CN111783818B - 一种基于Xgboost和DBSCAN的精准营销方法 - Google Patents

一种基于Xgboost和DBSCAN的精准营销方法 Download PDF

Info

Publication number
CN111783818B
CN111783818B CN202010277261.3A CN202010277261A CN111783818B CN 111783818 B CN111783818 B CN 111783818B CN 202010277261 A CN202010277261 A CN 202010277261A CN 111783818 B CN111783818 B CN 111783818B
Authority
CN
China
Prior art keywords
data
dbscan
xgboost
model
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010277261.3A
Other languages
English (en)
Other versions
CN111783818A (zh
Inventor
石建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong University
Original Assignee
Nantong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong University filed Critical Nantong University
Priority to CN202010277261.3A priority Critical patent/CN111783818B/zh
Publication of CN111783818A publication Critical patent/CN111783818A/zh
Application granted granted Critical
Publication of CN111783818B publication Critical patent/CN111783818B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于Xgboost和DBSCAN的精准营销方法,包括以下步骤:步骤1.对数据源中的银行数据进行人工标注,以此获得类别信息;步骤2.将银行数据及其标注信息整合,作为完整的数据集;步骤3.针对数据集进行探索性分析;步骤4.针对数据集进行数据预处理,划分数据集,得到训练集、测试集;步骤5.将数据输入到已经构建好的模型中进行训练,得到精准营销模型;步骤6.将待检测的银行数据输入到精准营销模型进行检测,得到客户分类结果;步骤7.进行效果验证,输出检测结果。本发明通过Xgboost来找出目标客户,并使用DBSCAN来向目标客户推荐对应的产品,从而提高营销成功率。

Description

一种基于Xgboost和DBSCAN的精准营销方法
技术领域
本发明涉及机器学习和数据挖掘领域,具体为一种基于Xgboost和DBSCAN 的精准营销方法。
背景技术
当前,科技发展越来越快,更多的商业公司在追求营销效果的同时对营销精准度提出了更高的要求,产品质量和客户资源把握着商业公司的命脉。而基于大数据的精准营销则是提升营销效率,减少人工成本的重要环节。
目前,银行的金融产品营销普遍采取的是人工营销,和机器营销。其中,人工营销有效率低、成本高、人工易产生疲倦等的缺点;而机器营销主要是预设所有的营销话术,并在工作时逐一播放,因此降低了人力成本。因此,采用机器人的方式去对客户实施营销手段,不仅降低了人工成品,也避免了人工疲倦时导致的话术失误,这让机器营销成为了银行营销的趋势。
尽管如此,机器营销和人工营销一样,有一个共通的缺点,就是成功率太低。毕竟客户群众多,性格兴趣难以捉摸。即使机器日夜工作,降低人工损耗,但毕竟机器的程序是预设好的,难以面对不同的客户使用针对性地营销措施。
总体而言,现有机器营销方法存在营销成功率太低的问题。
发明内容
本发明的目的是为了提供一种基于Xgboost和DBSCAN的精准营销方法,通过Xgboost来找出目标客户,并使用DBSCAN来向目标客户推荐对应的产品,从而提高营销成功率。
为了实现上述发明目的,本发明采用了以下技术方案:一种基于Xgboost和DBSCAN的精准营销方法,包括以下步骤:步骤1.对数据源中的银行数据进行人工标注,以此获得类别信息;
步骤2.将银行数据及其标注信息整合,作为完整的数据集;
步骤3.针对数据集进行探索性分析;
步骤4.针对数据集进行数据预处理,划分数据集,得到训练集、测试集;
步骤5.将数据输入到已经构建好的模型中进行训练,得到精准营销模型;
步骤6.将待检测的银行数据输入到精准营销模型进行检测,得到客户分类结果;
步骤7.进行效果验证,输出检测结果。
优选的,在步骤3中,所述数据集进行探索性分析,具体包括以下步骤:步骤a.初步观察并记录源数据的特征,属性,做初步分析;
步骤b.设定阈值,作为数据预处理的指标;
步骤c.格式转化,将文本格式转化成便于处理的csv格式。
优选的,在步骤4中,所述数据预处理包括数据清理、异常值处理、数据规约,以及划分数据集,具体包括以下步骤:步骤d.数据清理主要是删除无意义数据,增强可用数据的可读性;
步骤e.异常值处理主要是针对数据中的NULL以及缺失值进行处理;
步骤f.数据规约包括离散值规约和连续值规约;
步骤g.生成随机种子seed,并按照8:2比例将经银行数据划分训练集、测试集;
优选的,在步骤5中,所述模型训练通过Xgboost算法和DBSCAN算法实现,所述Xgboost算法用于将客户分类为目标客户和非目标客户,所述DBSCAN 算法实现用于为目标客户推荐对应的金融产品。
优选的,所述模型训练通过Xgboost算法对客户进行分类,并设置GPU加速,具体包括以下步骤:步骤5-1.调用XGBClassifier,并设置tree_method等于“gpu_hist”;
步骤5-2.初始化xgboost模型xgb以及相关参数;
步骤5-3.利用fit函数训练xgb,并优化;
步骤5-4.进入epoch循环,利用predict计算预测值,并用f1_score计算得分值;
步骤5-5.循环结束,找出得分值最高的模型并保存至model1。
优选的,所述模型训练通过DBSCAN算法对客户进行产品推荐,具体包括以下步骤:步骤5-6.调用DBSCAN,并设置tree_method等于“gpu_hist”;
步骤5-7.初始化DBSCAN模型db以及相关参数;
步骤5-8.利用fit函数训练db,并优化;
步骤5-9.进入epoch循环,利用predict计算预测值,并用f1_score计算得分值;
步骤5-10.循环结束,找出得分值最高的模型并保存至model2;
步骤5-11.求出异常点的个数,以及每一类的样本个数,保存至txt。
优选的,在步骤5中,所述精准营销训练过程中采用的损失函数loss为逻辑回归,并且采用SGD作为优化器优化。
优选的,在步骤6中,将所有的分类结果和推荐产品整合成数据表,并赋予概率信息。
优选的,在步骤7中,将目标客户label设为1,非目标客户设为0,测试完的精度达到标准后,进行测试,操作为输入一系列标注过但未参与训练的数据,让模型判断,并推荐相关的金融产品。
与现有技术相比,采用了上述技术方案的基于Xgboost和DBSCAN的精准营销方法,具有如下有益效果:采用本发明的基于Xgboost和DBSCAN的精准营销方法,通过Xgboost算法对客户进行分类,将客户分类为目标客户和非目标客户,并通过DBSCAN算法对客户进行产品推荐,为目标客户推荐对应的金融产品,减少人工成本,提升营销效率以及营销成功率。
具体实施方式
下面对本发明做进一步描述。
基于Xgboost和DBSCAN的精准营销方法的流程,包括以下步骤:步骤1.对数据源中的银行数据进行人工标注,以此获得类别信息,将分类完的产品设置 label值,目标客户为1,非目标客户为0;
步骤2.将银行数据及其标注信息整合,作为完整的数据集;
步骤3.针对数据集进行探索性分析,具体包括以下步骤:步骤a.初步观察并记录源数据的特征,属性,做初步分析;步骤b.设定阈值,作为数据预处理的指标;步骤c.格式转化,将文本格式转化成便于处理的csv格式。
步骤4.针对数据集进行数据预处理,划分数据集,得到训练集、测试集,具体如下:数据预处理具体包括数据清理、异常值处理、数据规约,以及划分数据集。数据清理:根据经验值来人工筛选字段,剔除无用字段,增强可用数据的可读性;去除冗余重复值过大的字;对每个表的字段比对,使其保持一致;给数据设定label值;
异常值处理主要是针对数据中的NULL以及缺失值进行处理,根据设定的阈值,找出NULL或空值数量大于阈值的字段,舍去;对于不满足舍去条件的存在异常值的字段使用牛顿插值填充:
数据规约包括离散值规约和连续值规约,连续型数据标准化,归一至0~1;离散型数据先进行映射操作,转化成连续型数据,再进行归一。
具体包括以下步骤:步骤4-1:将原始数据转化成CSV格式,并以GBK格式解码得到data1;
步骤4-2:读取csv格式的数据data1,并用DataFrame格式表示数据data2,行数为row,列数为col;
步骤4-3:比对所有文件的字段名,将同义的字段修改一致;
步骤4-4:给label值增加字段label,目标客户设置为1,非目标客户为0;
步骤4-5:根据经验值,直接删去无用的字段,譬如客户代码,代理机构号等;
步骤4-6:设定阈值alpha,作为去冗余字段的标准值;
步骤4-7:遍历data2,并用value_counts计算出每个字段中,各值的数量n;若n大于等于row的80%,则删除该冗余字段;
步骤4-8:同理删除符合条件的null值和空值;
步骤4-9:利用牛顿插值法来填补剩下的异常值,至此异常值处理完毕得到data3;
步骤4-10:根据数据的性质,将数据分成离散型数据subset1和连续型数据subset2,分别进行数据规约;
步骤4-11:对subset1使用LabelEncoder和fit_transform,将subset1转化成连续型数据,在使用sigmod函数将其归一为s1;
步骤4-12:对连续型数据直接使用sigmod函数归一,得到s2;
步骤4-13:将s1和s2利用concat进行合并,得到data4;
步骤4-14:由于经历过预处理的data4仍然数据量巨大,特征繁多,所以为了提取更主要的特征,在此进行PCA降维,定义为:
XXTW=λW
式中:X表示输入数据的矩阵,XT表示X转置,W表示参数数据的矩阵表示,λ表示权重;得到data5。
步骤4-15:设置随机种子seed,利用train_test_split随机抽取80%的data5 作为训练数据train,20%的data5作为测试数据test;
步骤5.将数据输入到已经构建好的模型中进行训练,得到精准营销模型。所述模型训练通过Xgboost算法和DBSCAN算法实现,所述Xgboost算法用于将客户分类为目标客户和非目标客户,所述DBSCAN算法实现用于为目标客户推荐对应的金融产品。
基于Xgboost和DBSCAN精准营销方法的核心算法的流程,模型训练通过 Xgboost算法对客户进行分类,并设置GPU加速,定义为:
式中:obj表示目标函数,G表示将原式经过泰勒展开后得到的j和j-1阶导构成的函数对j-1阶导数的偏导数,H为G对j-1阶导数的导数,λ和γ为权重, w为参数矩阵,T为余项矩阵。
具体包括以下步骤:步骤5-1.调用XGBClassifier,并设置tree_method等于“gpu_hist”;
步骤5-2.初始化xgboost模型xgb以及相关参数;
步骤5-3.利用fit函数训练xgb,并优化;
步骤5-4.进入epoch循环,利用predict计算预测值,并用f1_score计算得分值;
步骤5-5.循环结束,找出得分值最高的模型并保存至model1。
模型训练通过DBSCAN算法对客户进行产品推荐,具体包括以下步骤:步骤5-6.调用DBSCAN,并设置tree_method等于“gpu_hist”;
步骤5-7.初始化DBSCAN模型db以及相关参数;
步骤5-8.利用fit函数训练db,并优化;
步骤5-9.进入epoch循环,利用predict计算预测值,并用f1_score计算得分值;
步骤5-10.循环结束,找出得分值最高的模型并保存至model2;
步骤5-11.求出异常点的个数,以及每一类的样本个数,保存至txt。
精准营销训练过程中采用的损失函数loss为逻辑回归,并且采用SGD作为优化器优化,定义为:
式中:p为目标函数,为g(x)的偏导数,ωTx为输入数据的矩阵形式。
步骤6.将待检测的银行数据输入到精准营销模型进行检测,得到客户分类结果,将所有的分类结果和推荐产品整合成数据表,并赋予概率信息,具体包括以下步骤:步骤6-1.加载测试数据test;
步骤6-2.根据训练过程中涉及到的数据预处理过程进行处理,得到data_t;
步骤6-3.加载model1,进行客户分类,并将结果保存至output1;
步骤6-4.加载model2,并利用output1筛选出目标客户集合data_c;
步骤6-5.将data_c传入model2,得到推荐结果output2;
步骤6-6.将output1和output2整合成output3;
步骤6-7.将output3分别和data_t以及data_c进行比对求得精度p1、p2;
步骤6-8.p1表示该客户为目标客户的概率,p2表示客户会购买对应产品的概率;
步骤6-9.将output3和p1,p2整合并保存至excel文件,得到最终的output。
步骤7.进行效果验证,输出检测结果,将目标客户label设为1,非目标客户设为0,测试完的精度达到标准后,进行测试,操作为输入一系列标注过但未参与训练的数据,让模型判断,并推荐相关的金融产品。具体包括以下步骤:步骤7-1:将一批新的客户经过预测流程后得出预测文件output,并按照p1的大小,降序排列;
步骤7-2:业务员或者机器人按照次序以此致电客户,进行产品营销;
步骤7-3:在一个周期内,追踪这批客户的动向,并记录成为目标的客户作为参考比对。
对整个模型进行性能评估,本次性能评估用了f1_score作为验证标准,具体如下:
TP:真阳性,预测为1,实际也为1;FP:假阳性,预测为1,实际为0;
FN:假阴性,预测为0,实际为1;TN:真阴性,预测为0,实际也为0;
准确率:
召回率:
由于本发明涉及多个变量,表1对各个步骤中的变量进行说明,如表1为变量说明:
表1
以上是本发明的优选实施方式,对于本领域的普通技术人员来说不脱离本发明原理的前提下,还可以做出若干变型和改进,这些也应视为本发明的保护范围。

Claims (5)

1.一种基于Xgboost和DBSCAN的精准营销方法,其特征在于:包括以下步骤:步骤1. 对数据源中的银行数据进行人工标注,以此获得类别信息;
步骤2. 将银行数据及其标注信息整合,作为完整的数据集;
步骤3. 针对数据集进行探索性分析;
步骤4. 针对数据集进行数据预处理,划分数据集,得到训练集,测试集;
步骤5. 将数据输入到已经构建好的模型中进行训练,得到精准营销模型;
步骤6. 将待检测的银行数据输入到精准营销模型进行检测,得到客户分类结果;
步骤7.进行效果验证,输出检测结果;
其中,在步骤5中,所述模型训练通过Xgboost算法和DBSCAN算法实现,所述Xgboost算法用于将客户分类为目标客户和非目标客户,所述DBSCAN算法实现用于为目标客户推荐对应的金融产品;
所述模型训练通过Xgboost算法对客户进行分类,并设置GPU加速,具体包括以下步骤:步骤5-1.调用XGBClassifier,并设置tree_method等于“gpu_hist”;
步骤5-2.初始化xgboost模型xgb以及相关参数;
步骤5-3.利用fit函数训练xgb,并优化;
步骤5-4.进入epoch循环,利用predict计算预测值,并用f1_score计算得分值;
步骤5-5.循环结束,找出得分值最高的模型并保存至model1;
所述模型训练通过DBSCAN算法对客户进行产品推荐,具体包括以下步骤:步骤5-6. 调用DBSCAN,并设置tree_method等于“gpu_hist”;
步骤5-7. 初始化DBSCAN模型db以及相关参数;
步骤5-8. 利用fit函数训练db,并优化;
步骤5-9. 进入epoch循环,利用predict计算预测值,并用f1_score计算得分值;
步骤5-10. 循环结束,找出得分值最高的模型并保存至model2;
步骤5-11. 求出异常点的个数,以及每一类的样本个数,保存至txt;
其中,在步骤3中,所述数据集进行探索性分析,具体包括以下步骤:步骤a.初步观察并记录源数据的特征,属性,做初步分析;
步骤b.设定阈值,作为数据预处理的指标;
步骤c.格式转化,将文本格式转化成便于处理的csv格式。
2.根据权利要求1所述的基于Xgboost和DBSCAN的精准营销方法,其特征在于:在步骤4中,所述数据预处理包括数据清理、异常值处理、数据规约,以及划分数据集,具体包括以下步骤:步骤d.数据清理主要是删除无意义数据,增强可用数据的可读性;
步骤e. 异常值处理主要是针对数据中的NULL以及缺失值进行处理;
步骤f. 数据规约包括离散值规约和连续值规约;
步骤g. 生成随机种子seed,并按照8:2比例将经银行数据划分训练集、测试集。
3.根据权利要求1所述的基于Xgboost和DBSCAN的精准营销方法,其特征在于:在步骤5中,所述精准营销训练过程中采用的损失函数loss为逻辑回归,并且采用SGD作为优化器优化。
4.根据权利要求1所述的基于Xgboost和DBSCAN的精准营销方法,其特征在于:在步骤6中,将所有的分类结果和推荐产品整合成数据表,并赋予概率信息。
5.根据权利要求1所述的基于Xgboost和DBSCAN的精准营销方法,其特征在于:在步骤7中,将目标客户label设为1,非目标客户设为0,测试完的精度达到标准后,进行测试,操作为输入一系列标注过但未参与训练的数据,让模型判断,并推荐相关的金融产品。
CN202010277261.3A 2020-04-10 2020-04-10 一种基于Xgboost和DBSCAN的精准营销方法 Active CN111783818B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010277261.3A CN111783818B (zh) 2020-04-10 2020-04-10 一种基于Xgboost和DBSCAN的精准营销方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010277261.3A CN111783818B (zh) 2020-04-10 2020-04-10 一种基于Xgboost和DBSCAN的精准营销方法

Publications (2)

Publication Number Publication Date
CN111783818A CN111783818A (zh) 2020-10-16
CN111783818B true CN111783818B (zh) 2023-09-26

Family

ID=72753144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010277261.3A Active CN111783818B (zh) 2020-04-10 2020-04-10 一种基于Xgboost和DBSCAN的精准营销方法

Country Status (1)

Country Link
CN (1) CN111783818B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112256964A (zh) * 2020-10-22 2021-01-22 重庆邮电大学 一种基于多维度数据学习的金融机构潜在客户推荐方法
CN112686448B (zh) * 2020-12-31 2024-02-13 重庆富民银行股份有限公司 基于属性数据的流失预警方法及系统
CN113011949A (zh) * 2021-03-25 2021-06-22 江苏经贸职业技术学院 基于客户信息补全的XGBoost金融产品推荐方法
CN113379457A (zh) * 2021-06-04 2021-09-10 浙江杭州余杭农村商业银行股份有限公司 面向金融领域的智能营销方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013025920A2 (en) * 2011-08-16 2013-02-21 Business Researchers, Inc. System and method for analyzing marketing treatment data
CN103559630A (zh) * 2013-10-31 2014-02-05 华南师范大学 一种基于客户属性及行为特征分析的客户细分方法
CN106095841A (zh) * 2016-06-05 2016-11-09 西华大学 一种基于协同过滤的移动互联网广告推荐方法
CN107909433A (zh) * 2017-11-14 2018-04-13 重庆邮电大学 一种基于大数据移动电子商务的商品推荐方法
CN109493449A (zh) * 2018-11-23 2019-03-19 北京航空航天大学 一种基于货车gps轨迹数据和高速交易数据的货车载货状态估计方法
CN109509040A (zh) * 2019-01-03 2019-03-22 广发证券股份有限公司 预测基金潜在客户的建模方法、营销方法及装置
CN110008977A (zh) * 2018-12-05 2019-07-12 阿里巴巴集团控股有限公司 聚类模型构建方法以及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9703856B2 (en) * 2014-07-07 2017-07-11 Sap Se Hilbert curve partitioning for parallelization of DBSCAN
US20170193335A1 (en) * 2015-11-13 2017-07-06 Wise Athena Inc. Method for data encoding and accurate predictions through convolutional networks for actual enterprise challenges

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013025920A2 (en) * 2011-08-16 2013-02-21 Business Researchers, Inc. System and method for analyzing marketing treatment data
CN103559630A (zh) * 2013-10-31 2014-02-05 华南师范大学 一种基于客户属性及行为特征分析的客户细分方法
CN106095841A (zh) * 2016-06-05 2016-11-09 西华大学 一种基于协同过滤的移动互联网广告推荐方法
CN107909433A (zh) * 2017-11-14 2018-04-13 重庆邮电大学 一种基于大数据移动电子商务的商品推荐方法
CN109493449A (zh) * 2018-11-23 2019-03-19 北京航空航天大学 一种基于货车gps轨迹数据和高速交易数据的货车载货状态估计方法
CN110008977A (zh) * 2018-12-05 2019-07-12 阿里巴巴集团控股有限公司 聚类模型构建方法以及装置
CN109509040A (zh) * 2019-01-03 2019-03-22 广发证券股份有限公司 预测基金潜在客户的建模方法、营销方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种改进的基于PCA的数据预处理方法;陈燕、陈亚林、郑军;《电子技术应用》;第96-99页 *
基于机器学习的恶意软件分类识别研究;张雨薇、黄迎春;《科技资讯》;第9-11页 *

Also Published As

Publication number Publication date
CN111783818A (zh) 2020-10-16

Similar Documents

Publication Publication Date Title
CN111783818B (zh) 一种基于Xgboost和DBSCAN的精准营销方法
CN107239891B (zh) 一种基于大数据的招投标审核方法
CN109271374B (zh) 一种基于机器学习的数据库健康度打分方法和打分系统
CN109325691B (zh) 异常行为分析方法、电子设备及计算机程序产品
TWI723528B (zh) 電腦執行的事件風險評估方法及裝置、電腦可讀儲存媒體以及計算設備
JP2011508353A5 (zh)
CN110569904B (zh) 机器学习模型的构建方法及计算机可读存储介质
CN113221960B (zh) 一种高质量漏洞数据收集模型的构建方法及收集方法
CN113051291A (zh) 工单信息的处理方法、装置、设备及存储介质
CN107368526A (zh) 一种数据处理方法及装置
CN110990529B (zh) 企业的行业明细划分方法及系统
US11385988B2 (en) System and method to improve results of a static code analysis based on the probability of a true error
CN109063983A (zh) 一种基于社交媒体数据的自然灾害损失实时评估方法
CN109471934B (zh) 基于互联网的金融风险线索发掘方法
CN110163722B (zh) 用于农产品精准销售的大数据分析系统及分析方法
CN110808947B (zh) 一种自动化的脆弱性量化评估方法及系统
CN116185684A (zh) 一种服务器故障根因分析模型的构建方法及应用
CN112506930B (zh) 一种基于机器学习技术的数据洞察系统
Pramudita et al. Optimization Analysis of Neural Network Algorithms Using Bagging Techniques on Classification of Date Fruit Types
CN111008038A (zh) 一种基于逻辑回归模型的pull request被合并概率的计算方法
US20240160696A1 (en) Method for Automatic Detection of Pair-Wise Interaction Effects Among Large Number of Variables
CN113902551B (zh) 车贷申请欺诈识别的方法和设备
CN114492435A (zh) 一种大数据分析方法及系统
CN115495990A (zh) 数据处理方法和设备
CN117635138A (zh) 异常业务交易账户识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant