CN112381329A - 一种聚合商户模型构建和异常风险聚合商户监控方法 - Google Patents
一种聚合商户模型构建和异常风险聚合商户监控方法 Download PDFInfo
- Publication number
- CN112381329A CN112381329A CN202011391246.8A CN202011391246A CN112381329A CN 112381329 A CN112381329 A CN 112381329A CN 202011391246 A CN202011391246 A CN 202011391246A CN 112381329 A CN112381329 A CN 112381329A
- Authority
- CN
- China
- Prior art keywords
- merchant
- merchants
- aggregated
- address
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 44
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000012544 monitoring process Methods 0.000 title claims abstract description 16
- 238000010276 construction Methods 0.000 title claims description 7
- 230000002776 aggregation Effects 0.000 claims abstract description 36
- 238000004220 aggregation Methods 0.000 claims abstract description 36
- 239000013598 vector Substances 0.000 claims abstract description 33
- 238000001514 detection method Methods 0.000 claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000012937 correction Methods 0.000 claims abstract description 10
- 230000000694 effects Effects 0.000 claims description 5
- 230000010365 information processing Effects 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 8
- 230000005856 abnormality Effects 0.000 abstract description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 238000012512 characterization method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000002547 anomalous effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 208000001613 Gambling Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Educational Administration (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种聚合商户模型构建和异常风险聚合商户监控方法,通过nlp技术,先提取聚合商户的经营范围和聚合商户地址,对商户的经营范围和地址做矫正之后,用训练好的词向量对矫正好的商户经营范围和地址进行表征,生成聚合商户表征向量。本发明的有益效果如下:增加了地址矫正和商户经营范围矫正技术,有效地填补了商户地址、聚合商户经营范围缺失或者信息不全的情况,提升了对于异常商户识别的准确性;能够有效地将地址相近、经营范围相近的聚合商户聚类到一起,提升异常商户识别的准确性;最后,针对实际场景中,异常商户的占比很低的情况,本发明创新性地运用有监督异常检测的算法训练模型,提升了问题异常商户识别的准确性。
Description
技术领域
本发明涉及电子信息技术领域,特别涉及一种聚合商户模型构建和异常风险聚合商户监控方法。
背景技术
当前,聚合支付发展迅速,在实际交易中占了较多的比重。但是聚合商户很多都是非自己体系内的商户,从合作方处能够获取的信息较少(仅有一些交易金额、时间、类型、加密后的用户id等信息),合规风险敞口大,在实际监控中存在监控难的问题。目前针对这一块的风险,很少有相关的方法进行监控。同时,仅通过店铺的一些交易特征来监控,对于黑商户覆盖率低,对于正常的商户误抓率高。通过前期对于聚合商户的详细分析,我们发现其具有明显的行业聚集性和地域聚集性。同时,异常风险商户在我们全量的商户中的占比较低。为提高对于聚合商户(特别是赌博、套现类商户)的风险交易识别率,我们发明了一种聚合商户模型构建和异常风险聚合商户监控方法。
发明内容
本发明要解决的技术问题是克服现有技术的缺陷,提供一种聚合商户模型构建和异常风险聚合商户监控方法,1.本发明对于聚合商户的经营地址和聚合商户经营范围,增加了地址矫正和商户经营范围矫正技术,有效地填补了商户地址、聚合商户经营范围缺失或者信息不全的情况,提升了对于异常商户识别的准确性;2.本发明创新性地从文本的角度,运用nlp技术将聚合商户进行聚类,能够有效地将地址相近、经营范围相近的聚合商户聚类到一起,提升异常商户识别的准确性;3.最后,针对实际场景中,异常商户的占比很低的情况,本发明创新性地运用有监督异常检测的算法训练模型,提升了问题异常商户识别的准确性。
为了解决上述技术问题,本发明提供了如下的技术方案:
本发明一种聚合商户模型构建和异常风险聚合商户监控方法,包括以下步骤:
S1.商户行业信息和地址信息处理模块,提取聚合商户填写的行业信息和地址信息,先针对对全国地址信息、商户行业信息训练语料训练词向量,然后针对聚合商户行业信息和地址信息的缺失、模糊的问题做相应的矫正,最后将聚合商户的行业和地址信息语句分词之后,用词向量加权求平均后表征一个商户;
S2.商户划分模块,利用S1中每个商户生成的表征的词向量,对商户进行聚类,最终,将地址相近,行业类型相近的聚合商户聚类到一起,根据业务指标设定合理的阈值,将聚合商户划分成n类;
S3.异常检测模块,对于S2中的划分的n类,每一类选取黑白样本单独建模,每一类采用有监督的异常检测算法,检测类中的异常商户,并最终将n类的结果合并输出。
作为本发明的一种优选技术方案,步骤S1中包含以下:
S1.1:获取全国的所有的地理位置地址、商户经营范围描述的预料库,分词之后,利用word2vec训练词向量;
S1.2:针对聚合商户的注册地址和经营范围缺失、填写模糊的问题做矫正,针对聚合商户注册地址缺失的问题,我们利用该聚合商户下经常发生交易的lbs位置信息对应的地址进行填充,针对一些聚合商户填写地址模糊的问题,利用lbs位置信息进行矫正,例如某些聚合商户只填写xx路xx号的情况,根据lbs数据,矫正为xx省xx市xx路xx号,针对聚合商户经营范围缺失的问题,选取同一地区的已知经营范围的商户,提取商户的买家规模、交易习惯、买家活跃度等特征,对缺失经营范围的聚合商户进行经营范围的预测,填补缺失;
S1.3:将修正后的商户名称和经营范围分词后,拼接成一条语句,用S1.1生成的词向量对语句中的每一个单词的词向量加和后求平均,作为聚合商户的表征向量。
作为本发明的一种优选技术方案,上述的步骤S2,包含:
S2.1:对S1.3中的生成的聚合商户表征向量,进行聚类,将商户聚成n类,最终将行业相近、地址相近的聚合商户聚类到一起。
作为本发明的一种优选技术方案,上述的步骤S3,包含:
S3.1:对于S2中生成的n类聚合商户的每一类,利用该类别中的黑白样本商户,每一类都单独训练一个模型,因为实际场景中,黑商户的比例很低,所以训练模型时采用有监督的异常检测算法,最终,对于一个未知标签的聚合商户,通过S1~S3的整个流程,预测出它是否存在异常。
与现有技术相比,本发明的有益效果如下:
1.本发明对于聚合商户的经营地址和聚合商户经营范围,增加了地址矫正和商户经营范围矫正技术,有效地填补了商户地址、聚合商户经营范围缺失或者信息不全的情况,提升了对于异常商户识别的准确性;
2.本发明创新性地从文本的角度,运用nlp技术将聚合商户进行聚类,能够有效地将地址相近、经营范围相近的聚合商户聚类到一起,提升异常商户识别的准确性;
3.最后,针对实际场景中,异常商户的占比很低的情况,本发明创新性地运用有监督异常检测的算法训练模型,提升了问题异常商户识别的准确性。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明的系统总体示意图;
图2是本发明的商户经营范围和地址信息处理模块示意图;
图3是本发明的商户划分模块示意图;
图4是本发明的异常检测模块示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1
如图1-4所示,本发明实施例提供的一种聚合商户模型构建和异常风险聚合商户监控方法,基于地址相近、行业相近的聚合商户,经营状况相当的假设,通过nlp技术,先提取聚合商户的经营范围和聚合商户地址,对商户的经营范围和地址做矫正之后,用训练好的词向量对矫正好的商户经营范围和地址进行表征,生成聚合商户表征向量。随后根据实际的业务场景,选定合适的阈值,对商户表征向量进行层次聚类,将地址相近,经营范围相近的商户聚集到一起。最后,对每一类的商户,利用其中的黑白样本商户进行建模,利用有监督的异常检测算法去训练模型,对未知标签的聚合商户进行预测,判断是否为异常商户。
图1是一种聚合商户模型构建和异常风险聚合商户监控方法的总体流程图,参照图1所示,该方法包括如下步骤:
S1:使用商户经营范围和地址处理模块,对聚合商户的经营范围和聚合商户地址文本进行处理,最终将商户的经营范围和地址用一个表征向量进行表示;
具体的,为了将地址相近,经营范围相似的聚合商户聚类到一起,必须对商户的地址和经营范围进行合理的表征。如果从文本角度考虑此问题,必须兼具语义的相似性。为此,本发明利用word2vec训练词向量的方式对聚合商户的地址和经营范围文本进行表征的方法。
图2是根据一示例性实施例示出的商户经营范围和地址信息处理模块,对商户的经营范围和地址信息进行处理,获取商户表征向词量的流程图,参照图2所示,其包括如下步骤:
S1.1:收集全国的地理位置信息和商户经营范围的语料库,利用word2vec训练词向量;
具体的,我们收集了一些全国的地理位置信息库和工商信息的语料库,对文本分词之后,利用word2vec的方式训练每个词的词向量,将每个词训练为一个200维的词向量。
S1.2:对商户地址和商户经营范围进行矫正;
具体的,实际中,商户地址和经营范围存在缺失或者填写模糊的情况。针对聚合商户注册地址缺失的问题,我们利用该聚合商户下交易次数发生最多的交易的lbs位置信息,通过经纬度反解找到lbs对应的具体地址作为聚合商户的地址。针对一些聚合商户填写地址模糊的问题,例如商户地址只有街道名,缺失省份地市信息。我们利用商户下经常出现交易的lbs或者ip的省份地市信息予以补充。例如某些聚合商户只填写xx路xx号的情况,根据lbs数据或者ip地址位置,矫正为xx省xx市xx路xx号。针对聚合商户经营范围缺失的问题,选取同一地区的已知经营范围的商户,提取商户的买家规模(包括但不仅限于买家数量、买家消费金额等)、交易习惯(包括但不仅限于xx时间段内该买家下交易的数量)、买家活跃度(包括但不仅限于xx段时间内,该商户下消费过的买家的数量、买家活跃的总时间等)等特征,利用lightgbm训练多分类模型之后,对缺失经营范围的聚合商户进行经营范围的预测。将预测值认为是该商户的经营范围进行填补。
S1.3:对S1.2中矫正完成的聚合商户地址和聚合商户经营范围,进行分词后,将两者拼接成一个语句。然后对每个分词之后的单词用S1.1得到的词向量进行表征,然后将各个单词的词向量加和后求平均,得到商户表征向量;
S2:商户划分模块,将距离相近,经营范围相似的商户聚类到一起。
具体的,利用S1.3获取的词向量表征商户,然后利用密度聚类的方法,选取适当的阈值,对聚合商户进行聚类。
图3是根据一示例性实施例示出的商户划分模块,对商户进行聚类,参照图3所示,其包括如下步骤:
S2.1:将步骤S1.3中得到的商户表征向量,输入聚类算法的模型中进行聚类;
具体的,步骤S2.1采用密度聚类DBSCAN进行聚类。基于密度的聚类算法假设聚类结构能够通过样本分布的紧密程度确定,以数据集在空间分布上的稠密程度为依据进行聚类,即只要一个区域中的样本密度大于某个阈值,就把它划入与之相近的簇中。因为我们预先无法给定商户聚类的类簇数。而DBSCAN不需要指定类簇的数量。
在本实施例中,作为一种较优的实施方式,步骤S2.1中所使用的聚类算法,采用的是密度聚类DBSCAN算法。在其他实施例中,也可以采用其他形式的聚类算法,如EM聚类(期望最大化),层次聚类(HierarchicalClustering)等。
S3:对聚合商户提取商户的经营特征和图谱特征,然后对S2中划分的n类商户,每一类中的商户的黑白样本,都采用有监督的异常检测算法构建模型,用于对未知标签的聚合商户样本进行检测。
具体的,经过S2步骤的聚类之后,我们按照实际业务的需求,通过调整密度聚类的参数,将聚合商户聚成了n类。即我们将聚合商户按照地址相近和经营范围相似的原则,聚成了n类。对于每一类的商户,我们需要提取类中商户的商户经营特征和图谱特征,这些特征能够有效地区分正常的商户和异常的商户。在提取完聚合商户的经营特征和图谱特征之后,我们需要针对每一类中的黑白商户样本构建模型,用以预测未知标签的商户,判断其是否是个异常商户。因为在实际聚合商户分布中,每一类的异常商户数量占比较少。因此,我们考虑使用有监督的异常检测算法,构建模型。
图4是根据一示例性实施例示出的异常检测模块,对提取特征后的异常商户进行检测,给出图像是异常检测模块的具体流程图,参照图4所示,其包括如下步骤:
S3.1:将S2中聚类好之后的商户,每一类商户,提取商户的经营特征和图谱特征。
具体的,商户的经营特征包括但不仅限于:1、一段时间之内,商户消费下消费的总金额、2、一段时间之内,商户下消费的总人数、3、一段时间之内,商户夜间消费的数量等商户经营指标。这里的一段时间,包括了一些短时间例度(小时、分钟级)以及长时间例度(周、月)的指标。这些指标对于正常商户和异常商户,具有很好的区分度。
同时,依据商户的消费、转账等关系,商户之间存在比较紧密的关联关系。因此,图谱特征也是甄别异常商户的比较有效的特征。具体的,商户的图谱特征,我们依据商户、用户之间的关联关系,可以挖掘出以下图谱特征:1、某聚合商户2度范围之内,异常商户的比例、2、某聚合商户2度范围之内,异常用户的比例等。
在本实施例中,作为一种较优的实施方式,步骤3.1中提到的商户经营特征和图谱特征仅供参考。实际场景中,还可以衍生出很多的业务特征和图谱特征,用以提升模型的效果。
S3.2:将步骤S3.1中得到的聚合商户的经营特征和图谱特征向量,对于每一类商户,都用有监督的异常检测算法训练一个模型,然后对未知标签的商户进行预测,判断其是否为异常商户;
具体的,在本实施例中,我们最终将聚合商户聚成了30类。对于每一类商户,先提取聚合商户的经营特征和图谱特征向量。然后对于类别中已知标签的黑白样本聚合商户,用有监督的异常检测算法训练模型,然后对于该类中未知标签的聚合商户进行判断,看是否是异常商户。
具体的,在本实施例中,异常检测算法采用xgbod(ExtremeBoostingBasedOutlierDetection(Supervised))算法。这是一种有监督的异常检测算法。这种算法来自论文
《ImprovingSupervisedOutlierDetectionwithUnsupervisedRepresentationLearning.IEEEInternationalJointConferenceonNeuralNetworks,2018》。XGBOD使用多个无监督的离群点挖掘算法从底层数据中提取有用的表示,以增强嵌入式有监督分类器在改进的特征空间上的预测能力。同时,这种算法又结合了集成学习的优势,使算法对于异常值的检测效果更好。
S3.3:对S2中的聚成的每一类的聚合商户训练的异常检测模型,对该类的未知标签的聚合商户进行检测,并最终将各类的异常商户输出。
与现有技术相比,本发明的有益效果如下:
1.本发明对于聚合商户的经营地址和聚合商户经营范围,增加了地址矫正和商户经营范围矫正技术,有效地填补了商户地址、聚合商户经营范围缺失或者信息不全的情况,提升了对于异常商户识别的准确性;
2.本发明创新性地从文本的角度,运用nlp技术将聚合商户进行聚类,能够有效地将地址相近、经营范围相近的聚合商户聚类到一起,提升异常商户识别的准确性;
3.最后,针对实际场景中,异常商户的占比很低的情况,本发明创新性地运用有监督异常检测的算法训练模型,提升了问题异常商户识别的准确性。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种聚合商户模型构建和异常风险聚合商户监控方法,其特征在于,包括以下步骤:
S1.商户行业信息和地址信息处理模块,提取聚合商户填写的行业信息和地址信息,先针对对全国地址信息、商户行业信息训练语料训练词向量,然后针对聚合商户行业信息和地址信息的缺失、模糊的问题做相应的矫正,最后将聚合商户的行业和地址信息语句分词之后,用词向量加权求平均后表征一个商户;
S2.商户划分模块,利用S1中每个商户生成的表征的词向量,对商户进行聚类,最终,将地址相近,行业类型相近的聚合商户聚类到一起,根据业务指标设定合理的阈值,将聚合商户划分成n类;
S3.异常检测模块,对于S2中的划分的n类,每一类选取黑白样本单独建模,每一类采用有监督的异常检测算法,检测类中的异常商户,并最终将n类的结果合并输出。
2.根据权利要求1所述的一种聚合商户模型构建和异常风险聚合商户监控方法,其特征在于,步骤S1中包含以下:
S1.1:获取全国的所有的地理位置地址、商户经营范围描述的预料库,分词之后,利用word2vec训练词向量;
S1.2:针对聚合商户的注册地址和经营范围缺失、填写模糊的问题做矫正,针对聚合商户注册地址缺失的问题,我们利用该聚合商户下经常发生交易的lbs位置信息对应的地址进行填充,针对一些聚合商户填写地址模糊的问题,利用lbs位置信息进行矫正,例如某些聚合商户只填写xx路xx号的情况,根据lbs数据,矫正为xx省xx市xx路xx号,针对聚合商户经营范围缺失的问题,选取同一地区的已知经营范围的商户,提取商户的买家规模、交易习惯、买家活跃度等特征,对缺失经营范围的聚合商户进行经营范围的预测,填补缺失;
S1.3:将修正后的商户名称和经营范围分词后,拼接成一条语句,用S1.1生成的词向量对语句中的每一个单词的词向量加和后求平均,作为聚合商户的表征向量。
3.根据权利要求1所述的一种聚合商户模型构建和异常风险聚合商户监控方法,其特征在于,上述的步骤S2,包含:
S2.1:对S1.3中的生成的聚合商户表征向量,进行聚类,将商户聚成n类,最终将行业相近、地址相近的聚合商户聚类到一起。
4.根据权利要求1所述的一种聚合商户模型构建和异常风险聚合商户监控方法,其特征在于,上述的步骤S3,包含:
S3.1:对于S2中生成的n类聚合商户的每一类,利用该类别中的黑白样本商户,每一类都单独训练一个模型,因为实际场景中,黑商户的比例很低,所以训练模型时采用有监督的异常检测算法,最终,对于一个未知标签的聚合商户,通过S1~S3的整个流程,预测出它是否存在异常。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011391246.8A CN112381329A (zh) | 2020-12-02 | 2020-12-02 | 一种聚合商户模型构建和异常风险聚合商户监控方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011391246.8A CN112381329A (zh) | 2020-12-02 | 2020-12-02 | 一种聚合商户模型构建和异常风险聚合商户监控方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112381329A true CN112381329A (zh) | 2021-02-19 |
Family
ID=74589697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011391246.8A Pending CN112381329A (zh) | 2020-12-02 | 2020-12-02 | 一种聚合商户模型构建和异常风险聚合商户监控方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112381329A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114298013A (zh) * | 2021-12-29 | 2022-04-08 | 江苏苏宁银行股份有限公司 | 一种基于深度学习的虚假收货地址预测方法和装置 |
-
2020
- 2020-12-02 CN CN202011391246.8A patent/CN112381329A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114298013A (zh) * | 2021-12-29 | 2022-04-08 | 江苏苏宁银行股份有限公司 | 一种基于深度学习的虚假收货地址预测方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jurgens et al. | Geolocation prediction in twitter using social networks: A critical analysis and review of current practice | |
Saha et al. | Pattern recognition using clustering analysis to support transportation system management, operations, and modeling | |
CN109117883B (zh) | 基于长短时记忆网络的sar影像海冰分类方法及系统 | |
Kosiorowski et al. | DepthProc an R package for robust exploration of multidimensional economic phenomena | |
US11195412B2 (en) | Predicting short-term traffic flow congestion on urban motorway networks | |
CN111984701B (zh) | 乡村聚落演化的预测方法、装置、设备及存储介质 | |
Bi et al. | How built environment impacts online car-hailing ridership | |
Khavari et al. | Population cluster data to assess the urban-rural split and electrification in Sub-Saharan Africa | |
Banerjee et al. | Traffic accident risk prediction using machine learning | |
CN110459056A (zh) | 一种基于lstm神经网络的公交到站时间预测方法 | |
Kortas et al. | Exploring multi-scale variability in hotspot mapping: A case study on housing prices and crime occurrences in Heerlen | |
Sardinha et al. | Context-aware demand prediction in bike sharing systems: Incorporating spatial, meteorological and calendrical context | |
CN117709989A (zh) | 一种营销活动的预测方法、电子设备及存储介质 | |
Huang et al. | Detecting neighborhood gentrification at scale via street-level visual data | |
CN111582313B (zh) | 样本数据生成方法、装置及电子设备 | |
CN112381329A (zh) | 一种聚合商户模型构建和异常风险聚合商户监控方法 | |
Safaei-Moghadam et al. | Predicting real-time roadway pluvial flood risk: A hybrid machine learning approach coupling a graph-based flood spreading model, historical vulnerabilities, and Waze data | |
CN110020666A (zh) | 一种基于乘客行为模式的公共交通广告投放方法及系统 | |
Bing et al. | Integrating semantic zoning information with the prediction of road link speed based on taxi GPS data | |
Domashova et al. | Detection of non-typical users of the electronic marketplace" Freight transportation" to prevent the competitive intelligence | |
Knaap et al. | geosnap: The Geospatial Neighborhood Analysis Package | |
CN117808121A (zh) | 一种面向非独立同分布数据的联邦对比聚类学习方法、系统 | |
Zhai et al. | Multi-scale approaches to cope with scale effect issues in macroscopic crash analysis | |
Chakraborty et al. | Global urban activity changes from COVID-19 physical distancing restrictions | |
CN116401601A (zh) | 基于逻辑回归模型的停电敏感用户优选处置方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210219 |
|
WD01 | Invention patent application deemed withdrawn after publication |