CN113056753A - 基于交易后数据的机器学习 - Google Patents
基于交易后数据的机器学习 Download PDFInfo
- Publication number
- CN113056753A CN113056753A CN201980076279.2A CN201980076279A CN113056753A CN 113056753 A CN113056753 A CN 113056753A CN 201980076279 A CN201980076279 A CN 201980076279A CN 113056753 A CN113056753 A CN 113056753A
- Authority
- CN
- China
- Prior art keywords
- transactions
- transaction
- training
- classifier module
- classifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010801 machine learning Methods 0.000 title claims description 9
- 238000012549 training Methods 0.000 claims abstract description 64
- 238000000034 method Methods 0.000 claims abstract description 45
- 230000000694 effects Effects 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 6
- 238000001356 surgical procedure Methods 0.000 description 5
- 238000003491 array Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
公开了与使用交易后信息对交易进行分类有关的技术。可以使用用于一组交易的第一数据作为训练数据输入来训练第一分类器模块,其中第一数据包括交易前信息和交易后信息。在所公开的技术中,在训练第一分类器模块过程中,用于一组交易中的交易的正确分类是已知的。在所公开的技术中,训练架构基于经训练的第一分类器对一组交易中的多个交易的分类输出,为多个交易生成各自的权重。在所公开的技术中,训练架构基于生成的权重使用用于一组交易的第二数据作为训练数据输入来训练第二分类器模块。在一些实施例中,经训练的第二分类器模块仅基于用于一个或多个未决交易的交易前信息对一个或多个未决交易进行分类。
Description
技术领域
本公开总体上涉及机器学习分类器,并且更具体而言,涉及基于交易后数据使用实例权重的训练分类器。
背景技术
可以出于各种原因对交易(包括出于进一步检查而识别某些类型的交易(例如,出于计算机安全目的而检测异常交易))进行分类。机器学习可以用于训练各种类型的分类器来识别交易类型。历来仅基于交易完成之前可用的信息来训练分类器(例如,因为这是对交易进行实时分类时唯一可用的信息)。一般而言,提高分类器的准确性可以减少或避免安全问题。
附图说明
图1A是示出根据一些实施例的使用交易后信息来生成用于训练数据的权重的示例性训练架构的框图。
图1B是示出根据一些实施例的根据图1A的架构来训练的示例性分类器的框图。
图2示出根据一些实施例的与训练交易有关的示例性交易前信息和交易后信息。
图3示出根据一些实施例的指示与未决交易(pending transaction)有关的交易前信息和交易后信息的示例性时间线。
图4A是示出根据一些实施例的针对来自教师分类器的不同输出值的示例性数量的交易的图示。
图4B是示出根据一些实施例的基于来自教师分类器的输出值而具有不同的分配权重的示例性数量的交易的图示。
图5A是示出根据一些实施例的,相对于图4A的图示,来自具有更多低置信度输出值的教师分类器的不同输出值的示例性数量的交易的图示。
图5B是示出根据一些实施例的基于图5A的输出值而具有不同权重的示例性数量的交易的图示。
图6是示出根据一些实施例的用于使用一个或多个生成的权重来训练分类模块的示例性方法的框图。
图7是示出根据一些实施例的示例性计算设备的框图。
本说明书包括对各种实施例的引用,以指示本公开并非旨在指代一个特定的实施方式,而是指代落入包括所附权利要求在内的本公开精神内的一系列实施例。可以以与本公开一致的任何合适的方式来组合特定特征、结构或特性。
在本公开内,可以将不同实体(可以以不同的名称称为“单元”、“电路”、其他部件等)描述或要求保护为“被配置”成执行一个或多个任务或操作。在本文中使用此表述—(被配置成[执行一个或多个任务]的[实体])来指代结构(即,诸如电子电路之类的实体事物)。更具体而言,此表述用于指示此结构被布置成在操作过程中执行一个或多个任务。可以说某个结构被“配置成”执行某个任务(即使此结构当前未在操作中)。“被配置成对一个或多个交易进行分类的经训练的交易分类器”旨在涵盖,例如,在操作过程中执行此功能的设备(即使当前未使用相应的设备(例如,当其电池未与之连接时))。因此,被描述或叙述为“被配置成”执行某个任务的实体是指实体事物,诸如,存储可执行以执行任务的程序指令的设备、电路、内存等。此短语在本文中不用于指代无形事物。
“被配置成”一词并不旨在表示“可配置成”。例如,尽管未编程的移动计算设备可以是“可配置成”执行某个特定功能,但它不会被视为“被配置成”执行此功能。在适当的编程之后,移动计算设备可以被配置成执行此功能。
在所附权利要求中陈述了一种结构“被配置成”执行一个或多个任务的明确意图是不对权利要求要素引用35U.S.C.§112(f)。因此,所提交的本申请中的权利要求均不应被解释为具有装置加功能元件。如果申请人希望在专利审查程序过程中引用第112(f)条,则将使用“用于……的装置”[执行功能]构造来陈述权利要求要素。
如本文所用,“基于”一词用于描述影响确定的一个或多个因素。此词语不排除额外的因素可能会影响确定的可能性。也就是说,确定可以仅基于指定因素或基于指定因素以及其他未指定因素。考量一下短语“基于B来确定A”。此短语指定B是一个因素,且用于确定A或影响A的确定。此短语不排除对A的确定也可以基于其他因素,诸如,C。此短语还旨在涵盖其中仅基于B来确定A的实施例。如本文所用,短语“基于”与短语“至少部分基于”同义。
如本文所用,术语“处理元件”是指被配置成执行程序指令(或其部分或其组合)的各种元件。处理元件包括,例如,ASIC(专用集成电路)之类的电路,单个处理器核心的部分或电路,整个处理器核心,单个处理器,现场可编程门阵列(FPGA)之类的可编程硬件设备,和/或包括多个处理器的系统的较大部分,及其任何组合。
具体实施方式
公开了用于使用机器学习技术以基于交易后数据生成的权重来训练交易分类器的技术。当对交易进行实时分类时(例如,确定是否核准交易),交易后信息在分类时不可用。因此,交易后信息历来没有被用于训练分类器。
然而,在所公开的实施例中,基于交易后数据来训练教师分类器,并且使用此教师分类器来生成实例权重(例如,每个交易的权重用作训练输入)。然后,可以使用实例权重来训练实时分类器。例如,高度加权的交易可能对训练实时分类器有更大的影响。在各种实施例中,在分类器训练中使用交易后信息可以提高交易分类器的准确性,并且进而可以提高某些类型的交易(例如,不合要求的交易)的捕获率。
训练架构和实时分类的概述
图1A是示出根据一些实施例的示例性训练架构的框图,此示例性训练架构使用交易后信息来生成用于训练数据的权重。在所示的实施例中,训练架构100包括教师分类器110、权重生成器模块120,以及交易分类器130。在所示的实施例中,训练架构100产生经训练的交易分类器140,下面将参考图1B进行讨论。在各种实施例中,图1A的元件中的一者或多者可以访问用于训练交易的已知的正确分类。
在图1A中,教师分类器110接收交易前信息和交易后信息作为输入。在所示的实施例中,教师分类器110生成分类器输出。在一些实施例中,分类器输出指示交易处于某个类别中的预测可能性。例如,对于具有两个类别输出的分类器,可以使用介于0和1之间的值来指示概率,其中值为0指示发生第一类交易(例如,正常交易)的可能性很高,而值为1指示发生第二类交易(例如,诈骗性交易)的可能性很高。介于两者之间的值可指示置信度较低的预测。例如,值为0.4可指示交易可能正常,但置信度相当低。出于说明的目的,包括了用于分类器输出的示例性数值范围0到1,但并不意图限制本公开的范围;可以设想其他输出范围和其他数量的类别。分类器输出的示例性集合在下面参考图4A和图5A讨论。
在所示的实施例中,权重生成器模块120基于来自教师分类器110的分类器输出来生成用于交易的权重。在所示的实施例中,权重生成器模块120将生成的用于训练的交易前权重传送到交易分类器130。在一些实施例中,基于教师分类器110的输出,使用各种不同的加权技术来生成权重。在输出范围为0到1的一些实施例中,将分类器110的预测输入到以下加权等式,以确定用于交易的权重:
此方法可以为距已知的正确分类更远的交易提供更大的权重(例如,对于分类器输出范围0到1和已知的正确分类1,与输出为0.2相比,输出0.4距已知的分类更远)。在困难的分类上加倍训练可提供更好的整体分类结果的情况下,这可以提高分类器的准确性(并非在所有情况下都是如此)。在其他实施例中,可以使用各种其他技术中的任一种来生成权重。例如,在一些实施例中,可以使用以上等式中的权重的倒数(例如,为更接近正确的已知分类的交易提供更大的权重)。
在一些实施例中,系统使用多种不同的加权技术来生成多个不同的权重集合。在一些实施例中,使用这些多个不同的权重集合来训练交易分类器130,从而生成经训练的交易分类器140的不同版本。在一些实施例中,基于由经训练的交易分类器140的不同版本分类的交易的已知的正确分类来确定不同分类器的优选的(例如,最准确的)版本。在一些实施例中,选择分类器140的确定版本用于将来交易的分类。
在所示的实施例中,交易分类器130接收用于相应交易的交易前权重和交易前信息。在所示的实施例中,不对交易分类器130进行关于交易后信息的训练(除了基于权重之外)。在所示的实施例中,基于交易前权重来训练交易分类器130,以生成经训练的交易分类器140。在一些实施例中,使用类似于用于训练教师分类器110的机器学习技术来训练交易分类器130。例如,教师分类器110和交易分类器130可以是相同类型和拓扑的分类器。在一些实施例中,将由交易分类器130生成的分类器输出与用于输入训练交易的正确的已知分类进行比较,以生成用于对分类器130进行训练的度量(例如,对分类器130的训练程度)。
如上所述,本文讨论的各种模块可以实现机器学习技术,包括以下一者或多者:梯度提升、逻辑回归、朴素贝叶斯、决策树、随机森林、神经网络等。在各种实施例中,交易前权重可用于指示在训练过程中对某些交易的强调,例如,通过对那些交易执行更多的迭代,基于那些交易的错误进行更大的训练调整(例如,更新内部神经网络权重)等。
例如,考量在以上参考图1讨论的训练架构中用作训练实例的一组交易中的第一交易和第二交易。在此示例中,第一交易和第二交易的已知的正确分类都是0。在此示例中,可以将组中的第一交易和第二交易输入到教师分类器110。在此示例中,教师分类器110生成用于第一交易的分类器输出值0.2和用于第二交易的分类器输出值0.5,并将它们传送给权重生成器模块120。此外,在此示例中,模块120基于分类器输出值生成较低的权重(例如,为1)并将其分配给第一交易,将较大的权重(例如,为5)分配给第二交易。最终,基于为两个交易分配的权重来训练交易分类器130,其中,在此示例中,第二交易对交易分类器130的训练具有更大的影响。
图1B是示出根据一些实施例的根据图1A的架构训练的示例性分类器的框图。在所示的实施例中,经训练的交易分类器140执行交易的实时分类150。在所示的实施例中,用于未决交易的数据被输入到分类器140。在所示的实施例中,分类器140生成用于未决交易的分类器输出。在一些实施例中,交易被输入到经训练的交易分类器140,以用于实时分类。在一些实施例中,基于分类器输出,交易授权系统对输入到分类器140的一个或多个交易进行终止或授权。
如本文所用,术语“模块”是指被配置成执行指定的操作的电路或实体非暂时性计算机可读介质,其存储指示其他电路(例如,处理器)执行指定的操作的信息(例如,程序指令)。模块可以以多种方式实现,包括实现为硬连线电路或其中存储有可由一个或多个处理器执行以执行操作的程序指令的内存。硬件电路可以包括,例如,定制的超大规模集成(VLSI)电路或门阵列、成品半导体,诸如,逻辑芯片、晶体管或其他分立部件。模块也可以在现场可编程门阵列、可编程阵列逻辑、可编程逻辑器件之类的可编程硬件设备中实现。模块也可以是存储可执行以执行指定操作的程序指令的任何合适形式的非暂时性计算机可读介质。
示例性交易前信息和交易后信息
如本文所用,术语“交易前信息”是指在相关的未决交易完成之前可用于分类器的信息。因此,交易前信息可以包括在交易已经发起之后但是在交易完成之前接收到的信息。交易前信息可以包括,例如,来自在当前未决交易完成之前未决或完成的交易的数据,以及其他非交易信息,诸如,用户活动、用户位置等。各种交易前信息和交易后信息可以用于(有或没有预处理)生成输入到分类器110和/或140的特征。
如本文所用,术语“交易后信息”是指直到相关交易完成之后才可用的信息。在一些实施例中,交易后信息包括在当前未决交易完成之后发起的交易。另外,交易后信息可以包括非交易信息,诸如,其他用户活动。因此,交易后信息可以包括以下属性中的一者或多者:一个或多个设备上的用户活动、地理围栏信息、点击活动、一个或多个交易的美元金额、一个或多个交易中的商品数量、商品类型、用户信息、发起一个或多个交易的设备的类型、在完成交易后的交易数量、在完成交易后的各种交易的总美元金额等。
图2示出了根据一些实施例的与训练交易有关的示例性交易前信息和交易后信息。在所示的示例中,前三行是与特定训练交易(未明确示出)有关的交易前信息,而其余行代表交易后信息。在所示的示例中,交易后信息包括$450交易、地理围栏信息220,以及互联网活动信息224(但是在各种实施例中可以利用各种类型的交易和非交易信息中的任一种)。
在所示的实施例中,用户ID列包含单个标识号(在此示例中,所有四个交易都针对同一用户)。在所示的实施例中,针对每个交易的交易金额214被示为美元金额$400、$40、$300,以及$450。在所示的实施例中,示出了发起每个交易的日期216。在所示的实施例中,最右边的列显示交易是否是诈骗性交易218。在所示的实施例中,从顶部开始的第三个交易已被分类为诈骗性交易,而其他交易则不是。
在所示的实施例中,最后一个交易(金额$450)被认为是与上面讨论的特定训练交易有关的交易后信息(在特定交易的实时分类过程中不可用)。在一些实施例中,交易后信息包括多个交易。在一些实施例中,地理围栏信息220包括以下一者或多者:与用户相关联的设备进入地理围栏的时间,用户进入地理围栏的哪一部分,用户退出地理围栏的时间等。在一些实施例中,互联网活动信息224包括以下一者或多者:浏览信息的用户,观看的网站数量,观看的时间长度,互联网搜索字段输入,用于连接的网络等。除信息220和224之外的各种不同类型的信息可以被认为是交易后信息。注意,各种数据结构中的任一者都可以用于存储交易前信息和交易后信息;所公开的示例并非旨在限制本公开的范围。
图3示出了时间线310,在时间线的中心处具有特定的示例性交易。在所示的实施例中,交易前信息被指示为在时间轴上位于特定交易的完成的左侧,并且在特定交易的实时分类过程中是可用的。交易后信息被指示为在时间轴上位于特定交易的完成的右侧,并且在特定交易完成后是可用的。
示例性教师分类器输出和分配的权重
图4A-图5B是示出根据一些实施例的来自教师分类器110的示例性输出和相应的分配的权重的图示。图4A-图4B表示一组训练交易,其已知的正确分类为0,而图5A-图5B表示一组训练交易,其已知的正确分类为1。所示的示例对具有距正确结果更远的预测输出的交易使用更大的权重,但是其他加权技术可能不会显示出此特性。
图4A是示出根据一些实施例的用于来自教师分类器的不同输出值的示例性数量的交易的图示。在所示的实施例中,对于众多交易,示出了预测交易应被分类为第一类还是第二类的输出值(例如,交易应被分类为符合标准(good)还是不符合标准(bad)),其中输出值在介于0和1之间的示例性数值范围上。在所示的实施例中,基于交易前信息和交易后信息生成教师分类器的输出预测值。注意,相对于在没有任何基于交易后信息的训练输入参数(例如,没有教师分类器)的情况下训练交易分类器的实施方式,使用基于交易后信息进行训练的教师分类器可以提高交易分类器的准确性。
针对图4A的示例绘制的交易都具有已知的正确分类0。在所示的实施例中,大多数输出预测在0.1到0.3范围内。然而,需注意,少数预测与正确的分类相距甚远(例如,在0.5到0.6范围内)。
如以上参考图1A所讨论的,在一些实施例中,基于教师分类器针对那些交易的输出预测(基于教师分类器的置信度),将权重分配给交易。例如,可以基于交易是否被正确地分类和/或基于分类器的置信度(例如,对于已知的符合标准的交易的预测0.4的置信度可以比预测0.2低)来对交易进行加权。在所示的图4A-图5B的示例中,为置信度较低或不正确的预测赋予更大的权重,但是在其他实施例中,可以使用各种加权技术中的任一种。
图4B是示出根据一些实施例的基于来自教师分类器的输出值而具有不同的分配权重的示例性数量的交易的图示。在所示的实施例中,已经基于图4A中显示的输出和针对众多交易的已知的正确分类值,将权重分配给众多交易。在图4B中,大多数输出预测已被分配了较小的权重值(例如,介于1和2之间)。
图5A是示出根据一些实施例的用于来自教师分类器的不同输出值的示例性数量的交易的图示,此教师分类器具有相对于图4A的图示而言更多数量的低置信度输出值。针对图4A的示例绘制的交易均具有已知的正确分类0。图5A示出具有在0.4到0.6范围内的分类的众多交易,指示教师分类器对这些交易的分类没有置信度。此外,图5A还示出0.2到0.4范围内的众多交易,这可以指示那些交易被错误地分类。
图5B是示出根据一些实施例的基于图5A的输出值而具有不同权重的示例性数量的交易的图示。在所示的实施例中,与图4B中以大于2的值加权的交易数量相比,更多数量的交易以大于2的值加权。此示例性场景对应于其中错误预测的和/或低置信度预测的交易获得更大的权重的实施例。
在一些实施例中,某些训练交易可以被忽略和/或被分配权重,从而导致那些交易对训练分类器140没有影响。在一些实施例中,除了或代替基于教师分类器的输出来分配权重,系统还可以基于训练交易的一个或多个特定属性为训练交易分配权重。例如,在一些实施例中,基于美元价值属性来训练一个或多个分类器。例如,具有较大美元价值(例如,$10,00)的交易的权重可以高于具有较小美元价值(例如,$10)的交易的权重。在各种实施例中,交易属性包括以下一者或多者:美元金额、商品数量、位置、服务提供商、交易类型等。
示例性方法
图6是示出根据一些实施例的用于使用一个或多个生成的权重来训练分类模块的示例性方法的图示。图6所示的方法可以与本文公开的计算机电路、系统、设备、元件或部件以及其他设备中的任一者结合使用。在各种实施例中,所示的一些方法元素可以以与所示的顺序不同的顺序同时执行,或者可以省略。还可以根据需要执行额外的方法元素。
在610,在所示的实施例中,计算设备使用用于一组交易的第一数据作为训练数据输入来训练第一分类器模块,其中第一数据包括用于一组交易中的交易的交易前信息和交易后信息,并且其中一组交易中的交易的正确分类是已知的。在一些实施例中,用于一组交易中的第一交易的交易后信息包括用于在第一交易之后执行的一个或多个交易以及与第一交易相关联的用户的非交易活动的信息。
在620,在所示的实施例中,计算设备基于经训练的第一分类器对一组交易中的多个交易的分类输出,为多个交易生成各自的权重。在一些实施例中,计算设备基于正确的分类与经训练的第一分类器模块为交易而生成的输出预测之间的关系来生成各自的权重。例如,如果输出预测距给定交易的正确的已知分类较远,则分配给给定交易的权重可以大于分配给输出预测接近正确的已知分类的交易的权重。在一些实施例中,计算设备为输出预测距正确分类较远的交易生成更大的权重。在一些实施例中,加权指示不使用一组交易中的一个或多个交易来训练第二分类器模块。
在630,在所示的实施例中,计算设备基于生成的权重使用用于一组交易的第二数据作为训练数据输入来训练第二分类器模块。
在一些实施例中,用于一组交易的第二数据包括用于一组交易中的交易的交易前信息,而不包括用于一组交易中的交易的交易后信息。在一些实施例中,计算设备使用多种不同的加权技术来生成各自的权重,以生成多组权重。在一些实施例中,计算设备使用多组权重针对第二分类器模块的多个版本训练第二分类器模块。在一些实施例中,计算设备选择第二分类器模块的多个版本中的经训练的版本。在一些实施例中,计算设备使用梯度提升树机器学习技术基于生成的权重来训练第二分类器模块。
在640,在所示的实施例中,计算设备仅基于用于一个或多个未决交易的交易前信息,使用经训练的第二分类器模块,对一个或多个未决交易进行分类。
在一些实施例中,在训练交易分类器时使用交易后信息可以有利地提高交易分类器的捕获率。在一些实施例中,诈骗性交易捕获率的小幅提高可以充分地改善整体交易的安全性。
需注意,本文讨论的各种实施例可以涉及支付交易(例如,当讨论诈骗时)。在其他实施例中,所公开的技术可以用于各种类型的交易和分类中的任一种。例如,所公开的技术可以用于在交易对应于手术之类的过程的情况下预测医疗结果。在此示例性实施例中,交易前信息包括在医疗过程之前和过程中可用的信息,而交易后信息可以包括以下一者或多者:手术完成后给予的药物、患者在手术完成后两周内出现的症状、当前手术完成后接受相同类型手术的其他患者出现的症状等。
示例性计算设备
现在转参图7,示出了计算设备(也可以称为计算系统)710的一个实施例的框图。计算设备710可以用于实现本公开的各个部分。计算设备710可以是任何合适类型的设备,包括但不限于,个人计算机系统、台式计算机、膝上型计算机或笔记本计算机、大型计算机系统、网络服务器、工作站,或网络计算机。如图所示,计算设备710包括经由互连体760(例如,系统总线)耦接的处理单元750、存储器712,以及输入/输出(I/O)接口730。I/O接口730可以耦接到一个或多个I/O设备740。计算设备710还包括网络接口732,其可以耦接到网络720,以与(例如,其他计算设备)通信。
在各种实施例中,处理单元750包括一个或多个处理器。在一些实施例中,处理单元750包括一个或多个协同处理器单元。在一些实施例中,处理单元750的多个实例可以耦接到互连体760。处理单元750(或750内的每个处理器)可以包含高速缓存或其他形式的板载内存。在一些实施例中,处理单元750可以被实现为通用处理单元,并且在其他实施例中,其可以被实现为专用处理单元(例如,ASIC)。总体而言,计算设备710不限于任何特定类型的处理单元或处理器子系统。
存储器子系统712可由处理单元750使用(例如,用于存储可由处理单元750执行的指令和由处理单元750使用的数据)。存储器子系统712可以由任何合适类型的实体内存介质(包括硬盘存储器、软盘存储器、可移动磁盘存储器、闪存、随机存取内存(RAM-SRAM、EDORAM、SDRAM、DDR SDRAM、RDRAM等)、ROM(PROM、EEPROM等),等等)来实现。在一个实施例中,存储器子系统712可以仅由易失性内存组成。存储器子系统712可以存储可由计算设备710使用处理单元750执行的程序指令,包括可执行以促使计算设备710实现本文公开的各种技术的程序指令。
根据各种实施例,I/O接口730可以代表一个或多个接口,并且可以是被配置成耦接到其他设备并与其他设备通信的各种类型的接口中的任一种。在一个实施例中,I/O接口730是从正面总线到一个或多个背面总线的桥接芯片。I/O接口730可以经由一个或多个相应的总线或其他接口耦接到一个或多个I/O设备740。I/O设备的示例包括存储设备(硬盘、光盘驱动器、可移动闪存驱动器、存储阵列、SAN,或关联的控制器)、网络接口设备、用户界面设备,或其他设备(例如,图形、声音等)。
还设想了存储可由计算系统执行以实现本文公开的技术的指令(以及可选地,数据)的各种制品。计算系统可以使用一个或多个处理元件来执行指令。制品包括非暂时性计算机可读内存介质。设想的非暂时性计算机可读存储介质包括计算设备的内存子系统的部分,以及磁性介质(例如,磁盘)或光学介质(例如,CD、DVD及相关技术等)之类的存储介质或内存介质。非暂时性计算机可读介质可以是易失性或非易失性内存。
尽管上文已经描述了特定实施例,但是即使在关于特定特征仅描述单个实施例的情况下,这些实施例也不旨在限制本公开的范围。除非另有说明,否则本公开中提供的特征的示例旨在是说明性的而非限制性的。以上描述旨在涵盖受益于本公开的本领域技术人员将显而易见的此类替代、修改以及等同形式。
本公开的范围包括本文(明确地或隐含地)公开的任何特征或特征的组合,或其任何概括(无论其是否减轻了本文所解决的任何或所有问题)。因此,可以在本申请(或要求其优先权的申请)的专利审查程序过程中针对任何这种的特征组合提出新的权利要求。具体而言,参考所附权利要求,可以将从属权利要求的特征与独立权利要求的特征进行组合,并且可以以任何适当的方式而不是仅以所附权利要求中列举的特定组合的方式将来自各个独立权利要求的特征进行组合。
Claims (20)
1.一种方法,包括:
使用用于一组交易的第一数据作为训练数据输入来训练第一分类器模块,其中,所述第一数据包括用于所述一组交易中的交易的交易前信息和交易后信息两者,并且其中,用于所述一组交易中的交易的正确分类是已知的;
基于经训练的第一分类器对所述一组交易中的多个交易的分类输出,为所述多个交易生成各自的权重;
基于所生成的权重使用用于所述一组交易的第二数据作为训练数据输入来训练第二分类器模块;以及
仅基于用于一个或多个未决交易的交易前信息,使用经训练的第二分类器模块,对所述一个或多个未决交易进行分类。
2.根据权利要求1所述的方法,其中,基于所生成的权重进行训练包括以下项中的一者或多者:
基于第一交易的权重大于第二交易的权重,对所述第一交易执行比所述第二交易更多的训练迭代;或者
基于第一交易的权重大于第二交易的权重,对所述第一交易执行比所述第二交易更大的训练调整。
3.根据权利要求1所述的方法,其中,生成各自的权重是使用多种不同的加权技术以生成多组权重来执行的;
其中,训练所述第二分类器模块是使用所述多组权重针对所述第二分类器模块的多个版本执行的;
其中,所述方法还包括:选择所述第二分类器模块的多个版本中的经训练的版本。
4.根据权利要求1所述的方法,其中,基于正确的分类与由经训练的第一分类器模块为所述交易而生成的输出预测之间的关系来生成各自的权重。
5.根据权利要求1所述的方法,其中,生成各自的权重为输出预测距所述正确分类较远的交易提供更大的权重。
6.根据权利要求1所述的方法,其中,基于所生成的权重来训练所述第二分类器模块是使用梯度提升树机器学习技术来执行的。
7.根据权利要求1所述的方法,其中,用于所述一组交易中的第一交易的交易后信息包括用于在所述第一交易之后执行的一个或多个交易以及与所述第一交易相关联的用户的非交易活动的信息。
8.根据权利要求1所述的方法,其中,用于所述一组交易的第二数据包括用于所述一组交易中的交易的交易前信息,并且不包括用于所述一组交易中的交易的交易后信息。
9.根据权利要求1所述的方法,其中,加权指示不使用所述一组交易中的一个或多个交易来训练所述第二分类器模块。
10.一种非暂时性计算机可读介质,其上存储有指令,所述指令能够由计算设备执行,以执行以下操作,所述操作包括:
使用用于一组交易的第一数据作为训练数据输入来训练第一分类器模块,其中,所述第一数据包括用于所述一组交易中的交易的交易前信息和交易后信息两者,并且其中,用于所述一组交易中的交易的正确分类是已知的;
基于经训练的第一分类器对所述一组交易中的多个交易的分类输出,为所述多个交易生成各自的权重;以及
基于所生成的权重使用用于所述一组交易的第二数据作为训练数据输入来训练第二分类器模块。
11.根据权利要求10所述的非暂时性计算机可读介质,其中,生成各自的权重是使用多种不同的加权技术以生成多组权重来执行的;
其中,训练所述第二分类器模块是使用所述多组权重针对所述第二分类器模块的多个版本执行的;
其中,所述操作还包括:选择所述第二分类器模块的多个版本中的经训练的版本。
12.根据权利要求10所述的非暂时性计算机可读介质,其中,基于正确的分类与由经训练的第一分类器模块为所述交易而生成的输出预测之间的关系来生成各自的权重。
13.根据权利要求10所述的非暂时性计算机可读介质,其中,生成各自的权重为输出预测距所述正确分类较远的交易提供更大的权重。
14.根据权利要求10所述的非暂时性计算机可读介质,其中,用于所述一组交易中的第一交易的交易后信息包括用于在所述第一交易之后执行的一个或多个交易以及与所述第一交易相关联的用户的非交易活动的信息。
15.根据权利要求10所述的非暂时性计算机可读介质,其中,用于所述一组交易的第二数据包括用于所述一组交易中的交易的交易前信息,并且不包括用于所述一组交易中的交易的交易后信息。
16.一种方法,包括:
由计算系统访问经训练的分类器模块,其中,所述经训练的分类器模块是基于交易前信息和交易后信息两者针对用作训练输入的各自的训练交易而生成的;以及
由所述计算系统使用访问的分类器模块仅基于用于一个或多个未决交易的交易前信息对所述一个或多个未决交易进行分类。
17.根据权利要求16所述的方法,其中,所述经训练的分类器模块是通过以下步骤生成的:
使用用于一组交易的第一数据作为训练数据输入来训练教师分类器模块,其中,所述第一数据包括用于所述一组交易中的交易的交易前信息和交易后信息;
基于经训练的第一分类器对所述一组交易中的多个交易的分类输出,为所述多个交易生成各自的权重;以及
基于所生成的权重使用用于所述一组交易的第二数据作为训练数据输入来训练第二分类器模块,以生成经训练的分类器模块。
18.根据权利要求17所述的方法,其中,用于所述一组交易的第二数据包括用于所述一组交易中的交易的交易前信息,并且不包括用于所述一组交易中的交易的交易后信息。
19.根据权利要求17所述的方法,其中,
基于正确的分类与由所述教师分类器模块为所述交易而生成的输出预测之间的关系来生成各自的权重。
20.根据权利要求17所述的方法,其中,加权指示不使用所述一组交易中的一个或多个交易来训练所述分类器模块。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/198,445 | 2018-11-21 | ||
US16/198,445 US11321632B2 (en) | 2018-11-21 | 2018-11-21 | Machine learning based on post-transaction data |
PCT/US2019/062355 WO2020106806A1 (en) | 2018-11-21 | 2019-11-20 | Machine learning based on post-transaction data |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113056753A true CN113056753A (zh) | 2021-06-29 |
CN113056753B CN113056753B (zh) | 2024-07-12 |
Family
ID=70727994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980076279.2A Active CN113056753B (zh) | 2018-11-21 | 2019-11-20 | 基于交易后数据的机器学习 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11321632B2 (zh) |
EP (1) | EP3884440A4 (zh) |
CN (1) | CN113056753B (zh) |
AU (2) | AU2019384537B2 (zh) |
WO (1) | WO2020106806A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11922422B2 (en) | 2020-11-17 | 2024-03-05 | Visa International Service Association | System, method, and computer program product for determining fraud |
US11961084B1 (en) * | 2021-11-22 | 2024-04-16 | Rsa Security Llc | Machine learning models for fraud detection |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5819226A (en) * | 1992-09-08 | 1998-10-06 | Hnc Software Inc. | Fraud detection using predictive modeling |
US7236538B1 (en) * | 2000-08-02 | 2007-06-26 | Via Telecom Co., Ltd. | Method and apparatus for improving transmit antenna weight tracking using channel correlations in a wireless communication system |
CN103778551A (zh) * | 2012-10-23 | 2014-05-07 | 阿里巴巴集团控股有限公司 | 商品信息提示方法及装置 |
CN105279691A (zh) * | 2014-07-25 | 2016-01-27 | 中国银联股份有限公司 | 基于随机森林模型的金融交易检测方法和设备 |
US20170236370A1 (en) * | 2016-02-15 | 2017-08-17 | Zynga Inc. | Automatically identifying potentially fraudulent gaming accounts |
WO2017143932A1 (zh) * | 2016-02-26 | 2017-08-31 | 中国银联股份有限公司 | 基于样本聚类的欺诈交易检测方法 |
CN107784124A (zh) * | 2017-11-23 | 2018-03-09 | 重庆邮电大学 | 一种基于时空关系的lbsn超网络链接预测方法 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7668769B2 (en) | 2005-10-04 | 2010-02-23 | Basepoint Analytics, LLC | System and method of detecting fraud |
US7587348B2 (en) | 2006-03-24 | 2009-09-08 | Basepoint Analytics Llc | System and method of detecting mortgage related fraud |
US20120109821A1 (en) * | 2010-10-29 | 2012-05-03 | Jesse Barbour | System, method and computer program product for real-time online transaction risk and fraud analytics and management |
US8914876B2 (en) | 2011-05-05 | 2014-12-16 | Ebay Inc. | System and method for transaction security enhancement |
US10134040B2 (en) * | 2013-04-26 | 2018-11-20 | Visa International Service Association | Systems and methods for large-scale testing activities discovery |
CN105095238B (zh) * | 2014-05-04 | 2019-01-18 | 中国银联股份有限公司 | 用于检测欺诈交易的决策树生成方法 |
US20160335432A1 (en) | 2015-05-17 | 2016-11-17 | Bitdefender IPR Management Ltd. | Cascading Classifiers For Computer Security Applications |
KR101779036B1 (ko) * | 2016-01-08 | 2017-09-15 | 한국인터넷진흥원 | 머신러닝을 이용하여 이상거래를 탐지하기 위한 장치 및 그 방법 |
US20180005285A1 (en) * | 2016-06-30 | 2018-01-04 | Paypal, Inc. | Tokenization and dynamic transaction classification |
US11443224B2 (en) * | 2016-08-10 | 2022-09-13 | Paypal, Inc. | Automated machine learning feature processing |
US20180053105A1 (en) * | 2016-08-18 | 2018-02-22 | Paypal, Inc. | Model Training for Multiple Data Spaces for Pattern Classification and Detection |
US11301765B2 (en) * | 2016-10-18 | 2022-04-12 | Paypal, Inc. | Processing machine learning attributes |
US11144825B2 (en) | 2016-12-01 | 2021-10-12 | University Of Southern California | Interpretable deep learning framework for mining and predictive modeling of health care data |
US11416956B2 (en) * | 2017-03-15 | 2022-08-16 | Coupa Software Incorporated | Machine evaluation of contract terms |
US11625569B2 (en) * | 2017-03-23 | 2023-04-11 | Chicago Mercantile Exchange Inc. | Deep learning for credit controls |
US20180350006A1 (en) * | 2017-06-02 | 2018-12-06 | Visa International Service Association | System, Method, and Apparatus for Self-Adaptive Scoring to Detect Misuse or Abuse of Commercial Cards |
KR101879416B1 (ko) * | 2017-06-12 | 2018-07-18 | 고려대학교 산학협력단 | 이상 금융거래 탐지 방법 및 그 전자 장치 |
US20190102675A1 (en) * | 2017-09-29 | 2019-04-04 | Coupa Software Incorporated | Generating and training machine learning systems using stored training datasets |
US10896450B2 (en) * | 2017-11-16 | 2021-01-19 | Coupa Software Incorporated | System and methods for using transaction data to identify computing devices capable of performing transactions subject to transaction parameters |
US11151573B2 (en) * | 2017-11-30 | 2021-10-19 | Accenture Global Solutions Limited | Intelligent chargeback processing platform |
US10949828B2 (en) * | 2018-06-28 | 2021-03-16 | International Business Machines Corporation | Transaction processing based on statistical classification and contextual analysis |
US20200082004A1 (en) * | 2018-09-06 | 2020-03-12 | Ca, Inc. | Automatic detection of database criticality |
US20200098053A1 (en) * | 2018-09-26 | 2020-03-26 | Intuit Inc. | Method and system for user data driven financial transaction description dictionary construction |
US20200286095A1 (en) * | 2019-03-07 | 2020-09-10 | Sony Corporation | Method, apparatus and computer programs for generating a machine-learning system and for classifying a transaction as either fraudulent or genuine |
AU2019475423B2 (en) * | 2019-11-20 | 2023-06-08 | Paypal, Inc. | Techniques for leveraging post-transaction data for prior transactions to allow use of recent transaction data |
EP3866087A1 (en) * | 2020-02-12 | 2021-08-18 | KBC Groep NV | Method, use thereoff, computer program product and system for fraud detection |
-
2018
- 2018-11-21 US US16/198,445 patent/US11321632B2/en active Active
-
2019
- 2019-11-20 EP EP19887633.6A patent/EP3884440A4/en active Pending
- 2019-11-20 WO PCT/US2019/062355 patent/WO2020106806A1/en unknown
- 2019-11-20 CN CN201980076279.2A patent/CN113056753B/zh active Active
- 2019-11-20 AU AU2019384537A patent/AU2019384537B2/en active Active
-
2022
- 2022-01-31 US US17/589,614 patent/US20220156645A1/en active Pending
- 2022-10-06 AU AU2022246433A patent/AU2022246433B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5819226A (en) * | 1992-09-08 | 1998-10-06 | Hnc Software Inc. | Fraud detection using predictive modeling |
US7236538B1 (en) * | 2000-08-02 | 2007-06-26 | Via Telecom Co., Ltd. | Method and apparatus for improving transmit antenna weight tracking using channel correlations in a wireless communication system |
CN103778551A (zh) * | 2012-10-23 | 2014-05-07 | 阿里巴巴集团控股有限公司 | 商品信息提示方法及装置 |
CN105279691A (zh) * | 2014-07-25 | 2016-01-27 | 中国银联股份有限公司 | 基于随机森林模型的金融交易检测方法和设备 |
US20170236370A1 (en) * | 2016-02-15 | 2017-08-17 | Zynga Inc. | Automatically identifying potentially fraudulent gaming accounts |
WO2017143932A1 (zh) * | 2016-02-26 | 2017-08-31 | 中国银联股份有限公司 | 基于样本聚类的欺诈交易检测方法 |
CN107784124A (zh) * | 2017-11-23 | 2018-03-09 | 重庆邮电大学 | 一种基于时空关系的lbsn超网络链接预测方法 |
Also Published As
Publication number | Publication date |
---|---|
US11321632B2 (en) | 2022-05-03 |
CN113056753B (zh) | 2024-07-12 |
US20220156645A1 (en) | 2022-05-19 |
AU2022246433B2 (en) | 2024-01-25 |
AU2019384537A1 (en) | 2021-06-03 |
EP3884440A1 (en) | 2021-09-29 |
AU2022246433A1 (en) | 2022-11-03 |
WO2020106806A1 (en) | 2020-05-28 |
EP3884440A4 (en) | 2022-08-10 |
AU2019384537B2 (en) | 2022-07-14 |
US20200160232A1 (en) | 2020-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200134716A1 (en) | Systems and methods for determining credit worthiness of a borrower | |
US10586235B2 (en) | Database optimization concepts in fast response environments | |
US20200372509A1 (en) | Detecting malicious transactions using multi-level risk analysis | |
AU2022246433B2 (en) | Machine learning based on post-transaction data | |
AU2021290143B2 (en) | Machine learning module training using input reconstruction techniques and unlabeled transactions | |
US20200327549A1 (en) | Robust and Adaptive Artificial Intelligence Modeling | |
US20220318654A1 (en) | Machine Learning and Reject Inference Techniques Utilizing Attributes of Unlabeled Data Samples | |
US20220383203A1 (en) | Feature selection using feature-ranking based optimization models | |
US20220156634A1 (en) | Training Data Augmentation for Machine Learning | |
US20220129727A1 (en) | Multi-Phase Training Techniques for Machine Learning Models Using Weighted Training Data | |
US11983610B2 (en) | Calculating decision score thresholds using linear programming | |
US20210150530A1 (en) | Techniques for leveraging post-transaction data for prior transactions to allow use of recent transaction data | |
US20230195056A1 (en) | Automatic Control Group Generation | |
US20240177058A1 (en) | Use of a Training Framework of a Multi-Class Model to Train a Multi-Label Model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |