CN106570531A - 支付设备相似度的计算方法及计算系统 - Google Patents

支付设备相似度的计算方法及计算系统 Download PDF

Info

Publication number
CN106570531A
CN106570531A CN201610994178.1A CN201610994178A CN106570531A CN 106570531 A CN106570531 A CN 106570531A CN 201610994178 A CN201610994178 A CN 201610994178A CN 106570531 A CN106570531 A CN 106570531A
Authority
CN
China
Prior art keywords
payment devices
similarity
payment
importance degree
facility information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610994178.1A
Other languages
English (en)
Inventor
霍文虎
刘润石
袁旭萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Ctrip Business Co Ltd
Original Assignee
Shanghai Ctrip Business Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Ctrip Business Co Ltd filed Critical Shanghai Ctrip Business Co Ltd
Priority to CN201610994178.1A priority Critical patent/CN106570531A/zh
Publication of CN106570531A publication Critical patent/CN106570531A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/30Payment architectures, schemes or protocols characterised by the use of specific devices or networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种支付设备相似度的计算方法及计算系统,计算方法包括以下步骤:S1、收集用户在浏览以及支付时采集到的支付设备的所有相关设备信息;S2、设置多台支付设备,并为每台支付设备设置唯一标识,对在所述支付设备上进行的每一次操作均生成一条源数据;S3、对每两条源数据之间均进行比对,并根据比对结果生成模型分析数据;S4、计算每个设备信息的重要度;S5、建立相似度计算模型,并通过相似度计算模型以及设备信息的重要度计算两个支付设备之间的相似度。本发明计算支付设备的相似度,从库中匹配唯一设备号给到实时交易,降低更改部分支付设备信息就能轻易改变设备标识的影响,提高模型规则的准确率、覆盖率,降低资损。

Description

支付设备相似度的计算方法及计算系统
技术领域
本发明涉及一种支付设备相似度的计算方法及计算系统。
背景技术
在“互联网+”大环境的良性驱动下,支付业务的不断发展、产品服务越来越多样化,每日交易量达到百万级,在正常用户享受便捷服务的同时,有部分不法分子使用欺诈来的卡片在支付平台上进行销赃为目的的交易。为了保护用户的财产安全,提升用户支付安全感,风控人员会使用反欺诈规则/模型对疑似欺诈交易进行识别后的处理,传统反欺诈模型/规则常用的识别逻辑是同主体下(账户、信用卡、设备等)短时间内是否有频繁的交易(例如欺诈分子使用自己的PC(个人计算机)在短时间内频繁下单),此类逻辑的业务含义为:欺诈分子的盗卡后的目的是在被盗用户感知之前尽可能的销赃,出于此本质目的,大部分欺诈分子会进行短时间内的频繁交易。在长期的“对抗”当中,欺诈分子的手段也变得越来越高明,他们知道风控会有针对同一主体累计交易笔数的相关规则逻辑,会采取措施“绕过”逻辑,例如:①欺诈分子注册多个账户,进行多点下单,这样从单个账户维度来看,并没有满足频繁交易的逻辑。②欺诈分子使用盗来的多张卡进行多点交易而非单卡销赃。③欺诈分子使用多台“设备”进行多点交易。
第①种绕过规则的手段对于欺诈分子来说只需要批量注册账户,是一种低成本的手段,且一般的欺诈分子都是团伙作案,所以手中的信用卡也是多张,那么第②种手段对他们来说也是轻而易举。对于第③种通过换“设备”的方式绕过规则,原本是相对成本较高的(理论上需要有多台PC或者移动设备),但由于我们风控是通过采集的设备标识,导致用户只需要清空cookie就能改变自己的设备号,从数据上看来用户使用了一台新的设备,这个问题的存在造成欺诈分子也能低成本的进行“设备”的更换。
发明内容
本发明要解决的技术问题是为了克服现有技术中风控是通过采集的设备标识,导致用户只需要清空cookie就能改变设备号,使得设备无法被识别的缺陷,提供一种支付设备相似度的计算方法及计算系统。
本发明是通过下述技术方案来解决上述技术问题的:
本发明提供了一种支付设备相似度的计算方法,其特点在于,包括以下步骤:
S1、收集用户在浏览以及支付时采集到的支付设备的所有相关设备信息;
S2、设置多台支付设备,并为每台支付设备设置唯一标识,对在所述支付设备上进行的每一次操作均生成一条源数据;
S3、对每两条源数据之间均进行比对,并根据比对结果生成模型分析数据;
S4、计算每个设备信息的重要度;
S5、建立相似度计算模型,并通过所述相似度计算模型以及所述设备信息的重要度计算两个支付设备之间的相似度。
较佳地,步骤S5之后还包括:
S6、判断计算出的所述两个支付设备之间的相似度是否超过第一阈值,若是,则确认所述两个支付设备相同,若否,则确认所述两个支付设备不同。
较佳地,步骤S4中还删除重要度小于第二阈值的设备信息。
较佳地,所述设备信息包括操作系统、浏览器语言、分辨率、浏览器类型中的至少一种。
较佳地,所述支付设备包括PC及手机。
本发明的目的在于还提供了一种支付设备相似度的计算系统,其特点在于,包括:
设备信息收集模块,用于收集用户在浏览以及支付时采集到的支付设备的所有相关设备信息;
源数据生成模块,用于设置多台支付设备,并为每台支付设备设置唯一标识,对在所述支付设备上进行的每一次操作均生成一条源数据;
模型分析数据生成模块,用于对每两条源数据之间均进行比对,并根据比对结果生成模型分析数据;
重要度计算模块,用于计算每个设备信息的重要度;
相似度计算模块,用于建立相似度计算模型,并通过所述相似度计算模型以及所述设备信息的重要度计算两个支付设备之间的相似度。
较佳地,所述计算系统还包括:
判断模块,判断计算出的所述两个支付设备之间的相似度是否超过第一阈值,若是,则确认所述两个支付设备相同,若否,则确认所述两个支付设备不同。
较佳地,所述重要度计算模块还用于删除重要度小于第二阈值的设备信息。
较佳地,所述设备信息包括操作系统、浏览器语言、分辨率、浏览器类型中的至少一种。
较佳地,所述支付设备包括PC及手机。
本发明的积极进步效果在于:本发明计算支付设备直接的相似度,并从库中匹配唯一设备号给到实时交易,降低了更改部分支付设备信息就能轻易改变设备标识的影响,在风控场景中增加了欺诈分子的作案成本,提高模型规则的准确率、覆盖率,降低资损。
附图说明
图1为本发明的较佳实施例的支付设备相似度的计算系统的模块示意图。
图2为本发明的较佳实施例的支付设备相似度的计算方法的流程图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
如图1所示,本发明的支付设备相似度的计算系统包括设备信息收集模块1、源数据生成模块2、模型分析数据生成模块3、重要度计算模块4、相似度计算模块5以及判断模块6;
所述设备信息收集模块1用于进行字段收集,具体地,会收集用户在浏览以及支付时采集到的支付设备的所有相关设备信息;具体的设备信息例如可包括操作系统、浏览器语言、分辨率、浏览器类型等;
所述源数据生成模块2则用于设置多台支付设备,并为每台支付设备设置唯一标识,对在所述支付设备上进行的每一次操作均生成一条源数据;其中,支付设备的设备类型和操作系统等属性需要保证多样化,例如支付设备包含PC、手机等,操作系统包含Windows、IOS、Android等,并为每台支付设备打上唯一标识;
然后,安排操作人员在实验观察期内在支付设备上进行一系列操作,例如浏览平台、调整分辨率等,每一次操作均会生成一条源数据,收集在实验观察期内的支付设备的源数据构成源数据集。
所述模型分析数据生成模块3则对每两条源数据之间均进行比对,并根据比对结果生成模型分析数据;具体地,会利用所述源数据生成模块2生成并收集的源数据,对支付设备进行两两之间的比对,记录比对结果,需要记录的有两条源数据对应的设备号是否一致、各个支付设备的设备信息是否一致,所有比对结果的一致记为1、不一致记为0,然后将比对结果整理为最终的模型分析数据。
所述重要度计算模块4用于计算每个设备信息的重要度;数据中的自变量对应为源数据中两条记录比对设备信息是否一致的结果,目标变量对应为两条记录是否来自同一支付设备,显而易见,如果设备信息的变化对判断两条记录是否来自同一支付设备影响不大,则可以认为该设备信息的重要度较低,反之亦然。对于变量重要度的计算有多种方式,本发明中举例采用Information Value(IV,信息价值)的方法计算变量重要度。下面举例说明计算分辨率的重要度:
1(设备号一致) 0(设备号不一致)
1(分辨率一致) 0.7 0.4
0(分辨率不一致) 0.3 0.6
交叉表中的数值代表某变量每个水平的记录数分别在目标变量2种取值(一般0或1)情况下的占比,纵向相加为1,例如0.7代表两条记录分辨率一致的情况在设备号也是一致情况下的占比为70%,
1.计算分辨率一致情况下的第一woe(证据重要度)值=ln(0.7/0.4)=0.56,第一重要度=0.7-0.4=0.3;
2.计算分辨率不一致情况下的第二woe值=ln(0.3/0.6)=-0.7,第二重要度=0.3-0.6=-0.3
3.分辨率重要度计算(iv)=0.56*0.3+(-0.7)*(-0.3)=0.378;
由此可以加计算出分辨率这一设备信息的重要度为0.378,其他设备信息的重要度计算以此类推。
在本发明中,所述重要度计算模块4还可以对计算出的各设备信息的重要度进行排序,重要度越高代表该变量(即设备信息的变化)对判断因变量(即设备号的变化)影响越大,也即是该设备信息对判断支付设备之间的相似性贡献越大,优选地,所述重要度计算模块4还可以剔除重要度低于第二阈值(可根据实际需要进行设置)的设备信息,即认为这部分设备信息对计算支付设备的相似度的贡献较低。
所述相似度计算模块5用于建立相似度计算模型,并通过所述相似度计算模型以及所述设备信息的重要度计算两个支付设备之间的相似度;具体地,可利用重要度高的变量(即设备信息)进行模型训练,算法可以通过训练后的结果评估选择合适的二分类模型算法,例如逻辑回归、决策树、随机森林等等,模型的结果为通过比对后输出两个支付设备是同一个的概率或可以理解为两个支付设备的相似度。
所述判断模块6则判断计算出的所述两个支付设备之间的相似度是否超过第一阈值,若是,则确认所述两个支付设备相同,此时可给予两个支付设备相同的设备号;若否,则确认所述两个支付设备不同,此时就可以认定当前交易中用户使用的支付设备是新的,并可以将支付设备补充进设备库中。
在本发明的具体应用过程中:
1、第一阈值的确定:利用训练模型的结果确定第一阈值,第一阈值以上认为两个支付设备的相似性较高可以认为是同一设备,第一阈值的设定标准为参考设定完后的准确率与覆盖率。
2、设备库整理:整理已有设备库,对库中的支付设备给予唯一标识。
3、对于实时交易,利用当笔交易的设备信息与设备库中的支付设备进行一一比对,计算与每个支付设备的相似度。
4、从设备库中找出与当笔交易的支付设备最大相似度的支付设备,如果相似度超过第一阈值则判断该支付设备与设备库中的支付设备一致,给予二者相同设备号;如果未超过第一阈值,则认为该笔交易的支付设备为新的,将其补充进设备库中。
5、风控应用:风控场景中,基于支付设备主体的变量(即设备信息)在计算的时候,主体标识均可用设备库中的设备号来代替,不再轻易受单个设备信息更改的影响。
本发明给出一种计算支付设备中各种设备信息(例如MAC地址(硬件地址)、操作系统等)重要度的方法,并且依据重要的设备信息字段,给出一种计算支付设备之间相似度的方式,基于相似度后的阈值设定,在现有设备库中给实时交易的支付设备匹配唯一设备号,取代简单通过采集的设备信息直接来标识设备号的方法,弥补传统方法设备号“易更改”的不足。
本发明通过借鉴机器学习中计算变量重要度的思想运用于计算采集到的各种设备信息的重要度,根据重要度以模型的方式计算实时交易所属设备与现有设备库中支付设备的相似度,超过阈值的赋予相同设备id,未超过阈值的作为现有设备库中的补充id,达到相对于普通根据设备信息直接赋予设备号的方法更具备唯一性的目的,由于采用了模型多变量综合打分的方式,设备号不再受单个设备信息更改的影响,在风控场景中的应用结果为,提高欺诈分子作案的成本,降低盗卡资损。
如图2所示,本发明还提供了一种支付设备相似度的计算方法,其利用上述的支付设备相似度的计算系统实现,包括以下步骤:
步骤101、收集用户在浏览以及支付时采集到的支付设备的所有相关设备信息;
步骤102、设置多台支付设备,并为每台支付设备设置唯一标识,对在所述支付设备上进行的每一次操作均生成一条源数据;
步骤103、对每两条源数据之间均进行比对,并根据比对结果生成模型分析数据;
步骤104、计算每个设备信息的重要度;
步骤105、建立相似度计算模型,并通过所述相似度计算模型以及所述设备信息的重要度计算两个支付设备之间的相似度;
步骤106、判断计算出的所述两个支付设备之间的相似度是否超过第一阈值,若是,则确认所述两个支付设备相同,若否,则确认所述两个支付设备不同。
其中,优选地,在步骤104中还删除重要度小于第二阈值的设备信息。所述设备信息包括操作系统、浏览器语言、分辨率、浏览器类型中的至少一种。所述支付设备包括PC及手机。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (10)

1.一种支付设备相似度的计算方法,其特征在于,包括以下步骤:
S1、收集用户在浏览以及支付时采集到的支付设备的所有相关设备信息;
S2、设置多台支付设备,并为每台支付设备设置唯一标识,对在所述支付设备上进行的每一次操作均生成一条源数据;
S3、对每两条源数据之间均进行比对,并根据比对结果生成模型分析数据;
S4、计算每个设备信息的重要度;
S5、建立相似度计算模型,并通过所述相似度计算模型以及所述设备信息的重要度计算两个支付设备之间的相似度。
2.如权利要求1所述的计算方法,其特征在于,步骤S5之后还包括:
S6、判断计算出的所述两个支付设备之间的相似度是否超过第一阈值,若是,则确认所述两个支付设备相同,若否,则确认所述两个支付设备不同。
3.如权利要求1所述的计算方法,其特征在于,步骤S4中还删除重要度小于第二阈值的设备信息。
4.如权利要求1所述的计算方法,其特征在于,所述设备信息包括操作系统、浏览器语言、分辨率、浏览器类型中的至少一种。
5.如权利要求1所述的计算方法,其特征在于,所述支付设备包括PC及手机。
6.一种支付设备相似度的计算系统,其特征在于,包括:
设备信息收集模块,用于收集用户在浏览以及支付时采集到的支付设备的所有相关设备信息;
源数据生成模块,用于设置多台支付设备,并为每台支付设备设置唯一标识,对在所述支付设备上进行的每一次操作均生成一条源数据;
模型分析数据生成模块,用于对每两条源数据之间均进行比对,并根据比对结果生成模型分析数据;
重要度计算模块,用于计算每个设备信息的重要度;
相似度计算模块,用于建立相似度计算模型,并通过所述相似度计算模型以及所述设备信息的重要度计算两个支付设备之间的相似度。
7.如权利要求6所述的计算系统,其特征在于,所述计算系统还包括:
判断模块,判断计算出的所述两个支付设备之间的相似度是否超过第一阈值,若是,则确认所述两个支付设备相同,若否,则确认所述两个支付设备不同。
8.如权利要求6所述的计算系统,其特征在于,所述重要度计算模块还用于删除重要度小于第二阈值的设备信息。
9.如权利要求6所述的计算系统,其特征在于,所述设备信息包括操作系统、浏览器语言、分辨率、浏览器类型中的至少一种。
10.如权利要求6所述的计算系统,其特征在于,所述支付设备包括PC及手机。
CN201610994178.1A 2016-11-11 2016-11-11 支付设备相似度的计算方法及计算系统 Pending CN106570531A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610994178.1A CN106570531A (zh) 2016-11-11 2016-11-11 支付设备相似度的计算方法及计算系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610994178.1A CN106570531A (zh) 2016-11-11 2016-11-11 支付设备相似度的计算方法及计算系统

Publications (1)

Publication Number Publication Date
CN106570531A true CN106570531A (zh) 2017-04-19

Family

ID=58541726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610994178.1A Pending CN106570531A (zh) 2016-11-11 2016-11-11 支付设备相似度的计算方法及计算系统

Country Status (1)

Country Link
CN (1) CN106570531A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348421A (zh) * 2019-08-08 2021-02-09 北京国双科技有限公司 一种数据处理方法及装置
CN113921016A (zh) * 2021-10-15 2022-01-11 阿波罗智联(北京)科技有限公司 语音处理方法、装置、电子设备以及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103166917A (zh) * 2011-12-12 2013-06-19 阿里巴巴集团控股有限公司 网络设备身份识别方法及系统
US9317954B2 (en) * 2013-09-23 2016-04-19 Lucasfilm Entertainment Company Ltd. Real-time performance capture with on-the-fly correctives
CN105989149A (zh) * 2015-03-02 2016-10-05 苏宁云商集团股份有限公司 一种用户设备指纹的提取和识别方法及系统
CN106033510A (zh) * 2015-03-13 2016-10-19 阿里巴巴集团控股有限公司 一种用户设备识别方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103166917A (zh) * 2011-12-12 2013-06-19 阿里巴巴集团控股有限公司 网络设备身份识别方法及系统
US9317954B2 (en) * 2013-09-23 2016-04-19 Lucasfilm Entertainment Company Ltd. Real-time performance capture with on-the-fly correctives
CN105989149A (zh) * 2015-03-02 2016-10-05 苏宁云商集团股份有限公司 一种用户设备指纹的提取和识别方法及系统
CN106033510A (zh) * 2015-03-13 2016-10-19 阿里巴巴集团控股有限公司 一种用户设备识别方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
曹林等: "《建设用地节约集约利用评价和潜力测算的理论与方法研究》", 31 August 2015, 南开大学出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348421A (zh) * 2019-08-08 2021-02-09 北京国双科技有限公司 一种数据处理方法及装置
CN113921016A (zh) * 2021-10-15 2022-01-11 阿波罗智联(北京)科技有限公司 语音处理方法、装置、电子设备以及存储介质

Similar Documents

Publication Publication Date Title
CN109829776B (zh) 商户风险评估方法、装置、计算机设备和存储介质
CN109409896B (zh) 银行欺诈识别模型训练方法、银行欺诈识别方法和装置
CN110689438A (zh) 企业类金融风险评分方法、装置、计算机设备及存储介质
CN106530078A (zh) 基于跨行业数据的贷款风险预警方法及系统
CN109670936A (zh) 贷款审批处理方法、平台、设备及计算机可读存储介质
CN107437223A (zh) 贷款信息审核方法、装置及设备
CN106651570A (zh) 一种贷款实时审批系统和方法
CN108230151A (zh) 一种可疑交易监测方法、装置、设备及存储介质
CN111523996A (zh) 一种审批方法及系统
CN106600423A (zh) 基于机器学习的车险数据处理方法、车险欺诈识别方法及装置
CN108053310A (zh) 信用风险评分方法、装置、计算机设备及存储介质
CN106875078A (zh) 交易风险检测方法、装置及设备
CN106296389A (zh) 一种用户信用度的评估方法及装置
CN106067088A (zh) 电子银行访问行为的检测方法和装置
CN109377339B (zh) 一种可疑交易案例的辅助甄别方法及系统
CN108363717B (zh) 一种数据安全级别的识别检测方法及装置
CN102163310A (zh) 一种基于用户信用度等级的信息推送方法和装置
CN106779278A (zh) 资产信息的评价系统及其信息的处理方法和装置
CN109509087A (zh) 智能化的贷款审核方法、装置、设备及介质
CN109325845A (zh) 一种金融产品智能推荐方法及系统
CN106971344A (zh) 保额控制方法和系统
CN106529960A (zh) 电子交易中的欺诈交易检测方法
CN111557011A (zh) 企业破产预测系统及其运行方法
CN107767275A (zh) 保险资源需求分析方法和装置
CN109840778A (zh) 欺诈用户的识别方法及装置、可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170419