CN110609829B - 交易数据的清洗还原方法及系统 - Google Patents

交易数据的清洗还原方法及系统 Download PDF

Info

Publication number
CN110609829B
CN110609829B CN201910751416.XA CN201910751416A CN110609829B CN 110609829 B CN110609829 B CN 110609829B CN 201910751416 A CN201910751416 A CN 201910751416A CN 110609829 B CN110609829 B CN 110609829B
Authority
CN
China
Prior art keywords
mode
user
transaction data
payment
repayment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910751416.XA
Other languages
English (en)
Other versions
CN110609829A (zh
Inventor
张晨
黄向前
赵音龙
林三吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Xinyan Artificial Intelligence Technology Co ltd
Original Assignee
Shanghai Xinyan Artificial Intelligence Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Xinyan Artificial Intelligence Technology Co ltd filed Critical Shanghai Xinyan Artificial Intelligence Technology Co ltd
Priority to CN201910751416.XA priority Critical patent/CN110609829B/zh
Publication of CN110609829A publication Critical patent/CN110609829A/zh
Application granted granted Critical
Publication of CN110609829B publication Critical patent/CN110609829B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Abstract

本发明一种交易数据的清洗还原方法及系统,包括:授权处理用户的原始交易数据和对应的用户信息参数,用户信息参数包括产品的利率、周期、额度、逾期方式、逾期利率、还款方式和扣款方式;从原始交易数据中提取出用户的有效交易数据,每笔有效交易数据包括扣款状态、扣款时间和扣款金额;对用户的有效交易数据进行数据去重操作;根据用户的扣款方式选择用户的清洗模型,扣款方式为主动还款方式对应主动还款清洗模型,扣款方式为被动还款方式对应被动还款清洗模型;将产品的逾期方式和逾期利率输入至选出的清洗模型中,以将同笔逾期订单合并;将产品的周期、额度和还款方式输入至选出的清洗模型中,以将同笔订单合并;还原出用户的初始账单。

Description

交易数据的清洗还原方法及系统
技术领域
本发明涉及数据清洗和数据还原技术领域,特别是涉及一种交易数据的清洗还原方法及系统,应用于互联网金融及征信机构。
背景技术
通过查询资料,目前市面上并没有针对如此大量的交易数据来进行用户账单还原的方法。
发明内容
本发明针对现有技术存在的问题和不足,提供一种交易数据的清洗还原方法及系统。
本发明是通过下述技术方案来解决上述技术问题的:
本发明提供一种交易数据的清洗还原方法,其特点在于,其包括以下步骤:
S1、授权处理用户的原始交易数据和对应的用户信息参数,用户信息参数包括产品的利率、周期、额度、逾期方式、逾期利率、还款方式和扣款方式,扣款方式包括主动还款方式和被动还款方式,还款方式包括一次性还款和分期还款;
S2、从原始交易数据中提取出用户的有效交易数据,每笔有效交易数据包括扣款状态、扣款时间和扣款金额;
S3、对用户的有效交易数据进行数据去重操作;
S4、根据用户的扣款方式选择用户的清洗模型,扣款方式为主动还款方式对应主动还款清洗模型,扣款方式为被动还款方式对应被动还款清洗模型;
S5、将产品的逾期方式和逾期利率输入至选出的清洗模型中,以将同笔逾期订单合并;
S6、将产品的周期、额度和还款方式输入至选出的清洗模型中,以将同笔订单合并;
S7、还原出用户的初始账单。
较佳地,在步骤S3中,数据去重操作包括对有效交易数据中扣款时间为同一天、扣款金额为相同及扣款状态为失败的多笔数据仅保留其中一笔数据。
本发明还提供一种交易数据的清洗还原系统,其特点在于,其包括获取模块、提取模块、去重模块、选择模块、清洗模块和还原模块;
所述获取模块用于授权处理用户的原始交易数据和对应的用户信息参数,用户信息参数包括产品的利率、周期、额度、逾期方式、逾期利率、还款方式和扣款方式,扣款方式包括主动还款方式和被动还款方式,还款方式包括一次性还款和分期还款;
所述提取模块用于从原始交易数据中提取出用户的有效交易数据,每笔有效交易数据包括扣款状态、扣款时间和扣款金额;
所述去重模块用于对用户的有效交易数据进行数据去重操作;
所述选择模块用于根据用户的扣款方式选择用户的清洗模型,扣款方式为主动还款方式对应主动还款清洗模型,扣款方式为被动还款方式对应被动还款清洗模型;
所述清洗模块用于将产品的逾期方式和逾期利率输入至选出的清洗模型中,以将同笔逾期订单合并,将产品的周期、额度和还款方式输入至选出的清洗模型中,以将同笔订单合并;
所述还原模块用于还原出用户的初始账单。
较佳地,数据去重操作包括对有效交易数据中扣款时间为同一天、扣款金额为相同及扣款状态为失败的多笔数据仅保留其中一笔数据。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明的积极进步效果在于:
本发明根据借贷用户的交易数据,对其进行特征提取,得到多个关键维度;利用预先了解的商户信息和清洗模型对交易数据进行清洗和还原,得到以用户,商户为维度的一笔借款交易账单。通过输入原始的交易数据和对应的商户信息参数可以选择不同的清洗模型,来还原该用户在某商户下的一笔初始交易订单。只需通过商户信息来确定参数,就可以利用通用模型进行批量清洗还原出借款用户的初始交易订单信息,从而利用用户的借款信息来分析该用户的行为、偏好等特征。
附图说明
图1为本发明较佳实施例的交易数据的清洗还原方法的流程图。
图2为本发明较佳实施例的交易数据的清洗还原系统的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本实施例提供一种交易数据的清洗还原方法,其包括以下步骤:
步骤101、授权处理用户的原始交易数据和对应的用户信息参数,用户信息参数包括产品的利率、周期、额度、逾期方式、逾期利率、还款方式和扣款方式,扣款方式包括主动还款方式和被动还款方式,还款方式包括一次性还款和分期还款。
步骤102、从原始交易数据中提取出用户的有效交易数据,每笔有效交易数据包括扣款状态、扣款时间和扣款金额。
步骤103、对用户的有效交易数据进行数据去重操作。
在步骤103中,数据去重操作包括对有效交易数据中扣款时间为同一天、扣款金额为相同及扣款状态为失败的多笔数据仅保留其中一笔数据。
步骤104、根据用户的扣款方式选择用户的清洗模型,扣款方式为主动还款方式对应主动还款清洗模型,扣款方式为被动还款方式对应被动还款清洗模型。
步骤105、将产品的逾期方式和逾期利率输入至选出的清洗模型中,以将同笔逾期订单合并。
步骤106、将产品的周期、额度和还款方式输入至选出的清洗模型中,以将同笔订单合并。
步骤107、还原出用户的初始账单。
如图2所示,本实施例还提供一种交易数据的清洗还原系统,其包括获取模块1、提取模块2、去重模块3、选择模块4、清洗模块5和还原模块6。
所述获取模块1用于授权处理用户的原始交易数据和对应的用户信息参数,用户信息参数包括;产品的利率、周期、额度、逾期方式、逾期利率、还款方式和扣款方式,扣款方式包括主动还款方式和被动还款方式,还款方式包括一次性还款和分期还款。
所述提取模块2用于从原始交易数据中提取出用户的有效交易数据,每笔有效交易数据包括扣款状态、扣款时间和扣款金额。
所述去重模块3用于对用户的有效交易数据进行数据去重操作。
其中,数据去重操作包括对有效交易数据中扣款时间为同一天、扣款金额为相同及扣款状态为失败的多笔数据仅保留其中一笔数据。
所述选择模块4用于根据用户的扣款方式选择用户的清洗模型,扣款方式为主动还款方式对应主动还款清洗模型,扣款方式为被动还款方式对应被动还款清洗模型。
所述清洗模块5用于将产品的逾期方式和逾期利率输入至选出的清洗模型中,以将同笔逾期订单合并,将产品的周期、额度和还款方式输入至选出的清洗模型中,以将同笔订单合并。
所述还原模块6用于还原出用户的初始账单。
通过对商户信息进行汇总,根据商户的扣款方式为主动还款和被动还款主要分为两大类清洗模型,在每种扣款方式中,根据产品逾期规则衍生出10种逾期判定方式,从而精准还原该用户逾期订单。再根据产品每期还款方式以及产品额度周期,将用户的同一笔订单进行合并,准确的还原出用户的一整笔订单交易。
本发明创新性的建立了一种清洗模型,只要将商户信息,用户数据输入,便可快速还原成该用户的初始账单,来进行用户的行为进行分析。
本发明创新性的将用户的账单信息还原,并衍生出借款时间,产品周期,借款金额等多种维度,便于分析该用户的借款偏好。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (2)

1.一种交易数据的清洗还原方法,其特征在于,其包括以下步骤:
S1、授权处理用户的原始交易数据和对应的用户信息参数,用户信息参数包括产品的利率、周期、额度、逾期方式、逾期利率、还款方式和扣款方式,扣款方式包括主动还款方式和被动还款方式,还款方式包括一次性还款和分期还款;
S2、从原始交易数据中提取出用户的有效交易数据,每笔有效交易数据包括扣款状态、扣款时间和扣款金额;
S3、对用户的有效交易数据进行数据去重操作;数据去重操作包括对有效交易数据中扣款时间为同一天、扣款金额为相同及扣款状态为失败的多笔数据仅保留其中一笔数据;
S4、根据用户的扣款方式选择用户的清洗模型,扣款方式为主动还款方式对应主动还款清洗模型,扣款方式为被动还款方式对应被动还款清洗模型;
S5、将产品的逾期方式和逾期利率输入至选出的清洗模型中,以将同笔逾期订单合并;
S6、将产品的周期、额度和还款方式输入至选出的清洗模型中,以将同笔订单合并;
S7、还原出用户的初始账单。
2.一种交易数据的清洗还原系统,其特征在于,其包括获取模块、提取模块、去重模块、选择模块、清洗模块和还原模块;
所述获取模块用于授权处理用户的原始交易数据和对应的用户信息参数,用户信息参数包括产品的利率、周期、额度、逾期方式、逾期利率、还款方式和扣款方式,扣款方式包括主动还款方式和被动还款方式,还款方式包括一次性还款和分期还款;
所述提取模块用于从原始交易数据中提取出用户的有效交易数据,每笔有效交易数据包括扣款状态、扣款时间和扣款金额;
所述去重模块用于对用户的有效交易数据进行数据去重操作;数据去重操作包括对有效交易数据中扣款时间为同一天、扣款金额为相同及扣款状态为失败的多笔数据仅保留其中一笔数据;
所述选择模块用于根据用户的扣款方式选择用户的清洗模型,扣款方式为主动还款方式对应主动还款清洗模型,扣款方式为被动还款方式对应被动还款清洗模型;
所述清洗模块用于将产品的逾期方式和逾期利率输入至选出的清洗模型中,以将同笔逾期订单合并,将产品的周期、额度和还款方式输入至选出的清洗模型中,以将同笔订单合并;
所述还原模块用于还原出用户的初始账单。
CN201910751416.XA 2019-08-15 2019-08-15 交易数据的清洗还原方法及系统 Active CN110609829B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910751416.XA CN110609829B (zh) 2019-08-15 2019-08-15 交易数据的清洗还原方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910751416.XA CN110609829B (zh) 2019-08-15 2019-08-15 交易数据的清洗还原方法及系统

Publications (2)

Publication Number Publication Date
CN110609829A CN110609829A (zh) 2019-12-24
CN110609829B true CN110609829B (zh) 2023-11-14

Family

ID=68890353

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910751416.XA Active CN110609829B (zh) 2019-08-15 2019-08-15 交易数据的清洗还原方法及系统

Country Status (1)

Country Link
CN (1) CN110609829B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017166363A1 (zh) * 2016-03-31 2017-10-05 宇龙计算机通信科技(深圳)有限公司 基于信贷付款方式的付款方法、付款装置和终端
CN109636589A (zh) * 2018-12-20 2019-04-16 安徽经邦软件技术有限公司 一种大数据交叉验证还原功能系统
CN109670938A (zh) * 2018-10-10 2019-04-23 苏宁消费金融有限公司 征信数据合并上报的方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017166363A1 (zh) * 2016-03-31 2017-10-05 宇龙计算机通信科技(深圳)有限公司 基于信贷付款方式的付款方法、付款装置和终端
CN109670938A (zh) * 2018-10-10 2019-04-23 苏宁消费金融有限公司 征信数据合并上报的方法和系统
CN109636589A (zh) * 2018-12-20 2019-04-16 安徽经邦软件技术有限公司 一种大数据交叉验证还原功能系统

Also Published As

Publication number Publication date
CN110609829A (zh) 2019-12-24

Similar Documents

Publication Publication Date Title
CN102411583B (zh) 一种文本匹配方法及装置
US20200134629A1 (en) False positive reduction in abnormality detection system models
US20150220937A1 (en) Systems and methods for appending payment network data to non-payment network transaction based datasets through inferred match modeling
CN105893526A (zh) 多源数据融合系统和方法
US20150161623A1 (en) Generating customer profiles using temporal behavior maps
US20150220945A1 (en) Systems and methods for developing joint predictive scores between non-payment system merchants and payment systems through inferred match modeling system and methods
CN110895758B (zh) 存在作弊交易的信用卡账户的筛选方法、装置及系统
CN109598604B (zh) 日切判断方法及装置
US20190295089A1 (en) Transaction fraud detection based on entity linking
EP2816524A1 (en) Future credit score projection
US20120072334A1 (en) Responsibility analytics
CN101661491A (zh) 数据仓库中宽表的更新方法和更新系统
CN111861605A (zh) 业务对象推荐方法
US20160125337A1 (en) Transaction derived in-business probability modeling apparatus and method
CN110688433B (zh) 一种基于路径的特征生成方法及装置
Sivashankari et al. Production inventory model for two levels production with defective items and incorporating multi-delivery policy
CN111612585A (zh) 一种虚拟资源的发放方法及装置
US10262358B2 (en) Merchant continuity correction using cardholder loyalty information
CN107679862B (zh) 一种欺诈交易模型的特征值确定方法及装置
CN110609829B (zh) 交易数据的清洗还原方法及系统
TWI626609B (zh) Production method and system for personal product and expense purchase combination
US20160117689A1 (en) Process and apparatus for assigning a match confidence metric for inferred match modeling
CN112035681B (zh) 基于知识图谱的信用卡费率信息确定方法及装置
US7571171B1 (en) Smart trigger for use in processing business transactions
CN112862493B (zh) 一种智能庞氏骗局检测方法、装置、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant