CN113538057A - 一种纸质票据转化方法、装置、设备及可读存储介质 - Google Patents

一种纸质票据转化方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN113538057A
CN113538057A CN202110833534.2A CN202110833534A CN113538057A CN 113538057 A CN113538057 A CN 113538057A CN 202110833534 A CN202110833534 A CN 202110833534A CN 113538057 A CN113538057 A CN 113538057A
Authority
CN
China
Prior art keywords
drawer
paper
client
information
name information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110833534.2A
Other languages
English (en)
Other versions
CN113538057B (zh
Inventor
安文娟
马宁
臧进进
吕志斌
祝国浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Citic Bank Corp Ltd
Original Assignee
China Citic Bank Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Citic Bank Corp Ltd filed Critical China Citic Bank Corp Ltd
Priority to CN202110833534.2A priority Critical patent/CN113538057B/zh
Publication of CN113538057A publication Critical patent/CN113538057A/zh
Application granted granted Critical
Publication of CN113538057B publication Critical patent/CN113538057B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种纸质票据转化方法、装置、设备及可读存储介质,所述方法包括:获取目标时间范围内客户办理过的银行承兑汇票业务数据;为具有所述完整的出票人名称信息的每一个出票人生成对应的编号;为具有所述出票人编号的每个出票人构建特征数据;根据具有所述出票人编号的每个出票人所对应的结算方式信息,将具有所述出票人编号的出票人进行分类,得到多个客户类型;根据所述不同类型的客户所对应的特征数据,计算所述纸电混用未转化客户和所述仅纸质客户转为电子客户的概率值;根据所述概率值,生成客户转化名单。本发明为一种较为可靠的纸质银行承兑汇票向电子银行承兑汇票转化的方法,可以规避纸质银行承兑汇票的高风险性。

Description

一种纸质票据转化方法、装置、设备及可读存储介质
技术领域
本发明涉及金融技术领域,具体而言,涉及一种纸质票据转化方法、装置、设备及可读存储介质。
背景技术
电子银行承兑汇票相较纸质银行承兑汇票在流传、提效、节约成本、集约化管理以及风险防控等诸多方面均具备较大优势,电子银行承兑汇票最终取代纸质票据是资本和金融市场发展的规律,所以目前央行正大力推广电子银行承兑汇票。但受制于业务所需,近些年各大商业银行仍在继续签发纸质银行承兑汇票,找到一种方法加速转化从而抢占市场先机,这必将是未来商业银行业务争夺的重点之一。
目前,关于纸质银行承兑汇票转为电子银行承汇票的研究不多,而且绝大多数均是仅从形式上研究如何对现有纸质票据进行电子化处理,并未从本质上彻底改变其结算方式。
发明内容
本发明的目的在于提供一种纸质票据转化方法、装置、设备及可读存储介质,以改善上述问题。
为了实现上述目的,本申请实施例提供了如下技术方案:
一方面,本申请实施例提供了一种纸质票据转化方法,所述方法包括:
获取目标时间范围内客户办理过的银行承兑汇票业务数据,所述银行承兑汇票业务数据包括每个出票人名称信息和每个出票人的结算方式信息;
对所述每个出票人名称信息进行预处理,得到完整的出票人名称信息,为具有所述完整的出票人名称信息的每一个出票人生成对应的编号,得到不同的出票人编号;
为具有所述出票人编号的每个出票人构建特征数据,所述特征数据包括每个出票人的票据数量、累计票面金额、基本信息、交易信息、资产持有情况信息和客户标签信息;
根据具有所述出票人编号的每个出票人所对应的结算方式信息,将具有所述出票人编号的出票人进行分类,得到多个客户类型,所述多个客户类型包括仅纸质客户、仅电子客户、纸电混用已转化客户、纸电混用未转化客户;
根据所述不同类型的客户所对应的特征数据,计算所述纸电混用未转化客户和所述仅纸质客户转为电子客户的概率值;
根据所述概率值,生成客户转化名单,以指示相关工作人员按照所述客户转化名单进行转化推广。
可选的,所述对所述每个出票人名称信息进行预处理,得到完整的出票人名称信息,为具有所述完整的出票人名称信息的每一个出票人生成对应的编号,得到不同的出票人编号,包括:
检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息不存在空值且不存在异常,则将此出票人名称信息定义为完整的出票人名称信息;
检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息存在空值或者存在异常且异常无法修复,则将此出票人名称信息剔除;
检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息存在空值或者存在异常,但异常可修复,则进行修复,将修复之后的出票人名称信息也定义为完整的出票人名称信息。
可选的,所述为具有所述出票人编号的每个出票人构建特征数据,所述特征数据包括每个出票人的票据数量、累计票面金额、基本信息、交易信息、资产持有情况信息和客户标签信息,包括:
以所述出票人编号为统计粒度,计算每个出票人的票据数量和累计票面金额;
根据所述出票人编号,获取所述出票人编号所对应的出票人的基本信息、交易信息、资产持有情况信息、客户标签信息;
将所述每个出票人的票据数量、累计票面金额、基本信息、交易信息、资产持有情况信息和客户标签信息定义为特征,将每个出票人的特征组合在一起,构建出具有所述出票人编号的每个出票人所对应的特征数据。
可选的,所述根据所述不同类型的客户所对应的特征数据,计算所述纸电混用未转化客户和所述仅纸质客户转为电子客户的概率值,包括:
将所述仅纸质客户和所述纸电混用已转化客户所对应的特征数据作为样本集,将其按照7:3的比例分训练集和测试集;
对所述样本集进行归一化处理,处理后采用XGBoost模型进行训练和测试,得到训练好的第一模型;
将所述纸电混用未转化客户所对应的特征数据作为预测集,利用所述训练好的第一模型预测所述纸电混用未转化客户转为电子客户的概率值。
可选的,所述所述根据所述不同类型的客户所对应的特征数据,计算所述纸电混用未转化客户和所述仅纸质客户转为电子客户的概率值,包括:
将所述仅纸质客户和所述仅电子客户所对应的特征数据作为样本集,采用SMOTE算法构造平衡数据集;
对所述平衡数据集进行归一化处理,处理后利用XGBoost模型对其进行特征重要性分析,得到重要特征;
将所述仅电子客户的所述重要特征所对应的数据作为样本集,将其按照7:3的比例分训练集和测试集,采用one class SVM模型进行训练与测试,得到训练好的第二模型;
将所述仅纸质客户所对应的特征数据作为预测集,利用所述训练后的第二模型预测仅纸质客户转为电子客户的概率值。
可选的,所述根据所述概率值,生成客户转化名单,以指示相关工作人员按照所述客户转化名单进行转化推广,包括:
获取所述概率值所对应的等级分类表,所述等级分类表中不同的等级对应不同的概率值范围;
根据所述等级分类表,将所述概率值进行等级匹配,得到等级匹配结果;
根据所述等级匹配结果,生成转化名单至相关业务部门或者下发至相应分行,以指示相关工作人员按照所述等级匹配结果进行推广。
第二方面,本申请实施例提供了一种纸质票据转化装置,所述装置包括:获取模块、预处理模块、构建模块、分类模块、计算模块和生成模块。
所述获取模块,用于获取目标时间范围内客户办理过的银行承兑汇票业务数据,所述银行承兑汇票业务数据包括每个出票人名称信息和每个出票人的结算方式信息;
所述预处理模块,用于对所述每个出票人名称信息进行预处理,得到完整的出票人名称信息,为具有所述完整的出票人名称信息的每一个出票人生成对应的编号,得到不同的出票人编号;
所述构建模块,用于为具有所述出票人编号的每个出票人构建特征数据,所述特征数据包括每个出票人的票据数量、累计票面金额、基本信息、交易信息、资产持有情况信息和客户标签信息;
所述分类模块,用于根据具有所述出票人编号的每个出票人所对应的结算方式信息,将具有所述出票人编号的出票人进行分类,得到多个客户类型,所述多个客户类型包括仅纸质客户、仅电子客户、纸电混用已转化客户、纸电混用未转化客户;
所述计算模块,用于根据所述不同类型的客户所对应的特征数据,计算所述纸电混用未转化客户和所述仅纸质客户转为电子客户的概率值;
所述生成模块,用于根据所述概率值,生成客户转化名单,以指示相关工作人员按照所述客户转化名单进行转化推广。
可选的,所述预处理模块,包括:
第一检查单元,用于检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息不存在空值且不存在异常,则将此出票人名称信息定义为完整的出票人名称信息;
第二检查单元,用于检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息存在空值或者存在异常且异常无法修复,则将此出票人名称信息剔除;
第三检查单元,用于检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息存在空值或者存在异常,但异常可修复,则进行修复,将修复之后的出票人名称信息也定义为完整的出票人名称信息。
可选的,所述构建模块,包括:
第一计算单元,用于以所述出票人编号为统计粒度,计算每个出票人的票据数量和累计票面金额;
第一获取单元,用于根据所述出票人编号,获取所述出票人编号所对应的出票人的基本信息、交易信息、资产持有情况信息、客户标签信息;
构建单元,用于将所述每个出票人的票据数量、累计票面金额、基本信息、交易信息、资产持有情况信息和客户标签信息定义为特征,将每个出票人的特征组合在一起,构建出具有所述出票人编号的每个出票人所对应的特征数据。
可选的,所述计算模块,包括:
划分单元,用于将所述仅纸质客户和所述纸电混用已转化客户所对应的特征数据作为样本集,将其按照7:3的比例分训练集和测试集;
第一处理单元,用于对所述样本集进行归一化处理,处理后采用XGBoost模型进行训练和测试,得到训练好的第一模型;
第一预测单元,用于将所述纸电混用未转化客户所对应的特征数据作为预测集,利用所述训练好的第一模型预测所述纸电混用未转化客户转为电子客户的概率值。
可选的,所述计算模块,包括:
构造单元,用于将所述仅纸质客户和所述仅电子客户所对应的特征数据作为样本集,采用SMOTE算法构造平衡数据集;
第二处理单元,用于对所述平衡数据集进行归一化处理,处理后利用XGBoost模型对其进行特征重要性分析,得到重要特征;
训练单元,用于将所述仅电子客户的所述重要特征所对应的数据作为样本集,将其按照7:3的比例分训练集和测试集,采用one class SVM模型进行训练与测试,得到训练好的第二模型;
第二预测单元,用于将所述仅纸质客户所对应的特征数据作为预测集,利用所述训练后的第二模型预测仅纸质客户转为电子客户的概率值。
可选的,所述生成模块,包括:
第二获取单元,用于获取所述概率值所对应的等级分类表,所述等级分类表中不同的等级对应不同的概率值范围;
匹配单元,用于根据所述等级分类表,将所述概率值进行等级匹配,得到等级匹配结果;
生成单元,用于根据所述等级匹配结果,生成转化名单至相关业务部门或者下发至相应分行,以指示相关工作人员按照所述等级匹配结果进行推广。
第三方面,本申请实施例提供了一种纸质票据转化设备,所述设备包括存储器和处理器。存储器用于存储计算机程序;处理器用于执行所述计算机程序时实现上述纸质票据转化方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述纸质票据转化方法的步骤。
本发明的有益效果为:
1、本发明为一种较为可靠的纸质银行承兑汇票向电子银行承兑汇票转化的方法,可以规避纸质银行承兑汇票的高风险性。
2、本发明主要是基于行内承兑汇票客户数据,构建客户特征数据,并根据客户结算方式的不同对客户进行分类。针对“仅纸质”和“纸电混用未转化”两种情况,分别提出两种转化方案,以实现纸质向电子的逐步过渡。
3、本发明针对“纸电混用未转化”及“仅纸质”两种情况进行电子转化,通过预测结果可以知道哪些客户易于转化,实践效果较为明显,可供业务部门进行针对性地营销推广,具备较高的实用价值。
本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明实施例中所述的一种纸质票据转化方法流程示意图;
图2是本发明实施例中所述的一种纸质票据转化装置结构示意图;
图3是本发明实施例中所述的一种纸质票据转化设备结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号或字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例1
如图1所示,本实施例提供了一种纸质票据转化方法,该方法包括步骤S1、步骤S2、步骤S3、步骤S4和步骤S5。
步骤S1、获取目标时间范围内客户办理过的银行承兑汇票业务数据,所述银行承兑汇票业务数据包括每个出票人名称信息和每个出票人的结算方式信息;
步骤S2、对所述每个出票人名称信息进行预处理,得到完整的出票人名称信息,为具有所述完整的出票人名称信息的每一个出票人生成对应的编号,得到不同的出票人编号;
步骤S3、为具有所述出票人编号的每个出票人构建特征数据,所述特征数据包括每个出票人的票据数量、累计票面金额、基本信息、交易信息、资产持有情况信息和客户标签信息;
步骤S4、根据具有所述出票人编号的每个出票人所对应的结算方式信息,将具有所述出票人编号的出票人进行分类,得到多个客户类型,所述多个客户类型包括仅纸质客户、仅电子客户、纸电混用已转化客户、纸电混用未转化客户;
步骤S5、根据所述不同类型的客户所对应的特征数据,计算所述纸电混用未转化客户和所述仅纸质客户转为电子客户的概率值;
步骤S6、根据所述概率值,生成客户转化名单,以指示相关工作人员按照所述客户转化名单进行转化推广。
本实施例中,“仅纸质客户”是指仅使用过纸质银行承兑汇票的客户;“仅电子客户”是指仅使用过电子银行承兑汇票的客户;“纸电混用已转化客户”是指客户之前使用纸质银行承兑汇票,后来改用电子银行承兑汇票;“纸电混用未转化客户”是指两种方式交叉使用的客户。
本实施有效地提出了纸质银行承兑汇票转为电子银行承兑汇票的转化方式,可为下一步推广方案实施提供数据支撑,进而规避纸质银行承兑汇票的高风险性。
在本公开的一种具体实施方式中,所述步骤S2,还可以包括步骤S21、步骤S22和步骤S23。
步骤S21、检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息不存在空值且不存在异常,则将此出票人名称信息定义为完整的出票人名称信息;
步骤S22、检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息存在空值或者存在异常且异常无法修复,则将此出票人名称信息剔除;
步骤S23、检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息存在空值或者存在异常,但异常可修复,则进行修复,将修复之后的出票人名称信息也定义为完整的出票人名称信息。
在本公开的一种具体实施方式中,所述步骤S3,还可以包括步骤S31、步骤S32和步骤S334。
步骤S31、以所述出票人编号为统计粒度,计算每个出票人的票据数量和累计票面金额;
步骤S32、根据所述出票人编号,获取所述出票人编号所对应的出票人的基本信息、交易信息、资产持有情况信息、客户标签信息;
步骤S33、将所述每个出票人的票据数量、累计票面金额、基本信息、交易信息、资产持有情况信息和客户标签信息定义为特征,将每个出票人的特征组合在一起,构建出具有所述出票人编号的每个出票人所对应的特征数据。
在本实施例中,通过构建客户多维度的特征数据,可以提高预测的准确性。
在本公开的一种具体实施方式中,所述步骤S5,还可以包括步骤S51、步骤S52和步骤S53。
步骤S51、将所述仅纸质客户和所述纸电混用已转化客户所对应的特征数据作为样本集,将其按照7:3的比例分训练集和测试集;
步骤S52、对所述样本集进行归一化处理,处理后采用XGBoost模型进行训练和测试,得到训练好的第一模型;
步骤S53、将所述纸电混用未转化客户所对应的特征数据作为预测集,利用所述训练好的第一模型预测所述纸电混用未转化客户转为电子客户的概率值。
在本公开的一种具体实施方式中,所述步骤S5,还可以包括步骤S54、步骤S55、步骤S56和步骤S57。
步骤S54、将所述仅纸质客户和所述仅电子客户所对应的特征数据作为样本集,采用SMOTE算法构造平衡数据集;
步骤S55、对所述平衡数据集进行归一化处理,处理后利用XGBoost模型对其进行特征重要性分析,得到重要特征;
步骤S56、将所述仅电子客户的所述重要特征所对应的数据作为样本集,将其按照7:3的比例分训练集和测试集,采用one class SVM模型进行训练与测试,得到训练好的第二模型;
步骤S57、将所述仅纸质客户所对应的特征数据作为预测集,利用所述训练后的第二模型预测仅纸质客户转为电子客户的概率值。
在本公开的一种具体实施方式中,所述步骤S6,还可以包括步骤S61、步骤S62和步骤S63。
步骤S61、获取所述概率值所对应的等级分类表,所述等级分类表中不同的等级对应不同的概率值范围;
步骤S62、根据所述等级分类表,将所述概率值进行等级匹配,得到等级匹配结果;
步骤S63、根据所述等级匹配结果,生成转化名单至相关业务部门或者下发至相应分行,以指示相关工作人员按照所述等级匹配结果进行推广。
本实施例中,所述概率值所对应的等级分类表具体为:概率值为0.9-1则为定义为转化易等级;概率值为0.8-0.9,则定义为转化偏易等级;概率值为0.5-0.7,则定义为转化适中等级;概率值为0.2-0.4,则定义为转化偏难等级;概率值为0.1,则定义为转化难等级。
根据上述预测结果,提供转化名单至相关业务部门或者下发至相应分行,按照转化难易程度进行推广,以实现纸质向电子银行承兑汇票的逐步过渡。
实施例2
如图2所示,本实施例提供了一种纸质票据转化方法装置,所述装置包括:获取模块701、预处理模块702、构建模块703、分类模块704、计算模块705和生成模块706。
所述获取模块701,用于获取目标时间范围内客户办理过的银行承兑汇票业务数据,所述银行承兑汇票业务数据包括每个出票人名称信息和每个出票人的结算方式信息;
所述预处理模块702,用于对所述每个出票人名称信息进行预处理,得到完整的出票人名称信息,为具有所述完整的出票人名称信息的每一个出票人生成对应的编号,得到不同的出票人编号;
所述构建模块703,用于为具有所述出票人编号的每个出票人构建特征数据,所述特征数据包括每个出票人的票据数量、累计票面金额、基本信息、交易信息、资产持有情况信息和客户标签信息;
所述分类模块704,用于根据具有所述出票人编号的每个出票人所对应的结算方式信息,将具有所述出票人编号的出票人进行分类,得到多个客户类型,所述多个客户类型包括仅纸质客户、仅电子客户、纸电混用已转化客户、纸电混用未转化客户;
所述计算模块705,用于根据所述不同类型的客户所对应的特征数据,计算所述纸电混用未转化客户和所述仅纸质客户转为电子客户的概率值;
所述生成模块706,用于根据所述概率值,生成客户转化名单,以指示相关工作人员按照所述客户转化名单进行转化推广。
本实施例针对“纸电混用未转化”及“仅纸质”两种情况进行电子转化,通过预测结果可以知道哪些客户易于转化,实践效果较为明显,可供业务部门进行针对性地营销推广,具备较高的实用价值。
在本公开的一种具体实施方式中,所述预处理模块702包括第一检查单元7021、第二检查单元7022和第三检查单元7023。
所述第一检查单元7021,用于检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息不存在空值且不存在异常,则将此出票人名称信息定义为完整的出票人名称信息;
所述第二检查单元7022,用于检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息存在空值或者存在异常且异常无法修复,则将此出票人名称信息剔除;
所述第三检查单元7023,用于检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息存在空值或者存在异常,但异常可修复,则进行修复,将修复之后的出票人名称信息也定义为完整的出票人名称信息。
在本公开的一种具体实施方式中,所述构建模块703包括第一计算单元7031、第一获取单元7032和构建单元7033。
所述第一计算单元7031,用于以所述出票人编号为统计粒度,计算每个出票人的票据数量和累计票面金额;
所述第一获取单元7032,用于根据所述出票人编号,获取所述出票人编号所对应的出票人的基本信息、交易信息、资产持有情况信息、客户标签信息;
所述构建单元7033,用于将所述每个出票人的票据数量、累计票面金额、基本信息、交易信息、资产持有情况信息和客户标签信息定义为特征,将每个出票人的特征组合在一起,构建出具有所述出票人编号的每个出票人所对应的特征数据。
在本公开的一种具体实施方式中,所述计算模块705包括划分单元7051、第一处理单元7052和第一预测单元7053。
所述划分单元7051,用于将所述仅纸质客户和所述纸电混用已转化客户所对应的特征数据作为样本集,将其按照7:3的比例分训练集和测试集;
所述第一处理单元7052,用于对所述样本集进行归一化处理,处理后采用XGBoost模型进行训练和测试,得到训练好的第一模型;
所述第一预测单元7053,用于将所述纸电混用未转化客户所对应的特征数据作为预测集,利用所述训练好的第一模型预测所述纸电混用未转化客户转为电子客户的概率值。
在本公开的一种具体实施方式中,所述计算模块705包括构造单元7054、第二处理单元7055、训练单元7056和第二预测单元7057。
所述构造单元7054,用于将所述仅纸质客户和所述仅电子客户所对应的特征数据作为样本集,采用SMOTE算法构造平衡数据集;
所述第二处理单元7055,用于对所述平衡数据集进行归一化处理,处理后利用XGBoost模型对其进行特征重要性分析,得到重要特征;
所述训练单元7056,用于将所述仅电子客户的所述重要特征所对应的数据作为样本集,将其按照7:3的比例分训练集和测试集,采用one class SVM模型进行训练与测试,得到训练好的第二模型;
所述第二预测单元7057,用于将所述仅纸质客户所对应的特征数据作为预测集,利用所述训练后的第二模型预测仅纸质客户转为电子客户的概率值。
在本公开的一种具体实施方式中,所述生成模块706包括第二获取单元7061、匹配单元7062和生成单元7063。
所述第二获取单元7061,用于获取所述概率值所对应的等级分类表,所述等级分类表中不同的等级对应不同的概率值范围;
所述匹配单元7062,用于根据所述等级分类表,将所述概率值进行等级匹配,得到等级匹配结果;
所述生成单元7063,用于根据所述等级匹配结果,生成转化名单至相关业务部门或者下发至相应分行,以指示相关工作人员按照所述等级匹配结果进行推广。
需要说明的是,关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
实施例3
相应于上面的方法实施例,本公开实施例还提供了一种纸质票据转化设备,下文描述的一种纸质票据转化设备与上文描述的一种纸质票据转化方法可相互对应参照。
图3是根据一示例性实施例示出的一种纸质票据转化设备800的框图。如图3所示,该纸质票据转化设备800可以包括:处理器801,存储器802。该纸质票据转化调节设备800还可以包括多媒体组件803,输入/输出(I/O)接口804,以及通信组件805中的一者或多者。
其中,处理器801用于控制该纸质票据转化设备800的整体操作,以完成上述的纸质票据转化方法中的全部或部分步骤。存储器802用于存储各种类型的数据以支持在该纸质票据转化设备800的操作,这些数据例如可以包括用于在该纸质票据转化设备800上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器802可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件803可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器802或通过通信组件805发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口804为处理器801和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件805用于该纸质票据转化设备800与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件805可以包括:Wi-Fi模块,蓝牙模块,NFC模块。
在一示例性实施例中,该纸质票据转化设备800可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal ProcessingDevice,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的纸质票据转化方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的纸质票据转化方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器802,上述程序指令可由该纸质票据转化设备800的处理器801执行以完成上述的纸质票据转化方法。
实施例4
相应于上面的方法实施例,本公开实施例还提供了一种可读存储介质,下文描述的一种可读存储介质与上文描述的一种纸质票据转化方法可相互对应参照。
一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例的纸质票据转化方法的步骤。
该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种纸质票据转化方法,其特征在于,包括:
获取目标时间范围内客户办理过的银行承兑汇票业务数据,所述银行承兑汇票业务数据包括每个出票人名称信息和每个出票人的结算方式信息;
对所述每个出票人名称信息进行预处理,得到完整的出票人名称信息,为具有所述完整的出票人名称信息的每一个出票人生成对应的编号,得到不同的出票人编号;
为具有所述出票人编号的每个出票人构建特征数据,所述特征数据包括每个出票人的票据数量、累计票面金额、基本信息、交易信息、资产持有情况信息和客户标签信息;
根据具有所述出票人编号的每个出票人所对应的结算方式信息,将具有所述出票人编号的出票人进行分类,得到多个客户类型,所述多个客户类型包括仅纸质客户、仅电子客户、纸电混用已转化客户、纸电混用未转化客户;
根据所述不同类型的客户所对应的特征数据,计算所述纸电混用未转化客户和所述仅纸质客户转为电子客户的概率值;
根据所述概率值,生成客户转化名单,以指示相关工作人员按照所述客户转化名单进行转化推广。
2.根据权利要求1所述的纸质票据转化方法,其特征在于,所述对所述每个出票人名称信息进行预处理,得到完整的出票人名称信息,为具有所述完整的出票人名称信息的每一个出票人生成对应的编号,得到不同的出票人编号,包括:
检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息不存在空值且不存在异常,则将此出票人名称信息定义为完整的出票人名称信息;
检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息存在空值或者存在异常且异常无法修复,则将此出票人名称信息剔除;
检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息存在空值或者存在异常,但异常可修复,则进行修复,将修复之后的出票人名称信息也定义为完整的出票人名称信息。
3.根据权利要求1所述的纸质票据转化方法,其特征在于,所述为具有所述出票人编号的每个出票人构建特征数据,所述特征数据包括每个出票人的票据数量、累计票面金额、基本信息、交易信息、资产持有情况信息和客户标签信息,包括:
以所述出票人编号为统计粒度,计算每个出票人的票据数量和累计票面金额;
根据所述出票人编号,获取所述出票人编号所对应的出票人的基本信息、交易信息、资产持有情况信息、客户标签信息;
将所述每个出票人的票据数量、累计票面金额、基本信息、交易信息、资产持有情况信息和客户标签信息定义为特征,将每个出票人的特征组合在一起,构建出具有所述出票人编号的每个出票人所对应的特征数据。
4.根据权利要求1所述的纸质票据转化方法,其特征在于,所述根据所述不同类型的客户所对应的特征数据,计算所述纸电混用未转化客户和所述仅纸质客户转为电子客户的概率值,包括:
将所述仅纸质客户和所述纸电混用已转化客户所对应的特征数据作为样本集,将其按照7:3的比例分训练集和测试集;
对所述样本集进行归一化处理,处理后采用XGBoost模型进行训练和测试,得到训练好的第一模型;
将所述纸电混用未转化客户所对应的特征数据作为预测集,利用所述训练好的第一模型预测所述纸电混用未转化客户转为电子客户的概率值。
5.根据权利要求1所述的纸质票据转化方法,其特征在于,所述根据所述不同类型的客户所对应的特征数据,计算所述纸电混用未转化客户和所述仅纸质客户转为电子客户的概率值,包括:
将所述仅纸质客户和所述仅电子客户所对应的特征数据作为样本集,采用SMOTE算法构造平衡数据集;
对所述平衡数据集进行归一化处理,处理后利用XGBoost模型对其进行特征重要性分析,得到重要特征;
将所述仅电子客户的所述重要特征所对应的数据作为样本集,将其按照7:3的比例分训练集和测试集,采用one class SVM模型进行训练与测试,得到训练好的第二模型;
将所述仅纸质客户所对应的特征数据作为预测集,利用所述训练后的第二模型预测仅纸质客户转为电子客户的概率值。
6.根据权利要求1所述的纸质票据转化方法,其特征在于,所述根据所述概率值,生成客户转化名单,以指示相关工作人员按照所述客户转化名单进行转化推广,包括:
获取所述概率值所对应的等级分类表,所述等级分类表中不同的等级对应不同的概率值范围;
根据所述等级分类表,将所述概率值进行等级匹配,得到等级匹配结果;
根据所述等级匹配结果,生成转化名单至相关业务部门或者下发至相应分行,以指示相关工作人员按照所述等级匹配结果进行推广。
7.一种纸质票据转化装置,其特征在于,包括:
获取模块,用于获取目标时间范围内客户办理过的银行承兑汇票业务数据,所述银行承兑汇票业务数据包括每个出票人名称信息和每个出票人的结算方式信息;
预处理模块,用于对所述每个出票人名称信息进行预处理,得到完整的出票人名称信息,为具有所述完整的出票人名称信息的每一个出票人生成对应的编号,得到不同的出票人编号;
构建模块,用于为具有所述出票人编号的每个出票人构建特征数据,所述特征数据包括每个出票人的票据数量、累计票面金额、基本信息、交易信息、资产持有情况信息和客户标签信息;
分类模块,用于根据具有所述出票人编号的每个出票人所对应的结算方式信息,将具有所述出票人编号的出票人进行分类,得到多个客户类型,所述多个客户类型包括仅纸质客户、仅电子客户、纸电混用已转化客户、纸电混用未转化客户;
计算模块,用于根据所述不同类型的客户所对应的特征数据,计算所述纸电混用未转化客户和所述仅纸质客户转为电子客户的概率值;
生成模块,用于根据所述概率值,生成客户转化名单,以指示相关工作人员按照所述客户转化名单进行转化推广。
8.根据权利要求7所述的纸质票据转化装置,其特征在于,所述预处理模块,包括:
第一检查单元,用于检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息不存在空值且不存在异常,则将此出票人名称信息定义为完整的出票人名称信息;
第二检查单元,用于检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息存在空值或者存在异常且异常无法修复,则将此出票人名称信息剔除;
第三检查单元,用于检查每一个出票人名称信息是否存在空值或异常,若所述出票人名称信息存在空值或者存在异常,但异常可修复,则进行修复,将修复之后的出票人名称信息也定义为完整的出票人名称信息。
9.根据权利要求7所述的纸质票据转化装置,其特征在于,所述构建模块,包括:
第一计算单元,用于以所述出票人编号为统计粒度,计算每个出票人的票据数量和累计票面金额;
第一获取单元,用于根据所述出票人编号,获取所述出票人编号所对应的出票人的基本信息、交易信息、资产持有情况信息、客户标签信息;
构建单元,用于将所述每个出票人的票据数量、累计票面金额、基本信息、交易信息、资产持有情况信息和客户标签信息定义为特征,将每个出票人的特征组合在一起,构建出具有所述出票人编号的每个出票人所对应的特征数据。
10.根据权利要求7所述的纸质票据转化装置,其特征在于,所述计算模块,包括:
划分单元,用于将所述仅纸质客户和所述纸电混用已转化客户所对应的特征数据作为样本集,将其按照7:3的比例分训练集和测试集;
第一处理单元,用于对所述样本集进行归一化处理,处理后采用XGBoost模型进行训练和测试,得到训练好的第一模型;
第一预测单元,用于将所述纸电混用未转化客户所对应的特征数据作为预测集,利用所述训练好的第一模型预测所述纸电混用未转化客户转为电子客户的概率值。
11.根据权利要求7所述的纸质票据转化装置,其特征在于,所述计算模块,包括:
构造单元,用于将所述仅纸质客户和所述仅电子客户所对应的特征数据作为样本集,采用SMOTE算法构造平衡数据集;
第二处理单元,用于对所述平衡数据集进行归一化处理,处理后利用XGBoost模型对其进行特征重要性分析,得到重要特征;
训练单元,用于将所述仅电子客户的所述重要特征所对应的数据作为样本集,将其按照7:3的比例分训练集和测试集,采用one classSVM模型进行训练与测试,得到训练好的第二模型;
第二预测单元,用于将所述仅纸质客户所对应的特征数据作为预测集,利用所述训练后的第二模型预测仅纸质客户转为电子客户的概率值。
12.根据权利要求7所述的纸质票据转化装置,其特征在于,所述生成模块,包括:
第二获取单元,用于获取所述概率值所对应的等级分类表,所述等级分类表中不同的等级对应不同的概率值范围;
匹配单元,用于根据所述等级分类表,将所述概率值进行等级匹配,得到等级匹配结果;
生成单元,用于根据所述等级匹配结果,生成转化名单至相关业务部门或者下发至相应分行,以指示相关工作人员按照所述等级匹配结果进行推广。
13.一种纸质票据转化设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述纸质票据转化方法的步骤。
14.一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述纸质票据转化方法的步骤。
CN202110833534.2A 2021-07-23 2021-07-23 一种纸质票据转化方法、装置、设备及可读存储介质 Active CN113538057B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110833534.2A CN113538057B (zh) 2021-07-23 2021-07-23 一种纸质票据转化方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110833534.2A CN113538057B (zh) 2021-07-23 2021-07-23 一种纸质票据转化方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN113538057A true CN113538057A (zh) 2021-10-22
CN113538057B CN113538057B (zh) 2024-04-30

Family

ID=78088731

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110833534.2A Active CN113538057B (zh) 2021-07-23 2021-07-23 一种纸质票据转化方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN113538057B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320444A (zh) * 2007-06-07 2008-12-10 华为技术有限公司 一种实现电子票据的方法、系统及装置
US8548907B1 (en) * 2011-01-11 2013-10-01 Derrick Harlan Campbell System for converting paper money orders to electronic money orders
CN105550929A (zh) * 2015-12-03 2016-05-04 中国建设银行股份有限公司 一种商业汇票一体化处理方法及系统
CN106570481A (zh) * 2016-11-03 2017-04-19 广州普惠创新金融信息服务有限公司 一种票据信息化的处理方法、装置及系统
CN109948369A (zh) * 2018-12-29 2019-06-28 航天信息股份有限公司 一种利用票据的可打印数据生成电子化版式文件的方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320444A (zh) * 2007-06-07 2008-12-10 华为技术有限公司 一种实现电子票据的方法、系统及装置
US8548907B1 (en) * 2011-01-11 2013-10-01 Derrick Harlan Campbell System for converting paper money orders to electronic money orders
CN105550929A (zh) * 2015-12-03 2016-05-04 中国建设银行股份有限公司 一种商业汇票一体化处理方法及系统
CN106570481A (zh) * 2016-11-03 2017-04-19 广州普惠创新金融信息服务有限公司 一种票据信息化的处理方法、装置及系统
CN109948369A (zh) * 2018-12-29 2019-06-28 航天信息股份有限公司 一种利用票据的可打印数据生成电子化版式文件的方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"票据电子化的趋势及应用", 金融电子化, no. 03, 7 March 2009 (2009-03-07) *
高古峰;: "电子银行承兑汇票的应用", 冶金财会, no. 11, 25 November 2013 (2013-11-25) *

Also Published As

Publication number Publication date
CN113538057B (zh) 2024-04-30

Similar Documents

Publication Publication Date Title
CA3063580A1 (en) Classifier training method and apparatus, electronic device and computer readable medium
Abedin et al. Tax default prediction using feature transformation-based machine learning
US11720615B2 (en) Self-executing protocol generation from natural language text
CN110889291B (zh) 一种基于深度学习和区块链的研报评价方法
CN110019324B (zh) 一种生成纳税人资金回路的方法及系统
CN110544035A (zh) 一种内控检测方法、系统和计算机可读存储介质
CN114626731A (zh) 风险识别方法、装置、电子设备及计算机可读存储介质
CN114626102A (zh) 基于区块链的电子凭证流转方法、装置、设备及存储介质
CN112037039A (zh) 一种贷款评估方法及装置
CN111898611A (zh) 一种结合rpa和ai的收款凭证生成方法、装置、设备及介质
CN111061792A (zh) 一种金融服务管理系统
CN113240516A (zh) 基于区块链的银行纳税信息处理方法及装置
CN117094764A (zh) 银行积分处理方法及装置
CN109829769B (zh) 一种电子发票查重方法及系统
CN110619564B (zh) 一种反欺诈特征生成方法和装置
CN113538057A (zh) 一种纸质票据转化方法、装置、设备及可读存储介质
CN114998001A (zh) 业务类别识别方法、装置、设备、存储介质和程序产品
CN108805687A (zh) 一种会计记账系统
CN114971017A (zh) 银行交易数据的处理方法及装置
CN114331105A (zh) 电子汇票的处理系统、方法、电子设备和存储介质
CN114493853A (zh) 信用等级评价方法、装置、电子设备及存储介质
CN113763143A (zh) 审计处理方法、计算机设备及存储装置
CN111429257A (zh) 一种交易监控方法和装置
CN113159924A (zh) 授信客户对象的确定方法及装置
Dziawgo Supervisory technology as a new tool for banking sector supervision

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant