CN116308590A - 票据产品推送方法、装置及系统 - Google Patents

票据产品推送方法、装置及系统 Download PDF

Info

Publication number
CN116308590A
CN116308590A CN202310168388.5A CN202310168388A CN116308590A CN 116308590 A CN116308590 A CN 116308590A CN 202310168388 A CN202310168388 A CN 202310168388A CN 116308590 A CN116308590 A CN 116308590A
Authority
CN
China
Prior art keywords
list
user
bill
product
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310168388.5A
Other languages
English (en)
Inventor
许承飞
郭芃
吴欢
林慕云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202310168388.5A priority Critical patent/CN116308590A/zh
Publication of CN116308590A publication Critical patent/CN116308590A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/04Billing or invoicing

Landscapes

  • Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种票据产品推送方法、装置及系统,可用于人工智能技术领域,所述方法包括:通过第一预设模型基于用户数据进行用户票据贴现意愿预测得到第一清单;通过第二预设模型基于用户数据进行用户票据贴现成功率预测得到第二清单;根据第一清单和第二清单对用户进行聚类得到用户分类清单,根据所述用户分类清单向用户终端推送对应的票据产品信息。本发明可提高票据产品营销的准确度,提高交易成功率。

Description

票据产品推送方法、装置及系统
技术领域
本发明涉及票据技术领域,特别涉及人工智能领域,尤其涉及一种票据产品推送方法、装置及系统。
背景技术
目前银行对于票据贴现业务依赖客户经理线下与客户沟通洽谈,耗费大量人力资源,也对客户经理自身的业务能力和掌握的客户资源有很强的依赖,急需一种科学、合理的票据产品推送机制,提升票据贴现的营销成功率,拓展营销新途径,提高客户经理工作效率,增加获客能力。目前,在向客户进行票据产品营销时,通常仅考虑单一因素预测客户所需的票据产品,导致预测准确性较低,使票据产品的交易成功率降低。
发明内容
本发明的一个目的在于提供一种票据产品推送方法,提高票据产品营销的准确度,提高交易成功率。本发明的另一个目的在于提供一种票据产品推送装置。本发明的另一个目的在于提供一种票据产品推送系统。本发明的还一个目的在于提供一种计算机设备。本发明的还一个目的在于提供一种可读介质。
为了达到以上目的,本发明的一方面公开了一种票据产品推送方法,包括:
通过第一预设模型基于用户数据进行用户票据贴现意愿预测得到第一清单;
通过第二预设模型基于用户数据进行用户票据贴现成功率预测得到第二清单;
根据第一清单和第二清单对用户进行聚类得到用户分类清单,根据所述用户分类清单向用户终端推送对应的票据产品信息。
优选的,所述通过第一预设模型基于用户数据进行用户票据贴现意愿预测得到第一清单具体包括:
基于预设的第一特征对所述用户数据进行特征提取得到第一特征向量,所述预设的第一特征包括基础特征、衍生特征和用户特征的至少之一;
通过XGBOOST模型基于所述第一特征向量进行用户票据贴现意愿预测得到贴现意愿高于预设贴现意愿标准的第一票据产品与用户的第一清单。
优选的,所述通过第二预设模型基于用户数据进行用户票据贴现成功率预测得到第二清单具体包括:
基于预设的第二特征对所述用户数据进行特征提取得到第二特征向量,所述预设的第二特征包括基础特征、衍生特征和用户特征的至少之一;
通过GBM模型基于所述第二特征向量进行用户票据贴现成功率预测得到贴现成功率高于预设贴现成功率标准的第二票据产品与用户的第二清单。
优选的,所述根据第一清单和第二清单对用户进行聚类得到用户分类清单具体包括:
对第一清单和第二清单根据用户进行合并得到联合清单;
对所述联合清单中的用户进行聚类得到多个用户类型;
基于多个用户类型和所述联合清单得到用户分类清单。
优选的,所述对第一清单和第二清单根据用户进行合并得到联合清单具体包括:
确定第一清单和第二清单中的所有用户;
统计每个用户在第一清单和第二清单中对应的票据产品;
根据所有用户及对应的票据产品得到所述联合清单。
优选的,所述对所述联合清单中的用户进行聚类得到多个用户类型具体包括:
通过kmeans聚类模型基于联合清单中用户的用户数据、贴现意愿和贴现成功率的至少之一进行聚类得到多个用户类型,每个用户类型至少包括一个用户。
优选的,所述根据所述用户分类清单向用户终端推送对应的票据产品信息具体包括:
根据所述用户类型和所述用户分类清单确定待推送的目标票据产品;
根据所述用户类型基于所述目标票据产品形成票据产品营销信息并将所述票据产品营销信息推送至用户终端。
本发明还公开了一种票据产品推送装置,包括:
第一预测模块,用于通过第一预设模型基于用户数据进行用户票据贴现意愿预测得到第一清单;
第二预测模块,用于通过第二预设模型基于用户数据进行用户票据贴现成功率预测得到第二清单;
产品推送模块,用于根据第一清单和第二清单对用户进行聚类得到用户分类清单,根据所述用户分类清单向用户终端推送对应的票据产品信息。
本发明还公开了一种票据产品推送系统,包括票据产品推送装置和用户终端;
其中,所述票据产品推送装置用于通过第一预设模型基于用户数据进行用户票据贴现意愿预测得到第一清单;第二预测模块,用于通过第二预设模型基于用户数据进行用户票据贴现成功率预测得到第二清单;产品推送模块,用于根据第一清单和第二清单对用户进行聚类得到用户分类清单,根据所述用户分类清单向用户终端推送对应的票据产品信息。
本发明还公开了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述方法。
本发明还公开了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述方法。
本发明票据产品推送方法通过第一预设模型基于用户数据进行用户票据贴现意愿预测得到第一清单;通过第二预设模型基于用户数据进行用户票据贴现成功率预测得到第二清单;根据第一清单和第二清单对用户进行聚类得到用户分类清单,根据所述用户分类清单向用户终端推送对应的票据产品信息。从而,本发明通过第一预设模型和第二预设模型两个模型分别基于用户数据进行用户票据贴现意愿和贴现成功率预测得到用户对不同票据产品的贴现意愿和成功率的第一清单和第二清单。进而,根据第一清单和第二清单对用户进行聚类得到用户分类清单,根据该用户分类清单对不同类型用户有针对性的推送对应的票据产品信息,便于用户购买票据产品,提高用户的票据产品交易成功率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明票据产品推送系统具体实施例的结构图;
图2示出了本发明票据产品推送方法具体实施例的流程图;
图3示出了本发明票据产品推送方法具体实施例S300聚类的流程图;
图4示出了本发明票据产品推送方法具体实施例S310的流程图;
图5示出了本发明票据产品推送方法具体实施例S300推送票据产品的流程图;
图6示出了本发明票据产品推送装置具体实施例的结构图;
图7示出适于用来实现本发明实施例的计算机设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
关于本文中所使用的“第一”、“第二”、……等,并非特别指称次序或顺位的意思,亦非用以限定本发明,其仅为了区别以相同技术用语描述的元件或操作。
关于本文中所使用的“包含”、“包括”、“具有”、“含有”等等,均为开放性的用语,即意指包含但不限于。
关于本文中所使用的“及/或”,包括所述事物的任一或全部组合。
需要说明的是,本发明技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
需要说明的是,本申请公开的一种票据产品推送方法、装置及系统可用于人工智能技术领域,也可用于除人工智能技术领域之外的任意领域,本申请公开的一种票据产品推送方法、装置及系统的应用领域不做限定。
为了便于理解本申请提供的技术方案,下面先对本申请技术方案的相关内容进行说明。本申请实施例提供的票据产品推送方法通过第一预设模型和第二预设模型两个模型分别基于用户数据进行用户票据贴现意愿和贴现成功率预测得到用户对不同票据产品的贴现意愿和成功率的第一清单和第二清单。进而,根据第一清单和第二清单对用户进行聚类得到用户分类清单,根据该用户分类清单对不同类型用户有针对性的推送对应的票据产品信息,便于用户购买票据产品,提高用户的票据产品交易成功率。
图1是本申请实施例提供的票据产品推送方法系统的结构示意图,如图1所示,本申请实施例提供的票据产品推送方法系统包括票据产品推送装置1和用户终端2。
其中,票据产品推送装置1用于通过第一预设模型基于用户数据进行用户票据贴现意愿预测得到第一清单,通过第二预设模型基于用户数据进行用户票据贴现成功率预测得到第二清单,根据第一清单和第二清单对用户进行聚类得到用户分类清单,根据所述用户分类清单向用户终端2推送对应的票据产品信息。
下面以票据产品推送装置1作为执行主体为例,说明本申请实施例提供的票据产品推送方法的实现过程。可理解的是,本申请实施例提供的票据产品推送方法的执行主体包括但不限于该票据产品推送装置1。
本发明实施例公开了一种票据产品推送方法。如图2所示,本实施例中,所述方法包括:
S100:通过第一预设模型基于用户数据进行用户票据贴现意愿预测得到第一清单。
S200:通过第二预设模型基于用户数据进行用户票据贴现成功率预测得到第二清单。
S300:根据第一清单和第二清单对用户进行聚类得到用户分类清单,根据所述用户分类清单向用户终端推送对应的票据产品信息。
现有技术中,通常只考虑一方面(贴现意愿、贴现成功率等)对用户进行预测并推送相应的票据产品,但是不同方向的模型的预测结果通常具有差异,有些结果甚至相互矛盾,从而可能会在产品推送时漏掉或者无法给用户推送到最优的票据产品。因此,本发明票据产品推送方法通过第一预设模型基于用户数据进行用户票据贴现意愿预测得到第一清单;通过第二预设模型基于用户数据进行用户票据贴现成功率预测得到第二清单;根据第一清单和第二清单对用户进行聚类得到用户分类清单,根据所述用户分类清单向用户终端推送对应的票据产品信息。从而,本发明通过第一预设模型和第二预设模型两个模型分别基于用户数据进行用户票据贴现意愿和贴现成功率预测得到用户对不同票据产品的贴现意愿和成功率的第一清单和第二清单。进而,根据第一清单和第二清单对用户进行聚类得到用户分类清单,根据该用户分类清单对不同类型用户有针对性的推送对应的票据产品信息,便于用户购买票据产品,提高用户的票据产品交易成功率。
在优选的实施方式中,所述S100通过第一预设模型基于用户数据进行用户票据贴现意愿预测得到第一清单具体包括:
S110:基于预设的第一特征对所述用户数据进行特征提取得到第一特征向量,所述预设的第一特征包括基础特征、衍生特征和用户特征的至少之一。
S120:通过XGBOOST模型基于用户数据进行用户票据贴现意愿预测得到贴现意愿高于预设贴现意愿标准的第一票据产品与用户的第一清单。
具体的,可以理解的是,在该优选的实施方式中,通过对现有的各种算法进行测试并比较预测能力后,选择XGBOOST模型对用户票据贴现意愿进行预测,以提高用户票据贴现意愿预测的准确度。
在优选的实施方式中,所述S200通过第二预设模型基于用户数据进行用户票据贴现成功率预测得到第二清单具体包括:
S210:基于预设的第二特征对所述用户数据进行特征提取得到第二特征向量,所述预设的第二特征包括基础特征、衍生特征和用户特征的至少之一。
S220:通过GBM模型基于用户数据进行用户票据贴现成功率预测得到贴现成功率高于预设贴现成功率标准的第二票据产品与用户的第二清单。
具体的,可以理解的是,在该优选的实施方式中,通过对现有的各种算法进行测试并比较预测能力后,选择GBM模型对用户票据贴现成功率进行预测,以提高用户票据贴现成功率预测的准确度。
XGBOOST和GBM模型算法是一种决策树。决策树(Decision Tree)是应用于分类的一种树结构。其中的每个内部节点(internal node)代表对某个属性的一次测试判别,一个分枝代表一个测试结果,叶子(leaf)代表某个类(class)或者类的分布(classdistribution)。最顶层的节点是根结点。可以将决策树理解为一个if-then规则的集合,由决策树的根节点到叶节点的每一条路径构建一条规则。决策树学习算法包含特征选择、决策树的生成和决策树的修剪过程,构造决策树的方法是采用自上而下的递归构造。
构造的思路是,如果训练样本集合中的所有样本是同类的,则将之作为叶子节点,节点内容即是该类别标记。否则,根据某种策略(如信息熵或GINI系数)选择一个属性,按照属性的各个取值,把样本集合划分为若干子集合,使得每个子集上的所有样本在该属性上具有同样的属性值,然后再依次递归处理各个子集。这种思路实际上就是“分而治之”的道理。通过信息增益算法计算各个叶子节点分支的信息增益值,选择信息增益最大的叶子节点的特征作为结果输出。
在优选的实施方式中,票据推送方法还包括预先构建XGBOOST模型和GBM模型的步骤。在具体例子中,可通过准备训练数据、对训练数据进行特征提取得到特征向量以及将特征向量输入预先构建的XGBOOST模型框架和GBM模型框架中进行训练得到XGBOOST模型和GBM模型的步骤。
其中,训练数据可包括历史票据贴现交易信息、历史利率报价信息、Shibor基准利率信息、票据公示控制信息、票据公示催告信息、企业黑名单信息、敏感信息、票据流转记录、授权信息、追索信息、授信额度信息和征信信息(CIIS)等数据。
其中,历史票据贴现交易信息可包含票据号码、票面金额、票据种类、票据介质、票据到期日、贴现日期、贴现利率、贴现机构、承兑人、出票人、收款人、交易对手、可转让标志、付息方式、交易方式、业务模式等。
历史利率报价信息可包含报价类型、报价机构、票据种类、票据介质、期限类型、期限值、承兑人名单、交易对手名单、适用机构、浮动点数等。
Shibor基准利率信息可包含业务种类、票据介质、期限类型、期限值、基准利率值等。
票据公示控制信息可包含控制银行编号、设置机构、控制类型、发布日期、撤销日期等。
票据公示催告信息可包含票据号码、校验标志等。
企业黑名单信息可包含客户编号(CIS号/统一社会信用代码)、客户名称、控制类型、控制开始日期、控制截止日期、控制种类等。
敏感信息可包含敏感信息类型、字典代码、字典值等。
票据流转记录可包含票据号码、流转日期、流转序号、业务种类、背书人、被背书人等。
授权信息可包含授权机构、授权金额、授权开始日、授权到期日等。
追索信息可包含追索类型、追索金额、被追索人等。
授信额度信息的数据可来源于全球客户信用管理(GCCM),包含客户代码、客户名称、一年(含)以内同业融资专项授信额度、一年(含)以内同业融资专项授信额度余额、非专项授信审批额度、非专项融资余额、授信开始日、授信到期日等。
征信信息(CIIS)的数据来源于法人征信,包括二代征信相关特征数据。
其他补充信息用于关联完善交易特征,可包含金融机构信息、票交所机构信息、支付系统行名行号信息、票交所机构对照关系信息、机构信息等等。
需要说明的是,在实际应用中,本领域技术人员可根据实际需求选取训练数据,训练数据并不限于上述数据,本发明对此并不作限定。
在特征提取时,预设的特征可包括基础特征、衍生特征和用户特征的至少之一。其中,基础特征可包括以下特征的至少之一:(1)根据交易数据获得基础特征,并根据交易最终是否成功标记为正负样本:票据号码、票据种类、票据介质、票面金额、票据到期日、贴现日期、贴现利率、贴现机构、承兑人编号、承兑人名称、出票人编号、出票人名称、收款人编号、收款人名称、贴现申请人编号、贴现申请人名称、票据可转让标识、付息方式、交易方式、业务模式、样本标志。(2)根据交易数据、利率报价数据和shibor基准利率组合获得特征:利率报价值、信贷流量控制值、信贷流量解除机构层级、资金流动性控制值、资金流动性解除机构层级。(3)根据交易数据、公示控制信息组合获得特征:承兑人是否被公示控制。(4)根据交易数据、公示催告信息组合获得特征:票据是否被公示催告。(5)根据交易数据、企业黑名单组合获得特征:出票人是否黑名单客户、承兑人是否黑名单客户、收款人是否黑名单客户、贴现申请人是否黑名单客户。(6)根据交易数据、敏感信息组合获得特征:出票人是否含敏感字、承兑人是否含敏感字、收款人是否含敏感字、贴现申请人是否含敏感字。(7)根据交易数据、票据流转记录组合获得特征:票据背书次数、背书连续标识。(8)根据交易数据、票据流转记录、企业黑名单组合获得特征:历史背书人是否含黑名单客户。(9)根据交易数据、票据流转记录、敏感信息组合获得特征:历史背书人是否含敏感字。(10)根据交易数据、欺诈信息组合获得特征:出票人是否存在欺诈信息、承兑人是否存在欺诈信息、收款人是否存在欺诈信息、贴现申请人是否存在欺诈信息。(11)根据交易数据、同业名单信息组合获得特征:承兑人是否同业白名单标识、承兑人是否同业黑名单标识。(12)根据交易数据、征信信息组合获得特征:贴现申请人不良类余额、贴现申请人关注类余额。(13)根据交易数据、客户信息组合获得特征:出票人在工行开户标识、承兑人在工行开户标识、收款人在工行开户标识、贴现申请人在工行开户标识、出票人企业规模、出票人经济性质、出票人所属行业、出票人融资投向、出票人所在地区、承兑人企业规模、承兑人经济性质、承兑人所属行业、承兑人融资投向、承兑人所在地区、收款人企业规模、收款人经济性质、收款人所属行业、收款人融资投向、收款人所在地区、贴现申请人企业规模、贴现申请人经济性质、贴现申请人所属行业、贴现申请人融资投向、贴现申请人所在地区。(14)根据交易数据、授信额度信息组合获得特征:承兑人1天,3天,10天,30天,60天,90天,180天,1年以内同业融资专项授信额度、承兑人1天,3天,10天,30天,60天,90天,180天,1年以内同业融资专项授信额度余额、承兑人1天,3天,10天,30天,60天,90天,180天,1年非专项授信审批额度、承兑人1天,3天,10天,30天,60天,90天,180天,1年非专项融资余额、承兑人1天,3天,10天,30天,60天,90天,180天,1年授信开始日期、承兑人授信到期日期、贴现申请人1天,3天,10天,30天,60天,90天,180天,1年非专项授信审批额度、贴现申请人1天,3天,10天,30天,60天,90天,180天,1年非专项融资余额、贴现申请人授信开始日期、贴现申请人授信到期日期。(15)根据交易数据、授权信息组合获得特征:授权金额。(16)根据交易数据、追索信息组合获得特征:承兑人被追索总金额。
衍生特征可包括以下特征的至少之一:(1)根据出票人和贴现申请人衍生特征:自开自贴标识。(2)根票据贴现利率和利率报价值衍生特征:利率下浮点数(如果贴现利率大于利率报价值则下浮点数为负)。(3)根据票据到期日和贴现日期衍生特征:剩余期限。(4)企业过去1天,3天,10天,30天,60天,90天内总贴现次数。(5)企业过去1天,3天,10天,30天,60天,90天内总贴现金额。(6)企业过去1天,3天,10天,30天,60天,90天内库存票据总笔数。(7)企业过去1天,3天,10天,30天,60天,90天内库存票据总额。(8)企业过去1天,3天,10天,30天,60天,90天内库贴现成功次数。(9)企业过去1天,3天,10天,30天,60天,90天内库贴现失败次数。
用户特征可包括以下特征的至少之一:进出口企业,客户星级,企业规模,上市企业,议价能力,营销级别,走出去/走进来企业,企业规模,营销级别,上市企业,行业政策,进出口企业,有无融资关系,授信趋势,风险,外部及舆情风险,企业规模-大型企业,企业规模-中型企业,企业规模-小型企业,企业规模-微型企",绿色信贷,潜在风险标识,行业风险,CIIS状态(当前),跨行业经营,关联企业交易集中,同一客户资金往来频繁,行业政策分类,偿债能力,财务效益,资金运营,发展能力,关联类型复杂,交易对手风险,隐形关联风险,高管违约,行外交叉违约,涉诉涉处罚,关联企业违约,应纳入未纳入授信关联,小企业投资小贷公司,担保代偿,保证人发生违约,小企业过度担保,未披露关联关系,过度融资,资金结算异常,供应链融资风险,贸易融资背景存疑,隐性关联保证担保,区域行业突出风险,融资背景涉嫌虚假,外部资讯风险,小企业投资房地产,代发代缴异常,股权出质或冻结,销售收入与纳税金额不匹配,资金往来异常,小企业一户多抵押,还本付息资金来源异常,法人代表频繁变更,经营场所频繁变更,潜在风险贷款余额增加,押品不足值,关联企业已不良,涉嫌隐瞒关联关系,固融业务风险,工商注册注销吊销,贷前流水异常,股权关联客户未纳入统一授信,还本付息来源于同一户,固融业务风险,工商注册注销吊销,贷前流水异常,股权关联客户未纳入统一授信,还本付息来源于同一户,账户资金大幅下降,本金逾期多天,本金逾期多次,欠息客户,密切人员关联客户未纳入统一授信,我行账户冻结,贷款资金流向异常,融资背景真实性存疑,融资投放违反制度规定,对外担保超企业净资产,对外担保不良或关注,还款来源异常,过度或多头融资,一户多保,异常资金往来,关联体过度融资,他行下调关注,其他机构融资申请被否决,关联企业融资申请被否决,未按计划还款达5天,网贷通客户隐性强关联,四色因子预警,反洗钱高风险标识,反洗钱客户,小企业管理标识,法人、股东、实收资本与工商注册不符,个人资金涉嫌流入股市,销售收入大幅下降,交易集中对象异常,先进制造业,股东变化次频繁,经营资金流入、销售归行连续下降等。
需要说明的是,与模型训练过程的特征提取类似的,在基于用户数据对用户票据贴现意愿和用户票据贴现成功率预测时,需要对用户数据分别基于预设的第一特征进行特征提取得到第一特征向量,基于预设的第二特征进行特征提取得到第二特征向量。其中,预设的第一特征和第二特征可包括基础特征、衍生特征和用户特征的至少之一,在实际应用中,第一特征和第二特征的具体选择可以相同,也可以不同,并且本领域技术人员可根据实际需求选取待提取的特征,选用的特征并不限于上述数据,本发明对此并不作限定。
在可选的实施方式中,可将训练数据拆分为训练集、测试集和验证集,通过训练集对预先构建的XGBOOST模型框架和GBM模型框架进行训练得到XGBOOST模型和GBM模型,通过测试集对训练好的XGBOOST模型和GBM模型进行测试,若测试不通过,需要进一步对XGBOOST模型和GBM模型进行训练优化直至测试通过。最后,通过验证集对通过测试的XGBOOST模型和GBM模型进行校验,以确定XGBOOST模型和GBM模型是否满足要求。
在优选的实施方式中,如图3所示,所述S300根据第一清单和第二清单对用户进行聚类得到用户分类清单具体包括:
S310:对第一清单和第二清单根据用户进行合并得到联合清单。
S320:对所述联合清单中的用户进行聚类得到多个用户类型。
S330:基于多个用户类型和所述联合清单得到用户分类清单。
具体的,可以理解的是,第一清单中包括用户数据与票据产品的票据贴现意愿的对应关系,第二清单中包括用户数据与票据产品的票据贴现成功率的对应关系。由此,可将第一清单和第二清单中进行合并得到所有用户数据分别对应的所有票据产品的贴现意愿和贴现成功率,得到联合清单。
进一步的,为了对用户进行细化的分类营销,可通过聚类的方式对联合清单中的用户数据、贴现意愿和贴现成功率等数据进行聚类,得到不同用户类型分别对应的可营销票据产品。例如,可根据票据贴现意愿的数值范围将票据贴现意愿分别高、中和低三个级别,也可根据票据贴现成功率的数值范围将票据贴现成功率分别高、中和低三个级别。同时,也可将用户数据分为绿色、制造业和三农等领域进行分类。从而,可按照票据贴现意愿、票据贴现成功率和用户的领域等对用户数据进行聚类得到不同用户类型分别对应的不同票据贴现意愿和票据贴现成功率的票据产品。
在优选的实施方式中,如图4所示,所述S310对第一清单和第二清单根据用户进行合并得到联合清单具体包括:
S311:确定第一清单和第二清单中的所有用户。
S312:统计每个用户在第一清单和第二清单中对应的票据产品。
S313:根据所有用户及对应的票据产品得到所述联合清单。
具体的,可以理解的是,输入第一预设模型和第二预设模型的用户数据为多个用户的用户数据,从而,第一清单和第二清单中分别包括不同用户对应不同票据产品的票据贴现意愿和票据贴现成功率的预测值,这些预测值分别代表了不同用户对应不同票据产品的票据贴现意愿和票据贴现成功率的概率大小。从而,可先将第一清单和第二清单中的所有用户合并,然后将每个用户对应的票据产品的票据贴现意愿和票据贴现成功率的预测值分别对应,即可得到联合清单。该联合清单中包括了票据产品的票据贴现意愿和票据贴现成功率的预测值,从而能够更好的选择对应的票据产品向用户推送,进行细化的票据产品营销,提高票据产品交易的成功率。例如,在具体例子中,可根据联合清单选择用户票据贴现意愿和票据贴现成功率的预测值均最高的票据产品向用户推送,若不存在,则可将票据贴现意愿和票据贴现成功率的预测值进行加权求和得到加权值,选择加权值最高的票据产品推送给用户。当然,在实际应用中,本领域技术人员可根据实际需求根据聚类后的结果向用户推送票据产品,本发明对此并不作限定。
需要说明的是,当用户为新用户时,可先获取用户的历史用户数据,根据历史用户数据确定用户的用户类型,然后根据聚类的结果确定向用户推送的票据产品。其中,可预先构建分类模型根据历史用户数据确定用户的用户类型,分类模型的构建为本领域的常规技术手段,在此不再赘述。
在优选的实施方式中,所述对所述联合清单中的用户进行聚类得到多个用户类型具体包括:
通过kmeans聚类模型基于联合清单中用户的用户数据、贴现意愿和贴现成功率的至少之一进行聚类得到多个用户类型,每个用户类型至少包括一个用户。
其中,k-means算法是一种聚类算法,所谓聚类,即根据相似性原则,将具有较高相似度的数据对象划分至同一类簇,将具有较高相异度的数据对象划分至不同类簇。聚类与分类最大的区别在于,聚类过程为无监督过程,即待处理数据对象没有任何先验知识,而分类过程为有监督过程,即存在有先验知识的训练数据集。
k-means算法中的k代表类簇个数,means代表类簇内数据对象的均值(这种均值是一种对类簇中心的描述),因此,k-means算法又称为k-均值算法。k-means算法是一种基于划分的聚类算法,以距离作为数据对象间相似性度量的标准,即数据对象间的距离越小,则它们的相似性越高,则它们越有可能在同一个类簇。数据对象间距离的计算有很多种,k-means算法通常采用欧氏距离来计算数据对象间的距离。
在前期数据清洗时,将空值赋为0;非数值类型:使用Label Encoding的方式将每个非数值的数据都对应一个数值,但是这里数值大小并没有比较意义的。异常值:由于KMeans算法对异常值和噪点比较敏感,使用sklearn的preprocessing.scale()方法将数据标准化。
模型参数评估时选择K值个数。无监督聚类没有样本输出,没有比较直接的聚类评估方法,但是我们可以从簇内的稠密程度和簇间的离散程度来评估聚类的效果。使用轮廓系数Silhouette Coefficient方法。轮廓系数Silhouette Coefficient适用于实际类别信息未知的情况。对于单个样本,设a是与它同类别中其它样本的平均距离,b是与它距离最近的不同类别中样本的平均距离,分数值s=(b-a)/max(a,b)。对于一个样本集合,它的轮廓系数是所有样本轮廓系数的平均值。轮廓系数取值范围是[-1,1],同类别样本距离相近且不同类别样本距离越远,分数越高,聚类效果越好。
可通过平均轮廓系数检验得到最佳KMeans聚类模型。在具体例子中:
Figure BDA0004096956760000131
结果输出:
**************K value and silhouette summary:***************
[2. 0.2341654]
[3. 0.22548233]
[4. 0.4696373]
[5. 0.2758751]
[6. 0.28744501]
[7. 0.30129771]
[8. 0.30919939]
[9. 0.26335877]]
Best K is:4with average silhouette of 0.469。
在优选的实施方式中,所述方法还包括:
S400:通过管控规则对用户进行过滤。
具体的,通过管控规则对具有风险的用户进行过滤,可得到更为精确、更具安全性的清单。其中,客户异常实时管控规则可包括以下规则的至少之一:
规则1.账户冻结48小时以上,且开通“电子商业承兑汇票”功能。
规则2:账户T日销户,且开通“电子商业承兑汇票”功能;
规则3:账户被采取“只收不付”、“不收不付”、“暂停账户非柜面业务”、“限制账户交易规模或频率”等控制状态3天以上,且开通“电子商业承兑汇票”功能。
本发明通过对贴现成功概率预测模型和客户贴现意愿模型推荐结果进行整合得到潜在客户和票的推荐清单。再通过kmeans聚类模型对潜在客户进行分类。在客户签收票据时可调用复合模型进行分析,预测结果(包含潜在票据客户推荐清单、客户分类以及对应的营销策略推荐)可推送给客户经理,提升票据贴现的营销成功率,拓展营销新途径,提高客户经理工作效率,增加获客能力。
本发明的复合模型,相比于原先的单一模型,优势和创新性在于:1通过复合模型提高了推荐的准确性,整合了客户侧和银行市场侧的双重要素,对潜在客户做了更全面的评估;2、对推荐结果进行分类,及提供对应的营销策略,便于客户经理在营销前对客户背景和营销策略进行充分准备,达到精准营销,实现数字化营销。3、对于推送前的客户清单进行实时客户规则管控,防止出现客户异常后紧急贴现造成的银行的损失。
在优选的实施方式中,如图5所示,所述S300根据所述用户分类清单向用户终端推送对应的票据产品信息具体包括:
S340:根据所述用户类型和所述用户分类清单确定待推送的目标票据产品。
S350:根据所述用户类型基于所述目标票据产品形成票据产品营销信息并将所述票据产品营销信息推送至用户终端。
具体的,通过聚类得到的联合清单中包括了票据产品的票据贴现意愿和票据贴现成功率的预测值,从而能够更好的选择对应的票据产品向用户推送,进行细化的票据产品营销,提高票据产品交易的成功率。例如,在具体例子中,可根据联合清单选择用户票据贴现意愿和票据贴现成功率的预测值均最高的票据产品向用户推送,若不存在,则可将票据贴现意愿和票据贴现成功率的预测值进行加权求和得到加权值,选择加权值最高的票据产品推送给用户。当然,在实际应用中,本领域技术人员可根据实际需求根据聚类后的结果向用户推送票据产品,本发明对此并不作限定。
其中,可对不同用户类型的用户发送不同的票据产品营销信息,例如该票据产品营销信息中可包括不同的优惠信息,实现细化的票据产品营销,提高获客能力。
基于相同原理,本发明实施例公开了一种票据产品推送装置。如图6所示,本实施例中,所述装置包括第一预测模块11、第二预测模块12和产品推送模块13。
其中,第一预测模块11用于通过第一预设模型基于用户数据进行用户票据贴现意愿预测得到第一清单。
第二预测模块12用于通过第二预设模型基于用户数据进行用户票据贴现成功率预测得到第二清单。
产品推送模块13用于根据第一清单和第二清单对用户进行聚类得到用户分类清单,根据所述用户分类清单向用户终端推送对应的票据产品信息。
在优选的实施方式中,所述第一预测模块11具体用于基于预设的第一特征对所述用户数据进行特征提取得到第一特征向量,所述预设的第一特征包括基础特征、衍生特征和用户特征的至少之一,通过XGBOOST模型基于所述第一特征向量进行用户票据贴现意愿预测得到贴现意愿高于预设贴现意愿标准的第一票据产品与用户的第一清单。
在优选的实施方式中,所述第二预测模块12具体用于基于预设的第二特征对所述用户数据进行特征提取得到第二特征向量,所述预设的第二特征包括基础特征、衍生特征和用户特征的至少之一,通过GBM模型基于所述第二特征向量进行用户票据贴现成功率预测得到贴现成功率高于预设贴现成功率标准的第二票据产品与用户的第二清单。
在优选的实施方式中,所述产品推送模块13具体用于对第一清单和第二清单根据用户进行合并得到联合清单;对所述联合清单中的用户进行聚类得到多个用户类型;基于多个用户类型和所述联合清单得到用户分类清单。
在优选的实施方式中,所述产品推送模块13具体用于确定第一清单和第二清单中的所有用户;统计每个用户在第一清单和第二清单中对应的票据产品;根据所有用户及对应的票据产品得到所述联合清单。
在优选的实施方式中,所述产品推送模块13具体用于通过kmeans聚类模型基于联合清单中用户的用户数据、贴现意愿和贴现成功率的至少之一进行聚类得到多个用户类型,每个用户类型至少包括一个用户。
在优选的实施方式中,所述产品推送模块13具体用于根据所述用户类型和所述用户分类清单确定待推送的目标票据产品;根据所述用户类型基于所述目标票据产品形成票据产品营销信息并将所述票据产品营销信息推送至用户终端。
由于该装置解决问题的原理与以上方法类似,因此本装置的实施可以参见以上的方法的实施,在此不再赘述。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机设备,具体的,计算机设备例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
在一个典型的实例中计算机设备具体包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述方法。
下面参考图7,其示出了适于用来实现本申请实施例的计算机设备700的结构示意图。
如图7所示,计算机设备700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的工作和处理。在RAM703中,还存储有系统700操作所需的各种程序和数据。CPU701、ROM702、以及RAM703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶反馈器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡,调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装如存储部分708。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包括用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由记录“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (11)

1.一种票据产品推送方法,其特征在于,包括:
通过第一预设模型基于用户数据进行用户票据贴现意愿预测得到第一清单;
通过第二预设模型基于用户数据进行用户票据贴现成功率预测得到第二清单;
根据第一清单和第二清单对用户进行聚类得到用户分类清单,根据所述用户分类清单向用户终端推送对应的票据产品信息。
2.根据权利要求1所述的票据产品推送方法,其特征在于,所述通过第一预设模型基于用户数据进行用户票据贴现意愿预测得到第一清单具体包括:
基于预设的第一特征对所述用户数据进行特征提取得到第一特征向量,所述预设的第一特征包括基础特征、衍生特征和用户特征的至少之一;
通过XGBOOST模型基于所述第一特征向量进行用户票据贴现意愿预测得到贴现意愿高于预设贴现意愿标准的第一票据产品与用户的第一清单。
3.根据权利要求1所述的票据产品推送方法,其特征在于,所述通过第二预设模型基于用户数据进行用户票据贴现成功率预测得到第二清单具体包括:
基于预设的第二特征对所述用户数据进行特征提取得到第二特征向量,所述预设的第二特征包括基础特征、衍生特征和用户特征的至少之一;
通过GBM模型基于所述第二特征向量进行用户票据贴现成功率预测得到贴现成功率高于预设贴现成功率标准的第二票据产品与用户的第二清单。
4.根据权利要求1所述的票据产品推送方法,其特征在于,所述根据第一清单和第二清单对用户进行聚类得到用户分类清单具体包括:
对第一清单和第二清单根据用户进行合并得到联合清单;
对所述联合清单中的用户进行聚类得到多个用户类型;
基于多个用户类型和所述联合清单得到用户分类清单。
5.根据权利要求4所述的票据产品推送方法,其特征在于,所述对第一清单和第二清单根据用户进行合并得到联合清单具体包括:
确定第一清单和第二清单中的所有用户;
统计每个用户在第一清单和第二清单中对应的票据产品;
根据所有用户及对应的票据产品得到所述联合清单。
6.根据权利要求4所述的票据产品推送方法,其特征在于,所述对所述联合清单中的用户进行聚类得到多个用户类型具体包括:
通过kmeans聚类模型基于联合清单中用户的用户数据、贴现意愿和贴现成功率的至少之一进行聚类得到多个用户类型,每个用户类型至少包括一个用户。
7.根据权利要求1所述的票据产品推送方法,其特征在于,所述根据所述用户分类清单向用户终端推送对应的票据产品信息具体包括:
根据所述用户类型和所述用户分类清单确定待推送的目标票据产品;
根据所述用户类型基于所述目标票据产品形成票据产品营销信息并将所述票据产品营销信息推送至用户终端。
8.一种票据产品推送装置,其特征在于,包括:
第一预测模块,用于通过第一预设模型基于用户数据进行用户票据贴现意愿预测得到第一清单;
第二预测模块,用于通过第二预设模型基于用户数据进行用户票据贴现成功率预测得到第二清单;
产品推送模块,用于根据第一清单和第二清单对用户进行聚类得到用户分类清单,根据所述用户分类清单向用户终端推送对应的票据产品信息。
9.一种票据产品推送系统,其特征在于,包括票据产品推送装置和用户终端;
其中,所述票据产品推送装置用于通过第一预设模型基于用户数据进行用户票据贴现意愿预测得到第一清单;第二预测模块,用于通过第二预设模型基于用户数据进行用户票据贴现成功率预测得到第二清单;产品推送模块,用于根据第一清单和第二清单对用户进行聚类得到用户分类清单,根据所述用户分类清单向用户终端推送对应的票据产品信息。
10.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述方法。
11.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述方法。
CN202310168388.5A 2023-02-27 2023-02-27 票据产品推送方法、装置及系统 Pending CN116308590A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310168388.5A CN116308590A (zh) 2023-02-27 2023-02-27 票据产品推送方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310168388.5A CN116308590A (zh) 2023-02-27 2023-02-27 票据产品推送方法、装置及系统

Publications (1)

Publication Number Publication Date
CN116308590A true CN116308590A (zh) 2023-06-23

Family

ID=86777218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310168388.5A Pending CN116308590A (zh) 2023-02-27 2023-02-27 票据产品推送方法、装置及系统

Country Status (1)

Country Link
CN (1) CN116308590A (zh)

Similar Documents

Publication Publication Date Title
US20230009149A1 (en) System, method and computer program for underwriting and processing of loans using machine learning
Abdou et al. Neural nets versus conventional techniques in credit scoring in Egyptian banking
Chen Classifying credit ratings for Asian banks using integrating feature selection and the CPDA-based rough sets approach
Alden et al. Detection of financial statement fraud using evolutionary algorithms
JP2003526146A (ja) 評価値を求めてリスクを低減する方法とシステム
CN108492001A (zh) 一种用于担保贷款网络风险管理的方法
Deng et al. An intelligent system for insider trading identification in Chinese security market
CN115526700A (zh) 风险的预测方法、装置及电子设备
Katterbauer et al. A deep learning approach to risk management modeling for Islamic microfinance
Li et al. A semi-parametric ensemble model for profit evaluation and investment decisions in online consumer loans with prepayments
Chen et al. Mixed credit scoring model of logistic regression and evidence weight in the background of big data
CN110910002B (zh) 一种应收账款违约风险识别方法及系统
Cheng et al. A Financial distress pre-warning study by fuzzy regression model of TSE-listed companies
Shah Developing financial distress prediction models using cutting edge recursive partitioning techniques: a study of Australian mining performance
CN116308590A (zh) 票据产品推送方法、装置及系统
Bouazza et al. Datamining for fraud detecting, state of the art
Veres et al. The Concept of Using Artificial Intelligence Methods in Debt Financing of Business Entities.
Aksenov et al. Front-Running Model in the Stock Market
Lee et al. Application of machine learning in credit risk scorecard
Zakowska A New Credit Scoring Model to Reduce Potential Predatory Lending: A Design Science Approach
Liu et al. Research on the identification and prediction of default risk of online lending platform customers
Cheng et al. An attribute selection based classifier to predict financial distress
Pradnyana et al. Loan Default Prediction in Microfinance Group Lending with Machine Learning
Atria et al. COMPARATIVE ANALYSIS OF CLASSIFIER FOR BRI CUSTOMERS PATTERN PREDICTION USING NAIVE BAYES, KNN AND RANDOM FOREST
Chi Managing credit risk and the cost of equity with machine learning techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination