CN113592529B - 债券产品的潜在客户推荐方法和装置 - Google Patents

债券产品的潜在客户推荐方法和装置 Download PDF

Info

Publication number
CN113592529B
CN113592529B CN202110694000.6A CN202110694000A CN113592529B CN 113592529 B CN113592529 B CN 113592529B CN 202110694000 A CN202110694000 A CN 202110694000A CN 113592529 B CN113592529 B CN 113592529B
Authority
CN
China
Prior art keywords
bond
data
historical
target
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110694000.6A
Other languages
English (en)
Other versions
CN113592529A (zh
Inventor
毛贯中
左光远
王建民
赵曦滨
沈恩亚
宋怡然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Bond Jinke Information Technology Co ltd
Tsinghua University
Original Assignee
China Bond Jinke Information Technology Co ltd
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Bond Jinke Information Technology Co ltd, Tsinghua University filed Critical China Bond Jinke Information Technology Co ltd
Priority to CN202110694000.6A priority Critical patent/CN113592529B/zh
Publication of CN113592529A publication Critical patent/CN113592529A/zh
Application granted granted Critical
Publication of CN113592529B publication Critical patent/CN113592529B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种债券产品的潜在客户推荐方法和装置,所述方法包括:根据业务需求确定债券变量,基于债券变量获取目标债券的数据;对目标债券的数据进行第一预处理,得到预处理后的目标债券的数据;将预处理后的目标债券的数据输入构建好的相似债券推荐模型,输出目标债券的相似债券;获取相似债券在目标市场的持有账户以及每个持有账户持有相似债券的数量,并基于每个持有账户持有相似债券的数量,确定目标债券在所述目标市场的潜在客户。本发明能够实现在无客户行为数据和无客户偏好数据的多个债券数据的不同市场的应用场景下为新发债券推荐潜在客户,该相似债券推荐模型可灵活运用于多种推荐场景,普适性较高。

Description

债券产品的潜在客户推荐方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种债券产品的潜在客户推荐方法和装置。
背景技术
相关技术中对新发债券的潜在客户预测是基于一级市场的大客户偏好,对于二级市场的受众客户无法确认,进而不能实现将新发债券推荐给潜在客户。
另外,由于当前场景中包括多个债券产品以及多个客户,并且只产生交易信息数据,缺少其它客户行为数据或客户偏好数据,使得现有的潜在客户推荐系统不适用于当前场景。
综上,相关技术中对于无客户行为数据和无客户偏好数据的多个债券数据的不同市场的应用场景,现有的推荐系统无法实现在不同市场推荐新发债券的潜在客户的问题亟待解决。
发明内容
本发明提供一种债券产品的潜在客户推荐方法和装置,用以解决相关技术中对于无客户行为数据和无客户偏好数据的多个债券数据的不同市场的应用场景,现有的推荐系统无法实现在不同市场推荐新发债券的潜在客户的问题。
第一方面,本发明提供一种债券产品的潜在客户推荐方法,包括:
根据业务需求确定债券变量,基于所述债券变量获取目标债券的数据;
对所述目标债券的数据进行第一预处理,得到预处理后的目标债券的数据;
将所述预处理后的目标债券的数据输入构建好的相似债券推荐模型,输出所述目标债券的相似债券;
获取所述相似债券在目标市场的持有账户以及每个所述持有账户持有所述相似债券的数量,并基于所述每个所述持有账户持有所述相似债券的数量,确定所述目标债券在所述目标市场的潜在客户。
可选地,所述方法还包括:
构建所述相似债券推荐模型;
所述构建所述相似债券推荐模型包括:
基于所述债券变量获取历史债券数据,对所述历史债券数据进行第二预处理,得到预处理后的历史债券数据;
基于预处理后的历史债券数据计算每个债券变量的数据的方差,从所述预处理后的历史债券数据中获取第一历史债券数据作为K维树KDTree的根节点,其中,所述第一历史债券数据与第一债券变量的数据的中位数对应,所述第一债券变量的数据的方差最大;
基于第一历史债券数据将第二历史债券数据分别部署于所述KDTree的子节点;
从所述历史债券数据中随机选取第三历史债券数据,将所述第三历史债券数据输入已部署的KDTree,基于输出结果验证所述已部署的KDTree的准确度;
若所述已部署的KDTree的准确度大于预设阈值,确认所述已部署的KDTree为构建好的相似债券推荐模型。
可选地,所述基于第一历史债券数据将第二历史债券数据分别部署于所述KDTree的子节点,包括:
若所述第二历史债券数据内的第一债券变量的数据小于第一历史债券数据内的第一债券变量的数据,获取所述第二历史债券数据内的第一债券变量的数据的中位数,将所述中位数对应的历史债券数据部署于第二层的左子节点;
若所述第二历史债券数据内的第一债券变量的数据大于第一历史债券数据内的第一债券变量的数据,获取所述第二历史债券数据内的第一债券变量的数据的中位数,将所述中位数对应的历史债券数据部署于第二层的右子节点。
可选地,所述将所述第三历史债券数据输入已部署的KDTree,基于输出结果验证所述已部署的KDTree的准确度,包括:
将第三历史债券数据输入所述已部署的KDTree,所述已部署的KDTree基于欧式距离进行最近邻搜索,输出第一债券数据;
获取所述第一债券数据的持有账户;
获取第三历史债券数据的持有账户,计算所述第三历史债券数据的持有账户与所述第一债券数据的持有账户的重合度;
其中,所述重合度用于指示所述已部署的KDTree的准确度。
可选地,所述基于所述每个账户持有所述相似债券的数量,确定所述目标债券在所述目标市场的潜在客户,包括:
基于所述每个所述持有账户持有所述相似债券的数量,对所述持有账户按照从大到小的顺序进行排序;
确定排序靠前的预设比例的持有账户为所述目标债券在所述目标市场的潜在客户。
可选地,所述对所述历史债券数据进行第二预处理,得到预处理后的历史债券数据,包括:
基于所述债券变量对所述历史债券数据依次进行异常值检测处理、缺失列删除处理、缺失值填充处理、无效债券信息删除处理和相关性计算,得到预处理后的历史债券数据。
可选地,所述债券变量为债券信息和发行方信息中的信息字段,其中,
所述债券信息包括债券代码、债券性质代码、债券期限、付息周期、债券计息方式代码、央行票据互换工具CBS特殊标志、永续债标志、集合债标志、含权标志和债券信用级别代码中的至少一项;
所述发行方信息包括客户性质、法人机构地区和主体信用级别代码中的至少一项。
第二方面,本发明提供一种债券产品的潜在客户推荐装置,包括:
获取单元,用于根据业务需求确定债券变量,基于所述债券变量获取目标债券的数据;
数据预处理单元,用于对所述目标债券的数据进行第一预处理,得到预处理后的目标债券的数据;
推荐单元,用于将所述预处理后的目标债券的数据输入构建好的相似债券推荐模型,输出所述目标债券的相似债券;
确定单元,用于获取所述相似债券在目标市场的持有账户以及每个所述持有账户持有所述相似债券的数量,并基于所述每个所述持有账户持有所述相似债券的数量,确定所述目标债券在所述目标市场的潜在客户。
第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述债券产品的潜在客户推荐方法的步骤。
第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述债券产品的潜在客户推荐方法的步骤。
本发明提供的债券产品的潜在客户推荐方法和装置,根据业务需求确定债券变量,基于债券变量获取目标债券的数据,对目标债券的数据进行第一预处理,得到预处理后的目标债券的数据,将预处理后的目标债券的数据输入构建好的相似债券推荐模型,输出目标债券的相似债券,获取相似债券在目标市场的持有账户以及每个持有账户持有所述相似债券的数量,并基于每个持有账户持有相似债券的数量,确定目标债券在所述目标市场的潜在客户,实现了在无客户行为数据和无客户偏好数据的多个债券数据的不同市场的应用场景下,为新发债券推荐潜在客户,该相似债券推荐模型可灵活运用于多种推荐场景,普适性较高。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的债券产品的潜在客户推荐方法的流程示意图;
图2是本发明提供的构建相似债券推荐模型的流程示意图;
图3是本发明提供的债券产品的潜在客户推荐装置的结构示意图;
图4是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
应理解,说明书中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。
本发明实施例中术语“多个”是指两个或两个以上,其它量词与之类似。
下面结合附图,通过一些实施例及其应用场景对本发明实施例提供的债券产品的潜在客户推荐方法进行详细地说明。本发明实施例提供的债券产品的潜在客户推荐方法,执行主体为电子设备,本发明实施例提及的电子设备包括但不限于手机、平板电脑、电脑、可穿戴设备等。
为了解决相关技术中对于无客户行为数据和无客户偏好数据的多个债券数据的不同市场的应用场景,现有的推荐系统无法实现在不同市场推荐新发债券的潜在客户的问题,本发明实施例提供一种债券产品的潜在客户推荐方法,图1是本发明实施例提供的债券产品的潜在客户推荐方法的流程示意图。如图1所示,该方法包括以下步骤:
步骤100、根据业务需求确定债券变量,基于所述债券变量获取目标债券的数据。
在本发明实施例中,业务需求为在无客户行为数据和无客户偏好数据的多个债券数据的不同市场的应用场景下,为目标债券推荐潜在客户。
可选地,所述债券变量为债券信息和发行发信息中的信息字段,其中,
所述债券信息包括债券代码、债券性质代码、债券期限、付息周期、债券计息方式代码、央行票据互换工具(Central Bank Bills Swap,CBS)特殊标志、永续债标志、集合债标志、含权标志和债券信用级别代码中的至少一项;
所述发行方信息包括客户性质、法人机构地区和主体信用级别代码中的至少一项。
其中,目标债券为一个或多个新发债券。
在本发明实施例中,根据业务需求从上述债券信息和发行方信息中确定债券变量,例如,根据业务需求选取当前场景较为重要的变量作为债券变量,如债券性质代码、债券期限、付息周期、债券信用级别代码及客户性质等。
然后,基于所确定的债券变量从数据库中获取目标债券的数据,例如,若债券变量包括债券性质代码、债券期限、付息周期、债券信用级别代码及客户性质等,则从数据库中获取新发债券的债券性质代码、债券期限、付息周期、债券信用级别代码和客户性质等数据。
步骤101、对所述目标债券的数据进行第一预处理,得到预处理后的目标债券的数据。
需要说明的是,为了提高目标债券的数据的质量,便于后续输入到相似债券推荐模型输出相似债券,需要对目标债券的数据进行第一预处理。
一种实施方式中,第一预处理的过程为对目标债券的数据中的缺失值采用0补齐。
一种实施方式中,基于债券变量对目标债券的数据进行第一预处理,得到预处理后的目标债券的数据,其中,目标债券的数据中的缺失值采用0补齐。
步骤102、将所述预处理后的目标债券的数据输入构建好的相似债券推荐模型,输出所述目标债券的相似债券。
其中,相似债券推荐模型是基于经过预处理的历史债券数据构建得到。
相似债券推荐模型用于输出与预处理后的目标债券的数据的欧式距离最近的历史债券,将该与预处理后的目标债券的数据的欧式距离最近的历史债券作为所述目标债券的相似债券。
步骤103、获取所述相似债券在目标市场的持有账户以及每个所述持有账户持有所述相似债券的数量,并基于所述每个所述持有账户持有所述相似债券的数量,确定所述目标债券在所述目标市场的潜在客户。
目标市场包括一级市场和二级市场。
其中,一级市场为债权债务登记日当天的市场,二级市场为债权债务登记日之后的市场。
所述相似债券在目标市场的持有账户表示在目标市场持有该相似债券的至少一个账户。
在一实施例中,获取该相似债券在目标市场的持有账户以及每个持有账户持有该相似债券的数量,然后根据每个持有账户持有该相似债券的数量,从持有账户中选取持有该相似债券的数量较多(超过预设阈值)的账户,作为所述目标债券在所述目标市场的潜在客户。
可选地,所述基于所述每个所述持有账户持有所述相似债券的数量,确定所述目标债券在所述目标市场的潜在客户,包括:
基于所述每个所述持有账户持有所述相似债券的数量,对所述持有账户按照从大到小的顺序进行排序;
确定排序靠前的预设比例的持有账户为所述目标债券在所述目标市场的潜在客户。
一种实施方式中,获取该相似债券在目标市场的全部持有账户,并获取每个持有账户持有该相似债券的数量,根据每个持有账户持有该相似债券的数量,对全部持有账户按照从大到小的顺序进行排序,确定排序靠前的预设比例的持有账户为目标债券在目标市场的潜在客户。
本发明实施例提供的债券产品的潜在客户推荐方法,根据业务需求确定债券变量,基于债券变量获取目标债券的数据,对目标债券的数据进行预处理,得到预处理后的目标债券的数据,将预处理后的目标债券的数据输入构建好的相似债券推荐模型,输出目标债券的相似债券,获取相似债券在目标市场的持有账户以及每个持有账户持有所述相似债券的数量,并基于每个持有账户持有相似债券的数量,确定目标债券在所述目标市场的潜在客户,实现了在无客户行为数据和无客户偏好数据的多个债券数据的不同市场的应用场景下为新发债券推荐潜在客户,该相似债券推荐模型可灵活运用于多种推荐场景,普适性较高。
基于上述实施例的内容,所述方法还包括:
构建所述相似债券推荐模型。
图2是本发明实施例提供的构建相似债券推荐模型的流程示意图。如图2所示,所述构建所述相似债券推荐模型包括:
步骤200、基于所述债券变量获取历史债券数据,对所述历史债券数据进行第二预处理,得到预处理后的历史债券数据。
步骤201、基于预处理后的历史债券数据计算每个债券变量的数据的方差,从所述预处理后的历史债券数据中获取第一历史债券数据作为K维树KDTree的根节点,其中,所述第一历史债券数据与第一债券变量的数据的中位数对应,所述第一债券变量的数据的方差最大。
步骤202、基于第一历史债券数据将第二历史债券数据分别部署于所述KDTree的子节点。
步骤203、从所述历史债券数据中随机选取第三历史债券数据,将所述第三历史债券数据输入已部署的KDTree,基于输出结果验证所述已部署的KDTree的准确度。
步骤204、若所述已部署的KDTree的准确度大于预设阈值,确认所述已部署的KDTree为构建好的相似债券推荐模型。
K维树(K-Dimensional Tree,KDTree)是一种对K维空间中的实例点进行存储以便对其进行快速检索的树形数据结构,其中,KDTree是二进制空间分割树的特殊情况。
需要说明的是,为了提高历史债券数据的质量,便于构建合理的相似债券推荐模型,需要对历史债券数据进行第二预处理。
一种实施方式中,第二预处理包括异常值检测处理、缺失列删除处理、缺失值填充处理、无效债券信息删除处理和相关性计算。
进一步地,对历史债券数据依次进行异常值检测处理、缺失列删除处理、缺失值填充处理、无效债券信息删除处理和相关性计算,得到预处理后的历史债券数据,其中,历史债券数据中各个债券变量的数据之间相互独立,互不干扰。
需要说明的是,第一历史债券数据、第二历史债券数据和第三历史债券数据均不相同。
其中,第三历史债券数据表示一个或多个历史债券数据。
输出结果为在已部署的KDTree中第三历史债券数据的相似债券。
可选地,所述基于第一历史债券数据将第二历史债券数据分别部署于所述KDTree的子节点,包括:
若所述第二历史债券数据内的第一债券变量的数据小于第一历史债券数据内的第一债券变量的数据,获取所述第二历史债券数据内的第一债券变量的数据的中位数,将所述中位数对应的历史债券数据部署于第二层的左子节点;
若所述第二历史债券数据内的第一债券变量的数据大于第一历史债券数据内的第一债券变量的数据,获取所述第二历史债券数据内的第一债券变量的数据的中位数,将所述中位数对应的历史债券数据部署于第二层的右子节点。
结合案例具体说明构建相似债券推荐模型的过程。
例如,基于债券变量A、债券变量B和债券变量C从数据库中获取历史债券数据,该历史债券数据可采用三维空间坐标系中的坐标点(x,y,z)结构表示,依次为(2,0,3)、(1,6,2)、(1,4,2)、(3,1,5)、(2,8,3)、(2,7,1)和(5,2,3),其中历史债券数据中x轴对应的数据表示债券变量A的数据,历史债券数据中y轴对应的数据表示债券变量B的数据,历史债券数据中z轴对应的数据表示债券变量C的数据,分别计算每个债券变量的数据的方差,得到债券变量A的数据的方差为3.536,债券变量B的数据的方差为17.776,债券变量C的数据的方差为3.536,确认债券变量B的数据的方差最大,则债券变量B的数据的中位数对应的债券数据(1,4,2)部署于根节点。
进一步地,基于债券变量B的数据的中位数将其它历史债券数据进行划分,得到小于该中位数的债券变量B的数据对应的历史债券数据为(2,0,3)、(3,1,5)和(5,2,3),选取这些历史债券数据内债券变量B的数据的中位数对应的历史债券数据(3,1,5)作为第二层左子节点,同样的,(2,0,3)作为第二层左子节点对应的第三层左子节点,(5,2,3)作为第二层左子节点对应的第三层右子节点。
进一步地,基于债券变量B的数据的中位数将其它历史债券数据进行划分,得到大于该中位数的债券变量B的数据对应的历史债券数据为(1,6,2)、(2,7,1)和(2,8,3),选取这些历史债券数据内债券变量B的数据的中位数对应的历史债券数据(2,7,1)作为第二层右子节点,同样的,(1,6,2)作为第二层右子节点对应的第三层左子节点,(2,8,3)作为第二层右子节点对应的第三层右子节点。
本发明实施例提供的债券产品的潜在客户推荐方法,将第一历史债券数据作为KDTree的根节点,将第二历史债券数据部署于KDTree的子节点,基于第三历史债券数据验证已部署的KDTree,若验证通过,确认已部署的KDTree为构建好的相似债券推荐模型,根据构建好的相似债券推荐模型,能够实现在无客户行为数据和无客户偏好数据的多个债券数据的不同市场的应用场景下,为新发债券推荐潜在客户,该相似债券推荐模型可灵活运用于多种推荐场景,普适性较高。
基于上述实施例的内容,所述将所述第三历史债券数据输入已部署的KDTree,基于输出结果验证所述已部署的KDTree的准确度,包括:
将第三历史债券数据输入所述已部署的KDTree,所述已部署的KDTree基于欧式距离进行最近邻搜索,输出第一债券数据;
获取所述第一债券数据的持有账户;
获取第三历史债券数据的持有账户,计算所述第三历史债券数据的持有账户与所述第一债券数据的持有账户的重合度;
其中,所述重合度用于指示所述已部署的KDTree的准确度。
最近邻搜索的原理是:若第三历史债券数据内第一债券变量的数据小于或等于根节点中第一债券变量的数据,在左子树分枝进行搜索,若第三历史债券数据内第一债券变量的数据大于根节点中第一债券变量的数据,在右子树分枝进行搜索,对于每一层子节点,重复上述步骤,直至找到最近邻的子节点对应的历史债券数据作为输出结果。
其中,计算第三历史债券数据与已部署的KDTree内每个节点对应的历史债券数据的欧式距离,根据欧式距离对每个节点对应的历史债券数据按照从小到大的顺序进行排序,获取排名靠前的预设数量的历史债券数据,确认该历史债券数据作为输出结果。
利用公式(1)计算第三历史债券数据的持有账户与第一债券数据的持有账户的重合度:
其中,n表示第三历史债券数据与第一债券数据共同的持有账户,n1表示第三历史债券数据的持有账户,n2表示第一债券数据的持有账户,δ表示第三历史债券数据的持有账户与第一债券数据的持有账户的重合度。
本发明实施例提供的债券产品的潜在客户推荐方法,将第三历史债券数据输入已部署的KDTree,输出第一债券数据,计算第一债数据的持有账户与第三债券数据的持有账户的重合度,即确定已部署的KDTree的准确度,进而根据已部署的KDTree的准确度构建相似债券推荐模型,进而实现在无客户行为数据和无客户偏好数据的多个债券数据的不同市场的应用场景下为新发债券推荐潜在客户。
基于上述实施例的内容,所述对所述历史债券数据进行第二预处理,得到预处理后的历史债券数据,包括:
基于所述债券变量对所述历史债券数据依次进行异常值检测处理、缺失列删除处理、缺失值填充处理、无效债券信息删除处理和相关性计算,得到预处理后的历史债券数据。
异常值检测处理用于对历史债券数据内每个债券变量的数据进行异常值检测,若该债券变量的数据为无效债券信息,对该债券变量的数据进行无效债券信息删除,若该债券变量的数据为缺失值,对该债券变量进行缺失列删除或缺失值填充。
缺失列删除处理用于在历史债券数据内某个债券变量的数据缺失数量超过第一预设阈值的情况下,将该债券变量的全部数据删除。
例如,在历史债券数据内某个债券变量的数据缺失数量超过60%的情况下,将该债券变量的全部数据删除。
缺失值填充处理用于在历史债券数据内某个债券变量的数据缺失数量未超过预设阈值的情况下,对该债券变量的空缺数据进行高频数据填充或均值填充。
高频数据填充表示将该债券变量的全部数据中出现频率最高的数据用于填充该债券变量的空缺数据。
均值填充表示将该债券变量的全部数据的平均值用于填充该债券变量的空缺数据。
无效债券信息删除处理用于在历史债券数据内某个债券变量的数据的重复率超过第二预设阈值的情况下,将该债券变量的全部数据删除。
例如,在历史债券数据内某个债券变量的数据的重复率超过80%的情况下,将该债券变量的全部数据删除。
利用公式(2)计算历史债券数据内任意两个债券变量的全部数据的相关系数:
其中,x表示历史债券数据内第二债券变量的数据,表示历史债券数据内第二债券变量的全部数据的平均值,y表示历史债券数据内第三债券变量的数据,/>表示历史债券数据内第二债券变量的全部数据的平均值,R2表示第二债券变量的数据与第三债券变量的数据的相关系数,满足R2∈[0,1]。
进一步地,若R2>0.5,则第二债券变量的数据与第二债券变量的数据的相关程度较高,删除历史债券数据内的第二债券变量的全部数据或第三债券变量的全部债券数据,得到预处理后的历史债券数据。
需要说明的是,第二债券变量与第三债券变量不同。
本发明实施例提供的债券产品的潜在客户推荐方法,基于债券变量对历史债券数据依次进行异常值检测处理、缺失列删除处理、缺失值填充处理、无效债券信息删除处理和相关性计算,得到预处理后的历史债券数据,进而基于预处理后的历史债券数据构建相似债券推荐模型,根据构建好的相似债券推荐模型,能够实现在无客户行为数据和无客户偏好数据的多个债券数据的不同市场的应用场景下,为新发债券推荐潜在客户。
下面对本发明提供的债券产品的潜在客户推荐装置进行描述,下文描述的债券产品的潜在客户推荐装置与上文描述的债券产品的潜在客户推荐方法可相互对应参照。
图3是本发明实施例提供的债券产品的潜在客户推荐装置的结构示意图。如图3所示,该债券产品的潜在客户推荐装置包括:获取单元310、数据预处理单元320、推荐单元330和确定单元340,其中,
获取单元310,用于根据业务需求确定债券变量,基于所述债券变量获取目标债券的数据;
数据预处理单元320,用于对所述目标债券的数据进行第一预处理,得到预处理后的目标债券的数据;
推荐单元330,用于将所述预处理后的目标债券的数据输入构建好的相似债券推荐模型,输出所述目标债券的相似债券;
确定单元340,用于获取所述相似债券在目标市场的持有账户以及每个所述持有账户持有所述相似债券的数量,并基于所述每个所述持有账户持有所述相似债券的数量,确定所述目标债券在所述目标市场的潜在客户。
本发明实施例提供的债券产品的潜在客户推荐装置,根据业务需求确定债券变量,基于债券变量获取目标债券的数据,对目标债券的数据进行第一预处理,得到预处理后的目标债券的数据,将预处理后的目标债券的数据输入构建好的相似债券推荐模型,输出目标债券的相似债券,获取相似债券在目标市场的持有账户以及每个持有账户持有所述相似债券的数量,并基于每个持有账户持有相似债券的数量,确定目标债券在所述目标市场的潜在客户,实现了在无客户行为数据和无客户偏好数据的多个债券数据的不同市场的应用场景下为新发债券推荐潜在客户,该相似债券推荐模型可灵活运用于多种推荐场景,普适性较高。
可选地,该装置还包括:
模型构建单元,用于构建所述相似债券推荐模型;
所述模型构建单元,具体用于:
基于所述债券变量获取历史债券数据,对所述历史债券数据进行第二预处理,得到预处理后的历史债券数据;
基于预处理后的历史债券数据计算每个债券变量的数据的方差,从所述预处理后的历史债券数据中获取第一历史债券数据作为K维树KDTree的根节点,其中,所述第一历史债券数据与第一债券变量的数据的中位数对应,所述第一债券变量的数据的方差最大;
基于第一历史债券数据将第二历史债券数据分别部署于所述KDTree的子节点;
从所述历史债券数据中随机选取第三历史债券数据,将所述第三历史债券数据输入已部署的KDTree,基于输出结果验证所述已部署的KDTree的准确度;
若所述已部署的KDTree的准确度大于预设阈值,确认所述已部署的KDTree为构建好的相似债券推荐模型。
可选地,所述基于第一历史债券数据将第二历史债券数据分别部署于所述KDTree的子节点,包括:
若所述第二历史债券数据内的第一债券变量的数据小于第一历史债券数据内的第一债券变量的数据,获取所述第二历史债券数据内的第一债券变量的数据的中位数,将所述中位数对应的历史债券数据部署于第二层的左子节点;
若所述第二历史债券数据内的第一债券变量的数据大于第一历史债券数据内的第一债券变量的数据,获取所述第二历史债券数据内的第一债券变量的数据的中位数,将所述中位数对应的历史债券数据部署于第二层的右子节点。
可选地,所述将所述第三历史债券数据输入已部署的KDTree,基于输出结果验证所述已部署的KDTree的准确度,包括:
将第三历史债券数据输入所述已部署的KDTree,所述已部署的KDTree基于欧式距离进行最近邻搜索,输出第一债券数据;
获取所述第一债券数据的持有账户;
获取第三历史债券数据的持有账户,计算所述第三历史债券数据的持有账户与所述第一债券数据的持有账户的重合度;
其中,所述重合度用于指示所述已部署的KDTree的准确度。
可选地,所述确定单元340,还用于:
基于所述每个所述持有账户持有所述相似债券的数量,对所述持有账户按照从大到小的顺序进行排序;
确定排序靠前的预设比例的持有账户为所述目标债券在所述目标市场的潜在客户。
可选地,所述数据预处理单元320,具体用于:
基于所述债券变量对所述历史债券数据依次进行异常值检测处理、缺失列删除处理、缺失值填充处理、无效债券信息删除处理和相关性计算,得到预处理后的历史债券数据。
可选地,所述债券变量为债券信息和发行方信息中的信息字段,其中,
所述债券信息包括债券代码、债券性质代码、债券期限、付息周期、债券计息方式代码、央行票据互换工具CBS特殊标志、永续债标志、集合债标志、含权标志和债券信用级别代码中的至少一项;
所述发行方信息包括客户性质、法人机构地区和主体信用级别代码中的至少一项。
本发明提供的债券产品的潜在客户推荐装置能够实现图1至图2的方法实施例实现的各个过程,并达到相同的技术效果,为避免重复,这里不再赘述。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行债券产品的潜在客户推荐方法,该方法包括:
根据业务需求确定债券变量,基于所述债券变量获取目标债券的数据;
对所述目标债券的数据进行第一预处理,得到预处理后的目标债券的数据;
将所述预处理后的目标债券的数据输入构建好的相似债券推荐模型,输出所述目标债券的相似债券;
获取所述相似债券在目标市场的持有账户以及每个所述持有账户持有所述相似债券的数量,并基于所述每个所述持有账户持有所述相似债券的数量,确定所述目标债券在所述目标市场的潜在客户。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的债券产品的潜在客户推荐方法,该方法包括:
根据业务需求确定债券变量,基于所述债券变量获取目标债券的数据;
对所述目标债券的数据进行第一预处理,得到预处理后的目标债券的数据;
将所述预处理后的目标债券的数据输入构建好的相似债券推荐模型,输出所述目标债券的相似债券;
获取所述相似债券在目标市场的持有账户以及每个所述持有账户持有所述相似债券的数量,并基于所述每个所述持有账户持有所述相似债券的数量,确定所述目标债券在所述目标市场的潜在客户。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的债券产品的潜在客户推荐方法,该方法包括:
根据业务需求确定债券变量,基于所述债券变量获取目标债券的数据;
对所述目标债券的数据进行第一预处理,得到预处理后的目标债券的数据;
将所述预处理后的目标债券的数据输入构建好的相似债券推荐模型,输出所述目标债券的相似债券;
获取所述相似债券在目标市场的持有账户以及每个所述持有账户持有所述相似债券的数量,并基于所述每个所述持有账户持有所述相似债券的数量,确定所述目标债券在所述目标市场的潜在客户。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种债券产品的潜在客户推荐方法,其特征在于,包括:
根据业务需求确定债券变量,基于所述债券变量获取目标债券的数据;
对所述目标债券的数据进行第一预处理,得到预处理后的目标债券的数据;
将所述预处理后的目标债券的数据输入构建好的相似债券推荐模型,输出所述目标债券的相似债券;
获取所述相似债券在目标市场的持有账户以及每个所述持有账户持有所述相似债券的数量,并基于所述每个所述持有账户持有所述相似债券的数量,确定所述目标债券在所述目标市场的潜在客户;
还包括:构建所述相似债券推荐模型;
所述构建所述相似债券推荐模型包括:
基于所述债券变量获取历史债券数据,对所述历史债券数据进行第二预处理,得到预处理后的历史债券数据;
基于预处理后的历史债券数据计算每个债券变量的数据的方差,从所述预处理后的历史债券数据中获取第一历史债券数据作为K维树KDTree的根节点,其中,所述第一历史债券数据与第一债券变量的数据的中位数对应,所述第一债券变量的数据的方差最大;
基于第一历史债券数据将第二历史债券数据分别部署于所述KDTree的子节点;
从所述历史债券数据中随机选取第三历史债券数据,将所述第三历史债券数据输入已部署的KDTree,基于输出结果验证所述已部署的KDTree的准确度;
若所述已部署的KDTree的准确度大于预设阈值,确认所述已部署的KDTree为构建好的相似债券推荐模型。
2.根据权利要求1所述的债券产品的潜在客户推荐方法,其特征在于,所述基于第一历史债券数据将第二历史债券数据分别部署于所述KDTree的子节点,包括:
若所述第二历史债券数据内的第一债券变量的数据小于第一历史债券数据内的第一债券变量的数据,获取所述第二历史债券数据内的第一债券变量的数据的中位数,将所述中位数对应的历史债券数据部署于第二层的左子节点;
若所述第二历史债券数据内的第一债券变量的数据大于第一历史债券数据内的第一债券变量的数据,获取所述第二历史债券数据内的第一债券变量的数据的中位数,将所述中位数对应的历史债券数据部署于第二层的右子节点。
3.根据权利要求1所述的债券产品的潜在客户推荐方法,其特征在于,所述将所述第三历史债券数据输入已部署的KDTree,基于输出结果验证所述已部署的KDTree的准确度,包括:
将第三历史债券数据输入所述已部署的KDTree,所述已部署的KDTree基于欧式距离进行最近邻搜索,输出第一债券数据;
获取所述第一债券数据的持有账户;
获取第三历史债券数据的持有账户,计算所述第三历史债券数据的持有账户与所述第一债券数据的持有账户的重合度;
其中,所述重合度用于指示所述已部署的KDTree的准确度。
4.根据权利要求1所述的债券产品的潜在客户推荐方法,其特征在于,所述基于所述每个所述持有账户持有所述相似债券的数量,确定所述目标债券在所述目标市场的潜在客户,包括:
基于所述每个所述持有账户持有所述相似债券的数量,对所述持有账户按照从大到小的顺序进行排序;
确定排序靠前的预设比例的持有账户为所述目标债券在所述目标市场的潜在客户。
5.根据权利要求1所述的债券产品的潜在客户推荐方法,其特征在于,所述对所述历史债券数据进行第二预处理,得到预处理后的历史债券数据,包括:
基于所述债券变量对所述历史债券数据依次进行异常值检测处理、缺失列删除处理、缺失值填充处理、无效债券信息删除处理和相关性计算,得到预处理后的历史债券数据。
6.根据权利要求1所述的债券产品的潜在客户推荐方法,其特征在于,所述债券变量为债券信息和发行方信息中的信息字段,其中,
所述债券信息包括债券代码、债券性质代码、债券期限、付息周期、债券计息方式代码、央行票据互换工具CBS特殊标志、永续债标志、集合债标志、含权标志和债券信用级别代码中的至少一项;
所述发行方信息包括客户性质、法人机构地区和主体信用级别代码中的至少一项。
7.一种债券产品的潜在客户推荐装置,其特征在于,包括:
获取单元,用于根据业务需求确定债券变量,基于所述债券变量获取目标债券的数据;
数据预处理单元,用于对所述目标债券的数据进行第一预处理,得到预处理后的目标债券的数据;
推荐单元,用于将所述预处理后的目标债券的数据输入构建好的相似债券推荐模型,输出所述目标债券的相似债券;
确定单元,用于获取所述相似债券在目标市场的持有账户以及每个所述持有账户持有所述相似债券的数量,并基于所述每个所述持有账户持有所述相似债券的数量,确定所述目标债券在所述目标市场的潜在客户;
还包括:构建所述相似债券推荐模型;
所述构建所述相似债券推荐模型包括:
基于所述债券变量获取历史债券数据,对所述历史债券数据进行第二预处理,得到预处理后的历史债券数据;
基于预处理后的历史债券数据计算每个债券变量的数据的方差,从所述预处理后的历史债券数据中获取第一历史债券数据作为K维树KDTree的根节点,其中,所述第一历史债券数据与第一债券变量的数据的中位数对应,所述第一债券变量的数据的方差最大;
基于第一历史债券数据将第二历史债券数据分别部署于所述KDTree的子节点;
从所述历史债券数据中随机选取第三历史债券数据,将所述第三历史债券数据输入已部署的KDTree,基于输出结果验证所述已部署的KDTree的准确度;
若所述已部署的KDTree的准确度大于预设阈值,确认所述已部署的KDTree为构建好的相似债券推荐模型。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述债券产品的潜在客户推荐方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述债券产品的潜在客户推荐方法的步骤。
CN202110694000.6A 2021-06-22 2021-06-22 债券产品的潜在客户推荐方法和装置 Active CN113592529B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110694000.6A CN113592529B (zh) 2021-06-22 2021-06-22 债券产品的潜在客户推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110694000.6A CN113592529B (zh) 2021-06-22 2021-06-22 债券产品的潜在客户推荐方法和装置

Publications (2)

Publication Number Publication Date
CN113592529A CN113592529A (zh) 2021-11-02
CN113592529B true CN113592529B (zh) 2023-11-21

Family

ID=78244253

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110694000.6A Active CN113592529B (zh) 2021-06-22 2021-06-22 债券产品的潜在客户推荐方法和装置

Country Status (1)

Country Link
CN (1) CN113592529B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985935A (zh) * 2018-07-06 2018-12-11 兴业证券股份有限公司 金融产品推荐方法及存储介质
US10204359B1 (en) * 2016-01-08 2019-02-12 Adnoli LLC System and method for determining purchase records of mobile devices to provide effective mobile advertising
CN110969516A (zh) * 2019-12-25 2020-04-07 清华大学 一种商品推荐方法及装置
CN111931039A (zh) * 2020-06-28 2020-11-13 重庆锐云科技有限公司 潜在客户推荐方法、装置、计算机设备及存储介质
CN112463952A (zh) * 2020-12-22 2021-03-09 安徽商信政通信息技术股份有限公司 一种基于近邻搜索的新闻文本聚合方法及系统
CN112581226A (zh) * 2020-12-21 2021-03-30 中国工商银行股份有限公司 产品推荐方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10204359B1 (en) * 2016-01-08 2019-02-12 Adnoli LLC System and method for determining purchase records of mobile devices to provide effective mobile advertising
CN108985935A (zh) * 2018-07-06 2018-12-11 兴业证券股份有限公司 金融产品推荐方法及存储介质
CN110969516A (zh) * 2019-12-25 2020-04-07 清华大学 一种商品推荐方法及装置
CN111931039A (zh) * 2020-06-28 2020-11-13 重庆锐云科技有限公司 潜在客户推荐方法、装置、计算机设备及存储介质
CN112581226A (zh) * 2020-12-21 2021-03-30 中国工商银行股份有限公司 产品推荐方法及系统
CN112463952A (zh) * 2020-12-22 2021-03-09 安徽商信政通信息技术股份有限公司 一种基于近邻搜索的新闻文本聚合方法及系统

Also Published As

Publication number Publication date
CN113592529A (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
CN109614238B (zh) 一种目标对象识别方法、装置、系统及可读存储介质
CN110659318B (zh) 基于大数据的策略推送方法、系统及计算机设备
CN111382956A (zh) 企业集团关系的挖掘方法和装置
CN107679059B (zh) 业务模板的匹配方法、装置、计算机设备及存储介质
CN108256810B (zh) 保险业务审批流程处理方法和装置
CN109949154A (zh) 客户信息分类方法、装置、计算机设备和存储介质
CN108257033A (zh) 一种保单分析方法、装置、终端设备及存储介质
CN113297435B (zh) 一种基于基因码的物资管理方法和系统
CN112989059A (zh) 潜在客户识别方法及装置、设备及可读计算机存储介质
CN109740129A (zh) 基于区块链的报表生成方法、装置、设备及可读存储介质
CN116401379A (zh) 金融产品数据推送方法、装置、设备及存储介质
CN104573132B (zh) 歌曲查找方法及装置
CN113592529B (zh) 债券产品的潜在客户推荐方法和装置
CN112148880A (zh) 一种客服对话语料聚类方法、系统、设备及存储介质
CN110941638B (zh) 应用分类规则库构建方法、应用分类方法及装置
CN113468886B (zh) 工单处理方法、装置及计算机设备
CN109324963A (zh) 自动测试收益结果的方法及终端设备
CN112507725B (zh) 金融信息的静态发布方法、装置、设备及存储介质
CN114254617A (zh) 一种修订条款的方法、装置、计算设备及存储介质
CN113448876A (zh) 一种业务测试方法、装置、计算机设备及存储介质
CN109783559B (zh) 房产交易数据的获取方法、装置、电子设备以及存储介质
CN108257328A (zh) 金融设备取款业务处理方法、金融设备及计算机可读存储介质
US20230274304A1 (en) Merging a two or more multi-level user structures into a multi-line user structure and simulating sponsorship of new members
CN116975774A (zh) 机构名称融合方法、终端设备及计算机可读存储介质
CN115545888A (zh) 策略生成方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant