CN115619571A - 一种理财规划方法、系统及装置 - Google Patents

一种理财规划方法、系统及装置 Download PDF

Info

Publication number
CN115619571A
CN115619571A CN202211313530.2A CN202211313530A CN115619571A CN 115619571 A CN115619571 A CN 115619571A CN 202211313530 A CN202211313530 A CN 202211313530A CN 115619571 A CN115619571 A CN 115619571A
Authority
CN
China
Prior art keywords
data
service
client
model
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211313530.2A
Other languages
English (en)
Inventor
徐峰
潘晓明
齐爽
孙少波
周佳琪
徐野
李玉功
鲍传松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaan Securities Co ltd
Original Assignee
Huaan Securities Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaan Securities Co ltd filed Critical Huaan Securities Co ltd
Priority to CN202211313530.2A priority Critical patent/CN115619571A/zh
Publication of CN115619571A publication Critical patent/CN115619571A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Operations Research (AREA)
  • General Physics & Mathematics (AREA)
  • Technology Law (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种理财规划方法、系统及装置,属于数据处理技术领域,方法包括:基于理财意向预测模型从客户行为数据中确定目标客户;基于服务推送模型向目标客户推送理财服务推荐信息;基于风险评估模型确定目标客户标签画像对应的风险等级;基于预设深度投资模型输出理财服务配置信息对应的资产配置结果;基于资讯分类评级模型对资讯数据进行分类,输出服务评级结果。本发明通过提出针对客户理财全生命周期提出的全面理财规划方法,实现了理财规划全流程自动化和智能化的创新。

Description

一种理财规划方法、系统及装置
技术领域
本发明涉及数据处理技术领域,尤其涉及一种理财规划方法、系统及装置。
背景技术
随着人们理财意识的逐渐增强,越来越多的人开始关注各种类型的理财方法和对应的理财产品。
当前的传统理财规划分为两种,一种是传统理财规划业务,其发展较为平缓,主要是理财经理为客户提供线下一对一定制化的理财服务;另一种是半智能化的理财规划,核心思想是将理财规划服务移植到线上,通过线上问卷的形式对客户进行信息收集、分析、自动化匹配,各种新兴技术开始逐步渗透到整个业务流程的构建中。随着理财市场规模不断壮大,传统的理财规划技术已无法覆盖因持续大量增长的理财资产规模和多样化的理财服务所带来的新需求。同时,投资者对于资产配置的需求日益旺盛,而且面临着可供挑选的投资品种越来越多,大多数投资者识别难、选择难和配置难的问题普遍存在,而传统理财规划技术为投资者提供的帮助有限。
可以看出,现有的理财规划方法已不能满足人们的理财需求,存在专业性参差不齐,存在着服务差异、供需失衡及过度依赖用户认知等问题;还存在理财规划过程比较粗略,没有做到理财业务模式的全流程自动化、智能化,用户体验较差;在客户理财规划中的理财意向不明确、触达服务不精准、风险不匹配、投资模型不健全、资讯繁杂等问题普遍存在;对用户的判断主要依赖用户自己的描述,但大部分理财用户的金融知识专业度不足,极易造成提供的服务与用户实际需求不匹配等问题。
因此,需要提出更智能、更普及和更个性化的智能理财规划技术。
发明内容
本发明提供一种理财规划方法、系统及装置,用以解决现有技术中理财规划方法存在专业性不足、无法精准获知客户需求以及理财全流程规划客户体验差的缺陷。
第一方面,本发明提供一种理财规划方法,包括:
获取客户行为数据,基于理财意向预测模型从所述客户行为数据中确定目标客户;
确定所述目标客户的推送服务类型,基于服务推送模型向所述目标客户推送理财服务推荐信息;
获取目标客户标签画像,基于风险评估模型确定所述目标客户标签画像对应的风险等级;
利用所述目标客户标签画像得到理财服务配置信息,基于预设深度投资模型输出所述理财服务配置信息对应的资产配置结果;
对所述资产配置结果进行服务跟踪处理获得资讯数据。
第二方面,本发明还提供一种理财规划系统,包括:
客户挖掘单元,用于获取客户行为数据,基于理财意向预测模型从所述客户行为数据中确定目标客户;
客户触达单元,用于确定所述目标客户的推送服务类型,基于服务推送模型向所述目标客户推送理财服务推荐信息;
客户分析单元,用于获取目标客户标签画像,基于风险评估模型确定所述目标客户标签画像对应的风险等级;
理财服务单元,用于利用所述目标客户标签画像得到理财服务配置信息,基于预设深度投资模型输出所述理财服务配置信息对应的资产配置结果;
跟踪服务单元,用于对所述资产配置结果进行服务跟踪处理获得资讯数据。
第三方面,本发明还提供一种理财规划装置,包括:自上而下依次进行连接的客户端模块、应用服务模块、算法模型模块、计算引擎模块和数据存储模块:
所述客户端模块向客户呈现理财规划推荐信息,以及向客户提供操作界面;
所述应用服务模块将所述算法模型模块的算法封装为对外服务接口,所述应用服务模块通过服务编排完成服务协同工作,所述应用服务模块通过服务管理提供服务注册、服务发现、服务上下架和服务鉴权,所述应用服务模块通过服务监控提供告警信息;
所述算法模型模块对数据进行清洗加工转换为算法输入数据,将算法数据数据输入至构建的模型,对所述构建的模型进行模型训练后得到算法模型并保存所述算法模型,由所述算法模型向上层提供服务接口;
所述计算引擎模块提供实时计算和批量计算;
所述数据存储模块存储客户基本数据、客户动态画像数据、客户交易数据、客户行为数据、组合数据、模型数据、资讯数据和产品数据。
本发明提供的理财规划方法、系统及装置,通过提出针对客户理财全生命周期提出的全面理财规划方法,实现了理财规划全流程自动化和智能化的创新。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的理财规划方法的流程示意图;
图2是本发明提供的智能理财规划流程图;
图3是本发明提供的客户挖掘技术实现原理图;
图4是本发明提供的Stacking模型融合方法示意图;
图5是本发明提供的客户触达技术实现原理图;
图6是本发明提供的传统用户兴趣模型和结合时间权重用户兴趣模型效果对比图;
图7是本发明提供的不同推荐模型效果对比图;
图8是本发明提供的客户分析技术实现原理图;
图9是本发明提供的理财服务技术实现原理图;
图10是本发明提供的深度投资模型框架图;
图11是本发明提供的沪深300回测结果对比图;
图12是本发明提供的中证1000回测结果对比图;
图13是本发明提供的服务跟踪技术原理图;
图14是本发明提供的理财规划系统的结构示意图;
图15是本发明提供的理财规划装置模块图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明提供的理财规划方法的流程示意图,如图1所示,包括:
步骤100:获取客户行为数据,基于理财意向预测模型从所述客户行为数据中确定目标客户;
步骤200:确定所述目标客户的推送服务类型,基于服务推送模型向所述目标客户推送理财服务推荐信息;
步骤300:获取目标客户标签画像,基于风险评估模型确定所述目标客户标签画像对应的风险等级;
步骤400:利用所述目标客户标签画像得到理财服务配置信息,基于预设深度投资模型输出所述理财服务配置信息对应的资产配置结果;
步骤500:对所述资产配置结果进行服务跟踪处理获得资讯数据。
本发明通过自上而下地对理财规划业务全生命周期的智能化改进,定义实现理财规划业务的全生命周期流程,包括客户挖掘、客户触达、客户分析、理财服务以及跟踪服务五个流程,每个流程均包含了智能理财规划的具体实施路径,实现了各个阶段全流程智能化创新,如图2所示的智能理财规划流程图,全面展现了本发明的理财规划的全流程实施图。
同时,在上述五个全生命周期流程中,为了解决客户理财规划全生命周期阶段中的理财意向不明确、触达服务不精准、风险不匹配、投资模型不健全、资讯繁杂等问题,本发明还分别提出了理财意向预测模型、服务推送模型、风险评估模型、预设深度投资模型和资讯分类评级模型。
具体地,通过客户端获取客户行为数据,通过理财意向预测模型从客户行为数据中筛选出目标客户,然后根据目标客户不用的分类确定不同的推送服务类型,根据不同的推送服务类型向对应的目标客户推送相关的理财服务推荐信息,进一步得到目标客户标签画像,由风险评估模型对目标客户标签画像进行风险评估,得到对应的风险等级,同时还利用该目标客户标签画像得到理财服务配置信息,再由预设深度投资模型分析得出理财服务配置信息对应的资产配置结果,此外还对已确定资产配置结果的客户进行跟踪服务,得到相应的资讯数据,最后由资讯分类评级模型对该资讯数据进行分类评估,得到最终的服务评级结果。
本发明通过提出针对客户理财全生命周期提出的全面理财规划方法,实现了理财规划全流程自动化和智能化的创新。
在上述实施例的基础上,所述获取客户行为数据,包括:
在客户端进行数据埋点获得埋点数据,或在服务器端采集日志获取实时数据;
对所述实时数据进行清洗,得到清洗后数据;
将所述埋点数据和所述清洗后数据发送至消息中间件进行缓存,获得用户行为日志数据流,基于所述用户行为日志数据流获取所述客户行为数据。
具体地,本发明提出的客户挖掘阶段,是在传统客户挖掘的基础上,融入了人工智能、大数据等技术,实现对传统客户挖掘的创新突破。客户挖掘的主要目的是挖掘出具有理财潜能的目标客户,为后续的精准营销做准备,详细的技术实现原理参见图3所示。
需要说明的是,目标客户挖掘分为两条线路,一是从实时数据中挖掘目标客户,二是从非实时的数据中挖掘目标客户。实时数据主要是指用户的行为数据;非实时数据主要是指从用户的行为数据中挖掘出目标客户,首要的任务就是实时采集用户的行为数据,然后进行清洗,并将清洗后的实时数据流传递进消息中间件中,然后通过算法模型对实时数据进行挖掘,最后将挖掘出的目标客户信息保存进存储系统中,详细的步骤如下:
(1)用户行为数据实时收集
用户行为数据搜集的第一步就是数据埋点和服务端日志搜集,本发明选择Growing Io进行数据埋点。
收集用户行为数据的另一种方式就是服务端日志采集,使用Flume集群来采集服务器端日志数据,Flume集群的上游数据源对接服务端日志文件,实时采集服务端日志,下游对接日志清洗程序,对日志数据进行清洗,从中提取目标数据。
(2)用户行为数据清洗
为了从海量的日志数据中提取出目标数据,Flume集群的下游对接Storm实时数据清洗程序,使用Storm实时清洗程序对海量日志进行清洗、提取出用户行为日志数据。
(3)实时数据发送至消息中间件
将清洗后的用户行为日志数据和前端埋点数据通过日志搜集服务集群传递到Kafka集群中,本发明使用Kafka消息中间件来缓存用户行为数据的优势是将日志搜集服务和后续的算法模型挖掘服务进行解耦,并且保障系统的吞吐量。
(4)目标客户挖掘
目标客户挖掘分为实时挖掘和批量挖掘两种模式。实时挖掘算法采用FlinkML编写,Flink集群对接Kafka集群,从Kafka集群中获取用户行为日志数据流。通过实时训练模型可以预测出该客户的理财潜能等级。批量挖掘模式采用Hadoop批处理技术,定时训练模型,预测客户的理财潜能等级。
对应地,所述基于理财意向预测模型从所述客户行为数据中确定目标客户,包括:
获取分布式梯度增强库XGBoost模型、轻量级梯度提升机LightGBM模型和随机森林模型;
将所述客户行为数据划分为第一特征数据集、第二特征数据集和第三特征数据集;
将所述第一特征数据集输入至所述XGBoost模型,得到第一预测结果,将所述第二特征数据集输入至所述LightGBM模型,得到第二预测结果,将所述第三特征数据集输入至所述随机森林模型,得到第三预测结果;
将所述第一预测结果、第二预测结果和第三预测结果进行融合,得到所述客户行为数据对应的理财潜能等级,根据所述理财潜能等级确定所述目标客户。
具体地,为了快速精准地获取客户需求,本发明在客户挖掘阶段设计了理财意向预测模型,对客户的产品需求与购买产品的意向进行分析。
该模型主要使用客户行为数据中的历史交易信息,包括客户基本信息、交易金额等数据,通过Stacking融合模型进行建模,预测该客户是否可能购买理财产品。融合模型的基模型选用XGBoost、LightGBM和随机森林模型,采用模型融合的方式能充分结合各基模型的优点,最后通过与该客户实际购买理财数据进行对比,不断深入学习优化参数,最终得到能够准确预测客户购买意向的预测模型。
Stacking模型分为两层,第一层将XGBoost、LightGBM、随机森林等三种不同的算法作为基学习器,得到三组预测结果,作为第二层模型的输入进行训练,从而得到最终的预测结果,Stacking模型融合方法如图4所示。
由于变量较多,部分特征对模型结果的影响不显著,为排除这部分特征对模型的干扰,提升模型的可解释性,采用XGBoost模型输出特征重要性。XGBoost模型通过记录特征的分裂总次数,计算信息增益来对特征重要性进行打分,最后根据数值大小排序。根据变量重要性得分选出排名靠前的指标:客户近一个月峰值资产、近三个月转入转出的差值、客户近一个月转入转出金额差值、客户转入频率趋势、客户转入金额趋势、客户近三个月资产闲置率等。将融合模型与XGBoost、LightGBM、随机森林模型进行对比,从模型评价指标中可以看出融合后的模型无论在准确率、精确率、AUC等指标都优于其他模型。表1和表2给出了融合模型的混淆矩阵与评价指标。
表1
Figure BDA0003908052230000071
表2
Figure BDA0003908052230000072
在确保模型总体性能的基础上,根据模型的准确度和召回率进行了进一步细分。细分原理是通过调参实现对两项指标的权衡,将客户分为了五个星级的目标群体。其中星级五的客户为高准确度、低召回率的群体,整体人数较少,营销成功率极高,适合专项营销服务。随着星级的降低,召回率不断上升,而准确度则持续下降。考虑的整体的营销服务成本有限,等级一的客户更适合线上推广服务。模型在实际业务中运用的结果见表3。
表3
Figure BDA0003908052230000073
Figure BDA0003908052230000081
本发明通过采用融合的理财意向预测模型,相比传统的单一预测模型,准确率有了大幅提升,模型性能也有明显提升。
对应地,所述基于理财意向预测模型从所述客户行为数据中确定目标客户之后,还包括:
根据所述理财潜能等级,将所述目标客户存储至预设数据库和/或远程字典服务缓存中。
可选地,在预测出客户的理财潜能等级后,需要将客户的理财潜能数据保存进存储系统中,通常为Oracle、Mysql等数据库。
在上述实施例的基础上,所述确定所述目标客户的推送服务类型,包括:
获取客户身份信息ID和所述目标客户的理财潜能等级,基于所述客户ID和所述理财潜能等级确定基本路线推送服务;
获取客户行为信息,基于所述客户行为信息确定实时路线推送服务;
获取预设数据库中客户变化信息,基于所述客户变化信息确定监控路线推送服务。
具体地,本发明提出的第二阶段的客户触达的主要目的是将理财服务推送给目标客户。根据客户的理财潜能等级、行为信息向目标客户推荐不同的服务,如:理财相关的知识、资讯信息等。为了实现客户触达的目标,本发明在技术实现上分为三条路线:基本路线、实时路线、监控路线。基本路线就是根据客户ID,获取客户的理财潜能等级,根据不同的理财潜能等级向客户推荐不同的服务;实时路线就是根据客户行为信息向客户推荐服务;监控路线主要通过监控数据库中数据的变化,主要是客户理财潜能的变化,通过邮件和短信平台向客户发送理财宣传,详细的技术实现参见图5所示。
本发明针对客户不同的理财潜能等级和行为信息向不同的目标客户推荐不同的服务,通过三种实现路线向目标客户进行服务推送,最大程度地对客户服务进行全方位覆盖。
对应地,所述基于服务推送模型向所述目标客户推送理财服务推荐信息,包括:
确定若干用户偏好主题词和若干权重向量,基于所述若干用户偏好主题词和所述若干权重向量构建用户主题偏好向量;
基于服务信息总字数、用户阅读总字数、阅读总时间、第一服务信息浏览时间边界值、第二服务信息浏览时间边界值和所述用户主题偏好向量,确定用户阅读时长影响度,其中所述第一服务信息浏览时间边界值小于所述第二服务信息浏览时间边界值;
根据用户收藏行为和用户点赞信息,确定用户服务信息关注度;
根据用户自选行为信息和持仓行为信息,确定用户服务信息自选与持仓操作关注度;
基于所述用户阅读时长影响度、所述用户服务信息关注度自选与持仓操作关注度,确定用户对服务的页面关注度向量;
确定服务信息主题特征向量,根据所述用户对服务的页面关注度向量和所述服务信息主题特征向量构建用户主题偏好向量;
获取时间惩罚函数,基于所述时间惩罚函数对所述用户主题偏好向量进行更新,得到用户兴趣模型;
将所述用户主题偏好向量与所述用户兴趣模型进行匹配,得到用户主题兴趣匹配模型;
基于所述用户主题兴趣匹配模型,计算任意两个用户相似度,将所述任意两个用户相似度高于预设阈值的用户加入任一用户兴趣相似用户集合,向所述任一用户兴趣相似用户集合推送所述理财服务推荐信息;
根据准确率确定所述任一用户兴趣相似用户集合中用户对新闻感兴趣概率,根据召回率确定所述任一用户兴趣相似用户集合中用户感兴趣新闻出现概率,并根据所述准确率和所述召回率输出F值指标。
具体地,智能服务推送模型采用混合推荐方法,首先通过用户浏览数据,结合服务主题构建用户兴趣模型,在用户兴趣模型的基础上使用推荐算法匹配相应的服务。
本发明构建兴趣模型时,考虑到用户主题偏好可能会随着时间衰减,使用指数函数表示时间影响因子,以表示用户兴趣随时间变化的相关性。引入时间因子后,用户兴趣模型构建流程如下:
(1)用户模型表示
用户兴趣偏好表示用户对服务信息主题的兴趣程度,可用权重向量表示如下:
Tu={(z1,wu1),(z2,wu2),…,(zm,wum)} (1)
其中,zi表示主题词,wui表示主题zi的权值。
(2)兴趣偏好计算
本模型认为用户对服务信息的兴趣程度与浏览时长和点赞收藏行为相关。用户阅读时长影响度Aun可表示为:
Figure BDA0003908052230000101
其中,t1和t2是服务信息浏览时间的边界值,当浏览时间低于t1时,可认为用户u没有完成浏览,大于t2认为用户阅读时间存在异常。其中In为服务信息n的总字数,Iu为用户阅读的总字数,Tu为阅读的总时间。
用户对服务信息n的关注度Bun可表示为:
Figure BDA0003908052230000102
当用户对服务信息收藏或点赞,则数值为1。
用户对服务信息n的自选与持仓操作关注度Cun可表示为:
Figure BDA0003908052230000103
当用户对服务信息相关的股票有持仓或者加入自选,则数值为1。
综上,可得到用户对服务信息的兴趣偏好公式如下:
Pun=w1×Aun+w2×Bun+w3×Cun (5)
其中,Pun最终取值范围为[0,1],w1、w2、w3为权重。
根据用户的浏览行为和服务信息主题特征向量可计算用户主题偏好向量:
Figure BDA0003908052230000104
其中,Pun是用户u对服务信息n的页面关注度,Zn为服务信息n的主题特征向量。
(3)用户兴趣模型更新
由于服务信息的时效性与热度会随着时间流逝而衰减,因此对于不同类型的内容进行时间衰减惩罚。设计时间惩罚函数如下:
Figure BDA0003908052230000111
其中,t表示服务信息发布距今的时间长度,T和G为可调参数,T为平滑值,G为时间惩罚因子。
在用户主题偏好向量中,加上时间惩罚的权重的更新公式为:
Wui=F(t)×Wui′ (8)
其中,Wui′表示主题i原有的权重值。
基于内容的推荐方法主要对用户浏览数据进行分析,用服务信息主题特征描述用户主题兴趣偏好,构建用户兴趣模型,然后向目标用户推荐在内容特征上与其兴趣模型最匹配的服务信息。基于内容的推荐的关键是计算资讯主题特征与用户兴趣模型的匹配值。
将资讯主题特征向量与用户当前的兴趣模型进行匹配,计算公式可表示为:
Figure BDA0003908052230000112
相似度越高则资讯主题特征与用户偏好性向量越匹配,说明用户对该服务感兴趣程度越高。
基于用户协同过滤通过分析用户兴趣偏好,将相似用户感兴趣的服务推送给用户,可以挖掘用户新的兴趣点。通过计算用户之间兴趣主题相似度,选取相似度高的K个近似用户,然后将他们感兴趣的服务推荐加入待推荐列表中。
计算用户u和v的相似度,将相似度高于阈值的用户加入用户u的兴趣相似的用户集合Ku中。计算方式如下:
Figure BDA0003908052230000113
实验采取准确率、召回率、F值评价推荐系统的效果。准确率表示用户对推荐列表中新闻感兴趣的概率,召回率表示用户感兴趣的新闻在推荐列表中出现的概率,F值指标综合考虑了准确率和召回率,计算公式为:
Figure BDA0003908052230000114
Figure BDA0003908052230000115
Figure BDA0003908052230000116
其中,R(u)表示根据用户在训练集上的行为给用户做出的推荐列表,T(u)代表用户在测试集上的行为列表。
首先分别构建传统的用户兴趣模型和结合时间权重的用户兴趣模型,并与候选服务进行相似度计算,得到推荐列表,将推荐列表与测试数据中用户浏览资讯记录对比,模型对比结果见图6。
由图6可看出,传统的用户兴趣模型和结合时间权重的用户兴趣模型效果对比生成的推荐结果对比,结合时间权重的兴趣模型在准确率、召回率、F值三个指标上均优于传统兴趣模型,证明了时间权重的有效性。
将本发明的融合方法与基于内容的推荐方法、基于用户协同过滤推荐方法对比,结果参见图7所示。图7展示了不同推荐方法下的F值,可见本发明使用的混合推荐方法在推荐性能方面有了明显的提高。
在上述实施例的基础上,所述获取目标客户标签画像,包括:
获取客户实时行为日志数据,将所述客户实时行为日志数据进行量化,转换为结构化数据,对所述结构化数据进行模型训练,得到客户实时标签画像;
获取客户离线数据,对所述客户离线数据进行批处理,得到客户离线标签画像。
具体地,本发明提出的第三阶段的客户分析目的是为了深层次了解客户,掌握客户的特点及需求。客户分析在技术实现上分为实时分析和离线分析两种模式,实时分析模式根据客户的实时交易数据、浏览行为数据、搜索行为数据等进行实时分析预测客户的标签画像;离线模式是通过对客户的离线数据,如客户的问卷作答数据、客户的近期交易数据、客户的持仓数据等进行批量的分析,通过机器学习模型和统计分析方法挖掘出客户潜在的标签信息,形成全新的画像,客户分析阶段详细的技术实现方案参见图8所示。
(1)实时分析模式
实时分析模式能够对客户的线上实时操作而产生的数据进行建模分析,得到客户的标签画像。首先,由Flume组件搭建的日志采集系统采集客户端日志数据。Flume日志采集系统下游对接Storm集群,Storm集群对日志系统采集的日志进行清洗。经Storm集群清洗后的结构化数据被发送到RabbitMQ中间件系统中。Flink集群实时消费RabbitMQ中的结构化数据,并且实时训练模型,对用户行为数据进行挖掘,然后将挖掘出的客户标签画像数据保存进存储系统中。
(2)离线分析模式
客户分析的离线分析模式主要是对客户的问卷数据、持仓数据、近期交易数据等进行挖掘分析,从中分析出客户的一些标签属性。首先通过Sqoop组件从数据库中导出问卷数据、客户持仓数据、近期交易数据等,Sqoop组件的另一端对接Hadoop数据清洗集群。Hadoop清洗程序将Sqoop导入的数据清洗转变为模型算法允许的数据格式,然后将这些标准格式的数据临时的保存进HDFS中。Spark集群运行的客户分析程序从HDFS中读取标准的输入数据,通过模型算法挖掘出客户的标签属性,然后保存进数据库中。
本发明通过采用实时分析和离线分析两种模式进行客户分析,获得目标客户的标签画像,便于深层次掌握客户的特点及需求。
对应地,所述基于风险评估模型确定所述目标客户标签画像对应的风险等级,包括:
获取用户交易数据和用户持仓信息;
基于回归分析算法计算所述用户交易数据和所述用户持仓信息,得到客户持仓股票风险系数;
获取客户平均仓位率和资金周转率指标,基于风险聚类分析方法计算所述客户平均仓位率、所述资金周转率指标和所述客户持仓股票风险系数,得到所述风险等级。
具体地,本发明采用客户风险评估模型结合传统问卷分析结果,基于数据挖掘技术对客户进行聚类,达到客户细分的结果。首先基于用户交易数据及持仓信息,使用回归分析算法计算客户持仓股票风险系数,再结合客户平均仓位率、资金周转率指标运用聚类分析方法对客户进行风险评级分类。
β系数是资产定价模型最重要的参数之一,用来衡量资产风险程度。被定义为某个资产的收益率与市场组合之间的相关性。其计算公式如下:
Figure BDA0003908052230000131
其中,分子cov(kj,km)是第j种证券的收益与市场组合收益之间的协方差。假设j股票第i年的收益率为Yi,证券市场第i年的收益率为Xi,则有:
Figure BDA0003908052230000132
Figure BDA0003908052230000133
Figure BDA0003908052230000141
可见股票β系数与三个因素有关:该股票与市场的相关性、股票的标准差、市场整体的标准差。β系数可以衡量相对于市场而言特定股票的系统风险,当β=1时,表明该股票与市场整体风险一致,当β<1时,表明该股票收益波动率低于整个市场的平均波动水平,风险相对较低,当β>1时,表明该股票收益率波动大于市场平均波水平,属于高风险证券。
实验选取2000名客户资料作为样本,分析客户在一年内的平均仓位率、资金周转率、持仓组合β系数三个指标,对于三个指标具体计算方法:
平均仓位率=∑(月平均仓位率)/12
资金周转率=∑(月平均仓位率)(月资金周转率=∑(当月每日交易额)/上月末资金额)
由于客户的β系数往往随着收益率波动以及持仓品种变化,分别计算客户近两年以及近三个月的β并赋予不同的权重:
β=0.3βt1+0.7βt2 (18)
其中βt1表示客户近两年的风险系数,βt2代表客户近三个月的风险系数。根据单一指数法计算风险系数,β的估计可由最小二乘公式得出。
Figure BDA0003908052230000142
Figure BDA0003908052230000143
其中
Figure BDA0003908052230000144
rit表示第i个客户在第t天的收益率,rmt表示第t天市场整体收益率。
在实际计算中,用β系数定义的方式计算比较复杂,一般采用单一指数法计算β系数,其具体形式如下:
rit=αiirmtit (21)
其中,rit表示股票实际收益率,αi表示预期收益率与实际收益率的差值。
通过计算分析得出客户的平均仓位、资金周转率、风险系数等指标,并进行归一化处理,再使用动态聚类算法进行聚类,得出聚类数据K=3。
采用邓恩指数指标(Dunn Validity Index,DVI)和标准互信息指标(NormalizedMutual Information,NMI)评价聚类算法的效果,Dunn指标的计算方法为任意两个簇元素的类间最短距离除以簇中类内最大距离的,DVI越大意味着类间距离越大,同时类内距离越小,NMI指标度量衡量两个数据分布的吻合程度,取值范围为[0,1],数值越大,评估效果愈优,计算得出DVI指标的值为0.842,NMI指标的值为0.73,说明聚类效果较好。
根据聚类结果将客户细分成三类,分类结果见表4。
表4
Figure BDA0003908052230000151
X1代表风险厌恶型客户。特点是仓位率低,交易频率偏低,持仓股票风险系数较低,在追求本金的基础上获取适当收益;
X2代表风险中性型客户,期望用适度的风险换取合理的回报;
X3代表风险偏好型客户。特点是持仓较高,交易频率高,持仓股票风险系数高,追求短期的高回报,可忍受短期的巨大价格波动。
本发明通过使用客户风险聚类算法,根据用户持仓股票风险系数以及交易特征将用户分为三个等级,分别为:风险厌恶性、风险偏好型、风险中性型客户,该模型可以作为投资者适当性评估的补充,结合客户风险问卷分析结果可更全面地分析客户风险偏好。
在上述实施例的基础上,所述利用所述目标客户标签画像得到理财服务配置信息,包括:
获取投资产品信息和所述目标客户标签画像,采用预设大类资产配置模型计算所述投资产品信息和所述目标客户标签画像,输出资产配置结果,根据融合深度学习的资产配置模型对所述资产配置结果进行筛选,得到配置投资方案;
采用符号数学系统TensorFlow框架构建离线推荐模型,将客户ID和所述目标客户标签画像输入所述离线推荐模型,输出理财投资方案列表,将所述配置投资方案添加至理财投资方案列表,得到离线推荐理财方案;
获取客户浏览行为数据,获取所述客户浏览行为数据的行为日志,将所述行为日志传递至开源流处理平台Kafka组件,由WebSerivce测试工具Storm实时处理所述Kafka组件中的所述行为日志,输出理财推荐列表,形成实时推荐理财方案;
确定客户理财投资方案,获取所述客户理财投资方案的信息集合,基于所述信息集合调用签约交易接口,输出签约配置信息。
具体地,本发明在第四阶段提出的理财服务就是为不同的客户根据其预期收益及风险承受能力定制个性化的投资组合方案及提供签约的渠道,内部构建了投研分析、产品池管理、策略管理、产品运营等模块,各模块协同共建理财服务流程。该环节首先需要读取客户画像数据(即客户分析阶段的处理结果),以客户画像数据为基础,为客户配置个性化的投资组合方案。同时,依据客户间相似度,给客户推荐其它投资组合方案,从而扩大客户理财投资方案的可选范围。另一方面,根据客户的浏览行为,实时的训练模型,为客户推荐理财方案。客户理财方案选定后,可通过客户端进行签约。总的来讲,理财服务阶段在技术实现上分为三个方面:配置投资方案、推荐理财方案、签约留痕,详细的技术实现方案参见图9所示。
第一部分为配置投资方案,该模块以客户画像数据、金融产品及其衍生品为输入,输出投资组合方案。该模块首先使用大类资产配置模型进行大类资产配置,然后使用融合深度学习的资产配置模型进行产品选择,从而形成个性化的组合投资方案。融合深度学习的资产配置模型使用TensorFlow框架搭建。
第二部分为推荐理财方案,理财投资方案的推荐根据推荐算法的训练方式,可以分为离线推荐和实时推荐两种模式。离线推荐模式是根据客户标签属性,向客户推荐投资方案。实时推荐是根据客户的浏览行为进行推荐。
第三部分为签约留痕,当客户选中某个理财投资方案后,通过客户端进行投资组合的签约。客户触发签约事件后,客户端把投资方案ID、客户信息、投资金额等信息传递到客户端模块的Service中。客户端模块服务调用签约交易接口,进行签约、资金冻结、档案留痕等一系列操作。操作完成后,会返回给客户端签约成功的信息。
本发明提出的智能化理财服务流程,能为客户提供个性化的投资建议方案和投资建议组合方案,具有精准度较高,准确贴合客户需求,增强投资建议灵活性的特点。
对应地,所述基于预设深度投资模型输出所述理财服务配置信息对应的资产配置结果,包括:
获取所述理财服务配置信息对应数据集,将所述理财服务配置信息对应数据集输入至输入层形成输入序列,将所述输入序列输入长短期记忆网络LSTM神经网络,将所述LSTM神经网络输出端与注意力机制层进行连接,形成所述预设深度投资模型;
确定候选因子,将所述候选因子输入至所述预设深度投资模型,结合深度学习算法输出所述资产配置结果;
其中,所述候选因子包括估值类因子、成长因子、资本结构类因子和技术面因子。
具体地,针对传统的资产配置模型主要基于大类资产配置的思想,产品选择方面以多因子建模的形式为主,更多的是基于主观分析和线性关系相结合。在此基础上,本发明提出深度投资模型,利用深度学习非线性拟合的优势,能够寻找投资产品中深层次的相关性,结合传统资产配置模型,构建基于Auto-Encoder的深度资产配置模型,通过自编码算法对投资组合的市场信息进行降维处理,根据深度网络中训练误差与测试误差的集合调整模型参数,构建相应的投资组合。
首先是模型的构建,将股票数据集传入输入层,输入序列由X=(x1,x2,...,xT)组成,序列长度为T,xi代表时间i模型的输入,再将输入数据依次纵向通过LSTM神经网络,构建时间序列模型,经过LSTM层可输出每个时刻的数据状态,不同时刻信息对当前股票价格的影响不同,时间久远的信息影响相对较小,最后引入注意力机制,评估不同时刻信息的重要性,深度投资模型的整体架构如图10所示。
本发明采用分类法方式构建多因子选股模型,选取候选因子作为模型的输入,结合深度学习算法,预测股票收益率区间。分类多因子选股模型根据估值类因子、成长类因子、技术面因子等各方面影响因素,以各个因子的数值特征作为模型的输入,最后根据学习算法预测股票收益的分类。
然后是数据选择与分析,实验数据选取因子分为四类:估值类因子、成长因子、资本结构类因子、技术面因子。
估值因子是对股票走势的预期,度量股票价值的方式包括市盈率、市净率、市销率以及市现率等。成长因子反映一个公司是否有持续创造价值的能力,即创值能力越高,成长性越好。公司的成长性可以由以下指标反映:ROE增长率、净利润增长率、营业收入增长率等。资本结构因子包括公司资产负债率、固定资产比率、总资产周转率等指标,反映公司的财务状况。技术面因子是反映上市公司交易数据方面的技术指标,如成交量、一月动量因子、平滑移动均线(EMA)、换手率、资金流量、波动等。
最后是实证结果与分析,经过因子筛选后,选取筛选后的多因子序列数据作为样本,将数据划分为训练集、测试集与验证集。实验每次以月底最后一个交易日为基准,使用过去90个交易日的历史数据,预测未来第20个交易日价格涨跌情况,采取多分类的方式,根据股票收益率划分类别标签,当股票收益率低于-30%时,类别标签设为-2,股票收益率在-30%到0%之间设为-1,同理,股票收益率高于30%时将类别标签设为2,收益率在0%到30%之间设为1。
深度投资模型的选股策略为:根据过去两个自然月的因子数据,对股票池中股票未来一个月的收益率进行分类预测;取出上涨概率较大的股票构建投资组合,并以月为周期进行投资组合的更新。
本发明建立的多因子选股策略回测时间选择于2020年11月1日至2021年10月30日,为全面的评估多因子选股策略的有效性,分别从沪深300、中证1000成分股中训练模型挑选相应的股票策略,并与对应的沪深300、中证1000指数趋势对比,以验证模型选股策略在大盘、小盘股的适用性。
根据深度投资模型选股策略,从沪深300成分股中选取对应的投资策略,并与沪深300指数基金对比。净值变化如图11所示,相较于沪深300指数,根据深度投资模型选取的策略收益率更高,同时具有更小的回撤风险,模型策略收益和回撤均优于沪深300指数基金。
根据深度投资模型选股策略,从中证1000成分股中选取对应的投资策略,并与中证1000指数基金对比。净值变化如图12所示,相较于中证1000指数,根据深度投资模型选取的策略月收益率为8.78%,而中证1000基金月收益率为8.12%,月收益率略高于中证1000,但是模型策略回撤风险相对较大,中证1000股票池整体流通总市值较小,股价波动较大,通过模型选取的策略回撤风险控制难度较大。
上述实验结果中,根据深度投资模型选取投资策略在大中盘股票中表现较好,在小盘股中回撤控制的较差。
在实践过程中,由于过去的数据不能完全反映未来股价趋势,由历史数据模拟得出的结果难免有一定的偏差,且不能应对市场出现的非预期波动,并不能保证模型完全准确。本发明将深度投资模型作为传统选股方法的辅助,通过深度投资模型选出产品池,选出有一定的概率呈上涨趋势的股票,供传统选股方法进一步筛选。
本发明通过深度投资模型,对理财服务配置信息进行深度解析,得到比较客观和准确的资产配置结果。
在上述实施例的基础上,所述对所述资产配置结果进行服务跟踪处理获得反馈数据,包括:
本发明在第五阶段提出的服务跟踪分为持仓跟踪和客户跟踪两个方面,持仓跟踪就是跟踪客户的投资组合,包括业绩、风险等指标,在技术实现上可以分为两大功能模块:持仓报表服务和预警监控服务。持仓报表服务就是利用SparkSQL、Hive等技术为客户生成持仓报表,通过客户端展示给客户。预警服务就是跟踪客户的持仓数据,对可能发生的风险进行预警,另外采用NLP技术对相关舆情进行分析,进行风险预警。客户跟踪主要是跟踪客户动态,结合客户的行为数据,通过算法模型挖掘客户预期收益变化情况及客户可承受风险的变化情况。详细的技术实现方案参见图13所示。
(1)持仓跟踪
首先使用Sqoop组件读取客户的持仓数据信息,然后将数据导入到SparkSQL中。SparkSQL经过数据的转换、计算形成客户持仓报表数据,将计算好的客户持仓报表数据存储在Hive数仓中。客户端应用层服务通过调用数据接口,获取客户的持仓报表数据。采用CDC技术监控数据库中舆情数据的变化。通过NLP技术分析舆情的正负面情况,同时提取出舆情涉及的企业和客户持仓信息相匹配,通过预警Service将风险展示给客户。
(2)客户跟踪
客户的理财目标和风险承受能力可能会随着时间的变化而变化,为此须对客户的变化进行跟踪。在技术实现上,首先使用Kafka组件搜集客户的行为数据,然后Storm集群及Ray集群实时消费Kafka中的用户行为数据,从中挖掘客户的投资目标和风险承受能力的变化情况。当实时挖掘模型检测出客户的投资目标和风险承受能力发生变化时,通过WebSocket等技术将投资调整建议推送到客户端。
本发明通过跟踪产品组合、事件预警与跟踪客户,使得智能理财规划业务的全生命周期形成完整的闭环,实现与客户进行全生命周期互动。
下面对本发明提供的理财规划系统进行描述,下文描述的理财规划系统与上文描述的理财规划方法可相互对应参照。
图14是本发明提供的理财规划系统的结构示意图,如图14所示,包括:客户挖掘单元1401、客户触达单元1402、客户分析单元1403、理财服务单元1404和跟踪服务单元1405,其中:
客户挖掘单元1401用于获取客户行为数据,基于理财意向预测模型从所述客户行为数据中确定目标客户;客户触达单元1402用于确定所述目标客户的推送服务类型,基于服务推送模型向所述目标客户推送理财服务推荐信息;客户分析单元1403用于获取目标客户标签画像,基于风险评估模型确定所述目标客户标签画像对应的风险等级;理财服务单元1404用于利用所述目标客户标签画像得到理财服务配置信息,基于预设深度投资模型输出所述理财服务配置信息对应的资产配置结果;跟踪服务单元1405用于对所述资产配置结果进行服务跟踪处理获得反馈数据,包括产品持仓组合与客户动态,实现对客户服务效果的反馈调节与主动更新,提升理财规划效果。
本发明通过提出针对客户理财全生命周期提出的全面理财规划系统,实现了理财规划全流程自动化和智能化的创新,相比于传统理财方法中专业性参差不齐的情况,解决了服务差异、供需失衡、利益冲突及过度依赖用户认知的痛点问题。
图15是本发明提供的理财规划装置模块图,如图15所示,包括:
自上而下依次进行连接的客户端模块、应用服务模块、算法模型模块、计算引擎模块和数据存储模块:
所述客户端模块向客户呈现理财规划推荐信息和操作界面;
所述应用服务模块将所述算法模型模块的算法封装为对外服务接口,所述应用服务模块通过服务编排完成服务协同工作,所述应用服务模块通过服务管理提供服务注册、服务发现、服务上下架和服务鉴权,所述应用服务模块通过服务监控提供告警信息;
所述算法模型模块对数据进行清洗加工转换为算法输入数据,将算法数据数据输入至构建的模型,对所述构建的模型进行训练并保存至所述算法模型模块,由所述算法模型模块向上层提供服务接口;
所述计算引擎模块提供实时计算和批量计算;
所述数据存储模块存储客户基本数据、客户画像数据、客户交易数据、客户行为数据、组合数据、模型数据、资讯数据和产品数据。
具体地,为实现理财规划的全流程智能化的目的,本发明还提供一种智能理财规划装置,所述智能理财规划装置包括:“数据存储模块”、“计算引擎模块”、“算法模型模块”、“应用服务模块”、“客户端模块”五个模块,具体如图15所示。数据存储模块负责底层数据的安全高效存储,为其它需要使用数据的组件提供稳定、高效的数据存取服务。计算引擎模块为算法模型提供算力支持。算法模型模块主要是对引擎中涉及到的算法进行建模、训练、统一管理。应用服务模块负责为上层应用提供服务接口。客户端模块是直接和客户交互的层级,为客户提供可视化的和理财相关的操作界面。
其中,客户端模块包含PC端、网页端、移动端、微信小程序等。客户端模块是直接和客户接触的层级,它为客户提供友好的操作界面。客户端模块最主要也是最核心的功能就是为客户提供友好的线上理财渠道。理财推荐功能通过后端算法引擎,结合客户的特点,向客户推荐合适的理财方案,通过客户端模块,将合适的理财方案展示给客户。客户可以在终端设备上进行自助开户、填写问卷、签约理财、买卖产品等操作。另一方面,运营人员可以通过客户端后台管理系统,对理财产品进行上下架管理与信息披露。总体来看,客户端模块就是为客户提供线上理财渠道的应用软件的客户端集合。
应用服务模块为客户端应用提供接口服务。应用服务模块对接算法模型模块和客户端模块。服务应用层负责将算法模型模块的算法封装成服务,然后供上层应用调用。应用服务模块应具备四个功能:服务封装、服务编排、服务管理、服务监控。应用服务模块将算法层的算法封装成可对外提供稳定服务的接口,如将算法封装成Restful接口,上层应用通过这些标准的接口调用服务层的服务。提供服务编排的能力,通过服务编排使得符合编排条件的服务协同工作,从而提供更加复杂的服务。应用服务模块还具备服务管理的功能,提供服务注册、服务发现、服务上下架的管理的功能。另外服务管理功能还包含服务鉴权,必须对接口的调用者进行身份验证,从而保证安全性。除此之外,服务应用层还具备服务监控的功能。服务监控需要监控的指标有接口调用次数、接口反应时长、接口错误率等。监控指标根据经验设置阈值,指标值超过阈值时,监控系统会向运维人员发出告警信息,告警信息通常以短信的形式实时发出。运维人员收到告警信息后,通过监控平台找到对应的服务接口,拉取服务日志数据,分析告警原因,从而及时定位问题所在。应用服务模块涉及到技术包含:微服务框架、KafKa消息队列、中间件技术、Docker容器技术等。
算法模型模块是引擎的核心,引擎中的智能是通过算法模型模块来支撑的。算法模型模块需要解决四个问题:数据处理、模型搭建及训练、模型保存、算法模型服务化。算法模型模块具备数据处理的能力,可以对数据进行清洗加工,转化为算法允许的输入数据。算法模型模块可以搭建模型算法,并且可以根据输入数据对搭建的模型进行训练。算法模型模块具有保存模型的能力,当模型训练完毕后,算法模型模块提供保存模型的功能。算法模型模块最核心的功能是给上层应用提供智能化的服务,因此训练好的模型必须能够服务化,为上层应用提供调用的接口。算法模型模块还可以对训练好的模型进行上下架管理。“数据分析建模平台”和“量化分析平台”是算法模型模块的两个实体。从训练数据接入到数据预处理,再到模型可视化搭建及训练都可以在数据建模平台上完成。模型训练完毕后,通过数据建模平台可以保存模型,并且管理模型的上下架。模型上架后,对外暴露调用模型的接口。模型下架后,对外接口关闭。量化分析平台是一个数据挖掘分析平台。可以对接入的数据做来量化分析或者建模分析。量化分析平台内置了很多数据挖掘算法,如K-means算法、Apriori算法、逻辑回归算法、C4.5算法等。通过量化分析平台,可以在引擎中挖掘出有用的信息,改善引擎的运营情况。
计算引擎模块是引擎的算力中心,为其提供算力支持。该层分为实时计算和批量计算两种类型的算力引擎。由于数据的价值会随着时间的变化而迅速降低,对于一些实时性要求较高的数据,系统须进行实时的处理。例如,用户浏览过某一些理财产品,用户的浏览数据须实时的进行处理,并且更新用户兴趣模型。在该层中,实时计算引擎有Storm集群、Flink集群、Ray集群等。实时计算具有三大特点:实时且无界的数据流、持续且高效的计算、流式且实时的数据集成。一般情况下,实时计算处理的数据是无界的流式数据,这些数据按照产生的时间先后顺序被实时计算引擎订阅和消费。实时计算属于触发式的计算模式,当有新的数据到来时,实时计算会自动触发计算任务,整个过程是持续进行的。另外,实时计算的结果可以持续的写入到存储层中。在众多的实时计算引擎中,Ray引擎对强化学习模型具有很好的支持,结合实时流数据,可以对模型进行强化学习,提升模型预测的精准度。批量计算引擎有Hadoop集群、Spark集群等。批处理任务的特点是:数据有界性、任务定时调度。批处理一般用于处理有界数据,数据经过批处理程序的加工,转变成目的数据,目的数据可以直接落库,或者作为另一个批处理程序的输入。另外,计算引擎模块中还包含其他一些大数据组件,如任务调度的Azkaban、数仓Hive、数据导入导出工具Sqoop等。
数据存储模块负责存储的数据包括“客户基本数据”、“客户动态画像数据”、“客户交易数据”、“客户行为数据”、“组合数据”、“模型数据”、“资讯数据”、“产品数据”等。为了保证数据的高可用,存储模块采用集群模式来存储数据,能够有效的降低数据丢失及部分服务器宕机而引起的数据不可用情况的发生。另外,数据存储时采用了异地主备机房的方案,按照一定的频率将主机房的数据同步到备机房服务器上,避免因主机房遭受毁灭性的打击而导致数据丢失情况的发生。同时对高频读写数据采用分库分表的存储策略。分库分表策略的使用有效的解决了单库存储在数据量较大时存在的性能瓶颈问题,大大提升了系统的稳定性及负载能力。为了防止数据泄露,采用数据加密的方式的存储敏感数据。在存储服务器之上设置数据加解密网关。数据加解密网关对入库数据进行加密,对出库数据进行解密。数据加解密网关还具有流量控制的功能,只有合法的请求才能通过该网关获取存储层中的数据。数据保存时采用加密方式存储,防止因数据库中数据被窃取而导致信息泄露情况的发生。存储层使用到的信息技术包含HDFS、Hbase、Mongodb、Oracle、Mysql、Redis、AES加解密等。
本发明在装置层面上,智能理财规划平台自下而上被划分为五个模块:数据存储模块、计算引擎模块、算法模型模块、应用服务模块、客户端模块,各模块协同共建整个智能理财规划平台。数据存储模块确保数据安全高效的存储;计算引擎模块为需要大数据计算的应用提供算力的支持;算法模型模块提供数据处理、模型搭建、算法训练等功能;应用服务模块将训练好的模型封装成Restful风格的接口,为上层应用提供AI能力;客户端模块是最接近用户的层级,为用户提供友好的展示及操作界面。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种理财规划方法,其特征在于,包括:
获取客户行为数据,基于理财意向预测模型从所述客户行为数据中确定目标客户;
确定所述目标客户的推送服务类型,基于服务推送模型向所述目标客户推送理财服务推荐信息;
获取目标客户标签画像,基于风险评估模型确定所述目标客户标签画像对应的风险等级;
利用所述目标客户标签画像得到理财服务配置信息,基于预设深度投资模型输出所述理财服务配置信息对应的资产配置结果;
对所述资产配置结果进行服务跟踪处理获得资讯数据。
2.根据权利要求1所述的理财规划方法,其特征在于,所述获取客户行为数据,包括:
在客户端进行数据埋点获得埋点数据,或在服务器端采集日志获取实时数据;
对所述实时数据进行清洗,得到清洗后数据;
将所述埋点数据和所述清洗后数据发送至消息中间件进行缓存,获得用户行为日志数据流,基于所述用户行为日志数据流获取所述客户行为数据;
对应地,所述基于理财意向预测模型从所述客户行为数据中确定目标客户,包括:
获取分布式梯度增强库XGBoost模型、轻量级梯度提升机LightGBM模型和随机森林模型;
将所述客户行为数据划分为第一特征数据集、第二特征数据集和第三特征数据集;
将所述第一特征数据集输入至所述XGBoost模型,得到第一预测结果,将所述第二特征数据集输入至所述LightGBM模型,得到第二预测结果,将所述第三特征数据集输入至所述随机森林模型,得到第三预测结果;
将所述第一预测结果、第二预测结果和第三预测结果进行融合,得到所述客户行为数据对应的理财潜能等级,根据所述理财潜能等级确定所述目标客户;
根据所述理财潜能等级,将所述目标客户存储至预设数据库和/或远程字典服务缓存中。
3.根据权利要求1所述的理财规划方法,其特征在于,所述确定所述目标客户的推送服务类型,包括:
获取客户身份信息ID和所述目标客户的理财潜能等级,基于所述客户ID和所述理财潜能等级确定基本路线推送服务;
获取客户行为信息,基于所述客户行为信息确定实时路线推送服务;
获取预设数据库中客户变化信息,基于所述客户变化信息确定监控路线推送服务;
对应地,所述基于服务推送模型向所述目标客户推送理财服务推荐信息,包括:
确定若干用户偏好主题词和若干权重向量,基于所述若干用户偏好主题词和所述若干权重向量构建用户主题偏好向量;
基于服务信息总字数、用户阅读总字数、阅读总时间、第一服务信息浏览时间边界值、第二服务信息浏览时间边界值和所述用户主题偏好向量,确定用户阅读时长影响度,其中所述第一服务信息浏览时间边界值小于所述第二服务信息浏览时间边界值;
根据用户收藏行为和用户点赞信息,确定用户服务信息关注度;
根据用户自选行为信息和持仓行为信息,确定用户服务信息自选与持仓操作关注度;
基于所述用户阅读时长影响度、所述用户服务信息关注度自选与持仓操作关注度,确定用户对服务的页面关注度向量;
确定服务信息主题特征向量,根据所述用户对服务的页面关注度向量和所述服务信息主题特征向量构建用户主题偏好向量;
获取时间惩罚函数,基于所述时间惩罚函数对所述用户主题偏好向量进行更新,得到用户兴趣模型;
将所述用户主题偏好向量与所述用户兴趣模型进行匹配,得到用户主题兴趣匹配模型;
基于所述用户主题兴趣匹配模型,计算任意两个用户相似度,将所述任意两个用户相似度高于预设阈值的用户加入任一用户兴趣相似用户集合,向所述任一用户兴趣相似用户集合推送所述理财服务推荐信息;
根据准确率确定所述任一用户兴趣相似用户集合中用户对新闻感兴趣概率,根据召回率确定所述任一用户兴趣相似用户集合中用户感兴趣新闻出现概率,并根据所述准确率和所述召回率输出F值指标。
4.根据权利要求1所述的理财规划方法,其特征在于,所述获取目标客户标签画像,包括:
获取客户实时行为日志数据,将所述客户实时行为日志数据进行量化,转换为结构化数据,对所述结构化数据进行模型训练,得到客户实时标签画像;
获取客户离线数据,对所述客户离线数据进行批处理,得到客户离线标签画像;
对应地,所述基于风险评估模型确定所述目标客户标签画像对应的风险等级,包括:
获取用户交易数据和用户持仓信息;
基于回归分析算法计算所述用户交易数据和所述用户持仓信息,得到客户持仓股票风险系数;
获取客户平均仓位率和资金周转率指标,基于风险聚类分析方法计算所述客户平均仓位率、所述资金周转率指标和所述客户持仓股票风险系数,得到所述风险等级。
5.根据权利要求1所述的理财规划方法,其特征在于,所述利用所述目标客户标签画像得到理财服务配置信息,包括:
获取投资产品信息和所述目标客户标签画像,采用预设大类资产配置模型计算所述投资产品信息和所述目标客户标签画像,输出资产配置结果,根据融合深度学习的资产配置模型对所述资产配置结果进行筛选,得到配置投资方案;
采用符号数学系统TensorFlow框架构建离线推荐模型,将客户ID和所述目标客户标签画像输入所述离线推荐模型,输出理财投资方案列表,将所述配置投资方案添加至理财投资方案列表,得到离线推荐理财方案;
获取客户浏览行为数据,获取所述客户浏览行为数据的行为日志,将所述行为日志传递至开源流处理平台Kafka组件,由WebSerivce测试工具Storm实时处理所述Kafka组件中的所述行为日志,输出理财推荐列表,形成实时推荐理财方案;
确定客户理财投资方案,获取所述客户理财投资方案的信息集合,基于所述信息集合调用签约交易接口,输出签约配置信息;
对应地,所述基于预设深度投资模型输出所述理财服务配置信息对应的资产配置结果,包括:
获取所述理财服务配置信息对应数据集,将所述理财服务配置信息对应数据集输入至输入层形成输入序列,将所述输入序列输入长短期记忆网络LSTM神经网络,将所述LSTM神经网络输出端与注意力机制层进行连接,形成所述预设深度投资模型;
确定候选因子,将所述候选因子输入至所述预设深度投资模型,结合深度学习算法输出所述资产配置结果;
其中,所述候选因子包括估值类因子、成长因子、资本结构类因子和技术面因子。
6.根据权利要求1所述的理财规划方法,其特征在于,所述对所述资产配置结果进行服务跟踪处理获得资讯数据,包括:
采用数据迁移Sqoop组件获取客户持仓数据,将所述客户持仓数据导入至SparkSQL数据库中,输出客户持仓报表数据;
基于变化数据捕获CDC获取数据库中变化的舆情数据,由自然语言处理NLP获取所述舆情数据的正负面信息,输出风险预警信息;
采用Kafka组件获取客户行为数据,由Storm集群及分布式计算Ray集群获取所述客户行为数据中的客户投资目标和风险承受能力,输出投资调整建议。
7.一种理财规划系统,其特征在于,包括:
客户挖掘单元,用于获取客户行为数据,基于理财意向预测模型从所述客户行为数据中确定目标客户;
客户触达单元,用于确定所述目标客户的推送服务类型,基于服务推送模型向所述目标客户推送理财服务推荐信息;
客户分析单元,用于获取目标客户标签画像,基于风险评估模型确定所述目标客户标签画像对应的风险等级;
理财服务单元,用于利用所述目标客户标签画像得到理财服务配置信息,基于预设深度投资模型输出所述理财服务配置信息对应的资产配置结果;
跟踪服务单元,用于对所述资产配置结果进行服务跟踪处理获得资讯数据,基于资讯分类评级模型对所述资讯数据进行分类,输出服务评级结果。
8.一种理财规划装置,基于权利要求1至6中任一理财规划方法,其特征在于,包括自上而下依次进行连接的客户端模块、应用服务模块、算法模型模块、计算引擎模块和数据存储模块:
所述客户端模块向客户呈现理财规划推荐信息,以及向客户提供操作界面;
所述应用服务模块将所述算法模型模块的算法封装为对外服务接口,所述应用服务模块通过服务编排完成服务协同工作,所述应用服务模块通过服务管理提供服务注册、服务发现、服务上下架和服务鉴权,所述应用服务模块通过服务监控提供告警信息;
所述算法模型模块对数据进行清洗加工转换为算法输入数据,将算法数据数据输入至构建的模型,对所述构建的模型进行模型训练后得到算法模型并保存所述算法模型,由所述算法模型向上层提供服务接口;
所述计算引擎模块提供实时计算和批量计算;
所述数据存储模块存储客户基本数据、客户动态画像数据、客户交易数据、客户行为数据、组合数据、模型数据、资讯数据和产品数据。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述理财规划方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述理财规划方法。
CN202211313530.2A 2022-10-25 2022-10-25 一种理财规划方法、系统及装置 Pending CN115619571A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211313530.2A CN115619571A (zh) 2022-10-25 2022-10-25 一种理财规划方法、系统及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211313530.2A CN115619571A (zh) 2022-10-25 2022-10-25 一种理财规划方法、系统及装置

Publications (1)

Publication Number Publication Date
CN115619571A true CN115619571A (zh) 2023-01-17

Family

ID=84865132

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211313530.2A Pending CN115619571A (zh) 2022-10-25 2022-10-25 一种理财规划方法、系统及装置

Country Status (1)

Country Link
CN (1) CN115619571A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117093652A (zh) * 2023-10-17 2023-11-21 杭银消费金融股份有限公司 一种离线数据同步方法及系统
CN118071513A (zh) * 2024-04-16 2024-05-24 交通银行股份有限公司江西省分行 一种基于人工智能驱动的个性化银行资产管理方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117093652A (zh) * 2023-10-17 2023-11-21 杭银消费金融股份有限公司 一种离线数据同步方法及系统
CN117093652B (zh) * 2023-10-17 2024-01-16 杭银消费金融股份有限公司 一种离线数据同步方法及系统
CN118071513A (zh) * 2024-04-16 2024-05-24 交通银行股份有限公司江西省分行 一种基于人工智能驱动的个性化银行资产管理方法及系统

Similar Documents

Publication Publication Date Title
Gupta Introduction to data mining with case studies
Tam et al. Managerial applications of neural networks: the case of bank failure predictions
Baesens et al. Using neural network rule extraction and decision tables for credit-risk evaluation
Linoff et al. Data mining techniques: for marketing, sales, and customer relationship management
Blattberg et al. Database models and managerial intuition: 50% model+ 50% manager
US20180053092A1 (en) Method and System for Innovation Management and Optimization Under Uncertainty
Chitra et al. Customer retention in banking sector using predictive data mining technique
Li et al. AI-driven customer relationship management for sustainable enterprise performance
Wihartati et al. Decision Support System for Share Investment Using The Capital Assetpricing Method (CAPM)
Chang et al. Pairs trading on different portfolios based on machine learning
Singh et al. E-commerce system for sale prediction using machine learning technique
Cui et al. Targeting high value customers while under resource constraint: partial order constrained optimization with genetic algorithm
CN114997916A (zh) 潜在用户的预测方法、系统、电子设备和存储介质
Agarwal et al. Machine Learning and Natural Language Processing in Supply Chain Management: A Comprehensive Review and Future Research Directions.
Sasani et al. TM-vector: A Novel Forecasting Approach for Market stock movement with a Rich Representation of Twitter and Market data
Wei et al. Online shopping behavior analysis for smart business using big data analytics and blockchain security
CN115619571A (zh) 一种理财规划方法、系统及装置
Gupta Applied analytics through case studies using Sas and R: implementing predictive models and machine learning techniques
Asemi et al. A novel combined business recommender system model using customer investment service feedback
Leventhal Predictive Analytics for Marketers: Using Data Mining for Business Advantage
Nagaraju et al. Methodologies used for customer churn detection in customer relationship management
Chashmi et al. Predicting customer turnover using recursive neural networks
CN115587170A (zh) 一种问题项个性化推荐方法、系统及存储介质
Gerunov Performance of 109 Machine Learning Algorithms across Five Forecasting Tasks: Employee Behavior Modeling, Online Communication, House Pricing, IT Support and Demand Planning
Singh Decision Making and Predictive Analysis for Real Time Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination