CN112330462A - 一种智能投顾方法 - Google Patents
一种智能投顾方法 Download PDFInfo
- Publication number
- CN112330462A CN112330462A CN202011222266.2A CN202011222266A CN112330462A CN 112330462 A CN112330462 A CN 112330462A CN 202011222266 A CN202011222266 A CN 202011222266A CN 112330462 A CN112330462 A CN 112330462A
- Authority
- CN
- China
- Prior art keywords
- data
- overdue
- investment
- sample data
- balance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种智能投顾方法,包括:获取互联网金融历史平衡数据,并对获得的平衡数据进行特征组合,得到有用组合特征;使用有用组合特征的数据来训练模型,并将未训练的样本数据放入训练好的模型,输出样本数据的逾期概率;计算样本数据的逾期概率与样本数据的期望收益之间的方差,从而确定投资标的的选择;通过大数据获得用户个性化的风险偏好及其变化规律,并根据用户个性化的风险偏好结合投资标的定制个性化的资产配置方案;利用互联网对用户个性化的资产配置方案进行实时跟踪调整,实现投资期间的风险监控。本发明为投资者提供了从投资标的选择,到投资期间的风险监控,再到投资习惯评价以及专业的个性化投资组合推荐的一站式服务。
Description
技术领域
本发明涉及计算机仿真技术领域,尤其涉及一种智能投顾方法。
背景技术
随着金融市场不断深入发展,金融产品层次与交易策略、交易工具的日趋复杂,普通投资者学习成本越来越高,难以跟上市场发展步伐,导致专业投资顾问服务的需求日渐凸显。但是,受限于传统投顾服务的限制,如:百万资金起步、服务流程繁琐、服务费高昂、不能随时随地咨询、投顾水平良莠不齐等,现有技术尚无法最大程度满足普通投资者的投顾需求。
发明内容
针对上述现有技术的缺点,本发明的目的是提供一种能够准确、全面、有效地给客户提供投顾建议的智能投顾方法,不仅大大节约了投资者的时间成本,还可以在一定程度上帮助投资者避免非理性投资行为。
本发明实施例提供的一种智能投顾方法,包括:
获取互联网金融历史平衡数据,并对获得的平衡数据进行特征组合,得到有用组合特征;
使用有用组合特征的数据来训练模型,并将未训练的样本数据放入训练好的模型,输出样本数据的逾期概率;
计算样本数据的逾期概率与样本数据的期望收益之间的方差,从而确定投资标的的选择;
通过大数据获得用户个性化的风险偏好及其变化规律,并根据用户个性化的风险偏好结合投资标的定制个性化的资产配置方案;
利用互联网对用户个性化的资产配置方案进行实时跟踪调整,实现投资期间的风险监控。
进一步地,上述方法中,通过以下方式获取互联网金融历史平衡数据:通过网络平台API接口获取互联网金融历史平衡数据。
进一步地,上述方法中,所述平衡数据是指逾期数据与非逾期数据为同比例的数据。
进一步地,上述方法中,所述平衡数据通过欠采样方式使得数据平衡,具体步骤如下:
将不平衡数据分割为逾期数据集与非逾期数据集,其中不平衡数据是指逾期的数据少于非逾期的数据;
将非逾期数据集中的数据进行等份分割成与逾期数据集数据量相同的数据集;
将逾期数据集中的数据与分割后的非逾期数据集中的数据进行合并,形成逾期数据与非逾期数据为同比例的平衡数据。
进一步地,上述方法中,所述对获得的平衡数据进行特征组合,是指通过Apriori关联规则算法对获得的平衡数据进行特征组合。
进一步地,上述方法中,所述通过Apriori关联规则算法对获得的平衡数据进行特征组合的方法如下:
将平衡数据根据是否逾期分为数据集D1与数据集D2,并分别求出各类数据集满足置信度与支持度的频繁模式集合Part1与Part2;
计算频繁模式集合Part1与Part2的交集Parta和并集Partb,并计算Parta与Partb的差集Part;
将满足差集Part内元素的所有数据特征作为一个特征进行组合。
进一步地,上述方法中,将随机森林算法作为识别算法进行训练,并使用有用组合特征的数据来训练模型。
进一步地,上述方法中,所述使用有用组合特征的数据训练模型后,还包括:通过逐步回归的方法筛选有用组合特征。
进一步地,上述方法中,所述通过逐步回归的方法筛选有用组合特征的方法如下:
将有用组合特征逐个引入随机森林算法模型,每引入一个特征均对其进行T检验,即检验该特征的系数是否等于零;
若新引入特征的系数等于零,则删除该有用组合特征,否则,将该特征留存并继续加入新的有用组合特征到模型中。
进一步地,上述方法中,所述计算样本数据的逾期概率与样本数据的期望收益之间的方差,从而确定投资标的的选择的方法如下:
通过核回归方法计算样本数据的期望收益,所述核回归公式如下:
其中,x为样本数据的逾期概率,xi、xj为已知历史数据的逾期概率,yi、yj为已知历史数据的期望收益,K(x,xi)和K(x,xj)为核函数;
计算样本数据的期望收益与样本数据的逾期概率之间的方差,并将该方差作为投资标的风险的衡量;
将样本数据的期望收益与样本数据的逾期概率之间的方差作为x轴,将样本数据的期望收益作为y轴,显示出投资标的的有效前沿。
与现有技术相比,本发明智能投顾方法为投资者提供了从投资标的选择,到投资期间的风险监控,再到投资习惯评价以及专业的个性化投资组合推荐的一站式服务,不仅大大节约了投资者的时间成本,还可以在一定程度上帮助投资者避免非理性投资行为。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种智能投顾方法流程示意图;
图2为本发明提供的通过欠采样方式使得数据平衡的方法流程示意图;
图3为本发明提供的通过Apriori关联规则算法对获得的平衡数据进行特征组合的方法流程示意图;
图4为本发明提供的通过逐步回归的方法筛选有用组合特征的方法流程示意图;
图5为本发明提供的确定投资标的的选择的方法流程示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例主要通过Python语言开发,并利用爬虫技术与拍拍贷API接口进行网络平台(如:P2P)智能投顾的二次开发。
下面结合说明书附图对本发明实施例作进一步详细描述。
如图1所示,本发明实施例公开了一种智能投顾方法,包括:
S101,获取互联网金融历史平衡数据,并对获得的平衡数据进行特征组合,得到有用组合特征;
S102,使用有用组合特征的数据来训练模型,并将未训练的样本数据放入训练好的模型,输出样本数据的逾期概率;
S103,样本数据的逾期概率与样本数据的期望收益之间的方差,从而确定投资标的的选择;
S104,通过大数据获得用户个性化的风险偏好及其变化规律,并根据用户个性化的风险偏好结合投资标的定制个性化的资产配置方案;
S105,利用互联网对用户个性化的资产配置方案进行实时跟踪调整,实现投资期间的风险监控。
本发明从不同纬度对标的风险进行详尽评估,针对个人投资者缺少专业的投资知识,对市场上琳琅满目的投资标的选择困难以及难以控制风险等问题,为投资者提供了从投资标的选择,到投资期间的风险监控,再到投资习惯评价以及专业的个性化投资组合推荐的一站式服务,不仅大大节约了投资者的时间成本,还可以在一定程度上帮助投资者避免非理性投资行为。
进一步地,上述方法中,通过以下方式获取互联网金融历史平衡数据:通过网络平台API接口获取互联网金融历史平衡数据。
进一步地,上述方法中,所述平衡数据是指逾期数据与非逾期数据为同比例的数据。
进一步地,如图2所示,所述平衡数据通过欠采样方式使得数据平衡,具体步骤如下:
S201,将不平衡数据分割为逾期数据集与非逾期数据集,其中不平衡数据是指逾期的数据少于非逾期的数据;
S202,将非逾期数据集中的数据进行等份分割成与逾期数据集数据量相同的数据集;
S203,将逾期数据集中的数据与分割后的非逾期数据集中的数据进行合并,形成逾期数据与非逾期数据为同比例的平衡数据。
本发明实施中将不平衡数据先分割为逾期数据集与非逾期数据集;其次,将非逾期数据集中的数据进行等份分割成与逾期数据集数据量相近的数据集(即,若逾期数据有100条,而非逾期数据有10000条,则将非逾期数据分割为100个数据集,每个数据集中含100条数据),然后将两者数据进行合并,形成新的平衡数据集。
本发明实施例每一个数据集都可以训练得到一个模型,从而可以得到多个模型。在对样本数据预测的过程中,多个模型都会对样本数据进行评估,最后通过求均值的方法得到样本的逾期概率。
进一步地,上述方法中,所述对获得的平衡数据进行特征组合,是指通过Apriori关联规则算法对获得的平衡数据进行特征组合。
进一步地,如图3所示,所述通过Apriori关联规则算法对获得的平衡数据进行特征组合的方法如下:
S301,将平衡数据根据是否逾期分为数据集D1与数据集D2,并分别求出各类数据集满足置信度与支持度的频繁模式集合Part1与Part2;
S302,计算频繁模式集合Part1与Part2的交集Parta和并集Partb,并计算Parta与Partb的差集Part;
S303,将满足差集Part内元素的所有数据特征作为一个特征进行组合。
实施中,本发明将r内所有属性作为一个特征进行组合,并且仅当该组合内所有属性出现时,将其标识为1,其余标识为0。
具体地,所述支持度是指某一特征或特征组合在样本中出现的次数占所有样本数的比例。所述置信度是指在某一特征或特征组合出现的情况下,另一特征或特征组合出现的可能性。
实施中,本发明通过设定最低支持度和置信度,可以选出频繁组合出现的特征,即频繁模式。
进一步地,上述方法中,将随机森林算法作为识别算法进行训练,并使用有用组合特征的数据来训练模型。本发明实施例将Apriori关联规则算法与随机森林算法相结合,构造了新的模型。
进一步地,上述方法中,所述使用有用组合特征的数据训练模型后,还包括:通过逐步回归的方法筛选有用组合特征。
进一步地,如图4所示,,所述通过逐步回归的方法筛选有用组合特征的方法如下:
S401,将有用组合特征逐个引入随机森林算法模型,每引入一个特征均对其进行T检验,即检验该特征的系数是否等于零;
S402,若新引入特征的系数等于零,则删除该有用组合特征,否则,将该特征留存并继续加入新的有用组合特征到模型中。
进一步地,如图5所示,所述计算样本数据的逾期概率与样本数据的期望收益之间的方差,从而确定投资标的的选择的方法如下:
S501,通过核回归方法计算样本数据的期望收益,所述核回归公式如下:
其中,x为样本数据的逾期概率,xi、xj为已知历史数据的逾期概率,yi、yj为已知历史数据的期望收益,K(x,xi)和K(x,xj)为核函数;
S502,计算样本数据的期望收益与样本数据的逾期概率之间的方差,并将该方差作为投资标的风险的衡量;
S503,将样本数据的期望收益与样本数据的逾期概率之间的方差作为x轴,将样本数据的期望收益作为y轴,显示出投资标的的有效前沿。
实施中,核回归方法是一种非参数回归的方法,不对原始的数据做任何假设。而核函数用于对离x不同距离的点赋予不同的权重(离x越近权重约大)。
本发明基于核回归的方法,针对投资者在网络平台行业进行投资时的困惑,构建了风险-收益指标,计算出网络平台投资的有效投资前沿,将其作为投资推荐的依据,给投资者提供了有效地投顾建议。
本发明实施例利用线上网络平台的数据集进行了验证与投资模拟,即利用训练好的模型预测线上网络平台的样本数据逾期与否,其准确率与AUC(Area Under Curve,ROC曲线下的面积)均得到显著提高,表明本发明智能投顾方法采用的Apriori关联规则算法与随机森林算法具有更强的识别能力。
同时,本发明实施例将上述算法作为欺诈识别的模型,如下表的混淆矩阵,本发明实施例利用线上P2P网络平台-拍拍贷的数据集进行了验证与投资模拟,其TP/(TP+TN+FP+FN)约为90%,表明其可识别出近90%的欺诈样本。
上表中,其中TP指实际是逾期样本预测也为逾期样本的样本数,TN指实际是逾期样本被预测为非逾期样本的样本数,FP指实际是非逾期样本被预测为逾期样本的样本数,FN指实际是非逾期样本预测为非逾期样本的样本数。
综上,本发明实施例主要用于对目前的网络平台投资者进行投资时标的选择的推荐。本发明针对个人投资者缺少专业的投资知识,对市场上琳琅满目的投资标的选择困难以及难以控制风险等问题,为投资者构建了风险-收益指标,计算出P2P投资的有效投资前沿,并将其作为投资推荐的依据,不仅大大节约了投资者的时间成本,还可以在一定程度上帮助投资者避免非理性投资行为。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种智能投顾方法,其特征在于,包括:
获取互联网金融历史平衡数据,并对获得的平衡数据进行特征组合,得到有用组合特征;
使用有用组合特征的数据来训练模型,并将未训练的样本数据放入训练好的模型,输出样本数据的逾期概率;
计算样本数据的逾期概率与样本数据的期望收益之间的方差,从而确定投资标的的选择;
通过大数据获得用户个性化的风险偏好及其变化规律,并根据用户个性化的风险偏好结合投资标的定制个性化的资产配置方案;
利用互联网对用户个性化的资产配置方案进行实时跟踪调整,实现投资期间的风险监控。
2.根据权利要求1所述的方法,其特征在于:通过以下方式获取互联网金融历史平衡数据:通过网络平台API接口获取互联网金融历史平衡数据。
3.根据权利要求1或2所述的方法,其特征在于:所述平衡数据是指逾期数据与非逾期数据为同比例的数据。
4.根据权利要求3所述的方法,其特征在于:所述平衡数据通过欠采样方式使得数据平衡,具体步骤如下:
将不平衡数据分割为逾期数据集与非逾期数据集,其中不平衡数据是指逾期的数据少于非逾期的数据;
将非逾期数据集中的数据进行等份分割成与逾期数据集数据量相同的数据集;
将逾期数据集中的数据与分割后的非逾期数据集中的数据进行合并,形成逾期数据与非逾期数据为同比例的平衡数据。
5.根据权利要求1所述的方法,其特征在于:所述对获得的平衡数据进行特征组合,是指通过Apriori关联规则算法对获得的平衡数据进行特征组合。
6.根据权利要求5所述的方法,其特征在于:所述通过Apriori关联规则算法对获得的平衡数据进行特征组合的方法如下:
将平衡数据根据是否逾期分为D1数据集与D2数据集,并分别求出各类数据集满足置信度与支持度的频繁模式集合Part1与Part2;
计算频繁模式集合Part1与Part2的交集Parta和并集Partb,并计算Parta与Partb的差集Part;
将满足差集Part内元素的所有数据特征作为一个特征进行组合。
7.根据权利要求1所述的方法,其特征在于:将随机森林算法作为识别算法进行训练,并使用有用组合特征的数据来训练模型。
8.根据权利要求1或7所述的方法,其特征在于:所述使用有用组合特征的数据训练模型后,还包括:通过逐步回归的方法筛选有用组合特征。
9.根据权利要求8所述的方法,其特征在于:所述通过逐步回归的方法筛选有用组合特征的方法如下:
将有用组合特征逐个引入随机森林算法模型,每引入一个特征均对其进行T检验,即检验该特征的系数是否等于零;
若新引入特征的系数等于零,则删除该有用组合特征,否则,将该特征留存并继续加入新的有用组合特征到模型中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011222266.2A CN112330462A (zh) | 2020-11-05 | 2020-11-05 | 一种智能投顾方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011222266.2A CN112330462A (zh) | 2020-11-05 | 2020-11-05 | 一种智能投顾方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112330462A true CN112330462A (zh) | 2021-02-05 |
Family
ID=74316028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011222266.2A Pending CN112330462A (zh) | 2020-11-05 | 2020-11-05 | 一种智能投顾方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112330462A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7171385B1 (en) * | 1999-11-26 | 2007-01-30 | Algorithmics International Corp. | System and method for trading off put and call values of a portfolio |
CN109191306A (zh) * | 2018-08-08 | 2019-01-11 | 平安科技(深圳)有限公司 | 资产配置方法、系统、计算机设备和存储介质 |
CN110223137A (zh) * | 2019-05-22 | 2019-09-10 | 平安科技(深圳)有限公司 | 产品组合推荐方法、装置、计算机设备和存储介质 |
CN111461216A (zh) * | 2020-03-31 | 2020-07-28 | 浙江邦盛科技有限公司 | 一种基于机器学习的案件风险识别方法 |
CN111552926A (zh) * | 2020-04-28 | 2020-08-18 | 重庆长安新能源汽车科技有限公司 | 基于车联网的驾驶行为评价方法、系统及存储介质 |
-
2020
- 2020-11-05 CN CN202011222266.2A patent/CN112330462A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7171385B1 (en) * | 1999-11-26 | 2007-01-30 | Algorithmics International Corp. | System and method for trading off put and call values of a portfolio |
CN109191306A (zh) * | 2018-08-08 | 2019-01-11 | 平安科技(深圳)有限公司 | 资产配置方法、系统、计算机设备和存储介质 |
CN110223137A (zh) * | 2019-05-22 | 2019-09-10 | 平安科技(深圳)有限公司 | 产品组合推荐方法、装置、计算机设备和存储介质 |
CN111461216A (zh) * | 2020-03-31 | 2020-07-28 | 浙江邦盛科技有限公司 | 一种基于机器学习的案件风险识别方法 |
CN111552926A (zh) * | 2020-04-28 | 2020-08-18 | 重庆长安新能源汽车科技有限公司 | 基于车联网的驾驶行为评价方法、系统及存储介质 |
Non-Patent Citations (1)
Title |
---|
陈金钊 等: "法律方法", vol. 1, 研究出版社, pages: 290 - 291 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110070391B (zh) | 数据处理方法、装置、计算机可读介质及电子设备 | |
US6631362B1 (en) | General decision-making support method and system | |
US11423324B2 (en) | Training and estimation of selection behavior of target | |
WO2020029386A1 (zh) | 资产配置方法、系统、计算机设备和存储介质 | |
KR20200009280A (ko) | 주식 종목 추천 방법 및 시스템 | |
WO2023000491A1 (zh) | 一种应用推荐方法、装置、设备及计算机可读存储介质 | |
CN113742492A (zh) | 保险方案生成方法、装置、电子设备及存储介质 | |
Siebenbrunner et al. | Can bank-specific variables predict contagion effects? | |
WO2023245549A1 (zh) | 基于人工智能的基金组合更新方法、装置、设备及介质 | |
Corazza et al. | An evolutionary approach to preference disaggregation in a MURAME-based creditworthiness problem | |
Cheikh et al. | Do sovereign credit ratings matter for corporate credit ratings? | |
CN107767152A (zh) | 产品购买倾向分析方法及服务器 | |
Frydman et al. | Random survival forest for competing credit risks | |
Fano et al. | Convergence of outcomes and evolution of strategic behavior in double auctions | |
US20140344020A1 (en) | Competitor pricing strategy determination | |
US20160171608A1 (en) | Methods and systems for finding similar funds | |
KR20170034836A (ko) | 재무 정보 및 비재무 정보에 기초한 신용 평가 방법과 시스템 및 기록매체 | |
WO2020004049A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN112330462A (zh) | 一种智能投顾方法 | |
Qureshi et al. | Nexus between Fintech Adoptability and Customer’s Perception towards Fintech in the Islamic Banking Industry | |
CN115713441A (zh) | 基于AHP-Fuzzy算法和神经网络的教学质量评价方法与系统 | |
US20140344021A1 (en) | Reactive competitor price determination using a competitor response model | |
US20140344022A1 (en) | Competitor response model based pricing tool | |
CN115049429A (zh) | 增益预测方法、装置和计算机设备 | |
EP3901840A1 (en) | Combined prediction system and methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |