CN115456793A

CN115456793A - 一种用户投资决策的智能风险控制系统

Info

Publication number: CN115456793A
Application number: CN202211085413.5A
Authority: CN
Inventors: 王光臣; 栾茜庆; 王钰; 魏怡婷; 赵祥蓉
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2022-09-06
Filing date: 2022-09-06
Publication date: 2022-12-09

Abstract

本发明涉及一种用户投资决策的智能风险控制系统，属于投资风险控制技术领域，包括数据采集模块、数据预处理模块、风险评估模块和风险预警模块，本发明能够定性定量评估用户及产品所属企业的实时风险状态，从用户角度出发，既考虑用户本身固定的风险承受能力，同时通过用户客观行为更新其实时风险承受能力；从产品角度出发，一方面获取互联网公开产品及产品所属企业相关信息数据，评估产品所属企业风险状态，另一方面根据市场状态及政策导向等文本信息，对其进行数据情感分析识别以实现实时跟进。该系统提供了一种定制化风险监控及预警服务，提高风险预警速度及风险能力评估准确度，从而帮助用户在进行投资决策过程中实现风险实时预警服务。

Description

一种用户投资决策的智能风险控制系统

技术领域

本发明涉及一种用户投资决策的智能风险控制系统，属于投资风险控制技术领域。

背景技术

随着经济社会的不断发展，人们逐渐摆脱了以往传统线下金融投资交易模式，通过线上网站或各类app进行投资决策的电子交易日益增多，这给人们提供了一种更加省时省力的互联网金融交易方式。值得注意的是，大量信息涌入使得用户对相关产品及所属企业认知了解存在的信息差问题、用户对自身风险评价过于主观导致评估能力存在偏差等问题，都对用户投资决策带来影响，从而产生风险。

目前，现有技术对于用户投资决策的风险监控，通常分为以下两种。第一种仅从用户角度出发，通过用户调查问卷链接等形式开展，用户自行填写相关基础信息，工作人员根据其问卷结果，对用户风险承受能力进行分类评估。第二种仅从产品角度出发，通常是基于投资产品本身的涨跌波动，或根据历史区间数据对未来走势进行短时预测，仅向用户展现其涨跌幅度和数值数据，无法直接反映该投资产品的风险情况。

现有技术存在的缺陷为：从用户角度出发时，用户自行填写时主观性较强，可能与自身真实风险承受情况存在一定偏差，仅主观填写将无法通过用户行为客观体现，导致用户风险承受能力评估能力不够准确；从产品角度出发时，仅对产品本身走势进行涨跌预测，并未考虑产品所属企业本身存在的风险，而涨跌本身受到很多市场因素影响。各种技术手段无法精准预测风险，且无法聚焦到每一个独特的投资用户者，并未考虑个体差异性，因而风险监控覆盖范围不够精确，也无法在用户决策过程中对于风险进行及时识别与预警。

发明内容

针对现有技术的不足和应用的需求，本发明提供一种用户投资决策的智能风险控制系统，能够定性定量评估用户及产品所属企业的实时风险状态，从用户角度出发，既考虑用户本身固定的风险承受能力，同时通过用户客观行为更新其实时风险承受能力；从产品角度出发，一方面获取互联网公开产品及产品所属企业相关信息数据，评估产品所属企业风险状态，另一方面根据市场状态及政策导向等文本信息，对其进行数据情感分析识别以实现实时跟进。该系统将提供一种定制化风险监控及预警服务，提高风险预警速度及风险能力评估准确度，从而帮助用户在进行投资决策过程中实现风险实时预警服务。

本发明采用以下技术方案：

本发明提供了一种用户投资决策的智能风险控制系统，包括数据采集模块、数据预处理模块、风险评估模块和风险预警模块，其中，

所述数据采集模块，用于获取用户及企业数据，并将其传输至数据处理模块；

所述数据预处理模块，用于对数据采集模块采集的数据进行数据预处理；

所述风险评估模块，用于对用户个人风险及产品所属企业风险进行评估，分别计算用户个人风险承受能力值及产品所属企业综合风险值；

所述风险预警模块，用于根据风险评估模块得到的用户个人风险承受能力值及产品所属企业综合风险值进行预警信息推送提醒。

上述系统的工作原理在于：数据采集模块将互联网获取的公开数据向数据预处理模块传输，经数据预处理模块标准化处理完毕后，向风险评估模块进行传送；风险评估模块分别对用户行为和企业行为进行模型搭建与数据处理分析，计算用户个人风险承受能力值和产品所属企业综合风险值；计算后的数值向风险预警模块进行传输，将二者进行匹配，当风险值超过预设值时，风险预警模块将向用户及时进行预警信息推送提醒，以达到风险及时预警的目的。

优选的，所述数据采集模块包括历史数据采集模块和实时数据采集模块；

历史数据采集模块包括历史数据采集模块I和历史数据采集模块II，历史数据采集模块I通过与互联网公开信息平台对接，获取企业产品信息数据，包括企业信息数据、企业涉案数据、产品信息数据、产品涉案数据、互联网广告信息及评论信息数据、工商违法违规记录数据、司法数据、知识产权和专利数据、涉税数据等；历史数据采集模块II通过问卷等形式获取用户基础信息数据，包括用户的年龄、性别、婚姻状况、受教育程度、职业、收入、家庭开支情况、个人征信情况、固定资产、金融资产规模、产生焦虑感的最低投资亏损比例、投资经验、金融理财知识等，用户基础信息数据主要是通过用户自行填写的问卷调查信息来获取；

所述实时数据采集模块包括实时数据采集模块I和实时数据采集模块II，实时数据采集模块I通过互联网公开信息、第三方信息披露平台和第三方商业数据库实时监测并获取所属企业重大异常行为，重大异常行为包括但不限于企业涉案行为、因税务等被相关部门警告处罚行为等；

实时数据采集模块II与用户行为监测平台(即第三方行为监测平台)对接，实时监测用户互联网行为或通过情绪识别行为倾向，将其作为用户本身风险承受能力评估的重要影响因素。

上述数据采集模块实现了对用户基础信息数据、用户互联网客观行为数据、企业基础信息数据、企业实时重大异常行为数据获取，进一步增强了该智能风控系统对其可能存在的风险的多方面综合监控能力。

优选的，所述数据预处理模块用于对采集到的数据进行标准化处理，在数据标准化处理过程中，对采集的任一项数据指标，找到其最大值X_max和最小值X_min，计算极差R＝X_max-X_min，再用每一项数据指标的真实值X与最小值X_min做差，再除以极差R，即：

上述数据处理方式对数据采集模块传输的数据进行数据标准化处理，通过无量纲化处理使数据具有可比性，是一种高效直接的数据处理方式。

优选的，所述风险评估模块包括用户风险评估模块和企业风险评估模块；

所述用户风险评估模块，将用户的年龄、性别、婚姻状况、受教育程度、职业、收入、家庭开支情况、个人征信情况等作为用户社会人口统计学特征，将固定资产、金融资产规模、产生焦虑感的最低投资亏损比例等作为用户直接风险承受能力特征，将投资经验、金融理财知识等作为用户风险认知水平能力特征，根据三大特征建立用户私人风险偏好评估模型(建立模型的过程中将三大特征融合为一个用户私人风险偏好评估模型，模型的建立过程可参考现有技术，属于本领域的常规技术)，将用户风险评估三大特征输入能够得到用户风险偏好类型，并能够计算用户个人风险承受能力值；

将实时数据采集模块II与用户行为监测平台对接得到的数据作为用户私人风险偏好评估模型的影响因素，包括用户浏览网页内容信息、用户浏览网页主题及时长信息、页面浏览完成度、互联网发言积极信息、互联网发言消极信息、互联网发言被举报信息、互联网发言被拉黑及禁言信息、互联网发言争吵频率信息、深夜购物app使用情况、深夜购物退款退单信息、各类app从下载到卸载平均使用时长、用户对不同类别app的使用粘性等，对用户私人风险偏好评估模型进行实时训练；

对用户私人风险偏好评估模型的影响因素进行浓缩，浓缩成三个概括性指标因子，即用户的历史网络浏览信息、互联网发言信息、各大app使用情况；

将实时数据采集模块II得到的上述用户的历史网络浏览信息、互联网发言信息、各大app使用情况等影响因素相关数据，进行归一化、统一量纲数据预处理，得到各项概括性指标因素对应数值C_i(i＝1,2,3)；

通过信息熵法得到三个概括性指标因子影响风险偏好评估结果的权重值m_i(i＝1,2,3)；

对C₁、C₂和C₃进行标准化处理，获取标准数值

和

得到用户个人风险承受能力值Y公式为：

优选的，得到权重值m_i(i＝1,2,3)的过程为：

建立一般模型，设X＝(X₁,X₂,…,X_p)^T是用户私人风险偏好评估模型的影响因素数据，m＝(m₁,m₂,m₃)^T为共性因子，即浓缩后的三个概括性指标因子数据，且E(X)＝μ＝(μ₁,μ₂,…,μ_p)^T，E(X)表示数学期望E对影响因素X＝(X₁,X₂,…,X_p)^T作用下的一个均值表达形式，μ为均值，p为影响因素总量，μ₁,μ₂,μ_p为每一影响因素下对应的均值；

Var(X)＝∑＝(a_ij)_p×p为因子负荷矩阵，即随机变量与共性因子之间的相关系数；

公式概括表示为X＝μ+AM，其中A为相关系数，M为共性因子；

利用多影响因素对风险评价体系影响下的共性因子(概括性影响因素)提供的信息熵来确定指标权重；

信息熵用来评价信息的有序程度及信息的效用值。信息熵越大，信息的无序度越高，其信息的效用值越小；反之，信息熵越小，信息的无序度越低，信息的效用值越大。

对实时数据采集模块II采集到的数据进行无量纲化处理

将每一个概括性指标因子作为一个系统，样本数为s，样本数是指每一概括性指标因子下所包含的数据量，每个样本关于此指标的数据分别等于n_i，常数k＝1/lns；

通过公式得到浓缩后的三个概括性指标因子(共性因子)信息熵值e_i；

对处理后出现极端异常值的数据可进行平移变换处理，以保证该方法的正常进行；

对若干用户私人风险偏好评估模型的影响因素进行因子分析并浓缩提取共性因子，即得到浓缩后的共性因子，权重值m_i(i＝1,2,3)为：

优选的，所述企业风险评估模块包括数据获取模块、模型搭建模块和风险计算模块，所述数据获取模块包括数据获取模块I和数据获取模块II，数据获取模块I用于获取历史数据采集模块I采集到的数据，然后进行清洗、整理和加工，得到标准化数据；

数据获取模块II用于通过互联网公开信息、第三方信息披露平台和第三方商业数据库获取特定企业归属行业类别、通过实时爬虫执行网页数据获取操作，获取得到企业投资产品资讯及研报文本信息后，对文本数据进行特殊情绪识别分析，判断词汇语句的情绪值；

模型搭建模块用于构建投资产品所属企业风险预警模型，首先根据数据获取模块I的数据构建所属企业风险预警一般模型，然后通过数据获取模块II得到的词汇语句的情绪值输入到所属企业风险预警一般模型中，以构建投资产品所属企业风险偏好评价模型；

风险计算模块用于将数据获取模块II获取的实时特征文本数据作为输入变量，输入到投资产品所属企业风险偏好评价模型中，计算得到企业综合风险值。

企业风险评估模块还可包括风险验证模型，通过不断迭代文本信息数据对应的行为特征在所述模型中的所占权重，对模型进行灵敏度测试检验，最佳适配权重指标与文本数据特征，以尽可能提高模型准确度。

优选的，对文本数据进行特殊情绪识别分析的过程为：

首先建立训练情感词典，将搜集的积极情感词表、消极情感词表、否定词表、程度副词表及特殊行业词汇进行整合去重，整理后加入其中；

输入获取得到的企业投资产品资讯及研报文本信息语句，对语句实行自动分词预处理，将其输入提前预设的训练情感词典后，根据判断规则对文本语句进行输入情感分类；

判断规则包括但不限于，以最简单的情形即情绪值满足基础线性叠加原理为基础，对于积极情感词汇赋予正向值权重，对消极情感词语赋予负向值权重；将语句进行分词，若词汇向量中包含相应词汇，叠加向前的权值；否定词赋予相反权值，程度副词赋予加倍权值等；

利用语法词汇出现位置规则对情感词按照既定判断规则进行加权，通过情感词典计算文本进行加权平均情感，最终根据总权值的正负性和绝对值大小，判断词汇语句的情绪值。

本发明在计算企业综合风险值过程中，除考虑企业本身固有信息数据对风险能力评估的影响以外，创新引入市场相关资讯、研报及政策导向等文本情感分析内容，对于识别市场模式和产品企业发展走向具有重要意义，增强对相关产品所属企业风险能力评估的全面性与客观性。

优选的，本发明中的用户个人风险承受能力值为一个区间，比如稳健型代表一定的阈值空间，风险预警模块用于将用户个人风险承受能力值与企业综合风险值进行匹配，当企业综合风险值超出用户个人风险承受能力值的区间时，则对用户进行风险预警提醒。

通过用户在不同行为状态下定性定量进行风险计算，当企业综合风险值超过户个人风险承受能力值的区间时，自动触发风险预警提醒功能，从而实现用户在投资决策过程中的智能风险控制。

本发明中未详尽之处，均可采用现有技术进行。

本发明的有益效果为：

本发明基于互联网公开数据，该智能风险控制系统能够对上市投资产品所归属的实体企业展开精准风险监控，同时对行业相关的金融新闻与政策导向作为市场环境的情绪价值参考，多角度对投资产品所属企业开展风险监控，对风险较大且超出用户风险承受能力范围的企业及相关产品进行早期预警；除考虑由用户基础信息决定的用户固定风险承受能力外，参考用户的互联网行为作为用户风险承受能力的重要影响因素，更加全面客观地对用户的风险承受能力进行量化，从而提高风险预警速度及风险能力评估准确度。

与传统技术相比，本系统提供用户个性化服务，提高了在投资决策过程中聚焦到每一位用户的风险监控覆盖范围的全面性与精确性，定性定量分析用户的风险承受能力及投资产品所属企业的综合风险值，提高风险预警速度及匹配风险数据准确度，使用户能够及时接收风险预警信息推送。

附图说明

图1为本发明的用户投资决策的智能风控系统示意图；

图2为特殊情绪识别分析流程图；

其中，11-数据采集模块，12-数据预处理模块，13-风险评估模块，14-风险预警模块，111-实时数据采集模块，112-历史数据采集模块，131-用户风险评估模块，132-企业风险评估模块。

具体实施方式：

实施例1

一种用户投资决策的智能风控系统，如图1所示，包括数据采集模块11、数据预处理模块12、风险评估模块13和风险预警模块14，其中，

数据采集模块11，用于获取用户及企业数据，并将其传输至数据处理模块；

数据预处理模块12，用于对数据采集模块采集的数据进行数据预处理；

风险评估模块13，用于对用户个人风险及产品所属企业风险进行评估，分别计算用户个人风险承受能力值及产品所属企业综合风险值；

风险预警模块14，用于根据风险评估模块得到的用户个人风险承受能力值及产品所属企业综合风险值进行预警信息推送提醒。

实施例2

一种用户投资决策的智能风控系统，如实施例1所述，所不同的是，数据采集模块11包括历史数据采集模块112和实时数据采集模块111；

历史数据采集模块112包括历史数据采集模块I和历史数据采集模块II，历史数据采集模块I通过与互联网公开信息平台对接，获取企业产品信息数据，包括企业信息数据、企业涉案数据、产品信息数据、产品涉案数据、互联网广告信息及评论信息数据、工商违法违规记录数据、司法数据、知识产权和专利数据、涉税数据等；历史数据采集模块II通过问卷等形式获取用户基础信息数据，包括用户的年龄、性别、婚姻状况、受教育程度、职业、收入、家庭开支情况、个人征信情况、固定资产、金融资产规模、产生焦虑感的最低投资亏损比例、投资经验、金融理财知识等，用户基础信息数据主要是通过用户自行填写的问卷调查信息来获取；

实时数据采集模块111包括实时数据采集模块I和实时数据采集模块II，实时数据采集模块I通过互联网公开信息、第三方信息披露平台和第三方商业数据库实时监测并获取所属企业重大异常行为，重大异常行为包括但不限于企业涉案行为、因税务等被相关部门警告处罚行为等；

实施例3

一种用户投资决策的智能风控系统，如实施例2所述，所不同的是，数据预处理模块12用于对采集到的数据进行标准化处理，在数据标准化处理过程中，对采集的任一项数据指标，找到其最大值X_max和最小值X_min，计算极差R＝X_max-X_min，再用每一项数据指标的真实值X与最小值X_min做差，再除以极差R，即：

实施例4

一种用户投资决策的智能风控系统，如实施例3所述，所不同的是，风险评估模块12包括用户风险评估模块131和企业风险评估模块132；

用户风险评估模块131，将用户的年龄、性别、婚姻状况、受教育程度、职业、收入、家庭开支情况、个人征信情况等作为用户社会人口统计学特征，将固定资产、金融资产规模、产生焦虑感的最低投资亏损比例等作为用户直接风险承受能力特征，将投资经验、金融理财知识等作为用户风险认知水平能力特征，根据三大特征建立用户私人风险偏好评估模型(建立模型的过程中将三大特征融合为一个用户私人风险偏好评估模型，模型的建立过程可参考现有技术，属于本领域的常规技术)，将用户风险评估三大特征输入能够得到用户风险偏好类型，并能够计算用户个人风险承受能力值；

对C₁、C₂和C₃进行标准化处理，获取标准数值

和

得到用户个人风险承受能力值Y公式为：

实施例5

一种用户投资决策的智能风控系统，如实施例4所述，所不同的是，得到权重值m_i(i＝1,2,3)的过程为：

公式概括表示为X＝μ+AM，其中A为相关系数，M为共性因子；

对实时数据采集模块II采集到的数据进行无量纲化处理

实施例6

一种用户投资决策的智能风控系统，如实施例5所述，所不同的是，企业风险评估模块131包括数据获取模块、模型搭建模块和风险计算模块，所述数据获取模块包括数据获取模块I和数据获取模块II，数据获取模块I用于获取历史数据采集模块I采集到的数据，然后进行清洗、整理和加工，得到标准化数据；

实施例7

一种用户投资决策的智能风控系统，如实施例6所述，所不同的是，对文本数据进行特殊情绪识别分析的过程为：

如图2所示，首先建立训练情感词典，将搜集的积极情感词表、消极情感词表、否定词表、程度副词表及特殊行业词汇进行整合去重，整理后加入其中；

实施例8

一种用户投资决策的智能风控系统，如实施例7所述，所不同的是，本实施例中的用户个人风险承受能力值为一个区间，比如稳健型代表一定的阈值空间，风险预警模块用于将用户个人风险承受能力值与企业综合风险值进行匹配，当企业综合风险值超出用户个人风险承受能力值的区间时，则对用户进行风险预警提醒。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种用户投资决策的智能风控系统，其特征在于，包括数据采集模块、数据预处理模块、风险评估模块和风险预警模块，其中，

2.根据权利要求1所述的用户投资决策的智能风控系统，其特征在于，所述数据采集模块包括历史数据采集模块和实时数据采集模块；

历史数据采集模块包括历史数据采集模块I和历史数据采集模块II，历史数据采集模块I通过与互联网公开信息平台对接，获取企业产品信息数据，包括企业信息数据、企业涉案数据、产品信息数据、产品涉案数据、互联网广告信息及评论信息数据、工商违法违规记录数据、司法数据、知识产权和专利数据、涉税数据；历史数据采集模块II获取用户基础信息数据，包括用户的年龄、性别、婚姻状况、受教育程度、职业、收入、家庭开支情况、个人征信情况、固定资产、金融资产规模、产生焦虑感的最低投资亏损比例、投资经验、金融理财知识；

所述实时数据采集模块包括实时数据采集模块I和实时数据采集模块II，实时数据采集模块I通过互联网公开信息、第三方信息披露平台和第三方商业数据库实时监测并获取所属企业重大异常行为；实时数据采集模块II与用户行为监测平台对接，实时监测用户互联网行为或通过情绪识别行为倾向。

3.根据权利要求2所述的用户投资决策的智能风控系统，其特征在于，所述数据预处理模块用于对采集到的数据进行标准化处理，在数据标准化处理过程中，对采集的任一项数据指标，找到其最大值X_max和最小值X_min，计算极差R＝X_max-X_min，再用每一项数据指标的真实值X与最小值X_min做差，再除以极差R，即：

4.根据权利要求3所述的用户投资决策的智能风控系统，其特征在于，所述风险评估模块包括用户风险评估模块和企业风险评估模块；

所述用户风险评估模块，将用户的年龄、性别、婚姻状况、受教育程度、职业、收入、家庭开支情况、个人征信情况作为用户社会人口统计学特征，将固定资产、金融资产规模、产生焦虑感的最低投资亏损比例作为用户直接风险承受能力特征，将投资经验、金融理财知识作为用户风险认知水平能力特征，根据三大特征建立用户私人风险偏好评估模型；

将实时数据采集模块II与用户行为监测平台对接得到的数据作为用户私人风险偏好评估模型的影响因素，包括用户浏览网页内容信息、用户浏览网页主题及时长信息、页面浏览完成度、互联网发言积极信息、互联网发言消极信息、互联网发言被举报信息、互联网发言被拉黑及禁言信息、互联网发言争吵频率信息、深夜购物app使用情况、深夜购物退款退单信息、各类app从下载到卸载平均使用时长、用户对不同类别app的使用粘性，对用户私人风险偏好评估模型进行实时训练；

对C₁、C₂和C₃进行标准化处理，获取标准数值