CN115456793A - 一种用户投资决策的智能风险控制系统 - Google Patents
一种用户投资决策的智能风险控制系统 Download PDFInfo
- Publication number
- CN115456793A CN115456793A CN202211085413.5A CN202211085413A CN115456793A CN 115456793 A CN115456793 A CN 115456793A CN 202211085413 A CN202211085413 A CN 202211085413A CN 115456793 A CN115456793 A CN 115456793A
- Authority
- CN
- China
- Prior art keywords
- risk
- user
- data
- information
- acquisition module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Operations Research (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- Finance (AREA)
- Pure & Applied Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Optimization (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Mathematical Analysis (AREA)
- Accounting & Taxation (AREA)
- Game Theory and Decision Science (AREA)
- Computational Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Technology Law (AREA)
- Algebra (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种用户投资决策的智能风险控制系统,属于投资风险控制技术领域,包括数据采集模块、数据预处理模块、风险评估模块和风险预警模块,本发明能够定性定量评估用户及产品所属企业的实时风险状态,从用户角度出发,既考虑用户本身固定的风险承受能力,同时通过用户客观行为更新其实时风险承受能力;从产品角度出发,一方面获取互联网公开产品及产品所属企业相关信息数据,评估产品所属企业风险状态,另一方面根据市场状态及政策导向等文本信息,对其进行数据情感分析识别以实现实时跟进。该系统提供了一种定制化风险监控及预警服务,提高风险预警速度及风险能力评估准确度,从而帮助用户在进行投资决策过程中实现风险实时预警服务。
Description
技术领域
本发明涉及一种用户投资决策的智能风险控制系统,属于投资风险控制技术领域。
背景技术
随着经济社会的不断发展,人们逐渐摆脱了以往传统线下金融投资交易模式,通过线上网站或各类app进行投资决策的电子交易日益增多,这给人们提供了一种更加省时省力的互联网金融交易方式。值得注意的是,大量信息涌入使得用户对相关产品及所属企业认知了解存在的信息差问题、用户对自身风险评价过于主观导致评估能力存在偏差等问题,都对用户投资决策带来影响,从而产生风险。
目前,现有技术对于用户投资决策的风险监控,通常分为以下两种。第一种仅从用户角度出发,通过用户调查问卷链接等形式开展,用户自行填写相关基础信息,工作人员根据其问卷结果,对用户风险承受能力进行分类评估。第二种仅从产品角度出发,通常是基于投资产品本身的涨跌波动,或根据历史区间数据对未来走势进行短时预测,仅向用户展现其涨跌幅度和数值数据,无法直接反映该投资产品的风险情况。
现有技术存在的缺陷为:从用户角度出发时,用户自行填写时主观性较强,可能与自身真实风险承受情况存在一定偏差,仅主观填写将无法通过用户行为客观体现,导致用户风险承受能力评估能力不够准确;从产品角度出发时,仅对产品本身走势进行涨跌预测,并未考虑产品所属企业本身存在的风险,而涨跌本身受到很多市场因素影响。各种技术手段无法精准预测风险,且无法聚焦到每一个独特的投资用户者,并未考虑个体差异性,因而风险监控覆盖范围不够精确,也无法在用户决策过程中对于风险进行及时识别与预警。
发明内容
针对现有技术的不足和应用的需求,本发明提供一种用户投资决策的智能风险控制系统,能够定性定量评估用户及产品所属企业的实时风险状态,从用户角度出发,既考虑用户本身固定的风险承受能力,同时通过用户客观行为更新其实时风险承受能力;从产品角度出发,一方面获取互联网公开产品及产品所属企业相关信息数据,评估产品所属企业风险状态,另一方面根据市场状态及政策导向等文本信息,对其进行数据情感分析识别以实现实时跟进。该系统将提供一种定制化风险监控及预警服务,提高风险预警速度及风险能力评估准确度,从而帮助用户在进行投资决策过程中实现风险实时预警服务。
本发明采用以下技术方案:
本发明提供了一种用户投资决策的智能风险控制系统,包括数据采集模块、数据预处理模块、风险评估模块和风险预警模块,其中,
所述数据采集模块,用于获取用户及企业数据,并将其传输至数据处理模块;
所述数据预处理模块,用于对数据采集模块采集的数据进行数据预处理;
所述风险评估模块,用于对用户个人风险及产品所属企业风险进行评估,分别计算用户个人风险承受能力值及产品所属企业综合风险值;
所述风险预警模块,用于根据风险评估模块得到的用户个人风险承受能力值及产品所属企业综合风险值进行预警信息推送提醒。
上述系统的工作原理在于:数据采集模块将互联网获取的公开数据向数据预处理模块传输,经数据预处理模块标准化处理完毕后,向风险评估模块进行传送;风险评估模块分别对用户行为和企业行为进行模型搭建与数据处理分析,计算用户个人风险承受能力值和产品所属企业综合风险值;计算后的数值向风险预警模块进行传输,将二者进行匹配,当风险值超过预设值时,风险预警模块将向用户及时进行预警信息推送提醒,以达到风险及时预警的目的。
优选的,所述数据采集模块包括历史数据采集模块和实时数据采集模块;
历史数据采集模块包括历史数据采集模块I和历史数据采集模块II,历史数据采集模块I通过与互联网公开信息平台对接,获取企业产品信息数据,包括企业信息数据、企业涉案数据、产品信息数据、产品涉案数据、互联网广告信息及评论信息数据、工商违法违规记录数据、司法数据、知识产权和专利数据、涉税数据等;历史数据采集模块II通过问卷等形式获取用户基础信息数据,包括用户的年龄、性别、婚姻状况、受教育程度、职业、收入、家庭开支情况、个人征信情况、固定资产、金融资产规模、产生焦虑感的最低投资亏损比例、投资经验、金融理财知识等,用户基础信息数据主要是通过用户自行填写的问卷调查信息来获取;
所述实时数据采集模块包括实时数据采集模块I和实时数据采集模块II,实时数据采集模块I通过互联网公开信息、第三方信息披露平台和第三方商业数据库实时监测并获取所属企业重大异常行为,重大异常行为包括但不限于企业涉案行为、因税务等被相关部门警告处罚行为等;
实时数据采集模块II与用户行为监测平台(即第三方行为监测平台)对接,实时监测用户互联网行为或通过情绪识别行为倾向,将其作为用户本身风险承受能力评估的重要影响因素。
上述数据采集模块实现了对用户基础信息数据、用户互联网客观行为数据、企业基础信息数据、企业实时重大异常行为数据获取,进一步增强了该智能风控系统对其可能存在的风险的多方面综合监控能力。
优选的,所述数据预处理模块用于对采集到的数据进行标准化处理,在数据标准化处理过程中,对采集的任一项数据指标,找到其最大值Xmax和最小值Xmin,计算极差R=Xmax-Xmin,再用每一项数据指标的真实值X与最小值Xmin做差,再除以极差R,即:
上述数据处理方式对数据采集模块传输的数据进行数据标准化处理,通过无量纲化处理使数据具有可比性,是一种高效直接的数据处理方式。
优选的,所述风险评估模块包括用户风险评估模块和企业风险评估模块;
所述用户风险评估模块,将用户的年龄、性别、婚姻状况、受教育程度、职业、收入、家庭开支情况、个人征信情况等作为用户社会人口统计学特征,将固定资产、金融资产规模、产生焦虑感的最低投资亏损比例等作为用户直接风险承受能力特征,将投资经验、金融理财知识等作为用户风险认知水平能力特征,根据三大特征建立用户私人风险偏好评估模型(建立模型的过程中将三大特征融合为一个用户私人风险偏好评估模型,模型的建立过程可参考现有技术,属于本领域的常规技术),将用户风险评估三大特征输入能够得到用户风险偏好类型,并能够计算用户个人风险承受能力值;
将实时数据采集模块II与用户行为监测平台对接得到的数据作为用户私人风险偏好评估模型的影响因素,包括用户浏览网页内容信息、用户浏览网页主题及时长信息、页面浏览完成度、互联网发言积极信息、互联网发言消极信息、互联网发言被举报信息、互联网发言被拉黑及禁言信息、互联网发言争吵频率信息、深夜购物app使用情况、深夜购物退款退单信息、各类app从下载到卸载平均使用时长、用户对不同类别app的使用粘性等,对用户私人风险偏好评估模型进行实时训练;
对用户私人风险偏好评估模型的影响因素进行浓缩,浓缩成三个概括性指标因子,即用户的历史网络浏览信息、互联网发言信息、各大app使用情况;
将实时数据采集模块II得到的上述用户的历史网络浏览信息、互联网发言信息、各大app使用情况等影响因素相关数据,进行归一化、统一量纲数据预处理,得到各项概括性指标因素对应数值Ci(i=1,2,3);
通过信息熵法得到三个概括性指标因子影响风险偏好评估结果的权重值mi(i=1,2,3);
优选的,得到权重值mi(i=1,2,3)的过程为:
建立一般模型,设X=(X1,X2,…,Xp)T是用户私人风险偏好评估模型的影响因素数据,m=(m1,m2,m3)T为共性因子,即浓缩后的三个概括性指标因子数据,且E(X)=μ=(μ1,μ2,…,μp)T,E(X)表示数学期望E对影响因素X=(X1,X2,…,Xp)T作用下的一个均值表达形式,μ为均值,p为影响因素总量,μ1,μ2,μp为每一影响因素下对应的均值;
Var(X)=∑=(aij)p×p为因子负荷矩阵,即随机变量与共性因子之间的相关系数;
公式概括表示为X=μ+AM,其中A为相关系数,M为共性因子;
利用多影响因素对风险评价体系影响下的共性因子(概括性影响因素)提供的信息熵来确定指标权重;
信息熵用来评价信息的有序程度及信息的效用值。信息熵越大,信息的无序度越高,其信息的效用值越小;反之,信息熵越小,信息的无序度越低,信息的效用值越大。
将每一个概括性指标因子作为一个系统,样本数为s,样本数是指每一概括性指标因子下所包含的数据量,每个样本关于此指标的数据分别等于ni,常数k=1/lns;
通过公式得到浓缩后的三个概括性指标因子(共性因子)信息熵值ei;
对处理后出现极端异常值的数据可进行平移变换处理,以保证该方法的正常进行;
对若干用户私人风险偏好评估模型的影响因素进行因子分析并浓缩提取共性因子,即得到浓缩后的共性因子,权重值mi(i=1,2,3)为:
优选的,所述企业风险评估模块包括数据获取模块、模型搭建模块和风险计算模块,所述数据获取模块包括数据获取模块I和数据获取模块II,数据获取模块I用于获取历史数据采集模块I采集到的数据,然后进行清洗、整理和加工,得到标准化数据;
数据获取模块II用于通过互联网公开信息、第三方信息披露平台和第三方商业数据库获取特定企业归属行业类别、通过实时爬虫执行网页数据获取操作,获取得到企业投资产品资讯及研报文本信息后,对文本数据进行特殊情绪识别分析,判断词汇语句的情绪值;
模型搭建模块用于构建投资产品所属企业风险预警模型,首先根据数据获取模块I的数据构建所属企业风险预警一般模型,然后通过数据获取模块II得到的词汇语句的情绪值输入到所属企业风险预警一般模型中,以构建投资产品所属企业风险偏好评价模型;
风险计算模块用于将数据获取模块II获取的实时特征文本数据作为输入变量,输入到投资产品所属企业风险偏好评价模型中,计算得到企业综合风险值。
企业风险评估模块还可包括风险验证模型,通过不断迭代文本信息数据对应的行为特征在所述模型中的所占权重,对模型进行灵敏度测试检验,最佳适配权重指标与文本数据特征,以尽可能提高模型准确度。
优选的,对文本数据进行特殊情绪识别分析的过程为:
首先建立训练情感词典,将搜集的积极情感词表、消极情感词表、否定词表、程度副词表及特殊行业词汇进行整合去重,整理后加入其中;
输入获取得到的企业投资产品资讯及研报文本信息语句,对语句实行自动分词预处理,将其输入提前预设的训练情感词典后,根据判断规则对文本语句进行输入情感分类;
判断规则包括但不限于,以最简单的情形即情绪值满足基础线性叠加原理为基础,对于积极情感词汇赋予正向值权重,对消极情感词语赋予负向值权重;将语句进行分词,若词汇向量中包含相应词汇,叠加向前的权值;否定词赋予相反权值,程度副词赋予加倍权值等;
利用语法词汇出现位置规则对情感词按照既定判断规则进行加权,通过情感词典计算文本进行加权平均情感,最终根据总权值的正负性和绝对值大小,判断词汇语句的情绪值。
本发明在计算企业综合风险值过程中,除考虑企业本身固有信息数据对风险能力评估的影响以外,创新引入市场相关资讯、研报及政策导向等文本情感分析内容,对于识别市场模式和产品企业发展走向具有重要意义,增强对相关产品所属企业风险能力评估的全面性与客观性。
优选的,本发明中的用户个人风险承受能力值为一个区间,比如稳健型代表一定的阈值空间,风险预警模块用于将用户个人风险承受能力值与企业综合风险值进行匹配,当企业综合风险值超出用户个人风险承受能力值的区间时,则对用户进行风险预警提醒。
通过用户在不同行为状态下定性定量进行风险计算,当企业综合风险值超过户个人风险承受能力值的区间时,自动触发风险预警提醒功能,从而实现用户在投资决策过程中的智能风险控制。
本发明中未详尽之处,均可采用现有技术进行。
本发明的有益效果为:
本发明基于互联网公开数据,该智能风险控制系统能够对上市投资产品所归属的实体企业展开精准风险监控,同时对行业相关的金融新闻与政策导向作为市场环境的情绪价值参考,多角度对投资产品所属企业开展风险监控,对风险较大且超出用户风险承受能力范围的企业及相关产品进行早期预警;除考虑由用户基础信息决定的用户固定风险承受能力外,参考用户的互联网行为作为用户风险承受能力的重要影响因素,更加全面客观地对用户的风险承受能力进行量化,从而提高风险预警速度及风险能力评估准确度。
与传统技术相比,本系统提供用户个性化服务,提高了在投资决策过程中聚焦到每一位用户的风险监控覆盖范围的全面性与精确性,定性定量分析用户的风险承受能力及投资产品所属企业的综合风险值,提高风险预警速度及匹配风险数据准确度,使用户能够及时接收风险预警信息推送。
附图说明
图1为本发明的用户投资决策的智能风控系统示意图;
图2为特殊情绪识别分析流程图;
其中,11-数据采集模块,12-数据预处理模块,13-风险评估模块,14-风险预警模块,111-实时数据采集模块,112-历史数据采集模块,131-用户风险评估模块,132-企业风险评估模块。
具体实施方式:
实施例1
一种用户投资决策的智能风控系统,如图1所示,包括数据采集模块11、数据预处理模块12、风险评估模块13和风险预警模块14,其中,
数据采集模块11,用于获取用户及企业数据,并将其传输至数据处理模块;
数据预处理模块12,用于对数据采集模块采集的数据进行数据预处理;
风险评估模块13,用于对用户个人风险及产品所属企业风险进行评估,分别计算用户个人风险承受能力值及产品所属企业综合风险值;
风险预警模块14,用于根据风险评估模块得到的用户个人风险承受能力值及产品所属企业综合风险值进行预警信息推送提醒。
上述系统的工作原理在于:数据采集模块将互联网获取的公开数据向数据预处理模块传输,经数据预处理模块标准化处理完毕后,向风险评估模块进行传送;风险评估模块分别对用户行为和企业行为进行模型搭建与数据处理分析,计算用户个人风险承受能力值和产品所属企业综合风险值;计算后的数值向风险预警模块进行传输,将二者进行匹配,当风险值超过预设值时,风险预警模块将向用户及时进行预警信息推送提醒,以达到风险及时预警的目的。
实施例2
一种用户投资决策的智能风控系统,如实施例1所述,所不同的是,数据采集模块11包括历史数据采集模块112和实时数据采集模块111;
历史数据采集模块112包括历史数据采集模块I和历史数据采集模块II,历史数据采集模块I通过与互联网公开信息平台对接,获取企业产品信息数据,包括企业信息数据、企业涉案数据、产品信息数据、产品涉案数据、互联网广告信息及评论信息数据、工商违法违规记录数据、司法数据、知识产权和专利数据、涉税数据等;历史数据采集模块II通过问卷等形式获取用户基础信息数据,包括用户的年龄、性别、婚姻状况、受教育程度、职业、收入、家庭开支情况、个人征信情况、固定资产、金融资产规模、产生焦虑感的最低投资亏损比例、投资经验、金融理财知识等,用户基础信息数据主要是通过用户自行填写的问卷调查信息来获取;
实时数据采集模块111包括实时数据采集模块I和实时数据采集模块II,实时数据采集模块I通过互联网公开信息、第三方信息披露平台和第三方商业数据库实时监测并获取所属企业重大异常行为,重大异常行为包括但不限于企业涉案行为、因税务等被相关部门警告处罚行为等;
实时数据采集模块II与用户行为监测平台(即第三方行为监测平台)对接,实时监测用户互联网行为或通过情绪识别行为倾向,将其作为用户本身风险承受能力评估的重要影响因素。
上述数据采集模块实现了对用户基础信息数据、用户互联网客观行为数据、企业基础信息数据、企业实时重大异常行为数据获取,进一步增强了该智能风控系统对其可能存在的风险的多方面综合监控能力。
实施例3
一种用户投资决策的智能风控系统,如实施例2所述,所不同的是,数据预处理模块12用于对采集到的数据进行标准化处理,在数据标准化处理过程中,对采集的任一项数据指标,找到其最大值Xmax和最小值Xmin,计算极差R=Xmax-Xmin,再用每一项数据指标的真实值X与最小值Xmin做差,再除以极差R,即:
上述数据处理方式对数据采集模块传输的数据进行数据标准化处理,通过无量纲化处理使数据具有可比性,是一种高效直接的数据处理方式。
实施例4
一种用户投资决策的智能风控系统,如实施例3所述,所不同的是,风险评估模块12包括用户风险评估模块131和企业风险评估模块132;
用户风险评估模块131,将用户的年龄、性别、婚姻状况、受教育程度、职业、收入、家庭开支情况、个人征信情况等作为用户社会人口统计学特征,将固定资产、金融资产规模、产生焦虑感的最低投资亏损比例等作为用户直接风险承受能力特征,将投资经验、金融理财知识等作为用户风险认知水平能力特征,根据三大特征建立用户私人风险偏好评估模型(建立模型的过程中将三大特征融合为一个用户私人风险偏好评估模型,模型的建立过程可参考现有技术,属于本领域的常规技术),将用户风险评估三大特征输入能够得到用户风险偏好类型,并能够计算用户个人风险承受能力值;
将实时数据采集模块II与用户行为监测平台对接得到的数据作为用户私人风险偏好评估模型的影响因素,包括用户浏览网页内容信息、用户浏览网页主题及时长信息、页面浏览完成度、互联网发言积极信息、互联网发言消极信息、互联网发言被举报信息、互联网发言被拉黑及禁言信息、互联网发言争吵频率信息、深夜购物app使用情况、深夜购物退款退单信息、各类app从下载到卸载平均使用时长、用户对不同类别app的使用粘性等,对用户私人风险偏好评估模型进行实时训练;
对用户私人风险偏好评估模型的影响因素进行浓缩,浓缩成三个概括性指标因子,即用户的历史网络浏览信息、互联网发言信息、各大app使用情况;
将实时数据采集模块II得到的上述用户的历史网络浏览信息、互联网发言信息、各大app使用情况等影响因素相关数据,进行归一化、统一量纲数据预处理,得到各项概括性指标因素对应数值Ci(i=1,2,3);
通过信息熵法得到三个概括性指标因子影响风险偏好评估结果的权重值mi(i=1,2,3);
实施例5
一种用户投资决策的智能风控系统,如实施例4所述,所不同的是,得到权重值mi(i=1,2,3)的过程为:
建立一般模型,设X=(X1,X2,…,Xp)T是用户私人风险偏好评估模型的影响因素数据,m=(m1,m2,m3)T为共性因子,即浓缩后的三个概括性指标因子数据,且E(X)=μ=(μ1,μ2,…,μp)T,E(X)表示数学期望E对影响因素X=(X1,X2,…,Xp)T作用下的一个均值表达形式,μ为均值,p为影响因素总量,μ1,μ2,μp为每一影响因素下对应的均值;
Var(X)=∑=(aij)p×p为因子负荷矩阵,即随机变量与共性因子之间的相关系数;
公式概括表示为X=μ+AM,其中A为相关系数,M为共性因子;
利用多影响因素对风险评价体系影响下的共性因子(概括性影响因素)提供的信息熵来确定指标权重;
信息熵用来评价信息的有序程度及信息的效用值。信息熵越大,信息的无序度越高,其信息的效用值越小;反之,信息熵越小,信息的无序度越低,信息的效用值越大。
将每一个概括性指标因子作为一个系统,样本数为s,样本数是指每一概括性指标因子下所包含的数据量,每个样本关于此指标的数据分别等于ni,常数k=1/lns;
通过公式得到浓缩后的三个概括性指标因子(共性因子)信息熵值ei;
对处理后出现极端异常值的数据可进行平移变换处理,以保证该方法的正常进行;
对若干用户私人风险偏好评估模型的影响因素进行因子分析并浓缩提取共性因子,即得到浓缩后的共性因子,权重值mi(i=1,2,3)为:
实施例6
一种用户投资决策的智能风控系统,如实施例5所述,所不同的是,企业风险评估模块131包括数据获取模块、模型搭建模块和风险计算模块,所述数据获取模块包括数据获取模块I和数据获取模块II,数据获取模块I用于获取历史数据采集模块I采集到的数据,然后进行清洗、整理和加工,得到标准化数据;
数据获取模块II用于通过互联网公开信息、第三方信息披露平台和第三方商业数据库获取特定企业归属行业类别、通过实时爬虫执行网页数据获取操作,获取得到企业投资产品资讯及研报文本信息后,对文本数据进行特殊情绪识别分析,判断词汇语句的情绪值;
模型搭建模块用于构建投资产品所属企业风险预警模型,首先根据数据获取模块I的数据构建所属企业风险预警一般模型,然后通过数据获取模块II得到的词汇语句的情绪值输入到所属企业风险预警一般模型中,以构建投资产品所属企业风险偏好评价模型;
风险计算模块用于将数据获取模块II获取的实时特征文本数据作为输入变量,输入到投资产品所属企业风险偏好评价模型中,计算得到企业综合风险值。
企业风险评估模块还可包括风险验证模型,通过不断迭代文本信息数据对应的行为特征在所述模型中的所占权重,对模型进行灵敏度测试检验,最佳适配权重指标与文本数据特征,以尽可能提高模型准确度。
实施例7
一种用户投资决策的智能风控系统,如实施例6所述,所不同的是,对文本数据进行特殊情绪识别分析的过程为:
如图2所示,首先建立训练情感词典,将搜集的积极情感词表、消极情感词表、否定词表、程度副词表及特殊行业词汇进行整合去重,整理后加入其中;
输入获取得到的企业投资产品资讯及研报文本信息语句,对语句实行自动分词预处理,将其输入提前预设的训练情感词典后,根据判断规则对文本语句进行输入情感分类;
判断规则包括但不限于,以最简单的情形即情绪值满足基础线性叠加原理为基础,对于积极情感词汇赋予正向值权重,对消极情感词语赋予负向值权重;将语句进行分词,若词汇向量中包含相应词汇,叠加向前的权值;否定词赋予相反权值,程度副词赋予加倍权值等;
利用语法词汇出现位置规则对情感词按照既定判断规则进行加权,通过情感词典计算文本进行加权平均情感,最终根据总权值的正负性和绝对值大小,判断词汇语句的情绪值。
本发明在计算企业综合风险值过程中,除考虑企业本身固有信息数据对风险能力评估的影响以外,创新引入市场相关资讯、研报及政策导向等文本情感分析内容,对于识别市场模式和产品企业发展走向具有重要意义,增强对相关产品所属企业风险能力评估的全面性与客观性。
实施例8
一种用户投资决策的智能风控系统,如实施例7所述,所不同的是,本实施例中的用户个人风险承受能力值为一个区间,比如稳健型代表一定的阈值空间,风险预警模块用于将用户个人风险承受能力值与企业综合风险值进行匹配,当企业综合风险值超出用户个人风险承受能力值的区间时,则对用户进行风险预警提醒。
通过用户在不同行为状态下定性定量进行风险计算,当企业综合风险值超过户个人风险承受能力值的区间时,自动触发风险预警提醒功能,从而实现用户在投资决策过程中的智能风险控制。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (8)
1.一种用户投资决策的智能风控系统,其特征在于,包括数据采集模块、数据预处理模块、风险评估模块和风险预警模块,其中,
所述数据采集模块,用于获取用户及企业数据,并将其传输至数据处理模块;
所述数据预处理模块,用于对数据采集模块采集的数据进行数据预处理;
所述风险评估模块,用于对用户个人风险及产品所属企业风险进行评估,分别计算用户个人风险承受能力值及产品所属企业综合风险值;
所述风险预警模块,用于根据风险评估模块得到的用户个人风险承受能力值及产品所属企业综合风险值进行预警信息推送提醒。
2.根据权利要求1所述的用户投资决策的智能风控系统,其特征在于,所述数据采集模块包括历史数据采集模块和实时数据采集模块;
历史数据采集模块包括历史数据采集模块I和历史数据采集模块II,历史数据采集模块I通过与互联网公开信息平台对接,获取企业产品信息数据,包括企业信息数据、企业涉案数据、产品信息数据、产品涉案数据、互联网广告信息及评论信息数据、工商违法违规记录数据、司法数据、知识产权和专利数据、涉税数据;历史数据采集模块II获取用户基础信息数据,包括用户的年龄、性别、婚姻状况、受教育程度、职业、收入、家庭开支情况、个人征信情况、固定资产、金融资产规模、产生焦虑感的最低投资亏损比例、投资经验、金融理财知识;
所述实时数据采集模块包括实时数据采集模块I和实时数据采集模块II,实时数据采集模块I通过互联网公开信息、第三方信息披露平台和第三方商业数据库实时监测并获取所属企业重大异常行为;实时数据采集模块II与用户行为监测平台对接,实时监测用户互联网行为或通过情绪识别行为倾向。
4.根据权利要求3所述的用户投资决策的智能风控系统,其特征在于,所述风险评估模块包括用户风险评估模块和企业风险评估模块;
所述用户风险评估模块,将用户的年龄、性别、婚姻状况、受教育程度、职业、收入、家庭开支情况、个人征信情况作为用户社会人口统计学特征,将固定资产、金融资产规模、产生焦虑感的最低投资亏损比例作为用户直接风险承受能力特征,将投资经验、金融理财知识作为用户风险认知水平能力特征,根据三大特征建立用户私人风险偏好评估模型;
将实时数据采集模块II与用户行为监测平台对接得到的数据作为用户私人风险偏好评估模型的影响因素,包括用户浏览网页内容信息、用户浏览网页主题及时长信息、页面浏览完成度、互联网发言积极信息、互联网发言消极信息、互联网发言被举报信息、互联网发言被拉黑及禁言信息、互联网发言争吵频率信息、深夜购物app使用情况、深夜购物退款退单信息、各类app从下载到卸载平均使用时长、用户对不同类别app的使用粘性,对用户私人风险偏好评估模型进行实时训练;
对用户私人风险偏好评估模型的影响因素进行浓缩,浓缩成三个概括性指标因子,即用户的历史网络浏览信息、互联网发言信息、各大app使用情况;
将实时数据采集模块II得到的上述用户的历史网络浏览信息、互联网发言信息、各大app使用情况等影响因素相关数据,进行归一化、统一量纲数据预处理,得到各项概括性指标因素对应数值Ci(i=1,2,3);
通过信息熵法得到三个概括性指标因子影响风险偏好评估结果的权重值mi(i=1,2,3);
5.根据权利要求4所述的用户投资决策的智能风控系统,其特征在于,得到权重值mi(i=1,2,3)的过程为:
建立一般模型,设X=(X1,X2,…,Xp)T是用户私人风险偏好评估模型的影响因素数据,m=(m1,m2,m3)T为共性因子,即浓缩后的三个概括性指标因子数据,且E(X)=μ=(μ1,μ2,…,μp)T,E(X)表示数学期望E对影响因素X=(X1,X2,…,Xp)T作用下的一个均值表达形式,μ为均值,p为影响因素总量,μ1,μ2,μp为每一影响因素下对应的均值;
Var(X)=∑=(aij)p×p为因子负荷矩阵,即随机变量与共性因子之间的相关系数;
公式概括表示为X=μ+AM,其中A为相关系数,M为共性因子;
利用多影响因素对风险评价体系影响下的共性因子(概括性影响因素)提供的信息熵来确定指标权重;
将每一个概括性指标因子作为一个系统,样本数为s,样本数是指每一概括性指标因子下所包含的数据量,每个样本关于此指标的数据分别等于ni,常数k=1/lns;
通过公式得到浓缩后的三个概括性指标因子信息熵值ei;
三个概括性指标因子权重值mi(i=1,2,3)为:
6.根据权利要求5所述的用户投资决策的智能风控系统,其特征在于,所述企业风险评估模块包括数据获取模块、模型搭建模块和风险计算模块,所述数据获取模块包括数据获取模块I和数据获取模块II,数据获取模块I用于获取历史数据采集模块I采集到的数据,然后进行清洗、整理和加工,得到标准化数据;
数据获取模块II用于通过互联网公开信息、第三方信息披露平台和第三方商业数据库获取特定企业归属行业类别、通过实时爬虫执行网页数据获取操作,获取得到企业投资产品资讯及研报文本信息后,对文本数据进行特殊情绪识别分析,判断词汇语句的情绪值;
模型搭建模块用于构建投资产品所属企业风险预警模型,首先根据数据获取模块I的数据构建所属企业风险预警一般模型,然后通过数据获取模块II得到的词汇语句的情绪值输入到所属企业风险预警一般模型中,以构建投资产品所属企业风险偏好评价模型;
风险计算模块用于将数据获取模块II获取的实时特征文本数据作为输入变量,输入到投资产品所属企业风险偏好评价模型中,计算得到企业综合风险值。
7.根据权利要求6所述的用户投资决策的智能风控系统,其特征在于,对文本数据进行特殊情绪识别分析的过程为:
首先建立训练情感词典,将搜集的积极情感词表、消极情感词表、否定词表、程度副词表及特殊行业词汇进行整合去重,整理后加入其中;
输入获取得到的企业投资产品资讯及研报文本信息语句,对语句实行自动分词预处理,将其输入提前预设的训练情感词典后,根据判断规则对文本语句进行输入情感分类;
判断规则包括但不限于,以最简单的情形即情绪值满足基础线性叠加原理为基础,对于积极情感词汇赋予正向值权重,对消极情感词语赋予负向值权重;将语句进行分词,若词汇向量中包含相应词汇,叠加向前的权值;否定词赋予相反权值,程度副词赋予加倍权值;
利用语法词汇出现位置规则对情感词按照既定判断规则进行加权,通过情感词典计算文本进行加权平均情感,最终根据总权值的正负性和绝对值大小,判断词汇语句的情绪值。
8.根据权利要求7所述的用户投资决策的智能风控系统,其特征在于,用户个人风险承受能力值为区间,风险预警模块用于将用户个人风险承受能力值与企业综合风险值进行匹配,当企业综合风险值超出用户个人风险承受能力值的区间时,则对用户进行风险预警提醒。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211085413.5A CN115456793A (zh) | 2022-09-06 | 2022-09-06 | 一种用户投资决策的智能风险控制系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211085413.5A CN115456793A (zh) | 2022-09-06 | 2022-09-06 | 一种用户投资决策的智能风险控制系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115456793A true CN115456793A (zh) | 2022-12-09 |
Family
ID=84303043
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211085413.5A Pending CN115456793A (zh) | 2022-09-06 | 2022-09-06 | 一种用户投资决策的智能风险控制系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115456793A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116562649A (zh) * | 2023-05-12 | 2023-08-08 | 实道时代(北京)科技有限公司 | 基于人工智能的投资决策管理方法、系统及存储介质 |
CN116611696A (zh) * | 2023-07-19 | 2023-08-18 | 北京大学 | 一种基于时间序列分析的数字资产市场风险预测系统 |
CN117556225A (zh) * | 2024-01-12 | 2024-02-13 | 杭银消费金融股份有限公司 | 一种人行征信数据风险管理系统 |
CN118037422A (zh) * | 2024-01-30 | 2024-05-14 | 深圳信钛数科科技有限公司 | 一种用于银行业的线上大数据智慧风控系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112365265A (zh) * | 2020-10-26 | 2021-02-12 | 建投数据科技(山东)有限公司 | 一种互联网金融智能风控系统 |
CN113297283A (zh) * | 2020-11-12 | 2021-08-24 | 苏宁金融科技(南京)有限公司 | 用于企业风险预警的舆情分析方法及系统 |
CN113887908A (zh) * | 2021-09-24 | 2022-01-04 | 浙江工业大学 | 考虑主客观交叉融合权重的桥梁风险评估方法 |
-
2022
- 2022-09-06 CN CN202211085413.5A patent/CN115456793A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112365265A (zh) * | 2020-10-26 | 2021-02-12 | 建投数据科技(山东)有限公司 | 一种互联网金融智能风控系统 |
CN113297283A (zh) * | 2020-11-12 | 2021-08-24 | 苏宁金融科技(南京)有限公司 | 用于企业风险预警的舆情分析方法及系统 |
CN113887908A (zh) * | 2021-09-24 | 2022-01-04 | 浙江工业大学 | 考虑主客观交叉融合权重的桥梁风险评估方法 |
Non-Patent Citations (1)
Title |
---|
姜旭初,姜威;, 北京:冶金工业出版社 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116562649A (zh) * | 2023-05-12 | 2023-08-08 | 实道时代(北京)科技有限公司 | 基于人工智能的投资决策管理方法、系统及存储介质 |
CN116611696A (zh) * | 2023-07-19 | 2023-08-18 | 北京大学 | 一种基于时间序列分析的数字资产市场风险预测系统 |
CN116611696B (zh) * | 2023-07-19 | 2024-01-26 | 北京大学 | 一种基于时间序列分析的数字资产市场风险预测系统 |
CN117556225A (zh) * | 2024-01-12 | 2024-02-13 | 杭银消费金融股份有限公司 | 一种人行征信数据风险管理系统 |
CN117556225B (zh) * | 2024-01-12 | 2024-04-05 | 杭银消费金融股份有限公司 | 一种人行征信数据风险管理系统 |
CN118037422A (zh) * | 2024-01-30 | 2024-05-14 | 深圳信钛数科科技有限公司 | 一种用于银行业的线上大数据智慧风控系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115456793A (zh) | 一种用户投资决策的智能风险控制系统 | |
CN110070391B (zh) | 数据处理方法、装置、计算机可读介质及电子设备 | |
Revathy et al. | Sentiment analysis using machine learning: Progress in the machine intelligence for data science | |
Zeinalizadeh et al. | Modeling and analysis of bank customer satisfaction using neural networks approach | |
CN111507831A (zh) | 信贷风险自动评估方法和装置 | |
CN110570941B (zh) | 一种基于文本语义向量模型评估心理状态的系统和装置 | |
Chuang et al. | A hybrid neural network approach for credit scoring | |
US20190066020A1 (en) | Multi-Variable Assessment Systems and Methods that Evaluate and Predict Entrepreneurial Behavior | |
KR101834008B1 (ko) | 음성 데이터 기반 신용평가 장치, 방법 및 컴퓨터 프로그램 | |
US20220261819A1 (en) | System and method for determining and managing environmental, social, and governance (esg) perception of entities and industries through use of survey and media data | |
CN116664012A (zh) | 一种基于大数据分析的企业信用评估方法及系统 | |
Howard et al. | Evaluating proposed fairness models for face recognition algorithms | |
Whittingham et al. | Personality traits, basic individual values and GMO risk perception of twitter users | |
Lei et al. | On stock volatility forecasting based on text mining and deep learning under high‐frequency data | |
Chen et al. | Forecasting corporate credit ratings using big data from social media | |
CN116501840A (zh) | 一种用于获客营销的nlp智能分析方法 | |
EP4044097A1 (en) | System and method for determining and managing environmental, social, and governance (esg) perception of entities and industries through use of survey and media data | |
CN117312514A (zh) | 咨询答复方法、装置及计算机可读取存储介质 | |
Alamsyah et al. | Recognizing Personality from Social Media Linguistic Cues: A Case Study of Brand Ambassador Personality | |
Lo et al. | Do polluting firms suffer long term? Can government use data‐driven inspection policies to catch polluters? | |
CN115271282A (zh) | 基于模糊逻辑的客户价值确定方法及装置 | |
CN117235264A (zh) | 文本处理方法、装置、设备和计算机可读存储介质 | |
Lovell et al. | Using machine learning to assess rape reports: Sentiment analysis detection of officers'“signaling” about victims' credibility | |
CN109816234A (zh) | 服务准入方法、服务准入装置、电子设备及存储介质 | |
CN117455681A (zh) | 业务风险预测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |