CN112419029A - 类金融机构风险监控方法、风险模拟系统及存储介质 - Google Patents
类金融机构风险监控方法、风险模拟系统及存储介质 Download PDFInfo
- Publication number
- CN112419029A CN112419029A CN202011368381.0A CN202011368381A CN112419029A CN 112419029 A CN112419029 A CN 112419029A CN 202011368381 A CN202011368381 A CN 202011368381A CN 112419029 A CN112419029 A CN 112419029A
- Authority
- CN
- China
- Prior art keywords
- information
- risk
- sample data
- emotion
- index information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000004088 simulation Methods 0.000 title claims abstract description 60
- 238000012544 monitoring process Methods 0.000 title claims abstract description 29
- 230000007246 mechanism Effects 0.000 claims abstract description 63
- 238000009826 distribution Methods 0.000 claims abstract description 53
- 238000005315 distribution function Methods 0.000 claims abstract description 39
- 238000005070 sampling Methods 0.000 claims abstract description 22
- 238000000342 Monte Carlo simulation Methods 0.000 claims abstract description 18
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 230000000694 effects Effects 0.000 claims abstract description 7
- 230000004927 fusion Effects 0.000 claims abstract description 4
- 230000008451 emotion Effects 0.000 claims description 120
- 238000002844 melting Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 15
- 230000008018 melting Effects 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 10
- 238000012935 Averaging Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 8
- 230000008520 organization Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 2
- 238000013077 scoring method Methods 0.000 claims description 2
- 239000010931 gold Substances 0.000 abstract description 6
- 229910052737 gold Inorganic materials 0.000 abstract description 6
- 230000006870 function Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 241000272778 Cygnus atratus Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008909 emotion recognition Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种类金融机构风险监控方法、风险模拟系统及存储介质,其方法包括获取样本数据信息;将样本数据信息进行数据预处理以形成若干相关联的类金融机构的舆情指数信息;将舆情指数信息进行曲线拟合以形成概率分布拟合曲线,判断该概率分布拟合曲线服从的分布函数及其对应参数以获取参数已知的概率分布函数;将参数已知的概率分布函数通过马尔科夫链蒙特卡洛模拟进行抽样以获取抽样样本数据;获取若干相关联的类金融机构的实缴资本信息;将若干相关联的类金融机构所对应的实缴资本信息以及抽样样本数据通过动态网络仿真方法分析并获取对应该类相关联的类金融机构的风险状况。本申请具有可以对类金融机构较好地进行风险监控的效果。
Description
技术领域
本发明涉及金融风险管理的技术领域,尤其是涉及一种类金融机构风险监控方法、 风险模拟系统及存储介质。
背景技术
类金融机构是从事金融活动,但是并未获得金融许可证,非由国家金融监管部门直 接监管的企业。与传统的金融机构不同,其通常以地方性机构以及民营形式为主,客户质量 较低且业务风险大,财务数据往往不公开且未经第三方审计,融资能力有限并需要银行等正 规金融机构支持而有可能造成金融系统性风险。
如今对于风险的度量以及风险情景模拟通常针对一些数据易于获取,且数据分布较 为常见的机构(例如上市公司、银行等具有资质的金融机构),通过资产收益波动率、VaR(风险价值模型)、资产价格以及收益情景模拟等方式来对风险进行评定。
但是由于类金融机构与传统的金融机构不同,其并不存在公开交易的股权市场,也 没有公开披露可信度高的财务数据,其产品也往往并没有高流动性高透明度的公开交易平 台,数据较为稀疏,因而无法采用对传统的金融机构的度量方式来进行类金融机构的风险评 估。
发明内容
为了对类金融机构进行较好地风险监控,本申请提供一种类金融机构风险监控方法、风险模拟系统及存储介质。
第一方面,本申请提供的一种类金融机构风险监控方法采用如下的技术方案:
一种类金融机构风险监控方法,包括:
获取样本数据信息;
将样本数据信息进行数据预处理以形成若干相关联的类金融机构的舆情指数信息;
将舆情指数信息进行曲线拟合以形成概率分布拟合曲线,判断该概率分布拟合曲线服从的分 布函数及其对应参数以获取参数已知的概率分布函数;
将参数已知的概率分布函数通过马尔科夫链蒙特卡洛模拟进行抽样以获取抽样样本数据; 获取若干相关联的类金融机构的实缴资本信息;
将若干相关联的类金融机构所对应的实缴资本信息以及抽样样本数据通过动态网络仿真方法 分析并获取对应该类相关联的类金融机构的风险状况。
通过采用上述技术方案,由于用于传统金融机构风险度量的数据,例如回报率、坏账率、债务结构等信息,在类金融机构方面无法获取,因而可以采用舆情指数作为风险量化分析的主要数据来源,但同时由于类金融机构的特殊性,采样获取的样本数据通常难以直接 通过简单地积分等方式生成模拟样本以进行风险的监控以及量化,而通过马尔科夫链蒙特卡 洛模拟,其对概率分布函数的要求较低,可以对一些较为复杂难以进行抽样的分布函数进行 抽样以供风险模拟模型的搭建,解决了一些复杂的分布函数难以生成样本、难以进行模拟的 问题。同时,由于相互关联的类金融机构之间会相互制约,相互影响,因而通过动态网络仿 真方法可以对该类关联的类金融机构进行更为精确的模拟已做到风险监控。
优选的,所述对样本数据进行数据预处理的方法包括:
根据预设的机构名称信息以将样本数据信息进行分类;
在对样本数据信息进行分类过程中,对样本数据信息进行切词处理以形成样本切词信息;根 据机构名称信息与样本切词信息之间的关联关系以对样本数据信息进行分类。
通过采用上述技术方案,这种通过切词后对样本数据进行分类处理的方式,相比LDA等主题模型的归类方式,计算量更小,效率更高,构建速度更快,效率更高。
优选的,所述舆情指数信息包括关注度指数信息,所述关注度指数信息的构建方法 包括:
统计若干预设时间段内同一类金融机构所对应的样本数据信息以形成若干与预设时间段一一 对应的标准关注度信息;
统计若干标准关注度信息以形成关注度指数信息。
优选的,所述舆情指数信息包括情绪指数信息,所述情绪指数信息的构建方法包括:
将若干样本数据信息通过识别标点符号以划分形成若干单句文本信息;
对单句文本信息进行情感评分以形成单句情感指数信息;
基于同一目标的样本数据信息以将若干单句情感指数信息求均值以形成目标的样本数据信息 的情感分数信息;
统计若干预设时间段内同一类金融机构的情感分数信息以形成若干与预设时间段一一对应的 标准情感分信息;
统计若干标准情感分信息以形成情绪指数信息。
通过采用上述技术方案,情绪指数会直观反映出获取的文本数据的评价,在一定程 度上,评价越正向说明该金融机构的口碑以及风险更好,因而可以通过情绪指数来构成后续 风险监控的样本。同时,通过将情感评分汇总得到每篇文章对应的分值的方案,相比深度学 习等情感识别的方案,该方案对于人工标注的工作量要求更小,也无需进行有监督的人工智 能模型训练,效率更高,同时判断和打分逻辑也更加透明。
优选的,所述舆情指数信息的构建方法包括:
统计若干预设时间段内同一类金融机构所对应的样本数据信息以形成若干与预设时间段一一 对应的标准关注度信息;
将若干样本数据信息通过识别标点符号以划分形成若干单句文本信息;
对单句文本信息进行情感评分以形成单句情感指数信息;
基于同一目标的样本数据信息以将若干单句情感指数信息求均值以形成目标的样本数据信息 的情感分数信息;
统计若干预设时间段内同一类金融机构的情感分数信息以形成若干与预设时间段一一对应的 标准情感分信息;
将同一预设时间段内的标准关注度信息与标准情感分信息进行逻辑运算以求得标准舆情信 息;
统计若干预设时间段内的标准舆情信息以形成舆情指数信息。
通过采用上述技术方案,通过结合关注度指数以及情绪指数可以更精确地获取对类 金融机构的舆情评价,高关注度指数意味着社会公众的关注度更高,因而其情绪指数的波动 会造成更大的影响。将其二者结合可以提高舆情指数评价的正确性,使得在后续风险监控的 过程中可以更准确地对关联的类金融机构的风险性做出评价。
优选的,所述单句文本信息的情感评分方法包括:
根据预设的至少两个词汇情感类目以对单句文本信息中的词汇依次进行分类,对不同词汇情 感类目中的内容进行累计以形成累计数量信息;
根据词汇情感类目对应预设的权重以及该词汇情感类目所对应的累计数量信息以形成该词汇 情感类目信息所对应的词汇情感指数信息;
将多个词汇情感指数信息进行逻辑运算以形成单句情感指数信息。
通过采用上述技术方案,通过该种方式进行获取的单句情感指数信息的准确度较高。
优选的,对所述舆情指数信息进行曲线拟合的方法包括:
根据舆情指数信息构建频率分布图;
对频率分布图通过多项式高次回归进行拟合以形成概率分布拟合曲线。
优选的,根据抽样样本数据计算VaR阈值;
根据抽样样本数据计算VaR阈值;
将VaR阈值的负向划分为若干风险冲击阈值区间,定义每个风险冲击阈值区间一一对应预 设有风险冲击等级di,判断抽样样本数据所对应的数值所落入的风险冲击阈值区间以获取 风险冲击等级di;
构建破产节点集合B与风险传导集合S,其中,当类金融机构的抗风险载荷额度Ui小于0时,该类金融机构录入破产节点集合B中,当一类金融机构的相关联的类金融机构的风险冲击等级di大于0时,该类金融机构录入风险传导集合S中;
所述动态网络仿真方法包括:
S0:根据预设的类金融机构之间的关联关系构建网络链接,并赋予各链接不同的权重Lji,其 中,i和j代表不同的类金融机构,Lji代表j至i的链接的权重;
S1、判断各类金融机构属于破产节点集合B或风险传导集合S;
S2、将当前模拟时刻的抽样样本数据存入类金融机构,并获取该时刻下类金融机构的风险冲 击等级di;
k为当前模拟时刻,dji代表节点j对指定节点i造成影响,且dji=di;
k为当前模拟时刻,dji代表节点j对指定节点i造成影响,且dji=di,l代表同一集团外公司的网 络连接权重;
S9、计算净资产损失LOSSL,其中,LOSSL=∑j∈BUj;
S10、清空所有数据并从S1重新开始,直至模拟次数达到预设次数;
S11、获取若干模拟次数下的净资产损失LOSSL;
S12、对若干净资产损失LOSSL通过正态分布拟合获取偏度信息以及峰度信息;
S13、通过偏度信息以及峰度信息判断该类关联的类金融机构的风险状况。
通过采用上述技术方案,由于相关联的类金融机构之间会相互影响,因此通过动态 网络仿真方法可以较为准确地贴合实际情况而对相关联的类金融机构的风险进行模拟以及监 控。
第二方面,本申请提供的一种类金融机构风险模拟系统,采用如下的技术方案:
一种类金融机构风险模拟系统,包括:
样本数据信息获取模块,用于获取样本数据信息;
数据预处理模块,用于将样本数据信息进行数据预处理以形成舆情指数信息;
曲线拟合模块,用于将舆情指数信息进行曲线拟合以形成概率分布拟合曲线;
判断模块,判断该概率分布拟合曲线服从的分布函数及其对应参数以获取参数已知的概率分 布函数。
抽样模块,用于将参数已知的概率分布函数通过马尔科夫链蒙特卡洛模拟进行抽样 以获取抽样样本数据;
资产信息获取模块,用于获取若干相关联的类金融机构的实缴资本信息;
风险结果模拟模块,用于将若干相关联的类金融机构所对应的实缴资本信息以及抽样样本数 据通过动态网络仿真方法分析并获取对应该类相关联的类金融机构的风险状况。
第三方面,本申请提供的一种计算机可读存储介质,采用如下的技术方案:
一种计算机可读存储介质,存储有能够被处理器加载并执行上述任一种类金融机构风险监控 方法的计算机程序。
综上所述,本申请具有对类金融机构进行较为准确的风险监控的优点。
附图说明
图1是本申请实施例中类金融机构风险监控方法的流程示意图。
图2是本申请实施例中对样本数据信息进行数据预处理以形成若干相关联的类金融 机构的舆情指数信息的流程示意图。
图3是本申请实施例中一种实施方式下舆情指数信息的获取方法的流程示意图,具 体为通过单一的关注度指数信息来构成舆情指数信息。
图4是本申请实施例中另一种实施方式下舆情指数信息的获取方法的流程示意图, 具体为通过单一的情绪指数信息来构成舆情指数信息。
图5是本申请实施例中另一种实施方式下舆情指数信息的获取方法的流程示意图, 具体为舆情指数信息通过关注度指数信息与情绪指数信息共同进行构建。
图6是本申请实施例中对单句文本信息进行情感评分以形成单句情感指数信息的流 程示意图。
图7是本申请实施例中对舆情指数信息进行曲线拟合的方法的流程示意图。
图8是本申请实施例中马尔科夫链蒙特卡洛模拟的Metropolis–Hasting算法的流程示意图。
图9是本申请实施例中动态网络仿真方法的流程示意图。
图10是本申请实施例中一个示例下的网络链接的示意图。
图11是本申请实施例中风险冲击等级的获取方法的流程示意图。
具体实施方式
以下结合附图1-11对本申请作进一步详细说明。
本具体实施例仅仅是对本发明的解释,其并不是对本发明的限制,本领域技术人员 在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本发明 的权利要求范围内都受到专利法的保护。
本发明实施例提供一种类金融机构风险监控方法,包括:获取样本数据信息;将样本数据信息进行数据预处理以形成若干相关联的类金融机构的舆情指数信息;将舆情指数信 息进行曲线拟合以形成概率分布拟合曲线,判断该概率分布拟合曲线服从的分布函数及其对 应参数以获取参数已知的概率分布函数;将参数已知的概率分布函数通过马尔科夫链蒙特卡 洛模拟进行抽样以获取抽样样本数据;获取若干相关联的类金融机构的实缴资本信息;将若 干相关联的类金融机构所对应的实缴资本信息以及抽样样本数据通过动态网络仿真方法分析 并获取对应该类相关联的类金融机构的风险状况。
本发明实施例中,由于用于传统金融机构风险度量的数据,例如回报率、坏账率、债务结构等信息,在类金融机构方面无法获取,因而可以采用舆情指数作为风险量化分析的 主要数据来源,但同时由于类金融机构的特殊性,采样获取的样本数据通常难以直接通过简 单地积分等方式生成模拟样本以进行风险的监控以及量化,而通过马尔科夫链蒙特卡洛模 拟,其对概率分布函数的要求较低,可以对一些较为复杂难以进行抽样的分布函数进行抽样 以供风险模拟模型的搭建,解决了一些复杂的分布函数难以生成样本、难以进行模拟的问 题。同时,由于相互关联的类金融机构之间会相互制约,相互影响,因而通过动态网络仿真 方法可以对该类关联的类金融机构进行更为精确的模拟已做到风险监控。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中 的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本 发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在 没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三 种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种 情况。另外,本文中字符“/”,如无特殊说明,一般表示前后关联对象是一种“或”的关 系。
下面结合说明书附图对本发明实施例作进一步详细描述。
本发明实施例提供一种类金融机构风险监控方法,所述方法的主要流程描述如下。
如图1所示:
步骤1000:获取样本数据信息。
其中,由于类金融机构往往缺乏公开的财务和运营数据,过往的风险管理的数据采 集过程往往无法实现,且其不存在公开交易的股权市场,其产品往往也没有高流动性高透明 度的公开交易平台,而用于传统金融机构风险度量的数据,例如回报率、坏账率、债务结构 等信息,在类金融机构方面也无法获取。因而,在本实施例中,样本数据信息的获取采用公 开的新闻文本作为样本数据信息以进行后续的处理。
新闻文本的数据获取操作需要通过自动网站浏览以及网站信息记录功能来实现,具 体可以通过Python的selenuim库进行操作。与传动采用无差别采集海量新闻以及通过主题 模型进行新闻主体判断以筛选相关新闻的方式不同,新闻采集需要先确定关键词信息再进行 针对性的爬取,通过使用搜索引擎搜索与关键词信息相关的新闻,并且通过自动点击网页和 复制新闻数据到本地计算机中。如此往复,即可获得所需要的新闻信息。
而关键词信息的指定主要针对类金融机构的具体类型以及机构名称,例如:“商业保 理”、“典当行”等类型;“平安壹账通”、“壹链盟”、“E-Bill”等类金融机构以及其相关类金 融产品名称。同时可以辅以按公开的工商经营范围分类中的“金融信息服务”、“资产管理”、 “投资咨询”、“区块链”等关键词匹配筛选的方式,进行相关类金融机构的信息的收集,大 幅提升效率。
步骤2000:将样本数据信息进行数据预处理以形成若干相关联的类金融机构的舆情 指数信息。
其中,舆情指数信息包括关注度指数信息以及情绪指数信息。同时,舆情指数信息可以通过单一的关注度指数信息进行替代,也可以通过单一的情绪指数信息进行替代,但若 考虑到较高的关注度会放大情绪指数带来的影响,也可以通过将关注度指数信息与情绪指数 信息相互结合的方式来实现舆情指数信息的获取。
步骤3000:将舆情指数信息进行曲线拟合以形成概率分布拟合曲线,判断该概率分 布拟合曲线服从的分布函数及其对应参数以获取参数已知的概率分布函数。
其中,通过曲线拟合后获得的概率分布拟合曲线并不等同于概率分布函数,无法直 接应用于后续的抽样。而对于不同的分布以及分布相同参数不同的概率分布拟合曲线,由于 其图像的形式不同,因此可以通过深度学习网络进行识别。
其中,先将统计学中各种分布图像进行收集,其中也包括个函数在其参数不同的情 况下的图像,并人工标注其服从的概率分布函数及其参数。然后通过深度学习中卷积神经网 络的方式,以图像作为训练数据、人工标注作为有监督学习的实际结果数据进行训练。深度 学习网络的训练以及输出的识别结果,不仅包括概率分布函数的形式,也包括概率分布函数 的参数。
而由于曲线图像不具有复杂性,卷积神经网络的选取可以参考较为原始但高效的LeNet或AlexNet网络,以ReLU激活函数,构建2组卷积层和全连接层,最后到达输出 层。具体实现可以借助Python的Tensorflow框架实现。
除此之外,该步的判断方式也可以通过人工识别的方式进行核验,找到与该概率分 布拟合曲线最接近的概率分布函数,其方法在此处不再赘述。
步骤4000:将参数已知的概率分布函数通过马尔科夫链蒙特卡洛模拟进行抽样以获 取抽样样本数据。
其中,类金融机构由于存在流动性差、缺乏有效市场等问题,导致其舆情指数的分布往往不服从常见的概率分布,难于直接进行抽样和风险模拟,因而通过马尔科夫链蒙特卡 洛模拟可以针对复杂的非常见的概率分布进行抽样模拟的特性来对舆情指数所服从的概率分 布函数进行抽样。其中,马尔科夫链蒙特卡洛模拟是一种将马尔科夫过程引入到蒙特卡洛模 拟中的方法,其可以实现抽样分布随模拟的进行而改变的动态模拟。
步骤5000:获取若干相关联的类金融机构的实缴资本信息。
其中,该步骤的实缴资本信息根据工商信息所查询实缴资本金作为实缴资本信息, 但需要注意的是,该步骤并不一定要设置于步骤4000与步骤6000之间,其这仅仅是为了方 便描述本实施例的其中一种实施方式,其也可以对应调换至本实施例的任意步骤之间。
步骤6000:将若干相关联的类金融机构所对应的实缴资本信息以及抽样样本数据通 过动态网络仿真方法分析并获取对应该类相关联的类金融机构的风险状况。
其中,在实际情况下,风险通常会在关联的类金融机构之间进行传导,而其传导方式主要包括直接传导和间接传导,直接传导包括类金融机构股权投资关系与债务关系以及处 于同一集团母公司下的关系。这类关系主要是在财务方面进行直接的风险传导,当股权或债 务关系中有公司发生了财务风险,往往会将财务风险传导至对其拥有股权或者债务的公司或 关联企业中。而间接传导也可以分为两个方面,其一是以传统金融机构为媒介的传导,当传 统金融机构拥有债权的某类金融机构由于严重的财务问题发生违约,其也会影响到其他同类 型类金融机构在该银行的信用情况,甚至发生资金链断裂,导致系统性风险。此外,间接传 导最可能发生于社会舆情,当类金融机构有严重的财务违约事件发生,往往会在社会产生严 重的负面影响,最终影响到其他的类金融机构的信用和财务流动性。因而通过动态网络仿真 方法可以较为准确地对该类相关联的类金融机构进行风险监控。
参考图2,为对样本数据信息进行数据预处理以形成若干相关联的类金融机构的舆情 指数信息的具体流程图,其步骤具体包括:
步骤2100:根据预设的机构名称信息以将样本数据信息进行分类,在对样本数据信息进行 分类过程中,对样本数据信息进行切词处理以形成样本切词信息,根据机构名称信息与样本 切词信息之间的关联关系以对样本数据信息进行分类。
其中,切词处理可以采用Python的jieba库以用于切词,而机构名称信息具体为步骤 1000中进行搜索的关键词信息中的类金融机构的“类型”、“机构名称”、“机构产品”作为关键词进行搜索和匹配,将新闻数据进一步归类和汇集到各类别、各机构以及机构的产品。这种分类方式由于先行采集时已经避免了无关信息的采集,计算量更小,效率更高。
另外,当需要对不同网络的关联的类金融机构进行风险监控时,无需重复对样本数 据信息进行爬取,而是直接采用原有的样本数据信息中不同的机构名称信息即可直接进行数 据预处理。
步骤2200:获取对同一分类下的类金融机构的舆情指数信息。
参照图3,在一个实施方式的步骤2200中,当通过单一的关注度指数信息来构成舆情指数信息时,其具体步骤包括:
步骤2210:统计若干预设时间段内同一类金融机构所对应的样本数据信息以形成若干与预 设时间段一一对应的标准关注度信息。
其中,预设时间段可以通过预设的方式进行限定,通常而言,预设时间段设定为一天。而当前预设时间段内的标准关注度信息即为当前预设时间段内新闻文章对应出现的次数。
步骤2211:统计若干标准关注度信息以形成关注度指数信息。
其中,当预设时间段以天为单位时,关注度指数信息会统计并整合不同日期下的标 准关注度信息,形成一串日期与标准关注度信息一一对应的数据组。
参照图4,在另一个实施方式的步骤2200中,当通过单一的情绪指数信息来构成舆情指数信息时,其具体步骤包括:
步骤2220:将若干样本数据信息通过识别标点符号以划分形成若干单句文本信息。
其中,标点符号识别是以逗号、句号、感叹号、省略号等表示语句终止的标点符号作为切分点来将文章划分为若干单句文本信息。
步骤2221:对单句文本信息进行情感评分以形成单句情感指数信息。
步骤2222:基于同一目标的样本数据信息以将若干单句情感指数信息求均值以形成 目标的样本数据信息的情感分数信息。
其中,求均值的目的是为了降低新闻文本的句子或字数过多所导致不同的样本数据 信息所对应的情感分数信息相差过大,从而标准化每个样本数据信息所对应的情感分数信 息。
步骤2223:统计若干预设时间段内同一类金融机构的情感分数信息以形成若干与预 设时间段一一对应的标准情感分信息。
其中,预设时间段可以通过预设的方式进行限定,通常而言,预设时间段设定为一天。同时,在当同一预设时间段内情感分数信息出现不止一次时,可以通过求取情感分数信息的均值来获取标准情感分信息。
步骤2224:统计若干标准情感分信息以形成情绪指数信息。
其中,当预设时间段以天为单位时,情绪指数信息会统计并整合不同日期下的标准 情感分信息,形成一串日期与标准情感分信息一一对应的数据组。
参照图5,在另一个实施方式的步骤2200中,舆情指数信息通过关注度指数信息与情绪指数信息进行构建,其具体包括:
步骤2230:统计若干预设时间段内同一类金融机构所对应的样本数据信息以形成若干与预 设时间段一一对应的标准关注度信息。
其中,预设时间段可以通过预设的方式进行限定,通常而言,预设时间段设定为一天。而当前预设时间段内的标准关注度信息即为当前预设时间段内新闻文章对应出现的次数。
步骤2231:将若干样本数据信息通过识别标点符号以划分形成若干单句文本信息。
其中,标点符号识别是以逗号、句号、感叹号、省略号等表示语句终止的标点符号作为切分点来将文章划分为若干单句文本信息。
步骤2232:对单句文本信息进行情感评分以形成单句情感指数信息。
步骤2233:基于同一目标的样本数据信息以将若干单句情感指数信息求均值以形成 目标的样本数据信息的情感分数信息。
其中,求均值的目的是为了降低新闻文本的句子或字数过多所导致不同的样本数据 信息所对应的情感分数信息相差过大,从而标准化每个样本数据信息所对应的情感分数信 息。
步骤2234:统计若干预设时间段内同一类金融机构的情感分数信息以形成若干与预 设时间段一一对应的标准情感分信息。
其中,预设时间段可以通过预设的方式进行限定,通常而言,预设时间段设定为一天,且需与标准关注度信息的预设时间段相同。同时,在当同一预设时间段内情感分数信息出现不止一次时,可以通过求取情感分数信息的均值来获取标准情感分信息。
步骤2235:将同一预设时间段内的标准关注度信息与标准情感分信息进行逻辑运算 以求得标准舆情信息。
其中,标准关注度信息与标准情感分信息可以通过简单的相加或相乘运算来得到标 准舆情信息。但是为了放大标准关注度信息带来的影响,标准舆情信息的计算方法包括:
其中,S为标准舆情信息,X为标准情感分信息,Y为标准关注度信息。
此处,标准关注度信息除以标准关注度信息的标准差的目的在于避免原本为负数的 标准舆情信息由于指数为偶数而被错误计算为正数的情况。
步骤2236:统计若干预设时间段内的标准舆情信息以形成舆情指数信息。
其中,当预设时间段以天为单位时,舆情指数信息会统计并整合不同日期下的标准 舆情信息,形成一串日期与标准舆情信息一一对应的数据组,该数据组即为上述的舆情指数 信息。
在本实施例中,步骤2221与步骤2232中关于对单句文本信息进行情感评分以形成单句情感指数信息的方法均相同,如图6所示,其具体包括:
步骤7000:根据预设的至少两个词汇情感类目以对单句文本信息中的词汇依次进行分类, 对不同词汇情感类目中的内容进行累计以形成累计数量信息。
其中,词汇情感类目可以根据实际情况进行设定。在本实施例中,词汇情感类目共包括“对象词”、“情感词”、“状态词”、“不确定性词”等大类。“对象词”具体可以包括 “壹账通”、“客户”、“债权人”等描述对象的对象词。“情感词”具体可以包括“风险”、 “危机”、“困难”等描述情感的词语,其具体可以分为描述正向情感的正向词以及描述负向 情感的负向词。“状态词”具体可以包括“存在”、“处于”、“现状”等状态词。“不确定性 词”具体可以包括“必然”、“一定”、“可能”、“也许”等不确定性词语。
步骤7100:根据词汇情感类目对应预设的权重以及该词汇情感类目所对应的累计数 量信息以形成该词汇情感类目信息所对应的词汇情感指数信息。
步骤7200:将多个词汇情感指数信息进行逻辑运算以形成单句情感指数信息。
其中,以上述的词汇情感类目的实施方式为例,其可以对各个词汇情感类目分与不 同的权重,具体举例如下表所示:
以上述的词汇情感类目及其对应的权重为例,词汇情感指数信息的数据即为同一词汇情感类 目下的数量乘以其对应的权重即可,而单句情感指数信息的计算规则可以通过将若干词汇情 感指数信息进行累乘的方式进行计算。
此外,为了保证词语的可替换性和分析的准确性,系统可以采用CBOW等词向量模型进行同义词替换。其中,词向量模型可以采用Python的word2vec库实现。
参考图7,为本申请实施例中对舆情指数信息进行曲线拟合的方法,具体包括:
步骤3100:根据舆情指数信息构建频率分布图。
其中,频率分布图的构建方法具体为将舆情指数信息按顺序排列成频率分布的形式,并将频率数据作为因变量。
步骤3200:对频率分布图通过多项式高次回归进行拟合以形成概率分布拟合曲线。
其中,概率分布拟合曲线的表达式具体为表达式为而为了防止过拟 合,可以采用LASSO等方法,在线性回归的损失函数中加入等损失项,使得各系数、特别是高次项的系数能够保持在较低的水平,从而减少过拟合的问题。除此之外,也可以人为控制自变量N的次数,人工判断回归出的曲线的平滑 程度,避免曲线出现较频繁的波动。一般情况下,自变量N控制在4至6之间。
马尔科夫链蒙特卡洛模拟具体可以通过Metropolis–Hasting算法进行实现,参考图8,为Metropolis–Hasting算法的具体流程图,其具体包括:
将平稳状态下的概率分布定义为p(x),并定义便于抽样的参考分布g(x),例如正态分布。同 时,随机选取分布中一个可能的值作为t时刻的状态,记为xt,则g(x)~N(xt,1)。其中,流程 具体包括:
步骤4100:参考分布g(x′|xt)采样马尔科夫链下一时刻的状态x′。即,根据分布g(x′|xt)进行 抽样,并将结果记为x′。
其中,每次经过抽样后,若马尔科夫链上的状态转移,则服从正态分布的参考分布,其中心值或均值将变更为新的状态,即g(x)~N(xt+1,1)。
步骤4200:通过均匀分布生成一个0到1之间的随机数u,并判断随机数u与接受概率a(x′,xt)之间的关系。如果接受概率a(x′,xt)>u,则进入步骤4300中;否则xt+1=xt,并回到步骤4100中。其中,
步骤4300:令xt+1=x′,即接受x作为马尔科夫链在t+1时刻的状态,并回到步骤4100中,进入下一个状态的循环。
最后通过步骤4100至步骤4300之间往复循环,选取马尔科夫链收敛后的样本,就可以得到一串马尔科夫链的参数的样本数据,且这些样本数据服从马尔科夫链收敛时的稳定 分布(即p(x))。而这组数据即为抽样样本数据。
除此之外,马尔科夫链蒙特卡洛模拟还可以通过吉布斯采样的算法进行实现,其可 以通过基于Python的PyMC3库实现,此处不再赘述。
参照图9,为本申请实施例中动态网络仿真方法的具体流程:
步骤6010:根据预设的类金融机构之间的关联关系构建网络链接,并赋予各链接不同的权 重Lji。
其中,i和j代表不同的类金融机构,Lji代表j至i的链接的权重。
举例说明,参照图10所示,为一个示例下的网络链接图。其中,BDEF为同一集团 下的类金融机构,而A与C相对于B为集团外的类金融机构,且A与B之间,A与C之间 相互关联。在实际情况下,同一集团下的类金融机构之间赋予的权重更高,而集团外的类金 融机构之间的权重相比于同一集团下的较低。
步骤6020:判断各类金融机构属于破产节点集合B或风险传导集合S;
其中,类金融机构包含风险冲击等级di、抗风险载荷额度Ui、破产判断因子与风险冲击因 子抗风险载荷额度Ui与实缴资本信息相关联且Ui=ln(实缴资本信息),其中,风险冲击等 级di会随着网络链接进行传递。而破产节点集合B以及风险传导集合S需要预先进行构建。 此处,当类金融机构的抗风险载荷额度Ui小于0时,该类金融机构录入破产节点集合B中, 当一类金融机构的相关联的类金融机构的风险冲击等级di大于0时(即某一类金融机构受到 相邻类金融机构的风险冲击时),该类金融机构录入风险传导集合S中。
同时,在同一集团中,由于子公司的净资产存在母公司补缴的可能,故子公司的类金 融机构的实缴资本信息可以相对应的进行上浮。
步骤6030:将当前模拟时刻的抽样样本数据存入类金融机构,并获取该时刻下类金 融机构的风险冲击等级di;
其中,抽样样本数据来源于通过马尔科夫链蒙特卡洛模拟进行抽样所得到的抽样样本数据。 参照图11,风险冲击等级di的获取方法具体包括:
步骤6031:根据抽样样本数据计算VaR阈值。
其中,VaR阈值指的是在一定概率水平(置信度)下,类金融机构在未来特定时期内的最大可能损失。其求解方式是本领域技术人员的常用技术手段,此处不再赘述。
步骤6032:将VaR阈值的负向划分为若干风险冲击阈值区间,定义每个风险冲击阈值区间一一对应预设有风险冲击等级di,判断抽样样本数据所对应的数值所落入的风险冲击 阈值区间以获取风险冲击等级di。
其中,VaR阈值的负向指的是VaR阈值对应至概率分布函数中的左侧,当抽样样本数据落入该区间中时即进行风险冲击等级di的获取。在本实施例中,风险冲击阈值区间可以 划分为十个区间,其中,越远离VaR阈值的风险冲击阈值区间所对应的风险冲击等级di越 高。
其中,k为当前模拟时刻,dji代表类金融机构j对指定类金融机构i造成影响,而由于同一类金 融机构对相关联的类金融机构的冲击均相同,故dji=di;
其中,k为当前模拟时刻,dji代表类金融机构j对指定类金融机构i造成影响,且dji=di,l代表 同一集团外公司的网络连接权重,而一般来说,同一集团内公司的网络连接权重会大于统一 集团外公司的网络连接权重,即Lji>l;
其中,以图10所示的网络链接对上述步骤进行简述,假定在某一模拟时刻中,若类金融机 构B破产,其会产生对应的风险冲击等级dB,并根据网络链接将该风险冲击等级dB传导至相邻的类金融机构ADEF处(例如步骤6040)。而由于类金融机构DEF处于同一集团内, 因而类金融机构B破产带来的冲击会导致类金融机构DEF之间再次发生冲击,而类金融机 构A却只收到类金融机构B破产所带来的影响(例如步骤6060)。当计算完毕后进入下一模 拟时刻,此时由于类金融机构B破产使其与类金融机构A断开链接,因而使类金融机构A 与类金融机构DEF也断开链接,在下一模拟时刻中,将分为两个分离的系统进行传导冲 击。而当相邻模拟时刻的破产节点总量相同时,即说明整个网络链接趋于平衡。
步骤6100:计算净资产损失LOSSL,其中,LOSSL=∑j∈BUj;
步骤6110:清空所有数据并从步骤6020重新开始,直至模拟次数达到预设次数;
步骤6120:获取若干模拟次数下的净资产损失LOSSL;
步骤6130:对若干净资产损失LOSSL通过正态分布拟合获取偏度信息以及峰度信息;
其中,可以采用R语言或MATLAB等统计软件对若干净资产损失LOSSL进行拟合,并可以获 得对应的偏度以及峰度。
步骤6140:通过偏度信息以及峰度信息判断该类关联的类金融机构的风险状况。
其中,偏度越左偏(分布左侧极端值更极端)、峰度越高(代表肥尾,极端值更多),则代表整个系统出现大规模财务问题的黑天鹅事件的可能性越高,因而其风险越高,需要进 行风险控制。一般情况下,可认为当偏度小于0时,存在左偏,模拟中发生极端负面情况的 次数更多,该类金融机构网络系统存在更高的风险。当峰度大于3时,说明模拟数据的分布 存在“肥尾”,即两侧的极端值会更多,特别是在左偏的情况下,发生极端负面情况的次数 更多,说明该类金融机构网络系统存在更高的风险。
基于同一发明构思,本申请实施例还公开一种类金融机构风险模拟系统,其包括:
样本数据信息获取模块,用于获取样本数据信息;
数据预处理模块,用于将样本数据信息进行数据预处理以形成舆情指数信息;
曲线拟合模块,用于将舆情指数信息进行曲线拟合以形成概率分布拟合曲线;
判断模块,用于判断该概率分布拟合曲线服从的分布函数及其对应参数以获取参数已知的概 率分布函数。
抽样模块,用于将参数已知的概率分布函数通过马尔科夫链蒙特卡洛模拟进行抽样 以获取抽样样本数据;
资产信息获取模块,用于获取若干相关联的类金融机构的实缴资本信息;
风险结果模拟模块,用于将若干相关联的类金融机构所对应的实缴资本信息以及抽样样本数 据通过动态网络仿真方法分析并获取对应该类相关联的类金融机构的风险状况。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模 块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完 成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上 述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此 不再赘述。
本发明实施例还提供一种计算机可读存储介质,存储有能够被处理器加载执行时实 现如图1-图6流程中所述的各个步骤。
所述计算机可读存储介质例如包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可 以存储程序代码的介质。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间 接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示 的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络 单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是 各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既 可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时, 可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者 说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出 来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可 以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述 方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器、随机存取 存储器、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以对本申请的技术方案进行了详细介绍,但以上实施例 的说明只是用于帮助理解本发明的方法及其核心思想,不应理解为对本发明的限制。本技术 领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明 的保护范围之内。
Claims (10)
1.一种类金融机构风险监控方法,其特征在于,包括:
获取样本数据信息;
将样本数据信息进行数据预处理以形成若干相关联的类金融机构的舆情指数信息;
将舆情指数信息进行曲线拟合以形成概率分布拟合曲线,判断该概率分布拟合曲线服从的分布函数及其对应参数以获取参数已知的概率分布函数;
将参数已知的概率分布函数通过马尔科夫链蒙特卡洛模拟进行抽样以获取抽样样本数据;
获取若干相关联的类金融机构的实缴资本信息;
将若干相关联的类金融机构所对应的实缴资本信息以及抽样样本数据通过动态网络仿真方法分析并获取对应该类相关联的类金融机构的风险状况。
2.根据权利要求1所述的类金融机构风险监控方法,其特征在于,所述对样本数据进行数据预处理的方法包括:
根据预设的机构名称信息以将样本数据信息进行分类;
在对样本数据信息进行分类过程中,对样本数据信息进行切词处理以形成样本切词信息;根据机构名称信息与样本切词信息之间的关联关系以对样本数据信息进行分类。
3.根据权利要求2所述的类金融机构风险监控方法,其特征在于,所述舆情指数信息包括关注度指数信息,所述关注度指数信息的构建方法包括:
统计若干预设时间段内同一类金融机构所对应的样本数据信息以形成若干与预设时间段一一对应的标准关注度信息;
统计若干标准关注度信息以形成关注度指数信息。
4.根据权利要求2所述的类金融机构风险监控方法,其特征在于,所述舆情指数信息包括情绪指数信息,所述情绪指数信息的构建方法包括:
将若干样本数据信息通过识别标点符号以划分形成若干单句文本信息;
对单句文本信息进行情感评分以形成单句情感指数信息;
基于同一目标的样本数据信息以将若干单句情感指数信息求均值以形成目标的样本数据信息的情感分数信息;
统计若干预设时间段内同一类金融机构的情感分数信息以形成若干与预设时间段一一对应的标准情感分信息;
统计若干标准情感分信息以形成情绪指数信息。
5.根据权利要求2所述的类金融机构风险监控方法,其特征在于,所述舆情指数信息的构建方法包括:
统计若干预设时间段内同一类金融机构所对应的样本数据信息以形成若干与预设时间段一一对应的标准关注度信息;
将若干样本数据信息通过识别标点符号以划分形成若干单句文本信息;
对单句文本信息进行情感评分以形成单句情感指数信息;
基于同一目标的样本数据信息以将若干单句情感指数信息求均值以形成目标的样本数据信息的情感分数信息;
统计若干预设时间段内同一类金融机构的情感分数信息以形成若干与预设时间段一一对应的标准情感分信息;
将同一预设时间段内的标准关注度信息与标准情感分信息进行逻辑运算以求得标准舆情信息;
统计若干预设时间段内的标准舆情信息以形成舆情指数信息。
6.根据权利要求4或5所述的类金融机构风险监控方法,其特征在于,所述单句文本信息的情感评分方法包括:
根据预设的至少两个词汇情感类目以对单句文本信息中的词汇依次进行分类,对不同词汇情感类目中的内容进行累计以形成累计数量信息;
根据词汇情感类目对应预设的权重以及该词汇情感类目所对应的累计数量信息以形成该词汇情感类目信息所对应的词汇情感指数信息;
将多个词汇情感指数信息进行逻辑运算以形成单句情感指数信息。
7.根据权利要求1所述的类金融机构风险监控方法,其特征在于,对所述舆情指数信息进行曲线拟合的方法包括:
根据舆情指数信息构建频率分布图;
对频率分布图通过多项式高次回归进行拟合以形成概率分布拟合曲线。
8.根据权利要求1所述的类金融机构风险监控方法,其特征在于,
根据抽样样本数据计算VaR阈值;
将VaR阈值的负向划分为若干风险冲击阈值区间,定义每个风险冲击阈值区间一一对应预设有风险冲击等级di,判断抽样样本数据所对应的数值所落入的风险冲击阈值区间以获取风险冲击等级di;
构建破产节点集合B与风险传导集合S,其中,当类金融机构的抗风险载荷额度Ui小于0时,该类金融机构录入破产节点集合B中,当一类金融机构的相关联的类金融机构的风险冲击等级di大于0时,该类金融机构录入风险传导集合S中;
所述动态网络仿真方法包括:
S0:根据预设的类金融机构之间的关联关系构建网络链接,并赋予各链接不同的权重Lji,其中,i和j代表不同的类金融机构,Lji代表j至i的链接的权重;
S1、判断各类金融机构属于破产节点集合B或风险传导集合S;
S2、将当前模拟时刻的抽样样本数据存入类金融机构,并获取该时刻下类金融机构的风险冲击等级di;
k为当前模拟时刻,dji代表节点j对指定节点i造成影响,且dji=di;
k为当前模拟时刻,dji代表节点j对指定节点i造成影响,且dji=di,l代表同一集团外公司的网络连接权重;
S9、计算净资产损失LOSSL,其中,LOSSL=∑j∈BUj;
S10、清空所有数据并从S1重新开始,直至模拟次数达到预设次数;
S11、获取若干模拟次数下的净资产损失LOSSL;
S12、对若干净资产损失LOSSL通过正态分布拟合获取偏度信息以及峰度信息;
S13、通过偏度信息以及峰度信息判断该类关联的类金融机构的风险状况。
9.一种类金融机构风险模拟系统,其特征在于,包括:
样本数据信息获取模块,用于获取样本数据信息;
数据预处理模块,用于将样本数据信息进行数据预处理以形成舆情指数信息;
曲线拟合模块,用于将舆情指数信息进行曲线拟合以形成概率分布拟合曲线;
判断模块,用于判断该概率分布拟合曲线服从的分布函数及其对应参数以获取参数已知的概率分布函数;
抽样模块,用于将参数已知的概率分布函数通过马尔科夫链蒙特卡洛模拟进行抽样以获取抽样样本数据;
资产信息获取模块,用于获取若干相关联的类金融机构的实缴资本信息;
风险结果模拟模块,用于将若干相关联的类金融机构所对应的实缴资本信息以及抽样样本数据通过动态网络仿真方法分析并获取对应该类相关联的类金融机构的风险状况。
10.一种计算机可读存储介质,其特征在于,存储有能够被处理器加载并执行如权利要求1至8中任一种类金融机构风险监控方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011368381.0A CN112419029B (zh) | 2020-11-27 | 2020-11-27 | 类金融机构风险监控方法、风险模拟系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011368381.0A CN112419029B (zh) | 2020-11-27 | 2020-11-27 | 类金融机构风险监控方法、风险模拟系统及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112419029A true CN112419029A (zh) | 2021-02-26 |
CN112419029B CN112419029B (zh) | 2021-11-12 |
Family
ID=74828923
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011368381.0A Active CN112419029B (zh) | 2020-11-27 | 2020-11-27 | 类金融机构风险监控方法、风险模拟系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112419029B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113393321A (zh) * | 2021-07-11 | 2021-09-14 | 北京天仪百康科贸有限公司 | 一种基于区块链的金融风控方法 |
CN114037519A (zh) * | 2021-11-16 | 2022-02-11 | 中国工商银行股份有限公司 | 敞口风险评估方法、装置、计算机设备和存储介质 |
CN114092222A (zh) * | 2021-11-10 | 2022-02-25 | 建信金融科技有限责任公司 | 基于金融风险的阈值模型建立方法、装置、设备和介质 |
CN115048487A (zh) * | 2022-05-30 | 2022-09-13 | 平安科技(深圳)有限公司 | 基于人工智能的舆情分析方法、装置、计算机设备及介质 |
CN117634855A (zh) * | 2024-01-26 | 2024-03-01 | 山东大学 | 基于自适应仿真的项目风险决策方法、系统、设备及介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003316948A (ja) * | 2002-04-19 | 2003-11-07 | Hitachi Ltd | 資産ポートフォリオ評価装置及び方法 |
CN107025299A (zh) * | 2017-04-24 | 2017-08-08 | 北京理工大学 | 一种基于加权lda主题模型的金融舆情感知方法 |
CN108256016A (zh) * | 2018-01-08 | 2018-07-06 | 合肥工业大学 | 基于个人微博的个人异常情绪检测方法及装置 |
CN108364199A (zh) * | 2018-02-28 | 2018-08-03 | 北京搜狐新媒体信息技术有限公司 | 一种基于互联网用户评论的数据分析方法及系统 |
CN109871640A (zh) * | 2019-03-07 | 2019-06-11 | 常州大学 | 一种基于蒙特卡罗模拟的粉尘二次爆炸风险预测方法 |
CN110163446A (zh) * | 2019-05-28 | 2019-08-23 | 重庆理工大学 | 一种基于连续马尔科夫的双层网络舆情信息传播预测方法 |
CN111611542A (zh) * | 2020-04-29 | 2020-09-01 | 北京林业大学 | 一种金融体系的系统性风险的度量方法和装置 |
CN111967802A (zh) * | 2020-09-25 | 2020-11-20 | 杭州安恒信息安全技术有限公司 | 一种企业金融风险定量分析和预警方法、装置及设备 |
-
2020
- 2020-11-27 CN CN202011368381.0A patent/CN112419029B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003316948A (ja) * | 2002-04-19 | 2003-11-07 | Hitachi Ltd | 資産ポートフォリオ評価装置及び方法 |
CN107025299A (zh) * | 2017-04-24 | 2017-08-08 | 北京理工大学 | 一种基于加权lda主题模型的金融舆情感知方法 |
CN108256016A (zh) * | 2018-01-08 | 2018-07-06 | 合肥工业大学 | 基于个人微博的个人异常情绪检测方法及装置 |
CN108364199A (zh) * | 2018-02-28 | 2018-08-03 | 北京搜狐新媒体信息技术有限公司 | 一种基于互联网用户评论的数据分析方法及系统 |
CN109871640A (zh) * | 2019-03-07 | 2019-06-11 | 常州大学 | 一种基于蒙特卡罗模拟的粉尘二次爆炸风险预测方法 |
CN110163446A (zh) * | 2019-05-28 | 2019-08-23 | 重庆理工大学 | 一种基于连续马尔科夫的双层网络舆情信息传播预测方法 |
CN111611542A (zh) * | 2020-04-29 | 2020-09-01 | 北京林业大学 | 一种金融体系的系统性风险的度量方法和装置 |
CN111967802A (zh) * | 2020-09-25 | 2020-11-20 | 杭州安恒信息安全技术有限公司 | 一种企业金融风险定量分析和预警方法、装置及设备 |
Non-Patent Citations (2)
Title |
---|
MARAGOUDAKIS, MANOLIS .ET AL: "Exploiting Financial News and Social Media Opinions for Stock Market Analysis using MCMC Bayesian Inference", 《COMPUTATIONAL ECONOMICS》 * |
谢合亮等: "基于蒙特卡洛方法的金融市场风险VaR的算法分析", 《统计与决策》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113393321A (zh) * | 2021-07-11 | 2021-09-14 | 北京天仪百康科贸有限公司 | 一种基于区块链的金融风控方法 |
CN114092222A (zh) * | 2021-11-10 | 2022-02-25 | 建信金融科技有限责任公司 | 基于金融风险的阈值模型建立方法、装置、设备和介质 |
CN114037519A (zh) * | 2021-11-16 | 2022-02-11 | 中国工商银行股份有限公司 | 敞口风险评估方法、装置、计算机设备和存储介质 |
CN115048487A (zh) * | 2022-05-30 | 2022-09-13 | 平安科技(深圳)有限公司 | 基于人工智能的舆情分析方法、装置、计算机设备及介质 |
CN115048487B (zh) * | 2022-05-30 | 2024-05-03 | 平安科技(深圳)有限公司 | 基于人工智能的舆情分析方法、装置、计算机设备及介质 |
CN117634855A (zh) * | 2024-01-26 | 2024-03-01 | 山东大学 | 基于自适应仿真的项目风险决策方法、系统、设备及介质 |
CN117634855B (zh) * | 2024-01-26 | 2024-05-07 | 山东大学 | 基于自适应仿真的项目风险决策方法、系统、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112419029B (zh) | 2021-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112419029B (zh) | 类金融机构风险监控方法、风险模拟系统及存储介质 | |
US11164075B2 (en) | Evaluation method and apparatus based on text analysis, and storage medium | |
US20100257117A1 (en) | Predictions based on analysis of online electronic messages | |
CN111738843B (zh) | 一种使用流水数据的量化风险评价系统和方法 | |
Naeem et al. | Machine learning-based USD/PKR exchange rate forecasting using sentiment analysis of Twitter data | |
Urolagin | Text mining of tweet for sentiment classification and association with stock prices | |
CN115310722A (zh) | 一种基于数据统计的农产品价格预测方法 | |
CN109035025A (zh) | 评价股票评论可靠性的方法和装置 | |
Yussupova et al. | A decision support approach based on sentiment analysis combined with data mining for customer satisfaction research | |
CN114969498A (zh) | 一种行业龙头信息的推荐方法及装置 | |
Suwa et al. | Develop method to predict the increase in the Nikkei VI index | |
Fernandes et al. | Decision-making simulator for buying and selling stock market shares based on twitter indicators and technical analysis | |
CN109300031A (zh) | 基于股票评论数据的数据挖掘方法和装置 | |
Vanipriya et al. | Stock market prediction using sequential events | |
Liashenko et al. | Stock Price Forecasting using Sentiment Analysis of Stock Tweets | |
Xu | Data Mining in Social Media for Stock Market Prediction | |
CN117150245B (zh) | 一种企业智能诊断信息生成方法、装置、设备和存储介质 | |
Lee et al. | The Dissemination of Politically-Motivated False Information and Its Influence on the Stock Market | |
Pandey et al. | An Analysis on Sentiment Analysis and Stock Market Price Prediction | |
Anusha et al. | An Approach to Loan Approval prediction Using Boosting Ensemble Learning | |
Li et al. | A collective portfolio selection approach for investment clubs | |
Scaramozzino | The role of textual data in finance: methodological issues and empirical evidence | |
Oladapo et al. | Social Media and Sentimental Analysis: Central Bank of Nigeria Currency Redesign Policy | |
Srivastav et al. | Text Mining for Intelligent Information Processing and Analysis | |
CN116227909A (zh) | 一种企业负面舆情智能风险识别及指标构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |