一种用于企业风控分析的网络管理系统及其控制方法
技术领域
本发明涉及大数据分析技术领域,具体来说是一种用于企业风控分析的网络管理系统及其控制方法。
背景技术
在投融资、银行借贷等金融行业领域中,往往需要对被投资企业或者面临借贷的企业的金融风险做出整体评估,进而制定出合适的投融资或者贷款策略。目前多数机构借助于大数据手段和金融风控模型对企业的风险做出评测,诸如银行、保险公司等金融机构往往借助于其收集的业务数据发展出各自独立的数据模型,例如:考察企业固定资产情况、一定时间内的企业借贷还贷情况、企业资金周转率信息等。
其在一定程度上解决了企业风险评估问题,但往往缺乏更多的行业数据支撑,无法做出更加客观精准的判读,例如对企业所在行业趋势调查、企业核心竞争力水平调查等。同时,由于机构收集数据存在时效性,对企业或者企业存在行业近期存在风险缺少判断,例如,行业内近期存在的供货波动,政策影响等。
随着近年来的数据开放、数据交易的日益发展,金融风险评估机构将获得更多的数据来源与渠道,因此也需要一种网络模型结构及其方法能够有效的融合多种数据并给出更为准确的风险测评数据。
发明内容
本发明的目的是为了解决现有技术中暂无用于风险评控网络管理系统的缺陷,提供一种用于企业风控分析的网络管理系统及其控制方法来解决上述问题。
为了实现上述目的,本发明的技术方案如下:
一种用于企业风控分析的网络管理系统,包括数据源代理模块、风控分析模块、搜索引擎模块、数据库和风控指数计算模块,
所述的数据源代理模块基于多主体机制的数据源访问机制,采用基于多主体BDI模型,接收到搜索引擎模块的请求后,主动访问各自数据源,并将结果返回至数据库;搜索引擎模块根据企业风控关键字模型向数据源代理模块发出数据查询请求,对检索到的数据结果经过量化分析,以KV数据库的形式保存至数据库;风控分析模块用于查询企业风险事件,并根据企业风险事件确定企业风险关键字,并采用网络拓扑构建企业风控关键字模型;风控指数计算模块通过归一化以及矩阵化处理,采用随机森林以及Boost分析方法,将数据库中的数据结果转化成单一数值。
一种用于企业风控分析的网络管理系统的控制方法,包括以下步骤:
构建企业风控关键字模型;
构建关键字搜索信息:根据企业风控关键字模型通过搜索引擎模块查找关键字信息,并将关键字信息存入数据库;
在数据库中构建风险数据库:利用风控分析模块构建出风险数据库;
风控指数的计算:风控指数计算模块对数据库中的风险数据库计算风控指数。
所述的构建企业风控关键字模型包括以下步骤:
搜索企业关键字:由搜索引擎模块向数据源代理模块递交查询请求,搜索出企业关键字;
数据源代理模块给搜索引擎模块返回文档型数据,搜索引擎模块解析分档,其步骤如下:
对文档型数据切分关键单词;
对切分关键单词后的文档型数据依次解析,对解析出来的单词构建关键词描述矩阵,并统计单词出现频率;
对于高频率单词采用加权函数加强;
采用聚类分析单词关联程度,距离函数选用欧氏距离、闵氏距离、cosine距离或RBF神经网络;
利用关键词描述矩阵描述距离信息构建关键词无向图网络,无向图的边长为单词距离d,表示单词角聚合程度;
对关键词根据单词距离d剔除无效单词,生成企业风控关键字模型;
将企业风控关键字模型保存入数据库中的图数据库,图数据库为Neo4J或FlockDB。
所述的在数据库中构建风险数据库包括以下步骤:
风控分析模块解析数据库中的关键字信息,整理出关键字信息中的文档信息;
建立关键词无向图网络,体现事件描述符之间的关联性,
设定关键词无向图网络中事件描述包含{涉及金额指数v、事件统计频次f、事件属性}信息,
其中,涉及金额指数v为文档中解析到金额信息,根据事件性质判断其正负属性,事件属性为直接事件或间接事件;
利用事件描述符和关键词无向图网络生成风险数据库。
所述风控分析模块解析数据库中的关键字信息包括以下步骤:
风控分析模块切分各个关键字信息,提取关键字信息中的敏感信息;
串联敏感信息和关键字信息形成事件描述符,其结构如下:
{事件序列号,事件发生时间,涉及金额,风险影响因子w,事件统计频次f};
用NFA机制,比对若干个事件描述符,并拼接成字符串;
对相同事件统计频次f计数。
所述风控指数的计算以下步骤:
风控指数计算模块扫描数据库中的风险数据库,取特定年度构建直接影响指数矩阵Mv和间接影响矩阵Mind,方法如下:
按事件属性,构建直接影响矩阵与间接影响矩阵,将关键无向图各节点展开作为行向量,事件在当年发生的序列作为列向量,单元取值为事件统计频次F;
采用随机森林RF方法计算直接影响因子Wd,确定Wd={Wd1,Wd2,…Wdn};
采用XGBoost计算间接影响因子Wind,Wind采用One Hot Encoding方式展开为稀疏矩阵;
利用稀疏矩阵通过XGBoost计算取得间接影响因子Wind={Wind1,Wind2,…,Windn};
计算直接影响指数:
扫描风险数据库,取特定年度事件构建直接影响矩阵Mv,行向量为关键无向图各节点、列向量为当年事件发生次序,单元取值为涉及金额指数v;Mv各行相加求和,得出向量Vd;再计算直接影响指数Id=Vd×Wdt;
计算间接影响指数:
扫描企业风险事件库,取特定年度事件构建间接影响矩阵Mind,行向量为关键无向图各节点\列向量为当年事件发生次序,单元取值为涉及金额指数v;计算Mind×Windt得到向量Vind;取Vind平均数得间接影响指数Iind;计算企业影响指数I=Id×Iind;
采用回归模型统计企业影响指数I。
有益效果
本发明的一种用于企业风控分析的网络管理系统及其控制方法,与现有技术相比构建出用于企业风控分析的网络管理模型,并通过整合不同来源的数据,整合分析成风控指数,保证了企业风控指数分析的精确性和及时性。
附图说明
图1为本发明的系统连接原理图;
图2为本发明的控制方法顺序图。
具体实施方式
为使对本发明的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的实施例及附图配合详细的说明,说明如下:
如图1所示,本发明所述的一种用于企业风控分析的网络管理系统,包括数据源代理模块、风控分析模块、搜索引擎模块、数据库和风控指数计算模块。
数据源代理模块基于多主体机制的数据源访问机制,采用基于多主体BDI模型,接收到搜索引擎模块的请求后,主动访问各自数据源,并将结果返回至数据库(数据集合)。搜索引擎模块根据企业风控关键字模型向数据源代理模块发出数据查询请求,对检索到的数据结果经过量化分析,以KV数据库的形式保存至数据库。
风控分析模块用于查询企业风险事件,并根据企业风险事件确定企业风险关键字,并采用网络拓扑构建企业风控关键字模型。与企业相关的风险事件包括相关行业的调控政策、具有影响力的行业事件等,还如企业并购、企业融资、企业高管的特定事件。风控指数计算模块通过归一化以及矩阵化处理,采用随机森林以及Boost分析方法,将数据库中的数据结果转化成单一数值。
如图2所示,本发明所述的一种用于企业风控分析的网络管理系统的控制方法,包括以下步骤:
第一步,构建企业风控关键字模型。企业风控关键字模型用于发现企业风控分析所需要的关键字数据,使得搜索引擎模块所查找的关键字信息能够有效反映企业风控。其具体步骤如下:
(1)搜索企业关键字:由搜索引擎模块向数据源代理模块递交查询请求,搜索出企业关键字。
(2)数据源代理模块给搜索引擎模块返回文档型数据,搜索引擎模块解析分档,其步骤如下:
A1)对文档型数据切分关键单词,可以根据“停用词库”、“形容词库”等数据库删除不相干单词。
A2)对切分关键单词后的文档型数据依次解析,对解析出来的单词构建关键词描述矩阵,并统计单词出现频率。
A3)对于高频率单词采用加权函数加强,在实际应用中如企业经营者姓名、企业知识产权、行业名称等内容。
A4)采用聚类分析单词关联程度,距离函数选用欧氏距离、闵氏距离、cosine距离或RBF神经网络。
A5)利用关键词描述矩阵描述距离信息构建关键词无向图网络,无向图的边长为单词距离d,表示单词角聚合程度。
A6)对关键词根据单词距离d剔除无效单词,生成企业风控关键字模型。
A7)将企业风控关键字模型保存入数据库中的图数据库,图数据库为Neo4J或FlockDB。
第二步,构建关键字搜索信息:根据企业风控关键字模型通过搜索引擎模块查找关键字信息(可以采用DFS、BFS检索),并将关键字信息存入数据库。
第三步,在数据库中构建风险数据库:利用风控分析模块构建出风险数据库。风险数据库为数据库中的子数据集,经过搜索引擎模块查找后,汇集了企业风控分析的众多数据,是用于风控指数计算模块分析的数据来源。其具体步骤如下:
(1)风控分析模块解析数据库中的关键字信息,整理出关键字信息中的文档信息。
A1)风控分析模块切分各个关键字信息,提取关键字信息中的敏感信息;
A2)串联敏感信息和关键字信息形成事件描述符,其结构如下:
{事件序列号,事件发生时间,涉及金额,风险影响因子w,事件统计频次f};
A3)用NFA机制,比对若干个事件描述符,并拼接成字符串;
A4)对相同事件统计频次f计数。
(2)建立关键词无向图网络,体现事件描述符之间的关联性,
设定关键词无向图网络中事件描述包含{涉及金额指数v、事件统计频次f、事件属性}信息,
其中,涉及金额指数v为文档中解析到金额信息,根据事件性质判断其正负属性,事件属性为直接事件或间接事件。事件正属性指获得融资、盈利等,事情负属性指灾害、赔偿等风险损失。
(3)利用事件描述符和关键词无向图网络生成风险数据库。
第四步,风控指数的计算:风控指数计算模块对数据库中的风险数据库计算风控指数,通过风控指数计算模块计算出相关风险指数指标,其具体步骤如下:
(1)风控指数计算模块扫描数据库中的风险数据库,取特定年度构建直接影响指数矩阵Mv和间接影响矩阵Mind,方法如下:
按事件属性,构建直接影响矩阵与间接影响矩阵,将关键无向图各节点展开作为行向量,事件在当年发生的序列作为列向量,单元取值为事件统计频次F。
(2)采用随机森林RF方法计算直接影响因子Wd,确定Wd={Wd1,Wd2,…Wdn}。
(3)采用XGBoost计算间接影响因子Wind,Wind采用One Hot Encoding方式展开为稀疏矩阵;
利用稀疏矩阵通过XGBoost计算取得间接影响因子Wind={Wind1,Wind2,…,Windn}。
(4)计算直接影响指数:
扫描风险数据库,取特定年度事件构建直接影响矩阵Mv,行向量为关键无向图各节点、列向量为当年事件发生次序,单元取值为涉及金额指数v;Mv各行相加求和,得出向量Vd;再计算直接影响指数Id=Vd×Wdt。
(5)计算间接影响指数:
扫描企业风险事件库,取特定年度事件构建间接影响矩阵Mind,行向量为关键无向图各节点\列向量为当年事件发生次序,单元取值为涉及金额指数v;计算Mind×Windt得到向量Vind;取Vind平均数得间接影响指数Iind;计算企业影响指数I=Id×Iind;
(6)采用回归模型统计企业影响指数I。
本发明对文档数据解析,构建关键词无向图,并枚举关键词无向图中单词展开迭代搜索,尽最大可能的搜集相关企业风险事件信息;同时将企业风险事件分解为可以直接经济量化的直接影响时间,以及无法直接经济量化的间接影响事件,分别评估其风险;并根据事件统计频次判断事件重要程度,进而计算风险指数;计算的风险指数,根据直接风险指数与间接风险指数计算综合风险指数;按年度统计企业风险指数,实现预测将来一段时间内的企业风险情况。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。