CN111967802A - 一种企业金融风险定量分析和预警方法、装置及设备 - Google Patents

一种企业金融风险定量分析和预警方法、装置及设备 Download PDF

Info

Publication number
CN111967802A
CN111967802A CN202011023365.8A CN202011023365A CN111967802A CN 111967802 A CN111967802 A CN 111967802A CN 202011023365 A CN202011023365 A CN 202011023365A CN 111967802 A CN111967802 A CN 111967802A
Authority
CN
China
Prior art keywords
enterprise
financial risk
risk
data
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011023365.8A
Other languages
English (en)
Inventor
戚华春
孙学军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Anheng Information Security Technology Co Ltd
Original Assignee
Hangzhou Anheng Information Security Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Anheng Information Security Technology Co Ltd filed Critical Hangzhou Anheng Information Security Technology Co Ltd
Priority to CN202011023365.8A priority Critical patent/CN111967802A/zh
Publication of CN111967802A publication Critical patent/CN111967802A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Abstract

本申请公开了一种企业金融风险定量分析和预警方法,通过采集并融合互联网上公开的企业数据,根据预先设置的企业金融风险指标体系从中提取指标数据,基于机器学习能力利用企业金融风险模型根据指标数据进行企业金融风险量化评价。特别的,该方法在企业金融风险模型中增加了舆情调节参数,具体通过采集企业官网的网络流量数据并对其进行分析,从而根据企业官网访问量的变化情况对企业舆情风险指标的权重进行参数调节。最终,提高了企业金融风险定量分析的精准度,提高了企业金融风险预警的效率。此外,本申请还提供了一种企业金融风险定量分析和预警装置、设备及可读存储介质,其技术效果与上述方法的技术效果相对应。

Description

一种企业金融风险定量分析和预警方法、装置及设备
技术领域
本申请涉及计算机技术领域,特别涉及一种企业金融风险定量分析和预警方法、装置、设备及可读存储介质。
背景技术
近年来,随着移动互联网等新一代信息技术的迅猛发展,以互联网金融为代表的各类金融业态已融入到经济社会发展的各个领域,呈现出爆发式增长的态势,P2P网络借贷平台、网络小贷公司、股权投资机构、交易场所等各类金融业态不断涌现,其融资规模、交易规模不断扩大,涉及的交易主体也越来越复杂。
然而,由于互联网具有不分地域、快速传播、涉众面广等特性,导致以网络为载体的非法金融活动日益猖獗,容易出现金融诈骗、风险失控、卷款潜逃等问题,这些非法金融业态具有多样性、隐蔽性、边缘性、广域性等特点,严重影响金融秩序,对社会稳定、公民财产安全等造成极大的安全隐患。
传统的企业金融风险监测方案主要存在以下问题:一方面,依靠举报人举报信息,风险发现滞后,往往等到风险爆发后才会有举报信息;另一方面,企业的金融风险判定多依赖于人工个案判断,缺乏客观性,且判断效率低下。
可见,如何监测企业金融风险,保证金融秩序,是亟待本领域技术人员解决的问题。
发明内容
本申请的目的是提供一种企业金融风险定量分析和预警方法、装置、设备及可读存储介质,用以解决目前缺乏高效的金融风险监管方案,为公民财产带来安全隐患的问题。其具体方案如下:
第一方面,本申请提供了一种企业金融风险定量分析和预警方法,包括:
采集目标企业的企业数据;
从所述企业数据中提取企业金融风险指标的指标数据,其中所述企业金融风险指标包括企业注册风险指标、企业经营风险指标和企业舆情风险指标;
采集所述目标企业的官网的访问量数据以作为样本,计算样本方差、样本均值、样本标准差;根据所述样本方差、所述样本均值、所述样本标准差的大小关系,确定舆情调节参数,其中所述舆情调节参数用于对所述企业舆情风险指标的权重进行调节;
将所述指标数据和所述舆情调节参数输入企业金融风险模型,得到所述目标企业的企业金融风险指数,其中所述企业金融风险模型包括各项企业金融风险指标的权重;
根据所述企业金融风险指数,进行风险预警。
优选的,所述采集目标企业的企业数据,包括:
通过以下任意一项或多项技术,采集目标企业的企业数据:逆向JS脚本技术、网页自动化测试技术、多账号Cookie池技术、中间人代理技术。
优选的,所述从所述企业数据中提取企业金融风险指标的指标数据,包括:
对所述企业数据进行预处理,其中所述预处理包括数据清洗和整理;从预处理后的企业数据中识别得到企业金融风险指标的文字描述;通过自然语言处理技术,将所述文字描述转换为向量表示,得到企业金融风险指标的指标数据。
优选的,在所述将所述指标数据和所述舆情调节参数输入企业金融风险模型之前,还包括:
构建企业金融风险模型,所述企业金融风险模型包括企业金融风险指标的初始权重;
根据训练样本,采用线性回归方法对所述企业金融风险模型中企业金融风险指标的初始权重进行调整。
优选的,所述根据所述企业金融风险指数,进行风险预警,包括:
若所述企业金融风险指数小于等于第一阈值,则判定所述目标企业为低风险企业,并进行相应的风险预警;
若所述企业金融风险指数大于所述第一阈值且小于第二阈值,则判定所述目标企业为中风险企业,并进行相应的风险预警;
若所述企业金融风险指数大于等于所述第二阈值,则判定所述目标企业为高风险企业,并进行相应的风险预警。
优选的,所述根据所述样本方差、所述样本均值、所述样本标准差的大小关系,确定舆情调节参数,包括:
若所述样本方差与所述样本均值的差值小于等于3倍的所述样本标准差,则选取第一预设值作为舆情调节参数;
若所述样本方差与所述样本均值的差值大于3倍的所述样本标准差,则选取第二预设值作为舆情调节参数;
其中,所述第一预设值小于所述第二预设值。
优选的,所述第一预设值为1,所述第二预设值为1.5。
第二方面,本申请提供了一种企业金融风险定量分析和预警装置,包括:
互联网数据采集模块:用于采集目标企业的企业数据;
指标数据提取模块:用于从所述企业数据中提取企业金融风险指标的指标数据,其中所述企业金融风险指标包括企业注册风险指标、企业经营风险指标和企业舆情风险指标;
网络流量采集分析模块:用于采集所述目标企业的官网的访问量数据以作为样本,计算样本方差、样本均值、样本标准差;根据所述样本方差、所述样本均值、所述样本标准差的大小关系,确定舆情调节参数,其中所述舆情调节参数用于对所述企业舆情风险指标的权重进行调节;
风险定量分析模块:用于将所述指标数据和所述舆情调节参数输入企业金融风险模型,得到所述目标企业的企业金融风险指数,其中所述企业金融风险模型包括各项企业金融风险指标的权重;
风险预警模块:用于根据所述企业金融风险指数,进行风险预警。
第三方面,本申请提供了一种企业金融风险定量分析和预警设备,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序,以实现如上所述的企业金融风险定量分析和预警方法。
第四方面,本申请提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时用于实现如上所述的企业金融风险定量分析和预警方法。
本申请所提供的一种企业金融风险定量分析和预警方法,包括:采集目标企业的企业数据;从企业数据中提取企业金融风险指标的指标数据,其中企业金融风险指标包括企业注册风险指标、企业经营风险指标和企业舆情风险指标;采集目标企业的官网的访问量数据以作为样本,计算样本方差、样本均值、样本标准差;根据样本方差、样本均值、样本标准差的大小关系,确定舆情调节参数,其中舆情调节参数用于对企业舆情风险指标的权重进行调节;将指标数据和舆情调节参数输入企业金融风险模型,得到目标企业的企业金融风险指数,其中企业金融风险模型包括各项企业金融风险指标的权重;根据企业金融风险指数,进行风险预警。
可见,该方法通过采集并融合互联网上公开的企业数据,根据预先设置的企业金融风险指标体系从中提取指标数据,基于机器学习能力利用企业金融风险模型根据指标数据进行企业金融风险量化评价。特别的,该方法在企业金融风险模型中增加了舆情调节参数,具体通过采集企业官网的网络流量数据并对其进行分析,从而根据企业官网访问量的变化情况对企业舆情风险指标的权重进行参数调节。最终,提高了企业金融风险定量分析的精准度,也提高了企业金融风险预警的效率。
此外,本申请还提供了一种企业金融风险定量分析和预警装置、设备及可读存储介质,其技术效果与上述方法的技术效果相对应,这里不再赘述。
附图说明
为了更清楚的说明本申请实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请所提供的一种企业金融风险定量分析和预警方法实施例一的实现流程图;
图2为本申请所提供的一种企业金融风险定量分析和预警方法实施例二的整体过程示意图;
图3为本申请所提供的一种企业金融风险定量分析和预警方法实施例二的企业金融风险定量分析过程示意图;
图4为本申请所提供的一种企业金融风险定量分析和预警装置实施例的功能框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
传统的企业金融风险监测发现主要存在以下问题:依靠举报人举报信息,风险发现滞后,往往等到风险爆发后才会有举报信息;企业的金融风险判定多依赖于人工个案判断,主观性较强,较少运用机器学习等新技术;各个数据源之间是相互隔离,企业金融风险线索无法得到有效的验证和互补。
针对该问题,本申请提供了一种企业金融风险定量分析和预警方法、装置、设备及可读存储介质,采集互联网上公开的企业信息,数据资源丰富,获取方式便捷高;充分利用互联网大数据分析技术,构建专门的风险指标体系,利用企业金融风险模型生成风险量化指数,使得金融风险判断更加准确和高效;在企业金融风险模型中增加舆情调节参数,具体采集企业官网的网络流量,根据企业官网访问量的变化情况对企业舆情风险指标的权重进行参数调节,提高了企业金融风险定量分析的精准度,也提高了企业金融风险预警的效率。最终实现将企业金融风险防控关口前移,以网治网,对企业金融风险事件及时研判,防患于未然。
下面对本申请提供的一种企业金融风险定量分析和预警方法实施例一进行介绍,参见图1,实施例一包括:
S101、采集目标企业的企业数据;
具体的,利用爬虫技术,全网采集涉及企业金融风险相关的数据内容,包括互联网上公开的企业工商注册信息、企业司法诉讼信息、企业失信被执行信息、企业知识产权信息和企业舆情信息。
在采集企业工商注册信息时,一般包括企业基本信息、企业股东信息、企业对外投资、企业主要人员、企业分支机构、企业变更记录、企业地址、企业邮箱、企业电话、企业网址等。
在采集企业司法诉讼信息时,一般包括裁判文书、开庭公告、法院公告、立案信息、司法拍卖等。
在采集企业失信被执行信息时,一般包括企业失信、企业被执行、限制高消费等。
在采集企业知识产权信息时,一般包括招投标信息、招聘信息、购地数据等。
在采集企业舆情信息时,一般包括专利信息、著作权/软件著作权、商标信息、域名信息、资质证书等。
可以理解的是,在采集到企业数据之后,为方便后续处理,可以先对企业数据进行预处理,例如数据清洗、标准化等操作。
S102、从企业数据中提取企业金融风险指标的指标数据;
本实施例根据金融业务经营特点,提炼出企业金融风险的特征指标,并建立了相应的企业金融风险指标体系。企业金融风险指标体系主要包括三种类型的指标:企业注册风险指标、企业经营风险指标和企业舆情风险指标。
具体的,从预处理后的企业数据中识别得到企业金融风险指标的文字描述;通过自然语言处理技术,将文字描述转换为向量表示,得到企业金融风险指标的指标数据。
S103、采集目标企业的官网的访问量数据以作为样本,计算样本方差、样本均值、样本标准差;根据样本方差、样本均值、样本标准差的大小关系,确定舆情调节参数,其中舆情调节参数用于对企业舆情风险指标的权重进行调节;
在S103之前,还包括模型的构建和训练过程:构建企业金融风险模型,企业金融风险模型包括企业金融风险指标的初始权重;根据训练样本,采用线性回归方法对企业金融风险模型中企业金融风险指标的初始权重进行调整。
可见,企业金融风险模型包括各项企业金融风险指标的权重,此外,本实施例的企业金融风险模型还设置有舆情风险指标的权重的调节参数,即上述舆情调节参数。
企业发布在互联网上的官网,就是企业在互联网上的门面。企业在官网上发布企业资讯、产品信息,大众通过访问企业官网来了解企业、了解产品,也可以通过企业官网进行线上交易。因此企业官网的访问量也代表着大众对这个企业的关注度,代表着这个企业的舆情变化趋势。企业官网访问量变化越大,隐含着企业舆情存在着更大变化和不确定性。比如在2018年下半年,P2P企业牛板金暴雷,牛板金企业官网的访问量瞬间放大,大大超出平时的访问量,形成一个陡峭的上扬曲线。
因此,本实施例的企业金融风险模型中,不仅包括各项企业金融风险指标的权重,还包括舆情企业舆情风险指标的权重的调节参数,即上述舆情调节参数。
在实际应用中,主要运用网络流量分光技术从城域网网口采集目标企业官网的网络流量,采集的内容主要包括网络流量HTTP报文中的Web地址、请求头、协议类型、URL格式及Cookies等信息。根据采集结果,确定企业官网的访问量数据,并通过分析访问量数据确定该企业的舆情调节参数。在后续评估金融风险时,将各项企业金融风险指标的指标数据和舆情调节参数一并输入企业金融风险模型中,得到相应的企业金融风险指数。
S104、将指标数据和舆情调节参数输入企业金融风险模型,得到目标企业的企业金融风险指数;
S105、根据企业金融风险指数,进行风险预警。
具体的,设置企业金融风险指数的阈值,根据阈值决定是否进行风险预警。
本实施例所提供一种企业金融风险定量分析和预警方法,通过采集和融合互联网上公开的企业工商注册信息、企业司法诉讼信息、企业失信被执行信息、企业知识产权信息和企业舆情信息,经过数据清洗和标准化,根据预先设置的企业金融风险指标体系从中提取指标数据,结合机器学习能力利用企业金融风险模型计算企业金融风险指数,进行企业金融风险量化评价。特别的是,在企业金融风险模型中增加舆情调节参数,根据企业官网访问量的变化情况对企业舆情风险指标的权重进行参数调节,提高了企业金融风险定量分析的精准度,也提高了企业金融风险预警的效率。
本实施例改变了传统企业金融风险完全依赖工商备案信息和受害人举报,增加了互联网数据的维度和指数化体系,并在模型中增加企业官网访问量的变化率,对企业舆情信息进行参数调节,可以更加快速和精准的分析和发现相应的企业金融风险情况。
在实施例一的基础上,为提升数据采集效率,上述S101具体可以包括:通过以下任意一项或多项技术,从互联网采集目标企业的企业数据:逆向JS脚本技术、网页自动化测试技术、多账号Cookie池技术、中间人代理技术。
在实施例一的基础上,可以设置三个企业金融风险指数的阈值,将企业按照企业金融风险指数的高低划分为三个等级,此时S105具体可以包括:
若企业金融风险指数小于等于第一阈值,则判定目标企业为低风险企业,并进行相应的风险预警;若企业金融风险指数大于第一阈值且小于第二阈值,则判定目标企业为中风险企业,并进行相应的风险预警;若企业金融风险指数大于等于第二阈值,则判定目标企业为高风险企业,并进行相应的风险预警。
在实施例一的基础上,S103中所述根据样本方差、样本均值、样本标准差的大小关系,确定舆情调节参数的过程,具体可以包括:
若样本方差与样本均值的差值小于等于3倍的样本标准差,则选取第一预设值作为舆情调节参数;若样本方差与样本均值的差值大于3倍的样本标准差,则选取第二预设值作为舆情调节参数;其中,第一预设值小于第二预设值。
具体的,第一预设值和第二预设值可以根据实际需求自行设定,本实施例中第一预设值设置为1,第二预设值设置为1.5。
下面开始详细介绍本申请提供的一种企业金融风险定量分析和预警方法实施例二,实施例二的整体实现过程如图2所示具体分为数据采集、企业金融风险定量分析和企业金融风险预警三个部分。各个部分具体描述如下:
(一)数据采集,包括互联网数据采集和网络流量数据采集
互联网数据采集主要运用爬虫技术,全网采集涉及企业金融风险相关的数据内容,包括互联网上公开的企业工商注册信息、企业司法诉讼信息、企业失信被执行信息、企业知识产权信息和企业舆情信息。
在互联网数据采集过程中,会通过逆向JS脚本技术、网页自动化测试、多账号Cookie池、中间人代理技术等提高数据采集的成功率。下面对各个技术进行说明:
(1)逆向JS脚本技术。分析网站请求加密,模拟加密过程。数据采集时,会大量遇到JS加密技术,此时通过常规采集方法,无法做到采集正常数据。通过逆向JS技术,可半自动化解析JS加密规则,从而解密网站请求加密方法,通过自动化模拟器,模拟网站请求加密过程,反向加密网站请求,切合目标采集网站的请求标准。
(2)网页自动化测试。模拟人为操作读取页面元素。为不引起目标采集网站的采集反制策略,通过网页自动化测试引擎,随机使用不同的人为访问模型,模拟人为操作流程,进行目的性采集工作。
(3)多账号Cookie池。解决网站账号限制。某些采集目标网站会限制同账号高频度访问,设置多账号Cookie池,模拟多账号访问,将访问频率分散在不同账号中,这样既可以高效采集数据,也可绕过目标网站的账号频度限制,维持数据采集引擎的可用性。
(4)中间人代理技术。拦截自动化测试时网站的请求。采集引擎采集的目标网站不一定是可视的目标网站,目标网站的数据请求接口常常隐藏在无数请求链接的背后。通过中间人代理技术,可拦截自动化测试时,网站的各类请求,从中获取真实数据请求接口,从而挖掘真实、可靠数据。
网络流量采集,主要运用网络流量分光技术从城域网网口采集目标企业官网的网络流量,采集的内容主要包括网络流量HTTP报文中的Web地址、请求头、协议类型、URL格式及Cookies等信息。根据采集结果确定企业官网的访问量数据,具体可以为日访问量数据。
(二)企业金融风险定量分析
如图3所示,企业金融风险定量分析包括四部分内容:企业金融风险指标设定、企业数据清洗整理、城域网网络流量分析(企业舆情风险调节参数)、企业金融风险模型计算,下面分别就各个部分展开介绍。
1、企业金融风险指标设定
本实施例根据金融业务经营特点,提炼出企业金融风险的特征指标,建立相应的指标体系,如表1所示:
表1
Figure BDA0002701388270000111
其中:各指标值根据指标项内容设计,取值范围为(0,100)。
2、企业数据清洗整理
根据上述设计的风险特征指标体系,按照每个特征描述,通过互联网公开采集到数据进行针对性的数据清洗和整理。
如按照企业名录,在互联网上定向采集企业注册信息、企业在互联网上被公示的风险信息,以及各类网站、论坛、微博、微信公众号上公开公示的舆情信息,按照每个特征指标的详细描述,通过简单的统计分析和自然语言处理技术,将相应的特征文字描述转换成可供模型计算的数值向量,为每个企业形成相应的特征数据集。
通过互联网公开采集技术,将采集到的在互联网上已经公开公示、报道的风险企业数据作为负样本。
3、城域网网络流量分析(企业舆情风险调节参数)
在统计描述中,标准差用来计算每一个变量(观察值)与总体均数之间的差异,来描述变量的变异程度。因此本实施例通过有权机关授权,通过网络探针接入城域网入口的分光流量,利用多种解码技术,深入分析协议报文,实现流量解析后与内置企业官网库进行访问碰撞,通过计算企业官网每日访问量的标准差。标准差越大,说明企业官网访问量变化越大,隐含着企业舆情存在着更大变化和不确定性。
由于在实际工作中,总体均数难以得到时,一般采用样本统计量代替总体参数,经校正后,样本方差计算公式为:
Figure BDA0002701388270000121
其中,S是样本方差,x为变量,X为样本均值,n为样本数量。一般样本选择为最近30天的企业官网流量数据。
为简便起见,按照3西格玛准则,对没有超出其平均值加减3倍标准差的企业舆情调节参数λ为1,否则λ为1.5。
4、企业金融风险模型计算
(1)按照上述设计的分析特征指标体系,为每个权重设置初始的指标值权重,全部权重累计为1,即∑kak=1,(k=1……18)如表2所示:
表2
指标值 权重
x<sub>1</sub> a<sub>1</sub>
x<sub>2</sub> a<sub>2</sub>
x<sub>3</sub> a<sub>3</sub>
x<sub>4</sub> a<sub>4</sub>
x<sub>5</sub> a<sub>5</sub>
x<sub>6</sub> a<sub>6</sub>
x<sub>7</sub> a<sub>7</sub>
x<sub>8</sub> a<sub>8</sub>
x<sub>9</sub> a<sub>9</sub>
x<sub>10</sub> a<sub>10</sub>
x<sub>11</sub> a<sub>11</sub>
x<sub>12</sub> a<sub>12</sub>
x<sub>13</sub> a<sub>13</sub>
x<sub>14</sub> a<sub>14</sub>
x<sub>15</sub> a<sub>15</sub>
x<sub>16</sub> a<sub>16</sub>
x<sub>17</sub> a<sub>17</sub>
x<sub>18</sub> a<sub>18</sub>
(2)根据以上指标体系和权重设计,单个企业的风险至计算公式为:
EA=∑kxk*ak+λ∑lxl*al
其中,k=1……11,l=12……18,xk为第k项指标值,ak为第k向指标值的权重,λ是企业舆情风险调节参数。
在模型的训练过程中,遵循以下原则:初始指标值权重值可以按照经验设置;将样本企业数据集按照8:2分成测试集和验证集;指标值权重调整,利用机器学习中的线性回归方法进行权重调整;经过多轮机器学习后,可以得到较为稳定的各个指标的权值值;照最后稳定的权重值,重新为每个企业计算相应的风险值。
(三)企业金融风险预警
如图2所示,本实施例根据风险指数大小设置风险阈值,将企业金融风险分为低、中、高三级。其中,风险等级为高的企业,一般认为是涉嫌出现风险的企业,将作为风险情报线索提交有权部门。
可见,本实施例提供的一种企业金融风险定量分析和预警方法,数据来源于互联网公开采集,数据资源丰富,获取方式便捷高;根据互联网公开采集数据,为企业金融风险分析建立专门的指标体系,使得风险判断更加准确和高效;结合机器学习能力调整特征指标权重,使得企业金融风险分值计算更为精准;在模型中增加企业官网访问量的变化率,对企业舆情信息进行参数调节,提高企业金融风险监测预警的效率,提高企业金融风险定量分析的精准度;按照高中低三级预警模式,可以有效判断机构风险等级,快速定性和处置风险。
下面对本申请实施例提供的一种企业金融风险定量分析和预警装置进行介绍,下文描述的一种企业金融风险定量分析和预警装置与上文描述的一种企业金融风险定量分析和预警方法可相互对应参照。
如图4所示,本实施例的企业金融风险定量分析和预警装置,包括:
互联网数据采集模块401:用于采集目标企业的企业数据;
指标数据提取模块402:用于从企业数据中提取企业金融风险指标的指标数据,其中企业金融风险指标包括企业注册风险指标、企业经营风险指标和企业舆情风险指标;
网络流量采集分析模块403:用于采集目标企业的官网的访问量数据以作为样本,计算样本方差、样本均值、样本标准差;根据样本方差、样本均值、样本标准差的大小关系,确定舆情调节参数,其中舆情调节参数用于对企业舆情风险指标的权重进行调节;
风险定量分析模块404:用于将指标数据和舆情调节参数输入企业金融风险模型,得到目标企业的企业金融风险指数,其中企业金融风险模型包括各项企业金融风险指标的权重;
风险预警模块405:用于根据企业金融风险指数,进行风险预警。
本实施例的企业金融风险定量分析和预警装置用于实现前述的企业金融风险定量分析和预警方法,因此该装置中的具体实施方式可见前文中的企业金融风险定量分析和预警方法的实施例部分,例如,互联网数据采集模块401、指标数据提取模块402、网络流量采集分析模块403、风险定量分析模块404、风险预警模块405,分别用于实现上述企业金融风险定量分析和预警方法中步骤S101,S102,S103,S104,S105。所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再展开介绍。
另外,由于本实施例的企业金融风险定量分析和预警装置用于实现前述的企业金融风险定量分析和预警方法,因此其作用与上述方法的作用相对应,这里不再赘述。
此外,本申请还提供了一种企业金融风险定量分析和预警设备,包括:
存储器:用于存储计算机程序;
处理器:用于执行计算机程序,以实现如上文所述的企业金融风险定量分析和预警方法。
最后,本申请提供了一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行时用于实现如上文所述的企业金融风险定量分析和预警方法。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的方案进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种企业金融风险定量分析和预警方法,其特征在于,包括:
采集目标企业的企业数据;
从所述企业数据中提取企业金融风险指标的指标数据,其中所述企业金融风险指标包括企业注册风险指标、企业经营风险指标和企业舆情风险指标;
采集所述目标企业的官网的访问量数据以作为样本,计算样本方差、样本均值、样本标准差;根据所述样本方差、所述样本均值、所述样本标准差的大小关系,确定舆情调节参数,其中所述舆情调节参数用于对所述企业舆情风险指标的权重进行调节;
将所述指标数据和所述舆情调节参数输入企业金融风险模型,得到所述目标企业的企业金融风险指数,其中所述企业金融风险模型包括各项企业金融风险指标的权重;
根据所述企业金融风险指数,进行风险预警。
2.如权利要求1所述的方法,其特征在于,所述采集目标企业的企业数据,包括:
通过以下任意一项或多项技术,采集目标企业的企业数据:逆向JS脚本技术、网页自动化测试技术、多账号Cookie池技术、中间人代理技术。
3.如权利要求2所述的方法,其特征在于,所述从所述企业数据中提取企业金融风险指标的指标数据,包括:
对所述企业数据进行预处理,其中所述预处理包括数据清洗和整理;从预处理后的企业数据中识别得到企业金融风险指标的文字描述;通过自然语言处理技术,将所述文字描述转换为向量表示,得到企业金融风险指标的指标数据。
4.如权利要求1所述的方法,其特征在于,在所述将所述指标数据和所述舆情调节参数输入企业金融风险模型之前,还包括:
构建企业金融风险模型,所述企业金融风险模型包括企业金融风险指标的初始权重;
根据训练样本,采用线性回归方法对所述企业金融风险模型中企业金融风险指标的初始权重进行调整。
5.如权利要求1所述的方法,其特征在于,所述根据所述企业金融风险指数,进行风险预警,包括:
若所述企业金融风险指数小于等于第一阈值,则判定所述目标企业为低风险企业,并进行相应的风险预警;
若所述企业金融风险指数大于所述第一阈值且小于第二阈值,则判定所述目标企业为中风险企业,并进行相应的风险预警;
若所述企业金融风险指数大于等于所述第二阈值,则判定所述目标企业为高风险企业,并进行相应的风险预警。
6.如权利要求1-5任意一项所述的方法,其特征在于,所述根据所述样本方差、所述样本均值、所述样本标准差的大小关系,确定舆情调节参数,包括:
若所述样本方差与所述样本均值的差值小于等于3倍的所述样本标准差,则选取第一预设值作为舆情调节参数;
若所述样本方差与所述样本均值的差值大于3倍的所述样本标准差,则选取第二预设值作为舆情调节参数;
其中,所述第一预设值小于所述第二预设值。
7.如权利要求6所述的方法,其特征在于,所述第一预设值为1,所述第二预设值为1.5。
8.一种企业金融风险定量分析和预警装置,其特征在于,包括:
互联网数据采集模块:用于采集目标企业的企业数据;
指标数据提取模块:用于从所述企业数据中提取企业金融风险指标的指标数据,其中所述企业金融风险指标包括企业注册风险指标、企业经营风险指标和企业舆情风险指标;
网络流量采集分析模块:用于采集所述目标企业的官网的访问量数据以作为样本,计算样本方差、样本均值、样本标准差;根据所述样本方差、所述样本均值、所述样本标准差的大小关系,确定舆情调节参数,其中所述舆情调节参数用于对所述企业舆情风险指标的权重进行调节;
风险定量分析模块:用于将所述指标数据和所述舆情调节参数输入企业金融风险模型,得到所述目标企业的企业金融风险指数,其中所述企业金融风险模型包括各项企业金融风险指标的权重;
风险预警模块:用于根据所述企业金融风险指数,进行风险预警。
9.一种企业金融风险定量分析和预警设备,其特征在于,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序,以实现如权利要求1-7任意一项所述的企业金融风险定量分析和预警方法。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时用于实现如权利要求1-7任意一项所述的企业金融风险定量分析和预警方法。
CN202011023365.8A 2020-09-25 2020-09-25 一种企业金融风险定量分析和预警方法、装置及设备 Pending CN111967802A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011023365.8A CN111967802A (zh) 2020-09-25 2020-09-25 一种企业金融风险定量分析和预警方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011023365.8A CN111967802A (zh) 2020-09-25 2020-09-25 一种企业金融风险定量分析和预警方法、装置及设备

Publications (1)

Publication Number Publication Date
CN111967802A true CN111967802A (zh) 2020-11-20

Family

ID=73387564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011023365.8A Pending CN111967802A (zh) 2020-09-25 2020-09-25 一种企业金融风险定量分析和预警方法、装置及设备

Country Status (1)

Country Link
CN (1) CN111967802A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112419029A (zh) * 2020-11-27 2021-02-26 诺丁汉(宁波保税区)区块链有限公司 类金融机构风险监控方法、风险模拟系统及存储介质
CN113065971A (zh) * 2021-03-31 2021-07-02 中国工商银行股份有限公司 产品风险预警方法及装置
CN113673870A (zh) * 2021-08-23 2021-11-19 杭州安恒信息技术股份有限公司 一种企业数据分析方法及相关组件

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112419029A (zh) * 2020-11-27 2021-02-26 诺丁汉(宁波保税区)区块链有限公司 类金融机构风险监控方法、风险模拟系统及存储介质
CN113065971A (zh) * 2021-03-31 2021-07-02 中国工商银行股份有限公司 产品风险预警方法及装置
CN113673870A (zh) * 2021-08-23 2021-11-19 杭州安恒信息技术股份有限公司 一种企业数据分析方法及相关组件
CN113673870B (zh) * 2021-08-23 2024-04-30 杭州安恒信息技术股份有限公司 一种企业数据分析方法及相关组件

Similar Documents

Publication Publication Date Title
KR102061987B1 (ko) 위험 평가 방법 및 시스템
CN111967802A (zh) 一种企业金融风险定量分析和预警方法、装置及设备
CN106469376B (zh) 一种风险控制方法和设备
CN111507822A (zh) 一种基于特征工程的企业风险评估方法
CN112734559B (zh) 企业信用风险评价方法、装置及电子设备
Hacioglu et al. Crafting performance-based cryptocurrency mining strategies using a hybrid analytics approach
CN111738843A (zh) 一种使用流水数据的量化风险评价系统和方法
CN111369344A (zh) 一种动态生成预警规则的方法和装置
CN113409150A (zh) 经营风险及信用风险评估方法、装置及计算机存储介质
CN111798304A (zh) 一种风险贷款确定方法、装置、电子设备及存储介质
McKay DeFi-ing cyber attacks
CN116402528A (zh) 电力数据处理系统
CN112581291B (zh) 风险测评异动检测方法、装置、设备及存储介质
TW201327453A (zh) 微型企業融資風險評估方法
CN113836410B (zh) 车辆声品质评估方法、装置、评估设备及存储介质
CN113673870B (zh) 一种企业数据分析方法及相关组件
KR20120103310A (ko) 데이터베이스 분석을 통한 낙찰 금액 산출 시스템 및 그 산출 방법
Hutapea et al. Spatial modeling of poverty level in kepulauan bangka belitung province
CN114422168A (zh) 一种恶意机器流量识别方法及系统
CN114092216A (zh) 企业信贷评级方法、装置、计算机设备和存储介质
CN110782332A (zh) 一种智能信用评估动态追溯方法
López et al. Credit Risk Models in the Mexican Context Using Machine Learning
CN117474322A (zh) 模型风险等级的评估方法及装置、存储介质、电子设备
Uddin et al. A study on the relationship between working environment and labor unrest in ready-made garment (RMG) industry of Bangladesh
CN113344709A (zh) 客户理财风险测评方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination