CN116862243A - 一种基于神经网络的企业风险分析预测方法、系统及介质 - Google Patents
一种基于神经网络的企业风险分析预测方法、系统及介质 Download PDFInfo
- Publication number
- CN116862243A CN116862243A CN202311096562.6A CN202311096562A CN116862243A CN 116862243 A CN116862243 A CN 116862243A CN 202311096562 A CN202311096562 A CN 202311096562A CN 116862243 A CN116862243 A CN 116862243A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- data
- risk
- crawling
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012502 risk assessment Methods 0.000 title claims abstract description 96
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 50
- 238000012549 training Methods 0.000 claims abstract description 19
- 238000005516 engineering process Methods 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 230000009193 crawling Effects 0.000 claims description 107
- 238000011156 evaluation Methods 0.000 claims description 50
- 239000013598 vector Substances 0.000 claims description 28
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 abstract description 8
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000003062 neural network model Methods 0.000 description 6
- 238000012937 correction Methods 0.000 description 4
- 238000013075 data extraction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
Abstract
本申请实施例提供了一种基于神经网络的企业风险分析预测方法、系统及介质,该方法包括:通过网络爬虫技术爬取大量数据,并输入初始模型进行训练,生成风控模型;获取企业文本数据,将企业文本数据进行预处理,抽取企业实体关系数据;将企业实体关系数据输入风控模型,得到企业风险评估信息;将企业风险评估信息与预设的评估信息进行比较,判断偏差率是否大于或等于预设的偏差率阈值;若大于或等于,则根据风险预警信息对企业风险进行预测;通过风控模型对企业文本数据进行实体关系抽取,并实现企业风险智能评估,当企业评估信息出现较大的偏差时,说明企业出现异常风险数据,根据异常风险数据对企业经营风险进行预测,提高企业风险分析的精度。
Description
技术领域
本申请涉及企业风险分析领域,具体而言,涉及一种基于神经网络的企业风险分析预测方法、系统及介质。
背景技术
随着企业向数字经济转型,很多企业面临着产业结构调整和数字化转型的挑战,在这一过程中,可能会存在潜在的风险,企业在生产经营过程中也可能会出现一些问题,导致企业有不同程度风险的发生。不同类型的风险对企业的影响程度不同,但都有可能给企业造成不同程度的损失在企业风险评估方法方面,初步的企业风险评估方法主要采用专家判定法,依据专家的个人经验判定企业的风险状况,但该方法主观性较强且依赖于专家经验、准确率不高,针对上述问题,目前亟待有效的技术解决方案。
发明内容
本申请实施例的目的在于提供一种基于神经网络的企业风险分析预测方法、系统及介质,可以通过风控模型对企业文本数据进行实体关系抽取,并实现企业风险智能评估,当企业评估信息出现较大的偏差时,说明企业出现异常风险数据,根据异常风险数据对企业经营风险进行预测,提高企业风险分析的精度。
本申请实施例还提供了一种基于神经网络的企业风险分析预测方法,包括:
通过网络爬虫技术爬取大量数据,并输入初始模型进行训练,生成风控模型;
获取企业文本数据,将企业文本数据进行预处理,抽取企业实体关系数据;
将企业实体关系数据输入风控模型,得到企业风险评估信息;
将企业风险评估信息与预设的评估信息进行比较,得到偏差率;
判断所述偏差率是否大于或等于预设的偏差率阈值;
若大于或等于,则生成风险预警信息,根据风险预警信息对企业风险进行预测;
若小于,则将企业风险评估信息传输至终端。
可选地,在本申请实施例所述的基于神经网络的企业风险分析预测方法中,所述通过网络爬虫技术爬取大量数据,并输入初始模型进行训练,生成风控模型,具体为:
通过网络数据库建立爬取队列,并生成数据爬取顺序,生成初始网页链接;
根据初始网页链接读取与访问初始网页,并提取网页中的数据元素;
根据数据元素提取网页特征,将网页特征与预设的特征进行相似度计算;
若相似度大于或等于预设的相似度阈值,则生成企业数据;
若小于,则将爬取队列中的下一个网页链接进行调用,并提取网页中的数据进行分析。
可选地,在本申请实施例所述的基于神经网络的企业风险分析预测方法中,所述根据初始网页链接读取与访问初始网页,并提取网页中的数据元素,具体为:
获取初始网络链接,建立爬取参数;
获取实时爬取状态信息,将实时爬取状态信息与预设爬取状态信息进行比较,得到爬取偏差率;
判断所述爬取偏差率是否大于或等于预设的偏差率阈值;
若大于或等于,则生成爬取调整信息,根据爬取调整信息对爬取参数进行实时调整;
若小于,则根据当前爬取参数读取与访问初始网页,并提取网页中的数据元素。
可选地,在本申请实施例所述的基于神经网络的企业风险分析预测方法中,所述获取企业文本数据,将企业文本数据进行预处理,抽取企业实体关系数据,具体为:
获取企业文本数据,将经预处理后的文本数据与实体词典进行匹配并对文本数据进行标注;
将标注好的文本数据和预处理的企业文本数据转换为向量进行拼接;
对拼接向量进行学习提取企业文本数据的语义特征;
根据语义特征进行实体关系抽取生成企业实体关系数据。
可选地,在本申请实施例所述的基于神经网络的企业风险分析预测方法中,所述根据语义特征进行实体关系抽取生成企业实体关系数据之后,还包括:
获取企业实体关系数据,根据企业实体关系数据生成词向量;
使用卷积神经网络捕获词向量构建的句子局部信息;
根据句子局部信息提取数据语义特征,并根据数据语义特征进行数据关系抽取,得到企业风险数据;
根据企业风险数据生成风险评价信息;
根据风险评价信息对企业风险进行等级划分。
可选地,在本申请实施例所述的基于神经网络的企业风险分析预测方法中,所述根据企业风险数据生成风险评价信息,根据风险评价信息对企业风险进行等级划分;具体为:
获取风险评价信息,将风险评价信息与预设的评价信息进行比较,得到评价值;
将所述评价值与企业风险等级的多个标准等级范围进行比较;
根据评价值计算企业风险等级;
将企业风险等级与预设的等级进行比较;
判断所述风险等级是否大于或等于预设的等级;
若大于或等于,则生成企业预警信息,根据企业预警信息生成企业风险数据;
若小于,则将企业风险评价信息进行实时监控。
第二方面,本申请实施例提供了一种基于神经网络的企业风险分析预测系统,该系统包括:存储器及处理器,所述存储器中包括基于神经网络的企业风险分析预测方法的程序,所述基于神经网络的企业风险分析预测方法的程序被所述处理器执行时实现以下步骤:
通过网络爬虫技术爬取大量数据,并输入初始模型进行训练,生成风控模型;
获取企业文本数据,将企业文本数据进行预处理,抽取企业实体关系数据;
将企业实体关系数据输入风控模型,得到企业风险评估信息;
将企业风险评估信息与预设的评估信息进行比较,得到偏差率;
判断所述偏差率是否大于或等于预设的偏差率阈值;
若大于或等于,则生成风险预警信息,根据风险预警信息对企业风险进行预测;
若小于,则将企业风险评估信息传输至终端。
可选地,在本申请实施例所述的基于神经网络的企业风险分析预测系统中,所述通过网络爬虫技术爬取大量数据,并输入初始模型进行训练,生成风控模型,具体为:
通过网络数据库建立爬取队列,并生成数据爬取顺序,生成初始网页链接;
根据初始网页链接读取与访问初始网页,并提取网页中的数据元素;
根据数据元素提取网页特征,将网页特征与预设的特征进行相似度计算;
若相似度大于或等于预设的相似度阈值,则生成企业数据;
若小于,则将爬取队列中的下一个网页链接进行调用,并提取网页中的数据进行分析。
可选地,在本申请实施例所述的基于神经网络的企业风险分析预测系统中,所述根据初始网页链接读取与访问初始网页,并提取网页中的数据元素,具体为:
获取初始网络链接,建立爬取参数;
获取实时爬取状态信息,将实时爬取状态信息与预设爬取状态信息进行比较,得到爬取偏差率;
判断所述爬取偏差率是否大于或等于预设的偏差率阈值;
若大于或等于,则生成爬取调整信息,根据爬取调整信息对爬取参数进行实时调整;
若小于,则根据当前爬取参数读取与访问初始网页,并提取网页中的数据元素。
第三方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中包括基于神经网络的企业风险分析预测方法程序,所述基于神经网络的企业风险分析预测方法程序被处理器执行时,实现如上述任一项所述的基于神经网络的企业风险分析预测方法的步骤。
由上可知,本申请实施例提供的一种基于神经网络的企业风险分析预测方法、系统及介质,通过网络爬虫技术爬取大量数据,并输入初始模型进行训练,生成风控模型;获取企业文本数据,将企业文本数据进行预处理,抽取企业实体关系数据;将企业实体关系数据输入风控模型,得到企业风险评估信息;将企业风险评估信息与预设的评估信息进行比较,得到偏差率;判断所述偏差率是否大于或等于预设的偏差率阈值;若大于或等于,则生成风险预警信息,根据风险预警信息对企业风险进行预测;若小于,则将企业风险评估信息传输至终端;通过风控模型对企业文本数据进行实体关系抽取,并实现企业风险智能评估,当企业评估信息出现较大的偏差时,说明企业出现异常风险数据,根据异常风险数据对企业经营风险进行预测,提高企业风险分析的精度的技术。
本申请的其他特征和优点将在随后的说明书阐述,本申请的目的和优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的基于神经网络的企业风险分析预测方法的流程图;
图2为本申请实施例提供的基于神经网络的企业风险分析预测方法的通过网络爬虫提取网页数据流程图;
图3为本申请实施例提供的基于神经网络的企业风险分析预测方法的网络爬虫爬取参数调整方法流程图;
图4为本申请实施例提供的基于神经网络的企业风险分析预测系统的结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到,相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,图1是本申请一些实施例中的一种基于神经网络的企业风险分析预测方法的流程图。该基于神经网络的企业风险分析预测方法用于终端设备中,该基于神经网络的企业风险分析预测方法,包括以下步骤:
S101,通过网络爬虫技术爬取大量数据,并输入初始模型进行训练,生成风控模型;
S102,获取企业文本数据,将企业文本数据进行预处理,抽取企业实体关系数据;
S103,将企业实体关系数据输入风控模型,得到企业风险评估信息,将企业风险评估信息与预设的评估信息进行比较,得到偏差率;
S104,判断偏差率是否大于或等于预设的偏差率阈值;
S105,若大于或等于,则生成风险预警信息,根据风险预警信息对企业风险进行预测;
若小于,则将企业风险评估信息传输至终端。
需要说明的是,网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件,通过网络爬虫可以获取企业大数据,并对初始模型进行训练形成神经网络模型,提高神经网络模型的学习能力,使神经网络模型输出的结果更加精准。
请参照图2,图2是本申请一些实施例中的一种基于神经网络的企业风险分析预测方法的通过网络爬虫提取网页数据流程图。根据本发明实施例,通过网络爬虫技术爬取大量数据,并输入初始模型进行训练,生成风控模型,具体为:
S201,通过网络数据库建立爬取队列,并生成数据爬取顺序,生成初始网页链接;
S202,根据初始网页链接读取与访问初始网页,并提取网页中的数据元素;
S203,根据数据元素提取网页特征,将网页特征与预设的特征进行相似度计算;
S204,若相似度大于或等于预设的相似度阈值,则生成企业数据;
S205,若小于,则将爬取队列中的下一个网页链接进行调用,并提取网页中的数据进行分析。
需要说明的是,通过提取网页中的数据元素,并进行网页特征的提取,对网页特征进行判断,提高网页提取的数据元素的准确性,保证在模型训练过程中防止数据的冗余,提高训练效率。
请参照图3,图3是本申请一些实施例中的一种基于神经网络的企业风险分析预测方法的网络爬虫爬取参数调整方法流程图。根据本发明实施例,根据初始网页链接读取与访问初始网页,并提取网页中的数据元素,具体为:
S301,获取初始网络链接,建立爬取参数;
S302,获取实时爬取状态信息,将实时爬取状态信息与预设爬取状态信息进行比较,得到爬取偏差率;
S303,判断爬取偏差率是否大于或等于预设的偏差率阈值;
S304,若大于或等于,则生成爬取调整信息,根据爬取调整信息对爬取参数进行实时调整;
S305,若小于,则根据当前爬取参数读取与访问初始网页,并提取网页中的数据元素。
需要说明的是,在进行网页爬取过程中,通过判断爬取状态对爬取参数进行实时调整,保证网页爬取的精度,可以从网页中提取有效特征,防止无效特征对数据元素分析的干扰。
根据本发明实施例,获取企业文本数据,将企业文本数据进行预处理,抽取企业实体关系数据,具体为:
获取企业文本数据,将经预处理后的文本数据与实体词典进行匹配并对文本数据进行标注;
将标注好的文本数据和预处理的企业文本数据转换为向量进行拼接;
对拼接向量进行学习提取企业文本数据的语义特征;
根据语义特征进行实体关系抽取生成企业实体关系数据。
需要说明的是,通过网页爬取从专业数据库、信息披露网站、企业官网等多个渠道获取企业各类信息,如企业公告信息、企业司法信息、企业舆情信息等,构建了企业文本数据集,并通过企业文本数据抽取企业实体关系数据,企业相关文本数据集主要包括两种数据形式:第一类是有一定固定结构的企业文本数据,如企业公告、企业创新等数据,该类型的数据内容具有一定的重复性并且有较为固定的数据来源,如企业公告数据主要来源于巨潮资讯网等信息披露网站、企业创新数据等专业数据库。因此,按数据来源对这类数据进行风险类型划分。第二类是没有固定结构的文本数据,如企业舆情等,该类型数据内容呈现多样化、更新速度快。
根据本发明实施例,根据语义特征进行实体关系抽取生成企业实体关系数据之后,还包括:
获取企业实体关系数据,根据企业实体关系数据生成词向量;
使用卷积神经网络捕获词向量构建的句子局部信息;
根据句子局部信息提取数据语义特征,并根据数据语义特征进行数据关系抽取,得到企业风险数据;
根据企业风险数据生成风险评价信息;
根据风险评价信息对企业风险进行等级划分。
需要说明的是,通过对企业实体关系数据进行词向量划分,并提取语义特征,根据语义特征可以得到企业实体关系数据的语义,并对企业风险数据进行评价,评价值越高,说明企业风险越高,从而实现对企业风险的精准预测。
根据本发明实施例,根据企业风险数据生成风险评价信息,根据风险评价信息对企业风险进行等级划分;具体为:
获取风险评价信息,将风险评价信息与预设的评价信息进行比较,得到评价值;
将评价值与企业风险等级的多个标准等级范围进行比较;
根据评价值计算企业风险等级;
将企业风险等级与预设的等级进行比较;
判断风险等级是否大于或等于预设的等级;
若大于或等于,则生成企业预警信息,根据企业预警信息生成企业风险数据;
若小于,则将企业风险评价信息进行实时监控。
需要说明的是,根据评价值判断该评价值处于哪一个风险等级的标准等级范围,并生成对应的风险等级,根据风险等级对企业进行实时动态预警,形成动态企业风险数据,从而可以根据企业风险数据对企业进行实时动态监控,提高企业的运行安全性。
根据本发明实施例,将标注好的文本数据和预处理的企业文本数据转换为向量进行拼接,还包括:
获取企业文本数据,将文本数据转换为向量;
利用卷积核与文本向量进行卷积运算;
不同的卷积核提取不同部位的特征信息;
将特征信息与预设的特征进行比较,得到特征偏差;
判断特征偏差是否满足预设的偏差范围;
若满足,则生成修正信息,根据修正信息对文图数据的转换参数进行修正;
若不满足,则得到文本数据语义信息。
需要说明的是,通过卷积神经网络对文本向量进行卷积运算,并判断文本特征是否满足要求,并实时对文本特征向量的转换参数进行实时调整,保证文本特征的转换精度。
请参照图4,图4是本申请一些实施例中的一种基于神经网络的企业风险分析预测系统的结构示意图。第二方面,本申请实施例提供了一种基于神经网络的企业风险分析预测系统4,该系统包括:存储器41及处理器42,存储器41中包括基于神经网络的企业风险分析预测方法的程序,基于神经网络的企业风险分析预测方法的程序被处理器执行时实现以下步骤:
通过网络爬虫技术爬取大量数据,并输入初始模型进行训练,生成风控模型;
获取企业文本数据,将企业文本数据进行预处理,抽取企业实体关系数据;
将企业实体关系数据输入风控模型,得到企业风险评估信息;
将企业风险评估信息与预设的评估信息进行比较,得到偏差率;
判断偏差率是否大于或等于预设的偏差率阈值;
若大于或等于,则生成风险预警信息,根据风险预警信息对企业风险进行预测;
若小于,则将企业风险评估信息传输至终端。
需要说明的是,网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件,通过网络爬虫可以获取企业大数据,并对初始模型进行训练形成神经网络模型,提高神经网络模型的学习能力,使神经网络模型输出的结果更加精准。
根据本发明实施例,通过网络爬虫技术爬取大量数据,并输入初始模型进行训练,生成风控模型,具体为:
通过网络数据库建立爬取队列,并生成数据爬取顺序,生成初始网页链接;
根据初始网页链接读取与访问初始网页,并提取网页中的数据元素;
根据数据元素提取网页特征,将网页特征与预设的特征进行相似度计算;
若相似度大于或等于预设的相似度阈值,则生成企业数据;
若小于,则将爬取队列中的下一个网页链接进行调用,并提取网页中的数据进行分析。
需要说明的是,通过提取网页中的数据元素,并进行网页特征的提取,对网页特征进行判断,提高网页提取的数据元素的准确性,保证在模型训练过程中防止数据的冗余,提高训练效率。
根据本发明实施例,根据初始网页链接读取与访问初始网页,并提取网页中的数据元素,具体为:
获取初始网络链接,建立爬取参数;
获取实时爬取状态信息,将实时爬取状态信息与预设爬取状态信息进行比较,得到爬取偏差率;
判断爬取偏差率是否大于或等于预设的偏差率阈值;
若大于或等于,则生成爬取调整信息,根据爬取调整信息对爬取参数进行实时调整;
若小于,则根据当前爬取参数读取与访问初始网页,并提取网页中的数据元素。
需要说明的是,在进行网页爬取过程中,通过判断爬取状态对爬取参数进行实时调整,保证网页爬取的精度,可以从网页中提取有效特征,防止无效特征对数据元素分析的干扰。
根据本发明实施例,获取企业文本数据,将企业文本数据进行预处理,抽取企业实体关系数据,具体为:
获取企业文本数据,将经预处理后的文本数据与实体词典进行匹配并对文本数据进行标注;
将标注好的文本数据和预处理的企业文本数据转换为向量进行拼接;
对拼接向量进行学习提取企业文本数据的语义特征;
根据语义特征进行实体关系抽取生成企业实体关系数据。
需要说明的是,通过网页爬取从专业数据库、信息披露网站、企业官网等多个渠道获取企业各类信息,如企业公告信息、企业司法信息、企业舆情信息等,构建了企业文本数据集,并通过企业文本数据抽取企业实体关系数据,企业相关文本数据集主要包括两种数据形式:第一类是有一定固定结构的企业文本数据,如企业公告、企业创新等数据,该类型的数据内容具有一定的重复性并且有较为固定的数据来源,如企业公告数据主要来源于巨潮资讯网等信息披露网站、企业创新数据等专业数据库。因此,按数据来源对这类数据进行风险类型划分。第二类是没有固定结构的文本数据,如企业舆情等,该类型数据内容呈现多样化、更新速度快。
根据本发明实施例,根据语义特征进行实体关系抽取生成企业实体关系数据之后,还包括:
获取企业实体关系数据,根据企业实体关系数据生成词向量;
使用卷积神经网络捕获词向量构建的句子局部信息;
根据句子局部信息提取数据语义特征,并根据数据语义特征进行数据关系抽取,得到企业风险数据;
根据企业风险数据生成风险评价信息;
根据风险评价信息对企业风险进行等级划分。
需要说明的是,通过对企业实体关系数据进行词向量划分,并提取语义特征,根据语义特征可以得到企业实体关系数据的语义,并对企业风险数据进行评价,评价值越高,说明企业风险越高,从而实现对企业风险的精准预测。
根据本发明实施例,根据企业风险数据生成风险评价信息,根据风险评价信息对企业风险进行等级划分;具体为:
获取风险评价信息,将风险评价信息与预设的评价信息进行比较,得到评价值;
将评价值与企业风险等级的多个标准等级范围进行比较;
根据评价值计算企业风险等级;
将企业风险等级与预设的等级进行比较;
判断风险等级是否大于或等于预设的等级;
若大于或等于,则生成企业预警信息,根据企业预警信息生成企业风险数据;
若小于,则将企业风险评价信息进行实时监控。
需要说明的是,根据评价值判断该评价值处于哪一个风险等级的标准等级范围,并生成对应的风险等级,根据风险等级对企业进行实时动态预警,形成动态企业风险数据,从而可以根据企业风险数据对企业进行实时动态监控,提高企业的运行安全性。
根据本发明实施例,将标注好的文本数据和预处理的企业文本数据转换为向量进行拼接,还包括:
获取企业文本数据,将文本数据转换为向量;
利用卷积核与文本向量进行卷积运算;
不同的卷积核提取不同部位的特征信息;
将特征信息与预设的特征进行比较,得到特征偏差;
判断特征偏差是否满足预设的偏差范围;
若满足,则生成修正信息,根据修正信息对文图数据的转换参数进行修正;
若不满足,则得到文本数据语义信息。
需要说明的是,通过卷积神经网络对文本向量进行卷积运算,并判断文本特征是否满足要求,并实时对文本特征向量的转换参数进行实时调整,保证文本特征的转换精度。
本发明第三方面提供了一种计算机可读存储介质,可读存储介质中包括基于神经网络的企业风险分析预测方法程序,基于神经网络的企业风险分析预测方法程序被处理器执行时,实现如上述任一项的基于神经网络的企业风险分析预测方法的步骤。
本发明公开的一种基于神经网络的企业风险分析预测方法、系统及介质,通过网络爬虫技术爬取大量数据,并输入初始模型进行训练,生成风控模型;获取企业文本数据,将企业文本数据进行预处理,抽取企业实体关系数据;将企业实体关系数据输入风控模型,得到企业风险评估信息;将企业风险评估信息与预设的评估信息进行比较,得到偏差率;判断所述偏差率是否大于或等于预设的偏差率阈值;若大于或等于,则生成风险预警信息,根据风险预警信息对企业风险进行预测;若小于,则将企业风险评估信息传输至终端;通过风控模型对企业文本数据进行实体关系抽取,并实现企业风险智能评估,当企业评估信息出现较大的偏差时,说明企业出现异常风险数据,根据异常风险数据对企业经营风险进行预测,提高企业风险分析的精度的技术。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (10)
1.一种基于神经网络的企业风险分析预测方法,其特征在于,包括:
通过网络爬虫技术爬取大量数据,并输入初始模型进行训练,生成风控模型;
获取企业文本数据,将企业文本数据进行预处理,抽取企业实体关系数据;
将企业实体关系数据输入风控模型,得到企业风险评估信息;
将企业风险评估信息与预设的评估信息进行比较,得到偏差率;
判断所述偏差率是否大于或等于预设的偏差率阈值;
若大于或等于,则生成风险预警信息,根据风险预警信息对企业风险进行预测;
若小于,则将企业风险评估信息传输至终端。
2.根据权利要求1所述的基于神经网络的企业风险分析预测方法,其特征在于,所述通过网络爬虫技术爬取大量数据,并输入初始模型进行训练,生成风控模型,具体为:
通过网络数据库建立爬取队列,并生成数据爬取顺序,生成初始网页链接;
根据初始网页链接读取与访问初始网页,并提取网页中的数据元素;
根据数据元素提取网页特征,将网页特征与预设的特征进行相似度计算;
若相似度大于或等于预设的相似度阈值,则生成企业数据;
若小于,则将爬取队列中的下一个网页链接进行调用,并提取网页中的数据进行分析。
3.根据权利要求2所述的基于神经网络的企业风险分析预测方法,其特征在于,所述根据初始网页链接读取与访问初始网页,并提取网页中的数据元素,具体为:
获取初始网络链接,建立爬取参数;
获取实时爬取状态信息,将实时爬取状态信息与预设爬取状态信息进行比较,得到爬取偏差率;
判断所述爬取偏差率是否大于或等于预设的偏差率阈值;
若大于或等于,则生成爬取调整信息,根据爬取调整信息对爬取参数进行实时调整;
若小于,则根据当前爬取参数读取与访问初始网页,并提取网页中的数据元素。
4.根据权利要求3所述的基于神经网络的企业风险分析预测方法,其特征在于,所述获取企业文本数据,将企业文本数据进行预处理,抽取企业实体关系数据,具体为:
获取企业文本数据,将经预处理后的文本数据与实体词典进行匹配并对文本数据进行标注;
将标注好的文本数据和预处理的企业文本数据转换为向量进行拼接;
对拼接向量进行学习提取企业文本数据的语义特征;
根据语义特征进行实体关系抽取生成企业实体关系数据。
5.根据权利要求4所述的基于神经网络的企业风险分析预测方法,其特征在于,所述根据语义特征进行实体关系抽取生成企业实体关系数据之后,还包括:
获取企业实体关系数据,根据企业实体关系数据生成词向量;
使用卷积神经网络捕获词向量构建的句子局部信息;
根据句子局部信息提取数据语义特征,并根据数据语义特征进行数据关系抽取,得到企业风险数据;
根据企业风险数据生成风险评价信息;
根据风险评价信息对企业风险进行等级划分。
6.根据权利要求5所述的基于神经网络的企业风险分析预测方法,其特征在于,所述根据企业风险数据生成风险评价信息,根据风险评价信息对企业风险进行等级划分;具体为:
获取风险评价信息,将风险评价信息与预设的评价信息进行比较,得到评价值;
将所述评价值与企业风险等级的多个标准等级范围进行比较;
根据评价值计算企业风险等级;
将企业风险等级与预设的等级进行比较;
判断所述风险等级是否大于或等于预设的等级;
若大于或等于,则生成企业预警信息,根据企业预警信息生成企业风险数据;
若小于,则将企业风险评价信息进行实时监控。
7.一种基于神经网络的企业风险分析预测系统,其特征在于,该系统包括:存储器及处理器,所述存储器中包括基于神经网络的企业风险分析预测方法的程序,所述基于神经网络的企业风险分析预测方法的程序被所述处理器执行时实现以下步骤:
通过网络爬虫技术爬取大量数据,并输入初始模型进行训练,生成风控模型;
获取企业文本数据,将企业文本数据进行预处理,抽取企业实体关系数据;
将企业实体关系数据输入风控模型,得到企业风险评估信息;
将企业风险评估信息与预设的评估信息进行比较,得到偏差率;
判断所述偏差率是否大于或等于预设的偏差率阈值;
若大于或等于,则生成风险预警信息,根据风险预警信息对企业风险进行预测;
若小于,则将企业风险评估信息传输至终端。
8.根据权利要求7所述的基于神经网络的企业风险分析预测系统,其特征在于,所述通过网络爬虫技术爬取大量数据,并输入初始模型进行训练,生成风控模型,具体为:
通过网络数据库建立爬取队列,并生成数据爬取顺序,生成初始网页链接;
根据初始网页链接读取与访问初始网页,并提取网页中的数据元素;
根据数据元素提取网页特征,将网页特征与预设的特征进行相似度计算;
若相似度大于或等于预设的相似度阈值,则生成企业数据;
若小于,则将爬取队列中的下一个网页链接进行调用,并提取网页中的数据进行分析。
9.根据权利要求8所述的基于神经网络的企业风险分析预测系统,其特征在于,所述根据初始网页链接读取与访问初始网页,并提取网页中的数据元素,具体为:
获取初始网络链接,建立爬取参数;
获取实时爬取状态信息,将实时爬取状态信息与预设爬取状态信息进行比较,得到爬取偏差率;
判断所述爬取偏差率是否大于或等于预设的偏差率阈值;
若大于或等于,则生成爬取调整信息,根据爬取调整信息对爬取参数进行实时调整;
若小于,则根据当前爬取参数读取与访问初始网页,并提取网页中的数据元素。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括基于神经网络的企业风险分析预测方法程序,所述基于神经网络的企业风险分析预测方法程序被处理器执行时,实现如权利要求1至6中任一项所述的基于神经网络的企业风险分析预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311096562.6A CN116862243A (zh) | 2023-08-29 | 2023-08-29 | 一种基于神经网络的企业风险分析预测方法、系统及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311096562.6A CN116862243A (zh) | 2023-08-29 | 2023-08-29 | 一种基于神经网络的企业风险分析预测方法、系统及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116862243A true CN116862243A (zh) | 2023-10-10 |
Family
ID=88221898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311096562.6A Pending CN116862243A (zh) | 2023-08-29 | 2023-08-29 | 一种基于神经网络的企业风险分析预测方法、系统及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116862243A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117436705A (zh) * | 2023-12-11 | 2024-01-23 | 深圳市明心数智科技有限公司 | 一种贸易风险分析方法、系统及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543985A (zh) * | 2018-11-15 | 2019-03-29 | 李志东 | 企业风险评估方法、系统及介质 |
CN110674970A (zh) * | 2019-08-19 | 2020-01-10 | 广州荔支网络技术有限公司 | 企业法务风险预警方法、装置、设备及可读存储介质 |
CN114926039A (zh) * | 2022-05-26 | 2022-08-19 | 中国平安人寿保险股份有限公司 | 风险评估方法、风险评估装置、电子设备及存储介质 |
-
2023
- 2023-08-29 CN CN202311096562.6A patent/CN116862243A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109543985A (zh) * | 2018-11-15 | 2019-03-29 | 李志东 | 企业风险评估方法、系统及介质 |
CN110674970A (zh) * | 2019-08-19 | 2020-01-10 | 广州荔支网络技术有限公司 | 企业法务风险预警方法、装置、设备及可读存储介质 |
CN114926039A (zh) * | 2022-05-26 | 2022-08-19 | 中国平安人寿保险股份有限公司 | 风险评估方法、风险评估装置、电子设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117436705A (zh) * | 2023-12-11 | 2024-01-23 | 深圳市明心数智科技有限公司 | 一种贸易风险分析方法、系统及介质 |
CN117436705B (zh) * | 2023-12-11 | 2024-04-19 | 深圳市明心数智科技有限公司 | 一种贸易风险分析方法、系统及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106557695B (zh) | 一种恶意应用检测方法和系统 | |
CN109829629A (zh) | 风险分析报告的生成方法、装置、计算机设备和存储介质 | |
CN115618371B (zh) | 一种非文本数据的脱敏方法、装置及存储介质 | |
CN116862243A (zh) | 一种基于神经网络的企业风险分析预测方法、系统及介质 | |
CN112347226A (zh) | 文档知识抽取方法、装置、计算机设备及可读存储介质 | |
CN113918794B (zh) | 企业网络舆情效益分析方法、系统、电子设备及存储介质 | |
CN111881398A (zh) | 页面类型确定方法、装置和设备及计算机存储介质 | |
CN112990281A (zh) | 异常投标识别模型训练方法、异常投标识别方法及装置 | |
WO2023159756A1 (zh) | 价格数据的处理方法和装置、电子设备、存储介质 | |
CN110750981A (zh) | 一种基于机器学习的高准确度网站敏感词检测方法 | |
CN107527289B (zh) | 一种投资组合行业配置方法、装置、服务器和存储介质 | |
CN113569118A (zh) | 自媒体推送方法、装置、计算机设备及存储介质 | |
CN115296933B (zh) | 一种工业生产数据风险等级评估方法及系统 | |
CN115563626B (zh) | 一种面向cve的漏洞可利用性预测方法 | |
CN112685618A (zh) | 用户特征识别方法、装置、计算设备及计算机存储介质 | |
CN111581533B (zh) | 目标对象的状态识别方法、装置、电子设备和存储介质 | |
CN114021064A (zh) | 网站分类方法、装置、设备及存储介质 | |
CN113961811A (zh) | 基于事件图谱的话术推荐方法、装置、设备及介质 | |
Zhu et al. | PDHF: Effective phishing detection model combining optimal artificial and automatic deep features | |
CN105930328A (zh) | 异常数据的解析方法及系统 | |
CN112187768B (zh) | 不良信息网站的检测方法、装置、设备及可读存储介质 | |
CN117278322B (zh) | Web入侵检测方法、装置、终端设备及存储介质 | |
US11941052B2 (en) | Online content evaluation system and methods | |
CN115858901A (zh) | 一种电子商务消费者评论数据采集方法和系统 | |
CN116401711A (zh) | 一种自适应数据脱敏方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |