CN117422311A - 企业风险评级模型构建方法、系统及存储介质 - Google Patents
企业风险评级模型构建方法、系统及存储介质 Download PDFInfo
- Publication number
- CN117422311A CN117422311A CN202311603997.5A CN202311603997A CN117422311A CN 117422311 A CN117422311 A CN 117422311A CN 202311603997 A CN202311603997 A CN 202311603997A CN 117422311 A CN117422311 A CN 117422311A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- data
- external
- internal
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000010276 construction Methods 0.000 title claims abstract description 28
- 238000003860 storage Methods 0.000 title claims abstract description 7
- 239000013598 vector Substances 0.000 claims abstract description 134
- 230000009133 cooperative interaction Effects 0.000 claims abstract description 69
- 238000004458 analytical method Methods 0.000 claims abstract description 22
- 230000003993 interaction Effects 0.000 claims description 24
- 238000000034 method Methods 0.000 claims description 21
- 238000007726 management method Methods 0.000 claims description 18
- 238000007781 pre-processing Methods 0.000 claims description 12
- 239000000463 material Substances 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 4
- 238000012550 audit Methods 0.000 claims description 3
- 238000011160 research Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 abstract description 6
- 238000012502 risk assessment Methods 0.000 description 13
- 238000009826 distribution Methods 0.000 description 9
- 230000007246 mechanism Effects 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000013210 evaluation model Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000013068 supply chain management Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种企业风险评级模型构建方法、系统及存储介质,其获取企业内部资料以及企业外部资料;对所述企业内部资料以及企业外部资料进行联合分析以得到企业内部‑外部协同交互特征向量;以及,基于所述企业内部‑外部协同交互特征向量,确定企业风险等级。这样,可以实现对企业的风险等级自动化评估,以促进企业改善自身的管理水平,提高市场竞争力和社会信誉。
Description
技术领域
本申请涉及智能化模型构建技术领域,并且更具体地,涉及一种企业风险评级模型构建方法、系统及存储介质。
背景技术
风险评级是一种对企业的财务状况、经营能力等方面进行综合分析和评价的方法,旨在反映企业的偿债能力和风险水平。风险评级的目的是为了帮助投资者、债权人、监管机构等利益相关者了解企业的真实情况,为他们提供有效的决策依据。风险评级还可以促进企业改善自身的管理水平,提高市场竞争力和社会信誉。
然而,目前的企业风险评级模型存在一些问题。例如,一些模型只考虑了企业的财务指标,忽略了企业的经营环境、行业特征等非财务因素,导致评级结果缺乏全面性和针对性。
因此,期待一种优化的企业风险评级模型构建方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种企业风险评级模型构建方法、系统及存储介质,其获取企业内部资料以及企业外部资料;对所述企业内部资料以及企业外部资料进行联合分析以得到企业内部-外部协同交互特征向量;以及,基于所述企业内部-外部协同交互特征向量,确定企业风险等级。这样,可以实现对企业的风险等级自动化评估,以促进企业改善自身的管理水平,提高市场竞争力和社会信誉。
第一方面,提供了一种企业风险评级模型构建方法,其包括:
获取企业内部资料以及企业外部资料;
对所述企业内部资料以及企业外部资料进行联合分析以得到企业内部-外部协同交互特征向量,其包括:
分别提取所述企业内部资料和所述企业外部资料的语义信息以得到企业内部资料语义编码特征向量和企业外部资料语义编码特征向量;
以及提取所述企业内部资料语义编码特征向量和所述企业外部资料语义编码特征向量之间的特征交互信息以得到所述企业内部-外部协同交互特征向量;
基于所述企业内部-外部协同交互特征向量,确定企业风险等级。
第二方面,提供了一种企业风险评级模型构建系统,其包括:
资料获取模块,用于获取企业内部资料以及企业外部资料;
联合分析模块,用于对所述企业内部资料以及企业外部资料进行联合分析以得到企业内部-外部协同交互特征向量;
以及企业风险等级确定模块,用于基于所述企业内部-外部协同交互特征向量,确定企业风险等级。
第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在计算机中执行时,令所述计算机执行所述的企业风险评级模型构建方法
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本申请实施例的企业风险评级模型构建方法的流程图。
图2为根据本申请实施例的企业风险评级模型构建方法的架构示意图。
图3为根据本申请实施例的企业风险评级模型构建方法中步骤120的子步骤的流程图。
图4为根据本申请实施例的企业风险评级模型构建系统的框图。
图5为根据本申请实施例的企业风险评级模型构建方法的场景示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
除非另有说明,本申请实施例所使用的所有技术和科学术语与本申请的技术领域的技术人员通常理解的含义相同。本申请中所使用的术语只是为了描述具体的实施例的目的,不是旨在限制本申请的范围。
在本申请实施例记载中,需要说明的是,除非另有说明和限定,术语“连接”应做广义理解,例如,可以是电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
需要说明的是,本申请实施例所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换,以使这里描述的本申请的实施例可以除了在这里图示或描述的那些以外的顺序实施。
应可以理解,风险评级是一种对企业、债券、投资组合等进行风险分析和评估的方法。旨在评估风险的程度,帮助投资者、债权人、监管机构等利益相关者了解实体的风险水平,并为他们提供决策依据。
风险评级通常基于定量和定性的分析,考虑多个因素来评估实体的风险状况。风险评级因素包括:
1.财务状况,财务指标是评估企业风险的重要依据。例如,负债比率、流动比率、盈利能力等指标可以反映企业的偿债能力和盈利能力。
2.经营能力,评估企业的经营能力可以包括市场份额、产品多样化程度、供应链管理等因素。这些因素可以反映企业在竞争环境中的稳定性和竞争力。
3.行业特征,不同行业的风险特征各不相同。行业的竞争程度、市场需求变化、技术创新等因素都会对企业的风险产生影响。
4.宏观经济环境,宏观经济因素如通货膨胀率、利率水平、政策变化等对企业的经营和偿债能力有重要影响。
5.法律和监管环境,法律和监管政策的变化可能对企业经营和风险产生重大影响。评估企业在法律和监管环境下的合规性和可持续性是重要的评级因素之一。
根据评级结果,企业可以被分为不同的风险等级,通常用字母或数字表示(如AAA、AA、A、B等)。不同的评级机构可能有不同的评级体系和标准,但一般来说,较高的评级表示较低的风险水平,而较低的评级表示较高的风险水平。
风险评级的目的是为利益相关者提供有关企业风险的信息,帮助他们做出明智的决策。对企业而言,风险评级还可以促使其改善管理水平,提高市场竞争力和社会信誉。
在本申请中,一种优化的企业风险评级模型构建方案,构建一个综合利用内外部数据的风险评级模型可以更全面地评估企业的风险水平,提供更准确、全面的风险评估结果。
传统的风险评级方法存在主观性和主观判断的问题,评级结果可能受到人为因素的影响。通过建立基于数据和模型的风险评级模型,可以减少主观性的干扰,提高评级的客观性和准确性。模型可以基于大量的历史数据进行训练和优化,从而更准确地预测企业的风险水平。
风险评级模型的构建可以为投资者、债权人、监管机构等利益相关者提供决策依据。评级结果可以帮助他们了解企业的风险状况,从而做出更明智的投资、贷款或监管决策。模型结果可以提供客观、可量化的指标,辅助利益相关者进行风险管理和决策制定。
风险评级模型的构建可以帮助企业了解自身的风险状况,并发现潜在的风险因素。企业可以根据评级结果进行风险管理和内部控制的改进,提高企业的管理水平和竞争力。评级模型可以帮助企业识别风险薄弱环节,及时采取措施加以改善,降低风险发生的可能性。
构建企业风险评级模型可以提供全面的风险评估,提高评级准确性,为利益相关者提供决策依据,并促进企业改善管理水平。这有助于提高风险管理的效果,减少风险带来的损失,并促进经济的稳定和可持续发展。
图1为根据本申请实施例的企业风险评级模型构建方法的流程图。图2为根据本申请实施例的企业风险评级模型构建方法的架构示意图。如图1和图2所示,所述企业风险评级模型构建方法,包括:110,获取企业内部资料以及企业外部资料;120,对所述企业内部资料以及企业外部资料进行联合分析以得到企业内部-外部协同交互特征向量;以及,130,基于所述企业内部-外部协同交互特征向量,确定企业风险等级。
其中,在所述步骤110中,内部资料的获取需要与企业内部合作,确保获得准确、完整的数据。可能需要与不同部门合作,如财务、市场、人力资源等,获取相关数据。外部资料的获取需要从可靠的数据源中获取信息,如行业报告、市场数据提供商、政府机构等。确保数据的来源可信度和数据的时效性。
其中,内部资料提供了企业自身的财务、经营等方面的信息,可以反映企业的内部状况和潜在风险。外部资料提供了行业、市场、宏观经济等方面的信息,可以帮助了解外部环境对企业的影响和潜在风险。
在所述步骤120中,在进行联合分析时,需要考虑内部和外部数据的匹配性和一致性,确保数据的可比性和有效性。选择合适的分析方法和模型,如统计分析、机器学习、数据挖掘等,对内部和外部数据进行整合和分析。
其中,联合分析可以揭示内部和外部数据之间的关联性和相互影响,帮助发现内外部因素之间的潜在关系和风险传导机制。协同交互特征向量可以综合反映企业内外部因素的综合影响,提供更全面、准确的风险评估依据。
在所述步骤130中,建立合适的评估模型或方法来基于协同交互特征向量确定企业风险等级,可以使用统计模型、机器学习模型、专家系统等方法。根据具体情况和需求,确定风险等级的划分标准和评估指标,以确保评估结果的可解释性和实用性。
其中,基于协同交互特征向量的风险评估可以综合考虑企业内外部因素的影响,提供更全面、准确的风险等级评估结果。风险等级的确定可以帮助企业和利益相关者了解企业的风险状况,制定相应的风险管理策略和决策。
通过获取企业内部和外部的多维度数据,并进行联合分析和基于协同交互特征向量的风险评估,可以提供更全面、准确的风险等级评估结果,为企业和利益相关者提供决策依据,降低风险带来的损失,促进企业的可持续发展。
具体地,在所述步骤110中,获取企业内部资料以及企业外部资料。基于此,在本申请的技术方案中,首先获取企业内部资料以及企业外部资料,其中,所述企业内部资料包括财务数据、经营数据、人力资源数据、管理层报告和内部审计报告,所述企业外部资料包括行业报告、市场研究报告、宏观经济数据、竞争对手信息、法律法规、政策文件、媒体报道和舆情分析报告。
其中,财务数据、经营数据、人力资源数据、管理层报告和内部审计报告可以提供关于企业财务状况、经营能力、人力资源管理等方面的信息。这些内部资料反映了企业自身的运营情况和内部管理水平,是评估企业风险的重要依据。而行业报告、市场研究报告、宏观经济数据、竞争对手信息、法律法规、政策文件、媒体报道和舆情分析报告提供了关于企业所处行业环境、市场竞争情况、宏观经济状况、法律法规政策等方面的信息。通过分析这些外部资料,可以了解企业所处的行业趋势、市场变化、法规政策的影响以及竞争对手的动态等,从而更好地评估企业的风险水平。
其中,所述企业内部资料可以提供企业自身的财务状况信息,包括资产负债表、利润表、现金流量表等,帮助评估企业的偿债能力、盈利能力和现金流状况。也可以提供企业的经营数据,如销售额、成本、利润率等,用于评估企业的经营风险和盈利能力。还可以提供供应链信息,包括供应商、物流、库存等,用于评估供应链风险和运营风险。
进一步地,所述企业外部资料可以提供行业数据,如行业增长率、市场份额、竞争对手情况等,用于评估企业所在行业的竞争风险和市场变化。也可以提供市场数据,如市场规模、市场需求、市场趋势等,用于评估企业产品或服务的市场风险和市场机会。还可以提供宏观经济指标,如国内生产总值、通货膨胀率、利率等,用于评估宏观经济环境对企业的影响和宏观风险。
综合利用企业内部资料和企业外部资料,可以全面了解企业的内外部状况和潜在风险因素。有助于评估企业的整体风险水平,并为制定相应的风险管理策略提供依据。同时,及时获取和分析这些资料可以帮助企业及早发现潜在风险,采取相应的措施进行风险防范和应对。
针对上述技术问题,本申请的技术构思是:综合利用企业内部以及外部的多维度数据源,来实现对企业的风险等级自动化评估。通过整合内部和外部数据源,可以获得更全面的信息来评估企业的风险。内部数据包括财务报表、经营数据、供应链信息等,而外部数据可以包括行业数据、宏观经济指标、市场竞争情况等。综合利用这些数据源可以提供更全面、多角度的风险评估,减少信息的遗漏和片面性,提高评估的准确性。
通过建立风险评级模型,可以利用历史数据进行训练和优化,从而提高风险预测的准确性,模型可以识别出与企业风险相关的关键特征和模式,通过学习历史数据的规律,预测未来的风险水平。有助于及早发现风险信号,提前采取相应的风险管理措施,降低潜在风险带来的影响。
传统的风险评估通常需要人工进行数据收集、整理和分析,工作量大且容易受到主观因素的影响。而利用自动化评估模型,可以实现对大量数据的快速处理和分析,节省时间和人力成本。同时,模型可以实时更新和调整,根据新的数据和情况进行风险评估,提高评估的时效性和灵活性。
通过自动化评估模型得出的风险等级结果可以为利益相关者提供决策支持。投资者、债权人、监管机构等可以根据评级结果来制定相应的投资、贷款或监管策略。同时,企业自身也可以根据评级结果来进行风险管理和战略规划,有针对性地改进业务和管理,提高企业的竞争力和可持续发展能力。
综合利用企业内部和外部的多维度数据源来实现对企业的风险等级自动化评估,可以提供更全面、准确的风险评估结果,提高评估效率,为决策者提供决策支持。这有助于降低风险带来的损失,增强企业的竞争力和可持续发展能力。
具体地,在所述步骤120中,对所述企业内部资料以及企业外部资料进行联合分析以得到企业内部-外部协同交互特征向量。图3为根据本申请实施例的企业风险评级模型构建方法中步骤120的子步骤的流程图,如图3所示,对所述企业内部资料以及企业外部资料进行联合分析以得到企业内部-外部协同交互特征向量,包括:121,分别提取所述企业内部资料和所述企业外部资料的语义信息以得到企业内部资料语义编码特征向量和企业外部资料语义编码特征向量;以及,122,提取所述企业内部资料语义编码特征向量和所述企业外部资料语义编码特征向量之间的特征交互信息以得到所述企业内部-外部协同交互特征向量。
首先,在进行语义信息提取时,可以使用自然语言处理(NLP)技术和文本特征提取方法。其中,对企业内部资料进行文本预处理,包括分词、去停用词、词干化等,以减少噪声和提取关键信息。进一步地,使用词袋模型、TF-IDF、Word2Vec等方法,将企业内部资料转化为语义编码特征向量。同样地,对企业外部资料进行文本预处理和语义编码特征向量提取。
这样,就可以得到企业内部资料语义编码特征向量和企业外部资料语义编码特征向量,分别反映了内部资料和外部资料的语义信息。
然后, 在得到企业内部资料语义编码特征向量和企业外部资料语义编码特征向量后,可以进行特征交互,以捕捉内部和外部资料之间的关联性和相互影响。其中,可以使用特征组合、特征乘积、特征差异等方式,对内部和外部特征向量进行交互操作,生成新的特征。进一步地,可以使用统计方法、机器学习方法、神经网络等进行特征交互的建模和训练,以学习内部-外部特征之间的复杂关系。最终得到的企业内部-外部协同交互特征向量反映了内部和外部因素之间的相互作用和影响。
通过提取企业内部资料和企业外部资料的语义信息,并进行特征交互,可以获得更丰富、更准确的企业内部-外部协同交互特征向量。这有助于综合考虑内部和外部因素的影响,提供更全面、准确的风险评估依据。同时,协同交互特征向量还可以帮助发现内外部因素之间的潜在关系和风险传导机制,进一步提升风险评估的效果和预测能力。
对于所述步骤121,包括:对所述企业内部资料进行数据预处理并通过包含词嵌入层的第一语义编码器以得到所述企业内部资料语义编码特征向量;以及,对所述企业外部资料进行数据预处理并通过包含词嵌入层的第二语义编码器以得到所述企业外部资料语义编码特征向量。
应可以理解,在进行数据预处理时,可以包括步骤:首先,进行文本清洗,去除特殊字符、标点符号等噪声数据。然后,进行分词处理,将文本划分为词语的序列。接着去停用词,去除常见的无实际含义的词语,如“的”,“和”,“是”等。最后,进行词干化或词形还原,将词语还原为其原始形式,以减少词形的变化对语义的影响。
通过数据预处理,可以减少噪声数据的影响,提取出关键信息,为后续的语义编码提供更准确、干净的数据。
语义编码器是一种模型或算法,用于将文本数据转换为语义编码特征向量。其中,词嵌入层是用于将词语映射为连续向量表示的技术,通过将词语嵌入到连续向量空间中,词嵌入层可以捕捉词语之间的语义关系和相似性。
在语义编码器中,可以使用深度学习模型,如循环神经网络(RNN)、长短时记忆网络(LSTM)、Transformer等,将经过预处理的文本数据输入模型进行编码。模型的输出即为企业内部资料语义编码特征向量和企业外部资料语义编码特征向量。
通过使用包含词嵌入层的语义编码器,可以将文本数据转化为连续的语义编码特征向量。这样捕捉了词语之间的语义关系和相似性,提供了更丰富的语义信息;具备了连续性的特点,有助于模型更好地理解文本数据;可以作为后续模型的输入,用于进一步的特征交互、建模和预测。
通过数据预处理和包含词嵌入层的语义编码器,可以得到企业内部资料和企业外部资料的语义编码特征向量,为后续的风险评估和决策提供有益的效果。
接着,分别提取所述企业内部资料和所述企业外部资料的语义信息以得到企业内部资料语义编码特征向量和企业外部资料语义编码特征向量。在本申请的一个具体示例中,分别提取所述企业内部资料和所述企业外部资料的语义信息以得到企业内部资料语义编码特征向量和企业外部资料语义编码特征向量的编码过程,包括:对所述企业内部资料进行数据预处理并通过包含词嵌入层的第一语义编码器以得到企业内部资料语义编码特征向量;同时,对所述企业外部资料进行数据预处理并通过包含词嵌入层的第二语义编码器以得到企业外部资料语义编码特征向量。也就是,通过数据预处理的手段将所述企业内部资料和所述企业外部资料中的文本信息转化为便于计算机读取和分析的数据结构形式;再利用包含词嵌入层的语义编码器对其进行语义编码与理解,以捕捉蕴含在所述企业内部资料和所述企业外部资料中的重要语义信息。
对于所述步骤122,包括:使用特征间注意力层来进行所述企业内部资料语义编码特征向量和所述企业外部资料语义编码特征向量之间的特征交互以得到所述企业内部-外部协同交互特征向量。
特征间注意力层可以用于对不同特征之间的相关性进行建模和权重分配,从而增强它们之间的交互作用。特征间注意力层可以识别和强调企业内部资料和企业外部资料之间的相关特征,通过计算注意力权重,可以确定哪些内部特征与外部特征在语义上更相关,从而提高这些相关特征的权重,使其对最终特征向量的生成贡献更大。
特征间注意力层可以捕捉到更复杂的特征关系。企业内部资料和企业外部资料可能具有不同的特征表示和语义含义,通过特征间注意力层,可以对它们之间的关系进行建模,包括线性和非线性关系,从而更全面地捕捉到它们之间的交互信息。
通过引入特征间注意力层,可以增强企业内部资料和企业外部资料之间的协同作用,将它们的语义信息相互融合。这样可以提供更丰富、更准确的特征表示,有助于提高模型的预测性能和泛化能力。
特征间注意力层可以根据具体任务和数据动态地学习特征之间的权重。这意味着注意力权重可以根据输入数据的特点进行自适应调整,使得模型能够更好地适应不同的情况和变化。
使用特征间注意力层来进行企业内部资料语义编码特征向量和企业外部资料语义编码特征向量之间的特征交互可以提供一些有益的效果,包括强化相关特征、捕捉复杂关系、提高预测性能和自适应特征权重。这有助于更好地利用企业内外数据的语义信息,提高模型的表达能力和性能。
然后,提取所述企业内部资料语义编码特征向量和所述企业外部资料语义编码特征向量之间的特征交互信息以得到所述企业内部-外部协同交互特征向量。在本申请的一个具体示例中,提取所述企业内部资料语义编码特征向量和所述企业外部资料语义编码特征向量之间的特征交互信息以得到所述企业内部-外部协同交互特征向量的编码过程,包括:使用特征间注意力层来进行所述企业内部资料语义编码特征向量和所述企业外部资料语义编码特征向量之间的特征交互以得到企业内部-外部协同交互特征向量。
应可以理解,传统的注意力机制的目标在于学习一个注意力权重矩阵,应用于当前层的各个神经节点,对于那些重要的节点,赋予它们较大的权重,对于那些次要的节点,赋予它们较小的权重。由于每个神经节点都包含着某种特征信息,经过上述操作,神经网络能从众多特征信息中选择出对当前任务目标更关键的信息。而所述特征间注意力层与传统的注意力机制不同的是,其能够更多地关注各个特征信息间的依赖关系。
应可以理解,特征间注意力层是一种用于建模特征之间相关性的机制,常用于深度学习模型中,可以通过计算注意力权重来控制不同特征之间的交互程度,从而加强或减弱它们之间的关联。
具体地,首先,将输入的特征向量表示为矩阵形式,其中每一行代表一个特征向量。这些特征向量可以是不同来源的语义编码特征向量,如企业内部资料和企业外部资料的语义编码特征向量。接着,通过计算特征之间的相似度来衡量它们的相关性。常用的相似度度量方法包括余弦相似度、内积等。然后,利用相似度计算的结果,可以计算每个特征与其他特征之间的注意力权重,注意力权重表示了不同特征之间的关注程度或重要性。一种常见的计算方法是使用softmax函数对相似度进行归一化,以确保权重之和为1。最后,根据注意力权重,可以对特征进行加权组合,以实现特征之间的交互。一种常见的方法是将注意力权重应用于特征矩阵的行或列,从而得到加权的特征表示。
通过特征间注意力层,不同特征之间的相关性可以得到更好的建模和利用,可以帮助模型更好地捕捉特征之间的复杂关系,提高模型的表达能力和性能。在企业内部资料和企业外部资料的语义编码特征向量之间进行特征交互时,特征间注意力层可以帮助模型更好地理解和利用两者之间的关联,从而提升企业内部-外部协同交互特征向量的质量和效果。
具体地,在所述步骤130中,基于所述企业内部-外部协同交互特征向量,确定企业风险等级,包括:对所述企业内部-外部协同交互特征向量的各个特征值进行优化以得到优化企业内部-外部协同交互特征向量;以及,将所述优化企业内部-外部协同交互特征向量通过分类器以得到分类结果,所述分类结果用于表示企业风险等级标签。
在本申请的技术方案中,考虑到使用特征间注意力层来进行所述企业内部资料语义编码特征向量和所述企业外部资料语义编码特征向量之间的特征交互聚焦于提取所述企业内部资料语义编码特征向量和所述企业外部资料语义编码特征向量之间的依赖关系,同时也对于所述企业内部资料语义编码特征向量和所述企业外部资料语义编码特征向量的所述企业内部资料和所述企业外部资料的文本语义特征进行表达,因此,所述企业内部-外部协同交互特征向量的特征表达会具有多样化的特征分布表达。
这样,在所述企业内部-外部协同交互特征向量通过分类器进行分类,以基于作为特征回归过程的特征空间到概率分布空间的空间域映射来获得与标签对应的概率分布,从而获得所述分类结果时,考虑到所述企业内部-外部协同交互特征向量的多样化的局部特征分布表达会在所述企业内部-外部协同交互特征向量中产生特征分布表示稀疏化,从而导致将所述企业内部-外部协同交互特征向量通过分类器进行类概率回归映射时,所述企业内部-外部协同交互特征向量的各个特征值的回归概率的概率密度分布的收敛性差,影响通过分类器得到的分类结果的准确性。因此,优选地,对所述企业内部-外部协同交互特征向量的各个特征值进行优化。
在本申请的一个实施例中,对所述企业内部-外部协同交互特征向量的各个特征值进行优化以得到优化企业内部-外部协同交互特征向量,包括:以如下优化公式对所述企业内部-外部协同交互特征向量的各个特征值进行优化以得到所述优化企业内部-外部协同交互特征向量;其中,所述优化公式为:
其中,是所述企业内部-外部协同交互特征向量,/>和/>是所述企业内部-外部协同交互特征向量的第/>和第/>个特征值,且/>是所述企业内部-外部协同交互特征向量的全局特征均值,/>是所述优化企业内部-外部协同交互特征向量的第/>个特征值。
具体地,针对所述企业内部-外部协同交互特征向量在高维特征空间内的稀疏分布导致的概率空间内概率密度分布的局部概率密度不匹配,通过正则化全局自洽类编码,来模仿所述企业内部-外部协同交互特征向量的高维特征流形在概率空间内的编码行为的全局自洽关系,以调整在高维开放空间域内的特征流形的误差景观,实现所述企业内部-外部协同交互特征向量的高维特征流形对显式概率空间嵌入的自洽匹配式类编码,从而提升所述企业内部-外部协同交互特征向量的回归概率的概率密度分布的收敛性,改进其通过分类器得到的分类结果的准确性。
进一步地,将所述企业内部-外部协同交互特征向量通过分类器以得到分类结果,所述分类结果用于表示企业风险等级标签。
综上,基于本申请实施例的企业风险评级模型构建方法100被阐明,其综合利用企业内部以及外部的多维度数据源,来实现对企业的风险等级自动化评估。
在本申请的一个实施例中,图4为根据本申请实施例的企业风险评级模型构建系统的框图。如图4所示,根据本申请实施例的企业风险评级模型构建系统200,包括:资料获取模块210,用于获取企业内部资料以及企业外部资料;联合分析模块220,用于对所述企业内部资料以及企业外部资料进行联合分析以得到企业内部-外部协同交互特征向量;以及,企业风险等级确定模块230,用于基于所述企业内部-外部协同交互特征向量,确定企业风险等级。
这里,本领域技术人员可以理解,上述企业风险评级模型构建系统中的各个单元和模块的具体功能和操作已经在上面参考图1到图3的企业风险评级模型构建方法的描述中得到了详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的企业风险评级模型构建系统200可以实现在各种终端设备中,例如用于企业风险评级模型构建的服务器等。在一个示例中,根据本申请实施例的企业风险评级模型构建系统200可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该企业风险评级模型构建系统200可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该企业风险评级模型构建系统200同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该企业风险评级模型构建系统200与该终端设备也可以是分立的设备,并且企业风险评级模型构建系统200可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
图5为根据本申请实施例的企业风险评级模型构建方法的场景示意图。如图5所示,在该应用场景中,首先,获取企业内部资料(例如,如图5中所示意的C1)以及企业外部资料(例如,如图5中所示意的C2);然后,将获取的企业内部资料以及企业外部资料输入至部署有企业风险评级模型构建算法的服务器(例如,如图5中所示意的S)中,其中所述服务器能够基于企业风险评级模型构建算法对所述企业内部资料以及所述企业外部资料进行处理,以确定企业风险等级。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (8)
1.一种企业风险评级模型构建方法,其特征在于,包括:
获取企业内部资料以及企业外部资料;
对所述企业内部资料以及企业外部资料进行联合分析以得到企业内部-外部协同交互特征向量,其包括:
分别提取所述企业内部资料和所述企业外部资料的语义信息以得到企业内部资料语义编码特征向量和企业外部资料语义编码特征向量;
以及提取所述企业内部资料语义编码特征向量和所述企业外部资料语义编码特征向量之间的特征交互信息以得到所述企业内部-外部协同交互特征向量;
基于所述企业内部-外部协同交互特征向量,确定企业风险等级。
2.根据权利要求1所述的企业风险评级模型构建方法,其特征在于,所述企业内部资料包括财务数据、经营数据、人力资源数据、管理层报告和内部审计报告,所述企业外部资料包括行业报告、市场研究报告、宏观经济数据、竞争对手信息、法律法规、政策文件、媒体报道和舆情分析报告。
3.根据权利要求2所述的企业风险评级模型构建方法,其特征在于,分别提取所述企业内部资料和所述企业外部资料的语义信息以得到企业内部资料语义编码特征向量和企业外部资料语义编码特征向量,包括:
对所述企业内部资料进行数据预处理并通过包含词嵌入层的第一语义编码器以得到所述企业内部资料语义编码特征向量;
以及对所述企业外部资料进行数据预处理并通过包含词嵌入层的第二语义编码器以得到所述企业外部资料语义编码特征向量。
4.根据权利要求3所述的企业风险评级模型构建方法,其特征在于,提取所述企业内部资料语义编码特征向量和所述企业外部资料语义编码特征向量之间的特征交互信息以得到所述企业内部-外部协同交互特征向量,包括:
使用特征间注意力层来进行所述企业内部资料语义编码特征向量和所述企业外部资料语义编码特征向量之间的特征交互以得到所述企业内部-外部协同交互特征向量。
5.根据权利要求4所述的企业风险评级模型构建方法,其特征在于,基于所述企业内部-外部协同交互特征向量,确定企业风险等级,包括:
对所述企业内部-外部协同交互特征向量的各个特征值进行优化以得到优化企业内部-外部协同交互特征向量;
以及将所述优化企业内部-外部协同交互特征向量通过分类器以得到分类结果,所述分类结果用于表示企业风险等级标签。
6.根据权利要求5所述的企业风险评级模型构建方法,其特征在于,对所述企业内部-外部协同交互特征向量的各个特征值进行优化以得到优化企业内部-外部协同交互特征向量,包括:以如下优化公式对所述企业内部-外部协同交互特征向量的各个特征值进行优化以得到所述优化企业内部-外部协同交互特征向量;
其中,所述优化公式为:
;
其中,是所述企业内部-外部协同交互特征向量,/>和/>是所述企业内部-外部协同交互特征向量的第/>和第/>个特征值,且/>是所述企业内部-外部协同交互特征向量的全局特征均值,/>是所述优化企业内部-外部协同交互特征向量的第/>个特征值。
7.一种企业风险评级模型构建系统,其特征在于,包括:
资料获取模块,用于获取企业内部资料以及企业外部资料;
联合分析模块,用于对所述企业内部资料以及企业外部资料进行联合分析以得到企业内部-外部协同交互特征向量;
以及企业风险等级确定模块,用于基于所述企业内部-外部协同交互特征向量,确定企业风险等级。
8.一种计算机可读存储介质,其特征在于,其上存储有计算机程序指令,所述计算机程序指令在计算机中执行时,令所述计算机执行权利要求1-7中任一项的所述的企业风险评级模型构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311603997.5A CN117422311A (zh) | 2023-11-28 | 2023-11-28 | 企业风险评级模型构建方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311603997.5A CN117422311A (zh) | 2023-11-28 | 2023-11-28 | 企业风险评级模型构建方法、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117422311A true CN117422311A (zh) | 2024-01-19 |
Family
ID=89525037
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311603997.5A Withdrawn CN117422311A (zh) | 2023-11-28 | 2023-11-28 | 企业风险评级模型构建方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117422311A (zh) |
-
2023
- 2023-11-28 CN CN202311603997.5A patent/CN117422311A/zh not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Verbraken et al. | Development and application of consumer credit scoring models using profit-based classification measures | |
CN110866819A (zh) | 一种基于元学习的自动化信贷评分卡生成方法 | |
Bateni et al. | Bankruptcy prediction using logit and genetic algorithm models: A comparative analysis | |
CN106067094A (zh) | 一种动态评估方法及系统 | |
Claveria et al. | Evolutionary computation for macroeconomic forecasting | |
Korol | Fuzzy logic in financial management | |
Liang et al. | A stock time series forecasting approach incorporating candlestick patterns and sequence similarity | |
CN116861924A (zh) | 基于人工智能的项目风险预警方法及系统 | |
Xu et al. | Novel key indicators selection method of financial fraud prediction model based on machine learning hybrid mode | |
Kumar et al. | Stock Price Prediction Using Machine Learning | |
Al-Qaheri et al. | Discovering stock price prediction rules using rough sets | |
Feng et al. | Optimization and analysis of intelligent accounting information system based on deep learning model | |
Kipkogei et al. | Business success prediction in Rwanda: a comparison of tree-based models and logistic regression classifiers | |
CN115409127A (zh) | 一种合同违约风险预测模型的训练方法和相关装置 | |
KR102499182B1 (ko) | 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템 | |
Raman et al. | Multigraph attention network for analyzing company relations | |
Hou | Financial Abnormal Data Detection System Based on Reinforcement Learning | |
CN117422311A (zh) | 企业风险评级模型构建方法、系统及存储介质 | |
Qiang et al. | [Retracted] Relationship Model between Human Resource Management Activities and Performance Based on LMBP Algorithm | |
Ayyappa et al. | Forecasting Equity Prices using LSTM and BERT with Sentiment Analysis | |
Xu | An Intelligent Classification Method of Multisource Enterprise Financial Data Based on SAS Model | |
CN116542380B (zh) | 基于自然语言的电厂供应链碳足迹优化方法及装置 | |
CN117455059A (zh) | 一种基于数据采集的行业趋势评估系统 | |
Zhang et al. | Enterprise event risk detection based on supply chain contagion | |
CN117973846A (zh) | 基于产业链的企业风险预测方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20240119 |