CN113688287A - 一种企业风险传染路径分析方法、装置、设备及存储介质 - Google Patents
一种企业风险传染路径分析方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113688287A CN113688287A CN202110976821.9A CN202110976821A CN113688287A CN 113688287 A CN113688287 A CN 113688287A CN 202110976821 A CN202110976821 A CN 202110976821A CN 113688287 A CN113688287 A CN 113688287A
- Authority
- CN
- China
- Prior art keywords
- risk
- nodes
- infection
- node
- enterprise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000015181 infectious disease Diseases 0.000 title claims abstract description 134
- 238000004458 analytical method Methods 0.000 title claims description 19
- 239000013598 vector Substances 0.000 claims abstract description 60
- 238000000034 method Methods 0.000 claims abstract description 42
- 238000004364 calculation method Methods 0.000 claims description 39
- 238000004422 calculation algorithm Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 12
- 238000005295 random walk Methods 0.000 claims description 10
- 238000000354 decomposition reaction Methods 0.000 claims description 9
- 238000000342 Monte Carlo simulation Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000037361 pathway Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 206010037180 Psychiatric symptoms Diseases 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003068 pathway analysis Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种企业风险传染路径分析方法、装置、设备及存储介质,通过根据企业数据建立企业图谱,并对节点间的各种关系进行权重计算,确定各节点间的关联权重。同时根据风险源节点的特征向量,明确候选风险源的选取范围,并根据特征向量之间的关系距离明确疑似风险源节点,将之和风险源节点作为风险传染的风险起点。在得到风险起点之后,需要对与风险源节点和疑似风险源节点关联的K层各节点的风险传染强度、风险传染深度进行具体分析,并明确企业风险传染的路径,从而能够对企业风险采取实时的分析和预警,具有客观性和准确性,提高了政府、银行等相关部门对企业风险的管理能力和效率。
Description
技术领域
本发明涉及信息技术领域,尤其涉及一种企业风险传染路径分析方法、装置、设备及存储介质。
背景技术
企业图谱是一种关于企业、投资人以及投资、任职关系的复杂网络。将企业、投资人抽象为一副图中的节点,节点之间的投资、被投资与任职关系抽象为节点之间的边,这些节点和边共同组成的复杂网络即为企业图谱。近年来企业知识图谱在企业数据分析领域已经得到了广泛的应用,然而更多的聚焦于企业知识图谱的构建以及企业族群的识别方面,针对企业触发风险时的传染路径识别问题则相对较少。
随着近年来企业信用风险、暴雷风险频发,能够对暴雷的企业的风险传播强度和风险传播路径进行第一时间的分析和预警是当前的重要课题。现有的相关专利并没有对疑似风险源企业进行识别亦或是对潜在风险源企业进行了识别,但是在疑似风险源集与风险源集合的临界值与关联系数计算上较为简单。此外,在企业风险传染过程中风险值的加权衰减过程中,节点关联权重由专家根据先验经验人为设定,极易出现判断思维的不一致性,从而影响了潜在风险企业识别和风险传染路径的客观准确性。
发明内容
基于此,有必要针对上述技术问题,提供一种企业风险传染路径分析方法、装置、设备及存储介质。
一种企业风险传染路径分析方法,所述方法包括:根据接收的企业数据建立企业图谱,所述企业图谱中包括节点和节点之间的关系,所述节点具体为企业和个人;通过预设的关系加权算法,对所述企业图谱各节点间的关系进行加权处理,得到携带节点间关联权重的目标企业图谱;根据所述企业数据,量化各节点的基本信息,并构建各节点的特征向量;定义已发生风险的节点为风险源节点,根据所有的风险源节点构成风险源集合,并根据各风险源节点的特征向量构成风险特征集;根据所述风险源集合和所述风险特征集,构建候选风险源集合,并根据所述候选风险源集合确定疑似风险源节点;将所述风险源节点和疑似风险源节点为风险起点,基于所述目标企业图谱,采用蒙特卡罗模拟各节点的风险传染路径,并计算个节点的风险值;定义风险值大于预设值的节点为目标节点,根据所述风险起点和所述目标节点,分析各节点的风险传染路径。
在其中一个实施例中,所述根据所述风险源集合和所述风险特征集,构建候选风险源集合,并根据所述候选风险源集合确定疑似风险源节点,具体为:分析所述风险源集合和所述风险特征集,得到各特征向量维度的标准差;根据各特征向量维度的标准差,构建候选风险源集合,候选风险源集合中包括多个节点;计算所述多个节点与风险源节点的相似度,当相似度符合预设范围时,对应的节点为疑似风险源节点。
在其中一个实施例中,所述计算所述多个节点与风险源节点的相似度,当相似度符合预设范围时,对应的节点为疑似风险源节点,具体为:通过向量夹角余弦距离算法计算候选风险源企业的特征向量与风险源企业特征向量之间的向量距离;将向量距离符合预设范围的企业定义为疑似风险源企业。
在其中一个实施例中,将所述风险源节点和疑似风险源节点为风险起点,基于所述目标企业图谱,采用蒙特卡罗模拟各节点的风险传染路径,并计算个节点的风险值,具体为:定义所述风险源节点和疑似风险源节点为风险起点;根据所述节点间关联权重,计算各节点的风险传染强度值;采用K-核分解法计算所述风险起点的风险传染深度;基于所述风险传染强度值和所述风险传染深度,采用蒙特卡洛模拟法模拟所述风险起点的K层风险传染,得到K层风险传染中各节点的风险传染路径;采用随机漫步算法统计所述K层风险传导路径中各节点的风险传染路径,得到对应节点的风险值。
一种企业风险传染路径分析装置,包括图谱构建模块、关系加权模块、特征向量构建模块、风险特征集模块、疑似风险源模块、风险值计算模块和传染路径分析模块,其中:所述图谱构建模块用于,根据接收的企业数据建立企业图谱,所述企业图谱中包括节点和节点之间的关系,所述节点具体为企业和个人;所述关系加权模块用于,通过预设的关系加权算法,对所述企业图谱各节点间的关系进行加权处理,得到携带节点间关联权重的目标企业图谱;所述特征向量构建模块用于,根据所述企业数据,量化各节点的基本信息,并构建各节点的特征向量;所述风险特征集模块用于,定义已发生风险的节点为风险源节点,根据所有的风险源节点构成风险源集合,并根据各风险源节点的特征向量构成风险特征集;所述疑似风险源模块用于,根据所述风险源集合和所述风险特征集,构建候选风险源集合,并根据所述候选风险源集合确定疑似风险源节点;所述风险值计算模块用于,将所述风险源节点和疑似风险源节点为风险起点,基于所述目标企业图谱,采用蒙特卡罗模拟各节点的风险传染路径,并计算个节点的风险值;所述传染路径分析模块用于,定义风险值大于预设值的节点为目标节点,根据所述风险起点和所述目标节点,分析各节点的风险传染路径。
在其中一个实施例中,所述疑似风险源模块包括标准差计算单元、候选风险源集合构建单元和相似度计算单元,其中:所述标准差计算单元用于,分析所述风险源集合和所述风险特征集,得到各特征向量维度的标准差;所述候选风险源集合构建单元用于,根据各特征向量维度的标准差,构建候选风险源集合,候选风险源集合中包括多个节点;所述相似度计算单元用于,计算所述多个节点与风险源节点的相似度,当相似度符合预设范围时,对应的节点为疑似风险源节点。
在其中一个实施例中,所述风险值计算模块包括风险起点单元、传染强度值计算单元、传染深度计算单元、传染路径获取单元和风险值计算单元:所述风险起点单元用于,定义所述风险源节点和疑似风险源节点为风险起点;所述传染强度值计算单元用于,根据所述节点间关联权重,计算各节点的风险传染强度值;所述传染深度计算单元用于,采用K-核分解法计算所述风险起点的风险传染深度;所述传染路径获取单元用于,基于所述风险传染强度值和所述风险传染深度,采用蒙特卡洛模拟法模拟所述风险起点的K层风险传染,得到K层风险传染中各节点的风险传染路径;所述风险值计算单元用于,采用随机漫步算法统计所述K层风险传导路径中各节点的风险传染路径,得到对应节点的风险值。
一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述各个实施例中所述的一种企业风险传染路径分析方法的步骤。
一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述各个实施例中所述的一种企业风险传染路径分析方法的步骤。
上述一种企业风险传染路径分析方法、装置、设备及存储介质,通过根据企业数据建立企业图谱,并对节点间的各种关系进行权重计算,确定各节点间的关联权重。同时根据风险源节点的特征向量,明确候选风险源的选取范围,并根据特征向量之间的关系距离明确疑似风险源节点,将之和风险源节点作为风险传染的风险起点。在得到风险起点之后,需要对与风险源节点和疑似风险源节点关联的K层各节点的风险传染强度、风险传染深度进行具体分析,并明确企业风险传染的路径,从而能够对企业风险采取实时的分析和预警,具有客观性和准确性,提高了政府、银行等相关部门对企业风险的管理能力和效率。
附图说明
图1为一个实施例中一种企业风险传染路径分析方法的应用场景图;
图2为一个实施例中一种企业风险传染路径分析方法的流程示意图;
图3为一个实施例中一种企业风险传染路径分析装置的结构框图;
图4为一个实施例中风险特征集模块的结构框图;
图5为一个实施例中风险值计算模块的结构框图;
图6是一个实施例中设备的内部结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本发明做进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请提供的一种企业风险传染分析方法,可以应用于如图1所示的应用环境中。其中,终端1则是本方法所实施的场所,终端1可以服务器2进行网络交互,其中,终端1接收来自服务器2的企业数据,最终得到的目标企业的目标风险程度,是可以通过网络传输至服务器2中,同样的,本方案实施场所也可以是通过服务器的形式,这里只是一种场景,并不限于本场景。其中,终端1可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器2可以用独立的服务器或者是多个服务器组成的服务器集群来实现。首先,通过SDK可以实时采集用户的各项数据,比如手机设备号、数据网络、地理位置等信息。另外,通过抓取用户通信运营商的数据可以获取用户的通信记录等。这些信息数据则通过服务器2发送至终端1中。有了这些数据,就可以通过其中的关联关系建立巨大的复杂网络,即为企业图谱,比如有一些账号的手机设备手机号是相同的,或者使用同一个WIFI,或者同一个基站,或者手机号码之间有通信记录等等。建立网络之后,就可以对这张网络进行深度分析与挖掘。
风险源:风险源可以是自然人或者企业实体。当金融交易资金链断裂或者遇到严重的商业纠纷时,该企业成为风险源,并在金融交易图谱中的该节点明确为风险传染路径起点。
风险载体:风险不可能在真空中传导,必须要有一定的介质。在本模型中,当涉及到企业间的风险传染时风险载体扩展至地区、行业和上下游关系等。
在一个实施例中,如图2所示,提供了一种企业风险传染路径分析方法,包括以下步骤:
S110根据接收的企业数据建立企业图谱,企业图谱中包括节点和节点之间的关系,节点具体为企业和个人。
具体地,将企业相关数据输入到一张图中,其中自然人和企业成为企业图谱中的各个节点,自然人与企业间存在的关系包括交易、法人、股东、实控、投资、任职和担保关系形成图谱各节点的多条边,其中法人、股东、实控、投资和任职关系为自然人与企业间的单向关系。其余的两条边交易和担保,都是多边关系,也即自然人与企业之间可能发生多次交易关系和担保关系,而且每条边分别具有多个属性,比如交易金额和发生时间等。
S120通过预设的关系加权算法,对企业图谱各节点间的关系进行加权处理,得到携带节点间关联权重的目标企业图谱。
具体地,采用简单加权和分位点加权的方式来合并边:首先是简单加权的方法,在原本的边有八大关系中有法人、实控、任职、子公司这四类简单的关系,可以直接根据边是否存在进行简单加权,合并成一个无向的边,进而形成企业图谱的整张图;在边权重拟合过程中,如果需要保留边属性中更多的信息,可以采用分位点加权的方式。比如采用分位点对交易做区分,对主体A和其他主体的交易总额进行排序,如果主体A和主体B的交易金额在20名以内,那么权重是20名以外的两倍。股东和投资关系也可以采用类似的方式,比如当某主体A对主体B的投资金额占到公司市值的30%以上,或者持有股份占到30%以上时,设置关联权重是占用比率在30%以下情况的2倍。
具体的处理方法如下:
Weight=Ei+W股东+W投资+W交易
经此处理后,自然人和企业以及企业和企业间均存在一条无向边,并且该边携带两者关联权重属性。
S130根据企业数据,量化各节点的基本信息,并构建各节点的特征向量。
具体地,企业节点具有经营范围、所属行业、企业地址、注册资本、专利数量、失信情况以及法律诉讼情况等方面信息,将上述维度进行量化,形成属于企业节点的特征向量。自然人节点具有性别、年龄等属性,将上述属性进行量化,形成属于自然人节点的特征向量。
S140定义已发生风险的节点为风险源节点,根据所有的风险源节点构成风险源集合,并根据各风险源节点的特征向量构成风险特征集。
具体地,首先明确具体风险源企业,由于全量企业数据过于庞大,同时,鉴于准确定和效率性目标,采用相应算法将识别范围相应缩小,首先需要根据风险源企业特征计算候选疑似风险源企业集,以便于后续高效运算。
S150根据风险源集合和风险特征集,构建候选风险源集合,并根据候选风险源集合确定疑似风险源节点。
在一个实施例中,步骤S150具体为:分析风险源集合和风险特征集,得到各特征向量维度的标准差;根据各特征向量维度的标准差,构建候选风险源集合,候选风险源集合中包括多个节点;计算多个节点与风险源节点的相似度,当相似度符合预设范围时,对应的节点为疑似风险源节点。具体地,计算风险源企业所形成的风险矩阵各列的标准差σ,根据标准差计算风险源企业对应的特征向量的上下界,具体算法如下:
Step1:对任意的A属于风险源集合R,查询风险源企业A关于特征集U的特征向量TA=(α1,α2,…,αm),特征集U即为风险特征集。
Step2:计算风险源企业(或节点)所形成特征集U每个维度的标准差Tσ=(σ1,σ2,…,σm)。
Step3:对特征向量TA=(α1,α2,…,αm)的数值型特征进行如下计算:
求解关于x的不等式
从而得到关于特征向量第i维的上下界yi1和yi2
Step4:输出特征向量TA的上下界:
T1=(y11,y21,…,ym1)和T2=(y12,y22,…,ym2)
Step5:将T1和T2作为搜索条件,将符合条件的企业定义为候选疑似风险源企业集。
在一个实施例中,计算多个节点与风险源节点的相似度,当相似度符合预设范围时,对应的节点为疑似风险源节点,具体为:通过向量夹角余弦距离算法计算候选风险源企业的特征向量与风险源企业特征向量之间的向量距离;将向量距离符合预设范围的企业定义为疑似风险源企业。具体地,在明确候选疑似风险源企业集后,需要计算候选企业集里与风险源企业联系最紧密的企业定义为疑似风险源企业,其算法如下:
Step1:获取风险源企业特征向量TA=(α1,α2,…,αm),对于任意企业B,计算其特征向量与风险源企业特征向量之间的相似度COSθ。
Step2:对计算的企业之间相似度进行归一化处理。
sim=0.5+0.5cosθ
Step3:设定相似度阈值为λ,将sim<λ的企业认定为疑似风险源企业。
Step4:遍历候选集合中所有企业与风险源企业之间的相似度,并输出疑似风险源企业集合。
S160将风险源节点和疑似风险源节点为风险起点,基于目标企业图谱,采用蒙特卡罗模拟各节点的风险传染路径,并计算个节点的风险值。
具体地,在衡量企业图谱中与风险源企业和疑似风险源企业相邻各节点的风险传染性时,首先要考虑单个企业对其他企业的直接传染性。当单个企业成为风险源企业时,产生的风险会通过企业图谱网络传染给其他企业或者自然人。
在一个实施例中,步骤S160具体为:定义风险源节点和疑似风险源节点为风险起点;根据节点间关联权重,计算各节点的风险传染强度值;采用K-核分解法计算风险起点的风险传染深度;基于风险传染强度值和风险传染深度,采用蒙特卡洛模拟法模拟风险起点的K层风险传染,得到K层风险传染中各节点的风险传染路径;采用随机漫步算法统计K层风险传导路径中各节点的风险传染路径,得到对应节点的风险值。具体地,节点强度值指标用于衡量企业图谱中单个节点受到冲击后,一轮传染可以影响的节点数量和强度,采用企业图谱中各节点的强度值指标d(vi)来衡量,其中:
企业图谱网络中某个企业的强度值越大,说明该企业在图谱中的风险传染性越强。当发生外生冲击时,该企业会在较短时间内将风险传染给其他企业。
在传染强度计算完成之后,需要以风险源节点与疑似风险源节点进行K层展开,确定最大影响范围,本发明的无向K层展开算法实现是在Nebula Graph图数据库进行的,展开算法采用K-核分解法,该模块可以分析当单个节点受到冲击后,可以影响的最远节点的距离。K-核分解法是去除外围最不重要的节点,得到具有最高影响力和传染性的内层节点时所剥离的层数。所剥离的层数越多,节点传染性越强,传染的路径越远。K-核分解法的具体步骤如下:
Step1:根据计算出的节点i的强度值,找到强度值d(vi)等于1的所有节点,将该节点以及与该节点相连接的所有边移除,从而形成新的风险传染网络。重复执行上述操作,直到网络中所有节点的强度值均大于1。以上过程中,所有被移除的节点均处于Ks=1层(又称为1核)。
Step 2:对经过Step 1处理后得到的次外层结构,使用相同的方法逐次移除出剩余强度值等于2的节点,该轮所有被移除的节点均处于Ks=2层(又称为2核)。
Step 3:重复上述Step1-2,得到处于Ks=3、Ks=4、...、Ks=n层的节点。ks值越大的节点在受到风险源的冲击时时,经过多轮风险传染后,影响的范围将更大,风险传染性也更强,传染路径也更远。
在K层展开完成后,输出K层分解后的展开子图,采用蒙特卡洛模拟法(Monte-Carlo)模拟从Ks=1至Ks=n的随机游走路径,假设一个风险源S和一个终点D,如果从S出发在图上随机游走,随着游走次数趋向无限,落在D点的概率会趋向一个固定值,这个值反映了在图中S点和D点的关系以及整个图的结构。
采用Monte-Carlo方法,对每个风险源和疑似风险源节点的K层分解子图模拟十万的随机游走路径,当路径的数量相对于图的规模达到一定的“代表性”时,可以对随机游走做一个频率统计。从KS=1出发的风险点的路径/从S出发的所有路径数量,这个比值就是点S的风险值。
S170定义风险值大于预设值的节点为目标节点,根据风险起点和目标节点,分析各节点的风险传染路径。
具体地,通过风险起点和目标节点确定风险传染路径,实现对各节点的风险传染路径进行分析。
上述实施例中,通过根据企业数据建立企业图谱,并对节点间的各种关系进行权重计算,确定各节点间的关联权重。同时根据风险源节点的特征向量,明确候选风险源的选取范围,并根据特征向量之间的关系距离明确疑似风险源节点,将之和风险源节点作为风险传染的风险起点。在得到风险起点之后,需要对与风险源节点和疑似风险源节点关联的K层各节点的风险传染强度、风险传染深度进行具体分析,并明确企业风险传染的路径,从而能够对企业风险采取实时的分析和预警,具有客观性和准确性,提高了政府、银行等相关部门对企业风险的管理能力和效率。
在一个实施例中,如图3所示,提供了一种企业风险传染路径分析装置200,该装置包括图谱构建模块210、关系加权模块220、特征向量构建模块230、风险特征集模块240、疑似风险源模块250、风险值计算模块260和传染路径分析模块270,其中:
图谱构建模块210用于,根据接收的企业数据建立企业图谱,企业图谱中包括节点和节点之间的关系,节点具体为企业和个人;
关系加权模块220用于,通过预设的关系加权算法,对企业图谱各节点间的关系进行加权处理,得到携带节点间关联权重的目标企业图谱;
特征向量构建模块230用于,根据企业数据,量化各节点的基本信息,并构建各节点的特征向量;
风险特征集模块240用于,定义已发生风险的节点为风险源节点,根据所有的风险源节点构成风险源集合,并根据各风险源节点的特征向量构成风险特征集;
疑似风险源模块250用于,根据风险源集合和风险特征集,构建候选风险源集合,并根据候选风险源集合确定疑似风险源节点;
风险值计算模块260用于,将风险源节点和疑似风险源节点为风险起点,基于目标企业图谱,采用蒙特卡罗模拟各节点的风险传染路径,并计算个节点的风险值;
传染路径分析模块270用于,定义风险值大于预设值的节点为目标节点,根据风险起点和目标节点,分析各节点的风险传染路径。
在一个实施例中,如图4所示,风险特征集模块250包括标准差计算单元251、候选风险源集合构建单元252和相似度计算单元253,其中:标准差计算单元251用于,分析风险源集合和风险特征集,得到各特征向量维度的标准差;候选风险源集合构建单元用于,根据各特征向量维度的标准差,构建候选风险源集合,候选风险源集合中包括多个节点;相似度计算单元253用于,计算多个节点与风险源节点的相似度,当相似度符合预设范围时,对应的节点为疑似风险源节点。。
在一个实施例中,如图5所示,风险值计算模块260包括风险起点单元261、传染强度值计算单元262、传染深度计算单元263、传染路径获取单元264和风险值计算单元265,其中:风险起点单元261用于,定义风险源节点和疑似风险源节点为风险起点;传染强度值计算单元262用于,根据节点间关联权重,计算各节点的风险传染强度值;传染深度计算单元263用于,采用K-核分解法计算风险起点的风险传染深度;传染路径获取单元264用于,基于风险传染强度值和风险传染深度,采用蒙特卡洛模拟法模拟风险起点的K层风险传染,得到K层风险传染中各节点的风险传染路径;风险值计算单元265用于,采用随机漫步算法统计K层风险传导路径中各节点的风险传染路径,得到对应节点的风险值。
在一个实施例中,提供了一种设备,该设备可以是服务器,其内部结构图可以如图6所示。该设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该设备的处理器用于提供计算和控制能力。该设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该设备的数据库用于存储配置模板,还可用于存储目标网页数据。该设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种企业风险传染路径分析方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的设备的限定,具体的设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时使所述计算机执行如前述实施例所述的方法,所述计算机可以为上述提到的一种企业风险传染路径分析装置的一部分。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
显然,本领域的技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在计算机存储介质(ROM/RAM、磁碟、光盘)中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以,本发明不限制于任何特定的硬件和软件结合。
以上内容是结合具体的实施方式对本发明所做的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (9)
1.一种企业风险传染路径分析方法,其特征在于,包括:
根据接收的企业数据建立企业图谱,所述企业图谱中包括节点和节点之间的关系,所述节点具体为企业和个人;
通过预设的关系加权算法,对所述企业图谱各节点间的关系进行加权处理,得到携带节点间关联权重的目标企业图谱;
根据所述企业数据,量化各节点的基本信息,并构建各节点的特征向量;
定义已发生风险的节点为风险源节点,根据所有的风险源节点构成风险源集合,并根据各风险源节点的特征向量构成风险特征集;
根据所述风险源集合和所述风险特征集,构建候选风险源集合,并根据所述候选风险源集合确定疑似风险源节点;
将所述风险源节点和疑似风险源节点为风险起点,基于所述目标企业图谱,采用蒙特卡罗模拟各节点的风险传染路径,并计算个节点的风险值;
定义风险值大于预设值的节点为目标节点,根据所述风险起点和所述目标节点,分析各节点的风险传染路径。
2.如权利要求1所述的方法,其特征在于,所述根据所述风险源集合和所述风险特征集,构建候选风险源集合,并根据所述候选风险源集合确定疑似风险源节点,具体为:
分析所述风险源集合和所述风险特征集,得到各特征向量维度的标准差;
根据各特征向量维度的标准差,构建候选风险源集合,候选风险源集合中包括多个节点;
计算所述多个节点与风险源节点的相似度,当相似度符合预设范围时,对应的节点为疑似风险源节点。
3.如权利要求2所述的方法,其特征在于,所述计算所述多个节点与风险源节点的相似度,当相似度符合预设范围时,对应的节点为疑似风险源节点,具体为:
通过向量夹角余弦距离算法计算候选风险源企业的特征向量与风险源企业特征向量之间的向量距离;
将向量距离符合预设范围的企业定义为疑似风险源企业。
4.如权利要求1所述的方法,其特征在于,将所述风险源节点和疑似风险源节点为风险起点,基于所述目标企业图谱,采用蒙特卡罗模拟各节点的风险传染路径,并计算个节点的风险值,具体为:
定义所述风险源节点和疑似风险源节点为风险起点;
根据所述节点间关联权重,计算各节点的风险传染强度值;
采用K-核分解法计算所述风险起点的风险传染深度;
基于所述风险传染强度值和所述风险传染深度,采用蒙特卡洛模拟法模拟所述风险起点的K层风险传染,得到K层风险传染中各节点的风险传染路径;
采用随机漫步算法统计所述K层风险传导路径中各节点的风险传染路径,得到对应节点的风险值。
5.一种企业风险传染路径分析装置,其特征在于,包括图谱构建模块、关系加权模块、特征向量构建模块、风险特征集模块、疑似风险源模块、风险值计算模块和传染路径分析模块,其中:
所述图谱构建模块用于,根据接收的企业数据建立企业图谱,所述企业图谱中包括节点和节点之间的关系,所述节点具体为企业和个人;
所述关系加权模块用于,通过预设的关系加权算法,对所述企业图谱各节点间的关系进行加权处理,得到携带节点间关联权重的目标企业图谱;
所述特征向量构建模块用于,根据所述企业数据,量化各节点的基本信息,并构建各节点的特征向量;
所述风险特征集模块用于,定义已发生风险的节点为风险源节点,根据所有的风险源节点构成风险源集合,并根据各风险源节点的特征向量构成风险特征集;
所述疑似风险源模块用于,根据所述风险源集合和所述风险特征集,构建候选风险源集合,并根据所述候选风险源集合确定疑似风险源节点;
所述风险值计算模块用于,将所述风险源节点和疑似风险源节点为风险起点,基于所述目标企业图谱,采用蒙特卡罗模拟各节点的风险传染路径,并计算个节点的风险值;
所述传染路径分析模块用于,定义风险值大于预设值的节点为目标节点,根据所述风险起点和所述目标节点,分析各节点的风险传染路径。
6.如权利要求5所述的装置,其特征在于,所述疑似风险源模块包括标准差计算单元、候选风险源集合构建单元和相似度计算单元,其中:
所述标准差计算单元用于,分析所述风险源集合和所述风险特征集,得到各特征向量维度的标准差;
所述候选风险源集合构建单元用于,根据各特征向量维度的标准差,构建候选风险源集合,候选风险源集合中包括多个节点;
所述相似度计算单元用于,计算所述多个节点与风险源节点的相似度,当相似度符合预设范围时,对应的节点为疑似风险源节点。
7.如权利要求5所述的装置,其特征在于,所述风险值计算模块包括风险起点单元、传染强度值计算单元、传染深度计算单元、传染路径获取单元和风险值计算单元:
所述风险起点单元用于,定义所述风险源节点和疑似风险源节点为风险起点;
所述传染强度值计算单元用于,根据所述节点间关联权重,计算各节点的风险传染强度值;
所述传染深度计算单元用于,采用K-核分解法计算所述风险起点的风险传染深度;
所述传染路径获取单元用于,基于所述风险传染强度值和所述风险传染深度,采用蒙特卡洛模拟法模拟所述风险起点的K层风险传染,得到K层风险传染中各节点的风险传染路径;
所述风险值计算单元用于,采用随机漫步算法统计所述K层风险传导路径中各节点的风险传染路径,得到对应节点的风险值。
8.一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110976821.9A CN113688287A (zh) | 2021-08-24 | 2021-08-24 | 一种企业风险传染路径分析方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110976821.9A CN113688287A (zh) | 2021-08-24 | 2021-08-24 | 一种企业风险传染路径分析方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113688287A true CN113688287A (zh) | 2021-11-23 |
Family
ID=78582069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110976821.9A Pending CN113688287A (zh) | 2021-08-24 | 2021-08-24 | 一种企业风险传染路径分析方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113688287A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114511181A (zh) * | 2021-12-31 | 2022-05-17 | 中国环境科学研究院 | 基于电网及税收数据融合的水污染环保校验方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109272378A (zh) * | 2018-08-23 | 2019-01-25 | 阿里巴巴集团控股有限公司 | 一种风险群组的发现方法和装置 |
CN111598461A (zh) * | 2020-05-19 | 2020-08-28 | 北京海致星图科技有限公司 | 一种基于企业知识图谱实时的风险泛化与传导分析方法 |
CN111861120A (zh) * | 2020-06-17 | 2020-10-30 | 国家计算机网络与信息安全管理中心 | 企业关联图谱的构建方法、装置、设备及计算机可读介质 |
CN112150014A (zh) * | 2020-09-27 | 2020-12-29 | 平安资产管理有限责任公司 | 一种企业风险预警方法、装置、设备及可读存储介质 |
CN112819353A (zh) * | 2021-02-07 | 2021-05-18 | 撼地数智(重庆)科技有限公司 | 一种基于企业图谱的风险分析方法和计算机设备 |
-
2021
- 2021-08-24 CN CN202110976821.9A patent/CN113688287A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109272378A (zh) * | 2018-08-23 | 2019-01-25 | 阿里巴巴集团控股有限公司 | 一种风险群组的发现方法和装置 |
CN111598461A (zh) * | 2020-05-19 | 2020-08-28 | 北京海致星图科技有限公司 | 一种基于企业知识图谱实时的风险泛化与传导分析方法 |
CN111861120A (zh) * | 2020-06-17 | 2020-10-30 | 国家计算机网络与信息安全管理中心 | 企业关联图谱的构建方法、装置、设备及计算机可读介质 |
CN112150014A (zh) * | 2020-09-27 | 2020-12-29 | 平安资产管理有限责任公司 | 一种企业风险预警方法、装置、设备及可读存储介质 |
CN112819353A (zh) * | 2021-02-07 | 2021-05-18 | 撼地数智(重庆)科技有限公司 | 一种基于企业图谱的风险分析方法和计算机设备 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114511181A (zh) * | 2021-12-31 | 2022-05-17 | 中国环境科学研究院 | 基于电网及税收数据融合的水污染环保校验方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107633265B (zh) | 用于优化信用评估模型的数据处理方法及装置 | |
WO2019214248A1 (zh) | 一种风险评估方法、装置、终端设备及存储介质 | |
Choi et al. | Asymmetric and leptokurtic distribution for heteroscedastic asset returns: the SU-normal distribution | |
CN108763277B (zh) | 一种数据分析方法、计算机可读存储介质及终端设备 | |
Ronellenfitsch et al. | Topological phenotypes constitute a new dimension in the phenotypic space of leaf venation networks | |
CN110046929B (zh) | 一种欺诈团伙识别方法、装置、可读存储介质及终端设备 | |
CN111199474A (zh) | 一种基于双方网络图数据的风险预测方法、装置和电子设备 | |
CN111222976A (zh) | 一种基于双方网络图数据的风险预测方法、装置和电子设备 | |
CN113095408A (zh) | 风险的确定方法、装置和服务器 | |
CN114612251A (zh) | 风险评估方法、装置、设备及存储介质 | |
WO2022142903A1 (zh) | 身份识别方法、装置、电子设备及相关产品 | |
CN109034199B (zh) | 数据处理方法及装置、存储介质和电子设备 | |
CN114118816B (zh) | 一种风险评估方法、装置、设备及计算机存储介质 | |
CN112990989B (zh) | 价值预测模型输入数据生成方法、装置、设备和介质 | |
CN113688287A (zh) | 一种企业风险传染路径分析方法、装置、设备及存储介质 | |
CN110751354B (zh) | 一种异常用户的检测方法和装置 | |
CN111400663B (zh) | 模型训练方法、装置、设备及计算机可读存储介质 | |
CN113849618B (zh) | 基于知识图谱的策略确定方法、装置、电子设备及介质 | |
CN115982654A (zh) | 一种基于自监督图神经网络的节点分类方法及装置 | |
Durán-Rosal et al. | Simultaneous optimisation of clustering quality and approximation error for time series segmentation | |
CN114626940A (zh) | 数据分析方法、装置及电子设备 | |
CN111353871A (zh) | 一种基于双方网络图数据的风险预测方法、装置和电子设备 | |
Hassanat et al. | A Novel Outlier-Robust Accuracy Measure for Machine Learning Regression Based on Hassanat Distance Metric | |
CN116541726B (zh) | 用于植被覆盖度估算的样本量确定方法、装置及设备 | |
CN116484230B (zh) | 识别异常业务数据的方法及ai数字人的训练方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211123 |