CN113988724B - 一种上市公司金融活动知识图谱的风险分析方法 - Google Patents

一种上市公司金融活动知识图谱的风险分析方法 Download PDF

Info

Publication number
CN113988724B
CN113988724B CN202111617963.2A CN202111617963A CN113988724B CN 113988724 B CN113988724 B CN 113988724B CN 202111617963 A CN202111617963 A CN 202111617963A CN 113988724 B CN113988724 B CN 113988724B
Authority
CN
China
Prior art keywords
knowledge graph
risk
named entity
financial
named
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111617963.2A
Other languages
English (en)
Other versions
CN113988724A (zh
Inventor
胡为民
郑喜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Dib Enterprise Risk Management Technology Co ltd
Original Assignee
Shenzhen Dib Enterprise Risk Management Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Dib Enterprise Risk Management Technology Co ltd filed Critical Shenzhen Dib Enterprise Risk Management Technology Co ltd
Priority to CN202111617963.2A priority Critical patent/CN113988724B/zh
Publication of CN113988724A publication Critical patent/CN113988724A/zh
Application granted granted Critical
Publication of CN113988724B publication Critical patent/CN113988724B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Computational Linguistics (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Operations Research (AREA)
  • General Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Animal Behavior & Ethology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Technology Law (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种上市公司金融活动知识图谱的风险分析方法,包括:构建金融活动知识图谱;将命名实体库中的所有命名实体进行规范化处理;基于规范化处理过后的命名实体,构建三元组,进而得到三元组候选集;根据三元组候选集得到有效三元组;根据有效三元组构建知识图谱;知识图谱风险分析;根据知识图谱,构建金融风险传导模型;进行迭代计算,得到收敛后的金融风险传导模型,该模型用于表示知识图谱中每一个命名实体潜在风险程度;解决了现有技术中需要人工构建知识图谱的不足,节省了大量人力成本,构建金融风险传导模型,进而挖掘知识图谱中存在潜在风险的命名实体,对于上市公司监管机构加强市场金融活动的监管起到了重要的支撑作用。

Description

一种上市公司金融活动知识图谱的风险分析方法
技术领域
本发明属于知识图谱风险分析技术领域,尤其涉及一种上市公司金融活动知识图谱的风险分析方法。
背景技术
上市公司金融活动知识图谱能直观的反映上市公司金融活动的特点以及存在的风险,并能用于分析金融活动中的风险传导过程,对于上市公司监管机构加强市场金融活动的监管有着重要的支撑作用。然而市面上关于上市公司金融活动知识图谱鲜有报道。
目前产业界知识图谱的构建多依赖人工构建,耗费大量人力成本。主要是因为现有自动化构建技术难以适用于不同的领域,往往需要针对特定领域设计针对性的自动化知识图谱构建方法。另外,上市公司金融活动中的风险传导过程有其一定特点,需要基于知识图谱设计针对性的金融风险传导模型,进行知识图谱的风险分析。
发明内容
本发明的目的在于克服上述现有技术中需要针对性设计知识图谱、以及难以挖掘知识图谱中存在风险的实体的不足,提供了一种通过自动化构建知识图谱,进而挖掘知识图谱中存在潜在风险的命名实体的风险分析方法,具体为一种上市公司金融活动知识图谱的风险分析方法。
本发明提供了一种上市公司金融活动知识图谱的风险分析方法,包括:
构建金融活动知识图谱;
S1:将命名实体库中的所有命名实体进行规范化处理;
S2:基于规范化处理过后的命名实体,构建三元组,进而得到三元组候选集;
S3:计算三元组候选集中每一个三元组出现在上市公司公告中的次数,选取次数大于阈值的三元组作为有效三元组;根据有效三元组构建知识图谱;
知识图谱风险分析;
S4:根据知识图谱构建金融风险传导模型;
S5:迭代计算知识图谱中每个节点受其它节点影响的风险值,直至知识图谱中所有节点的风险值动态平衡,得到收敛后的金融风险传导模型,收敛后的金融风险传导模型用于表示知识图谱中每一个命名实体潜在风险程度。
优选的,S1中,包括:
S1.1:对于命名实体进行规范化处理;从命名实体库中依次提取所有两命名实体组合,计算两命名实体组合中两命名实体之间的字符串二元组杰卡德距离,对于字符串二元组杰卡德距离小于设定值的两命名实体,将其归并为同一个命名实体;
S1.2:将已计算的两命名实体组合替换成命名实体库中未计算的两命名实体组合,执行步骤S1.1;
S1.3:重复执行步骤S1.2,直至命名实体库中所有两命名实体组合均已进行规范化处理,并将归并为同一个命名实体的命名实体统一表示为规范化命名实体。
优选的,S2中,基于规范化处理过后的命名实体,根据上市公司公告文本段落中所有共同出现的规范化命名实体,构建三元组,整合所有上市公司公告文本段落中出现的三元组,构建三元组候选集。
优选的,S3中,计算三元组候选集中每一个三元组出现在上市公司公告中的次数,计算公式为:
Figure 518293DEST_PATH_IMAGE001
其中,三元组候选集记为:
Figure 436571DEST_PATH_IMAGE002
,上市公司公告文本记为:
Figure 681739DEST_PATH_IMAGE003
Figure 369072DEST_PATH_IMAGE004
表示规范化命名实体,
Figure 572651DEST_PATH_IMAGE005
Figure 447066DEST_PATH_IMAGE006
表示与
Figure 151717DEST_PATH_IMAGE004
连通的规范化命名实体,
Figure 801879DEST_PATH_IMAGE007
Figure 300994DEST_PATH_IMAGE008
表示三元组,
Figure 662705DEST_PATH_IMAGE009
表示三元组在所有上市公司公告文本
Figure 515254DEST_PATH_IMAGE003
段落中出现的次数,
Figure 911601DEST_PATH_IMAGE010
表示所有上市公司公告文本中段落的数量,
Figure 456982DEST_PATH_IMAGE011
表示第t个段落,
Figure 571569DEST_PATH_IMAGE012
表示包含三元组的段落数量,
Figure 86864DEST_PATH_IMAGE013
表示所有上市公司公告文本中三元组的数量;选取次数大于阈值的三元组作为有效三元组,对所有有效三元组进行关联,构建知识图谱,知识图谱记为
Figure 478662DEST_PATH_IMAGE014
优选的,S4中,基于知识图谱,通过平滑递减函数构建金融风险传导模型,平滑递减函数表示金融风险程度与传导路径之间的映射关系,在金融风险传导模型中,对于知识图谱中存在风险的节点,设置初始化已知风险值,记为:
Figure 54000DEST_PATH_IMAGE015
Figure 29784DEST_PATH_IMAGE016
为规范化命名实体,表示知识图谱中存在风险的节点;对于知识图谱中其它未知风险的节点,记为
Figure 348770DEST_PATH_IMAGE017
,设置初始化未知风险值,记为:
Figure 719708DEST_PATH_IMAGE018
Figure 341314DEST_PATH_IMAGE019
为规范化命名实体,表示知识图谱中未知风险的节点,与
Figure 164913DEST_PATH_IMAGE017
含义相同。
优选的,S5中,包括:
S5.1:在知识图谱中随机选择一个节点;
S5.2:采用广度优先算法搜索设定半径内所有的其它节点;
S5.3:以设定半径内的所有节点的风险值计算选择节点的潜在风险值;
S5.4:重复步骤S5.1、S5.2和S5.3,直至知识图谱中所有节点的风险值动态平衡,得到收敛后的金融风险传导模型,收敛后的金融风险传导模型用于表示知识图谱中每一个命名实体潜在风险程度。
优选的,S5.3中,以设定半径内的所有节点的风险值通过平滑递减函数计算选择节点的潜在风险值,平滑递减函数公式为:
Figure 287590DEST_PATH_IMAGE020
其中,
Figure 388401DEST_PATH_IMAGE004
为规范化命名实体,表示选择节点,
Figure 305542DEST_PATH_IMAGE021
表示
Figure 757383DEST_PATH_IMAGE004
的潜在风险值,
Figure 418171DEST_PATH_IMAGE006
表示知识图谱中与
Figure 498123DEST_PATH_IMAGE004
连通且最短路径为m跳的规范化命名实体,
Figure 225645DEST_PATH_IMAGE022
表示知识图谱中与
Figure 23837DEST_PATH_IMAGE004
关联的其它规范化命名实体,
Figure 222737DEST_PATH_IMAGE023
表示
Figure 298140DEST_PATH_IMAGE004
在知识图谱中关联的其它规范化命名实体
Figure 88242DEST_PATH_IMAGE022
的风险值总和。
优选的,设定半径为10跳。
有益效果:本发明提供的这种方法,通过字符串二元组杰卡德距离对命名实体进行规范化处理,并通过三元组候选集构建知识图谱,解决了现有技术中需要人工构建知识图谱的不足,节省了大量人力成本;通过知识图谱构建金融风险传导模型,进而挖掘知识图谱中存在潜在风险的命名实体,对于上市公司监管机构加强市场金融活动的监管起到了重要的支撑作用。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施中风险分析方法的流程图。
具体实施方式
下面将结合本发明的实施例中的附图,对本发明的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本实施例提供了一种上市公司金融活动知识图谱的风险分析方法,包括:
构建金融活动知识图谱;
S1:将命名实体库中的所有命名实体进行规范化处理;
在本实施例中,命名实体库通过从上市公司金融机构及其关联的法人和其他机构进行数据采集获得,直接从网络上爬取数据并解析标签获得,目前已有相关实体库。
具体的,包括:
S1.1:对于命名实体进行规范化处理;从命名实体库中依次提取所有两命名实体组合,计算两命名实体组合中两命名实体之间的字符串二元组杰卡德距离,对于字符串二元组杰卡德距离小于设定值的两命名实体,将其归并为同一个命名实体;
在本实施例中,命名实体库记为:
Figure 717937DEST_PATH_IMAGE024
,两命名实体分别记为:
Figure 251687DEST_PATH_IMAGE025
Figure 181597DEST_PATH_IMAGE026
;故
Figure 611441DEST_PATH_IMAGE027
Figure 384225DEST_PATH_IMAGE028
之间的字符串二元组杰卡德距离计算公式为:
Figure 570268DEST_PATH_IMAGE029
其中,
Figure 479318DEST_PATH_IMAGE030
表示
Figure 345643DEST_PATH_IMAGE027
Figure 215510DEST_PATH_IMAGE028
之间的字符串二元组杰卡德距离,
Figure 825483DEST_PATH_IMAGE031
表示命名实体
Figure 729985DEST_PATH_IMAGE027
的名称字符串中连续的二元组集合,
Figure 767211DEST_PATH_IMAGE032
表示命名实体
Figure 389953DEST_PATH_IMAGE027
的名称中单字符序列,
Figure 803617DEST_PATH_IMAGE033
表示命名实体
Figure 61161DEST_PATH_IMAGE028
的名称字符串中连续的二元组集合;
设定值为0.1,对于字符串二元组杰卡德距离小于0.1,即
Figure 269288DEST_PATH_IMAGE034
的两命名实体,将其归并为同一个命名实体;
S1.2:将已计算的两命名实体组合替换成命名实体库中未计算的两命名实体组合,执行步骤S1.1;
S1.3:重复执行步骤S1.2,直至命名实体库中所有两命名实体组合均已进行规范化处理,并将归并为同一个命名实体的命名实体统一表示为规范化命名实体。
S2:基于规范化处理过后的命名实体,构建三元组,进而得到三元组候选集;
具体的,基于规范化处理过后的命名实体,根据上市公司公告文本段落中所有共同出现的规范化命名实体,构建三元组,整合所有上市公司公告文本段落中出现的三元组,构建三元组候选集。
S3:计算三元组候选集中每一个三元组出现在上市公司公告中的次数,选取次数大于阈值的三元组作为有效三元组;根据有效三元组构建知识图谱;
具体的,计算三元组候选集中每一个三元组出现在上市公司公告中的次数,计算公式为:
Figure 113747DEST_PATH_IMAGE035
其中,三元组候选集记为:
Figure 331102DEST_PATH_IMAGE002
,上市公司公告文本记为:
Figure 944617DEST_PATH_IMAGE003
Figure 589225DEST_PATH_IMAGE004
表示规范化命名实体,
Figure 780035DEST_PATH_IMAGE005
Figure 410868DEST_PATH_IMAGE006
表示与
Figure 3523DEST_PATH_IMAGE004
连通的规范化命名实体,
Figure 192934DEST_PATH_IMAGE007
Figure 605460DEST_PATH_IMAGE008
表示三元组,
Figure 164618DEST_PATH_IMAGE009
表示三元组在所有上市公司公告文本
Figure 487146DEST_PATH_IMAGE003
段落中出现的次数,
Figure 473556DEST_PATH_IMAGE010
表示所有上市公司公告文本中段落的数量,
Figure 638959DEST_PATH_IMAGE011
表示第t个段落,
Figure 611594DEST_PATH_IMAGE012
表示包含三元组的段落数量,
Figure 913262DEST_PATH_IMAGE013
表示所有上市公司公告文本中三元组的数量;
在本实施例中,阈值设置为2.0,若次数大于等于阈值,即
Figure 945940DEST_PATH_IMAGE036
,则选取该三元组作为有效三元组,对所有有效三元组进行关联,构建知识图谱,知识图谱记为
Figure 598638DEST_PATH_IMAGE014
知识图谱风险分析;
S4:根据知识图谱构建金融风险传导模型;
具体的,基于知识图谱,通过平滑递减函数构建金融风险传导模型,平滑递减函数表示金融风险程度与传导路径之间的映射关系,在金融风险传导模型中,对于知识图谱中存在风险的节点,设置初始化已知风险值,记为:
Figure 234019DEST_PATH_IMAGE015
Figure 295254DEST_PATH_IMAGE016
为规范化命名实体,表示知识图谱中存在风险的节点;对于知识图谱中其它未知风险的节点,记为
Figure 357888DEST_PATH_IMAGE017
,设置初始化未知风险值,记为:
Figure 373248DEST_PATH_IMAGE018
Figure 812320DEST_PATH_IMAGE019
为规范化命名实体,表示知识图谱中未知风险的节点,与
Figure 88580DEST_PATH_IMAGE017
含义相同。
S5:迭代计算知识图谱中每个节点受其它节点影响的风险值,直至知识图谱中所有节点的风险值动态平衡,得到收敛后的金融风险传导模型,收敛后的金融风险传导模型用于表示知识图谱中每一个命名实体潜在风险程度。
具体的,S5.1:在知识图谱中随机选择一个节点;
S5.2:采用广度优先算法搜索设定半径内所有的其它节点;
S5.3:以设定半径内的所有节点的风险值计算选择节点的潜在风险值;
以设定半径内的所有节点的风险值通过平滑递减函数计算选择节点的潜在风险值,平滑递减函数公式为:
Figure 463061DEST_PATH_IMAGE037
其中,
Figure 824772DEST_PATH_IMAGE004
为规范化命名实体,表示选择节点,
Figure 942901DEST_PATH_IMAGE021
表示
Figure 339247DEST_PATH_IMAGE004
的潜在风险值,
Figure 9263DEST_PATH_IMAGE006
表示知识图谱中与
Figure 960733DEST_PATH_IMAGE004
连通且最短路径为m跳的规范化命名实体,
Figure 7186DEST_PATH_IMAGE022
表示知识图谱中与
Figure 258039DEST_PATH_IMAGE004
关联的其它规范化命名实体,
Figure 974322DEST_PATH_IMAGE023
表示
Figure 45047DEST_PATH_IMAGE004
在知识图谱中关联的其它规范化命名实体
Figure 364033DEST_PATH_IMAGE022
的风险值总和;
在本实施例中,设定半径为10跳,为经验参数;
S5.4:重复步骤S5.1、S5.2和S5.3,直至知识图谱中所有节点的风险值动态平衡,得到收敛后的金融风险传导模型,收敛后的金融风险传导模型用于表示知识图谱中每一个命名实体潜在风险程度。
本实施例提供的这种上市公司金融活动知识图谱的风险分析方法具有以下有益效果:通过字符串二元组杰卡德距离对命名实体进行规范化处理,并通过三元组候选集构建知识图谱,解决了现有技术中需要人工构建知识图谱的不足,节省了大量人力成本;通过知识图谱构建金融风险传导模型,进而挖掘知识图谱中存在潜在风险的命名实体,对于上市公司监管机构加强市场金融活动的监管起到了重要的支撑作用。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换或改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种上市公司金融活动知识图谱的风险分析方法,其特征在于,包括:
构建金融活动知识图谱;
S1:将命名实体库中的所有命名实体进行规范化处理;
S2:基于规范化处理过后的命名实体,构建三元组,进而得到三元组候选集;
S3:计算三元组候选集中每一个三元组出现在上市公司公告中的次数,选取次数大于阈值的三元组作为有效三元组;根据有效三元组构建知识图谱;
计算三元组候选集中每一个三元组出现在上市公司公告中的次数,计算公式为:
Figure 100661DEST_PATH_IMAGE001
其中,三元组候选集记为:
Figure 745269DEST_PATH_IMAGE002
,上市公司公告文本记为:
Figure 201658DEST_PATH_IMAGE003
Figure 504595DEST_PATH_IMAGE004
表示规范化命名实体,
Figure 97250DEST_PATH_IMAGE005
Figure 912759DEST_PATH_IMAGE006
表示与
Figure 590865DEST_PATH_IMAGE007
连通的规范化命名实体,
Figure 900755DEST_PATH_IMAGE008
Figure 613496DEST_PATH_IMAGE009
表示三元组,
Figure 334328DEST_PATH_IMAGE010
表示三元组在所有上市公司公告文本
Figure 312779DEST_PATH_IMAGE011
段落中出现的次数,
Figure 410048DEST_PATH_IMAGE012
表示所有上市公司公告文本中段落的数量,
Figure 242875DEST_PATH_IMAGE013
表示第t个段落,
Figure 134607DEST_PATH_IMAGE014
表示包含三元组的段落数量,
Figure 791899DEST_PATH_IMAGE015
表示所有上市公司公告文本中三元组的数量;选取次数大于阈值的三元组作为有效三元组,对所有有效三元组进行关联,构建知识图谱,所述知识图谱记为
Figure 692858DEST_PATH_IMAGE016
知识图谱风险分析;
S4:根据知识图谱构建金融风险传导模型;
基于知识图谱,通过平滑递减函数构建金融风险传导模型,所述平滑递减函数表示金融风险程度与传导路径之间的映射关系,在所述金融风险传导模型中,对于知识图谱中存在风险的节点,设置初始化已知风险值,记为:
Figure 114613DEST_PATH_IMAGE017
Figure 442826DEST_PATH_IMAGE018
为规范化命名实体,表示知识图谱中存在风险的节点;对于知识图谱中其它未知风险的节点,记为
Figure 333552DEST_PATH_IMAGE019
,设置初始化未知风险值,记为:
Figure 38203DEST_PATH_IMAGE020
Figure 580043DEST_PATH_IMAGE021
为规范化命名实体,表示知识图谱中未知风险的节点,与
Figure 79157DEST_PATH_IMAGE019
含义相同;
S5:迭代计算所述知识图谱中每个节点受其它节点影响的风险值,直至知识图谱中所有节点的风险值动态平衡,得到收敛后的金融风险传导模型,收敛后的金融风险传导模型用于表示知识图谱中每一个命名实体潜在风险程度。
2.根据权利要求1所述的一种上市公司金融活动知识图谱的风险分析方法,其特征在于,S1中,包括:
S1.1:对于命名实体进行规范化处理;从命名实体库中依次提取所有两命名实体组合,计算两命名实体组合中两命名实体之间的字符串二元组杰卡德距离,对于字符串二元组杰卡德距离小于设定值的两命名实体,将其归并为同一个命名实体;
S1.2:将已计算的两命名实体组合替换成命名实体库中未计算的两命名实体组合,执行步骤S1.1;
S1.3:重复执行步骤S1.2,直至命名实体库中所有两命名实体组合均已进行规范化处理,并将归并为同一个命名实体的命名实体统一表示为规范化命名实体。
3.根据权利要求2所述的一种上市公司金融活动知识图谱的风险分析方法,其特征在于,S2中,基于规范化处理过后的命名实体,根据上市公司公告文本段落中所有共同出现的规范化命名实体,构建三元组,整合所有上市公司公告文本段落中出现的三元组,构建三元组候选集。
4.根据权利要求3所述的一种上市公司金融活动知识图谱的风险分析方法,其特征在于,S5中,包括:
S5.1:在知识图谱中随机选择一个节点;
S5.2:采用广度优先算法搜索设定半径内所有的其它节点;
S5.3:以设定半径内的所有节点的风险值计算选择节点的潜在风险值;
S5.4:重复步骤S5.1、S5.2和S5.3,直至知识图谱中所有节点的风险值动态平衡,得到收敛后的金融风险传导模型,收敛后的金融风险传导模型用于表示知识图谱中每一个命名实体潜在风险程度。
5.根据权利要求4所述的一种上市公司金融活动知识图谱的风险分析方法,其特征在于,S5.3中,以设定半径内的所有节点的风险值通过平滑递减函数计算选择节点的潜在风险值,平滑递减函数公式为:
Figure 457180DEST_PATH_IMAGE022
其中,
Figure 434364DEST_PATH_IMAGE023
为规范化命名实体,表示选择节点,
Figure 627448DEST_PATH_IMAGE024
表示
Figure 48196DEST_PATH_IMAGE025
的潜在风险值,
Figure 162782DEST_PATH_IMAGE026
表示知识图谱中与
Figure 943656DEST_PATH_IMAGE025
连通且最短路径为m跳的规范化命名实体,
Figure 194509DEST_PATH_IMAGE027
表示知识图谱中与
Figure 786159DEST_PATH_IMAGE028
关联的其它规范化命名实体,
Figure 388041DEST_PATH_IMAGE029
表示
Figure 972606DEST_PATH_IMAGE023
在知识图谱中关联的其它规范化命名实体
Figure 343545DEST_PATH_IMAGE030
的风险值总和。
6.根据权利要求4所述的一种上市公司金融活动知识图谱的风险分析方法,其特征在于,所述设定半径为10跳。
CN202111617963.2A 2021-12-28 2021-12-28 一种上市公司金融活动知识图谱的风险分析方法 Active CN113988724B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111617963.2A CN113988724B (zh) 2021-12-28 2021-12-28 一种上市公司金融活动知识图谱的风险分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111617963.2A CN113988724B (zh) 2021-12-28 2021-12-28 一种上市公司金融活动知识图谱的风险分析方法

Publications (2)

Publication Number Publication Date
CN113988724A CN113988724A (zh) 2022-01-28
CN113988724B true CN113988724B (zh) 2022-03-22

Family

ID=79734630

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111617963.2A Active CN113988724B (zh) 2021-12-28 2021-12-28 一种上市公司金融活动知识图谱的风险分析方法

Country Status (1)

Country Link
CN (1) CN113988724B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116187868B (zh) * 2023-04-27 2023-07-21 深圳市迪博企业风险管理技术有限公司 一种基于知识图谱的产业链发展质量评价方法及装置
CN116227940B (zh) * 2023-05-04 2023-07-25 深圳市迪博企业风险管理技术有限公司 一种基于资金流向图的企业资金流异常检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874261A (zh) * 2017-03-17 2017-06-20 中国科学院软件研究所 一种基于语义三角的领域知识图谱及查询方法
CN107122444A (zh) * 2017-04-24 2017-09-01 北京科技大学 一种法律知识图谱自动构建方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522416A (zh) * 2018-10-19 2019-03-26 广东工业大学 一种金融风险控制知识图谱的构建方法
CN111143479B (zh) * 2019-12-10 2023-09-01 易点生活数字科技有限公司 基于dbscan聚类算法的知识图谱关系抽取与rest服务可视化融合方法
CN111402064A (zh) * 2020-06-03 2020-07-10 天云融创数据科技(北京)有限公司 一种风险值的评估方法及装置
CN111813962B (zh) * 2020-09-07 2020-12-18 北京富通东方科技有限公司 一种用于知识图谱融合的实体相似度计算方法
CN112214614B (zh) * 2020-10-16 2024-02-09 民生科技有限责任公司 基于知识图谱挖掘风险传播路径的方法及其系统
CN113449046A (zh) * 2021-06-29 2021-09-28 平安资产管理有限责任公司 基于企业知识图谱的模型训练方法、系统及相关装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874261A (zh) * 2017-03-17 2017-06-20 中国科学院软件研究所 一种基于语义三角的领域知识图谱及查询方法
CN107122444A (zh) * 2017-04-24 2017-09-01 北京科技大学 一种法律知识图谱自动构建方法

Also Published As

Publication number Publication date
CN113988724A (zh) 2022-01-28

Similar Documents

Publication Publication Date Title
CN113988724B (zh) 一种上市公司金融活动知识图谱的风险分析方法
CN102930023B (zh) 基于知识的数据质量解决方案
US10984032B2 (en) Relation extraction using co-training with distant supervision
US7882047B2 (en) Partially observable markov decision process including combined bayesian networks into a synthesized bayesian network for information processing
US20160300012A1 (en) Family Networks
CN111199474B (zh) 一种基于双方网络图数据的风险预测方法、装置和电子设备
CN111222976B (zh) 一种基于双方网络图数据的风险预测方法、装置和电子设备
US9607039B2 (en) Subject-matter analysis of tabular data
CN109284626A (zh) 面向差分隐私保护的随机森林算法
Price et al. Tightly congruent bursts of lineage and phenotypic diversification identified in a continental ant radiation
CN110019074A (zh) 访问路径的分析方法、装置、设备及介质
CN110827131B (zh) 一种分布式自动特征组合的纳税人信用评估方法
CN109951306A (zh) 告警的处理方法、装置、设备及介质
CN111597343B (zh) 一种基于app的智能化用户职业判断方法、装置和电子设备
Garnett et al. Complexity in history: modelling the organisational demography of the British banking sector
Leão et al. Evolutionary patterns in the geographic range size of Atlantic Forest plants
Maliet et al. Ranked tree shapes, nonrandom extinctions, and the loss of phylogenetic diversity
CN110378543A (zh) 离职风险预测方法、装置、计算机设备和存储介质
Goel et al. Understanding gender segregation through call data records: an Estonian case study
CN114880482A (zh) 一种基于图嵌入的关系图谱关键人员分析方法及系统
CN113570222A (zh) 一种用户设备鉴别方法、装置和计算机设备
CN109408643A (zh) 基金相似度计算方法、系统、计算机设备和存储介质
CN117540223A (zh) 基于ap算法的社交网络舆情传播转发链条挖掘方法及装置
Wolf et al. In search for the missing link: studying the interrelationship between organizational learning and organizational culture change
Piñeiro et al. Contrasting genetic signal of recolonization after rainforest fragmentation in African trees with different dispersal abilities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant