CN113449046A - 基于企业知识图谱的模型训练方法、系统及相关装置 - Google Patents
基于企业知识图谱的模型训练方法、系统及相关装置 Download PDFInfo
- Publication number
- CN113449046A CN113449046A CN202110724205.4A CN202110724205A CN113449046A CN 113449046 A CN113449046 A CN 113449046A CN 202110724205 A CN202110724205 A CN 202110724205A CN 113449046 A CN113449046 A CN 113449046A
- Authority
- CN
- China
- Prior art keywords
- entity
- enterprise
- risk
- node
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 55
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000010276 construction Methods 0.000 claims abstract description 11
- 238000012216 screening Methods 0.000 claims abstract description 10
- 238000000605 extraction Methods 0.000 claims description 19
- 230000004927 fusion Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 230000006698 induction Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 19
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 241000700605 Viruses Species 0.000 description 5
- 239000000969 carrier Substances 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013499 data model Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Operations Research (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于企业知识图谱的模型训练方法,训练方法包括,获取与企业关联的多个实体,以及各个实体的原始信息;根据各个实体的原始信息,抽取N个连接关系值;在所述N个连接关系值中筛选出高于预设阀值的M个连接关系值;从所述原始信息中抽取与所述M个连接关系值对应的K个实体、K个实体属性值以及M个实体连接关系;通过所述K个实体、所述K个实体属性值、以及所述M个实体连接关系,构建企业知识图谱;基于所述企业知识图谱,训练出用于预测企业风险的风险传导模型;本实施例提取关联性较强的实体作为构建知识图谱的节点,减少了构建知识图谱的数据量,提高了图谱的构建效率;提高了风险传导模型进行风险预测的准确率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于企业知识图谱的模型训练方法、系统、计算机设备及计算机可读存储介质。
背景技术
近年来的违约事件数量日益增长,风险的控制与预警在风险投资中起到重要的作用,风险的有效预警能避免投资人出现重大损失;初具规模的企业与其他企业和自然人之间会存在各种关联关系;导致企业的信用风险不仅仅是与自身的经营状况有关;还会受到与企业具有关联关系的主体的影响,即具有关联关系的主体的信用风险可能会传导给企业自身;因此,与企业具有关联关系的主体的信用风险通常被作为企业风险评估的重要因素之一。
针对关联主体之间的风险传导性,现有的主流方法是基于风控人员的专家经验和实地考察,然后进行主观判断,从而给出目标企业的风险等级,由于不同的专业人员评判会有差异,存在较强的主观性;所以此类预测结果难以量化;
现有技术中,也有基于图嵌入的风险传导模型,利用企业间的关联图谱,结合图嵌入方法,将企业映射到低维向量表示空间,在低维向量表示空间中企业之间的关系满足简单的矢量加减运算规律,然后根据计算空间中的企业之间的距离大小来模拟企业间的风险传导概率高低。
知识图谱又称为科学知识图谱,是显示知识发展进程与结构关系的一系列图形,用可视化的网络描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系;
而利用知识图谱作为风险传导模型训练的基础是现有模型训练常用的做法,现有的知识图谱一般是通过采集大量的实体数据,图谱构建时间长、数据挖掘不准确;导致基于知识图谱训练出的风险传导模型的风险预测的准确度低。
发明内容
本发明的目的是提供,用于解决以下问题:图谱构建时间长,训练出的风险传导模型的风险预测的准确度低的问题。
本发明实施例的一个方面提供了一种基于企业知识图谱的模型训练方法,所述方法包括,获取与企业关联的多个实体,以及各个实体的原始信息;所述实体为企业、自然人、专利、产品的任意一种或多种;所述原始信息包括所述各个实体的控股信息、抵押信息、担保信息、业务往来信息的一种或多种;根据各个实体的原始信息,抽取N个连接关系值,其中每个连接关系值对应于具有连接关系的两个实体;在所述N个连接关系值中筛选出高于预设阀值的M个连接关系值;每个连接关系值包括控股比例、抵押比例、担保比例、业务往来比例的一种,所述M、N均为正整数,且M不大于N;从所述原始信息中抽取与所述M个连接关系值对应的K个实体、K个实体属性值以及M个实体连接关系;其中K为正整数,所述M个实体连接关系与所述M个连接关系值一一对应;通过所述K个实体、所述K个实体属性值、以及所述M个实体连接关系,构建企业知识图谱;其中每个实体属性值表示所述每个实体的已知风险值;所述已知风险值与所述企业信用评级呈反比;基于所述企业知识图谱,训练出用于预测企业风险的风险传导模型。
可选地,从所述原始信息中抽取与所述M个连接关系值对应的K个实体、K个实体属性值以及M个实体连接关系的步骤,包括,分别从不同的数据结构中获取所述各个实体的原始信息;通过图映射或D2R转换或包装器归纳或信息抽取将所述原始信息转换为RDF三元组数据进行存储;所述原始信息包括结构化数据、半结构化数据以及文本数据;所述RDF三元组数据包括K个实体、K个实体属性值以及M个实体连接关系。
可选地,所述通过所述K个实体、所述K个实体属性值、以及所述M个实体连接关系,构建企业知识图谱的步骤包括,对所述K个实体、所述K个实体属性值以及所述M个实体连接关系进行知识融合,利用知识融合后的数据构建企业知识图谱。
可选地,所述企业知识图谱包括K个节点、K个节点属性及具有关联信息的节点之间的有向边;所述K个节点与所述K个实体一一对应,所述K个节点属性与所述K个实体属性值一一对应;每个所述关联信息对应于M个连接关系值中的一个。
可选地,所述基于所述企业知识图谱,训练出用于预测企业风险的风险传导模型的步骤包括,根据所述企业图谱中的各个节点的已知风险值和所述各个节点之间的关联信息,得到所述各个节点的关联风险值;将所述关联风险值输入到模型中进行训练,以得到用于预测企业风险的风险传导模型。
可选地,所述根据所述企业图谱中的各个节点的已知风险值和所述各个节点之间的关联信息,得到所述各个节点的关联风险值的步骤,包括,获取与第i个节点具有关联关系的各个其他节点的已知风险值;i为所述各个节点之一,i为正整数;获取所述第i个节点与所述各个其他节点之间的关联信息;根据所述各个其他节点的已知风险值以及所述第i个节点与所述各个其他节点之间的关联信息,获取所述第i个节点的外部风险;根据所述第i个节点的外部风险以及所述第i个节点的已知风险值,得到所述第i个节点的关联风险值。
可选地,所述根据所述各个其他节点的已知风险值以及所述第i个节点与所述各个其他节点之间的关联信息,获取所述第i个节点的外部风险的步骤,包括,获取与所述第i个节点关联的各个其他节点的风险传出阈值;根据所述第i个节点与所述各个其他节点之间的关联信息,获取各个其他节点的风险传导权值;根据所述各个其他节点的风险传导阈值和风险传导权值,获取所述第i个节点的外部风险。
本发明实施例的一个方面又提供一种基于企业知识图谱的模型训练系统,包括,
获取模块,用于获取与企业关联的多个实体,以及各个实体的原始信息;所述实体为企业、自然人、专利、产品的任意一种或多种;所述原始信息包括所述各个实体的控股信息、抵押信息、担保信息、业务往来信息的一种或多种;
提取模块,用于根据各个实体的原始信息,抽取N个连接关系值,其中每个连接关系值对应于具有连接关系的两个实体;
筛选模块,用于在所述N个连接关系值中筛选出高于预设阀值的M个连接关系值;每个连接关系值包括控股比例、抵押比例、担保比例、业务往来比例的一种,所述M、N均为正整数,且M不大于N;
抽取模块,用于从所述原始信息中抽取与所述M个连接关系值对应的K个实体、K个实体属性值以及M个实体连接关系;其中K为正整数,所述M个实体连接关系与所述M个连接关系值一一对应;
图谱构建模块,用于通过所述K个实体、所述K个实体属性值、以及所述M个实体连接关系,构建企业知识图谱;其中每个实体属性值表示所述每个实体的已知风险值;所述已知风险值与所述企业信用评级呈反比。
训练模块,用于基于所述企业知识图谱,训练出用于预测企业风险的风险传导模型。
本发明实施例的一个方面又提供了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述基于企业知识图谱的模型训练方法的步骤。
本发明实施例的一个方面又提供了一种计算机可读存储介质,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述基于企业知识图谱的模型训练方法的步骤。
本发明实施例提供的基于企业知识图谱的模型训练方法、系统、计算机设备及计算机可读存储介质,根据实际需要确定与企业相关的实体,在不同的数据结构中抽取与实体相关的原始信息,通过预设阀值筛选出关联性较强的目标实体,以构建知识图谱,相比于传统的图谱构建过程,本实施例只提取关联性较强的实体作为构建知识图谱的节点,减少了构建知识图谱的数据量,提高了图谱的构建效率;提高了风险传导模型进行风险预测的准确率。
附图说明
图1示意性示出了根据本发明实施例一的基于企业知识图谱的模型训练方法的流程图;
图2为图1中步骤S101的子步骤图;
图3为图1中步骤S103的子步骤图;
图4为图3中步骤S105-1的子步骤图;
图5为图4中步骤S1051C的子步骤图;
图6示意性示出了根据本发明实施例二的基于企业知识图谱的模型训练系统的框图;及
图7示意性示出了根据本发明实施例三的适于实现基于企业知识图谱的模型训练方法的计算机设备的硬件架构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明实施例中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
在本发明的描述中,需要理解的是,步骤前的数字标号并不标识执行步骤的前后顺序,仅用于方便描述本发明及区别每一步骤,因此不能理解为对本发明的限制。
下面为本发明涉及的术语解释:
知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。在本发明实施例中,知识图谱是指多关系图(Multi-relational Graph),包含多种类型的节点和多种类型的边,通常用“实体(Entity)”来表达图里的节点、用“关系(Relation)”来表达图里的“边”。实体指的是现实世界中的事物,在本实施例中实体为用户账号,关系则用来表达不同实体之间的某种联系。
实体(Entity),是一个系统内可定义的事物或概念,如人/角色(例如自然人),对象(例如公司),概念(例如简介)或事件(例如资本额)。
实施例一
图1示意性示出了根据本发明实施例一的基于企业知识图谱的模型训练方法的流程图。
如图1所示,该企业知识图谱的训练方法可以包括步骤S100~S105,其中:
步骤S100,获取与企业关联的多个实体,以及各个实体的原始信息;所述实体为企业、自然人、专利、产品的任意一种或多种;所述原始信息包括所述各个实体的控股信息、抵押信息、担保信息、业务往来信息的一种或多种。
具体地,上市企业、中型企业、小型企业、微型企业、法人、实际控股人、投资人、发明专利、实用新型专利、外观专利、电子产品、医疗器械用品等均可视为实体。
步骤S101,根据各个实体的原始信息,抽取N个连接关系值,其中每个连接关系值对应于具有连接关系的两个实体。
两个实体之间的连接关系包括控股关系、抵押关系、担保关系、业务往来关系;实体抽取或者说命名实体识别(NER)在信息抽取中扮演着重要角色,主要抽取的是文本中的原子信息元素,如人名、组织/机构名、地理位置、事件/日期、字符值、金额值等。实体抽取任务主要包括:找到命名实体,并进行分类,本实施例中的实体抽取主要根据原始信息中实体之间的连接关系,抽取对应的连接关系值。
步骤S102,在所述N个连接关系值中筛选出高于预设阀值的M个连接关系值;每个连接关系值包括控股比例、抵押比例、担保比例、业务往来比例的一种,所述M、N均为正整数,且M不大于N。
作为优选方案,假设选取的各个实体之间的连接关系值为控股比例,原始信息中包括有若干组包括有控股比例的信息,例如“A公司对C公司控股比例为30%,A公司对C公司的担保比例为10%;B公司对C公司控股比例为5%,D公司对C公司控股比例为15%”,H公司对C公司的抵押比例为30%,假设预设阀值设定为比例10%,则根据预设阀值,筛选出高于预设阀值的目标信息,即“A公司对C公司控股比例为30%,A公司对C公司的担保比例为10%,D公司对C公司控股比例为15%,H公司对C公司的抵押比例为30%”,以上述目标信息作为构建知识图谱的基础,由于B公司对C公司的影响较小,所以B公司对C公司的传导风险的概率可以忽略不计;本实施例通过与C公司关联性较强的A公司、H公司、D公司作为构建知识图谱的基础,一方面减少了构建知识图谱的数据量,提高了图谱的构建效率;另一方面,减少了风险传导模型中的计算各个节点的关联风险值的计算量。
步骤S103,从所述原始信息中抽取与所述M个连接关系值对应的K个实体、K个实体属性值以及M个实体连接关系;其中K为正整数,所述M个实体连接关系与所述M个连接关系值一一对应。
信息抽取是构建知识图谱的重要步骤,如图2所示,本实施例通过如下方法针对原始信息进行信息抽取;
步骤S103-1:分别从不同的数据结构中获取所述各个实体的原始信息;
步骤S103-2:通过图映射或D2R转换或包装器归纳或信息抽取将所述原始信息转换为RDF三元组数据进行存储;所述原始信息包括结构化数据、半结构化数据以及文本数据;所述RDF三元组数据包括K个实体、K个实体属性值以及M个实体连接关系。
作为优选方案,结构化数据包括链接数据,企业数据库数据、企业税务数据库数据;半结构化数据包括表单数据、列表数据;链接数据中包括有若干个区域,每个区域对应有一个不同的超链接,通过图映射的方法将所述超链接跳转至目标页面;D2R转换主要的作用是将企业数据库数据、企业税务数据库数据映射到RDF三元组数据中;包装器主要用于将原始信息从目标页面中抽取出来;其中企业数据库数据可以包括企业的背景信息(包括基本信息、企业关系、投资事件等);产品信息(专利、版权、商标等);工商信息(注册时间、注册地址、实缴金额、股东变动等)。
RDF(Resource Description Framework),即资源描述框架,其本质是一个数据模型(Data Model)。它提供了一个统一的标准,用于描述实体/资源。简单来说,就是表示事物的一种方法和手段。RDF形式上表示为SPO三元组,有时候也称为一条语句(statement),知识图谱中我们也称其为一条知识。
文本数据的信息抽取可以包括文本的预处理、分词、词性标注、语法标注、语法解析、依存分析,以及基于深度学习的表征学习方法、采用句子嵌入到CNN-CRF中,自动学习特征,实现自动实体识别、实体链接;信息抽取还包括关系抽取、事件抽取;以及三元组、多元关系以及模态知识等。
作为优选方案,假设原始信息为“A公司对C公司控股比例为30%,D公司对C公司控股比例为15%,A公司的已知风险值为30,C公司已知风险值为40,D公司的已知风险值为50”,则抽取出的K个实体为A公司、C公司、D公司;抽取出的K个实体属性值为A公司的已知风险值30、C公司的已知风险值40,D公司的已知风险值50;抽取出的M个实体连接关系为A与C通过控股关系连接,其连接关系值为30%,D公司与C公司通过控股关系连接,其连接关系值为15%。
步骤S104:通过所述K个实体、所述K个实体属性值、以及所述M个实体连接关系,构建企业知识图谱;其中每个实体属性值表示所述每个实体的已知风险值,所述已知风险值与所述企业信用评级呈反比。
所述企业知识图谱包括K个节点、K个节点属性及具有关联信息的节点之间的有向边;所述K个节点与所述K个实体一一对应,所述K个节点属性与所述K个实体属性值一一对应;每个所述关联信息对应于M个连接关系值中的一个。
作为优选方案,假设抽取出的实体为A公司、C公司、D公司,则分别对应企业知识图谱中的a、c、d三个节点,通过A公司对C公司的控股关系,在节点a与节点c之间构建有向边,通过A公司对D公司的控股关系,在节点a与节点d之间构建有向边,将A公司、C公司、D公司的已知风险值分别作为节点a、节点c、节点d的节点属性,添加至企业知识图谱中,其中通过A公司、C公司、D公司的抵押关系、担保关系、业务往来关系的作为企业知识图谱有向边的构建方法与上述利用控股关系构建的方法类似,在此不再赘述,通过完善a、c、d节点之间的边,以构建出企业知识图谱。
示例性的,假设将节点j的企业信用评级划分为A,B,C,D,E,E,F,G,H,I,J,K;信用等级A对应的已知风险值为0,B对应的已知风险值为10,C对应的已知风险值为20,D对应的已知风险值为30,E对应的已知风险值为40,F对应的已知风险值为50,G对应的已知风险值为60,H对应的已知风险值为70,I对应的已知风险值为80,J对应的已知风险值为90,K对应的已知风险值为100。
企业信用评级(Enterprise Credit Rating),作为一个完整的体系,包括信用评级的要素和指标、信用评级的等级和标准、信用评级的方法和模型等方面的内容。其中信用评级指标和信用评级方法是信用评级体系中最核心的两个内容,同时又是信用评价体系中联系最紧密、影响最深刻的两个内容。
信用评级的方法包括判别分析法、综合评判法、人工神经网络法、模糊分析法以及企业信用评级法;为了保证信用评级的客观性,本技术方案优选为企业信用评级法;
企业信用评级法是通过对国际上先进的企业信用评级理论、企业信用评级思想、企业信用评级模型以及企业信用评级方法的研究,最终总结出一套符合中国经济环境且适用于中国中小企业的信用评级体系,并建立了完备的企业信用评级数据库、业内领先的企业信用评级模型以及科学的企业信用评级方法。企业信用网就是通过利用现代互联网信息技术手段,来充分把握各个行业发展脉搏,从而保证了企业信用评级结果的准确性、及时性,提高了中国企业信用评级行业的技术水平。
通过所述K个实体、所述K个实体属性值、以及所述M个实体连接关系,构建企业知识图谱的步骤包括,
步骤S104-1:对所述K个实体、所述K个实体属性值以及所述M个实体连接关系进行知识融合,利用知识融合后的数据构建企业知识图谱。
知识融合,即合并两个知识图谱(本体),由于两条数据的信息表示不同,但指代的对象属于同一个实体;知识融合具体的目的将来自多个来源的关于同一个实体或概念的描述信息融合起来;知识融合包括本体对齐和本体匹配;基本流程包括现有技术中的数据预处理、分块、负载均衡、记录链接、结果评估、结果输出。
步骤S105:基于所述企业知识图谱,训练出用于预测企业风险的风险传导模型。
在构建后的企业知识图谱上,可以查询到各个节点的属性(即各个节点的已知风险值)、以及各个节点之间的边,利用企业知识图谱,可以查询出目标企业关联的其他企业或法人或产品,通过图谱中的连接关系,可训练出预测企业风险的风险传导模型。
如图3所示,所述基于所述企业知识图谱,训练出用于预测企业风险的风险传导模型的具体步骤包括:
步骤S105-1:根据所述企业图谱中的各个节点的已知风险值和所述各个节点之间的关联信息,得到所述各个节点的关联风险值;
步骤S105-2:将所述关联风险值作为训练数据输入到模型中进行训练,以得到用于预测企业风险的风险传导模型。
在实际应用中,关联风险的传导量化值很难准确标注,比如,企业i的对外投资企业j出现了风险状态,无法预估该对外投资给企业i带来的风险程度。人为预估风险程度存在很强的主观性,所以针对不同的人,判定的风险程度不一;使用人为标注的关联风险作为训练样本,将会导致风险传导模型预测不稳定。在本方案中,模型训练方法中的目标不是人工标注的关联风险传导量化值,而是以第i个节点关联风险状态,即通过企业i的关联风险值作为训练数据对模型进行训练,解决了风险传导人工标注难以统一量化的困难。
如图4所示,所述根据所述企业图谱中的各个节点的已知风险值和所述各个节点之间的关联信息,得到所述各个节点的关联风险值的具体步骤包括
步骤S105-1A:获取与第i个节点具有关联关系的各个其他节点的已知风险值;i为所述各个节点之一,i为正整数;
步骤S105-1B:获取所述第i个节点与所述各个其他节点之间的关联信息;
步骤S105-1C:根据所述各个其他节点的已知风险值以及所述第i个节点与所述各个其他节点之间的关联信息,获取所述第i个节点的外部风险;
步骤S105-1D:根据所述第i个节点的外部风险以及所述第i个节点的已知风险值,得到所述第i个节点的关联风险值。
作为优选方案,根据企业知识图谱中可获取第i个节点与各个其他节点的的关联信息,再根据与其关联的其他节点的已知风险值,从而可计算出所述第i个节点的外部风险;如图5所示,其中获取所述第i个节点的外部风险的步骤如下:
步骤S1051C-1:获取与所述第i个节点关联的各个其他节点的风险传出阈值;
其中获取与所述风险传出阀值的计算公式如下:
th(xj)=σth(wth*xj+bth)
上式中,th(xj)为风险传出函数,σth为激活函数,对应的表达式为σth(x)=tanh(max(0,x)),(其中,),bth为th(xj)的偏移量参数,取值可为负,表示节点j的已知风险值高于|bth|时,才具备风险传出的能力;xj为节点j的已知风险值;wth表示已知风险值的缩放系数;其中,xj的值与节点j的信用评级成反比;节点j的信用评级越高,xj的值越小。
假设bth的设置值为-11,wth的缩放系数设置值为1,则当节点j的信用等级为A时,th(xj)的值为0;当节点j的信用等级为B时,th(xj)为20。
步骤S1051C-2:根据所述第i个节点与所述各个其他节点之间的关联信息,获取各个其他节点的风险传导权值;
其中获取所述风险传导权值的计算公式如下:
g(rij)=σg(wg*rij+bg)
上式中,g(rij)为风险传导权值函数,取值范围为[0,1],σg为激活函数,wg为g(rij)的权重系数,bg为g(rij)的偏移量系数;rij为节点j到节点i的多条有向边的值的集合;
本实施例模型训练过程是将第i个节点的关联风险值作为训练数据,输入到待训练的风险传导模型中,通过现有的损失函数计算loss值,然后根据loss值更新上述参数bth、wth、wg、bg的值,以使得损失函数中的loss值降到最低,从而完成对风险传导模型的训练。
示例性地,节点j对节点i的控股比例为15%,节点j对节点i的担保金额占j节点最大可担保额度的比例为35%,节点j对节点i的抵押额度占j节点最大可抵押额度的比例为0;节点j对节点i的业务往来占j节点与其他企业业务往来的比例为0;则rij=[0.15,0.35,0,0]。
步骤S1051C-3:根据所述各个其他节点的风险传导阈值和风险传导权值,获取所述第i个节点的外部风险。
其中获取所述第i个节点的外部风险的计算公式如下:
上式中,aggregation(neighbors)表示所述第i个节点的外部风险;f(x)=A*σf(x),σf(x)为激活函数,A为饱和传出风险参数;
激活函数是在人工神经网络的神经元运行的函数,用于将神经元的输入映射到输出端;常用的激活函数有三种,分别是Sigmoid函数、Tanh函数;ReLU函数;本技术方案σg、σf(x)的激活函数优选为ReLU函数,其中,ReLU函数的表达式为f(x)=max(0,x),在输入信号小于0时,输出为0,输入信号大于0时,输出等于输出。
步骤S1051D-1:根据所述第i个节点的外部风险以及所述第i个节点的已知风险值,得到所述第i个节点的未来风险的计算公式如下:
future(xi)=xi+aggregation(neighbors)
xj为第i个节点的已知风险值,aggregation(neighbors)表示第i个节点的外部风险。
本技术方案的风险传导过程避免了基于统计方法的因子挖掘过程,实现了全流程的驱动学习;以企业自身未来一段时间的风险状态作为模型的训练样本,避免因子挖掘的不充分导致模型效果较差的问题;训练后的风险传导模型还支持展示归因;展示归因也称为展示跟踪,用于跟踪每个节点的风险传导关系;具体地,通过本技术方案方法训练后的风险传导模型,可以判断目标企业i是否有外部风险传入;可以找出目标企业i的外部风险来自于哪些风险源头,哪些风险源头是高风险源头j,以及可以展示通过哪些路径(即rij)传导至i企业。
实施例二
图6示意性示出了根据本发明实施例二的基于企业知识图谱的模型训练系统的框图,该训练系统可以被分割成程序模块,一个或者多个程序模块被存储于存储介质中,并由处理器所执行,以完成本发明实施例。本发明实施例所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,以下描述将具体介绍本实施例中各程序模块的功能。
如图6所示,该训练系统130包括获取模块131、提取模块132、筛选模块133、抽取模块134、图谱构建模块135、训练模块136;
获取模块131,用于获取与企业关联的多个实体,以及各个实体的原始信息;所述实体为企业、自然人、专利、产品的任意一种或多种;所述原始信息包括所述各个实体的控股信息、抵押信息、担保信息、业务往来信息的一种或多种。
提取模块132,用于根据各个实体的原始信息,抽取N个连接关系值,其中每个连接关系值对应于具有连接关系的两个实体。
筛选模块133,用于在所述N个连接关系值中筛选出高于预设阀值的M个连接关系值;每个连接关系值包括控股比例、抵押比例、担保比例、业务往来比例的一种,所述M、N均为正整数,且M不大于N。
抽取模块134,用于从所述原始信息中抽取与所述M个连接关系值对应的K个实体、K个实体属性值以及M个实体连接关系;其中K为正整数,所述M个实体连接关系与所述M个连接关系值一一对应;。
图谱构建模块135,用于通过所述K个实体、所述K个实体属性值、以及所述M个实体连接关系,构建企业知识图谱;其中每个实体属性值表示所述每个实体的已知风险值;所述已知风险值与所述企业信用评级呈反比。
训练模块136,用于基于所述企业知识图谱,训练出用于预测企业风险的风险传导模型。
所述抽取模块134还用于分别从不同的数据结构中获取所述各个实体的原始信息;通过图映射或D2R转换或包装器归纳或信息抽取将所述原始信息转换为RDF三元组数据进行存储;所述原始信息包括结构化数据、半结构化数据以及文本数据;所述RDF三元组数据包括K个实体、K个实体属性值以及M个实体连接关系。
所述图谱构建模块135还用于对所述K个实体、所述K个实体属性值以及所述M个实体连接关系进行知识融合,利用知识融合后的数据构建企业知识图谱。
所述训练模块136还用于根据所述企业图谱中的各个节点的已知风险值和所述各个节点之间的关联信息,得到所述各个节点的关联风险值,将所述关联风险值输入到模型中进行训练,以得到用于预测企业风险的风险传导模型。
所述训练模块136还用于获取与第i个节点具有关联关系的各个其他节点的已知风险值;i为所述各个节点之一,i为正整数;获取所述第i个节点与所述各个其他节点之间的关联信息;根据所述各个其他节点的已知风险值以及所述第i个节点与所述各个其他节点之间的关联信息,获取所述第i个节点的外部风险;根据所述第i个节点的外部风险以及所述第i个节点的已知风险值,得到所述第i个节点的关联风险值。
所述训练模块136还用于获取与所述第i个节点关联的各个其他节点的风险传出阈值;根据所述第i个节点与所述各个其他节点之间的关联信息,获取各个其他节点的风险传导权值;根据所述各个其他节点的风险传导阈值和风险传导权值,获取所述第i个节点的外部风险。
实施例三
图7示意性示出了根据本发明实施例三的适于实现病毒扫描与展示方法的计算机设备6的硬件架构示意图。本实施例中,计算机设备6是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。例如,可以是智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)、网关等。如图7所示,计算机设备6至少包括但不限于:可通过系统总线相互通信链接存储器141、处理器142、网络接口143。
存储器141至少包括一种类型的计算机可读存储介质,可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器141可以是计算机设备6的内部存储模块,例如该计算机设备6的硬盘或内存。在另一些实施例中,存储器141也可以是计算机设备6的外部存储设备,例如该计算机设备6上配备的插接式硬盘,智能存储卡(SmartMedia Card,简称为SMC),安全数字(Secure Digital,简称为SD)卡,闪存卡(Flash Card)等。当然,存储器141还可以既包括计算机设备6的内部存储模块也包括其外部存储设备。本实施例中,存储器141通常用于存储安装于计算机设备6的操作系统和各类应用软件,例如病毒扫描与展示方法的程序代码等。此外,存储器141还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器142在一些实施例中可以是中央处理器(Central Processing Unit,简称为CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器142通常用于控制计算机设备6的总体操作,例如执行与计算机设备6进行数据交互或者通信相关的控制和处理等。本实施例中,处理器142用于运行存储器141中存储的程序代码或者处理数据。
网络接口143可包括无线网络接口或有线网络接口,该网络接口143通常用于在计算机设备6与其他计算机设备之间建立通信链接。例如,网络接口143用于通过网络将计算机设备6与外部终端相连,在计算机设备6与外部终端之间的建立数据传输通道和通信链接等。网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(GlobalSystem of Mobile communication,简称为GSM)、宽带码分多址(Wideband Code DivisionMultiple Access,简称为WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
需要指出的是,图7仅示出了具有部件141-143的计算机设备,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
在本实施例中,存储于存储器141中的病毒扫描与展示方法还可以被分割为一个或者多个程序模块,并由处理器(本实施例为处理器142)所执行,以完成本发明实施例。
实施例四
本发明还提供一种计算机可读存储介质,计算机可读存储介质其上存储有计算机程序,计算机程序被处理器执行时实现实施例中的病毒扫描与展示方法的步骤。
本实施例中,计算机可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,计算机可读存储介质可以是计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,计算机可读存储介质也可以是计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(Smart Media Card,简称为SMC),安全数字(Secure Digital,简称为SD)卡,闪存卡(Flash Card)等。当然,计算机可读存储介质还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中,计算机可读存储介质通常用于存储安装于计算机设备的操作系统和各类应用软件,例如实施例中病毒扫描与展示方法的程序代码等。此外,计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的各类数据。
显然,本领域的技术人员应该明白,上述的本发明实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明实施例不限制于任何特定的硬件和软件结合。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于企业知识图谱的模型训练方法,其特征在于,所述方法包括:
获取与企业关联的多个实体,以及各个实体的原始信息;所述实体为企业、自然人、专利、产品的任意一种或多种;所述原始信息包括所述各个实体的控股信息、抵押信息、担保信息、业务往来信息的一种或多种;
根据所述各个实体的原始信息,抽取N个连接关系值,其中每个连接关系值对应于具有连接关系的两个实体;
在所述N个连接关系值中筛选出高于预设阀值的M个连接关系值;每个连接关系值包括控股比例、抵押比例、担保比例、业务往来比例的一种,所述M、N均为正整数,且M不大于N;
从所述原始信息中抽取与所述M个连接关系值对应的K个实体、K个实体属性值以及M个实体连接关系;其中K为正整数,所述M个实体连接关系与所述M个连接关系值一一对应;
通过所述K个实体、所述K个实体属性值、以及所述M个实体连接关系,构建企业知识图谱;其中每个实体属性值表示所述每个实体的已知风险值,所述已知风险值与企业信用评级呈反比;
基于所述企业知识图谱,训练出用于预测企业风险的风险传导模型。
2.根据权利要求1所述的基于企业知识图谱的模型训练方法,其特征在于,所述从所述原始信息中抽取与所述M个连接关系值对应的K个实体、K个实体属性值以及M个实体连接关系的步骤,包括,
分别从不同的数据结构中获取所述各个实体的原始信息;
通过图映射或D2R转换或包装器归纳或信息抽取将所述原始信息转换为RDF三元组数据进行存储;所述原始信息包括结构化数据、半结构化数据以及文本数据;所述RDF三元组数据包括K个实体、K个实体属性值以及M个实体连接关系。
3.根据权利要求1所述的基于企业知识图谱的模型训练方法,其特征在于,所述通过所述K个实体、所述K个实体属性值、以及所述M个实体连接关系,构建企业知识图谱的步骤包括,
对所述K个实体、所述K个实体属性值以及所述M个实体连接关系进行知识融合,利用知识融合后的数据构建企业知识图谱。
4.根据权利要求1所述的基于企业知识图谱的模型训练方法,其特征在于,所述企业知识图谱包括K个节点、K个节点属性及具有关联信息的节点之间的有向边;所述K个节点与所述K个实体一一对应,所述K个节点属性与所述K个实体属性值一一对应;每个所述关联信息对应于M个连接关系值中的一个。
5.根据权利要求4所述的基于企业知识图谱的模型训练方法,其特征在于,所述基于所述企业知识图谱,训练出用于预测企业风险的风险传导模型的步骤包括:
根据所述企业图谱中的各个节点的已知风险值和所述各个节点之间的关联信息,得到所述各个节点的关联风险值;
将所述关联风险值作为训练数据输入到模型中进行训练,以得到用于预测企业风险的风险传导模型。
6.根据权利要求5所述的基于企业知识图谱的模型训练方法,其特征在于,所述根据所述企业图谱中的各个节点的已知风险值和所述各个节点之间的关联信息,得到所述各个节点的关联风险值的步骤,包括:
获取与第i个节点具有关联关系的各个其他节点的已知风险值;i为所述各个节点之一,i为正整数;
获取所述第i个节点与所述各个其他节点之间的关联信息;
根据所述各个其他节点的已知风险值以及所述第i个节点与所述各个其他节点之间的关联信息,获取所述第i个节点的外部风险;
根据所述第i个节点的外部风险以及所述第i个节点的已知风险值,得到所述第i个节点的关联风险值。
7.根据权利要求6所述的基于企业知识图谱的模型训练方法,其特征在于,所述根据所述各个其他节点的已知风险值以及所述第i个节点与所述各个其他节点之间的关联信息,获取所述第i个节点的外部风险的步骤,包括,
获取与所述第i个节点关联的各个其他节点的风险传出阈值;
根据所述第i个节点与所述各个其他节点之间的关联信息,获取各个其他节点的风险传导权值;
根据所述各个其他节点的风险传导阈值和风险传导权值,获取所述第i个节点的外部风险。
8.一种基于企业知识图谱的模型训练系统,其特征在于,包括,
获取模块,用于获取与企业关联的多个实体,以及各个实体的原始信息;所述实体为企业、自然人、专利、产品的任意一种或多种;所述原始信息包括所述各个实体的控股信息、抵押信息、担保信息、业务往来信息的一种或多种;
提取模块,用于根据各个实体的原始信息,抽取N个连接关系值,其中每个连接关系值对应于具有连接关系的两个实体;
筛选模块,用于在所述N个连接关系值中筛选出高于预设阀值的M个连接关系值;每个连接关系值包括控股比例、抵押比例、担保比例、业务往来比例的一种,所述M、N均为正整数,且M不大于N;
抽取模块,用于从所述原始信息中抽取与所述M个连接关系值对应的K个实体、K个实体属性值以及M个实体连接关系;其中K为正整数,所述M个实体连接关系与所述M个连接关系值一一对应;
图谱构建模块,用于通过所述K个实体、所述K个实体属性值、以及所述M个实体连接关系,构建企业知识图谱;其中每个实体属性值表示所述每个实体的已知风险值;所述已知风险值与所述企业信用评级呈反比;
训练模块,用于基于所述企业知识图谱,训练出用于预测企业风险的风险传导模型。
9.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时用于实现权利要求1~7中任一项所述的基于企业知识图谱的模型训练方法的步骤。
10.一种计算机可读存储介质,其特征在于,其内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行权利要求1~7中任一项所述的基于企业知识图谱的模型训练方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110724205.4A CN113449046A (zh) | 2021-06-29 | 2021-06-29 | 基于企业知识图谱的模型训练方法、系统及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110724205.4A CN113449046A (zh) | 2021-06-29 | 2021-06-29 | 基于企业知识图谱的模型训练方法、系统及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113449046A true CN113449046A (zh) | 2021-09-28 |
Family
ID=77813665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110724205.4A Pending CN113449046A (zh) | 2021-06-29 | 2021-06-29 | 基于企业知识图谱的模型训练方法、系统及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113449046A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113988724A (zh) * | 2021-12-28 | 2022-01-28 | 深圳市迪博企业风险管理技术有限公司 | 一种上市公司金融活动知识图谱的风险分析方法 |
CN114202223A (zh) * | 2021-12-16 | 2022-03-18 | 深圳前海微众银行股份有限公司 | 企业信用风险评分方法、装置、设备及存储介质 |
CN114417020A (zh) * | 2022-03-29 | 2022-04-29 | 浙江省标准化研究院(金砖国家标准化(浙江)研究中心 浙江省物品编码中心) | 一种产业链图谱构建系统及方法 |
CN115034520A (zh) * | 2022-08-09 | 2022-09-09 | 太平金融科技服务(上海)有限公司深圳分公司 | 风险预测方法、装置、设备及存储介质 |
CN116187767A (zh) * | 2023-04-26 | 2023-05-30 | 北京网智天元大数据科技有限公司 | 一种基于图注意力机制的企业风险传导预测方法及系统 |
CN117010697A (zh) * | 2023-09-25 | 2023-11-07 | 山东财经大学 | 一种基于人工智能的可视化企业风险评估方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110503236A (zh) * | 2019-07-08 | 2019-11-26 | 中国平安人寿保险股份有限公司 | 基于知识图谱的风险预测方法、装置、设备以及存储介质 |
CN110717824A (zh) * | 2019-10-17 | 2020-01-21 | 北京明略软件系统有限公司 | 基于知识图谱的银行对公客群风险传导测算的方法及装置 |
CN111784508A (zh) * | 2020-07-01 | 2020-10-16 | 北京知因智慧科技有限公司 | 企业风险评估方法、装置及电子设备 |
CN111967976A (zh) * | 2020-08-19 | 2020-11-20 | 中国银行股份有限公司 | 基于知识图谱的风险企业确定方法及装置 |
CN112364182A (zh) * | 2020-12-09 | 2021-02-12 | 交通银行股份有限公司 | 基于图特征的企业风险传导预测方法、设备及存储介质 |
-
2021
- 2021-06-29 CN CN202110724205.4A patent/CN113449046A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110503236A (zh) * | 2019-07-08 | 2019-11-26 | 中国平安人寿保险股份有限公司 | 基于知识图谱的风险预测方法、装置、设备以及存储介质 |
CN110717824A (zh) * | 2019-10-17 | 2020-01-21 | 北京明略软件系统有限公司 | 基于知识图谱的银行对公客群风险传导测算的方法及装置 |
CN111784508A (zh) * | 2020-07-01 | 2020-10-16 | 北京知因智慧科技有限公司 | 企业风险评估方法、装置及电子设备 |
CN111967976A (zh) * | 2020-08-19 | 2020-11-20 | 中国银行股份有限公司 | 基于知识图谱的风险企业确定方法及装置 |
CN112364182A (zh) * | 2020-12-09 | 2021-02-12 | 交通银行股份有限公司 | 基于图特征的企业风险传导预测方法、设备及存储介质 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114202223A (zh) * | 2021-12-16 | 2022-03-18 | 深圳前海微众银行股份有限公司 | 企业信用风险评分方法、装置、设备及存储介质 |
CN113988724A (zh) * | 2021-12-28 | 2022-01-28 | 深圳市迪博企业风险管理技术有限公司 | 一种上市公司金融活动知识图谱的风险分析方法 |
CN114417020A (zh) * | 2022-03-29 | 2022-04-29 | 浙江省标准化研究院(金砖国家标准化(浙江)研究中心 浙江省物品编码中心) | 一种产业链图谱构建系统及方法 |
CN114417020B (zh) * | 2022-03-29 | 2022-09-09 | 浙江省标准化研究院(金砖国家标准化(浙江)研究中心浙江省物品编码中心) | 一种产业链图谱构建系统及方法 |
CN115034520A (zh) * | 2022-08-09 | 2022-09-09 | 太平金融科技服务(上海)有限公司深圳分公司 | 风险预测方法、装置、设备及存储介质 |
CN116187767A (zh) * | 2023-04-26 | 2023-05-30 | 北京网智天元大数据科技有限公司 | 一种基于图注意力机制的企业风险传导预测方法及系统 |
CN117010697A (zh) * | 2023-09-25 | 2023-11-07 | 山东财经大学 | 一种基于人工智能的可视化企业风险评估方法 |
CN117010697B (zh) * | 2023-09-25 | 2023-12-19 | 山东财经大学 | 一种基于人工智能的可视化企业风险评估方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113449046A (zh) | 基于企业知识图谱的模型训练方法、系统及相关装置 | |
CN109409677A (zh) | 企业信用风险评估方法、装置、设备及存储介质 | |
CN111506723B (zh) | 问答响应方法、装置、设备及存储介质 | |
WO2019196552A1 (zh) | 保险欺诈识别的数据处理方法、装置、设备及服务器 | |
CN113705554A (zh) | 图像识别模型的训练方法、装置、设备及存储介质 | |
CN114462616A (zh) | 用于防止敏感数据在线公开的机器学习模型 | |
CN115100670A (zh) | 保单信息处理方法及其系统、电子设备、存储介质 | |
WO2022143431A1 (zh) | 一种反洗钱模型的训练方法及装置 | |
CN113051911A (zh) | 提取敏感词的方法、装置、设备、介质及程序产品 | |
CN110134844A (zh) | 细分领域舆情监控方法、装置、计算机设备及存储介质 | |
CN109933783A (zh) | 一种不良资产经营领域的合同要素化方法 | |
CN112487109A (zh) | 实体关系抽取方法、终端和计算机可读存储介质 | |
WO2023159756A1 (zh) | 价格数据的处理方法和装置、电子设备、存储介质 | |
CN112464670A (zh) | 识别方法、识别模型的训练方法、装置、设备、存储介质 | |
CN114090601A (zh) | 一种数据筛选方法、装置、设备以及存储介质 | |
CN116701584A (zh) | 基于电力用户画像的智能问答方法、装置以及电子设备 | |
CN115936895A (zh) | 基于人工智能的风险评估方法、装置、设备及存储介质 | |
CN114091463B (zh) | 地区工单乱点分析方法、装置、电子设备及可读存储介质 | |
CN114417974A (zh) | 模型训练方法、信息处理方法、装置、电子设备和介质 | |
CN111046934B (zh) | 一种swift报文软条款识别方法及装置 | |
CN113836244A (zh) | 样本获取方法、模型训练方法、关系预测方法及装置 | |
CN113849580A (zh) | 一种主体评级预测方法、装置、电子设备及存储介质 | |
CN113987351A (zh) | 基于人工智能的智能推荐方法、装置、电子设备及介质 | |
CN114912818B (zh) | 资产指标分析方法、装置、设备及存储介质 | |
CN108921226A (zh) | 一种基于低秩表示和流形正则化的零样本分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20240426 |
|
AD01 | Patent right deemed abandoned |