CN110659981A - 企业依存关系识别方法、装置及电子设备 - Google Patents
企业依存关系识别方法、装置及电子设备 Download PDFInfo
- Publication number
- CN110659981A CN110659981A CN201910918079.9A CN201910918079A CN110659981A CN 110659981 A CN110659981 A CN 110659981A CN 201910918079 A CN201910918079 A CN 201910918079A CN 110659981 A CN110659981 A CN 110659981A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- enterprises
- amount
- information
- repayment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Business, Economics & Management (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提出一种企业依存关系识别方法、装置及电子设备,涉及互联网技术领域,在利用获得的企业信息数据构建企业信息图谱后,根据企业信息图谱中包含的多个企业之间的关联关系,获得企业信息图谱中与第一企业存在关联关系的所有企业,从而得到第一企业对应的关联企业集,进而在关联企业集中获得与第一企业存在依存关系的所有企业,相比于现有技术,能够基于多个企业之间的关联关系,自动识别出企业间的依存关系,从而提升企业依存关系的识别效率。
Description
技术领域
本申请涉及互联网技术领域,具体而言,涉及一种企业依存关系识别方法、装置及电子设备。
背景技术
在金融领域,贷款集中度风险是银行面临的主要风险之一,贷款集中度风险是指银行对单一企业的贷款余额与银行净资本的比例过高而导致银行遭受贷款损失的风险。
因此,为了降低贷款集中度风险,银行一般需要排查出关联客户,比如集团客户和经济依存客户,其中经济依存客户是指存在经济依存关系的企事业法人客户,而存在经济依存关系的客户可能会由于一个客户发生财务困难或者违约时导致另一个客户无法及时足额偿还债务。
识别经济依存关系客户能够降低银行的贷款集中度风险。然而,目前一般是依靠人工对不同企业是否在经济层面存在依存关系进行识别,识别效率较低。
发明内容
本申请的目的在于提供一种企业依存关系识别方法、装置及电子设备,能够提升企业依存关系的识别效率。
为了实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请实施例提供一种企业依存关系识别方法,所述方法包括:
利用获得的企业信息数据,建立企业信息图谱;其中,所述企业信息图谱中包含多个企业之间的关联信息;
获得所述企业信息图谱中与第一企业对应的关联企业集;其中,所述关联企业集包括所述企业信息图谱中与所述第一企业存在关联信息的所有企业;
在所述关联企业集中获得与所述第一企业存在依存关系的所有企业。
第二方面,本申请实施例提供一种企业依存关系识别装置,所述装置包括:
处理模块,用于利用获得的企业信息数据,建立企业信息图谱;其中,所述企业信息图谱中包含多个企业之间的关联信息;
所述处理模块还用于,获得所述企业信息图谱中与第一企业对应的关联企业集;其中,所述关联企业集包括所述企业信息图谱中与所述第一企业存在关联信息的所有企业;
识别模块,用于在所述关联企业集中获得与所述第一企业存在依存关系的所有企业。
第三方面,本申请实施例提供一种电子设备,所述电子设备包括存储器,用于存储一个或多个程序;处理器;当所述一个或多个程序被所述处理器执行时,实现上述的企业依存关系识别方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的企业依存关系识别方法。
本申请实施例提供的一种企业依存关系识别方法、装置及电子设备,在利用获得的企业信息数据构建企业信息图谱后,根据企业信息图谱中包含的多个企业之间的关联关系,获得企业信息图谱中与第一企业存在关联关系的所有企业,从而得到第一企业对应的关联企业集,进而在关联企业集中获得与第一企业存在依存关系的所有企业,相比于现有技术,能够基于多个企业之间的关联关系,自动识别出企业间的依存关系,从而提升企业依存关系的识别效率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。
图1示出本申请实施例提供的电子设备的一种示意性结构框图;
图2示出本申请实施例提供的企业依存关系识别方法的一种示意性流程图;
图3示出一种担保网络示意图;
图4示出一种企业交易网络示意图;
图5示出图2中步骤205的子步骤的一种示意性流程图;
图6示出图2中步骤205的子步骤的另一种示意性流程图;
图7示出图2中步骤205的子步骤的再一种示意性流程图;
图8示出图2中步骤203的子步骤的一种示意性流程图;
图9示出本申请实施例提供的企业依存关系识别装置的一种示意性结构框图。
图中:100-电子设备;101-存储器;102-处理器;103-通信接口;300-企业依存关系识别装置;301-处理模块;302-识别模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
如上所述,识别不同企业间的经济依存关系能够降低银行的贷款集中度风险。但由于目前针对不同企业间是否在经济层面存在依存关系,主要还是依靠人为进行识别,不仅使不同企业间在经济层面是否存在依存关系受人为影响因素较大,依存关系识别不够客观,而且需要耗费较大的人力成本,识别效率也较低。
为此,基于上述缺陷,本申请实施例提供的一种可能的实现方式为:利用获得的企业信息数据构建企业信息图谱后,根据企业信息图谱中包含的多个企业之间的关联关系,获得企业信息图谱中与第一企业存在关联关系的所有企业,从而得到第一企业对应的关联企业集,进而在关联企业集中获得与第一企业存在依存关系的所有企业,从而提升企业依存关系的识别效率。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1示出本申请实施例提供的电子设备100的一种示意性结构框图。电子设备100包括存储器101、处理器102和通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
存储器101可用于存储软件程序及模块,如本申请实施例提供的企业依存关系识别装置300对应的程序指令/模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理,以实现本申请实施例提供的企业依存关系识别方法。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除可编程只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可以理解,图1所示的结构仅为示意,电子设备100还可以包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
下面以图1所示的电子设备100作为示意性执行主体,对本申请实施例提供的企业依存关系识别方法进行示例性说明。
请参阅图2,图2示出本申请实施例提供的企业依存关系识别方法的一种示意性流程图,可以包括以下步骤:
步骤201,利用获得的企业信息数据,建立企业信息图谱;
步骤203,获得企业信息图谱中与第一企业对应的关联企业集;
步骤205,在关联企业集中获得与第一企业存在依存关系的所有企业。
在本申请实施例中,可以基于获得的企业信息数据,比如担保关系数据、企业交易数据等,构建企业信息图谱。
比如,首先对于担保关系数据,可以提取担保关系数据中的相关实体以及担保关系作为三元组数据,例如<企业1,企业2,担保>,以企业为实体、担保关系为边构建如图3所示的担保网络。
其次,对于企业交易数据,可以提取企业交易数据中的相关实体、属性以及交易关系,将企业作为实体,交易关系为边,转账金额及交易时间为边的属性构建如图4所示的企业交易网络。
然后,将例如图3所示的担保网络以及图4所示的企业交易网络进行梳理整合,并将梳理的企业间的企业交易数据作为节点属性之一,构建企业信息图谱,该企业信息图谱中包含有多个企业之间的关联关系。
其中,对于构建的客户交易图谱,可以以点和边的形式分别存储在hive中。示例性地,点的存储方式可以通过<顶点,顶点属性集>的方式进行存储,边的存储方式可以通过<顶点1,顶点2,边属性集>的方式进行存储。
接下来,基于所获得的企业信息图谱,获得该企业信息图谱中与第一企业对应的关联企业集,该关联企业集包括企业信息图谱中与第一企业存在关联信息的所有企业。比如结合图3及图4所示,以企业C作为第一企业为例,则企业C对应的关联企业集中包含的企业有:企业A、企业D、企业E、企业G。
由此,根据获得的第一企业对应的关联企业集,在关联企业集中获得与第一企业存在依存关系的所有企业,从而识别出与第一企业存在依存关系的企业。
可见,基于上述设计,本申请实施例提供的一种企业关联关系识别方法,在利用获得的企业信息数据构建企业信息图谱后,根据企业信息图谱中包含的多个企业之间的关联关系,获得企业信息图谱中与第一企业存在关联关系的所有企业,从而得到第一企业对应的关联企业集,进而在关联企业集中获得与第一企业存在依存关系的所有企业,相比于现有技术,能够基于多个企业之间的关联关系,自动识别出企业间的依存关系,从而提升企业依存关系的识别效率。
其中,需要说明的是,在执行S205时,可以从多个维度识别企业间是否存在依存关系。
比如,可以从转账交易信息的维度识别企业间是否存在依存关系。示例性地,请参阅图5,图5示出图2中步骤205的子步骤的一种示意性流程图,作为一种可能的实现方式,步骤205可以包括以下子步骤:
步骤205-1a,获得第一企业转账给关联企业集中第二企业的第一交易金额,以及第二企业转账给第一企业的第二交易金额;
步骤205-1b,获得第一企业对应的主营业务收入额及主营业务成本额;
步骤205-1c,当第二交易金额占主营业务收入额的比例达到第一阈值,或第一交易金额占主营业务成本额的比例达到第二阈值时,确定第一企业与第二企业存在依存关系。
在本申请实施例中,多个企业间的关联信息可以为多个企业之间的转账交易信息,比如图4所示的转账交易关系。
由此,以第一企业对应的关联企业集中的任意之一作为第二企业,以图4中的企业C作为第一企业、企业G作为第二企业为例,在执行步骤205时,首先获得企业C转账给企业G的第一交易金额,以及企业G转账给企业C的第二交易金额,假定第一交易金额记为M,第二交易金额记为N。
然后,获得企业C的主营业务收入额以及主营业务成本额,比如可以通过读取获得的企业信息数据,从而该企业信息数据中读取到企业C的主营业务收入额X,以及主营业务成本额Y。
最后,通过计算第二交易金额N除以主营业务收入额X得到的比值,以及第一交易金额M除以主营业务成本额Y得到的比值,并在判定第一交易金额占主营业务收入额的比例达到第一阈值,或第二交易金额占主营业务成本额的比例达到第二阈值时,确定第一企业与第二企业存在依存关系;比如,以第一阈值取0.5,第二阈值取0.5为例,若满足N/X>0.5,或M/Y>0.5,则电子设备可以确定企业G转账给企业C的第一交易金额对企业C的主营业务收入额存在影响较大,或者是企业C转账给企业G的第二交易金额会对企业C的主营业务成本额存在较大影响,因此电子设备可确定企业C与企业G存在依存关系。
另一方面,还可以从担保信息的维度识别企业间是否存在依存关系。示例性地,请参阅图6,图6示出图2中步骤205的子步骤的另一种示意性流程图,作为另一种可能的实现方式,步骤205还可以包括以下子步骤:
步骤205-2a,获得第一企业为关联企业集中第二企业进行担保的第一担保金额,以及第二企业为第一企业进行担保的第二担保金额;
步骤205-2b,获得第一企业对应的第一净资产额,以及第二企业对应的第二净资产额;
步骤205-2c,当第一担保金额占第一净资产额的比例达到第三阈值,或第二担保金额占第二净资产额的比例达到第四阈值时,确定第一企业与第二企业存在依存关系。
在本申请实施例中,多个企业间的关联信息还可以为多个企业之间的担保信息,比如图3所示的担保关系。
由此,同样以第一企业对应的关联企业集中的任意之一作为第二企业,比如以图3中的企业C作为第一企业、企业D作为第二企业为例,在执行步骤205时,首先获得企业C为企业D进行担保的第一担保金额,以及企业D为企业C进行担保的第二担保金额。
然后,获得企业C对应的第一净资产额,以及企业D对应的第二净资产额。
最后,通过计算第一担保金额除以第一净资产额得到的比值,以及第二担保金额除以第二净资产额得到的比值,并在判定第一担保金额占第一净资产额的比例达到第三阈值,或第二担保金额占第二净资产额的比例达到第四阈值时,电子设备可以确定企业C对企业D的担保金额会对企业C的净资产额产生较大的影响,或者是企业D对企业C的担保金额会对企业D的净资产额产生较大的影响,由此电子设备可以确定第一企业与第二企业存在依存关系。
再一方面,还可以从还款交易信息的维度识别企业间是否存在依存关系。示例性地,请参阅图7,图7示出图2中步骤205的子步骤的再一种示意性流程图,作为再一种可能的实现方式,步骤205还可以包括以下子步骤:
步骤205-3a,获得第一企业对应的第一还款企业集,以及关联企业集中第二企业对应的第二还款企业集;
步骤205-3b,获得存在于第一还款企业集且存在于第二还款企业集的第三企业;
步骤205-3c,判断第一还款状态是否满足第一设定条件;若为是,则执行步骤205-3d;若为否,则执行步骤205-3f;
步骤205-3d,判断第二还款状态是否满足第二设定条件;若为是,则执行步骤205-3e;若为否,则执行步骤205-3f;
步骤205-3e,确定第一企业与第二企业存在依存关系;
步骤205-3f,确定第一企业与第二企业不存在依赖关系。
在本申请实施例中,多个企业间的关联信息还可以为多个企业之间的还款交易信息。
由此,同样以第一企业对应的关联企业集中的任意之一作为第二企业,在执行步骤S205时,首先执行步骤205-3a,获得第一企业对应的第一还款企业集,以及第二企业对应的第二还款企业集。
比如以企业A作为第一企业、企业B作为第二企业为例,假定遍历所有为企业A进行还款的账户,以及遍历所有为企业B进行还款的账户,得到的企业A对应的第一还款企业集为{企业C、企业D、企业E},以及企业B对应的第二还款企业集为{企业C、企业F、企业G}。
然后,执行步骤205-3b,获得存在于第一还款企业集且存在于第二还款企业集的第三企业,即第三企业为第一企业和第二企业共同还款的企业,比如上述示例的企业C。
接下来,以第三企业为第一企业还款的总金额,占第一还款企业集中的所有企业为第一企业还款的总金额的比例达到第五阈值,以及第三企业为第二企业还款的总金额,占第二还款企业集中的所有企业为第二企业还款的总金额的比例达到第五阈值,作为第一设定条件,执行步骤205-3c,判断第一还款状态是否满足第一设定条件;若满足,则执行步骤205-3d,若不满足,则执行步骤205-3f。
比如,按照前述示例,企业C作为第三企业,以0.5作为第五阈值为例,假定第一还款企业集中的所有企业为企业A还款的总金额为E,第二还款企业集中的所有企业为企业B还款的总金额为F;假定企业C为企业A还款的总金额为G,企业C为企业B还款的总金额为H;若G/E>=0.5,且H/F>=0.5,则电子设备确定第一还款状态满足第一设定条件,执行步骤205-3d;反之,若G/E<0.5,或H/F<0.5,则电子设备确定第一还款状态不满足第一设定条件,执行步骤205-3f。
另外,可以将第一还款企业集中除第三企业之外的其他企业为第一企业还款的总金额,占第一还款企业集中的所有企业为第一企业还款的总金额的比例未达到第六阈值,且第二还款企业集中除第三企业之外的其他企业为第二企业还款的总金额,占第二还款企业集中的所有企业为第二企业还款的总金额的比例未达到第六阈值,作为第二设定条件,在步骤205-3c确定第一还款状态满足第一设定条件时,执行步骤205-3d,判断第二还款状态是否满足第二设定条件;若满足,则执行步骤205-3e,若不满足,则执行步骤205-3f。
比如,按照前述示例,假定以0.05作为第六阈值,当G/E>=0.5,且H/F>=0.5时,电子设备计算第一还款企业集中企业D以及企业E各自为企业A还款的总金额,除以第一还款企业集中的所有企业为企业A还款的总金额E得到的比值分别为P1及P2,且计算第二还款企业集中企业F以及企业G各自为企业B还款的总金额,除以第二还款企业集中的所有企业为企业B还款的总金额F得到的比值分别为Q1及Q2;电子设备判断P1、P2是否均小于0.05,且Q1、Q2是否均小于0.05;若P1、P2均小于0.05,且Q1、Q2均小于0.05,则电子设备确定第二还款状态满足第二设定条件,电子设备确定企业A与企业B存在依存关系;若P1、P2、Q1、Q2中至少有一个不小于0.05,则电子设备确定第二还款状态不满足第二设定条件,即电子设备确定企业A与企业B不存在依存关系。
另外,为实现步骤203,请参阅图8,图8示出图2中步骤203的子步骤的一种示意性流程图,作为一种可能的实现方式,步骤203可以包括以下子步骤:
步骤203-1,利用Spark Graphx加载企业信息图谱;
步骤203-2,通过aggregateMessages算子获得企业信息图谱中与第一企业存在关联信息的所有企业;
步骤203-3,将获得的与第一企业存在关联信息的所有企业作为关联企业集。
在执行步骤203时,可以以Spark Graphx作为图计算引擎,加载企业信息图谱;然后aggregateMessages算子遍历企业信息图谱中的所有企业,获得与第一企业存在关联信息的所有企业,进而将获得的与第一企业存在关联关系的所有企业作为第一企业对应的关联企业集。
其中,需要说明的是,步骤203-2中与第一企业存在关联信息的所有企业,是指与第一企业存在直接关联信息的所有企业,比如在如图3所示的示意图中,以企业A作为第一企业为例,此时与企业A存在关联关系的企业包括企业B、企业C及企业D;又比如,在图4所示的示意图中,同样以企业A为例,假设存在一种情况,企业A转账给企业D的金额中的至少部分被企业D转账给了企业G,但在执行步骤203-2时,只将企业D作为与企业A存在关联信息的企业。
另外,在实现步骤205时,可以利用Spark Graphx中的Pregel遍历关联企业集中包含的所有企业,并识别出与第一企业存在依存关系的所有企业,从而有效的解决在遍历关联企业集中包含的所有企业时,大量的迭代计算造成的计算问题。
并且,基于与上述企业依存关系识别方法相同的发明构思,请参阅图9,图9示出本申请实施例提供的企业依存关系识别装置300的一种示意性结构框图,该企业依存关系识别装置300可以包括处理模块301及识别模块302。其中:
处理模块301用于,利用获得的企业信息数据,建立企业信息图谱;其中,企业信息图谱中包含多个企业之间的关联信息;
处理模块301还用于,获得企业信息图谱中与第一企业对应的关联企业集;其中,关联企业集包括企业信息图谱中与第一企业存在关联信息的所有企业;
识别模块302用于,在关联企业集中获得与第一企业存在依存关系的所有企业。
可选地,作为一种可能的实现方式,关联信息为多个企业之间的转账交易信息;
识别模块302在关联企业集中获得与第一企业存在依存关系的所有企业时,具体用于:
获得第一企业转账给关联企业集中第二企业的第一交易金额,以及第二企业转账给第一企业的第二交易金额;其中,第二企业为关联企业集中的任意之一;
获得第一企业对应的主营业务收入额及主营业务成本额;
当第二交易金额占主营业务收入额的比例达到第一阈值,或第一交易金额占主营业务成本额的比例达到第二阈值时,确定第一企业与第二企业存在依存关系。
可选地,作为一种可能的实现方式,关联信息为多个企业之间的担保信息;
识别模块302在关联企业集中获得与第一企业存在依存关系的所有企业时,具体用于:
获得第一企业为关联企业集中第二企业进行担保的第一担保金额,以及第二企业为第一企业进行担保的第二担保金额;其中,第二企业为关联企业集中的任意之一;
获得第一企业对应的第一净资产额,以及第二企业对应的第二净资产额;
当第一担保金额占第一净资产额的比例达到第三阈值,或第二担保金额占第二净资产额的比例达到第四阈值时,确定第一企业与第二企业存在依存关系。
可选地,作为一种可能的实现方式,关联信息为多个企业之间的还款交易信息;
识别模块302在关联企业集中获得与第一企业存在依存关系的所有企业时,具体用于:
获得第一企业对应的第一还款企业集,以及关联企业集中第二企业对应的第二还款企业集;其中,第二企业为关联企业集中的任意之一;
获得存在于第一还款企业集且存在于第二还款企业集的第三企业;
当第一还款状态满足第一设定条件时,判断第二还款状态是否满足第二设定条件;
当第二还款状态满足第二设定条件时,确定第一企业与第二企业存在依存关系;
其中,第一设定条件为第三企业为第一企业还款的总金额,占第一还款企业集中的所有企业为第一企业还款的总金额的比例达到第五阈值,以及第三企业为第二企业还款的总金额,占第二还款企业集中的所有企业为第二企业还款的总金额的比例达到第五阈值;
第二设定条件为第一还款企业集中除第三企业之外的其他企业为第一企业还款的总金额,占第一还款企业集中的所有企业为第一企业还款的总金额的比例未达到第六阈值,且第二还款企业集中除第三企业之外的其他企业为第二企业还款的总金额,占第二还款企业集中的所有企业为第二企业还款的总金额的比例未达到第六阈值。
可选地,作为一种可能的实现方式,处理模块301在获得企业信息图谱中与第一企业对应的关联企业集时,具体用于:
利用Spark Graphx加载企业信息图谱;
通过aggregateMessages算子获得企业信息图谱中与第一企业存在关联信息的所有企业;
将获得的与第一企业存在关联信息的所有企业作为关联企业集;
识别模块302在关联企业集中获得与第一企业存在依存关系的所有企业时,具体用于:
利用Spark Graphx中的Pregel遍历关联企业集中包含的所有企业,并识别出与第一企业存在依存关系的所有企业。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。
也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。
也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,本申请实施例提供的一种企业依存关系识别方法、装置及电子设备,在利用获得的企业信息数据构建企业信息图谱后,根据企业信息图谱中包含的多个企业之间的关联关系,获得企业信息图谱中与第一企业存在关联关系的所有企业,从而得到第一企业对应的关联企业集,进而在关联企业集中获得与第一企业存在依存关系的所有企业,相比于现有技术,能够基于多个企业之间的关联关系,自动识别出企业间的依存关系,从而提升企业依存关系的识别效率。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (10)
1.一种企业依存关系识别方法,其特征在于,所述方法包括:
利用获得的企业信息数据,建立企业信息图谱;其中,所述企业信息图谱中包含多个企业之间的关联信息;
获得所述企业信息图谱中与第一企业对应的关联企业集;其中,所述关联企业集包括所述企业信息图谱中与所述第一企业存在关联信息的所有企业;
在所述关联企业集中获得与所述第一企业存在依存关系的所有企业。
2.如权利要求1所述的方法,其特征在于,所述关联信息为多个企业之间的转账交易信息;
在所述关联企业集中获得与所述第一企业存在依存关系的所有企业的步骤,包括:
获得所述第一企业转账给所述关联企业集中第二企业的第一交易金额,以及所述第二企业转账给所述第一企业的第二交易金额;其中,所述第二企业为所述关联企业集中的任意之一;
获得所述第一企业对应的主营业务收入额及主营业务成本额;
当所述第二交易金额占所述主营业务收入额的比例达到第一阈值,或所述第一交易金额占所述主营业务成本额的比例达到第二阈值时,确定所述第一企业与所述第二企业存在依存关系。
3.如权利要求1所述的方法,其特征在于,所述关联信息为多个企业之间的担保信息;
在所述关联企业集中获得与所述第一企业存在依存关系的所有企业的步骤,包括:
获得所述第一企业为所述关联企业集中第二企业进行担保的第一担保金额,以及所述第二企业为所述第一企业进行担保的第二担保金额;其中,所述第二企业为所述关联企业集中的任意之一;
获得所述第一企业对应的第一净资产额,以及所述第二企业对应的第二净资产额;
当所述第一担保金额占所述第一净资产额的比例达到第三阈值,或所述第二担保金额占所述第二净资产额的比例达到第四阈值时,确定所述第一企业与所述第二企业存在依存关系。
4.如权利要求1所述的方法,其特征在于,所述关联信息为多个企业之间的还款交易信息;
在所述关联企业集中获得与所述第一企业存在依存关系的所有企业的步骤,包括:
获得所述第一企业对应的第一还款企业集,以及所述关联企业集中第二企业对应的第二还款企业集;其中,所述第二企业为所述关联企业集中的任意之一;
获得存在于所述第一还款企业集且存在于所述第二还款企业集的第三企业;
当第一还款状态满足第一设定条件时,判断第二还款状态是否满足第二设定条件;
当所述第二还款状态满足所述第二设定条件时,确定所述第一企业与所述第二企业存在依存关系;
其中,所述第一设定条件为所述第三企业为所述第一企业还款的总金额,占所述第一还款企业集中的所有企业为所述第一企业还款的总金额的比例达到第五阈值,以及所述第三企业为所述第二企业还款的总金额,占所述第二还款企业集中的所有企业为所述第二企业还款的总金额的比例达到所述第五阈值;
所述第二设定条件为所述第一还款企业集中除所述第三企业之外的其他企业为所述第一企业还款的总金额,占所述第一还款企业集中的所有企业为所述第一企业还款的总金额的比例未达到第六阈值,且所述第二还款企业集中除所述第三企业之外的其他企业为所述第二企业还款的总金额,占所述第二还款企业集中的所有企业为所述第二企业还款的总金额的比例未达到所述第六阈值。
5.如权利要求1所述的方法,其特征在于,获得所述企业信息图谱中与第一企业对应的关联企业集的步骤,包括:
利用Spark Graphx加载所述企业信息图谱;
通过aggregateMessages算子获得所述企业信息图谱中与所述第一企业存在关联信息的所有企业;
将获得的与所述第一企业存在关联信息的所有企业作为所述关联企业集;
在所述关联企业集中获得与所述第一企业存在依存关系的所有企业的步骤,包括:
利用Spark Graphx中的Pregel遍历所述关联企业集中包含的所有企业,并识别出与所述第一企业存在依存关系的所有企业。
6.一种企业依存关系识别装置,其特征在于,所述装置包括:
处理模块,用于利用获得的企业信息数据,建立企业信息图谱;其中,所述企业信息图谱中包含多个企业之间的关联信息;
所述处理模块还用于,获得所述企业信息图谱中与第一企业对应的关联企业集;其中,所述关联企业集包括所述企业信息图谱中与所述第一企业存在关联信息的所有企业;
识别模块,用于在所述关联企业集中获得与所述第一企业存在依存关系的所有企业。
7.如权利要求6所述的装置,其特征在于,所述关联信息为多个企业之间的转账交易信息;
所述识别模块在所述关联企业集中获得与所述第一企业存在依存关系的所有企业时,具体用于:
获得所述第一企业转账给所述关联企业集中第二企业的第一交易金额,以及所述第二企业转账给所述第一企业的第二交易金额;其中,所述第二企业为所述关联企业集中的任意之一;
获得所述第一企业对应的主营业务收入额及主营业务成本额;
当所述第二交易金额占所述主营业务收入额的比例达到第一阈值,或所述第一交易金额占所述主营业务成本额的比例达到第二阈值时,确定所述第一企业与所述第二企业存在依存关系。
8.如权利要求6所述的装置,其特征在于,所述关联信息为多个企业之间的担保信息;
所述识别模块在所述关联企业集中获得与所述第一企业存在依存关系的所有企业时,具体用于:
获得所述第一企业为所述关联企业集中第二企业进行担保的第一担保金额,以及所述第二企业为所述第一企业进行担保的第二担保金额;其中,所述第二企业为所述关联企业集中的任意之一;
获得所述第一企业对应的第一净资产额,以及所述第二企业对应的第二净资产额;
当所述第一担保金额占所述第一净资产额的比例达到第三阈值,或所述第二担保金额占所述第二净资产额的比例达到第四阈值时,确定所述第一企业与所述第二企业存在依存关系。
9.如权利要求6所述的装置,其特征在于,所述关联信息为多个企业之间的还款交易信息;
所述识别模块在所述关联企业集中获得与所述第一企业存在依存关系的所有企业时,具体用于:
获得所述第一企业对应的第一还款企业集,以及所述关联企业集中第二企业对应的第二还款企业集;其中,所述第二企业为所述关联企业集中的任意之一;
获得存在于所述第一还款企业集且存在于所述第二还款企业集的第三企业;
当第一还款状态满足第一设定条件时,判断第二还款状态是否满足第二设定条件;
当所述第二还款状态满足所述第二设定条件时,确定所述第一企业与所述第二企业存在依存关系;
其中,所述第一设定条件为所述第三企业为所述第一企业还款的总金额,占所述第一还款企业集中的所有企业为所述第一企业还款的总金额的比例达到第五阈值,以及所述第三企业为所述第二企业还款的总金额,占所述第二还款企业集中的所有企业为所述第二企业还款的总金额的比例达到所述第五阈值;
所述第二设定条件为所述第一还款企业集中除所述第三企业之外的其他企业为所述第一企业还款的总金额,占所述第一还款企业集中的所有企业为所述第一企业还款的总金额的比例未达到第六阈值,且所述第二还款企业集中除所述第三企业之外的其他企业为所述第二企业还款的总金额,占所述第二还款企业集中的所有企业为所述第二企业还款的总金额的比例未达到所述第六阈值。
10.一种电子设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1-5中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910918079.9A CN110659981A (zh) | 2019-09-26 | 2019-09-26 | 企业依存关系识别方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910918079.9A CN110659981A (zh) | 2019-09-26 | 2019-09-26 | 企业依存关系识别方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110659981A true CN110659981A (zh) | 2020-01-07 |
Family
ID=69039359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910918079.9A Pending CN110659981A (zh) | 2019-09-26 | 2019-09-26 | 企业依存关系识别方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110659981A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111784495A (zh) * | 2020-06-04 | 2020-10-16 | 江苏常熟农村商业银行股份有限公司 | 担保圈识别方法、装置、计算机设备和存储介质 |
CN112270195A (zh) * | 2020-11-25 | 2021-01-26 | 上海水滴征信服务有限公司 | 确定企业关联关系、重名对象判定 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106779996A (zh) * | 2016-12-08 | 2017-05-31 | 深圳微众税银信息服务有限公司 | 一种供应链金融中企业数据挖掘方法及系统 |
CN107563885A (zh) * | 2017-08-08 | 2018-01-09 | 阿里巴巴集团控股有限公司 | 一种套现识别方法和装置 |
CN108596439A (zh) * | 2018-03-29 | 2018-09-28 | 北京中兴通网络科技股份有限公司 | 一种基于知识图谱的企业风险预测方法及系统 |
CN109583620A (zh) * | 2018-10-11 | 2019-04-05 | 平安科技(深圳)有限公司 | 企业潜在风险预警方法、装置、计算机设备和存储介质 |
CN109657066A (zh) * | 2018-11-19 | 2019-04-19 | 平安科技(深圳)有限公司 | 基于多视角的知识图谱构建方法、装置和计算机设备 |
CN110019540A (zh) * | 2017-07-20 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 企业图谱的实现方法、展示方法及装置、设备 |
CN110175909A (zh) * | 2019-05-07 | 2019-08-27 | 交通银行股份有限公司 | 一种企业关联关系确定方法及系统 |
-
2019
- 2019-09-26 CN CN201910918079.9A patent/CN110659981A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106779996A (zh) * | 2016-12-08 | 2017-05-31 | 深圳微众税银信息服务有限公司 | 一种供应链金融中企业数据挖掘方法及系统 |
CN110019540A (zh) * | 2017-07-20 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 企业图谱的实现方法、展示方法及装置、设备 |
CN107563885A (zh) * | 2017-08-08 | 2018-01-09 | 阿里巴巴集团控股有限公司 | 一种套现识别方法和装置 |
CN108596439A (zh) * | 2018-03-29 | 2018-09-28 | 北京中兴通网络科技股份有限公司 | 一种基于知识图谱的企业风险预测方法及系统 |
CN109583620A (zh) * | 2018-10-11 | 2019-04-05 | 平安科技(深圳)有限公司 | 企业潜在风险预警方法、装置、计算机设备和存储介质 |
CN109657066A (zh) * | 2018-11-19 | 2019-04-19 | 平安科技(深圳)有限公司 | 基于多视角的知识图谱构建方法、装置和计算机设备 |
CN110175909A (zh) * | 2019-05-07 | 2019-08-27 | 交通银行股份有限公司 | 一种企业关联关系确定方法及系统 |
Non-Patent Citations (1)
Title |
---|
樊继慧: "基于Spark GraphX的企业信息族谱分析", 《电脑知识与技术》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111784495A (zh) * | 2020-06-04 | 2020-10-16 | 江苏常熟农村商业银行股份有限公司 | 担保圈识别方法、装置、计算机设备和存储介质 |
CN111784495B (zh) * | 2020-06-04 | 2021-05-04 | 江苏常熟农村商业银行股份有限公司 | 担保圈识别方法、装置、计算机设备和存储介质 |
CN112270195A (zh) * | 2020-11-25 | 2021-01-26 | 上海水滴征信服务有限公司 | 确定企业关联关系、重名对象判定 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109658478B (zh) | 一种提供企业画像的方法及系统 | |
CN108376364B (zh) | 一种支付系统对账的方法、设备及终端设备 | |
US20160148321A1 (en) | Simplified screening for predicting errors in tax returns | |
US20180173790A1 (en) | Modifying data structures to indicate derived relationships among entity data objects | |
CN111915155A (zh) | 小微企业风险等级识别方法、装置及计算机设备 | |
CN107798592B (zh) | 计算佣金的方法及设备 | |
CN110503564B (zh) | 基于大数据的保全案件处理方法、系统、设备及存储介质 | |
CN110659981A (zh) | 企业依存关系识别方法、装置及电子设备 | |
KR100974342B1 (ko) | 전문단체의 추천을 이용한 기업신용평가 시스템 및 그 방법 | |
CN115526700A (zh) | 风险的预测方法、装置及电子设备 | |
CN110689426A (zh) | 一种风险识别方法、装置、电子设备及存储介质 | |
US10157207B2 (en) | System for supplemental data reporting utilizing data record properties | |
US20220198556A1 (en) | Inventory affordability and policy distance calculator | |
US7716092B2 (en) | Use of separate rib ledgers in a computerized enterprise resource planning system | |
CN112632197B (zh) | 基于知识图谱的业务关系处理方法及装置 | |
CN110827137A (zh) | 信用评价方法和装置 | |
US10235719B2 (en) | Centralized GAAP approach for multidimensional accounting to reduce data volume and data reconciliation processing costs | |
US20170148098A1 (en) | Data creating, sourcing, and agregating real estate tool | |
US20170139924A1 (en) | System and user interface for configuring data records and supplemental data reporting | |
JP2012238073A (ja) | 債権買取査定支援システム及び債権買取査定支援方法 | |
CN111932131A (zh) | 业务数据处理方法及装置 | |
US10482483B2 (en) | System for aggregating data record attributes for supplemental data reporting | |
CN115994194B (zh) | 政务大数据的数据质量检查方法、系统、设备及介质 | |
CN113487415B (zh) | 一种基于信息数据的信用评估与授信申请系统及方法 | |
CN110659841B (zh) | 风险资产筛选方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200107 |
|
RJ01 | Rejection of invention patent application after publication |