CN110609737A - 关联数据查询方法、装置、计算机设备和存储介质 - Google Patents

关联数据查询方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110609737A
CN110609737A CN201910748898.3A CN201910748898A CN110609737A CN 110609737 A CN110609737 A CN 110609737A CN 201910748898 A CN201910748898 A CN 201910748898A CN 110609737 A CN110609737 A CN 110609737A
Authority
CN
China
Prior art keywords
enterprise
target
identifier
pedigree
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910748898.3A
Other languages
English (en)
Other versions
CN110609737B (zh
Inventor
魏晓茹
陈烨
李泓格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910748898.3A priority Critical patent/CN110609737B/zh
Publication of CN110609737A publication Critical patent/CN110609737A/zh
Application granted granted Critical
Publication of CN110609737B publication Critical patent/CN110609737B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4812Task transfer initiation or dispatching by interrupt, e.g. masked
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请涉及知识图谱技术领域,提供了一种关联数据查询方法、装置、计算机设备和存储介质。其中的方法包括:接收终端发送的查询请求,所述查询请求中携带待查询企业标识及查询类型标识,所述待查询企业标识为待查询企业对应的标识;调用预设的拦截器对所述查询请求进行拦截,对拦截后的所述查询请求进行解析以获取所述待查询企业标识及所述查询类型标识;从预设的线程池中调用与所述查询类型标识对应的目标线程;所述线程池中包括多个线程,不同的查询类型标识在所述线程池中对应不同的线程;通过所述目标线程获取所述待查询企业标识对应的目标数据,将所述目标数据发送至所述终端进行可视化。采用本申请的方法可以提高服务器的整体响应效率。

Description

关联数据查询方法、装置、计算机设备和存储介质
技术领域
本申请涉及知识图谱技术领域,特别是涉及一种关联数据查询方法、装置、计算机设备和存储介质。
背景技术
随着互联网的飞速发展,知识图谱数据也在不断地积累。用户经常需要从海量的知识图谱数据库中进行查询以获取想要的图谱数据。
通常情况下,根据不同的业务场景需要查询不同的数据,例如,在有些场景下需要查询比较全面的数据,而在有些场景下需要针对性查询数据。传统技术中,服务器通常是对所有的查询请求统一进行查询,这样一来,当某类业务场景的查询请求再短时间内迸发时,服务器对其他类型业务场景的查询请求的响应效率也会受到影响,导致服务器的整体响应效率低下。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高服务器的整体响应效率的关联数据查询方法、装置、计算机设备和存储介质。
一种关联数据查询方法,所述方法包括:接收终端发送的查询请求,所述查询请求中携带待查询企业标识及查询类型标识,所述待查询企业标识为待查询企业对应的标识;调用预设的拦截器对所述查询请求进行拦截,对拦截后的所述查询请求进行解析以获取所述待查询企业标识及所述查询类型标识;从预设的线程池中调用与所述查询类型标识对应的目标线程;所述线程池中包括多个线程,不同的查询类型标识在所述线程池中对应不同的线程;通过所述目标线程获取所述待查询企业标识对应的目标数据,将所述目标数据发送至所述终端进行可视化。
在其中一个实施例中,当所述查询类型标识为预设标识时,所述通过所述目标线程获取所述待查询企业标识对应的目标数据,包括:根据所述待查询企业标识获取对应的企业关联路径;确定每一条企业关联路径对应的最高级别企业,并计算各个最高级别企业对应的关联度,根据所述关联度确定所述待查询企业标识对应的第一目标核心企业;查询所述第一目标核心企业对应的所有关联企业,根据所述第一目标核心企业及其关联企业确定所述待查询企业标识对应的目标谱系;将所述目标谱系确定为所述待查询企业标识对应的目标数据。
在其中一个实施例中,所述根据所述第一目标核心企业及其关联企业确定所述待查询企业标识对应的目标谱系,包括:从所述关联企业中确定所述第一目标核心企业对应的控制企业;根据所述第一目标核心企业及所述控制企业确定所述目标谱系。
在其中一个实施例中,所述从所述关联企业中确定所述第一目标核心企业对应的控制企业,包括:根据所述第一目标核心企业及其关联企业确定初始谱系,并依次将各个关联企业确定为目标判断企业;当所述初始谱系中包含所述目标判断企业对应的全部预设类型关联对象时,判定所述目标判断企业为所述第一目标核心企业对应的控制企业;当所述初始谱系中未包含所述目标判断企业对应的全部预设类型关联对象时,计算所述初始谱系中与所述目标判断企业对应的所有预设类型关联对象的关联度总和;当所述关联度总和超过预设阈值时,判定所述目标判断企业为所述第一目标核心企业对应的控制企业;当所述关联度总和不超过预设阈值时,确定所述目标判断企业对应的第二核心企业;当所述第一目标核心企业与所述第二核心企业相同时,判定所述目标判断企业为所述第一目标核心企业对应的控制企业;当所述第一目标核心企业与所述第二核心企业不相同时,判定所述目标判断企业不是所述第一目标核心企业对应的控制企业。
在其中一个实施例中,当最高级别企业中存在多个关联度相同的最高关联度企业或者存在多个关联度差值小于预设阈值的最高关联度企业时,所述根据所述关联度确定所述待查询企业标识对应的第一目标核心企业,包括:分别将各个最高关联度企业确定为初始核心企业,并分别确定每一个所述初始核心企业对应的目标谱系;当任意一个初始核心企业对应的目标谱系满足预设条件时,将满足所述预设条件的目标谱系对应的初始核心企业判定为第一目标核心企业;当所有初始核心企业对应的目标谱系均不满足预设条件时,分别计算所述待查询企业与每一个初始核心企业对应的目标谱系的相似度;根据所述相似度确定所述第一目标核心企业;其中,预设条件为谱系中与所述待查询企业对应的所有预设类型关联对象的关联度总和超过预设阈值。
在其中一个实施例中,在所述将所述目标数据发送至所述终端进行可视化之前,还包括:获取预设的标签类型集合及各个标签类型对应的标签确定规则;分别判断所述目标谱系是否满足各个标签类型对应的标签确定规则;若满足,则根据所述标签确定规则确定所述目标谱系对应的目标标签;所述将所述目标数据发送至所述终端进行可视化,包括:将所述目标数据及所述目标标签发送至所述终端进行可视化。
在其中一个实施例中,在所述通过所述目标线程获取所述待查询企业标识对应的目标数据之前,包括:获取当前企业集合;依次将所述企业集合中的每个企业确定为目标企业,并获取所述目标企业的企业关联路径;确定所述目标企业的每一条企业关联路径对应的最高级别企业,并计算各个最高级别企业对应的关联度,根据所述关联度确定所述目标企业对应的目标核心企业;分别根据核心企业相同的目标企业确定谱系,得到所述企业集合对应的多个谱系;通过所述目标线程获取所述待查询企业标识对应的目标数据,包括:依次遍历各个谱系并判断各个谱系中是否包含所述待查询企业;将包含所述待查询企业的谱系确定为目标数据。
一种关联数据查询装置,所述装置包括:查询请求接收模块,用于接收终端发送的查询请求,所述查询请求中携带待查询企业标识及查询类型标识;查询请求拦截模块,用于调用预设的拦截器对所述查询请求进行拦截,对拦截后的所述查询请求进行解析以获取所述待查询企业标识及查询类型标识;目标线程调用模块,用于从预设的线程池中调用与所述查询类型标识对应的目标线程;所述线程池中包括多个线程,不同的查询类型标识在所述线程池中对应不同的线程;目标数据获取模块,用于通过所述目标线程获取所述待查询企业标识对应的目标数据,将所述目标数据发送至所述终端进行可视化。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任意实施例所述的关联数据查询方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意实施例所述的关联数据查询方法的步骤。
上述关联数据查询方法、装置、计算机设备和存储介质,通过设置线程池,并为不同的查询类型分配不同的线程,当接受到查询指令时,首先对查询指令进行拦截,对拦截后的查询指令进行解析以确定查询指令对应的查询类型,然后从线程池中调用该查询类型对应的目标线程去获取目标数据,由于对不同的查询类型能够调用不同的线程,各个线程之间相互独立运行,避免了当某个查询类型的查询请求在短时间内迸发时造成其他类型的查询请求无法及时响应的情况,提高了服务器的整体响应效率。
附图说明
图1为一个实施例中关联数据查询方法的应用场景图;
图2为一个实施例中关联数据查询方法的流程示意图;
图3为一个实施例中步骤S208的流程示意图;
图4为一个实施例中企业关联路径的举例示意图;
图5为一个实施例中确定控制企业的流程示意图;
图6为一个实施例中确定第一核心企业的流程示意图;
图7为另一个实施例中关联数据查询方法的流程示意图;
图8为一个实施例中关联数据查询装置的结构框图;
图9为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的关联数据查询方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。终端102可以向服务器发送查询请求,并在查询请求中携带待查询企业标识及查询类型标识,服务器在接收到查询请求时,调用预设的拦截器对查询请求进行拦截,对拦截后的查询请求进行解析以获取待查询企业标识及查询类型标识,从预设的线程池中调用与查询类型标识对应的目标线程,通过目标线程获取待查询企业标识对应的目标数据,将目标数据发送至终端,终端对目标数据进行可视化。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种关联数据查询方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S202,接收终端发送的查询请求,查询请求中携带待查询企业标识及查询类型标识。
其中,待查询企业标识用于唯一标识待查询企业,可以是企业的名称,或者是企业的统一信用代码。待查询企业指的是需要进行关联数据查询的企业。查询类型标识用于标识不同的查询类型,在不同的业务场景下对应不同的查询类型。在一个实施例中,查询类型包括查询给定企业的全部关联数据及其查询给定企业的谱系数据。
具体地,终端界面可显示各个查询类型对应的查询按钮并显示查询输入框,当用户需要查询某个企业对应的企业关联数据时,可通过该输入框输入待查询企业的名称或者统一信用代码,并点击查询类型对应的查询按钮,触发查询指令,终端根据该查询指令向服务器发送查询请求,并在查询请求中携带待查询企业标识及查询类型标识。
步骤S204,调用预设的拦截器对查询请求进行拦截,对拦截后的查询请求进行解析以获取待查询企业标识及查询类型标识。
步骤S206,从预设的线程池中调用与查询类型标识对应的目标线程;线程池中包括多个线程,不同的查询类型标识在线程池中对应不同的线程。
在一个实施例中,线程池可以指的是由多个线程组成的线程集合。
步骤S208,通过目标线程获取待查询企业标识对应的目标数据,将目标数据发送至终端进行可视化。
上述关联数据查询方法,通过设置线程池,并为不同的查询类型分配不同的线程,当接受到查询指令时,首先对查询指令进行拦截,对拦截后的查询指令进行解析以确定查询指令对应的查询类型,然后从线程池中调用该查询类型对应的目标线程去获取目标数据,由于对不同的查询类型能够调用不同的线程,各个线程之间相互独立运行,避免了当某个查询类型的查询请求在短时间内迸发时造成其他类型的查询请求无法及时响应的情况,提高了服务器的整体响应效率。
在一个实施例中,如图3所示,当查询类型标识为预设标识时,通过目标线程获取待查询对象标识对应的目标数据,包括:
步骤302,根据待查询企业标识获取对应的企业关联路径。
其中,预设标识指的是查询类型为查询谱系数据时对应的查询类型标识。企业关联路径指的是待查询企业与其对应的所有预设类型关联企业按照预设关联关系走向形成的路径,其中,关联企业包括直接关联企业及间接关联企业。在一个实施例中,预设类型关联企业指的是与待查询企业之间有预设关联关系的企业,其中,预设关联关系指的是投资关系。举个例子,如图4所示,待查询企业A的所有预设类型关联企业包括有直接关联企业B、企业C,间接关联企业D、企业E,则待查询企业A对应的企业关联路径包括A-B-D、A-B-E、A-C。
在一些实施例中,服务器可以通过爬虫算法获取待查询企业对应的企业数据,例如工商信息披露、企业年报以及上市公告等,通过这些数据构建待查询企业的企业关联图谱,然后采用股权穿透算法从生成的企业关联图谱中查找待查询企业的所有股东企业,并根据持股关系走向得到股权分布路径。
在另一些实施例中,可以预先构建一个企业关联图谱数据库,通过爬虫算法收集各个企业的相关数据,生成各个企业对应的关联图谱,然后以图结构数据或者三元组的形式存储在企业关联图谱数据库中,当接收到企业的查询请求时,服务器可直接通过股权穿透算法在企业关联图谱数据库中查询待查询企业的所有股东企业,并根据持股关系走向得到股权分布路径。
步骤S304,确定每一条企业关联路径对应的最高级别企业,并计算各个最高级别企业对应的关联度,根据关联度确定待查询企业标识对应的第一目标核心企业。
其中,最高级别企业指的是每一条企业关联路径中层级最高的企业,例如图4中,企业A对应的最高级别企业包括企业D、E、C。具体地,服务器在确定好了每一条企业关联路径对应的最高级别企业后,需要计算企业关联路径中各个关联企业对应的关联度,在计算最高级别企业的关联度时,可以依次将每一层关联关系对应的关联度相乘,例如图3中最高级别企业D的关联度为=企业D对企业B的关联度*企业B对企业A的关联度。其中,关联度用于表征持股比例的大小。
进一步,服务器比较各个最高级别企业对应的关联度,根据比较结果确定待查询企业对应的目标核心企业。在一个实施例中,当只有一个关联度最高的最高级别企业时,将该关联度最高的最高级别企业确定为第一目标核心企业。
步骤S306,查询第一目标核心企业对应的所有关联企业,根据第一目标核心企业及其关联企业确定待查询企业标识对应的目标谱系。
其中,核心企业对应的关联企业指的是被该核心企业直接或间接投资,或者和该核心企业可以通过自然人逐层关联在一起的企业;谱系指的是以核心企业、核心企业对应的控制企业、核心企业对应的企业人员、控制企业对应的企业人员为节点的企业关联图谱,其中,核心企业对应的控制企业指的是被核心企业实际控制的企业,例如,淘宝为阿里巴巴的控制企业。企业人员指的是在企业中担任重要职位且承担企业运营责任的人员,可以是企业的董监高,也可以是企业的法定代表人,还可以是股东。
在一个实施例中,服务器可以从预先建立的企业关联图谱数据库中查询核心企业对应的所有关联企业,然后根据核心企业及其关联企业确定待查询企业对应的目标谱系。
在一个实施例中,服务器可以直接将核心企业、所有关联企业、各个关联企业对应的企业人员以及核心企业对应的企业人员确定为节点得到待查询企业对应的目标谱系。
在另一个实施例中,由于将核心企业及其关联企业直接确定为目标谱系时,得到的目标谱系中可能存在某一些企业还与其他谱系有关联的情况,这种情况下,得到目标谱系可能并不准确,因为这些与其他谱系有关联的企业有可能是属于其他谱系的,因此,为进一步提高目标谱系的准确性,服务器可以进一步从核心企业对应的关联企业中进行筛选以确定核心企业对应的控制企业,然后根据核心企业及其控制企业来确定目标谱系,具体来说,服务器可以以核心企业、控制企业、核心企业对应的企业人员、控制企业对应的企业人员为节点得到待查询企业对应的目标谱系。
步骤S308,将目标谱系确定为待查询企业标识对应的目标数据。
上述实施例中,当查询类型标识为预设标识时,服务器可通过调用目标线程查询到谱系数据,由于谱系数据中除了包括与待查询企业具有简单关联关系的企业关联数据外,还包括了与待查询企业具有相同核心企业这一隐藏关系的企业关联数据,因此,得到的目标数据关系维度更加丰富。
在一个实施例中,根据第一目标核心企业及其关联企业确定待查询企业对应的目标谱系,包括:从关联企业中确定第一目标核心企业对应的控制企业;根据第一目标核心企业及控制企业确定目标谱系。
在一个实施例中,如图5所示,从关联企业中确定第一目标核心企业对应的控制企业,包括:
步骤S502,根据第一目标核心企业及其关联企业确定初始谱系,并依次将各个关联企业确定为目标判断企业。
具体地,服务器可以从预先建立的企业关联图谱数据库中查询核心企业对应的企业人员、关联企业对应的企业人员,然后以核心企业、关联企业、核心企业对应的企业人员、关联企业对应的企业人员为节点确定初始谱系,并依次将初始谱系中各个关联企业确定为目标判断企业,其中,目标判断企业指的是需要进一步判断来确定是否为核心企业对应的控制企业的企业。
步骤S504,判断初始谱系中是否包含目标判断企业对应的全部预设类型关联对象,若是,则进入步骤S514;若否,则进入步骤S506。
具体地,服务器可以从预先建立的企业关联图谱数据库中查询目标判断企业对应的全部预设类型关联对象,预设类型关联对象包括与目标判断企业具有直接或间接的预设类型关联关系的企业或自然人,将查询到的全部预设类型关联对象与初始谱系中的节点一一对比,以判断初始谱系中是否包含了这些预设类型关联对象。其中,预设类型关联关系指的是投资关系。
步骤S506,计算初始谱系中目标判断企业对应的所有预设类型关联对象的关联度总和。
其中,关联度总和指的是各个预设类型关联对象对目标判断企业的关联度相加得到的数据。
步骤S508,判断关联度总和是否超过预设阈值,若是,则进入步骤S514;若否,则进入步骤S510。
其中,预设阈值可根据需要进行设定。在一个实施例中,预设阈值可设置为50%。
步骤S510,确定目标判断企业对应的第二核心企业。
具体地,服务器首先获取目标判断企业对应的企业关联路径,确定每一条企业关联路径对应的最高级别企业,并计算各个最高级别企业对应的关联度,根据关联度确定目标判断企业对应的第二核心企业,其中,服务器根据关联度确定目标判断企业对应的第二核心企业的具体步骤可参照本申请实施例中服务器根据关联度确定待查询企业对应的第一目标核心企业的具体步骤,本申请在此不赘述。
步骤S512,判断第一目标核心企业与第二核心企业是否相同,若是,则进入步骤S514;若否,则进入步骤S516。
步骤S514,判定目标判断企业为第一目标核心企业对应的控制企业。
步骤S516,判定目标判断企业不是第一目标核心企业对应的控制企业。
通过上述实施例中的步骤,服务器可以准确的确定核心企业对应的控制企业。
在一个实施例中,如图6所示,根据关联度确定待查询企业对应的第一目标核心企业,包括:
步骤S602,分别将各个最高关联度企业确定为初始核心企业,并分别确定每一个初始核心企业对应的目标谱系。
其中,最高关联度企业指的是关联度最高的最高级别企业。
本实施例中,最高级别企业中存在多个关联度相同的最高关联度企业或者存在多个关联度差值小于预设阈值的最高关联度企业,服务器可分别将各个最高关联度企业确定为初始核心企业,并进一步查询该初始核心企业的所有关联企业,根据初始核心企业和其对应的关联企业确定目标谱系。本实施例中,确定目标谱系的具体方法步骤可参考本申请其他实施例中的方法,本申请在此不赘述。
步骤S604,分别判断每一个初始核心企业对应的目标谱系是否满足预设条件,若是,则进入步骤S606;若否,则进入步骤S608。
步骤S606,将该满足预设条件的目标谱系所对应的核心企业确定为第一目标核心企业。
其中,预设条件为谱系中与待查询企业对应的所有预设类型关联对象的关联度总和超过预设阈值。
步骤S608,计算待查询企业与每一个初始核心企业对应的目标谱系的相似度,根据相似度确定第一目标核心企业。
具体地,企业和谱系的相似度按照以下公式进行计算:
相似度=企业和谱系中的任意预设类型关联对象的相似度总和/谱系中的预设类型关联对象总数;
其中,预设类型关联对象指的是与该企业具有直接或间接的预设类型关联关系的企业或自然人。
企业和谱系中任意预设类型关联对象的相似度=1/企业和谱系中预设类型关联对象的欧式距离d;其中,N维空间的欧式距离参照以下公式进行计算:
其中,(x1,x2,……,xn)、(y1,y2,……,yn)分别是企业和预设类型关联对象在n维空间的特征向量,在具体实施时,可采用transR算法,并根据企业和预设类型关联对象之间的关系数据将关联图谱中的节点映射至n维向量空间中。
下面对上述的计算方式进行举例说明,A企业对应两个初始核心企业A1和A2,其中A1企业对应的谱系为X谱系,A2企业对应的谱系为Y谱系,且X谱系和Y谱系均不满足预设条件,在X谱系中包括A的预设类型关联对象为F、J、K,在Y谱系中包括A的预设类型关联对象为B、C、D、G;
则A企业和X谱系的相似度计算如下:
其中,X(F)为企业A与企业F的相似度,X(J)为企业A与企业J的相似度,X(K)为企业A与企业K的相似度;
A企业和Y谱系的相似度计算如下:
其中,Y(G)为企业A与企业G的相似度,Y(D)为企业A与企业D的相似度,Y(B)为企业A与企业B的相似度,Y(C)为企业A与企业C的相似度。
通过上述实施例中的方法,可以准确度的确定待查询企业对应的目标核心企业。
在一个实施例中,在将目标谱系发送至终端之前,还包括:获取预设的标签类型集合及各个标签类型对应的标签确定规则;分别判断目标谱系是否满足各个标签类型对应的标签确定规则;若满足,则根据标签确定规则确定目标谱系对应的目标标签;将目标谱系发送至终端,包括:将目标谱系及目标标签发送至终端。
其中,标签确定规则指的是用于确定谱系对应的标签的规则,标签用于表征谱系的整体特征。标签类型集合中的标签类型包括但不限于集团标签、地域标签、家族标签,不同的标签类型对应的不同的标签确定规则,具体来说,地域标签的标签确定规则可以是:若谱系的高管之间,存在明显的地域集中色彩,则根据该地域确定标签,例如某个谱系的高管籍贯多为‘福建莆田’则该谱系属于‘莆田系’;集团标签的标签确定规则可以是:若谱系的核心企业为集团公司,或为注册资本在5000万以上的公司,则以该核心企业确定标签,例如某个谱系的核心企业为平安集团,则该谱系属于平安系;家族标签的标签确定规则可以是:若谱系的高管、法人、自然人股东之间,有亲属关系,则该谱系为家族系,可以根据该家族的名称确定标签。
本实施例中,服务器分别判断目标谱系是否满足每一个标签类型对应的标签确定规则,当目标谱系满足任意一个标签类型对应的标签确定规则时,根据该标签确定规则确定目标谱系对应的目标标签,进一步,服务器将目标标签及目标谱系发送至终端,终端对目标谱系及目标标签进行展示,由于标签可表征谱系的整体特征,使得用户能够方便快捷的对谱系有一个直观的了解,从而更好地满足用户对风控的需求。
在一个实施例中,如图7所示,上述步骤S208在通过目标线程获取待查询企业标识对应的目标数据之前,包括:
步骤S702,获取当前企业集合;
其中,当前企业集合指的是当前企业关联图谱数据库中所涉及的所有企业所组成的集合。
步骤S704,依次将企业集合中的每个企业确定为目标企业,并获取目标企业的企业关联路径。
步骤S706,确定目标企业的每一条企业关联路径对应的最高级别企业,并计算各个最高级别企业对应的关联度,根据关联度确定目标企业对应的目标核心企业。
具体地,服务器在计算最高级别企业的关联度时,可以依次将每一层关联关系对应的关联度相乘,例如图3中最高级别企业D的关联度为=企业D对企业B的关联度*企业B对企业A的关联度。
进一步,服务器比较各个最高级别企业对应的关联度,根据比较结果确定目标企业对应的目标核心企业。
在一个实施例中,当只有一个关联度最高的最高级别企业时,将该关联度最高的最高级别企业确定为目标核心企业。在另一个实施例中,当最高级别企业中存在多个关联度相同的最高关联度企业或者存在多个关联度差值小于预设阈值的最高关联度企业时,可参照上述实施例中记载的方式确定目标核心企业,本申请在此不再赘述。
步骤S708,分别根据核心企业相同的目标企业确定谱系,得到企业集合对应的多个谱系。
具体地,服务器将核心企业相同的目标企业确定为同一个谱系中的企业,得到该谱系对应的企业集合,然后从企业关联图谱数据库中分别查询该谱系集合中各个企业对应的企业人员,最后以该企业集合中各个企业以及各个企业对应的企业人员为节点得到对应的谱系。进一步,服务器将得到的谱系保存在企业关联图谱数据库中。
进一步,上述步骤S208通过目标线程获取待查询企业标识对应的目标数据,将目标数据发送至终端进行可视化包括:依次遍历各个谱系并判断各个谱系中是否包含待查询企业,将包含待查询企业的谱系确定为目标数据。
上述实施例中,服务器可通过调用目标线程查询到谱系数据,由于谱系数据中除了包括与待查询企业具有简单关联关系的企业关联数据外,还包括了与待查询企业具有相同核心企业这一隐藏关系的企业关联数据,因此,得到的目标数据关系维度更加丰富。
应该理解的是,虽然图2-7的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-6中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图8所示,提供了一种关联数据查询装置800,包括:
查询请求接收模块802,用于接收终端发送的查询请求,查询请求中携带待查询企业标识及查询类型标识;
查询请求拦截模块804,用于调用预设的拦截器对查询请求进行拦截,对拦截后的查询请求进行解析以获取待查询企业标识及查询类型标识;
目标线程调用模块806,用于从预设的线程池中调用与查询类型标识对应的目标线程;线程池中包括多个线程,不同的查询类型标识在线程池中对应不同的线程;
目标数据获取模块808,用于通过目标线程获取待查询企业标识对应的目标数据,将目标数据发送至终端进行可视化。
在一个实施例中,当查询类型标识为预设标识时,目标数据获取模块808还用于根据待查询企业标识获取对应的企业关联路径;确定每一条企业关联路径对应的最高级别企业,并计算各个最高级别企业对应的关联度,根据关联度确定待查询企业标识对应的第一目标核心企业;查询第一目标核心企业对应的所有关联企业,根据第一目标核心企业及其关联企业确定待查询企业标识对应的目标谱系;将目标谱系确定为待查询企业标识对应的目标数据。
在一个实施例中,目标数据获取模块808还用于从关联企业中确定第一目标核心企业对应的控制企业;根据第一目标核心企业及控制企业确定目标谱系。
在一个实施例中,目标数据获取模块808还用于根据第一目标核心企业及其关联企业确定初始谱系,并依次将各个关联企业确定为目标判断企业;当初始谱系中包含目标判断企业对应的全部预设类型关联对象时,判定目标判断企业为第一目标核心企业对应的控制企业;当初始谱系中未包含目标判断企业对应的全部预设类型关联对象时,计算初始谱系中与目标判断企业对应的所有预设类型关联对象的关联度总和;当关联度总和超过预设阈值时,判定目标判断企业为第一目标核心企业对应的控制企业;当关联度总和不超过预设阈值时,确定目标判断企业对应的第二核心企业;当第一目标核心企业与第二核心企业相同时,判定目标判断企业为第一目标核心企业对应的控制企业;当第一目标核心企业与第二核心企业不相同时,判定目标判断企业不是第一目标核心企业对应的控制企业。
在一个实施例中,当最高级别企业中存在多个关联度相同的最高关联度企业或者存在多个关联度差值小于预设阈值的最高关联度企业时,目标数据获取模块808还用于分别将各个最高关联度企业确定为初始核心企业,并分别确定每一个初始核心企业对应的目标谱系;当任意一个初始核心企业对应的目标谱系满足预设条件时,将满足预设条件的目标谱系对应的初始核心企业判定为第一目标核心企业;当所有初始核心企业对应的目标谱系均不满足预设条件时,分别计算待查询企业与每一个初始核心企业对应的目标谱系的相似度;根据相似度确定第一目标核心企业;其中,预设条件为谱系中与待查询企业对应的所有预设类型关联对象的关联度总和超过预设阈值。
在一实施例中,上述装置还包括:目标标签确定模块,用于获取预设的标签类型集合及各个标签类型对应的标签确定规则;分别判断目标谱系是否满足各个标签类型对应的标签确定规则;若满足,则根据标签确定规则确定目标谱系对应的目标标签;目标数据获取模块808还用于将目标数据及目标标签发送至终端进行可视化。
在一个实施例中,上述装置还包括:谱系确定模块,用于获取当前企业集合;依次将企业集合中的每个企业确定为目标企业,并获取目标企业的企业关联路径;确定目标企业的每一条企业关联路径对应的最高级别企业,并计算各个最高级别企业对应的关联度,根据关联度确定目标企业对应的目标核心企业;分别根据核心企业相同的目标企业确定谱系,得到企业集合对应的多个谱系;目标数据获取模块808还用于依次遍历各个谱系并判断各个谱系中是否包含待查询企业;将包含待查询企业的谱系确定为目标数据。
关于关联数据查询装置的具体限定可以参见上文中对于关联数据查询方法的限定,在此不再赘述。上述关联数据查询装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储企业关联数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据查询方法。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述任意实施例的关联数据查询方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意实施例的关联数据查询方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种关联数据查询方法,所述方法包括:
接收终端发送的查询请求,所述查询请求中携带待查询企业标识及查询类型标识,所述待查询企业标识为待查询企业对应的标识;
调用预设的拦截器对所述查询请求进行拦截,对拦截后的所述查询请求进行解析以获取所述待查询企业标识及所述查询类型标识;
从预设的线程池中调用与所述查询类型标识对应的目标线程;所述线程池中包括多个线程,不同的查询类型标识在所述线程池中对应不同的线程;
通过所述目标线程获取所述待查询企业标识对应的目标数据,将所述目标数据发送至所述终端进行可视化。
2.根据权利要求1所述的方法,其特征在于,当所述查询类型标识为预设标识时,所述通过所述目标线程获取所述待查询企业标识对应的目标数据,包括:
根据所述待查询企业标识获取对应的企业关联路径;
确定每一条企业关联路径对应的最高级别企业,并计算各个最高级别企业对应的关联度,根据所述关联度确定所述待查询企业标识对应的第一目标核心企业;
查询所述第一目标核心企业对应的所有关联企业,根据所述第一目标核心企业及其关联企业确定所述待查询企业标识对应的目标谱系;
将所述目标谱系确定为所述待查询企业标识对应的目标数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一目标核心企业及其关联企业确定所述待查询企业标识对应的目标谱系,包括:
从所述关联企业中确定所述第一目标核心企业对应的控制企业;
根据所述第一目标核心企业及所述控制企业确定所述目标谱系。
4.根据权利要求3所述的方法,其特征在于,所述从所述关联企业中确定所述第一目标核心企业对应的控制企业,包括:
根据所述第一目标核心企业及其关联企业确定初始谱系,并依次将各个关联企业确定为目标判断企业;
当所述初始谱系中包含所述目标判断企业对应的全部预设类型关联对象时,判定所述目标判断企业为所述第一目标核心企业对应的控制企业;
当所述初始谱系中未包含所述目标判断企业对应的全部预设类型关联对象时,计算所述初始谱系中与所述目标判断企业对应的所有预设类型关联对象的关联度总和;
当所述关联度总和超过预设阈值时,判定所述目标判断企业为所述第一目标核心企业对应的控制企业;
当所述关联度总和不超过预设阈值时,确定所述目标判断企业对应的第二核心企业;
当所述第一目标核心企业与所述第二核心企业相同时,判定所述目标判断企业为所述第一目标核心企业对应的控制企业;
当所述第一目标核心企业与所述第二核心企业不相同时,判定所述目标判断企业不是所述第一目标核心企业对应的控制企业。
5.根据权利要求2所述的方法,其特征在于,当最高级别企业中存在多个关联度相同的最高关联度企业或者存在多个关联度差值小于预设阈值的最高关联度企业时,所述根据所述关联度确定所述待查询企业标识对应的第一目标核心企业,包括:
分别将各个最高关联度企业确定为初始核心企业,并分别确定每一个所述初始核心企业对应的目标谱系;
当任意一个初始核心企业对应的目标谱系满足预设条件时,将满足所述预设条件的目标谱系对应的初始核心企业判定为第一目标核心企业;
当所有初始核心企业对应的目标谱系均不满足预设条件时,分别计算所述待查询企业与每一个初始核心企业对应的目标谱系的相似度;
根据所述相似度确定所述第一目标核心企业;
其中,预设条件为谱系中与所述待查询企业对应的所有预设类型关联对象的关联度总和超过预设阈值。
6.根据权利要求2至5任意一项所述的方法,其特征在于,在所述将所述目标数据发送至所述终端进行可视化之前,还包括:
获取预设的标签类型集合及各个标签类型对应的标签确定规则;
分别判断所述目标谱系是否满足各个标签类型对应的标签确定规则;
若满足,则根据所述标签确定规则确定所述目标谱系对应的目标标签;
所述将所述目标数据发送至所述终端进行可视化,包括:
将所述目标数据及所述目标标签发送至所述终端进行可视化。
7.根据权利要求2所述的方法,其特征在于,在所述通过所述目标线程获取所述待查询企业标识对应的目标数据之前,包括:
获取当前企业集合;
依次将所述企业集合中的每个企业确定为目标企业,并获取所述目标企业的企业关联路径;
确定所述目标企业的每一条企业关联路径对应的最高级别企业,并计算各个最高级别企业对应的关联度,根据所述关联度确定所述目标企业对应的目标核心企业;
分别根据核心企业相同的目标企业确定谱系,得到所述企业集合对应的多个谱系;
通过所述目标线程获取所述待查询企业标识对应的目标数据,包括:
依次遍历各个谱系并判断各个谱系中是否包含所述待查询企业;
将包含所述待查询企业的谱系确定为目标数据。
8.一种关联数据查询装置,其特征在于,所述装置包括:
查询请求接收模块,用于接收终端发送的查询请求,所述查询请求中携带待查询企业标识及查询类型标识;
查询请求拦截模块,用于调用预设的拦截器对所述查询请求进行拦截,对拦截后的所述查询请求进行解析以获取所述待查询企业标识及查询类型标识;
目标线程调用模块,用于从预设的线程池中调用与所述查询类型标识对应的目标线程;所述线程池中包括多个线程,不同的查询类型标识在所述线程池中对应不同的线程;
目标数据获取模块,用于通过所述目标线程获取所述待查询企业标识对应的目标数据,将所述目标数据发送至所述终端进行可视化。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201910748898.3A 2019-08-14 2019-08-14 关联数据查询方法、装置、计算机设备和存储介质 Active CN110609737B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910748898.3A CN110609737B (zh) 2019-08-14 2019-08-14 关联数据查询方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910748898.3A CN110609737B (zh) 2019-08-14 2019-08-14 关联数据查询方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN110609737A true CN110609737A (zh) 2019-12-24
CN110609737B CN110609737B (zh) 2023-04-25

Family

ID=68890966

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910748898.3A Active CN110609737B (zh) 2019-08-14 2019-08-14 关联数据查询方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110609737B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111327513A (zh) * 2019-12-26 2020-06-23 中国平安财产保险股份有限公司 消息数据的推送方法、装置、计算机设备及存储介质
CN111782703A (zh) * 2020-07-07 2020-10-16 北京润华信通科技有限公司 灌区对象数据间关联关系自动管理和展示的方法及系统
CN112102093A (zh) * 2020-08-05 2020-12-18 中证征信(深圳)有限公司 主体身份及关联关系识别方法、装置、设备和介质
CN112685451A (zh) * 2020-12-28 2021-04-20 招商局金融科技有限公司 数据查询处理方法、装置、计算机设备及存储介质
CN114547331A (zh) * 2022-01-29 2022-05-27 北京金堤科技有限公司 一种目标对象多维图谱的生成方法、装置和存储介质
CN115470254A (zh) * 2022-09-20 2022-12-13 中国建设银行股份有限公司 数据查询方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120242672A1 (en) * 2011-03-21 2012-09-27 Apple Inc. Fast queries in a multithreaded queue of a graphics system
CN106383864A (zh) * 2016-09-02 2017-02-08 北京百度网讯科技有限公司 一种时序数据库的查询请求处理方法和装置
CN108259243A (zh) * 2018-01-12 2018-07-06 深圳市卓讯信息技术有限公司 基于微服务技术架构的数据处理方法、终端及计算机存储介质
CN109800335A (zh) * 2019-01-23 2019-05-24 平安科技(深圳)有限公司 企业图谱的生成方法、装置、计算机设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120242672A1 (en) * 2011-03-21 2012-09-27 Apple Inc. Fast queries in a multithreaded queue of a graphics system
CN106383864A (zh) * 2016-09-02 2017-02-08 北京百度网讯科技有限公司 一种时序数据库的查询请求处理方法和装置
CN108259243A (zh) * 2018-01-12 2018-07-06 深圳市卓讯信息技术有限公司 基于微服务技术架构的数据处理方法、终端及计算机存储介质
CN109800335A (zh) * 2019-01-23 2019-05-24 平安科技(深圳)有限公司 企业图谱的生成方法、装置、计算机设备和存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111327513A (zh) * 2019-12-26 2020-06-23 中国平安财产保险股份有限公司 消息数据的推送方法、装置、计算机设备及存储介质
CN111327513B (zh) * 2019-12-26 2022-09-13 中国平安财产保险股份有限公司 消息数据的推送方法、装置、计算机设备及存储介质
CN111782703A (zh) * 2020-07-07 2020-10-16 北京润华信通科技有限公司 灌区对象数据间关联关系自动管理和展示的方法及系统
CN111782703B (zh) * 2020-07-07 2024-02-27 北京润华信通科技有限公司 灌区对象数据间关联关系自动管理和展示的方法及系统
CN112102093A (zh) * 2020-08-05 2020-12-18 中证征信(深圳)有限公司 主体身份及关联关系识别方法、装置、设备和介质
CN112685451A (zh) * 2020-12-28 2021-04-20 招商局金融科技有限公司 数据查询处理方法、装置、计算机设备及存储介质
CN112685451B (zh) * 2020-12-28 2024-02-13 招商局金融科技有限公司 数据查询处理方法、装置、计算机设备及存储介质
CN114547331A (zh) * 2022-01-29 2022-05-27 北京金堤科技有限公司 一种目标对象多维图谱的生成方法、装置和存储介质
CN115470254A (zh) * 2022-09-20 2022-12-13 中国建设银行股份有限公司 数据查询方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN110609737B (zh) 2023-04-25

Similar Documents

Publication Publication Date Title
CN110609737A (zh) 关联数据查询方法、装置、计算机设备和存储介质
CN110489520B (zh) 基于知识图谱的事件处理方法、装置、设备和存储介质
Deng et al. St-norm: Spatial and temporal normalization for multi-variate time series forecasting
CN109542428B (zh) 业务处理方法、装置、计算机设备和存储介质
CN109614238B (zh) 一种目标对象识别方法、装置、系统及可读存储介质
WO2020056973A1 (zh) 跨平台产品推荐方法、装置、服务器和存储介质
JP5734460B2 (ja) 画像を比較するための方法およびシステム
CN108876133A (zh) 基于业务信息的风险评估处理方法、装置、服务器和介质
CN109949154B (zh) 客户信息分类方法、装置、计算机设备和存储介质
CN109446844B (zh) 一种面向大数据发布的隐私保护方法及系统
CN110659298B (zh) 财务数据处理方法、装置、计算机设备和存储介质
CN115526363A (zh) 业务数据处理方法、装置、计算机设备和存储介质
Qi et al. Privacy-preserving distributed service recommendation based on locality-sensitive hashing
CN109657107B (zh) 一种基于第三方应用的终端匹配方法和装置
CN110555164B (zh) 群体兴趣标签的生成方法、装置、计算机设备和存储介质
CN111934899B (zh) 物联网用户信息的配置方法、装置、计算机设备
AU2017410367B2 (en) System and method for learning-based group tagging
WO2019148712A1 (zh) 钓鱼网站检测方法、装置、计算机设备和存储介质
CN110135943B (zh) 产品推荐方法、装置、计算机设备和存储介质
CN108363729A (zh) 一种字符串比较方法、装置、终端设备及存储介质
WO2020052183A1 (zh) 商标侵权的识别方法、装置、计算机设备和存储介质
CN113888299A (zh) 风控决策方法、装置、计算机设备和存储介质
CN110084476B (zh) 案件调整方法、装置、计算机设备和存储介质
Zhang et al. CRUC: Cold-start recommendations using collaborative filtering in internet of things
CN112015723A (zh) 数据等级划分方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant