CN109002544A - 一种数据处理方法、装置和计算机可读介质 - Google Patents

一种数据处理方法、装置和计算机可读介质 Download PDF

Info

Publication number
CN109002544A
CN109002544A CN201810826359.2A CN201810826359A CN109002544A CN 109002544 A CN109002544 A CN 109002544A CN 201810826359 A CN201810826359 A CN 201810826359A CN 109002544 A CN109002544 A CN 109002544A
Authority
CN
China
Prior art keywords
investment
data
node
target
map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810826359.2A
Other languages
English (en)
Other versions
CN109002544B (zh
Inventor
周晗
柳超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dike Technology Co Ltd
Original Assignee
Beijing Dike Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dike Technology Co Ltd filed Critical Beijing Dike Technology Co Ltd
Priority to CN201810826359.2A priority Critical patent/CN109002544B/zh
Publication of CN109002544A publication Critical patent/CN109002544A/zh
Application granted granted Critical
Publication of CN109002544B publication Critical patent/CN109002544B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Technology Law (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种数据处理方法、装置和计算机可读介质,涉及数据处理的技术领域,包括获取包括多个节点的目标投资图谱的第一直接投资数据,第一直接投资数据中包括:投资节点相对于直接被投资节点的股权占比,投资节点和直接被投资节点为多个节点中的任意两个邻居节点;基于第一直接投资数据确定第一间接投资数据,其中,第一间接投资数据包括:投资节点相对于间接被投资节点的股权占比,间接被投资节点为多个节点中投资节点的间接投资节点;将第一直接投资数据和第一间接投资数据进行合并,得到第一目标投资数据,本发明以实时高效地计算出当前投资图谱中的投资链路的股权比例。

Description

一种数据处理方法、装置和计算机可读介质
技术领域
本发明涉及数据处理的技术领域,尤其是涉及一种数据处理方法、装置和计算机可读介质。
背景技术
企业信息中具有海量的投资数据,需要在这海量数据中有效地发现公司或个人的持股公司,或者通过公司发现其直接或间接的股东,从而辨识公司的实际控制人、最终受益人以及其投资链路。
由于投资图谱里涉及到的公司和个人的数目很庞大,投资数据又在实时变化,同时受益人、公司间的股权关系不仅具有复杂的层级结构,而且实时更新的直接持股数据会影响到其股权链路上所有公司的股权占比。现有技术中,一般直接计算当前投资图谱中股权链路上所有公司的股权占比。但是,针对数目庞大的投资数据采用传统的方法会导致计算效率较慢,且计算性能较低的问题。
发明内容
有鉴于此,本发明的目的在于提供一种数据处理方法、装置和计算机可读介质,以实时高效地计算出当前投资图谱中的投资链路的股权比例。
第一方面,本发明实施例提供了一种数据处理方法,包括:获取包括多个节点的目标投资图谱的第一直接投资数据,所述第一直接投资数据中包括:投资节点相对于直接被投资节点的股权占比,所述投资节点和所述直接被投资节点为所述多个节点中的任意两个邻居节点;基于所述第一直接投资数据确定第一间接投资数据,其中,所述第一间接投资数据包括:投资节点相对于间接被投资节点的股权占比,所述间接被投资节点为所述多个节点中所述投资节点的间接投资节点;将所述第一直接投资数据和所述第一间接投资数据进行合并,得到第一目标投资数据。
进一步地,获取目标投资图谱的第一直接投资数据包括:获取所述目标投资图谱的目标图谱矩阵,其中,所述目标图谱矩阵中的元素aij表示所述目标投资图谱中的第i个投资节点相对于与第j个直接被投资节点的股权占比,i和j依次1至M,M为所述目标投资图谱中节点的数量;基于所述第一直接投资数据确定第一间接投资数据包括:基于所述目标图谱矩阵确定所述第一间接投资数据。
进一步地,基于所述目标图谱矩阵确定所述第一间接投资数据包括:通过公式P=MN计算所述第一间接投资数据,其中,M为所述目标图谱矩阵,P为所述第一间接投资数据,N为投资节点和间接被投资节点之间的投资层数,N为大于等于2,且小于等于H的任意一个正整数,H为最大投资层数。
进一步地,当N的取值为多个时,所述第一间接投资数据的数量为多个;将所述第一直接投资数据和所述第一间接投资数据进行合并,得到第一目标投资数据包括:将所述目标图谱矩阵和多个所述第一间接投资数据进行求和运算,得到所述第一目标投资数据。
进一步地,获取所述目标投资图谱的目标图谱矩阵包括:获取所述目标投资图谱;获取目标映射表,其中,所述目标映射表中包括所述目标投资图谱中每个节点的名称信息和每个节点的标识信息之间的关联关系;基于所述目标映射表将所述目标投资图谱映射为所述目标投资图谱的所述目标图谱矩阵。
进一步地,所述第一目标投资数据为三元组数据(i,j,bij),其中,bij为所述第一目标投资数据中第i个投资节点相对于与第j个被投资节点之间的股权占比,i为所述第i个投资节点的标识信息,j为第j个被投资节点的标识信息;所述方法还包括:获取目标映射表,其中,所述目标映射表中包括所述目标投资图谱中每个节点的名称信息和每个节点的标识信息之间的关联关系;基于所述目标映射表将所述三元组数据中投资节点的标识信息和被投资节点的标识信息替换为对应的名称信息。
进一步地,所述方法还包括:在检测到所述目标投资图谱中的投资数据发生变化之后,则按照所述变更节点与所述目标投资图谱中发生变化的投资数据更新所述第一直接投资数据,得到第二直接投资数据;基于所述第二直接投资数据确定第二间接投资数据;将所述第二间接投资数据和所述第二直接投资数据进行合并,得到第二目标投资数据。
进一步地,所述方法还包括:在所述第一目标投资数据中确定与所述发生变化的投资数据相连通的第一连通投资数据,其中,在检测到所述发生变化的投资数据之后,所述第一连通投资数据发生变化;在所述第二目标投资数据中确定与所述发生变化的投资数据相连通的第二连通投资数据;将所述第一连通投资数据替换为所述第二连通投资数据。
第二方面,本发明实施例提供了一种数据处理装置,包括:获取单元,用于获取包括多个节点的目标投资图谱的第一直接投资数据,所述第一直接投资数据中包括:投资节点相对于直接被投资节点的股权占比,所述投资节点和所述直接被投资节点为所述多个节点中的任意两个邻居节点;确定单元,用于基于所述第一直接投资数据确定第一间接投资数据,其中,所述第一间接投资数据包括:投资节点相对于间接被投资节点的股权占比,所述间接被投资节点为所述多个节点中所述投资节点的间接投资节点;合并单元,用于将所述第一直接投资数据和所述第一间接投资数据进行合并,得到第一目标投资数据。
第三方面,本发明实施例提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行上述第一方面中任一所述的方法。
针对背景技术中的技术问题,在本实施例中提供一种数据处理方法,通过该方法能够实时高效地计算出当前投资图谱中的投资链路的股权比例,以解决传统的方法会导致计算效率较慢,且计算性能较低的问题。
在本实施例中,该方法首先获取目标投资图谱的第一直接投资数据,然后,基于第一直接投资数据确定第一间接投资数据,进而根据第一直接投资数据和第一间接投资数据确定第一目标投资数据,其中,第一目标投资数据中包括具有直接投资关系的两个节点之间的股权占比,还包括具有间接投资关系的两个节点之间的股权占比。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种数据处理方法的流程图;
图2是根据本发明实施例的一种可选地目标投资图谱的示意图;
图3是根据本发明实施例的另一种可选地目标投资图谱的示意图;
图4是根据本发明实施例的另一种可选地目标投资图谱的示意图;
图5是根据本发明实施例的另一种可选地目标投资图谱的示意图;
图6是根据本发明实施例的一种数据处理装置的示意图;
图7是根据本发明实施例的一种电子设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
根据本发明实施例,提供了一种数据处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种数据处理方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取包括多个节点的目标投资图谱的第一直接投资数据,所述第一直接投资数据中包括:投资节点相对于直接被投资节点的股权占比,所述投资节点和所述直接被投资节点为所述多个节点中的任意两个邻居节点;
如图2所示的即为一种可选的目标投资图谱的示意图。从图2中可以看出,该目标投资图谱包括4个节点,分别为:A、B、C和D。其中,A、B、C和D均为投资实体。从图2中可以看出,A投资C,且A和C之间的股权占比为0.8;B投资C,且B和C之间的股权占比为0.2;B投资D,且B和D之间的股权占比为0.3;C投资D,且C和D之间的股权占比为0.7。也就是说,在如图2所示的目标投资图谱中,C既是投资节点,又是被投资节点。
基于此,如图2所示的目标投资图谱的第一直接投资数据可以表示为:(0,2,0.8);(1,2,0.2);(1,3,0.3);(2,3,0.7)。数字0-3分别是A、B、C和D的标识信息,即0表示A、1表示B、2表示C、3表示D。
例如,如图2所示,(0,2,0.8)表示投资实体A相对于投资实体C的股权占比,此时,投资实体A即为上述投资节点所对应的投资实体,投资实体C即为上述直接被投资节点所对应的投资实体。
步骤S104,基于所述第一直接投资数据确定第一间接投资数据,其中,所述第一间接投资数据包括:投资节点相对于间接被投资节点的股权占比,所述间接被投资节点为所述多个节点中所述投资节点的间接投资节点;
如图2所示,A投资C,C投资D,此时D即为A的间接投资对象。也即,投资实体A即为上述投资节点所对应的投资实体,投资实体D即为上述投资实体A的间接被投资节点所对应的投资实体。
此时的第一间接投资数据即为目标投资图谱中投资节点相对于其间接投资节点的股权占比。
例如,如图2所示,包括以下投资链路:A→C;C→D;B→C;B→D;B→C→D;A→C→D。其中,B→C→D和A→C→D为两层投资链路,B和D之间为间接投资关系,A和D之间也是间接投资关系。A→C、C→D、B→C和B→D均为一层投资链路。此时,第一间接投资数据即为B和D之间的投资数据和A和D之间的投资数据。
又例如,如图3所示,包括以下投资链路:A→C;C→D;B→C;B→D;D→E;B→C→D;A→C→D;B→D→E;C→D→E;A→C→D→E;B→C→D→E。此时,A→C→D→E和B→C→D→E为三层投资链路。此时,第一间接投资数据即为B和D之间的投资数据、A和D之间的投资数据、B和E之间的投资数据、C和E之间的投资数据、A和E之间的投资数据、B和E之间的投资数据。
可选地,本实施例中所描述的投资数据为投资节点相对于被投资节点(直接投资节点和/或间接投资节点)的股权占比。
步骤S106,将所述第一直接投资数据和所述第一间接投资数据进行合并,得到第一目标投资数据。
在本实施例中,通过上述处理方式,能够高效的计算直接投资、多层间接投资的实际股权占比,得到当前的最终受益人和实际持股。
针对背景技术中的技术问题,在本实施例中提供一种数据处理方法,通过该方法能够实时高效地计算出当前投资图谱中的投资链路的股权比例,以解决传统的方法会导致计算效率较慢,且计算性能较低的问题。
在一个可选的实施方式中,步骤S102,获取目标投资图谱的第一直接投资数据包括如下步骤S1021:获取所述目标投资图谱的目标图谱矩阵,其中,所述目标图谱矩阵中的元素aij表示所述目标投资图谱中的第i个投资节点相对于与第j个直接被投资节点的股权占比,i和j依次1至M,M为所述目标投资图谱中节点的数量;
步骤S104,基于所述第一直接投资数据确定第一间接投资数据包括如下步骤S1041:基于所述目标图谱矩阵确定所述第一间接投资数据。
在本实施例中,第一直接投资数据可以为目标投资图谱的目标图谱矩阵其中,该目标图谱矩阵中的元素aij目标投资图谱中的第i个投资节点相对于与第j个直接被投资节点的股权占比。
例如,如图2所示的目标投资图谱。此时,0.8表示第1个投资节点(A)相对于第3个直接被投资节点(C)的股权占比。
在得到该目标图谱矩阵之后,就可以基于该目标图谱矩阵确定第一间接投资数据。
在另一个可选的实施方式中,步骤S1021,获取所述目标投资图谱的目标图谱矩阵包括如下步骤:
步骤S11,获取所述目标投资图谱;
步骤S12,获取目标映射表,其中,所述目标映射表中包括所述目标投资图谱中每个节点的名称信息和每个节点的标识信息之间的关联关系;
步骤S13,基于所述目标映射表将所述目标投资图谱映射为所述目标投资图谱的所述目标图谱矩阵。
具体地,在本实施例中,首先,获取目标投资图谱的图谱数据。然后获取目标映射表,之后,基于目标映射表将目标投资图谱的图谱数据映射为目标图谱矩阵。
例如,如图2所示的目标投资图谱。首先,获取该目标投资图谱的图谱数据。例如,获取到的数据为:(A,C,0.8);(B,C,0.2);(B,D,0.3);(C,D,0.7)。该目标映射表为:(A:0);(B:1);(C:2);(D:3)。然后,基于该目标映射表即将目标投资图谱的图谱数据映射为目标图谱矩阵,即目标图谱矩阵为(0,2,0.8);(1,2,0.2);(1,3,0.3);(2,3,0.7)。
在另一个可选的实施方式中,步骤S1041,基于所述目标图谱矩阵确定所述第一间接投资数据包括如下步骤:
通过公式P=MN计算所述第一间接投资数据,其中,M为所述目标图谱矩阵,P为所述第一间接投资数据,N为投资节点和间接被投资节点之间的投资层数,N为大于等于2,且小于等于H的任意一个正整数,H为最大投资层数。
具体地,在本实施例中,可以对N个矩阵M做连乘M*M*...*M=M^N=P,其中,P的物理意义是全部节点N层股权链的占比。以图2所示的投资图谱为例,N=2时,P=M*M,其表现的图1中具有两层股权链路的节点之间的投资股权占比,即A->D和B->D。其结果也是一个稀疏矩阵,即稀疏矩阵P的三元组表示形式为:(0,3,0.56);(1,3,0.14)。
例如,如图3所示的目标投资图谱,N的最大取值为3,此时,N的取值可以为2,还可以为3,当N为3时,该第一间接投资数据P的物理意义是全部节点3层股权链的占比。
在得到第一间接投资数据之后,就可以将所述第一直接投资数据和所述第一间接投资数据进行合并,得到第一目标投资数据,具体包括:
当N的取值为多个时,所述第一间接投资数据的数量为多个,此时,可以将所述目标图谱矩阵和多个第一间接投资数据进行求和运算,得到所述第一目标投资数据。
以图2所示的目标投资图谱为例,该目标投资图谱的目标图谱矩阵为该矩阵的三元组表示形式为:(0,2,0.8);(1,2,0.2);(1,3,0.3);(2,3,0.7)。第一间接投资数据的三元组表示形式为:(0,3,0.56);(1,3,0.14)。此时,就可以将(0,2,0.8);(1,2,0.2);(1,3,0.3);(2,3,0.7),与(0,3,0.56);(1,3,0.14)进行相加计算,即P+M,即可得到目标投资图谱中各节点直接投资和多层间接投资的股权占比。例如,(0,2,0.8);(0,3,0.56);(1,2,0.2);(1,3,0.44);(2,3,0.7)。其中,(0,2,0.8);(0,3,0.56);(1,2,0.2);(1,3,0.44);(2,3,0.7)即为第一目标投资数据。
综上可见,基于投资图谱的股权计算方法可以映射为矩阵的乘法和加法运算,具体地,N层投资关系的全局股权计算为
需要说明的是,在本实施例中,可以基于图形处理器(Graphics ProcessingUnit,GPU)计算第一目标投资数据,其中,图形处理器的计算性能可以满足实时性要求。
在本实施例中,在得到第一目标投资数据之后,还还可以对第一目标投资数据进行重建。
通过上述描述可知,第一目标投资数据为一个稀疏矩阵,该稀疏矩阵的三元组数据为(i,j,bij),其中,bij为所述第一目标投资数据中第i个投资节点相对于与第j个被投资节点之间的股权占比,i为所述第i个投资节点的标识信息,j为第j个被投资节点的标识信息。
基于此,对第一目标投资数据进行重建包括如下步骤:
获取目标映射表,其中,所述目标映射表中包括所述目标投资图谱中每个节点的名称信息和每个节点的标识信息之间的关联关系;
基于所述目标映射表将所述三元组数据中投资节点的标识信息和被投资节点的标识信息替换为对应的名称信息。
以图2为例进行说明,首先,可以获取目标映射表:(A:0);(B:1);(C:2);(D:3)。之后,可以基于该目标映射表将三元组数据中投资节点的标识信息和被投资节点的标识信息替换为对应的名称信息,得到重建结果,其中,重建结果可以表示为:(A,C,0.8);(A,D,0.56);(B,C,0.2);(B,D,0.44);(C,D,0.7)。由此,就可以得到多层及以下投资链路的投资股权占比,通过新建图谱的占比就可以找到最终受益人和实际控制权的公司和个人。
需要说明的是,在本实施例中,可以通过图形处理器进行离线计算和在线计算。如果计算方式为离线计算,那么图像处理器在每次计算时,都获取全量的投资图谱数据,进而对全量的投资图谱数据进行全量计算。在全量计算得到第一目标投资数据之后,将全部的第一目标投资数据更新到数据库中。相对于现有技术的方法,该方法能够实时高效地计算出当前投资图谱中的投资链路的股权比例,以解决传统的方法会导致计算效率较慢,且计算性能较低的问题。
除此之外,还可以通过在线计算方式计算上述第一目标投资数据,具体计算过程描述如下:
首先,在检测到所述目标投资图谱中的投资数据发生变化之后,则按照所述目标投资图谱中发生变化的投资数据更新所述第一直接投资数据,得到第二直接投资数据;
需要说明的是,在本实施例中,发生变化的投资数据可以为在目标投资图谱中新增一个节点之后,新增阶段与目标投资图谱中各个节点之间的投资数据;发生变化的投资数据还可以为在目标投资图谱中删除一个节点,或者删除目标投资图谱中的一条边,或者修改目标投资图谱中邻居节点之前的股权占比,或者,在目标投资图谱中新增任意两个节点之间的股权占比。综上,当目标投资图谱中的投资数据发生变化之后,就按照目标投资图谱中发生变化的投资数据更新所述第一直接投资数据。
然后,基于所述第二直接投资数据确定第二间接投资数据;
最后,将所述第二间接投资数据和所述第二直接投资数据进行合并,得到第二目标投资数据。
下面以新增节点为例来进行说明。在本实施例中,实时获取投资数据。例如,某一时刻的目标投资图谱为如图2所示的投资图谱,之后,该目标投资图谱发生了更新,更新为如图3所示的目标投资图谱。对比图2和图3可知,图3在图2的基础上,增加量了D→E,此时,E节点即为新增节点。在本实施例中,在检测到新增节点E之后,按照新增节点E与图2所示的目标投资图谱中各个节点之间的连接关系更新所述第一直接投资数据,得到第二直接投资数据,其中,该第二投资数据为之后,就可以基于所述第二直接投资数据确定第二间接投资数据,进而,将所述第二间接投资数据和所述第二直接投资数据进行合并,得到第二目标投资数据。
在本实施例中,在得到第二目标投资数据之后,可以在所述第一目标投资数据中确定与所述发生变化的投资数据相连通的第一连通投资数据,其中,在检测到所述发生变化的投资数据之后,所述第一连通投资数据发生变化;在所述第二目标投资数据中确定与所述发生变化的投资数据相连通的第二连通投资数据;将所述第一连通投资数据替换为所述第二连通投资数据。
以图4为例来进行说明。如图6所示,相对于图2,图4中B→D由0.3变化为0.2。此时,发生变化的投资数据即为B和D之间的投资数据。此时,确定与该发生变化的投资数据相连通的第一连通投资数据。如图2和图4所示,当B和D之间的投资数据发生变化时,所影响的投资数据即为B→D的投资数据(也即,第一连通投资数据)。如图4所对应的第二目标投资数据为:(A,C,0.8);(A,D,0.56);(B,C,0.2);(B,D,0.34);(C,D,0.7)。第二目标投资数据中与发生变化的投资数据相连通的第二连通投资数据为(B,D,0.34)。此时,可以将第一目标投资数据中的(B,D,0.44)替换为(B,D,0.34)。
以图5为例来进行说明。如图5所示,相对于图2,图5中C→D由0.7变化为0.6。此时,发生变化的投资数据即为C和D之间的投资数据。此时,确定与该发生变化的投资数据相连通的第一连通投资数据。如图2和图5所示,当C和D之间的投资数据发生变化时,所影响的投资数据即为A→D的投资数据,B→D的投资数据以及C→D的投资数据(也即,第一连通投资数据)。如图5所对应的第二目标投资数据为:(A,C,0.8);(A,D,0.48);(B,C,0.2);(B,D,0.42);(C,D,0.6)。第二目标投资数据中与发生变化的投资数据相连通的第二连通投资数据为(A,D,0.48)、(B,D,0.42);(C,D,0.6)。此时,可以将第一目标投资数据中的(A,D,0.56)、(B,D,0.44);(C,D,0.7)替换为(A,D,0.48)、(B,D,0.42);(C,D,0.6)。
通过上述描述可知,在线计算方式采用增量存储的方式,该方式能够实现实时对更新的目标投资数据进行存储,在对更新的目标投资数据进行存储时,能够减少向数据库中传输的数据量,提高数据的处理效率。
通过上述描述可知,本实施例所提供的方法的好处在于:受益人、控股数据等数据有近一亿条,全量计算很快,但全量存储相对较慢,如果每次都全量存的话开销太大,所以只更新增量数据可以大大提高处理速度。
本发明通过矩阵化投资图谱并在GPU中进行计算,可以高效的计算直接投资、多层间接投资的实际股权占比,得到当前的最终受益人和实际持股;另外,本发明能支持离线和在线计算;同时,本发明的方法还可以用于检测交叉持股的股权链路。
实施例二:
本发明实施例还提供了一种数据处理装置,该数据处理装置主要用于执行本发明实施例上述内容所提供的数据处理方法,以下对本发明实施例提供的数据处理装置做具体介绍。
图6是根据本发明实施例的一种数据处理装置的示意图,如图6所示,该数据处理装置主要包括获取单元10,确定单元20和合并单元30,其中:
获取单元10,用于获取包括多个节点的目标投资图谱的第一直接投资数据,所述第一直接投资数据中包括:投资节点相对于直接被投资节点的股权占比,所述投资节点和所述直接被投资节点为所述多个节点中的任意两个邻居节点;
确定单元20,用于基于所述第一直接投资数据确定第一间接投资数据,其中,所述第一间接投资数据包括:投资节点相对于间接被投资节点的股权占比,所述间接被投资节点为所述多个节点中所述投资节点的间接投资节点;
合并单元30,用于将所述第一直接投资数据和所述第一间接投资数据进行合并,得到第一目标投资数据。
针对背景技术中的技术问题,在本实施例中提供一种数据处理方法,通过该方法能够实时高效地计算出当前投资图谱中的投资链路的股权比例,以解决传统的方法会导致计算效率较慢,且计算性能较低的问题。
可选地,获取单元10包括:获取模块,用于获取目标投资图谱的第一直接投资数据包括:获取所述目标投资图谱的目标图谱矩阵,其中,所述目标图谱矩阵中的元素aij表示所述目标投资图谱中的第i个投资节点相对于与第j个直接被投资节点的股权占比,i和j依次1至M,M为所述目标投资图谱中节点的数量;确定单元20包括:确定模块,用于基于所述目标图谱矩阵确定所述第一间接投资数据。
可选地,确定模块用于:通过公式P=MN计算所述第一间接投资数据,其中,M为所述目标图谱矩阵,P为所述第一间接投资数据,N为投资节点和间接被投资节点之间的投资层数,N为大于等于2,且小于等于H的任意一个正整数,H为最大投资层数。
可选地,当N的取值为多个时,所述第一间接投资数据的数量为多个;合并单元30用于:将所述目标图谱矩阵和多个所述第一间接投资数据进行求和运算,得到所述第一目标投资数据。
可选地,获取模块用于:获取所述目标投资图谱;获取目标映射表,其中,所述目标映射表中包括所述目标投资图谱中每个节点的名称信息和每个节点的标识信息之间的关联关系;基于所述目标映射表将所述目标投资图谱映射为所述目标投资图谱的所述目标图谱矩阵。
可选地,所述第一目标投资数据为三元组数据(i,j,bij),其中,bij为所述第一目标投资数据中第i个投资节点相对于与第j个被投资节点之间的股权占比,i为所述第i个投资节点的标识信息,j为第j个被投资节点的标识信息;所述装置还用于:获取目标映射表,其中,所述目标映射表中包括所述目标投资图谱中每个节点的名称信息和每个节点的标识信息之间的关联关系;基于所述目标映射表将所述三元组数据中投资节点的标识信息和被投资节点的标识信息替换为对应的名称信息。
可选地,所述装置还用于:在检测到所述目标投资图谱中的投资数据发生变化之后,则按照所述目标投资图谱中发生变化的投资数据更新所述第一直接投资数据,得到第二直接投资数据;基于所述第二直接投资数据确定第二间接投资数据;将所述第二间接投资数据和所述第二直接投资数据进行合并,得到第二目标投资数据。
可选地,所述装置还用于:在所述第一目标投资数据中确定与所述发生变化的投资数据相连通的第一连通投资数据,其中,在检测到所述发生变化的投资数据之后,所述第一连通投资数据发生变化;在所述第二目标投资数据中确定与所述发生变化的投资数据相连通的第二连通投资数据;将所述第一连通投资数据替换为所述第二连通投资数据。
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
实施例三:
参见图7,本发明实施例还提供一种电子设备100,包括:处理器70,存储器71,总线72和通信接口73,所述处理器70、通信接口73和存储器71通过总线72连接;处理器70用于执行存储器71中存储的可执行模块,例如计算机程序。
其中,存储器71可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口73(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线72可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器71用于存储程序701,所述处理器70在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器70中,或者由处理器70实现。
处理器70可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器70中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器70可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者图形处理器(Graphics Processing Unit,简称GPU)等其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器71,处理器70读取存储器71中的信息,结合其硬件完成上述方法的步骤。
在本实施例中,还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行上述方法实施例中任一所述的方法。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种数据处理方法,其特征在于,包括:
获取包括多个节点的目标投资图谱的第一直接投资数据,所述第一直接投资数据中包括:投资节点相对于直接被投资节点的股权占比,所述投资节点和所述直接被投资节点为所述多个节点中的任意两个邻居节点;
基于所述第一直接投资数据确定第一间接投资数据,其中,所述第一间接投资数据包括:投资节点相对于间接被投资节点的股权占比,所述间接被投资节点为所述多个节点中所述投资节点的间接投资节点;
将所述第一直接投资数据和所述第一间接投资数据进行合并,得到第一目标投资数据。
2.根据权利要求1所述的方法,其特征在于,
获取目标投资图谱的第一直接投资数据包括:获取所述目标投资图谱的目标图谱矩阵,其中,所述目标图谱矩阵中的元素aij表示所述目标投资图谱中的第i个投资节点相对于与第j个直接被投资节点的股权占比,i和j依次1至M,M为所述目标投资图谱中节点的数量;
基于所述第一直接投资数据确定第一间接投资数据包括:基于所述目标图谱矩阵确定所述第一间接投资数据。
3.根据权利要求2所述的方法,其特征在于,基于所述目标图谱矩阵确定所述第一间接投资数据包括:
通过公式P=MN计算所述第一间接投资数据,其中,M为所述目标图谱矩阵,P为所述第一间接投资数据,N为投资节点和间接被投资节点之间的投资层数,N为大于等于2,且小于等于H的正整数,H为最大投资层数。
4.根据权利要求3所述的方法,其特征在于,当N的取值为多个时,所述第一间接投资数据的数量为多个;
将所述第一直接投资数据和所述第一间接投资数据进行合并,得到第一目标投资数据包括:
将所述目标图谱矩阵和多个所述第一间接投资数据进行求和运算,得到所述第一目标投资数据。
5.根据权利要求2所述的方法,其特征在于,获取所述目标投资图谱的目标图谱矩阵包括:
获取所述目标投资图谱;
获取目标映射表,其中,所述目标映射表中包括所述目标投资图谱中每个节点的名称信息和每个节点的标识信息之间的关联关系;
基于所述目标映射表将所述目标投资图谱映射为所述目标投资图谱的所述目标图谱矩阵。
6.根据权利要求5中任一项所述的方法,其特征在于,所述第一目标投资数据为三元组数据(i,j,bij),其中,bij为所述第一目标投资数据中第i个投资节点相对于与第j个被投资节点之间的股权占比,i为所述第i个投资节点的标识信息,j为第j个被投资节点的标识信息;所述方法还包括:
获取目标映射表,其中,所述目标映射表中包括所述目标投资图谱中每个节点的名称信息和每个节点的标识信息之间的关联关系;
基于所述目标映射表将所述三元组数据中投资节点的标识信息和被投资节点的标识信息替换为对应的名称信息。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述方法还包括:
在检测到所述目标投资图谱中的投资数据发生变化之后,则按照所述目标投资图谱中发生变化的投资数据更新所述第一直接投资数据,得到第二直接投资数据;
基于所述第二直接投资数据确定第二间接投资数据;
将所述第二间接投资数据和所述第二直接投资数据进行合并,得到第二目标投资数据。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
在所述第一目标投资数据中确定与所述发生变化的投资数据相连通的第一连通投资数据,其中,在检测到所述发生变化的投资数据之后,所述第一连通投资数据发生变化;
在所述第二目标投资数据中确定与所述发生变化的投资数据相连通的第二连通投资数据;
将所述第一连通投资数据替换为所述第二连通投资数据。
9.一种数据处理装置,其特征在于,包括:
获取单元,用于获取包括多个节点的目标投资图谱的第一直接投资数据,所述第一直接投资数据中包括:投资节点相对于直接被投资节点的股权占比,所述投资节点和所述直接被投资节点为所述多个节点中的任意两个邻居节点;
确定单元,用于基于所述第一直接投资数据确定第一间接投资数据,其中,所述第一间接投资数据包括:投资节点相对于间接被投资节点的股权占比,所述间接被投资节点为所述多个节点中所述投资节点的间接投资节点;
合并单元,用于将所述第一直接投资数据和所述第一间接投资数据进行合并,得到第一目标投资数据。
10.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行上述权利要求1-8中任一所述的方法。
CN201810826359.2A 2018-07-25 2018-07-25 一种数据处理方法、装置和计算机可读介质 Active CN109002544B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810826359.2A CN109002544B (zh) 2018-07-25 2018-07-25 一种数据处理方法、装置和计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810826359.2A CN109002544B (zh) 2018-07-25 2018-07-25 一种数据处理方法、装置和计算机可读介质

Publications (2)

Publication Number Publication Date
CN109002544A true CN109002544A (zh) 2018-12-14
CN109002544B CN109002544B (zh) 2020-11-06

Family

ID=64597339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810826359.2A Active CN109002544B (zh) 2018-07-25 2018-07-25 一种数据处理方法、装置和计算机可读介质

Country Status (1)

Country Link
CN (1) CN109002544B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020788A (zh) * 2019-03-15 2019-07-16 阿里巴巴集团控股有限公司 目标实体资源分布的确定方法和装置
CN110147418A (zh) * 2019-04-18 2019-08-20 厦门市美亚柏科信息股份有限公司 一种判断地址是否标准化、地址标准化的方法及系统
CN113641878A (zh) * 2021-08-09 2021-11-12 平安科技(深圳)有限公司 适用于有向环路的实控人识别方法、装置、设备及介质
CN113641878B (zh) * 2021-08-09 2024-05-28 平安科技(深圳)有限公司 适用于有向环路的实控人识别方法、装置、设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8972467B2 (en) * 2010-08-31 2015-03-03 Sovanta Ag Method for selecting a data set from a plurality of data sets by means of an input device
CN105631047A (zh) * 2016-02-17 2016-06-01 中国工商银行股份有限公司 一种分层级联的数据处理方法及系统
CN105930461A (zh) * 2016-04-21 2016-09-07 成都数联铭品科技有限公司 实现关联信息节点可视化追踪的数据处理方法
CN106875110A (zh) * 2017-02-06 2017-06-20 泰康保险集团股份有限公司 业务指标分层计算方法及装置、分布式计算方法及系统
CN107358527A (zh) * 2017-06-19 2017-11-17 重庆誉存大数据科技有限公司 一种投资关系网络可视化分析方法及系统
CN108038136A (zh) * 2017-11-23 2018-05-15 上海斯睿德信息技术有限公司 基于图模型的企业知识图谱的建立方法和图形化查询方法
CN108256816A (zh) * 2017-09-15 2018-07-06 平安科技(深圳)有限公司 一种佣金数据处理方法、装置及设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8972467B2 (en) * 2010-08-31 2015-03-03 Sovanta Ag Method for selecting a data set from a plurality of data sets by means of an input device
CN105631047A (zh) * 2016-02-17 2016-06-01 中国工商银行股份有限公司 一种分层级联的数据处理方法及系统
CN105930461A (zh) * 2016-04-21 2016-09-07 成都数联铭品科技有限公司 实现关联信息节点可视化追踪的数据处理方法
CN106875110A (zh) * 2017-02-06 2017-06-20 泰康保险集团股份有限公司 业务指标分层计算方法及装置、分布式计算方法及系统
CN107358527A (zh) * 2017-06-19 2017-11-17 重庆誉存大数据科技有限公司 一种投资关系网络可视化分析方法及系统
CN108256816A (zh) * 2017-09-15 2018-07-06 平安科技(深圳)有限公司 一种佣金数据处理方法、装置及设备
CN108038136A (zh) * 2017-11-23 2018-05-15 上海斯睿德信息技术有限公司 基于图模型的企业知识图谱的建立方法和图形化查询方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020788A (zh) * 2019-03-15 2019-07-16 阿里巴巴集团控股有限公司 目标实体资源分布的确定方法和装置
CN110020788B (zh) * 2019-03-15 2023-12-29 创新先进技术有限公司 目标实体资源分布的确定方法和装置
CN110147418A (zh) * 2019-04-18 2019-08-20 厦门市美亚柏科信息股份有限公司 一种判断地址是否标准化、地址标准化的方法及系统
CN113641878A (zh) * 2021-08-09 2021-11-12 平安科技(深圳)有限公司 适用于有向环路的实控人识别方法、装置、设备及介质
CN113641878B (zh) * 2021-08-09 2024-05-28 平安科技(深圳)有限公司 适用于有向环路的实控人识别方法、装置、设备及介质

Also Published As

Publication number Publication date
CN109002544B (zh) 2020-11-06

Similar Documents

Publication Publication Date Title
CN108234524A (zh) 网络数据异常检测的方法、装置、设备及存储介质
CN110209660A (zh) 欺诈团伙挖掘方法、装置及电子设备
CN105634974B (zh) 软件定义网络中的路由确定方法和装置
CN109615524B (zh) 洗钱犯罪团伙的识别方法、装置、计算机设备及存储介质
CN109325525A (zh) 样本属性评估模型训练方法、装置及服务器
CN109685717A (zh) 图像超分辨率重建方法、装置及电子设备
CN109002544A (zh) 一种数据处理方法、装置和计算机可读介质
CN109300309A (zh) 路况预测方法及装置
CN109840533A (zh) 一种应用拓扑图识别方法及装置
CN110519106A (zh) 目标网络中设备类型的确定方法、装置及电子设备
CN110263145A (zh) 一种电子合同签署方法及电子合同签署设备
CN109710708A (zh) 一种电子地图映射方法及装置
CN107767152A (zh) 产品购买倾向分析方法及服务器
CN107003834A (zh) 行人检测设备和方法
CN109524099A (zh) 医疗机构推荐方法、服务器及用户终端
CN113609345B (zh) 目标对象关联方法和装置、计算设备以及存储介质
CN113312760A (zh) 一种基于交通仿真的网联机动车右转轨迹规划方法和装置
CN108984703A (zh) 一种统一资源定位符url去重方法及装置
CN108966283A (zh) 一种遥测数据压缩传输方法、装置和计算机可读介质
CN113850996A (zh) 路段公交线路重复系数数据计算方法、装置及存储介质
CN110310476B (zh) 道路拥堵程度的评估方法、装置、计算机设备及存储介质
CN114842659B (zh) 一种交通拥堵疏导方法及装置
CN109003148B (zh) 广告推送方法、装置、服务器及可读存储介质
CN109949398A (zh) 粒子渲染方法、装置及电子设备
CN110275895A (zh) 一种缺失交通数据的填充设备、装置及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant