CN113901279A

CN113901279A - 一种图数据库的检索方法和装置

Info

Publication number: CN113901279A
Application number: CN202111468911.3A
Authority: CN
Inventors: 吴涛
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2021-12-03
Filing date: 2021-12-03
Publication date: 2022-01-07
Anticipated expiration: 2041-12-03
Also published as: CN113901279B; WO2023098316A1

Abstract

本说明书实施例提供了一种图数据库的检索方法和装置,图数据库中存有第一图形，第一图形包括多个节点，以及连接多个节点的边，多个节点中包括第一节点，该方法包括：获取第一节点对应的第一标识；至少根据第一标识，从预先建立的倒排索引中，获取第一属性信息的存储位置，第一属性信息为第一节点的属性信息，或以第一节点为端点的第一边的属性信息；倒排索引中至少关联存储第一标识以及第一属性信息的存储位置；根据存储位置，获取第一属性信息。

Description

一种图数据库的检索方法和装置

技术领域

本说明书一个或多个实施例涉及图数据库领域，尤其涉及一种图数据库的检索方法和装置。

背景技术

图数据库是一种非关系型NoSQL数据库，它基于图形理论存储实体之间的关系信息。例如，存储社交网络中人与人之间的关系数据。传统的关系型SQL数据库在存储这类关系数据时，数据处理效果并不好。例如，关系数据库查询关联关系通常基于表连接，但是表连接操作代价昂贵，涉及到大量的IO操作及消耗大量内存，其查询较为复杂、缓慢。而图形数据库以更为直接和自然的方式存储实体间的关系，因此更方便关系数据的建模和处理，解决关系型数据的不足。

但是，现有的图数据库方案中，也存在数据检索、以及检索所依赖的数据访问的计算开销均比较大的问题。

因此，需要一种新的图数据库的检索方法。

发明内容

本说明书中的实施例旨在提供一种新的图数据库的检索方法，及其对应的数据保存和访问方法，降低图数据库中数据检索和数据维护对于计算资源的消耗，解决现有技术中的不足。

根据第一方面,提供了一种图数据库的检索方法，所述图数据库中存有第一图形，所述第一图形包括多个节点，以及连接多个节点的边，所述多个节点中包括第一节点，所述方法包括：

获取第一节点对应的第一标识；

至少根据第一标识，从预先建立的倒排索引中，获取第一属性信息的存储位置，所述第一属性信息为第一节点的属性信息，或以第一节点为端点的第一边的属性信息；所述倒排索引中至少关联存储第一标识以及第一属性信息的存储位置；

根据所述存储位置，获取第一属性信息。

在一种可能的实施方式中，所述第一属性信息保存于第一文件中，所述第一属性信息的存储位置包括，第一文件对应的文件编号和所述第一属性信息在第一文件中对应的偏移地址；

根据所述存储位置，获取第一属性信息，包括：

根据所述文件编号，从至少一个存储文件中确定第一文件；

根据所述偏移地址，从第一文件中获取第一属性信息。

在一种可能的实施方式中，所述倒排索引包括若干条索引记录，单条所述索引记录对应于第一图形中的一个对象，该对象为一个节点或一条边；

所述索引记录由第一键字段、第二键字段和地址字段构成，所述第一键字段用于保存所述索引记录对应的节点的标识，或所述索引记录对应的边的第一端点的标识；

所述第二键字段包括第一类型标识位，所述第一类型标识位用于标识该条索引记录对应的对象是边或是节点；

所述地址字段用于保存所述对象的属性信息的存储位置。

在一种可能的实施方式中，至少根据第一标识，从预先建立的倒排索引中，获取第一属性信息的存储位置，包括：

若所述第一属性信息为第一节点的属性信息，

从预先建立的倒排索引中，确定出第一键字段保存有第一标识、且第一类型标识位标识的对象为节点的第一索引记录；

根据所述第一索引的地址字段，确定第一属性信息的存储位置。

若所述第一属性信息为以第一节点为端点的第一边的属性信息，

从预先建立的倒排索引中，确定出第一键字段保存有第一标识、且第一类型标识位标识的对象为边的第二索引记录；

根据所述第二索引的地址字段，确定第一属性信息的存储位置。

在一种可能的实施方式中，所述第二键字段还包括第二类型标识位，若所述对象为边，且第一图形为有向图，则所述第二类型标识位用于标识所述索引记录对应的边的方向。

从预先建立的倒排索引中，确定出第一索引记录，所述第一索引记录的第一键字段保存有第一标识、第一类型标识位标识的对象为边、且第二类型标识位标识的边的方向为预知的第一方向；

在一种可能的实施方式中，所述第一方向为入边或出边。

在一种可能的实施方式中，所述第二键字段还包括标签标识位和/或时间戳标识位，所述标签标识位和时间戳标识位，分别用于标识该条索引记录对应的对象的分类标签和产生时间。

从预先建立的倒排索引中，确定出第一索引记录，所述第一索引记录的第一键字段保存有第一标识、且第一类型标识位标识的对象为边、且时间戳标识位标识的产生时间处于预知的第一时段内；

根据所述第一索引记录的地址字段，确定第一属性信息的存储位置。

从预先建立的倒排索引中，确定出第二索引记录，所述第二索引记录的第一键字段保存有第一标识、且第一类型标识位标识的对象为边、且标签标识位标识的分类标签为预知的第一标签；

根据所述第二索引记录的地址字段，确定第一属性信息的存储位置。

在一种可能的实施方式中，所述第一键字段为int类型。

在一种可能的实施方式中，所述第二键字段为long类型。

在一种可能的实施方式中，所述第一图形为有向图；所述第一边是以第一节点为起点的边。

在一种可能的实施方式中，所述倒排索引保存于内存中。

在一种可能的实施方式中，所述倒排索引根据节点的标识，被划分为多个索引页保存于内存中，其中每个索引页保存预定数量的索引记录。

在一种可能的实施方式中，所述方法还包括，

当所述倒排索引的容量超出预定的第一内存容量阈值，

从所述多个索引页中确定出若干转存索引页，并将所述转存索引页从内存中转存至永久存储器中。

在一种可能的实施方式中，所述方法还包括，

若所述倒排索引保存于内存中的索引页的总容量，低于预定的第二内存容量阈值，且，当永久存储空间中保存有所述转存索引页，

则从所述转存索引页中确定出若干回存索引页，将所述回存索引页从永久存储器转存到内存中。

在一种可能的实施方式中，所述第一文件包括若干条属性记录，单条所述属性记录对应于一个对象，并包括该对象的属性信息，该对象为第一图形中的一个节点或一条边。

在一种可能的实施方式中，若所述对象为边，所述属性记录中还包括该条边的另一端节点的标识。

在一种可能的实施方式中，所述第一文件分块压缩后，存储于永久存储器中。

在一种可能的实施方式中，根据所述偏移地址，从第一文件中获取第一属性信息，包括：

根据所述偏移地址，确定第一属性信息所属的所述第一文件的第一文件块；

从永久存储器中提取第一文件块对应的压缩文件块，解压缩所述压缩文件块，获取第一文件块；

从第一文件块中，获取第一属性信息。

根据第二方面，提供一种图数据库的检索装置，所述图数据库中存有第一图形，所述第一图形包括多个节点，以及连接多个节点的边，所述多个节点中包括第一节点，所述方法装置包括：

标识获取单元，配置为，获取第一节点对应的第一标识；

存储位置获取单元，配置为，至少根据第一标识，从预先建立的倒排索引中，获取第一属性信息的存储位置，所述第一属性信息为第一节点的属性信息，或以第一节点为端点的第一边的属性信息；所述倒排索引中至少关联存储第一标识以及第一属性信息的存储位置；

属性信息获取单元，配置为，根据所述存储位置，获取第一属性信息。

根据第三方面,提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行第一方面所述的方法。

根据第四方面,提供了一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现第一方面所述的方法。

利用以上各个方面中的方法、装置、计算设备、存储介质中的一个或多个，可以有效的降低图数据库中的数据检索和维护消耗的计算资源，进而提高图数据的处理量和处理速度。

附图说明

为了更清楚说明本发明实施例的技术方案，下面将对实施例描述中所需使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出现有图数据库的检索方法的原理示意图；

图2示出根据本说明书实施例的一种图数据库的检索方法的原理示意图；

图3示出根据本说明书实施例的一种图数据库的检索方法的流程图；

图4示出根据本说明书实施例的第二键字段的结构图；

图5示出根据本说明书实施例的一种图数据库的检索装置的结构图。

具体实施方式

下面将结合附图，对本发明书提供的方案进行描述。

如前所述，在需要处理和保存数据与数据之间的关系，特别是多层关系的时候，传统的关系型数据库由于通常需要使用大量join操作，性能消耗很大。尤其是在处理数据量很大的时候，处理效率难以令人满意。

因此，一些技术方案利用图数据库，来保护和处理数据及其之间的关系。图数据库通过保存节点、以及节点之间的边构成的图的方式，来直接保存数据及其之间的关系。相对于传统数据通过消耗 JOIN 操作把不同的表链接起来，从而隐式地表达数据之间的关系，图数据库中直接的关系表示方式，使得利用图数据库在处理数据及其之间的关系时，具有明显更高的处理效率。

但是，发明人研究发现，一些图数据库方案，也存在数据检索、以及检索所依赖的数据访问的计算开销均比较大的问题。以一种图数据库方案为例，在该技术方案中，将数据库中所保存的图中的例如节点、关系（边）、属性（节点或关系的）等数据分别保存在不同类型的数据存储文件中。在一个例子中，例如分别将节点、关系、属性数据保存在节点数据文件nodestore.db、边数据文件relationshipstore.db和属性数据文件propertystore.db中。并且，对所有的属性、节点和边均建立内部维护的标识ID，并通过所述ID进行访问。图1示出该图数据库的检索方法的原理示意图。如图1所示，例如，当已知一个节点（node），需要获取以它为端点（例如以它为起点）的一条边（例如第一条边）的属性时，可以先根据该节点的ID（例如为节点2，这里称‘节点2’只是为了方便描述，并不暗示ID的数据类型），从节点数据文件中，查找‘节点2’的第一条边的ID，例如为‘边2’。然后，根据边ID‘边2’，从边数据文件中，查找到‘边2’的属性的ID，例如为‘属性3’。最后，根据‘属性3’从属性数据文件中查找到‘属性3’的属性值。从上述过程可以可知，其存在如下问题：1、各种的数据都要进行id化，且其进一步的数据处理中需要进行id转换后才能进行，由于所有数据的ID化累计的计算性能消耗较大，限制了图数据库所能处理的总数据量。2、所有信息都存储在数据存储文件中，存取和维护这些数据存储文件的开销非常大。由于数据存储文件通常数据量较大，因此通常保存在永久存储器（例如磁盘）中，每次访问都需要对磁盘进行访问。磁盘访问的速度本身较慢，使得整体的数据访问和处理的速度较慢。3、检索数据常常需要跳转多个数据存储文件，每次都需要通过访问一种文件来确定下一个需要访问的信息的地址，这种链式的进行文件读取，访问的开销也是非常大的。

为了解决上述技术问题，本说明书实施例提供了一种图数据库的检索方法。该方法的核心思想是，在内存中建立用于检索的倒排索引，然后根据该倒排索引，可以直接检索到节点和边的属性保存的地址，进而可以以极少的计算消耗，获取到节点和边的属性。图2示出根据本说明书实施例的一种图数据库的检索方法的原理示意图。在图2所示的实施例中，倒排索引中每条索引可以对应于一个节点或一条边，每条记录例如可以由三个字段构成，其中，第一键字段保存节点ID或者保存边的例如起点ID，第二键字段可以包括用于指示该条记录对应的是节点或是边的标识位，还可以包括例如节点/边的分类标签标识位等，第三字段则包括该条记录对应的节点/边的属性数据的保存地址。在一个实施例中，第三字段例如包括该属性数据所存储于的属性数据文件的文件编号、以及在该属性数据在该文件中的偏移地址。从上述可见，第一字段和第二字段主要用于指示属性所从属的节点或边，第三字段用于保存属性的地址。因此，本说明书中也将第一字段和第二字段称之为第一键字段和第二键字段，第三字段称之地址地段。需要注意的是，这里称第一、第二‘键’字段中仅是方便表述上述指示之意。并非等同于暗示其如同一些‘特定键’（例如哈西表中‘键值对中的键’）一样，必须是一种哈西值。

因此，在实际检索中，例如当需要检索以节点1为起点的边的属性时，可以很方便的通过节点1的ID，以及例如该边的其他条件（例如边的分类（类别）标签、边的方向等），快速从倒排索引中检索到该条边对应的索引记录，然后从该条记录的地址字段得到该边的属性所存储的地址，例如包括文件的编号（例如文件1）和在文件中的偏移地址，进而快速从文件1中提取该边的属性数据，整个检索操作的算法复杂度理论上大致为O（1）。

由此可见，使用该方法具有如下优点：1、只对少量数据-例如对节点，进行ID化，使数据处理中数据ID化的计算开销大大减少，进而提高图数据库的数据处理量。2、倒排索引主要保存在内存中，尤其在是数据量较少时，倒排索引可以全部保存在内存中，因此，利用倒排索引进行检索，相对于利用硬盘中保存的数据存储文件（由于数据存储文件通常较大，难以全部放置在内存中）进行检索，大大提高了检索效率。3、通过节点ID/起点ID，或者一些附加的条件，可以从倒排索引快速检索到目标索引记录，并从目标索引记录的地址字段，直接定位需要访问的数据位置，相对于现有技术中通常需要在多个数据存储文件中进行多次跳传，才能检索到最终结果，文件访问的开销大为减少。

下面进一步阐述该方法的详细过程。图3示出根据本说明书实施例的一种图数据库的检索方法的流程图。如图3所述，该方法至少包括如下步骤：

步骤31，获取第一节点对应的第一标识；

步骤32，至少根据第一标识，从预先建立的倒排索引中，获取第一属性信息的存储位置，所述第一属性信息为第一节点的属性信息，或以第一节点为端点的第一边的属性信息；所述倒排索引中至少关联存储第一标识以及第一属性信息的存储位置；

步骤33，根据所述存储位置，获取第一属性信息。

首先，在步骤31，获取第一节点对应的第一标识。

该步骤中，第一节点可以是图数据库中任意的图的任意节点。对于任意的节点，均有与其相对应的节点标识，即节点ID。第一标识，即第一节点对应的节点ID。在不同类型的实施例中，节点ID的数据类型可以不同。在一个具体的实施例中，节点ID的数据类型可以为整数型，例如short型、int型、long型。

然后，在步骤32，至少根据第一标识，从预先建立的倒排索引中，获取第一属性信息的存储位置。

该步骤中，预先建立的倒排索引中可以关联保存了节点/边、以及它们的属性的存储地址。根据一种实施方式，倒排索引可以包括若干条索引记录，单条所述索引记录对应于第一图形中的一个对象，该对象为一个节点或一条边；所述索引记录可以由第一键字段、第二键字段和地址字段构成，所述第一键字段用于保存所述索引记录对应的节点的标识，或所述索引记录对应的边的第一端点的标识；所述第二键字段包括第一类型标识位，所述第一类型标识位用于标识该条索引记录对应的对象是边或是节点；所述地址字段用于保存所述对象的属性信息的存储位置。

进而，在一个实施例中，若所述第一属性信息为第一节点的属性信息，可以从预先建立的倒排索引中，确定出第一键字段保存有第一标识、且第一类型标识位标识的对象为节点的第一索引记录；然后，根据所述第一索引记录的地址字段，确定第一属性信息的存储位置。在另一个实施例中，若所述第一属性信息为以第一节点为端点的第一边的属性信息，可以从预先建立的倒排索引中，确定出第一键字段保存有第一标识、且第一类型标识位标识的对象为边的第二索引记录；根据所述第二索引记录的地址字段，确定第一属性信息的存储位置。

在不同的实施例中，图数据库中保存的图可以是有向图。为了便于有向图中，可以根据边的方向进行检索，在一个实施例中，第二键字段还可以包括第二类型标识位，若所述对象为边，且第一图形为有向图，则所述第二类型标识位用于标识所述索引记录对应的边的方向。上述边的方向可以为入边或出边。所谓入边，该边的方向是从其他节点指向该索引记录的第一键字段记录的节点，例如第一节点，即以第一节点为终点。所谓出边，是指该边的方向，是从第一节点指向其他节点，即以第一节点为起点。

在一个具体的实施例中，若所述第一属性信息为以第一节点为端点的第一边的属性信息，可以从预先建立的倒排索引中，确定出第三索引记录，所述第三索引记录的第一键字段保存有第一标识、第一类型标识位标识的对象为边、且第二类型标识位标识的边的方向为预知的第一方向；根据所述第三索引的地址字段，确定第一属性信息的存储位置。如此，以预先已知的第一方向作为进一步的检索条件，确定出第一属性信息的存储位置。在一个具体的实施例中，第一图形为有向图；第一边是以第一节点为起点的边。

在不同的实施例中，倒排索引中还可以进一步保存节点和/或边的，例如分类标识和/或生成时间戳。用于在检索中，根据分类标识和/或生成时间戳，确定节点或边的对应索引记录。因此，在一个实施例中，所述第二键字段还包括标签标识位和/或时间戳标识位，所述标签标识位和时间戳标识位，分别用于标识该条索引记录对应的对象的分类标签和产生时间。在一个具体的实施例中，若所述第一属性信息为以第一节点为端点的第一边的属性信息，可以从预先建立的倒排索引中，确定出第一索引记录，所述第一索引记录的第一键字段保存有第一标识、且第一类型标识位标识的对象为边、且时间戳标识位标识的产生时间处于预知的第一时段内；然后，根据所述第一索引记录的地址字段，确定第一属性信息的存储位置。如此，以关系产生的时段（边的时间戳所属时段）作为进一步的检索条件，快速确定出预定时段内产生的目标连接边对应的属性信息的存储位置。

在另一个具体的实施例中，若所述第一属性信息为以第一节点为端点的第一边的属性信息，可以从预先建立的倒排索引中，确定出第二索引记录，所述第二索引记录的第一键字段保存有第一标识、且第一类型标识位标识的对象为边、且标签标识位标识的分类标签为预知的第一标签；根据所述第二索引记录的地址字段，确定第一属性信息的存储位置。如此，以关系的类型（边的标签）作为进一步的检索条件，快速确定出预定类型的目标连接边对应的属性信息的存储位置。

如前所述，在不同的实施例中，节点ID可以是不同的数据类型。与之对应的，在不同的实施例中，第一键字段也可以相应的为不同的数据类型。并且，在不同的实施例中，第二键字段也可以为不同的数据类型。在一个实施例中，第一键字段可以为int类型，第二键字段可以为long类型。

图4示出根据本说明书实施例的第二键字段的结构图。如图4所示，第二键字段为long型字段（64个bit），并包括1个bit的第一类型标识位isVertex（1），1个bit的第二类型标识位inEdge(1)，还包括一个bit的有值标识位hasValue(1)，10个bit的分类标签标识位label(10)，42个bit的时间戳标识位time(42)，以及有值标识位和分类标签标识位之间的3bit空白位blank(3)、分类标签标识位和时间戳标识位之间的3bit空白位blank(6)。具体的，例如当第一类型标识位的取值为‘1’时，表示该条索引记录对应于节点，当第一类型标识位的取值为‘0’时，表示该条索引记录对应于边。例如当第二类型标识位的取值为‘1’时，表示该条索引记录对应的边的方向为入边，当第二类型标识位的取值为‘0’时，表示该条索引记录对应的对象（节点/边）的方向为出边。例如当有值标识位的取值为‘1’时，表示该条索引记录对应的对象（节点/边），具有保存于属性文件中的属性数据，进而例如可以根据该索引记录的地址字段，确定该属性数据的存储地址。当有值标识位的的取值为‘0’时，表示该条索引记录对应的对象（节点/边），不具有保存于属性文件中的属性数据，因此无需进一步查找该数据。分类标签标识位和时间戳标识位，分别用来保存条索引记录对应的对象（节点/边）的分类标签和生成时间戳。在不同的实施例中，分类标签和生成时间戳，可以具有不同的编码方式，本说明书不做限制。在不同的实施例中，第二键字段也可以具有不同的具体结构，本说明书不做限制。

可以理解，内存访问操作的速度通常大大高于永久存储器（例如硬盘），将倒排索引放置于内存中用于图数据检索，可以大大提高检索速度。因此，在一个实施例中，所述倒排索引可以保存于内存中。具体的，在一个实施例中，倒排索引可以根据节点的标识，被划分为多个索引页保存于内存中，其中每个索引页保存预定数量的索引记录。在一个例子中，例如每个索引页保存1000条索引记录。

但是，若倒排索引的容量超过一定范围，使其难以全部保存于内存中，可以将倒排索引的一部分转存到永久存储器中。因此，在一个实施例中，当所述倒排索引的容量超出预定的第一内存容量阈值，可以从所述多个索引页中确定出若干转存索引页，并将所述转存索引页从内存中转存至永久存储器中。后续运行中，例如当保存于内存中的索引页的容量减少时，还可以将转存至永久存储器的索引页回存到内存中。因此，在另一个实施例中，若所述倒排索引保存于内存中的索引页的总容量，低于预定的第二内存容量阈值，且，当永久存储空间中保存有所述转存索引页，则可以从所述转存索引页中确定出若干回存索引页，将所述回存索引页从永久存储器转存到内存中。

接着，在步骤33，根据所述存储位置，获取第一属性信息。

图数据库中的属性信息保存于属性数据文件中，由于图数据库中的属性信息的数据量通常比较大，所以属性数据文件可以有多个。因此，在一个实施例中，第一属性信息可以保存于第一文件中，所述第一属性信息的存储位置可以包括，第一文件对应的文件编号和所述第一属性信息在第一文件中对应的偏移地址；根据所述文件编号，从至少一个存储文件中确定第一文件；根据所述偏移地址，从第一文件中获取第一属性信息。在一个实施例中，第一文件可以包括若干条属性记录，单条所述属性记录对应于一个对象，并包括该对象的属性信息，该对象为第一图形中的一个节点或一条边。在一个实施例中，若所述对象为边，所述属性记录中还可以包括该条边的另一端节点的标识。

在不同的实施例中，属性存储文件可以保存于不同的存储器中，例如内存和永久存储器中。在一个实施例中，由于属性存储文件的数据量通常也较大，因此通常可以将其保存于永久存储器中。本说明书中所述的永久存储器，是指断电后其存储内容不会丢失的存储器，例如硬盘、移动硬盘、闪存，以及例如TF卡、SD卡等永久性存储卡，在不同的具体实施例中，可以采用不同的具体永久存储器，本说明书对此不做限制。

为了提高属性数据的访问速度，可以将属性存储文件分块存储，从而在访问具体的属性数据时，只需要访问具体属性数据所属的文件块即可，而无须对整个属性存储文件进行操作。因此，在一个实施例中，可以将第一文件分块压缩后，存储于永久存储器中。进而，在一个具体的实施例中，可以根据所述偏移地址，确定第一属性信息所属的所述第一文件的第一文件块；从永久存储器中提取第一文件块对应的压缩文件块，解压缩所述压缩文件块，获取第一文件块；从第一文件块中，获取第一属性信息。例如，在一个例子中，希望提取文件编号3的属性文件中的偏移地址为1000的属性信息，可以找到文件编号3的属性文件，确定该文件中偏移地址1000所属的文件块（block）对应的压缩文件块，解压该压缩文件块，从中获取偏移地址为1000的属性信息。在实际生产场景中，属性信息通常具有其具体的数据类型（例如object类型），或包括进一步细化的属性项。在不同的实施例中，属性信息可以具有不同的具体数据类型和具体属性项，本说明书对此不做限定。在不同的实施例中，还可以根据具体数据类型的结构和具体属性项的划分，解析其属性信息，本说明书对于具体解析方式也不做限定。

根据另一方面的实施例，还提供一种图数据库的检索装置。图5示出根据本说明书实施例的一种图数据库的检索装置的结构图。所述图数据库中存有第一图形，所述第一图形包括多个节点，以及连接多个节点的边，所述多个节点中包括第一节点。如图5所示，该装置500包括：

标识获取单元51，配置为，获取第一节点对应的第一标识；

存储位置获取单元52，配置为，至少根据第一标识，从预先建立的倒排索引中，获取第一属性信息的存储位置，所述第一属性信息为第一节点的属性信息，或以第一节点为端点的第一边的属性信息；所述倒排索引中至少关联存储第一标识以及第一属性信息的存储位置；

属性信息获取单元53，配置为，根据所述存储位置，获取第一属性信息。

在一个实施例中，所述第一属性信息可以保存于第一文件中，所述第一属性信息的存储位置包括，第一文件对应的文件编号和所述第一属性信息在第一文件中对应的偏移地址；

根据所述存储位置，获取第一属性信息，包括：

根据所述文件编号，从至少一个存储文件中确定第一文件；

根据所述偏移地址，从第一文件中获取第一属性信息。

在一个实施例中，所述倒排索引可以包括若干条索引记录，单条所述索引记录对应于第一图形中的一个对象，该对象为一个节点或一条边；

所述地址字段用于保存所述对象的属性信息的存储位置。

在一个实施例中，存储位置获取单元，可以进一步配置为，

若所述第一属性信息为第一节点的属性信息，

在一个实施例中，存储位置获取单元，可以进一步配置为，

在一个实施例中，所述第二键字段还可以包括第二类型标识位，若所述对象为边，且第一图形为有向图，则所述第二类型标识位用于标识所述索引记录对应的边的方向。

在一个实施例中，存储位置获取单元，可以进一步配置为，

在一个实施例中，所述第一方向为入边或出边。

在一个实施例中，所述第二键字段还包括标签标识位和/或时间戳标识位，所述标签标识位和时间戳标识位，分别用于标识该条索引记录对应的对象的分类标签和产生时间。

在一个实施例中，存储位置获取单元，可以进一步配置为，

从预先建立的倒排索引中，确定出第一索引记录，所述第一索引记录的第一键字段保存有第一标识、且第一类型标识位标识的对象为边、且时间戳标识位标识的产生时间处于预知的第一时段内；根据所述第一索引记录的地址字段，确定第一属性信息的存储位置。

在一个实施例中，存储位置获取单元，可以进一步配置为，

从预先建立的倒排索引中，确定出第二索引记录，所述第二索引记录的第一键字段保存有第一标识、且第一类型标识位标识的对象为边、且标签标识位标识的分类标签为预知的第一标签；根据所述第二索引记录的地址字段，确定第一属性信息的存储位置。

在一个实施例中，所述第一键字段可以为int类型。

在一个实施例中，所述第二键字段可以为long类型。

在一个实施例中，所述第一图形为有向图；所述第一边是以第一节点为起点的边。

在一个实施例中，所述倒排索引保存于内存中。

在一个实施例中，所述倒排索引根据节点的标识，被划分为多个索引页保存于内存中，其中每个索引页保存预定数量的索引记录。

在一个实施例中，所述装置还包括，转存单元，可以配置为：

当所述倒排索引的容量超出预定的第一内存容量阈值，

在一个实施例中，所述装置还包括，回存单元，可以配置为：

在一个实施例中，所述第一文件可以包括若干条属性记录，单条所述属性记录对应于一个对象，并包括该对象的属性信息，该对象为第一图形中的一个节点或一条边。

在一个实施例中，若所述对象为边，所述属性记录中还包括该条边的另一端节点的标识。

在一个实施例中，所述第一文件分块压缩后，存储于永久存储器中。

在一个实施例中，属性信息获取单元，可以进一步配置为：根据所述偏移地址，确定第一属性信息所属的所述第一文件的第一文件块；从永久存储器中提取第一文件块对应的压缩文件块，解压缩所述压缩文件块，获取第一文件块；从第一文件块中，获取第一属性信息。

本说明书又一方面提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行上述任一项方法。

本说明书再一方面提供一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现上述任一项方法。

需要理解，本文中的“第一”，“第二”等描述，仅仅为了描述的简单而对相似概念进行区分，并不具有其他限定作用。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种图数据库的检索方法，所述图数据库中存有第一图形，所述第一图形包括多个节点，以及连接多个节点的边，所述多个节点中包括第一节点，所述方法包括：

获取第一节点对应的第一标识；

根据所述存储位置，获取第一属性信息。

2.根据权利要求1所述的方法，其中，所述第一属性信息保存于第一文件中，所述第一属性信息的存储位置包括，第一文件对应的文件编号和所述第一属性信息在第一文件中对应的偏移地址；

根据所述存储位置，获取第一属性信息，包括：

根据所述文件编号，从至少一个存储文件中确定第一文件；

根据所述偏移地址，从第一文件中获取第一属性信息。

3.根据权利要求1所述的方法，其中，所述倒排索引包括若干条索引记录，单条所述索引记录对应于第一图形中的一个对象，该对象为一个节点或一条边；

所述地址字段用于保存所述对象的属性信息的存储位置。

4.根据权利要求3所述的方法，其中，

至少根据第一标识，从预先建立的倒排索引中，获取第一属性信息的存储位置，包括：

若所述第一属性信息为第一节点的属性信息，

从所述若干条索引记录中，确定出第一索引记录，所述第一索引记录的第一键字段保存有第一标识，且第一类型标识位标识的对象为节点；

5.根据权利要求3所述的方法，其中，

从所述若干条索引记录中，确定出第二索引记录，所述第二索引记录的第一键字段保存有第一标识，且第一类型标识位标识的对象为边；

6.根据权利要求3所述的方法，其中，所述第二键字段还包括第二类型标识位，若所述对象为边，且第一图形为有向图，则所述第二类型标识位用于标识所述索引记录对应的边的方向。

7.根据权利要求6所述的方法，其中，

从所述若干条索引记录中，确定出第三索引记录，所述第三索引记录的第一键字段保存有第一标识，第一类型标识位标识的对象为边，且第二类型标识位标识的方向为预知的第一方向；

根据所述第三索引记录的地址字段，确定第一属性信息的存储位置。

8.根据权利要求7所述的方法，其中，所述第一方向为入边或出边。

9.根据权利要求3所述的方法，其中，所述第二键字段还包括标签标识位和/或时间戳标识位，所述标签标识位和时间戳标识位，分别用于标识该条索引记录对应的对象的分类标签和产生时间。

10.根据权利要求9所述的方法，其中，

从所述若干条索引记录中，确定出第一索引记录，所述第一索引记录的第一键字段保存有第一标识，第一类型标识位标识的对象为边，且时间戳标识位标识的产生时间处于预知的第一时段内；

11.根据权利要求9所述的方法，其中，

从所述若干条索引记录中，确定出第二索引记录，所述第二索引记录的第一键字段保存有第一标识，第一类型标识位标识的对象为边，且标签标识位标识的分类标签为预知的第一标签；

12.根据权利要求3所述的方法，所述第一键字段为int类型。

13.根据权利要求3所述的方法，所述第二键字段为long类型。

14.根据权利要求1所述的方法，其中，所述第一图形为有向图；所述第一边是以第一节点为起点的边。

15.根据权利要求1所述的方法，其中，所述倒排索引保存于内存中。

16.根据权利要求15所述的方法，其中，所述倒排索引根据节点的标识，被划分为多个索引页保存于内存中，其中每个索引页保存预定数量的索引记录。

17.根据权利要求16所述的方法，还包括，

当所述倒排索引的容量超出预定的第一内存容量阈值，

18.根据权利要求17所述的方法，还包括，

19.根据权利要求2所述的方法，其中，所述第一文件包括若干条属性记录，单条所述属性记录对应于一个对象，并包括该对象的属性信息，该对象为第一图形中的一个节点或一条边。

20.根据权利要求19所述的方法，其中，若所述对象为边，所述属性记录中还包括该条边的另一端节点的标识。

21.根据权利要求2所述的方法，其中，所述第一文件分块压缩后，存储于永久存储器中。

22.根据权利要求21所述的方法，其中，根据所述偏移地址，从第一文件中获取第一属性信息，包括：

从第一文件块中，获取第一属性信息。

23.一种图数据库的检索装置，所述图数据库中存有第一图形，所述第一图形包括多个节点，以及连接多个节点的边，所述多个节点中包括第一节点，所述方法装置包括：

标识获取单元，配置为，获取第一节点对应的第一标识；

24.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-22中任一项的所述的方法。

25.一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-22中任一项所述的方法。