WO2023066221A1 - 图数据库处理 - Google Patents

图数据库处理 Download PDF

Info

Publication number
WO2023066221A1
WO2023066221A1 PCT/CN2022/125821 CN2022125821W WO2023066221A1 WO 2023066221 A1 WO2023066221 A1 WO 2023066221A1 CN 2022125821 W CN2022125821 W CN 2022125821W WO 2023066221 A1 WO2023066221 A1 WO 2023066221A1
Authority
WO
WIPO (PCT)
Prior art keywords
edge
edge data
graph database
data
timestamp
Prior art date
Application number
PCT/CN2022/125821
Other languages
English (en)
French (fr)
Inventor
朱博尧
Original Assignee
支付宝(杭州)信息技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 支付宝(杭州)信息技术有限公司 filed Critical 支付宝(杭州)信息技术有限公司
Publication of WO2023066221A1 publication Critical patent/WO2023066221A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists

Abstract

本说明书的实施例提供图数据库处理方法及装置。在该图数据库处理方法中,获取图数据库系统的当前系统时间;并且从图数据库中获取各个边数据的时间戳。基于当前系统时间、各个边数据的时间戳以及各个边数据的存活时间,从各个边数据中确定出过期边数据。响应于确定出过期边数据,从图数据库中删除所确定出的过期边数据。

Description

图数据库处理 技术领域
本说明书实施例通常涉及数据库领域,尤其涉及图数据库处理方法及装置。
背景技术
图数据以图数据库的形式存储在图数据存储设备或图数据处理设备的内存中。图数据库中的边数据通常具有时效性,随着时间推移,图数据库中的部分边数据将会过期而不再发挥作用,从而需要从图数据库中确定出过期边数据,并且从图数据库中清除该过期边数据。
发明内容
鉴于上述,本说明书实施例提供图数据库处理方法及装置。利用该图数据库处理方法及装置,可以从图数据库中高效地确定出过期边数据。
根据本说明书实施例的一个方面,提供一种图数据库处理方法,包括:获取图数据库系统的当前系统时间;从图数据库中获取各个边数据的时间戳;以及基于所述当前系统时间、各个边数据的时间戳以及各个边数据的存活时间,从各个边数据中确定出过期边数据。
可选地,在上述方面的一个示例中,所述图数据库处理方法还可以包括:响应于确定出过期边数据,从所述图数据库中删除所确定出的过期边数据。
可选地,在上述方面的一个示例中,边数据的边标识包括时间戳。从图数据库中获取各个边数据的时间戳可以包括:从图数据库中获取各个边数据;从所获取的各个边数据中提取边标识;对各个边数据的边标识进行解析;以及从解析后的各个边数据的边标识中提取各个边数据的时间戳。
可选地,在上述方面的一个示例中,边数据的边属性包括时间戳属性。从图数据库中获取各个边数据的时间戳可以包括:从图数据库中获取各个边数据;从所获取的各个边数据中提取边属性;对所提取的各个边数据的边属性进行解析;以及从解析后的各个边数据的边属性中提取各个边数据的时间戳。
可选地,在上述方面的一个示例中,各个边数据的存活时间包括用户输入的各个边数据的存活时间。
可选地,在上述方面的一个示例中,边数据的边标识包括边类型。所述图数据库处理方法还可以包括:从解析后的各个边数据的边标识中提取各个边数据的边类型;以及 基于各个边数据的边类型,从所述图数据库系统的系统配置文件中获取各个边数据的存活时间。
根据本说明书的实施例的另一方面,提供一种图数据库处理方法,图数据库中的边数据的边标识包括起点ID、边类型、时间戳和终点ID,并且边数据按照起点ID、边类型、时间戳和终点ID进行排序后按序存储在图数据库中,所述图数据库处理方法包括:获取图数据库系统的当前系统时间;基于边标识中的起点ID和边类型,对图数据库中的边数据进行分类;以及对于每类边数据,基于所述当前系统时间以及该边类型对应的存活时间确定出该类边数据中的第一条过期边数据,并且将该类边数据中时间戳排在所述第一条过期边数据之后的所有边数据确定为过期边数据。
可选地,在上述方面的一个示例中,所述边数据的分类过程和/或所述第一条过期边数据的确定过程基于二分法实现。
根据本说明书的实施例的另一方面,提供一种图数据库处理装置,包括:系统时间获取单元,获取图数据库系统的当前系统时间;时间戳获取单元,从图数据库中获取各个边数据的时间戳;以及过期数据确定单元,基于所述当前系统时间、各个边数据的时间戳以及各个边数据的存活时间,从各个边数据中确定出过期边数据。
可选地,在上述方面的一个示例中,所述图数据库处理装置还可以包括:过期数据删除单元,响应于确定出过期边数据,从所述图数据库中删除所确定出的过期边数据。
可选地,在上述方面的一个示例中,边数据的边标识包括时间戳。相应地,所述时间戳获取单元可以包括:边数据获取模块,从图数据库中获取各个边数据;边标识提取模块,从所获取的各个边数据中提取边标识;边标识解析模块,对各个边数据的边标识进行解析;以及时间戳提取模块,从解析后的各个边数据的边标识中提取各个边数据的时间戳。
可选地,在上述方面的一个示例中,边数据的边属性包括时间戳属性。相应地,所述时间戳获取单元可以包括:边数据获取模块,从图数据库中存储的图数据中获取各个边数据;边属性提取模块,从所获取的各个边数据中提取边属性;边属性解析模块,对所提取的各个边数据的边属性进行解析;以及时间戳提取模块,从解析后的各个边数据的边属性中提取各个边数据的时间戳。
可选地,在上述方面的一个示例中,所述图数据库处理装置还可以包括:存活时间获取单元,获取用户输入的各个边数据的存活时间。
可选地,在上述方面的一个示例中,边数据的边标识包括边类型。相应地,所述图数据库处理装置还可以包括:边类型提取单元,从解析后的各个边数据的边标识中提取 各个边数据的边类型;以及存活时间获取单元,基于各个边数据的边类型,从所述图数据库系统的系统配置文件中获取各个边数据的存活时间。
根据本说明书的实施例的另一方面,提供一种图数据库处理装置,图数据库中的边数据的边标识包括起点ID、边类型、时间戳和终点ID,并且边数据按照起点ID、边类型、时间戳和终点标识进行排序后按序存储在图数据库中,所述图数据库处理装置包括:系统时间获取单元,获取图数据库系统的当前系统时间;边数据分类单元,基于边标识中的起点标识和边类型,对图数据库中的边数据进行分类;以及过期数据确定单元,对于每类边数据,基于所述当前系统时间以及该边类型对应的存活时间确定出该类边数据中的第一条过期边数据,并且将该类边数据中时间戳排在所述第一条过期边数据之后的所有边数据确定为过期边数据。
根据本说明书的实施例的另一方面,提供一种图数据库处理装置,包括:至少一个处理器,与所述至少一个处理器耦合的存储器,以及存储在所述存储器中的计算机程序,所述至少一个处理器执行所述计算机程序来实现如上所述的图数据库处理方法。
根据本说明的实施例的另一方面,提供一种计算机可读存储介质,其存储有可执行指令,所述指令当被执行时使得处理器执行如上所述的图数据库处理方法。
根据本说明书的实施例的另一方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行来实现如上所述的图数据库处理方法。
附图说明
通过参照下面的附图,可以实现对于本说明书内容的本质和优点的进一步理解。在附图中,类似组件或特征可以具有相同的附图标记。
图1示出了根据本说明书的实施例的图数据库中存储的图数据的数据结构的示例示意图。
图2示出了根据本说明书的实施例的图数据库处理方法的示例流程图。
图3示出了根据本说明书的实施例的时间戳获取过程的示例流程图。
图4示出了根据本说明书的实施例的时间戳获取过程的另一示例流程图。
图5示出了根据本说明书的实施例的存活时间获取过程的示例流程图。
图6示出了根据本说明书的实施例的图数据库处理方法的另一示例流程图。
图7示出了根据本说明书的实施例的图数据库处理装置的示例方框图。
图8示出了根据本说明书的实施例的时间戳获取单元的示例方框图。
图9示出了根据本说明书的实施例的时间戳获取单元的另一示例方框图。
图10示出了根据本说明书的实施例的图数据库处理装置的另一示例方框图。
图11示出了根据本说明书的实施例的基于计算机系统实现的图数据库处理装置的示例示意图。
具体实施方式
现在将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本说明书内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。例如,所描述的方法可以按照与所描述的顺序不同的顺序来执行,以及各个步骤可以被添加、省略或者组合。另外,相对一些示例所描述的特征在其它例子中也可以进行组合。
如本文中使用的,术语“包括”及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义,无论是明确的还是隐含的。除非上下文中明确地指明,否则一个术语的定义在整个说明书中是一致的。
图数据包括顶点数据和边数据。顶点数据例如可以包括顶点标识和顶点属性,以及边数据可以包括起点ID、终点ID以及边属性。顶点标识用于唯一标识顶点。顶点标识、顶点属性和边属性可以与业务相关。比如,对于社交网络场景,顶点标识可以是人的身份证号码或者人员编号等。顶点属性可以包括年龄、学历、住址、职业等。边属性可以包括顶点与顶点之间的关系,即,人与人之间的关系,比如,同学/同事关系等。
下面将参照附图描述根据本说明书的实施例的图数据库处理方法及图数据库处理装置。
图1示出了根据本说明书的实施例的图数据库中存储的图数据的数据结构的示例示意图。
如图1所示,顶点数据可以包括顶点标识和顶点属性。相应地,顶点数据的数据存储结构可以包括顶点标识字段和顶点属性字段。顶点标识字段用于存储顶点的顶点标识。顶点标识可以包括顶点ID和顶点类型。在另一示例中,顶点标识也可以仅仅包括顶点ID。顶点属性字段用于存储顶点的顶点属性。顶点属性可以包括一个或多个顶点属性。每个顶点属性可以包括属性名和属性值。属性名例如可以包括“年龄”、“身高”、“职业”等。属性值是指属性名的对应取值。可选地,属性名可以用于建立索引,从而在数据查询时支持条件过滤。此外,顶点数据还可以包括顶点元数据。相应地,顶点数据的数据 存储结构还可以包括顶点元数据字段。顶点元数据字段用于存储顶点的顶点元数据。顶点元数据可以包括用于数据查询的查询条件,比如,顶点时间戳。可选地,在一个示例中,顶点元数据还可以包括顶点类型。顶点类型例如可以是实现顶点分类的特征信息,例如,“人”、“公司”、“设备”等。如图1所示,顶点数据可以基于顶点标识进行排序,并且按照排序结果进行存储。
边数据可以包括边标识以及边属性。相应地,边数据的存储结构可以包括边标识字段和边属性字段。边标识字段用于存储边标识。在一个示例中,边标识可以包括起点ID(源顶点ID,SrcId)、边类型、边时间戳和终点ID(目标顶点ID,DesId)。边类型例如可以是实现边分类的特征信息。例如,在该出边指示账户转账时,边类型可以为“转账”。在该出边指示支付时,边类型可以为“支付”。按照上述方式,可以利用起点ID、终点ID、边时间戳和边类型唯一地标识出图数据库中的一条边数据。例如,假设存在A向B转账的转账边数据,则可以利用“起点A和终点B的顶点标识&转账时间T&转账边”作为该转账边数据的边标识。可选地,在另一示例中,边标识也可以不包括边类型和/或边时间戳。
边属性字段可以包括一个或多个边属性字段。每个边属性字段可以包括属性名字段和属性值字段。属性名字段用于存储边属性的属性名,以及属性值字段用于存储边属性的属性值。边属性的属性名例如可以包括“金额”、“货币”、“操作设备”、“时间戳”等。边属性的属性值是指属性名的对应取值。例如,顶点A和B之间存在一条好友关系边,该好友关系边可以具有时间戳属性,该时间戳属性表示顶点A和B的最近互动时间。
同样,在边数据存储时,需要基于边标识对边数据进行排序,并基于排序结果进行边数据存储。如图1所示,所存储的边数据可以包括边数据1到边数据m,其中,边数据i存储起点i的所有出边数据。在一个示例中,在进行排序时,可以依次基于起点ID、边类型、时间戳和终点ID进行排序,即,首先基于起点ID进行排序,然后在每个起点ID的排序结果中基于边类型进行排序。随后,在每个边类型的排序结果中基于时间戳进行排序。最后,在每个时间戳的排序结果中基于终点ID进行排序,由此得到最终排序结果,并按照最终排序结果将边数据存储在图数据库系统中的图数据库中,如图1所示。此外,优选地,在边标识和边属性中不会同时存储有时间戳信息。
上面参照图1描述了根据本说明书的实施例的图数据存储的数据结构的一个示例。在本说明书的其它实施例中,也可以采用其它合适的数据存储方式进行图数据存储。
在如上将图数据存储在图数据库中,由于图数据库中的边数据通常具有时效性,随着时间推移,图数据库中的部分边数据将会过期而不再发挥作用,从而需要对图数据库 定期进行过期边数据处理,由此从图数据库中确定出过期边数据,并且从图数据库中清除该过期边数据。
图2示出了根据本说明书的实施例的图数据库处理过程200的示例流程图。图数据库处理过程200由图数据库处理装置执行。
如图2所示,在210,图数据库处理装置获取图数据库系统的当前系统时间。图数据库处理装置可以应用于图数据库系统中,从而可以从图数据库系统的操作系统获取当前系统时间。图数据库处理装置也可以与图数据库系统可通信地连接,由此可以向图数据库系统发起系统时间获取请求。图数据库系统响应于系统时间获取请求,将图数据库系统的当前系统时间返回给图数据库处理装置。
在220,图数据库处理装置从图数据库中获取各个边数据的时间戳。
图3示出了根据本说明书的实施例的时间戳获取过程300的示例流程图。在图3的示例中,所存储的边数据中的边标识包括时间戳。
如图3所示,在310,图数据库处理装置从图数据库中获取各个边数据。边数据的获取过程可以基于与图数据的数据结构匹配的任何适合数据获取方式从边数据所在的数据分块中获取。
在从图数据库中获取到各个边数据中,在320,图数据库处理装置从所获取的各个边数据中提取边标识。例如,在一个示例中,边数据的边标识字段具有规定长度,并且作为边数据的首字段。在进行边标识提取时,可以自边数据的头部开始读取规定长度的信息,由此从边数据中提取出边标识。
在如上提取出边标识后,在330,图数据库处理装置对各个边数据的边标识进行解析。在340,图数据库处理装置从解析后的各个边数据的边标识中提取各个边数据的时间戳。
图4示出了根据本说明书的实施例的时间戳获取过程400的另一示例流程图。在图4的示例中,所存储的边数据的边标识中不具有时间戳,并且边属性包括时间戳属性。
如图4所示,在410,图数据库处理装置从图数据库中获取各个边数据。边数据的获取过程可以基于与图数据的数据结构匹配的任何适合数据获取方式从边数据所在的数据分块中获取。
在从图数据库中获取到各个边数据中,在420,图数据库处理装置从所获取的各个边数据中提取边属性。例如,在一个示例中,边数据的边标识字段具有规定长度,并且作为边数据的首字段,则可以读取边数据的规定长度字段后的字段信息,由此从边数据中提取出边属性。
在430,图数据库处理装置对所提取的各个边数据的边属性进行解析。在440,图数据库处理装置从解析后的各个边数据的边属性中提取各个边数据的时间戳。
回到图2,在如上获取各个边数据的时间戳后,在230,基于图数据库系统的当前系统时间、各个边数据的时间戳以及各个边数据的存活时间,从各个边数据中确定出过期边数据。
例如,假设图数据库系统的当前系统时间为T0,边数据的时间戳为T1,以及边数据的存活时间为T。如果T0-T1≤T,则确定该边数据为未到期边数据。如果T0-T1>T,则确定该边数据为到期边数据。
在一些实施例中,各个边数据的存活时间可以在进行图数据库处理时由用户输入。例如,用户可以针对每个边数据输入对应的存活时间。或者,用户可以针对每种类型的边数据输入对应的存活时间。
在一些实施例中,边数据的存活时间可以配置在图数据库系统的系统配置文件中。在该系统配置文件中,为每种类型的边配置一个存活时间。可选地,系统配置文件可以进行更新。例如,系统配置文件可以响应于应用场景对进行更新,或者响应于用户需求而进行更新。
图5示出了根据本说明书的实施例的存活时间获取过程500的示例流程图。在图5的示例中,边数据的存活时间配置在图数据库系统的系统配置文件中。
如图5所示,在510,图数据库处理装置从解析后的各个边数据的边标识中提取各个边数据的边类型。
在520,图数据库处理装置基于各个边数据的边类型,从图数据库系统的系统配置文件中获取各个边数据的存活时间。
回到图2,在如上针对图数据库中的边数据完成过期边数据确定后,在240,响应于确定出过期边数据,从图数据库中删除所确定出的过期边数据。
要说明的是,在一个示例中,240的操作可以在针对图数据库的所有边数据都完成过期边数据确定后执行。在另一示例中,240的操作可以响应于针对一条边数据完成过期边数据确定后执行。在这种情况下,响应于确定边数据为过期边数据,则从图数据库中删除该边数据。响应于确定边数据为未过期边数据,则保留该边数据。
图6示出了根据本说明书的实施例的图数据库处理方法的另一示例流程图。在图6的示例中,图数据按照图1所示的数据结构存储在图数据库中。
如图6所示,在610,获取图数据库系统的当前系统时间。610中的当前系统时间获取过程可以参考上面参照图2的210描述的操作。
在620,基于边标识中的起点ID和边类型,对图数据库中的边数据进行分类。所得到的每个边数据分类中的每条边数据都具有相同的起点ID和边类型。在一个示例中,边数据的分类过程可以基于二分法实现。例如,在一个示例中,边数据按照起点ID和边类型从大到小排序并按序存储在图数据库中。在进行边数据分类时,首先读取第一条边数据,然后获取第一条边数据中的边标识并进行解析,由此得到起点ID和边类型。然后利用二分法找到边数据中位于最中间的边数据(第二边数据),然后获取该边数据中的边标识并进行解析,由此得到该边数据的起点ID和边类型。如果所得到的起点ID和边类型与第一条边数据的起点ID和边类型完全一致,则第二边数据与第一条边数据属于同一分类数据,随后获取第二边数据和最后一条边数据的中间边数据再次进行分类边界确定。如果所得到的起点ID和边类型与第一条边数据的起点ID和边类型不是完全一致,则第二边数据与第一条边数据不属于同一分类数据,随后获取第一条边数据和第二边数据的中间边数据再次进行分类边界确定。针对所获取的中间边数据进行边标识解析,并将解析出的起点ID和边类型与第一条边数据的起点ID和边类型进行比较,并基于比较结果执行下一中间边数据获取,直到确定出第一条边数据所属边数据分类的边界(第一类边数据)。在找到第一类边数据(即,确定出第一类边数据的边界)后,从紧接第一类边数据的边数据开始,按照上述方式确定出第二类边数据(第二类边数据的边界)。如此循环,直到对图数据中的所有边数据完成分类。
在如上完成分类后,在630,对于每类边数据,基于当前系统时间以及该边类型对应的存活时间确定出该类边数据中的第一条过期边数据。在一个示例中,边数据按照时间戳从大到小排序并按序存储在图数据库中。在进行第一条过期边数据确定时,首先读取位于该类边数据最中间的边数据(第一中间边数据),并从所读取的边数据中提取出边标识进行解析,从解析后的边标识中提取出时间戳,基于当前系统时间、该边类型对应的存活时间以及所提取出的时间戳,确定该第一中间边数据是否是过期边数据。如果确定为是过期边数据,则再次读取该类边数据中的第一条边数据和该第一中间边数据之间的中间边数据(第二中间边数据)。如果确定为是未过期边数据,则再次读取该类边数据中的第一中间边数据和最后一条边数据之间的中间边数据(第二中间边数据)。然后,按照上述方式确定第二中间边数据是否为过期边数据,如此循环执行,直到确定出该类边数据中的第一条过期边数据。
在640,对于每类边数据,将该类边数据中时间戳排在第一条过期边数据之后的所有边数据确定为过期边数据。例如,假如在边数据存储时按照时间戳从大到小的顺序按序存储,则将排在第一条过期边数据之后的所有边数据确定为过期边数据。假如在边数 据存储时按照时间戳从小到大的顺序按序存储,则将排在第一条过期边数据之前的所有边数据确定为过期边数据。
可选地,在650,响应于确定出过期边数据,从图数据库中删除所确定出的过期边数据。
在一些实施例中,在获取图数据库系统的当前系统时间后,还可以从图数据库中获取第一条边数据。然后,对第一条边数据的边标识进行解析,并根据解析后的边标识确定边数据的时间戳保存在边标识或边属性中。如果确定为保存在边标识中,则基于上述与边标识包括时间戳对应的过期边数据确定方式(即,图1和图3或图6示出的方式)进行过期边数据确定。如果确定为保存在边属性中,则基于上述与边属性包括时间戳对应的过期边数据确定方式(即,图1和图4示出的方式)进行过期边数据确定。
如上参照图1到图6描述了根据本说明书的实施例的图数据库处理方法。利用该图数据库处理方法,通过在进行图数据存储时将边数据的时间戳保存在边标识或边属性中,使得在进行图数据库处理时,可以从边数据中提取出时间戳,并基于所提取的时间戳和图数据库系统的当前系统时间进行边数据过期与否确定,由此实现在图数据库中快速清理过期边数据。
如果边数据的时间戳存储在边属性中,则需要扫描所有边数据,然后解析边属性得到时间戳,而后基于所得到的时间戳判断是否过期。在边数据的时间戳保存在边标识中并且边数据按照起点ID、边类型、时间戳和终点ID顺序存储在图数据库中的情况下,由于对于给定起点ID和边类型,边数据按照时间戳排序,从而可以基于给定起点ID和边类型对图数据库中的边数据进行分类,并通过当前系统时间和存活时间定位出每类边数据的第一条过期边数据,随后将该类边数据中时间戳排在第一条过期边数据之后的所有边数据确定为过期边数据,而不需要对其余边数据再次进行边标识解析和过期判断处理,从而可以进一步缩短过期边数据判断的所需时间,由此提升图数据库中的过期边数据清理效率。
图7示出了根据本说明书的实施例的图数据库处理装置700的示例方框图。如图7所示,图数据库处理装置700包括系统时间获取单元710、时间戳获取单元720、过期数据确定单元730和过期数据删除单元740。
系统时间获取单元710被配置为获取图数据库系统的当前系统时间。系统时间获取单元710的操作可以参考上面参照图2的210描述的操作。
时间戳获取单元720被配置为从图数据库中获取各个边数据的时间戳。时间戳获取单元720的操作可以参考上面参照图2的220描述的操作以及参照图3和图4描述的操 作。
过期数据确定单元730被配置为基于当前系统时间、各个边数据的时间戳以及各个边数据的存活时间,从各个边数据中确定出过期边数据。过期数据确定单元730的操作可以参考上面参照图2的220以及图5描述的操作。
过期数据删除单元740被配置为响应于确定出过期边数据,从图数据库中删除所确定出的过期边数据。
要说明的是,在本说明书的其它实施例中,图数据库处理装置700也可以不包括过期数据删除单元740。
图8示出了根据本说明书的实施例的时间戳获取单元800的示例方框图。在图8的示例中,边数据的边标识包括时间戳。如图8所示,时间戳获取单元800包括边数据获取模块810、边标识提取模块820、边标识解析模块830和时间戳提取模块840。
边数据获取模块810被配置为从图数据库中获取各个边数据。边数据获取模块810的操作可以参考上面参照图3的310描述的操作。
边标识提取模块820被配置为从所获取的各个边数据中提取边标识。边标识提取模块820的操作可以参考上面参照图3的320描述的操作。
边标识解析模块830被配置为对各个边数据的边标识进行解析。边标识解析模块830的操作可以参考上面参照图3的330描述的操作。
时间戳提取模块840被配置为从解析后的各个边数据的边标识中提取各个边数据的时间戳。时间戳提取模块840的操作可以参考上面参照图3的340描述的操作。
图9示出了根据本说明书的实施例的时间戳获取单元900的另一示例方框图。在图9的示例中,边属性包括时间戳属性。如图9所示,时间戳获取单元900包括边数据获取模块910、边属性提取模块920、边属性解析模块930和时间戳提取模块940。
边数据获取模块910被配置为从图数据库中获取各个边数据。边数据获取模块910的操作可以参考上面参照图4的410描述的操作。
边属性提取模块920被配置为从所获取的各个边数据中提取边属性。边属性提取模块920的操作可以参考上面参照图4的420描述的操作。
边属性解析模块930被配置为对各个边数据的边属性进行解析。边属性解析模块930的操作可以参考上面参照图4的430描述的操作。
时间戳提取模块940被配置为从解析后的各个边数据的边属性中提取各个边数据的时间戳。时间戳提取模块940的操作可以参考上面参照图4的440描述的操作。
此外,可选地,在一个示例中,图数据库处理装置700还可以包括存活时间获取单 元(未示出)。存活时间获取单元被配置为获取用户输入的各个边数据的存活时间。
此外,可选地,在一个示例中,边标识还可以包括边类型。相应地,图数据库处理装置700还可以包括边类型提取单元和存活时间获取单元。边类型提取单元被配置为从解析后的各个边数据的边标识中提取各个边数据的边类型;以及存活时间获取单元被配置为基于各个边数据的边类型,从图数据库系统的系统配置文件中获取各个边数据的存活时间。
图10示出了根据本说明书的实施例的图数据库处理装置1000的另一示例方框图。在图10的示例中,边数据的边标识包括起点ID、边类型、时间戳和终点ID,并且边数据按照起点ID、边类型、时间戳和终点ID依次进行排序后按序存储在图数据库中。如图10所示,图数据库处理装置1000包括系统时间获取单元1010、边数据分类单元1020和过期数据确定单元1030。
系统时间获取单元1010被配置为获取图数据库系统的当前系统时间。系统时间获取单元1010的操作可以参考上面参照图6的610描述的操作。
边数据分类单元1020被配置为基于边标识中的起点ID和边类型,对图数据库中的边数据进行分类。边数据分类单元1020的操作可以参考上面参照图6的620描述的操作。
过期数据确定单元1030被配置为对于每类边数据,基于当前系统时间以及该边类型对应的存活时间确定出该类边数据中的第一条过期边数据,并且将该类边数据中时间戳排在第一条过期边数据之后的所有边数据确定为过期边数据。过期数据确定单元1030的操作可以参考上面参照图6的630以及640描述的操作。
如上参照图1到图10,对根据本说明书实施例的图数据库处理方法以及图数据库处理装置进行了描述。上面的图数据库处理装置可以采用硬件实现,也可以采用软件或者硬件和软件的组合来实现。
图11示出了根据本说明书的实施例的基于计算机系统实现的图数据库处理装置1100的示意图。如图11所示,图数据库处理装置1100可以包括至少一个处理器1110、存储器(例如,非易失性存储器)1120、内存1130和通信接口1140,并且至少一个处理器1110、存储器1120、内存1130和通信接口1140经由总线1160连接在一起。至少一个处理器1110执行在存储器中存储或编码的至少一个计算机可读指令(即,上述以软件形式实现的元素)。
在一个实施例中,在存储器中存储计算机可执行指令,其当执行时使得至少一个处理器1110:获取图数据库系统的当前系统时间;从图数据库中获取各个边数据的时间戳; 以及基于图数据库系统的当前系统时间、各个边数据的时间戳以及各个边数据的存活时间,从各个边数据中确定出过期边数据。
在另一实施例中,在存储器中存储计算机可执行指令,其当执行时使得至少一个处理器1110:获取图数据库系统的当前系统时间;基于边标识中的起点ID和边类型,对图数据库中的边数据进行分类;以及对于每类边数据,基于当前系统时间以及该边类型对应的存活时间确定出该类边数据中的第一条过期边数据,并且将该类边数据中时间戳排在第一条过期边数据之后的所有边数据确定为过期边数据。
应该理解,在存储器中存储的计算机可执行指令当执行时使得至少一个处理器1110进行本说明书的各个实施例中以上结合图1-图10描述的各种操作和功能。
根据一个实施例,提供了一种比如机器可读介质(例如,非暂时性机器可读介质)的程序产品。机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本说明书的各个实施例中以上结合图1-图10描述的各种操作和功能。具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。
在这种情况下,从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此机器可读代码和存储机器可读代码的可读存储介质构成了本发明的一部分。
可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上或云上下载程序代码。
根据一个实施例,提供一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序当被处理器执行时,使得处理器执行本说明书的各个实施例中以上结合图1-图10描述的各种操作和功能。
本领域技术人员应当理解,上面公开的各个实施例可以在不偏离发明实质的情况下做出各种变形和修改。因此,本发明的保护范围应当由所附的权利要求书来限定。
需要说明的是,上述各流程和各系统结构图中不是所有的步骤和单元都是必须的,可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的,可以根据需要进行确定。上述各实施例中描述的装置结构可以是物理结构,也可以是逻辑结构,即,有些单元可能由同一物理实体实现,或者,有些单元可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
以上各实施例中,硬件单元或模块可以通过机械方式或电气方式实现。例如,一个硬件单元、模块或处理器可以包括永久性专用的电路或逻辑(如专门的处理器,FPGA或ASIC)来完成相应操作。硬件单元或处理器还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器),可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。
上面结合附图阐述的具体实施方式描述了示例性实施例,但并不表示可以实现的或者落入权利要求书的保护范围的所有实施例。在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”,并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的,具体实施方式包括具体细节。然而,可以在没有这些具体细节的情况下实施这些技术。在一些实例中,为了避免对所描述的实施例的概念造成难以理解,公知的结构和装置以框图形式示出。
本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说,对本公开内容进行的各种修改是显而易见的,并且,也可以在不脱离本公开内容的保护范围的情况下,将本文所定义的一般性原理应用于其它变型。因此,本公开内容并不限于本文所描述的示例和设计,而是与符合本文公开的原理和新颖性特征的最广范围相一致。

Claims (18)

  1. 一种图数据库处理方法,包括:
    获取图数据库系统的当前系统时间;
    从图数据库中获取各个边数据的时间戳;以及
    基于所述当前系统时间、各个边数据的时间戳以及各个边数据的存活时间,从各个边数据中确定出过期边数据。
  2. 如权利要求1所述的图数据库处理方法,还包括:
    响应于确定出过期边数据,从所述图数据库中删除所确定出的过期边数据。
  3. 如权利要求1所述的图数据库处理方法,其中,边数据的边标识包括时间戳,从图数据库中获取各个边数据的时间戳包括:
    从图数据库中获取各个边数据;
    从所获取的各个边数据中提取边标识;
    对各个边数据的边标识进行解析;以及
    从解析后的各个边数据的边标识中提取各个边数据的时间戳。
  4. 如权利要求1所述的图数据库处理方法,其中,边数据的边属性包括时间戳属性,从图数据库中获取各个边数据的时间戳包括:
    从图数据库中获取各个边数据;
    从所获取的各个边数据中提取边属性;
    对所提取的各个边数据的边属性进行解析;以及
    从解析后的各个边数据的边属性中提取各个边数据的时间戳。
  5. 如权利要求1所述的图数据库处理方法,其中,各个边数据的存活时间包括用户输入的各个边数据的存活时间。
  6. 如权利要求1所述的图数据库处理方法,其中,边数据的边标识包括边类型,所述图数据库处理方法还包括:
    从解析后的各个边数据的边标识中提取各个边数据的边类型;以及
    基于各个边数据的边类型,从所述图数据库系统的系统配置文件中获取各个边数据的存活时间。
  7. 一种图数据库处理方法,图数据库中的边数据的边标识包括起点ID、边类型、时间戳和终点ID,并且边数据按照起点ID、边类型、时间戳和终点ID进行排序后按序存储在图数据库中,所述图数据库处理方法包括:
    获取图数据库系统的当前系统时间;
    基于边标识中的起点ID和边类型,对图数据库中的边数据进行分类;以及
    对于每类边数据,基于所述当前系统时间以及该边类型对应的存活时间确定出该类边数据中的第一条过期边数据,并且将该类边数据中时间戳排在所述第一条过期边数据之后的所有边数据确定为过期边数据。
  8. 如权利要求7所述的图数据库处理方法,其中,所述边数据的分类过程和/或所述第一条过期边数据的确定过程基于二分法实现。
  9. 一种图数据库处理装置,包括:
    系统时间获取单元,获取图数据库系统的当前系统时间;
    时间戳获取单元,从图数据库中获取各个边数据的时间戳;以及
    过期数据确定单元,基于所述当前系统时间、各个边数据的时间戳以及各个边数据的存活时间,从各个边数据中确定出过期边数据。
  10. 如权利要求9所述的图数据库处理装置,还包括:
    过期数据删除单元,响应于确定出过期边数据,从所述图数据库中删除所确定出的过期边数据。
  11. 如权利要求9所述的图数据库处理装置,其中,边数据的边标识包括时间戳,所述时间戳获取单元包括:
    边数据获取模块,从图数据库中获取各个边数据;
    边标识提取模块,从所获取的各个边数据中提取边标识;
    边标识解析模块,对各个边数据的边标识进行解析;以及
    时间戳提取模块,从解析后的各个边数据的边标识中提取各个边数据的时间戳。
  12. 如权利要求9所述的图数据库处理装置,其中,边数据的边属性包括时间戳属性,所述时间戳获取单元包括:
    边数据获取模块,从图数据库中获取各个边数据;
    边属性提取模块,从所获取的各个边数据中提取边属性;
    边属性解析模块,对所提取的各个边数据的边属性进行解析;以及
    时间戳提取模块,从解析后的各个边数据的边属性中提取各个边数据的时间戳。
  13. 如权利要求9所述的图数据库处理装置,还包括:
    存活时间获取单元,获取用户输入的各个边数据的存活时间。
  14. 如权利要求9所述的图数据库处理装置,其中,边数据的边标识包括边类型,所述图数据库处理装置还包括:
    边类型提取单元,从解析后的各个边数据的边标识中提取各个边数据的边类型;以 及
    存活时间获取单元,基于各个边数据的边类型,从所述图数据库系统的系统配置文件中获取各个边数据的存活时间。
  15. 一种图数据库处理装置,图数据库中的边数据的边标识包括起点ID、边类型、时间戳和终点ID,并且边数据按照起点ID、边类型、时间戳和终点ID进行排序后按序存储在图数据库中,所述图数据库处理装置包括:
    系统时间获取单元,获取图数据库系统的当前系统时间;
    边数据分类单元,基于边标识中的起点ID和边类型,对图数据库中的边数据进行分类;以及
    过期数据确定单元,对于每类边数据,基于所述当前系统时间以及该边类型对应的存活时间确定出该类边数据中的第一条过期边数据,并且将该类边数据中时间戳排在所述第一条过期边数据之后的所有边数据确定为过期边数据。
  16. 一种图数据库处理装置,包括:
    至少一个处理器,
    与所述至少一个处理器耦合的存储器,以及
    存储在所述存储器中的计算机程序,所述至少一个处理器执行所述计算机程序来实现如权利要求1到6中任一所述或者如权利要求7或8所述的图数据库处理方法。
  17. 一种计算机可读存储介质,其存储有可执行指令,所述指令当被执行时使得处理器执行如权利要求1到6中任一所述或者如权利要求7或8所述的图数据库处理方法。
  18. 一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行来实现如权利要求1到6中任一所述或者如权利要求7或8所述的图数据库处理方法。
PCT/CN2022/125821 2021-10-21 2022-10-18 图数据库处理 WO2023066221A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202111224569.2 2021-10-21
CN202111224569.2A CN113672610B (zh) 2021-10-21 2021-10-21 图数据库处理方法及装置

Publications (1)

Publication Number Publication Date
WO2023066221A1 true WO2023066221A1 (zh) 2023-04-27

Family

ID=78550793

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2022/125821 WO2023066221A1 (zh) 2021-10-21 2022-10-18 图数据库处理

Country Status (2)

Country Link
CN (1) CN113672610B (zh)
WO (1) WO2023066221A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113672610B (zh) * 2021-10-21 2022-02-15 支付宝(杭州)信息技术有限公司 图数据库处理方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899156A (zh) * 2015-05-07 2015-09-09 中国科学院信息工程研究所 一种面向大规模社交网络的图数据存储及查询方法
CN107239232A (zh) * 2017-05-10 2017-10-10 华立科技股份有限公司 用于电能表的数据存储方法
CN111400298A (zh) * 2020-04-17 2020-07-10 Oppo广东移动通信有限公司 数据处理方法及装置、计算机可读存储介质
CN113127660A (zh) * 2021-05-24 2021-07-16 成都四方伟业软件股份有限公司 一种时序图形数据库存储方法及装置
CN113672610A (zh) * 2021-10-21 2021-11-19 支付宝(杭州)信息技术有限公司 图数据库处理方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408469A (zh) * 2018-09-05 2019-03-01 中国平安人寿保险股份有限公司 过期数据文件处理方法、装置、电子装置及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899156A (zh) * 2015-05-07 2015-09-09 中国科学院信息工程研究所 一种面向大规模社交网络的图数据存储及查询方法
CN107239232A (zh) * 2017-05-10 2017-10-10 华立科技股份有限公司 用于电能表的数据存储方法
CN111400298A (zh) * 2020-04-17 2020-07-10 Oppo广东移动通信有限公司 数据处理方法及装置、计算机可读存储介质
CN113127660A (zh) * 2021-05-24 2021-07-16 成都四方伟业软件股份有限公司 一种时序图形数据库存储方法及装置
CN113672610A (zh) * 2021-10-21 2021-11-19 支付宝(杭州)信息技术有限公司 图数据库处理方法及装置

Also Published As

Publication number Publication date
CN113672610A (zh) 2021-11-19
CN113672610B (zh) 2022-02-15

Similar Documents

Publication Publication Date Title
WO2023056928A1 (zh) 数据存储及查询
WO2023066221A1 (zh) 图数据库处理
CN110750562A (zh) 基于Storm的实时数据比对预警方法及系统
CN106982150B (zh) 一种基于Hadoop的移动互联网用户行为分析方法
US20210357624A1 (en) Information processing method and device, and storage medium
WO2020259100A1 (zh) 一种信息处理方法及装置、存储介质
US20140214824A1 (en) Method, device and computer storage medium for adding information of friends
CN104021217B (zh) 一种提取手机碎片文件和被删除文件的系统和方法
WO2019019767A1 (zh) 客户身份信息处理方法、装置、存储介质和计算机设备
CN115576905A (zh) 档案文件管理方法、装置、电子设备和存储介质
CN105719072B (zh) 关联多段组件交易的系统及方法
CN110543584B (zh) 一种建立人脸索引的方法、装置、处理服务器及存储介质
KR101019627B1 (ko) 패턴 기반 참고문헌 자동 구축 시스템 및 방법과 이를 위한기록매체
CN110796014A (zh) 垃圾投放习惯分析方法、系统、装置及存储介质
CN110602049A (zh) 数据传输方法、服务器及存储介质
WO2020000742A1 (zh) 一种去重流量记录方法、装置、服务器及存储介质
CN104883269A (zh) 一种处理ac日志的方法和装置
CN103093213B (zh) 视频文件分类方法及终端
CN107402980A (zh) 一种基于网络环境下的大数据的处理方法和系统
CN111966339A (zh) 埋点参数的录入方法、装置、计算机设备和存储介质
CN106503198A (zh) 一种基于hadoop元数据的冷数据识别方法及系统
CN110968584A (zh) 一种画像生成系统、方法、电子设备及可读存储介质
CN111639117B (zh) 基于数据加工的业务处理方法及装置
CN116303379A (zh) 一种数据处理方法、系统及计算机储存介质
US8037077B2 (en) Computer-readable recording medium, method, and apparatus for creating message patterns

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22882827

Country of ref document: EP

Kind code of ref document: A1