CN113760971A - 用于检索图数据库的数据的方法、计算设备和存储介质 - Google Patents

用于检索图数据库的数据的方法、计算设备和存储介质 Download PDF

Info

Publication number
CN113760971A
CN113760971A CN202111316856.6A CN202111316856A CN113760971A CN 113760971 A CN113760971 A CN 113760971A CN 202111316856 A CN202111316856 A CN 202111316856A CN 113760971 A CN113760971 A CN 113760971A
Authority
CN
China
Prior art keywords
node
graph database
edges
edge
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111316856.6A
Other languages
English (en)
Other versions
CN113760971B (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Datayes Co
Original Assignee
Datayes Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Datayes Co filed Critical Datayes Co
Priority to CN202111316856.6A priority Critical patent/CN113760971B/zh
Publication of CN113760971A publication Critical patent/CN113760971A/zh
Application granted granted Critical
Publication of CN113760971B publication Critical patent/CN113760971B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/219Managing data history or versioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开的实施例涉及用于检索图数据库中数据的方法、计算设备和计算机存储介质。该方法包括:响应于确认针对图数据库的检索指令未指定时间范围信息,针对图数据库中存储的当前最新节点和边进行遍历;响应于确认针对图数据库的检索指令包括时间范围信息,解析查询语句,以便确定相匹配的候选节点和候选边;响应于确定候选节点和候选边中的至少一个开启了版本控制,重写查询语句,以便指示需遍历至状态边的候选节点和候选边,并且将时间范围信息作为检索约束条件,状态边是在图数据库的节点或者边被修改时而配置的,状态边被关联有时间属性;以及基于所重写的查询语句,检索图数据库。本公开能够支持针对图数据库的历史数据回溯性查询。

Description

用于检索图数据库的数据的方法、计算设备和存储介质
技术领域
本公开的实施例总体涉及信息处理领域,具体涉及用于检索图数据库的数据的方法、计算设备和计算机存储介质。
背景技术
在目前的SAAS业务系统中,通常平台需要对不同租户(或用户)的业务数据进行隔离,以便于租户可以对数据进行私有化的管理,进而形成租户独有的业务数据。各个租户通常会对SAAS业务系统所提供的原始的业务数据进行个性化的修改。这些修改有可能仅涉及少量的局部数据。不过,为了对租户业务数据进行隔离和便于后续检索,传统的图数据库技术通常会将不同租户修改后的业务数据整体进行存储,这将需要更多的存储资源用来针对多个租户的修改后的业务数据进行存储。并且,随着SAAS业务系统的租户的日益增多,使得针对租户业务数据的存储压力快速增长。因此,传统的用于检索图数据库的数据的方案所针对的图数据通常需要耗费大量的存储资源以用于隔离和存储不同用户经修改的数据。
另外,在以知识图谱方式构建的系统中,各类信息通常都会随时间推移逐渐演化,在一些应用场景下,历史数据回溯至关重要。而传统的用于检索图数据库的数据的方案难以支持针对图数据库的历史数据回溯性查询。
综上,传统的用于检索图数据库的数据的方案无法支持针对图数据库的历史数据回溯性查询,并且需要耗费大量的存储资源以用于隔离和存储不同用户经修改的数据。
发明内容
提供了一种用于检索图数据库的数据的方法、计算设备以及计算机存储介质,能够支持针对图数据库的历史数据回溯性查询。
根据本公开的第一方面,提供了一种用于检索图数据库的数据的方法。该方法包括:确认针对图数据库的检索指令是否指定时间范围信息;响应于确认针对图数据库的检索指令未指定时间范围信息,针对图数据库中存储的当前最新节点和边进行遍历;响应于确认针对图数据库的检索指令包括时间范围信息,解析对应的查询语句,以便确定与查询语句相匹配的候选节点和候选边;响应于确定候选节点和候选边中的至少一个开启了版本控制,重写查询语句,以便指示需遍历至状态边的、开启了版本控制的候选节点和候选边,并且将时间范围信息作为检索约束条件,状态边是在图数据库的节点或者边被修改时而配置在图数据库中的,状态边被关联有时间属性;以及基于所重写的查询语句,检索图数据库。
根据本公开的第二方面,提供了一种计算设备。该计算设备包括:至少一个处理器,以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据第一方面的方法。
在本公开的第三方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面的方法。
在一些实施例中,图数据库分别存储有关于知识图谱的通用模版和与多个用户分别相关联的多个修改日志,修改日志指示相关联的用户针对通用模版中的节点和边进行修改的信息。
在一些实施例中,基于所重写的查询语句检索图数据库包括:基于所重写的查询语句,逐个节点检索图数据库的通用模版,以便生成第一检索结果,第一检索结果至少指示一个或多个目标节点;以及检索与用户相关联的修改日志,以便将与修改日志所指示的关于目标节点的修改信息应用至通用模版。
在一些实施例中,将与修改日志所指示的关于目标节点的修改信息应用至通用模版包括:响应于确定与用户相关联的修改日志指示用户针对第一检索结果中所指示的目标节点进行删除,则在第一检索结果中去除目标节点;响应于确定与用户相关联的修改日志指示用户针对第一检索结果中所指示的目标节点进行修改,基于目标节点的标识替换第一检索结果中目标节点的对应信息;响应于确定与用户相关联的修改日志指示用户增加预定节点,基于第一检索结果中所指示的、作为被添加的预定节点的上游节点的目标节点的标识,在第一检索结果中添加预定节点的对应信息。
在一些实施例中,状态边是在图数据库的节点或者边被修改时而配置在图数据库中的包括:确定是否检测到用于启动图数据库中的预定节点的版本控制的指令;响应于确定检测到用于启动图数据库中的预定节点的版本控制的指令,针对预定节点生成实体状态节点,实体状态节点经由状态边与预定节点相关联;以及使状态边关联用于指示起始时间和截止时间的时间戳。
在一些实施例中,状态边是在图数据库的节点或者边被修改时而配置在图数据库中的还包括:响应于确定当前操作为更新预定节点的节点信息,创建从预定节点经由状态边至实体状态节点的边;以及响应于确定当前操作为删除预定节点,删除预定节点,并且使得预定节点关联用于指示删除的标识。
在一些实施例中,状态边是在图数据库的节点或者边被修改时而配置在图数据库中的还包括:响应于确定当前操作为更新预定边信息,建立新的用于连接对应节点的边,并且同步对应节点的已连接的边所关联的属性信息;以及响应于确定当前操作为删除预定边的信息,删除预定边,并且使得预定边关联一用于指示删除的标识。
在一些实施例中,状态边是在图数据库的节点或者边被修改时而配置在图数据库中的还包括:响应于确定当前操作为增加预定节点或者预定边,不配置版本控制。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素。
图1示出了根据本公开的实施例的用于检索图数据库的数据的方法的系统的示意图。
图2示出了根据本公开的实施例的用于检索图数据库的方法的流程图。
图3示出了根据本公开的实施例的被查询图数据库的示意图。
图4示出了根据本公开的实施例的用于基于所重写的查询语句索图数据库的方法的流程图。
图5示出了根据本公开的实施例的被查询图数据库的示意图。
图6示出了根据本公开的实施例的用于配置状态边的方法的流程图。
图7示出了可以用来实施本公开内容的实施例的示例设备的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
如上文所描述,传统的用于检索图数据库的数据的方案无法支持针对图数据库的历史数据回溯性查询,并且需要耗费大量的存储资源以用于隔离和存储不同用户经修改的数据。
为了至少部分地解决上述问题以及其他潜在问题中的一个或者多个,本公开的示例实施例提出了一种用于检索图数据的数据的方案。在该方案中,通过在确认针对图数据库的检索指令未指定时间范围信息时,针对图数据库中存储的当前最新节点和边进行遍历;在确认针对图数据库的检索指令包括时间范围信息时,针对对应的查询语句进行解析以便在确定候选节点和候选边开启了版本控制时,重写对应查询语句使其指示哪些节点和边需遍历状态边(该状态边是节点或者边被修改时而配置的),并且指示需将时间范围信息作为检索约束条件,然后基于所重写的查询语句检索图数据库,本公开可以在图数据节点和边被修改时,配置关联有时间属性的状态边,当确定检索指令涉及时间范围时,重写检索语句,使得遍历至与检索语句匹配并且开启版本控制的节点和边的状态边。因此,本公开能够支持针对图数据库的历史数据回溯性查询。
在下文中,将结合附图更详细地描述本方案的具体示例。
图1示出了根据本公开的实施例的用于检索图数据库的数据的方法的系统100的示意图。如图1所示,系统100例如包括计算设备110、多个用户终端120-1、120-M至120-N、网络140。计算设备110可以通过网络140与多个用户终端120-1、120-M至120-N、进行数据交互。
计算设备110例如包括但不限于服务器计算机、多处理器系统、大型计算机、包括上述系统或设备中的任意一个的分布式计算环境等。在一些实施例中,计算设备110可以具有一个或多个处理单元,包括诸如图像处理单元GPU、现场可编程门阵列FPGA和专用集成电路ASIC等的专用处理单元以及诸如中央处理单元CPU的通用处理单元。
计算设备110例如可以是用于提供图数据库的数据存储和检索。具体而言,计算设备110例如用于在确认针对图数据库的检索指令未指定时间范围信息时,针对图数据库中存储的当前最新节点和边进行遍历;以及在确认针对图数据库的检索指令包括时间范围信息,解析对应的查询语句,以便确定与查询语句相匹配的候选节点和候选边。计算设备110例如还用于如果确定候选节点和候选边中的至少一个开启了版本控制,重写查询语句以便指示需遍历至状态边的、开启了版本控制的候选节点和候选边,并且指示需将时间范围信息作为检索约束条件的候选节点和候选边,以及基于所重写查询语句检索图数据库。
用户终端120-1至120-N例如包括但不限于用户的手机、计算机等,用于获取和修改图数据库的数据。
以下将结合图2和图3描述根据本公开的实施例的用于检索图数据库的方法。图2示出了根据本公开的实施例的用于检索图数据库的方法200的流程图。图3示出了根据本公开的实施例的被查询图数据库300的示意图。应当理解,方法200例如可以在图7所描述的电子设备700处执行。也可以在图1所描述的计算设备110处执行。应当理解,方法200还可以包括未示出的附加动作和/或可以省略所示出的动作,本公开的范围在此方面不受限制。
在步骤202处,计算设备110确认针对图数据库的检索指令是否指定时间范围信息。
关于图数据库,其包括多个节点和多个边。每个节点关联有节点标识,每个边关联有边标识。例如,节点指示实体,例如某个公司、某个人。边指示关联实体的关系。节点可以关联有属性,用以描述节点的各种特性。边具有标签,边也具有方向。传统的关系型数据库的数据的存储结构为表结构,图数据库存储的为图结构。涉及节点或者边的修改操作主要包括:插入、删除和更新节点或者边。
以下将以在图3所示经修改的知识图谱数据中查询节点A的连通图为例来说明本公开的方法200。
在一些实施例中,图数据库分别存储有关于知识图谱的通用模版和与多个用户分别相关联的多个修改日志,修改日志指示相关联的用户针对通用模版中的节点和边进行修改的信息。应当理解,用户的修改数据通常较少,通过图数据库分别存储通用模版和与多个用户分别相关联的多个修改日志,而非将用户的每一次修改后的数据整体进行存储,本公开能够显著地降低存储图数据库的存储资源。
在步骤204处,如果计算设备110确认针对图数据库的检索指令未指定时间范围信息,针对图数据库中存储的当前最新节点和边进行遍历。如果确认针对图数据库的检索指令未指定时间范围信息,即未指定图数据库的时间版本,则进行默认检索,即检索当前最新的图数据库,不针对状态边进行遍历。
在一些实施例中,计算设备110确定当前节点的邻居节点是否被关联有用于指示删除的标识;如果计算设备110确定当前节点的邻居节点是否被关联有用于指示删除的标识,则删除该邻居节点。如图3所示,当遍历至节点E时,如果检测到其邻居节点F关联有用于指示“删除”的标识。则删除该邻居节点F。
在步骤206处,如果计算设备110确认针对图数据库的检索指令包括时间范围信息,解析对应的查询语句,以便确定与查询语句相匹配的候选节点和候选边。
如图3所示,如果计算设备110确定关于“查询节点A的连通图”的查询指令中指示了时间范围(例如为“2019-2020年”)。则计算设备110解析对应的查询语句,以确定该查询语句会涉及哪些相匹配的候选节点和候选边。
在步骤208处,计算设备110确定是否候选节点和候选边中的至少一个开启了版本控制。如果计算设备110确定候选节点和候选边中的没有一个开启了版本控制,则跳转至步骤204处,计算设备110针对图数据库中存储的当前最新节点和边进行遍历。在步骤210处,如果计算设备110确定候选节点和候选边中的至少一个开启了版本控制,重写查询语句,以便指示需遍历至状态边的、开启了版本控制的候选节点和候选边,并且将时间范围信息作为检索约束条件,状态边是在图数据库的节点或者边被修改时而配置在图数据库中的,状态边被关联有时间属性。
例如,如图3所示,计算设备110重写查询语句,使其查询关于节点A的连通图,并且以时间范围信息“2019-2020”为检索约束条件遍历至存在状态边的、开启了版本控制的候选节点和候选边。
在步骤12处,计算设备110基于所重写查询语句,检索图数据库。
例如,计算设备110从图3中节点A出发,确定节点A为不存在状态边的节点,此时默认节点A对所有时间均有效,则认为节点A为匹配的候选节点。然后进一步获取节点A的邻居节点(即,节点B,节点C)。如果确定邻居节点 B和节点C 均未关联状态边(例如是HasState),则默认对所有时间有效,则认为节点B和节点C为匹配的候选节点。对于节点C的邻居节点(即节点E)而言,节点C和节点E之间关联有两条状态边,例如是第一边312(即,“Edge C-E:From: 1999 To: 2020”)和第二边514(即,“Edge C-E:From: 2021 To:” )。计算设备110在第一边312和第二边314中,选择时间属性(即,“From,To ”)满足检索语句中关于时间范围信息“2019-2020”的检索约束条件的作为检索结果,例如第二边314以及节点E为检索结果。节点B与邻居节点(即节点D)之间关联有一个状态边318(即,HasState:From:1999To: 2020)。如果该状态边318满足检索语句中关于时间范围信息“2019-2020”的检索约束条件,则将状态边318所关联的节点D1替换节点D。则关于A的连通图的检索结果为:(A,B,C,E,D1)”。对于节点E的邻居节点(即节点F)而言,其关联有用于指示“删除”的标识(即,Delete: true)。则不将节点F作为检索结果。
在一些实施例中,关于检索图数据库的方法,其例如包括:计算设备110基于所重写的查询语句,逐个节点检索图数据库的通用模版,以便生成第一检索结果,第一检索结果至少指示一个或多个目标节点;以及检索与用户相关联的修改日志,以便将与修改日志所指示的关于目标节点的修改信息应用至通用模版。当查询用户数据的时候,图谱查询引擎对通用模版和对应用户的修改日志的数据进行融合。
应当理解,图数据库存储数据时需要保证不同用户之间的数据彼此隔离,并且查询引擎需要将针对用户的特色数据的正确且完整的检索结果返回给用户。在传统的数据存储以及检索方式中,通常是为每个用户拷贝完整的模版数据。假设通用模版的数据规模为N,整个系统例如有M 个用户。那么整个系统的存储成本例如可以根据以下公式(1)加以计算。
C = N * M (1)
在上述公式(1)中,M 代表用户数量。N代表通用模版的数据规模。C代表整个系统的存储成本。
当图谱模版数据不断变大,和/或用户数目极速增长的时候,系统将面临存储资源需求迅速增长的问题与压力。本公开通过针对用户修改数据,系统仅仅保存关于用户操作的修改日志(change log)。例如对于 M个用户,那么整个存储的成本可以根据以下公式(2)加以计算。
C = N+M*delta (2)
在上述公式(2)中,M 代表用户数量。N代表通用模版的数据规模。C代表整个系统的存储成本。delta 代表用户修改的数据平均规模。delta通常较小。通过比较公式(1)和公式(2)可知,本公开可以大大降低因用户规模的快速增长所带来的存储压力。
关于检索图数据库的方法,下文将进一步结合图4和图5加以说明,在此,不再赘述。
在上述方案中,通过在确认针对图数据库的检索指令未指定时间范围信息时,针对图数据库中存储的当前最新节点和边进行遍历;在确认针对图数据库的检索指令包括时间范围信息时,针对对应的查询语句进行解析以便在确定候选节点和候选边开启了版本控制时,重写对应查询语句使其指示哪些节点和边需遍历状态边(该状态边是节点或者边被修改时而配置的),并且指示需将时间范围信息作为检索约束条件,然后基于所重写的查询语句检索图数据库,本公开可以在图数据节点和边被修改时,配置关联有时间属性的状态边,当确定检索指令涉及时间范围时,重写检索语句,使得遍历至与检索语句匹配并且开启版本控制的节点和边的状态边。因此,本公开能够支持针对图数据库的历史数据回溯性查询。以下将结合图4和图5描述根据本公开的实施例的用于基于所重写的查询语句检索图数据库的方法。图4示出了根据本公开的实施例的用于基于所重写的查询语句检索图数据库的方法400的流程图。图5示出了根据本公开的实施例的被查询图数据库500的示意图。应当理解,方法400例如可以在图7所描述的电子设备700处执行。也可以在图1所描述的计算设备110处执行。应当理解,方法200还可以包括未示出的附加动作和/或可以省略所示出的动作,本公开的范围在此方面不受限制。
在步骤402处,计算设备110基于所重写的查询语句,逐个节点检索图数据库的通用模版,以便生成第一检索结果,第一检索结果至少指示一个或多个目标节点。
图5的左部指示图数据库的通用模版,例如通用图谱510。图5的右部指示用户修改通用模版后生成的用户数据,例如用户图谱520。用户例如删除了通用图谱510中的节点C,修改了节点D,并且新增节点F以及边BE和EF,从而生成用户图谱520。为了节约存储空间,本公开并非针对用户图谱520直接进行存储,而是将用户针对通用图谱510的上述修改信息存储在与用户相关联的修改日志(例如patch 图谱)中,籍此可以显著降低因用户规模的快速增长所带来的存储压力。
当计算设备110基于关于“从节点A 开始的连接图”的查询语句进行检索时,计算设备110首先检索通用图谱510,以生成第一检索结果,例如为“A-(B,C) ”。
在步骤404处,计算设备110检索与用户相关联的修改日志。例如,计算设备110查询与用户相关联的修改日志(例如patch 图谱)。
在步骤406处,如果计算设备110确定与用户相关联的修改日志指示用户针对第一检索结果中所指示的目标节点进行删除,则在第一检索结果中去除目标节点。例如,与用户相关联的修改日志(例如patch 图谱)指示第一检索结果中所指示的节点C 被标识为“删除”,则在第一检索结果“A-(B,C) ”中去除该节点C,第一检索结果为“A-(B) ”。例如,计算设备110进一步查询通用图谱510中的节点B的邻居节点为节点D。即第一检索结果为“A-(B)-D”。
在步骤408处,如果计算设备110确定与用户相关联的修改日志指示用户针对第一检索结果中所指示的目标节点进行修改,基于目标节点的标识替换第一检索结果中目标节点的对应信息。如果计算设备110查询与用户相关联的修改日志时,确定第一检索结果中所指示的修改日志指示节点D被标识为修改,则替换第一检索结果“A-(B) -D”中节点D的对应信息。
在步骤410处,如果计算设备110确定与用户相关联的修改日志指示用户增加预定节点,基于第一检索结果中所指示的、作为被添加的预定节点的上游节点的目标节点的标识,在第一检索结果中添加预定节点的对应信息。例如,计算设备110查询与用户相关联的修改日志(例如patch 图谱)时,如果确认修改日志指示节点B关联有新的下游的节点E,则在第一检索结果“A-(B) -D”中在作为上游节点的节点B之后添加节点E,即更新第一检索结果为“A-(B)-(D,E)”。
例如,计算设备110从节点D和节点E 出发查询通用图谱510,确认节点D和节点E中无连接节点。然后,计算设备110查询修改日志(例如patch 图谱),确定节点E可到达节点F,进而使得第一检索结果被更新为“A-(B)-(D,E)-(F)”。
在上述方案中,本公开将用户针对图数据库中的通用模板的修改存储在与用户相关联的修改日志中,而非将用户修改后数据整体进行存储,显著地降低了存储所需的存储资源;另外,在查询图数据库时,首先逐连接节点查询通用模板以生成第一检索结果,然后查询修改日志,并根据修改日志中的对应节点的标识调整第一检索结果。本公开可以获得准确的检索结果。因而,本公开不仅可以显著降低因用户规模的快速增长所带来的存储压力,而且能够便捷并准确地获得图数据库的检索结果。
以下将结合图6描述根据本公开的实施例的用于配置状态边的方法。图6示出了根据本公开的实施例的用于配置状态边的方法600的流程图。应当理解,方法600例如可以在图7所描述的电子设备700处执行。也可以在图1所描述的计算设备110处执行。应当理解,方法600还可以包括未示出的附加动作和/或可以省略所示出的动作,本公开的范围在此方面不受限制。
在步骤602处,计算设备110确定是否检测到用于启动图数据库中的预定节点的版本控制的指令。如果计算设备110确定没有检测到用于启动图数据库中的预定节点的版本控制的指令,则跳转至步骤602处,以便继续检测。
在步骤604处,如果计算设备110确定检测到用于启动图数据库中的预定节点的版本控制的指令,针对预定节点生成实体状态节点,实体状态节点经由状态边与预定节点相关联。在图谱进行建模时,可以添加时间控制属性。针对图谱中的特定的节点和边都可以指定是否开启版本控制。对于图数据库中的实体(Entity)或者节点而言,如果检测到用于启动版本控制的指令,则会为实体(Entity)存储额外的实体状态节点(EntityState节点),实体(Entity)与实体状态节点(EntityState节点)之间是通过状态边(Has_State 边)相连接的。
在步骤606处,计算设备110使状态边关联用于指示起始时间和截止时间的时间戳。例如,状态边被指定用于指示起始时间和截止时间(“From,To ”)的时间戳。该时间戳用于指示针对节点或者实体的修改事件发生的时间。对于实体关系或者边而言,如果检测到用于启动版本控制的指令,则指定额外时间属性(“From, To”)来描述针对实体关系或者边的修改事件发生的时间。
在步骤608处,如果计算设备110确定当前操作为更新预定节点的节点信息,创建从预定节点经由状态边至实体状态节点的边。在一些实施例中,如果计算设备110确定当前操作为新增节点,默认不做版本控制。如果计算设备110确定当前操作为更新节点信息,则建立一个从对应实体经由状态边至实体状态节点的连接(即,建立Entity-> Has_State(From, To)->EntityState的新连接)。
在步骤610处,如果计算设备110确定当前操作为删除预定节点,删除预定节点,并且使得预定节点关联用于指示删除的标识。 如果计算设备110确定当前操作为删除节点,则需要在对应节点或者对应实体(Entity)上添加一个删除(Delete )的标记。
在步骤612处,如果计算设备110确定当前操作为更新预定边信息,建立新的用于连接对应节点的边,并且同步对应节点的已连接的边所关联的属性信息。如果计算设备110确定当前操作为新增实体关系或者边,默认不做版本控制。如果计算设备110确定当前操作为更新实体关系或者边,则需要新建立一条用于连接对应节点的边,同时被修改的旧的实体关系或者边,需要同步更新其是时间属性(“From, To”)。
在步骤614处,如果计算设备110确定当前操作为删除预定边的信息,删除预定边,并且使得预定边关联一用于指示删除的标识。例如,如果计算设备110确定当前操作为删除某一实体关系或者边,则删除该实体关系或者边,同时需要添加一个用于指示删除(Delete )的标识。
通过采用上述手段,本公开可以使得图数据库内置了可配置的版本控制的功能,以及能够支持针对图数据库基于起始时间和截止时间的时间戳查询方式。
图7示出了可以用来实施本公开内容的实施例的示例设备700的示意性框图。例如,如图1所示的计算设备110可以由设备700来实施。如图所示,设备700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的计算机程序指令或者从存储单元708加载到随机存取存储器(RAM)703中的计算机程序指令,来执行各种适当的动作和处理。在随机存取存储器703中,还可存储设备700操作所需的各种程序和数据。中央处理单元701、只读存储器702以及随机存取存储器703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
设备700中的多个部件连接至输入/输出接口705,包括:输入单元706,例如键盘、鼠标、麦克风等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
上文所描述的各个过程和处理,例如方法200、400和600,可由中央处理单元701执行。例如,在一些实施例中,方法200、400和60可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由只读存储器702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序被加载到随机存取存储器703并由中央处理单元701执行时,可以执行上文描述的方法200、400和600的一个或多个动作。
本公开涉及方法、装置、系统、电子设备、计算机可读存储介质和/或计算机程序产品。计算机程序产品可以包括用于执行本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (10)

1.一种用于检索图数据库中数据的方法,包括:
确认针对图数据库的检索指令是否指定时间范围信息;
响应于确认针对图数据库的检索指令未指定时间范围信息,针对所述图数据库中存储的当前最新节点和边进行遍历;
响应于确认针对图数据库的检索指令包括时间范围信息,解析对应的查询语句,以便确定与所述查询语句相匹配的候选节点和候选边;
响应于确定所述候选节点和候选边中的至少一个开启了版本控制,重写所述查询语句,以便指示需遍历至状态边的、开启了版本控制的候选节点和候选边,并且将所述时间范围信息作为检索约束条件,所述状态边是在图数据库的节点或者边被修改时而配置在所述图数据库中的,所述状态边被关联有时间属性;以及
基于所重写的查询语句,检索所述图数据库。
2.根据权利要求1所述的方法,其中所述图数据库分别存储有关于知识图谱的通用模版和与多个用户分别相关联的多个修改日志,所述修改日志指示相关联的用户针对通用模版中的节点和边进行修改的信息。
3.根据权利要求2所述的方法,其中基于所重写的查询语句检索所述图数据库包括:
基于所重写的查询语句,逐个节点检索所述图数据库的通用模版,以便生成第一检索结果,所述第一检索结果至少指示一个或多个目标节点;以及
检索与用户相关联的修改日志,以便将与所述修改日志所指示的关于所述目标节点的修改信息应用至所述通用模版。
4.根据权利要求3所述的方法,其中将与所述修改日志所指示的关于所述目标节点的修改信息应用至所述通用模版包括:
响应于确定与用户相关联的修改日志指示用户针对第一检索结果中所指示的目标节点进行删除,则在第一检索结果中去除所述目标节点;
响应于确定与用户相关联的修改日志指示用户针对第一检索结果中所指示的目标节点进行修改,基于目标节点的标识替换第一检索结果中目标节点的对应信息;
响应于确定与用户相关联的修改日志指示用户增加预定节点,基于第一检索结果中所指示的、作为被添加的预定节点的上游节点的目标节点的标识,在第一检索结果中添加预定节点的对应信息。
5.根据权利要求1所述的方法,其中所述状态边是在图数据库的节点或者边被修改时而配置在所述图数据库中的包括:
确定是否检测到用于启动图数据库中的预定节点的版本控制的指令;
响应于确定检测到用于启动图数据库中的预定节点的版本控制的指令,针对预定节点生成实体状态节点,所述实体状态节点经由状态边与预定节点相关联;以及
使所述状态边关联用于指示起始时间和截止时间的时间戳。
6.根据权利要求5所述的方法,其中所述状态边是在图数据库的节点或者边被修改时而配置在所述图数据库中的还包括:
响应于确定当前操作为更新预定节点的节点信息,创建从预定节点经由状态边至实体状态节点的边;以及
响应于确定当前操作为删除预定节点,删除预定节点,并且使得预定节点关联用于指示删除的标识。
7.根据权利要求5所述的方法,其中所述状态边是在图数据库的节点或者边被修改时而配置在所述图数据库中的还包括:
响应于确定当前操作为更新预定边信息,建立新的用于连接对应节点的边,并且同步对应节点的已连接的边所关联的属性信息;以及
响应于确定当前操作为删除预定边的信息,删除预定边,并且使得预定边关联一用于指示删除的标识。
8.根据权利要求6或7所述的方法,其中所述状态边是在图数据库的节点或者边被修改时而配置在所述图数据库中的还包括:
响应于确定当前操作为增加预定节点或者预定边,不配置版本控制。
9.一种计算设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的方法。
CN202111316856.6A 2021-11-09 2021-11-09 用于检索图数据库的数据的方法、计算设备和存储介质 Active CN113760971B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111316856.6A CN113760971B (zh) 2021-11-09 2021-11-09 用于检索图数据库的数据的方法、计算设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111316856.6A CN113760971B (zh) 2021-11-09 2021-11-09 用于检索图数据库的数据的方法、计算设备和存储介质

Publications (2)

Publication Number Publication Date
CN113760971A true CN113760971A (zh) 2021-12-07
CN113760971B CN113760971B (zh) 2022-02-22

Family

ID=78784622

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111316856.6A Active CN113760971B (zh) 2021-11-09 2021-11-09 用于检索图数据库的数据的方法、计算设备和存储介质

Country Status (1)

Country Link
CN (1) CN113760971B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114328977A (zh) * 2022-03-09 2022-04-12 北京有生博大软件股份有限公司 一种基于图数据库的人员迁调图谱构建方法
CN115048435A (zh) * 2022-08-15 2022-09-13 联通沃音乐文化有限公司 一种智能型数据库存储方法及系统
CN115080807A (zh) * 2022-07-20 2022-09-20 北京达佳互联信息技术有限公司 数据查询方法、装置及电子设备
CN115795111A (zh) * 2023-01-20 2023-03-14 阿里健康科技(中国)有限公司 图数据的查询方法、装置、设备和存储介质
CN116010350A (zh) * 2023-03-24 2023-04-25 深圳万物安全科技有限公司 二进制日志检索方法、系统、设备及存储介质
WO2024092547A1 (en) * 2022-11-02 2024-05-10 Paypal, Inc. Graph computing for electronic communication risk detection

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530538A (zh) * 2012-07-03 2014-01-22 沈阳高精数控技术有限公司 一种基于Schema的XML安全视图查询方法
CN104899156A (zh) * 2015-05-07 2015-09-09 中国科学院信息工程研究所 一种面向大规模社交网络的图数据存储及查询方法
US20150363461A1 (en) * 2014-06-17 2015-12-17 Google Inc. Real-time saved-query updates for a large graph
US20180081943A1 (en) * 2016-09-16 2018-03-22 At&T Intellectual Property I, L.P. Time-Based Querying of Graph Databases
US10425290B1 (en) * 2018-12-13 2019-09-24 LogicMonitor, Inc. Creating and displaying a graph representation of a computer network topology for an executing application
CN111008198A (zh) * 2019-11-22 2020-04-14 广联达科技股份有限公司 业务数据获取方法、装置、存储介质、电子设备
CN111611806A (zh) * 2020-05-06 2020-09-01 北京智通云联科技有限公司 一种用于知识图谱问答的语义解析方法、系统及设备
CN111737323A (zh) * 2020-08-14 2020-10-02 支付宝(杭州)信息技术有限公司 基于区块链的信息查询方法、装置及电子设备
CN112269887A (zh) * 2020-11-09 2021-01-26 安徽华典大数据科技有限公司 一种基于图数据库的分布式系统
CN112860713A (zh) * 2021-04-23 2021-05-28 脉策(上海)智能科技有限公司 用于获取图层数据的方法、电子设备和存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530538A (zh) * 2012-07-03 2014-01-22 沈阳高精数控技术有限公司 一种基于Schema的XML安全视图查询方法
US20150363461A1 (en) * 2014-06-17 2015-12-17 Google Inc. Real-time saved-query updates for a large graph
CN106462625A (zh) * 2014-06-17 2017-02-22 谷歌公司 针对大型图表的实时所保存查询更新
CN104899156A (zh) * 2015-05-07 2015-09-09 中国科学院信息工程研究所 一种面向大规模社交网络的图数据存储及查询方法
US20180081943A1 (en) * 2016-09-16 2018-03-22 At&T Intellectual Property I, L.P. Time-Based Querying of Graph Databases
US10425290B1 (en) * 2018-12-13 2019-09-24 LogicMonitor, Inc. Creating and displaying a graph representation of a computer network topology for an executing application
CN111008198A (zh) * 2019-11-22 2020-04-14 广联达科技股份有限公司 业务数据获取方法、装置、存储介质、电子设备
CN111611806A (zh) * 2020-05-06 2020-09-01 北京智通云联科技有限公司 一种用于知识图谱问答的语义解析方法、系统及设备
CN111737323A (zh) * 2020-08-14 2020-10-02 支付宝(杭州)信息技术有限公司 基于区块链的信息查询方法、装置及电子设备
CN112269887A (zh) * 2020-11-09 2021-01-26 安徽华典大数据科技有限公司 一种基于图数据库的分布式系统
CN112860713A (zh) * 2021-04-23 2021-05-28 脉策(上海)智能科技有限公司 用于获取图层数据的方法、电子设备和存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114328977A (zh) * 2022-03-09 2022-04-12 北京有生博大软件股份有限公司 一种基于图数据库的人员迁调图谱构建方法
CN115080807A (zh) * 2022-07-20 2022-09-20 北京达佳互联信息技术有限公司 数据查询方法、装置及电子设备
CN115048435A (zh) * 2022-08-15 2022-09-13 联通沃音乐文化有限公司 一种智能型数据库存储方法及系统
CN115048435B (zh) * 2022-08-15 2022-11-01 联通沃音乐文化有限公司 一种智能型数据库存储方法及系统
WO2024092547A1 (en) * 2022-11-02 2024-05-10 Paypal, Inc. Graph computing for electronic communication risk detection
CN115795111A (zh) * 2023-01-20 2023-03-14 阿里健康科技(中国)有限公司 图数据的查询方法、装置、设备和存储介质
CN116010350A (zh) * 2023-03-24 2023-04-25 深圳万物安全科技有限公司 二进制日志检索方法、系统、设备及存储介质
CN116010350B (zh) * 2023-03-24 2023-06-06 深圳万物安全科技有限公司 二进制日志检索方法、系统、设备及存储介质

Also Published As

Publication number Publication date
CN113760971B (zh) 2022-02-22

Similar Documents

Publication Publication Date Title
CN113760971B (zh) 用于检索图数据库的数据的方法、计算设备和存储介质
KR20200104789A (ko) 데이터 저장 및 조회 방법, 장치, 기기 및 매체
US9830376B2 (en) Language tag management on international data storage
US11481440B2 (en) System and method for processing metadata to determine an object sequence
CN111858577B (zh) 存储管理的方法、设备和计算机程序产品
CN107526746B (zh) 管理文档索引的方法和设备
CN110555030A (zh) 一种sql语句的处理方法和装置
US10983718B2 (en) Method, device and computer program product for data backup
US10984050B2 (en) Method, apparatus, and computer program product for managing storage system
CN114579561A (zh) 数据处理方法和装置、存储介质
US11675772B2 (en) Updating attributes in data
CN110674084A (zh) 用于数据保护的方法、设备和计算机可读存储介质
CN108694172B (zh) 信息输出方法和装置
CN113742332A (zh) 数据存储方法、装置、设备及存储介质
CN111600739B (zh) Opc ua地址空间模型中关联节点的同步更新方法
CN114218256A (zh) 访问语句处理方法、装置、设备及存储介质
US11347689B2 (en) Method, device and computer program product for event ordering
CN110968649B (zh) 用于管理数据集的方法、设备和计算机程序产品
CN114089976B (zh) 用于生成数据库操作语句的方法、设备和介质
CN113742321A (zh) 一种数据更新的方法和装置
CN113268488B (zh) 数据持久化的方法和装置
US20210365327A1 (en) Method, electronic deivce and computer program product for creating snapview backup
US11651030B2 (en) Delta-based conflict-free replicated data type arrays using dot stores that map dots to dot stores
US11455437B1 (en) Techniques for generating and retrieving change summary data and aggregated model version data for an infrastructure model
CN113760860B (zh) 一种数据读取方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant