CN115168661B - 原生图数据处理方法、装置、设备及存储介质 - Google Patents

原生图数据处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115168661B
CN115168661B CN202211060033.6A CN202211060033A CN115168661B CN 115168661 B CN115168661 B CN 115168661B CN 202211060033 A CN202211060033 A CN 202211060033A CN 115168661 B CN115168661 B CN 115168661B
Authority
CN
China
Prior art keywords
node
target
index
index word
traversal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211060033.6A
Other languages
English (en)
Other versions
CN115168661A (zh
Inventor
周柳阳
蒋林林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yihao Hulian Technology Co ltd
Original Assignee
Shenzhen Yihao Hulian Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yihao Hulian Technology Co ltd filed Critical Shenzhen Yihao Hulian Technology Co ltd
Priority to CN202211060033.6A priority Critical patent/CN115168661B/zh
Publication of CN115168661A publication Critical patent/CN115168661A/zh
Application granted granted Critical
Publication of CN115168661B publication Critical patent/CN115168661B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results

Abstract

本发明涉及计算机技术领域,公开了一种原生图数据处理方法、装置、设备及存储介质,用于提高原生图数据处理的效率。所述原生图数据处理方法包括:获取待处理的多个索引词,并根据多个索引词生成索引词集合;将索引词集合输入预置的原生图数据库进行索引词节点匹配,得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合;对第二节点集合中的多个集合元素进行节点遍历,得到每个集合元素对应的遍历堆;对遍历堆中的多个堆元素进行排序,得到目标排序结果,并根据目标排序结果提取遍历堆对应的目标节点;根据目标节点构建多个索引词对应的结果树,并根据结果树生成目标数据并输出。

Description

原生图数据处理方法、装置、设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种原生图数据处理方法、装置、设备及存储介质。
背景技术
随着互联网技术的高速发展,数据规模越来越大,数据结构也越来越复杂,而且对系统的需求越来越高。原生图数据库的核心概念是通过节点、边和属性等方式来表示和存储数据,支持增删改查等图查询操作,提供数据库管理功能。而在图的分析挖掘领域,除了图查询,还常常要执行批量迭代式的图处理任务—图计算。
现有方案进行原生图数据搜索时,需要把整个图结构加载到内存中,所以,当节点数的数量偏大时,会受到内存的限制,导致现有方案的效率低。
发明内容
本发明提供了一种原生图数据处理方法、装置、设备及存储介质,用于提高原生图数据处理的效率。
本发明第一方面提供了一种原生图数据处理方法,所述原生图数据处理方法包括:获取待处理的多个索引词,并根据所述多个索引词生成索引词集合;将所述索引词集合输入预置的原生图数据库进行索引词节点匹配,得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合;对所述第二节点集合中的多个集合元素进行节点遍历,得到每个集合元素对应的遍历堆;对所述遍历堆中的多个堆元素进行排序,得到目标排序结果,并根据所述目标排序结果提取所述遍历堆对应的目标节点;根据所述目标节点构建所述多个索引词对应的结果树,并根据所述结果树生成目标数据并输出。
可选的,在本发明第一方面的第一种实现方式中,所述将所述索引词集合输入预置的原生图数据库进行索引词节点匹配,得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合,包括:将所述索引词集合输入预置的原生图数据库,并通过所述原生图数据库分别对所述索引词集合中的多个索引词进行索引词节点匹配,得到每个索引词对应的第一节点集合;根据所述第一节点集合查询每个索引词节点对应的目标节点词;对所述目标节点词和每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合。
可选的,在本发明第一方面的第二种实现方式中,所述原生图数据处理方法还包括:构建所述目标节点词和所述索引词节点之间的属性关系;根据所述属性关系对所述目标节点词进行节点映射,得到节点词关系对;根据所述节点词关系对索引所述索引词节点的目标节点词。
可选的,在本发明第一方面的第三种实现方式中,所述对所述第二节点集合中的多个集合元素进行节点遍历,得到每个集合元素对应的遍历堆,包括:提取所述第二节点集合中的多个集合元素,其中,所述集合元素用于指示所述索引词节点;调用预置的遍历算法分别对所述多个集合元素进行节点遍历,得到每个集合元素的最短路径信息;将每个集合元素的最短路径信息存储至一个集合中,生成每个集合元素对应的遍历堆。
可选的,在本发明第一方面的第四种实现方式中,所述对所述遍历堆中的多个堆元素进行排序,得到目标排序结果,并根据所述目标排序结果提取所述遍历堆对应的目标节点,包括:获取所述遍历堆中的多个堆元素;根据所述最短路径信息对所述多个堆元素进行路径距离排序,得到目标排序结果;提取所述目标排序结果中的第一个节点,并将所述第一个节点作为所述遍历堆对应的目标节点。
可选的,在本发明第一方面的第五种实现方式中,所述根据所述目标节点构建所述多个索引词对应的结果树,并根据所述结果树生成目标数据并输出,包括:根据所述目标节点在所述原生图数据库中搜索与所述目标节点对应的相关节点;将所述目标节点作为根节点构建所述相关节点与所述多个索引词对应的结果树;根据所述结果树中的多个目标节点词生成目标数据,并将所述目标数据作为所述多个索引词的搜索结果并输出。
可选的,在本发明第一方面的第六种实现方式中,所述原生图数据处理方法还包括:获取多个搜索结果,并对所述多个搜索结果进行结果排序,得到搜索结果序列;根据所述搜索结果序列分别对所述多个搜索结果进行输出。
本发明第二方面提供了一种原生图数据处理装置,所述原生图数据处理装置包括:获取模块,用于获取待处理的多个索引词,并根据所述多个索引词生成索引词集合;匹配模块,用于将所述索引词集合输入预置的原生图数据库进行索引词节点匹配,得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合;遍历模块,用于对所述第二节点集合中的多个集合元素进行节点遍历,得到每个集合元素对应的遍历堆;排序模块,用于对所述遍历堆中的多个堆元素进行排序,得到目标排序结果,并根据所述目标排序结果提取所述遍历堆对应的目标节点;输出模块,用于根据所述目标节点构建所述多个索引词对应的结果树,并根据所述结果树生成目标数据并输出。
可选的,在本发明第二方面的第一种实现方式中,所述匹配模块具体用于:将所述索引词集合输入预置的原生图数据库,并通过所述原生图数据库分别对所述索引词集合中的多个索引词进行索引词节点匹配,得到每个索引词对应的第一节点集合;根据所述第一节点集合查询每个索引词节点对应的目标节点词;对所述目标节点词和每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合。
可选的,在本发明第二方面的第二种实现方式中,所述原生图数据处理装置还包括:映射模块,用于构建所述目标节点词和所述索引词节点之间的属性关系;根据所述属性关系对所述目标节点词进行节点映射,得到节点词关系对;根据所述节点词关系对索引所述索引词节点的目标节点词。
可选的,在本发明第二方面的第三种实现方式中,所述遍历模块具体用于:提取所述第二节点集合中的多个集合元素,其中,所述集合元素用于指示所述索引词节点;调用预置的遍历算法分别对所述多个集合元素进行节点遍历,得到每个集合元素的最短路径信息;将每个集合元素的最短路径信息存储至一个集合中,生成每个集合元素对应的遍历堆。
可选的,在本发明第二方面的第四种实现方式中,所述排序模块具体用于:获取所述遍历堆中的多个堆元素;根据所述最短路径信息对所述多个堆元素进行路径距离排序,得到目标排序结果;提取所述目标排序结果中的第一个节点,并将所述第一个节点作为所述遍历堆对应的目标节点。
可选的,在本发明第二方面的第五种实现方式中,所述输出模块具体用于:根据所述目标节点在所述原生图数据库中搜索与所述目标节点对应的相关节点;将所述目标节点作为根节点构建所述相关节点与所述多个索引词对应的结果树;根据所述结果树中的多个目标节点词生成目标数据,并将所述目标数据作为所述多个索引词的搜索结果并输出。
可选的,在本发明第二方面的第六种实现方式中,所述原生图数据处理装置还包括:排序模块,用于获取多个搜索结果,并对所述多个搜索结果进行结果排序,得到搜索结果序列;根据所述搜索结果序列分别对所述多个搜索结果进行输出。
本发明第三方面提供了一种原生图数据处理设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述原生图数据处理设备执行上述的原生图数据处理方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的原生图数据处理方法。
本发明提供的技术方案中,获取待处理的多个索引词,并根据多个索引词生成索引词集合,通过将索引词生成索引词集合,可以实现一次性搜索多个索引词,节省了搜索次数,提高了搜索效率;将索引词集合输入预置的原生图数据库进行索引词节点匹配,得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合,本发明通过对原生图数据库进行搜索以数据节点为基础来进行分析图,提高数据库搜索的数据挖掘速度;对第二节点集合中的多个集合元素进行节点遍历,得到每个集合元素对应的遍历堆;对遍历堆中的多个堆元素进行排序,得到目标排序结果,并根据目标排序结果提取遍历堆对应的目标节点;根据目标节点构建多个索引词对应的结果树,并根据结果树生成目标数据并输出,通过对结果树生成目标数据,然后对目标数据进行排序,同时生成多个索引词的多个搜索结果,提高了原生图数据库搜索的效率,进而提高了原生图数据处理的效率。
附图说明
图1为本发明实施例中原生图数据处理方法的一个实施例示意图;
图2为本发明实施例中原生图数据处理方法的另一个实施例示意图;
图3为本发明实施例中原生图数据处理装置的一个实施例示意图;
图4为本发明实施例中原生图数据处理装置的另一个实施例示意图;
图5为本发明实施例中原生图数据处理设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种原生图数据处理方法、装置、设备及存储介质,用于提高原生图数据处理的效率。本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中原生图数据处理方法的一个实施例包括:
101、获取待处理的多个索引词,并根据多个索引词生成索引词集合;
可以理解的是,本发明的执行主体可以为原生图数据处理装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
具体的,服务器可以获取索引词,获取索引词的方式可以是,服务器通过终端显示获取索引词的界面,具体的,服务器可以通过用户在界面上输入的索引词获取索引词,也可通过采集用户输入的音频获取索引词。在终端获取索引词之后,可以根据多个索引词生成索引词集合。
102、将索引词集合输入预置的原生图数据库进行索引词节点匹配,得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合;
具体的,获取索引词集合,索引词集合中包括待分类的索引词信息以及对该索引词信息进行预分类所得到的预分类编码,根据预先存储的分类编码与索引词序列的对应关系,确定预分类编码所对应的目标索引词序列,判断索引词文本是否与目标索引词序列中的每一个索引词相匹配,若索引词文本与目标索引词序列中的每一个索引词相匹配,则判定预分类编码正确,将预分类编码作为该索引词信息的分类编码,并对得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合。
103、对第二节点集合中的多个集合元素进行节点遍历,得到每个集合元素对应的遍历堆;
具体的,服务器接收遍历条件,根据遍历条件在索引词数据库进行遍历,生成与遍历条件相匹配的至少一个索引词,根据索引词以及基于该索引词统计数据生成索引词列表,接收用户输入的目标遍历条件,获取该目标遍历条件的目标统计数据,统计数据包括含有索引词的遍历堆的数量以及相应的遍历堆列表,基于遍历堆列表进行逻辑与运算,以获取满足遍历条件和目标遍历条件的目标遍历堆,其中还包括遍历堆数量,基于索引词以及后台的遍历堆列表实现了索引词的选取以及遍历堆和技术的统计、分析。
104、对遍历堆中的多个堆元素进行排序,得到目标排序结果,并根据目标排序结果提取遍历堆对应的目标节点;
具体的,按照必经节点序列中各必经节点的排序,依次将各必经节点添加至待确定距离中,并确定待确定距离每两个相邻的必经节点生成的子距离,遍历每一子距离,在可选节点中确定每一子距离对应的待插入可选节点,将待插入可选节点插入对应的子距离中,得到目标距离,得到目标排序结果,提取目标排序结果中的第一个节点,并将第一个节点作为遍历堆对应的目标节点,能够提高数据收集的效率。
105、根据目标节点构建多个索引词对应的结果树,并根据结果树生成目标数据并输出。
具体的,服务器根据目标节点在原生图数据库中搜索与目标节点对应的相关节点,将目标节点作为根节点构建相关节点与多个索引词对应的结果树,根据结果树中的多个目标节点词生成目标数据,并将目标数据作为多个索引词的搜索结果并输出,本实施例中通过获取与目标节点预先关联的信息规则,根据结果树中的多个目标节点词生成目标数据,并将目标数据作为多个索引词的搜索结果并输出,能够提高查找效率。
本发明实施例中,获取待处理的多个索引词,并根据多个索引词生成索引词集合,通过将索引词生成索引词集合,可以实现一次性搜索多个索引词,节省了搜索次数,提高了搜索效率;将索引词集合输入预置的原生图数据库进行索引词节点匹配,得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合,本发明通过对原生图数据库进行搜索以数据节点为基础来进行分析图,提高数据库搜索的数据挖掘速度;对第二节点集合中的多个集合元素进行节点遍历,得到每个集合元素对应的遍历堆;对遍历堆中的多个堆元素进行排序,得到目标排序结果,并根据目标排序结果提取遍历堆对应的目标节点;根据目标节点构建多个索引词对应的结果树,并根据结果树生成目标数据并输出,通过对结果树生成目标数据,然后对目标数据进行排序,同时生成多个索引词的多个搜索结果,提高了原生图数据库搜索的效率,进而提高了原生图数据处理的效率。
请参阅图2,本发明实施例中原生图数据处理方法的另一个实施例包括:
201、获取待处理的多个索引词,并根据多个索引词生成索引词集合;
具体的,在本实施例中,步骤201的具体实施方式与上述步骤101类似,此处不再赘述。
202、将索引词集合输入预置的原生图数据库,并通过原生图数据库分别对索引词集合中的多个索引词进行索引词节点匹配,得到每个索引词对应的第一节点集合;
具体的,在本实施例中,步骤202的具体实施方式与上述步骤102类似,此处不再赘述。
203、根据第一节点集合查询每个索引词节点对应的目标节点词;
可选的,构建目标节点词和索引词节点之间的属性关系;根据属性关系对目标节点词进行节点映射,得到节点词关系对;根据节点词关系对索引词节点的目标节点词。
其中,构建目标节点的路径关系映射集合,作为映射关系规则存储到配置文件,加载映射关系规则,遍历DOM树,输出路径匹配的节点数据,得到原始映射关系集合,为每组映射关系进行一致性排序,并输出最终的映射关系集合,最终服务器根据该映射关系集合,根据属性关系对目标节点词进行节点映射,得到节点词关系对;根据节点词关系对索引词节点的目标节点词。
204、对目标节点词和每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合;
205、对第二节点集合中的多个集合元素进行节点遍历,得到每个集合元素对应的遍历堆;
具体的,提取第二节点集合中的多个集合元素,其中,集合元素用于指示索引词节点;调用预置的遍历算法分别对多个集合元素进行节点遍历,得到每个集合元素的最短路径信息;将每个集合元素的最短路径信息存储至一个集合中,生成每个集合元素对应的遍历堆。
其中,当提取第二节点集合中的多个集合元素后,将索引词节点存放至队列中,查询与索引词节点相邻的所有其它节点,将所有相邻节点存放至队列中,依次遍历队列中的所有节点,查询与节点相邻的所有其它节点,并通过循环遍历查询与目标节点一致的相邻节点,由此获得最短路径,将每个集合元素的最短路径信息存储至一个集合中,生成每个集合元素对应的遍历堆。本申请通过对相邻节点进行监控获得目标节点,以此获得最短路径,可以提高查询的速度和效率。
206、对遍历堆中的多个堆元素进行排序,得到目标排序结果,并根据目标排序结果提取遍历堆对应的目标节点;
具体的,获取遍历堆中的多个堆元素;根据最短路径信息对多个堆元素进行路径距离排序,得到目标排序结果;提取目标排序结果中的第一个节点,并将第一个节点作为遍历堆对应的目标节点。
其中,获取待确定距离的相关信息,包括起始节点的信息,必经节点的信息,可选节点的信息,以及各节点之间的时间距离信息,时间距离信息表示两个节点之间的距离或可达时间,基于各必经节点与起始节点之间的时间距离信息,对各必经节点进行排序,得到必经节点序列,按照必经节点序列中各必经节点的排序,依次将各必经节点添加至待确定距离中,并确定待确定距离每两个相邻的必经节点生成的子距离,遍历每一子距离,在可选节点中确定每一子距离对应的待插入可选节点,将待插入可选节点插入对应的子距离中,得到目标距离,得到目标排序结果,提取目标排序结果中的第一个节点,并将第一个节点作为遍历堆对应的目标节点,能够提高数据收集的效率。
207、根据目标节点构建多个索引词对应的结果树,并根据结果树生成目标数据并输出。
具体的,根据目标节点在原生图数据库中搜索与目标节点对应的相关节点;将目标节点作为根节点构建相关节点与多个索引词对应的结果树;根据结果树中的多个目标节点词生成目标数据,并将目标数据作为多个索引词的搜索结果并输出。
其中,通过多个目标节点信息预先创建树形结构,树形结构中除根节点外的任一子节点表示至少一个比特位,且每个子节点对应一个结果信息,从根节点到子节点所经分支上的所有节点各自表示的比特位的值按经过顺序排列的二进制数,获取待匹配结果信息,从树形结构中,与根节点连接的第一层子节点开始,通过比较子节点所表示的比特位与待匹配结果信息中对应位置的比特位是否一致,查找出树形结构中是否存在与待匹配结果信息对应的目标节点,如果查找到目标节点,获取与目标节点预先关联的信息规则,根据结果树中的多个目标节点词生成目标数据,并将目标数据作为多个索引词的搜索结果并输出,能够提高查找效率。
可选的,获取多个搜索结果,并对多个搜索结果进行结果排序,得到搜索结果序列;根据搜索结果序列分别对多个搜索结果进行输出。
其中,服务器对多个搜索结果进行基础排序,对该基础排序进行修正调整,得到搜索结果的最终排序,并对基础排序进行修正调整,得到搜索结果的最终排序,根据共现信息等情况来对基础排序进行调整,得到二次排序的结果,使排序的依据更合理,以向用户提供更为精准的搜索结果,提高了搜索结果的质量,简化了用户的操作。
本发明实施例中,获取待处理的多个索引词,并根据多个索引词生成索引词集合,通过将索引词生成索引词集合,可以实现一次性搜索多个索引词,节省了搜索次数,提高了搜索效率;将索引词集合输入预置的原生图数据库进行索引词节点匹配,得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合,本发明通过对原生图数据库进行搜索以数据节点为基础来进行分析图,提高数据库搜索的数据挖掘速度;对第二节点集合中的多个集合元素进行节点遍历,得到每个集合元素对应的遍历堆;对遍历堆中的多个堆元素进行排序,得到目标排序结果,并根据目标排序结果提取遍历堆对应的目标节点;根据目标节点构建多个索引词对应的结果树,并根据结果树生成目标数据并输出,通过对结果树生成目标数据,然后对目标数据进行排序,同时生成多个索引词的多个搜索结果,提高了原生图数据库搜索的效率,进而提高了原生图数据处理的效率。
上面对本发明实施例中原生图数据处理方法进行了描述,下面对本发明实施例中原生图数据处理装置进行描述,请参阅图3,本发明实施例中原生图数据处理装置一个实施例包括:
获取模块301,用于获取待处理的多个索引词,并根据所述多个索引词生成索引词集合;
匹配模块302,用于将所述索引词集合输入预置的原生图数据库进行索引词节点匹配,得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合;
遍历模块303,用于对所述第二节点集合中的多个集合元素进行节点遍历,得到每个集合元素对应的遍历堆;
排序模块304,用于对所述遍历堆中的多个堆元素进行排序,得到目标排序结果,并根据所述目标排序结果提取所述遍历堆对应的目标节点;
输出模块305,用于根据所述目标节点构建所述多个索引词对应的结果树,并根据所述结果树生成目标数据并输出。
本发明实施例中,获取待处理的多个索引词,并根据多个索引词生成索引词集合,通过将索引词生成索引词集合,可以实现一次性搜索多个索引词,节省了搜索次数,提高了搜索效率;将索引词集合输入预置的原生图数据库进行索引词节点匹配,得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合,本发明通过对原生图数据库进行搜索以数据节点为基础来进行分析图,提高数据库搜索的数据挖掘速度;对第二节点集合中的多个集合元素进行节点遍历,得到每个集合元素对应的遍历堆;对遍历堆中的多个堆元素进行排序,得到目标排序结果,并根据目标排序结果提取遍历堆对应的目标节点;根据目标节点构建多个索引词对应的结果树,并根据结果树生成目标数据并输出,通过对结果树生成目标数据,然后对目标数据进行排序,同时生成多个索引词的多个搜索结果,提高了原生图数据库搜索的效率,进而提高了原生图数据处理的效率。
请参阅图4,本发明实施例中原生图数据处理装置另一个实施例包括:
获取模块301,用于获取待处理的多个索引词,并根据所述多个索引词生成索引词集合;
匹配模块302,用于将所述索引词集合输入预置的原生图数据库进行索引词节点匹配,得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合;
遍历模块303,用于对所述第二节点集合中的多个集合元素进行节点遍历,得到每个集合元素对应的遍历堆;
排序模块304,用于对所述遍历堆中的多个堆元素进行排序,得到目标排序结果,并根据所述目标排序结果提取所述遍历堆对应的目标节点;
输出模块305,用于根据所述目标节点构建所述多个索引词对应的结果树,并根据所述结果树生成目标数据并输出。
可选的,所述匹配模块302具体用于:
将所述索引词集合输入预置的原生图数据库,并通过所述原生图数据库分别对所述索引词集合中的多个索引词进行索引词节点匹配,得到每个索引词对应的第一节点集合;根据所述第一节点集合查询每个索引词节点对应的目标节点词;对所述目标节点词和每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合。
可选的,所述原生图数据处理装置还包括:
映射模块306,用于构建所述目标节点词和所述索引词节点之间的属性关系;根据所述属性关系对所述目标节点词进行节点映射,得到节点词关系对;根据所述节点词关系对索引所述索引词节点的目标节点词。
可选的,所述遍历模块303具体用于:
提取所述第二节点集合中的多个集合元素,其中,所述集合元素用于指示所述索引词节点;调用预置的遍历算法分别对所述多个集合元素进行节点遍历,得到每个集合元素的最短路径信息;将每个集合元素的最短路径信息存储至一个集合中,生成每个集合元素对应的遍历堆。
可选的,所述排序模块304具体用于:
获取所述遍历堆中的多个堆元素;根据所述最短路径信息对所述多个堆元素进行路径距离排序,得到目标排序结果;提取所述目标排序结果中的第一个节点,并将所述第一个节点作为所述遍历堆对应的目标节点。
可选的,所述输出模块305具体用于:
根据所述目标节点在所述原生图数据库中搜索与所述目标节点对应的相关节点;将所述目标节点作为根节点构建所述相关节点与所述多个索引词对应的结果树;根据所述结果树中的多个目标节点词生成目标数据,并将所述目标数据作为所述多个索引词的搜索结果并输出。
可选的,所述原生图数据处理装置还包括:
排序模块307,用于获取多个搜索结果,并对所述多个搜索结果进行结果排序,得到搜索结果序列;根据所述搜索结果序列分别对所述多个搜索结果进行输出。
本发明实施例中,获取待处理的多个索引词,并根据多个索引词生成索引词集合,通过将索引词生成索引词集合,可以实现一次性搜索多个索引词,节省了搜索次数,提高了搜索效率;将索引词集合输入预置的原生图数据库进行索引词节点匹配,得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合,本发明通过对原生图数据库进行搜索以数据节点为基础来进行分析图,提高数据库搜索的数据挖掘速度;对第二节点集合中的多个集合元素进行节点遍历,得到每个集合元素对应的遍历堆;对遍历堆中的多个堆元素进行排序,得到目标排序结果,并根据目标排序结果提取遍历堆对应的目标节点;根据目标节点构建多个索引词对应的结果树,并根据结果树生成目标数据并输出,通过对结果树生成目标数据,然后对目标数据进行排序,同时生成多个索引词的多个搜索结果,提高了原生图数据库搜索的效率,进而提高了原生图数据处理的效率。
上面图3和图4从模块化功能实体的角度对本发明实施例中的原生图数据处理装置进行详细描述,下面从硬件处理的角度对本发明实施例中原生图数据处理设备进行详细描述。
图5是本发明实施例提供的一种原生图数据处理设备的结构示意图,该原生图数据处理设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对原生图数据处理设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在原生图数据处理设备500上执行存储介质530中的一系列指令操作。
原生图数据处理设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的原生图数据处理设备结构并不构成对原生图数据处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种原生图数据处理设备,所述原生图数据处理设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例中的所述原生图数据处理方法的步骤。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述原生图数据处理方法的步骤。
进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种原生图数据处理方法,其特征在于,所述原生图数据处理方法包括:
获取待处理的多个索引词,并根据所述多个索引词生成索引词集合;
将所述索引词集合输入预置的原生图数据库进行索引词节点匹配,得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合;其中,所述将所述索引词集合输入预置的原生图数据库进行索引词节点匹配,得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合,包括:将所述索引词集合输入预置的原生图数据库,并通过所述原生图数据库分别对所述索引词集合中的多个索引词进行索引词节点匹配,得到每个索引词对应的第一节点集合;根据所述第一节点集合查询每个索引词节点对应的目标节点词;对所述目标节点词和每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合;其中,构建所述目标节点词和所述索引词节点之间的属性关系;根据所述属性关系对所述目标节点词进行节点映射,得到节点词关系对;根据所述节点词关系对索引所述索引词节点的目标节点词;
对所述第二节点集合中的多个集合元素进行节点遍历,得到每个集合元素对应的遍历堆;
对所述遍历堆中的多个堆元素进行排序,得到目标排序结果,并根据所述目标排序结果提取所述遍历堆对应的目标节点;
根据所述目标节点构建所述多个索引词对应的结果树,并根据所述结果树生成目标数据并输出。
2.根据权利要求1所述的原生图数据处理方法,其特征在于,所述对所述第二节点集合中的多个集合元素进行节点遍历,得到每个集合元素对应的遍历堆,包括:
提取所述第二节点集合中的多个集合元素,其中,所述集合元素用于指示所述索引词节点;
调用预置的遍历算法分别对所述多个集合元素进行节点遍历,得到每个集合元素的最短路径信息;
将每个集合元素的最短路径信息存储至一个集合中,生成每个集合元素对应的遍历堆。
3.根据权利要求2所述的原生图数据处理方法,其特征在于,所述对所述遍历堆中的多个堆元素进行排序,得到目标排序结果,并根据所述目标排序结果提取所述遍历堆对应的目标节点,包括:
获取所述遍历堆中的多个堆元素;
根据所述最短路径信息对所述多个堆元素进行路径距离排序,得到目标排序结果;
提取所述目标排序结果中的第一个节点,并将所述第一个节点作为所述遍历堆对应的目标节点。
4.根据权利要求1所述的原生图数据处理方法,其特征在于,所述根据所述目标节点构建所述多个索引词对应的结果树,并根据所述结果树生成目标数据并输出,包括:
根据所述目标节点在所述原生图数据库中搜索与所述目标节点对应的相关节点;
将所述目标节点作为根节点构建所述相关节点与所述多个索引词对应的结果树;
根据所述结果树中的多个目标节点词生成目标数据,并将所述目标数据作为所述多个索引词的搜索结果并输出。
5.根据权利要求4所述的原生图数据处理方法,其特征在于,所述原生图数据处理方法还包括:
获取多个搜索结果,并对所述多个搜索结果进行结果排序,得到搜索结果序列;
根据所述搜索结果序列分别对所述多个搜索结果进行输出。
6.一种原生图数据处理装置,其特征在于,所述原生图数据处理装置包括:
获取模块,用于获取待处理的多个索引词,并根据所述多个索引词生成索引词集合;
匹配模块,用于将所述索引词集合输入预置的原生图数据库进行索引词节点匹配,得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合;其中,所述将所述索引词集合输入预置的原生图数据库进行索引词节点匹配,得到每个索引词对应的第一节点集合,并对每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合,包括:将所述索引词集合输入预置的原生图数据库,并通过所述原生图数据库分别对所述索引词集合中的多个索引词进行索引词节点匹配,得到每个索引词对应的第一节点集合;根据所述第一节点集合查询每个索引词节点对应的目标节点词;对所述目标节点词和每个索引词对应的第一节点集合进行节点集融合,得到第二节点集合;其中,构建所述目标节点词和所述索引词节点之间的属性关系;根据所述属性关系对所述目标节点词进行节点映射,得到节点词关系对;根据所述节点词关系对索引所述索引词节点的目标节点词;
遍历模块,用于对所述第二节点集合中的多个集合元素进行节点遍历,得到每个集合元素对应的遍历堆;
排序模块,用于对所述遍历堆中的多个堆元素进行排序,得到目标排序结果,并根据所述目标排序结果提取所述遍历堆对应的目标节点;
输出模块,用于根据所述目标节点构建所述多个索引词对应的结果树,并根据所述结果树生成目标数据并输出。
7.一种原生图数据处理设备,其特征在于,所述原生图数据处理设备包括:存储器和至少一个处理器,所述存储器中存储有指令;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述原生图数据处理设备执行如权利要求1-5中任一项所述的原生图数据处理方法。
8.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现如权利要求1-5中任一项所述的原生图数据处理方法。
CN202211060033.6A 2022-08-31 2022-08-31 原生图数据处理方法、装置、设备及存储介质 Active CN115168661B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211060033.6A CN115168661B (zh) 2022-08-31 2022-08-31 原生图数据处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211060033.6A CN115168661B (zh) 2022-08-31 2022-08-31 原生图数据处理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN115168661A CN115168661A (zh) 2022-10-11
CN115168661B true CN115168661B (zh) 2022-12-02

Family

ID=83481858

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211060033.6A Active CN115168661B (zh) 2022-08-31 2022-08-31 原生图数据处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115168661B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6163782A (en) * 1997-11-19 2000-12-19 At&T Corp. Efficient and effective distributed information management
CN102163218A (zh) * 2011-03-28 2011-08-24 武汉大学 基于图索引的图数据库关键词邻近搜索方法
CN111177405A (zh) * 2019-12-18 2020-05-19 深圳壹账通智能科技有限公司 数据搜索匹配方法、装置、计算机设备和存储介质
CN113434506A (zh) * 2021-06-29 2021-09-24 平安科技(深圳)有限公司 数据管理及检索方法、装置、计算机设备及可读存储介质
CN114443780A (zh) * 2021-12-28 2022-05-06 阿里云计算有限公司 数据处理方法、装置、设备和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111460798A (zh) * 2020-03-02 2020-07-28 平安科技(深圳)有限公司 近义词推送方法、装置、电子设备及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6163782A (en) * 1997-11-19 2000-12-19 At&T Corp. Efficient and effective distributed information management
CN102163218A (zh) * 2011-03-28 2011-08-24 武汉大学 基于图索引的图数据库关键词邻近搜索方法
CN111177405A (zh) * 2019-12-18 2020-05-19 深圳壹账通智能科技有限公司 数据搜索匹配方法、装置、计算机设备和存储介质
CN113434506A (zh) * 2021-06-29 2021-09-24 平安科技(深圳)有限公司 数据管理及检索方法、装置、计算机设备及可读存储介质
CN114443780A (zh) * 2021-12-28 2022-05-06 阿里云计算有限公司 数据处理方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN115168661A (zh) 2022-10-11

Similar Documents

Publication Publication Date Title
Navarro Spaces, trees, and colors: The algorithmic landscape of document retrieval on sequences
US20200058374A1 (en) Systems and methods for adaptive local alignment for graph genomes
CN111460311A (zh) 基于字典树的搜索处理方法、装置、设备和存储介质
CN108647276B (zh) 一种搜索方法
WO2002027532A1 (en) System and method for use in text analysis of documents and records
CN113420537B (zh) 电子表格数据处理方法、装置、设备及存储介质
CN108228657B (zh) 一种关键字检索的实现方法及装置
CN112083812A (zh) 联想词确定方法、装置、存储介质和电子设备
JP2012073812A (ja) データ分析支援システム及び方法
CN110737779A (zh) 知识图谱的构建方法、装置、存储介质和电子设备
CN113918807A (zh) 数据推荐方法、装置、计算设备及计算机可读存储介质
CN111984673B (zh) 一种电网电能量计量系统树形结构模糊检索方法和装置
CN115168661B (zh) 原生图数据处理方法、装置、设备及存储介质
CN113806647A (zh) 识别开发框架的方法及相关设备
CN115147020B (zh) 装修数据处理方法、装置、设备及存储介质
CN115130043B (zh) 基于数据库的数据处理方法、装置、设备及存储介质
CN112650791B (zh) 字段处理方法、装置、计算机设备和存储介质
CN112069236A (zh) 关联文件的展示方法、装置、设备及存储介质
JPH1011469A (ja) 多段表処理方式
CN115168399B (zh) 基于图形化界面的数据处理方法、装置、设备及存储介质
KR20190139227A (ko) K-부정합 검색을 위한 필터를 생성하는 시스템 및 방법
CN117313111B (zh) 一种基于汽车信息安全测试用例的标注与索引方法和系统
CN115630154B (zh) 一种面向大数据环境的动态摘要信息构建方法及系统
JP5091937B2 (ja) エンジンプロセスの構築方法および装置
Contreras-Orendain Limitations of Genomic Analysis on Novel Species

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant