CN114528444A - 图数据处理方法、装置、电子设备和存储介质 - Google Patents
图数据处理方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN114528444A CN114528444A CN202210184254.8A CN202210184254A CN114528444A CN 114528444 A CN114528444 A CN 114528444A CN 202210184254 A CN202210184254 A CN 202210184254A CN 114528444 A CN114528444 A CN 114528444A
- Authority
- CN
- China
- Prior art keywords
- information
- sub
- field
- cache
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title abstract description 17
- 230000006835 compression Effects 0.000 claims abstract description 122
- 238000007906 compression Methods 0.000 claims abstract description 122
- 238000012545 processing Methods 0.000 claims abstract description 19
- 238000000034 method Methods 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 11
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 22
- 238000004891 communication Methods 0.000 description 10
- 101100288387 Caenorhabditis elegans lab-1 gene Proteins 0.000 description 8
- 235000013305 food Nutrition 0.000 description 8
- 239000000555 dodecyl gallate Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000000594 mannitol Substances 0.000 description 2
- 239000004223 monosodium glutamate Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000001119 stannous chloride Substances 0.000 description 2
- 239000001117 sulphuric acid Substances 0.000 description 2
- 239000000196 tragacanth Substances 0.000 description 2
- 239000004262 Ethyl gallate Substances 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 235000008429 bread Nutrition 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9014—Indexing; Data structures therefor; Storage structures hash tables
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本公开提供了一种图数据处理方法,涉及人工智能技术领域,尤其涉及知识图谱技术领域。具体实现方案为:针对多个结点中的每个结点,删除与每个结点相关的K个关系信息中的类型子信息,得到K个压缩关系信息,其中,每个关系信息将多个结点中作为源结点的结点与作为目标结点的结点相连,K为大于或等于1的整数;以及根据K个压缩关系信息和类型子信息,生成每个结点的编码信息。本公开还提供了一种图数据处理装置、电子设备和存储介质。
Description
技术领域
本公开涉及人工智能技术领域,尤其涉及知识图谱技术领域。更具体地,本公开提供了一种图数据处理方法、装置、电子设备和存储介质。
背景技术
图数据包括关系信息。可以将关系信息存储至内存中,使得关系信息可以被高效地访问。
发明内容
本公开提供了一种图数据处理方法、装置、设备以及存储介质。
根据本公开的一方面,提供了一种图数据处理方法,该方法包括:所述图数据包括多个结点和结点之间的关系信息,所述方法包括:针对多个结点中的每个结点,删除与所述每个结点相关的K个关系信息中的类型子信息,得到K个压缩关系信息,其中,每个关系信息将所述多个结点中作为源结点的结点与作为目标结点的结点相连,K为大于或等于1的整数;以及根据所述K个压缩关系信息和所述类型子信息,生成所述每个结点的编码信息。
根据本公开的另一方面,提供了一种图数据处理装置,所述图数据包括多个结点和结点之间的关系信息,所述装置包括:删除模块,用于针对所述多个结点中的每个结点,删除与所述每个结点相关的K个关系信息中的类型子信息,得到K个压缩关系信息,其中,每个关系信息将所述多个结点中作为源结点的结点与作为目标结点的结点相连,K为大于或等于1的整数;以及生成模块,用于根据所述K个压缩关系信息和所述类型子信息,生成所述每个结点的编码信息。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据本公开提供的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行根据本公开提供的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开提供的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开的一个实施例的可以应用图数据处理方法和装置的示例性系统架构示意图;
图2是根据本公开的一个实施例的图数据处理方法的流程图;
图3A是根据本公开的一个实施例的图数据的示意图;
图3B是根据本公开的一个实施例的编码信息的示意图;
图4A是根据本公开的另一个实施例的图数据的示意图;
图4B是根据本公开的另一个实施例的编码信息的示意图;
图5A是根据本公开的另一个实施例的图数据的示意图;
图5B是根据本公开的另一个实施例的编码信息的示意图;
图6A是根据本公开的另一个实施例的图数据的示意图;
图6B是根据本公开的另一个实施例的编码信息的示意图;
图7是根据本公开的一个实施例的图数据处理装置的框图;以及
图8是根据本公开的一个实施例的可以应用图数据处理方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图数据可以包括大量的关系信息。
可以将全部的关系信息都存储至内存中,并利用哈希表等索引结构提供高效的访问服务。但全部的关系信息可以占用大量的内存空间。而且,有些关系信息被访问的频率较低,将这些关系信息存储至内存中,会产生大量非必要的成本。
可以将内存作为缓存,再将被访问频率较高的关系信息存储至该缓存中。但是,缓存中的信息可以被更新,部分关系信息可能被移出缓存,导致这些信息无法被高效地访问。
图1是根据本公开一个实施例的可以应用图数据处理方法和装置的示例性系统架构示意图。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的图数据处理方法一般可以由服务器105执行。相应地,本公开实施例所提供的图数据处理装置一般可以设置于服务器105中。本公开实施例所提供的图数据处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的图数据处理装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
图2是根据本公开的一个实施例的图数据处理方法的流程图。
如图2所示,该方法200可以包括操作S210至操作S220。
在本公开实施例中,图数据包括多个结点和结点之间的关系信息。
例如,图数据可以与一个知识图谱对应。
在操作S210,针对多个结点中的每个结点,删除与每个结点相关的K个关系信息中的类型子信息,得到K个压缩关系信息。
在本公开实施例中,每个关系信息将多个结点中作为源结点的结点与作为目标结点的结点相连。
例如,K为大于或等于1的整数。
例如,一个关系信息R1对应的目标结点为结点“汽车A”。该关系信息对应的源结点为结点“甲某”。结点“甲某”与一个驾驶员对应,结点“汽车A”与一个汽车对应。该关系信息R_1的类型子信息Lable_1可以为“驾驶”。
关系信息R_1包括原类型字段F_Lori_1和结点字段F_N_1,原类型字段F_Lori_1的值是根据类型子信息Lable_1确定的。结点字段F_N_1包括源结点子字段F_Ns_1和目标结点子字段F_Nt_1。关系信息R_1的源结点子字段F_Ns_1的值是根据结点“甲某”的标识信息确定的,关系信息R_1的目标结点子字段F_Nt_1的值是根据结点“汽车A”的标识信息确定的。
在一个示例中,原类型字段F_Lori_1的值可以占用2个字节(Byte)的存储空间,源结点子字段F_Ns_1的值或目标结点子字段F_Nt_1的值可以占用6个字节的存储空间。
例如,一个关系信息R_2对应的目标结点为结点“汽车B”。该关系信息对应的源结点为结点“甲某”。结点“汽车B”与一个汽车对应。该关系信息R_2的类型子信息也可以是上文所述的类型子信息Lable_1。
关系信息R_2包括原类型字段F_Lori_2和结点字段F_N_2,原类型字段F_Lori_2的值是根据类型子信息Lable_1确定的。结点字段F_N_2包括源结点子字段F_Ns_2和目标结点子字段F_Nt_2。关系信息R_2的源结点子字段F_Ns_2的值是根据结点“甲某”的标识信息确定的,关系信息R_2的目标结点子字段F_Nt_2的值是根据结点“汽车B”确定的。
在一个示例中,原类型字段F_Lori_2的值可以占用2个字节(Byte)的空间,源结点子字段F_Ns_2的值或目标结点子字段F_Nt_2的值可以占用6个字节的空间。
又例如,针对结点“甲某”,可以删除与结点“甲某”相关的关系信息R1和关系信息R_2中的类型子信息Lable_1,得到压缩关系信息Rc_1和压缩关系信息Rc_2。即本实施例中,与结点“甲某”相关的关系信息为2个,即K=2。
压缩关系信息Rc_1可以包括源结点子字段F_Ns_1和目标结点子字段F_Nt_1。而压缩关系信息Rc_2可以包括源结点子字段F_Ns_2和目标结点子字段F_Nt_2。
在操作S220,根据K个压缩关系信息和类型子信息,生成每个结点的编码信息。
例如,结点“甲某”的编码信息包括类型字段F_L_1和缓存字段F_Buf_1。
类型字段F_L_1的值是根据类型子信息Lable_1确定的。
缓存字段F_Buf_1的值是根据上文所述的2个压缩关系信息确定的。在一个示例中,缓存字段F_Buf_1包括:上文所述的源结点子字段F_Ns_1和目标结点子字段F_Nt_1,以及源结点子字段F_Ns_2和目标结点子字段F_Nt_2。
通过本公开实施例,可以对关系信息进行压缩,使得多个结点的缓存信息可以全部加载到内存中,以提高查询效率。
在一些实施例中,每个结点的编码信息包括有效字段、类型字段和缓存字段。例如,有效字段的值是根据K个压缩关系信息中的有效子信息的长度值确定的,类型字段的值是根据类型子信息确定的,缓存字段的值是根据K个压缩关系信息确定的。下面将结合图3A至图3B进行详细说明。
图3A是根据本公开的一个实施例的图数据的示意图。
如图3A所示,本实施例中,结点“甲某”N301与结点“汽车A”N302通过边E312连接,结点“甲某”N301与结点“汽车B”N303通过边E313连接。
如图3A所示,针对结点“甲某”N301,边E312可以表征上文所述的关系信息R1,边E312可以表征上文所述的关系信息R_2。在一个示例中,关系信息R_1和关系信息R_2可以为输出关系信息。
图3B是根据本公开的一个实施例的编码信息的示意图。
如图3B所示,结点“甲某”N301的编码信息包括有效字段310、类型字段320和缓存字段。
例如,类型字段320的值可以是根据上文所述的类型子信息Lable_1确定。类型字段320的值可以表征与结点“甲某”N301相关的关系的类型为“驾驶”。
例如,缓存字段包括源结点子字段331、目标结点子字段332、源结点子字段333和目标结点子字段334。源结点子字段331例如可以是上文所述的源结点子字段F_Ns_1,目标结点子字段332例如可以是上文所述的目标结点子字段F_Nt_1,源结点子字段333例如可以是上文所述的源结点子字段F_Ns_2,目标结点子字段334例如可以是目标结点子字段F_Nt_2。
又例如,源结点子字段331的值例如可以是结点“甲某”N301的标识信息。该标识信息可以是一个字符串。该字符串的最后8位数据为非0数据,其他数据为0。将标识信息中非零数据作为有效子信息。在一个示例中,可以根据结点“甲某”N301的标识信息中有效子信息的长度值确定有效字段310的值。在查询时,基于有效字段的值,可以直接定位到有效子信息,提高查询效率。
又例如,结点“甲某”N301的编码信息还包括编码字段340。编码字段340的值可以表征相关的编码方式。
在一些实施例中,K个压缩关系信息包括至少一个输入压缩关系信息和至少一个输出压缩关系信息;根据K个压缩关系信息和类型子信息,生成每个结点的编码信息包括:根据至少一个输入压缩关系信息,得到输入缓存信息;根据至少一个输出压缩关系信息,得到输出缓存信息;以及根据输入缓存信息、输出缓存信息和类型子信息,生成每个结点的编码信息。
在一些实施例中,每个结点的编码信息包括有效字段、类型字段、偏移字段、输入缓存字段和输出缓存字段,其中,有效字段的值是根据K个压缩关系信息中的有效子信息的长度值确定的,类型字段的值是根据类型子信息确定的,偏移字段的值是根据输入缓存信息或输出缓存信息的长度值确定的,输入缓存字段的值是根据输入缓存信息确定的,输出缓存字段的值是根据输出缓存信息确定的。下面将结合图4A和图4B进行详细说明。
图4A是根据本公开的一个实施例的图数据的示意图。
如图4A所示,本实施例中,结点“甲某”N401与结点“乙某”N402通过边E421连接,结点“甲某”N401与结点“丙某”N403通过边E413连接。在一个示例中,结点“甲某”N401与驾驶员“甲某”对应,结点“乙某”N402与驾驶员“乙某”对应,结点“丙某”N403与驾驶员“丙某”对应。
如图4A所示,针对结点“甲某”N401,边E421可以表征关系信息R_3,边E413可以表征关系信息R_4。关系信息R_3和关系信息R_4的类型子信息Lable_2可以为“朋友”。在一个示例中,关系信息R_3可以表征“乙某”将“甲某”作为朋友。关系信息R_3可以为输入关系信息。关系信息R_4可以表征“甲某”将“丙某”作为朋友。关系信息R_4可以为输出关系信息。
删除关系信息R_3和关系信息R_4中的类型子信息后,可以分别得到压缩关系信息Rc_3和压缩关系信息Rc_4。在一个示例中,相应的,压缩关系信息Rc_3可以为输入压缩关系信息。压缩关系信息Rc_4可以为输出压缩关系信息。
可以将压缩关系信息Rc_3作为输入缓存信息,将压缩关系信息Rc_4作为输出缓存信息。
图4B是根据本公开的另一个实施例的编码信息的示意图。
如图4B所示,结点“甲某”N401的编码信息包括有效字段410、类型字段420、偏移字段450、输出缓存字段430和输入缓存字段460。
例如,类型字段420的值可以是根据上文所述的类型子信息Lable_2确定。类型字段420的值可以表征与结点“甲某”N401相关的关系的类型为“朋友”。
例如,输出缓存字段430包括输出源结点子字段和输出目标结点子字段。输出源结点子字段的值例如可以是结点“甲某”N401的标识信息。输出目标结点子字段的值例如可以是结点“丙某”N403的标识信息。
例如,输入缓存字段460包括输入源结点子字段和输入目标结点子字段。输入源结点子字段值例如可以是结点“乙某”N302的标识信息。输入目标结点子字段的值例如可以是结点“甲某”N401的标识信息。
又例如,结点“甲某”N401的标识信息可以是一个字符串。该字符串的最后8位数据为非0数据,其他数据为0。将标识信息中非零数据作为有效子信息。本实施例中,结点“甲某”N401、结点“乙某”N402和结点“丙某”N403的标识信息的有效子信息的长度值相同。在一个示例中,可以根据结点“甲某”N401的标识信息中有效子信息的长度值确定有效字段410的值。
在一个示例中,结点“甲某”N401的标识信息可以占用6个字节的空间。结点“乙某”N402的标识信息可以占用6个字节的空间。输入缓存字段460的值包括输入源结点子字段的值和输入目标结点子字段的值。输入缓存字段460的值可以占用12个字节的空间。
又例如,偏移字段450的值是根据输入缓存字段460的值确定的。对偏移字段450的值进行解析之后,可以直接查询到输出缓存信息,减少查询输出缓存信息所需的时间。
又例如,结点“甲某”N401的编码信息还包括编码字段440。编码字段440的值可以表征相关的编码方式。
在一些实施例中,类型子信息为多个,每个类型子信息与至少一个压缩关系信息对应,根据K个压缩关系信息和类型子信息,生成每个结点的编码信息包括:针对多个类型子信息,将与每个类型子信息对应的至少一个压缩关系信息拼接为子缓存信息,得到多个子缓存信息;根据多个子缓存信息,得到缓存信息;以及根据多个类型子信息、缓存信息中每个子缓存信息的位置和缓存信息,生成每个结点的编码信息。
在一些实施例中,每个结点的编码信息包括有效字段、类型数量字段、类型字段、位置字段、偏移字段和缓存字段,其中,有效字段的值是根据预设值和K个压缩关系信息中的有效子信息的长度值确定的,类型数量字段的值是根据预设值确定的,类型字段的值是根据多个类型子信息确定的,位置字段的值是根据缓存信息中每个子缓存信息的位置确定的,偏移字段的值是根据有效字段的值、类型数量字段的值、类型字段的值和位置字段的值确定的,缓存字段的值是根据K个压缩关系信息确定的。下面将结合图5A和图5B进行详细说明。
图5A是根据本公开的一个实施例的图数据的示意图。
如图5A所示,本实施例中,结点“甲某”N501与结点“汽车A”N502通过边E512连接,结点“甲某”N501与结点“食物”N503通过边E513连接。在一个示例中,结点“甲某”N501与驾驶员“甲某”对应,结点“汽车A”N502与一个汽车对应,结点“食物”N503与一个食物(例如面包)对应。
如图5A所示,针对结点“甲某”N501,边E512可以表征上文所述的关系信息R_1,边E513可以表征关系信息R_5。关系信息R1的类型子信息Lable_1可以为“驾驶”。关系信息R_5的类型子信息Lable_3可以为“食用”。在一个示例中,关系信息R_1可以表征“甲某”可以驾驶“汽车A”。关系信息R_1可以为输出关系信息。关系信息R_5可以表征“甲某”可以食用“食物”。关系信息R_5可以为输出关系信息。
删除关系信息R_1和关系信息R_5中的类型子信息后,可以分别得到压缩关系信息Rc_1和压缩关系信息Rc_5。可以将压缩关系信息Rc_1作为第一子缓存信息。将压缩关系信息Rc_5作为第二子缓存信息。根据这两个子缓存信息,可以得到缓存信息。例如,可以将两个子缓存信息拼接,使得第一缓存子信息位于第二缓存子信息之前,以得到缓存信息。
图5B是根据本公开的另一个实施例的编码信息的示意图。
如图5B所示,结点“甲某”N501的编码信息包括有效字段510、类型字段520、偏移字段550、缓存字段530、类型数量字段560和位置字段570。
例如,类型字段520的值可以是根据上文所述的类型子信息Lable_1和类型子信息Lable_3确定。类型字段520的值可以为2个,其中一个值可以表征与结点“甲某”N501相关的关系的一个类型为“驾驶”,另一个值可以表征与结点“甲某”N501相关的关系的一个类型为“食用”。
例如,缓存字段530包括第一类输出源结点子字段和第一类输出目标结点子字段。第一类输出源结点子字段的值例如可以是结点“甲某”N501的标识信息。第一类输出目标结点子字段的值例如可以是结点“汽车A”N502的标识信息。第一类输出源结点子字段和第一类输出目标结点子字段可以与上文所述的第一子缓存信息对应。
缓存字段530还包括第二类输出源结点子字段和第二类输出目标结点子字段。第二类输出源结点子字段的值例如可以是结点“甲某”N501的标识信息。第二类输出目标结点子字段的值例如可以是结点“食物”N503的标识信息。第二类输出源结点子字段和第二类输出目标结点可以与上文所述的第二子缓存信息对应。
又例如,结点“甲某”N501的标识信息可以是一个字符串。该字符串的最后8位数据为非0数据,其他数据为0。将标识信息中非零数据作为有效子信息。本实施例中,结点“甲某”N501、结点“汽车A”N502和结点“食物”N503的标识信息的有效子信息的长度值相同。
又例如,本实施例中,可以根据预设值和结点“甲某”N501标识信息的有效子信息的长度值,确定有效字段510的值。预设值可以表征位置字段的值占用的存储空间,在一个示例中,预设值可以为4。
又例如,类型数量字段560的值可以表征与结点“甲某”N501相关的关系的类型数量。本实施例中,类型数量字段的值为2。
又例如,位置字段570的值可以表征缓存信息中每个子缓存信息的位置。如上文所述,本实施例中,共有两个子缓存信息。相应地,位置字段570中存在两个值,分别表征两个子缓存信息的位置。根据位置字段中的值,可以快速确定两个子缓存信息的位置,提高查询效率。例如,可以根据第一子缓存信息的位置确定查询的起始位置,根据第二子缓存信息的位置确定查询的终止位置。
又例如,偏移字段550的值是根据有效字段510的值、类型数量字段560的值、类型字段520的值和位置字段570的值确定的。在一个示例中,类型数量字段的值较小,可以为类型数量字段分配1个字节的存储空间。类型字段的值为2个,可以为其分配2*2个字节的存储空间。位置字段570的存储空间可以根据上文的预设值(例如为4)和类型子信息的数量确定,例如为2*4个字节。结点“甲某”N501的编码信息还可以包括一个编码字段540,可以为编码字段540分配1个字节的存储空间。以及,可以为有效字段分配1个字节的存储空间。因此,除了缓存字段之外,其他字段占用的存储空间共可以为14个字节。
对偏移字段550的值进行解析之后,可以直接查询到缓存信息,减少查询缓存信息所需的时间。
在一个示例中,结点“甲某”N501的标识信息可以占用6个字节的空间。结点“汽车A”N502的标识信息可以占用6个字节的空间。结点“食物”N503的标识信息占用6个字节的空间。
又例如,结点“甲某”N501的编码信息还包括编码字段550。编码字段550的值可以表征相关的编码方式。
在另一些实施例中,类型子信息的数量更多时,例如大于255个,可以为类型数量字段分配更多的存储空间,例如2个字节。此时,偏移字段550的值也会发生变化。
在一些实施例中,压缩关系信息包括输入压缩关系信息和输出压缩关系信息,类型子信息为多个,每个类型子信息与至少一个输入压缩关系信息和/或至少一个输出压缩关系对应,根据K个压缩关系信息和类型子信息,生成每个结点的编码信息包括:针对多个类型子信息,将与每个类型子信息对应的至少一个输入压缩关系信息拼接为子输入缓存信息,得到多个子输入缓存信息;针对多个类型子信息,将与每个类型子信息对应的至少一个输出压缩关系信息拼接为子输出缓存信息,得到多个子输出缓存信息;根据多个子输入缓存信息,得到输入缓存信息;根据多个子输出缓存信息,得到输出缓存信息;以及根据多个类型子信息、输入缓存信息中和输出缓存信息,生成每个结点的编码信息。
在一些实施例中,每个结点的编码信息包括偏移字段、输入缓存字段和输出缓存字段,其中,偏移字段的值是根据输入缓存信息或输出缓存信息的长度值确定的,输入缓存字段的值时根据输入缓存信息确定的,输出缓存字段的值是根据输出缓存信息确定的。下面将结合图6A和图6B进行详细说明。
图6A是根据本公开的一个实施例的图数据的示意图。
如图6A所示,本实施例中,结点“甲某”N601与结点“乙某”N602通过边E621连接,结点“甲某”N601与结点“丙某”N603通过边E613连接。在一个示例中,结点“甲某”N601与驾驶员“甲某”对应,结点“乙某”N602与驾驶员“乙某”对应,结点“丙某”N603与驾驶员“丙某”对应。
如图6A所示,针对结点“甲某”N601,边E621可以表征上文所述的关系信息R_3,边E613可以表征关系信息R_4。关系信息R_3和关系信息R_4的类型子信息Lable_2可以为“朋友”。在一个示例中,关系信息R_3可以表征“乙某”将“甲某”作为朋友。关系信息R_3可以为输入关系信息。关系信息R_6可以表征“甲某”将“乙某”作为朋友。关系信息R_4可以为输出关系信息。
如图6A所示,结点“甲某”N601与结点“汽车C”N604通过边E614连接,边E614可以表征关系信息R_6。关系信息R_6可以表征“甲某”可以驾驶“汽车C”。关系信息R_6可以为输出关系信息。
删除关系信息R_3、关系信息R_4和关系信息R_6中的类型子信息后,可以分别得到压缩关系信息Rc_3、压缩关系信息Rc_4和压缩关系信息Rc_6。在一个示例中,相应的,压缩关系信息Rc_3可以为输入压缩关系信息。压缩关系信息Rc_4可以为输出压缩关系信息。压缩关系信息Rc_6可以为输出压缩关系信息。
可以将压缩关系信息Rc_3作为一个子输入缓存信息。根据该子输入缓存信息,可以得到输入缓存信息。
可以将压缩关系信息Rc_4作为第一子输出缓存信息。可以将压缩关系信息Rc_6作为第二子输出缓存信息。根据两个子输出缓存信息,可以得到输出缓存信息。
图6B是根据本公开的另一个实施例的编码信息的示意图。
如图6B所示,结点“甲某”N601的编码信息包括偏移字段610、输出缓存字段620和输入缓存字段630。
偏移字段610的值是根据输入缓存信息的长度值确定的,输入缓存字段620的值时根据输入缓存信息确定的,输出缓存字段630的值是根据输出缓存信息确定的。
又例如,结点“甲某”N601的编码信息还可以包括编码字段640。
又例如,输出缓存字段630包括第一有效子字段、第一类型子字段、第一偏移子字段、缓存子字段、类型数量子字段和位置子字段。在一个示例中,第一有效子字段的值是根据预设值和K个压缩关系信息中的有效子信息的长度值确定的,类型数量子字段的值是根据预设值确定的,第一类型子字段的值是根据多个类型子信息(本实施例中的类型子信息Lable_1和类型子信息Lable_2)确定的,第一位置子字段的值是根据输出缓存信息中每个子输出缓存信息的位置确定的,第一偏移子字段的值是根据第一有效子字段的值、类型数量子字段的值、第一类型子字段的值和位置子字段的值确定的,缓存子字段的值是根据第一子输出缓存信息和第二子输出缓存信息确定的。可以理解,输出缓存字段630,与例如图5B所示的编码信息类似,本公开在此不再赘述。
又例如,输入缓存字段640包括第二有效子字段、第二类型子字段、输入缓存子字段。在一个示例中,第二有效子字段的值是根据K个压缩关系信息中的有效子信息的长度值确定的,第二类型子字段的值是根据类型子信息(本实施例中的类型子信息Lable_2)确定的,输入缓存子字段的值是根据子输入缓存信息确定的。可以理解,输入缓存字段640,与例如图3B所示的编码信息类似,本公开在此不再赘述。
在一些实施例中,每个结点包括标识信息,标识信息包括第一标识子信息、第二标识子信息和第三标识子信息,方法还包括:根据第一标识子信息,确定第二标识子信息的存储信息;根据第二标识子信息的存储信息和第二标识子信息,确定第三标识子信息的存储信息;以及根据第三标识子信息的存储信息和第三标识子信息,确定每个结点的编码信息的存储信息。
例如,第一标识子信息可以与标识信息的前两个字节对应、第二标识子信息可以与标识信息的中间两个字节对应,第三标识子信息可以与标识信息的最后两个字节对应。
图7是根据本公开的一个实施例的图数据处理装置的框图。
如图7所示,该装置700可以包括删除模块710和生成模块720。
所述图数据包括多个结点和结点之间的关系信息,所述装置包括:
删除模块710,用于针对所述多个结点中的每个结点,删除与所述每个结点相关的K个关系信息中的类型子信息,得到K个压缩关系信息,其中,每个关系信息将所述多个结点中作为源结点的结点与作为目标结点的结点相连,K为大于或等于1的整数。
生成模块720,用于根据所述K个压缩关系信息和所述类型子信息,生成所述每个结点的编码信息。
在一些实施例中,所述每个结点的编码信息包括有效字段、类型字段和缓存字段,其中,所述有效字段的值是根据所述K个压缩关系信息中的有效子信息的长度值确定的,所述类型字段的值是根据所述类型子信息确定的,所述缓存字段的值是根据所述K个压缩关系信息确定的。
在一些实施例中,所述K个压缩关系信息包括至少一个输入压缩关系信息和至少一个输出压缩关系信息;所述生成模块包括:第一获得子模块,用于根据所述至少一个输入压缩关系信息,得到输入缓存信息;第二获得子模块,用于根据所述至少一个输出压缩关系信息,得到输出缓存信息;以及第一生成子模块,用于根据所述输入缓存信息、所述输出缓存信息和所述类型子信息,生成所述每个结点的编码信息。
在一些实施例中,所述每个结点的编码信息包括有效字段、类型字段、偏移字段、输入缓存字段和输出缓存字段,其中,所述有效字段的值是根据所述K个压缩关系信息中的有效子信息的长度值确定的,所述类型字段的值是根据所述类型子信息确定的,所述偏移字段的值是根据所述输入缓存信息或所述输出缓存信息的长度值确定的,所述输入缓存字段的值是根据所述输入缓存信息确定的,所述输出缓存字段的值是根据所述输出缓存信息确定的。
在一些实施例中,所述类型子信息为多个,每个类型子信息与至少一个压缩关系信息对应,所述生成模块包括:第三获得子模块,用于针对所述多个类型子信息,将与每个类型子信息对应的至少一个压缩关系信息拼接为子缓存信息,得到多个子缓存信息;第四获得子模块,用于根据所述多个子缓存信息,得到缓存信息;以及第二生成子模块,用于根据所述多个类型子信息、所述缓存信息中每个子缓存信息的位置和所述缓存信息,生成所述每个结点的编码信息。
在一些实施例中,所述每个结点的编码信息包括有效字段、类型数量字段、类型字段、位置字段、偏移字段和缓存字段,其中,所述有效字段的值是根据预设值和所述K个压缩关系信息中的有效子信息的长度值确定的,所述类型数量字段的值是根据所述预设值确定的,所述类型字段的值是根据所述多个类型子信息确定的,所述位置字段的值是根据所述缓存信息中每个子缓存信息的位置确定的,所述偏移字段的值是根据所述有效字段的值、所述类型数量字段的值、所述类型字段的值和所述位置字段的值确定的,所述缓存字段的值是根据所述K个压缩关系信息确定的。
在一些实施例中,所述压缩关系信息包括输入压缩关系信息和输出压缩关系信息,所述类型子信息为多个,每个类型子信息与至少一个输入压缩关系信息或至少一个输出压缩关系对应,所述生成模块包括:第五获得子模块,用于针对所述多个类型子信息,将与每个类型子信息对应的至少一个输入压缩关系信息拼接为子输入缓存信息,得到多个子输入缓存信息;第六获得子模块,用于针对所述多个类型子信息,将与每个类型子信息对应的至少一个输出压缩关系信息拼接为子输出缓存信息,得到多个子输出缓存信息;第七获得子模块,用于根据所述多个子输入缓存信息,得到输入缓存信息;第八获得子模块,用于根据所述多个子输出缓存信息,得到输出缓存信息;以及第三生成子模块,用于根据所述多个类型子信息、所述输入缓存信息中和所述输出缓存信息,生成所述每个结点的编码信息。
在一些实施例中,所述每个结点的编码信息包括偏移字段、输入缓存字段和输出缓存字段,其中,所述偏移字段的值是根据所述输入缓存信息或所述输出缓存信息的长度值确定的,所述输入缓存字段的值时根据所述输入缓存信息确定的,所述输出缓存字段的值是根据所述输出缓存信息确定的。
在一些实施例中,所述每个结点包括标识信息,所述标识信息包括第一标识子信息、第二标识子信息和第三标识子信息,所述装置还包括:第一确定模块,用于根据所述第一标识子信息,确定所述第二标识子信息的存储信息;第二确定模块,用于根据所述第二标识子信息的存储信息和所述第二标识子信息,确定所述第三标识子信息的存储信息;以及第三确定模块,用于根据所述第三标识子信息的存储信息和所述第三标识子信息,确定所述每个结点的编码信息的存储信息。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如图数据处理方法。例如,在一些实施例中,图数据处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时,可以执行上文描述的图数据处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图数据处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (21)
1.一种图数据处理方法,所述图数据包括多个结点和结点之间的关系信息,所述方法包括:
针对所述多个结点中的每个结点,删除与所述每个结点相关的K个关系信息中的类型子信息,得到K个压缩关系信息,其中,每个关系信息将所述多个结点中作为源结点的结点与作为目标结点的结点相连,K为大于或等于1的整数;以及
根据所述K个压缩关系信息和所述类型子信息,生成所述每个结点的编码信息。
2.根据权利要求1所述的方法,其中,所述每个结点的编码信息包括有效字段、类型字段和缓存字段,
其中,所述有效字段的值是根据所述K个压缩关系信息中的有效子信息的长度值确定的,所述类型字段的值是根据所述类型子信息确定的,所述缓存字段的值是根据所述K个压缩关系信息确定的。
3.根据权利要求1所述的方法,其中,所述K个压缩关系信息包括至少一个输入压缩关系信息和至少一个输出压缩关系信息;
所述根据所述K个压缩关系信息和所述类型子信息,生成所述每个结点的编码信息包括:
根据所述至少一个输入压缩关系信息,得到输入缓存信息;
根据所述至少一个输出压缩关系信息,得到输出缓存信息;以及
根据所述输入缓存信息、所述输出缓存信息和所述类型子信息,生成所述每个结点的编码信息。
4.根据权利要求3所述的方法,其中,所述每个结点的编码信息包括有效字段、类型字段、偏移字段、输入缓存字段和输出缓存字段,
其中,所述有效字段的值是根据所述K个压缩关系信息中的有效子信息的长度值确定的,所述类型字段的值是根据所述类型子信息确定的,所述偏移字段的值是根据所述输入缓存信息或所述输出缓存信息的长度值确定的,所述输入缓存字段的值是根据所述输入缓存信息确定的,所述输出缓存字段的值是根据所述输出缓存信息确定的。
5.根据权利要求1所述的方法,其中,所述类型子信息为多个,每个类型子信息与至少一个压缩关系信息对应,
所述根据所述K个压缩关系信息和所述类型子信息,生成所述每个结点的编码信息包括:
针对所述多个类型子信息,将与每个类型子信息对应的至少一个压缩关系信息拼接为子缓存信息,得到多个子缓存信息;
根据所述多个子缓存信息,得到缓存信息;以及
根据所述多个类型子信息、所述缓存信息中每个子缓存信息的位置和所述缓存信息,生成所述每个结点的编码信息。
6.根据权利要求5所述的方法,其中,所述每个结点的编码信息包括有效字段、类型数量字段、类型字段、位置字段、偏移字段和缓存字段,
其中,所述有效字段的值是根据预设值和所述K个压缩关系信息中的有效子信息的长度值确定的,所述类型数量字段的值是根据所述预设值确定的,所述类型字段的值是根据所述多个类型子信息确定的,所述位置字段的值是根据所述缓存信息中每个子缓存信息的位置确定的,所述偏移字段的值是根据所述有效字段的值、所述类型数量字段的值、所述类型字段的值和所述位置字段的值确定的,所述缓存字段的值是根据所述K个压缩关系信息确定的。
7.根据权利要求1所述的方法,其中,所述压缩关系信息包括输入压缩关系信息和输出压缩关系信息,所述类型子信息为多个,每个类型子信息与至少一个输入压缩关系信息或至少一个输出压缩关系对应,
所述根据所述K个压缩关系信息和所述类型子信息,生成所述每个结点的编码信息包括:
针对所述多个类型子信息,将与每个类型子信息对应的至少一个输入压缩关系信息拼接为子输入缓存信息,得到多个子输入缓存信息;
针对所述多个类型子信息,将与每个类型子信息对应的至少一个输出压缩关系信息拼接为子输出缓存信息,得到多个子输出缓存信息;
根据所述多个子输入缓存信息,得到输入缓存信息;
根据所述多个子输出缓存信息,得到输出缓存信息;以及
根据所述多个类型子信息、所述输入缓存信息中和所述输出缓存信息,生成所述每个结点的编码信息。
8.根据权利要求7所述的方法,其中,所述每个结点的编码信息包括偏移字段、输入缓存字段和输出缓存字段,
其中,所述偏移字段的值是根据所述输入缓存信息或所述输出缓存信息的长度值确定的,所述输入缓存字段的值时根据所述输入缓存信息确定的,所述输出缓存字段的值是根据所述输出缓存信息确定的。
9.根据权利要求1至8任一项所述的方法,其中,所述每个结点包括标识信息,所述标识信息包括第一标识子信息、第二标识子信息和第三标识子信息,
所述方法还包括:
根据所述第一标识子信息,确定所述第二标识子信息的存储信息;
根据所述第二标识子信息的存储信息和所述第二标识子信息,确定所述第三标识子信息的存储信息;以及
根据所述第三标识子信息的存储信息和所述第三标识子信息,确定所述每个结点的编码信息的存储信息。
10.一种图数据处理装置,所述图数据包括多个结点和结点之间的关系信息,所述装置包括:
删除模块,用于针对所述多个结点中的每个结点,删除与所述每个结点相关的K个关系信息中的类型子信息,得到K个压缩关系信息,其中,每个关系信息将所述多个结点中作为源结点的结点与作为目标结点的结点相连,K为大于或等于1的整数;以及
生成模块,用于根据所述K个压缩关系信息和所述类型子信息,生成所述每个结点的编码信息。
11.根据权利要求10所述的装置,其中,所述每个结点的编码信息包括有效字段、类型字段和缓存字段,
其中,所述有效字段的值是根据所述K个压缩关系信息中的有效子信息的长度值确定的,所述类型字段的值是根据所述类型子信息确定的,所述缓存字段的值是根据所述K个压缩关系信息确定的。
12.根据权利要求10所述的装置,其中,所述K个压缩关系信息包括至少一个输入压缩关系信息和至少一个输出压缩关系信息;
所述生成模块包括:
第一获得子模块,用于根据所述至少一个输入压缩关系信息,得到输入缓存信息;
第二获得子模块,用于根据所述至少一个输出压缩关系信息,得到输出缓存信息;以及
第一生成子模块,用于根据所述输入缓存信息、所述输出缓存信息和所述类型子信息,生成所述每个结点的编码信息。
13.根据权利要求12所述的装置,其中,所述每个结点的编码信息包括有效字段、类型字段、偏移字段、输入缓存字段和输出缓存字段,
其中,所述有效字段的值是根据所述K个压缩关系信息中的有效子信息的长度值确定的,所述类型字段的值是根据所述类型子信息确定的,所述偏移字段的值是根据所述输入缓存信息或所述输出缓存信息的长度值确定的,所述输入缓存字段的值是根据所述输入缓存信息确定的,所述输出缓存字段的值是根据所述输出缓存信息确定的。
14.根据权利要求10所述的装置,其中,所述类型子信息为多个,每个类型子信息与至少一个压缩关系信息对应,
所述生成模块包括:
第三获得子模块,用于针对所述多个类型子信息,将与每个类型子信息对应的至少一个压缩关系信息拼接为子缓存信息,得到多个子缓存信息;
第四获得子模块,用于根据所述多个子缓存信息,得到缓存信息;以及
第二生成子模块,用于根据所述多个类型子信息、所述缓存信息中每个子缓存信息的位置和所述缓存信息,生成所述每个结点的编码信息。
15.根据权利要求14所述的装置,其中,所述每个结点的编码信息包括有效字段、类型数量字段、类型字段、位置字段、偏移字段和缓存字段,
其中,所述有效字段的值是根据预设值和所述K个压缩关系信息中的有效子信息的长度值确定的,所述类型数量字段的值是根据所述预设值确定的,所述类型字段的值是根据所述多个类型子信息确定的,所述位置字段的值是根据所述缓存信息中每个子缓存信息的位置确定的,所述偏移字段的值是根据所述有效字段的值、所述类型数量字段的值、所述类型字段的值和所述位置字段的值确定的,所述缓存字段的值是根据所述K个压缩关系信息确定的。
16.根据权利要求10所述的装置,其中,所述压缩关系信息包括输入压缩关系信息和输出压缩关系信息,所述类型子信息为多个,每个类型子信息与至少一个输入压缩关系信息或至少一个输出压缩关系对应,
所述生成模块包括:
第五获得子模块,用于针对所述多个类型子信息,将与每个类型子信息对应的至少一个输入压缩关系信息拼接为子输入缓存信息,得到多个子输入缓存信息;
第六获得子模块,用于针对所述多个类型子信息,将与每个类型子信息对应的至少一个输出压缩关系信息拼接为子输出缓存信息,得到多个子输出缓存信息;
第七获得子模块,用于根据所述多个子输入缓存信息,得到输入缓存信息;
第八获得子模块,用于根据所述多个子输出缓存信息,得到输出缓存信息;以及
第三生成子模块,用于根据所述多个类型子信息、所述输入缓存信息中和所述输出缓存信息,生成所述每个结点的编码信息。
17.根据权利要求16所述的装置,其中,所述每个结点的编码信息包括偏移字段、输入缓存字段和输出缓存字段,
其中,所述偏移字段的值是根据所述输入缓存信息或所述输出缓存信息的长度值确定的,所述输入缓存字段的值时根据所述输入缓存信息确定的,所述输出缓存字段的值是根据所述输出缓存信息确定的。
18.根据权利要求10至17任一项所述的装置,其中,所述每个结点包括标识信息,所述标识信息包括第一标识子信息、第二标识子信息和第三标识子信息,
所述装置还包括:
第一确定模块,用于根据所述第一标识子信息,确定所述第二标识子信息的存储信息;
第二确定模块,用于根据所述第二标识子信息的存储信息和所述第二标识子信息,确定所述第三标识子信息的存储信息;以及
第三确定模块,用于根据所述第三标识子信息的存储信息和所述第三标识子信息,确定所述每个结点的编码信息的存储信息。
19.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至9中任一项所述的方法。
20.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1至9中任一项所述的方法。
21.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1至9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210184254.8A CN114528444B (zh) | 2022-02-25 | 2022-02-25 | 图数据处理方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210184254.8A CN114528444B (zh) | 2022-02-25 | 2022-02-25 | 图数据处理方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114528444A true CN114528444A (zh) | 2022-05-24 |
CN114528444B CN114528444B (zh) | 2023-02-03 |
Family
ID=81625408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210184254.8A Active CN114528444B (zh) | 2022-02-25 | 2022-02-25 | 图数据处理方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114528444B (zh) |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070208693A1 (en) * | 2006-03-03 | 2007-09-06 | Walter Chang | System and method of efficiently representing and searching directed acyclic graph structures in databases |
CN101196933A (zh) * | 2008-01-09 | 2008-06-11 | 王珊 | 利用连接表压缩数据图的方法和设备 |
CN103379136A (zh) * | 2012-04-17 | 2013-10-30 | 中国移动通信集团公司 | 一种日志采集数据压缩方法、解压缩方法及装置 |
CN103605706A (zh) * | 2013-11-11 | 2014-02-26 | 华中师范大学 | 一种基于知识地图的资源检索方法 |
US20140324882A1 (en) * | 2013-04-30 | 2014-10-30 | Tummarello GIOVANNI | Method and system for navigating complex data sets |
CN104484478A (zh) * | 2014-12-31 | 2015-04-01 | 中国农业银行股份有限公司 | 一种关联聚类数据瘦身方法及系统 |
CN105302915A (zh) * | 2015-12-23 | 2016-02-03 | 西安美林数据技术股份有限公司 | 基于内存计算的高性能数据处理系统 |
CN105389336A (zh) * | 2015-05-07 | 2016-03-09 | 数灵科技有限公司 | 大量数据关系的表示 |
CN106294739A (zh) * | 2016-08-10 | 2017-01-04 | 桂林电子科技大学 | 一种基于k2树和多值决策图的大规模图数据处理方法 |
CN110389953A (zh) * | 2019-05-24 | 2019-10-29 | 中国科学院计算技术研究所 | 基于压缩图的数据存储方法、存储介质、存储装置和服务器 |
CN111611449A (zh) * | 2020-05-08 | 2020-09-01 | 百度在线网络技术(北京)有限公司 | 信息编码方法、装置、电子设备及计算机可读存储介质 |
CN111737404A (zh) * | 2020-06-26 | 2020-10-02 | 豆盟(北京)科技股份有限公司 | 数据处理方法、装置、设备和计算机存储介质 |
CN111813926A (zh) * | 2019-11-13 | 2020-10-23 | 中国传媒大学 | 一种图数据库Neo4J交互可视化的操作方法与系统 |
CN111966870A (zh) * | 2020-08-14 | 2020-11-20 | 深圳市万物云科技有限公司 | 一种基于图数据库的社区关系实时构建方法及其相关组件 |
CN113220820A (zh) * | 2020-12-15 | 2021-08-06 | 中国人民解放军国防科技大学 | 基于图的高效sparql查询应答方法、装置和设备 |
CN113761122A (zh) * | 2021-05-19 | 2021-12-07 | 清华大学 | 一种事件抽取方法、相关装置、设备及存储介质 |
CN113961672A (zh) * | 2021-11-01 | 2022-01-21 | 北京百度网讯科技有限公司 | 信息标注方法、装置、电子设备和存储介质 |
CN114064925A (zh) * | 2021-11-23 | 2022-02-18 | 北京百度网讯科技有限公司 | 知识图谱的构建方法、数据查询方法、装置、设备和介质 |
-
2022
- 2022-02-25 CN CN202210184254.8A patent/CN114528444B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070208693A1 (en) * | 2006-03-03 | 2007-09-06 | Walter Chang | System and method of efficiently representing and searching directed acyclic graph structures in databases |
CN101196933A (zh) * | 2008-01-09 | 2008-06-11 | 王珊 | 利用连接表压缩数据图的方法和设备 |
CN103379136A (zh) * | 2012-04-17 | 2013-10-30 | 中国移动通信集团公司 | 一种日志采集数据压缩方法、解压缩方法及装置 |
US20140324882A1 (en) * | 2013-04-30 | 2014-10-30 | Tummarello GIOVANNI | Method and system for navigating complex data sets |
CN103605706A (zh) * | 2013-11-11 | 2014-02-26 | 华中师范大学 | 一种基于知识地图的资源检索方法 |
CN104484478A (zh) * | 2014-12-31 | 2015-04-01 | 中国农业银行股份有限公司 | 一种关联聚类数据瘦身方法及系统 |
CN105389336A (zh) * | 2015-05-07 | 2016-03-09 | 数灵科技有限公司 | 大量数据关系的表示 |
CN105302915A (zh) * | 2015-12-23 | 2016-02-03 | 西安美林数据技术股份有限公司 | 基于内存计算的高性能数据处理系统 |
CN106294739A (zh) * | 2016-08-10 | 2017-01-04 | 桂林电子科技大学 | 一种基于k2树和多值决策图的大规模图数据处理方法 |
CN110389953A (zh) * | 2019-05-24 | 2019-10-29 | 中国科学院计算技术研究所 | 基于压缩图的数据存储方法、存储介质、存储装置和服务器 |
CN111813926A (zh) * | 2019-11-13 | 2020-10-23 | 中国传媒大学 | 一种图数据库Neo4J交互可视化的操作方法与系统 |
CN111611449A (zh) * | 2020-05-08 | 2020-09-01 | 百度在线网络技术(北京)有限公司 | 信息编码方法、装置、电子设备及计算机可读存储介质 |
CN111737404A (zh) * | 2020-06-26 | 2020-10-02 | 豆盟(北京)科技股份有限公司 | 数据处理方法、装置、设备和计算机存储介质 |
CN111966870A (zh) * | 2020-08-14 | 2020-11-20 | 深圳市万物云科技有限公司 | 一种基于图数据库的社区关系实时构建方法及其相关组件 |
CN113220820A (zh) * | 2020-12-15 | 2021-08-06 | 中国人民解放军国防科技大学 | 基于图的高效sparql查询应答方法、装置和设备 |
CN113761122A (zh) * | 2021-05-19 | 2021-12-07 | 清华大学 | 一种事件抽取方法、相关装置、设备及存储介质 |
CN113961672A (zh) * | 2021-11-01 | 2022-01-21 | 北京百度网讯科技有限公司 | 信息标注方法、装置、电子设备和存储介质 |
CN114064925A (zh) * | 2021-11-23 | 2022-02-18 | 北京百度网讯科技有限公司 | 知识图谱的构建方法、数据查询方法、装置、设备和介质 |
Non-Patent Citations (2)
Title |
---|
M. NABAEE AND F. LABEAU: "Quantized network coding for sparse messages", 《2012 IEEE STATISTICAL SIGNAL PROCESSING WORKSHOP (SSP)》 * |
谢怡 等: "大数据环境下数据读取关键技", 《计算机技术与发展》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114528444B (zh) | 2023-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110019080B (zh) | 数据访问方法和装置 | |
US10249070B2 (en) | Dynamic interaction graphs with probabilistic edge decay | |
CN111523001B (zh) | 用于存储数据的方法、装置、设备以及存储介质 | |
CN108984553B (zh) | 缓存方法和装置 | |
WO2021023149A1 (zh) | 一种动态返回报文的方法和装置 | |
CN110795315A (zh) | 监控业务的方法和装置 | |
CN113761565B (zh) | 数据脱敏方法和装置 | |
CN113656198A (zh) | 客户端到云手机的复制粘贴方法和装置 | |
CN114528444B (zh) | 图数据处理方法、装置、电子设备和存储介质 | |
CN115604365B (zh) | 数据编解码方法、装置、电子设备及可读存储介质 | |
CN114138397B (zh) | 页面显示方法、装置、电子设备及存储介质 | |
CN112887426B (zh) | 信息流的推送方法、装置、电子设备以及存储介质 | |
CN115514718A (zh) | 基于数据传输系统的数据交互方法、控制层、设备 | |
CN109144991B (zh) | 动态分表的方法、装置、电子设备和计算机可存储介质 | |
CN115794742A (zh) | 文件路径数据处理方法、装置、设备及存储介质 | |
CN112711572B (zh) | 适用于分库分表的在线扩容方法和装置 | |
CN114741158A (zh) | 页面切换方法、装置、设备以及存储介质 | |
CN110019671B (zh) | 一种处理实时消息的方法和系统 | |
CN113220981A (zh) | 一种优化缓存的方法和装置 | |
CN110866002A (zh) | 分表数据处理的方法和装置 | |
CN115982206B (zh) | 一种处理数据的方法和装置 | |
CN113722548B (zh) | 一种业务系统中引用关系的处理方法和装置 | |
CN112817990B (zh) | 数据处理方法、装置、电子设备以及可读存储介质 | |
US20230132173A1 (en) | Data reading method, device and storage medium | |
CN111274586B (zh) | 保存数据的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |