CN109086430A - 数据存储处理方法、装置、计算设备及计算机存储介质 - Google Patents

数据存储处理方法、装置、计算设备及计算机存储介质 Download PDF

Info

Publication number
CN109086430A
CN109086430A CN201810909029.XA CN201810909029A CN109086430A CN 109086430 A CN109086430 A CN 109086430A CN 201810909029 A CN201810909029 A CN 201810909029A CN 109086430 A CN109086430 A CN 109086430A
Authority
CN
China
Prior art keywords
data
table data
key values
change
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810909029.XA
Other languages
English (en)
Inventor
张馨予
左欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201810909029.XA priority Critical patent/CN109086430A/zh
Publication of CN109086430A publication Critical patent/CN109086430A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据存储处理方法、装置、计算设备及计算机存储介质,其中,数据存储处理方法包括:获取列表数据;将列表数据转换为至少两个数据键值对形式的转换数据;其中,至少两个数据键值对形式的转换数据具有索引信息;将至少两个数据键值对形式的转换数据存储至数据库中。根据本发明提供的技术方案,能够便捷地将列表数据转换为至少两个数据键值对形式的转换数据并进行存储,有效地提高了数据存储效率和灵活性,有助于降低内存处理压力,优化了数据存储处理方式。

Description

数据存储处理方法、装置、计算设备及计算机存储介质
技术领域
本发明涉及互联网技术领域,具体涉及一种数据存储处理方法、装置、计算设备及计算机存储介质。
背景技术
随着互联网技术的不断发展,数据处理技术也得到了快速发展,出现了许多例如Storm、Spark、Flink等流式处理框架。在这些流式处理框架中,大多会对状态信息进行管理,并持久化存储,当机器、节点等因某种原因失败时,即可利用存储的状态信息进行状态修复。在一些流式处理框架中,列表数据(例如Flink中的ListState)是作为一个整体持久化存储至数据库中的,那么即使只需要对某列表数据中的单个元素进行操作,也需要从数据库中获取整个列表数据的数据,因此,这种处理方式存在着数据存储效率较低、灵活性较差的问题。另外,若列表数据具有超大规模的数据量时,还可能会导致内存爆炸。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的数据存储处理方法、装置、计算设备及计算机存储介质。
根据本发明的一个方面,提供了一种数据存储处理方法,该方法包括:
获取列表数据;
将列表数据转换为至少两个数据键值对形式的转换数据;其中,至少两个数据键值对形式的转换数据具有索引信息;
将至少两个数据键值对形式的转换数据存储至数据库中。
根据本发明的另一方面,提供了一种数据存储处理装置,该装置包括:
获取模块,适于获取列表数据;
转换模块,适于将列表数据转换为至少两个数据键值对形式的转换数据;其中,至少两个数据键值对形式的转换数据具有索引信息;
存储模块,适于将至少两个数据键值对形式的转换数据存储至数据库中。
根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
存储器用于存放至少一可执行指令,可执行指令使处理器执行上述数据存储处理方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述数据存储处理方法对应的操作。
根据本发明提供的技术方案,获取列表数据,接着将列表数据转换为至少两个数据键值对形式的转换数据,然后将至少两个数据键值对形式的转换数据存储至数据库中。利用本发明提供的技术方案,能够便捷地将列表数据转换为至少两个数据键值对形式的转换数据并进行存储,与现有技术中将列表数据作为一个整体进行存储相比,本发明有效地提高了数据存储效率和灵活性,有助于降低内存处理压力,优化了数据存储处理方式。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的数据存储处理方法的流程示意图;
图2示出了根据本发明另一个实施例的数据存储处理方法的流程示意图;
图3示出了根据本发明一个实施例的数据存储处理装置的结构框图;
图4示出了根据本发明实施例的一种计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的数据存储处理方法的流程示意图,如图1所示,该方法包括如下步骤:
步骤S100,获取列表数据。
该方法适用于Flink等流式处理框架。以Flink流式处理框架为例,根据其容错机制,检查点定期触发,产生快照,快照中记录有所有有状态的算子(operator)的当前的状态信息,并对快照进行持久化存储。当机器、节点等失败时,只需从最近的一份快照开始,利用可重发的数据源重发一次数据即可恢复。其中,状态信息可采用列表的形式进行保存,例如ListState。当需要对列表数据进行持久化存储时,在步骤S100中获取列表数据。其中,该列表数据可包含有至少一个元素。本领域技术人员可根据实际需要对元素的数量以及元素的元素值的数据类型进行设置,此处不做限定。
步骤S101,将列表数据转换为至少两个数据键值对形式的转换数据。
现有技术中,列表数据是直接作为一个整体持久化存储至数据库中的,若数据库为基于键值(Key-Value)存储的数据库,那么一个列表数据中的所有数据将会存储在一个Value中,这种存储方式使得在每次需要对该列表数据中的单个元素进行操作时,都需要从数据库中获取这个Value,即需要获取整个列表数据的数据,这种数据存储方式存在着存储效率较低、灵活性较差、对内存要求较高的问题。为了解决上述问题,本发明将列表数据转换为至少两个数据键值对形式的转换数据,其中,至少两个数据键值对形式的转换数据具有索引信息。索引信息用于表明至少两个数据键值对形式的转换数据之间的联系,并且根据索引信息还能够将至少两个数据键值对形式的转换数据还原成原有的列表数据。
其中,由列表数据转换得到的数据键值对形式的转换数据的数量与该列表数据中所包含的元素的总数量有关。例如,由列表数据转换得到的数据键值对形式的转换数据的数量可大于与该列表数据中所包含的元素的总数量。
步骤S102,将至少两个数据键值对形式的转换数据存储至数据库中。
在转换得到至少两个数据键值对形式的转换数据之后,就可将至少两个数据键值对形式的转换数据存储至数据库中,以实现持久化存储。其中,数据库可为基于键值存储的数据库,例如,RocksDB数据库等。当需要对列表数据中的单个元素进行操作时,根据与该元素对应的索引信息,即可从数据库中获取与索引信息对应的转换数据,无需再从数据库中获取整个列表数据的数据,从而有效地提高了灵活性,减少了数据获取量,降低了内存处理压力。
根据本实施例提供的数据存储处理方法,获取列表数据,接着将列表数据转换为至少两个数据键值对形式的转换数据,然后将至少两个数据键值对形式的转换数据存储至数据库中。利用本发明提供的技术方案,能够便捷地将列表数据转换为至少两个数据键值对形式的转换数据并进行存储,与现有技术中将列表数据作为一个整体进行存储相比,本发明有效地提高了数据存储效率和灵活性,有助于降低内存处理压力,优化了数据存储处理方式。
图2示出了根据本发明另一个实施例的数据存储处理方法的流程示意图,如图2所示,该方法包括如下步骤:
步骤S200,获取列表数据。
该方法适用于流式处理框架,当需要对列表数据进行持久化存储时,在步骤S200中获取列表数据。
步骤S201,根据列表数据的标记信息以及列表数据中所包含的元素的总数量,创建与列表数据对应的索引。
在获取了列表数据之后,就可根据列表数据的标记信息以及列表数据中所包含的元素的总数量,创建与列表数据对应的索引,以便根据索引对列表数据进行转换。具体地,可按照预设索引创建规则来创建索引,本领域技术人员可根据实际需要设置预设索引创建规则,此处不做限定。例如,预设索引创建规则规定了以列表数据的标记信息、指定分隔符以及-1、0、1等数字设置索引信息。
其中,列表数据与标记信息一一对应,列表数据的标记信息为用于唯一标记列表数据的字段等信息,具体地,列表数据的标记信息可以是根据列表数据的名称所确定的。本领域技术人员还可根据其他方式确定列表数据的标记信息,此处不做限定。
所创建的与列表数据对应的索引包括至少一个索引信息,索引信息的数量与列表数据中所包含的元素的总数量有关。例如,索引信息的数量比列表数据中所包含的元素的总数量多1。
步骤S202,利用索引、列表数据的元数据以及列表数据中的每一个元素的元素值,构建至少两个数据键值对形式的转换数据。
在创建了索引之后,就可利用索引、列表数据的元数据以及列表数据中的每一个元素的元素值,构建至少两个数据键值对形式的转换数据。具体地,将索引中起始的索引信息作为数据键,将列表数据的元数据作为数据键对应的数据值,构建与元数据对应的数据键值对形式的转换数据;针对列表数据中的每一个元素,依据元素在列表数据中的顺序,从索引中确定元素对应的索引信息;将元素对应的索引信息作为数据键,将元素的元素值作为数据键对应的数据值,构建与元素对应的数据键值对形式的转换数据。其中,列表数据的元数据可包括列表数据中所包含的元素的总数量,另外,列表数据的元数据还可包括其他用于描述列表数据的数据,此处不做限定。
例如,某个列表数据的标记信息为A,该列表数据中所包含的元素的总数量为3,即该列表数据中一共包含有3个元素,这三个元素的名称分别为B、C和D,每个元素都具有对应的元素值,在一个具体实施例中,所创建的与列表数据对应的索引所包括的索引信息的数量比该列表数据中所包含的元素的总数量多1,那么所创建的与该列表数据对应的索引包括4个索引信息,这4个索引信息依次分别为“A_-1”、“A_0”、“A_1”以及“A_2”,其中,索引信息中的A表示索引信息对应的列表数据的标记信息,索引信息中的-1表示该索引信息对应于列表数据的元数据,索引信息中的0、1和2分别表示其所对应的元素在所属的列表数据中的顺序。
其中,该索引中起始的索引信息为“A_-1”,以列表数据的元数据包括列表数据中所包含的元素的总数量为例,那么将“A_-1”作为数据键,将元素的总数量(即3)作为该数据键对应的数据值,构建与元数据对应的数据键值对形式的转换数据。
针对列表数据中的元素B,元素B为列表数据中的第1个元素,那么从索引中确定元素B对应的索引信息为“A_0”,然后将“A_0”作为数据键,将元素B的元素值作为该数据键对应的数据值,构建与元素B对应的数据键值对形式的转换数据。
同理,针对列表数据中的元素C,从索引中确定元素C对应的索引信息为“A_1”,将“A_1”作为数据键,将元素C的元素值作为该数据键对应的数据值,构建与元素C对应的数据键值对形式的转换数据;针对列表数据中的元素D,从索引中确定元素D对应的索引信息为“A_2”,将“A_2”作为数据键,将元素D的元素值作为该数据键对应的数据值,构建与元素D对应的数据键值对形式的转换数据。通过上述处理方式,便捷地将列表数据中的每一个元素都转换为对应的数据键值对形式的转换数据,那么当需要对列表数据中的单个元素进行操作时,从数据库中获取数据键为该元素对应的索引信息的转换数据即可,无需再从数据库中获取整个列表数据的数据,从而有效地提高了灵活性,减少了数据获取量,降低了内存处理压力。
步骤S203,对至少两个数据键值对形式的转换数据进行序列化处理,将序列化处理后的数据键值对形式的转换数据存储至数据库的列族中。
在完成至少两个数据键值对形式的转换数据的构建之后,将至少两个数据键值对形式的转换数据存储至数据库中。由于数据库所支持的存储形式的限制,还需要将至少两个数据键值对形式的转换数据序列化处理成数据库所支持的存储形式。以RocksDB数据库为例,RocksDB数据库所支持的存储形式为字节数组(byte数组),那么针对每一个数据键值对形式的转换数据,需要根据转换数据中数据键和数据值具体的数据类型,选择与数据类型对应的序列化处理方法,然后将转换数据序列化处理成byte数组,例如,与元数据对应的数据键值对形式的转换数据中数据值存储的是元素的总数量,那么可选择与int数据类型对应的序列化处理方法对其进行序列化处理。在经过序列化处理之后,将序列化处理后的转换数据存储至数据库的列族(Column Family)中,以便数据库对属于同一个列表数据的转换数据进行统一管理。
步骤S204,接收针对于列表数据的元素添加请求。
步骤S205,根据元素添加请求,对数据库中存储的与列表数据的元数据对应的数据键值对形式的转换数据以及与列表数据中的每一个元素对应的数据键值对形式的转换数据进行更新。
其中,元素添加请求携带有列表数据的标记信息、待添加元素的元素值以及待添加元素在列表数据中的顺序等信息。根据元素添加请求,需要对数据库中存储的与列表数据中的每一个元素对应的数据键值对形式的转换数据进行更新,以实现元素的添加。另外,元素的添加也会导致列表数据的元数据发生变化,例如列表数据中所包含的元素的总数量增加,那么还需要对数据库中存储的与列表数据的元数据对应的数据键值对形式的转换数据进行更新。具体地,可利用RocksDB数据库中的transaction功能实现对RocksDB数据库中存储的与列表数据的元数据对应的数据键值对形式的转换数据以及与列表数据中的每一个元素对应的数据键值对形式的转换数据的更新。
步骤S206,接收针对于列表数据的元素获取请求。
步骤S207,根据元素获取请求,确定与待获取元素对应的索引信息。
其中,元素获取请求携带有列表数据的标记信息以及待获取元素在列表数据中的顺序等信息。在接收到元素获取请求之后,就可根据预设索引创建规则以及元素获取请求中携带的列表数据的标记信息和待获取元素在列表数据中的顺序等信息,确定与待获取元素对应的索引信息。例如,预设索引创建规则规定了以列表数据的标记信息、下划线以及-1、0、1等数字设置索引信息,且根据元素获取请求可知,列表数据的标记信息为A,待获取元素在列表数据中的顺序为第2个,那么确定与待获取元素对应的索引信息为“A_1”。
步骤S208,利用与待获取元素对应的索引信息,从数据库中获取与索引信息对应的数据键值对形式的转换数据的数据值。
在确定了与待获取元素对应的索引信息之后,从数据库中查找并获取与该索引信息对应的数据键值对形式的转换数据的数据值。具体地,在步骤S202中是将元素对应的索引信息作为数据键,将元素的元素值作为数据键对应的数据值,构建与元素对应的数据键值对形式的转换数据,那么在步骤S208中可从数据库中获取数据键为所确定的与待获取元素对应的索引信息的转换数据的数据值。例如,所确定的与待获取元素对应的索引信息为“A_1”,那么从数据库中获取Key为“A_1”的转换数据的Value,该Value的值即为待获取元素的元素值。
本方法能够直接从数据库中获取列表数据中的单个元素的元素值,在需要对列表数据中的单个元素进行操作时,只需从数据库中获取该元素的元素值,内存中也仅需存储该元素的元素值即可,内存中无需存储整个列表数据的数据,从而有效地减少了内存占用量,降低了内存处理压力。因此,在需要对列表数据中的单个元素进行操作时,即使列表数据具有超大规模的数据量,也不会导致内存爆炸。
另外,本发法还可方便地对列表数据的元数据进行查询。具体地,在步骤S203之后,该方法还可包括:接收针对于列表数据的元数据查询请求,根据元数据查询请求,确定与元数据对应的索引信息,然后利用与元数据对应的索引信息,从数据库中获取与该索引信息对应的数据键值对形式的转换数据的数据值。
其中,元数据查询请求携带有列表数据的标记信息以及用于标记元数据的信息等。例如,元数据包括列表数据中所包含的元素的总数量,那么可用“list.length”或者“CURRENT_MAX_SIZE”等作为用于标记元数据的信息。根据预设索引创建规则以及元素获取请求中携带的标记信息和用于标记元数据的信息,确定与元数据对应的索引信息,然后从数据库中获取数据键为所确定的与元数据对应的索引信息的转换数据的数据值。例如,根据元数据查询请求可知,列表数据的标记信息为A,需要查询的是元数据,那么确定与元数据对应的索引信息为“A_-1”,接着从数据库中获取Key为“A_-1”的转换数据的Value,该Value的值即为列表数据的元数据。
由于在数据库中存储的是序列化处理后的数据键值对形式的转换数据,所以在从数据库中获取到与索引信息对应的数据键值对形式的转换数据的数据值之后,还需对所获取的数据值进行反序列化处理。具体地,利用与该数据值的数据类型对应的反序列化处理方法对其进行反序列化处理。
可选地,在一些情况下,还需要遍历列表数据中的各个元素,那么可根据索引中的索引信息,遍历列表数据中各个元素对应的数据键值对形式的转换数据。例如,预设索引创建规则规定了以列表数据的标记信息、下划线以及-1、0、1等数字设置索引信息,列表数据的标记信息为A,那么索引中起始的索引信息为“A_-1”,先从数据库中获取与索引信息“A_-1”对应的数据键值对形式的转换数据的数据值,该数据值中记录有列表数据的元数据,根据该元数据能够获知该列表数据中所包含的元素的总数量,假如元素的总数量是3,那么这3个元素对应的索引信息依次为“A_0”、“A_1”和“A_2”,那么接着依次从数据库中获取与索引信息“A_0”、“A_1”和“A_2”对应的数据键值对形式的转换数据的数据值,即可方便地实现对列表数据中的各个元素的遍历。
根据本实施例提供的数据存储处理方法,能够方便地为列表数据创建对应的索引,利用索引、列表数据的元数据以及列表数据中的每一个元素的元素值,将列表数据转换为与元数据对应的数据键值对形式的转换数据以及与每一个元素对应的数据键值对形式的转换数据,并进行存储,不仅提高了数据存储效率,而且与现有技术中将列表数据作为一个整体进行存储相比,本发明提供的数据存储处理方式极大地方便了对列表数据的操作,既能够便捷地获取列表数据中单个元素的元素值,也能够便捷地添加元素,具有较高的灵活性,有效地减少了列表数据的内存占用量,降低了内存处理压力。
图3示出了根据本发明一个实施例的数据存储处理装置的结构框图,该装置适用于流式处理框架,如图3所示,该装置包括:获取模块310、转换模块320和存储模块330。
获取模块310适于:获取列表数据。
转换模块320适于:将列表数据转换为至少两个数据键值对形式的转换数据;其中,至少两个数据键值对形式的转换数据具有索引信息。
可选地,转换模块320进一步适于:根据列表数据的标记信息以及列表数据中所包含的元素的总数量,创建与列表数据对应的索引;利用索引、列表数据的元数据以及列表数据中的每一个元素的元素值,构建至少两个数据键值对形式的转换数据。
具体地,转换模块320进一步适于:将索引中起始的索引信息作为数据键,将列表数据的元数据作为数据键对应的数据值,构建与元数据对应的数据键值对形式的转换数据;针对列表数据中的每一个元素,依据元素在列表数据中的顺序,从索引中确定元素对应的索引信息;将元素对应的索引信息作为数据键,将元素的元素值作为数据键对应的数据值,构建与元素对应的数据键值对形式的转换数据。其中,列表数据的元数据可包括:列表数据中所包含的元素的总数量。列表数据的标记信息可根据列表数据的名称进行确定。
存储模块330适于:将至少两个数据键值对形式的转换数据存储至数据库中。
可选地,存储模块330进一步适于:对至少两个数据键值对形式的转换数据进行序列化处理,将序列化处理后的数据键值对形式的转换数据存储至数据库的列族中。
可选地,该装置还包括:接收模块340和处理模块350。
接收模块340适于:接收针对于列表数据的元素添加请求。
处理模块350适于:根据元素添加请求,对数据库中存储的与列表数据的元数据对应的数据键值对形式的转换数据以及与列表数据中的每一个元素对应的数据键值对形式的转换数据进行更新。
可选地,接收模块340进一步适于:接收针对于列表数据的元素获取请求;处理模块350进一步适于:根据元素获取请求,确定与待获取元素对应的索引信息;利用与待获取元素对应的索引信息,从数据库中获取与索引信息对应的数据键值对形式的转换数据的数据值。
可选地,处理模块350进一步适于:根据索引中的索引信息,遍历列表数据中各个元素对应的数据键值对形式的转换数据。
根据本实施例提供的数据存储处理装置,能够方便地为列表数据创建对应的索引,利用索引、列表数据的元数据以及列表数据中的每一个元素的元素值,将列表数据转换为与元数据对应的数据键值对形式的转换数据以及与每一个元素对应的数据键值对形式的转换数据,并进行存储,不仅提高了数据存储效率,而且与现有技术中将列表数据作为一个整体进行存储相比,本发明提供的数据存储处理方式极大地方便了对列表数据的操作,既能够便捷地获取列表数据中单个元素的元素值,也能够便捷地添加元素,具有较高的灵活性,有效地减少了列表数据的内存占用量,降低了内存处理压力。
本发明还提供了一种非易失性计算机存储介质,计算机存储介质存储有至少一可执行指令,可执行指令可执行上述任意方法实施例中的数据存储处理方法。
图4示出了根据本发明实施例的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图4所示,该计算设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:
处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。
通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器402,用于执行程序410,具体可以执行上述数据存储处理方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以用于使得处理器402执行上述任意方法实施例中的数据存储处理方法。程序410中各步骤的具体实现可以参见上述数据存储处理实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了:A1.一种数据存储处理方法,所述方法包括:
获取列表数据;
将所述列表数据转换为至少两个数据键值对形式的转换数据;其中,所述至少两个数据键值对形式的转换数据具有索引信息;
将所述至少两个数据键值对形式的转换数据存储至数据库中。
A2.根据A1所述的方法,其中,所述将所述列表数据转换为至少两个数据键值对形式的转换数据进一步包括:
根据所述列表数据的标记信息以及所述列表数据中所包含的元素的总数量,创建与所述列表数据对应的索引;
利用所述索引、所述列表数据的元数据以及所述列表数据中的每一个元素的元素值,构建至少两个数据键值对形式的转换数据。
A3.根据A2所述的方法,其中,所述利用所述索引、所述列表数据的元数据以及所述列表数据中的每一个元素的元素值,构建至少两个数据键值对形式的转换数据进一步包括:
将所述索引中起始的索引信息作为数据键,将所述列表数据的元数据作为数据键对应的数据值,构建与所述元数据对应的数据键值对形式的转换数据;
针对所述列表数据中的每一个元素,依据所述元素在所述列表数据中的顺序,从所述索引中确定所述元素对应的索引信息;将所述元素对应的索引信息作为数据键,将所述元素的元素值作为数据键对应的数据值,构建与所述元素对应的数据键值对形式的转换数据。
A4.根据A2或A3所述的方法,其中,所述列表数据的元数据包括:所述列表数据中所包含的元素的总数量。
A5.根据A2-A4任一项所述的方法,其中,所述列表数据的标记信息是根据所述列表数据的名称所确定的。
A6.根据A1-A5任一项所述的方法,其中,所述将所述至少两个数据键值对形式的转换数据存储至数据库中进一步包括:
对所述至少两个数据键值对形式的转换数据进行序列化处理,将序列化处理后的数据键值对形式的转换数据存储至数据库的列族中。
A7.根据A3-A6任一项所述的方法,其中,在所述将所述至少两个数据键值对形式的转换数据存储至数据库中之后,所述方法还包括:
接收针对于所述列表数据的元素添加请求;
根据所述元素添加请求,对所述数据库中存储的与所述列表数据的元数据对应的数据键值对形式的转换数据以及与所述列表数据中的每一个元素对应的数据键值对形式的转换数据进行更新。
A8.根据A3-A6任一项所述的方法,其中,在所述将所述至少两个数据键值对形式的转换数据存储至数据库中之后,所述方法还包括:
接收针对于所述列表数据的元素获取请求;
根据所述元素获取请求,确定与待获取元素对应的索引信息;
利用与待获取元素对应的索引信息,从所述数据库中获取与所述索引信息对应的数据键值对形式的转换数据的数据值。
A9.根据A3-A6任一项所述的方法,其中,在所述将所述至少两个数据键值对形式的转换数据存储至数据库中之后,所述方法还包括:
根据所述索引中的索引信息,遍历所述列表数据中各个元素对应的数据键值对形式的转换数据。
A10.根据A1-A9任一项所述的方法,其中,所述方法适用于流式处理框架。
本发明还公开了:B11.一种数据存储处理装置,所述装置包括:
获取模块,适于获取列表数据;
转换模块,适于将所述列表数据转换为至少两个数据键值对形式的转换数据;其中,所述至少两个数据键值对形式的转换数据具有索引信息;
存储模块,适于将所述至少两个数据键值对形式的转换数据存储至数据库中。
B12.根据B11所述的装置,其中,所述转换模块进一步适于:
根据所述列表数据的标记信息以及所述列表数据中所包含的元素的总数量,创建与所述列表数据对应的索引;
利用所述索引、所述列表数据的元数据以及所述列表数据中的每一个元素的元素值,构建至少两个数据键值对形式的转换数据。
B13.根据B12所述的装置,其中,所述转换模块进一步适于:
将所述索引中起始的索引信息作为数据键,将所述列表数据的元数据作为数据键对应的数据值,构建与所述元数据对应的数据键值对形式的转换数据;
针对所述列表数据中的每一个元素,依据所述元素在所述列表数据中的顺序,从所述索引中确定所述元素对应的索引信息;将所述元素对应的索引信息作为数据键,将所述元素的元素值作为数据键对应的数据值,构建与所述元素对应的数据键值对形式的转换数据。
B14.根据B12或B13所述的装置,其中,所述列表数据的元数据包括:所述列表数据中所包含的元素的总数量。
B15.根据B12-B14任一项所述的装置,其中,所述列表数据的标记信息是根据所述列表数据的名称所确定的。
B16.根据B11-B15任一项所述的装置,其中,所述存储模块进一步适于:
对所述至少两个数据键值对形式的转换数据进行序列化处理,将序列化处理后的数据键值对形式的转换数据存储至数据库的列族中。
B17.根据B13-B16任一项所述的装置,其中,所述装置还包括:
接收模块,适于接收针对于所述列表数据的元素添加请求;
处理模块,适于根据所述元素添加请求,对所述数据库中存储的与所述列表数据的元数据对应的数据键值对形式的转换数据以及与所述列表数据中的每一个元素对应的数据键值对形式的转换数据进行更新。
B18.根据B13-B16任一项所述的装置,其中,所述装置还包括:
接收模块,适于接收针对于所述列表数据的元素获取请求;
处理模块,适于根据所述元素获取请求,确定与待获取元素对应的索引信息;利用与待获取元素对应的索引信息,从所述数据库中获取与所述索引信息对应的数据键值对形式的转换数据的数据值。
B19.根据B13-B16任一项所述的装置,其中,所述装置还包括:
处理模块,适于根据所述索引中的索引信息,遍历所述列表数据中各个元素对应的数据键值对形式的转换数据。
B20.根据B11-B19任一项所述的装置,其中,所述装置适用于流式处理框架。
本发明还公开了:C21.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如A1-A10中任一项所述的数据存储处理方法对应的操作。
本发明还公开了:D22.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如A1-A10中任一项所述的数据存储处理方法对应的操作。

Claims (10)

1.一种数据存储处理方法,所述方法包括:
获取列表数据;
将所述列表数据转换为至少两个数据键值对形式的转换数据;其中,所述至少两个数据键值对形式的转换数据具有索引信息;
将所述至少两个数据键值对形式的转换数据存储至数据库中。
2.根据权利要求1所述的方法,其中,所述将所述列表数据转换为至少两个数据键值对形式的转换数据进一步包括:
根据所述列表数据的标记信息以及所述列表数据中所包含的元素的总数量,创建与所述列表数据对应的索引;
利用所述索引、所述列表数据的元数据以及所述列表数据中的每一个元素的元素值,构建至少两个数据键值对形式的转换数据。
3.根据权利要求2所述的方法,其中,所述利用所述索引、所述列表数据的元数据以及所述列表数据中的每一个元素的元素值,构建至少两个数据键值对形式的转换数据进一步包括:
将所述索引中起始的索引信息作为数据键,将所述列表数据的元数据作为数据键对应的数据值,构建与所述元数据对应的数据键值对形式的转换数据;
针对所述列表数据中的每一个元素,依据所述元素在所述列表数据中的顺序,从所述索引中确定所述元素对应的索引信息;将所述元素对应的索引信息作为数据键,将所述元素的元素值作为数据键对应的数据值,构建与所述元素对应的数据键值对形式的转换数据。
4.根据权利要求2或3所述的方法,其中,所述列表数据的元数据包括:所述列表数据中所包含的元素的总数量。
5.根据权利要求2-4任一项所述的方法,其中,所述列表数据的标记信息是根据所述列表数据的名称所确定的。
6.根据权利要求1-5任一项所述的方法,其中,所述将所述至少两个数据键值对形式的转换数据存储至数据库中进一步包括:
对所述至少两个数据键值对形式的转换数据进行序列化处理,将序列化处理后的数据键值对形式的转换数据存储至数据库的列族中。
7.根据权利要求3-6任一项所述的方法,其中,在所述将所述至少两个数据键值对形式的转换数据存储至数据库中之后,所述方法还包括:
接收针对于所述列表数据的元素添加请求;
根据所述元素添加请求,对所述数据库中存储的与所述列表数据的元数据对应的数据键值对形式的转换数据以及与所述列表数据中的每一个元素对应的数据键值对形式的转换数据进行更新。
8.一种数据存储处理装置,所述装置包括:
获取模块,适于获取列表数据;
转换模块,适于将所述列表数据转换为至少两个数据键值对形式的转换数据;其中,所述至少两个数据键值对形式的转换数据具有索引信息;
存储模块,适于将所述至少两个数据键值对形式的转换数据存储至数据库中。
9.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的数据存储处理方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的数据存储处理方法对应的操作。
CN201810909029.XA 2018-08-10 2018-08-10 数据存储处理方法、装置、计算设备及计算机存储介质 Pending CN109086430A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810909029.XA CN109086430A (zh) 2018-08-10 2018-08-10 数据存储处理方法、装置、计算设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810909029.XA CN109086430A (zh) 2018-08-10 2018-08-10 数据存储处理方法、装置、计算设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN109086430A true CN109086430A (zh) 2018-12-25

Family

ID=64834089

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810909029.XA Pending CN109086430A (zh) 2018-08-10 2018-08-10 数据存储处理方法、装置、计算设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN109086430A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110213267A (zh) * 2019-05-31 2019-09-06 广州华多网络科技有限公司 白名单业务处理方法、服务器以及计算机存储介质
CN111126619A (zh) * 2019-12-06 2020-05-08 苏州浪潮智能科技有限公司 一种机器学习方法与装置
CN113342853A (zh) * 2021-06-18 2021-09-03 上海哔哩哔哩科技有限公司 流式数据处理方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106991102A (zh) * 2016-01-21 2017-07-28 腾讯科技(深圳)有限公司 倒排索引中键值对的处理方法及处理系统
CN107391632A (zh) * 2017-06-30 2017-11-24 北京奇虎科技有限公司 数据库存储处理方法、装置、计算设备及计算机存储介质
CN107728937A (zh) * 2017-09-15 2018-02-23 上海交通大学 一种使用非易失性内存介质的键值对持久存储方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106991102A (zh) * 2016-01-21 2017-07-28 腾讯科技(深圳)有限公司 倒排索引中键值对的处理方法及处理系统
CN107391632A (zh) * 2017-06-30 2017-11-24 北京奇虎科技有限公司 数据库存储处理方法、装置、计算设备及计算机存储介质
CN107728937A (zh) * 2017-09-15 2018-02-23 上海交通大学 一种使用非易失性内存介质的键值对持久存储方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110213267A (zh) * 2019-05-31 2019-09-06 广州华多网络科技有限公司 白名单业务处理方法、服务器以及计算机存储介质
CN110213267B (zh) * 2019-05-31 2022-10-04 广州华多网络科技有限公司 白名单业务处理方法、服务器以及计算机存储介质
CN111126619A (zh) * 2019-12-06 2020-05-08 苏州浪潮智能科技有限公司 一种机器学习方法与装置
CN111126619B (zh) * 2019-12-06 2022-05-31 苏州浪潮智能科技有限公司 一种机器学习方法与装置
CN113342853A (zh) * 2021-06-18 2021-09-03 上海哔哩哔哩科技有限公司 流式数据处理方法和系统

Similar Documents

Publication Publication Date Title
US20200394495A1 (en) System and architecture of neural network accelerator
CN109086430A (zh) 数据存储处理方法、装置、计算设备及计算机存储介质
US8533182B1 (en) Apparatuses, systems, and methods for efficient graph pattern matching and querying
CN104991791B (zh) 一种文件的增量升级发布方法和装置
Peloso et al. Standard 4D gravity on a brane in six-dimensional flux compactifications
CN105653499B (zh) 用于单指令多数据处理器的高效硬件指令
CN107391632A (zh) 数据库存储处理方法、装置、计算设备及计算机存储介质
TWI490783B (zh) 包含向量化註釋及經向量化之函式記號匹配之純量函式向量化技術
CN109033278A (zh) 数据处理方法、装置、电子设备及计算机存储介质
CN115335823A (zh) 用于最短路径图搜索的向量化的队列
CN108228799A (zh) 对象索引信息的存储方法及装置
CN107330119B (zh) 缓存数据处理方法、电子设备、计算机存储介质
US20230376759A1 (en) Accelerated embedding layer computations
CN114175640B (zh) 向量化的散列表
CN108959549A (zh) 数据写入方法、装置、计算设备及计算机存储介质
CN108280227A (zh) 基于缓存的数据信息处理方法及装置
CN107480260A (zh) 大数据实时分析方法、装置、计算设备及计算机存储介质
CN107239485A (zh) 数据库操作方法、装置及系统
CN109753300A (zh) 一种算法升级方法、计算任务发送方法及相关产品
CN108062378B (zh) 一种列式存储下多时间序列的连接查询方法及系统
WO2021126203A1 (en) Processing sequential inputs using neural network accelerators
CN108958973A (zh) 分布式文件系统纠删码数据重构存储节点选择方法及装置
CN113190576A (zh) 数据处理方法、装置、计算机设备和可读存储介质
CN109240893A (zh) 应用运行状态查询方法及终端设备
CN107391257A (zh) 业务所需内存容量的预估方法、装置及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181225