CN106372233B - 数据集合存储方法及装置 - Google Patents

数据集合存储方法及装置 Download PDF

Info

Publication number
CN106372233B
CN106372233B CN201610815584.7A CN201610815584A CN106372233B CN 106372233 B CN106372233 B CN 106372233B CN 201610815584 A CN201610815584 A CN 201610815584A CN 106372233 B CN106372233 B CN 106372233B
Authority
CN
China
Prior art keywords
acquisition system
data element
data
data acquisition
random number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610815584.7A
Other languages
English (en)
Other versions
CN106372233A (zh
Inventor
吴晓飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201610815584.7A priority Critical patent/CN106372233B/zh
Publication of CN106372233A publication Critical patent/CN106372233A/zh
Application granted granted Critical
Publication of CN106372233B publication Critical patent/CN106372233B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据集合存储方法及装置。其中,方法包括:获取数据集合对应的随机数;在向数据集合内插入数据元素时,依据数据集合名、数据元素名和随机数生成唯一标识数据元素的存储位置标识;依据存储位置标识确定数据元素在数据集合中的排序位置,将数据元素插入到排序位置处,以完成数据元素的存储,从而实现了数据元素随机存储于数据集合,而不是依照一定规则存储于数据集合中,由于数据元素是随机存储于数据集合中,进而能够保证在从数据集合弹出数据元素时是随机的,进一步提升了弹出数据元素的随机性。

Description

数据集合存储方法及装置
技术领域
本发明涉及互联网技术领域,具体涉及一种数据集合存储方法及装置。
背景技术
数据元素一般以某种格式记录在计算机内部或外部存储介质上,其中磁盘作为一种常用的存储介质,在磁盘上则可按使用要求采用顺序存取或直接存取方式,也就是说,数据元素在存储到磁盘后,针对磁盘内的数据元素便无法再进行数据元素的顺序处理。
在很多场景下,例如年会抽奖、社会调差、质量检验等,一般情况下需要创建一数据集合,将数据元素插入到数据集合中,然后再从数据集合中随机弹出数据元素,在将数据元素存储于数据集合时,现有技术一般是按照预设规则存储数据元素,以年会抽奖、数据元素为用户姓名为例,一般是按照姓氏将多个用户姓名存储于数据集合,对于这种按照预设规则存储数据元素,当需要随机性获取数据集合中数据元素时,在弹出数据元素时很容易出现无效取值的情况,具体指数据元素已被弹出,然而并无法提前获知这一情况,严重影响了取值性能。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的数据集合存储方法和相应的数据集合存储装置。
根据本发明的一个方面,提供了一种数据集合存储方法,方法包括:
获取数据集合对应的随机数;
在向数据集合内插入数据元素时,依据数据集合名、数据元素名和随机数生成唯一标识数据元素的存储位置标识;
依据存储位置标识确定数据元素在数据集合中的排序位置,将数据元素插入到排序位置处,以完成数据元素的存储。
根据本发明的另一方面,提供了一种数据集合存储装置,装置包括:
随机数获取模块,适于获取数据集合对应的随机数;
存储位置标识生成模块,适于在向数据集合内插入数据元素时,依据数据集合名、数据元素名和随机数生成唯一标识数据元素的存储位置标识;
确定模块,适于依据存储位置标识确定数据元素在数据集合中的排序位置;
插入模块,将数据元素插入到排序位置处,以完成数据元素的存储。
根据本发明提供的技术方案,在向数据集合内插入数据元素时,依据数据集合名、数据元素名和获取到的数据集合的随机数生成唯一标识数据元素的存储位置标识,依据存储位置标识确定数据元素在数据集合中的排序位置,将数据元素插入到排序位置处,以完成数据元素的存储,从而实现了数据元素随机存储于数据集合,而不是依照一定规则存储于数据集合中,由于数据元素是随机存储于数据集合中,进而能够保证在从数据集合弹出数据元素时是随机的,进一步提升了弹出数据元素的随机性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的数据集合存储方法的流程示意图;
图2示出了根据本发明另一个实施例的数据集合存储方法的流程示意图;
图3示出了根据本发明一个实施例的数据集合存储装置的结构框图;
图4示出了根据本发明另一个实施例的数据集合存储装置的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为了解决上述问题,发明人经过创造性劳动,提出了基于数据集合的随机数为数据元素生成存储位置标识,依据存储位置标识将数据元素存储于数据集合的解决方案。
在下面的实施例中,将详细介绍将一个数据元素存储于数据集合的实现方式:
图1示出了根据本发明一个实施例的数据集合存储方法的流程示意图。如图1所示,该方法包括以下步骤:
步骤S100,获取数据集合对应的随机数。
具体地,数据集合是一个数据元素的集合,该数据集合可以用于存储数据元素,每一数据集合都有一对应的随机数,为了保证数据元素存储于数据集合时是随机存储的,即并不是按照一定规则存储的,需要获取数据集合对应的随机数。
步骤S101,在向数据集合内插入数据元素时,依据数据集合名、数据元素名和随机数生成唯一标识数据元素的存储位置标识。
具体地,获取到数据集合对应的随机数后,在将数据元素插入到数据集合时,可以依据数据集合名、数据元素名和随机数生成唯一标识数据元素的存储位置标识,该存储位置标识是唯一的,也就是说,每个数据元素都唯一的对应一存储位置标识,用于标识对应的数据元素在数据集合内的存储位置。
在本步骤中,依据数据集合名、数据元素名和随机数生成数据元素的存储位置标识,不仅是为了保证所生成的存储位置标识是随机的,而且还保证能够根据所生成的存储位置标识查找到具体的数据集合和数据元素,也就是说,在需要从数据集合中弹出数据元素时,能够根据存储位置标识查找对应的数据集合和数据元素,而不会出现所弹出的数据元素与存储位置标识不对应的情况。
步骤S102,依据存储位置标识确定数据元素在数据集合中的排序位置,将数据元素插入到排序位置处,以完成数据元素的存储。
在步骤S101中提到了存储位置标识用于标识数据元素在数据集合内的存储位置,因此,在依据数据集合名、数据元素名和随机数生成唯一标识数据元素的存储位置标识后,可以依据存储位置标识确定数据元素在数据集合中的排序位置,以某一数据元素的存储位置标识为100为例,可以确定该数据元素在数据集合中的排序位置为100,在确定了数据元素在数据集合中的排序位置后,将数据元素插入到排序位置处,进而完成数据元素的存储。
根据本发明上述实施例提供的方法,在向数据集合内插入数据元素时,依据数据集合名、数据元素名和获取到的数据集合的随机数生成唯一标识数据元素的存储位置标识,依据存储位置标识确定数据元素在数据集合中的排序位置,将数据元素插入到排序位置处,以完成数据元素的存储,从而实现了数据元素随机存储于数据集合,而不是依照一定规则存储于数据集合中,由于数据元素是随机存储于数据集合中,进而能够保证在从数据集合弹出数据元素时是随机的,进一步提升了弹出数据元素的随机性。
图2示出了根据本发明另一个实施例的数据集合存储方法的流程示意图。如图2所示,该方法包括以下步骤:
步骤S200,获取数据集合对应的随机数。
具体地,数据集合是一个数据元素的集合,该数据集合可以用于存储数据元素,每一数据集合都有一对应的随机数,为了保证数据元素存储于数据集合时是随机存储的,即并不是按照一定规则存储的,需要获取数据集合对应的随机数。
在向数据集合内插入数据元素之前,需要先获取数据集合对应的随机数,我们知道,数据集合的状态一般可以分为两种:数据集合为空,即数据集合内未存储有任何数据元素;以及数据集合不为空,即数据集合内存储有至少一个数据元素。
其中,在数据集合为空时,由于并未利用过本发明实施例的方法将数据元素存储于数据集合中,因此,数据集合也没有对应的随机数,这样就可以先为数据集合生成一随机数,并记录所生成的随机数,该随机数可以用于后续的方法步骤中生成数据元素的存储位置标识以及下一个数据元素的存储。
针对每一个数据元素,都将采用本发明方法将数据元素存储于数据集合,在数据集合不为空时,说明之前已利用过本发明的方法将数据元素存储于数据集合,因此,这里可以通过查询数据集合对应的记录来获取随机数。举例说明,在向数据集合插入数据元素B之前,需要判断数据集合是否为空,也就是判断数据集合内是否存储其他数据元素,例如在判断出数据集合内存储有数据元素A的情况下,可以确定在将数据元素A在插入数据集合时,已经为数据集合生成了一随机数,因此可以通过查询数据集合对应的记录来获取随机数,以将数据元素B存储于数据集合中。
步骤S201,在向数据集合内插入数据元素时,将数据集合名、数据元素名和随机数三者组合在一起,计算其哈希值以作为数据元素的存储位置标识。
在本步骤中,HASH值(哈希值)是根据数据集合名、数据元素名和随机数通过逻辑运算得到的数值,因此,对于存储于同一数据集合的不同数据元素得到的HASH值是不同的,以及对于存储于不同的数据集合的同一数据元素得到的HASH值是不同的,因此可以利用HASH值来作为数据元素的存储位置标识。
具体地,获取到数据集合对应的随机数后,在将数据元素插入到数据集合时,可以采用MD5(Message Digest Algorithm,消息摘要算法第五版)或 SHA1(Secure HashAlgorithm,安全哈希算法)算法对数据集合名、数据元素名和随机数进行运算处理得到其HASH值,并将计算得到的HASH值作为数据元素的存储位置标识,由于HASH值是唯一的,数据元素的存储位置标识也是唯一的,也就是说,每个数据元素都唯一的对应一存储位置标识,用于标识对应的数据元素在数据集合内的存储位置。
在本步骤中,计算数据集合名、数据元素名和随机数三者的HASH值,将其作为数据元素的存储位置标识,不仅是为了保证所生成的存储位置标识是随机的,而且还保证能够根据存储位置标识查找到具体的数据集合和数据元素,也就是说,在需要从数据集合中弹出数据元素时,能够根据存储位置标识查找对应的数据集合和数据元素,而不会出现所弹出的数据元素与存储位置标识不对应的情况。
步骤S202,将数据元素的存储位置标识与已插入数据集合中的数据元素的存储位置标识进行比较,根据比较结果确定数据元素在数据集合中的排序位置。
在数据集合不为空时,在得到数据元素的存储位置标识后,需要将数据元素的存储位置标识与已插入数据集合中的数据元素的存储位置标识进行比较来确定数据元素在数据集合中的排序位置,举例说明,数据集合内已存储有数据元素A、B、C,它们的存储位置标识分别为30、40、43,对于数据元素D,根据步骤S201计算得到数据元素D的存储位置标识为35,通过将数据元素D的存储位置标识与已插入数据集合中的数据元素A、B、C的存储位置标识比较,可以确定数据元素D应插入到数据元素A和数据元素B之间,确定了数据元素D在数据集合中的排序位置。
步骤S203,将数据元素插入到排序位置处,以完成数据元素的存储。
在根据步骤S202确定了数据元素在数据集合中的排序位置后,将数据元素插入到对应的排序位置处,从而完成数据元素的存储。
在将数据元素插入到数据集合后,还可以根据不同的需求从数据集合中弹出数据元素,例如年会抽奖、社会调查、质量检验,由于数据元素插入数据集合时是随机插入的,因此,可以依照一定的顺序弹出数据元素,具体地,当数据集合不为空时,在从数据集合中弹出数据元素时,依据排序位置从前至后的顺序弹出数据元素。举例说明,在将数据元素插入数据集合时,可以按照排序位置由大至小的顺序将数据元素插入到排序位置处,因此,在依据排序位置从前至后的顺序弹出数据元素时,可以依照排序位置由大至小的顺序弹出数据元素;此外,还可以按照排序位置由小至大的顺序将数据元素插入到排序位置处,因此,在依据排序从前至后的顺序弹出数据元素时,可以依照排序位置由小至大的顺序弹出数据元素,当然这里仅仅是举例说明,不具有任何限定作用。
下面将详细介绍从数据集合中弹出数据元素的实现过程:
步骤S204,在从数据集合中弹出数据元素时,查询当前保存的无效的存储位置标识。
具体地,无效的存储位置标识标明了最新被弹出的数据元素的存储位置,表明该存储位置标识对应的数据元素已被弹出过,因此,在从数据集合中弹出数据元素时,应该选择数据集合中未被弹出过的数据元素。具体地,在从数据集合中弹出数据元素时,需要先查询当前保存的无效的存储位置标识,以根据该无效的存储位置标识确定对应的数据元素。
步骤S205,依据无效的存储位置标识,查找排序位置在无效的存储位置标识对应的数据元素之后的数据元素。
在查询到无效的存储位置标识之后,依据无效的存储位置标识,查找排序位置在无效的存储位置标识对应的数据元素之后的数据元素,查找到的数据元素将作为本次被弹出的数据元素。
步骤S206,弹出查找到的数据元素,并将当前保存的无效的存储位置标识更新为查找到的数据元素对应的存储位置标识。
在根据无效的存储位置标识查找到排序位置在无效的存储位置标识对应的数据元素之后的数据元素后,将该数据元素弹出,为了保证每一次弹出的数据元素都是有效的,每次从数据集合中弹出数据元素后,都需要对无效的存储位置标识进行更新,具体地,将当前保存的无效的存储位置标识更新为查找到的数据元素对应的存储位置标识,以在下一次数据元素弹出时根据更新后的无效的存储位置标识查找排序位置在无效的存储位置标识对应的数据元素之后的数据元素,对于存储有较多数量的数据元素的数据集合,这种方法将大幅度提升取值的性能。
在年会抽奖、社会调查或质量检验活动结束后,可以清空对应的数据集合,在下一次年会抽奖、社会调查或质量检验时,还可以上述实施例中的方法向数据集合内插入数据,以及从数据集合中弹出数据元素。当然,在数据集合为空时,需要为数据集合生成随机数,在生成随机数后,需要判断随机数与之前记录的随机数是否相同,若是,则重新生成一个与之前记录的随机数不同的随机数,以保证数据元素插入数据集合的顺序与上一次的不同,进而能够保证弹出数据元素也不同,更好的实现了活动的意义。
根据本发明上述实施例提供的方法,获取数据集合对应的随机数,在向数据集合内插入数据元素时,计算数据集合名、数据元素名和随机数的哈希值以作为数据元素的存储位置标识,依据存储位置标识确定数据元素排序位置,实现数据元素的存储,保证了数据元素是随机插入到数据集合的,而不是按照固定顺序插入到数据集合,在从数据集合中弹出数据元素时,查询当前保存的无效的存储位置标识;依据无效的存储位置标识,查找排序位置在无效的存储位置标识对应的数据元素之后的数据元素;弹出查找到的数据元素,并将当前保存的无效的存储位置标识更新为查找到的数据元素对应的存储位置标识,由于数据元素是随机插入到数据集合的,因此,按照固定顺序弹出数据元素也能保证数据元素是随机被弹出的,根据无效的存储位置标识来确定被弹出数据元素,保证每一次弹出的数据元素都是有效的,大幅度提升取值的性能。
图3示出了根据本发明一个实施例的数据集合存储装置的结构框图。如图3所示,该装置包括:随机数获取模块300、存储位置标识生成模块310、确定模块320和插入模块330。
随机数获取模块300,适于获取数据集合对应的随机数。
存储位置标识生成模块310,适于在向数据集合内插入数据元素时,依据数据集合名、数据元素名和随机数生成唯一标识数据元素的存储位置标识。
确定模块320,适于依据存储位置标识确定数据元素在数据集合中的排序位置。
插入模块330,将数据元素插入到排序位置处,以完成数据元素的存储。
根据本发明上述实施例提供的装置,在向数据集合内插入数据元素时,依据数据集合名、数据元素名和获取到的数据集合的随机数生成唯一标识数据元素的存储位置标识,依据存储位置标识确定数据元素在数据集合中的排序位置,将数据元素插入到排序位置处,以完成数据元素的存储,从而实现了数据元素随机存储于数据集合,而不是依照一定规则存储于数据集合中,由于数据元素是随机存储于数据集合中,进而能够保证在从数据集合弹出数据元素时是随机的,进一步提升了弹出数据元素的随机性。
图4示出了根据本发明另一个实施例的数据集合存储装置的结构框图。如图4所示,该装置包括:随机数获取模块400、存储位置标识生成模块410、确定模块420和插入模块430。
随机数获取模块400,适于在数据集合为空时,为数据集合生成随机数;或者在数据集合不为空时,查询数据集合对应的记录以获取随机数。
存储位置标识生成模块410适于:将数据集合名、数据元素名和随机数三者组合在一起,计算其哈希值以作为数据元素的存储位置标识。
确定模块420进一步包括:比较单元421,适于将数据元素的存储位置标识与已插入数据集合中的数据元素的存储位置标识进行比较。
确定单元422,适于根据比较结果确定数据元素在数据集合中的排序位置。
插入模块430,将数据元素插入到排序位置处,以完成数据元素的存储。
该装置还包括:记录模块440,适于记录生成的随机数。
装置还包括:判断模块450,适于在数据集合为空时,判断随机数获取模块获取的随机数与之前记录的随机数是否相同。
随机数获取模块400进一步适于:在判断出随机数与之前记录的随机数相同的情况下,重新生成一个与之前记录的随机数不同的随机数。
此外,当数据集合不为空时,装置还包括:弹出模块460,适于在从数据集合中弹出数据元素时,依据排序位置从前至后的顺序弹出数据元素。
其中,弹出模块460进一步包括:查询单元461,适于在从数据集合中弹出数据元素时,查询当前保存的无效的存储位置标识。
查找单元462,适于依据无效的存储位置标识,查找排序位置在无效的存储位置标识对应的数据元素之后的数据元素。
弹出单元463,适于弹出查找到的数据元素,并将当前保存的无效的存储位置标识更新为查找到的数据元素对应的存储位置标识。
根据本发明上述实施例提供的装置,获取数据集合对应的随机数,在向数据集合内插入数据元素时,计算数据集合名、数据元素名和随机数的哈希值以作为数据元素的存储位置标识,依据存储位置标识确定数据元素排序位置,实现数据元素的存储,保证了数据元素是随机插入到数据集合的,而不是按照固定顺序插入到数据集合,在从数据集合中弹出数据元素时,查询当前保存的无效的存储位置标识;依据无效的存储位置标识,查找排序位置在无效的存储位置标识对应的数据元素之后的数据元素;弹出查找到的数据元素,并将当前保存的无效的存储位置标识更新为查找到的数据元素对应的存储位置标识,由于数据元素是随机插入到数据集合的,因此,按照固定顺序弹出数据元素也能保证数据元素是随机被弹出的,根据无效的存储位置标识来确定被弹出数据元素,保证每一次弹出的数据元素都是有效的,大幅度提升取值的性能。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的数据集合存储设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (12)

1.一种数据集合存储方法,所述方法包括:
获取数据集合对应的随机数;
在向所述数据集合内插入数据元素时,依据数据集合名、数据元素名和所述随机数生成唯一标识所述数据元素的存储位置标识;
依据所述存储位置标识确定所述数据元素在所述数据集合中的排序位置,将所述数据元素插入到所述排序位置处,以完成所述数据元素的存储;
其中,所述获取数据集合对应的随机数进一步包括:在数据集合为空时,为所述数据集合生成所述随机数;或者,在数据集合不为空时,查询所述数据集合对应的记录以获取所述随机数;
所述依据数据集合名、数据元素名和所述随机数生成唯一标识所述数据元素的存储位置标识进一步包括:将所述数据集合名、所述数据元素名和所述随机数三者组合在一起,计算其哈希值以作为所述数据元素的存储位置标识。
2.根据权利要求1所述的方法,在数据集合为空时,为所述数据集合生成所述随机数之后,所述方法还包括:
记录生成的所述随机数。
3.根据权利要求2所述的方法,在数据集合为空时,为所述数据集合生成所述随机数之后,所述方法还包括:
判断所述随机数与之前记录的随机数是否相同,若是,则重新生成一个与之前记录的随机数不同的随机数。
4.根据权利要求1所述的方法,当所述数据集合不为空时,所述方法还包括:
在从所述数据集合中弹出数据元素时,依据排序位置从前至后的顺序弹出数据元素。
5.根据权利要求1-4中任一项所述的方法,所述依据存储位置标识确定所述数据元素在所述数据集合中的排序位置进一步包括:
将所述数据元素的存储位置标识与已插入所述数据集合中的数据元素的存储位置标识进行比较,根据比较结果确定数据元素在所述数据集合中的排序位置。
6.根据权利要求4所述的方法,所述在从所述数据集合中弹出数据元素时,依据排序位置从前至后的顺序弹出数据元素进一步包括:
在从所述数据集合中弹出数据元素时,查询当前保存的无效的存储位置标识;
依据所述无效的存储位置标识,查找排序位置在所述无效的存储位置标识对应的数据元素之后的数据元素;
弹出查找到的数据元素,并将当前保存的无效的存储位置标识更新为查找到的数据元素对应的存储位置标识。
7.一种数据集合存储装置,所述装置包括:
随机数获取模块,适于获取数据集合对应的随机数;
存储位置标识生成模块,适于在向所述数据集合内插入数据元素时,依据数据集合名、数据元素名和所述随机数生成唯一标识所述数据元素的存储位置标识;
确定模块,适于依据所述存储位置标识确定所述数据元素在所述数据集合中的排序位置;
插入模块,将所述数据元素插入到所述排序位置处,以完成所述数据元素的存储;
其中,所述随机数获取模块进一步适于:在数据集合为空时,为所述数据集合生成所述随机数;或者,在数据集合不为空时,查询所述数据集合对应的记录以获取所述随机数;
所述存储位置标识生成模块进一步适于:将所述数据集合名、所述数据元素名和所述随机数三者组合在一起,计算其哈希值以作为所述数据元素的存储位置标识。
8.根据权利要求7所述的装置,所述装置还包括:记录模块,适于记录生成的所述随机数。
9.根据权利要求8所述的装置,所述装置还包括:判断模块,适于在数据集合为空时,判断所述随机数获取模块获取的随机数与之前记录的随机数是否相同;
所述随机数获取模块进一步适于:在判断出所述随机数与之前记录的随机数相同的情况下,重新生成一个与之前记录的随机数不同的随机数。
10.根据权利要求7所述的装置,当所述数据集合不为空时,所述装置还包括:弹出模块,适于在从所述数据集合中弹出数据元素时,依据排序位置从前至后的顺序弹出数据元素。
11.根据权利要求7-10中任一项所述的装置,所述确定模块进一步包括:
比较单元,适于将所述数据元素的存储位置标识与已插入所述数据集合中的数据元素的存储位置标识进行比较;
确定单元,适于根据比较结果确定数据元素在所述数据集合中的排序位置。
12.根据权利要求10所述的装置,所述弹出模块进一步包括:
查询单元,适于在从所述数据集合中弹出数据元素时,查询当前保存的无效的存储位置标识;
查找单元,适于依据所述无效的存储位置标识,查找排序位置在所述无效的存储位置标识对应的数据元素之后的数据元素;
弹出单元,适于弹出查找到的数据元素,并将当前保存的无效的存储位置标识更新为查找到的数据元素对应的存储位置标识。
CN201610815584.7A 2016-09-09 2016-09-09 数据集合存储方法及装置 Active CN106372233B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610815584.7A CN106372233B (zh) 2016-09-09 2016-09-09 数据集合存储方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610815584.7A CN106372233B (zh) 2016-09-09 2016-09-09 数据集合存储方法及装置

Publications (2)

Publication Number Publication Date
CN106372233A CN106372233A (zh) 2017-02-01
CN106372233B true CN106372233B (zh) 2019-09-20

Family

ID=57899556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610815584.7A Active CN106372233B (zh) 2016-09-09 2016-09-09 数据集合存储方法及装置

Country Status (1)

Country Link
CN (1) CN106372233B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108460161B (zh) * 2018-03-30 2021-11-19 腾讯科技(深圳)有限公司 分层抽样方法、装置和计算机设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102332132A (zh) * 2011-07-22 2012-01-25 深圳市财富万方信息技术有限公司 一种互联网实时抽奖系统及其实现方法
CN103845894A (zh) * 2012-12-06 2014-06-11 伊莱克特隆赛克股份公司 电子骰子游戏和骰宝变型
CN104424331A (zh) * 2013-09-10 2015-03-18 深圳市腾讯计算机系统有限公司 数据抽样方法及装置
CN104679791A (zh) * 2013-12-03 2015-06-03 腾讯科技(深圳)有限公司 获取数据包的处理方法和装置
CN105678194A (zh) * 2016-02-05 2016-06-15 中国农业大学 数据完整性检验系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102332132A (zh) * 2011-07-22 2012-01-25 深圳市财富万方信息技术有限公司 一种互联网实时抽奖系统及其实现方法
CN103845894A (zh) * 2012-12-06 2014-06-11 伊莱克特隆赛克股份公司 电子骰子游戏和骰宝变型
CN104424331A (zh) * 2013-09-10 2015-03-18 深圳市腾讯计算机系统有限公司 数据抽样方法及装置
CN104679791A (zh) * 2013-12-03 2015-06-03 腾讯科技(深圳)有限公司 获取数据包的处理方法和装置
CN105678194A (zh) * 2016-02-05 2016-06-15 中国农业大学 数据完整性检验系统及方法

Also Published As

Publication number Publication date
CN106372233A (zh) 2017-02-01

Similar Documents

Publication Publication Date Title
CN106503053B (zh) Utxo查询方法及装置
CN104035800B (zh) 一种增量包生成方法、版本升级方法、装置以及系统
CN104572860B (zh) 一种数据处理方法和系统
CN105447167B (zh) 分布式系统中节点缓存数据的处理方法及装置
JP5842768B2 (ja) 重複除去装置、重複除去方法及び重複除去プログラム
CN105610903B (zh) 分布式系统的数据节点升级方法及装置
CN110235162B (zh) 区块链系统数据处理方法和区块的生成方法
CN107679872A (zh) 基于区块链的艺术品鉴别方法及装置、电子设备
CN103530420B (zh) 数据文件的动态更新方法及装置
US20140258570A1 (en) Implementing configuration preserving relocation of sriov adapter
CN106844676A (zh) 数据存储方法及装置
US8782375B2 (en) Hash-based managing of storage identifiers
CN107451152A (zh) 计算设备、数据缓存和查找的方法及装置
CN106372233B (zh) 数据集合存储方法及装置
CN106599247A (zh) LSM‑tree结构中数据文件的合并方法及装置
CN105771238A (zh) 游戏辅助功能的运行方法和装置
CN104504331A (zh) 虚拟化安全检测方法与系统
CN105550230B (zh) 分布式存储系统节点故障的侦测方法和装置
CN103761240A (zh) 数据库访问方法和装置
CN106776348B (zh) 测试用例管理方法和装置
US9846713B2 (en) Index-only multi-index access
CN112579591A (zh) 数据校验方法、装置、电子设备及计算机可读存储介质
CN113256301B (zh) 数据屏蔽方法、装置、服务器及介质
CN110032341A (zh) 一种模组的数据处理方法、装置、电子设备及介质
CN108984780B (zh) 基于支持重复键值树数据结构管理磁盘数据的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220718

Address after: Room 801, 8th floor, No. 104, floors 1-19, building 2, yard 6, Jiuxianqiao Road, Chaoyang District, Beijing 100015

Patentee after: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Patentee before: Qizhi software (Beijing) Co.,Ltd.