CN114758727A - 基于携带缓存Trie树加速生物基因的检索方法 - Google Patents
基于携带缓存Trie树加速生物基因的检索方法 Download PDFInfo
- Publication number
- CN114758727A CN114758727A CN202210451340.0A CN202210451340A CN114758727A CN 114758727 A CN114758727 A CN 114758727A CN 202210451340 A CN202210451340 A CN 202210451340A CN 114758727 A CN114758727 A CN 114758727A
- Authority
- CN
- China
- Prior art keywords
- tree
- trie
- gene sequence
- data
- trie tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 86
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000005457 optimization Methods 0.000 claims abstract description 10
- 238000010835 comparative analysis Methods 0.000 claims abstract description 6
- 235000014629 Myrica faya Nutrition 0.000 claims description 6
- 244000132444 Myrica faya Species 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 108091008053 gene clusters Proteins 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2246—Trees, e.g. B+trees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24552—Database cache management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Mathematical Physics (AREA)
- Bioethics (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于携带缓存Trie树加速生物基因的检索方法,属于数据查询技术领域,该检索方法具体步骤如下:(1)构建Tire树并将数据导入Tire树中;(2)对Tire树进行性能优化;(3)对基因序列簇进行缓存优化;(4)对Tire树查询效率进行对比分析;本发明通过构建Trie树与哈希表结合的方式对各组生物基因数据进行查询,能够利用有限的内存空间加速基因索引的检索。
Description
技术领域
本发明涉及数据查询技术领域,尤其涉及基于携带缓存Trie树加速生物基因的检索方法。
背景技术
信息检索是指用户进行信息查询和获取的主要方式。大批量的数据以数据库的形式进行管理。以关系型数据库为主,通过索引表查询数据,而数据写入磁盘中,在搭建生信数据库时,多数采用的架构方式为以Java,Python构建后端系统,数据保存在MySQL数据库。在这样的系统中,后端主要负责数据的传递,而数据的检索压力全部转交给数据库。检索的效率取决于数据库的性能,其中包括运行数据库机器的硬件性能,以及数据库产品自身的性能。随着数据量的增长,系统的性能很难提升。甚至单次检索耗时可达一分钟之久,同时后端程序在整个系统中并没有起到对数据检索有利的作用。在数据量到达十万级别的时候,MySQL会出现明显的性能问题。当一个SQL语句需要十几秒的执行时间,应当在系统中增加检索服务来缓解数据库压力。若后端程序能够提前帮助数据库过滤出所有符合条件的索引,再结合数据库精准匹配,这种方式能够极大的减缓数据库的压力;为此,我们提出基于携带缓存Trie树加速生物基因的检索方法。
发明内容
本发明的目的是为了解决现有技术中存在的缺陷,而提出的基于携带缓存Trie树加速生物基因的检索方法。
为了实现上述目的,本发明采用了如下技术方案:
基于携带缓存Trie树加速生物基因的检索方法,该检索方法具体步骤如下:
(1)构建Tire树并将数据导入Tire树中:工作人员构建Tire树,同时将生物基因数据导入Tire树中进行存储;
(2)对Tire树进行性能优化:将Tire树进行压缩处理,同时生成一组索引表以对Tire树在精准匹配时效率进行性能优化;
(3)对基因序列簇进行缓存优化:将生成的各组基因序列簇缓存至内存中,同时通过LRU算法对各组基因序列簇进行选择淘汰;
(4)对Tire树查询效率进行对比分析:收集并分析MySQL与Redis查询效率,同时检测Tire树查询效率,并将收集到的三组查询效率进行对比分析。
作为本发明的进一步方案,步骤(1)中所述Tire树构建具体步骤如下:
步骤一:对各组生物基因数据的基因序列进行分析,并提取“MSTRG”和“CSS”两组标识;
步骤二:创建Trie树根节点,同时该根节点不包含字符,依据分析结果将各组生物基因数据的字符录入除根节点以外的每个节点中,同时每个节点只包含一个字符;
步骤三:当工作人员查询某一组或多组生物基因数据时,从根节点到某一节点,路径上经过的字符连接起来,为该生物基因数据对应的字符串,且每个节点的所有子节点包含的字符都不相同。
作为本发明的进一步方案,步骤(2)中所述性能优化具体步骤如下:
第一步:遍历Trie树各连续分支,并将非根内部节点只有一个子节点进行标记,并将该节点视为冗余;
第二步:将标记的各组长度为一的连续分支节点压缩为一串字符串,并将其作为该Trie树索引的单一分支节点,同时存储空间从标准Trie树的O(n)降低到压缩后的O(k),其中,n为Trie树中总字符串长度,k为插入基因的最长长度;
第三步:在内存中构建一张索引表,在进行模糊查询时通过Trie树做索引查询,进行精确查找时查询索引表,且所有基因索引表在内存中只会保存一份,Trie树与索引表最后指向同一块内存地址。
作为本发明的进一步方案,第三步中所述索引表可替换为缓存表,同时系统在Trie树上进行精准查询时,将查询结果缓存到缓存表中。
作为本发明的进一步方案,步骤(4)中所述选择淘汰具体步骤如下:
S1:依据Trie树的LRU顺序,通过LRU链表对各组启动链表头部进行进一步链接,收集最少查询的基因序列簇信息,并将该基因序列簇的启动链表安排在LRU链表的首位,并依次进行排序;
S2:在Trie树启动阶段跟踪访问信息前,内存模块在Trie树启动之前清除所有更新页表项的访问位,若在Trie树启动期间访问了某个基因序列簇,会将该基因序列簇添加到启动链表中;
S3:在Trie树启动时间结束之前,内存模块重新检查所有基因序列簇的访问位,若在其它阶段也访问某个基因序列簇,则将该基因序列簇将从启动链表中删除,并移到常规LRU链表中,确定完成后对启动链表中的各组基因序列簇进行数据更新;
S4:内存模块从LRU链表的头部选择最少查询的应用基因序列簇,并将其淘汰,同时缓存中只保存那些高频查询的基因序列簇。
作为本发明的进一步方案,步骤(5)中所述对比分析具体步骤如下:
Q1:分别给予MySQL、Redis以及Trie树10个线程数,并执行5次接口访问,分别收集50个样本数据;
Q2:分析各组样本数据,在只提供5个及以下的关键字情况下,Trie的吞吐量比MySQL与Redis高,且当给的关键字足够多,能够筛选走一部分数据时,Trie最快能到达3×104/s吞吐量;
Q3:将数据装到一台2核2G、公网带宽1Mbps的机器中,同时收集各组样本数据进行分析;
Q4:依据分析结果,Redis作为内存数据库其性能大于MySQL类别的磁盘数据库,而同样将数据存放在内存中的Trie树,其性能远大于MySQL与Redis。
相比于现有技术,本发明的有益效果在于:
该基于携带缓存Trie树加速生物基因的检索方法相较于以往的检索方法,本发明通过计算机对各组生物基因数据的基因序列进行分析,并创建Trie树根节点,之后依据分析结果将各组生物基因数据的字符录入除根节点以外的每个节点中,同时每个节点只包含一个字符,将Trie树中各组长度为一的连续分支节点压缩为一串字符串,并将其作为该Trie树索引的单一分支节点,并添加索引表或缓存表优化搜索,依据Trie树的LRU顺序,通过LRU链表对各组启动链表头部进行进一步链接,收集最少查询的基因序列簇信息,收集工作人员查询信息,并对启动链表中的各组基因序列簇进行数据更新,同时从LRU链表的头部选择最少查询的应用基因序列簇,并将其淘汰且缓存中只保存那些高频查询的基因序列簇,通过构建Trie树与哈希表结合的方式对各组生物基因数据进行查询,能够利用有限的内存空间加速基因索引的检索。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1为本发明提出的基于携带缓存Trie树加速生物基因的检索方法的流程框图。
具体实施方式
参照图1,基于携带缓存Trie树加速生物基因的检索方法,该检索方法具体步骤如下:
构建Tire树并将数据导入Tire树中:工作人员构建Tire树,同时将生物基因数据导入Tire树中进行存储。
具体的,计算机对各组生物基因数据的基因序列进行分析,并提取“MSTRG”和“CSS”两组标识,之后创建Trie树根节点,同时该根节点不包含字符,依据分析结果将各组生物基因数据的字符录入除根节点以外的每个节点中,同时每个节点只包含一个字符,当工作人员查询某一组或多组生物基因数据时,从根节点到某一节点,路径上经过的字符连接起来,为该生物基因数据对应的字符串,且每个节点的所有子节点包含的字符都不相同。
对Tire树进行性能优化:将Tire树进行压缩处理,同时生成一组索引表以对Tire树在精准匹配时效率进行性能优化。
具体的,内存模块遍历Trie树各连续分支,并将非根内部节点只有一个子节点进行标记,并将该节点视为冗余,将标记的各组长度为一的连续分支节点压缩为一串字符串,并将其作为该Trie树索引的单一分支节点,同时存储空间从标准Trie树的O(n)降低到压缩后的O(k),其中,n为Trie树中总字符串长度,k为插入基因的最长长度,同时在内存中构建一张索引表,在进行模糊查询时通过Trie树做索引查询,进行精确查找时查询索引表,且所有基因索引表在内存中只会保存一份,Trie树与索引表最后指向同一块内存地址。
需要进一步说明的是,索引表可替换为缓存表,同时系统在Trie树上进行精准查询时,会将查询结果缓存到缓存表中。
此外,需要进一步说明的是,所有基因索引表在内存中只会保存一份,Trie树与索引表最后指向同一块内存地址,且索引表中可以使用哈希算法减少因为基因序列编号太长的问题。
对基因序列簇进行缓存优化:将生成的各组基因序列簇缓存至内存中,同时通过LRU算法对各组基因序列簇进行选择淘汰。
具体的,首先系统依据Trie树的LRU顺序,通过LRU链表对各组启动链表头部进行进一步链接,收集最少查询的基因序列簇信息,并将该基因序列簇的启动链表安排在LRU链表的首位,并依次进行排序,然后在Trie树启动阶段跟踪访问信息前,内存模块在Trie树启动之前清除所有更新页表项的访问位,若在Trie树启动期间访问了某个基因序列簇,会将该基因序列簇添加到启动链表中,在Trie树启动时间结束之前,内存模块重新检查所有基因序列簇的访问位,若在其它阶段也访问某个基因序列簇,则将该基因序列簇将从启动链表中删除,并移到常规LRU链表中,确定完成后对启动链表中的各组基因序列簇进行数据更新,内存模块再从LRU链表的头部选择最少查询的应用基因序列簇,并将其淘汰,同时缓存中只保存那些高频查询的基因序列簇。
需要进一步说明的是,LRU算法实现底层数据结构使用链表与哈希表,为了优化查询效率,哈希表负责查询,链表负责淘汰元素。
对Tire树查询效率进行对比分析:收集并分析MySQL与Redis查询效率,同时检测Tire树查询效率,并将收集到的三组查询效率进行对比分析。
具体的,工作人员分别给予MySQL、Redis以及Trie树10个线程数,并执行5次接口访问,分别收集50个样本数据,之后分析各组样本数据,在只提供5个及以下的关键字情况下,Trie的吞吐量比MySQL与Redis高,且当给的关键字足够多,能够筛选走一部分数据时,Trie最快能到达3×104/s吞吐量,再将数据装到一台2核2G、公网带宽1Mbps的机器中,同时收集各组样本数据进行分析,依据分析结果,Redis作为内存数据库其性能大于MySQL类别的磁盘数据库,而同样将数据存放在内存中的Trie树,其性能远大于MySQL与Redis。
Claims (6)
1.基于携带缓存Trie树加速生物基因的检索方法,其特征在于,该检索方法具体步骤如下:
(1)构建Tire树并将数据导入Tire树中:工作人员构建Tire树,同时将生物基因数据导入Tire树中进行存储;
(2)对Tire树进行性能优化:将Tire树进行压缩处理,同时生成一组索引表以对Tire树在精准匹配时效率进行性能优化;
(3)对基因序列簇进行缓存优化:将生成的各组基因序列簇缓存至内存中,同时通过LRU算法对各组基因序列簇进行选择淘汰;
(4)对Tire树查询效率进行对比分析:收集并分析MySQL与Redis查询效率,同时检测Tire树查询效率,并将收集到的三组查询效率进行对比分析。
2.根据权利要求1所述的基于携带缓存Trie树加速生物基因的检索方法,其特征在于,步骤(1)中所述Tire树构建具体步骤如下:
步骤一:对各组生物基因数据的基因序列进行分析,并提取“MSTRG”和“CSS”两组标识;
步骤二:创建Trie树根节点,同时该根节点不包含字符,依据分析结果将各组生物基因数据的字符录入除根节点以外的每个节点中,同时每个节点只包含一个字符;
步骤三:当工作人员查询某一组或多组生物基因数据时,从根节点到某一节点,路径上经过的字符连接起来,为该生物基因数据对应的字符串,且每个节点的所有子节点包含的字符都不相同。
3.根据权利要求1所述的基于携带缓存Trie树加速生物基因的检索方法,其特征在于,步骤(2)中所述性能优化具体步骤如下:
第一步:遍历Trie树各连续分支,并将非根内部节点只有一个子节点进行标记,并将该节点视为冗余;
第二步:将标记的各组长度为一的连续分支节点压缩为一串字符串,并将其作为该Trie树索引的单一分支节点,同时存储空间从标准Trie树的O(n)降低到压缩后的O(k),其中,n为Trie树中总字符串长度,k为插入基因的最长长度;
第三步:在内存中构建一张索引表,在进行模糊查询时通过Trie树做索引查询,进行精确查找时查询索引表,且所有基因索引表在内存中只会保存一份,Trie树与索引表最后指向同一块内存地址。
4.根据权利要求3所述的基于携带缓存Trie树加速生物基因的检索方法,其特征在于,第三步中所述索引表可替换为缓存表,同时系统在Trie树上进行精准查询时,将查询结果缓存到缓存表中。
5.根据权利要求1所述的基于携带缓存Trie树加速生物基因的检索方法,其特征在于,步骤(4)中所述选择淘汰具体步骤如下:
S1:依据Trie树的LRU顺序,通过LRU链表对各组启动链表头部进行进一步链接,收集最少查询的基因序列簇信息,并将该基因序列簇的启动链表安排在LRU链表的首位,并依次进行排序;
S2:在Trie树启动阶段跟踪访问信息前,内存模块在Trie树启动之前清除所有更新页表项的访问位,若在Trie树启动期间访问了某个基因序列簇,会将该基因序列簇添加到启动链表中;
S3:在Trie树启动时间结束之前,内存模块重新检查所有基因序列簇的访问位,若在其它阶段也访问某个基因序列簇,则将该基因序列簇将从启动链表中删除,并移到常规LRU链表中,确定完成后对启动链表中的各组基因序列簇进行数据更新;
S4:内存模块从LRU链表的头部选择最少查询的应用基因序列簇,并将其淘汰,同时缓存中只保存那些高频查询的基因序列簇。
6.根据权利要求1所述的基于携带缓存Trie树加速生物基因的检索方法,其特征在于,步骤(5)中所述对比分析具体步骤如下:
Q1:分别给予MySQL、Redis以及Trie树10个线程数,并执行5次接口访问,分别收集50个样本数据;
Q2:分析各组样本数据,在只提供5个及以下的关键字情况下,Trie的吞吐量比MySQL与Redis高,且当给的关键字足够多,能够筛选走一部分数据时,Trie最快能到达3×104/s吞吐量;
Q3:将数据装到一台2核2G、公网带宽1Mbps的机器中,同时收集各组样本数据进行分析;
Q4:依据分析结果,Redis作为内存数据库其性能大于MySQL类别的磁盘数据库,而同样将数据存放在内存中的Trie树,其性能远大于MySQL与Redis。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210451340.0A CN114758727B (zh) | 2022-04-26 | 2022-04-26 | 基于携带缓存Trie树加速生物基因的检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210451340.0A CN114758727B (zh) | 2022-04-26 | 2022-04-26 | 基于携带缓存Trie树加速生物基因的检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114758727A true CN114758727A (zh) | 2022-07-15 |
CN114758727B CN114758727B (zh) | 2024-06-14 |
Family
ID=82333902
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210451340.0A Active CN114758727B (zh) | 2022-04-26 | 2022-04-26 | 基于携带缓存Trie树加速生物基因的检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114758727B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2524207A1 (en) * | 1998-07-10 | 2000-01-20 | Overture Services, Inc. | A search system and method for retrieval of data, and the use thereof in a search engine |
US20030061227A1 (en) * | 2001-06-04 | 2003-03-27 | Baskins Douglas L. | System and method of providing a cache-efficient, hybrid, compressed digital tree with wide dynamic ranges and simple interface requiring no configuration or tuning |
CN105117417A (zh) * | 2015-07-30 | 2015-12-02 | 西安交通大学 | 一种读优化的内存数据库Trie树索引方法 |
WO2017161749A1 (zh) * | 2016-03-21 | 2017-09-28 | 乐视控股(北京)有限公司 | 一种信息匹配方法及装置 |
-
2022
- 2022-04-26 CN CN202210451340.0A patent/CN114758727B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2524207A1 (en) * | 1998-07-10 | 2000-01-20 | Overture Services, Inc. | A search system and method for retrieval of data, and the use thereof in a search engine |
US20030061227A1 (en) * | 2001-06-04 | 2003-03-27 | Baskins Douglas L. | System and method of providing a cache-efficient, hybrid, compressed digital tree with wide dynamic ranges and simple interface requiring no configuration or tuning |
CN105117417A (zh) * | 2015-07-30 | 2015-12-02 | 西安交通大学 | 一种读优化的内存数据库Trie树索引方法 |
WO2017161749A1 (zh) * | 2016-03-21 | 2017-09-28 | 乐视控股(北京)有限公司 | 一种信息匹配方法及装置 |
Non-Patent Citations (1)
Title |
---|
唐军;卢正新;: "支持内存数据库索引缓存优化的CST树的设计与实现", 计算机与数字工程, no. 01, 20 January 2010 (2010-01-20) * |
Also Published As
Publication number | Publication date |
---|---|
CN114758727B (zh) | 2024-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8266147B2 (en) | Methods and systems for database organization | |
CN102521406B (zh) | 海量结构化数据复杂查询任务的分布式查询方法和系统 | |
CA2388515C (en) | System for managing rdbm fragmentations | |
CN102521405B (zh) | 支持高速加载的海量结构化数据存储、查询方法和系统 | |
JP3771271B2 (ja) | コンパクト0完全木における順序付けられたキーの集まりの記憶と検索のための装置及び方法 | |
AU608872B2 (en) | Device for enabling concurrent access of indexed sequential data files | |
US6850925B2 (en) | Query optimization by sub-plan memoization | |
AU752283B2 (en) | Method and apparatus for performing a join query in a database system | |
US6374232B1 (en) | Method and mechanism for retrieving values from a database | |
US6546394B1 (en) | Database system having logical row identifiers | |
AU2009246432B2 (en) | Managing storage of individually accessible data units | |
US11789923B2 (en) | Compression units in an index block | |
US7809674B2 (en) | Supporting B+tree indexes on primary B+tree structures with large primary keys | |
US6826563B1 (en) | Supporting bitmap indexes on primary B+tree like structures | |
US20210165808A1 (en) | Computer system and method for indexing and retrieval of partially specified type-less semi-infinite information | |
CN114758727B (zh) | 基于携带缓存Trie树加速生物基因的检索方法 | |
CN110457531A (zh) | 一种基于OpenMP的并行字符串查询方法 | |
CN115455040A (zh) | 提高数据库sql查询效率的方法、装置、设备、介质 | |
WO1992015954A1 (en) | Compaction of a querying in relational databases | |
CN116028488A (zh) | 一种大规模清单类数据管理方法及装置 | |
CN114676136B (zh) | 一种面向内存键值表的子集过滤器 | |
CN112463837B (zh) | 一种关系型数据库数据存储查询方法 | |
CN100531179C (zh) | 保存字符串匹配规则及利用保存规则进行字串匹配的方法 | |
WO2010060179A1 (en) | Methods for organizing a relational database by using clustering operations | |
CN117097821B (zh) | 基于tr069协议的基站报文参数更新存储方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |