CN101751517B - 一种基因组短序列映射的快速处理方法及系统 - Google Patents

一种基因组短序列映射的快速处理方法及系统 Download PDF

Info

Publication number
CN101751517B
CN101751517B CN200910252466.XA CN200910252466A CN101751517B CN 101751517 B CN101751517 B CN 101751517B CN 200910252466 A CN200910252466 A CN 200910252466A CN 101751517 B CN101751517 B CN 101751517B
Authority
CN
China
Prior art keywords
sequence
sequencing
short string
contig
sequencing sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200910252466.XA
Other languages
English (en)
Other versions
CN101751517A (zh
Inventor
李瑞强
朱红梅
王俊
杨焕明
汪建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Technology Solutions Co Ltd
Original Assignee
BGI Technology Solutions Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CNA2008102183374A external-priority patent/CN101430741A/zh
Application filed by BGI Technology Solutions Co Ltd filed Critical BGI Technology Solutions Co Ltd
Priority to CN200910252466.XA priority Critical patent/CN101751517B/zh
Publication of CN101751517A publication Critical patent/CN101751517A/zh
Application granted granted Critical
Publication of CN101751517B publication Critical patent/CN101751517B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明适用于基因工程技术领域,提供了一种基因组短序列映射的快速处理方法及系统,所述方法包括下述步骤:将测序序列按预设长度短串的碱基值排序;将序列片段重叠群逐个碱基切割成所述预设长度的短串;依次根据所述序列片段重叠群中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,建立映射关系。在本发明中,通过将测序序列按预设长度短串的碱基值排序,并将序列片段重叠群逐个碱基切割成预设长度的短串,依次根据序列片段重叠群中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,建立映射关系,实现了用于短序组装中的一种短序列映射,处理时间短、效率高。

Description

一种基因组短序列映射的快速处理方法及系统
技术领域
本发明属于基因工程技术领域,尤其涉及一种基因组短序列映射的快速处理方法及系统。
背景技术
对大基因组的短序列进行组装面临内存的挑战,为了降低构建deBruijn图的内存使用,组装软件可以不在内存中记录测序序列和序列片段重叠群(contig)之间的对应关系,而只在contig组装完毕后,将正确的测序序列映射到contig上。现有的短序列比对多采用计算机软件实现,主要分两类,一类使用了固定短串(kmer)的组合索引结构,另一类使用的是后缀树类样的索引结构。现有短序列对比软件可以在两个错配之内将短序列映射到contig上,但是在处理contig和短序列之间的比对时,处理时间长、效率低,不能很好地满足短序列组装中的需求。
发明内容
本发明一个目的在于提供一种基因组短序列映射的快速处理方法和系统,旨在减少contig和短序列之间的比对过程的处理时间、提高效率。
基于上述目的,本发明提供的一种基因组短序列的快速处理映射方法,所述方法包括下述步骤:
将测序序列按预设长度短串的碱基值排序;
将序列片段重叠群逐个碱基切割成所述预设长度的短串;
依次根据所述序列片段重叠群中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,建立映射关系。
基于上述目的,本发明提供的基因组短序列的快速处理映射系统,所述系统包括:
排序单元,用于将测序序列按预设长度短串的碱基值排序;
切割单元,用于将序列片段重叠群逐个碱基切割成所述预设长度的短串;以及
映射单元,用于依次根据所述序列片段重叠群中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,建立映射关系。
在本发明实施例中,通过将测序序列按预设长度短串的碱基值排序,并将contig逐个碱基切割成预设长度的短串,依次根据contig中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,建立映射关系,本发明技术方案从contig和参与拼接的序列之间的比对出发,利用基于de Bruijn图组装出contig所具有的在定长的短串上不存在重复的特点,实现了用于短序列组装中的短序列映射,所需处理时间明显缩短、效率大幅提高。
附图说明
图1是本发明实施例提供的基因组短序列映射的快速处理方法的实现流程图;
图2是本发明实施例提供的基因组短序列映射的快速处理系统的结构图;
图3是本发明另一实施例提供的基因组短序列映射的快速处理系统的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明实施例中,通过将测序序列按预设长度短串的碱基值排序,并将contig逐个碱基切割成预设长度的短串,依次根据contig中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,建立映射关系。
图1示出了本发明实施例提供的基因组短序列映射的快速处理方法的实现流程,详述如下:
在步骤S101中,将测序序列按预设长度短串的碱基值排序。
在本发明实施例中,短串长度的选取严格等于在构建de Bruijn图时短串的长度,即上述预设长度为构建de Bruijn图时短串的长度。将测序序列按短串的碱基值排序,可以降低排序的复杂性。按预设长度切割各测序序列的短串,并从小到大按短串的碱基值排序,生成一个短串数组,这个短串数组和各测序序列是一一对应的。其中,所述按预设长度切割各测序序列的短串的步骤可以采用如下方式:在当前被切割的测序序列上滑动截取短串,滑动的步长为1个碱基,截取的窗口为所述预设长度,即构建de Bruiin图时短串的长度。
另外,本步骤中,优选可以建立一个索引数组,用于记录短串数组中短串与contig的对应关系。
在对短串进行排序时,可以使用桶排序方式对短串的碱基值进行排序。其中,每个桶子存放短串上的4个碱基,这样按4个碱基逐步完成排序。另外,在排序中使用另一个前缀数组记录相邻短串间共有前缀的碱基个数,对前缀碱基个数的记录可以在桶排序内部完成。当然,也可以采用其他方法对短串的碱基值进行排序。
在步骤S102中,将contig逐个碱基切割成所述预设长度的短串。
在本发明实施例中,本步骤可采用如下方式:提取contig保存在内存中,在contig上滑动截取短串,滑动的步长为1个碱基,截取的窗口为所述预设长度,即构建de Bruijn图时短串的长度。
由于构建de Bruijn图时短串是唯一的,所以按照构建de Bruijn图时短串的长度将contig逐个碱基切割成的各个短串是唯一的。
在步骤S103中,依次根据contig中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,建立contig与测序序列的映射关系。
上述步骤S103具体包括:
步骤S1.依次取contig切割得到的短串;
步骤S2.在排序后的测序序列中查找短串的碱基值与contig中所取短串的碱基值相等的所有测序序列;
步骤S3.通过查询所述索引数组,在步骤S2查找到的测序序列与contig间建立映射关系。
在本发明实施例中,步骤S3具体包括:利用索引数组保存的短串数组中短串与contig的对应关系,根据步骤S2中查找到的测序序列中的短串在所述索引数组中查询对应的contig,建立短串对应的测序序列与contig之间的映射关系。
在本发明实施例中,步骤S2中采用二分法在短串数组中查找与contig中所取短串的碱基值相等的短串,实现短串间的比较,算法详述如下:
初始化:将起始位置L置为0,结束位置R设为N-1,最小共有前缀数l、最大共有前缀数r都置为0;
步骤1.判断contig中所取短串W是否小于短串数组的短串A[0],如果是返回不匹配的响应,否则进入步骤2;
步骤2.判断contig中所取短串W是否大于短串数组的第N个短串A[N-1],如果是则返回不匹配的响应,否则进入步骤3;
步骤3.判断L+1是否小于结束位置R,如果是则进入步骤4,否则进入步骤8;
步骤4.查找中间位置M取为
Figure G200910252466XD00041
碱基判断位置m取最小共有前缀数l和最大共有前缀数r二者中的最小值;其中,m是L和R之间的最大共有前缀数。
步骤5.判断短串W的第m个碱基值Wm是否小于或等于查找中间位置短序的第m个碱基值A[M]m,如果是则进入步骤6,否则进入步骤7;
步骤6.结束位置R向前移动到查找中间位置M,用短串W与短序A[M]的共有前缀数更新最大共有前缀数r,进入步骤3;
步骤7.起始位置L向后移动到查找中间位置M,用短串W与短序A[M]的共有前缀数更新最大共有前缀数l,进入步骤3;
步骤8.将起始位置L赋值为结束位置R。
A[R]即为查找到的短串,结合已经建立的前缀数组,找出A[R]前后碱基值均与其相等的短串。再根据索引数组即可以得到这些短串对应的测序序列,进一步建立得到的这些测序序列与contig的映射。当然,也可以根据其他查询方法在短串数组中查找与contig中所取短串的碱基值相等的短串。
由于在生物学上,互补序列上的映射关系也是构成该contig的序列的正确关系,为了同时得到contig的互补序列与测序序列的映射,作为本发明的一个优选实施例,在步骤S101前进一步包括:根据测序序列得到其互补测序序列的步骤。
此时,步骤S101改为将测序序列和得到的互补测序序列按预设长度短串的碱基值排序;步骤S103改为依次根据contig中所切割成的短串的碱基值在排序后的测序序列及其互补测序序列中查找相应的测序序列和/或互补测序序列,建立映射关系。将测序序列及其互补测序序列按短串的碱基值排序,实现contig与测序序列间的正、反相映射,减少了比较搜索的次数,处理速度加快。
为了同时得到互补contig与测序序列的映射,作为本发明的另一个优选实施例,在上述步骤S102之前进一步根据contig得到其互补contig。此时,步骤S102为将contig和得到的互补contig逐个碱基切割成预设长度的短串,步骤S103为依次根据contig和得到的互补contig中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,建立映射关系。
对比上述通过对contig逐个碱基在排序后的测序序列及其互补测序序列中查找,实现contig与测序序列的正、反相映射的方式,这里通过对contig及其互补contig逐个碱基执行两次切割、查找操作实现。
本发明上面两个优选实施例中所采取的这种正反向截取的方式,虽然使用了更多的内存,但是测序序列查询时,只查询一个方向就可以找出双向的比对结果,速度得到了提高。如果截取单向的话,在查询时需要将测序序列正方向都查询,才能得到结果。
本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以在存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等,该程序用来执行如下步骤:
1.将测序序列按预设长度短串的碱基值排序;
2.将contig逐个碱基切割成预设长度的短串;
3.依次根据contig中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,建立映射关系。
图2示出了本发明实施例提供的基因组短序列映射的快速处理系统的结构,为了便于说明仅示出了与本发明实施例相关的部分,该系统可以用于短序列组装中,其中:
排序单元201,用于将测序序列按预设长度短串的碱基值排序,其实现方式可参见上述步骤S101的内容,不再赘述。
切割单元202,用于将contig逐个碱基切割成预设长度的短串,其实现方式可参见上述步骤S102的内容,不再赘述。
映射单元203,依次根据contig中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,建立映射关系。
其中,映射单元203包括:
短串获取模块2031,用于依次取contig切割得到的短串。
查找模块2032,在排序后的测序序列中查找短串的碱基值与短串获取模块2031所取短串的碱基值相等的所有测序序列,其实现方式参见上述步骤S2,不再赘述。
关联模块2033,在查找到的测序序列与contig间建立映射关系,其实现方式参见上述步骤S3,不再赘述。
为了同时得到contig与测序序列的反相映射,作为本发明的一个优选实施例,短序列映射系统还包括:
第一互补计算单元204,根据测序序列得到其互补测序序列。
此时,排序单元201将测序序列和得到的互补测序序列按预设长度短串的碱基值排序,映射单元203依次根据contig中所切割成的短串的碱基值在排序后的测序序列及其互补测序序列中查找相应的测序序列和/或互补测序序列,在查找到的测序序列和/或互补测序序列与所述序列片段重叠群间建立映射关系。即查找相应的测序序列,在查找到的测序序列与所述contig间建立映射关系;或者查找相应的互补测序序列,在查找到的互补测序序列与所述contig间建立映射关系;或者查找相应的测序序列,并查找相应的互补测序序列,查找到的测序序列与所述contig间建立映射关系,并同时在查找到的互补测序序列与所述contig间建立映射关系。
为了同时得到互补contig与测序序列的映射,作为本发明的另一个优选实施例,如图3所示,短序列映射系统还包括:
第二互补计算单元205,根据contig得到其互补contig。
此时,切割单元202将contig和得到的互补contig逐个碱基切割成预设长度的短串,映射单元203依次根据contig和得到的互补contig中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,建立映射关系。
在本发明实施例中,通过将测序序列按预设长度短串的碱基值排序,并将contig逐个碱基切割成预设长度的短串,依次根据contig中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,建立映射关系,实现了用于短序组装中的一种短序列映射方法,处理时间短、效率高。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种基因组短序列映射的快速处理方法,其特征在于,所述方法包括下述步骤:
将测序序列按预设长度短串的碱基值排序;
将序列片段重叠群逐个碱基切割成所述预设长度的短串;
依次根据所述序列片段重叠群中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,在查找到的测序序列与所述序列片段重叠群间建立映射关系;
所述预设长度为构建de Bruijn图时短串的长度。
2.如权利要求1所述的方法,其特征在于,所述依次根据所述序列片段重叠群中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,在查找到的测序序列与所述序列片段重叠群间建立映射关系的步骤具体为:
依次取所述序列片段重叠群切割得到的短串;
在排序后的测序序列中查找短串的碱基值与序列片段重叠群中所取短串的碱基值相等的所有测序序列;
在查找到的测序序列与所述序列片段重叠群间建立映射关系。
3.如权利要求2所述的方法,其特征在于,采用二分法在所述排序后的测序序列中查找短串的碱基值与所述序列片段重叠群中所取短串的碱基值相等的测序序列。
4.如权利要求1所述的方法,其特征在于,在所述将测序序列按预设长度短串的碱基值排序的步骤前,所述方法还包括:
根据所述测序序列得到其互补测序序列;
所述将测序序列按预设长度短串的碱基值排序的步骤为:
将测序序列和得到的互补测序序列按所述预设长度短串的碱基值排序;
所述依次根据所述序列片段重叠群中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,在查找到的测序序列与所述序列片段重叠群间建立映射关系的步骤为:
依次根据所述序列片段重叠群中所切割成的短串的碱基值在排序后的测序序列及其互补测序序列中查找相应的测序序列和/或互补测序序列,在查找到的测序序列和/或互补测序序列与所述序列片段重叠群间建立映射关系。
5.如权利要求1所述的方法,其特征在于,在所述将序列片段重叠群逐个碱基切割成所述预设长度的短串的步骤前,所述方法还包括:
根据所述序列片段重叠群得到其互补序列片段重叠群;
所述将序列片段重叠群逐个碱基切割成所述预设长度的短串的步骤为:
将序列片段重叠群和得到的互补序列片段重叠群逐个碱基切割成所述预设长度的短串;
所述依次根据所述序列片段重叠群中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,建立映射关系的步骤为:
依次根据所述序列片段重叠群和得到的互补序列片段重叠群中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,在查找到的测序序列与所述序列片段重叠群间建立映射关系。
6.如权利要求1所述的方法,其特征在于,所述将测序序列按预设长度短串的碱基值排序步骤为使用桶排序方式对短串的碱基值进行排序。
7.如权利要求1所述的方法,其特征在于,所述将测序序列按预设长度短串的碱基值排序过程中进一步包括:建立一个索引数组,用于记录短串数组中短串与所述序列片段重叠群的对应关系;
在查找到的测序序列与所述序列片段重叠群间建立映射关系的步骤包括:通过查询所述索引数组,在查找到的测序序列与所述序列片段重叠群间建立映射关系。
8.一种基因组短序列映射的快速处理系统,其特征在于,所述系统包括:
排序单元,用于将测序序列按预设长度短串的碱基值排序;其中,所述预设长度为构建de Bruijn图时短串的长度;
切割单元,用于将序列片段重叠群逐个碱基切割成所述预设长度的短串;以及
映射单元,用于依次根据所述序列片段重叠群中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,在查找到的测序序列与所述序列片段重叠群间建立映射关系。
9.如权利要求8所述的系统,其特征在于,所述映射单元包括:
短串获取模块,用于依次取所述序列片段重叠群切割得到的短串;
查找模块,用于在排序后的测序序列中查找短串的碱基值与所述短串获取模块所取短串的碱基值相等的所有测序序列;以及
关联模块,用于在查找到的测序序列与所述序列片段重叠群间建立映射关系。
10.如权利要求8所述的系统,其特征在于,所述系统还包括:
第一互补计算单元,用于根据所述测序序列得到其互补测序序列;
所述排序单元具体是用于将测序序列和得到的互补测序序列按所述预设长度短串的碱基值排序,所述映射单元具体是用于依次根据所述序列片段重叠群中所切割成的短串的碱基值在排序后的测序序列及其互补测序序列中查找相应的测序序列和/或互补测序序列,在查找到的测序序列和/或互补测序序列与所述序列片段重叠群间建立映射关系。
11.如权利要求8所述的系统,其特征在于,所述系统还包括:
第二互补计算单元,用于根据所述序列片段重叠群得到其互补序列片段重叠群;
所述切割单元具体是用于将序列片段重叠群和得到的互补序列片段重叠群逐个碱基切割成所述预设长度的短串,所述映射单元具体是用于依次根据所述序列片段重叠群和得到的互补序列片段重叠群中所切割成的短串的碱基值在排序后的测序序列中查找相应的测序序列,在查找到的测序序列与所述序列片段重叠群间建立映射关系。
CN200910252466.XA 2008-12-12 2009-12-11 一种基因组短序列映射的快速处理方法及系统 Active CN101751517B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910252466.XA CN101751517B (zh) 2008-12-12 2009-12-11 一种基因组短序列映射的快速处理方法及系统

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CNA2008102183374A CN101430741A (zh) 2008-12-12 2008-12-12 一种短序列映射方法及系统
CN200810218337.4 2008-12-12
CN200910252466.XA CN101751517B (zh) 2008-12-12 2009-12-11 一种基因组短序列映射的快速处理方法及系统

Publications (2)

Publication Number Publication Date
CN101751517A CN101751517A (zh) 2010-06-23
CN101751517B true CN101751517B (zh) 2014-02-26

Family

ID=42478492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910252466.XA Active CN101751517B (zh) 2008-12-12 2009-12-11 一种基因组短序列映射的快速处理方法及系统

Country Status (1)

Country Link
CN (1) CN101751517B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103014137B (zh) * 2011-09-22 2015-01-07 深圳华大基因科技服务有限公司 一种分析基因表达定量的方法
EP2626802B1 (en) * 2012-02-10 2016-11-16 Tata Consultancy Services Limited Assembly of metagenomic sequences
CN102682226B (zh) * 2012-04-18 2015-09-30 盛司潼 一种核酸测序信息处理系统及方法
CN102867134B (zh) * 2012-08-16 2016-05-18 盛司潼 一种对基因序列片段进行拼接的系统和方法
CN103093121B (zh) * 2012-12-28 2016-01-27 深圳先进技术研究院 双向多步deBruijn图的压缩存储和构造方法
KR101584857B1 (ko) * 2013-09-03 2016-01-12 삼성에스디에스 주식회사 염기 서열 정렬 시스템 및 방법
CN103984879B (zh) * 2014-03-14 2017-03-29 中国科学院上海生命科学研究院 一种测定待测基因组区域表达水平的方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0967291A1 (en) * 1998-06-08 1999-12-29 The Board of Trustees of The Leland S. Stanford Junior University Method for parallel screening of allelic variation
CN1360057A (zh) * 2001-11-16 2002-07-24 北京华大基因研究中心 一种基于重复序列识别的全基因组测序数据的拼接方法
CN1662662A (zh) * 2002-06-17 2005-08-31 英特尔公司 通过信号扩展和数据整合进行的核酸测序
CN101196921A (zh) * 2007-12-24 2008-06-11 北京大学 用于近似查询的长序列数据降维方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0967291A1 (en) * 1998-06-08 1999-12-29 The Board of Trustees of The Leland S. Stanford Junior University Method for parallel screening of allelic variation
CN1360057A (zh) * 2001-11-16 2002-07-24 北京华大基因研究中心 一种基于重复序列识别的全基因组测序数据的拼接方法
CN1662662A (zh) * 2002-06-17 2005-08-31 英特尔公司 通过信号扩展和数据整合进行的核酸测序
CN101196921A (zh) * 2007-12-24 2008-06-11 北京大学 用于近似查询的长序列数据降维方法

Also Published As

Publication number Publication date
CN101751517A (zh) 2010-06-23

Similar Documents

Publication Publication Date Title
CN101751517B (zh) 一种基因组短序列映射的快速处理方法及系统
Clerry Compact hash tables using bidirectional linear probing
CN101594319B (zh) 表项查找方法和装置
CN1838124A (zh) 海量数据内存数据库中快速定位的网格+t树索引的方法
CN107798054A (zh) 一种基于Trie的范围查询方法及装置
CN109471905B (zh) 一种支持时间范围和属性范围复合查询的区块链索引方法
CN101430741A (zh) 一种短序列映射方法及系统
US7873041B2 (en) Method and apparatus for searching forwarding table
CN1809826A (zh) 使用位矢量索引的多维数据对象搜索
CN1908588A (zh) 一种基于小网格路网组织结构的快速地图匹配方法
CN102456055B (zh) 兴趣点检索的方法及装置
CN101329680B (zh) 句子层面的大规模快速匹配方法
Almodaresi et al. PuffAligner: a fast, efficient and accurate aligner based on the Pufferfish index
CN102890719B (zh) 一种对车牌号进行模糊搜索的方法及装置
CN101256579A (zh) 一种数据库范围查询数据组织的方法
US20130307710A1 (en) Compression match enumeration
CN102306202B (zh) 一种基于街区距离的高维向量快速检索算法
CN101079074A (zh) 一种数据存储与检索的方法及系统
CN1859208A (zh) 一种tcam路由表管理方法和系统
CN1776688A (zh) 一种字符数据的检索方法
CN102207935A (zh) 用于创建索引的方法和系统
CN103064841A (zh) 检索装置和检索方法
CN111339381A (zh) 一种字典序分区双数组的字符串批量查询方法及装置
CN102222093B (zh) 一种获取字符串最长公共子串的方法
CN103500165A (zh) 一种结合聚类和双key值的高维向量检索方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: BGI TECHNOLOGY SOLUTIONS CO., LTD.

Free format text: FORMER OWNER: BGI-SHENZHEN

Effective date: 20130703

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20130703

Address after: 518083 science and Technology Pioneer Park, comprehensive building, Beishan Industrial Zone, Yantian District, Guangdong, Shenzhen 201

Applicant after: BGI Technology Solutions Co., Ltd.

Address before: Beishan Industrial Zone Building in Yantian District of Shenzhen city of Guangdong Province in 518083

Applicant before: BGI-Shenzhen

C14 Grant of patent or utility model
GR01 Patent grant