CN110312825A - 隐藏核酸内存在的信息 - Google Patents
隐藏核酸内存在的信息 Download PDFInfo
- Publication number
- CN110312825A CN110312825A CN201780073821.XA CN201780073821A CN110312825A CN 110312825 A CN110312825 A CN 110312825A CN 201780073821 A CN201780073821 A CN 201780073821A CN 110312825 A CN110312825 A CN 110312825A
- Authority
- CN
- China
- Prior art keywords
- nucleic acid
- bar code
- sequence
- bar
- target nucleic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 462
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 436
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 436
- 238000000034 method Methods 0.000 claims abstract description 91
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 29
- 238000004458 analytical method Methods 0.000 claims description 47
- 108091034117 Oligonucleotide Proteins 0.000 claims description 14
- 239000002253 acid Substances 0.000 claims description 14
- 238000009395 breeding Methods 0.000 claims description 12
- 230000001488 breeding effect Effects 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 10
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 9
- 201000010099 disease Diseases 0.000 claims description 9
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 9
- 108091008146 restriction endonucleases Proteins 0.000 claims description 9
- 238000012300 Sequence Analysis Methods 0.000 claims description 5
- 238000001976 enzyme digestion Methods 0.000 claims description 3
- 238000007789 sealing Methods 0.000 claims description 3
- 230000029087 digestion Effects 0.000 claims 2
- 239000000463 material Substances 0.000 description 74
- 238000005516 engineering process Methods 0.000 description 37
- 238000004590 computer program Methods 0.000 description 12
- 238000012163 sequencing technique Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 9
- 239000002773 nucleotide Substances 0.000 description 8
- 125000003729 nucleotide group Chemical group 0.000 description 8
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 230000003321 amplification Effects 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 6
- 108020004414 DNA Proteins 0.000 description 5
- 241000196324 Embryophyta Species 0.000 description 5
- 238000013500 data storage Methods 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 206010028980 Neoplasm Diseases 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 239000002777 nucleoside Substances 0.000 description 4
- 125000003835 nucleoside group Chemical group 0.000 description 4
- 238000006116 polymerization reaction Methods 0.000 description 4
- 108700020463 BRCA1 Proteins 0.000 description 3
- 102000036365 BRCA1 Human genes 0.000 description 3
- 101150072950 BRCA1 gene Proteins 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- -1 cytimidine Chemical compound 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 229910052802 copper Inorganic materials 0.000 description 2
- 239000010949 copper Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000005670 electromagnetic radiation Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000011005 laboratory method Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241000218636 Thuja Species 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 1
- 238000003975 animal breeding Methods 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000009189 diving Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 210000005075 mammary gland Anatomy 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000008775 paternal effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/66—General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B70/00—Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B20/00—Methods specially adapted for identifying library members
- C40B20/04—Identifying library members by means of a tag, label, or other readable or detectable entity associated with the library members, e.g. decoding processes
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Plant Pathology (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Immunology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明涉及与核酸序列内存在的遗传信息的隐藏相关的方法,其中个体核酸分子带有条形码。在某些实施方式中,条形码的添加在富集之前、之后或期间进行。然后将带条形码的核酸与带条形码的对照核酸组合。提供了用于添加条形码和合并的不同方法,以隐藏核酸中存在的不同类型的遗传信息。
Description
对相关申请的引用
本申请要求2016年10月24日提交的美国临时专利申请系列号62/411,998的优先权权益,所述美国临时专利申请通过引用并入本文。
背景技术
核酸可以提供关于所述核酸所源自的生物体的遗传信息(例如疾病风险)。这种遗传信息可用于识别个体,从而对获得遗传信息并同时维护个体的隐私提出了挑战。例如,使用来自于遗传关联性研究的数据,所述遗传关联性研究的参与者可以是可识别的,并且可以估算他们的疾病风险。这可能也对核酸在临床评估中的使用提出了挑战,因为患者在经历遗传测试时可能害怕被识别。植物和/或动物繁育者也可能对核酸的隐藏感兴趣。这些繁育者可以从它们的繁育物的核酸搜寻遗传信息,但是也可以对隐藏关于那些繁育物和/或繁育方法的信息有兴趣。类似地,开发用于工业和/或医学目的的微生物的人员可能从向潜在对手隐藏核酸获益。此外,核酸作为数据储存介质的用途可以是隐藏作为核酸储存的信息的正当理由。
为了缓和与人类的基因组隐私相关的问题,研究人员已提出了各种不同的解决方案,包括:知情同意书,基因组数据的加密,基因组数据共享的限制,和对象决定退出数据库的能力。所有这些方法仅适用于核酸序列数据而不是核酸本身。
严重缺乏在分析之前维护核酸隐私的方法。在分析之前,个体样品可以使它们的核酸带有条形码标签,使用单一条形码识别整个样品。通过将这些样品合并并且只使用所述条形码(并且不使用姓名或其他标识符)识别它们,提供了一定限度的隐藏。然而,有权访问所述序列数据的对手能够直接观察到被合并的样品的数目,并且知道每个样品的基因型。然后可以使用这些基因型来识别样品的起源,并作出关于所述样品的特性的预测。
此外,核酸可用作数据存储介质。在这种情况下,所述数据需要测序仪来恢复和/或转变所述数据的介质(例如转变成数字格式)。如果对手有权访问所述序列数据,则储存在核酸中的数据的隐藏将是有用的。在这些或相似的情况下,模糊并隐藏所述核酸中存在的数据的类型或形式将是有用的。
因此,对于在分析之前隐藏核酸本身的方法,存在着尚未满足的需求。通过隐藏核酸,可以然后将它们送出由第三方进行分析,同时将从感兴趣的核酸提供的信息最少化。
发明内容
本文中描述的技术涉及核酸的制备。本文中描述的方法涉及核酸在分析(例如测序)之前的隐藏。在某些实施方式中,所述核酸的来源的身份被隐藏,使所述核酸匿名。在某些实施方式中,核酸的存在被隐藏。在某些实施方式中,核酸内包含的与生物体的特性相关的信息被隐藏。在某些实施方式中,分析所述核酸的潜在目的被隐藏。在某些实施方式中,被用作信息存储介质的核酸内的信息被隐藏。在某些实施方式中,本文中描述的方法涉及核酸在分析之前的富集。
一方面,本文中描述的技术涉及一种在序列分析之前制备核酸,以便所述核酸被隐藏和/或模糊和/或匿名的方法。所述方法包括:
(a)在安全设施中生成由核酸构成的条形码的集合并将它们发送给消费者,使得所述条形码的性质对于除了所述消费者之外的每个人而言是隐藏的;
(b)将所述条形码附加到待分析的核酸;以及
(c)将带条形码的核酸与其他带条形码的核酸组合,以在分析之前隐藏它们的信息。
用于在步骤(a)中安全地生成材料的方法
在某些实施方式中,所述条形码和它们的相关接头、标记或其他核酸或起到帮助隐藏核酸的作用的化学品,在确保没有任何监控设备并且与安全设施外部没有任何形式的通讯的设施内生成。在某些实施方式中,所述安全设施被电磁屏蔽例如法拉第笼包围,以阻止不想要的电磁通讯。在某些实施方式中,所述设施内的设备和机器被电磁屏蔽包围。在某些实施方式中,所述安全设施在设施外部缺少通讯电缆,例如铜质电话线或光纤电缆。在某些实施方式中,这种设施中的电子设备将缺少与所述设施外部的任何物体的任何连接,并且与外部世界是“气隙的(air-gapped)”。在某些实施方式中,在所述设施中工作的个体不允许携带任何类型的记录设备例如照相机。在某些实施方式中,所述安全设施作为建筑物存在,而在其他实施方式中,所述安全设施作为建筑物中的房间或一组房间存在。
在某些实施方式中,条形码序列的集合将由计算机随机生成,确保所述集合中的每个条形码是独一无二的,并且关于所述集合中的任何条形码的知识不能以任何形式预测所述集合中的其他条形码。在某些实施方式中,关于条形码集合中的某些条形码的知识可用于对所述集合中其他条形码的序列作出有限量的预测。在这些实施方式中,对于给定安全环境来说容许的关于条形码集合的预测的量,在某些实施方式中可以由本领域技术人员测量。然后将这个条形码集合分成许多子集。每个子集将用独特的标识符标记,并且也在计算机上生成将这些标识符匹配到所述条形码的表格。将所述条形码的表格放置在安全数据转移装置例如CD-ROM、DVD-ROM或闪存驱动器上。在某些实施方式中,所述条形码识别表格也被印刷在介质例如纸上。
在某些实施方式中,在生成条形码之前检查所述条形码集合,以确保所述条形码的序列不可能干扰它们在本发明的任何其他步骤中的用途。这种比较可以通过计算机程序来实现,所述程序可以通过本领域技术人员已知的方法来产生。在某些实施方式中,在生成任何条形码序列之前产生对使用来说不理想的条形码的序列,并将所述不理想的条形码的序列用于在条形码生成之前过滤所述条形码序列的集合。
在某些实施方式中,将关于所述条形码的信息转移到用于生成所述条形码以及它们的相关接头、标记或在本技术中使用的其他材料的机器。任何机器和/或计算机之间的所有信息转移将使用屏蔽电磁辐射的电线来进行,防止信息从所述电线泄漏。在其他实施方式中,产生所述随机条形码集合的计算机被并入到用于生成所述随机条形码的一个或多个机器中。在这些实施方式中,屏蔽所述整个机器以免受电磁辐射影响将防止关于所述条形码的信息被检测。
所述条形码和它们的相关材料将被生成并放置在它们自己的容器例如试管或微孔板的孔中。这些容器被标记和/或标识,以便可以使用由计算机产生的所述条形码的表格来查找条形码身份。
在某些实施方式中,将带条形码的材料的子集与它的条形码表格一起放置在容器中。然后将这个容器以某种方式密封,以便指示它是否已被打开或以其他方式篡改,例如使用在盒子已被打开之后不能重新密封的密封物进行密封。在某些实施方式中,这种容器也可以含有其他核酸,其可用于在本技术的其他步骤中与核酸合并。在某些实施方式中,包含的所述核酸可以带有条形码,可以部分带有条形码,或者可以不带有条形码。在某些实施方式中,在这个容器中提供了用于指导这种技术的使用的软件和/或文件。
在某些实施方式中,所述条形码不是完全独一无二的。在某些实施方式中,所述条形码的子集含有存在于其他子集中的某些条形码。在某些这些实施方式中,这些不是完全独一无二的条形码的集合的生成也可以由计算机指导。在其他实施方式中,所述条形码以某种方式完全随机地生成,使得它们的序列部分或完全已知,并且关于所述条形码序列的信息被安全地记录。在这些实施方式中,关于所述随机生成的条形码的信息将被安全地放置在安全数据转移装置例如CD-ROM、DVD-ROM或闪存驱动器上。在这些实施方式中,所述条形码生成的真正随机性将被检查,以确保所述集合中某些条形码的知识不提供关于所述集合中其他条形码的信息或仅提供关于其他条形码的极少信息,以满足所述消费者所需的安全标准。在这些实施方式中,对每组条形码应用可以除去不想要的条形码的过滤过程,以确保所述条形码不干扰本发明中的其他步骤。
用于在步骤(b)中添加条形码的方法
在某些实施方式中,使用由美国专利公布US 2015/0211050和美国专利公布2015/0211061所描述的技术,在富集之前或期间将条形码添加到核酸,所述专利公布两者都通过引用并入本文。
在某些实施方式中,通过连接来添加条形码,并且随后不进行富集。在某些实施方式中,通过连接添加条形码可以在条形码已经存在时进行。在某些实施方式中,所述条形码分子含有便于所述条形码与其他核酸的连接的接头。在某些实施方式中,可以使用粘性末端连接例如TA连接来连接带有接头的条形码。
在某些实施方式中,在添加条形码之前使用限制性酶来消化核酸。在某些实施方式中,限制性酶消化产生粘性末端。在这些实施方式中,所述条形码上的接头含有与所述限制性酶产生的粘性末端相对应的粘性末端,以便于所述条形码的连接。
在某些实施方式中,不是所有的靶和/或诱饵核酸都带有条形码。在某些实施方式中,随机数量的核酸带有条形码。在某些实施方式中,利用分子生物学技术固有的随机性为某些核酸随机添加条形码。在某些实施方式中,利用计算机来估算从靶核酸获得必要信息所必需的添加条形码的量,并比较添加条形码和合并的方法以估算通过这些方法获得的隐私性。在某些实施方式中,计算机指导待添加条形码的核酸的随机比例。
用于在步骤(c)中组合带条形码的核酸的方法
在某些实施方式中,将待隐藏的带条形码的核酸与相似的带条形码的核酸(即对照和/或诱饵核酸序列)合并。例如,对照核酸可以是源自于同一物种中的相同基因,但源自于不同个体的核酸。在某些实施方式中,被合并的核酸与在相关群体中存在的核酸相似,并且也与待隐藏的核酸相似。例如,源自于相同基因并源自于群体内的同一种族的核酸。在某些实施方式中,将所述带条形码的核酸与含有相对高比例的可以预示潜在特性的核酸的其他带条形码的核酸合并。例如,将所述带条形码的核酸与具有高比例的疾病携带变体的带条形码的核酸合并,所述比例比在种族匹配的群体中存在的疾病携带变体的比例更高。
在某些实施方式中,将所述待隐藏的核酸的来源的父母和/或与其密切相关的其他个体的核酸添加条形码,并与所述待隐藏的带条形码的核酸合并。在某些实施方式中,来自于所述亲属的核酸的使用量比待隐藏的核酸的量高得多。在某些实施方式中,调整不同核酸的相对量,使得它们的比例在不同的亲属与待隐藏的核酸之间不同。在某些实施方式中,将一组待隐藏的核酸添加条形码并彼此合并。在某些实施方式中,将不需要隐藏并且令所述消费者不感兴趣的一组核酸与所述感兴趣的带条形码的核酸合并。在这些实施方式中,与所述感兴趣的核酸合并的核酸的合并物受到良好控制。在这些情况下,可以选择特定核酸以优化隐藏。在这些实施方式中,进行大量不感兴趣的分析以便隐藏对感兴趣的核酸的分析。
在某些实施方式中,核酸被用于储存数据,例如使用脱氧核糖核酸作为数据存储介质。在某些实施方式中,将这些储存数据的核酸添加条形码并与其他储存数据的核酸合并。在某些实施方式中,将这些储存数据的核酸与不含令所述消费者感兴趣的数据的其他核酸合并。
本发明的一个实施方式涉及一种用于制备分析用靶核酸序列的方法,所述方法包括生成包含核酸的条形码的集合;将所述条形码添加到所述待分析的靶核酸序列;以及将所述待分析的带条形码的靶核酸序列与包含条形码的对照或诱饵核酸序列组合或合并。
本发明的另一个实施方式涉及一种用于使靶核酸序列匿名的方法,所述方法包括生成包含核酸的条形码的集合;将所述条形码添加到所述靶核酸序列;以及将所述带条形码的靶核酸序列与包含条形码的对照或诱饵核酸序列组合或合并,其中所述带条形码的靶核酸序列与所述对照或诱饵核酸序列的组合使所述靶核酸序列匿名。
在某些实施方式中,将随机量的带条形码和/或不带条形码的靶核酸和/或随机量的带条形码和/或不带条形码的诱饵核酸合并,用于测序。在这些实施方式中,待合并的量的随机性可以由随机化因子例如硬币、一套骰子或由本领域技术人员设计的计算机程序来确定。在这些实施方式中,随机性的量和/或确定随机量的方法由本领域技术人员设计,以确保通过所述合并实现所述消费者所要求的隐私性的量。
在某些实施方式中,期望由于分子生物学方法的不可预测的本性而产生随机性。作为一个实例,当使用聚合酶链反应扩增核酸时,所靶向的核酸的准确的拷贝数是未知的(但可以在边际误差内预测)。作为另一个实例,当溶液中存在的核酸的量未知但同样以一定的边际误差预测时,将该核酸溶液与其他核酸合并产生的核酸合并物中每种寡核苷酸的准确量不能确定地知道。在某些实施方式中,通过将一组核酸合并并除去该合并物中的一部分,产生来自于该合并物的随机选择来获得随机性。在某些实施方式中,估算在分子生物学方法中出现的随机性,以预测该随机性将如何影响在本发明中使用的隐私和/或隐藏。
附图说明
图1A-1C描绘了本文中所描述的用于添加条形码(图1A)和合并核酸(图1B),以便对无权访问条形码表格的个体隐藏它们的信息(图1C)的工作流程图。
图2描绘了本文中所描述的用于条形码和用于将这些条形码添加到核酸或在核酸已添加条形码后将核酸隐藏的任何相关材料的安全生成的工作流程图。
图3描绘了本文中所描述的使用核酸的大量可能的潜在条形码的说明。
图4描绘了本文中所描述的用于生成条形码的子集,然后将其与条形码表格分开地放置在容器中的工作流程图,所述条形码表格可用于确定哪些条形码存在于哪些容器中。
图5描绘了本文中所描述的使用条形码的子集来生成带条形码的核酸,并使用其他带条形码的核酸通过将它们合并在一起进行隐藏的工作流程图。
图6A和图6B描绘了本文中所描述的使用粘性末端连接将条形码附加到核酸的工作流程图。
具体实施方式
当在本文中使用时,术语“隐藏”意味着隐藏信息,特别是对于核酸中包含的信息而言。“隐藏”这种隐藏信息的行动,可以通过各种不同方法来实现,每种方法隐藏核酸中存在的不同信息。这些方法包括但不限于:降低检测已知源自于特定来源的核酸的存在的能力,降低确定核酸的来源中存在的特性的能力,降低确定哪些核酸源自于哪些来源的能力,降低获得储存在核酸中的任何数据的能力,降低确定核酸所源自的来源的类型的能力。
当在本文中使用时,术语“靶核酸”是指旨在用于分析例如序列分析的核酸寡核苷酸。
当在本文中使用时,术语“诱饵核酸”是指与靶核酸合并以帮助隐藏所述靶核酸的任何核酸寡核苷酸。这些诱饵核酸可以含有来自于各种不同来源的靶核酸或由所述靶核酸构成。也就是说,来自于一个来源的靶核酸可以被隐藏在来自于其他来源的靶核酸的合并物内,导致靶核酸充当用于其他靶核酸的诱饵核酸。
当在本文中使用时,术语“匿名”是指降低将靶核酸以任何方式联系到个体、家庭、种族或任何其他具名实体或组的能力。
当在本文中使用时,术语“模糊”是指使对靶核酸进行分析所用于的目的和/或情况和/或原因变得模糊的行动。
当在本文中使用时,术语“隐藏”涵盖了术语“匿名”和“模糊”,并且术语隐藏的使用可以意味着隐藏和/或匿名和/或模糊。
当在本文中使用时,术语“条形码”是指作为用于靶核酸分子的标识符的寡核苷酸。
在某些实施方式中,本文中描述的技术涉及核酸的制备。在某些实施方式中,本文中描述的方法在核酸分析(例如测序)之前隐藏了所述核酸中存在的信息。在某些实施方式中,本文中描述的方法涉及核酸的富集。
核酸可以含有用于识别所述核酸的来源的信息。当它们的来源是人时,已被潜在对手知道的关于该人的任何信息有助于识别该人。这可以是例如已知在具有特定姓氏、来自于世界的特定地区、来自于特定种族的个体中发生的稀有突变,或已知与这些核酸变体相关的人的任何其他特征。如果核酸变体可用于确定它们的来源的特征(例如它们的来源具有红发),则该信息可用于帮助识别该来源。匿名是可用于识别来源的信息的减少。
许多个体是不同种族的组合,他们的祖先源自于世界上的不同地方。因此,他们的遗传组成反映出这些不同种族。从父系血统继承的DNA与源自于母系血统的DNA相比可以来自于一个或多个不同种族。
通过观察核酸的种族组成,可以识别那些核酸所源自的个体。通过组合其他识别信息例如发色、体型或任何其他可遗传的性状,甚至可以更容易地确定核酸的来源。正如本文中公开的,添加条形码和合并打破了这种信息,使得关于核酸来源的各个信息碎片不能如同源自于个体来源那样被集合在一起。被合并的带条形码的核酸的类型可以源自于各种不同种族和具有各种不同的可遗传性状的个体,使得有权访问所述序列数据的对手不能确定任何特定个体是否具有所述合并物中存在的核酸。所述带条形码的合并物由含有来自于多种来源的变体的核酸的集群构成,并且在没有将条形码联系到它们的来源的表格的情况下,对这些来源的任一者的身份的确定受到阻碍。
为了隐藏核酸内包含的信息,本文中描述的技术利用了下述步骤:(a)条形码和在所述技术中使用的其他必要材料的安全生成,;(b)将条形码添加到靶核酸(图1A);和(c)带条形码的靶核酸与其他核酸的合并(图1B)。
在某些实施方式中,在本技术中使用的材料的安全生成可以在安全设施中进行(图2)。在某些实施方式中,该设施不需与设施外部的任何通讯。在某些实施方式中,材料由机器例如机器人生成,并且可以不需任何直接的人类参与。在某些实施方式中,人类参与材料生成过程的某些步骤。为了确保安全性,如果人类参与,则他们在进入所述设施之前必须被筛查,以防他们在设施内使用可能危害设施内存在的信息的任何记录设备(例如照相机)。
在某些实施方式中,为了防止与设施外部的任何通讯,在设施的内部与外部之间不存在电子通讯手段。例如,不存在进/出所述设施的可用于通讯的电缆,例如但不限于铜电话线或光纤缆线。为了防止电磁信号进/出所述设施,使用阻挡电磁信号的方法,例如使用包围所述设施的法拉第笼,或通过其他手段干扰电磁通讯。在某些实施方式中,使用视听监控来监测所述设施周围区域的通讯。在某些实施方式中,这种监测包括电磁信号的监测,以侦查可能的间谍活动。在某些实施方式中,所述设施内的所有计算机系统都是“气隙的”,并且监控进入/离开所述设施的所有个体的未授权通讯。
在某些实施方式中,在所述设施内,计算机生成待用作条形码的随机核酸序列的集合。这些条形码序列将以防止使用来自于该集合的任何信息作出关于所述条形码序列的任何预测的方式生成,使得所述条形码的集合是独一无二的,并且生成的每个条形码也是完全独立于所述集合中的其他条形码的独一无二的条形码。在某些实施方式中,将这些序列沿着电线发送到从核酸生产条形码的机器,使用具有电磁屏蔽的电线以便信息不会从所述电线散发出去。在某些实施方式中,所述条形码序列的集合由并入在用于生成所述条形码的机器中的计算机产生。在某些实施方式中,这些条形码与连接到所述条形码的用于帮助将条形码添加到其他核酸的任何材料一起产生。这些材料包括但不限于接头、标记或在所述技术中的后续步骤中使用的任何其他化学品或分子。
使用核酸,大量条形码是可能的。传统上,在生物技术中使用4种不同类型的核酸碱基:腺嘌呤,胞嘧啶,胸腺嘧啶和鸟嘌呤。在某些实施方式中,本文中的技术可以使用任何非常规的核苷酸碱基(例如5-甲基胞嘧啶)。在本文描述的技术中,讨论了可以使用仅仅4种核苷酸碱基产生的大量条形码(图3),并且应该理解,如果使用非常规的核苷酸碱基,甚至更多类型的条形码是可能的。
使用4种核苷酸碱基,存在4n种这些核苷酸的可能组合,其中“n”是所述条形码中寡核苷酸的长度。例如,如果所述条形码的长度为4(n=4),则存在44=256个可能的不同条形码序列。如果允许所述条形码的长度变化,使得某些条形码具有与其他条形码不同的长度,则存在甚至更多可能的条形码序列。例如,如果存在长度为1、2、3或4的条形码,则存在44+43+42+41=340种可能的序列。
随着条形码长度的增加,可能的条形码的数目快速变大。例如,如果条形码的长度为8并且核酸长度仅为8,则存在65,536种可能的组合。将条形码加长到20并且核酸长度仅为20,则允许超过一百亿种不同组合。在这种技术的某些实施方式中,不是所有的条形码序列都可以理想地使用,并且某些条形码可以被排除在使用之外。然而,即使在排除一些之后,仍有大量条形码是可能的。
在某些实施方式中,为了确定哪些条形码序列对于潜在的分析是理想的,在分析之前或期间使用计算机程序来检查所述可能的条形码序列,并将它们与可能与它们相互作用的其他核苷酸序列进行比较。可能的条形码序列的检查可以包括但不限于:预测它们的二级结构(例如估算它们形成G-四链体DNA或RNA结构的能力),检查均聚物运行,检查均聚嘌呤/均聚嘧啶区域,检查发夹环形成能力,或所述序列的可能干扰分析和/或分析用制备的任何其他性质。可能的条形码与其他序列之间的比较可以包括但不限于:比较条形码与其他条形码的互补性,比较条形码与其他条形码的形成可替选结构的能力(例如三链体或四链体DNA形成),将所述可能的条形码与潜在的靶核酸进行比较以避免互补性,或将所述可能的条形码与它在制备期间或分析期间可能遇到的任何其他序列进行比较。在这些实施方式中,将不被确定为对于使用是理想的序列从可能的条形码序列的总集合中移除,然后将剩余的序列随机分成子集并制造。
在某些实施方式中,每个子集含有独特的条形码集合,而在其他实施方式中,在不同子集中存在的一些条形码具有一致的序列。取决于可能对靶核酸进行的分析,允许在条形码的子集中的一些条形码不是独一无二的和/或允许一些条形码在条形码的子集之间不是独立无二的,可以帮助隐藏。在某些实施方式中,在条形码生成之前,可以使用计算机程序来确定对于所提议的分析来说,条形码的非独特性是否明智。由本领域技术人员产生的该计算机程序,也可用于确定所有待分析的分子是否都需要添加条形码,或者所述分析是否可以允许在不同子集之间和/或子集内存在条形码序列的一些重叠。
在某些实施方式中,所述条形码被生成在随机子集中,使得这些条形码的子集以及它们的相关连接化学品与其他条形码的子集分开包装(图4)。在某些实施方式中,所述条形码被包装在不含连接到它们的任何相关化学品的子集中(即它们被包装为仅仅条形码)。这种包装包括用于稳定或运输所述包装内的化学品的任何必需液体或其他化学品。在某些实施方式中,所述条形码的子集被一起包装在微孔板例如96或384孔板上。在某些实施方式中,每个子集中存在的条形码的表格被生成并印刷在纸上。在某些实施方式中,每个子集中存在的条形码的表格被转移到外部数据存储装置例如CD-ROM、DVD-ROM或闪存驱动器。
在某些实施方式中,条形码的生成在产生的条形码的准确序列中包含一定的随机性。在某些实施方式中,所述条形码序列中存在的随机性是用于制造所述条形码的技术的结果。在某些实施方式中,在条形码寡核苷酸的构建中引起的随机性由随机化因素添加,例如随机指导条形码寡核苷酸的生成的计算机或其他过程。例如,条形码可以被随机生成为:
TACGCGAGATAC(SEQ ID NO:1)或
TACGCGAGATAA(SEQ ID NO:2)或
TACGCGAGATAT(SEQ ID NO:3)或
TACGCGAGATAG(SEQ ID NO:4)
(在这些实例的每个中,序列中的最后一个核苷酸可以取4种核苷酸碱基之一)。这种随机化可能造成某些子集中的某些条形码与其他子集中的条形码一致。在某些实施方式中,所述随机条形码序列在制造过程之前、之后或期间被完美记录,而在其他实施方式中,关于每个子集中存在的准确条形码序列,存在着不确定性。关于每个子集中存在的准确条形码的不完美的信息可以提供额外的安全和/或降低制造成本,但作为后果可能降低关于来自于分析的结果的确定性。这种不确定性可以降低消费者和潜在对手区分靶核酸和诱饵的能力。在某些实施方式中,可以使用由本领域技术人员设计的计算机程序来执行成本效益分析,以确定随机、可能不完全知道的条形码子集的益处对于这种技术的任何具体用途来说是否是理想的。
在某些实施方式中,将所述条形码的子集和所述条形码的表格密封在容器中,使得所述密封在被打开后不能被重新密封。在某些实施方式中,含有条形码及其相关表格的容器被受信任的信使送往消费者。在其他实施方式中,这些容器被运输到配送中心。
通过安全地生成子集中的条形码,本技术的消费者可以选择将条形码的哪些子集使用在他们的靶核酸上以及哪些子集可能被他们使用在任何诱饵核酸上。
在某些实施方式中,所述安全设施也生产诱饵核酸。这些诱饵核酸将被用于所述技术的未来步骤中。在某些实施方式中,使用介质例如纸或电子数据格式,将所述诱饵中存在的核酸序列共享给技术的消费者。在某些实施方式中,所述诱饵的准确本质不被共享,并且运输的诱饵核酸的子集仅带有存在的核酸类型的一般性指示。例如,诱饵核酸的集合可以是源自于群体、亚群、种族、物种、亚种或植物株系、动物繁育物、微生物菌株的一组核酸或来自于多个植物/动物/微生物物种的相关核酸的集合。在某些实施方式中,这些诱饵核酸由第三方或所述技术的消费者提供。在某些实施方式中,关于使用哪些诱饵核酸作出建议。在某些实施方式中,所述诱饵核酸由所述消费者和所述安全设施两者提供,并由所述消费者组合。
从安全设施提供诱饵核酸帮助向所述消费者安全地隐藏核酸内包含的信息,但由于条形码被提供给所述消费者,因此消费者能够凭自身安全地生成带条形码的诱饵核酸。对隐藏来说最佳的诱饵的类型取决于所述靶核酸和所述消费者希望隐藏的信息。防止对手获得关于所述诱饵核酸的任何事先了解提供了最大的隐藏,因此诱饵核酸的秘密生成是理想的。所述消费者可能不具有生成适合的诱饵核酸的能力,并且在这些情况下需要从安全设施提供诱饵核酸。
在某些实施方式中,在这种技术中向核酸的条形码添加利用了来自于美国专利公布号2015/0211050和2015/0211061的技术,所述美国专利公布通过引用并入本文。在某些实施方式中,这种技术的使用涉及靶核酸的富集,其中条形码在富集期间或之前添加。在富集之前或期间添加条形码导致单独的条形码标记源自于相同寡核苷酸的多个核酸寡核苷酸。在这些实施方式中,所述诱饵核酸也在富集之前或期间用条形码标记,使得与靶核酸相同,单独的条形码也标记所述诱饵核酸中的多个核酸寡核苷酸(图5)。
在某些实施方式中,使用长度为1、长度为2、长度为3、长度为4、长度为5、长度为6、长度为7或长度为8的核酸的小的条形码。在某些实施方式中,小的和大的条形码一起使用,例如长度为8、长度为9、长度为10、长度为11、长度为12、长度为13、长度为14、长度为15、长度为16、长度为17、长度为18、长度为19、长度为20、长度为21、长度为22、长度为23、长度为24、长度为25、长度为26、长度为27、长度为28、长度为29和/或长度为30或更长的条形码。当各种不同长度的条形码被一起使用并且在核酸被添加条形码后存在富集步骤时,必须考虑不同寡核苷酸的相对富集速率。例如,更长的条形码可能需要更多时间来聚合,因此富集带有这些较长条形码标签的核酸与带有较短核酸标签的核酸相比可能产生较少的被富集的核酸分子。
在某些实施方式中,条形码和它们的标记和接头将具有不同的聚合速率,因此在带有这些不同分子标签的核酸之间富集速率将不同。在某些实施方式中,由于改变富集速率的核酸碱基的修饰、由于中止或以其他方式减缓聚合速率的可替选二级结构或由于向所述条形码添加了其他分子以干扰聚合酶或改变富集速率,富集速率是可变的。在这些实施方式中,条形码和它们的接头和标记对聚合速率可能具有的影响,可以通过改变在本技术中的任何富集步骤期间出现的相对富集速率,从而随机改变具有不同条形码的核酸的量。
在某些实施方式中,改变富集速率可用于改变具有不同条形码的核酸的量,这可用于进一步隐藏所述靶核酸。如果某些带条形码的靶核酸具有不同于所述靶核酸上的条形码的量,则更难以将这两种核酸联系为源自于同一来源。例如,如果个体的基因组区域(例如基因)是待测序的,那么该个体可能具有该基因组区域的两种不同变体,各自来自于父母亲。如果每种变体以相近的量存在,则它们可能被归属于单一来源,但如果对于两个区域来说富集的带条形码的变体的量不同,则将这两个区域归属于同一来源变得更加困难。
在某些实施方式中,使用连接步骤来添加条形码,并且在这些实施方式中,在条形码被连接后不随后进行富集。在某些实施方式中,在条形码连接之前存在富集步骤。在某些实施方式中,在条形码连接之前的富集步骤也添加条形码。
在某些实施方式中,使用粘性末端连接将条形码连接到靶核酸。在某些实施方式中,使用的粘性末端连接是TA连接(图6A),包括在连接之前向靶核酸添加腺苷酸核酸。在这些实施方式中,将条形码连接到含有悬垂的胸苷酸核酸的接头分子,以匹配所述靶核酸上悬垂的腺苷酸。
在某些实施方式中,在条形码连接之前对核酸使用限制性酶(图6B)。用限制性酶切开核酸可用于多种目的,包括但不限于:将所述核酸断裂成较小尺寸的寡核苷酸以满足分析的要求(例如下一代测序要求输入小于一定长度的寡核苷酸);将所述核酸的区域彼此分离开,以使所述核酸中存在的可能变体不在同一个分子上,进一步增加隐藏;在所述核酸上产生粘性末端以便于与条形码连接,所述条形码被设计为具有与由所述限制性酶消化在所述核酸上产生的粘性末端相对应的接头。
在某些实施方式中,条形码被并入到用于特定测序技术目的的步骤中。测序技术可能需要或得益于在分析之前向核酸添加分子。在这种技术的某些实施方式中,在序列分析之前添加到核酸的分子包括添加被设计用于隐藏所述核酸的条形码。例如,在PacificBiosciences实时测序仪上的测序得益于向待测序的核酸添加单链区(参见美国专利公布号2012/0196279,其通过引用并入本文)。该单链区可以含有条形码信息,并且在这种技术的某些实施方式中,将条形码添加到该区以便于在分析之前隐藏核酸。在某些实施方式中,除了在前面步骤处添加的条形码之外,在这个步骤处也添加条形码。
在某些实施方式中,条形码由这一技术的消费者添加到诱饵核酸。在这些实施方式中,对诱饵核酸采取与用于任何靶核酸的步骤相似的步骤。在这些实施方式中,由于消费者选择向哪些核酸添加哪些条形码的子集的能力,只有所述消费者了解所述靶核酸上存在的条形码和在所述诱饵核酸上的条形码(图5)。在某些实施方式中,所述诱饵核酸由安全设施添加条形码并提供给所述消费者。在这些实施方式中,提供给消费者的条形码的表格将告知所述消费者他们可以向他们的靶核酸添加哪些条形码。在某些实施方式中,由安全设施提供的诱饵核酸上存在的条形码的表格可能不对所述消费者公开。在其他实施方式中,添加到诱饵核酸的条形码的表格被提供给所述消费者。
在某些实施方式中,所述靶核酸上存在的某些条形码序列与诱饵核酸上存在的某些条形码序列一致。在这些实施方式中,对诱饵核酸上存在的条形码的了解是必需的,并且将为由安全设施提供的诱饵核酸提供条形码的表格。所述靶核酸和诱饵核酸上的条形码的集合之间的交叠,将为哪些核酸是靶并且哪些是诱饵提供进一步的隐藏,因为甚至所述消费者也不具有完整的信息!在这些实施方式中,只要在靶核酸上存在足够量的独一无二的条形码,所述消费者仍然可以获得关于所述靶核酸的有用信息。在某些实施方式中,获得关于靶核酸的足够信息所需的独一无二的条形码的数目,由所述消费者确定。在某些实施方式中,提供关于在所述靶与所述诱饵核酸之间有多少条形码可以重叠的建议。
在某些实施方式中,不是所有的靶和/或诱饵(对照)核酸都接受条形码。在某些实施方式中,一些不带条形码的接头、引物或原本将含有条形码的其他材料被生成为不含条形码。在某些实施方式中,当在扩增步骤后或在没有扩增步骤的情况下添加条形码时,条形码可以以某种方式连接到核酸,使得不是所有的核酸都接受条形码(例如将有限量的条形码添加到核酸,使得不是所有的核酸都接受条形码)。在某些实施方式中,可以使用由本领域技术人员产生的计算机程序来确定如果不是所有的靶核酸都添加条形码的话,分析是否可以提供足够的信息。
在某些实施方式中,可以利用分子生物学程序和技术固有的随机性来帮助隐藏。在这些实施方式中,可以通过随机化为分析而制备的核苷酸的条形码添加来帮助隐藏。在某些实施方式中,接受任何条形码的核酸的比例和/或数目被随机化。在某些实施方式中,接受相同条形码的核酸的数目被随机化。例如,如果在富集步骤期间或之前添加条形码,则核酸的总合并物中存在的一致的条形码的相对数量将受到用于扩增所述核酸的分子过程中的随机性的影响。在某些实施方式中,利用接受任何条形码的条形码的数目和/或比例的随机性来帮助隐藏。如果用于将条形码添加到核酸的方法导致少于每个核酸接受一个条形码,则在某些实施方式中,接受或不接受条形码的具体核酸可以是随机的。在某些实施方式中,大量各种不同核酸的分布的估算以及随机化程序对隐藏所具有的影响,可以使用由本领域技术人员产生的计算机程序来预测。在某些实施方式中,用于估算随机性的计算机程序也可以指导如何使用分子遗传学程序来获得随机性。
在本技术中用于合并核酸的方法取决于各种不同因素,包括但不限于:被靶向的核酸的类型(例如所述靶核酸的物种、亚种或种族),对手可能具有的关于所述靶核酸的潜在了解,消费者希望隐藏的信息的类型,用于分析所述核酸的技术的准确度,消费者对诱饵核酸的可获得性,可获得的关于所述靶核酸的知识,序列分析的成本,可用于分析的经费,或影响所述消费者和/或潜在对手可能具有的关于所使用的靶核酸和诱饵核酸的信息的任何其他因素。
本文中提供的方法提供了各种不同的技术用于合并核酸以用于隐藏。合并带条形码的核酸以用于隐藏的用途不限于本文中提供的实例。
在某些实施方式中,向所述消费者提供模拟和/或能够模拟的计算机程序,以帮助他们作出关于合并的决定。在某些实施方式中,使用隐私性的一种或多种度量例如差分隐私(参见美国专利号7,698,250,其通过引用并入本文)来确定由消费者选择的隐私性水平所必需的合并的类型。在某些实施方式中,对所述消费者作出关于合并方法的建议。
在某些实施方式中,诱饵核酸的合并物部分或完全由其他靶核酸、即彼此不一致的靶核酸构成。通过使用来自于一个来源的靶核酸作为用于来自于其他来源的靶核酸的诱饵核酸,降低了有用的分析的相对成本。如果所使用的一些或所有诱饵核酸不是消费者感兴趣的靶核酸,则将靶核酸与这些诱饵合并需要分析不感兴趣的核酸。随着测序分析的成本持续降低,向用于分析的核酸合并物添加不感兴趣的诱饵核酸将变得相对不太昂贵。然而,在某些实施方式中,合并的所有核酸都是所述消费者感兴趣的(即多种靶核酸彼此充当诱饵),因此这种技术不需廉价的测序即可对所述消费者来说是成本效益高的。在某些实施方式中,关于合并的决定受到分析成本和消费者具有的用于分析的预算的影响。
合并带条形码的核酸可以隐藏关于那些核酸的信息。希望被隐藏的信息决定了合并方法。在本文中提供了核酸中存在的可以使用这种技术隐藏的信息的类型的实例。使用这种技术来隐藏信息不限于本文中提供的实例。
作为预示性实例,假设所述靶核酸源自于人,并且对于可能赋予疾病风险的基因(例如使人对乳腺/卵巢癌易感的BRCA1基因变体)进行她们的靶核酸的富集。假设所述靶核酸已被添加条形码,并与源自于其他个体的同一基因的带条形码的核酸(诱饵合并物)组合。假设所述诱饵合并物由种族相同的个体构成,则整个合并物的组成与在添加靶之前的单独的诱饵合并物几乎一致。因此,任何对手将难以确定任何个体是否存在于所述合并物中,因为当个体的核酸被添加到所述合并物时,所述合并物仅仅略微改变。因此,使用独一无二的分子条形码隐藏了来自于核酸的可用于识别所述合并物中的个体的信息。对手可以确定所述合并物由来自于多个未知个体的基因的许多拷贝构成,但将难以识别这些个体。
使用来自于匹配群体的大量核酸合并物匿名核酸,需要对整个合并物进行分析以获得关于单一靶的信息。正如讨论过的,当诱饵核酸的合并物由其他靶核酸构成时,从所述合并物的分析提供的所有信息对所述消费者有一定用处。在某些实施方式中,所述合并物完全由彼此充当诱饵的靶核酸构成。在某些实施方式中,所述合并物由消费者不感兴趣的诱饵核酸构成,其只起到隐藏靶核酸的作用。在某些实施方式中,所述诱饵合并物是各种不同来源的组合,其中一些是消费者感兴趣的靶核酸,另一些是消费者不感兴趣的诱饵核酸。
关于可能不必然有助于识别核酸来源的特性的遗传信息,可能也可以从核酸的分析获得(例如疾病风险)。在某些实施方式中,本文描述的技术也可以隐藏该特性的信息。对于某些特性来说,使用核酸变体的组合来预测所述特性。例如,在基因组中的基因座处纯合的个体可能对疾病易感。添加条形码以及合并将来自于靶核酸的不同部分的信息打散。例如,将从父母亲中的一者继承的等位基因变体与来自于父母亲中的另一者的等位基因变体添加不同的条形码,使得确定个体继承的基因型需要使用条形码表格。结果,被设计完全用于匿名的合并方法甚至导致所述核酸中存在的其他信息的隐藏。
然而,某些合并方法提供了关于特性信息的增加的隐藏。作为另一个预示性实例,再次假设正在分析靶的基因(再次例如BRCA1)中的突变。并且假设将他们的带条形码的核酸合并在一起以彼此充当诱饵。使用这种合并物,对手可能获得关于所述合并物总体的特性信息。例如,如果所述合并物中的许多个体携带使他们对癌症风险易感的BRCA1变体,则有权访问序列分析的对手将能够确定所述合并物与普通群体相比具有相对更高的癌症风险。可以为合并物选择诱饵核酸,使得特性信息被隐藏。在所述同一个预示性实例中,可以选择诱饵核酸,使得所述合并物显得具有与普通群体相近量的疾病风险变体。在这种情形中,预测所述测序核酸的合并物所源自的个体具有以与在普通群体中已知出现的比率可比的比率出现的特性。因此,所述合并物变得对于合并物中存在的特性不提供信息。在某些实施方式中,将核酸合并,通过设计所述合并物以显得以与背景群体相近的比率含有特性,来隐藏所述合并物中存在的特性。
当选择不源自于靶核酸的诱饵核酸时,由于所述合并物中存在的特性可以被更准确地控制,因此特性可以变得被进一步隐藏。在某些实施方式中,添加诱饵核酸以使所述合并物显得具有特定特性,隐藏了所述合并物中靶核酸的来源的特性。在某些实施方式中,向合并物添加具有已知特性(例如高癌症风险遗传变体)的诱饵核酸,使得所述合并物富含具有该特性的核酸变体。具有预测的特性的核酸的压倒性存在,可以隐藏所述靶核酸是否也具有该特性。作为预示性实例,我们,我们取同样的靶核酸合并物来分析特性(例如使用来自于个体的BRCA基因分析癌症风险),并且我们添加大量具有该特性的诱饵核酸。不论靶核酸的来源的特性如何,这时所述合并物显得含有许多具有该特性的个体。
在某些实施方式中,由于其他因素可以先验地相信靶核酸具有特定特性,例如在靶核酸的来源中测量到特性,在靶核酸的来源的家族中存在特性,靶核酸的来源的家系分析,靶核酸的种族背景,或关于靶核酸的来源的任何其他已知信息。在某些实施方式中,使用这种信息将靶核酸合并。
在某些实施方式中,利用随机性来改变添加到合并物的来自于各种不同来源的核酸的量。在某些实施方式中,随机性出现在用于制备分析用核酸的分子遗传学流程中。作为一个实例,核酸的扩增导致产生随机量的核酸。作为分子生物学技术中的随机性的另一个实例,将含有核酸的液体等分到可能已经含有或可能不含核酸的另一种液体中,具有有限的精确性。因此,被等分的核酸的准确量是随机的。此外,当分析核酸时,分析的准确结果以许多方式含有随机性,包括但不限于:接受分析的准确核酸寡核苷酸的随机性,分析结果的质量的随机性(例如随机误差),和/或给定核酸寡核苷酸的结果的数量的随机性。
在某些实施方式中,由消费者修改分子生物学技术固有的随机性。在某些实施方式中,所述消费者修改他们的实验室技术以提高合并物中核酸的数量的随机性。这种随机性可以包括但不限于:使用已知提高随机性的实验室技术(例如在移液量方面精度较低的移液技术),使用已知在从扩增得到的核酸的数量方面精度较低的核酸扩增方法(例如使用在定时和/或温度方面精度有限的热循环仪),和/或使用已知引入随机性的试剂和化学品(例如在核酸的纯化中或在核酸的扩增中)。在某些实施方式中,使用随机化因子(例如但不限于硬币、骰子或计算机)进一步随机化用于制备核酸的技术。所述随机化因子可以随机化核酸制备和/或分析中的任何步骤来进一步随机化实验室技术,以随机化被纯化、分离、扩增和/或等分的核酸的量,以提高得到的合并物中核酸的数量的随机性。本领域技术人员可以确定对于给定技术或一组技术来说容许的材料的随机数量的边界,以确保所有随机来源的方案都是成功的。作为一个预示性实例,可以使用掷硬币来确定添加到合并物的核酸的数量,其中由本领域技术人员确定可容许的最小值(由随机化因子、在这里是硬币驱动),以确保存在足以用于成功分析的核酸。
在某些实施方式中,使用由本领域技术人员设计的计算机程序来确定对于这种技术的给定应用来说多大的随机性是理想的。在某些实施方式中,使用信息理论来计算通过合并可能出现多大的随机性。在某些实施方式中,使用对抗性建模来确定在合并中使用多大的随机性。在某些实施方式中,使用由随机合并引起的额外成本的估算值来确定在合并中使用多大的随机性。这些成本可以包括但不限于由通过扩增随机改变核酸的量和/或移取随机量的不同核酸引起的成本,以及由需要增加充分分析靶核酸所需的总测序引起的成本。当核酸被随机合并时,某些靶核酸有机会仅以少量出现在合并物中。当随后对这种合并物进行分析时,这些不太常见的核酸随后将比更常见的核酸接受更少的分析。增加对所述合并物进行的总分析可以确保即使是不太常见的核酸也接受充分分析。在某些实施方式中,给定随机合并方法所需的分析的总量由本领域技术人员估算。
由测序流程中的随机性引起的可变性可以进一步帮助隐藏。测序分析利用核酸合并物来产生序列数据。这些数据不被等同地提供给所述合并物中的每个核酸。测序导致某些核酸寡核苷酸产生所述数据中的一个或多个核酸序列,而同一合并物中的其他核酸寡核苷酸不产生所述数据中的序列。此外,由测序仪产生的序列数据不为被测序的所有寡核苷酸提供同等品质的序列数据。在某些实施方式中,由本领域技术人员设计的计算机程序被用于估算分析的固有随机性,提出将在不同样品量之间进一步引入随机变化的其他随机性,和/或估算通过这些方法获得的隐私性。同样地,计算机程序可用于估算非独一无二的条形码(在条形码的子集之间或之内)是否可以和/或应该被用于提供增加的安全性和/或限制在分析中使用的条形码的量。
在某些实施方式中,匿名对消费者来说兴趣有限,所述靶核酸中的其他信息的隐藏是优先的。例如,如果对手有权访问序列分析结果并且也知道所分析的核酸的来源。一种用于“家族合并”的方法可用于隐藏所述家族的后代的核酸。后代的核酸主要由源自于父母亲每一者的核酸构成。如果核酸的大的合并物由来自于父母亲每一者的核酸构成,则可以向所述合并物添加少量来自于所述后代的核酸,对所述合并物仅有少量改变。因此,来自于后代的核酸可以被方便地隐藏在来自于其父母亲的核酸的合并物中。在这种技术的某些实施方式中,家族合并被用于隐藏后代的核酸。在家族合并的某些实施方式中,使用源自于父母亲每一者的可变量的核酸。在某些实施方式中,将来自于父母亲和后代的核酸富集,并在富集期间添加条形码。在某些实施方式中,通过改变具有不同条形码的核酸被富集的速率,某些核酸比其他核酸更加富集。在某些实施方式中,靶核酸或诱饵核酸的变化通过使用其他手段改变富集速率来进行,例如改变在例如富集期间发生的聚合的循环数。在某些实施方式中,通过改变被添加的不同核酸的量,向合并物提供各种不同量的不同核酸。
通过随机改变合并物中变体的相对量,不同变体的相对频率被改变。然后可以将后代核酸进一步隐藏在父母亲核酸的合并物中,因为否则的话合并物中存在的变体的相对比率可能帮助指示哪些变体被后代继承。
类似的方法可用于在繁育计划中隐藏来自于后代的核酸。例如,可以将二倍体生物体杂交以优化一种或多种所需性状,并且核酸分析可以帮助在性状显现之前确定所述后代的性状。例如,可以使用核酸分析在犊牛中估算成年牛的产奶量,可以在来自于年轻植物的核酸中估算作物产量,或者核酸分析可以帮助在需要后代成熟的任何其他性状完全显现之前预测所述性状。在某些实施方式中,这种“家系合并”可以通过对繁育计划中的后代添加条形码并合并,来隐藏关于在繁育计划中的后代的信息。在某些实施方式中,将源自于所述后代的父母亲或其他亲属的带条形码的核酸与来自于所述后代的带条形码的核酸合并,以帮助隐藏。在某些实施方式中,将单独的后代核酸添加条形码并合并在一起,彼此充当诱饵。在某些实施方式中,在所述合并中利用随机性。与前面描述的随机性的应用相似,可以使用计算机程序来估算所述过程中的固有随机性,并提供用于进一步随机化条形码添加和/或合并的方法,以获得所需的安全性。
在利用“家系合并”的实施方式中,对手将能够确定所述合并物的混合物源自于植物或动物的各种不同品种,但将难以确定所述品种如何被混合在家系中,或者它们是否是已将其核酸一起混合在合并物中的纯种。在某些实施方式中,合并被设计成通过合并源自于大量多种多样的后代和/或它们的亲属的核酸,来隐藏繁育计划中存在的品种和/或杂种的类型。
繁育者可能正在繁育因特定的可遗传性状而选择的杂种的谱系,从而导致在那些杂种中存在特定核酸。因此,那些杂种将含有特定量的来自于不同谱系的不同变体,并且这些杂种的核酸分析可能揭示出关于繁育计划和品种中存在的性状的信息。在某些实施方式中,将源自于原始品种的核酸与源自于所述杂种的核酸混合,以改变不同变体的相对频率,进一步隐藏感兴趣的品种中存在的性状并模糊繁育计划。
在某些实施方式中,核酸被用作数据存储介质,并且这种技术被用于隐藏储存在所述核酸中的数据。在某些实施方式中,这些数据储存核酸的条形码添加足以隐藏那些核酸中的信息,并且不向含有数据的核酸的合并物添加其他带条形码的核酸(即所述靶核酸的一部分可以充当用于其他部分的诱饵)。在某些实施方式中,将含有数据的带条形码的核酸与不含数据的带条形码的核酸合并。在某些实施方式中,将含有数据的带条形码的核酸与源自于生物体的带条形码的核酸合并,将含有数据的核酸隐藏在所述生物体核酸的合并物内。
本文中引用的所有文献通过引用并入本文。
尽管已经详细描述了本发明的各种不同实施方式,但对于本领域技术人员来说显然可以对那些实施方式进行修改和改编。然而,应该明确地理解,这样的修改和改编在本发明的范围之内,正如在示例性权利要求书中所阐述的。
Claims (35)
1.一种用于隐藏核酸内可能存在的信息的方法,所述方法包括:
(a)安全地生成条形码;
(b)将所述条形码附加到核酸以产生带条形码的核酸;
(c)将所述带条形码的核酸与其他核酸合并;
其中所述条形码的安全生成在产生多个条形码集合以及每个集合中存在的条形码的表格的设施中进行;
其中所述条形码和条形码的表格被密封在指示密封何时破损的容器中;
其中将所述条形码附加到核酸分子,使得在相同个体核酸样品的不同核酸之间条形码不完全一致;
其中所述带条形码的核酸与其他带条形码的核酸的合并隐藏了所述核酸中存在的信息。
2.权利要求1的方法,其中提供了消费者感兴趣的核酸能够被添加条形码并与其合并的核酸。
3.权利要求2的方法,其中所提供的核酸在安全设施中被添加条形码。
4.权利要求3的方法,其中将已添加到所述核酸的条形码的表格提供给所述消费者。
5.权利要求1的方法,其中在富集步骤之前或期间将条形码添加到核酸。
6.权利要求5的方法,其中在改变带有不同条形码的核酸的相对量的富集步骤期间或之前选择并添加所述条形码。
7.权利要求1的方法,其中使用粘性末端连接将所述条形码添加到核酸。
8.权利要求7的方法,其中使用TA连接将所述条形码添加到核酸。
9.权利要求7的方法,其中将所述核酸用限制性酶消化。
10.权利要求9的方法,其中所述条形码含有与由所述限制性酶产生的粘性末端相对应的粘性末端,并且这些粘性末端被用于将条形码连接到核酸。
11.权利要求9的方法,其中使用限制性酶的消化被用于降低寡核苷酸的尺寸。
12.权利要求9的方法,其中使用限制性酶的消化被用于在分析之前将所述核酸中的变体彼此分开。
13.权利要求1的方法,其中在制备序列分析用核酸时通常会发生的步骤期间添加条形码。
14.权利要求1的方法,其中被添加到核酸的某些条形码与被添加到其他核酸的其他条形码具有一致的序列。
15.权利要求1的方法,其中向所述消费者提供关于他们可以如何合并核酸以隐藏所述核酸可能含有的信息的建议。
16.权利要求1的方法,其中将带条形码的核酸与具有一定相似性的其他带条形码的核酸合并。
17.权利要求1的方法,其中将带条形码的核酸与具有相似起源的其他带条形码的核酸合并。
18.权利要求1的方法,其中以一定方式选择将与其他带条形码的核酸合并的带条形码的核酸,以控制能够作出的关于所述核酸的来源中存在的特性的预测。
19.权利要求1的方法,其中将带条形码的核酸合并,以便隐藏所述核酸的来源的身份。
20.权利要求1的方法,其中将带条形码的核酸合并,以便隐藏关于所述核酸的某些来源中存在的特性的信息。
21.权利要求1的方法,其中将带条形码的核酸合并,以便繁育者可以隐藏他们的繁育物中存在的特性。
22.权利要求1的方法,其中将带条形码的核酸合并,以便繁育者可以隐藏在他们的繁育程序中使用的方法。
23.权利要求1的方法,其中将含有数据的带条形码的核酸合并以隐藏它们含有的数据。
24.一种用于制备分析用靶核酸序列的方法,所述方法包括:
a.产生包含核酸的条形码的集合;
b.将步骤(a)的条形码附加到待分析的靶核酸序列;以及
c.将待分析的带条形码的靶核酸序列与包含条形码的对照或诱饵核酸序列组合或合并。
25.权利要求24的方法,其中步骤(a)的条形码由计算机随机产生。
26.权利要求24的方法,其中通过连接将所述条形码附加到所述靶核酸序列。
27.权利要求24的方法,其中所述对照或诱饵核酸序列选自与所述靶核酸序列具有相似起源的序列、已知与特定遗传特性相关的序列和已知与特定疾病状态相关的序列。
28.权利要求24的方法,其中所述带条形码的靶核酸序列在与所述对照或诱饵核酸序列组合时被隐藏。
29.一种用于使靶核酸序列匿名的方法,所述方法包括:
a.产生包含核酸的条形码的集合;
b.将步骤(a)的条形码附加到所述靶核酸序列;以及
c.将带条形码的靶核酸序列与包含条形码的对照或诱饵核酸序列组合或合并,其中所述带条形码的靶核酸序列与所述对照或诱饵核酸序列的组合使所述靶核酸序列匿名。
30.权利要求1的方法,其中所述条形码被随机生成。
31.权利要求1的方法,其中不是所有的核酸都接受条形码。
32.权利要求1的方法,其中带条形码的核酸被随机合并。
33.权利要求1的方法,其中将固有地随机的分析用于隐藏。
34.权利要求6的方法,其中不同核酸的富集速率随机变化。
35.权利要求9的方法,其中在分析之前使用卫生设备将所述核酸中的变体彼此分开。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662411998P | 2016-10-24 | 2016-10-24 | |
US62/411,998 | 2016-10-24 | ||
PCT/US2017/058076 WO2018081113A1 (en) | 2016-10-24 | 2017-10-24 | Concealing information present within nucleic acids |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110312825A true CN110312825A (zh) | 2019-10-08 |
Family
ID=62025409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780073821.XA Pending CN110312825A (zh) | 2016-10-24 | 2017-10-24 | 隐藏核酸内存在的信息 |
Country Status (8)
Country | Link |
---|---|
US (1) | US11667951B2 (zh) |
EP (1) | EP3529400B1 (zh) |
JP (1) | JP6941680B2 (zh) |
CN (1) | CN110312825A (zh) |
CA (1) | CA3041645C (zh) |
ES (1) | ES2870639T3 (zh) |
IL (1) | IL266197B2 (zh) |
WO (1) | WO2018081113A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3276526A1 (en) * | 2008-12-31 | 2018-01-31 | 23Andme, Inc. | Finding relatives in a database |
US11667951B2 (en) | 2016-10-24 | 2023-06-06 | Geneinfosec, Inc. | Concealing information present within nucleic acids |
CA3120107A1 (en) | 2018-11-30 | 2020-06-04 | Geneinfosec, Inc. | A method for generating random oligonucleotides and determining their sequence |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6537747B1 (en) * | 1998-02-03 | 2003-03-25 | Lucent Technologies Inc. | Data transmission using DNA oligomers |
US20040142325A1 (en) * | 2001-09-14 | 2004-07-22 | Liat Mintz | Methods and systems for annotating biomolecular sequences |
DE60032259D1 (de) * | 1999-05-06 | 2007-01-18 | Sinai School Medicine | Steganographie auf DNA basis |
CA2624324A1 (en) * | 2005-10-06 | 2007-04-19 | Lucigen Corporation | Thermostable viral polymerases and methods of use |
WO2009001135A2 (en) * | 2007-06-25 | 2008-12-31 | Cythera Technologies Limited | Combinatorial libraries and related methods |
CN102737167A (zh) * | 2001-05-25 | 2012-10-17 | 株式会社日立制作所 | 用于处理关于核苷酸序列的信息的方法、设备及系统 |
CA2833917A1 (en) * | 2011-04-28 | 2012-11-01 | The Board Of Trustees Of The Leland Stanford Junior University | Identification of polynucleotides associated with a sample. |
US20130029855A1 (en) * | 2011-07-25 | 2013-01-31 | Bioinventors & Entrepreneurs Network, Llc | Sieving of Nucleic Acid Samples |
CN103154273A (zh) * | 2010-09-21 | 2013-06-12 | 群体遗传学科技有限公司 | 通过分子计数提高等位基因调用的置信度 |
CA2894694A1 (en) * | 2012-12-14 | 2014-06-19 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
CN104812947A (zh) * | 2012-07-17 | 2015-07-29 | 考希尔股份有限公司 | 检测遗传变异的系统和方法 |
WO2015117145A1 (en) * | 2014-02-03 | 2015-08-06 | The University Of Chicago | Compositions and methods for quantitative assesment of dna-protein complex density |
US20150232929A1 (en) * | 2014-02-18 | 2015-08-20 | Illumina, Inc. | Methods and compositions for dna profiling |
WO2017100496A1 (en) * | 2015-12-11 | 2017-06-15 | Shoreline Biome, Llc | Methods for dna preparation for multiplex high throughput targeted sequencing |
Family Cites Families (230)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5106727A (en) | 1989-04-27 | 1992-04-21 | Life Technologies, Inc. | Amplification of nucleic acid sequences using oligonucleotides of random sequences as primers |
CA2036946C (en) | 1990-04-06 | 2001-10-16 | Kenneth V. Deugau | Indexing linkers |
US5573905A (en) | 1992-03-30 | 1996-11-12 | The Scripps Research Institute | Encoded combinatorial chemical libraries |
US6087186A (en) | 1993-07-16 | 2000-07-11 | Irori | Methods and apparatus for synthesizing labeled combinatorial chemistry libraries |
US5604097A (en) | 1994-10-13 | 1997-02-18 | Spectragen, Inc. | Methods for sorting polynucleotides using oligonucleotide tags |
US5695934A (en) | 1994-10-13 | 1997-12-09 | Lynx Therapeutics, Inc. | Massively parallel sequencing of sorted polynucleotides |
US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
USRE43097E1 (en) | 1994-10-13 | 2012-01-10 | Illumina, Inc. | Massively parallel signature sequencing by ligation of encoded adaptors |
US5763175A (en) | 1995-11-17 | 1998-06-09 | Lynx Therapeutics, Inc. | Simultaneous sequencing of tagged polynucleotides |
US6458530B1 (en) | 1996-04-04 | 2002-10-01 | Affymetrix Inc. | Selecting tag nucleic acids |
US5963722A (en) | 1997-07-31 | 1999-10-05 | Advanced Micro Devices, Inc. | Byte granularity data checking in a bus bridge verification system |
US6607878B2 (en) | 1997-10-06 | 2003-08-19 | Stratagene | Collections of uniquely tagged molecules |
US5998175A (en) | 1998-07-24 | 1999-12-07 | Lumigen, Inc. | Methods of synthesizing and amplifying polynucleotides by ligation of multiple oligomers |
US6232075B1 (en) | 1998-12-14 | 2001-05-15 | Li-Cor, Inc. | Heterogeneous assay for pyrophosphate detection |
US7056661B2 (en) | 1999-05-19 | 2006-06-06 | Cornell Research Foundation, Inc. | Method for sequencing nucleic acid molecules |
WO2000075373A2 (en) | 1999-05-20 | 2000-12-14 | Illumina, Inc. | Combinatorial decoding of random nucleic acid arrays |
US6235483B1 (en) | 2000-01-31 | 2001-05-22 | Agilent Technologies, Inc. | Methods and kits for indirect labeling of nucleic acids |
US7582420B2 (en) | 2001-07-12 | 2009-09-01 | Illumina, Inc. | Multiplex nucleic acid reactions |
US7157564B1 (en) | 2000-04-06 | 2007-01-02 | Affymetrix, Inc. | Tag nucleic acids and probe arrays |
US6917726B2 (en) | 2001-09-27 | 2005-07-12 | Cornell Research Foundation, Inc. | Zero-mode clad waveguides for performing spectroscopy with confined effective observation volumes |
US6869764B2 (en) | 2000-06-07 | 2005-03-22 | L--Cor, Inc. | Nucleic acid sequencing using charge-switch nucleotides |
US6936702B2 (en) | 2000-06-07 | 2005-08-30 | Li-Cor, Inc. | Charge-switch nucleotides |
US6958217B2 (en) | 2001-01-24 | 2005-10-25 | Genomic Expression Aps | Single-stranded polynucleotide tags |
US6613523B2 (en) | 2001-06-29 | 2003-09-02 | Agilent Technologies, Inc. | Method of DNA sequencing using cleavable tags |
AU2002359436A1 (en) | 2001-11-13 | 2003-06-23 | Rubicon Genomics Inc. | Dna amplification and sequencing using dna molecules generated by random fragmentation |
ATE425263T1 (de) | 2001-11-19 | 2009-03-15 | Parallele Bioscience Inc | Multiplex-oligonukleotidaddition und zielamplifikation |
GB0129012D0 (en) | 2001-12-04 | 2002-01-23 | Solexa Ltd | Labelled nucleotides |
US8855935B2 (en) | 2006-10-02 | 2014-10-07 | Ancestry.Com Dna, Llc | Method and system for displaying genetic and genealogical data |
CN1791682B (zh) | 2003-02-26 | 2013-05-22 | 凯利达基因组股份有限公司 | 通过杂交进行的随机阵列dna分析 |
WO2004092331A2 (en) | 2003-04-08 | 2004-10-28 | Li-Cor, Inc. | Composition and method for nucleic acid sequencing |
US7972994B2 (en) | 2003-12-17 | 2011-07-05 | Glaxosmithkline Llc | Methods for synthesis of encoded libraries |
CN101864412A (zh) | 2003-12-17 | 2010-10-20 | 普雷西斯药品公司 | 合成编码文库的方法 |
US7381529B2 (en) | 2003-12-31 | 2008-06-03 | Intel Corporation | Methods and compositions for detecting nucleic acids using scanning probe microscopy and nanocodes |
DE602005018166D1 (de) | 2004-02-12 | 2010-01-21 | Population Genetics Technologi | Genetische analyse mittels sequenzspezifischem sortieren |
US7462452B2 (en) | 2004-04-30 | 2008-12-09 | Pacific Biosciences Of California, Inc. | Field-switch sequencing |
US8071755B2 (en) | 2004-05-25 | 2011-12-06 | Helicos Biosciences Corporation | Nucleotide analogs |
AU2005275061B2 (en) | 2004-07-14 | 2012-05-24 | Zs Genetics, Inc. | Systems and methods of analyzing nucleic acid polymers and related components |
WO2006044078A2 (en) | 2004-09-17 | 2006-04-27 | Pacific Biosciences Of California, Inc. | Apparatus and method for analysis of molecules |
US7170050B2 (en) | 2004-09-17 | 2007-01-30 | Pacific Biosciences Of California, Inc. | Apparatus and methods for optical analysis of molecules |
US7892731B2 (en) * | 2004-10-01 | 2011-02-22 | Radix Biosolutions, Ltd. | System and method for inhibiting the decryption of a nucleic acid probe sequence used for the detection of a specific nucleic acid |
WO2006052242A1 (en) | 2004-11-08 | 2006-05-18 | Seirad, Inc. | Methods and systems for compressing and comparing genomic data |
US7647186B2 (en) | 2004-12-07 | 2010-01-12 | Illumina, Inc. | Oligonucleotide ordering system |
WO2006086673A2 (en) | 2005-02-09 | 2006-08-17 | Pacific Biosciences Of California, Inc. | Nucleotide compositions and uses thereof |
US7393665B2 (en) | 2005-02-10 | 2008-07-01 | Population Genetics Technologies Ltd | Methods and compositions for tagging and identifying polynucleotides |
US7407757B2 (en) | 2005-02-10 | 2008-08-05 | Population Genetics Technologies | Genetic analysis by sequence-specific sorting |
US20070026426A1 (en) | 2005-04-26 | 2007-02-01 | Applera Corporation | System for genetic surveillance and analysis |
US7709197B2 (en) | 2005-06-15 | 2010-05-04 | Callida Genomics, Inc. | Nucleic acid analysis by random mixtures of non-overlapping fragments |
US20070020640A1 (en) | 2005-07-21 | 2007-01-25 | Mccloskey Megan L | Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis |
ATE510930T1 (de) | 2005-08-02 | 2011-06-15 | Rubicon Genomics Inc | Zusammensetzungen und verfahren zur bearbeitung und amplifikation von dna mit verwendung mehrerer enzyme in einer einzigen reaktion |
US7960104B2 (en) | 2005-10-07 | 2011-06-14 | Callida Genomics, Inc. | Self-assembled single molecule arrays and uses thereof |
WO2007062664A2 (en) | 2005-12-01 | 2007-06-07 | Nuevolution A/S | Enzymatic encoding methods for efficient synthesis of large libraries |
US7698250B2 (en) | 2005-12-16 | 2010-04-13 | Microsoft Corporation | Differential data privacy |
EP1963530B1 (en) | 2005-12-22 | 2011-07-27 | Pacific Biosciences of California, Inc. | Active surface coupled polymerases |
US9966153B2 (en) | 2005-12-29 | 2018-05-08 | Quest Diagnostics Investments Incorporated | Graphical presentation of medical data |
EP1987162A4 (en) | 2006-01-23 | 2009-11-25 | Population Genetics Technologi | NUCLEIC ACID ANALYSIS ABOUT SEQUENCE TOKENS |
WO2007087312A2 (en) | 2006-01-23 | 2007-08-02 | Population Genetics Technologies Ltd. | Molecular counting |
WO2007092538A2 (en) | 2006-02-07 | 2007-08-16 | President And Fellows Of Harvard College | Methods for making nucleotide probes for sequencing and synthesis |
US8975216B2 (en) | 2006-03-30 | 2015-03-10 | Pacific Biosciences Of California | Articles having localized molecules disposed thereon and methods of producing same |
US7563574B2 (en) | 2006-03-31 | 2009-07-21 | Pacific Biosciences Of California, Inc. | Methods, systems and compositions for monitoring enzyme activity and applications thereof |
WO2007136717A1 (en) | 2006-05-16 | 2007-11-29 | Nugen Technologies, Inc. | Nucleic acid separation and purification method based on reversible charge interactions |
WO2008005310A2 (en) | 2006-06-30 | 2008-01-10 | Ambit Biosciences Corp. | Detectable nucleic acid tag |
WO2008005459A2 (en) | 2006-06-30 | 2008-01-10 | Nugen Technologies, Inc. | Methods for fragmentation and labeling of nucleic acids |
US7910302B2 (en) | 2006-10-27 | 2011-03-22 | Complete Genomics, Inc. | Efficient arrays of amplified polynucleotides |
EP2121983A2 (en) | 2007-02-02 | 2009-11-25 | Illumina Cambridge Limited | Methods for indexing samples and sequencing multiple nucleotide templates |
AU2008237018B2 (en) | 2007-04-10 | 2014-04-03 | Bruker Spatial Biology, Inc. | Methods and computer systems for identifying target-specific sequences for use in nanoreporters |
US9163053B2 (en) | 2007-05-18 | 2015-10-20 | Fluidigm Corporation | Nucleotide analogs |
WO2009006438A2 (en) | 2007-06-29 | 2009-01-08 | Epicentre Technologies Corporation | Copy dna and sense rna |
US9336177B2 (en) | 2007-10-15 | 2016-05-10 | 23Andme, Inc. | Genome sharing |
US8589437B1 (en) | 2007-10-15 | 2013-11-19 | 23Andme, Inc. | De-identification and sharing of genetic data |
US8518640B2 (en) | 2007-10-29 | 2013-08-27 | Complete Genomics, Inc. | Nucleic acid sequencing and process |
US8093063B2 (en) | 2007-11-29 | 2012-01-10 | Quest Diagnostics Investments Incorporated | Assay for detecting genetic abnormalities in genomic nucleic acids |
JP2011509095A (ja) | 2008-01-09 | 2011-03-24 | ライフ テクノロジーズ コーポレーション | 核酸配列決定のための対をなすタグのライブラリーを製造する方法 |
US7968702B2 (en) | 2008-03-13 | 2011-06-28 | Pacific Biosciences Of California, Inc. | Labeled reactants and their uses |
CA2991818C (en) | 2008-03-28 | 2022-10-11 | Pacific Biosciences Of California, Inc. | Compositions and methods for nucleic acid sequencing |
EP2286217B1 (en) | 2008-03-31 | 2015-02-18 | Pacific Biosciences of California, Inc. | Single molecule loading methods and compositions |
EP2274446B1 (en) | 2008-03-31 | 2015-09-09 | Pacific Biosciences of California, Inc. | Two slow-step polymerase enzyme systems and methods |
EP2326732A4 (en) | 2008-08-26 | 2012-11-14 | Fluidigm Corp | TEST METHODS FOR INCREASED SURPLUS OF SAMPLES AND / OR TARGETS |
US8383345B2 (en) | 2008-09-12 | 2013-02-26 | University Of Washington | Sequence tag directed subassembly of short sequencing reads into long sequencing reads |
US8748103B2 (en) | 2008-11-07 | 2014-06-10 | Sequenta, Inc. | Monitoring health and disease status using clonotype profiles |
US9506119B2 (en) | 2008-11-07 | 2016-11-29 | Adaptive Biotechnologies Corp. | Method of sequence determination using sequence tags |
US8367813B2 (en) | 2008-11-17 | 2013-02-05 | Pacific Biosciences Of California, Inc. | Phospholink nucleotides for sequencing applications |
US8252910B2 (en) | 2008-11-19 | 2012-08-28 | Pacific Biosciences Of California, Inc. | Modular nucleotide compositions and uses therefor |
US9175338B2 (en) | 2008-12-11 | 2015-11-03 | Pacific Biosciences Of California, Inc. | Methods for identifying nucleic acid modifications |
KR20110106922A (ko) | 2009-01-13 | 2011-09-29 | 플루이다임 코포레이션 | 단일 세포 핵산 분석 |
AP3396A (en) | 2009-02-13 | 2015-08-31 | Chem Inc X | Methods of creating and screening DNA-encoded libraries |
US8691509B2 (en) | 2009-04-02 | 2014-04-08 | Fluidigm Corporation | Multi-primer amplification method for barcoding of target nucleic acids |
WO2010117470A2 (en) | 2009-04-10 | 2010-10-14 | Pacific Biosciences Of California, Inc. | Nanopore sequencing devices and methods |
US8053744B2 (en) | 2009-04-13 | 2011-11-08 | Src, Inc. | Location analysis using nucleic acid-labeled tags |
US8298767B2 (en) | 2009-08-20 | 2012-10-30 | Population Genetics Technologies Ltd | Compositions and methods for intramolecular nucleic acid rearrangement |
US8236570B2 (en) | 2009-11-03 | 2012-08-07 | Infoscitex | Methods for identifying nucleic acid ligands |
US9023769B2 (en) | 2009-11-30 | 2015-05-05 | Complete Genomics, Inc. | cDNA library for nucleic acid sequencing |
US9315857B2 (en) | 2009-12-15 | 2016-04-19 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse label-tags |
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
EP2550528B1 (en) | 2010-03-25 | 2019-09-11 | Bio-Rad Laboratories, Inc. | Droplet generation for droplet-based assays |
WO2011161549A2 (en) | 2010-06-24 | 2011-12-29 | Population Genetics Technologies Ltd. | Methods and compositions for polynucleotide library production, immortalization and region of interest extraction |
BR112012032586B1 (pt) | 2010-06-30 | 2021-08-17 | Bgi Genomics Co., Ltd | Métodos para determinar a sequência nucleotídica de um ácido nucléico de interesse e para determinar o genótipo hla em uma amostra |
US20140342940A1 (en) | 2011-01-25 | 2014-11-20 | Ariosa Diagnostics, Inc. | Detection of Target Nucleic Acids using Hybridization |
US20130261003A1 (en) | 2010-08-06 | 2013-10-03 | Ariosa Diagnostics, In. | Ligation-based detection of genetic variants |
GB2497912B (en) | 2010-10-08 | 2014-06-04 | Harvard College | High-throughput single cell barcoding |
US9074251B2 (en) | 2011-02-10 | 2015-07-07 | Illumina, Inc. | Linking sequence reads using paired code tags |
US8865404B2 (en) | 2010-11-05 | 2014-10-21 | President And Fellows Of Harvard College | Methods for sequencing nucleic acid molecules |
DK2652155T3 (en) | 2010-12-16 | 2017-02-13 | Gigagen Inc | Methods for Massive Parallel Analysis of Nucleic Acids in Single Cells |
EP3037536B1 (en) | 2011-01-28 | 2019-11-27 | Illumina, Inc. | Oligonucleotide replacement for di-tagged and directional libraries |
US20120196279A1 (en) | 2011-02-02 | 2012-08-02 | Pacific Biosciences Of California, Inc. | Methods and compositions for nucleic acid sample preparation |
WO2012112804A1 (en) | 2011-02-18 | 2012-08-23 | Raindance Technoligies, Inc. | Compositions and methods for molecular labeling |
EP2689028B1 (en) | 2011-03-23 | 2017-08-30 | Pacific Biosciences Of California, Inc. | Isolation of polymerase-nucleic acid complexes and loading onto substrates |
EP2702175B1 (en) | 2011-04-25 | 2018-08-08 | Bio-Rad Laboratories, Inc. | Methods and compositions for nucleic acid analysis |
US20130059762A1 (en) | 2011-04-28 | 2013-03-07 | Life Technologies Corporation | Methods and compositions for multiplex pcr |
US8722585B2 (en) | 2011-05-08 | 2014-05-13 | Yan Wang | Methods of making di-tagged DNA libraries from DNA or RNA using double-tagged oligonucleotides |
SG194745A1 (en) | 2011-05-20 | 2013-12-30 | Fluidigm Corp | Nucleic acid encoding reactions |
US9005935B2 (en) | 2011-05-23 | 2015-04-14 | Agilent Technologies, Inc. | Methods and compositions for DNA fragmentation and tagging by transposases |
US9752176B2 (en) | 2011-06-15 | 2017-09-05 | Ginkgo Bioworks, Inc. | Methods for preparative in vitro cloning |
US9506167B2 (en) | 2011-07-29 | 2016-11-29 | Ginkgo Bioworks, Inc. | Methods and systems for cell state quantification |
KR101454886B1 (ko) | 2011-08-01 | 2014-11-03 | 주식회사 셀레믹스 | 핵산분자의 제조방법 |
WO2013022961A1 (en) | 2011-08-08 | 2013-02-14 | 3The Broad Institute | Compositions and methods for co-amplifying subsequences of a nucleic acid fragment sequence |
US9094211B2 (en) | 2011-08-26 | 2015-07-28 | Life Technologies Corporation | Systems and methods for identifying an individual |
WO2013033721A1 (en) | 2011-09-02 | 2013-03-07 | Atreca, Inc. | Dna barcodes for multiplexed sequencing |
US9347900B2 (en) | 2011-10-14 | 2016-05-24 | Pacific Biosciences Of California, Inc. | Real-time redox sequencing |
US9935765B2 (en) | 2011-11-03 | 2018-04-03 | Genformatic, Llc | Device, system and method for securing and comparing genomic data |
US10325067B1 (en) | 2011-12-31 | 2019-06-18 | Quest Diagnostics Investments Incorporated | Statistical quality control of medical laboratory results |
EP4372084A3 (en) | 2012-01-26 | 2024-08-14 | Tecan Genomics, Inc. | Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation |
US10102927B2 (en) | 2012-02-11 | 2018-10-16 | YouGene, Inc. | Systems and methods for storing, processing and utilizing proprietary genetic information |
US20130252280A1 (en) | 2012-03-07 | 2013-09-26 | Genformatic, Llc | Method and apparatus for identification of biomolecules |
US8751166B2 (en) | 2012-03-23 | 2014-06-10 | International Business Machines Corporation | Parallelization of surprisal data reduction and genome construction from genetic data for transmission, storage, and analysis |
SG10201507700VA (en) | 2012-05-08 | 2015-10-29 | Adaptive Biotechnologies Corp | Compositions and method for measuring and calibrating amplification bias in multiplexed pcr reactions |
US8812243B2 (en) | 2012-05-09 | 2014-08-19 | International Business Machines Corporation | Transmission and compression of genetic data |
JP2015519900A (ja) | 2012-05-21 | 2015-07-16 | フリューダイム・コーポレイション | 粒子集団の単粒子解析方法及び単粒子単離方法 |
US10308979B2 (en) | 2012-06-01 | 2019-06-04 | Agilent Technologies, Inc. | Target enrichment and labeling for multi-kilobase DNA |
US9116118B2 (en) | 2012-06-08 | 2015-08-25 | Pacific Biosciences Of California, Inc. | Modified base detection with nanopore sequencing |
EP2861761A1 (en) | 2012-06-15 | 2015-04-22 | Adaptive Biotechnologies Corporation | Uniquely tagged rearranged adaptive immune receptor genes in a complex gene set |
WO2014005042A2 (en) | 2012-06-29 | 2014-01-03 | Massachusetts Institute Of Technology | Massively parallel combinatorial genetics |
CN108875312A (zh) | 2012-07-19 | 2018-11-23 | 哈佛大学校长及研究员协会 | 利用核酸存储信息的方法 |
CN104583421A (zh) | 2012-07-19 | 2015-04-29 | 阿瑞奥萨诊断公司 | 遗传变体的基于多重的顺序连接的检测 |
WO2014026031A1 (en) | 2012-08-10 | 2014-02-13 | Sequenta, Inc. | High sensitivity mutation detection using sequence tags |
US20140155295A1 (en) | 2012-08-14 | 2014-06-05 | 10X Technologies, Inc. | Capsule array devices and methods of use |
US9951386B2 (en) | 2014-06-26 | 2018-04-24 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10221442B2 (en) | 2012-08-14 | 2019-03-05 | 10X Genomics, Inc. | Compositions and methods for sample processing |
US9266370B2 (en) | 2012-10-10 | 2016-02-23 | Apdn (B.V.I) Inc. | DNA marking of previously undistinguished items for traceability |
WO2014071070A1 (en) | 2012-11-01 | 2014-05-08 | Pacific Biosciences Of California, Inc. | Compositions and methods for selection of nucleic acids |
CN104903466B (zh) | 2012-11-05 | 2016-11-23 | 鲁比康基因组学公司 | 条形编码核酸 |
US9605309B2 (en) | 2012-11-09 | 2017-03-28 | Genia Technologies, Inc. | Nucleic acid sequencing using tags |
US9222122B2 (en) | 2012-11-20 | 2015-12-29 | Src, Inc. | System and method for rapid detection and identification of nucleic acid labeled tags |
WO2014092458A1 (ko) | 2012-12-11 | 2014-06-19 | 연세대학교 산학협력단 | 코돈 조합화 및 변이유발을 이용한 유전자 라이브러리의 합성 방법 |
CN108753766A (zh) | 2013-02-08 | 2018-11-06 | 10X基因组学有限公司 | 多核苷酸条形码生成 |
US20140242582A1 (en) | 2013-02-28 | 2014-08-28 | Ariosa Diagnostics, Inc. | Detection of genetic abnormalities using ligation-based detection and digital pcr |
KR101575457B1 (ko) | 2013-03-07 | 2015-12-11 | 서울대학교산학협력단 | 이종 dna 바코딩 방법 |
EP2774998A1 (en) | 2013-03-08 | 2014-09-10 | Roche Diagniostics GmbH | Improved sequence tags |
US20140255929A1 (en) | 2013-03-11 | 2014-09-11 | Sequenta, Inc. | Mosaic tags for labeling templates in large-scale amplifications |
US9328382B2 (en) | 2013-03-15 | 2016-05-03 | Complete Genomics, Inc. | Multiple tagging of individual long DNA fragments |
GB2525568B (en) | 2013-03-15 | 2020-10-14 | Abvitro Llc | Single cell barcoding for antibody discovery |
CN113337604A (zh) | 2013-03-15 | 2021-09-03 | 莱兰斯坦福初级大学评议会 | 循环核酸肿瘤标志物的鉴别和用途 |
NZ629509A (en) | 2013-03-15 | 2017-04-28 | Ancestry Com Dna Llc | Family networks |
US9929985B1 (en) | 2013-03-15 | 2018-03-27 | Quest Diagnostics Investments Incorporated | Systems and methods for electronically distributing information |
WO2014144713A2 (en) | 2013-03-15 | 2014-09-18 | Immumetrix, Inc. | Methods of sequencing the immune repertoire |
ES2887726T3 (es) | 2013-06-12 | 2021-12-27 | Massachusetts Gen Hospital | Métodos, kits, y sistemas para la detección multiplexada de moléculas diana y sus usos |
EP2816496A1 (en) | 2013-06-19 | 2014-12-24 | Sophia Genetics S.A. | Method to manage raw genomic data in a privacy preserving manner in a biobank |
US9708657B2 (en) | 2013-07-01 | 2017-07-18 | Adaptive Biotechnologies Corp. | Method for generating clonotype profiles using sequence tags |
WO2015026853A2 (en) | 2013-08-19 | 2015-02-26 | Abbott Molecular Inc. | Next-generation sequencing libraries |
US20150087556A1 (en) | 2013-09-20 | 2015-03-26 | University Of Massachusetts | COMPOSITIONS AND METHODS FOR MAKING cDNA LIBRARIES FROM SMALL RNAs |
WO2015053943A1 (en) | 2013-10-09 | 2015-04-16 | Stc.Unm | Synthetic long read dna sequencing |
EP3058092B1 (en) | 2013-10-17 | 2019-05-22 | Illumina, Inc. | Methods and compositions for preparing nucleic acid libraries |
US9416414B2 (en) | 2013-10-24 | 2016-08-16 | Pacific Biosciences Of California, Inc. | Delaying real-time sequencing |
US9834814B2 (en) | 2013-11-22 | 2017-12-05 | Agilent Technologies, Inc. | Spatial molecular barcoding of in situ nucleic acids |
US9824068B2 (en) | 2013-12-16 | 2017-11-21 | 10X Genomics, Inc. | Methods and apparatus for sorting data |
WO2015094861A1 (en) | 2013-12-17 | 2015-06-25 | Clontech Laboratories, Inc. | Methods for adding adapters to nucleic acids and compositions for practicing the same |
US10296927B2 (en) | 2013-12-20 | 2019-05-21 | Iqvia Inc. | System and method for projecting product movement |
EP3087204B1 (en) | 2013-12-28 | 2018-02-14 | Guardant Health, Inc. | Methods and systems for detecting genetic variants |
WO2015103339A1 (en) | 2013-12-30 | 2015-07-09 | Atreca, Inc. | Analysis of nucleic acids associated with single cells using nucleic acid barcodes |
WO2015112948A2 (en) | 2014-01-27 | 2015-07-30 | Iafrate Anthony John | Methods for determining a nucleotide sequence |
CN107075566B (zh) | 2014-01-27 | 2021-06-15 | 阿谢尔德克斯有限责任公司 | 用于制备核酸的等温方法及相关组合物 |
CA2938080A1 (en) | 2014-01-27 | 2015-07-30 | The General Hospital Corporation | Methods of preparing nucleic acids for sequencing |
WO2015134787A2 (en) | 2014-03-05 | 2015-09-11 | Adaptive Biotechnologies Corporation | Methods using randomer-containing synthetic molecules |
US10354748B1 (en) | 2014-03-28 | 2019-07-16 | Google Llc | Storing genetic data in a storage system |
US9354922B2 (en) | 2014-04-02 | 2016-05-31 | International Business Machines Corporation | Metadata-driven workflows and integration with genomic data processing systems and techniques |
CA2943624A1 (en) | 2014-04-10 | 2015-10-15 | 10X Genomics, Inc. | Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same |
ES2777529T3 (es) | 2014-04-17 | 2020-08-05 | Adaptive Biotechnologies Corp | Cuantificación de genomas de células inmunitarias adaptativas en una mezcla compleja de células |
US10975371B2 (en) | 2014-04-29 | 2021-04-13 | Illumina, Inc. | Nucleic acid sequence analysis from single cells |
SG11201609053YA (en) | 2014-04-29 | 2016-11-29 | Illumina Inc | Multiplexed single cell gene expression analysis using template switch and tagmentation |
JP5902747B2 (ja) | 2014-04-30 | 2016-04-13 | ファナック株式会社 | 加工再開準備機能を有するレーザ加工システム |
SG11201610168YA (en) | 2014-05-16 | 2017-01-27 | Illumina Inc | Nucleic acid synthesis techniques |
WO2015196120A1 (en) | 2014-06-19 | 2015-12-23 | Somagenics, Inc. | Methods and compositions for detecting polynucleotides and fragments thereof |
CN114214314A (zh) | 2014-06-24 | 2022-03-22 | 生物辐射实验室股份有限公司 | 数字式pcr条码化 |
US10017759B2 (en) | 2014-06-26 | 2018-07-10 | Illumina, Inc. | Library preparation of tagged nucleic acid |
DK3164489T3 (da) | 2014-07-03 | 2020-08-10 | Rhodx Inc | Mærkning og vurdering af en målsekvens |
EP3169799B1 (en) | 2014-07-15 | 2019-09-04 | Qiagen Sciences, LLC | Semi-random barcodes for nucleic acid analysis |
WO2016011177A1 (en) | 2014-07-18 | 2016-01-21 | Fluidigm Corporation | Reagents and kit compositions for single-cell whole genome amplification |
US10116632B2 (en) | 2014-09-12 | 2018-10-30 | New York University | System, method and computer-accessible medium for secure and compressed transmission of genomic data |
EP3207163B1 (en) | 2014-10-15 | 2020-05-27 | Sage Science, Inc. | Apparatuses, methods and systems for automated processing of nucleic acids and electrophoretic sample preparation |
EP3212807B1 (en) | 2014-10-29 | 2020-09-02 | 10X Genomics, Inc. | Methods and compositions for targeted nucleic acid sequencing |
US9975122B2 (en) | 2014-11-05 | 2018-05-22 | 10X Genomics, Inc. | Instrument systems for integrated sample processing |
US10233490B2 (en) | 2014-11-21 | 2019-03-19 | Metabiotech Corporation | Methods for assembling and reading nucleic acid sequences from mixed populations |
SG11201705615UA (en) | 2015-01-12 | 2017-08-30 | 10X Genomics Inc | Processes and systems for preparing nucleic acid sequencing libraries and libraries prepared using same |
US20180010120A1 (en) | 2015-01-16 | 2018-01-11 | Seqwell, Inc. | Normalized iterative barcoding and sequencing of dna collections |
MX2017007938A (es) * | 2015-02-19 | 2018-01-18 | Troy Group Inc | Sistema de registro de documento seguro y encubierto. |
US10208339B2 (en) | 2015-02-19 | 2019-02-19 | Takara Bio Usa, Inc. | Systems and methods for whole genome amplification |
US10246702B1 (en) | 2015-02-23 | 2019-04-02 | New England Biolabs, Inc. | Compositions and methods for labeling target nucleic acid molecules |
EP3262214B1 (en) | 2015-02-27 | 2023-10-25 | Standard BioTools Inc. | Microfluidic device |
EP3262192B1 (en) | 2015-02-27 | 2020-09-16 | Becton, Dickinson and Company | Spatially addressable molecular barcoding |
US9785792B2 (en) | 2016-03-04 | 2017-10-10 | Color Genomics, Inc. | Systems and methods for processing requests for genetic data based on client permission data |
EP3653728B1 (en) | 2015-06-09 | 2023-02-01 | Life Technologies Corporation | Methods, systems, compositions, kits, apparatus and computer-readable media for molecular tagging |
US9771575B2 (en) | 2015-06-19 | 2017-09-26 | Agilent Technologies, Inc. | Methods for on-array fragmentation and barcoding of DNA samples |
EP3322812B1 (en) | 2015-07-13 | 2022-05-18 | President and Fellows of Harvard College | Methods for retrievable information storage using nucleic acids |
EP3332032B1 (en) | 2015-08-06 | 2023-12-27 | Pacific Biosciences Of California, Inc. | Integrated circuits for selectively addressing sparsely arranged electronic measurement devices |
US20170058332A1 (en) | 2015-09-02 | 2017-03-02 | Guardant Health, Inc. | Identification of somatic mutations versus germline variants for cell-free dna variant calling applications |
KR102160864B1 (ko) | 2015-10-01 | 2020-09-28 | 디엔에이넛지 리미티드 | 생물학적 정보를 보안적으로 전송하는 방법, 장치 및 시스템 |
CN108350499B (zh) | 2015-11-19 | 2022-05-13 | 10X基因组学有限公司 | 可转化标记组合物、方法及结合其的过程 |
US10612089B2 (en) | 2016-01-12 | 2020-04-07 | Bio-Rad Laboratories, Inc. | Synthesizing barcoding sequences utilizing phase-shift blocks and uses thereof |
WO2017139690A1 (en) | 2016-02-11 | 2017-08-17 | 10X Genomics, Inc. | Cell population analysis using single nucleotide polymorphisms from single cell transcriptomes |
US10640822B2 (en) | 2016-02-29 | 2020-05-05 | Iridia, Inc. | Systems and methods for writing, reading, and controlling data stored in a polymer |
WO2017184677A1 (en) | 2016-04-21 | 2017-10-26 | President And Fellows Of Harvard College | Method and system of nanopore-based information encoding |
US10619205B2 (en) | 2016-05-06 | 2020-04-14 | Life Technologies Corporation | Combinatorial barcode sequences, and related systems and methods |
US10301677B2 (en) | 2016-05-25 | 2019-05-28 | Cellular Research, Inc. | Normalization of nucleic acid libraries |
US10240196B2 (en) | 2016-05-27 | 2019-03-26 | Agilent Technologies, Inc. | Transposase-random priming DNA sample preparation |
US10296709B2 (en) | 2016-06-10 | 2019-05-21 | Microsoft Technology Licensing, Llc | Privacy-preserving genomic prediction |
US10370701B2 (en) | 2016-06-17 | 2019-08-06 | Pacific Biosciences Of California, Inc. | Methods and compositions for generating asymmetrically-tagged nucleic acid fragments |
US10190155B2 (en) | 2016-10-14 | 2019-01-29 | Nugen Technologies, Inc. | Molecular tag attachment and transfer |
DK3529357T3 (da) | 2016-10-19 | 2022-04-25 | 10X Genomics Inc | Fremgangsmåder til stregkodning af nukleinsyremolekyler fra individuelle celler |
AU2017345562B2 (en) | 2016-10-19 | 2024-01-25 | Illumina Singapore Pte. Ltd. | Methods for chemical ligation of nucleic acids |
US11667951B2 (en) | 2016-10-24 | 2023-06-06 | Geneinfosec, Inc. | Concealing information present within nucleic acids |
WO2018089944A1 (en) | 2016-11-11 | 2018-05-17 | uBiome, Inc. | Method and system for fragment assembly and sequence identification |
WO2018089860A1 (en) | 2016-11-11 | 2018-05-17 | 2D Genomics Inc. | Methods for processing nucleic acid samples |
US10447661B1 (en) | 2016-12-23 | 2019-10-15 | Iqvia Inc. | System and method for privacy-preserving genomic data analysis |
GB2559319B (en) | 2016-12-23 | 2019-01-16 | Cs Genetics Ltd | Reagents and methods for the analysis of linked nucleic acids |
WO2018132459A1 (en) | 2017-01-10 | 2018-07-19 | Paragon Genomics, Inc. | Methods and compositions for reducing redundant molecular barcodes created in primer extension reactions |
US10347365B2 (en) | 2017-02-08 | 2019-07-09 | 10X Genomics, Inc. | Systems and methods for visualizing a pattern in a dataset |
US11174512B2 (en) | 2017-05-31 | 2021-11-16 | Molecular Assemblies, Inc. | Homopolymer encoded nucleic acid memory |
EP3642363A1 (en) | 2017-06-20 | 2020-04-29 | Bio-Rad Laboratories, Inc. | Mda using bead oligonucleotide |
US10296842B2 (en) | 2017-07-21 | 2019-05-21 | Helix OpCo, LLC | Genomic services system with dual-phase genotype imputation |
US10162678B1 (en) | 2017-08-14 | 2018-12-25 | 10X Genomics, Inc. | Systems and methods for distributed resource management |
US10748643B2 (en) | 2017-08-31 | 2020-08-18 | 10X Genomics, Inc. | Systems and methods for determining the integrity of test strings with respect to a ground truth string |
-
2017
- 2017-10-24 US US16/344,004 patent/US11667951B2/en active Active
- 2017-10-24 EP EP17865703.7A patent/EP3529400B1/en active Active
- 2017-10-24 JP JP2019543186A patent/JP6941680B2/ja active Active
- 2017-10-24 CA CA3041645A patent/CA3041645C/en active Active
- 2017-10-24 ES ES17865703T patent/ES2870639T3/es active Active
- 2017-10-24 CN CN201780073821.XA patent/CN110312825A/zh active Pending
- 2017-10-24 IL IL266197A patent/IL266197B2/en unknown
- 2017-10-24 WO PCT/US2017/058076 patent/WO2018081113A1/en unknown
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6537747B1 (en) * | 1998-02-03 | 2003-03-25 | Lucent Technologies Inc. | Data transmission using DNA oligomers |
DE60032259D1 (de) * | 1999-05-06 | 2007-01-18 | Sinai School Medicine | Steganographie auf DNA basis |
CN102737167A (zh) * | 2001-05-25 | 2012-10-17 | 株式会社日立制作所 | 用于处理关于核苷酸序列的信息的方法、设备及系统 |
US20040142325A1 (en) * | 2001-09-14 | 2004-07-22 | Liat Mintz | Methods and systems for annotating biomolecular sequences |
CA2624324A1 (en) * | 2005-10-06 | 2007-04-19 | Lucigen Corporation | Thermostable viral polymerases and methods of use |
WO2009001135A2 (en) * | 2007-06-25 | 2008-12-31 | Cythera Technologies Limited | Combinatorial libraries and related methods |
CN103154273A (zh) * | 2010-09-21 | 2013-06-12 | 群体遗传学科技有限公司 | 通过分子计数提高等位基因调用的置信度 |
CA2833917A1 (en) * | 2011-04-28 | 2012-11-01 | The Board Of Trustees Of The Leland Stanford Junior University | Identification of polynucleotides associated with a sample. |
US20150133317A1 (en) * | 2011-04-28 | 2015-05-14 | Department Of Veterans Affairs | Identification of polynucleotides associated with a sample |
US20130029855A1 (en) * | 2011-07-25 | 2013-01-31 | Bioinventors & Entrepreneurs Network, Llc | Sieving of Nucleic Acid Samples |
CN104812947A (zh) * | 2012-07-17 | 2015-07-29 | 考希尔股份有限公司 | 检测遗传变异的系统和方法 |
CA2894694A1 (en) * | 2012-12-14 | 2014-06-19 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US20140206554A1 (en) * | 2012-12-14 | 2014-07-24 | 10X Technologies, Inc. | Methods and Systems for Processing Polynucleotides |
WO2015117145A1 (en) * | 2014-02-03 | 2015-08-06 | The University Of Chicago | Compositions and methods for quantitative assesment of dna-protein complex density |
US20150232929A1 (en) * | 2014-02-18 | 2015-08-20 | Illumina, Inc. | Methods and compositions for dna profiling |
WO2017100496A1 (en) * | 2015-12-11 | 2017-06-15 | Shoreline Biome, Llc | Methods for dna preparation for multiplex high throughput targeted sequencing |
Non-Patent Citations (1)
Title |
---|
QUAIL等: "SASI-Seq: sample assurance Spike-Ins, and highly differentiating 384 barcoding for Illumina sequencing", 《BIOMED CENTRAL》 * |
Also Published As
Publication number | Publication date |
---|---|
CA3041645A1 (en) | 2018-05-03 |
ES2870639T3 (es) | 2021-10-27 |
EP3529400B1 (en) | 2021-02-17 |
IL266197B1 (en) | 2023-11-01 |
CA3041645C (en) | 2021-11-02 |
JP6941680B2 (ja) | 2021-09-29 |
US11667951B2 (en) | 2023-06-06 |
JP2019533478A (ja) | 2019-11-21 |
IL266197A (en) | 2019-06-30 |
IL266197B2 (en) | 2024-03-01 |
WO2018081113A1 (en) | 2018-05-03 |
US20190233877A1 (en) | 2019-08-01 |
EP3529400A1 (en) | 2019-08-28 |
EP3529400A4 (en) | 2020-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Eusebi et al. | Genomic tools for effective conservation of livestock breed diversity | |
CN102770558B (zh) | 由母本生物样品进行胎儿基因组的分析 | |
Duan et al. | Recent advances in detecting mitochondrial DNA heteroplasmic variations | |
US11319589B2 (en) | Methods of determining the presence or absence of a plurality of target polynucleotides in a sample | |
Malenfant et al. | Design of a 9K illumina BeadChip for polar bears (U rsus maritimus) from RAD and transcriptome sequencing | |
Utsunomia et al. | A glimpse into the satellite DNA library in Characidae fish (Teleostei, Characiformes) | |
Darvasi et al. | Complexities in the genetic dissection of quantitative trait loci | |
CN110312825A (zh) | 隐藏核酸内存在的信息 | |
Milani et al. | Satellite DNAs unveil clues about the ancestry and composition of B chromosomes in three grasshopper species | |
Zhao et al. | Microsatellite markers for animal identification and meat traceability of six beef cattle breeds in the Chinese market | |
CN109477141A (zh) | 样品鉴定方法 | |
Ito et al. | Population genetic diversity and hybrid detection in captive zebras | |
Guimaraes et al. | A cost‐effective high‐throughput metabarcoding approach powerful enough to genotype~ 44 000 year‐old rodent remains from Northern Africa | |
Lisachov et al. | Whole-chromosome fusions in the karyotype evolution of Sceloporus (Iguania, Reptilia) are more frequent in sex chromosomes than autosomes | |
Kroupin et al. | Pipeline for the rapid development of cytogenetic markers using genomic data of related species | |
Rodionov et al. | Combination of multiple microsatellite analysis and genome-wide SNP genotyping helps to solve wildlife crime: A case study of poaching of a caucasian tur (Capra caucasica) in Russian mountain national park | |
McNevin | Forensic inference of biogeographical ancestry from genotype: The Genetic Ancestry Lab | |
Deniskova et al. | Maternal origins and haplotype diversity of seven Russian goat populations based on the D-loop sequence variability | |
Nanda et al. | Evolution of the degenerated Y-chromosome of the swamp guppy, Micropoecilia picta | |
Wojciechowska et al. | From wisent to the lab and back again—A complex SNP set for population management as an effective tool in European Bison conservation | |
Liu et al. | A unified STR profiling system across multiple species with whole genome sequencing data | |
Smołucha et al. | Use of the HRM method in quick identification of FecXO mutation in highly prolific olkuska sheep | |
Primrose et al. | Genomics: applications in human biology | |
Bouffet-Halle et al. | Characterisation and cross-amplification of sex-specific genetic markers in Australasian Egerniinae lizards and their implications for understanding the evolution of sex determination and social complexity | |
Kulkarni et al. | Use of targeted amplicon sequencing in peanut to generate allele information on allotetraploid sub-genomes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20191008 |
|
WD01 | Invention patent application deemed withdrawn after publication |