CN115667511A - 多核苷酸序列的按需合成 - Google Patents

多核苷酸序列的按需合成 Download PDF

Info

Publication number
CN115667511A
CN115667511A CN202180033416.1A CN202180033416A CN115667511A CN 115667511 A CN115667511 A CN 115667511A CN 202180033416 A CN202180033416 A CN 202180033416A CN 115667511 A CN115667511 A CN 115667511A
Authority
CN
China
Prior art keywords
oligonucleotide
nucleotides
long
oligonucleotides
short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180033416.1A
Other languages
English (en)
Inventor
K·坎南
J·E·吉尔
D·G·吉布森
L·付
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cordus Dna
Original Assignee
Cordus Dna
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cordus Dna filed Critical Cordus Dna
Publication of CN115667511A publication Critical patent/CN115667511A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/13Exoribonucleases producing 5'-phosphomonoesters (3.1.13)
    • C12Y301/13003Oligonucleotidase (3.1.13.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/02Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2) hydrolysing N-glycosyl compounds (3.2.2)
    • C12Y302/02028Double-stranded uracil-DNA glycosylase (3.2.2.28)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y605/00Ligases forming phosphoric ester bonds (6.5)
    • C12Y605/01Ligases forming phosphoric ester bonds (6.5) forming phosphoric ester bonds (6.5.1)
    • C12Y605/01001DNA ligase (ATP) (6.5.1.1)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了合成具有所需和/或定义序列的产物DNA分子的方法。所述方法涉及将至少一个长寡核苷酸和至少一个短寡核苷酸退火到至少一个锚定链上,所述锚定链具有与所述至少一个长寡核苷酸和至少一个短寡核苷酸至少部分互补的序列。退火后,与锚定链结合的至少一个长寡核苷酸邻接与同一锚定链结合的至少一个短寡核苷酸。所述锚定链具有一个或多个非标准核苷酸,以及任选的一个或多个简并核苷酸。所述方法涉及连接所述相邻的至少一个长寡核苷酸和至少一个短寡核苷酸,以形成dsDNA分子。本发明还提供了通过组装含有少于20,000个成员的库的寡核苷酸成员来合成DNA分子的方法,这些成员可以组装成所有可能的DNA序列。

Description

多核苷酸序列的按需合成
发明背景
相关申请的交叉引用
本申请根据35 U.S.C.§119(e)要求于2020年5月15日提交的美国序列号63/025,696的优先权,所述美国序列号的全部内容通过引用整体并入本文。
序列表的合并
所附序列表中的材料特此通过引用并入本申请中。随附的序列表文本文件名称为CODEX2260—IWO—SL.txt,创建于2021年5月12日,并且大小为20.0kb。可以在使用WindowsOS的计算机上使用Microsoft Word访问该文件。
技术领域
本发明涉及合成生物学和从寡核苷酸部分的文库组装多核苷酸分子。
背景技术
合成生物学和基因编辑和治疗学领域对多样和已知序列的寡核苷酸的需求持续且不断增长。用于合成小寡核苷酸的现有方法涉及通过核苷酸的固相、顺序偶联进行化学合成,以生成所需长度和序列的寡核苷酸。然后将产生的寡核苷酸从固相中释放出来,脱保护,并通过其它方法收集以组装成更大的寡核苷酸。虽然是自动化的,但这些过程容易受到副反应和碱基错误的影响,从而限制了产生的寡核苷酸的长度。对于需要超高序列保真度的应用,这些方法还有额外的限制。
合成寡核苷酸的酶方法也存在,并且涉及使用酶,如末端脱氧核苷酸转移酶(TdT),这是一种模板无关的聚合酶,其催化将脱氧核糖核苷酸掺入DNA模板的3'-羟基末端。但该酶对特定的核苷酸碱基表现出强烈的偏倚,并且不能可靠地以所需的顺序和长度添加核苷酸。
仍然需要高效和高保真度的寡核苷酸合成方法,以便用户能够产生任何所需长度和序列的寡核苷酸。
发明内容
本发明提供了合成具有所需和/或定义序列的产物DNA分子的方法。所述方法涉及将至少一个长寡核苷酸和至少一个短寡核苷酸退火到至少一个锚定链上,所述锚定链具有与所述至少一个长寡核苷酸和至少一个短寡核苷酸至少部分互补的序列。退火后,与锚定链结合的至少一个长寡核苷酸邻接与同一锚定链结合的至少一个短寡核苷酸。所述锚定链具有一个或多个非标准核苷酸,以及任选的一个或多个简并核苷酸。所述方法涉及连接所述相邻的至少一个长寡核苷酸和至少一个短寡核苷酸,以形成dsDNA分子。使所述dsDNA分子与一种或多种酶接触,所述一种或多种酶降解包括非标准核苷酸的DNA,从而合成所述产物DNA分子。本发明还提供了通过组装含有少于20,000个成员的文库的寡核苷酸成员来合成DNA分子的方法,这些成员可以组装成所有可能的DNA序列。
在第一方面,本发明提供了一种合成具有所需序列的产物DNA分子的方法。所述方法涉及将至少一个长寡核苷酸和至少一个短寡核苷酸退火到至少一个锚定链上,所述锚定链具有与所述至少一个长寡核苷酸和至少一个短寡核苷酸至少部分互补的序列。退火后,与锚定链结合的至少一个长寡核苷酸邻接与同一锚定链结合的至少一个短寡核苷酸。所述至少一个锚定链具有一个或多个非标准核苷酸,以及任选的一个或多个简并核苷酸。所述方法进一步涉及连接所述相邻的至少一个长寡核苷酸和至少一个短寡核苷酸,以形成包括非标准核苷酸的dsDNA分子,以及使所述dsDNA分子与一种或多种酶接触,所述一种或多种酶降解包括一个或多个非标准核苷酸的DNA,从而合成所述产物DNA分子。
在一个实施例中,所述退火发生在包括两个长寡核苷酸、两个短寡核苷酸和两个锚定链的结合集内,并且进一步包括将所述两个短寡核苷酸连接到所述两个长寡核苷酸,其中所述长寡核苷酸和短寡核苷酸进一步包括可变核苷酸。所述退火可以发生在包括两个长寡核苷酸、一个短寡核苷酸和至少一个锚定链的结合集中,并且其中所述短寡核苷酸连接到两个长寡核苷酸,并且所述短寡核苷酸和两个长寡核苷酸包括可变核苷酸。在任何实施例中,所述非标准核苷酸可以是脱氧尿苷。所述dsDNA分子只能在一个链上具有所述非标准核苷酸。
在任何实施例中,所述方法还可以包含使用DNA扩增方法扩增所述产物DNA分子的步骤。在任何实施例中,所述方法可以包含在所述产物DNA分子上执行PCR的多个循环。所述产物DNA分子可以具有侧翼序列,用于退火在PCR的所述多个循环中使用的引物。在任何实施例中,所述产物DNA分子的长度可以为8-30个核苷酸。所述连接可以通过DNA连接酶进行。在一个实施例中,所述至少一个长寡核苷酸的长度为12-24个核苷酸,并且所述至少一个短寡核苷酸的长度为3-8个核苷酸。在另一个实施例中,所述至少一个长寡核苷酸的长度为12-24个核苷酸,并且所述至少一个短寡核苷酸的长度为3-8个核苷酸,并且所述至少一个锚定链的长度为20-60个核苷酸。
在任何实施例中,所述方法可以包含在溶液中通过钝端连接并根据所需序列连接具有双链末端的两个DNA分子的步骤。在一个实施例中,退火后,第一短寡核苷酸邻接第一长寡核苷酸,并且第二短寡核苷酸邻接第二长寡核苷酸,并且所述方法涉及连接所述第一短寡核苷酸和长寡核苷酸,以及连接所述第二短寡核苷酸和长寡核苷酸。
在另一个实施例中,退火后,所述至少一个短寡核苷酸邻接第一长寡核苷酸和第二长寡核苷酸,并且所述方法涉及将所述至少一个短寡核苷酸连接到所述第一长寡核苷酸和第二长寡核苷酸。在各个实施例中,降解包括非标准核苷酸的DNA的一种或多种酶是选自尿嘧啶DNA糖基化酶、核酸内切酶VIII和核酸外切酶T的一种或多种酶。
在任何实施例中,每个锚定链具有4-6个可变和/或4-6个简并核苷酸,所述核苷酸存在于单个简并区域中。在任何实施例中,所述长寡核苷酸和短寡核苷酸各自具有4-6个可变核苷酸。在一个实施例中,所述两个长寡核苷酸还具有可变核苷酸,所述可变核苷酸在退火步骤期间与它们各自至少部分互补的锚定链上的简并核苷酸结合。在一个实施例中,所述长寡核苷酸、短寡核苷酸和锚定链各自包括4-6个可变核苷酸。
在一些实施例中,所述产物DNA分子可以是长度为8-30个核苷酸的单链DNA或双链DNA,不包含侧翼序列。在其它实施例中,所述产物DNA分子是长度为16-20个寡核苷酸的单链DNA或双链DNA。
在任何实施例中,所述长寡核苷酸和短寡核苷酸都可以从寡核苷酸文库提供给所述方法。在一些实施例中,从所述寡核苷酸文库提供的所述短寡核苷酸的长度为3-7个核苷酸。所述寡核苷酸文库可以包含长寡核苷酸成员,其在可变核苷酸的每个位置处具有所有四种可能的核苷酸。所述长寡核苷酸可以具有可变区域,所述可变区域退火到所述一个或多个锚定链上的简并核苷酸的序列。
在所述方法的任何实施例中,所述短寡核苷酸和长寡核苷酸包括4-6个可变核苷酸,所述锚定链包括4-6个简并核苷酸,所述锚定链包括至少两个脱氧尿苷单磷酸盐核苷酸,并且所述产物DNA分子通过PCR扩增。
在任何实施例中,所述产物DNA分子可以具有小于1/25,000的错误率。在任何实施例中,所述至少一个长寡核苷酸、至少一个短寡核苷酸和至少一个锚定链可以选自具有少于20,000个成员的寡核苷酸文库,所述寡核苷酸文库可以含有足以合成所有可能的核苷酸序列的寡核苷酸。
在任何实施例中,所述方法还可以涉及使所述产物DNA分子与IIS型限制性核酸内切酶接触以生成具有单链悬垂的产物DNA分子的步骤。所述IIS型限制性核酸内切酶可以是任何的,例如BsaI和/或BsmBI。在一个实施例中,所述产物DNA分子编码非遗传信息。所述产物DNA分子可以具有对应于信息字节的序列。在任何实施例中,PCR的所述多个循环可以包含使用具有非标准核苷酸的引物将两个核苷酸从所述引物的3'末端嵌入的PCR的第一步。
在一个实施例中,所述产物DNA分子可以编码gRNA,并且所述侧翼序列可以编码一个或多个转录元件。在任何实施例中,所述转录元件可以是启动子、Cas9手柄和终止子的任何一个或多个。
另一方面,本发明提供了一种合成产物DNA分子的方法。所述方法涉及提供寡核苷酸文库,其中所述寡核苷酸文库具有少于20,000个寡核苷酸成员,并且所述文库中的所述寡核苷酸成员可以组装成所有可能的多核苷酸序列;以及从所述文库中组装寡核苷酸成员以获得所述产物DNA分子。在一个实施例中,所述寡核苷酸文库存在于固相上,并且所述寡核苷酸成员存在于所述寡核苷酸文库内定义的物理位置处。所述固相可以是DNA芯片。所述产物DNA分子可以是长度为8-30个碱基对的双链DNA。所述产物DNA分子可以经受连续的方法,以将所述产物DNA分子与至少一个额外的DNA分子连接起来,以产生更大的产物DNA分子。在一些实施例中,所述文库具有少于16,000个寡核苷酸成员。所述更大的产物DNA分子的长度为至少1,000bp。所述产物DNA分子可以具有小于1/10,000的错误率。
在一个实施例中,组装寡核苷酸成员涉及将至少一个长寡核苷酸和至少一个短寡核苷酸退火到至少一个锚定链上,所述锚定链具有与所述至少一个长寡核苷酸和至少一个短寡核苷酸至少部分互补的序列,并且退火后,与锚定链结合的至少一个长寡核苷酸邻接与同一锚定链结合的至少一个短寡核苷酸,并且所述至少一个锚定链可以具有一个或多个非标准核苷酸,以及任选的一个或多个简并核苷酸;以及连接所述相邻的至少一个长寡核苷酸和至少一个短寡核苷酸,以形成具有非标准核苷酸的dsDNA分子;以及使所述dsDNA分子与一种或多种酶接触,所述一种或多种酶降解具有一个或多个非标准核苷酸的DNA,从而合成所述产物DNA分子。
另一方面,本发明提供了一种试剂盒,其含有20,000个或更少(更少)寡核苷酸成员的文库,其中所述文库中的所述寡核苷酸成员可以组装成每种可能的多核苷酸序列。所述试剂盒的所述寡核苷酸成员可以在定义的位置处分离并在空间上分离。在一个实施例中,所述文库存在于DNA芯片上。
另一方面,本发明提供了一种寡核苷酸文库,其具有少于20,000个定义的位置并且在每个位置处具有寡核苷酸文库成员。所述寡核苷酸文库成员可以组装成每种可能的多核苷酸序列。在一个实施例中,多核苷酸序列的长度小于10Mbp。
附图说明
图1A-1B;图1A提供了使用两个短寡核苷酸和两个长寡核苷酸和两个锚定链的被称为实施例1(E1)的本发明实施例的示意图。O2和O3是由可变核苷酸构成的短寡核苷酸。O2与O5的可变区域结合,并且O3与O6的可变区域结合。图1B提供了使用一个短寡核苷酸和两个长寡核苷酸和一个锚定链的被称为实施例2(E2)的本发明实施例的示意图。dU被描绘成寡核苷酸序列的一部分。O2与O4的可变区域结合。
图2描绘了用于去除侧翼的实施例。在PCR反应之后,产生的dsDNA具有定义序列的16-20个核苷酸,所述定义序列的两侧是用于PCR的通用引物位点。在本实施例中,脱氧尿苷是非标准核苷酸,并且降解或消化锚定链涉及与尿嘧啶DNA糖基化酶(UDG)和DNA糖基化酶-核酸内切酶III和核酸外切酶接触,从而产生定义序列的8-30个核苷酸dsDNA。dU被描绘成寡核苷酸序列的一部分。
图3是不同GC含量的产物DNA分子的组装示意图。根据实例1和图1A的程序组装了四个寡核苷酸序列(SEQ ID NO:1-4),其GC范围为30-60%。组装了20bp的DNA产物,其具有18bp的侧翼序列。dU被描绘成寡核苷酸序列的一部分。
图4是不同GC含量的产物DNA分子的组装示意图。根据实例2和图1B的程序组装了四个寡核苷酸序列(SEQ ID NO:5-8),其GC范围为30-60%。组装了16bp的DNA产物,其具有18bp的侧翼序列。dU被描绘成寡核苷酸序列的一部分。
图5提供了使用本发明中的限制性核酸内切酶生成具有“粘性”末端的产物DNA分子的示意图。限制性核酸内切酶从识别位点切除一定数量的核苷酸。图5公开了SEQ ID NO:51-57、55-56、54、59、58、57和60-61。
图6提供了本发明的用于在DNA中存储数字信息的实施例的示意图。产生了16bp的产物DNA分子,其编码四个信息字节。这些实例展示了如何使用本发明的方法将非遗传信息(此处为“戴帽子的猫”)编码为DNA。图6公开了SEQ ID NO:51-53、55和62-68。
图7是本发明的应用于合成120bp的产物DNA的实施例的示意图,所述产物DNA是具有转录元件启动子、向导RNA、Cas9手柄和终止子的初始向导结构。在本实施例中,PCR的第一个循环利用在其3'末端具有两个可变碱基的两个引物。这将原本16bp的产物DNA分子转化为20bp的产物。PCR的后续步骤掺入了转录元件。
具体实施方式
本发明提供了使用寡核苷酸文库组装具有高保真度的任何序列的DNA分子的方法。所述方法涉及使用具有DNA分子成员的寡核苷酸文库,使得可以使用所述方法从所述文库组装所有可能的DNA序列。在一个实施例中,所述寡核苷酸文库具有少于20,000个成员。
已经做出了许多努力,以实现从具有有限数量的成员的文库中组装任何可能的DNA序列的方法。本发明人发现,任何可能的DNA序列都可以使用本文公开的材料和方法方便地组装。因此,本发明能够创建少于20,000个寡核苷酸的文库,从中可以组装所有可能的寡核苷酸序列。少于20,000个寡核苷酸的文库可以方便地提供在小型装置(例如DNA芯片)上,并且提供装置和仪器以仅使用寡核苷酸文库的成员选择性地组装任何DNA序列。
在一些实施例中,本发明提供了合成长度为8-30个核苷酸的寡核苷酸的方法,所述核苷酸可用作构建块,以便进一步组装成更大的寡核苷酸。本发明还提供了一种预制寡核苷酸的文库,其可以含有少于20,000个成员。本发明还提供了通过从文库中组装寡核苷酸来合成DNA分子的方法。文库的成员可以组装成所有可能的DNA序列。还提供了用于进行所述方法的试剂盒。本发明不依赖于TdT(末端脱氧核苷酸转移酶)酶,也不需要其逐碱基合成寡核苷酸。
寡核苷酸文库
在各个实施例中,文库中的寡核苷酸成员可以是各种长度的DNA。文库可以具有长寡核苷酸成员和短寡核苷酸成员。在各个实施例中,寡核苷酸文库可以具有少于50,000个成员、或少于40,000个成员、或少于30,000个成员、或少于20,000个成员、或少于19,000个成员、或少于18,000个成员、或少于17,000个成员或少于16,000个成员。所述方法能够使用文库中的寡核苷酸成员合成所有可能的多核苷酸序列。在各个实施例中,本发明允许组装超过40亿个(对于16聚体)和至多超过1万亿个(对于20聚体)多核苷酸,仅从文库中的那些寡核苷酸开始。在各个实施例中,文库中的每个寡核苷酸都可以在产物DNA分子的合成中使用100至10,000次。组装的产物DNA分子可以是任何大小,例如其可以小于1Mbp或小于5Mbp或小于10Mbp或小于12Mbp,或小于13Mbp,或小于14Mbp,或小于15Mbp或为1-10Mbp,或1-12Mbp,或1-15Mpb。术语“寡核苷酸(oligo和oligonucleotide)”在本文中可互换使用,并且表示通常长度较短的核苷酸的聚合物。“多核苷酸”是一个通用术语,其表示任何长度的核苷酸的聚合物。
在其它实施例中,所述方法还可以与甚至更小的文库一起使用,以组装可能需要的大量序列,例如,所述文库可以具有少于14,000个成员或少于12,000个成员,或少于10,000个成员或少于8,000个成员,或少于7,000个成员,并且用于在已定义类别中组装数量更有限和定向的序列,在所述已定义类别中,此类序列是必需的。已定义类别的实例可以包含一组与特定生物学功能相关或来自特定生物体的基因。已定义类别的实例可以包含(但不限于)与转录、调控、RNA代谢、翻译、蛋白质折叠、蛋白质输出、RNA(rRNA、tRNA、小RNA)、核糖体生物发生、rRNA修饰、DNA复制、DNA修复、DNA拓扑、DNA代谢、染色体分离、细胞分裂和tRNA修饰相关的基因或序列。
在任何实施例中,在所述方法中合成的产物DNA分子可以完全从寡核苷酸文库中合成或仅从寡核苷酸文库中合成。因此,寡核苷酸文库可以含有短寡核苷酸、长寡核苷酸和锚定链。
长寡核苷酸和短寡核苷酸
在一个实施例中,长寡核苷酸和短寡核苷酸可以是任何长度的DNA,但长寡核苷酸的长度都大于短寡核苷酸。例如,短寡核苷酸的长度可以为至多12个核苷酸,并且长寡核苷酸的长度可以大于12个核苷酸。在各个实施例中,短寡核苷酸可以具有许多长度,实例包含但不限于4-6个核苷酸(nt),或3-8个nt或4-7个nt或4-8个nt或5-7个nt或5-8个nt或6-7个nt或6-8个nt。在各个实施例中,长寡核苷酸的长度可以例如且不限于,9-18个nt或9-20个nt或9-22个nt或9-25个nt或9-30个nt或9-35个nt或10-18个nt或10-20个nt或10-22个nt或11-18个nt或11-20个nt或11-22个nt或20-24个nt或20-25个nt。长寡核苷酸和短寡核苷酸可以以本文提供的短寡核苷酸长度和长寡核苷酸长度的任意组合或亚组合存在。
在任何实施例中,长寡核苷酸的长度可以大于最长的短寡核苷酸的长度,例如短寡核苷酸的长度为5-12个核苷酸,并且长寡核苷酸的长度为至少13个核苷酸。因此,长寡核苷酸相对于短寡核苷酸可以是长的。在任何实施例中,短寡核苷酸和/或长寡核苷酸可能仅具有不带非标准碱基的核苷酸。在任何实施例中,短寡核苷酸和/或长寡核苷酸可能仅具有带有标准碱基的核苷酸,即寡核苷酸中的所有核苷酸具有碱基A(腺嘌呤)、T(胸腺嘧啶)、C(胞嘧啶)或G(鸟嘌呤)。长寡核苷酸和/或锚定链可以具有用于结合引物的序列,所述引物可用于PCR或其它DNA扩增程序。
图1A描绘了在本发明的一个实施例中使用的寡核苷酸和方法。在本实施例中,寡核苷酸1-6(O1-O6)都被描绘为具有可变区域。O1和O4是长寡核苷酸,并且O2和O3是短寡核苷酸。O5和O6是具有非标准核苷酸的锚定链,被指示为脱氧尿苷(dU)。在步骤1中,O1和O2退火至O5,并且O3和O4退火至O6。这种退火可以是同时的,但在一些实施例中不必是同时的。O2可以退火至O5,并且O3可以退火至O6,并且长寡核苷酸可以随后退火。但寡核苷酸可以按任何顺序退火。在本实施例中,长寡核苷酸和短寡核苷酸各自退火,使得它们彼此邻接并被退火至同一锚定链上。在任何实施例中,都可能发生钝端连接。双链DNA分子由O1-O6形成,因此含有一个具有一个或多个非标准核苷酸的DNA链,所述一个或多个非标准核苷酸可以全部位于两个链中的同一链上。在另一个步骤中,可能发生锚定链耗尽。所述锚定链具有一个或多个非标准核苷酸,所述一个或多个非标准核苷酸含有非标准碱基。dsDNA与一种或多种酶接触,所述一种或多种酶降解或消化具有一个或多个非标准核苷酸的DNA。降解或消化DNA可以涉及切除一个或多个非标准核苷酸(或来自这些核苷酸的碱基)、侵蚀具有非标准核苷酸的链并留下单链DNA分子,所述分子可以没有非标准碱基或只有标准碱基。然后,单链DNA分子可以任选地通过PCR或其它DNA扩增程序进行扩增,如通过将单链DNA分子与引物接触并对混合物进行PCR或其它DNA扩增程序。PCR或其它DNA扩增程序中使用的引物可以具有一个或多个非标准核苷酸(例如dU),其方式与锚定链相似或相同。O1、O4、O5和O6可以具有序列,所述序列用于结合适于完成DNA扩增过程的一个或多个引物并且可以作为侧翼序列存在。
图1B描绘了另一个实施例(实施例2,E2)。在本实施例中,寡核苷酸1-4(O1-O4)都被描绘为具有可变区域。O1和O3是长寡核苷酸,并且O2是短寡核苷酸。O4是具有非标准核苷酸的锚定链。在步骤1中,O1、O2和O3退火至O4。同样,这种退火可以是(但不一定是)同时的,并且O1、O2和O3可以按任何顺序退火至O4。在本实施例中,钝端连接不会发生,也没有必要。因此,在一些实施例(包含图1B中未描绘的附加实施例)中,所述方法不涉及钝端连接并且钝端连接不会发生。双链DNA分子由O1-O4形成,因此含有一个具有一个或多个来自O4的非标准核苷酸的DNA链。在另一个步骤中,可能发生锚定链耗尽。锚定链O4具有一个或多个非标准核苷酸,所述一个或多个非标准核苷酸含有非标准碱基。dsDNA与一种或多种酶接触,所述一种或多种酶降解或消化具有一个或多个非标准核苷酸的DNA。降解或消化DNA可以涉及切除一个或多个非标准核苷酸(或来自这些核苷酸的碱基)、侵蚀具有非标准核苷酸的链并留下单链DNA分子。然后,单链DNA分子可以通过PCR或其它DNA扩增程序进行扩增,如通过将单链DNA分子与引物接触并对混合物进行PCR或其它DNA扩增程序。在实施例中,O1、O3和O4可以具有用于结合适于完成DNA扩增过程的一个或多个引物的序列。
锚定链
在一些实施例中,锚定链可以包括一个或多个非标准核苷酸。非标准核苷酸是具有除C、G、A或T以外的核碱基的核苷酸。在一些实施例中,非标准核苷酸具有尿嘧啶作为核碱基(例如脱氧尿苷单磷酸盐)。AP位点(也被称为非碱性位点)是DNA中既没有嘌呤碱基也没有嘧啶碱基(也没有它们的衍生物)的位置,因此缺少核碱基;这些也是一类非标准碱基。非标准核苷酸的其它实例包含但不限于二羟基胸苷、胸腺乙二醇、AP位点、无嘌呤位点、嘧啶位点、5-羟基-5-甲基海因、5-羟基乙内酰脲和甲基二磺酰脲。本领域普通技术人员参照本公开将实现在本发明中将找到用途的其它非标准核苷酸。本文所用的脱氧核苷酸可指单磷酸盐、二磷酸盐或三磷酸盐形式。因此,脱氧尿苷可以表示dUMP、dUDP或dUTP中的任一者,其将通过使用的上下文被本领域普通技术人员理解。
在一些实施例中,锚定链具有一个或多个含尿嘧啶的核苷酸作为非标准核苷酸。任选地,锚定链还可以具有一个或多个简并核苷酸,其可以作为简并核苷酸区域存在。在一些实施例中,含尿嘧啶的核苷酸含有脱氧尿嘧啶,但在其它实施例中,含尿嘧啶的核苷酸可以含有尿嘧啶二醇作为核碱基。含尿嘧啶的非标准核苷酸也可由胞嘧啶脱氨或掺入脱氧尿苷磷酸盐残基引起。在一些实施例中,这种含尿嘧啶的核苷酸可以掺入锚定链中。在各个实施例中,锚定链的序列中可以具有2个或3个或4个或5个或6个或多于6个dU核苷酸。在一些实施例中,非标准核苷酸可以在锚定链中近似均匀地间隔。在各个实施例中,锚定链是寡核苷酸,其可以每隔7个或每隔8个或每隔9个或每隔10个或每隔12个或每隔15个核苷酸具有含尿嘧啶的核苷酸。虽然间隔的非标准核苷酸就足够了,但除了间隔的非标准核苷酸或代替所述间隔的非标准核苷酸,锚定链还可以具有一个或多个连续的非标准核苷酸。锚定链可以基于应用而具有任何合适的长度,但在各个实施例中,锚定链的长度可以为20-30个核苷酸,或长度为25-30个核苷酸,或者长度可以为25-40个或25-85个核苷酸或25-80个核苷酸或25-70个核苷酸或25-65个核苷酸或25-60个核苷酸。但在其它实施例中,锚定链也可以是18-65或18-85或20-65或20-85。在实施例1(E1)(图1A)的各个实施例中,锚定链的长度可以是20-35个核苷酸或20-30个nt或25-30个nt。在实施例2(E2)(图1B)的各个实施例中,锚定链的长度可以是30-40个核苷酸或30-55个或40-60个核苷酸。在任何实施例中,锚定链可以大约是长寡核苷酸和短寡核苷酸长度的组合,或长寡核苷酸和短寡核苷酸长度的80-120%或90-110%的组合。在任何实施例中,锚定链可以大约是两个长寡核苷酸和一个短寡核苷酸长度的组合,或两个长寡核苷酸和一个短寡核苷酸长度的80-120%或90-110%的组合。
使用不同长度的短寡核苷酸、长寡核苷酸和锚定链的各个实施例均可利用。在E1或E2(图1A和1B)的各个实施例中,短寡核苷酸的长度可以是4-6个核苷酸并且长寡核苷酸的长度可以是14-22个nt。在E1的其它实施例中,短寡核苷酸的长度可以是5-6个核苷酸并且长寡核苷酸的长度可以是14-22个nt;锚定链的长度可以是20-30个nt。在另一个实施例中,短寡核苷酸的长度为4-6个或5-6个核苷酸并且长寡核苷酸的长度为16-20个nt;锚定链的长度可以是20-35个nt。在E2的一些实施例中,短寡核苷酸的长度为4-6个或5-6个核苷酸并且长寡核苷酸的长度为16-20个nt;锚定链的长度可以是40-60个nt。普通技术人员利用本公开将意识到,短寡核苷酸、长寡核苷酸和锚定链的长度可以根据所考虑的特定应用进行调整。
在任何实施例中,含有一个或多个非标准核苷酸的DNA序列是一种或多种酶的底物,所述一种或多种酶降解含有非标准核苷酸的DNA。当非标准核苷酸是含尿嘧啶的核苷酸时,其可以是降解含有尿嘧啶核苷酸的DNA的一种或多种酶的底物。在一个实施例中,所述酶是尿嘧啶DNA糖基化酶(UDG),其催化脱氧尿苷中N-糖苷键的水解以释放尿嘧啶。含尿嘧啶的核苷酸也可以是核酸内切酶VIII的底物,其具有DNA糖基化酶活性和AP裂解酶活性–因此,核酸内切酶VIII可以从核苷酸中切割尿嘧啶。在一个实施例中,
Figure BDA0003924593790000101
II可用于切除尿嘧啶(马萨诸塞州伊普斯维奇的新英格兰生物实验室(New England Biolabs,Ipswich,MA))。
Figure BDA0003924593790000102
II具有尿嘧啶DNA糖基化酶活性(其切除尿嘧啶碱基)和具有裂解酶活性的核酸内切酶III(其破坏非碱性位点3'和5'侧的磷酸二酯骨架),从而促进DNA的降解。含尿嘧啶的核苷酸也可以是核酸内切酶VIII的底物,其具有N-糖基化酶活性和AP-裂解酶活性。当非标准核苷酸是受损的嘧啶时,也可以使用核酸内切酶VIII,其将切割所述受损的嘧啶以留下无嘌呤位点。核酸内切酶VIII可用于各个实施例,其中非标准碱基是尿素、5,6-二羟基胸苷、胸腺嘧啶、5-羟基-5-甲基海因、尿嘧啶二醇、6-羟基-5,6-二氢胸苷或甲基二磺酰脲中的任一者。核酸内切酶III还可以识别和去除具有这些非标准碱基的核苷酸。核酸外切酶(例如核酸外切酶T、核酸外切酶I等)可用于去除单链悬垂。普通技术人员利用本公开将实现许多其它非标准碱基和降解含有所述非标准碱基的DNA的方式,这将在本发明中找到应用。
锚定链与至少一个短寡核苷酸和至少一个长寡核苷酸至少部分互补。在一些实施例中,锚定链与至少一个短寡核苷酸和/或至少一个长寡核苷酸完全互补。锚定链可以任选地具有4个、5个、6个、7个、8个或4-6个或4-7个或4-8个或多于8个简并核苷酸,其可以作为连续序列存在或在分子中单独分散或成群分散。简并核苷酸的“区域”是两个或更多个连续的简并核苷酸位置。
方法
本发明的方法合成具有所需序列的产物DNA分子,所述所需序列可以是预定的序列,即在开始所述方法之前由用户决定的序列。在各个实施例中,所需序列的产物DNA分子的长度可以是16-20个核苷酸,或长度为6-12个或6-16个或6-20个或6-24个或12-24个核苷酸,或长度为12-25个或12-30个或12-40或12-60个或20-25个或20-30个或20-40个或20-60个或20-80个或60-120个或60-180个核苷酸。产物DNA分子可以任选地组装具有侧翼序列,可用于连续程序(例如PCR或其它DNA扩增)。侧翼序列可以是适合于所考虑的连续程序的任何长度,例如约12个核苷酸,或约18个核苷酸,或约18-22个核苷酸或18-30个核苷酸或18-60个核苷酸。所述方法涉及将至少一个长寡核苷酸和至少一个短寡核苷酸退火到至少一个锚定链上,所述锚定链具有与所述至少一个长寡核苷酸和至少一个短寡核苷酸至少部分互补的序列。在任何实施例中,长寡核苷酸和短寡核苷酸可以与锚定链的一部分完全互补。退火可以是部分退火,其中短寡核苷酸和/或长寡核苷酸中只有至少50%或至少70%或至少90%的核苷酸退火到其在至少一个锚定链上的互补核苷酸,或者可以是完全退火,其中短寡核苷酸和/或长寡核苷酸中的所有核苷酸均退火到至少一个锚定链上的互补序列。退火后,与锚定链结合的所述至少一个长寡核苷酸邻接与同一锚定链结合的至少一个短寡核苷酸。在一些实施例中,至少一个长寡核苷酸可以邻接与锚定链结合的两个短寡核苷酸,和/或至少一个短寡核苷酸可以邻接与锚定链结合的两个长寡核苷酸。至少一个长寡核苷酸和至少一个短寡核苷酸可以退火或结合到同一个锚定链上。在一个实施例中,至少一个短寡核苷酸邻接两个长寡核苷酸,并在两个长寡核苷酸之间退火,其中短寡核苷酸和长寡核苷酸被退火到锚定链上。在任何实施例中,术语与同一锚定链结合,或所述方法中被“结合”的任意两个寡核苷酸,可以指直接结合,或可以指退火的两个多核苷酸,或指通过氢键合结合的多核苷酸。氢键合的强度可以足以在本文公开的方法的步骤中将两个多核苷酸保持在一起(例如在25℃下,持续至少2分钟)。
彼此邻接并退火到同一锚定链上的至少一个长寡核苷酸和至少一个短寡核苷酸可以连接,以形成双链DNA分子(dsDNA)。所述连接可以通过连接酶进行,例如T4 DNA连接酶,但本发明中可以使用任何合适的DNA连接酶(例如Taq连接酶)。然后,dsDNA分子可以与一种或多种酶接触,所述一种或多种酶降解包括含尿嘧啶的核苷酸的DNA,以合成产物DNA分子。
因此,所述方法允许产生长度为8-30个或8-40个或8-50个或8-60个或8-70个核苷酸(不计数侧翼序列)的产物DNA分子,而不需要常规的寡核苷酸合成器,所述寡核苷酸合成器通常依赖于化学合成(例如亚磷酰胺化学)。相反,所述方法依赖于酶促合成,因此可以根据需要产生去除侧翼序列后长度为8-30个或8-40个或8-50个或8-60个或8-70个或8-80个或8-100个核苷酸的此类寡核苷酸。在其它实施例中,所述方法可以产生6-30个或6-40个或6-70个或6-90个或6-120个核苷酸的产物DNA分子(不计数侧翼序列)。
所述方法还可以涉及在产物DNA分子上执行PCR或另一种DNA扩增程序的多个循环。PCR是本领域普通技术人员所熟知的并且涉及引物的使用。在任何实施例中,在PCR或其它DNA扩增程序中使用的引物可以含有一个或多个dU核苷酸,或其它非标准核苷酸。在一些实施例中,引物可以具有两个或三个或四个或多于四个dU核苷酸,或其它非标准核苷酸。
在任何实施例中,所述方法在不使用限制性核酸内切酶的情况下执行。在任何实施例中,所述方法也可以在没有克隆或不需要克隆的情况下执行。在任何实施例中,所述方法可以完全在体外进行。在任何实施例中,在所述方法的任何步骤中,所述方法可以在不使用活细胞的情况下执行。在任何实施例中,所述方法可以产生无痕产物DNA分子。无痕DNA意指没有通过合成DNA的过程引入或从合成DNA的过程中引入的任何核苷酸(例如,来自接头或侧翼序列的残基核苷酸)。在任何实施例中,所述方法可以产生产物DNA分子,所述分子不含条形码,或者不含出于鉴定目的放置的核苷酸序列。条形码可以是不被需要但具有特定序列的序列,并且用于鉴定DNA的序列。在各个实例和实施例中,条形码序列的长度为6-8个核苷酸,或长度为4-10个核苷酸。在任何实施例中,所述方法可以在所述方法中使用的任何寡核苷酸的任何部分不被固定,即,不与固相或固相载体(例如珠、DNA芯片、微流体表面等)结合的情况下进行。在任何实施例中,寡核苷酸可以在溶液中退火,并且可以在溶液中连接,即在步骤或方法中没有任何寡核苷酸被结合或部分结合到固相或固相载体上。在任何实施例中,本发明的方法可以根据本文所述的方法合成产物DNA分子,而无需使用和无需执行化学组装技术(例如亚磷酰胺化学)。在任何实施例中,本发明的方法可以仅使用寡核苷酸的酶促组装来组装产物DNA分子。在任何实施例中,所述方法可以通过从包括少于20,000个成员的文库或从本文中描述的任何文库中绘制短寡核苷酸、长寡核苷酸和锚定寡核苷酸来执行。在任何实施例中,所述至少一个长寡核苷酸、至少一个短寡核苷酸和至少一个锚定链可以选自具有少于20,000个成员的寡核苷酸文库或选自本文中描述的任何文库。
图1A示出了涉及钝端连接的本发明实施例。在一些实施例中,短寡核苷酸可以退火至锚定链以形成具有钝端的DNA分子,并且任选地是部分单链和部分双链的。例如参考图1A,O2可以退火至O5以形成此类DNA分子,所述分子是部分单链和部分双链的并且具有钝端;相应地,O3可以退火至O6以形成另一个此类分子。在任何实施例中,图1A中描绘的两个钝端双链DNA分子(无论是部分双链还是完全双链),例如O2-O5和O3-O6(或O1-O2-O5和O3-O4-O6),都可以通过DNA连接酶在钝端连接中的溶液中连接以形成更长的DNA分子。也可能发生长寡核苷酸O1和O4的结合,使得O1和O2彼此邻接,并且O3和O4彼此邻接。随后通过使寡核苷酸与DNA连接酶接触来连接相邻的寡核苷酸可以形成DNA分子。因此,在一些实施例中,产物DNA分子的形成可以涉及两个至少部分双链的DNA分子的一个或多个钝端连接步骤。然而,在其它实施例中,O1和O2可以与O5退火以形成相邻的O1和O2(O1-O2-O5),并且O3和O4可以与O6退火以形成相邻的O3和O4(O3-O4-O6),并且形成的DNA分子可以通过钝端连接在溶液中通过DNA连接酶的作用连接以形成DNA分子。
因此,在一个实施例中,长寡核苷酸和短寡核苷酸都可以结合到同一锚定链上以形成钝端DNA分子,并且可以任选地连接在一起,然后可以通过钝端连接与另一个长寡核苷酸和短寡核苷酸连接,所述另一个长寡核苷酸和短寡核苷酸都与不同的锚定链结合并且也形成钝端DNA分子。在任何实施例中,锚定链可以比短寡核苷酸和长寡核苷酸长并且不超过短寡核苷酸和长寡核苷酸的组合长度。请注意,锚定链具有非标准碱基(图1A和1B中的dU)。连接后的dsDNA可以与降解具有非标准碱基的DNA的酶接触,例如UDG和核酸内切酶III或DNA糖基化酶-裂解酶核酸内切酶VIII。当锚定链耗尽时,会留下一个单链DNA分子。
如图1B所示,在一些实施例中,短寡核苷酸和两个长寡核苷酸可以退火到同一锚定链上,并且短寡核苷酸可以退火到位于两个长寡核苷酸之间并邻接两个长寡核苷酸的锚定链。两个长寡核苷酸、短寡核苷酸和锚定链可以是结合集,并且所述结合集可以任选地是部分单链和部分双链的。参考图1B,O1和O3是长寡核苷酸,O2是短寡核苷酸,并且O4是锚定链。O1-O3可以按任何顺序与锚定链O4结合。两个长寡核苷酸和一个短寡核苷酸可以与锚定链O4结合,其中O2位于O1和O3之间并邻接O1和O3。O2可以在寡核苷酸与锚定链O4结合后(例如通过连接酶)连接到O1和O3。O2也可以自发地与O1和O3连接。
可以任选地形成产物DNA分子,其具有到产物DNA分子的3'和5'侧的侧翼序列。在一个实施例中,这些侧翼序列可以为扩增程序(例如通过PCR)中的引物提供结合位点。侧翼序列也可以任选地具有非标准核苷酸,以便稍后去除。因此,产物DNA分子将占主导地位并在该方法中合成。在一些实施例中,产物DNA分子将含有具有引物结合位点的侧翼序列。在任何实施例中,所述方法可以包含在扩增后去除侧翼序列以产生产物DNA分子的步骤。去除侧翼序列的方法在本领域中是已知的。一种此类方法在于2018年6月14日公开的US 2018/0163254中找到,所述文献特此通过引用整体并入,包含所有表、附图和权利要求书。在一些实施例中,侧翼序列可用于向产物DNA分子添加长度,或用将在最终产物中使用的转录元件或其它有益序列包围产物DNA分子。例如,可以将侧翼序列设置为在产物DNA分子的前面提供启动子,和/或提供终止子。在一个实施例中,产物DNA分子是16-20bp的gRNA序列,并且侧翼序列可以被设置成在gRNA序列的前面提供启动子,并在之后提供Cas9手柄和终止子。因此,在一些实施例中,产物DNA分子也可以扩展以涵盖侧翼序列,与仅作为引物的结合位点相比,这可以提供更多的效用。
本文公开的任何方法都可以在自动化方法中执行,例如通过自动化仪器。自动化方法是在方法启动后不需要人为干预的方法–所述方法从那时起完成,而无需人类执行任何操作。自动化仪器可以含有用于从寡核苷酸文库中选择寡核苷酸成员的组件。可以将待组装的DNA序列上传、记录或存储在非瞬态计算机可读介质上。非瞬态计算机可读介质可以被编程为在插入或以其它方式与附接到自动化仪器或包括在自动化仪器内的处理器进行电子通信时执行自动化步骤。所述自动化步骤可以是用于执行本文公开的方法的本文公开的那些步骤。因此,本发明还提供了一种非瞬态计算机可读介质,所述非瞬态计算机可读介质用本文所述的寡核苷酸文库的每个成员的位置进行编程,其中所述寡核苷酸文库存在于所述寡核苷酸文库的合适支撑结构上。在一个实施例中,非瞬态计算机可读介质被编程为具有14,000-20,000个或15,000-20,000个或16,000-20,000个,或至多20,000个,或14,000-25,000个寡核苷酸文库成员的位置。还可以使用指令对培养基进行编程,以组合来自文库的结合集的4-6个成员,并根据本文描述的方法将结合集的成员组装成产物DNA分子。
本发明还提供了具有位于培养基上的本文所述的寡核苷酸文库的试剂盒。所述培养基可以是任何合适的培养基,例如一个或多个DNA芯片、一个或多个珠子、一个或多个96孔板、一个或多个384孔板、一个或多个微流体反应载体、一个或多个微量滴定板、一个或多个纳米滴定板、一个或多个皮量滴定板或可以保留文库的寡核苷酸成员的其它固相载体或固相表面。当使用多于一种介质时,培养基可以以足以容纳寡核苷酸文库的数量存在。含有寡核苷酸文库的培养基可以含有任何合适体积的成员,并且实例包含体积为1nl至100ul,或10nl至100ul。DNA芯片(或DNA微阵列)是具有一系列微观位置的固体表面,寡核苷酸可以附着和/或存储在所述固体表面上。
本发明的方法可以合成具有极低错误率的产物DNA分子。在各个实施例中,所述方法可以产生本文所述的任何产物DNA分子,其错误率小于1/10,000个核苷酸,或小于1/12,000个核苷酸,或小于1/15,000个核苷酸,或小于1/25,000个核苷酸,或小于1/30,000个核苷酸,或小于1/40,000个核苷酸,或小于1/50,000个核苷酸。
在任何实施例中,本文公开的方法不利用或要求在方法中使用载体。
结合集
结合集是一组寡核苷酸,其中所述集合中的每个寡核苷酸都可以按本文所述的合成产物DNA分子的方法与所述集合中的至少一个其它寡核苷酸结合。在一个实施例中,结合集含有两个长寡核苷酸、两个短寡核苷酸和两个锚定链(例如图1A中描绘的结合集)。在另一个实施例中,结合集可以含有两个长寡核苷酸、一个短寡核苷酸和至少一个锚定链(例如如图1B所示)。在其它实施例中,结合集可以含有长寡核苷酸和短寡核苷酸以及具有与两者互补的序列的锚定链。结合集可以与其它结合集结合,以形成较大的DNA分子或形成所需序列的产物DNA分子。然而,普通技术人员利用本公开将意识到,利用寡核苷酸的其它组合的其它结合集可以被组装并且根据本文所述的方法或它们的变体有效地组装产物DNA分子。例如,结合集可以利用多于两个的锚定链,或多于两个的长寡核苷酸,或多于两个的短寡核苷酸。本文还描述了可在方法中利用的附加结合集。结合集的这种替代实施例可以退火,使得至少一个长寡核苷酸和至少一个短寡核苷酸退火到锚定链上,并且至少一个长寡核苷酸邻接与锚定链结合的至少一个短寡核苷酸。
这些只是可以在方法中找到其用途的示例性结合集,而不应视为限制性。在其它实施例中,结合集可以含有三个或四个或五个或六个短寡核苷酸和两个或三个或四个长寡核苷酸。在任何实施例中,可以使用多个锚定链。仅在一些实例中,三个、四个或五个或六个锚定链可以在结合集中利用,并在本文中公开的方法中找到用途。仅在一些示例性实施例中,四个短寡核苷酸可以与两个长寡核苷酸和一个或两个锚定链一起应用。短寡核苷酸、长寡核苷酸和锚定链因此可以以任意组合形式应用,并且普通技术人员利用本公开将能够得出可以在方法中应用的寡核苷酸和锚定链的多种组合。
可变区域
在各个实施例中,短寡核苷酸和/或长寡核苷酸和锚定寡核苷酸可以具有一个或多个可变核苷酸。任何一种或多种寡核苷酸可以在具有可变核苷酸的寡核苷酸序列的一个或多个区域或部分中具有3个或4个或5个或6个或7个或3-7个或4-5个或4-6个或4-7个可变核苷酸。一个或多个可变核苷酸可以作为一个连续序列存在以包括可变区域,或者可变核苷酸可以单独分离或在整个寡核苷酸序列中以两个或更多个连续核苷酸的组的形式分离以包括可变区域。具有可变核苷酸的寡核苷酸可以代表由可变核苷酸呈现的每种可能性的不同序列。例如,O1可以具有可变区域。当可变区域为五个核苷酸时,O1可以具有1024个可能的核苷酸序列,即4x4x4x4x4等于O1的1024个可变序列。图1A中描绘的O2-O6和图1B中描绘的O1-O4也是如此,它们示出了其中任何寡核苷酸可以在寡核苷酸序列的一个或多个区域中具有一个或多个可变核苷酸的实施例。对于短寡核苷酸,寡核苷酸的每个核苷酸可以是可变的,即整个短寡核苷酸可以是一个可变区域。但是一些短寡核苷酸也可以具有分散在序列中的可变核苷酸,单独或成组,如上所述。寡核苷酸的每个可变序列都可以位于寡核苷酸文库中的不同位置。
简并核苷酸
在所述方法中使用的一个或多个锚定链可以任选地具有一个或多个简并核苷酸。在具有定义序列的寡核苷酸中,简并核苷酸是可以是A、C、T或G中的任一核苷酸。具有简并核苷酸的寡核苷酸是简并寡核苷酸。虽然类似于具有可变核苷酸的寡核苷酸,但简并寡核苷酸共定位在寡核苷酸文库中的相同(简并寡核苷酸)位置。因此,简并寡核苷酸可以作为一个群组存在于一个位置,由于简并核苷酸,每个简并寡核苷酸都有一个单独的序列。在一些实施例中,一个寡核苷酸上的简并核苷酸可以退火至另一个寡核苷酸上的可变区域,如图1A-B所示。在各个实施例中,结合集中的任何寡核苷酸都可以具有简并核苷酸,并且任何寡核苷酸都可以具有可变核苷酸。在一些实施例中,结合集中的至少两个寡核苷酸具有简并核苷酸。参照图1A,O5和O6可以具有简并寡核苷酸,或O1和O4,或O2和O3,而结合集合中的其它寡核苷酸则没有。参照图1B,O4可以具有简并核苷酸,或者O1和O3可以具有简并核苷酸,或者O2可以具有简并核苷酸,而结合集中的其它寡核苷酸则没有。
所述一个或多个锚定链可以具有3个或4个或5个或6个或7个或8个或3-5个或3-6个或3-7个或3-8个或4-5个或4-6个或4-7个或4-8个简并核苷酸。寡核苷酸中的一个或多个简并核苷酸可以作为一个连续序列存在以包括简并区域,或者简并核苷酸可以单独分离或在整个寡核苷酸(例如锚定链)中以两个或更多个连续简并核苷酸的组的形式分离。具有简并核苷酸的文库的寡核苷酸成员具有多个可能的序列并且可以组合在一起并位于文库中的单个位置,并且被认为是文库中的一个寡核苷酸成员。因此,具有例如五个简并核苷酸的简并区域的锚定寡核苷酸(或其它寡核苷酸)可以具有1024个可能的序列(4x4x4x4x4),但所有1024个序列可以共定位在文库中的单个定义位置。寡核苷酸文库中含有多个简并寡核苷酸序列的位置被称为简并寡核苷酸位置。多个简并寡核苷酸(每个序列略有不同)可以共定位在寡核苷酸文库中的单个位置。虽然在一些实施例中,所有可能的简并寡核苷酸序列都位于同一位置(例如,具有5个简并核苷酸的简并寡核苷酸的所有1024个可能的序列),但在其它实施例中,多个简并寡核苷酸可以位于寡核苷酸文库中多个不同位置处的方便数的组中。
除了简并序列之外,锚定寡核苷酸还可以具有一个或多个可变核苷酸,所述一个或多个可变核苷酸可以位于寡核苷酸的可变区域中。当锚定(或其它)寡核苷酸具有可变核苷酸(例如五个可变核苷酸)时,存在寡核苷酸的1024个可能的可变序列(4x4x4x4x4)。当寡核苷酸具有一个或多个可变核苷酸时,寡核苷酸的每个可变序列都可以位于文库中的自定义位置。因此,虽然具有一个或多个简并核苷酸的寡核苷酸共定位在文库中的单个定义位置,但具有可变核苷酸的寡核苷酸可以在文库中各自具有自定义位置,每个可能的可变序列都有一个单独的位置。寡核苷酸(如具有一个或多个简并核苷酸的锚定链)可以共定位在具有锚定链的所有1024个可能的序列的单一位置处,所述锚定链具有存在于所述单个位置处的简并核苷酸。当具有可变核苷酸的寡核苷酸也具有简并核苷酸时,简并序列也可以存在于具有可变核苷酸的寡核苷酸的所有1024个位置处,并且具有简并序列的定义位置处的每个寡核苷酸在该位置处可以具有相同的可变序列。
为了说明,考虑图1A中的寡核苷酸O5具有五个核苷酸的可变区域,以及五个核苷酸的简并区域。因此,对于O5,O5可以存在于可变位置L1...L1024,其中每个位置都具有简并序列D1...D1024和不同的可变序列中的每一个。因此,对于O5,简并序列D1-D1024可以都存在于可变位置L1-L1024中的每一个位置处,所述位置各自具有不同的可变序列。因此,在O5的位置L1处,简并序列D1-D1024将都具有可变序列V1。在O5的位置L2处,简并序列D1-D1024将都具有可变序列V2。在O5的位置L3处,简并序列D1-D1024将都具有可变序列V3,依此类推。因此,对于O5,简并序列D1-D1024都存在于O5的位置L1-L1024处,其中每个简并序列都具有特定位置的可变序列。至于图1A中的O1-O4,这些寡核苷酸只有可变区域,没有简并核苷酸。因此,如果各自具有五个核苷酸的可变区域,则每个寡核苷酸存在1024个可能的序列(4x4x4x4x4),对于每个寡核苷酸,这些序列可以存在于文库中的1024个不同位置(L1...L1024)。因此,一个寡核苷酸上的可变区域可以退火至互补寡核苷酸上的可变区域和/或简并区域。
寡核苷酸文库
本发明还提供了合成产物DNA分子的方法,所述方法涉及提供寡核苷酸成员的文库。寡核苷酸成员的文库可以具有少于20,000个寡核苷酸成员,并且文库中的寡核苷酸成员可以组装成所有可能的多核苷酸序列。所述方法涉及从文库中组装寡核苷酸成员以获得产物DNA分子。
参照图1A,所有寡核苷酸O1-O6都是文库中的成员。O1、O2、O3和O4可以各自任选地具有一个或多个可变区域。寡核苷酸文库可以是一个或多个DNA芯片、固相载体、固相、珠子、微流体表面、板等,或其中寡核苷酸可以存储在定义的位置并可用于检索和在方法中使用的其它结构。因此,在一些实施例中,文库将含有O1、O2、O3和O4的每个可能的可变序列的不同位置(在O1-O4各自具有可变区域的实施例中)。当O1-O4的可变区域具有5个可变核苷酸时,容纳寡核苷酸的可能序列的位置数为4的5次方(45),因此为4x4x4x4x4。因此,在一些实施例中,在1024个定义的位置处存在一个定义的寡核苷酸序列,其中在每个位置处存在单个或唯一的定义序列。因此,O1寡核苷酸可以有1024个可能的序列,这些序列可以存在于O1的1024个定义位置,其中每个位置都有一个定义的序列。每个寡核苷酸可以有或多或少5个可变核苷酸。因此,将认识到,任何寡核苷酸都可以具有可变区域和/或简并区域。在一个实施例中,只有锚定链同时具有可变区域和简并区域。
考虑以图1A的实施例为例,其中寡核苷酸O1-O6在可变区域中具有五个可变核苷酸,并在简并区域中具有五个简并核苷酸。在本实施例中,O2和O3均为短寡核苷酸,各自仅包括五个可变核苷酸;O1和O4各自具有一个可变区域,因此各自具有1,024个位置。因此,对于O1-O4中的每一个,文库可以有1024个位置,即4,096个位置。在此实例中,O5和O6各自具有五个可变核苷酸和五个简并核苷酸。因此,文库还可以针对O5和O6中的每一个具有1,024个位置,其中每个位置具有不同的可变序列,并且所有可能的简并序列(因此,1,024个简并寡核苷酸序列)一起存在于每个可变序列的1,024个位置中的每一个位置处。因此,此实例在文库中总共给出了6,144个不同的位置。
类似地,考虑图1B的实施例,寡核苷酸O1-O4可以在可变区域中具有五个可变核苷酸。O4可以进一步在简并区域中具有五个简并核苷酸,其中所述简并核苷酸都可以与每个特定的可变序列共定位。O2是仅包括五个可变核苷酸的短寡核苷酸;O1和O3是长寡核苷酸并且各自具有一个可变区域,因此各自具有1,024个位置。因此,对于O1-O4中的每一个,文库可以有1,024个位置,即文库中的4,096个不同位置。但在其它实施例中,结合集中只有一些寡核苷酸可以具有可变核苷酸。
寡核苷酸文库中的位置可以是孔、管或将寡核苷酸成员分离在不同位置(在空间上与文库的其它成员充分分离,以便其在这个不同的位置处被单独和作为物种访问)的任何其它结构。寡核苷酸可以维持在其不同的位置处,作为单个分子(可以从中合成互补序列)或作为同一分子的多个拷贝(可以从中获取少量并用于合成过程)。由于简并区域,一些寡核苷酸文库成员将具有多于一个实际序列。不同的位置可由软件程序鉴定,所述软件程序可以被配置成机械组件或装置,所述机械组件或装置从不同的位置检索文库成员,以便在需要定义的寡核苷酸文库成员的方法中使用。在一个实施例中,寡核苷酸文库可以位于一系列小管中,这些小管各自含有寡核苷酸文库的成员,并且其仪器组件可以根据位于非瞬态计算机可读介质上的指令去检索寡核苷酸文库成员。非瞬态计算机可读介质还可以含有用于合成产物DNA分子的编程指令和/或步骤,并且所述编程指令和/或步骤可以被提供给与计算机可读介质通信的仪器。所述编程指令或步骤可以指示仪器根据本文公开的任何方法执行预定序列的DNA分子的组装,或执行本文提供的任何方法。
寡核苷酸文库的成员存在于不同的位置,在空间上与文库的其它成员分离。文库的成员可以是存在于其位置处的特定序列(单个或多个拷贝)。但成员也可以是存在于不同位置或定义位置的一组相似序列。当使用简并序列时,考虑到简并核苷酸的数量,含有简并序列的文库中的成员可以是所有可能的简并序列(或在一些实施例中是所有可能序列的子集),并且存在于不同的位置。例如,对于具有5个简并核苷酸区域的寡核苷酸成员,该成员可以包括4x4x4x4x4或1024个不同的寡核苷酸,这些寡核苷酸可以共定位在文库中的不同位置。因此,寡核苷酸文库可以具有少于20,000个不同的位置,其中文库的成员存在于少于20,000个不同的位置处。在一些实施例中,可能存在许多不受关注的所有可能序列的序列。因此,所有可能的简并序列中只有一个子集需要存在于不同的位置处。因此,在一些实施例中,所有可能的简并序列的子集可以作为寡核苷酸文库的成员存在于不同的位置处。寡核苷酸文库中的不同的位置是可鉴定的位置,仪器可以去到该位置以获得该位置的寡核苷酸成员。在任何实施例中,不同的位置可以通过任何合适的技术(例如在包含寡核苷酸文库的固相载体的微观图片或网格中的参考点)来定义。在一些实施例中,不同的位置可以存储在非瞬态计算机可读介质上和/或通过所述非瞬态计算机可读介质通信。
带悬垂的产物DNA
在去除侧翼序列(使用时)之后,如果需要的话,可以组装产物DNA分子。在一些实施例中,产物DNA分子将是双链钝端DNA。DNA分子可以被合成,使得它们各自含有重叠或“粘性末端”(例如,寡核苷酸长度的一半),所述重叠或“粘性末端”然后可用于将它们组装成更大的DNA分子。
但在其它实施例中,可以合成具有一个或多个碱基的单链悬垂的产物DNA分子。IIS型限制性核酸内切酶在距其识别位点的明确距离处切割DNA。因此,IIS型限制性核酸内切酶在本发明中用于生产具有单链悬垂的产物DNA分子的应用。然后,这些产物DNA分子可以通过退火与具有互补悬垂序列的产物DNA分子连接,以形成更大的DNA分子。
在任何实施例中,所述方法可以进一步涉及使所述产物DNA分子与IIS型限制性核酸内切酶接触以生成具有单链悬垂的产物DNA分子的步骤。在任何实施例中,所述方法还可以涉及将所得产物DNA分子中的两个或更多个分子连接在一起以产生更长的产物DNA分子的步骤。如图5所示,可以将识别位点编码为侧翼序列,以便能够释放具有单链悬垂(即“粘性”末端)的双链产物DNA分子。单链悬垂可以是任何合适的长度,例如4个或5个或6个或7个或8个或多于8个核苷酸或6-10个核苷酸或7-9个核苷酸。在一个实施例中,单链悬垂可以是产物DNA分子长度的一半,或比产物DNA长度的一半多或少1个或2个碱基。例如,如果产物DNA分子的长度为16个核苷酸,则悬垂可以是8个核苷酸或6-10个核苷酸。在一个实施例中,BsaI位点可以被编码成侧翼序列,如图5所示。BsaI识别序列5'-GGTCTC(N1)-3'(SEQ IDNO:49)。酶通常切割N的3'侧。有用的IIS型限制性核酸内切酶的另一个实例是BsmBI,其识别序列5'-CGTCTCN-3'(SEQ ID NO:50),并且通常切割N的3'侧。普通技术人员利用本公开将实现将在本发明中找到用途的其它限制性核酸内切酶。这些人员也可以很容易地确定酶在任何特定应用中的切割位置。在本文公开的方法的任何实施例中,通过这些方法产生的DNA分子可以含有一个或多个IIS型限制性核酸内切酶切割位点。
DNA数据存储
DNA即使在数千年并甚至在许多极端环境中都是稳定的,这使其在存储信息方面具有很大的优势。本文公开的任何方法也可以应用于将数字数据编码成DNA。一个或多个产物DNA分子可以具有包括经编码的非遗传信息的序列。一个或多个产物DNA分子可以具有对应于编码非遗传信息的信息字节的序列。可以参考为每个经编码的字符或信息字节分配一个或多个语言字符的键对信息字节进行解码。例如,如图6所示,可以合成16bp的产物DNA分子,并且其轻松容纳四个信息字节,其中每个字节由分配的核苷酸序列编码。在此实例中,四个核苷酸序列表示一个信息字节,其可以对应于字符(例如字母或数字)。因此,在此实例中,每个信息字节中可以编码256个字符(4x4x4x4)。因此,世界上任何语言的字母表都可以很容易地容纳在这些256个信息字节中,以及在通信中使用的足够数量的数字和其它字符中。
产物DNA还可以编码字符(例如字母、单词、数字、标点符号、单词字符或通信中使用的其它字符),从而指示由该DNA分子编码的信息在序列中的位置。图6描绘了16bp的产物DNA分子,每个分子具有四个字节的四个核苷酸。每个产物DNA序列中的最后一个字节指示消息中放置前三个字节的位置;这很方便地是一个数字,但可以是可以放入可定义序列中的任何字符。虽然4个核苷酸的字节提供至多256个标识符,但字节可以是任何方便长度的核苷酸。例如,字节可以包括5个核苷酸或6个核苷酸(允许4,096个标识符),或7个或甚至8个核苷酸,或多于8个核苷酸,从而允许包含更多的标识符。通过将DNA分子放置在单个孔中以达到标识符的数量,然后按照孔序列的顺序组装来自DNA的信息,也可以扩展有限数量的标识符。使用这种只有4个核苷酸标识符的方法,即使是单个384孔板也可以含有超过98,000个DNA分子(256个分子x 384个孔),这些DNA分子可以组装以提供近300,000个信息字节(除了标识符之外)。当使用5个核苷酸标识符时,可以单独鉴定超过1,024个分子乘以384个孔,即393,000个分子,或单个板中超过100万个信息字节。可以使用多个板来容纳更多量的信息。因此,可以根据这些方法对无限量的信息进行编码和无限期存储。
CRISPR向导RNA
本发明还可以应用于合成向导RNA(gRNA)以用于CRISPR-Cas9的方法。使用这些方法可以快速构建任何gRNA序列。也可以从寡核苷酸文库中的寡核苷酸构建向导RNA构建体。可以在具有初始向导结构的DNA序列的方法中合成产物DNA分子。初始向导RNA结构可以编码具有必要的原核或真核转录元件的gRNA,这些元件用于按适当的顺序进行体外转录,例如启动子、gRNA序列和终止子中的任何一个或多个。在一些实施例中,gRNA可以编码Cas9结合发夹(Cas9手柄)。在一些实施例中,转录元件包含启动子和/或终止子。在一些实施例中,产物DNA分子可以编码用于gRNA的20个碱基。图7描绘了一个实施例,其中本发明的短寡核苷酸和长寡核苷酸(其可以来自寡核苷酸文库)在方法中被合成为具有转录元件的初始向导结构。本文公开的方法的任何实施例都可用于合成向导结构。由于所有可能的多核苷酸序列都可以从寡核苷酸文库中组装,因此可以在方法中组装任何初始向导结构。如本文所述,产物DNA分子可以被合成,使得它们可以被连接以合成更大的DNA分子。
添加碱基
在任何实施例中,所述方法可以包含一个步骤,该步骤可以向产物DNA分子中添加2个或3个或4个或5个或6个或7个或8个或2-4个或2-6个或2-8个或2-10个或2-12个额外的核苷酸。在图7中描绘的实施例中,根据本文公开的任何方法,通过对短寡核苷酸、长寡核苷酸和锚定链进行退火来合成16bp的产物DNA分子。可以制造长短寡核苷酸和/或短寡核苷酸和锚定链以提供额外的核苷酸(例如两个或更多个额外的核苷酸),这些核苷酸将在扩增步骤后成为产物DNA分子的一部分。所述方法的任何实施例均可涉及PCR或其它DNA扩增技术的多个步骤。在任何实施例中,在PCR的步骤期间,可以使用引物,其中非标准核苷酸(例如dU)从引物的3'末端凹陷或嵌入一个或多个核苷酸或两个或更多个核苷酸,或嵌入2个或3个或4个或5个或6个或7个或8个或2-4个或2-6个或2-8个或2-10个或2-12个核苷酸。这允许扩增产物DNA分子每侧的额外核苷酸,并将其包含在产物DNA分子中。在一些实施例中,这是在PCR的第一步或早期步骤中完成的。结果是产物DNA分子已经通过例如每侧的两个额外核苷酸进行了扩展。因此,16bp的产物DNA分子可以在所述方法中扩展质20bp的产物DNA分子。
实施例
各种长度的长寡核苷酸、短寡核苷酸和锚定链都可以用于本文公开的方法中,无论是在图1A中描绘的实施例中还是在图1B中描绘的实施例中。各种大小的长寡核苷酸、短寡核苷酸和锚定链都可以用于所述方法中,以及所有可能的组合和子组合中。
在一些实施例中,至少一个长寡核苷酸的长度为12-24个核苷酸,至少一个短寡核苷酸的长度为4-8个核苷酸,并且至少一个锚定链的长度为20-60个核苷酸;或者至少一个长寡核苷酸的长度为12-24个核苷酸,至少一个短寡核苷酸的长度为4-8个核苷酸,并且至少一个锚定链的长度为12-60个核苷酸;或者至少一个长寡核苷酸的长度为12-24个核苷酸,至少一个短寡核苷酸的长度为4-8个核苷酸,并且至少一个锚定链的长度为12-80个核苷酸。在一个实施例中,至少一个长寡核苷酸的长度为12-24个核苷酸,至少一个短寡核苷酸的长度为4-10个核苷酸,并且至少一个锚定链的长度为20-60个核苷酸;或者至少一个长寡核苷酸的长度为12-24个核苷酸,至少一个短寡核苷酸的长度为4-10个核苷酸,并且至少一个锚定链的长度为12-60个核苷酸;或者至少一个长寡核苷酸的长度为12-24个核苷酸,至少一个短寡核苷酸的长度为4-10个核苷酸,并且至少一个锚定链的长度为12-80个核苷酸。在一个实施例中,至少一个长寡核苷酸的长度为12-24个核苷酸,至少一个短寡核苷酸的长度为4-12个核苷酸,并且至少一个锚定链的长度为20-60个核苷酸;或者至少一个长寡核苷酸的长度为12-24个核苷酸,至少一个短寡核苷酸的长度为4-12个核苷酸,并且至少一个锚定链的长度为12-60个核苷酸;或者至少一个长寡核苷酸的长度为12-24个核苷酸,至少一个短寡核苷酸的长度为4-12个核苷酸,并且至少一个锚定链的长度为12-80个核苷酸。
在一些实施例中,至少一个长寡核苷酸的长度为12-30个核苷酸,并且至少一个短寡核苷酸的长度为从4-8个核苷酸,并且至少一个锚定链的长度为20-60个核苷酸;或者至少一个长寡核苷酸的长度为12-30个核苷酸,并且至少一个短寡核苷酸的长度为4-8个核苷酸中的任何一个,并且至少一个锚定链的长度为12-60个核苷酸;或者至少一个长寡核苷酸的长度为12-30个核苷酸,并且至少一个短寡核苷酸的长度为4-8个核苷酸中的任何一个,并且至少一个锚定链的长度为12-80个核苷酸。在另一个实施例中,至少一个长寡核苷酸的长度为12-30个核苷酸,并且至少一个短寡核苷酸的长度为从4-10个核苷酸,并且至少一个锚定链的长度为20-60个核苷酸;或者至少一个长寡核苷酸的长度为12-30个核苷酸,并且至少一个短寡核苷酸的长度为4-10个核苷酸中的任何一个,并且至少一个锚定链的长度为12-60个核苷酸;或者至少一个长寡核苷酸的长度为12-30个核苷酸,并且至少一个短寡核苷酸的长度为4-10个核苷酸中的任何一个,并且至少一个锚定链的长度为12-80个核苷酸。在另一个实施例中,至少一个长寡核苷酸的长度为12-30个核苷酸,并且至少一个短寡核苷酸的长度为从4-12个核苷酸,并且至少一个锚定链的长度为20-60个核苷酸;或者至少一个长寡核苷酸的长度为12-30个核苷酸,并且至少一个短寡核苷酸的长度为4-12个核苷酸中的任何一个,并且至少一个锚定链的长度为12-60个核苷酸;或者至少一个长寡核苷酸的长度为12-30个核苷酸,并且至少一个短寡核苷酸的长度为4-12个核苷酸中的任何一个,并且至少一个锚定链的长度为12-80个核苷酸。
在一些实施例中,所述至少一个长寡核苷酸的长度为12-40个核苷酸,并且所述至少一个短寡核苷酸的长度为4-8个核苷酸中的任何一个,并且所述至少一个锚定链的长度为20-60个核苷酸。在另一个实施例中,所述至少一个长寡核苷酸的长度为12-40个核苷酸,并且所述至少一个短寡核苷酸的长度为4-8个核苷酸中的任何一个,并且所述至少一个锚定链的长度为12-60个核苷酸。在另一个实施例中,所述至少一个长寡核苷酸的长度为12-40个核苷酸,并且所述至少一个短寡核苷酸的长度为4-8个核苷酸中的任何一个,并且所述至少一个锚定链的长度为12-80个核苷酸。在另一个实施例中,所述至少一个长寡核苷酸的长度为12-40个核苷酸,并且所述至少一个短寡核苷酸的长度为4-10个核苷酸中的任何一个,并且所述至少一个锚定链的长度为20-60个核苷酸。在另一个实施例中,所述至少一个长寡核苷酸的长度为12-40个核苷酸,并且所述至少一个短寡核苷酸的长度为4-10个核苷酸中的任何一个,并且所述至少一个锚定链的长度为12-60个核苷酸。在另一个实施例中,所述至少一个长寡核苷酸的长度为12-40个核苷酸,并且所述至少一个短寡核苷酸的长度为4-10个核苷酸中的任何一个,并且所述至少一个锚定链的长度为12-80个核苷酸。在另一个实施例中,所述至少一个长寡核苷酸的长度为12-40个核苷酸,并且所述至少一个短寡核苷酸的长度为4-12个核苷酸中的任何一个,并且所述至少一个锚定链的长度为20-60个核苷酸。在另一个实施例中,所述至少一个长寡核苷酸的长度为12-40个核苷酸,并且所述至少一个短寡核苷酸的长度为4-12个核苷酸中的任何一个,并且所述至少一个锚定链的长度为12-60个核苷酸。在另一个实施例中,所述至少一个长寡核苷酸的长度为12-40个核苷酸,并且所述至少一个短寡核苷酸的长度为4-12个核苷酸中的任何一个,并且所述至少一个锚定链的长度为12-80个核苷酸。
此外,在任何一个实施例中,核酸的退火都可以从变性开始,所述变性可以在90℃或更高、或95℃或更高、或98℃或更高的温度下进行。同样,退火可以在35℃或更低、或30℃或更低、或25℃或更低的温度下发生。在一个实施例中,变性发生在98℃或更高的温度下,并且退火发生在25℃或更低的温度下。在另一个实施例中,变性发生在96℃或更高的温度下,并且退火发生在27℃或更低的温度下。所述方法可以涉及以1摄氏度/秒的速率或以0.1摄氏度/秒的速率从变性温度过渡到退火温度。在一个实施例中,以1摄氏度/秒的速率从变性温度过渡到约85℃,然后以0.1摄氏度/秒的速率从约85℃过渡到退火温度。退火和变性可以循环进行,并且可以在重复至少20次或至少25次或至少30次或约30次的循环中进行。
本公开的普通技术人员知道在哪些条件下相邻的长寡核苷酸和短寡核苷酸在与锚定链结合时可以发生连接,所述条件可以容易地确定。在不同的实施例中,连接可以发生在不同的温度下,以允许寡核苷酸和锚定链的完全沉降和退火,并且可以使用一种方法来允许最大程度的退火。在各个实施例中,连接可以在37℃±2℃下发生约5-15秒或8-12秒或约10秒,然后在16℃±2℃下发生约5-15秒或8-12秒或约10秒,然后在4℃±2℃下发生约5-15秒或8-12秒或约10秒。在其它实施例中,连接可以在37℃±1℃下发生约5-15秒或8-12秒或约10秒,然后在16℃±1℃下发生约5-15秒或8-12秒或约10秒,然后在4℃±1℃下发生约5-15秒或8-12秒或约10秒。
本公开的普通技术人员还知道在哪些条件下含有非标准核苷酸的锚定链可以被耗尽。条件可以基于用于耗尽引物的条件。在各个实施例中,条件可以是35-45℃持续45-75分钟,或约37℃持续60分钟,然后是65℃持续10分钟。
实例1
该实例示出了使用图1A中描绘的方法的实施例合成四种GC含量不同的20聚体。用18bp的侧翼序列合成产物DNA分子(SEQ ID NO:1-4)。提供这些序列是为了便于说明,并且任何序列都可以使用这些方法进行组装。
对于SEQ ID NO:1-4中的每一个的合成,遵循相同的程序。对于SEQ ID NO:1的合成,形成混合物1和2。混合物1含有限制性核酸内切酶缓冲液(50mM乙酸钾、20mM Tris-乙酸、10mM乙酸镁和100ug/ml BSA,pH 7.9,作为马萨诸塞州伊普斯维奇的新英格兰生物实验室公司的
Figure BDA0003924593790000251
缓冲液市售)以简化双重消化反应,O2(SEQ ID NO:10)、O3(SEQ IDNO:11)、O5(SEQ ID NO:13)和O6(SEQ ID NO:14)和水各100uM。混合物2含有相同的限制性核酸内切酶缓冲液,O1(SEQ ID NO:9)和O4(SEQ ID NO:12)和水各100uM。寡核苷酸如下:
O1、O4(长寡核苷酸):18个nt(通用侧翼)+4-6个nt的可变区域
O2、O3(短寡核苷酸):4-6个nt的可变区域
O5、O6(锚定链):18个nt的通用侧翼+3-5个nt简并碱基+4-6个nt的可变区域。
将混合物1和混合物2组合并经受变性和退火条件,如下所示:
98℃–2分钟
以1摄氏度/秒的速率斜降至85℃/s
85℃–2分钟
以0.1摄氏度/秒的速率斜降至25℃/s
25℃–2分钟。
变性和退火后,使混合物经受连接反应,所述连接反应在连接方案下用T4连接酶进行,所述连接方案包含30个循环:
37℃–10秒
16℃–10秒
4℃–10秒
然后将相同的循环重复30次,以70℃持续15分钟为结束,为锚定链耗尽做准备。
然后使用尿嘧啶DNA糖基化酶(UDG)和DNA糖基化酶-裂解酶核酸内切酶VIII对混合物进行锚定链耗尽步骤,以进行尿嘧啶特异性切除,从而在尿嘧啶残基的位置生成单个核苷酸间隙。反应条件为37℃持续60分钟,然后65℃持续10分钟。
将锚定链耗尽混合物稀释1:100,并在最终的PCR扩增反应中以2ul作为模板。PCR反应组分包含DNA聚合酶(
Figure BDA0003924593790000252
2.0高保真度DNA聚合酶(马萨诸塞州贝弗利的凯杰贝弗利有限责任公司(Qiagen Beverly,LLC,Beverly,MA))、通用引物、dNTP和模板。PCR方案如下:
98℃–30秒
30个循环:
98℃–10秒
60℃–10秒
72℃–15秒
72℃–10分钟
如图3所示,所有四个20bp和不同GC含量的产物DNA分子都与18bp的侧翼序列组装在一起,以产生56bp的扩增子,这些扩增子在4%琼脂糖凝胶上被分解。通过对24个克隆的Sanger测序确认了SEQ ID NO:1-4,并发现其具有预期的序列。
SEQ ID NO:2-4的合成是相同的,使用来自寡核苷酸文库的以下寡核苷酸。
对于SEQ ID NO:2–O1(SEQ ID NO:15)、O2(SEQ ID NO:16)、O3(SEQ ID NO:17)、O4(SEQ ID NO:18)、O5(SEQ ID NO:19)、O6(SEQ ID NO:20)。
对于SEQ ID NO:3–O1(SEQ ID NO:21)、O2(SEQ ID NO:22)、O3(SEQ ID NO:23)、O4(SEQ ID NO:24)、O5(SEQ ID NO:25)、O6(SEQ ID NO:26)。
对于SEQ ID NO:4–O1(SEQ ID NO:27)、O2(SEQ ID NO:28)、O3(SEQ ID NO:29)、O4(SEQ ID NO:30)、O5(SEQ ID NO:31)、O6(SEQ ID NO:32)。
如图3所示,并由Sanger测序确认,所有序列都显示出正确和定义的序列。
实例2
该实例示出了另一个实施例,所述实施例示出了四个产物DNA分子(SEQ ID NO:5-8)的合成,其中结合集含有两个长寡核苷酸、一个短寡核苷酸和一个锚定链,其实施例如图1B所示。用18bp的侧翼序列合成20bp的产物DNA分子,从而提供56bp的最终扩增子长度。
对于SEQ ID NO:5-8中的每一个的合成,遵循相同的程序。对于SEQ ID NO:5的合成,混合物中含有混合物O1(SEQ ID NO:33)、O2(SEQ ID NO:34),O3(SEQ ID NO:35)和O4(SEQ ID NO:36)。O1和O3是长寡核苷酸,O2是短寡核苷酸,并且O4是锚定链。寡核苷酸如下:
O1、O3(长寡核苷酸):18个nt的通用侧翼+4-6个nt的可变区域
O2(短寡核苷酸):6个nt的可变区域
O4(锚定链):52个nt
方案与实例1中的方案相同。结果如图4所示,该图显示了琼脂糖凝胶,其中四个扩增子被分解。四个16bp的DNA产物(SEQ ID NO:5-8)用它们的18bp的侧翼序列成功组装,以产生52bp的扩增子。在4%琼脂糖凝胶上证明组装(图3)。通过Sanger测序确认最终产物的序列,并发现其是预期的序列。
SEQ ID NO:6-8的合成以相同的方式进行,使用来自寡核苷酸文库的以下寡核苷酸。
对于SEQ ID NO:6–O1(SEQ ID NO:37)、O2(SEQ ID NO:38)、O3(SEQ ID NO:39)、O4(SEQ ID NO:40);
对于SEQ ID NO:7–O1(SEQ ID NO:41)、O2(SEQ ID NO:42)、O3(SEQ ID NO:43)、O4(SEQ ID NO:44);
对于SEQ ID NO:8–O1(SEQ ID NO:45)、O2(SEQ ID NO:46)、O3(SEQ ID NO:47)、O4(SEQ ID NO:48);
如图4所示(并由Sanger测序确认),所有序列都显示出正确和定义的序列。
序列表
<110> 科德斯DNA公司(CODEX DNA, INC.)
K·克里希娜
J·E·吉尔
D·G·吉布森
L·付
<120> 多核苷酸序列的按需合成
<130> CODEX2260-1WO
<140>
<141>
<150> 63/025,696
<151> 2020-05-15
<160> 68
<170> PatentIn 3.5版
<210> 1
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 1
atttattact agacagagga 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 2
aggcagagtt aattcgaaca 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 3
agactggtac aacaggactc 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 4
cgcggtccaa cttaggcgta 20
<210> 5
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 5
tgagatctgg agaaaa 16
<210> 6
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 6
cttattaatt aacaga 16
<210> 7
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 7
gcggccgctt aattaa 16
<210> 8
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 8
ggatccgaat tcttgt 16
<210> 9
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<400> 9
ttttucaatg catcggtccc ggtattt 27
<210> 10
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 10
attact 6
<210> 11
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 11
agacag 6
<210> 12
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<400> 12
aggaacggag gccgaacatg ctutttt 27
<210> 13
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<220>
<221> modified_base
<222> (7)..(9)
<223> a、c、t、g、未知或其它
<400> 13
agtaatnnnu accgggaccg augcattgut ttt 33
<210> 14
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<220>
<221> modified_base
<222> (25)..(27)
<223> a、c、t、g、未知或其它
<400> 14
ttttuagcat gutcggcctc cgtunnnctg tct 33
<210> 15
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<400> 15
ttttucaatg catcggtccc ggtaggc 27
<210> 16
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 16
agagtt 6
<210> 17
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 17
aattcg 6
<210> 18
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<400> 18
aacaacggag gccgaacatg ctutttt 27
<210> 19
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<220>
<221> modified_base
<222> (7)..(9)
<223> a、c、t、g、未知或其它
<400> 19
aactctnnnu accgggaccg augcattgut ttt 33
<210> 20
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<220>
<221> modified_base
<222> (25)..(27)
<223> a、c、t、g、未知或其它
<400> 20
ttttuagcat gutcggcctc cgtunnncga att 33
<210> 21
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<400> 21
ttttucaatg catcggtccc ggtagac 27
<210> 22
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 22
tggtac 6
<210> 23
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 23
aacagg 6
<210> 24
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<400> 24
actcacggag gccgaacatg ctutttt 27
<210> 25
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<220>
<221> modified_base
<222> (7)..(9)
<223> a、c、t、g、未知或其它
<400> 25
gtaccannnu accgggaccg augcattgut ttt 33
<210> 26
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<220>
<221> modified_base
<222> (25)..(27)
<223> a、c、t、g、未知或其它
<400> 26
ttttuagcat gutcggcctc cgtunnncct gtt 33
<210> 27
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<400> 27
ttttucaatg catcggtccc ggtcgcg 27
<210> 28
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 28
gtccaa 6
<210> 29
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 29
cttagg 6
<210> 30
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<400> 30
cgtaacggag gccgaacatg ctutttt 27
<210> 31
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<220>
<221> modified_base
<222> (7)..(9)
<223> a、c、t、g、未知或其它
<400> 31
ttggacnnnu accgggaccg augcattgut ttt 33
<210> 32
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<220>
<221> modified_base
<222> (25)..(27)
<223> a、c、t、g、未知或其它
<400> 32
ttttuagcat gutcggcctc cgtunnncct aag 33
<210> 33
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<400> 33
ttttucaatg catcggtccc ggttgaga 28
<210> 34
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 34
tctgga 6
<210> 35
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 35
gaaaaacgga ggccgaacat gct 23
<210> 36
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<220>
<221> modified_base
<222> (25)..(28)
<223> a、c、t、g、未知或其它
<220>
<221> modified_base
<222> (35)..(38)
<223> a、c、t、g、未知或其它
<400> 36
ttttuagcat gutcggcctc cgtunnnntc cagannnnua ccgggaccga ugcattg 57
<210> 37
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<400> 37
ttttucaatg catcggtccc ggtcttat 28
<210> 38
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 38
taatta 6
<210> 39
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 39
acagaacgga ggccgaacat gct 23
<210> 40
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<220>
<221> modified_base
<222> (25)..(28)
<223> a、c、t、g、未知或其它
<220>
<221> modified_base
<222> (35)..(38)
<223> a、c、t、g、未知或其它
<400> 40
ttttuagcat gutcggcctc cgtunnnnta attannnnua ccgggaccga ugcattg 57
<210> 41
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<400> 41
ttttucaatg catcggtccc ggtgcggc 28
<210> 42
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 42
cgctta 6
<210> 43
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 43
attaaacgga ggccgaacat gct 23
<210> 44
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<220>
<221> modified_base
<222> (25)..(28)
<223> a、c、t、g、未知或其它
<220>
<221> modified_base
<222> (35)..(38)
<223> a、c、t、g、未知或其它
<400> 44
ttttuagcat gutcggcctc cgtunnnnta agcgnnnnua ccgggaccga ugcattg 57
<210> 45
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<400> 45
ttttucaatg catcggtccc ggtggatc 28
<210> 46
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 46
cgaatt 6
<210> 47
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 47
cttgtacgga ggccgaacat gct 23
<210> 48
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<220>
<221> modified_base
<222> (25)..(28)
<223> a、c、t、g、未知或其它
<220>
<221> modified_base
<222> (35)..(38)
<223> a、c、t、g、未知或其它
<400> 48
ttttuagcat gutcggcctc cgtunnnnaa ttcgnnnnua ccgggaccga ugcattg 57
<210> 49
<211> 7
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> modified_base
<222> (7)..(7)
<223> a、c、g或t
<400> 49
ggtctcn 7
<210> 50
<211> 7
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<221> modified_base
<222> (7)..(7)
<223> a、c、g或t
<400> 50
cgtctcn 7
<210> 51
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 51
caatgcatcg gggtctctat ctg 23
<210> 52
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 52
gatctagaga cccggaacat gct 23
<210> 53
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<220>
<221> modified_base
<222> (20)..(23)
<223> a、c、t、g、未知或其它
<220>
<221> modified_base
<222> (30)..(33)
<223> a、c、t、g、未知或其它
<400> 53
agcatgutcc gggtctctun nnntggatcn nnnuagagac cccgaugcat tg 52
<210> 54
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 54
caatgcatcg gggtctct 18
<210> 55
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 55
caatgcatcg gggtctctat ctggatccag atctagagac ccggaacatg ct 52
<210> 56
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<400> 56
agcatgutcc gggtctctag atctggatcc agatagagac cccgaugcat tg 52
<210> 57
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<400> 57
agcatgutcc gggtctct 18
<210> 58
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<220>
<223> 组合的DNA/RNA分子的描述:合成寡核苷酸
<400> 58
agatagagac cccgaugcat tg 22
<210> 59
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 59
atctagagac ccggaacatg ct 22
<210> 60
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 60
atctggatcc ag 12
<210> 61
<211> 12
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 61
agatctggat cc 12
<210> 62
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 62
agcatgttcc gggtctctag atctccatcc agatagagac cccgatgcat tg 52
<210> 63
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 63
caatgcatcg gggtctctag caggctcctg ttctagagac ccggaacatg ct 52
<210> 64
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 64
agcatgttcc gggtctctag aacaggagcc tgctagagac cccgatgcat tg 52
<210> 65
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 65
caatgcatcg gggtctctag caggatagca ttctagagac ccggaacatg ct 52
<210> 66
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 66
agcatgttcc gggtctctag aatgctatcc tgctagagac cccgatgcat tg 52
<210> 67
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 67
caatgcatcg gggtctctag caggatccag tactagagac ccggaacatg ct 52
<210> 68
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成寡核苷酸
<400> 68
agcatgttcc gggtctctag tactggatcc tgctagagac cccgatgcat tg 52

Claims (54)

1.一种合成具有所需序列的产物DNA分子的方法,所述方法包括:
将至少一个长寡核苷酸和至少一个短寡核苷酸退火到至少一个锚定链上,所述锚定链具有与所述至少一个长寡核苷酸和至少一个短寡核苷酸至少部分互补的序列,
其中退火后,与锚定链结合的至少一个长寡核苷酸邻接与同一锚定链结合的至少一个短寡核苷酸,并且
其中所述至少一个锚定链包括一个或多个非标准核苷酸,以及任选的一个或多个简并核苷酸;
连接所述相邻的至少一个长寡核苷酸和至少一个短寡核苷酸,以形成包括非标准核苷酸的dsDNA分子;
使所述dsDNA分子与一种或多种酶接触,所述一种或多种酶降解包括一个或多个非标准核苷酸的DNA,从而合成所述产物DNA分子。
2.根据权利要求1所述的方法,其中所述退火发生在包括两个长寡核苷酸、两个短寡核苷酸和两个锚定链的结合集内,并且进一步包括将所述两个短寡核苷酸连接到所述两个长寡核苷酸,其中所述长寡核苷酸和短寡核苷酸进一步包括可变核苷酸。
3.根据权利要求1所述的方法,其中所述退火发生在包括两个长寡核苷酸、一个短寡核苷酸和至少一个锚定链的结合集中,并且其中所述短寡核苷酸连接到两个长寡核苷酸,并且所述短寡核苷酸和两个长寡核苷酸包括可变核苷酸。
4.根据权利要求1至3中任一项所述的方法,其中所述非标准核苷酸是脱氧尿苷。
5.根据权利要求1至4中任一项所述的方法,其中所述dsDNA分子只在一个链上包括所述非标准核苷酸。
6.根据权利要求1至5中任一项所述的方法,其进一步包括使用DNA扩增方法扩增所述产物DNA分子。
7.根据权利要求6所述的方法,其中所述扩增是通过聚合酶链反应(PCR)执行的或者其中所述扩增包括在所述产物DNA分子上执行PCR的多个循环。
8.根据权利要求1至7中任一项所述的方法,其中所述产物DNA分子包括侧翼序列,用于退火在PCR的所述多个循环中使用的引物。
9.根据权利要求1至8中任一项所述的方法,其中所述产物DNA分子的长度为8-30个核苷酸。
10.根据权利要求1至9中任一项所述的方法,其中所述连接通过DNA连接酶进行。
11.根据权利要求1至10中任一项所述的方法,其中所述至少一个长寡核苷酸的长度为12-24个核苷酸,并且所述至少一个短寡核苷酸的长度为4-8个核苷酸。
12.根据权利要求1至10中任一项所述的方法,其中所述至少一个长寡核苷酸的长度为12-24个核苷酸,并且所述至少一个短寡核苷酸的长度为4-8个核苷酸,并且所述至少一个锚定链的长度为20-60个核苷酸。
13.根据权利要求1至12中任一项所述的方法,其进一步包括在溶液中通过钝端连接并根据所需序列连接具有双链末端的两个DNA分子。
14.根据权利要求2或4至13中任一项所述的方法,其进一步包括,退火后,第一短寡核苷酸邻接第一长寡核苷酸,并且第二短寡核苷酸邻接第二长寡核苷酸,以及连接所述第一短寡核苷酸和长寡核苷酸,以及连接所述第二短寡核苷酸和长寡核苷酸。
15.根据权利要求3至13中任一项所述的方法,其进一步包括,退火后,所述至少一个短寡核苷酸邻接第一长寡核苷酸和第二长寡核苷酸,以及将所述至少一个短寡核苷酸连接到所述第一长寡核苷酸和第二长寡核苷酸。
16.根据权利要求1至15中任一项所述的方法,其中降解包括非标准核苷酸的DNA的所述一种或多种酶包括选自由以下组成的组的一种或多种酶:尿嘧啶DNA糖基化酶、核酸内切酶VIII和核酸外切酶T。
17.根据权利要求1至16中任一项所述的方法,其中每个锚定链包括4-6个可变和/或4-6个简并核苷酸,所述核苷酸包括在单个简并区域中。
18.根据权利要求3所述的方法,其中所述锚定链包括4-6个可变和/或4-6个简并核苷酸,所述核苷酸包括在单个简并区域中。
19.根据权利要求1至18中任一项所述的方法,其中所述长寡核苷酸和短寡核苷酸各自包括4-6个可变核苷酸。
20.根据权利要求3所述的方法,其中所述长寡核苷酸和短寡核苷酸各自包括4-6个可变核苷酸。
21.根据权利要求1至20中任一项所述的方法,其中所述两个长寡核苷酸进一步包括可变核苷酸,所述可变核苷酸在退火步骤期间与它们各自至少部分互补的锚定链上的简并核苷酸结合。
22.根据权利要求1至21中任一项所述的方法,其中所述长寡核苷酸、短寡核苷酸和锚定链各自包括4-6个可变核苷酸。
23.根据权利要求1至22中任一项所述的方法,其中所述产物DNA分子是长度为8-30个核苷酸的单链DNA,不包含所述侧翼序列;或者其中所述产物DNA分子是长度为8-30个碱基对的双链DNA,不包含所述侧翼序列。
24.根据权利要求1至22中任一项所述的方法,其中所述产物DNA分子是长度为16-20个寡核苷酸的单链DNA;或者其中所述产物DNA分子是长度为16-20个碱基对的双链DNA。
25.根据权利要求1至24中任一项所述的方法,其中所述长寡核苷酸和短寡核苷酸都可以从寡核苷酸文库提供给所述方法。
26.根据权利要求25所述的方法,其中从所述寡核苷酸文库提供的所述短寡核苷酸的长度为3-7个核苷酸。
27.根据权利要求26所述的方法,其中所述寡核苷酸文库包括长寡核苷酸成员,其在可变核苷酸的每个位置处具有所有四种可能的核苷酸。
28.根据权利要求1至27中任一项所述的方法,其中所述长寡核苷酸包括可变区域,所述可变区域退火到所述一个或多个锚定链上的简并核苷酸的序列。
29.根据权利要求2或4至28中任一项所述的方法,其中
a.所述短寡核苷酸和长寡核苷酸包括4-6个可变核苷酸;
b.所述锚定链包括4-6个简并核苷酸;
c.所述锚定链包括至少两个脱氧尿苷单磷酸盐核苷酸;并且
d.所述产物DNA分子通过PCR扩增。
30.根据权利要求3至28中任一项所述的方法,其中
a.所述短寡核苷酸和长寡核苷酸包括4-6个可变核苷酸;
b.所述锚定链包括4-6个简并核苷酸;
c.所述锚定链包括至少两个脱氧尿嘧啶单磷酸盐核苷酸;并且
d.所述产物DNA分子通过PCR扩增。
31.根据权利要求1至30中任一项所述的方法,其中所述产物DNA分子具有小于1/25,000的错误率。
32.根据权利要求1至31中任一项所述的方法,其中所述至少一个长寡核苷酸、至少一个短寡核苷酸和至少一个锚定链选自包括少于20,000个成员的寡核苷酸文库。
33.根据权利要求32所述的方法,其中包括少于20,000个成员的所述寡核苷酸文库含有足以合成所有可能的核苷酸序列的寡核苷酸。
34.根据权利要求1至33中任一项所述的方法,其进一步包括使所述产物DNA分子与IIS型限制性核酸内切酶接触以生成具有单链悬垂的产物DNA分子的步骤。
35.根据权利要求34所述的方法,其中所述IIS型限制性核酸内切酶选自BsaI和BsmBI。
36.根据权利要求1至35中任一项所述的方法,其中所述产物DNA分子包括经编码的非遗传信息。
37.根据权利要求1至36中任一项所述的方法,其中所述产物DNA分子包括对应于信息字节的序列。
38.根据权利要求7所述的方法,其中PCR的所述多个循环包括使用包括非标准核苷酸的引物将两个核苷酸从所述引物的3'末端嵌入的PCR的第一步。
39.根据权利要求8至37中任一项所述的方法,其中所述产物DNA分子编码向导RNA,并且所述侧翼序列编码一个或多个转录元件,并且所述向导RNA任选地编码Cas9结合发夹。
40.根据权利要求39所述的方法,其中所述转录元件包括启动子和终止子。
41.一种合成产物DNA分子的方法,所述方法包括:
提供寡核苷酸文库,其中所述寡核苷酸文库包括少于20,000个寡核苷酸成员,
并且其中所述文库中的所述寡核苷酸成员可以组装成所有可能的多核苷酸序列;
从所述文库中组装寡核苷酸成员以获得所述产物DNA分子。
42.根据权利要求41所述的方法,其中所述寡核苷酸文库存在于固相上,并且所述寡核苷酸成员存在于所述寡核苷酸文库内定义的物理位置处。
43.根据权利要求42所述的方法,其中所述固相是DNA芯片。
44.根据权利要求41至43中任一项所述的方法,其中所述产物DNA分子是长度为8-30碱基对的双链DNA。
45.根据权利要求41至44中任一项所述的方法,其中所述产物DNA分子经受连续的方法,以将所述产物DNA分子与至少一个额外的DNA分子连接起来,以产生更大的产物DNA分子。
46.根据权利要求41至45中任一项所述的方法,其中所述文库包括少于16,000个寡核苷酸成员。
47.根据权利要求41至46中任一项所述的方法,其中所述更大的产物DNA分子的长度为至少1,000bp。
48.根据权利要求41至47中任一项所述的方法,其中所述产物DNA分子具有小于1/10,000的错误率。
49.根据权利要求41至48中任一项所述的方法,其中组装寡核苷酸成员包括
将至少一个长寡核苷酸和至少一个短寡核苷酸退火到至少一个锚定链上,所述锚定链具有与所述至少一个长寡核苷酸和至少一个短寡核苷酸至少部分互补的序列,
其中退火后,与锚定链结合的至少一个长寡核苷酸邻接与同一锚定链结合的至少一个短寡核苷酸,并且
其中所述至少一个锚定链包括一个或多个非标准核苷酸,以及任选的一个或多个简并核苷酸;
连接所述相邻的至少一个长寡核苷酸和至少一个短寡核苷酸,以形成包括非标准核苷酸的dsDNA分子;
使所述dsDNA分子与一种或多种酶接触,所述一种或多种酶降解包括一个或多个非标准核苷酸的DNA,从而合成所述产物DNA分子。
50.一种试剂盒,其包括20,000个或更少寡核苷酸成员的文库,其中所述文库中的所述寡核苷酸成员可以组装成每种可能的多核苷酸序列。
51.根据权利要求50所述的试剂盒,其中所述寡核苷酸成员在定义的位置处分离并在空间上分离。
52.根据权利要求50至51中任一项所述的试剂盒,其中所述文库包括在DNA芯片上。
53.一种寡核苷酸文库,其包括少于20,000个定义的位置并且在每个位置处包括寡核苷酸文库成员,其中所述寡核苷酸文库成员可以组装成每种可能的多核苷酸序列。
54.根据权利要求50至53中任一项所述的寡核苷酸文库,其中所述多核苷酸序列的长度小于10Mbp。
CN202180033416.1A 2020-05-15 2021-05-13 多核苷酸序列的按需合成 Pending CN115667511A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063025696P 2020-05-15 2020-05-15
US63/025,696 2020-05-15
PCT/US2021/032344 WO2021231799A1 (en) 2020-05-15 2021-05-13 On demand synthesis of polynucleotide sequences

Publications (1)

Publication Number Publication Date
CN115667511A true CN115667511A (zh) 2023-01-31

Family

ID=78513070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180033416.1A Pending CN115667511A (zh) 2020-05-15 2021-05-13 多核苷酸序列的按需合成

Country Status (7)

Country Link
US (1) US20210355519A1 (zh)
EP (1) EP4150080A1 (zh)
JP (1) JP2023526280A (zh)
CN (1) CN115667511A (zh)
AU (1) AU2021273496A1 (zh)
CA (1) CA3178255A1 (zh)
WO (1) WO2021231799A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024096856A1 (en) * 2022-10-31 2024-05-10 Codex Dna, Inc. Methods of synthesizing nucleic acid molecules

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6458530B1 (en) * 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
SE0401270D0 (sv) * 2004-05-18 2004-05-18 Fredrik Dahl Method for amplifying specific nucleic acids in parallel
US20170267998A1 (en) * 2014-12-04 2017-09-21 Axiomx, Inc. Methods of synthesizing polynucleotides
US20160215316A1 (en) * 2015-01-22 2016-07-28 Genomic Expression Aps Gene synthesis by self-assembly of small oligonucleotide building blocks
CN108699505A (zh) * 2015-12-03 2018-10-23 安可济控股有限公司 用于形成连接产物的方法和组合物
WO2019241290A1 (en) * 2018-06-12 2019-12-19 Accuragen Holdings Limited Methods and compositions for forming ligation products

Also Published As

Publication number Publication date
WO2021231799A1 (en) 2021-11-18
US20210355519A1 (en) 2021-11-18
AU2021273496A1 (en) 2022-12-15
EP4150080A1 (en) 2023-03-22
JP2023526280A (ja) 2023-06-21
CA3178255A1 (en) 2021-11-18

Similar Documents

Publication Publication Date Title
US20220017893A1 (en) Capture methodologies for circulating cell free dna
CN108060191B (zh) 一种双链核酸片段加接头的方法、文库构建方法和试剂盒
EP3143139B1 (en) Synthesis of double-stranded nucleic acids
CN110678547B (zh) 分子条码化
WO2013074833A1 (en) Capture probe and assay for analysis of fragmented nucleic acids
WO2016189288A1 (en) Nucleic acid sample enrichment
WO2015050501A1 (en) Amplification paralleled library enrichment
WO2016170319A1 (en) Nucleic acid sample enrichment
CN110699425A (zh) 基因目标区域的富集方法及体系
EP1394251A1 (en) Method for the selective randomization of polynucleotides
US20190048334A1 (en) Methods for sample preparation
CN115667511A (zh) 多核苷酸序列的按需合成
CN108166069A (zh) 一种新型甲基化建库方法及其应用
EP3208344B1 (en) Primer for nucleic acid random fragmentation and nucleic acid random fragmentation method
WO2020227382A1 (en) Sequential sequencing methods and compositions
US20200208299A1 (en) Rapid library construction for high throughput sequencing
JP2020096564A (ja) Rna検出方法、rna検出用核酸及びrna検出用キット
WO2024022207A1 (en) Methods of in-solution positional co-barcoding for sequencing long dna molecules
CN112941147B (zh) 一种高保真靶标基因建库方法及其试剂盒
CN107937389B (zh) 阵列上连接组装
JP2023540177A (ja) ヘアピンアダプターを使用して配列決定ライブラリーから標的配列を濃縮する方法
WO2022251510A2 (en) Oligo-modified nucleotide analogues for nucleic acid preparation
CN115605590A (zh) 一种制备定点修饰的长链dna的方法
CA3238653A1 (en) Methods of synthesizing nucleic acid molecules

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination