CN110312800A - 处理核酸样本的方法 - Google Patents

处理核酸样本的方法 Download PDF

Info

Publication number
CN110312800A
CN110312800A CN201780083440.XA CN201780083440A CN110312800A CN 110312800 A CN110312800 A CN 110312800A CN 201780083440 A CN201780083440 A CN 201780083440A CN 110312800 A CN110312800 A CN 110312800A
Authority
CN
China
Prior art keywords
seq
nucleic acid
reverse transcriptase
modification
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780083440.XA
Other languages
English (en)
Inventor
A·比比罗
P·帕特尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Biological Radiation Laboratory Co Ltd
Bio Rad Laboratories Inc
Original Assignee
Biological Radiation Laboratory Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Biological Radiation Laboratory Co Ltd filed Critical Biological Radiation Laboratory Co Ltd
Publication of CN110312800A publication Critical patent/CN110312800A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1096Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1276RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6846Common amplification features
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6848Nucleic acid amplification reactions characterised by the means for preventing contamination or increasing the specificity or sensitivity of an amplification reaction
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/107RNA dependent DNA polymerase,(i.e. reverse transcriptase)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/101Temperature
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07049RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本公开提供用于扩增和分析核酸样本的方法和系统。本公开提供使用经过修饰的逆转录酶制备cDNA和/或DNA分子以及cDNA和/或DNA文库的方法。

Description

处理核酸样本的方法
交叉参考
本申请要求2016年11月11日提交的美国临时申请第62/421,028号和2017年3月27日提交的美国临时申请第62/477,211号的权益,这些临时申请均以全文引用的方式并入本文中。
背景技术
用于研究活细胞中的基因表达的常用技术为由核糖核酸(RNA)分子产生互补脱氧核糖核酸(cDNA)。这种技术提供由活细胞研究RNA的方式,这避免了直接分析本身不稳定的RNA。作为cDNA合成中的第一步骤,使来自生物体的RNA分子与生物体细胞或组织萃取物分离。信使RNA(mRNA)分离之后,使用例如利用oligo dT(脱氧胸苷核苷酸的短序列)的亲和色谱法方法,将寡核苷酸序列退火到已分离mRNA分子上,并且可以将RNA/DNA引物用作模板来利用具有逆转录酶活性的酶产生RNA序列的cDNA拷贝。因此,mRNA的逆转录是多种形式的基因表达分析中的关键步骤。通常,通过引物延伸或聚合酶链反应将mRNA逆转录到cDNA中以供后续分析。
逆转录酶同时具有RNA引导的DNA聚合酶活性和DNA引导的DNA聚合酶活性。RNA模板的逆转录可能需要引物序列,该引物序列退火到RNA模板上以便从引物的3'OH启动DNA合成。在室温下,逆转录酶可以允许形成完全匹配以及不匹配的DNA/RNA杂交体。在一些情况下,逆转录酶可能由于一些非特异性引发事件而产生大量非特异性cDNA产物。非特异性逆转录产物可干扰后续cDNA分析,例如cDNA测序、实时聚合酶链反应(PCR)和碱性琼脂糖凝胶电泳等等。由于非特异性逆转录酶活性而产生的非特异性cDNA模板在例如实时PCR等应用中可能存在特定困难。具体来说,这些非特异性cDNA产物可能产生能够使实时PCR信号和产物分析复杂化的错误信号。因此,降低非特异性逆转录酶活性可以促成cDNA合成的更高特异性。目前,还没有改进逆转录特异性的可靠和易用方法。本公开满足这些和其它需求。
若干方法可用于获得来自单细胞的转录组数据。一种先驱方法使用逆转录酶和oligo-dT引物,其中T7噬菌体RNA聚合酶启动子序列连接至oligo-dT运行的5'端。将所得cDNA转录到多个RNA拷贝中,随后转化回cDNA(Phillips等人,方法(Methods)10(3):283-288(1996))。这常常将cDNA分子截短,从而失去原始mRNA的5'序列,尤其是对于相对较长的转录物而言,并且当以较低量(LQ)细胞为起始物质时需要进行多轮处理,这进一步加剧cDNA截短。最新修改(Hashimshony等人,细胞报告(Cell Rep.)2(3):666-673(2012))使得能够进行多重分析,但这仍然偏向于3'端序列。其它方法基于cDNA的PCR扩增(Liu等人,酶学方法(Methods Enzymol.)303:45-55(1999);Ozsolak等人,基因组研究(Genome Res.)20(4):519-525(2010));Gonzalez等人,科学公共图书馆综合卷(PLoS ONE.)5(12):el4418(2010);Kanamori等人,基因组研究(Genome Res.)21(7):1150-1159(2011);Islam等人,基因组研究(Genome Res.)21(7):1160-1167(2011);Tang等人,自然方法(Nat.Methods.)6(5):377-382(2009);Kurimoto等人,核酸研究(Nucleic Acids Res.)34(5):e42(2006);Qiu S等人,前沿基因学(Front Genet.)3:124(2012))。
然而,这些方法可能导致序列沿着mRNA的偏向表示,并且由于即使使用长PCR反应时仍排斥DNA模板(例如,长DNA模板),因而无法得到mRNA(例如,长mRNA)的完整序列。
发明内容
本公开提由从较低量细胞和/或单细胞分离的RNA扩增cDNA的方法。本公开还提供转录组分析方法,其中细胞没有经受应力(例如,用于cDNA分析的高温),因而维持转录组表达谱。
在一个实施例中,本公开涉及一种用于制备互补脱氧核糖核酸(cDNA)分子的方法,其包括:
(a)将引物退火到模板核酸分子上,从而产生已退火模板核酸分子;以及
(b)在存在核苷酸的情况下,将以下各者混合:
i.该已退火模板核酸分子;
ii.一个或多个受体核酸分子;和
iii.经过修饰的逆转录酶,其中该经过修饰的逆转录酶通过以下操作产生多个连续互补脱氧核糖核酸分子:i)逆转录该已退火模板核酸分子的序列;ii)迁移到受体核酸分子;和iii)在约12℃到约42℃的温度下以最多约5%的误差率逆转录该受体核酸分子的序列。
在一些实施例中,该迁移与模板和受体核酸分子之间的序列一致性无关。在一些实施例中,(a)和(b)在单个容器中执行。在一些实施例中,该方法进一步包括对包括多个不同核糖核酸(RNA)分子的多个异质模板核酸分子执行该方法。在一些实施例中,多个不同核糖核酸分子包括信使RNA(mRNA)、核糖体RNA(rRNA)、转运RNA(tRNA)、微小RNA(mRNA)和长链非编码RNA(lncRNA)。在一些实施例中,在最多约2小时内制备多个连续互补脱氧核糖核酸分子。在一些实施例中,模板核酸分子选自由以下组成的组:人工片段化DNA模板、天然片段化DNA模板、人工片段化核糖核酸(RNA)模板、天然片段化核糖核酸(RNA)模板或其组合。
在一些实施例中,经过修饰的逆转录酶以每个碱基至少约80%的持续合成能力扩增该已退火模板核酸分子。在一些实施例中,经过修饰的逆转录酶包括至少一种相对于野生型未修饰逆转录酶有所改进的酶性质。在一些实施例中,至少一种已改进酶性质选自由以下组成的组:相对于该野生型未修饰逆转录酶的较高热稳定性、较高比活性、较高持续合成能力、较高链置换、较高端到端模板跳转(end-to-end template jumping)、较高亲和力及较高保真性。在一些实施例中,经过修饰的逆转录酶是R2逆转录酶。在一些实施例中,经过修饰的逆转录酶与SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ IDNO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ IDNO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ IDNO:65、SEQ ID NO:66或SEQ ID NO:67具有至少约90%的一致性,且相对于SEQ ID NO:52含有至少一个取代修饰。
在一些实施例中,该方法进一步包括在执行(a)和(b)之后添加标签到模板核酸分子,从而产生多个带标签的连续互补脱氧核糖核酸分子。在一些实施例中,该方法进一步包括对该等带标签的多个连续互补脱氧核糖核酸分子进行测序。在一些实施例中,经过修饰的逆转录酶进一步包括标签。在一些实施例中,该标签选自由以下组成的组:生物素、叠氮基、乙炔基、His标签、钙调蛋白标签、CBP、CYD、Strep II、FLAG标签、HA标签、Myc标签、S标签、SBP标签、Softag-1、Softag-3、V5标签、Xpress标签、isopeptag、SpyTag B、HPC肽标签、GST、MBP、生物素羧基载体蛋白、谷胱甘肽-S-转移酶标签、绿色荧光蛋白标签、麦芽糖结合蛋白标签、Nus标签、Strep标签和硫氧还蛋白标签。
在一些实施例中,该方法进一步包括进行聚合酶链反应(PCR)扩增反应,从而形成一个或多个扩增子。在一些实施例中,(a)和(b)以及PCR扩增反应在同一容器中进行。在一些实施例中,PCR扩增在足以使该逆转录酶失活的温度下进行。
在一些实施例中,一个或多个受体核酸分子包括通过该经过修饰的逆转录酶停止该逆转录的经过修饰的核苷酸。在一些实施例中,该方法进一步包括从受试者获得包括一个或多个模板核酸分子的样本并将一个或多个引物退火到该一个或多个模板核酸分子上。在一些实施例中,样本是组织样本。在一些实施例中,样本包括一种或多种游离核酸,且该方法进一步包括在同一容器中进行(a)和(b)的反应。
在一些实施例中,该方法进一步包括在退火一个或多个引物之前耗尽包括一个或多个模板核酸分子的样本的至少一个核糖体RNA(rRNA)。在一些实施例中,耗尽至少一个核糖体RNA(rRNA)包括使寡核苷酸与rRNA杂交。在一些实施例中,耗尽该至少一个核糖体RNA(rRNA)包括rRNA的寡核苷酸探针引导式内切核苷酸裂解(oligonucleotide probe-guidedendonucleolitic cleavage)。在一些实施例中,该一个或多个模板核酸分子包括至少一个转运RNA(tRNA),且该方法进一步包括在退火一个或多个引物之前耗尽一个或多个模板核酸分子的至少一个tRNA。
在一些实施例中,该方法在不纯化一个或多个已退火模板核酸分子的情况下执行。在一些实施例中,该方法进一步包括纯化包括多个连续互补脱氧核糖核酸分子的混合物。在一些实施例中,纯化包括两个纯化步骤。在一些实施例中,两个纯化步骤包括镍亲和纯化步骤和肝素亲和纯化步骤。
在一些实施例中,对约0.1nM到约100nM一个或多个模板核酸分子执行该方法。在一些实施例中,该方法进一步包括将一个或多个随机引物退火到模板核酸分子上。在一些实施例中,引物与一个或多个衔接子序列杂交。在一些实施例中,模板核酸分子来源于单个细胞。
在一个实施例中,本公开涉及一种用于制备互补脱氧核糖核酸分子的方法,其包括:
(a)将一个或多个引物退火到一定量的模板核酸分子上,从而产生一个或多个已退火模板核酸分子;以及
(b)在存在核苷酸的情况下,将以下各者混合:
i.一个或多个已退火模板核酸分子;
ii.一个或多个受体核酸分子;和
iii.经过修饰的逆转录酶,经过修饰的逆转录酶由此通过逆转录已退火模板核酸分子的序列、迁移到受体核酸分子并在无需在单个反应容器中进行热循环的情况下逆转录受体核酸分子的序列来产生多个连续互补脱氧核糖核酸分子。
在一些实施例中,该迁移与模板和受体核酸分子之间的序列一致性无关。在一些实施例中,在最多约2小时内制备多个连续互补脱氧核糖核酸分子。在一些实施例中,该一定量的模板核酸分子选自由以下组成的组:人工片段化DNA模板、天然片段化DNA模板、人工片段化核糖核酸(RNA)模板、天然片段化核糖核酸(RNA)模板或其组合。在一些实施例中,该一定量的模板核酸分子包括一种或多种游离核酸。在一些实施例中,经过修饰的逆转录酶包括至少一种相对于野生型未修饰逆转录酶有所改进的酶性质。在一些实施例中,已改进酶性质选自由以下组成的组:相对于该野生型未修饰逆转录酶的较高热稳定性、较高比活性、较高持续合成能力、较高链置换、较高端到端模板跳转、较高亲和力及较高保真性。在一些实施例中,经过修饰的逆转录酶是R2逆转录酶。在一些实施例中,经过修饰的逆转录酶与SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ IDNO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ IDNO:66或SEQ ID NO:67具有至少90%的一致性,且相对于SEQ ID NO:52含有至少一个取代修饰。
在一些实施例中,该方法进一步包括在执行(a)和(b)之后添加标签到该一定量的模板核酸分子,从而产生多个带标签的连续互补脱氧核糖核酸分子。在一些实施例中,该方法进一步包括对多个带标签的连续互补脱氧核糖核酸分子进行测序。在一些实施例中,经过修饰的逆转录酶包括标签。在一些实施例中,该标签选自由以下组成的组:生物素、叠氮基、乙炔基、His标签、钙调蛋白标签、CBP、CYD、Strep II、FLAG标签、HA标签、Myc标签、S标签、SBP标签、Softag-1、Softag-3、V5标签、Xpress标签、isopeptag、SpyTag B、HPC肽标签、GST、MBP、生物素羧基载体蛋白、谷胱甘肽-S-转移酶标签、绿色荧光蛋白标签、麦芽糖结合蛋白标签、Nus标签、Strep标签和硫氧还蛋白标签。在一些实施例中,一个或多个受体核酸分子包括通过该经过修饰的逆转录酶停止逆转录的经过修饰的核苷酸。
在一些实施例中,该方法进一步包括从受试者获得样本。在一些实施例中,样本包括一种或多种游离核酸,且该方法进一步包括在同一容器中进行(a)和(b)的反应。在一些实施例中,样本是组织样本。在一些实施例中,该方法进一步包括在退火一个或多个引物之前耗尽一个或多个模板核酸分子的至少一个核糖体RNA(rRNA)。在一些实施例中,耗尽至少一个核糖体RNA(rRNA)包括使寡核苷酸与rRNA杂交。在一些实施例中,耗尽该至少一个核糖体RNA(rRNA)包括rRNA的寡核苷酸探针引导式内切核苷酸裂解。在一些实施例中,耗尽一定量的模板核酸分子的至少一个转运RNA(tRNA)发生在退火一个或多个引物之前。
在一些实施例中,该方法在不纯化一个或多个已退火模板核酸分子的情况下执行。在一些实施例中,该方法进一步包括纯化包括多个连续互补脱氧核糖核酸分子的混合物。在一些实施例中,纯化包括两个纯化步骤。在一些实施例中,两个纯化步骤包括镍亲和纯化步骤和肝素亲和纯化步骤。在一些实施例中,该一定量的模板核酸分子是约0.1nM到约100nM的一个或多个模板核酸分子。在一些实施例中,一个或多个引物包括一个或多个随机引物。在一些实施例中,一个或多个引物与一个或多个衔接子序列杂交。在一些实施例中,一定量的模板核酸分子来源于单个细胞。
在一个实施例中,本公开涉及一种多肽,其具有逆转录酶活性且包括与SEQ IDNO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ IDNO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ IDNO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66或SEQID NO:67具有至少90%的一致性且相对于SEQ ID NO:52含有至少一个取代修饰的氨基酸序列。
在一个实施例中,本公开涉及一种经纯化多肽,其包括来自R2逆转录酶的一个或多个结构域,其中该经纯化多肽以最多约5%的误差率由模板核酸分子产生互补脱氧核糖核酸分子的一个或多个拷贝。
在一些实施例中,多肽以每个碱基至少约80%的持续合成能力逆转录模板核酸分子。在一些实施例中,多肽在约12℃到约42℃的温度下逆转录模板核酸分子。在一些实施例中,多肽包括如SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ IDNO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ IDNO:65、SEQ ID NO:66或SEQ ID NO:67中所列的氨基酸序列。
在一个实施例中,本公开涉及一种非天然存在的酶,其包括来自R2逆转录酶的一个或多个结构域,其中非天然存在的酶在小于三小时的时段中以针对至少一种酶性质大于1.0的性能指标产生互补脱氧核糖核酸产物,该至少一种酶性质选自由以下组成的组:相比于具有SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ IDNO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ IDNO:66或SEQ ID NO:67的已纯化酶改进的稳定性、比活性、蛋白表达、纯化、持续合成能力、链置换、模板跳转、增大的DNA/RNA亲和力和保真性。
在一些实施例中,R2逆转录酶和/或非天然存在的酶和/或多肽可以具有至少一个突变和/或修饰。在一些实施例中,R2和/或非天然存在的酶和/或多肽包括C952S,和/或C956S,和/或C952S,C956S(双突变体),和/或C969S,和/或H970Y,和/或R979Q,和/或R976Q,和/或R1071S,和/或R328A,和/或R329A,和/或Q336A,和/或R328A,R329A,Q336A(三突变体),和/或G426A,和/或D428A,和/或G426A,D428A(双突变体)突变,和/或其任何组合。
在一个实施例中,本公开涉及一种方法,其包括:
(a)添加核酸酶复合物到多个双链核酸分子,其中该核酸酶复合物包括:
i.Cas9核酸酶或其功能变异体;和
ii.至少一个合成引导寡核苷酸,其中该合成引导寡核苷酸与该等多个双链核酸分子中的至少一个双链核酸分子中的核糖体核糖核酸(rRNA)区域或转运核糖核酸(tRNA)区域互补;
(b)使该复合物裂解至少一个双链核酸分子的该rRNA或tRNA区域,从而提供至少一个已裂解双链核酸分子,以及
(c)对该至少一个已裂解双链核酸分子或其衍生物进行核酸测序,从而得到缺乏该rRNA或tRNA区域的该至少一个双链核酸分子的核酸序列。
在一些实施例中,该合成引导寡核苷酸与核糖体核糖核酸(rRNA)互补。在一些实施例中,该合成引导寡核苷酸与转运核糖核酸(tRNA)互补。在一些实施例中,该方法不需要在测序之前使包括来源于rRNA和tRNA的序列的多个双链分子变性。在一些实施例中,多个双链核酸分子包括cDNA。
在一些实施例中,该方法不需要使包括来源于rRNA和/或tRNA的序列的多个双链分子变性。在一些实施例中,多个双链核酸分子包括来源于rRNA和/或tRNA的序列。在一些实施例中,双链核酸分子包括cDNA。在一些实施例中,预定区域为rRNA区域。在一些实施例中,预定区域为tRNA区域。
在一个实施例中,本公开涉及一种用于制备核酸分子的多联体的方法,其包括:
(a)处理多个双链核酸分子的末端;
(b)添加第一多个衔接子分子(adaptor molecule)到该多个双链核酸分子,其中该第一多个衔接子分子包括一个或多个突出端序列(overhang sequence),其中至少两个突出端序列彼此互补,从而提供第一多个衔接子连接双链核酸分子;
(c)在不存在引物的情况下添加聚合酶到该第一多个衔接子连接双链核酸分子,该聚合酶由此通过使两个或超过两个衔接子连接双链核酸分子通过该一个或多个突出端序列接合来形成第一组衔接子连接双链核酸多联体;
(d)添加第二多个衔接子分子到该第一组,其中该第二多个衔接子分子包括一个或多个突出端序列,其中至少两个突出端序列彼此互补,从而提供第二组衔接子连接双链核酸分子;
(e)对一组衔接子分子重复(a)到(c),得到包括预定平均长度的多联体。
在一些实施例中,(a)中的处理包括末端修复。在一些实施例中,聚合酶是逆转录酶。在一些实施例中,逆转录酶是R2逆转录酶或其功能变异体。在一些实施例中,第一多个衔接子分子、第二多个衔接子分子或二者包括唯一分子识别序列(unique molecularidentifier sequence;UMI)。在一些实施例中,聚合酶在PCR或等温扩增反应中使两个或超过两个衔接子连接双链核酸分子接合。在一些实施例中,第一多个衔接子分子、第二多个衔接子分子或二者包括至少一个经过修饰的核苷酸。
在一些实施例中,衔接子包括唯一分子识别序列(UMI)。在一些实施例中,扩增通过PCR或等温扩增进行。在一些实施例中,衔接子包括至少一个经过修饰的核苷酸。
本公开的优点包含但不限于:用于cDNA和核酸文库制备(例如,单个细胞和/或批量文库制备)的简单高效且与各种序列技术兼容的方法;高品质文库制备可以用于单细胞核酸(例如RNA)测序和批量核酸(例如RNA)测序;经过修饰的逆转录酶具有改进的酶性质;核酸样本(例如RNA,和/或mRNA,和/或DNA)到核酸(例如cDNA)文库的高转化率(例如效率和/或保真性);低非特异性产物产率;以及在转录组分析中,由于可以在环境温度(例如30℃)下进行核酸合成,细胞不经受应力(例如cDNA合成无需高温)。
本公开的优点还包含能够使用随机引发或多引发产生核酸(例如cDNA)文库,和/或即使在较低量(例如500飞摩尔)的片段化/已降解核酸分子(例如RNA和DNA)下也能够由片段化/已降解核酸分子产生文库。本公开的优点还包含所公开的方法能够(例如通过使用经过修饰的逆转录酶)扩增片段(例如扩增完整片段)并产生完整片段的多个拷贝以供测序。当前可用方法可能引起在随机位置扩增片段并且可能仅扩增片段的部分,因此根据当前方法的片段测序和鉴别在较低量下不可用。本公开的优点还包含通过单步扩增方案或通过两步扩增流程进行扩增,因此提高特异性和效率。当前方法包含可能导致低产率、低效率和/或低特异性的多步扩增。本公开的方法的另一个优点是能够使用未必与模板互补的核酸分子片段(例如RNA)进行引发。本公开的另一个优点是经过修饰的酶能够在室温下和/或在低至约30℃的温度下进行模板跳转。本公开的另一个优点是能够以少于三个步骤(图1)和/或在小于4小时内由样本制备文库。这个优点对于临床研究和测试以及医学领域尤其重要。本公开的另一个优点是本文公开的方法能够(例如通过使用经过修饰的逆转录酶)改进模板跳转、持续合成能力、链置换性质、酶活性和/或保真性。
本公开的其它方面和优点将根据以下详细描述而变得为本领域技术人员显而易见,其中仅展示和描述本公开的说明性实施例。应意识到,本公开能够具有其它和不同实施例,并且其若干细节能够在各个明显的方面进行修改,其都不脱离本公开。因此,图式和描述在本质上被看作是说明性的,而不是限定性的。
引用并入
在本说明书中提及的所有公开案、专利和专利申请以及NCBI登记号都以引用的方式并入本文中,达到如同每一个单独的公开案、专利、专利申请或NCBI登记号都专门并且单独地指示以引用方式并入的相同程度。在以参考方式并入的公开案和专利、专利申请或NCBI登记号与包含于本说明书中的公开内容相矛盾的情况下,本说明书打算替代和/或优先于任何这类有矛盾的材料。
附图说明
本公开的新颖特征在所附权利要求书中细致阐述。将通过参考以下详细描述(其阐述使用本公开的原理的说明性实施例)和附图(本文中也称为“图式”和“图”)获得对本公开的特征和优点的更好理解,其中:
图1示出传统方法和本公开的方法之间制备互补脱氧核糖核酸(cDNA)文库的差异。图1还示出基于传统方法和本公开的方法由液体活检样本制备用于测序的样本的差异。传统方法包含需要约1-2天的流程和超过4-5小时的动手操作时间,而本公开的方法包含需要小于约2小时的流程和小于约30分钟的动手操作时间;
图2示出用于基于本公开的方法构建文库的工作流程;
图3示出用于构建文库的工作流程;
图4示出使用随机引物构建文库的工作流程;
图5A示出使用片段化或已降解核糖核酸(RNA)或脱氧核糖核酸(DNA)利用RNA引发构建文库的工作流程;
图5B示出使用片段化或已降解RNA或DNA利用RNA引发构建文库的工作流程的实例,即使用特异性引物的方法;
图6A示出使用片段化或已降解RNA或DNA利用供体复合物构建文库的工作流程;
图6B示出使用片段化或已降解RNA或DNA利用供体复合物构建文库的工作流程的实例,即使用特异性引物;
图7示出R2逆转录酶的N端和C端截短的示意图;
图8示出利用所选非长末端重复序列(LTR)逆转录转座子的序列分析以及两个保守区(区域1和区域0)上游的N端截短位点的实例;
图9示出利用所选非LTR逆转录转座子的序列分析以及两个保守基序8*和9*下游的C端截短位点的实例;
图10示出展示经纯化野生型R2逆转录酶和N端截短R2逆转录酶的凝胶;
图11示出聚丙烯酰胺凝胶电泳(PAGE)凝胶,通过使用合成RNA展示R2酶和莫洛尼鼠白血病病毒(moloney murine leukemia virus;MMLV)逆转录酶的活性和模板跳转性质;
图12A示出用于测序文库制备的工作流程;
图12B示出基于一锅(例如单容器)反应的文库制备的实时PCR数据;
图12C示出展示扩增子的凝胶;
图13示出使用不同模板量的一锅(例如单容器)RNA文库制备;
图14示出利用不同模板长度的一锅(例如单容器)RNA文库制备;
图15示出酶活性和模板跳转取决于氯化钠(NaCl)的浓度;
图16A示出基于带荧光标记的引物(荧光素)观测的镍亲和纯化和/或肝素亲和纯化之后的酶活性;
图16B示出基于SYBR Gold染色观测的镍亲和纯化和/或肝素亲和纯化之后的模板跳转性质;
图17示出存在DNA模板的情况下的R2酶活性和模板跳转(泳道(lane)1:无酶对照物;泳道2:0.023μg/μl酶,存在DNA模板);
图18A示出本公开用于对来自液体活检的文库制备进行测序的方法的工作流程;
图18B示出样本DNA片段是利用RNA引发方法和RNA供体方法通过R2酶捕获的;
图18C示出样本DNA片段(处于各种浓度下)是使用RNA引发方法通过R2酶捕获的;
图18D示出样本DNA片段(处于各种浓度下)是利用RNA供体方法通过R2酶捕获的;
图19示出样本DNA片段是使用RNA供体方法以低至500飞摩尔的浓度捕获的;
图20示出本公开的方法可以用于液体活检应用。图20公开本文所描述之方法展示相比当前可用技术的高敏感度(例如本文公开的方法可以用于低至0.3pg的极低DNA量,其敏感度比当前可用方法高约100-1000倍)。数据还展示涉及甚至低于0.3pg(例如低几个数量级)的DNA量的应用潜力;
图21示出本公开的方法具有检测RNA(例如外泌体RNA)和游离DNA(cell-freeDNA)的突变的优势。这个方法可以用于通过合并RNA和游离DNA而提高检测敏感度来检测罕见突变或低频突变(例如,一些突变等位基因可能以每毫升血浆少于1个拷贝出现)。这恶搞方法可以用于例如测试从体液(例如血液)分离的分析物。体液(例如血浆)可能含有不同游离核酸来源。这些游离来源可以是循环游离DNA(例如双链DNA(dsDNA)和单链DNA(ssDNA))以及RNA(例如细胞外RNA(exRNA)和来自外泌体的RNA)。游离DNA可能存在于片段化和/或降级的各个阶段(例如长度不同)。细胞外RNA可以包含但不限于信使RNA(mRNA)、转运RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)和长链非编码RNA(lncRNA)。图21还示出本公开的方法区别地标签存在于相同或不同试管(例如相同PCR管)中的游离DNA和RNA。加标签有助于通过区分来源于DNA和RNA模板的序列进行测序后分析。图21展示两种不同的分析物(DNA和RNA)在存在末端脱氧核苷酸转移酶(TdT)、多聚腺苷酸聚合酶以及特异性核苷酸底物dCTP(或替代地dGTP或dTTP)和ATP的情况下加聚腺苷酸尾(polytailed)。简单地说,将含有RNA和DNA(dsDNA和ssDNA)的反应物与多聚腺苷酸聚合酶、TdT、dCTP和ATP混合并一起培育(图21)。多聚腺苷酸聚合酶优先使用优选的底物ATP延伸RNA,而TdT优先使用优选的脱氧底物dCTP延伸DNA。一般来说,反应可以使用两种酶(例如多聚腺苷酸聚合酶和TdT)同时进行,或替代地,可以一次使用一种酶依序进行;
图22A示出链霉亲和素固定化寡核苷酸可以用于改进特定模板捕捉和模板跳转能力的效率。图22A展示链霉亲和素固定化寡核苷酸结合于特定DNA和/或RNA模板。在这种情况下,链霉亲和素固定化寡核苷酸结合于磁珠。一旦特定DNA和/或RNA模板结合于链霉亲和素-磁珠复合物,即可富集模板。寡核苷酸可用作引物并且模板可以在存在酶(例如R2酶)的情况下转录;
图22B示出包括同时结合于寡核苷酸引物和寡核苷酸受体的链霉亲和素的复合物能够与特定DNA和/或RNA模板结合。简单地说,特定模板结合于寡核苷酸引物,寡核苷酸引物接着可以在存在酶(例如R2酶)的情况下延伸。引物延伸接着由于受体寡核苷酸与特定模板之间极为接近而经历模板跳转;
图22C示出包括结合于寡核苷酸引物、寡核苷酸受体和磁珠的链霉亲和素的复合物能够与特定DNA和/或RNA模板结合。在这种情况下,特定模板首先富集有磁珠。模板接着在存在酶(例如R2酶)的情况下进行拷贝,且延伸的序列可能进一步经历模板跳转;
图23A和图23B示出模板多联体化。一些测序技术具有长测序读取长度(约500bp到约50000bp),而其它技术具有短测序读取长度(约50bp到约250bp)大部分从体液分离的游离DNA和RNA是短片段(约20bp到约200bp)。图23A和图23B中所示的方法尤其适合于具有长测序读取长度的测序技术,因为该方法能够形成长模板多联体。图23A示出多联体化由信号传导序列分隔开的若干模板的方法。在这个方法中,短dsDNA片段转化成由信号传导序列分隔开的长多联体。图23B展示多联体化的最终产物,其在两端包含特定衔接子。衔接子设计并有唯一分子识别序列(UMI),其允许跟踪带标签的分子并且有助于降低数据分析时的误差。简单地说,dsDNA片段利用两个或超过两个衔接子接合。随后使用无引物的PCR(或者等温扩增)使接合的片段延伸。可以例如通过用经过修饰的核苷酸对衔接子加标签(例如通过引入甲基化核苷酸或通过插入dUTP)来确定多联体长度或已连接模板的数目。多联体的长度可以基于经过修饰/未修饰的衔接子之间的比来调节。衔接子序列可以充当同源性引发位置(退火到同源点ssDNA片段,充当模板和引物)。PCR中的反应经历所选数目个循环(循环越多,多联体越长)或时间(等温扩增)。接着停止反应,且长dsDNA多联体由两个唯一dsDNA衔接子接合。还参见实例13;
图24A示出本公开的模板多联体化的工作流程;
图24B示出展示200bp DNA片段的多联体化的凝胶;
图25示出存在逆转录酶和第二酶或酶促活性(即,伴随酶)(例如ssDNA 3'至5'核酸外切酶或具有编辑活性的聚合酶(例如3'至5'核酸外切酶))的情况下的示意反应。伴随酶的实例包含但不限于T4DNA聚合酶、核酸外切酶I和核酸外切酶T。伴随酶的一个功能或用途为去除过量未使用的游离延伸引物。游离引物可产生不想要的产物(例如游离引物可以充当跳转受体或可以用作非特异性引物)。图25展示反应流程,其以将引物退火到RNA模板上开始(可以将引物退火到特定序列、或多聚腺苷酸尾、或3'端的加聚腺苷酸尾产物)。接着将反应物与酶(例如R2酶)、具有编辑活性的聚合酶(例如3'至5'核酸外切酶)和受体模板(例如具有受保护3'端的受体模板)混合。受体模板可以在3'端处包含碱基以保护其免受核酸外切酶水解。可以用于保护受体模板的核苷酸实例包含但不限于核糖核苷酸、硫代磷酸和含或不含修饰的核苷酸碱基。或者,如果例如使用适当比率的引物与核酸外切酶,那么可以在单个步骤中执行图25中所示的反应。如图25中所示,如果R2逆转录酶在完全跳转到受体模板上之前从DNA/RNA异源双链体解离,那么产物过度延伸(3'突出端)。接着,3'至5'核酸外切酶活性可能重新产生DNA/RNA双链体的普通端结构。一般而言,跳转到受体模板可以通过多转换机制来完成,因而提高反应产率;
图26示出下一代测序(NGS)文库的生物分析器跟踪数据。线条1表示来自血浆的片段化RNA seq文库,且线条2表示来自血浆的非片段化RNA seq文库(参见实例15);
图27和图28示出产生游离脱氧核糖核酸(cfDNA)文库的方法;
图29示出文库制备:使用连接到磁珠或固体支撑物的互补寡核苷酸牵拉核糖体RNA和/或转运RNA和/或PCR产物以最大化测序能力;
图30示出文库制备:使核糖体RNA和/或转运RNA和/或PCR产物进行寡核苷酸引导式降解以最大化测序能力。
图31示出本公开的能够同时捕捉/靶向所有种类的RNA的技术。图31展示根据本公开的方法所获得的游离RNA文库。图表对应于由20ng游离RNA(cfRNA)制备的文库的Illumina测序结果。分析了28357171个读数,绘制91.9%。捕获的物品/分析物的实例包含但不限于穹窿体RNA(vault RNA)、tRNA、srpRNA、sRNA、snRNA、snoRNA、scRNA、scaRNA、rRNA、RNA、长非编码RNA(lncRNAs)、微小RNA(miRNA)、大lnc RNA、庞杂RNA(miscellaneous RNA)、3'重叠ncRNA、DNA、双向启动子incRNA、lincRNA、MT_tRNA、MT_rRNA、核酶、LTR、逆转录子(retroposon)和SINE。
具体实施方式
虽然本文已展示并描述本公开的各种实施例,但本领域的技术人员将显而易见,这些实施例仅作为实例而提供。本领域技术人员可以在不脱离本公开的情况下想到众多变型、变化和取代。应理解,可以采用本文描述的本公开实施例的各种替代方案。
除非另外定义,否则本文中所使用的所有技术和科学术语具有与本公开所属领域的一般技术人员通常所理解相同的含义。在有矛盾的情况下,将以包括定义的本申请为准。此外,除非上下文另外需要,否则单数术语应包括复数并且复数术语应包括单数。除非指定仅专利或专利公开案的特定部分以引用方式并入,否则本文提及的所有公开案、专利和其它参考文献全部出于所有目的以引用的方式并入,就如同每个单独的公开案或专利申请都专门并且单独指定以引用方式併入一样。为了进一步限定本公开,提供以下术语、缩写和定义。
如本文所用,术语“约”是指可能发生的数量的变化,例如,由于用于在现实世界中制备浓缩液或溶液的典型测量和液体处理程序、这些程序中不经意的误差、用于制备组合物或执行实施方法的成分的制造、来源或纯度的差异、等等而发生。术语“约”还涵盖了由于由特定初始混合物产生的组合物的不同平衡条件而有差异的量。无论是否由术语“约”修饰,权利要求书都包括数量的等效值。在一些实施例中,术语“约”意思是在所报告数值的10%内,或所报告数值的5%内,或所报告数值的20%内。
本公开的元件或组件之前的不定冠词“一(a和an)”不打算限制个例的数目,即,元件或组件的出现次数。因此,“一”应被理解为包括一个或至少一个,且除非数字明显表示单数,否则元件或组件的单数形式也包含复数。
术语“退火”、“杂交”或“结合”在本文中可以互换使用,指代一个或多个单链多核苷酸序列、区段或链的合并并且允许其通过碱基配对形成双链分子。两个互补序列(例如核糖核酸(RNA)和/或脱氧核糖核酸(DNA))可以通过利用互补碱基形成氢键,从而产生双链多核苷酸或多核苷酸的双链区来退火或杂交。
术语“受试者”可以是可能得益于本公开方法的任何动物,包含例如人类和非人类哺乳动物,例如灵长类动物、啮齿动物、马、狗和猫。受试者包含但不限于真核生物;哺乳动物,例如灵长类动物,例如黑猩猩或人类、奶牛、狗、猫;啮齿动物,例如天竺鼠、大鼠、小鼠;兔类;或鸟类;爬行动物;或鱼类。尤其打算使用本文所描述的方法治疗的受试者包含人类。受试者可以是个体或患者。
如本文所用,术语“引物延伸反应”一般是指双链核酸的变性、引物与已变性核酸的一个或两个链的结合以及引物的拉伸。
如本文所用,术语“反应混合物”一般是指包括完成核酸扩增(例如DNA扩增、RNA扩增)所必需的试剂的组合物,其中这些试剂的非限制性实例包含对靶RNA或靶DNA具有特异性的引物组、由RNA的逆转录产生的DNA、DNA聚合酶、逆转录酶(例如用于RNA的逆转录)、适合缓冲液(包含两性离子缓冲液)、辅因子(例如二价和一价阳离子)、dNTP和其它酶(例如尿嘧啶-DNA糖基化酶(UNG))等。在一些情况下,反应混合物也可以包括一个或多个报告剂。
如本文所用,“报告剂(reporter agent)”一般是指产生可检测信号的组合物,其存在与否可以用于检测已扩增产物的存在。
如本文所用,术语“靶核酸”一般是指起始核酸分子群体中具有如下核苷酸序列的核酸分子,需要确定该核苷酸序列的存在、量和/或序列或这些项中的一个或多个的变化。靶核酸可以是任何类型的核酸,包含DNA、RNA和其类似物。
如本文所用,术语“引物”是指在限制酶切水解中天然存在的或以合成方式产生的寡核苷酸,其特征在于能够相对于模板寡核苷酸延伸,使得当将全部寡核苷酸在存在核苷酸的情况下全部置于适合温度和pH下时,序列与模板分子的至少一部分的序列互补的寡核苷酸与引物连接。然而,能够以这种方式使用本身不需要引物相对于模板完全延伸,且在一些实施例中,引物仅用作添加少数非模板化核苷酸的位点。可使用例如长度为至少6个核苷酸的引物六聚体的引物。在一些实施例中,引物可以用荧光标记(例如5'-/56FAM/TGATGACGAGGCATTTGGC/3')。在一些实施例中,引物的长度在约6个到约100个核苷酸,或在一些实施例中约10个到约70个核苷酸的范围内。在一些实施例中,可以使用较大的引物。在一些实施例中,可以使用随机引物。在一些实施例中,引物可以是随机引物。在一些实施例中,一个或多个引物可以是一个或多个随机引物。
术语“一个或多个引物”可以包括任何数目的引物或随机引物。举例来说,“一个或多个引物”可以包含至少、最多或约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、20、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个引物或随机引物。一个或多个引物可以包含约1到约2、约1到约3、约1到约4、约1到约5、约1到约6、约1到约7、约1到约8、约1到约9、约1到约10、约1到约15、约1到约20、约1到约25、约1到约30、约1到约35、约5到约15、约3到约10、约5到约20、约10到约50、约30到约100或大于约100个引物。一个或多个引物可以包括任何数目的引物。举例来说,一个或多个引物可以包含至少、最多或约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、20、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、150、200、250、300、350、400、450、500、550、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、3000、4000、5000、6000、7000、8000、9000、10000、11000、12000、13000、14000、15000、16000、17000、18000、19000、20000、25000、30000、35000、40000、45000、50000、55000、60000、65000、70000,75000,80000、85000,90000、95000,100000、150000、200000、250000、300000、350000、400000、450000、500000、550000、600000、650000、700000、750000、800000、850000、900000、950000、1000000、1500000、2000000、2500000、3000000、3500000、4000000、4500000、5000000、5500000、6000000、6500000、7000000、7500000、8000000、8500000、9000000、9500000或10000000个引物。一个或多个引物可以包含约10到约100、约100到约1000、约1000到约10,000、约10,000到约100,000、约100,000到约1,000,000或约1,000,000到约10,000,000个引物。
如本文所用,术语“随机引物”是指其中含有随机碱基序列的引物,并且打算涵盖部分或全部由随机碱基序列组成的引物。
在一些实施例中,引物可以包含衔接子序列。在一些实施例中,引物的5'尾序列包括不与靶(衔接子序列)杂交的序列。可以选择具有不同3'靶结合序列(即,“通用”5'尾序列)的多种引物中相同的衔接子序列。这使得单个报告探针序列可以用于检测任何所需靶序列,这在由于加标记而更复杂的报告探针合成中是一个优势。在一些实施例中,引物可以包含RNA引物。在一些实施例中,引物可以包含DNA引物。在一些实施例中,引物可以包含R2RNA引物。在一些实施例中,引物可以包含一个或多个随机引物。
如本文所用,术语“受体模板”与“受体核酸分子”同义。在一些实施例中,受体核酸可以被修饰。在一些实施例中,受体核酸分子可以在3'端被修饰,例如以保护其不会被误认为RNA引物。在一些实施例中,受体核酸分子的修饰可以包含双脱氧3'端。在一些实施例中,修饰可以包含磷酸化3'端。在一些实施例中,多核苷酸的磷酸化3'端或通常在其3'端上具有羟基的受体核酸分子的磷酸化3'端可以由于通过本公开的酶进行延伸而用作3'封阻物,或例如可以抑制DNA聚合酶的延伸或可以抑制通过接合酶进行的接合。3'封阻物的另一个非限制性实例包含将3'C3间隔基(三碳间隔基)添加到多核苷酸的3'端,其可以充当针对聚合酶延伸的有效封阻剂。Zhou等人,临床化学(Clin.Chem.),50:1328-1335(2004)。因此,3'端可以通过添加例如C3间隔基、磷酸根、氨基(NH2)或任何其它抑制在多核苷酸的3'端与另一核苷酸之间形成后续磷酸二酯键的化学修饰来封阻。
如本文所用,“突出端序列(overhang sequence)”是指核酸的从双链区延伸的单链区。
如本文所用,“已分离”多核苷酸意思是已从其天然环境去除、使用重组技术产生或以化学方式或以酶方式合成的多核苷酸。多核苷酸也可以被纯化,即,基本上不含任何其它多核苷酸和相关细胞产物或其它杂质。
如本文所用,术语“聚合酶”可以指代将单独的核苷酸连接在一起成为一个链,使用另一个链作为模板的酶。在一些实施例中,聚合酶是具有编辑能力的聚合酶。在一些实施例中,具有编辑能力的聚合酶可以是3'至5'核酸外切酶、T4DNA聚合酶、核酸外切酶I、Phi29、Pfu、Vent、KOD、核酸外切酶III和核酸外切酶T。聚合酶的实例可以包含DNA聚合酶、RNA聚合酶、RNA引导式DNA聚合酶、逆转录酶、具有逆转录酶活性的多肽或其任何变异体、热稳定聚合酶、野生型聚合酶、经过修饰的聚合酶、大肠杆菌DNA聚合酶I、T7DNA聚合酶、噬菌体T4DNA聚合酶、PHI 29(phi29)DNA聚合酶、Taq聚合酶、Tth聚合酶、Tli聚合酶、Pfu聚合酶、VENT聚合酶、DEEPVENT聚合酶、EX-Taq聚合酶、LA-Taq聚合酶、Sso聚合酶、Poc聚合酶、Pab聚合酶、Mth聚合酶、ES4聚合酶、Tru聚合酶、Tac聚合酶、Tne聚合酶、Tma聚合酶、Tea聚合酶、Tih聚合酶、Tfi聚合酶、Platinum Taq聚合酶、Tbr聚合酶、Tfl聚合酶、Tth聚合酶、Pfutubo聚合酶、Pyrobest聚合酶、Pwo聚合酶、KOD聚合酶、Bst聚合酶、Sac聚合酶、克列诺片段(Klenow fragment)、具有3'至5'核酸外切酶活性的聚合酶和变异体、经过修饰的产物以及其衍生物。在一些实施例中,聚合酶可以是逆转录酶或本公开的经过修饰的逆转录酶。在一些实施例中,聚合酶是单亚单位聚合酶。该聚合酶可以具有高持续合成能力,亦即聚合酶在不剥离核酸模板的情况下将核苷酸连续地并入核酸模板中的能力。
术语“逆转录酶”或RT是指含有RNA引导式DNA聚合酶和DNA引导式DNA聚合酶的酶。RT是指具有逆转录酶活性(例如催化DNA由RNA模板的合成)的一组酶。一般而言,这类酶包含但不限于逆转录病毒逆转录酶、逆转录转座子逆转录酶、逆转录质粒逆转录酶、逆转录子逆转录酶、细菌逆转录酶、Ⅱ型内含子衍生逆转录酶和其突变体、变异体或衍生物。非逆转录病毒逆转录酶包含非长末端重复序列(LTR)逆转录转座子逆转录酶、逆转录质粒逆转录酶、逆转录子逆转录酶和Ⅱ型内含子逆转录酶。其它细菌逆转录酶描述于Simon D和Zimmerly S(2008)的“细菌中的多种未表征的逆转录元件(A diversityofuncharacterized retroelements in bacteria)”核酸研究(Nucleic Acids Res)36(22):7219-7229以及Kojima,KK和Kanehisa,M(2008)的“基于基因邻域和蛋白质架构的新颖类型的原核逆转录元件的系统性调查(Systematic survey for novel types ofprokaryotic retroelements based on gene neighborhood and proteinarchitecture)”分子生物学与进化(Mol Biol Evol)25:1395-1404中,这些文献描述了许多类别的非逆转录病毒逆转录酶(即,逆转录子、II型内含子和多样性产生逆转录元件等等)。逆转录酶已经主要用于将RNA转录为cDNA,接着cDNA可以克隆到载体中以用于进一步处理或用于各种扩增方法中,例如聚合酶链反应、核酸序列依赖性扩增(NASBA)、转录介导扩增(TMA)、自我维持序列复制(3SR)、各种引物延伸反应、5'RACE、化学修饰检测或需要使用RNA模板合成DNA的其它技术。
逆转录病毒逆转录酶
莫洛尼鼠白血病病毒(M-MLV)逆转录酶含有78kDa的单个亚单位,其具有RNA依赖性DNA聚合酶活性和RNase H活性。已将这种酶克隆并以完全活性形式表达于大肠杆菌中(在Prasad,V.R.,逆转录酶(Reverse Transcriptase),纽约冷泉港:冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),第135页(1993)中进行了综述)。
人类免疫缺陷病毒(HIV)逆转录酶是p66和p51亚单位的杂二聚体,其中较小亚单位通过蛋白水解裂解来源于较大亚单位。p66亚单位具有RNA依赖性DNA聚合酶结构域和RNaseH结构域,而p51亚单位具有仅一个DNA聚合酶结构域。活性HIV p66/p51逆转录酶还已经成功地克隆和表达于多种表达宿主中,包含大肠杆菌(在Le Grice,S.F.J.,逆转录酶(Reverse Transcriptase),纽约冷泉港:冷泉港实验室出版社,第163页(1993)中进行了综述)。在HIV p66/p51杂二聚体内,51-kD亚单位为非催化活性的,且66-kD亚单位具有DNA聚合酶活性和RNase H活性(Le Grice,S.F.J.等人,欧洲分子生物学杂志(EMBO Journal)10:3905(1991);Hostomsky,Z.等人,病毒学杂志(J.Virol.)66:3179(1992))。
禽肉瘤白血病病毒(Avian Sarcoma-Leukosis Virus;ASLV)逆转录酶家族的成员也是具有两个亚单位α(大约62kDa)和β(大约94kDa)的杂二聚体,其中α亚单位通过蛋白水解裂解来源于β亚单位(在Prasad,V.R.,逆转录酶(Reverse Transcriptase),纽约冷泉港:冷泉港实验室出版社(1993),第135页中进行了综述)。这个家族的成员包含但不限于劳斯肉瘤病毒(Rous Sarcoma Virus;RSV)逆转录酶、禽成髓细胞瘤病毒(AvianMyeloblastosis Virus;AMV)逆转录酶、禽成红细胞增多症病毒(Avian ErythroblastosisVirus;AEV)辅助病毒MCAV逆转录酶、禽髓细胞瘤病毒MC29辅助病毒MCAV逆转录酶、禽网状内皮组织增殖病毒(Avian Reticuloendotheliosis Virus;REV-T)辅助病毒REV-A逆转录酶、禽肉瘤病毒UR2辅助病毒UR2AV逆转录酶、禽肉瘤病毒Y73辅助病毒YAV逆转录酶、劳斯相关病毒(Rous Associated Virus;RAV)逆转录酶和成髓细胞瘤相关病毒(MyeloblastosisAssociated Virus;MAV)逆转录酶等等。
ASLV逆转录酶可以呈两种其它催化活性结构形式(Ad和a)存在(Hizi,A.和Joklik,W.K.,生物化学杂志(J.Biol.Chem.)252:2281(1977))。
沉积分析表明α/β和β/β以二聚体存在,且a形式以单体与二聚体形式之间的平衡存在(Grandgenett,D.P.等人,美国国家科学院院刊(Proc.Nat.Acad.Sci.USA)70:230(1973);Hizi,A.和Joklik,W.K.,生物化学杂志(J.Biol.Chem.)252:2281(1977);以及Soltis,D.A.和Skalka,A.M.,美国国家科学院院刊85:3372(1988))。ASLVα/β和β/β逆转录酶为唯一已知的在同一蛋白质复合物中包含三个不同活性的逆转录病毒逆转录酶实例:DNA聚合酶活性、RNase H活性和DNA核酸内切酶(整合酶)活性(在Skalka,A.M.,逆转录酶(Reverse Transcriptase),纽约冷泉港:冷泉港实验室出版社(1993),第193页中进行了综述)。a形式缺乏整合酶结构域和活性。
已克隆和表达ASLV逆转录酶的各个亚单位的各种形式。这些形式包含:其通常以蛋白水解方式被处理成β的98-kDa前体多肽和从β羧基端剥离的4kDa多肽(Alexander,F.等人,病毒学杂志61:534(1987)和Anderson,D.等人,聚焦(Focus)17:53(1995));以及成熟β亚单位(Weis,J.H.和Salstrom,J.S.,美国专利第4,663,290号(1987);以及Soltis,D.A.和Skalka,A.M.,美国国家科学院院刊85:3372(1988))。(还参见Wemer S和Wohrl B.M.,欧洲生物化学杂志(Eur.J.Biochem.)267:4740-4744(2000);Wemer S和Wohrl B.M.,病毒学杂志74:3245-3252(2000);Wemer S和Wohrl B.M.,生物化学杂志274:26329-26336(1999))。杂二聚体RSVα/β逆转录酶也已经从表达克隆RSVβ基因的大肠杆菌细胞提纯(Chemov,A.P.等人,生物医学(Biomed.Sci.)2:49(1991))。
非逆转录病毒来源的逆转录酶
逆转录酶还可以从大量并非逆转录病毒来源的可动遗传因子分离。这些可动遗传因子存在于更高级物种的基因组中并且在这些可动遗传因子的寿命周期中发挥作用。已知可动遗传因子针对逆转录酶编码基因(在Howard M Temin,真核基因组中的逆转录:逆转录病毒、副逆转录病毒、逆转录转座子和逆转录物(Reverse Transcription in theEukaryotic Genome:Retroviruses.Pararetroviruses,Retrotransposons,andRetrotranscripts),分子生物学与进化(Mol.Biol.Evol.)2(6):455-468中进行了综述)。这些因子包含但不限于逆转录转座子。逆转录转座子包含非长末端重复序列(LTR)逆转录转座子和LTR可动因子(例如TY3、TY5、非LTR、LINE-L1、R2、Rl)。(Cordaux和Batzer在2009年10月的自然综述(Nature Reviews),第10卷,第691-703页中综述)。
如本文所用,“非LTR逆转录转座子”是指由非LTR逆转录转座子编码的蛋白质和其具有逆转录酶活性的多肽片段,且由其衍生的蛋白质或多肽含有增强其逆转录酶活性或对该活性无有害影响的一个或多个氨基酸取代。非LTR逆转录转座子的优选类别是R2蛋白或多肽。因此,如本文所用,“R2蛋白或R2酶或多肽或其功能片段”是指由R2元件编码的天然存在的蛋白质和其具有逆转录酶活性的多肽片段,且由其衍生的蛋白质或多肽含有增强其逆转录酶活性或对该活性无有害影响的一个或多个氨基酸取代。
逆转录元件(编码RT的遗传因子)被分成表示为含LTR逆转录元件和非含LTR逆转录元件的两个主要家族(Xiong Y,Eickbush TH(1990)“逆转录元件基于其逆转录酶序列的来源和进化(Origin and evolution of retroelements based upon their reversetranscriptase sequences)”欧洲分子生物学杂志9:3353-62)。非LTR逆转录元件是不同的RT编码元件家族,其包含逆转录质粒、非LTR逆转录转座子、逆转录子和可动II型内含子。
如本文所用,术语聚合酶“活性部分(active fraction)”被定义为酶具有聚合酶活性的部分。举例来说,逆转录酶活性部分(RT活性部分)是酶具有逆转录酶活性的部分。
如本文所用,术语“变异的”、“经过修饰的”、“非天然存在的”和“突变的”同义并且是指多肽或酶由于使用例如重组DNA技术(例如突变)产生的一个或多个氨基酸插入、缺失、突变和取代而不同于专门列举的多肽或酶。可以通过比较特定多肽与同源多肽(例如酵母或细菌)的序列以及最大限度地减少高同源性区域(保守区)中产生的氨基酸序列变化的数目或通过用共同序列置换氨基酸来引导确定可以置换、添加或缺失哪些氨基酸残基而不会消除相关活性。在一些实施例中,术语“衍生的”、“变异的”、“经过修饰的”、“非天然存在的”和“突变的”可互换地使用。
本公开的突变体可以根据任何适合方法,包含但不限于本文中描述和例示的方法来产生。例如取代、插入、缺失和/或侧链修饰的突变可以使用任何合适的技术(包含定点突变)来引入到相关基因的核苷酸和氨基酸序列中(Wu编的酶学方法(Meth.Enzymol.)217,学术出版社(Academic Press)(1993))。λRed重组酶方法可以用来“敲除”基因(Datsenko等人,美国国家科学院院刊(PNAS USA)97:6640-6645(2000))。可产生持久的无标记物的多个基因破坏。还可以使用非天然存在的核苷酸和氨基酸。
如本文所用,“同源物”是指与具有带指定序列识别号的氨基酸序列的酶在功能上等同(即具有相同酶活性),但在氨基酸序列中可能具有有限数目的氨基酸取代、缺失、插入或添加。为了维持蛋白质的功能,该等取代可以是保守性取代,用具有类似性质的氨基酸置换一个氨基酸。
在一些实施例中,同源物是指与具有对应于蛋白质的SEQ ID NO的氨基酸序列至少约25%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%或至少约99%一致的蛋白质。用于确定序列一致性的算法包含例如可通过美国国家生物技术信息中心(National Center for Biotechnology Information;NCBI)获得的BLAST。可确定序列类似的程度,该程度表明表明同源性并因此表明类似或一致功能。
可以通过使用例如随机突变和定点突变等方法适当地向由本文公开的核苷酸序列构成的酶的DNA引入取代、缺失、插入和/或添加来获得编码各种酶的同源物的多核苷酸(核酸研究(Nucleic Acid Res.)10,第p6487页(1982);酶学方法(Methods in Enzymol.)100,第448页(1983);分子克隆(Molecular Cloning)第2版,冷泉港实验室出版社(1989);PCR:一种实用方法(PCR A Practical Approach),IRL出版社,第200页(1991))。编码各种酶的同源物的多核苷酸可以引入和表达于宿主中,从而获得同源物。
术语“异源”是指来源于除参考物种外的来源的分子或活性,而“同源”是指来源于宿主微生物的分子或活性。相应地,本公开的编码核酸的外源性表达可使用异源或同源编码核酸中的任一者或两者。
在一些实施例中,宿主细胞可以选自例如细菌、酵母、真菌或可用作宿主生物体的多种其它生物体中的任一者,并且经过修饰的或非天然存在的酶由该等生物体产生。
在一些实施例中,未明确限定宿主,且可以使用例如如本文所描述的方法将一种或多种酶活性并入任何适合宿主生物体中。在一些实施例中,宿主选自细菌、酵母、藻类、蓝藻细菌、真菌或植物细胞或其任何组合。大肠杆菌和酿酒酵母(S.cerevisiae)尤其适用于宿主生物体,因为其为适合于基因工程的已充分表征的微生物。
如本文所用,“酶”包含能够催化生化反应的由细胞产生的蛋白质。此外,除非上下文规定,否则如本文所用,“酶”包含保持相关催化活性的蛋白质片段且可以包含经过合成而保持相关催化活性的人工酶。
本文所描述的每一种酶都可以连接到其它氨基酸序列,只要保持活性在功能上等同于该酶的活性即可。如上文所提及,应理解,各种酶或其同源物可以是(多)肽片段,只要保持活性在功能上等同于该酶的活性即可。
在一些实施例中,用于本公开的组合物、方法和试剂盒的酶包含任何具有逆转录酶活性的酶。这些酶包含但不限于非逆转录病毒逆转录酶、逆转录病毒逆转录酶、逆转录转座子逆转录酶、非LTR逆转录转座子、R2逆转录酶、LTR逆转录转座子、B型肝炎逆转录酶、花椰菜花叶病毒(cauliflower mosaic virus)逆转录酶、细菌逆转录酶、Tth DNA聚合酶、TaqDNA聚合酶(Saiki,R.K.等人,科学(Science)239:487-491(1988);美国专利第4,889,818号和第4,965,188号)、Tne DNA聚合酶(PCT公开第WO 96/10640号)、Tma DNA聚合酶(美国专利第5,374,553号)和其突变体、片段、变异体或衍生物。在一些实施例中,用于本公开中的逆转录酶包含逆转录病毒逆转录酶,例如M-MLV逆转录酶、AMV逆转录酶、RSV逆转录酶、RAV逆转录酶、MAV逆转录酶和总体而言的ASLV逆转录酶。突变型逆转录酶可以例如通过定点或随机突变使编码相关逆转录酶的一个或多个基因突变来获得。这些突变可以包含点突变、缺失突变、插入突变和截短。举例来说,一个或多个点突变(例如用一个或多个不同氨基酸取代一个或多个氨基酸)可以用来构建用于本公开的突变型逆转录酶。
在一些实施例中,对酶进行选择和/或工程改造,以展现高保真度和低误差率。核苷酸聚合酶的保真性通常以误差率的形式进行测量,即以违反众所周知的沃森-克里克碱基配对规则的方式并入核苷酸的频率。聚合酶(例如DNA聚合酶)的保真性或误差率可使用任何适合分析来测量。参见例如Lundburg等人,1991基因(Gene),108:1-6。术语“保真性”可以用于指代聚合精确度,或聚合酶在合成与模板互补的核酸分子(例如,RNA或DNA)时区分正确底物与不正确底物(例如核苷酸)的能力。酶的保真性越高,酶在核酸合成期间在生长链中错掺的核苷酸越少;也就是说,增加或提高保真性产生具有降低误差率(降低错掺率)的更忠实聚合酶。在一些实施例中,错掺误差率最多为约10-2、10-4、10-6或10-8。
在一些实施例中,非天然存在或经过修饰的酶(例如非天然存在或经过修饰的逆转录酶、非天然存在或经过修饰的非LTR逆转录转座子、非天然存在或经过修饰的R2逆转录酶)或具有逆转录酶活性的经过修饰多肽展现如下错掺误差率:等于或小于约50%、等于或小于约45%、等于或小于约40%、等于或小于约35%、等于或小于约30%、等于或小于约25%、等于或小于约20%、等于或小于约15%、等于或小于约10%、等于或小于约9%、等于或小于约8%、等于或小于约7%、等于或小于约6%、等于或小于约5%、等于或小于约4%、等于或小于约3%、等于或小于约2%、等于或小于约1%、等于或小于约0.01%、等于或小于约0.001%、等于或小于约0.0001%、等于或小于约0.00001%、等于或小于约0.000001%或等于或小于约0.0000001%。
在一些实施例中,非天然存在或经过修饰的酶(例如非天然存在或经过修饰的逆转录酶、非天然存在或经过修饰的非LTR逆转录转座子、非天然存在或经过修饰的R2逆转录酶)或具有逆转录酶活性的经过修饰的多肽以比未修饰或天然存在的酶或具有逆转录酶活性的未修饰多肽低如下倍数的误差率产生与模板互补的一个或多个核酸(例如cDNA)分子:至少约10000倍、低至少约1500倍、低至少约1000倍、低至少约500倍、低至少约100倍、低至少约95倍、低至少约90倍、低至少约85倍、低至少约80倍、低至少约75倍、低至少约70倍、低至少约65倍、低至少约60倍、低至少约55倍、低至少约50倍、低至少约45倍、低至少约40倍、低至少约35倍、低至少约30倍、低至少约25倍、低至少约20倍、低至少约15倍、低至少约10倍、低至少约9倍、低至少约8倍、低至少约7倍、低至少约6倍、低至少约5倍、低至少约4倍、低至少约3倍、低至少约2倍或低至少约1倍。
在一些实施例中,测序错误率将等于或少于约1/100,000个碱基。在一些实施例中,核苷酸序列确定的误差率等于或少于约1/10个碱基、1/20个碱基、3/100个碱基、1/100个碱基、1/1000个碱基和1/10,000个碱基。
术语“多核苷酸”、“核酸”、“核苷酸”和“寡核苷酸”可互换使用。这些术语是指任何长度的核苷酸(脱氧核糖核苷酸或核糖核苷酸)、其片段或类似物的聚合形式。以下是多核苷酸的非限制性实例:基因或基因片段的编码区或非编码区、由连锁分析限定的基因座(一个或多个)、外显子、内含子、信使RNA(mRNA)、转运RNA、转运-信使RNA、核糖体RNA、反义RNA、核小RNA(snRNA)、核仁小RNA(snoRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、具有任何序列的已分离DNA、具有任何序列的已分离RNA、核酸探针和引物。多核苷酸可以包括经过修饰的核苷酸,例如甲基化核苷酸和核苷酸类似物。如果存在,那么可以在聚合物组装之前或之后赋予对核苷酸结构的修饰。核苷酸序列可以间杂有非核苷酸组分。可以在聚合后例如通过与标记组分结合而进一步修饰多核苷酸。本文所描述的核酸可以含有磷酸二酯键。在一些实施例中,核酸可以是DNA(包含例如基因组DNA、粒线体DNA和cDNA)、RNA(包含例如mRNA和rRNA)或杂交体,其中核酸含有脱氧核糖核苷酸和核糖核苷酸的任何组合以及碱基的任何组合,包含尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤(xathanine)、次黄嘌呤(hypoxathanine)、异胞嘧啶、异鸟嘌呤等。多核苷酸打算涵盖单个核酸以及复数个核酸。多核苷酸可以由任何可以是未修饰RNA或DNA或经过修饰的RNA或DNA的多聚核糖核苷酸或多聚脱氧核糖核苷酸构成。举例来说,多核苷酸可以由以下构成:单链和双链DNA、为单链和双链区的混合物的DNA、单链和双链RNA、为单链和双链区的混合物的RNA,以及包括DNA与RNA(可以是单链,或更通常是双链,或单链与双链区的混合物)的杂交分子。
核糖体RNA可以构成样本中总RNA的高达80%或更高。通常需要将rRNA与mRNA分开,因为rRNA可能有害地影响mRNA的定量分析。将rRNA与mRNA分离的一个方法是耗尽样本的rRNA。一个实例为使用寡核苷酸(例如就真核rRNA而言与17S rRNA、18S rRNA或28S rRNA同源或就细菌rRNA而言与16S rRNA或23S rRNA同源的寡核苷酸)杂交rRNA分子。设计寡核苷酸,使得可以“捕获”该等寡核苷酸并且从样本去除杂交产物。举例来说,寡核苷酸可固定于例如色谱柱或珠粒的表面上。MICROBExpress(注册商标)和MICROBEnrich(注册商标)(Ambion,奥斯汀,德克萨斯)为用于rRNA缺失的可在市面上购得的试剂盒的实例。用于样本的rRNA的缺失的方法及组合物描述于美国申请第10/029,397号,该申请以引用方式并入。大部分真核mRNA的3'端处的poly(A)尾可以用于分开这些分子与rRNA以及其它缺乏这种poly(A)尾的非mRNA种类。在一些实施例中,本公开方法包括例如通过使寡核苷酸与rRNA杂交来耗尽核糖体RNA。在一些实施例中,本公开方法包括通过至少一个rRNA和/或tRNA序列的寡核苷酸探针引导式内切核苷酸裂解耗尽rRNA和/或tRNA。在一些实施例中,缺失可以是部分或完全缺失。在一些实施例中,缺失包括降低样本的rRNA和/或tRNA的数目。在一些实施例中,本公开涉及耗尽rRNA和/或转运RNA(tRNA)的方法。在一些实施例中,本公开涉及耗尽一个或多个模板核酸分子的至少一个转运RNA(tRNA)。在一些实施例中,耗尽rRNA和/或tRNA发生在将引物(例如一个或多个引物)退火到模板上之前。
在一个实施例中,本公开涉及一种耗尽用于文库测序的样本的核糖体RNA和/或转运RNA的方法。在一些实施例中,方法包括提供包括RNA的样本。在一些实施例中,RNA包括核糖体RNA(rRNA)和/或转运RNA(tRNA)。在一些实施例中,方法包括进行聚合酶链反应(PCR)以将rRNA和/或tRNA转化为双链DNA(dsDNA)。
在一些实施例中,方法包括部分或完全(完整)扩增。在一些实施例中,方法进一步包括引入复合物,该复合物包括核酸酶和/或编码核酸酶的多核苷酸以及至少一个专门设计的引导寡核苷酸。在一些实施例中,至少一个引导寡核苷酸包括与至少一个rRNA和/或至少一个tRNA互补的序列。在一些实施例中,至少一个引导寡核苷酸包括与至少一个dsDNA互补的至少一个序列。在一些实施例中,核酸酶或编码核酸酶的多核苷酸使dsDNA的至少一个链裂解。在一些实施例中,核酸酶或编码核酸酶的多核苷酸使rRNA和/或tRNA和/或dsDNA裂解,从而耗尽样本的rRNA和/或tRNA。在一些实施例中,核酸酶是Cas9,或多核苷酸编码Cas9或其功能变异体。在一些实施例中,方法包括使dsDNA变性成单链DNA(ssDNA)链。在一些实施例中,方法进一步包括引入至少一个包括结合分子和与至少一个ssDNA链互补的至少一个序列的寡核苷酸(例如专门设计的寡核苷酸),从而形成寡核苷酸与至少一个ssDNA链的杂交复合物。在一些实施例中,方法包括将杂交复合物固定到至少一种固体支撑物。在一些实施例中,固定杂交复合物使得从样本去除杂交复合物。在一些实施例中,固体支撑物包括链霉亲和素。在一些实施例中,方法包括引入至少一个包括结合分子和与至少一个rRNA和/或tRNA互补的至少一个序列的寡核苷酸(例如专门设计的寡核苷酸),从而形成包括寡核苷酸和至少一个rRNA和/或tRNA的复合物。在一些实施例中,方法进一步包括将复合物固定到至少一种固体支撑物。在一些实施例中,固定复合物使得从样本去除复合物。在一些实施例中,固体支撑物包括链霉亲和素。在一些实施例中,结合分子是生物素。
在一些实施例中,本公开的任一方法包括核酸酶或编码核酸酶的多核苷酸。在一些实施例中,核酸酶或编码核酸酶的多核苷酸使dsDNA的至少一个链裂解。在一些实施例中,dsDNA裂解是文库制备的中间产物。在一些实施例中,dsDNA裂解包含rRNA和/或tRNA(编码序列)。在一些实施例中,寡核苷酸引导式核分解裂解可能不需要或不需要使dsDNA变性。在一些实施例中,不需要dsDNA变性为本公开的一个显著改进。在一些实施例中,核酸酶或编码核酸酶的多核苷酸是Cas9或编码Cas9的多核苷酸,或其功能变异体。
在一个实施例中,本公开涉及一种方法,其包括将核酸酶复合物添加到多个双链核酸分子。在一些实施例中,核酸酶复合物包括Cas9核酸酶或其功能变异体以及至少一个合成引导寡核苷酸。在一些实施例中,合成引导寡核苷酸与核糖体核糖核酸(rRNA)和/或转运核糖核酸(tRNA)区域互补。在一些实施例中,该区域处于至少一个双链核酸分子中。在一些实施例中,方法包括允许复合物裂解rRNA和/或tRNA区域。在一些实施例中,该区域存在于至少一个双链核酸分子中。在一些实施例中,方法提供至少一个已裂解双链核酸分子。在一些实施例中,方法包括对至少一个已裂解双链核酸分子或其衍生物进行测序(例如核酸测序)。在一些实施例中,方法包括对至少一个缺乏rRNA区域和/或tRNA区域的双链核酸分子的核酸序列进行测序。在一些实施例中,方法包括对至少一个包括rRNA区域和/或tRNA区域的双链核酸分子的核酸序列进行测序。在一些实施例中,方法包括对核酸序列的混合物进行测序,其中该混合物包括至少一个包括rRNA区域和/或tRNA区域的双链核酸分子以及至少一个缺乏rRNA区域和/或tRNA区域的双链核酸分子。
在一个实施例中,本公开涉及一种产生游离脱氧核糖核酸(cfDNA)文库的方法,其包括:提供包括cfDNA的样本;使cfDNA变性以产生单链DNA(ssDNA)样本;在存在核苷酸和/或催化金属的情况下,将包括模板、引物和逆转录酶的复合物引入到ssDNA样本,其中逆转录酶使引物在模板上延伸,且随后模板跳转到ssDNA样本,从而产生双链DNA(dsDNA)样本,且其中dsDNA包括模板与ssDNA之间的至少一个缺口;引入包括3'至5'核酸外切酶活性的聚合酶以产生具有平端和/或3'突出端的dsDNA;引入不对称衔接子,该衔接子包括在5'端处具有单链突出端的核酸双链体,其中不对称衔接子接合到dsDNA的5'端,且其中单链突出端包括与至少一个聚合酶链反应(pcr)扩增引物互补的序列;以及进行pcr反应来扩增dsDNA的仅一个链。
在一个实施例中,本公开涉及一种产生游离脱氧核糖核酸(cfDNA)文库的方法。在一些实施例中,方法包括提供包括cfDNA的样本。在一些实施例中,方法包括使cfDNA变性以产生单链DNA(ssDNA)样本。在一些实施例中,方法包括将末端脱氧核苷酸转移酶(TdT)和脱氧腺苷三磷酸(dATP)引入到ssDNA样本以产生poly(A)和/或poly(C)尾。在一些实施例中,方法包括引入不可延伸核苷酸。在一些实施例中,方法包括将包括引物和第一衔接子的复合物退火到ssDNA样本的尾端。在一些实施例中,复合物包括与尾端互补的序列。在一些实施例中,方法包括在存在核苷酸和/或催化金属的情况下引入逆转录酶(例如经过修饰的逆转录酶)和包括受体和第二衔接子的复合物,从而产生双链DNA(dsDNA)样本。在一些实施例中,核苷酸包括可降解核苷酸。在一些实施例中,逆转录酶使引物延伸,且随后模板跳转到复合物以继续延伸。在一些实施例中,复合物包括核苷酸封阻物以防止逆转录酶到达复合物的末端和跳转到另一复合物。在一些实施例中,dsDNA包括原始链和拷贝链。在一些实施例中,原始链包括复合物与ssDNA之间的至少一个缺口。在一些实施例中,拷贝链包括至少一个可降解核苷酸。在一些实施例中,方法进一步包括引入包括3'至5'核酸外切酶活性的聚合酶以产生具有平端或3'突出端的dsDNA,和/或引入接合至少一个缺口的DNA接合酶。在一些实施例中,方法进一步包括引入至少一个尿嘧啶-DNA糖基化酶以降解至少一个可降解核苷酸。在一些实施例中,方法进一步包括进行包括引物(例如至少第一引物和/或至少第一和第二引物)的聚合酶链反应(PCR)以扩增原始链。在一些实施例中,引物(例如第一引物)包括与第一衔接子互补的序列,且第二引物包括与第二衔接子互补的序列。
在一个实施例中,本公开涉及一种产生用于测序的文库的方法。在一些实施例中,方法包括提供包括游离核糖核酸(cfRNA)的样本。在一些实施例中,方法包括使样本经受高温。在一些实施例中,高温足以使RNA(例如cfRNA)发生磷酸根转移作用(transphosphorylation)。在一些实施例中,方法进一步包括引入磷酸酶。在一些实施例中,磷酸酶可以将RNA的磷酸根部分转化成3'-羟基。在一些实施例中,方法进一步包括引入腺苷三磷酸和聚合酶以在RNA的3'-羟基上产生poly(A)尾。在一些实施例中,方法进一步包括在存在核苷酸的情况下,引入引物、受体和逆转录酶。在一些实施例中,引物包括与poly(A)尾互补的序列,从而退火到poly(A)尾。在一些实施例中,逆转录酶使引物延伸,且随后模板跳转到受体以继续延伸。在一些实施例中,方法进一步包括引入至少一种固体支撑物来将过量引物和非特异性引物产物固定到至少一种固体支撑物,从而从样本去除过量引物和非特异性引物产物。在一些实施例中,方法进一步包括进行聚合酶链反应(PCR)反应来扩增RNA。在一些实施例中,方法进一步包括使用等温扩增反应。
在一个实施例中,本公开涉及一种制备用于测序的核酸文库的方法。在一些实施例中,方法包括获得多个核酸分子。在一些实施例中,方法包括诱导至少一个核酸分子(例如多个核酸分子中的至少一个)的非酶促分子内磷酸根转移作用。在一些实施例中,非酶促分子内磷酸根转移作用可以通过增加温度(例如增加多个核酸分子的温度)发生。在一些实施例中,非酶促分子内磷酸根转移作用和/或温度增加产生具有游离5'-磷酸根部分的核酸分子(例如,多个核酸分子可以具有游离5'-磷酸根部分)。在一些实施例中,方法包括将磷酸酶添加到具有游离5'-磷酸根部分的核酸分子。在一些实施例中,磷酸酶将游离5'-磷酸根部分中的一者或多者转化成羟基。在一些实施例中,这使得多个核酸分子具有游离羟基。在一些实施例中,方法包括(例如在存在一定量腺苷三磷酸的情况下)将多个核酸分子与聚合酶混合。在一些实施例中,聚合酶在游离羟基上产生poly(A)尾。在一些实施例中,方法包括在存在核苷酸的情况下将(i)包括与该poly(A)尾互补的序列的一个或多个引物、(ii)一个或多个受体核酸分子和(iii)经过修饰的逆转录酶混合。在一些实施例中,经过修饰的逆转录酶通过逆转录已退火模板核酸分子的序列、迁移到受体核酸分子和逆转录该受体核酸分子的序列来产生多个连续互补脱氧核糖核酸分子。在一些实施例中,方法包括添加至少一种固体支撑物。在一些实施例中,固体支撑物固定过量的包括与该poly(A)尾互补的序列的一个或多个引物。在一些实施例中,方法包括进行聚合酶链反应(PCR)反应在一些实施例中,方法包括进行等温扩增。
在一个实施例中,本公开涉及一种产生用于测序的文库的方法。在一些实施例中,方法包括提供包括至少一个核酸分子(例如核糖核酸(例如cfRNA))的样本。在一些实施例中,方法包括使样本(或核酸分子)经受足以使核酸分子(例如RNA)发生磷酸根转移作用的高温。在一些实施例中,所述方法进一步包括添加催化金属(例如镁)和/或多胺。在一些实施例中,方法包括引入磷酸酶以将核酸分子(例如RNA)的磷酸根部分转化成3'-羟基。在一些实施例中,方法包括引入腺苷三磷酸和聚合酶以产生poly(A)尾。在一些实施例中,poly(A)尾产生于核酸分子(例如RNA)的3'-羟基上。在一些实施例中,方法包括在存在核苷酸的情况下将引物、受体和逆转录酶引入到样本或核酸分子。在一些实施例中,引物包括与poly(A)尾互补的序列,从而退火到poly(A)尾。在一些实施例中,逆转录酶使引物延伸,且随后模板跳转到受体以继续延伸。在一些实施例中,方法包括引入至少一种固体支撑物。在一些实施例中,固体支撑物固定过量引物和非特异性引物产物。在一些实施例中,从样本/混合物去除过量引物和非特异性引物产物。在一些实施例中,方法进一步包括进行聚合酶链反应(PCR)反应以扩增核酸分子(例如RNA)。在一些实施例中,方法进一步包括等温扩增反应。
在一个实施例中,本公开涉及一种耗尽rRNA和/或tRNA的方法,和/或涉及一种包括通过进行扩增反应逆转录至少一个核酸分子的方法。在一些实施例中,至少一个核酸分子是rRNA和/或tRNA。在一些实施例中,扩增反应提供多个双链核酸分子(例如cDNA)。在一些实施例中,方法包括添加核酸酶或包括核酸酶的多肽和/或引导寡核苷酸。在一些实施例中,方法包括添加复合物,该复合物包括核酸酶或包括核酸酶的多肽以及引导寡核苷酸。在一些实施例中,核酸酶或包括核酸酶的多肽是Cas9或包括Cas9的多肽。在一些实施例中,引导寡核苷酸与核酸分子中的区域互补。在一些实施例中,引导寡核苷酸与至少一个核酸分子(例如双链核酸分子)中的预定区域互补。在一些实施例中,寡核苷酸将核酸酶(例如Cas9)引导到裂解位点。在一些实施例中,包括核酸酶和引导寡核苷酸的复合物使核酸分子的区域或预定区域裂解。在一些实施例中,裂解位于一基因处。在一些实施例中,方法包括对已裂解核酸分子(例如已裂解双链核酸分子)进行测序(例如对已裂解核酸分子文库进行测序)。在一些实施例中,双链核酸分子包括来源于rRNA、tRNA或rRNA和tRNA两者的序列。在一些实施例中,至少一个双链核酸分子的预订区域是rRNA、tRNA或两者(例如组合)的区域。在一些实施例中,预定区域为rRNA区域。在一些实施例中,预定区域为tRNA区域。在一些实施例中,方法不需要使核酸分子变性。在一些实施例中,方法不需要使多个双链核酸分子变性。在一些实施例中,双链核酸分子包括来源于rRNA和/或tRNA测序前的序列。在一些实施例中,双链核酸分子包括cDNA。
在一个实施例中,本公开涉及一种用于制备核酸分子的多联体的方法。在一些实施例中,方法包括处理多个双链核酸分子的末端。在一些实施例中,方法包括将第一多个衔接子分子添加到多个双链核酸分子。在一些实施例中,第一多个衔接子分子包括一个或多个突出端序列。在一些实施例中,一个或多个突出端序列中的至少两者彼此互补。在一些实施例中,方法提供第一多个衔接子连接双链核酸分子。在一些实施例中,方法包括添加聚合酶(例如添加聚合酶到第一多个衔接子连接双链核酸分子)。在一些实施例中,在不存在引物的情况下添加聚合酶。在一些实施例中,方法不包括添加引物。在一些实施例中,聚合酶形成第一组衔接子连接双链核酸多联体。在一些实施例中,通过一个或多个突出端序列接合两个或超过两个衔接子连接双链核酸分子来形成第一组衔接子连接双链核酸多联体。在一些实施例中,方法包括将第二多个衔接子分子添加到该第一组(例如第一衔接子分子)。在一些实施例中,第二多个衔接子分子包括一个或多个突出端序列。在一些实施例中,一个或多个突出端序列中的至少两者彼此互补。在一些实施例中,方法提供第二组衔接子连接双链核酸分子。在一些实施例中,先前实施例中的任一者可以利用一组衔接子分子重复,从而得到包括预定平均长度的多联体。
在一个实施例中,本公开涉及一种用于制备核酸分子的多联体的方法。在一些实施例中,方法包括对至少一个核酸分子和/或多个双链核酸分子进行末端修复。在一些实施例中,方法包括将至少一个或多个衔接子分子添加到至少一个核酸分子和/或多个双链核酸分子。在一些实施例中,将至少一个或(第一)多个衔接子分子添加到至少一个核酸分子和/或多个双链核酸分子包括接合。在一些实施例中,将至少一个或(第一)多个衔接子分子添加到至少一个核酸分子和/或多个双链核酸分子包括逆转录酶(例如R2逆转录酶或经过修饰的逆转录酶)。在一些实施例中,至少一个或多个衔接子分子包括一个或多个突出端序列。在一些实施例中,至少两个突出端序列彼此互补(例如从而提供(第一)多个衔接子连接双链核酸分子)。在一些实施例中,至少一个或多个衔接子分子包括连接/接合到核酸分子的3'端的序列(例如突出端序列)和/或连接/接合到核酸分子的5'端的序列(例如突出端序列)。在一些实施例中,核酸分子包括3'端和5'端上的衔接子。在一些实施例中,结合于3'端的衔接子与结合于5'端的衔接子互补。在一些实施例中,衔接子序列是未知的。在一些实施例中,衔接子序列是预定的。在一些实施例中,衔接子充当模板和/或引物。在一些实施例中,结合于一个核酸分子的3'端的衔接子可以结合于另一核酸分子的5'端上的衔接子。在一些实施例中,方法进一步包括将聚合酶添加到与核酸分子连接的衔接子。在一些实施例中,方法进一步包括将聚合酶添加到(第一)多个衔接子连接双链核酸分子。在一些实施例中,在不存在引物的情况下添加聚合酶。在一些实施例中,聚合酶通过一个或多个突出端序列接合两个或超过两个衔接子连接双链核酸分子来形成第一组衔接子连接双链核酸多联体。在一些实施例中,聚合酶允许连接到核酸分子的衔接子形成多联体。在一些实施例中,方法包括将第二多个衔接子分子添加到第一组。在一些实施例中,第二多个衔接子分子包括一个或多个突出端序列。在一些实施例中,至少两个突出端序列彼此互补。在一些实施例中,形成第二组衔接子连接双链核酸分子。在一些实施例中,可以例如通过用经过修饰的核苷酸对衔接子加标签(例如通过引入甲基化核苷酸或通过插入dUTP)来确定多联体长度或所连接模板的数目。在一些实施例中,多联体长度可以基于经过修饰/未修饰的衔接子之间的比率来调节。在一些实施例中,衔接子序列可以充当同源性引发位置(退火到同源点ssDNA片段,充当模板和引物)。在一些实施例中,方法包括通过PCR或等温反应扩增多联体。在一些实施例中,PCR反应经历所选数目个循环(循环越多,多联体越长)或所选时间(等温扩增)。在一些实施例中,停止反应,且用两个唯一dsDNA衔接子接合(长)dsDNA多联体。在一些实施例中,可以操控多联体的长度。在一些实施例中,多联体的长度至少可以基于PCR循环对数目和/或时间量(例如等温扩增中的时间)和/或基于存在于衔接子中的经过修饰的核苷酸确定。在一些实施例中,衔接子包括唯一分子识别序列(UMI)。在一些实施例中,聚合酶在PCR或等温扩增反应中使两个或超过两个衔接子连接双链核酸分子接合。在一些实施例中,衔接子包括至少一个经过修饰的核苷酸。
在一些实施例中,扩增来自从受试者获得的生物样本的核酸。在一些情况下,直接从受试者获得生物样本。在一些实施例中,直接从受试者获得的生物样本是指已在从受试者获得之后进行进一步处理的生物样本。在一些实施例中,直接从受试者获得的生物样本是指在从受试者获得之后尚未进一步处理的生物样本,但可使用任何方法从受试者收集生物样本以供进一步处理。举例来说,通过接入受试者的循环系统、从受试者(例如经由针头)取出血液并将取出的血液注入容器来直接从受试者获得血液。容器可以包括试剂(例如抗凝剂),使得血液样本适用于进一步分析。在另一实例中,药签可以用来获取受试者的口咽部表面的上皮细胞。在从受试者获得生物样本后,可以使含有生物样本的药签与流体(例如缓冲液)接触来从药签收集生物体液。
在一些实施例中,生物样本已经过纯化。在一些实施例中,生物样本尚未经过纯化。在一些实施例中,在将生物样本提供到试管时,尚未提取生物样本的核酸。举例来说,在将生物样本提供到试管时,可能还未从生物样本提取生物样本中的RNA或DNA。在一些实施例中,在将生物样本提供到反应容器(例如试管)之前,可能未浓集存在于生物样本中的靶核酸(例如靶RNA或靶DNA)。可从受试者获得包括核酸的任何适合生物样本。
本公开涉及一种非天然存在或经过修饰的酶(例如非天然存在或经过修饰的逆转录酶、经过修饰的逆转录酶)或具有逆转录酶活性的经过修饰的多肽,其具有相比天然存在的或野生型或未修饰酶(例如野生型逆转录酶)或具有逆转录酶活性的未修饰多肽改进的酶性质。在一些实施例中,非天然存在或经过修饰的酶是具有逆转录酶活性的酶。在一些实施例中,非天然存在或经过修饰的酶是经过修饰的逆转录酶。在一些实施例中,非天然产生或经过修饰的酶是经过修饰的非逆转录病毒逆转录酶。在一些实施例中,非天然存在或经过修饰的酶是经过修饰的非LTR逆转录转座子。在一些实施例中,非天然存在或经过修饰的酶是经过修饰的R2逆转录酶。在一些实施例中,非天然存在或经过修饰的酶或具有逆转录酶活性的经过修饰的多肽可以以如下持续合成能力扩增模板核酸分子:每个碱基至少约80%、每个碱基至少约85%、每个碱基至少约88%、每个碱基至少约89%、每个碱基至少约90%、每个碱基至少约91%、每个碱基至少约92%、每个碱基至少约93%、每个碱基至少约94%、每个碱基至少约95%、每个碱基至少约96%、每个碱基至少约97%、每个碱基至少约98%、每个碱基至少约99%、每个碱基至少约99.5%或每个碱基至少约100%。
在一些实施例中,非天然存在或经过修饰的酶或具有逆转录酶活性的经过修饰的多肽可以或能够以在介于约12℃与约40℃之间的温度下测量的持续合成能力扩增模板核酸分子。在一些实施例中,温度介于约10℃与约35℃之间、介于约12℃与约30℃之间、介于约25℃与约40℃之间或介于约12℃与约42℃之间。在一些实施例中,温度在约8℃到约50℃之间、约2℃到约60℃之间、约8℃到约42℃之间、约6℃到约32℃之间或约7℃到约35℃之间。
在一些实施例中,非天然存在或经过修饰的酶或具有逆转录酶活性的经过修饰的多肽可以以如下持续合成能力扩增或能够以如下持续合成能力扩增模板核酸分子:在约或最高约4℃、约或最高约8℃、约或最高约12℃、约或最高约15℃、约或最高约20℃、约或最高约25℃、约或最高约30℃、约或最高约35℃、约或最高约40℃或者约或最高约42℃的温度下每个碱基至少约80%;在约或最高约12℃、约或最高约15℃、约或最高约20℃、约或最高约25℃、约或最高约30℃、约或最高约35℃、约或最高约40℃、约或最高约42℃、约或最高约45℃、约或最高约50℃的温度下每个碱基至少约85%;在约或最高约4℃、约或最高约8℃、约或最高约12℃、约或最高约15℃、约或最高约20℃、约或最高约25℃、约或最高约30℃、约或最高约35℃、约或最高约40℃或者约或最高约42℃的温度下每个碱基至少约89%;在约或最高约12℃、约或最高约15℃、约或最高约20℃、约或最高约25℃、约或最高约30℃、约或最高约35℃、约或最高约40℃、约或最高约42℃、约或最高约45℃、约或最高约50℃的温度下每个碱基至少约90%;在约或最高约4℃、约或最高约8℃、约或最高约12℃、约或最高约15℃、约或最高约20℃、约或最高约25℃、约或最高约30℃、约或最高约35℃、约或最高约40℃或者约或最高约42℃的温度下每个碱基至少约91%;在约或最高约12℃、约或最高约15℃、约或最高约20℃、约或最高约25℃、约或最高约30℃、约或最高约35℃、约或最高约40℃、约或最高约42℃、约或最高约45℃、约或最高约50℃的温度下每个碱基至少约85%;在约或最高约4℃、约或最高约8℃、约或最高约12℃、约或最高约15℃、约或最高约20℃、约或最高约25℃、约或最高约30℃、约或最高约35℃、约或最高约40℃或者约或最高约42℃的温度下每个碱基至少约95%;在约或最高约12℃、约或最高约15℃、约或最高约20℃、约或最高约25℃、约或最高约30℃、约或最高约35℃、约或最高约40℃、约或最高约42℃、约或最高约45℃、约或最高约50℃的温度下每个碱基至少约85%;在约或最高约4℃、约或最高约8℃、约或最高约12℃、约或最高约15℃、约或最高约20℃、约或最高约25℃、约或最高约30℃、约或最高约35℃、约或最高约40℃或者约或最高约42℃的温度下每个碱基至少约99%;在约或最高约12℃、约或最高约15℃、约或最高约20℃、约或最高约25℃、约或最高约30℃、约或最高约35℃、约或最高约40℃、约或最高约42℃、约或最高约45℃、约或最高约50℃的温度下每个碱基至少约85%;在约或最高约4℃、约或最高约8℃、约或最高约12℃、约或最高约15℃、约或最高约20℃、约或最高约25℃、约或最高约30℃、约或最高约35℃、约或最高约40℃或者约或最高约42℃的温度下每个碱基至少约99.5%;在约或最高约12℃、约或最高约15℃、约或最高约20℃、约或最高约25℃、约或最高约30℃、约或最高约35℃、约或最高约40℃、约或最高约42℃、约或最高约45℃、约或最高约50℃的温度下每个碱基至少约85%;或在约或最高约4℃、约或最高约8℃、约或最高约12℃、约或最高约15℃、约或最高约20℃、约或最高约25℃、约或最高约30℃、约或最高约35℃、约或最高约40℃或者约或最高约42℃的温度下每个碱基至少约100%;在约或最高约12℃、约或最高约15℃、约或最高约20℃、约或最高约25℃、约或最高约30℃、约或最高约35℃、约或最高约40℃、约或最高约42℃、约或最高约45℃、约或最高约50℃的温度下每个碱基至少约85%。
在一些实施例中,非天然存在或经过修饰的酶或具有逆转录酶活性的经过修饰的多肽可以以如下持续合成能力扩增或能够以如下持续合成能力扩增模板核酸分子:在最高约35℃的温度下每个碱基至少约80%;在最高约40℃的温度下每个碱基至少约85%;在最高约35℃的温度下每个碱基至少约88%;在最高约40℃的温度下每个碱基至少约89%;在最高约35℃的温度下每个碱基至少约90%;在最高约35℃的温度下每个碱基至少约91%;在最高约40℃的温度下每个碱基至少约92%;在最高约35℃的温度下每个碱基至少约93%;在最高约40℃的温度下每个碱基至少约94%;在最高约35℃的温度下每个碱基至少约95%;在最高约40℃的温度下每个碱基至少约96%;在最高约35℃的温度下每个碱基至少约97%;在最高约40℃的温度下每个碱基至少约98%;在最高约40℃的温度下每个碱基至少约99%;在最高约40℃的温度下每个碱基至少约99.5%;或在最高约40℃的温度下每个碱基至少约100%。
在一些实施例中,改进的酶性质选自以下中的至少一者:改进的稳定性(例如改进的热稳定性)、改进的比活性、改进的蛋白质表达、改进的纯化、改进的持续合成能力、改进的链置换、改进的模板跳转、改进的DNA/RNA亲和力和改进的保真性。在一些实施例中,非天然存在的酶或经过修饰的酶或具有逆转录酶活性的经过修饰的多肽扩增模板核酸分子。在一些实施例中,扩增模板核酸分子的非天然存在的酶或经过修饰的酶或具有逆转录酶活性的经过修饰的多肽具有针对至少一个酶性质大于约1、大于约2、大于约3、大于约4、大于约5、大于约6、大于约7、大于约8、大于约9、大于约10、大于约15、大于约20、大于约25、大于约30、大于约35、大于约40、大于约45、大于约50、大于约60、大于约70、大于约80、大于约90或大于约100的性能指标。在一些实施例中,该酶性质和/或性能指标在如下温度下实现:等于或低于或最高约50℃、等于或低于或最高约42℃、等于或低于或最高约40℃、等于或低于或最高约39℃、等于或低于或最高约38℃、等于或低于或最高约37℃、等于或低于或最高约36℃、等于或低于或最高约35℃、等于或低于或最高约34℃、等于或低于或最高约33℃、等于或低于或最高约32℃、等于或低于或最高约31℃、等于或低于或最高约30℃、等于或低于或最高约29℃、等于或低于或最高约28℃、等于或低于或最高约27℃、等于或低于或最高约26℃、等于或低于或最高约25℃、等于或低于或最高约23℃、等于或低于或最高约20℃、等于或低于或最高约15℃、等于或低于或最高约13℃、等于或低于或最高约12℃、等于或低于或最高约10℃、等于或低于或最高约8℃、等于或低于或最高约4℃。在一些实施例中,非天然存在的酶或经过修饰的酶(例如经过修饰的逆转录酶)或具有逆转录酶活性的经过修饰的多肽针对给定核苷酸底物展现的持续合成能力高于参考酶或参考多肽针对相同核苷酸底物的持续合成能力:高至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约37.5%、至少约40%、至少约45%、至少约50%、至少约60%、至少约70%、至少约75%、至少约80%、至少约90%、至少约95%、至少约100%、至少约110%、至少约125%、至少约150%、至少约170%、至少约190%、至少约200%、至少约250%、至少约500%、至少约750%、至少约1000%、至少约5000%或至少约10000%。在一些实施例中,非天然存在或经过修饰的酶是非天然存在的逆转录酶。在一些实施例中,经过修饰的酶是经过修饰的逆转录酶。
本公开涉及需要显著较少的动手操作时间(hands-on time)的工艺和/或方法,举例来说,相比用于RNA测序和/或液体活检的其它方法,该流程的执行简单得多并且需要的持续时间短得多。在一些实施例中,本公开的方法和工艺包括小于约2小时的流程和/或小于约30分钟的动手操作时间。在一些实施例中,该流程小于约20小时、小于约15小时、小于约12小时、小于约11小时、小于约10小时、小于约9小时、小于约8小时、小于约7小时、小于约6小时、小于约5小时、小于约4小时、小于约3小时、小于约2.5小时、小于约2小时、小于约1.5小时、小于约1小时或小于约30分钟。在一些实施例中,动手操作时间小于约5小时、小于约4小时、小于约3小时、小于约2.5小时、小于约2小时、小于约1.5小时、小于约1小时、小于约50分钟、小于约40分钟、小于约35分钟、小于约30分钟、小于约25分钟、小于约20分钟或小于约15分钟。
在一些实施例中,用于制备核酸文库和/或互补cDNA文库的方法包括在最多约1小时、最多约2小时、最多约3小时、最多约4小时、最多约5小时、最多约7小时、最多约10小时、最多约15小时或最多约20小时内制备文库。
在一个实施例中,本公开涉及能够发现用于癌症的新颖标记物和突变的方法和工艺,和/或提供用于精准医学的方法。在一些实施例中,本文中所公开的方法和工艺提供<0.1%的捕获ctDNA中的次要等位基因的较高敏感度(可获得的当前方法具有>1%的敏感度)。在一些实施例中,本公开的方法和/或工艺包括一锅(例如单容器)法、1步流程,且以等于或小于约2小时的时间量由样本制备文库。参见图2。
本公开涉及制备经过修饰的逆转录酶的方法,该方法包括以下步骤中的至少一者:(a)对编码逆转录酶的核酸序列进行随机或理性突变;(b)对编码逆转录酶的核酸序列进行氨基酸截短;(c)对编码逆转录酶的核酸序列进行变异,包括插入、缺失或取代氨基酸残基;以及(d)使编码逆转录酶的核酸序列与蛋白质或结构域融合。在一些实施例中,将在步骤(a)到(d)中的任一者中获得的核酸序列表达于宿主细胞中。在一些实施例中,经过修饰的逆转录酶包括至少一个相对于野生型或未修饰逆转录酶有所改进的酶性质。在一些实施例中,核酸序列为DNA、RNA或RNA和DNA的组合。在一些实施例中,方法包括筛选表达经过修饰的逆转录酶的宿主细胞。在一些实施例中,方法包括制备由宿主细胞表达的经过修饰的逆转录酶。在一些实施例中,方法可以包括根据包含本文公开的任何方法的任何方法来纯化经过修饰的逆转录酶。在一些实施例中,方法可以包括确定逆转录酶活性、估计逆转录酶活性分数(active fraction)和/或测试经过修饰的逆转录酶的稳定性和/或稳固性。在一些实施例中,使用逆转录酶活性分析来进行确定逆转录酶活性、估计逆转录酶活性分数和/或测试经过修饰的逆转录酶的稳定性和/或稳固性,或使用逆转录酶活性分析来测试。在一些实施例中,逆转录酶活性、逆转录酶活性分数和/或经过修饰的逆转录酶的稳定性和/或稳固性相比未修饰或天然存在的逆转录酶有所提高/改进。
本公开涉及用于制备互补脱氧核糖核酸(cDNA)分子的方法。在一些实施例中,方法包括将引物退火到模板核酸分子上,从而产生已退火模板核酸分子。在一些实施例中,方法进一步包括在存在核苷酸的情况下,将已退火模板核酸分子、一个或多个受体核酸分子和经过修饰的逆转录酶混合。在一些实施例中,经过修饰的逆转录酶产生多个连续互补脱氧核糖核酸分子。在一些实施例中,在最多约2小时内制备多个连续互补脱氧核糖核酸分子。在一些实施例中,通过使经过修饰的逆转录酶逆转录已退火模板核酸分子的序列来产生多个连续互补脱氧核糖核酸分子。在一些实施例中,经过修饰的逆转录酶接着迁移到受体核酸分子(例如一个或多个受体核酸分子)。在一些实施例中,逆转录酶(例如经过修饰的逆转录酶)能够在约12℃到约42℃的温度下逆转录模板和/或受体核酸分子的序列。在一些实施例中,逆转录酶(例如经过修饰的逆转录酶)能够在约8℃到约50℃(例如约8℃、约15℃、约20℃、约25℃、约30℃、约35℃、约40℃、约45℃、约48℃)的温度下逆转录模板和/或受体核酸分子的序列。在一些实施例中,逆转录酶(例如经过修饰的逆转录酶)能够在最高约4℃、最高约8℃、最高约15℃、最高约20℃、最高约25℃、最高约30℃、最高约35℃、最高约40℃、最高约45℃或最高约48℃的温度下逆转录模板和/或受体核酸分子的序列。在一些实施例中,逆转录以最高约5%的误差率发生。在一些实施例中,逆转录酶(例如经过修饰的逆转录酶)能够以最多约45%、最多约40%、最多约35%、最多约30%、最多约25%、最多约20%、最多约15%、最多约10%、最多约8%、最多约7%、最多约6%、最多约5%、最多约4%、最多约3%、最多约2%或最多约1%的误差率逆转录模板和/或受体核酸分子。在一些实施例中,逆转录酶(例如经过修饰的逆转录酶)可以与模板和受体核酸分子之间的序列一致性无关地从模板迁移到受体核酸分子。在一些实施例中,方法在单个容器中准备。在一些实施例中,模板核酸分子是片段化DNA模板、片段化RNA模板、非片段化DNA模板、非片段化RNA模板或其组合。在一些实施例中,方法进一步包括将标签添加到模板核酸分子,从而产生多个带标签的连续互补脱氧核糖核酸分子。在一些实施例中,方法进一步包括进行聚合酶链反应扩增反应,从而形成一个或多个扩增子。
本公开涉及使用经过修饰的逆转录酶制备互补脱氧核糖核酸(cDNA)分子的方法。在一些实施例中,用于制备cDNA分子的方法通过模板跳转执行。在一些实施例中,经过修饰的逆转录酶具有相比天然存在或未修饰的或野生型酶(例如野生型逆转录酶)有所改进的酶性质。在一些实施例中,用于制备cDNA分子的方法包括:(a)将引物退火到模板上;以及(b)在存在核苷酸(例如dNTP)的情况下,在足以产生与模板和/或受体核酸分子互补的cDNA分子的条件下将用经过修饰逆转录酶退火到引物的模板与受体核酸分子(例如受体RNA、DNA或其组合)混合(图3)。在一些实施例中,酶(例如经过修饰的逆转录酶)通过从模板迁移到受体核酸分子产生连续cDNA分子。在一些实施例中,模板跳转与模板和受体核酸分子之间的序列一致性无关。在一些实施例中,步骤(a)和步骤(b)同时执行。在一些实施例中,步骤(a)包括步骤(b)(例如步骤(a)和步骤(b)合并成一个步骤)。在一些实施例中,步骤(a)和/或步骤(b)中的至少一者进一步包括添加热启动热稳定聚合酶。在一些实施例中,本公开的方法在单个试管中执行。在一些实施例中,本公开的方法进一步包括聚合酶链反应(PCR)扩增反应。在一些实施例中,PCR扩增反应在单个试管(例如来自步骤(a)和(b)的同一个试管)中进行。在一些实施例中,本公开方法的所有步骤在单个试管中执行。
本公开涉及一种用于制备用于测序的核酸分子多联体的方法。在一些实施例中,方法包括接合核酸分子与第一衔接子。在一些实施例中,方法进一步包括通过进行核酸扩增反应扩增所接合核酸分子而形成多联体。在一些实施例中,在不存在引物的情况下进行扩增反应。在一些实施例中,方法进一步包括接合多联体与第二衔接子。在一些实施例中,衔接子(第一和/或第二衔接子)设计成允许分子(例如核酸分子,和/或模板,和/或引物,和/或受体)的重组或基于同源性的退火和延伸。在一些实施例中,核酸扩增反应是聚合酶链反应(PCR)或等温扩增。在一些实施例中,第一衔接子包括唯一分子识别(UMI)序列。在一些实施例中,第一衔接子充当引物。在一些实施例中,第一衔接子包括单链核酸。在一些实施例中,单链核酸包括单链DNA(ssDNA)。在一些实施例中,第二衔接子包括双链核酸。在一些实施例中,双链核酸包括双链DNA(dsDNA)。在一些实施例中,第一衔接子不同于第二衔接子。在一些实施例中,第一衔接子包括两个或超过两个衔接子。在一些实施例中,第二衔接子包括两个或超过两个衔接子。在一些实施例中,核酸分子的两端都包括衔接子。在一些实施例中,核酸分子的仅一端包括衔接子。在一些实施例中,核酸分子的3'端和5'端都包括衔接子。
本公开涉及使用经过修饰的逆转录酶制备互补脱氧核糖核酸(cDNA)分子的方法。在一些实施例中,用于制备cDNA分子的方法通过模板跳转执行。在一些实施例中,经过修饰的逆转录酶具有相比天然存在或未修饰的或野生型酶(例如野生型逆转录酶)有所改进的酶性质。在一些实施例中,用于制备cDNA分子的方法包括在存在核苷酸(例如dNTP)的情况下,在足以产生与模板和/或受体核酸分子互补的cDNA分子的条件下将引物、模板、经过修饰的逆转录酶和受体核酸分子(例如受体RNA、DNA或其组合)混合。在一些实施例中,方法包括添加热启动热稳定聚合酶(例如到混合步骤)。在一些实施例中,本公开的方法在单个试管中执行。在一些实施例中,本公开的方法进一步包括聚合酶链反应(PCR)扩增反应。在一些实施例中,PCR扩增反应在单个试管(例如与混合步骤相同的一个试管)中进行。在一些实施例中,本公开方法的所有步骤在单个试管(单个容器)中执行。
在一些实施例中,用于制备cDNA分子的方法包括:(a)将一个或多个引物退火到模板上;以及(b)在存在核苷酸(例如dNTP)的情况下,在足以产生与模板和/或受体核酸分子互补的cDNA分子的条件下将用经过修饰逆转录酶退火到一个或多个引物的模板与受体核酸分子(例如受体RNA、DNA或其组合)混合(图4)。在一些实施例中,用于制备cDNA分子的方法通过模板跳转执行。在一些实施例中,步骤(a)和步骤(b)同时执行。在一些实施例中,步骤(a)包括步骤(b)(例如步骤(a)和步骤(b)合并成一个步骤)。在一些实施例中,步骤(a)和/或步骤(b)中的至少一者进一步包括添加热启动热稳定聚合酶。在一些实施例中,本公开的方法在单个试管中执行。在一些实施例中,本公开的方法进一步包括聚合酶链反应(PCR)扩增反应。在一些实施例中,PCR扩增反应在单个试管(例如用于步骤(a)和(b)中或来自步骤(a)和(b)的同一个试管)中进行。在一些实施例中,本公开方法的所有步骤在单个试管中执行。
在一些实施例中,用于制备cDNA分子的方法包括在存在核苷酸(例如dNTP)的情况下,在足以产生与模板和/或受体核酸分子互补的cDNA分子的条件下将一个或多个引物、模板、经过修饰的逆转录酶和受体核酸分子(例如受体RNA、DNA或其组合)混合。在一些实施例中,用于制备cDNA分子的方法通过模板跳转执行。在一些实施例中,方法包括添加热启动热稳定聚合酶(例如到混合步骤)。在一些实施例中,本公开的方法在单个试管中执行。在一些实施例中,本公开的方法进一步包括聚合酶链反应(PCR)扩增反应。在一些实施例中,PCR扩增反应在单个试管(例如与混合步骤相同的一个试管)中进行。在一些实施例中,本公开方法的所有步骤在单个试管中执行。
本公开涉及制备核酸分子的方法,其包括:在存在核苷酸(例如dNTP)的情况下,在足以产生核酸分子的条件下将片段或已降解模板(例如核酸片段)、引物、经过修饰的逆转录酶和受体核酸分子混合(图5A和图5B)。在一些实施例中,受体核酸分子包括经过修饰的核苷酸。在一些实施例中,引物延伸在经过修饰的核苷酸处停止。在一些实施例中,经过修饰的逆转录酶包括至少一个相对于野生型、天然存在或未修饰的逆转录酶有所改进的酶性质。在一些实施例中,引物是RNA引物。在一些实施例中,引物是经过工程改造的引物(例如经过工程改造的RNA引物)。在一些实施例中,引物已经过最优化。在一些实施例中,引物是经过最优化和/或工程改造的引物(例如经过最优化和/或工程改造的RNA引物)。在一些实施例中,引物是RNA R2引物。在一些实施例中,用于制备核酸分子的方法通过模板跳转执行。在一些实施例中,本公开方法的混合步骤进一步包括添加热启动热稳定聚合酶。在一些实施例中,本公开的方法在单个试管中执行。在一些实施例中,本公开的方法进一步包括聚合酶链反应(PCR)扩增反应。在一些实施例中,PCR扩增反应在相同的单个试管中进行。在一些实施例中,本公开方法的所有步骤在单个试管中执行。
本公开涉及制备核酸分子的方法,其包括:在存在核苷酸(例如dNTP)的情况下,在足以产生核酸分子的条件下将片段或已降解模板(例如核酸片段)、供体复合物、经过修饰的逆转录酶和受体核酸分子混合(图6A和图6B)。在一些实施例中,受体核酸分子包括经过修饰的核苷酸。在一些实施例中,引物延伸在经过修饰的核苷酸处停止。在一些实施例中,经过修饰的逆转录酶包括至少一个相对于野生型或天然存在或未修饰的逆转录酶有所改进的酶性质。在一些实施例中,供体复合物包括模板和引物。在一些实施例中,供体复合物是供体R2复合物。在一些实施例中,供体R2复合物包括RNA R2引物。在一些实施例中,用于制备核酸分子的方法通过模板跳转执行。在一些实施例中,本公开方法的混合步骤进一步包括添加热启动热稳定聚合酶。在一些实施例中,本公开的方法在单个试管中执行。在一些实施例中,本公开的方法进一步包括聚合酶链反应(PCR)扩增反应。在一些实施例中,PCR扩增反应在相同的单个试管(例如用于制备核酸分子的相同的单个试管)中进行。在一些实施例中,本公开方法的所有步骤在单个试管中执行。
本公开涉及使用经过修饰的逆转录酶制备互补脱氧核糖核酸(cDNA)文库的方法。在一些实施例中,用于制备cDNA文库的方法使用模板跳转。在一些实施例中,经过修饰的逆转录酶具有相比天然存在或野生型或未修饰的酶(例如野生型逆转录酶)有所改进的酶性质。在一些实施例中,用于制备cDNA文库的方法包括:(a)将引物或一个或多个引物退火到模板上;以及(b)在存在核苷酸(例如dNTP)的情况下,在足以产生与模板和/或受体核酸分子互补的cDNA分子的条件下将用经过修饰逆转录酶退火到引物的模板或者退火到一个或多个引物的模板与受体核酸分子(例如受体RNA、DNA或其组合)混合。在一些实施例中,用于制备cDNA文库的方法包括在存在核苷酸(例如dNTP)的情况下,在足以产生与模板和/或受体核酸分子互补的cDNA分子的条件下将引物或一个或多个引物、模板、经过修饰的逆转录酶和受体核酸分子(例如受体RNA、DNA或其组合)混合。在一些实施例中,酶(例如经过修饰的逆转录酶)通过从模板迁移到受体核酸分子产生连续cDNA分子。在一些实施例中,模板跳转与模板和受体核酸分子之间的序列一致性无关。在一些实施例中,方法进一步包括扩增cDNA分子以产生cDNA文库。在一些实施例中,步骤(a)和步骤(b)同时执行。在一些实施例中,步骤(a)包括步骤(b)(例如步骤(a)和步骤(b)合并成一个步骤)。在一些实施例中,混合步骤或步骤(a)和/或步骤(b)中的至少一者进一步包括添加热启动热稳定聚合酶。在一些实施例中,本公开的方法在单个试管中执行。在一些实施例中,本公开的方法进一步包括聚合酶链反应(PCR)扩增反应。在一些实施例中,PCR扩增反应在单个试管(例如用于混合步骤或来自混合步骤,或者步骤(a)和(b)中或来自步骤(a)和(b)的同一个试管)中进行。在一些实施例中,本公开方法的所有步骤在单个试管中执行。
本公开涉及用于制备cDNA和/或DNA文库的方法,其包括在存在核苷酸(例如dNTP)的情况下,在足以产生与核酸(例如cDNA和/或DNA)分子的条件下将片段或已降解模板(例如核酸片段)、引物、经过修饰的逆转录酶和受体核酸分子混合。在一些实施例中,受体核酸分子包括经过修饰的核苷酸。在一些实施例中,引物延伸在经过修饰的核苷酸处停止。在一些实施例中,经过修饰的逆转录酶包括至少一个相对于野生型或未修饰逆转录酶有所改进的酶性质。在一些实施例中,引物是RNA R2引物。在一些实施例中,方法进一步包括扩增核酸(例如cDNA和/或DNA)分子以产生cDNA文库。在一些实施例中,用于制备cDNA和/或DNA和/或核酸分子的方法通过模板跳转执行。
本公开涉及制备cDNA和/或DNA文库的方法,其包括:在存在核苷酸(例如dNTP)的情况下,在足以产生核酸(例如cDNA和/或DNA)分子的条件下将片段或已降解模板(例如核酸片段)、供体复合物、经过修饰的逆转录酶和受体核酸分子混合。在一些实施例中,受体核酸分子包括经过修饰的核苷酸。在一些实施例中,引物延伸在经过修饰的核苷酸处停止。在一些实施例中,经过修饰的逆转录酶包括至少一个相对于野生型或未修饰逆转录酶有所改进的酶性质。在一些实施例中,供体复合物包括模板和引物。在一些实施例中,供体复合物是供体R2复合物。在一些实施例中,供体R2复合物包括RNA R2引物。在一些实施例中,方法进一步包括扩增核酸(例如cDNA和/或DNA)分子以产生cDNA和/或DNA文库。在一些实施例中,用于制备cDNA和/或DNA和/或核酸分子的方法通过模板跳转执行。
在一些实施例中,本公开的方法可以包括供体复合物。在一些实施例中,供体复合物包括模板和引物。在一些实施例中,本公开的方法可以包括模板。在一些实施例中,模板是片段化和/或已降解模板。在一些实施例中,模板没有经过片段化。在一些实施例中,模板是RNA、DNA或DNA和RNA的组合。在一些实施例中,RNA是mRNA。在一些实施例中,模板为mRNA。
本公开涉及制备用于测序的文库的方法,其包括:(a)从受试者获得具有游离核酸的样本;以及(b)将经过修饰的逆转录酶、模板(例如核酸模板)、核苷酸、受体核酸分子和一个或多个引物添加到核酸。在一些实施例中,方法进一步包括对来源于样本的游离核酸(cf核酸)进行扩增反应以产生多个扩增子。在一些实施例中,扩增反应包括35个或更少扩增循环。在一些实施例中,方法包括产生用于测序的文库。在一些实施例中,文库包括多个扩增子。在一些实施例中,经过修饰的逆转录酶能够模板跳转和/或包括至少一个相对于野生型或未修饰的逆转录酶有所改进的酶性质。在一些实施例中,核酸为DNA、RNA或RNA和DNA的组合。
本公开涉及一种使用模板跳转制备互补脱氧核糖核酸(cDNA)分子的方法,其包括在足以产生连续cDNA分子的条件下将引物或一个或多个引物、信使RNA(mRNA)模板、核苷酸、经过修饰的逆转录酶、受体核酸分子和催化金属混合于单个试管中。在一些实施例中,连续cDNA分子与mRNA模板和/或受体核酸分子互补。在一些实施例中,经过修饰的逆转录酶包括至少一个相对于野生型或未修饰逆转录酶有所改进的酶性质。在一些实施例中,产生连续cDNA分子。在一些实施例中,经过修饰的逆转录酶经历从模板到受体核酸分子的迁移。
本公开涉及一种制备用于测序的文库的方法,其包括在足以产生文库的条件下将游离核酸、经过修饰的逆转录酶、模板、核苷酸、受体核酸分子、催化金属和一个或多个引物混合于单个试管中。在一些实施例中,经过修饰的逆转录酶包括至少一个相对于野生型或未修饰逆转录酶有所改进的酶性质。
在一些实施例中,核酸分子包括未知核酸序列。在一些实施例中,模板包括未知核酸序列。在一些实施例中,模板到受体核酸分子的迁移与模板和受体核酸分子之间的序列一致性无关。在一些实施例中,受体核酸分子包括可以使引物延伸停止的经过修饰的核苷酸。在一些实施例中,游离核酸是游离DNA(cfDNA)、循环肿瘤DNA(ctDNA)和/或福尔马林固定石蜡包埋DNA(FFPE DNA)或其组合。
在一些实施例中,本公开方法可以在方法的任何步骤时或之前和/或进行混合步骤的同时添加热启动热稳定聚合酶。举例来说,可以在将经过修饰的逆转录酶添加到反应的同时添加热启动热稳定聚合酶。可以在添加受体核酸分子的同时,和/或将模板和/或引物和/或逆转录酶和/或核苷酸添加到反应管的同时添加热启动热稳定聚合酶。在一些实施例中,在PCR反应开始之前添加热启动热稳定聚合酶。在一些实施例中,在RT反应之前或同时添加热启动热稳定聚合酶。在一些实施例中,热启动热稳定聚合酶是热启动Taq聚合酶。靶核酸的扩增可以在珠粒上发生。在一些实施例中,扩增不在珠粒上发生。扩增可以是通过等温扩增,例如等温线性扩增进行。在一些实施例中,可以进行热启动PCR,其中在添加聚合酶之前将反应加热至95℃,例如持续两分钟,或者直至第1循环中的第一加热步骤之前可以使聚合酶保持无活性。热启动PCR可以用于最大限度地减少非特异性扩增。
在一些实施例中,本公开的方法在单个试管中执行。在一些实施例中,本公开方法的所有步骤在单个试管中执行。在一些实施例中,方法(从开始到结束)在单个试管中执行。在一些实施例中,用于RT反应的同一试管用于PCR扩增反应。
在一些实施例中,PCR扩增在足以使逆转录酶失活的温度下进行。在一些实施例中,PCR扩增在足以活化热启动热稳定聚合酶的温度下进行。
本公开涉及扩增样本的游离核酸分子的方法。在一些实施例中,样本是生物样本。在一些实施例中,对游离核酸分子进行包括逆转录酶(例如经过修饰的逆转录酶)的核酸扩增。在一些实施例中,在以指定持续合成能力扩增核酸分子的条件下对游离核酸分子进行包括逆转录酶(例如经过修饰的逆转录酶)的核酸扩增。在一些实施例中,持续合成能力为每个碱基至少约80%、每个碱基至少约81%、每个碱基至少约82%、每个碱基至少约83%、每个碱基至少约84%、每个碱基至少约85%、每个碱基至少约86%、每个碱基至少约87%、每个碱基至少约88%、每个碱基至少约89%、每个碱基至少约90%、每个碱基至少约91%、每个碱基至少约92%、每个碱基至少约93%、每个碱基至少约94%、每个碱基至少约95%、每个碱基至少约96%、每个碱基至少约97%、每个碱基至少约98%、每个碱基至少约99%或每个碱基至少约100%。在一些实施例中,持续合成能力在如下温度下进行:约或最高约或最低约12℃、约或最高约或最低约13℃、约或最高约或最低约14℃、约或最高约或最低约15℃、约或最高约或最低约16℃、约或最高约或最低约17℃、约或最高约或最低约18℃、约或最高约或最低约19℃、约或最高约或最低约20℃、约或最高约或最低约21℃、约或最高约或最低约22℃、约或最高约或最低约23℃、约或最高约或最低约24℃、约或最高约或最低约25℃、约或最高约或最低约26℃、约或最高约或最低约27℃、约或最高约或最低约28℃、约或最高约或最低约29℃、约或最高约或最低约30℃、约或最高约或最低约31℃、约或最高约或最低约32℃、约或最高约或最低约33℃、约或最高约或最低约34℃、约或最高约或最低约35℃、约或最高约或最低约36℃、约或最高约或最低约37℃、约或最高约或最低约38℃、约或最高约或最低约39℃、约或最高约或最低约40℃、约或最高约或最低约45℃、约或最高约或最低约50℃、约或最高约或最低约60℃、约或最高约或最低约70℃、约或最高约或最低约80℃、约或最高约或最低约8℃。在一些实施例中,持续合成能力为在约或最高约或最低约30℃、约或最高约或最低约12℃、约或最高约或最低约45℃、约或最高约或最低约35℃的温度下每个碱基至少约80%、每个碱基至少约81%、每个碱基至少约82%、每个碱基至少约83%、每个碱基至少约84%、每个碱基至少约85%、每个碱基至少约86%、每个碱基至少约87%、每个碱基至少约88%、每个碱基至少约89%、每个碱基至少约90%、每个碱基至少约91%、每个碱基至少约92%、每个碱基至少约93%、每个碱基至少约94%、每个碱基至少约95%、每个碱基至少约96%、每个碱基至少约97%、每个碱基至少约98%、每个碱基至少约99%或每个碱基至少约100%。在一些实施例中,逆转录酶是非LTR逆转录转座子或经过修饰的非LTR逆转录转座子。在一些实施例中,逆转录酶是R2逆转录酶或经过修饰的R2逆转录酶。在一些实施例中,逆转录酶是R2非LTR逆转录转座子或经过修饰的R2非LTR逆转录转座子。
本公开涉及由多个单细胞制备互补脱氧核糖核酸(cDNA)文库和/或DNA文库的方法。在一些实施例中,方法包括以下步骤:从每个单细胞剥离核酸以提供多个单独的核酸样本。在一些实施例中,每个单独的核酸样本中的核酸来自单个细胞。在一些实施例中,方法进一步包括将核酸模板退火到一个或多个引物上。在一些实施例中,方法进一步包括在存在核苷酸的情况下,在有效产生cDNA和/或DNA分子的条件下,将利用受体模板(或受体核酸分子)退火到一个或多个引物的核酸模板和经过修饰的逆转录酶混合。在一些实施例中,经过修饰的逆转录酶能够模板跳转和/或包括至少一个相对于野生型或未修饰的逆转录酶有所改进的酶性质。在一些实施例中,方法进一步包括扩增cDNA分子和/或DNA分子以产生cDNA和/或DNA文库。
本公开涉及检测核酸分子的方法。在一些实施例中,方法包括在有效产生核酸分子的条件下,将包括核酸分子的样本与受体模板(或受体核酸分子)、经过修饰的逆转录酶、引物和核苷酸混合。在一些实施例中,经过修饰的逆转录酶包括至少一个相对于野生型或未修饰逆转录酶有所改进的酶性质。在一些实施例中,受体模板(或受体核酸分子)包括至少一个经过修饰的核苷酸。在一些实施例中,经过修饰的核苷酸可使引物延伸停止。在一些实施例中,方法进一步包括扩增核酸分子。
本公开涉及检测、诊断和/或预后受试者的疾病(例如癌症)的方法,其包括:(a)获得来源于受试者的核酸样本(例如游离核酸样本)的序列信息,以及(b)使用来源于步骤(a)的序列信息检测样本中的循环肿瘤核酸。在一些实施例中,根据步骤(a)获得序列信息包括使用一个或多个衔接子。在一些实施例中,一个或多个衔接子包括分子条形码。衔接子可以包括一个或多个末端修饰。衔接子可以包括一个5'磷酸根。衔接子可以包括两个5'磷酸根。衔接子可以包括一个3'羟基。衔接子可以包括两个3'羟基。衔接子可以缺乏3'羟基。
在一些实施例中,分子条形码包括随机序列。在一些实施例中,方法能够检测游离核酸,该游离核酸小于或等于总游离核酸的约0.75%、0.50%、0.25%、0.1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%、0.1%、0.05%、0.01%、0.009%、0.008%、0.007%、0.006%、0.005%、0.004%、0.003%、0.002%、0.001%、0.0005%、or0.00001%、1%、1.75%、1.5%、1.25%、2%、3%、4%、5%、6%、8%、9%、10%、11%、12%、13%、14%15%、16%、17%、18%、19%、20%、22%、25%、27%、30%、32%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些实施例中,方法能够检测循环肿瘤核酸,该循环肿瘤核酸小于或等于总循环核酸的约0.75%、0.50%、0.25%、0.1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%、0.1%、0.05%、0.01%、0.009%、0.008%、0.007%、0.006%、0.005%、0.004%、0.003%、0.002%、0.001%、0.0005%、or 0.00001%、1%、1.75%、1.5%、1.25%、2%、3%、4%、5%、6%、8%、9%、10%、11%、12%、13%、14%15%、16%、17%、18%、19%、20%、22%、25%、27%、30%、32%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些实施例中,方法能够检测循环肿瘤核酸(ct核酸)的百分比,该百分比小于或等于总游离核酸的1.75%、1.5%、1.25%、1%、0.75%、0.50%、0.25%、0.1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%、0.1%、0.05%、0.01%、0.009%、0.008%、0.007%、0.006%、0.005%、0.004%、0.003%、0.002%、0.001%、0.0005%或0.00001%。在一些实施例中,序列信息包括关于至少约1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、50、70、80、100、200或300个基因组区域的信息。在一些实施例中,序列信息包括关于不完全所有、几乎所有或所有基因组测序的信息。在一些实施例中,低至50ng cfDNA的浓度可以提供完整基因组测序。
在一些实施例中,本公开的方法可以用来确定受试者疾病(例如癌症)的存在。在一些实施例中,确定受试者的癌症的存在包括根据本文所描述的任一方法从受试者获得样本并检测样本中的核酸分子(例如核酸片段)。在一些实施例中,确定受试者的疾病(例如癌症)的存在包括对核酸分子进行扩增和/或测序。在一些实施例中,核酸分子的存在指示癌症。在一些实施例中,核酸分子的存在指示产前状态。在一些实施例中,核酸分子和/或模板包括未知序列。在一些实施例中,样本是生物样本。在一些实施例中,生物样本包括循环肿瘤DNA。在一些实施例中,生物样本包括组织样本。
在一些实施例中,本公开的方法包括检测由扩增引物产生的扩增子,其中扩增子的存在确定样本中是否存在经过修饰的逆转录酶。
在一些实施例中,本公开的方法包括基于核酸分子(例如cDNA分子)存在与否提供产前诊断。
本公开涉及一种产生核酸分子(例如cDNA分子)的试剂盒,其包括:一个或多个引物、核苷酸、至少一种经过修饰的逆转录酶、模板和用于执行本公开中公开的任一方法的说明书。在一些实施例中,试剂盒可以用于检测核酸,该试剂盒包括核酸模板(例如DNA模板)、至少一种经过修饰的逆转录酶、核苷酸和用于执行本公开中公开的任一方法的说明书。在一些实施例中,试剂盒中存在的或将用于试剂盒的经过修饰的逆转录酶在如下温度下具有活性和/或能够进行模板跳转:等于或低于约或高于约4℃、8℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、45℃、46℃、47℃、48℃、49℃、50℃、52℃、55℃或60℃。在一些实施例中,核酸和/或模板(例如核酸模板、DNA或RNA)以如下浓度存在:低至约50飞摩尔、低至约60飞摩尔、低至约70飞摩尔、低至约75飞摩尔、低至约80飞摩尔、低至约90飞摩尔、低至约100飞摩尔、低至约120飞摩尔、低至约150飞摩尔、低至约200飞摩尔、低至约250飞摩尔、低至约300飞摩尔、低至约350飞摩尔、低至约400飞摩尔、低至约500飞摩尔、低至约550飞摩尔、低至约600飞摩尔、低至约700飞摩尔或低至约800飞摩尔。在一些实施例中,试剂盒可以包括一个或多个引物和/或退火到引物的模板。本公开还涉及一种产生经过修饰的酶、经过修饰的逆转录酶或经过修饰的多肽的试剂盒。在一些实施例中,试剂盒包含PCR步骤和/或用于PCR的组分。
在一些实施例中,本公开涉及一种用于检测核酸的试剂盒,其包括模板、至少一种经过修饰的逆转录酶、核苷酸和用于执行本公开方法的说明书。在一些实施例中,核酸以至少约50飞摩尔、至少约20飞摩尔、至少约100飞摩尔或大于约1000飞摩尔的浓度存在。
本公开涉及本文公开的任何方法,其中方法可以进一步包括检测至少一个由扩增引物产生的扩增子。在一些实施例中,存在至少一个扩增子表明样本中存在至少一个经过修饰的逆转录酶。
在一些实施例中,本公开的任一方法不包括纯化步骤。在一些实施例中,本公开的任一方法包括至少一个纯化步骤。在一些实施例中,本公开的任一方法包括至少两个纯化步骤。在一些实施例中,本公开的任一方法包括至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少十个、至少十五个或至少二十个纯化步骤。
本公开涉及一种用于制备用于测序的文库的方法。
在一些实施例中,经过修饰的逆转录酶是经过修饰的非逆转录病毒逆转录酶。在一些实施例中,经过修饰的逆转录酶是经过修饰的非LTR逆转录转座子。在一些实施例中,经过修饰的逆转录酶是经过修饰的R2逆转录酶。
在一些实施例中,变异体或经过修饰的酶、或非天然存在的酶、或经过修饰的多肽具有相比未修饰、野生型或天然存在的酶或多肽有所改进的酶性质。在一些实施例中,改进的酶性质选自以下中的至少一者:增加的稳定性(例如增加的热稳定性)、增加的比活性、增加的蛋白质表达、改进的纯化、改进的持续合成能力、改进的链置换、增加的模板跳转和改进的保真性。在一些实施例中,术语稳定性可以包含但不限于热稳定性、存储稳定性和pH稳定性。在一些实施例中,比活性是蛋白质或酶的酶活性(单位数)相对于反应中所使用的蛋白质或酶的总量的度量。在一些实施例中,基于酶产生cDNA分子的能力来测量比活性。在一些实施例中,以基于引物延伸反应确定的U/mg蛋白质测量比活性。在一些实施例中,变化或改进的性质的特征可以由性能指标(PI)表征,其中PI是变异体、经过修饰的酶或非天然存在的酶相比野生型或相比天然存在的酶或蛋白质的性能比。术语“性能指标(PI)”可以指代变异多肽与亲本多肽、或经过修饰的酶与未修饰酶(例如逆转录酶)、或非天然存在的酶与天然存在的酶针对指定性能特性的性能比。在一些实施例中,指定性能或酶性质特性可以包含但不限于稳定性(例如热稳定性)、比活性、蛋白质表达、纯化、持续合成能力、端到端模板跳转和/或保真性。在一些实施例中,PI大于约0.5,而在其它实施例中,PI为约1或大于约1。在一些实施例中,变异多肽、经过修饰的酶(例如经过修饰的逆转录酶)或非天然存在的酶包括一个或多个氨基酸位置处的修饰。在一些实施例中,经过修饰的酶或非天然存在的酶具有如下性能指标(PI):等于或大于约0.1、等于或大于约0.2、等于或大于约0.3、等于或大于约0.4、等于或大于约0.5、等于或大于约0.6、等于或大于约0.7、等于或大于约0.8、等于或大于约0.9、等于或大于约1、等于或大于约1.2、等于或大于约1.5、等于或大于约2、等于或大于约2.5、等于或大于约3、等于或大于约3.5、等于或大于约4、等于或大于约4.5、等于或大于约5、等于或大于约5.5、等于或大于约6、等于或大于约6.5、等于或大于约7、等于或大于约8、等于或大于约9、等于或大于约10、等于或大于约50、等于或大于约75、等于或大于约100、等于或大于约500、等于或大于约1000。在一些实施例中,变异体或经过修饰的酶具有如下性能指标(PI):约0.1到约1、约0.5到约1、约0.1到约2、约1到约2、约0.5到约2、约0.5到约10、约1到约10、约0.1到约10、约1到约5、约0.5到约5、约0.5到约20、约0.3到约20、约5到约10、约1.5到约10、约1.5到约50、约1到约50、约1.5到约100、约1.5到约75、约4到约10、3到约10、约3到约25、约3到约50、约2到约20、约2到约100、约2到约1000、约1到约1000。在一些实施例中,针对蛋白质表达确定性能指标。在一些实施例中,针对至少一个改进酶性质的特性确定性能指标。在一些实施例中,针对纯化确定性能指标。在一些实施例中,针对稳定性(例如热稳定性)确定性能指标。在一些实施例中,针对比活性确定性能指标。在一些实施例中,针对持续合成能力确定性能指标。在一些实施例中,针对链置换确定性能指标。在一些实施例中,针对模板跳转确定性能指标。在一些实施例中,针对保真性确定性能指标。在一些实施例中,改进酶性质的特性选自由以下组成的组:增加的热稳定性、增加的比活性和增加的蛋白质表达。在一些实施例中,性能指标在30℃下进行确定。在一些实施例中,在30℃下分析酶性质。在一些实施例中,酶性质、稳定性(例如热稳定性)、比活性、蛋白质表达、纯化、持续合成能力、链置换、模板跳转和/或保真性在30℃进行确定。在一些实施例中,用于测量酶性质的性能指标在特定温度下进行确定。在一些实施例中,温度为约25℃到约42℃。在一些实施例中,温度为约8℃到约50℃。在一些实施例中,用于测量酶性质的性能指标可以在如下范围内的温度下进行确定:约8℃到约50℃、约12℃到约42℃、25℃到约42℃、约25℃到约40℃、约28℃到约38℃、约30℃到约38℃、约35℃到约37℃、约27℃到约38℃、约27℃到约37℃、约26℃到约42℃、约25℃到约38℃、约27℃到约38℃、约29℃到约38℃、约29℃到约32℃。在一些实施例中,用于测量酶性质的性能指标可以在如下温度下进行确定:等于或低于约8℃、等于或低于约12℃、等于或低于约20℃、等于或低于约4℃、等于或低于约55℃、等于或低于约37℃、等于或低于约25℃、等于或低于约28℃、等于或低于约30℃、等于或低于约32℃、等于或低于约34℃、等于或低于约35℃、等于或低于约36℃、等于或低于约33℃、等于或低于约31℃、等于或低于约60℃、等于或低于约38℃、等于或低于约39℃、等于或低于约40℃、等于或低于约41℃、等于或低于约42℃、等于或低于约50℃。在一些实施例中,温度可以在约25℃到约80℃的范围内。
在一些实施例中,经过修饰的酶的比活性为约5U/mg到约140,000U/mg、约5U/mg到约125,000units/mg、约50U/mg到约100,000U/mg、约100U/mg到约100,000U/mg、约250U/mg到约100,000U/mg、约500U/mg到约100,000U/mg、约1000U/mg到约100,000U/mg、约5000U/mg到约100,000U/mg、约10,000U/mg到约100,000U/mg、约25,000U/mg到约75,000U/mg。在一些实施例中,比活性的范围包含约20,000U/mg到约140,000U/mg的比活性、约20,000U/mg到约130,000U/mg的比活性、约20,000U/mg到约120,000U/mg的比活性、约20,000U/mg到约110,000U/mg的比活性、约20,000U/mg到约100,000U/mg的比活性、约20,000U/mg到约90,000U/mg的比活性、约25,000U/mg到约140,000U/mg的比活性、约25,000U/mg到约130,000U/mg的比活性、约25,000U/mg到约120,000U/mg的比活性、约25,000U/mg到约110,000U/mg的比活性、约25,000U/mg到约100,000U/mg的比活性和约25,000U/mg到约90,000U/mg的比活性。在一些实施例中,比活性范围的下限可以在如下范围内变化:30,000、35,000、40,000、45,000、50,000、55,000、60,000、65,000、70,000、75,000和80,000U/mg。在一些实施例中,该范围的上限可以在如下范围内变化:150,000、140,000、130,000、120,000、110,000、100,000和90,000U/mg。
在一些实施例中,样本是生物样本。在一些实施例中,生物样本包括循环肿瘤DNA。在一些实施例中,生物样本包括组织样本。在一些实施例中,核酸来自样本。在一些实施例中,样本是液体活检样本。在一些实施例中,样本可以是RNA样本。在一些实施例中,RNA样本可以用于各种目的,包含但不限于PCR、接合、转录组分析、微阵列分析、RNA印迹法分析和cDNA文库构建。在一些实施例中,本公开涉及以适用于通过例如测序进行转录组分析或进行微阵列分析的量和品质从较低量的细胞和/或单细胞扩增cDNA文库的方法。
在一些实施例中,核酸和/或模板具有未知序列。在一些实施例中,核酸和/或模板是RNA、DNA或RNA和DNA的组合。在一些实施例中,RNA是mRNA。在一些实施例中,mRNA包括内部引发。在一些实施例中,核酸可以是片段化核酸和/或已降解核酸。在一些实施例中,模板可以是片段化模板和/或已降解模板。在一些实施例中,核酸可以是非片段化核酸和/或非降解核酸。在一些实施例中,模板可以是非片段化模板和/或非降解模板。在一些实施例中,核酸和/或模板指示疾病。在一些实施例中,核酸和/或模板指示癌症。在一些实施例中,核酸等于或小于约0.01微摩尔。在一些实施例中,核酸介于约0.1nM与约100nM之间。在一些实施例中,核酸等于或小于约500飞摩尔。
在一些实施例中,RNA是从选自由以下组成的组的来源获得:单细胞、培养细胞、组织、基于RNA转录扩增的RNA(例如TTR扩增RNA或其它DNA依赖性RNA聚合酶转录RNA)、RNA-启动子-驱动转录RNA、aRNA、aRNA扩增RNA、单细胞mRNA文库、已分离mRNA、含于细胞内的RNA和RNA来源的组合。在一些实施例中,RNA由多个固定细胞制备,其中该等固定细胞受保护以免RNA降解,并且经历透化以供酶渗透。在一些实施例中,固定细胞由固定剂处理的培养细胞、冷冻的新鲜组织、固定剂处理的新鲜组织或石蜡包埋组织在载玻片上获得。
在一些实施例中,RNA分子可以是体外合成的产物,或者可以从细胞或组织分离(Ausubel等人,简洁分子生物学方案(Short Protocols in Molecular Biology),第三版,威立(Wiley),1995)。适用于获得适用于实践本公开的RNA的细胞和组织可以包含动物细胞和植物细胞。在一些实施例中,细胞包含哺乳动物细胞和昆虫细胞。RNA还可以从例如细菌的原核细胞分离。
在一些实施例中,模板是RNA、DNA或RNA和DNA的组合。在一些实施例中,模板可以是片段化模板和/或已降解模板。在一些实施例中,模板没有经过降解和/或片段化。在一些实施例中,RNA是mRNA。在一些实施例中,模板是RNA模板。在一些实施例中,模板是DNA模板。在一些实施例中,模板是DNA和/或RNA模板。在一些实施例中,模板是DNA和RNA的混合物。在一些实施例中,RNA包括任何类型的RNA(例如rRNA、tRNA、mRNA和/或snRNA中的一者或多者)。在一些实施例中,RNA包括至少一个类型的RNA的混合物。在一些实施例中,DNA可以包括以下的混合物或其中至少一者:基因组DNA或核DNA、粒线体DNA、Y系DNA、常染色体DNA、核糖体DNA或其组合。在一些实施例中,模板是任何长度的聚合物。在一些实施例中,模板为约20个碱基到约100个碱基、约30个碱基到约500个碱基、约30个碱基到约1000个碱基、约50个碱基到约300个碱基、约100个碱基到约600个碱基、约200个碱基到约800个碱基、约200个碱基到约600个碱基、约100个碱基到约2000个碱基、约100个碱基到约2500个碱基、约200个碱基到约5000个碱基、约200个碱基到约1000个碱基、约200到约10000个碱基。在一些实施例中,模板为至少约10个碱基、至少约20个碱基、至少约30个碱基、至少约40个碱基、至少约50个碱基、至少约60个碱基、至少约70个碱基、至少约80个碱基、至少约90个碱基、至少约100个碱基、至少约150个碱基、至少约200个碱基、至少约250个碱基、至少约300个碱基、至少约350个碱基、至少约400个碱基、至少约450个碱基、至少约500个碱基、至少约550个碱基、至少约600个碱基、至少约650个碱基、至少约700个碱基、至少约750个碱基、至少约800个碱基、至少约850个碱基、至少约900个碱基、至少约950个碱基、至少约1000个碱基、至少约1100个碱基、至少约1200个碱基、至少约1300个碱基、至少约1400个碱基、至少约1500个碱基、至少约1700个碱基、至少约2000个碱基、至少约2200个碱基、至少约2500个碱基、至少约2700个碱基、至少约3000、至少约3500个碱基、至少约4000个碱基、至少约4500个碱基、至少约5000个碱基、至少约10,000个碱基或至少约50,000个碱基。在一些实施例中,模板为约或至少约或最多约10个碱基、约或至少约或最多约20个碱基、约或至少约或最多约30个碱基、约或至少约或最多约40个碱基、约或至少约或最多约50个碱基、约或至少约或最多约60个碱基、约或至少约或最多约70个碱基、约或至少约或最多约80个碱基、约或至少约或最多约90个碱基、约或至少约或最多约100个碱基、约或至少约或最多约150个碱基、约或至少约或最多约200个碱基、约或至少约或最多约250个碱基、约或至少约或最多约300个碱基、约或至少约或最多约350个碱基、约或至少约或最多约400个碱基、约或至少约或最多约450个碱基、约或至少约或最多约500个碱基、约或至少约或最多约550个碱基、约或至少约或最多约600个碱基、约或至少约或最多约650个碱基、约或至少约或最多约700个碱基、约或至少约或最多约750个碱基、约或至少约或最多约800个碱基、约或至少约或最多约850个碱基、约或至少约或最多约900个碱基、约或至少约或最多约950个碱基、约或至少约或最多约1000个碱基、约或至少约或最多约1100个碱基、约或至少约或最多约1200个碱基、约或至少约或最多约1300个碱基、约或至少约或最多约1400个碱基、约或至少约或最多约1500个碱基、约或至少约或最多约1700个碱基、约或至少约或最多约2000个碱基、约或至少约或最多约2200个碱基、约或至少约或最多约2500个碱基、约或至少约或最多约2700个碱基、约或至少约或最多约3000、约或至少约或最多约3500个碱基、约或至少约或最多约4000个碱基、约或至少约或最多约4500个碱基、约或至少约或最多约5000个碱基、约或至少约或最多约10,000个碱基或约或至少约或最多约50,000个碱基。在一些实施例中,模板DNA可以是双链DNA模板(dsDNA模板)或单链DNA模板(ssDNA模板)。在一些实施例中,模板RNA可以是双链RNA模板(dsRNA模板)或单链RNA模板(ssRNA模板)。
在一些实施例中,模板来自单个细胞。在一些实施例中,模板来自多个细胞。在一些实施例中,模板包括低拷贝数DNA或RNA或DNA和/或RNA的组合。在一些实施例中,低拷贝数指代含有等于或小于约250皮克(例如,100皮克)例如模板和/或DNA和/或RNA和/或DNA与RNA的混合物的样本。在一些实施例中,RNA可以包括以下中的至少一者:信使RNA(mRNA)、转运RNA、转运-信使RNA、核糖体RNA、反义RNA、核小RNA(snRNA)、核仁小RNA(snoRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)或其任何组合。在一些实施例中,模板来自样本。在一些实施例中,模板总量是样本中的模板总量。在一些实施例中,模板总量是反应混合物中的模板总量。在一些实施例中,模板总量是一个锅(例如单个容器)中的模板总量。在一些实施例中,模板总量为约1飞摩尔(fM)到约100微摩尔、约40飞摩尔到约0.01微摩尔、约50飞摩尔到约500飞摩尔、约50飞摩尔到约0.01微摩尔、约50飞摩尔到约0.1微摩尔、约50飞摩尔到约500皮摩尔、约50飞摩尔到约500纳摩尔、约50飞摩尔到约500微摩尔、约50飞摩尔到约1皮摩尔、约40飞摩尔到约1纳摩尔、约1飞摩尔到约1皮摩尔、约0.0001微摩尔到约0.01微摩尔、约0.0001微摩尔到约0.1微摩尔或约0.1nM到约100nM。在一些实施例中,模板总量等于或为至少约或小于约1000微摩尔、等于或为至少约或小于约500微摩尔、等于或为至少约或小于约250微摩尔、等于或为至少约或小于约100微摩尔、等于或为至少约或小于约50微摩尔、等于或为至少约或小于约25微摩尔、等于或为至少约或小于约10微摩尔、等于或为至少约或小于约1微摩尔、等于或为至少约或小于约0.1微摩尔、等于或为至少约或小于约0.01微摩尔、等于或为至少约或小于约0.001微摩尔、等于或为至少约或小于约0.0001微摩尔、等于或为至少约或小于约2000纳摩尔、等于或为至少约或小于约500纳摩尔、等于或为至少约或小于约250纳摩尔、等于或为至少约或小于约200纳摩尔、等于或为至少约或小于约50纳摩尔、等于或为至少约或小于约25纳摩尔、等于或为至少约或小于约20纳摩尔、等于或为至少约或小于约2纳摩尔、等于或为至少约或小于约0.2纳摩尔、等于或为至少约或小于约0.01纳摩尔、等于或为至少约或小于约0.001纳摩尔、等于或为至少约或小于约0.0001纳摩尔、等于或为至少约或小于约3000皮摩尔、等于或为至少约或小于约500皮摩尔、等于或为至少约或小于约250皮摩尔、等于或为至少约或小于约300皮摩尔、等于或为至少约或小于约50皮摩尔、等于或为至少约或小于约25皮摩尔、等于或为至少约或小于约30皮摩尔、等于或为至少约或小于约3皮摩尔、等于或为至少约或小于约0.3皮摩尔、等于或为至少约或小于约0.01皮摩尔、等于或为至少约或小于约0.001皮摩尔、等于或为至少约或小于约0.0001皮摩尔、等于或为至少约或小于约5000飞摩尔、等于或为至少约或小于约500飞摩尔、等于或为至少约或小于约250飞摩尔、等于或为至少约或小于约50飞摩尔、等于或为至少约或小于约25飞摩尔、等于或为至少约或小于约10飞摩尔、等于或为至少约或小于约1飞摩尔、等于或为至少约或小于约0.1飞摩尔、等于或为至少约或小于约0.01飞摩尔、等于或为至少约或小于约0.001飞摩尔、等于或为至少约或小于约0.0001飞摩尔。
在一些实施例中,模板可以存在于任何相关核酸样本中,包含但不限于从单个细胞、多个细胞(例如培养细胞)、组织、器官或生物(例如细菌、酵母等)分离的核酸样本。在一些实施例中,核酸样本从哺乳动物(例如人类、啮齿动物(例如小鼠)或任何其它哺相关乳动物)分离的细胞、组织、器官等等。在一些实施例中,核酸样本从除哺乳动物以外的来源分离,例如细菌、酵母、昆虫(例如,果蝇)、两栖动物(例如,青蛙(例如,非洲爪蟾蜍))、病毒、植物或任何其它非哺乳动物核酸样本来源。
在一些实施例中,模板经过最优化。在一些实施例中,受体模板或受体核酸分子包括至少一个经过修饰的核苷酸。在一些实施例中,受体模板或受体核酸分子经过工程改造来改进模板跳转和/或转化效率。在一些实施例中,受体模板或受体核酸分子在3'端处经过最优化。在一些实施例中,最优化防止二级结构形成和/或核苷酸合成。
在一些实施例中,本公开中公开的方法可以进一步包括模板(例如,供体模板)的最优化。在一些实施例中,模板的最优化包括使模板(例如RNA)与能够去除模板(例如mRNA)的5'帽结构的试剂接触。在一些实施例中,在允许通过试剂去除帽结构的条件下进行帽结构去除。在一些实施例中,本公开中公开的方法进一步包括例如去帽模板的脱磷酸化。在一些实施例中,方法进一步包含在允许脱磷酸化的条件下将脱磷酸化剂添加到去帽模板。
在一些实施例中,本公开的任何方法可以进一步包括模板的最优化。在一些实施例中,模板的最优化包括:在允许通过试剂去除帽结构的条件下,使包括模板的样本与去除模板的5'帽结构的试剂接触。在一些实施例中,模板的最优化可以进一步包括在允许通过试剂脱磷酸化去帽模板的条件下添加脱磷酸化剂。在一些实施例中,模板(例如RNA分子)在合成或分离之后脱磷酸化。在一些实施例中,脱磷酸化通过用碱性磷酸酶处理核酸(例如RNA)分子来实现。在一些实施例中,已分离供体模板(例如RNA或mRNA)在分离之后去帽和脱磷酸化。核酸(例如RNA)去帽方法包含酶促法(例如通过使用焦磷酸酶,例如烟草焦磷酸酶)和化学法(例如过碘酸盐氧化和β消除)。核酸(例如RNA)的脱磷酸化方法可以使用碱性磷酸酶。在一些实施例中,已分离mRNA经过去帽(例如使用烟草酸性焦磷酸酶)和脱磷酸化(例如通过使用碱性磷酸酶)。在一些实施例中,通过利用焦磷酸酶对mRNA进行酶处理或通过化学去帽(例如通过过碘酸盐氧化和β消除)来去除RNA帽结构。在一些实施例中,mRNA经过标签修饰。
在一些实施例中,本公开的任一方法在一个锅(例如单个容器)中执行。在一些实施例中,反应在一个锅(例如单个容器)中进行。在一些实施例中,反应是一锅(例如单容器)反应。
在一些实施例中,模板跳转取决于受体核酸分子的浓度。
在一些实施例中,经过修饰的酶(例如经过修饰的逆转录酶)、经过修饰的逆转录酶、非天然存在的酶、具有逆转录酶活性的经过修饰的多肽相对于野生型、未修饰对应物或天然存在的酶包括至少一个修饰。在一些实施例中,经过修饰的非LTR逆转录转座子包括野生型或未修饰非LTR逆转录转座子的至少一个修饰。在一些实施例中,经过修饰的R2逆转录酶包括野生型或未修饰R2逆转录酶的至少一个修饰。在一些实施例中,经过修饰的逆转录酶包括野生型或未修饰逆转录酶的至少一个修饰。在一些实施例中,具有逆转录酶活性的经过修饰的多肽包括具有逆转录酶活性的野生型或未修饰多肽的至少一个修饰。在一些实施例中,修饰包括至少一个截短(例如N端截短、C端截短和/或N端和C端截短)。在一些实施例中,修饰包括氨基酸在相关位置的定点并入和/或添加和/或缺失和/或取代。在一些实施例中,修饰增强经过修饰的酶或经过修饰的多肽相对于野生型或未修饰酶或多肽的生物性质。在一些实施例中,修饰改进经过修饰的酶或多肽相对于野生型或未修饰酶或多肽的至少一个酶性质。在一些实施例中,修饰充当例如标记和蛋白质半衰期延长剂的连接点和用于将变异体附着到固体支撑物表面的连接点。在一些实施例中,本公开涉及产生能够产生经过修饰的酶(例如经过修饰的逆转录酶)或经过修饰的多肽的细胞的方法,和产生含有编码经过修饰的酶(例如经过修饰的逆转录酶)或经过修饰的多肽的DNA或RNA的载体的方法。在一些实施例中,截短基于两步法。在一些实施例中,用于选择截短的第一步骤包含分析一类酶或蛋白质或多肽的结构域与基序结构和功能。在一些实施例中,酶或蛋白质或多肽是非LTR逆转录转座子、逆转录酶、R2逆转录酶、LTR逆转录转座子、R2非LTR逆转录转座子或其任何组合。在一些实施例中,酶或蛋白质或多肽来自不同生物体。在一些实施例中,酶或蛋白质或多肽的所有结构域存在。在一些实施例中,所有结构域存在以确保逆转录酶活性。在一些实施例中,所有结构域存在以确保本公开必需的独特性质。在一些实施例中,负责逆转录酶活性的结构域没有经过修饰。在一些实施例中,R2结构域不包括修饰。在一些实施例中,R2结构域可以包括修饰。在一些实施例中,截短变异体展示表达水平。在一些实施例中,对展示有前景的表达水平的截短变异体进一步进行序列的较小调整(步骤二)。在一些实施例中,序列的较小调整包含氨基酸的缺失、插入和/或取代。在一些实施例中,氨基酸的缺失、插入和/或取代可以包含一个或几个氨基酸。在一些实施例中,氨基酸的缺失、插入和/或取代进一步最优化表达和/或稳定性(例如热稳定性)。
在一些实施例中,经过修饰的酶(例如经过修饰的逆转录酶)、经过修饰的逆转录酶或经过修饰的多肽相对于野生型或未修饰酶(例如野生型逆转录酶)或野生型或未修饰多肽具有N端截短、C端截短或两者。在一些实施例中,聚合酶包括N端截短、C端截短或两者。在一些实施例中,经过修饰的逆转录酶包括N端截短、C端截短或N端和C端截短的组合。在一些实施例中,经过修饰的酶包括N端截短、C端截短或N端和C端截短的组合。在一些实施例中,经过修饰的多肽包括N端截短、C端截短或N端和C端截短的组合。在一些实施例中,截短包括序列MAHHHHHHVGTVGTGGGSGGASTAL。在一些实施例中,经过修饰的逆转录酶、经过修饰的酶、经过修饰的多肽、经过修饰的非LTR逆转录转座子或经过修饰的R2逆转录酶包括少于约100个氨基酸残基的截短。在一些实施例中,经过修饰的逆转录酶、经过修饰的酶、经过修饰的多肽、经过修饰的非逆转录转座子或经过修饰的R2逆转录酶包括以下中的至少一者:(a)少于约400个氨基酸残基的氨基端截短和(b)少于约400个氨基酸残基的羧基端截短。在一些实施例中,经过修饰的逆转录酶、经过修饰的酶、经过修饰的多肽、经过修饰的非LTR逆转录转座子或经过修饰的R2逆转录酶缺乏N端、C端或两者的多达:约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约30、约50、约75、约100、约120、约150、约175、约200、约220、约250、约275、约280、约290、约300、约325、约350、约375、约380、约390、约400或约450个氨基酸。在一些实施例中,经过修饰的逆转录酶、经过修饰的酶、经过修饰的多肽、经过修饰的非LTR逆转录转座子或经过修饰的R2逆转录酶可替代地或另外具有多达:约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24或约25个氨基酸、约30、约50、约75、约100、约120、约150、约175、约200、约220、约250、约275、约280、约290、约300、约325、约350、约375、约380、约390或共约450个氨基酸的一个或多个内部缺失。在一些实施例中,N端截短、C端截短或两者可以包括约1到约50个氨基酸、约1到约25、约1到约70、约10到约50、约20到约30、约15到约100、约1到约150、约15到约60、约15到约40、约1到约10、约10到35、约50到约100、约20到约150、约200到约350、约25到约350、约150到约400、约50到约400、约50到约450、约200到约400或约50到约350或约50到约400个氨基酸的缺失。在一些实施例中,N端截短去除至少约5、至少约10、至少约15、至少约20、至少约25、至少约30、至少约35、至少约40、至少约50、至少约60、至少约65、至少约70、至少约75、至少约80、至少约90、至少约95、至少约100、至少约120、至少约130、至少约140、至少约150、至少约175、至少约200、至少约220、至少约250、至少约275、至少约300、至少约325、至少约350、至少约375或至少约400个氨基酸。在一些实施例中,C端截短去除至少约5、至少约10、至少约15、至少约20、至少约25、至少约30、至少约35、至少约40、至少约50、至少约60、至少约65、至少约70、至少约75、至少约80、至少约90、至少约95、至少约100、至少约120、至少约130、至少约140、至少约150、至少约175、至少约200、至少约220、至少约250、至少约275、至少约300、至少约325、至少约350、至少约375或至少约400个氨基酸。在一些实施例中,N端截短缺乏约5、约10、约15、约20、约25、约30、约35、约40、约50、约60、约65、约70、约75、约80、约90、约95、约100、约120、约130、约140、约150、约175、约200、约220、约250、约275、约300、约325、约350、约375或约400个氨基酸。在一些实施例中,C端截短缺乏约5、约10、约15、约20、约25、约30、约35、约40、约50、约60、约65、约70、约75、约80、约90、约95、约100、约120、约130、约140、约150、约175、约200、约220、约250、约275、约300、约325、约350、约375或约400个氨基酸。在一些实施例中,N端截短缺乏不超过约5、不超过约10、不超过约15、不超过约20、不超过约25、不超过约30、不超过约35、不超过约40、不超过约50、不超过约60、不超过约65、不超过约70、不超过约75、不超过约80、不超过约90、不超过约95、不超过约100、不超过约120、不超过约130、不超过约140、不超过约150、不超过约175、不超过约200、不超过约220、不超过约250、不超过约275、不超过约300、不超过约325、不超过约350、不超过约375或不超过约400个氨基酸。在一些实施例中,C端截短缺乏不超过约5、不超过约10、不超过约15、不超过约20、不超过约25、不超过约30、不超过约35、不超过约40、不超过约50、不超过约60、不超过约65、不超过约70、不超过约75、不超过约80、不超过约90、不超过约95、不超过约100、不超过约120、不超过约130、不超过约140、不超过约150、不超过约175、不超过约200、不超过约220、不超过约250、不超过约275、不超过约300、不超过约325、不超过约350、不超过约375或不超过约400个氨基酸。在一些实施例中,截短包括去除至少约、最多约或约5、10、15、20、25、30、40、50、75、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475或500个氨基酸的N端截短。在一些实施例中,截短包括去除至少约、最多约或约5、10、15、20、25、30、40、50、75、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475或500个氨基酸的C端截短。在一些实施例中,N端截短、C端截短或两者可以是大于约500个氨基酸、大于约1000个氨基酸、大于约1500个氨基酸、大于约2000个氨基酸、大于约5000个氨基酸、大于约10000个氨基酸、大于约100000个氨基酸、大于约1000000个氨基酸。
在一些实施例中,可以对影响蛋白质或酶的功能活性的区域的截短进行工程改造。在一些实施例中,可以对不影响蛋白质或酶的功能活性的区域的截短进行工程改造。截短可以包括少于约5、少于约10、少于约15、少于约20、少于约25、少于约30、少于约35、少于约40、少于约45、少于约50、少于约60、少于约70、少于约80、少于约90、少于约100、少于约125、少于约150、少于约200、少于约250、少于约300、少于约350、少于约400个或更多个氨基酸的截短。截短可以包括大于约5、大于约10、大于约15、大于约20、大于约25、大于约30、大于约35、大于约40、大于约45、大于约50、大于约60、大于约70、大于约80、大于约90、大于约100、大于约125、大于约150、大于约200、大于约250、大于约300、大于约350、大于约400个或更多个氨基酸的截短。截短可以包括多肽或酶的约5%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约87%、约90%、约92%、约95%或约100%的截短。
在一些实施例中,变异体或经过修饰的酶或经过修饰的蛋白质可以包括氨基酸位置处的一个或多个修饰。在一些实施例中,本公开的变异体、突变体或经过修饰的多肽或酶类可具有相比对应未突变或未修饰或野生型聚合酶或相比一个或多个聚合酶(例如RNA依赖性DNA聚合酶或逆转录酶)增加的活性,例如增加的RNA依赖性DNA聚合酶活性或DNA依赖性DNA聚合酶活性。在一些实施例中,活性增加的聚合酶或逆转录酶可以是相比(1)对应未突变或野生型酶;或(2)特定聚合酶(例如RNA依赖性DNA聚合酶、逆转录酶)或特定逆转录酶或一组聚合酶或一组逆转录酶具有至少约5%增加、至少约10%增加、至少约25%增加、至少约30%增加、至少约50%增加、至少约100%增加、至少约150%增加、至少约200%增加、至少约300%增加、至少约500%增加、至少约1,000%增加、至少约2,500%增加或至少约5,000%增加的经过修饰的聚合酶或经过修饰的逆转录酶。在一些实施例中,本公开的经过修饰的聚合酶或经过修饰的逆转录酶可能具有约5%到约5,000%、约5%到约2,500%、约5%到约1000%、约5%到约500%、约5%到约250%、约5%到约100%、约5%到约50%、约5%到约25%、约25%到约5,000%、约25%到约2,500%、约25%到约1,000%、约25%到约500%、约25%到约250%、约25%到约100%、约100%到约5,000%、约100%到约2,500%、约100%到约1000%、约100%到约500%或约100%到约250%的活性增加。本公开经过修饰的聚合酶或经过修饰的逆转录酶的RNA依赖性DNA聚合酶活性和/或DNA依赖性DNA聚合酶活性的增加还可以根据相比(1)对应未修饰或野生型酶;或(2)特定聚合酶(例如RNA依赖性DNA聚合酶、逆转录酶)或特定逆转录酶或一组聚合酶或一组逆转录酶的相对活性来测量。在一些实施例中,当将本公开的经过修饰的聚合酶或经过修饰的逆转录酶的活性与(1)对应未突变或野生型酶;或(2)特定聚合酶(例如RNA依赖性DNA聚合酶、逆转录酶)或特定逆转录酶或一组聚合酶或一组逆转录酶进行比较时,这种相对活性的增加为至少约1.1、1.2、1.5、2、5、10、25、50、75、100、150、200、300、500、1,000、2,500、5,000、10,000或25,000倍。因此,本公开的经过修饰的聚合酶或经过修饰的逆转录酶可能具有如下增加的RNA依赖性DNA聚合酶和/或增加的DNA依赖性DNA聚合酶活性:增加约1.1倍到约25,000倍、约1.1倍到约10,000倍、约1.1倍到约5,000倍、约1.1倍到约2,500倍、约1.1倍到约1,000倍、约1.1倍到约500倍、约1.1倍到约250倍、约1.1倍到约50倍、约1.1倍到约25倍、约1.1倍到约10倍、约1.1倍到约5倍、约5倍到约25,000倍、约5倍到约5,000倍、约5倍到约1,000倍、约5倍到约500倍、约5倍到约100倍、约5倍到约50倍、约5倍到约25倍、约50倍到约25,000倍、约50倍到约5,000倍、约50倍到约1,000倍、约50倍到约500倍、约50倍到约100倍、约100倍到约25,000倍、约1,000倍到约25,000倍、约4,000倍到约25,000倍、约10,000倍到约25,000倍、约15,000倍到约25,000倍、约1,000倍到约10,000倍、约2,500倍到约10,000倍、约5,000倍到约10,000倍、约7,500倍到约10,000倍、约1,000倍到约15,000倍、约2,500倍到约15,000倍、约5,000倍到约15,000倍、约7,500倍到约15,000倍、约10,000倍到约15,000或约12,500倍到约15,000倍。
在一些实施例中,经过修饰的酶、具有逆转录酶活性的经过修饰的多肽或非天然存在的酶相对于未修饰或天然存在的对应物展现针对给定核苷酸底物的变化(例如增加或减少的)持续合成能力。在一些实施例中,经过修饰的酶、具有逆转录酶活性的经过修饰的多肽或非天然存在的酶展现的针对给定核苷酸底物的持续合成能力是参考酶针对相同核苷酸底物的持续合成能力的至少约5%、10%、25%、37.5%、50%、75%、100%、110%、125%、150%、200%、250%、500%、750%、1,000%、5,000%或10,000%。在一些实施例中,参考酶是经过修饰的酶的未修饰对应物。在一些实施例中,参考酶是逆转录酶。在一些实施例中,参考酶是非LTR逆转录转座子。在一些实施例中,参考酶是LTR逆转录转座子。在一些实施例中,参考酶是R2逆转录酶。在一些实施例中,参考酶或多肽包括如下氨基酸序列:SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ IDNO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ IDNO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ IDNO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30、SEQ IDNO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:36、SEQ IDNO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ IDNO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47和/或SEQ ID NO:48。在一些实施例中,R2包括至少一个突变和/或修饰。在一些实施例中,R2包括如下氨基酸序列:SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ IDNO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ IDNO:66或SEQ ID NO:67。在一些实施例中,R2和/或经过修饰的酶和/或经过修饰的逆转录酶包括一个或多个氨基酸处的突变,其选自(但不限于)C952S,和/或C956S,和/或C952S,C956S(双重突变体),和/或C969S,和/或H970Y,和/或R979Q,和/或R976Q,和/或R1071S,和/或R328A,和/或R329A,和/或Q336A,和/或R328A,R329A,Q336A(三重突变体),和/或G426A,和/或D428A,和/或G426A,D428A(双重突变体),和/或其任何组合。在一些实施例中,氨基酸位置基于SEQ ID NO:52。在一些实施例中,氨基酸位置基于野生型逆转录酶。在一些实施例中,氨基酸位置基于野生型R2。在一些实施例中,半胱氨酸突变。在一些实施例中,半胱氨酸突变成丝氨酸。在一些实施例中,精氨酸突变。在一些实施例中,精氨酸突变成丝氨酸或谷氨酰胺或丙氨酸。在一些实施例中,氨基酸突变成丙氨酸。在一些实施例中,谷氨酰胺突变成丙氨酸。在一些实施例中,天冬氨酸突变成丙氨酸。在一些实施例中,甘氨酸突变成丙氨酸。在一些实施例中,组氨酸突变成酪氨酸。
在一些实施例中,本公开的变异体或经过修饰的酶(例如经过修饰的逆转录酶)或具有逆转录酶活性的经过修饰的多肽包括至少一个改进酶性质的变化特性。在一些实施例中,本公开的变异体或经过修饰的酶(例如经过修饰的逆转录酶)或具有逆转录酶活性的经过修饰的多肽与本公开中公开的氨基酸序列包括至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%和至少约99%的序列一致性。在一些实施例中,变异体或经过修饰的酶或具有逆转录酶活性的经过修饰的多肽与对应于表1中基因库编号的氨基酸序列包括至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%和/或至少约99%序列一致性。在一些实施例中,变异体或经过修饰的酶或具有逆转录酶活性的经过修饰的多肽与如下序列中所列的氨基酸序列包括至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%和/或至少约99%序列一致性:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ IDNO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ IDNO:29、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ IDNO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ IDNO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ IDNO:47和/或SEQ ID NO:48。在一些实施例中,变异体或经过修饰的酶或具有逆转录酶活性的经过修饰的多肽与如下序列中所列的氨基酸序列包括至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%和/或至少约99%序列一致性:SEQID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66和/或SEQ ID NO:67。参见表2。SEQ ID NO:49是R2RT C截短的实例,SEQ ID NO:50是R2RT N截短的实例,SEQ ID NO:51是R2RT N和C截短的实例,SEQ ID NO:52是R2野生型的实例。SEQID NO:53-67是具有单个、双重或三重突变的R2的实例(表2)。在一些实施例中,经过修饰的逆转录酶来源于节肢动物。在一些实施例中,节肢动物是家蚕。
表1
表2
在一些实施例中,多肽、蛋白质、酶、经过修饰的酶类(例如经过修饰的逆转录酶)、经过修饰的多肽、非天然存在的酶类或变异体包括但不限于与蛋白质、结构域、融合搭配物、载体蛋白、靶序列、抗原决定子或其任何组合的融合物。在一些实施例中,逆转录酶或经过修饰的逆转录酶与蛋白质、结构域、融合搭配物、靶序列、抗原决定子或其任何组合融合。在一些实施例中,非LTR逆转录转座子或经过修饰非LTR逆转录转座子与蛋白质、结构域、融合搭配物、靶序列、抗原决定子或其任何组合融合。在一些实施例中,经过修饰的LTR逆转录转座子与蛋白质、结构域、融合搭配物、靶序列、抗原决定子或其任何组合融合。在一些实施例中,经过修饰的R2非LTR逆转录转座子与蛋白质、结构域、融合搭配物、靶序列、抗原决定子或其任何组合融合。在一些实施例中,经过修饰的R2逆转录酶与蛋白质、结构域、融合搭配物、靶序列、抗原决定子或其任何组合融合。在一些实施例中,经过修饰的逆转录酶与蛋白质、结构域、融合搭配物、靶序列、抗原决定子或其任何组合融合。在一些实施例中,变异体与蛋白质、结构域、融合搭配物、靶序列、抗原决定子或其任何组合融合。在一些实施例中,具有逆转录酶活性的多肽与蛋白质、结构域、融合搭配物、靶序列、抗原决定子或其任何组合融合。
在一些实施例中,融合的多肽、蛋白质、酶、经过修饰的酶(例如经过修饰的逆转录酶)、经过修饰的多肽、非天然存在的酶或其变异体相比野生型对应物、天然存在的酶或未融合多肽、蛋白质、酶或其变异体增加稳定性(例如增加热稳定性)、增加存放期、增加活性分数和/或改进纯化。在一些实施例中,经过修饰的逆转录酶包括融合搭配物或载体蛋白。在一些实施例中,融合蛋白、结构域、融合搭配物、靶序列、抗原决定子或其任何组合的选择基于产生降低或增加的稳定性(例如增加的热稳定性)、降低或增加的货架期和/或降低或增加的表达水平的机制(Costa等人,“大肠杆菌中针对蛋白质溶解度、纯化和免疫原性的融合标签:新颖Fh8系统(Fusion tags for protein solubility,purification andimmunogenicity in Escherichia coli:the novel Fh8system)”前沿微生物学(FrontMicrobiol.)2014年2月19日;5:63)。在一些实施例中,融合标签提高其搭配物蛋白的溶解度。在一些实施例中,融合蛋白形成胶束样结构。在一些实施例中,胶束样结构是被掩蔽和保护而不受溶剂影响的和/或可溶性蛋白质结构域朝外的错误折叠或未折叠的蛋白质。在一些实施例中,融合搭配物吸引伴侣蛋白。在一些实施例中,融合标签迫使其搭配物蛋白进入伴侣蛋白介导的折叠路径。在一些实施例中,MBP和/或N利用物质(NusA)是呈现这种机制的两个融合标签。在一些实施例中,融合搭配物具有固有的伴随蛋白样活性。在一些实施例中,融合标签的疏水性小片与部分折叠的伴随蛋白(passenger protein)相互作用,从而预防自聚集并促进适当折叠。在一些实施例中,溶解度强化搭配物可能在其靶蛋白的折叠中起被动作用,从而减少蛋白质聚集的机会。在一些实施例中,融合搭配物捕获电荷。在一些实施例中,强酸性融合搭配物抑制蛋白质聚集。在一些实施例中,融合是与以下但不限于与以下进行:Fh8、MBP、NusA、Trx、SUMO、GST、SET、GB1、ZZ、HaloTag、SNUT、Skp、T7PK、EspA、Mocr、Ecotin、CaBP、ArsC、IF2结构域I、表达度标签、为IF2结构域I的部分的表达度标签、RpoA、SlyD、Tsf、RpoS、PotD、Crr、msyB、yjgD、rpoD、His6或其任何组合。在一些实施例中,融合提高蛋白质溶解度和/或纯化。在一些实施例中,Fh8可以用作有效溶解度强化搭配物和/或稳固纯化。在一些实施例中,Fh8融合标签具有包括MPSVQEVEKLLHVLDRNGDGKVSAEELKAFADDSKCPLDSNKIKAFIKEHDKNKDGKLDLKELVSILSS的氨基酸序列。在一些实施例中,密码子最优化序列包括ATGCCGTCTGTTCAGGAAGTTGAAAAACTGCTGCACGTTCTGGACCGTAACGGTGACGGTAAAGTTTCTGCGGAAGAACTGAAAGCGTTCGCGGACGACTCTAAATGCCCGCTGGACTCTAACAAAATCAAAGCGTTCATCAAAGAACACGACAAAAACAAAGACGGTAAACTGGACCTGAAAGAACTGGTTTCTATCCTGTCTTCTTAG。在一些实施例中,本公开的酶、或经过修饰的酶(例如经过修饰的逆转录酶)、或蛋白质(例如经过修饰的蛋白质)、或多肽(例如经过修饰的多肽)、或变异体、或产物、或核酸分子、或cDNA分子、或模板、或受体核酸分子、或引物、或RNA、或DNA、或片段核酸、或已降解核酸可以包括一个或多个标签。在一些实施例中,片段化或已降解RNA或DNA或其变异体可以包括一个或多个标签。在一些实施例中,R2逆转录酶或其变异体可以包括一个或多个标签。在一些实施例中,非LTR逆转录转座子蛋白或具有逆转录酶活性的多肽或其变异体可以包括一个或多个标签。在一些实施例中,cDNA分子可以包括一个或多个标签。在一些实施例中,可以在固体支撑物上捕获标签,从而有助于分离本公开的酶或蛋白质或多肽或变异体或产物。在一些实施例中,标签可以是亲和素能够识别的生物素。亲和标签可以包含用于增加与多个亲和素分子的结合的多个生物素残基。在一些实施例中,标签可以包含官能基(例如叠氮基或乙炔基),其使得能够通过铜(I)介导点击化学进行捕捉(参见H.C.Kolb和K.B.Sharpless,今日药物发现(Drug Discovery Today),2003,8(24),1128-1137)。在一些实施例中,标签可以包含可以由结合于固体支撑物上的抗体捕获的抗原。在一些实施例中,标签可以包含但不限于His标签、His6标签、钙调蛋白标签、CBP、CYD(共价但可分离的NorpD肽)、Strep II、FLAG标签、HA标签、Myc标签、S标签、SBP标签、Softag-1、Softag-3、V5标签、Xpress标签、Isopeptag、SpyTag、B、HPC(蛋白C重链)肽标签、GST、MBP、生物素、生物素羧基载体蛋白、谷胱甘肽-S-转移酶标签、绿色荧光蛋白标签、麦芽糖结合蛋白标签、Nus标签、Strep标签、硫氧还蛋白标签以及其组合。在一些实施例中,可以对带标签的分子进行测序。
在一些实施例中,分子条形码可以连接到分子的任何区域。举例来说,分子条形码可以连接到多核苷酸(例如DNA、RNA)的5'端或3'端。举例来说,分子条形码的靶特异性区域包括与分子的5'区中的序列互补的序列。分子条形码的靶特异性区域还可以包括与分子的3'区中序列互补的序列。在一些情况下,分子条形码连接基因或基因产物内的区域。举例来说,基因组DNA经过片段化,且样本标签或分子识别标记连接到片段化DNA。在其它情况下,RNA分子经过选择性剪接,且分子条形码连接到选择性剪接的变异体。在另一实例中,多核苷酸经过水解,且分子条形码连接到经过水解的多核苷酸。在另一实例中,分子条形码的靶特异性区域包括与分子内的序列互补的序列。
在一些实施例中,本公开的方法包括将生物素部分或另一亲和纯化部分引入到例如核酸分子,例如DNA、RNA或DNA和RNA的组合。在一些实施例中,方法进一步包括将加亲和纯化标签的核酸分子固定在固体支撑物上。在一些实施例中,固体支撑物是其上结合亲和纯化物质,例如亲和素、链霉亲和素、甲壳素、谷胱甘肽等的琼脂糖树脂或磁珠。
在一些实施例中,本公开的酶或蛋白质或多肽或变异体或产物可以结合于固体支撑物。在一些实施例中,片段化或已降解核酸(例如RNA或DNA)或其变异体可以结合于固体支撑物。在一些实施例中,R2逆转录酶或其变异体可结合于固体支撑物。在一些实施例中,非LTR逆转录转座子蛋白或具有逆转录酶活性的多肽或其变异体可以结合于固体支撑物。在一些实施例中,cDNA分子可以结合于固体支撑物。在一些实施例中,固体支撑物可以是玻璃、塑料、瓷制品、树脂、琼脂糖、二氧化硅或其它材料。在一些实施例中,固体支撑物可以是为基本平坦的底物、凝胶、微珠、磁珠、膜或其它适合的形状和尺寸的平板。在一些实施例中,微珠可能具有10nm到几毫米之间的直径。在一些实施例中,固体支撑物可以是无孔的或多孔的,具有各种密度和尺寸的孔。在一些实施例中,可以在固体支撑物上捕获DNA和/或RNA片段,可以洗掉不想要的DNA和/或RNA。在一些实施例中,可以例如通过使用限制酶从固体支撑物剥离DNA和/或RNA片段。
在一些实施例中,固体支撑物可以包括靶核酸结合区,其中靶核酸结合区包括选自由基因特异性序列、oligo-dT序列、随机多聚体和其任何组合组成的组的序列。在一些实施例中,固体支撑物进一步包括靶核酸或其补体。在一些实施例中,固体支撑物包括多个靶核酸或其补体,包括生物体或其补体的转录组的转录物的约0.01%到约100%,或生物体或其补体的基因组的基因的约0.01%到约100%。在一些实施例中,多个寡核苷酸的细胞标记包括通过第一标记连接序列连接到第二随机序列的第一随机序列;且多个寡核苷酸的分子标记包括随机序列。在一些实施例中,固体支撑物选自由以下组成的组:聚二甲基硅氧烷(PDMS)固体支撑物、聚苯乙烯固体支撑物玻璃固体支撑物、聚丙烯固体支撑物、琼脂糖固体支撑物、明胶固体支撑物、磁性固体支撑物、普朗尼克固体支撑物和其任何组合。在一些实施例中,多个寡核苷酸包括连接子(linker),该连接子包括连接子官能基,且固体支撑物包括固体支撑物官能基;其中固体支撑物官能基和连接子官能基彼此连接。在一些实施例中,连接子官能基和固体支撑物官能基单独地选自由以下组成的组:C6、生物素、链霉亲和素、伯胺、醛、酮和其任何组合。在一些实施例中,多个寡核苷酸的分子标记包括至少15个核苷酸。
在一些实施例中,融合搭配物可以通过酶促裂解、化学裂解和/或通过使用体内裂解策略从其靶蛋白去除。在一些实施例中,蛋白酶可以用于标签去除。在一些实施例中,蛋白酶可以是内切蛋白酶、丝氨酸蛋白酶、Xa因子、肠激酶、α-凝血酶、病毒蛋白酶、烟草蚀刻病毒(TEV)、人类鼻病毒3C蛋白酶、SUMO蛋白酶、外切蛋白酶、金属羧肽酶(metallocarboxypeptidase)或氨基肽酶。在一些实施例中,融合标签可以通过通过纯化步骤去除。在一些实施例中,初始亲和纯化步骤包含(例如通过位于融合蛋白N端的组氨酸标签)使与内切蛋白酶(例如加his标签的蛋白酶)混合成溶液的经纯化融合蛋白裂解脱离标签。裂解的靶蛋白可以在第二亲和纯化步骤之后回收于流动样本中,其中裂解的融合标签和添加的蛋白酶收集在经过洗脱的样本中。
在一些实施例中,本公开的经过修饰的酶、经过修饰的逆转录酶、非天然存在的酶或具有逆转录酶活性的经过修饰的多肽在无热循环的情况下展示活性,能够进行模板跳转,和/或产生核酸分子(例如cDNA分子)。在一些实施例中,本公开的经过修饰的逆转录酶、经过修饰的酶、非天然存在的酶或具有逆转录酶活性的经过修饰的多肽在如下范围内的温度下展示活性,能够进行模板跳转和/或产生核酸cDNA分子:约25℃到约42℃、约12℃到约42℃、约8℃到约50℃、约4℃到约60℃、约27℃到约35℃、约28℃到约33℃、约29℃到约32℃、约30℃到约37℃、约26℃到约38℃、约30℃到约37℃、约25℃到约32℃、约29℃到约31℃、约27℃到约38℃、约29℃到约38℃。在一些实施例中,本公开的非天然存在的酶、经过修饰的逆转录酶、经过修饰的酶或具有逆转录酶活性的经过修饰的多肽在约30℃下或在约35℃下或在约25℃下展示活性,能够进行模板跳转和/或产生核酸分子(例如cDNA分子)。在一些实施例中,本公开的经过修饰的酶、经过修饰的逆转录酶、非天然存在的酶或具有逆转录酶活性的经过修饰的多肽在如下温度下展示活性,能够进行模板跳转,和/或产生核酸分子(例如cDNA分子):小于等于约38℃、小于等于约42℃、小于等于约50℃、小于等于约60℃、小于等于约35℃、小于等于约30℃、小于等于约28℃、小于等于约25℃、小于等于约20℃、小于等于约12℃、小于等于约8℃或小于等于约4℃。在一些实施例中,本公开的经过修饰的酶、经过修饰的逆转录酶、非天然存在的酶或具有逆转录酶活性的经过修饰的多肽在小于等于约36℃的温度下展示活性,能够进行模板跳转,和/或产生核酸分子(例如cDNA分子)。在一些实施例中,本公开的经过修饰的酶、经过修饰的逆转录酶、非天然存在的酶或具有逆转录酶活性的经过修饰的多肽在室温下展示活性,能够进行模板跳转,和/或产生核酸分子(例如cDNA分子)。在一些实施例中,本公开的经过修饰的酶、经过修饰的逆转录酶、非天然存在的酶或具有逆转录酶活性的经过修饰的多肽在如下温度下展示活性,能够进行模板跳转,和/或产生核酸分子(例如cDNA分子):约或最高约8℃、约或最高约12℃、约或最高约20℃、约或最高约25℃、约或最高约28℃、约或最高约30℃、约或最高约31℃、约或最高约32℃、约或最高约33℃、约或最高约34℃、约或最高约35℃、约或最高约36℃、约或最高约39℃、约或最高约40℃、约或最高约41℃、约或最高约42℃、约或最高约50℃、约或最高约55℃、约或最高约60℃。在一些实施例中,本公开的经过修饰的酶、经过修饰的逆转录酶、非天然存在的酶或具有逆转录酶活性的经过修饰的多肽在等于或小于如下约任何温度的温度下展示活性,能够进行模板跳转,和/或产生核酸分子(例如cDNA分子):介于约42℃与约80℃之间,或介于约35℃与约80℃之间,或介于约30℃与约50℃之间,或介于约8℃与约50℃之间,或介于约12℃与约42℃之间。
在一些实施例中,本公开的经过修饰的酶、经过修饰的逆转录酶、具有逆转录酶活性的经过修饰的多肽或非天然存在的酶相对于未修饰或天然存在的酶具有至少一个变化特性。在一些实施例中,变化特性使得经过修饰的酶、经过修饰的逆转录酶、非天然存在的酶或具有逆转录酶活性的经过修饰的多肽能够在无热循环的情况下由模板核酸分子产生核酸分子和/或互补脱氧核糖核酸(cDNA)分子。在一些实施例中,本公开的经过修饰的酶、经过修饰的逆转录酶、具有逆转录酶活性的经过修饰的多肽或非天然存在的酶能够以如下误差率产生核酸分子或cDNA分子的一个或多个拷贝:最多约0.5%、最多约1%、最多约1.5%、最多约2%、最多约2.5%、最多约3%、最多约3.5%、最多约4%、最多约4.5%、最多约5%、最多约6%、最多约7%、最多约8%、最多约9%、最多约10%、最多约15%、最多约20%、最多约25%、最多约30%、最多约40%、最多约45%、最多约50%、最多约60%、最多约65%、最多约70%、最多约75%或最多约80%。在一些实施例中,本公开的经过修饰的酶、经过修饰的逆转录酶、具有逆转录酶活性的经过修饰的多肽或非天然存在的酶是本文公开的序列中的任一者的变型。在一些实施例中,本公开的经过修饰的酶、经过修饰的逆转录酶、具有逆转录酶活性的经过修饰的多肽或非天然存在的酶是对应于表1中提供的寄存编号的序列中的任一者的变型。在一些实施例中,本公开的经过修饰的酶、经过修饰的逆转录酶、具有逆转录酶活性的经过修饰的多肽或非天然存在的酶是SEQ ID NO:1-67中提供的序列中的任一者的变型。在一些实施例中,本公开的经过修饰的酶、经过修饰的逆转录酶、具有逆转录酶活性的经过修饰的多肽或非天然存在的酶相对于未修饰或天然存在的酶具有至少一个改进酶性质的变化特性。在一些实施例中,至少一个改进酶性质的变化特性包括以下中的至少一者:增加/改进稳定性(例如增加/改进的热稳定性)、增加/改进的比活性、增加/改进的蛋白质表达、增加/改进的纯化、增加/改进的持续合成能力、增加/改进的链置换、增加/改进的模板跳转和增加/改进的保真性。
在一个实施例中,本公开涉及一种非天然存在的酶,其对模板核酸分子进行逆转录以产生互补脱氧核糖核酸(cDNA)产物并以如下持续合成能力扩增cDNA产物:在约12℃、约15℃、约20℃、约25℃、约30℃、约32℃、约35℃、约40℃下测量的每个碱基至少约80%、至少约85%、至少约87%、至少约90%、至少约92%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%。
在一些实施例中,非天然存在的酶针对至少一个酶性质具有大于约1.0的性能指标。在一些实施例中,酶性质是由以下组成的组中的至少一者:改进的稳定性(例如改进的热稳定性)、比活性、蛋白质表达、纯化、持续合成能力、链置换、模板跳转、增加的DNA/RNA亲和力和保真性。
在一个实施例中,本公开涉及一种非天然存在的酶,其对模板核酸分子进行逆转录,从而产生互补脱氧核糖核酸(cDNA)产物、核酸产物并在约3小时或更短的时段内和/或以针对至少一个选自由以下组成的组的酶性质大于约1.0的性能指标扩增cDNA产物:改进的稳定性(例如改进的热稳定性)、比活性、蛋白质表达、纯化、持续合成能力、链置换、模板跳转、增加的DNA/RNA亲和力和保真性。在一些实施例中,温度为约25℃到约40℃(例如约28℃、约30℃、约32℃、约35℃或约37℃)。在一些实施例中,温度为约8℃到约50℃(例如约8℃、约20℃、约42℃、约45℃或约50℃)。
在一个实施例中,本公开涉及一种非天然存在的酶,其对模板核酸分子进行逆转录,从而产生互补脱氧核糖核酸(cDNA)产物并在3小时或更短(例如2.5小时或更短、2小时或更短、1.5小时或更短、1小时或更短或30分钟或更短)的时段内和/或针对给定核苷酸底物以比参考酶针对相同核苷酸底物的持续合成能力高至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约88%、至少约90%、至少约95%或至少约98%的持续合成能力扩增cDNA产物。
在一个实施例中,本公开涉及一种非天然存在的酶,其对模板核酸分子进行逆转录,从而产生核酸产物并在3小时或更短(例如2.5小时或更短、2小时或更短、1.5小时或更短、1小时或更短或30分钟或更短)的时段内和/或针对给定核苷酸底物以比参考酶针对相同核苷酸底物的持续合成能力高至少约5%、至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约85%、至少约88%、至少约90%、至少约95%或至少约98%的持续合成能力扩增核酸产物。
在一个实施例中,本公开提供一种扩增核酸分子的方法,其包括使用经过修饰的逆转录酶对核酸分子进行核酸扩增。在一些实施例中,逆转录酶能够以在约4℃、约8℃、约12℃、约30℃、约28℃、约29℃、约32℃、约35℃、约37℃、约42℃、约50℃或高于约42℃下每个碱基至少约80%、至少约88%、至少约90%、至少约95%或至少约98%的持续合成能力扩增核酸分子。
在一些实施例中,本公开的方法进一步包括使用经过修饰的逆转录酶对模板核酸分子进行逆转录,从而产生核酸分子。在一些实施例中,核酸分子是游离核酸分子。在一些实施例中,模板核酸分子是游离核酸分子。
在一些实施例中,利用引物延伸或拉伸反应产生扩增产物。引物延伸/拉伸反应可以包括如下循环:在变性温度下将反应混合物培育一段变性持续时间及在拉伸温度下将反应混合物培育一段拉伸持续时间。
任何类型的核酸扩增反应可以用来扩增靶核酸和产生扩增产物。此外,核酸的扩增可以是线性的、指数的或其组合。扩增可以是基于乳液的或可以是不基于乳液的。核酸扩增方法的非限制性实例包含逆转录、引物延伸、聚合酶链反应、接合酶链反应、解旋酶依赖性扩增、不对称扩增、滚环扩增和多重置换扩增(MDA)。在一些实施例中,扩增产物可能是DNA。在扩增靶RNA的情况下,DNA可以通过逆转录RNA获得,DNA的后续扩增可以用于产生扩增的DNA产物。扩增的DNA产物可以指示生物样本中存在靶RNA。在扩增DNA的情况下,可以采用任何DNA扩增。DNA扩增方法的非限制性实例包含聚合酶链反应(PCR)、PCR的变型(例如实时PCR、等位基因特异性PCR、组装PCR、不对称PCR、数字PCR、乳液PCR、拨出PCR(dial-outPCR)、解螺旋酶依赖性PCR、巢式PCR、热启动PCR、反向PCR、甲基化特异性PCR、微引物PCR(miniprimer PCR)、多重PCR、巢式PCR、重叠-延伸PCR(overlap-extension PCR)、热不对称交错PCR、递减PCR)和接合酶链反应(LCR)。在一些情况下,DNA扩增为线性的。在一些情况下,DNA扩增为指数的。在一些情况下,利用巢式PCR实现DNA扩增,巢式PCR可以改进检测扩增DNA产物的敏感度。
变性温度可以取决于例如分析的特定生物样本、生物样本中的靶核酸(例如病毒粒子、细菌)的特定来源、使用的试剂和/或所需反应条件而变化。在一些实施例中,变性温度可以是约80℃到约110℃。在一些实施例中,变性温度可以是约90℃到约100℃。在一些实施例中,变性温度可以是约90℃到约97℃。在一些实例中,变性温度可以是约92℃到约95℃。在另外其它实例中,变性温度可以是约80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、93℃、94℃、95℃、96℃、97℃、98℃、99℃或100℃。
变性持续时间可以取决于例如分析的特定生物样本、生物样本中的靶核酸(例如病毒粒子、细菌)的特定来源、使用的试剂和/或所需反应条件而变化。在一些实施例中,变性持续时间可以小于或等于约300秒、240秒、180秒、120秒、90秒、60秒、55秒、50秒、45秒、40秒、35秒、30秒、25秒、20秒、15秒、10秒、5秒、2秒或1秒。举例来说,变性持续时间可能不超过约180秒、120秒、90秒、60秒、55秒、50秒、45秒、40秒、35秒、30秒、25秒、20秒、15秒、10秒、5秒、2秒或1秒。
拉伸或延伸温度可以取决于例如分析的特定生物样本、生物样本中的靶核酸(例如病毒颗粒、细菌)的特定来源、使用的试剂和/或所需反应条件而变化。在一些实施例中,拉伸温度可以是约30℃到约80℃。在一些实施例中,拉伸温度可以是约35℃到约72℃。在一些实施例中,拉伸温度可以是约45℃到约68℃。在一些实施例中,拉伸温度可以是约35℃到约65℃。在一些实施例中,拉伸温度可以是约40℃到约67℃。在一些实施例中,拉伸温度可以是约50℃到约68℃。在一些实施例中,拉伸温度可以是约0℃、1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、34℃、33℃、32℃、31℃、30℃、20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃或80℃。
拉伸持续时间可以取决于例如分析的特定生物样本、生物样本中的靶核酸(例如病毒颗粒、细菌)的特定来源、使用的试剂和/或所需反应条件而变化。在一些实施例中,拉伸持续时间可以小于或等于约360秒、小于或等于约300秒、240秒、180秒、120秒、90秒、60秒、55秒、50秒、45秒、40秒、35秒、30秒、25秒、20秒、15秒、10秒、5秒、2秒或1秒。在一些实施例中,拉伸持续时间可能不超过约120秒、90秒、80秒、70秒、65秒、60秒、55秒、50秒、45秒、40秒、35秒、30秒、25秒、20秒、15秒、10秒、5秒、2秒或1秒。
在一些实施例中,可以进行多个循环的引物延伸反应。可以进行任何合适数目个循环。在一些实施例中,进行的循环的数目可能少于约100、90、80、70、60、50、40、30、20、10或5个循环。进行的循环的数目可以取决于例如获得可检测扩增产物(例如指示生物样本中存在靶RNA的可检测量的扩增DNA产物)所需的循环数目(例如循环阈值(Ct))。在一些实施例中,获得可检测扩增产物(例如指示生物样本中存在靶RNA的可检测量的DNA产物)所需的循环数目可能少于约或约100个循环、75个循环、70个循环、65个循环、60个循环、55个循环、50个循环、40个循环、35个循环、30个循环、25个循环、20个循环、15个循环、10个循环、8个循环、7个循环、5个循环或4个循环。此外,在一些实施例中,可以在小于100、75、70、65、60、55、50、45、40、35、30、25、20、15、10、9、8、7、6、5、4、3、2、1的循环阈值(Ct)下获得可检测量的可扩增产物(例如指示生物样本中存在靶RNA的可检测量的DNA产物)。
在一些实施例中,扩增步骤(例如引物扩增、模板扩增、核酸扩增)包括PCR步骤。在一些实施例中,每个PCR循环可以包括变性步骤、退火步骤和延伸步骤。在一些实施例中,每个PCR循环可以包括变性步骤和延伸步骤。在一些实施例中,PCR包括至少约或约或最多约1个循环、至少约或约或最多约4个循环、至少约或约或最多约5个循环、至少约或约或最多约10个循环、至少约或约或最多约15个循环、至少约或约或最多约20个循环、至少约或约或最多约25个循环、至少约或约或最多约30个循环、至少约或约或最多约35个循环、至少约或约或最多约40个循环、至少约或约或最多约45个循环、至少约或约或最多约50个循环、至少约或约或最多约55个循环、至少约或约或最多约60个循环、至少约或约或最多约65个循环、至少约或约或最多约70个循环、至少约或约或最多约75个循环、至少约或约或最多约80个循环、至少约或约或最多约90个循环、至少约或约或最多约95个循环、至少约或约或最多约100个循环、至少约或约或最多约110个循环、至少约或约或最多约120个循环、至少约或约或最多约130个循环、至少约或约或最多约140个循环、至少约或约或最多约150个循环、至少约或约或最多约160个循环。在一些实施例中,PCR包括约10个循环到40个循环、约20个循环到40个循环、约20个循环到38个循环、约20个循环到35个循环、约10个循环到35个循环、约10个循环到30个循环、约25个循环到30个循环、约20个循环到30个循环、约4个循环到8个循环或约28个循环到32个循环。在一些实施例中,在PCR循环开始之前将反应加热到95℃,保持3分钟。在一些实施例中,每个PCR循环包括将95℃保持3秒和将62℃保持20秒。在一些实施例中,每个PCR循环包括将95℃保持3秒,将54℃保持10秒和将64℃保持20秒。在一些实施例中,每个PCR循环包括将95℃保持3秒和将64℃保持20秒。在一些实施例中,每个PCR循环包括将95℃保持3秒和将62℃保持60秒。在一些实施例中,每个PCR循环包括将95℃保持3秒,将54℃保持10秒和将64℃保持10秒。在一些实施例中,PCR包括30个循环。在一些实施例中,在PCR循环完成之后将反应加热到68℃。在一些实施例中,在PCR循环完成之后将反应加热到68℃,保持约1秒到约5秒、约1秒到约5分钟、约1分钟到约5分钟。在一些实施例中,本文所描述的PCR方法包括延伸或拉伸步骤,长至少约5秒、长至少约6秒、长至少约7秒、长至少约8秒、长至少约9秒、长至少约10秒、长至少约11秒、长至少约12秒、长至少约13秒、长至少约14秒、长至少约15秒、长至少约20秒、长至少约30秒、长至少约40秒、长至少约50秒、长至少约60秒、长至少约90秒、长至少约120秒、长至少约150秒、长至少约180秒、长至少约210秒、长至少约240秒、长至少约270秒、长至少约300秒、长至少约330秒、长至少约360秒、长至少约390秒或更长。
用于扩增产生指示存在扩增靶核酸的可检测量的扩增产物的时间可以取决于获得的靶核酸所来自的生物样本、将进行的特定核酸扩增反应和所需扩增反应的特定循环数目而变化。在一些实施例中,靶核酸的扩增可以在如下时段内产生指示存在靶核酸的可检测量的扩增产物:120分钟或更短;90分钟或更短;60分钟或更短;50分钟或更短;45分钟或更短;40分钟或更短;35分钟或更短;30分钟或更短;25分钟或更短;20分钟或更短;15分钟或更短;10分钟或更短;或5分钟或更短。
在一些实施例中,可以在进行引物延伸反应之前预加热生物样本。预加热生物样本的温度(例如预加热温度)和持续时间(例如预加热持续时间)可以取决于例如所分析的特定生物样本而变化。在一些实例中,可以将生物样本预加热不超过约60分钟、50分钟、40分钟、30分钟、25分钟、20分钟、15分钟、10分钟、9分钟、8分钟、7分钟、6分钟、5分钟、4分钟、3分钟、2分钟、1分钟、45秒、30秒、20秒、15秒、10秒或5秒。在一些实例中,可以在约80℃到约110℃的温度下预加热生物样本。在一些实例中,可以在约90℃到约100℃的温度下预加热生物样本。在一些实例中,可以在约90℃到约97℃的温度下预加热生物样本。在一些实例中,可以在约92℃到约95℃的温度下预加热生物样本。在一些实施例中,可以在约80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、93℃、94℃、95℃、96℃、97℃、98℃、99℃或100℃的温度下预加热生物样本。
在一些实施例中,进行核酸扩增所需的试剂还可以包含产生可检测信号的报告剂,可检测信号的存在与否指示扩增产物的存在。可检测信号的强度可能与扩增产物的量成比例。在产生与最初扩增的靶核酸类型不同的核酸的扩增产物的一些情况下,可检测信号的强度可能与最初扩增的靶核酸的量成比例。举例来说,在通过平行逆转录扩增靶RNA和扩增从逆转录获得的DNA的情况下,两个反应所需的试剂也可能包括报告剂,其可产生指示扩增DNA产物和/或扩增的靶RNA的存在的可检测信号。可检测信号的强度可能与扩增DNA产物和/或扩增的原始靶RNA的量成比例。报告剂的使用还实现了实时扩增方法,包含用于DNA扩增的实时PCR。
报告剂可以通过共价或非共价连接或相互作用与核酸(包含扩增产物)连接。非共价连接或相互作用的非限制性实例包含离子相互作用、范德华力、疏水相互作用、氢结合以及其组合。在一些实施例中,报告剂可以结合于初始反应物,且报告剂含量变化可以用来检测扩增产物。在一些实施例中,报告剂可能仅仅在核酸扩增进行时可检测(或不可检测)。在一些实施例中,光学活性染料(例如荧光染料)可以用作报告剂。染料的非限制性实例包含SYBR绿(SYBR green)、SYBR蓝(SYBR blue)、DAPI、碘化丙啶、Hoeste、SYBR金(SYBR gold)、溴化乙锭、吖啶(acridine)、原黄素(proflavine)、吖啶橙、吖啶黄、荧光香豆素(fluorcoumanin)、玫瑰树碱(ellipticine)、道诺霉素(daunomycin)、氯奎(chloroquine)、偏端霉素D(distamycin D)、色霉素(chromomycin)、乙菲啶(homidium)、光神霉素(mithramycin)、多吡啶钌(ruthenium polypyridyl)、安曲霉素(anthramycin)、啡啶(phenanthridine)和吖啶、溴化乙锭、碘化丙锭、碘化己锭(hexidium iodide)、二氢乙锭(dihydroethidium)、乙锭同二聚体-1和乙锭同二聚体-2、叠氮溴化乙锭(ethidiummonoazide)和ACMA、Hoechst 33258、Hoechst 33342、Hoechst34580、DAPI、吖啶橙、7-AAD、放线菌素D、LDS751、羟基芪脒(hydroxystilbamidine)、SYTOX Blue、SYTOX Green、SYTOXOrange、POPO-1、POPO-3、YOYO-1、YOYO-3、TOTO-1、TOTO-3、JOJO-1、LOLO-1、BOBO-1、BOBO-3、PO-PRO-1、PO-PRO-3、BO-PRO-1、BO-PRO-3、TO-PRO-1、TO-PRO-3、TO-PRO-5、JO-PRO-1、LO-PRO-1、YO-PRO-1、YO-PRO-3、PicoGreen、OliGreen、RiboGreen、SYBR Gold、SYBR Green I、SYBR Green II、SYBR DX、SYTO-40、SYTO-41、SYTO-42、SYTO-43、SYTO-44、SYTO-45(蓝色)、SYTO-13、SYTO-16、SYTO-24、SYTO-21、SYTO-23、SYTO-12、SYTO-11、SYTO-20、SYTO-22、SYTO-15、SYTO-14、SYTO-25(绿色)、SYTO-81、SYTO-80、SYTO-82、SYTO-83、SYTO-84、SYTO-85(橙色)、SYTO-64、SYTO-17、SYTO-59、SYTO-61、SYTO-62、SYTO-60、SYTO-63(红色)、荧光素、异硫氰酸荧光素(fluorescein isothiocyanate;FITC)、四甲基异硫氰酸若丹明(TRITC)、若丹明、四甲基若丹明、R-藻红素、Cy-2、Cy-3、Cy-3.5、Cy-5、Cy5.5、Cy-7、Texas Red、Phar-Red、别藻蓝蛋白素(allophycocyanin;APC)、Sybr Green I、Sybr Green II、Sybr Gold、CellTracker Green、7-AAD、乙锭同二聚体I、乙锭同二聚体II、乙锭同二聚体III、溴化乙锭、伞形酮(umbelliferone)、曙红(eosin)、绿色荧光蛋白、赤藓红(erythrosin)、香豆素(coumarin)、甲基香豆素、芘、孔雀绿(malachite green)、芪(stilbene)、荧光黄(luciferyellow)、级联蓝(cascade blue)、二氯三嗪基胺荧光素、丹磺酰氯、荧光镧系元素络合物(例如包含铕和铽的络合物)、羧基四氯荧光素、5-羧基和/或6-羧基荧光素(FAM)、5-(或6-)碘乙酰胺基荧光素、5-{[2(和3)-5-(乙酰基巯基)-丁二酰基]氨基}荧光素(SAMSA-荧光素)、丽丝胺若丹明B磺酰氯(lissamine rhodamine B sulfonyl chloride)、5和/或6羧基若丹明(ROX)、7-氨基-甲基-香豆素、7-氨基-4-甲基香豆素-3-乙酸(AMCA)、BODIPY荧光团、8-甲氧基芘-l,3,6-三磺酸三钠盐、3,6-二磺酸盐-4-氨基-萘二甲酰亚胺、藻胆蛋白(phycobiliprotein)、AlexaFluor 350、AlexaFluor 405、AlexaFluor 430、AlexaFluor488、AlexaFluor 532、AlexaFluor 546、AlexaFluor 555、AlexaFluor 568、AlexaFluor594、AlexaFluor 610、AlexaFluor 633、AlexaFluor 635、AlexaFluor 647、AlexaFluor660、AlexaFluor 680、AlexaFluor 700、AlexaFluor 750和AlexaFluor 790染料、DyLight350、DyLight 405、DyLight 488、DyLight 550、DyLight 594、DyLight 633、DyLight 650、DyLight 680、DyLight 755和DyLight 800或其它荧光团。
在一些实施例中,报告剂可以是在与扩增产物杂交时为光学活性的序列特异性寡核苷酸探针。由于探针与扩增产物的序列特异性结合所致,使用寡核苷酸探针可以增加特异性和检测敏感度。探针可以与任一种光学活性的报告剂(例如染料)连接且还可以包含能够阻断相关染料的光学活性的猝灭剂。可能适于用作报告剂的探针的非限制性实例包含TaqMan探针、TaqMan Tamara探针、TaqMan MGB探针或Lion探针。在一些实施例中,报告剂可以是放射性物种。放射性物种的非限制性实例包含14C、1231、1241、1251、1311、99mTc、35S或3H。在一些实施例中,报告剂可以是能够产生可检测信号的酶。可检测信号可以通过酶的活性利用其底物或在酶具有多个底物的情况下利用特定底物产生。可以用作报告剂的酶的非限制性实例包含碱性磷酸酶、辣根过氧化物酶、12-半乳糖苷酶、碱性磷酸酶、β-半乳糖苷酶、乙酰胆碱酯酶和荧光素酶。
在一些实施例中,可以检测扩增产物(例如扩增DNA产物、扩增RNA产物)。扩增产物(包含扩增DNA)的检测可以利用任何适合检测方法实现。使用的检测方法的特定类型可以取决于例如特定扩增产物、用于扩增的反应容器的类型、反应混合物中的其它试剂、反应混合物中是否包含报告剂和是否使用报告剂、使用的报告剂的特定类型。检测方法的非限制性实例包含光学检测、光谱检测、静电检测、电化学检测等等。光学检测方法包含但不限于荧光测定法和UV-Vis光吸收。光谱检测方法包含但不限于质谱法、核磁共振(NMR)波谱法和红外光谱法。静电检测方法包含但不限于基于凝胶的技术,例如凝胶电泳、SDS-PAGE凝胶。电化学检测方法包含但不限于在高效液相色谱分离扩增产物之后对扩增产物进行电化学检测。
在一些实施例中,完成方法的要素所需的时间可以取决于方法的特定步骤而变化。在一些实施例中,用于完成方法的要素的时间量可以是约5分钟到约120分钟。在一些实施例中,用于完成方法的要素的时间量可以是约5分钟到约60分钟。在一些实施例中,用于完成方法的要素的时间量可以是约5分钟到约30分钟。在一些实施例中,用于完成方法的要素的时间量可以小于或等于120分钟、小于或等于90分钟、小于或等于75分钟、小于或等于60分钟、小于或等于45分钟、小于或等于40分钟、小于或等于35分钟、小于或等于30分钟、小于或等于25分钟、小于或等于20分钟、小于或等于15分钟、小于或等于10分钟或者小于或等于5分钟。
在一些实施例中,反应可能具有适合于产生产物、适合于引物延伸、蛋白质表达、PCR扩增或模板跳转的pH。在一些实施例中,反应的pH的范围可以是约5到约9、约6到约9、约7到约9、约8到约9。在一些实施例中,pH范围是约pH 2到约pH 10、约pH 4到约pH 10、约pH 2到约pH 8、约pH 4到约pH 8、约pH 5到约pH 8、约pH 5到约pH 7、约pH 6到约pH 11、约pH 6到约pH 12、约pH 5到pH 13、约pH 5到约pH 14。在一些实施例中,pH为约2.0、约2.5、约3.0、约3.5、约4.0、约4.5、约5.0、约5.5、约6.0、约6.5、约7.0、约7.5、约8.0、约8.5、约9.0、约9.5、约10.0、约10.5、约11、约11.5、约12、约12.5、约13、约13.5、约14。
在一些实施例中,本公开的任何方法可以包括清洁剂。在一些实施例中,清洁剂是非离子和/或两性离子清洁剂。在一些实施例中,非离子清洁剂选自由以下组成的组:Tween、Triton、Triton CF-21、Triton CF-32、Triton DF-12、Triton DF-16、Triton GR-SM、Triton N-101(聚氧乙烯含支链壬基苯基醚)、Triton QS-15、Triton QS-44、TritonRW-75(聚乙二醇260单(十六烷基/十八烷基)醚和1-十八醇)、Triton X-100(聚乙二醇叔辛基苯基醚)、Triton X-102、Triton X-15、Triton X-151、Triton X-200、Triton X-207、Triton X-114、Triton X-165、Triton X-305、Triton X-405(聚氧乙烯(40)异辛基苯基醚)、还原Triton X-405(聚氧乙烯(40)异辛基苯基醚)、Triton X-45(聚乙二醇4-叔辛基苯基醚)、Triton X-705-70、任何形式的TWEEN(包含:TWEEN 20(聚氧乙烯山梨醇酐单月桂酸酯)、TWEEN 21(聚氧乙烯山梨醇酐单月桂酸酯)、TWEEN 40(聚氧乙烯(20)山梨醇酐单棕榈酸酯)、TWEEN 60(聚乙二醇山梨醇酐单硬脂酸酯)、TWEEN 61(聚乙二醇山梨醇酐单硬脂酸酯)、TWEEN 65(聚氧乙烯山梨醇酐三硬酯酸酯)、TWEEN 80(聚氧乙烯山梨醇酐单油酸酯)、TWEEN 81(聚氧乙烯山梨醇酐单油酸酯)、TWEEN 85(聚氧乙烯(20)山梨醇酐三油酸酯))、Brij、Brij 30(聚氧乙烯4月桂基醚)、Brij 35(聚氧乙烯23月桂基醚)、Brij 52(聚氧乙烯2鲸蜡基醚)、Brij56(聚氧乙烯10鲸蜡基醚)、Brij 58(聚氧乙烯20鲸蜡基醚)、Brij 72(聚氧乙烯2硬脂基醚)、Brij 76(聚氧乙烯10硬脂基醚)、Brij 78(聚氧乙烯20硬脂基醚)、Brij92(聚氧乙烯2油基醚)、Brij 97(聚氧乙烯10油基醚)、Brij 98(聚氧乙烯20油基醚)、Brij700(聚氧乙烯100硬脂基醚)、辛基硫葡萄糖苷、麦芽糖苷以及其组合。
在一些实施例中,本文公开的用于产生根据本公开的任何分子的任何方法包括至少一种盐。在一些实施例中,该盐是至少一个选自由以下组成的组的成员:NaCl、LiCl、AlCl3、CuCl2、MgCl2、InCl3、SnCl4、CrCl2、CrCl3、KCl、NaI、KI、TMACl(四甲基氯化铵)、TEACl(四乙基氯化铵)、KSCN、CsSCN、KCH3COO、CH3COONa、C5H8KNO4、C5H8NNaO4、CsCl和其任何组合。在一些实施例中,本文公开的用于产生根据本公开的任何分子的任何方法包括NaCl。在一些实施例中,足以产生分子或文库的条件包括NaCl。在一些实施例中,反应可能具有适合于产生产物、适合于引物延伸、蛋白质表达、PCR扩增或模板跳转的盐浓度和/或NaCl浓度。在一些实施例中,NaCl浓度是约50mM到约1000mM、约100mM到约500mM、约200mM到约300mM、约200mM到约600mM。在一些实施例中,NaCl浓度是:至少约、最多约或约50mM,至少约、最多约或约100mM,至少约、最多约或约150mM,至少约、最多约或约200mM,至少约、最多约或约250mM,至少约、最多约或约300mM,至少约、最多约或约350mM,至少约、最多约或约400mM,至少约、最多约或约450mM,至少约、最多约或约500mM,至少约、最多约或约550mM,至少约、最多约或至少约、最多约或约600mM,至少约、最多约或约650mM,至少约、最多约或约700mM,至少约、最多约或约750mM,至少约、最多约或约800mM,至少约、最多约或约850mM,至少约、最多约或约900mM,至少约、最多约或约950mM,或者至少约、最多约或约1000mM。在一些实施例中,NaCl可以改进本公开的酶或多肽(例如逆转录酶)的酶活性和/或模板跳转。
在一些实施例中,反应可能具有适合于产生产物、适合于引物延伸、蛋白质表达、PCR扩增或模板跳转的核苷酸(例如dNTP)浓度。在一些实施例中,反应中的dNTP总浓度可以是约50μM到约1000μM、约100μM到约500μM、约200μM到约300μM、约200μM到约600μM。在一些实施例中,dNTP总浓度是:至少约、最多约或约50μM,至少约、最多约或约100μM,至少约、最多约或约150μM,至少约、最多约或约200μM,至少约、最多约或约250μM,至少约、最多约或约300μM,至少约、最多约或约350μM,至少约、最多约或约400μM,至少约、最多约或约450μM,至少约、最多约或约500μM,至少约、最多约或约550μM,至少约、最多约或至少约、最多约或约600μM,至少约、最多约或约650μM,至少约、最多约或约700μM,至少约、最多约或约750pM,至少约、最多约或约800μM,至少约、最多约或约850μM,至少约、最多约或约900μM,至少约、最多约或约950μM,或者至少约、最多约或约1000μM。在一些实施例中,每个dNTP的总浓度是:至少约、最多约或约1μM;至少约、最多约或约2μM;至少约、最多约或约3μM;至少约、最多约或约4μM;至少约、最多约或约5μM;至少约、最多约或约6μM;至少约、最多约或约7μM;至少约、最多约或约8μM;至少约、最多约或约9μM;至少约、最多约或约10μM;至少约、最多约或约15μM;至少约、最多约或约20μM;至少约、最多约或约25μM;至少约、最多约或约30μM;至少约、最多约或约35μM;至少约、最多约或约40μM;至少约、最多约或约45μM;至少约、最多约或约50μM;至少约、最多约或约55μM;至少约、最多约或约60μM;至少约、最多约或约65μM;至少约、最多约或约70μM;至少约、最多约或约75μM;至少约、最多约或约80μM;至少约、最多约或约85μM;至少约、最多约或约90μM;至少约、最多约或约95μM;至少约、最多约或约100μM;至少约、最多约或约250μM;至少约、最多约或约500μM;至少约、最多约或约1000μM;至少约、最多约或约10000μM。在一些实施例中,每个dNTP的总浓度是约2μM到约5μM、约2μM到约10μM、约2μM到约20μM、约2μM到约50μM、约2μM到约100μM、约2μM到约250μM、约5μM到约10μM、约5μM到约50μM、约5μM到约250μM、约5μM到约1000μM。
在一些实施例中,每个dNTP的浓度可能无关于和不同于一个或多个dNTP的浓度。在一些实施例中,每个dNTP的浓度(例如每个dCTP、dGTP、dTTP或dATP的浓度)可能无关于和不同于至少一个其它dNTP的浓度。在一些实施例中,一个dNTP(例如dCTP、dGTP、dTTP或dATP)的浓度不同于至少一个其它dNTP(例如dCTP、dGTP、dTTP或dATP)的浓度,是其至少约或最多约或约1倍、2倍、3倍、4倍、5倍、7倍、10倍、20倍、35倍、50倍、75倍、90倍、100倍、200倍、500倍或1000倍。
在一些实施例中,反应混合物包含pH调节剂。相关pH调节剂包含但不限于氢氧化钠、盐酸、磷酸缓冲溶液、tris缓冲液、柠檬酸缓冲溶液等等。举例来说,反应混合物的pH可以通过添加适当量的pH调节剂来调节到所需范围。
适合于产生产物的温度范围可以根据以下因素变化:例如采用的特定聚合酶、采用的任何视情况存在的引物的解链温度等。在一些实施例中,聚合酶可以包含但不限于逆转录酶、莫洛尼鼠白血病病毒(MMLV)逆转录酶、R2逆转录酶、RNA引导式DNA聚合酶、DNA引导式DNA聚合酶、非LTR逆转录转座子、R2非LTR逆转录转座子、具有逆转录酶活性的多肽或其任何变异体,或其任何组合。
在一些实施例中,足以产生产物的条件包含使反应混合物达到如下范围内的温度:约4℃到约72℃、约16℃到约70℃、约37℃到约50℃、约40℃到约45℃、约30℃到约42℃、约25℃到约42℃、约25℃到约30℃、约28℃到约32℃、约29℃到约31℃。在一些实施例中,温度是约15℃、约16℃、约17℃、约18℃、约19℃、约20℃、约21℃、约22℃、约23℃、约24℃、约25℃、约26℃、约27℃、约28℃、约29℃、约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃、约42℃、约43℃、约44℃、约45℃、约46℃、约47℃、约48℃、约49℃、约50℃、约51℃、约52℃、约53℃、约54℃、约55℃、约56℃、约57℃、约58℃、约59℃、约60℃、约61℃、约62℃、约63℃、约64℃、约65℃、约66℃、约67℃、约68℃、约69℃、约70℃、约71℃、约72℃、约73℃、约74℃或约75℃。在一些实施例中,温度是约或最高约42℃。在一些实施例中,温度是约或最高约50℃。在一些实施例中,温度是约或最高约35℃。在一些实施例中,温度是约或最高约25℃。在一些实施例中,温度是约或最高约30℃。在一些实施例中,将反应物培育约20分钟到约3小时、约30分钟到约1.5小时、约30分钟到约1小时、约30分钟到约2小时、约1小时到约2小时、约1小时到约1.5小时、约30分钟到约5小时、约1小时到约3小时、约1小时到约4小时、约1小时到约5小时。在一些实施例中,将反应物培育约1小时。在一些实施例中,将反应物培育约20分钟、约30分钟、约40分钟、约50分钟、约1小时、约1.5小时、约2小时、约2.5小时、约3小时、约3.5小时、约4小时、约4.5小时或约5小时。在一些实施例中,将反应物培育至少约20分钟、至少约30分钟、至少约40分钟、至少约50分钟、至少约1小时、至少约1.5小时、至少约2小时、至少约2.5小时、至少约3小时、至少约3.5小时、至少约4小时、至少约4.5小时或至少约5小时。在一些实施例中,将反应物在约30℃下培育约1小时或在约42℃下培育约1小时。在一些实施例中,足以产生分子或核酸分子的条件包括将约12℃到约42℃的温度保持约1分钟到约5小时。在一些实施例中,足以产生分子或核酸分子的条件包括将约8℃到约50℃的温度保持约1分钟到约24小时。
在一些实施例中,引物可以设计成某一长度。在一些实施例中,引物的长度可以是约6到约100个核苷酸、约6到约90个核苷酸、约6到约80个核苷酸、约6到约70个核苷酸、约6到约60个核苷酸、约6到约50个核苷酸、约6到约40个核苷酸、约6到约30个核苷酸、约6到约20个核苷酸或约6到约10个核苷酸。在一些实施例中,引物的长度可以是约25到约80、约25到约75、约25到约70、约25到约65、约25到约60、约25到约55、约25到约50、约25到约45、约25到约40、约25到约35或约25到约30个碱基。在一些实施例中,引物的长度可以是至少约5、至少约6、至少约7、至少约8、至少约9、至少约10、至少约11、至少约12、至少约13、至少约14、至少约15、至少约16、至少约17、至少约18、至少约19、至少约20、至少约25、至少约30、至少约35、至少约40、至少约45、至少约50、至少约55、至少约60、至少约65、至少约70、至少约75、至少约80、至少约85、至少约90、至少约95或至少约100个碱基。在一些实施例中,引物的长度可以是约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95或约100个碱基。在一些实施例中,引物可以是至少约、不超过约或约120、130、140、150、160、170、180、190、200、230、250、270、290、300、320、340、350、370、400、420、450、470、490或500。
在一些实施例中,引物可以设计成在给定解链温度(Tm)下退火到靶。在一些实施例中,Tm可以是约20℃到约100℃、约20℃到约90℃、约20℃到约80℃、约20℃到约70℃、约20℃到约60℃、约20℃到约50℃、约20℃到约40℃或约20℃到约30℃。在一些实施例中,Tm可以是最低约、最高约或约20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、71℃、72℃、73℃、74℃、75℃、76℃、77℃、78℃、79℃、80℃、81℃、82℃、83℃、84℃、85℃、86℃、87℃、88℃、89℃、90℃、91℃、92℃、83℃、84℃、85℃、96℃、97℃、98℃、99℃或100℃。多个引物可以设计成具有某一范围内的Tm,例如在跨15℃、10℃、9℃、8℃、7℃、6℃、5℃、4℃、3℃、2℃或1℃的范围内。多个引物可以设计成具有一致的Tm。
在一些实施例中,本公开的酶、或经过修饰的酶(例如经过修饰的逆转录酶)、或蛋白质、或多肽、或变异体或PCR产物、或cDNA分子、或模板、或核酸分子、或任何组分可以纯化。在一些实施例中,片段化或已降解核酸(例如RNA或DNA)可以纯化。在一些实施例中,逆转录酶或经过修饰的逆转录酶可以纯化。在一些实施例中,R2逆转录酶或经过修饰的R2逆转录酶可以纯化。在一些实施例中,非LTR逆转录转座子蛋白质、或具有逆转录酶活性的多肽、或经过修饰的非LTR逆转录转座子蛋白质、或具有逆转录酶活性的经过修饰的多肽可以进一步纯化。在一些实施例中,cDNA分子可以纯化。在一些实施例中,模板可以纯化。在一些实施例中,受体核酸分子可以纯化。
纯化可以包括沉淀,超速离心,基于尺寸、电荷、疏水性、亲和力、金属结合的色谱法,HPLC。在一些实施例中,纯化包括柱色谱法。在一些实施例中,柱色谱法可以是尺寸排阻(SEC)、离子交换(IEX)、亲和色谱法、固定金属离子亲和色谱法(IMAC)、Ni-IMAC色谱法和/或疏水相互作用(HIC)。在一些实施例中,纯化包括His标签亲和树脂。在一些实施例中,纯化可以包括一个步骤。在一些实施例中,纯化可以包括两个步骤。在一些实施例中,两步纯化包括镍和肝素。在一些实施例中,两步纯化包括镍亲和纯化和肝素亲和纯化。在一些实施例中,相比一步纯化,两个纯化步骤提供较高活性和/或增加的模板跳转。在一些实施例中,纯化包括肝素亲和纯化。在一些实施例中,纯化可以包含亲和纯化、Ni-NTA亲和纯化、快速蛋白质液相色谱法(FPLC)(AKTAFPLC系统和Bio-Rad FPLC系统)、高压液相色谱法(HPLC)(例如Beckman HPLC和Waters HPLC)。在一些实施例中,纯化可以包含但不限于离子交换色谱法(例如Q、S)、尺寸排阻色谱法、盐梯度、亲和纯化(例如Ni、Co、FLAG、麦芽糖、谷胱甘肽、蛋白质A/G)、凝胶过滤、反相纯化、Ceramic HyperD(注册商标)离子交换色谱法和疏水相互作用柱(HIC)。还包含分析方法,例如SDS-PAGE(例如考马斯、银染)、免疫印迹、Bradford和ELISA,其可以在产生或纯化过程的任何步骤期间进行利用,通常用于测量蛋白质或酶组合物的纯度。
在一些实施例中,使用两步纯化而经过纯化的酶、蛋白质、多肽、R2逆转录酶、非LTR逆转录转座子蛋白质或具有逆转录酶活性的多肽、逆转录酶、或其变异体、或其产物的总体活性比使用单步纯化的总体活性高至少约2%、至少约5%、至少约7%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%。在一些实施例中,经过纯化的酶、蛋白质、多肽、R2逆转录酶、非LTR逆转录转座子蛋白质或具有逆转录酶活性的多肽、逆转录酶、或其变异体、或其产物的总体活性比未经过纯化的酶、蛋白质、多肽、R2逆转录酶、非LTR逆转录转座子蛋白质或具有逆转录酶活性的多肽、逆转录酶、或其变异体、或其产物的总体活性高至少约0.5%、至少约1%、至少约1.5%、至少约2%、至少约5%、至少约7%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%。在一些实施例中,经过纯化的酶、蛋白质、多肽、R2逆转录酶、非LTR逆转录转座子蛋白质、或具有逆转录酶活性的多肽、逆转录酶、经过修饰的酶、经过修饰的逆转录酶、具有逆转录酶活性的经过修饰的多肽、或其变异体、或其产物具有至少约0.5%、至少约1%、至少约3%、至少约或约5%、至少约或约10%、至少约或约15%、至少约或约20%、至少约或约25%、至少约或约30%、至少约或约35%、至少约或约40%、至少约或约45%、至少约或约50%、至少约或约55%、至少约或约60%、至少约或约61%、至少约或约62%、至少约或约63%、至少约或约64%、至少约或约65%、至少约或约66%、至少约或约67%、至少约或约68%、至少约或约69%、至少约或约70%、至少约或约71%、至少约或约72%、至少约或约73%、至少约或约74%、至少约或约75%、至少约或约76%、至少约或约77%、至少约或约78%、至少约或约79%、至少约或约80%、至少约或约81%、至少约或约82%、至少约或约83%、至少约或约84%、至少约或约85%、至少约或约86%、至少约或约87%、至少约或约88%、至少约或约89%、至少约或约90%、至少约或约91%、至少约或约92%、至少约或约93%、至少约或约94%、至少约或约95%、至少约或约96%、至少约或约97%、至少约或约98%或至少约或约99%的纯度。
在一些实施例中,相比未经过纯化的酶、蛋白质、多肽、R2逆转录酶、非LTR逆转录转座子蛋白质或具有逆转录酶活性的多肽、逆转录酶或其变异体或其产物,经过纯化的酶、蛋白质、多肽、R2逆转录酶、非LTR逆转录转座子蛋白质或具有逆转录酶活性的多肽、逆转录酶、或其变异体或其产物产生模板跳转的强度多和/或高至少约或约一倍、至少约或约两倍、至少约或约三倍、至少约或约四倍、至少约或约五次、至少约或约六倍、至少约或约七倍、至少约或约八倍、至少约或约九倍、至少约或约十倍、至少约或约十五倍、至少约或约二十倍、至少约或约二十五倍、至少约或约三十倍、至少约或约四十倍、至少约或约五十倍、至少约或约七十倍、至少约或约八十倍、至少约或约九十倍、至少约或约100倍、至少约或约150倍、至少约或约200倍、至少约或约250倍、至少约或约300倍、至少约或约350倍、至少约或约400倍、至少约或约500倍、至少约或约700倍、至少约或约1000倍、至少约或约10000倍。
游离DNA和循环肿瘤DNA
在一些实施例中,获得一定量的循环肿瘤(ctDNA)可以包括PCR。在一些实施例中,获得一定量的ctDNA可以包括数字PCR。在一些实施例中,获得一定量的ctDNA可以包括定量PCR。在一些实施例中,获得一定量的ctDNA可以包括获得ctDNA上的测序信息。测序信息可以包括与一个或多个基因组区域碱基相关的信息。在一些实施例中,获得一定量的ctDNA可以包括使ctDNA与阵列杂交。
确定游离DNA的量可以包括确定游离DNA的绝对量。游离DNA的量可以通过对与游离DNA有关的测序读数进行计数来确定。游离DNA的量可以通过定量PCR确定。
确定游离DNA(cfDNA)的量可以通过cfDNA的分子条形码化进行。cfDNA的分子条形码化可以包括将衔接子连接到cfDNA的一个或多个端。衔接子可以包括多个寡核苷酸。衔接子可以包括一个或多个脱氧核糖核苷酸。衔接子可以包括核糖核苷酸。衔接子可以是单链的。衔接子可以是双链的。衔接子可以包括双链和单链部分。举例来说,衔接子可以是Y形衔接子。衔接子可以是线状衔接子。衔接子可以是环形衔接子。衔接子可以包括分子条形码、样本指标、引物序列、连接子序列或其组合。分子条形码可以邻近样本指标。分子条形码可以邻近引物序列。样本指标可以邻近引物序列。连接子序列可以将分子条形码连接到样本指标。连接子序列可以将分子条形码连接到引物序列。连接子序列可以将样本指标连接到引物序列。
衔接子可以包括分子条形码。分子条形码可以包括随机序列。分子条形码可以包括预定序列。两个或超过两个衔接子可以包括两个或超过两个不同分子条码。可以最优化分子条码来最大限度地减少二聚合。可以最优化分子条码来使得甚至能够鉴别扩增或测序错误。例如,第一分子条形码的扩增可以引入单个碱基错误。第一分子条形码可以包括与其它分子条码的大于单个碱基差异。因此,具有单个碱基错误的第一分子条形码可能仍被鉴别为第一分子条形码。分子条形码可以包括至少2、3、4、5、6、7、8、9、10或更多个核苷酸。分子条形码可以包括至少3个核苷酸。分子条形码可以包括至少4个核苷酸。分子条形码可以包括少于20、19、18、17、16或15个核苷酸。分子条形码可以包括少于10个核苷酸。分子条形码可以包括少于8个核苷酸。分子条形码可以包括少于6个核苷酸。分子条形码可以包括2到15个核苷酸。分子条形码可以包括2到12个核苷酸。分子条形码可以包括3到10个核苷酸。分子条形码可以包括3到8个核苷酸。分子条形码可以包括4到8个核苷酸。分子条形码可以包括4到6个核苷酸。
衔接子可以包括样本指标。样本指标可以包括随机序列。样本指标可以包括预定序列。两组或超过两组衔接子可以包括两个或超过两个不同样本指标。一组衔接子内的衔接子可以包括一致的样本指标。可以最优化样本指标来最大限度地减少二聚合。可以最优化样本指标来使得甚至能够鉴别扩增或测序错误。例如,第一样本指标的扩增可以引入单个碱基错误。第一样本指标可以包括与其它样本指标的大于单个碱基差异。因此,具有单个碱基错误的第一样本指标可能仍被鉴别为第一分子条形码。样本指标可以包括至少2、3、4、5、6、7、8、9、10或更多个核苷酸。样本指标可以包括至少3个核苷酸。样本指标可以包括至少4个核苷酸。样本指标可以包括少于20、19、18、17、16或15个核苷酸。样本指标可以包括少于10个核苷酸。样本指标可以包括少于8个核苷酸。样本指标可以包括少于6个核苷酸。样本指标可以包括2到15个核苷酸。样本指标可以包括2到12个核苷酸。样本指标可以包括3到10个核苷酸。样本指标可以包括3到8个核苷酸。样本指标可以包括4到8个核苷酸。样本指标可以包括4到6个核苷酸。
衔接子可以包括引物序列。引物序列可以是PCR引物序列。引物序列可以是测序引物。
衔接子可以连接到cfDNA的一端。衔接子可以连接到cfDNA的两端。衔接子可以连接到单链cf DNA的一个或多个端。衔接子可以连接到双链cfDNA的一个或多个端。
衔接子可以通过接合连接到cfDNA。接合可以是平端接合。接合可以是黏端接合。衔接子可以通过引物延伸连接到cf DNA。衔接子可以通过逆转录连接到cfDNA。衔接子可以通过杂交连接到cfDNA。衔接子可以包括至少部分与cfDNA互补的序列。或者,在一些情况下,衔接子不包括与cfDNA互补的序列。
cf-DNA可以来源于受试者的肿瘤。cf-DNA可以来源于受试者的任何样本。cf-DNA可以来源于受试者的任何器官。cf-DNA可以来源于受试者的任何体液(例如血液、唾液、尿液和黏液)。方法可以进一步包括基于cf-DNA的检测来检测受试者的癌症。
在一些实施例中,序列存在与否可能与DNA或RNA表达谱或癌症有关。举例来说,序列存在与否可能与样本(例如单个细胞)的转录表达谱、微小RNA表达谱、癌症表达谱或基因组突变表达谱有关。在一些实施例中,cfDNA可以用于癌症表达谱分析,和/或监测病况进展,和/或监测以往突变和新突变的发生。方法可以进一步包括基于cf-DNA的检测来诊断受试者的癌症。诊断癌症可能具有至少约50%、52%、55%、57%、60%、62%、65%、67%、70%、72%、75%、77%、80%、82%、85%、87%、89%、90%、91%、92%、93%、94%、95%、96%、97%或99%的敏感度。诊断癌症可能具有至少约50%、52%、55%、57%、60%、62%、65%、67%、70%、72%、75%、77%、80%、82%、85%、87%、89%、90%、91%、92%、93%、94%、95%、96%、97%或99%的特异性。方法可以进一步包括基于cf-DNA的检测来对受试者的癌症进行预后。对癌症进行预后可能具有至少约50%、52%、55%、57%、60%、62%、65%、67%、70%、72%、75%、77%、80%、82%、85%、87%、89%、90%、91%、92%、93%、94%、95%、96%、97%或99%的敏感度。对癌症进行预后可能具有至少约50%、52%、55%、57%、60%、62%、65%、67%、70%、72%、75%、77%、80%、82%、85%、87%、89%、90%、91%、92%、93%、94%、95%、96%、97%或99%的特异性。方法可以进一步包括基于cf-DNA的检测确定用于受试者的治疗方案。方法可以进一步包括基于cf-DNA的检测向受试者施用抗癌疗法。方法可以进一步包括基于测序信息检测突变(例如特定区域的突变)。诊断癌症可以基于突变的检测。检测到至少3个突变可以指示癌症。检测到三个或更多个区域中的一个或多个突变可以指示癌症。
酶的突变
在一些实施例中,经过修饰的酶或衍生物和变异体可以在肽合成期间制备或通过产生后修饰制备。在一些实施例中,经过修饰的酶或衍生物和变异体可以通过定点突变(例如定点突变试剂盒方案)、随机突变或酶裂解和/或核酸接合产生。在一些实施例中,衍生物和变异体或经过修饰的酶通过随机突变产生。在一些实施例中,合理设计和/或突变基于序列比对分析。在一些实施例中,合理设计/突变基于关于确定且已知的酶和蛋白质的序列比对分析。在一些实施例中,对酶和/或元件与R2的同源性进行序列比对分析,该等酶和/或元件包含但不限于非LTR逆转录转座子、端粒酶、II型内含子、LTR逆转录转座子、逆转录酶、逆转录病毒逆转录酶(例如HIV、MMLV)和病毒RNA依赖性RNA聚合酶。
在一些实施例中,本公开的变异体或经过修饰的酶可以通过包含但不限于例如点饱和突变(site-saturation mutagenesis)、扫描突变(scanning mutagenesis)、插入突变(insertional mutagenesis)、缺失突变(deletion mutagenesis)、随机突变、定点突变和定向进化以及各种其它重组方法产生。制备经过修饰的酶、多核苷酸和蛋白质(例如变异体)的方法包含:DNA改组方法;基于基因的非同源重组的方法,例如ITCHY(参见Ostermeier等人,7:2139-44[1999])、SCRACHY(参见Lutz等人98:11248-53[2001])、SHIPREC(参见Sieber等人19:456-60[2001])和NRR(参见Bittkeretal,20:1024-9[2001];Bittkeretak,101:7011-6[2004]);以及依赖于使用寡核苷酸插入随机和靶向突变、缺失和/或插入的方法(参见Ness等人,20:1251-5[2002];Coco等人,20:1246-50[2002];Zha等人,4:34-9[2003];Glaser等人,149:3903-13[1992])。在一些实施例中,本公开的多核苷酸、多肽、蛋白质或酶可以通过在重组之前借助易错PCR、随机核苷酸插入或其它方法进行随机突变来改变。本公开的多核苷酸、多肽、蛋白质或酶可以通过DNA改组、基因改组、基序改组、外显子改组和/或密码子改组(统称为“DNA改组”)产生。DNA改组涉及通过同源或定点重组组装两个或超过两个DNA区段以产生聚核苷酸序列变化。DNA改组可以用于调节本公开的多核苷酸、多肽、蛋白质或酶的活性,这些方法可以用于产生活性有所变化的多肽。通常参见美国专利第5,605,793号、第5,811,238号、第5,830,721号、第5,834,252号、第5,837,458号和第6,444,468号;以及Patten等人,生物技术当前述评(Curr.Opinion Biotechnol.)8:724-33(1997);Harayama,生物技术趋势(Trends Biotechnol.)16(2):76-82(1998);Hansson等人,分子生物学杂志(J.Mol.Biol.)287:265-76(1999);以及Lorenzo和Blasco,生物技术(Biotechniques)24(2):308-13(1998)。本公开的多核苷酸、多肽、蛋白质或酶可以含有本公开的多核苷酸、多肽、蛋白质或酶的一或多个组分、基序、区段、部分、结构域、片段等。在一些实施例中,可以使用用于突变PCR的试剂盒,例如Diversify PCR随机突变试剂盒(Clontech)或GeneMorph随机突变试剂盒(Stratagene)。
在一些实施例中,变异蛋白与亲本蛋白或经过修饰的酶与野生型或未修饰的酶彼此之间有少数氨基酸残基不同。不同的氨基酸残基的数目可以是一个或多个,优选约1、2、3、4、5、10、15、20、30、40、50、60、70、80、90、100或更多个氨基酸残基。在一些实施例中,变异体之间不同的氨基酸的数目介于约1与约10之间。在一些实施例中,相关蛋白和尤其变异蛋白包括至少约35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%的氨基酸序列一致性。另外,如本文所用的相关蛋白或变异蛋白是指显著区域数目不同于另一相关蛋白或亲本蛋白的蛋白质。举例来说,在一些实施例中,变异蛋白具有不同于亲本蛋白的约1、2、3、4、5、6、7、8、9或10个对应显著区域。
在一些实施例中,筛选方法可以包含常规筛选方法,例如液相分析或基于微量滴定板的分析。用于液相分析的型式通常为机器人操控的96孔、384孔或1536孔微量滴定板。其它筛选方法包含生长选择(Snustad等人,1988;Lundberg等人,1993;Yano等人,1998)、细菌菌落或噬菌斑的比色筛选(Kuritz,1999)、体外表达克隆(King等人,1997)和细胞表面或噬菌体呈现(Benhar,2001)。在一些实施例中,筛选方法可以是选自以下的方法:酵母双杂交(yeast-2-hybrid)、n杂交(n-hybrid)、反向双杂交(reverse-2-hybrid)、反向n杂交(reverse-n-hybrid)、分裂双杂交(split two hybrid)、细菌呈现、噬菌体呈现、逆转录病毒呈现、核糖体呈现、共价呈现、体外呈现或任何其它呈现方法。在一些实施例中,使用噬菌体呈现方法筛选文库。
来源于模板跳转的序列的分析:可以将对应于模板跳转产物的条带从聚丙烯酰胺凝胶切离,用乙酸钠(例如0.3M乙酸钠,pH 5.2)、SDS(例如0.03%)在室温下洗脱几个小时,进行酚/氯仿提取和乙醇沉淀。已分离的cDNA随后可以用作使用一个或多个引物进行PCR扩增的模板。接着可以将PCR产物直接克隆到载体中(Burke等人,“R4:对线虫的大亚单位rRNA基因具有特异性的非LTR逆转录转座子(R4,a non-LTR Retrotransposon Specific tothe Large Subunit rRNA Gene of Nematodes)”,核酸研究(Nucleic Acids Res.)23:4628-4634(1995)),对各个克隆体进行测序。
试剂盒
试剂盒中可以包括本文所描述的任何组合物。在非限制性实例中,适合容器中的试剂盒包括一个或多个引物。试剂盒还可以包括计算机可读介质,例如非暂时性计算机可读介质。试剂盒还可以包括用于引物延伸和扩增的反应组分(例如dNTP、聚合酶、缓冲液)。试剂盒可以包含用于文库形成的试剂(例如引物(探针)、dNTP、聚合酶和酶)。试剂盒还可以包括用于纯化的方法,例如珠粒悬浮液。试剂盒可以包含用于测序的试剂,例如带荧光标记的dNTP、测序引物等。
在一些实施例中,试剂盒的一些组分可以包装成含水介质或冻干形式。试剂盒的容器可以包含至少一个小瓶、试管、烧瓶、瓶子、针筒或其它容器,组分可以放在其中并适当地等分。在试剂盒中存在超过一个组分的情况下,试剂盒还可以含有可以分开放置其它组分的第二、第三或其它额外的容器。容器中可以包括组分的各种组合。在一些实施例中,小瓶中可以包括组分的各种组合。本公开的试剂盒还可以含有用于商业销售的受严格限制的组分。这些容器可以包含注塑成型或吹塑成型塑料容器,其中可以固持所需小瓶。
当试剂盒的组分提供于一或多种液体溶液中时,液体溶液可以是水溶液。试剂盒的组分可以按干燥粉末形式提供。当试剂和/或组分以干粉形式提供时,可以通过添加适合的溶剂使粉末复水。
试剂盒可以包含使用试剂盒组分以及使用试剂盒中未包含的任何其它试剂的说明书。说明书可以包含可以执行的变化。
在一些实施例中,试剂和材料包含用于扩增所需序列的引物、核苷酸、适合缓冲液或缓冲剂、盐等,且在一些情况下,试剂包含用于分离特定所需细胞的装置或试剂。在一些实施例中,试剂盒中存在适合于从个体提取一个或多个样本的一个或多个装置。装置可以是针筒、细针、解剖刀等。
在一些实施例中,试剂盒可以用于由模板(例如RNA模板)制备cDNA。这种试剂盒可以包含承载器件,其被分区以便容纳一个或多个容器,例如小瓶、试管等等,每个容器包含用于由RNA制备cDNA的一个单独元件。举例来说,可以提供第一容器,其内容物包含呈液体溶液、粉末形式或冻干形式的逆转录酶(例如非逆转录病毒逆转录酶、非LTR逆转录转座子、R2逆转录酶)或其变异体。此外,可以提供任何数目的其它容器,其内容物独立地包含适合缓冲液、单独地或共同地呈适合溶液形式的用于核苷酸合成的底物(例如脱氧核苷酸三磷酸(例如dATP、dCTP、dGTP和dTTP))、模板(例如模板RNA)、一个或多个引物和受体核酸分子(例如受体RNA)以及视情况存在的末端转移酶溶液。在一些实施例中,试剂盒可以包括:片段或已降解核酸、DNA、RNA或其组合;一个或多个引物;受体核酸分子(例如包括经过修饰的核苷酸的受体核酸分子);逆转录酶(例如非逆转录病毒逆转录酶、非LTR逆转录转座子、R2逆转录酶)或其变异体;适合缓冲液;用于核苷酸合成的底物,例如脱氧核苷酸三磷酸(例如dATP、dCTP、dGTP和dTTP)。可以提供上述组分的任何组合。试剂盒可以不包括任何上述组分。在一些实施例中,一个或多个引物可以是一个或多个随机引物。在一些实施例中,可以单独地封装任何组分。
靶分子
在一些情况下,分子是DNA、RNA或DNA-RNA杂交体。分子可以是单链或双链的。在一些实施例中,分子是RNA分子,例如mRNA、rRNA、tRNA、ncRNA、lncRNA、siRNA、微小RNA或miRNA。RNA分子可以聚腺苷酸化。或者,mRNA分子没有聚腺苷酸化。或者,分子是DNA分子。DNA分子可以是基因组DNA。DNA分子可以包括外显子、内含子、非转译区或其任何组合。在一些实施例中,分子是一组分子。
在一些实施例中,分子是片段或已降解分子。在一些实施例中,片段或已降解分子是片段DNA、已降解DNA、片段RNA、已降解RNA或其组合。在一些实施例中,分子是模板核酸(例如模板DNA、RNA或其组合)。在一些实施例中,分子是核酸。在一些实施例中,分子的总量是约1飞摩尔(fM)到约100微摩尔、约40飞摩尔到约0.01微摩尔、约50飞摩尔到约500飞摩尔、约50飞摩尔到约0.01微摩尔、约50飞摩尔到约0.1微摩尔、约50飞摩尔到约500皮摩尔、约50飞摩尔到约500纳摩尔、约50飞摩尔到约500微摩尔、约50飞摩尔到约1皮摩尔、约40飞摩尔到约1纳摩尔、约1飞摩尔到约1皮摩尔、约0.1nM到约100nM。在一些实施例中,分子的总量等于或低于约1000微摩尔、等于或低于约500微摩尔、等于或低于约250微摩尔、等于或低于约100微摩尔、等于或低于约50微摩尔、等于或低于约25微摩尔、等于或低于约10微摩尔、等于或低于约1微摩尔、等于或低于约0.1微摩尔、等于或低于约0.01微摩尔、等于或低于约0.001微摩尔、等于或低于约0.0001微摩尔、等于或低于约2000纳摩尔、等于或低于约500纳摩尔、等于或低于约250纳摩尔、等于或低于约200纳摩尔、等于或低于约50纳摩尔、等于或低于约25纳摩尔、等于或低于约20纳摩尔、等于或低于约2纳摩尔、等于或低于约0.2纳摩尔、等于或低于约0.01纳摩尔、等于或低于约0.001纳摩尔、等于或低于约0.0001纳摩尔、等于或低于约3000皮摩尔、等于或低于约500皮摩尔、等于或低于约250皮摩尔、等于或低于约300皮摩尔、等于或低于约50皮摩尔、等于或低于约25皮摩尔、等于或低于约30皮摩尔、等于或低于约3皮摩尔、等于或低于约0.3皮摩尔、等于或低于约0.01皮摩尔、等于或低于约0.001皮摩尔、等于或低于约0.0001皮摩尔、等于或低于约5000飞摩尔、等于或低于约500飞摩尔、等于或低于约250飞摩尔、等于或低于约50飞摩尔、等于或低于约25飞摩尔、等于或低于约10飞摩尔、等于或低于约1飞摩尔、等于或低于约0.1飞摩尔、等于或低于约0.01飞摩尔、等于或低于约0.001飞摩尔、等于或低于约0.0001飞摩尔。
本文公开的方法和试剂盒可以用来随机地标记一致或接近一致的分子和/或不同分子的每次出现。在一些情况下,本文公开的方法和试剂盒可以用来随机地标记一致或接近一致的分子(例如包括一致或接近一致的序列的分子)。举例来说,要标记的分子包括至少约80%、85%、90%、95%、96%、97%、98%、99%或100%的序列一致性。接近一致的分子可能相差小于约100、90、80、70、60、50、40、30、25、20、25、10、9、8、7、6、5、4、3、2或1个核苷酸或碱基对。多个样本中的一个或多个样本中的多个核酸可以包括两个或超过两个一致的序列。多个样本中的一个或多个中的全部核酸的至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或100%可以包括相同序列。多个样本中的一个或多个样本中的多个核酸可以包括至少两个不同的序列。多个样本中的一个或多个中的全部核酸的至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%可以包括至少两个不同的序列。在一些情况下,要标记的分子是彼此的变异体。在一些实施例中,要标记的分子是片段或已降解核酸(例如DNA或RNA)。在一些实施例中,要标记的分子是未知的。在一些实施例中,要标记的分子在飞摩尔范围、纳摩尔范围、微摩尔范围或毫摩尔范围内。在一些实施例中,要标记的分子可以含有单核苷酸多态型或其它类型的突变。在一些实施例中,要标记的分子是剪接变异体。在一些实施例中,至少一个分子随机地被标记。在一些实施例中,至少约2、3、4、5、6、7、8、9或10个一致或接近一致的分子随机地被标记。在一些实施例中,至少约20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000个一致或接近一致的分子随机地被标记。在一些实施例中,至少1500、2,000、2500、3,000、3500、4,000、4500、5,000、6,000、7,000、8,000、9,000或10000个一致或接近一致的分子随机地被标记。在一些实施例中,至少15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000或100,000个一致或接近一致的分子随机地被标记。在一些实施例中,检测到一个或多个分子。在一些实施例中,对一个或多个分子进行测序。在一些实施例中,对以飞摩尔范围存在的一个或多个未知分子进行扩增(例如通过PCR)和/或标记和/或检测和/或测序。在一些实施例中,该一个或多个未知分子指示疾病。在一些实施例中,以飞摩尔范围存在的该一个或多个未知分子指示疾病。在一些实施例中,疾病是癌症或肿瘤。
在一些实施例中,本文公开的方法和试剂盒可以用来随机地标记不同分子。举例来说,要标记的分子包括小于约75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%、5%、4%、3%、2%、1%的序列一致性。不同分子可相差至少约1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100或更多个核苷酸或碱基对。在一些情况下,至少一个分子随机地被标记。在一些实施例中,至少2、3、4、5、6、7、8、9或10个不同分子随机地被标记。在一些实施例中,至少约20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000个不同分子随机地被标记。在一些实施例中,至少约1500、2000、2500、3000、3500、4000、4500、5000、6000、7000、8000、9000或10000个不同分子随机地被标记。在一些实施例中,至少15000、20000、25000、30000、35000、40000、45000、50000、60000、70000、80000、90000或100000个不同分子随机地被标记。在一些实施例中,对分子进行测序。
在一些实施例中,要标记的不同分子可能以不同浓度或量存在于样本中。举例来说,一个分子的浓度或量可以大于样本中另一个分子的浓度或量。在一些实施例中,样本中的至少一个分子的浓度或量比样本中至少一种其它分子的浓度或量高至少约1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90或100倍或更多倍。在一些实施例中,样本中的至少一个分子的浓度或量比样本中至少一种其它分子的浓度或量高至少约1000倍或更多倍。在一些实施例中,一个分子的浓度或量小于样本中另一个分子的浓度或量。在一些实施例中,样本中至少一个分子的浓度或量可能比样本中至少一种其它分子的浓度或量低至少约1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90或100倍或更多倍。在一些实施例中,样本中的至少一个分子的浓度或量可能比样本中至少一种其它分子的浓度或量低至少约1000倍或更多倍。
在一些实施例中,要标记的分子在一个或多个样本中。要标记的分子可以在两个或超过两个样本中。两个或超过两个样本可以含有不同量或浓度的要标记的分子。在一些实施例中,一个样本中的一个分子的浓度或量可以大于不同样本中相同分子的浓度或量。在一些实施例中,相比尿液样本,血液样本可能含有更高量的特定分子。在一些实施例中,将单个样本分成两个或超过两个子样本。子样本可以含有不同量或浓度的相同分子。一个样本中的至少一个分子的浓度或量可能比另一样本中相同分子的浓度或量高至少约1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90或100倍或更多倍。在一些实施例中,一个样本中的一种分子的浓度或量可以小于不同样本中相同分子的浓度或量。举例来说,相比肺组织样本,皮肤组织样本可能含有更高量的特定分子。一个样本中的至少一个分子的浓度或量可能比另一样本中相同分子的浓度或量低至少约1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90或100倍或更多倍。
在一些实施例中,本文公开的方法和试剂盒可以用于分析两个或超过两个样本的一个或多个分子。一个或多个分子可以包括一种或多种多肽。方法可以包括确定一种或多种带标记的多肽的一致性。确定一种或多种带标记的多肽的一致性可以包括质谱法。方法可以进一步包括合并第一样本的带标记的多肽与第二样本的带标记的多肽。可以在确定不同带标记的多肽的数目之前合并带标记的多肽。方法可以进一步包括合并带第一样本标签的多肽与带第二样本标签的多肽。可以在接触多个分子识别标记物之前合并带第一样本标签的多肽和带第二样本标签的多肽。确定不同带标记的多肽的数目可以包括检测带标记的多肽的至少一部分。检测带标记的多肽的至少一部分可以包括检测样本标签、分子识别标记多肽或其组合的至少一部分。在一些实施例中,可检测标签包括L-DNA聚核苷酸序列。
测序
在一些实施例中,确定不同带标记的核酸的数目可以包括确定带标记的核酸或其任何产物(例如带标记的扩增子、带标记的cDNA分子)的序列。在一些实施例中,可以对扩增的靶核酸进行测序。确定带标记的核酸或其任何产物的序列可以包括进行测序反应以确定样本标签的至少一部分、分子识别标记、带标记的核酸的至少一部分、其补体、其反向补体或其任何组合的序列。在一些实施例中,仅对样本标签或样本标签的一部分进行测序。在一些实施例中,仅对分子识别标记或分子识别标记的一部分进行测序。
可以通过如下测序方法确定带标记的核酸或其任何产物的序列:例如Helioscope(注册商标)单分子测序、纳米孔DNA测序、Lynx Therapeutics公司的大规模平行签名测序(MPSS)、454焦磷酸测序、单分子实时(RNAP)测序、Illumina(Solexa)测序、SOLiD测序、IonTorrent、离子半导体测序、单分子SMRT(注册商标)测序、聚合酶克隆测序(Polonysequencing)、DNA纳米球测序和VisiGen生物科技公司的方法。或者,确定带标记的核酸或其任何产物的序列可以使用测序平台,包含但不限于Illumina提供的Genome AnalyzerIIx、HiSeq和MiSeq;单分子实时(SMRT(注册商标))技术,例如Pacific生物科学公司(加利福尼亚)提供的PacBio RS系统,和Solexa测序仪;准确单分子测序(True Single MoleculeSequencing;tSMS(注册商标))技术,例如Helicos公司提供的HeliScope(注册商标)测序仪(马萨诸塞州剑桥市)。在一些实施例中,可以在固体或半固体支撑物上、在凝胶中、在乳液中、在表面上、在珠粒上、在液滴中、在连续跟踪中、在稀释液中或在一个或多个物理上分离的体积中发生测序反应。
测序可以包括对带标记的核酸的至少约10、20、30、40、50、60、70、80、90、100或更多个核苷酸或碱基对进行测序。在一些实施例中,测序包括对带标记的核酸的至少约200、300、400、500、600、700、800、900、1000或更多个核苷酸或碱基对进行测序。在其它实施例中,测序包括对带标记的核酸的至少约1500、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000或10,000或更多个核苷酸或碱基对进行测序。
测序可以包括每次运行至少约200、300、400、500、600、700、800、900、1000或更多个测序读长。在一些情况下,测序包括每次运行对至少约1500、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000或10,000或更多个测序读长进行测序。测序可以包括每次运行小于或等于约1,600,000,000个测序读长。测序可以包括每次运行小于或等于约200,000,000个读长。
细胞
本公开中所描述的细胞可以是来自动物(例如人类、大鼠、猪、马、奶牛、狗、小鼠)的细胞。在一些情况下,细胞是人类细胞。细胞可以是人胎细胞。人胎细胞可以从怀有胎儿的母体获得。细胞可以是来自怀孕母体的细胞。细胞可以是来自脊椎动物、无脊椎动物、真菌、古细菌或细菌的细胞。细胞可以来自多细胞组织(例如器官(例如大脑、肝脏、肺、肾脏、前列腺、卵巢、脾脏、淋巴结、甲状腺、胰脏、心脏、骨骼肌、肠、喉、食道和胃)、囊胚)。细胞可以是来自细胞培养物的细胞。细胞可以是海拉细胞、K562细胞、Ramos细胞、杂交瘤、干细胞、未分化细胞、分化细胞、循环细胞、CHO细胞、3T3细胞等等。
可以用于本公开方法的循环病变细胞包含可能受疾病或病况影响或被感染因子感染的所有类型的循环细胞。循环细胞是指体液中存在的细胞。循环细胞可能不一定在整个身体或循环系统中循环。举例来说,循环细胞可以存在于局部,例如滑液或脑脊髓液或淋巴液中。循环疾病细胞还可以脱离已受疾病或病况影响或被感染因子感染的组织或器官。在其它实施例中,循环病变细胞可以是不同类型的循环病变细胞的混合物。
在一些实施例中,细胞是癌细胞。癌细胞的非限制性实例可以包含前列腺癌细胞、乳腺癌细胞、结肠癌细胞、肺癌细胞、脑癌细胞和卵巢癌细胞。在一些实施例中,细胞来自癌症(例如循环肿瘤细胞)。癌症的非限制性实例可以包含腺瘤、腺癌、鳞状细胞癌、基底细胞癌、小细胞癌、大细胞未分化癌、软骨肉瘤和纤维肉瘤。
在一些实施例中,细胞是罕见细胞。罕见细胞可以是循环肿瘤细胞(CTC)、循环上皮细胞(CEC)、循环干细胞(CSC)、干细胞、未分化干细胞、癌症干细胞、骨髓细胞、祖细胞、泡沫细胞、胎儿细胞、间叶细胞、循环内皮细胞、循环子宫内膜细胞、滋养细胞免疫系统细胞(宿主或移植细胞)、结缔组织细胞、细菌、真菌或病原体(例如,细菌或原生动物)、微粒、细胞片段、蛋白质和核酸、细胞器、其它细胞组分(例如,线粒体和核)以及病毒。
在一些实施例中,细胞来自肿瘤。在一些实施例中,肿瘤是良性的或恶性的。肿瘤细胞可以包括转移细胞。在一些实施例中,细胞来自包括多个不同细胞类型(例如不同基因型)的固体组织。
样本
在一些实施例中,包含模板核酸(例如DNA和/或RNA)的样本可能以足以产生产物的量合并成反应混合物。在一些实施例中,将样本合并成反应混合物,使得反应混合物中DNA和/或RNA的最终浓度是约1fg/μL到约10μg/μL、约1μg/μL到约5μg/μL、约0.001μg/μL到约2.5μg/μL、约0.005μg/μL到约1μg/μL、约0.01μg/μL到约0.5μg/μL、约0.1μg/μL到约0.25μg/μL。在一些实施例中,从单个细胞分离包含模板的样本。在一些实施例中,从约2、3、4、5、6、7、8、9、10、20、50、100、500或更多个细胞分离包含模板的样本。
在一些实施例中,模板是DNA、RNA或DNA和RNA的组合。在一些实施例中,模板是片段或已降解DNA、片段或已降解RNA,或片段或已降解DNA和片段或已降解RNA的组合。在一些实施例中,模板总量是样本中的模板总量。在一些实施例中,模板总量是反应混合物中的模板总量。在一些实施例中,模板总量是一个锅或单个容器中的模板总量。在一些实施例中,模板总量是一个锅或单个容器反应中的模板总量。在一些实施例中,模板总量为约1飞摩尔(fM)到约100微摩尔、约0.0001微摩尔到约0.01微摩尔、约0.0001微摩尔到约0.1微摩尔、约40飞摩尔到约0.01微摩尔、约50飞摩尔到约500飞摩尔、约50飞摩尔到约0.01微摩尔、约50飞摩尔到约0.1微摩尔、约50飞摩尔到约500皮摩尔、约50飞摩尔到约500纳摩尔、约50飞摩尔到约500微摩尔、约50飞摩尔到约1皮摩尔、约40飞摩尔到约1纳摩尔、约1飞摩尔到约1皮摩尔。在一些实施例中,模板总量等于或至少约为或低于约1000微摩尔、等于或至少约为或低于约500微摩尔、等于或至少约为或低于约250微摩尔、等于或至少约为或低于约100微摩尔、等于或至少约为或低于约50微摩尔、等于或至少约为或低于约25微摩尔、等于或至少约为或低于约10微摩尔、等于或至少约为或低于约1微摩尔、等于或至少约为或低于约0.1微摩尔、等于或至少约为或低于约0.01微摩尔、等于或至少约为或低于约0.001微摩尔、等于或至少约为或低于约0.0001微摩尔、等于或至少约为或低于约2000纳摩尔、等于或至少约为或低于约500纳摩尔、等于或至少约为或低于约250纳摩尔、等于或至少约为或低于约200纳摩尔、等于或至少约为或低于约50纳摩尔、等于或至少约为或低于约25纳摩尔、等于或至少约为或低于约20纳摩尔、等于或至少约为或低于约2纳摩尔、等于或至少约为或低于约0.2纳摩尔、等于或至少约为或低于约0.01纳摩尔、等于或至少约为或低于约0.001纳摩尔、等于或至少约为或低于约0.0001纳摩尔、等于或至少约为或低于约3000皮摩尔、等于或至少约为或低于约500皮摩尔、等于或至少约为或低于约250皮摩尔、等于或至少约为或低于约300皮摩尔、等于或至少约为或低于约50皮摩尔、等于或至少约为或低于约25皮摩尔、等于或至少约为或低于约30皮摩尔、等于或至少约为或低于约3皮摩尔、等于或至少约为或低于约0.3皮摩尔、等于或至少约为或低于约0.01皮摩尔、等于或至少约为或低于约0.001皮摩尔、等于或至少约为或低于约0.0001皮摩尔、等于或至少约为或低于约5000飞摩尔、等于或至少约为或低于约500飞摩尔、等于或至少约为或低于约250飞摩尔、等于或至少约为或低于约50飞摩尔、等于或至少约为或低于约25飞摩尔、等于或至少约为或低于约10飞摩尔、等于或至少约为或低于约1飞摩尔、等于或至少约为或低于约0.1飞摩尔、等于或至少约为或低于约0.01飞摩尔、等于或至少约为或低于约0.001飞摩尔、等于或至少约为或低于约0.0001飞摩尔。
在一些实施例中,样本可以从获自受试者的生物样本获得。在一些实施例中,样本包括循环肿瘤DNA样本和/或组织样本。在一些实施例中,生物样本包括游离生物样本。在一些实施例中,生物样本包括循环肿瘤DNA样本。在一些实施例中,生物样本包括活检样本。在一些实施例中,生物样本包括组织样本。在一些实施例中,生物样本包括液体活检样本。在一些实施例中,生物样本包括游离DNA。在一些实施例中,生物样本可以是固体生物样本,例如肿瘤样本。在一些实施例中,来自受试者的样本可以包括至少约1%、至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约100%来自肿瘤的肿瘤细胞或核酸。固体生物样本可以通过在福尔马林溶液中固定、接着包埋于石蜡中来处理(例如FFPE样本)。固体生物样本可以通过冷冻处理。或者,可以既不固定也不冷冻生物样本。未固定、未冷冻的样本可以存储在配置成用于保存核酸的溶液中。可以视情况对固体生物样本进行均匀化、声波处理、弗氏压制(Frenchpress)、杜恩斯处理(dounce)、冷冻/解冻,之后可以离心。
在一些实施例中,样本可以是液体生物样本。在一些实施例中,液体生物样本可以是血液样本(例如全血、血浆或血清)。可以通过使用菲科尔试剂(Ficoll reagent)对全血样本进行细胞组分(例如血浆、血清)和细胞组分的分离。在一些实施例中,液体生物样本可以是尿液样本。在一些实施例中,液体生物样本可以是外淋巴液样本。在一些实施例中,液体生物样本可以是粪便样本。在一些实施例中,液体生物样本可以是唾液。在一些实施例中,液体生物样本可以是精液。在一些实施例中,液体生物样本可以是羊水。在一些实施例中,液体生物样本可以是脑脊髓液。在一些实施例中,液体生物样本可以是胆汁。在一些实施例中,液体生物样本可以是汗液。在一些实施例中,液体生物样本可以是泪液。在一些实施例中,液体生物样本可以是痰液。在一些实施例中,液体生物样本可以是滑液。在一些实施例中,液体生物样本可以是呕吐物。在一些实施例中,液体生物样本可以是游离样本。在一些特定实施例中,游离样本可以是游离血浆样本。
样本中的多核苷酸(可以称为输入核酸或输入)可以包括DNA。输入核酸可以是复合DNA,例如双链DNA、基因组DNA或来自超过一个生物体的混合核酸。样本中的多核苷酸可以包括RNA。可以获得并纯化RNA。RNA可以包含经过纯化或未经纯化形式的RNA,其包含但不限于mRNA、tRNA、snRNA、rRNA、逆转录病毒、小非编码RNA、微小RNA、多聚核糖体RNA、mRNA前体、内含子RNA、病毒RNA、游离RNA和其片段。非编码RNA或ncRNA可以包含snoRNA、微小RNA、siRNA、piRNA和长ncRNA。样本中的多核苷酸可以包括cDNA。cDNA可以由RNA(例如mRNA)产生。cDNA可以是单链或双链的。输入DNA可以是线粒体DNA。输入DNA可以是游离DNA。游离DNA可以从例如血清或血浆样本获得。输入DNA可以来自超过一个个体或生物体。输入DNA可以是双链或单链的。
在一些实施例中,可以在某一时间段内收集样本。可以在规律的时间间隔内收集或可以在不规律时间间隔内间歇性地收集样本。可以比较来自不同样本的核酸,例如以监测病况或疾病的进展或复发。
在一些情况下,样本可以通过收集核芯活检(core biopsy)。在一些实施例中,样本可能以经过纯化的核酸的形式收集。这些经过纯化的样本的实例可以包含作为示范性实例的附着到过滤纸的沉淀核酸、酚-氯仿提取物、通过试剂盒纯化(例如Quigen Miniprep(注册商标)等等)纯化的核酸或经过凝胶纯化的核酸。
本公开的样本可以是来自动物(例如人类、大鼠、猪、马、奶牛、狗、小鼠)的样本。在一些情况下,样本是人类样本。样本可以是人胎样本。样本可以来自多细胞组织(例如器官(例如大脑、肝脏、肺、肾脏、前列腺、卵巢、脾脏、淋巴结、甲状腺、胰脏、心脏、骨骼肌、肠、喉、食道和胃)、囊胚)。样本可以是来自细胞培养物的细胞。
样本可以包括多个细胞。样本可以包括多个相同类型的细胞。样本可以包括多个不同类型的细胞。样本可以包括处于细胞周期和/或分化路径中相同点的多个细胞。样本可以包括处于细胞周期和/或分化路径中不同点的多个细胞。样本可以包括多个样本。
多个样本可以包括至少5、10、20、30、40、50、60、70、80、90或100或更多个样本。多个样本可以包括至少约100、200、300、400、500、600、700、800、900或1000或更多个样本。多个样本可以包括至少约1000、2000、3000、4000、5000、6000、7000、8000个样本、9000或10,000个样本,或100,000个样本,或1,000,000或更多个样本。多个样本可以包括至少约10,000个样本。
第一样本中的一个或多个核酸可以不同于第二样本中的一个或多个核酸。第一样本中的一个或多个核酸可以不同于多个样本中的一个或多个核酸。一个或多个核酸可以包括至少约1个核苷酸、2个核苷酸、5个核苷酸、10个核苷酸、20个核苷酸、50个核苷酸、100个核苷酸、200个核苷酸、300个核苷酸、500个核苷酸、1000个核苷酸、2000个核苷酸、3000个核苷酸、4000个核苷酸、5000个核苷酸、10,000个核苷酸、100,000个核苷酸、1,000,000个核苷酸的长度。
第一样本可以包括一个或多个细胞,且第二样本可以包括一个或多个细胞。第一样本的一个或多个细胞可以具有与第二样本的一个或多个细胞相同的细胞类型。第一样本的一个或多个细胞可以具有与多个样本的一个或多个不同细胞不同的细胞类型。细胞类型可以是软骨细胞、破骨细胞、脂肪细胞、成肌细胞、干细胞、内皮细胞或平滑肌细胞。细胞类型可以是免疫细胞类型。免疫细胞类型可以是T细胞、B细胞、凝血细胞、树突细胞、中性粒细胞、巨噬细胞或单核细胞。
多个样本可以包括一个或多个恶性细胞。一个或多个恶性细胞可以来源于肿瘤、肉瘤或白血病。
多个样本可以包括至少一种体液。体液可以包括血液、尿液、淋巴液、唾液。多个样本可以包括至少一个血液样本。
多个样本可以包括来自一个或多个生物组织的至少一个细胞。一个或多个生物组织可以是骨、心脏、胸腺、动脉、血管、肺、肌肉、胃、肠、肝脏胰脏、脾脏、肾脏、胆囊、甲状腺、肾上腺乳腺、卵巢、前列腺、睾丸、皮肤、脂肪、眼睛或大脑。
生物组织可以包括被感染组织、病变组织、恶性组织、钙化组织或健康组织。
多个样本可以来自一个或多个来源。多个样本可以来自两个或超过两个来源。多个样本可以来自一个或多个受试者。多个样本可以来自两个或超过两个受试者。多个样本可以来自同一个受试者。一个或多个受试者可以来自相同物种。一个或多个受试者可以来自不同物种。一个或多个受试者可以是健康的。一个或多个受试者可以受疾病、病症或病况影响。多个样本可以包括选自哺乳动物、细菌、病毒、真菌或植物的来源的细胞。一个或多个样本可以来自人类、马、奶牛、鸡、猪、大鼠、小鼠、猴、兔、豚鼠、绵羊、山羊、狗、猫、鸟、鱼、蛙和果蝇。
在一些实施例中,多个样本可以并行获得。多个样本可以同时获得。多个样本可以依序获得。多个样本可以在多年内,即获得一个或多个不同样本的100年、10年、5年、4年、3年、2年或1年内获得。一个或多个样本可以在获得一个或多个不同样本的约一年内获得。一个或多个样本可以在获得一个或多个不同样本的12个月、11个月、10个月、9个月、8个月、7个月、6个月、4个月、3个月、2个月或1个月内获得。一个或多个样本可以在获得一个或多个不同样本的30天、28天、26天、24天、21天、20天、18天、17天、16天、15天、14天、13天、12天、11天、10天、9天、8天、7天、6天、5天、4天、3天、2天或一天内获得。一个或多个样本可以在获得一个或多个不同样本的约24小时、22小时、20小时、18小时、16小时、14小时、12小时、10小时、8小时、6小时、4小时、2小时或1小时内获得。一个或多个样本可以在获得一个或多个不同样本的约60秒、45秒、30秒、20秒、10秒、5秒、2秒或1秒内获得。一个或多个样本可以在获得一个或多个不同样本的小于一秒内获得。
在一些实施例中,本公开提供用于对受试者的疾病或病况的状态或后果进行诊断、监测和/或预后的方法、试剂盒和组合物。通常,方法包括:(a)标记来自一个或多个样本的一个或多个分子(例如片段化或已降解核酸,DNA或RNA)以产生一个或多个带标记的核酸;(b)扩增一个或多个带标记的核酸;(c)对一个或多个带标记的核酸进行检测和/或定量;以及(d)基于一个或多个带标记的核酸的检测和/或定量对受试者的疾病或病况的状态或后果进行诊断、监测和/或预后。在一些实施例中,一个或多个带标记的核酸指示疾病,例如癌症。在一些实施例中,一个或多个带标记的核酸以飞摩尔范围存在。方法可以进一步包括确定治疗方案。样本中的一者或多者可以包括来自患有疾病或病况的受试者的一个或多个样本。一个或多个样本可以包括来自健康受试者的一个或多个样本。一个或多个样本可以包括来自对照物的一个或多个样本。
监测疾病或病况可以进一步包括监测治疗方案。监测治疗方案可以包括确定治疗方案的功效。在一些情况下,监测治疗方案包括施用、终止、添加或改变治疗方案。改变治疗方案可以包括增加或降低治疗方案的剂量、给药频率或施用模式。治疗方案可以包括一种或多种治疗药物。治疗药物可以是抗癌药物、抗病毒药物、抗细菌药物、抗病原药物或其任何组合。在一些实施例中,靶序列的扩增可以包括生物体的基因组的至少一部分。在一些实施例中,可以扩增和/或分析生物体的基因组的至少约0.01%、约0.02%、约0.03%、约0.04%、约0.05%、约0.06%、约0.07%、约0.08%、约0.09%、约0.1%、约0.2%、约0.3%、约0.4%、约0.5%、约0.6%、约0.7%、约0.8%、约0.9%、约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、约19%、约20%、约21%、约22%、约23%、约24%、约25%、约26%、约27%、约28%、约29%、约30%、约31%、约32%、约33%、约34%、约35%、约36%、约37%、约38%、约39%、约40%、约41%、约42%、约43%、约44%、约45%、约46%、约47%、约48%、约49%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%、约96%、约97%、约98%、约99%或约100%。
在一些实施例中,靶序列的扩增可以包括生物体的转录组的至少一部分。在一些实施例中,可以扩增和分析生物体的转录组的至少约0.01%、约0.02%、约0.03%、约0.04%、约0.05%、约0.06%、约0.07%、约0.08%、约0.09%、约0.1%、约0.2%、约0.3%、约0.4%、约0.5%、约0.6%、约0.7%、约0.8%、约0.9%、约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、约19%、约20%、约21%、约22%、约23%、约24%、约25%、约26%、约27%、约28%、约29%、约30%、约31%、约32%、约33%、约34%、约35%、约36%、约37%、约38%、约39%、约40%、约41%、约42%、约43%、约44%、约45%、约46%、约47%、约48%、约49%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%、约96%、约97%、约98%、约99%或约100%。
在一些实施例中,改进酶性质的特性选自由以下组成的组:增加的稳定性(例如增加的热稳定性)、增加的比活性、增加的蛋白质表达、增加的持续合成能力、增加的链置换、增加的端到端模板跳转和增加的保真性。
实例
以下具体实例是说明性的和非限制性的。本文所描述的实例参考前述部分中描述的各种实施例并且提供对该等实施例的非限制性支持。
实例1:表达和纯化
小规模和中等规模:将关于经过修饰的R2非长末端重复序列(LTR)逆转录转座子或经过修饰的R2逆转录酶的表达载体pET-45b转型为大肠杆菌BL21(DE3)。下表3展示本公开的经过修饰的R2酶变异体的两个实例,P2和P8变异体。为了表达,将预培养物设置在含100μM羧苄青霉素(Corbenicillin)的2ml LB中并在室温下生长隔夜,保持约8到12小时。约8到12小时后,将200μL预培养物转移到25mL自诱导表达培养基Overnight Express TB(Novagen)中,并在室温下振荡培育36小时到48小时。通过在4-8℃下以8000xg离心10分钟来收集细胞。在-20℃将生物质离心块冷冻最少1小时。
表3
纯化:将离心块再悬浮于0.5mL裂解缓冲液(每1/6生物质为0.5mL裂解缓冲液)并在室温下培育30分钟。裂解缓冲液组合物:lxBugBuster,100mM磷酸钠,0.1%Tween,2.5mMTCEP,3μL蛋白酶抑制剂混合物(Roche),50μg溶菌酶,0.5μL DNasel(2,000U/ml,来自NEB)。培育后,将裂解物与相等体积(0.5mL)的His结合缓冲液(50mM磷酸钠pH 7.7,1.5M氯化钠,2.5mM TCEP,0.1%Tween,0.03%Triton X-100和10mM咪唑)混合并在室温下培育约10-15分钟。培育后,在约4℃到约8℃的温度下,以l0000xg离心裂解物约15分钟。接着根据制造商的流程将离心块与250μL His亲和凝胶(Zymo Research的His-Spin Protein Miniprep)混合。结合步骤之后,将His亲和凝胶用洗涤缓冲液(50mM磷酸钠pH 7.7,750mM氯化钠,0.1%Tween,0.03%Triton X-100,2.5mM TCEP和50mM咪唑)洗涤三次。将R2逆转录酶(RT)(例如经过修饰的酶)用150μL洗脱缓冲液(50mM磷酸钠pH 7.7,300mM氯化钠,2.5mM TCEP,0.1%Tween和250mM咪唑)洗脱并直接使用或冷冻于30%丙三醇中。这个流程可以进行调整以供用于突变的表达和纯化并用于筛选。举例来说,类似流程可以调整成培养板型式,例如可以使用2mL Overnight Express TB(Novagen)代替25mL,并且纯化步骤可以包括含镍固定树脂的96孔自旋培养板。
结果:纯化后,使用十二烷基硫酸钠聚丙烯酰胺凝胶电泳(SDS-PAGE)、4-12%聚丙烯酰胺、Bis-Tris分析样本(图10)。图10中的SDS-PAGE分析示出含有全长野生型R2和截短R2非LTR逆转录转座子的样本。结果展示,未观测到全长野生型R2的清晰产物,而存在截短R2非LTR逆转录转座子的较大表达水平。洗脱的样本展示利用IMAC进行His标签亲和纯化的截短R2非LTR逆转录转座子的高产率。图10泳道如下:M表示标记物,P表示离心块(不可溶),S表示上清液(可溶的),且E表示洗脱的样本(His标签亲和纯化R2)。
实例2:替代/诊断分析
逆转录酶(RT)活性分析的实例:分析可以用于比较突变体(例如经过修饰的酶)的酶活性、活性分数、稳定性(例如热稳定性)和稳固性。基于引物延伸分析通过使用各种模板/引物和酶浓度比较延伸DNA引物比非延伸DNA引物的分数来估计RT活性和活性分数。在添加或不添加DNA捕获剂(trap)的情况下进行延伸分析。实例流程:预先用各种浓度的R2RT(相对于模板/引物为0.1到4倍)将用带荧光标记的引物退火的0.2μM模板/引物在室温下培育20分钟。预先培育条件包含40mM Tris pH 7.5,200mM NaCl,5mM TCEP和0.1%Tween。延伸开始于添加MgCl2(5mM,最终)和dNTP(各25μM,最终)及视情况存在的DNA捕获剂(最终3μM的未标记DNA寡核苷酸双链体或肝素)。添加DNA捕获剂有助于估计RT活性分数。接着将反应物培育10分钟,并用EDTA(50mM,最终)或甲酰胺(50%,最终)停止。用15%PAGE-尿素分析反应产物。使用的模板序列的实例是rCrArG rUrCrA rGrUrC rArGrU rCrArG rUrCrA rGrUrGrCrCrA rArArU rGrCrC rUrCrG rUrCrA rUrC,且引物的模板序列的实例是/56-FAM/TGATGACGAGGCATTTGGC。
端到端模板跳转分析的实例:使用两个模板进行引物延伸分析,其中将一个模板退火到带荧光标记的引物(供体模板),且另一个模板不含引物(受体核酸)。实例流程:预先用各种浓度的R2RT(相对于模板/引物为0.1到4倍)将用带荧光标记的引物退火的0.1μM模板/引物(或者,可以用Syber Gold染色反应产物)在室温下培育20分钟。预先培育条件包含40mM Tris pH 7.5,200mM NaCl,5mM TCEP和0.1%Tween。延伸开始于添加MgCl2(5mM,最终)和dNTP(各50μM,最终)及各种浓度(范围在约0.01μM到约5μM内)的受体核酸。接着将反应物培育30分钟,并用EDTA(50mM,最终)或甲酰胺(50%,最终)停止。用15%PAGE-尿素分析反应产物。模板:基于PCR反应中利用两个引物产生的DNA模板来利用T7RNA聚合酶通过体外RNA合成产生模板,两个引物之一包含T7启动子序列(即,第一引物)。第二引物还用作供体模板/引物流程中的DNA引物。接着用15%PAGE-尿素分析反应产物。使用的材料的实例:用于利用T7引物CTGCAGTAATACGACTCACTATAGGATCCTCTAGAGTCGACCTGC进行PCR扩增的模板pUC18;供体引物GCCATTCGCCATTCAGGCTGC(用于供体RNA模板处的PCR扩增和引发);RNA模板(约190个核苷酸);受体核酸—G封阻PCR模板
ACGGCCAGTGAATTGTAATACGACTCACTATAGGGCGAATTGGGTACCGCCTCGAGGTCGACGGTATCGATAAGCTTGATATCGAATTCCTGCAGCGGATCCACTAGTTCTAGAGCGGCCGCCACCGCGGTGGAGCTCCAGCTTTTGTTCCCTTTAGTGAGGGTTAATTTCGAGCTTGGCGTAAT CATGGTCATAGCTGTTTCC;用于PCR扩增的两个引物(T7引物ACGGCCAGTGAATTGTAATACGAC和第二引物GGAAACAGCTATGACCATG)。
持续合成能力分析的实例:基于引物延伸和产物形成使用15%PAGE-尿素或1.2%琼脂糖凝胶或2%琼脂糖凝胶分析持续合成能力分析。利用光密度测定法分析产物长度分布。实例流程:预先用各种浓度的R2RT(相对于模板/引物为0.1到4倍)将用带荧光标记的引物退火的0.05-0.1μM模板/引物(或者,可以用Syber Gold染色反应产物)在室温下培育20分钟。预先培育条件:40mM Tris pH 7.5,200mM NaCl,5mM TCEP和0.1%Tween。延伸开始于添加MgCl2(5mM,最终)、dNTP(各50μM,最终)及视情况存在的DNA捕获剂(最终3μM的未标记DNA寡核苷酸双链体)。接着将反应物培育30分钟到1小时,并用EDTA(50mM,最终)或甲酰胺(50%,最终)停止。模板:基于PCR反应中利用两个引物产生的DNA模板来利用T7RNA聚合酶通过体外RNA合成产生模板,两个引物之一包含T7启动子序列。第二引物还用作供体模板/引物流程中的DNA引物。利用15%PAGE-尿素或1.2%琼脂糖凝胶或2%琼脂糖凝胶分析反应产物。材料包含:用于利用T7引物CTGCAGTAATACGACTCACTATAGGATCCTCTAGAGTCGACCTGC进行PCR扩增的模板pUC18,RT引物CAGGGTTATTGTCTCATGAGCG(用于供体RNA模板处的PCR扩增和引发);和RNA模板(约600个核苷酸)。
随机引发的实例:具有含衔接子的若干引物或含衔接子的随机引物的较长RNA模板;PCR扩增后进行产物分析以比较产物的长度分布(一个引物对模板的5'端具有特异性,且第二引物与衔接子序列互补)。
实例3:使用合成RNA的活性和模板跳转实验
经过修饰的R2酶展示活性和模板跳转性质(图11)。下表4中描述和图11中所示的实验展示,当反应缺乏酶时不存在活性(泳道2),当反应缺乏受体核酸时有延伸产物但无模板跳转(泳道3),模板跳转取决于受体核酸的浓度(泳道4和5)。泳道6展示尽管酶MMLV能够进行产物延伸,但未观测到明显产物(表4和图11)。简单来说,反应含有:0.25mM dNTP,R2缓冲液或MMLV缓冲液,0.4μM模板/引物,受体核酸(0到1μM),经过修饰的R2酶(0到0.023μg/μL)或MMLV(2U/μL)和H2O。将含有R2酶或R2缓冲液的反应物在30℃下培育1小时(泳道2到5)。将含有MMLV酶的反应物在42℃下培育1小时(泳道6)。使用15%PAGE-尿素凝胶分析产物。
表4
序列:
P173(RNA模板) CAGUCAGUCAGUCAGUCAGUGCCAAAUGCCUCGUCAUC
P174(带荧光标记的引物) /56-FAM/TGATGACGAGGCATTTGGC
P181(受体核酸) GTTAATAACGAAATGAGCAGCCrGrGrG
实例4:一锅(单容器)反应
这个实验设计成展示用于制备一锅(单容器)RNA文库的方法(表5)。这个实验在一锅(单容器)反应中成功地捕获200bp RNA分子。图3和图12A中展示工作流程的示意图。这个实验中使用的模板是使用T7体外转录流程产生的200碱基对合成RNA(供体模板)。对照物包含无酶对照物、无受体对照物、无受体与无供体含引物模板对照物和MMLV(表5)。用于这个实验中的其它对照物包含在PCR扩增期间仅使用一个引物(图12B,编号5和6)。
简单来说,R2酶反应(RT反应)包含H2O、R2缓冲液、0.25mM dNTP、0.025μM200bpRNA/引物(含引物的供体模板)、受体核酸(0.15μM)和0.023μg/μl R2酶(例如经过修饰的逆转录酶)(表5,图12C泳道4)。表5涉及其它反应的细节。接着将R2反应物在30℃下培育1小时,且将MMLV反应物在42℃下培育1小时。接着为反应物补充PCR试剂,包含扩增引物和热启动聚合酶(表6)。简单来说,为2.5μl RT反应物(即,来自表5的50μl反应物中的2.5μl)补充PCR扩增所需的组分。用于R2酶的PCR扩增反应包含H2O、SYBRFAST预混液、0.5μMP186引物和P170引物中的每一者和模板(例如2.5μl RT反应物)。PCR条件是在95℃下保持3分钟,并且在95℃下保持3秒和在62℃下保持20秒,进行30个循环。接着将反应物升温到68℃。在这个实验期间不需要纯化步骤(例如在PCR之前不纯化RT反应物)。在一些情况下,在PCR步骤期间将初始RT反应物(或R2反应物)稀释10倍,例如2.5μl RT反应物呈25μl总体积(参见表6)。在一些情况下,可以将10μl RT反应物和90μl PCR试剂添加到同一试管(因此为一锅或单容器反应)。图12B中的凝胶展示使用R2酶反应产生了正确尺寸的扩增子(泳道4)。其它泳道未展示扩增子形成(泳道1:梯级;泳道2:无酶对照物;泳道3:MMLV对照物;泳道5:无受体对照物;泳道6:无供体对照物;以及泳道7:梯级)。
表5
表6
序列:
实例5:使用各种模板量的一锅(单容器)RNA文库制备
这个实验设计成展示用于使用不同量的模板RNA制备一锅(单容器)RNA文库的方法(表7)。图3展示工作流程的示意图。这个实验中使用的模板是600碱基对合成RNA(供体模板)。这个实验中使用的RNA模板量在0μM、0.00025μM、0.0025μM和0.025μM之间变化。简单来说,反应物包含H2O、R2缓冲液或MMLV缓冲液、0.25mM dNTP、含引物的600bp RNA模板(0μM、0.00025μM、0.0025μM和0.025μM)、受体核酸分子(用于MMLV反应的6μM P181TSO)或用于R2反应的0.1μM P173和酶(0.023μg/μl经过修饰的R2酶或0.4U/μl MMLV)。将R2反应物在30℃下培育1小时(表7,编号1到4),且将MMLV反应物在42℃下培育1小时(表7,编号5到8)。接着为反应物补充PCR试剂,包含扩增引物和热启动聚合酶。表8中展示用于R2反应物(反应物1到4)的PCR条件,且表9中展示用于MMLV反应物(反应物5到8)的PCR条件。R2反应物包含H2O、SYBR FAST预混液、0.5μM P186引物和P172引物中的每一者以及1×模板(2.5μl RT反应物)。MMLV反应物包含H2O、SYBR FAST预混液、0.5μM P161引物和P172引物中的每一者以及1×模板(2.5μl RT反应物)。简单来说,将2.5μl RT反应物(例如未净化)与总体积为25μl的包含SYBRFAST预混液、引物和H2O的PCR组分一起培育(一锅/试管/单容器反应)。用于R2反应物的PCR条件是在95℃下保持3分钟,并在95℃下保持3秒、在54℃下保持10秒和在64℃下保持20秒,进行30个循环。接着将反应物升温到68℃。用于MMLV反应物的PCR条件是在95℃下保持3分钟,并在95℃下保持3秒和在64℃下保持20秒,进行30个循环。接着将反应物升温到68℃。在这个实验过程期间无需纯化步骤。在一些情况下,可以在PCR期间通过将10μl RT反应物和90μl PCR试剂添加到同一个试管,使其为一锅(单容器)反应来将初始反应物稀释10倍。使用实时PCR的结果展示各种量的600碱基对RNA下的产物转化率,且展示R2酶相比MMLV呈现较优转化效率(图13)。这个实验表明,即使在较低量的模板(0.00025μM)下,R2酶也能够进行RNA文库制备(图13,编号4)。这是单细胞应用的代表。这个实验还展示比当前可用方法大10倍的转化效率。
表7
表8
表9
序列:
实例6:使用各种模板长度的一锅(单容器)RNA文库制备
这个实验设计成展示使用不同长度的模板RNA(200bp、600bp和2000bp)制备一锅(单容器)RNA文库的方法。A图3中展示工作流程的示意图。简单来说,反应物包含H2O、R2缓冲液、0.25mM dNTP、含引物的RNA(例如0.3μM(200bp)、0.125μM(600bp)或0.03μM(2000bp))、0.1μM P173和酶(例如0.023μg/μl经过修饰的R2酶;P2变异体)(表10)。将反应物在30℃下培育1小时。接着为反应物补充PCR试剂,包含扩增引物和热启动聚合酶。PCR扩增反应包含H2O、SYBR FAST预混液、0.5μM正向引物和反向引物中的每一者以及2.5μl 10×模板(RT反应物)(表11)。用于无模板对照物反应的正向和反向引物分别是P186和P183。用于200bp RNA模板反应的正向和反向引物分别是P186和P170。用于600bp RNA模板反应的正向和反向引物分别是P186和P172。用于2000bp RNA模板反应的正向和反向引物分别是P186和P183。用于反应物的PCR条件是在95℃下保持3分钟,并在95℃下保持3秒和在62℃下保持60秒,进行30个循环。接着将反应物升温到68℃。在这个实验过程期间无需纯化步骤。可以在PCR期间通过将10μl RT反应物和90μl PCR试剂添加到同一个试管,使其为一锅(单容器)反应来将初始反应物稀释10倍。使用实时PCR的结果在各种长度的RNA模板下展示产物转化率(图14)。这个实验还示出RNA长度兼容性。实验展示与若干转录物长度的兼容性并且实现多种应用,例如Iso-seq、VDJ及其它应用。
表10
反应物 1 2 3 4
H<sub>2</sub>O 30μl 27.5μl 27.5μl 27.5μl
5×R2缓冲液 10μl 10μl 10μl 10μl
10mM dNTP 1.25μl 1.25μl 1.25μl 1.25μl
2.5μM600bpRNA-P172 0μl 0μl 2.5μl 0μl
0.6μM 2000bpRNA-P 184 0μl 0μl 0μl 2.5μl
6μM200bpRNA-P170 0μl 2.5μl 0pl 0μl
1μM P173 5μl 5μl 5μl 5μl
0.3μg/μlP2(R2酶) 3.75μl 3.75μl 3.75μl 3.75μl
总计 50μl 50μl 50μl 50μl
表11
序列:
实例7:针对酶活性和模板跳转的NaCl浓度最优化
这个实验设计成基于NaCl浓度最优化酶活性和模板跳转。简单来说,反应物包含H2O、10×R2缓冲液、0.1mM dNTP、0.2μM含引物(P173和P174)的RNA模板、NaCl(100mM、200mM、300mM、400mM、500mM、600mM或800mM)和酶(例如0μg/μl或0.023μg/μl经过修饰的R2酶(P2变异体R2酶))。10×R2缓冲液包含H2O、500mM Tris-HCl pH 7.5、0.5%Tween和25mM的DTT(42.5μl H2O,50μl的1000mM Tris-HCl pH 7.5,5μl的10%Tween,2.5μl的1000mMDTT)。在室温下将反应物培育约2小时。接着为反应物补充0.5μM模板(P173)和5mM MgCl2,且在室温下培育约1小时,之后在80℃培育约5分钟。接着在凝胶上运行反应(图15)。结果表明,在这个实验中,300mM NaCl对于酶活性和模板跳转是最优的(图15)。
表12
实例8:R2酶(P2变异体)的两步纯化产生较高活性和模板跳转
这个实验设计成基于不同纯化方法最优化R2酶的活性和模板跳转性质。简单来说,反应物包含H2O、10×R2缓冲液、0.1mM dNTP、0.2μM含引物(P173和P174)的RNA、5mMMgCl2、NaCl、0.5μM P173和酶(0.023μg/μl或0.045μg/μl用于一步纯化的P2变异体R2酶(镍或肝素),或0.0075μg/μl、0.023μg/μl或0.048μg/μl用于两步纯化的P2变异体R2酶(镍和肝素))。将反应物在室温下培育约2小时,接着在80℃下培育约5分钟。接着在凝胶上运行反应(图16A和图16B)。结果表明,相比进行仅一个纯化步骤(仅镍或仅肝素)的反应物,对酶进行了Ni-NTA镍亲和色谱柱纯化和之后的进一步肝素琼脂糖亲和色谱柱纯化的反应物展示较高活性和较好模板跳转能力(图16A和图16B)。
实例9:DNA模板实现R2酶(P2变异体)的活性和模板跳转
这个实验证实经过修饰的逆转录酶在存在DNA模板的情况下展示活性和模板跳转能力(图17)。简单地说,反应物包含H2O、5×R2缓冲液、0.25mM dNTP、0.4μM含引物的DNA模板(P188和P189)、0μM或1.5μM DNA模板(P188)(图17,分别为泳道1和2)和0μg/μl或0.023μg/μl酶(P2变异体R2酶)(图17,分别为泳道1和2)。将反应物在30℃下培育约1小时,接着在80℃下培育约10分钟。接着在凝胶上运行反应(图17)。序列:DNA模板P188(AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT);引物P189(AGATCGGAAGAGCGTCGTGTAG)。
实例10:可以捕获DNA片段并用R2酶对DNA片段加标签
这个实验展示,使用本公开的方法在一锅(单容器)反应中捕获200bp DNA片段(cfDNA的典型尺寸)并对其加标签。这个实验的一些事实:不需要序列的先验了解,且这个实验提供的数据满足敏感度需求(典型液体活检样本具有10到30ng之间的DNA,所需敏感度0.1%(约10-30pg))。
这个实验展示,使用R2酶(P8变异体R2酶)捕获含有DNA片段(通过PCR产物的热变性和快速冷却制备的200bp PCR产物)的一锅(单容器)反应物并对其加标签。简单来说,这个实验包含两个方法:1)利用RNA引发捕获DNA片段(图5A和图5B所示的示意图);以及2)使用RNA供体捕获DNA片段(图6A和图6B所示的示意图)。简单来说,根据第一方法(RNA引发)的反应物包含H2O、5×R2缓冲液、0.25mM dNTP、200bpDNA片段(0ng(无DNA模板对照物(NTC))、160pg、32pg或6pg DNA模板)、酶(例如0.023μg/μl P8变异体R2酶)和0.5μM P173。根据第二方法(RNA供体)的反应物包含H2O、5×R2缓冲液、0.25mM dNTP、200bp DNA片段(0ng(无DNA模板对照物(NTC))、160pg、32pg或6pg)、酶(例如0.023μg/μl P8变异体R2酶)和0.2μM的RNA供体(P173+P174)。接着将反应物在30℃下培育约1小时。接着将反应物进行1:10稀释并补充PCR试剂,包含扩增引物和热启动聚合酶。用于第一方法(RNA引发)的PCR扩增反应包含H2O,含1×SYBR Green的1×Taq预混液,0.5μM P169,0.5μM P186,和1×模板(用于PCR的总体积100μl中的10μl RT反应物)。用于第二方法(RNA供体)的PCR扩增反应包含H2O、含1×Sybr Green的1×Taq预混液、0.5μM P169、0.5μM P186和1×模板(用于PCR的总体积100μl中的10μl RT反应物)。用于反应的PCR条件是在95℃下保持3分钟,并在95℃下保持3秒、在54℃下保持10秒和在64℃下保持10秒,进行30个循环。接着将反应物升温到68℃,保持2秒。在丙烯酰胺凝胶上确认PCR产物的长度。结果展示,在无DNA序列的先验了解的情况下,使用RNA引发或供体RNA机制捕获了DNA片段(约200bp)。预期PCR产物为约240bp,其是DNA模板除RNA供体以外的大约尺寸(图18B)。参见图18A、图18B、图18C和图18D。
序列:
实例11:使用R2酶的DNA模板的检测极限
这个实验分析了使用RNA供体策略捕捉58bp DNA寡核苷酸的DNA模板(P188)的检测极限。简单地说,反应物包含H2O、5×R2缓冲液、0.25mM dNTP、DNA片段/P188(0μM、0.5μM、0.05μM、0.005μM、0.0005μM、0.00005μM、0.000005μM和0.0000005μM)、酶(例如0.023μg/μlP8变异体R2酶)和含已退火DNA引物的0.4μM RNA(P173/P174)。将反应物在30℃下培育约1小时,且在80℃下培育约10分钟。接着对反应物进行5倍稀释并补充PCR试剂,包含扩增引物和热启动聚合酶。PCR扩增反应物包含H2O、SYBRFAST预混液、0.25μM P188、0.25μM P174和1×模板(总体积25μl中的2.5μl RT反应物)。用于反应的PCR条件是在95℃下保持3分钟,并在95℃下保持3秒、在54℃下保持10秒和在64℃下保持10秒,进行30个循环。接着将反应物升温到68℃,保持2秒。图19展示,针对不同量的模板DNA观测到良好滴定,而无模板对照物(0μM DNA)在20个PCR循环时仍保持洁净。针对低浓度DNA模板(浓度低至500飞摩尔DNA)观测到滴定。这个实验还表明在高DNA模板浓度下可能存在抑制性作用。
序列:
实例12:用于液体活检应用的敏感度驱动因子(driver)
这个实验展示DNA滴定和达到0.3pg DNA的敏感度。如先前在上述实例(例如实例11)中描述的类似流程以0μg、0.3μg、30ng、3ng、0.3ng、30pg、3pg或0.3pg的DNA模板浓度行进(参见图20)。目前,下一代测序样本制备技术都不能保持这种敏感度能力。这个实验展示比任何当前可用方法高100-1000倍的敏感度。数据展示关于低于0.3pg的一些数量级的DNA的应用潜力。
实例13:模板多联体化
这个实验设计成展示一种将短DNA片段转化成多联体的方法。多联体可以含有约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、500、1000或更多个拷贝的起始核酸。图24A中展示工作流程的示意图。简单来说,用于模板制备的初始PCR流程包含H2O、2×Q5预混液、P316(0.5μM)、P317(0.5μM)和pUC18(0.05ng/μl)。PCR条件是在98℃下保持30秒,接着为30个循环:在98℃下保持10秒,在66℃下保持15秒,和在72℃下保持10秒。在30个循环结束时,将反应物保持在72℃下2分钟,接着降温到4℃。衔接子退火反应包含H2O、TrispH 8.0(20mM)、NaCl(100mM)和两个引物(各25μM;(P312+P313)或(P314+P315)或(P320+P321))。将反应物在90℃下培育1分钟,之后以0.1℃/秒的斜率降温到25℃(20秒),接着降温并保持在4℃下。第一衔接子接合反应包含H2O(30μL)、片段化DNA(20μL)、末端修复与加T尾缓冲液(7μL)和末端修复与加T尾酶混合物(3μL)。将反应物在20℃下培育30分钟,接着升温到65℃,保持30分钟。接着将H2O(5μL)与2.5μL的20μM衔接子(P312+P313)、2.5μL的20μM衔接子(P314+P315)、接合缓冲液(30μL)和DNA连接酶(10μL)一起添加到反应物(50μL)。接着将反应物在室温下培育15分钟,之后将反应物净化。SPRI珠粒并且对反应物进行洗脱。将衔接子接合文库(10μL)与H2O(40μL)和2×Kappa HiFi预混液(50μL)一起培育,并进行PCR(在98℃下保持45秒;5个循环:在98℃下保持15秒,在60℃下保持30秒和在72℃下保持30秒;在72℃下保持1分钟;以及保持在4℃下)。可以修改这个流程以便增加循环数目(例如从5个循环增加到25个循环)。第二衔接子接合反应包括与针对第一衔接子接合反应描述的流程类似的流程;差异在于使用5μL的20μM衔接子(P320+P321)代替2.5μL的20μM衔接子(P312+P313)和2.5μL的20μM衔接子(P314+P315)。图24B中的凝胶展示,衔接子成功地接合到片段化DNA序列并展示模板多联体化。
序列:
实例14:在去除3'-磷酸根、2'-磷酸根和2',3'-环状磷酸根之后改进的转化效率 (RNA样本到下一代序列(NGS)文库)。
本公开提出或展示的一些技术需要RNA样本的3'端的游离3'-羟基。举例来说,用聚合酶(例如多聚腺苷酸聚合酶)进行RNA加poly(A)尾和/或用末端脱氧核苷酸转移酶(TdT)进行DNA加聚腺苷酸尾和/或接合需要3'-OH。内源RNA通常含有3'-羟基或2',3'-环状磷酸根或3'-磷酸根。3'-羟基可以是转录、poly(A)尾合成或酶裂解(类似于RNase H)的具有催化机制的酶)的产物。2',3'-环状磷酸根可以是酶裂解(如RNase A的酶)或自发性水解(非酶分子内磷酸根转移作用)的产物。举例来说,RNA可以通过分子内酯基转移作用裂解。
2',3'-环状磷酸根由于天然RNA磷酸二酯键不稳定性而十分常见,且可以天然产生(游离RNA降解)或者由于样本处理或存储而产生。携带2',3'-环状磷酸根或3'-磷酸根的RNA样本随后无法加聚腺苷酸尾或接合,因为两者都需要存在游离3'-羟基。因此,含有2',3'-环状磷酸根或3'-磷酸根的RNA样本可以用磷酸酶(例如T4多核苷酸激酶(PNK)酶)处理以产生3'-羟基。磷酸酶的其它实例公开于下表13中(Ushati Das和Stewart Shuman,通过T4多核苷酸激酶-磷酸酶复原RNA2',3'-环状磷酸根末端的机制(Mechanism ofRNA 2',3'-cyclic phosphate endhealing by T4polynucleotide kinase-phosphatase),核酸研究(Nucleic Acids Research),2013,第41卷,第1期,355-365)。
表13.复原2',3'-环状磷酸根末端的RNA修复酶的比较
T4多核苷酸激酶(PNK)酶包含激酶和磷酸酶的酶活性。因此,为了最优化T4PNK,激酶酶活性可以通过取代至少一个催化必需氨基酸来去除。这使得磷酸酶为存在的唯一酶活性。去除激酶活性有助于后续反应,例如使用例如ATP加多聚腺苷酸尾,因为ATP也是一种激酶底物。本文公开包含脱磷酸化的游离RNA NGS文库制备流程的实例。本文还公开比较反应(例如不用T4PNK处理的反应)。结果展示NGS文库中捕获的RNA颗粒数目显著地增加3到5倍(参考图26中的生物分析器跟踪数据)。
其它潜在益处:取决于用于产生RNA颗粒的工艺类型的RNA颗粒3'端的独特性质允许聚焦于和/或操控测序文库。举例来说,如果不希望对因降解过程产生的RNA片段(例如携带2',3'-环状磷酸根的不完全RNA片段)进行序列,那么可以避免用T4PNK处理样本。以这种方式,文库将包含完整mRNA和miRNA(3'-羟基)。
实例15:RNA样本片段化是NGS文库制备工作流程的部分;酶促和非酶促方法(与如 Illumina和Ion Torrent的短读长技术相关)。
例如Illumina或Ion Torrent的主要DNA测序技术在测序读长方面受到限制(表示每个单独的读长中可以进行测序的碱基的有限数目)。两种技术都具有最多约100bp-500bp的读长范围,这使得其不能使用明显超过此范围的文库。游离RNA通常在约20到2000个碱基的范围内,福尔马林固定石蜡包埋(FFPE)RNA在约20到500个碱基的范围内,且mRNA通常为大约2000个碱基。出于实践原因,样本通常经过片段化,因此有效文库尺寸不超过400bp。相比较短片段,载有长超过l000bp的文库片段的样本极其低效。本文公开RNA样本片段化的两个通用方法:酶促和非酶促方法。酶促方法可以使用具有RNase活性的酶(例如RNase A、RNase P、RNase H、RNase III、RNase Tl、RNase T2、RNase U2、RNase VI、RNase I、RNaseL、RNase PhyM、RNase V、Dicer或Argonaute)。本文公开的非酶促方法利用RNA的天然化学不稳定性。RNA可能由于内部磷酸根转移作用而经历自发性非酶促片段化。可以通过各种条件(例如金属,例如Mg、Mn、Pb或多胺,或辅因子,例如PVP或PEG)使RNA的磷酸二酯键断裂。磷酸根转移作用速率的增加可以例如利用高pH或(较)高温度来实现。非酶水解优先发生于RNA颗粒的单链部分中,优先发生在碱基UA或CA之间。使用非酶促方法的优点包含:简单性和可靠性(与酶活性或存放期无关),并且反应可以在与大部分后续步骤兼容的条件下进行。
下表16展示片段化流程和无片段化流程的工作流程。图26展示片段化流程(由线条1表示)和无片段化流程(由线条2表示)的生物分析仪跟踪数据。使用游离RNA样本制备文库。
表16.工作流程
简单地说,无片段化流程包含6.5μL的H2O、2μL的10×T4PNK缓冲液、0.5μL的10×RNase抑制剂、1μL的10U/μL T4PNK酶和10μL样本(例如游离RNA样本)。将反应物在37℃下培育20分钟,在70℃下培育4分钟,接着放在冰上。接着将3.25μL的H2O、10μL的5×2D PNK缓冲液、1.25μL的10×RNase抑制剂、7.5μL的10mM ATP和1.25μL的5U/μL大肠杆菌PolyA聚合酶添加到反应物。将反应物在16℃下培育5分钟,接着放在冰上。接着将0.5μL的100×dNTP、1μL的10μM P334引物、0.25μL的100μM P423DNA ter acc添加到反应物。将反应物在70℃下培育2分钟,接着放在冰上2分钟。将1.25μL的10×RNase抑制剂、3.75μL的P2(例如lμg/μL的R2变异体(例如R2RT N-截短,例如SEQ ID NO:50))添加到反应物(总共50μL反应物)。将反应物在34℃下培育1小时,下拉,SPRI 1.6×,接着以50μL洗脱。参见图26,线条2。在一些情况下,可以使用逆转录酶或经过修饰的逆转录酶或与逆转录酶具有类似功能的酶代替P2。
简单地说,片段化流程包含1μL的10×缓冲液A和9μL的样本(例如游离RNA样本)。将反应物在94℃下培育4分钟,接着放在冰上。将14.75μL的H2O、3μL的10×缓冲液B、0.75μL的10×RNase抑制剂和1.5μL的10U/μL T4PNK酶添加到反应物。将反应物在37℃下培育30分钟,在72℃下培育3分钟,接着放在冰上。接着将5μL的10×缓冲液C、1.25μL的10×RNase抑制剂、7.5μL的10mM ATP和1.25μL的5U/μL大肠杆菌PolyA聚合酶添加到反应物。将反应物在16℃下培育5分钟,接着放在冰上。接着将0.5μL的100×dNTP、1μL的10μM P334引物、0.25μL的100μM P423DNA ter acc添加到反应物。将反应物在70℃下培育2分钟,接着放在冰上2分钟。将1.25μL的10×RNase抑制剂和3.75μL的P2(例如lμg/μL的R2变异体(例如R2RT N-截短,例如SEQ ID NO:50))添加到反应物(总共50μL反应物)。将反应物在34℃下培育1小时,下拉,SPRI 1.6×,接着以50μL洗脱。参见图26,线条1。在一些情况下,可以使用逆转录酶或经过修饰的逆转录酶或与逆转录酶具有类似功能的酶代替P2。
简单地说,5×2D PNK缓冲液包含645μL H2O、10μL的1000mM Tris-HCl pH 7.5、300μL的5000mM NaCl2、5μL的1000mM MgCl2、25μL的10%吐温和15μL的1000mM DTT。缓冲液A储备液包含60μL H2O、10μL的1000mM Tris-HCl pH 8.3和30μL的1000mM MgCl2。缓冲液B储备液包含45μL H2O、50μL的1000mM Tris-HCl pH 7.5和5μL的1000mM DTT。缓冲液C储备液包含36μL H2O、60μL的5000mM NaCl2、2.5μL的10%吐温和1.5μL的1000mM DTT。10×PNK缓冲液包含150μL H2O、700μL的1000mM Tris-HCl pH 7.5、100μL的MgCl2和50μL的1000mM DTT。100×平衡dNTP包含100μL H2O、75μL的100mM dATP、75μL的100mM dTTP、375μL的100mMdGTP和375μL的100mM dCTP。5×R2缓冲液+dNTP包含430μL H2O、150μL的1000mM Tris-HClpH 7.5、300μL的5000mM NaCl2、25μL的1000mM MgCl2、25μL的10%吐温、25μL的1000mM DTT、3.75μL的100mM dATP、3.75μL的100mM dTTP、18.75μL的100mM dGTP和18.75μL的100mMdCTP。链霉亲和素磁珠包含160μL的生物素标记寡核苷酸AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA/3BioTEG/饱和的链霉亲和素磁珠(NEB);将珠粒再悬浮在10mM Tris pH7.5、300mMNaCl2中。使用的引物序列是:P334(A/iSp9/CCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNNNTTTTTTTTTTTTTTTTT);P423(AA/iSp9/ACACTCTTTCCCTACACGACGCTCTTCCGATCT/3ddC/);P399(AATGATACGGCGACCACCGAGATCTACACGTACTGACACACTCTTTCCCTACACGACGC);P400(CAAGCAGAAGACGGCATACGAGATATTACTCGGTGACTGGAGTTCAGACGTGT)
实例16:R2 RT跳转的稳固机制。
R2RT跳转为极其有效的机制。相比模板交换机制(例如使用MMLV的方法),其对受体-衔接子序列的敏感度低得多。这种较低敏感度时的测序衔接子在例如Illumina测序中的利用率最理想。在这个实验中,测试多种受体。结果展示RNA受体与DNA受体之间的效率类似。DNA受体的使用时的技术成本更低且更可靠和/或稳定。结果还展示转化效率对受体序列的3'端不敏感。因此,这个机制允许关于受体序列的灵活性,且其对于RNA和DNA样本都是有意义的。使用的受体的实例:1)AA/iSp9/ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGGG/3ddC/;
2)AA/iSp9/ACACTCTTTCCCTACACGACGCTCTTCCGATCTCAGGG/3ddC/;
3)AA/iSp9/ACACTCTTTCCCTACACGACGCTCTTCCGATCTTCTGGG/3ddC/;
4)AA/iSp9/ACACTCTTTCCCTACACGACGCTCTTCCGATCTG/3ddC/;
5)AA/iSp9/ACACTCTTTCCCTACACGACGCTCTTCCGATCT/3ddC/;
6)AA/iSp9/ACACTCTTTCCCTACACGACGCTCTTCCGATCTrGrGrG/3ddC/;
7)AAAA/iSp9/ACACTCTTTCCCTACACGACGCTCTTCCGATCTrGrGrG;
8)AA/iSp9/ACACTCTTTCCCTACACGACGCTCTTCCGATCTN/3ddC/;
9)AA/iSp9/ACACTCTTTCCCTACACGACGCTCTTCCGATCTNN/3ddC/;
10)AA/iSp9/ACACTCTTTCCCTACACGACGCTCTTCCGATCT*/3ddC/;
11)AA/iSp9/ACACTCTTTCCCTACACGACGCTCTTCCGATCTN/ideoxyI//3ddC/;
12)AA/iSp9/ACACTCTTTCCCTACACGACGCTCTTCCGATC/iSuper-dT//3ddC/;以及
13)A/iSp9/CCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT/3ddC/。
实例17:不可延伸核苷酸的多聚腺苷酸尾长度控制方法。
多聚腺苷酸聚合酶是常用于在RNA的3'端上产生多聚腺苷酸尾的RNA聚合酶(例如多聚腺苷酸聚合酶形式大肠杆菌或酵母)。多聚腺苷酸聚合酶具有允许在无RNA或DNA模板的情况下产生RNA链(即,RNA的3'端延伸)的酶活性。尽管多聚腺苷酸聚合酶优选合成多聚腺苷酸尾,但多聚腺苷酸聚合酶也具有其它核糖核苷酸(例如CTP、GTP和UTP)的活性。控制多聚腺苷酸尾的长度对于测序质量和产率而言十分重要。通常,将ATP浓度和反应时间和/或温度用于控制多聚腺苷酸尾长度。可以使用替代方法,例如使用封阻(不可延伸)核苷酸(例如3'-脱氧腺苷-5'-三磷酸酯(ATP类似物))。一旦将封阻核苷酸3'-脱氧腺苷-5'-三磷酸酯并入RNA链类似物,其就会因缺乏3'羟基而无法进一步延伸。使用各种浓度的ATP和3'-脱氧腺苷-5'-三磷酸酯。发现,可以独立于反应时间和/或酶浓度而基于ATP和3'-脱氧腺苷-5'-三磷酸酯的浓度/比率来控制多聚腺苷酸尾长度。这种方法在应用于高通量处理过程或自动处理过程时提供显著流程优势。
实例18:产生cfDNA文库的方法
本文描述两种产生cfDNA文库的方法。为了有助于说明两种方法,将流程划分成两个通用步骤。在第一步骤中,使用R2酶(2D基因组R2酶和衍生物)和辅助酶。这个步骤的产物包含双链DNA(dsDNA),例如通过具有已知序列的已连接衔接子侧接的一个原始样本链。这种dsDNA颗粒包含一个原始样本链和一个通过R2和辅助酶拷贝的链。拷贝链包含可降解核苷酸,例如dUTP,其可以在用例如尿嘧啶-DNA糖基化酶(UDG)酶处理后降解。去除拷贝链的替代方法包含在引物-衔接子序列中含dUTP或使用不对称衔接子。在第二步骤中,具有已连接衔接子的原始DNA链使用高保真度方法/酶(例如具有校对活性的酶)来进行PCR扩增。保留原始链以供测序的至少一个优点在于,其避免在使用非误差校正酶(例如R2酶)复制时引入误差。因此,所得文库的保真性不会受损。
方法1(参见图27):首先,将游离DNA(cfDNA)变性以产生单链DNA(ssDNA)样本。相比基于接合的方法,这允许分开分析每一个链(一个最终产物中的两个链)。分析每个链创造了更多捕捉罕见突变的机会。流程还可以包含脱磷酸化步骤(3'和5'端)。接下来,将ssDNA与包含DNA或RNA衔接子以及已退火引物和R2聚合酶的引发-跳转复合物混合。反应物包含dNTP和催化金属。简单地说,R2首先在衔接子模板上延伸引物,且接着模板跳转到ssDNA样本。产生的产物是在衔接子模板与ssDNA样本之间带有一个缺口的dsDNA。下一步骤是使用具有3'至5'核酸外切酶活性的DNA聚合酶(例如T4聚合酶、Klenov片段、Bst DNA聚合酶或Phi29DNA聚合酶)进行末端修复。聚合酶还可能具有DNA链置换能力。所得产物是具有平端或3'A突出端的dsDNA。缺口可以置换为整个新链,其中延伸和置换通过原始样本链的3'羟基引发。另一方面,可以在下一步骤接合期间修复缺口。下一步骤接合包含不对称衔接子。衔接子是在5'端处具有一个单链突出端的DNA双链体。这个突出端包含与至少一个PCR扩增引物互补的序列,使得仅一个链被扩增。或者,为了只分离原始ssDNA链,可以与dUTP和UDG降解组合使用具有3'和5'突出端的衔接子(Y结构)。接着进行PCR扩增,且PCR扩增包含对两个衔接子具有特异性的DNA引物。仅来自先前步骤的一个链被扩增;一个链包含原始样本DNA。在一些实施例中,原始ssDNA链的分离发生在末端修复步骤与不对称衔接子接合步骤之间。
方法2(参见图28):首先,将游离DNA(cfDNA)变性以产生单链DNA(ssDNA)样本。流程还可以包含脱磷酸化步骤(3'和5'端)。接下来,通过例如添加末端脱氧核苷酸转移酶(TdT)产生polyA或polyC尾。可以基于dATP和培育时间或温度的组合控制TdT产生的尾的长度(如果选择加polyA尾)。或者,可以基于不可延伸核苷酸(例如ddATP或3'-脱氧腺苷-5'-三磷酸酯)控制polyA尾的长度。此处,反应物包含以各种比率和浓度使用的dATP和不可延伸类似物。接下来,可以用温度杀死TdT,且可以用与DNA尾序列互补的引物-衔接子将样本退火。接着将反应物与dNTP(包含dUTP)、催化金属、R2酶和受体-衔接子混合。R2酶延伸已退火引物并跳转到受体-衔接子以继续延伸。受体-衔接子包含核苷酸封阻物以防止R2完成该模板并跳转到另一个模板。产物是具有两侧的5'突出端和cfDNA样本链与受体-衔接子之间的缺口的双链DNA。接着利用具有3'至5'核酸外切酶活性的DNA聚合酶和DNA接合酶(例如T4聚合酶、Klenov片段、BstDNA聚合酶或Phi29DNA聚合酶、T4DNA接合酶)对产物进行末端修复和缺口接合。接着对末端修复和缺口接合的产物进行UDG降解。最后步骤是包含对两个衔接子具有特异性的DNA引物的PCR扩增。仅来自先前步骤的一个链被扩增;一个链包含原始样本DNA。
实例19:文库制备,耗尽核糖体RNA(rRNA)和转运RNA(tRNA)以最大化测序通量
细胞中的全部RNA的大约80%为rRNA,且15%为tRNA。核糖体RNA罕见地充当诊断靶。因此,操作为从测序文库去除/耗尽rRNA和tRNA。可以在文库制备的各个阶段控制测序文库中的rRNA和tRNA的量。举例来说,rRNA和tRNA的耗尽可以发生在早期阶段期间,例如在全部RNA分离(RNA水平)之后,或在PCR扩增(dsDNA水平)之后。本文描述去除rRNA和tRNA的两种通用方法:1)使用连接到磁珠或固体支撑物的互补寡核苷酸牵拉rRNA/tRNA或PCR产物;以及2)寡核苷酸引导式降解rRNA/tRNA或PCR产物。
方法1:在这种方法中,使扩增的dsDNA变性并与大量已进行策略设计的寡核苷酸杂交。寡核苷酸与具有rDNA序列的一个或两个DNA链互补。对于Illumina文库,因为桥式扩增中仅使用一个极性,所以可以仅耗尽一个链(参见图29)。每个寡核苷酸包含生物素修饰。使用链酶亲和素固定的磁珠或固体支撑物耗尽/去除核糖体序列(包含DNA片段)。在一些情况下,在PCR文库扩增之后进行耗尽以便减轻罕见和低表示序列的损失。还可以在文库制备的早期阶段(例如RNA水平)期间进行耗尽。
方法2:在这种方法中,Cas9核酸酶与经过策略设计的导引RNA寡核苷酸复合(Carolin Anders和Martin Jinek,Cas9的体外酶学(In vitro Enzymology of Cas9),酶学方法(Methods Enzymol.),2014;546:1-20)。寡核苷酸可以具有与核糖体RNA互补的序列。Cas9与导引RNA寡核苷酸的复合物特异性结合dsDNA(在PCR扩增之后)和rRNA序列,且催化单个或两个DNA链的内切核苷酸裂解(参见图30)。
实施例
实施例1.一种用于使用模板跳转制备互补脱氧核糖核酸(cDNA)分子的方法,其包括:将引物退火到模板上;以及在存在核苷酸的情况下,在足以产生与模板和受体核酸分子互补的连续cDNA分子的条件下将退火到引物的模板与经过修饰的逆转录酶和受体核酸分子混合,其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质,其中产生连续cDNA分子后,经过修饰的逆转录酶经历从模板到受体核酸分子的迁移。
实施例2.一种用于使用模板跳转制备互补脱氧核糖核酸(cDNA)分子的方法,其包括:(a)将一个或多个引物退火到模板上;以及(b)在存在核苷酸的情况下,在足以产生与模板和/或受体核酸分子互补的cDNA分子的条件下将退火到一个或多个引物的模板与经过修饰的逆转录酶和受体核酸分子混合,其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质。
实施例3.一种使用模板跳转制备核酸分子的方法,其包括:在存在核苷酸的情况下,在足以产生核酸分子的条件下将片段或已降解模板、引物、经过修饰的逆转录酶和受体核酸分子混合,其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质。
实施例4.一种用于使用模板跳转制备核酸分子的方法,其包括:在存在核苷酸的情况下,在足以产生核酸分子的条件下将片段或已降解模板、供体复合物、经过修饰的逆转录酶和受体核酸分子混合,其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质。
实施例5.一种用于使用模板跳转制备互补脱氧核糖核酸(cDNA)文库的方法,该方法包括:(a)将一个或多个引物退火到模板;(b)在存在核苷酸的情况下,在足以产生与模板和/或受体核酸分子互补的连续cDNA分子的条件下将退火到一个或多个引物的模板与受体核酸分子和经过修饰的逆转录酶混合,其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质,其中产生连续cDNA分子后,经过修饰的逆转录酶经历从模板到受体核酸分子的迁移;以及(c)扩增cDNA分子以产生cDNA文库。
实施例6.一种用于使用模板跳转制备互补脱氧核糖核酸(cDNA)文库的方法,该方法包括:(a)在存在核苷酸的情况下,在足以产生cDNA分子的条件下将片段化或已降解模板与引物、经过修饰的逆转录酶和受体核酸分子混合,其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质;以及(b)扩增cDNA分子以产生cDNA文库。
实施例7.一种用于使用模板跳转制备脱氧核糖核酸(DNA)文库的方法,该方法包括:(a)在足以产生DNA分子的条件下将片段化或已降解模板与引物、经过修饰的逆转录酶和受体核酸分子混合,其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质;以及(b)扩增DNA分子以产生DNA文库。
实施例8.一种用于使用模板跳转制备互补脱氧核糖核酸(cDNA)文库的方法,该方法包括:(a)在足以产生cDNA分子的条件下将片段化或已降解模板与供体复合物、经过修饰的逆转录酶和受体核酸分子混合,其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质;以及(b)扩增cDNA分子以产生cDNA文库。
实施例9.一种用于使用模板跳转制备脱氧核糖核酸(DNA)文库的方法,该方法包括:(a)在足以产生DNA分子的条件下将片段化或已降解模板与供体复合物、经过修饰的逆转录酶和受体核酸分子混合,其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质;以及(b)扩增DNA分子以产生DNA文库。
实施例10.一种用于制备用于测序的文库的方法,其包括:(a)从受试者获得含游离核酸的样本;(b)将经过修饰的逆转录酶、模板、核苷酸、受体核酸分子和一个或多个引物混合到游离核酸,其中经过修饰的逆转录酶能够进行模板跳转且包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质;(c)对来源于样本的游离核酸(cf核酸)进行扩增反应以产生多个扩增子,其中扩增反应包括35个或更少扩增循环;以及(d)产生用于测序的文库,该文库包括多个扩增子。
实施例11.一种用于由多个单细胞制备互补脱氧核糖核酸(cDNA)文库的方法,该方法包括以下步骤:(a)从每个单细胞剥离核酸以提供多个单独的核酸样本,其中每个单独的核酸样本中的核酸来自单个细胞;(b)将核酸模板退火到一个或多个引物上;(c)在存在核苷酸的情况下,在有效产生cDNA分子的条件下将退火到一个或多个引物的核酸模板与受体核酸分子和经过修饰的逆转录酶混合,其中经过修饰的逆转录酶能够进行模板跳转且包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质;以及(d)扩增cDNA分子以产生cDNA文库。
实施例12.一种用于由多个单细胞制备脱氧核糖核酸(DNA)文库的方法,该方法包括以下步骤:(a)从每个单细胞剥离核酸以提供多个单独的核酸样本,其中每个单独的核酸样本中的核酸来自单个细胞;(b)将核酸模板退火到一个或多个引物;(c)在存在核苷酸的情况下,在有效产生DNA分子的条件下将退火到一个或多个引物的核酸模板与受体核酸分子和经过修饰的逆转录酶混合,其中经过修饰的逆转录酶能够进行模板跳转且包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质;以及(d)扩增DNA分子以产生DNA文库。
实施例13.一种用于检测核酸分子的方法,该方法包括以下步骤:(a)在有效产生核酸分子的条件下将包括核酸分子的样本与受体核酸分子、经过修饰的逆转录酶、引物和核苷酸混合,其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质;以及(b)扩增核酸分子。
实施例14.一种用于确定受试者的癌症的存在的方法,其包括:(a)从受试者获得生物样本;(b)根据实施例13检测生物样本中的核酸分子;(c)对核酸分子进行测序;以及(d)基于核酸分子的存在确定受试者罹患癌症。
实施例15.一种用于使用模板跳转制备互补脱氧核糖核酸(cDNA)分子的方法,其包括在足以产生与mRNA模板和受体核酸分子互补的连续cDNA分子的条件下将引物或一个或多个引物、信使RNA(mRNA)模板、核苷酸、经过修饰的逆转录酶、受体核酸分子和催化金属混合在单个试管中,其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质,其中产生连续cDNA分子后,经过修饰的逆转录酶经历从模板到受体核酸分子的迁移。
实施例16.一种用于制备用于测序的文库的方法,其包括在足以产生文库的条件下将游离核酸、经过修饰的逆转录酶、模板、核苷酸、受体核酸分子、催化金属和一个或多个引物混合在单个试管中,其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质。
实施例17.一种用于在足以产生用于测序的文库的条件下制备文库的方法,其包括:(a)从受试者获得含有游离核酸的样本;(b)将经过修饰的逆转录酶、模板、核苷酸和一个或多个引物混合到游离核酸;(c)对来源于样本的游离核酸(cf核酸)进行扩增反应以产生多个扩增子,其中扩增反应包括35个或更少扩增循环;以及(d)产生用于测序的文库,该文库包括多个扩增子。
实施例18.一种用于制备cDNA分子的方法,其包括在存在核苷酸的情况下,在足以产生与模板和/或受体核酸分子互补的cDNA分子的条件下将引物、模板、经过修饰的逆转录酶和受体核酸分子混合,其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质。
实施例19.一种用于制备cDNA分子的方法,其包括在存在核苷酸的情况下,在足以产生与模板和/或受体核酸分子互补的cDNA分子的条件下将一个或多个引物、模板、经过修饰的逆转录酶和受体核酸分子混合,其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质。
实施例20.一种用于制备cDNA文库的方法,其包括在存在核苷酸的情况下,在足以产生与模板和/或受体核酸分子互补的cDNA分子的条件下将引物或一个或多个引物、模板、经过修饰的逆转录酶与受体核酸分子混合,其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质;以及扩增cDNA分子以产生cDNA文库。
实施例21.根据实施例1至20中任一项所述的方法,其中核酸分子(例如受体核酸分子或游离核酸分子)或模板包括未知的核酸序列。
实施例22.根据实施例1、5和15中任一项所述的方法,其中迁移与模板和受体核酸分子之间的序列一致性无关。
实施例23.根据实施例1至20中任一项所述的方法,其中混合包括添加热启动热稳定聚合酶。
实施例24.根据实施例23所述的方法,其中热启动热稳定聚合酶是热启动Taq聚合酶。
实施例25.根据实施例1至20中任一项所述的方法,其中方法在单个试管(单个容器)中执行。
实施例26.根据实施例1至20中任一项所述的方法,其进一步包括进行聚合酶链反应(PCR)扩增反应。
实施例27.根据实施例26所述的方法,其中PCR扩增反应在与根据实施例25的单个试管(单个容器)相同的单个试管(同一容器)中进行。
实施例28.根据实施例1至16和18至20中任一项所述的方法,其中受体核酸分子包括使引物延伸停止的经过修饰的核苷酸。
实施例29.根据实施例10、16和17中任一项所述的方法,其中游离核酸是游离DNA(cfDNA)、循环肿瘤DNA(ctDNA)或福尔马林固定石蜡包埋DNA(FFPE DNA)。
实施例30.根据实施例26所述的方法,其中PCR扩增在足以使逆转录酶失活的温度下进行。
实施例31.根据实施例26所述的方法,其中PCR扩增在足以活化热启动热稳定聚合酶的温度下进行。
实施例32.根据实施例1至16和18至20中任一项所述的方法,其中受体核酸分子在3'端处经过修饰。
实施例33.根据实施例32所述的方法,其中修饰包括双脱氧3'端和/或磷酸化3'端。
实施例34.根据实施例1至20中任一项所述的用于制备核酸分子和/或文库或互补cDNA分子和/或文库的方法,其中在最多约2小时内制备分子和/或文库。
实施例35.根据实施例10至14和17中任一项所述的方法,其中样本包括循环肿瘤DNA样本或组织样本。
实施例36.根据实施例1至20中任一项所述的方法,其中核酸分子和/或受体核酸分子是RNA、DNA或RNA和DNA的组合。
实施例37.根据实施例1至12和15至20中任一项所述的方法,其中模板是RNA、DNA或RNA和DNA的组合。
实施例38.根据实施例4、8和9中任一项所述的方法,其中供体复合物包括模板和引物。
实施例39.根据实施例37所述的方法,其中模板是片段化或已降解模板。
实施例40.根据实施例36和37中任一项所述的方法,其中RNA是mRNA。
实施例41.根据实施例1至20中任一项所述的方法,其进一步包括耗尽核糖体RNA(rRNA)和/或转运RNA(tRNA)。
实施例42.根据实施例41所述的方法,其中耗尽rRNA的步骤包括使寡核苷酸与rRNA杂交。
实施例43.根据实施例1至20中任一项所述的方法,其中核酸和/或模板来自样本。
实施例44.根据实施例10至14、17和43中任一项所述的方法,其中样本是液体活检样本。
实施例45.根据实施例1至20中任一项所述的方法,其中核酸和/或模板等于或小于约0.01微摩尔。
实施例46.根据实施例45所述的方法,其中核酸和/或模板等于或小于约500飞摩尔。
实施例47.根据实施例1至20中任一项所述的方法,其中核酸和/或模板是片段或已降解核酸、片段化DNA、片段化RNA或其任何组合。
实施例48.根据实施例13所述的方法,其中核酸分子指示疾病。
实施例49.根据实施例48所述的方法,其中疾病是癌症。
实施例50.根据实施例1至20中任一项所述的方法,其进一步包括基于核酸分子存在与否提供产前诊断。
实施例51.根据实施例1至20中任一项所述的方法,其进一步包括最优化模板,其中最优化包括在允许通过去除模板的5'帽结构的试剂去除帽结构的条件下使包括模板的样本与该试剂接触,从而形成去帽模板。
实施例52.根据实施例51所述的方法,其进一步包括在允许通过试剂脱磷酸化去帽模板的条件下使样本与脱磷酸化剂接触。
实施例53.根据实施例51所述的方法,其中该试剂是焦磷酸酶。
实施例54.根据实施例52所述的方法,其中该试剂是碱性磷酸酶。
实施例55.根据实施例1至20中任一项所述的方法,其中引物带荧光标记。
实施例56.根据实施例1至20中任一项所述的方法,其中逆转录酶是非长末端重复序列(LTR)逆转录转座子(例如其中经过修饰的逆转录酶是非长末端重复序列(LTR)逆转录转座子)。
实施例57.根据实施例1至20中任一项所述的方法,其中逆转录酶是R2逆转录酶(例如其中经过修饰的逆转录酶是经过修饰的R2逆转录酶)。
实施例58.根据实施例56所述的方法,其中非LTR逆转录转座子是R2非LTR逆转录转座子。
实施例59.根据实施例1至12和15中任一项所述的方法,其中模板跳转取决于受体核酸分子的浓度。
实施例60.根据实施例1至16和18至20中任一项所述的方法,其中改进的酶性质包括以下中的至少一者:增加的稳定性(例如增加的热稳定性);增加的比活性;增加的蛋白质表达;改进的纯化;改进的持续合成能力;改进的链置换;改进的端到端模板跳转;增加的DNA/RNA亲和力;以及增加的保真性。
实施例61.根据实施例1至20中任一项所述的方法,其中经过修饰的逆转录酶包括N端截短、C端截短或N端和C端截短。
实施例62.根据实施例1至20中任一项所述的方法,其中经过修饰的逆转录酶包括小于约500个氨基酸残基的截短。
实施例63.根据实施例1至20中任一项所述的方法,其中经过修饰的逆转录酶包括以下修饰中的一个或多个:(a)小于约400个氨基酸残基的氨基端截短;以及(b)小于约400个氨基酸残基的羧基端截短。
实施例64.根据实施例1至20中任一项所述的方法,其中经过修饰的逆转录酶进一步包括标签。
实施例65.根据实施例1、2、5、6、8、11、15和18至20中任一项所述的方法,其中cDNA分子进一步包括标签。
实施例66.根据实施例1至12和15至20中任一项所述的方法,其中模板进一步包括标签。
实施例67.根据实施例64至66中任一项所述的方法,其进一步包括对包括标签的经过修饰的逆转录酶或包括标签的cDNA分子或包括标签的模板进行测序。
实施例68.根据实施例67所述的方法,其中测序包括全转录组分析。
实施例69.根据实施例64至66中任一项所述的方法,其中标签是选自由以下组成的组的至少一个成员:生物素、叠氮基、乙炔基、His标签、钙调蛋白标签、CBP、CYD、StrepII、FLAG标签、HA标签、Myc标签、S标签、SBP标签、Softag-1、Softag-3、V5标签、Xpress标签、isopeptag、SpyTag B、HPC肽标签、GST、MBP、生物素、生物素羧基载体蛋白、谷胱甘肽-S-转移酶标签、绿色荧光蛋白标签、麦芽糖结合蛋白标签、Nus标签、Strep标签和硫氧还蛋白标签。
实施例70.根据实施例1至20中任一项所述的方法,其进一步包括纯化包括连续cDNA分子或核酸分子或DNA分子的溶液。
实施例71.根据实施例1至20中任一项所述的方法,其中在不纯化的情况下执行方法。
实施例72.根据实施例1至20中任一项所述的方法,其中经过修饰的逆转录酶来源于节肢动物。
实施例73.根据实施例72所述的方法,其中节肢动物是家蚕。
实施例74.根据实施例1至20中任一项所述的方法,其中纯化经过修饰的逆转录酶。
实施例75.根据实施例74所述的方法,其中经过修饰的逆转录酶具有至少约80%的纯度。
实施例76.根据实施例70所述的方法,其中纯化溶液包括两个纯化步骤。
实施例77.根据实施例76所述的方法,其中两个纯化步骤包括镍亲和纯化和肝素亲和纯化。
实施例78.根据实施例74所述的方法,其中经过修饰的逆转录酶通过固定金属亲和色谱(IMAC)来纯化。
实施例79.根据实施例1至20中任一项所述的方法,其中方法进一步包括盐。
实施例80.根据实施例79所述的方法,其中盐是选自由以下组成的组的至少一个成员:NaCl、LiCl、AlCl3、CuCl2、MgCl2、InCl3、SnCl4、CrCl2、CrCl3、KC1、NaI、KI、TMAC1(四甲基氯化铵)、TEACl(四乙基氯化铵)、KSCN、CsSCN、KCH3COO、CH3COONa、C5H8KNO4、C5H8NNaO4、CsCl和其任何组合。
实施例81.根据实施例80所述的方法,其中盐包括NaCl。
实施例82.根据实施例1至20中任一项所述的方法,其中方法进一步包括清洁剂。
实施例83.根据实施例82所述的方法,其中清洁剂是非离子和/或两性离子清洁剂。
实施例84.根据实施例83所述的方法,其中非离子清洁剂选自由以下组成的组:Tween、Triton、Triton CF-21、Triton CF-32、Triton DF-12、Triton DF-16、Triton GR-SM、Triton N-101(聚氧乙烯含支链壬基苯基醚)、Triton QS-15、Triton QS-44、TritonRW-75(聚乙二醇260单(十六烷基/十八烷基)醚和1-十八醇)、Triton X-100(聚乙二醇叔辛基苯基醚)、Triton X-102、Triton X-15、Triton X-151、Triton X-200、Triton X-207、Triton X-114、Triton X-165、Triton X-305、Triton X-405(聚氧乙烯(40)异辛基苯基醚)、还原Triton X-405(聚氧乙烯(40)异辛基苯基醚)、Triton X-45(聚乙二醇4-叔辛基苯基醚)、Triton X-705-70、任何形式的TWEEN(包含:TWEEN 20(聚氧乙烯山梨醇酐单月桂酸酯)、TWEEN 21(聚氧乙烯山梨醇酐单月桂酸酯)、TWEEN 40(聚氧乙烯(20)山梨醇酐单棕榈酸酯)、TWEEN 60(聚乙二醇山梨醇酐单硬脂酸酯)、TWEEN 61(聚乙二醇山梨醇酐单硬脂酸酯)、TWEEN 65(聚氧乙烯山梨醇酐三硬酯酸酯)、TWEEN 80(聚氧乙烯山梨醇酐单油酸酯)、TWEEN 81(聚氧乙烯山梨醇酐单油酸酯)、TWEEN 85(聚氧乙烯(20)山梨醇酐三油酸酯))、Brij、Brij 30(聚氧乙烯4月桂基醚)、Brij 35(聚氧乙烯23月桂基醚)、Brij 52(聚氧乙烯2鲸蜡基醚)、Brij56(聚氧乙烯10鲸蜡基醚)、Brij 58(聚氧乙烯20鲸蜡基醚)、Brij 72(聚氧乙烯2硬脂基醚)、Brij 76(聚氧乙烯10硬脂基醚)、Brij 78(聚氧乙烯20硬脂基醚)、Brij92(聚氧乙烯2油基醚)、Brij 97(聚氧乙烯10油基醚)、Brij 98(聚氧乙烯20油基醚)、Brij700(聚氧乙烯100硬脂基醚)、辛基硫葡萄糖苷、麦芽糖苷以及其组合。
实施例85.根据实施例79至84中任一项所述的方法,其中盐或清洁剂改进酶活性或模板跳转。
实施例86.根据实施例5至13、17和20中任一项所述的方法,其中扩增步骤包括PCR。
实施例87.根据实施例86所述的方法,其中PCR包括至少一种扩增引物和/或聚合酶。
实施例88.根据实施例87所述的方法,其中PCR包括约4-8个循环、约10-40个循环或约1-15个循环。
实施例89.根据实施例86所述的方法,其中PCR包括约30个循环。
实施例90.根据实施例87所述的方法,其中聚合酶是热启动聚合酶。
实施例91.根据实施例86所述的方法,其进一步包括检测由扩增引物产生的扩增子,其中扩增子的存在确定样本中是否存在经过修饰的逆转录酶。
实施例92.根据实施例1至20中任一项所述的方法,其进一步包括将约12℃到约42℃的温度保持约1分钟到约5小时。
实施例93.根据实施例1至20中任一项所述的方法,其中方法以一锅(单容器)反应形式执行。
实施例94.根据实施例1至12和15至20中任一项所述的方法,其中模板介于约30个碱基对与约15000个碱基对之间。
实施例95.根据实施例94所述的方法,其中模板是约200个碱基对或约600个碱基对。
实施例96.根据实施例1至12和15至20中任一项所述的方法,其中模板介于约0.0001微摩尔与约0.1微摩尔之间。
实施例97.根据实施例96所述的方法,其中模板为至少约0.0001微摩尔。
实施例98.根据实施例1至12和15至20中任一项所述的方法,其中模板或片段化或已降解模板为至少约50飞摩尔。
实施例99.根据实施例1至13、15至16和18至20中任一项所述的方法,其中受体核酸分子包括至少一个经过修饰的核苷酸。
实施例100.根据实施例1至20中任一项所述的方法,其中引物包括一个或多个随机引物。
实施例101.根据实施例1至20中任一项所述的方法,其中引物包括R2RNA引物。
实施例102.根据实施例1至20中任一项所述的方法,其中引物进一步包括衔接子序列。
实施例103.根据实施例1至20中任一项所述的方法,其中经过修饰的逆转录酶包括与以下的融合物:Fh8、MBP、NusA、Trx、SUMO、GST、SET、GB1、ZZ、HaloTag、SNUT、Skp、T7PK、EspA、Mocr、Ecotin、CaBP、ArsC、IF2结构域I、表达度标签、RpoA、SlyD、Tsf、RpoS、PotD、Crr、msyB、yjgD、rpoD或其任何组合。
实施例104.一种用于制备经过修饰的逆转录酶的方法,该方法包括以下步骤中的至少一者:(a)对编码逆转录酶的DNA序列进行随机或合理突变;(b)对编码逆转录酶的DNA序列进行氨基酸截短;(c)对编码逆转录酶的DNA序列进行变异,包括氨基酸残基的插入、缺失或取代;(d)使编码逆转录酶的DNA序列与蛋白质或结构域融合;以及(e)对编码逆转录酶的DNA序列进行同源基因DNA改组;其中步骤(a)到(e)中的任一者中获得的DNA序列表达于宿主细胞中,且其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质。
实施例105.根据实施例104所述的方法,其进一步包括筛选表达经过修饰的逆转录酶的宿主细胞。
实施例106.根据实施例105所述的方法,其进一步包括制备由宿主细胞表达的经过修饰的逆转录酶。
实施例107.根据实施例104所述的方法,其进一步包括以下中的至少一者:确定逆转录酶(RT)活性,估计逆转录酶活性分数,和测试突变体的稳定性和稳固性。
实施例108.根据实施例107所述的方法,其中通过逆转录酶活性分析监测RT活性、RT活性分数或突变体的稳定性和稳固性。
实施例109.一种经过修饰的多肽,其具有逆转录酶活性和至少一种改进酶性质的变化特性,其中经过修饰的多肽包括与对应于表1中提供的美国国家生物技术信息中心(NCBI)基因库数据库寄存编号的任一个序列具有至少约85%氨基酸序列一致性的氨基酸序列。
实施例110.一种经过修饰的多肽,其具有逆转录酶活性和至少一种相对于野生型或未修饰逆转录酶变化的特性,其变化特性使得逆转录酶能够(i)在无热循环的情况下由模板核酸分子产生互补脱氧核糖核酸(cDNA)分子,和(ii)以最多约5%的误差率产生cDNA分子的一个或多个拷贝,其中经过修饰的多肽是具有对应于表1中提供的任一寄存编号的任一序列的截短变异体。
实施例111.一种经过修饰的多肽,其具有逆转录酶活性和至少一种改进酶性质的变化特性,其中经过修饰的多肽包括与以下各者具有至少约85%氨基酸序列一致性的氨基酸序列:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:20、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35、SEQ IDNO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ IDNO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ IDNO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ IDNO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ IDNO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ IDNO:66或SEQ ID NO:67。
实施例112.根据实施例109至111中任一项所述的经过修饰的多肽,其中改进酶性质的特性包括以下中的至少一者:增加的稳定性;增加的比活性;增加的蛋白质表达;改进的纯化;改进的持续合成能力;改进的链置换;改进的模板跳转;增加的DNA/RNA亲和力;以及增加的保真性。
实施例113.根据实施例109至111中任一项所述的经过修饰的多肽,其中经过修饰的多肽包括N端截短、C端截短或N端和C端截短。
实施例114.根据实施例109至113中任一项所述的经过修饰的多肽,其中经过修饰的多肽包括小于约100个氨基酸残基的截短。
实施例115.根据实施例109至114中任一项所述的经过修饰多肽,其中经过修饰的多肽包括以下修饰中的一个或多个:(a)小于约400个氨基酸残基的氨基端截短;以及(b)小于约400个氨基酸残基的羧基端截短。
实施例116.根据实施例109至115中任一项所述的经过修饰的多肽,其中经过修饰的多肽包括融合搭配物或载体蛋白。
实施例117.根据实施例116所述的经过修饰的多肽,其中经过修饰的多肽包括与以下的融合物:Fh8、MBP、NusA、Trx、SUMO、GST、SET、GB1、ZZ、HaloTag、SNUT、Skp、T7PK、EspA、Mocr、Ecotin、CaBP、ArsC、IF2结构域I、表达度标签、RpoA、SlyD、Tsf、RpoS、PotD、Crr、msyB、yjgD、rpoD或其任何组合。
实施例118.根据实施例116所述的经过修饰的多肽,其中融合变异体包括以下中的至少一者:相比非融合多肽增加的存放期、增加的活性分数和改进的纯化。
实施例119.一种非天然存在的酶,其对模板核酸分子进行逆转录以产生互补脱氧核糖核酸(cDNA)产物并以在30℃下测量的每个碱基至少约80%的持续合成能力扩增cDNA产物。
实施例120.一种非天然存在的酶,其对模板核酸分子进行逆转录以产生核酸产物并以在30℃下测量的每个碱基至少约80%的持续合成能力扩增核酸产物。
实施例121.根据实施例119至120所述的非天然存在的酶,其中非天然存在的酶具有针对至少一种酶性质大于1.0的性能指标。
实施例122.根据实施例121所述的非天然存在的酶,其中酶性质选自由以下组成的组:改进的稳定性、比活性、蛋白质表达、纯化、持续合成能力、链置换、模板跳转、增加的DNA/RNA亲和力和保真性。
实施例123.一种非天然存在的酶,其对模板核酸分子进行逆转录以产生互补脱氧核糖核酸(cDNA)产物并在3小时或更短的时段内以针对至少一种选自由以下组成的组的酶性质大于1.0的性能指标扩增cDNA产物:改进的稳定性、比活性、蛋白质表达、纯化、持续合成能力、链置换、模板跳转、增加的DNA/RNA亲和力和保真性,该性能指标在约12℃到约42℃的温度下测量。
实施例124.一种非天然存在的酶,其对模板核酸分子进行逆转录以产生核酸产物并在3小时或更短的时段内以针对至少一种选自由以下组成的组的酶性质大于1.0的性能指标扩增核酸产物:改进的稳定性、比活性、蛋白质表达、纯化、持续合成能力、链置换、模板跳转、增加的DNA/RNA亲和力和保真性,该性能指标在约12℃到约42℃的温度下测量。
实施例125.根据实施例123至124中任一项所述的非天然存在的酶,其中模板核酸分子是游离核酸分子。
实施例126.一种非天然存在的酶,其对模板核酸分子进行逆转录以产生互补脱氧核糖核酸(cDNA)产物并在约3小时或更短的时段内以针对给定核苷酸底物的某一持续合成能力扩增cDNA产物,该持续合成能力比参考酶针对相同核苷酸底物的持续合成能力高至少约5%。
实施例127.一种非天然存在的酶,其对模板核酸分子进行逆转录以产生核酸产物并在约3小时或更短的时段内以针对给定核苷酸底物的某一持续合成能力扩增核酸产物,该持续合成能力比参考酶针对相同核苷酸底物的持续合成能力高至少约5%。
实施例128.一种扩增核酸分子的方法,其包括使用经过修饰的逆转录酶对核酸分子进行核酸扩增,其中逆转录酶能够在约30℃下以每个碱基至少约80%的持续合成能力扩增核酸分子。
实施例129.根据实施例128所述的方法,其进一步包括使用经过修饰的逆转录酶对模板核酸分子进行逆转录以产生核酸分子。
实施例130.根据实施例128所述的方法,其中核酸分子是游离核酸分子。
实施例131.一种试剂盒,其包括:引物、一个或多个引物或随机引物、核苷酸、至少一种经过修饰的逆转录酶、模板和执行根据实施例1至20中任一项所述的方法的说明书。
实施例132.根据实施例131所述的试剂盒,其中试剂盒包括具有逆转录或核酸扩增活性且能够在约30℃的温度下进行模板跳转的经过修饰的逆转录酶。
实施例133.一种用于检测核酸的试剂盒,其包括模板、至少一种经过修饰的逆转录酶、核苷酸和执行根据实施例3至4和13中任一项所述的方法的说明书,其中核酸以至少约50飞摩尔的浓度存在。
实施例134.一种对有需要的受试者的癌症进行检测、诊断或预后的方法,该方法包括:(a)获得根据实施例10所述的来源于受试者的游离核酸样本的序列信息;以及(b)使用来源于(a)的序列信息检测游离核酸样本中的肿瘤核酸,其中在小于或等于游离核酸样本中的总核酸分子的约2%的浓度下检测到肿瘤核酸。
实施例135.根据实施例134所述的方法,其中在小于或等于游离核酸样本中的总核酸分子的约1.75%的浓度下检测到肿瘤核酸。
实施例136.根据实施例134所述的方法,其中序列信息包括关于至少2个基因组区域的信息。
实施例137.根据实施例134所述的方法,其中步骤(a)的获得序列信息包括使用一个或多个衔接子。
实施例138.根据实施例137所述的方法,其中一个或多个衔接子包括含有随机序列的分子条形码。
实施例139.根据实施例134所述的方法,其中对癌症进行诊断或预后具有至少约50%的敏感度。
实施例140.根据实施例134所述的方法,其中对癌症进行诊断或预后具有至少约50%的特异性。
实施例141.根据实施例134中任一项所述的方法,其中核酸是RNA、DNA或RNA和DNA的组合。
实施例142.一种制备用于测序的核酸分子的方法,其包括:从受试者获得含有游离核酸的样本,其中游离核酸包括脱氧核糖核酸(DNA)和核糖核酸(RNA)分子;将聚腺苷酸尾添加到核酸,包括将游离核酸与转移酶或聚合酶中的至少一者和至少一种核苷酸底物混合;在足以使引物退火到核酸的聚腺苷酸尾的条件下混合一个或多个引物;以及在足以扩增核酸的条件下混合经过修饰的逆转录酶,其中经过修饰的逆转录酶包括至少一种相对于野生型或未修饰逆转录酶改进的酶性质。
实施例143.根据实施例142所述的方法,其中(b)包括转移酶和聚合酶。
实施例144.根据实施例142所述的方法,其中转移酶包括末端脱氧核苷酸转移酶(TdT)。
实施例145.根据实施例142所述的方法,其中聚合酶包括多聚腺苷酸聚合酶。
实施例146.根据实施例142所述的方法,其中核苷酸底物包括dCTP、dGTP、dTTP和ATP中的至少一者。
实施例147.一种用于制备用于测序的核酸分子的方法,其包括:将游离核酸与寡核苷酸-链霉亲和素结合物混合,其中寡核苷酸-链霉亲和素结合物能够退火到核酸;以及在足以使核酸转录的条件下将退火到核酸的寡核苷酸-链霉亲和素结合物与经过修饰的逆转录酶混合。
实施例148.根据实施例147所述的方法,其中寡核苷酸-链霉亲和素结合物包括寡核苷酸引物。
实施例149.根据实施例147所述的方法,其中寡核苷酸-链霉亲和素结合物包括寡核苷酸引物和寡核苷酸受体。
实施例150.根据实施例149所述的方法,其中寡核苷酸受体极为接近已退火核酸以便允许模板跳转。
实施例151.根据实施例147至150中任一项所述的方法,其中寡核苷酸-链霉亲和素结合物包括磁珠。
实施例152.根据实施例151所述的方法,其进一步包括已退火的核酸的富集。
实施例153.根据实施例142至152中任一项所述的方法,其中游离核酸包括ssDNA、dsDNA、dsRNA、ssRNA、细胞外RNA和来自外泌体的RNA中的至少一者。
实施例154.一种用于使用模板跳转制备核酸分子的方法,其包括:(a)将引物退火到核酸模板;以及(b)在足以产生核酸分子的条件下将退火引物的模板与经过修饰的逆转录酶、具有编辑能力的聚合酶和受体核酸分子混合。
实施例155.根据实施例154所述的方法,其中依序执行步骤(a)和(b)。
实施例156.根据实施例154所述的方法,其中同时执行步骤(a)和(b)。
实施例157.根据实施例142至156中任一项所述的方法,其中逆转录酶是DNA聚合酶。
实施例158.根据实施例142至156中任一项所述的方法,其中逆转录酶是非长末端重复序列(LTR)逆转录转座子。
实施例159.根据实施例142至156中任一项所述的方法,其中逆转录酶是R2逆转录酶。
实施例160.根据实施例158所述的方法,其中非LTR逆转录转座子是R2非LTR逆转录转座子。
实施例161.根据实施例154至160中任一项所述的方法,其中受体核酸分子包括受保护3'端。
实施例162.根据实施例154所述的方法,其中具有编辑能力的聚合酶包括3'至5'核酸外切酶、T4DNA聚合酶、核酸外切酶I、Phi29、Pfu、Vent、KOD、核酸外切酶III和核酸外切酶T中的至少一者。
实施例163.一种用于制备用于测序的核酸分子的多联体的方法,其包括:使核酸分子与第一衔接子接合;通过在无引物的情况下进行核酸扩增反应来扩增已接合核酸分子,从而形成多联体;以及使多联体与第二衔接子接合。
实施例164.根据实施例163所述的方法,其中核酸扩增反应是聚合酶链反应(PCR)或等温扩增。
实施例165。根据实施例163至164中任一项所述的方法,其中第一衔接子包括唯一分子识别(UMI)序列。
实施例166.根据实施例163至164中任一项所述的方法,其中第一衔接子充当引物。
实施例167.根据实施例163至164中任一项所述的方法,其中第一衔接子包括单链核酸。
实施例168.根据实施例167所述的方法,其中单链核酸包括单链DNA(ssDNA)。
实施例169.根据实施例163至164中任一项所述的方法,其中第二衔接子包括双链核酸。
实施例170.根据实施例169所述的方法,其中双链核酸包括双链DNA(dsDNA)。
实施例171.根据实施例163至164中任一项所述的方法,其中第一衔接子不同于第二衔接子。
实施例172.根据实施例163至164中任一项所述的方法,其中第一衔接子包括两个或超过两个衔接子。
实施例173.根据实施例163至164中任一项所述的方法,其中第二衔接子包括两个或超过两个衔接子。
实施例174.根据实施例163中任一项所述的方法,其中核酸分子的两端包括衔接子。
实施例175.根据实施例142至174中任一项所述的方法,其中核酸分子包括ssDNA、dsDNA、dsRNA、ssRNA、细胞外RNA和来自外泌体的RNA中的至少一者。
实施例176.根据实施例163所述的方法,其中衔接子包括核苷酸修饰。
实施例177.根据实施例176所述的方法,其中核苷酸修饰包括甲基化核苷酸。
实施例178.根据实施例176所述的方法,其中核苷酸修饰包括dUTP。
实施例179.一种从用于文库测序的样本耗尽核糖体和/或转运RNA的方法,其包括:提供包括RNA的样本,其中RNA包括核糖体RNA(rRNA)和/或转运RNA(tRNA);进行扩增反应(例如聚合酶链反应(PCR)或等温扩增)以将rRNA和/或tRNA转化成双链DNA(dsDNA),其中扩增反应是部分扩增反应或完全/完整扩增反应;引入包括核酸酶或编码核酸酶的多核苷酸以及至少一种专门设计的引导寡核苷酸的复合物,其中至少一种引导寡核苷酸包括与至少一个dsDNA互补的至少一个序列,且核酸酶或编码核酸酶的多核苷酸使dsDNA的至少一个链裂解。
实施例180.一种从用于文库测序的样本耗尽核糖体和/或转运RNA的方法,其包括:提供包括RNA的样本,其中RNA包括核糖体RNA(rRNA)和/或转运RNA(tRNA);进行扩增反应(例如聚合酶链反应(PCR)一等温扩增),其中扩增反应是部分扩增反应或完全/完整扩增反应以将rRNA和/或tRNA转化成双链DNA(dsDNA);使dsDNA变性成单链DNA(ssDNA)链;引入包括结合分子和与至少一个ssDNA链互补的至少一个序列的至少一个专门设计的寡核苷酸,从而形成寡核苷酸与至少一个ssDNA链的杂交复合物;将杂交复合物固定到至少一种固体支撑物,从而从样本去除杂交复合物。
实施例181.一种从用于文库测序的样本耗尽核糖体和/或转运RNA的方法,其包括:提供包括RNA的样本,其中RNA包括核糖体RNA(rRNA)和/或转运RNA(tRNA);引入包括结合分子和与至少一个rRNA和/或tRNA互补的至少一个序列的至少一个专门设计的寡核苷酸,从而形成包括寡核苷酸和至少一个rRNA和/或tRNA的复合物;将复合物固定到至少一种固体支撑物,从而从样本去除复合物。
实施例182.根据实施例181至182中任一项所述的方法,其中结合分子是生物素。
实施例183.根据实施例181至182中任一项所述的方法,其中至少一种固体支撑物是链霉亲和素。
实施例184.一种产生游离脱氧核糖核酸(cfDNA)文库的方法,其包括:提供包括cfDNA的样本;使cfDNA变性以产生单链DNA(ssDNA)样本;在存在核苷酸和/或催化金属的情况下将包括模板、引物和逆转录酶的复合物引入到ssDNA样本,其中逆转录酶使引物在模板上延伸且随后模板跳跃到ssDNA样本以产生双链DNA(dsDNA)样本(例如其中双链DNA包括拷贝链和原始链(拷贝链是由通过逆转录酶的延伸产生的链,且原始链来自样本)),且其中dsDNA包括模板与ssDNA之间的至少一个缺口;引入包括3'至5'核酸外切酶活性的聚合酶以产生具有平端和/或3'突出端的dsDNA;引入包括在5'端处具有单链突出端的核酸双链体的(不对称)衔接子,其中(不对称)衔接子接合到dsDNA的5'端,且其中单链突出端包括与至少一个聚合酶链反应(PCR)扩增引物互补的序列;以及进行PCR反应以扩增dsDNA的仅一个链(进一步,其中dsDNA的一个链是原始DNA链)。
实施例185.根据实施例184所述的方法,其中dsDNA的一个链(原始链)改进PCR扩增的保真性。
实施例186.一种产生游离脱氧核糖核酸(cfDNA)文库的方法,其包括:提供包括cfDNA的样本;使cfDNA变性以产生单链DNA(ssDNA)样本;将末端脱氧核苷酸转移酶(TdT)和脱氧腺苷三磷酸(dATP)(及视情况存在的不可延伸核苷酸)引入到ssDNA样本以产生poly(A)和/或poly(C)尾;将包括引物和第一衔接子的复合物退火到ssDNA样本的尾,其中复合物包括与尾互补的序列;在存在核苷酸和/或催化金属的情况下引入逆转录酶以及包括受体和第二衔接子的复合物,以产生双链DNA(dsDNA)样本,其中核苷酸包括可降解核苷酸,其中逆转录酶使引物延伸且随后模板跳跃到复合物以便继续延伸;且其中复合物包括核苷酸封阻物以防止逆转录酶到达复合物的末端并跳转到另一个复合物,其中dsDNA包括原始链和拷贝链,其中原始链包括复合物与ssDNA之间的至少一个缺口,且拷贝链包括至少一个可降解核苷酸;引入包括3'至5'核酸外切酶活性的聚合酶以产生具有平端或3'突出端的dsDNA且引入DNA接合酶以接合至少一个缺口;引入至少一种尿嘧啶-DNA糖基化酶以降解至少一个可降解核苷酸,从而耗尽/去除/降解拷贝链(从而使得仅存在原始链);以及进行包括至少第一引物和/或至少第二引物的聚合酶链反应(PCR)以扩增原始链,其中第一引物包括与第一衔接子互补的序列,且第二引物包括与第二衔接子互补的序列。
实施例187.根据实施例186所述的方法,其中原始链改进PCR扩增的保真性(即,去除拷贝链并仅留下或主要留下原始链会改进PCR扩增期间的保真性)。
实施例188.一种用于制备用于测序的核酸文库的方法,其包括:(a)获得多个核酸分子;(b)通过增加该多个核酸分子的温度诱导该多个核酸分子中的至少一个分子的非酶促分子内磷酸根转移作用,从而提供含游离5'-磷酸根部分的多个核酸分子;(c)将磷酸酶添加到含游离5'-磷酸根部分的该多个核酸分子,磷酸酶由此将该游离5'-磷酸根部分中的一或多者转化成羟基,从而提供含游离羟基的多个核酸分子;(d)在存在一定量腺苷三磷酸的情况下将步骤c)的产物和聚合酶混合,由此该聚合酶从含游离羟基的该多个核酸分子的至少一个分子产生poly(A)尾;(e)在存在核苷酸的情况下将(i)包括与该poly(A)尾互补的序列的一个或多个引物、(ii)一个或多个受体核酸分子和(iii)经过修饰的逆转录酶混合,该经过修饰的逆转录酶由此通过逆转录已退火模板核酸分子的序列、迁移到受体核酸分子和逆转录该受体核酸分子的序列来产生多个连续互补脱氧核糖核酸分子;(f)将至少一种固体支撑物添加到(e)的产物,该固体支撑物由此固定过量的包括与该poly(A)尾互补的序列的一个或多个引物;以及(g)进行聚合酶链反应(PCR)反应。
实施例189.一种产生用于测序的文库的方法,其包括:提供包括核糖核酸(例如cfRNA)的样本;使样本经受足以允许RNA的磷酸根转移作用的高温(视情况,进一步,其中将催化金属(镁)和/或多胺引入到样本);引入磷酸酶以将RNA的磷酸根部分转化成3'-羟基;引入腺苷三磷酸和聚合酶以在RNA的3'-羟基上产生poly(A)尾;在存在核苷酸的情况下引入引物、受体和逆转录酶,其中引物包括与poly(A)尾互补的序列,从而退火到poly(A)尾,且其中逆转录酶使引物延伸且随后模板跳跃到受体以便继续延伸;引入至少一种固体支撑物以将过量引物和非特异性引物产物固定到至少一种固体支撑物,从而从样本去除过量引物和非特异性引物产物;以及进行聚合酶链反应(PCR)反应以扩增RNA。
序列:
AAB59214.1逆转录酶样蛋白[家蚕];SEQ ID NO:1
T18197逆转录酶样蛋白—蚕;SEQ ID NO:2
KMQ90176.1逆转录酶[黑蚁];SEQ ID NO:3
KYB24671.1来自2类逆转录转座子R2DM样蛋白的逆转录病毒相关Pol多蛋白[赤拟谷盗];SEQ ID NO:4
KMQ90064.1逆转录酶[黑蚁];SEQ ID NO:5
ACJ71597.1逆转录酶[美国蝇];SEQ ID NO:6
AFM44926.1R2蛋白[蝗虫];SEQ ID NO:7
AHN53448.1逆转录酶[南非蜱(Nuttalliella namaqua)];SEQ ID NO:8
ACJ46647.1逆转录酶[恐龙虾];SEQ ID NO:9
BAC82590.1逆转录酶[玻璃海鞘];SEQ ID NO:10
AAB94032.1逆转录酶结构域蛋白[果蝇];SEQ ID NO:11
AAC34906.1部分逆转录酶[地蜈蚣];SEQ ID NO:12
BAC82589.1逆转录酶[玻璃海鞘];SEQ ID NO:13
AIL01110.1逆转录酶[竹节虫];SEQ ID NO:14
AF019998.1R2蛋白[磷尾虫];SEQ ID NO:15
KMQ88340.1逆转录酶[黑蚁];SEQ ID NO:16
AF019997.1R2蛋白[磷尾虫];SEQ ID NO:17
AAC34903.1部分逆转录酶[海滨跳虫];SEQ ID NO:18
AF019995.1R2蛋白[蝌蚪虾];SEQ ID NO:19
BAC82591.1部分逆转录酶[玻璃海鞘];SEQ ID NO:20
CAX83712.1核酸内切酶-逆转录酶[日本血吸虫];SEQ ID NO:21
XP_009165216.1部分假定蛋白T265_13057[泰国肝吸虫];SEQ ID NO:22
AAB94040.1部分逆转录酶[斑长足瓢虫];SEQ ID NO:23
AAV85443.1部分逆转录酶样蛋白[美洲银眼蜱];SEQ ID NO:24
AAV85445.1部分逆转录酶样蛋白[肩突硬蜱];SEQ ID NO:25
KRY44798.1来自2类逆转录转座子R2DM的逆转录病毒相关Pol多蛋白[布氏旋毛虫];SEQ ID NO:26
AAV85444.1部分逆转录酶样蛋白[微小扇头蜱];SEQ ID NO:27
KRX52183.1来自2类逆转录转座子R2DM的逆转录病毒相关Pol多蛋白[旋毛虫属T9];SEQ ID NO:28
KRX72028.1来自2类逆转录转座子R2DM的逆转录病毒相关Pol多蛋白[旋毛虫属T6];SEQ ID NO:29
AF019999.1部分R2蛋白[磷尾虫];SEQ ID NO:30
AAA21258.1逆转录酶[欧洲果蝇];SEQ ID NO:31
KRX12851.1来自2类逆转录转座子R2DM的逆转录病毒相关Pol多蛋白[尼氏旋毛虫];SEQ ID NO:32
KFD59471.1假定蛋白M51411684[猪鞭虫];SEQ ID NO:33
KXZ75771.1假定蛋白TcasGA2_TC031700[赤拟谷盗];SEQ ID NO:34
XP_002412745.1假定逆转录酶[肩突硬蜱];SEQ ID NO:35
BAE46603.1部分逆转录酶[布氏粘盲鳗];SEQ ID NO:36
AF020000.1部分R2蛋白[恐龙虾];SEQ ID NO:37
KRX36111.1来自2类逆转录转座子R2DM的逆转录病毒相关Pol多蛋白[穆氏旋毛虫];SEQ ID NO:38
KRZ66264.1来自2类逆转录转座子R2DM的逆转录病毒相关Pol多蛋白[巴氏旋毛虫];SEQ ID NO:39
KRY45664.1来自2类逆转录转座子R2DM的逆转录病毒相关Pol多蛋白[布氏旋毛虫];SEQ ID NO:40
CAJ00246.1TPA:多蛋白[曼氏血吸虫];SEQ ID NO:41
Q03278来自1类逆转录转座子R2的逆转录病毒相关Pol多蛋白[蝇蛹金小蜂(寄生蜂)];SEQ ID NO:42
Q03279来自1类逆转录转座子R2的逆转录病毒相关Pol多蛋白[粪生蕈蚊(黑翅蕈蚊)(尖眼蕈蚊)];SEQ ID NO:43
KXZ75830.1假定蛋白TcasGA2_TC031908[赤拟谷盗];SEQ ID NO:44
PI6423.1来自2类逆转录转座子R2DM的逆转录病毒相关Pol多蛋白[黑腹果蝇];SEQ ID NO:45
KRX34481.1来自2类逆转录转座子R2DM的逆转录病毒相关Pol多蛋白[穆氏旋毛虫];SEQ ID NO:46
EEB 15300.1假定逆转录酶[头虱];SEQ ID NO:47
XP_002431867.1假定逆转录酶[头虱];SEQ ID NO:48

Claims (82)

1.一种用于制备互补脱氧核糖核酸(cDNA)分子的方法,其包括:
(a)将引物退火到模板核酸分子上,从而产生已退火模板核酸分子;以及
(b)在存在核苷酸的情况下,将以下各者混合:
i.所述已退火模板核酸分子;
ii.一个或多个受体核酸分子;和
iii.经过修饰的逆转录酶,其中所述经过修饰的逆转录酶通过以下操作产生多个连续互补脱氧核糖核酸分子:i)逆转录所述已退火模板核酸分子的序列;ii)迁移到受体核酸分子;和iii)在约12℃到约42℃的温度下以最多约5%的误差率逆转录所述受体核酸分子的序列。
2.根据权利要求1所述的方法,其中所述迁移与所述模板核酸分子和所述受体核酸分子之间的序列一致性无关。
3.根据权利要求1所述的方法,其中(a)和(b)在单个容器执行。
4.根据权利要求1所述的方法,其进一步包括对包括多个不同核糖核酸(RNA)分子的多个异质模板核酸分子执行所述方法。
5.根据权利要求4所述的方法,其中所述多个不同核糖核酸分子包括信使RNA(mRNA)、核糖体RNA(rRNA)、转运RNA(tRNA)、微小RNA(mRNA)和长链非编码RNA(lncRNA)。
6.根据权利要求1所述的方法,其中在最多约2小时内制备所述多个连续互补脱氧核糖核酸分子。
7.根据权利要求1所述的方法,其中所述模板核酸分子选自由以下组成的组:人工片段化DNA模板、天然片段化DNA模板、人工片段化核糖核酸(RNA)模板、天然片段化核糖核酸(RNA)模板或其组合。
8.根据权利要求1所述的方法,其中所述经过修饰的逆转录酶以每个碱基至少约80%的持续合成能力扩增所述已退火模板核酸分子。
9.根据权利要求1所述的方法,其中所述经过修饰的逆转录酶包括至少一种相对于野生型未修饰逆转录酶有所改进的酶性质。
10.根据权利要求9所述的方法,其中所述至少一种已改进酶性质选自由以下组成的组:相对于所述野生型未修饰逆转录酶的较高热稳定性、较高比活性、较高持续合成能力、较高链置换、较高端到端模板跳转、较高亲和力及较高保真性。
11.根据权利要求1所述的方法,其中所述经过修饰的逆转录酶是R2逆转录酶。
12.根据权利要求1所述的方法,其中所述经过修饰的逆转录酶与SEQ ID NO:49、SEQID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66或SEQ ID NO:67具有至少90%的一致性,且相对于SEQ ID NO:52含有至少一个取代修饰。
13.根据权利要求1所述的方法,其进一步包括在执行步骤(a)和(b)之后添加标签到所述模板核酸分子,从而产生多个带标签的连续互补脱氧核糖核酸分子。
14.根据权利要求1所述的方法,其进一步包括对所述带标签的多个连续互补脱氧核糖核酸分子进行测序。
15.根据权利要求1所述的方法,其中所述经过修饰的逆转录酶进一步包括标签。
16.根据权利要求15所述的方法,其中所述标签选自由以下组成的组:生物素、叠氮基、乙炔基、His标签、钙调蛋白标签、CBP、CYD、Strep II、FLAG标签、HA标签、Myc标签、S标签、SBP标签、Softag-1、Softag-3、V5标签、Xpress标签、isopeptag、SpyTag B、HPC肽标签、GST、MBP、生物素羧基载体蛋白、谷胱甘肽-S-转移酶标签、绿色荧光蛋白标签、麦芽糖结合蛋白标签、Nus标签、Strep标签和硫氧还蛋白标签。
17.根据权利要求1所述的方法,其进一步包括进行聚合酶链反应(PCR)扩增反应,从而形成一个或多个扩增子。
18.根据权利要求17所述的方法,其中(a)和(b)以及所述PCR扩增反应在同一容器中进行。
19.根据权利要求17所述的方法,其中所述PCR扩增在足以使所述逆转录酶失活的温度下进行。
20.根据权利要求1所述的方法,其中所述一个或多个受体核酸分子包括通过所述经过修饰的逆转录酶停止所述逆转录的经过修饰的核苷酸。
21.根据权利要求1所述的方法,其进一步包括从受试者获得包括一个或多个模板核酸分子的样本并将一个或多个引物退火到所述一个或多个模板核酸分子上。
22.根据权利要求21所述的方法,其中所述样本是组织样本。
23.根据权利要求21所述的方法,其中所述样本包括一种或多种游离核酸,且方法进一步包括在同一容器中进行(a)和(b)的所述反应。
24.根据权利要求21所述的方法,其进一步包括在退火一个或多个引物之前耗尽包括一个或多个模板核酸分子的所述样本的至少一个核糖体RNA(rRNA)。
25.根据权利要求24所述的方法,其中所述耗尽所述至少一个核糖体RNA(rRNA)的步骤包括使寡核苷酸与所述rRNA杂交。
26.根据权利要求24所述的方法,其中所述耗尽所述至少一个核糖体RNA(rRNA)的步骤包括所述rRNA的寡核苷酸探针引导式内切核苷酸裂解。
27.根据权利要求21所述的方法,其中所述一个或多个模板核酸分子包括至少一个转运RNA(tRNA),且所述方法进一步包括在退火一个或多个引物之前耗尽所述一个或多个模板核酸分子的所述至少一个tRNA。
28.根据权利要求1所述的方法,其中所述方法在不纯化所述一个或多个已退火模板核酸分子的情况下执行。
29.根据权利要求1所述的方法,其进一步包括纯化包括所述多个连续互补脱氧核糖核酸分子的所述混合物。
30.根据权利要求29所述的方法,其中所述纯化包括两个纯化步骤。
31.根据权利要求30所述的方法,其中所述两个纯化步骤包括镍亲和纯化步骤和肝素亲和纯化步骤。
32.根据权利要求1所述的方法,其中对约0.1nM到约100nM所述一个或多个模板核酸分子执行所述方法。
33.根据权利要求1所述的方法,其进一步包括将一个或多个随机引物退火到所述模板核酸分子上。
34.根据权利要求1所述的方法,其中所述引物与一个或多个衔接子序列杂交。
35.根据权利要求1所述的方法,其中所述模板核酸分子来源于单个细胞。
36.一种用于制备互补脱氧核糖核酸分子的方法,其包括:
(a)将一个或多个引物退火到一定量的模板核酸分子上,从而产生一个或多个已退火模板核酸分子;以及
(b)在存在核苷酸的情况下,将以下各者混合:
i.所述一个或多个已退火模板核酸分子;
ii.一个或多个受体核酸分子;和
iii.经过修饰的逆转录酶,所述经过修饰的逆转录酶由此通过逆转录已退火模板核酸分子的序列、迁移到受体核酸分子并在无需在单个反应容器中进行热循环的情况下逆转录所述受体核酸分子的序列来产生多个连续互补脱氧核糖核酸分子。
37.根据权利要求36所述的方法,其中所述迁移与所述模板核酸分子和所述受体核酸分子之间的序列一致性无关。
38.根据权利要求36所述的方法,其中在最多约2小时内制备所述多个连续互补脱氧核糖核酸分子。
39.根据权利要求36所述的方法,其中所述一定量的模板核酸分子选自由以下组成的组:人工片段化DNA模板、天然片段化DNA模板、人工片段化核糖核酸(RNA)模板、天然片段化核糖核酸(RNA)模板或其组合。
40.根据权利要求36所述的方法,其中所述一定量的模板核酸分子包括一种或多种游离核酸。
41.根据权利要求36所述的方法,其中所述经过修饰的逆转录酶包括至少一种相对于野生型未修饰逆转录酶有所改进的酶性质。
42.根据权利要求41所述的方法,其中所述已改进酶性质选自由以下组成的组:相对于所述野生型未修饰逆转录酶的较高热稳定性、较高比活性、较高持续合成能力、较高链置换、较高端到端模板跳转、较高亲和力及较高保真性。
43.根据权利要求36所述的方法,其中所述经过修饰的逆转录酶是R2逆转录酶。
44.根据权利要求36所述的方法,其中所述经过修饰的逆转录酶与SEQ ID NO:49、SEQID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66或SEQ ID NO:67具有至少90%的一致性,且相对于SEQ ID NO:52含有至少一个取代修饰。
45.根据权利要求36所述的方法,其进一步包括在执行步骤(a)和(b)之后添加标签到所述一定量的模板核酸分子,从而产生多个带标签的连续互补脱氧核糖核酸分子。
46.根据权利要求所述的方法45,其进一步包括对所述多个带标签的连续互补脱氧核糖核酸分子进行测序。
47.根据权利要求36所述的方法,其中所述经过修饰的逆转录酶进一步包括标签。
48.根据权利要求47所述的方法,其中所述标签选自由以下组成的组:生物素、叠氮基、乙炔基、His标签、钙调蛋白标签、CBP、CYD、Strep II、FLAG标签、HA标签、Myc标签、S标签、SBP标签、Softag-1、Softag-3、V5标签、Xpress标签、isopeptag、SpyTag B、HPC肽标签、GST、MBP、生物素羧基载体蛋白、谷胱甘肽-S-转移酶标签、绿色荧光蛋白标签、麦芽糖结合蛋白标签、Nus标签、Strep标签和硫氧还蛋白标签。
49.根据权利要求36所述的方法,其中所述一个或多个受体核酸分子包括通过所述经过修饰的逆转录酶停止所述逆转录的经过修饰的核苷酸。
50.如权利要求36所述的方法,其进一步包括从受试者获得样本。
51.根据权利要求50所述的方法,其中所述样本包括一种或多种游离核酸,且方法进一步包括在同一容器中进行(a)和(b)的所述反应。
52.根据权利要求50所述的方法,其中所述样本是组织样本。
53.根据权利要求36所述的方法,其进一步包括在退火一个或多个引物之前耗尽所述一个或多个模板核酸分子的至少一个核糖体RNA(rRNA)。
54.根据权利要求53所述的方法,其中所述耗尽所述至少一个核糖体RNA(rRNA)的步骤包括使寡核苷酸与所述rRNA杂交。
55.根据权利要求53所述的方法,其中所述耗尽所述至少一个核糖体RNA(rRNA)的步骤包括所述rRNA的寡核苷酸探针引导式内切核苷酸裂解。
56.根据权利要求36所述的方法,其进一步包括在退火一个或多个引物之前耗尽所述一定量的模板核酸分子的至少一个转运RNA(tRNA)。
57.根据权利要求36所述的方法,其中所述方法在不纯化所述一个或多个已退火模板核酸分子的情况下执行。
58.根据权利要求36所述的方法,其进一步包括纯化包括所述多个连续互补脱氧核糖核酸分子的所述混合物。
59.根据权利要求58所述的方法,其中所述纯化包括两个纯化步骤。
60.根据权利要求59所述的方法,其中所述两个纯化步骤包括镍亲和纯化步骤和肝素亲和纯化步骤。
61.根据权利要求36所述的方法,其中所述一定量的模板核酸分子是约0.1nM到约100nM的所述一个或多个模板核酸分子。
62.根据权利要求36所述的方法,其中所述一个或多个引物包括一个或多个随机引物。
63.根据权利要求36所述的方法,其中所述一个或多个引物与一个或多个衔接子序列杂交。
64.根据权利要求36所述的方法,其中所述一定量的模板核酸分子来源于单个细胞。
65.一种多肽,其具有逆转录酶活性,其包括与SEQ ID NO:49、SEQ ID NO:50、SEQ IDNO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ IDNO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ IDNO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66或SEQ ID NO:67具有至少90%的一致性且相对于SEQ ID NO:52含有至少一个取代修饰的氨基酸序列。
66.一种已纯化多肽,其包括来自R2逆转录酶的一个或多个结构域,其中所述已纯化多肽以最多约5%的误差率由模板核酸分子产生互补脱氧核糖核酸分子的一个或多个拷贝。
67.根据权利要求66所述的多肽,其中所述多肽以每个碱基至少约80%的持续合成能力逆转录所述模板核酸分子。
68.根据权利要求66所述的多肽,其中所述多肽在约12℃到约42℃的温度下逆转录所述模板核酸分子。
69.根据权利要求66所述的多肽,其中所述多肽包括如SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ IDNO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66或SEQ ID NO:67中所列的氨基酸序列。
70.一种非天然存在的酶,其包括来自R2逆转录酶的一个或多个结构域,其中所述非天然存在的酶在小于三小时的时段中以针对至少一种酶性质大于1.0的性能指标产生互补脱氧核糖核酸产物,所述至少一种酶性质选自由以下组成的组:相比于具有SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:53、SEQ ID NO:54、SEQ ID NO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ IDNO:61、SEQ ID NO:62、SEQ ID NO:63、SEQ ID NO:64、SEQ ID NO:65、SEQ ID NO:66或SEQID NO:67的已纯化酶改进的稳定性、比活性、蛋白表达、纯化、持续合成能力、链置换、模板跳转、增大的DNA/RNA亲和力和保真性。
71.一种方法,其包括:
(a)添加核酸酶复合物到多个双链核酸分子,其中所述核酸酶复合物包括:
i.Cas9核酸酶或其功能变异体;和
ii.至少一个合成引导寡核苷酸,其中所述合成引导寡核苷酸与所述多个双链核酸分子中的至少一个双链核酸分子中的核糖体核糖核酸(rRNA)区域或转运核糖核酸(tRNA)区域互补;
(b)使所述复合物裂解至少一个双链核酸分子的所述rRNA或tRNA区域,从而提供至少一个已裂解双链核酸分子,以及
(c)对所述至少一个已裂解双链核酸分子或其衍生物进行核酸测序,从而得到缺乏所述rRNA或tRNA区域的所述至少一个双链核酸分子的核酸序列。
72.根据权利要求71所述的方法,其中所述合成引导寡核苷酸与核糖体核糖核酸(rRNA)互补。
73.根据权利要求71所述的方法,其中所述合成引导寡核苷酸与转运核糖核酸(tRNA)互补。
74.根据权利要求71所述的方法,其中所述方法不需要在测序之前使包括来源于rRNA和tRNA的序列的所述多个双链分子变性。
75.根据权利要求71所述的方法,其中所述多个双链核酸分子包括cDNA。
76.一种用于制备核酸分子的多联体的方法,其包括:
(a)处理多个双链核酸分子的末端;
(b)添加第一多个衔接子分子到所述多个双链核酸分子,其中所述第一多个衔接子分子包括一个或多个突出端序列,其中至少两个突出端序列彼此互补,从而提供第一多个衔接子连接双链核酸分子;
(c)在不存在引物的情况下添加聚合酶到所述第一多个衔接子连接双链核酸分子,所述聚合酶由此通过使两个或超过两个衔接子连接双链核酸分子通过所述一个或多个突出端序列接合来形成第一组衔接子连接双链核酸多联体;
(d)添加第二多个衔接子分子到所述第一组,其中所述第二多个衔接子分子包括一个或多个突出端序列,其中至少两个突出端序列彼此互补,从而提供第二组衔接子连接双链核酸分子;
(e)对一组衔接子分子重复(a)到(c),得到包括预定平均长度的多联体。
77.根据权利要求76所述的方法,其中所述(a)中的处理包括末端修复。
78.根据权利要求76所述的方法,其中所述聚合酶是逆转录酶。
79.根据权利要求78所述的方法,其中所述逆转录酶是R2逆转录酶或其功能变异体。
80.根据权利要求76所述的方法,其中所述第一多个衔接子分子、所述第二多个衔接子分子或二者包括唯一分子识别序列(UMI)。
81.根据权利要求76所述的方法,其中所述聚合酶在PCR或等温扩增反应中使两个或超过两个衔接子连接双链核酸分子接合。
82.根据权利要求76所述的方法,其中所述第一多个衔接子分子、所述第二多个衔接子分子或二者包括至少一个经过修饰的核苷酸。
CN201780083440.XA 2016-11-11 2017-11-10 处理核酸样本的方法 Pending CN110312800A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662421028P 2016-11-11 2016-11-11
US62/421,028 2016-11-11
US201762477211P 2017-03-27 2017-03-27
US62/477,211 2017-03-27
PCT/US2017/061197 WO2018089860A1 (en) 2016-11-11 2017-11-10 Methods for processing nucleic acid samples

Publications (1)

Publication Number Publication Date
CN110312800A true CN110312800A (zh) 2019-10-08

Family

ID=62109339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780083440.XA Pending CN110312800A (zh) 2016-11-11 2017-11-10 处理核酸样本的方法

Country Status (6)

Country Link
US (4) US11104943B2 (zh)
EP (2) EP4151729A1 (zh)
JP (2) JP7155136B2 (zh)
KR (2) KR102489902B1 (zh)
CN (1) CN110312800A (zh)
WO (1) WO2018089860A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113005179A (zh) * 2021-02-26 2021-06-22 广东省中医院(广州中医药大学第二附属医院、广州中医药大学第二临床医学院、广东省中医药科学院) 一种基于dna-多肽探针技术定量核酸的质谱方法和应用
WO2024131786A1 (zh) * 2022-12-19 2024-06-27 北京干细胞与再生医学研究院 一种在基因组插入大片段dna的系统
WO2024212753A1 (en) * 2023-04-11 2024-10-17 Beijing Astragenomics Technology Co., Ltd. Non-ltr retrotransposon system and use thereof

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3529400B1 (en) 2016-10-24 2021-02-17 Geneinfosec, Inc. Concealing information present within nucleic acids
EP4151729A1 (en) 2016-11-11 2023-03-22 Bio-Rad Laboratories, Inc. Methods for processing nucleic acid samples
WO2020014528A1 (en) * 2018-07-13 2020-01-16 The Regents Of The University Of California Retrotransposon-based delivery vehicle and methods of use thereof
WO2020033777A2 (en) * 2018-08-08 2020-02-13 The Regents Of The University Of California COMPOSITIONS AND METHODS FOR ORDERED AND CONTINUOUS COMPLEMENTARY DNA (cDNA) SYNTHESIS ACROSS NON-CONTINUOUS TEMPLATES
WO2020047124A1 (en) 2018-08-28 2020-03-05 Flagship Pioneering, Inc. Methods and compositions for modulating a genome
CN110904512A (zh) * 2018-09-14 2020-03-24 广州华大基因医学检验所有限公司 一种适用于单链dna的高通量测序文库构建方法
EP4025686A4 (en) 2019-09-03 2023-09-13 Myeloid Therapeutics, Inc. GENOMIC INTEGRATION METHODS AND COMPOSITIONS
US20230040216A1 (en) * 2019-11-19 2023-02-09 The Broad Institute, Inc. Retrotransposons and use thereof
CN112899345A (zh) * 2019-12-03 2021-06-04 暨南大学 一种核糖体印迹测序文库构建方法
WO2021142197A1 (en) * 2020-01-09 2021-07-15 Duke University Composistions and methods for crispr enabled dna synthesis
KR20230053735A (ko) 2020-03-04 2023-04-21 플래그쉽 파이어니어링 이노베이션스 브이아이, 엘엘씨 게놈의 조정을 위한 개선된 방법 및 조성물
KR102482668B1 (ko) * 2020-03-10 2022-12-29 사회복지법인 삼성생명공익재단 고유 분자 식별자의 표지 정확도를 증진하는 방법
JP7522431B2 (ja) 2020-04-01 2024-07-25 国立大学法人北海道大学 動物試料からのウイルス検出方法
EP4139485B1 (en) * 2020-04-22 2023-09-06 10X Genomics, Inc. Methods for spatial analysis using targeted rna depletion
CN114075558B (zh) * 2020-08-21 2024-04-26 深圳华大生命科学研究院 一种wh54聚合酶及其在rt-pcr中的应用
EP4225941A4 (en) * 2020-10-09 2024-07-10 Univ California IMPROVEMENTS IN REACTIONS WITH NON-RETROVIRAL REVERSE TRANSCRIPTASE
JP2024533311A (ja) 2021-09-08 2024-09-12 フラッグシップ パイオニアリング イノベーションズ シックス,エルエルシー ゲノムを調節するための方法及び組成物
WO2023197015A1 (en) * 2022-04-08 2023-10-12 New England Biolabs, Inc. Compositions and analysis of dephosphorylated oligoribonucleotides
WO2024145553A1 (en) * 2022-12-29 2024-07-04 Illumina, Inc. Materials and methods for preparation of a spatial transcriptomics library

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060281079A1 (en) * 2000-08-30 2006-12-14 Eickbush Thomas H Method of performing reverse transcription reaction using reverse transcriptase encoded by non-ltr retrotransposable element
US20100267573A1 (en) * 2006-08-25 2010-10-21 Keene Jack D Methods for In Vivo Identification of Endogenous mRNA Targets of MicroRNAs

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2939708A (en) 1957-07-31 1960-06-07 Robert L Scheib Barbed point for arrows
US4663290A (en) 1982-01-21 1987-05-05 Molecular Genetics, Inc. Production of reverse transcriptase
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US5374553A (en) 1986-08-22 1994-12-20 Hoffmann-La Roche Inc. DNA encoding a thermostable nucleic acid polymerase enzyme from thermotoga maritima
US4889818A (en) 1986-08-22 1989-12-26 Cetus Corporation Purified thermostable enzyme
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US5912155A (en) 1994-09-30 1999-06-15 Life Technologies, Inc. Cloned DNA polymerases from Thermotoga neapolitana
US5962271A (en) * 1996-01-03 1999-10-05 Cloutech Laboratories, Inc. Methods and compositions for generating full-length cDNA having arbitrary nucleotide sequence at the 3'-end
US5972603A (en) * 1996-02-09 1999-10-26 President And Fellows Of Harvard College DNA polymerase with modified processivity
AUPQ568100A0 (en) * 2000-02-16 2000-03-09 Amrad Operations Pty. Limited A method for producing recombinant molecules
US7229765B2 (en) 2000-11-28 2007-06-12 Rosetta Inpharmatics Llc Random-primed reverse transcriptase-in vitro transcription method for RNA amplification
US20070111944A1 (en) 2001-02-16 2007-05-17 Scrofani Sergio D B Purification of vascular endothelial growth factor-B
US20030175709A1 (en) 2001-12-20 2003-09-18 Murphy George L. Method and system for depleting rRNA populations
JP4634799B2 (ja) 2002-09-13 2011-02-16 ライフ テクノロジーズ コーポレーション 耐熱性逆転写酵素およびその使用法
CA2623405C (en) * 2005-09-20 2014-11-25 Immunivest Corporation Methods and composition to generate unique sequence dna probes labeling of dna probes and the use of these probes
WO2008070352A2 (en) 2006-10-27 2008-06-12 Complete Genomics, Inc. Efficient arrays of amplified polynucleotides
US20080268508A1 (en) * 2007-04-30 2008-10-30 Sowlay Mohankumar R Methods and kits for negative selection of desired nucleic acid sequences
US8518640B2 (en) 2007-10-29 2013-08-27 Complete Genomics, Inc. Nucleic acid sequencing and process
WO2010027484A2 (en) * 2008-09-05 2010-03-11 Pacific Biosciences Of California, Inc. Engineering polymerases and reaction conditions for modified incorporation properties
CN102459632B (zh) * 2009-06-04 2017-05-10 恰根有限公司 复杂核酸的扩增
US9005891B2 (en) * 2009-11-10 2015-04-14 Genomic Health, Inc. Methods for depleting RNA from nucleic acid samples
US20110206638A1 (en) * 2010-01-20 2011-08-25 The Regents Of The University Of California Compositions and methods for reducing the mutation rate of viruses
US20140057799A1 (en) * 2010-12-16 2014-02-27 Gigagen System and Methods for Massively Parallel Analysis of Nucleic Acids in Single Cells
CN102739417B (zh) 2011-04-01 2014-08-20 华为技术有限公司 流媒体业务处理系统及故障检测方法
RU2644672C2 (ru) * 2011-04-01 2018-02-13 Оккам Байолэбс, Инк. Способы и наборы для обнаружения бесклеточных специфических для патогенов нуклеиновых кислот
GB2513024B (en) 2012-02-27 2016-08-31 Cellular Res Inc A clonal amplification method
US9708654B2 (en) * 2012-06-15 2017-07-18 Board Of Regents, The University Of Texas System High throughput sequencing of multiple transcripts
EP2912197B1 (en) 2012-10-24 2019-08-07 Takara Bio USA, Inc. Template switch-based methods for producing a product nucleic acid
WO2014152155A1 (en) 2013-03-14 2014-09-25 The Broad Institute, Inc. Massively multiplexed rna sequencing
EP3611262B1 (en) 2013-03-15 2020-11-11 Lineage Biosciences, Inc. Methods of sequencing the immune repertoire
US9328382B2 (en) 2013-03-15 2016-05-03 Complete Genomics, Inc. Multiple tagging of individual long DNA fragments
ES2729637T3 (es) * 2013-03-15 2019-11-05 Theranos Ip Co Llc Amplificación de ácidos nucleicos
US10266894B2 (en) 2013-08-23 2019-04-23 Ludwig Institute For Cancer Research Ltd Methods and compositions for cDNA synthesis and single-cell transcriptome profiling using template switching reaction
WO2015096063A1 (en) 2013-12-25 2015-07-02 Coyote Bioscience Co., Ltd. Methods and systems for nucleic acid amplification
SG11201606819QA (en) * 2014-02-18 2016-09-29 Univ Duke Compositions for the inactivation of virus replication and methods of making and using the same
EP3143139B1 (en) * 2014-05-14 2021-12-15 Ruprecht-Karls-Universität Heidelberg Synthesis of double-stranded nucleic acids
EP3626834B1 (en) * 2014-07-15 2022-09-21 Qiagen Sciences, LLC Semi-random barcodes for nucleic acid analysis
CA2972969A1 (en) * 2015-01-12 2016-07-21 10X Genomics, Inc. Processes and systems for preparing nucleic acid sequencing libraries and libraries prepared using same
US10711296B2 (en) 2015-03-24 2020-07-14 Sigma-Aldrich Co. Llc Directional amplification of RNA
CN109983125B (zh) * 2016-08-31 2024-06-04 哈佛学院董事及会员团体 生成用于通过荧光原位测序检测的核酸序列文库的方法
EP4151729A1 (en) 2016-11-11 2023-03-22 Bio-Rad Laboratories, Inc. Methods for processing nucleic acid samples
EP3894586A2 (en) * 2018-12-10 2021-10-20 10X Genomics, Inc. Methods for determining a location of a biological analyte in a biological sample

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060281079A1 (en) * 2000-08-30 2006-12-14 Eickbush Thomas H Method of performing reverse transcription reaction using reverse transcriptase encoded by non-ltr retrotransposable element
US20100267573A1 (en) * 2006-08-25 2010-10-21 Keene Jack D Methods for In Vivo Identification of Endogenous mRNA Targets of MicroRNAs

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JEREMY KAPTEYN等: "Incorporation of non-natural nucleotides into template-switching oligonucleotides reduces background and improves cDNA synthesis from very small RNA samples", 《BMC GENOMICS》 *
SIMONE PICELLI等: "Full-length RNA-seq from single cells using Smart-seq2", 《NAT PROTOC》 *
VARUNI K JAMBURUTHUGODA等: "Identification of RNA binding motifs in the R2 retrotransposon-encoded reverse transcriptase", 《NUCLEIC ACIDS RES》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113005179A (zh) * 2021-02-26 2021-06-22 广东省中医院(广州中医药大学第二附属医院、广州中医药大学第二临床医学院、广东省中医药科学院) 一种基于dna-多肽探针技术定量核酸的质谱方法和应用
WO2024131786A1 (zh) * 2022-12-19 2024-06-27 北京干细胞与再生医学研究院 一种在基因组插入大片段dna的系统
WO2024212753A1 (en) * 2023-04-11 2024-10-17 Beijing Astragenomics Technology Co., Ltd. Non-ltr retrotransposon system and use thereof

Also Published As

Publication number Publication date
US20190040453A1 (en) 2019-02-07
US10954558B2 (en) 2021-03-23
JP7155136B2 (ja) 2022-10-18
KR20190096989A (ko) 2019-08-20
EP3559231B1 (en) 2022-08-17
US11104943B2 (en) 2021-08-31
KR102489902B1 (ko) 2023-01-19
JP2023002597A (ja) 2023-01-10
JP2020500035A (ja) 2020-01-09
WO2018089860A1 (en) 2018-05-17
EP4151729A1 (en) 2023-03-22
EP3559231A1 (en) 2019-10-30
KR102709829B1 (ko) 2024-09-24
US20220235395A1 (en) 2022-07-28
EP3559231A4 (en) 2020-10-14
KR20230013167A (ko) 2023-01-26
US10954557B2 (en) 2021-03-23
US20190040454A1 (en) 2019-02-07
US20190071711A1 (en) 2019-03-07

Similar Documents

Publication Publication Date Title
CN110312800A (zh) 处理核酸样本的方法
US20240026316A1 (en) Methods for producing modified reverse transcriptases
US11993773B2 (en) Methods for extending polynucleotides
CN108368503A (zh) 用于受控dna片段化的方法
JPH07500735A (ja) メッセンジャーrnaの同定、単離およびクローニング
CN109593757B (zh) 一种探针及其适用于高通量测序的对目标区域进行富集的方法
CN105917036A (zh) 下一代测序文库
KR20190137718A (ko) 회전환 증폭을 이용한 표적핵산 검출 방법 및 표적핵산 검출용 조성물
US11326160B2 (en) Method for making a cDNA library
CN110747514B (zh) 一种高通量单细胞小rna文库构建方法
CN114391043A (zh) 哺乳动物dna的甲基化检测及分析
KR20220125170A (ko) 인공 염기 화합물, 이를 포함하는 핵산 및 이의 용도, 및 핵산 제조 방법
Chetverin et al. Scientific and practical applications of molecular colonies
WO2021231891A1 (en) Method for direct amplification and detection of rna

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination