WO2020061903A1 - 测序文库的构建方法和得到的测序文库及测序方法 - Google Patents

测序文库的构建方法和得到的测序文库及测序方法 Download PDF

Info

Publication number
WO2020061903A1
WO2020061903A1 PCT/CN2018/107980 CN2018107980W WO2020061903A1 WO 2020061903 A1 WO2020061903 A1 WO 2020061903A1 CN 2018107980 W CN2018107980 W CN 2018107980W WO 2020061903 A1 WO2020061903 A1 WO 2020061903A1
Authority
WO
WIPO (PCT)
Prior art keywords
sequence
nucleic acid
acid molecule
molecular tag
transposon
Prior art date
Application number
PCT/CN2018/107980
Other languages
English (en)
French (fr)
Inventor
崔路漫
范飞
章文蔚
龙舟
汪为茂
王欧
Original Assignee
深圳华大生命科学研究院
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳华大生命科学研究院 filed Critical 深圳华大生命科学研究院
Priority to EP18934817.0A priority Critical patent/EP3859014A4/en
Priority to CN201880097792.5A priority patent/CN112739829A/zh
Priority to PCT/CN2018/107980 priority patent/WO2020061903A1/zh
Publication of WO2020061903A1 publication Critical patent/WO2020061903A1/zh
Priority to US17/211,833 priority patent/US20210214783A1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1096Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • C12N15/1006Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor by means of a solid support carrier, e.g. particles, polymers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Definitions

  • whole genome sequencing technology is applied to non-invasive prenatal gene detection
  • target region capture sequencing technology is applied to tumor targeted drug gene detection
  • single cell genome and transcriptome sequencing technology is used to study the heterogeneity and development mechanism of tumor tissues
  • the long-sequence sequencing technology is used for the research of non-invasive thalassaemia detection.
  • a variety of clinical tests and basic research are carried out on the second-generation sequencing platform.
  • the emergence of high-throughput sequencing technology has brought revolutionary changes to molecular detection in clinical laboratories, but how to construct a higher-quality library and obtain better sequencing data has become an important issue for efficient detection and extensive clinical applications.
  • a method for constructing a library using a virtual read-labeled short-read sequence co-barcoding The entire short-read sequence of a long piece of DNA is labeled with the same barcode. The original information of the fragment.
  • This method can be used for the detection of ultra-long DNA fragments, but for fragments below 10 kb, such as conventionally extracted genomic DNA or highly degraded FFPE (formalin-fixed paraffin embedded, Formalin-Fixed and Parrffin-Embedded) samples and mRNA Long fragments, due to the short fragments of a single copy, and the limitation of the role of transposase during the construction of the database, lead to a lower coverage, which is not conducive to genome assembly and de novo sequencing of new species, which limits the scope of application of this technology.
  • the present invention provides a method for constructing a sequencing library, including:
  • the transposase on the transposition complex is released from the long fragment nucleic acid molecule, so that the long fragment nucleic acid molecule is interrupted into a plurality of short fragment nucleic acid molecules, and the short fragment nucleic acid molecule is connected with a transposon sequence and The above molecular tag sequence, and a plurality of short fragment nucleic acid molecules derived from the same long fragment nucleic acid molecule are linked to the same molecular tag sequence.
  • the aforementioned linear nucleic acid molecule is a formalin-fixed paraffin-embedded nucleic acid molecule, or a full-length mRNA cDNA sequence after reverse transcription, or a 18S rRNA, 16S rRNA reverse transcription full-length DNA sequence , Or genomic DNA fragmentation sequences, or full-length sequences of mitochondrial or small genomic sequences, or amplicon sequences of genomic DNA target regions.
  • the transposon complex includes a pair of transposon sequences different from each other, and each transposon sequence includes a sense strand and an antisense strand, and the sense strand of one transposon sequence can be related to the molecular tag.
  • the sequences are ligated, and the U-base site on the antisense strand can be removed by USER digestion to facilitate subsequent polymerase chain amplification.
  • the transposon complex includes a pair of transposon sequences that are identical to each other, and each transposon sequence includes a sense strand and an antisense strand, and the sense strand of each transposon sequence can be related to the above The molecular tag sequence is linked, and the above antisense strand has a U base site, which can be removed by USER digestion.
  • a segment of capture transposition is added to the solid-phase carrier with a molecular tag sequence.
  • the complex sequence makes it complementary to the molecular tag sequence, and then mixes with the long fragment nucleic acid molecule with the transposable complex to incubate the capture transposable complex sequence with the molecular tag sequence and the transposable complex, respectively.
  • the transposon sequences on the body are complementary to form a bridge between the two, and the molecular tag sequence is linked to the transposon sequence on the transposon complex through the action of ligase.
  • each solid-phase carrier forms a virtual segmentation, so that one of the above-mentioned solid-phase carriers captures one The long fragment nucleic acid molecule with a transposable complex, and the molecular tag sequence is linked to a transposon sequence on the transposable complex.
  • each solid-phase carrier forms a virtual segmentation, so that one of the above-mentioned solid-phase carriers captures one of the above-mentioned Long fragment nucleic acid molecules.
  • linear nucleic acid molecules are cyclized to form circular nucleic acid molecules, and then multiple copies of long-segment nucleic acid molecules are obtained by rolling-circle amplification, and complementary strands are further synthesized to obtain double-stranded long-segment nucleic acid molecules.
  • nucleic acid molecules in the same virtual partition are labeled with the same molecular tag, and then conventional library construction and sequencing are performed. After sequencing, according to the molecular tag information, the short read sequence generated by the sequencer can be reassembled (reduced) into the original long fragment nucleic acid molecule sequence, thereby realizing the sequencing of full-length mRNA, full-length mitochondria, and long-fragment DNA.
  • FIG. 1 is a schematic diagram of a full-length transcript sequencing technology combining a molecular tag according to an embodiment of the present invention
  • FIG. 3 is a schematic structural diagram of an ultralong double-stranded cDNA molecule with a linker sequence according to an embodiment of the present invention
  • FIG. 4 is a schematic diagram of two different transposable complex structures and their binding to full-length transcribed cDNA molecules according to an embodiment of the present invention
  • FIG. 5 is a schematic diagram of the principle of combining a vector with a molecular tag sequence and a transposition complex 1 according to an embodiment of the present invention, transferring the molecular tag sequence and releasing a cDNA molecule from the vector;
  • the method of the present invention uses rolling circle amplification technology to obtain ultra-long fragments of multiple copies of circular DNA, which can solve single-copy short fragment sequences (such as FFPE samples and full-length mRNAs).
  • single-copy short fragment sequences such as FFPE samples and full-length mRNAs.
  • the sense strand of the linker sequence is: Linker-F (5'-2-bio-AAAAAAAAAATGTGAGCCAAGGAGTTG-3 ', 5'-terminal double biotin modification, SEQ ID NO: 1); the antisense strand of the linker sequence is Linker-R ( 5'-CCAGAGCAACTCCTTGGCTCACA-3 ', SEQ ID NO: 2).
  • the annealing conditions for the two single-stranded DNAs are 70 ° C for 1 minute, and the temperature is slowly reduced to 20 ° C at a rate of 0.1 ° C / s, and the reaction is performed at 20 ° C for 30 minutes.
  • the above product is purified with 55 ⁇ L XP magnetic beads (Agencourt AMPure XP-Medium, A63882, AGNCOURT), and the purification method can be found in the official standard operating procedures.
  • step 12 Add 20 ⁇ L of the rolling circle amplification reaction solution prepared in step 11 to the product of step 10, and make up the volume to 40 ⁇ L with water. Run the following program: 95 ° C for 1 minute, 65 ° C for 1 minute, and 40 ° C for 1 minute. After the program, remove the product and place it on ice.
  • polymerase (Standard Taq polymerase (standard Taq buffer solution), 5U / ⁇ L, NEB company) 1 ⁇ L, 10xthermopol buffer (10 times the concentration of thermopol buffer, NEB company, 200mM Tris-HCl (Tris-hydrochloric acid), 100mM (NH 4 ) 2 SO 4 (ammonium sulfate), 100 mM KCl (potassium chloride), 20 mM MgSO 4 (magnesium sulfate), 1% X-100) 5 ⁇ L, 25 mM dNTP (Enzymatics) 0.8 ⁇ L, total volume 50 ⁇ L. After the reaction, the magnetic beads were adsorbed on a magnetic stand, and the supernatant was recovered.
  • Primer 2 5'phos-GAGACGTTCTCGACTCAGCAGA-3 '(SEQ ID NO: 19).
  • polymerase Standard Taq polymerase, 5U / ⁇ L, NEB
  • polymerase Standard Taq polymerase, 5U / ⁇ L, NEB
  • 10xthermopol buffer 10 times the concentration of thermopol buffer, NEB, 200mM Tris-HCl (Tris-HCl), 100mM (NH 4 ) 2 SO 4 (ammonium sulfate), 100 mM KCl (potassium chloride), 20 mM MgSO 4 (magnesium sulfate), 1% X-100) 5 ⁇ L, 25 mM dNTP (Enzymatics) 0.8 ⁇ L, total volume 50 ⁇ L.
  • the magnetic beads were adsorbed on a magnetic stand, and the supernatant was recovered.
  • the ligase reagent mixture contains 5 ⁇ L of ligase (T4 DNA ligase, 600 U / ⁇ L, Enzymatics), 3 times the concentration of ligation buffer (PEG8000 (polyethylene glycol 8000) 30%, Tris-HCl (Tris-hydrochloric acid) 150mM , ATP 1 mM, BSA (bovine serum protein) 0.15 mg / mL, MgCl 2 (magnesium chloride) 30 mM, DTT (dithiothreitol) 1.5 mM) 10 ⁇ L and 16.7 ⁇ M linker 2 1.5 ⁇ L (linker 2 by sense linker 2 -F and antisense linker 2-R are annealed), with a total volume of 30 ⁇ L.
  • ligation buffer PEG8000 (polyethylene glycol 8000) 30%
  • Tris-HCl Tris-hydrochloric acid
  • ATP Tris-HCl
  • BSA bovine serum protein
  • Primer 1 5'-TGTGAGCCAAGGAGTTG-3 '(SEQ ID NO: 20);
  • Primer 2 5'phos-GAGACGTTCTCGACTCAGCAGA-3 '(SEQ ID NO: 21).
  • the circularized product was subjected to rolling circle amplification.
  • the product was subjected to electrophoresis for 45 minutes using a 1.5% agarose gel and a voltage of 140 V. The results are shown in FIG. 9.

Abstract

一种测序文库的构建方法和得到的测序文库及测序方法,构建方法包括:将线性核酸分子环化形成环状核酸分子,滚环扩增得到多拷贝的长片段核酸分子,然后合成互补链得到双链的长片段核酸分子;与转座复合体混合孵育形成带有转座复合体的长片段核酸分子,与带有分子标签序列的固相载体混合孵育,使得分子标签序列与转座复合体上的转座子序列连接;将转座复合体上的转座酶从长片段核酸分子上释放出来,同时长片段核酸分子被打断成多个连接有转座子序列和分子标签序列的短片段核酸分子;对短片段核酸分子进行聚合酶链式扩增,得到测序文库。

Description

测序文库的构建方法和得到的测序文库及测序方法 技术领域
本发明涉及测序技术领域,具体涉及一种测序文库的构建方法和得到的测序文库及测序方法。
背景技术
分子生物学的快速发展,使基因测序技术成为现代生物学研究中重要的手段之一,广泛应用于生育健康,遗传风险评估,肿瘤的预防、筛查、诊断、治疗和预后中。基因测序技术能够真实地反映基因组上全部DNA遗传信息,进而比较全面地揭示肿瘤的发生机制及其发展过程,因而在肿瘤的科学研究中具有十分重要的地位。第一代测序技术是1977年Sanger等发明的双脱氧核苷酸末端终止法和Gilbert等发明的化学降解法;第二代测序技术包括Roche公司的454技术、Illumina公司的Solexa技术、ABI公司的SOLiD技术和华大基因的纳米球测序技术等;Helicos公司和Pacbio的单分子测序技术被称为第三代测序技术。由于三代测序对文库的要求较高,测序成本也较高,因此目前应用最广泛的是二代测序技术。例如全基因组测序技术应用于无创产前基因检测,目标区域捕获测序技术应用于肿瘤靶向用药基因检测,单细胞基因组和转录组测序技术应用于肿瘤组织的异质性和发生发展机制的研究,长片段测序应技术用于无创地贫检测的研究,多种临床检测及基础研究都在二代测序平台开展。高通量测序技术的出现为临床实验室的分子检测带来革命性的变化,但如何构建更高质量的文库,得到更好的测序数据,成为高效检测和广泛临床应用的重要问题。
目前,大部分基因组测序文库的构建都是通过物理方式或酶切方式将双链DNA长片段随机打断成几百bp的小片段,然后进行末端修复,加“A”,加“接头”,PCR扩增等步骤,最终得到用于测序的文库。转录组测序技术是应用oligo dT(多聚胸腺嘧啶脱氧核苷酸)或随机引物捕获mRNA进行逆转录和二链合成,得到双链cDNA分子,后续的文库构建方案与基因组文库构建的方案基本一样。但是,此种文库构建方法片段化的过程无法得到长片段基因信息,并且会损失一部分信息,对于新物种的从头测序来说,增加了基因组组装的难度。另外,对待检测区域进行目标区域扩增时,可能由于待检测区域的断裂,导致引物或探针结合位点减少,降低捕获效率。并且建库过程中的PCR扩增为指数扩增,片段化导致的DNA分布的偏向性,经PCR扩增会得到放大,这可能导致测序数据的覆盖度不均一。
此外,还有一种利用虚拟分隔标记的短读序列共标签(co-barcoding)的文库构建方法,在一条长片段DNA的全部短读序列上标记相同的标签(barcode),根据标签拼接,获得长片段的原始信息。该方法可用于超长DNA片段检测,但是对于10kb以下的片段,例如常规提取的基因组DNA或高度降解的FFPE(福尔马林固定石蜡包埋,Formalin-Fixed and Parrffin-Embedded)样品及mRNA全长片段,由于单一拷贝的片段较短,建库过程中转座酶 作用的限制,导致覆盖度较低,不利于基因组组装和新物种的从头测序,限制了该技术的应用范围。
发明内容
本发明提供一种测序文库的构建方法,克服了单一拷贝的片段较短和建库过程中转座酶作用的限制问题。
根据第一方面,本发明提供一种测序文库的构建方法,包括:
将线性核酸分子环化形成环状核酸分子,以上述环状核酸分子为模板进行滚环扩增得到多拷贝的长片段核酸分子,然后合成互补链得到双链的长片段核酸分子;
将上述长片段核酸分子与转座复合体混合孵育形成带有转座复合体的长片段核酸分子,其中上述转座复合体包括转座子序列和转座酶,然后与带有分子标签序列的固相载体混合孵育,使得上述分子标签序列与上述转座复合体上的转座子序列连接;
将上述转座复合体上的转座酶从上述长片段核酸分子上释放出来,使得上述长片段核酸分子被打断成多个短片段核酸分子,上述短片段核酸分子连接有转座子序列和上述分子标签序列,并且来源于同一长片段核酸分子的多个短片段核酸分子连接有相同的分子标签序列。
根据第一方面,本发明还提供一种测序文库的构建方法,包括:
将线性核酸分子环化形成环状核酸分子,以上述环状核酸分子为模板进行滚环扩增得到多拷贝的长片段核酸分子,然后合成互补链得到双链的长片段核酸分子;
使带有分子标签序列的固相载体上的分子标签序列与转座子序列连接,然后与转座酶以及任选的另一种转座子序列混合孵育,使得上述转座子序列和上述转座酶形成转座复合体,获得带有分子标签序列和转座复合体的固相载体,然后与上述长片段核酸分子混合孵育使得上述转座复合体与上述长片段核酸分子结合;
将上述转座复合体上的转座酶从上述长片段核酸分子上释放出来,使得上述长片段核酸分子被打断成多个短片段核酸分子,上述短片段核酸分子连接有转座子序列和上述分子标签序列,并且来源于同一长片段核酸分子的多个短片段核酸分子连接有相同的分子标签序列。
作为优选的技术方案,上述方法还包括:对上述连接有转座子序列和上述分子标签序列的短片段核酸分子进行聚合酶链式扩增,使得扩增产物中每个分子包括短片段核酸分子以及转座子序列和分子标签序列。
作为优选的技术方案,上述线性核酸分子是福尔马林固定石蜡包埋样本中的核酸分子,或者全长mRNA逆转录后的cDNA序列,或者18S rRNA、16S rRNA逆转录后的全长DNA序列,或者基因组DNA片段化序列,或者线粒体或小基因组序列的全长序列,或者基因组DNA目标区域的扩增子序列。
作为优选的技术方案,上述线性核酸分子通过两端连接接头序列并形成两端互补的粘性末端的方式环化形成环状核酸分子,然后通过以上述环状核酸分子为模板且以与上述接头序 列互补的序列为引物进行滚环扩增的方式得到多拷贝的长片段核酸分子。
作为优选的技术方案,上述接头序列上包括U碱基位点,可通过USER酶切的方式形成互补的粘性末端;或者,上述接头序列上包括酶切位点,可通过酶切的方式形成互补的粘性末端。
作为优选的技术方案,上述转座复合体包括一对彼此相同或不同的转座子序列。
作为优选的技术方案,上述转座复合体包括一对彼此不同的转座子序列,每个转座子序列包括正义链和反义链,其中一个转座子序列的正义链能够与上述分子标签序列连接,并且上述反义链上带有U碱基位点,可通过USER酶切去除,以利于后续的聚合酶链式扩增。
作为优选的技术方案,上述转座复合体包括一对彼此相同的转座子序列,每个转座子序列包括正义链和反义链,并且每个转座子序列的正义链都能够与上述分子标签序列连接,上述反义链上带有U碱基位点,可通过USER酶切去除。
作为优选的技术方案,上述转座复合体上的转座酶从上述长片段核酸分子上释放出来使得上述长片段核酸分子被打断成多个短片段核酸分子之后,在上述转座子序列与上述短片段核酸分子连接的缺口处连接上第二接头序列,再进行聚合酶链式扩增。
作为优选的技术方案,上述带有分子标签序列的固相载体上的分子标签序列的数量是2个以上。
作为优选的技术方案,上述分子标签序列通过与上述固相载体上的接头序列连接的方式添加到上述固相载体上。
作为优选的技术方案,上述带有分子标签序列的固相载体上的分子标签序列的数量是2个以上,这些分子标签序列通过顺次连接的方式添加到上述固相载体上,形成包括2个以上分子标签序列的组合式分子标签。
作为优选的技术方案,上述将上述带有转座复合体的长片段核酸分子与带有分子标签序列的固相载体混合孵育之前,向上述带有分子标签序列的固相载体加入一段捕获转座复合体序列使其互补连接到上述分子标签序列上,然后再与上述带有转座复合体的长片段核酸分子混合孵育使得该捕获转座复合体序列分别与上述分子标签序列和上述转座复合体上的转座子序列互补而在二者之间形成搭桥,并通过连接酶作用而使上述分子标签序列与上述转座复合体上的转座子序列连接起来。
作为优选的技术方案,将带有转座复合体的长片段核酸分子与带有分子标签序列的固相载体混合孵育时,每个固相载体形成一个虚拟分割,使得一个上述固相载体捕获一条上述带有转座复合体的长片段核酸分子,并使上述分子标签序列与上述转座复合体上的转座子序列连接。
作为优选的技术方案,将带有分子标签序列和转座复合体的固相载体与上述长片段核酸分子混合孵育时,每个固相载体形成一个虚拟分割,使得一个上述固相载体捕获一条上述长片段核酸分子。
根据第二方面,本发明提供一种根据第一方面的方法制备的测序文库。
根据第三方面,本发明提供一种测序方法,包括对第一方面的方法制备的测序文库进行测序。本发明的测序方法除了使用本发明制备得到的测序文库以外,其他方面可以按照本领域常用的测序方法进行,包括第二代测序技术,例如Roche公司的454技术、Illumina公司的Solexa技术、ABI公司的SOLiD技术和华大基因的纳米球测序技术等;以及第三代测序技术,例如Helicos公司和Pacbio的单分子测序技术等。
作为优选的技术方案,上述测序选自全长转录本组装测序,18S rRNA或16S rRNA的全长测序,线粒体全长测序,或者长片段扩增子测序。
本发明的方法,将线性核酸分子环化形成环状核酸分子,之后滚环扩增得到多拷贝的长片段核酸分子,进一步合成互补链得到双链的长片段核酸分子,再利用虚拟分隔和快速的酶反应,将同一虚拟分隔中的核酸分子利用相同的分子标签进行标记,然后进行常规建库和测序。测序完成后,根据分子标签信息,可以将测序仪产生的短读序列重新组装(还原)为原始长片段核酸分子序列,从而实现对全长mRNA、线粒体全长和长片段DNA等序列的测序。
附图说明
图1为本发明实施例的结合分子标签的全长转录本测序技术示意图;
图2为本发明实施例的带有分子标签序列的载体结构示意图;
图3为本发明实施例的带有接头序列的超长双链cDNA分子结构示意图;
图4为本发明实施例的两种不同的转座复合体结构及其与全长转录cDNA分子结合示意图;
图5为本发明实施例的带有分子标签序列的载体与转座复合体1结合,转移分子标签序列并从载体上释放cDNA分子的原理示意图;
图6为本发明实施例的带有分子标签序列的载体与转座复合体2结合,转移分子标签序列并从载体上释放cDNA分子的原理示意图;
图7为本发明实施例的全长转录本制备结果琼脂糖凝胶电泳图;
图8为本发明实施例的全长转录本产物的双链环化产物琼脂糖凝胶电泳图;
图9为本发明实施例的全长转录本产物的环化产物滚环扩增和滚环扩增产物二链合成琼脂糖凝胶电泳图;
图10为本发明实施例的使用转座复合体1最终获得的带标签序列的小片段琼脂糖凝胶电泳图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本发明能被更好的理解。然而,本领域技术人员可以毫不费力的认识 到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
针对目前基因组和转录组文库构建方法的种种限制和不足,本发明提出了一种基于长片段DNA制备及富集并结合短读序列共标签(co-barcoding)进行文库构建的方法,能够解决DNA片段化过程产生的断裂问题,不需要将DNA片段打断至几百bp,可以获得长片段信息,并且减少打断过程造成的损失。对于高度降解的FFPE样品,使用本发明方法不需要进行打断,直接进行后续建库,可大大降低建库过程中的DNA损失,提高检测效率。此外,本发明的方法采用滚环扩增技术得到环状DNA多拷贝的超长片段,能够解决单一拷贝的短片段序列(如FFPE样品及mRNA全长等),在建库过程中由于转座酶作用的限制,导致的基因组覆盖度不均一的问题,从而提高检测覆盖度,利于组装和从头测序,扩大应用范围。
本发明方法将来自于一条长片段DNA的全部短读序列标记上相同的分子标签(molecule barcode),从而获得长片段的原始信息。该长片段DNA序列可以是全长mRNA逆转录后的cDNA序列或18S rRNA、16S rRNA的全长cDNA序列,也可以是基因组DNA长片段,也可以是线粒体或小基因组序列的全长。因此,本发明方法的应用领域包括但不限于全长转录本重测序,全长转录本组装测序,18S rRNA、16S rRNA的全长测序,线粒体全长测序,长片段扩增子测序等领域。
本发明方法基本上包括:将长片段DNA序列进行双链环化,滚环扩增得到长片段DNA序列的连续多个拷贝的超长单链DNA片段,应用特异性引物合成双链超长DNA片段,再利用虚拟分隔(vitrual compartments)和快速的酶反应,将同一虚拟分隔中的DNA利用相同的分子标签(molecule barcode)进行标记,然后进行常规建库和测序。测序完成后,根据分子标签信息,可以将测序仪产生的短读序列重新组装(还原)为原始长片段DNA序列,从而实现对全长mRNA、线粒体全长和长片段DNA等序列的测序。
本发明相比现有技术,其优点至少包括以下几方面:(1)可以进行mRNA全长转录本、18S rRNA、16S rRNA的全长检测;(2)可以进行长片段DNA序列检测,提高基因组检测覆盖度,利于新物种的从头测序,基因组组装;(3)对于石蜡包埋这种特殊样品或如线粒体一样的小基因组样品,可直接进行长片段文库构建和测序;(4)可以提高靶向测序目标区域捕获的效率。
本发明的技术方案包括长片段DNA制备及富集技术以及虚拟分隔标记技术。具体而言:(1)长片段DNA制备及富集技术,是将两端带有特定接头序列的DNA分子首尾相连成环状。然后以环状DNA为模板进行多拷贝富集,得到连续多个拷贝的超长DNA片段单链,最后合成双链,完成长片段DNA制备及富集。(2)虚拟分隔标记技术,其理论原理为,分子 热运动的速率是相对稳定的,因此在一定时间内,分子热运动的范围有限,因此可以将某一半径范围内的液体空间视为一个“虚拟”分隔。当液体体积足够大,分子数量足够稀时,分子之间的距离较大,两个独立分子可以被视为完全隔离,不会产生相互作用。例如,将mRNA全长转录本制备完后,在单一反应体系中,加入带有分子标签的载体,从而将DNA分子进行虚拟分隔。最后通过片段化和标签化的过程,将来自于同一DNA的短读序列全部标记上相同的分子标签。
如图1所示,以mRNA全长转录本测序为例,本发明的一个典型但非限定性的示例性技术方案包括:首先通过常规方法提取总RNA,然后将mRNA应用带有特定接头序列的多聚胸腺嘧啶脱氧核苷酸(oligo dT)捕获分离出来,进行逆转录并合成二链得到全长cDNA分子,同时在cDNA分子的另一端引入相同的接头序列。然后将两端带有特定接头序列的cDNA分子通过酶切的方式使两端变成粘性末端,再应用连接酶将cDNA分子的首尾相连成环状。以环状cDNA为模板进行多拷贝富集,得到连续多个拷贝的超长cDNA片段单链,然后合成第二链得到双链cDNA超长片段,完成mRNA全长转录本的制备及富集。之后将一定分子数量的cDNA分子与转座酶复合体混合,在一定温度下转座酶复合体会随机插入并结合到cDNA长分子上。接下来将带有转座酶复合体的cDNA分子加入一个固定容器,同时加入携带有大量特定分子标签(barcode)的载体,以及生化反应试剂。随后控制反应体积、cDNA分子浓度、载体浓度以及反应时间,使每一个带有大量特定分子标签(barcode)的载体形成一个虚拟分隔,该载体能捕获结合在长片段cDNA分子上的转座酶复合体,当cDNA长片段分子浓度足够低,而带有分子标签的载体数量足够多时,一个载体就只会捕获一条cDNA分子,使得落在不同载体上的cDNA分子形成虚拟分隔。载体捕获cDNA分子后,将载体上的标签(barcode)与转座复合体的接头序列连起来,这样标签(barcode)就转移到cDNA片段上去,然后释放转座酶,从而最终使一条长片段cDNA断裂成许多适合测序的短片段,并且这些来自同一个长片段cDNA分子的短片段上所带有的标签是相同的。之后可以通过标签信息,将测序生成的短读长序列重新还原成原始长片段cDNA,从而实现全长转录本测序。
在本发明的一个非限定性的实施例中,本发明方法的实施路线包括四个部分,第一个部分为制备大量带有多拷贝特定标签序列(分子标签)的载体;第二个部分为mRNA全长转录本(cDNA)的制备与富集;第三个部分为将富集后的超长DNA双链分子与转座酶复合体进行结合;第四部分为分子标签载体杂交捕获带有转座复合体的超长DNA双链分子,并将分子标签转移至DNA分子上。
以下结合附图详细介绍以上四个部分:
第一部分:
制备大量带有多拷贝特定标签序列(分子标签)的载体,即在一个载体上带有相同序列的多个拷贝的寡聚核苷酸序列。本方法采用“分散-合并-分散”的技术手段实现多种类多拷贝特定标签序列载体的构建。如图2所示,在本发明的一个非限定性的实施例中,其主要流程为:
1.将特定接头序列(Linker)通过生物素-链霉亲和素作用连接到修饰有链霉亲和素蛋白的载体上。在一个实施例中,上述载体可以是氧化铁磁珠载体,在其它实施例中,可以是其他固相载体,如交联后的琼脂糖、琼脂、聚苯乙烯、聚丙烯酰胺、玻璃等,其表面带有链霉亲和素修饰,以便于特定接头序列上的生物素修饰结合。在其它实施例中,固相载体表面的修饰可以是羟基、羧基、氨基等任何可以交联DNA寡核苷酸(即接头序列)的分子。
2.将不同编号(1-1536号)的标签序列1和辅助序列1分装在384孔板的不同孔中,退火,共计4个384孔板。标签序列1分为三个部分,第一部分是分别与特定接头序列反义链互补以及与辅助序列1互补的序列,可以由4-50个碱基组成,在一个优选的实施例中,与特定接头序列反义链互补的序列和与辅助序列1互补的序列分别是6个和15个碱基;第二部分是特定分子标签(barcode)序列,可以由4-50个碱基组成,在一个优选的实施例中,为10个碱基组成;第三部分是与辅助序列2互补的4-50个碱基,在一个优选的实施例中,是6个碱基。辅助序列1是由与标签序列1部分互补的序列组成,可以是4-50个碱基,在一个优选的实施例中,是21个碱基。在一个优选的实施例中,标签序列1和辅助序列1均由A、T、C、G四种碱基组成,每种碱基不能连续出现三次以上,退火后形成部分双链的粘性末端结构,便于与带有特定接头序列的载体连接以及与退火后的标签序列2连接。需要说明的是,上述描述的标签序列1的结构和组成仅是一种示例性的例子,根据具体需要,各部分的碱基组成和数量可以任意变动。此外,标签序列的连接方式可以是序列的3’端连在载体磁珠上,也可以是5’端连在载体磁珠上。标签序列可以是单链序列,也可以是双链序列。
3.将步骤1中带有接头序列的载体平均分配到4个384孔板的各个孔中。使用DNA连接酶将载体上的接头序列与退火好的标签序列1进行连接。标签序列1包含一段特定的DNA序列,标记为分子标签1。
4.使用大量缓冲液清洗载体,将上一步反应中的连接酶与未能完全反应的寡聚核苷酸去除。
5.将步骤4清洗后的载体通过离心收集起来,并使用震荡混匀仪混匀。
6.将不同编号(1-1536号)的标签序列2和辅助序列2分装在全新的384孔板的不同孔中退火,共计4个384孔板。之后将步骤5混匀后的载体平均分配到各个孔中。标签序列2由特定分子标签(barcode)序列、与辅助序列2互补的序列以及与捕获转座复合体序列互补的序列组成,这三段序列可以分别是4-50个碱基,在一个优选的实施例中,分别是10个、10个和15个碱基。辅助序列2是由与标签序列1部分互补的序列以及与标签序列2部分互补的序列组成,这两段序列可以分别是4-50个碱基,在一个优选的实施例中,分别是6个和20个碱基。在一个优选的实施例中,标签序列2和辅助序列2均由A、T、C、G四种碱基组成,每种碱基不能连续出现三次以上,退火后形成部分双链的粘性末端结构,便于与带有特定接头序列和退火后的标签序列1的载体连接。
7.使用DNA连接酶将载体中的标签序列1与标签序列2进行连接。标签序列2包含一 段特定的DNA序列,标记为分子标签2。
8.使用大量缓冲液清洗载体,将上一步反应中的连接酶与未能完全反应的寡聚核苷酸去除。
9.经过以上制备得到部分双链并含有两个标签序列的载体,将含有两个标签序列的DNA序列标记为A链,部分互补链为B链。
10.将载体上的B链变性下来,然后应用缓冲液清洗载体。再与一段捕获转座酶复合体的序列退火。
11.使用大量缓冲液清洗载体,将上一步反应中未能完全反应的寡聚核苷酸去除。至此,完成方案1的1536*1536种(即2359296种)分子标签载体的制备。
12.载体制备方案2,在完成上述步骤后,使用DNA连接酶将退火后的转座子1(例如,可参考后面实施例中的转座子1)与步骤11载体上的DNA序列进行连接。
13.使用大量缓冲液清洗载体,将上一步反应中未能完全反应的寡聚核苷酸去除。至此,完成方案2的1536*1536种(即2359296种)分子标签载体的制备。
需要说明的是,以上关于第一部分的说明仅是示例性的,尤其是,分子标签数量不限于上述2359296种,可以向上增加或向下减少,但最少不能少于2,例如,在其它实施例中,可能仅使用一个1-1536号编号的单一标签序列,而不是上述描述的标签序列1和标签序列2的组合;在其它实施例中,还可能使用三个或三个以上标签序列的组合,例如标签序列1、标签序列2和标签序列3分别都有1-1536号编号,可以组合出1536*1536*1536种分子标签载体。
第二部分:
以mRNA全长转录本测序为例,mRNA全长转录本(cDNA)的制备与富集,是指将多个拷贝的cDNA全长序列连接在一起。在本发明一个实施例中,采用双链环化和滚环扩增的技术手段,实现全长cDNA的制备与富集。如图3所示,在本发明的一个非限定性的实施例中,其主要流程为:
1.应用带有接头序列的多聚胸腺嘧啶脱氧核苷酸(oligo dT)捕获全长mRNA并进行逆转录,利用逆转录酶的末端转移酶活性,合成二链的同时在cDNA分子的另一端引入相同的接头序列,并进行一步延伸得到全长cDNA分子。其中,接头序列上带有U碱基,可以被USER酶切除。在其它实施例中,接头序列上带有其他类型的酶切位点,替代U碱基位点,经过相应酶的酶切作用形成位于cDNA分子两端的粘性末端。例如,I碱基通过endo V酶切切除I碱基形成粘性末端。
2.应用USER酶将cDNA分子两端的接头序列中的U碱基切除,使cDNA分子两端成为粘性末端。在其它实施例中,接头序列上带有限制性酶切位点,通过限制性酶的酶切作用产生粘性末端。
3.应用DNA连接酶,使cDNA分子粘性末端的回文序列首尾相连,形成双链环状cDNA 分子。
4.以双链环状cDNA分子为模板,oligo dT为引物,用phi29DNA聚合酶进行cDNA分子多个拷贝的富集,得到连续多个拷贝的超长单链cDNA分子。
5.以超长单链cDNA分子为模板,接头序列的片段为引物,应用DNA聚合酶I和DNA连接酶,合成互补的二链,得到超长双链cDNA分子,完成mRNA全长转录本(cDNA)的制备与富集。
需要说明的是,在mRNA全长转录本(cDNA)的制备与富集过程中,所使用的酶不仅限于上述phi29DNA聚合酶、DNA聚合酶I和DNA连接酶等,可以使用具有相同功能的其他酶代替。此外,在mRNA全长转录本(cDNA)的制备与富集过程中,所使用的反应体系可以根据反应物的投入量来调整,反应体系中所使用的酶量也可以根据反应物的投入量来调整。
第三部分:
转座酶作为一种常规使用的建库工具酶,具有反应速度快,可以一步实现片段化和标签化等优势。同时,转座酶还具有在转座反应后,若不进行变性处理则可持续保持DNA片段完整的特性。因此在本发明实施例中,用转座酶进行高分子量DNA的片段化。如图4所示,在本发明的一个非限定性的实施例中,其具体流程为:
1.在30℃下,将转座子序列与转座酶混合,30℃孵育一小时后,形成转座复合体,取出放置于-20℃冰箱备用。在一个实施例中,转座酶是Tn5转座酶。在其它实施例中,可以为Tn转座酶家族的其他酶,如Tn7;或者其他转座酶家族,如Mu家族;甚至不限于转座酶或者酶制剂,只要其能够使cDNA被片段化同时将一段序列连接至cDNA上。
2.之后取一定数量的转座复合体与高分子量DNA在55℃下孵育10分钟。
3.不释放转座酶,让cDNA分子保持完整性。
如图4所示,有两种转座复合体可用于本发明中,一种是转座复合体1,转座酶包埋两种转座子,即转座子1和转座子2,其中只有一种转座子(例如转座子1)能被载体杂交捕获。在一个实施例中,每个转座子序列包括正义链和反义链,转座复合体1中的转座子1的正义链与分子标签序列连接,转座子2的正义链不与分子标签序列连接,也可以相反;并且反义链上带有U碱基位点,可通过USER酶切去除,以利于后续的聚合酶链式扩增。
另一种是转座复合体2,转座酶包埋两条相同的转座子(例如转座子1),均能被载体杂交捕获。在一个实施例中,每个转座子序列包括正义链和反义链,并且每个转座子序列的正义链都与分子标签序列连接,反义链上带有U碱基位点,可通过USER酶切去除。
需要说明的是,消化转座子上反义链的方式不限于使用USER/UDG&APE1组合酶切法切除U碱基位点,还可以是外切酶III、Lambda外切酶或其他能够特异性或非特异性消化该反义链的酶或其他试剂。转座子的反义链上U碱基替换T碱基的位置和数量不限,可以替换该序列上任意的T碱基。此外,该碱基不限于U碱基,可以为其他特殊修饰碱基,如甲基化 碱基,同时该替换碱基的位置和替换碱基的数量不限,可以替换该序列上任意的碱基。此外,本发明实施例中,转座子序列的长度和序列信息不限。
第四部分:
将带有分子标签序列(Molecule Barcode)的载体与转座酶复合体结合,转移标签并从载体上释放cDNA分子,如图5和图6所示,根据使用的转座酶复合体的类型不同,后续的处理方式也不同。
1.将带有转座酶复合体的长片段cDNA稀释后与带标签(Barcode)的载体混合,载体会以cDNA序列杂交的方式捕获转座酶复合体。带标签的载体的用量可以根据反应物的投入量具体调整确定,在一个实施例中,带标签的载体的用量是数万、数十万、数百万、数千万甚至数亿等。在其它实施例中,带标签的载体可以视情况增加或减少。
2.当使用转座复合体1时,用DNA连接酶将带有标签(Barcode)的载体序列与DNA分子的转座复合体的缺口处连接,即通过连接酶将标签(Barcode)转移到连接着cDNA分子的转座复合体上。
3.当使用转座复合体1时,释放转座酶后,cDNA长片段分子被打断成小片段,来自于同一条cDNA长片段分子的小片段均带有相同的分子标签。用USER酶切掉捕获转座酶的序列,然后应用DNA聚合酶进行延伸反应,将DNA从载体上释放下来,然后使用特定接头序列的部分序列作为引物1、转座子2正链的部分序列作为引物2进行DNA分子聚合酶链式扩增,至此即可获得带有分子标签的适合测序的短片段分子。
4.当使用转座复合体2时,释放转座酶后,cDNA长片段分子被打断成小片段,所有的小片段均被加上相同的分子标签。用连接酶在缺口处连接上接头2,如图6所示,在本发明一个实施例中,通过间隙连接法(Gap ligation)在缺口处连接上接头2,然后将与接头2正链互补的序列作为引物2,在DNA聚合酶的作用下,通过延伸反应合成与载体序列互补的DNA序列。
需要说明的是,有许多方法都可以在片段化后的cDNA小片段3’端加接头,例如还包括多聚C/A/T/G碱基尾链转移法,延伸终止链转移法,不对称接头间隙填补法,单链随机序列填补法等。
5.使用特定接头序列的部分序列作为引物1、与接头2正链互补的序列作为引物2进行DNA分子聚合酶链式扩增,至此即可获得带有分子标签的适合测序的短片段分子。
6.使用合适的测序平台进行测序,通过分子标签信息,将测序得到的短片段信息还原为cDNA长片段信息,从而获得细胞内的全部mRNA表达量。
以mRNA全长转录本测序为例,本发明的方法提供了一种mRNA全长转录本测序的解决方案,成功地解决了短读测序方法中片段化造成的信息丢失,无法测得全长的问题。本发明的方法可提高靶向测序中目标区域的捕获效率。本发明的方法构建文库所产生的测序数据,可以用于基因组或转录组的从头组装。
以下通过具体实施例详细说明本发明的技术方案和效果,应当理解实施例仅是示例性的,不能理解为对本发明保护范围的限制。
实施例
第一部分:制备大量带有多拷贝分子标签序列的载体
1.将特定接头序列(Linker)通过生物素-链霉亲和素作用连接到修饰有链霉亲和素蛋白的载体上。本实施例中,特定接头序列(Linker)为双链DNA分子,由两条单链DNA链退火在一起。
接头序列的正义链为:Linker-F(5’-2-bio-AAAAAAAAAATGTGAGCCAAGGAGTTG-3’,5’-端双生物素修饰,SEQ ID NO:1);接头序列的反义链为Linker-R(5’-CCAGAGCAACTCCTTGGCTCACA-3’,SEQ ID NO:2)。两条单链DNA的退火条件是70℃1分钟,以0.1℃/s的速度缓慢降温至20℃,20℃反应30分钟。带有链霉亲和素的磁珠为Dynabeads M-280streptation(112.06D,链霉亲和素免疫磁珠,Invitrogen)。按照Linker(50μM)2μL与M-280磁珠30μL的比例混合,磁珠的保存液替换成1倍浓度的磁珠结合缓冲液(50mM Tirs-HCl,150mM NaCl,0.1mM EDTA),25℃,在垂直混匀仪上混合1个小时,然后用低盐磁珠洗涤缓冲液(50mM Tirs-HCl,150mM NaCl,0.02%Tween-20)洗涤2次,最后用12.5μL(2μL Linker+30μL磁珠,Linker浓度为1.6μM)1倍浓度的连接缓冲液重悬磁珠(连接缓冲液的工作液浓度为3倍,PEG8000 30%,Tris-HCl 150mM,ATP 1mM,BSA0.15mg/mL,MgCl 2 30mM,DTT 1.5mM)。
2.将不同编号(1-1536号)的标签序列1和辅助序列1分装在384孔板的不同孔中进行退火(1:1退火,一共4μL/孔),共计4个384孔板。
标签序列1:5’Phos-CTCTGGCGACGGCCACGAAGC[Barcode]TCTGCG-3’(SEQ ID NO:3);
辅助序列1:5’-[Barcode]GCTTCGTGGCCGTCG-3’(SEQ ID NO:4)。
其中,Barcode表示仪器随机合成的标签序列,例如是10个随机的碱基N,其中N可以是A、T、G、C中的任何一个。
标签序列1与辅助序列1的退火条件是:标签序列1 100μM与辅助序列1按照1:1混合后置于PCR仪器上,70℃1分钟,以0.1℃/s的速度缓慢降温至20℃,20℃反应30分钟。
3.使用DNA连接酶将载体上的接头序列与标签序列1进行连接。该标签序列1包含一段特定的DNA序列,标记为分子标签1。具体步骤为将步骤1中带有Linker的M280磁珠平均分配到4块384孔板的1536个孔中,每孔2.5μL。再在每孔补上3倍浓度连接酶缓冲液的混合物3.5μL(T4 DNA连接酶600U/μL 1μL,连接缓冲液2.5μL),以每个384孔板10μL的总反应体积进行连接反应,反应温度25℃,反应时间1个小时。
4.使用大量高盐磁珠洗涤缓冲液(50mM Tirs-HCl,500mM NaCl,0.02%Tween-20)洗涤一次,再使用大量低盐磁珠洗涤缓冲液(50mM Tirs-HCl,150mM NaCl,0.02%Tween-20) 洗涤一次,将上一步反应中的连接酶与未能完全反应的寡聚核苷酸去除。
5.将步骤4清洗后的磁珠通过磁力架收集起来,然后用1倍浓度的连接缓冲液重悬磁珠,重悬后Linker的浓度为1.6μM,并使用震荡混匀仪混匀。
6.将不同编号(1-1536号)的标签序列2和辅助序列2分装在全新的384孔板的不同孔中退火,共计4个384孔板。
标签序列2:5’-[Barcode]TAGCATGGACTATGG-3’(SEQ ID NO:5);
辅助序列2:5’-GTCCATGCTA[Barcode]CGCAGA-3’(SEQ ID NO:6)。
其中,Barcode表示仪器随机合成的标签序列,例如是10个随机的碱基N,其中N可以是A、T、G、C中的任何一个。
标签序列2与辅助序列2的退火条件是:标签序列2 100μM与辅助序列2 100μM各2μL混合于384孔板中,然后置于PCR仪器上,70℃1分钟,以0.1℃/s的速度缓慢降温至20℃,20℃反应30分钟。
7.将步骤5混匀后的磁珠按每孔2.5μL的量分配到步骤6的384孔板的各个孔中。然后加入3倍浓度连接酶缓冲液的混合物3.5μL(T4 DNA连接酶600U/μL 1μL,连接缓冲液2.5μL),在25℃反应1个小时。
8.使用大量高盐磁珠洗涤缓冲液(50mM Tirs-HCl,500mM NaCl,0.02%Tween-20)洗涤一次,再使用大量低盐磁珠洗涤缓冲液(50mM Tirs-HCl,150mM NaCl,0.02%Tween-20)洗涤一次,将上一步反应中的连接酶与未能完全反应的寡聚核苷酸去除,用磁力架收集磁珠后将磁珠重悬与低盐磁珠洗涤缓冲液中。
9.每份取10亿个磁珠,用磁力架去除磁珠中的低盐磁珠洗涤液,用50μL低盐磁珠洗涤液洗涤一次,然后用强碱变性缓冲液(KOH 1.6M,EDTA 1mM)50μL重悬磁珠,在常温下孵育5分钟,然后用磁力架吸附磁珠2分钟后去取强碱变性缓冲液,然后再加入强碱变性缓冲液50μL洗涤磁珠一次,去除强碱变性缓冲液后,加入10μL退火缓冲液(400mM Tris-HCl,500mM NaCl,100mM MgCl 2,pH 7.9),100μM捕获转座复合体序列5.7μL,用水补足至100μL。其中,捕获转座复合体序列为AUCGUACCUGAUACCGCUAGGAACCACUAGUACAGCAGUCACG(SEQ ID NO:7)退火条件为60℃反应5分钟,25℃反应1小时。
10.将上一步反应中未能完全反应的寡聚核苷酸去除,用磁力架收集磁珠,使用低盐缓冲液洗涤磁珠,最后将磁珠重悬于低盐磁珠洗涤缓冲液中,4摄氏度保存1年。
11.至此完成方案1的2359296种分子标签磁珠载体的制备。
12.载体制备方案2,将步骤10制备好的标签磁珠载体放在磁力架上,去除低盐缓冲液后,加入50μM转座子1 11.4μL,加入3倍浓度连接酶缓冲液的混合物45μL(T4 DNA连接酶600U/μL 12μL,3倍浓度的连接缓冲液33μL),用水补足至100μL,在25℃反应1个小时。
13.使用大量高盐磁珠洗涤缓冲液(50mM Tirs-HCl,500mM NaCl,0.02%Tween-20)洗 涤一次,再使用大量低盐磁珠洗涤缓冲液(50mM Tirs-HCl,150mM NaCl,0.02%Tween-20)洗涤一次,将上一步反应中的连接酶与未能完全反应的寡聚核苷酸去除。用磁力架收集磁珠,最后将磁珠重悬于低盐磁珠洗涤缓冲液中,4摄氏度保存1年。
14.至此完成方案2的2359296种分子标签磁珠载体的制备。
第二部分:转座复合体的制备
1.准备转座子,转座子由两条DNA单链分子退火形成。转座复合体1中包括彼此不同的转座子1和转座子2。构成转座复合体1的转座子1的正义链为转座子1-F,构成转座复合体1的转座子1的反义链为转座子1-R。构成转座复合体1的转座子2的正义链为转座子2-F,构成转座复合体1的转座子2的反义链为转座子2-R。
转座子1-F:
5'phos-CGATCCTTGGTGATCATGTCGTCAGTGCTTGTCTTCCTAAGATGTGTATAAG AGACAG-3'(SEQ ID NO:8);
转座子1-R:5'phos-CTGTCTCUTATACACATCT-3'(SEQ ID NO:9);
转座子2-F:5'-GAGACGTTCTCGACTCAGCAGAAGATGTGTATAAGAGACAG-3'(SEQ ID NO:10);
转座子2-R:5’Phos-CTGTCTCUTATACACATCT-3’(SEQ ID NO:11)。
转座复合体2中包括两个相同的转座子1。构成转座复合体2的转座子1的正义链为转座子1-F,构成转座复合体2的转座子1的反义链为转座子1-R。
退火条件是:浓度为100μM的转座子正义链与反义链各20μL混合,70℃1分钟,以0.1℃/s的速度缓慢降温至20℃,20摄氏度反应30分钟,最终获得浓度为50μM的转座子。
2.应用第一部分中方案1的磁珠载体时,使用在保质期内的1U/μL的Tn5转座酶11.8μL,上一步准备的转座子1和转座子2各1.6μL或转座子1 3.2μL,TE缓冲液(10mM Tris-HCl,1mM EDTA)稀释的50%甘油25μL在冰上混合后置于30摄氏反应1个小时,反应结束后的产物为转座复合体1或转座复合体2,转座复合体中转座子的浓度的4pmol/μL,准备好的转座复合体可保存于-20摄氏度1年。
3.应用第一部分中方案2的磁珠载体且用转座复合体1时,取出第一部分中制备好的方案2的磁珠载体5.3μL,用低盐磁珠洗涤缓冲液洗涤两次,加入0.6μL步骤1)中退火的双链转座子2,4.3μL Tn5转座酶(1U/μL)在10.1μL包埋反应液(50%甘油;50%TE)中进行包埋,包埋时置于垂直混匀仪上,包埋温度30℃孵育1小时,包埋后转座子终浓度为4pmol/μL。
4.应用第一部分中方案2的磁珠载体且只用转座复合体2时,取出第一部分中制备好的方案2的磁珠载体5.3μL,用低盐磁珠洗涤缓冲液洗涤两次,加入4.3μL Tn5转座酶(1U/μL)在10.7μL包埋反应液(50%甘油;50%TE)中进行包埋,包埋时置于垂直混匀仪上,包埋温度30℃孵育1小时,包埋后转座子终浓度为4pmol/μL。
第三部分:mRNA全长转录本(cDNA)的制备与富集
mRNA全长转录本(cDNA)的制备与富集,是指将多个拷贝的cDNA全长序列连接在一起。本实施例采用双链环化和滚环扩增的技术手段,实现全长cDNA的制备与富集。
1.提前合成用于捕获mRNA的捕获序列,用于逆转录的TSO引物、ISO引物,用于滚环扩增的oligo dT序列,用于合成双链的Tn引物,均用TE溶液回溶至浓度为100μM,储存于-20摄氏度备用。本实施例以1μg总RNA投入量为例。
捕获序列:
5'-AAGCdUdUCGTAGCCATGTCGTTCTGCGNNNNNNNNNNTTTTTTTTTTTTTTTTTTTTTV-3'(SEQ ID NO:12);
TSO引物:5’-AAGCdUdUCGTAGCCATGTCGTTCTGrGrG+G-3’(SEQ ID NO:13);
ISO引物:5‘-AAGCdUdUCGTAGCCATGTCGTTCTG-3’(SEQ ID NO:14);
oligo dT序列:5’-TTTTTTTTTTTTTTTT-3’(SEQ ID NO:15);
Tn引物:5‘-CGTAGCCATGTCGTTCTG-3’(SEQ ID NO:16)。
2.取1μL总RNA(1微克),加入5μL dNTP(10mM),1μL捕获序列(50μM),置于PCR仪中72摄氏度3分钟,立刻取出冰上放置1分钟。然后加入逆转录酶反应混合液,其中包含1μL逆转录酶(SuperScript II reverse transcriptase(200U/μL),Invitrogen公司),0.5μL RNaseOUT TM(RNA酶抑制剂,40U/μL,Invitrogen公司),4μL 5XSuperscript II first-strand buffer(5倍浓度的逆转录酶II缓冲液,250mM Tris-HCl,pH 8.3,375mM KCl,15mM MgCl2,Invitrogen公司),0.5μL DTT(100mM,Invitrogen公司),6μL MgCl 2(25mM,Invitrogen公司),0.5μL TSO引物(100μM),用水补足体积,共20μL。置于PCR仪中,运行如下程序:(1)42摄氏度90分钟;(2)50摄氏度2分钟;(3)42摄氏度2分钟;其中(2)至(3)运行10个循环。
3.反应结束后,加入全长转录本扩增反应混合液,其中包括50μL 2X KAPA HiFi HotStart Ready Mix(2倍浓度的KAPA HIFI热启动酶混合液)(5mM MgCl 2,每种dNTP 0.6mM,1U KAPA HiFi HotStart DNA Polymerase(1个单位的KAPA HiFi热启动DNA聚合酶),KAPA公司),5μL ISO引物(10μM),用水补充体积到100μL。按以下程序进行反应:(1)98摄氏度3分钟;(2)98摄氏度20秒;(3)67摄氏度15秒;(4)72摄氏度6分钟;(5)72摄氏度5分钟;其中步骤(2)至(5)重复1-2个循环。需要说明的是,扩增循环数与总RNA投入量有关,总RNA投入量变少的情况下,扩增循环数需要增加,例如总RNA投入量10ng或100ng的情况下,扩增循环数可能是18-20或10-15个循环。
4.反应结束后,将上述产物用200μL XP磁珠(Agencourt AMPure XP-Medium,A63882,AGENCOURT公司)纯化,纯化方法见官方提供的标准操作规程。
5.纯化结束后,向上述产物加入1μL USER酶(1U/μL NEB),3μL 10X stTaq Buffer(10倍浓度的标准Taq缓冲液,100mM Tris-HCl,500mM KCl,15mM MgCl 2),用水补充体积到30μL。置于PCR仪中37摄氏度反应1小时。
6.反应结束后,立刻取出,加入5μL 10×TA Buffer,补水至50μL,置于PCR仪中70摄氏度反应30分钟,室温水浴20分钟。
7.反应结束后,向上述产物中加入2.75μL 20×Circ Mix(10×TA Buffer(10倍浓度的TA缓冲液),0.1M ATP),0.1μL T4 DNA连接酶(Enzymatics公司,600U/μL),用水补充体积到55μL,室温反应2小时。
8.反应结束后,将上述产物用55μL XP磁珠(Agencourt AMPure XP-Medium,A63882,AGENCOURT公司)纯化,纯化方法见官方提供的标准操作规程。
9.纯化结束后,向上述产物中加入3μL 10×Plasmid-safe Buffer(10倍浓度的线性DNA消化缓冲液)(330mM Tris-acetate(Tris-醋酸,pH 7.5),660mM potassium acetate(乙酸钾),100mM magnesium acetate(醋酸镁),5.0mM DTT),3.38μL Plasmid-Safe ATP-Dependent DNase(10U/μL,Epicentre公司),1.2μL 25mM ATP,补水至30μL,置于PCR仪中37摄氏度反应1.5小时。
10.反应结束后,将上述产物用30μL XP磁珠(Agencourt AMPure XP-Medium,A63882,AGENCOURT公司)纯化,纯化方法见官方提供的标准操作规程。至此完成了全长转录本的双链环化。
11.配制滚环扩增反应溶液,取4μL oligo dT(50μM),加入40μL 10×phi29buffer(10倍浓度的phi29缓冲液),补水至200μL,储存于-20摄氏度冰箱保存,备用。
12.向步骤10的产物中加入20μL步骤11配制的滚环扩增反应液,用水补足体积至40μL。运行如下程序:95摄氏度1分钟,65摄氏度1分钟,40摄氏度1分钟,程序结束后,马上取出产物放置冰上。
13.向上述产物中加入40μL Enzyme mixture(酶混合液),4μLEnzyme mixture Ⅱ(酶混合液Ⅱ),置于PCR仪中,30摄氏度10分钟,65摄氏度10分钟。4摄氏度可保存一周之内备用。
14.反应结束后,用单链浓度检测试剂盒(Lifetech公司)进行浓度检测。取100ng进行后续反应。
15.取步骤13的产物100ng,加入5μL 10×NEB buffer 2(10倍浓度的NEB缓冲液2),0.4μL dNTP Mix(每种25mM),0.5μL ATP(0.1M),0.5μL Tn引物(10μM),置于PCR仪中运行如下程序:95摄氏度3分钟,58摄氏度30秒,反应结束后立刻取出,加入2μL DNA聚合酶1(NEB,5U/μL),1μL T4 DNA连接酶(Enzymatics公司,600U/μL),置于PCR仪运行如下程序:37摄氏度30分钟,75摄氏度20分钟。
16.反应结束后,将上述产物用50μL XP磁珠(Agencourt AMPure XP-Medium,A63882,AGENCOURT公司)纯化,纯化方法见官方提供的标准操作规程。纯化产物放于4摄氏度,可保存一周之内备用。至此完成了mRNA全长转录本(cDNA)的制备与富集。
第四部分:制备带有分子标签的适合测序的短片段分子
1.准备带有标签的磁珠,取1千万个磁珠,用磁力架去除磁珠中的低盐磁珠洗涤液,用低盐磁珠洗涤缓冲液和杂交缓冲液(Tris-HCl 50mM(Tris-盐酸),NaCl 1000mM(氯化钠),Tween-20(吐温-20)0.05%)50μL各洗涤一次,最后用2倍杂交缓冲液50μL(Tris-HCl(Tris-盐酸)100mM,NaCl(氯化钠)2000mM,Tween-20(吐温-20)1%)重悬磁珠。
2.在冰上配制转座复合体与长片段DNA分子的混合液。取5倍浓度的转座酶打断缓冲液(HEPES-KOH 50mM(氢氧化钾),DMF 50%(二甲基甲酰胺),MgCl 2 25mM(氯化镁))10μL,长片段DNA分子(即第三部分制备的产物)10ng,稀释成包含0.5pmol/μL转座子的转座复合体1μL,用分子反应级的水将体系补足至50μL,置于55摄氏度反应10分钟,然后马上放到冰上。
3.当使用方案1的载体磁珠时,将步骤2中准备好的带有转座酶复合体的50μL长片段DNA溶液与上一步带标签(Barcode)的磁珠50μL混合,60摄氏度反应1分钟,然后让反应液置于室温,让其自然降温并置于垂直混匀仪,25摄氏度混合反应1个小时。
4.使用转座复合体1时,在1个小时的杂交时间结束后,加入连接酶的混合反应液重悬磁珠,置于20摄氏度反应1小时,其中连接酶(T4 DNA连接酶,Enzymatics公司,600U/μL)1μL,10倍浓度的连接缓冲液20μL,用分子级水补足体积至200μL。反应结束后加入5μL 0.44%SDS室温下孵育10分钟使转座酶变性从DNA上释放下来,然后用高盐磁珠洗涤液和低盐磁珠洗涤液分别洗涤一次。再加入USER酶(1U/μL NEB)2μL,置于垂直混匀仪上37摄氏度反应0.5个小时,然后在37度环境下,用37摄氏度预热的高盐磁珠洗涤液和低盐磁珠洗涤缓冲液各洗涤一次。然后加入聚合酶试剂混合液重悬磁珠,置于72摄氏度反应10分钟。其中聚合酶(Standard Taq polymerase(标准Taq聚合酶),5U/μL,NEB公司)1μL,10xthermopol buffer(10倍浓度的thermopol缓冲液,NEB,200mM Tris-HCl,100mM(NH 4) 2SO 4,100mM KCl(氯化钾),20mM MgSO 4(硫酸镁),1%
Figure PCTCN2018107980-appb-000001
X-100)5μL,25mM dNTP(Enzymatics公司)0.8μL,总体积50μL。反应结束后用磁力架吸附磁珠,回收上清液。
5.使用转座复合体2时,在1个小时的杂交时间结束后,加入连接酶的混合反应液重悬磁珠,置于20摄氏度反应1小时,其中连接酶(T4 DNA连接酶,Enzymatics公司,600U/μL)1μL,10倍浓度的连接缓冲液20μL,用分子级水补足体积至200μL。反应结束后用高盐磁珠洗涤液和低盐磁珠洗涤液分别洗涤一次。再加入USER酶(1U/μL,NEB公司)2μL,置于垂直混匀仪上37摄氏度反应0.5个小时。反应结束后加入5μL 0.44%SDS室温下孵育10分钟使转座酶变性从DNA上释放下来,然后用高盐磁珠洗涤液和低盐磁珠洗涤液分别洗涤一次。然后用连接酶试剂混合液重悬磁珠,置于垂直混匀仪上25摄氏度反应1个小时。连接酶试剂混合液包含连接酶(T4 DNA连接酶,600U/μL,Enzymatics公司)5μL,3倍浓度连接缓冲液(PEG8000(聚乙二醇8000)30%,Tris-HCl 150mM,ATP 1mM,BSA(牛血清蛋白)0.15mg/mL,MgCl 2(氯化镁)30mM,DTT(二硫代苏糖醇)1.5mM)10μL和16.7μM接头2 1.5μL(接头2由正义链接头2-F和反义链接头2-R退火形成),总体积为30μL。反应 结束后高盐磁珠洗涤液和低盐磁珠洗涤缓冲液各洗涤一次。然后加入聚合酶试剂混合液和1μL的100μM引物2重悬磁珠,置于72摄氏度反应10分钟。其中聚合酶(Standard Taq polymerase(标准Taq缓冲液),5U/μL,NEB公司)1μL,10xthermopol buffer(10倍浓度的thermopol缓冲液,NEB公司,200mM Tris-HCl(Tris-盐酸),100mM(NH 4) 2SO 4(硫酸铵),100mM KCl(氯化钾),20mM MgSO 4(硫酸镁),1%
Figure PCTCN2018107980-appb-000002
X-100)5μL,25mM dNTP(Enzymatics公司)0.8μL,总体积50μL。反应结束后用磁力架吸附磁珠,回收上清液。
接头2-F:5’phos-TCTGCTGAGTCGAGAACGTCTddC-3’(SEQ ID NO:17);
接头2-R:5’-CTCGACTCAGCAGddA-3’(SEQ ID NO:18);
引物2:5’phos-GAGACGTTCTCGACTCAGCAGA-3’(SEQ ID NO:19)。
6.当使用方案2的载体磁珠且用转座复合体1时,不需要进行杂交和连接反应,将步骤2产物中加入1.25μL 0.44%SDS室温下孵育10分钟使转座酶变性从DNA上释放下来,然后用高盐磁珠洗涤液和低盐磁珠洗涤液分别洗涤一次。再加入USER酶(1U/μL NEB)2μL,置于垂直混匀仪上37摄氏度反应0.5个小时,然后在37度环境下,用37摄氏度预热的高盐磁珠洗涤液和低盐磁珠洗涤缓冲液各洗涤一次。然后加入聚合酶试剂混合液重悬磁珠,置于72摄氏度反应10分钟。其中聚合酶(Standard Taq polymerase(标准Taq聚合酶),5U/μL,NEB公司)1μL,10xthermopol buffer(10倍浓度的thermopol缓冲液,NEB,200mM Tris-HCl(Tris-盐酸),100mM(NH 4) 2SO 4(硫酸铵),100mM KCl(氯化钾),20mM MgSO 4(硫酸镁),1%
Figure PCTCN2018107980-appb-000003
X-100)5μL,25mM dNTP(Enzymatics公司)0.8μL,总体积50μL。反应结束后用磁力架吸附磁珠,回收上清液。
7.当使用方案2的载体磁珠且用转座复合体2时,不需要进行杂交和连接反应,将步骤2产物中加入USER酶(1U/μL,NEB公司)1μL,置于垂直混匀仪上37摄氏度反应0.5个小时。反应结束后加入1.25μL 0.44%SDS室温下孵育10分钟使转座酶变性从DNA上释放下来,然后用高盐磁珠洗涤液和低盐磁珠洗涤液分别洗涤一次。然后用连接酶试剂混合液重悬磁珠,置于垂直混匀仪上25摄氏度反应1个小时。连接酶试剂混合液包含连接酶(T4 DNA连接酶,600U/μL,Enzymatics公司)5μL,3倍浓度连接缓冲液(PEG8000(聚乙二醇8000)30%,Tris-HCl(Tris-盐酸)150mM,ATP 1mM,BSA(牛血清蛋白)0.15mg/mL,MgCl 2(氯化镁)30mM,DTT(二硫代苏糖醇)1.5mM)10μL和16.7μM接头2 1.5μL(接头2由正义链接头2-F和反义链接头2-R退火形成),总体积为30μL。反应结束后高盐磁珠洗涤液和低盐磁珠洗涤缓冲液各洗涤一次。然后加入聚合酶试剂混合液和1μL的100μM引物2重悬磁珠,置于72摄氏度反应10分钟。其中聚合酶(Standard Taq polymerase(标准Taq聚合酶),5U/μL,NEB公司)1μL,10xthermopol buffer(10倍浓度的thermopol缓冲液,NEB公司,200mM Tris-HCl(Tris-盐酸),100mM(NH 4) 2SO 4(硫酸铵),100mM KCl(氯化钾),20mM MgSO 4(硫酸镁),1%
Figure PCTCN2018107980-appb-000004
X-100)5μL,25mM dNTP(Enzymatics公司)0.8μL,总体积50μL。反应结束后用磁力架吸附磁珠,回收上清液。
8.使用引物1和引物2进行DNA分子聚合酶链式扩增5-8个循环,扩增试剂使用的是诺唯赞TD601PCR试剂盒,扩增完成后用XP磁珠(Agencourt AMPure XP-Medium,A63882,AGENCOURT公司)纯化,纯化方法见官方提供的标准操作规程,纯化结束后回收产物为带有分子标签的适合测序的短片段分子。
引物1:5'-TGTGAGCCAAGGAGTTG-3'(SEQ ID NO:20);
引物2:5’phos-GAGACGTTCTCGACTCAGCAGA-3’(SEQ ID NO:21)。
8.使用BGIseq-500进行测序,上一步骤获得的文库需要进行单链成环反应,操作详情请参照BGIseq-500标准DNA小片段建库流程的成环步骤。
9.通过分子标签信息,将测序得到的短片段信息还原为cDNA长片段信息,获得mRNA表达量。
实验结果:
1.全长转录本制备的结果,用1.0%琼脂糖凝胶,140V电压,跑电泳45分钟,结果如图7所示。
2.将全长转录本产物进行双链环化,环化产物应用6%聚丙烯酰胺凝胶,200V电压,跑电泳30分钟,结果如图8所示。
3.将环化产物进行滚环扩增,产物应用1.5%琼脂糖凝胶,140V电压,跑电泳45分钟,结果如图9所示。
4.将滚环扩增产物进行二链合成,合成产物应用1.5%琼脂糖凝胶,140V电压,跑电泳45分钟,结果如图9所示。
用转座复合体1的样本,最终获得的带标签序列的小片段210ng,用1.5%琼脂糖凝胶,1XTAE 120V电压,跑电泳45分钟,结果如图10所示,其条带位于250-3000bp之间,主带在500bp左右,根据DNA质量与摩尔直接之间的换算关系,210ng DNA为636fmol(210/660/500*1000*1000),满足标准BGIseq-500成环步骤要求。成环反应后获得单链环19ng(200fmol),满足测序要求。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (19)

  1. 一种测序文库的构建方法,其特征在于,所述方法包括:
    将线性核酸分子环化形成环状核酸分子,以所述环状核酸分子为模板进行滚环扩增得到多拷贝的长片段核酸分子,然后合成互补链得到双链的长片段核酸分子;
    将所述长片段核酸分子与转座复合体混合孵育形成带有转座复合体的长片段核酸分子,其中所述转座复合体包括转座子序列和转座酶,然后与带有分子标签序列的固相载体混合孵育,使得所述分子标签序列与所述转座复合体上的转座子序列连接;
    将所述转座复合体上的转座酶从所述长片段核酸分子上释放出来,使得所述长片段核酸分子被打断成多个短片段核酸分子,所述短片段核酸分子连接有转座子序列和所述分子标签序列,并且来源于同一长片段核酸分子的多个短片段核酸分子连接有相同的分子标签序列。
  2. 一种测序文库的构建方法,其特征在于,所述方法包括:
    将线性核酸分子环化形成环状核酸分子,以所述环状核酸分子为模板进行滚环扩增得到多拷贝的长片段核酸分子,然后合成互补链得到双链的长片段核酸分子;
    使带有分子标签序列的固相载体上的分子标签序列与转座子序列连接,然后与转座酶以及任选的另一种转座子序列混合孵育,使得所述转座子序列和所述转座酶形成转座复合体,获得带有分子标签序列和转座复合体的固相载体,然后与所述长片段核酸分子混合孵育使得所述转座复合体与所述长片段核酸分子结合;
    将所述转座复合体上的转座酶从所述长片段核酸分子上释放出来,使得所述长片段核酸分子被打断成多个短片段核酸分子,所述短片段核酸分子连接有转座子序列和所述分子标签序列,并且来源于同一长片段核酸分子的多个短片段核酸分子连接有相同的分子标签序列。
  3. 根据权利要求1或2所述的测序文库的构建方法,其特征在于,所述方法还包括:
    对所述连接有转座子序列和所述分子标签序列的短片段核酸分子进行聚合酶链式扩增,使得扩增产物中每个分子包括短片段核酸分子以及转座子序列和分子标签序列。
  4. 根据权利要求1或2所述的测序文库的构建方法,其特征在于,所述线性核酸分子是福尔马林固定石蜡包埋样本中的核酸分子,或者全长mRNA逆转录后的cDNA序列,或者18S rRNA、16S rRNA逆转录后的全长DNA序列,或者基因组DNA片段化序列,或者线粒体或小基因组序列的全长序列,或者基因组DNA目标区域的扩增子序列。
  5. 根据权利要求1或2所述的测序文库的构建方法,其特征在于,所述线性核酸分子通过两端连接接头序列并形成两端互补的粘性末端的方式环化形成环状核酸分子,然后通过以所述环状核酸分子为模板且以与所述接头序列互补的序列为引物进行滚环扩增的方式得到多拷贝的长片段核酸分子。
  6. 根据权利要求5所述的测序文库的构建方法,其特征在于,所述接头序列上包括U碱基位点,可通过USER酶切的方式形成互补的粘性末端;或者,所述接头序列上包括酶切位点,可通过酶切的方式形成互补的粘性末端。
  7. 根据权利要求1或2所述的测序文库的构建方法,其特征在于,所述转座复合体包括 一对彼此相同或不同的转座子序列。
  8. 根据权利要求7所述的测序文库的构建方法,其特征在于,所述转座复合体包括一对彼此不同的转座子序列,每个转座子序列包括正义链和反义链,其中一个转座子序列的正义链能够与所述分子标签序列连接,并且所述反义链上带有U碱基位点,可通过USER酶切去除,以利于后续的聚合酶链式扩增。
  9. 根据权利要求7所述的测序文库的构建方法,其特征在于,所述转座复合体包括一对彼此相同的转座子序列,每个转座子序列包括正义链和反义链,并且每个转座子序列的正义链都能够与所述分子标签序列连接,所述反义链上带有U碱基位点,可通过USER酶切去除。
  10. 根据权利要求9所述的测序文库的构建方法,其特征在于,所述转座复合体上的转座酶从所述长片段核酸分子上释放出来使得所述长片段核酸分子被打断成多个短片段核酸分子之后,在所述转座子序列与所述短片段核酸分子连接的缺口处连接上第二接头序列,再进行聚合酶链式扩增。
  11. 根据权利要求1或2所述的测序文库的构建方法,其特征在于,所述带有分子标签序列的固相载体上的分子标签序列的数量是2个以上。
  12. 根据权利要求1或2所述的测序文库的构建方法,其特征在于,所述分子标签序列通过与所述固相载体上的接头序列连接的方式添加到所述固相载体上。
  13. 根据权利要求1或2所述的测序文库的构建方法,其特征在于,所述带有分子标签序列的固相载体上的分子标签序列的数量是2个以上,这些分子标签序列通过顺次连接的方式添加到所述固相载体上,形成包括2个以上分子标签序列的组合式分子标签。
  14. 根据权利要求1所述的测序文库的构建方法,其特征在于,所述将所述带有转座复合体的长片段核酸分子与带有分子标签序列的固相载体混合孵育之前,向所述带有分子标签序列的固相载体加入一段捕获转座复合体序列使其互补连接到所述分子标签序列上,然后再与所述带有转座复合体的长片段核酸分子混合孵育使得该捕获转座复合体序列分别与所述分子标签序列和所述转座复合体上的转座子序列互补而在二者之间形成搭桥,并通过连接酶作用而使所述分子标签序列与所述转座复合体上的转座子序列连接起来。
  15. 根据权利要求1所述的测序文库的构建方法,其特征在于,将带有转座复合体的长片段核酸分子与带有分子标签序列的固相载体混合孵育时,每个固相载体形成一个虚拟分割,使得一个所述固相载体捕获一条所述带有转座复合体的长片段核酸分子,并使所述分子标签序列与所述转座复合体上的转座子序列连接。
  16. 根据权利要求2所述的测序文库的构建方法,其特征在于,将带有分子标签序列和转座复合体的固相载体与所述长片段核酸分子混合孵育时,每个固相载体形成一个虚拟分割,使得一个所述固相载体捕获一条所述长片段核酸分子。
  17. 一种根据权利要求1至16任一项所述的方法制备的测序文库。
  18. 一种测序方法,其特征在于,所述方法包括对权利要求1至16任一项所述的方法制 备的测序文库进行测序。
  19. 根据权利要求18所述的测序方法,其特征在于,所述测序选自全长转录本组装测序,18S rRNA或16S rRNA的全长测序,线粒体全长测序,或者长片段扩增子测序。
PCT/CN2018/107980 2018-09-27 2018-09-27 测序文库的构建方法和得到的测序文库及测序方法 WO2020061903A1 (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
EP18934817.0A EP3859014A4 (en) 2018-09-27 2018-09-27 METHOD OF CONSTRUCTING SEQUENCING LIBRARY, OBTAINED SEQUENCING LIBRARY AND METHOD OF SEQUENCING
CN201880097792.5A CN112739829A (zh) 2018-09-27 2018-09-27 测序文库的构建方法和得到的测序文库及测序方法
PCT/CN2018/107980 WO2020061903A1 (zh) 2018-09-27 2018-09-27 测序文库的构建方法和得到的测序文库及测序方法
US17/211,833 US20210214783A1 (en) 2018-09-27 2021-03-25 Method for constructing sequencing library, obtained sequencing library and sequencing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2018/107980 WO2020061903A1 (zh) 2018-09-27 2018-09-27 测序文库的构建方法和得到的测序文库及测序方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/211,833 Continuation US20210214783A1 (en) 2018-09-27 2021-03-25 Method for constructing sequencing library, obtained sequencing library and sequencing method

Publications (1)

Publication Number Publication Date
WO2020061903A1 true WO2020061903A1 (zh) 2020-04-02

Family

ID=69950890

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/107980 WO2020061903A1 (zh) 2018-09-27 2018-09-27 测序文库的构建方法和得到的测序文库及测序方法

Country Status (4)

Country Link
US (1) US20210214783A1 (zh)
EP (1) EP3859014A4 (zh)
CN (1) CN112739829A (zh)
WO (1) WO2020061903A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114807123A (zh) * 2021-01-29 2022-07-29 深圳华大基因科技服务有限公司 一种dna分子的扩增引物设计和连接方法
WO2023109887A1 (zh) * 2021-12-15 2023-06-22 南京金斯瑞生物科技有限公司 一种整合位点的检测方法
WO2023240610A1 (zh) * 2022-06-17 2023-12-21 深圳华大智造科技股份有限公司 单链核酸分子测序文库构建方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113667716B (zh) * 2021-08-27 2023-12-15 北京医院 基于滚环扩增的测序文库构建方法及其应用
CN113981548B (zh) * 2021-11-24 2023-07-11 竹石生物科技(苏州)有限公司 Dna甲基化测序文库的制备方法和甲基化检测方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017151828A1 (en) * 2016-03-01 2017-09-08 Universal Sequencing Technology Corporation Methods and kits for tracking nucleic acid target origin for nucleic acid sequencing

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100510106C (zh) * 2006-10-20 2009-07-08 东南大学 全基因组滚环扩增及其产物的固定方法
DK2376517T3 (da) * 2008-10-24 2013-02-11 Epict Technologies Corp Transposon-ende-sammensætninger og fremgangsmåder til at modificere nukleinsyrer
EP2635679B1 (en) * 2010-11-05 2017-04-19 Illumina, Inc. Linking sequence reads using paired code tags
WO2012106546A2 (en) * 2011-02-02 2012-08-09 University Of Washington Through Its Center For Commercialization Massively parallel continguity mapping
EP3161152B1 (en) * 2014-06-30 2018-12-26 Illumina, Inc. Methods and compositions using one-sided transposition
CN106715713B (zh) * 2014-09-12 2020-11-03 深圳华大智造科技有限公司 试剂盒及其在核酸测序中的用途
IL299976A (en) * 2014-10-17 2023-03-01 Illumina Cambridge Ltd Continuity-preserving transposition
PT3207134T (pt) * 2014-10-17 2019-09-17 Illumina Cambridge Ltd Transposição que preserva a contiguidade
US10479991B2 (en) * 2014-11-26 2019-11-19 Mgi Tech Co., Ltd Method and reagent for constructing nucleic acid double-linker single-strand cyclical library
CN104711250A (zh) * 2015-01-26 2015-06-17 北京百迈客生物科技有限公司 一种长片段核酸文库的构建方法
WO2016191618A1 (en) * 2015-05-27 2016-12-01 Jianbiao Zheng Methods of inserting molecular barcodes
CN105861710B (zh) * 2016-05-20 2018-03-30 北京科迅生物技术有限公司 测序接头、其制备方法及其在超低频变异检测中的应用

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017151828A1 (en) * 2016-03-01 2017-09-08 Universal Sequencing Technology Corporation Methods and kits for tracking nucleic acid target origin for nucleic acid sequencing

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114807123A (zh) * 2021-01-29 2022-07-29 深圳华大基因科技服务有限公司 一种dna分子的扩增引物设计和连接方法
CN114807123B (zh) * 2021-01-29 2023-12-01 深圳华大基因科技服务有限公司 一种dna分子的扩增引物设计和连接方法
WO2023109887A1 (zh) * 2021-12-15 2023-06-22 南京金斯瑞生物科技有限公司 一种整合位点的检测方法
WO2023240610A1 (zh) * 2022-06-17 2023-12-21 深圳华大智造科技股份有限公司 单链核酸分子测序文库构建方法

Also Published As

Publication number Publication date
EP3859014A1 (en) 2021-08-04
CN112739829A (zh) 2021-04-30
US20210214783A1 (en) 2021-07-15
EP3859014A4 (en) 2022-04-27

Similar Documents

Publication Publication Date Title
WO2020061903A1 (zh) 测序文库的构建方法和得到的测序文库及测序方法
EP3377625B1 (en) Method for controlled dna fragmentation
US10544451B2 (en) Vesicular linker and uses thereof in nucleic acid library construction and sequencing
JP2020522243A (ja) 核酸のマルチプレックス末端タギング増幅
CN112689673A (zh) 转座体使能的dna/rna测序(ted rna-seq)
US11401543B2 (en) Methods and compositions for improving removal of ribosomal RNA from biological samples
CA2922244C (en) Chromosome conformation capture method including selection and enrichment steps
CN110382710A (zh) 构建核酸分子拷贝的方法
US20140336058A1 (en) Method and kit for characterizing rna in a composition
WO2015050501A1 (en) Amplification paralleled library enrichment
Golov et al. C-TALE, a new cost-effective method for targeted enrichment of Hi-C/3C-seq libraries
CN114391043B (zh) 哺乳动物dna的甲基化检测及分析
CN111801428B (zh) 一种获得单细胞mRNA序列的方法
CN113166809A (zh) 一种dna甲基化检测的方法、试剂盒、装置和应用
US11136576B2 (en) Method for controlled DNA fragmentation
CN113302301A (zh) 检测分析物的方法及其组合物
EP4041913B1 (en) Novel method
WO2023115536A1 (zh) 一种生成标记的核酸分子群的方法及其试剂盒
CA3234378A1 (en) Methods for producing dna libraries and uses thereof
JP4681129B2 (ja) 核酸末端領域の非対称的修飾法
KR20230163386A (ko) 증폭된 라이브러리에서 바람직하지 않은 단편을 선택적으로 고갈시키기 위한 차단 올리고뉴클레오티드
JPH07503859A (ja) 挿入エレメントおよび増幅可能な核酸
JP5253703B2 (ja) 遺伝子断片の取得方法
CN115279918A (zh) 用于测序的新型核酸模板结构

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18934817

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2018934817

Country of ref document: EP

Effective date: 20210428