CN109486924A - 基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法 - Google Patents

基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法 Download PDF

Info

Publication number
CN109486924A
CN109486924A CN201811406204.XA CN201811406204A CN109486924A CN 109486924 A CN109486924 A CN 109486924A CN 201811406204 A CN201811406204 A CN 201811406204A CN 109486924 A CN109486924 A CN 109486924A
Authority
CN
China
Prior art keywords
bar code
sequence
series connection
connection bar
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811406204.XA
Other languages
English (en)
Other versions
CN109486924B (zh
Inventor
李晨虹
王颖
袁昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Maritime University
Shanghai Ocean University
Original Assignee
Shanghai Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Maritime University filed Critical Shanghai Maritime University
Priority to CN201811406204.XA priority Critical patent/CN109486924B/zh
Publication of CN109486924A publication Critical patent/CN109486924A/zh
Priority to US16/693,253 priority patent/US20210309994A1/en
Application granted granted Critical
Publication of CN109486924B publication Critical patent/CN109486924B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法,包括样本DNA序列破碎、修复序列平末端、序列末端加上串联条形码接头、修复序列空缺并延伸和PCR扩增的步骤构建DNA文库;其中串联条形码为6bp长度的DNA序列,且同时满足最小编辑长度3以内、包含不同碱基的片段、使用不同激光色的碱基且相邻碱基激光色不同和不含有AAA、ACA、CCC、CAC、GGG、GTG、TTT和TGT的碱基序列。通过提前引入串联条形码进行DNA标记,大大减少污染数据不能被识别的可能性,极大改善在DNA文库构建和基因富集过程中非常普遍的样本之间相互污染问题。

Description

基于Illumina测序的串联条形码、其标记的DNA文库及其构建 方法
技术领域
本发明涉及分子标记,涉及DNA文库标记,具体涉及一种基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法。
背景技术
在使用Illumina方法进行测序时,目前通用DNA文库构建的步骤为破碎、修复平末端、加上IS7、IS8引物识别位点接头、补足接头与序列之间出现的空缺,最后进行indexingPCR时为序列加上条形码以便区分样本,测序后得到的数据根据此条形码进行分类。但是,上述方法在整个实验步骤最后加上条形码,如果在之前的步骤中样本之间发生相互污染,则无法区分数据是属于哪个样本。
现有技术中,专利申请(CN107502607A)公开了一种大量组织、细胞样本mRNA的分子条形码标记、文库构建、测序的方法,用于反转录mRNA,合成cDNA时进行标记,但不适用于DNA文库构建。专利(CN104573407B)公开了一种物种特异性内源性条形码的搜索方法及其在多样本混合测序中的应用,通过重叠延伸PCR技术,利用样本内源DNA序列的差异对PCR产物进行标记,与DNA文库构建无关,也没有包括条形码标记技术。目前,DNA样本间交叉污染现象非常严重,对后续数据的组装和分析造成很大困扰和隐患。
发明内容
为克服上述现有技术的不足,本发明的目的在于提供一种基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法,在文库构建初期即加入可以区分样本的串联条形码(Inline Index)接头,通过串联条形码标记构建DNA文库,准确区分不同DNA样本。相对于传统的分子条形码技术,不仅纠正受到污染的数据,还大大增加条形码组合的数量用于区分更多样本,节约成本。
为实现上述发明目的,本发明采用的技术方案如下:
第一方面,基于Illumina测序的串联条形码为6bp长度的DNA序列,且同时满足
(ⅰ)最小编辑长度3以内,和
(ⅱ)包含不同碱基的片段,和
(ⅲ)使用不同激光色的碱基,且相邻碱基激光色不同,和
(ⅳ)不含有'AAA'、'ACA'、'CCC'、'CAC'、'GGG'、'GTG'、'TTT'和'TGT'的碱基序列。
优选的,所述串联条形码包括IS1串联条形码、IS2串联条形码和与所述IS1串联条形码和IS2串联条形码对应的IS3串联条形码。
且所述IS3串联条形码与所述IS1串联条形码和IS2串联条形码之间分别具有部分互补片段。
优选的,所述IS1串联条形码包括IS1序列和与所述IS1序列具有部分互补片段的IS3X’序列,通过在95℃以0.1℃/秒的速率降温至12℃,所述IS1序列和所述IS3X’序列结合形成所述IS1串联条形码。
优选的,所述IS2串联条形码包括IS2序列和与所述IS2序列具有部分互补片段的IS3Y’序列,通过在95℃以0.1℃/秒的速率降温至12℃,所述IS2序列和所述IS3Y’序列结合形成所述IS2串联条形码。
第二方面,通过上述串联条形码标记的DNA文库的构建方法,具体地,包括以下步骤:
(1)生物样本DNA序列破碎,获取DNA片段序列,和
(2)修复上述DNA片段序列平末端,和
(3)在所述DNA片段序列5’端加上IS1串联条形码接头,所述DNA片段序列3’端加上IS2串联条形码接头,且引物IS7的结合位点位于所述IS1串联条形码接头外侧,引物IS8的结合位点位于所述IS2串联条形码接头外侧,和
(4)修复所述DNA片段序列空缺并延伸,和
(5)采用所述引物IS7、IS8对DNA序列进行PCR扩增,即得。
本发明的有益效果在于:
传统DNA文库的构建方法中,不断重复地清洗步骤很容易造成样本之间,或者外源性DNA对样本的污染,加上生物探针敏感,导致低浓度的污染DNA也可能被捕获、测序。本发明通过提前引入串联条形码进行DNA标记,大大减少污染数据不能被识别的可能性,极大改善在DNA文库构建和基因富集过程中非常普遍的样本之间相互污染问题。另外,通过本发明标记后的DNA样本可以相互混合用于基因富集、测序,大大降低基因富集技术操作的复杂性和繁琐程度。
附图说明
图1:串联条形码的制作过程为:在95℃以0.1℃/秒的速率降温至12℃的过程中对应的IS1和IS3X’结合形成IS1串联条形码;同样的,在95℃以0.1℃/秒的速率降温至12℃的过程中对应的IS2和IS3Y’结合形成IS2串联条形码。
图2:DNA文库的建立过程依次为:DNA序列平末端修复、两端添加串联条形码接头、修复空缺并延伸DNA;由于引物IS7、IS8的结合位点分别位于IS1、IS2的接头序列最外侧,用引物IS7和引物IS8对DNA序列进行PCR扩增即完成DNA文库。基因富集实验过程中,利用特异探针对DNA文库进行目标片段抓取,引物IS4和测序用条形码Index引物的结合位点分别位于引物IS7和引物IS8外侧,获得最终目标片段后对DNA序列进行index PCR扩增,并进行Illumina测序,也可用引物IS4和Index引物对DNA文库进行扩增直接测序获得基因组信息。
具体实施方式
下面结合附图详细说明本发明的技术方案,但本发明的保护范围不限于下述的实施例。
实施例1
构建串联条形码,根据表1所提供的DNA序列进行合成,先配置OligoHybridization Buffer(NaCl(5M)1mL,Tris-Cl pH8.0(1M)100μL,EDTA pH 8.0(0.5M)20μL和H2O 8.88mL。
具体步骤如下:
将IS1和对应编号的IS3混合,并加入Oligo Hybridization Buffer来形成双链接头(IS1_adapter_P5.F(500μM)10μL、IS3_adapter_P5+P7.R(500μM)10μL、OligoHybridization Buffer(10×)10μL、H2O70μL)。
将IS2和对应编号的IS3混合,并加入Oligo Hybridization Buffer来形成双链接头(IS2_adapter_P7.F(500μM)10μL、IS3_adapter_P5+P7.R(500μM)10μL、OligoHybridization Buffer(10×)10μL、H2O70μL)。
将上述两种混合液分别在PCR仪中95℃下反应10秒,然后以0.1℃/秒的速率从95℃降温至12℃,再以20μL每管进行分装,并在管盖上做好编号,在-20℃环境下保存备用,如图1所示。
表1:Inline Index信息
Name Sequence Name Sequence
TCTGCC IS1_Ind1 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtc*t*g*c*c IS3_Ind1 ggcagaAGATCGGAA*G*A*G*C
GTCTCT IS1_Ind2 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgt*c*t*c*t IS3_Ind2 agagacAGATCGGAA*G*A*G*C
ATATTG IS1_Ind3 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTat*a*t*t*g IS3_Ind3 caatatAGATCGGAA*G*A*G*C
TGGAAG IS1_Ind4 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtg*g*a*a*g IS3_Ind4 cttccaAGATCGGAA*G*A*G*C
TCTAGT IS1_Ind5 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtc*t*a*g*t IS3_Ind5 actagaAGATCGGAA*G*A*G*C
AGAGTA IS1_Ind6 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTag*a*g*t*a IS3_Ind6 tactctAGATCGGAA*G*A*G*C
GGCCAA IS1_Ind7 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgg*c*c*a*a IS3_Ind7 ttggccAGATCGGAA*G*A*G*C
TATCTC IS1_Ind8 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTta*t*c*t*c IS3_Ind8 gagataAGATCGGAA*G*A*G*C
TTATGC IS1_Ind9 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtt*a*t*g*c IS3_Ind9 gcataaAGATCGGAA*G*A*G*C
AGTTGG IS1_Ind10 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTag*t*t*g*g IS3_Ind10 ccaactAGATCGGAA*G*A*G*C
GTCAAG IS1_Ind11 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgt*c*a*a*g IS3_Ind11 cttgacAGATCGGAA*G*A*G*C
CAGCAA IS1_Ind12 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTca*g*c*a*a IS3_Ind12 ttgctgAGATCGGAA*G*A*G*C
TCGCCG IS1_Ind13 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtc*g*c*c*g IS3_Ind13 cggcgaAGATCGGAA*G*A*G*C
CTAAGA IS1_Ind14 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTct*a*a*g*a IS3_Ind14 tcttagAGATCGGAA*G*A*G*C
CCGCTT IS1_Ind15 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTcc*g*c*t*t IS3_Ind15 aagcggAGATCGGAA*G*A*G*C
AAGTTA IS1_Ind16 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTaa*g*t*t*a IS3_Ind16 taacttAGATCGGAA*G*A*G*C
GGTACC IS1_Ind17 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgg*t*a*c*c IS3_Ind17 ggtaccAGATCGGAA*G*A*G*C
CCAGGT IS1_Ind18 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTcc*a*g*g*t IS3_Ind18 acctggAGATCGGAA*G*A*G*C
AATCGA IS1_Ind19 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTaa*t*c*g*a IS3_Ind19 tcgattAGATCGGAA*G*A*G*C
AACGCA IS1_Ind20 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTaa*c*g*c*a IS3_Ind20 tgcgttAGATCGGAA*G*A*G*C
GACGAC IS1_Ind21 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTga*c*g*a*c IS3_Ind21 gtcgtcAGATCGGAA*G*A*G*C
CGCGCT IS1_Ind22 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTcg*c*g*c*t IS3_Ind22 agcgcgAGATCGGAA*G*A*G*C
CCGTAG IS1_Ind23 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTcc*g*t*a*g IS3_Ind23 ctacggAGATCGGAA*G*A*G*C
GTAATC IS1_Ind24 A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgt*a*a*t*c IS3_Ind24 gattacAGATCGGAA*G*A*G*C
GACCTT IS2_Ind25 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTga*c*c*t*t IS3_Ind25 aaggtcAGATCGGAA*G*A*G*C
TCATAA IS2_Ind26 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTtc*a*t*a*a IS3_Ind26 ttatgaAGATCGGAA*G*A*G*C
CAAGAG IS2_Ind27 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTca*a*g*a*g IS3_Ind27 ctcttgAGATCGGAA*G*A*G*C
CGATCA IS2_Ind28 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTcg*a*t*c*a IS3_Ind28 tgatcgAGATCGGAA*G*A*G*C
TTGATT IS2_Ind29 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTtt*g*a*t*t IS3_Ind29 aatcaaAGATCGGAA*G*A*G*C
TCCGAG IS2_Ind30 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTtc*c*g*a*g IS3_Ind30 ctcggaAGATCGGAA*G*A*G*C
CCTGAA IS2_Ind31 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTcc*t*g*a*a IS3_Ind31 ttcaggAGATCGGAA*G*A*G*C
ATTCTT IS2_Ind32 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTat*t*c*t*t IS3_Ind32 aagaatAGATCGGAA*G*A*G*C
GCGACT IS2_Ind33 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTgc*g*a*c*t IS3_Ind33 agtcgcAGATCGGAA*G*A*G*C
GGCTTC IS2_Ind34 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTgg*c*t*t*c IS3_Ind34 gaagccAGATCGGAA*G*A*G*C
AATACG IS2_Ind35 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTaa*t*a*c*g IS3_Ind35 cgtattAGATCGGAA*G*A*G*C
TACGGT IS2_Ind36 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTta*c*g*g*t IS3_Ind36 accgtaAGATCGGAA*G*A*G*C
ACCGTC IS2_Ind37 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTac*c*g*t*c IS3_Ind37 gacggtAGATCGGAA*G*A*G*C
AGAAGC IS2_Ind38 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTag*a*a*g*c IS3_Ind38 gcttctAGATCGGAA*G*A*G*C
CATAGC IS2_Ind39 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTca*t*a*g*c IS3_Ind39 gctatgAGATCGGAA*G*A*G*C
AGGCTC IS2_Ind40 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTag*g*c*t*c IS3_Ind40 gagcctAGATCGGAA*G*A*G*C
CTGCGG IS2_Ind41 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTct*g*c*g*g IS3_Ind41 ccgcagAGATCGGAA*G*A*G*C
CTCGGC IS2_Ind42 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTct*c*g*g*c IS3_Ind42 gccgagAGATCGGAA*G*A*G*C
GATTAG IS2_Ind43 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTga*t*t*a*g IS3_Ind43 ctaatcAGATCGGAA*G*A*G*C
AGATAT IS2_Ind44 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTag*a*t*a*t IS3_Ind44 atatctAGATCGGAA*G*A*G*C
TGGTCC IS2_Ind45 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTtg*g*t*c*c IS3_Ind45 ggaccaAGATCGGAA*G*A*G*C
GTTCCG IS2_Ind46 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTgt*t*c*c*g IS3_Ind46 cggaacAGATCGGAA*G*A*G*C
GTACGT IS2_Ind47 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTgt*a*c*g*t IS3_Ind47 acgtacAGATCGGAA*G*A*G*C
AAGAAC IS2_Ind48 G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTaa*g*a*a*c IS3_Ind48 gttcttAGATCGGAA*G*A*G*C
*表示PTO修饰
实施例2
构建DNA文库,采用Covaris M220超声波破碎仪(Covaris,Inc.MassachusettsUSA)将生物样本DNA序列破碎至长度约250-500bp的DNA片段序列,破碎程序为:运行90秒(50peak power,25duty factor,200cycles/burst),暂停60秒,运行90秒(50peak power,25duty factor,200cycles/burst)。在270μL离心管中,加入35μL MagNA beads,放入磁板并静置1分钟,吸去清液后留下干燥磁珠。在MagNA beads干燥后,加入60μLDNA样本与54μL的MagNA beads Buffer,混匀,并同时准备正对照和负对照。室温放置10分钟后,将离心管放到磁板上,小心地吸出上清液。加入70%酒精186μL,放置1分钟后吸去,重复一次后打开离心管盖,放置5分钟使残留酒精挥发。
准备20μL的混合物(Buffer Tango(10×)2.2μL、1×dNTPs(10mM each)0.22μL、ATP(100mM)0.22μL、T4polynucleotide kinase(10U/μL)1.1μL、T4DNA polymerase(5U/μL)0.44μL、H2O 17.82μL),加入放有干燥的MagNA beads离心管中(在冰盒上操作),混合均匀,将离心管放入PCR仪中修复DNA粘性末端,运行程序为:15分钟25℃,5分钟12℃。将样本拿出PCR仪后,加入18μLMagNA beads Buffer,充分混匀后,放在磁板上静置5分钟,吸去上清液。加入186μL的70%酒精,室温静置1分钟后,去除酒精。重复操作一次后,打开离心管盖静置5分钟使残留酒精挥发。
配置混合溶液38μL(T4DNA ligase buffer(10×)4.4μL,PEG-4000(50%)4.4μL,5%,T4DNA ligase(5U/μL)1.1μL,H2O 31.9μL)。配置完成后,加入放有干燥的MagNA beads离心管中(在冰盒上操作),再分别加入对应样本、正对照和副对照的串联条形码。放入PCR仪中,运行程序为:30分钟22℃。将样本拿出PCR仪后,加入36μLMagNA beads Buffer,充分混匀后,放在磁板上静置5分钟,吸去上清液,加入186μL的70%酒精,室温静置1分钟后,去除酒精;重复操作一次后,打开离心管盖静置5分钟使残留酒精挥发。
为了补足加上串联条形码后接头与序列之间出现的空缺,用Bsm酶从5’端替换延伸填补空缺,配置混合溶液40μL(Bsm buffer(10×)4.4μL、dNTPs(10mM each)1.1μL、Bsmpolymerase、large fragment(8U/μL)1.65μL、H2O36.85μL)。配置完成后,加入放有干燥的MAGNA beads离心管中(在冰盒上操作)。放入PCR仪上,运行程序为:20分钟37℃。将样本拿出PCR仪后,加入36μLMagNA beads Buffer充分混匀,放在磁板上静置5分钟,吸去上清液。加入186μL的70%酒精,室温静置1分钟后,去除酒精。重复操作一次后,打开离心管盖静置5分钟使残留酒精挥发。加入35μL TE Buffer,转入新离心管(命名为lib)中,-20℃保存。
参见附图2,经过上述DNA序列平末端修复、两端添加串联条形码接头、修复空缺并延伸DNA的步骤处理后,由于引物IS7、IS8的结合位点分别位于IS1、IS2的接头序列最外侧,再用引物IS7和引物IS8对DNA序列进行PCR扩增即完成DNA文库。另外,基因富集实验过程中,利用特异探针对DNA文库进行目标片段抓取,引物IS4和测序用条形码Index引物的结合位点分别位于引物IS7和引物IS8外侧,获得最终目标片段后对DNA序列进行index PCR扩增,并进行Illumina测序,也可用引物IS4和Index引物对DNA文库进行扩增直接测序获得基因组信息。

Claims (5)

1.基于Illumina测序的串联条形码,其特征在于,所述串联条形码为6bp长度的DNA序列,且同时满足
(ⅰ)最小编辑长度3以内,和
(ⅱ)包含不同碱基的片段,和
(ⅲ)使用不同激光色的碱基,且相邻碱基激光色不同,和
(ⅳ)不含有'AAA'、'ACA'、'CCC'、'CAC'、'GGG'、'GTG'、'TTT'和'TGT'的碱基序列。
2.根据权利要求1所述的基于Illumina测序的串联条形码,其特征在于,所述串联条形码包括IS1串联条形码、IS2串联条形码和与所述IS1串联条形码和IS2串联条形码对应的IS3串联条形码。
3.根据权利要求1或2所述的基于Illumina测序的串联条形码,其特征在于,所述IS1串联条形码包括IS1序列和与所述IS1序列具有部分互补片段的IS3X’序列,通过在95℃以0.1℃/秒的速率降温至12℃,所述IS1序列和所述IS3X’序列结合形成。
4.根据权利要求1或2所述的基于Illumina测序的串联条形码,其特征在于,所述IS2串联条形码包括IS2序列和与所述IS2序列具有部分互补片段的IS3Y’序列,通过在95℃以0.1℃/秒的速率降温至12℃,所述IS2序列和所述IS3Y’序列结合形成。
5.权利要求1-4任一项所述基于Illumina测序的串联条形码标记DNA文库的构建方法,其特征在于,包括以下步骤:
(1)生物样本DNA序列破碎,获取DNA片段序列,和
(2)修复上述DNA片段序列平末端,和
(3)在所述DNA片段序列5’端加上IS1串联条形码接头,所述DNA片段序列3’端加上IS2串联条形码接头,且引物IS7的结合位点位于所述IS1串联条形码接头外侧,引物IS8的结合位点位于所述IS2串联条形码接头外侧,和
(4)修复所述DNA片段序列空缺并延伸,和
(5)采用所述引物IS7、IS8对DNA序列进行PCR扩增,即得。
CN201811406204.XA 2018-11-23 2018-11-23 基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法 Active CN109486924B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811406204.XA CN109486924B (zh) 2018-11-23 2018-11-23 基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法
US16/693,253 US20210309994A1 (en) 2018-11-23 2019-11-23 Inline index based on illumina sequencing, and dna library labeled thereby and method for constructing same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811406204.XA CN109486924B (zh) 2018-11-23 2018-11-23 基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法

Publications (2)

Publication Number Publication Date
CN109486924A true CN109486924A (zh) 2019-03-19
CN109486924B CN109486924B (zh) 2022-03-01

Family

ID=65697727

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811406204.XA Active CN109486924B (zh) 2018-11-23 2018-11-23 基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法

Country Status (2)

Country Link
US (1) US20210309994A1 (zh)
CN (1) CN109486924B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105506125A (zh) * 2016-01-12 2016-04-20 上海美吉生物医药科技有限公司 一种dna的测序方法及一种二代测序文库
CN105734049A (zh) * 2016-03-10 2016-07-06 深圳出入境检验检疫局动植物检验检疫技术中心 Dna条形码制备方法及草莓疫霉红心病菌dna条形码
CN107586835A (zh) * 2017-10-19 2018-01-16 东南大学 一种基于单链接头的下一代测序文库的构建方法及其应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105506125A (zh) * 2016-01-12 2016-04-20 上海美吉生物医药科技有限公司 一种dna的测序方法及一种二代测序文库
CN105734049A (zh) * 2016-03-10 2016-07-06 深圳出入境检验检疫局动植物检验检疫技术中心 Dna条形码制备方法及草莓疫霉红心病菌dna条形码
CN107586835A (zh) * 2017-10-19 2018-01-16 东南大学 一种基于单链接头的下一代测序文库的构建方法及其应用

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ILLUMINA: "Illumina Adapter Sequences", 《DOCUMENT#1000000002694V00》 *
LUHAN YANG等: "CRISPR/Cas9-Directed Genome Editing of Cultured Cells", 《CURRENT PROTOCOLS IN MOLECULAR BIOLOGY》 *
倪守胜等: "基于高通量测序的虾夷扇贝基因组微卫星特征分析", 《渔业科学进展》 *
高山等主编: "《R语言与Bioconductor生物信息学应用》", 31 January 2014, 天津科技翻译出版有限公司 *

Also Published As

Publication number Publication date
US20210309994A1 (en) 2021-10-07
CN109486924B (zh) 2022-03-01

Similar Documents

Publication Publication Date Title
CN106498040B (zh) 一种分子标记微珠及基于该分子标记微珠的高通量单细胞测序方法
US10655173B2 (en) Spatial and cellular mapping of biomolecules in situ by high-throughput sequencing
CN105349675B (zh) 基于双酶切的大黄鱼全基因组SNP和InDel分子标记方法
CN108251504A (zh) 一种超快速构建基因组dna测序文库的方法和试剂盒
CN110218781B (zh) 21个微单倍型位点的复合扩增体系、下一代测序分型试剂盒及分型方法
CN106636393A (zh) 与南瓜皮色基因连锁的snp分子标记及其应用
WO2022257754A1 (zh) 一种鸡的品种鉴定方法
CN108517567A (zh) 用于cfDNA建库的接头、引物组、试剂盒和建库方法
CN105368930A (zh) 测序基因分型技术中测序酶切组合的确定方法
CN111748637A (zh) 一种用于亲缘关系分析鉴定的snp分子标记组合、多重复合扩增引物组、试剂盒及方法
CN111304288A (zh) 特异性分子标签umi组及其应用
CN109505012A (zh) 一种针对FFPE样本的mRNA二代测序文库构建的试剂盒及其应用
CN113293204A (zh) 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法
CN116043337A (zh) Dna甲基化标志物筛查试剂盒及方法
CN105002570B (zh) 一种一次制备多个dna大片段插入双末端测序文库的方法
CN106676099A (zh) 构建简化基因组文库的方法及试剂盒
CN113462748A (zh) Dna测序文库的制备方法及试剂盒
CN109486924A (zh) 基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法
CN109055509B (zh) 基于二代测序技术检测无对照样本的微卫星不稳定的方法、组合物和用途
CN109022558A (zh) 基于酶切组合基因分型测序技术的许氏平鲉基因组snp分子标记方法
CN113136416B (zh) 一种用于PacBio测序的文库构建方法
CN107190067B (zh) 一种改进的二代测序用随机标签接头制作方法
CN106222164B (zh) 利用转座子酶进行体外核酸单向扩增的方法、组合物和试剂盒
CN112795990A (zh) 一种灵活多变的降低污染及pcr偏倚的多标签二代测序文库接头
WO2024036445A1 (zh) 一种测序文库的制备方法及用于制备测序文库的试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant