CN109486924A - 基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法 - Google Patents
基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法 Download PDFInfo
- Publication number
- CN109486924A CN109486924A CN201811406204.XA CN201811406204A CN109486924A CN 109486924 A CN109486924 A CN 109486924A CN 201811406204 A CN201811406204 A CN 201811406204A CN 109486924 A CN109486924 A CN 109486924A
- Authority
- CN
- China
- Prior art keywords
- bar code
- sequence
- series connection
- connection bar
- dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1068—Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Plant Pathology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Immunology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法,包括样本DNA序列破碎、修复序列平末端、序列末端加上串联条形码接头、修复序列空缺并延伸和PCR扩增的步骤构建DNA文库;其中串联条形码为6bp长度的DNA序列,且同时满足最小编辑长度3以内、包含不同碱基的片段、使用不同激光色的碱基且相邻碱基激光色不同和不含有AAA、ACA、CCC、CAC、GGG、GTG、TTT和TGT的碱基序列。通过提前引入串联条形码进行DNA标记,大大减少污染数据不能被识别的可能性,极大改善在DNA文库构建和基因富集过程中非常普遍的样本之间相互污染问题。
Description
技术领域
本发明涉及分子标记,涉及DNA文库标记,具体涉及一种基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法。
背景技术
在使用Illumina方法进行测序时,目前通用DNA文库构建的步骤为破碎、修复平末端、加上IS7、IS8引物识别位点接头、补足接头与序列之间出现的空缺,最后进行indexingPCR时为序列加上条形码以便区分样本,测序后得到的数据根据此条形码进行分类。但是,上述方法在整个实验步骤最后加上条形码,如果在之前的步骤中样本之间发生相互污染,则无法区分数据是属于哪个样本。
现有技术中,专利申请(CN107502607A)公开了一种大量组织、细胞样本mRNA的分子条形码标记、文库构建、测序的方法,用于反转录mRNA,合成cDNA时进行标记,但不适用于DNA文库构建。专利(CN104573407B)公开了一种物种特异性内源性条形码的搜索方法及其在多样本混合测序中的应用,通过重叠延伸PCR技术,利用样本内源DNA序列的差异对PCR产物进行标记,与DNA文库构建无关,也没有包括条形码标记技术。目前,DNA样本间交叉污染现象非常严重,对后续数据的组装和分析造成很大困扰和隐患。
发明内容
为克服上述现有技术的不足,本发明的目的在于提供一种基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法,在文库构建初期即加入可以区分样本的串联条形码(Inline Index)接头,通过串联条形码标记构建DNA文库,准确区分不同DNA样本。相对于传统的分子条形码技术,不仅纠正受到污染的数据,还大大增加条形码组合的数量用于区分更多样本,节约成本。
为实现上述发明目的,本发明采用的技术方案如下:
第一方面,基于Illumina测序的串联条形码为6bp长度的DNA序列,且同时满足
(ⅰ)最小编辑长度3以内,和
(ⅱ)包含不同碱基的片段,和
(ⅲ)使用不同激光色的碱基,且相邻碱基激光色不同,和
(ⅳ)不含有'AAA'、'ACA'、'CCC'、'CAC'、'GGG'、'GTG'、'TTT'和'TGT'的碱基序列。
优选的,所述串联条形码包括IS1串联条形码、IS2串联条形码和与所述IS1串联条形码和IS2串联条形码对应的IS3串联条形码。
且所述IS3串联条形码与所述IS1串联条形码和IS2串联条形码之间分别具有部分互补片段。
优选的,所述IS1串联条形码包括IS1序列和与所述IS1序列具有部分互补片段的IS3X’序列,通过在95℃以0.1℃/秒的速率降温至12℃,所述IS1序列和所述IS3X’序列结合形成所述IS1串联条形码。
优选的,所述IS2串联条形码包括IS2序列和与所述IS2序列具有部分互补片段的IS3Y’序列,通过在95℃以0.1℃/秒的速率降温至12℃,所述IS2序列和所述IS3Y’序列结合形成所述IS2串联条形码。
第二方面,通过上述串联条形码标记的DNA文库的构建方法,具体地,包括以下步骤:
(1)生物样本DNA序列破碎,获取DNA片段序列,和
(2)修复上述DNA片段序列平末端,和
(3)在所述DNA片段序列5’端加上IS1串联条形码接头,所述DNA片段序列3’端加上IS2串联条形码接头,且引物IS7的结合位点位于所述IS1串联条形码接头外侧,引物IS8的结合位点位于所述IS2串联条形码接头外侧,和
(4)修复所述DNA片段序列空缺并延伸,和
(5)采用所述引物IS7、IS8对DNA序列进行PCR扩增,即得。
本发明的有益效果在于:
传统DNA文库的构建方法中,不断重复地清洗步骤很容易造成样本之间,或者外源性DNA对样本的污染,加上生物探针敏感,导致低浓度的污染DNA也可能被捕获、测序。本发明通过提前引入串联条形码进行DNA标记,大大减少污染数据不能被识别的可能性,极大改善在DNA文库构建和基因富集过程中非常普遍的样本之间相互污染问题。另外,通过本发明标记后的DNA样本可以相互混合用于基因富集、测序,大大降低基因富集技术操作的复杂性和繁琐程度。
附图说明
图1:串联条形码的制作过程为:在95℃以0.1℃/秒的速率降温至12℃的过程中对应的IS1和IS3X’结合形成IS1串联条形码;同样的,在95℃以0.1℃/秒的速率降温至12℃的过程中对应的IS2和IS3Y’结合形成IS2串联条形码。
图2:DNA文库的建立过程依次为:DNA序列平末端修复、两端添加串联条形码接头、修复空缺并延伸DNA;由于引物IS7、IS8的结合位点分别位于IS1、IS2的接头序列最外侧,用引物IS7和引物IS8对DNA序列进行PCR扩增即完成DNA文库。基因富集实验过程中,利用特异探针对DNA文库进行目标片段抓取,引物IS4和测序用条形码Index引物的结合位点分别位于引物IS7和引物IS8外侧,获得最终目标片段后对DNA序列进行index PCR扩增,并进行Illumina测序,也可用引物IS4和Index引物对DNA文库进行扩增直接测序获得基因组信息。
具体实施方式
下面结合附图详细说明本发明的技术方案,但本发明的保护范围不限于下述的实施例。
实施例1
构建串联条形码,根据表1所提供的DNA序列进行合成,先配置OligoHybridization Buffer(NaCl(5M)1mL,Tris-Cl pH8.0(1M)100μL,EDTA pH 8.0(0.5M)20μL和H2O 8.88mL。
具体步骤如下:
将IS1和对应编号的IS3混合,并加入Oligo Hybridization Buffer来形成双链接头(IS1_adapter_P5.F(500μM)10μL、IS3_adapter_P5+P7.R(500μM)10μL、OligoHybridization Buffer(10×)10μL、H2O70μL)。
将IS2和对应编号的IS3混合,并加入Oligo Hybridization Buffer来形成双链接头(IS2_adapter_P7.F(500μM)10μL、IS3_adapter_P5+P7.R(500μM)10μL、OligoHybridization Buffer(10×)10μL、H2O70μL)。
将上述两种混合液分别在PCR仪中95℃下反应10秒,然后以0.1℃/秒的速率从95℃降温至12℃,再以20μL每管进行分装,并在管盖上做好编号,在-20℃环境下保存备用,如图1所示。
表1:Inline Index信息
Name | Sequence | Name | Sequence | |
TCTGCC | IS1_Ind1 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtc*t*g*c*c | IS3_Ind1 | ggcagaAGATCGGAA*G*A*G*C |
GTCTCT | IS1_Ind2 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgt*c*t*c*t | IS3_Ind2 | agagacAGATCGGAA*G*A*G*C |
ATATTG | IS1_Ind3 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTat*a*t*t*g | IS3_Ind3 | caatatAGATCGGAA*G*A*G*C |
TGGAAG | IS1_Ind4 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtg*g*a*a*g | IS3_Ind4 | cttccaAGATCGGAA*G*A*G*C |
TCTAGT | IS1_Ind5 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtc*t*a*g*t | IS3_Ind5 | actagaAGATCGGAA*G*A*G*C |
AGAGTA | IS1_Ind6 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTag*a*g*t*a | IS3_Ind6 | tactctAGATCGGAA*G*A*G*C |
GGCCAA | IS1_Ind7 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgg*c*c*a*a | IS3_Ind7 | ttggccAGATCGGAA*G*A*G*C |
TATCTC | IS1_Ind8 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTta*t*c*t*c | IS3_Ind8 | gagataAGATCGGAA*G*A*G*C |
TTATGC | IS1_Ind9 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtt*a*t*g*c | IS3_Ind9 | gcataaAGATCGGAA*G*A*G*C |
AGTTGG | IS1_Ind10 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTag*t*t*g*g | IS3_Ind10 | ccaactAGATCGGAA*G*A*G*C |
GTCAAG | IS1_Ind11 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgt*c*a*a*g | IS3_Ind11 | cttgacAGATCGGAA*G*A*G*C |
CAGCAA | IS1_Ind12 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTca*g*c*a*a | IS3_Ind12 | ttgctgAGATCGGAA*G*A*G*C |
TCGCCG | IS1_Ind13 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTtc*g*c*c*g | IS3_Ind13 | cggcgaAGATCGGAA*G*A*G*C |
CTAAGA | IS1_Ind14 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTct*a*a*g*a | IS3_Ind14 | tcttagAGATCGGAA*G*A*G*C |
CCGCTT | IS1_Ind15 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTcc*g*c*t*t | IS3_Ind15 | aagcggAGATCGGAA*G*A*G*C |
AAGTTA | IS1_Ind16 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTaa*g*t*t*a | IS3_Ind16 | taacttAGATCGGAA*G*A*G*C |
GGTACC | IS1_Ind17 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgg*t*a*c*c | IS3_Ind17 | ggtaccAGATCGGAA*G*A*G*C |
CCAGGT | IS1_Ind18 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTcc*a*g*g*t | IS3_Ind18 | acctggAGATCGGAA*G*A*G*C |
AATCGA | IS1_Ind19 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTaa*t*c*g*a | IS3_Ind19 | tcgattAGATCGGAA*G*A*G*C |
AACGCA | IS1_Ind20 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTaa*c*g*c*a | IS3_Ind20 | tgcgttAGATCGGAA*G*A*G*C |
GACGAC | IS1_Ind21 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTga*c*g*a*c | IS3_Ind21 | gtcgtcAGATCGGAA*G*A*G*C |
CGCGCT | IS1_Ind22 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTcg*c*g*c*t | IS3_Ind22 | agcgcgAGATCGGAA*G*A*G*C |
CCGTAG | IS1_Ind23 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTcc*g*t*a*g | IS3_Ind23 | ctacggAGATCGGAA*G*A*G*C |
GTAATC | IS1_Ind24 | A*C*A*C*TCTTTCCCTACACGACGCTCTTCCGATCTgt*a*a*t*c | IS3_Ind24 | gattacAGATCGGAA*G*A*G*C |
GACCTT | IS2_Ind25 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTga*c*c*t*t | IS3_Ind25 | aaggtcAGATCGGAA*G*A*G*C |
TCATAA | IS2_Ind26 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTtc*a*t*a*a | IS3_Ind26 | ttatgaAGATCGGAA*G*A*G*C |
CAAGAG | IS2_Ind27 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTca*a*g*a*g | IS3_Ind27 | ctcttgAGATCGGAA*G*A*G*C |
CGATCA | IS2_Ind28 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTcg*a*t*c*a | IS3_Ind28 | tgatcgAGATCGGAA*G*A*G*C |
TTGATT | IS2_Ind29 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTtt*g*a*t*t | IS3_Ind29 | aatcaaAGATCGGAA*G*A*G*C |
TCCGAG | IS2_Ind30 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTtc*c*g*a*g | IS3_Ind30 | ctcggaAGATCGGAA*G*A*G*C |
CCTGAA | IS2_Ind31 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTcc*t*g*a*a | IS3_Ind31 | ttcaggAGATCGGAA*G*A*G*C |
ATTCTT | IS2_Ind32 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTat*t*c*t*t | IS3_Ind32 | aagaatAGATCGGAA*G*A*G*C |
GCGACT | IS2_Ind33 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTgc*g*a*c*t | IS3_Ind33 | agtcgcAGATCGGAA*G*A*G*C |
GGCTTC | IS2_Ind34 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTgg*c*t*t*c | IS3_Ind34 | gaagccAGATCGGAA*G*A*G*C |
AATACG | IS2_Ind35 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTaa*t*a*c*g | IS3_Ind35 | cgtattAGATCGGAA*G*A*G*C |
TACGGT | IS2_Ind36 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTta*c*g*g*t | IS3_Ind36 | accgtaAGATCGGAA*G*A*G*C |
ACCGTC | IS2_Ind37 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTac*c*g*t*c | IS3_Ind37 | gacggtAGATCGGAA*G*A*G*C |
AGAAGC | IS2_Ind38 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTag*a*a*g*c | IS3_Ind38 | gcttctAGATCGGAA*G*A*G*C |
CATAGC | IS2_Ind39 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTca*t*a*g*c | IS3_Ind39 | gctatgAGATCGGAA*G*A*G*C |
AGGCTC | IS2_Ind40 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTag*g*c*t*c | IS3_Ind40 | gagcctAGATCGGAA*G*A*G*C |
CTGCGG | IS2_Ind41 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTct*g*c*g*g | IS3_Ind41 | ccgcagAGATCGGAA*G*A*G*C |
CTCGGC | IS2_Ind42 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTct*c*g*g*c | IS3_Ind42 | gccgagAGATCGGAA*G*A*G*C |
GATTAG | IS2_Ind43 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTga*t*t*a*g | IS3_Ind43 | ctaatcAGATCGGAA*G*A*G*C |
AGATAT | IS2_Ind44 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTag*a*t*a*t | IS3_Ind44 | atatctAGATCGGAA*G*A*G*C |
TGGTCC | IS2_Ind45 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTtg*g*t*c*c | IS3_Ind45 | ggaccaAGATCGGAA*G*A*G*C |
GTTCCG | IS2_Ind46 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTgt*t*c*c*g | IS3_Ind46 | cggaacAGATCGGAA*G*A*G*C |
GTACGT | IS2_Ind47 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTgt*a*c*g*t | IS3_Ind47 | acgtacAGATCGGAA*G*A*G*C |
AAGAAC | IS2_Ind48 | G*T*G*A*CTGGAGTTCAGACGTGTGCTCTTCCGATCTaa*g*a*a*c | IS3_Ind48 | gttcttAGATCGGAA*G*A*G*C |
*表示PTO修饰
实施例2
构建DNA文库,采用Covaris M220超声波破碎仪(Covaris,Inc.MassachusettsUSA)将生物样本DNA序列破碎至长度约250-500bp的DNA片段序列,破碎程序为:运行90秒(50peak power,25duty factor,200cycles/burst),暂停60秒,运行90秒(50peak power,25duty factor,200cycles/burst)。在270μL离心管中,加入35μL MagNA beads,放入磁板并静置1分钟,吸去清液后留下干燥磁珠。在MagNA beads干燥后,加入60μLDNA样本与54μL的MagNA beads Buffer,混匀,并同时准备正对照和负对照。室温放置10分钟后,将离心管放到磁板上,小心地吸出上清液。加入70%酒精186μL,放置1分钟后吸去,重复一次后打开离心管盖,放置5分钟使残留酒精挥发。
准备20μL的混合物(Buffer Tango(10×)2.2μL、1×dNTPs(10mM each)0.22μL、ATP(100mM)0.22μL、T4polynucleotide kinase(10U/μL)1.1μL、T4DNA polymerase(5U/μL)0.44μL、H2O 17.82μL),加入放有干燥的MagNA beads离心管中(在冰盒上操作),混合均匀,将离心管放入PCR仪中修复DNA粘性末端,运行程序为:15分钟25℃,5分钟12℃。将样本拿出PCR仪后,加入18μLMagNA beads Buffer,充分混匀后,放在磁板上静置5分钟,吸去上清液。加入186μL的70%酒精,室温静置1分钟后,去除酒精。重复操作一次后,打开离心管盖静置5分钟使残留酒精挥发。
配置混合溶液38μL(T4DNA ligase buffer(10×)4.4μL,PEG-4000(50%)4.4μL,5%,T4DNA ligase(5U/μL)1.1μL,H2O 31.9μL)。配置完成后,加入放有干燥的MagNA beads离心管中(在冰盒上操作),再分别加入对应样本、正对照和副对照的串联条形码。放入PCR仪中,运行程序为:30分钟22℃。将样本拿出PCR仪后,加入36μLMagNA beads Buffer,充分混匀后,放在磁板上静置5分钟,吸去上清液,加入186μL的70%酒精,室温静置1分钟后,去除酒精;重复操作一次后,打开离心管盖静置5分钟使残留酒精挥发。
为了补足加上串联条形码后接头与序列之间出现的空缺,用Bsm酶从5’端替换延伸填补空缺,配置混合溶液40μL(Bsm buffer(10×)4.4μL、dNTPs(10mM each)1.1μL、Bsmpolymerase、large fragment(8U/μL)1.65μL、H2O36.85μL)。配置完成后,加入放有干燥的MAGNA beads离心管中(在冰盒上操作)。放入PCR仪上,运行程序为:20分钟37℃。将样本拿出PCR仪后,加入36μLMagNA beads Buffer充分混匀,放在磁板上静置5分钟,吸去上清液。加入186μL的70%酒精,室温静置1分钟后,去除酒精。重复操作一次后,打开离心管盖静置5分钟使残留酒精挥发。加入35μL TE Buffer,转入新离心管(命名为lib)中,-20℃保存。
参见附图2,经过上述DNA序列平末端修复、两端添加串联条形码接头、修复空缺并延伸DNA的步骤处理后,由于引物IS7、IS8的结合位点分别位于IS1、IS2的接头序列最外侧,再用引物IS7和引物IS8对DNA序列进行PCR扩增即完成DNA文库。另外,基因富集实验过程中,利用特异探针对DNA文库进行目标片段抓取,引物IS4和测序用条形码Index引物的结合位点分别位于引物IS7和引物IS8外侧,获得最终目标片段后对DNA序列进行index PCR扩增,并进行Illumina测序,也可用引物IS4和Index引物对DNA文库进行扩增直接测序获得基因组信息。
Claims (5)
1.基于Illumina测序的串联条形码,其特征在于,所述串联条形码为6bp长度的DNA序列,且同时满足
(ⅰ)最小编辑长度3以内,和
(ⅱ)包含不同碱基的片段,和
(ⅲ)使用不同激光色的碱基,且相邻碱基激光色不同,和
(ⅳ)不含有'AAA'、'ACA'、'CCC'、'CAC'、'GGG'、'GTG'、'TTT'和'TGT'的碱基序列。
2.根据权利要求1所述的基于Illumina测序的串联条形码,其特征在于,所述串联条形码包括IS1串联条形码、IS2串联条形码和与所述IS1串联条形码和IS2串联条形码对应的IS3串联条形码。
3.根据权利要求1或2所述的基于Illumina测序的串联条形码,其特征在于,所述IS1串联条形码包括IS1序列和与所述IS1序列具有部分互补片段的IS3X’序列,通过在95℃以0.1℃/秒的速率降温至12℃,所述IS1序列和所述IS3X’序列结合形成。
4.根据权利要求1或2所述的基于Illumina测序的串联条形码,其特征在于,所述IS2串联条形码包括IS2序列和与所述IS2序列具有部分互补片段的IS3Y’序列,通过在95℃以0.1℃/秒的速率降温至12℃,所述IS2序列和所述IS3Y’序列结合形成。
5.权利要求1-4任一项所述基于Illumina测序的串联条形码标记DNA文库的构建方法,其特征在于,包括以下步骤:
(1)生物样本DNA序列破碎,获取DNA片段序列,和
(2)修复上述DNA片段序列平末端,和
(3)在所述DNA片段序列5’端加上IS1串联条形码接头,所述DNA片段序列3’端加上IS2串联条形码接头,且引物IS7的结合位点位于所述IS1串联条形码接头外侧,引物IS8的结合位点位于所述IS2串联条形码接头外侧,和
(4)修复所述DNA片段序列空缺并延伸,和
(5)采用所述引物IS7、IS8对DNA序列进行PCR扩增,即得。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811406204.XA CN109486924B (zh) | 2018-11-23 | 2018-11-23 | 基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法 |
US16/693,253 US20210309994A1 (en) | 2018-11-23 | 2019-11-23 | Inline index based on illumina sequencing, and dna library labeled thereby and method for constructing same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811406204.XA CN109486924B (zh) | 2018-11-23 | 2018-11-23 | 基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109486924A true CN109486924A (zh) | 2019-03-19 |
CN109486924B CN109486924B (zh) | 2022-03-01 |
Family
ID=65697727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811406204.XA Active CN109486924B (zh) | 2018-11-23 | 2018-11-23 | 基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20210309994A1 (zh) |
CN (1) | CN109486924B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105506125A (zh) * | 2016-01-12 | 2016-04-20 | 上海美吉生物医药科技有限公司 | 一种dna的测序方法及一种二代测序文库 |
CN105734049A (zh) * | 2016-03-10 | 2016-07-06 | 深圳出入境检验检疫局动植物检验检疫技术中心 | Dna条形码制备方法及草莓疫霉红心病菌dna条形码 |
CN107586835A (zh) * | 2017-10-19 | 2018-01-16 | 东南大学 | 一种基于单链接头的下一代测序文库的构建方法及其应用 |
-
2018
- 2018-11-23 CN CN201811406204.XA patent/CN109486924B/zh active Active
-
2019
- 2019-11-23 US US16/693,253 patent/US20210309994A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105506125A (zh) * | 2016-01-12 | 2016-04-20 | 上海美吉生物医药科技有限公司 | 一种dna的测序方法及一种二代测序文库 |
CN105734049A (zh) * | 2016-03-10 | 2016-07-06 | 深圳出入境检验检疫局动植物检验检疫技术中心 | Dna条形码制备方法及草莓疫霉红心病菌dna条形码 |
CN107586835A (zh) * | 2017-10-19 | 2018-01-16 | 东南大学 | 一种基于单链接头的下一代测序文库的构建方法及其应用 |
Non-Patent Citations (4)
Title |
---|
ILLUMINA: "Illumina Adapter Sequences", 《DOCUMENT#1000000002694V00》 * |
LUHAN YANG等: "CRISPR/Cas9-Directed Genome Editing of Cultured Cells", 《CURRENT PROTOCOLS IN MOLECULAR BIOLOGY》 * |
倪守胜等: "基于高通量测序的虾夷扇贝基因组微卫星特征分析", 《渔业科学进展》 * |
高山等主编: "《R语言与Bioconductor生物信息学应用》", 31 January 2014, 天津科技翻译出版有限公司 * |
Also Published As
Publication number | Publication date |
---|---|
US20210309994A1 (en) | 2021-10-07 |
CN109486924B (zh) | 2022-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106498040B (zh) | 一种分子标记微珠及基于该分子标记微珠的高通量单细胞测序方法 | |
US10655173B2 (en) | Spatial and cellular mapping of biomolecules in situ by high-throughput sequencing | |
CN105349675B (zh) | 基于双酶切的大黄鱼全基因组SNP和InDel分子标记方法 | |
CN108251504A (zh) | 一种超快速构建基因组dna测序文库的方法和试剂盒 | |
CN110218781B (zh) | 21个微单倍型位点的复合扩增体系、下一代测序分型试剂盒及分型方法 | |
CN106636393A (zh) | 与南瓜皮色基因连锁的snp分子标记及其应用 | |
WO2022257754A1 (zh) | 一种鸡的品种鉴定方法 | |
CN108517567A (zh) | 用于cfDNA建库的接头、引物组、试剂盒和建库方法 | |
CN105368930A (zh) | 测序基因分型技术中测序酶切组合的确定方法 | |
CN111748637A (zh) | 一种用于亲缘关系分析鉴定的snp分子标记组合、多重复合扩增引物组、试剂盒及方法 | |
CN111304288A (zh) | 特异性分子标签umi组及其应用 | |
CN109505012A (zh) | 一种针对FFPE样本的mRNA二代测序文库构建的试剂盒及其应用 | |
CN113293204A (zh) | 基于二代测序平台检测微卫星不稳定性的引物组合物、试剂盒和方法 | |
CN116043337A (zh) | Dna甲基化标志物筛查试剂盒及方法 | |
CN105002570B (zh) | 一种一次制备多个dna大片段插入双末端测序文库的方法 | |
CN106676099A (zh) | 构建简化基因组文库的方法及试剂盒 | |
CN113462748A (zh) | Dna测序文库的制备方法及试剂盒 | |
CN109486924A (zh) | 基于Illumina测序的串联条形码、其标记的DNA文库及其构建方法 | |
CN109055509B (zh) | 基于二代测序技术检测无对照样本的微卫星不稳定的方法、组合物和用途 | |
CN109022558A (zh) | 基于酶切组合基因分型测序技术的许氏平鲉基因组snp分子标记方法 | |
CN113136416B (zh) | 一种用于PacBio测序的文库构建方法 | |
CN107190067B (zh) | 一种改进的二代测序用随机标签接头制作方法 | |
CN106222164B (zh) | 利用转座子酶进行体外核酸单向扩增的方法、组合物和试剂盒 | |
CN112795990A (zh) | 一种灵活多变的降低污染及pcr偏倚的多标签二代测序文库接头 | |
WO2024036445A1 (zh) | 一种测序文库的制备方法及用于制备测序文库的试剂盒 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |