CN113151427A - 一种核苷非标记fret的核酸测序方法 - Google Patents
一种核苷非标记fret的核酸测序方法 Download PDFInfo
- Publication number
- CN113151427A CN113151427A CN202110544290.6A CN202110544290A CN113151427A CN 113151427 A CN113151427 A CN 113151427A CN 202110544290 A CN202110544290 A CN 202110544290A CN 113151427 A CN113151427 A CN 113151427A
- Authority
- CN
- China
- Prior art keywords
- nucleic acid
- fret
- sequencing
- dna polymerase
- donor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000002866 fluorescence resonance energy transfer Methods 0.000 title claims abstract description 86
- 239000002777 nucleoside Substances 0.000 title claims abstract description 20
- 150000003833 nucleoside derivatives Chemical class 0.000 title claims abstract description 16
- 238000003203 nucleic acid sequencing method Methods 0.000 title abstract description 7
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 83
- 238000012163 sequencing technique Methods 0.000 claims abstract description 79
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 65
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 65
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims abstract description 38
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims abstract description 38
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 37
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 37
- 238000000034 method Methods 0.000 claims abstract description 35
- 238000006243 chemical reaction Methods 0.000 claims abstract description 34
- 230000008859 change Effects 0.000 claims abstract description 20
- 230000000295 complement effect Effects 0.000 claims abstract description 12
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 11
- 239000000203 mixture Substances 0.000 claims abstract description 11
- 239000004205 dimethyl polysiloxane Substances 0.000 claims description 11
- 229920000435 poly(dimethylsiloxane) Polymers 0.000 claims description 11
- 239000000463 material Substances 0.000 claims description 9
- 239000011324 bead Substances 0.000 claims description 8
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 claims description 8
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 claims description 8
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 claims description 8
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 claims description 8
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 claims description 8
- 108010006785 Taq Polymerase Proteins 0.000 claims description 7
- -1 polydimethylsiloxane Polymers 0.000 claims description 7
- 229920000089 Cyclic olefin copolymer Polymers 0.000 claims description 4
- 239000004713 Cyclic olefin copolymer Substances 0.000 claims description 4
- 239000004952 Polyamide Substances 0.000 claims description 4
- 229920003229 poly(methyl methacrylate) Polymers 0.000 claims description 4
- 229920002647 polyamide Polymers 0.000 claims description 4
- 239000004926 polymethyl methacrylate Substances 0.000 claims description 4
- 108090000623 proteins and genes Proteins 0.000 claims description 4
- 239000011521 glass Substances 0.000 claims description 3
- 239000004005 microsphere Substances 0.000 claims description 3
- 102000004169 proteins and genes Human genes 0.000 claims description 3
- 239000000872 buffer Substances 0.000 claims description 2
- 125000003835 nucleoside group Chemical group 0.000 claims 4
- 239000002773 nucleotide Substances 0.000 claims 1
- 125000003729 nucleotide group Chemical group 0.000 claims 1
- 238000002372 labelling Methods 0.000 abstract description 8
- 108020004414 DNA Proteins 0.000 abstract description 5
- 238000001514 detection method Methods 0.000 abstract description 3
- 102000053602 DNA Human genes 0.000 abstract 1
- 238000012986 modification Methods 0.000 description 18
- 230000004048 modification Effects 0.000 description 18
- 239000003153 chemical reaction reagent Substances 0.000 description 9
- 239000011534 wash buffer Substances 0.000 description 9
- IGAZHQIYONOHQN-UHFFFAOYSA-N Alexa Fluor 555 Chemical compound C=12C=CC(=N)C(S(O)(=O)=O)=C2OC2=C(S(O)(=O)=O)C(N)=CC=C2C=1C1=CC=C(C(O)=O)C=C1C(O)=O IGAZHQIYONOHQN-UHFFFAOYSA-N 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000010276 construction Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- 238000012165 high-throughput sequencing Methods 0.000 description 4
- 238000002347 injection Methods 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 238000005086 pumping Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 239000012114 Alexa Fluor 647 Substances 0.000 description 3
- 102000012410 DNA Ligases Human genes 0.000 description 3
- 108010061982 DNA Ligases Proteins 0.000 description 3
- 101150118346 HLA-A gene Proteins 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 210000003811 finger Anatomy 0.000 description 3
- 239000007850 fluorescent dye Substances 0.000 description 3
- 238000001215 fluorescent labelling Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000002174 soft lithography Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 230000006820 DNA synthesis Effects 0.000 description 2
- 108700039887 Essential Genes Proteins 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 210000003813 thumb Anatomy 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 229930002877 anthocyanin Natural products 0.000 description 1
- 235000010208 anthocyanin Nutrition 0.000 description 1
- 239000004410 anthocyanin Substances 0.000 description 1
- 150000004636 anthocyanins Chemical class 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000000695 excitation spectrum Methods 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000009878 intermolecular interaction Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000007885 magnetic separation Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 229920001343 polytetrafluoroethylene Polymers 0.000 description 1
- 239000004810 polytetrafluoroethylene Substances 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000000163 radioactive labelling Methods 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
- C12Q1/6818—Hybridisation assays characterised by the detection means involving interaction of two or more labels, e.g. resonant energy transfer
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种核苷非标记FRET的核酸测序方法,该方法包括将FRET供体和受体荧光基团标记在DNA聚合酶或接头上,待测核酸分子固定之后与DNA聚合酶孵育结合,继续循环依次投入四种测序反应体系参与待测核酸互补链的合成,通过碱基合成时供体‑受体分子对之间空间距离变化带来FRET信号改变确定合成进行,并与投入的dNTP种类结合,得出该次反应对应碱基类型,通过多次反应得到的碱基类型的排列确定核酸序列的组成。本发明方法对样品的核酸浓度和总量要求低,适合于实验室快速检测,dNTP非标记的策略会带来更高的测序准确率,可以测量单分子水平、单克隆分子簇和单分子多拷贝等多种情形下的FRET信号。
Description
技术领域
本发明涉及高通量测序方法,具体涉及一种核苷非标记FRET的核酸测序方法。
背景技术
FRET(荧光共振能量转移)是相距较近(1-10nm)的两个荧光分子之间产生的一种能量转移现象。供体荧光基团的发射光谱与受体荧光基团的激发光谱在一定程度上重叠,供体的激发能量能诱导受体发出荧光,FRET效率和供、受体距离的6次方成反比,因而极为灵敏。在生物学研究中常常被用于鉴定蛋白和核酸分子内部构象变化以及分子之间的相互作用,尤其是利用FRET效率和空间距离成反比的特点研究核酸链合成的过程。
然而诸多研究集中在已知核酸链的结构和分子间相互作用。FRET高灵敏的特性可以对核酸测序,即对于未知链的序列检测起到促进作用。现阶段的高通量测序技术以Illumina的二代测序为代表,普遍采用荧光标记的dNTP参与碱基合成。然而这些修饰荧光基团的dNTP在参与碱基合成容易产生错配,导致测序错误。同时,现有测序平台仪器昂贵且复杂的多色荧光系统操作复杂,对于需要快速进行目标测序获取相关信息从而引导后续研究的问题,现有的测序方法并不能提供这一便利,送往测序公司的测序样品的测序数据返回时间一般在10天以上。此外,这些测序方法通常对建库后的核酸浓度和核酸总量有较高的要求,而这些条件对于一些特殊的样品和实验可能很难达到,建库后的PCR操作又会带来扩增错误。
发明内容
发明目的:针对现有技术存在的问题,本发明提供了一种核苷非标记FRET的核酸测序方法,该方法是基于荧光共振能量转移的核酸测序方法主要解决目前在dNTP上进行放射性或荧光标记的操作导致碱基合成的错误率高的问题,本发明的测序方法可以测量单分子水平、单克隆分子簇和单分子多拷贝等多种情形下的FRET信号,实现核酸的高通量快速、准确测序。
技术方案:为了实现上述目的,本发明提供一种核苷非标记FRET的核酸测序方法,该方法包括将FRET供体和受体荧光基团修饰在DNA聚合酶或接头上,待测核酸分子固定位置之后与荧光基团修饰的DNA聚合酶孵育结合,继续循环依次投入四种测序反应体系参与待测核酸互补链的合成,所述四种测序反应体系分别由不带有荧光标记的dATP、dTTP、dCTP和dGTP构成,通过碱基合成时供体-受体分子对之间空间距离变化带来FRET信号改变确定合成进行,并与投入的dNTP种类结合,得出该次反应对应碱基类型,通过多次反应得到的碱基类型的排列确定核酸序列的组成。
其中,所述供体和受体荧光基团既可以一个修饰在接头上,另一个修饰在DNA聚合酶上,也可以同时修饰在DNA聚合酶上。第一种修饰情况下供体和受体其中之一均可以修饰在接头序列或者酶上。
其中,所述DNA聚合酶是野生型或经过改造的突变型的DNA聚合酶家族成员,包括Taq DNA聚合酶、phi29 DNA聚合酶、PfuUltra高保真DNA聚合酶。
其中,所述待测核酸的固定为为将待测核酸修饰在测序芯片表面或者修饰在散布在溶液中的测序材料上。
本发明中因为利用光学的方法测供受体的荧光,供受体要保证不能肉眼可见的幅动,同时需要用注射器通反应试剂或者washbuffer,所以需要固定DNA合成的空间位置。
作为优选,所述测序芯片是由刚性材料制备而成,所述刚性材料包括玻璃、聚甲基丙烯酸甲酯、聚酰胺、环烯烃类共聚物或者聚二甲基硅氧烷;所述溶液中的测序材料为磁珠或者微球。如MagVigen磁珠以生物素-链霉亲和素结合作为捕获原理,Dynabeads磁珠以磁分离捕获待测核酸。
其中,所述待测核酸固定的方式包括核酸和核酸间共价结合(如通过接头和固定待测核酸)、蛋白和核酸间的共价结合或者生物素-链霉亲和素和核酸间的非共价结合作用。
其中,所述待测核酸固定后核酸分子之间的中位距离在0.1μm-1mm范围内。本发明中微孔芯片制备时,微孔的大小和排列,即代表待测核酸分子之间的距离,这个距离范围主要受限于可见光的半波长和高通量的要求,即不能太低也不能过高。
作为优选,每次投入反应体系(dNTP)之前用缓冲液洗去或化学降解上一步投入但未反应的dNTP。
进一步地,所述测序方法可以测量单分子水平上供-受体间的FRET信号,也可以测量单克隆分子簇和单分子多拷贝的FRET信号。
其中,所述通过多次反应得到的碱基类型的排列确定核酸序列的组成,其中多次反应对应碱基位置间可以是连续的,也可以是不连续的。本发明中即使是重复序列如CCCCCCCCCC也可以进行测序。
本发明的测序方法为边合成边测序,在应用荧光共振能量转移进行测序的基础上采用核苷非标记策略,通过碱基合成时供体-受体分子对之间空间距离变化带来FRET信号改变确定合成进行与否,表现在FRET的改变和恒定,反映碱基合成和不合成。
本发明方法首次通过结合FRET和高通量测序,以FRET的高灵敏度和dNTP非标记的特点提高测序的准确度,放松对建库后核酸浓度和总量的要求,能够快速对样品进行测序分析。这种方法的特点是将FRET供体和受体荧光基团标记在DNA聚合酶或接头序列上,不带有荧光标记的dNTP,包含dATP、dTTP、dCTP、dGTP其中之一,按照一定周期顺序依次投入参与模板分子互补链的合成,通过合成时供体-受体分子对之间的FRET信号变化判断合成是否进行,在其进行时与当时投入反应物的种类结合,推定该次反应对应碱基类型,通过多次反应得到的碱基类型的排列确定核酸序列的组成。
捕获待测分子时,可设计已知序列(通过碱基互补配对来固定待测核酸分子)作为接头起到固定待测分子的作用,保证在流体注入的过程中模板不会被洗去。除此之外,也可以利用生物素-链霉亲和素等非共价结合也可以用于捕获待测分子,达到核酸-核酸之间共价结合相同甚至更强的固定作用。待测分子既可以修饰在芯片表面,芯片由一定刚性的材料制备而成,包括玻璃、PMMA(聚甲基丙烯酸甲酯)、聚酰胺(PA)、环烯烃类共聚物(COC)和PDMS(聚二甲基硅氧烷),既保证一定的刚性,也适应光学仪器;也可以修饰在散布在溶液中的材料上,包括磁珠和微球等。
供-受体的选择除了光谱的重叠之外,还应注重二者有足够的荧光持续时间,以便在测序中获得更长的reads,如花青素、Atto和Alexa系列是最常用的荧光团,并且已经普遍商用。供-受体分子对的修饰模式有两种:一种是接头的5′端修饰一个荧光基团(供体或受体),另一个荧光基团(受体或供体)修饰在DNA聚合酶上。当投入的某种dNTP参与碱基合成时,DNA聚合酶会往3′方向移动一个碱基的距离,从而FRET值下降;另一种是将供-受体分子对修饰在DNA聚合酶的不同位置上,当投入的某种dNTP参与碱基合成时,DNA聚合酶本身的构象变化(闭合和打开)也会使处于不同位置上的供-受体的空间距离发生变化,FRET值也会呈现规律性的改变,实际上闭合-打开的过程虽然是周期性的,但是在DNA聚合酶上标记的位置不同会导致可能碱基合成时,供-受体距离靠近也可能相离,不过不管是靠近还是相离,这种变化单一的出现一种,并且随着合成过程是连续的。
目前的技术下第一种修饰方式的读长(~20bp)主要受限于随着供-受体空间距离的增大,FRET效率显著下降。而第二种修饰方式下序列的合成不会增大供-受体分子对的空间距离,此时的读长仅仅受限于硬件响应情况和分子对荧光持续时间,因此第二种修饰模式会带来更长的读长。本发明第二种修饰方式因为供-受体都标记在酶上,在实验中可以看到第二种修饰方式能够测200bp以上的序列甚至更长,并且随着供-受体的发展和显微镜的发展,第二种方式测序可以更长,效果更好。本发明的两种标记方式都避免了在dNTP上进行荧光标记的操作,dNTP非标记可以减小碱基合成时的错配率,提高测序数据的可靠性。
所述测序方法可以在单分子水平上测量供-受体间的FRET信号,也可以经过实验的方法得到单克隆分子簇和单分子多拷贝,放大供-受体间的FRET信号,有利于测序的准确性和更长读长的获取。在测序过程中,配制含单种dNTP的反应试剂,按照dATP、dTTP、dCTP、dGTP的顺序,循环注入测序芯片当中,在新的反应体系投入之前需要用缓冲液洗去或化学降解上一步投入但未反应的dNTP。并且无论哪一种dNTP参与碱基的合成,DNA聚合酶的移动方向、移动距离和自身构象变化都是相似的,从而FRET信号的变化趋势和变化数值都近似,呈现规律性变化。
即使待测序列中含有重复序列,该测序方法依旧适用。第一种分子对修饰模式下,当投入的某种dNTP连续参与几个相同碱基合成时,DNA聚合酶会往3′方向连续移动数个碱基的距离,相应的FRET值就会连续下降,其下降的数值与单个碱基合成的下降数值成正比。对于第二种修饰模式,dNTP连续参与碱基合成会导致DNA聚合酶构象会发生连续的周期性变化,其上的供-受体分子对的空间距离也会发生连续的周期性变化,FRET值也会呈现规律性的改变,由信号改变次数可以推断合成了几位碱基。
本测序方法所用DNA聚合酶可以是野生型和经过改造的突变型,包括Taq DNA聚合酶、phi29 DNA聚合酶、PfuUltra高保真DNA聚合酶等。由于该测序方法基于FRET的原理,因此可以搭配涉及碱基合成和连接的反应方法,兼容性强。
本发明将FRET用于测序上提出了一种新的测序原理,效果十分显著,同时本发明使用核苷非标记的方式(目前商业的测序大多数都是核苷标记),将供-受体修饰在DNA聚合酶或接头序列上,不在dNTP上标记然后参与DNA合成,错误率低。
有益效果:与现有技术相比,本发明具有如下优点:
本发明结合了FRET的原理提供了一种核苷非标记的高准确率的高通量测序方法。较于成熟的测序方法,该发明避免在dNTP上进行荧光标记,能够提高测序的准确率。容易搭配成熟的显微镜平台,在实验室即时完成目标测序,省去送于公司测序的时间。同时,该方法基于FRET的高灵敏性,可在单分子水平实现信号的测量,因此该方法对建库和纯化后的核酸浓度和总量要求较低,避免为满足商业测序要求进行不必要的PCR从而引入错误,这能满足一些稀有样品的低深度测序。该方法随着供-受体分子对的发展,包括荧光持续时间、FRET现象的极限距离等,具有成长性。本发明方法既可以测量单分子水平上供-受体间的FRET信号,也可以测量单克隆分子簇和单分子多拷贝的FRET信号,适合于实验室中的快速检测,可兼容参与碱基合成和连接的各种酶,通用性强。
附图说明
图1为实施例1中测序平台的搭建以及样品投入的过程;
图2为实施例2中第一种修饰模式下的测序示意图和隐马尔可夫模型提取FRET的部分特征信号;
图3为实施例3中第二种修饰模式下的测序示意图和隐马尔可夫模型提取FRET的部分特征信号。
具体实施方式
根据下述实施例,可以更好地理解本发明。然而,本领域的技术人员容易理解,实施例所描述的内容仅用于说明本发明,而不应当也不会限制权利要求书中所详细描述的本发明。
实施例1
微孔阵列的制备和应用:通过软光刻法制备含无数微孔(2μm×2μm×2μm)的PDMS(聚二甲基硅氧烷)芯片,每一张芯片上超过50万个微孔,并且在芯片表面上化学修饰已知序列作为接头捕获待测核酸分子(已知序列6-8个碱基和后来建库的接头互补即可),已知序列也作为互补链合成的引物。供体(Alexa Fluor 647)和受体(Alexa Fluor 555)荧光基团既可以一个修饰在已知序列的5′端,另一个修饰在DNA聚合酶上,也可以同时修饰在DNA聚合酶上。根据芯片表面的已知序列和PCR操作加上的A尾设计核酸序列,通过DNA连接酶在待测的未知核酸分子上完成连接,以使建库后的核酸片段能与芯片表面固定序列互补,之后经过磁珠筛选目标大小的待测核酸片段,原理上待测片段长度控制在500bp以下,以防从芯片表面上脱落,可以通过超声、酶学方法达到这一要求。完成建库的待测核酸用Qubit定量浓度,由泊松分布公式(如下)计算每一微孔至多包含单一分子的核酸浓度。
在本例中,公式中λ为平均一个孔中核酸分子的个数,k的取值为0,1,2…,P(X=k)表示一个孔中含k个核酸分子的概率。取λ为0.1时,约90%的空孔,9%的单分子捕获率,从而保证每一微孔至多包含单一分子。经过稀释后的待测核酸分子载入连接聚四氟乙烯管的注射器中由注射泵缓慢注入芯片,使核酸分子逐渐被固定在微孔中。被固定在微孔中的单分子经过PCR过程扩增成单克隆分子簇,可显著增强供-受体间FRET信号。核酸分子被固定在微孔中之后,被荧光标记的DNA聚合酶注入芯片中60℃孵育2min,促进与待测核酸分子的结合。如图1所示,制备的PDMS芯片置于全内反射显微镜的载物台上,注入芯片的反应体系由注射器装载,样品从图1上的入口注入,出口处接连废液缸,其反应体系和用于清洗的Wash Buffer配制如下。图1中仅采用碱基互补配对的共价结合作用固定合成的空间位置,还可以利用生物素-链霉亲和素的非共价结合作用。激光发生器产生激光使供体持续发出荧光,因为供-受体光谱的重叠致使出现FRET现象。
配制含单种dNTP的四种反应体系,包括dATP、dTTP、dCTP和dGTP,分别载入4支1mL注射器中,利用注射泵精确控制流体流动。测序平台搭建完成之后可以开始测序的操作,按照dATP、dTTP、dCTP、dGTP的顺序依次循环将反应体系注入芯片中,注入的每种反应体系的体积以超过2倍芯片总容量为宜,注入后完全浸润微孔后72℃延伸3s再注入下一种体系,注入每种反应试剂之前以至少5倍芯片总容量的Wash Buffer彻底洗去之前投入但未反应的dNTP。当某种dNTP参与碱基合成时,DNA聚合酶往3′端移动一个碱基的距离(~0.3nm)或经历自身构象的改变,从而实现供-受体距离带动FRET效率变化。之后的实验数据利用隐马尔可夫模型提取FRET的特征信号,获得测序reads,即可推断原核酸链的序列组成。
本例中介绍了在核苷非标记的通用测序平台的搭建,反应试剂和用于清洗的WashBuffer的配制。接着利用精密注射泵泵入反应试剂和Wash Buffer从而更好控制流体流速,以防手动推入的流速过快使芯片炸裂,并且能够精确控制泵入流体的总体积。
实施例2
在实施例1的测序平台基础上,通过软光刻法制备含2μm×2μm×2μm微孔的PDMS(聚二甲基硅氧烷)芯片,每一张芯片上超过50万个微孔,并且在芯片表面上化学修饰已知序列(TCGCCTAT)作为接头捕获待测核酸分子,每个微孔都修饰无数的已知序列,将AlexaFluor 647修饰在已知序列的5′端。使用GM12878的基因组DNA扩增HLA-A基因片段(172bp,NCBI Homo sapiens Gene ID:3105),50μL体系:Premix Ex Taq HS 25μL,DNA 50ng,正反向引物各0.4μM(正向引物:5′-GGATTACATCGCCCTGAAC-3′;反向引物:5′-CGTCTCCTTCCCGTTCTC-3-3′),不足50μL的用无酶水补齐。扩增程序为:95℃ 5min;(95℃30s,60℃ 20s,72℃ 30s)30个循环;72℃ 5min;4℃保存。PCR产物根据芯片表面的已知序列和Ex Taq DNA聚合酶上的A尾设计核酸序列(5′-TCGCCTAT-3′),通过DNA连接酶实现连接,以使待测核酸片段能与芯片表面固定序列互补,之后经过磁珠筛选目标大小的待测核酸片段。在λ取0.1的情况下,经过稀释的待测核酸分子在9%的微孔中固定单个分子,由于微孔中修饰无数的已知序列,因此可通过PCR将固定的单分子扩增成单克隆分子簇。随后并经过PCR扩增成单克隆分子簇。将Alexa Fluor 555修饰在Ex Taq DNA聚合酶上,即第一种修饰方式,并且在固定待测序列之后注入芯片中60℃孵育2min,使与待测核酸分子结合。
反应试剂和Wash Buffer由实施例1中配方配置并装载进注射器中。用注射泵按照dATP、dTTP、dCTP、dGTP的顺序泵入一种反应试剂,泵入的体积可由注射泵控制,并且以超过2倍芯片总容量为宜,完全浸润微孔后72℃延伸3s,循环泵入直到测序完成。需要注意在每次投入反应试剂之前必须以至少5倍芯片总容量的Wash Buffer彻底洗去之前投入但未反应的dNTP。利用全内反射显微镜平台中的激光发生器产生激发光并用软件记录发射光的强度,此时需要同时记录供-受体两者的发射光强度,从而能够计算FRET效率,全内反射显微镜在这方面表现优于共聚焦显微镜。图2给出了第一种修饰方式下的测序原理图,根据记录的供-受体发射光强度数据通过如下公式计算FRET效率。
公式中E代表FRET效率,Facceptor和Fdonor表示记录到的受体和供体的发射光强度。经过归一化后可以绘制如图中所示的FRET随时间变化的曲线图,使用隐马尔可夫模型提取FRET的特征信号。由图2中曲线图反映的FRET值的变化结合变化时投入的dNTP种类(ACTGTC)可以推出对应的待测核酸序列为5′-GACAGT-3′,直到FRET信号不在变化时测序完成。将测序数据与NCBI上人类基因组中HLA-A基因序列相比对,该种修饰模式下能够精确测得约20bp片段。
本例中在实施例1的基础上,采用第一种供-受体分子对修饰方式,即供-受体分别标记在接头的5′端和DNA聚合酶上。并且使用看家基因的PCR产物作为实施例的测序模板,在以上的测序步骤下能够准确的测得序列组成,此例中因为FRET距离的限制所能准确测得的片段大小~20bp。
实施例3
在实施例1的测序平台基础上,通过软光刻法制备含无数微孔的PDMS(聚二甲基硅氧烷)芯片,每个微孔直径为1μm,深度为2μm,每一张芯片上包含上百万个微孔,并且在芯片表面上化学修饰已知序列(TCGCCTAT)作为接头捕获待测核酸分子,每个微孔都修饰无数的已知序列,已知序列也作为互补链合成的引物。使用GM12878的基因组DNA扩增HLA-A基因片段(172bp),50μL体系:Premix Ex Taq HS 25μL,DNA 50ng,正反向引物各0.4μM(正向引物:5′-GGATTACATCGCCCTGAAC-3′;反向引物:5′-CGTCTCCTTCCCGTTCTC-3-3′),不足50μL的用无酶水补齐。扩增程序为:95℃5min;(95℃30s,60℃20s,72℃30s)30个循环;72℃5min;4℃保存。PCR产物根据芯片表面的已知序列和Ex Taq DNA聚合酶的A尾设计核酸序列(5′-TCGCCTAT-3′),通过DNA连接酶实现连接,以使待测核酸片段能与芯片表面固定序列互补。之后经过磁珠筛选目标大小的待测核酸片段。在λ取0.1的情况下,完成建库的待测核酸在9%的微孔中固定单个分子,此例从单分子水平测量FRET信号。将供体(Alexa Fluor 647)和受体(Alexa Fluor 555)荧光基团分别修饰在Ex Taq DNA聚合酶的thumb(手掌)和finger(手指)结构域上,即第二种修饰模式,并且在固定待测序列之后注入芯片中60℃孵育2min,使与待测核酸分子结合。
反应试剂和Wash Buffer由实施例1中配方配置并装载进注射器中。接着用注射泵按照dATP、dTTP、dCTP、dGTP的顺序泵入一种反应试剂,泵入的体积可由注射泵控制,并且以超过2倍芯片总容量为宜,完全浸润微孔后72℃延伸3s,循环泵入直到测序完成。需要注意在投入之前必须以至少5倍芯片总容量的Wash Buffer彻底洗去之前投入但未反应的dNTP。利用全内反射显微镜平台中的激光发生器产生激发光并用软件记录发射光的强度,此时需要同时记录供-受体两者的发射光强度,从而能够计算FRET效率,全内反射显微镜在这方面表现优于共聚焦显微镜。图3给出了第二种修饰方式下的测序原理图,根据记录的供-受体发射光强度数据通过如下公式计算FRET效率。
公式中E代表FRET效率,Facceptor和Fdonor表示记录到的受体和供体的发射光强度。经过归一化后可以绘制如图中所示的FRET随时间变化的曲线图,使用隐马尔可夫模型提取FRET的特征信号。由图3中曲线图反映的FRET值的变化结合变化时投入的dNTP种类(ACTGTC)可以推出对应的待测核酸序列为5′-GACAGT-3′。直到FRET信号不再变化时测序完成,此种修饰方法能够精确HAL-A序列,由NCBI上的参考序列比对得出此例中的测序准确率为99.99%以上。
本例中,采用第二种供-受体分子对修饰方式,即供-受体分别标记在DNA聚合酶的thumb(手掌)和finger(手指)结构域上。同样使用看家基因的PCR产物作为实施例的测序模板,在以上的测序步骤下能够准确的测得序列组成。此例中由于分子对标记在酶的不同位置上,当碱基合成时,DNA聚合酶自身构象发生规律性的周期变化,这会导致处于不同位置上的供-受体的空间距离发生改变,相应地FRET值也会呈现规律性的下降和回弹。此例中序列的合成不会增大供-受体分子对的空间距离,此时的读长在200bp以上,仅仅受限于硬件响应情况和分子对荧光持续时间。
本发明的实施例2中为单克隆分子簇的应用,实施例3为单分子水平的应用。单分子多拷贝类似于单克隆分子簇,所以本发明能够在单分子水平进行测量表明灵敏度高,主要益于FRET性质;而经过扩增的单克隆分子簇和单分子多拷贝则是增强目标信号,同时实施例2和3中均为通过泊松分布来分配单分子,这使得实验要求低,核酸浓度和总量要求较低,以防不必要的PCR进一步引入错误。
Claims (10)
1.一种核苷非标记FRET的核酸测序方法,其特征在于,该方法包括将FRET供体和受体荧光基团修饰在DNA聚合酶或接头上,待测核酸分子固定之后与DNA聚合酶孵育结合,继续循环依次投入四种测序反应体系参与待测核酸互补链的合成,所述四种测序反应体系分别由不带有荧光标记的dATP、dTTP、dCTP和dGTP构成,通过碱基合成时供体-受体分子对之间空间距离变化带来FRET信号改变确定合成进行,并与投入的dNTP种类结合,得出该次反应对应碱基类型,通过多次反应得到的碱基类型的排列确定核酸序列的组成。
2.根据权利要求1所述的核苷非标记FRET的核酸测序方法,其特征在于,所述供体和受体荧光基团既可以一个修饰在接头上,另一个修饰在DNA聚合酶上,也可以同时修饰在DNA聚合酶上。
3.根据权利要求1或者2所述的核苷非标记FRET的核酸测序方法,其特征在于,所述DNA聚合酶是野生型或经过改造的突变型的DNA聚合酶家族成员,包括Taq DNA聚合酶、phi29DNA聚合酶或者PfuUltra高保真DNA聚合酶。
4.根据权利要求1所述的核苷非标记FRET的核酸测序方法,其特征在于,所述待测核酸分子固定为将待测核酸修饰在测序芯片表面或者修饰在散布在溶液中的测序材料上。
5.根据权利要求4所述的核苷非标记FRET的核酸测序方法,其特征在于,所述测序芯片是由刚性材料制备而成,所述刚性材料优选包括玻璃、聚甲基丙烯酸甲酯、聚酰胺、环烯烃类共聚物或者聚二甲基硅氧烷;所述溶液中的测序材料为磁珠或者微球。
6.根据权利要求1所述的核苷非标记FRET的核酸测序方法,其特征在于,所述待测核酸分子固定的方式包括核酸和核酸间共价结合、蛋白和核酸间的共价结合或者生物素-链霉亲和素和核酸间的非共价结合作用。
7.根据权利要求6所述的核苷非标记FRET的核酸测序方法,其特征在于,所述待测核酸分子固定后核酸分子之间的中位距离在0.1μm-1mm范围内。
8.根据权利要求1所述的核苷非标记FRET的核酸测序方法,其特征在于,每次投入反应体系之前用缓冲液洗去或化学降解上一步投入但未反应的反应体系dNTP。
9.根据权利要求1所述的核苷非标记FRET的核酸测序方法,其特征在于,所述测序方法可以测量单分子水平上供-受体间的FRET信号,也可以测量单克隆分子簇和单分子多拷贝的FRET信号。
10.根据权利要求1所述的核苷非标记FRET的核酸测序方法,其特征在于,所述通过多次反应得到的碱基类型的排列确定核酸序列的组成,其中多次反应对应碱基位置间可以是连续的,也可以是不连续的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110544290.6A CN113151427A (zh) | 2021-05-19 | 2021-05-19 | 一种核苷非标记fret的核酸测序方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110544290.6A CN113151427A (zh) | 2021-05-19 | 2021-05-19 | 一种核苷非标记fret的核酸测序方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113151427A true CN113151427A (zh) | 2021-07-23 |
Family
ID=76876589
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110544290.6A Pending CN113151427A (zh) | 2021-05-19 | 2021-05-19 | 一种核苷非标记fret的核酸测序方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113151427A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101878312A (zh) * | 2007-10-30 | 2010-11-03 | 埃西斯创新有限公司 | 基于聚合酶的单分子测序 |
CN102317471A (zh) * | 2008-12-11 | 2012-01-11 | 加利福尼亚大学董事会 | 用于单个dna分子的直接测序的方法和系统 |
CN109562376A (zh) * | 2016-04-04 | 2019-04-02 | 纽约哥伦比亚大学董事会 | 一种基于荧光能量转移的单分子/集群dna合成测序 |
CN112218640A (zh) * | 2018-03-15 | 2021-01-12 | 哥伦比亚大学董事会 | 核苷酸类似物及其在核酸测序和分析中的用途 |
-
2021
- 2021-05-19 CN CN202110544290.6A patent/CN113151427A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101878312A (zh) * | 2007-10-30 | 2010-11-03 | 埃西斯创新有限公司 | 基于聚合酶的单分子测序 |
CN102317471A (zh) * | 2008-12-11 | 2012-01-11 | 加利福尼亚大学董事会 | 用于单个dna分子的直接测序的方法和系统 |
CN109562376A (zh) * | 2016-04-04 | 2019-04-02 | 纽约哥伦比亚大学董事会 | 一种基于荧光能量转移的单分子/集群dna合成测序 |
CN112218640A (zh) * | 2018-03-15 | 2021-01-12 | 哥伦比亚大学董事会 | 核苷酸类似物及其在核酸测序和分析中的用途 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240003892A1 (en) | Heterogeneous single cell profiling using molecular barcoding | |
WO2021116715A1 (en) | Spatial barcoding | |
EP3037553B1 (en) | Bioassay system including optical detection apparatuses, and method for detecting biomolecules | |
CN100396790C (zh) | 溶液识别、表面寻址蛋白质芯片及其制备和检测方法 | |
JP2010532485A (ja) | ナノfetを含む電子検出のためのシステムおよび方法 | |
US20240043925A1 (en) | Compositions and methods of making gene expression libraries | |
CN1932033A (zh) | 基于微阵列芯片的核酸测序方法 | |
JP6510978B2 (ja) | 核酸を配列決定する方法および装置 | |
CN115176028A (zh) | 用于检测多种分析物的系统和方法 | |
JP2023515110A (ja) | 人工知能ベースのベースコーラの知識蒸留及び勾配プルーニングに基づく圧縮 | |
JP2005515468A (ja) | 微分子の分析物のバイオセンサ | |
US20240060954A1 (en) | Obtaining information from a biological sample in a flow cell | |
CN113564238A (zh) | 从多个引物测序以增加数据速率和密度 | |
US20210147833A1 (en) | Systems and methods for information storage and retrieval using flow cells | |
US20220010370A1 (en) | Method for sequencing polynucleotides | |
CN113151427A (zh) | 一种核苷非标记fret的核酸测序方法 | |
CN116445594A (zh) | 适用于原位检测连续多个核苷酸位点的测序方法及其应用 | |
CN113308524A (zh) | 一种基于荧光共振能量转移的核酸高通量测序方法 | |
TW202120693A (zh) | 偵測核苷酸之聚合酶併入的方法 | |
WO2011108344A1 (ja) | 基板上に固定化された複数の核酸検体の識別方法及び装置 | |
RU2816708C2 (ru) | Способы и композиции для определения лигандов на матрицах с использованием индексов и штрихкодов | |
KR20240027599A (ko) | 올리고 서열을 사용하여 훈련된 자체-학습 염기 호출자 | |
WO2023175018A1 (en) | Concurrent sequencing of forward and reverse complement strands on separate polynucleotides | |
CN1428606A (zh) | 一种新型抗原检测方法及利用该方法制成的检测装置 | |
JP2012191876A (ja) | ポリヌクレオチドシーケンス法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |