CN112322715B - 一种核酸测序方法 - Google Patents

一种核酸测序方法 Download PDF

Info

Publication number
CN112322715B
CN112322715B CN202011289898.0A CN202011289898A CN112322715B CN 112322715 B CN112322715 B CN 112322715B CN 202011289898 A CN202011289898 A CN 202011289898A CN 112322715 B CN112322715 B CN 112322715B
Authority
CN
China
Prior art keywords
leu
glu
polymerase
ala
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011289898.0A
Other languages
English (en)
Other versions
CN112322715A (zh
Inventor
白净卫
杜娟娟
徐扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202011289898.0A priority Critical patent/CN112322715B/zh
Publication of CN112322715A publication Critical patent/CN112322715A/zh
Priority to PCT/CN2021/129461 priority patent/WO2022105640A1/zh
Application granted granted Critical
Publication of CN112322715B publication Critical patent/CN112322715B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07007DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种核酸测序方法,包括提供有聚合酶,所述聚合酶通过可断裂基团与dNTP连接,并且,所述的聚合酶可发出光信号;使所述聚合酶与待测核酸模板‑引物复合体的引物3'端接触,所述聚合酶上的dNTP与待测核酸序列上的碱基互补配对并在聚合酶酶促反应加入引物3'端;检测所述聚合酶发出的光信号。随后dNTP与聚合酶断裂,聚合酶离开后新的模板‑引物复合体可以进入下一个测序循环。本发明所述的核酸测序方法可以实现对核酸序列快速的测定。

Description

一种核酸测序方法
技术领域
本发明属于生物技术领域,涉及一种核酸序列的测定方法。
背景技术
DNA(脱氧核糖核酸)是组成生物体的遗传物质,由不同排列顺序的A、T、C、G组成,这些由不同顺序的A、T、C、G组成的遗传物质蕴含着丰富的遗传信息以及生命内涵。通过核酸测序技术可以获取不同遗传物质的核酸序列,帮助人们了解个体遗传物质之间的差异,这对生命科学研究、疾病诊断、个性化用药等均具有十分重要的意义。
第一代测序技术以Sanger发明的双脱氧链末端终止法为代表,该方法成本高,速度慢,通量低等不足,不能满足研究及应用的需求。第二代测序技术中Illumina公司的Solexa测序技术成本相对较低,所以被广泛的应用,但是该技术从开始建库到完成测序需要6天的时间,耗时较长。第三代测序技术中Pacific Bioscience公司的SMRT是唯一商业化应用的技术,SMRT技术实现了单分子测序,具有不需要扩增,读长长等优势,虽然该技术相对于Solexa测序技术从建库到完成测序时间短了一些,但是仍需约两天时间才能完成。
专利US5302509描述了一种对多核苷酸模板测序的方法,该方法包括使用DNA聚合酶或DNA连接酶连续掺入与模板链互补的经标记核苷酸或多核苷酸而实施的多延伸反应。在这种“合成测序(sequencing by synthesis)”反应中,通过连续掺入与模板链互补的单个核苷酸以5'到3'的方向构建了一条与模板链碱基配对的新核苷酸链。将测序反应使用的核苷三磷酸底物封闭以防止过度掺入,差异标记核苷三磷酸底物以使得能够确定作为后续核苷酸被加入的掺入核苷酸的种类。
专利CN106244712A公开了一种DNA测序方法,包括如下步骤:(1)在待测DNA的3'末端增加标签序列,形成含有标签序列的待测DNA;所述标签序列的核苷酸序列与测序引物的核苷酸序列反向互补;(2)将所述含有标签序列的待测DNA和所述测序引物混合,形成5'末端双链主体单链形式的产物;(3)完成步骤(2)后,将产物分别与dATP、dCTP、dTTP和dGTP混合,得到四个体系,分别将每个体系加入特异DNA聚合酶修饰的单分子器件,读取电信号。实验证明,采用本发明提供的方法可进行DNA测序,具有重要的应用价值。Illumina的测序技术的核心的合成酶链伸反应(Sequencing by synthesis)是一个三个底物的反应,主要包括模板-引物杂交体、dNTP、DNA合成酶,反应动力学是二级反应;本发明提供的方法以dNTP-DNA合成酶和可逆连接复合物为反应底物,与模板-引物杂交体反应,反应动力学是一级反应,因此比Illumina的SBS技术速度更快。此外,Illumina的SBS荧光分子连接在dNTP的碱基上,通常只有一个荧光分子,因此光学信号强度有限;本发明提供的方法在合成酶上连接荧光分子,可以提供更多的连接位点,连接一个以上的荧光集团,因此可以提高光学信号强度。
WO2007076057A2提供了含有具有改善核苷酸类似物进入活性位点区和在活性位点区与核苷酸类似物协调作用的特征的聚合酶的组合物。也提供了制备这种聚合酶和将这种聚合酶用于测序以及DNA复制和扩增的方法,以及聚合酶活性的动力学模型和使用此模型的计算机实现方法。
Sebastian Palluk等(Nature Biotechnology,2018(36):645-650)公开了一种寡核苷酸的合成方法,该寡核苷酸的合成方法是利用末端脱氧核苷酸转移酶(TdT)进行核苷酸的合成。合成的原理是TdT分子可以与单个脱氧核糖核苷三磷酸(dNTP)分子形成连接复合物,引物与形成酶连接体系的dNTP结合后,引物的3'末端与TdT共价结合,形成的新的体系对其它的TdT-dNTP有排斥作用,切断TdT与dNTP之间的连接释放引物并允许随后的延伸,这样就在单链DNA 3'末端上可逆终止的延伸了一个dNTP。但此方法只是应用单链核酸的延伸反应即DNA合成,不涉及鉴定模板DNA的序列,也不涉及给核酸合成酶连接荧光分子或者其他发光基团。
Fei Chen等(Genomics Proteomics Bioinformatics,2013(11):34-40)对可逆终止子的分类及可逆终止子在基因测序技术中应用的发展历史及工作机制做了介绍。
针对于现有技术的不足,本发明提供一种能够快速测定核酸序列的方法。
发明内容
本发明第一方面提供一种测定核酸序列的方法,所述的测序方法包括如下步骤:
(1)提供聚合酶(polymerase),所述的聚合酶通过可断裂基团(linker)与dNTP连接,并且,所述的聚合酶可发出光信号;
(2)使所述聚合酶与待测核酸模板-引物复合体的引物3'端接触,所述聚合酶上的dNTP与待测核酸的序列上的碱基互补配对并在聚合酶酶促反应加入引物3'端;
(3)检测所述聚合酶发出的光信号。
其中,酶促反应形成一个碱基的延伸后,所连接的聚合酶阻止了另一个dNTP-聚合酶与新形成的引物3'端的反应,造成了链终止。
本发明所述的待测核酸可以为DNA或RNA,优选的所述的待测核酸序列为DNA,例如基因组DNA、cDNA以及DNA片段。
所述的聚合酶可以为目前已知的DNA聚合酶及其变体,例如,所述的聚合酶选自Bst DNA Pol及其变体、DNA Pol I及其变体、DNA Polγ及其变体、T3 DNA Pol及其变体、T5DNA Pol及其变体、L5 DNA Pol及其变体、DNA Po1 II及其变体、DNA Pol B及其变体、DNAPolα及其变体、DNA Pol△及其变体、DNA Polε及其变体、DNA Pol III及其变体、DNA Polβ及其变体、DNA Polσ及其变体、DNA Polλ及其变体、DNA Polμ及其变体、DNA Pol IV及其变体、DNA Pol V及其变体、末端转移酶及其变体中的一种或者两种以上;其中,所述的末端转移酶为末端脱氧核苷酸转移酶(TdT)。
优选的,所述的聚合酶为DNA Polβ及其变体,所述的DNA Polβ的序列为SEQ IDNO:1。所述的DNA Polβ变体为DNA Polβ在一个或多个(例如,2个、3个、4个或5个)氨基酸序列位置的突变,所述的突变包含取代、缺失和/或插入,或者与DNA Polβ编码序列具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%以上的序列同一性,并且所述的DNA Polβ变体具有聚合酶活性。
优选的,所述的DNA Polβ变体的突变位点是在DNA合成的催化中心附近的区域,又不是催化反应所必须的氨基酸残基位置,可以保证不影响催化活性,又保证dNTP离催化中心比较近,不需要特别长的可断裂基团就可以与催化中心接触参与反应。
更优选的,所述的DNA Polβ的变体是将SEQ ID NO:1第145-355位的任意一个、两个或三个半胱氨酸突变为非半胱氨酸,优选的,是将SEQ ID NO:1第145-355位的任意一个、两个或三个半胱氨酸突变为丝氨酸,并且将第1-236位的任意一个、两个或三个非半胱氨酸突变为半胱氨酸。
更优选的,所述的DNA Polβ的变体是将SEQ ID NO:1第155-294位的任意一个、两个或三个半胱氨酸突变为丝氨酸,并且将第20-154位的任意一个、两个或三个非半胱氨酸突变为半胱氨酸。
更优选的,将所述的DNA Polβ的变体是将SEQ ID NO:1的第178位、第239位和/或第267位的半胱氨酸突变为丝氨酸,并且将第28位、第33位和/或第149位的任意一个、两个或三个非半胱氨酸突变为半胱氨酸。
特别优选的,所述的聚合酶为DNA Polβ的变体,所述的DNA Polβ的变体选自如下变体中的一种或者两种以上的组合:
(1)将SEQ ID NO:1第178位的半胱氨酸突变为丝氨酸,第239位的半胱氨酸突变为丝氨酸,第267位的半胱氨酸突变为丝氨酸,第28位的天冬酰胺突变为半胱氨酸;
(2)将SEQ ID NO:1第178位的半胱氨酸突变为丝氨酸,第239位的半胱氨酸突变为丝氨酸,第267位的半胱氨酸突变为丝氨酸,第33位的异亮氨酸突变为半胱氨酸;
(3)将SEQ ID NO:1第178位的半胱氨酸突变为丝氨酸,第239位的半胱氨酸突变为丝氨酸,第267位的半胱氨酸突变为丝氨酸,第149位的精氨酸突变为半胱氨酸。
在本发明的一个具体实施方式中,所述的聚合酶的氨基酸序列与SEQ ID NO:3-6具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%以上的序列同一性,并且所述的DNA Polβ变体具有聚合酶活性。
在本发明的另一个具体实施方式中,所述的聚合酶的氨基酸序列如SEQ ID NO:3-6任一所示。
优选的,所述的聚合酶为Bst DNA Pol及其变体,所述的Bst DNA Pol的序列为SEQID NO:2。所述的Bst DNA Pol变体为Bst DNA Pol在一个或多个(例如,2个、3个、4个或5个)氨基酸序列位置的突变,所述的突变包含取代、缺失和/或插入,或者与Bst DNA Pol编码序列具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%以上的序列同一性,并且所述的Bst DNA Pol变体具有聚合酶活性。
优选的,所述的Bst DNA Pol变体的突变位点是在DNA合成的催化中心附近的区域,又不是催化反应所必须的氨基酸残基位置,可以保证不影响催化活性,又保证dNTP离催化中心比较近,不需要特别长的可断裂基团就可以与催化中心接触参与反应。
更优选的,所述的Bst DNA Pol的变体是将SEQ ID NO:2第85-100或540-570位的任意一个、两个或三个半胱氨酸突变为非半胱氨酸,优选的,是将SEQ ID NO:2第85-100或540-570位的任意一个、两个或三个半胱氨酸突变为丝氨酸,并且将第250-280或320-380位的任意一个、两个或三个非半胱氨酸突变为半胱氨酸。
优选的,所述的Bst DNA Pol的变体是将SEQ ID NO:2第90-95或549-555位的任意一个、两个或三个半胱氨酸突变为丝氨酸,并且将第260-270或330-370位的任意一个、两个或三个非半胱氨酸突变为半胱氨酸。
更优选的,所述的Bst DNA Pol的变体是将SEQ ID NO:2的第93位和/或第550位的半胱氨酸突变为丝氨酸,并且将第264位、第334位和/或第364位的任意一个、两个或三个非半胱氨酸突变为半胱氨酸。
特别优选的,所述的聚合酶为Bst DNA Pol的变体,所述的Bst DNA Pol的变体选自如下变体中的一种或者两种以上的组合:
(1)将SEQ ID NO:2第93位的半胱氨酸突变为丝氨酸,第550位的半胱氨酸突变为丝氨酸;
(2)将SEQ ID NO:2第93位的半胱氨酸突变为丝氨酸,第550位的半胱氨酸突变为丝氨酸,第264位的天冬氨酸突变为半胱氨酸;
(3)将SEQ ID NO:2第93位的半胱氨酸突变为丝氨酸,第550位的半胱氨酸突变为丝氨酸,第334位的精氨酸突变为半胱氨酸;
(4)将SEQ ID NO:2第93位的半胱氨酸突变为丝氨酸,第550位的半胱氨酸突变为丝氨酸,第364位的亮氨酸突变为半胱氨酸。
在本发明的一个具体实施方式中,所述的聚合酶的氨基酸序列与SEQ ID NO:7-10具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%以上的序列同一性,并且所述的DNA Polβ变体具有聚合酶活性。
在本发明的另一个具体实施方式中,所述的聚合酶的氨基酸序列如SEQ ID NO:7-10任一所示。
所述的通过可断裂基团与聚合酶连接的dNTP选自dATP或修饰的dATP、dGTP或修饰的dGTP、dCTP或修饰的dCTP、dTTP或修饰的dTTP、dUTP或修饰的dUTP中的任意一种。
所述的可断裂基团用于连接聚合酶和修饰的dNTP,或者连接聚合酶和dNTP。优选的,所述的可断裂基团含有可断裂结构X,所述的X选自:
Figure BDA0002783510810000061
其中,j为1-3的整数,
R选自H、C1-10直链或支链烷基、C2-10烯基、C2-10炔基、C3-10环烷基、芳基、含有N、O或S的杂环芳基、含有N、O或S的杂环烷基、-N(C0-10烷基)(C0-10烷基)、-CON(C0-10烷基)(C0-10烷基)、-N(C0-10烷基)CO(C0-10烷基)、COR1、CN,C1-10烷氧基,芳氧基,含有N、O或S杂芳氧基,上述基团中的H可被以下基团取代:卤素、-CN、-OCH2F、-OCHF2、-OCF3、-OH、C1-10直链或支链烷基、-N(C0-10烷基)(C0-10烷基)、-OC0-10烷基、C3-10环烷基、-O杂环烷基、-N杂环烷基、-S杂环烷基、-N杂环芳香基、-O杂环芳香基、-S杂环芳香基,R1选自H、OC0-10烷基、C1-10直链或支链烷基,
R'选自N或O。
更优选的,所述的可断裂基团具有L1-L2-X-L3-L4结构,其中L1为与dNTP或修饰的dNTP结合的端基,L2和L3不存在或者为不可断裂连接基团,L4为与聚合酶结合的端基,X为可断裂基团。
所述的修饰的dNTP为碱基修饰的dNTP,所述的碱基修饰的dNTP为含N原子的碱基修饰的dNTP,更优选的,所述的碱基修饰的dNTP为含氨基的碱基修饰的dNTP。特别优选的,所述的碱基修饰的dNTP为碱基被
Figure BDA0002783510810000071
修饰的dNTP,所述的n选自0-12的整数,优选的,所述的n选自1-6的整数,例如n选自1、2、3、4、5或6,所述的G选自-COOH、-SH、-NH2、-N3、-CH=CH2、-C≡CH。
本发明所述的碱基修饰的dNTP既可以是3'位修饰的dNTP,也可以是3'位非修饰的dNTP,所述的3'位修饰的dNTP可以达到阻隔核酸链的延展。
优选的,所述的碱基修饰的dNTP为嘌呤碱基的7号位或者是嘧啶碱基的3号位被以下基团修饰:
Figure BDA0002783510810000072
修饰的dNTP,所述的n选自0-12的整数,优选的,所述的n选自1-6的整数,例如n选自1、2、3、4、5或6,所述的G选自-COOH、-SH、-NH2、-N3、-CH=CH2、-C≡CH。
优选的,所述的3'位修饰的dNTP可以为3'位的H原子被以下基团取代:
Figure BDA0002783510810000073
Figure BDA0002783510810000074
修饰的dNTP,所述的n选自0-12的整数,优选的,所述的n选自1-6的整数,例如n选自1、2、3、4、5或6,所述的G选自-COOH、-SH、-NH2、-N3、-CH=CH2、-C≡CH。
在本发明具体实施方式中,所述的碱基修饰的dNTP选自:
Propargylamino-3'-azidomethyl-dCTP;
Propargyl-3'-azidomethyl-dCTP;
Propargylamino-3'-azidomethyl-dUTP;
Propargyl-3'-azidomethyl-dUTP;
7-Deaza-7-Propargylamino-3'-azidomethyl-dGTP;
7-deaza-propargyl-3'-azidomethyl-dGTP;
7-Deaza-7-Propargylamino-3'-azidomethyl-dATP;
7-deaza-propargyl-3'-azidomethyl-dATP;
Propargylamino dCTP,propargyl-dCTP;
Propargylamino dUTP,propargyl-dUTP;
7-Deaza-7-Propargylamino dATP,7-deaza-propargyl-dATP;
7-Deaza-7-Propargylamino dGTP,7-deaza-propargyl-dGTP。
优选的,所述的连接位点选自下式A、式B、式C或式D。
Figure BDA0002783510810000091
优选的,所述的X选自:
Figure BDA0002783510810000101
其中,j为1-3的整数,
R选自H、C1-10直链或支链烷基、C2-10烯基、C2-10炔基、C3-10环烷基、芳基、含有N、O或S的杂环芳基、含有N、O或S的杂环烷基、-N(C0-10烷基)(C0-10烷基)、-CON(C0-10烷基)(C0-10烷基)、-N(C0-10烷基)CO(C0-10烷基)、COR1、CN,C1-10烷氧基,芳氧基,含有N、O或S杂芳氧基,上述基团中的H可被以下基团取代:卤素、-CN、-OCH2F、-OCHF2、-OCF3、-OH、C1-10直链或支链烷基、-N(C0-10烷基)(C0-10烷基)、-OC0-10烷基、C3-10环烷基、-O杂环烷基、-N杂环烷基、-S杂环烷基、-N杂环芳香基、-O杂环芳香基、-S杂环芳香基,R1选自H、OC0-10烷基、C1-10直链或支链烷基,
R'选自N或O。
优选的,所述L1或L4独立的选自马来酰亚胺基、羧基、巯基、叠氮基、炔基、环辛炔基及其衍生物、四嗪基、二硫吡啶基、乙烯基、烯砜基、琥珀酰亚胺基、醛基、酰肼基、胺氧基和α-卤代羰基。
优选的,所述L2或L3独立的选自-O(CH2CH2O)i-、-(CH2)i-、-(CH2)iNH(CH2)i-、-(CH2)iCOO(CH2)i-、-(CH2)iCONH(CH2)i-、-(CH2)iO(CH2)i-、-(CH2)iCO(CH2)i-或
Figure BDA0002783510810000102
中的一个或二个以上基团的组合,所述的i选自0-10的整数。
优选的,所述的可断裂基团选自:
Figure BDA0002783510810000111
。所述连接聚合酶与dNTP的可断裂基团在现有技术中常用的方法的作用下可发生断裂,例如,经紫外线照射或者经化学物质作用后基团发生断裂,从而使聚合酶与dNTP分离。
本发明所述的聚合酶可以为可发光聚合酶,例如所述的聚合酶经突变为可发光聚合酶,或将传统聚合酶与发光蛋白融合形成融合蛋白成为可发光聚合酶。
本发明所述聚合酶还可以是经修饰后含有一个或多个荧光标记物、磷光标记物或者化学发光标记物的聚合酶,所述的修饰不影响聚合酶的活性,所述荧光标记物、磷光标记物或者化学发光标记物经光照后发出光信号。所述的化学发光标记物为目前已知的在可见光和/或紫外线的照射下发出光信号的基团,例如,辣根过氧化酶、碱性磷酸酶、荧光素酶及其衍生物,吖啶酯类、过氧化草酸酯类、洛粉碱、光泽精、鲁米诺及其衍生物,催化化学发光标记物的金属离子复合物、电催化化学发光标记物、苯并二呋喃、次甲基、三苯甲烷、吖嗪、三吩嗪、萘二甲酰亚胺、吡唑、萘醌、蒽醌、单偶氮和双偶氮以及上述基团的衍生物,具有可见光区吸收带的苯的衍生物,具有紫外吸收带的C=C、C=O、-N=N-、-NO2、-C=S等。
所述的荧光标记物包括荧光素,Cy2,Cy3,Cy5,Cy7,Alexa Fluor系列染料,异硫氰酸荧光素,5-六氯荧光素氨基磷酸酯,6-羧基-2',4,7,7'-四氯荧光素琥珀酰亚胺酯,6-羧基-4',5'-二氯-2',7'-二甲氧基荧光素琥珀酰亚胺酯,德克萨斯红,罗丹明110,荧光素马来酰亚胺染料,氟硼二吡咯,呫吨、羰花青、1,1'-二(十八烷基)-3,3,3',3'-四甲基吲哚羰花青高氯酸盐、3,3'-二(十八烷基)-氧杂羰花青高氯酸盐、芘、酞菁、6-羧基罗丹明6G、异硫氰酸荧光素、6-羧基荧光素琥珀酰亚胺酯、5-羧基荧光素琥珀酰亚胺酯、5-羧基荧光素、6-羧基荧光素、罗丹明B、罗丹明6G、7-氨基-4-甲基香豆素、二氢罗丹明123、四甲基罗丹明-6-马来酰亚胺、四甲基罗丹明-5-马来酰亚胺、5-吲哚乙酰氨基荧光素、双[NN-双(羧甲基)氨甲基]荧光素四钠盐、荧光素-5-马来酰亚胺、磺基罗丹明G、7-羟基-4-甲基香豆素、3-氰基-7-羟基香豆素、荧光素二钠盐、四甲基罗丹明-6-异硫氰酸、6-羧基-X-罗丹明琥珀酰亚胺酯、5-羧基-X-罗丹明琥珀酰亚胺酯、6-羧基-X-罗丹明、5-羧基四甲基罗丹明琥珀酰亚胺酯、6-羧基四甲基罗丹明、5-羧基四甲基罗丹明、产生能量转移染料及荧光蛋白,例如GFP(绿色荧光蛋白),CFP(青色荧光蛋白),BFP(蓝色荧光蛋白),YFP(黄色荧光蛋白)及衍生物中的一种或多种。
所述的磷光标记物包括过渡金属铱(Ir)或钌(Ru)的氮杂芳基络合物,优选如下式所示:
Figure BDA0002783510810000121
优选的,所述的步骤(1)中提供的通过可断裂基团与dNTP连接的聚合酶为提供四种连接有不同有dNTP的聚合酶,并且所述的四种连接有不同有dNTP的聚合酶连接有不同的荧光标记物、磷光标记物或者化学发光标记物。
优选的,所述的步骤(2)中待测核酸固定在支持物上。
本领域技术人员可以理解,所述的支持物可以市售获得,例如玻璃、陶瓷、二氧化硅和硅的材料制备得到支持物,也可以使用具有金表面的支持物。所述支持物通常包含一个平的表面(平面),或至少包含其中待连接的多核酸大致在同一平面上的结构。或者,所述固体支持物可以为非平面,例如微珠。可使用任何合适的尺寸。例如,所述支持物可以在每个方向上为1到10cm的数量级。
如果仅将引物混合物接枝到固体支持物表面,并且待扩增模板存在于游离溶液中,则扩增反应大体上可如WO98/44151中所述进行。简单的说,引物附着之后,在允许模板和固定化引物杂交的条件下将所述固体支持物与待扩增模板相接触。通常在合适的杂交条件下将所述模板加入到游离溶液中,这对本领域技术人员是明显的。通常杂交条件为例如起始变性步骤之后为40℃,5×SSC。接着可以进行固相扩增,扩增的第一步是引物延伸步骤,其中将核苷酸添加到与模板杂交的固定化引物的3'端,以生成完整延伸的互补链。这样,该互补链在其3'端包含能够与固定在固体支持物上的第二引物分子结合的序列。进一步的扩增轮次导致形成结合于固体支持物的模板分子簇或集群。
优选的,所述的步骤(2)中还包括在待测核酸上添加引物的步骤。
所述的步骤(3)中通过光照激发聚合酶发出光信号。
所述的步骤(3)中通过现有技术中常用的检测系统检测聚合酶上发出的光信号,例如,利用特定波长激光或使用其它合适的光源,可以通过CCD或其它合适检测方法检测聚合酶上发出的光信号。例如,专利PCT/US07/007991中所描述的方法可以用于测定荧光信号。或者通过加入酶促化学发光、直接化学发光的底物和或催化试剂,或者通过施加电压进行电催化化学发光,并检测发光信号。
优选的,本发明所述的核酸测序方法中还包括步骤(4)使聚合酶与dNTP之间断裂。
所述的步骤(4)中聚合酶与dNTP之间断裂是使连接聚合酶和dNTP之间的可断裂基团发生断裂,所述的可断裂基团的断裂是通过现有技术中常用的方法实现的,例如,通过紫外线照射或者经化学物质,例如是还原剂作用、pH变化使连接聚合酶和dNTP之间的基团的断裂。
在本发明的实施方式中,所述的紫外线可以为365nm-410nm的紫外线;所述的还原剂可以为DTT、TCEP、THPP,所述改变溶液的试剂包括有机酸,无机酸,有机碱,无机碱。
本发明所述的步骤(4)步骤中还包括用洗脱液去除聚合酶。
本发明提供的核酸测序方法还包括步骤(5),即重复步骤(1)-(4)。
优选的,本发明提供的核酸测序方法还包括核酸样品前处理,所述的核酸样品前处理包括核酸样品文库构建及扩增。
所述的核酸样品文库构建包括在核酸两端添加接头(adapter),得到待测核酸。
优选的,所述的核酸样品文库构建包括将核酸样品片段化后在核酸两端添加接头,得到待测核酸。
接头通常是可以通过常规方法合成的短寡核苷酸。接头可以通过多种方式附着至靶标核酸片段的5'端和3'端。优选的,将两种不同的接头序列附着至待扩增核酸上,以使一个接头附着至核酸分子的一端而另一个接头分子附着至核酸分子另一端。
接头包含允许使用固定于固体支持物上的扩增引物分子扩增核酸的序列。为了起到核酸扩增模板的作用,模板构建体的一条单链必须包含与正向扩增引物中序列互补的序列(以使所述正向引物分子可结合并引发互补链合成)以及与反向扩增引物分子中序列相对应的序列(以使反向引物分子可以结合到互补链上)。接头中允许与引物分子杂交的序列通常长约20-30个核苷酸,但是本发明并不限于此长度的序列。
扩增引物中序列以及接头中的相应序列通常来说对本发明并不重要,只要所述引物分子可以与扩增序列相互作用来指导桥式扩增即可。引物设计的原则通常对本领域技术人员来说都是很熟悉的。
所述的扩增是待测核酸通过与固定在载体上的引物进行桥式PCR或者滚环扩增技术进行待测核酸的扩增。
本发明第二方面提供了一种聚合酶,所述的聚合酶为DNA Polβ的变体,所述的DNAPolβ的变体是将SEQ ID NO:1第145-355位的任意一个、两个或三个半胱氨酸突变为非半胱氨酸,优选的,是将SEQ ID NO:1第145-355位的任意一个、两个或三个半胱氨酸突变为丝氨酸,并且将第1-236位的任意一个、两个或三个非半胱氨酸突变为半胱氨酸。
优选的,所述的DNA Polβ的变体是将SEQ ID NO:1第155-294位的任意一个、两个或三个半胱氨酸突变为丝氨酸,并且将第20-154位的任意一个、两个或三个非半胱氨酸突变为半胱氨酸。更优选的,将所述的DNA Polβ的变体是将SEQ ID NO:1的第178位、第239位和/或第267位的半胱氨酸突变为丝氨酸,并且将第28位、第33位和/或第149位的任意一个、两个或三个非半胱氨酸突变为半胱氨酸。
特别优选的,所述的聚合酶为DNA Polβ的变体,所述的DNA Polβ的变体选自如下变体中的一种或者两种以上的组合:
(1)将SEQ ID NO:1第178位的半胱氨酸突变为丝氨酸,第239位的半胱氨酸突变为丝氨酸,第267位的半胱氨酸突变为丝氨酸,第28位的天冬酰胺突变为半胱氨酸;
(2)将SEQ ID NO:1第178位的半胱氨酸突变为丝氨酸,第239位的半胱氨酸突变为丝氨酸,第267位的半胱氨酸突变为丝氨酸,第33位的异亮氨酸突变为半胱氨酸;
(3)将SEQ ID NO:1第178位的半胱氨酸突变为丝氨酸,第239位的半胱氨酸突变为丝氨酸,第267位的半胱氨酸突变为丝氨酸,第149位的精氨酸突变为半胱氨酸。
在本发明的一个具体实施方式中,所述的聚合酶的氨基酸序列与SEQ ID NO:3-6具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%以上的序列同一性,并且所述的DNA Polβ变体具有聚合酶活性。
在本发明的另一个具体实施方式中,所述的聚合酶的氨基酸序列如SEQ ID NO:3-6任一所示。
本发明的第三方面,提供一种聚合酶,所述的聚合酶为Bst DNA Pol及其变体,所述的Bst DNA Pol的序列为SEQ ID NO:2。所述的Bst DNA Pol变体为Bst DNA Pol在一个或多个(例如,2个、3个、4个或5个)氨基酸序列位置的突变,所述的突变包含取代、缺失和/或插入,或者与Bst DNA Pol编码序列具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%以上的序列同一性,并且所述的Bst DNAPol变体具有聚合酶活性。
优选的,所述的Bst DNA Pol变体的突变位点是在DNA合成的催化中心附近的区域,又不是催化反应所必须的氨基酸残基位置,可以保证不影响催化活性,又保证dNTP离催化中心比较近,不需要特别长的可断裂基团就可以与催化中心接触参与反应。
更优选的,所述的Bst DNA Pol的变体是将SEQ ID NO:2第85-100或540-570位的任意一个、两个或三个半胱氨酸突变为非半胱氨酸,优选的,是将SEQ ID NO:2第85-100或540-570位的任意一个、两个或三个半胱氨酸突变为丝氨酸,并且将第250-280或320-380位的任意一个、两个或三个非半胱氨酸突变为半胱氨酸。优选的,所述的Bst DNA Pol的变体是将SEQ ID NO:2第90-95或549-555位的任意一个、两个或三个半胱氨酸突变为丝氨酸,并且将第260-270或330-370位的任意一个、两个或三个非半胱氨酸突变为半胱氨酸。更优选的,将所述的Bst DNA Pol的变体是将SEQ ID NO:2的第93位和/或第550位的半胱氨酸突变为丝氨酸,并且将第264位、第334位和/或第364位的任意一个、两个或三个非半胱氨酸突变为半胱氨酸。
特别优选的,所述的聚合酶为Bst DNA Pol的变体,所述的Bst DNA Pol的变体选自如下变体中的一种或者两种以上的组合:
(1)将SEQ ID NO:2第93位的半胱氨酸突变为丝氨酸,第550位的半胱氨酸突变为丝氨酸;
(2)将SEQ ID NO:2第93位的半胱氨酸突变为丝氨酸,第550位的半胱氨酸突变为丝氨酸,第264位的天冬氨酸突变为半胱氨酸;
(3)将SEQ ID NO:2第93位的半胱氨酸突变为丝氨酸,第550位的半胱氨酸突变为丝氨酸,第334位的精氨酸突变为半胱氨酸;
(4)将SEQ ID NO:2第93位的半胱氨酸突变为丝氨酸,第550位的半胱氨酸突变为丝氨酸,第364位的亮氨酸突变为半胱氨酸。
在本发明的一个具体实施方式中,所述的聚合酶的氨基酸序列与SEQ ID NO:7-10具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%以上的序列同一性,并且所述的DNA Polβ变体具有聚合酶活性。
在本发明的另一个具体实施方式中,所述的聚合酶的氨基酸序列如SEQ ID NO:7-10任一所示。
本发明的第四方面还提供了一种聚合酶复合物,所述的聚合酶复合物为通过可断裂基团将聚合酶与dNTP连接制备得到。其中,所述的可断裂基团用于连接聚合酶和修饰的dNTP,或者,连接聚合酶和dNTP。优选的,所述的可断裂基团含有可断裂结构X,所述的X选自:
Figure BDA0002783510810000171
其中,j为1-3的整数,
R选自H、C1-10直链或支链烷基、C2-10烯基、C2-10炔基、C3-10环烷基、芳基、含有N、O或S的杂环芳基、含有N、O或S的杂环烷基、-N(C0-10烷基)(C0-10烷基)、-CON(C0-10烷基)(C0-10烷基)、-N(C0-10烷基)CO(C0-10烷基)、COR1、CN,C1-10烷氧基,芳氧基,含有N、O或S杂芳氧基,上述基团中的H可被以下基团取代:卤素、-CN、-OCH2F、-OCHF2、-OCF3、-OH、C1-10直链或支链烷基、-N(C0-10烷基)(C0-10烷基)、-OC0-10烷基、C3-10环烷基、-O杂环烷基、-N杂环烷基、-S杂环烷基、-N杂环芳香基、-O杂环芳香基、-S杂环芳香基,R1选自H、OC0-10烷基、C1-10直链或支链烷基,
R'选自N或O。
更优选的,所述的可断裂基团具有L1-L2-X-L3-L4结构,其中,L1为与dNTP或修饰的dNTP结合的端基,L2和L3不存在或为不可断裂连接基团,L4为与聚合酶结合的端基,X为可断裂基团。
所述的修饰的dNTP为碱基修饰的dNTP,所述的碱基修饰的dNTP为含N原子的碱基修饰的dNTP,更优选的,所述的碱基修饰的dNTP为含氨基的碱基修饰的dNTP。特别优选的,所述的碱基修饰的dNTP为碱基被
Figure BDA0002783510810000181
修饰的dNTP,所述的n选自0-12的整数,优选的,所述的n选自1-6的整数,例如n选自1、2、3、4、5或6,所述的G选自-COOH、-SH、-NH2、-N3、-CH=CH2、-C≡CH。
优选的,所述的碱基修饰的dNTP为嘌呤碱基的7号位或者是嘧啶碱基的3号位被以下基团修饰:
Figure BDA0002783510810000182
修饰的dNTP,所述的n选自0-12的整数,优选的,所述的n选自1-6的整数,例如n选自1、2、3、4、5或6,所述的G选自-COOH、-SH、-NH2、-N3、-CH=CH2、-C≡CH。
本发明所述的碱基修饰的dNTP既可以是3'位修饰的dNTP,也可以是3'位非修饰的dNTP,所述的3'位修饰的dNTP可以达到阻隔核酸链的延展。所述的3'位修饰的dNTP可以为3'位的H原子被以下基团取代:
Figure BDA0002783510810000183
修饰的dNTP,所述的n选自0-12的整数,优选的,所述的n选自1-6的整数,例如n选自1、2、3、4、5或6,所述的G选自-COOH、-SH、-NH2、-N3、-CH=CH2、-C≡CH。
在本发明具体实施方式中,所述的碱基修饰的dNTP选自:
Propargylamino-3'-azidomethyl-dCTP;
Propargyl-3'-azidomethyl-dCTP;
Propargylamino-3'-azidomethyl-dUTP;
Propargyl-3'-azidomethyl-dUTP;
7-Deaza-7-Propargylamino-3'-azidomethyl-dGTP;
7-deaza-propargyl-3'-azidomethyl-dGTP;
7-Deaza-7-Propargylamino-3'-azidomethyl-dATP;
7-deaza-propargyl-3'-azidomethyl-dATP;
Propargylamino dCTP,propargyl-dCTP;
Propargylamino dUTP,propargyl-dUTP;
7-Deaza-7-Propargylamino dATP,7-deaza-propargyl-dATP;
7-Deaza-7-Propargylamino dGTP,7-deaza-propargyl-dGTP。
优选的,所述的连接位点选自下式A、式B、式C或式D。
Figure BDA0002783510810000191
优选的,所述的X选自:
Figure BDA0002783510810000201
其中,j为1-3的整数,
R选自H、C1-10直链或支链烷基、C2-10烯基、C2-10炔基、C3-10环烷基、芳基、含有N、O或S的杂环芳基、含有N、O或S的杂环烷基、-N(C0-10烷基)(C0-10烷基)、-CON(C0-10烷基)(C0-10烷基)、-N(C0-10烷基)CO(C0-10烷基)、COR1、CN,C1-10烷氧基,芳氧基,含有N、O或S杂芳氧基,上述基团中的H可被以下基团取代:卤素、-CN、-OCH2F、-OCHF2、-OCF3、-OH、C1-10直链或支链烷基、-N(C0-10烷基)(C0-10烷基)、-OC0-10烷基、C3-10环烷基、-O杂环烷基、-N杂环烷基、-S杂环烷基、-N杂环芳香基、-O杂环芳香基、-S杂环芳香基,R1选自H、OC0-10烷基、C1-10直链或支链烷基,
R'选自N或O。
优选的,所述L1或L4独立的选自马来酰亚胺基、羧基、巯基、叠氮基、炔基、环辛炔基及其衍生物、四嗪基、二硫吡啶基、乙烯基、烯砜基、琥珀酰亚胺基、醛基、酰肼基、胺氧基和α-卤代羰基。
优选的,所述L2或L3独立的选自-O(CH2CH2O)i-、-(CH2)i-、-(CH2)iNH(CH2)i-、-(CH2)iCOO(CH2)i-、-(CH2)iCONH(CH2)i-、-(CH2)iO(CH2)i-、-(CH2)iCO(CH2)i-或
Figure BDA0002783510810000202
中的一个或二个以上基团的组合,所述的i选自0-10的整数。
优选的,所述的可断裂基团选自:
Figure BDA0002783510810000211
所述连接聚合酶与dNTP的可断裂基团在现有技术中常用的方法的作用下可发生断裂,例如,经紫外线照射或者经化学物质作用后基团发生断裂,从而使聚合酶与dNTP分离。
本发明所述的聚合酶复合物还可以包括荧光标记物、磷光标记物或者化学发光标记物。
所述的化学发光标记物为目前已知的在可见光和/或紫外线的照射下发出光信号的基团,例如,辣根过氧化酶、碱性磷酸酶、荧光素酶及其衍生物,吖啶酯类、过氧化草酸酯类、洛粉碱、光泽精、鲁米诺及其衍生物,催化化学发光标记物的金属离子复合物、电催化化学发光标记物、苯并二呋喃、次甲基、三苯甲烷、吖嗪、三吩嗪、萘二甲酰亚胺、吡唑、萘醌、蒽醌、单偶氮和双偶氮以及上述基团的衍生物,具有可见光区吸收带的苯的衍生物,具有紫外吸收带的C=C、C=O、-N=N-、-NO2、-C=S等。
所述的荧光标记物包括所述的荧光标记物包括荧光素,Cy2,Cy3,Cy5,Cy7,AlexaFluor系列染料,异硫氰酸荧光素,5-六氯荧光素氨基磷酸酯,6-羧基-2',4,7,7'-四氯荧光素琥珀酰亚胺酯,6-羧基-4',5'-二氯-2',7'-二甲氧基荧光素琥珀酰亚胺酯,德克萨斯红,罗丹明110,荧光素马来酰亚胺染料,氟硼二吡咯,呫吨、羰花青、1,1'-二(十八烷基)-3,3,3',3'-四甲基吲哚羰花青高氯酸盐、3,3'-二(十八烷基)-氧杂羰花青高氯酸盐、芘、酞菁、6-羧基罗丹明6G、异硫氰酸荧光素、6-羧基荧光素琥珀酰亚胺酯、5-羧基荧光素琥珀酰亚胺酯、5-羧基荧光素、6-羧基荧光素、罗丹明B、罗丹明6G、7-氨基-4-甲基香豆素、二氢罗丹明123、四甲基罗丹明-6-马来酰亚胺、四甲基罗丹明-5-马来酰亚胺、5-吲哚乙酰氨基荧光素、双[NN-双(羧甲基)氨甲基]荧光素四钠盐、荧光素-5-马来酰亚胺、磺基罗丹明G、7-羟基-4-甲基香豆素、3-氰基-7-羟基香豆素、荧光素二钠盐、四甲基罗丹明-6-异硫氰酸、6-羧基-X-罗丹明琥珀酰亚胺酯、5-羧基-X-罗丹明琥珀酰亚胺酯、6-羧基-X-罗丹明、5-羧基四甲基罗丹明琥珀酰亚胺酯、6-羧基四甲基罗丹明、5-羧基四甲基罗丹明、产生能量转移染料及荧光蛋白,例如GFP(绿色荧光蛋白),CFP(青色荧光蛋白),BFP(蓝色荧光蛋白),YFP(黄色荧光蛋白)及衍生物中的一种或多种。
所述的磷光标记物包括过渡金属铱(Ir)或钌(Ru)的氮杂芳基络合物,优选如下式所示:
Figure BDA0002783510810000221
本发明的第五方面提供了一种核酸的合成方法,所述的核酸的合成方法包括:
(1)提供聚合酶,所述的聚合酶通过可断裂基团与dNTP连接;
(2)将所述聚合酶与待测核酸的模板-引物复合体的引物3'端接触,所述聚合酶上的dNTP与待测核酸的序列上的碱基互补配对并在聚合酶酶促反应加入引物3'端上。
其中,酶促反应形成一个碱基的延伸后,所连接的聚合酶阻止了另一个dNTP-聚合酶与新形成的引物3'端的反应,造成了链终止。
优选的,所述的核酸的合成方法还包括步骤(3)使聚合酶与dNTP之间断裂;及(4)重复(1)-(3)步骤。
其中,所述的可断裂基团用于连接聚合酶和修饰的dNTP,或者连接聚合酶和dNTP。
优选的,所述的可断裂基团含有可断裂结构X,所述的X选自:
Figure BDA0002783510810000231
其中,j为1-3的整数,
R选自H、C1-10直链或支链烷基、C2-10烯基、C2-10炔基、C3-10环烷基、芳基、含有N、O或S的杂环芳基、含有N、O或S的杂环烷基、-N(C0-10烷基)(C0-10烷基)、-CON(C0-10烷基)(C0-10烷基)、-N(C0-10烷基)CO(C0-10烷基)、COR1、CN,C1-10烷氧基,芳氧基,含有N、O或S杂芳氧基,上述基团中的H可被以下基团取代:卤素、-CN、-OCH2F、-OCHF2、-OCF3、-OH、C1-10直链或支链烷基、-N(C0-10烷基)(C0-10烷基)、-OC0-10烷基、C3-10环烷基、-O杂环烷基、-N杂环烷基、-S杂环烷基、-N杂环芳香基、-O杂环芳香基、-S杂环芳香基,R1选自H、OC0-10烷基、C1-10直链或支链烷基,
R'选自N或O。
更优选的,所述的可断裂基团具有L1-L2-X-L3-L4结构,其中L1为与dNTP或修饰的dNTP结合的端基,L2和L3不存在或者为不可断裂连接基团,L4为与聚合酶结合的端基,X为可断裂基团。
所述的修饰的dNTP为碱基修饰的dNTP,所述的碱基修饰的dNTP为含N原子的碱基修饰的dNTP,更优选的,所述的碱基修饰的dNTP为含氨基的碱基修饰的dNTP。特别优选的,所述的碱基修饰的dNTP为碱基被
Figure BDA0002783510810000241
修饰的dNTP,所述的n选自0-12的整数,优选的,所述的n选自1-6的整数,例如n选自1、2、3、4、5或6,所述的G选自-COOH、-SH、-NH2、-N3、-CH=CH2、-C≡CH。
本发明所述的碱基修饰的dNTP既可以是3'位修饰的dNTP,也可以是3'位非修饰的dNTP,所述的3'位修饰的dNTP可以达到阻隔核酸链的延展。
优选的,所述的碱基修饰的dNTP为嘌呤碱基的7号位或者是嘧啶碱基的3号位被以下基团修饰:
Figure BDA0002783510810000242
修饰的dNTP,所述的n选自0-12的整数,优选的,所述的n选自1-6的整数,例如n选自1、2、3、4、5或6,所述的G选自-COOH、-SH、-NH2、-N3、-CH=CH2、-C≡CH。
优选的,所述的3'位修饰的dNTP可以为3'位的H原子被以下基团取代:
Figure BDA0002783510810000243
Figure BDA0002783510810000244
修饰的dNTP,所述的n选自0-12的整数,优选的,所述的n选自1-6的整数,例如n选自1、2、3、4、5或6,所述的G选自-COOH、-SH、-NH2、-N3、-CH=CH2、-C≡CH。
在本发明具体实施方式中,所述的碱基修饰的dNTP选自:
Propargylamino-3'-azidomethyl-dCTP;
Propargyl-3'-azidomethyl-dCTP;
Propargylamino-3'-azidomethyl-dUTP;
Propargyl-3'-azidomethyl-dUTP;
7-Deaza-7-Propargylamino-3'-azidomethyl-dGTP;
7-deaza-propargyl-3'-azidomethyl-dGTP;
7-Deaza-7-Propargylamino-3'-azidomethyl-dATP;
7-deaza-propargyl-3'-azidomethyl-dATP;
Propargylamino dCTP,propargyl-dCTP;
Propargylamino dUTP,propargyl-dUTP;
7-Deaza-7-Propargylamino dATP,7-deaza-propargyl-dATP;
7-Deaza-7-Propargylamino dGTP,7-deaza-propargyl-dGTP。
优选的,所述的连接位点选自下式A、式B、式C或式D。
Figure BDA0002783510810000251
优选的,所述的X选自:
Figure BDA0002783510810000261
其中,j为1-3的整数,
R选自H、C1-10直链或支链烷基、C2-10烯基、C2-10炔基、C3-10环烷基、芳基、含有N、O或S的杂环芳基、含有N、O或S的杂环烷基、-N(C0-10烷基)(C0-10烷基)、-CON(C0-10烷基)(C0-10烷基)、-N(C0-10烷基)CO(C0-10烷基)、COR1、CN,C1-10烷氧基,芳氧基,含有N、O或S杂芳氧基,上述基团中的H可被以下基团取代:卤素、-CN、-OCH2F、-OCHF2、-OCF3、-OH、C1-10直链或支链烷基、-N(C0-10烷基)(C0-10烷基)、-OC0-10烷基、C3-10环烷基、-O杂环烷基、-N杂环烷基、-S杂环烷基、-N杂环芳香基、-O杂环芳香基、-S杂环芳香基,R1选自H、OC0-10烷基、C1-10直链或支链烷基,
R'选自N或O。
优选的,所述L1或L4独立的选自马来酰亚胺基、羧基、巯基、叠氮基、炔基、环辛炔基及其衍生物、四嗪基、二硫吡啶基、乙烯基、烯砜基、琥珀酰亚胺基、醛基、酰肼基、胺氧基和α-卤代羰基。
优选的,所述L2或L3独立的选自-O(CH2CH2O)i-、-(CH2)i-、-(CH2)iNH(CH2)i-、-(CH2)iCOO(CH2)i-、-(CH2)iCONH(CH2)i-、-(CH2)iO(CH2)i-、-(CH2)iCO(CH2)i-或
Figure BDA0002783510810000262
中的一个或二个以上基团的组合,所述的i选自0-10的整数。
优选的,所述的可断裂基团选自:
Figure BDA0002783510810000271
。所述的引物可以为游离状态或者固定在支持物上。
所述的步骤(3)中聚合酶与dNTP之间断裂是使连接聚合酶和dNTP之间的可断裂基团发生断裂,所述的连接聚合酶和dNTP之间的可断裂基团的断裂是通过现有技术中常用的方法实现的,例如,通过紫外线照射或者经化学物质,例如是还原剂作用、pH变化使连接聚合酶和dNTP之间的基团的断裂。
本发明提供的核酸测序方法中所用的聚合酶通过可断裂基团与dNTP连接,且含有荧光标记物、化学发光标记物或者磷光标记物,利用该聚合酶实施的核酸测序方法可以实现核酸序列的快速测定。
附图说明
以下,结合附图来详细说明本发明的实施例,其中:
图1:连接dNTP与聚合酶的linker的结构式,具体为PC Mal-NHS碳酸盐脂;
图2:DNA聚合酶Bst DNA Pol及其变体的纯化结果图,其中,泳道M代表Marker;泳道CF代表Bst DNA Pol Cys-Free突变位点为C93S/C550S,泳道D264C代表突变位点为C93S/C550S/D264C的Bst DNA Pol变体,泳道R334C代表突变位点为C93S/C550S/R334C的Bst DNAPol变体,泳道L364C代表突变位点为C93S/C550S/L364C的Bst DNA Pol变体;
图3:实施例1制备获得的DNA聚合酶Bst DNA Pol聚合酶酶活检测,其中,泳道M代表Marker,泳道PC代表阳性对照,泳道NC代表阴性对照,泳道CF代表Bst DNA Pol Cys-Free突变位点为C93S/C550S,泳道D264C代表突变位点为C93S/C550S/D264C的Bst DNA Pol变体,泳道R334C代表突变位点为C93S/C550S/R334C的Bst DNA Pol变体,泳道L364C代表突变位点为C93S/C550S/L364C的Bst DNA Pol变体;
图4A:dATP碱基修饰结构式,具体为7-deaza-Propargylamino-dATP,分子量为543.26;
图4B:dCTP碱基修饰结构式,具体为Propargylamino-dCTP,分子量为520.22;
图4C:dGTP碱基修饰结构式,具体为7-deaza-Propargylamino-dGTP,分子量为559.26;
图4D:dUTP碱基修饰结构式,具体为Propargylamino-dUTP,分子量为521.20;
图5:dNTP与linker连接位点;
图6A:质谱检测DNA聚合酶Bst DNA Pol及其变体与小分子的连接,具体为Bst DNAPol Cys-Free与dUTP的连接质谱图;
图6B:质谱检测DNA聚合酶Bst DNA Pol及其变体与小分子的连接,具体为突变位点为C93S/C550S/L364C的Bst DNA Pol变体的质谱图;
图6C:质谱检测DNA聚合酶Bst DNA Pol及其变体与小分子的连接,具体为突变位点为C93S/C550S/L364C的Bst DNA Pol变体与dUTP的连接质谱图;
图6D:质谱检测DNA聚合酶Bst DNA Pol及其变体与小分子的连接,具体为突变位点为C93S/C550S/R334C的Bst DNA Pol变体与dUTP的连接质谱图;
图6E:质谱检测DNA聚合酶Bst DNA Pol及其变体与小分子的连接,具体为突变位点为C93S/C550S/D264C的Bst DNA Pol变体与dUTP的连接质谱图;
图7:测序过程的反应模式图,具体为设计模板引物复合体,将其与dNTP-linker-聚合酶进行延伸反应,洗去未结合的dNTP-linker-聚合酶后进行荧光或者发光检测;光催化切断linker,使聚合酶脱离引物-模板复合体。使用缓冲液将被光切掉的聚合酶洗去,重复上述步骤进行下一个核苷酸的加入;
图8:单核苷酸延伸检测电泳图,其中,泳道P为单独的引物;泳道P+T为引物-模板复合体;泳道3nt为引物-模板复合体与单独的聚合酶和外加dTTP进行延伸反应,使引物长度增加3个核苷酸;标记+365泳道为引物-模板复合体与dUTP-linker-聚合酶进行延伸反应,由于聚合酶与dUTP被linker连接,在延伸完成后不会脱离引物-模板复合体,阻碍了其他dUTP-linker-聚合酶结合在引物-模板复合体上,无法进行后续的延伸反应,因此只能延伸增加1个核苷酸,在延伸反应后经过365nm光照射后,引物与聚合酶分离,因此泳道中的条带为只延伸1个核苷酸长度的引物;标记-365泳道中反应条件与标记+365泳道相同,由于未使用365nm光进行切割,引物与聚合酶共价结合,变性胶无法打开,因此引物条带的分子量极高。
具体实施方式
本发明所述“核酸”是指至少两个共价连接在一起的核苷酸。
本发明所述的“dNTP”是指脱氧核糖核苷三磷酸(deoxy-ribonucleotidetriphosphate)或核糖核苷三磷酸,通常包括dATP、dGTP、dTTP、dCTP或dUTP等。
本发明所述的“突变体”或“变体”是指野生型聚合酶中一个或多个氨基酸位点发生改变形成的具有同一功能的酶或蛋白。
本发明所述的“基团的组合”是指一个或多个取代基基团之间以共价键的形式连接所形成新的基团。
本发明所述的“修饰”是指在物质的分子结构中一个或多个基团被取代。
本发明中所述的术语C0-10烷基,C0烷基是指H,因此,C0-10烷基包括H、C1烷基、C2烷基、C3烷基、C4烷基、C5烷基、C6烷基、C7烷基、C8烷基、C9烷基、C10烷基。
本发明中所述的术语C1-10直链/支链烷基,包括甲基、乙基、C3直链/支链烷基、C4直链/支链烷基、C5直链/支链烷基、C6直链/支链烷基、C7直链/支链烷基、C8直链/支链烷基、C9直链/支链烷基、C10直链/支链烷基。
本发明中所述的术语C3-10支链烷基,包括异丙基、异丁基、叔丁基、异戊基。
本发明中所述的术语C3-10环烷基,包括C3环烷基、C4环烷基、C5环烷基、C6环烷基、C7环烷基、C8环烷基、C9环烷基、C10环烷基。
本发明所述的术语卤素,包括氟、氯、溴、碘。
本发明所述的术语杂环烷基是指含3-10个环原子,优选5-10个环原子的非芳香的饱和单环或多环环系,其中的一个或多个环原子不是碳原子,而是例如氮、氧或硫原子。优选的杂环烷基含有5-6个环原子。杂环烷基前的前缀氮杂、氧杂或硫杂分别是指至少有一个氮、氧或硫原子作为环原子。
本发明所述的术语杂环芳香基是指含5-14个环原子,优选5-10个环原子的芳香单环或多环环系,其中的一个或多个环原子不是碳原子,而是例如氮、氧或硫原子。优选的杂环芳香基含有5-6个环原子。代表性的杂环芳香基包括吡嗪基、呋喃基、噻吩基、吡啶基、嘧啶基、异噁唑基、异噻唑基、噁唑基、噻唑基、吡唑基、吡咯基、吡唑基、三唑基、吡嗪基、哒嗪基、喹喔啉基、2,3-二氮杂萘基、咪唑并[1,2-a]吡啶、咪唑并[2,1-b]噻唑基、吲哚基、氮杂吲哚基、苯并咪唑基、苯并噻吩基、喹啉基、咪唑基、噻吩并吡啶基、喹唑啉基、噻吩并嘧啶基、吡咯并吡啶基、咪唑并吡啶基、异喹啉基、1,2,4-三嗪基、苯并噻唑基等。
实施例1聚合酶制备
一、克隆和Bst DNA Pol表达菌株
使用用于生产N末端6His标记的Bst DNA Pol及其变体及其变体的表达构建体pET15-Bst DNA Pol。对于N末端6His标记的Bst DNA Pol及其变体由于产率增加而在细胞质中进行表达。
二、蛋白的表达和纯化
使用通用的化学转化方法,将N末端6His标记的Bst DNA Pol及其变体的表达质粒导入BL21(DE3)的表达菌株中进行表达。使用缓冲液A(50mM Tris-HCl pH8.0、800mM NaCl、1mM EDTA、1mM DTT)对细菌进行破碎离心。依次使用PEI溶液和饱和硫酸铵溶液除去细菌上清中的DNA和其他杂质蛋白。利用His-trap FF层析柱和AKTA蛋白纯化系统(GEHealthcare)对N末端6His标记Bst DNA Pol及其变体蛋白进行纯化。收集蛋白洗脱液,利用Heparin HP层析柱(GE Healthcare)进行纯化。收集蛋白洗脱液利用SDS-PAGE胶进行蛋白纯度的检测,结果如图2显示,纯化的DNA聚合酶Bst DNA Pol及其变体的纯度大于95%,泳道M为蛋白Marker(Thermo Fisher),泳道CF为DNA聚合酶Bst DNA Pol Cys-Free,泳道D264C为DNA聚合酶Bst DNA Pol Cys-Free D264C突变体,泳道R334C为DNA聚合酶Bst DNAPol Cys-Free R334C突变体,泳道L364C为DNA聚合酶Bst DNA Pol Cys-Free L364C突变体。测定纯化的DNA聚合酶Bst DNA Pol及其变体浓度,分装冻存在-80℃超低温冰箱,留待制备dNTP-linker-聚合酶复合体。
三、聚合酶活性的检测
纯化的DNA聚合酶Bst DNA Pol及其变体需要先对其活性进行检测,待确定具有聚合酶活性后,方可与小分子进行连接。将纯化的DNA聚合酶Bst DNA Pol及其变体与退火结合的引物-模板复合体、10mM MgCl2、dNTP混合物和缓冲液(50mM NaCl、10mM Tris-HClpH7.9、1mM DTT)混合,反应体系定容为10uL。在37℃条件下孵育30min,之后利用非变性的聚丙烯酰胺凝胶电泳进行检测。在与阴性对照组的比较中,引物-模板复合体分子量会增加,说明聚合酶具有酶活性将引物延伸至模板长度。如图3,泳道M为DNA Marker(ThermoFisher),泳道PC为阳性对照,使用聚合酶Klenow(NEB),泳道NC为阴性对照,泳道CF为DNA聚合酶Bst DNA Pol Cys-Free,泳道D264C为DNA聚合酶Bst DNA Pol Cys-Free D264C突变体,泳道R334C为DNA聚合酶Bst DNA Pol Cys-Free R334C突变体,泳道L364C为DNA聚合酶Bst DNA Pol Cys-Free L364C突变体。
如图2-3显示,通过上述方法获得了较高纯度的聚合酶,且获得的聚合酶具有较高聚合酶活性。
实施例2dNTP-linker-聚合酶的制备
一、dNTP与linker连接
采用摩尔比1:2将上述的dNTP(如图4A-4D)与linker(如图1)分子进行混合,避光室温震荡孵育2小时,利用乙酸乙酯沉淀连接产物,离心挥干上清,将沉淀置于-20℃冰箱保存。
二、小分子与聚合酶链接的制备
将上述连接产物小分子用DMSO溶解,按小分子摩尔比10:1与前述的表达纯化的N末端6His标记的Bst DNA Pol及其变体的聚合酶蛋白进行混合,避光室温震荡孵育2小时。之后采用Zeba Spin Desalting Column(Thermo)除去溶液内多余的小分子。其中,dNTP与linker连接位点见图5。
使用质谱方法,取部分连接产物进行连接效果和效率的检测。如图6A-图6E。由图6A-图6E显示将dNTP通过linker连接到聚合酶上,获得了连有单分子碱基修饰的dNTP的聚合酶。
实施例3测序
按照反应模式图(图7),设计一段随机序列的DNA模板,其长度为60bp,从模板的3'端第20-22位为连续三个腺嘌呤(A),在模板的5'端加生物素标签,设计一段与模板3'端互补的引物序列,长度为19nt,序列见表1。将预先退火结合在一起的引物和模板与dNTP-linker-聚合酶在酶活性最适温度60℃下孵育5分钟进行延伸反应。将反应后的溶液放置在冰上,用波长为365nm-405nm的LED灯照射15分钟,对聚合酶与dNTP连接的linker进行光切割,使聚合酶脱离引物-模板复合体。将照射之后的反应体系与带有链霉亲和素标记的磁珠孵育5分钟,使延长了的引物-模板复合体结合在磁珠上。使用磁珠洗涤缓冲液(0.5M NaCl、20mM Tris-HCl pH 7.5、1mM EDTA)将被光切掉的聚合酶和未结合的dNTP-linker-聚合酶洗去。为了检测经过一轮反应之后,是否在引物上延伸了一个核苷酸,使用50mM KOH溶液将引物-模板复合体打开,将引物洗脱下来,再用等体积的50mM HCl溶液中和,然后利用15%尿素变性的PAGE胶进行检测。由于只有引物的5'端带有荧光基团(FAM),使用GE公司的Typhoon荧光扫胶仪可以检测尿素变性的PAGE胶上引物的大小,并拍照进行对比分析。
表1引物与模板序列
Figure BDA0002783510810000321
反应结果如图8泳道P为单独的引物;泳道P+T为引物-模板复合体;泳道3nt为引物-模板复合体与单独的聚合酶Bst L364C和外加dTTP进行延伸反应,使引物长度增加3个核苷酸;标记+365泳道为引物-模板复合体与聚合酶Bst L364C-dUTP进行延伸反应,由于聚合酶与dUTP被linker连接,在延伸完成后不会脱离引物-模板复合体,阻碍了其他dUTP-linker-聚合酶结合在引物-模板复合体上,无法进行后续的延伸反应,因此只能延伸增加1个核苷酸,在延伸反应后经过365nm光照射后,引物与聚合酶分离,因此泳道中的条带为只延伸1个核苷酸的引物;标记-365泳道中反应条件与标记+365泳道相同,由于未使用365nm光进行切割,引物与聚合酶共价结合,变性胶无法打开,因此引物条带的分子量极高。
结果显示连有dUTP的聚合酶Bst L364C具有较高的聚合酶活性,无法脱离引物-模板复合体的聚合酶Bst L364C有效的阻碍了后续的延伸反应,且阻碍基团能够被365nm光切掉,解除阻碍。
序列表
<110> 清华大学
<120> 一种核酸测序方法
<130> 1
<160> 12
<170> SIPOSequenceListing 1.0
<210> 1
<211> 335
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Met Ser Lys Arg Lys Ala Pro Gln Glu Thr Leu Asn Gly Gly Ile Thr
1 5 10 15
Asp Met Leu Thr Glu Leu Ala Asn Phe Glu Lys Asn Val Ser Gln Ala
20 25 30
Ile His Lys Tyr Asn Ala Tyr Arg Lys Ala Ala Ser Val Ile Ala Lys
35 40 45
Tyr Pro His Lys Ile Lys Ser Gly Ala Glu Ala Lys Lys Leu Pro Gly
50 55 60
Val Gly Thr Lys Ile Ala Glu Lys Ile Asp Glu Phe Leu Ala Thr Gly
65 70 75 80
Lys Leu Arg Lys Leu Glu Lys Ile Arg Gln Asp Asp Thr Ser Ser Ser
85 90 95
Ile Asn Phe Leu Thr Arg Val Ser Gly Ile Gly Pro Ser Ala Ala Arg
100 105 110
Lys Phe Val Asp Glu Gly Ile Lys Thr Leu Glu Asp Leu Arg Lys Asn
115 120 125
Glu Asp Lys Leu Asn His His Gln Arg Ile Gly Leu Lys Tyr Phe Gly
130 135 140
Asp Phe Glu Lys Arg Ile Pro Arg Glu Glu Met Leu Gln Met Gln Asp
145 150 155 160
Ile Val Leu Asn Glu Val Lys Lys Val Asp Ser Glu Tyr Ile Ala Thr
165 170 175
Val Cys Gly Ser Phe Arg Arg Gly Ala Glu Ser Ser Gly Asp Met Asp
180 185 190
Val Leu Leu Thr His Pro Ser Phe Thr Ser Glu Ser Thr Lys Gln Pro
195 200 205
Lys Leu Leu His Gln Val Val Glu Gln Leu Gln Lys Val His Phe Ile
210 215 220
Thr Asp Thr Leu Ser Lys Gly Glu Thr Lys Phe Met Gly Val Cys Gln
225 230 235 240
Leu Pro Ser Lys Asn Asp Glu Lys Glu Tyr Pro His Arg Arg Ile Asp
245 250 255
Ile Arg Leu Ile Pro Lys Asp Gln Tyr Tyr Cys Gly Val Leu Tyr Phe
260 265 270
Thr Gly Ser Asp Ile Phe Asn Lys Asn Met Arg Ala His Ala Leu Glu
275 280 285
Lys Gly Phe Thr Ile Asn Glu Tyr Thr Ile Arg Pro Leu Gly Val Thr
290 295 300
Gly Val Ala Gly Glu Pro Leu Pro Val Asp Ser Glu Lys Asp Ile Phe
305 310 315 320
Asp Tyr Ile Gln Trp Lys Tyr Arg Glu Pro Lys Asp Arg Ser Glu
325 330 335
<210> 2
<211> 581
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Met Ala Lys Met Ala Phe Thr Leu Ala Asp Arg Val Thr Glu Glu Met
1 5 10 15
Leu Ala Asp Lys Ala Ala Leu Val Val Glu Val Val Glu Glu Asn Tyr
20 25 30
His Asp Ala Pro Ile Val Gly Ile Ala Val Val Asn Glu His Gly Arg
35 40 45
Phe Phe Leu Arg Pro Glu Thr Ala Leu Ala Asp Pro Gln Phe Val Ala
50 55 60
Trp Leu Gly Asp Glu Thr Lys Lys Lys Ser Met Phe Asp Ser Lys Arg
65 70 75 80
Ala Ala Val Ala Leu Lys Trp Lys Gly Ile Glu Leu Ser Gly Val Ser
85 90 95
Phe Asp Leu Leu Leu Ala Ala Tyr Leu Leu Asp Pro Ala Gln Gly Val
100 105 110
Asp Asp Val Ala Ala Ala Ala Lys Met Lys Gln Tyr Glu Ala Val Arg
115 120 125
Pro Asp Glu Ala Val Tyr Gly Lys Gly Ala Lys Arg Ala Val Pro Asp
130 135 140
Glu Pro Val Leu Ala Glu His Leu Val Arg Lys Ala Ala Ala Ile Trp
145 150 155 160
Ala Leu Glu Arg Pro Phe Leu Asp Glu Leu Arg Arg Asn Glu Gln Asp
165 170 175
Arg Leu Leu Val Glu Leu Glu Gln Pro Leu Ser Ser Ile Leu Ala Glu
180 185 190
Met Glu Phe Ala Gly Val Lys Val Asp Thr Lys Arg Leu Glu Gln Met
195 200 205
Gly Glu Glu Leu Ala Glu Gln Leu Arg Thr Val Glu Gln Arg Ile Tyr
210 215 220
Glu Leu Ala Gly Gln Glu Phe Asn Ile Asn Ser Pro Lys Gln Leu Gly
225 230 235 240
Val Ile Leu Phe Glu Lys Leu Gln Leu Pro Val Leu Lys Lys Thr Lys
245 250 255
Thr Gly Tyr Ser Thr Ser Ala Asp Val Leu Glu Lys Leu Ala Pro Tyr
260 265 270
His Glu Ile Val Glu Asn Ile Leu His Tyr Arg Gln Leu Gly Lys Leu
275 280 285
Gln Ser Thr Tyr Ile Glu Gly Leu Leu Lys Val Val Arg Pro Asp Thr
290 295 300
Lys Lys Val His Thr Ile Phe Asn Gln Ala Leu Thr Gln Thr Gly Arg
305 310 315 320
Leu Ser Ser Thr Glu Pro Asn Leu Gln Asn Ile Pro Ile Arg Leu Glu
325 330 335
Glu Gly Arg Lys Ile Arg Gln Ala Phe Val Pro Ser Glu Ser Asp Trp
340 345 350
Leu Ile Phe Ala Ala Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala
355 360 365
His Ile Ala Glu Asp Asp Asn Leu Met Glu Ala Phe Arg Arg Asp Leu
370 375 380
Asp Ile His Thr Lys Thr Ala Met Asp Ile Phe Gln Val Ser Glu Asp
385 390 395 400
Glu Val Thr Pro Asn Met Arg Arg Gln Ala Lys Ala Val Asn Phe Gly
405 410 415
Ile Val Tyr Gly Ile Ser Asp Tyr Gly Leu Ala Gln Asn Leu Asn Ile
420 425 430
Ser Arg Lys Glu Ala Ala Glu Phe Ile Glu Arg Tyr Phe Glu Ser Phe
435 440 445
Pro Gly Val Lys Arg Tyr Met Glu Asn Ile Val Gln Glu Ala Lys Gln
450 455 460
Lys Gly Tyr Val Thr Thr Leu Leu His Arg Arg Arg Tyr Leu Pro Asp
465 470 475 480
Ile Thr Ser Arg Asn Phe Asn Val Arg Ser Phe Ala Glu Arg Met Ala
485 490 495
Met Asn Thr Pro Ile Gln Gly Ser Ala Ala Asp Ile Ile Lys Lys Ala
500 505 510
Met Ile Asp Leu Asn Ala Arg Leu Lys Glu Glu Arg Leu Gln Ala Arg
515 520 525
Leu Leu Leu Gln Val His Asp Glu Leu Ile Leu Glu Ala Pro Lys Glu
530 535 540
Glu Met Glu Arg Leu Ser Arg Leu Val Pro Glu Val Met Glu Gln Ala
545 550 555 560
Val Thr Leu Arg Val Pro Leu Lys Val Asp Tyr His Tyr Gly Ser Thr
565 570 575
Trp Tyr Asp Ala Lys
580
<210> 3
<211> 335
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Met Ser Lys Arg Lys Ala Pro Gln Glu Thr Leu Asn Gly Gly Ile Thr
1 5 10 15
Asp Met Leu Thr Glu Leu Ala Asn Phe Glu Lys Asn Val Ser Gln Ala
20 25 30
Ile His Lys Tyr Asn Ala Tyr Arg Lys Ala Ala Ser Val Ile Ala Lys
35 40 45
Tyr Pro His Lys Ile Lys Ser Gly Ala Glu Ala Lys Lys Leu Pro Gly
50 55 60
Val Gly Thr Lys Ile Ala Glu Lys Ile Asp Glu Phe Leu Ala Thr Gly
65 70 75 80
Lys Leu Arg Lys Leu Glu Lys Ile Arg Gln Asp Asp Thr Ser Ser Ser
85 90 95
Ile Asn Phe Leu Thr Arg Val Ser Gly Ile Gly Pro Ser Ala Ala Arg
100 105 110
Lys Phe Val Asp Glu Gly Ile Lys Thr Leu Glu Asp Leu Arg Lys Asn
115 120 125
Glu Asp Lys Leu Asn His His Gln Arg Ile Gly Leu Lys Tyr Phe Gly
130 135 140
Asp Phe Glu Lys Arg Ile Pro Arg Glu Glu Met Leu Gln Met Gln Asp
145 150 155 160
Ile Val Leu Asn Glu Val Lys Lys Val Asp Ser Glu Tyr Ile Ala Thr
165 170 175
Val Ser Gly Ser Phe Arg Arg Gly Ala Glu Ser Ser Gly Asp Met Asp
180 185 190
Val Leu Leu Thr His Pro Ser Phe Thr Ser Glu Ser Thr Lys Gln Pro
195 200 205
Lys Leu Leu His Gln Val Val Glu Gln Leu Gln Lys Val His Phe Ile
210 215 220
Thr Asp Thr Leu Ser Lys Gly Glu Thr Lys Phe Met Gly Val Ser Gln
225 230 235 240
Leu Pro Ser Lys Asn Asp Glu Lys Glu Tyr Pro His Arg Arg Ile Asp
245 250 255
Ile Arg Leu Ile Pro Lys Asp Gln Tyr Tyr Ser Gly Val Leu Tyr Phe
260 265 270
Thr Gly Ser Asp Ile Phe Asn Lys Asn Met Arg Ala His Ala Leu Glu
275 280 285
Lys Gly Phe Thr Ile Asn Glu Tyr Thr Ile Arg Pro Leu Gly Val Thr
290 295 300
Gly Val Ala Gly Glu Pro Leu Pro Val Asp Ser Glu Lys Asp Ile Phe
305 310 315 320
Asp Tyr Ile Gln Trp Lys Tyr Arg Glu Pro Lys Asp Arg Ser Glu
325 330 335
<210> 4
<211> 335
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 4
Met Ser Lys Arg Lys Ala Pro Gln Glu Thr Leu Asn Gly Gly Ile Thr
1 5 10 15
Asp Met Leu Thr Glu Leu Ala Asn Phe Glu Lys Cys Val Ser Gln Ala
20 25 30
Ile His Lys Tyr Asn Ala Tyr Arg Lys Ala Ala Ser Val Ile Ala Lys
35 40 45
Tyr Pro His Lys Ile Lys Ser Gly Ala Glu Ala Lys Lys Leu Pro Gly
50 55 60
Val Gly Thr Lys Ile Ala Glu Lys Ile Asp Glu Phe Leu Ala Thr Gly
65 70 75 80
Lys Leu Arg Lys Leu Glu Lys Ile Arg Gln Asp Asp Thr Ser Ser Ser
85 90 95
Ile Asn Phe Leu Thr Arg Val Ser Gly Ile Gly Pro Ser Ala Ala Arg
100 105 110
Lys Phe Val Asp Glu Gly Ile Lys Thr Leu Glu Asp Leu Arg Lys Asn
115 120 125
Glu Asp Lys Leu Asn His His Gln Arg Ile Gly Leu Lys Tyr Phe Gly
130 135 140
Asp Phe Glu Lys Arg Ile Pro Arg Glu Glu Met Leu Gln Met Gln Asp
145 150 155 160
Ile Val Leu Asn Glu Val Lys Lys Val Asp Ser Glu Tyr Ile Ala Thr
165 170 175
Val Ser Gly Ser Phe Arg Arg Gly Ala Glu Ser Ser Gly Asp Met Asp
180 185 190
Val Leu Leu Thr His Pro Ser Phe Thr Ser Glu Ser Thr Lys Gln Pro
195 200 205
Lys Leu Leu His Gln Val Val Glu Gln Leu Gln Lys Val His Phe Ile
210 215 220
Thr Asp Thr Leu Ser Lys Gly Glu Thr Lys Phe Met Gly Val Ser Gln
225 230 235 240
Leu Pro Ser Lys Asn Asp Glu Lys Glu Tyr Pro His Arg Arg Ile Asp
245 250 255
Ile Arg Leu Ile Pro Lys Asp Gln Tyr Tyr Ser Gly Val Leu Tyr Phe
260 265 270
Thr Gly Ser Asp Ile Phe Asn Lys Asn Met Arg Ala His Ala Leu Glu
275 280 285
Lys Gly Phe Thr Ile Asn Glu Tyr Thr Ile Arg Pro Leu Gly Val Thr
290 295 300
Gly Val Ala Gly Glu Pro Leu Pro Val Asp Ser Glu Lys Asp Ile Phe
305 310 315 320
Asp Tyr Ile Gln Trp Lys Tyr Arg Glu Pro Lys Asp Arg Ser Glu
325 330 335
<210> 5
<211> 335
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 5
Met Ser Lys Arg Lys Ala Pro Gln Glu Thr Leu Asn Gly Gly Ile Thr
1 5 10 15
Asp Met Leu Thr Glu Leu Ala Asn Phe Glu Lys Asn Val Ser Gln Ala
20 25 30
Cys His Lys Tyr Asn Ala Tyr Arg Lys Ala Ala Ser Val Ile Ala Lys
35 40 45
Tyr Pro His Lys Ile Lys Ser Gly Ala Glu Ala Lys Lys Leu Pro Gly
50 55 60
Val Gly Thr Lys Ile Ala Glu Lys Ile Asp Glu Phe Leu Ala Thr Gly
65 70 75 80
Lys Leu Arg Lys Leu Glu Lys Ile Arg Gln Asp Asp Thr Ser Ser Ser
85 90 95
Ile Asn Phe Leu Thr Arg Val Ser Gly Ile Gly Pro Ser Ala Ala Arg
100 105 110
Lys Phe Val Asp Glu Gly Ile Lys Thr Leu Glu Asp Leu Arg Lys Asn
115 120 125
Glu Asp Lys Leu Asn His His Gln Arg Ile Gly Leu Lys Tyr Phe Gly
130 135 140
Asp Phe Glu Lys Arg Ile Pro Arg Glu Glu Met Leu Gln Met Gln Asp
145 150 155 160
Ile Val Leu Asn Glu Val Lys Lys Val Asp Ser Glu Tyr Ile Ala Thr
165 170 175
Val Ser Gly Ser Phe Arg Arg Gly Ala Glu Ser Ser Gly Asp Met Asp
180 185 190
Val Leu Leu Thr His Pro Ser Phe Thr Ser Glu Ser Thr Lys Gln Pro
195 200 205
Lys Leu Leu His Gln Val Val Glu Gln Leu Gln Lys Val His Phe Ile
210 215 220
Thr Asp Thr Leu Ser Lys Gly Glu Thr Lys Phe Met Gly Val Ser Gln
225 230 235 240
Leu Pro Ser Lys Asn Asp Glu Lys Glu Tyr Pro His Arg Arg Ile Asp
245 250 255
Ile Arg Leu Ile Pro Lys Asp Gln Tyr Tyr Ser Gly Val Leu Tyr Phe
260 265 270
Thr Gly Ser Asp Ile Phe Asn Lys Asn Met Arg Ala His Ala Leu Glu
275 280 285
Lys Gly Phe Thr Ile Asn Glu Tyr Thr Ile Arg Pro Leu Gly Val Thr
290 295 300
Gly Val Ala Gly Glu Pro Leu Pro Val Asp Ser Glu Lys Asp Ile Phe
305 310 315 320
Asp Tyr Ile Gln Trp Lys Tyr Arg Glu Pro Lys Asp Arg Ser Glu
325 330 335
<210> 6
<211> 335
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Met Ser Lys Arg Lys Ala Pro Gln Glu Thr Leu Asn Gly Gly Ile Thr
1 5 10 15
Asp Met Leu Thr Glu Leu Ala Asn Phe Glu Lys Asn Val Ser Gln Ala
20 25 30
Ile His Lys Tyr Asn Ala Tyr Arg Lys Ala Ala Ser Val Ile Ala Lys
35 40 45
Tyr Pro His Lys Ile Lys Ser Gly Ala Glu Ala Lys Lys Leu Pro Gly
50 55 60
Val Gly Thr Lys Ile Ala Glu Lys Ile Asp Glu Phe Leu Ala Thr Gly
65 70 75 80
Lys Leu Arg Lys Leu Glu Lys Ile Arg Gln Asp Asp Thr Ser Ser Ser
85 90 95
Ile Asn Phe Leu Thr Arg Val Ser Gly Ile Gly Pro Ser Ala Ala Arg
100 105 110
Lys Phe Val Asp Glu Gly Ile Lys Thr Leu Glu Asp Leu Arg Lys Asn
115 120 125
Glu Asp Lys Leu Asn His His Gln Arg Ile Gly Leu Lys Tyr Phe Gly
130 135 140
Asp Phe Glu Lys Cys Ile Pro Arg Glu Glu Met Leu Gln Met Gln Asp
145 150 155 160
Ile Val Leu Asn Glu Val Lys Lys Val Asp Ser Glu Tyr Ile Ala Thr
165 170 175
Val Ser Gly Ser Phe Arg Arg Gly Ala Glu Ser Ser Gly Asp Met Asp
180 185 190
Val Leu Leu Thr His Pro Ser Phe Thr Ser Glu Ser Thr Lys Gln Pro
195 200 205
Lys Leu Leu His Gln Val Val Glu Gln Leu Gln Lys Val His Phe Ile
210 215 220
Thr Asp Thr Leu Ser Lys Gly Glu Thr Lys Phe Met Gly Val Ser Gln
225 230 235 240
Leu Pro Ser Lys Asn Asp Glu Lys Glu Tyr Pro His Arg Arg Ile Asp
245 250 255
Ile Arg Leu Ile Pro Lys Asp Gln Tyr Tyr Ser Gly Val Leu Tyr Phe
260 265 270
Thr Gly Ser Asp Ile Phe Asn Lys Asn Met Arg Ala His Ala Leu Glu
275 280 285
Lys Gly Phe Thr Ile Asn Glu Tyr Thr Ile Arg Pro Leu Gly Val Thr
290 295 300
Gly Val Ala Gly Glu Pro Leu Pro Val Asp Ser Glu Lys Asp Ile Phe
305 310 315 320
Asp Tyr Ile Gln Trp Lys Tyr Arg Glu Pro Lys Asp Arg Ser Glu
325 330 335
<210> 7
<211> 581
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 7
Met Ala Lys Met Ala Phe Thr Leu Ala Asp Arg Val Thr Glu Glu Met
1 5 10 15
Leu Ala Asp Lys Ala Ala Leu Val Val Glu Val Val Glu Glu Asn Tyr
20 25 30
His Asp Ala Pro Ile Val Gly Ile Ala Val Val Asn Glu His Gly Arg
35 40 45
Phe Phe Leu Arg Pro Glu Thr Ala Leu Ala Asp Pro Gln Phe Val Ala
50 55 60
Trp Leu Gly Asp Glu Thr Lys Lys Lys Ser Met Phe Asp Ser Lys Arg
65 70 75 80
Ala Ala Val Ala Leu Lys Trp Lys Gly Ile Glu Leu Ser Gly Val Ser
85 90 95
Phe Asp Leu Leu Leu Ala Ala Tyr Leu Leu Asp Pro Ala Gln Gly Val
100 105 110
Asp Asp Val Ala Ala Ala Ala Lys Met Lys Gln Tyr Glu Ala Val Arg
115 120 125
Pro Asp Glu Ala Val Tyr Gly Lys Gly Ala Lys Arg Ala Val Pro Asp
130 135 140
Glu Pro Val Leu Ala Glu His Leu Val Arg Lys Ala Ala Ala Ile Trp
145 150 155 160
Ala Leu Glu Arg Pro Phe Leu Asp Glu Leu Arg Arg Asn Glu Gln Asp
165 170 175
Arg Leu Leu Val Glu Leu Glu Gln Pro Leu Ser Ser Ile Leu Ala Glu
180 185 190
Met Glu Phe Ala Gly Val Lys Val Asp Thr Lys Arg Leu Glu Gln Met
195 200 205
Gly Glu Glu Leu Ala Glu Gln Leu Arg Thr Val Glu Gln Arg Ile Tyr
210 215 220
Glu Leu Ala Gly Gln Glu Phe Asn Ile Asn Ser Pro Lys Gln Leu Gly
225 230 235 240
Val Ile Leu Phe Glu Lys Leu Gln Leu Pro Val Leu Lys Lys Thr Lys
245 250 255
Thr Gly Tyr Ser Thr Ser Ala Asp Val Leu Glu Lys Leu Ala Pro Tyr
260 265 270
His Glu Ile Val Glu Asn Ile Leu His Tyr Arg Gln Leu Gly Lys Leu
275 280 285
Gln Ser Thr Tyr Ile Glu Gly Leu Leu Lys Val Val Arg Pro Asp Thr
290 295 300
Lys Lys Val His Thr Ile Phe Asn Gln Ala Leu Thr Gln Thr Gly Arg
305 310 315 320
Leu Ser Ser Thr Glu Pro Asn Leu Gln Asn Ile Pro Ile Arg Leu Glu
325 330 335
Glu Gly Arg Lys Ile Arg Gln Ala Phe Val Pro Ser Glu Ser Asp Trp
340 345 350
Leu Ile Phe Ala Ala Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala
355 360 365
His Ile Ala Glu Asp Asp Asn Leu Met Glu Ala Phe Arg Arg Asp Leu
370 375 380
Asp Ile His Thr Lys Thr Ala Met Asp Ile Phe Gln Val Ser Glu Asp
385 390 395 400
Glu Val Thr Pro Asn Met Arg Arg Gln Ala Lys Ala Val Asn Phe Gly
405 410 415
Ile Val Tyr Gly Ile Ser Asp Tyr Gly Leu Ala Gln Asn Leu Asn Ile
420 425 430
Ser Arg Lys Glu Ala Ala Glu Phe Ile Glu Arg Tyr Phe Glu Ser Phe
435 440 445
Pro Gly Val Lys Arg Tyr Met Glu Asn Ile Val Gln Glu Ala Lys Gln
450 455 460
Lys Gly Tyr Val Thr Thr Leu Leu His Arg Arg Arg Tyr Leu Pro Asp
465 470 475 480
Ile Thr Ser Arg Asn Phe Asn Val Arg Ser Phe Ala Glu Arg Met Ala
485 490 495
Met Asn Thr Pro Ile Gln Gly Ser Ala Ala Asp Ile Ile Lys Lys Ala
500 505 510
Met Ile Asp Leu Asn Ala Arg Leu Lys Glu Glu Arg Leu Gln Ala Arg
515 520 525
Leu Leu Leu Gln Val His Asp Glu Leu Ile Leu Glu Ala Pro Lys Glu
530 535 540
Glu Met Glu Arg Leu Ser Arg Leu Val Pro Glu Val Met Glu Gln Ala
545 550 555 560
Val Thr Leu Arg Val Pro Leu Lys Val Asp Tyr His Tyr Gly Ser Thr
565 570 575
Trp Tyr Asp Ala Lys
580
<210> 8
<211> 581
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 8
Met Ala Lys Met Ala Phe Thr Leu Ala Asp Arg Val Thr Glu Glu Met
1 5 10 15
Leu Ala Asp Lys Ala Ala Leu Val Val Glu Val Val Glu Glu Asn Tyr
20 25 30
His Asp Ala Pro Ile Val Gly Ile Ala Val Val Asn Glu His Gly Arg
35 40 45
Phe Phe Leu Arg Pro Glu Thr Ala Leu Ala Asp Pro Gln Phe Val Ala
50 55 60
Trp Leu Gly Asp Glu Thr Lys Lys Lys Ser Met Phe Asp Ser Lys Arg
65 70 75 80
Ala Ala Val Ala Leu Lys Trp Lys Gly Ile Glu Leu Ser Gly Val Ser
85 90 95
Phe Asp Leu Leu Leu Ala Ala Tyr Leu Leu Asp Pro Ala Gln Gly Val
100 105 110
Asp Asp Val Ala Ala Ala Ala Lys Met Lys Gln Tyr Glu Ala Val Arg
115 120 125
Pro Asp Glu Ala Val Tyr Gly Lys Gly Ala Lys Arg Ala Val Pro Asp
130 135 140
Glu Pro Val Leu Ala Glu His Leu Val Arg Lys Ala Ala Ala Ile Trp
145 150 155 160
Ala Leu Glu Arg Pro Phe Leu Asp Glu Leu Arg Arg Asn Glu Gln Asp
165 170 175
Arg Leu Leu Val Glu Leu Glu Gln Pro Leu Ser Ser Ile Leu Ala Glu
180 185 190
Met Glu Phe Ala Gly Val Lys Val Asp Thr Lys Arg Leu Glu Gln Met
195 200 205
Gly Glu Glu Leu Ala Glu Gln Leu Arg Thr Val Glu Gln Arg Ile Tyr
210 215 220
Glu Leu Ala Gly Gln Glu Phe Asn Ile Asn Ser Pro Lys Gln Leu Gly
225 230 235 240
Val Ile Leu Phe Glu Lys Leu Gln Leu Pro Val Leu Lys Lys Thr Lys
245 250 255
Thr Gly Tyr Ser Thr Ser Ala Cys Val Leu Glu Lys Leu Ala Pro Tyr
260 265 270
His Glu Ile Val Glu Asn Ile Leu His Tyr Arg Gln Leu Gly Lys Leu
275 280 285
Gln Ser Thr Tyr Ile Glu Gly Leu Leu Lys Val Val Arg Pro Asp Thr
290 295 300
Lys Lys Val His Thr Ile Phe Asn Gln Ala Leu Thr Gln Thr Gly Arg
305 310 315 320
Leu Ser Ser Thr Glu Pro Asn Leu Gln Asn Ile Pro Ile Arg Leu Glu
325 330 335
Glu Gly Arg Lys Ile Arg Gln Ala Phe Val Pro Ser Glu Ser Asp Trp
340 345 350
Leu Ile Phe Ala Ala Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala
355 360 365
His Ile Ala Glu Asp Asp Asn Leu Met Glu Ala Phe Arg Arg Asp Leu
370 375 380
Asp Ile His Thr Lys Thr Ala Met Asp Ile Phe Gln Val Ser Glu Asp
385 390 395 400
Glu Val Thr Pro Asn Met Arg Arg Gln Ala Lys Ala Val Asn Phe Gly
405 410 415
Ile Val Tyr Gly Ile Ser Asp Tyr Gly Leu Ala Gln Asn Leu Asn Ile
420 425 430
Ser Arg Lys Glu Ala Ala Glu Phe Ile Glu Arg Tyr Phe Glu Ser Phe
435 440 445
Pro Gly Val Lys Arg Tyr Met Glu Asn Ile Val Gln Glu Ala Lys Gln
450 455 460
Lys Gly Tyr Val Thr Thr Leu Leu His Arg Arg Arg Tyr Leu Pro Asp
465 470 475 480
Ile Thr Ser Arg Asn Phe Asn Val Arg Ser Phe Ala Glu Arg Met Ala
485 490 495
Met Asn Thr Pro Ile Gln Gly Ser Ala Ala Asp Ile Ile Lys Lys Ala
500 505 510
Met Ile Asp Leu Asn Ala Arg Leu Lys Glu Glu Arg Leu Gln Ala Arg
515 520 525
Leu Leu Leu Gln Val His Asp Glu Leu Ile Leu Glu Ala Pro Lys Glu
530 535 540
Glu Met Glu Arg Leu Ser Arg Leu Val Pro Glu Val Met Glu Gln Ala
545 550 555 560
Val Thr Leu Arg Val Pro Leu Lys Val Asp Tyr His Tyr Gly Ser Thr
565 570 575
Trp Tyr Asp Ala Lys
580
<210> 9
<211> 581
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 9
Met Ala Lys Met Ala Phe Thr Leu Ala Asp Arg Val Thr Glu Glu Met
1 5 10 15
Leu Ala Asp Lys Ala Ala Leu Val Val Glu Val Val Glu Glu Asn Tyr
20 25 30
His Asp Ala Pro Ile Val Gly Ile Ala Val Val Asn Glu His Gly Arg
35 40 45
Phe Phe Leu Arg Pro Glu Thr Ala Leu Ala Asp Pro Gln Phe Val Ala
50 55 60
Trp Leu Gly Asp Glu Thr Lys Lys Lys Ser Met Phe Asp Ser Lys Arg
65 70 75 80
Ala Ala Val Ala Leu Lys Trp Lys Gly Ile Glu Leu Ser Gly Val Ser
85 90 95
Phe Asp Leu Leu Leu Ala Ala Tyr Leu Leu Asp Pro Ala Gln Gly Val
100 105 110
Asp Asp Val Ala Ala Ala Ala Lys Met Lys Gln Tyr Glu Ala Val Arg
115 120 125
Pro Asp Glu Ala Val Tyr Gly Lys Gly Ala Lys Arg Ala Val Pro Asp
130 135 140
Glu Pro Val Leu Ala Glu His Leu Val Arg Lys Ala Ala Ala Ile Trp
145 150 155 160
Ala Leu Glu Arg Pro Phe Leu Asp Glu Leu Arg Arg Asn Glu Gln Asp
165 170 175
Arg Leu Leu Val Glu Leu Glu Gln Pro Leu Ser Ser Ile Leu Ala Glu
180 185 190
Met Glu Phe Ala Gly Val Lys Val Asp Thr Lys Arg Leu Glu Gln Met
195 200 205
Gly Glu Glu Leu Ala Glu Gln Leu Arg Thr Val Glu Gln Arg Ile Tyr
210 215 220
Glu Leu Ala Gly Gln Glu Phe Asn Ile Asn Ser Pro Lys Gln Leu Gly
225 230 235 240
Val Ile Leu Phe Glu Lys Leu Gln Leu Pro Val Leu Lys Lys Thr Lys
245 250 255
Thr Gly Tyr Ser Thr Ser Ala Asp Val Leu Glu Lys Leu Ala Pro Tyr
260 265 270
His Glu Ile Val Glu Asn Ile Leu His Tyr Arg Gln Leu Gly Lys Leu
275 280 285
Gln Ser Thr Tyr Ile Glu Gly Leu Leu Lys Val Val Arg Pro Asp Thr
290 295 300
Lys Lys Val His Thr Ile Phe Asn Gln Ala Leu Thr Gln Thr Gly Arg
305 310 315 320
Leu Ser Ser Thr Glu Pro Asn Leu Gln Asn Ile Pro Ile Cys Leu Glu
325 330 335
Glu Gly Arg Lys Ile Arg Gln Ala Phe Val Pro Ser Glu Ser Asp Trp
340 345 350
Leu Ile Phe Ala Ala Asp Tyr Ser Gln Ile Glu Leu Arg Val Leu Ala
355 360 365
His Ile Ala Glu Asp Asp Asn Leu Met Glu Ala Phe Arg Arg Asp Leu
370 375 380
Asp Ile His Thr Lys Thr Ala Met Asp Ile Phe Gln Val Ser Glu Asp
385 390 395 400
Glu Val Thr Pro Asn Met Arg Arg Gln Ala Lys Ala Val Asn Phe Gly
405 410 415
Ile Val Tyr Gly Ile Ser Asp Tyr Gly Leu Ala Gln Asn Leu Asn Ile
420 425 430
Ser Arg Lys Glu Ala Ala Glu Phe Ile Glu Arg Tyr Phe Glu Ser Phe
435 440 445
Pro Gly Val Lys Arg Tyr Met Glu Asn Ile Val Gln Glu Ala Lys Gln
450 455 460
Lys Gly Tyr Val Thr Thr Leu Leu His Arg Arg Arg Tyr Leu Pro Asp
465 470 475 480
Ile Thr Ser Arg Asn Phe Asn Val Arg Ser Phe Ala Glu Arg Met Ala
485 490 495
Met Asn Thr Pro Ile Gln Gly Ser Ala Ala Asp Ile Ile Lys Lys Ala
500 505 510
Met Ile Asp Leu Asn Ala Arg Leu Lys Glu Glu Arg Leu Gln Ala Arg
515 520 525
Leu Leu Leu Gln Val His Asp Glu Leu Ile Leu Glu Ala Pro Lys Glu
530 535 540
Glu Met Glu Arg Leu Ser Arg Leu Val Pro Glu Val Met Glu Gln Ala
545 550 555 560
Val Thr Leu Arg Val Pro Leu Lys Val Asp Tyr His Tyr Gly Ser Thr
565 570 575
Trp Tyr Asp Ala Lys
580
<210> 10
<211> 581
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 10
Met Ala Lys Met Ala Phe Thr Leu Ala Asp Arg Val Thr Glu Glu Met
1 5 10 15
Leu Ala Asp Lys Ala Ala Leu Val Val Glu Val Val Glu Glu Asn Tyr
20 25 30
His Asp Ala Pro Ile Val Gly Ile Ala Val Val Asn Glu His Gly Arg
35 40 45
Phe Phe Leu Arg Pro Glu Thr Ala Leu Ala Asp Pro Gln Phe Val Ala
50 55 60
Trp Leu Gly Asp Glu Thr Lys Lys Lys Ser Met Phe Asp Ser Lys Arg
65 70 75 80
Ala Ala Val Ala Leu Lys Trp Lys Gly Ile Glu Leu Ser Gly Val Ser
85 90 95
Phe Asp Leu Leu Leu Ala Ala Tyr Leu Leu Asp Pro Ala Gln Gly Val
100 105 110
Asp Asp Val Ala Ala Ala Ala Lys Met Lys Gln Tyr Glu Ala Val Arg
115 120 125
Pro Asp Glu Ala Val Tyr Gly Lys Gly Ala Lys Arg Ala Val Pro Asp
130 135 140
Glu Pro Val Leu Ala Glu His Leu Val Arg Lys Ala Ala Ala Ile Trp
145 150 155 160
Ala Leu Glu Arg Pro Phe Leu Asp Glu Leu Arg Arg Asn Glu Gln Asp
165 170 175
Arg Leu Leu Val Glu Leu Glu Gln Pro Leu Ser Ser Ile Leu Ala Glu
180 185 190
Met Glu Phe Ala Gly Val Lys Val Asp Thr Lys Arg Leu Glu Gln Met
195 200 205
Gly Glu Glu Leu Ala Glu Gln Leu Arg Thr Val Glu Gln Arg Ile Tyr
210 215 220
Glu Leu Ala Gly Gln Glu Phe Asn Ile Asn Ser Pro Lys Gln Leu Gly
225 230 235 240
Val Ile Leu Phe Glu Lys Leu Gln Leu Pro Val Leu Lys Lys Thr Lys
245 250 255
Thr Gly Tyr Ser Thr Ser Ala Asp Val Leu Glu Lys Leu Ala Pro Tyr
260 265 270
His Glu Ile Val Glu Asn Ile Leu His Tyr Arg Gln Leu Gly Lys Leu
275 280 285
Gln Ser Thr Tyr Ile Glu Gly Leu Leu Lys Val Val Arg Pro Asp Thr
290 295 300
Lys Lys Val His Thr Ile Phe Asn Gln Ala Leu Thr Gln Thr Gly Arg
305 310 315 320
Leu Ser Ser Thr Glu Pro Asn Leu Gln Asn Ile Pro Ile Arg Leu Glu
325 330 335
Glu Gly Arg Lys Ile Arg Gln Ala Phe Val Pro Ser Glu Ser Asp Trp
340 345 350
Leu Ile Phe Ala Ala Asp Tyr Ser Gln Ile Glu Cys Arg Val Leu Ala
355 360 365
His Ile Ala Glu Asp Asp Asn Leu Met Glu Ala Phe Arg Arg Asp Leu
370 375 380
Asp Ile His Thr Lys Thr Ala Met Asp Ile Phe Gln Val Ser Glu Asp
385 390 395 400
Glu Val Thr Pro Asn Met Arg Arg Gln Ala Lys Ala Val Asn Phe Gly
405 410 415
Ile Val Tyr Gly Ile Ser Asp Tyr Gly Leu Ala Gln Asn Leu Asn Ile
420 425 430
Ser Arg Lys Glu Ala Ala Glu Phe Ile Glu Arg Tyr Phe Glu Ser Phe
435 440 445
Pro Gly Val Lys Arg Tyr Met Glu Asn Ile Val Gln Glu Ala Lys Gln
450 455 460
Lys Gly Tyr Val Thr Thr Leu Leu His Arg Arg Arg Tyr Leu Pro Asp
465 470 475 480
Ile Thr Ser Arg Asn Phe Asn Val Arg Ser Phe Ala Glu Arg Met Ala
485 490 495
Met Asn Thr Pro Ile Gln Gly Ser Ala Ala Asp Ile Ile Lys Lys Ala
500 505 510
Met Ile Asp Leu Asn Ala Arg Leu Lys Glu Glu Arg Leu Gln Ala Arg
515 520 525
Leu Leu Leu Gln Val His Asp Glu Leu Ile Leu Glu Ala Pro Lys Glu
530 535 540
Glu Met Glu Arg Leu Ser Arg Leu Val Pro Glu Val Met Glu Gln Ala
545 550 555 560
Val Thr Leu Arg Val Pro Leu Lys Val Asp Tyr His Tyr Gly Ser Thr
565 570 575
Trp Tyr Asp Ala Lys
580
<210> 11
<211> 60
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gtgatacggc gaccaccttt tggtggtcgc cgtatcacaa agtcgaggcc ctgtgcaagc 60
<210> 12
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gcttgcacag ggcctcgac 19

Claims (17)

1.一种核酸测序方法,所述的测序方法包括如下步骤:
(1)提供聚合酶,所述的聚合酶通过可断裂基团与dNTP连接,并且所述的聚合酶可发出光信号;
(2)使所述聚合酶与待测核酸模板-引物复合体的引物3'端接触,所述聚合酶上的dNTP与待测核酸的序列上的碱基互补配对并在聚合酶酶促反应加入引物3'端;
(3)检测所述聚合酶发出的光信号;
所述聚合酶为Bst DNA Pol的变体,所述的Bst DNA Pol的变体的氨基酸序列如SEQ IDNO:10所示。
2.根据权利要求1所述的一种核酸测序方法,其特征在于,所述的可断裂基团含有可断裂结构X,所述的X选自:
Figure 195492DEST_PATH_IMAGE001
其中,j为1-3的整数,
R选自H、C1-10直链或支链烷基、C2-10烯基、C2-10炔基、C3-10环烷基、芳基、含有N、O或S的杂环芳基、含有N、O或S的杂环烷基、-N(C0-10烷基)(C0-10烷基)、-CON(C0-10烷基)(C0-10烷基)、-N(C0-10烷基)CO(C0-10烷基)、COR1、CN,C1-10烷氧基,芳氧基,含有N、O或S杂芳氧基,上述基团中的H可被以下基团取代:卤素、-CN、-OCH2F、-OCHF2、-OCF3、-OH、C1-10直链或支链烷基、-N(C0-10烷基)(C0-10烷基)、-OC0-10烷基、C3-10环烷基、-O杂环烷基、-N杂环烷基、-S杂环烷基、-N杂环芳香基、-O杂环芳香基、-S杂环芳香基,R1选自H、OC0-10烷基、C1-10直链或支链烷基,
R'选自N或O。
3.根据权利要求2所述的一种核酸测序方法,其特征在于,所述的可断裂基团具有L1-L2-X-L3-L4结构,其中,L1为与dNTP或修饰的dNTP结合的端基,L2和L3不存在或为不可断裂连接基团,L4为与聚合酶结合的端基。
4.根据权利要求3所述的一种核酸测序方法,其特征在于,所述的L1或L4独立的选自马来酰亚胺基、羧基、巯基、叠氮基、炔基、环辛炔基及其衍生物、四嗪基、二硫吡啶基、乙烯基、烯砜基、琥珀酰亚胺基、醛基、酰肼基、胺氧基和α-卤代羰基。
5.根据权利要求3所述的一种核酸测序方法,其特征在于,所述的L2或L3独立的选自-O(CH2CH2O)i-、-(CH2)i-、-(CH2)iNH(CH2)i-、-(CH2)iCOO(CH2)i-、-(CH2)iCONH(CH2)i-、-(CH2)iO(CH2)i-、-(CH2)iCO(CH2)i-或
Figure 643791DEST_PATH_IMAGE002
中的一个或二个以上基团的组合,所述的i选自0-10的整数。
6.根据权利要求1所述的一种核酸测序方法,其特征在于,所述聚合酶连接有一个或多个荧光标记物、磷光标记物或者化学发光标记物。
7.根据权利要求6所述的一种核酸测序方法,其特征在于,其中,
所述的化学发光标记物选自辣根过氧化酶、碱性磷酸酶、荧光素酶、吖啶酯类、过氧化草酸酯类、洛粉碱、光泽精、鲁米诺、催化化学发光标记物的金属离子复合物、电催化化学发光标记物、苯并二呋喃、次甲基、三苯甲烷、吖嗪、三吩嗪、萘二甲酰亚胺、吡唑、萘醌、蒽醌、单偶氮、双偶氮、具有可见光区吸收带的苯的衍生物、具有紫外吸收带的C=C、C=O、-N=N-、-NO2或-C=S;
所述的荧光标记物选自荧光素、Cy2、Cy3、Cy5、Cy7、Alexa Fluor系列染料、异硫氰酸荧光素、5-六氯荧光素氨基磷酸酯、6-羧基-2',4,7,7'-四氯荧光素琥珀酰亚胺酯、6-羧基-4',5'-二氯-2',7'-二甲氧基荧光素琥珀酰亚胺酯、德克萨斯红、罗丹明110、荧光素马来酰亚胺染料、氟硼二吡咯、呫吨、羰花青、1,1'-二(十八烷基)-3,3,3',3'-四甲基吲哚羰花青高氯酸盐、3,3'-二(十八烷基)-氧杂羰花青高氯酸盐、芘、酞菁、6-羧基罗丹明6G、异硫氰酸荧光素、6-羧基荧光素琥珀酰亚胺酯、5-羧基荧光素琥珀酰亚胺酯、5-羧基荧光素、6-羧基荧光素、罗丹明B、罗丹明6G、7-氨基-4-甲基香豆素、二氢罗丹明123、四甲基罗丹明-6-马来酰亚胺、四甲基罗丹明-5-马来酰亚胺、5-吲哚乙酰氨基荧光素、双[N、N-双(羧甲基)氨甲基]荧光素四钠盐、荧光素-5-马来酰亚胺、磺基罗丹明G、7-羟基-4-甲基香豆素、3-氰基-7-羟基香豆素、荧光素二钠盐、四甲基罗丹明-6-异硫氰酸、6-羧基-X-罗丹明琥珀酰亚胺酯、5-羧基-X-罗丹明琥珀酰亚胺酯、6-羧基-X-罗丹明、5-羧基四甲基罗丹明琥珀酰亚胺酯、6-羧基四甲基罗丹明、5-羧基四甲基罗丹明、产生能量转移染料或荧光蛋白,所述的荧光蛋白选自绿色荧光蛋白、青色荧光蛋白、蓝色荧光蛋白、黄色荧光蛋白中的一种或多种;
所述的磷光标记物包括过渡金属铱或钌的氮杂芳基络合物。
8.根据权利要求1所述的一种核酸测序方法,其特征在于,所述的步骤(1)中提供通过可断裂基团与dNTP连接的聚合酶为提供四种连接有不同dNTP的聚合酶,并且所述的四种连接有不同dNTP的聚合酶连接有不同的荧光标记物、化学发光标记物或者磷光标记物。
9.根据权利要求1所述的一种核酸测序方法,其特征在于,所述的步骤(2)中待测核酸固定在支持物上。
10.根据权利要求1所述的一种核酸测序方法,其特征在于,所述的核酸测序方法中还包括步骤(4)使聚合酶与dNTP之间断裂。
11.根据权利要求10所述的一种核酸测序方法,其特征在于,所述的核酸测序方法还包括步骤(5):重复步骤(1)-(4)。
12.根据权利要求1所述的一种核酸测序方法,其特征在于,所述的核酸测序方法还包括核酸样品前处理,所述的核酸样品前处理包括核酸样品文库构建及扩增。
13.一种聚合酶,其特征在于,所述聚合酶为Bst DNA Pol的变体,所述的Bst DNA Pol的变体的氨基酸序列如SEQ ID NO:10所示。
14.一种聚合酶复合物,其特征在于,所述的聚合酶复合物为通过可断裂基团将聚合酶与dNTP连接制备得到;所述聚合酶为Bst DNA Pol的变体,所述的Bst DNA Pol的变体的氨基酸序列如SEQ ID NO:10所示。
15.根据权利要求14所述的一种聚合酶复合物,其特征在于,所述的可断裂基团含有可断裂结构X,所述的X选自:
Figure 157949DEST_PATH_IMAGE004
其中,j为1-3的整数,
其中,R选自H、C1-10直链或支链烷基、C2-10烯基、C2-10炔基、C3-10环烷基、芳基、含有N、O或S的杂环芳基、含有N、O或S的杂环烷基、-N(C0-10烷基)(C0-10烷基)、-CON(C0-10烷基)(C0-10烷基)、-N(C0-10烷基)CO(C0-10烷基)、COR1、CN,C1-10烷氧基,芳氧基,含有N、O或S杂芳氧基,上述基团中的H可被以下基团取代:卤素、-CN、-OCH2F、-OCHF2、-OCF3、-OH、C1-10直链或支链烷基、-N(C0-10烷基)(C0-10烷基)、-OC0-10烷基、C3-10环烷基、-O杂环烷基、-N杂环烷基、-S杂环烷基、-N杂环芳香基、-O杂环芳香基、-S杂环芳香基,R1选自H、OC0-10烷基、C1-10直链或支链烷基,
R'选自N或O。
16.一种核酸的合成方法,其特征在于,所述的核酸的合成方法包括:
(1)提供聚合酶,所述的聚合酶通过可断裂基团与dNTP连接;
(2)将所述聚合酶与待测核酸的模板-引物复合体的引物3'端接触,所述聚合酶上的dNTP与待测核酸的序列上的碱基互补配对并在聚合酶酶促反应加入引物3'端上;所述聚合酶为Bst DNA Pol的变体,所述的Bst DNA Pol的变体的氨基酸序列如SEQ ID NO:10所示。
17.根据权利要求16所述的一种核酸的合成方法,其特征在于,所述的核酸的合成方法还包括步骤(3)使聚合酶与dNTP之间断裂;及(4)重复(1)-(3)步骤。
CN202011289898.0A 2020-11-17 2020-11-17 一种核酸测序方法 Active CN112322715B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011289898.0A CN112322715B (zh) 2020-11-17 2020-11-17 一种核酸测序方法
PCT/CN2021/129461 WO2022105640A1 (zh) 2020-11-17 2021-11-09 一种核酸测序方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011289898.0A CN112322715B (zh) 2020-11-17 2020-11-17 一种核酸测序方法

Publications (2)

Publication Number Publication Date
CN112322715A CN112322715A (zh) 2021-02-05
CN112322715B true CN112322715B (zh) 2022-11-25

Family

ID=74322615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011289898.0A Active CN112322715B (zh) 2020-11-17 2020-11-17 一种核酸测序方法

Country Status (2)

Country Link
CN (1) CN112322715B (zh)
WO (1) WO2022105640A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112322715B (zh) * 2020-11-17 2022-11-25 清华大学 一种核酸测序方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1177640A (zh) * 1996-08-06 1998-04-01 霍夫曼-拉罗奇有限公司 改进的热稳定dna聚合酶
CN106244712A (zh) * 2016-08-31 2016-12-21 北京大学 Dna测序方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7897737B2 (en) * 2006-12-05 2011-03-01 Lasergen, Inc. 3′-OH unblocked, nucleotides and nucleosides, base modified with photocleavable, terminating groups and methods for their use in DNA sequencing
US8772473B2 (en) * 2009-03-30 2014-07-08 The Regents Of The University Of California Mostly natural DNA sequencing by synthesis
US8603741B2 (en) * 2010-02-18 2013-12-10 Pacific Biosciences Of California, Inc. Single molecule sequencing with two distinct chemistry steps
CN105001292A (zh) * 2015-07-14 2015-10-28 深圳市瀚海基因生物科技有限公司 一种光可断裂的荧光标记可逆终端化合物及其在dna或rna测序中的用途
FR3052462A1 (fr) * 2016-06-14 2017-12-15 Dna Script Variants d'une adn polymerase de la famille polx
JP7058228B2 (ja) * 2016-06-24 2022-04-21 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 繋ぎ止められたヌクレオシド三リン酸を用いた核酸合成および配列決定
CN108795900B (zh) * 2017-04-27 2021-02-02 深圳华大智造科技股份有限公司 Dna聚合酶及其制备方法
WO2019051250A1 (en) * 2017-09-08 2019-03-14 Sigma-Aldrich Co. Llc SYNTHESIS OF POLYNUCLEOTIDES DEPENDING ON A MATRIX AND POLYMERASE MEDIATION
CN112322715B (zh) * 2020-11-17 2022-11-25 清华大学 一种核酸测序方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1177640A (zh) * 1996-08-06 1998-04-01 霍夫曼-拉罗奇有限公司 改进的热稳定dna聚合酶
CN106244712A (zh) * 2016-08-31 2016-12-21 北京大学 Dna测序方法

Also Published As

Publication number Publication date
WO2022105640A1 (zh) 2022-05-27
CN112322715A (zh) 2021-02-05

Similar Documents

Publication Publication Date Title
US10907196B2 (en) Coumarin compounds and their uses as fluorescent labels
CA3026019C (en) &#34;fluorescent dyes and their uses as biomarkers&#34;
US20230025669A1 (en) Secondary amine-substituted coumarin compounds and their uses as fluorescent labels
JP4558932B2 (ja) ハイブリダイゼーション及び不一致識別のための、ピラゾロ[3,4−d]ピリミジン含有オリゴヌクレオチド
JP3415627B2 (ja) 均質pcrハイブリダイゼーション系のための蛍光検出アッセイ
CN110114476B (zh) 一种基于单荧光染料的测序方法
ES2805874T3 (es) Ligación enzimática de ácidos nucleicos
US12043637B2 (en) Fluorescent dyes containing bis-boron fused heterocycles and uses in sequencing
KR20180057702A (ko) 폴리메틴 화합물 및 형광 표지로서의 이의 용도
JP2006518587A (ja) 分子タグを使用する多重分析プラットフォーム
JP2005501567A5 (zh)
EP3476830B1 (en) Polymethine compounds and their use as fluorescent labels
WO2023060858A1 (zh) 基于环境敏感染料的单色荧光mrt基因测序试剂及方法
US9156987B2 (en) Polymethine compounds and their use as fluorescent labels
JP2005517646A (ja) 核酸配列決定のためのヌクレオチド類似体およびその使用
CN112322715B (zh) 一种核酸测序方法
US20230357843A1 (en) Nucleic acid circularization and amplification on a surface
CN114286867B (zh) 一种基于发光标记物光信号动力学及二次发光信号对多核苷酸进行测序的方法
CN113748216B (zh) 一种基于自发光的单通道测序方法
WO2020093261A1 (zh) 对多核苷酸进行测序的方法
WO2020073274A1 (zh) 对多核苷酸进行测序的方法
WO2019233451A1 (zh) Dna甲基化检测探针
JPS613063A (ja) 発光物質を利用したポリヌクレオチドの測定方法
NZ748730B2 (en) Coumarin compounds and their uses as fluorescent labels
WO2024076991A2 (en) Modified enzymes and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant