KR20240024924A - 폴리머라제 돌연변이체 및 3'-oh 비차단 가역적 종결자와의 사용 - Google Patents

폴리머라제 돌연변이체 및 3'-oh 비차단 가역적 종결자와의 사용 Download PDF

Info

Publication number
KR20240024924A
KR20240024924A KR1020247001823A KR20247001823A KR20240024924A KR 20240024924 A KR20240024924 A KR 20240024924A KR 1020247001823 A KR1020247001823 A KR 1020247001823A KR 20247001823 A KR20247001823 A KR 20247001823A KR 20240024924 A KR20240024924 A KR 20240024924A
Authority
KR
South Korea
Prior art keywords
glu
lys
ile
leu
polymerase
Prior art date
Application number
KR1020247001823A
Other languages
English (en)
Inventor
미쉘 카유에트
제프리 폭스
코니 한센
홀리 호그리페
웨이동 우
Original Assignee
애질런트 테크놀로지스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 애질런트 테크놀로지스, 인크. filed Critical 애질런트 테크놀로지스, 인크.
Publication of KR20240024924A publication Critical patent/KR20240024924A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07007DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/101DNA polymerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/186Modifications characterised by incorporating a non-extendable or blocking moiety
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/155Cyclic reactions

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

변형된 뉴클레오티드를 혼입시키는 능력이 개선된, 3'-OH 비차단 가역적 종결자를 포함하는 돌연변이 폴리머라제가 제공된다. 상기 돌연변이 폴리머라제는 폴리뉴클레오티드 서열분석, 프라이머 연장 반응 및 주형-비의존적 효소적 올리고뉴클레오티드 합성과 같은 다양한 용도에 사용될 수 있다.

Description

폴리머라제 돌연변이체 및 3'-OH 비차단 가역적 종결자와의 사용
기술분야
본 발명은 돌연변이 폴리머라제, 및 폴리뉴클레오티드 서열분석, 프라이머 연장 반응 및 기타 용도를 위해 상기 돌연변이 폴리머라제를 사용하는 방법에 관한 것이다.
폴리머라제는 게놈을 복제하고 유지하기 위해 유기체에서 자연적으로 존재한다. 폴리머라제는 생명공학 분야에서 PCR 및 서열분석을 포함한 매우 다양한 용도로 활용되어 왔다. 폴리머라제는 뉴클레오티드 염기 간의 상보성을 검출하고/하거나 올리고뉴클레오티드 가닥의 구조적 특징을 인식하고, 뉴클레오티드와 가닥의 3'말단 사이의 반응을 위한 효소로 작용함으로써 DNA 또는 RNA의 복제를 가능하게 한다. 뉴클레오티드, 특히 핵산 중합에서 가역적 종결자로 작용하도록 변형된 뉴클레오티드의 혼입이 개선된 다양한 생명공학 용도를 위해 폴리머라제에 대한 필요성이 여전히 남아 있다.
종결자 DNA 폴리머라제는 패밀리 B 써모코커스 종(Family B Thermococcus sp.) 9°N-7 DNA 폴리머라제의 유도체이다. 종결자는 New England Biolabs, Inc.(미국 매사추세츠주 입스위치 소재)에서 상업적으로 이용가능하며, 그의 특성 및 용도는 최근에 문헌[Gardner, et al., "Therminator DNA Polymerase: Modified Nucleotides and Unnatural Substrates", Front. Mol. Biosci., 24 April 2019(doi.org/10.3389/fmolb.2019.00028)]에서 검토되었다.
피로코커스 퓨리오서스(Pyrococcus furiosus, Pfu)는 원래 90℃ 내지 100℃ 온도의, 지열로 가열된 해저 퇴적물로부터 단리된 고호열성(hyperthermophilic) 고세균(archaea) 종이다. 피로코커스 퓨리오서스는 폴리머라제 연쇄반응(PCR) 및 기타 생명공학 용도에 사용되어 온 패밀리 B DNA 폴리머라제를 보유하고 있다(문헌[PfuTurbo DNA Polymerase Instruction Manual, Revision G0, ⓒAgilent Technologies, Inc. 2015, 2020]; 문헌[Elshawadfy, et al., "DNA polymerase hybrids derived from the family-B enzymes of Pyrococcus furiosus and Thermococcus kodakarensis: improving performance in the polymerase chain reaction." Front Microbiol. 2014 May 27;5:224. doi: 10.3389/fmicb.2014.00224] 참조).
많은 야생형 및 돌연변이 DNA 폴리머라제가 다양한 생명공학 용도에서 사용되었거나 사용될 가능성이 있으며, 특히 변형된 뉴클레오티드를 혼입시키는 능력을 갖는 경우 더욱 그렇다. 이러한 DNA 폴리머라제는 폴리뉴클레오티드 서열분석, 클로닝, PCR 또는 기타 증폭, 단일 뉴클레오티드 다형성(SNP) 검출, 전체 게놈 증폭(WGA), 합성 생물학, 분자 진단 및 기타 용도에 유용할 수 있다.
DNA 폴리머라제의 한 가지 잠재적인 용도는 효소-매개 올리고뉴클레오티드 합성(TiEOS, T emplate- I ndependent E nzymatic O ligo S ynthesis(주형-비의존성 효소적 올리고 합성))을 위한 것이다. TiEOS는 천연 및 변형된 뉴클레오티드 둘 다로부터 긴 핵산 중합체를 생성하는 접근법이다(문헌[Jensen, et al., "Template-Independent Enzymatic Oligonucleotide Synthesis (TiEOS): Its History, Prospects, and Challenges", (2018) Biochemistry 57:1821-32] 참조). 현재의 접근법은 주형-비의존성 DNA 폴리머라제를 가역적으로 변형된 종결자와 결합시켜 주기당 단일-염기 부가로 올리고뉴클레오티드 신장(elongation)을 제어한다. TiEOS에 바람직한 효소는 말단 데옥시뉴클레오티딜 트랜스퍼라제(TdT)이다. 패밀리 X DNA 폴리머라제로 분류되는 TdT는 생체내에서 주형-비의존적 방식으로 뉴클레오티드를 부가시켜 포유동물의 항원 수용체 다양성을 증가시킨다. TdT는 100% 미만의 효율로 가역적 종결자를 혼입시키며, 이것은 생성된 합성 올리고뉴클레오티드의 길이 및 충실도를 제한한다. 현재까지, 효소적으로 합성된 최장 올리고는 조작된 패밀리 X DNA 폴리머라제를 사용한 DNA Script(99.4% 단계적 수율의 280량체(280mer))에 의해 보고되었다(문헌[Eisenstein (2020) Nature Biotechnology 38:1113-1115]; 및 미국 특허 제10,752,887호 참조). 또한, 합성에 의한 서열분석(sequencing-by-synthesis)에 사용하기 위해 개발된 가역적 종결자 중 다수는 종결기가 뉴클레오티드의 당(3'-OH 차단됨) 또는 염기(3'-OH 비차단(unblocked))에서 제거된 후에 흔적(scar) 또는 변형을 남긴다.
가역적 종결자(reversible terminator)로서 기능하도록 변형된 뉴클레오티드를 포함하여, 변형된 뉴클레오티드를 혼입시키는 개선된 능력하에 폴리뉴클레오티드 서열분석 및 기타 생명공학 용도를 위한 폴리머라제가 필요하다. 또한 높은 혼입 및 종결 효율하에 주형-비의존적 방식으로 흔적없는 가역적 종결자를 혼입시키는 효소가 필요하다.
본 발명의 한 양태로서, 돌연변이 폴리머라제가 제공된다. 돌연변이 폴리머라제는 서열번호 1과 적어도 80% 동일한 아미노산 서열을 포함하고, 또한 본원에서 확인되는 Pfu 폴리머라제의 아미노산 위치와 기능적으로 동등한 하나 이상의 위치에 하나 이상의 아미노산 돌연변이를 포함한다. 일부 실시양태에서, 폴리머라제는 Pfu 폴리머라제의 위치 486과 기능적으로 동등한 위치에 돌연변이를 포함하고/하거나, Pfu 폴리머라제의 위치 546과 기능적으로 동등한 위치에 돌연변이를 포함하고/하거나, Pfu 폴리머라제의 위치 477과 기능적으로 동등한 위치에 돌연변이를 포함한다. 예시적인 돌연변이 폴리머라제로는 서열번호 2, 서열번호 9, 서열번호 10, 서열번호 4, 또는 서열번호 5의 아미노산 서열을 포함하는 것들이 포함된다.
본 발명의 또 다른 양태로서, 본원에 기술된 바와 같은 가역적 종결자 및 돌연변이 폴리머라제를 포함하는 조성물이 제공된다. 일부 실시양태에서, 가역적 종결자는 3'-OH-비변형(unmodified) 가역적 종결자(예를 들면, 라이트닝 종결자(Lightning Terminator))이다. 예를 들어, 문헌[Weidong Wu, et al., "Termination of DNA synthesis by N6-alkylated, not 3'-O-alkylated, photocleavable 2'-deoxyadenosine triphosphates," Nucleic Acids Research, Volume 35, Issue 19, 1 October 2007, Pages 6339-6349]; 문헌[Vladislav A. Litosh, et al., "Improved nucleotide selectivity and termination of 3'-OH unblocked reversible terminators by molecular tuning of 2-nitrobenzyl alkylated HOMedU triphosphates," Nucleic Acids Research, Volume 39, Issue 6, 1 March 2011, Page e39]; 및 문헌[Brian P. Stupi, et al., "Stereochemistry of Benzylic Carbon Substitution Coupled with Ring Modification of 2-Nitrobenzyl Groups as Key Determinants for Fast-Cleaving Reversible Terminators", Angew. Chem. Int. Ed. 2012, 51, 1724 -1727]; 문헌[Andrew F. Gardner, et al., "Rapid incorporation kinetics and improved fidelity of a novel class of 3'-OH unblocked reversible terminators", Nucleic Acids Research, Volume 40, Issue 15, 1 August 2012, Pages 7404-7415]을 참조하시오.
또 다른 양태로서, 3'-OH 비차단 가역적 종결자 및 돌연변이 폴리머라제를 포함하는 조성물이 제공된다. 돌연변이 폴리머라제는 서열번호 2와 적어도 96% 동일한 아미노산 서열을 포함하고, Pfu 폴리머라제의 K477, A486 및 Y546의 아미노산 위치와 기능적으로 동등한 위치에 아미노산 돌연변이를 포함한다.
또 다른 양태로서, 핵산을 포함하는 프라이밍 가닥에 뉴클레오티드를 혼입시키는 방법이 제공된다. 상기 방법은 혼입 반응에 충분한 조건 하에서 프라이밍 가닥을 뉴클레오티드 및 돌연변이 폴리머라제와 접촉시키는 것을 포함한다. 돌연변이 폴리머라제는 서열번호 2와 적어도 96% 동일한 아미노산 서열을 포함하고, Pfu 폴리머라제의 K477, A486 및 Y546의 아미노산 위치와 기능적으로 동등한 위치에 아미노산 돌연변이를 포함한다.
본 발명의 또 다른 양태는 폴리뉴클레오티드 서열분석 방법에 관한 것이다. 상기 방법은 다음을 포함한다: (a) 주형 및 프라이밍 가닥을 포함하는 이중체(dupelx)를 형성하는 단계(이때, 주형은 서열분석될 표적 핵산 및 프라이밍 가닥의 적어도 일부에 상보적인 프라이머 결합 부위를 포함함); (b) 프라이밍 가닥을 가역적 종결자 뉴클레오티드 및 돌연변이 폴리머라제와 결합시키는 단계(이때, 상기 돌연변이 폴리머라제는 서열번호 2와 적어도 96% 동일한 아미노산 서열을 포함하고, Pfu 폴리머라제의 K477, A486 및 Y546의 아미노산 위치와 기능적으로 동등한 위치에 아미노산 돌연변이를 포함함); (c) 주형-의존적 반응으로 프라이밍 가닥의 3'-말단에 가역적 종결자를 혼입시키는 단계; 및 (d) 혼입된 가역적 종결자 뉴클레오티드를 식별하여, 주형의 서열을 결정하는 단계.
본 발명의 또 다른 양태로서, 프라이밍 가닥, 3'-OH 비차단 가역적 종결자 및 돌연변이 폴리머라제를 포함하는 조성물이 제공된다. 돌연변이 폴리머라제는 서열번호 1과 적어도 80%(대안적으로, 적어도 85%, 90% 또는 95%) 동일한 아미노산 서열을 포함한다. 돌연변이 폴리머라제는 Pfu 폴리머라제의 위치 L270, E330, Q332, L333, L409, P451, L453, L457, E476, L489, L490, N492, F494, Y497 및 E581과 기능적으로 동등한 위치에 하나 이상의 돌연변이를 추가로 포함한다. 돌연변이 폴리머라제는 서열번호 11의 DNA 폴리머라제의 혼입 활성보다 적어도 4배 더 높은 혼입 활성을 갖는다.
또 다른 양태로서, 3'-OH-비변형 가역적 종결자를 프라이밍 가닥에 혼입시키는 방법이 제공된다. 상기 방법은 혼입 반응에 충분한 조건 하에서 프라이밍 가닥을 3'-OH-비변형 가역적 종결자 및 돌연변이 폴리머라제와 접촉시키는 것을 포함한다. 돌연변이 폴리머라제는 서열번호 1과 적어도 80% 동일한 아미노산 서열 및 Pfu 폴리머라제의 위치 L270, E330, Q332, L333, L409, P451, L453, L457, E476, L489, L490, N492, F494, Y497 및 E581과 기능적으로 동등한 위치에 하나 이상의 돌연변이를 포함한다. 상기 방법은 또한 프라이밍 가닥의 3'-말단에 3'-OH-비변형 가역적 종결자를 혼입시키는 것을 포함한다.
또 다른 양태로서, 프라이밍 가닥, 3'-OH-비변형 가역적 종결자 및 돌연변이 폴리머라제를 포함하는 조성물이 제공된다. 돌연변이 폴리머라제는 서열번호 2와 적어도 96% 동일하며, Pfu 폴리머라제의 위치 546과 기능적으로 동등한 위치에 Y546H 돌연변이; Pfu 폴리머라제의 위치 409와 기능적으로 동등한 위치에 L409Y, L409H 또는 L409F 돌연변이; 및 Pfu 폴리머라제의 위치 486과 기능적으로 동등한 위치에 A486X 돌연변이(이때, X는 알라닌을 제외한 임의의 아미노산임)를 포함한다.
본 발명의 또 다른 양태로서, 주형-비의존적 반응으로 단일 뉴클레오티드를 프라이밍 가닥에 혼입시키는 방법이 제공된다. 상기 방법은 프라이밍 가닥을 3'-OH-비변형 가역적 종결자 및 돌연변이 폴리머라제와 결합시키는 것을 포함한다. 돌연변이 폴리머라제는 서열번호 2와 적어도 96% 동일하며, Pfu 폴리머라제의 위치 546과 기능적으로 동등한 위치에 Y546H 돌연변이; Pfu 폴리머라제의 위치 409와 기능적으로 동등한 위치에 L409Y, L409H 또는 L409F 돌연변이; 및 Pfu 폴리머라제의 위치 486과 기능적으로 동등한 위치에 A486X 돌연변이(이때, X는 알라닌을 제외한 임의의 아미노산임)를 포함한다. 종결자의 혼입은 서열번호 11의 돌연변이 DNA 폴리머라제에 대한 것보다 적어도 2배(대안적으로, 4배 또는 10배) 더 높다.
또 다른 양태로서, 3'-OH 주형-비의존적 올리고뉴클레오티드 합성 방법이 제공된다. 상기 방법은 프라이밍 가닥, 3'-OH-비변형 가역적 종결자 및 돌연변이 DNA 폴리머라제를 결합시키는 것을 포함한다. 돌연변이 DNA 폴리머라제는 서열번호 2와 적어도 96% 동일한 아미노산 서열; Pfu 폴리머라제의 위치 546과 기능적으로 동등한 위치에 히스티딘으로의 Y546H 돌연변이; Pfu 폴리머라제의 위치 409와 기능적으로 동등한 위치에 L409Y, L409H 또는 L409F 돌연변이; 및 Pfu 폴리머라제의 위치 486과 기능적으로 동등한 위치에 A486X 돌연변이(이때, X는 알라닌을 제외한 임의의 아미노산임)를 포함한다. 상기 방법은 또한 3'-OH 비차단 비변형 가역적 종결자를 프라이밍 가닥에 혼입시키는 것을 포함한다.
본 발명의 방법 및 조성물의 상기 및 기타 특징 및 이점들은 첨부된 청구범위와 함께 하기 상세한 설명으로부터 명백해질 것이다.
도 1a는 DNA 서열분석에 사용되는, 5-하이드록실메틸우라실 염기 및 부착된 염료를 갖는 가역적 (3'-OH 비차단) 라이트닝 종결자를 예시한다. 도 1b 및 1c는 3-OH 차단된 종결자와 비변형-3-OH 종결자(본 개시내용에 사용됨) 사이의 개념 차이를 보여준다. 도 1d는 천연 dATP를 보여준다. 도 1e 및 1f는 3'-OH 비차단 가역적 종결자를 사용한 TiEOS에 사용되는 가역적 dATP 종결자를 보여준다. 도 1e("LTA-1")는 아데노신의 N6 위치에서 니트로벤질 모이어티로 변형된다. 도 1f("LTA-2")는 7-하이드록실메틸-7-데아자-데옥시아데노신의 α-3급-부틸 니트로벤질 모이어티로 변형되고, 선택적으로 트라이포스페이트 모이어티의 α-티오 변형으로 변형된다.
도 2는 실시예 4의 돌연변이 키메라 폴리머라제를 사용한 서열분석으로부터의 서열분석 측정기준(metrics)을 보여준다. Pfu A486L/Y546H DNA 폴리머라제("대조군", Pfu 2)의 다음 도메인들은 9°N DNA 폴리머라제의 상응하는 분절들로 치환되었다: A-1-99 ; B-100-199; C-400-449; 및 D-(500-599에 걸쳐 있는 20-40 아미노산의 4개 분절). 도메인 D의 경우, ARL 및 L+L은 4개의 서브-키메라 폴리머라제에 의해 나타나는 평균값으로 표현된다.
도 3은 가역적 종결자(LTA)의 혼입에 대한 Pfu 폴리머라제의 위치 486에 돌연변이를 갖는 돌연변이 폴리머라제의 활성을 보여준다.
도 4a 및 4b는 가역적 종결자(LTA)의 혼입에 대한 실시예 5에서 시험된 다양한 F494X 돌연변이 폴리머라제의 활성을 보여준다.
도 5는 실시예 6에서 천연 뉴클레오티드로 시험된 다양한 돌연변이 폴리머라제의 활성을 보여준다.
도 6은 실시예 6에서 시험된 다양한 돌연변이 폴리머라제에 의한 가역적 종결자의 상대적 혼입을 보여준다.
도 7a 및 7b는 실시예 6에서 시험된 Y546X 돌연변이체(A486L 비함유)에 의한 가역적 종결자의 혼입이 결여됨을 보여준다.
도 8은 돌연변이 폴리머라제와 변형된 뉴클레오티드 사이의 상호작용 모델을 예시한다.
도 9a 내지 9c는 실시예 7에서 상업적으로 이용가능한 TdT(Promega) 제제 및 다양한 돌연변이 폴리머라제에 의한 천연 dATP의 주형-비의존적 혼입에 대한 측정결과를 보여준다.
도 10a 내지 10e는 실시예 8에서 상업적으로 이용가능한 TdT(Promega) 제제 및 다양한 돌연변이 폴리머라제에 의한 프라이밍 가닥에 대한 가역적 종결자의 주형-비의존적 혼입에 대한 측정결과를 보여준다.
도 11a 내지 11f는 실시예 9에서 상업적으로 이용가능한 TdT(Promega) 제제에 의한 가역적 종결자의 주형-비의존적 혼입에 대한 측정결과를 보여준다.
도 12a 및 12b는 실시예 9에서 돌연변이 폴리머라제(Pfu26)에 의한 프라이밍 가닥에 대한 가역적 종결자의 주형-비의존적 혼입에 대한 측정결과를 보여준다.
도 13a 내지 13c는 실시예 10에서 돌연변이 폴리머라제(Pfu26)에 의한 3'-OH 비차단 가역적 종결자(LTA-2)의 다주기(multi-cycle) 부가에 대한 측정결과를 보여준다.
본 교시내용은 첨부된 도면과 함께 읽을 때 하기 상세한 설명으로부터 가장 잘 이해된다. 특징들은 반드시 일정한 비율로 도시되는 것은 아니다.
본 개시내용은 라이트닝 종결자와 같은 3'-OH 비차단 가역적 종결자 뉴클레오티드의 개선된 혼입을 위한 돌연변이 폴리머라제를 제공한다. 본 발명자들은 놀랍게도, 가역적 종결자의 개선된 혼입을 나타내고, 개선된 서열분석 성능 및 더 낮은 DNA 결합 친화도와 같은 다수의 다른 관련 이점을 갖는 특정 돌연변이 폴리머라제를 확인하였다.
본 개시내용은 또한 본원에 기술된 돌연변이 폴리머라제를 암호화하는 핵산 분자를 제공한다. 이러한 핵산 분자는 코돈과 아미노산 사이의 공지된 대응성을 기준으로 본원에 개시된 아미노산 서열에 기반하여 쉽게 구상될 수 있다. 본 개시내용은 또한 이러한 핵산 분자를 포함하는 발현 벡터를 제공한다. 본 개시내용은 또한 이러한 발현 벡터를 포함하는 숙주 세포를 제공한다.
본 개시내용은 또한 하나 이상의 가역적 종결자 뉴클레오티드를, 뉴클레오티드의 혼입 지점으로 작용하고 그의 3' 말단으로부터 연장될 수 있는 프라이밍 가닥에 혼입시키는 방법을 제공한다. 상기 방법은 다음의 구성요소가 상호작용하도록 하는 것을 포함한다: (i) 본원에 기술된 바와 같은 돌연변이 폴리머라제, (ii) 프라이밍 가닥; 및 (iii) 라이트닝 종결자와 같은 가역적 종결자를 포함하는 뉴클레오티드 용액.
본 개시내용은 또한 본원에 기술된 바와 같은 돌연변이 폴리머라제 및 뉴클레오티드 용액을 포함하는 뉴클레오티드 혼입 반응을 수행하기 위한 키트를 제공한다. 일부 실시양태에서, 뉴클레오티드 용액은 3'-OH 비차단 가역적 종결자를 포함한다.
본원에 기술된 돌연변이 폴리머라제는 변형된 뉴클레오티드, 특히 3'-OH 비차단 가역적 종결자의 혼입을 위해 개선된다. 본 발명자들은 가역적 종결자의 개선된 혼입을 나타내고 합성에 의한 서열분석 반응에서 더 낮은 DNA 결합 친화도 및 개선된 서열분석 측정기준을 포함하여 다수의 다른 관련 이점을 갖는 특정 돌연변이 폴리머라제를 확인하였다. 결합 친화도가 낮을수록 돌연변이 폴리머라제가 연장된 1차 가닥과 연장되지 않은 1차 가닥 사이를 빠르게 순환할 수 있으며, 이는 더 높은 친화도를 갖는 폴리머라제에 비해 더 높은 혼입 효율을 제공할 것으로 예상된다.
하기에 더 상세히 기술된 바와 같이, 폴리머라제의 하나 이상의 잔기에 대한 하나 이상의 돌연변이가 전환율(turnover rate)의 상당한 증가 및 가파이로인산분해(pyrophosphorolysis)의 감소를 야기하는 것으로 밝혀졌다. 이러한 돌연변이 폴리머라제는 합성에 의한 DNA 서열분석(SBS)의 성능이 개선되고, 페이징(phasing) 및/또는 프리-페이징(pre-phasing)이 감소되며 합성에 의한 서열분석 반응에서 품질 측정기준이 전체적으로 개선된다. "페이징"은 서열분석 주기 동안 해당 클러스터 내의 일부 가닥에 뉴클레오티드를 혼입하지 못함으로 인해 SBS 동안 클러스터 내에서의 동시성(synchronicity)의 손실을 의미한다. "프리-페이징"은 효과적인 3' 종결자가 없는 뉴클레오티드가 일부 가닥에 혼입되어 클러스터 결과보다 1주기 앞서 진행되게 하는 SBS 클러스터의 상황을 지칭한다.
일부 실시양태에서, 돌연변이 폴리머라제는 서열번호 1과 적어도 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 재조합 DNA 폴리머라제는 Pfu DNA 폴리머라제 아미노산 서열의 특정 위치와 기능적으로 동등한 하나 이상의 위치에 하나 이상의 아미노산 돌연변이를 포함한다. 야생형 Pfu DNA 폴리머라제 아미노산 서열은 서열번호 1에 제시되어 있다.
일부 실시양태에서, 본 발명의 돌연변이 폴리머라제는 서열번호 1과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 또한 Pfu 폴리머라제의 409, 477, 486 또는 546의 아미노산 위치 잔기와 기능적으로 동등한 하나 이상의 위치에 하나 이상의 아미노산 돌연변이를 포함한다. 일부 실시양태에서, 폴리머라제는 Pfu 폴리머라제의 위치 486과 기능적으로 동등한 위치에 돌연변이를 포함하고, Pfu 폴리머라제의 위치 546과 기능적으로 동등한 위치에 돌연변이를 추가로 포함할 수 있으며, Pfu 폴리머라제의 위치 477과 기능적으로 동등한 위치에 돌연변이를 추가로 포함할 수 있다. 일부 실시양태에서, 돌연변이 폴리머라제는 서열번호 2와 적어도 96% 동일하고, 돌연변이 A486X를 포함하며, 이때, X는 알라닌을 제외한 임의의 아미노산일 수 있다. 예를 들어, 돌연변이 폴리머라제는 돌연변이 Y546H, K477W 및 A486X를 갖는 서열번호 1의 아미노산 서열을 포함할 수 있으며, 이때, X는 알라닌을 제외한 임의의 아미노산일 수 있다. 일부 실시양태에서, 돌연변이 폴리머라제는 또한 돌연변이 D141A 및 E143A를 포함한다.
일부 실시양태에서, 돌연변이 폴리머라제는 Pfu 폴리머라제의 위치 270, 330, 332, 333, 409, 451, 453, 457, 476, 489, 490, 492, 494, 497 및 581과 기능적으로 동등한 위치에 하나 이상의 돌연변이를 추가로 포함한다. 일부 실시양태에서, 돌연변이 폴리머라제는 Pfu 폴리머라제의 위치 266, 267, 268, 269, 329, 336, 399, 400, 403, 404, 407, 408, 410, 411, 450, 452, 455, 456, 458, 459, 460, 461, 462, 463, 464, 465, 466, 475, 477, 478, 479, 480, 481, 482, 483, 485, 487, 488, 491, 493, 495, 496, 498, 499, 500, 515, 522, 545, 546, 577, 579, 580, 582, 584, 591, 595, 603, 606, 607, 608, 612, 613, 614, 664, 665, 666, 668, 669, 674, 675 및 676과 기능적으로 동등한 임의의 위치에 돌연변이를 포함하지 않는다.
전술한 돌연변이 폴리머라제는 3' 차단된 뉴클레오티드의 존재 하에서 및/또는 DNA 서열분석 용도에서 폴리머라제 활성의 하나 이상의 양태를 개선시키는 것으로 알려진 추가의 돌연변이를 포함할 수 있다.
일부 실시양태에서, 돌연변이 폴리머라제는 야생형 폴리머라제와 비교하여 감소된 엑소뉴클레아제 활성을 포함한다. 예를 들어, 돌연변이 폴리머라제는 9°N DNA 폴리머라제의 아미노산 서열에서 Asp141 및/또는 Glu143과 기능적으로 동등한 위치에 돌연변이를 포함할 수 있다.
일부 실시양태에서, 돌연변이 폴리머라제는 내부 메티오닌을 제거하기 위한 추가적인 돌연변이를 포함할 수 있다. 예를 들어, 일부 실시양태에서, 돌연변이 폴리머라제는 Pfu 및 9°N DNA 폴리머라제 아미노산 서열에서 Met129와 기능적으로 동등한 위치에 상이한 아미노산으로의 돌연변이를 포함한다. 일부 실시양태에서, 돌연변이 폴리머라제는 Pfu 및 9°N DNA 폴리머라제의 아미노산 서열에서 Met129Ala와 기능적으로 동일한 돌연변이를 포함한다.
일부 실시양태에서, 돌연변이는 비극성 측쇄를 갖는 잔기에 대한 돌연변이를 포함한다. 비극성 측쇄를 갖는 아미노산은 당해 분야에 잘 알려져 있으며, 예를 들어, 알라닌, 시스테인, 글리신, 이소류신, 류신, 메티오닌, 페닐알라닌, 프롤린, 트립토판, 티로신 및 발린을 포함한다.
일부 실시양태에서, 돌연변이는 극성 측쇄를 갖는 잔기에 대한 돌연변이를 포함한다. 극성 측쇄를 갖는 아미노산은 당해 분야에 잘 알려져 있으며, 예를 들어, 아르기닌, 아스파라긴, 아스파트산, 글루타민, 글루탐산, 히스티딘, 라이신, 세린 및 트레오닌을 포함한다.
일부 실시양태에서, 돌연변이는 소수성 측쇄를 갖는 잔기에 대한 돌연변이를 포함한다. 소수성 측쇄를 갖는 아미노산은 당해 분야에 잘 알려져 있으며, 예를 들어, 글리신, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌 및 트립토판을 포함한다.
일부 실시양태에서, 돌연변이는 전하를 띠지 않은 측쇄를 갖는 잔기에 대한 돌연변이를 포함한다. 전하를 띠지 않은 측쇄를 갖는 아미노산은 당해 분야에 잘 알려져 있으며, 예를 들어, 글리신, 세린, 시스테인, 아스파라긴, 글루타민, 티로신 및 트레오닌을 포함한다.
일부 실시양태에서, 돌연변이 폴리머라제는 DNA 폴리머라제의 유도체이다. 일부 실시양태에서, DNA 폴리머라제는 고세균 DNA 폴리머라제가다. 일부 실시양태에서, DNA 폴리머라제는 패밀리 B DNA 폴리머라제이다. 패밀리 B 고세균 DNA 폴리머라제는 아레지 등(Arezi et al.)의 미국 특허 공개 번호 20030228616호의 개시내용에 의해 예시된 바와 같이 당해 분야에 공지되어 있다. 일부 실시양태에서, 고세균 DNA 폴리머라제는 고호열성 고세균으로부터 유래되며, 이는 폴리머라제가 종종 열안정성이라는 것을 의미한다. 따라서, 추가의 바람직한 실시양태에서, 돌연변이 폴리머라제는 Vent, Deep Vent, 9°N 및 Pfu 폴리머라제로부터 선택된 DNA 폴리머라제로부터 유래된다. Vent 및 Deep Vent는 고호열성 고세균인 써모코커스 리토랄리스(Thermococcus litoralis) 및 피로코커스 종 GB-D 각각으로부터 단리된 패밀리 B DNA 폴리머라제에 사용되는 상품명이다. 9°N 폴리머라제는 또한 독특한 써모코커스 종(T. sp . 9°N)에서도 단리되었다. 상기에서 논의한 바와 같이, Pfu 폴리머라제는 피로코커스 퓨리오서스(Pyrococcus furiosus)로부터 단리되었다. 일부 실시양태에서, 본 발명의 돌연변이 폴리머라제는 피로코커스 폴리머라제 또는 써모코커스 폴리머라제의 유도체이다.
일부 실시양태에서, 패밀리 B 고세균 DNA 폴리머라제는, 예를 들어, 써모코커스, 피로코커스 또는 메타노코커스(Methanococcus) 속과 같은 속으로부터 유래된다. 써모코커스 속의 구성원으로는 써모코커스 4557, 써모코커스 바로필루스(Thermococcus barophilus), 써모코커스 감마톨레란스(Thermococcus gammatolerans), 써모코커스 온누리네우스(Thermococcus onnurineus), 써모코커스 시비리쿠스(Thermococcus sibiricus), 써모코커스 코다카렌시스(Thermococcus kodakarensis), 써모코커스 고르고나리우스(Thermococcus gorgonarius)가 포함되지만, 이로 제한되지는 않는다. 피로코커스 속의 구성원으로는 피로코커스 NA2, 피로코커스 아비시(Pyrococcus abyssi), 피로코커스 퓨리오서스(Pyrococcus furiosus), 피로코커스 호리코시(Pyrococcus horikoshii), 피로코커스 야야노시(Pyrococcus yayanosii), 피로코커스 엔데아보리(Pyrococcus endeavori), 피로코커스 글리코보란스(Pyrococcus glycovorans), 피로코커스 워세이(Pyrococcus woesei)가 포함되지만, 이로 제한되지는 않는다. 메타노코커스 속의 구성원으로는 메타노코코커스 에올리쿠스(Methanococcus aeolicus), 메타노코커스 마리팔루디스(Methanococcus maripaludis), 메타노코커스 반니엘리(Methanococcus vannielii), 메타노코커스 볼타에(Methanococcus voltae), 메타노코커스 써모리쏘트로피쿠스(Methanococcus thermolithotrophicus) 및 메타노코커스 잔나쉬(Methanococcus jannaschii)가 포함되지만, 이로 제한되지는 않는다.
예를 들어, 폴리머라제는 Vent, Deep Vent, 9°N 및 Pfu 폴리머라제로 이루어진 군에서 선택될 수 있다. 일부 실시양태에서, 패밀리 B 고세균 DNA 폴리머라제는 Pfu 폴리머라제이다. Pfu 폴리머라제에 관한 추가 정보는 미국 특허 제5,789,166호; 제5,932,419호; 제5,948,663호; 제6,183,997호; 제6,391,548호; 제6,444,428호; 제6,734,293호; 제7,132,265호; 및 제7,176,004호에서 찾을 수 있다. 균주 GB-D로부터의 "Deep Vent"(Q51334) 및 Pwo DNA 폴리머라제와 같은 피로코커스 균주의 다른 폴리머라제도 또한 사용할 수 있다.
전문용어
본원에 사용된 전문용어는 단지 특정한 실시양태를 설명하기 위한 것이며 제한하려는 의도가 아니라는 것을 이해해야 한다. 정의된 용어는 본 교시내용의 기술 분야에서 일반적으로 이해되고 수용되는 정의된 용어의 기술적 및 과학적 의미에 추가된다.
용어 "핵산" 및 "폴리뉴클레오티드"는 뉴클레오티드, 예를 들어, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드, 또는 2개의 천연 핵산과 유사한 서열 특이적 방식으로 천연 핵산과 하이브리드화될 수 있는, 예를 들어, 왓슨-크릭(Watson-Crick) 염기쌍 상호작용에 참여할 수 있는 합성에 의해 생성된 화합물로 이루어진, 임의의 길이, 예를 들어, 약 10개 염기 초과, 약 100개 염기 초과, 약 500개 염기 초과, 1000개 염기 초과, 약 10,000개 이상의 염기까지의 중합체를 설명하기 위해 본원에서 상호교환적으로 사용된다. 천연 뉴클레오티드에는 구아닌, 시토신, 아데닌, 티민 및 우라실(각각 G, C, A, T 및 U)이 포함된다.
본원에 정의된 바와 같은 용어 "뉴클레오시드"는 1' 위치 또는 동등한 위치에서 당 또는 당 대체물, 예를 들면, 카보사이클릭 또는 비사이클릭 링커에 연결된 퓨린, 데아자퓨린 또는 피리미딘 염기를 포함하는 화합물이며, 2'-데옥시 및 2'-하이드록실, 2',3'-디데옥시 형태뿐 아니라 기타 치환을 포함한다.
본원에 사용된 바와 같은 용어 "뉴클레오시드 폴리포스페이트"는 2개 이상의 포스페이트 기를 갖는 뉴클레오시드의 포스페이트 에스테르를 지칭한다. 데옥시아데노신 트라이포스페이트는 뉴클레오시드 폴리포스페이트의 한 예이다. 뉴클레오시드 폴리포스페이트는 말단 포스페이트 또는 내부 포스페이트에 부착된 화학적 기를 함유할 수 있다. 예를 들어, 뉴클레오시드 폴리포스페이트는 폴리포스페이트 쇄의 말단 포스페이트 또는 내부 포스페이트에 부착된 전기화학적 표지, 질량 태그, 전하 차단 표지 또는 발색성 표지, 화학발광 표지, 형광 염료 또는 형광 소광 표지를 갖는 분자를 포함할 수 있다. 표지로 사용될 수 있는 화학적 기의 추가적인 예로는 발색단, 효소, 항원, 중금속, 자기 프로브, 인광성 기, 방사성 물질, 산란 또는 형광 나노입자, 라만(Raman) 신호 생성 모이어티 및 전기화학적 검출 모이어티가 포함된다. 추가로, 본원에 사용된 바와 같은 용어 "뉴클레오시드 폴리포스페이트"는 황 원자, 이미도 기 또는 포스페이트 쇄에 대한 다른 변형을 포함할 수 있는, 뉴클레오시드의 포스페이트 에스테르를 지칭한다.
본원에 사용된 바와 같은 용어 "뉴클레오티드"는 뉴클레오시드의 포스페이트 에스테르를 지칭하며, 이때, 에스테르화 부위는 전형적으로 오탄당 당 또는 당 대체물의 C-5 위치에 부착된 하이드록실 기에 해당한다. 일부 경우에서, 뉴클레오티드는 뉴클레오시드 폴리포스페이트를 포함한다. 그러나, "부가 뉴클레오티드", "혼입된 뉴클레오티드", "부가된 뉴클레오티드" 및 "혼입 후 뉴클레오티드"라는 용어는 모두 올리고뉴클레오티드 또는 폴리뉴클레오티드 쇄의 일부인 뉴클레오티드 잔기를 지칭한다.
용어 "뉴클레오시드", "뉴클레오티드", "데옥시뉴클레오시드" 및 "데옥시뉴클레오티드"는 공지된 퓨린 및 피리미딘 염기뿐만 아니라 변형된 다른 헤테로사이클릭 염기도 함유하는 모이어티를 포함하도록 의도된다. 이러한 변형에는 메틸화 퓨린 또는 피리미딘, 아실화 퓨린 또는 피리미딘, 알킬화 리보스 또는 기타 헤테로사이클이 포함된다. 또한, "뉴클레오시드", "뉴클레오티드", "데옥시뉴클레오시드" 및 "데옥시뉴클레오티드"에는 통상적인 리보스 및 데옥시리보스 당뿐만 아니라 다른 당도 함유하는 모이어티가 포함된다. 변형된 뉴클레오시드, 뉴클레오티드, 데옥시뉴클레오시드 또는 데옥시뉴클레오티드는 또한 당 모이어티에 대한 변형을 포함하며, 예를 들어, 이때, 하나 이상의 하이드록실 기는 할로겐 원자 또는 지방족 기로 대체되거나 에테르, 아민 등으로 작용화된다.
천연 뉴클레오티드 또는 뉴클레오시드는 본원에서 아데노신(A), 티미딘(T), 구아노신(G), 시티딘(C) 및 우리딘(U)으로 정의된다. 이들 뉴클레오티드 또는 뉴클레오시드의 특정 변형은 자연에서 발생하는 것으로 인식된다. 그러나, 수소 결합된 염기쌍 형성에 영향을 미치는, 자연에서 발생하는 A, T, G 및 C의 변형은 비자연적으로 발생하는 것으로 간주된다. 예를 들어, 2-아미노아데노신은 자연에서 발견되지만, 상기 용어가 본원에서 사용되는 바와 같이 "천연" 뉴클레오티드 또는 뉴클레오시드는 아니다. 염기쌍 형성에 영향을 미치지 않는 자연적으로 발생하고 자연적으로 발생하는 것으로 간주되는 변형된 뉴클레오티드 또는 뉴클레오시드의 다른 비제한적 예는 5-메틸시토신, 3-메틸아데닌, O(6)-메틸구아닌 및 8-옥소구아닌 등이다. 뉴클레오티드에는 천연이든 합성이든 임의의 뉴클레오티드 또는 뉴클레오티드 유사체가 포함된다.
"상보적인", "상보성" 또는 "상보적인 핵산 서열"이라는 용어는 왓슨-크릭 염기쌍 형성 규칙에 의해 또 다른 핵산 가닥의 염기 서열과 관련된 핵산 가닥을 지칭한다. 일반적으로, 하나의 서열이 역평행 센스가닥(anti-parallel sense)중 다른 것의 서열에 하이브리드화될 수 있을 때 두 서열은 상보적이며, 이때, 각 서열의 3'-말단은 다른 서열의 5'-말단에 하이브리드화되고 이어서 한 서열의 A, T, G, 및 C는 각각 다른 서열의 T, A, C, 및 G 각각과 정렬된다.
용어 "이중체(duplex)"는 완전히 또는 부분적으로 상보적인 적어도 2개의 서열이 그의 뉴클레오티드 전부 또는 대부분 사이에서 왓슨-크릭 유형 염기 쌍을 이루어 안정한 복합체가 형성되는 것을 의미한다. "어닐링" 및 "하이브리드화"라는 용어는 안정한 이중체의 형성을 의미하기 위해 상호교환적으로 사용된다.
뉴클레오티드 서열과 관련하여, 용어 "하이브리드화" 및 "하이브리드화되는"은 본원에서 상호교환적으로 사용된다. 2개의 뉴클레오티드 서열이 서로 하이브리드화되는 능력은 2개의 뉴클레오티드 서열의 상보성 정도를 기반으로 하며, 이는 결국 일치하는 상보성 뉴클레오티드 쌍의 분획에 기반한다. 주어진 서열에서 또 다른 서열에 상보적인 뉴클레오티드가 많을수록 하이브리드화에 대한 조건이 더 엄격해질 수 있으며, 두 서열의 하이브리드화가 더 특이적일 것이다. 온도를 높이고 공용매의 비율을 높이며 염 농도를 낮추는 등에 의해 엄격도를 높일 수 있다.
"프라이밍 가닥"이라는 용어는 뉴클레오티드 혼입 지점으로 작용할 수 있고 그의 3' 말단에서 연장될 수 있는, 효소적으로 제조되거나 합성된 핵산을 의미한다. 일부 실시양태에서, 프라이밍 가닥은 주형과 이중체를 형성하는 프라이머이며, 주형에 상보적인 뉴클레오티드를 혼입하여 주형을 따라 그의 3' 말단에서 연장되고; 연장 과정 동안 부가된 뉴클레오티드의 서열은 주형 폴리뉴클레오티드의 서열에 의해 결정된다. 일부 실시양태에서, 프라이밍 가닥은 단일-염기 연장 반응 또는 분석, 또는 주형-비의존적 올리고뉴클레오티드 합성을 위한 혼입 지점으로 작용할 수 있는 핵산이다. 프라이밍 가닥은 DNA 폴리머라제, RNA 폴리머라제 또는 역전사효소에 의해 촉매화되는 뉴클레오티드 혼입의 시작점 역할을 한다. 프라이밍 가닥은 길이가 2 내지 1000개 염기 이상, 예를 들어, 10 내지 500개 염기일 수 있다.
"주형"이라는 용어는 왓슨-크릭 염기쌍 형성 규칙에 따라 주형에 상보적인 핵산 분자의 합성을 유도하기 위해 핵산 폴리머라제에 의해 사용될 수 있는 핵산 분자를 의미한다. 예를 들어, DNA 폴리머라제는 DNA를 활용하여 주형 DNA 가닥에 상보적인 서열을 갖는 또 다른 DNA 분자를 합성하였다. RNA 폴리머라제는 DNA를 주형으로 활용하여 DNA 주형의 가닥에 상보적인 서열을 갖는 RNA의 합성을 유도한다. DNA 역전사효소는 RNA를 활용하여 RNA 주형의 가닥에 상보적인 서열을 갖는 DNA의 합성을 유도한다.
"프라이머 연장 조건"이라는 어구는 주형 가닥을 주형으로 사용하여 프라이머 분자의 말단에 뉴클레오티드를 부가함으로써 폴리머라제 매개 프라이머 연장을 허용하는 조건을 의미한다.
"단일-염기 연장"이라는 어구는 단일 가역적 종결자 뉴클레오티드가 프라이밍 가닥에 혼입되는 절차를 지칭한다. 본 발명의 방법 및 조성물은 단일-염기 연장 분석에 사용될 수 있으며, 이는 핵산을 따라 특정 위치에 있는 뉴클레오티드 염기의 정체를 결정하는 데 사용될 수 있다. 예를 들어, 단일-염기 연장 분석을 사용하여 단일-뉴클레오티드 다형성(SNP)을 식별하거나 DNA 메틸화 수준을 측정할 수 있다.
프라이머가 특정 핵산 주형에 "상응"하거나 "대응"하는 경우, 프라이머 염기쌍은 해당 핵산 주형과 쌍을 이루게 된다. 즉, 특이적으로 하이브리드화된다. 하기에서 더 상세히 논의되는 바와 같이, 특정 핵산 주형에 대한 프라이머 및 특정 핵산 주형 또는 그 보체는 통상적으로 서열이 동일한 하나 이상의 인접 뉴클레오티드 영역을 함유한다.
용어 "종결자" 및 "종결자 뉴클레오티드"는 상호교환적으로 사용되며, 폴리머라제에 의한 뉴클레오티드 부가를 위한 기질로서 역할을 할 수 없거나 그렇지 않으면 연장에 저항하는 뉴클레오티드를 지칭한다. 디데옥시뉴클레오티드, 3' 아지도 뉴클레오티드 및 3' 아미노 뉴클레오티드는 종결자 뉴클레오티드의 예이지만, 다른 것들도 많이 알려져 있다. 다른 비제한적인 예로는 3'-포스페이트 표지된 뉴클레오티드 또는 실제 종결자 뉴클레오티드가 포함된다.
"가역적 종결자"라는 용어는 뉴클레오티드 부가를 위한 기질로서 역할을 할 수 없거나 연장에 대한 저항성이 역전되도록 구성된 종결자 뉴클레오티드를 지칭한다. 예를 들어, 가역적 종결자는 뉴클레오티드가 폴리머라제의 기질로 이용될 수 있도록 제거될 수 있는 차단 모이어티를 가질 수 있다. 일부 경우에서, 차단 모이어티는 뉴클레오티드의 당의 3'-OH 위치에 있고, 상기 뉴클레오티드는 "3'-OH 차단된 뉴클레오티드"로 지칭되며, 차단 모이어티를 제거하면 3'-OH가 생성된다.
대안적으로, 일부 가역적 종결자는 당의 3'-OH 위치에 차단 모이어티를 갖지 않으며, 이러한 종결자는 본원에서 3'-OH 비차단 가역적 종결자로 지칭된다. 라이트닝 종결자는 3'-OH 비차단 가역적 종결자의 한 예이며, 이때, 뉴클레오티드는 리보스 모이어티의 유리 3'-OH 및 퓨린(C7) 또는 피리미딘(C5) 염기에 부착된 광절단성 차단 기를 특징으로 한다. 도 1a, 1e 및 1f는 라이트닝 종결자의 예를 예시한다. 일부 실시양태에서, 3'-OH 비차단 가역적 종결자는 광절단성 차단 기를 포함한다. 상기 가역적 종결자는 가닥에 혼입될 수 있지만 일정 기간 동안 연장이 차단된다. 차단이 해제된 후에, 상기 종결자는 프라이머 연장 반응에서 연장이 가능해진다. 광절단성 차단 기를 포함하는 3'-OH 비차단 가역적 종결자는, 차단되지 않고 자외선 또는 다른 광절단 기술에 노출됨으로써 활성화될 때까지 PCR 증폭에 대해 실질적으로 불활성이다. 매우 다양한 광절단성 차단 기들이 미국 특허 제8,969,535호; 제9,200,319호; 및 제10,041,115호에 기술된 바와 같은 후기 단계 프라이머에 포함될 수 있다. 일부 실시양태에서, 광절단성 차단 기는 약 90% 내지 약 100%의 차단 효율을 갖는다.
광절단성 차단 기는 DNA 합성을 가역적으로 차단 및 종료시킨 후, 자외선에 노출됨으로써 효율적으로 절단되어 프라이머를 활성화시키도록 설계된다. 일부 실시양태에서, 광절단성 차단 기는 염기 아데닌, 시토신, 구아닌, 티민, 우라실, 또는 그의 변형된 피리미딘 및 퓨린 유도체, 예를 들면, 7-하이드록실-7-데아자-아데닌/구아닌을 함유하는 뉴클레오티드 화합물의 형태이다. 다른 실시양태에서, 절단성 기는 염료와 같은 리포터를 포함하도록 유도체화될 수 있다. 일부 실시양태에서, 염기 아데닌, 시토신, 구아닌, 티민, 우라실 또는 그의 변형된 피리미딘 및 퓨린 유도체는 2-니트로벤질 기와 같은 광절단성 보호 기에 공유적으로 부착될 수 있다. 일부 실시양태에서, 2-니트로벤질 기는 DNA 합성의 종결을 개선하기 위해 유도체화된다. 2-니트로벤질 기와 같은 광절단성 보호 기는 또한, 일부 실시양태에서, 광절단성 보호 기에 대한 공유 결합에 의해 형광 염료로 유도체화될 수 있다.
일부 실시양태에서, 광절단성 차단 기는 2-니트로벤질 기와 공유적으로 부착된 뉴클레오시드의 염기를 포함하고, 2-니트로벤질 기의 알파 탄소 위치는 선택적으로 하나의 알킬 또는 아릴 기로 치환된다. 다른 실시양태에서, 2-니트로벤질 기는 종결 및 차단 특성뿐만 아니라 광촉매 탈보호 속도를 향상시키도록 작용화된다. 다른 실시양태에서, 염기에 부착된 2-니트로벤질 및 알파 탄소 치환된 2-니트로벤질 기의 종결 및 차단 특성은 리보스 당의 3'-OH 기가 비차단되는 경우에도 발생한다. 일부 실시양태에서, 알파 탄소 치환된 2-니트로벤질 기는 또한 선택된 형광 염료 또는 다른 리포터를 포함하도록 유도체화될 수 있다.
"리포터"라는 용어는 검출가능한 신호를 직접 또는 간접적으로 생성할 수 있는 화학적 모이어티를 의미한다. 리포터의 예로는 형광 염료 기, 방사성 표지 또는 화학발광 또는 생물발광 수단을 통해 신호에 영향을 미치는 기들이 포함된다. 형광 염료 기의 예로는 잔텐, 플루오레세인, 로다민, BODIPY, 시아닌, 쿠마린, 피렌, 프탈로시아닌, 피코빌리단백질, ALEXA FLUOR 350, ALEXA FLUOR 405, ALEXA FLUOR 430, ALEXA FLUOR 488, ALEXA FLUOR 514, ALEXA FLUOR 532, ALEXA FLUOR 546, ALEXA FLUOR 555, ALEXA FLUOR 568, ALEXA FLUOR 568, ALEXA FLUOR 594, ALEXA FLUOR 610, ALEXA FLUOR 633, ALEXA FLUOR 647, ALEXA FLUOR 660, ALEXA FLUOR 680, ALEXA FLUOR 700, ALEXA FLUOR 750, 및 스쿠아레인 염료가 포함된다. 본 발명의 일부 실시양태에서, 리포터로서 사용될 수 있는 방사성 표지의 예는 35S, 3H, 32P 또는 33P와 같이 당해 분야에 잘 알려져 있다.
용어 "프라이머 연장 시약"은 폴리뉴클레오티드 표적과 같은 폴리뉴클레오티드 분자에 대한 프라이머 연장 반응(예를 들면, 폴리머라제 연쇄 반응(PCR))을 수행하는데 필요하거나 적합한 임의의 시약을 지칭한다. 프라이머 연장 시약에는 일반적으로 Tris-HCl 또는 기타 완충액과 같은 적절한 완충액과의 혼합물 중의 프라이머, 열안정성 폴리머라제 또는 역전사효소, 및 뉴클레오티드가 포함된다. 일부 실시양태에서, 프라이머 연장 시약은 또한 염 또는 이온, 세제, 유기 용매, 중합체 및/또는 기타 첨가제를 포함할 수 있다. 예를 들어, 프라이머 연장 시약에는 이온(예를 들어, Mg2+, Mn2+ 또는 K+) 또는 그의 염, Triton X-100, Tween 20 또는 NP40과 같은 세제, 소 혈청 알부민(BSA)과 같은 혈청 또는 혈청 단백질 성분, 글리세롤, 만니톨 또는 솔비톨과 같은 폴리올, 및/또는 환원제(예를 들어, 디티오트레이톨(DTT) 또는 트리스(2-카복시에틸)포스핀(TCEP))가 포함될 수 있다. cDNA 합성은 RNA 전사체(올리고(dT))의 3' 폴리A 꼬리 또는 RNA 내의 여러 서열-특이적 부위(랜더머(randomer), 표적 특이적 프라이머)에 어닐링된 역방향 프라이머에 의해 프라이밍된다.
2개 이상의 폴리머라제를 비교하는 맥락에서 "기능적으로 동등한"이라는 용어는 폴리머라제에서 동일한 기능적 역할을 갖는 다른 폴리머라제의 아미노산 위치에 존재하는 것으로 간주되는 아미노산을 폴리머라제가 함유한다는 것을 의미한다. 한 예로서, Vent DNA 폴리머라제의 위치 412에서 티로신에서 발린으로의 돌연변이(Y412V)는 9°N 폴리머라제의 위치 409에서 티로신에서 발린으로의 치환(Y409V)과 기능적으로 동등하다. 일반적으로, 2개 이상의 상이한 폴리머라제의 기능적으로 동등한 돌연변이는 폴리머라제의 아미노산 서열의 상동성 아미노산 위치에서 발생한다. 따라서, 본원에서 "기능적으로 동등한"이라는 용어의 사용은 또한 돌연변이된 아미노산의 특정 기능이 알려져 있는지 여부에 관계없이 주어진 돌연변이에 "위치적으로 동등한" 또는 "상동성"인 돌연변이를 포함한다. 서열 정렬 및/또는 분자 모델링을 기반으로 2개 이상의 상이한 폴리머라제의 아미노산 서열에서 위치적으로 동등하거나 상동성인 아미노산 잔기를 식별하는 것이 가능하다.
2개 이상의 핵산 또는 폴리펩티드 서열과 관련하여 용어 "동일한" 또는 "퍼센트 동일성"은, 적절한 서열 비교 알고리즘을 사용하거나 육안 검사를 통해 측정시, 최대 대응을 위해 비교하고 정렬했을 때, 동일하거나, 특정 비율의 동일한 아미노산 잔기 또는 뉴클레오티드를 갖는 2개 이상의 서열 또는 부분서열(subsequence)을 지칭한다.
2개의 핵산 또는 폴리펩티드(예를 들어, 폴리머라제를 암호화하는 DNA, 또는 폴리머라제의 아미노산 서열)와 관련하여 "실질적으로 동일한"이라는 어구는, 서열 비교 알고리즘을 사용하거나 육안 검사를 통해 측정시, 최대 대응을 위해 비교하고 정렬했을 때, 적어도 약 60%, 또는 적어도 약 70%, 또는 적어도 약 80%, 또는 적어도 약 90%, 또는 적어도 약 95%, 또는 적어도 약 98%, 또는 적어도 약 99% 이상의 뉴클레오티드 또는 아미노산 잔기 동일성을 갖는 2개 이상의 서열 또는 부분서열을 지칭한다. 이러한 "실질적으로 동일한" 서열은 실제 조상과 관련 없이 전형적으로 "상동성"인 것으로 간주된다. 바람직하게는, "실질적인 동일성"은 길이가 적어도 약 50개의 잔기인 서열 영역에 걸쳐 존재하고, 보다 바람직하게는 적어도 약 100개 잔기의 영역에 걸쳐 존재하며, 가장 바람직하게는 서열은 적어도 약 150개의 잔기에 걸쳐 실질적으로 동일하거나, 비교될 두 서열의 전체 길이에 걸쳐 실질적으로 동일하다.
폴리머라제 및/또는 아미노산 서열과 같은 폴리펩티드는 공통 조상 단백질 또는 단백질 서열로부터 자연적으로 또는 인공적으로 유래될 때 "상동성"이다. 유사하게, 폴리뉴클레오타이드 및/또는 핵산 서열은 공통 조상 핵산 또는 핵산 서열로부터 자연적으로 또는 인공적으로 유래될 때 상동성이다. 상동성은 일반적으로 2개 이상의 핵산 또는 단백질(또는 그의 서열) 사이의 서열 유사성으로부터 추정된다. 상동성을 확립하는데 유용한 서열들 간의 정확한 유사성 백분율은 문제가 되는 핵산 및 단백질에 따라 다르지만, 50, 100, 150개 이상의 잔기에서 25% 정도의 서열 유사성이 상동성을 확립하는데 통상적으로 사용된다. 더 높은 수준의 서열 유사성, 예를 들어, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 99% 이상을 사용하여 또한 상동성을 확립할 수도 있다. 서열 유사성 백분율을 측정하는 방법은 쉽게 이용가능하다. 퍼센트 서열 동일성 및 서열 유사성을 측정하는데 적합한 알고리즘의 예는 BLAST 알고리즘이며, BLAST 분석을 수행하기 위한 소프트웨어-기반 인터페이스는 국립 생명공학 정보 센터(National Center for Biotechnology Information)를 통해 공개적으로 이용가능하다.
명세서 및 첨부된 청구범위에 사용된 바와 같이, 그의 일반적인 의미에 더하여, "실질적인" 또는 "실질적으로"라는 용어는 당해 분야의 숙련자가 허용할 수 있는 한계 또는 정도 내에 있음을 의미한다. 예를 들어, "실질적으로 해제된(cancelled)"은 당해 분야의 숙련자가 해제를 허용가능한 것으로 간주한다는 것을 의미한다.
명세서 및 첨부된 청구범위에 사용된 바와 같이, 그의 일반적인 의미에 더하여, "대략" 및 "약"이라는 용어는 당해 분야의 숙련자가 허용할 수 있는 한계 또는 양 내에 있음을 의미한다. "약"이라는 용어는 일반적으로 표시된 수의 15% 안팎을 지칭한다. 예를 들어, "약 10"은 8.5 내지 11.5의 범위를 나타낼 수 있다. 예를 들어, "대략 동일하다"는 것은 당해 분야의 숙련자가 비교되는 항목이 동일한 것으로 간주한다는 것을 의미한다.
본 개시내용에서, 수치 범위는 범위를 정의하는 숫자를 포함한다. 예시 목적으로 화학적 구조 및 공식이 길어지거나 확대될 수 있음을 인식해야 한다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 개시 내용이 관련된 분야에서 작업하는 사람들이 일반적으로 이해하는 것과 동일한 의미를 갖는다.
본 교시내용의 범위는 첨부된 청구범위에 의해서만 제한될 것이기 때문에, 본원에 사용된 용어는 단지 특정 실시양태를 설명하기 위한 것이며 제한하려는 의도가 아니라는 점을 이해해야 한다.
본원에 개시된 바와 같이, 다수의 값의 범위들이 제공된다. 문맥상 명백하게 달리 지시하지 않는 한, 하한 단위의 10분의 1까지 각각의 중간 값은 그 범위의 상한과 하한 사이에서 또한 구체적으로 개시되는 것으로 이해된다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 개시내용이 속하는 당해 분야의 숙련자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 본원에 기재된 것과 유사하거나 등가인 임의의 방법 및 재료가 본 교시내용의 실시 또는 시험에 또한 사용될 수 있지만, 이제 일부 예시적인 방법 및 재료를 기술한다.
본원에 언급된 모든 특허 및 간행물은 명백하게 참조로 도입된다.
명세서 및 첨부된 청구범위에 사용된 바와 같이, "하나의" 및 "그"라는 용어는, 문맥상 명백하게 달리 지시하지 않는 한, 단수 및 복수의 언급대상을 둘 다 포함한다. 따라서, 예를 들어, "모이어타"는 하나의 모이어티 및 복수의 모이어티를 포함한다.
사용 방법 및 용도
본원에 제시된 돌연변이 폴리머라제는 합성에 의한 서열분석(sequencing-by-synthesis, SBS) 기술과 같은 폴리뉴클레오티드 서열분석에 사용될 수 있다. 간략하게, SBS는 상보적 가닥의 합성을 위한 주형으로 표적 핵산을 사용하여 수행될 수 있다. 프라이머는 주형에 결합하고 DNA 폴리머라제의 활성에 의해 하나 이상의 표지된 뉴클레오티드로 연장된다. 1차 가닥(즉, 주형에 하이브리드화된 프라이머)은 표적 핵산을 주형으로 사용하여 연장되고, 검출될 수 있는 표지된 뉴클레오티드를 혼입시킨다. 선택적으로, 표지된 뉴클레오티드는 일단 뉴클레오티드가 프라이머에 부가되면 추가의 프라이머 연장을 종결시키는 가역적 종결자일 수 있다. 예를 들어, 종결을 역전시키기 위해 탈차단제(deblocking agent)가 전달될 때까지 후속 연장이 일어날 수 없도록 가역적 종결자가 프라이머에 부가될 수 있다. 따라서, 가역적 종결자를 사용하는 실시양태의 경우, 탈차단 시약은 (표지 검출이 일어나기 전 또는 후에) 서열분석 기기로 전달될 수 있다.
일부 가역적 종결자(예를 들어, 라이트닝 종결자)는 DNA 합성을 종결하고 신속하게 절단되도록 설계된 광절단성 차단 기를 갖는다. 라이트닝 종결자는, 예를 들면, 주형에 어닐링된 가닥의 단일-염기 연장에 의해 또는 대안적으로 주형-비의존적 방식으로 말단 데옥시뉴클레오티드 트랜스퍼라제(TdT)를 사용한 1차 가닥의 단일 염기 연장에 의해 1차 가닥의 3' 말단과 결합되고 그에 혼입된다.
일부 실시양태에서, 본 발명의 돌연변이 폴리머라제는 주형-비의존성 효소적 올리고 합성(TiEOS)에 사용된다. 일부 실시양태에서, 본 발명의 방법은 프라이밍 가닥을 돌연변이 폴리머라제(예를 들면, Pfu26 또는 Pfu48) 및 하나 이상의 3'-OH 비차단 가역적 종결자와 접촉시키는 것을 포함한다. 본 발명의 방법은 주기 당 단일-염기 부가에 의해 프라이밍 가닥의 3' 말단을 연장시키는 것을 포함할 수 있다. 일부 실시양태에서, 본 발명의 돌연변이 폴리머라제는 높은 혼입 및 종결 효율하에 주형-비의존적 방식으로 프라이밍 가닥에 가역적 종결자를 혼입시킨다.
돌연변이 폴리머라제를 암호화하는 핵산
본원에 제시된 돌연변이 폴리머라제 효소를 암호화하는 핵산이 추가로 제시된다. 본 개시내용에 의해 개시되거나 교시된 임의의 주어진 돌연변이 폴리머라제에 대해, 공지된 분자 생물학 원리에 따라 돌연변이 폴리머라제를 암호화하는 뉴클레오티드 서열을 수득하는 것이 가능하다. 따라서, 본 개시내용은 돌연변이 폴리머라제를 암호화하는 핵산뿐만 아니라 돌연변이 폴리머라제 자체에 대한 설명을 제공한다.
본원에 개시된 재조합 폴리머라제를 암호화하는 핵산은 또한 본원에 제시된 실시양태의 특징이다. 특정 아미노산은 다중 코돈에 의해 암호화될 수 있으며, 특정 번역 시스템(예를 들어, 원핵 또는 진핵 세포)은 종종 코돈 편향을 나타낸다, 예를 들어, 상이한 유기체는 종종 동일한 아미노산을 암호화하는 여러 동의(synonymous) 코돈 중 하나를 선호한다. 따라서, 본원에 제시된 핵산은 선택적으로 "코돈 최적화"되며, 이는 핵산이 폴리머라제를 발현하기 위해 사용되는 특정 번역 시스템에 의해 선호되는 코돈을 포함하도록 합성된다는 것을 의미한다. 예를 들어, 세균 세포(또는 특정 세균 균주)에서 폴리머라제를 발현하는 것이 바람직할 때, 핵산은 폴리머라제의 효과적인 발현을 위해 그 세균 세포의 게놈에서 가장 빈번하게 발견되는 코돈을 포함하도록 합성될 수 있다. 진핵 세포에서 폴리머라제를 발현시키는 것이 바람직할 때 유사한 전략이 사용될 수 있다, 예를 들어, 핵산은 진핵 세포가 선호하는 코돈을 포함할 수 있다.
다양한 단백질 단리 및 검출 방법이 알려져 있으며, 예를 들어, 본원에 제시된 재조합 폴리머라제를 발현하는 세포의 재조합 배양물로부터 폴리머라제를 단리하는 데 사용될 수 있다.
9°N 폴리머라제를 암호화하는 야생형 뉴클레오티드 서열이 알려져 있다면, 표준 유전자 코드를 사용하여 하나 이상의 아미노산 치환을 갖는 9°N의 임의의 주어진 돌연변이 버전을 암호화하는 뉴클레오티드 서열을 추정하는 것이 가능하다. 유사하게, 뉴클레오티드 서열은, 예를 들어, Vent, Pfu, T. sp. JDF-3, Taq 등과 같은 다른 폴리머라제의 돌연변이 버전에 대해 쉽게 유도될 수 있다. 이어서, 필요한 뉴클레오티드 서열을 갖는 핵산 분자를 당해 분야에 공지된 표준 분자 생물학 기술을 사용하여 구축할 수 있다.
본원에 제시된 실시양태에 따르면, 정의된 핵산은 동일한 핵산뿐만 아니라, 특히 보존적 아미노산 치환의 축퇴 코드로 인해 동의 코돈(동일한 아미노산 잔기를 지정하는 상이한 코돈)을 초래하는 경우의 치환을 포함한 임의의 사소한 염기 변이도 포함한다. "핵산 서열"이라는 용어는 또한 염기 변이와 관련하여 주어진 임의의 단일 가닥 서열에 대한 상보적인 서열도 포함한다.
본원에 기술된 핵산 분자는 또한 유리하게는 적합한 숙주에서 그로부터 암호화된 폴리머라제 단백질을 발현시키기 위해 적합한 발현 벡터에 포함될 수 있다. 상기 세포의 후속 형질전환 및 형질전환된 세포의 후속 선택을 위해, 클로닝된 DNA를 적합한 발현 벡터에 혼입시키는 것은, 그 전체가 참고로 도입되는 문헌[Sambrook et al. (1989), Molecular cloning: A Laboratory Manual, Cold Spring Harbor Laboratory]에 제공된 바와 같이 당해 분야의 숙련자에게 잘 알려져 있다.
이러한 발현 벡터로는 상기 DNA 단편의 발현을 수행할 수 있는 조절 서열, 예를 들면, 프로모터 영역에 작동가능하게 연결된 본원에 제시된 실시양태에 따른 핵산을 갖는 벡터가 포함된다. "작동가능하게 연결된"이라는 용어는 설명된 구성요소가 의도된 방식으로 기능하도록 허용하는 관계에 있는 병치를 지칭한다. 이러한 벡터는 본원에 제시된 실시양태에 따른 단백질의 발현을 제공하기 위해 적합한 숙주 세포로 형질전환될 수 있다.
핵산 분자는 성숙한 단백질, 또는 숙주 세포에 의해 절단되어 성숙한 단백질을 형성하는 전구단백질 상의 리더 서열을 암호화하는 것을 포함한 전구서열을 갖는 단백질을 암호화할 수 있다. 벡터는, 예를 들어, 복제 기점, 및 선택적으로 상기 뉴클레오티드의 발현을 위한 프로모터 및 선택적으로 프로모터의 조절인자가 제공된 플라스미드, 바이러스 또는 파지 벡터일 수 있다. 벡터는, 예를 들어, 항생제 내성 유전자와 같은 하나 이상의 선택성 마커를 함유할 수 있다.
발현에 필요한 조절 요소로는 RNA 폴리머라제에 결합하고 적절한 수준의 전사 개시를 유도하는 프로모터 서열 및 또한 리보솜 결합을 위한 번역 개시 서열이 포함된다. 예를 들어, 세균 발현 벡터는 lac 프로모터와 같은 프로모터 및 번역 개시를 위해 Shine-Dalgarno 서열 및 시작 코돈 AUG를 포함할 수 있다. 유사하게, 진핵생물 발현 벡터는 RNA 폴리머라제 II에 대한 이종 또는 동종 프로모터, 하류 폴리아데닐화 신호, 시작 코돈 AUG, 및 리보솜의 분리를 위한 종결 코돈을 포함할 수 있다. 이러한 벡터는 상업적으로 입수할 수 있거나 당해 분야에 잘 알려진 방법에 의해 기술된 서열로부터 조립될 수 있다.
고등 진핵생물에 의한 폴리머라제를 암호화하는 DNA의 전사는 벡터에 인핸서 서열을 포함시킴으로써 최적화될 수 있다. 인핸서는 프로모터에 작용하여 전사 수준을 증가시키는 DNA의 시스-작용 요소이다. 벡터는 또한 일반적으로 선택성 마커 이외에 복제 기점도 포함할 것이다.
본 개시내용을 고려하여, 본 교시내용에 따라 다양한 방법이 구현될 수 있다. 또한, 다양한 구성요소, 재료, 구조 및 매개변수는 단지 설명 및 예시의 방식으로 포함되며 제한하는 의미가 아니다. 본 개시내용을 고려하여, 본 교시내용은 다른 용도로 구현될 수 있으며 이러한 용도를 구현하는 구성 요소, 재료, 구조 및 장비는 첨부된 청구범위의 범위 내에 유지되면서 결정될 수 있다.
실시예
실시예를 위한 일반적인 방법 및 조건
실시예에 사용된 실험 절차 및 조건을 일반적으로 하기에서 설명한다.
A. 돌연변이 폴리머라제의 생성 및 생산
이 섹션에서는 일반적으로 돌연변이 유전자 서열을 생성하여 본 발명의 돌연변이 폴리머라제를 생성한 방법 및 돌연변이 유전자를 발현하여 하기 실시예에 사용된 다양한 돌연변이 폴리머라제를 수득한 방법을 설명한다. 돌연변이 DNA 폴리머라제는 Agilent의 QuikChange Lightning Multi Site-Directed Mutagenesis 키트의 시약 및 프로토콜을 사용하여 제조되었다. 돌연변이 플라스미드를 서열 확인한 다음 발현 숙주 BL21-Gold(DE3)(Agilent)에 형질전환시켰다. 세포를 지수기(OD600 약 0.4)까지 성장시키고 1mM IPTG로 유도하였다. 열처리된 세균 용해물 및 정제된 Pfu 돌연변이체를 문헌[Hansen et al(2011) NAR 39: 1801-1810]에 기술된 바와 같이 제조하였다.
B. 돌연변이 폴리머라제를 사용한 서열분석 및 서열분석 측정기준
이 섹션에서는 일반적으로 본 발명의 돌연변이 폴리머라제가 합성에 의한 서열분석에 사용된 방법, 및 서열분석에서 이들의 성능이 측정된 방법을 설명한다. 본질적으로 문헌[Hertzog D, et al., "A high-performance, low-cost Approach to Next Generation Sequencing", BioOptics World. 2011 Issue Nov/Dec 2011]에 기술된 바와 같이, 브레드보드(breadboard) 기기에서 서열분석을 수행하였다.
실시예 1
본 실시예에서는, 3'-OH 비차단 종결자로 서열분석하는데 있어 그의 능력을 개선하기 위한 시도로 서열번호 12의 DNA 폴리머라제(종결자)에 돌연변이를 도입하였다. 써모코커스 속 9°N DNA 폴리머라제에 대한 상기와 같은 돌연변이는 미국 특허 제9,273,352호; 미국 특허 제9,677,059호; 미국 특허 제9,765,309호; 미국 특허출원 공개 번호 20160032377호에 개시되어 있다. 하기 표 1은 라이트닝 종결자를 사용한 서열분석 측정기준을 요약하였다.
실험 # 종결자 돌연변이 #
(9°N DNA 폴리머라제 넘버링)
ARL (87 주기) Lead+Lag %판독물>85bp
1-1 없음 72.3 1.6 35.4
1-2 R743A 55.0 2.4 8.6
1-3 T514S 72.0 1.1 38.3
1-4 I521L 53.9 2.8 2.8
1-5 K477M 68.8 1.6 27.7
1-6 T144G 70.5 1.4 31.8
1-7 G153D 66.7 1.8 21.5
1-8 K476W 70.2 1.4 31.8
1-9 L478S 65.8 1.6 19.6
1-10 T590I 68.1 1.3 32.2
1-11 A639F 58.5 2.3 6.9
1-12 D718N 65.6 1.8 17.9
# 정제된 돌연변이체를 동일한 단위 농도(주기 1에서 0.08U/μl, 주기 2-n에서 0.008U/μl)에서 비교하였다. "없음" 대조군을 생성하였으며 종결자 돌연변이체와 함께 스크리닝하였다.
본 실시예 및 다음 실시예에서 사용된 바와 같이, "Lead+Lag"는 현재의 염기 신호에 대해 다음 염기 신호(Lead)를 판독하거나 이전 염기 신호(Lag)를 판독함으로써 야기된 합성 기술에 의한 서열분석에서의 디페이징(dephasing) 오류를 지칭한다. 이러한 오류는 폴리머라제에 의한 가역적 종결자의 불완전한 혼입으로 인해 발생할 수 있다. 폴리머라제에 대한 이들 돌연변이는, 라이트닝 종결자를 혼입하기 위해, 종결자에 비해 평균 판독 길이(ARL)가 증가하지 않았다는 점에서 종결자 폴리머라제에 의한 서열분석 성능을 개선하는데 효과적이지 않은 것으로 밝혀졌다. 이러한 결과는 염기-변형된 가역적 종결자에 대한 대체 폴리머라제 및/또는 돌연변이를 식별하는데 있어서 어려움 및 예측불가능성을 나타낸다.
실시예 2
본 실시예에서는, 종결자에 존재하는 특정 돌연변이(D141A/E143A/A485L)를 도입하여 돌연변이 폴리머라제를 생성하였다. 세 가지 돌연변이를 JDF3(써모코커스 속 JDF3) 및 Pfu(피로코커스 퓨리오서스) DNA 폴리머라제의 동등한 위치에 도입하였다. 그런 다음, 전술한 바와 같이, 라이트닝 종결자를 사용한 서열분석에서 새로운 돌연변이 폴리머라제를 그 성능에 대해 평가하였다. 표 2는 서열분석 측정기준에 대한 자연적 변이의 영향을 보여주는 결과를 요약하였다. 결과로 수득된 ARL은 종결자에 비해 20bp 이상 더 낮았으며, 이는 상이한 폴리머라제 간의 변이가 3'-OH 비차단 가역적 종결자를 사용한 서열분석에 상당한 영향을 미칠 수 있음을 시사한다.
추가적으로, 3'-OH 비차단 가역적 종결자를 사용한 서열분석에 영향을 미치는 9°N, JDF3 및 Pfu DNA 폴리머라제 사이의 아미노산 차이를 확인하기 위해 일련의 키메라 폴리머라제 및 단일-점 돌연변이체를 구축하였다. 하기 표 2는 이들 폴리머라제에 이루어진 돌연변이 및 라이트닝 종결자를 사용한 서열분석에서의 사용으로부터의 서열분석 측정기준을 나타낸다. 서열분석에서 돌연변이 폴리머라제의 평가 결과는 또한 도 2에 예시되어 있다.
실험 # 폴리머라제 (D141A/E143A) ARL (87 주기) Lead+ Lag %판독물
>85
Pfu에서의 동등한 위치
2-1 종결자 (9°N polB A485L) 76.0 1.3 49.6 A486L
2-2 JDF3 polB A485L 47.4 2.2 0.7 A486L
2-3 JDF3 polB A485L/Y493F 64.5 1.8 15.1 A486L/Y494F
2-4 Pfu polB A486L 54.9 2.1 9.9 -
2-5 Pfu polB A486L/Y546H 75.3 1.3 49.7 -
# 대체 폴리머라제는 동일한 단백질 농도(주기 1에서 0.02ug/μl, 주기 2~n에서 0.002ug/μl)에서 비교되었다.
494 및 546(Pfu 넘버링)에서 이들 3개의 폴리머라제 중에서의 자연적 변이는 서열분석 측정기준에 상당한 영향을 미치는 것으로 밝혀졌다. 페닐알라닌(F; 9°N 및 Pfu에서 자연 발생)이 Pfu의 494에 동등한 위치에서 JDF3에 도입되었을 때(JDF3 A485L/Y493F; 실험 #2-3) ARL은 17bp만큼 개선되었다. 히스티딘(H; 9°N 및 JDF3에서 자연 발생)이 Pfu의 코돈 546에 도입되었을 때 훨씬 더 큰 개선이 주목되었다(실험 #2-5). 실제로, Pfu A486L/Y546H를 사용한 서열분석 측정기준은(실험 #2-5), Pfu A486L/Y546H가 종결자에 비해 더 낮은 리딩(leading) 값 및 더 높은 래깅(lagging) 값을 나타낸 것을 제외하고, 종결자와 거의 동일하였다(하기 표에 나타냄).
실시예 3
본 실시예에서, 돌연변이 DNA 폴리머라제는 고세균 폴리머라제에 대해 확인된 다양한 돌연변이를 제조함으로써 Pfu 폴리머라제로부터 유래되었다. 돌연변이는 연구 및 특허 문헌에 기재된 것들 중에서 선택되었다(하기에 나타냄). 돌연변이는 또한 돌연변이 A486L 및 Y546H를 갖는 Pfu 폴리머라제에 도입되었다. 돌연변이는 다양한 폴리머라제에 대해 이러한 돌연변이가 논의된 문헌과 함께 하기 표 3에 나타내었다.
시험된 돌연변이 문헌 인용
E399D, N400D, R407I 문헌[Ramsay, N. et al (2010) CyDNA: Synthesis and Replication of Highly Cy-Dye Substituted DNA by an Evolved Polymerase. J. AM. CHEM. SOC. 2010, 132, 5096-5104].
L479S, K477W, T591I 문헌[Bomati, E. et al. Modified Polymerases for Improved Incorporation of Nucleotide Analogues]. US 9,677,057
T515S 문헌[Chen, C-Y et al. Modified Polymerases for Improved Incorporation of Nucleotide Analogues]. US 20160032377
Y410G 문헌[Cozens et al (2012) A short adaptive path from DNA to RNA polymerases. Proc. Natl. Acad. Sci. 109:8067-72].
L409Y, P411L 문헌[Arezi et al (2002) Efficient and High Fidelity Incorporation of Dye-terminators by a Novel Archaeal DNA Polymerase Mutant. J. Mol. Biol. (2002) 322, 719-729]; 또한 US 20030228616.
돌연변이 폴리머라제를 전술한 바와 같이 서열분석에 사용하였다. Pfu 폴리머라제에 부가된 이들 돌연변이 중에서, K477W만이 서열 측정기준에 상당한 영향을 미쳤으며, 특히 전장 판독물의 비율이 더 높았다(실험 #2-6). 상기 돌연변이(Pfu D141A/E143A/K477W/A486L/Y546H)에는 임의의 이름 Pfu10이 지정되었다. Pfu10의 아미노산 서열은 서열번호 2에 제시되어 있다. 본 실시예는 Pfu10이 3'-OH 비차단 가역적 종결자를 사용하는 합성에 의한 서열분석에 사용하기 위한 개선된 서열분석 효소임을 보여준다.
실험# 폴리머라제 # 실행 ARL (87 주기) FracQ30 리딩 래깅 %판독물 >85bp
2-1 종결자 (NEB) 110 76.0 0.58 0.70 0.61 49.6
2-6 Pfu10 12 80.4 0.62 0.24 0.66 69.5
본 실시예 및 다른 실시예에서 사용된 바와 같이, "FracQ30"은 전체 서열분석 판독물 중 30의 Q 점수(Q30)를 갖는 서열분석 염기 판독물의 백분율을 나타낸다. K477W가 Pfu를 개선시킨다는 발견은 예상치 못했는데, 그 이유는 종결자가 Pfu10의 위치 486, 494 및 546 각각과 동등한 위치에 L, F 및 H를 함유함에도 불구하고 종결자의 등가 돌연변이가 라이트닝 종결자(실험 #1-8 참조; K476W)를 사용한 서열분석을 개선하지 못했기 때문이다. 이러한 결과는, 3'-OH 비차단 가역적 종결자를 사용하여, 종결자보다 Pfu와 더 밀접하게 관련된 서열분석 폴리머라제를 사용하여 K477W의 이점이 실현될 수 있음을 시사한다. BLASTP 정렬은 Pfu10과 9°N DNA 폴리머라제(종결자의 모체) 사이의 퍼센트 아미노산 서열 동일성이 79.9%임을 시사한다.
실시예 4
본 실시예에서는, 허용되는 정도의 감소된 동일성을 탐색하고 L486, F494, H546, F494, H546 및 W477을 함유하는 다른 돌연변이 Pfu 폴리머라제를 확인하기 위해, 다중-부위 돌연변이유발에 의해 Pfu10 내에 또는 도메인 치환에 의해 PFu A486L/Y546H 내에 다양한 돌연변이를 도입하였다. 서열번호 3은 고세균 DNA 폴리머라제에서 나타나는 15개의 보존적 돌연변이와 잠재적인 번역 시작 부위를 제거하는 M129A 치환을 갖는 Pfu10 변이체("PFU10-N12"로 불림)의 아미노산 서열을 보여준다(Pfu10과 97.9% 동일성). Pfu10 및 Pfu10-N12는 전술한 바와 같이, 라이트닝 종결자를 사용한 서열분석에서의 성능에 대해 평가하였다.
하기 표 5는 Pfu10 변이체의 서열분석 성능을 보여주는 결과를 요약하였다. 상기 변이체(Pfu10-N12)는 라이트닝 종결자를 사용한 서열분석에서 Pfu10보다 약간 더 낫지는 않더라도 필적하게 수행한다.
실험 # 효소 서열분석된 DNA 라이브러리 # 효소 로트/# 서열분석 ARL (120 주기) FracQ30 Lead+Lag %판독물 >85
3-1 Pfu10 인간 4/44 109.7 0.65 1.1 92.0
3-2 Pfu10-N12 인간 2/6 111.6 0.68 1.0 93.3
3-3 Pfu10 에스케리키아 콜라이 4/27 92.3 0.63 0.8 79.9
3-4 Pfu10-N12 에스케리키아 콜라이 2/8 93.8 0.65 0.9 82.6
또한, 원하는 수준의 활성을 유지하면서 다양성을 증가시키기 위해 임의의 도메인 치환을 사용할 수 있다. 서열분석 측정기준에 대한 도메인 치환의 효과가 도 2에 예시되어 있다. 예를 들어, Pfu L486L/Y546H의 아미노산 분절 1-99, 100-199, 400-449 및 500-599를 종결자의 상응하는 폴리펩티드 서열로 대체하면 서열분석 측정기준에 최소한의 영향을 미쳐서, Pfu10이 3'-OH 비차단 가역적 종결자를 혼입하는 능력을 손상시키지 않으면서 적어도 16 내지 29개의 추가 돌연변이(96.3 내지 97.9% 변이)를 수용할 수 있음을 입증하였다.
실시예 5
본 실시예는 추가적인 돌연변이 폴리머라제를 생성하기 위해 Pfu D141A/E143A의 위치 486 및 494에서 포화 돌연변이유발을 이용하였다. 세균 추출물은 라이트닝 종결자-A(LTA)를 사용하는 플레이트-기반 단일-염기 연장 분석에서 스크리닝하였다. 최고의 형광 신호를 생성하는 양성 클론을 서열분석하여 아미노산 대체를 확인하였다. 도 3 및 4에 나타낸 바와 같이, A486 및 F494는 매우 돌연변이성이며, 다중 치환은 A486F, A486Y, A486N, A486R, A486H, F494C, F494I, F494N 및 F494T를 포함하여 라이트닝 종결자의 혼입을 개선시킨다. 스크리닝 결과에 기반하여 선택된 용해물을 서열분석을 위해 제출하고, 선택에 기반하여 아미노산 식별을 실시하였다.
도 3은 Pfu 폴리머라제에서 위치 486의 포화를 예시한다. QuikChange 키트를 축퇴 NDT 코돈 프라이머와 함께 사용하여 Pfu A486 돌연변이체의 라이브러리를 생성하였다. NDT 코돈은 첫 번째 위치에 A, C, G 또는 T를 포함하고, 두 번째 위치에 A, G 또는 T를 포함하고, 세 번째 위치에 T를 포함하여, 프라이머에 가변성을 도입한다. 12개의 가능한 NDT 코돈은 12개의 아미노산(Phe, Leu, Ile, Val, Tyr, His, Asn, Asp, Cys, Arg, Ser 및 Gly)을 나타낸다. 무작위로 선택된 32개의 콜로니로부터 열-정제 추출물을 제조하였다. 고정화된 dsDNA 기질을 사용하는 미세적정 플레이트 분석에서 LTA의 혼입에 대해 추출물을 스크리닝하였다. "A" 돌연변이체에 대한 형광 신호는 야생형 Pfu(코돈 486에 야생형 알라닌)에 대한 배경에 해당한다.
도 4a 및 4b는 Pfu 폴리머라제에서 위치 494의 포화를 예시한다. QuikChange 키트를 축퇴 코돈 프라이머의 2개 풀(A, B)과 함께 사용하여 Pfu F494 돌연변이체의 라이브러리를 생성하였다. 무작위로 선택된 32개의 콜로니로부터 열-정제 추출물을 제조하였다. 고정화된 DNA 기질을 사용하는 미세적정 플레이트 분석에서 LTA의 혼입에 대해 추출물을 스크리닝하였다. "F" 돌연변이체에 대한 형광 신호는 야생형 Pfu(위치 494에 야생형 페닐알라닌)에 대한 배경에 해당한다.
실시예 6
본 실시예에서, 추가적인 돌연변이 폴리머라제는 Pfu 폴리머라제로부터 유래되었다. 돌연변이체를 생성하기 위해, QuikChange Lightning Mutagenesis 키트 및 "NDT" 코돈을 함유하는 올리고뉴클레오티드를 사용하여 Pfu pol B 유전자의 87개 코돈을 포화시켜 R, N, D, C, G, H, I, L, F, S, Y 및 V 치환을 동일한 빈도로 생성하였다. 일부 경우에서, NDT 라이브러리에서 누락된 돌연변이체를 나머지 돌연변이(A, T, K, Q, E, P, K, W)를 암호화하는 돌연변이유발성 올리고의 등몰 혼합물과 별도의 QuikChange 반응으로 제조하였다. 32개의 클론을 각각의 QuikChange 라이브러리에서 무작위로 선택하였다(더 적은 수의 형질전환체를 생성한 T267, Y403, Y410, I475, G499 및 K675 라이브러리 제외). 세균 용해물을 제조하고 고정화된 프라이머-주형을 사용하는 플레이트-기반 분석을 이용하여 LTA 및 LTC의 혼입을 스크리닝하였다. LTG 및 LTU의 활용을 위해 제한된 수의 돌연변이체도 또한 스크리닝하였다(유사한 경향; 데이터는 나타내지 않음). 세척 및 UV 절단(염료 소광 효과를 최소화하기 위해) 후에, 플레이트를 판독하고 형광 신호를 Pfu 대조군과 비교하였다. 하기 표 6은 Pfu10(상기 논의됨)과 함께 임의의 이름 Pfu5, Pfu1 및 Pfu2가 부여된, 대조군 역할을 하는 4개의 돌연변이 Pfu 폴리머라제를 식별한다.
D141A/E143A A486L Y546H K477W
Pfu5 + - - -
Pfu1 + + - -
Pfu2 + + + -
Pfu10 + + + +
스크리닝 결과에 기반하여 선택된 용해물을 서열 분석을 위해 제출하고, 선택에 기반하여 아미노산을 식별하였다. 대조군 추출물은 천연 뉴클레오티드와 유사한 활성(U/μl)을 나타내었지만(도 5), A486L-함유 돌연변이 폴리머라제(Pfu1, Pfu2, Pfu10) 만이 라이트닝 종결자를 활용할 수 있었다(도 6). Y546H 자체는 라이트닝 종결자 혼입을 허용하지 않는다(도 7a 및 7b). 그러나, A486L 및 Y546H의 조합(Pfu2 및 Pfu10에서)은 LTC의 혼입을 최대화하는 것으로 밝혀졌으며(도 6), 이는 히스티딘을 티로신으로 치환시킴으로써 극복될 수 있는 LTC와 Y546 사이의 불리한 상호작용을 시사한다. 실시예 3에서 보이듯이, K477W는 전장 판독물의 분획을 증가시킴으로써 서열분석에 유리하다. 그러나, K477W(Pfu10에서)가 LTA 및 LTU 혼입에 부정적인 영향을 미치거나 그렇지 않으면 부착된 형광단의 트립토판(W) 소광으로 인해 최종 형광에 부정적인 영향을 미치기 때문에, 상기 메커니즘은 혼입 효율과 무관한 것으로 보이다.
다음의 코돈들이 포화되었다: 266, 267, 268, 269, 270, 329, 330, 332, 333, 336, 399, 400, 403, 404, 407, 408, 409, 410, 411, 450, 451, 452, 453, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 475, 476, 477, 478, 479, 480, 481, 482, 483, 485, 486, 487, 488, 489, 490, 491, 492, 493, 494, 495, 496, 497, 498, 499, 500, 515, 522, 545, 546, 577, 579, 580, 581, 582, 584, 591, 595, 603, 606, 607, 608, 612, 613, 614, 664, 665, 666, 668, 669, 674, 675, 676. 스크리닝된 87개 위치 중 16개 위치가 돌연변이되어 LTA 및/또는 LTC의 혼입에 유의미한(>4X 야생형 Pfu) 개선을 수행할 수 있었다. 하기 표는 LTA 및 LTC의 개선된 혼입을 제공하는 돌연변이를 보여준다. 4개 위치(L409, A486, F494, Y497)가 치환가능성이 높은 것으로 보이며, 특정 아미노산 대체(L409H, L409F, A486Y, A486R, A486H, A486N, F494C, F494N, F494I, F494T)는 Pfu A486L 대조군(Pfu10)에 비해 우수한 혼입 신호를 생성한다.
*서열분석되지 않음
N492에서의 돌연변이(N492I/V/P)는 LTC 혼입에만 유리한 것으로 나타난 것이 관찰되었다. 또한, L409(L409D/C/V/H/F), A486(A486Y/R/F/I/H/N) 및 Y497(Y497H/I)에서의 특정 치환은 LTA보다 LTC 흡수에 더 큰 영향을 미치는 것으로 보인다. 이러한 결과는 Y546 및 N492에서의 치환(뉴클레오티드의 트라이포스페이트 부분과 H-결합을 형성함)이 결합 포켓에서 LTC의 배향을 변경하여 그의 고유한 염기, 링커 및/또는 염료 모이어티를 더 잘 수용함을 시사한다. 도 8은 iCn3D 웹-기반 구조 뷰어를 사용하여 시각화된, 9°N DNA 폴리머라제(5OMV) 구조에서 유리한 돌연변이 위치를 보여준다. LTC에만 유리한 돌연변이는 N492 및 Y546에 위치한다. LTA에 비해 상대적으로 더 높은 LTC 혼입을 제공하는 돌연변이는 L409, A486 및 Y497에 위치한다.
실시예 7
본 실시예는 주형-비의존성 효소적 올리고뉴클레오티드 합성에서 본 발명의 돌연변이 Pfu 폴리머라제의 실시양태의 성능을 평가한다. 본 실시예에서는, 폴리머라제 TdT 및 Pfu26(Pfu10 + L409Y)(서열번호 4) 및 Pfu48(Pfu26, 단 A486L 대신 A486R 함유)(서열번호 5)을 주형-비의존적 DNA 합성 분석에서 비교하였다. 상기 분석은 dATP(도 1d), LTA-1(도 1e) 또는 LTA-2(도 1f)를 사용하여 수행되었다. LTA-1 및 LTA-2는 분자에 연결된 임의의 염료 또는 기타 리포터를 포함하지 않았다.
주형-비의존적 DNA 합성 반응은 7.5U TdT(Promega) 또는 180nM(프라이머에 비해 3X) Pfu26(D141A/E143A/A486L/Y546H/K477W/L409Y) 또는 Pfu48(D141A/E143A/ A486R/Y546H/K477W/L409Y)을 사용하였다. CoCl2(Promega) 또는 1X ThermoPol 완충액(NEB)과 함께 1X TdT 완충액을 함유하는 2중 반응에서 다양한 농도의 dATP를 2μM(TdT) 또는 60nM(Pfu) T7 FOR 프라이머(6'Fam TAATACGACTCACTATAGGG)(서열번호 6)에 첨가하였다. 반응물을 37℃(TdT) 또는 60℃(Pfu)에서 30분 동안 배양한 다음, 열(TdT; 70℃에서 10분) 또는 EDTA(1μl 500μM EDTA)로 불활성화시켰다. 반응 생성물을 Stratalinker(15와트 전구, 365nM, 10분)를 사용하여 UV에 노출시켰다. 반응물을 물(TdT, 1:333; Pfu, 1:10)에 희석하고, 1μl(TdT) 또는 0.5μl(Pfu) 분취량을 HiDI/LIZ 120 크기 표준을 사용하여 10μl까지 늘렸다. 생성물을 95℃에서 5분간 가열하고, 얼음 위에서 2분간 냉각한 다음, ABI 3500 모세관 전기영동 시스템(50cM 모세관, 필터 세트 #5, 분석 = GE5 LIZ120)에서 분석하였다.
말단 트랜스퍼라제 활성은 주형-비의존적 dATP 부가 수로 측정되었다. TdT에 대한 결과는 도 9a에, Pfu26에 대한 결과는 도 9b에, Pfu48에 대한 결과는 도 9c에 나타내었다. 말단 트랜스퍼라제 활성은 dATP 또는 프라이머 농도의 함수로서 각각 증가하거나 감소하는 것으로 밝혀졌다. 이러한 결과는, L409Y가 결여된 Pfu 돌연변이체(예를 들어, Pfu10)가 비-주형 dA-부가를 수행하지 못하므로 L409Y 돌연변이가 말단 트랜스퍼라제 활성을 제공함을 입증한다(하기 도 10c 참조).
실시예 8
본 실시예에서는, 실시예 7에 기술된 조건을 사용하여 α-티오트라이포스페이트의 Rp+Sp 라세미 혼합물로서 LTA-2(도 1f)를 사용하여 프라이머 연장을 수행하였다. 도 10a는 LTA-2의 4가지 상이한 농도(5μM, 10μM, 50μM 및 100μM)에서의 결과를 보여준다. 도 9a와 10a를 비교하면 TdT가 최고 100μM 농도에서도 dATP만큼 효율적으로 LTA-2 종결자를 혼입하지 않았음을 보여준다.
추가의 실험에서, 2개의 단일-가닥 올리고뉴클레오타이드의 등몰 혼합물(각각 3μM)을 사용하여 단일-염기 연장 반응(10μl)을 수행하였다:
CE2: 6Fam-TAATACGACTCACTATAGGGCAGGAAACAGCTATGACCAGGGGATCAGC(서열번호 7) 및
T7: 6Fam-TAATACGACTCACTATAGGG(서열번호 8)
둘 다 Fam으로 표지되었지만 모세관 전기영동을 사용하여 그들의 길이로 구별가능하였다. 프라이머 연장 반응은 18nM 폴리머라제 농도에서 다음의 3가지 Pfu 돌연변이체를 사용하여 수행하였다:
Pfu10: D141A/E143A/A486L/Y546H/K477W 돌연변이를 갖는 Pfu 폴리머라제(서열번호 2)
Pfu26: D141A/E143A/A486L/Y546H/K477W/L409Y 돌연변이를 갖는 Pfu 폴리머라제(서열번호 4)
Pfu48: D141A/E143A/A486R/Y546H/K477W/L409Y 돌연변이를 갖는 Pfu 폴리머라제(서열번호 5)
연장 반응은 또한 5μM의 최종 농도에서 Rp+Sp 라세미 혼합물(즉, LTA-2, LTU-2, LTG-2 및 LTC-2)에서 개별 αS-변형된 LT를 사용하였다. LTU-2, LTG-2 및 LTC-2는 모두 아데닌 대신 우라실, 구아닌 및 시토신을 갖는, LTA-2와 같은 C7 또는 C5-하이드록시메틸-α-3급-부틸-2-니트로벤질 변형된 가역적 종결자이다. 이들 실험에서, 가역적 종결자는 염료를 포함하지 않았다. 실시예 7에 기술된 바와 같이 반응물을 배양하고, 중단하고, UV-처리하고 분석하였다.
도 10b는 어떠한 폴리머라제도 포함하지 않은 대조군 연장 반응 구성의 결과를 보여준다. 도 10c는 Pfu10 폴리머라제를 사용한 경우의 연장 반응 결과를 보여주며, 도 10d 및 10e는 각각 Pfu26 폴리머라제 및 Pfu48 폴리머라제를 사용한 결과를 보여준다. 도 10a를 도 10c 내지 10e와 비교하면 L409Y-함유 Pfu 돌연변이체(Pfu26, Pfu48)가 3'-OH 비차단 가역적 종결자 LTA-2, LTU-2, LTG-2 및 LTC-2를 혼입하는데 있어서 송아지 흉선 말단 트랜스퍼라제(TdT)보다 우수함을 보여준다. 또한, 예비 데이터는 프라이머 연장 효율이 프라이머 서열(CE2>P7) 및 염기(LTA, LTU > LTG > LTC)에 의해 영향 받음을 보여준다.
Pfu26은 또한 특정 올리고뉴클레오티드를 직접적으로 말단-표지하는데 사용될 수 있으며(예를 들어, 미국 특허출원 공개 번호 20200216841호에 개시된 바와 같은 원위치(in situ) 하이브리드화 용도의 경우), 이는 5' 돌출부(overhang)를 갖는 상보적 주형의 사용(및 후속 제거)을 배제한다.
실시예 9
본 실시예에서는 단일-가닥 프라이밍 가닥의 3' 말단에 3'-OH 비차단 가역적 종결자(도 1e에 나타낸 LTA-1, 또는 도 1f에 나타낸 LTA-2)의 부가를 시험하였다. 연장 반응은 2μM 또는 80nM의 프라이밍 가닥 및 다양한 농도(100/50/10/5/1μM)의 가역적 종결자를 사용하여 수행하였다. Pfu26 폴리머라제의 성능을 TdT 폴리머라제와 비교하였다.
프라이머 연장은 7.5 U 송아지 흉선 TdT, 1X Promega TdT 완충액(CoCl2 함유), 다양한 농도의 LTA-1(100μM, 50μM, 10μM, 5μM 또는 1μM), 및 2μM(도 11a 내지 11c) 또는 80nM(도 11d 내지 11f)의 프라이밍 가닥(Fam-표지된 T7 F 프라이머(6Fam TAATACGACTCACTATAGGG), 서열번호 8)을 함유하는 2중 25μl 반응에서 수행하였다. 대조군은 폴리머라제를 첨가하지 않고 수행하였다. 프라이머 연장은 또한 Pfu26 돌연변이 폴리머라제, 60nM의 프라이밍 가닥 및 다양한 농도(10μM 또는 5μM 또는 1μM)의 LTA-1 또는 LTA-2를 함유하는 반응에서 수행하였다.
반응물을 37℃에서 30분 동안 배양한 후, 70℃에서 10분 동안 열-사멸시켰다. 반응 생성물을 절반으로 나누고, 절반을 실시예 7에 기술된 바와 같이 UV로 처리하였다. 이어서, 반응물을 물에 1:333(2μM 프라이머) 또는 1:13(80nM 프라이머)으로 희석하고, 0.5μl 분량을 실시예 7에 제공된 조건을 이용하여 모세관 전기영동으로 분석하였다.
TdT 폴리머라제를 사용한 반응의 결과는 도 11a 내지 11f에 나타내었다. Pfu26 폴리머라제를 사용한 반응의 결과는 도 12a 및 12b에 나타내었다.
TiEOS에 "흔적없는(scarless)" LT를 사용할 가능성은 "츄백(chewback) 활성"을 제거하고 절단/종결 효율을 개선하기 위해 NGS에서 사용되는 2-니트로벤질 모이어티 상의 α-티오-트라이포스페이트 및 α-3급-부틸 변형이 결여된 프로토타입 가역적 종결자인 LTA-1을 사용하여 입증되었다. 도 11a 내지 11c에 나타낸 바와 같이, TdT는 더 고도로 치환된 LTA-2보다 훨씬 더 효율적으로 LTA-1을 혼입시킨다(도 10a). 그러나, 종결 효율이 부족하고, 단일 합성 주기에 3개 염기(2μM 프라이머에서) 또는 그 이상(80nM 프라이머에서)이 혼입된다.
TdT와 비교하여, Pfu26은 1, 5 및 10μM 농도에서 부가된 염기의 수를 기준으로 LTA-1을 덜 효율적으로 혼입하는 것으로 보인다(도 11d 내지 11f 대 도 12a). 그러나, LTA-2를 혼입하지 못한 TdT와 달리, Pfu26은 단일 배양 단계에서 효율적인 혼입 및 종결을 제공하였다(도 12b 참조). 상기 결과는 천연 및 비-동족 핵산 중합체 각각의 효소-매개 합성을 달성하기 위해 "흔적없는" 가역적 종결자 및 변형된 가역적 종결자 둘 다와 함께 특수 Pfu 돌연변이체를 사용할 실행가능성을 입증한다.
실시예 10
본 실시예는 Pfu26 돌연변이 폴리머라제를 사용하여 단일-가닥 프라이밍 가닥의 3' 말단에 3'-OH 비차단 가역적 종결자(도 1f에 나타낸 LTA-2)의 다주기 부가를 시험하였다. 7-데아자-C7하이드록시메틸기에 부착된 α-3급-부틸 치환된 2-니트로벤질 종결 기를 갖는 변형된 LTA-2를 갖는 Pfu26을 사용하여 실시예 7에 기술된 바와 같이 단일-염기 연장 분석을 수행하였다. 변형된 LTA-2는 선택적으로 αS 트라이포스페이트 변형을 함유하고, Sp 이성질체를 단리하기 위해 HPLC 정제되었다(도 13a 및 13c). 각각의 혼입 주기(3 주기 - 도 13a 및 13B; 6 주기 - 도 13c)에서, 1μl를 제거하고 ABI 3500 분석을 위해 얼음 위에 저장하였다. 각각의 주기에서, 나머지 반응 부피는 MyOne T1 비오티닐화 비드를 사용하여 다음과 같이 정제하였다(3-주기 실험의 경우). 127.5μl의 비드를 1ml 세척 용액으로 2회 세척하고 세척 용액과 함께 원래 부피로 재현탁시켰다. 스페이서(5'-CCC TAT AGT GAG TCG TAT ACG GAG CAT A-비오틴)를 갖는, 비오틴화된 안티센스 T7(밑줄 친) 프라이머를 180nM의 최종 농도로 첨가하였다. 비드 및 포획 올리고를 실온에서 300rpm으로 30분 동안 혼합하고, 500μl 세척액으로 2회 세척하고, 150μl의 동일한 세척액에 재현탁시켰다. 10μl의 비드/포획 올리고 혼합물을 9μl의 각 혼입 반응(주기 2 내지 6)에 첨가하고 실온에서 300rpm으로 30분 동안 배양하였다. 이어서, 혼합물을 실온에서 500μl 세척 용액으로 2회 세척하고 10μl Thermopol 완충액에 재현탁시켰다. Fam-T7 올리고를 방출하기 위해, 반응을 95℃에서 5분 동안 배양하고, 신속하게 자석에 적용한 후 다음 번 혼입을 위해 각각의 용출액 8μl를 제거하였다. 정제(주기 2 내지 6) 후에, 2μl의 새로운 효소/LTA 혼합물을 첨가하고, 전술한 바와 같이 프라이머 연장을 수행하고 분석하였다.
결과(도 13a 내지 13c에 나타냄)는 Pfu26이 7-데아자-7-하이드록시메틸-α-3급-부틸-2-니트로베질 변형된 LTA와 함께, 2 내지 3회의 TiEOS 후에 100%의 효율로 개별 생성물을 생성하지 않았음을 시사하였다. αS 변형의 제거(도 13b) 또는 7-데아자-7-하이드록시메틸-α-3급-부틸-2-니트로벤질 변형된 LTA의 키랄적으로 순수한 αS(Sp 이성질체)의 혼입(도 13a, 13c)은 부산물과 함께 문제를 해결하지 못했다. 그러나, 결과는 천연 및 변형된 긴 핵산 중합체의 효소적 합성을 달성하기 위해 본 발명의 돌연변이 폴리머라제의 실시양태와 함께 사용될 수 있는 "흔적없는" 비-이성질체 가역적 종결자를 설계하기 위한 개념 검증(proof-of-concept)을 입증한다.
예시적인 실시양태
다양한 실시양태가 기술되어 있지만, 본 개시내용의 교시내용은 기술된 특정 실시양태로 제한되지 않으며, 따라서 물론 다양할 수 있음을 이해해야 한다.
실시양태 1. 3'-OH 비차단 가역적 종결자 및 돌연변이 폴리머라제를 포함하는 조성물로서, 돌연변이 폴리머라제가 서열번호 2와 적어도 96% 동일한 아미노산 서열을 포함하고 Pfu 폴리머라제의 K477, A486 및 Y546의 아미노산 위치와 기능적으로 동등한 위치에 아미노산 돌연변이를 포함하는 조성물.
실시양태 2. 돌연변이 폴리머라제가 Pfu 폴리머라제의 위치 486과 기능적으로 동등한 위치에 A486X 돌연변이를 포함하고, 이때, X는 알라닌을 제외한 임의의 아미노산인, 실시양태 1의 조성물.
실시양태 3. A486X 돌연변이가 A486F, A486Y, A486N, A486R 또는 A486H인, 실시양태 2의 조성물.
실시양태 4. 돌연변이 폴리머라제가 Pfu 폴리머라제의 위치 546과 기능적으로 동등한 위치에 Y546H 돌연변이를 추가로 포함하는, 실시양태 1 내지 3 중 어느 하나의 조성물.
실시양태 5. 돌연변이 폴리머라제가 Pfu 폴리머라제의 위치 477과 기능적으로 동등한 위치에 K477W 돌연변이를 추가로 포함하는, 실시양태 1 내지 4 중 어느 하나의 조성물.
실시양태 6. 돌연변이 폴리머라제가 Pfu 폴리머라제의 위치 F494와 기능적으로 동등한 위치에 돌연변이를 추가로 포함하는, 실시양태 1 내지 5 중 어느 하나의 조성물.
실시양태 7. F494 돌연변이가 F494C, F494I, F494N 또는 F494T인, 실시양태 6의 조성물.
실시양태 8. 돌연변이 폴리머라제가 피로코커스 폴리머라제의 유도체인, 전술한 실시양태 중 어느 하나의 조성물.
실시양태 9. 돌연변이 폴리머라제가 서열번호 2의 아미노산 서열을 포함하는, 실시양태 8의 조성물.
실시양태 10. 돌연변이 폴리머라제가 써모코커스 폴리머라제의 유도체인, 실시양태 1 내지 7 중 어느 하나의 조성물.
실시양태 11. 혼입 반응에 충분한 조건 하에서 핵산을 포함하는 프라이밍 가닥을 뉴클레오티드 및 돌연변이 폴리머라제와 접촉시키는 것을 포함하는, 상기 프라이밍 가닥에 뉴클레오티드를 혼입시키는 방법으로서,
상기 돌연변이 폴리머라제가 서열번호 2와 적어도 96% 동일한 아미노산 서열을 포함하고 Pfu 폴리머라제의 K477, A486 및 Y546의 아미노산 위치와 기능적으로 동등한 위치에 아미노산 돌연변이를 포함하는, 방법.
실시양태 12. 뉴클레오티드가 3'-OH 비차단 가역적 종결자인, 실시양태 11의 방법.
실시양태 13. 다음을 포함하는, 폴리뉴클레오티드 서열분석 방법:
(a) 주형 및 프라이밍 가닥을 포함하는 이중체를 형성하는 단계(이때, 주형은 서열분석될 표적 핵산 및 프라이밍 가닥의 적어도 일부에 상보적인 프라이머 결합 부위를 포함함);
(b) 프라이밍 가닥을 가역적 종결자 뉴클레오티드 및 돌연변이 폴리머라제와 결합시키는 단계(이때, 상기 돌연변이 폴리머라제는 서열번호 2와 적어도 96% 동일한 아미노산 서열을 포함하고 Pfu 폴리머라제의 K477, A486 및 Y546의 아미노산 위치와 기능적으로 동등한 위치에 아미노산 돌연변이를 포함함);
(c) 주형-의존적 반응으로 프라이밍 가닥의 3'-말단에 가역적 종결자를 혼입시키는 단계; 및
(d) 혼입된 가역적 종결자 뉴클레오티드를 식별하여, 주형의 서열을 결정하는 단계.
실시양태 14. 3'-OH 방법이 단계 (c) 및 (d)를 적어도 80회 반복하는 것을 추가로 포함하는, 실시양태 13의 방법.
실시양태 15. 프라이밍 가닥, 3'-OH 비차단 가역적 종결자 및 돌연변이 폴리머라제를 포함하는 조성물로서,
상기 돌연변이 폴리머라제가 서열번호 1과 적어도 80% 동일한 아미노산 서열을 포함하고,
상기 돌연변이 폴리머라제가 Pfu 폴리머라제의 위치 L270, E330, Q332, L333, L409, P451, L453, L457, E476, L489, L490, N492, F494, Y497 및 E581과 기능적으로 동등한 위치에 하나 이상의 돌연변이를 추가로 포함하고;
상기 돌연변이 폴리머라제가 서열번호 11의 DNA 폴리머라제의 혼입 활성보다 적어도 4배 더 높은 3'-OH 비차단 가역적 종결자에 대한 혼입 활성을 갖는,
조성물.
실시양태 16. 아미노산 서열이 서열번호 1과 적어도 85% 동일한, 실시양태 15의 조성물.
실시양태 17. 아미노산 서열이 서열번호 1과 적어도 90% 동일한, 실시양태 15의 조성물.
실시양태 18. 아미노산 서열이 서열번호 1과 적어도 95% 동일한, 실시양태 15의 조성물.
실시양태 19. 돌연변이 폴리머라제가 Pfu 폴리머라제의 위치 266, 267, 268, 269, 329, 336, 399, 400, 403, 404, 407, 408, 410, 411, 450, 452, 455, 456, 458, 459, 460, 461, 462, 463, 464, 465, 466, 475, 477, 478, 479, 480, 481, 482, 483, 485, 487, 488, 491, 493, 495, 496, 498, 499, 500, 515, 522, 545, 546, 577, 579, 580, 582, 584, 591, 595, 603, 606, 607, 608, 612, 613, 614, 664, 665, 666, 668, 669, 674, 675 및 676과 기능적으로 동등한 임의의 위치에 돌연변이를 포함하지 않는, 실시양태 15 내지 18 중 어느 하나의 조성물.
실시양태 20. 돌연변이 폴리머라제가 피로코커스 폴리머라제의 유도체인, 실시양태 15 내지 19 중 어느 하나의 조성물.
실시양태 21. 돌연변이 폴리머라제가 써모코커스 폴리머라제의 유도체인, 실시양태 15 내지 19 중 어느 하나의 조성물.
실시양태 22. 조성물이 프라이밍 가닥의 적어도 일부에 상보적인 프라이머 결합 부위를 포함하는 주형을 추가로 포함하는, 실시양태 15 내지 21 중 어느 하나의 조성물.
실시양태 23. 조성물이 546H 및 486X 돌연변이를 추가로 포함하는, 실시양태 15 내지 22 중 어느 하나의 조성물.
실시양태 24. 조성물이 프라이밍 가닥에 상보적인 주형을 함유하지 않는, 실시양태 15 내지 23 중 어느 하나의 조성물.
실시양태 25. 혼입 반응에 충분한 조건 하에서 프라이밍 가닥을 3'-OH-비변형 가역적 종결자 및 돌연변이 폴리머라제와 접촉시키고; 프라이밍 가닥의 3'-말단에 3'-OH-비변형 가역적 종결자를 혼입시키는 것을 포함하는, 3'-OH-비변형 가역적 종결자를 프라이밍 가닥에 혼입시키는 방법으로서,
돌연변이 폴리머라제가 서열번호 1과 적어도 80% 동일한 아미노산 서열 및 Pfu 폴리머라제의 위치 L270, E330, Q332, L333, L409, P451, L453, L457, E476, L489, L490, N492, F494, Y497 및 E581과 기능적으로 동등한 위치에 하나 이상의 돌연변이를 포함하는,
방법.
실시양태 26. 3'-OH-비변형 가역적 종결자가 2-니트로벤질-변형된 뉴클레오티드인, 실시양태 25의 방법.
실시양태 27. 3'-OH-비변형 가역적 종결자가 C7- 또는 C5-하이드록시메틸-α-3급-부틸-2-니트로벤질 변형된 뉴클레오티드 및 그의 α-티오 유도체인, 실시양태 25의 방법.
실시양태 28. 상기 돌연변이 폴리머라제가 Pfu 폴리머라제의 위치 492와 기능적으로 동등한 위치에 하나 이상의 아미노산 돌연변이를 포함하고, 상기 방법이 종결자를 선택적으로 혼입시키는 것을 포함하는, 실시양태 25 내지 27 중 어느 하나의 방법.
실시양태 29. 돌연변이가 N492I, N492V 또는 N492P로부터 선택되는, 실시양태 28의 방법.
실시양태 30. 시토신 염기를 포함하는 3'-OH 비차단 가역적 종결자가 돌연변이 폴리머라제에 의해 선택적으로 혼입되는, 실시양태 28의 방법.
실시양태 31. 프라이밍 가닥, 3'-OH-비변형 가역적 종결자, 및 서열번호 2와 96% 이상 동일한 돌연변이 폴리머라제를 포함하고,
Pfu 폴리머라제의 위치 546과 기능적으로 동등한 위치에 Y546H 돌연변이;
Pfu 폴리머라제의 위치 409와 기능적으로 동등한 위치에 L409Y, L409H 또는 L409F 돌연변이; 및
Pfu 폴리머라제의 위치 486과 기능적으로 동등한 위치에 A486X 돌연변이(이때, X는 알라닌을 제외한 임의의 아미노산임)
를 포함하는 조성물.
실시양태 32. 조성물이 프라이밍 가닥에 상보적인 주형을 함유하지 않는, 실시양태 31의 조성물.
실시양태 33. 돌연변이 폴리머라제가 Pfu 폴리머라제의 위치 L270, E330, Q332, L333, P451, L453, L457, E476, L489, L490, N492, F494, Y497 및 E581과 기능적으로 동등한 위치에 하나 이상의 돌연변이를 추가로 포함하는, 실시양태 31 또는 32의 조성물.
실시양태 34. 돌연변이 폴리머라제가 서열번호 4 또는 서열번호 5의 아미노산 서열을 포함하는, 실시양태 31 또는 32의 조성물.
실시양태 35. 돌연변이 폴리머라제가 서열번호 11의 DNA 폴리머라제의 혼입 활성보다 적어도 2배 더 높은 혼입 활성을 갖는, 실시양태 31 내지 34 중 어느 하나의 조성물.
실시양태 36. 돌연변이 폴리머라제가 피로코커스 폴리머라제의 유도체인, 실시양태 31 내지 35 중 어느 하나의 조성물.
실시양태 37. 돌연변이 폴리머라제가 서열번호 2의 아미노산 서열을 포함하는, 실시양태 31 내지 36 중 어느 하나의 조성물.
실시양태 38. 돌연변이 폴리머라제가 써모코커스 폴리머라제의 유도체인, 실시양태 31 내지 35 중 어느 하나의 조성물.
실시양태 39. 프라이밍 가닥을 3'-OH-비변형 가역적 종결자 및 돌연변이 폴리머라제와 결합시키는 것을 포함하는, 주형-비의존적 반응으로 단일 뉴클레오티드를 프라이밍 가닥에 혼입시키는 방법으로서,
돌연변이 폴리머라제가 서열번호 2와 적어도 96% 동일하고,
Pfu 폴리머라제의 위치 546과 기능적으로 동등한 위치에 Y546H 돌연변이;
Pfu 폴리머라제의 위치 409와 기능적으로 동등한 위치에 L409Y, L409H 또는 L409F 돌연변이; 및
Pfu 폴리머라제의 위치 486과 기능적으로 동등한 위치에 A486X 돌연변이(이때, X는 알라닌을 제외한 임의의 아미노산임)를 포함하고;
종결자의 혼입이 서열번호 11의 돌연변이 DNA 폴리머라제에 대한 것보다 적어도 2배 더 높은,
방법.
실시양태 40. 프라이밍 가닥, 3'-OH-비변형 가역적 종결자, 및 돌연변이 DNA 폴리머라제를 결합시키고, 3'-OH-비변형 가역적 종결자를 프라이밍 가닥에 혼입시키는 것을 포함하는, 주형-비의존적 올리고뉴클레오티드 합성 방법으로서,
돌연변이 DNA 폴리머라제가 다음을 포함하는, 방법:
서열번호 2와 적어도 96% 동일한 아미노산 서열;
Pfu 폴리머라제의 위치 546과 기능적으로 동등한 위치에 히스티딘으로의 Y546H 돌연변이;
Pfu 폴리머라제의 위치 409와 기능적으로 동등한 위치에 L409Y, L409H 또는 L409F 돌연변이; 및
Pfu 폴리머라제의 위치 486과 기능적으로 동등한 위치에 A486X 돌연변이(이때, X는 알라닌을 제외한 임의의 아미노산임).
실시양태 41. 폴리머라제가 Pfu 폴리머라제의 위치 L270, E330, Q332, L333, P451, L453, L457, E476, L489, L490, N492, F494, Y497 및 E581과 기능적으로 동등한 위치에 하나 이상의 돌연변이를 추가로 포함하는, 실시양태 39 또는 40의 방법.
실시양태 42. 3'-OH-비변형 가역적 종결자가 2-니트로벤질-변형된 뉴클레오티드인, 실시양태 39 내지 41 중 어느 하나의 방법.
실시양태 43. 3'-OH-비변형 가역적 종결자가 C7- 또는 C5-하이드록시메틸-α-3급-부틸-2-니트로벤질 변형된 뉴클레오티드 및 그의 α-티오 유도체인, 실시양태 39 내지 41 중 어느 하나의 방법.
인용 및 참조문헌
문헌[Jensen, et al., "Template-Independent Enzymatic Oligonucleotide Synthesis (TiEOS): Its History, Prospects, and Challenges." Biochemistry. 2018 Mar 27;57(12):1821-1832. doi: 10.1021/acs.biochem.7b00937. Epub 2018 Mar 13. PMID: 29533604].
문헌[Ramsay, et al., "CyDNA: synthesis and replication of highly Cy-dye substituted DNA by an evolved polymerase." J Am Chem Soc. 2010 Apr 14;132(14):5096-104. doi: 10.1021/ja909180c. PMID: 20235594; PMCID: PMC2850551].
문헌[Cozens, et al., "A short adaptive path from DNA to RNA polymerases." Proc Natl Acad Sci U S A. 2012 May 22;109(21):8067-72. doi: 10.1073/pnas.1120964109. Epub 2012 May 7. PMID: 22566643; PMCID: PMC3361454].
문헌[Hansen, et al., "Engineered split in Pfu DNA polymerase fingers domain improves incorporation of nucleotide gamma-phosphate derivative." Nucleic Acids Res. 2011 Mar;39(5):1801-10. doi: 10.1093/nar/gkq1053. Epub 2010 Nov 9. PMID: 21062827; PMCID: PMC3061061].
문헌[Palluk, et al., "De novo DNA synthesis using polymerase-nucleotide conjugates." Nat Biotechnol. 2018 Aug;36(7):645-650. doi: 10.1038/nbt.4173. Epub 2018 Jun 18. PMID: 29912208].
문헌[Eisenstein, "Enzymatic DNA synthesis enters new phase." Nat Biotechnol. 2020 Oct;38(10):1113-1115. doi: 10.1038/s41587-020-0695-9. PMID: 33020638].
문헌[Hoff, et al. "Enzymatic Synthesis of Designer DNA Using Cyclic Reversible Termination and a Universal Template." ACS Synth Biol. 2020 Feb 21;9(2):283-293. doi: 10.1021/acssynbio.9b00315. Epub 2020 Jan 14. PMID: 31895546].
문헌[Mathews, et al., "3'-O-Caged 2'-Deoxynucleoside Triphosphates for Light-Mediated, Enzyme-Catalyzed, Template-Independent DNA Synthesis." Curr Protoc Nucleic Acid Chem. 2017 Dec 24;71:13.17.1-13.17.38. doi: 10.1002/cpnc.41. PMID: 29275537].
문헌[Pinheiro, et al., "Synthetic genetic polymers capable of heredity and evolution." (2012) Science 336:341-4. doi: 10.1126/science.1217622. PMID: 22517858].
문헌[Kennedy, et al., "The Mechanistic Architecture of the Thermostable Pyrococcus Furiosus Family B DNA Polymerase Motif A and its Interaction with dNTP Substrate." (2009) Biochemistry 48(47):11161-11168. doi: 10.1021/bi9010122. PMCID: PMC3097049]
문헌[Wu, et al., "Termination of DNA synthesis by N6 -alkylated, not 3'-O-alkylated, photocleavable 2'-deoxyadenosine triphosphates," Nucleic Acids Research, Volume 35, Issue 19, 1 October 2007, Pages 6339-6349]
문헌[Litosh, et al., "Improved nucleotide selectivity and termination of 3'-OH-unblocked reversible terminators by molecular tuning of 2-nitrobenzyl alkylated HOMedU triphosphates," Nucleic Acids Research, Volume 39, Issue 6, 1 March 2011, Page e39]
문헌[Stupi, et al., "Stereochemistry of Benzylic Carbon Substitution Coupled with Ring Modification of 2-Nitrobenzyl Groups as Key Determinants for Fast-Cleaving Reversible Terminators", Angew. Chem. Int. Ed. 2012, 51, 1724 -1727]
문헌[Gardner, et al., "Rapid incorporation kinetics and improved fidelity of a novel class of 3'-OH-unblocked reversible terminators", Nucleic Acids Research, 40(15):7404-7415 (2012)]
문헌[Gardner, et al., "Determinants of nucleotide sugar recognition in an archaeon DNA polymerase", Nucleic Acids Research, 27(12):2545-53 (1999)]
문헌[Evans, et al., "Improving dideoxynucleotide-triphosphate utilisation by the hyper-thermophilic DNA polymerase from the archaeon Pyrococcus furiosus", Nucleic Acids Research, 28(5):1059-66 (2000)]
문헌[Ramsay, et al., "CyDNA: Synthesis and Replication of Highly Cy-Dye Substituted DNA by an Evolved Polymerase" JACS 132:5096-5104 (2010)]
문헌[Hertzog, et al., "A high-performance, low-cost approach to next-generation sequencing", BioOptics World. 2011 Issue Nov/Dec 2011]
스미스 등(Smith, et al.)의 미국 특허 제9,273,352호
보마티 등(Bomati, et al.)의 미국 특허 제9,677,057호
레이싱어 등(Reisinger, et al.)의 미국 특허 제9,677,059호
첸 등(Chen, et al.)의 미국 특허 제9,765,309호
첸 등(Chen, et al.)의 미국 특허출원 공개 번호 20160032377호
아레지 등(Arezi, et al.)의 미국 특허출원 공개 번호 20030228616호
우 등(Wu, et al.)의 미국 특허 제8,969,535호
리토쉬 등(Litosh, et al.)의 미국 특허 제9,200,319호
스투피 등(Stupi, et al.)의 미국 특허 제10,041,115호
에버바인 등(Eberwine, et al.)의 미국 특허출원 공개 번호 20200216841호
SEQUENCE LISTING <110> Agilent Technologies, Inc. <120> POLYMERASE MUTANTS AND USE WITH 3'-OH UNBLOCKED REVERSIBLE TERMINATORS <130> 20200132-01 (027644-8398) <140> PCT/US2021/070785 <141> 2021-06-29 <160> 12 <170> PatentIn version 3.5 <210> 1 <211> 775 <212> PRT <213> Pyrococcus furiosus <400> 1 Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile 1 5 10 15 Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg 20 25 30 Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile 35 40 45 Glu Glu Val Lys Lys Ile Thr Gly Glu Arg His Gly Lys Ile Val Arg 50 55 60 Ile Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Ile 65 70 75 80 Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Thr Ile 85 90 95 Arg Glu Lys Val Arg Glu His Pro Ala Val Val Asp Ile Phe Glu Tyr 100 105 110 Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro 115 120 125 Met Glu Gly Glu Glu Glu Leu Lys Ile Leu Ala Phe Asp Ile Glu Thr 130 135 140 Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile 145 150 155 160 Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ile Thr Trp Lys Asn Ile 165 170 175 Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys 180 185 190 Arg Phe Leu Arg Ile Ile Arg Glu Lys Asp Pro Asp Ile Ile Val Thr 195 200 205 Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu 210 215 220 Lys Leu Gly Ile Lys Leu Thr Ile Gly Arg Asp Gly Ser Glu Pro Lys 225 230 235 240 Met Gln Arg Ile Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Ile 245 250 255 His Phe Asp Leu Tyr His Val Ile Thr Arg Thr Ile Asn Leu Pro Thr 260 265 270 Tyr Thr Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Lys Pro Lys Glu 275 280 285 Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn 290 295 300 Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Ala Thr Tyr 305 310 315 320 Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ile Gln Leu Ser Arg Leu 325 330 335 Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 340 345 350 Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Val Ala 355 360 365 Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser 370 375 380 Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn 385 390 395 400 Ile Val Tyr Leu Asp Phe Arg Ala Leu Tyr Pro Ser Ile Ile Ile Thr 405 410 415 His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr 420 425 430 Asp Ile Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Ile Pro Gly 435 440 445 Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile 450 455 460 Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Lys Ile Leu Leu 465 470 475 480 Asp Tyr Arg Gln Lys Ala Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly 485 490 495 Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu 500 505 510 Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu 515 520 525 Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ile Asp Thr Asp Gly 530 535 540 Leu Tyr Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Ile Lys Lys Lys 545 550 555 560 Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu 565 570 575 Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys 580 585 590 Lys Arg Tyr Ala Val Ile Asp Glu Glu Gly Lys Val Ile Thr Arg Gly 595 600 605 Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln 610 615 620 Ala Arg Val Leu Glu Thr Ile Leu Lys His Gly Asp Val Glu Glu Ala 625 630 635 640 Val Arg Ile Val Lys Glu Val Ile Gln Lys Leu Ala Asn Tyr Glu Ile 645 650 655 Pro Pro Glu Lys Leu Ala Ile Tyr Glu Gln Ile Thr Arg Pro Leu His 660 665 670 Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Lys Leu Ala 675 680 685 Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val 690 695 700 Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Ile Leu Ala Glu Glu 705 710 715 720 Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn 725 730 735 Gln Val Leu Pro Ala Val Leu Arg Ile Leu Glu Gly Phe Gly Tyr Arg 740 745 750 Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser 755 760 765 Trp Leu Asn Ile Lys Lys Ser 770 775 <210> 2 <211> 775 <212> PRT <213> Artificial Sequence <220> <223> Artificial Sequence <400> 2 Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile 1 5 10 15 Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg 20 25 30 Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile 35 40 45 Glu Glu Val Lys Lys Ile Thr Gly Glu Arg His Gly Lys Ile Val Arg 50 55 60 Ile Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Ile 65 70 75 80 Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Thr Ile 85 90 95 Arg Glu Lys Val Arg Glu His Pro Ala Val Val Asp Ile Phe Glu Tyr 100 105 110 Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro 115 120 125 Met Glu Gly Glu Glu Glu Leu Lys Ile Leu Ala Phe Ala Ile Ala Thr 130 135 140 Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile 145 150 155 160 Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ile Thr Trp Lys Asn Ile 165 170 175 Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys 180 185 190 Arg Phe Leu Arg Ile Ile Arg Glu Lys Asp Pro Asp Ile Ile Val Thr 195 200 205 Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu 210 215 220 Lys Leu Gly Ile Lys Leu Thr Ile Gly Arg Asp Gly Ser Glu Pro Lys 225 230 235 240 Met Gln Arg Ile Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Ile 245 250 255 His Phe Asp Leu Tyr His Val Ile Thr Arg Thr Ile Asn Leu Pro Thr 260 265 270 Tyr Thr Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Lys Pro Lys Glu 275 280 285 Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn 290 295 300 Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Ala Thr Tyr 305 310 315 320 Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ile Gln Leu Ser Arg Leu 325 330 335 Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 340 345 350 Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Val Ala 355 360 365 Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser 370 375 380 Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn 385 390 395 400 Ile Val Tyr Leu Asp Phe Arg Ala Leu Tyr Pro Ser Ile Ile Ile Thr 405 410 415 His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr 420 425 430 Asp Ile Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Ile Pro Gly 435 440 445 Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile 450 455 460 Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Trp Ile Leu Leu 465 470 475 480 Asp Tyr Arg Gln Lys Leu Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly 485 490 495 Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu 500 505 510 Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu 515 520 525 Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ile Asp Thr Asp Gly 530 535 540 Leu His Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Ile Lys Lys Lys 545 550 555 560 Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu 565 570 575 Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys 580 585 590 Lys Arg Tyr Ala Val Ile Asp Glu Glu Gly Lys Val Ile Thr Arg Gly 595 600 605 Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln 610 615 620 Ala Arg Val Leu Glu Thr Ile Leu Lys His Gly Asp Val Glu Glu Ala 625 630 635 640 Val Arg Ile Val Lys Glu Val Ile Gln Lys Leu Ala Asn Tyr Glu Ile 645 650 655 Pro Pro Glu Lys Leu Ala Ile Tyr Glu Gln Ile Thr Arg Pro Leu His 660 665 670 Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Lys Leu Ala 675 680 685 Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val 690 695 700 Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Ile Leu Ala Glu Glu 705 710 715 720 Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn 725 730 735 Gln Val Leu Pro Ala Val Leu Arg Ile Leu Glu Gly Phe Gly Tyr Arg 740 745 750 Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser 755 760 765 Trp Leu Asn Ile Lys Lys Ser 770 775 <210> 3 <211> 775 <212> PRT <213> Artificial Sequence <220> <223> Artificial Sequence <400> 3 Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Ile Ile 1 5 10 15 Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Arg Ile Glu His Asp Arg 20 25 30 Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile 35 40 45 Glu Glu Ile Lys Lys Ile Thr Gly Glu Arg His Gly Lys Ile Val Arg 50 55 60 Ile Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Val 65 70 75 80 Thr Val Trp Arg Leu Tyr Leu Glu His Pro Gln Asp Val Pro Thr Ile 85 90 95 Arg Glu Lys Val Lys Glu His Pro Ala Val Ile Asp Ile Phe Glu Tyr 100 105 110 Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro 115 120 125 Ala Glu Gly Glu Glu Glu Leu Lys Ile Leu Ala Phe Ala Ile Ala Thr 130 135 140 Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile 145 150 155 160 Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ile Thr Trp Lys Asn Ile 165 170 175 Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys 180 185 190 Arg Phe Val Lys Ile Ile Lys Glu Lys Asp Pro Asp Ile Ile Val Thr 195 200 205 Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu 210 215 220 Lys Leu Gly Val Lys Leu Thr Ile Gly Arg Asp Gly Ser Glu Pro Lys 225 230 235 240 Met Gln Arg Ile Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Ile 245 250 255 His Phe Asp Leu Tyr His Val Ile Thr Arg Thr Ile Asn Leu Pro Thr 260 265 270 Tyr Thr Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Lys Pro Lys Glu 275 280 285 Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn 290 295 300 Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Ala Thr Tyr 305 310 315 320 Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ile Gln Leu Ser Arg Leu 325 330 335 Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 340 345 350 Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Val Ala 355 360 365 Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser 370 375 380 Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn 385 390 395 400 Ile Val Tyr Leu Asp Phe Arg Ala Leu Tyr Pro Ser Ile Ile Ile Thr 405 410 415 His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr 420 425 430 Asp Ile Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Ile Pro Gly 435 440 445 Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile 450 455 460 Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Trp Ile Leu Leu 465 470 475 480 Asp Tyr Arg Gln Lys Leu Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly 485 490 495 Tyr Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Arg Glu Cys Ala Glu 500 505 510 Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Thr Trp Lys Glu 515 520 525 Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ile Asp Thr Asp Gly 530 535 540 Leu His Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Ile Lys Lys Lys 545 550 555 560 Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu 565 570 575 Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys 580 585 590 Lys Arg Tyr Ala Val Ile Asp Glu Glu Gly Lys Val Ile Thr Arg Gly 595 600 605 Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln 610 615 620 Ala Arg Val Leu Glu Thr Ile Leu Lys His Gly Asp Val Glu Glu Ala 625 630 635 640 Val Arg Ile Val Lys Glu Val Ile Gln Lys Leu Ala Asn Tyr Glu Ile 645 650 655 Pro Pro Glu Lys Leu Ala Ile Tyr Glu Gln Ile Thr Arg Pro Leu His 660 665 670 Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Lys Leu Ala 675 680 685 Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val 690 695 700 Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Ile Leu Ala Glu Glu 705 710 715 720 Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn 725 730 735 Gln Val Leu Pro Ala Val Leu Arg Ile Leu Glu Gly Phe Gly Tyr Arg 740 745 750 Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser 755 760 765 Trp Leu Asn Ile Lys Lys Ser 770 775 <210> 4 <211> 775 <212> PRT <213> Artificial Sequence <220> <223> Artificial Sequence <400> 4 Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile 1 5 10 15 Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg 20 25 30 Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile 35 40 45 Glu Glu Val Lys Lys Ile Thr Gly Glu Arg His Gly Lys Ile Val Arg 50 55 60 Ile Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Ile 65 70 75 80 Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Thr Ile 85 90 95 Arg Glu Lys Val Arg Glu His Pro Ala Val Val Asp Ile Phe Glu Tyr 100 105 110 Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro 115 120 125 Met Glu Gly Glu Glu Glu Leu Lys Ile Leu Ala Phe Ala Ile Ala Thr 130 135 140 Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile 145 150 155 160 Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ile Thr Trp Lys Asn Ile 165 170 175 Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys 180 185 190 Arg Phe Leu Arg Ile Ile Arg Glu Lys Asp Pro Asp Ile Ile Val Thr 195 200 205 Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu 210 215 220 Lys Leu Gly Ile Lys Leu Thr Ile Gly Arg Asp Gly Ser Glu Pro Lys 225 230 235 240 Met Gln Arg Ile Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Ile 245 250 255 His Phe Asp Leu Tyr His Val Ile Thr Arg Thr Ile Asn Leu Pro Thr 260 265 270 Tyr Thr Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Lys Pro Lys Glu 275 280 285 Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn 290 295 300 Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Ala Thr Tyr 305 310 315 320 Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ile Gln Leu Ser Arg Leu 325 330 335 Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 340 345 350 Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Val Ala 355 360 365 Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser 370 375 380 Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn 385 390 395 400 Ile Val Tyr Leu Asp Phe Arg Ala Tyr Tyr Pro Ser Ile Ile Ile Thr 405 410 415 His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr 420 425 430 Asp Ile Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Ile Pro Gly 435 440 445 Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile 450 455 460 Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Trp Ile Leu Leu 465 470 475 480 Asp Tyr Arg Gln Lys Leu Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly 485 490 495 Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu 500 505 510 Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu 515 520 525 Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ile Asp Thr Asp Gly 530 535 540 Leu His Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Ile Lys Lys Lys 545 550 555 560 Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu 565 570 575 Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys 580 585 590 Lys Arg Tyr Ala Val Ile Asp Glu Glu Gly Lys Val Ile Thr Arg Gly 595 600 605 Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln 610 615 620 Ala Arg Val Leu Glu Thr Ile Leu Lys His Gly Asp Val Glu Glu Ala 625 630 635 640 Val Arg Ile Val Lys Glu Val Ile Gln Lys Leu Ala Asn Tyr Glu Ile 645 650 655 Pro Pro Glu Lys Leu Ala Ile Tyr Glu Gln Ile Thr Arg Pro Leu His 660 665 670 Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Lys Leu Ala 675 680 685 Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val 690 695 700 Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Ile Leu Ala Glu Glu 705 710 715 720 Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn 725 730 735 Gln Val Leu Pro Ala Val Leu Arg Ile Leu Glu Gly Phe Gly Tyr Arg 740 745 750 Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser 755 760 765 Trp Leu Asn Ile Lys Lys Ser 770 775 <210> 5 <211> 775 <212> PRT <213> Artificial Sequence <220> <223> Artificial Sequence <400> 5 Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile 1 5 10 15 Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg 20 25 30 Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile 35 40 45 Glu Glu Val Lys Lys Ile Thr Gly Glu Arg His Gly Lys Ile Val Arg 50 55 60 Ile Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Ile 65 70 75 80 Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Thr Ile 85 90 95 Arg Glu Lys Val Arg Glu His Pro Ala Val Val Asp Ile Phe Glu Tyr 100 105 110 Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro 115 120 125 Met Glu Gly Glu Glu Glu Leu Lys Ile Leu Ala Phe Ala Ile Ala Thr 130 135 140 Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile 145 150 155 160 Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ile Thr Trp Lys Asn Ile 165 170 175 Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys 180 185 190 Arg Phe Leu Arg Ile Ile Arg Glu Lys Asp Pro Asp Ile Ile Val Thr 195 200 205 Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu 210 215 220 Lys Leu Gly Ile Lys Leu Thr Ile Gly Arg Asp Gly Ser Glu Pro Lys 225 230 235 240 Met Gln Arg Ile Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Ile 245 250 255 His Phe Asp Leu Tyr His Val Ile Thr Arg Thr Ile Asn Leu Pro Thr 260 265 270 Tyr Thr Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Lys Pro Lys Glu 275 280 285 Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn 290 295 300 Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Ala Thr Tyr 305 310 315 320 Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ile Gln Leu Ser Arg Leu 325 330 335 Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 340 345 350 Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Val Ala 355 360 365 Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser 370 375 380 Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn 385 390 395 400 Ile Val Tyr Leu Asp Phe Arg Ala Tyr Tyr Pro Ser Ile Ile Ile Thr 405 410 415 His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr 420 425 430 Asp Ile Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Ile Pro Gly 435 440 445 Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile 450 455 460 Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Trp Ile Leu Leu 465 470 475 480 Asp Tyr Arg Gln Lys Arg Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly 485 490 495 Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu 500 505 510 Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu 515 520 525 Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ile Asp Thr Asp Gly 530 535 540 Leu His Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Ile Lys Lys Lys 545 550 555 560 Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu 565 570 575 Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys 580 585 590 Lys Arg Tyr Ala Val Ile Asp Glu Glu Gly Lys Val Ile Thr Arg Gly 595 600 605 Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln 610 615 620 Ala Arg Val Leu Glu Thr Ile Leu Lys His Gly Asp Val Glu Glu Ala 625 630 635 640 Val Arg Ile Val Lys Glu Val Ile Gln Lys Leu Ala Asn Tyr Glu Ile 645 650 655 Pro Pro Glu Lys Leu Ala Ile Tyr Glu Gln Ile Thr Arg Pro Leu His 660 665 670 Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Lys Leu Ala 675 680 685 Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val 690 695 700 Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Ile Leu Ala Glu Glu 705 710 715 720 Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn 725 730 735 Gln Val Leu Pro Ala Val Leu Arg Ile Leu Glu Gly Phe Gly Tyr Arg 740 745 750 Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser 755 760 765 Trp Leu Asn Ile Lys Lys Ser 770 775 <210> 6 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 6 taatacgact cactataggg 20 <210> 7 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 7 taatacgact cactataggg caggaaacag ctatgaccag gggatcagc 49 <210> 8 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Artificial Sequence <400> 8 taatacgact cactataggg 20 <210> 9 <211> 775 <212> PRT <213> Artificial Sequence <220> <223> Artificial Sequence <400> 9 Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile 1 5 10 15 Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg 20 25 30 Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile 35 40 45 Glu Glu Val Lys Lys Ile Thr Gly Glu Arg His Gly Lys Ile Val Arg 50 55 60 Ile Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Ile 65 70 75 80 Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Thr Ile 85 90 95 Arg Glu Lys Val Arg Glu His Pro Ala Val Val Asp Ile Phe Glu Tyr 100 105 110 Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro 115 120 125 Met Glu Gly Glu Glu Glu Leu Lys Ile Leu Ala Phe Ala Ile Ala Thr 130 135 140 Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile 145 150 155 160 Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ile Thr Trp Lys Asn Ile 165 170 175 Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys 180 185 190 Arg Phe Leu Arg Ile Ile Arg Glu Lys Asp Pro Asp Ile Ile Val Thr 195 200 205 Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu 210 215 220 Lys Leu Gly Ile Lys Leu Thr Ile Gly Arg Asp Gly Ser Glu Pro Lys 225 230 235 240 Met Gln Arg Ile Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Ile 245 250 255 His Phe Asp Leu Tyr His Val Ile Thr Arg Thr Ile Asn Leu Pro Thr 260 265 270 Tyr Thr Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Lys Pro Lys Glu 275 280 285 Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn 290 295 300 Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Ala Thr Tyr 305 310 315 320 Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ile Gln Leu Ser Arg Leu 325 330 335 Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 340 345 350 Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Val Ala 355 360 365 Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser 370 375 380 Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn 385 390 395 400 Ile Val Tyr Leu Asp Phe Arg Ala Leu Tyr Pro Ser Ile Ile Ile Thr 405 410 415 His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr 420 425 430 Asp Ile Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Ile Pro Gly 435 440 445 Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile 450 455 460 Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Lys Ile Leu Leu 465 470 475 480 Asp Tyr Arg Gln Lys Leu Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly 485 490 495 Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu 500 505 510 Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu 515 520 525 Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ile Asp Thr Asp Gly 530 535 540 Leu Tyr Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Ile Lys Lys Lys 545 550 555 560 Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu 565 570 575 Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys 580 585 590 Lys Arg Tyr Ala Val Ile Asp Glu Glu Gly Lys Val Ile Thr Arg Gly 595 600 605 Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln 610 615 620 Ala Arg Val Leu Glu Thr Ile Leu Lys His Gly Asp Val Glu Glu Ala 625 630 635 640 Val Arg Ile Val Lys Glu Val Ile Gln Lys Leu Ala Asn Tyr Glu Ile 645 650 655 Pro Pro Glu Lys Leu Ala Ile Tyr Glu Gln Ile Thr Arg Pro Leu His 660 665 670 Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Lys Leu Ala 675 680 685 Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val 690 695 700 Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Ile Leu Ala Glu Glu 705 710 715 720 Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn 725 730 735 Gln Val Leu Pro Ala Val Leu Arg Ile Leu Glu Gly Phe Gly Tyr Arg 740 745 750 Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser 755 760 765 Trp Leu Asn Ile Lys Lys Ser 770 775 <210> 10 <211> 775 <212> PRT <213> Artificial Sequence <220> <223> Artificial Sequence <400> 10 Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile 1 5 10 15 Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg 20 25 30 Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile 35 40 45 Glu Glu Val Lys Lys Ile Thr Gly Glu Arg His Gly Lys Ile Val Arg 50 55 60 Ile Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Ile 65 70 75 80 Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Thr Ile 85 90 95 Arg Glu Lys Val Arg Glu His Pro Ala Val Val Asp Ile Phe Glu Tyr 100 105 110 Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro 115 120 125 Met Glu Gly Glu Glu Glu Leu Lys Ile Leu Ala Phe Ala Ile Ala Thr 130 135 140 Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile 145 150 155 160 Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ile Thr Trp Lys Asn Ile 165 170 175 Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys 180 185 190 Arg Phe Leu Arg Ile Ile Arg Glu Lys Asp Pro Asp Ile Ile Val Thr 195 200 205 Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu 210 215 220 Lys Leu Gly Ile Lys Leu Thr Ile Gly Arg Asp Gly Ser Glu Pro Lys 225 230 235 240 Met Gln Arg Ile Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Ile 245 250 255 His Phe Asp Leu Tyr His Val Ile Thr Arg Thr Ile Asn Leu Pro Thr 260 265 270 Tyr Thr Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Lys Pro Lys Glu 275 280 285 Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn 290 295 300 Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Ala Thr Tyr 305 310 315 320 Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ile Gln Leu Ser Arg Leu 325 330 335 Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 340 345 350 Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Val Ala 355 360 365 Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser 370 375 380 Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn 385 390 395 400 Ile Val Tyr Leu Asp Phe Arg Ala Leu Tyr Pro Ser Ile Ile Ile Thr 405 410 415 His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr 420 425 430 Asp Ile Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Ile Pro Gly 435 440 445 Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile 450 455 460 Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Lys Ile Leu Leu 465 470 475 480 Asp Tyr Arg Gln Lys Leu Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly 485 490 495 Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu 500 505 510 Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu 515 520 525 Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ile Asp Thr Asp Gly 530 535 540 Leu His Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Ile Lys Lys Lys 545 550 555 560 Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu 565 570 575 Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys 580 585 590 Lys Arg Tyr Ala Val Ile Asp Glu Glu Gly Lys Val Ile Thr Arg Gly 595 600 605 Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln 610 615 620 Ala Arg Val Leu Glu Thr Ile Leu Lys His Gly Asp Val Glu Glu Ala 625 630 635 640 Val Arg Ile Val Lys Glu Val Ile Gln Lys Leu Ala Asn Tyr Glu Ile 645 650 655 Pro Pro Glu Lys Leu Ala Ile Tyr Glu Gln Ile Thr Arg Pro Leu His 660 665 670 Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Lys Leu Ala 675 680 685 Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val 690 695 700 Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Ile Leu Ala Glu Glu 705 710 715 720 Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn 725 730 735 Gln Val Leu Pro Ala Val Leu Arg Ile Leu Glu Gly Phe Gly Tyr Arg 740 745 750 Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser 755 760 765 Trp Leu Asn Ile Lys Lys Ser 770 775 <210> 11 <211> 775 <212> PRT <213> Artificial Sequence <220> <223> Artificial Sequence <400> 11 Met Ile Leu Asp Val Asp Tyr Ile Thr Glu Glu Gly Lys Pro Val Ile 1 5 10 15 Arg Leu Phe Lys Lys Glu Asn Gly Lys Phe Lys Ile Glu His Asp Arg 20 25 30 Thr Phe Arg Pro Tyr Ile Tyr Ala Leu Leu Arg Asp Asp Ser Lys Ile 35 40 45 Glu Glu Val Lys Lys Ile Thr Gly Glu Arg His Gly Lys Ile Val Arg 50 55 60 Ile Val Asp Val Glu Lys Val Glu Lys Lys Phe Leu Gly Lys Pro Ile 65 70 75 80 Thr Val Trp Lys Leu Tyr Leu Glu His Pro Gln Asp Val Pro Thr Ile 85 90 95 Arg Glu Lys Val Arg Glu His Pro Ala Val Val Asp Ile Phe Glu Tyr 100 105 110 Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro 115 120 125 Met Glu Gly Glu Glu Glu Leu Lys Ile Leu Ala Phe Ala Ile Ala Thr 130 135 140 Leu Tyr His Glu Gly Glu Glu Phe Gly Lys Gly Pro Ile Ile Met Ile 145 150 155 160 Ser Tyr Ala Asp Glu Asn Glu Ala Lys Val Ile Thr Trp Lys Asn Ile 165 170 175 Asp Leu Pro Tyr Val Glu Val Val Ser Ser Glu Arg Glu Met Ile Lys 180 185 190 Arg Phe Leu Arg Ile Ile Arg Glu Lys Asp Pro Asp Ile Ile Val Thr 195 200 205 Tyr Asn Gly Asp Ser Phe Asp Phe Pro Tyr Leu Ala Lys Arg Ala Glu 210 215 220 Lys Leu Gly Ile Lys Leu Thr Ile Gly Arg Asp Gly Ser Glu Pro Lys 225 230 235 240 Met Gln Arg Ile Gly Asp Met Thr Ala Val Glu Val Lys Gly Arg Ile 245 250 255 His Phe Asp Leu Tyr His Val Ile Thr Arg Thr Ile Asn Leu Pro Thr 260 265 270 Tyr Thr Leu Glu Ala Val Tyr Glu Ala Ile Phe Gly Lys Pro Lys Glu 275 280 285 Lys Val Tyr Ala Asp Glu Ile Ala Lys Ala Trp Glu Ser Gly Glu Asn 290 295 300 Leu Glu Arg Val Ala Lys Tyr Ser Met Glu Asp Ala Lys Ala Thr Tyr 305 310 315 320 Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ile Gln Leu Ser Arg Leu 325 330 335 Val Gly Gln Pro Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 340 345 350 Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Val Ala 355 360 365 Pro Asn Lys Pro Ser Glu Glu Glu Tyr Gln Arg Arg Leu Arg Glu Ser 370 375 380 Tyr Thr Gly Gly Phe Val Lys Glu Pro Glu Lys Gly Leu Trp Glu Asn 385 390 395 400 Ile Val Tyr Leu Asp Phe Arg Ala Leu Tyr Pro Ser Ile Ile Ile Thr 405 410 415 His Asn Val Ser Pro Asp Thr Leu Asn Leu Glu Gly Cys Lys Asn Tyr 420 425 430 Asp Ile Ala Pro Gln Val Gly His Lys Phe Cys Lys Asp Ile Pro Gly 435 440 445 Phe Ile Pro Ser Leu Leu Gly His Leu Leu Glu Glu Arg Gln Lys Ile 450 455 460 Lys Thr Lys Met Lys Glu Thr Gln Asp Pro Ile Glu Lys Ile Leu Leu 465 470 475 480 Asp Tyr Arg Gln Lys Ala Ile Lys Leu Leu Ala Asn Ser Phe Tyr Gly 485 490 495 Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu 500 505 510 Ser Val Thr Ala Trp Gly Arg Lys Tyr Ile Glu Leu Val Trp Lys Glu 515 520 525 Leu Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ile Asp Thr Asp Gly 530 535 540 Leu Tyr Ala Thr Ile Pro Gly Gly Glu Ser Glu Glu Ile Lys Lys Lys 545 550 555 560 Ala Leu Glu Phe Val Lys Tyr Ile Asn Ser Lys Leu Pro Gly Leu Leu 565 570 575 Glu Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Phe Phe Val Thr Lys 580 585 590 Lys Arg Tyr Ala Val Ile Asp Glu Glu Gly Lys Val Ile Thr Arg Gly 595 600 605 Leu Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln 610 615 620 Ala Arg Val Leu Glu Thr Ile Leu Lys His Gly Asp Val Glu Glu Ala 625 630 635 640 Val Arg Ile Val Lys Glu Val Ile Gln Lys Leu Ala Asn Tyr Glu Ile 645 650 655 Pro Pro Glu Lys Leu Ala Ile Tyr Glu Gln Ile Thr Arg Pro Leu His 660 665 670 Glu Tyr Lys Ala Ile Gly Pro His Val Ala Val Ala Lys Lys Leu Ala 675 680 685 Ala Lys Gly Val Lys Ile Lys Pro Gly Met Val Ile Gly Tyr Ile Val 690 695 700 Leu Arg Gly Asp Gly Pro Ile Ser Asn Arg Ala Ile Leu Ala Glu Glu 705 710 715 720 Tyr Asp Pro Lys Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn 725 730 735 Gln Val Leu Pro Ala Val Leu Arg Ile Leu Glu Gly Phe Gly Tyr Arg 740 745 750 Lys Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Thr Ser 755 760 765 Trp Leu Asn Ile Lys Lys Ser 770 775 <210> 12 <211> 775 <212> PRT <213> Artificial Sequence <220> <223> Artificial Sequence <400> 12 Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asn Gly Lys Pro Val Ile 1 5 10 15 Arg Val Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg 20 25 30 Thr Phe Glu Pro Tyr Phe Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile 35 40 45 Glu Asp Val Lys Lys Val Thr Ala Lys Arg His Gly Thr Val Val Lys 50 55 60 Val Lys Arg Ala Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Ile 65 70 75 80 Glu Val Trp Lys Leu Tyr Phe Asn His Pro Gln Asp Val Pro Ala Ile 85 90 95 Arg Asp Arg Ile Arg Ala His Pro Ala Val Val Asp Ile Tyr Glu Tyr 100 105 110 Asp Ile Pro Phe Ala Lys Arg Tyr Leu Ile Asp Lys Gly Leu Ile Pro 115 120 125 Met Glu Gly Asp Glu Glu Leu Thr Met Leu Ala Phe Ala Ile Ala Thr 130 135 140 Leu Tyr His Glu Gly Glu Glu Phe Gly Thr Gly Pro Ile Leu Met Ile 145 150 155 160 Ser Tyr Ala Asp Gly Ser Glu Ala Arg Val Ile Thr Trp Lys Lys Ile 165 170 175 Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Lys Glu Met Ile Lys 180 185 190 Arg Phe Leu Arg Val Val Arg Glu Lys Asp Pro Asp Val Leu Ile Thr 195 200 205 Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu 210 215 220 Glu Leu Gly Ile Lys Phe Thr Leu Gly Arg Asp Gly Ser Glu Pro Lys 225 230 235 240 Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile 245 250 255 His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr 260 265 270 Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Lys Pro Lys Glu 275 280 285 Lys Val Tyr Ala Glu Glu Ile Ala Gln Ala Trp Glu Ser Gly Glu Gly 290 295 300 Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr 305 310 315 320 Glu Leu Gly Arg Glu Phe Phe Pro Met Glu Ala Gln Leu Ser Arg Leu 325 330 335 Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 340 345 350 Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Lys Arg Asn Glu Leu Ala 355 360 365 Pro Asn Lys Pro Asp Glu Arg Glu Leu Ala Arg Arg Arg Gly Gly Tyr 370 375 380 Ala Gly Gly Tyr Val Lys Glu Pro Glu Arg Gly Leu Trp Asp Asn Ile 385 390 395 400 Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His 405 410 415 Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp 420 425 430 Val Ala Pro Glu Val Gly His Lys Phe Cys Lys Asp Phe Pro Gly Phe 435 440 445 Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys 450 455 460 Arg Lys Met Lys Ala Thr Val Asp Pro Leu Glu Lys Lys Leu Leu Asp 465 470 475 480 Tyr Arg Gln Arg Leu Ile Lys Ile Leu Ala Asn Ser Phe Tyr Gly Tyr 485 490 495 Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser 500 505 510 Val Thr Ala Trp Gly Arg Glu Tyr Ile Glu Met Val Ile Arg Glu Leu 515 520 525 Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly Leu 530 535 540 His Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala 545 550 555 560 Lys Glu Phe Leu Lys Tyr Ile Asn Pro Lys Leu Pro Gly Leu Leu Glu 565 570 575 Leu Glu Tyr Glu Gly Phe Tyr Val Arg Gly Phe Phe Val Thr Lys Lys 580 585 590 Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu 595 600 605 Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala 610 615 620 Arg Val Leu Glu Ala Ile Leu Lys His Gly Asp Val Glu Glu Ala Val 625 630 635 640 Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro 645 650 655 Pro Glu Lys Leu Val Ile His Glu Gln Ile Thr Arg Asp Leu Arg Asp 660 665 670 Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala 675 680 685 Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu 690 695 700 Lys Gly Ser Gly Arg Ile Gly Asp Arg Ala Ile Pro Ala Asp Glu Phe 705 710 715 720 Asp Pro Thr Lys His Arg Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln 725 730 735 Val Leu Pro Ala Val Glu Arg Ile Leu Lys Ala Phe Gly Tyr Arg Lys 740 745 750 Glu Asp Leu Arg Tyr Gln Lys Thr Lys Gln Val Gly Leu Gly Ala Trp 755 760 765 Leu Lys Val Lys Gly Lys Lys 770 775

Claims (43)

  1. 3'-OH 비차단 가역적 종결자(unblocked reversible terminator) 및 돌연변이 폴리머라제를 포함하는 조성물로서, 돌연변이 폴리머라제가 서열번호 2와 적어도 96% 동일한 아미노산 서열을 포함하고 Pfu 폴리머라제의 K477, A486 및 Y546의 아미노산 위치와 기능적으로 동등한 위치에 아미노산 돌연변이를 포함하는, 조성물.
  2. 제1항에 있어서,
    돌연변이 폴리머라제가 Pfu 폴리머라제의 위치 486과 기능적으로 동등한 위치에 A486X 돌연변이를 포함하고, 이때, X는 알라닌을 제외한 임의의 아미노산인, 조성물.
  3. 제2항에 있어서,
    A486X 돌연변이가 A486F, A486Y, A486N, A486R 또는 A486H인, 조성물.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    돌연변이 폴리머라제가 Pfu 폴리머라제의 위치 546과 기능적으로 동등한 위치에 Y546H 돌연변이를 추가로 포함하는, 조성물.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    돌연변이 폴리머라제가 Pfu 폴리머라제의 위치 477과 기능적으로 동등한 위치에 K477W 돌연변이를 추가로 포함하는, 조성물.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    돌연변이 폴리머라제가 Pfu 폴리머라제의 위치 F494와 기능적으로 동등한 위치에 돌연변이를 추가로 포함하는, 조성물.
  7. 제6항에 있어서,
    F494 돌연변이가 F494C, F494I, F494N 또는 F494T인, 조성물.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    돌연변이 폴리머라제가 피로코커스(Pyrococcus) 폴리머라제의 유도체인, 조성물.
  9. 제8항에 있어서,
    돌연변이 폴리머라제가 서열번호 2의 아미노산 서열을 포함하는, 조성물.
  10. 제1항 내지 제7항 중 어느 한 항에 있어서,
    돌연변이 폴리머라제가 써모코커스(Thermococcus) 폴리머라제의 유도체인, 조성물.
  11. 혼입 반응에 충분한 조건 하에서 핵산을 포함하는 프라이밍 가닥을 뉴클레오티드 및 돌연변이 폴리머라제와 접촉시키는 단계를 포함하는, 상기 프라이밍 가닥에 뉴클레오티드를 혼입시키는 방법으로서,
    상기 돌연변이 폴리머라제가 서열번호 2와 적어도 96% 동일한 아미노산 서열을 포함하고 Pfu 폴리머라제의 K477, A486 및 Y546의 아미노산 위치와 기능적으로 동등한 위치에 아미노산 돌연변이를 포함하는, 방법.
  12. 제11항에 있어서,
    뉴클레오티드가 3'-OH 비차단 가역적 종결자인, 방법.
  13. (a) 주형 및 프라이밍 가닥을 포함하는 이중체(duplex)를 형성하는 단계로서, 상기 주형이 서열분석될 표적 핵산 및 상기 프라이밍 가닥의 적어도 일부에 상보적인 프라이머 결합 부위를 포함하는, 단계;
    (b) 상기 프라이밍 가닥을 가역적 종결자 뉴클레오티드 및 돌연변이 폴리머라제와 결합시키는 단계로서, 상기 돌연변이 폴리머라제가 서열번호 2와 적어도 96% 동일한 아미노산 서열을 포함하고 Pfu 폴리머라제의 K477, A486 및 Y546의 아미노산 위치와 기능적으로 동등한 위치에 아미노산 돌연변이를 포함하는, 단계;
    (c) 주형-의존적 반응으로 상기 프라이밍 가닥의 3'-말단에 가역적 종결자를 혼입시키는 단계; 및
    (d) 혼입된 가역적 종결자 뉴클레오티드를 식별하여, 상기 주형의 서열을 결정하는 단계
    를 포함하는, 폴리뉴클레오티드 서열을 분석하는 방법.
  14. 제13항에 있어서,
    단계 (c) 및 (d)를 적어도 80회 반복하는 것을 추가로 포함하는, 방법.
  15. 프라이밍 가닥, 3'-OH 비차단 가역적 종결자 및 돌연변이 폴리머라제를 포함하는 조성물로서,
    상기 돌연변이 폴리머라제가 서열번호 1과 적어도 80% 동일한 아미노산 서열을 포함하고;
    상기 돌연변이 폴리머라제가 Pfu 폴리머라제의 위치 L270, E330, Q332, L333, L409, P451, L453, L457, E476, L489, L490, N492, F494, Y497 및 E581과 기능적으로 동등한 위치에 하나 이상의 돌연변이를 추가로 포함하고;
    상기 돌연변이 폴리머라제가 서열번호 11의 DNA 폴리머라제의 혼입 활성보다 적어도 4배 더 높은 3'-OH 비차단 가역적 종결자에 대한 혼입 활성을 갖는,
    조성물.
  16. 제15항에 있어서,
    아미노산 서열이 서열번호 1과 적어도 85% 동일한, 조성물.
  17. 제15항에 있어서,
    아미노산 서열이 서열번호 1과 적어도 90% 동일한, 조성물.
  18. 제15항에 있어서,
    아미노산 서열이 서열번호 1과 적어도 95% 동일한, 조성물.
  19. 제15항 내지 제18항 중 어느 한 항에 있어서,
    돌연변이 폴리머라제가 Pfu 폴리머라제의 위치 266, 267, 268, 269, 329, 336, 399, 400, 403, 404, 407, 408, 410, 411, 450, 452, 455, 456, 458, 459, 460, 461, 462, 463, 464, 465, 466, 475, 477, 478, 479, 480, 481, 482, 483, 485, 487, 488, 491, 493, 495, 496, 498, 499, 500, 515, 522, 545, 546, 577, 579, 580, 582, 584, 591, 595, 603, 606, 607, 608, 612, 613, 614, 664, 665, 666, 668, 669, 674, 675 및 676과 기능적으로 동등한 임의의 위치에 돌연변이를 포함하지 않는, 조성물.
  20. 제15항 내지 제19항 중 어느 한 항에 있어서,
    돌연변이 폴리머라제가 피로코커스 폴리머라제의 유도체인, 조성물.
  21. 제15항 내지 제19항 중 어느 한 항에 있어서,
    돌연변이 폴리머라제가 써모코커스 폴리머라제의 유도체인, 조성물.
  22. 제15항 내지 제21항 중 어느 한 항에 있어서,
    조성물이 프라이밍 가닥의 적어도 일부에 상보적인 프라이머 결합 부위를 포함하는 주형을 추가로 포함하는, 조성물.
  23. 제15항 내지 제22항 중 어느 한 항에 있어서,
    조성물이 546H 및 486X 돌연변이를 추가로 포함하는, 조성물.
  24. 제15항 내지 제23항 중 어느 한 항에 있어서,
    조성물이 프라이밍 가닥에 상보적인 주형을 함유하지 않는, 조성물.
  25. 혼입 반응에 충분한 조건 하에서 프라이밍 가닥을 3'-OH-비변형(unmodified) 가역적 종결자 및 돌연변이 폴리머라제와 접촉시키는 단계; 및
    상기 프라이밍 가닥의 3'-말단에 상기 3'-OH-비변형 가역적 종결자를 혼입시키는 단계
    를 포함하는, 3'-OH-비변형 가역적 종결자를 프라이밍 가닥에 혼입시키는 방법으로서,
    상기 돌연변이 폴리머라제가 서열번호 1과 적어도 80% 동일한 아미노산 서열, 및 Pfu 폴리머라제의 위치 L270, E330, Q332, L333, L409, P451, L453, L457, E476, L489, L490, N492, F494, Y497 및 E581과 기능적으로 동등한 위치에 하나 이상의 돌연변이를 포함하는, 방법.
  26. 제25항에 있어서,
    3'-OH-비변형 가역적 종결자가 2-니트로벤질-변형된 뉴클레오티드인, 방법.
  27. 제25항에 있어서,
    3'-OH-비변형 가역적 종결자가 C7- 또는 C5-하이드록시메틸-α-3급-부틸-2-니트로벤질 변형된 뉴클레오티드 및 그의 α-티오 유도체인, 방법.
  28. 제25항 내지 제27항 중 어느 한 항에 있어서,
    종결자를 선택적으로 혼입시키는 단계를 포함하는 방법으로서, 돌연변이 폴리머라제가 Pfu 폴리머라제의 위치 492와 기능적으로 동등한 위치에 하나 이상의 아미노산 돌연변이를 포함하는, 방법.
  29. 제28항에 있어서,
    돌연변이가 N492I, N492V 및 N492P로부터 선택되는, 방법.
  30. 제28항에 있어서,
    시토신 염기를 포함하는 3'-OH 비차단 가역적 종결자가 돌연변이 폴리머라제에 의해 선택적으로 혼입되는, 방법.
  31. 프라이밍 가닥, 3'-OH-비변형 가역적 종결자, 및 서열번호 2와 적어도 96% 동일한 돌연변이 폴리머라제를 포함하고,
    Pfu 폴리머라제의 위치 546과 기능적으로 동등한 위치에 Y546H 돌연변이;
    Pfu 폴리머라제의 위치 409와 기능적으로 동등한 위치에 L409Y, L409H 또는 L409F 돌연변이; 및
    Pfu 폴리머라제의 위치 486과 기능적으로 동등한 위치에 A486X 돌연변이로서, X는 알라닌을 제외한 임의의 아미노산인, 돌연변이
    를 포함하는 조성물.
  32. 제31항에 있어서,
    조성물이 프라이밍 가닥에 상보적인 주형을 함유하지 않는, 조성물.
  33. 제31항 또는 제32항에 있어서,
    돌연변이 폴리머라제가 Pfu 폴리머라제의 위치 L270, E330, Q332, L333, P451, L453, L457, E476, L489, L490, N492, F494, Y497 및 E581과 기능적으로 동등한 위치에 하나 이상의 돌연변이를 추가로 포함하는, 조성물.
  34. 제31항 또는 제32항에 있어서,
    돌연변이 폴리머라제가 서열번호 4 또는 서열번호 5의 아미노산 서열을 포함하는, 조성물.
  35. 제31항 내지 제34항 중 어느 한 항에 있어서,
    돌연변이 폴리머라제가 서열번호 11의 DNA 폴리머라제의 혼입 활성보다 적어도 2배 더 높은 혼입 활성을 갖는, 조성물.
  36. 제31항 내지 제35항 중 어느 한 항에 있어서,
    돌연변이 폴리머라제가 피로코커스 폴리머라제의 유도체인, 조성물.
  37. 제31항 내지 제36항 중 어느 한 항에 있어서,
    돌연변이 폴리머라제가 서열번호 2의 아미노산 서열을 포함하는, 조성물.
  38. 제31항 내지 제35항 중 어느 한 항에 있어서,
    돌연변이 폴리머라제가 써모코커스 폴리머라제의 유도체인, 조성물.
  39. 프라이밍 가닥을 3'-OH-비변형 가역적 종결자 및 돌연변이 폴리머라제와 결합시키는 단계를 포함하는, 주형-비의존적 반응으로 단일 뉴클레오티드를 프라이밍 가닥에 혼입시키는 방법으로서,
    상기 돌연변이 폴리머라제가
    서열번호 2와 적어도 96% 동일하고,
    Pfu 폴리머라제의 위치 546과 기능적으로 동등한 위치에 Y546H 돌연변이;
    Pfu 폴리머라제의 위치 409와 기능적으로 동등한 위치에 L409Y, L409H 또는 L409F 돌연변이; 및
    Pfu 폴리머라제의 위치 486과 기능적으로 동등한 위치에 A486X 돌연변이로서, X는 알라닌을 제외한 임의의 아미노산인, 돌연변이
    를 포함하고,
    종결자의 혼입이 서열번호 11의 돌연변이 DNA 폴리머라제에 대한 것보다 적어도 2배 더 높은,
    방법.
  40. 프라이밍 가닥, 3'-OH-비변형 가역적 종결자, 및 돌연변이 DNA 폴리머라제를 결합시키는 단계; 및
    3'-OH-비변형 가역적 종결자를 프라이밍 가닥에 혼입시키는 단계
    를 포함하는, 주형-비의존적 올리고뉴클레오티드를 합성하는 방법으로서,
    상기 돌연변이 DNA 폴리머라제가
    서열번호 2와 적어도 96% 동일한 아미노산 서열;
    Pfu 폴리머라제의 위치 546과 기능적으로 동등한 위치에 히스티딘으로의 Y546H 돌연변이;
    Pfu 폴리머라제의 위치 409와 기능적으로 동등한 위치에 L409Y, L409H 또는 L409F 돌연변이; 및
    Pfu 폴리머라제의 위치 486과 기능적으로 동등한 위치에 A486X 돌연변이로서, X는 알라닌을 제외한 임의의 아미노산인, 돌연변이
    를 포함하는, 방법.
  41. 제39항 또는 제40항에 있어서,
    폴리머라제가 Pfu 폴리머라제의 위치 L270, E330, Q332, L333, P451, L453, L457, E476, L489, L490, N492, F494, Y497 및 E581과 기능적으로 동등한 위치에 하나 이상의 돌연변이를 추가로 포함하는, 방법.
  42. 제39항 내지 제41항 중 어느 한 항에 있어서,
    3'-OH-비변형 가역적 종결자가 2-니트로벤질-변형된 뉴클레오티드인, 방법.
  43. 제39항 내지 제41항 중 어느 한 항에 있어서,
    3'-OH-비변형 가역적 종결자가 C7- 또는 C5-하이드록시메틸-α-3급-부틸-2-니트로벤질 변형된 뉴클레오티드 및 그의 α-티오 유도체인, 방법.
KR1020247001823A 2021-06-29 2021-06-29 폴리머라제 돌연변이체 및 3'-oh 비차단 가역적 종결자와의 사용 KR20240024924A (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2021/070785 WO2023277953A1 (en) 2021-06-29 2021-06-29 Polymerase mutants and use with 3'-oh unblocked reversible terminators

Publications (1)

Publication Number Publication Date
KR20240024924A true KR20240024924A (ko) 2024-02-26

Family

ID=84692022

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247001823A KR20240024924A (ko) 2021-06-29 2021-06-29 폴리머라제 돌연변이체 및 3'-oh 비차단 가역적 종결자와의 사용

Country Status (8)

Country Link
US (2) US11773380B1 (ko)
EP (1) EP4363564A1 (ko)
KR (1) KR20240024924A (ko)
CN (1) CN117693581A (ko)
AU (1) AU2021453871A1 (ko)
CA (1) CA3222738A1 (ko)
IL (1) IL309368A (ko)
WO (1) WO2023277953A1 (ko)

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5948663A (en) 1990-12-03 1999-09-07 Stratagene Purified thermostable pyrococcus furiosus DNA polymerase I
US5789166A (en) 1995-12-08 1998-08-04 Stratagene Circular site-directed mutagenesis
US6183997B1 (en) 1997-03-21 2001-02-06 Stratagene Polymerase enhancing factor (PEF) extracts PEF protein complexes isolated PEF proteins and methods for purifying and identifying same
ATE378417T1 (de) 1997-03-21 2007-11-15 Stratagene California Polymerase-verbessernder faktor (pef)-enthaltende extrakte, pef proteinkomplexe, isoliertes pef protein und verfahren zur reinigung und identifizierung
US20030228616A1 (en) 1999-10-29 2003-12-11 Stratagene DNA polymerase mutants with reverse transcriptase activity
EP1232270A1 (en) * 1999-11-23 2002-08-21 Amersham Biosciences Corp. IMPROVING DIDEOXYNUCLEOTIDE-TRIPHOSPHATE UTILIZATION BY THE HYPER-THERMOPHILIC DNA POLYMERASE FROM THE ARCHAEON i PYROCOCCUS FURIOSUS /i
JP4990886B2 (ja) 2005-05-10 2012-08-01 ソレックサ リミテッド 改良ポリメラーゼ
US8435775B2 (en) * 2006-09-06 2013-05-07 Medical Research Council Mutant Pfu DNA polymerase
US7897737B2 (en) 2006-12-05 2011-03-01 Lasergen, Inc. 3′-OH unblocked, nucleotides and nucleosides, base modified with photocleavable, terminating groups and methods for their use in DNA sequencing
BRPI0915173B8 (pt) 2008-06-11 2021-05-25 Agilent Technologies Inc compostos de nucleotídeos e nucleosídeos e método de sequenciamento de um ácido nucleico-alvo
AU2012308518B2 (en) 2011-09-13 2017-08-17 Agilent Technologies, Inc. 5-methoxy, 3'-oh unblocked, fast photocleavable terminating nucleotides and methods for nucleic acid sequencing
ES2607061T3 (es) 2012-05-02 2017-03-29 Clariant Produkte (Deutschland) Gmbh Endoglucanasas con propiedades mejoradas
WO2014142921A1 (en) * 2013-03-14 2014-09-18 Illumina, Inc. Modified polymerases for improved incorporation of nucleotide analogues
CA2951416A1 (en) 2014-06-27 2015-12-30 Illumina, Inc. Modified polymerases for improved incorporation of nucleotide analogues
US9677057B2 (en) 2014-09-30 2017-06-13 Illumina, Inc. Modified polymerases for improved incorporation of nucleotide analogues
US10752887B2 (en) 2018-01-08 2020-08-25 Dna Script Variants of terminal deoxynucleotidyl transferase and uses thereof
WO2020146312A1 (en) 2019-01-07 2020-07-16 Agilent Technologies, Inc. Compositions and methods for genomic dna and gene expression analysis in single cells
US11034942B1 (en) * 2020-02-27 2021-06-15 Singular Genomics Systems, Inc. Modified pyrococcus polymerases and uses thereof
JP2023518730A (ja) 2020-03-26 2023-05-08 アジレント・テクノロジーズ・インク 多段階プライマー伸長反応用の方法および組成物

Also Published As

Publication number Publication date
US12006519B2 (en) 2024-06-11
EP4363564A1 (en) 2024-05-08
US20240018490A1 (en) 2024-01-18
WO2023277953A1 (en) 2023-01-05
IL309368A (en) 2024-02-01
US11773380B1 (en) 2023-10-03
AU2021453871A1 (en) 2024-01-25
CA3222738A1 (en) 2023-01-05
CN117693581A (zh) 2024-03-12

Similar Documents

Publication Publication Date Title
CN108018270B (zh) 用以提升核苷酸类似物并入的重组dna聚合酶
JP2022521094A (ja) 共転写キャッピング用rnaポリメラーゼバリアント
US5547859A (en) Chain-terminating nucleotides for DNA sequencing methods
JP2021510074A (ja) ターミナルデオキシヌクレオチジルトランスフェラーゼの改変体およびその使用
WO2018148723A1 (en) Polymerase enzyme from pyrococcus abyssi
JP2021118748A (ja) ポリメラーゼ酵素
JP2003510052A (ja) 改良されたポリヌクレオチド合成のための方法と組成物
JP2022543569A (ja) ポリ(a)およびポリ(u)ポリメラーゼを使用するポリヌクレオチドの鋳型なしの酵素による合成
CA2624324A1 (en) Thermostable viral polymerases and methods of use
US20050118578A1 (en) Amplified nucleic acids and immobilized products thereof
US20240158767A1 (en) Polymerase enzyme from phage t4
US20120083018A1 (en) Thermostable dna polymerases and methods of use
EP3580350B1 (en) Polymerase enzyme from pyrococcus furiosus
US12006519B2 (en) Polymerase mutants and use with 3′-OH unblocked reversible terminators
CN116249782A (zh) 使用热稳定性酶从头开始的不依赖于模板的核酸合成
WO2023143123A1 (zh) 可控合成单链dna的末端转移酶变体及应用
EP3580352A1 (en) Polymerase enzyme from pyrococcus abyssi
Olejnik et al. Polymerase enzyme from 9 N
Amblar et al. Purification and properties of the 5′-3′ exonuclease D10A mutant of DNA polymerase I from Streptococcus pneumoniae: a new tool for DNA sequencing
WO2023056394A1 (en) Polymerase variants for template-independent enzymatic nucleic acids synthesis and kit comprising the same
CN118234853A (zh) 新型末端脱氧核苷酸
CN117083392A (zh) 用于有效掺入核苷酸与3’-磷酸酯和其他3’-终止子的聚合酶
JP2004135628A (ja) Dnaの変異導入法

Legal Events

Date Code Title Description
A201 Request for examination