KR100811331B1 - 폴리뉴클레오티드의 분석 방법 - Google Patents

폴리뉴클레오티드의 분석 방법 Download PDF

Info

Publication number
KR100811331B1
KR100811331B1 KR1020017004172A KR20017004172A KR100811331B1 KR 100811331 B1 KR100811331 B1 KR 100811331B1 KR 1020017004172 A KR1020017004172 A KR 1020017004172A KR 20017004172 A KR20017004172 A KR 20017004172A KR 100811331 B1 KR100811331 B1 KR 100811331B1
Authority
KR
South Korea
Prior art keywords
modified
delete delete
nucleotide
polynucleotide
nucleotides
Prior art date
Application number
KR1020017004172A
Other languages
English (en)
Other versions
KR20010099663A (ko
Inventor
빈센트 피. 쥬니어 스탄톤
지아 류 윌페
토모히코 카와테
그레고리 버딘
Original Assignee
베어리어제닉스, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/394,467 external-priority patent/US6566059B1/en
Priority claimed from US09/394,457 external-priority patent/US6440705B1/en
Application filed by 베어리어제닉스, 인코포레이티드 filed Critical 베어리어제닉스, 인코포레이티드
Publication of KR20010099663A publication Critical patent/KR20010099663A/ko
Application granted granted Critical
Publication of KR100811331B1 publication Critical patent/KR100811331B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/06Pyrimidine radicals
    • C07H19/10Pyrimidine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/14Pyrrolo-pyrimidine radicals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/16Purine radicals
    • C07H19/20Purine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6872Methods for sequencing involving mass spectrometry
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • C12Q1/683Hybridisation assays for detection of mutation or polymorphism involving restriction enzymes, e.g. restriction fragment length polymorphism [RFLP]

Abstract

본 발명은 완전 서열을 결정할 필요 없이 뉴클레오티드 서열에서의 변이를 검출하는 것을 비롯한 폴리뉴클레오티드의 분석 방법, 폴리뉴클레오티드의 완전 서열 결정 방법, DNA의 유전자형 결정 방법 및 단편으로 절단되는 동안 폴리뉴클레오티드 단편의 표지 방법에 관한 것이다.
Figure R1020017004172
폴리뉴클레오티드, 서열 결정, 유전자형, 돌연변이, 증폭

Description

폴리뉴클레오티드의 분석 방법{A Method for Analyzing Polynucleotides}
본 발명은 일반적으로 유기 화학, 분석 화학, 생화학, 분자 생물학, 유전학, 진단학 및 의학에 관한 것이다. 특히, 본 발명은 폴리뉴클레오티드 분석 방법; 즉, 폴리뉴크레오티드의 완전한 뉴클레오티드 서열을 결정하는 방법, 연관된 폴리뉴클레오티드 사이의 뉴클레오티드 서열의 변이를 검출하는 방법 및 DNA의 유전자형결정 방법에 관한 것이다.
하기 기재된 것은 배경 정보로서만 제공되는 것이며, 본 발명에 대한 선행 기술임을 의도하거나 인정하려는 것은 아니다.
DNA는 모든 생존 세포의 유전 정보의 운반체이다. 유기체의 유전적 특성 및 물리적 특성, 그의 유전자형 및 표현형 각각은 유기체의 DNA의 정확한 핵산 서열에 의해 조절된다. 유기체 DNA에 존재하는 모든 서열 정보의 총합은 유기체의 "게놈"이라 불린다. DNA 분자의 핵산 서열은 4 종의 "뉴클레오티드"의 선형 중합체로 이루어져 있다. 4 종의 뉴클레오티드는 3 부분으로 이루어진 분자이고, 각각 (1) 4 개의 헤테로시클릭 염기, 즉 아데닌 (약어 "A"), 시토신 ("C"), 구아닌 ("G") 및 티민 ("T") 중 하나: (2) 1-탄소 원자가 헤테로시클릭 염기의 고리 질소 원자에 결합된 오탄당 유도체 2-데옥시리보스; 및 (3) 당 잔기의 5'-히드록시기 및 인산 분자 사이에 형성된 모노포스페이트 모노에스테르로 이루어져 있다. 뉴클레오티드는 한 뉴클레오티드의 5'-포스페이트와 다른 뉴클레오티드의 3'-히드록시기 사이의 디에스테르의 형성에 의해 중합되어 DNA 단일 스트랜드를 형성한다. 실제로, 이들 단일 스트랜드 두개는 상보적 뉴클레오티드간의 수소결합에 의해 상호작용하며, A는 T와 상보적으로, C는 G와 상보적으로 "염기쌍"을 형성하여 왓슨(Watson) 및 크릭(Crick)의 공지된 DNA "이중나선" 정보를 만든다. RNA는 티민 염기가 우라실("U")로 치환되고 오탄당이 데옥시리보스가 아닌 리보스 그 자체라는 점을 제외하고는 DNA와 유사하다. 또한, RNA는 실제로 주로 단일 스트랜드로 존재한다. 즉, 2 개의 스트랜드는 통상적으로 합해져서 이중나선을 형성하지 않는다.
폴리뉴클레오티드의 뉴클레오티드 서열을 언급할 때, 통상적으로 염기의 약어, 즉 A, C, G 및 T (또는 U)를 사용하여 염기를 포함하는 전체 뉴클레오티드를 나타낸다. 예를 들어, "ACG"로서 명명되는 폴리뉴클레오티드 서열은 아데닌 뉴클레오티드가 포스페이트 에스테르 결합을 통해 시토신 뉴클레오티드와 결합하고, 시토신 뉴클레오티드는 다른 포스페이트 에스테르 결합을 통해 구아닌 뉴클레오티드와 결합하고 있다는 것을 의미한다. 기재된 폴리뉴클레오티드가 DNA라면 "A"는 데옥시리보스 당을 함유하는 아데닌 뉴크레오티드를 의미하는 것으로 이해된다. 의미가 모호할 가능성이 있다면 DNA 분자의 "A"를 "데옥시A" 또는 단순히 "dA"로 명명할 수 있다. C 및 G에 대해서도 동일하게 적용된다. T는 DNA에만 있고 RNA에는 없기 때문에, 의미가 모호할 가능성이 없으므로 데옥시T 또는 dT로 언급할 필요가 없다.
대략적으로 한 유기체당 유전자의 수는 유기체의 표현형의 복잡함; 즉, 유기체를 복제하고 이를 기능하게 하는데 필요한 게놈 산물의 수에 비례한다고 말할 수 있다. 현재 가장 복잡한 것중의 하나라고 여겨지는 인간 게놈은 대략 60,000 내지 100,000 유전자 및 약 33억 염기 쌍으로 이루어져 있다. 이들 유전자 각각은 RNA를 코딩하며, 이들 대부분은 또한 특이적 생화학 또는 구조적 기능을 수행하는 특정 단백질을 코딩한다. 이들 유전자 중 어느 하나의 유전자 암호에서의 다형성 또는 돌연변이로서 또한 공지된 변이는 변형된 생화학 활성을 갖거나 또는 전혀 활성이 없는 유전자 산물, 대개 단백질 또는 RNA의 생성을 가져온다. 이는 특정 유전자를 포함하는 DNA 중 하나의 뉴클레오티드의 첨가, 결실 또는 치환 (천이(transition) 또는 염기전환(transversion))(종종 "단일 뉴클레오티드 다형성(single nucleotide polymorphism, SNP)"이라고 함)만큼 작은 변화로부터 온다. 유전자 암호의 이러한 돌연변이의 결과는 해가 없거나 약화시키거나 치명적이다. 현재 유전자 성분을 갖는다고 믿어지는 6700 이상의 인간 질환이 존재한다. 예를 들어, 혈우병, 알쯔하이머병, 헌팅톤병, 뒤시엔느 근위축증 및 낭성섬유증이 특정 유전자를 포함하는 DNA의 뉴클레오티드 서열의 변이와 연관되어 있다고 공지되어 있다. 또한, 특정 DNA 서열의 변화가 개체가 비만, 당료병, 심혈관계 질환, 중추신경계 질환, 자가면역질환 및 암과 같은 다양한 비정상적 상태로 쉽게 되도록 할 수 있다고 제안하는 증거들이 모아지고 있다. 특정 유전자의 DNA 서열의 변이는 또한 예를 들어, 약물, 방사선 치료, 영양 상태 및 다른 의학적 간섭에 반응하는 환자들 사이에서 관찰되는 상이함에 연관되어 있다. 그러므로, 유기체 게놈의 DNA 서열 변이를 검출할 수 있는 능력은 이러한 변이 및 의학 질환 및 의학 간섭에 대한 반응 사이의 관계에 대해 조사하는 측면에서 중요하다. 관계가 확립되면 환자의 게놈의 변이(들)를 검출할 수 있는 능력은 극히 유용한 진단 도구가 될 수 있다. 초기에 변이 검출을 이용함으로써 질병이 물리적으로 그 자신을 드러내기 전에 질병을 진단하고 궁극적으로 치료하거나 또는 심지어 예방하는 것이 가능하게 될 것이다. 또한, 원인이 공지되지 않았거나 유전학이 아니라고 여겨지는 질병의 유전자 염기를 발견할 수 있는 변이 검출은 가치있는 연구 도구일 수 있다. 변이 검출은 또한 하나 이상의 제안된 치료요법에 대한 환자들간의 반응이 상이한 경우 최적의 치료 요법을 선택하게 하는데 유용할 수 있다.
유전자 암호의 변이를 검출할 수 있는 것에 대한 잇점이 명백한 반면, 이렇게 실행하는 실제 측면은 인간 DNA의 서열 변이가 50 내지 100명의 개체를 비교시 100 개의 뉴클레오티드중 약 1의 빈도로 일어난다고 예측될 만큼 위협적이다 [Nickerson, D.A., Nature Genetics, 1998, 223-240]. 이는 인간 게놈의 변이 3천만개 정도로 많다는 것을 의미한다. 이들 변이중 아무것도 인간의 양호한 물리적 상태에 측정가능할 정도로 영향을 미치지 않는다(사실은 거의 영향을 미치지 않음). 이들 3천만개의 변이를 검출한 후, 이들이 인간 건강과 연관이 있다는 것을 결정하는 것은 만만치 않은 과제임이 명백하다.
변이 검출외에, 유기체 게놈의 완전한 뉴클레오티드 서열에 대한 지식은 유기체의 전체 생물학을 이해하는데 크게 기여할 것이다. 즉, 모든 유전자 산물, 그의 유기화 및 유기체의 게놈의 배열, 유전자 발현 (즉, 각각의 유전자 산물의 생 성) 및 복제를 조절하는데 필요한 서열을 확인하게 될 것이다. 사실, 이러한 지식 및 이해에 대한 의문점이 전체 인간 게놈의 서열화를 목표로 하는 국제적 노력인 인간 게놈 프로젝트(Human Genome Project)의 존재이유이다. 단일 게놈의 서열이 입수가능하다면 유기체가 무엇이든간에 이는 그 종의 다른 유기체, 특히 다른 특성을 나타내는 그 종 내에서의 유기체 (다른 특성과 연관된 DNA 서열의 상이함을 확인하기 위함)의 부분 또는 완전한 서열을 얻는데 유용하게 될 것이다. 미생물 유기체에 대한 이러한 상이한 특성에는 음성적인 측면에서는 병원성, 또는 양성적인 측면에서는 특정 중합체를 형성하거나 공해를 치료하는 능력이 포함될 것이다. 성장 속도, 영양소 함량 또는 페스트에 대한 저항성의 상이함은 식물들 사이에서 관찰될 수 있는 잠재적 차이점이다. 인간들 사이에서도, 질병에 대한 감수성(susceptibility) 또는 특정 치료요법에 대한 반응의 상이함이 유전학, 즉, DNA 서열, 변이와 연관될 수 있다. DNA 서열 정보로부터 인지될 거대한 잠재적 유용성, 특히 같은 종의 개체 사이의 DNA 서열 변이의 확인의 결과에 따라 빠르고 저가인 자동화 DNA 서열화 및 변이 검출 방법에 대한 요구가 미래에 극적으로 증가할 것으로 기대될 수 있다.
DNA 세그먼트, 예를 들어 유전자, cDNA, 또는 더 크게는 염색체 또는 전체 게놈의 DNA 서열이 결정된다면, 동일한 종의 개체 사이에서의 DNA 세그먼트의 서열 변이의 존재에 대해 연구할 수 있다. 완전한 DNA 서열화는 이 과제를 성취하기 위한 확실한 방법이다. 그러므로, 상기 종의 다른 개체로부터 얻은 DNA 세그먼트의 복사본의 완전한 서열을 결정하고, 이전에 얻어진 것과 완전한 서열을 단순히 비교 하는 것이 가능하다. 그러나, 현재 DNA 서열화 기술은 비용과 시간이 많이 들고, 높은 수준은 정확도를 얻기 위해서는 높은 중복이 필요하다. 대부분의 주요 서열화 프로젝트는 염기 2,000개중 1회 내지 염기 10,000개중 1회의 허용가능한 오차율에 도달하는데 각각의 뉴크레오티드의 5배 내지 10 배의 서열화범위를 필요로 한다. 또한, DNA 서열화는 변이를 검출하는데 있어 비효과적 방법이다. 예를 들어, 유전자의 임의의 2 개의 복사본 사이에서의 변이는 예를 들어 2 개의 염색체가 비교되는 경우 1,000개 이상의 염기에서 1회로 드물게 일어날 수 있다. 그러므로, 변이가 존재하는 서열의 오직 작은 부분만이 관심 대상이다. 그러나, 전체 서열화를 사용하면 전술한 작은 부분을 포함하는 원하는 정보에 도달하기 위해 거대한 수의 뉴클레오티드가 서열화되어야 한다. 예를 들어, 말하자면 4 종의 변이를 검출하기 위해 3,000개의 뉴클레오티드 DNA 서열의 10개의 버전을 비교하는 것을 생각해보자. 비록 오직 2배의 중복이 사용된다고 하더라도 (개체 각각으로부터 3,000개의 뉴클레오티드 DNA 세그먼트 이중 스트랜드의 각 스트랜드가 1회 서열화됨) 60,000개의 뉴클레오티드가 서열화되어야 할 것이다(10×3,000×2). 또한, 신규 프라이머로 추가 실행을 필요로 하는 서열화에 대한 문제점에 직면하게 될 것이다. 즉, 프로젝트는 4 종의 변이를 결정하기 위해 100,000개 만큼 많은 수의 뉴크레오티드를 서열화하는 문제점을 발생시킬 수 있다. 지난 15년 동안 서열의 상이함을 확인하고 변이 부위의 위치에 대한 약간의 정보를 제공하기 위한 다양한 방법이 개발되어 왔다(표 1). 이러한 방법을 이용하면 3000 nt(뉴클레오티드) 서열의 비교적 짧은 4 부분을 서열화할 필요성만이 있을 것이다. 또한, 각각의 변이가 특징적 변화 (표 1)를 진행시킨 후, 예를 들어 50개의 샘플중 22개가 변이 검출 방법에 의해 이러한 특징적 변화를 나타낸다면 22개 중 4 개의 샘플을 서열화함으로써 다른 18 개에 대한 정보를 제공할 것이기 때문에 몇몇의 샘플만을 각각의 영역에서 서열화해야 할 것이다. 서열화를 필요로하는 세그먼트의 길이는 사용되는 변이 검출 방법에 따라 50 내지 100 nt만큼 짧을 수 있다. 즉, 서열화 프로젝트의 규모는 4(부위)×50(부위당 nt)×2(각 개체로부터의 스트랜드)×2(부위당 개체) 또는 오직 약 800 뉴클레오티드로 감소될 수 있다. 이는 진행되는 변이 검출 단계의 부재시 필요로 되는 서열화의 약 1%의 정도이다.
현재 실행되는 바와 같이, 폴리뉴클레오티드의 전체 뉴클레오티드 서열을 결정하는 기술, 및 폴리뉴클레오티드와 연관된 이전에 공지되지 않은 변이 또는 돌연변이를 검출하는 방법은 다음과 같이 완성된다. 즉, 연관된 폴리뉴클레오티드 사이에 단일 뉴클레오티드 변이가 존재하거나 또는 존재하지 않더라도 연관된 폴리뉴클레오티드의 세그먼트의 완전한 서열을 결정한 후 비교하는 것이다.
공지되지 않은 변이를 검출하는데 필요한 완전한 서열화 정도를 감소시키는 제1 단계로서 표 1에 기재된 바와 같은 변이 검출 방법이 사용될 수 있다는 점만이 차이점이다.
Figure 112004044300818-pct00195
완전한 뉴클레오티드 서열화를 실행하는 방법의 두가지 부류는 맥삼 및 길버트(Maxan and Gilbert) 화학적 방법 [Proc. Nat. Acad. Sci. USA, 74, 560-564 (1977)] 및 생어(Sanger) 등의 연쇄반응-종결 방법 (chain-terminating procedure) [Proc. Nat. Acad. Sci. USA, 74, 5463-5467 (1977)]이다.
완전한 뉴클레오티드를 서열화하는 맥삼-길버트 방법은 예를 들어 32P를 함유하는 DNA 분자를 말단-표지한 후, 2 개의 반응 각각을 수반하는 2 개의 별개 반응 서열 중 하나를 수반한다(즉, 전체 4 개의 반응). 이들 반응 서열 중 하나는 조사될 폴리뉴클레오티드(대부분의 경우 DNA와 같은 단리된 자연 발생 폴리뉴클레오티드임)의 퓨린 뉴클레오티드 구아닌 (G) 및 아데닌 (A)의 선택적 메틸화를 수반한다. 구아닌의 N7 위치는 아데닌의 N3 위치보다 대략 5배 빠르게 메틸화된다. 수성 염기의 존재하에 가열되는 경우 메틸화된 염기는 제거되고 폴리뉴클레오티드 사슬이 끊기게 된다. 반응 산물이 폴리아크릴아미드 겔 플레이트상에서 전기영동으로 처리되는 경우 G 절단 래더(ladder)가 우세하므로 메틸화된 아데닌보다 메틸화된 구아닌과의 반응이 더욱 효과적이다. 반면에, 산성 조건하에서는 메틸화된 염기 모두가 효과적으로 제거된다. 피페리딘에 의한 처리는 A+G에 상응하는 서열화 래더를 생성시켜 이러한 비염기성 부위에서 DNA를 절단시킨다.
그러므로, 4 개의 화학 반응 후 얻어진 절단 산물의 말단-표지된 래더를 전기영동 분석함으로써 DNA 분자의 정확한 뉴클레오티드 서열을 밝히게 될 것이다. 맥삼-길버트 서열화 방법에 있어 각각의 감수성(susceptible) 위치에서 1 내지 2%와 비슷한 부분적인 절단만이 일어나는 것은 중요한 점이다. 이는 전기영동이 크기에 의해 단편을 분리하기 때문이다. 의미있게는, 형성된 단편은 평균적으로 분 자당 단일 변형 및 절단을 나타내야 한다. 그 후, 4 개의 반응 모두의 단편이 크기에 따라 정렬되면 표적 DNA의 정확한 서열이 결정될 수 있다.
완전한 뉴클레오티드 서열을 결정하는 생어 방법은 효소적 중합에 의해 염기-특이적 사슬-말단 표지된 DNA 단편의 4 개의 연속물을 제조하는 것으로 이루어져 있다. 맥삼-길버트 방법에서와 같이, 4 개의 별도의 반응이 수행될 수 있다. 생어 방법에서 4 개의 반응 혼합물 각각은 동일한 올리고뉴클레오티드 주형 (단일 또는 이중 스트랜드 DNA), 4 종의 뉴클레오티드 A, G, C 및 T(이들중 하나는 표지될 수 있음), 폴리머라제 및 프라이머, 주형 올리고뉴클레오티드와 상보적인 뉴클레오티드의 중합에 영향을 미치는 존재하는 폴리머라제 및 프라이머를 포함한다. 4 개의 반응 혼합물중 하나에 뉴클레오티드중 하나의 디데옥시 유도체를 실험적으로 결정된 양으로 가한다. 나머지 3 종의 뉴클레오티드중 하나의 디데옥시 유도체 소량을 제2 반응 혼합물에 가하여, 다른 디데옥시 뉴클레오티드를 각각 포함하는 4 개의 반응 혼합물을 얻는다. 3'-히드록실기가 없는 특징이 있는 디데옥시 유도체는 초기 올리고뉴클레오티드 사슬에 회합될 때 효소 중합 반응을 종결시킨다. 즉, 말하자면 디데옥시아데노신 트리포스페이트 (ddATP)를 함유하는 하나의 반응 혼합물에서 전기영동에 의해 분해되면 연쇄반응-종결 ddA가 중합 반응에 회합되는 점까지 생성된 단편의 크기에 상응하는 일련의 밴드를 형성하는 ddA가 모든 말단에 있는 일련의 올리고뉴클레오티드 단편이 형성된다. 상응하는 단편의 래더는 올리고뉴클레오티드 단편의 말단이 C, G 및 T인 다른 반응 혼합물 각각으로부터 얻어질 수 있다. 단편의 4 개의 세트는 "서열 래더"를 생성하는데, 래더의 가로 막대는 표제 DNA를 포함하는 염기 서열에서 그 다음 뉴클레오티드를 나타낸다. 그러므로, DNA의 정확한 뉴클레오티드 서열은 자동화 DNA 서열화 장치의 경우에 자가방사선촬영법 또는 크로마토그램의 컴퓨터 분석후 전기영동 겔 플레이트에서 간단히 판독될 수 있다. 상기 언급된 바와 같이, 변형된 뉴클레오티드를 효과적으로 회합하는 염료-표지된 연쇄반응 종결 디데옥시뉴클레오티드 및 변형된 폴리머라제는 개선된 연쇄반응-종결 서열화 방법이다.
맥삼-길버트 및 생어 방법 모두는 단점을 갖는다. 이는 시간 소모적이고 노동 집약적이고 (특히 생어 방법처럼 자동화되지 않은 맥삼-길버트 방법에 대하여), 고가이며 (예, 생어 방법의 가장 최상의 버전은 매우 고가의 시약을 필요로 함), 적절한 작동 및 신뢰할 만한 결과를 확신하기 위해 우수한 정도의 전문적 기술 지식을 요구한다는 것이다. 또한, 맥삼-길버트 방법은 겔 플레이트로부터 폴스(false) 래더 판독을 가져올 수 있는 인공 단편을 생성시킬 수 있는 변형 화학의 특이성 부족으로 어려움을 겪는다. 반면에 생어 방법은 중합 반응을 간섭할 수 있는 주형 2차 구조 형성에 감수성이 있다. 이 문제점은 염료 표지된 디데옥시 종결제를 사용함으로써 호전됨에도 불구하고, 판독불가능한 서열의 부분을 만드는 서열 래더에 나타나는 잘못된 단편을 가져올 수 있는 2차 구조를 보고 중합의 종결("종결" 이라 함)을 일으킨다. 또한, 두 서열화 방법 모두는 전기영동 중에 단편 이동성에 영향을 줄 수 있는 DNA 2차 구조의 다른 결과인 "압축"에 민감하며, 이로인해 서열 래더를 판독불가능하게 하거나 2차 구조의 주변을 잘못 해석하게 한다. 또한, 두 방법 모두는 래더의 불규칙한 강도에 의해 그리고 비특이적 백그라운드에 의해 어려움을 겪는다. 이들 사항은 변이 검출이 관건인 경우에 확대되게 된다. 단일 뉴클레오티드 변이를 식별하기위해, 사용되는 방법을 극히 정확해야 한다. 하나의 뉴클레오티드를 판독할 때의 "실수"는 양성 폴스(false); 즉, 존재하지 않는 변이를 지시하는 결과를 가져올 수 있다. 맥삼-길버트 방법 및 생어 방법 모두는 단일 실행으로는 이러한 정확도를 얻는 것이 불가능하다. 사실, 서열화 실험의 "한번 실행"에서의 오차의 빈도는 1% 이상으로, 서열의 2 개의 버전을 비교시 실제 DNA 변이의 빈도보다 10 배 높다. 비교될 폴리뉴클레오티드 각각에 대해 (대개 "샷건(shotgun)" 서열화 방법에 대하여) 여러번 실행함으로써 상황은 호전될 수 있으나, 장비, 시약, 노동력 및 시간의 측면에서 비용이 단순히 증가된다. 서열화의 높은 가격은 연관된 폴리뉴클레오티드 중에서 뉴클레오티드 서열 변이를 찾을 때 표제 폴리뉴클레오티드의 완전한 서열 또는 변이의 완전한 성질을 결정하는 것이 종종 불필요하며 (보다시피 몇몇의 경우에 본 발명의 방법을 이용하여 식별가능함에도 불구하고); 변이 검출 단독으로도 충분할 수 있다고 여겨지게 한다.
맥삼-길버트 및 생어 방법과 연관된 문제점 모두를 피할 수 없지만 상기 방법을 적어도 더 효과적으로 만들도록 하는 여러 기술이 고안되어 왔다. 이러한 노력중 하나가 방법중에서 가장 시간 소모가 많은 단계의 하나인 평면(slab) 겔 전기영동을 피하는 방법을 개발하는 것이다. 예를 들어, 미국 특허 제5,003,059호 및 제5,174,962호에 생어 방법이 사용되고 있으나; 중합 반응을 종결시키는데 사용되는 뉴클레오티드 각각의 디데옥시 유도체는 유일하게 황의 동위원소인 32S, 33S, 34 S 또는 36S로 태그되어 있다. 중합 반응이 종결되면, 연쇄반응 종결 서열은 평면 겔 전기영동과 비교되는 모세관 존(capillary zone) 전기영동에 의해 분리되고, 분해를 증가시키고 실행 시간을 감소시키고 매우 소량의 샘플을 분석하게 한다. 그 후 분리된 연쇄반응 종결 서열은 연소되어 회합된 황 동위원소가 이산화황 동위원소 (32SO2, 33SO2, 34SO236SO 2)로 전환하게 된다. 그후 이산화황 동위원소는 질량 분석법으로 처리된다. 황 동위원소 각각은 유일하게 염기-특이적 연쇄반응 종결 단편의 4 개의 세트 중 하나와 연관되어 있기 때문에 표제 DNA의 뉴클레오티드 서열은 질량 분석으로부터 결정될 수 있다.
미국 특허 제5,580,733호에 개시된 다른 방법은 또한 생어 기술을 포함하고 있으나 겔 전기영동을 함께 제거한다. 상기 방법은 생어 반응으로부터 염기-특이적 연쇄반응 종결 올리고뉴클레오티드의 4 개의 군 각각을 취하는 것 및 3-히드록시피콜린산과 같은 가시레이저광선 흡수 매트릭스와의 혼합물을 형성하는 것을 수반한다. 그 후 상기 혼합물은 가시레이저광선으로 비춰지고 증발되는데, 이는 연쇄반응 종결 핵산 단편의 추가 단편화 없이 일어난다. 그 다음 하전된 증발된 분자는 전기장에서 가속화되고, 이온화된 분자의 질량 대 전하 (m/z) 비율이 시간-비행 질량 측정법 (time-of-flight mass spectrometry, TOF-MS)에 의해 결정된다. 그 후 표제 DNA의 정확한 서열을 결정하기 위해 분자량을 정렬한다. 그 다음 혼합물 각각에 포함된 연속적 단편 사이의 질량차를 측정함으로써 A, G, C 또는 T로 종결된 단편의 길이를 추론할 수 있다. 현재 MS 장치의 중요한 한계는 통상적으로 사용시 길이가 뉴클레오티드 100 개 이상 (많은 장치에서는 50개 뉴클레오티드)인 폴리뉴클레오티드 단편은 특히, 단편이 복합 혼합물의 부분일 경우 효과적으로 검출되지 않는다는 것이다. 분석될 수 있는 단편의 크기에 대한 엄격한 한계로 인해 MS에 의한 폴리뉴클레오티드 분석의 개발이 제한되어 왔다. 그러므로, 현재 MS 장치의 능력을 DNA와 같은 큰 폴리뉴클레오티드에 적합하게 하는 방법이 필요하다. 본 발명은 이러한 방법을 제공한다.
뉴클레오티드 서열화로의 추가 접근이 미국 특허 제5,547,835호에 개시되어 있다. 다시, 시작점은 생어 서열화 전략이다. 4 종의 염기 특이적 연쇄반응 종결 일련의 단편들은 예를 들어, 정제, 양이온 교환 및 질량 변형에 의해 상태조절된다. 그 후 상태조절된 단편의 분자량은 질량 분석법에 의해 결정되고, 시작 핵산의 서열은 분자량에 따라 염기 특이적 종결 단편을 정렬함으로써 결정된다.
상기 방법 각각은 질량 분석법에 의한 분석 전에 폴리뉴클레오티드의 완전한 생어 서열화를 수반한다. 유전적 돌연변이; 즉 변이를 검출하기 위해 완전한 서열은 공지된 뉴클레오티드 서열과 비교될 수 있다. 서열이 공지되지 않은 경우, 대상 유기체에서 비정상적인 것이 나타나지 않는 동일한 유기체의 다른 것으로부터 단리된 동일한 DNA의 뉴클레오티드 서열과 비교함으로써 돌연변이를 밝힐 것이다. 이러한 접근법은 물론 생어 방법을 2 회, 즉 8 개의 별도의 반응을 실행하는 것을 요구한다. 또한, 잠정적 변이가 검출된다면 전체 방법은 양성 폴스(false)가 얻어지지 않았다는 것을 확신하기 위해 다른 프라이머를 사용하여 마주보는 스트랜드를 서열화하는 것을 대부분의 경우 다시 실행할 것이다. 특정 질환과 연관된 특이적 뉴클레오티드 변이 또는 돌연변이가 공지된 경우, 완전한 서열화없이 변이를 검출 하는 광범위한 다양한 방법이 공지되어 있다. 예를 들어 미국 특허 제5,605,798호에 이러한 방법이 기재되어 있다. 상기 방법은 생물학 샘플로부터 대상이 되는 표적 서열을 함유하는 핵산 분자를 얻는 것, 그리고 임의로 표적 서열을 증폭시킨 후, 표적 서열에 대해 상보적인 것으로 특이적으로 고안된 검출기 올리고뉴클레오티드에 표적 서열을 혼성화시키는 것을 수반한다. 검출기 올리고뉴클레오티드 또는 표적 서열은 혼성화 전에 질량 변형에 의해 "상태조절"된다. 비혼성화된 검출기 올리고뉴클레오티드는 제거되고, 남은 반응 산물은 증발되고 이온화된다. 질량 분석법에 의한 검출기 올리고뉴클레오티드의 검출은 생물학 샘플중에 표적 핵산 서열이 존재함을 지시하고, 따라서 변이와 연관된 질환의 진단을 확실하게 한다.
상당한 정도의 오버랩이 있긴 하지만 변이 검출 방법을 일반적인 두 카테고리로 나눌 수 있다. 하나의 카테고리인 변이 검출 방법은 신규 변이의 존재, 위치 및 특성에 대해 DNA 세그먼트를 검사하는데 유용하다. 이를 성취하기 위해서 변이 검출 방법은 DNA 서열화와 합해질 수 있다.
방법의 제2 군인 변이 분류 (종종 유전자형 결정이라고 함) 방법은 변이(들)의 위치가 이전에 확인되고 특성화된 경우 DNA 세그먼트 중 특정 부위에서 뉴클레오티드를 반복 결정하는데 유용하다. 이 유형의 분석에서, 종종 특정 뉴클레오티드(들)의 상태에 대한 매우 민감한 시험을 고안할 수 있다. 물론 이 기술은 신규 변이를 발견하는데 매우 적합한 것은 아니다.
상기 지시한 바와 같이, 표 1은 많은 존재하는 뉴클레오티드 검사용 기술의 리스트이다. 이들중 주요 기술은 주로 신규 변이 결정에 사용된다. 나타내지 않 은 유전자형 결정을 위한 다른 다양한 방법이 있다. 맥삼-길버트 및 생어 서열화 방법처럼 이들 기술은 일반적으로 시간-소모적이며 장황하고, 각 방법으로부터 최대의 정확성을 얻기 위해 비교적 고도의 기술을 필요로 한다. 리스트에 있는 기술중 몇몇은 최선을 다해도 본질적으로 바람직한 것보다 덜 정확할 것이다.
주로 변이 검출을 위해 고안된 표 1의 방법은 변이 뉴클레오티드가 이미 확인되고 1 개 이상의 공지되지 않은 DNA 샘플 (변이 분류 또는 유전자형 결정)에서의 그의 상태를 결정하는 것이 목표인 경우에 또한 사용될 수 있다. 구체적으로 유전자형 결정을 위해 개발되어 온 방법들중 몇몇에는 (1) 프라이머 신장 반응의 디데옥시뉴클레오티드 종결이 다른 길이의 신장 산물 또는 다른 종결 뉴클레오티드가 생기는 변이 부위에서 일어나며, 이것이 그 후 플레이트 판독기에서 전기영동, 질량 분석법 또는 형광법에 의해 결정될 수 있는 프라이머 신장 방법; (2) 변이 부위에 2 개의 가능한 서열에 상응하는 올리고뉴클레오티드가 고체 표면에 부착되고 공지되지 않은 샘플로부터 프로브와 혼성화되는 혼성화 방법; (3) 제한 엔도뉴클레아제 인지 부위가 하나의 변이 뉴클레오티드와는 절단가능하나 다른 변이 뉴클레오티드와는 절단가능하지 않은 다형성 뉴클레오티드를 포함하는 제한 단편 길이 다형성 분석; (4) 뉴클레아제 분해에 의해 폐지되는 프로브상에 2 개의 플루오르 사이의 형광 공명 에너지 전이 (Fluorescent resonance energy transfer, FRET)가 있는 표지된 올리고뉴클레오티드 프로브의 상이한 혼성화 및 그에 따른 상이한 5'-엔도뉴클레아제 분해를 수반하는"태크맨(TaqMan)"과 같은 방법; (5) 대립형질 유전자 특이적 혼성화를 활용하는 분자 베콘(beacon)이라 불리는 표지된 올리고뉴클레오티 드 프로브를 수반하는 다른 FRET 기재 방법; (6) 오직 하나의 올리고뉴클레오티드에 완전하게 맞는 다형성 부위를 가로질러 2 개의 올리고뉴클레오티드의 효소 라이게이션(ligation)을 필요로 하는 라이게이션 의존적 방법; (7) 중합효소 연쇄반응 (PCR)에서 대립형질 유전자 특이적 올리고뉴클레오티드 프라이밍이 있다 [U. Landegren, et al., 1998, Reading Bits of Genetic Information: Methods for Single-nucleotide Polymorphism Analysis, Genome Research 8(8):769-76].
바이러스, 세균 또는 진핵세포 (예, 인간을 포함하는 고등 유기체)의 전체 게놈과 같은 큰 주형의 완전한 서열화, 또는 비교할 목적으로 주어진 종들의 개체 또는 다른 균주로부터의 큰 DNA 영역(들)의 반복 서열화가 바람직하다면, DNA 서열화를 위한 주형의 라이브러리를 만드는 도구적 전략이 필요하게 된다. 이는 종래의 연쇄반응 종결 서열화(즉, 생어 방법)가 대상 폴리뉴클레오티드의 뉴클레오티드 래더를 생성시키는데 사용되는 분석 방법의 분해 능력에 의해 제한되기 때문이다. 겔에 있어서, 이 분해 능력은 한번에 대략 500 내지 800 nt이다. 질량분석에 있어서, 한계는 장치에서 검출하기 전에 효과적으로 증발될 수 있는 폴리뉴클레오티드의 길이이다. 더 큰 단편이 더 고도화된 방법 및 장치에 의해 분석되어 왔음에도 불구하고, 현재 이 한계는 대략 50 내지 60 nt이다. 그러나, 인간 게놈 프로젝트 (Human Genome Project)와 같은 대규모의 서열화 프로젝트에서 "마커(marker)" (그 존재가 중합효소 연쇄 반응(PCR)에 의해 비교적 쉽게 확인될 수 있으며, 따라서 게놈의 신규 영역을 맵핑(mapping)하기 위한 참고 자료로서 사용될 수 있는 공지된 염색체 위치의 DNA 세그먼트)는 현재 약 100 킬로염기(Kb)의 분리된 염기이다. 100 Kb 간격의 마커는 효과적 서열화 전략에 의해 연결되어야 한다. 사용된 분석 방법이 겔 전기영동이라면, DNA 100 kb 스트레치 서열에 대해 100 개의 서열화 반응을 필요로 될 것이다. 주의를 기울여야 하는 기초적 의문점은 프로세스를 최적화하기위해 100 kB 세그먼트 (또는 취급될 크기에 상관 없이)를 분할하는 방법; 즉, 원하는 수준의 정확도로 완전한 서열을 생성하는데 필요한 서열 어셈블리 작업 및 서열화 반응의 수를 최소화하는 방법이다. 이에 관하여 주요 관심사항은 초기에 한번 서열화된 단편을 올바르게 재조립하여 전장 표적 DNA를 재생성시키는 방법으로 DNA를 단편화하는 방법이다. 현재, 2 가지 일반적인 접근법은 서열을 전장 표적 DNA ("샷건 서열화" (예를 들어, 문헌 [Venter, J. C., et al., Science, 1998, 280: 1540-1542; Weber, J. L. 및 Myers, E. W., Genome Research, 1997, 7: 401-409; Andersson, B. et al., DNA Sequence, 1997, 7: 63-70] 참조), 및 "직접 DNA 서열화" (예를 들어, 문헌 [Voss, H., et al., Biotechniques, 1993, 15: 714-721; Kaczorowski, T., et al., Anal. Biochem., 1994, 221: 127-135; Lodhi, M. A., et al., Genome Research, 1996, 6: 10-18] 참조))로 재조립하는데 필요한 정보 및 서열-준비 단편 둘 모두를 제공한다
샷건 서열화는 플라스미드 또는 파지미드 (phagemid)와 같은 서열-준비 벡터의 "클론 (clone)" 및 랜덤 단편의 큰 라이브러리의 형성을 수반한다. 본래 서열의 모든 부분이 비교적 동일하게 나타나는 라이브러리에 도달하기 위해, 샷건 서열화된 DNA가 종종 거의 랜덤 단편화를 형성하는 것으로 보여진 음파처리와 같은 물리적 방법에 의해 단편화된다. 그 후, 클론은 서열화를 위해 샷건 라이브러리로부 터 무작위로 선택된다. DNA의 완전한 서열은 짧은 (대략 500 nt) 샷건 서열에서 오버랩되는 서열을 확인함으로써 어셈블리된다. DNA의 전체 표적 영역이 무작위로 선택된 클론 중에서 나타난다는 것을 확신하고, 에러 (잘못 배열된 오버랩) 빈도를 감소시키기 위해, 높은 정도의 서열화 중복이 필요하다 (예를 들어, 7 내지 10 배). 이러한 높은 중복에도 불구하고, 서열화범위에 갭을 채우기 위해 추가 서열화가 종종 필요하다. 다중 클론의 다른 위치에서 일어날 수 있는 Alu (단배체 게놈당 500,000 내지 1,000,000 복사본에서 일어나는 300 염기쌍 서열) 및 LINES (긴 7,000 염기일 수 있으며 단배체 게놈당 100,000 복사본 만큼 많이 존재할 수 있는 "Long INterspersed DNA sequence Elements")와 같은 반복 서열의 존재는 DNA 서열 재조립을 문제점있게 할 수 있다. 예를 들어, 이들 서열 부류중 다른 개체들은 이러한 반복의 반대쪽 측면에서 서열 관계를 결정하는 것을 매우 어렵게 만들 수 있는 동일성이 90% 이상일 수 있다. 도 X는 서열이 문헌 [Martin-Gallardo, et al., Nature Genetics, (1992) 1: 34-39]에 보고된 서열화 후 가설상의 10 kb 서열 모델링에서 샷건 서열화로의 접근의 어려움을 나타낸다.
두 번째 일반적인 접근법인 직접 DNA 서열화는 종종 큰 삽입물 (예, 코스미드, P1, PAC 또는 BAC 라이브러리)를 갖는 클론의 라이브러리를 만드는 것을 또한 필요로 한다. 이 방법에서, 서열화될 영역중 클론의 위치는 맵핑되어 서열화될 영역의 거리를 재는 최소-오버랩 틸링(tiling) 경로를 구성하는 클론의 세트를 얻게 된다. 그 후, 이 최소 세트로부터의 클론은 "프라이머 워킹(primer walking)"(예를 들어 상기 Voss의 문헌 참조)과 같은 방법에 의해 서열화된다. 이 방법에서, 한 서열의 말단은 다음 서열화 반응을 시작할 때 신규 서열화 프라이머를 선택하는데 사용되고, 제2 서열의 말단은 다음 프라이머를 선택하는데 사용되며 그 다음도 이와 같다. 완전한 DNA의 어셈블리는 직접적 서열화에 의해 더 쉽게 이루어지며, 클론의 순서 및 서열화범위의 완전성 모두가 클론 맵(map)으로부터 공지되어 있기 때문에 서열화 중복이 덜 요구된다. 반면에, 맵 그 자체를 어셈블링하는 것은 상당한 노력을 필요로 한다. 또한, 신규 서열화 프라이머가 합성될 수 있는 속도, 및 그렇게 실행하는데 드는 비용은 종종 프라이머 워킹에 대한 제한 요인이 된다. 신규 프라이머 구조를 단순화시키는 다양한 방법이 본 방법에 도움이 되는한 (예를 들어 상기 Kaczorowski 등의 문헌 및 Lodhi 등의 문헌 참조) 직접 DNA 서열화는 가치있지만 종종 고가이며 느린 방법으로 남아 있다.
대부분의 대규모 서열화 프로젝트는 샷건 서열화 및 직접 서열화 모두의 측면을 이용한다. 예를 들어 상세한 맵은 표적 영역의 완전한 서열화범위를 제공하는 클론의 최소 세트를 확인하는 큰 삽입물 라이브러리(예, BACs)로 만들어 질 수 있지만, 큰 삽입물 각각의 서열화는 큰 삽입물 각각 샷건 접근; 예를 들어 큰 삽입물을 단편화하고, 더 최적의 서열화 벡터에서 단편을 재클로닝하는 것에 의해 실행된다 (예를 들어, 문헌 [Chen, C. N., Nucleic Acids Research, 1996, 24: 4034-4041] 참조). 샷건 및 직접 방법은 또한 초기 샷건 실험에 의해 다루어지지 않는특이적 영역이 그 후 직접적 서열화에 의해 결정되는 상보적 방법에서 사용된다.
그러므로, 게놈 DNA 서열화 프로젝트에서 요구되는 바와 같이 큰 분자를 완전히 서열화하기 위한 샷건 및 직접 서열화로의 접근에는 상당한 제한이 존재한다. 그러나, 인접한 DNA의 이용가능한 판독 길이가 현재 생어 방법에 의해 효과적으로 서열화될 수 있는 500 내지 800 nt로부터 확장된다면 두 방법 모두 이롭게 될 것이다. 예를 들어, 직접 서열화는 또한 표지물 사이의 더 긴 길이를 혀용하는 더 긴 판독 길이에 의해 성취될 수 있는 고분해 맵에 대한 필요성을 감소시킴으로써 유의하게 개선될 수 있다.
현재 서열화 방법의 주된 제한은 오차율이 높다는 것이다 [Kristensen, T., et al, DNA Sequencing, 2: 243-346, 1992; Kurshid, F. 및 Beck, S., Analytical Biochemistry, 208: 138-143, 1993; Fichant, G. A. 및 Quentin, Y., Nucleic Acid Research, 23:2900-2908, 1995]. 맥삼-길버트 및 생어 방법과 연관된 많은 오차는 시스템적인 것, 즉 오차가 랜덤하지 않고; 오히려 반복적으로 일어난다고 공지되어 있다. 이를 피하기 위해, 두가지 기계적으로 상이한 서열화 방법을 이용하여 한 방법에서의 시스템 오차를 검출하여 제2 등의 방법에 의해 교정할 수 있다. 현재 서열화 방법의 비용의 상당한 부분이 서열화 오차를 감소시키기 위한 높은 중복에 대한 필요성과 연관되어 있기 때문에 두 가지 방법을 이용함으로써 높은 정확도 DNA 서열을 얻는데 드는 전체 비용을 감소시킬 수 있다.
리보뉴클레오티드 및 데옥시리보뉴클레오티드로 이루어진 폴리뉴클레오티드의 형성 및(또는) 화학적 절단은 상기 기재되어 있다. 특히, 리보뉴클레오티드 및 데옥시리보뉴클레오티드를 폴리뉴클레오티드에 회합시키는 돌연변이 폴리머라제가 기재되어 있으며; 중합에 의한 혼합 리보- 및 데옥시리보- 함유 폴리뉴클레오티드의 형성이 기재되어 있고; 이러한 혼합 폴리뉴클레오티드로부터의 서열 래더의 생 성이 기재되어 있다(화학 염기에 대한 리보 당의 공지된 능력을 연구함).
그러나, 이러한 방법의 용도는 (i) 1 개의 리보뉴클레오티드 및 3 개의 데옥시리보뉴클레오티드가 혼입되고; (ii) 리보뉴클레오티드에서의 절단이 화학적 염기를 사용하여 수행되고, (iii) 리보뉴클레오티드 함유 폴리뉴클레오티드의 부분적 절단만이 실행되고, (iv) 상기 방법의 유용성이 전기영동으로 분리되는 서열 래더의 생성에 국한되는 것인 폴리뉴클레오티드에 제한되어 있다.
또한, 후속 단계에서 화학적 염기에 의해 실질적으로 완전히 절단되는, 단일 리보뉴클레오티드 함유 폴리뉴클레오티드 프라이머의 화학적 합성이 보고되어 있다. 이 때, 프라이머 신장 산물의 크기는 질량 분석법 또는 다른 방법에 의해 결정된다.
<발명의 요약>
완전한 뉴클레오티드 서열 및 변이(들)의 존재를 결정하기 위한 단순하며 저가이고, 빠르고, 민감하고 정확한, DNA와 같은 폴리뉴클레오티드 분석 방법이 필요하다는 것은 상기로부터 명백하다. 또한, 반복 조밀 영역에 걸쳐 매우 긴 DNA 서열의 어셈블리를 가능하게 하는 방법이 필요하다. 본 발명의 방법은 이들 필요성 각각을 충족시킨다. 일반적으로, 본 발명은 DNA, 및 화학적으로 변형된 뉴클레오티드의 효소 회합에 의해 변형된 다른 폴리뉴클레오티드의 특이적 절단에 기초를 둔 신규한 유전자형 결정 방법, DNA 서열화 방법 및 변이 검출 방법을 제공한다.
그러므로, 한 면에서, 본 발명은
a. 폴리뉴클레오티드중 하나 이상의 천연 뉴클레오티드를 실질적으로 존재하 고 있는 각각의 위치에서 변형된 뉴클레오티드로 치환하여 변형 폴리뉴클레오티드를 형성시키는 단계(단, 상기 변형된 뉴클레오티드는 리보뉴클레오티드가 아님); 및
b. 상기 변형 폴리뉴클레오티드를, 변형된 뉴클레오티드가 실질적으로 존재하는 각 위치에서 그를 절단하는 시약(들)과 접촉시키는 단계를 포함하는, 폴리뉴클레오티드의 절단 방법에 관한 것이다.
다른 면에서, 본 발명은
c. 단계 b로부터 얻은 단편의 질량을 측정하는 단계; 및
d. 상기 단편의 질량을 공지된 서열의 관련 폴리뉴클레오티드의 절단시에 예측되는 단편의 질량과 비교하는 단계; 또는
e. 공지되지 않은 서열의 하나 이상의 관련 뉴클레오티드에 대하여 단계 a 내지 c를 반복하고, 상기 폴리뉴클레오티드의 상기 단편의 질량을 관련 폴리뉴클레오티드로부터 얻은 단편의 질량과 비교하는 단계를 더 포함하는, 관련 폴리뉴클레오티드에서 뉴클레오티드 서열 변화를 검출하는데 사용하기 위한 상기 기재된 방법에 관한 것이다.
본 발명의 다른 면은
c. 상기 단계 b로부터 얻은 단편의 질량을 측정하는 단계;
d. 매회 상기 폴리뉴클레오티드중의 상이한 천연 뉴클레오티드를 변형된 뉴클레오티드로 치환하면서, 상기 폴리뉴클레오티드중 각각의 천연 뉴클레오티드가 변형된 뉴클레오티드로 치환되고, 각각의 변형 폴리뉴클레오티드가 절단되고, 절단 된 단편의 질량이 측정될 때까지 단계 1a, 1b 및 1c를 반복하는 단계; 및
e. 상기 제1 단편의 질량으로부터 상기 폴리뉴클레오티드의 상기 뉴클레오티드 서열을 결정하는 단계의 추가 단계에 의해 폴리뉴클레오티드의 뉴클레오티드 서열을 결정하는 상기 제1 방법의 용도이다.
본 발명의 다른 면은
치환될 상기 천연 뉴클레오티드로서 상기 다형성 또는 돌연변이에 관련된 것으로 공지된 뉴클레오티드를 사용하는 단계;
상기 천연 뉴클레오티드를 변형된 뉴클레오티드를 사용하여 상기 폴리뉴클레오티드를 증폭시킴으로써 치환하여 변형 폴리뉴클레오티드를 형성시키는 단계;
상기 변형된 뉴클레오티드를 상기 변형된 뉴클레오티드가 실질적으로 존재하는 각각의 위치에서 단편으로 절단시키는 단계; 및
상기 단편을 분석하여 유전자형을 결정하는 단계에 의해 다형성 또는 돌연변이를 갖는 것으로 공지된 뉴클레오티드의 유전자형을 결정하는 상기 제1 방법의 용도이다.
바로 앞의 방법에서, 전기영동, 질량 분석법 또는 FRET 검출법에 의한 상기 단편의 분석법은 본 발명의 한 면이다.
본 발명의 다른 면은
a. 폴리뉴클레오티드중의 제1 천연 뉴클레오티드를 실질적으로 존재하고 있는 각각의 위치에서 변형된 뉴클레오티드로 치환하여 1차 변형된 폴리뉴클레오티드를 형성하는 단계;
b. 상기 1차 변형된 뉴클레오티드중의 제2 천연 뉴클레오티드를 실질적으로 존재하고 있는 각각의 위치에서 제2 변형된 뉴클레오티드로 치환하여 2차 변형된 뉴클레오티드를 형성하는 단계;
c. 상기 2차 변형 폴리뉴클레오티드를, 상기 제2 변형된 뉴클레오티드가 상기 제1 변형된 뉴클레오티드에 서열상 바로 후속하는 및 포스포디에스테르 또는 변형된 포스포디에스테르 연결로 연결된 상기 2차 변형 폴리뉴클레오티드중의 각 위치에서 2차 변형 폴리뉴클레오티드를 절단하는 시약(들)과 접촉시키는 단계
를 포함하는, 폴리뉴클레오티드의 절단 방법이다.
본 발명의 다른 면은 바로 앞의 방법에서
d. 단계 c로부터 얻은 상기 단편의 질량을 측정하는 단계; 및
e. 상기 단편의 질량을 공지된 서열의 관련 폴리뉴클레오티드의 절단시에 예측되는 단편의 질량과 비교하는 단계; 또는
f. 공지되지 않은 서열의 하나 이상의 관련 폴리뉴클레오티드에 대하여 단계 a 내지 d를 반복하고, 상기 단편의 질량을 관련 폴리뉴클레오티드를 절단하여 얻은 단편의 질량과 비교하는 단계의 추가 단계에 의해 관련 폴리뉴클레오티드의 뉴클레오티드 서열 변화를 검출하는 것이다.
본 발명의 한 면은
a. 폴리뉴클레오티드중의 4 종의 천연 뉴클레오티드중 3종을 실질적으로 존재하는 각각의 위치에서 3종의 안정화 변형된 뉴클레오티드로 치환하여 하나의 천연 뉴클레오티드가 잔존하는 변형 폴리뉴클레오티드를 형성하는 단계;
b. 상기 변형 폴리뉴클레오티드를 실질적으로 상기 하나의 천연 뉴클레오티드가 존재하고 있는 각각의 위치에서 단편으로 절단하는 단계;
c. 상기 단편의 질량을 측정하는 단계; 및
d. 상기 단편의 질량을 공지된 서열의 관련 폴리뉴클레오티드의 절단시 예측되는 단편의 질량와 비교하는 단계; 또는
e. 공지되지 않은 서열의 하나 이상의 관련 폴리뉴클레오티드에 대하여 단계 a 내지 c를 반복하고, 상기 단편의 질량을 관련 폴리뉴클레오티드를 절단하여 얻은 질량과 비교하는 단계를 포함하는, 관련 폴리뉴클레오티드의 뉴클레오티드 서열 변화를 검출하는 방법이다.
본 발명의 다른 면은 바로 앞의 방법에서 상기 잔존하는 천연 뉴클레오티드를 탈안정화 변형된 뉴클레오티드로 치환시키는 것이다.
본 발명의 추가 면은
a. 폴리뉴클레오티드중 2종 이상의 천연 뉴클레오티드를 실질적으로 존재하는 각각의 위치에서 절단 특성이 서로 상이한 2종 이상의 변형된 뉴클레오티드로 치환하여 변형 폴리뉴클레오티드를 형성하는 단계;
b. 상기 변형 폴리뉴클레오티드를 실질적으로 상기 2종 이상의 변형된 뉴클레오티드의 첫번째 뉴클레오티드가 존재하는 각각의 위치에서 제1 단편으로 절단하는 단계;
c. 상기 제1 단편을 상기 제1 단편중 상기 둘 이상의 변형된 뉴클레오티드의 두번째 뉴클레오티드가 존재하는 각각의 위치에서 제2 단편으로 절단하는 단계;
d. 상기 제1 단편 및 제2 단편의 질량을 측정하는 단계; 및
e. 상기 제1 단편 및 제2 단편의 질량을 공지된 서열의 관련 폴리뉴클레오티드의 절단시 예측되는 제1 단편 및 제2 단편의 질량과 비교하는 단계, 또는
f. 비공지된 서열의 하나 이상의 관련 폴리뉴클레오티드에 대하여 단계 a 내지 d를 반복하고, 상기 제1 단편 및 제2 단편의 질량을 관련 폴리뉴클레오티드를 절단하여 얻은 질량과 비교하는 단계를 포함하는, 관련 폴리뉴클레오티드의 뉴클레오티드 서열 변화를 검출하는 방법이다.
본 발명의 한 면은 상기 방법에서 상기 단계들을 상이한 쌍의 천연 뉴클레오티드를 변형된 뉴클레오티드로 치환하여 얻은 변형된 뉴클레오티드를 사용하여 반복하는, 즉 주어진 4개의 천연 뉴클레오티드 1, 2, 3, 4에서 상기 제1과 제3의 천연 뉴클레오티드를 한 실험에서, 상기 제2와 제4의 천연 뉴클레오티드를 다른 실험에서, 상기 제1과 제4의 천연 뉴클레오티드를 또다른 실험에서, 상기 제2와 제3의 천연 뉴클레오티드를 다른 실험에서 또는 상기 제3와 제4의 천연 뉴클레오티드를 최종 실험에서 변형된 뉴클레오티드로 치환하여 수행하는 방법이다.
본 발명의 한 면은 바로 앞의 방법에 의해 얻은 변형 폴리뉴클레오티드가 질량 분석계, 특히 탠덤(tandem) 질량 분석계에서 절단될 수 있다는 것이다.
본 발명의 또다른 양태는
a. 폴리뉴클레오티드중의 천연 뉴클레오티드를 소정 백분율로 존재 위치에서 변형된 뉴클레오티드(리보뉴클레오티가 아님)로 치환하여 변형된 뉴클레오티드를 형성시키는 단계;
b. 상기 변형 폴리뉴클레오티드를 실질적으로 상기 변형된 뉴클레오티드 가 존재하는 각각의 위치에서 단편으로 절단하는 단계;
c. 매회 상기 폴리뉴클레오티드중의 상이한 천연 뉴클레오티드를 변형된 뉴클레오티드로 치환하면서 단계 a 및 b를 반복하는 단계; 및
d. 각 절단 반응으로부터 얻은 상기 단편의 질량을 측정하는 단계; 및
e. 상기 질량으로 부터 상기 폴리뉴클레오티드의 서열을 결정하는 단계; 또는
f. 단계 c에서의 단편으로부터 얻은 서열 래더(ladder)를 분석하는 단계를 포함하는, 폴리뉴클레오티드의 뉴클레오티드 서열의 결정 방법에 관한 것이다.
본 발명의 하나의 양태는
a. 폴리뉴클레오티드중의 천연 뉴클레오티드를 소정의 제1 백분율로 존재 위치에서 변형된 뉴클레오티드(리보뉴클레오티드가 아님)로 치환하여 변형 폴리뉴클레오티드를 형성하는 단계;
b. 상기 변형 폴리뉴클레오티드를, 상기 변형된 뉴클레오티드가 존재하는 위치에서 소정의 제2 백분율(제1 백분율 및 제2 백분율의 조합이 상기 변형된 폴리뉴클레오티드의 부분 절단을 일으킴)로 단편으로 절단하는 단계;
c. 매회 상기 폴리뉴클레오티드중 상이한 천연 뉴클레오티드를 변형된 뉴클레오티드로 치환하면서 단계 a 및 b를 반복하는 단계;
d. 각 절단 반응으로부터 얻은 상기 단편의 질량을 측정하는 단계; 및
e. 상기 질량으로부터 폴리뉴클레오티드의 서열을 결정하는 단계; 또는
f. 단계 a 및 b에서 상기 단편으로부터 얻은 서열 래더를 분석하는 단계
를 포함하는, 폴리뉴클레오티드의 뉴클레오티드 서열 결정 방법에 관한 것이다.
본 발명의 하나의 양태는
a. 폴리뉴클레오티드중의 2종 이상의 천연 뉴클레오티드를 실질적으로 존재하는 각각의 위치에서 둘 이상의 변형 뉴클레오티드로 치환하여 변형된 폴리뉴클레오티드를 형성하는 단계;
b. 상기 변형된 폴리뉴클레오티드를 2 개 이상의 분취물로 분리하는 단계(이때, 상기 분취물의 수는 단계 a에서 치환된 천연 뉴클레오티드의 수와 동일함); 및
c. 상기 각각의 분취물중의 변형된 폴리뉴클레오티드를, 실질적으로 상기 변형된 뉴클레오티드중의 상이한 어느 하나 각각이 존재하는 위치에서 단편으로 절단하는 단계(상기 분취물 각각은 그들 각각과는 다른 변형된 뉴클레오티드에서 절단된 단편을 함유함);
d. 상기 단편의 질량을 측정하는 단계; 및
e. 상기 질량으로부터 상기 뉴클레오티드 서열을 결정하는 단계; 또는
f. 상기 각각의 분취물중의 변형된 폴리뉴클레오티드를, 소정의 백분율로 상이한 변형 뉴클레오티드가 존재하는 위치에서 단편으로 절단하는 단계(상기 분취물 각각은 그들 각각과는 다른 변형된 뉴클레오티드에서 절단된 단편을 함유함); 및
g. 상기 단계 f에서의 단편으로부터 얻은 서열 래더를 분석하는 단계를 포함하는, 폴리뉴클레오티드의 뉴클레오티드 서열 결정 방법에 관한 것이다.
또한, 본 발명은
a. 폴리뉴클레오티드중의 제1 천연 서열을 소정의 백분율로 존재 위치에서 제1 변형된 뉴클레오티드(리보뉴클레오티드가 아님)로 치환하여 제1의 부분적으로 변형 폴리뉴클레오티드를 형성하는 단계;
b. 상기 제1 부분적으로 변형 뉴클레오티드를 공지된 절단 효율의 상기 절단 방법을 이용하여 단편으로 절단하여 제1 뉴클레오티드 특이적 절단 생성물 세트를 형성하는 단계;
c. 단계 a 및 b를 반복하여, 제2, 제3 및 제4 천연 뉴클레오티드를 제2, 제3 및 제4 변형된 뉴클레오티드로 치환하여 절단시 제2, 제3 및 제4 뉴클레오티드 특이적 절단 생성물 세트를 생성하는 제2, 제3 및 제4의 부분적으로 변형 폴리뉴클레오티드를 생성시키는 단계;
d. 상기 제1, 제2, 제3 및 제4의 뉴클레오티드 특이적 절단 생성물 세트에 겔 전기영동을 수행하여 서열 래더를 형성시키는 단계; 및
e. 상기 서열 래더로부터 상기 폴리뉴클레오티드의 서열을 판독하는 단계
를 포함하는, 폴리뉴클레오티드의 뉴클레오티드 서열 결정 방법에 관한 것이다.
본 발명의 하나의 양태는
그 중 1개 또는 2개가 변형된 뉴클레오티드인 4개의 상이한 뉴클레오티드와,
그 중 1종 이상의 폴리머라제가 상기 변형된 뉴클레오티드가 삽입되는 점, 또는 2개의 변형된 뉴클레오티드가 사용되는 경우, 변형된 뉴클레오티드의 상기 인접 쌍이 삽입되고 적절한 공간 관계를 갖는 점에서 절단을 생성하거나 강화하는, 2종 이상의 폴리머라제를 함께 혼합하는 것을 포함하는(단, 하나의 변형된 뉴클레오티드만이 사용되는 경우, 그 유일한 변형 특성으로서 리보스를 함유하지 않음), 중합하는 동안 폴리뉴클레오티드를 절단하는 방법이다.
상기 방법에서, 2개의 변형된 뉴클레오티드가 사용되는 경우, 그 중 하나가 리보뉴클레오티드이며, 그 중 하나가 5'-아미노-2',5'-디데옥시뉴클레오티드인 것이 본 발명의 하나의 양태이다.
또한, 상기 특이 변형된 뉴클레오티드를 사용하는 방법에서, 본 발명의 하나의 양태는, 하나는 클레나우(Klenow)(엑소-)폴리머라제이며, 하나는 돌연변이 E710A 클레나우(엑소-) 폴리머라제인 2종의 폴리머라제를 사용하는 것이다.
상기 방법들 중 임의의 하나에서, 변형된 뉴클레오티드로 치환되지 않는 모든 천연 뉴클레오티드가 질량-변형된 뉴클레오티드로 치환될 수 있는 것이 본 발명의 하나의양태이다.
변형 폴리뉴클레오티드가 DNA 및 RNA로 이루어진 군으로부터 선택되는 것 또한 본 발명의 모든 방법의 하나의 양태이다.
상기 모든 방법의 또다른 양태는 질량 분광법에 의한 상기 단편들의 질량의 검출이다. 현재 질량 분광법의 바람직한 유형은 전자분무 이온화 질량 분광법 및 매트릭스 보조 탈착/이온화 질량 분광법 (MALDI)이다.
서열 래더의 생성을 요구하는 상기 방법들에서, 상기 생성은 겔 전기영동을 사용하여 수행될 수 있다.
또한, 변형된 뉴클레오티드로 천연 뉴클레오티드를 부분 치환함으로써 폴리뉴클레오티드 서열을 결정하는 것에 관련된 상기 방법에서, 단계 "a"에서 수득된 상기 제1, 제2, 제3 및 제4의 부분적으로 변형 폴리뉴클레오티드를 1종 이상의 제한 효소로 절단하고, 수득된 제한 단편의 말단을 표지하고, 제한 단편을 정제하고, 단계 "b"를 수행하는 것이 본 발명의 또다른 양태이다.
본 발명의 하나의 양태는
a. 폴리뉴클레오티드중의 부분적으로 또는 실질적으로 존재하고 있는 각각의 위치에서 천연 뉴클레오티드를 변형 뉴클레오티드로 치환하여 변형 폴리뉴클레오티드를 형성하고;
b. 표지에 공유적으로 결합된 포스핀의 존재 하에, 상기 변형 폴리뉴클레오티드와, 변형 폴리뉴클레오티드를 부분적으로 또는 실질적으로 각각의 발생점에서 절단하는 시약(들)과 접촉시키는 것을 포함하는,
절단으로부터 수득된 실질적으로 모든 단편들이 표지를 수행하도록 폴리뉴클레오티드를 절단하는 방법이다.
본 발명의 바람직한 실시양태에서, 상기 방법 중의 포스핀은 트리스(카르복시에틸)포스핀(TCEP)이다.
또한, 상기 방법 중에서, 표지는 본 발명의 또다른 양태의 형광발광 태그 또는 방사성 태그이다.
상기 방법들이 유전학적으로 관련된 질병을 진단하는데에 사용될 수 있는 것 또한 본 발명의 하나의 양태이다. 상기 방법들은 유전학적으로 관련된 질병 또는 장애의 예후를 수득하기 위한 수단으로서 사용될 수 있다. 이들은 또한, 특정 환자가 유전학적으로 관련된 질병 또는 장애에 적용가능한 절차에 의한 의약적 치료를 받을만한지 여부를 결정하는데에 사용될 수 있다.
본 발명의 하나의 양태는
a. 폴리뉴클레오티드 내의 하나 이상의 천연 뉴클레오티드를, 그 중 하나 이상이 변형 염기를 포함하는 하나 이상의 변형 뉴클레오티드로 치환하고;
b. 상기 변형 폴리뉴클레오티드를, 상기 변형 뉴클레오티드의 삽입 부위(들)에서 변형 폴리뉴클레오티드를 단편으로 절단하는 시약(들)과 접촉시키고;
c. 상기 폴리뉴클레오티드의 변이를 검출하거나, 서열을 제작하거나, 또는 유전자형을 결정하기 위해 상기 단편들을 분석하는,
다형성 또는 돌연변이를 포함하는 것으로 공지된 폴리뉴클레오티드의 뉴클레오티드 서열의 변이를 검출하거나, 폴리뉴클레오티드를 서열화하거나, 또는 폴리뉴클레오티드의 유전자형을 결정하는 방법이다.
본 발명의 또다른 양태에서, 상기 방법의 변형 염기는 아데닌일 수 있다. 또한 7-데아자-7-니트로아데닌일 수 있다.
본 발명의 또다른 양태에서, 상기와 같이 변형된 폴리뉴클레오티드는 화학 염기와 접촉함으로써 단편으로 절단될 수 있다.
상기 방법에서, 상기 변형 폴리뉴클레오티드를 단편으로 절단하는 것이 상기 변형 폴리뉴클레오티드와 포스핀을 접촉시키는 것을 포함하는 것도 본 발명의 또다른 양태이다.
상기 방법에서 포스핀으로서 TCEP를 사용하는 것이 본 발명의 또다른 양태이다.
상기 방법에서 변형 염기는 또한, 5-위치에서, 예컨대 제한없이 니트로 또는 할로인 전자 끄는기로 치환된 시토신 또는 아자시토신과 같은 변형 시토신일 수 있다.
다시, 상기 주지된 바와 같이 변형된 폴리뉴클레오티드는 화학 염기로 절단될 수 있다.
상기 절단 반응에서 TCEP의 봉입물이 본 발명의 또다른 양태이다.
상기 방법에서 변형 염기는 또한, 예컨대 제한없이 7-메틸-구아닌과 같은 변형된 구아닌일 수 있으며, 절단은 화학 염기로 수행될 수 있다.
본 발명의 추가 양태에서, 변형 구아닌은 N2-알릴구아닌이다. 예컨대 제한없이 요오드와 같은 친전자핵과 변형 폴리뉴클레오티드를 접촉시킴으로써 변형 구아닌을 절단하는 것이 본 발명의 또다른 양태이다.
본 발명의 또다른 양태에서, 상기 방법의 변형 염기는 또한 변형 티민 및 변형 우라실일 수 있다. 본 발명의 바람직한 실시양태는 티민 또는 우라실 대신에 5-히드록시우라실을 사용하는 것이다. 5-히드록시우라실이 사용되면, 절단은
a. 폴리뉴클레오티드와 화학 산화제를 접촉시키고; 이어서
b. 상기 폴리뉴클레오티드와 화학 염기를 접촉시킴으로써 수행된다.
본 발명의 또다른 양태는, 폴리뉴클레오티드 내의 하나 이상의 천연 뉴클레오티드를, 그 중 하나 이상이 변형 당을 포함하는 하나 이상의 변형 뉴클레오티드로 치환 (단, 단지 하나의 뉴클레오티드가 치환되는 경우, 상기 변형 당은 리보스가 아님)하는 것을 포함하는, 폴리뉴클레오티드 내의 뉴클레오티드 서열의 변이를 검출하거나, 폴리뉴클레오티드를 서열화하거나, 또는 폴리뉴클레오티드의 유전자형을 결정하기 위한 방법이다.
본 발명의 추가적 양태에서, 변형 당은 2-케토당이다. 케토 당은 화학 염기로 절단될 수 있다.
변형 당은 또한 화학 염기에 대해 감수성인 아라비노스일 수 있다.
변형 당은 또한 폴리뉴클레오티드를 화학 염기에 의해 절단하기 쉽게 하는 4-히드록시메틸기로 치환된 당일 수 있다.
한편, 변형 당은 히드록시시클로펜탄, 특히 1-히드록시- 또는 2-히드록시시클로펜탄일 수 있다. 히드록시시클로펜탄은 또한 화학 염기에 의해 절단될 수 있다.
변형 당은 아지도당, 예를 들면, 제한없이, 2'-아지도, 4'-아지도 또는 4'-아지도메틸 당일 수 있다. 아지도 당의 절단은 TCEP의 존재 하에 수행될 수 있다.
당은 또한 광분해할 수 있는 기로 치환되어 유리 라디칼, 예컨대 제한없이, 페닐셀레닐 또는 t-부틸카르복시기를 형성할 수 있다. 상기 기는 폴리뉴클레오티드를 자외광에 의해 절단되기 쉽게 한다.
당은 또한 시아노당일 수 있다. 바람직한 실시양태에서, 시아노당은 2'-시아노당 또는 2"-시아노당이다. 시아노당 변형된 폴리뉴클레오티드는 화학 염기로 절단될 수 있다.
변형 당의 2', 2" 또는 4' 위치에서 전자 끄는기, 예컨대 제한없이, 불소, 아지도, 메톡시 또는 니트로로 치환된 당이 본 발명의 또다른 양태이다. 이들 변형 당은 변형 폴리뉴클레오티드를 화학 염기에 의해 절단되기 쉽게 한다.
한편, 당은 당 고리 내에 전자 끄는 원소의 봉입에 의해 변형될 수 있다. 질소가 그러한 기의 예이다. 질소는 당의 고리 산소 또는 고리 탄소를 치환할 수 있으며, 생성된 변형 당은 화학 염기에 의해 절단가능하다.
본 발명의 또다른 양태에서, 변형 당은 머캅토기 함유 당일 수 있다. 화학 염기에 의해 절단 가능한 당의 2' 위치가 일반적으로 바람직한 실시양태이다.
특히, 변형 당은 5'-메틸레닐 당, 5'-케토 당 또는 5',5'-디플루오로 당일 수 있으며, 이들 모두 화학 염기에 의해 절단가능하다.
본 발명의 또다른 양태는, 폴리뉴클레오티드 중의 하나 이상의 천연 뉴클레오티드를, 그 중 하나 이상이 변형 포스페이트 에스테르를 포함하는 하나 이상의 변형 뉴클레오티드로 치환하는 것을 포함하는, 다형성 또는 돌연변이를 함유하는 것으로 공지된 폴리뉴클레오티드의 뉴클레오티드 서열의 변이를 검출하거나, 폴리뉴클레오티드를 서열화하거나, 또는 폴리뉴클레오티드의 유전자형을 결정하는 방법이다.
변형 포스페이트 에스테르는 포스포로티오에이트일 수 있다.
하나의 실시양태에서, 포스포로티오에이트의 황은 당 고리에 공유적으로 결합되어 있지 않다. 이 경우, 상기 변형 폴리뉴클레오티드를 단편으로 절단하는 것은
a. 상기 포스포로티올레이트의 황을 알킬화제와 접촉시키고;
b. 상기 변형 폴리뉴클레오티드와 화학 염기를 접촉시키는 것을 포함한다.
본 발명의 특히 바람직한 실시양태에서, 알킬화제는 요오드화 메틸이다.
본 발명의 또다른 양태에서, 변형 폴리뉴클레오티드 함유 포스포로티오에이트는, 상기 포스포로티오에이트의 황과, 화학 염기 중의 β-머캅토에탄올, 예컨대 비제한적으로 메탄올 중의 소듐 메톡시드를 접촉시킴으로써, 단편으로 절단될 수 있다.
한편, 상기 포스포로티올레이트의 황 원자는 본 발명의 또다른 실시양태에서, 당 고리에 공유적으로 결합될 수 있다. 이와 같이 변형된 폴리뉴클레오티드의 절단은 화학 염기에 의해 수행될 수 있다.
변형 포스페이트 에스테르는 또한 포스포르아미데이트일 수 있다. 포스포르아미데이트 함유 폴리뉴클레오티드의 절단은 산을 사용하여 수행될 수 있다.
본 발명의 하나의 양태에서, 변형 포스페이트 에스테르는 알킬 포스포네이트 및 알킬 포스포로트리에스테르로 이루어진 군으로부터 선택된 기를 포함하며, 여기서 알킬기는 메틸이 바람직하다. 상기 변형 폴리뉴클레오티드는 또한 산으로 절단될 수 있다.
본 발명의 또다른 양태는, 폴리뉴클레오티드의 제1 및 제2 천연 뉴클레오티 드를 제1 및 제2 변형 뉴클레오티드로 치환하여, 상기 폴리뉴클레오티드 서열에서 제1 변형 뉴클레오티드의 바로 다음에 상기 제2 변형 뉴클레오티드가 있도록 하는 부위에서, 상기 폴리뉴클레오티드를 특이적으로 절단하는 것을 포함하는, 다형성 또는 돌연변이를 포함하는 것으로 공지된 폴리뉴클레오티드의 뉴클레오티드 서열 내의 변이를 검출하거나, 폴리뉴클레오티드를 서열화하거나, 또는 폴리뉴클레오티드를 유전자형 분석하는 방법이다.
상기 방법에서, 제1 변형 뉴클레오티드는 그 5' 위치에서 포스포로티오에이트기의 황 원자에 공유적으로 결합되며, 2'-히드록시기로 변형된 상기 제2 변형 뉴클레오티드는 상기 제1 변형 뉴클레오티드의 5'에 인접한다. 이 디뉴클레오티드 쌍은 화학 염기로 절단가능하다.
또한, 상기 방법에서, 제1 변형 뉴클레오티드는 2'-히드록시기로 변형된 상기 제2 변형 뉴클레오티드가 제1 변형 뉴클레오티드의 3'에 인접하는 것인 포스포로티오에이트기의 황 원자에 그 3' 위치에서 공유적으로 결합될 수 있다. 상기 변형 뉴클레오티드 쌍은 또한 화학 염기로 절단될 수 있다.
상기 방법에서, 상기 제1 변형 뉴클레오티드가 포스포로티오에이트기의 제1 산소 원자에 그 5' 위치에서 공유적으로 결합되며, 상기 제2 변형 뉴클레오티드가 그 2' 위치에서 이탈기로 치환되며, 상기 제2 변형 뉴클레오티드가 상기 포스포로티오에이트기의 제2 산소에 그 3' 위치에서 공유적으로 결합된 것 또한 본 발명의 하나의 양태이다. 임의의 이탈기가 사용될 수 있으며, 불소, 염소, 브롬 및 요오드가 그 예이다. 이렇게 변형된 폴리뉴클레오티드는 화학 염기로 절단될 수 있다. 소듐 메톡시드가 유용한 화학 염기의 비제한적인 예이다.
본 발명의 다른 실시양태에서, 상기 제1 변형 뉴클레오티드는 포스포로티오에이트기의 제1 산소 원자에 그 5' 위치에서 공유적으로 결합하며, 상기 제2 변형 뉴클레오티드는 그 4' 위치에서 이탈기로 치환되며, 상기 포스포로티오에이트기의 제2 산소 원자에 그 3' 위치에서 공유적으로 결합된다. 여기서, 다시, 임의의 우수한 이탈기로서 불소, 염소, 브롬 및 요오드가 사용될 수 있으며, 이는 비제한적인 예이다. 마찬가지로, 이들 기는 변형 폴리뉴클레오티드를 비제한적인 예로서 소듐 메톡시드와 같은 화학 염기에 의해 절단되기 쉽게 한다.
본 발명의 또다른 실시양태에서, 상기 제1 변형 뉴클레오티드는 포스포로티오에이트기의 제1 산소 원자에 그 5' 위치에 공유적으로 결합하며, 상기 제2 변형 뉴클레오티드는 그 2' 위치에서 1개 또는 2개의 불소 원자로 치환되며, 상기 포스포로티오에이트기의 제2 산소원 자에 그 3' 위치에서 공유적으로 결합된다. 이러한 변형 폴리뉴클레오티드는
a. 상기 변형 폴리뉴클레오티드와 에틸렌 술피드 또는 β-머캅토에탄올을 접촉시키고; 이어서,
b. 상기 변형 폴리뉴클레오티드와 비제한적인 예로서 소듐 메톡시드와 같은 화학 염기를 접촉시킴으로써 절단될 수 있다.
본 발명의 또다른 실시양태는 포스포로티오에이트기의 제1 산소 원자에 그 5' 위치에서 공유적으로 결합된 상기 제1 변형 뉴클레오티드, 그 2' 위치에서 히드록시기로 치환되고 상기 제2 변형 뉴클레오티드, 및 상기 포스포로티오에이트기의 제2 산소에 그 3' 위치에서 공유적으로 결합된 상기 제2 변형 뉴클레오티드를 갖는다. 여기서, 절단은
a. 상기 변형 폴리뉴클레오티드와 금속 산화제를 접촉시키고; 이어서,
b. 상기 변형 폴리뉴클레오티드와 화학 염기를 접촉시킴으로써 수행될 수 있다.
금속 산화제의 비제한적인 예는 Cu 및 Fe이며, 동일하게, 유용한 염기들의 비제한적인 예는 희석 수산화 피페리딘 및 희석 수산화암모늄이다.
본 발명의 또다른 실시양태에서, 상기 제1 변형 뉴클레오티드는 포스포르아미데이트기의 질소 원자에 그 5' 위치에서 공유적으로 결합되며, 2'-히드록시기로 변형된 상기 제2 변형 뉴클레오티드는 상기 제1 변형 뉴클레오티드의 5'에 인접한다. 이러한 형태의 변형은 변형 폴리뉴클레오티드를 산 절단되기 쉽게 한다.
본 발명의 또다른 실시양태는, 상기 제1 변형 뉴클레오티드가 포스포르아미데이트기의 질소 원자에 그 3' 위치에서 공유적으로 결합되며, 2'-히드록시기로 변형된 상기 제2 변형 뉴클레오티드는 상기 제1 변형 뉴클레오티드의 3'에 인접하는 것이다. 다시, 이러한 치환 패턴이 산으로 절단가능하다.
상기 제1 변형 뉴클레오티드가 또한, 그 5' 위치에서 알킬포스포네이트 또는 알킬포스포로트리에스테르기의 산소원자에 공유적으로 결합되며, 2'-히드록시기로 변형된 상기 제2 변형 뉴클레오티드가 상기 제1 변형 뉴클레오티드에 인접한다. 이러한 또다른 디뉴클레오티드기 또한 산으로 절단가능하다.
또다른 절단 가능한 디뉴클레오티드기는 상기 제1 변형 뉴클레오티드가 그 4' 위치에서 전자 끄는기를 가지며, 2'-히드록시기로 변형된 상기 제2 변형 뉴클레오티드가 상기 제1 변형 뉴클레오티드의 5'에 인접하는 것이다. 다시, 산과의 접촉에 의해 절단이 수행될 수 있다.
본 발명의 또다른 양태는
a. 각각 변형 염기, 변형 당 및 변형 포스페이트 에스테르로 이루어진 군으로부터 선택된 하나 이상의 변형물로 변형된 하나 이상의 변형 뉴클레오티드로 상기 폴리뉴클레오티드 내의 하나 이상의 천연 뉴클레오티드를 치환하고 (단, 단지 하나의 변형 뉴클레오티드만이 사용된 경우, 상기 변형 뉴클레오티드는 리보뉴클레오티드가 아님);
b. 상기 변형 폴리뉴클레오티드와, 상기 변형 폴리뉴클레오티드를 상기 변형 뉴클레오티드의 삽입 부위(들)에서 단편으로 절단하는 시약(들)을 접촉시키고;
c. 상기 폴리뉴클레오티드의 상기 변이를 검출하거나, 상기 서열을 제작하거나, 또는 유전자형을 결정하기 위해 상기 단편을 분석하는 것을 포함하는,
다형성 또는 돌연변이를 포함하는 것으로 알려진 폴리뉴클레오티드의 뉴클레오티드 서열 내의 변이를 검출하거나, 폴리뉴클레오티드를 서열화하거나, 또는 폴리뉴클레오티드를 유전자형을 분석하는 방법이다.
본 발명의 하나의 양태는 하기 화학식을 갖는 화합물이다.
Figure 112001007374848-pct00002
식 중, R1은 하기로 이루어진 군으로부터 선택된다.
Figure 112001007374848-pct00003
Figure 112001007374848-pct00004
하기 화학식을 갖는 화합물이 본 발명의 또다른 양태이다.
Figure 112001007374848-pct00005
식 중, "염기"는 시토신, 구아닌, 이노신 및 우라실로 이루어진 군으로부터 선택된다.
본 발명의 또다른 양태는 하기 화학식을 갖는 화합물이다.
Figure 112001007374848-pct00006
식 중, "염기"는 아데닌, 시토신, 구아닌, 이노신 및 우라실로 이루어진 군으로부터 선택된다.
본 발명의 또다른 양태는 하기 화학식을 갖는 화합물이다.
Figure 112001007374848-pct00007
Figure 112001007374848-pct00008
식 중, "염기"는 아데닌, 시토신, 구아닌, 이노신, 티민 및 우라실로 이루어진 군으로부터 선택된다.
하기로 이루어진 군으로부터 선택된 디뉴클레오티드 서열을 갖는 폴리뉴클레 오티드가 본 발명의 또다른 양태이다.
Figure 112001007374848-pct00009
Figure 112001007374848-pct00010
Figure 112001007374848-pct00011
Figure 112001007374848-pct00012
Figure 112001007374848-pct00013
Figure 112001007374848-pct00014
식 중, "염기"는 아데닌, 시토신, 구아닌 및 티민으로 이루어진 군으로부터 독립적으로 선택되며; W는 전자 끄는기이고; X는 이탈기이며, R은 알킬, 바람직하게는 저급 알킬기이다. 본 발명의 또다른 양태에서, 전자 끄는기는 F, Cl, Br, I, NO2, C≡N, -C(O)OH 및 OH로부터 선택되며, 또다른 양태에서, 이탈기는 Cl, Br, I 및 OTs로 이루어진 군으로부터 선택된다.
본 발명의 하나의 양태는 1종 이상의 폴리머라제의 존재 하에, 하기 화학식을 갖는 화합물을 아데노신 트리포스페이트, 구아노신 트리포스페이트, 및 티미딘 또는 우리딘 트리포스페이트와 혼합하는 것을 포함하는 폴리뉴클레오티드의 합성 방법이다.
Figure 112001007374848-pct00015
식 중, R1은 하기로 이루어진 군으로부터 선택된다.
Figure 112001007374848-pct00016
1종 이상의 폴리머라제의 존재 하에, 하기 화학식을 갖는 화합물을 아데노신 트리포스페이트, 시티딘 트리포스페이트 및 구아노신 트리포스페이트와 혼합하는 것을 포함하는 폴리뉴클레오티드의 합성 방법 또한 본 발명의 하나의 양태이다.
Figure 112001007374848-pct00017
식 중, R1은 하기로 이루어진 군으로부터 선택된다.
Figure 112001007374848-pct00018
1종 이상의 폴리머라제의 존재 하에, 하기 화학식을 갖는 화합물을 시티딘 트리포스페이트, 구아노신 트리포스페이트 및 티미딘 트리포스페이트와 혼합하는 것을 포함하는 폴리뉴클레오티드의 합성 방법 또한 본 발명의 또다른 하나의 양태이다.
Figure 112001007374848-pct00019
식 중, R1은 하기로 이루어진 군으로부터 선택된다.
Figure 112001007374848-pct00020
본 발명의 하나의 양태는, 1종 이상의 폴리머라제의 존재 하에, 하기 화학식을 갖는 화합물을 아데노신 트리포스페이트, 시티딘 트리포스페이트 및 티미딘 트리포스페이트와 혼합하는 것을 포함하는 폴리뉴클레오티드의 합성 방법이다.
Figure 112001007374848-pct00021
식 중, R1은 하기로 이루어진 군으로부터 선택된다.
Figure 112001007374848-pct00022
본 발명의 또다른 양태는 1종 이상의 폴리머라제의 존재 하에,
하기 화학식을 갖는 화합물
Figure 112001007374848-pct00023
(식 중, "염기"는 시토신, 구아닌, 이노신 및 우라실로 이루어진 군으로부터 선택됨);
하기 화학식을 갖는 화합물
Figure 112001007374848-pct00024
(식 중, "염기"는 아데닌, 시토신, 구아닌, 이노신 및 우라실로 이루어진 군으로부터 선택됨); 및
하기 화학식을 갖는 화합물
Figure 112001007374848-pct00025
Figure 112001007374848-pct00026
(식 중, "염기"는 아데닌, 시토신, 구아닌 또는 이노신, 및 티민 또는 우라실로 이루어진 군으로부터 선택됨)으로 이루어진 군으로부터 선택된 화합물을,
아데노신 트리포스페이트, 시티딘 트리포스페이트, 구아노신 트리포스페이트 및 티미딘 트리포스페이트의 4개의 뉴클레오시드 트리포스페이트 중, 상기 염기 (또는 그의 치환체)를 포함하지 않는 어느 3개와 혼합시키는 것을 포함하는, 폴리뉴클레오티드의 합성 방법이다.
본 발명의 또다른 양태는 1종 이상의 폴리머라제의 존재 하에, 하기 화합물 쌍들 중 한 쌍을 아데노신 트리포스페이트, 시티딘 트리포스페이트, 구아노신 트리포스페이트 및 티미딘 트리포스페이트의 4개의 뉴클레오시드 트리포스페이트 중, 염기-1 또는 염기-2 (또는 이들의 치환체)를 포함하지 않는 어느 2개와 혼합하는 것을 포함하는 폴리뉴클레오티드의 합성 방법이다.
Figure 112001007374848-pct00027
Figure 112001007374848-pct00028
Figure 112001007374848-pct00029
Figure 112001007374848-pct00030
Figure 112001007374848-pct00031
Figure 112001007374848-pct00032
Figure 112001007374848-pct00033
Figure 112001007374848-pct00034
Figure 112001007374848-pct00035
Figure 112001007374848-pct00036
Figure 112001007374848-pct00037
식 중, 염기1은 아데닌, 시토신, 구아닌 또는 이노신, 및 티민 또는 우라실로 이루어진 군으로부터 선택되며;
염기2는 염기1이 아닌 나머지 3개의 염기로 이루어진 군으로부터 선택되며;
R3은 O--P(=O)(O-)-O-P(=O)(O-)-O-P(=O)(O-)-O-이며;
W는 전자 끄는기이며;
X는 이탈기이며;
동일한 탄소 원자의 괄호 안에 나타낸 또다른 W 또는 X는 단일 W 또는 X기가 당의 임의의 위치에서 존재할 수 있거나, 또는 2개의 W 또는 2개의 X기가 동시에 존재할 수 있음을 의미하며;
R은 저급 알킬기를 나타낸다.
본 발명의 하나의 양태는 리보뉴클레오티드가 아닌 변형 뉴클레오티드의 폴리뉴클레오티드로의 삽입을 촉매할 수 있는, 본 발명의 또다른 양태의 DNA 셔플링(shuffling)을 포함하는 공정에 의해 수득된 돌연변이 폴리머라제이다.
공정을 포함하는 DNA 셔플링은
a. 1종 이상의 공지된 폴리머라제(들)을 선택하고;
b. DNA 셔플링을 수행하고;
c. 셔플링된 DNA를 숙주세포에 형질전환시키고;
d. 숙주세포 콜로니를 증식시키고;
e. 상기 숙주세포 콜로니로부터 세포용해물을 형성하고;
f. 검출가능한 리포터 서열을 함유하는 DNA 주형, 폴리뉴클레오티드로의 삽입이 요망되는 변형 뉴클레오티드(들), 및 상기 변형 뉴클레오티드(들)에 의해 치환되지 않은 천연 뉴클레오티드를 첨가하고;
g. 검출가능한 리포터의 존재에 대해, 세포용해물을 검사하는 단계들을 포함할 수 있다.
공정을 포함하는 DNA-셔플링은 또한,
a. 1종의 공지된 폴리머라제, 또는 상이한 서열 또는 상이한 생화학적 성질 또는 이들 모두를 갖는 2종 이상의 공지된 폴리머라제를 선택하고,
b. DNA 셔플링을 수행하고;
c. 상기 셔플링된 DNA를 숙주로 형질전환시켜, 숙주세포 콜로니 내에서 형질 전환체의 라이브러리를 형성하고;
d. 상기 숙주세포 콜로니를 플레이팅(plating)하여 상기 형질전환체의 제1 분리 풀(pool)을 제조하고;
e. 상기 각각의 제1 분리 풀 숙주세포 콜로니로부터 세포용해물을 형성하고;
f. 상기 각 세포용해물로부터 모든 천연 뉴클레오티드를 제거하고;
g. 상기 각 세포용해물을 ⅰ. RNA 폴리머라제 프로머터에 상응하는 서열, 이어서 리포터 서열을 포함하는 단일 스트랜드 DNA 주형; ⅱ. 상기 주형의 한쪽 끝에 단일 스트랜드 DNA 프라이머 상보체; ⅲ. 상기 폴리뉴클레오티드로의 삽입이 요망되는 변형 뉴클레오티드(들); ⅳ. 상기 변형 뉴클레오티드(들)로 치환되지 않은 각각의 천연 뉴클레오티드와 혼합하고;
h. RNA 폴리머라제를 상기 각각의 합해진 세포용해물에 첨가하고;
i. 상기 리포터 서열의 존재에 대해, 각각의 합해진 세포용해물을 검사하고;
j. 상기 리포터의 존재가 검출되는 숙주세포 콜로니의 각각의 제1 분리 풀로부터 숙주세포 콜로니의 형질전환체의 제2 분리 풀을 생성하고;
k. 숙주세포 콜로니의 각각의 제2 분리 풀로부터 세포용해물을 형성하고;
l. 상기 폴리머라제를 함유하는 단 하나의 숙주세포 콜로니가 잔류할 때까지, 단계 g, h, i, j, k 및 l을 반복하여, 숙주세포 콜로니의 형질전환체의 분리 풀을 형성하고;
m. 상기 하나의 숙주세포 콜로니로부터 상기 폴리머라제를 단백질 발현 벡터로 재클로닝하는 단계들을 포함할 수 있다.
세포 노화 선택을 포함하는 공정에 의해 수득된 리보뉴클레오티드가 아닌 변형 뉴클레오티드의 폴리뉴클레오티드로의 삽입을 촉매시킬 수 있는 폴리머라제가 본 발명의 또다른 양태이다.
세포 노화 선택 공정은
a. 공지된 폴리머라제를 돌연변이시켜 돌연변이 폴리머라제의 라이브러리를 형성하고;
b. 상기 라이브러리를 벡터에 클로닝하고;
c. 세포가 활성적으로 증식하는 경우에만 선택된 화학제에 의해 사멸하기 쉽도록 선택된 숙주세포로 상기 벡터를 형질전환시키고;
d. 변형 뉴클레오티드를 첨가하고;
e. 상기 숙주세포를 증식시키고;
f. 상기 숙주세포를 상기 선택된 화학제로 처리하고;
g. 사멸한 세포들로부터 생(生)세포를 분리하고;
h. 상기 폴리머라제(들)을 상기 생세포들로부터 단리하는 단계들을 포함할 수 있다.
본 발명의 또다른 양태에서, 상기 언급된 단계 d 내지 h는 1회 이상 반복하여, 폴리머라제의 선택을 세밀하게 구별할 수 있다.
폴리머라제를 수득하기 위한 세포 노화 과정은 또한
a. 공지된 폴리머라제를 돌연변이시켜 돌연변이 폴리머라제의 라이브러리를 형성하고;
b. 돌연변이 폴리머라제의 라이브러리를 플라스미드 벡터에 클로닝하고;
c. 증식시 항생물질에 감수성인 상기 플라스미드 벡터 세균성 세포로 형질전환시키고;
d. 상기 항생물질을 사용하여 형질감염체를 선택하고;
e. 상응하는 뉴클레오시드 트리포스페이트로서 변형 뉴클레오티드를 세균성 세포에 도입하고;
f. 세포를 증식시키고;
g. 활성적으로 증식하는 세균성 세포를 사멸시킬 수 있는 항생물질을 첨가하고;
h. 상기 세균성 세포를 단리하고;
i. 어떠한 항생물질도 함유하지 않는 신선한 배지에서 상기 세균성 세포를 증식시키고;
j. 증식 콜로니로부터 생세포를 선택하고;
k. 상기 생세포로부터 플라스미드 벡터를 단리하고;
l. 상기 폴리머라제를 단리하고;
m. 상기 폴리머라제를 분석하는 단계들을 포함할 수 있다.
상기 단계 l을 수행하기 전에, 상기 단계 c 내지 k를 1 회 이상 추가로 반복하는 것이 본 발명의 또다른 양태이다.
폴리머라제는 또한 파지(phage) 표시 기법을 포함하는 공정에 의해 수득될 수 있다.
파지 표시 기법은 하기 단계를 포함할 수 있다.
a. DNA 폴리머라제를 선택하는 단계,
b. 상기 폴리머라제를 박테리오파지 벡터에서 박테리오파지 외피 단백질에 융합함으로써 발현시키는 단계,
c. 올리고뉴클레오티드를 파지의 표면에 결합시키는 단계,
d. c의 올리고뉴클레오티드에 상보적인 제2 올리고뉴클레오티드를 첨가하거나, c의 올리고뉴클레오티드의 분자내 상보성을 사용하여 자가 프라이밍 결합체를 형성함으로써 프라이머 주형 결합체를 형성하는 단계,
e. 변형 뉴클레오티드 또는 폴리뉴클레오티드로 혼입되는 것이 바람직한 뉴클레오티드, 및 상기 변형 뉴클레오티드(들)에 의해 치환되지 않은 천연 뉴클레오티드의 존재하에서 프라이머 신장을 수행하는 단계, 여기서 성공적인 프라이머 신장은 검출가능한 리포터 서열의 존재를 야기하고,
f. 파지를 검출가능한 리포터가 없은 것과 검출가능한 리포터가 있는 것으로 분류하는 단계.
본 발명의 또다른 면에서, 검출가능한 리포터 서열은 프라이머 신장 반응에서 1종 이상의 염료로 표지된 천연 또는 변형 뉴클레오티드의 혼입에 의해 형성된다.
본 발명의 역시 또다른 면에서, 표지된 분류 공정은 형광 활성화 세포 분류기를 사용하는 것을 포함한다.
본 발명의 한 면은 상기 방법에서 검출가능한 리포터가 제한 엔도뉴클리아제 소화 부위를 수반하고 분류과정은 제한 엔도뉴클레아제 소화를 한다는 것이다.
상기 방법에서 얻어진 폴리머라제가 열안정성인 것은 본 발명의 또다른 면이다.
변형 뉴클레오티드가 혼입되는 상기 임의의 방법에 의해 얻어진 폴리머라제는 화학 구조가
Figure 112001007374848-pct00038
(여기서, R1
Figure 112001007374848-pct00039
로 이루어진 군으로부터 선택됨);
Figure 112001007374848-pct00040
(여기서, "염기"는 시토신, 구아닌, 이노신 및 우라실로 이루어진 군으로부터 선택됨)인 화합물;
Figure 112001007374848-pct00041
(여기서, "염기"는 아데닌, 시토신, 구아닌, 이노신 및 우라실로 이루어진 군으로부터 선택됨),
Figure 112001007374848-pct00042
Figure 112001007374848-pct00043
(여기서, 염기"는 아데닌, 시토신, 구아닌, 이노신, 티민 및 우라실로 이루어진 군 으로부터 선택됨)인 화합물; 또는
Figure 112001007374848-pct00044
Figure 112001007374848-pct00045
Figure 112001007374848-pct00046
Figure 112001007374848-pct00047
Figure 112001007374848-pct00048
Figure 112001007374848-pct00049
Figure 112001007374848-pct00050
Figure 112001007374848-pct00051
Figure 112001007374848-pct00052
Figure 112001007374848-pct00053
(여기서, 염기1은 아데닌, 시토신, 구아닌 또는 이노신 및 티민 또는 우라실로부터 이루어진 군으로부터 선택되고,
염기2는 염기1이 아닌 나머지 3 가지 염기로 이루어진 군으로부터 선택되고,
R3은 O--P(=O)(O-)-O-P(=O)(O-)-O-P(=O)(O-)-O-이고,
W는 전자끄는 기이고,
X는 이탈기이고,
동일한탄소 원자상 괄호내에 도시된 두번째 W 또는 X는 단일 W 또는 X기는 당 내의 각 위치에 있을 수 있거나, 두개의 W기 모두 또는 두개의 X기 모두는 동시에 존재할 수 있다는 것을 의미하고,
R은 저급 알킬기임)인 화합물로 이루어진 군으로부터 선택되는 폴리머라제이다.
본 발명의 최종 면은,
하나 이상의 변형 뉴클레오티드,
상기 하나 이상의 변형 뉴클레오티드를 폴리뉴클레오티드로 혼입하여 변형된 폴리뉴클레오티드를 형성할 수 있는 하나 이상의 폴리머라제, 및
시약, 또는 상기 폴리뉴클레오티드에서 하나 이상의 변형 뉴클레오티드가 발생하는 각 점에서 상기 변형된 폴리뉴클레오티드를 분할할 수 있는 시약을 포함하는 키트이다.
본원에 사용한 바와 같이, "화학적 방법"은 하나 이상의 변형 뉴클레오티드 및 하나 이상의 시약의 조합물을 의미하며, 이는 천연 뉴클레오티드의 부분적인 또는 완전한 치환에 의해 변형 뉴클레오티드(들)이 폴리뉴클레오티드로 혼입되고, 변형된 폴리뉴클레오티드가 시약(들)이 필요한 경우, 변형 뉴클레오티드(들)의 혼입 부분(들)에서 변형된 폴리뉴클레오티드가 선택적으로 분할되는 것을 야기하는 것을 의미한다.
"분석"은 2개 이상의 관련된 폴리뉴클레오티드중 뉴클레오티드 서열에서 변 이의 검출, 또는 다르게는 폴리뉴클레오티드의 전체 뉴클레오티드 서열의 결정을 의미한다.
"시약"은 천연 뉴클레오티드 대신 변형 뉴클레오티드가 혼입되는 점에서 변형 폴리뉴클레오티드의 분할을 야기하는 화학적 또는 물리적 힘을 의미하고, 이러한 시약에는, 이에 제한하지는 않으면서, 화학약품 또는 화학약품의 조합물, 정상 또는 응집성 (레이저) 가시선 또는 uv 선, 열, 높은 에너지 이온 충격 및 조사가 있다. 또한, 시약은 이에 제한되지는 않지만 폴리머라제와 같은 단백질로 구성될 수 있다.
"관련된" 폴리뉴클레오티드는, 폴리뉴클레오티드의 뉴클레오티드 서열이 변이가 없는 경우 완전히 동일할 것으로 예상되거나, 변이가 없을 경우 완전히 동일한 겹침 영역이 35 뉴클레오티드 초과일 것으로 예상되는 유전자적으로 유사한 원으로부터 얻어진 폴리뉴클레오티드이다.
"변이"는 관련 폴리뉴클레오티드중 뉴클레오티드 서열이 상이한 것이다. 상이성은 관련 폴리뉴클레오티드의 서열에 비해 하나 이상의 뉴클레오티드를 하나의 폴리뉴클레오티드로부터 제거한 것, 하나 이상의 뉴클레오티드를 첨가한 것 또는 뉴클레오티드를 다른 것으로 치환된 것일 수 있다. 용어 "돌연변이", "다형성" 및 "변이"는 본원에 교환되어 사용된다. 본원에 사용된 바와 같이, 단수형인 용어 "변이"는 동일한 폴리뉴클레오티드에서 다양한 변이, 즉 2개 이상의 뉴클레오티드 첨가, 제거 및(또는) 치환을 함유하는 것으로 이루어진다. "점 돌연변이"는 하나의 뉴클레오티드의 다른 것으로의 단일 치환을 의미한다.
"서열" 또는 "뉴클레오티드 서열"은 핵산 중 뉴클레오티드 잔기의 순서를 의미한다.
상기 기재된 바와 같이, 본 발명의 화학적 방법의 한 면은 천연 뉴클레오티드 대신 폴리뉴클레오티드로 혼입될 수 있는 변형 뉴클레오티드로 이루어진다.
"뉴클레오시드"는 당에 연결된 염기를 의미한다. 염기는 아데닌 (A), 구아닌 (G)(또는 그의 치환체, 이노신 (I)), 시토신 (C), 또는 티아민 (T) (또는 그의 치환체, 우라실 (U))일 수 있다. 당은 리보스 (RNA 중 천연 뉴클레오티드의 당) 또는 2-데옥시리보스 (DNA 중 천연 뉴클레오티드의 당) 일 수 있다.
"뉴클레오시드 트리포스페이트"는 트리포스페이트기 (O--P(=O)(O-)-O-P(=O)(O-)-O-P(=O)(O-)-O-뉴클레오시드)에 연결된 뉴클레오티드를 의미한다. 트리포스페이트기는 반대이온, 즉 양으로 하전된 이온을 필요로 하는 4개의 형식 음전하를 갖는다. 임의의 양으로 하전된 이온은, 이에 제한하지는 않으면서 예를 들어 Na+, K+, NH4 +, Mg2+, Ca2+ 등이 사용될 수 있다. Na+는 가장 통상적으로 사용되는 반대이온 중 하나이다. 반대이온을 생략하는 것은 뉴클레오티드 트리포스페이트를 나타낼 때 존재한다고 이해되는 당 업계에 허용된 관례이고, 본 출원에서 이런 관례를 따를 것이다.
본원에 사용된 바와 같이, 특별히 표시되지 않는다면, 용어 "뉴클레오시드 트리포스페이트" 또는 임의의 특정 뉴클레오시드 트리포스페이트를 참고한 것, 예를 들어 아데노신 트리포스페이트, 구아노신 트리포스페이트 또는 시티딘 트리포스페이트는 리보뉴클레오시드 또는 2'-데옥시리보뉴클레오시드를 사용하여 제조된 트리포스페이트를 의미한다.
"뉴클레오티드"는 단일 포스페이트기에 연결된 뉴클레오시드를 의미하거나, 통상적으로 폴리뉴클레오티드로의 혼입에서는, 폴리머라제의 존재하에서 실제로 중합되는 종인 뉴클레오시드 트리포스페이트의 줄임말을 의미한다.
"천연 뉴클레오티드"는 RNA의 경우 A, C, G 또는 U 뉴클레오티드를 의미하고, DNA의 경우 dA, dC, dG ("d"는 당이 데옥시리보스라는 사실을 의미함) 및 dT를 의미한다. 천연 뉴클레오티드는 또한 구조가 상기와 상이할 수 있지만, 폴리뉴클레오티드의 원인 유기체에 의해 폴리뉴클레오티드 서열로 천연적으로 혼입되는 뉴클레오티드를 의미한다.
본원에 사용된 바와 같이, 이노신 (I)는 염기 히포크산틴을 함유하는 푸린 리보뉴클레오시드를 의미한다.
본원에 사용된 바와 같이, 뉴클레오티드 트리포스페이트에 대한 "치환체"는 상이한 뉴클레오시드에서 천연적으로 A, C, G 또는 T를 치환할 수 있는 분자를 의미한다. 따라서, 이노신은 구아노신에 대한 천연 치환체이고, 우리딘은 티미딘에 대한 천연 치환체이다.
본원에 사용된 바와 같이, "변형 뉴클레오티드"는 두개의 기준을 특징으로 한다. 우선, 변형 뉴클레오티드는 "비-천연" 뉴클레오티드이다. 한 면에서, "비-천연" 뉴클레오티드는 비-천연 환경에 위치하는 천연 뉴클레오티드일 수 있다. 예를 들어, 데옥시리보뉴클레오티드로 천연적으로 이루어진 폴리뉴클레오티드에서 리보뉴클레오티드는 폴리뉴클레오티드로 혼입될 경우 "비-천연" 뉴클레오티드를 구성할 것이다. 반대로, 리보뉴클레오티드로 천연적으로 이루어진 폴리뉴클레오티드에서, 데옥시리보뉴클레오티드는 폴리뉴클레오티드로 혼입될 경우 비-천연 뉴클레오티드를 구성할 것이다. 또한, "비-천연" 뉴클레오티드는, 예를 들어 이제 제한되지는 않지만 뉴클레오티드 분자로 하나 이상의 화학적 치환기의 첨가, 분자로부터 하나 이상의 화학적 치환기의 제거, 또는 뉴클레오티드에서 하나 이상의 원자 또는 화학적 치환기의 다른 원자 및 화학적 치환기로의 치환에 의해 화학적으로 변형된 천연 뉴클레오티드일 수 있다. 마지막으로, "변형" 뉴클레오티드는 천연 뉴클레오티드와 거의 유사하지 않은 분자일 수 있고, 그럼에도 불구하고 천연 뉴클레오티드 대신 폴리뉴클레오티드로 폴리머라제에 의해 혼입될 수 있다.
본원에 사용된 바와 같은 "변형" 뉴클레오티드에 의한 두번째 기준은 뉴클레오티드가 혼입된 폴리뉴클레오티드의 분할 특성을 변경하는 것을 특징으로 한다. 예를 들어, 이에 제한하지는 않으면서, 데옥시리보뉴클레오티드로 주로 이루어진 폴리뉴클레오티드로의 리보뉴클레오티드의 혼입은 천연 디옥시리보뉴클레오티드에 존재하지 않는 알칼리성 분할에 대한 민감성을 부가한다. "변형" 뉴클레오티드의 이러한 두번째 기준은 단일 천연 뉴클레오티드를 치환하는 단일 비-천연 뉴클레오티드에 의해 (예를 들어, 상기 기재된 데옥시리보뉴클레오티드를 리보뉴클레오티드로 치환함), 또는 선택된 반응 조건을 필요로 할 경우, 개별적으로 폴리뉴클레오티드의 분할 특성을 변경하지 않지만, 다른 것과 상호작용하여 폴리뉴클레오티드에 변경된 분할 특성을 부가하는 2종 이상의 비-천연 뉴클레오티드에 의해 ("디뉴클레오티드 분할"이라 함) 충족될 수 있다.
단일 변형 뉴클레오티드의 폴리뉴클레오티드로의 혼입 및 변형 폴리뉴클레오티드의 후속하는 분할을 참조할 경우, 변형 뉴클레오티드는 리보뉴클레오티드일 수 없다.
변형 뉴클레오티드에 대해 "상이한 분할 특성을 가짐"은 변형 폴리뉴클레오티드에서 다른 변형 뉴클레오티드의 각 혼입 자리를 남기는 반응 조건하에서 동일한 변형폴리뉴클레오티드로 혼입된 변형 뉴클레오티드가 분할될 수 있다는 것을 의미한다.
본원에 사용된 바와 같이, "변형 뉴클레오티드를 안정화시킴"은 변형 뉴클레오티드의 혼입 자리의 분할에 대한 증가된 내성을 부가하는 이러한 변형 뉴클레오티드를 의미한다. 본원에 기재되어 있는 대부분의 변형 뉴클레오티드는 변형 폴리뉴클레오티드로 혼입될 경우 분할되는 증가된 불안정성을 제공한다. 그러나, 변형 폴리뉴클레오티드에서 천연 뉴클레오티드와는 상이한 변형 뉴클레오티드의 불안정성은 천연 뉴클레오티드에서 임의의 분할을 방지하면서 변형 뉴클레오티드(들)에서 완전히 분할되도록 하기에 항상 충분한 것은 아니다. 따라서, 뉴클레오티드를 또한 함유하는 폴리뉴클레오티드에서 안정화 뉴클레오티드의 존재하에서 불안정성을 감소시키고 (뉴클레오티드를 안정화), 특정 분할 공정에서 불안정성을 증가시키는 (뉴클레오티드를 불안정화) 변형 뉴클레오티드는 분할 공정에서 분할 및 비분할 뉴클레오티드간의 증가된 구별을 제공할 수 있다는 유용한 역할을 한다. 폴리뉴클레 오티드에서 뉴클레오티드를 안정화시키는 바람직한 방법은 뉴클레오티드를 불안정화시키지 않는 모든 뉴클레오티드를 안정화 뉴클레오티드로 치환하는 것이다. 모노뉴클레오티드 분할의 경우 3개의 안정화 뉴클레오티드 및 하나의 불안정화 뉴클레오티드를 사용할 것이고, 디뉴클레오티드 분할의 경우 2개의 안정화 뉴클레오티드 및 두개의 (상이한) 불안정화 뉴클레오티드를 사용할 것이다. 본원에 사용된 바와 같이, 용어 "안정화 뉴클레오티드"는 폴리뉴클레오티드로 혼입되고 분할 공정을 필요로 할 경우, 폴리뉴클레오티드의 다른 (비안정화) 뉴클레오티드에서 (상기 다른 뉴클레오티드는 천연 뉴클레오티드 또는 안정화 뉴클레오티드임) 모노 또는 디뉴클레오티드 분할에 비해 안정화 뉴클레오티드에서 분할을 감소시키는 변형 뉴클레오티드를 의미한다.
본원에 사용된 "탈안정화 변형 뉴클레오티드" 또는 "불안정화 변형 뉴클레오티드"는 폴리뉴클레오티드중 탈안정화 변형 뉴클레오티드의 혼입 자리에서 천연 뉴클레오티드보다 분할에 대한 더 큰 친화도를 부가하는 변형 뉴클레오티드를 의미한다.
본원에 사용된 "질량의 결정"은 분자의 질량을 결정하기 위해 질량 분광계를 사용하는 것을 의미한다. 질량 분광계는 일반적으로 추측될 수 있는 질량으로부터 분석 이온의 질량 대 하전비 (m/z)를 측정한다. 분석 폴리뉴클레오티드의 전하 상태가 +1 또는 -1일 경우, m/z 비 및 질량은 양자 질량에 대한 보정을 한 후 (양으로 하전된 이온에 여분의 양자를 첨가하고, 음이온 하전된 이온으로부터 양자를 뺌) 수치적으로 동일하지만, 전하가 +1 초과 또는 -1 미만일 경우, m/z비는 보통 실제 질량 미만일 것이다. 몇몇 경우, 질량 분광계에 제공되는 소프트웨어는 m/z로부터 질량을 계산하므로, 사용자는 차이점을 인식할 필요가 없다.
본원에 사용된 바와 같이, "표지" 또는 "테그"는 예를 들어, 이에 제한되지는 않지만, 공유 결합 또는 혼성에 의해 다른 분자, 예를 들어, 역시 이에 제한되지는 않지만, 폴리뉴클레오티드 또는 폴리뉴클레오티드 단편에 첨가되었을 경우, 다른 분자를 검출하는 방법을 제공하거나 강화하는 분자를 의미한다.
형광 또는 형광성 표지 또는 태그는 상이한 파장에서 여기되었을 경우 특정 파장에서 검출가능한 빛을 방출한다. 방사능 표지 또는 방사성 활성 태그는 이에 제한되지는 않지만 신틸레이션 카운터와 같은 장치로 검출가능한 방사성활성 입자를 방출한다.
"질량-변형된" 뉴클레오티드는 원자 또는 화학 치환체가 첨가되고, 제거되거나 치환되지만, 이러한 첨가, 제거 또는 치환이 뉴클레오티드에서 본원에 정의된 바와 같은 변형 뉴클레오티드 특성을 생성하지 않는 뉴클레오티드이다. 즉, 첨가, 제거 또는 치환의 효과는 단지 뉴클레오티드의 질량을 변형하는 것이다.
"폴리뉴클레오티드"는 첫번째 뉴클레오시드의 3'-히드록실기와 두번째 뉴클레오티드의 5'-히드록실기간의 포스포디에스테르 결합에 의해 연결되고, 그의 3'-히드록실기를 통해 세번째 뉴클레오티드의 5'-히드록실기에 연결되어 포스포디에스테르 골격에 의해 연결된 뉴클레오티드로 이루어진 중합체를 형성하는 뉴클레오티드의 직쇄를 의미한다. 폴리뉴클레오티드는 이에 제한되지는 않지만 단일 또는 이중 스트랜드 DNA 또는 RNA 또는 당업계에 공지된 임의의 다른 구조이다.
"변형 폴리뉴클레오티드"는 하나 이상의 천연 뉴클레오티드가 부분적으로 또는 실질적으로 완전히 변형 뉴클레오티드로 치환된 폴리뉴클레오티드를 의미한다.
"변형 DNA 단편"은 생어 디데옥시 종결 조건하에서 그의 디데옥시 유사체가 본원에 기재된 변형 뉴클레오티드로 부분적으로 치환된 것 이외에 천연 뉴클레오티드 중의 하나와 함께 합성된 DNA 단편을 의미한다. 이러한 결과는 생어 단편의 세트, 즉, 변형 뉴클레오티드도 함유하는 이러한 단편을 사용한 디데옥시 뉴클레오티드에 따라 ddA, ddC, ddG 또는 ddT에서 종결되는 단편의 세트이다 (물론, 변형 뉴클레오티드에 상응하는 천연 뉴클레오티드는 특정 생어 단편에 존재함).
본원에 사용된 바와 같이, 폴리뉴클레오티드의 "분할 특성을 변경"하는 것은 다른 비-천연 또는 천연 뉴클레오티드로 이루어진 자리에 대해 변형 뉴클레오티드의 혼입점에서 폴리뉴클레오티드를 상이하게 분할가능하거나 분할가능하지 않게, 즉 분할에 내성으로 만드는 것을 의미한다. 현재, 분자의 임의의 다른 자리보다 변형 뉴클레오티드의 혼입 자리에서 폴리뉴클레오티드가 더욱 분할되기 쉽도록 만들어 "분할 특성을 변경"하는 것이 바람직하다.
본원에 사용된 바와 같이, 뉴클레오티드 치환체에 관해 단수형으로 사용되는 것은 달리 특별히 표시되지 않은 경우에는 천연 뉴클레오티드의 각 발생점에서 치환을 포함하여 구성되어야 한다.
본원에 사용된 바와 같이, "주형"은 표적 폴리뉴클레오티드 스트랜드, 예를 들어 이에 제한되지는 않지만, 폴리머라제가 천연-발생 스트랜드의 상보물을 중합하는 성장 스트랜드로 혼입되어야 하는 뉴클레오티드를 인식하는 수단으로서 사용되는 비변형된 천연-발생 DNA 스트랜드를 의미한다. 이러한 DNA 스트랜드는 단일 스트랜드일 수 있거나, 이중 스트랜드 DNA 주형의 일부일 수 있다. 반복된 중합 주기, 예를 들어 폴리머라제 연쇄 반응 (PCR)을 필요로 하는 본 발명의 적용에서, 주형 스트랜드 그 자체는 변형 뉴클레오티드의 혼입에 의해 변형될 수 있지만, 여전히 추가의 폴리뉴클레오티드를 합성하기 위한 폴리머라제에 대한 주형으로서 역할을 한다.
"프라이머"는 그의 서열이 복제된 주형의 세그먼트에 상보적이고, 폴리머라제가 복제 방법의 개시점으로서 사용하는 짧은 올리고뉴클레오티드이다. "상보적"은 프라이머의 뉴클레오티드 서열이 주형과의 안정한 수소 결합 결합체를 형성할 수 있다는 것을 의미한다. 즉, 프라이머는 10개 염기 쌍 길이 이상에 대해 염기-쌍을 형성함으로써 주형과 혼성화될 수 있다.
본원에 사용된 바와 같이, "폴리머라제"는 이에 제한되지는 않지만, 뉴클레오티드 첨가, 뉴클레오티드 제거, 하나 이상의 점 돌연변이 또는 당업자에게 "DNA 혼합" (하기 참조)로 공지된 기술, 또는 상이한 폴리머라제의 부분들을 합하여 키메라성 폴리머라제를 만드는 것에 의해 돌연변이되는 DNA 또는 RNA 폴리머라제, 역전사효소, 돌연변이 DNA 또는 RNA 폴리머라제와 같은 분자를 의미한다. 이러한 돌연변이화 기술을 조합하여 또한 사용할 수 있다. 폴리머라제는 뉴클레오티드의 중합을 촉매화하여 폴리뉴클레오티드를 형성한다. 본원에 개시되고 본 발명의 면인 방법은 변형 뉴클레오티드를 천연 뉴클레오티드와 함께 폴리뉴클레오티드로 효과적으로 혼입할 수 있는 폴리머라제를 생성하고, 확인하고, 사용하는 것이다. 폴리머 라제는 프라이머를 한번 또는 반복하여 확장하거나, 또는 두개의 프라이머를 사용하여 두개의 상보적인 스트랜드의 반복된 프라이밍에 의해 폴리뉴클레오티드를 증폭시키는데 사용될 수 있다. 확장 방법에는, 이에 제한되지는 않지만, 폴리머라제 연쇄 반응 (PCR), NASBR, SDA, 3SR, TSA 및 회전 써클 복제가 있다. 주어진 변형 뉴클레오티드를 함유하는 폴리뉴클레오티드를 제조하는 임의의 방법에서 하나 또는 여러개의 폴리머라제 또는 증폭 방법이 사용될 수 있다는 것을 이해하여야 한다. "가열 안정성 폴리머라제" 또는 "열안정성 폴리머라제"는 이중 스트랜드 핵산을 변성시키는에 필요한 바와 같이, 승온을 필요로 한 후 프라이머 신장 반응에 영향을 끼치는데 충분한 활성을 유지하는 폴리머라제를 의미한다.
광학 중합 조건의 선택은 적용을 따른다. 일반적으로, 프라이머 신장 또는 증폭 (예, PCR)이 전기영동 분석에 의존한 서열 방법에 적합할 것이지만, 프라미어 확장의 형태는 디뉴클레오티드 분할 및 질량 분광 분석에 의존하는 서열 또는 변이 검출 방법에 가장 적합할 수 있다. 유전자형 방법은 증폭에 의한 폴리뉴클레오티드의 생성에 가장 적합하다. 중합 유형은 본 발명의 변이 검출 방법에 적합할 수 있다.
"제한 효소"는 DNA에서 인식 자리에 대한 DNA를 분할하는 제한 엔도뉴클리아제 (폴리뉴클레오티드 쇄내의 포스포디에스테르 결합을 분할하는 효소)를 의미한다. 인식 자리 (제한 자리)는 전형적으로 약 4-8개의 뉴클레오티드 길이의 뉴클레오티드 특정 서열로 이루어진다.
본원에 사용된 바와 같이, "전기영동"은 겔 전기 영동, 예를 들어 슬랩 (slab) 겔 전기 영동, 모세관 전기영동 및 이들이 자동화된 것, 예를 들어 유리 또는 다른 물질에서 생성될 수 있는 것과 같은 에칭된 채널에서 자동화된 DNA 서열 또는 동시 다-채널 자동화된 모세관 DNA 서열기 또는 전기영동분석으로서 당업계에 공지된 기술을 의미한다.
"질량 분광계"는 이에 제한되지는 않지만 매트릭스 어시트티드 레이저 흡수제거 이온화 (MALDI) 및 전기분무 이온화 (ESI) 질량 분석기를 포함하고, 이에 제한되지는 않지만 흐름 시간 (time-of-flight), 4극자 또는 포리에르 (Fourier) 변형 검출 기술을 사용할 수 있는 당업계에 공지된 질량 분석 기술을 의미한다. 질량 분광기가 본 발명의 바람직한 실시태양을 구성하지만, 다른 장치 기술이 질량을 결정하건 올리고뉴클레오티드의 질량과 비교하는데 제공되거나, 제공될 수 있다는 것이 명백할 것이다. 본 발명의 면은 질량을 결정하고 비교하는 것이고, 이러한 결정하고 비교할 수 있는 이러한 임의의 장치 공정은 본 발명의 범위 및 주제내에 있다고 간주된다.
본원에 사용된 바와 같이, "FRET"는 형광 공명 에너지 전이, 양자를 방출하지 않고 한 염료 (공여체)로부터 또다른 염료 (수용체)로 여기를 전이하는 두개의 염색 분자의 전기 여기된 상태간의 거리 의존 상호작용를 의미한다. 일련의 형광성 공정은 FRET를 이용하기 위해 개발되었다. 본 발명에서, 두개의 염료 분자는 일반적으로 분할가능한 변형 뉴클레오티드의 반대면에 위치하고, 이러한 분할은 염료의 근접성을 다른 염료로 변경하고 이로 인해 폴리뉴클레오티드에서 염료의 형광 방출이 변화된다.
본원에 사용된 바와 같이, "유전자 서열을 구성"하는 것은 분할 공정에 의해 얻어진 그의 단편의 질량이 분석에 의한 대상 폴리뉴클레오티드의 DNA 서열에 대한 부분 또는 완전한 정보를 추측하는 방법을 의미한다. 유전자 서열을 구성하는 방법은 폴리뉴클레오티드에 혼입된 변형 뉴클레오티드(들)의 강제 및 사용된 화학 반응 메카니즘(들) (이들 모두는 가능한 구성 질량의 범위에 영향을 줌)이 주어진 대상 폴리뉴클레오티드로부터 얻을 수 있는 모든 가능한 폴리뉴클레오티드의 공지되거나 예측된 질량으로 실험적으로 결정된 분할 질량 세트의 비교를 수반한다. 이어서 분할 단편의 질량으로부터 서열 정보를 가장 많이 추출하기 위해 다양한 분석 연역법 (deduction)이 사용될 수 있다. 별개의 반응에서 두개 이상의 변형 뉴클레오티드 또는 변형 뉴클레오티드의 세트에 의해 대상 폴리뉴클레오티드가 변형되고 분할될 경우, 분할 단편의 몇몇 세트의 분석으로부터 생성될 수 있는 연역법 범위가 더 크기 때문에 더 많은 서열 정보가 일반적으로 추측될 수 있다.
본원에 사용된 바와 같이, "서열 래더"는 단일 DNA 또는 RNA 주형으로부터 제조되어 공통의 말단, 보통 5' 말단을 공유하지만 이들이 반대 말단의 상이한 자리에서 종결되기 때문에 길이가 다른, 겹쳐진 폴리뉴클레오티드의 집합이다. 종결 자리는 4개의 뉴클레오티드, 주형중 A, G, C 또는 T/U중 하나가 존재하는 자리와 일치한다. 따라서 폴리뉴클레오티드의 길이는 집합적으로 주형 DNA 단편중에서 4개의 뉴클레오티드중 하나가 발생하는 간격으로 특정된다. 이러한 4개 서열 래더의 세트는 모든 4개의 뉴클레오티드가 발생하는 간격을 특정하므로, 주형 DNA 단편의 완전한 서열을 제공한다. 본원에서 사용된 바와 같이 용어 "서열 래더"는 또한 완전한 DNA 서열을 결정하기 위해 필요한 4개의 서열 래더의 세트를 의미한다. "서열 래더를 발생시킴"은 완전한 DNA 서열을 결정하기 위한 4개 서열 래더를 얻기 위한 방법을 의미한다.
본원에 사용된 바와 같이, "세포 노화 선택"은 폴리뉴클레오티드로 변형 뉴클레오티드를 혼입하는 폴리머라제를 찾기 위해 세포가 실제로 성장하는 동안에만 특정 화학약품에 의해 죽기 쉬운 세포, 예를 들어 이에 제한되지는 않지만, 이들이 성장하는 동안만 항생제에 의해 죽을 수 있는 박테리아를 사용할 수 있는 방법을 의미한다. 이러한 공정은 세포주로 혼입된 특정 폴리머라제는 변형 뉴클레오티드를 혼입하는 것을 필요로 하는데, 이러한 혼입은 이들이 노화하는 것을 야기하는, 즉 성장을 중지하는 세포에서의 변화를 생성한다. 몇몇은 변형 뉴클레오티드-혼입 폴리머라제를 함유하고, 몇몇은 이를 함유하지 않는 세포 콜로니를 화학약품에 노출시키면, 폴리머라제를 함유하지 않은 세포만이 죽는다. 이어서, 이러한 세포는 세포 성장이 재개시되는 배지, 즉 화학약품 또는 변형 뉴클레오티드가 없는 배지에 넣고, 성장한 세포를 분리하고, 폴리머라제를 이들로부터 단리한다.
본원에 사용된 바와 같이, "화학 산화제"는 분자내 기의 산화 상태를 증가시킬 수 있는 시약을 의미한다. 예를 들어, 이에 제한되지는 않지만, 히드록실기 (-OH)는 케토기로 산화될 수 있다. 예를 들어, 이에 제한되지는 않지만, 과망간산칼륨, t-부틸 히포클로라이드, m-클로로퍼벤조산, 과산화수소, 나트륨 히포클로라이트, 오존, 처아세트산, 과황산칼륨, 및 나트륨 히포브로마이트가 화학 산화제이다.
본원에 사용된 바와 같이, "화학적 염기"는 수성 매질에서 pK 7.0 초과인 화학약품을 의미한다. 화학적 염기의 예로는, 이에 제한되지는 않지만, 알칼리 (나트륨, 칼륨, 리튬) 및 알칼리 토 (칼슘, 마그네슘, 바륨) 히드록시드, 탄산나트륨, 중탄산나트륨, 트리나트륨 포스페이트, 수산화암모늄 및 질소-함유 유기 화합뮬, 예를 들어 피리딘, 아닐린, 퀴놀린, 모르폴린, 피레리딘 및 피롤이 있다. 이들은 약하거나 (일반적으로 희석때문임) 강한 (진한 용액) 수용액으로서 사용될 수 있다. 화학적 염기는 또는 강한 비수성 유기 염기를 의미하고, 이러한 염기의 예로는, 이에 제한되지는 않지만, 나트륨 메톡시드, 나트륨 에톡시드 및 칼륨 t-부톡시드가 있다.
본원에 사용된 바와 같이, 용어 "산"은 물 중 용액에서 분해하여 하나 이상의 수소 이온을 생성하는 물질을 의미한다. 산은 무기산 또는 유기산일 수 있다. 산은 일반적으로 매우 진한 것으로 추정되는 강산, 또는 일반적으로 희석된 것으로 추정되는 약산일 수있다. 물론, 산이 고유하게 상이한 농도를 갖는 다는 것은 이해된다. 예를 들어, 황산은 아세트산보다 훨씬 더 강하고 이러한 인자는 또한 본원에 기재된 방법에 사용하기 위해 적절한 산을 선택할 경우 고려되어야만 한다. 산의 적절한 선택은 본원에 개시물로부터 당업자에게 명백할 것이다. 바람직하게, 본 발명에 사용된 산은 약하다. 무기산의 예로는, 이에 제한되지는 않지만, 염산, 황산, 인산, 질산 및 붕산이 있다. 유기산의 예로는, 이에 제한되지는 않지만, 포름산, 아세트산, 벤조산, p-톨루엔술폰산, 트리플루오르아세트산, 나프트산, 요산 및 페놀이 있다.
"전자-끄는 기"는 그의 큰 음전기성에 의해 유도적으로 전자 밀도를 그 가까이로 및 그를 향해서 끌고, 부분 양전하를 갖는 덜 음전기성인 기를 남기는 화학기를 의미한다. 이러한 부분 양 전하는 인접하는 기에 부분 음전하를 안정화시켜 인 접하는 기의 형식전하 또는 전이 상태인 음전하가 관계된 임의의 반응을 촉진한다. 전자-끄는 기의 예로는, 이에 제한되지는 않지만, 시아노 (C≡N), 아지도 (-N≡N), 니트로 (NO2), 할로 (F, Cl, Br, I), 히드록시 (-OH), 티오히드록시 (-SH) 및 암모늄 (-NH3 +)이 있다.
본원에 사용된 바와 같이, "전자 흡인 성분"은 원자를 탄소보다 더욱 음전기성으로 만들어 고리에 위치할 경우 원자가 전자-끄는 기를 사용하여 전자를 끌고, 원자 근처에 있는 부분 양전하를 갖는 기를 남긴다. 이는 인접 원자가 친핵체의 공격을 받기 쉽도록 만든다. 또한 이는 안정화되는 경향이 있으므로, 음전하가 양으로 하전된 원자에 부착된 다른 원자에 형성되는 경향이 있다.
"친핵체" 및 "친핵체기"는 분자와 반응할 경우 분자로부터 한쌍의 전자를 받는 기를 의미한다. 몇몇 통속적인 친핵제에는, 이에 제한하지는 않으면서, 요오드, 및 방향족 질소 양이온이 있다.
본원에 사용된 바와 같이 "알킬"기는 탄소수 1 내지 20의 직선형 또는 분지형 비치환된 기를 의미한다. 이러한 기는 바람직하게 탄소수 1 내지 10의 쇄, 가장 바람직하게 탄소수 1 내지 4의 쇄로 이루어진다. 본원에 사용된 바와 같은 탄소수 "1 내지 20" 등은 쇄의 탄소수가 1 또는 2 또는 3 또는 4 등, 20 이하인 것을 의미한다.
"머캅토"기는 -SH기를 의미한다.
"알킬화제"는 알킬기를 분자내로 도입할 수 있는 분자를 의미한다. 이에 제 한하지는 않으면서, 예를 들어 메틸 요오다이드, 디메틸 술페이드, 디에틸 술페이트, 에틸 브로마이드 및 부틸 요오다이드이다.
본원에 사용된 바와 같이, 용어 "선택성", "선택적으로", "실질적으로", "본직적으로", "균일하게" 등은 표시된 사건의 발생하는 특정 정도를 의미한다. 특히, 변형 뉴클레오티드의 혼입 백분율은 90 % 초과, 바람직하게 95 % 초과, 가장 바람직하게 99 % 초과이거나, 또는 변형 뉴클레오티드에서 분할에 대한 선택성은 다른 천연 또는 변형 뉴클레오티드보다 10 배 초과, 바람직하게 25 배 이상, 가장 바람직하게 100 배 이상이거나, 또는 변형 뉴클레오티드에서 백분율 분할은 90 % 초과, 바람직하게 95 % 초과, 가장 바람직하게 99 % 초과이다.
본원에 사용된 바와 같이, "진단"은 질병 또는 장애의 특징을 결정하는 것을 의미한다. 본 발명의 방법은 임의의 형태의 진단, 이에 제한하지는 않으면서, 임상 진단 (질병 또는 장애의 징후 및 증상에 대한 연구로부터 진단하고, 이러한 징후 및 진단이 변이되어 존재함), 감별 진단 (환자가 앓고 있는 질병으로부터 유사한 증상을 갖는 2종 이상의 질병을 결정하는 것)등으로 사용될 수 있다.
본원에 사용된 바와 같이, "예후"는 질병의 경로 및(또는) 결과를 예측하는 것을 의미한다. 본 발명의 내용에서, 본원에 기재된 방법은 유전자 변이 또는 질병 진행 또는 치료 응답에서의 변이의 효과를 따르는데 사용될 수 있다. 진단 수단으로서 본 발명의 방법을 사용하는 것은 변이의 생물학적 영향력에 대한 지식을 필요로 하지 않는다는 것을 주목하여야 한다. 특정 장애를 앓는 개인 또는 장애와의 변이의 통계적인 관계에서 변이를 검출하는 것이 충분하다. 특정 변이에서 진 행 또는 환자의 치료에 대한 응답은 장애의 경로를 추적되어 치료법 또는 다른 장애 처리 결정에 대한 안내를 할 수 있다.
"유전자 성분을 갖는"은 특정 질병, 장애 또는 치료에 대한 응답이 변이, 또는 질병 또는 장애를 앓는 개인의 유전자 코드의 변이에 관련되었다고 알려지거나 짐작되는 것을 의미한다.
본원에 사용된 바와 같이, "개인"은 파충류 및 포유류를 포함한 고등 생물체 형태, 특히 인간을 의미한다. 그러나,본 발명의 방법은 임의의 생물학적 유기체의 핵산의 분석에 유용하다.
<표의 간단한 설명>
표 1은 DNA에서 변이의 검출에 현재 사용되는 몇몇 방법에 대한 설명이다.
표 2는 4개의 DNA 뉴클레오티드 모노포스페이트의 분자량 및 뉴클레오티드의 각 쌍간의 질량 상이성을 나타내고 있다.
표 3은 표2에서의 DNA 뉴클레오티드의 모든 가능한 2머, 3머, 4머 및 5머의 질량을 나타내고 있다.
표 4는 4개의 뉴클레오티드 중 하나에서 분할에 의해 생성될 수 있는 모든 가능한 2머, 3머, 4머, 5머, 6머 및 7머의 질량, 및 인접하는 올리고뉴클레오티드 간의 질량 상이성을 나타내고 있다.
표 5는 모든 가능한 점 돌연변이 (뉴클레오티드가 다른 것으로 치환됨)에서 발생한 질량 변화 및 점 돌연변이가 다양한 해상력의 질량 분광계를 사용하여 질량 분석법에 의해 검출될 수 있어야 하는 폴리뉴클레오티드의 이론상 최대 크기를 나타내고 있다.
표 6은 본 발명의 방법을 사용하여 올리고뉴클레오티드에서 실제 분자량 상이성을 나타내고 있고, 상이성은 지금까지 밝혀지지 않은 올리고뉴클레오티드에서 변이를 밝히고 있다.
표 7은 4개의 별개의 반응에서 대표적인 20머의 분할에 의해 얻어진 질량 모두를 보여주고 있고, 각 반응은 DNA 뉴클레오티드 하나에 대해, 즉 A, C, G 및 T에서 특정하다.
<도면의 간단한 설명>
도 1은 PCR에 의해 얻어진 66 염기-쌍 단편에서 단일 염기 변화 (T에서 C)의 검출을 보여주고 있다.
도 2는 변형 뉴클레오티드 7-메틸구아닌의 G로의 혼입에 의해 변형된 폴리뉴클레오티드의 분할로부터 기대되는 주된 단편의 분자량을 보여주고 있다.
도 3은 분할 전, 후의 변형된 G가 있는 폴리뉴클레오티드의 폴리아크릴아미드 겔 분석을 보여주고 있다. 단일 뉴클레오티드 (RFC 대 RFC mut)에 의해 분화된 두개의 폴리뉴클레오티드를 분석하였다.
도 4는 RFC의 존재하에서 PCR 증폭된 66 염기-쌍 단편의, 확대된 삽입물을 갖는 질량 분광사진을 보여주고 있다.
도 5는 7-메틸G가 G로 완전히 치환된 후 G에서 분할된 66 염기 폴리뉴클레오티드로부터 분할 생성물의, 확대된 삽입물을 갖는 질량 분광사진을 보여주고 있다.
도 6은 단 하나의 뉴클레오티드에 의해 분화된 두개의 올리고뉴클레오티드의 질량 분광사진을 보여주고 있고, G는 더 큰 올리고뉴클레오티드에만 존재한다.
도 7은 선형화된, 단일 스트랜드 M13 주형의 서열 겔을 보여주고 있다. 주형은 5'-아미노 dTTP의 존재하에서 엑소-마이너스 클레나우 폴리머라제를 사용하여 87 뉴클레오티드로 확장된 후, 아세트산으로 부분적으로 분할되었다.
도 8은 화학적 분할 전 및 후에 도 7에서 정제된 전체 길이 확장 생성물을 보여주고 있다.
도 9는 도 7 및 8의 완전히 확장된 프라이머/주형 결합체의 제한 효소 소화의 결과를 보여주고, 5'-아미노T의 존재하에서 프라이머가 확장되어 7.2 Kb 폴리뉴클레오티드를 형성하는 것도 보여주고 있다.
도 10은 Hae III 제한 PhiX174 DNA의 고성능 액체 크로마토그래피 (HPLC) 분리에 의해 얻어진 분석을 보여주고 있다.
도 11은 T가 5-아미노T로 치환된 후, 아세트산으로 분할하여 폴리아크릴아미드 겔 전기영동으로 변성시킨 폴리뉴클레오티드로부터 얻어진 서열 래더를 보여주고 있다.
도 12는 리보뉴클레오티드가 가교 티올 에스테르의 5'인 디뉴클레오티드의 예를 보여주고 있다.
도 13은 완전한 모노뉴클레오티드 분할 또는 완전한 디뉴클레오티드 분할의 50, 100, 150, 200 및 250 뉴클레오티드 폴리뉴클레오티드에서 변이 검출에 대한 효율을 보여주고 있다.
도 14 내지 18은 화학적으로 분할가능한 변형 뉴클레오티드를 사용하여 긴 범위 DNA 서열의 다양한 면을 보여주고 있다.
도 14는 10 kb 클론의 가상적 숏건 (shotgun) 서열 분석을 보여주고 있고, 폴리머라제가 혼입한 모노뉴클레오티드의 화학적 분할에 의한 긴 범위 DNA 서열화의 원칙 및 장점을 설명하고 있다.
도 15는 4 dNTP 및 하나의 5'-아미노-dNTP의 존재하에서 프라이머 신장 후, 얻어진 서열 래더의 제한 엔도뉴클리아제 소화, 말단 표지, 화학 분할 및 전기영동 분석에 의한 2.7 kb 플라스미드의 서열을 설명하고 있다.
도 16은 HPLC에 의한 5'-아미노 T 치환된 Hinc II 제한 엔도뉴클리아제 단편의 부분적 분리를 보여주고 있다.
도 17은 디데옥시 종료 및 5'-아미노 뉴클레오티드 치환된 프라이머 신장 생성물의 산 분할에 의해 생성된 서열 래더를 비교한 것이다. 화학적 분할 공정은 4000 뉴클레오티드 초과에 대한 표지된 생성물의 균일한 분배를 야기한다.
도 18은 디데옥시 종료 및 자가방사선상에서 시각화한 5'-아미노 뉴클레오티드 치환된 프라이머 신장 생성물의 산 분할에 의해 생성된 서열 래더를 비교한 것이다.
도 19는 700 nt DNA 단편의 제한 엔도뉴클리아제 분할에 의해 생성된 DNA 단편을 디뉴클레오티드 화학적 분할에 의해 생성된 단편에 비교하여 설명한 것이다.
도 20은 5' 내지 '3 배향에서 리보뉴클레오티드 및 5'-아미노-뉴클레오티드를 사용한 디뉴클레오티드 분할을 보여주고 있다.
도 21은 리보뉴클레오티드 및 5'-아미노뉴클레오티드로 치환된 DNA 단편의 염기 분할에 의해 얻어진 분할 생성물을 산 분할에 의해 얻어진 분할 생성물과 비교하고 있다.
도 22는 리보-G 및 5'아미노-TTP로 치환된 DNA 단편의 분할의 결과를 보여주고 있다. 자가방사선상은 GT에서의 완전한 분할 및 G 또는 T에서 배경 분할이 없는 것을 보여주고 있다.
도 23은 리보-A 및 5'-아미노-TTP를 혼입하는 DNA 단편의 분할 결과는 나타내고 있다. 또한, 자가방사선상은 완전하고, 완전히 자리 특이성 분할을 보여주고 있다.
도 24는 도 23의 DNA 단편의 분할 생성물의 질량 분광사진이다. 2 nt 단편을 제외한 모든 단편이 관찰된다.
도 25는 리보-A 및 5'아미노-TTP가 혼입된 257 nt 프라이머 신장 생성물의 디뉴클레오티드 분할의 결과를 묘사하고 있다.
도 26은 도 25의 프라이머 신장 생성물의 AT 디뉴클레오티드 분할 생성물의 MALDI-TOF 질량 분광사진이다.
도 27 내지 33은 모노뉴클레오티드 분할을 질량 분광계, 전기 영동 및 FRET에 의해 유전자형에 적용하는 것을 설명하고 있다.
도 27은 유전자형의 개략도이다 (공지된 변이 자리에서 변이 검출).
도 28은 트렌스페릴 수용체에서 변형된 ddA의 존재하에서 PCR 증폭 후, 변형 뉴클레오티드에서 화학적 분할에 의한 유전자형 dA 대 dG 변이의 결과를 나타내고 있다.
도 29는 변형 뉴클레오티드 혼입/화학적 분할 후, 얻어진 단편의 질량 분광 분석을 사용하여 유전자형을 예시하고 있다.
도 30은 화학적 분할 후 MALDI-TOF에 의해 트렌스페린 수용체를 함유하는 변형 뉴클레오티드의 유전자형을 설명하고 있다.
도 31은 MALDI-TOF 유전자형의 특징적인 면을 설명하고 있다.
도 32는 변형 뉴클레오티드 트렌스페릴 수용체의 화학적 분할 후, 석판 겔 또는 모세관 전기 영동에 의한 트렌스페린 수용체 다형성의 유전자형을 설명하고 있다.
도 33은 변형된 폴리뉴클레오티드의 화학적 분할 후 변이 폴리뉴클레오티드의 FRET 검출을 개략적으로 설명하고 있다.
<본 발명의 상세한 설명>
한 면에서, 본 발명은 실질적으로 천연 뉴클레오티드가 변형 뉴클레오티드로 혼입되는 각 점에서 폴리뉴클레오티드에서 천연 뉴클레오티드로 치환되고, 변형된 폴리뉴클레오티드를 실질적으로 변형 뉴클레오티드의 각 혼입점에서 분할하고, 얻어진 단편의 질량을 결정한 후, 공지된 서열의 관련된 폴리뉴클레오티드로부터 기대되는 질량과 비교함으로써, 또는 관련된 폴리뉴클레오티드의 서열이 공지되지 않은 경우, 상기 단계를 두번째 관련된 폴리뉴클레오티드로 반복한 후, 두개의 관련된 폴리뉴클레오티드로부터 얻어진 단편의 질량과 비교함으로써, 관련된 폴리뉴클레오티드 중 뉴클레오티드 서열에서 변이를 검출하는 방법에 관한 것이다. 물론, 본 발명의 방법은 임의의 특정 수의 관련된 폴리뉴클레오티드에 제한되지 않고, 필 요하거나 복적한 만큼 사용할 수 있다는 것을 이해하여야 한다.
또다른 면에서, 본 발명은 폴리뉴클레오티드에서 두개의 천연 뉴클레오티드를 두개의 변형 뉴클레오티드로 치환함으로써 관련된 폴리뉴클레오티드 중 뉴클레오티드 서열에서 변이를 검출하는 방법에 관한 것이고, 선택된 반응 조건하에서 이들이 개별적으로 변형 폴리뉴클레오티드에 선택성 분할 특성을 부가하지 않도록 변형 뉴클레오티드는 선택된다. 반대로, 두개의 변형 뉴클레오티드가 인접할 경우, 즉, 치환된 천연 뉴클레오티드가 비변형 폴리뉴클레오티드에서 인접할 경우, 이들은 일제히 선택성 분할 특성을 변형 폴리뉴클레오티드에 부가하도록 작용한다. 단순한 근접성 이외에, 변형 뉴클레오티드가 적절하게 공간상 관계에 있는 것은 선택된 변형 뉴클레오티드 및 반응 조건에 따라 필요할 수 있다. 예를 들어, 제한하지 않으면서, 5'A-3'G는 5'G-3'A와는 달리 분할될 수 있다. 상기와 같이, 일단 천연 뉴클레오티드가 변형 뉴클레오티드로 치환되면, 변형 뉴클레오티드 쌍은 분할되고, 단편의 질량이 결정되고, 공지된 서열의 관련 폴리뉴클레오티드로부터 예상되는 질량, 또는 관련 폴리뉴클레오티드 중 하나 이상의 서열이 공지되지 않은 경우, 공정이 다른 관련 폴리뉴클레오티드와 반복된 될 경우 얻어진 질량과 비교된다.
또다른 발명에서, 본 발명은 모노- 또는 디뉴클레오티드 분할 생성물을 전기영동 또는 형광 공명 에너지 전이 (FRET)에 의해 검출하는 방법에 관한 것이다. FRET-기재 분석에서, 특정 파장 범위에 걸친 형광의 존재 또는 부재를 모니터링한다. 이러한 방법 모두는 변이가 이미 확인된 폴리뉴클레오티드의 단일 자리에서 변이를 검출하는데 특히 적합하다. 특정 변이에 대한 지식은 변이 뉴클레오티드( 들)상태의 신속하고, 저렴하고, 자동화가능한 결정에 특히 적합한 전기영동 또는 FRET 시약 및 공정의 디자인을 허용한다. 분할 생성물의 전기영동 및 FRET 검출의 예는 하기 기재 및 도면에 기재되어 있다.
본 발명의 또다른 면은 특정 질병 및 장애의 발달에 대한 본 발명의 변이 검출 방법의 용도, 및 특정 질병 및 장애의 성질의 검출용 진단 또는 예후용 수단으로서 용도이다.
진단 수단의 발달에서, 본 발명의 방법은 공지되거나, 유전자상-관련된 것으로 예측할 수 있는 특정 질병 또는 장애의 증상을 나타내는 시험 대상, 또는 건강 증진 또는 경제적으로 값어치 있는 형질, 예를 들어 성장률, 페스트 내성, 농작물 수율과 같은 목적하는 특성을 나타내는 시험 대상의 DNA를 동일한 집단의 건강한 일원 및(또는) 동일한 질병, 장애 또는 형질을 나타내는 집단의 DNA와 비교하는데 사용될 것이다. 시험 대상에는, 이에 제한하지는 않으면서, 인간, 임의의 다른 포유류, 예를 들어 쥐, 생쥐, 개, 고양이, 말, 소, 돼지, 양, 염소 등, 냉혈종, 예를 들어, 어류, 또는 농업상 중요한 농작물, 예를 들어 및, 옥수수, 면 및 대두가 있다. 집단의 건강한 일원과 집단의 질병 또는 장애가 있는 일원과의 통계학상 명백한 변이의 검출은 대상이 질병 또는 장애가 있거나, 걸릴 위험이 있는지 확인하기 위한 시험의 유용성에 대한 실질적인 증거로서 역할을 할 것이다. 이는 매우 유용한 진단 시험이 될 것이다.
삭제
본 발명의 방법을 진단 또는 예후 수단으로서 사용하여, 발견된 변이에 관한 모든 것, 즉 변이의 정확한 위치, 변이가 첨가, 결실 또는 치환인지의 여부, 또는 첨가, 결실 또는 치환된 뉴클레오티드 종류에 대해 안다는 것은 완전히 불필요한 것이다. 변이의 존재를 간단히 검출함으로써 피검자의 질환 또는 질병의 발생을 진단하거나 예측하고자 하는 요구를 달성한다. 그러나, 대부분의 경우 진단 또는 예후의 용도로 특정 변이에 대한 상세한 유전형 분석 시험법을 개발할 수 있는 것이 바람직하다.
본원에 기재된 유전형 결정법의 특히 유용한 측면은 용이한 분석 디자인, 저렴한 시약, 및 전기영동, 질량분석 및 형광 검출을 포함하는 다양한 방법 (이에 한정되지는 않음)에 의한 절단 생성물의 검출에 있어서의 적합성이다.
본 발명의 다른 양태에서, 폴리뉴클레오티드 전체 서열은 변형된 한 뉴클레오티드로 천연 뉴클레오티드의 각 발생 지점의 한 천연 뉴클레오티드의 치환에 이어 절단 및 질량 검출을 수반하는 상기 방법을 반복함으로써 결정할 수 있다. 본 실시태양에서, 각 천연 뉴클레오티드는 4회의 공정을 수행한다. 즉 DNA 경우 각 dA, dC 및 T (이에 한정되는 것은 아님)가 4가지 별개의 실험에서 변형된 뉴클레오티드로 치환된다. 4회의 절단 반응으로부터 얻어진 질량은 폴리뉴클레오티드의 전체 서열을 결정하는 데 사용할 수 있다. 본 방법은 프라이머 신장 또는 예를 들어 PCR에 의한 증폭으로 제조되는 폴리뉴클레오티드에 적용할 수 있다. PCR에 의한 증폭의 경우 양 스트랜드 모두 변형된 뉴클레오티드로 치환된다.
상기 공정에서 서열 내의 임의의 위치의 뉴클레오티드가 불확실할 경우 추가 공정이 필요할 수 있다 (예. 하기의 실시예 참조). 또한, 이 추가 실험은 두개의 변형된 뉴클레오티드로 두개의 천연 뉴클레오티드의 치환, 변형된 뉴클레오티드의 인접한 부위의 절단, 이어서 얻어진 단편의 질량을 측정하기 위해 상기에 기재된 방법을 이용할 수 있다. 표적 뉴클레오티드의 인접 뉴클레오티드의 위치에 대한 정보로부터 불확실한 뉴클레오티드를 결정할 수 있다. 주요 실험에서 발생할 수 있는 임의의 불확실한 뉴클레오티드를 분석하는 데에 이용할 수 있는 또다른 실험은 신속하고 용이하나 단독으로는 매우 정확한 서열분석이 불가능한 겔 전기영동법을 수반하는 원 패스 생어 서열화 (one-pass Sanger sequencing)이다. 따라서, 본 발명의 방법과 함께, 당업계에 공지된 다른 서열화 방법은 특정의 불확실한 뉴클레오티드의 경우에 이를 분석하는 데 필요한 정보를 제공할 수 있다. 또한, 상기 방법의 조합법이 사용될 수 있다. 각 서열화가 그의 성과물을 절충하는 특정하게 연관된 인공물을 가지면서 그 합성물이 방법에 따라 상이한 경우에 상이한 방법을 사용하는 것이 유용하다. 따라서, 매우 정확한 서열분석이 목적인 경우에 서로 다른 인공물을 상쇄하는 경향이 있는 두가지 이상의 서열분석 기술을 이용하는 것이 매우 유리하다. 본원에 개시 내용 및 문제의 불확실한 특정 서열을 기초로 하여 뉴클레오티드를 분석하는 또다른 실험은 당업자에게 명백할 것이며, 따라서 본 발명의 범위 내에 있는 것으로 간주된다.
본 발명의 또다른 양태에서, 본원에 기재된 변형된 뉴클레오티드 절단 반응은 한 절단 단편과 다른 분자 사이의 공유 결합의 형성할 수 있다. 이 분자는 여러 목적에 사용될 수 있다. 이 분자는 직접적으로 검출가능한 표지 또는 질량분석, 전기영동 및 형광분석법에서 절단 생성물의 검출을 향상시키는 부분을 함유할 수 있다. 예를 들어, 상기 부분은 염료, 방사선동위원소, 이온화 효율을 상승시키는 이온 트랩, 탈착 효율을 중단시키는 흥분성기 또는 탈착 및/또는 이온화 특성을 전체적으로 변화시키는 거대 분자일 수 있으나 이에 한정되지는 않는다. 표지 반응은 부분적이거나 전체적이다. 조절가능한 크기의 균일하게 표지된 DNA 단편의 용례는 DNA 혼성화, 예를 들어 DNA 칩과 같은 고밀도 배열에 대한 혼성화 프로브이다.
본 발명의 또다른 양태는 폴리뉴클레오티드 내의 천연 뉴클레오티드의 존재 위치 비율로 변형된 뉴클레이티드로 천연 뉴클레오티드을 치환시키는 것이다. 상기 퍼센트는 약 0.01% 내지 약 95%, 바람직하게는 약 0.01% 내지 약 50%, 보다 바람직하게는 0.01% 내지 약 10% 및 가장 바람직하게는 0.01% 내지 1%이다. 치환율은 선택된 절단 반응의 효율에 보완적으로 선택된다. 즉, 효율이 낮은 절단 반응을 선택하는 경우 높은 치환 반응율이 허용되고, 수율이 높은 절단 반응이 선택되는 경우 낮은 비율의 치환 반응이 바람직하다. 평균적으로 각 폴리뉴클레오티드 스트랜드가 한번 절단되는 결과를 원하는 경우, 맥삼-길버트 및 생어 방법에 기재된 바와 같은 서열 사다리가 전개될 수 있다. 본원에 기재된 절단 반응은 효율이 비교적 높기 때문에 폴리뉴클레오티드 스트랜드 당 단일 절단을 요구하는 경우에 낮은 치환율이 바람직하다. 또한, 낮은 치환율은 이용가능한 중합효소로 보다 용이하게 달성될 수 있다. 그러나, 본원의 개시 내용을 기초로 하는 상이한 효율의 다른 절단 반응은 당업자에게 명백하며, 마찬가지로 본 발명의 범위에 해당한다. 실제로, 본 발명의 한 양태는 변형된 폴리뉴클레오티드 내에 변형된 뉴클레오티드 의 결합 지점에서 절단율이 약 0.01% 내지 50%, 바람직하게는 약 0.01% 내지 10% 및 가장 바람직하게는 약 0.01% 내지 약 1%으로 효율이 충분히 낮은 절단 반응을 사용하여, 실질적으로 각 존재 위치에서 변형된 뉴클레오티드로 천연 서열이 치환된 폴리뉴클레오티드는 서열 사다리를 생성하는 데에도 사용될 수 있다. 가장 바람직한 수준의 효율인 약 0.01% 내지 약 1%로 완전히 변형된 폴리뉴클레오티드의 각 스트랜드는 평균적으로 1회 절단되어야 한다.
다른 양태에서, 본 발명은 변형된 뉴클레오티드의 결합 및 절단에 대해 신규한 특성을 갖는 중합효소의 제조 및 동정 방법에 관한 것이다.
A. 뉴클레오티드의 변형 및 절단
(1) 염기의 변형 및 절단
변형된 뉴클레오티드는 변형된 염기, 변형된 당, 변형된 인산 에스테르 결합 또는 이들의 조합을 포함할 수 있다.
염기 변형은 뉴클레오티드의 아데닌, 시토신, 구아닌 또는 티민 (또는 RNA 경우 우라실) 부분의 화학적 변형이며 생성되는 화학 구조는 변형된 뉴클레오티드를 비변형된 염기를 함유하는 뉴클레오티드에 비해 시약에 의해 보다 공격받기 쉽게 만든다. 하기는 염기의 변형의 실시예로서 이에 한정되지는 않는다. 염기의 이같은 다른 변형법은 본원의 개시 내용에 비추어 보아 당업자에게 명백하며, 따라서 본 발명의 범위 내에 포함되는 것으로 간주된다 (예, 디플루오로톨루엔: Liu, D. et al., Chem. Biol., 4:919-929, 1997, Moran, S., et al., Pro. Natl. Acad. Sci. USA, 94:10506-10511, 1997)
이러한 변형된 염기의 일부 실시예는 하기에 기재되어 있다.
1. 아데닌 (1)은 7-데아자-7-니트로아데닌 (2)로 치환된다. 7-데아자-7-니트로아데닌은 효소 촉매 중합반응에 의해 폴리뉴클레오티드로 용이하게 결합된다. 7-니트로기는 화학적 염기, 예를 들어 수성의 수산화나트륨 또는 수성의 피페리딘 (이에 한정되지 않음)에 의해 공격하도록 C-8을 활성화시켜 결국 특정 스트랜드를 절단한다 (Verdine, et al., JACS, 1996, 118:6116-6120)
(1) (2)
Figure 112001007374848-pct00054
Figure 112001007374848-pct00055
본 발명자들은 완전한 절단이 원하는 결과이지만 피페리딘을 이용한 절단은 항상 완전하지는 않다는 것을 확인하였다. 그러나, 포스핀 유도체, 예를 들어 트리스(2-카르복시에틸) 포스핀 (TCEP) (이에 한정되지는 않음) 및 염기의 존재하에서 절단 반응을 수행하는 경우 완전한 절단을 얻는다. 상기 절단 반응의 예는 다음과 같다. 7-니트로-7-데아자-2'-데옥시아데노신의 결합에 의해 변형된 DNA를 0.2 M TCEP/1M 피페리딘/0.5 M 트리스 염기로 95℃에서 1시간 동안 처리한다. 변성 폴리아크릴아미드겔 (20%) 분석은 완전한 절단을 보였다. 다른 염기, 예를 들어 NH4OH (이에 한정되지 않음)는 피페리딘 및 트리스 염기 대신에 사용할 수 있다. 본 방법, 즉 염기와 함께 포스핀의 사용은 표적 폴리뉴클레오티드가 피페리딘에 불 안정한 변형된 뉴클레오티드로 치환되는 임의의 절단 반응에 이용가능하다.
TCEP 및 염기를 이용한 절단 생성물은 고유하다. 질량분석법은 3' 말단에 인산-리보스-TCEP 부가물 및 5' 말단에서 인산 잔기를 갖는 구조와 일치한다.
Figure 112001007374848-pct00056
TCEP가 변형된 폴리뉴클레오티드의 단편화에 참여하는 방법은 현재 공지되지 않았다. 그러나, 임의의 특정 이론으로 뒷받침없이 본 발명자들은 그 기전을 하기와 같을 것으로 생각한다.
Figure 112001007374848-pct00057
TCEP (또는 다른 포스핀)의 절단 생성물로의 결합은 절단반응과 동시에 단편화된 폴리뉴클레오티드의 매우 유용한 표지 방법이다. 상기에 기재된 바와 같이 3' 말단 리보스에서 부가물을 형성할 수 있는 적합하게 관능화된 포스핀을 이용함 으로써 질량 태그, 형광 태그, 방사성 태그 및 이온 트랩 태그 (이에 한정되지 않음)와 같은 관능성이 단편화된 폴리뉴클레오티드에 결합될 수 있다. 하나 이상의 태그를 함유하고 절단 단편에 공유결합할 수 있는 포스핀은 본 발명의 또다른 양태를 구성한다. 유사하게, 폴리뉴클레오티드 단편의 표지 방법과 같은 상기 태그된 포스핀의 사용은 본 발명의 또다른 양태이다.
본원의 개시 내용을 기초로 하여 당업자에게 명백할 수 있는 다른 포스핀은 뉴클레오티드 단편 상에 표지된 포스핀의 제조에 사용할 수 있으며, TCEP는 표지를 위해 특히 우수한 후보물질이다. 예를 들어, 카르복시기 (-C(0)OH)는 여러가지 기술, 예를 들어 하기 반응식에서 도시된 바와 같이 아미드, 에스테르 또는 머캅토에스테르를 형성하는, 카르보디이미드 존재하에서 아민, 알콜 또는 머캅탄과의 반응 (이에 한정되지 않음)에 의해 직접 변형될 수 있다.
Figure 112001007374848-pct00058
카르복시기는 친핵체 (상기 경우 아민)의 존재하에서 카르보디이미드와 반응시 카르보이미드 및 카르복시기 사이의 부가물은 자리옮김하여 안정한 N-아실 우레아를 형성한다. 카르보디이미드가 형광표지염료 (fluorophore)를 포함하는 경우, 하기 반응식에서 도시된 바와 같이 생성 포스핀은 그 형광표지염료를 포함한다.
Figure 112001007374848-pct00059
상기 반응식에서,
M1 및 M2는 독립적으로 O. NH, NR 및 S이고,
R1 및 R2는 질량 태그, 형광 태그, 방사성 태그, 이온 트랩 태그 또는 이들의 조합물이다.
아미노기 함유 형광염료표지, 예를 들어 형광성 글리신 아미드 (5-아미노아세트아미드)플루오레세인, 7-아미노-4-메틸쿠마린, 2-아미노아크리돈, 5-아미노플루오레세인, 1-피렌메틸아민 및 5-아미노에오신이 본 방법의 표지된 포스핀의 제조에 사용된다. 또한, 루시퍼 옐로우 및 캐스케이드 블루는 바이오틴 아미노 유도체가 사용될 수 있는 것과 마찬가지로 사용될 수 있다. 또한, 로다민 및 텍사스 레드 히드라진과 같은 히드라진 유도체도 본 발명에 유용할 수 있다.
또한, 형광 디아조알칸, 예를 들어 1-피레닐디아조메탄 (이에 한정되지 않음)도 TCEP와 에스테르를 형성하는 데 사용될 수 있다.
또한, 형광 알킬 할로겐화물은 카르복시기의 음이온, 즉 C(O)O-기와 결합하여 에스테르를 형성할 수 있다. 사용될 수 있는 할로겐화물에는 파나실 브로마이드, 3-브로모아세틸-7-디에틸아미노쿠마린, 6-브로모아세틸-2-디에틸아미노나프탈 렌, 5-브로모메틸플로오레세인, BODIPY (등록상표) 493/503 메틸 브로마이드, 모노브로모비만, 쿠마린 요오도아세트아미드와 같은 요오도아세트아미드 (이에 한정되지 않음)는 TCEP와 공유결합하는 효과적인 표지 포함 부분으로서 작용할 수 있다.
나프탈이미드 술포네이트 에스테르는 아세토니트릴 중에서 카르복실산 음이온과 신속하게 반응하여 259 nm에서의 흡광도로 100 팜토몰까지 394 nm에서의 형광도로 4 펨토몰까지를 검출가능한 부가물을 생성한다.
또한, 무수한 아민 반응성 형광 프로브가 이용가능하며, TCEP를 하기 반응에 의해 1차 아민으로 전환시키는 것이 가능하다.
Figure 112001007374848-pct00060
이어서, 아미노포스핀은 본원에서 기재된 절단/표지 방법에 사용하기 위한 표지 함유 아미노포스핀을 형성하는데 사용할 수 있다.
상기 염료 및 이들은 TCEP에 공유 결합시키기 위한 방법은 형성될 수 있는 가능한 부가물의 단지 몇몇 예가 있다. 이러한 추가적인 시약 및 방법의 유용한 자료는 몰레귤라 프로브, 인크 (Molecular Probes, Inc.)의 카탈로그이다. 본원의 개시 및 몰레귤라 프로브 카탈로그와 같은 자료를 근거로 하여, 포스핀, 특히 TCEP를 변형시키는 많은 방법은 당업자에게 명백하다. 폴리뉴클레오티드의 화학 절단 시 폴리뉴클레오티드 단편으로 표지를 결합시키는 데 사용하기 위해 포스핀을 변형하는 다른 방법은 본 발명의 범위 내에 있다.
2. 시토신 (4)는 5-아자시토신 (5)로 치환될 수 있다. 5-아자시토신은 효소 촉매는 중합반응에 의해 폴리뉴클레오티드로 효율적으로 결합될 수 있다. 5-아자시토신은 화학적 염기, 특히 수성 염기, 예를 들어 수성 피페리딘 또는 수성 수산화나트륨에 의해 절단되기 쉽다 (Verdine, et al., Biochemistry. 1992, 31:11265-11273).
Figure 112001007374848-pct00061
Figure 112001007374848-pct00062
3(a). 구아닌 (6)은 7-메틸구아닌 (7)로 치환될 수 있으며 중합효소에 의해 폴리뉴클레오티드로 용이하게 결합되고 (Verdine, et al., JACS, 1991, 113:5104-5106) 화학적 염기, 예를 들어 수성의 피페리딘 (이에 한정되지 않음)에 의한 공격을 받기 쉽다 [Siebenlist, et al., Proc. Natl. Acad. Sci. USA, 1980, 77:122) 또는
Figure 112001007374848-pct00063
Figure 112001007374848-pct00064
3(b). 문헌 (Gupta and Kool, Chem. Commun. 1997, pp1425-26)은 N6-알릴-디데옥시아데닌이 DNA 스트랜드에 결합될 때 약한 친전자체 E+, 본 문헌에 경우 요오드 처리시 절단한다는 것을 증명하였다. 제안된 기전은 반응식 1에 도시되어 있다.
Figure 112001007374848-pct00065
유사한 방법은 이전에 보고되지 않은, 하기 반응식 2에서 도시된 방법에 의해 제조될 수 있는 2-알릴아미노구아닌 유도체 (8)를 이용하여 구아닌에 이용될 수 있다.
Figure 112001007374848-pct00066
본원의 개시 내용을 기초로 하는 화합물 8의 다른 합성법이 명백하다. 이러한 합성은 본 발명의 요지 및 범위 내에 있는 것으로 간주된다. 폴리뉴클레오티드 스트랜드로 생성된 N2-알릴구아노신 삼인산의 결합은 문헌 (Gupta)의 N6-알릴구아노신 뉴클레오티드와 유사한 방법, 즉 반응식 3에 도시된 기전에 의해 절단되기 쉽다.
Figure 112001007374848-pct00067
4. 티미딘 (9) 또는 우라실 (10)은 5-히드록시우라실 (11)로 치환될 수 있 다 (Verdine, JACS, 1991, 113:5104). 상기 변형된 염기와 같이 5-히드록시우라실로부터 제조된 뉴클레오티드는 또한 효소 촉매 중합반응에 의해 폴리뉴클레오티드로 결합된다 (Verdine, et al., JACS, 1993, 115:374-375). 특이적 절단은 먼저 5-히드록시우라실을 산화제, 예를 들어 수성의 과망간산염으로 처리한 후 화학적 염기, 예를 들어 수성 피페리딘 (이에 한정되지 않음)으로 처리한다 (Verdine, 상기 문헌).
Figure 112001007374848-pct00068
5. 5 위치에서 전자 흡인기, 예를 들어 니트로, 할로 또는 시아노 (이에 한정되지 않음)로 치환된 피리미딘은 6 위치에서 친핵체의 공격을 받기 쉬워져 염기 촉매된 개환 및 후속의 인산 에스테르 결합의 분해가 수반된다. 5-치환된 시티딘을 사용하는 실시예가 반응식 4에 도시되어 있으며, 이는 임의의 방법으로 본 기술 범위를 한정하는 것으로 해석되어서는 안된다. 트리스(카르복시에틸)포스핀 (TCEP)의 존재하에서 절단이 수행되는 경우 부가물 (10)이 얻어질 수 있으며, TCEP가 적합한 잔기 (하기 참조)로 관능화되는 경우, 표지된 폴리뉴클레오티드 단편이 얻어질 수 있다.
Figure 112001007374848-pct00069
(2) 당의 변형 및 절단
또한, 뉴클레오티드의 당 부분의 변형은 상기 변형의 결합 부위에서 선택적으로 절단되기 쉽도록 변형된 폴리뉴클레오티드를 제공한다. 통상, 당은 3' 및(또는) 5' 인산 에스테르 결합을 더 불안정하게 만드는, 즉, 천연 뉴클레오티드의 3' 및(또는) 5' 인산 에스테르 결합보다 절단되기 쉽도록 하나 이상의 관능기를 포함하도록 변형된다. 하기에는 이러한 당의 변형의 실시예이며, 이에 한정되지는 않는다. 다른 당의 변형은 본원의 개시 내용에 비추어 당업자에게 명백하므로 본 발명의 범위 내의 것으로 간주된다. 하기 식에서, B 및 B'는 임의의 염기이고 이들은 동일하거나 상이하다.
1. 데옥시리보스 기재 폴리뉴클레오티드에서, 리보스 유사체로 하나 이상의 데옥시리보뉴클레오시드의 치환, 데옥시아데노신 (13)의 아데노신 (12)로의 치환은 생성되는 변형된 폴리뉴클레오티드의 아데노신의 각 위치에서 폴리뉴클레오티드가 화학적 염기, 예를 들어 수성 수산화나트륨 또는 진한 수산화암모늄에 의해 선택적으로 절단되기 쉽게 만든다 (반응식 5)
Figure 112001007374848-pct00070
Figure 112001007374848-pct00071
Figure 112001007374848-pct00072
2. 2' 케토당 (14, 합성: JACS, 1967, 89:2697)으로 데옥시뉴클레오티드의 당을 치환할 수 있다. 화학적 염기, 수성의 수산화물(이에 한정되지 않음)로 처리시, 케토기는 케탈 형태 (15)와 평형화하고, 이는 이어서 절단에 효과적인 인산 에스테르 결합을 공격한다 (반응식 6).
Figure 112001007374848-pct00073
3. 데옥시리보스 뉴클레오티드는 그의 아리비노스 유사체, 즉 2"-히드록시 기 (16)를 함유하는 당으로 치환될 수 있다. 다시, 화학적 (묽은 수성) 약염기의 처리는 분자간 인산 에스테르 결합을 치환시켜 폴리뉴클레오티드의 절단을 유발한다 (반응식 7)
Figure 112001007374848-pct00074
삭제
4. 데옥시리보스 뉴클레오티드는 그의 4'-히드록시메틸 유사체 (17, 합성: Helv. Chim. Acta, 1966, 79:1980)로 치환될 수 있으며, 상기 유사체는 화학적 약염기, 예를 들어 묽은 수성의 수산화물 (이에 한정되지 않음) 처리시 반응식 8에 도시된 바와 같이 인산 에스테르 결합을 유사하게 치환시켜 폴리뉴클레오티드의 절단을 유발한다.
Figure 112001007374848-pct00075
5. 데옥시리보스 뉴클레오티드는 4'-히드록시 카르복시클릭 유사체, 즉 4-히드록시메틸시클로페난 유도체 (18)로 치환될 수 있으며, 상기 유사체는 수성 염기 처리시, 반응식 9에 도시된 바와 같이 인산 에스테르 결합에서 폴리뉴클레오티드의 절단을 일으킨다.
Figure 112001007374848-pct00076
6. 당고리는 추가로 히드록실기 (19)로 치환된 카르보시클릭 유사체로 치환될 수 있다. 고리에서 히드록실기의 입체 화학적 위치에 따라, 3' 또는 5' 인산 에스테르 결합은 화학적 약염기의 처리시 선택적으로 절단된다 (반응식 10).
Figure 112001007374848-pct00077
7. 각 예에서, 상기 1, 3, 4, 5 및 6에서 인산 에스테르 절단을 공격하는 히드록시기는 아미노기 (-NH2)로 치환될 수 있다. 아미노기는 아지드 변형된 폴리뉴클레오티드가 형성된 후에 트리스(2-카르복시에틸)-포스핀 (TCEP)를 처리함으로써 대응 아지도당으로부터 계내에서 생성될 수 있다 (반응식 11). 일단 형성된 아미노기는 자발적으로 인산 에스테르 결합을 공격하여 절단을 일으킨다.
Figure 112001007374848-pct00078
8. 당은 유리 라디칼, 예를 들어 페닐셀레닐 (PhSe-) 또는 t-부틸 에스테르기 (tBuC(=O)-) (이에 한정되지 않음)을 생성할 수 있는 관능기로 치환될 수 있다 (Angew. Chem. Int. Ed. Engl. 1993, 32:1742-43).
무산소 조건하에서 변형된 당의 자외선 처리는 C4' 라디칼을 형성시키고, 이라디칼의 단편화는 변형된 뉴클레오티드의 절단을 일으킴으로써 변형된 뉴클레오티드에서 폴리뉴클레오티드의 절단을 일으킨다 (반응식 12). 유리 라디칼은 MALDI 질량 분석법의 레이저 탈착/이온화 공정 전 또는 공정 중에 생성될 수 있다. 다른 광불안정성 4' 치환체, 예를 들어 2-니트로벤질기 또는 3-니트로페닐기 (Synthesis, 1980, 1-26) 및 브롬 또는 요오드기 (이에 한정되지 않음)를 이용하여 변형된 뉴클레오티드는 또한 전구체로 사용되어 C4'라디칼을 형성할 수 있다.
Figure 112001007374848-pct00079
9. 전자 흡인기는 당에 결합될 수 있으며, 이에 따라 뉴클레오티드가 β-제거되기 쉽거나 (W가 시아노인 경우 ("시아노당" 20)) 또는 3' 인산 에스테르 결합의 가수분해에 의해 형성되는 산소음이온이 안정화되어 화학적 약염기를 사용하여 변형된 당에서 우선적으로 가수분해된다 (반응식 13). 상기 전자 흡인기에는 시아노 (-C ≡N), 니트로 (-NO2), 할로 (특히 플루오르), 아지도 (-N3) 또는 메톡시 (-OCH3)가 포함되나 이에 한정되지는 않는다.
Figure 112001007374848-pct00080
시아노당은 여러 방법에 의해 제조될 수 있으며, 그중 하나는 반응식 14에 도시되어 있다. 다른 방법은 본원의 개시 내용을 기초로 하여 당업자에게 명백함에 틀림없다. 시아노 (또는 다른 전자 흡인기로 치환된 당)의 치환 방법은 본 발명의 요지 및 범위 내에 있다.
Figure 112001007374848-pct00081
10. 당 고리의 산소는 다른 원자, 예를 들어 질소 (이에 한정되지 않음)로 치환되어 피롤 고리 (21)을 형성할 수 있다. 또는, 다른 헤테로원자, 예를 들어 질소 원자 (이에 한정되지 않음)가 한 고리 탄소 원자 대신에 당 고리에 위치되어 옥사졸 고리 (22)를 형성할 수 있다. 다른 경우에, 다른 또는 추가의 헤테로원자의 목적은 생성되는 비천연의 뉴클레오티드의 인산 에스테르 결합을 천연 뉴클레오티드보다 더 불안정하게 만드는 것이다 (반응식 15).
Figure 112001007374848-pct00082
11. 기, 예를 들어 머캅토기 (이에 한정되지는 않음)는 당의 2" 위치에 결합되어 화학적 약염기 처리시 3'-인산 에스테르를 제거함으로써 고리를 형성한다 (반응식 16)
Figure 112001007374848-pct00083
12. 케토기는 5' 위치에 결합되어 생성되는 인산은 무수물, 즉 구조식 23의 불안정성을 갖는다. 23과 같은 뉴클레오티드 삼인산은 반응식 17에 도시된 공정에 의해 합성할 수 있다. 이같은 뉴클레오티드 삼인산 합성의 다른 경로는 본원의 개시 내용을 기초로 하여 당업자에게 명백할 수 있다. 상기 합성은 본 발명의 요지 및 범위 내에 있다.
Figure 112001007374848-pct00084
구조식 23의 뉴클레오티드 삼인산이 결합되는 폴리뉴클레오티드는 유사한 혼합 무수물과 같이 반응식 18에 도시된 알칼리 가수분해되기 쉽다.
Figure 112001007374848-pct00085
13. 인산 에스테르 결합은 5' 위치에 이중 결합을 만듬으로써 비교적 더 불안정한 에놀 에스테르 결합으로 전환될 수 있다. 즉, 구조식 24의 뉴클레오티드 삼인산이 사용될 수 있다. 구조식 24의 뉴클레오티드 삼인산은 반응식 19에 도시된 공정에 의해 제조할 수 있다. 또한, 구조식 24를 생성하는 다른 방법은 본원의 개시 내용을 기초로 하여 당업자에게 명백할 수 있으며, 이러한 치환 합성방법은 본 발명의 요지 및 범위 내에 있다.
Figure 112001007374848-pct00086
에놀 에스테르는 반응식 20에 따라 알칼리 절단되기 쉽다.
Figure 112001007374848-pct00087
14. 5' 위치에서 디플루오르 치환은 인산 에스테르 결합의 불안정성을 증가시키고, 반응식 22에서 도시된 바와 같이 중간체 디플루오로히드록시기의 산성기로의 가수분해에 의해 반응의 완성을 또한 진행시킨다. 디할로 유도체는 반응식 21에 도시된 공정에 의해 합성할 수 있다. 다시 한번, 반응식 21에 도시된 경로는 디플루오로뉴클레오티드 삼인산을 합성하는 유일한 가능 경로가 아니다. 그러나, 상기에서와 같이 이들 다른 경로는 본원의 개시 내용을 기초로 하여 명백하며 본 발명의 요지 및 범위 내에 있다.
Figure 112001007374848-pct00088
Figure 112001007374848-pct00089
(3) 인산 에스테르의 변형 및 절단
뉴클레오티드의 인산 에스테르의 변형은 한 뉴클레오티드의 3'-히드록시기와 인접한 뉴클레오티드의 5'-히드록시 사이의 포스포디에스테르 결합을 변형시켜, 변형된 3' 또는 5' 인산 에스테르 결합의 둘 중 하나를 비변형된 대응 결합에 비해 실질적으로 절단되기 쉽게 만든다. 포스포디에스테르 결합이 폴리뉴클레오티드 골격을 형성하기 때문에 상기 변형 방법은 본원에서 "골격 변형법"으로도 언급한다. 하기는 골격 변형의 비제한적 실시예이다. 이같은 다른 변형은 본원의 개시 내용을 기초로 하여 당업자에게 명백하며, 따라서 본 발명의 범위 내에 있는 것으로 간주된다.
1. 인산 에스테르 결합에서 산소의 황으로의 치환, 즉 포스포로티올레이트 결합 (25A, 25B, 25C)을 생성시키고 직접적인 약염기 (반응식 23 (a) 및 23 (b)) 처리 또는 알킬화제, 에를 들어 메틸요오다이드 처리에 이어 비수성의 유기 강염기, 예를 들어 메톡시드 (반응식 23 (c)) 처리하여 포스포티오에스테르 결합을 선택적 으로 절단한다. 또한, 화학식 14의 결합과 같은 포스포로티올레이트 결합은 MALDI 질량분석시 레이저 광분해에 의해 선택적으로 절단된다. 반응내 단편화 방법 (Internat'l J. of Mass Spec. and Ion Process, 1997, 169/170:331-350)은 폴리뉴클레오티드 절단 및 분석을 한 단계로 통합한다.
Figure 112001007374848-pct00090
Figure 112001007374848-pct00091
Figure 112001007374848-pct00092
2. 인산 에스테르 결합내의 산소의 질소로의 치환은 포스포라미데이트 결합 (26)을 생성하고, 이는 예를 들어 묽은 수성산 (이에 한정되지 않음) 처리시 선택적인 절단을 일으킨다 (반응식 24).
Figure 112001007374848-pct00093
3. 인산 골격의 인에 부착된 한 유리 산소 원자의 알킬기, 예를 들어 메틸기 (이에 한정되지 않음)로의 치환은 메틸포스포네이트 결합을 형성하고, 이는 비수성 유기 강염기, 예를 들어 메톡시드 (이에 한정되지 않음)의 처리시 선택적인 절단을 일으킨다 (반응식 25)
Figure 112001007374848-pct00094
4. 인산 에스테르 결합의 유리 산소음이온의 알킬기, 예를 들어 메틸기 (이에 한정되지 않음)로의 알킬화는 비수성 유기 강염기, 예를 들어 메톡시드 (이에 한정되지 않음)의 처리시 알킬포스포로트리에스테르 결합의 선택적인 절단을 일으킨다 (반응식 26).
Figure 112001007374848-pct00095
5. 머캅토에탄올이 주로 디설피드로 존재하는 강염기, 예를 들어 메타놀 나트륨 메톡시드 (이에 한정되지 않음) 중에서 포스포로티오에이트의 β-머캅토에탄올의 처리하면 혼합된 디설피드를 형성하고, 디설피드는 자리 옮김 반응의 유무에 상관없이 분해하여 반응식 27에 도시된 절단 생성물을 생성한다.
Figure 112001007374848-pct00096
(4) 디뉴클레오티드의 변형 및 절단
상기의 치환은 모두 단일 치환이다. 즉, 하나의 변형된 뉴클레오티드로 표적 폴리뉴클레오티드내의 천연 뉴클레오티드 또는 필요한 경우 상기 위치의 부분에서 하나의 천연 뉴클레오티드를 치환한다. 본 발명의 또다른 양태에서 다중 치환이 사용될 수 있다. 즉, 두개 이상의 상이한 변형된 뉴클레오티드로 목적의 폴리뉴클레오티드 내의 천연 뉴클레오티드에서 두개 이상의 상이한 천연 뉴클레오티드를 각각 치환한다. 변형된 뉴클레오티드 및 절단 조건은 적합한 절단 조건하에서 변형된 뉴클레오티드가 폴리뉴클레오티드 상의 선택적인 절단 특성을 개별적으로 부여하지 않도록 선택된다. 그러나, 적합한 절단 조건이 적용되고 변형된 뉴클레 오티드가 서로 특정의 공간 관계에 있는 폴리뉴클레오티드로 결합되는 경우, 이들은 함께 상호작용하여 폴리뉴클레오티드가 선택적으로 절단가능하게 만든다. 바람직하게, 두개의 변형된 뉴클레오티드로 폴리뉴클레오티드에서 두개의 천연 뉴클레오티드를 치환시키고, 따라서 이 방법을 본원에서 "디뉴클레오티드 변형법"으로 언급한다. 두개의 변형된 뉴클레오티드 각각은 상당히 상이하고, 통상적으로 보다 격렬한 화학적 조건하에서도 불구하고 폴리뉴클레오티드의 특이적이고 선택적인 절단을 유도한다는 것에 주의하는 것이 중요하다.
본원에서 사용되는 "공간 관계"란 폴리뉴클레오티드로의 치환 후 2개 이상의 변형된 뉴클레오티드 사이의 3차원 관계를 의미한다. 본 발명의 바람직한 실시태양에서 2개의 변형된 뉴클레오티드는, 변경된 절단 특성을 변형된 폴리뉴클레오티드에 부여하기 위해 변형된 폴리뉴클레오티드 중에서 인접해야만 한다. 이러한 방식으로 2개의 변형된 뉴클레오티드를 사용하고, 이어서 변형된 뉴클레오티드를 절단시킴으로써 표적 뉴클레오티드 중의 2개의 천연 뉴클레오티드 사이의 관계가 선택된 다중 치환의 성질에 따라 성립될 수 있다. 다시 말해서, 치환되는 천연 뉴클레오티드도 또한 천연 뉴클레오티드 중에서 서로 인접하게 된다. 예를 들어 제한없이 변형된 A 및 변형된 G가 각각 상응하는 천연 A 및 천연 G의 발생 지점마다 치환되는 경우, 변형된 뉴클레오티드는 천연 A 및 G가 천연 폴리뉴클레오티드 중에서 바로 인접한 곳에서만, 즉 AG 또는 GA (단, 둘다는 아님)에서 선택적으로 절단될 수 있도록 한다. 또한, 하기 나타낸 바와 같이, 변형된 폴리뉴클레오티드의 적합한 선택으로 뉴클레오티드의 정확한 관계, 즉 상기 예에서 천연 뉴클레오티드에서 의 뉴클레오티드 서열이 AG 또는 GA인지를 나타낸다. 하기는 다중 치환의 비제한적인 예이다. 다른 다중 치환이 본원에서 개시된 기재를 기초로 당업자들에게 명백하며, 따라서 본 발명의 범위내에 드는 것으로 생각된다.
1. 하나의 변형된 뉴클레오티드는 친핵성 치환을 수행할 수 있는 관능기를 함유할 수 있는 반면, 다른 짝의 변형된 뉴클레오티는 선택적인 이탈기가 되도록 변형된다. 친핵체 및 이탈기는 서로에 대해 5',3'-배향 또는 3',5'-배향일 수 있다. 이것의 비제한적인 예는 반응식 28에 나타낸다. 하나의 변형된 뉴클레오티드 상의 2' 또는 2"-히드록시기는 온화한 화학 염기로 처리할 경우 양호한 친핵체가 된다. 다른 변형된 뉴클레오티드는 3' 또는 5'-티오히드록시(-SH)기는 함유하며, 이것은 변형된 뉴클레오티드로 혼입될 때 3' 도는 5'-포스포로티오에이트 결합을 형성한다. 이 포스포로티오에이트 결합은 선택적으로, 통상의 포스포디에스테르 결합보다 더 불안정하다. 온화한 염기로 처리한 경우, 하나의 변형된 뉴클레오티드의 히드록시기로부터 형성되는 옥시 음이온은 선택적으로 절단을 일으키는 다른 변형된 뉴클레오티드로 티오포스포페이트를 치환한다. 반응식 28a 및 28b에 나타낸 바와 같이, 히드록시기 및 티오포스페이트 결합 사이에 입체화학적 관계에 따라 히드록시 함유 변형된 뉴클레오티드의 3' 또는 5' 측에서 절단이 일어난다. 따라서, 천연 폴리뉴클레오티드 중에서 천연 뉴클레오티드의 정확한 관계가 나타난다.
Figure 112001007374848-pct00097
Figure 112001007374848-pct00098
2(a). 각각 하나의 변형된 뉴클레오티드가 3' 또는 5' 아미노(-NH2)기를 함유하고 다른 변형된 뉴클레오티드가 3' 또는 5' 히드록시기를 함유하는 경우, 생성된 포스포로아미데이트 결합된 폴리뉴클레오티드를 온화한 산으로 처리하면 포스포로아미데이트 결합의 아미노기가 양성자화되어 매우 양호한 이탈기가 된다. 다시, 하나의 변형된 뉴클레오티드의 히드록시기 및 다른 변형된 뉴클레오티드의 아미노기 사이의 공간 관계에 따라, 천연 폴리뉴클레오티드 중에서 뉴클레오티드의 정확한 관계는 반응식 29a 및 29b에서 나타낸 바와 같이 결정될 수 있다.
Figure 112001007374848-pct00099
Figure 112001007374848-pct00100
리보뉴클레오티드/5'-아미노뉴클레오티드 5',3' 결합의 디뉴클레오티드 절단은 현재 본 발명의 바람직한 실시태양이다. 이 방법의 예는 도 21 내지 26에 나타나있다.
2(b). 변형된 뉴클레오티드의 아미노기가 5'인 경우, 리보뉴클레오티드/5'-아미노 2',5'-디데옥시뉴클레오티드 쌍은 중합 과정 동안 절단될 수 있다. 예를 들어, 제한없이 야생형 클레노우 (엑소-) 및 돌연변이체 E710A 클레노우 (엑소-) 폴리머라제의 조합을 사용하여 아데닌 리보뉴클레오티드 및 5'-아미노디데옥시티민 뉴클레오티드를 폴리뉴클레오티드에 혼입하는 동안 절단이 일어난다. E710A는 잔기 710의 글루타메이트가 알라닌으로 치환된 돌연변이체 E710A 클레노우 (엑소-) 폴리머라제이다. E710A 돌연변이체는 리보뉴클레오티드 및 데옥시리보뉴클레오티드를 둘다 단일 발생된 폴리뉴클레오티드 스트랜드로 혼입시 클레노우 (엑소-) 보다 더 효율적이다. 유사한 특성을 갖는 다른 폴리머라제는 본원의 개시를 기초로 당업자에게 명백할 것이며, 이러한 폴리머라제를 중합 반응 동안 폴리뉴클레오티드로 리보뉴클레오티드 및 5'-아미노 2',5'-디데옥시뉴클레오티드의 혼입과 후속 절단을 위해 사용하는 것은 본 발명의 범주내에 든다.
5'-말단 방사표지된 프라이머가 클레노우 (엑소-) 및 E710A 클레노우 (엑소-)의 혼합물을 사용하여 신장되는 경우, 리보뉴클레오티드-5'-아미노뉴클레오티드 부위에서의 완전한 절단을 표시하는 하나의 단편 (5'-말단 단편)만이 관찰되었다. 본 발명자들은 중합 및 절단이 동일한 단계에서 일어남을 나타냈다 (도 21 내지 26). 즉, 절단은 단백질-DNA 접촉 동안 유도된다. 도면들은 폴리머라제가 절단 후에도 주형을 계속 신장시킨다는 것을 보여주며, 이것은 또한 절단이 단백질-DNA 접촉의 결과라는 것을 제안한다. USB 브랜드 클레노우 폴리머라제 (Amersham)는 또한 2개의 뉴클레오티드를 혼입할 수 있지만, 폴리머라제의 혼합물 만큼 효율적이지 않고, 더욱이 AT 부위에서 불완전한 절단을 표시하는 다중 생성물 밴드가 관찰된다.
물론 상기는 일반적인 개념의 특정예이다. 즉, 다른 야생형 폴리머라제, 돌연변이체 폴리머라제 또는 이들의 조합도 또한 중합 과정 동안 절단시키거나 변형된 뉴클레오티드 또는 디뉴클레오티드의 절단을 행할 수 있다. 본원의 개시를 기초로 하여 절단을 야기하는 폴리머라제(들) 및 뉴클레오티드 변형물의 정확한 조합 을 결정하기 위한 과정은 당업자에게 명백할 것이다. 예를 들어, 하기 기재한 바와 같이 돌연변이체 폴리머라제의 라이버리를 발생시키고 디뉴클레오티드 절단을 유도하는 것에 대해 특이적으로 선택하는 것이 유용할 수 있다. 따라서, 절단을 일으키는데 필요한 폴리머라제 또는 폴리머라제의 조합 및 변형된 뉴클레오티드를 사용하여 중합 과정 동안 변형된 폴리뉴클레오티드를 절단시키는 방법이므로, 중합 공정 동안 형성되는 변형된 폴리뉴클레오티드의 절단을 일으키는 폴리머라제 또는 폴리머라제의 조합은 본 발명의 또다른 일면이다.
3. 전자 끌게가 메틸포스포네이트 (반응식 30a) 또는 메틸포스포트리에스테르 (반응식 30b) 골격의 에스테르 결합에 관여하는 히드록시기와 결합된 탄소와 인접한 당 탄소에 있을 수 있다. 이것은 포스포네이트기가 온화한 염기 (반응식 30)으로 가수분해될 때 형성되는 옥시 음이온의 안정성을 증가시키고, 따라서 상기 히드록시기와 인접하지 않은 포스포네이트 에스테르 결합과 비교할때 이들 포스페이트 에스테르 결합을 선택적으로 가수분해시킨다.
Figure 112001007374848-pct00101
Figure 112001007374848-pct00102
4. 전자 끌게가 5'-히드록시기를 통하여 인접한 리보뉴클레오티드의 3'-히드록시기에 결합되는 뉴클레오티드의 4' 탄소 상에 있을 수 있다. 묽은 염기로 처리하면 반응식 31에 나타낸 바와 같이 절단된다.
Figure 112001007374848-pct00103
5. 당에서 2' 또는 4' 이탈기는 반응식 32 및 33에 나타낸 바와 같이 포스포로티오에이트의 황에 의해 공격되기 쉬워 목적하는 절단을 제공할 수 있다.
Figure 112001007374848-pct00104
Figure 112001007374848-pct00105
6. 에틸렌 술파이드는 반응식 34에 따르면 포스포로티오에이트 다음의 당의 2' 플루오로 유도체의 절단을 수행할 수 있다.
Figure 112001007374848-pct00106
β-머캅토에탄올 또는 유사 시약은 에틸렌 술파이드 대신 치환될 수 있다.
7. 포스포로티오에이트는 인접 리보뉴클레오티드의 2' 히드록시기에 아주 근접하여 보유될 수 있는, 제한없이 CuII 또는 FeIII와 같은 금속 산화제와 배위할 수 있다. 케톤에 대한 2' 히드록시기의 선택적인 산화는 반응식 35에서 나타낸 바와 같이 인접 포스페이트 에스테르 결합이 상응하는 리보뉴클레오티드 또는 데옥시리보뉴클레오티드보다 염기성 조건하에 보다 절단되도록 해야 한다.
Figure 112001007374848-pct00107
앞선 절단 반응은 변형된 뉴클레오티드의 실질적으로 모든 발생 지점에서 또는 다중 치환의 경우에서는 적합한 공간 관계의 2개 이상의 변형된 뉴클레오티드의 모든 발생 지점에서 절단을 일으키는 방식으로 수행될 수 있다. 한편, 절단 시약의 양 및 반응 조건을 조절함으로써 절단은 부분적으로 될 수 있고, 다시 말해 절단은 변형된 뉴클레오티드 또는 변형된 뉴클레오티드의 쌍의 발생 지점의 하나의 분획에서만 일어난다.
B. 질량 분광기에서 변형된 폴리뉴클레오티드의 단편화
상기 논의는 변형된 뉴클레오티드가 혼입된 부위에서 폴리뉴클레오티드를 절 단하는 화학적 방법에 관한 것이다. 그러나, 본 발명의 다른 일면은 용액 중에 화학적으로 폴리뉴클레오티드 분자를 단편화하는 것 이외에, 단편화가 화학적 또는 물리적 수단을 사용하여 질량 분광기내에서 이루어진다는 것이다. 또한, 질량 분광기내의 조건을 조작함으로써, 단편화의 범위는 조절될 수 있다. 화학적으로 변형된 올리고뉴클레오티드의 단편화의 정도를 조절하는 능력은 인접한 서열 사이의 관계를 결정하는데 매우 유용할 수 있다. 이것은, 완전히 절단된 폴리뉴클레오티드의 질량 분광(MS) 분석이 질량을 제공하고 따라서 각 단편 폴리뉴클레오티드의 뉴클레오티드 함량을 제공하지만, 이들 단편이 원래 (분석물) 폴리뉴클레오티드 중에서 함께 결합된 순서를 결정하는 것은 어려운 문제이기 때문이다. 절단의 엄격함을 완화시킴으로써 완전한 절단 세트로부터의 2개 이상의 단편에 해당하는 단편을 발생시킬 수 있다. 이들 화합물 단편의 질량은, 2개 성분의 단편이 원래 폴리뉴클레오티드 중에서 인접함을 추정하게 하는 정보를 제공한다. 완전한 절단 단편의 다중 상이한 쌍 또는 삼중선이 서로 인접해 있다는 것을 결정함으로써 실질적으로 보다 더 큰 서열이 완전한 절단 단편의 분석에 단독으로 의존해야 하는 경우보다 함께 이어질 수 있다. 시험관에서 부분적인 절단의 반복되는 발생 및 후속 시험과는 달리, 각종 부분적인 절단 조건의 수행이 실시간에 직접 관찰될 수 있고 동시에 최적의 부분 절단 데이터 세트(들)를 제공하도록 조작될 수 있기 때문에, 질량 분광계에서 조작에 의한 단편의 조건을 조절하는 능력이 특히 유리하다. 부분 절단의 연속 레벨이 매우 큰 단편 사이의 관계의 누적 그림을 제공하므로, 일부 목적을 위해 몇몇 부분적인 절단 조건의 사용은 매우 유용할 수 있다. 변형된 폴리 뉴클레오티드의 단편화에 대한 특정 메카니즘이 하기 기재된다.
첫째, 단편화는 적합한 이온화 방법의 선택으로 이온화 과정 동안 유도될 수 있다. 별법으로, 직렬식 질량 분광기(MS/MS) 접근법에서, 중요한 질량 대 하전 비(m/z)을 갖는 이온이 선택될 수 있고, 이어서 분자, 이온 또는 전자와의 충돌 또는 여러 파장의 광자의 흡수를 포함하는 각종 과정에 의해 활성화되어, 이온의 단편화를 일으킨다. 한 일면으로, 폴리뉴클레오티드 분자의 이온화 및 단편화는 고속 원자 충격(FAB)으로 달성될 수 있다. 이 접근법에서, 변형된 폴리뉴클레오티드 분자는 글리세롤, 티오글리세롤 또는 다른 글리세롤 유사체와 같은 액체 매트릭스 중에 용해된다. 용액은 금속성 표면상에 침착된다. 수천 전자 볼트의 운동 에너지를 갖는 입자는 액적으로 향하게 된다. 폴리뉴클레오티드의 변형화에 따라, 모든 변형된 뉴클레오티드에서의 부분적인 단편화 또는 완전한 단편화는 달성될 수 있다.
다른 일면으로, 이온화 및 단편화는 매트릭스 보조 레이저 탈착 이온화 질량 분광기(MALDI-MS)에 의해 수행될 수 있다. MALDI-MS에서, 변형된 폴리뉴클레오티드 분자의 용액은 매트릭스 용액, 예를 들어 수용액 중의 3-히드록시피콜린산과 혼합된다. 혼합물의 분취액이 고상 지지체, 전형적으로 변형되거나 변형되지 않은 금속성 표면 상에 침착된다. 바람직하게는 3 ㎛ 내지 10.6 Fm의 파장을 갖는 레이저가 변형된 폴리뉴클레오티드/매트릭스 혼합물을 조사하기 위해 사용된다. 공급원 단편화 (ISF) 생성물 중에서 분석하기 위해 지연된 적출법이 사용된다. 공급원 붕괴 후(PSD) 생성물을 분석하기 위해 이온 반사경이 사용된다.
다른 접근법으로, 이온화 및 단편화는 전자분무 이온화(ESI)에 의해 달성될 수 있다. 이 과정에서 변형된 DNA의 용액은 인가된 수 킬로볼트의 전압으로 바늘의 오리피스를 통하여 분무된다. 변형된 폴리뉴클레오티드 분자의 단편화는 노즐-스키머(NS) 영역에서 탈용매화 공정 동안 일어난다. 단편화의 정도는 변형화 특성 및 노즐과 스키머 사이의 전압, 유속 및 건조 가스의 온도와 같은 인자에 따른다. 모세관이 탈용매화를 보조하는데 사용되면, 인자는 단편화의 목적하는 정도를 달성하기 위해 조절되는데 필요한 모세관의 온도 및 모세관의 출구와 스키머 사이의 전압이다.
또다른 기술에서, 변형된 폴리뉴클레오티드 분자는 선택적으로 활성화되거나 분해될 수 있다. 활성화는 수백 내지 수백만 전자 볼트의 운동 에너지로 전구체 이온을 가속한 다음, 이들을 바람직하게는 희가스의 중성 분자와 충돌시킴으로써 달성될 수 있다. 충돌시 전구체 이온의 운동 에너지의 일부는 내부 에너지로 전환되어 단편화를 일으킨다. 활성화는 또한 가속화된 전구체 이온이 전도체 또는 반도체 표면과 충돌하도록 함으로써 달성될 수 있다. 또한 활성화는 가속화된 전구체 이온이 반대 극성의 이온과 충돌하도록 함으로써 달성될 수 있다. 다른 접근법으로, 활성화는 전자 포획에 의해 달성될 수 있다. 이 기술에서, 전구체 이온은 열중성자화된 전자와 충돌하게 된다. 활성화는 또한 전구체 이온을 여러 파장, 바람직하게는 193 nm 내지 10.6 ㎛ 범위의 광자로 조사시킴으로써 달성될 수 있다. 활성화는 또한 트랩핑된 이온을 위한 진공 챔버를 가열함으로써 달성되는데, 진공 챔버벽의 가열은 흑체 IR 조사를 일으킨다 (Williams, E. R., Anal. Chem., 1998, 70:179A-185A). 폴리뉴클레오티드 중의 변형된 뉴클레오티드의 존재는 또한 단편화 반응의 일정한 속도를 증가시켜 비변형된 폴리뉴클레오티드에 대한 흑체 IR 조사에 의해 요구되는 10 내지 1000 초 기간을 단축시킬 수 있다.
앞서 알 수 있는 바와 같이, 직렬식 질량 분광기는 본 발명의 방법으로 유리하게 사용될 수 있는 다른 도구이다. 직렬식 질량 분광기에서, 중요한 m/z를 갖는 전구체 이온이 선택되고 활성화에 도입된다. 사용되는 활성화 기술에 따라, 전구체 이온의 몇몇 또는 전부는 단편화되어 생성물 이온을 제공할 수 있다. 이것이 적절한 질량 분광계 (예, 푸리에-변환 이온 사이클로트론 공명 질량 분광계 및 이온 트랩 질량 분광계)내에서 행해지는 경우, 중요한 m/z를 갖는 생성물 이온이 추가로 선택되고 활성화 및 단편화에 도입되어 더 많은 생성물 이온을 제공할 수 있다. 전구체 및 생성물 이온 모두의 질량이 결정될 수 있다.
활성화의 상이한 단계에서 단편화의 정도를 조절하기 위해 상이한 활성화 기술에 대한 상이한 민감도를 갖는 2 이상의 상이한 타입의 변형된 뉴클레오티드 (논의를 위해 타입 I 및 타입 II으로 칭함)가 표적 폴리뉴클레오티드로 혼입될 수 있다 (천연 뉴클레오티드의 완전한 치환). 이러한 폴리뉴클레오티드는 타입 I의 변형된 뉴클레오티드가 혼입되는 위치 마다 타입 I의 활성화 기술에 의해 고효율로 단편화될 수 있다. 이어서, 타입 II의 변형된 뉴클레오티드를 여전히 함유하는 생성된 단편 이온이 선택되고 타입 II의 활성화 기술에 의해 단편화되어, 뉴클레오티드 함량이 보다 용이하게 추정될 수 있는 하위 단편의 세트를 발생시킬 수 있다. 이러한 접근법은 변이 검출에 유용할 수 있다. 예를 들어, 500머 폴리뉴클레오티 드는 먼저 타입 I의 단편화 기술을 사용하여 10-50 단편로 단편화될 수 있다. 각 단편의 m/z (예측된 단편 세트의 질량과 비교할 때)는 변이가 이 단편에서 존재하는 경우 나타난다. 일단 변이를 함유하는 단편이 동정되면 단편 이온의 나머지는 이온 트랩핑 장치로부터 배출되는 한편, 중요한 단편 이온은 활성화에 도입된다. 이들 단편 이온의 단편화의 정도를 조절함으로써, 더 작은 DNA 단편의 세트가 발생되어 뉴클레오티드의 순서 및 변이의 위치가 결정될 수 있게 된다. 하나의 타입의 변형된 뉴클레오티드 및 한 단계의 단편화를 포함하는 접근법과 비교하여, 상기의 접근법은 프로세싱되어야 하는 많은 실험 단계 및 데이타의 양이 상당히 감소되는 이점을 갖는다. 하나의 타입의 변형된 뉴클레오티드 및 2 단계의 부분적인 단편화를 포함하는 접근법과 비교할 때, 상기 접근법은 제2 단계에서 단편화 효율이 보다 조절가능하므로 서열 갭의 기회를 감소시키는 이점을 갖는다.
상기 활성화의 반응식이 모든 종류의 질량 분광계에 적용될 수 있지만, 이온 트랩 질량 분광계(ITMS) 및 푸리에-변환 이온 사이클로트론 공명 질량 분광계(FT-ICRMS)가 특히 전자 포획, 광자 활성화 및 흑체 IR 조사 접근법에 적합하다.
C. 변형될 뉴클레오티드 혼입
변형된 뉴클레오티드의 폴리머라제 촉매작용된 혼입의 몇몇 예는 실시예 부분에 기재된다. 그러나, 하나의 특정 폴리머라제가 상기 모든 변형된 뉴클레오티드를 혼입시키지 않을 것이다. 또한, 특정 폴리머라제가 하나의 변형된 뉴클레오티드를 효율적으로 혼입할 수 있지만, 제1 변형된 뉴클레오티드에 바로 인접한 제2 변형된 뉴클레오티드를 혼입하는데 덜 효율적일 수 있다. 더욱이, 현재 이용가능 한 폴리머라제는 절단을 달성하기 위한 매우 편일한 방법으로 (상기 참조) 변형된 뉴클레오티드 또는 뉴클레오티드 쌍에서 절단을 유도하거나 수행할 수 없을 수 있다. 그러나, 본 발명의 변형된 뉴클레오티드 및 변형된 뉴클레오티드의 인접 쌍을 혼입하거나 변형된 뉴클레오티드 또는 이들 변형된 뉴클레오티드에서 특정 절단을 유도하거나 수행할 수 있는 폴리머라제를 획득하기 위한 몇몇 접근법이 있다.
적절한 능력을 갖는 폴리머라제를 발견하기 위한 하나의 접근법은 제한없이 RNA 폴리머라제, DNA 폴리머라제 및 역 전사효소를 포함한 천연 폴리머라제 중에서 고유한 다양성을 이용하는 것이다. 천연 폴리머라제는 비-천연 뉴클레오티드에 대해 상이한 친화도를 갖는 것으로 공지되어 있고, 목적하는 혼입을 수행하는 천연 폴리머라제가 동정될 수 있다. 몇몇 경우에서, 하나 이상의 비-천연 뉴클레오티드의 혼입과 관련하여 상이한 특성을 갖는 2개 이상의 천연 폴리머라제의 혼합물을 사용하는 것이 유리할 수 있다. 예를 들어, 문헌 (W. Barnes, Proc. Natl. Acad. Sci. USA, 1994, 91:2216-2220)에는 장쇄 DNA 주형의 중합을 개선하기 위해 3'-엑소뉴클레아제 활성을 갖는 열안정성 DNA 폴리머라제 및 Taq DNA 폴리머라제의 엑소뉴클레아제가 없는 N-말단 삭제 돌연변이체인 2가지의 폴리머라제를 사용하는 것이 보고되어 있다. 친열성 유기체로부터의 천연 폴리머라제는 열적 사이클링, PCR에 의한 증폭이 변형된 폴리뉴클레오티드를 생성하는 가장 편리한 방법인 경우 바람직한 폴리머라제이다.
다른 접근법은 특정 변형된 뉴클레오티드 혼입을 달성할 수 있는 폴리머라제의 합리적인 디자인에서 동정하거나 보조하기 위해 폴리머라제 구조-기능 관계의 현지식을 이용하는 것이다 (예를 들어, Delarue, M. et al., Protein Engineering, 1990, 3:461-467; Joyce, C. M., Proc. Nalt. Acad. Sci. USA, 1997, 94:1619-1622). 예를 들어, 데옥시리보-NTPs (dNTPs, 옥시리보 클레티드 스페이트)에 대한 특이성을 제공하면서 리보-NTPs (rNTPs)를 배제하는 DNA 폴리머라제의 아미노산 잔기가 약간 상세하게 조사되었다. 페닐알라닌 잔기 155 또는 몰로니 무린 백혈병 바이러스 역 전사효소는 리보-NTPs의 출입을 차단하는 입체적 장벽을 제공한다. E. Coli DNA 폴리머라제 l의 클레노우 단편의 페닐알라닌 잔기 762, 및 HIV-1 역 전사효소의 티로신 잔기 115는 유사한 역할을 한다. 몇몇 상이한 폴리머라제 중의 티로신의 돌연변이 또는 그의 등가는 뉴클레오티드에 대한 폴리머라제의 충실성 및 민감성을 변경하는 효과를 갖는다.
RNA 폴리머라제에서 상응하는 부위도 검토되었고, 리보-뉴클레오티드를 데옥시리보-뉴클레오티드로부터 구별하는데 유사한 역할을 하는 것으로 보인다. 예를 들어, T7 RNA 폴리머라제의 티로신 639의 페닐알라닌으로의 돌연변이가 rNTPs에 대한 폴리머라제의 특이성을 약 20배까지 감소시키고, rNTPs 및 dNTPs 사이의 Km 차이를 거의 제거하는 것으로 나타났다. 그 결과 돌연변이체 T7 RNA 폴리머라제는 혼합된 dNTPs/rNTP 사슬을 중합할 수 있다 (예를 들어, Huang, Y., Biochemistry, 1997, 36:13718-13728 참조). 이들 결과는 하나 이상의 변형된 뉴클레오티드를 용이하게 혼입하는 폴리머라제의 디자인에서 구조-기능 정보의 사용을 설명한다.
또한, 특정 아미노산의 화학적 변형 또는 부위 지정 돌연변이유발 또는 유전학적 엔지니어링은 특별한 특성을 갖는 잘린, 돌연변이 또는 키메릭 폴리머라제를 생성하는데 사용될 수 있다. 예를 들어, 화학적 변형은 T7 DNA 폴리머라제 (Sequenase (등록상표), Amersham)를 변형하는데 사용되어 비-천연 뉴클레오티드에 대한 가공성 및 친화도를 증가시켰다 (Tabor, S., et al., Proc. Natl. Acad. Sci. USA, 1987, 84:4767-4771). 마찬가지로, 부위 지정 돌연변이유발은 E. Coli DNA 폴리머라제 l (클레노우 단편)을 데옥시 및 디데옥시뉴클레오티드 사이에서 어떻게 구별하는가를 조사하는데 사용되었다 (Astake, M., et al., J. Mol. Biol. 1998, 278:147-165).
더욱이, 최적의 특성을 갖는 폴리머라제의 개발은 돌연변이된 폴리머라제에서 목적하는 특성을 명백하게 나타내는 분석과 조합된 하나 이상의 공지된 폴리머라제의 랜덤한 돌연변이유발에 의해 달성될 수 있다. 이러한 돌연변이유발을 수행하는데 특별히 유용한 과정은 "DNA 서플링(shuffling)"으로 불린다 (Harayama, S., Trends Biotechnol., 1998, 16:76-82 참조). 예를 들어, 단지 3개 라운드의 DNA 서플링을 사용하여 β-락타마제 활성에 대해 분석함으로써 야생형 유전자보다 항생물질 세포탁심에 대한 내성이 16,000배 큰 변이체가 생성되었다 (Stemer, W. P. C., Nature, 1994, 370:389-391).
본 발명의 변형된 뉴클레오티드 또는 변형된 폴리뉴클레오티드의 인접한 쌍을 효율적으로 혼입할 수 있는 폴리머라제를 생성하고 선택하는, 본 발명의 다른 일면인 신규한 과정은 하기 실시예 부분에서 기재된다.
D. 단편 분석
일단 변형된 뉴클레오티드 또는 뉴클레오티드들은 폴리뉴클레오티드에서 하 나 이상의 천연 뉴클레오티드를 부분적으로 또는 완전히 치환되었고, 생성된 변형된 폴리뉴클레오티드의 절단이 달성되면, 얻어진 폴리뉴클레오티드의 분석이 수행될 수 있다. 목표가 폴리뉴클레오티드의 완전한 서열화인 경우, 상기 변형된 뉴클레오티드의 폴리뉴클레오티드로의 부분적인 혼입 또는 완전히 변형된 뉴클레오티드 치환된 폴리뉴클레오티드의 부분적인 절단이 막삼-킬버트(Maxam-Gilbert) 또는 산저(Sanger) 과정을 사용할 때 얻어지는 것과 유사한 단편 래더를 생성하는데 사용될 수 있다. 이러한 경우에서, 서열화 래더는 슬랩, 모세관 또는 모형화된 겔 전기영동법을 사용하여 구성될 수 있다. 막삼-길버트 과정에 비해 본 발명의 방법의 이점은 변형된 폴리뉴클레오티드 중의 변형된 뉴클레오티드의 치환은 절단시 정확한 반면, 막삼-킬버트 반응에 의한 전장 폴리뉴클레오티드의 후합성 변형은 잘못되기 쉽다. 예를 들어, 잘못된 뉴클레오티드는 변형되고 따라서 잘못된 절단이 일어날 수 있거나 또는 의도된 뉴클레오티드가 전혀 변형되지 않아 절단이 일어날 것으로 예상된 곳에서도 절단되지 않을 수 있다.
산저 과정에 비해 몇몇 이점이 있다. 첫째, 전장 클론은 연장 후 및 절단 전에 정제될 수 있어, 폴리머라제 오류 또는 주형 제2 구조에 의해 야기되는 중단으로 인해 미숙하게 종결된 단편이 겔 전기영동 전에 제거되어 보다 깨끗한 절단 밴드를 생성할 수 있다. 실제, 이들이 변형된 뉴클레오티드를 함유하고,이들 정확하게 절단 단편이 전장 클론의 절단로부터 얻어지는 다른 단편을 간단히 증대시킨다면 미숙하게 종결된 폴리머라제 신장 단편은 그 자체 절단된다는 점에서 이러한 정제를 수행하는 것이 필요하지 않을 수 있다. 두번째, 화학적 방법은, 상이한 염 료 종결제 분자의 특성 또는 염료 변형된 디데옥시뉴클레오티드와 폴리머라제 주형 착물과의 상호작용에서의 상당한 차이가 생성된 서열 래더에서 불균일한 신호 세기를 야기하는 염료 종결제 서열화와 달리, 동일한 세기의 서열 래더 생성물을 생성한다. 이러한 차이는 오류를 유도하고 이형접합체 동정을 어렵게 한다. 셋째, 본원에 기재된 화학적 방법은, 실질적으로 짧은 간격에 걸쳐 표지된 단편을 유용하게 발생하는 산저 사슬 종결 방법과 대조적으로 다중 kb의 거리에 걸쳐 균일한 서열 래더를 생성한다. 이것은 도 17 및 18에서 입증된다. 장쇄 서열 래더의 생성은 제한 핵산중간분해효소 분해와 결합되어 장쇄 주형의 1X 서열화를 달성할 수 있다.
게놈 DNA 서열화에 대한 이러한 접근법의 유용성은 도 14에 기재되고 그의 실행은 도 15 및 16에 기재된다. 이들 방법은 제한없이 인간 게놈과 같은 반복 게놈의 서열화에서 특별한 유용성을 갖는다.
폴리뉴클레오티드 서열 결정을 위한 질량 분광법의 사용에 대해 본원에 기재된 방법의 특별한 이점은 특히 겔 전기영동에 비해 질량 분광계와 관련된 자동화, 저가, 재생력 및 속도이다 (예를 들어, Fu, D. J., et al., Nature Biochemistry, 1998, 16:381-384 참조). 따라서, 본 발명의 일부 측면이 겔 분석법을 사용할 수 있지만, 질량 분광계를 사용하는 것이 바람직한 실시태양이다.
2개 이상의 관련 폴리뉴클레오티드 사이의 변이의 검출이 목표일 때, 각각 약간의 또는 1 원자 질량 단위 (amu) 내에서 질량을 구별하는 질량 분광계의 능력은 이러한 검출을 비교되는 폴리뉴클레오티드의 완전한 뉴클레오티드 서열을 결정할 필요없이 허용하며; 즉, 올리고뉴클레오티드의 질량은 뉴클레오티드 함량을 제 공한다. 이러한 방법에서 질량 분광계의 사용은 본 발명의 또다른 일면을 구성한다.
변이의 화학적 성질을 동정하고 결정하기 위한 질량 분광계의 사용은 4개의 데옥시뉴클레오티드 및 그의 올리고머의 독특한 분자량 특성을 기초로 한다.
하기 표 2는 4개의 데옥시뉴클레오티드 모노포스페이트의 질량 차이를 나타낸다. 하기 표 3a는 뉴클레오티드 조성만으로 모든 가능한 2머, 3머, 4머 및 5머의 계산된 질량을 나타낸다. 알 수 있는 바와 같이, 121개의 가능한 2머내지 5머올리고뉴클레오티드 중 2개만이 동일한 질량을 갖는다. 따라서, 폴리뉴클레오티드의 절단에 의해 생성되는 모든 2머, 3머, 4머 및 2개 5머를 제외한 모든 5머의 뉴클레오티드 조성은 충분한 해상도를 갖는 기기를 사용하여 질량 분광계로 즉시 결정될 수 있다. 표 3a에서 질량의 경우, 1500 내지 2000의 해상도 (최대 높이의 절반에서의 전체 너비)를 갖는 기기가 충분하고, 10,000 이하의 해상도를 갖는 질량 분광계가 시판되고 있다. 그러나, 절단이 변형된 뉴클레오티드 치환의 모든 부위에서 수행될 때, 모든 가능한 2머, 3머, 4머등의 질량을 고려할 필요가 없다. 이것은, 임의의 절단 단편에서 절단 뉴클레오티드가 내부적으로 발생하지 않기 때문이다. 즉, G가 절단 뉴클레오티드라면 모든 생성된 절단 단편은 절단 메카니즘에 따라 0 또는 1 G이고, 1 G이면, 그 G는 절단 메카니즘에 따라 단편의 3' 또는 5' 말단에서 일어나야 한다. 다시 말하면 G가 존재하는 경우 그 단편이 필수적으로 내부 G에서 재단편화되기 때문에 단편에 대해 내부 G는 있을 수 없다. 따라서, 절단 화학물질이 모든 G-절단 단편의 양 말단 중 하나에 G를 잔류시킨다면, G의 질량은 각 단편의 질량으로부터 공제되고 생성된 질량은 비교될 수 있다. A, C 및 T에 대해서도 동일하게 행해질 수 있다. 하기 표 4는 하나의 뉴클레오티드 부족한 모든 2머 내지 7머의 질량을 나타낸다. 이 계산은 30머 이하의 폴리뉴클레오티드에 대해 수행되고, 이것은 질량 5000 Da 이하의 동중핵의 올리고뉴클레오티드 (각각 0.01 %내의 질량을 갖는 올리고뉴클레오티드)의 8세트만이 있다는 것을 보여준다. 동중핵의 올리고뉴클레오티드의 8 세트는 하기 표 3b에서 나타나있다. 표 3b는 세트 2를 제외한 모든 세트가 다중 G 잔기를 갖는 폴리뉴클레오티드를 포함하는 것을 나타낸다. 따라서, G에서의 절단은 하나, 0.01 %의 해상도를 갖는 질량 분광계에 의해 해상될 수 없는 d(T8) 대 d(C3A5)를 제외한 모든 동중핵의 질량을 제거한다. 그러나, C 또는 A 절단은 후자의 폴리뉴클레오티드를 제거한다.
표 4는 A 또는 T에서의 절단이 일정하게 가장 근접한 가능한 절단 단편 사이에서 보다 큰 질량 차이를 갖는 단편들을 생성한다는 것을 보여준다. A에서의 절단은 가장 근접한 단편 사이에서 5, 10, 15, 20 또는 25 Da의 질량 차이를 생성하는 반면, T에서의 절단은 약간 많은 동중핵의 단편의 희생에도 불구하고 8, 18 또는 24 Da의 질량 차이를 제공한다.
Figure 112001007374848-pct00108
Figure 112001007374848-pct00109
따라서, 주어진 표적 분석물 폴리뉴클레오티드의 경우, 그의 서열이 공지되어 있는 경우, 하나 이상의 염기 뉴클레오티드가 임의의 상기 혼동 인조물을 생성하는지를 결정할 수 있고, 이어서 실험 조건의 현명한 선택으로 그것들을 피하거나 해결할 수 있다.
상기 분석을 기초로, 상이한 구성원으로부터 2개 이상의 유사한 폴리뉴클레오티드 중 뉴클레오티드 서열에서 임의의 차이가 폴리뉴클레오티드의 절단에 의해 얻어지는 단편의 패턴에서의 차이 및 질량 스펙트럼에 나타난 질량의 차이를 야기한다는 것을 알 수 있다. 모든 변이는 2개의 질량 변화, 질량의 소멸 및 새로운 질량의 출현을 야기한다. 또한, 이중 스트랜드 폴리뉴클레오티드가 분석되거나 2개의 스트랜드가 독립적으로 분석되는 경우, 변이는 표적 DNA의 2개의 상보적인 스트랜드의 질량에서 변화를 야기하여 모두 4개 질량 변화를 야기한다 (각 스트랜드에서 질량의 소멸 및 질량의 출현). 질량 변화를 나타내는 제2 스트랜드의 존재는 변이의 존재의 유용한 내부 확증을 제공한다. 또한, 상보적인 스트랜드로부터의 단편에서의 질량 변화의 세트는 변이체의 성질에 관하여 추가의 정보를 제공할 수 있다. 도 27 내지 30은 트랜스페린 수용체 유전자 중의 변이체 위치인 변형된 dA에서 완전한 치환 및 절단 후 폴리뉴클레오티드의 양 스트랜드에 대해 질량 차이의 검출을 예시한다. 하기 표 5는 모든 가능한 점 돌연변이 (전이 및 전환)에 대한 상보적인 스트랜드에 대해 예상되는 질량 변화 세트를 보여준다. 일단 질량 스펙트럼이 얻어지면, 즉각적으로 변이가 하나 이상의 뉴클레오티드의 단편으로의 첨가 (단편 질량에서 대략 300+a.u. 증가), 단편으로부터의 하나 이상의 뉴클레오티드의 삭제 (단편 질량에서 대략 300+a.u. 감소), 또는 하나 이상의 뉴클레오티드의 하나 이상의 다른 뉴클레오티드에 대한 치환 (표 5에서 나타난 바와 같은 차이)인지 명백해진다. 더욱이, 변이체가 치환인 경우 그 치환의 정확한 성질이 또한 확인될 수 있다.
Figure 112001007374848-pct00110
Figure 112001007374848-pct00111
Figure 112001007374848-pct00112
E. 연속 절단
상기 논의는 임의 주어진 변형된 폴리뉴클레오티드와 하나의 절단 반응의 사 용에 대해 주로 촛점이 맞춰진다. 그러나, 또한 2개 이상의 천연 뉴클레오티드가 상이한 절단 특성을 갖는 2개 이상의 변형된 뉴클레오티드로 치환된 폴리뉴클레오티드를 연속적으로 절단하는 것이 가능하며 이것도 본 발명의 다른 일면이다. 즉, 완전히 또는 부분적으로 치환된 2개 이상의 변형된 뉴클레오티드를 함유하는 폴리뉴클레오티드는 상이한 절단 조건, 화학적 또는 물리적 또는 둘다에 연속적으로 노출되어 절단될 수 있다. 이 접근법의 하나의 바람직한 실시태양은 직렬식 질량 분광법으로서, 여기서 하나의 과정에 의해 생성되는 단편화된 분자 종은 활성화 및 제2 변형된 뉴클레오티트에서의 절단을 야기하는 제2 물리/화학적 과정에 후속적으로 노출되는 동안 적절한 질량 분광계 (예, 푸리에-변환 이온 사이클로트론 공명 질량 분광계 또는 이온 트랩 질량 분광계)에서 보유될 수 있다. 생성물은 제3 및 제4 뉴클레오티드에 대한 특정 변형이 행해지는 제3 및 제4 절단 조건에 도입되어 주입 (전구체) 이온 및 절단의 각 라운드 동안 발생하는 것 사이의 전구체-생성물 관계를 관찰할 수 있다. 효율을 증가시키는 절단 조건의 연속 또는 단계식 구배의 사용은 이온들 사이의 전구체-생성물 관계의 해명을 촉진시키는데 사용될 수 있다.
다중 변형된 뉴클레오티드를 함유하는 폴리뉴클레오티드의 생성은 각각 상이한 단일 변형된 뉴클레오티드를 갖는 폴리뉴클레오티드의 세트, 즉 A에서의 절단을 위한 하나, G를 위한 하나, T를 위한 하나 및 C를 위한 하나를 생성하기 위한 동일한 주형에 대한 다중 중합을 수행할 필요를 감소시킨다. 또한, 단일 포리뉴클레오티드의 상이한 뉴클레오티드에 대해 특이적인 절단 과정의 연속 적용은 전구체-생성물 관계의 검출을 증가시키고, 이것은 DNA 서열을 결정하는데 유용하다. 도 21 은 dGTP에 대한 리보 GTP 및 dTTP에 대한 5'-아미노-TTP의 완전한 치환, 이어서 G에서의 절단을 야기하는 염기로의 절단 또는 T에서의 절단을 야기하는 산으로의 절단에 의해 변형되는 폴리뉴클레오티드의 생성을 보여준다. 후속해서 염기로 절단된 단편을 산으로 처리하거나 산으로 절단된 단편을 염기로 처리하면 이중 (G 및 T) 절단된 단편으로 추가로 단편화된다. 이것은 예를 들어 제한적이지 않고 서열의 27 위치 (dA)에서 변이를 동정하는데 유용하다 (도 21). 즉, 도 21에서 나타낸 바와 같이, G 단독에서의 절단은 단편 ACTTC A CCG (위치 27이 하이라이트됨)을 생성하고, 이것은 2개의 dA 잔기를 함유한다. -24 Da의 단편의 질량 변화는 A에서 C로의 변화를 표시하고, 이것은 2개 dA 잔기가 dC로 변화되는 결정을 허용하지 않는다. 유사하게, 3개의 dA 잔기를 함유하는 단편 TC A CCGGCACCA를 제공하는 T 단독에서의 절단은 또한 dA가 변화는 결정을 방지한다. 그러나, G 및 T에서의 이중 절단은 단편 TC A CCG를 생성하고, 이것은 -24 Da 질량 이동을 행하고, 하나의 dA를 함유하기 때문에 변이체 뉴클레오티드의 한정된 할당을 허용한다. 다른 뉴클레오티드에서 변이를 정확하게 검출하기 위해 이 접근법을 사용한 설계는 본원의 개시를 기초로 당업자에게 명백하고 본 발명의 범주내에 든다.
본 발명의 다른 일면은 질량 분광법으로부터 변이의 존재 또는 DNA 서열을 직접 추정하기 위해 컴퓨터의 사용을 허용하는 연산 또는 연산(들)이다.
F. 평행 절단
각각 상이한 절단 과정에 영향받기 쉬운 경우 2개 이상의 변형된 뉴클레오티드로 치환된 폴리뉴클레오티는 평행한 방식으로 분석될 수 있다는 것도 가능하며, 이것은 본 발명의 다른 일면이다. 즉, 폴리뉴클레오티드를 분취액으로 나누고 각 분취액을 변형된 뉴클레오티드 중 하나에 특이적인 절단 과정에 노출시킬 수 있다. 이것은 변형된 뉴클레오티드 각각에 대한 독립적인 중합 반응을 수행하는 노력을 덜어준다. 이 접근법은 서열 래더를 발생시키거나 변이 검출을 위한 완전한 절단 생성물을 발생시키는데 사용될 수 있다. 실시예 5에서 알 수 있는 바와 같이, 2개의 상이한 뉴클레오티드에서 완전한 절단 (독립적으로 수행됨), 이어서 질량 분광법은 실질적으로 단일 뉴클레오티드에서의 절단과 비교하여 변이 검출의 효율을 증가시킨다.
예를 들어, 리보-A, 5'-아미노-C, 및 5'-(가교)티오-G 뉴클레오티드로 치환된 단일 폴리뉴클레오티드를 생각하보자. 모든 3개의 변형된 뉴클레오티드는 폴리머라제에 의해 혼입되는 것으로 공지되어 있다. 서열 래더는 하나의 분취액을 산에 노출시켜 C에서의 절단을 야기하고, 제2 분취액을 염기에 노출시켜 A에서의 절단을 야기하고 제3 분취액을 은 또는 수은 염에 노출시켜 G에서의 절단을 야기시킴으로써 변형된 뉴클레오티드로부터 생성될 수 있다. 상기 3개의 변형된 뉴클레오티드와 4'-C-아실 T로 생성된 폴리뉴클레오티드는 또한 (별도로) UV광에 노출시켜 T에서 절단을 생성함으로써 단일 중합 생성물로부터 서열화 반응의 완전한 세트를 형성하는 것이 가능하다.
G. 변형된 뉴클레오티드 절단 및 사슬 종결의 조합
변형된 뉴클레오티드 혼입 및 절단의 다른 적용은 사슬 종결 과정과 조합하는 것이다. 하나 이상의 변형된 뉴클레오티드을 상이한 사슬 종결 뉴클레오티드, 예를 들어 디데옥시-G와 함께 중합 과정에 혼입함으로써 (예를 들어 제한없이, 변형된 A), 디데옥시-뉴클레오티드에서 종결하는 단편의 산저형 래더가 발생될 수 있다. 변형된 A에서 절단시키는 화학물질에 상기 단편의 래더를 후속적으로 노출시키면 5' 내지 A 및 3' 내지 A (대부분의 시간) 또는 G (사슬 종결 생성물 당 하나의 단편 중에)을 갖는 추가의 단편화를 야기한다. 변형된 뉴클레오티드에서 치환 및 절단에 의해서 단독으로 생성되는 단편 세트와 생성된 단편 세트의 비교는 유익한 비교를 제공한다. 모든 단편은 3' G에서 종결되는 사슬 종결 세트에서 여분의 단편의 존재를 제외하고 동일하고, 이것은 질량 분광분석시 개입되는 A없이 A가 (직접 또는 약간의 간격 뒤에) G에 의해 이어지는 모든 단편의 질량 (및 이에 의해 뉴클레오티드 함량)을 제공한다. 다른 사슬 종결 뉴클레오티드 및 다른 절단 뉴클레오티드를 사용한 유사한 데이타의 편차는 중합 생성물이 서열을 결정하는데 유용한 데이타 세트를 누적하여 제공한다.
H. 절단 저항성인 변형된 뉴클레오티드 치환 및 질량 이동하는 뉴클레오티드
본 발명의 상기 실시태양은 주로, 비변형된 뉴클레오티드와 비교하여, 폴리뉴클레오티드가 변형된 뉴클레오티드(들)의 혼입의 부위(들)에서 절단하는 민감성을 증가시키는 효과를 갖는 하나 이상의 뉴클레오티드의 폴리뉴클레오티드로의 치환에 관한 것이다. 그러나, 폴리뉴클레오티드에 혼입될 때 변형된 뉴클레오티드는 비변형된 부위와 비교하여, 변형된 뉴클레오티의 혼입 부위에서 절단에 대한 민감성을 감소시키는 것은 전적으로 가능하며, 이것은 본 발명의 또다른 일면이다. 이러한 플롯에서 절단은 폴리뉴클레오티드 중의 비변형된 부위에서 일어난다. 별법 으로, 절단 저항성 및 절단 민감성인 변형된 뉴클레오티드는 동일한 폴리뉴클레오티드에 혼입되어 절단이능한 부위 및 절단불가능한 부위 사이에서의 차이를 최적화할 수 있다.
절단에 대한 이러한 유형의 저항성을 부여하는 변형된 뉴클레오티드의 예는 임의 천연 뉴클레오티드의 2'-플루오로 유도체이다. 2'-플루오로 유도체는 비치환된 천연 뉴클레오티드보다 질량 분광계에서 단편화에 대해 실질적으로 덜 민감한 것으로 나타났다.
표 2에 나타낸 바와 같이, 천연 뉴클레오티드 사이의 질량 차이는 9 내지 40 Da 범위이고, 25 머 크기 이하의 모든 단편에서 단일 뉴클레오티드 차이를 해상하는데 충분하다. 그러나, 질량 분광계에 의한 검출을 단순화하기 위해 4개의 뉴클레오티드 사이 또는 임의 뉴클레오티드의 쌍 사이의 질량 차이를 증가시키는 것이 바람직할 수 있다. 이것은 표 2에서 dA 및 그의 2-클로로아데닌 유사체에 대해 설명되고 있다. 즉, 2-클로로아데닌으로의 치환 (질량 347.7)은 A-T 질량 차이를 9 Da에서 42.3 Da으로, A-C 차이를 24에서 57.3 Da으로, A-G 차이를 16에서 17.3 Da으로 증가시킨다. 기타 질량 이동하는 뉴클레오티드 유사체는 당업계에 공지되어 있고, 이들이 본 발명의 질량 분광법으로 유리하게 사용될 수 있는 것은 본 발명의 일면이다.
I. 적용
본 발명의 방법의 다수의 적용은 하기 기재된다. 이들 기재는 단지 예시적인 것이고 이들이 어떠한 임의의 방식으로 본 발명의 범주를 제한거나 제한하려고 의도되거나 해석되면 안된다는 것을 이해해야 한다. 따라서, 본원에 기재된 방법의 다른 적용은 본원 개시를 기초로 당업자에게 명백할 것이며, 이러한 적용은 본 발명의 범주내에 든다.
a. 완전 치환, 완전 신장 및 완전 절단
표적 폴리뉴클레오티드를 구성하는 4개의 뉴클레오티드 중 적어도 하나는 변형된 뉴클레오티드로 완전히 치환되는 (프라이머 신장을 이용하여 한 스트랜드 상에서 또는 DNA 증폭 과정을 이용하여 양쪽 스트랜드 상에서) 본 발명의 한 일면에서, 전장 뉴클레오티드가 제조되고 실질적으로 완전한 절단이 수행된다. 그 결과, 길이에서 4개의 뉴클레오티드를 평균한 단편으로 변형된 뉴클레오티드가 절단된다. 이것은, 다량의 A, T, G 및 C 뉴클레오티드가 대부분의 게놈에서 대충 동등하고 이들의 분포가 반정도 랜덤하기 때문이다. 따라서, 특별한 뉴클레오티드는 천연 뉴클레오티드에서 4개의 뉴클레오티드 마다 대략 1회 일어난다. 물론, 생물학적 폴리뉴클레오티드의 서열의 비-랜덤한 성질 및 A:T 대 G:C 염기쌍의 상이한 게놈에서의 비동등한 양으로 인해 평균 크기로부터 상당한 편차를 갖는 크기 분포를 갖는다. 신장된 프라이머 (프라이머 신장 또는 증폭)는 프라이머 말단 뒤 변형된 뉴클레오티드가 처음 발생될 때까지 절단되지 않아 15 nt보다 큰 (즉, 프라이머의 길이보다 큰) 단편을 생성한다. 종종, 이들 프라이머 함유 단편은 생성되는 가장 큰 것이거나 가장 큰 것 중의 것이다. 이것은 유전형 분석의 디자인에서 유리할 수 있다. 즉, 프라이머는 다형 뉴클레오티드 위치의 제1 발생이 프라이머 뒤가 되도록 디자인될 수 있다. 절단 후, 유전형은 프라이머 함유 단편의 길이로부터 결정될 수 있다. 이것은 도 27 내지 32에서 설명된다. 분석물 질량의 크기에서 이러한 변이로 인해, 질량 분광계로 각 질량의 뉴클레오티드 함량의 명확한 결정과 일치하는 해상도 및 질량 정확도의 수준으로, 20 머 이하 또는 30 머 이하의 범위의 폴리뉴클레오티드를 검출할 수 있다는 것이 필수적이다. 하기 논의되는 바와 같이, 이러한 필요조건은 분석물 폴리뉴클레오티드의 뉴클레오티드 서열이 이미 공지되어 있는지 (일반적으로 변이 검출 또는 유전형 결정에 있어서) 또는 공지되지 않었는지 (새로이 DNA 서열화하는 경우일 때)에 따라 상이한 연관성을 갖는다.
i. 변이 검출에 대한 적용
변이 검출은 일반적으로, 하나 이상의 대조 서열이 이용가능한 분석물 DNA 또는 cDNA 서열에 대해 수행된다. 변이 검출의 대상은 대조 서열 및 샘플 서열 사이 또는 샘플 서열들 사이의 서열 차이를 동정하기 위해 상이한 개체들 (샘플 서열들)로부터 상응하는 서열의 세트를 조사하는 것이다. 이러한 서열 변이는 절단된 샘플 폴리뉴클레오티드 사이의 상이한 질량의 존재에 의해 동정되고 특성화된다.
변이 검출 과정의 범위에 따라, 상이한 길이의 분석물 단편은 최적이 될 수 있다. 유전형의 경우, 하나의 프라이머는 공지된 변이체 부위와 인접한 것이 바람직하다.
일반적으로, 50개 이상의 뉴클레오티드, 보다 바람직하게는 100개 이상의 뉴클레오티드, 보다 더 바람직하게는 200개 이상의 뉴클레오티드의 분석물 단편은 변형된 뉴클레오티드 (A, G, C 또는 T)의 폴리머라제 혼입, 이어서 변형된 뉴클레오티드 혼입 부위에서의 절단, 및 얻어진 생성물의 질량 분광분석에 의해 생성된다. 뉴클레오티드 변이의 빈도 (인간 게놈에서 200 중 하나 내지 1000 중 하나로 평가됨)가 제공되면 일반적으로, 임의 2개의 샘플 사이에 상이한 영 또는 하나 또는 2개의 절단 단편이 있다. 샘플 중 상이한 단편은 단량체 내지 10 머, 덜 빈번하게 20 머 이하의 크기 범위일 수 있고, 드물게 매우 큰 길이의 단편일 수 있으나, 상기 알 수 있는 바와 같이 평균 절단 단편은 약 4개의 뉴클레오티드이다. 대조 서열에 대한 지식을 사용하여 매우 큰 절단 생성물을 발생하는 절단 반응식을 피하고, 보다 일반적으로 하기 개략된 바와 같은 모든 가능한 절단 반응식에 대해 각 뉴클레오티드 위치에서 변이 검출의 효율을 산정함으로써 샘플 중에 존재할 수 있는 임의 서열 변이의 검출력을 증가시킬 수 있다. 그러나, 큰 서열은 대조 서열이 이용가능하고 분석물 단편 길이가 단지 수백개의 뉴클레오티드인 경우 실질적으로 문제가 아니다. 이것은, 임의 분석물 단편이 크기에서 인접한 2개의 큰 절단 질량을 함유하는 것은 거의 불가능하기 때문이다. 일반적으로, 약간 큰 단편인 경우, 이들은 용이하게 동정될 수 있으며, 표 5에 나타낸 바와 같이, 단지 1000의 질량 해상할 수 있는 MALDI 기기를 사용하여도 가장 어려운 치환인 9 amu 이동을 야기하는 A <-> T 변화는 27 머으로 검출될 수 있다.
Figure 112001007374848-pct00113
성공 가능성을 극대화시키는 변이 검출을 위한 실험 조건을 선별하기 위해, 참조 서열을 사용하여 실험에 앞서 A, G, C 또는 T에서 절단에 의해 생성될 단편을 예측할 수 있다. 이러한 분석에 기초하여, 분석할 각 DNA 또는 cDNA 서열을 위해 최적으로 변형된 뉴클레오타이드 치환 및 절단 도식을 선별할 수 있다. 이러한 분석은 다음과 같이 수행할 수 있다:
·시험 폴리뉴클레오타이드의 각 뉴클레오타이드에 대해, 3개의 가능한 다른 뉴클레오타이드 각각을 치환하여 결합된 질량 변화를 일으킨다. 예를 들면, 1 위 치에서 시험 폴리뉴클레오티드가 A로 시작한다면, 이어서 T, G 및 C로 시작하는 가정의 폴리뉴클레오티드를 생성한다. 그 다음 시험 서열의 2 위치로 옮겨 다시 3개의 가능한 모든 치환을 수행하는 등 시험 폴리뉴클레오티드의 모든 위치에서 이를 수행한다. 시험 폴리뉴클레오티드에 100개의 길이의 뉴클레오티드가 있다면, 이러한 절차에 의해 하나의 스트랜드위에 전부 300개의 새로운 가정의 단편이 생성될 것이고, 상보적 스트랜드에서 또다른 300개의 새로운 가정의 단편이 생성될 것이다. 이어서, 3개의 치환의 각 세트를 함께 분석할 수 있다.
·1 위치에서 A에 T, C 또는 G를 치환하여 얻은 3개의 새로운 가설 시험 단편 각각의 T, C, G 또는 A에서 절단하여 얻을 질량를 생성한다. 이 질량 셋트를 참조 서열(예를 들면, 1 위치에 A를 가짐)로 부터 얻은 질량 셋트와 비교한다. 4개의 절단부(T, C, G, A)의 각각에서, 존재하는 질량의 실종 및 새로운 질량의 출현에 의해 전체 질량 세트에서 차이를 유발시키는지를 결정한다. 차이가 생긴다면, 하나의 차이인지 2개의 차이인지(즉, 하나의 질량의 실종 및 또다른 질량의 출현)를 결정한다. 또한, 참조 서열의 절단에 의해 생성된 질량 셋트와 비교하여 질량의 차이 정도를 결정한다. 시험 서열의 100 위치의 각각에 대해 상기와 같은 분석을 수행하고, 각각의 경우에서 4가지 가능한 염기 특이적 절단(즉, DNA의 경우, A, C, G 및 T에서)의 각각의 결과를 조사한다.
·4가지 가능한 염기 특이적 절단 각각의 상관 점수를 만든다. 상관 점수는 하나 이상의 질량 변화를 유발하는 참조 서열로부터의 300개의 가능한 변화에 비례하게 증가하고(즉, 2개의 질량 차이에서 상관 점수가 더 높다), 질량 차이의 양에 비례하게(질량 차이가 작은 것보다 클수록 크다) 증가한다
·프라이머 연장의 경우, 하나의 스트랜드에 대해 분석을 수행하고; 증폭의 경우, 두개의 스트랜드의 절단 생성물에 대해 계산한다.
상기 방법은 치환 및 절단을 조합 사용하는 것까지 확대될 수 있다. 예를 들면, 분석물 폴리뉴클레오티드의 각각의 스트랜드상에서 T 절단(T에서 두 스트랜드 모두의 독립적인 절단 또는 동시 절단)하거나, 또는 하나의 스트랜드상에서 T 및 A에서 절단(다시한번 언급하면, 두 스트랜드 모두의 독립적인 절단 또는 동시 절단)하거나 또는 하나의 스트랜드를 T로 절단하고, 상보적 스트랜드를 A로 절단하는 등이다. 상이한 도식 각각에 대해 생성된 상관 점수를 기초로 하여, 실험에 앞서 최적 도식을 결정할 수 있다.
상기 임무를 수행할 컴퓨터 프로그램을 제작할 수 있다. 이러한 프로그램은 또한 실험적 절단 질량의 분석을 포함하도록 확대될 수 있다. 즉, 프로그램이 실험적으로 결정된 질량 스펙트럼에서의 모든 질량와 참조 서열의 절단으로부터 예상된 절단 질량를 비교하고, 임의의 새로운 또는 실종 질량를 알리도록 제작할 수 있다. 새로운 질량 또는 실종 질량가 있다면, 실험 질량 셋트를 실험 절단 조건과 결합된 모든 가능한 뉴클레오티드 치환, 삽입 또는 결실의 컴퓨터 분석에서 생성된 질량와 비교할 수 있다. 그러나, 뉴클레오티드 치환이 삽입 또는 결실보다 약 10배 더 혼하므로 치환 분석만이 유용하다. 하나의 실시태양에서, 모든 가능한 뉴클레오티드 삽입, 결실 및 치환에 대한 컴퓨터 분석 데이터를 룩업 테이블(look-up table)에 저장할 수 있다. 실험 데이터와 부합되는 컴퓨터 질량 셋트는 신규한 변 이 서열의 서열을 제공하거나 또는 최소한, 신규 변이 서열의 제한된 가능한 서열셋트를 제공한다. (치환 위치 및 치환의 화학적 특성은 하나의 절단 실험으로 유일하게 특정될 수 없다.) 변이 샘플의 뉴클레오티드 서열에 관한 모든 불명료함을 해결하기 위해, 어떤 경우에는, 또다른 치환 및 절단 실험이 필요할 수 도 있고(후술하는 E 부분, 일련의 절단 및 DNA 서열화 적용 부분 참조), 또는 약간 다른 서열화 방법(예를 들면, 통상적인 서열화 방법 또는 혼성화에 의한 서열화)에 의해 해결할 수 있다. 모든 샘플에서 여러번의 상이한 치환 및 절단 시험을 통상적으로 수행하여 변이 분획을 최대하는 것이 유리할 수 있으며, 이를 특정 뉴클레오티드에게 정밀하게 지정할 수 있다.
본 발명의 발명자들은 50, 100, 150, 200 및 250개의 뉴클레오타이드로 된 천연 폴리뉴클레오티드를 컴퓨터 분석하여 2개의 뉴클레오타이드 절단물(예를 들면, 하나의 스트랜드상의 A 및 상보적 스트랜드상의 G에서 절단)의 조합이 99 내지 100% 검출 효율을 야기시키는 것으로 밝혀져 250 nt 이하에서 모든 가능한 치환을 고려할 수 있다. 잠재적으로 유용하지만 때때로 100% 미만의 감도를 가진 분석을 1000 nt 이하의 더 긴 단편에서 수행할 수 있다. 이 분석에 대한 상세한 사항은 실시예 5를 참조하시오.
ii. DNA 서열화에 대한 적용
본 발명의 또다른 측면은 폴리뉴클레오타이드의 완전한 뉴클레오티드 서열을 새로이 결정하기 위해 본원에 기술된 화학적 방법을 질량 분광분석법과 함께 사용하는 것이다. 이 절차는 변이 검출을 위해 상기에서 기술한 것과 같은 방법을 포 함한다; 즉, 폴리뉴클레오티드에서 4개의 뉴클레오타이드중 하나를 변형된 뉴클레오타이드로 완전 치환한 후 변형된 뉴클레오티드의 각각의 발생 지점에서 및 발생 지점 마다 변형된 폴리뉴클레오티드를 실질적으로 완전히 절단하고 및 이어서, 수득된 단편의 질량을 측정하는 것을 포함한다. 그러나, 이 경우, 4개의 절단 반응 셋트를 통상적으로 수행하는 것이 필수적이며, 상이한 천연 뉴클레오티드를 각각의 반응에서 변형된 뉴클레오티드로 치환하여 모든 4가지 천연 뉴클레오티드를 차례로 변형된 뉴클레오티드로 치환하고, 생성된 변형 폴리뉴클레오티드를 절단하고, 절단 생성물의 질량을 측정할 수 있다. 또한, 전술한 바와 같이, 1 이상의 다중 뉴클레오티드 치환을 수행하여 발생할 수 있는 서열화의 불명료함을 해결할 수 있다. 서열 측정 실험당 필요한 반응 횟수는 막샘-길버트 또는 생어 서열화에 필요한 수와 유사하지만, 본 발명의 방법은 방사능표지 또는 염료를 배제하여 우수한 속도 및 정확성을 제공하고, 자동화를 허용하고, 막샘-길버트 및 생어 서열화 또는 임의의 다른 겔 기재 방법과 관련된 압축을 포함하는 가공품을 배제하는 잇점이 있다. 상기 후자의 고려사항은 질량 분광분석법이 현재의 겔 전기영동 절차의 경우 수 시간과 비교하여, 수 초에서 수분의 범위내(및, 앞으로는 밀리초)로 절단 반응 분석을 허용할 것이기 때문에 탁월한 중요성을 가질 수 있다. 더욱더, 본 발명의 방법을 사용하여 이룩할 수 있는 변형된 폴리뉴클레오티드의 제작에 대한 제어와 함께 질량 분광분석법의 고유한 정밀도는 과잉 서열화에 대한 필요를 급격히 감소시킬 것이다. 대표적인 전체 서열화 실험을 하기 실시예 부분에 나타낸다.
분석물 분자를 절단하여 얻은 질량 패턴으로부터 DNA 서열을 추론하는 방법 은 서열 변이의 화학적 특성을 검출하고 추론하는 방법보다 상당히 더 복잡하다. 완전 절단 및 질량 분석에 의해 서열화하는 경우, 다음 과정을 수행해야 한다:
·서열의 길이를 측정한다. 실험적으로 측정한 질량으로부터 본원의 다른 곳에서 논의한 바와 같은 각각의 절단 단편의 뉴클레오티드 함량을 추론한다. 이 분석은 실험 절단 질량의 4개의 셋트 각각에 대해 수행한다. 이 분석의 단점은 둘 이상의 단편(특히, 짧은 것)이 동일한 질량을 가질 수 있고, 그러므로 하나로 계산될 수 있어서 서열 길이를 적게 계산할 수 있다는 것이다. 그러나, 이것은 단편의 질량을 합하여 4개의 모든 절단물과 비교할 수 있다는 점에서 심각한 실험 문제는 아니다; 만일 이들이 같지 않다면, 이어서 단편중에서 둘 이상의 중첩 질량이 있어야한다. 따라서, 모든 4개의 절단 반응에서 모든 단편의 질량을 측정하여 잠재적인 오차의 원인을 본질적으로 감소시킨다. 먼저, 가장 큰 길이를 제공하는 절단 질량의 셋트를 출발 지점으로 취할 수 있다. 그 다음, 다른 3개의 절단 반응에서 모든 질량의 뉴클레오티드 함량이 가장 큰 길이 절단 셋트와 결합된 질량중 임의의 질량의 뉴클레오티드 함량과 양립하는지 여부를 시험할 수 있다. 이들이 양립하지 않는다면, 가장 큰 길이와 결합된 셋트에서도 빠뜨리고 센 것이다. 서열 함량의 비교는 계산하지 않은 염기를 일반적으로 확인할 수 있도록 허용하여 서열의 전체 길이를 측정할 수 있도록 한다.
·분석의 다음 특징은 하기 (a) 내지 (d)를 포함할 수 있다: (a) 각각의 절단 생성물의 크기를 기초로 하여 A, C, G 및 T 뉴클레오티드가 발생해야 하는 간격을 측정하고; (b) 각각의 절단 셋트로부터의 가장 큰 단편의 뉴클레오티드 함량을 함께 속하는 뉴클레오티드의 셋트를 확인하고; (c) 상이한 셋트사이의 단편의 뉴클레오티드 함량을 비교하여 어느 단편이 양립하는지(즉, 하나가 다른 것안에서 포함되는지 또는 이들이 겹칠 수 있는지) 또는 양립하지 않는지(공통의 뉴클레오티드가 없음)를 측정하고; (d) 이들 상이한 분석 결과를 적분하여 단편들이 함께 결합될 수 있는 방법의 수를 한정한다. 가능성의 배제는 가능한 관계의 확인에 유용하다. 짧은 올리고뉴클레오티드의 서열을 합하는데 필요한 로직의 상세한 설명을 실시예 4에 나타내었다.
국소 서열 관계에 대한 추가의 정보를 제공하는 한가지 방법은 불완전하게(그러나 여전히 실질적으로) 절단된 단편 셋트를 얻기 위해 뉴클레오티드의 치환 정도 또는 절단의 완성도(하기 참조)를 감소시키는 것이다. 이러한 단편의 질량 분석은 어느 단편이 서로 인접해 있는지 확인하는데, 완전히 절단된 단편 셋트와 결합하여 대단히 유용할 수 있다. 제한된 상기 정보가 절단 단편을 연속 서열로 조립하는 전체 퍼즐을 완성하는데 필요하다.
완전 치환 및 절단 질량의 분석으로부터 DNA 서열의 추론을 보강하는 3가지 추가의 방법은 (a) 디뉴클레오티드 절단 질량(하기 참조)의 분석, 이것은 모노뉴클레오티드 치환 및 절단과 결합된 작은 질량을 더 작은 중간 크기의 컬렉션으로 구분짓는 뼈대를 제공할 수 있다. 디뉴클레오티드 절단은 또한 사실상 전체 서열을 따라 군데 군데 디뉴클레오티드 서열의 위치를 제공하고, 모든 가능한 디뉴클레오티드에서 디뉴클레오티드 절단은 다른 DNA 서열화 방법이다; (b) 단편 길이 및 중첩물에 대한 가치있는 보충 정보를 제공할 수 있는, 하나 이상의 변형된 뉴클레오 티드를 사용하는 상보적 스트랜드의 모노뉴클레오티드 치환 및 절단; (c) 동시의 디 및 모노뉴클레오티드 절단 또는 2개의 상이한 동시 모노뉴클레오티드 절단을 사용하여 치환 및 절단 도식을 조합하여 서열 규칙에 대한 명백한 정보를 제공할 수 있다.
전술한 기술에서는, 변형된 뉴클레오티드가 3개의 변형되지 않은 뉴클레오티드보다 적절한 조건하에서 선택적으로 더 화학적 절단을 받기 쉽다고 추정되었다. 그러나, 모노뉴클레오티드 절단을 이룩하는 다른 시도는 변형되지 않은 천연 뉴클레오티드에서 절단을 유도하기에 충분한 화학적 또는 물리적 조건하에서 절단에 저항하는 3개의 변형된 뉴클레오티드를 사용하는 것이다. 따라서, 본 발명의 또다른 특징으로, 변형되지 않은 뉴클레오티드에서 선택적인 절단에 의해 모노뉴클레오티드 절단을 이룩할 수 있다. 질량 분석분석법 분석을 수행하는 중에 단편형성에 대해 더욱 안정하게 만드는 것으로 나타난 뉴클레오티드의 한가지 화학적 변형은 2'-플루오로 변형이다(오노 티(Ono, T., et al.)의 문헌[Nucleic Acids Research, 1997, 25: 4581-4588] 참조). 생어 서열화 반응에서 얻을 수 있는 질량 범위를 확장시키는데 2'-플루오로 치환된 DNA의 활용(일반적으로 단편형성에 의해 제한됨)이 인식되었지만, 상기 화학이 또한 특정 물리적 또는 화학적 절단 과정에 저항하는 3가지 변형된 뉴클레오티드를 완전히 치환함으로써 뉴클레오티드 특이성 절단을 이룩하는데 유용하다는 것이 본 발명의 특징이다. MALDI-MS중에서 뉴클레오티드의 안정성을 증가시키는 것으로 나타난 또다른 화학적 변형은 아데닌 및 구아닌의 7-데아자 유사체이다. (슈나이더 및 체이트(Schneider, K. and Chait, B.T.)의 문헌[Nucleic Acids Research, 1995, 23: 1570-1575] 참조)
본 발명의 또다른 특징으로, 절단 단계에서 고도의 선택성을 이룩하기 위해 절단 저항성 변형된 뉴클레오티드를 절단에 민감한 변형된 뉴클레오티드와 함께 사용할 수 있다.
iii. 유전자형 측정에 적용
다양한 종으로부터 DNA 서열 데이터를 모으기 때문에, 특정 뉴클레오티드에서 변이(다형성 또는 돌연변이)가 이미 발견된 생물학적 샘플에서 특정 뉴클레오타이드 또는 뉴클레오타이드들의 상태를 측정하는 정밀하고, 높은 처리량, 자동화 및 저렴한 방법에 대한 수요가 증가하고 있다. 이러한 절차(DNA 서열에서 특정 위치에서 뉴클레오티드의 측정)를 유전자형 측정으로 부른다. 유전자형 측정은 많은 점에서 DNA 서열화의 특별한 경우(또는 단지 하나의 위치만이 의심스러운 경우의 변이 검출)이지만, 단 하나의 뉴클레오티드 위치의 서열이 측정된다. 단 하나의 뉴클레오티드 위치를 분석해야 하기 때문에, 유전자형 측정 방법은 DNA 서열화 방법과 전적으로 중첩되지 않는다. 본 발명의 방법은 신규하고 유용한 유전자형 측정 절차에 대한 기본을 제공한다. 이 방법의 기본은 다형성 부위에 걸쳐있는 폴리뉴클레오티드의 중합이다. 중합은 PCR 방법에 의하거나 또는 프라이머 연장에 의해 이룩될 수 있지만 PCR이 바람직하다. 중합은 3개의 천연 뉴클레오티드 및 하나의 화학적으로 변형된 뉴클레오티드의 존재하에서 수행하므로 화학적으로 변형된 뉴클레오티드는 다형성 또는 돌연변이 부위에서 뉴클레오티드중 하나에 상응한다. 예를 들면, A/T 다형성을 유전자형 측정한다면, 절단 가능한 뉴클레오티드는 A 또 는 T일 수 있다. G/A 다형성을 유전자형 측정한다면, 절단 가능한 뉴클레오티드는 A 또는 G일 수 있다. 반대로, T 및 C가 반대로 A 및 G로 나타나는 상보적 스트랜드에 대해서도 분석을 준비할 수 있다. 후속단계로, 중합 생성물을 산, 염기로 처리하거나 또는 다른 절단 도식을 적용하여 화학적으로 절단한다. 이것은 2개의 가능한 대립유전자로부터 2개의 생성물을 야기하는데, 하나의 대립유전자의 다형성 부위에서 절단 가능한 뉴클레오티드가 존재하나 다른 것에는 존재하지 않은 결과 하나가 다른 것보다 더 길다. 질량은 변하나 길이는 변하지 않으며, 또한 반대 스트림에서 일어난다. 하나의 강제사항은 폴리뉴클레오티드를 생산하는데 사용된 프라이머중 하나는 프라이머의 말단 다음의 절단 가능한 뉴클레오티드가 다형성 부위에서 처음 발생하도록 위치해야 한다는 점이다. 이로인해 프라이머중 하나가 다형성 부위에 근접하는 것이 보통 필요하다. 다른 방법은 2개의 절단 가능한 뉴클레오티드, 즉 (+) 스트랜드상에 다형성 뉴클레오티드 및 (-) 스트랜드상에 다형성 부위를 동시에 혼입하는 것이다. 예를 들면, (+) 스트랜드상에 절단 가능한 dA를 혼입하고 (A-G 다형성을 측정), (-) 스트랜드상에 절단 가능한 dC를 혼입((+) 스트랜드상에 G 대립유전자의 존재를 양성적으로 측정)할 수 있다. 이 경우, 둘다의 프라이머는 변이 부위에 근접하는 것이 유리할 수 있다. 상이한 크기의 2개의 대립유전자 생성물은 모세관 전기영동과 같은 전기영동 수단(이에 제한되지 않는다)에 의해 분리할 수 있다. 이들은 또한 질량 분광분석법(이에 제한되지 않는다)을 사용하여 질량에 의해 분리할 수 있다. 추가로, 분석하는데 후술하는 FRET 분석을 사용할 수 있다. 이들 3가지 분석 포멧중 임의의 포멧은 당해 분야에 공지된 수단 에 의해 멀티플렉싱과 양립한다.
대립유전자 절단 생성물의 존재 또는 부재에 대한 FRET 검출을 수행하는 한가지 방법은 형광물질 또는 소광물질 잔기를 프로브에 도입하여 프로브가 비절단 스트랜드(다른 대립유전자를 나타냄; 여러가지 가능한 도식을 예시하는 도 2 참조)에 비해 절단 스트랜드(하나의 대립유전자를 나타냄)와 상이하게 혼성화하도록 한다. 이러한 차별적인 혼성화는 하나의 스트랜드가 적어도 하나 및 종종 여러개의 뉴클레오티드만큼 다른 것보다 더 길기때문에 쉽게 이룩할 수 있다. 형광 또는 소광 그룹이 절단 가능한 폴리뉴클레오티드를 (PCR 또는 프라이머 연장에 의해) 제조하는데 사용된 프라이머상에 또한 놓여 프로브상의 잔기와 프라이머상의 잔기간의 적절한 FRET 상호작용이 존재한다면, 즉, 2개의 잔기의 흡수 및 방출 파장이 부합하고, 2개의 잔기사이의 거리 및 배향이 당해 분야의 숙련가들에게 공지된 방법에 의해 최적화된다면, 이어서 프로브와 프라이머를 최대 혼성화 차별을 부여하는 온도에서 가열할 때 강력한 신호가 하나의 대립유전자에서는 존재하지만 다른 대립유전자에서는 존재하지 않는다. 이상적으로, 프로브는 상이한 길이의 절단된 및 비절단된 대립유전자를 최대 이용하는 방식으로 합성된다. 예를 들면, 프라이머를 하나의 대립유전자에서 절단에 의해 제거되나 다른 대립유전자에서는 존재하는 영역에 혼성화시켜야한다. PCR 또는 프라이머 연장을 위해 프라이머를 선별할 때, 하나의 실험적 설계 고려는 2개의 대립유전자사이의 길이 차이를 최대화하도록 프라이머를 놓는 것이다. 차별을 최대화하는 다른 수단은 "분자 표지" 전략의 이용을 포함하며, 여기서 프로브 말단은 상보적이고 스템을 형성하나, 비절단 대립유전 자의 존재하에서는 비절단 분절이 프로브의 스템에 상보적이므로 프로브 분자에서 분자내 스템의 형성과 효과적으로 경쟁한다(도 32 및 33 참조).
상기 FRET 방법은 예를 들면 다음과 같이 단일 관에서 수행할 수 있다: (1) PCR; (2) 절단 시약의 첨가(및 필요한 경우, 가열); (3) 프로브의 첨가; 및 (4) 96 웰에서 여기 및 형광 검출을 할 수 있는 ABI 프리즘과 같은 도식에서 필요한 경우 온도 램핑(ramping).
2개의 변이 대립유전자를 차별하는 FRET 신호를 생성하는 다른 방법은 프라이머상의 염료와 상호작용하는 염료를 뉴클레오티드에 혼입하는 것이다. 차별 FRET를 이룩하는 열쇠는 염료로 변형된 뉴클레오티드가 먼저 다형성 부위너머(프라이머의 3' 말단 다음)에 나타나 절단후에, 하나의 대립유전자(절단된)의 뉴클레오티드 염료가 더이상 프라이머 염료의 필요한 공명 생성 거리내에 있지않고, 반면 다른(절단되지 않은) 대립유전자에서, 적절한 거리가 유지될 것이고, FRET이 나타날 것이라는 것이다. 이 방법의 유일한 단점은 FRET 검출을 방해할 지 모르는 백그라운드 신호를 유발할 수 있는 혼입되지 않은 염료 분자를 제거하는 정제 단계가 필요하다는 것이다. 이 방법을 수행하는데 관련된 실험 단계의 비제한적인 예는 하기 (1) 내지 (4)를 포함한다: (1) 염료 표지된 프라이머, 및 염료를 또한 운반하는 절단 가능한 변형된 뉴클레오티드 또는 하나의 절단 가능한 변형된 뉴클레오티드와 하나의 염료 표지된 뉴클레오티드중 하나와 함께 PCR. 염료는 예를 들면, 당 및 뉴클레오티드의 염기에 근접한 절단을 야기하는 5'-아미노 치환의 경우에서와 같이 절단 기작이 프라이머로부터 염료를 분리시킨다면 절단 가능한 뉴클레오티드 상에 있을 수 있다; (2) 절단 가능한 변형된 뉴클레오티드에서 절단; (3) 유리 뉴클레오티드를 제거하는 정제; 및 (4) FRET 검출.
본원에서 상기 언급한 바와 같이, 본 출원인은 2'-데옥시아데노신 대신에 7-니트로-7-데아자-2'-데옥시아데노신을 함유하는 폴리뉴클레오티드를 피페리딘/TCEP/트리스 염기를 사용하여 특이적으로 및 완전하게 절단될 수 있음을 입증했다. 이러한 PCR 증폭 및 화학적 절단이 가능할 수 있는 다른 화학의 예가 많이 있다. 추정 유전자형 측정에서는, 3개의 다른 뉴클레오티드와 함께 하나의 절단 가능한 뉴클레오티드 유사체를 PCR 반응에 수행한다. 프라이머(P)중 하나 근처에 다형체 염기가 있고, 프라이머와 다형체 염기사이에 절단 가능한 염기가 없도록 PCR 프라이머를 설계할 수 있다. 절단 가능한 염기가 다형체 염기중 하나라면, 이 대립유전자로부터의 P 함유 절단 생성물은 다른 대립유전자로부터의 생성물보다 더 짧을 것으로 예상된다. 도식적인 표시(도 27) 및 실험 데이터(도 28 내지 31)는 상기 배치의 예이다. 절단 가능한 염기가 다형체 염기와 다르다면, P 함유 단편은 2개의 대립유전자에서 동일한 길이를 가지나 상이한 분자량을 가질 것이다. 이 경우, 질량 분광분석법이 바람직한 분석 도구일 것이며, 하지만 모세관 전기영동으로 분석할 때 하나의 단일 염기가 차이가 있는 올리고뉴클레오티드는 상이하게 이동할 수 있다고 관측되었다. 하나의 특정 예에서, 트랜스페린 수용체(Transferrin Receptor) 유전자의 82bp 단편은 2'-데옥시아데노신 대신에 7-니트로-7-데아자-2'-데옥시아데노신을 사용하여 PCR에 의해 증폭되었다. 다형체 염기쌍은 A:T 대 G:C이다. PCR 증폭은 천연 DNA와 유사한 수율로 완전히 치환된 생성물을 생산했다(도 28). MALDI-TOF 질량 분광분석법 분석은 스펙트럼의 2개의 영역에서 다형성을 나타냈다. 첫번째는 7000 Da 내지 9200 Da이고, 두번째는 3700 Da 내지 4600 Da이다(도 30, 패널 A). 첫번째 영역은 상이한 길이의 프라이머 함유 단편에서 차이를 입증했다(도 30, 패널 B). 두번째 영역은 동일한 길이를 가지나 상이한 질량을 갖는 DNA 함유 다형체의 반대 스트랜드를 나타냈다(도 30, 패널 C). 2개의 대립유전자간의 공통적인 단편은 질량 참조물로 작용할 수 있다. 모세관 전기영동 분석을 또한 사용할 수 있다(도 31). 상이한 길이의 2개의 단편간의 이동성 차이는 예상된 바와 같이, 시험 샘플에서 용이하게 검출되었다. 추가로, 동일한 길이를 가지나 하나의 염기가 상이한(C 대 T) 2개의 다형체 단편(11 nt)간의 이동성 차이를 측정하여 반대 스트랜드로부터 지지 증거를 제공했다. 도 32는 동일한 다형체 부위의 FRET 검출의 도식을 예시한다.
b. 디뉴클레오티드에서 완전 치환, 완전 연장 및 완전 절단
본 발명의 또다른 태양에서, 본 발명의 폴리뉴클레오티드를 구성하는 4개의 뉴클레오티드중 2개를 (프라이머 연장을 이용하여 하나의 스트랜드상에서, 또는 DNA 증폭 절차를 이용하여 둘다의 스트랜드상에서) 변형된 뉴클레오티드로 완전 치환하고, 이어서 2개의 상이한 변형된 뉴클레오티드를 포함하는 디뉴클레오티드 부위에서 우선적으로 실질적으로 완전 절단을 이룩한다. 일반적으로, 대부분의 절단 기작의 입체 장애로 인해, 이들이 특정 순서로 일어날 때에만 2개의 변형된 뉴클레오티드가 절단될 것이다. 예를 들면, T 및 C가 변형된다면, 서열 5' TpC 3'은 절단될 것이지만 5' CpT 3'은 절단되지 않을 것이다(5' 및 3'은 폴리뉴클레오티드 스 트랜드의 극성을 나타내고, p는 내부 포스페이트 그룹을 나타낸다).
디뉴클레오티드 절단을 하는 이유는 모노뉴클레오티드 절단이 300 내지 400개 이상의 뉴클레오티드의 폴리뉴클레오티드를 분석하는데 이상적으로 적합하지 않다는 것인데, 그 이유는 질량 분광분석법에 의해 검출 및 해결해야만 하는 단편수가 제한되고, 동일한 질량을 갖는 둘 이상의 절단 단편의 우연한 발생 가능성이 증가하여 방법의 효능을 제한하기 때문이다. 상기 후자의 문제는 MS가 정량적이지않기 때문에 단편의 출현 또는 사라짐을 숨길 수 있는 동일한 조성의 모노-, 디-, 트리- 및 테트라뉴클레오티드의 출현과 관련하여 특히 심각하다. 이와는 대조적으로, 질량을 제공하지 않아 뉴클레오티드 함량을 제공하지 못하는 모세관 전기영동은 디-, 트리- 및 테트라뉴클레오티드 수의 변화를 검출하는 정량적 방법이다.
변형된 디뉴클레오티드의 절단은 길이가 평균 16개의 뉴클레오티드의 단편을 생성해야한다. 이것은 뉴클레오티드 빈도가 동일하고, 임의의 디뉴클레오티드 등급에 부과된 생물학적 선택이 없다(즉, 이들의 출현이 랜덤하다)고 가정하여 4개의 뉴클레오티드가 주어질때 42은 16이기 때문에 임의의 디뉴클레오티드가 많이 존재하기 때문이다. 이러한 가정중 어느 것도 완전히 정확하지 않지만, 치환 및 절단에 어느 뉴클레오티드 쌍을 선별하는지에 따라 평균 크기의 질량에서 상당한 편차를 가진 절단 질량의 넓은 크기 분포가 실제로 있을 것이다. 그러나, 포유동물, 무척추동물 및 원핵생물 게놈에서 다양한 디뉴클레오티드의 빈도와 관련한 입수가능한 정보를 이용하여 적절한 디뉴클레오티드를 선별할 수 있다. 예를 들면, 5' CpG 3' 디뉴클레오티드는 포유동물 게놈에서 덜 나타난다고 잘 알려져 있으며, 비교적 잦은 절단 간격이 바람직하다면 이들을 피해야 한다.
i. 변이 검출에 적용
분석 폴리뉴클레오티드의 서열이 공지되어 있다면, 예측된 절단 단편의 질량 분석에 기초하여 최적 디뉴클레오티드 절단 도식을 선별할 수 있다. 예를 들면, 질량 분광분석법에 의해 분석하는데 최적의 크기 범위내에 속하는 절단 단편을 모든 가능한 디뉴클레오티드 절단 도식에 의해 생성된 단편 크기를 분석함으로써 선별할 수 있다. 더욱더, 모든 가능한 디뉴클레오티드 절단 도식과 관련된 변이 검출의 이론적인 효율은 완전 모노뉴클레오티드 치환 및 절단에 대해 전체 분석 단편에서 가능한 모든 뉴클레오티드 치환의 검출성을 측정함으로써 전술한 바와 같이 측정할 수 있다. 몇몇 예에서, 2 이상의 독립적인 디뉴클레오티드 절단 반응은 보충 결과를 유발할 수 있거나, 또는 제2의 디뉴클레오티드 절단 실험을 실행하여 확증을 제공할 수 있다.
디뉴클레오티드의 길이(평균 16머)가 주어지면, 하나의 디뉴클레오티드 절단 실험에 기초하여 변이 뉴클레오티드의 위치를 정밀하게 측정하는 것이 종종 가능하지 않을 것이다. 예를 들면, 샘플간에 15 달톤 질량 차이가 14머에서 검출된다면, 이어서 14머에서 C <-> T 변이(표 2)가 있어야 하고, 즉, 더 무거운 대립유전자는 더 가벼운 대립유전자가 C를 함유하는 위치에 T를 함유한다. 그러나, 더 가벼운 변이 단편에 하나의 C만 있지 않다면 또는 더 무거운 변이 단편에 하나의 T만 있지 않다면, C 또는 T가 변이 단편인지 결정하는 것은 불가능하다. 변이된 정밀한 뉴 클레오티드와 관련한 이러한 불명료함은 여러가지 방법으로 해결할 수 있다. 첫째, 원래의 변이 단편을 다형성 잔기의 명확한 할당을 허용하는 단편으로 절단하도록 제2의 모노 또는 디뉴클레오티드 치환 및 절단 실험 또는 이러한 절단 실험의 조합을 설계할 수 있다. 둘째, 생어 서열화 또는 혼성화에 의한 서열화와 같이 결과물에 대한 독립적인 검사 방법으로 다른 서열화 절차를 사용할 수 있다.
ii. DNA 서열화에 대한 적용
독립형 절차로, 디뉴클레오티드 치환 및 절단은 길이가 평균 약 16개이나, 30, 40개까지 또는 더한층 50개 이상의 뉴클레오티드의 DNA 단편의 뉴클레오티드 함량에 관한 유용한 정보를 제공할 수 있다. 그러나, 전술한 바와 같이, 디뉴클레오티드 절단을 DNA 서열화에 적용하는 것은 주로 모노뉴클레오티드 절단과 함께 일어난다. 디뉴클레오티드 절단에 의해 생성된 비교적 큰 DNA 단편은 모노뉴클레오티드 절단에 의해 생성된 더 작은 단편을 함께 맞추어야 하는 단편 셋트로 분류할 때 매우 유용할 수 있다. 이러한 그룹형성에 의해 부과된 추가의 구속은 완전 서열을 더한층 비교적 더 큰 단편으로 부터 측정될 수 있도록 하기에 충분할 수 있다.
실시예 4에, 4개의 모노뉴클레오티드 치환 및 절단 반응을 사용하여 20 머로부터 뉴클레오티드 서열을 추론하는데 필요한 단계를 도시하였다. 실시예 4에 기술된 절차는 10 내지 30머 시리즈에서 수행할 수 있으며, 이의 서열 함량은 디뉴클레오티드 절단 절차에 의해 초기에 정의되거나 또는 적어도 구속될 수 있다. 이로써, 훨씬 더 큰 단편 서열을 얻을 수 있다. 뉴클레오티드 길이가 증가함에 따라 단편 질량과 서열 함량간의 관계는 더욱 애매해진다는 것에 주목한다, 즉 주어진 질량을 생성할 수 있는 가능한 서열이 점점 더 많아진다. 그러나, 질량을 구성하는 뉴클레오티드의 수가 공지되어 있다면, 가능한 뉴클레오티드 함량의 수는 상당히 떨어진다(Pomerantz, S.C., et al., J. Am. Soc. Mass Spectrom., 1993, 4:204-209). 더욱더, 특정 유형의 내부 디뉴클레오티드 서열의 부족과 같은 서열 구속은 모노뉴클레오티드 셋트에 대해 표 4에 도시한 바와 같이 가능한 뉴클레오티드 함량의 수를 더욱 감소시킨다.
c. 변형된 뉴클레오티드의 완전 치환 및 부분 절단
변형된 뉴클레오티드의 부분 치환 및 완전 절단
변형된 뉴클레오티드의 부분 치환 및 부분 절단
이들 적용은 상이한 전략에 의해 부분적으로 절단된 폴리뉴클레오티드를 제공하며, 이들 절차 각각은 본 발명의 특정 태양에 유용하다. 그러나, 변형된 뉴클레오티드의 완전 치환 및 부분 절단은 질량 분광분석법 분석을 위한 부분 절단 생성물을 생성하는 바람직한 방법이다. 그 이유는 완전 치환에 의해 100 뉴클레오티드에서 1의 절단으로부터 100 뉴클레오티드에서 99의 절단으로 광범위한 범위에 걸쳐 부분적인 절단의 정도를 변화시킬 수 있기 때문이다. 완전 절단과 함께 조차도 부분 치환은 상기 범위의 절단 완성을 허용되지 않는다. 그러나, 폴리머라제에 의해 효율적으로 혼입되지 않는 변형된 뉴클레오티드의 경우, 더 적은 치환도가 바람직하다. 절단의 완성도가 감소되기 때문에, 더 긴 범위에서 절단 단편간의 관계는 분명해진다. 다른 한편, 절단의 완성도가 증가함에 따라, 정밀한 질량 데이터 및 뉴클레오티드 함량의 명확한 할당을 얻는 능력은 증가된다. 약간의, 중간 및 상당한 절단의 조합은 적용이 변이 검출이든지 서열화이든지 전체 폴리뉴클레오티드의 전체 사진을 제공한다. 한정된 뉴클레오티드 함량의 작은 폴리뉴클레오티드를 한정된 규칙의 더 큰 그룹에 결합시킬 수 있다.
완전 절단으로 부분 치환 및 부분 절단으로 부분 치환은 서열화 래더의 제조에 유용하다. 변형된 뉴클레오티드가 이용가능한 폴리머라제에 의해 폴리뉴클레오티드로 효율적으로 혼입되지 않는다면, 변형된 뉴클레오티드를 함유하는 폴리뉴클레오티드를 효율적인 생산하는데 부분 치환의 낮은 비율이 최적일 수 있다. 그러나, 즉석 검출을 위해 충분한 절단 단편을 생성하기 위해 낮은 치환도는 완전 절단을 요구할 수 있다.
부분 절단과의 부분 치환은 완전 절단 조건이 엄격하고 이로써 폴리뉴클레오티드로 약간의 비특이적인 절단 또는 변형을 야기시키기 때문에 일반적으로 바람직한 시도이다. 또한, 비교적 고도(즉, 5% 이상의 뉴클레오티드 발생)의 부분 치환은 일정한 범위의 부분적인 절단 효능을 분석할 수 있도록 허용한다. MS 분석에서와 같이, 고도의 절단을 시험할 수 있는 것이 유리하다. 예를 들면, 매우 긴 서열 래더의 생산에 대한 균형이 생어 서열화에서 잘 알려져 있다, 즉 가장 짧은 단편을 가진 래더의 시작은 가장 긴 단편을 갖는 래더의 말단 처럼 판독하기가 어렵다. 유사하게, 본 발명의 폴리뉴클레오티드와 함께 부분 절단 조건을 조립하는 능력은 일련의 서열화 래더를 프라이머에 근접하거나 또는 프라이머로부터 약간의 거리가 있는 명확한 서열 데이터를 제공하는 동일한 폴리뉴클레오티드로부터 생성될 수 있도록 허용한다. 도 17에 도시한 바와 같이, 화학적 절단에 의해 생성된 서열 래더는 4 kb 이하 및 그 이상의 거리에서 디데옥시 종결보다 표지된 단편을 훨씬 더 잘 분포시킨다.
부분 절단은 또한 전술한 절단 저항성의 변형된 뉴클레오티드를 하나를 제외한 모든 천연 뉴클레오티드로 치환하여 얻을 수 있고, 이어서 절단 부위를 제공한다. 추가로, 상기 기술된 바와 같이, 절단 저항성 변형된 뉴클레오티드와 절단 민감성 변형된 뉴클레오티드의 조합을 사용할 수 있다.
방법에서 분자의 비특이적 분해를 야기시키지 않고 비교적 큰 분자의 질량을 측정할 수 있는 임의의 기법을 본 발명의 방법과 함께 사용할 수 있지만, 바람직한 기법은 복잡한 분석 혼합물을 분석하는데 매우 적합한 MALDI 질량 분광분석법이다. 0.1% 내지 0.05% 정도의 정밀도로 질량을 측정할 수 있는 상업적인 MALDI 도식가 유용할 수 있다. 즉, 이들 도식는 최적 조건하에서 2000중에서 1부만큼 적게 분자량이 차이가 나는 분자를 용해시킬 수 있다. MALDI MS 기법의 진보는 앞으로 몇년안에 상업적인 도식의 레졸루션을 증가시킬 것이다. 변이를 함유하는 2개의 스트랜드(A-T 전환, 분자량 차이 9; 표 5 참조)사이에서 일어날 수 있는 가장 작은 차이를 고려하고, 2,000의 레졸루션을 갖는 MALDI 장치(즉, m/z(질량/전하) 2,000을 갖는 이온과 m/z 2,001을 갖는 이온을 구별할 수 있는 기계)를 사용하면, A-T 전환이 검출될 수 있는 가장 큰 DNA 단편은 약 18,000 달톤이다(달톤은 거대 분자의 크기를 기술할 때 사용하는 분자량 단위이며, 분자의 분자량과 동일하다). 실험 셋팅에서, 도식의 실제 레졸빙 압력은 탄소의 동위원소 이질성에 의해 제한될 수 있 다, 즉, 탄소는 다른 인자 뿐 아니라 탄소-12 및 탄소-13으로 자연에서 존재한다. DNA 단편에서 4개의 뉴클레오티드의 대략 동일한 분포를 가정하면, 이것은 약 55개의 뉴클레오티드를 함유하는 올리고뉴클레오티드에서 A-T 전환의 검출로 번역된다. 스펙트럼의 다른 말단에서, 40의 분자량 차이를 야기시키는 단일 C-G 전환을 약 246 뉴클레오티드로 구성된 올리고뉴클레오티드에서 MALDI 질량 분광분석법을 사용하여 검출할 수 있다. A-T 전환이 검출가능한 올리고뉴클레오티드의 크기는 더 무거운 비천연 뉴클레오티드를 A 또는 T로 치환하여 증가시킬 수 있고, 예를 들면, 제한없이 A를 7-메틸-A로 치환하므로 분자량 변화를 23으로 증가시킬 수 있다. 표 5는 각각의 가능한 단일 점에서 분자량의 임의의 변형없이 상이한 레졸빙 파워의 질량 분광분석기로 돌연변이가 검출될 수 있는 올리고뉴클레오티드의 대략적인 크기를 나타낸다.
뉴클레오티드의 다양한 화학적 변형이 MS 분석시 질량 차이의 검출성을 증가시키는데 유용하다는 점과 관련하여 기술하였다. 본 발명의 방법과 함께 사용하는데 특히 유용한 질량 변형은 364.5의 질량을 갖는 퓨린 유사체 2-클로로아데닌이다. 표 2, 패널 B에 도시한 바와 같이, 모든 뉴클레오티드와 A사이의 질량 차이에 상당한 효과가 있다. 가장 중요한 점은 T-A 차이를 9 Da에서 42.3 Da으로 변화시키는 것이다. 더욱더, 2-클로로아데닌을 테르무스 아쿠아티쿠스(Thermus aquaticus)로부터의 DNA 폴리머라제에 의해 폴리뉴클레오티드에 혼입시킬 수 있다고 나타났다. 하나의 스트랜드상에서의 완전 치환이 기술되었다. (Hentosh, P. Anal. Biochem., 1992, 201:277-281).
1. 폴리머라제 개발
광범위한 돌연변이 폴리머라제는 변형된 뉴클레오티드에 대해 변화된 촉매 특성을 갖는다고 나타났다. 리보뉴클레오티드와 데옥시리보뉴클레오티드간의 식별 능력이 감소된 돌연변이 폴리머라제가 광범위하게 연구되었다. 아지도티미딘(AZT) 혼입에 대해 식별하는 인간 DNA 폴리머라제 β돌이변이체가 유전자 선별에 의해 단리되었다. 따라서, 천연 폴리머라제보다 임의의 본 발명의 변형된 뉴클레오티드를 더 잘 혼입시킬 수 있는 돌연변이 폴리머라제가 생산 및 선별할 수 있는 것이 더 유망하다.
특정 변형된 뉴클레오티드 또는 뉴클레오티드들을 폴리뉴클레오티드에 혼입하는데 최적의 폴리머라제를 얻기위해 하기 절차를 사용할 수 있다. 하기 절차의 변형은 당해 분야의 숙련가들에게 분명하며, 이러한 변형은 본 발명의 범위내에 있다.
a. 출발 폴리머라제를 선별한다. 다른 방법으로는, 변형된 뉴클레오티드 또는 뉴클레오티드들을 폴리뉴클레오티드로 혼입하는 것과 관련하여 상이한 서열 및(또는) 상이한 용량을 갖는 여러개의 폴리머라제를 선별할 수 있다. 예를 들면, 당이 변형된 뉴클레오티드를 효과적으로 혼입하는 하나와 포스페이트 주쇄가 변형된 뉴클레오티드를 효과적으로 혼입하는 다른 하나의 두개의 폴리머라제를 선별할 수 있다. 이어서, 폴리머라제의 코딩 서열을 원핵 숙주에 클로닝한다.
폴리머라제를 숙주의 세포질 공간으로 향하도록 하는 능력면에서 선별된 단 백질 태그를 클로닝시에 폴리머라제에 혼입하는 것이 유리할 수 있다. 이러한 태그의 비제한적인 예를 들면 티오레독신이다. 세포질 공간에서 단백질은 가열 충격(또는 당해 분야에 공지된 다른 절차)에 의해 반 순수한 상태로 수득될 수 있으며, 혼입체에 혼입하기가 쉽지 않다.
b. 이어서, 여러번(바람직하게는 3회 이상)의 셔플링(스템머의 상기 문헌 참조)을 수행한다.
c. 각각의 셔플링후, 셔플링된 DNA를 숙주에 형질변형시킨다. 이어서, 수득한 형질변형체의 라이브러리를 평판배양하고, 형질변형체의 풀(풀당 약 10 내지 1000개의 콜로니)을 자손 선별에 의해 스크리닝하기 위해 숙주 세포 콜로니로부터 준비한다. 이어서, 용해물을 각각의 풀로부터 제조한다. 숙주는 세균과 같은 원핵세포 또는 효모와 같은 단핵 진핵세포일 수 있으나 이에 제한되지 않는다. 하기 설명은 세균성 원핵 숙주의 사용에 관한 것이지만 당해 분야의 숙련가들은 다른 가능한 원핵 숙주를 알고 있으며 이것은 본 발명의 범위내에 있다.
d. 용해물을 저 분자량 컷-오프 맴브레인을 사용하여 투석하여 거의 모든 천연 뉴클레오티드를 제거한다. 이것은 원하는 특징을 갖는 폴리머라제에 대한 분석이 변형된 뉴클레오티드의 존재하에서 프라이머의 폴리머라제 연장을 동반하기 때문에 필수적인 과정이다. 상응하는 천연 뉴클레오티드의 존재는 결과가 확실치않은 분석에서 높은 백그라운드를 야기할 것이다. 다른 방법은 새우 알칼리성 포스파타제와 같은 포스파타제로 모든 천연 뉴클레오티드를 분해하는 것이다.
e. 투석된 용해물에 단일 스트랜드 DNA 주형, 주형의 하나의 말단에 상보적인 단일 스트랜드 DNA 프라이머, DNA에 혼입하는 것이 바람직한 변형된 뉴클레오티드 또는 뉴클레오티드들 및 변형된 뉴클레오티드로 치환되지 않는 천연 뉴클레오티드를 첨가한다. 원하는 폴리머라제가 2개의 인접 변형된 뉴클레오티드를 혼입하는 능력을 갖는다면, 하나 이상의 상보적 인접 서열을 함유하는 주형을 선별해야 한다. 예를 들면, 변형된-C-변형된-T 서열을 혼입할 수 있는 폴리머라제가 5'에서 3'을 원한다면, 주형은 3'에서 5'로 하나 이상의 G-A 또는 A-G 서열을 함유해야 한다. 변형된 뉴클레오티드 또는 뉴클레오티드들을 혼입하는 폴리머라제의 능력을 시험하기 위해 고안된 주형 스트랜드의 다음(즉, 5'에서) 세그먼트는 폴리머라제에 의해 복제될 때 검출가능한 서열을 생성하는 주형 스트랜드의 세그먼트이다. 서열은 여러가지 방법으로 검출될 수 있다. 한가지 가능성은 천연 뉴클레오티드중 하나와 상보적인 뉴클레오티드의 단독중합체 세그먼트를 갖는 주형을 사용하는 것이다. 이어서, 예를 들어 변형된 C를 혼입하는 폴리머라제를 확인하는데 목적이 있다면, 이어서 검출은 A, G 또는 T의 연속 시리즈의 중합을 동반하나, 검출에 사용된 뉴클레오티드는 주형 서열과 상보적인 중합된 서열에서 초기에 나타나지 않는다. 검출 뉴클레오티드는 방사능표지 또는 염료표지된 뉴클레오티드일 수 있으며, 이것은 변형된 뉴클레오티드의 혼입이 필요한 주형 세그먼트를 이미 통과한 돌연변이 폴리머라제에 의해서만 혼입될 것이다. 단독중합체를 검출하는 다른 방법은 변형된 뉴클레오티드(들)을 혼입할 수 있는 폴리머라제를 함유하는 풀에서만 생성된 단독중합체에 혼성화될 수 있는 상보적 방사능표지 또는 염료 표지된 프로브를 제조하는 것이다. 이어서, 혼성화를 예를 들어 나일론 필터상에 각각의 풀로부터의 프라이머 확장 생성물을 점적하고, 변성하고, 건조시키고 중합 생성물의 상보적 스트랜드에 혼성화될 표지된 단독중합체성 프로브를 첨가하여 검출할 수 있다. 물론, 숙주 세포 게놈 또는 에피솜에 존재하지 않는 단독중합체 또는 기타 서열을 사용하여 모든 풀에 존재하는 숙주 서열에 대한 백그라운드 혼성화를 최소화할 수 있다.
여전히 또다른 검출 절차는 T7 프로모터(이에 제한되지 않는다)와 같은 RNA 폴리머라제 프로모터와 상응하는 서열, 이어서 리포터 서열을 주형에 혼입하는 것이다. 이러한 서열은 변형된 뉴클레오티드의 혼입을 요구하는 주형 서열 및 프라이머의 하류(3'에서)에 위치해야 한다. T7 프로모터는 중합의 결과로 이중 스트랜드가 될 때까지 불활성일 것이다, 그러나, T7 프로모터 서열의 중합은 시험할 돌연변이 폴리머라제가 T7 프로모터 서열의 업스트림에 놓인 변형된 뉴클레오티드 또는 변형된 뉴클레오티드들의 서열을 혼입할 수 있는 경우에만 일어날 것이다. 리포터 서열은 뉴클레오티드의 단독중합체성 서열(예를 들면, T)을 포함할 수 있으며, 이의 상보적 서열(이 경우에는 A)을 염료 또는 방사능활성 표지로 표지한다. 이러한 방식으로, 고도의 T7 폴리머라제 매개된 전사에 의해 다량의 고 분자량(즉, 트리클로로아세트산에 의해 침전될 수 있다), 표지 중합체가 생성될 것이다. 다른 리포터 서열은 절단되지 않은 생성물과 절단된 생성물을 용이하게 구별할 수 있는 외부에서 첨가된 마커 올리고뉴클레오티드를 절단할 수 있는 리보자임이다. 다시한번 비 제한적인 예를 들면, 올리고뉴클레오티드의 하나의 말단은 바이오티닐화될 수 있고 다른 말단은 형광 염료를 함유할 수 있다. 상기 시스템에 의해 1000 배 이상의 신호의 증폭을 이룩할 수 있다. 이러한 시도에서는, 프로모터의 기능이 변형된 뉴클레오티드의 존재에 의해 방해받지 않음을 입증하거나 변형되는 뉴클레오티드가 없는 프로모터의 형태를 생성하는 것이 먼저 필수적일 것이다.
f. 선별된 변형 뉴클레오티드 또는 인접 변형 뉴클레오티드를 혼입할 수 있는 폴리머라제를 함유하는 용해된 세균성 콜로니의 임의의 풀은 검출가능한 단독중합체를 생성하거나 또는 변형된 뉴클레오티드 또는 인접 뉴클레오티드를 경유하여, T7 프로모터를 경유하여 또는 마커 서열을 경유하여 중합이 일어난 결과 마커 서열의 이중 스트랜드된 T7 RNA 폴리머라제 프로모터 업스트림을 함유할 것이다. 혼합물에 T7 RNA 폴리머라제의 첨가(또는 양자택일적으로, 플라스미드로부터 T7 RNA 폴리머라제의 발현)는 마커 서열의 전사를 야기할 것이며, 이어서 선별된 마커 시스템에 따라 적절한 방법에 의해 이를 검출할 수 있다. 변형된 뉴클레오티드(들)이 부족하거나 또는 변형된 뉴클레오티드(들)로 효과적으로 기능할 수 있는 프로모터를 선별하거나 설계하는 것이 반드시 필수적이지는 않다.
g. 원하는 특성을 갖는 폴리머라제를 함유하는 세균 콜로니를 이어서 동정하고 자손 선별에 의해 세균 콜로니의 풀로부터 정제한다. 각각의 선별 수행시에, 원하는 특성을 갖는 풀 또는 풀들을 서브풀로 나누고 각각의 서브풀에 대해 상기에서 나타낸 바와 같이 활성을 시험한다. 최고의 활성을 나타내는 서브풀을 선별하여 제2 서브풀로 분리하고 공정을 반복한다. 원하는 폴리머라제를 함유하는 하나의 콜로니만이 남을 때까지 이를 반복한다. 상기 폴리머라제를 단백질 발현 벡터안에 다시 클로닝할 수 있으며, 다량의 폴리머라제를 발현 및 정제할 수 있다.
폴리머라제를 개발하는 또다른 시도는 성장하는 세포만을 죽이는 몇몇 항생 제, 예를 들면 정지된 세포에는 영향을 미치지 않으나 성장하는 세포의 세균 세포벽 합성을 방해함으로써 죽이는 페니실린 및 관련 약물에 대해 잘 알려진 특성과 관련이 있다.
이 시도는 유전공학적으로 변형된 세균 세포에 변형된 뉴클레오티드를 도입하여 하나 이상의 돌연변이 폴리머라제, 바람직하게는 돌연변이 폴리머라제의 라이브러리를 발현시킬 것이다.
이상적인 숙주 균주는 내생 폴리머라제는 불활성시키나 플라스미드가 엔코딩된 폴리머라제에 의해서는 보충되는 것이다. 이어서, 상이한 선택성 마커, 예를 들면 항생제 저항성을 갖는 제2의 플라스미드위에 폴리머라제 라이브러리를 생성할 수 있다. 그후 라이브러리를 제1 (돌연변이되지 않은) 폴리머라제 엔코딩 플라스미드에 대한 네가티브 선별 조건하에서 숙주 세포에 도입하여 돌연변이 폴리머라제만을 갖는 세포를 남긴다. 하나 이상의 돌연변이 폴리머라제가 변형된 뉴클레오티드를 세포의 유전 물질에 혼입할 수 있다면, 변형된 유전자(들)의 발현이 변화될 것이고(이거나) 세포 성장에 영향을 미치는 SOS 반응과 같은 일련의 숙주 세포 반응이 유발될 것이다. 원하는 효과는 가역적인 성장 저지일 것이다, 즉 세포독성 효과보다는 오히려 세포증식억제일것이다. 이어서, 세포를 활발히 성장하는 세포만을 죽이는 항생제로 처치할 것이다. 그후 세포를 항생제의 존재로부터 제거하여 새로운 성장 배지에 놓는다. 변형된 뉴클레오티드를 세포의 유전 물질에 혼입함으로써 성장이 저지되어 항생제에 의한 영향을 받지 않는 세포는 콜로니를 형성할 것이다. 변형된 뉴클레오티드를 세포의 유전 물질에 혼입하는 것을 촉진하는, 폴리 머라제가 엔코딩된 플라스미드를 이어서 단리시키고, 이 절차를 추가의 선별을 위해 반복한다. 충분한 선별을 수행한 후, 폴리머라제를 단리하고 동정한다. 전술한 과정을 이룩하는데 사용될 수 있는 비제한적인 예를 들면 다음과 같다:
1. 돌연변이를 위한 폴리머라제 및 폴리머라제 셋트를 선별한다. 출발 폴리머라제(들)는 클레노우 E710A, 야생형 폴리머라제, 열안정성 또는 열불안정성 폴리머라제 또는 보족 이. 콜라이 DNA Pol I으로 공지된 폴리머라제 등과 같은 돌연변이 폴리머라제를 포함하나 이에 제한되지 않는다.
2. "더티 PCR", 셔플링, 부위가 지정된 돌연변이 또는 기타 다양성 생성 절차와 같은 기법을 사용하여 돌연변이 폴리머라제의 라이브러리를 제조한다.
3. 라이브러리를 플라스미드 벡터에 클로닝한다.
4. 플라스미드 라이브러리로 세균을 형질변형시키고, 적절한 항생제위에서 선별하여 형질변형체를 분리한다. 바람직하게는, 숙주 균주는 불활성화된 염색체 폴리머라제를 가지며, 돌연변이 폴리머라제만이 전술한 바와 같이 숙주 세포에서 발현되도록 선별을 적용할 수 있다.
5. 변형된 뉴클레오티드 트리포스페이트를 배지에 첨가한다. 세포내로 변형된 뉴클레오티드의 유입을 촉진하기 위해 일렉트로포레이션, 칼슘 또는 루비듐 클로라이드의 첨가, 가열 쇼크 등과 같은 세포 침투 절차를 사용하는 것이 필수적일 수 있다. 이어서, 변형된 뉴클레오티드(들)의 혼입에 의해 선별된 세포에서 세포 성장이 저지될 때까지 세포를 변형된 뉴클레오티드 트리포스페이트 존재하에서 성장시킨다.
6. 활발히 분화하는 세포를 선별적으로 죽이는 페니실린, 암피실린, 날리딕산 또는 임의의 기타 항생제를 첨가한다. 선택된 시간동안 세포를 지속적으로 성장시킨다.
7. 세포를 원심분리하고, 이들을 새로운 LB 배지에 현탁시키고, 이들을 평판배향한다. 실험적으로 측정된 시간동안 성장시킨다.
8. 콜로니를 선별하고, 플라스미드를 단리하고, 추가의 선별을 위해 단계 4 내지 7을 반복하거나 또는 다른 방법으로, 개별적인 콜로니 또는 콜로니 풀을 조사하기 위해 변형된 뉴클레오티드를 혼입에 대한 생화학적인 분석을 이용한다. 이러한 분석은 자손 선별 도식에서 개별 클론 또는 클론의 풀상의 방사능 표지 변형된 뉴클레오티드의 존재하에 주형의 중합을 동반할 것이다.
9. 단계 8의 분석에 의해 원하는 활성을 갖도록 결정된 폴리머라제(들)의 특성을 추가로 조사한다.
10. 단계 8에서 얻은 폴리머라제(들)을 다시 돌연변이시키고, 단계 3으로부터 선별 과정을 반복한다.
11. 변형된 뉴클레오티드를 혼입하는 능력이 허용가능한 수준으로 이룩되었을 때, 폴리머라제를 단리시키고 동정한다.
변형된 뉴클레오티드가 혼입된 활성 폴리머라제를 선별하는 또다른 방법은 활성 효소의 선별을 위해 기술된 박테리오파지의 사용을 포함한다(Pederson et al., Proc. Natl. Acad. Sci. USA, 1998, 95:10523-8). 이 절차의 변형을 돌연변이 폴리머라제 선별에 사용할 수 있다. 즉, 파지 표면에 공유 결합되는 올리고뉴 클레오티드는 파지의 표면상에서 발현된 돌연변이 폴리머라제에 의해 확장될 수 있다. 염료 표지된 변형된 뉴클레오티드는 프라이머 확장에 사용될 것이다. 혼입되지 않은 뉴클레오티드를 제거한 후, 염료 변형된 뉴클레오티드를 갖는 파지를 형광에 의해 활성화된 세포 분류 절차를 이용하여 확인할 수 있다.
별법으로, 적합한 주형 디자인을 사용하여 변형 뉴클레오티드 스트레치의 하류에만 도입되는 다른 뉴클레오티드에 형광 표지를 부착시킬 수 있다.
변형 뉴클레오티드 도입을 위한 활성 폴리머라제를 확인하는 다른 방법은 주형 DNA 및 뉴클레오티드 기질에 결합한 폴리머라제의 유용한 X-선 결정 구조를 이용한다. 폴리머라제/기질 복합체 내의 관찰되거나 예상된 상호작용을 기초로 하여, 소정의 변형 뉴클레오티드의 구조 변화를 수용하기 위해 합리적인 아미노산 변화를 생성시킬 수 있다. 예를 들어, X선 결정 구조가 폴리머라제 활성 부위에 존재하는 아미노산을 보여주는 T7 폴리머라제와 그의 기질 복합체에 대한 구조적 정보를 기초로 하여 (Doublie et al., Nature, 1998, 391:251-258), 리보뉴클레오티드 (rNTP) 및(또는) 5'-아미노-뉴클레오티드 (5'-아미노 dNTP) 도입을 위한 특이 활성을 증가시키기 위해 구조적으로 유사한 단백질 클레나우에 대해 부위 지정 돌연변이를 고안할 수 있다.
클레나우의 E710A 변이체 (Astatke et al., Proc. Nat. Acad. Sci. USA, 1998, 95:3402-3407)는 야생형 클레나우에 비해 rNTP를 도입하는 능력이 증가되었고, 이것은 아마도 돌연변이가 rNTP의 2'-히드록실기에 대한 입체 게이트를 제거하였기 때문인 것으로 보인다. 그러나, 이 돌연변이는 천연 dNTP 및 5'-아미노 dNTP 의 도입을 위한 변이체의 활성을 감소시켰다. 이 경우에, E710S 돌연변이를 사용하면 E710S가 rNTP 기질의 2'-OH와 H-결합을 형성할 수 있기 때문에 활성을 개선시킬 것이다. E710A 또는 E710S 돌연변이는 또한 그 자체로는 폴리머라제 활성에 거의 영향을 주지 않는 선행 기술의 변이체인 Y766F (Astatke et al., J. Biol. Chem., 1995, 270:1945-54)와 조합하여 사용될 수 있다. Y766의 결정 구조는 그의 히드록실이 E710의 측쇄와 수소 결합을 형성하여 E710이 Ala로 말단이 절단될 때 폴리머라제 활성에 영향을 줄 수 있다는 것을 보여준다. 다른 한편으로, E710 돌연변이는 F762A와 함께 한정된 위치에서 당 고리를 유지시킴으로써 활성을 개선시킬 수 있다. 이와 유사하게, 5'-아미노 유사체의 보다 양호한 도입은 5'-질소가 뉴클레오티드의 형태를 변경시켜 알파-인 원자의 배열을 변형시키기 때문에 뉴클레오티드 기질에 대한 폴리머라제의 결합을 완화시킴으로써 달성될 수 있다. 처음에, 뉴클레오티드 기질의 당 및 인산염을 유인하는 제한된 수의 잔기, 예를 들어 잔기 R668, H734 및 F762에 대한 돌연변이 발생에 촛점이 맞추어졌다. H881 잔기도 잘 적용되었다. dNTP 결합 부위로부터 추가로 유도된 것이지만, 상기 위치에서의 Ala 치환은 dNTP 도입의 충실도에 영향을 준다 (Polesky et al., J. Biol. Chem., 1990, 265:14579-91). 이들 잔기는 최대 효과를 갖는 아미노산 잔기를 확인하는 카세트 돌연변이 및 상기한 활성 폴리머라제의 후속 선별을 위해 표적화될 수 있다. R668K 치환은 프라이머 3'-NMP와의 마이너 그루브 상호작용을 보존하면서 dNTP에 대한 접촉을 제거하여야 하기 때문에 특히 관심의 대상이 된다. 다른 한편으로, R754 및 K758은 베타 및 알파 인산염과 접촉하지만, 이들 위치의 변화는 촉매 작용을 심하게 손상시킬 가능성이 있다. 이들 위치의 히스티딘 또는 리신은 인산염과의 상호작용을 보존할 수 있고 활성을 보유할 수 있다.
변형 뉴클레오티드의 도입을 위한 활성 폴리머라제의 선발을 위한 다른 방법은 외래 단백질이 파지 표면 단백질과의 융합체로서 박테리오파지의 표면에 발현되도록 하는 파지 디스플레이 시스템의 사용을 수반한다 (Kay, B. K., Winter, J. and J. McCafferty (Editors) Phage Display of Peptides and Proteins: A Laboratory Manual. Academic Press, 1996). 변이체 폴리머라제의 검출을 위한 실험 시스템의 확립은 파지 라이브러리의 표면에 변이체 폴리머라제의 발현 및 목적 폴리머라제 활성을 갖는 폴리머라제를 함유하는 파지의 후속 단리를 수반하고, 이 시스템의 특징은 활성 효소 뉴클레아제의 선발에 대해 문헌에 기재되었다 (Pedersen et al., Proc. Natl. Acad. Sci. USA, 1998, 95:10523-8). 상기 방법의 변형을 변이체 폴리머라제 선발에 사용할 수 있다. 즉, 파지 표면 상의 단백질에 공유결합된 올리뉴클레오티드는 동일한 파지의 표면 상에 발현된 변이체 폴리머라제에 의해 신장될 수 있다. 올리고뉴클레오티드는 폴리머라제에 의해 인식가능한 프라이머-주형 복합체를 제공하도록 폴딩되어야 하거나, 또는 올리고뉴클레오티드에 상보성인 프라이머를 별개로 제공할 수 있다. 어느 경우든, 중합을 위한 주형으로 기능하는 올리고뉴클레오티드의 부분은 그에 대해 효율적으로 작용하는 폴리머라제가 탐색되는 변형 뉴클레오티드(들)에 상보성인 뉴클레오티드를 함유할 것이다. 또한, 주형 올리고뉴클레오티드는 변형 뉴클레오티드(들)의 도입을 필요로 하는 주형 세그먼트를 따라 중합한 후에만 발생하는 표지된 뉴클레오티드의 주형에 대한 도입의 결과로서 신장 생성물이 용이하게 검출될 수 있도록 고안될 수 있다. 목적 촉매 활성을 갖는 폴리머라제를 함유하는 파지를 선택적으로 풍부하게 하는 방법은 형광 활성화된 세포 분류기 (FACS)의 사용을 수반한다. 염료 표지된 변형 뉴클레오티드는 시험 변형된 뉴클레오티드(들)의 도입 후에만 프라이머 신장 반응시에 도입하기 위해 사용된다. 도입되지 않은 뉴클레오티드의 제거 후에, 부착된 염료 변형 뉴클레오티드를 함유하는 파지 (변형 뉴클레오티드 또는 뉴클레오티드들을 도입할 수 있는 변이체 폴리머라제를 코딩하여야 함)는 형광 활성화된 세포 분류 방법 (Daugherty P.S., et al., Antibody affinity maturation using bacterial surface display. Protein Eng. 11:825-32, 1998)을 사용하여 1회 이상 확인할 수 있다. 별법으로, 변형 뉴클레오티드(들) 자체가 염료로 표지될 수 있고, 검출은 염료 표지된 파지의 FACS 분류에 의해 유사하게 달성할 수 있다. 이 방법은 염료가 중합을 방해할 수 있다는 단점이 있지만, 당업자는 중합을 억제할 가능성이 없는 결합을 통해 염료를 변형 뉴클레오티드에 부착시킬 수 있음을 알 것이다. 적합한 주형 디자인을 사용하여, 변형 뉴클레오티드 스트레치의 하류에만 도입되는 다른 뉴클레오티드에 형광 표지를 부착시킬 수 있다.
변형 뉴클레오티드 도입을 위한 활성 폴리머라제의 확인을 위한 다른 방법은 주형 DNA 및 뉴클레오티드 기질에 결합된 폴리머라제의 가용한 X선 결정 구조를 사용하는 것이다. 폴리머라제/기질 복합체 내의 관찰되거나 예상된 상호작용을 기초로 하여, 소정의 변형 뉴클레오티드의 구조적 변화를 수용하기 위해 합리적인 아미노산 변화를 생성시킬 수 있다. 예를 들어, X선 결정 구조가 폴리머라제 활성 부 위에 존재하는 아미노산을 보여주는 T7 폴리머라제와 그의 기질 복합체에 대한 구조적 정보를 기초로 하여 (Doublie et al., Nature, 1998, 391:251-258), 리보뉴클레오티드 (rNTP) 및(또는) 5'-아미노-뉴클레오티드 (5'-아미노 dNTP) 도입을 위한 특이 활성을 증가시키기 위해 구조적으로 유사한 단백질 클레나우에 대해 부위 지정 돌연변이를 고안할 수 있다.
클레나우의 E710A 변이체 (Astatke et al., Proc. Nat. Acad. Sci. USA, 1998, 95:3402-3407)는 야생형 클레나우에 비해 rNTP를 도입하는 능력이 증가되었고, 이것은 아마도 돌연변이가 rNTP의 2'-히드록실기에 대한 입체 게이트를 제거하였기 때문인 것으로 보인다. 그러나, 이 돌연변이는 천연 dNTP 및 5'-아미노 dNTP의 도입을 위한 변이체의 활성을 감소시켰다. 이 경우에, E710S 돌연변이를 사용하면 E710S가 rNTP 기질의 2'-OH와 H-결합을 형성할 수 있기 때문에 활성을 개선시킬 것이다. E710A 또는 E710S 돌연변이는 또한 그 자체로는 폴리머라제 활성에 거의 영향을 주지 않는 선행 기술의 변이체인 Y766F (Astatke et al., J. Biol. Chem., 1995, 270:1945-54)와 조합하여 사용될 수 있다. Y766의 결정 구조는 그의 히드록실이 E710의 측쇄와 수소 결합을 형성하여 E710이 Ala로 말단이 절단될 때 폴리머라제 활성에 영향을 줄 수 있다는 것을 보여준다. 다른 한편으로, E710 돌연변이는 F762A와 함께 한정된 위치에서 당 고리를 유지시킴으로써 활성을 개선시킬 수 있다. 이와 유사하게, 5'-아미노 유사체의 보다 양호한 도입은 5'-질소가 뉴클레오티드의 형태를 변경시켜 알파-인 원자의 배열을 변형시키기 때문에 뉴클레오티드 기질에 대한 폴리머라제의 결합을 완화시킴으로써 달성될 수 있다. 처음 에, 촛점은 뉴클레오티드 기질의 당 및 인산염을 유인하는 제한된 수의 잔기, 예를 들어 잔기 R668, H734 및 F762에 대한 돌연변이 발생에 맞추어졌다. H881 잔기도 잘 적용되었다. dNTP 결합 부위로부터 추가로 유도된 것이지만, 상기 위치에서의 Ala 치환은 dNTP 도입의 충실도에 영향을 준다 (Polesky et al., J. Biol. Chem., 1990, 265:14579-91). 이들 잔기는 최대 효과를 갖는 아미노산 잔기를 확인하는 카세트 돌연변이 및 상기한 활성 폴리머라제의 후속 선별을 위해 표적화될 수 있다. R668K 치환은 프라이머 3'-NMP와의 마이너 그루브 상호작용을 보존하면서 dNTP에 대한 접촉을 제거하여야 하기 때문에 특히 관심의 대상이 된다. 다른 한편으로, R754 및 K758은 베타 및 알파 인산염과 접촉하지만, 이들 위치의 변화는 촉매 작용을 심하게 손상시킬 가능성이 있다. 이들 위치의 히스티딘 또는 리신은 인산염과의 상호작용을 보존할 수 있고 활성을 보유할 수 있다.
당업자는 상기 설명한 클레나우 폴리머라제에 대한 바람직한 아미노산 변형의 집합을 이들 폴리머라제의 유용한 변이체를 생성시키기 위해 다른 폴리머라제에 적용할 수 있다는 것을 인식할 것이다. 이것은 다른 폴리머라제의 대응하는 아미노산의 위치를 결정하기 위해 클레나우 폴리머라제의 아미노산 서열과 다른 폴리머라제의 아미노산 서열을 정렬하고(하거나), 결정 구조가 가용한 경우 오르토로거스(orthologous) 아미노산을 확인하기 위해 다른 폴리머라제의 3차원 구조를 클레나우 폴리머라제의 3차원 구조와 비교함으로써 달성할 수 있다. 부위 지정 돌연변이 유발의 수행 및 원핵세포 벡터의 변이체 폴리머라제 발현 방법은 당업계에 공지되어 있다 (Ausubel, F. M., et al., Current Protocols in Molecular Biology, John Wiley & Sons, 1998).
변형 뉴클레오티드를 도입할 수 있는 변이체 폴리머라제의 생산 및 스크리닝 외에, 다른 폴리머라제 특성을 스크리닝하는 것도 일부 경우에 유용할 수 있다. 일반적으로, 후술되는 추가의 바람직한 폴리머라제 특성은 변형 뉴클레오티드 도입보다 분석하기가 더 어렵기 때문에, 이들 추가의 특성의 분석은 변형 뉴클레오티드를 도입하는 능력이 입증된 변이체 폴리머라제의 제2 스크리닝으로서 수행될 수 있다. 본 발명의 한 특징은 변형 뉴클레오티드의 절단이 변형 뉴클레오티드와 폴리머라제 사이의 접촉에 의해 유도되거나 강화될 수 있다는 것이다 (실시예 및 도 20-26 참조). 이것은 별개의 절단 단계를 불필요하게 만들기 때문에 바람직한 절단 방식이다. 따라서, 절단 강화 특성에 대해 변이체 폴리머라제를 분석하는 것이 유용하다. 상기 특성의 간단한 한 분석법은 프라이머 다음의 신장 서열이 절단 가능한 뉴클레오티드(들)을 포함하고 검출가능하게 표지된 상이한 뉴클레오티드가 그 다음에 존재하는 프라이머 신장법이다. 폴리머라제가 조력하는 절단의 경우에, 표지된 분자는 프라이머로부터 분리되어 보다 작은 표지된 분자를 생성시키고, 이것은 전기영동 또는 다른 방법에 의해 검출될 수 있다. 변이체 폴리머라제의 다른 유용한 특성은 주형 스트랜드 내의 변형 뉴클레오티드 또는 뉴클레오티드들을 인식하여 신생 상보성 스트랜드에 적합한 상보성 뉴클레오티드 (천연 또는 변형)의 도입을 촉매하는 능력이다. 이 특성은 새로이 합성되는 폴리뉴클레오티드가 연속 증폭시에 주형으로서 작용하는 PCR과 같은 순환 방법에 사용되는 폴리머라제를 위한 필요 조건이다. 상기 특성의 간단한 분석은 프라이머 신장 반응이 바로 변형 뉴클 레오티드(들)을 만나도록 프라이머의 말단 바로 다음에 변형 뉴클레오티드 또는 뉴클레오티드들을 갖도록 주형 스트랜드가 합성되는 짧은 프라이머 신장법이다. 변형 뉴클레오티드(들)을 주형으로 사용함을 나타내는, 주형을 통한 성공적인 중합은 주형으로서 변형 뉴클레오티드를 사용한 실패보다는 더 긴 신장 산물을 야기할 것이다. 신장 산물은 변형 뉴클레오티드(들)을 횡단한 후에만 표지 뉴클레오티드를 주형에 도입하도록 하기 위해 주형 합성에 의해 용이하게 검출되도록 만들 수 있다. 신장 산물의 서열은 변형 뉴클레오티드 반대편의 신장 스트랜드 상에 도입되는 뉴클레오티드가 적합한 것인지를 확인하기 위해 결정될 수 있다. 폴리머라제의 다른 유리한 특성은 높은 충실도, 내열성 및 처리성을 포함한다. 이들 특성 분석법은 공지되어 있다.
실시예 2: 모노뉴클레오티드 제한에 의한 변이 검출
하기 방법은 폴리뉴클레오티드의 완전한 서열을 얻을 필요없이 폴리뉴클레오티드에서 뉴클레오티드 서열의 변이를 검출하는 일례이다. 본 실시예에 사용된 변형 뉴클레오티드는 7-메틸구아닌 (7-메틸G)이고, 분석 하의 폴리뉴클레오티드는 특정 DNA의 66 염기쌍 단편이지만, 설명되는 기술은 상기 논의한 변형 뉴클레오티드 또는 본 발명의 범위에 포함되는 다른 변형 뉴클레오티드를 사용하여 실시할 수 있음을 이해할 것이다. 폴리뉴클레오티드는 폴리머라제에 의해 생성될 수 있는 임의의 길이의 폴리뉴클레오티드일 수 있다.
복제 인자 C (RFC) cDNA의 38 Kda 서브유닛의 66 염기쌍 영역은 PCR에 의해 증폭하였다. 3개의 프라이머를 2개의 별개의 증폭 반응에 사용하였다. 전향 프라 이머 (RFC bio)는 비오티닐화된 것이다. 이것은 스트렙타비딘 코팅된 비드를 사용하여 단일 스트랜드 주형의 단리를 가능하게 하고, 이것은 7-메틸G를 도입하는 이. 콜리 DNA 폴리머라제의 클레나우 엑소- 단편을 사용하여 신장될 수 있다. 또한, 이것은 신장 후 절단 전에 변형 7-메틸G DNA를 제거할 수 있게 한다.
2개의 역방향 프라이머를 별개의 증폭 반응에 사용하였다. 한 프라이머는 RFC 유전자 (RFC)의 천연 서열에 매치하고, 다른 프라이머 (RFC mut)는 염기 변이 (T를 C로)를 66 염기쌍 RFC 서열에 도입한다. 프라이머 및 대응하는 산물은 일부 도면에서 표지된 RFC 4.4 및 RFC 4.4 Mut이다.
PCR 및 상기 2개의 프라이머를 사용하여, 66 염기쌍 단편을 제조하였다 (도 1). 2개의 단편은 한 위치에서 상이하고, 비오티닐화 스트랜드에서 T에서 C로, 상보성 스트랜드에서 A에서 G로 변화되었다 (2개의 역방향 프라이머에 의해 코딩됨). PCR 산물은 스트렙타비딘 아가로스를 사용하여 정제하고, 각 PCR 산물로부터 비비오티닐화 스트랜드를 용출시켜 프라이머 신장을 위한 주형으로서 사용하였다. 비오티닐화 프라이머 RFC bio는 dATP, dCPT, dTTP 및 7-메틸dGTP의 존재 하에 상기 주형에 대해 신장시켰다.
이어서, 스트렙타비딘 아가로스 결합된 단일 스트랜드 DNA는 변형 DNA 단편에 7-메틸G를 도입하는 부위에서 절단하기 위해 90 ℃에서 30분 동안 피페리딘과 함께 인큐베이션하였다. 또한, 이 처리는 비오티닐화된 단편을 스트렙타비딘으로부터 분리시켰다. 반응 혼합물을 원심분리하여 폴리뉴클레오티드 함유 상등액을 새로운 튜브에 이송하였다. DNA를 Speedvac에서 건조시키고 탈이온수에 재현탁시 켰다. 이 시료에 대해 MALDI 질량 분광법을 실시하였다.
도 2는 7-메틸G의 각 도입 부위에서 비오티닐화 DNA 스트랜드의 절단 결과로서의 목적 예상 단편의 분자량을 보여준다. 이들 단편 및 그 분자량은 27머(8772.15), 10머(3062.92), 8머(2557.6), PCR 반응에 사용된 역방향 프라이머에 따라 10머다음의 RFC (3054.9) 또는 RFC mut (3039.88)이다. 또한, 비오티닐화 20머프라이머는 신장 반응에 과량으로 제공되기 때문에 존재한다. 15 달톤 차이나는 RFC 및 RFC mut의 10머단편은 검출되어 질량 분광계에 의해 해상되어 점 돌연변이를 나타내는 것이다.
도 3은 피페리딘을 사용한 절단 전후의 RFC 및 RFC mut 클레나우 폴리머라제 신장 단편의 변성 폴리뉴클레오티드 서열화 겔 분석을 보여준다. 모든 예상 단편은 두 경우에 모두 존재하였다. 추가의 작은 밴드의 대부분은 피페리딘에 의한 DNA 스트랜드의 불완전한 절단의 결과이다. 완전한 절단은 90 ℃에서 30분 동안 새로 증류된 피페리딘을 사용한 피페리딘 처리의 2 싸이클 (각 싸이클 후에 시료의 건조 및 세척 실시) (데이타 미제시)을 통하여 달성할 수 있다. 8-머와 10머사이에 존재하는 RFC mut 절단 (도 3의 레인 4) 밴드는 완전 또는 불완전 절단에 의해 설명되지 않는 유일한 밴드이다.
도 4는 RFC 시료의 RFC 질량 분광 사진이다. 우측의 먼 피크는 모든 다른 밴드의 분자량을 계산하기 위한 표준물로서 사용된 비오티닐화 프라이머 밴드이다. 분광 사진의 좌측은 모든 예상된 3개의 절단 밴드 (2개의 10머및 1개의 8-머)를 보여준다. 도 4의 삽입체는 2개의 10머및 1개의 8머주위의 영역의 확대도이다. 이 영역의 분자량은 보정을 위해 사용된 프라이머가 20 달톤 떨어져 있기 때문에 모두 균일하게 약 20 달톤만큼 떨어져 존재하였다. 그러나, 피크 사이의 질량 차이는 모두 정확하게 예상된 것이었다.
도 5는 RFC mut 시료의 질량 분광 사진 및 그의 확대 부분을 보여준다. 2개의 피크, 즉 10머중의 하나 (3089.67) 및 8머(2576.93)는 RFC 및 RFC mut 시료 사이에 동일하게 유지되어야 한다. 나머지 10-머의 분자량은 1개의 T의 C로의 스위치에 의해 15.02 Da (3054.9에서 3039.88로)만큼 RFC-mut 10-머에서 감소하여야 하고, 이것과 불변 RFC 10머사이의 질량 차이는 30.04 (3039.88 대 3069.92)이어야 한다. 그러나, RFC mut에서 실제로 얻어진 질량 차이는 319.73 Da이었다. 이것은 뉴클레오티드 57-66에 대응하는 10-머로부터 C 결실에 의한 것일 수 있다. 또한, 이것은 RFC mut 서열화 겔 상의 변형 9-머를 설명한다 (도 3). 이렇게 하기 위해서, 증폭 반응에 사용되는 시판되는 파라이머는 G가 결실된 것이어야 한다. RFC 프라이머, RFC mut 프라이머 및 하나의 G가 결실된 RFC mut 프라이머의 예상 분자량은 표 6에 나타내었다. RFC mut 올리고뉴클레오티드 프라이머의 합성시에 에러가 발생한다는 가설을 시험하기 위해서, RFC 및 RFC mut 올리고뉴클레오티드를 조합하여 질량 분광계로 분석하였다. 얻어진 질량 차이에서 알 수 있는 바와 같이 (도 6 및 표 6), 가설이 옳았으며, RFC mut 프라이머에는 실제로 하나의 G가 결실되었다.
본 발명의 방법의 뛰어남은 상기 실험에서 분명하게 알 수 있다. 공지의 서열 및 공지의 뉴클레오티드 변이를 사용하여 대조 시험으로서 시작하여 실제로 예 상하지 못한 위치에 미지의 변이체(RFC mut 프라이머)를 실제로 검출하였다.
실시예 3: 디뉴클레오티드 제한에 의한 변이 검출
4개의 염기쌍 인식 부위를 갖는 제한 효소는 256 (44) 염기마다 1회 절단하는 통계적 빈도로 DNA를 특이적으로 절단하여 질량 분광계로 분석하기에는 너무 큰 단편을 생성시킬 것이다 (도 19A). 본 발명의 화학적 디뉴클레오티드 제한 전략은 동일한 폴리뉴클레오티드의 훨씬 더 작은 단편을 생성시킨다. 얻어진 단편의 평균 크기는 질량 분광법 분석에 매우 적합한 16 (24) 염기이다 (도 19B).
본 발명의 화학적 제한 원칙의 예는 도 20에 예시되어 있다. 이 도면에는 5'에서 3' 방향으로 연결된 리보뉴클레오티드 및 5'-아미노뉴클레오티드를 갖고, 이에 의해 포스포르아미데이트 연결에 매우 근접하여 리보뉴클레오티드의 2'-히드록실기를 위치시키는 디뉴클레오티드쌍이 도시되어 있다. 히드록실기가 인 원자를 공격하여 2',3'-시클릭 포스페이트를 형성함으로써 상기 특정 디뉴클레오티드 부위에서 DNA를 절단시키기 때문에 포스포르아미데이트 링커의 화학적 불안정성이 증가한다.
도 21에는 본 방법의 실제 응용예가 도시되어 있다. 5'-32P 표지된 20 뉴클레오티드 프라이머는 pH 9의 Tris 완충액 중에서 87 뉴클레오티드의 단일 스트랜드 주형을 사용하여 클레나우 (엑소-) 및 E710A 클레나우 (엑소-) 폴리머라제의 혼합물로 신장시켰다. 프라이머 신장은 대응하는 천연 뉴클레오티드 대신에 리보GTP (레인 1), 5'-아미노 TTP (레인 3) 또는 리보GTP/5'-아미노TTP (레인 5)를 사용하여 수행하였다. 신장 후에, 반응 혼합물을 G25 컬럼 상에서 정제하였다. 리보G 함유 신장 산물은 수성 염기로 절단하여 G 서열화 래더를 생성시켰다 (레인 2). 5'-아미노T 함유 산물은 산에 불안정하고 절단되어 T 서열화 래더를 생성시켰다 (레인 4). 리보GTP/5'-아미노TTP를 사용한 신장 반응 조건 하에서 (레인 5), 64 뉴클레오티드 산물을 예상된 87 뉴클레오티드 대신에 수득하였다. 흥미롭게도, 64 뉴클레오티드 단편은 GT 제한에서 예상된 디뉴클레오티드 절단 산물의 하나이고 방사성 사진에 의해 가시화되어야 하는 유일한 것이다. 상기 산물의 산 절단은 T 래더를 생성시키지만 (레인 6), 염기 절단은 G 래더를 생성시키고 (레인 7), 이것은 리보GTP와 5'-아미노TTP 모두가 폴리뉴클레오티드에 성공적으로 도입되었음을 나타낸다. 이 결과로부터, GT 제한 절단은 신장 및(또는) 마무리 처리 과정에서 발생하고, 이것은 2개의 변형 뉴클레오티드의 상승적 불안정성에 의한 것일 가능성이 가장 크다고 결론지을 수 있다.
3개의 모든 예상된 제한 단편을 가시화시키기 위해서, 동일한 신장-절단 실험을 α-32P-dCTP의 존재 하에 수행하였다. 도 22에 도시한 바와 같이, 3개의 GT 제한 단편이 예상 상대 이동도 및 특정 방사성으로서 관찰되었다.
상기 디뉴클레오티드 제한 방법의 다양한 유용성은 동일한 DNA의 AT 제한에 의해 입증되었다. 특이적인 AT 제한은 폴리아크릴아미드 겔 전기영동 (PAGE) 분석에 의해 관찰되었다 (도 23). 유사하게 생성된 비방사성 산물을 MALDI-TOF 질량분광계로 분석하였다 (도 24). G25 컬럼 정제시에 상실된 2개의 뉴클레오티드로 이 루어진 단편을 제외하고는 모든 예상된 제한 단편이 관찰되었다.
상기 기술의 일반적인 응용성은 더 길고 상이한 DNA 주형을 사용하여 추가로 입증된다 (도 25 및 26). 리보ATP 및 5'-아미노TTP를 사용한 프라이머 신장 및 후속 AT 제한은 PAGE 분석 (도 25) 또는 MALDI-TOF 질량 분석 (도 26)에 의해 관찰된 바와 같이 예상 올리고뉴클레오티드를 생성시켰다.
실시예 4: 완전 치환/완전 절단에 의한 유전자형 분석
화학적 제한에 의한 하기 유전자형 분석 방법은 정확성 및 속도 증가를 포함하여 많은 잇점을 갖기 때문에 다른 유전자형 분석법의 매력적인 대안이다. 일반적으로, 상기 방법은 화학적으로 변형된 뉴클레오티드를 사용한 게놈 DNA의 PCR 증폭 및 생성 앰플리콘을 갖는 변형 염기의 화학적 절단을 수반한다. 도 27에는 상기 기술의 개략적인 내용이 제시되어 있다. 프라이머의 하나 (프라이머 1)는 다형성 염기 중의 하나 (예를 들어 A)가 제1 절단가능 뉴클레오티드로서 선택될 수 있도록 목적 다형성 부위에 근접하도록 고안된다. 화학적으로 변형된 뉴클레오티드 (다른 3개의 천연 뉴클레오티드로 보충됨)를 사용한 PCR 증폭 후에, 2개의 대립유전자 중의 하나만이 다형성 부위에서 절단될 수 있다. 화학적 시약을 사용한 처리는 프라이머 1을 포함하는 절단 산물을 생성시키고, 이 산물의 길이는 시료의 유전자형을 나타낼 수 있다. 질량 분광법 또는 전기영동에 의한 분석은 예상 길이 차이를 확인하기 위해 실시할 수 있다. 또한, 질량 분광 분석은 다형체를 함유하는 상보성 DNA 스트랜드의 단일 염기 차이를 밝혀내어 고유한 여유도(redundancy) 및 보다 높은 정확도를 제공할 수 있다.
도 28 내지 31에는, 트랜스페린 수용체 (TR) 유전자의 유전자형 분석에 이용된 화학적 절단 및 분석 방법이 도시되어 있다. TR 유전자의 82 bp DNA 서열을 다형체의 위치 및 증폭 효율을 기초로 하여 선발하였다 (도 28). 다형성 염기 (A 또는 G)는 프라이머 1의 3' 말단으로부터 3번째 염기에 위치한다. 이 3번째 염기가 A 대립유전자에 대해 도입되는 첫번째 변형 뉴클레오티드이고, G 대립유전자에 대한 제1 절단가능 염기는 프라이머로부터 6번째 염기이다. 그 결과, 길이가 상이한 단편이 화학적 절단으로부터 생성된다. 폴리머라제 AmpliTaq Gold (0.1 단위/㎕ Cycler) (MJ Research PTC-200)를 사용하여 35회의 증폭 싸이클(1분 변성, 1.5분 어닐링 및 5분의 신장)로 PCR 증폭 반응 (각각 50 ㎕)을 표준 완충액 중에서 수행하였다. 5% 비변성 폴리아크릴아미드 겔 (Sigma사의 Stains-All로 염색됨) 상에서의 PCR 산물의 분석 결과는 7-데아자-7-니트로-dATP가 효율적인 PCR 증폭을 위해 dATP를 대신할 수 있음을 보여주었다 (도 28).
7-데아자-7-니트로-dATP로부터의 PCR 산물에 피페리딘, 트리스-(2-카르복실에틸)포스핀 (TCEP) 및 Tris 염기를 각각 최종 농도 1 M, 0.2 M 및 0.5 M로 총 부피 100 리터가 되도록 직접 첨가하였다. 95 ℃에서 1 시간 동안 인큐베이션한 후, 1 ml의 0.2 M 트리에틸암모늄 아세테이트 (TEAA)를 각 반응 혼합물에 첨가하고, 생성 용액을 OASIS 컬럼 (Waters)으로 정제하였다. 용출된 산물을 Speedvac에서 건조 농축시키고, 잔사를 질량 분광계 또는 전기영동으로 분석하였다. 도 29는 7-데아자-7-니트로-dATP의 절단으로부터 예상된 선택된 단편의 서열을 보여준다. 이 서열은 길이 및 분자량에 따라 분류하였다. 제1 군은 프라이머로부터 신장된 보다 긴 단편을 포함한다. 22 뉴클레오티드 단편은 내부 기준으로 사용될 수 있는 비변이 단편이다. 25 뉴클레오티드 또는 28 뉴클레오티드 단편은 각각 A 또는 G 대립유전자로부터 예상된 것이다. 음영 처리된 서열군은 내부 기준으로 사용될 수 있는 비변이 13 뉴클레오티드 및 11 뉴클레오티드 단편 및 15 Da 질량 차이를 갖는 TR 유전자의 2개의 대립유전자 형태로부터 예상된 한쌍의 11 뉴클레오티드 단편을 포함하여 상보성 DNA 스트랜드로부터 유래한 것이다. 도 30a에는 82 bp 이종접합체 TR DNA 시료로부터 화학적으로 절단된 산물의 MALDI-TOF 스펙트럼이 도시되어 있다. 스펙트럼의 하일라이트는 도 29에 도시된 단편을 포함하는 2개의 영역이다.
각각 정제된 절단 시료를 3-히드록시피콜린산과 혼합하여 Perceptive Biosystems Voyager-DE 질량 분광계로 MALDI-TOF 분석을 실시하였다. 7000-9200 달톤 영역의 질량 스펙트럼을 기록하고 3개의 TR 유전자형에 대한 결과를 도 30b에 도시하였다. 스펙트럼은 비변이 22 뉴클레오티드 단편 (7189 Da)를 나타내는 피크를 사용하여 배열하였다. AG 이종접합체 시료에 대해 A 대립유전자에 대응하는 피크 (8057 Da) 및 다른 G 대립유전자에 대응하는 피크 (9005 Da)가 추가로 관찰되었다. 예상한 바와 같이, GG 또는 AA 이종접합체 시료에 대해서는 각각 G 또는 A 대립유전자로부터의 절단 단편의 분자량을 갖는 1개의 추가 피크만이 관찰되었다. 도 31a는 3700-4600 Da 영역의 AG 이종접합체 시료의 질량 스펙트럼을 보여준다. 내부 표준으로서의 3807 Da 및 4441 Da 단편을 사용하여 상기 시료의 유전자형은 15 Da 질량 차이를 갖는 스펙트럼의 중앙에 위치하는 2개의 피크의 관찰을 통해 확인하였다. 질량 분광계로 관찰된 분자량은 인산염-데옥시리보스-TCEP 애덕트가 절 단 반응 동안 균일하게 형성되어 3' 말단이 변형된 단편을 생성시킨다는 것을 나타내었다 (도 31b). 도 30 및 도 31에 나타낸 데이타는 또한 질량 분광법을 화학적 제한과 조합하여 양 DNA 스트랜드로부터 확인된 유전자형 정보를 제공하여 분석의 정확도를 보장할 수 있음을 입증한다.
별법으로, 화학적으로 제한된 시료는 2개의 대립유전자로부터 생성된 진단 길이 차이를 검출하기 위해 전기영동으로 분석할 수 있다. 모세관 전기영동 (CE) 분석은 UV 검출기 및 변성 선형 폴리아크릴아미드 겔을 포함하는 모세관이 탑재된 직접 제작한 기구를 사용하여 수행하였다. 도 32a는 상이한 유전자형의 TR 시료로부터 얻은 CE 크로마토그램을 보여준다. 예상한 바와 같이, 각각의 유전자형은 예상된 절단 산물의 길이에 대응하는 상이한 용출 패턴을 보여주었다. AA 동종접합체 시료는 25 뉴클레오티드 단편을, GG 동종접합체는 28 뉴클레오티드 단편을 생성시켰지만, AG 이종접합체 시료는 25 뉴클레오티드 및 28 뉴클레오티드 산물을 모두 생성시켰다. 5' 말단을 32P로 표지한 후에, 절단 시료에 대해 PAGE 분석을 실시하였다. 도 32b의 생성된 방사성 사진은 절단이 배경이 거의 없는 상태로 특이적이고 유전자형 결과가 분명함으로 입증한다.
다른 검출 방법은 형광 공명 에너지 전달 (FRET)의 사용을 수반한다. RFET는 TaqMan 분석 (Todd J. A. et al., 1995, Nature Genetics, 3:341-342) 및 Molecular Beacons (Tyagi, S. et al., 1998, Nature Biotechnology, 16:49-53)에 의한 다형체 검출에 성공적으로 적용되었다. 그러나, 더 긴 프로브가 표적 서열 ( 예를 들어 AT 풍부 서열)에 혼성화하는데 필요한 경우, 단일 뉴클레오티드 미스매치에 의한 매우 작은 차이를 구별하는 것이 더욱 어렵게 된다. 이 경우에 화학적 제한의 잇점은 도 33에 예시되었다. 상기 실시예와 유사하게, 다형성 염기 중의 하나 (예를 들어 A)의 변형 뉴클레오티드 유사체가 PCR 증폭에서 그의 천연 대응물 대신에 사용된다. 프라이머 1은 다형성 염기 A가 A 대립유전자의 제1 절단가능 뉴클레오티드가 되도록 다형성 부위에 근접하도록 고안된다. 프라이머 1은 또한 3' 말단에 근접하게 위치한 형광기 (F1)로 표지된다 (도 33a). 증폭 및 화학적 제한 후에, 제2 형광 F2에 공유결합된 프로브(도 33b)를 첨가하여 2개의 형광단 사이의 FRET 효과를 측정할 수 있다. 한 대립유전자가 다른 대립유전자보다 프라이머 1의 3'에 보다 더 근접하여 절단되기 때문에, 혼성화시 이들 사이의 차이는 단일 뉴클레오티드 미스매티보다 클 것으로 예상되고, 2개의 대립유전자 표적을 구별하기 위해 이용될 수 있다. 도 33c에 도시된 바와 같이, 실험 온도를 저하시켜 G 대립유전자로부터의 보다 긴 단편만이 프로브에 혼성화하여 FRET를 생성시킬 수 있다. 상기 시스템에서 "NO FRET" 결과는 대립유전자 A로서 또는 실패한 PCR 증폭으로 해석될 수 있기 때문에, 보다 저온에서 대립유전자 A로부터의 더 짧은 단편의 양성 검출을 보장하기 위해 상이한 온도에서 각 시료의 형광을 측정하는 것이 필요하다. 별법으로, 상기 양성 검출은 도 33d에 도시한 바와 같은 헤어핀 구조의 프로브를 사용하여 달성할 수 있다. 프로브는 5' 말단의 형광 F3 외에 헤어핀을 형성하도록 재폴딩되는 5' 말단을 갖는다. A 대립유전자로부터의 짧은 절단 단편과 헤어핀 프로브는 도시된 바와 같은 가교 이중체를 형성할 수 있어 F1과 F3 사이에 검출가능 한 FRET를 생성시킬 수 있다. G 대립유전자로부터의 보다 긴 단편과의 스트랜드 내 혼성화는 헤어핀 안정성과 경쟁하여 F1과 F3 사이의 FRET를 상실시킬 수 있다.
실시예 5: 부분 치환/부분 절단에 의한 완전 서열 결정
다음 방법을 사용하여, 1세트의 서열 결정 반응에서 변형 뉴클레오티드의 존재 하의 중합, 중합 산물의 효소에 의한 제한, 제한 단편의 정제 및 각 단편으로부터 서열 래더를 생성시키는 화학적 분해에 의해 10,000, 20,000 또는 그 이상의 염기로 이루어진 폴리뉴클레오티드의 서열을 완전하게 결정할 수 있다. 이 방법은 주형의 크기 및 프라이머 신장에 사용된 폴리머라제의 처리성 (중합 반응을 진행시키는 능력)에 의해서만 제한된다. 매우 과잉의 서열화를 필요로 하는 서열 삽입체가 정상적으로 분포하는 샷건 클로닝 라이브러리와는 달리, 본원에서 설명되는 방법을 사용하면 각 뉴클레오티드에 대해 1회의 시료 채취만이 필요하다. 제2 또는 심지어 제3 제한 효소 칵테일을 사용하여 방법을 반복하면 결과의 정확성을 보장하는데 필요한 여분을 공급하면서 동시에 전장 폴리뉴클레오티드 서열을 재구성하는 적합한 순서로 처음 제한으로부터 결정된 서열을 재구성하는데 필요한 서열 정보를 얻을 수 있다. 각 단계를 수행하기 위한 상이한 선택 조건이 아래에서 제공된다. 먼저, 설명되는 방법에 대한 다른 변형을 당업자는 용이하게 알 수 있으며, 이와 같은 다른 변형이 본 발명의 범위에 포함됨을 이해하여야 한다.
프라이머 분자량 질량 차이
RFCC 6099.6
RFC mut 6115.9 +16
RFC mut 5786.7 -313.2
a. 프라이머 및 주형의 어닐링
사용된 주형은 작거나 큰 삽입체 클로닝 벡터 또는 PCR 단편과 같은 증폭 산물일 수 있고, 단일 스트랜드 또는 이중스트랜드일 수 있다. 예를 들어, 주형은 플라스미드, 파지미드, 코스미드, P1, PAC, BAC 또는 YAC 클론일 수 있으며, 이것으로 제한되지 않는다. 주형은 모든 신장 산물이 동일한 부위에서 종결되도록 만들기 위해 신장 전에 이상적으로 선형으로 만든다. 이것은 제한 엔도뉴클레아제를 사용하여 주형을 제한함으로써 달성할 수 있다. 예를 들어, 주형은 희귀한 절단 효소 (즉, 예를 들어 7 또는 8개의 뉴클레오티드 모티프를 절단하는 효소)를 사용한 제한에 의해 선형 주형을 통상적으로 제조할 수 있도록 클로닝 부위의 어느 한쪽에 하나 이상의 희귀한 절단 효소 제한 부위를 갖는 벡터에 제조할 수 있다. Bluescript (Stratagene, Inc.)와 같은 많은 플라스미드 벡터는 상기 특징을 갖는다. 프라이머는 벡터 내의 서열에 어닐링하는 것, 예를 들어 M13의 보편적인 프라이머 서열을 선택할 수 있다. 이것은 하나 또는 두개의 프라이머(하나는 삽입체의 한쪽으로부터 유래)만을 사용하여 클론의 라이브러리의 서열을 결정할 수 있도록 한다. 별법으로, 일련의 삽입체 특이적 프라이머를 (약 5 내지 20 kb 간격으로) 프라이머 산재 형태로 사용할 수 있다.
b. 모든 4개의 천연 데옥시리보뉴클레오티드 및 천연 뉴클레오티드의 하나에 대응하는 변형 뉴클레오티드의 존재 하의 프라이머 신장
상기 변형 뉴클레오티드 중의 하나 또는 변형 폴리뉴클레오티드에 대해 선택적인 절단 특성을 부여할 수 있는 다른 변형 뉴클레오티드를 사용하여 주형의 전체 길이에 대해 프라이머를 신장시키기 위해 상기 논의한 방법을 사용하였다. 일반적으로, 변형 뉴클레오티드 대 그의 천연 대응물의 비율은 매우 작은 치환(약 1%)에서 완전한 치환(99% 이상)에 이르는 상당한 범위에 걸쳐 상이할 수 있다. 조절 인자는 후속 화학적 절단 반응의 효율이다. 절단 반응이 보다 효율적이면 도입 수준이 더욱 저하될 수 있다. 목표는 절단 후에 반응 혼합물 내의 각 분자가 서열화 래더에 도움을 주도록 하기 위해 제한 단편당 약 1개의 변형 뉴클레오티드를 갖도록 하는 것이다. 도 7은 이. 콜리 DNA 폴리머라제의 엑소- 클레나우 단편을 사용하여 변형 뉴클레오티드 5'-아미노 dTTP의 존재 하에 87 뉴클레오티드로 신장된 선형의 단일 스트랜드 M13 주형, 상기 변형 폴리뉴클레오티드를 보여준다. 도 9는 몰비 100:1의 5'-아미노-dTTP 및 dTTP의 존재 하에 M13 주형으로부터 다시 생성된 7.2 kb 신장 산물을 보여준다 (패널 A, 신장 산물).
c. 전장 프라이머 신장 산물의 정제 (선택 단계)
미성숙 종결 (즉, 전장 미만의 길이) 폴리머라제 신장 산물을 제거하여 절단 후 전기영동 상에 균일한 서열화 래더를 보장하기 위해서, 전장 또는 실질적으로 전장의 신장 산물을 정제하는 것이 바람직할 수 있다. 그러나, 절단후 제한 단편의 정제 (하기 단계 f)는 본질적으로 동일한 목적을 달성하고 대부분의 경우에 이 정제로 충분하다는 것을 알아야 한다. 어느 경우든 간에, 짧은 신장 산물의 제거는 당업계에 공지된 많은 방법, 예를 들어 회전 컬럼 크로마토그래피 또는 고성능 액체 크로마토그래피 (HPLC)에 의해 달성할 수 있다. 도 8은 산을 사용한 화학적 처리 전 (패널 A) 및 처리 후 (패널 B)의 정제된 전장 신장 산물을 보여준다.
d. 하나 이상의 제한 효소를 사용한 프라이머 신장 산물의 절단
상기한 바와 같이, DNA 서열화 주형 (이 경우, 제한 산물)의 최적 크기는 서열화 래더의 생성을 위해 겔 전기영동이 사용될 경우 약 300 내지 약 800 뉴클레오티드이다. 따라서, 10 Kb 이상의 전장 신장 산물을 제어가능한 크기로 감소시키기 위해 제한 엔도뉴클레아제를 사용하여야 한다. 상기 엔도뉴클레아제는 당업계에 다수 공지되어 있다. 예를 들어, 많은 4 염기 제한 엔도뉴클레아제가 공지되어 있으며, 이들은 일반적으로 목적 범위 내의 제한 산물을 생성시킬 것이다. 보다 짧은 제한 단편, 예를 들어 300 뉴클레오티드 미만의 단편의 서열이 결정될 수 있지만, 겔 전개를 가장 효율적으로 이용하기 위해서 제한 단편을 그 크기에 따라 분류하는 것이 바람직하다. 짧은 단편은 상대적으로 짧은 서열 결정 전개 시간을 요할 것이지만, 긴 단편을 더 긴 겔 및(또는) 긴 전개 시간을 필요로 할 것이다. 각각 하나 이상의 제한 엔도뉴클레아제 및 상용성 완충액을 함유하는 2 이상의 제한 엔도뉴클레아제 칵테일을 사용하여 제한 단편으로부터 폴리뉴클레오티드의 완전한 서열을 재조합하기 위해 필요한 중복 서열 정보를 제공할 수 있다. 도 9는 dTTP 및 변형 뉴클레오티드 5'-아미노 dTTP의 존재 하에 신장된 프라이머/주형 복합체의 제한 엔도뉴클레아제 분해의 예를 보여준다. 도 9에서 알 수 있는 바와 같이, 완전한 절단은 제한 엔도뉴클레아제 Msc I을 사용하여 수득하였다. 프라이머 신장 산물의 5' 말단만이 32P로 표지되었기 때문에 다른 MSC I 제한 산물은 보이지 않았다.
e. 제한 엔도뉴클레아제 산물의 표지
상기 방법에 의해 생성된 DNA 서열화 래더를 가시화시키기 위해, 검출가능한 표지로 제한 엔도뉴클레아제 산물을 표지하는 것이 필요하다. 많은 표지가 당업계에 공지되어 있고, 이들을 본 발명의 방법에 사용할 수 있다. 이들 중에는, 방사성 표지 및 화학 형광단이 존재하고, 이로 제한되지 않는다. 예를 들어, 35SdATP (Amersham Pharmacia Biotech, Inc) 또는 로다민-dUTP (Molecular Probes)가 프라이머 신장 단계에서 도입될 수 있다. 별법으로, DNA는 예를 들어 T4 폴리뉴클레오티드 키나제에 의한 제한 단편의 변형 또는 DNA 폴리머라제 및 표지된 뉴클레오티드를 사용한 빈 말단의 충전에 의해 제한 후에 표지될 수 있다. 상기 말단 표지는 당업계에 공지되어 있다 (예를 들어, Ausubel, F. M., et al., Current Protocols in Molecular Biology, John Wiley & Sons, 1998). 말단 표지는 균일한 서열화 래더를 제공하는 각 DNA 단편 상에 표지 1분자를 위치시킨다는 잇점을 갖는다. 주형은 그 서열 내에 변형 뉴클레오티드가 존재하지 않아 화학적 절단 반응 동안 절단되지 않기 때문에 주형 스트랜드의 표지는 중요하지 않다. 따라서, 주형 스트랜드에 대한 서열화 래더는 생성되지 않을 것이다.
f. 표지된 제한 엔도뉴클레아제 산물의 분리
제한 단편은 화학적 절단 전에 분리되어야 한다. 이를 달성하기 위한 많은 방법이 당업계에 공지되어 있다 (예를 들어, Ausubel, F. M., op. cit 참조). 특히 유용한 기술은 신속하고 간단하며 효과적이고 자동적으로 작동하는 HPLC이다. 예를 들어, 도 10은 Hae III 제한 PhiX174 DNA의 HPLC에 의해 얻어진 분리 결과를 보여준다. 이온 역상 HPLC 및 이온 교환 HPLC는 바람직한 분리 방법이다.
g. 변형 뉴클레오티드 도입 부위에서 분리된 표지 제한 엔도뉴클레아제 단편의 절단
도입되는 변형 뉴클레오티드에 따라, 상기한 바와 같은 절단 반응의 하나 또는 변형 뉴클레오티드의 도입 부위에서 선택적으로 절단하는 다른 절단 반응이 사용되고, 상기 다른 절단 반응은 본 발명의 범위에 포함된다.
h. 단편의 서열 결정
도 11은 T가 5-아미노 T로 치환된 폴리뉴클레오티드로부터 얻어진 서열 래더를 보여준다. 이 래더는 물론 표적 폴리뉴클레오티드의 완전 서열에서 T가 발생하는 위치만을 보여준다. 전체 서열을 얻기 위해서, 상기 과정을 3회 이상 반복하고, 각각의 경우에 나머지 뉴클레오티드 A, C 및 G 중의 하나는 대응하는 변형 뉴클레오티드, 예를 들어 5'-아미노-dATP, 5'-아미노-dCTP 또는 5'-아미노-dGTP로 치환될 것이다. 모든 4개의 각각의 단편 래더를 확보하면, 폴리뉴클레오티드의 완전 서열은 겔 서열화 데이타의 분석 및 비교에 의해 용이하게 재구성할 수 있다.
실시예 6: 질량 분광법과 조합하여 실질적으로 완전한 치환/실질적으로 완전한 절단에 의한 완전한 서열화
폴리뉴클레오티드의 완전한 서열화를 위한 선행 과정은 서열이 해독되는 단편 래더를 생성시키기 위해 겔 전기영동의 사용을 계속 필요로 한다. 상기한 바와 같이, 겔 전기영동은 재현가능하고 정확한 결과를 합리적으로 보장하는 방식으로 수행하기 위해 상당한 수준의 기술을 필요로 하는, 시간 및 노동 집중적 방법이다. 본 발명의 한 특징은 겔 전기영동을 사용할 필요를 완전히 제거하고 그 대신에 비교적 사용하기 간단하고 신속하며 감도가 양호하고 정확하며 자동 수행가능한 질량 분광법을 수행할 수 있다는 것이다. 본 발명의 상기 특징은 상기 8개의 단편쌍 및 8개의 단편쌍과 동일한 세트의 뉴클레오티드의 부가를 기초로 한 다른 단편쌍을 제외하고는 실질적으로 모든 2머내지 14머분자량의 상기 논의한 특징을 기초로 한다. 다음은 본 발명을 수행하는 방법의 일례이다. 이 실시예를 각 단계에서 인간의 개입 및 특정 분석법의 측면에서 설명하지만, 당업자는 분석 방법을 완전히 자동화하고 본 발명의 특징의 속도를 증가시킬 수 있는 컴퓨터 프로그램을 고안할 수 있다는 것을 용이하게 알 수 있을 것이다. 상기 컴퓨터 프로그램의 사용은 따라서 본 발명의 범위에 포함된다.
질량 분광법에 의해 완전한 뉴클레오티드 서열을 결정하는 방법은 하기 단계를 수반한다.
a. 폴리뉴클레오티드의 천연 뉴클레오티드를 변형 뉴클레오티드로 실질적으로 완전히 치환하여 변형 폴리뉴클레오티드를 형성. 이것은 상기 논의한 폴리머라제 반응을 사용한 프라이머 신장 또는 증폭 방법에 의해 달성된다. 선택적으로, 상기 논의한 방법을 사용하여 목적하는 변형 폴리뉴클레오티드 제조를 위한 최적 폴리머라제 또는 폴리머라제의 세트를 제조할 수 있다.
b. 변형 폴리뉴클레오티드 내의 변형 뉴클레오티드의 도입 지점에서만 실질적으로 완전한 절단이 실시되도록 하는 조건 하에서의 변형 폴리뉴클레오티드의 절단 및
c. 상기 절단 반응에서 수득된 단편의 질량 측정.
상기 3 단계는 이어서 3회 이상 반복하고, 각 반복시에는 나머지 천연 뉴클레오티드 각각에 대응하는 상이한 변형 뉴클레오티드를 사용한다. 그 결과는 일련의 질량이고, 이로부터 본래의 전체 폴리뉴클레오티드의 모든 또는 대부분의 서열을 확인할 수 있다. 주 분석 실시 후에도 존속하는 서열의 모호성은 인접 디뉴클레오티드 치환/절단 반응을 수반하는 하나 이상의 반응을 사용하여 또는 통상의 DNA 서열화 방법에 의해 쉽게 해결할 수 있다. 다음은 단편 분석을 수행하는 일례이다.
16 머 프라이머로부터 신장된 하기 20 뉴클레오티드 천연 올리고머를 사용하여 dTTP, dCTP, dGTP 및 변형 dATP의 존재 하에 중합하면 실질적으로 완전한 절단 후에 그 질량이 표 7에 나타내 바와 같은 5개의 단편이 생성된다.
5'-프라이머-TTACTGCATCGATATTAGTC-3'
나머지 3개의 천연 뉴클레오티드에 대해 상기 방법을 3회 수행하면 그 질량이 표 7에 나타낸 바와 같은 3개 이상의 단편 세트가 생성된다. 이들 질량으로부터, 모든 단편의 뉴클레오티드 함량 (서열이 아니라)이 결정될 수 있다. 실제 서열은 4개의 모든 절단 결과를 함께 분석함으로써 결정된다.
예를 들어, 표 1의 모든 단편의 질량을 참고하면, 각 절단 세트 내의 한 질량만이 16개보다 많은 뉴클레오티드를 포함하고, 다른 모든 단편은 프라이머의 3'이고 (프라이머 함유 단편은 적어도 16개의 뉴클레오티드이어야 하기 때문에), A 절단 컬럼에서 프라이머 다음에 2개, C 컬럼에 3개, G 컬럼에 5개의 뉴클레오티드 가 존재하고, T 컬럼에는 존재하지 않는다는 것을 용이하게 알 수 있다. 따라서, 서열은 TT로 시작하여 A, C, 미지의 뉴클레오티드 및 G이어야 한다. A, C 또는 G 절단은 상기 초기 간격에서 발생하지 않기 때문에 서열은 2개의 T 잔기로 시작하여야 한다. 또한, 상이한 절단 세트의 단편의 질량을 더함으로써 서열화되지 않은 역역의 길이가 20 뉴클레오티드임을 알 수 있다. 4개의 절단 세트의 뉴클레오티드의 숫자도 용이하게 확인할 수 있다. 세트 A: (프라이머 + 2) + 5 + 4 + 3 + 2 = 16, 세트 C: (프라이머 + 3) + 10 + 3 + 3 + 1 = 20, 세트 G: (프라이머 + 5) + 7 + 5 + 3 = 20, 세트 T: 4 + 3 + 3 + 2 + 2 + 1 = 15. 상기 정보로부터, A 및 T 세트 내에 중복 단편이 존재한다는 것을 분명하게 알 수 있다.
프라이머 함유 단편으로부터 프라이머의 공지의 질량을 공제하면 프라이머 직후에 존재하는 서열의 뉴클레오티드 함량을 알 수 있다. 따라서, 레인 A에서, 표 3의 608 달톤의 나머지 질량은 TT에 대응하는 것을 알 수 있고 이것은 미지의 단편 서열에서 처음 2개의 뉴클레오티드이다. 따라서, 프라이머 다음의 서열은 TTAC_G로 파악될 수 있다. G 레인에서 5 머의 질량 (1514 달톤)으로부터, 5-머는 3개의 T, 1개의 A 및 C를 함유한다는 것을 알 수 있다. 따라서, 상실 뉴클레오티드는 T가 분명하고, 처음 서열은 TTACTG이다.
5'-프라이머-TTACTGCATCGATATTAGTC-3'
절단되는 변형 뉴클레오티드 A 질량 C 질량 G 질량 T 질량
5'-3' 순서로 나열된 절단 단편 프라이머-TT 608+프라이머 프라이머-TTA 921+프라이머 프라이머-TTACT 1514+프라이머 프라이머 프라이머 단독
ACTGC 1463 CTG 861 GCATC 1463 T 304
ATCG 1174 CAT 845 GATATTA 2119 TAC 845
AT 556 CGATATTAGT 3041 GTC 861 TGCA 1174
ATT 860 C 289 TCGA 1174
AGTC 1174 TA 556
T 304
TAG 885
TC 532
서열 및 길이(미기재)가 공지된 프라이머 및 그 다음의 본 실시예를 위한 20 뉴클레오티드의 "미지" 서열로 구성된, 상단에 나타낸 서열에 대한 뉴클레오티드 특이적 절단 패턴. 본 실시예에서 절단은 변형 뉴클레오티드의 5'에서 포스포디에스테르 결합을 파괴하는 기작을 통하여 발생한다. 각 절단 세트는 프라이머 함유 단편 및 변형 뉴클레오티드가 처음 발생할 때까지의 프라이머 이후의 뉴클레오티드를 포함한다. 프라이머의 공지 질량은 상기 (가장 큰) 질량으로부터 공제하여 프라이머의 3' 직후의 서열의 뉴클레오티드 함량을 얻을 수 있다. 표에 제공된 질량은 각 절단 질량 내의 한개의 외부 인산염기의 존재를 반영하지만, 뉴클레오티드 변형의 화학적 특성 및 절단 반응에 따라 질량이 표에 나타낸 것과 상이할 수 있음을 알아야 한다. 그러나, 그 차이는 체계적으로 예상되기 때문에 제시된 분석의 의미를 무효화시키지 않는다.

표 7의 T 레인에 타나낸 질량을 보면, 906 달톤의 질량은 1개의 T, A 및 C를 함유하여야 한다. 이미 기지의 TAC 서열이 존재하기 때문에, 이것이 A 및 T 절단의 중복 부분의 확인 서열이라고 일시적으로 유지할 수 있다. 물론, T, A 및 C를 함유하는 다른 3-머이 단편에 존재할 가능성을 아직 배제할 수 없고, 이 때문에 상기 서열 배정은 이 시점에서 일시적이어야 한다.
다음 T 절단 단편은 최소 크기에서 각각 한개의 T 및 G를 함유하여야 한다. 2개의 T 절단 질량 946 및 1235는 이것을 허용한다. 따라서, 추가 서열은 G와 그 다음의 T (946 질량이 다음 질량일 경우)이거나 또는 G와 그 다음의 C 및 A (C와 A의 순서는 불명확함), 그리고 T이어야 한다. 이 서열은 이제 TTACTGGT 또는 TTACTG(C,A)T (뉴클레오티드 사이의 괄호 및 콤마는 순서가 미지임을 나타내기 위해 사용함)이다.
A 절단 반응을 보면, TT 이후의 다음 절단 질량은 ACTG를 함유함을 알 수 있다. 두개의 질량 1235 Da 및 1524 Da는 상기 기준을 충족시킨다. 1235 Da가 맞다면, 서열 내의 7번째의 뉴클레오티드는 절단이 이 뉴클레오티드에서 발생하여야 하기 때문에 A이다. 1524 Da가 맞다면, 서열은 CA이다. CA는 상기 논의한 2가지 가능성 중의 하나에 일치하고, 따라서 지금까지의 전체 서열은 TTACTGCAT이다.
C 절단 반응의 질량을 보면, 초기 TTA 이후의 처음 질량은 CTG(C,A)이어야 함을 알 수 있다. 절단은 임의의 C의 5'에서 발생하기 때문에, 가능성은 CTG 또는 CTGA이고, 이들 중 CTG만이 C 레인의 질량에 의해 지지된다. 따라서, C 레인의 제2 질량 단편은 CTG 및 이어서 다른 C (절단이 이 지점에서 발생하기 때문)이어야 한다. C 레인의 제3 질량 (906 Da)는 C, A 및 T를 함유하여야 하고, 이것은 이전의 서열 CAT를 입증한다. 이것은 나머지 서열에 대해 단지 2가지의 가능성, 즉 C 다음의 10 머 또는 10 머 다음의 말단 C만을 제시한다. 그러나, C 다음에 10 머가 존재한다면, 다른 레인 A, G 또는 T 중의 하나로부터의 절단 단편은 2개의 C를 함유하는 3 머, 4 머 또는 5 머를 보여야 한다. 어느 질량도 상기 올리고머를 허용하지 않기 때문에, 하나의 C는 미지 단편의 3' 말단에 존재하여야 하고, 10 머는 CAT 다음에 존재하여 서열 TTACTGCATC _ _ _ _ _ _ _ _ _ C를 제공한다.
다시 G 절단으로 돌아가서, 적어도 GCATC를 함유하는 단편이 존재하여야 함을 알 수 있다. 가용한 질량으로부터, 이것은 GCATC 그 자체 (1524 Da) 또는 7 머 (2180 Da)일 수 있다. 그러나, 5 머의 질량을 7 머의 질량으로부터 공제하면, 나머지 질량 656 Da는 어떠한 기지의 올리고뉴클레오티드에도 대응하지 않는다. 따라서, 7 머는 다음에 존재할 수 없고, GCATC가 올바른 서열이고, 다음 뉴클레오티드는 G이어야 한다 (절단은 5 머를 생성시키기 때문). 서열은 이제 TTACTGCATCG _ _ _ _ _ _ _ _ C이다.
T 절단 시리즈에서 다음 질량은 TCG로 시작하여야 한다. 상기 조합을 허용하는 유일한 T 절단 질량은 1235 Da이고, 이것은 TCGA 서열에 대응한다. 이 서열 다음에는 절단이 그 위치에서 발생하였기 때문에 T이어야 한다. 따라서, 전체 서열은 TTACTGCATCGAT _ _ _ _ _ _ C이다.
C를 함유하는 가용한 T 절단 시리즈 중에서 오직 하나의 질량 593 Da, 즉 TC가 존재한다. 따라서, 말단의 C에 선행하는 뉴클레오티드는 T이어야 한다. 유사하게, 이제 허용되지 않는 것으로 파악된, 2개의 C를 함유하지 않는 A 절단 시리즈의 유일한 TC 함유 질량은 1235, 즉 (A,G)TC이다. 1235 질량은 이미 한번 사용되었지만 (뉴클레오티드 8 - 11), A 시리즈만이 전체 16개 뉴클레오티드를 설명하기 때문에 단편 중복이 있다는 것도 알 수 있다. 서열은 이제 TTACTGCATCGAT _ _ _ (A,G)TC이다. 그러나, 말단 서열이 ATC라면, A 절단 중에서 906 Da 질량이 존재하여야 하지만, 그렇지 않다. 다른 한편으로, 말단 서열이 GTC라면 922 Da의 질량은 G 절단 단편 중에서 발견되어야 하고, 실제로 발견된다. 따라서, 서열은 이제 TTACTGCATCGAT _ _ _ AGTC로서 확립되었다.
AG는 함유하되 C는 함유하지 않는 유일한 가용 T 절단 질량이 존재하는데, 946 Da 질량으로서 T(A,G)로 이루어진다. 이 질량은 위치 17 및 18의 AG를 설명하여야 한다. 따라서, 위치 16은 T이어야 하고, 이제 서열은 TTACTGCATCGAT__TAGTC임을 알 수 있다.
A 절단 군에서 오직 2개의 질량, 즉 617 (AT) 및 921 (ATT)만이 가용하다. 이것은 2가지 방식, 즉 ATATT 또는 ATTAT로서 전체 서열을 완성한다. 어느 질량도 서열을 분명하게 나타낼 수 없다. 그러나, 표적 올리고뉴클레오티드 내의 20개의 모든 뉴클레오티드가 1회 실험에서 분명하게 확인되었고, 20개 중 18개의 서열이 분명하게 결정되었다.
서열 모호성은 일반적으로 상기 실시예에처럼 하나에 대한 것이거나 또는 보다 긴 단편의 서열을 결정할 때와 같이 둘 이상에 대한 것으로서, 서열 모호성의 특성 및 모호한 서열이 존재하는 환경, 즉 서열의 어느 한 쪽의 뉴클레오티드에 따라 몇개의 가용한 방법 중의 어느 하나를 사용한 추가의 실험을 통해 그 문제를 용이하게 해결하여야 한다. 예를 들어, 본 발명의 디뉴클레오티드 절단법을 사용하는 실험은 서열 모호성을 해결하기 위해 필요한 추가의 정보를 제공할 수 있다. 별법으로, 실질적으로 완전한 절단 조건의 일부 완화는 공지의 질량에 대해 모호한 질량의 위치 및 순서를 분명하게 하는 방식으로 인접하는 모호한 질량과 공지의 질량을 연결시키는 질량 래더를 만들 수 있다. 또는, 낮은 정확도의 싱글 패스(single pass) 생어 서열화법을 사용할 수 있다. 비교적 용이하고 신속한 Sanger 서열화 변형법만으로는 가치있는 정보를 제공하지 않을 수 있지만, 본 발명의 방법의 보완 방법으로서 모호성을 해결하는데 충분한 정보를 제공할 수 있고, 얻어진 서열화 래더가 분명하게 판독가능한 정도로 질량 스펙트럼 데이타를 확인하는 부분적인 리던던시를 제공할 것이다.
결론
따라서, 본 발명의 방법이 폴리뉴클레오티드의 변이 검출, 폴리뉴클레오티드에서 완전한 뉴클레오티드 서열의 결정 및 DNA의 유전자형 결정을 위한 유용한 도구를 제공한다는 것을 이해할 것이다.
특정 실시형태 및 실시예를 사용하여 본 발명을 설명하였지만, 본 발명의 범위에서 벗어나지 않으면서 상기 실시형태 및 실시예를 변경하는 것은 당업자에게 용이한 것이다.
다른 실시형태는 첨부되는 특허 청구 범위에 포함된다.







Claims (153)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. a. 폴리뉴클레오티드 중의 천연 뉴클레오티드를 이 천연 뉴클레오티드가 존재하는 부위 중 90%를 초과하는 위치에서 변형된 염기 뉴클레오티드, 변형된 당 뉴클레오티드 또는 변형된 포스포디에스테르 뉴클레오티드로 치환함으로써 변형된 폴리뉴클레오티드를 형성하는 단계로, 여기서, 상기 천연 뉴클레오티드는 프라이머 서열 내에는 존재하지 않으며,
    b. 상기 변형된 폴리뉴클레오티드를, 변형된 뉴클레오티드가 존재하는 부위 중 90%를 초과하는 위치에서 상기 변형된 폴리뉴클레오티드를 절단하는 비-효소성 시약(들)과 접촉시켜 단편 세트를 수득하는 단계; 및
    c. 상기 단편 세트를 분석하여 상기 폴리뉴클레오티드의 변화를 검출하거나 그의 유전자형을 결정하는 단계
    를 포함하는, 폴리뉴클레오티드의 뉴클레오티드 서열 상의 변화를 검출하거나, 또는 공지의 다형성 또는 돌연변이가 있는 것으로 의심되는 폴리뉴클레오티드의 유전자형을 결정하는 방법.
  32. 제31항에 있어서, 상기 천연 뉴클레오티드를 변형된 염기 뉴클레오티드로 치환하는 것인 방법.
  33. 제32항에 있어서, 상기 변형된 염기 뉴클레오티드가 변형된 아데닌을 포함하는 것인 방법.
  34. 제33항에 있어서, 상기 변형된 아데닌이 7-데아자-7-니트로아데닌인 방법.
  35. 제34항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 화학적 염기와 접촉시키는 것을 포함하는 것인 방법.
  36. 제34항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 포스핀과 접촉시키는 것을 포함하는 것인 방법.
  37. 제36항에 있어서, 상기 포스핀이 트리스(2-카르복시에틸)포스핀을 포함하는 것인 방법.
  38. 제31항에 있어서, 상기 변형된 염기 뉴클레오티드가 변형된 시토신을 포함하는 것인 방법.
  39. 제38항에 있어서, 상기 변형된 시토신이 아자시토신을 포함하는 것인 방법.
  40. 제38항에 있어서, 상기 변형된 시토신이 5-위치에 전자 흡인기를 포함하는 것인 방법.
  41. 제40항에 있어서, 상기 전자 흡인기가 니트로기 또는 할로기를 포함하는 것인 방법.
  42. 제39항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 화학적 염기와 접촉시키는 것을 포함하는 것인 방법.
  43. 제42항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 트리스(2-카르복시에틸)포스핀과 접촉시키는 것을 포함하는 것인 방법.
  44. 제31항에 있어서, 상기 변형된 염기 뉴클레오티드가 변형된 구아닌을 포함하는 것인 방법.
  45. 제44항에 있어서, 상기 변형된 구아닌이 7-니트로데아자구아닌을 포함하는 것인 방법.
  46. 제45항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 화학적 염기와 접촉시키는 것을 포함하는 것인 방법.
  47. 제44항에 있어서, 상기 변형된 구아닌이 N2-알릴구아닌을 포함하는 것인 방법.
  48. 제47항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 친전자제와 접촉시키는 것을 포함하는 것인 방법.
  49. 제48항에 있어서, 상기 친전자제가 요오드를 포함하는 것인 방법.
  50. 제31항에 있어서, 상기 변형된 염기 뉴클레오티드가 변형된 티민 또는 변형된 우라실을 포함하는 것인 방법.
  51. 제50항에 있어서, 상기 변형된 티민 또는 변형된 우라실이 5-히드록시우라실을 포함하는 것인 방법.
  52. 제51항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가
    상기 변형된 폴리뉴클레오티드를 화학적 산화제와 접촉시켜 산화된 폴리뉴클레오티드를 수득하는 단계; 및
    상기 산화된 폴리뉴클레오티드를 화학적 염기와 접촉시키는 단계
    를 포함하는 것인 방법.
  53. 제31항에 있어서, 상기 천연 뉴클레오티드를 변형된 당 뉴클레오티드로 치환하는 것인 방법.
  54. 제53항에 있어서, 상기 변형된 당 뉴클레오티드가 2-케토당을 포함하는 것인 방법.
  55. 제54항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 화학적 염기와 접촉시키는 것을 포함하는 것인 방법.
  56. 제53항에 있어서, 상기 변형된 당 뉴클레오티드가 아라비노스를 포함하는 것인 방법.
  57. 제56항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 화학적 염기와 접촉시키는 것을 포함하는 것인 방법.
  58. 제53항에 있어서, 상기 변형된 당 뉴클레오티드가 4-히드록시메틸기를 포함하는 것인 방법.
  59. 제58항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 화학적 염기와 접촉시키는 것을 포함하는 것인 방법.
  60. 제53항에 있어서, 상기 변형된 당 뉴클레오티드가 히드록시시클로펜탄을 포함하는 것인 방법.
  61. 제60항에 있어서, 상기 히드록시시클로펜탄이 1-히드록시-시클로펜탄 또는 2-히드록시-시클로펜탄을 포함하는 것인 방법.
  62. 제60항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 화학적 염기와 접촉시키는 것을 포함하는 것인 방법.
  63. 제53항에 있어서, 상기 변형된 당 뉴클레오티드가 아지도당을 포함하는 것인 방법.
  64. 제63항에 있어서, 상기 아지도당이 2'-아지도, 4'-아지도 또는 4'-아지도메틸 당으로 이루어진 군으로부터 선택되는 것인 방법.
  65. 제63항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 트리스(2-카르복시에틸)포스핀과 접촉시키는 것을 포함하는 것인 방법.
  66. 제53항에 있어서, 상기 변형된 당 뉴클레오티드가, 광분해되어 자유 라디칼을 생성할 수 있는 기를 포함하는 것인 방법.
  67. 제66항에 있어서, 광분해되어 자유 라디칼을 생성할 수 있는 기가 페닐셀레닐 또는 t-부틸카르복시인 방법.
  68. 제66항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 자외선에 노출시키는 것을 포함하는 것인 방법.
  69. 제53항에 있어서, 상기 변형된 당 뉴클레오티드가 시아노당을 포함하는 것인 방법.
  70. 제69항에 있어서, 상기 시아노당이 2'-시아노당 또는 2"-시아노당으로 이루어진 군으로부터 선택되는 것인 방법.
  71. 제70항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 화학적 염기와 접촉시키는 것을 포함하는 것인 방법.
  72. 제53항에 있어서, 상기 변형된 당 뉴클레오티드가 전자 흡인기를 포함하는 것인 방법.
  73. 제72항에 있어서, 상기 전자 흡인기가 불소, 아지도, 메톡시 및 니트로로 이루어진 군으로부터 선택되는 것인 방법.
  74. 제73항에 있어서, 상기 전자 흡인기가 변형된 당 뉴클레오티드의 2', 2" 또는 4' 위치에 존재하는 것인 방법.
  75. 제72항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 화학적 염기와 접촉시키는 것을 포함하는 것인 방법.
  76. 제53항에 있어서, 상기 변형된 당 뉴클레오티드가 당 고리에 전자 흡인 원소를 포함하는 것인 방법.
  77. 제76항에 있어서, 상기 전자 흡인 원소가 질소를 포함하는 것인 방법.
  78. 제77항에 있어서, 상기 질소가 상기 변형된 당의 고리 산소를 대신하는 것인 방법.
  79. 제77항에 있어서, 상기 질소가 상기 변형된 당의 고리 탄소를 대신하는 것인 방법.
  80. 제78항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 화학적 염기와 접촉시키는 것을 포함하는 것인 방법.
  81. 제79항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 화학적 염기와 접촉시키는 것을 포함하는 것인 방법.
  82. 제53항에 있어서, 상기 변형된 당 뉴클레오티드가 머캅토기를 포함하는 것인 방법.
  83. 제82항에 있어서, 상기 머캅토기가 변형된 당의 2' 위치에 존재하는 것인 방법.
  84. 제82항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 화학적 염기와 접촉시키는 것을 포함하는 것인 방법.
  85. 제53항에 있어서, 상기 변형된 당 뉴클레오티드가 5'-메틸레닐-당, 5'-케토-당 및 5',5'-디플루오로-당으로 이루어진 군으로부터 선택되는 것인 방법.
  86. 제85항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 화학적 염기와 접촉시키는 것을 포함하는 것인 방법.
  87. 제31항에 있어서, 상기 천연 뉴클레오티드를 변형된 포스포디에스테르 뉴클레오티드로 치환하는 것인 방법.
  88. 제87항에 있어서, 상기 변형된 포스포디에스테르 뉴클레오티드가 포스포로티올레이트를 포함하는 것인 방법.
  89. 제87항에 있어서, 상기 변형된 포스포디에스테르 뉴클레오티드가 포스포로아미데이트를 포함하는 것인 방법.
  90. 삭제
  91. 삭제
  92. 삭제
  93. 삭제
  94. 삭제
  95. 삭제
  96. 삭제
  97. 삭제
  98. 삭제
  99. 삭제
  100. 삭제
  101. 제31항에 있어서,
    a 단계에서는, 상이한 2종의 천연 뉴클레오티드를, 폴리뉴클레오티드 중 이 천연 뉴클레오티드가 존재하는 부위 중 90%를 초과하는 위치에서 각각 상이한 2종의 변형된 뉴클레오티드 (각각 제1 및 제2 변형 뉴클레오티드)로 치환하고,
    b 단계에서는, 상기 a 단계에서 얻은 변형된 폴리뉴클레오티드를, 그의 서열상 제1 변형 뉴클레오티드에 바로 후속하여 제2 변형 뉴클레오티드가 있는 부위 중 90%를 초과하는 위치에서 상기 변형된 폴리뉴클레오티드를 절단하는 비-효소성 시약(들)과 접촉시키는 것인 방법.
  102. 삭제
  103. 삭제
  104. 삭제
  105. 삭제
  106. 삭제
  107. 삭제
  108. 삭제
  109. 삭제
  110. 삭제
  111. 삭제
  112. 삭제
  113. 삭제
  114. 삭제
  115. 삭제
  116. 삭제
  117. 삭제
  118. 삭제
  119. 삭제
  120. 삭제
  121. 제101항에 있어서,
    상기 제1 변형 뉴클레오티드가 5' 위치에서 포스포로아미데이트기의 질소 원자에 공유결합되어 있고;
    상기 제2 변형 뉴클레오티드가 2'-히드록시기를 포함하며, 상기 제1 변형 뉴클레오티드의 5'에 인접해 있는 것인 방법.
  122. 제121항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 산과 접촉시키는 것을 포함하는 것인 방법.
  123. 제101항에 있어서,
    상기 제1 변형 뉴클레오티드가 3' 위치에서 포스포로아미데이트기의 질소 원자에 공유결합되어 있고;
    상기 제2 변형 뉴클레오티드가 2'-히드록시기를 포함하며, 상기 제1 변형 뉴클레오티드의 3'에 인접해 있는 것인 방법.
  124. 제123항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 산과 접촉시키는 것을 포함하는 것인 방법.
  125. 제101항에 있어서,
    상기 제1 변형 뉴클레오티드가 5' 위치에서 알킬포스포네이트기 또는 알킬포스포로트리에스테르기의 산소 원자에 공유결합되어 있고;
    상기 제2 변형 뉴클레오티드가 2'-히드록시기를 포함하며, 상기 제1 변형 뉴클레오티드의 3'에 인접해 있는 것인 방법.
  126. 제125항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 산과 접촉시키는 것을 포함하는 것인 방법.
  127. 제101항에 있어서,
    상기 제1 변형 뉴클레오티드가 4' 위치에 전자 흡인기를 갖고;
    상기 제2 변형 뉴클레오티드가 2'-히드록시기를 포함하며, 상기 제1 변형 뉴클레오티드의 5'에 인접해 있는 것인 방법.
  128. 제127항에 있어서, 변형된 폴리뉴클레오티드를 절단하는 단계가 상기 변형된 폴리뉴클레오티드를 산과 접촉시키는 것을 포함하는 것인 방법.
  129. 삭제
  130. 삭제
  131. 삭제
  132. 삭제
  133. 삭제
  134. 삭제
  135. 삭제
  136. 삭제
  137. 삭제
  138. 삭제
  139. 삭제
  140. 삭제
  141. 삭제
  142. 삭제
  143. 삭제
  144. 삭제
  145. 삭제
  146. 삭제
  147. 삭제
  148. 삭제
  149. 삭제
  150. 삭제
  151. 삭제
  152. 제31항, 제53항 및 제101항 중 어느 한 항에 있어서, 천연 뉴클레오티드의 변형된 뉴클레오티드로의 치환 비율, 변형된 뉴클레오티드에서의 절단 비율, 또는 상기 치환 비율 및 절단 비율 둘 모두가 95%를 초과하는 것인 방법.
  153. 제31항, 제53항 및 제101항 중 어느 한 항에 있어서, 천연 뉴클레오티드의 변형된 뉴클레오티드로의 치환 비율, 변형된 뉴클레오티드에서의 절단 비율, 또는 상기 치환 비율 및 절단 비율 둘 모두가 99%를 초과하는 것인 방법.
KR1020017004172A 1998-10-01 1999-09-30 폴리뉴클레오티드의 분석 방법 KR100811331B1 (ko)

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
US10272498P 1998-10-01 1998-10-01
US60/102,724 1998-10-01
US14953399P 1999-08-17 1999-08-17
US60/149,533 1999-08-17
US39477499A 1999-09-10 1999-09-10
US39438799A 1999-09-10 1999-09-10
US09/394,467 US6566059B1 (en) 1998-10-01 1999-09-10 Method for analyzing polynucleotides
US09/394,457 US6440705B1 (en) 1998-10-01 1999-09-10 Method for analyzing polynucleotides
US09/394,774 1999-09-10
US09/394,387 1999-09-10
US09/394,457 1999-09-10
US09/394,467 1999-09-10

Publications (2)

Publication Number Publication Date
KR20010099663A KR20010099663A (ko) 2001-11-09
KR100811331B1 true KR100811331B1 (ko) 2008-03-31

Family

ID=27557652

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020017004172A KR100811331B1 (ko) 1998-10-01 1999-09-30 폴리뉴클레오티드의 분석 방법

Country Status (13)

Country Link
EP (1) EP1117838B1 (ko)
JP (1) JP2002525129A (ko)
KR (1) KR100811331B1 (ko)
CN (1) CN1291034C (ko)
AT (1) ATE431428T1 (ko)
AU (1) AU774388B2 (ko)
BR (1) BR9914262A (ko)
CA (1) CA2344611C (ko)
DE (1) DE69940890D1 (ko)
HK (1) HK1060905A1 (ko)
IL (2) IL142323A0 (ko)
NO (1) NO20011607L (ko)
WO (1) WO2000018967A1 (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002079502A1 (en) * 2001-03-28 2002-10-10 The University Of Queensland A method for nucleic acid sequence analysis
US6987180B2 (en) 2002-02-07 2006-01-17 President And Fellows Of Harvard College Uridine analogs and techniques for making and using
EP1576185A4 (en) * 2002-10-18 2008-04-16 Genematrix Inc METHOD FOR DETECTING MUTATIONS
CA2507189C (en) 2002-11-27 2018-06-12 Sequenom, Inc. Fragmentation-based methods and systems for sequence variation detection and discovery
WO2005054258A2 (en) * 2003-12-02 2005-06-16 Innate Pharma New class of gamma delta t cells activators and use thereof
US9394565B2 (en) 2003-09-05 2016-07-19 Agena Bioscience, Inc. Allele-specific sequence variation analysis
WO2005098050A2 (en) 2004-03-26 2005-10-20 Sequenom, Inc. Base specific cleavage of methylation-specific amplification products in combination with mass analysis
US20070048748A1 (en) * 2004-09-24 2007-03-01 Li-Cor, Inc. Mutant polymerases for sequencing and genotyping
US7645866B2 (en) 2005-06-28 2010-01-12 Life Technologies Corporation Methods of producing and sequencing modified polynucleotides
WO2009073505A2 (en) * 2007-11-30 2009-06-11 Wisconsin Alumni Research Foundation Methods for processing tandem mass spectral data for protein sequence analysis
EP3194591A4 (en) * 2014-09-19 2018-03-21 Ionis Pharmaceuticals, Inc. Antisense compounds and uses thereof
CN105177152B (zh) * 2015-09-29 2019-02-01 福州艾迪康医学检验所有限公司 检测hla-b*51等位基因的方法和引物
US11162139B2 (en) 2016-03-02 2021-11-02 Shanghai Epican Genetech Co. Ltd. Method for genomic profiling of DNA 5-methylcytosine and 5-hydroxymethylcytosine
CN105648537B (zh) * 2016-03-02 2018-06-29 上海易毕恩基因科技有限公司 Dna5-甲基胞嘧啶与5-羟甲基胞嘧啶基因图谱测序方法
WO2019083449A1 (en) 2017-10-25 2019-05-02 National University Of Singapore LIGATURE AND / OR ASSEMBLY OF NUCLEIC ACID MOLECULES
CN107944221B (zh) * 2017-11-21 2020-12-29 南京溯远基因科技有限公司 一种并行分离核酸片断的拼接算法及其应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997033000A1 (en) * 1996-03-04 1997-09-12 Genetrace Systems, Inc. Methods of screening nucleic acids using mass spectrometry

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1340806C (en) * 1986-07-02 1999-11-02 James Merrill Prober Method, system and reagents for dna sequencing
US5187085A (en) * 1990-09-28 1993-02-16 Applied Biosystems, Inc. Nucleic acid sequence analysis with nucleoside-5'-o-(1-thiotriphosphates)
AU2604795A (en) * 1994-05-26 1995-12-21 New York Medical College Detection of halogenated precursors incorporated into dna
DE19815864A1 (de) * 1998-04-08 1999-10-14 Europ Lab Molekularbiolog 5'-modifizierte Nukleotide und ihre Anwendung in der Molekularbiologie und Medizin

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997033000A1 (en) * 1996-03-04 1997-09-12 Genetrace Systems, Inc. Methods of screening nucleic acids using mass spectrometry

Also Published As

Publication number Publication date
CN1463292A (zh) 2003-12-24
WO2000018967A1 (en) 2000-04-06
EP1117838A1 (en) 2001-07-25
ATE431428T1 (de) 2009-05-15
IL142323A0 (en) 2002-03-10
BR9914262A (pt) 2002-01-22
CA2344611C (en) 2011-04-05
NO20011607D0 (no) 2001-03-29
JP2002525129A (ja) 2002-08-13
IL142323A (en) 2006-09-05
AU1200400A (en) 2000-04-17
EP1117838A4 (en) 2007-05-02
AU774388B2 (en) 2004-06-24
KR20010099663A (ko) 2001-11-09
DE69940890D1 (de) 2009-06-25
HK1060905A1 (en) 2004-08-27
NO20011607L (no) 2001-05-31
EP1117838B1 (en) 2009-05-13
CN1291034C (zh) 2006-12-20
CA2344611A1 (en) 2000-04-06

Similar Documents

Publication Publication Date Title
US6440705B1 (en) Method for analyzing polynucleotides
US6500650B1 (en) Method for identifying polymorphisms
US6458945B1 (en) Method for analyzing polynucleotides
KR100811331B1 (ko) 폴리뉴클레오티드의 분석 방법
US6610492B1 (en) Base-modified nucleotides and cleavage of polynucleotides incorporating them
US6503710B2 (en) Mutation analysis using mass spectrometry
US6566059B1 (en) Method for analyzing polynucleotides
Delaney et al. Biological properties of single chemical− DNA adducts: a twenty year perspective
Banoub et al. Recent developments in mass spectrometry for the characterization of nucleosides, nucleotides, oligonucleotides, and nucleic acids
JP3437184B2 (ja) 切断可能なプライマーを用いるオリゴヌクレオチドサイズ計測
CA2623539C (en) High throughput screening of mutagenized populations
CN107922968B (zh) 用于单分子电子snp测定的聚合物标记的核苷酸
JPH08509857A (ja) マススペクトロメトリーによるdna配列決定法
Fei et al. Analysis of single nucleotide polymorphisms by primer extension and matrix‐assisted laser desorption/ionization time‐of‐flight mass spectrometry
JP2002531053A (ja) 核酸のヌクレオチド配列を解析するための方法および試薬
CA2561381A1 (en) Base specific cleavage of methylation-specific amplification products in combination with mass analysis
US6777188B2 (en) Genotyping by mass spectrometric analysis of allelic fragments
WO2004067764A2 (en) Nucleic acid sequencing using nicking agents
Deforce et al. Analysis of the DNA adducts of phenyl glycidyl ether in a calf thymus DNA hydrolysate by capillary zone electrophoresis-electrospray mass spectrometry: evidence for phosphate alkylation.
MXPA01003404A (en) A method for analyzing polynucleotides
US6994998B1 (en) Base-modified nucleotides and their use for polymorphism detection
Erturk Photochemical and Enzymatic Method for DNA Methylation Profiling and Walking Approach for Increasing Read Length of DNA Sequencing by Synthesis
US6855500B2 (en) Fluorescence-based genotyping
Hsieh Design and Synthesis of 3'-Oxygen-Modified Cleavable Nucleotide Reversible Terminators for Scarless DNA Sequencing by Synthesis
KR20200087727A (ko) 유전자 변이 특이성이 증가된 dna 중합효소를 이용한 질량분석법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee