KR20070090230A - 시토신의 화학적 변형에 의한 미생물 핵산의 단순화 방법 - Google Patents

시토신의 화학적 변형에 의한 미생물 핵산의 단순화 방법 Download PDF

Info

Publication number
KR20070090230A
KR20070090230A KR1020077015306A KR20077015306A KR20070090230A KR 20070090230 A KR20070090230 A KR 20070090230A KR 1020077015306 A KR1020077015306 A KR 1020077015306A KR 20077015306 A KR20077015306 A KR 20077015306A KR 20070090230 A KR20070090230 A KR 20070090230A
Authority
KR
South Korea
Prior art keywords
nucleic acid
dna
microbial
bacterial
microorganism
Prior art date
Application number
KR1020077015306A
Other languages
English (en)
Other versions
KR101293713B1 (ko
Inventor
더글라스 스펜서 밀러
조지 가버 엘. 마이클로스
Original Assignee
휴먼 제네틱 시그너처스 피티와이 엘티디
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2004906915A external-priority patent/AU2004906915A0/en
Application filed by 휴먼 제네틱 시그너처스 피티와이 엘티디 filed Critical 휴먼 제네틱 시그너처스 피티와이 엘티디
Publication of KR20070090230A publication Critical patent/KR20070090230A/ko
Application granted granted Critical
Publication of KR101293713B1 publication Critical patent/KR101293713B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/125Bisulfite(s)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/117Modifications characterised by incorporating modified base
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

미생물 게놈 또는 핵산을 시토신을 변형시키는 시약으로 처리하여 유도체 미생물 핵산을 형성하고 그 유도체 미생물 핵산을 증폭시켜 그 미생물 게놈 또는 핵산의 단순형을 생산하는 것을 포함하는 미생물 게놈 또는 미생물 핵산의 단순화 방법.
미생물 게놈, 핵산, 시토신 변형, 단순화

Description

시토신의 화학적 변형에 의한 미생물 핵산의 단순화 방법{METHODS FOR SIMPLIFYING MICROBIAL NUCLEIC ACIDS BY CHEMICAL MODIFICATION OF CYTOSINES}
본 발명은 미생물 측정을 위한 핵산 검출 분석에 대한 것이다. 본 발명은 또한 미생물 검출을 위한 특정 리간드를 이용하여 결합된 미생물 게놈의 복잡성을 감소시키기 위해 핵산의 화학적 처리 방법에 대한 것이다.
특정 핵산 분자의 검출에 많은 절차들이 현재 이용될 수 있다. 이들 절차들은 통상적으로 표적 핵산과 짧은 올리고뉴클로오티드(20 염기 미만)에서 수 킬로베이스(kb)를 갖는 서열의 길이를 갖는 핵산 탐침 사이의 서열-의존 혼성화에 의존하고 있다.
핵산 서열 집단 내로부터 특정 서열의 증폭을 위해 가장 널리 사용되는 방법은 PCR(polymerase chain reaction, Dieffenbach, C and Dveksler, G. eds. PCR Primer: A Laboratory Manual. Cold Spring Harbor Press, Plainview NY)이다.
이 증폭 방법에 있어서, 일반적으로 상보적인 DNA 가닥에 길이로 20 내지 30 뉴클로오타이드를 갖고 그 부위의 양 말단이 증폭될 수 있는 올리고뉴클레오타이드가 변성된 단일-가닥 DNA 상에서 DNA 합성을 준비하기 위해 사용된다.
열에 안정한 DNA 폴리머라제를 이용한 변성, 초기 혼성화 및 DNA 가닥 합성 의 연쇄적인 사이클들은 프라이머 사이에서 서열을 급격하게 증폭시킨다. RNA 서열은 cDNA(complementary DNA) 사본을 생산하는 역전사효소(reverse transcriptase)를 이용하여 첫 번째 복사에 의해 증폭될 수 있다. 증폭된 DNA 단편은 겔 전기영동, 표지된 탐침을 갖는 혼성화, 후속 동정(예를 들어 효소 관련 분석에 의함)이 필요한 표지 프라이머(tagged primers)의 이용, 및 표적 DNA와 혼성시에 신호를 발생시키는 형광-표지된 프라이머의 이용(예를 들어 Beacon 및 TaqMan 시스템)을 포함하는 수많은 수단에 의해 검출될 수 있다.
PCR뿐만 아니라, 다른 많은 기술들이 특정 핵산 서열의 검출 및 증폭을 위해 발전되어 왔다. 한 예는 리가제 연쇄 반응(ligase chain reaction, Barany, F. et al., Proc. Natl. Acad. Sci. USA 88, 189-193)이다.
다른 예는 1992년에 처음으로 기재된 등온 증폭(isothermal amplification, Walker GT, Little MC, Nadeau JG and Shank D. Isothermal in vitro amplification of DNA by a restriction enzyme/DNA polymerase system. PNAS 89: 392-396, 1992)으로 SDA(Strand Displacement Amplification)로 불린다. 그 이후로, 다른 많은 등온 증폭 기술들이 TMA(Transcription Mediated Amplification) 및 대응하는 게놈 DNA가 아닌 RNA 서열을 복사하는 RNA 폴리머라제를 이용하는 NASBA(Nucleic Acid Sequence Based Amplification)를 포함하여 기술되어 왔다(Guatelli JC, Whitfield KM, Kwoh DY, Barringer KJ, Richmann DD and Gingeras TR. Isothermal, in vitro amplification of nucleic acids by a multienzyme reaction modeled after retroviral replication. PNAS 87: 1874-1878 (1990); Kievits T, van Gemen B, van Strijp D, Schukkink R, Dircks M, Adriaanse H, Malek L, Sooknanan R, Lens P. NASBA isothermal enzymatic in vitro nucleic acid amplification optimized for the diagnosis of HIV-1 infection. J Virol Methods. 1991 Dec; 35(3):273-86).
다른 DNA-기초 등온 기술들은 DNA 폴리머라제가 원형 주형에 향한 프라이머를 연장시키는 것인 RCA(Rolling Circle Amplification, Fire A and Xu SQ. Rolling replication of short circles. PNAS 92: 4641-4645, 1995), 표적 검출을 위해 원형 탐침을 이용하는 RAM(Ramification Amplification, Zhang W, Cohenford M, Lentrichia B, lsenberg HD, Simson E, Li H, Yi J, Zhang DY. Detection of Chlamydia trachomatis by isothermal ramification amplification method: a feasibility study. J Clin Microbiol. 2002 Jan; 40(1): 128-32), 및 더 최근에는 열 대신 DNA 가닥을 푸는 헬리카아제 효소를 이용하는 헬리카아제-의존 등온 DNA 증폭(HDA, Vincent M, Xu Y, Kong H. Helicase-dependent isothermal DNA amplification. EMBO Rep. 2004 Aug; 5(8):795-800)을 포함하고 있다.
최근, DNA 증폭의 등온 방법이 기재되었다(Walker GT, Little MC, Nadeau JG and Shank D. Isothermal in vitro amplification of DNA by a restriction enzyme/DNA polymerase system. PNAS 89: 392-396, 1992). 통상적인 증폭 기술은 증폭 반응의 각 사이클에서 표적 분자의 변성 및 재생의 계속되는 사이클에 의존하고 있다. DNA의 열 처리는 DNA 분자의 확실한 절단을 초래하여, DNA가 발달하는 배반포(blastocyst)로부터 작은 수의 세포들로부터의 DNA 분리로 제한될 때, 또는 특 히 DNA가 단편화된 형태, 이를 테면 조직 박편, 파라핀 블락 및 오래된 DNA 샘플에 있는 경우에, 이 가열-냉각 사이클은 DNA에 손상을 더 줄 수 있고 증폭 시그날의 손상을 초래할 수 있다. 등온 방법은 다른 증폭으로부터 주형으로 사용되는 단일 가닥 분자를 생산하기 위해 주형 DNA의 계속적인 변성에 의존하는 것이 아니라, 일정 온도에서 특정 제한 엔도뉴클레아제에 의한 DNA 분자의 효소적인 닉킹(nicking)에 의존한다.
SDA(Strand Displacement Amplification)로 불리는 기술은 반-변형된 DNA의 변형되지 않은 가닥을 닉킹시키는 특정 제한 효소의 능력 및 하류 가닥을 연장 및 치환시키는 5'-3' 엑소뉴클레아제-결함 폴리머라아제의 능력에 의존하고 있다.
기하급수적 증폭은 센스 반응으로부터의 가닥 치환을 위한 안티 센스 반응을 위한 주형으로서 이용되는 센스 및 안티센스 반응의 커플링으로 인해 성취된다(Walker GT, Little MC, Nadeau JG and Shank D. Isothermal in vitro amplification of DNA by a restriction enzyme/DNA polymerase system. PNAS 89: 392-396, 1992). 그런 기술들을 이용하여 다음 미생물의 증폭에 성공하였다: 마이코박테리움 튜버쿨로시스(Mycobacterium tuberculosis, Walker GT, Little MC, Nadeau JG and Shank D. Isothermal in vitro amplification of DNA by a restriction enzyme/DNA polymerase system. PNAS 89: 392-396, 1992), HIV-1, 간염 C 및 HPV-16 (Nuovo G. J., 2000), 클라미디아 트라코마티스(Chlamydia trachomatis, Spears PA, Linn P, Woodard DL and Walker GT. Simultaneous Strand Displacement Amplification and Fluorescence Polarization Detection of Chlamydia trachomatis. Anal. Biochem. 247: 130-137, 1997).
지금까지 SDA의 이용은 변형 가닥 상에서 효소 분해에 저항하여 치환 반응을 이끄는 소화 대신에 효소적 니킹(nicking)을 초래하는 헤미-포스포티오에이트 DNA 듀플렉스를 생산하기 위해 변형된 포스포티오에이트 뉴클레오타이드에 의존한다. 그러나, 최근, 몇몇 "닉케이즈(nickase)" 효소가 설계되었다. 이들 효소들은 통상적인 방식으로 DNA를 절단하지 않고 DNA 가닥 중 하나에 틈을 발생시킨다. "닉케이즈" 효소는 N.AIwi (Xu Y, Lunnen KD and Kong H. Engineering a nicking endonuclease N.AIwi by domain swapping. PNAS 98: 12990-12995 (2001), N.BstNBI (Morgan RD, Calvet C, Demeter M, Agra R, Kong H. Characterization of the specific DNA nicking activity of restriction endonuclease . N.BstNBI. Biol Chem. 2000 Nov;381 (11 ):1123-5.) 및 MIyI (Besnier CE, Kong H. Converting MIyI endonuclease into a nicking enzyme by changing its oligomerization state. EMBO Rep. 2001 Sep;2(9):782-6. Epub 2001 Aug 23)을 포함한다. 그런 효소들의 이용이 SDA 과정을 간편화시킨다.
추가로, SDA는 열안정성 제한효소(Aval) 및 열안정성 엑소-폴리머라아제(Bst 폴리머라아제)의 조합하여 이용함으로써 개선되었다. 이 조합은 반응의 증폭 효율을 108배 증폭에서 1010배 증폭으로 향상시켜 이 기술을 이용하면 특정 단일 카피 분자의 증폭을 가능함을 보여주었다. 열안정성 폴리머라아제/효소 조합을 이용하는 결론적인 증폭 요소는 약 109이 된다(MiIIa M. A., Spears P. A., Pearson R. E. and Walker G. T. Use of the Restriction Enzyme Aval and Exo-Bst Polymerase in Strand Displacement Amplification Biotechniques 1997 24:392- 396).
지금까지, 모든 등온 DNA 증폭 기술은 증폭을 개시하기에 앞서 변성된 초기 이중 나선 주형 DNA 분자가 요구되었다. 추가로, 증폭은 오직 각 프라이밍 시로부터 오직 한 번만 개시된다.
직접 검출을 위하여, 표적 핵산은 겔 전기영동에 의해 크기에 기초하여 가장 일반적으로 분리되고 표적 서열에 상보적인 탐침을 갖고 있는 혼성화(서던 및 노던 블럿팅)에 앞서 고체 지지체에 옮겨진다. 탐침은 천연 핵산 또는 PNA(peptide nucleic acid) 또는 LNA(locked nucleic acid) 또는 INA(intercalating nucleic acid)와 같은 유사체일 수 있다. 탐침은 직접적으로 표지될 수 있고(예를 들어 32P로) 또는 간접적 검출 고정이 이용될 수 있다. 간접적 과정은 보통 비오틴 또는 디그옥시제닌(digoxigenin)과 같은 "태그(tag)"를 프로브에 통합시키는 것에 의존하고 그 탐침은 효소-결합된 기질 전환 또는 화학발광과 같은 수단에 의해 검출된다.
널리 이용되는 핵산의 직접 검출의 다른 방법은 "샌드위치" 혼성화이다. 이 방법에 있어서, 캡쳐 탐침은 고체 지지체에 결합되어 있고, 용액 내의 표적 핵산이 결합된 탐침과 혼성화된다. 결합되지 않은 표적 핵산은 세척되고 결합된 핵산은 표적 서열과 혼성화되는 두 번째 탐침을 이용하여 검출된다. 검출은 상기에서 기재한 것처럼 직접 또는 간접적인 방법을 이용할 수 있다. 그런 방법들의 예는 샌드위치 혼성화 원리를 이용하는 예로서 "가지 DNA(branched DNA)" 신호 검출 시스템을 포 함한다(1991 , Urdea, M. S., et al., Nucleic Acids Symp. Ser. 24,197-200). 핵산 서열의 직접 검출을 위해 핵산 혼성화를 이용하는 것으로 빨리 성장하고 있는 분야는 DNA 마이크로어레이이다(2002, Nature Genetics, 32, [Supplement]; 2004, Cope, L.M., et al., Bioinformatics, 20, 323-331; 2004, Kendall, S.L., et al., Trends in Microbiology, 12, 537-544). 이 과정에서, 짧은 올리고뉴클레오타이드(Affymetrix 시스템에서 통상적으로 25-머)에서 긴 올리고뉴클레오타이드(Applied Biosystems 및 Agilent platforms에서 통상적으로 60-머)까지, cDNA 클론과 같은 더 긴 서열까지의 범위를 갖는 개별 핵산 종류들은 격자 배열로 고체 지지체에 고정되거나 고체 지지체 상에서 사진석판적으로(photolithographically) 합성된다. 태그 또는 표지된 핵산 집단은 어레이로 혼성화되고, 어레이 상에서 각 스팟의 혼성화 정도가 정량화된다. 다른 검출 시스템, 이를 테면 화학 발광 같은 것이 사용될 수 있다 하더라도, 가장 일반적으로, 방사성있는- 또는 형광적으로-표지된 핵산(예를 들어 cRNAs 또는 cDNAs)들이 혼성화를 위해 사용된다.
핵산 서열의 직접 검출을 위해 핵산 혼성화를 이용하는 가장 빨리 성장하고 있는 분야는 DNA 마이크로어레이 분야이다(Young RA Biomedical discovery with DNA arrays. Cell 102: 9-15 (2000); Watson A New tools. A new breed of high tech detectives. Science 289:850-854, 2000). 이 과정에서, 짧은 올리고뉴클레오타이드(Affymetrix 시스템에서 통상적으로 25-머)에서 긴 올리고뉴클레오타이드(Applied Biosystems 및 Agilent platforms에서 통상적으로 60-머)까지, cDNA 클론과 같은 더 긴 서열까지의 범위를 갖는 개별 핵산 종류들은 격자 배열로 고체 지 지체에 고정되거나 고체 지지체 상에서 사진석판적으로(photolithographically) 합성된다. 태그 또는 표지된 핵산 집단은 어레이로 혼성화되고, 어레이 상에서 각 스팟의 혼성화 정도가 정량화된다. 다른 검출 시스템, 이를 테면 화학 발광 같은 것이 사용될 수 있다 하더라도, 가장 일반적으로, 방사성있는- 또는 형광적으로-표지된 핵산(예를 들어 cRNAs 또는 cDNAs)들이 혼성화를 위해 사용된다.
박테리아, 효소 및 진균과 같은 미생물의 검출을 위한 통상적인 방법들은 선택 영양 배지에서 미생물을 배양하여 크기, 모양, 포자 생산, 생화학적 또는 효소적 반응과 같은 특성 및 통상적인 빛 현미경 아래에서 보여지는 특정 염색(이를 테면 그램 염색)에 기초한 미생물 분류를 포함한다.
바이러스 종들은 특수화된 조직 또는 세포 내에서 성장되어져야 하기 때문에 전자 현미경에 의해 측정된 그들의 구조 및 크기에 기초하여 분류된다. 이런 기술들의 주요 결점은 모든 미생물들이 그런 접근의 유용성을 제한시키는 통상적인 배양 또는 세포 조건 하에서 성장할 수 없다는데 있다. 예를 들어, 네이세리아 메닌지티디스(Neisseria meningitidis), 스트렙토코커스 뉴모니애(Streptococcus pneumoniae) 및 해모필러스 인플루엔자(Haemophilus influenzae)(모두 수막염을 일으키고, 그 중에서 N. 메닌지티디스는 수막염과 전격 수막알균혈증을 일으킨다)와 같은 박테리아의 경우, 이들 세 가지 종들은 모두 배양하기 힘들다. 혈액 배양 병이 최고 7일 동안 매일 정기적으로 실험되어지고 2차 배양이 요구된다. H. 인플루엔자는 니코틴아미드 아데닌 디뉴클로오타이드 및 해민(haemin)이 모두 함유된 특수한 배지를 요구하고 초콜렛 아가 플레이트(Chocolate Agar Plates) 상에서 성장 한다. 혈액 배양은 트립티카제 소이 브루스(trypticase soy broth) 또는 BHI(brain heart infusion) 및 소듐 폴리아네톨설포네이트(sodium polyanetholesulphonate)와 같은 다양한 첨가제들의 첨가를 요구한다. 식중독 및 플러피 베이비 신드롬(floppy baby syndrome)을 야기시키는 클로스트리디움 보툴리늄(Clostridium botulinum)과 같은 미생물의 경우, 독소의 동정은 식품 추출물 또는 배양 상청액을 마우스에 주입하여 그 2일 후에 결과를 가시화시키는 것과 관련있다. 추가로, 특수 배지 상에서 잠재 미생물을 배양하는 것은 일주일이 걸린다. 스타필로코커스 아우레우스 장독소taphylococcus aureus enterotoxin)(식중독 뿐만 아니라 피부 감염, 혈액 감염, 폐렴, 골수염, 관절염 및 뇌농양의 원인)은 이온 교환 수지 또는 모노클로날 항체를 이용한 역수동 라텍스 응집(Reverse Passive Latex Agglutination)을 통해 독소의 선택적 흡수로 인하여 소량 검출된다. 이것에 상대적으로, S. 에피데르미스(S. epidermis)는 혈액감염을 일으키고 장비와 병원과 건강 관리 기계 및 장치의 표면을 오염시킨다.
비-바이러스 미생물은 또한 특정 아미노산의 생산 또는 글루코스, 말토스 또는 수크로스와 같은 기질의 발효 반응 동안의 대사 산물과 같은 대사적 성질에 기초하여 분류된다. 부가로, 미생물들은 항생제에 대한 민감성에 따라 유형지어 질 수 있다. 세포 표면 항원 또는 분비된 단백질, 이를 테면 독소에 대한 특정 항원은 또한 미생물을 동정하고 분류하는데 이용될 수 있다. 그러나, 상기 모든 방법들이 그 후의 테스팅에 앞서 미생물의 배양에 의존하고 있다. 미생물의 배양은 값비싸며 시간이 소모되고 오염 또는 배양이 까다롭지 않은 미생물에 의해 과성장되는 문제 가 발생할 수 있다. 많은 실험들이 최종 진단에 도달하기 위하여 동일한 샘플 상에서 수행되어야만 하는 경우에 있어서 기술들이 상대적으로 조잡하다. 대부분의 미생물들은 기존 배지에서 점진적으로 성장될 수 없고, 그러므로 그들은 다른 종의 미생물과 통상적으로 혼합된 집단이 원시적으로 존재하거나 고등 개체와 연합하여 존재할 때 검출이 된다.
병원성 미생물들의 검출 및 동정을 위한 다른 방법은 항체들이 그 미생물로 인한 감염에 대한 반응으로 생산되는 혈청학적 접근에 기초한다. 예를 들어, 메닌고코씨(Meningococci)는 그들의 캡슐 폴리사카라이드에 있어서 구조적 차이에 근거하여 분류될 수 있다. 이들은 다른 항원성을 가지고 있어 5개의 주요 혈청그룹(A, B, C, Y 및 W-135)으로 청정될 수 있다. ELISA(Enzyme Linked Immunosorbent Assays) 또는 RIA(Radio lmmuno Assay)은 그런 항체의 생산을 평가할 수 있다. 이들 양 방법은 감염 동안 숙주 동물에 의해 생산된 특정 항체의 존재를 검출한다. 이들 방법들은 숙주 동물에 의해 항체가 생산되는데 시간이 소요하여 종종 초기 감염은 놓치는 약점을 가지고 있다. 추가로, 그런 분석들의 이용은 과거 및 현재 감염 사이의 식별의 믿을 수 없다. 더욱 최근에, 감염 질환의 진단을 위한 분자적 방법의 이용에 많은 관심이 있었다. 이들 방법들은 병원성 미생물의 민감하고 특이적인 검출을 제공한다. 그런 방법들의 예는 "가지 DNA(branched DNA)" 시그널 검출 시스템을 포함한다. 이 방법은 샌드위치 혼성화 원리(Urdea MS et al. Branched DNA amplification multimers for the sensitive, direct detection of human HIV^and hepatitis viruses. Nucleic Acids Symp Ser. 1991 ;(24):197-200)를 이용 하는 예이다.
박테리아의 검출 및 분류를 위한 다른 방법은 16S 리보솜 RNA 서열을 증폭시키는 것이다. 16S rRNA는 다양한 임상 또는 환경 샘플에서 박테리아 종의 검출을 위한 PCR 증폭 분석에 이용하기 위한 적절한 표적이 되는 것으로 보고되고 16S rRNA 유전자가 종-특이적 다형성(polymorphisms)(Cloud, J. L., H. Neal, R. Rosenberry, C. Y. Turenne, M. Jama, D. R. Hillyard, and K. C. Carroll. 2002. J. Clin. Microbiol. 40:400-406)을 보여주기 때문에 다양한 특이 미생물을 동정하는데 자주 이용되어 왔다. 그러나, 박테리아의 순수 배양이 요구되고 PCR 증폭 이후에 샘플은 여전히 종을 측정하는 마이크로어레이 타입 장치에 나열되어 있거나 혼성화되어 있다(Fukushima M, Kakinuma K, Hayashi H, Nagai H, lto K, Kawaguchi R. J Clin Microbiol. 2003 Jun; 41(6):2605-15). 그런 방법들은 고가이며, 시간이 소모되고 노동 집약적이다.
본 발명자들은 임의 미생물 종을 위한 일반적 검출 또는 초기 스크리닝 분석에 채택될 수 있는 미생물 검출의 새로운 방법들을 개발하였다.
일반적인 측면에서, 본 발명은 미생물 핵산을 시토신을 변형시키는 시약으로 처리하여 그 처리된 핵산을 증폭시켜 그 게놈 또는 핵산의 단순화된 형태를 생산하도록 하는 미생물 게놈 또는 핵산을 구성하는 염기의 복잡성을 감소시키는 것에 대한 것이다.
첫 번째 측면에서, 본 발명은 다음을 포함하는 미생물 게놈 또는 미생물 핵산의 단순화 방법을 제공한다: 미생물 게놈 또는 핵산을 시토신을 변형시키는 시약으로 처리하여 유도체 미생물 핵산을 형성하고; 및 그 유도체 미생물 핵산을 증폭시켜 미생물 게놈 또는 핵산의 단순한 형태를 생산한다.
두 번째 측면에서, 본 발명은 다음을 포함하는 미생물-특이적 핵산 분자의 생산 방법을 제공한다: 미생물 유래 DNA를 함유하는 샘플을 시토신을 변형시키는 시약으로 처리하여 유도체 미생물 핵산을 형성시키고; 및 그 유도체 미생물 핵산의 적어도 한 부분을 증폭시켜 비처리된 미생물 핵산과 비교하여 감소된 총 수의 시토신을 단순화된 핵산 분자를 형성시키는 것으로서, 여기에서 그 단순화된 핵산 분자는 미생물 또는 미생물 타입에 특이적인 핵산 서열을 포함한다.
세 번째 측면에서, 본 발명은 다음을 포함하는 미생물-특이적 핵산 분자의 생산 방법을 제공한다: 미생물로부터 DNA 서열을 획득하고; 각 시토신을 티민으로 치환시켜 미생물 DNA 서열의 전환을 수행함으로써 미생물 DNA 서열의 단순형을 획득하고, 그 미생물 DNA의 단순형은 실질적으로 아데닌, 구아닌 및 티민 염기를 포함하는 것이고; 그리고 그 미생물 DNA의 단순형으로부터 미생물-특이적 핵산 분자를 선별하는 것이다.
네 번째 측면에서, 본 발명은 상기 본 발명의 세 번째 측면에 따른 방법에 의해 획득된 미생물-특이적 핵산 분자를 제공한다. 다섯 번째 측면에서, 본 발명은 테스트 또는 분석에서 그 미생물-특이적 핵산 분자에 결합하거나 증폭시키는 탐침 또는 프라이머를 획득하는, 본 발명의 세 번째 측면에 따른 방법의 용도를 제공한다.
여섯 번째 측면에서, 본 발명은 상기 본 발명의 다섯 번째 측면에 의해 획득한 탐침 또는 프라이머를 제공한다. 일곱 번째 측면에서, 본 발명은 다음을 포함하는, 샘플에서 미생물의 존재를 검출하는 방법을 제공한다: 미생물을 함유하고 있으리라 생각되는 샘플로부터 미생물의 DNA를 획득하고; 그 미생물 핵산을 시토신을 변형시키는 시약으로 처리하여 유도체 미생물 핵산을 형성시키고; 목적 미생물-특이적 핵산 분자의 증폭으로 유도체 미생물 핵산이 되도록 할 수 있는 프라이머를 제공하고; 유도체 미생물 핵산 상에서 증폭 반응을 수행하여 단순형 핵산을 형성시키는 것으로서, 여기에서 희망하는 미생물-특이적 핵산 분자의 검출은 그 샘플에서 미생물의 존재를 나타낸다.
만약 게놈 또는 미생물 핵산이 DNA라면, 단순형 DNA를 형성시키기 위해 증폭시키게 되는 유도체 DNA를 형성하기 위해 처리될 수 있다.
만약 게놈 또는 미생물 핵산이 RNA라면, 미생물 게놈 또는 핵산을 처리하기에 앞서 DNA로 전환시킬 수 있다. 부가로, 미생물 RNA는 증폭시키기 전에 유도체 DNA 분자로 전환되는 유도체 RNA 분자를 획득하기 위해 처리될 수 있다. RNA를 DNA로 전환시키는 방법들은 공지이고 cDNA를 형성하기 위해 역전사효소를 이용하는 것을 포함한다.
미생물 게놈 또는 핵산은 파아지, 바이러스, 비로이드(viroid), 박테리아, 진균, 조류(alga), 원생동물(protozoan), 스피로헤타(spirochaete), 또는 단세포 생물로부터 획득될 수 있다.
미생물 게놈 또는 핵산은 단백질을 암호화하는 핵산, 비-단백질을 암호화하는 핵산, 원핵생물 또는 단세포 진핵 미생물의 리보솜 유전자 부위로부터 선택될 수 있다. 바람직하게, 리보솜 유전자 부위는 원핵생물에서는 16S 또는 23S 이고, 단세포 진핵 미생물의 경우에는 18S 및 28S이다. 시약은 중아황산염(bisulfite), 아세트산염(acetate) 또는 구연산염(citrate)으로부터 선택된다. 바람직하게, 시약은 산성아황산나트륨(sodium bisulfite)이다.
바람직하게, 시약은 비-상보적 미생물 핵산 분자가 아니라 두 개의 유도체를 형성하는 상보적 이중 나선으로 된 미생물 게놈 DNA의 각 가닥에서 시토신을 우라실로 변형시킨다. 바람직한 형태에서, 시토신은 미생물 핵산에서 통상적으로 발견되는 것처럼 메틸화되어 있지 않다.
바람직하게, 유도체 미생물 핵산은 그 대응하는 비처리된 게놈 또는 핵산에 비교하여 감소된 총 수의 시토신을 갖는다.
바람직하게, 미생물 게놈 또는 핵산의 단순형은 그 대응하는 비처리된 미생물 게놈 또는 핵산과 비교하여 감소된 총 수의 시토신을 갖고 있다.
하나의 바람직한 형태에서, 유도체 미생물 핵산은 실질적으로 아데닌(A), 구아닌(G), 티민(T) 및 우라실(U)을 함유하고 그 대응하는 비처리된 미생물 게놈 또는 핵산과 실질적으로 동일한 수의 염기를 가지고 있다. 또 다른 바람직한 형태에서, 미생물 게놈 또는 핵산의 단순형은 실질적으로 아데닌(A), 구아닌(G) 및 티민(T)을 포함한다.
바람직하게, 증폭은 PCR(polymerase chain reaction), 등온 증폭 또는 시그널 증폭과 같은 임의의 적절한 수단에 의해 수행된다.
본 발명의 두 번째 측면에 따른 방법은 다음을 더 포함할 수 있다:
미생물-특이적 핵산 분자를 검출하는 것이다.
바람직한 형태에서, 미생물-특이적 핵산 분자는 다음에 의해 검출된다:
미생물-특이적 핵산 분자의 표적 부위에 결합할 수 있는 검출자 리간드를 제공하여 그 검출자 리간드가 표적 부위에 결합하도록 충분한 시간동안 놓아두고; 표적 부위에 결합된 검출자 리간드를 측정하여 미생물-특이적 핵산 분자의 존재를 검출한다.
또 다른 바람직한 형태에서, 미생물-특이적 핵산 분자는 증폭 산물을 분리하고 분리된 산물을 가시화함으로써 검출된다. 바람직하게, 증폭 산물은 전기영동에 의해 분리되고 겔 상에서 하나 이상의 밴드를 보여줌으로써 검출된다. 바람직하게, 미생물-특이적 핵산 분자는 미생물에서 자연적으로 발생되지 않는다.
바람직한 형태에서, 미생물-특이적 핵산 분자는 미생물의 분류 기준을 나타내는 핵산 서열을 갖고 있다. 미생물의 분류 기준은 과(family), 속(genus), 종(species), 균주(strain), 타입(type) 또는 그 미생물 또는 다른 지리학적 또는 해저 집단과는 다른 집단을 포함하나 이에 제한되지 않는다.
본 발명의 세 번째 측면에 따른 방법의 바람직한 형태에서, 두 개 이상의 미생물 DNA 서열의 단순형을 획득하고 두 개 이상의 서열을 적어도 하나의 미생물-특이적 핵산 분자를 획득하기 위하여 비교하였다. 본 발명의 일곱 번째 측면의 바람직한 형태에서, 핵산 분자들은 다음에 의해 측정된다: 핵산 분자의 부위에 결합할 수 있는 검출자 리간드를 제공하여 그 부위에 검출자 리간드가 결합하도록 충분한 시간동안 놓아두고; 핵산 분자에 검출자 리간드의 결합을 측정하여 핵산 분자의 존재를 검출한다.
또 다른 바람직한 형태에서, 핵산 분자는 증폭 산물을 분리하고 분리된 산물을 가시화함으로써 측정된다.
미생물이 DNA 게놈 또는 미생물 게놈을 가지고 있지 않거나 핵산이 RNA인 경우에, 예를 들어 RNA 바이러스인 경우에, 그 RNA 바이러스 게놈은 DNA를 시약으로 처리하기 위하여 우선 cDNA로 전환시킬 수 있다. RNA가 또한 처리될 수 있고 유도체 RNA가 증폭되기 전에 DNA로 전환된다.
바람직하게, 유도체 핵산은 실질적으로 아데닌(A), 구아닌(G), 티민(T) 및 우라실(U)을 포함하고, 실질적으로 그 대응하는 비변형된 미생물 핵산과 같이 동일한 총 수의 염기를 갖고 있다. 중요하게, 유도체 핵산 분자는 미생물 DNA가 임의의 시토신에서 메틸화되지 않았다는 조건 하에서, 실질적으로 시토신(C)를 함유하지 않는다.
바람직하게 증폭된 유도체 핵산은 실질적으로 염기 A, T 및 G를 함유하고 실질적으로 대응하는 유도체 핵산(및 비변형된 미생물 핵산)과 동일한 총수의 염기를 가지고 있다. 증폭된 유도체 핵산은 단순 핵산으로 명명되어 진다.
바람직한 형태에서, 미생물-특이적 핵산 분자는 미생물의 분류 기준을 나타내는 핵산 서열을 갖는다. 미생물의 분류 기준은 과(family), 속(genus), 종(species), 균주(strain), 타입, 또는 그 미생물 또는 다른 지리학적 또는 해저 집단과 다른 집단을 포함할 수 있다. 박테리아의 경우에는 다음과 같이 일반적으로 알려진 분류계에 부착할 수 있다:박테리아, 프로테오박테리아(Proteobacteria); 베타프로테오박테리아(Betaproteobacteria); 네이세이아레스(Neisseriales); 네이세리아세애(Neisseriaceae); 네이세리아(Neisseria). 다른 집단들은 미생물(플라스미드 또는 파아지미드)내의 세포내 형태 또는 병인성 부분(pathogenicity islands)과 같은 미생물 게놈의 다형성 염색체 부위에 존재하는 DNA 분자에서 존재하는 단일 뉴클레오타이드 변화 또는 변형을 위한 다형성일 수 있다.
본 발명은 또한 미생물과 바이러스 게놈의 유동성을 인식하는데 이용될 수 있고, 독립된 단편으로 존재하고 있는 바이러스 게놈의 키메라 특성을 인식하는데 이용될 수 있어 새롭게 발생하는 균주는 다른 동물의 게놈 부위의 재분류로부터 발생하는데, 예를 들어, 다른 포유동물 또는 조류 바이러스 게놈에서 취한 단편의 키메라로서 새로운 인간 인플루엔자 균주가 발생하게 된다.
그 방법은 원래 서열에 존재하는 하나 이상의 시토신을 티민으로 전환시켜 단순형 핵산을 얻을 수 있는 미생물의 알려진 핵산 서열로부터 인실리코(in silico)를 수행할 수 있다. 서열 동정은 전환된 서열로부터 결정될 수 있다. 그런 인실리코(in silico) 방법은 처리 및 증폭 단계를 모방한다.
이 방법에 의해 임의로 주어진 미생물에서 미생물-특이적 핵산 분자가 획득되었을 때, 탐침 또는 프라이머는 증폭 반응에서 목적 부위가 증폭되도록 설계될 수 있다. 그러므로, 탐침 또는 프로브가 설계되었을 때, 주어진 분류 기준에서 주어진 미생물을 검출하기 위해 샘플에 대한 임상 또는 과학적 분석을 수행하는 것이 가능할 것이다.
미생물-특이적 핵산 분자는 독특하거나 분류 기준 내에서 높은 정도의 유사성을 가질 수 있다. 본 발명의 한 잇점은 예를 들어 미생물의 분류 기준들 사이 또는 내에 존재하는 독특한 분자 또는 밀접한 서열 유사성을 갖는 분자를 위한 잠재적인 염기 차이성을 크게 단수화시키는 능력이다. 특이적 프라이머 또는 감소된 수의 변형된 프라이머가 주어진 샘플에서 미생물-특이적 핵산 분자를 증폭시키기 위해 사용될 수 있다.
시스테인을 함유하는 이중 나선 DNA의 경우, 처리 단계는 각각 아데닌, 구아닌, 티민 및 우라실 염기를 포함하는 두 개의 유도체 핵산(각 상보 가닥을 위한 하나)을 초래한다. 그 두 개의 유도체 핵산은 이중 나선 DNA의 두 개의 단일 가닥으로부터 생산된다. 그 두 개의 유도체 핵산은 바람직하게 시스테인을 함유하지 않으나 여전히 원래의 처리하지 않은 DNA 분자와 동일한 총 수의 염기 및 서열 길이를 갖고 있다. 중요하게, 그 두 개의 유도체 핵산은 서로 상보적이지 않고 증폭을 위해 상부 및 하부 가닥 주형을 형성한다. 하나 이상의 가닥이 단순형 핵산 분자를 생산하기 위하여 증폭을 위해 표적으로서 사용될 수 있다. 유도체 핵산의 증폭 동안, 상부(또는 하부 가닥)에 있는 우라실은 그 대응하는 증폭된 단순한 형태의 핵산에서 티민으로 치환된다. 증폭이 계속될수록, 상부(및/또는 만약 증폭되었다면 하부 가닥)는 희석될 것이고 각 새로운 상보 가닥은 오직 아데닌, 구아닌, 티민 염기만 가지게 될 것이다.
본 발명의 이런 측면은 또한 미생물-특이적 핵산 분자에 상보적인 서열을 갖는 핵산 분자, 및 바람직하게는 엄격한 조건 하에서, 미생물-특이적 핵산 분자와 혼성화할 수 있는 핵산 분자를 포함한다.
본 발명은 임의의 미생물이 주어진 샘플 내에 존재하는지 여부를 결정하는데 사용될 수 있는 미생물의 대표적 타입을 나타내는 탐침 또는 프라이머를 이용할 수 있다. 또한, 미생물 타입-특이적 탐침은 실질적으로 주어진 미생물의 타입, 서브타입, 변이체 및 유전자형의 예들을 실질적으로 검출하는데 이용될 수 있다.
미생물-특이적 핵산 분자가 임의의 주어진 미생물을 위해 획득되거나 동정되었을 때, 탐침 또는 프로브는 증폭 반응에서 목적 부위가 증폭되도록 설계될 수 있다. 양 가닥이 처리되어 전환된 게놈(여기에서부터, "유도체 핵산"으로 명명)은 프라이머 설계를 위해 분석될 수 있고, 처리 또는 전환이 서열의 비대칭을 유도할 수 있기 때문에, 다른 프라이머 서열이 동일한 유전자 좌(locus)의 "상부" 및 "하부" 가닥(또한 "왓슨"과 "크릭" 가닥으로 알려진 것)의 검출을 위해 요구된다는 점에 주의하는 것이 중요하다. 그러므로 전환 후에 즉시 존재하는 것과 같은 전환된 게놈 및 통상적인 효소학적 수단(PCR) 또는 등온 증폭과 같은 수단에 의해 유도체 핵산이 치환된 후에 나타나는 분자들의 집단의 두 가지의 분자 집단이 존재한다. 프라이머들은 편의를 위해 통상적으로 전환된 상부 가닥을 위해 설계되지만 프라이머들은 또한 하부 가닥을 위해 발생될 수 있다. 그러므로, 주어진 미생물을 검출하기 위해 임상적 또는 과학적 분석을 수행하는 것이 가능해질 것이다.
프라이머 또는 탐침은 유도체 핵산의 특정 부위가 증폭되도록 설계될 수 있다. 바람직한 형태에서, 프라이머들은 미생물-특이적 핵산 분자의 증폭을 야기시킨다. 일곱 번째 측면에서, 본 발명은 본 발명의 다섯 번째 측면에 따른 프라이머 또는 탐침과 증폭 반응을 위한 하나 이상의 시약 또는 성분들을 포함하는, 미생물-특이적 핵산 분자를 검출하기 위한 키트를 제공한다.
바람직하게, 미생물은 파아지, 바이러스, 비로이드(viroid), 박테리아, 진균, 조류, 원생동물(protozoan), 스피로헤타, 단세포 생물 또는 이를 테면 the Kingdom Protoctista(Margulis, L., et a/ 1990), Handbook of Protoctista(Jones and Bartlett, Publishers, Boston USA)와 같이 비록 매우 다양하게 분류된다 하더라도 임의의 다른 미생물, 또는 Harrisons Principles of Internal Medicine(12th Edition, edited by J D Wilson et al., McGraw Hill Inc) 뿐만 아니라 그 이후의 에디션에서 정의된 인간과 관련된 미생물들로부터 선택된다. 그것은 또한 OMIM(Online Mendelian Inheritance in Man, www.ncbi.gov)에서 정의된 인간 상태와 관련된 것으로 기재된 모든 미생물을 포함한다.
미생물은 환경적 샘플, 물 또는 대기속 개체에서 자연적으로 발생하는 병원체가 될 수 있으며, 이들은 세포 밖 또는 세포 내에서 , 또는 키레마 라이프 형태와 관련되거나, 또는 두 가지 이상의 라이프 형태, 이를 테면 지의(lichen)과 관련된 미생물 또는 박테리아 필름과 관련된 미생물과 같이 다른 생물의 외피에서 공생적으로 존재하는, 성숙하거나 포자 형태로 존재할 수 있다.
우선 역전사를 통해 그들의 RNA 게놈을 cDNA 형태로 전환시켜 시약에 의해 그 cDNA를 변형시킴으로써 RNA 바이러스 또는 비로이드의 존재를 분석하는 것이 가능하다. 이것은 만약 규칙적으로 시토신이 존재한다면 역전사 효소가 이것을 복사할 것이기 때문에, RNA 바이러스에 시토신에 존재하는 임의의 메틸화의 문제를 극복한다.
바람직하게, 시약은 메틸화되지 않은 시토신을 유도체 핵산의 증폭 동안 티민으로 치환되는 우라실로 변형시킨다. 바람직하게, 시토신을 변형시키기 위해 사용되는 시약은 산성아황산나트륨(sodium bisulfite)이다. 유사하게 메틸화된 시토신이 아니라, 메틸화되지 않은 시토신을 변형시키는 다른 시약은 또한 본 발명의 방법에 사용될 수 있다. 예로서 중아황산염, 아세트산염 또는 구연산염을 포함하나 여기에 제한되지 않는다. 바람직하게, 그 시약은 산성아황산나트륨으로 물의 존재 하에서 시토신을 우라실로 변형시키는 것이다.
산성아황산나트륨(NaHSO3)은 시토신의 5,6-이중 결합과 쉽게 반응하여 탈아미노화될 수 있는 술폰네이트 시토신 반응 중간매개체를 형성시키고, 물의 존재 하에서 우라실 설파이트(uracil sulfite)를 발생시킨다. 만약 필요하다면, 설파이트 기는 약염기 조건하에서 제거되어 우라실의 형성을 초래시킬 수 있다. 그러므로, 잠재적으로 모든 시토신은 우라실로 전환될 수 있다. 그러나, 임의의 메틸화된 시토신은 메틸화에 의한 보호로 인하여 변형 시약에 의해 전환될 수 없다.
본 발명은 동일한 박테리아 종의 분리체들 사이의 거대한 예상치 못한 게놈 변형(2005, Tettelin , H., et al., Proc. Natl. Acad. Sci. USA. 102, 13950-13955; Genome analysis of multiple pathogenic isolates of Streptococcus agalacticiae: implications for the microbial "pan-genome")에 의해 드러나는 최근 발생한 문제들의 몇몇을 회피하도록 보조할 수 있다. 이 박테리아 종들의 모든 분리체들은 유전자 풀의 약 80%를 나타내는 단백질 코딩 유전자의 "코어" 게놈과 부분적으로 나뉘어지고 균주-특이적 단백질 코딩 유전자를 구성하고 있는 비필수 게놈(dispensable genome)을 가지고 있다. 본 발명에 따른 방법에 의해 박테리아 집단 내에 존재하는 23S 유전자(들)을 처리함으로써, 발명자들은 모든 박테리아 분리체에 존재하고 있는 코어 비-단백질 코딩 성분을 처리할 수 있다.
본 발명은 임상적, 환경적, 수사적, 생물학적 전투, 또는 미생물의 과학적 분석에 적절하고, 이는 그 개체가 속하는 일반 그룹을 우선 결정하기 위해, 상기 초기 동정 또는 종 수준에서 유용하다. 실시예들은 임의 개체에서 질병의 진단(척추동물, 무척추동물, 원핵생물 또는 진핵생물이 될 수 있고, 예를 들어 식물 및 가축의 질병, 양어장 및 굴양식장과 같은 인간 식품원의 질병), 천연적 또는 오염된 환경 자원의 스크리닝 또는 샘플링, 세포 배양 또는 시험관 내(in vitro) 수정 임상에서 인간의 배반포 생산 또는 동물의 번식을 위한 시험관 내 수정란의 오염 결정을 포함한다. 수사적 세팅 또는 생물학적 전투 항목에서 미생물의 검출은 특히 중요하다.
본 명세서를 통해, 달리 요구되는 것이 없다면, 단어 "포함하다" 또는 "포함하다" 또는 "포함하는"과 같은 변화는 정해진 요소, 완전체(interger) 또는 단계(step), 또는 요소들의 그룹, 완전체들 또는 단계들의 포함을 포함하는 것으로 이해될 것이며, 어느 다른 요소, 완전체 또는 단계, 요소들의 그룹, 완전체들 또는 단계들의 배제로 의미되는 것은 아니다.
본 발명의 명세서에 포함되어 있는 서류들, 행위들, 물질들, 장치들, 그들 등에 대한 임의의 논의는 온전히 본 발명을 위한 내용을 제공하려는 목적이다. 임의의 또는 모든 이들 사항들은 선행 기술의 기초 부분을 형성하거나 본 발명이 발명되기에 앞서 호주에 존재하고 있었던 것처럼 본 발명과 관련된 분야에서 통상적인 지식이 되는 것은 아니다.
본 발명이 좀더 분명하게 이해되도록 하기 위하여, 바람직한 구체예들이 다음의 도면들 및 실시예에서 참고적으로 기재될 것이다.
발명을 실시하기 위한 형태(들)
정의
여기에서 사용된 용어 "게놈 단순화(genomic simplification)"는 게놈(또는 다른) 핵산이 아데닌(A), 구아닌(G), 티민(T) 및 시토신(C)의 네 가지의 염기를 포함하는 것으로부터 실질적으로 아데닌(A), 구아닌(G), 티민(T) 염기를 함유하는 것으로, 그러나 여전히 실질적으로 동일한 염기의 총 수를 갖는 것으로 변형되는 것을 의미한다.
여기에서 사용된 용어 "유도체 핵산(derivative nucleic acid)"은 실질적으로 염기 A, G, T 및 U(또는 비-A, G, 또는 T 염기 또는 염기-유사체)를 함유하고 실질적으로 그 대응의 비변형된 미생물 핵산과 동일한 염기의 총수를 갖는 핵산을 의미한다. 실질적으로 미생물 DNA에서 모든 시토신은 시약으로 처리되는 동안 우라실로 전환된다. 이를 테면 메틸화와 같이 변경된 시토신은 우라실(또는 다른 비-A, G, 또는 T 염기 또는 염기-유사체)로 필수적으로 전환되지 않을 것이다. 미생물 핵산이 통상적으로 메틸화된 시토신(또는 다른 시토신 변경)을 포함하지 않기 때문에, 바람직하게 처리 단계는 모든 시토신을 전환시킨다. 바람직하게 시토신은 우라실로 변형된다.
여기에서 사용된 용어 "단순화된 핵산(simplified nucleic acid)"는 유도체 핵산을 증폭시킨 후에 수득된 결과의 핵산 산물을 의미한다. 유도체 핵산에서 우라실은 단순화된 핵산 분자를 형성하는 유도체 핵산이 증폭되는 동안 이때 티민(T)으로 치환된다. 결과적 산물은 실질적으로 그 대응의 비변형된 미생물 핵산과 동일한 염기의 총 수를 갖고 있지만, 실질적으로 세 가지 염기들(A, G 및 T)의 조합으로 구성된다.
여기에서 사용된 용어 "단순화된 서열(simplified sequence)"은 단순화된 핵산을 형성하는 유도체 핵산을 증폭시킨 후에 수득된 결과의 핵산 서열을 의미한다. 결과적인 단순화된 서열은 실질적으로 그 대응의 비변형된 미생물 핵산 서열과 동일한 염기의 총 수를 갖는 것이지만, 실질적으로 세 가지 염기들(A, G 및 T)의 조합으로 구성된다.
여기에서 사용된 용어 "비-전환된 서열(non-converted sequence)"은 처리 및 증폭되기 전의 미생물 핵산의 핵산 서열을 의미한다. 비-전환된 서열은 통상적으로 천연적으로 발생하는 미생물 핵산의 서열이다.
여기에서 사용된 용어 "변형시키다"는 시토신을 다른 뉴클레오타이드로 전환시키는 것을 의미한다. 바람직하게, 시약은 비-메틸화된 시토신을 유도체 핵산을 형성하는 우라실로 변형시킨다.
여기에서 사용된 용어 "시토신을 변형시키는 시약"은 시토신을 다른 화학체로 전환시킬 수 있는 시약을 의미한다. 바람직하게, 그 시약은 시토신을 유도체 핵산의 증폭 동안 티민으로 치환될 수 있는 우라실로 변형시킨다. 바람직하게, 시토신을 변형시키기 위해 사용되는 시약은 산성아황산나트륨(sodium bisulfite)이다. 유사하게 메틸화된 시토신이 아니라 시토신을 변형시키는 다른 시약이 또한 본 발명의 방법에서 사용될 수 있다. 실시예들은 중아황산염, 아세트산염 또는 구연산염을 포함하나 여기에 제한되지 않는다. 바람직하게, 시약은 산성아황산나트륨으로서, 산성 수용액 조건의 존재 하에서 시토신을 우라실로 변형시키는 시약이다.
산성아황산나트륨(NaHSO3)은 시토신의 5,6-이중 결합과 쉽게 반응하여 탈아미노화에 적합한 설폰네이트 시토신 반응 중간매개물을 형성하고, 물의 존재하에서 우라실 설파이트를 생성시킨다. 만약 필요하다면, 설파이트 기는 약 알칼리 조건 하에서 제거되어 우라실을 형성시킬 수 있다. 그러므로, 잠재적으로 모든 시토신은 우라실로 전환될 것이다. 그러나, 임의의 메틸화된 시토신은 메틸화에 의한 보호로 인하여 변형시키는 시약에 의해 전환될 수 없다. 시토신(또는 다른 염기)는 본 발명에 의해 교시된 것처럼 효소적 수단에 의해 유도체 핵산으로 변형될 수 있다. 핵산의 염기가 변형될 수 있는 두 가지의 넓은 일반적인 방법이 있다: 화학적 및 효소적 방법: 그러므로, 본 발명을 위한 변형은 또한 천연적으로 발생하는 효소, 또는 인공적으로 구축된 또는 선택된 효소에 의해 수행될 수 있다. 중아황산염 방법론과 같은 화학적 처리는 적절한 화학적 단계를 통해 시토신을 우라실로 전환시킬 수 있다. 유사하게, 예를 들어, 시토신 디아미나아제(cytosine deaminases)는 유도체 핵산을 형성시키는 전환을 수행할 수 있다. 시토신 디아미나아제에 대한 첫 번째 보고는 다음 논문이다(Schmidt, G., Z. physiol. Chem., 208, 185; 또한 다음을 보라: 1950, Wang, T.P., Sable, H.Z., Lampen, J.O., J. Biol. Chem, 184, 17-28, Enzymatic deamination of cytosines nucleosides). 초기 연구에서, 시토신 디아미나아제는 다른 뉴클레오-디아미나아제가 없이는 수득되지 않았었지만, 그러나 왕 등은 효소와 E.coli로부터 그런 활성을 정제할 수 있었다. 그러므로 시토신과 다른, 그 위치에서 차후의 복제 동안 궁극적으로 염기의 삽입을 초래하는 유도체 핵산을 형성시키는 시토신의 임의 효소적 전환은 단순화된 게놈을 수득하게 될 것이다. 유도체를 수득하고 단순화된 게놈을 수득하게 되는 그 화학적 및 효소적 전환은 임의의 뉴클레오-염기, 즉, 미생물의 핵산에서 천연적으로 발생하는 퓨린 또는 피리미딘에 적용될 수 있다.
여기에서 사용된 용어 "게놈 또는 핵산의 단순형"은 자연적으로 발생하든 합성된 것이든 네 가지의 보통 염기 G, A, T 및 C를 함유하는 게놈 또는 핵산이 게놈의 대부분 또는 모든 Cs들이 적절한 화학적 변형 및 연속적인 증폭 과정에 의해 Ts로 전화되었기 때문에 오직 세 가지의 염기 G, A 및 T로 주로 구성된 것을 의미한다. 게놈의 단순형은 상대적인 게놈 복잡성이 네 가지의 염기 기본에서 세 가지 염기 조성물로 감소된다.
여기에서 사용된 용어 "염기-유사체"는 시토신의 변형에 의해 형성된 실체를 의미한다. 염기-유사체는 유도체 핵산의 증폭동안 DNA 폴리머라아제에 의해 인식될 수 있고 그 폴리머라아제는 A, G, 또는 T가 유도체 핵산에서 염기-유사체에 반대되는 위치에서 새롭게 형성된 상보적 DNA 가닥 상에 놓여지도록 한다. 통상적으로, 염기-유사체는 그 대응하는 비처리된 미생물 핵산에서 시토신으로부터 변형된 우라실이다. 염기-유사체의 예들은 임의의 뉴클레오-염기, 즉 퓨린 또는 피리미딘을 포함한다.
여기에서 사용된 용어 "상대적인 복잡성 감소"는 탐침 길이에 관련된 것으로서, 즉, 동일한 크기의 두 개의 게놈에서 주어진 분자 상태 하에서 동일한 특이성 및 탐침의 특정 유전자 좌에 대한 혼성화 수준을 성취하는데 요구되는 평균 탐침 길이에서의 증가에 대한 것으로서, 여기에서 첫 번째 게놈은 "있는 것처럼" 네 가지의 염기 G, A, T 및 C로 구성되고, 여기에서 두 번째 게놈은 정확하게 동일한 길이를 가지나 몇몇 시토신(이상적으로는 모든 시토신)이 티민으로 전환된 것이다. 테스트 하의 유전자 좌는 전환된 게놈뿐만 아니라 원래 비전환된 게놈에서 동일한 위치에 있는 것이다. 평균적으로, 11-머 탐침이 네 가지의 염기 G, A, T 및 C로 구성된 4,194,304 염기의 정상적 게놈에서 완벽하게 혼성화될 독특한 위치를 가질 것이다(411는 4,194,304와 같다). 그러나, 그런 4,194,304 염기의 정상적 게놈은 중아황산염 또는 다른 적절한 수단에 의해 전환되고, 이 전환된 게놈은 이제 오직 세 가지의 염기로 구성되고, 분명히 덜 복잡하다. 그러나 게놈 복잡성의 감소의 결과는 우리의 이전의 독특한 11-머 탐침은 단순화된 게놈 내에서 혼성화할 수 있는 독특한 자리를 더이상 갖지 않는다. 중아황산염 전환의 결과로서 처음부터 발생되는 11 염기 서열의 다른 많은 가능한 등가의 위치들이 존재한다. 원래의 유전자 좌를 찾아 혼성화하는 14-머 탐침이 이제 필요할 것이다. 그것에 처음에 직관에 반하는 것처럼 보일지라도, 더 많은 게놈이 동일하게 보이기 때문에(더 많은 유사 서열을 갖는다), 단순화된 세 가지 염기 게놈 내에서 원래의 위치를 검출하는 증가된 탐침 길이가 요구된다. 그러므로 감소된 상대적 게놈 복잡성(또는 세 가지 염기 게놈의 단순성)은 원래의 독특한 자리를 발견하기 위해 더 긴 탐침을 설계해야만 하는 것을 의미한다.
여기에서 사용된 용어 "상대적 게놈 복잡성 감소"는 비변형된 DNA와 비교하였을 때 마이크로브-특이적이 되는 것이 가능한 증가된 탐침 길이에 의해 측정될 수 있다. 이 용어는 또한 미생물의 존재를 결정하는데 이용되는 탐침 서열의 종류를 통합한다. 이들 탐침은 PNA 또는 LNA 또는 INA에 기재된 것과 같이 골격에 변형된 삽입과 같은 비-통상적 골격을 가질 수 있다. 그러므로, 게놈은 탐침이 INA와 같은 삽입 슈도뉴클레오타이드(Intercalating pseudonucleotide)과 같은 추가적인 성분들을 갖는 것에 상관하지 않는,감소된 상대적 복잡성을 갖는 것으로 생각된다. 실시예들은 DNA, RNA, LNA(locked nucleic acid), PNA(peptide nucleic acid), MNA, ANA(altritol nucleic acid), HNA(hexitol nucleic acid), INA(intercalating nucleic acid), CNA(cyclohexanyl nucleic acid) 및 그들의 혼합물과 그들의 하이브리드, 뿐만 아니라 포스포로티오에이트(phosphorothioates), 포스포로셀레노이트(phosphoroselenoates), 포스포트리에스테르(phosphotriesters) 및 포스포보라노에이트(phosphoboranoates)와 같은, 그러나 여기에 제한되지 않는 그들의 인 원자 변형를 포함하나 여기에 제한되지 않는다. 비-천연적으로 발생하는 뉴클레오타이드는 DNA, RNA, PNA, INA, HNA, MNA, ANA, LNA, CNA, CeNA, TNA, (2'-NH)-TNA, (3'-NH)-TNA, α-L-리보-LNA, α-L-자일로-LNA, β-D-자일로-LNA, α-D-리보-LNA, [3.2.1]-LNA, 비시클로-DNA(Bicyclo-DNA), 6-아미노-비시클로-DNA, 5-에피-비시클로-DNA, α-비시클로-DNA, 트리시클로-DNA, 비시클로[4.3.0]-DNA, 비시클로[3.2.1]-DNA, 비시클로[4.3.0]아미드-DNA, β-D-리보피라노실-NA, α-L-릭소피라노실-NA, 2'-R-RNA, α-L- RNA 또는 α-D-RNA, β-D-RNA 내에서 포함되는 뉴클레오타이드를 포함하지만, 이에 제한되지 않는다. 추가로, 비-인 함유 화합물은 메틸이미노메틸(methyliminomethyl), 포름아세테이트(formacetate), 티오포름아세테이트 및 아미드를 함유하는 연결기와 같은, 그러나 여기에 제한되지 않는 뉴클레오타이드에 연결하기 위해 사용될 수 있다. 특히, 핵산 및 핵산 유사체는 하나 이상의 삽입체 10 슈도뉴클레오타이드(IPN)을 포함할 수 있다. IPN의 존재는 핵산 분자를 위한 복잡성 설명의 부분도 아니고, PNA에서와 같은 복잡성의 부분 골격에 대한 것도 아니다.
'INA'는 여기에 참고자료로서 통합된 WO 03/051901 , WO 03/052132, WO 03/052133 및 WO 03/052134(Unest A/S)의 교치에 따라 삽입되는 핵산을 의미한다. INA는 하나 이상의 삽입체 슈도뉴클레오타이드(IPN) 분자를 함유하는 올리고뉴클레오타이드 또는 올리고뉴클레오타이드 15 유사체이다.
'HNA'는 Van Aetschot 등(1995)에서 예시로서 기재된 것과 같은 핵산을 의미한다.
'MNA'는 Hossain 등(1998)에 의해 기재된 것과 같은 핵산을 의미한다.
'ANA'는 Allert 등(1999)에 의해 기재된 것과 같은 핵산을 의미한다.
'LNA'는 WO 99/14226 (Exiqon)에 기재된 것과 같은 임의의 LNA 분자일 수 있으며, 바람직하게, LNA는 WO 99/14226의 요약에서 기재된 분자들로부터 선택된다. 더욱 바람직하게, LNA는 Singh 등(1998), Koshkin 등(1998), 또는 Obika 등(1997)에서 기재된 것과 같은 핵산이다.
'PNA'는 Nielsen 등(1991)에 의해 기재된 것과 같은 펩타이드 핵산을 의미한다.
여기에서 사용된 '상대적인 복잡성 감소'는 염기가 발생하는 순서를 의미하는 것이 아닌 것으로서, 이를 테면 AAAAAAATTTTTTT (서열번호: 2)인 동일한 길이의 서열에 대하여 ATATATATATATAT (서열번호: 1 )인 서열 사이의 임의의 수학적 복잡성 차이를 의미하는 것이 아니고, 다음의 과학 논문(Waring, M. & Britten R. J.1966, Science, 154, 791-794; Britten, RJ and Kohne D E., 1968, Science, 161 , 529-540) 및 워싱턴 년간 책 보고의 카네기 인스티튜션에서 유래된 초기 참고자료들에 소개된 상대적인 게놈 크기(추리적으로, 게놈 복잡성)의 원래의 재-회합 30 데이터를 의미하는 것도 아니다.
여기에서 사용된 '상대적 게놈 복잡성'은 분자적 탐침에 의해 접근되는 두 개의 게놈에서 염기의 불변 위치를 의미한다(오리지널과 전환되지 않은 게놈 양자는 1 내지 n 불변 위치에서 염기들을 갖는다). 특히 여성의 3억개의 염기 쌍 반수체(haploid) 인간 게놈의 경우에 있어서, 불변 위치는 1 내지 n으로 정의되고, 여기에서 n은 3,000,000,000이다. 만약 서열 1 내지 n에 있어서, i번째 염기는 오리지널 게놈에서 C이면, 그때 i번째 염기는 그 전환된 게놈에서 T이다.
여기에서 사용된 용어 "게놈 핵산(genomic nucleic acid)"은 미생물(원핵생물 및 단세포 진핵생물) RNA, DNA, 단백질 코딩 핵산, 비-단백질 코딩 핵산 및 원핵생물 및 단세포 진핵 미생물의 리보솜 유전자 부위를 포함한다.
여기에서 사용된 용어 "미생물 게놈(microbial genome)"은 염색체 뿐만 아니라 염색체외 핵산을 포함하고, 뿐만 아니라 플라스미드, 박테리파아지(bacteriphage) 및 아주 큰 의미에서 이동 요소와 같은 게놈의 일시적인 상주를 포함한다. "게놈"은 S. 갈락티애(S. galactiae)에 의해 예증된 것과 같은 코어 성분을 갖고, 뿐만 아니라 다른 분리체들 사이에서 다양한 코딩 및 비-코딩 요소들을 갖는 것이 가능하다.
여기에서 사용된 용어 "미생물 유래 DNA"는 미생물로부터 직접 획득되거나 임의의 알려진 또는 적절한 방법, 이를 테면 역전환효소에 의해 미생물 RNA를 DNA로 전환시킴으로써 간접적으로 획득된 DNA를 포함한다. 여기에서 사용된 용어 "미생물"은 파아지, 바이러스, 비로이드, 박테리아, 진균, 조류, 원생동물, 스피로해타, 단세포 개체 또는 임의의 다른 미생물스, 비로이드(viroid), 박테리아, 진균, 조류, 원생동물(protozoan), 스피로헤타, 단세포 생물 또는 이를 테면 the Kingdom Protoctista(Margulis, L., et a/ 1990), Handbook of Protoctista(Jones and Bartlett, Publishers, Boston USA)와 같이 비록 매우 다양하게 분류된다 하더라도 임의의 다른 미생물, 또는 Harrisons Principles of Internal Medicine(12th Edition, edited by J D Wilson et al., McGraw Hill Inc) 뿐만 아니라 그 이후의 에디션에서 정의된 인간과 관련된 미생물들로부터 선택된다. 그것은 또한 OMIM(Online Mendelian Inheritance in Man, www.ncbi.gov)에서 정의된 인간 상태와 관련된 것으로 기재된 모든 미생물을 포함한다.
여기에서 사용된 용어 "미생물-특이적 핵산 분자"는 미생물에 특이적인 하나 이상의 서열을 갖는 본 발명에 따른 방법을 이용하여 결정되거나 획득된 분자를 의미한다.
여기에서 사용된 용어 "미생물의 분류 기준"은 과(family), 속(genus), 종( species), 균주(strain), 타입 또는 동일하거나 다른 지리학적 또는 해저 집단으로부터의 다른 집단들을 포함한다. 반면, 세균의 경우 일반적으로 알려진 도식, 이를테면 박테리아; 프로테오박테리아; 베타프로테오박테리아; 네이세리아레스; 네이세리아세애; 네이세리아가 사용된다. 다른 집단들은 미생물(플라스미드 또는 파아지미드)내의 세포내 형태 또는 병인성 부분(pathogenicity islands)과 같은 미생물 게놈의 다형성 염색체 부위에서 존재하는 DNA 분자에서 존재하는 단일 뉴클레오타이드 변화 또는 변형을 위한 다형성일 수 있다. 미생물 및 바이러스 게놈의 유동성은 알려져 있고, 바이러스 게놈의 키메라 형태를 포함하고, 이는 독립된 핵산 조각으로 존재할 수 있다. 그러므로, 다른 동물들로부터의 게놈 부위의 재-분류로부터 새롭게 생기는 균주들, 예를 들어 다른 포유동물 또는 조류 바이러스 게놈에서 취한 조각들의 키메라와 같은 새로운 인간 인플루엔자 균주. 여기에서 사용되는 용어 "밀접한 서열 유사성"은 상기 상대적 서열 복잡성 및 측정으로서 탐침 길이의 정의를 포함한다.
물질 및 방법
DNA 의 추출
일반적으로, 미생물 DNA(또는 바이러스 RNA)는 임의의 적절한 소스로부터 획득될 수 있다. 실시예들은 세포 배양, 브루스 배양, 환경 샘플, 임상 샘플, 체액, 액체 샘플, 조직과 같은 고체 샘플을 포함하나 이에 제한되지 않는다. 샘플로부터의 미생물 DNA는 표준 과정에 의해 획득될 수 있다. 적절한 추출의 예는 다음과 같다. 목적 샘플을 400㎕의 7M 구아니디늄 하이드로클로라이드(Guanidinium hydrochloride), 5 mM EDTA, 100 mMTris/HCI pH6.4, 1% 트리톤-X-100, 50 mM 프로테인나아제 K(시그마), 100 μg/ml 효소 tRNA 상에서 평판배양된다. 그 샘플은 완전히 사용가능한 1.5ml 페슬(pestle)로 균질화되어 60℃에서 48시간 동안 남겨두었다. 배양한 후에, 그 샘플은 5분 동안 드라이아이스/5분 동안 95℃로 5회 냉동/해동 주기를 수행한다. 이때 샘플은 볼텍스시키고 2분 동안 마이크로퓨즈(microfuge)에서 회전시켜 세포 잔해물을 펠릿화시킨다. 상청액은 클린 튜브로 제거하고 염 농도를 감소시키기 위해 희석시키고 페놀:클로로포름으로 추출하고, 에탄올로 침전시키고, 10 mM 트리스/0.1 mM EDTA의 50㎕에서 재현탁시킨다.
특히, 표준 아가 플레이트에서 (각 종에 특이적인 영양 요구물과 함께) 성장된 그램 양성 및 그램 음성 박테리아로부터의 DNA 추출은 다음과 같이 수행되었다. 그램 음성 박테리아로부터의 DNA 추출을 위한 프로토콜은 다음과 같다:
a) 멸균된 이쑤시개를 이용하여 박테리아 콜로니를 배양 플레이트에서 긁어내어 멸균된 1.5ml 원심분리 튜브로 옮겼다.
b) 180㎕의 구아니디늄 티오시아네이트 추출 버퍼(7M 구아니디늄 티오시아네이트, 5 mM EDTA (pH 8.O), 40 mM 트리스/Hcl pH 7.6, 1% 트리톤-X-100)을 첨가하여 그 샘플을 박테리아 콜로니를 재현탁시키기 위해 혼합하였다.
c) 20㎕(20mg/ml)의 프로테인나아제 K를 첨가하여 그 샘플들을 잘 혼합시켰다.
d) 샘플들은 세포를 용해시키기 위해 3시간 동안 55℃에서 배양하였다.
e) 200㎕의 물을 각 샘플에 첨가되고 부드러운 피펫팅으로 샘플을 혼합시켰다.
f) 400㎕의 페놀/클로로포름/이소-아밀 알코올(25:24:1)을 첨가하여 그 샘플들을 2×15초 동안 볼텍스시켰다.
g) 그 샘플들을 4분 동안 14,000rpm으로 마이크로퓨즈에서 회전시켰다.
h) 그 수용액 상은 깨끗한 1.5ml 원심분리 튜브로 제거하였다.
i) 400㎕의 페놀/클로로포름/이소-아밀 알코올(25:24:1)을 첨가하여 그 샘플들을 2×15초 동안 볼텍스시켰다.
j) 그 샘플들을 4분 동안 14,000rpm으로 마이크로퓨즈에서 회전시켰다.
k) 그 수용액 상은 깨끗한 1.5ml 원심분리 튜브로 제거하였다.
l) 800㎕의 100% 에탄올을 각 샘플에 첨가하여 그 샘플을 간단히 볼텐스한 후에 1시간 동안 -20℃에 두었다.
m) 그 샘플들을 4℃에서 4분 동안 14,000rpm으로 마이크로퓨즈에서 회전시켰다.
n) DNA 펠릿을 500㎕의 70% 에탄올로 세척하였다.
o) 그 샘플들을 4℃에서 4분 동안 14,000rpm으로 마이크로퓨즈에서 회전시키고, 에탄올을 제거하고 펠릿들은 5분 동안 건조시켰다.
p) 마지막으로 그 DNA는 100㎕의 10 mM 트리스/HCI pH 8.0, 1 mM EDTA pH 8.0에서 재현탁시켰다.
q) 그 DNA 농도 및 순도를 230, 260, 280nm에서 용액의 흡광도를 측정하여 계산하였다.
그램 양성 박테리아로부터 DNA 추출을 위한 프로토콜은 다음과 같다:
a) 멸균된 이쑤시개를 이용하여 박테리아 콜로니를 배양 플레이트에서 긁어내어 멸균된 1.5ml 원심분리 튜브로 옮겼다.
b) 180㎕의 20mg/ml 라이소자임(시그마) 및 200㎍의 리소스타핀(Lysostaphin, 시그마)을 각 샘플에 첨가하고 그 샘플을 박테리아 콜로니를 재현탁시키기 위해 혼합하였다.
c) 그 샘플들을 30분 동안 37℃에서 배양하여 세포 벽을 파괴시켰다.
d) 그 샘플들을 조작하여 그램 양성 박테리아를 위한 QIAamp DNA 미니 키트 프로토콜에 따라 DNA를 추출하였다.
환자들의 세포 샘플로부터 DNA 추출.
a) 그 샘플들을 손으로 강하게 흔들어서 임의의 침전된 세포들을 재현탁시키고 그 용액을 균질하게 하였다.
b) 4ml의 재현탁된 세포들을 15ml 코스타 원심분리 튜브로 옮겼다.
c) 그 튜브들을 15분 동안 3000×g에서 스윙-아웃 부켓 로터(swing-out bucket rotor)에서 원심분리하였다.
d) 그 상청액을 조심스럽게 따라내고 펠릿화된 세포 물질이 흐뜨러지지 않도록 제거하였다.
e) 펠릿화된 세포들을 200㎕의 용해 버퍼(100 mM 트리스/HCI pH 8.0, 2 mM EDTA pH 8.0, 0.5% SDS, 0.5% 트리톤-X-100)에서 재현탁시키고 그 용액이 균질화될 때까지 잘 혼합하였다.
f) 80㎕의 샘플들을 96 웰 샘플 제조 플레이트로 옮겼다.
g) 20㎕의 프로테인나아제 X를 첨가하여 그 용액을 1시간 동안 55℃에서 배양시켰다(이 과정으로 세포 용해가 일어난다).
소변 샘플로부터 DNA 추출
QIAamp UltraSens™ 바이러스 교과서에 따라 출발 부피 1ml의 소변에서 DNA를 추출하였다.
DNA 샘플들의 중아황산염 처리
중아황산염 처리는 MethylEasy™ 고성능 DNA 중아황산염 변형 키트(Human Genetic Signatures, Australia)에 따라 수행되었다. 이는 하기에서 보여준다.
놀랍게도, 본 발명자들에 의해 핵산의 다른 소스로부터 미생물 DNA를 분리할 필요할 필요가 없음을 발견하였는데, 예를 들어 미생물 DNA가 인간 세포의 샘플에 존재할 때이다. 처리 단계는 다른 DNA 타입의 거대 혼합물을 위해 사용될 수 있고, 미생물-특이적 핵산은 본 발명에 의해 동정될 수 있다. 복잡한 DNA 혼합물에서 검출의 한계는 표적 핵산 분자의 단일 사본까지 내려갈 수 있는 표준 PCR 검출의 한계까지가 되는 것으로 평가된다.
샘플들
임의의 적절한 샘플은 본 발명을 위해 사용될 수 있다. 실시예들은, 미생물 배양물, 임상 샘플, 수의 샘플, 체액, 조직 배양 샘플, 환경 샘플, 물 샘플, 폐수를 포함하지만 이에 제한되지 않는다. 본 발명은 임의의 미생물을 측정하는데 적절하기 때문에, 이 목록이 철저하게 고려되어야만 하는 것은 아니다.
키트
본 발명은 다양한 형태의 키트, 또는 키트의 조합으로 실시될 수 있고 메뉴얼, 반자동화된 또는 전체 로보트 플랫폼에 의하여 설명될 수 있다. 바람직한 형태에서, MethyEasy™ 또는 고성능 MethyEasy™ 키트(Human Genetic Signatures Pty Ltd, Australia)은 EpMotion과 같은 로보트 플랫폼을 이용하여 96 또는 384 플레이트에서 핵산을 전환시킨다.
중아황산염 처리
핵산의 효과적인 중아황산염 처리를 위한 예시적 프로토콜은 하기에서 설명한다. 프로토콜은 실질적을 모든 처리된 DNA를 보유하게 한다. 이 방법은 또한 여기에서 HGS(Human Genetic Signatures) 방법으로 언급되기도 한다. 샘플 또는 시약의 부피 또는 양은 다양할 수 있을 것이다.
중아황산염 처리를 위한 바람직한 방법은 여기에 참고자료로 통합된 US 10/428310 또는 PCT/AU2004/000549에서 발견될 수 있다.
만약 바람직하다면, 적절한 제한효소로 미리-소화될 수 있는 2㎍의 DNA를 위해, 2 ㎕ (1/10 부피)의 3 M NaOH (신선하게 만들어진, 50 ml 물에서 6g)을 20㎕의 최종 부피에 첨가하였다. 이 단계는 중아황산염 시약이 단일가닥분자와 반응을 하기때문에, 이중나선 DNA 분자를 단일 가닥 형태로 변성시킨다. 그 혼합물은 15분 동안 37℃에서 배양시켰다. 상기 실온에서의 배양은 변성의 효율성을 개선시킬 수 있다. 배양 후에, 208㎕ 2M 소듐 메타비설파이트(신선하게 만들어진; BDH AnalaR #10356.4D; 416 ml 10 N NaOH이 있는 20ml의 물에서 7.6 g) 및 12㎕의 10mM 퀴놀(Quinol, 신선하게 만들어진; BDH AnalR #103122E, 50ml 물에서 0.055g)을 연속적으로 첨가하였다. 퀴놀은 환원제로서 시약의 산화를 감소시키게 한다. 다른 환원제가 또한 사용될 수 있는데, 예를 들어, DTT(dithiothreitol), 머캡토에탄 올(mercaptoethanol), 퀴논(하이드로퀴논) 또는 다른 적절한 환원제들이다. 그 샘플들을 200㎕의 미네랄 오일로 도포하였다. 미네랄 오일의 도포는 시약의 증발 및 산화를 막지만 필수적인 것은 아니다. 그 샘플은 이때 55℃에서 하룻밤동안 배양시켰다. 부가로, 그 샘플들은 다음과 같은 써멀 사이클러(thermal cycler)에서 순환시켰다: 다음처럼 약 4시간 동안 또는 하룻밤 동안 배양한다: 단계 1, PCR 기기에서 55℃/2시간 순환시켰다; 단계 2, 95℃/2분. 단계 1은 약 37℃ 내지 약 90℃사이의 임의 온도에서 수행될 수 있고 5분 내지 8시간 동안으로 시간을 다양하게 할 수 있다. 단계 2는 70℃ 내지 99℃ 사이의 임의 온도에서 수행될 수 있고 1초 내지 60분, 또는 더 오래 동안으로 시간을 다양하게 할 수 있다.
소듐 메타비설파이트로 처리한 후에, 오일을 제거하고 만약 DNA 농도가 낮다면 1 ㎕ tRNA (20 mg/ml) 또는 2㎕ 글리코겐을 첨가하였다. 이들 첨가제는 임의적이고 특히 DNA가 낮은 농도로 존재할 때 표적 DNA로 공동-침전시킴으로써 수득된 DNA의 수율을 개선시키기 위해 사용될 수 있다. 핵산의 좀더 효율적인 침전을 위한 담체로서 첨가제의 농도는 일반적으로 핵산의 양이 <0.5 μg일 때가 일반적으로 바람직하다.
이소프로판올 클린업 처리는 다음과 같이 수행되었다: 800㎕의 물을 그 샘플에 첨가하여 혼합시키고 1ml의 이소프로판올을 첨가하였다. 물 또는 버퍼는 반응관에서 중아황산염의 농도를 감소시켜 그 염이 목적의 표적 핵산과 함께 침전시키지 않을 수준까지 낮춘다. 희석은 염 농도가 여기에서 개시된 목적 범위 이하로 희석되는 한, 일반적으로 약 1/4 내지 1/1000 가 된다.
그 샘플은 다시 혼합시켜 4℃에서 최소 5분 동안 두었다. 그 샘플은 10-15분 동안 마이크로퓨즈에서 회전시키고 펠릿은 70% ETOH로 2회 세척하고 각 볼텍스하였다. 이 세척 처리는 핵산과 침전되는 임의의 잔여 염들을 제거시킨다.
펠릿을 건조시키고 적절한 부피, 이를 테면 50㎕의 T/E (10 mM 트리스/0.1 mM EDTA) pH 7.0-12.5에서 재현탁시켰다. pH 10.5에서의 버퍼가 특히 효과적인 것으로 발견되었다. 샘플은 1분 내지 96시간 동안 37℃ 내지 95℃에서 배양시키고, 필요하다면 핵산을 현탁시켰다.
중아황산염 처리의 또 다른 예는 시토신의 우라실로의 전환을 위한 방법 및 물질을 제공하는 WO 2005021778 (여기에 참고자료로 통합됨)에서 발견될 수 있다. 몇몇 구체예에서, 핵산, 이를 테면 gDNA는 중아황산염 및 폴리아민 촉매, 이를 테면 트리아민 또는 테트라-아민과 반응시켰다. 임의적으로, 중아황산염은 마그네슘 비설파이트를 포함한다. 다른 구체예에 있어서, 핵산은 마그네슘 비설파이트와 반응시키고, 임의적으로 폴리아민 촉매 및/또는 4기 아민 촉매(quaternary amine catalyst)의 존재하에서 반응시킨다. 또한 발명의 방법들을 수행하기 위해 사용될 수 있는 키트가 제공된다. 이들 방법들은 또한 처리 단계에서 본 발명에 적절할 것으로 평가될 것이다.
증폭
PCR 증폭은 프로메가 PCR 매스터 믹스, 6ng/㎕의 각 프라이머를 이용하여 2㎕의 중아황산염 처리된 게놈 DNA을 함유한 25㎕ 반응 혼합물에서 수행하였다. 가 닥-특이적으로 결합되는 프라이머를 증폭을 위해 사용하였다. 첫 번째 라운드의 PCR 증폭은 PCR 프라이머 1 및 4(하기에서 보라)을 이용하여 수행하였다. 첫 번째 라운드 증폭을 한 뒤에, 1㎕의 증폭된 물질을 PCR 프라이머 2 및 3을 함유한 두 번째 라운드 PCR 프리믹스로 옮겨 앞에서 설명한 것처럼 증폭시켰다. PCR 산물의 샘플들을 다음 조건 하에서 ThermoHybaid PX2 써멀 사이클러에서 증폭시켰다: 4분 동안 97℃의 1 사이클, 1분 동안 97℃의 30 사이클, 2분 동안 50℃ 및 2분 동안 72℃; 10분 동안 72℃의 1 사이클.
Figure 112007048658978-PCT00001
복합 증폭(Multiplex amplification)
만약 복합 증폭이 검출을 위해 요구된다면, 다음 방법론이 수행될 수 있다.
1㎕의 중아황산염로 처리된 DNA를 25㎕의 반응 부피로 다음 성분에 첨가하며, 그 성분은 x1 '퀴아젠 멀티플렉스 매스터 믹스, 5-100ng의 각 첫번째 INA 또는 올리고뉴클로오타이드 프라이머 1.5- 4.0 mM MgSO4, 400uM의 각 dNTP 및 폴리머라아제 혼합물의 0.5-2 유닛이다. 그 성분들은 다음처럼 핫 리드 썰머 사이클러(hot lid thermal cycler)에서 순환시켰다. 통상적으로 각 증폭 반응에서 최고 200개의 개별적 프라이머 서열이 가능하다.
Step 1 94℃ 15분 1 사이클
Step 2 94℃ 1분
50℃ 3분 35 사이클
68℃ 3분
Step 3 68℃ 10분 1 사이클
두 번째 라운드 증폭은 1㎕ 약수의 첫 번째 라운드 증폭에서 수행하여 효소반응 믹스 및 적절한 두 번째 라운드 프라이머를 함유하는 두 번째 라운드 반응 튜브로 옮겼다. 사이클링은 상기처럼 수행되었다.
프라이머
임의의 적절한 PCR 프라이머는 본 발명을 위해 사용될 수 있다. 통상적으로 프라이머는 증폭될 서열에 상보적인 서열을 갖는다. 프라이머는 통상적으로 올리고뉴클레오타이드지만 올리고뉴클레오타이드 유사체도 가능하다.
탐침
탐침은 임의의 적절한 핵산 분자 또는 핵산 유사체가 될 수 있다. 실시예들은 DNA, RNA, LNA(locked nucleic acid), PNA(peptide nucleic acid), MNA, ANA(altritol nucleic acid), HNA(hexitol nucleic acid), INA(intercalating nucleic acid), CNA(cyclohexanyl nucleic acid) 및 그들의 혼합물 및 그들의 하이브리드, 뿐만 아니라 포스포로티오에이트(phosphorothioates), 포스포로셀레노이 트(phosphoroselenoates), 포스포트리에스테르(phosphotriesters) 및 포스포보라노에이트(phosphoboranoates)와 같은, 그러나 여기에 제한되지 않는 그들의 인 원자 변형를 포함하나 여기에 제한되지 않는다. 비-천연적으로 발생하는 뉴클레오타이드는 DNA, RNA, PNA, INA, HNA, MNA, ANA, LNA, CNA, CeNA, TNA, (2'-NH)-TNA, (3'-NH)-TNA, α-L-리보-LNA, α-L-자일로-LNA, β-D-자일로-LNA, α-D-리보-LNA, [3.2.1]-LNA, 비시클로-DNA(Bicyclo-DNA), 6-아미노-비시클로-DNA, 5-에피-비시클로-DNA, α-비시클로-DNA, 트리시클로-DNA, 비시클로[4.3.0]-DNA, 비시클로[3.2.1]-DNA, 비시클로[4.3.0]아미드-DNA, β-D-리보피라노실-NA, α-L-릭소피라노실-NA, 2'-R-RNA, α-L- RNA 또는 α-D-RNA, β-D-RNA 내에서 포함되는 뉴클레오타이드를 포함하지만, 이에 제한되지 않는다. 추가로, 비-인 함유 화합물은 메틸이미노메틸(methyliminomethyl), 포름아세테이트(formacetate), 티오포름아세테이트 및 아미드를 함유하는 연결기와 같은, 그러나 여기에 제한되지 않는 뉴클레오타이드에 연결하기 위해 사용될 수 있다. 특히, 핵산 및 핵산 유사체는 하나 이상의 삽입체 10 슈도뉴클레오타이드(IPN)을 포함할 수 있다. 바람직하게, 탐침은 INA를 형성하는 하나 이상의 내부 IPNs를 함유하는 DNA 또는 DNA 올리고뉴클레오타이드이다.
전기영동
샘플들의 전기영동은 E-겔 시스템 유저 가이드(www.invitrogen.doc)에 따라 수행되었다.
검출 방법
목적 샘플의 상태를 결정하기 위해 다양한 가능한 검출 시스템이 존재한다. 핵산 분자를 검출하기 위한 임의의 알려진 시스템 또는 방법이 본 발명을 위해 사용될 수 있는 것으로 평가될 것이다. 검출 방법은 다음을 포함하지만, 이에 제한되지 않는다:
I. 적절하게 표지된 DNA의 10→200,000 개별 성분을 선택할 수 있는 마이크로-어레이 타입 장치에의 혼성화. 그 분석은 유리, 플라스틱, 미카, 나일론, 비즈, 자기 비즈, 형광 비즈 또는 멤브레인과 같은 임의의 적절한 고체 표면 상에서 INAs, PNAs 또는 뉴클레오타이드 또는 변형된 뉴클레오타이드 분석으로 구성될 수 있다;
II. 서던 블랏 타입 검출 시스템;
III. 아가로스 겔과 같은 표준 PCR 검출 시스템, 진스캔 분석과 같은 형광 리드 아웃. 샌드위치 혼성화 분석, 에티듐 브로마이드(ethidium bromide), 사이버 그린과 같은 DNA 염색 시약, 항체 검출, ELISA 플레이트 리더 타입 기기, 형광계 기기;
IV. 특이적 또는 멀티플 게놈 증폭된 단편의 실시간 PCR 정량 또는 그 상에서의 임의의 변형.
V. 형광 비즈, 효소 접합체, 방사선 비즈 등과 같은 WO 2004/065625에서 약술한 임의의 검출 시스템;
Vl. 리가제 연쇄 반응과 같은 증폭 단계 또는 SDA(Strand Displacement Amplification)와 같은 등온 DNA 증폭 기술을 이용한 임의의 다른 검출 시스템.
VII. 멀티-광자 검출 시스템.
VIII. 겔 상에서의 전기영동 및 가시화.
IX. 핵산 검출을 위해 사용되거나 사용될 수 있는 임의의 검출 플랫폼.
삽입되는 핵산( Intercalating nucleic acids )
INA는 핵산(DNA 및 RNA)이서열 특이성으로 혼성화할 수 있는 비천연적으로 발생하는 폴리뉴클레오타이드이다. INA는 몇가지 바람직한 성질을 나타내기 때문에 탐침-기초 혼성화 분석에서 핵산 탐침에 대안체/치환체로서의 후보자이다. INA는 그 대응하는 천연적으로 발생하는 핵산/핵산 복합체보다 더 열역학적으로 안정한 하이브리드를 형성하는 핵산에 혼성화될 수 있는 폴리머이다. 그들은 펩타이드 또는 핵산을 분해하는 것으로 알려진 효소를 위한 치환체가 아니다. 그러므로, INA는 생물학적 샘플에서 더 안정적이어야 하며, 뿐만 아니라 천연적으로 발생하는 핵산 단편보다 더 긴 유통기한을 가져야 한다.
이온 강도에 매우 의존적인 핵산 혼성화와는 달리, INA의 핵산과의 혼성화는 이온 강도에 아주 독립적이고 천연적으로 발생하는 핵산의 핵산에 대한 혼성화에 가장 불리한 조건 하의 낮은 이온 강도를 더 선호한다. INA의 결합 강도는 이중 나선 구조에서 특정 형태로 쌓여있는 염기들 사이의 수소 결합으로부터의 보통의 상호작용뿐만 아니라 분자 내에 조작된 삽입 그룹들의 수에 의존한다. 서열 구별은 DNA를 인식하는 DNA에서 보다 DNA를 인식하는 INA의 경우에 더 효율적이다. 바람직하게, INA는 (S)-1-O-(4,4'-디메톡시트리페닐메틸)-3-O-(1-피레닐메틸)-글리세롤의 포스포아미다이트(phosphoramidite)이다.
INA는 상업적으로 이용가능한 형색으로 표준 올리고뉴클레오타이드 합성 과정을 채택하여 합성된다. INA의 총 정의 및 그들의 합성은 여기에 참고자료로 통합된 WO 03/051901 , WO 03/052132, WO 03/052133 및 WO 03/052134 (Unes.t A/S)에서 볼 수 있다.
INA 탐침과 표준 핵산 탐침 사이에는 많은 차이점이 있다. 이들 차이점들은 생물학적, 구조절 및 물리-화학적 차이점에 의해 구분될 수 있다. 상기 및 하기에서 논의한 것처럼, 이들 생물학적, 구조적 및 물리-화학적 차이점들은 INA 탐침의 이용을 통상적으로 이용되는 핵산에 시도할 때 예상치못한 결과를 이끌어낼 수 있다. 이 서로 다른 조성물의 비-등가가 종종 화학분야에서 관찰된다.
생물학적 차이점에 대하여, 핵산은 유전적 전달 및 발현의 대리인으로서 생물체의 생명에 있어서 중추역할을 하는 생물학적 물질이다. 그들의 생체 내 성질들은 매우 잘 알려져 있다. 그러나, INa는 화학자들에 의해 고안되어 합성 유기 화학을 이용하여 만들어진 최근 완전히 인공적 물질로 개발된 것이다.
구조적으로, INA는 또한 핵산과 완전히 다르다. 비록 양자 모두 일반 뉴클레오염기(A, C, G, T 및 U)를 이용할 수 있으나, 이들 분자들의 조성물은 구조적으로 다양하다. RNA, DNA 및 INA의 골격은 포스포디에스테르 리보오스 및 2-데옥시리보스 단위의 반복으로 구성된다. INA는 폴리머에 링커 분자를 통해 접착된 하나 이상 의 큰 플랫 분자를 갖고 있다는 점에 있어서 DNA 또는 RNA와는 다르다. 그 플랫 분자는 이중 나선 구조에서 반대편 INA 상보적인 DNA 가닥에서 염기들 사이에 삽입된다.
INA와 DNA 또는 RNA 사이의 물리/화학적 차이점은 또한 많다. INA는 동일한 표적 서열에 결합하는 핵산 탐침보다 더욱 빠르게 상보적인 DNA에 결합한다. DNA 또는 RNA 단편과 달리, INA는 삽입 그룹이 말단에 위치하지 않는 한 RNA에 결합하는 것이 힘들다. 상보적인 DNA 가닥 상에서 상입 그룹과 염기들 사이의 강한 상호작용으로 인하여, INA/DNA 복합체의 안정성은 유사체 DNA/DNA 또는 RNA/DNA 복합체의 그것보다 더 놓다.
DNA, 또는 RNA 단편 또는 PNA와 같은 다른 핵산과 달리, INA 자가 응집 또는 결합 성질을 나타내지 않는다. INA는 서열 특이성으로 핵산에 혼성화하기 때문에, INA는 탐침-기초 분석의 발전에 유용한 후보자가 되고 키트 및 스크리닝 분석을 위해 특히 적합하다. 그러마, INA 탐침들은 핵산 탐침과 동일하진 않다. 결론적으로, 탐침-기초 분석의 특이성, 민감성 및 신뢰도를 개선시킬 수 있는 임의의 방법, 키트, 또는 조성물은 DNA 함유 샘플의 검출, 분석 및 정량에 있어서 유용할 것이다. INA는 이런 목적을 위한 필수적인 성질을 갖고 있다.
결과
미생물(이를테면 박테리아, 바이러스 또는 진균 균주)의 검출은 종종 그 종들 내의 상당히 많은 수의 개별적인 미생물 균주에 의해 제한된다.
본 발명의 일반적인 인실리코(in silico) 원리들은 박테리아 네이세리아 메닌지티디스(Neisseria meningitidis), 네이세리아 고노르로애(Neisseria gonorrhoeae), 해모필러스 인플루엔자(Haemophilus influenzae), 스트렙토코커스 에스피(Streptococcus sp) 및 스타필로코커스(Staphylococcus)를 이용하여 보여준다(도 1 내지 5). 본 발명의 일반적인 원리들은 인플루엔자, 바이러스 및 로타바이러스를 통해 보여주고 있다(도 6 및 7).
본 발명을 교시 및 지지하는 일반적은 생화학적 데이타는 그램 음성 박테리아뿐만 아니라 임상적으로 관련있는 그램 양성 박테리아를 이용하여 도 8 내지 18에서 보여주고 있다.
박테리아
도 1은 N.메닌지티디스의 iga 프로테아제 유전자의 34 뉴클레오타이드 부위 및 N.고노르로애의 그에 상응하는 유전자 좌를 보여주고 있다(이들 부위는 그들의 천연 박테리아 게놈에 존재한다)(총 분류; 박테리아; 프로테오박테리아; 베타프로테오박테리아; 네이세리아레스; 네이세리아세애; 네이세리아 메닌지티디스, Z2491 혈청그룹 A 및 총 유전자 좌 특징들; iag, IgAI 프로테아제; 유전자 ID 906889. 유전자 좌 태그 NMA0905; RefSeq accession # NC_003116.1; PMID 10761919; Parkhill J et al., 2000, Nature, 404, 502- 506).
이들 두 개의 네이세리아 34 뉴클레오타이드 서열 사이에는 74%의 서열 유사성이 있다. 양 박테리아 종에 있는 이들 부위를 증폭시키기 위해 제조된 PCR-기초 프라이머는 512의 가능한 조합을 갖는 변질 프라이머를 요구한다. PCR 증폭의 부분에 사용되는 일반 서열은 34 뉴클레오타이드 서열 GYAATYW AGGYCGYCTY GAAGAYTAYA AYATGGC(서열번호 3)이 될 것이고, 여기에서 다른 위치를 지시하기 위한 표준 코드는 하기와 같이 주어진다; N = A, G, T 또는 C; D = A, G 또는 T; H = A, T 또는 C; B = G, T 또는 C; V = G, A 또는 C; K = G 또는 T; S = C 또는 G; Y = T 또는 C; R = A 또는 G; M = A 또는 C 및 W = A 또는 T.
그러나, 이들 두 종의 박테리아 DNA가 (시토신을 티민으로 전환시키는) 중아황산염 시약으로 처리될 때, 천연적으로 발생하는 서열들은 암호화 능력이 없고 자연적으로 존재하지 않는 유도체 서열로 전환된다. 유도체 서열들은 이제 97%의 서열 유사성을 갖는다. 단일 테스트에서 이들 양 박테리아 유전자 좌의 PCR 증폭을 가능케 하도록 설계된 PCR-기초 프라이머들은 이제 오직 2 프라이머 조합만이 요구된다. 그 조합은 서열 GTAATTW AGGTTGTTTT GAAGATTATA ATATGGT(서열번호 4)를 기초로 하며, 오직 7 위치의 염기가 아데닌 또는 티민이 된다(W로 표시). 그러므로, 중아황산염 전환은 상대적인 게놈 복잡성을 512에서 2 프라이머 타입으로 감소시킨다. 이 엄청난 감소는 관련된 박테리아 종들로부터 동일한 유전자 좌의 증폭을 단순하게 한다.
또 다른 잇점이 이들 두 박테리아 종들로부터의 부위를 증폭시키기 위한 임의적인 INA 탐침의 이용, 다시 동일한 유전자 좌의 이용으로부터 발생한다. 도 2는 도 1에서 보여준 것처럼 N. 메닌지티디스 및 N.고노르로애의 iga 유전자의 동일한 34 뉴클레오타이드 부위와 탐침 길이 및 복잡성이 INA 탐침을 이용함으로써 감소될 수 있는 범위의 증명을 보여주고 있다. 짭은 INA 16 머 서열 AGGYCGYCTY GAAGAY(서열번호 5)는 이 부위를 검출하기 위해 16개의 가능한 프라이머 조합이 요구될 것이나, 중아황산염으로 전환된 후에는, 특정 프라이머 서열, AGGTTGTTTT GAAGAT(서열번호 6)이면 충분할 것이다. INA 분자의 잇점은 다음과 같다; 그거의 골격으로 통합되는 삽입 슈도뉴클레오타이드로 인하여, 표준 올리고뉴클레오타이드에 대한 INA의 증가된 Tm 때문에 정확한 유전자 좌에의 혼성화가 비특이적 결합과 더 쉽게 구별된다. 그러나, 표준 올리고뉴클레오타이드는 여전히 적절하게 수행할 것으로 평가된다.
밀접하게 관련된 박테리아 종들은 유사한 임상적 징후를 야기시킬때, 중아황산염으로 전환된 DNA는 또한 특정 박테리아 타입의 존재여부를 분석하기 위한 단순한 탐칩을 설계하기 위하여 사용될 수 있다. 도 3은 세 가지 박테리아 종들의 iga 유전자의 DNA 정렬을 보여주는데, 이들 중 하나는 다른 분류학적 그룹인 해모필러스 인플루엔자이다. 박테리아 DNA의 중아황산염 처리는 매우 적은 수의 탐침 조합을 초래한다. 이 비교는 한 번의 테스트에서 관련되지 않은 종을 분석할 수 있는 중요성을 보여준다. N.메닌지티디스 및 H.인플루엔자 모두는 뇌막염을 야기시키기에 한 번의 테스트로 동일한 임상적 증후를 야기시키는 모든 미생물을 분석할 수 있도록 하는데 유리하다. 동일한 분류 그룹으로부터 매우 많은 수의 다른 박테리아 종들의 분석은 본 발명에 의해 유용해진다. 도 4는 스트렙토코커스 그룹의 10개의 박테리아 종들의 tuf 유전자의 40 뉴클레오타이드 단편을 보여주는 것으로서, 그 10개의 종들은 S. 오랄리스(S. oralis), S.미티스(S. mitis), S. 디스갈락티애(S. dysgalactiae), S.크리스타투스(S. cristatus), S.고르도니(S. gordonii), S.파라우베리스(S. parauberis), S.뉴모니애(S. pneumoniae), S.보비스(S. bovis), S.베스티불라리스(S. vestivularis) 및 S. 우베리스(S. uberis)이다. 이 부위는 10개 종들 사이에 약 68% 서열 유사성을 갖고 한 번의 테스트에서 동시에 10종을 분석하기 위하여 12,288 프라이머 조합이 요구된다. 이들 종들 사이에 중아황산염으로 전환된 서열은 85% 서열 유사성을 가지고 있으므로 이제 64 가능한 프라이머 조합이 요구될 뿐이다.
동일한 박테리아 종에 속하는 다른 균주들의 분석은 또한 본 발명에 의해 단순해진다. 도 5는 스타필로코커스 아우레우스 장독소 유전자의 23 뉴클레오타이드 단편을 보여주고 있다. 이 유전자 부위의 천연 서열은 7 균주 모두 사이에서 오직 56% 서열 유사성을 가지고 1536 프라이머 조합이 요구되지만, 반면에 중아황산염 전환된 서열은 74% 서열 유사성을 가지게 되어 오직 64 프라이머 조합이 필요할 뿐이다.
바이러스 핵산 분석 및 상대적인 게놈 복잡성 감소
상대적인 게놈 복잡성 감소의 원리는 DNA 게놈을 갖는 인플루엔자 바이러스와 같은 바이러스 그룹, 뿐만아니라 RNA 게놈을 갖는 바이러스 그룹에 적용될 수 있다(RNA가 역전사효소에 의해 DNA로 전환되고 이때 중아황산염으로 처리된다). 바이러스 검출에의 적용을 기술하기 위하여, 인플루엔자 바이러스(오소믹소바이러스 과)뉴라미니다아제 유전자, 로타바이러스 균주(레오바이러스 과)의 VP4 유전자가 암호화하는 표면 단백질, 단편화된 RNA 게놈을 갖는 양 바이러스 모두가 사용되었다. 인플루엔자 바이러스의 분류는 복잡한데, 예를 들어 항원 특성에 기초하여 타입 A, B 및 C로 분류되고, 오리진의 위치, 분리 년수, 분리 수 및 서브타입에 기초하여 서브타입으로 분류된다. 이는 그룹으로 인플루엔자 바이러스를 동정할 수 있는 첫 번째 사례에 대한 요구로 강화되어 서브-서브-분류 기준으로까지 내려갔다.
로타바이러스의 분류학 또한 복잡하다. 로타바이러스 혈청형의 수는 P와 G 혈청형으로 알려진 두 개의 주요 혈청형으로 많다. 작게는 14개의 다른 G 혈청형이 존재하고 그들의 명백한 검출이 소아 의약에서 아주 중요하다. 비록 이들 감염들이 무증상일 수 있고 오직 위장 기관에 약한 효과를 나타낸다고 할지라도, 세살까지, 거의 모든 전 세계의 어린이들은 이미 적어도 한번 로타바이러스에 의해 감염된다. 임상 수준에서 인플루엔자에 의한 감염의 중요성은 거의 매 겨울마다 질병률 및 사망률을 갖는 것으로 매우 잘 알려져 있다. 그러나 그들은 차후 감염, 특히 스트렙토코커스 뉴모니애, 헤모필러스 인플루엔자 및 스타필로코커스 아우레우스에 의한 차후의 감염을 이끄는 큰 부가적인 합병증이 될 수 있다. 폐렴 합병증이 박테리아와 바이러스 감염의 혼합된 형태로 일어날 수 있고 즉각적인 항생체 처치가 효과적인 치료가 될 수 있기 때문에 바이러스 감염과 박테리아 감염 양자 모두를 동시에 분석할 수 있는 것은 대단히 유용하다.
9개의 다른 인플루엔자 균주에서 상대적인 게놈 복잡성 감소는 도 6에서 보여준다. 인플루엔자 바이러스의 뉴라미니다아제 유전자의 20 뉴클레오타이드 부위는 그것의 DNA 형태로 보여진다. 이들 9개의 분리체들 사이에 50%의 서열 유사성이 있다. 중아황산염 처리 후에, 서열 유사성은 75%로 증가되었다. 그것의 오리지널 형태에서, 이들 9개의 균주를 분석하기 위해서 2048 프라이머 조합이 요구되지만, 중아황산염 전환후에는 오직 48 프라이머 조합만이 요구된다.
3 개의 다른 로타바이러스 균주의 VP4 유전자에서 상대적인 게놈 복잡성 감소는 도 7에서 보여준다. VP4 유전자의 20 뉴클레오타이드 부위는 전환 전에는 52%의 서열 유사성을 가지나 전환 후에는 74%를 갖는다. 프라이머 조합의 수가 512에서 32로 감소된다.
미생물 검출의 수단으로서 미생물 게놈의 단순화의 인실리코(in silico) 접근을 지지하는 분자적 데이터는 병원적 및 병리적 테스트 유닛에서 일반적으로 사용되는 임상적으로 관련된 미생물 종들을 이용하여 도 8 내지 15에서 보여주고 있다.
만약 샘플에 존재하는 그램 양성 또는 그램 음성 박테리아의 존재 사이에서 초기 결정이 이루어진다면, 그것은 구별되는 잇점 및 미생물을 오염시키는 빠른 검출을 위한 임상적 긴급성이다. 여기에 기재된 방법은 증폭 반응을 통해 단순화된 게놈 상에서 그런 프라이머를 이용함으로써 그램 양성 또는 그램 음성 박테리아가 검출되도록 하는 프라이머 세트를 생성시키는 위해, 다른 박테리아 종들의 23S 리보솜 유전자를 이용한 테스트를 제공한다. 앞의 S. 갈락티애 예에서 보여진 것처럼 임의적으로 부가되는 몇몇 단백질 코딩 서열과 달리, 23S 서열은 모든 박테리아 종에서 존재하기 때문에 매우 고차원적 구별을 위해서는 이상적인 것이다. 많은 단백질 코딩 미생물 서열은 게놈 "플랏섬 앤 젯섬(flotsam and jetsam)"과 유사하고 그 들의 유용성은 다른 미생물 균주, 타입 또는 분리체와 같은 낮은 수준의 분류적 카테고리 사이, 또는 바이러스의 경우에 다른 타입 또는 새로이 발생한 돌연변이 사이의 구별성에 있다. 이들 성분들, 박테리아의 비단백질 코딩 리보솜 RNA 유전자와 단백질 코딩 recA 유전자, 양자의 정상 및 단순화된 게놈 서열은 도 15 및 16에서 각각 보여주고 있다. 23S 박테리아 앰플리콘을 위한 증폭 반응을 수행하기 위해 사용된 프라이머 서열은 표 1에서 보여준다. recA 앰플리콘을 위한 증폭 반응을 수행하기 위해 사용된 프라이머 서열은 표 2에서 보여준다. 모든 프라이머들은 중아황산염 처리된 DNA를 위해 제조되고 5'에서 3'방향으로 보여준다.
표 1은 그램 양성(Pos), 그램 음성(Neg)의 검출을 위한 프라이머를 생성시키는 정렬을 이용하는 23S 리보솜 RNA 유전자(들)로부터 중아황산염 단순화된 DNA의 증폭에 이용되는 적절한 박테리아 프라이머 서열을 설명한다. 추가로, 프라이머들은 마이코플라이스 속(Myc), 스타필로코커스 속(Staph), 스트렙토코커스 속(Strep), 네이세리아 속(NG), 클라미디아(CT) 및 E.coli및 클렙시엘라 뉴모니애(EC)의 검출에 특이적으로 설계된 것이다.
하기 심볼들은 다음 염기 부가를 지시한다;N = A, G, T 또는 C; D = A, G 또는 T; H = A, T 또는 C; B = G, T 또는 C; V = G, A 또는 C; K = G 또는 T; S = C 또는 G; Y = T 또는 C; R = A 또는 G; M = A 또는 C 및 W = A 또는 T.
사용된 모든 프라이머들은 중아황산염 단순화된 DNA 서열에 기초한다.
Figure 112007048658978-PCT00002
Figure 112007048658978-PCT00003
Figure 112007048658978-PCT00004
Figure 112007048658978-PCT00005
Figure 112007048658978-PCT00006
Figure 112007048658978-PCT00007
표 2는 독특한 박테리아 타입화를 위한 스타필로코커스 아우레우스(SA), 스타필로코커스 에피데르미디스(SE), 세라티아 마르세센스(SM), 에스체리치아 콜라이(EC) 및 예르시니아 엔테로콜리티카(YE)로 부터의 정렬을 이용한 recA 단백질 코딩 유전자로부터 단순화된 DNA를 증폭하는데 이용되는 박테리아 프라이머 서열을 보여준다.
Figure 112007048658978-PCT00008
Figure 112007048658978-PCT00009
표 1은 그램 양성(Pos로 표시) 및 그램 음성(Neg로 표시)의 검출을 위한 최적의 프라이머를 생성시키기 위해 복합 정렬을 이용하여 23S 리보솜 RNA 유전자(들)로부터 중아황산염 단순화된 DNA를 증폭시키는데 이용된 박테리아 프라이머 서열들을 보여주고 있다.
추가로 프라이머들은 개별적인 종들을 위해서뿐만 아니라 종의 그룹의 특이적 검출을 위해 설계되었다. 이들 박테리아 프라이머 그룹을 위한 표시는 다음과 같다: 에스체리치아 콜라이 및 클레브실레라 뉴모니애(EC), 네이세리아 속(NG), 클라미디아(CT), 마이코플라스마 속(Myc), 스트렙토코커스 속(Strep) 및 스타필로코커스 속(Staph). F 및 R 서브 표시는 각각 정프라이머 및 역프라이머를 의미한다. 추가로, 하나 이상의 가능한 염기가 주어진 뉴클레오타이드 위치에 필수적일 경우, 염기 축퇴는 다음 코드로 주어진다; N = A, G, T 또는 C; D = A, G 또는 T; H = A, T 또는 C; B = G, T 또는 C; V = G, A 또는 C; K = G 또는 T; S = C 또는 G; Y = T 또는 C; R = A 또는 G; M = A 또는 C; 및 W = A 또는 T. 반복하면, 본 발명에서 사용된 모든 프라이머들은 중아황산염 단순화된 DNA를 기초로 한 것이다. 표 2는 독특한 박테리아 타입화를 위하여 스타필로코커스 아우레우스(SA), 스타필로코커스 에피데르미디스(SE), 세라티아 마르세센스(SM), 에스체리치아 콜라이(EC) 및 예르시니아 엔테로콜리티카(YE)로부터 정렬을 이용한 recA 단백질 코딩 유전자로부터 중아황산염 단순화된 DNA를 증폭시키는데 사용된 박테리아 프라이머 서열을 보여주고 있다.
도 8은 아가로스 겔 전기영동에 의해 특이적 길이의 밴드로 검출되는 적절한 크기의 앰플리콘으로, 그램 양성과 그램 음성 박테리아의 유전적으로 단순화된 23S 리보솜 유전자 부위의 PCR로부터 획득한 증폭 산물을 보여주고 있다. 화살표는 마커 레인(M)에 걸려있는 표준 크기의 마커들에 대한 앰플리콘의 예상 크기를 나타낸다. 그램 음성 박테리아에 특이적인 프라이머의 이용은 에스체리치아 콜라이(Escherichia coli), 네이세리아 고노르로애(Neisseria gonorrheae), 클레브시엘라 뉴모니애(Klebsiella pneumoniae), 모라셀라 카타르할리스(Moraxella catarrhalis), 슈도모나스 아에루기노사(Pseudomonas aeruginosa) 및 프로테우스 불가리스(Proteus vulgaris)를 위한 6개의 그램 음성 레인들 1 내지 6(상부 패널)에서만 오직 밴드가 드러난다. 그램 양성 박테리아에 특이적인 프라이머의 사용은 엔테로코커스 패칼리스(Enterococcus faecalis), 스타필로코커스 에피데르미디스(Staphylococcus epidermidis), 스타필로코커스 아우레우스(Staphylococcus aureus), 스타필로코커스 자일로시스(Staphylococcus xylosis), 스트렙토코커스 뉴모니애(Streptococcus pneumoniae) 및 스트렙토코커스 해모라이티커스(Streptococcus haemolyticus)를 위한 6개의 그램 양성 레인, 7 내지 12(하부 패널)에서 오직 밴드를 나타낸다.
도 9는 오직 두 개의 그램 음성 박테리아 종, (이 예에서) E. 콜라이 및 K. 뉴모니애로부터 앰플리콘을 검출하기 위해 설계된 유전적으로 단순화된 23S 리보솜 유전자 부위로부터 PCR에 의해 획득된 증폭 산물을 보여준다. 증폭 방법론의 특이성은 E.콜라이 및 K. 뉴모니애를 나타내는 레인 1 및 3에서 앰플리콘의 존재 및 레인 2 뿐만 아니라 레인 4 내지 12에서의 증폭 산물의 부재로 묘사되고, 이들 10개의 빈 레인은 테스트에서 사용된 잔여 10 종의 박테리아를 대표한다.
도 10은 오직 하나의 박테리아 그룹 네이세리아에 특이적인 프라이머를 이용한 유전적으로 단순화된 23S 리보솜 유전자 부위의 PCR로부터 획득된 증폭 산물을 보여준다. 게놈 단순화 방법론의 특이성은 네이세리아 고노르로애를 나타내는 레인 2에서만 오직 앰플리콘이 존재하고 레인 1뿐만 아니라 레인 3 내지 12에서는 증폭 산물의 부재로서 묘사되고, 이들 11개의 빈 레인들은 테스트에서 사용된 잔여 11종의 박테리아를 나타낸다.
개별 미생물 종의 분석을 위해, 단백질 코딩 유전자는 미생물의 다른 균주들은 의문의 유전자 서열의 존재/부재에 다형성을 나타내지 않는다는 조건으로, 적절하게 사용될 수 있다.
도 11은 E. 콜라이의 박테리아 recA 유전자에 대한 프라이머의 이용을 나타내고 있다. 앰플리콘의 특이성은 레인 1에서 정확한 크기의 앰플리콘의 존재 및 다른 11종의 박테리아를 나타내는 잔여 레인 2 내지 12의 앰플리콘의 부재로서 나타난다.
도 12의 데이터는 또한 스파필로코커씨와 같은 큰 박테리아 그룹에 속하는 종들을 밝히는 프라이머들의 특이성을 보여주고 있다. 스타필로코커씨에 특이적인 프라이머를 이용하여 유전적으로 단순화된 23S 리보솜 유전자 부위에서 PCR에 의해 수득된 증폭 산물은 스타필로코커스 에피데르미디스(Staphylococcus epidermidis), 스타필로코커스 아우레우스(Staphylococcus aureus) 및 스타필로코커스 자일로시스(Staphylococcus xylosis)를 나타내는 레인 8, 9 및 10에서 오직 앰플리콘을 나타낸다. 레인 1 내지 7, 뿐만 아니라 레인 11 및 12에서의 증폭 산물의 부재는 반응의 특이성을 증명하는 것이다. 그 9개의 빈 레인은 테스트에서 사용된 비 스타필로코커스 박테리아 9종을 나타낸다.
도 13은 스트렙토코커스 박테리아에 특이적인 프라이머를 이용하여 유전적으로 단순화된 23S 리보솜 유전자 부위로부터의 PCR에 의해 수득된 증폭 산물을 보여주고 있다. 스트렙토코커씨에 특이적인 프라이머를 이용하여 유전적으로 단순한 23S 리보솜 유전자 부위로부터의 PCR에 의해 수득된 증폭 산물은 스트렙토코커스 뉴모니애(Streptococcus pneumoniae) 및 스트렙토코커스 해모라이티쿠스(Streptococcus haemolyticus)를 나타내는 레인 11 및 12에서만 오직 앰플리콘을 보여준다. 레인 1 내지 10에서의 증폭 산물의 부재는 반응의 특이성을 보여주는 것이다. 이 10개의 빈 레인들은 테스트에서 사용된 비 스트렙토코커스 박테리아의 10여 종을 나타낸다.
도 14는 스타필로코커스 에피데르미디스(레인 8)의 recA 유전자의 유전적으로 단순화된 부위로부터 단백질 코딩 유전자의 PCR에 의해 수득된 증폭 산물을 보여준다. 그 두 개의 밴드(화살표시)는 첫 번째 라운드(상위 밴드), 두 번째 라운드(하위 밴드), PCR 증폭들로부터 앰플리콘에 이르는 것을 보여준다. 레인 1 내지 7 및 9 내지 12에 있어서 앰플리콘의 부재는 그 방법의 특이성을 보여주고 단백질 코딩 유전자가 게놈의 비코딩 성분들 대신에 특정 상황에 있어서 오직 하나의 박테리아 종의 검출에 유용할 수 있음을 강조한다.
도 15는 클라미디아의 유전적으로 단순화된 23S 리보솜 유전자를 표적화하는 특이적 프라이머를 이용하여 앰플리콘의 검출을 보여준다. PCR 반응은 적은 양의 출발 DNA로 복제에서 수행되었다. 레인 5는 알려진 음성 개체의 소변에서 추출하였다. 임의의 복제물에서 밴드의 존재는 클라미디아 DNA의 존재로 인한 양성반응으로 고려된다.
도 16은 E.콜라이로부터 23S 리보솜 RNA 유전자의 정상 뉴클레오타이드 서열과 모든 시토신이 티민으로 치환된 게놈 단순화한 후의 동일 서열을 보여준다.
도 17은 E.콜라이로부터 recA 유전자의 정상 뉴클레오타이드 서열과 모든 시토신이 티민으로 치환되는 유전자 단순화한 후의 동일 서열을 보여준다.
요약하자면, 유전적으로 단순화된 프라이머를 이용하여 증폭되었을 때 올리고뉴클레오타이드 또는 INAs와 같은 변형된 핵산인, 미생물 소스로부터 중아황산염-처리된 DNA은 샘플 내의 임의의 타입의 미생물을 발견하기 위한 탁월한 검출 시스템을 제공하고, 그 샘플은 인간 임상 물질 또는 오염된 물과 같은 환경 소스로부터의 다른 극심한 곳의 샘플일 수 있다. 본 발명은 넓은 범위의 다양한 박테리아 종, 및 임상적으로 관련있는 바이러스를 검증한다. 효모 사카로마이세스 세레비지애 또는 그와 관련된 종과 같은 단세포 진핵 미생물의 검출은 본 발명의 단순한 연장이 된다. 그것은 18 또는 28S 리보솜 서열과 같은 유사한 게놈 서열 소스, 또는 보여진 것처럼 주어진 종, 타입, 계통 또는 돌연변이 또는 다형성에 특이적인 단백질 코딩 서열을 요구한다. 본 발명에 따른 검출 시스템의 실질적인 의미가 또한 중요하다. 여기의 상세한 설명에서 기재된 원리들이 증폭을 위한 PCR을 이용해 증명되면서, 본 분야에서 알려진 임의의 방법론을 통해 정보해독이 이루어질 수 있다. 마이크로어레이 검출 시스템에 대해 강조를 두면, 중아황산염 처리가 게놈의 복잡성을 감소시켜 미생물의 더 많은 부류가 더 작은 검출기(요소)로 마이크로어레이 상에서 테스트되도록 하기 때문에, 유전적으로 단순화된 DNA를 이용하여 미생물의 더 넓은 범위를 검출하는 것이 가능해질 것이다.
예를 들어, 만약 마이크로어레이가 한 번의 테스트에서 250,000 또는 다른 미생물을 검출하기 위해 구성되었던 것이라면, 검출기 플랫폼의 물리적인 제한으로 인하여 현재의 방법론은 적절한 실용적인 검출 플랫폼을 제공할 수 없을 것이다. 그러나, 게놈 단순화의 경우, 작은 마이크로어레이가 1000 또는 더 다른 고차원의 박테리아 카테고리를 검출할 수 있다. 그런 테스트의 좋은 점은 초기 테스트에서 양성인 그룹의 대표자를 단순하게 함유하고 있는, 다른 분석을 이용하여 평가될 수 있을 것이다. 당업자들은 넓게 기재된 것처럼 본 발명의 정신 또는 범위로부터 벗어남 없이 특정 구체예들에서 보여진 것과 같이 본 발명을 다양하게 변화 및/또는 변형시킬 수 있을 것으로 사료된다. 그러므로, 본 발명은 설명한데로 제한없이 모든 측면에서 고려될 것이다.
도 1은 게놈 단순화 전과 후의 네이세리아 메닌기티디스(Neisseria meningitidis) 및 네이세리아 고노르호애(Neisseria meningitidis) iga 유전자의 부분의 정렬을 보여주고 있다. 보여지는 것처럼, 게놈 단순화 전에, 유도체 핵산(97% 서열 유사성)을 형성하기 위한 단순화 후에 오직 2개의 조합들이 필요한 것과는 대조적으로, 총 512 탐침의 조합들이 네이세리아 종(74% 서열 유사성)의 전반적인 검출을 위해 요구되었다(서열번호는 각 서열 후에 나열되었다).
도 2는 INA 탐침은 표준 올리고뉴클레오타이드 탐침보다 더 짧은 길이가 될 수 있기 때문에, 단순화된 서열의 서열 유사성을 증가시키기 위한 INA 탐침의 용도를 보여준다. 게놈 단순화 과정의 INA 탐침과의 결합이 표적 서열에 대해 100% 서열 유사성을 갖는 탐침의 선택 및 이용하게 한다(서열번호는 각 서열 후에 나열되었다).
도 3은 네이세리아 및 해모필러스(Haemophilus)로부터 iga 유전자의 정렬을 이용한 밀접하게 관련된 종들 사이에서 분화되는 게놈 단순화를 보여준다. 보여지는 것처럼, 본 발명의 방법은 종 특이적 탐침을 생산하기 위해 게놈 물질의 단순화가 가능하게 한다. 추가로, 비록 게놈 DNA를 단순화시키지만, 그것은 여전히 네이세리아와 밀접하게 관련된 해모필러스 종들 사이의 분화가 가능하도록 한다(서열번호는 각 서열 후에 나열되었다).
도 4는 스트렙토코커씨(Streptococci)의 10개의 다른 종들에서 게놈 단순화 전과 후에 스트렙토코커스의 tuf 유전자의 정렬을 보여준다. 처리 전에, 총 12,288 탐침 조합이 그 tuf 유전자의 전반적인 프라이머를 위해 요구되었다. 게놈 단순화한 후에, 오직 64개의 탐침 조합이 전반적인 검출을 위해 요구되었다. 추가로, 단순화 전의 서열 유사성은 오직 67.5%로서 단순화 후에는 85%로 증가되었다(서열번호는 각 서열 후에 나열되었다).
도 5는 게놈 단순화 전과 후의 스타필로코커스의 장독소(enterotoxin)의 정렬을 보여준다. 중아황산염(bisulfite)의 처리 전에, 총 1,536개의 탐침 조합이 스타필로코커스의 장독소 유전자의 전반적인 프라이머를 위해 요구되었다. 게놈 단순화 후에, 오직 64개의 탐침 조합이 전반적인 검출을 위해 요구되었다(서열번호는 각 서열 후에 나열되었다).
도 6은 게노 단순화 전과 후의 다양한 인플루엔자 균주의 인플루엔자 그룹 A와 B 뉴라미니다아제(neuraminidase) 유전자의 정렬을 보여준다. 처리 전에, 총 2,048 탐침 조합이 그룹 A와 B 뉴라미니다아제 유전자의 전반적인 프라이머를 위해 요구되었다. 게놈 단순화 후에는 오직 48개의 탐침 조합이 전반적인 검출을 위해 요구되었다. 추가로, 단순화 전의 서열 유사성은 오직 50%였으나, 단순화 후에는 75%로 증가되었다(서열번호는 각 서열 후에 나열되었다).
도 7은 게놈 단순화 전과 후의 로타바이러스 VP4 유전자의 정렬을 보여준다. 처리 전에, 총 512 탐침 조합이 로타바이러스 VP4 유전자의 전반적인 프라이머를 위해 요구되었다. 게놈 단순화 후에, 오직 32 탐침 조합이 전반적인 검출을 위해 요구되었다(서열번호는 각 서열 후에 나열되었다).
도 8은 그램 양성과 그램 음성 박테리아의 유전적으로 단순화된 23S 리보솜 유전자로부터 PCR에 의해 수득된, 아가로스 겔 전기영동에 의해 특정 길이의 밴드로서 검출되는 적절한 앰플리콘을 갖는 증폭 산물을 보여준다. 화살은 마커 레인(M)에 있는 표준 크기의 마커에 비례하여 예상된 크기를 갖는 앰플리콘을 지시한다. 그램 음성 세균에 특이적인 프라이머를 사용하는 것은 오직 6개의 그램 음성 레인(상부 패널)에서 밴드를 나타내고, 그램 양성 박테리아에 특이적인 프라이머를 사용하는 것은 오직 6개의 그램 양성 레인(하부 패널)에서 밴드를 나타낸다.
도 9는 E.콜라이(레인 1)과 K.뉴모니애(레인 3)의 유전적으로 단순화된 23S 리보솜 유전자 부위로부터 PCR에 의해 수득된 증폭 산물을 보여준다. 증폭의 특이성은 박테리아의 잔존하는 10개의 종으로부터 증폭 산물의 부재로 나타내었다.
도 10은 네이세리아에 특이적인 프라이머를 사용하여 유전적으로 단순화된 23S 리보솜 유전자 부위로부터 PCR에 의해 수득된 증폭 산물을 보여준다.
도 11은 E.콜라이의 recA 유전자의 유전적으로 단순화된 부위로부터 단백질 코딩 유전자로부터 PCR에 의해 수득된 증폭 산물을 보여준다. 앰플리콘의 특이성은 E.coli recA 앰플리콘의 존재 및 다른 11종의 박테리아로부터 그것의 부재로 나타내었다.
도 12는 스타필로코커씨에 특이적인 프라이머를 이용하여 유전적으로 단순화된 23S 리보솜 유전자 부위로부터 PCR에 의해 수득된 증폭 산물을 보여준다.
도 13은 스트렙토코커씨(Streptococci)에 특이적인 프라이머를 이용하여 유전적으로 단순화된 23S 리보솜 유전자 부위로부터 PCR에 의해 수득된 증폭 산물을 보여준다.
도 14는 스타필로코커스 에피데르미디스(Staphylococcus epidermidis)의 recA 유전자의 유전적으로 단순화된 부위로부터 단백질 코딩 유전자로부터 PCR에 의해 수득된 증폭 산물을 보여준다. 그 (화살표로 표시된) 두 개의 밴드는 첫 번째 라운드(상위 밴드) 및 두 번째 라운드(하부 밴드), 증폭 산물로부터 앰플리콘이 미침을 나타낸다.
도 15는 클라디미아 트라코마티스(Chlamydia trachomatis)의 유전적으로 단순화된 23S 리보솜 유전자를 표적하는 특이적 프라이머를 이용한 앰플리콘의 검출을 보여준다.
도 16은 스타필로코커스 에피데르미스로부터 정상 게놈 서열 및 유전적으로 단순화된 23S rDNA 서열을 보여준다(서열번호는 각 서열 이후에 나열하였다).
도 17은 E.coli recA 유전자의 정상 게놈 서열 및 유전적으로 단순화된 23S rDNA 서열을 보여준다(서열번호는 각 서열 이후에 나열하였다).
<110> Human Genetic Signatures <120> Detection of Microorganisms <130> 205591675 <160> 308 <170> PatentIn version 3.1 <210> 1 <211> 14 <212> DNA <213> artificial <400> 1 atatatatat atat 14 <210> 2 <211> 14 <212> DNA <213> artificial <400> 2 aaaaaaattt tttt 14 <210> 3 <211> 34 <212> DNA <213> Neisseria <400> 3 gyaatywagg ycgyctygaa gaytayaaya tggc 34 <210> 4 <211> 34 <212> DNA <213> artificial <400> 4 gtaattwagg ttgttttgaa gattataata tggt 34 <210> 5 <211> 16 <212> DNA <213> artificial <400> 5 aggycgycty gaagay 16 <210> 6 <211> 16 <212> DNA <213> artificial <400> 6 aggttgtttt gaagat 16 <210> 7 <211> 28 <212> DNA <213> bacterial <400> 7 ggtttttttt gaaatagttt tagggtta 28 <210> 8 <211> 28 <212> DNA <213> bacterial <400> 8 ggtttttttt gaaarttatt taggtagt 28 <210> 9 <211> 25 <212> DNA <213> bacterial <400> 9 tggkagttag awtgtgrrwg ataag 25 <210> 10 <211> 25 <212> DNA <213> bacterial <400> 10 tgggagatak atrgtgggtg ttaat 25 <210> 11 <211> 22 <212> DNA <213> bacterial <400> 11 ggatgtggdr ttktkwagat aa 22 <210> 12 <211> 22 <212> DNA <213> bacterial <400> 12 tgawgtggga aggtwtagat ag 22 <210> 13 <211> 22 <212> DNA <213> bacterial <400> 13 hcaatmhhac ttcammmcmm yt 22 <210> 14 <211> 23 <212> DNA <213> bacterial <400> 14 wcaahhcacc ttcahmaacy tac 23 <210> 15 <211> 29 <212> DNA <213> bacterial <400> 15 accaacattc tcactymtaa wmamtccac 29 <210> 16 <211> 29 <212> DNA <213> bacterial <400> 16 atcaacattc acacttctaa tacctccaa 29 <210> 17 <211> 28 <212> DNA <213> bacterial <400> 17 ggttttttty gaaatagttt tagggtta 28 <210> 18 <211> 28 <212> DNA <213> bacterial <400> 18 ggttttttty gaaarttatt taggtagt 28 <210> 19 <211> 25 <212> DNA <213> bacterial <400> 19 yggkagttag awygygrrwg ataag 25 <210> 20 <211> 25 <212> DNA <213> bacterial <400> 20 ygggagatak ayrgygggtg ttaat 25 <210> 21 <211> 22 <212> DNA <213> bacterial <400> 21 ggatgtggdr ttkykwagat aa 22 <210> 22 <211> 22 <212> DNA <213> bacterial <400> 22 ygawgtggga aggtwtagat ag 22 <210> 23 <211> 22 <212> DNA <213> bacterial <400> 23 hcratmhhrc ttcrmmmcmm yt 22 <210> 24 <211> 23 <212> DNA <213> bacterial <400> 24 wcrahhcacc ttcahmracy tac 23 <210> 25 <211> 29 <212> DNA <213> bacterial <400> 25 accracattc tcactymtaa wmamtccac 29 <210> 26 <211> 29 <212> DNA <213> bacterial <400> 26 atcaacattc rcacttctaa tacctccaa 29 <210> 27 <211> 24 <212> DNA <213> bacterial <400> 27 kttragaaaa gtwtttagdd agrk 24 <210> 28 <211> 24 <212> DNA <213> bacterial <400> 28 tttargaaaa gttwttaagt wtta 24 <210> 29 <211> 25 <212> DNA <213> bacterial <400> 29 agdtragrwg agdattttwa ggtkr 25 <210> 30 <211> 25 <212> DNA <213> bacterial <400> 30 ggktrggwwg agaatwttaa ggtgt 25 <210> 31 <211> 25 <212> DNA <213> bacterial <400> 31 aatytmymat taaaacaata cmcaa 25 <210> 32 <211> 25 <212> DNA <213> bacterial <400> 32 aatctcaaaw aaaaacaaym ymacc 25 <210> 33 <211> 32 <212> DNA <213> bacterial <400> 33 acmhacatct tcacwmayay tayaayttca cc 32 <210> 34 <211> 32 <212> DNA <213> bacterial <400> 34 maytacatct tcacaacmah wtcaayttca ct 32 <210> 35 <211> 24 <212> DNA <213> bacterial <400> 35 cmatayyaaa ytacaataaa actc 24 <210> 36 <211> 24 <212> DNA <213> bacterial <400> 36 caataymaaa ctayaataaa aatt 24 <210> 37 <211> 31 <212> DNA <213> bacterial <400> 37 ggtgaarttr tartrtkwgt gaagatgtdk g 31 <210> 38 <211> 31 <212> DNA <213> bacterial <400> 38 agtgaarttg awdtkgttgt gaagatgtar t 31 <210> 39 <211> 25 <212> DNA <213> bacterial <400> 39 gatwggatgg aaagattttr trgag 25 <210> 40 <211> 25 <212> DNA <213> bacterial <400> 40 kgtwagatgg aaagattttg tgaat 25 <210> 41 <211> 23 <212> DNA <213> bacterial <400> 41 hymaymmway haaaataata tcc 23 <210> 42 <211> 23 <212> DNA <213> bacterial <400> 42 tcaammmywm maaaataata ttt 23 <210> 43 <211> 26 <212> DNA <213> bacterial <400> 43 awccattcta aaaaaacctt taaaca 26 <210> 44 <211> 26 <212> DNA <213> bacterial <400> 44 aaccawwmyw aamhmacctt cawact 26 <210> 45 <211> 28 <212> DNA <213> bacterial <400> 45 gttggtaagg tgatatgaat tgttataa 28 <210> 46 <211> 26 <212> DNA <213> bacterial <400> 46 ttattattaa ttgaatttat aggtta 26 <210> 47 <211> 27 <212> DNA <213> bacterial <400> 47 gaggagttta gagtttgaat tagtrtg 27 <210> 48 <211> 26 <212> DNA <213> bacterial <400> 48 tatatacaaa actatcaccc tatatc 26 <210> 49 <211> 22 <212> DNA <213> bacterial <400> 49 tcatcaaact cacaacayat ac 22 <210> 50 <211> 25 <212> DNA <213> bacterial <400> 50 ttgagtaaga tattgatggg ggtaa 25 <210> 51 <211> 21 <212> DNA <213> bacterial <400> 51 tatggttagg gggttattgt a 21 <210> 52 <211> 24 <212> DNA <213> bacterial <400> 52 aatctatcat ttaaaacctt aacc 24 <210> 53 <211> 24 <212> DNA <213> bacterial <400> 53 cctaactatc tataccttcc cact 24 <210> 54 <211> 25 <212> DNA <213> bacterial <400> 54 cactccccta ccataccaat aaacc 25 <210> 55 <211> 28 <212> DNA <213> bacterial <400> 55 gtatgatgag ttagggagtt aagttaaa 28 <210> 56 <211> 21 <212> DNA <213> bacterial <400> 56 ggtgaggtta agggatatat a 21 <210> 57 <211> 30 <212> DNA <213> bacterial <400> 57 aaaagagtga agagttgttt ggtttagata 30 <210> 58 <211> 24 <212> DNA <213> bacterial <400> 58 tccaaacctt tttcaacatt aact 24 <210> 59 <211> 28 <212> DNA <213> bacterial <400> 59 ccctaaaatt atttcaaaaa aaacaaaa 28 <210> 60 <211> 30 <212> DNA <213> bacterial <400> 60 ttagtggggg tttattggtt tattaatgga 30 <210> 61 <211> 30 <212> DNA <213> bacterial <400> 61 taaggaagtg atgatttgaa gatagttgga 30 <210> 62 <211> 21 <212> DNA <213> bacterial <400> 62 acaccttctc tactaaatac t 21 <210> 63 <211> 25 <212> DNA <213> bacterial <400> 63 tataccataa atcttcacta atatc 25 <210> 64 <211> 27 <212> DNA <213> bacterial <400> 64 ttgtgtagat gatggagtag taggtta 27 <210> 65 <211> 28 <212> DNA <213> bacterial <400> 65 gaatgatgga gtaagttaag tatgtgga 28 <210> 66 <211> 27 <212> DNA <213> bacterial <400> 66 taaaaattat ttcttaaaaa cctcact 27 <210> 67 <211> 26 <212> DNA <213> bacterial <400> 67 aaattatctc acacacctta aaatat 26 <210> 68 <211> 24 <212> DNA <213> bacterial <400> 68 aatgttaaaa ggttaaaggg atat 24 <210> 69 <211> 28 <212> DNA <213> bacterial <400> 69 tattgaattt aagttttggt gaatggtt 28 <210> 70 <211> 29 <212> DNA <213> bacterial <400> 70 ccaatatttc aacattaact cccactctc 29 <210> 71 <211> 29 <212> DNA <213> bacterial <400> 71 atatccatct tccaaattca taaaataat 29 <210> 72 <211> 24 <212> DNA <213> bacterial <400> 72 taaacaacaa caattccact ttcc 24 <210> 73 <211> 28 <212> DNA <213> bacterial <400> 73 ataggaaaag aaawtgaawg wgattttg 28 <210> 74 <211> 28 <212> DNA <213> bacterial <400> 74 gtgtagtggt gagtgaaagt ggaatagg 28 <210> 75 <211> 32 <212> DNA <213> bacterial <400> 75 taaacaamtt cmmtcaaaat aacatttyyc aa 32 <210> 76 <211> 23 <212> DNA <213> bacterial <400> 76 ctaattaata tttaaactta ccc 23 <210> 77 <211> 25 <212> DNA <213> bacterial <400> 77 ttttgaaatt atatgtttat aatgt 25 <210> 78 <211> 27 <212> DNA <213> bacterial <400> 78 aagtatgagt tggtgagtta tgatagt 27 <210> 79 <211> 23 <212> DNA <213> bacterial <400> 79 cctccamtta wtyataatct yac 23 <210> 80 <211> 25 <212> DNA <213> bacterial <400> 80 caccwaaaya acaccatcat acatt 25 <210> 81 <211> 29 <212> DNA <213> bacterial <400> 81 tgtagttaga tagtggggta taagtttta 29 <210> 82 <211> 24 <212> DNA <213> bacterial <400> 82 aggggaagag tttagattat taaa 24 <210> 83 <211> 28 <212> DNA <213> bacterial <400> 83 ataacttcaw cycmwataca acactcat 28 <210> 84 <211> 28 <212> DNA <213> bacterial <400> 84 atcaatttaa aaaattctca ctcycaaa 28 <210> 85 <211> 26 <212> DNA <213> bacterial <400> 85 tttttatwat tggatttggg gwtaaa 26 <210> 86 <211> 22 <212> DNA <213> bacterial <400> 86 tkktwwttag tattgagaat ga 22 <210> 87 <211> 24 <212> DNA <213> bacterial <400> 87 tgtaaattwa ttttgtaagt twgt 24 <210> 88 <211> 23 <212> DNA <213> bacterial <400> 88 gaatgagggg ggattgttta att 23 <210> 89 <211> 26 <212> DNA <213> bacterial <400> 89 tctataacca aaacaatcaa aaaata 26 <210> 90 <211> 26 <212> DNA <213> bacterial <400> 90 cattacacct aacaaatatc ttcacc 26 <210> 91 <211> 26 <212> DNA <213> bacterial <400> 91 atwwataggt tgaataggtr agaaat 26 <210> 92 <211> 28 <212> DNA <213> bacterial <400> 92 atagtgattt ggtggtttag tatggaat 28 <210> 93 <211> 32 <212> DNA <213> bacterial <400> 93 caaacctact tcaactcaaa aataaaataa at 32 <210> 94 <211> 29 <212> DNA <213> bacterial <400> 94 acaacaattt aaacccaact cacatatct 29 <210> 95 <211> 29 <212> DNA <213> bacterial <400> 95 aaaayaamwc tyttcaatct tcctayaaa 29 <210> 96 <211> 27 <212> DNA <213> bacterial <400> 96 atwwttgtta aggdwrtgar raggaag 27 <210> 97 <211> 24 <212> DNA <213> bacterial <400> 97 tagragggta aattgargwg ttta 24 <210> 98 <211> 26 <212> DNA <213> bacterial <400> 98 tkatttggga arrtwrgtta aagaga 26 <210> 99 <211> 25 <212> DNA <213> bacterial <400> 99 tctcttcaac ttaacctcac atcat 25 <210> 100 <211> 24 <212> DNA <213> bacterial <400> 100 ataatttcaa atctacawcm waat 24 <210> 101 <211> 25 <212> DNA <213> bacterial <400> 101 ratktattgg aggattgaat taggg 25 <210> 102 <211> 23 <212> DNA <213> bacterial <400> 102 atgttgaaaa gtgtttggat gat 23 <210> 103 <211> 31 <212> DNA <213> bacterial <400> 103 tctaaaatya ataawccaaa ataamcccct c 31 <210> 104 <211> 23 <212> DNA <213> bacterial <400> 104 actaccaayh atawhtcatt aac 23 <210> 105 <211> 25 <212> DNA <213> bacterial <400> 105 aggttgakat ttttgtatta gagta 25 <210> 106 <211> 29 <212> DNA <213> bacterial <400> 106 rwagtgatgg agggatgtag taggttaat 29 <210> 107 <211> 25 <212> DNA <213> bacterial <400> 107 cttttctyaa caatataaca tcact 25 <210> 108 <211> 24 <212> DNA <213> bacterial <400> 108 ctctcamtca cctaaaacta ctca 24 <210> 109 <211> 28 <212> DNA <213> bacterial <400> 109 agaagttgat gaaggatgtt attaatga 28 <210> 110 <211> 29 <212> DNA <213> bacterial <400> 110 gttattgata tgtgaatwta tagtatrtt 29 <210> 111 <211> 24 <212> DNA <213> bacterial <400> 111 caaaaythtt accttctyta atyc 24 <210> 112 <211> 23 <212> DNA <213> bacterial <400> 112 caacaaaatt ycacatactc cat 23 <210> 113 <211> 23 <212> DNA <213> bacterial <400> 113 gatttgatgt aaggttaagt agt 23 <210> 114 <211> 31 <212> DNA <213> bacterial <400> 114 ttggttaggt tgaagtttag gtaatattga a 31 <210> 115 <211> 32 <212> DNA <213> bacterial <400> 115 gatttatgtt gaaaagtgag tggatgaatt ga 32 <210> 116 <211> 29 <212> DNA <213> bacterial <400> 116 cctytttcta actcccaaat taaattaat 29 <210> 117 <211> 25 <212> DNA <213> bacterial <400> 117 gaagttgtgg attgtttttt ggata 25 <210> 118 <211> 30 <212> DNA <213> bacterial <400> 118 aagggtgttg aagtatgatt gtaaggatat 30 <210> 119 <211> 31 <212> DNA <213> bacterial <400> 119 tacamtccaa ymacacactt cacctatcct a 31 <210> 120 <211> 26 <212> DNA <213> bacterial <400> 120 caacaatata aaatcaacaa ctcaaa 26 <210> 121 <211> 26 <212> DNA <213> bacterial <400> 121 aggagtggtt agtttttgtg aagtta 26 <210> 122 <211> 24 <212> DNA <213> bacterial <400> 122 acaaattaaa aawccaacac aact 24 <210> 123 <211> 26 <212> DNA <213> bacterial <400> 123 taacactatc tcccaccaya atmaat 26 <210> 124 <211> 23 <212> DNA <213> bacterial <400> 124 taggttgttg agttttaatt ata 23 <210> 125 <211> 24 <212> DNA <213> bacterial <400> 125 gaagtataaa gtaatggtgg ggtg 24 <210> 126 <211> 31 <212> DNA <213> bacterial <400> 126 tacaatatca actacaccac ttctaacaaa t 31 <210> 127 <211> 23 <212> DNA <213> bacterial <400> 127 taataaaaat aacaattata ttt 23 <210> 128 <211> 28 <212> DNA <213> bacterial <400> 128 aaggttgtag agtattaagt attttaag 28 <210> 129 <211> 24 <212> DNA <213> bacterial <400> 129 gttgataatg tattaggggt tgga 24 <210> 130 <211> 28 <212> DNA <213> bacterial <400> 130 atatggattt gaaagtttag gtaagatg 28 <210> 131 <211> 31 <212> DNA <213> bacterial <400> 131 tactactaaa tcaacaacaa caatatccac a 31 <210> 132 <211> 23 <212> DNA <213> bacterial <400> 132 cttaatactt aaaacattaa tct 23 <210> 133 <211> 27 <212> DNA <213> bacterial <400> 133 gagaataagt aaaaggtgtt agttgtg 27 <210> 134 <211> 34 <212> DNA <213> bacterial <400> 134 gatttttatt ggtttattgt tatttgatat tgtt 34 <210> 135 <211> 31 <212> DNA <213> bacterial <400> 135 caaataatca atatcaacac ccaacttttt c 31 <210> 136 <211> 23 <212> DNA <213> bacterial <400> 136 tacacaccac caaacccata tac 23 <210> 137 <211> 24 <212> DNA <213> bacterial <400> 137 gaaaataaat agaaagtgtt ggtg 24 <210> 138 <211> 23 <212> DNA <213> bacterial <400> 138 tgtttttatt ggatattgtg ttt 23 <210> 139 <211> 26 <212> DNA <213> bacterial <400> 139 caataacatc tactacacca aaacac 26 <210> 140 <211> 25 <212> DNA <213> bacterial <400> 140 catattaaac tacttcaaat taccc 25 <210> 141 <211> 25 <212> DNA <213> bacterial <400> 141 tatgtgtttt ggtgaagatt gttta 25 <210> 142 <211> 22 <212> DNA <213> bacterial <400> 142 ttttgatatt gtattggggg tg 22 <210> 143 <211> 27 <212> DNA <213> bacterial <400> 143 ggtttgttaa tggggtgtat tgttgag 27 <210> 144 <211> 20 <212> DNA <213> bacterial <400> 144 catactctac atcaataaaa 20 <210> 145 <211> 26 <212> DNA <213> viral <400> 145 tatgtatgga gatatattta tattgt 26 <210> 146 <211> 25 <212> DNA <213> viral <400> 146 gttatgagta attaaatgat agttt 25 <210> 147 <211> 24 <212> DNA <213> viral <400> 147 taaaacacac aattcctaat atac 24 <210> 148 <211> 24 <212> DNA <213> viral <400> 148 cccattaata cctacaaaat caac 24 <210> 149 <211> 28 <212> DNA <213> viral <400> 149 gtatggattt aaggtaatat tgtaagat 28 <210> 150 <211> 26 <212> DNA <213> viral <400> 150 gtatttagag ttttaaaatg aaattt 26 <210> 151 <211> 23 <212> DNA <213> viral <400> 151 aacacacaaa aaacaaaata ttc 23 <210> 152 <211> 26 <212> DNA <213> viral <400> 152 accattatta cttactacta aaatac 26 <210> 153 <211> 25 <212> DNA <213> viral <400> 153 gtaattgatt tttattgtta tgagt 25 <210> 154 <211> 26 <212> DNA <213> viral <400> 154 gttatagata gtttagttgg ataagt 26 <210> 155 <211> 26 <212> DNA <213> viral <400> 155 ctaaatcaac cattataatt acaatc 26 <210> 156 <211> 23 <212> DNA <213> viral <400> 156 cctatctatc tatcaattac tac 23 <210> 157 <211> 26 <212> DNA <213> viral <400> 157 ttttgtatat ggaaatatat tagaat 26 <210> 158 <211> 24 <212> DNA <213> viral <400> 158 taggtgtatt atatgttaaa gatt 24 <210> 159 <211> 26 <212> DNA <213> viral <400> 159 cctcatctaa actatcactt aattac 26 <210> 160 <211> 26 <212> DNA <213> viral <400> 160 taactaatta tacttatcca tctaac 26 <210> 161 <211> 25 <212> DNA <213> viral <400> 161 aaataatgta ataaatagtt atgtt 25 <210> 162 <211> 26 <212> DNA <213> viral <400> 162 gttgtgttta gttgaaaagt aaagat 26 <210> 163 <211> 27 <212> DNA <213> viral <400> 163 ccatatatat actctataca cacaaac 27 <210> 164 <211> 22 <212> DNA <213> viral <400> 164 aaacacacta ttccaaatat ac 22 <210> 165 <211> 25 <212> DNA <213> viral <400> 165 ttaaagttta ttttgtagga aattg 25 <210> 166 <211> 28 <212> DNA <213> viral <400> 166 gatttatgtt tttataatga aatatagt 28 <210> 167 <211> 23 <212> DNA <213> viral <400> 167 ctaataaatc cataaacaac tac 23 <210> 168 <211> 27 <212> DNA <213> viral <400> 168 cataacaaat tactaattta catttac 27 <210> 169 <211> 27 <212> DNA <213> viral <400> 169 gtaagaaatt gtattgtatt tggaatt 27 <210> 170 <211> 25 <212> DNA <213> viral <400> 170 gaatgaatta gattttgttg atttg 25 <210> 171 <211> 24 <212> DNA <213> viral <400> 171 caactactat aatattctaa aatc 24 <210> 172 <211> 23 <212> DNA <213> viral <400> 172 aacacacaaa aaacaaaata ctc 23 <210> 173 <211> 25 <212> DNA <213> viral <400> 173 ttgtgtatgg tattatatta gaggt 25 <210> 174 <211> 22 <212> DNA <213> viral <400> 174 gatgttaaag attatttggg tt 22 <210> 175 <211> 21 <212> DNA <213> viral <400> 175 tcctctaaac tatcaaatta c 21 <210> 176 <211> 25 <212> DNA <213> viral <400> 176 caacccrtct ttctaataac taatc 25 <210> 177 <211> 24 <212> DNA <213> viral <400> 177 tttgaaataa ttgatttata ttgt 24 <210> 178 <211> 20 <212> DNA <213> viral <400> 178 atgagtaatt aggtgatagt 20 <210> 179 <211> 25 <212> DNA <213> viral <400> 179 ctataccttc aaaatcctcc attac 25 <210> 180 <211> 24 <212> DNA <213> viral <400> 180 ttattacctc tacttcaaac caac 24 <210> 181 <211> 30 <212> DNA <213> viral <400> 181 gatttatagt gtaatgagta attggatagt 30 <210> 182 <211> 22 <212> DNA <213> viral <400> 182 ggttatagta agttagataa gt 22 <210> 183 <211> 24 <212> DNA <213> viral <400> 183 tccccatcta taccttcaaa taac 24 <210> 184 <211> 23 <212> DNA <213> viral <400> 184 cctatttttt tttctacaat tac 23 <210> 185 <211> 27 <212> DNA <213> viral <400> 185 tattttgaat taattgattt attttgt 27 <210> 186 <211> 22 <212> DNA <213> viral <400> 186 atgagtaatt atgtgatagt tt 22 <210> 187 <211> 24 <212> DNA <213> viral <400> 187 atacatatac ccataaacaa ctac 24 <210> 188 <211> 23 <212> DNA <213> viral <400> 188 ttattactat acacaactaa aac 23 <210> 189 <211> 28 <212> DNA <213> viral <400> 189 aaattatgag gaagttgatt ttgtgtgt 28 <210> 190 <211> 25 <212> DNA <213> viral <400> 190 gagttaatta ttttttgtta ttagt 25 <210> 191 <211> 27 <212> DNA <213> viral <400> 191 tatatccata aacaactact ataaaac 27 <210> 192 <211> 27 <212> DNA <213> viral <400> 192 atctatacct tccraatcra ccattac 27 <210> 193 <211> 25 <212> DNA <213> viral <400> 193 aatagygtta tataatttag tgtat 25 <210> 194 <211> 25 <212> DNA <213> viral <400> 194 gtagtagaag ygtygyggga gaatt 25 <210> 195 <211> 27 <212> DNA <213> viral <400> 195 atccccatct ataccttcac aattaac 27 <210> 196 <211> 24 <212> DNA <213> viral <400> 196 ttatttatct actattactt atac 24 <210> 197 <211> 23 <212> DNA <213> viral <400> 197 gatttdkwdt gtwatgagta att 23 <210> 198 <211> 17 <212> DNA <213> viral <400> 198 rryrrkttag abgadga 17 <210> 199 <211> 22 <212> DNA <213> viral <400> 199 ydatacctwc wmawwhvdcc at 22 <210> 200 <211> 23 <212> DNA <213> viral <400> 200 achhhaaacc ahcchhwaca hcc 23 <210> 201 <211> 34 <212> DNA <213> bacterial <400> 201 gtaatcaagg tcgtcttgaa gactacaaca tggc 34 <210> 202 <211> 34 <212> DNA <213> bacterial <400> 202 gcaatttagg ccgcctcgaa gattataata tggc 34 <210> 203 <211> 34 <212> DNA <213> bacterial <400> 203 gyaatywagg ycgyctygaa gaytayaaya tggc 34 <210> 204 <211> 34 <212> DNA <213> bacterial <400> 204 gtaattaagg ttgttttgaa gattataata tggt 34 <210> 205 <211> 34 <212> DNA <213> bacterial <400> 205 gtaatttagg ttgttttgaa gattataata tggt 34 <210> 206 <211> 34 <212> DNA <213> bacterial <400> 206 gtaattwagg ttgttttgaa gattataata tggt 34 <210> 207 <211> 16 <212> DNA <213> bacterial <400> 207 aggycgycty gaagay 16 <210> 208 <211> 16 <212> DNA <213> bacterial <400> 208 aggttgtttt gaagat 16 <210> 209 <211> 16 <212> DNA <213> bacterial <400> 209 taactacgga agatca 16 <210> 210 <211> 16 <212> DNA <213> bacterial <400> 210 taattatgga agatta 16 <210> 211 <211> 16 <212> DNA <213> bacterial <400> 211 gtaatcaagg tcgtct 16 <210> 212 <211> 16 <212> DNA <213> bacterial <400> 212 gtaattaagg ttgttt 16 <210> 213 <211> 16 <212> DNA <213> bacterial <400> 213 gcaatttagg ccgcct 16 <210> 214 <211> 16 <212> DNA <213> bacterial <400> 214 gtaatttagg ttgttt 16 <210> 215 <211> 40 <212> DNA <213> bacterial <400> 215 aagctcttga aggtgactct aaatacgaag acatcatcat 40 <210> 216 <211> 40 <212> DNA <213> bacterial <400> 216 aagcccttga aggtgacact aaatacgaag acatcgttat 40 <210> 217 <211> 40 <212> DNA <213> bacterial <400> 217 aagctcttga aggtgactca aaatacgaag atatcatcat 40 <210> 218 <211> 40 <212> DNA <213> bacterial <400> 218 aagctcttga aggtgatact aagtacgaag acatcatcat 40 <210> 219 <211> 40 <212> DNA <213> bacterial <400> 219 aagctcttga aggtgactct aaatacgaag atatcatcat 40 <210> 220 <211> 40 <212> DNA <213> bacterial <400> 220 aagctcttga aggcgataca gcacatgaag atatcatcat 40 <210> 221 <211> 40 <212> DNA <213> bacterial <400> 221 aagctcttga aggtgactct aaatacgaag acatcgttat 40 <210> 222 <211> 40 <212> DNA <213> bacterial <400> 222 aagctcttga aggtgacact cagtacgaag atatcatcat 40 <210> 223 <211> 40 <212> DNA <213> bacterial <400> 223 aagctcttga aggtgattct aaatacgaag acatcatcat 40 <210> 224 <211> 40 <212> DNA <213> bacterial <400> 224 aagctcttga aggtgattct aaatacgaag acatcatcat 40 <210> 225 <211> 40 <212> DNA <213> bacterial <400> 225 aagcycttga aggygaywcw vmryaygaag ayatcrtyat 40 <210> 226 <211> 40 <212> DNA <213> bacterial <400> 226 aagtttttga aggtgatttt aaatatgaag atattattat 40 <210> 227 <211> 40 <212> DNA <213> bacterial <400> 227 aagtttttga aggtgatatt aaatatgaag atattgttat 40 <210> 228 <211> 40 <212> DNA <213> bacterial <400> 228 aagtttttga aggtgattta aaatatgaag atattattat 40 <210> 229 <211> 40 <212> DNA <213> bacterial <400> 229 aagtttttga aggtgatatt aagtatgaag atattattat 40 <210> 230 <211> 40 <212> DNA <213> bacterial <400> 230 aagtttttga aggtgatttt aaatatgaag atattattat 40 <210> 231 <211> 40 <212> DNA <213> bacterial <400> 231 aagtttttga aggtgatata gtatatgaag atattattat 40 <210> 232 <211> 40 <212> DNA <213> bacterial <400> 232 aagtttttga aggtgatttt aaatatgaag atattgttat 40 <210> 233 <211> 40 <212> DNA <213> bacterial <400> 233 aagtttttga aggtgatatt tagtatgaag atattattat 40 <210> 234 <211> 40 <212> DNA <213> bacterial <400> 234 aagtttttga aggtgatttt aaatatgaag atattattat 40 <210> 235 <211> 40 <212> DNA <213> bacterial <400> 235 aagtttttga aggtgatttt aaatatgaag atattattat 40 <210> 236 <211> 40 <212> DNA <213> bacterial <400> 236 aagtttttga aggtgatwtw rwrtatgaag atattrttat 40 <210> 237 <211> 23 <212> DNA <213> bacterial <400> 237 tacaacgaca ataaaacggt tga 23 <210> 238 <211> 23 <212> DNA <213> bacterial <400> 238 tataatgata ataaaatggt tga 23 <210> 239 <211> 23 <212> DNA <213> bacterial <400> 239 tacggagata ataaagttgt tga 23 <210> 240 <211> 23 <212> DNA <213> bacterial <400> 240 tatggagata ataaagttgt tga 23 <210> 241 <211> 23 <212> DNA <213> bacterial <400> 241 tacaacgaca ataaaacggt tga 23 <210> 242 <211> 23 <212> DNA <213> bacterial <400> 242 tataatgata ataaaatggt tga 23 <210> 243 <211> 23 <212> DNA <213> bacterial <400> 243 tacaacgaca ataaaacggt tga 23 <210> 244 <211> 23 <212> DNA <213> bacterial <400> 244 tataatgata ataaaatggt tga 23 <210> 245 <211> 23 <212> DNA <213> bacterial <400> 245 tatagagata ataaaacgat taa 23 <210> 246 <211> 23 <212> DNA <213> bacterial <400> 246 tatagagata ataaaatgat taa 23 <210> 247 <211> 23 <212> DNA <213> bacterial <400> 247 tacagagata ataaaactat taa 23 <210> 248 <211> 23 <212> DNA <213> bacterial <400> 248 tatagagata ataaaattat taa 23 <210> 249 <211> 23 <212> DNA <213> bacterial <400> 249 tacaatgaca ataaaatggt tga 23 <210> 250 <211> 23 <212> DNA <213> bacterial <400> 250 tataatgata ataaaatggt tga 23 <210> 251 <211> 23 <212> DNA <213> bacterial <400> 251 tayrrhgaya ataaarykrt tra 23 <210> 252 <211> 23 <212> DNA <213> bacterial <400> 252 tatrrwgata ataaartkrt tra 23 <210> 253 <211> 20 <212> DNA <213> viral <400> 253 tgtgtgtgca gggataattg 20 <210> 254 <211> 20 <212> DNA <213> viral <400> 254 tgtatatgta gggacaattg 20 <210> 255 <211> 20 <212> DNA <213> viral <400> 255 tgtgtttgta gagacaactg 20 <210> 256 <211> 20 <212> DNA <213> viral <400> 256 tgtatatgta gggacaattg 20 <210> 257 <211> 20 <212> DNA <213> viral <400> 257 tgtgtttgca gagataattg 20 <210> 258 <211> 20 <212> DNA <213> viral <400> 258 tgcatttgca gggacaattg 20 <210> 259 <211> 20 <212> DNA <213> viral <400> 259 tgcacttgca gggataattg 20 <210> 260 <211> 20 <212> DNA <213> viral <400> 260 tgcgtttgcc gagataattg 20 <210> 261 <211> 20 <212> DNA <213> viral <400> 261 tgtgcctgta gagataacag 20 <210> 262 <211> 20 <212> DNA <213> viral <220> <221> misc_feature <222> (1)..(10) <223> n <400> 262 tgyryntgym grgayaaywg 20 <210> 263 <211> 20 <212> DNA <213> viral <400> 263 tgtgtgtgta gggataattg 20 <210> 264 <211> 20 <212> DNA <213> viral <400> 264 tgtatatgta gggataattg 20 <210> 265 <211> 20 <212> DNA <213> viral <400> 265 tgtgtttgta gagataattg 20 <210> 266 <211> 20 <212> DNA <213> viral <400> 266 tgtatatgta gggataattg 20 <210> 267 <211> 20 <212> DNA <213> viral <400> 267 tgtgtttgta gagataattg 20 <210> 268 <211> 20 <212> DNA <213> viral <400> 268 tgtatttgta gggataattg 20 <210> 269 <211> 20 <212> DNA <213> viral <400> 269 tgtatttgta gggataattg 20 <210> 270 <211> 20 <212> DNA <213> viral <400> 270 tgtgtttgtt gagataattg 20 <210> 271 <211> 20 <212> DNA <213> viral <400> 271 tgtgtttgta gagataatag 20 <210> 272 <211> 20 <212> DNA <213> viral <400> 272 tgtrtdtgtw grgataatwg 20 <210> 273 <211> 19 <212> DNA <213> viral <400> 273 ctaaattcgc tccgattta 19 <210> 274 <211> 19 <212> DNA <213> viral <400> 274 ttaaatttgt tttgattta 19 <210> 275 <211> 19 <212> DNA <213> viral <400> 275 caaaattgac ccagactta 19 <210> 276 <211> 19 <212> DNA <213> viral <400> 276 taaaattgat ttagattta 19 <210> 277 <211> 19 <212> DNA <213> viral <400> 277 ttaaattcgt taagattca 19 <210> 278 <211> 19 <212> DNA <213> viral <400> 278 ttaaatttgt taagattta 19 <210> 279 <211> 19 <212> DNA <213> viral <400> 279 ywaaattsry ymmgaytya 19 <210> 280 <211> 19 <212> DNA <213> viral <400> 280 twaaattkrt twwgattta 19 <210> 281 <211> 20 <212> DNA <213> viral <400> 281 gatggcgata tggttgacac 20 <210> 282 <211> 20 <212> DNA <213> viral <400> 282 gatggtgata tggttgatat 20 <210> 283 <211> 20 <212> DNA <213> viral <400> 283 gatggtgaca tggtagatac 20 <210> 284 <211> 20 <212> DNA <213> viral <400> 284 gatggtgata tggtagatat 20 <210> 285 <211> 20 <212> DNA <213> viral <400> 285 gatggtgata tggtggacac 20 <210> 286 <211> 20 <212> DNA <213> viral <400> 286 gatggtgata tggtggatat 20 <210> 287 <211> 20 <212> DNA <213> viral <400> 287 gatggtgata tggtagatat 20 <210> 288 <211> 20 <212> DNA <213> viral <400> 288 gatggtgata tggtagatat 20 <210> 289 <211> 20 <212> DNA <213> viral <400> 289 gatggtgata tggtggacac 20 <210> 290 <211> 20 <212> DNA <213> viral <400> 290 gatggtgata tggtggatat 20 <210> 291 <211> 20 <212> DNA <213> viral <400> 291 gatggcgaca tggttgatat 20 <210> 292 <211> 20 <212> DNA <213> viral <400> 292 gatggtgata tggttgatat 20 <210> 293 <211> 20 <212> DNA <213> viral <400> 293 gatggtgata tggtggacac 20 <210> 294 <211> 20 <212> DNA <213> viral <400> 294 gatggtgata tggtggatat 20 <210> 295 <211> 20 <212> DNA <213> viral <400> 295 gatggtgaca tggtagatac 20 <210> 296 <211> 20 <212> DNA <213> viral <400> 296 gatggtgata tggtagatat 20 <210> 297 <211> 20 <212> DNA <213> viral <400> 297 gatggtgata tggtagatac 20 <210> 298 <211> 20 <212> DNA <213> viral <400> 298 gatggtgata tggtagatat 20 <210> 299 <211> 20 <212> DNA <213> viral <400> 299 gatggtgata tggtggatac 20 <210> 300 <211> 20 <212> DNA <213> viral <400> 300 gatggtgata tggtggatat 20 <210> 301 <211> 20 <212> DNA <213> viral <400> 301 gatggygaya tggtdgayay 20 <210> 302 <211> 20 <212> DNA <213> viral <400> 302 gatggtgata tggtdgatat 20 <210> 303 <211> 2922 <212> DNA <213> bacterial <400> 303 gattaagtta ttaagggcgc acggtggatg ccttggcact agaagccgat gaaggacgtt 60 actaacgacg atatgctttg ggtagctgta agtaagcgtt gatccagaga tttccgaatg 120 ggggaaccca gcatgagtta tgtcatgtta tcgatatgtg aatttatagc atgtcagaag 180 gcagacccgg agaactgaaa catcttagta cccggaggaa gagaaagaaa aatcgattcc 240 ctgagtagcg gcgagcgaaa cgggaagagc ccaaaccaac aagcttgctt gttggggttg 300 taggacactc tatacggagt tacaaaagaa catgttagac gaatcatctg gaaagatgaa 360 tcaaagaagg taataatcct gtagtcgaaa acatattctc tcttgagtgg atcctgagta 420 cgacggagca cgtgaaattc cgtcggaatc tgggaggacc atctcctaag gctaaatact 480 ctctagtgac cgatagtgaa ccagtaccgt gagggaaagg tgaaaagtac cccggaaggg 540 gagtgaaaga gaacttgaaa ccgtgtgctt acaagtagtc agagcccgtt aatgggtgat 600 ggcgtgcctt ttgtagaatg aaccggcgag ttacgatctg atgcaaggtt aagcagcaaa 660 tgcggagccg cagcgaaagc gagtctgaat agggcgttga gtatttggtc gtagacccga 720 aaccaggtga tctacccttg gtcaggttga agttcaggta acactgaatg gaggaccgaa 780 ccgacttacg ttgaaaagtg agcggatgaa ctgagggtag cggagaaatt ccaatcgaac 840 ttggagatag ctggttctct ccgaaatagc tttagggcta gcctcaagtg atgattattg 900 gaggtagagc actgtttgga cgaggggccc ctctcgggtt accgaattca gacaaactcc 960 gaatgccaat taatttaact tgggagtcag aacatgggtg ataaggtccg tgttcgaaag 1020 ggaaacagcc cagaccacca gctaaggtcc caaaatatat gttaagtgga aaaggatgtg 1080 gcgttgccca gacaactagg atgttggctt agaagcagcc atcatttaaa gagtgcgtaa 1140 tagctcacta gtcgagtgac actgcgccga aaatgtaccg gggctaaaca tattaccgaa 1200 gctgtggatt gtcctttgga caatggtagg agagcgttct aagggcgtcg aagcatgatc 1260 gcaaggacat gtggagcgct tagaagtgag aatgccggtg tgagtagcga aagacgggtg 1320 agaatcccgt ccaccgattg actaaggttt ccagaggaag gctcgtccgc tctgggttag 1380 tcgggtccta agctgaggcc gacaggcgta ggcgatggat aacaggttga tattcctgta 1440 ccacctagta tcgttttaat cgatgggggg acgcagtagg ataggcgaag cgtgctgttg 1500 gagtgcacgt ccaagcagta aggctgagtg ttaggcaaat ccggcactca taaggctgag 1560 ctgtgatggg gagaggaaat tgtttcctcg agtcgttgat ttcacactgc cgagaaaagc 1620 ctctagatag ataacaggtg cccgtaccgc aaaccgacac aggtagtcaa gatgagaatt 1680 ctaaggtgag cgagcgaact ctcgttaagg aactcggcaa aatgaccccg taacttcggg 1740 agaaggggtg ctctttaggg ttcacgccca gaagagccgc agtgaatagg cccaagcgac 1800 tgtttatcaa aaacacaggt ctctgctaaa ccgtaaggtg atgtataggg gctgacgcct 1860 gcccggtgct ggaaggttaa gaggagtggt tagcttctgc gaagctacga atcgaagccc 1920 cagtaaacgg cggccgtaac tataacggtc ctaaggtagc gaaattcctt gtcgggtaag 1980 ttccgacccg cacgaaaggc gtaacgattt gggcactgtc tcaacgagag actcggtgaa 2040 atcatagtac ctgtgaagat gcaggttacc cgcgacagga cggaaagacc ccgtggagct 2100 ttactgtagc ctgatattga aattcggcac agcttgtaca ggataggtag gagcctttga 2160 aacgtgagcg ctagcttacg tggaggcgtt ggtgggatac taccctagct gtgttggctt 2220 tctaacccgc accacttatc gtggtgggag acagtgtcag gcgggcagtt tgactggggc 2280 ggtcgcctcc taaaaggtaa cggaggcgct caaaggttcc ctcagaatgg ttggaaatca 2340 ttcatagagt gtaaaggcat aagggagctt gactgcgaga cctacaagtc gagcagggtc 2400 gaaagacgga cttagtgatc cggtggttcc gcatggaagg gccatcgctc aacggataaa 2460 agctaccccg gggataacag gcttatctcc cccaagagtt cacatcgacg gggaggtttg 2520 gcacctcgat gtcggctcat cgcatcctgg ggctgtagtc ggtcccaagg gttgggctgt 2580 tcgcccatta aagcggtacg cgagctgggt tcagaacgtc gtgagacagt tcggtcccta 2640 tccgtcgtgg gcgtaggaaa tttgagagga gctgtcctta gtacgagagg accgggatgg 2700 acatacctct ggtgtaccag ttgtcgtgcc aacggcatag ctgggtagct atgtatggac 2760 gggataagtg ctgaaagcat ctaagcatga agcccccctc aagatgagat ttcccaactt 2820 cggttataag atccctcgaa gatgacgagg ttaataggtt cgaggtggaa gcgtggtgac 2880 acgtggagct gacgaatact aatcgatcga agacttaatc aa 2922 <210> 304 <211> 2922 <212> DNA <213> bacterial <400> 304 gattaagtta ttaagggtgt atggtggatg ttttggtatt agaagttgat gaaggatgtt 60 attaatgatg atatgttttg ggtagttgta agtaagtgtt gatttagaga tttttgaatg 120 ggggaattta gtatgagtta tgttatgtta ttgatatgtg aatttatagt atgttagaag 180 gtagatttgg agaattgaaa tattttagta tttggaggaa gagaaagaaa aattgatttt 240 ttgagtagtg gtgagtgaaa tgggaagagt ttaaattaat aagtttgttt gttggggttg 300 taggatattt tatatggagt tataaaagaa tatgttagat gaattatttg gaaagatgaa 360 ttaaagaagg taataatttt gtagttgaaa atatattttt ttttgagtgg attttgagta 420 tgatggagta tgtgaaattt tgttggaatt tgggaggatt attttttaag gttaaatatt 480 ttttagtgat tgatagtgaa ttagtattgt gagggaaagg tgaaaagtat tttggaaggg 540 gagtgaaaga gaatttgaaa ttgtgtgttt ataagtagtt agagtttgtt aatgggtgat 600 ggtgtgtttt ttgtagaatg aattggtgag ttatgatttg atgtaaggtt aagtagtaaa 660 tgtggagttg tagtgaaagt gagtttgaat agggtgttga gtatttggtt gtagatttga 720 aattaggtga tttatttttg gttaggttga agtttaggta atattgaatg gaggattgaa 780 ttgatttatg ttgaaaagtg agtggatgaa ttgagggtag tggagaaatt ttaattgaat 840 ttggagatag ttggtttttt ttgaaatagt tttagggtta gttttaagtg atgattattg 900 gaggtagagt attgtttgga tgaggggttt tttttgggtt attgaattta gataaatttt 960 gaatgttaat taatttaatt tgggagttag aatatgggtg ataaggtttg tgtttgaaag 1020 ggaaatagtt tagattatta gttaaggttt taaaatatat gttaagtgga aaaggatgtg 1080 gtgttgttta gataattagg atgttggttt agaagtagtt attatttaaa gagtgtgtaa 1140 tagtttatta gttgagtgat attgtgttga aaatgtattg gggttaaata tattattgaa 1200 gttgtggatt gttttttgga taatggtagg agagtgtttt aagggtgttg aagtatgatt 1260 gtaaggatat gtggagtgtt tagaagtgag aatgttggtg tgagtagtga aagatgggtg 1320 agaattttgt ttattgattg attaaggttt ttagaggaag gtttgtttgt tttgggttag 1380 ttgggtttta agttgaggtt gataggtgta ggtgatggat aataggttga tatttttgta 1440 ttatttagta ttgttttaat tgatgggggg atgtagtagg ataggtgaag tgtgttgttg 1500 gagtgtatgt ttaagtagta aggttgagtg ttaggtaaat ttggtattta taaggttgag 1560 ttgtgatggg gagaggaaat tgtttttttg agttgttgat tttatattgt tgagaaaagt 1620 ttttagatag ataataggtg tttgtattgt aaattgatat aggtagttaa gatgagaatt 1680 ttaaggtgag tgagtgaatt tttgttaagg aatttggtaa aatgattttg taattttggg 1740 agaaggggtg ttttttaggg tttatgttta gaagagttgt agtgaatagg tttaagtgat 1800 tgtttattaa aaatataggt ttttgttaaa ttgtaaggtg atgtataggg gttgatgttt 1860 gtttggtgtt ggaaggttaa gaggagtggt tagtttttgt gaagttatga attgaagttt 1920 tagtaaatgg tggttgtaat tataatggtt ttaaggtagt gaaatttttt gttgggtaag 1980 ttttgatttg tatgaaaggt gtaatgattt gggtattgtt ttaatgagag atttggtgaa 2040 attatagtat ttgtgaagat gtaggttatt tgtgatagga tggaaagatt ttgtggagtt 2100 ttattgtagt ttgatattga aatttggtat agtttgtata ggataggtag gagtttttga 2160 aatgtgagtg ttagtttatg tggaggtgtt ggtgggatat tattttagtt gtgttggttt 2220 tttaatttgt attatttatt gtggtgggag atagtgttag gtgggtagtt tgattggggt 2280 ggttgttttt taaaaggtaa tggaggtgtt taaaggtttt tttagaatgg ttggaaatta 2340 tttatagagt gtaaaggtat aagggagttt gattgtgaga tttataagtt gagtagggtt 2400 gaaagatgga tttagtgatt tggtggtttt gtatggaagg gttattgttt aatggataaa 2460 agttattttg gggataatag gtttattttt tttaagagtt tatattgatg gggaggtttg 2520 gtattttgat gttggtttat tgtattttgg ggttgtagtt ggttttaagg gttgggttgt 2580 ttgtttatta aagtggtatg tgagttgggt ttagaatgtt gtgagatagt ttggttttta 2640 tttgttgtgg gtgtaggaaa tttgagagga gttgttttta gtatgagagg attgggatgg 2700 atatattttt ggtgtattag ttgttgtgtt aatggtatag ttgggtagtt atgtatggat 2760 gggataagtg ttgaaagtat ttaagtatga agtttttttt aagatgagat tttttaattt 2820 tggttataag attttttgaa gatgatgagg ttaataggtt tgaggtggaa gtgtggtgat 2880 atgtggagtt gatgaatatt aattgattga agatttaatt aa 2922 <210> 305 <211> 1062 <212> DNA <213> bacterial <400> 305 atggctatcg acgaaaacaa acagaaagcg ttggcggcag cactgggcca gattgagaaa 60 caatttggta aaggctccat catgcgcctg ggtgaagacc gttccatgga tgtggaaacc 120 atctctaccg gttcgctttc actggatatc gcgcttgggg caggtggtct gccgatgggc 180 cgtatcgtcg aaatctacgg accggaatct tccggtaaaa ccacgctgac gctgcaggtg 240 atcgccgcag cgcagcgtga aggtaaaacc tgtgcgttta tcgatgctga acacgcgctg 300 gacccaatct acgcacgtaa actgggcgtc gatatcgata acctgctgtg ctcccagccg 360 gacaccggcg agcaggcact ggaaatctgt gacgccctgg cgcgttctgg cgcagtagac 420 gttatcgtcg ttgactccgt ggcggcactg acgccgaaag cggaaatcga aggcgaaatc 480 ggcgactctc acatgggcct tgcggcacgt atgatgagcc aggcgatgcg taagctggcg 540 ggtaacctga agcagtccaa cacgctgctg atcttcatca accagatccg tatgaaaatt 600 ggtgtgatgt tcggtaaccc ggaaaccact accggtggta acgcgctgaa attctacgcc 660 tctgttcgtc tcgacatccg tcgtatcggc gcggtgaaag agggcgaaaa cgtggtgggt 720 agcgaaaccc gcgtgaaagt ggtgaagaac aaaatcgctg cgccgtttaa acaggctgaa 780 ttccagatcc tctacggcga aggtatcaac ttctacggcg aactggttga cctgggcgta 840 aaagagaagc tgatcgagaa agcaggcgcg tggtacagct acaaaggtga gaagatcggt 900 cagggtaaag cgaatgcgac tgcctggctg aaagataacc cggaaaccgc gaaagagatc 960 gagaagaaag tacgtgagtt gctgctgagc aacccgaact caacgccgga tttctctgta 1020 gatgatagcg aaggcgtagc agaaactaac gaagattttt aa 1062 <210> 306 <211> 1062 <212> DNA <213> bacterial <400> 306 atggttattg atgaaaataa atagaaagtg ttggtggtag tattgggtta gattgagaaa 60 taatttggta aaggttttat tatgtgtttg ggtgaagatt gttttatgga tgtggaaatt 120 atttttattg gtttgttttt attggatatt gtgtttgggg taggtggttt gttgatgggt 180 tgtattgttg aaatttatgg attggaattt tttggtaaaa ttatgttgat gttgtaggtg 240 attgttgtag tgtagtgtga aggtaaaatt tgtgtgttta ttgatgttga atatgtgttg 300 gatttaattt atgtatgtaa attgggtgtt gatattgata atttgttgtg tttttagttg 360 gatattggtg agtaggtatt ggaaatttgt gatgttttgg tgtgttttgg tgtagtagat 420 gttattgttg ttgattttgt ggtggtattg atgttgaaag tggaaattga aggtgaaatt 480 ggtgattttt atatgggttt tgtggtatgt atgatgagtt aggtgatgtg taagttggtg 540 ggtaatttga agtagtttaa tatgttgttg atttttatta attagatttg tatgaaaatt 600 ggtgtgatgt ttggtaattt ggaaattatt attggtggta atgtgttgaa attttatgtt 660 tttgtttgtt ttgatatttg ttgtattggt gtggtgaaag agggtgaaaa tgtggtgggt 720 agtgaaattt gtgtgaaagt ggtgaagaat aaaattgttg tgttgtttaa ataggttgaa 780 ttttagattt tttatggtga aggtattaat ttttatggtg aattggttga tttgggtgta 840 aaagagaagt tgattgagaa agtaggtgtg tggtatagtt ataaaggtga gaagattggt 900 tagggtaaag tgaatgtgat tgtttggttg aaagataatt tggaaattgt gaaagagatt 960 gagaagaaag tatgtgagtt gttgttgagt aatttgaatt taatgttgga tttttttgta 1020 gatgatagtg aaggtgtagt agaaattaat gaagattttt aa 1062 <210> 307 <211> 7904 <212> DNA <213> viral <400> 307 actacaataa ttcatgtata aaactaaggg cgtaaccgaa atcggttgaa ccgaaaccgg 60 ttagtataaa agcagacatt ttatgcacca aaagagaact gcaatgtttc aggacccaca 120 ggagcgaccc agaaagttac cacagttatg cacagagctg caaacaacta tacatgatat 180 aatattagaa tgtgtgtact gcaagcaaca gttactgcga cgtgaggtat atgactttgc 240 ttttcgggat ttatgcatag tatatagaga tgggaatcca tatgctgtat gtgataaatg 300 tttaaagttt tattctaaaa ttagtgagta tagacattat tgttatagtt tgtatggaac 360 aacattagaa cagcaataca acaaaccgtt gtgtgatttg ttaattaggt gtattaactg 420 tcaaaagcca ctgtgtcctg aagaaaagca aagacatctg gacaaaaagc aaagattcca 480 taatataagg ggtcggtgga ccggtcgatg tatgtcttgt tgcagatcat caagaacacg 540 tagagaaacc cagctgtaat catgcatgga gatacaccta cattgcatga atatatgtta 600 gatttgcaac cagagacaac tgatctctac tgttatgagc aattaaatga cagctcagag 660 gaggaggatg aaatagatgg tccagctgga caagcagaac cggacagagc ccattacaat 720 attgtaacct tttgttgcaa gtgtgactct acgcttcggt tgtgcgtaca aagcacacac 780 gtagacattc gtactttgga agacctgtta atgggcacac taggaattgt gtgccccatc 840 tgttctcaga aaccataatc taccatggct gatcctgcag gtaccaatgg ggaagagggt 900 acgggatgta atggatggtt ttatgtagag gctgtagtgg aaaaaaaaac aggggatgct 960 atatcagatg acgagaacga aaatgacagt gatacaggtg aagatttggt agattttata 1020 gtaaatgata atgattattt aacacaggca gaaacagaga cagcacatgc gttgtttact 1080 gcacaggaag caaaacaaca tagagatgca gtacaggttc taaaacgaaa gtatttggta 1140 gtccacttag tgatattagt ggatgtgtag acaataatat tagtcctaga ttaaaagcta 1200 tatgtataga aaaacaaagt agagctgcaa aaaggagatt atttgaaagc gaagacagcg 1260 ggtatggcaa tactgaagtg gaaactcagc agatgttaca ggtagaaggg cgccatgaga 1320 ctgaaacacc atgtagtcag tatagtggtg gaagtggggg tggttgcagt cagtacagta 1380 gtggaagtgg gggagagggt gttagtgaaa gacacactat atgccaaaca ccacttacaa 1440 atattttaaa tgtactaaaa actagtaatg caaaggcagc aatgttagca aaatttaaag 1500 agttatacgg ggtgagtttt tcagaattag taagaccatt taaaagtaat aaatcaacgt 1560 gttgcgattg gtgtattgct gcatttggac ttacacccag tatagctgac agtataaaaa 1620 cactattaca acaatattgt ttatatttac acattcaaag tttagcatgt tcatggggaa 1680 tggttgtgtt actattagta agatataaat gtggaaaaaa tagagaaaca attgaaaaat 1740 tgctgtctaa actattatgt gtgtctccaa tgtgtatgat gatagagcct ccaaaattgc 1800 gtagtacagc agcagcatta tattggtata aaacaggtat atcaaatatt agtgaagtgt 1860 atggagacac gccagaatgg atacaaagac aaacagtatt acaacatagt tttaatgatt 1920 gtacatttga attatcacag atggtacaat gggcctacga taatgacata gtagacgata 1980 gtgaaattgc atataaatat gcacaattgg cagacactaa tagtaatgca agtgcctttc 2040 taaaaagtaa ttcacaggca aaaattgtaa aggattgtgc aacaatgtgt agacattata 2100 aacgagcaga aaaaaaacaa atgagtatga gtcaatggat aaaatataga tgtgataggg 2160 tagatgatgg aggtgattgg aagcaaattg ttatgttttt aaggtatcaa ggtgtagagt 2220 ttatgtcatt tttaactgca ttaaaaagat ttttgcaagg catacctaaa aaaaattgca 2280 tattactata tggtgcagct aacacaggta aatcattatt tggtatgagt ttaatgaaat 2340 ttctgcaagg gtctgtaata tgttttgtaa attctaaaag ccatttttgg ttacaaccat 2400 tagcagatgc caaaataggt atgttagatg atgctacagt gccctgttgg aactacatag 2460 atgacaattt aagaaatgca ttggatggaa atttagtttc tatggatgta aagcatagac 2520 cattggtaca actaaaatgc cctccattat taattacatc taacattaat gctggtacag 2580 attctaggtg gccttattta cataatagat tggtggtgtt tacatttcct aatgagtttc 2640 catttgacga aaacggaaat ccagtgtatg agcttaatga taagaactgg aaatcctttt 2700 tctcaaggac gtggtccaga ttaagtttgc acgaggacga ggacaaggaa aacgatggag 2760 actctttgcc aacgtttaaa tgtgtgtcag gacaaaatac taacacatta tgaaaatgat 2820 agtacagacc tacgtgacca tatagactat tggaaacaca tgcgcctaga atgtgctatt 2880 tattacaagg ccagagaaat gggatttaaa catattaacc accaagtggt gccaacactg 2940 gctgtatcaa agaataaagc attacaagca attgaactgc aactaacgtt agaaacaata 3000 tataactcac aatatagtaa tgaaaagtgg acattacaag acgttagcct tgaagtgtat 3060 ttaactgcac caacaggatg tataaaaaaa catggatata cagtggaagt gcagtttgat 3120 ggagacatat gcaatacaat gcattataca aactggacac atatatatat ttgtgaagaa 3180 gcatcagtaa ctgtggtaga gggtcaagtt gactattatg gtttatatta tgttcatgaa 3240 ggaatacgaa catattttgt gcagtttaaa gatgatgcag aaaaatatag taaaaataaa 3300 gtatgggaag ttcatgcggg tggtcaggta atattatgtc ctacatctgt gtttagcagc 3360 aacgaagtat cctctcctga aattattagg cagcacttgg ccaaccaccc cgccgcgacc 3420 cataccaaag ccgtcgcctt gggcaccgaa gaaacacaga cgactatcca gcgaccaaga 3480 tcagagccag acaccggaaa cccctgccac accactaagt tgttgcacag agactcagtg 3540 gacagtgctc caatcctcac tgcatttaac agctcacaca aaggacggat taactgtaat 3600 agtaacacta cacccatagt acatttaaaa ggtgatgcta atactttaaa atgtttaaga 3660 tatagattta aaaagcattg tacattgtat actgcagtgt cgtctacatg gcattggaca 3720 ggacataatg taaaacataa aagtgcaatt gttacactta catatgatag tgaatggcaa 3780 cgtgaccaat ttttgtctca agttaaaata ccaaaaacta ttacagtgtc tactggattt 3840 atgtctatat gacaaatctt gatactgcat ccacaacatt actggcgtgc tttttgcttt 3900 gctttgtgtg cttttgtgtg tctgcctatt aatacgtccg ctgcttttgt ctgtgtctac 3960 atacacatca ttaataatat tggtattact attgtggata acagcagcct ctgcgtttag 4020 gtgttttatt gtatatatta tatttgttta tataccatta tttttaatac atacacatgc 4080 acgcttttta attacataat gtatatgtac ataatgtaat tgttacatat aattgttgta 4140 taccataact tactattttt tcttttttat tttcatatat aatttttttt tttgtttgtt 4200 tgtttgtttt ttaataaact gttattactt aacaatgcga cacaaacgtt ctgcaaaacg 4260 cacaaaacgt gcatcggcta cccaacttta taaaacatgc aaacaggcag gtacatgtcc 4320 acctgacatt atacctaagg ttgaaggcaa aactattgct gaacaaatat tacaatatgg 4380 aagtatgggt gtattttttg gtgggttagg aattggaaca gggtcgggta caggcggacg 4440 cactgggtat attccattgg gaacaaggcc tcccacagct acagatacac ttgctcctgt 4500 aagaccccct ttaacagtag atcctgtggg cccttctgat ccttctatag tttctttagt 4560 ggaagaaact agttttattg atgctggtgc accaacatct gtaccttcca ttcccccaga 4620 tgtatcagga tttagtatta ctacttcaac tgataccaca cctgctatat tagatattaa 4680 taatactgtt actactgtta ctacacataa taatcccact ttcactgacc catctgtatt 4740 gcagcctcca acacctgcag aaactggagg gcattttaca ctttcatcat ccactattag 4800 tacacataat tatgaagaaa ttcctatgga tacatttatt gttagcacaa accctaacac 4860 agtaactagt agcacaccca taccagggtc tcgcccagtg gcacgcctag gattatatag 4920 tcgcacaaca caacaggtta aagttgtaga ccctgctttt gtaaccactc ccactaaact 4980 tattacatat gataatcctg catatgaagg tatagatgtg gataatacat tatatttttc 5040 tagtaatgat aatagtatta atatagctcc agatcctgac tttttggata tagttgcttt 5100 acataggcca gcattaacct ctaggcgtac tggcattagg tacagtagaa ttggtaataa 5160 acaaacacta cgtactcgta gtggaaaatc tataggtgct aaggtacatt attattatga 5220 tttaagtact attgatcctg cagaagaaat agaattacaa actataacac cttctacata 5280 tactaccact tcacatgcag cctcacctac ttctattaat aatggattat atgatattta 5340 tgcagatgac tttattacag atacttctac aaccccggta ccatctgtac cctctacatc 5400 tttatcaggt tatattcctg caaatacaac aattcctttt ggtggtgcat acaatattcc 5460 tttagtatca ggtcctgata tacccattaa tataactgac caagctcctt cattaattcc 5520 tatagttcca gggtctccac aatatacaat tattgctgat gcaggtgact tttatttaca 5580 tcctagttat tacatgttac gaaaacgacg taaacgttta ccatattttt tttcagatgt 5640 ctctttggct gcctagtgag gccactgtct acttgcctcc tgtcccagta tctaaggttg 5700 taagcacgga tgaatatgtt gcacgcacaa acatatatta tcatgcagga acatccagac 5760 tacttgcagt tggacatccc tattttccta ttaaaaaacc taacaataac aaaatattag 5820 ttcctaaagt atcaggatta caatacaggg tatttagaat acatttacct gaccccaata 5880 agtttggttt tcctgacacc tcattttata atccagatac acagcggctg gtttgggcct 5940 gtgtaggtgt tgaggtaggt cgtggtcagc cattaggtgt gggcattagt ggccatcctt 6000 tattaaataa attggatgac acagaaaatg ctagtgctta tgcagcaaat gcaggtgtgg 6060 ataatagaga atgtatatct atggattaca aacaaacaca attgtgttta attggttgca 6120 aaccacctat aggggaacac tggggcaaag gatccccatg taccaatgtt gcagtaaatc 6180 caggtgattg tccaccatta gagttaataa acacagttat tcaggatggt gatatggttc 6240 atactggctt tggtgctatg gactttacta cattacaggc taacaaaagt gaagttccac 6300 tggatatttg tacatctatt tgcaaatatc cagattatat taaaatggtg tcagaaccat 6360 atggcgacag cttatttttt tatttacgaa gggaacaaat gtttgttaga catttattta 6420 atagggctgg tactgttggt gaaaatgtac cagacgattt atacattaaa ggctctgggt 6480 ctactgcaaa tttagccagt tcaaattatt ttcctacacc tagtggttct atggttacct 6540 ctgatgccca aatattcaat aaaccttatt ggttacaacg agcacagggc cacaataatg 6600 gcatttgttg gggtaaccaa ctatttgtta ctgttgttga tactacacgc agtacaaata 6660 tgtcattatg tgctgccata tctacttcag aaactacata taaaaatact aactttaagg 6720 agtacctacg acatggggag gaatatgatt tacagtttat ttttcaactg tgcaaaataa 6780 ccttaactgc agacgttatg acatacatac attctatgaa ttccactatt ttggaggact 6840 ggaattttgg tctacaacct cccccaggag gcacactaga agatacttat aggtttgtaa 6900 cccaggcaat tgcttgtcaa aaacatacac ctccagcacc taaagaagat gatcccctta 6960 aaaaatacac tttttgggaa gtaaatttaa aggaaaagtt ttctgcagac ctagatcagt 7020 ttcctttagg acgcaaattt ttactacaag caggattgaa ggccaaacca aaatttacat 7080 taggaaaacg aaaagctaca cccaccacct catctacctc tacaactgct aaacgcaaaa 7140 aacgtaagct gtaagtattg tatgtatgtt gaattagtgt tgtttgttgt gtatatgttt 7200 gtatgtgctt gtatgtgctt gtaaatatta agttgtatgt gtgtttgtat gtatggtata 7260 ataaacacgt gtgtatgtgt ttttaaatgc ttgtgtaact attgtgtcat gcaacataaa 7320 taaacttatt gtttcaacac ctactaattg tgttgtggtt attcattgta tataaactat 7380 atttgctaca tcctgttttt gttttatata tactatattt tgtagcgcca ggcccatttt 7440 gtagcttcaa ccgaattcgg ttgcatgctt tttggcacaa aatgtgtttt tttaaatagt 7500 tctatgtcag caactatggt ttaaacttgt acgtttcctg cttgccatgc gtgccaaatc 7560 cctgttttcc tgacctgcac tgcttgccaa ccattccatt gttttttaca ctgcactatg 7620 tgcaactact gaatcactat gtacattgtg tcatataaaa taaatcacta tgcgccaacg 7680 ccttacatac cgctgttagg cacatatttt tggcttgttt taactaacct aattgcatat 7740 ttggcataag gtttaaactt ctaaggccaa ctaaatgtca ccctagttca tacatgaact 7800 gtgtaaaggt tagtcataca ttgttcattt gtaaaactgc acatgggtgt gtgcaaaccg 7860 attttgggtt acacatttac aagcaactta tataataata ctaa 7904 <210> 308 <211> 7904 <212> DNA <213> viral <400> 308 attataataa tttatgtata aaattaaggg tgtaattgaa attggttgaa ttgaaattgg 60 ttagtataaa agtagatatt ttatgtatta aaagagaatt gtaatgtttt aggatttata 120 ggagtgattt agaaagttat tatagttatg tatagagttg taaataatta tatatgatat 180 aatattagaa tgtgtgtatt gtaagtaata gttattgtga tgtgaggtat atgattttgt 240 tttttgggat ttatgtatag tatatagaga tgggaattta tatgttgtat gtgataaatg 300 tttaaagttt tattttaaaa ttagtgagta tagatattat tgttatagtt tgtatggaat 360 aatattagaa tagtaatata ataaattgtt gtgtgatttg ttaattaggt gtattaattg 420 ttaaaagtta ttgtgttttg aagaaaagta aagatatttg gataaaaagt aaagatttta 480 taatataagg ggttggtgga ttggttgatg tatgttttgt tgtagattat taagaatatg 540 tagagaaatt tagttgtaat tatgtatgga gatatattta tattgtatga atatatgtta 600 gatttgtaat tagagataat tgatttttat tgttatgagt aattaaatga tagtttagag 660 gaggaggatg aaatagatgg tttagttgga taagtagaat tggatagagt ttattataat 720 attgtaattt tttgttgtaa gtgtgatttt atgttttggt tgtgtgtata aagtatatat 780 gtagatattt gtattttgga agatttgtta atgggtatat taggaattgt gtgttttatt 840 tgtttttaga aattataatt tattatggtt gattttgtag gtattaatgg ggaagagggt 900 atgggatgta atggatggtt ttatgtagag gttgtagtgg aaaaaaaaat aggggatgtt 960 atattagatg atgagaatga aaatgatagt gatataggtg aagatttggt agattttata 1020 gtaaatgata atgattattt aatataggta gaaatagaga tagtatatgt gttgtttatt 1080 gtataggaag taaaataata tagagatgta gtataggttt taaaatgaaa gtatttggta 1140 gtttatttag tgatattagt ggatgtgtag ataataatat tagttttaga ttaaaagtta 1200 tatgtataga aaaataaagt agagttgtaa aaaggagatt atttgaaagt gaagatagtg 1260 ggtatggtaa tattgaagtg gaaatttagt agatgttata ggtagaaggg tgttatgaga 1320 ttgaaatatt atgtagttag tatagtggtg gaagtggggg tggttgtagt tagtatagta 1380 gtggaagtgg gggagagggt gttagtgaaa gatatattat atgttaaata ttatttataa 1440 atattttaaa tgtattaaaa attagtaatg taaaggtagt aatgttagta aaatttaaag 1500 agttatatgg ggtgagtttt ttagaattag taagattatt taaaagtaat aaattaatgt 1560 gttgtgattg gtgtattgtt gtatttggat ttatatttag tatagttgat agtataaaaa 1620 tattattata ataatattgt ttatatttat atatttaaag tttagtatgt ttatggggaa 1680 tggttgtgtt attattagta agatataaat gtggaaaaaa tagagaaata attgaaaaat 1740 tgttgtttaa attattatgt gtgtttttaa tgtgtatgat gatagagttt ttaaaattgt 1800 gtagtatagt agtagtatta tattggtata aaataggtat attaaatatt agtgaagtgt 1860 atggagatat gttagaatgg atataaagat aaatagtatt ataatatagt tttaatgatt 1920 gtatatttga attattatag atggtataat gggtttatga taatgatata gtagatgata 1980 gtgaaattgt atataaatat gtataattgg tagatattaa tagtaatgta agtgtttttt 2040 taaaaagtaa tttataggta aaaattgtaa aggattgtgt aataatgtgt agatattata 2100 aatgagtaga aaaaaaataa atgagtatga gttaatggat aaaatataga tgtgataggg 2160 tagatgatgg aggtgattgg aagtaaattg ttatgttttt aaggtattaa ggtgtagagt 2220 ttatgttatt tttaattgta ttaaaaagat ttttgtaagg tatatttaaa aaaaattgta 2280 tattattata tggtgtagtt aatataggta aattattatt tggtatgagt ttaatgaaat 2340 ttttgtaagg gtttgtaata tgttttgtaa attttaaaag ttatttttgg ttataattat 2400 tagtagatgt taaaataggt atgttagatg atgttatagt gttttgttgg aattatatag 2460 atgataattt aagaaatgta ttggatggaa atttagtttt tatggatgta aagtatagat 2520 tattggtata attaaaatgt tttttattat taattatatt taatattaat gttggtatag 2580 attttaggtg gttttattta tataatagat tggtggtgtt tatatttttt aatgagtttt 2640 tatttgatga aaatggaaat ttagtgtatg agtttaatga taagaattgg aaattttttt 2700 ttttaaggat gtggtttaga ttaagtttgt atgaggatga ggataaggaa aatgatggag 2760 attttttgtt aatgtttaaa tgtgtgttag gataaaatat taatatatta tgaaaatgat 2820 agtatagatt tatgtgatta tatagattat tggaaatata tgtgtttaga atgtgttatt 2880 tattataagg ttagagaaat gggatttaaa tatattaatt attaagtggt gttaatattg 2940 gttgtattaa agaataaagt attataagta attgaattgt aattaatgtt agaaataata 3000 tataatttat aatatagtaa tgaaaagtgg atattataag atgttagttt tgaagtgtat 3060 ttaattgtat taataggatg tataaaaaaa tatggatata tagtggaagt gtagtttgat 3120 ggagatatat gtaatataat gtattatata aattggatat atatatatat ttgtgaagaa 3180 gtattagtaa ttgtggtaga gggttaagtt gattattatg gtttatatta tgtttatgaa 3240 ggaatatgaa tatattttgt gtagtttaaa gatgatgtag aaaaatatag taaaaataaa 3300 gtatgggaag tttatgtggg tggttaggta atattatgtt ttatatttgt gtttagtagt 3360 aatgaagtat ttttttttga aattattagg tagtatttgg ttaattattt tgttgtgatt 3420 tatattaaag ttgttgtttt gggtattgaa gaaatataga tgattattta gtgattaaga 3480 ttagagttag atattggaaa tttttgttat attattaagt tgttgtatag agatttagtg 3540 gatagtgttt taatttttat tgtatttaat agtttatata aaggatggat taattgtaat 3600 agtaatatta tatttatagt atatttaaaa ggtgatgtta atattttaaa atgtttaaga 3660 tatagattta aaaagtattg tatattgtat attgtagtgt tgtttatatg gtattggata 3720 ggatataatg taaaatataa aagtgtaatt gttatattta tatatgatag tgaatggtaa 3780 tgtgattaat ttttgtttta agttaaaata ttaaaaatta ttatagtgtt tattggattt 3840 atgtttatat gataaatttt gatattgtat ttataatatt attggtgtgt tttttgtttt 3900 gttttgtgtg tttttgtgtg tttgtttatt aatatgtttg ttgtttttgt ttgtgtttat 3960 atatatatta ttaataatat tggtattatt attgtggata atagtagttt ttgtgtttag 4020 gtgttttatt gtatatatta tatttgttta tatattatta tttttaatat atatatatgt 4080 atgtttttta attatataat gtatatgtat ataatgtaat tgttatatat aattgttgta 4140 tattataatt tattattttt ttttttttat ttttatatat aatttttttt tttgtttgtt 4200 tgtttgtttt ttaataaatt gttattattt aataatgtga tataaatgtt ttgtaaaatg 4260 tataaaatgt gtattggtta tttaatttta taaaatatgt aaataggtag gtatatgttt 4320 atttgatatt atatttaagg ttgaaggtaa aattattgtt gaataaatat tataatatgg 4380 aagtatgggt gtattttttg gtgggttagg aattggaata gggttgggta taggtggatg 4440 tattgggtat attttattgg gaataaggtt ttttatagtt atagatatat ttgtttttgt 4500 aagatttttt ttaatagtag attttgtggg tttttttgat ttttttatag tttttttagt 4560 ggaagaaatt agttttattg atgttggtgt attaatattt gtatttttta tttttttaga 4620 tgtattagga tttagtatta ttattttaat tgatattata tttgttatat tagatattaa 4680 taatattgtt attattgtta ttatatataa taattttatt tttattgatt tatttgtatt 4740 gtagttttta atatttgtag aaattggagg gtattttata tttttattat ttattattag 4800 tatatataat tatgaagaaa tttttatgga tatatttatt gttagtataa attttaatat 4860 agtaattagt agtatattta tattagggtt ttgtttagtg gtatgtttag gattatatag 4920 ttgtataata taataggtta aagttgtaga ttttgttttt gtaattattt ttattaaatt 4980 tattatatat gataattttg tatatgaagg tatagatgtg gataatatat tatatttttt 5040 tagtaatgat aatagtatta atatagtttt agattttgat tttttggata tagttgtttt 5100 atataggtta gtattaattt ttaggtgtat tggtattagg tatagtagaa ttggtaataa 5160 ataaatatta tgtatttgta gtggaaaatt tataggtgtt aaggtatatt attattatga 5220 tttaagtatt attgattttg tagaagaaat agaattataa attataatat tttttatata 5280 tattattatt ttatatgtag ttttatttat ttttattaat aatggattat atgatattta 5340 tgtagatgat tttattatag atatttttat aattttggta ttatttgtat tttttatatt 5400 tttattaggt tatatttttg taaatataat aatttttttt ggtggtgtat ataatatttt 5460 tttagtatta ggttttgata tatttattaa tataattgat taagtttttt tattaatttt 5520 tatagtttta gggtttttat aatatataat tattgttgat gtaggtgatt tttatttata 5580 ttttagttat tatatgttat gaaaatgatg taaatgttta ttatattttt ttttagatgt 5640 ttttttggtt gtttagtgag gttattgttt atttgttttt tgttttagta tttaaggttg 5700 taagtatgga tgaatatgtt gtatgtataa atatatatta ttatgtagga atatttagat 5760 tatttgtagt tggatatttt tattttttta ttaaaaaatt taataataat aaaatattag 5820 tttttaaagt attaggatta taatataggg tatttagaat atatttattt gattttaata 5880 agtttggttt ttttgatatt ttattttata atttagatat atagtggttg gtttgggttt 5940 gtgtaggtgt tgaggtaggt tgtggttagt tattaggtgt gggtattagt ggttattttt 6000 tattaaataa attggatgat atagaaaatg ttagtgttta tgtagtaaat gtaggtgtgg 6060 ataatagaga atgtatattt atggattata aataaatata attgtgttta attggttgta 6120 aattatttat aggggaatat tggggtaaag gatttttatg tattaatgtt gtagtaaatt 6180 taggtgattg tttattatta gagttaataa atatagttat ttaggatggt gatatggttt 6240 atattggttt tggtgttatg gattttatta tattataggt taataaaagt gaagttttat 6300 tggatatttg tatatttatt tgtaaatatt tagattatat taaaatggtg ttagaattat 6360 atggtgatag tttatttttt tatttatgaa gggaataaat gtttgttaga tatttattta 6420 atagggttgg tattgttggt gaaaatgtat tagatgattt atatattaaa ggttttgggt 6480 ttattgtaaa tttagttagt ttaaattatt tttttatatt tagtggtttt atggttattt 6540 ttgatgttta aatatttaat aaattttatt ggttataatg agtatagggt tataataatg 6600 gtatttgttg gggtaattaa ttatttgtta ttgttgttga tattatatgt agtataaata 6660 tgttattatg tgttgttata tttattttag aaattatata taaaaatatt aattttaagg 6720 agtatttatg atatggggag gaatatgatt tatagtttat tttttaattg tgtaaaataa 6780 ttttaattgt agatgttatg atatatatat attttatgaa ttttattatt ttggaggatt 6840 ggaattttgg tttataattt tttttaggag gtatattaga agatatttat aggtttgtaa 6900 tttaggtaat tgtttgttaa aaatatatat ttttagtatt taaagaagat gattttttta 6960 aaaaatatat tttttgggaa gtaaatttaa aggaaaagtt ttttgtagat ttagattagt 7020 tttttttagg atgtaaattt ttattataag taggattgaa ggttaaatta aaatttatat 7080 taggaaaatg aaaagttata tttattattt tatttatttt tataattgtt aaatgtaaaa 7140 aatgtaagtt gtaagtattg tatgtatgtt gaattagtgt tgtttgttgt gtatatgttt 7200 gtatgtgttt gtatgtgttt gtaaatatta agttgtatgt gtgtttgtat gtatggtata 7260 ataaatatgt gtgtatgtgt ttttaaatgt ttgtgtaatt attgtgttat gtaatataaa 7320 taaatttatt gttttaatat ttattaattg tgttgtggtt atttattgta tataaattat 7380 atttgttata ttttgttttt gttttatata tattatattt tgtagtgtta ggtttatttt 7440 gtagttttaa ttgaatttgg ttgtatgttt tttggtataa aatgtgtttt tttaaatagt 7500 tttatgttag taattatggt ttaaatttgt atgttttttg tttgttatgt gtgttaaatt 7560 tttgtttttt tgatttgtat tgtttgttaa ttattttatt gttttttata ttgtattatg 7620 tgtaattatt gaattattat gtatattgtg ttatataaaa taaattatta tgtgttaatg 7680 ttttatatat tgttgttagg tatatatttt tggtttgttt taattaattt aattgtatat 7740 ttggtataag gtttaaattt ttaaggttaa ttaaatgtta ttttagttta tatatgaatt 7800 gtgtaaaggt tagttatata ttgtttattt gtaaaattgt atatgggtgt gtgtaaattg 7860 attttgggtt atatatttat aagtaattta tataataata ttaa 7904

Claims (44)

  1. 미생물 게놈 또는 핵산을 시토신을 변형시키는 시약으로 처리하여 유도체 미생물 핵산을 형성하고; 그 유도체 미생물 핵산을 증폭시켜 미생물 게놈 또는 핵산의 단순형을 형성시키는 것을 포함하는, 미생물 게놈 또는 미생물 핵산의 단순화 방법.
  2. 제1항에 있어서, 그 미생물 게놈 또는 핵산을 처리하기 전에 미생물 RNA를 DNA로 전환시키는 것을 포함하는 방법.
  3. 제1항에 있어서, 미생물 RNA를 처리하여 유도체 RNA 분자를 수득한 후에 그 유도체 RNA를 전환하여 유도체 DNA 분자를 형성하도록 하는 것을 포함하는 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 여기에서 그 미생물 게놈 또는 핵산은 파아지, 바이러스, 비로이드(viroid), 박테리아, 진균, 조류, 원생동물(protozoan), 스피로헤타(spirochaete), 또는 단세포 생물로부터 수득하는 것인 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 여기에서 그 미생물 게놈 또는 핵산은 단백질 암호화 핵산, 비-단백질 암호화 핵산, 원핵생물 또는 단세포 진핵 미생물의 리보솜 유전자 부위로부터 선택되는 것인 방법.
  6. 제5항에 있어서, 여기에서 리보솜 유전자 부위는 원핵생물에서 16S 또는 23S이고, 단세포 진핵 미생물에서 18S 또는 28S인 것인 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 여기에서 그 시약은 비메틸화된 시토신을 변형시키는 것인 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 여기에서 그 시약은 중아황산염(bisulfite), 아세트산염(acetate) 또는 구연산염(citrate)로부터 선택되는 것인 방법.
  9. 제8항에 있어서, 여기에서 그 시약은 산성아황산나트륨(sodium bisulfite)인 것인 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 여기에서 그 시약은 상보적인 이중 나선의 미생물 게놈 DNA의 각 가닥에서 시토신을 우라실로 변형시켜 두 개의 유도체, 그러나 비-상보적인 미생물 핵산 분자를 형성하는 것인 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 여기에서 그 유도체 미생물 핵 산은 그 대응하는 비처리된 미생물 게놈 또는 핵산과 비교하여 감소된 총 수의 시토신을 갖는 것인 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 여기에서 그 미생물 게놈 또는 핵산의 단순형은 그 대응하는 비처리된 미생물 게놈 또는 핵산에 비교하여 감소된 총 수의 시토신을 갖는 것인 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 여기에서 그 유도체 미생물 핵산은 실질적으로 아데닌(A), 구아닌(G), 티민(T) 및 우라실(U) 염기를 함유하고 실질적으로 그 대응하는 비처리된 미생물 게놈 또는 핵산과 동일한 총 수의 염기를 갖는 것인 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 여기에서 그 미생물 게놈 또는 핵산의 단순형은 실질적으로 아데닌(A), 구아닌(G) 및 티민(T) 염기를 함유하는 것인 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 여기에서 증폭은 PCR(polymerase chain reaction), 등온 증폭 또는 시그널 증폭과 같은 임의의 적절한 수단에 의해 수행되는 것인 방법.
  16. 미생물 유래 DNA를 함유하는 샘플을 시토신을 변형시키는 시약으로 처리하여 유도체 미생물 핵산을 형성하고; 그 유도체 미생물 핵산의 적어도 일부분을 증폭시켜 그 대응하는 비처리된 미생물 핵산과 비교하여 감소된 총 수의 시토신을 갖는 단순화된 핵산 분자를 형성하는 것을 포함하는, 미생물-특이적 핵산 분자의 생산 방법으로서,
    여기에서 그 단순화된 핵산 분자는 미생물 또는 미생물 타입에 특이적인 핵산 서열을 포함하는 것인 방법.
  17. 제16항에 있어서, 여기에서 그 미생물은 파아지, 바이러스, 비로이드, 박테리아, 진균, 조류, 원생동물, 스피로헤타 또는 단세포 생물로부터 선택되는 것인 방법.
  18. 제16항 또는 제17항에 있어서, 여기에서 그 미생물 게놈 또는 핵산은 단백질 암호화 핵산, 비-단백질 암호화 핵산, 원핵생물 또는 단세포 진핵 미생물의 리보솜 유전자 부위로부터 선택되는 것인 방법.
  19. 제18항에 있어서, 여기에서 그 리보솜 유전자 부위는 원핵생물에서 16S 또는 23S이고, 단세포 진핵 미생물에서 18S 또는 28S인 것인 방법.
  20. 제16항 내지 제19항 중 어느 한 항에 있어서, 여기에서 그 시약은 비메틸화 된 시토신을 변형시키는 것인 방법.
  21. 제16항 내지 제20항 중 어느 한 항에 있어서, 여기에서 그 시약은 중아황산염(bisulfite), 아세트산염(acetate) 또는 구연산염(citrate)로부터 선택되는 것인 방법.
  22. 제21항에 있어서, 여기에서 그 시약은 산성아황산나트륨(sodium bisulfite)인 것인 방법.
  23. 제16항 내지 제22항 중 어느 한 항에 있어서, 여기에서 증폭은 PCR(polymerase chain reaction), 등온 증폭 또는 시그널 증폭과 같은 임의의 적절한 수단에 의해 수행되는 것인 방법.
  24. 제16항 내지 제23항 중 어느 한 항에 있어서, 미생물-특이적 핵산 분자를 검출하는 것을 더 포함하는 것인 방법.
  25. 제24항에 있어서, 여기에서 그 미생물-특이적 핵산 분자는 다음에 의해 검출되는 것인 방법:
    미생물-특이적 핵산 분자의 표적 부위에 결합할 수 있는 검출자 리간드를 제공하고 그 검출자 리간드가 표적 부위에 결합하도록 충분한 시간을 주고; 그 검출 자 리간드가 표적 부위에 결합하였는지를 측정하여 미생물-특이적 핵산 분자의 존재를 검출하는 것인 방법.
  26. 제24항에 있어서, 여기에서 그 미생물-특이적 핵산 분자는 증폭산물을 분리하고 그 분리된 산물을 가시화함으로써 검출되는 것인 방법.
  27. 제26항에 있어서, 여기에서 그 증폭 산물은 전기영동에 의해 분리되고 겔 상에서 하나 이상의 밴드를 가시화함으로써 검출되는 것인 방법.
  28. 제16항 내지 제27항 중 어느 한 항에 있어서, 여기에서 그 단순화된 핵산 분자는 실질적으로 시토신을 갖고 있지 않는 것인 방법.
  29. 제28항에 있어서, 여기에서 그 미생물-특이적 핵산 분자는 미생물에서 자연적으로 발생하지 않는 것인 방법.
  30. 제16항 내지 제29항 중 어느 한 항에 있어서, 여기에서 그 미생물-특이적 핵산 분자는 미생물 분류 기준을 지시하는 핵산 서열을 갖고 있는 것인 방법.
  31. 제30항에 있어서, 그 미생물 분류 기준은 과(family), 속(genus), 종(species), 균주(strain), 타입 또는 동일 또는 다른 지리학적 또는 해저 집단과 는 다른 집단을 포함하는 것인 방법.
  32. 미생물로부터 DNA 서열을 획득하고;
    각 시토신을 티민으로 변화시켜 그 미생물 DNA 서열의 전환을 수행하여 그 미생물 DNA 서열의 단순형을 형성하고 그 미생물 DNA의 단순형은 실질적으로 아데닌, 구아닌 및 티민 염기를 포함하고;
    그 미생물 DNA의 단순형으로부터 미생물-특이적 핵산 분자를 선별하는 것을 포함하는, 미생물-특이적 핵산 분자의 생산방법.
  33. 제32항에 있어서, 여기에서 그 전환은 인실리코(in silico)로 수행되는 것인 방법.
  34. 제32항 또는 제33항에 있어서, 여기에서 두 개 이상의 미생물 DNA 서열의 단순형을 수득하고 두 개 이상의 서열을 적어도 하나의 미생물-특이적 핵산 분자를 획득하기 위해 비교하는 것인 방법.
  35. 제32항 내지 제34항 중 어느 한 항의 방법에 의해 수득된 미생물-특이적 핵산 분자.
  36. 테스트 또는 분석에 있어서 미생물-특이적 핵산 분자에 결합하거나 증폭시키 는 탐침 또는 프라이머를 수득하기 위한 제32항 내지 제34항 중 어느 한 항의 방법의 용도.
  37. 미생물을 함유할 것으로 예상되는 샘플로부터 미생물 DNA를 수득하고;
    그 미생물 핵산을 시토신을 변형시키는 시약으로 처리하여 유도체 미생물 핵산을 형성하고;
    목적 미생물-특이적 핵산 분자가 유도체 미생물 핵산이 되도록 증폭시킬 수 있는 프라이머를 제공하고;
    그 유도체 미생물 핵산 상에서 증폭 반응을 수행하여 단순화된 핵산을 형성하고;
    그 목적 미생물-특이적 핵산 분자를 함유하는 증폭된 핵산 산물의 존재를 분석하는 것을 포함하는, 샘플에서 미생물 존재의 검출 방법으로서,
    여기에서 그 목적 미생물-특이적 핵산 분자의 검출은 샘플에서 그 미생물이 존재하는 것을 나타내는 것인 방법.
  38. 제37항에 있어서, 여기에서 그 미생물은 파아지, 바이러스, 비로이드, 박테리아, 진균, 조류, 원생동물, 스피로헤타 또는 단세포 생물로부터 선택되는 것인 방법.
  39. 제37항 또는 제38항에 있어서, 여기에서 그 시약은 비메틸화된 시토신을 변 형시키는 것인 방법.
  40. 제37항 내지 제39항 중 어느 한 항에 있어서, 여기에서 그 시약은 중아황산염, 아세트산염 또는 구연산염으로부터 선택되는 것인 방법.
  41. 제40항에 있어서, 여기에서 그 시약은 산성아황산나트륨인 것인 방법.
  42. 제37항 내지 제41항 중 어느 한 항에 있어서, 여기에서 증폭은 PCR(polymerase chain reaction), 등온 증폭 또는 시그널 증폭과 같은 임의의 적절한 수단에 의해 수행되는 것인 방법.
  43. 제37항 내지 제42항 중 어느 한 항에 있어서, 여기에서 그 핵산 분자는 다음에 의해 검출되는 것인 방법:
    핵산 분자의 부위에 결합할 수 있는 검출자 리간드를 제공하고 그 검출자 리간드가 그 부위에 결합하도록 충분한 시간을 주고; 그 검출자 리간드가 핵산 분자에 결합하였는지를 측정하여 핵산 분자의 존재를 검출하는 것인 방법.
  44. 제37항 내지 제43항 중 어느 한 항에 있어서, 여기에서 그 핵산 분자는 증폭 산물을 분리하고 그 분리된 산물을 가시화함으로써 검출되는 것인 방법.
KR1020077015306A 2004-12-03 2005-12-05 시토신의 화학적 변형에 의한 미생물 핵산의 단순화 방법 KR101293713B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AU2004906915 2004-12-03
AU2004906915A AU2004906915A0 (en) 2004-12-03 Detection of Microorganisms
PCT/AU2005/001840 WO2006058393A1 (en) 2004-12-03 2005-12-05 Methods for simplifying microbial nucleic acids by chemical modification of cytosines

Publications (2)

Publication Number Publication Date
KR20070090230A true KR20070090230A (ko) 2007-09-05
KR101293713B1 KR101293713B1 (ko) 2013-08-12

Family

ID=36564695

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077015306A KR101293713B1 (ko) 2004-12-03 2005-12-05 시토신의 화학적 변형에 의한 미생물 핵산의 단순화 방법

Country Status (14)

Country Link
US (2) US7833942B2 (ko)
EP (1) EP1828411B1 (ko)
JP (1) JP5116481B2 (ko)
KR (1) KR101293713B1 (ko)
CN (1) CN101111606B (ko)
BR (1) BRPI0517131B1 (ko)
CA (1) CA2589668C (ko)
DK (1) DK1828411T3 (ko)
ES (1) ES2399054T3 (ko)
IL (1) IL183622A0 (ko)
MX (1) MX2007006610A (ko)
NZ (1) NZ555620A (ko)
WO (1) WO2006058393A1 (ko)
ZA (1) ZA200706142B (ko)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602004028478D1 (de) 2003-06-17 2010-09-16 Human Genetic Signatures Pty Verfahren zur genomamplifikation
EP1668148B1 (en) 2003-09-04 2008-12-31 Human Genetic Signatures PTY Ltd. Nucleic acid detection assay
US8168777B2 (en) 2004-04-29 2012-05-01 Human Genetic Signatures Pty. Ltd. Bisulphite reagent treatment of nucleic acid
CA2580145C (en) 2004-09-10 2014-10-28 Human Genetic Signatures Pty Ltd Amplification blocker comprising intercalating nucleic acids (ina) containing intercalating pseudonucleotides (ipn)
KR101293713B1 (ko) * 2004-12-03 2013-08-12 휴먼 제네틱 시그너처스 피티와이 엘티디 시토신의 화학적 변형에 의한 미생물 핵산의 단순화 방법
CN101203618B (zh) * 2005-05-26 2013-03-13 人类遗传标记控股有限公司 使用含有非常规碱基的引物的等温链置换扩增
US8343738B2 (en) * 2005-09-14 2013-01-01 Human Genetic Signatures Pty. Ltd. Assay for screening for potential cervical cancer
US20080050738A1 (en) * 2006-05-31 2008-02-28 Human Genetic Signatures Pty Ltd. Detection of target nucleic acid
CA2654010A1 (en) * 2006-06-02 2007-12-13 Human Genetic Signatures Pty Ltd Modified microbial nucleic acid for use in detection and analysis of microorganisms
CA2680426A1 (en) * 2007-03-16 2008-09-25 Human Genetic Signatures Pty Ltd Assay for gene expression
US7888075B2 (en) 2007-07-31 2011-02-15 Quest Diagnostics Investments Incorporated Detection of methicillin-resistant and methicillin-sensitive Staphylococcus aureus in biological samples
CN101918595A (zh) * 2007-11-27 2010-12-15 人类遗传标记控股有限公司 用于扩增和复制亚硫酸氢盐修饰的核酸的酶
AU2008331435B2 (en) * 2007-12-05 2013-01-10 Human Genetic Signatures Pty Ltd Bisulphite treatment of RNA
AU2008341021A1 (en) * 2007-12-20 2009-07-02 Human Genetic Signatures Pty Ltd Elimination of contaminants associated with nucleic acid amplification
CA2719795A1 (en) * 2008-03-27 2009-10-01 Greene, Tweed Of Delaware, Inc. Inert substrate-bonded fluoroelastomer components and related methods
FR2940805B1 (fr) * 2009-01-05 2015-10-16 Biomerieux Sa Procede d'amplification et/ou de detection d'acides nucleiques, kits et utilisations de ce procede
ES2613743T3 (es) 2011-09-07 2017-05-25 Human Genetic Signatures Pty Ltd Ensayo de detección molecular
CN107849603B (zh) * 2015-04-24 2022-01-28 阿提拉生物系统公司 利用有限核苷酸组成的引物扩增
EP3665297A4 (en) 2017-08-11 2021-05-12 Atila Biosystems Incorporated DIGITAL AMPLIFICATION WITH LIMITED NUCLEOTIDIC COMPOSITION PRIMERS

Family Cites Families (98)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US692918A (en) * 1901-07-12 1902-02-11 Charles Sands Can-opener.
US5750338A (en) 1986-10-23 1998-05-12 Amoco Corporation Target and background capture methods with amplification for affinity assays
US5585481A (en) 1987-09-21 1996-12-17 Gen-Probe Incorporated Linking reagents for nucleotide probes
US5175273A (en) * 1988-07-01 1992-12-29 Genentech, Inc. Nucleic acid intercalating agents
AU7579991A (en) * 1990-02-20 1991-09-18 Gilead Sciences, Inc. Pseudonucleosides and pseudonucleotides and their polymers
ES2128323T3 (es) * 1990-07-24 1999-05-16 Hoffmann La Roche Reduccion de la amplificacion no-especifica durante la amplificacion in vitro del acido nucleico empleando bases de acido nucleico modificadas.
US5124327A (en) * 1991-09-06 1992-06-23 Merck & Co., Inc. HIV reverse transcriptase
DE69327454T2 (de) 1992-10-09 2000-05-11 Vysis Inc Analytisches verfahren
US5473060A (en) 1993-07-02 1995-12-05 Lynx Therapeutics, Inc. Oligonucleotide clamps having diagnostic applications
US6156501A (en) 1993-10-26 2000-12-05 Affymetrix, Inc. Arrays of modified nucleic acid probes and methods of use
CA2182517C (en) 1994-02-07 2001-08-21 Theo Nikiforov Ligase/polymerase-mediated primer extension of single nucleotide polymorphisms and its use in genetic analysis
SE9400522D0 (sv) 1994-02-16 1994-02-16 Ulf Landegren Method and reagent for detecting specific nucleotide sequences
US5658744A (en) * 1994-07-22 1997-08-19 The United States Of America As Represented By The Department Of Health And Human Services Methods of identifying patients having an altered immune status
FR2737223B1 (fr) 1995-07-24 1997-09-12 Bio Merieux Procede d'amplification de sequences d'acide nucleique par deplacement, a l'aide d'amorces chimeres
US5994066A (en) 1995-09-11 1999-11-30 Infectio Diagnostic, Inc. Species-specific and universal DNA probes and amplification primers to rapidly detect and identify common bacterial pathogens and associated antibiotic resistance genes from clinical specimens for routine diagnosis in microbiology laboratories
DE19612684A1 (de) 1996-03-29 1997-10-02 Gsf Forschungszentrum Umwelt Neue Verwendung extrem thermophiler DNA-Polymerasen
SE9601676D0 (sv) 1996-04-30 1996-04-30 Ulf Landegren Improved probing of specific mucleic acids
AU730633B2 (en) 1996-05-29 2001-03-08 Phillip Belgrader Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions
US5786146A (en) 1996-06-03 1998-07-28 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
US6017704A (en) 1996-06-03 2000-01-25 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
ES2195196T3 (es) 1996-12-30 2003-12-01 Univ Johns Hopkins Med Determinacion de la propensidad de un organo o un tejido al cancer por determinacion de su patron de impresion.
GB9717061D0 (en) 1997-08-13 1997-10-15 Tepnel Medical Ltd Amplification of nucleic acids
DE04020014T1 (de) 1997-09-12 2006-01-26 Exiqon A/S Bi-zyklische - Nukleosid,Nnukleotid und Oligonukleotid-Analoga
DE19754482A1 (de) * 1997-11-27 1999-07-01 Epigenomics Gmbh Verfahren zur Herstellung komplexer DNA-Methylierungs-Fingerabdrücke
GB9806253D0 (en) 1998-03-25 1998-05-20 Tepnel Medical Ltd Amplification of nucleic acids
DE19905082C1 (de) 1999-01-29 2000-05-18 Epigenomics Gmbh Verfahren zur Identifikation von Cytosin-Methylierungsmustern in genomischen DNA-Proben
US6410231B1 (en) 1999-02-26 2002-06-25 Incyte Genomics, Inc. SNP detection
US6951722B2 (en) 1999-03-19 2005-10-04 Takara Bio Inc. Method for amplifying nucleic acid sequence
US6331393B1 (en) 1999-05-14 2001-12-18 University Of Southern California Process for high-throughput DNA methylation analysis
US6420106B1 (en) * 1999-06-09 2002-07-16 Quantovir Ab Method and kit for early cancer prediction
DE19935749C2 (de) 1999-07-28 2003-06-26 Epigenomics Ag Verfahren zur Chrakterisierung von Nukleinsäurefragmenten
US6692918B2 (en) 1999-09-13 2004-02-17 Nugen Technologies, Inc. Methods and compositions for linear isothermal amplification of polynucleotide sequences
AU776421B2 (en) 1999-11-12 2004-09-09 Epigenomics Ag Method for the controlled implementation of complex PCR amplifications
DE19957827C2 (de) 1999-11-25 2003-06-12 Epigenomics Ag Verwendung eines Oligomer-Arrays mit PNA- und/oder DNA-Oligomeren auf einer Oberfläche
DE19959691A1 (de) 1999-12-06 2001-08-16 Epigenomics Ag Verfahren zur parallelen Detektions des Methylierungszustandes von genomischer DNA
EP1130113A1 (en) 2000-02-15 2001-09-05 Johannes Petrus Schouten Multiplex ligation dependent amplification assay
DE10010281B4 (de) 2000-02-25 2005-03-10 Epigenomics Ag Ligase/Polymerase-Verfahren zur Detektion von Cytosin-Methylierung in DNA Proben
WO2001064864A2 (en) * 2000-02-28 2001-09-07 Maxygen, Inc. Single-stranded nucleic acid template-mediated recombination and nucleic acid fragment isolation
EP1360319A2 (en) 2000-04-06 2003-11-12 Epigenomics AG Diagnosis of diseases associated with metabolism
US6521411B2 (en) * 2000-09-28 2003-02-18 Transgenomic, Inc. Method and system for the preparation of cDNA
IE20000887A1 (en) 2000-11-03 2002-12-11 Univ College Cork Nat Univ Ie Method for the amplification and optional characterisation of nucleic acids
AUPR142500A0 (en) 2000-11-13 2000-12-07 Human Genetic Signatures Pty Ltd A peptide nucleic acid-based assay for the detection of specific nucleic acid sequences
DE10061348C2 (de) 2000-12-06 2002-10-24 Epigenomics Ag Verfahren zur Quantifizierung von Cytosin-Methylierungen in komplex amplifizierter genomischer DNA
US20020142397A1 (en) 2000-12-22 2002-10-03 Philippe Collas Methods for altering cell fate
CN1500144A (zh) 2001-02-06 2004-05-26 �����﹤����ʽ���� 扩增的核酸及其固定化制品
WO2003048732A2 (en) 2001-02-07 2003-06-12 Illumina, Inc. Multiplexed methylation detection methods
DE10112515B4 (de) 2001-03-09 2004-02-12 Epigenomics Ag Verfahren zum Nachweis von Cytosin-Methylierungsmustern mit hoher Sensitivität
GB0113118D0 (en) 2001-05-31 2001-07-18 Intercytex Ltd Stem Cells
AU2002318253A1 (en) 2001-07-15 2003-03-03 Keck Graduate Institute Methylation analysis using nicking agents
KR20040028991A (ko) 2001-08-20 2004-04-03 다카라 바이오 가부시키가이샤 핵산 증폭 방법
EP1319718A1 (en) 2001-12-14 2003-06-18 Keygene N.V. High throughput analysis and detection of multiple target sequences
WO2003052133A2 (en) 2001-12-18 2003-06-26 Human Genetic Signatures Pty Ltd Oligonucleotide analogues comprising intercalator pseudonucleotides
US20060014144A1 (en) 2001-12-18 2006-01-19 Christensen Ulf B Pseudonucleotide comprising an intercalator
US7932070B2 (en) 2001-12-21 2011-04-26 Agilent Technologies, Inc. High fidelity DNA polymerase compositions and uses therefor
US6960436B2 (en) 2002-02-06 2005-11-01 Epigenomics Ag Quantitative methylation detection in DNA samples
FR2841116B1 (fr) * 2002-06-19 2004-11-26 Seb Sa Cafetiere du type expresso a reservoir d'eau amovible
IE20020544A1 (en) * 2002-06-28 2003-12-31 Univ College Cork Nat Univ Ie Method for the characterisation of nucleic acid molecules
DE10236406C1 (de) * 2002-08-02 2003-12-24 Epigenomics Ag Verfahren zur Amplifikation von Nukleinsäuren mit geringer Komplexität
SE0202867D0 (sv) 2002-09-27 2002-09-27 Pyrosequencing Ab New sequencing method
AU2002951899A0 (en) 2002-10-04 2002-10-24 Macquarie University Random drift mutagenesis
AU2003900368A0 (en) 2003-01-24 2003-02-13 Human Genetic Signatures Pty Ltd Assay for nucleic acid molecules
ES2294462T5 (es) 2003-01-29 2015-05-06 Epigenomics Ag Método mejorado para el tratamiento de bisulfito
EP1443052A1 (en) 2003-01-29 2004-08-04 Roche Diagnostics GmbH Improved method for bisulfite treatment of nucleic acid
US20040203004A1 (en) 2003-04-10 2004-10-14 Bernard Hans Ulrich Diagnostic apparatus and method
AU2003901834A0 (en) 2003-04-17 2003-05-01 Clearcoll Pty Ltd Cross-linked polysaccharide compositions
US7288373B2 (en) 2003-05-02 2007-10-30 Human Genetic Signatures Pty Ltd. Treatment of methylated nucleic acid
DE602004028478D1 (de) 2003-06-17 2010-09-16 Human Genetic Signatures Pty Verfahren zur genomamplifikation
DE10331107B3 (de) 2003-07-04 2004-12-02 Epigenomics Ag Verfahren zum Nachweis von Cytosin-Methylierungen in DNA mittels Cytidin-Deaminasen
US7368239B2 (en) 2003-08-29 2008-05-06 Applera Corporation Method and materials for polyamine catalyzed bisulfite conversion of cytosine to uracil
EP1668148B1 (en) 2003-09-04 2008-12-31 Human Genetic Signatures PTY Ltd. Nucleic acid detection assay
WO2005030041A2 (en) * 2003-09-25 2005-04-07 Third Wave Technologies, Inc. Detection of hpv
EP2145956B1 (en) 2003-11-03 2015-06-17 Medical Research Council Polymerase
EP1692315A1 (en) 2003-12-02 2006-08-23 Roche Diagnostics GmbH Improved method for bisulfite treatment
KR100968901B1 (ko) 2003-12-10 2010-07-14 다카라 바이오 가부시키가이샤 핵산의 증폭방법
US20050136417A1 (en) * 2003-12-19 2005-06-23 Affymetrix, Inc. Amplification of nucleic acids
US20050196792A1 (en) * 2004-02-13 2005-09-08 Affymetrix, Inc. Analysis of methylation status using nucleic acid arrays
WO2006028496A2 (en) * 2004-02-20 2006-03-16 Applera Corporation Lesion repair polymerase compositions
US8440404B2 (en) 2004-03-08 2013-05-14 Rubicon Genomics Methods and compositions for generating and amplifying DNA libraries for sensitive detection and analysis of DNA methylation
US8168777B2 (en) 2004-04-29 2012-05-01 Human Genetic Signatures Pty. Ltd. Bisulphite reagent treatment of nucleic acid
US7361465B2 (en) 2004-09-07 2008-04-22 Applera Corporation Methods and compositions for tailing and amplifying RNA
CA2580145C (en) 2004-09-10 2014-10-28 Human Genetic Signatures Pty Ltd Amplification blocker comprising intercalating nucleic acids (ina) containing intercalating pseudonucleotides (ipn)
KR101293713B1 (ko) 2004-12-03 2013-08-12 휴먼 제네틱 시그너처스 피티와이 엘티디 시토신의 화학적 변형에 의한 미생물 핵산의 단순화 방법
AU2005318874B2 (en) 2004-12-23 2007-05-03 Human Genetic Signatures Pty Ltd Detection of human papilloma virus
WO2006113770A1 (en) 2005-04-15 2006-10-26 Epigenomics Ag A method for providing dna fragments derived from a remote sample
KR101708544B1 (ko) 2005-04-15 2017-02-20 에피제노믹스 아게 세포 증식 질환을 분석하기 위한 방법 및 핵산
CN101203618B (zh) * 2005-05-26 2013-03-13 人类遗传标记控股有限公司 使用含有非常规碱基的引物的等温链置换扩增
US20070020639A1 (en) 2005-07-20 2007-01-25 Affymetrix, Inc. Isothermal locus specific amplification
US8343738B2 (en) 2005-09-14 2013-01-01 Human Genetic Signatures Pty. Ltd. Assay for screening for potential cervical cancer
ES2546848T3 (es) 2006-03-10 2015-09-29 Epigenomics Ag Un método para identificar una muestra biológica para el análisis de la metilación
WO2007106802A2 (en) 2006-03-14 2007-09-20 Siemens Healthcare Diagnostics Inc. Method for linear amplification of bisulfite converted dna
US20080050738A1 (en) 2006-05-31 2008-02-28 Human Genetic Signatures Pty Ltd. Detection of target nucleic acid
WO2008109945A1 (en) 2007-03-12 2008-09-18 Human Genetic Signatures Pty Ltd Analysis of ribonucleic acid
CA2680426A1 (en) 2007-03-16 2008-09-25 Human Genetic Signatures Pty Ltd Assay for gene expression
WO2008135512A2 (en) 2007-05-02 2008-11-13 Jerzy Paszkowski Dna amplification method
CN101918595A (zh) * 2007-11-27 2010-12-15 人类遗传标记控股有限公司 用于扩增和复制亚硫酸氢盐修饰的核酸的酶
AU2008331435B2 (en) * 2007-12-05 2013-01-10 Human Genetic Signatures Pty Ltd Bisulphite treatment of RNA
AU2008341021A1 (en) 2007-12-20 2009-07-02 Human Genetic Signatures Pty Ltd Elimination of contaminants associated with nucleic acid amplification
WO2010083561A1 (en) * 2009-01-21 2010-07-29 Human Genetic Signatures Pty Ltd Improved isothermal strand displacement amplification

Also Published As

Publication number Publication date
JP5116481B2 (ja) 2013-01-09
CA2589668A1 (en) 2006-06-08
IL183622A0 (en) 2007-09-20
WO2006058393A1 (en) 2006-06-08
JP2008521413A (ja) 2008-06-26
US20090042732A1 (en) 2009-02-12
KR101293713B1 (ko) 2013-08-12
US8598088B2 (en) 2013-12-03
CA2589668C (en) 2014-09-02
BRPI0517131A2 (pt) 2008-12-30
CN101111606A (zh) 2008-01-23
US20110136098A1 (en) 2011-06-09
MX2007006610A (es) 2007-12-12
EP1828411A1 (en) 2007-09-05
EP1828411A4 (en) 2009-04-15
BRPI0517131B1 (pt) 2021-08-31
ZA200706142B (en) 2009-08-26
DK1828411T3 (da) 2013-02-18
NZ555620A (en) 2008-08-29
ES2399054T3 (es) 2013-03-25
US7833942B2 (en) 2010-11-16
CN101111606B (zh) 2012-05-16
EP1828411B1 (en) 2012-11-07

Similar Documents

Publication Publication Date Title
KR101293713B1 (ko) 시토신의 화학적 변형에 의한 미생물 핵산의 단순화 방법
JP2009538603A (ja) 微生物の検出および分析に使用するための微生物改変核酸
EP2419527B1 (en) Method for the detection and characterization of a toxinogenic clostridium difficile strain
EP2351857B1 (en) Compositions and methods for detecting pathogen specific nucleic acids in urine
WO2015038634A2 (en) Multiplex diagnostic assay for lyme disease and other tick-borne diseases
WO2010062897A1 (en) Methods and compositions to detect clostridium difficile
JP4241929B2 (ja) Mycobacterium Kansasiiを検出するための組成物および方法
JP5210634B2 (ja) スペーサー領域を使用するセラチア(Serratia)種の検出、同定および鑑別
Bricker Characterization of the three ribosomal RNA operons rrnA, rrnB, and rrnC, from Brucella melitensis
JP3449961B2 (ja) マルチプライマーpcr法による病原生物検出法
JP2003219878A (ja) レジオネラ属菌検出のためのプライマーおよびそれを用いた検出法
JP2006061134A (ja) 結核菌検出のためのプライマーおよび検出同定法
AU2005312354B2 (en) Methods for simplifying microbial nucleic acids by chemical modification of cytosines
JP4531317B2 (ja) スピロヘータを検出するための一本鎖オリゴヌクレオチド、プローブ、プライマーおよび方法
Ibrahim et al. Detection of Mycobacterium avium subspecies paratuberculosis using nested polymerase chain reaction (nPCR).
JPH06253847A (ja) 炭疽菌検出のためのオリゴヌクレオチドおよびそれを用いた検出方法
Chandan et al. Molecular detection of Leptospira using polymerase chain reaction based on LipL32 and rpoB gene
WO2012176004A2 (en) Diagnostic methods for detecting clostridium difficile
JP2006158220A (ja) マイコプラズマ・ニューモニエ(Mycoplasmapneumoniae)検出のためのオリゴヌクレオチドプライマー
JPH06261759A (ja) 炭疽菌検出のためのオリゴヌクレオチドおよびそれを用いた検出方法
JP2004057056A (ja) トレポネマ・デンティコラの検出方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160712

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170705

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180710

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190717

Year of fee payment: 7