KR100823857B1 - 트랜스포존 매개된 다중 서열분석 - Google Patents

트랜스포존 매개된 다중 서열분석 Download PDF

Info

Publication number
KR100823857B1
KR100823857B1 KR1020037000251A KR20037000251A KR100823857B1 KR 100823857 B1 KR100823857 B1 KR 100823857B1 KR 1020037000251 A KR1020037000251 A KR 1020037000251A KR 20037000251 A KR20037000251 A KR 20037000251A KR 100823857 B1 KR100823857 B1 KR 100823857B1
Authority
KR
South Korea
Prior art keywords
transposon
vector
pcr
dna
target dna
Prior art date
Application number
KR1020037000251A
Other languages
English (en)
Other versions
KR20030021244A (ko
Inventor
어거스트폴알
키글파멜라제이
롱헨리
위엔시스안나
콜캐서린
드레이퍼마이클
Original Assignee
아벤티스 파마슈티칼스 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아벤티스 파마슈티칼스 인크. filed Critical 아벤티스 파마슈티칼스 인크.
Publication of KR20030021244A publication Critical patent/KR20030021244A/ko
Application granted granted Critical
Publication of KR100823857B1 publication Critical patent/KR100823857B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Abstract

본 발명은 벡터에 삽입된 DNA 단편의 트랜스포존-매개된 다중 서열분석의 자동화 방법에 관한 것이다. 보다 특히, 본 발명은 트랜스포존이 벡터 서열에 삽입된 작제물을 서열분석하기 전에 스크리닝함으로써 증가된 효율을 달성하는 상기 자동화 방법에서의 증가된 효율에 관한 것이다. 이는 관심의 대상인 DNA 단편 대신에 벡터를 서열분석하는 반응을 수행하는데 있어서의 시간 및 자원의 낭비를 방지한다.
표적 DNA 서열, 트랜스포존, 스크리닝, 폴리머라제 연쇄 반응, 다중 서열분석, 자동화

Description

트랜스포존 매개된 다중 서열분석{Transposon mediated multiplex sequencing}
본 발명은 벡터에 삽입된 DNA 단편의 트랜스포존-매개된 다중 서열분석의 자동화 방법에 관한 것이다. 보다 특히, 본 발명은 트랜스포존이 벡터 서열에 삽입된 작제물을 서열분석하기 전에 스크리닝함으로써 증가된 효율을 달성하는 상기 자동화 방법에서의 증가된 효율에 관한 것이다. 이는 관심의 대상인 DNA 단편 대신에 벡터를 서열분석하는 반응을 수행하는데 있어서의 시간 및 자원의 낭비를 방지한다.
지난 10년 동안에 게놈 및 발현된 서열 태그(EST) 서열분석으로부터 획득된 상당히 풍부한 정보는 전장 cDNA 전형을 클로닝시키고자 하는 노력에 상당히 기여하였다. 사람 및 마우스로부터의 게놈 서열분석 프로젝트가 가까운 장래에 완성될 것으로 예상되더라도, 이들 종의 트랜스크립톰(transcriptome)은 꽤 오랫 동안 모호한 상태로 남아있을 것이다. 완전한 확신을 가지고 게놈 서열로부터의 mRNA의 스플라이싱 프로그램을 예측하는데 관련된 복잡성은 전장 cDNA의 서열을 수득하는데 중점을 둔 추가의 게놈 연구를 강요한다. 게다가, 전장 cDNA 서열분석 노력은, cDNA의 증폭을 수반하는 방법을 클로닝에 사용한 후에 cDNA 서열을 확인하는데 또한 필요하다. 이러한 시나리오는 약물 발견 노력에 대한 유전자 표적물을 확증하는데 중점을 둔 게놈 센터에서 특히 일반적이다. 명백하게는, 막대한 비용 및 노력이 소모된 후에, 단지 표적 유전자의 암호화 서열이 정확하지 않기 때문에 추정 표적물에 확증 과정을 수행하지 못한다는 것은 어리석은 일일 것이다. 따라서, 게놈 센터에서는 다수의 전장 클론을 신속하고, 저렴하게 및 정확하게 서열분석하는 접근법이 필요하다. 이러한 목적을 위해, 본 발명자들은 트랜스포존 촉진된 다중 서열분석(TEMS: transposon expedited multiplex sequencing)으로 불리는 신규한 통합된 고효율 공정을 디자인하였다.
지난 20년 동안, 다수의 방법이 플라스미드로의 대형 삽입물을 서열분석하기 위해 개발되었다. 그러나, 다수의 이들 방법은 성가시고, 고효율의 자동화 시스템으로 변형될 수 없었다. 프라이머 워킹(primer walking)에 의한 서열분석은 더디고, 고가이며, 프라이머가 불량하게 특정화된 부위에서 서열에 대해 디자인되기 때문에 종종 실패한다. 유사하게는, 표적 클론의 말단으로부터 엑소뉴클레아제 분해에 의한 클론의 수집물을 제조하는 방법에 의한 서열분석은 더디고, 클론 특이적이고, 주형 DNA의 순도 및 완전도에 극도로 민감하다. 또한, 이러한 접근법을 이용한 성공률은 상당히 가변적이다. 클론의 샷건(shotgun) 서열분석은 보다 고효율적인 방법이나, 이는 삽입물을 각각의 클론으로부터 분리한 다음, 다양한 방법에 의해 생성된 보다 소형 단편을 재클로닝하는 것을 필요로 한다. 또한, 제한 분해를 이용하는 샷건 라이브러리는 클로닝 바이어스(cloning bias), 및 후속적으로 DNA 서열 데이터의 비무작위 분포를 초래한다.
트랜스포존-매개된 서열분석은, 표적 DNA 서열을 함유하는 다수의 벡터를 풀링(pooling)시키고, 각각의 말단 상에 프라이머를 갖는 트랜스포존을 작제물 속에 무작위로 삽입함으로써 수행할 수 있다. 상기 방법의 설명에 대해서는 문헌[Devine, S.E., Boeke, J.E. (1994) Efficient integration of artificial transposons into plasmid targets in vitro: a useful tool for DNA mapping, sequencing and genetic analysis, Nucleic Acids Research, pp. 3765-3772; 또는 Kimmel, B., M.J. Palazzola, C. Martin, J.D. Boeke, and S.E. Devine, 1997, Transposon-mediated DNA sequencing. In Genomic Analysis: A laboratory manual(ed. E Green, B. Birren, R. Myers, and P. Hieter), Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.]을 참조한다. 통상적으로는, 이러한 방법은 플라스미드를 클로닝하고 트랜스포존-삽입 단계를 위해 상이한 숙주 균주를 통해 이동시키는 것을 필요로 하기 때문에 성가시다. 그러나, 최근에 몇몇 상업적인 분자 생물제품 판매업체가 변형된 트랜스포존(즉, Tn5 등)의 무작위 삽입의 이점을 갖는 시험관내 전위(transposition) 시스템을 개발하였다. 불행하게도, 이들 시스템 중 몇몇은 위 양성율(false positives)의 높은 배경값을 유발하며, 폴리머라제 연쇄 반응("PCR")에 의해 양성 클론을 스크리닝하는 방법과 함께 사용하는 것은 곤란하다. 본 발명자들은 상기한 트랜스포존에 의거한 서열분석 방법 중 몇가지를 이용한 바, 뉴 잉글랜드 바이오랩스(New England Biolabs)로부터의 시험관내 GPS-1 전위 시스템의 변형 버젼을 이용할 경우에 상기 어려움 중 어떠한 것도 경험하지 않았다. 그럼에도 불구하고, 트랜스포존 삽입이 관심의 대상인 표적 DNA에서만 전적으로 이루어질 수 없으며, 고빈도로 벡터 내에 나타난다. 이러한 문제점을 해결하고, 트랜스포존 촉진된 서열분석의 효율을 증가시키기 위한 노력에 있어서, 본 발명자들은 트랜스포존 촉진된 다중 서열분석(TEMS)으로 불리는 특유한 고효율 방법을 개발하였다.
따라서, 본 발명의 목적은 DNA 단편을 서열분석하기 위한 고효율의 능률적인 저렴한 방법을 제공하는 것이다.
본 발명의 추가의 목적은 생성된 비-표적 DNA 서열의 양을 최소화시키는, 표적 DNA 단편의 트랜스포존-매개된 서열분석을 위한 고효율의 능률적인 저렴한 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 표적 DNA 서열에 삽입된 트랜스포존을 함유하는 목적하는 작제물과 이외의 다른 곳에 삽입된 트랜스포존을 함유하는 목적하지 않는 작제물 사이를 판별하는 PCR-이용 스크린을 제공하는 것이다.
발명의 요약
본 발명은 추가의 편의를 위해 자동화시킬 수 있는 하기 방법을 제공함으로써 상기 목적을 충족시킨다. 각각 벡터내로 클로닝된 다중 DNA 표적 서열을 풀링시키고, 각각의 말단 상에 서열분석 프라이머를 갖는 선택가능한 트랜스포존을 DNA 표적-함유 벡터에 무작위로 삽입한다. 다음, 선택된, 트랜스포존- 및 DNA 표적-서열 함유 벡터를 PCR 반응을 이용하여 개별적으로 스크리닝시켜, DNA 표적 서열내에 위치한 트랜스포존을 갖는 벡터를 동정한다. PCR 반응은 벡터 서열의 각각의 말단에 위치한 프라이머를 사용하고, PCR 폴리머라제에 대해 벡터의 길이만큼의 산물을 효율적으로 생성시키는데 충분한 신장 시간, 하지만 PCR 폴리머라제에 대해 벡터 + 트랜스포존의 길이만큼의 산물을 효율적으로 생성시키는데 불충분한 신장 시간을 제공하도록 최적화시킨다. 따라서, 충분한 양의 PCR 산물은 단지 DNA 표적 서열내에는 트랜스포존을 함유하나 벡터내에는 트랜스포존을 함유하지 않는 벡터에 대해 생성될 것이다. 각각의 PCR 반응에 충분한 양의 PCR 산물의 존재 또는 부재는 이본쇄 DNA("dsDNA")에 대해 선택적인 정량적 형광 염료의 사용에 의해 신속하게 측정할 수 있다. 다음, 프리스크린(prescreen)에서의 상당한 PCR 산물에 의해 동정된 벡터를 트랜스포존의 각각의 말단 상에서 서열분석 프라이머를 사용하여 개별적으로 서열분석하여, 각각의 DNA 표적 서열내로 판독한다. 각각의 서열분석 반응의 미가공 DNA 표적 서열을 조합하여, 풀(pool) 내의 각각의 DNA 표적의 전체 서열을 결정할 수 있다.
클론의 병렬식 프로세싱은 반응을 셋업하고 서열분석할 수 있는 속도를 상당히 증가시킨다. 또한, 당해 방법은 임의의 특유한 벡터에 의존하지 않으며, 임의의 재클로닝 단계를 필요로 하지 않는다. 전체 효율에 대해 가장 중요한 것은 벡터 골격의 서열분석을 스크리닝 단계로 최소화시키거나 제거하는 것이다. 본 발명의 방법의 각각의 단계의 자동화는 자동화 DNA 서열분석 분야의 당업자에게 구입가능한 장치를 이용하여 용이하게 달성할 수 있다.
도 1은 TEMS의 단계의 도식이다.
도 2는 GPS-Apra 트랜스포존 벡터의 서열을 도시한다.
도 3은 GPS-Apra-2㎛-URA3 트랜스포존 벡터의 서열을 도시한다.
도 4는 트랜스포존- 및 표적-DNA-함유 벡터의 벡터 부분을 증폭시키는 다양한 폴리머라제를 사용한 PCR 반응의 산물을 도시하기 위해 염색된 전기영동 겔의 사진이다.
도 5는 약 9kb 산물을 제거하기에는 너무 큰 신장 시간을 갖는 PCR 반응의 산물을 도시하기 위해 염색된 전기영동 겔의 사진이다.
도 6은 다양한 신장 온도에서 상이한 수의 사이클을 갖는 PCR 반응의 산물을 도시하기 위해 염색된 전기영동 겔의 사진이다.
도 7은 PCR 반응의 산물을 도시하기 위해 염색된 전기영동 겔의 사진 및 동일한 PCR 반응에 대한 PICOGREENR 결과의 표이다.
정의:
본원에 사용된 바와 같이:
"벡터"는 세포내에서 복제하고, 미지의 DNA 서열을 삽입할 수 있는 삽입 부위를 갖는 임의의 DNA 작제물이다.
벡터 또는 트랜스포존과 관련하여 "선택가능한"은 벡터 또는 트랜스포존이 당해 벡터 또는 트랜스포존으로 형질전환된 세포를 동정하기 위해 사용할 수 있는 표현형을 보유함을 의미한다. 바람직하게는, 상기 표현형은 형질전환된 세포가 비형질전환된 세포는 생존할 수 없는 조건하에 생존가능하도록 한다.
"표적 DNA" 또는 "표적 DNA 서열"은 당해 방법의 운영자가 서열분석하고자 하는 기지 또는 미지의 서열의 DNA 분자이다.
"개개의 형질전환체의 대표 수"는 풀내의 각각의 표적 DNA에 대해 표적 DNA내에 트랜스포존의 삽입물을 함유하는 형질전환체가 표적 DNA 내의 각각의 염기의 원하는 수의 독립적인 서열분석 결정을 제공하기에 충분한 수로 확실히 존재할 수 있도록 하는 개개의 형질전환체의 최소 수이다.
PCR 산물과 관련하여 "dsDNA의 상당한 양"은 예정된 역치를 초과하는 dsDNA의 양이다. 예정된 역치는 벡터 서열의 내부 또는 외부에 트랜스포존을 함유하는 것으로 공지된 수가지 작제물을 사용하는 PCR 반응에서 발견되는 PCR 산물의 변이도를 평가함으로써 확인할 수 있다.
본 발명은 다중 표적 DNA를 병렬식으로 서열분석하기 위해 효율적으로 자동화시킬 수 있는 방법을 제공한다. 당해 방법에 있어서, 각각의 표적 DNA 서열을 선택가능한 벡터, 바람직하게는 플라스미드 속에 벡터 서열 내의 동일한 삽입 지점에 삽입한다. 모든 표적 DNA를 동일한 벡터에 삽입하거나, 상이한 벡터를 사용하는 경우에 한 셋트의 프라이머를 사용하여 PCR 반응에 의해 모든 벡터를 증폭시킬 수 있도록 각각의 벡터가 실질적으로 동일한 크기이고, 삽입 지점 주위에 동일한 서열을 갖는 것이 중요하다.
다중 표적 DNA 서열의 각각을 함유하는 벡터를 각각의 표적 DNA 서열의 길이를 기준으로 한 비로 풀링시켜, 풀이 실질적으로 각각의 표적 DNA 서열의 kb마다 동일한 양을 함유하도록 한다. 풀내에 포함시킬 각각의 벡터의 비는 각각의 표적 DNA 서열의 길이를 (예를 들어, 아가로스 겔 상의 표준 크기 마커에 대한 전기영동에 의해) 측정하고, 벡터내의 모든 표적 DNA 서열의 길이에서 kb마다 각각의 벡터의 설정된 양을 풀에 첨가함으로써 측정할 수 있다.
다음, 트랜스포존-삽입 반응을 풀 상에서 수행하여, 선택가능한 트랜스포존을 표적-DNA 함유 벡터에 무작위로 삽입한다. 당해 단계는 통상적인 생체내 트랜스포존 삽입에 의해 수행할 수 있더라도, 이는 플라스미드를 1 이상의 세포 유형을 통해 이동시킴을 필요로 할 수 있다. 시험관내 트랜스포존-삽입 반응은 보다 더 간단하고 신속하다. 트랜스포존은 선택가능한 마커를 보유하여야만 하고, PCR 조건이 dsDNA 단편을 벡터의 크기로 효율적으로 증폭시키나, dsDNA 단편을 벡터 + 트랜스포존의 크기로 현저하게 증폭시키지는 않게 설정되도록 하기에 충분한 크기여야만 한다. 바람직하게는, 트랜스포존은 벡터의 길이와 거의 동일하거나 이보다 길다. 가장 바람직하게는, 트랜스포존은 벡터의 길이와 동일하거나 5/4 이상이다. 특히 바람직하게는, 트랜스포존은 벡터의 길이와 동일하거나 5/3 이상이다. 벡터가 세균 플라스미드인 경우에, 트랜스포존은 바람직하게는 약 3kb 이상이고, 가장 바람직하게는 약 4kb 이상이고, 특히 바람직하게는 약 5kb 이상이다.
다음, 트랜스포존-삽입 반응으로부터의 벡터의 풀을 사용하여 세포를 형질전환시키고, 형질전환체를 트랜스포존에 대해 선택하는 조건하에 증식시킨다. 선택된 형질전환체를 분리하고, 배양물로 증식시킨다. 배양물로 증식시킨 분리된 형질전환체의 수는 풀내의 표적 DNA 서열의 수 및 크기에 따라 달라진다. 충분한 형질전환체를 분리하고 증식시켜, 각각의 표적 DNA 서열에 대해, 분리된 형질전환체가 특정 표적 DNA 서열 내에 트랜스포존의 충분한 개별적 삽입물을 포함하여, 표적 DNA 서열내의 각각 및 모든 염기의 수배의 독립적인 서열 결정을 제공할 수 있도록 하여야만 한다. 오류로부터 안전하게 하기 위해, 당업자는 종종 서열 데이터의 6배 커버리지를 획득하고자 한다. 6배 커버리지(coverage)를 획득하고자 하는 경우에, 경험을 통한 일반적 방법으로서, 18개의 클론이 상기 커버리지를 획득하기 위해 뉴클레오타이드 1kb에 대해 실제적으로 서열분석하는데 필요할 것이다. 그러나, 18개의 클론을 실제적으로 서열분석하기 위해서는, 보다 다수의 형질전환체를 분리시키고 증식시켜야 하는데, 이는 트랜스포존이 각각의 경우에 표적 DNA내에 통합되지 않으나, 전체 표적 DNA-함유 백터에 걸쳐 무작위로 삽입될 수 있기 때문이다. 따라서, 수 18에 트랜스포존이 표적 DNA 서열에 삽입되는 가능성을 곱한다. 다음, 6배 서열분석 커버리지를 획득하기 위해서, 풀내의 각각의 DNA 서열에 대해, 분리할 형질전환체의 수는 kb 단위의 표적 DNA 서열 길이 X 18 X 비 (벡터의 크기)/(DNA 표적 서열의 크기)이다.
다음, 선택된 형질전환체로부터의 각각의 배양물에 대해 PCR 반응을 이의 DNA 상에서 수행한다. PCR 반응은 삽입 지점에서 벡터 서열의 3' 말단에 상보적인 프라이머를 사용하고, 이는 단편의 전체 벡터 서열 크기로의 PCR 증폭을 가능하게 한다. PCR 반응의 반응 조건을 벡터의 길이만큼의 단편은 효율적으로 생성시키나, 벡터 + 트랜스포존의 길이만큼의 단편은 효율적으로 생성시키지 못하도록 최적화시킨다. 본 발명에 따르는 임의의 특정 벡터와 트랜스포존의 조합체에 대한 PCR 조건의 최적화는 문헌[참조: Kimmel, B., M.J. Palazzola, C. Martin, J.D. Boeke, and S.E. Devine, 1997, Optimizing PCR Assays, Methods for Improving PCR, Detecting and Characterizing PCR products, Protocols for Detecting and Characterizing PCR Products. In Genomic Analysis: A laboratory manual(ed. E Green, B. Birren, R. Myers, and P. Hieter), Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.; 및 Cha, R.S. and Thilly, W.G. (1995): PCR Primer, Dieffenbach, C.W. and Dveksler, G.S.(eds.), CSH Press, New York]에 의해 안내된 바와 같이 통상의 실험법을 통해 당업자에 의해 결정될 수 있다. 폴리머라제의 선택은 반응을 최적화시키는데 도움을 줄 수 있더라도, PCR에 사용된 특정 DNA 폴리머라제는 상기 방법에 대해 제한적이어서는 안된다. 일반적으로는, PCR의 신장 온도 및/또는 시간을 변화시켜, 벡터 + 트랜스포존 크기의 산물의 목적하는 제거를 달성한다. 최적화의 실증을 위해서는, 실시예 2를 참조한다.
다음, 각각의 PCR 반응에서 생성된 산물의 양을 바람직하게는 광학적으로 측정한다. 광학 측정은 뉴클레오타이드로부터의 dsDNA를 판별하는 임의의 방법에 의해 수행될 수 있지만, 바람직하게는 dsDNA에 특이적인 형광 염료를 사용하여 수행한다. dsDNA 특이적 염료는 비스-벤즈이미드 염료 Hoechst 33528 및 PICOGREENR을 포함한 시아닌 염료(공급원: Molecular Probes, Inc.; Eugene, Oregon)를 포함한다. dsDNA에 대한 감도 및 선택도로 인해 PICOGREENR이 바람직하다. 형광도의 측정된 값을 dsDNA PCR 산물의 존재 여부를 측정하기 위해 예정된 역치 수준과 비교 한다. 형광도의 역치 수준은 분리된 형질전환체를 스크리닝하는데 사용할 동일한 PCR 조건하에 벡터 단독 및 벡터 + 트랜스포존의 크기의 양성 및 음성 대조 PCR 주형을 사용하여 실험적으로 셋팅시킨다.
상당한 양의 dsDNA를 생성시키지 않는 PCR 반응에 상응하는 형질전환체는 서열분석되지 않는데, 이는 이들이 벡터 서열내에 트랜스포존을 함유하고 있기 때문이다. 상당한 양의 dsDNA를 생성시키는 PCR 반응에 상응하는 형질전환체는 표적 DNA 서열내에 트랜스포존을 함유하며, 서열분석된다. 두가지 서열분석 반응을 트랜스포존의 각각의 말단으로부터의 프라이머를 사용하여 각각의 형질전환체에 대해 수행하여, 트랜스포존을 둘러싸고 있는 표적 DNA 서열의 서열을 판독한다. 서열분석 반응은 당해 분야의 임의의 공지된 방법에 의해 수행할 수 있다.
서열 데이터가 PCR 스크린을 통과하는 모든 형질전환체로부터 수집되면, 서열을 표적 DNA 서열의 풀의 개개의 일원 모두로 어셈블링시켜야만 한다. 이는 당해 분야에 공지된 컴퓨터 서열 분석 방법에 의해 수행할 수 있으며, 정확한 방법은 본 발명에 대해 제한되지 않는다.
본 발명의 방법의 이점은 속도, 효율 및 공정을 자동화시키는 능력을 포함한다. 특히, 본 발명의 방법은 트랜스포존이 벡터 서열에 삽입되고, 서열분석할 경우에, 주로 벡터 서열을 생성할 수 있는 비생산적 형질전환체의 제거를 가능하게 하는 신속한 PCR 스크린을 제공한다. PCR 스크린은 신속하고, 자동화시킬 수 있으며, PCR 산물의 크기를 측정하기 위해 아가로스 겔을 유동시키는 것과 같은 PCR 산물의 어떠한 분리도 필요로 하지 않는다. 표적 DNA의 풀의 사용은, 각각의 표적 DNA 서열에 대한 것을 필요로 하는 대신에 단일 트랜스포존 반응 및 단일 형질전환이 수행되도록 한다.
실시예 1 - 고효율 스크리닝 공정에 적합한 트랜스포존의 선택
뉴 잉글랜드 바이오랩스로부터의 원형 트랜스포존
게놈 프라이밍 시스템 키트(Genome Priming System Kit, 공급원: New England Biolabs; 32 Tozer Road, Beverly, MA 01915("NEB"))를 이용하여, DNA 표적물에 무작위로 삽입된 트랜스포존이 고도의 정확도로 표적물을 완전하게 서열분석하는 효율적인 방법일 수 있음을 처음으로 증명하였다. 카나마이신 내성 유전자를 함유하는 2종의 트랜스포존 중 1종을 키트에 공급하였다. 그러나, 카나마이신은 상당히 통상적인 내성 마커이고, 표적 DNA 서열이 카나마이신-선택가능한 벡터내로 이미 클로닝되었을 경우, 상이한 트랜스포존 또는 표적 DNA 서열의 재클로닝이 필요할 수 있었다. 키트에 클로람페니콜 내성 마커를 함유하나 또한 상당히 통상적인 또 다른 트랜스포존을 제공하였다. 따라서, 트랜스포존을 아프라마이신에 대한 비통상적인 내성 마커를 함유하도록 변형시켜, 추가의 클로닝 단계를 회피하고, 각각의 DNA 표적물에 대한 정확한 트랜스포존을 선택하는데 있어서 사람의 오류를 감소시킨다. NEB pGPS1 트랜스포존을 변형시켜 GPS-Apra 트랜스포존(도 2)을 작제하였다.
변형된 트랜스포존, GPS-Apra를 사용하는 스크리닝 방법
초기 실험은 스크리닝 공정이 트랜스포존에 대해 선택된 형질전환체로부터 트랜스포존을 표적 DNA 서열내에는 함유하나 벡터내에는 함유하지 않는 형질전환체를 판별할 수 있음을 보여주었다. 이는 벡터 서열의 비생산적 서열분석을 제거함으로써 비용을 감소시켰다. 원형 NEB pGPS1 트랜스포존은 2.614kb이고, 이 중 약 1.7kb가 각각의 말단에 프라이밍 부위를 가지며, 표적 DNA에 무작위로 삽입되어 있었다. 상보체 M13F 및 상보체 M13R 프라이머를 사용하는 3.0kb 벡터의 PCR 증폭에 의해, 2종의 별개의 PCR 산물을 슬랩 겔 상에서 가시화시킬 수 있었다. 3.0kb PCR 산물은 벡터가 3.0kb이기 때문에 트랜스포존이 틀림없이 표적 DNA 서열내에 존재함을 암시한다. 4.7kb PCR 산물은 트랜스포존(1.7kb)을 함유하는 벡터(3.0kb)를 암시한다. 따라서, 표적 DNA 서열내에 트랜스포존을 함유하는 클론은 겔 상에서의 3.0kb PCR 산물의 존재에 의해 동정할 수 있었다.
삽입물내에 트랜스포존을 함유하는 클론의 동정을 입증하기 위해, 콜로니를 트랜스포존 반응 후의 형질전환으로부터 선택하고, 선택을 위한 2종의 항생제, 아프라마이신 및 플라스미드 항생제를 함유하는 배지로 접종시켰다. 배양물을 밤새 증식시키고, PCR을 다음날 96웰 플레이트내의 PCR 칵테일로 배양물 약 1ul를 도입함으로써 수행하였다. PCR 칵테일은 Amplitaq 효소 및 시약(공급원: PE Corporation; PE Corporation, 761 Main Avenue, Norwalk, CT 06859)을 포함하였다. PCR에 대한 조건은 표준{5분 동안 95℃, (30초 동안 95℃, 1분 동안 54℃, 6분 동안 72℃, 30사이클), 1분 동안 72℃, 영구히 4℃}이다. 사이클의 완료(약 2.5시간) 후, 표준 크기 겔 상에서 50ul PCR 반응물 중 8ul를 사용하여 겔 전기영동을 수행하였다. 트랜스포존을 함유하지 않는 벡터 서열 및 트랜스포존을 포함한 벡터 서열로부터의 PCR 산물 사이의 명백하게 검출가능한 크기 판별이 존재하였다.
그러나, 서열분석 반응에 대한 고효율을 유지시키기 위해, 전기영동을 일시에 수백가지 샘플을 수용할 수 있는 대형 겔 상에서 수행하였다. 이들 대형 겔 상에서, 3kb 및 4.7kb 단편 사이의 차이는 자동화 시스템을 이용하여 재현가능하게 검출하는 것은 어려울 수 있다. 또한, 겔 전기영동은 매우 시간 소모적이며, 고효율 방식으로 스크리닝을 수행하는 것을 방해할 수 있다.
다른 고효율 방법에 대한 조사에 있어서, dsDNA의 형광 검출법은 재현가능하고 보다 덜 시간 소모적으로 인정되었다. PICOGREENR 검정법이 특히 편리한 것으로 간주된다. 그러나, dsDNA의 형광 검출법은 상이한 크기 단편을 판별할 수 없어, 임의의 PCR 산물의 존재 또는 부재가 표적 DNA 함유 벡터내의 트랜스포존의 위치를 지시하도록 PCR 반응을 변형시켜야만 한다. 표적 DNA 서열내에 트랜스포존을 함유하는 클론만이 dsDNA PCR 산물을 생성시키는 경우에, PICOGREENR dsDNA 염료는 목적하는 클론의 경우에만 고수준으로 형광 발광할 것이다. 벡터내에 트랜스포존을 함유하는 웰은 상당한 dsDNA 산물을 증폭시키지 않을 것이며, 저수준의 형광도를 발생시킬 것이다. 목적하는 클론과 목적하지 않는 클론 사이의 형광의 컷오프 수준을 공지된 샘플의 사용에 의해 측정할 수 있다.
신장 온도를 낮춤으로써 다양한 PCR 조건을 시험하지만, 4.7kb 밴드는 위 양성율을 증가시키지 않으면서 일관되게 소실되지 않을 것이다. 트랜스포존의 크기를 다시 상당히 증가시키도록 트랜스포존을 변형시킬 경우에, 상부의 트랜스포존-함유 밴드를 일관되게 소실시켜, 이에 의해 위 양성율을 낮출 수 있는 PCR 조건을 발현시킬 수 있는 것으로 결론내려진다. 음성 방법에서 트랜스포존 반응에 영향을 미치지 않을 대형 "스타퍼(stuffer)" 유전자를 탐색한다. URA3 유전자를 함유하는 효모 2㎛ 플라스미드가 크기 기준을 충족시키며, 또한 차후에 효모 실험에서 사용할 수 있었다. 따라서, GPS-Apra-2㎛-URA3 트랜스포존 플라스미드(도 3)는 약 5.0kb의 트랜스포존을 포함하여 전체 크기 6.1kb를 갖도록 작제하였다. PCR 조건을 변형시켜, 성공적으로 벡터내에 트랜스포존을 함유하는 클론을 소실시키고, 전위 반응에 영향을 미치지 않도록 하였다. 실시예 2를 참조한다.
실시예 2 - 위 음성(false negative) 및 위 양성(false positive) 결과를 감소시키기 위한 PCR 조건의 최적화
기본적인 PCR 개념
당해 스크린은 전체 벡터 DNA의 3.9kbp 단편을 증폭시키기 위해 특이적으로 최적화된 PCR 사이클링 조건을 기초로 하였다. 이 경우에, 벡터는 PCR4Blunt-TOPO(공급원: Invitrogen; 1600 Faraday Ave, Carlsbad, CA 92008)이였다. 벡터가 그 속에 삽입된 5kbp 트랜스포존을 함유하는 경우에, 이의 크기는 8.9kbp로 증가할 것이며, 이는 너무 커서 최적화된 PCR 조건하에 증폭시킬 수 없었다.
클론의 벡터 부분을 증폭시키기 위해 선택된 프라이머 서열은 만능 프라이머(universal primer) M13F(-20) 및 M13R의 상보체 서열이다. 서열은 다음과 같다: 5'-ACTGGCCGTCGTTTTAC-3' 및 5'-CATGGTCATAGCTGTT-3'. 이러한 증폭은 도 1에 도시되어 있다.
384-웰 포맷의 개발에 대한 배경
다중 클론을 함유하는 풀로부터 트랜스포존 반응을 스크리닝하기 위해서는, 신속하고 비용 효율적인 스크린을 개발하는 것이 필요하였다. 최초 개발 시도는 96-웰 프로토콜을 기초로 한 것이였다. 384-웰 플레이트로 변형시키기 위해, 모든 시약 용적을 절반으로 하여, 보다 적은 웰 용적을 수용하였다. 그러나, 이들 조건은 관찰되는 높은 회수의 PCR 실패로 인해 보다 덜 이상적인 것으로 입증되었다. 이러한 포맷에 대해 보다 강력한 PCR 시약 및 조건에 대한 조사가 수행되었다. 광범위한 효소 및 열순환(thermocycling) 조건을 시험한 실험의 결과는 다음 섹션에서 기술할 것이다.
384-웰 PCR 최적화 공정
폴리머라제 선택
몇몇 판매업체로부터의 다양한 PCR 키트의 신속한 스크리닝을 수행하여, 96-웰 포맷에서 사용된 PE Corporation AmpliTaq 폴리머라제의 384-웰로의 대체를 결정하였다. 다음의 PCR 키트를 시험하였다: Advantage cDNA PCR 키트(공급원: Clontech Laboratories Inc.; 1020 East Meadow Circle Palo Alto, CA 94303-4230), Failsafe PCR 시스템(공급원: Epicentre Technologies; 1402 Emil Street, Madison, WI 53713) 및 3종의 키트: LA Taq, Ex Taq 및 Z Taq(공급원: Takara Shuzo Co., LTD; Biomedical Group Seta 3-4-1, Otsu, Shiga, 520-2193, Japan). 시험된 샘플은 30개의 풀링된 DNA 표적물을 제공하였다. 이들을 pBluescript SK-(3.0kb)(공급원: Stratagene; 11011 North Torrey Pines Road, La Jolla, CA 92037)내로 클로닝시켰다. 증식 시간은 384웰 포맷에서는 20시간이였다. 예비 데이터를 기준으로 하여, Z-taq 시스템을 효소로서 선택하여, 이것이 보유하는 특성으로 인해 TEMS와 같은 고효율 시스템에서 사용하기에 이상적인 것으로 만들도록 하였다. 샘플의 PCR 산물이 유동되어진 염색된 전기영동 겔을 도시하는 도 4를 참조한다.
시약 최적화
PCR 스크린의 반응당 비용을 감소시키는 것이 또한 바람직하였다. 아래 표 2는 결과를 손상시키지 않으면서 다양한 시약의 각각이 감소될 수 있는 정도의 양을 시험하기 위해 수행된 다양한 실험을 요약한다.
최적화 공정 동안 시험된 다양한 PCR 칵테일 성분의 요약
시험된 가변 요소 시험된 조건 최적 결과
Z-Z-Taq 폴리머라제 0.625, 0.313, 0.156단위 0.313단위
10X Z-Taq 완충액 1x, 0.5x 1x
프라이머 2.5, 5, 10pmol 5pmol
프라이머 cM13f & cM13r cT3 & cT7 cM13f & cM13r
dNTP 100, 150, 200μM 150μM

상기 실험을 기초로 하여, 다음의 최적화된 반응 칵테일 혼합물(샘플당)을 측정한다.
ddH2O: 17.875μL
10x Z-Taq 완충액: 2.5μL
dNTP 혼합물: 1.5μL
주형 DNA: 1μL(Kerplunker # 96/384(제조원: Nalge Nunc International, 75 Panorama Creek Drive, Rochester, NY 14625) 및 Pin Replicator # 250520/250393을 사용하여 침착)
Z-Taq DNA 폴리머라제: 0.125μL(0.3125단위)
cM13f(5pmol/μL): 1μL
cM13r(5pmol/μL): 1μL
열순환기(thermocycler) 조건의 최적화
사용된 최초 열순환 조건은 다카라(Takara) 문헌에 제공된 권고안을 기초로 한다. 이들 조건은 다음과 같다:
1. 변성: 5초 동안 98℃
2. 어닐링: 10초 동안 55℃
3. 신장: 60초 동안 72℃(15.4초/kb)
4. 1로 가서 30회
5. PCR 반응이 평가될 때까지 4℃.
상기 조건을 사용한 결과는 도 2에 도시되어 있다. 이들 데이터로부터, 반응 특이성을 시험하고 감소시켜, 증폭된 양성율의 수를 증가시키도록 어닐링 온도를 저하시킬 수 있는 것으로 결론내려진다. 다음 실험에서는, 어닐링 온도를 52℃로 저하시켰다. 이들이 전체적인 반응 결과에 도움이 되더라도, 15.4초/kbp의 신장 시간을 사용할 경우에 트랜스포존 삽입을 함유하는 벡터의 증폭이 발생하는 것으로 밝혀졌다. 표적 DNA-함유 pBluescript SK-내의 트랜스포존 삽입 후에 선택되고, 384웰 플레이트의 웰내에서 20시간 동안 증식된 47개의 형질전환체로부터의 PCR 산물을 유동시킨 염색된 전기영동 겔을 도시하는 도 5를 참조한다. 트랜스포존을 함유하는 벡터의 증폭된 산물인 것으로 간주되는 9kb 밴드의 출현은 과도한 신장 시간의 결과이다.
또한, 48℃ 내지 68℃의 어닐링 온도 구배를 시험하여, 52℃가 실제로 상기 PCR에 대해 사용하기에 최적 온도인 것으로 확인하였다. 동일한 실험에 있어서, 사이클 회수를 또한 시험하였다. 30, 35, 40 및 45사이클을 시험하였다. 상기 실험의 결과로부터 배경 소음을 회피하도록 사이클의 회수를 적게 유지시킬 필요가 있는 것으로 결정내려진다. 48℃ 내지 68℃ 구배로부터, 52℃ 어닐링 온도가 최적인 것으로 재확인되었다. 당해 온도는 비특이적이 되도록 너무 낮지도 않으며, PCR이 불이행되기 시작하는 56℃ 온도에 가까와지는 위험에 처하도록 너무 높지도 않았다. 이들 결과는 염색된 전기영동 겔의 사진인 도 6에 도시되어 있으며, 여기서, 각각의 도시된 산물은 25ul PCR 칵테일 용적을 갖는 384웰 포맷으로 웰당 2.5ng에서 대조 pBluescript SK- 벡터의 증폭을 나타낸다. 상기 데이터를 기초로 하여, 열순환 조건을 결정하여, 다음의 사이클을 최적으로 사용하여 수행하였다.
1. 변성: 5초 동안 98℃
2. 어닐링: 10초 동안 52℃
3. 신장: 30초 동안 72℃(7.7초/kb)
4. 1로 가서 35회
5. PCR 반응의 평가까지 4℃.
증발이 384-웰 플레이트에서 문제점인 것으로 밝혀졌기 때문에, 고무 'P' 밀봉재(seal)(공급원: MJ Research; 590 Lincoln Street, Waltham, MA 02451)을 열순환 개시 전에 밀봉된 플레이트 상에 위치시킨다. 이와 더불어 제조업체에 의해 권고된 바와 같이, 덮개 온도를 85℃로 설정한다.
아래에 제시된 표 3은 최적화 공정 동안 시험된 다양한 PCR 열순환 조건의 요약을 제공한다.
최적화 동안 시험된 PCR 열순환 조건의 요약
시험된 가변 요소 시험된 조건 최적 결과
어닐링 온도 38℃-68℃ 52℃
PCR 사이클 30, 35, 40, 45 35
dsDNA 정량화 시약 PICOGREENR을 사용하여 양성 클론에 대한 스크리닝
겔 전기영동의 노동-집약적 작업을 우회하기 위해, TEMS PCR 스크린은 dsDNA 정량화 시약, PICOGREENR을 사용한다. PICOGREENR을 1x TE 완충액으로 1:150의 작업 희석율로 희석시킨다. 이러한 희석율이 최적인 것으로 밝혀져 있지만, 이는 제조업체의 프로토콜에서 권고된 1:200보다 약간 높게 농축되어 있다.
웰당 1:150 PICOGREENR 25μL를 로빈스 하이드라 96 디스펜서(Robbins Hydra 96 Dispenser; 공급원: Robbins Scientific; 1250 Elko Drive, Sunnyvale, CA 94089-2213)를 사용하여 블랙 384-웰 플레이트로 분액화시킨다. 다음, 웰당 각각의 PCR 반응물 5μL를 다시 하이드라 디스펜서를 사용하여 PICOGREENR에 첨가한다. 다음, 플레이트를 즉시 몰레큘러 다이나믹스 제미니 형광 플레이트 판독기(Molecular Dynamics Gemini Fluorescence Plate Reader)에 즉시 위치시킨 다음, 플레이트를 10초 동안 혼합한 후, 이의 형광 시그널을 측정한다.
스크린으로서 작용하는 검정법의 경우, 양성 웰과 음성 웰 사이의 형광 시그널은 명백한 차이가 존재하여야만 한다. 1.3, 2.5, 5 및 10μL의 PCR 산물의 양을 시험하여, 양성 시그널 내지 배경값의 가장 높은 검정치 범위를 측정한다. PICOGREENR 25μL로의 PCR 산물 5μL가 사용하기에 최적 조건임을 제시하는 결과는 표 4에 제시한다.
Figure 112003000493890-pct00001
형광 판독기에 의해 생성된 시그널 출력을 히스토그램 디스플레이에 전송시킨 다음, 양성 클론에 대한 컷오프 값이 히스토그램으로부터 정해진다. 통상의 조건을 사용할 경우, 컷오프는 일반적으로는 1000 내지 1500 범위에 포함된다.
Genesis RSP 150 TECAN 로봇 스테이션(TECAN U.S. INC., P.O. Box 13953, Research Triangle Park, NC 27709)을 이용하여, 스크린에 의해 표적 DNA 서열내에 트랜스포존을 갖는 것으로 동정된 클론으로부터의 세포를 함유하는 96-딥-웰 플레이트를 생성시킨다. 각각의 양성 클론으로부터의 세포를 Superbroth에 유입하고, 적합한 항생제(이원 선택)를 웰 중 하나에 유입한다. 이들 플레이트를 증식시킨 다음, 배양물을 자동화 서열분석에 적용시킨다.
384-웰 플레이트에 대한 최적화 PCR 스크린 기술의 예
Q-Bot를 사용하여, 트랜스포존 함유 클론의 콜로니를 웰당 Superbroth + 적합한 항생제 65μL를 함유하는 Genetix 384-웰 샐로우-웰 플레이트내로 채취한다. 플레이트를 가습 37℃ 배양기내에 19 내지 22시간 동안 위치시킨다. 웰당 무균 50% 글리세롤 25μL를 Multidrop 384 115V 액체 디스펜서(Labsystems Inc.; 8 East Forge Parkway, Franklin MA 02038)를 사용하여 증식 플레이트내로 분액화시킨다. 글리세롤 플레이트를 주형으로서 사용하여, 다음의 수단을 사용하여 PCR을 셋업시킨다:
ddH2O: 17.875μL
10x Z-Taq 완충액: 2.5μL
dNTP 혼합물: 1.5μL
주형 DNA*: 1μL(핀-도구인 Kerplunker를 사용)
Z-Taq DNA 폴리머라제: 0.125μL(0.3125단위)
cM13f(5pmol/μL): 1μL
cM13r(5pmol/μL): 1μL
*Kerplunker를 무균이도록 하기 위해, 이를 70% 에탄올 속에 저장하고, 사용 전에 화염처리해야 한다.
PCR 반응 플레이트를 열순환기 내에 유입하고, 다음의 사이클을 개시한다:
1. 변성: 5초 동안 98℃
2. 어닐링: 10초 동안 52℃
3. 신장: 30초 동안 72℃(7.7초/kb)
4. 1로 가서 35회
5. PCR 반응이 평가될 때까지 4℃.
전체 사이클링 시간: 1시간 18분 30초.
반응이 진행 중인 동안, PICOGREENR 시약을 실온에서 해동시킨다.
1x TE 완충액 중의 PICOGREENR의 1:150 희석액을 제조한다. 384-웰 플레이트당 10mL를 제조한다. 로빈스 하이드라(Robbins Hydra)를 사용하여, 웰당 25μL를 전체 384-웰 블랙 플레이트에 분액화시킨다. 로빈스 하이드라를 사용하여, 웰당 PCR 반응물 5μL를 PICOGREENR 플레이트에 분배한다. 플레이트를 즉시 형광 플레이트 판독기에 위치시키고, 10초 동안 진탕시켜 혼합한다. 형광 시그널 데이터를 플로피 디스크에 전송시킨다. 데이터를 엑셀 매크로(Excel macro)에 입력시키고, 역치로서 1500을 사용하여 양성 클론의 재배열 리스트를 생성시킨다. PCR 스크린으로부터 수득된 최종 PICOGREENR 데이터의 예에 대해서는 도 7을 참조한다. TECAN 로봇으로 재배열 리스트를 개방하고, 글리세롤 스톡 플레이트로부터의 클론을 Superbroth 및 적합한 항생제를 함유하는 96-웰 딥-웰 플레이트에 재배열한다. 플레이트를 배양한 후에, 이들 중의 배양물을 자동화 방법으로 서열분석한다.
실시예 3- 벡터 PCR4Blunt-TOPO내의 미지의 서열의 트랜스포존 촉진된 다중 서열분석
트랜스포존 반응
게놈 프라이밍 시스템(GPS) 키트(공급원: New England BioLabs)를 사용하여 트랜스포존 반응을 수행하였다. 트랜스포존 GPS1을 제외하고는 키트에 제공된 모든 성분을 사용하였다. 사용된 트랜스포존은 GPS1의 변형 버젼이였다. 2개의 변형체가 생성된다. 한 변형체인 pGPS-Apra에서는, 현존하는 내성 마커를 아프라마이신 내성 유전자로 대체하였다. 이는 벡터를 내성 마커에 무관하게 모든 벡터를 서열분석하는데 사용할 수 있도록 하기 위해 수행하였다. 또 다른 변형체인 pGPS-Apra-Y2㎛에서는, 효모 2㎛ 복제 기원을 함유하는 효모 "스타퍼" 부위를 트랜스포존내로 클로닝시켜, 이의 크기를 5kb로 증가시켰다(도 3). 이러한 변형은 벡터 골격으로의 전위를 스크리닝함으로써 공정의 효율을 개선하기 위해 발생시키는 것이다. 당해 반응은 DH10B 이. 콜라이(E. coli) 수용능(competent) 세포 내로의 전기천공에 의해 변형시키고, 트랜스포존을 보유하는 클론의 선택을 위해 적합한 항생제(아프라마이신(100㎍/ml)/카나마이신(50㎍/ml))를 함유하는 Luria-Bertani(1.0% 박토-트립톤, 0.5% 박토-효모 추출물, 1.0% NaCl, pH 7.0) 아가 플레이트 상에 플레이팅시켰다. 증식 기간은 20 내지 22시간이였다.
TEMS(트랜스포존 촉진된 다중 서열분석)
TEMS에 적용된 모든 표적 DNA 서열의 크기를 NotI를 사용한 표적 DNA-함유 벡터의 제한 분해에 의해 평가하였다. 동일한 벡터 골격내에 함유된 다양한 크기의 표적 DNA 서열을 함유하는 플라스미드 셋트를 풀링시켰다. 등몰 농도를 풀링 전에 각각의 표적 DAN 서열에 대해 계산하였다. 단일 주형으로서 풀링된 DNA 주형을 처리하는 트랜스포존 반응을 수행하였다. 각각의 표적 DNA 서열의 각각의 염기의 6배 커버리지에 대해, 각각의 표적 DNA 서열의 전체 크기를 서열 1kb당 18개의 클론의 표준 역가와 곱함으로써, 서열분석하기 위해 무작위로 선택된 클론의 수를 측정하였다. 벡터의 전체 크기 및 표적 DNA 서열의 전체 크기를 기준으로 하여, 트랜스포존 삽입 위치의 가능성을 계산하였다. 이들 역가를 6배 커버리지에 대한 클론의 수와 곱하여, 얼마나 많은 클론을 무작위로 선택하여 PCR 스크린에 적용시킬 것인지를 측정하였다.
계산된 수의 콜로니를 선택하고, 96웰 또는 384웰 배양 플레이트 상에서 적합한 항생제를 함유하는 Superbroth(박토-트립톤, 효모 추출물, NaCl, NaOH) 배지로 접종시켰다. 이들 배양 플레이트를 증식 플레이트의 포맷(96웰/384웰)에 따라 18 내지 22시간 동안 진탕시키지 않으면서 밤새 증식시켰다. 글리세롤 스톡을 플레이트의 임시 저장을 위해 제조하였다. 50% 글리세롤을 플레이트에 직접 첨가하여, 혼합하였다. 이는 -80℃에서 무기한 저장을 가능하게 하였다.
PCR에 의한 벡터 삽입의 스크리닝
스크리닝을 위한 클론의 벡터 부분을 증폭시키기 위해 선택된 프라이머 서열은 만능 프라이머 M13F(-20) 및 M13R의 상보체 서열이다. 서열은 다음과 같다: 5'-ACTGGCCGTCGTTTTAC-3' 및 5'-CATGGTCATAGCTGTT-3'. 배양 PCR을 다음 조건하에 어셈블링시킨다: 주형을 약 1μL로 분액화된 핀 리플리케이터(pin replicator) 도구를 사용하여 PCR 반응 시약 제제에 침착시킨다. 96-웰 포맷의 경우, 10x PCR 완충액 조성물은 100mM Tris-HCl pH 8.3; 500mM KCl; 15mM MgCl2; 0.01% w/v 젤라틴이다. 정방향 프라이머 5피코몰 및 역방향 프라이머 5피코몰을 각각의 반응에서 사용한다. 반응에서 dNTP 농도는 2.5mM 최종 농도이다. 각각의 반응에 첨가된 Taq 폴리머라제의 양은 0.1단위이다. 모든 반응은 50ul의 총 용적으로 수행한다. 384-웰 포맷 PCR은 TaKaRa Z-Taq 키트(공급원: Panvera Corporation; 545 Science Drive, Madison, WI 53711)를 이용하여 25μL의 총 용적으로 수행한다. 당해 키트는 Z-taq 폴리머라제(2.5단위/μL), 30mM 농도의 Mg2+를 함유하는 10x Z-Taq 완충액 및 dNTP 혼합물(각각 2.5mM)로 이루어져 있다. 가열된 덮개(MJ Rearch)가 장착된 열순환기를 작동시킨다. 상기 PCR 사이클은 짧은 신장 시간으로 인해 트랜스포존을 함유하지 않는 벡터만을 증폭시키도록 디자인되어 있다. 블랙 PCR 플레이트를 사용하여, 형광 분석을 이후에 플레이트에서 직접 수행할 수 있다.
PICOGREENR을 사용하는 분석 조건
PCR의 완료시, PICOGREENR 25ul를 PCR 플레이트에 첨가한다. 50ul 용적의 1x TE(트리스-아세테이트, EDTA) 완충액 중의 PICOGREENR 스톡 1:200을 PCR 반응물 10ul와 혼합한다. 분자가 480nm에서 여기되고, 시그널이 540nm에서 방출되는 형광분광기로 플레이트를 판독한다. 예정된 역치 이상으로 형광 발광하는 PCR 산물이 서열분석할 양성 클론이다. 역치는 벡터 또는 벡터에의 삽입물내에 트랜스포존을 함유하는 공지된 작제물을 사용하여 실험적으로 측정한다. 양성 클론을 분류하여, TECAN 로봇 암에 의한 배열에 적합한 포맷으로 압착한다. 글리세롤 스톡을 Superbroth(박토-트립톤, 효모 추출물, NaCl, 5N NaOH) 1.5ml 및 적합한 항생제를 함유하는 96 딥(deep) 웰 플레이트내로 접종시킨다. 이들 배양물을 24시간 동안 증식시킨 다음, 배양물로부터의 DNA 표적물을 트랜스포존의 한쪽 말단에서 프라이머를 사용하여 서열분석한다.
서열 어셈블리
Phred 소프트웨어를 사용한 미가공 서열의 벡터 트리밍(trimming) 및 염기 콜링(calling) 후에, 서열을 Phrap 소프트웨어를 사용하여 어셈블링시킨다[참조: Brent Ewing, LaDeana Hillier, Michael C. Wendl, and Phil Green. Base-calling of automated sequencer traces using phred. I. Accuracy assessment. 1998. Genome Research 8:175-185; 및 Brent Ewing and Phil Green Base-calling of automated sequencer traces using phred. II. Error probabilities. 1998. Genome Research 8:186-194]. 어셈블리를 consed 소프트웨어를 사용하여 검토한다[참조: Consed: A Graphical Tool for Sequence Finishing Gordon et al 1998]. 완료 상태에 대한 기준은 고품질, 즉 완전 전장 유전자의 6배 커버리지이다. 서열 10kb당 예상된 오류율은 0.1 미만이어야만 한다. 이들 기준이 충족되지 않을 경우에, 프라이머를 표적 DNA 서열의 오류 유발 절편의 프라이머 워킹 서열분석을 위한 주형과 함께 선택한다. 프라이머 워킹 서열분석은 필요한 서열분석의 용적에 따라 ABI 310 서열분석기 상에서 또는 ABI 3700을 사용하는 고효율 서열분석을 통해 수행하고, 후속적으로 이들 서열을 어셈블리에 첨가한다. BLAST 분석을 특별하게 공지된 유전자와의 비교를 위해 수행한다[참조: Altschul, S.F., Gish, W., Miller, W., Myers, E.W. & Lipman, D.J. (1990) "Basic local alignment search tool." J. Mol. Biol. 215:403-410; Gish, W. & States, D.J. (1993) "Identification of protein coding regions by database similarity search." Nature Genet. 3:266-272; Madden, T.L., Tatusov, R.L. & Zhang, J. (1996) "Applications of network BLAST server" Meth. Enzymol. 266:131-141; Altshul, S.F., Madden, T.L., Schaffer, A.A., Zhang, J., Zhang, Z., Miller, W. & Lipman, D.J. (1997) "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs." Nucleic Acids Res. 25:3389-3402; 및 Zhang, J. & Madden, T.L. (1997) "PowerBLAST: A new network BLAST application for interactive or automated sequence analysis and annotation." Genome Res. 7:649-656]. 생성된 전장 서열을 Sequencher로 불리는 또 다른 어셈블리 프로그램에 입력시킨다[참조: Cash, H., Clark, B., Galt, J., Garb, C., Goebel III, C.J., & Singer, J. Sequencher User Guide "The complete Software Solution for Sequencing DNA". Gene Codes Corporation. 1999]. 상기 프로그램을 사용하여, 오픈 리딩 프레임을, 존재할 경우에, 프레임 쉬프트를 유발하지 않는 확실한 변이인 것으로 검증하는 것은 용이하다.
상기한 실시예는 단지 예시와 설명을 위한 것이지, 본 발명을 제한하기 위한 것은 아님을 이해하여야 한다. 당해 분야의 숙련가는 하기 청구의 범위에 의해 한정된 바와 같은 본 발명의 범주를 벗어나지 않으면서 상기한 양태를 다양하게 변화시킬 수 있다.
<110> Aventis Pharmaceuticals Inc. <120> Transposon mediated multiplex sequencing <130> 5-1998-084659-3 <150> US 60/216,381 <151> 2000-07-07 <160> 4 <170> KopatentIn 1.71 <210> 1 <211> 2613 <212> DNA <213> Artificial <220> <223> GPS-Apra transposon vector <400> 1 ggtaccctgt gaatgcgcaa accaaccctt ggcagaacat atccatcgcg tccgccatct 60 ccagcagccg cacgcggcgc atctcgggca gcgttgggtc ctggccacgg gtgcgcatga 120 tcgtgctcct gtcgttgagg acccggctag gctggcgggg ttgccttact ggttagcaga 180 atgaatcacc gatacgcgag cgaacgtgaa gcgactgctg ctgcaaaacg tctgcgacct 240 gagcaacaac atgaatggtc ttcggtttcc gtgtttcgta aagtctggaa acgcggaagt 300 cagcgccctg caccattatg ttccggatct atgtcgggtg cggagaaaga ggtaatgaaa 360 tggcagatcc ctggcttgtt gtccacaacc gttaaacctt aaaagcttta aaagccttat 420 atattctttt ttttcttata aaacttaaaa ccttagaggc tatttaagtt gctgatttat 480 attaatttta ttgttcaaac atgagagctt agtacgtgaa acatgagagc ttagtacgtt 540 agccatgaga gcttagtacg ttagccatga gggtttagtt cgttaaacat gagagcttag 600 tacgttaaac atgagactta gtacgtgaaa catgagagct tagtacgtac tatcaacagg 660 ttgaactgct gatcttcgga tctatgtcgg gtgcggagaa agaggtaatg aaatggcatc 720 cggatctgca tcgcaggatg ctgctggcta ccctgtggaa cacctacatc tgtattaacg 780 aagcgctggc attgaccctg agtgattttt ctctggtccc gccgcatcca taccgccagt 840 tgtttaccct cacaacgttc cagtaaccgg gcatgttcat catcagtaac ccgtatcgtg 900 agcatcctct ctcgtttcat cggtatcatt acccccatga acagaaatcc cccttacacg 960 gaggcatcag tgaccaaaca ggaaaaaacc gcccttaaca tggcccgctt tatcagaagc 1020 cagacattaa cgcttctgga gaaactcaac gagctggacg cggatgaaca ggcagagctc 1080 ttactgtcat gccatccgta tgtgggcgga caataaagtc ttaaactgaa caaaatagat 1140 ctaaactatg acaataaagt cttaaactag acagaatagt tgtaaactga aatcagtcca 1200 gttatgctgt gaaaaagcat actggacttt tgttatggct aaagcaaact cttcattttc 1260 tgaagtgcaa attgcccgtc gtattaaaga ggggcgtggg gtcgacgcgg ccgcgccgta 1320 tttgcagtac cagcgtacgg cccacagaat gatgtcacgc tgaaaatgcc ggcctttgaa 1380 tgggttcatg tgcagctcca tcagcaaaag gggatgataa gtttatcacc accgactatt 1440 tgcaacagtg ccgttgatcg tgctatgatc gactgatgtc atcagcggtg gagtgcaatg 1500 tcgtgcaata cgaatggcga aaagccgagc tcatcggtca gcttctcaac cttggggtta 1560 cccccggcgg tgtgctgctg gtccacagct ccttccgtag cgtccggccc ctcgaagatg 1620 ggccacttgg actgatcgag gccctgcgtg ctgcgctggg tccgggaggg acgctcgtca 1680 tgccctcgtg gtcaggtctg gacgacgagc cgttcgatcc tgccacgtcg cccgttacac 1740 cggaccttgg agttgtctct gacacattct ggcgcctgcc aaatgtaaag cgcagcgccc 1800 atccatttgc ctttgcggca gcggggccac aggcagagca gatcatctct gatccattgc 1860 ccctgccacc tcactcgcct gcaagcccgg tcgcccgtgt ccatgaactc gatgggcagg 1920 tacttctcct cggcgtggga cacgatgcca acacgacgct gcatcttgcc gagttgatgg 1980 caaaggttcc ctatggggtg ccgagacact gcaccattct tcaggatggc aagttggtac 2040 gcgtcgatta tctcgagaat gaccactgct gtgagcgctt tgccttggcg gacaggtggc 2100 tcaaggagaa gagccttcag aaggaaggtc cagtcggtca tgcctttgct cggttgatcc 2160 gctcccgcga cattgtggcg acagccctgg gtcaactggg ccgagatccg ttgatcttcc 2220 tgcatccgcc agagggcggg atgcgaagaa tgcgatgccg ctcgccagtc gattggctga 2280 gctcatgagc ggagaacgag atgacgttgg aggggcaagg tcgcgctgat tgctggggca 2340 acacgtggag cggatcgggg attgtctttc ttcagctcgc tgatgatatg ctgacgctca 2400 atgccgtttg gactagtgtc gaccaaccag ataagtgaaa tctagttcca aactattttg 2460 tcatttttaa ttttcgtatt agcttacgac gctacaccca gttcccatct attttgtcac 2520 tcttccctaa ataatcctta aaaactccat ttccacccct cccagttccc aactattttg 2580 tccgcccaca ccgtaagatg cttttctgtg act 2613 <210> 2 <211> 6114 <212> DNA <213> Artificial <220> <223> GPS-Apra-2um-URA3 transposon vector <400> 2 ggtaccctgt gaatgcgcaa accaaccctt ggcagaacat atccatcgcg tccgccatct 60 ccagcagccg cacgcggcgc atctcgggca gcgttgggtc ctggccacgg gtgcgcatga 120 tcgtgctcct gtcgttgagg acccggctag gctggcgggg ttgccttact ggttagcaga 180 atgaatcacc gatacgcgag cgaacgtgaa gcgactgctg ctgcaaaacg tctgcgacct 240 gagcaacaac atgaatggtc ttcggtttcc gtgtttcgta aagtctggaa acgcggaagt 300 cagcgccctg caccattatg ttccggatct atgtcgggtg cggagaaaga ggtaatgaaa 360 tggcagatcc ctggcttgtt gtccacaacc gttaaacctt aaaagcttta aaagccttat 420 atattctttt ttttcttata aaacttaaaa ccttagaggc tatttaagtt gctgatttat 480 attaatttta ttgttcaaac atgagagctt agtacgtgaa acatgagagc ttagtacgtt 540 agccatgaga gcttagtacg ttagccatga gggtttagtt cgttaaacat gagagcttag 600 tacgttaaac atgagagctt agtacgtgaa acatgagagc ttagtacgta ctatcaacag 660 gttgaactgc tgatcttcgg atctatgtcg ggtgcggaga aagaggtaat gaaatggcat 720 ccggatctgc atcgcaggat gctgctggct accctgtgga acacctacat ctgtattaac 780 gaagcgctgg cattgaccct gagtgatttt tctctggtcc cgccgcatcc ataccgccag 840 ttgtttaccc tcacaacgtt ccagtaaccg ggcatgttca tcatcagtaa cccgtatcgt 900 gagcatcctc tctcgtttca tcggtatcat tacccccatg aacagaaatc ccccttacac 960 ggaggcatca gtgaccaaac aggaaaaaac cgcccttaac atggcccgct ttatcagaag 1020 ccagacatta acgcttctgg agaaactcaa cgagctggac gcggatgaac aggcagagct 1080 cttactgtca tgccatccgt atgtgggcgg acaataaagt cttaaactga acaaaataga 1140 tctaaactat gacaataaag tcttaaacta gacagaatag ttgtaaactg aaatcagtcc 1200 agttatgctg tgaaaaagca tactggactt ttgttatggc taaagcaaac tcttcatttt 1260 ctgaagtgca aattgcccgt cgtattaaag aggggcgtgg ggtcgacgcg gccgcgaatt 1320 ctgaaccagt cctaaaacga gtaaatagga ccggcaattc ttcaagcaat aaacaggaat 1380 accaattatt aaaagataac ttagtcagat cgtacaataa agctttgaag aaaaatgcgc 1440 cttattcaat ctttgctata aaaaatggcc caaaatctca cattggaaga catttgatga 1500 cctcatttct ttcaatgaag ggcctaacgg agttgactaa tgttgtggga aattggagcg 1560 ataagcgtgc ttctgccgtg gccaggacaa cgtatactca tcagataaca gcaatacctg 1620 atcactactt cgcactagtt tctcggtact atgcatatga tccaatatca aaggaaatga 1680 tagcattgaa ggatgagact aatccaattg aggagtggca gcatatagaa cagctaaagg 1740 gtagtgctga aggaagcata cgataccccg catggaatgg gataatatca caggaggtac 1800 tagactacct ttcatcctac ataaatagac gcatataagt acgcatttaa gcataaacac 1860 gcactatgcc gttcttctca tgtatatata tatacaggca acacgcagat ataggtgcga 1920 cgtgaacagt gagctgtatg tgcgcagctc gcgttgcatt ttcggaagcg ctcgttttcg 1980 gaaacgcttt gaagttccta ttccgaagtt cctattctct agaaagtata ggaacttcag 2040 agcgcttttg aaaaccaaaa gcgctctgaa gacgcacttt caaaaaacca aaaacgcacc 2100 ggactgtaac gagctactaa aatattgcga ataccgcttc cacaaacatt gctcaaaagt 2160 atctctttgc tatatatctc tgtgctatat ccctatataa cctacccatc cacctttcgc 2220 tccttgaact tgcatctaaa ctcgacctct acatttttta tgtttatctc tagtattact 2280 ctttagacaa aaaaattgta gtaagaacta ttcatagagt gaatcgaaaa caatacgaaa 2340 atgtaaacat ttcctatacg tagtatatag agacaaaata gaagaaaccg ttcataattt 2400 tctgaccaat gaagaatcat caacgctatc actttctgtt cacaaagtat gcgcaatcca 2460 catcggtata gaatataatc ggggatgcct ttatcttgaa aaaatgcacc cgcagcttcg 2520 ctagtaatca gtaaacgcgg gaagtggagt caggcttttt ttatggaaga gaaaatagac 2580 accaaagtag ccttcttcta accttaacgg acctacagtg caaaaagtta tcaagagact 2640 gcattataga gcgcacaaag gagaaaaaaa gtaatctaag atgctttgtt agaaaaatag 2700 cgctctcggg atgcattttt gtagaacaaa aaagaagtat agattctttg ttggtaaaat 2760 agcgctctcg cgttgcattt ctgttctgta aaaatgcagc tcagattctt tgtttgaaaa 2820 attagcgctc tcgcgttgca tttttgtttt acaaaaatga agcacagatt cttcgttggt 2880 aaaatagcgc tttcgcgttg catttctgtt ctgtaaaaat gcagctcaga ttctttgttt 2940 gaaaaattag cgctctcgcg ttgcattttt gttctacaaa atgaagcaca gatgcttcgt 3000 taacaaagat atgctattga agtgcaagat ggaaacgcag aaaatgaacc ggggatgcga 3060 cgtgcaagat tacctatgca atagatgcaa tagtttctcc aggaaccgaa atacatacat 3120 tgtcttccgt aaagcgctag actatatatt attatacagg ttcaaatata ctatctgttt 3180 cagggaaaac tcccaggttc ggatgttcaa aattcaatga tgggtaacaa gtacgatcgt 3240 aaatctgtaa aacagtttgt cggatattag gctgtatctc ctcaaagcgt attcgaatat 3300 cattgagaag ctgcagcgtc acatcggata ataatgatgg cagccattgt agaagtgcct 3360 tttgcatttc tagtctcttt ctcggtctag ctagttttac tacatcgcga agatagaatc 3420 ttagatcaca ctgcctttgc tgagctggat caatagagta acaaaagagt ggtaaggcct 3480 cgttaaagga caaggacctg agcggaagtg tatcgtacag tagacggagt atactagtat 3540 agtctatagt ccgtggaatt ctcatgtttg acagcttatc atcgataagc ttttcaattc 3600 aattcatcat ttttttttta ttcttttttt tgatttcggt ttctttgaaa tttttttgat 3660 tcggtaatct ccgaacagaa ggaagaacga aggaaggagc acagacttag attggtatat 3720 atacgcatat gtagtgttga agaaacatga aattgcccag tattckyrrc cgcwwytgca 3780 cagaacaaaa acctgcagga aacgaagata aatcatgtcg aaagctacat ataaggaacg 3840 tgctgctact catcctagtc ctgttgctgc caagctattt aatatcatgc acgaaaagca 3900 aacaaacttg tgtgcttcat tggatgttcg taccaccaag gaattactgg agttagttga 3960 agcattaggt cccaaaattt gtttactaaa aacacatgtg gatatcttga ctgatttttc 4020 catggagggc acagttaagc cgctaaaggc attatccgcc aagtacaatt ttttactctt 4080 cgaagacaga aaatttgctg acattggtaa tacagtcaaa ttgcagtact ctgcgggtgt 4140 atacagaata gcagaatggg cagacattac gaatgcacac ggtgtggtgg gcccaggtat 4200 tgttagcggt ttgaagcagg cggcagaaga agtaacaaag gaacctagag gccttttgat 4260 gttagcagaa ttgtcatgca agggctccct atctactgga gaatatacta agggtactgt 4320 tgacattgcg aagagcgaca aagattttgt tatcggcttt attgctcaaa gagacatggg 4380 tggaagagat gaaggttacg attggttgat tatgacaccc ggtgtgggtt tagatgacaa 4440 gggagacgca ttgggtcaac agtatagaac cgtggatgat gtggtctcta caggatctga 4500 cattattatt gttggaagag gactatttgc aaagggaagg gatgctaagg tagagggtga 4560 acgttacaga aaagcaggct gggaagcata tttgagaaga tgcggccagc aaaactaaaa 4620 aactgtatta taagtaaatg catgtatact aaactcacaa attagagctt caatttaatt 4680 atatcagtta ttacccggga atctcggtcg taatgatttt tataatgacg aaaaaaaaaa 4740 aattggaaag aaaaagcttt aatgcggtag tttatcacag ttaaattgct aacgcagtca 4800 ggcaccggcg gccgcgccgt atttgcagta ccagcgtacg gcccacagaa tgatgtcacg 4860 ctgaaaatgc cggcctttga atgggttcat gtgcagctcc atcagcaaaa ggggatgata 4920 agtttatcac caccgactat ttgcaacagt gccgttgatc gtgctatgat cgactgatgt 4980 catcagcggt ggagtgcaat gtcgtgcaat acgaatggcg aaaagccgag ctcatcggtc 5040 agcttctcaa ccttggggtt acccccggcg gtgtgctgct ggtccacagc tccttccgta 5100 gcgtccggcc cctcgaagat gggccacttg gactgatcga ggccctgcgt gctgcgctgg 5160 gtccgggagg gacgctcgtc atgccctcgt ggtcaggtct ggacgacgag ccgttcgatc 5220 ctgccacgtc gcccgttaca ccggaccttg gagttgtctc tgacacattc tggcgcctgc 5280 caaatgtaaa gcgcagcgcc catccatttg cctttgcggc agcggggcca caggcagagc 5340 agatcatctc tgatccattg cccctgccac ctcactcgcc tgcaagcccg gtcgcccgtg 5400 tccatgaact cgatgggcag gtacttctcc tcggcgtggg acacgatgcc aacacgacgc 5460 tgcatcttgc cgagttgatg gcaaaggttc cctatggggt gccgagacac tgcaccattc 5520 ttcaggatgg caagttggta cgcgtcgatt atctcgagaa tgaccactgc tgtgagcgct 5580 ttgccttggc ggacaggtgg ctcaaggaga agagccttca gaaggaaggt ccagtcggtc 5640 atgcctttgc tcggttgatc cgctcccgcg acattgtggc gacagccctg ggtcaactgg 5700 gccgagatcc gttgatcttc ctgcatccgc cagagggcgg gatgcgaaga atgcgatgcc 5760 gctcgccagt cgattggctg agctcatgag cggagaacga gatgacgttg gaggggcaag 5820 gtcgcgctga ttgctggggc aacacgtgga gcggatcggg gattgtcttt cttcagctcg 5880 ctgatgatat gctgacgctc aatgccgttt ggactagtgt cgaccaacca gataagtgaa 5940 atctagttcc aaactatttt gtcattttta attttcgtat tagcttacga cgctacaccc 6000 agttcccatc tattttgtca ctcttcccta aataatcctt aaaaactcca tttccacccc 6060 tcccagttcc caactatttt gtccgcccac accgtaagat gcttttctgt gact 6114 <210> 3 <211> 16 <212> DNA <213> Artificial <220> <223> primer <400> 3 actggccgtc gtttta 16 <210> 4 <211> 16 <212> DNA <213> Artificial <220> <223> primer <400> 4 catggtcata gctgtt 16

Claims (16)

  1. i) 삽입 부위에서 벡터내에 각각 삽입되어 있는 하나 이상의 표적 DNA 서열을 제공하는 단계;
    ii) 각각의 표적 DNA-함유 벡터를 증폭시키고, 이를 풀링(pooling)시켜 각각의 표적 DNA 서열이 kb당 실질적으로 등몰량으로 풀(pool) 내에 존재하도록 하는 단계;
    iii) 표적 DNA-함유 벡터의 풀을 선택가능한 트랜스포존에 노출시킴으로써, 선택가능한 트랜스포존이 무작위인 부위에서 표적 DNA-함유 벡터내에 통합되어, 표적 DNA- 및 트랜스포존-함유 벡터의 풀을 형성시키는 단계;
    iv) 세포를 표적 DNA- 및 트랜스포존-함유 벡터의 풀로 형질전환시키고, 대표수의 개개의 형질전환체를 분리하고 선택 조건하에 배양물로 증식시키는 단계;
    v) 삽입 부위에서 벡터 서열의 3' 말단에 상보적인 프라이머의 쌍을 사용하고, 각각의 반응 사이클 동안 벡터 서열의 전장 복사체를 효율적으로 생성시키기에는 충분하나 트랜스포존이 삽입된 벡터 서열의 전장 복사체를 효율적으로 생성시키기에는 짧은 신장 시간을 갖는 폴리머라제 연쇄 반응을 각각의 배양물로부터의 DNA 에 대해 수행하는 단계;
    vi) 각각의 폴리머라제 연쇄 반응에서 생성된 DNA의 양을 측정하는 단계; 및
    vii) 상당한 양의 DNA를 생성시키는 폴리머라제 연쇄 반응에 상당하는 배양물로부터의 표적 DNA-함유 벡터의 트랜스포존 플랭킹 부위를 서열분석하는 단계를 포함하는, DNA의 병렬식 트랜스포존-매개된 서열분석 방법.
  2. 제1항에 있어서, 단계 i) 내지 vii) 중 1단계 이상이 자동화되어 있는 방법.
  3. 제1항에 있어서, 각각의 폴리머라제 연쇄 반응에서 생성된 DNA의 양을 측정하는 단계가 dsDNA에 선택적인 형광 염료를 완료된 폴리머라제 연쇄 반응물에 첨가하여, 형광의 생성량을 측정함을 포함하는 방법.
  4. 제3항에 있어서, 단계 i) 내지 vii) 중 1단계 이상이 자동화되어 있는 방법.
  5. 제3항에 있어서, dsDNA에 선택적인 형광 염료가 PICOGREENR 및 비스벤즈이미드 염료로 이루어진 그룹으로부터 선택되는 방법.
  6. 제3항에 있어서, dsDNA에 선택적인 형광 염료가 PICOGREENR인 방법.
  7. 제1항에 있어서, 벡터 및 트랜스포존이 상이한 선택가능한 마커를 보유하는 방법.
  8. 제1항에 있어서, 트랜스포존이 3kb 이상인 방법.
  9. 제8항에 있어서, 트랜스포존이 4kb 이상인 방법.
  10. 제9항에 있어서, 트랜스포존이 도 3에 도시된 바와 같은 GPS-Apra-2㎛-URA3인 방법.
  11. 제8항에 있어서, 트랜스포존이 5kb 이상인 방법.
  12. 제1항에 있어서, 트랜스포존이 벡터의 길이와 동일하거나 이보다 더 긴 방법.
  13. 제12항에 있어서, 트랜스포존이 벡터 길이의 5/4 이상인 방법.
  14. 제13항에 있어서, 트랜스포존이 5kb이고, 벡터가 4kb인 방법.
  15. 제12항에 있어서, 트랜스포존이 벡터 길이의 5/3 이상인 방법.
  16. 제15항에 있어서, 트랜스포존이 5kb이고, 벡터가 3kb인 방법.
KR1020037000251A 2000-07-07 2001-07-05 트랜스포존 매개된 다중 서열분석 KR100823857B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US21638100P 2000-07-07 2000-07-07
US60/216,381 2000-07-07
PCT/US2001/021269 WO2002004674A2 (en) 2000-07-07 2001-07-05 Transposon mediated multiplex sequencing

Publications (2)

Publication Number Publication Date
KR20030021244A KR20030021244A (ko) 2003-03-12
KR100823857B1 true KR100823857B1 (ko) 2008-04-21

Family

ID=22806831

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020037000251A KR100823857B1 (ko) 2000-07-07 2001-07-05 트랜스포존 매개된 다중 서열분석

Country Status (17)

Country Link
US (1) US7229798B2 (ko)
EP (1) EP1327000B1 (ko)
JP (1) JP4807921B2 (ko)
KR (1) KR100823857B1 (ko)
AR (1) AR029582A1 (ko)
AT (1) ATE361994T1 (ko)
AU (2) AU7318501A (ko)
BR (1) BR0112261B1 (ko)
CA (1) CA2415786C (ko)
DE (1) DE60128379T2 (ko)
IL (2) IL153797A0 (ko)
MX (1) MXPA03000038A (ko)
NO (1) NO329791B1 (ko)
NZ (1) NZ523507A (ko)
TW (1) TWI235180B (ko)
WO (1) WO2002004674A2 (ko)
ZA (1) ZA200300035B (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010126356A1 (en) * 2009-04-29 2010-11-04 Hendrix Genetics B.V. Method of pooling samples for performing a biological assay

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997046714A1 (en) * 1996-06-04 1997-12-11 University Of Utah Research Foundation Monitoring hybridization during pcr
WO1998037205A1 (en) * 1997-02-20 1998-08-27 The John Hopkins University School Of Medicine Mutations in atp-dependent transposition proteins that reduce target-site specificity
WO2000026243A2 (en) * 1998-10-29 2000-05-11 Incyte Pharmaceuticals, Inc. Transmembrane 4 proteins

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997046714A1 (en) * 1996-06-04 1997-12-11 University Of Utah Research Foundation Monitoring hybridization during pcr
WO1998037205A1 (en) * 1997-02-20 1998-08-27 The John Hopkins University School Of Medicine Mutations in atp-dependent transposition proteins that reduce target-site specificity
WO2000026243A2 (en) * 1998-10-29 2000-05-11 Incyte Pharmaceuticals, Inc. Transmembrane 4 proteins

Also Published As

Publication number Publication date
AR029582A1 (es) 2003-07-02
JP4807921B2 (ja) 2011-11-02
AU7318501A (en) 2002-01-21
CA2415786A1 (en) 2002-01-17
EP1327000A2 (en) 2003-07-16
DE60128379T2 (de) 2008-01-10
US20030219779A1 (en) 2003-11-27
ZA200300035B (en) 2004-03-15
TWI235180B (en) 2005-07-01
IL153797A0 (en) 2003-07-31
EP1327000B1 (en) 2007-05-09
NO329791B1 (no) 2010-12-20
NO20026206L (no) 2003-02-25
ATE361994T1 (de) 2007-06-15
MXPA03000038A (es) 2003-08-19
WO2002004674A3 (en) 2003-04-17
DE60128379D1 (de) 2007-06-21
KR20030021244A (ko) 2003-03-12
BR0112261A (pt) 2003-09-02
US7229798B2 (en) 2007-06-12
JP2004502467A (ja) 2004-01-29
BR0112261B1 (pt) 2012-10-02
WO2002004674A2 (en) 2002-01-17
CA2415786C (en) 2007-09-25
NZ523507A (en) 2005-01-28
IL153797A (en) 2008-06-05
AU2001273185B2 (en) 2006-05-18
NO20026206D0 (no) 2002-12-23

Similar Documents

Publication Publication Date Title
RU2752700C2 (ru) Способы и композиции для днк-профилирования
EP2321429B1 (en) Methods and kits for nucleic acid sequencing
CN105358709A (zh) 用于检测基因组拷贝数变化的系统和方法
CN106257989B (zh) Ngs系统对照和涉及所述ngs系统对照的方法
DeFraia et al. Analysis of retrotransposon activity in plants
US20200040390A1 (en) Methods for Sequencing Repetitive Genomic Regions
CN115109842A (zh) 用于准确的平行定量核酸的高灵敏度方法
KR100823857B1 (ko) 트랜스포존 매개된 다중 서열분석
EP3325697B1 (en) Optimized clinical sample sequencing
WO2020259303A1 (zh) 一种快速构建rna 3&#39;端基因表达文库的方法
Tagu et al. Techniques for molecular biology
AU2001273185A1 (en) Transposon mediated multiplex sequencing
CN108913761B (zh) 一种用于筛查遗传性肝病的试剂盒
JP2005528909A (ja) コンビナトリアルオリゴヌクレオチドpcrの改善方法
CN108504722A (zh) 一种基于锁型探针等温扩增快速检测串联重复序列的方法
Cseke et al. DNA sequencing and analysis
CN112280884B (zh) 一种适用于玉米基因分型的InDel标记及其应用
Work Get Your Genes From the Top Gene Synthesis Provider 100% Sequence Accuracy Guaranteed
Rapley Molecular cloning and DNA sequencing
CN117385013A (zh) 一种靶向测序试剂盒及其使用方法
Ociepa Genome Sequencing as a Tool for Understanding Microorganisms
Urmanov et al. ANALYSIS OF THE EVOLUTION OF TECHNOLOGIES FOR DETERMINING THE NUCLEOTIDE SEQUENCE OF A DNA MOLECULE
CN117625763A (zh) 准确地平行定量变体核酸的高灵敏度方法
CN117625764A (zh) 准确地平行检测和定量核酸的方法
Jain et al. 14 ChaPtEr Next-Generation Sequencing

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130321

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140320

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee