KR20050073466A - 서브텔로미어 디엔에이 프로브 및 이의 제조 방법 - Google Patents

서브텔로미어 디엔에이 프로브 및 이의 제조 방법 Download PDF

Info

Publication number
KR20050073466A
KR20050073466A KR1020057005567A KR20057005567A KR20050073466A KR 20050073466 A KR20050073466 A KR 20050073466A KR 1020057005567 A KR1020057005567 A KR 1020057005567A KR 20057005567 A KR20057005567 A KR 20057005567A KR 20050073466 A KR20050073466 A KR 20050073466A
Authority
KR
South Korea
Prior art keywords
probe
chromosome
probes
chromosomal
sequence
Prior art date
Application number
KR1020057005567A
Other languages
English (en)
Inventor
피터 케이. 로간
조안 크놀
Original Assignee
칠드런스 머시 호스피탈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 칠드런스 머시 호스피탈 filed Critical 칠드런스 머시 호스피탈
Publication of KR20050073466A publication Critical patent/KR20050073466A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6841In situ hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

본 발명은 서브텔로미어 프로브 및 서브텔로미어 프로브를 개발하는데 사용할 수 있는 프라이머쌍, 및 이들의 제조 및 사용 방법에 관한 것이다. 상기 프로브는 염색체의 텔로미어에 아주 근접하여 위치하고, 오늘날 이용가능한 프로브보다 일반적으로 아주 더 작다.

Description

서브텔로미어 디엔에이 프로브 및 이의 제조 방법{SUBTELOMERIC DNA PROBES AND METHOD OF PRODUCING THE SAME}
서열 목록
본 출원은 서면 및 이와 함께 제출한 두 개의 동일한 CD-ROM에 포함된 서열 목록(sequence listing)을 포함한다. 서면상의 이러한 서열 목록은 두 개의 CD-ROM의 서열 목록과 동일하고 모두 본원에 참조로 포함되는 것이다.
본 발명은 염색체의 서브텔로미어 영역에서 발생하는 염색체 재배열을 검출하기 위한 염색체 말단 및 서브텔로미어(subtelomere)에 관한 것이다. 더욱 구체적으로, 본 발명은 의학 및 암 유전자 진단에서 이러한 염색체 재배열을 동정하기 위해 사용될 수 있는 프로브(probe)에 관한 것이다. 또한, 본 발명은 혼성화 분석이 텔로미어 또는 서브텔로미어 영역에서 재배열을 받았는 지의 여부를 나타내는 것인 게놈내의 단일 위치에 혼성화하기에 효과적인 단일 카피 프로브에 관한 것이다. 또한, 본 발명은 오늘날 기존의 클로닝된 프로브로 검출할 수 있는 것보다 더욱 넓은 범위의 비정상 염색체 말단을 검출하고, 염색체의 텔로미어 및 서부텔로미어가 얼마나 많이 구성되어야 하는 지를 알 수 있게 하고, 이러한 염색체 영역의 서열들이 서로 얼마나 연관이 있고 다른 염색체 영역과 얼마나 연관이 있는 지를 상관시키고, 재배열을 특정의 임상학적 증상과 상관시키고, 유전적으로 균형 및 불균형한 염색체 재배열에서 절단점(breakpoint)을 특성화하기에 유용한 단일 카피 프로브에 관한 것이다. 끝으로, 본 발명은 이러한 프로브를 제조하는 방법에 관한 것이다.
염색체는 유기체의 DNA 함유 세포 구조체로서, 세포 분할 동안에 형태학적 실체로서만 보여질 수 있다. 염색체는 두 개의 염색분체로 구성된다. 각 쌍의 염색분체는 동족체를 형성하는데, 각각은 단완(p완), 장완 (q완), 상기 장완과 단완을 연결하는 동원체 및 각 말단의 텔로미어를 갖는다. 염색체를 화학물질 또는 열로 전처리한 후, 각각의 완(arm)은 크로마틴 축합의 함수인 번갈은 밝고 어두운 분염(banding) 패턴을 나타낸다. G-분염은 임상학적 세포유전학에서 통상적으로 사용되는 것이다. R-분염은 경우에 따라 사용되는 것으로 밝고 어두운 G-밴드의 역패턴이다. 본 원에서는 G-분염 염색체를 나타내기로 한다.
동원체는 염색분체를 서로 결합시키고 체강 및 배아 세포에서 염색체를 정확히 분리시키는 특수한 단백질-DNA 구조이다. 흔히 이러한 동원체는 염색체에서 수축된 영역으로서 보여질 수 있고 그의 위치에 따라 그 염색체가 중부인지, 차중부인지 아니면 차단부인지를 결정할 수 있다. 중부 염색체의 경우, p완의 길이는 q완의 길이와 대략 동일하다. 차중부 염색체의 경우, p완의 길이는 q완의 길이보다 아주 짧다. 차단부 염색체는 아주 반복적인 서열 및 리보좀 RNA에 대한 유전자의 다중 카피로 구성되는 특수한 단완을 갖는다.
텔로미어는 염색체의 각 염색분체의 말단을 한정하는 특수한 단백질-DNA 구조이다. 대표적으로, 상기 텔로미어는 밝은 G-밴드에 위치하는 것으로, 어두운 G-밴드와 비교하여 유전자가 풍부하고 더욱 저밀도의 반복 서열들을 포함한다. 밝은 G 밴드에서 그 위치때문에, 염색체의 말단(텔로미어)들 사이의 교환 및 재배열을 시각적으로 검출하는 것은 어렵다. 텔로미어가 염색체 특이적이지 않지만, 이들에 바로 인접하며 명염색 G-밴드에 위치하는 서브텔로미어 또는 텔로미어 관련 반복 서열은 염색체 특이적일 수 있다. 이러한 텔로미어 자체는 3-20 kb 길이의 TG 풍부 반복 서열을 갖는데, 척추동물의 경우에는 (TTAGGG)n이다. 이러한 배열은 염색체 말단끼리의 융합 및 핵외효소적 분해(exonucleolytic degradation)를 방지함으로써 염색체의 안정성을 유지하는데 필요한 것이다. 추가로, DNA의 복제에 텔로미어가 필요하고, 이러한 텔로미어는 세포 수명을 유지하는데 O요한 역할을 한다. TTAGGG 탠덤 반복체에 바로 이웃한 것은 길이가 몇 kb인 복잡한 반복 DNA이다. 이러한 서열은 다중 염색체에 존재하려는 경향이 있고, 서브텔로미어 영역에 국한된다. 인간의 자연발생 돌연변이로부터, 이러한 반복체가 부족한 염섹체는 정상적으로 유전됨으로써, 이러한 서열은 중요한 생물헉적 역할이 없다는 것을 알 수 있다. 4p, 16 및 22q에 인접한 DNA를 서열 분석한 결과, 서브텔로미어 영역을 다른 염색체 말단과 상이한 서열 유사성을 갖는 말초부(distal) 및 기부(proximal) 서브도메인으로 분할하는 간질성 변질(TTAGGG)n 반복체가 확인되었다. 상기 기부 서브텔로미어 서열은 소수의 염색체들에 공통되는 긴 서열을 함유하고, 상기 말초부 서브텔로미어 서열은 많은 염색체들에 공통되는 전술한 짧고 복잡한 반복체를 함유한다. 추가로, 상기 서브텔로미어 영역을 포함하는 인간 게놈의 다수 영역에서 염색체 특이적이고 카피가 낮은 반복체 또는 듀플리콘(duplicon)(즉, 파라로그)가 발생할 수 있다. Trask 등은 복제되고 많은 인간 텔로미어와 높은 유사성을 갖는 큰 단편의 DNA내의 후각 수용체 유전자류를 동정했다. 아주 관련있는 서열(95% 이상의 상동성)의 비알레르기성 카피들 사이의 유사성때문에, 서브텔로미어 도메인을 분자 수준에서 분석하는 것이 아주 어려웠다.
서브텔로미어 영역(인접 서열)의 증가 또는 손실을 포함하는 Subtle 염색체 재배열이 특발성 정신 지체 및 기타 유전적인 임상학적 기형이 있는 개체의 0-10%에서 관찰되었다. 서브텔로미어 프로브의 다른 용도로는, 재발성 자발성 유산 및 불임 개체의 연구, 체질성 및 후천성 염색체 기형의 특성화, 전이식 진단의 선택, 및 만성 융모 표본채취 또는 조기 양막천자를 위해 얻은 간기 세포를 이용한 기형의 진단이 있다.
세포유전학적으로 정의되는 말단 결실이 하기의 세 개의 기작에 의해 발생한다: 텔로미어 재생 또는 치유, 간질성 결실을 생성하는 최초 텔로미어의 유지, 및 세포유전학적 재배열을 통해 상이한 텔로미어 서열을 얻음으로써 염색체 유도체의 형성. 대부분의 텔로미어 결실은 텔로미어 재생에 의해 안정화될 수 있기 때문에, 텔로미어에 가능하면 근접한 프로브를 이용하여 최대수의 말단 결실을 검촐하여야 한다는 것을 알 수 있다.
이러한 재배열의 크기가 작고 희미한 염색 밴드가 대부분의 염색체의 말단에 존재하기 때문에, 상기 재배열은 G-분염법 또는 R-분염법을 포함한 일상적인 세포유전학적 방법에 의해서는 검출될 수 없다. 대신에, 이들은 형광 동소 혼성화(FISH)로 나타낸 방법으로 염색체에 DNA 프로브를 혼성화하고 형광 분광분석하거나 또는 마이크로스텔라이트 분석을 실시하여 검출된다. 환자외에도 어버이 및/또는 기타 가족 구성원을 연구할 필요가 있는 마이크로스텔라이트 분석과 다르게, FISH는 기형을 검촐하기 위해 환자의 시료만을 필요로 한다. 일반적으로 통상의 FISH 프로브는 60,000 내지 170,000 염기쌍 길이로서 평균이 약 110,000 염기쌍(염색체 밴드의 평균 크기인 5백만 염기쌍이 아님)이며, 일반적으로 한 염색체 밴드의 일부로부터 얻어진다. 따라서, FISH는 일반적은 세포 유전학적 방법에 의해서는 볼 수 없는 기형을 검출할 수 있다. 상기 프로브는 염색체 팔의 말단에 근접한 상동성 DNA 서열에만 혼성화된다. 정상 개체의 경우, 부모 각각으로부터 하나씩 2 카피의 서열이 있으므로 각 세포에서 2 부위가 혼성화된다. 불균형한 말단 염색체 배열이 있는 환자의 경우, 서열의 카피수 및 위치에 편차가 있으므로, 동족 염색체의 말단으로부터 혼성화가 없는 경우 결실이 검출되고 또 다른 염색체상에 추가의 혼성화가 존재하는 경우 3염색체가 검출된다. 혼성화의 염색체 위치는 염색체의 세포유적학적 특성화로부터 바로 명백하게 됨으로써, 균형 및 불균형 전좌 모두를 검출할 수 있다.
아주 반복적인 텔로미어 구조를 가정하고 오늘날의 모든 방법이 독특한 서열의 존재에 따라 서브텔로미어 영역을 탐색한다는 사실을 가정하면, 감도와 특이성의 사이에 오늘날의 분석법을 이용한 교환이 있다. 감도는 최소의 결실을 검출하는 프로브를 가지는 것으로 정의되고 특이성은 특정의 염색체로부터 유래한 서열만을 함유하는 프로브로서 정의된다. 말단부 텔로미어 및 서브텔로미어 영역에서 복잡한 반복체를 함유하는 프로브는 염색체의 말단에 근접하게 놓여지지만, 단일 카피 프로브의 선택성이 없다(이러한 프로브는 다중 또는 모든 텔로미어의 일체성을 동시에 평가하는데 사용할 수 있다). 특정 서브텔로미어 영역을 검출할 수 있는 오늘날의 염색체 특이적 프로브는 일반적으로 크고, 말초부 서브텔로미어 간격(interval)으로 놓여지지 않는다. 이러한 거대한 크기 때문에, 이러한 통상적인 FISH 프로브는 다른 염색체상에서 확인되는 저빈도수 이원성(paralogous) 서열을 함유할 가능성이 더 크고, 이러한 염색체 표적에의 혼성화는 C0t1 DNA의 첨가에 의해 억제될 수 없다. 다른 염색체상에서 이원성 카피가 없는 클로닝된 프로브 서열을 선정하기 위하여, 통상적인 FISH 프로브는 유전자좌 특이적 단편을 포함하여야 한다. 이러한 기준을 만족시키는 서열은 텔로미어로부터 상당히 떨어져 있다. 프로브가 인식하는 서열과 텔로미어 사이에 발생하는 결실은 이러한 프로브에 의해서는 검출될 수 없다. 따라서, 거대 염색체 특이적 텔로미어 프로브를 이용하는 분석법은 감도를 저하시킬 수 있는데, 이는 더욱 먼 말단 재배열을 검출할 수 없기 때문이다.
차단부 p완을 제외하고 각각의 텔로미어에 대한 염색체 특이적 FISH 프로브의 제 1 세대는 인산 염색체의 거대 말단 단편들을 갖는 것으로 코스미드, 포스미드, 박테리오파지, P1, PAC 클론이었다. 이들 클론은 염색체상에서 반복 서열과 상호분산된 단일 카피 서열의클러스터로 구성된다. 이러한 게놈 구조에는 소량의 염색체 서열이 있다. 절반 YACS는 1p, 5p, 6p, 9p, 12p, 15q, 및 20q 텔로미어에는 이용될 수 없으며, 이들 말단은 인간 방사선 하이브리드 지도상의 대부분의 텔로미어 마커를 갖는 게놈 라이브러리를 선별함으로써 유도되었다. 따라서, 이들 클론과 동족 텔로미어 사이의 물리적인 거리는 알려지지 않았다. 통상적인 FISH 에서 사용되는 일부의 상업적으로 이용가능한 프로브들은 텔로미어에 근접하여 위치하지 않으며 그 말단으로부터 수백 kb 떨어져 있는 것으로 알려져 있다. 상업적으로 이용가능한 9p 클론이 텔로미어로부터 1.2-1.5 Mb 떨어져 있고 상업적으로 이용가능한 12p 클론이 텔로미어로부터 800 kb 이상 떨러져 있는 반면에 상업적으로 이용가능한 15q 클론이 텔로미어로부터 약 100 kb 떨어져 있다는 것이 확인된 이후에 간기 지도작성이 이루어졌다. 일부의 상업적으로 이용가능한 1p, 5p, 6p, 11q, 19p 및 Yp 클론에 대한 거리는 아직 알려지지 않고 있다. 클론과 해당하는 텔로미어 사이의 큰 간극 사이즈, 혼성화 패턴에서의 게놈 다형성 및 교차 혼성화는 제 2 세대의 텔로미어 특이적 클론의 개발을 촉진했다. 이러한 클론들은 텔로미어의 근방에 있지만, 염색체의 말단에 대한 실질적인 거리는 남아있다. 상업적으로 이용가능한 일부의 프로브는 염색체의 말단 명염색 밴드 영역에 체류하지 않을 정도로 멀리 떨어져 있다. 예를 들어, 상업적인 14qtel 프로브에서 서열 tag 부위(STS)의 좌표를 기준으로, 상기 프로브는 어두운 G-밴드인 14q32.32에 위치하므로, 말단의 밝은 밴드에 포함될 수 있는 어떤 프로브보다 텔로미어에 더욱 근접하게 된다. 이러한 클론들은 혼성화 세기를 충분하게 하는 거대한 인서트(insert)이지만, 프로브 자체에 포함되는 서열 또는 텔로미어 자체에 더욱 근접하는 서열의 결실을 검출할 수 없다.
통상적인 FISH에 있어서, DNA 프로브는 독특하고 반복적인 합성 DNA로 구성되는 큰 게놈 간격(약 50 내지 수백 kb)을 함유한다. 반복 DNA는 넓은 분포를 가지므로, 염색체 특이적 기형의 검출을 방해할 수 있다. 따라서, 반복 DNA를 억제하고 반복 서열이 염색체 DNA에 결합하는 것을 방지하기 위한 방법이 개발되어 왔다. 이러한 방법중 한 가지는 이러한 반복 서열을 과량의 표지되지않은 반복 DNA로 예비 어닐링하여 프로브의 독특한 서열만을 염색체에 혼성화하는 것을 포함한다.
통상적인 프로브는 서열화되지 않기때문에 이들의 위치가 염색체에서 정확히 결정되지 않았다는 것을 포함한 많은 결점이 있다. 이러한 프로브내에 포함된 이용가능한 서열 표지 부위(STS)의 서열들을 비교함으로써, 이러한 프로브들중 몇 가지는 텔로미어로부터 상당히 떨어져 있는 서열을 함유하는 것으로 입증되었다. 통상적인 프로브 자체의 길이는 대략적으로만 결정되었고 STS가 프로브의 임의의 장소에서 발생할 수 있었다. 이로써, 프로브의 정확한 위치는 프로브의 대략적인 길이에 해당하는 동일 길이내에서만 측정될 수 있다는 것을 알 수 있다. 또한, 이러한 통상적인 프로브중 일부는 텔로미어로서 작용하는 서열의 존재에 대하여 하프 YAC를 기능적으로 상보화시킴으로써 유도되었다. 실제로, 이러한 합성 DNA 서열들중 몇 가지는 다수의 염색체 팔의 실제 텔로미어를 함유하지 않는다. 인간의 조상 혈통에서 텔로미어로서 이용될 수 있었던 텔로미어형 서열이 인간 염색체내의 다수의 위치에서 확인될 수 있고,이러한 서열들은 인간 텔로미어 및 관련된 단일 카피 서열을 회복하기 위해 개발되어온 상보 연구에서 사용을 위해 선택될 수 있었다.
또한, Vysis, Inc. 및 Knight 등이 보고한 서열 표지 부위(STS)는 인간 게놈 기구 명명 위원회에 의한 것이기 보다는 내부 실험실 용어이기 때문에 몇 가지의 통상적인 프로브의 좌표가 결정될 수 없다. 이러한 실험실 STS가 게놈 데이터베이스, 유전자은행, 또는 기타 공공 데이터베이스에 기탁되지 않은 경우, 이러한 STS의 실험실 용어는 공개적으로 지정된 STS와 관련이 없을 수 있다. 따라서, 이러한 장애로 인하여, 이러한 STS들중 몇 가지의 위치는 공중용 소오스로부터 결정되지 않았다. 따라서, 서브텔로미어 서열을 함유하는 것으로 판단되는 합성 클론은 상기 STS를 통해 기준 게놈 서열에 고정될 수 없고 게놈내에서 이들의 위치는 이들 프로브의 현미경 검사를 통하지 않고는 확인될 수 없다. 이러한 현미경 검사는 인간 게놈 기준 서열 상으로의 지도작성에 의해서 달성될 수 있는 매우 높은 해상도가 없다. 세포 유전학적 실험에서 일반적으로 사용되는 이용가능한 몇 가지의 서브텔로미어 프로브를 지도작성할 수 없는 것은 염색체의 말단 밴드를 포함한 염색체 기형이 있는 환자에 반대의 결과를 초래할 수 있다. 이러한 프로브가 염색체의 말단으로부터 상당히 떨어져서 배치되는 서열(14qter 및 16qter 프로브)들로 구성되는 경우, 기형을 검출하지 못하는 것이 염색체상의 프로브의 위치, 재배열된 염색체 영역의 크기 또는 두 인자 때문 인지의 여부를 결정할 수 없다. 이것은 염색체 1p, 5p, 6p, 11q, 19p, Yp, Yq에 대하여 이용할 수 있는 서브텔로미어 프로브의 경우이다. 이러한 프로브의 경우, 기형을 검출하지 못하는 것이 프로브를 이용한 잘못된 소견(즉, 오류)에서 비롯된 것인지를 결정할 수 없다. 이러한 상태는 질병의 임상학적 진단에 사용된 시약의 경우에는 허용될 수 없고, 이들에 기초하는 의료용 진단 장치의 적용은 미합중국 FDA에 의해 거절될 수 있다. 상기 프로브가 연구용으로만 표지되는 것은 물론이다. 또한, 상기 프로브의 기원이 되는 클론이 더 이상 이용될 수 없기 때문에 당업자가 이러한 프로브중 몇 가지의 위치를 탐색하는 것도 불가능하다. 이로써, 일반적으로 사용되는 이러한 통상적인 클로닝된 시약은 임상학적 기형의 검출에 일반적으로 사용된다는 사실에도 불구하고 품질 조절 기준에 이용될 수 없다는 것을 알 수 있다. 인간 게놈 서열의 완성 이후로, 인간 게놈 지도작성 및 특성화를 위한 게놈 시약을 제조하였던 몇 몇의 회사들은 수요가 없기 때문에 이러한 제품에 대한 지원을 중단하거나 이들을 더 이상 유지하지 않았다. 이러한 회사들중 하나로서 서브텔로미어 재배열의 검출을 의한 합성 제품을 제조하던 회사는 더 이상 사업하지 않았고 이들을 획득한 회사는 2년 전에 제품 라인에 대한 지원을 중단했다. 따라서, 정확히 배치되는 프로브로서 실질적으로 영구히 이용가능한 게놈 서열로부터 유도되는 프라이머 포로브가 필요하다.
끝으로, 종래의 프로브는 게놈내의 다른 위치에 교차 혼성화되는 것으로 확인되어 왔다. 이는 서브텔로미어 분석을 위한 많은 합성 DNA 서열이 서열화되지않고 있으므로, 이들에 함유된 DNA 서열이 동일 또는 상이한 염색체상의 다른 먼 위치에서 이원성 서열을 갖지 않는다는 것을 인간 게놈서열 분석으로 확인하기가 불가능하기 때문이다. 따라서, 이러한 프로브중 몇 가지는 다른 염색체에 교차 혼성화되는 것으로 확인되었다. 제조업자(Vysis, Inc)는 하기의 프로브들이 다른 염색체에 됴차 혼성화된다는 것을 그의 제품 문헌을 통해 나타내고 있다.
추가로, Xp 및 Yp는 상동성이 있고 이들 모두를 검출하는 단일 프로브가 이용가능하다. 마찬가지로, Xq 및 Yq는 상동성이 있기때문에 이들 모두를 검출하는 단일 프로브가 이용가능하다.
이러한 교차 혼성화의 가능한 역효과를 설명하기 위한 가설예를 이용할 수 있다. 어버이가 염색체 10p 및 12p 사이에서 전이한 숨은 염색체 재배열을 함유하고 이러한 전이가 그 자손에게 불균형하게 전달됨으로써 10p 서열중 하나가 누락되어 있고 12p 서열이 중복되어 있다고 가정하자. 10p 프로브를 이용하여, 정상 카피 염색체 10p는 단일 염색체 12p에 교차 혼성화됨으로써, 이들 염색체들 사이의 전위가 일어났다는 것을 알 수 있다. 다른 상동 염색체로부터의 10p 서열의 상실때문에, 각 염색체 10p 및 12p 상에는 단지 하나의 혼성화 증거만이 있다. 그러나, 염색체 12 프로브는 10p 프로브에서 확인되는 결과와 일치하지 않는 세 개의 염색체 카피에 혼성화될 수 있다. 상기 두 소견을 명백히 해석하는데는 불필요할 정도로 복잡한 설명이 필요하다. 따라서, 교차 혼성화되지 않는 프로브가 당업계에서 필요하다. 이러한 프로브는 전위의 존재 및 핵형의 불균형 특성을 명백하고 간단하게 입증할 수 있다.
오늘날, 서브텔로미어 영역을 연구하기 위한 두 가지의 가장 공통적인 방법은 1) 말단 염색체 밴드로 지도작성된 프로브(BAC, PAC, P1, YAC, 및 기타 거대한 합성 클론)의 FISH 및 2) 서브텔로미어 영역으로 지도작성된 다형성 마이크로세이텔라이트 마커의 사용이다. 첫번째 방법의 경우, 다수의 단점이 관찰된다. 우선, 특정의 서브텔로미어 프로브의 교차 혼성화가 명백히 일어나고, 결실을 초래하는 일부의 다형성이 검출되었고, 상기 프로브 모두가 보고된 바와 같이 염색체 말단에 근접하지 않음으로써, 상기 프로브들은 더욱 작은 서브텔로미어 재배열은 검출할 수 없었다. 표 3은 임상학적 진단에서 사용된 상업적인 프로브들의 염색체 말단으로부터의 거리를 보여준다.
다형성 마이크로세이텔라이트 분석을 이용하는 두 번째 방법의 경우, 항 가지 단점은 마커가 염색체들 사이에서 구별되어야 하고 대부분의 마카들이 텔로미어로부터 비교적 멀리 떨어져 위치한다는 것이다. 따라서, 이러한 방법은 작은 결실을 쉽게 누락시킬 수 있다. 또 다른 단점은 환자 부모의 DNA 시료가 필요하다는 것이다.
서브텔로미어 영역을 평가히기 위해 다른 분자적 방법이 개발 및 사용되어 왔다. 멀티플렉스 증폭가능한 프로브 혼성화(MAPH)는 특정의 유전자 자리에서 카피수의 평가를 가능하게 하는 방법이다. 이러한 방법은 오늘날의 지도작성된 유엊적 유전자 자리/STS의 정확한 게놈 배치에 의존하고 유전자자리/STS가 염색체 말단내의 틀린 위치에 배치되는 경우에는 작은 결실이 누락될 수 있다. 예를 들어, D16S3400은 300 kb의 염색체 말단에 최초에 위치하였지만, 본 발명자들은 이것을 2003년 4월판 게놈 서열(표 3)을 이용하여 염색체 말단으로부터 3000 kb 이상 떨어지게 위치시켰다.
멀티플렉스 라이게이션 의존 프로브 증폭(MLPA)은 환자의 시료에 대하여 실시하기가 덜 지루하고 단순하다는 것을 제외하고, MAPH와 개념적으로 유사한 방법이다. MAPH와 마찬가지로, 시료중의 서열 커피수의 측정은 환자의 정제된 게놈 DNA에 대한 프로브의 초기 혼성화에 의해 수행된다. 표적 서열에 관한 제 2 프로브를 이용하여 혼성화 서열의 양을 측정하는 대신에, MLPA는 시험관내에서 상기 표적에 상동인 매우 짧은 서열을 라이게이션함으로써 혼성화 표적에 대한 특히성을 달성한다. 게놈 표적의 보완물에 인접한 벡터 서열내의 유니버셜 프라이머를 이용하여 어닐링 및 혼성화 프로브의 PCR 증폭을 실시하여 판독한다. 그러나, 상기 두 방법 모두는, 정상 및 비정상 표적에서 혼성화의 비를 측정하여 기형을 검출하기 때문에, 정상 개체내의 게놈 표적 서열의 당일 카피 특성의 종래 이론에 의존한다. 이러한 방법은 프로브의 개발 동안에 프로브의 단일 카피 특성이 설정되는 본 발명의 방법과 대조를 이루는 것이다. 이것은 평범한 차이가 아닌데, 프로브에 관한 게놈에서 이원성 서열이 존재하면 잘못된 양성 검출이 초래될 수 있고 프로브 서열을 이용하여 측정한 카피수 비율을 왜곡시킬 수 있기 때문이다. MPLA 프로브에 함유된 매우 짧은 길이의 상동성 게놈 서열을 전제로 하면, 당업자는 게놈내에 이원성 서열이 존재하지 않는다는 것을 확신하기 위하여, 프로브의 기원이 되는 유전자 영역의 단일 카피 특성의 종래 이론을 이용할 수 있다. 끝으로, MLSPA는 MAPH보다 실시하기가 더욱 간단하지만, 환자의 시료를 테스트하기에 앞서 합성 방법에 의해 파지 백터내의 한쌍의 게놈 서열을 클로닝하기 위하여 실질적으로 증가된 노력이 요구된다. 이러한 클로닝 단계는 본 발명에서는 불필요한 것이다.
어레이에 기초한 비교 게놈 혼성화(CGH)가 서브텔로미어 재배열을 조사하기 위해 사용되어 왔다. 이러한 방법은 게놈의 다중 영역들을 동시에 조사할 수 있다는 이점이 있지만, 본 발명에서는 없는 다수의 함정이 있다. 불균형 재배열의 검출을 위하여, 텔로미어 영역에서 거대한 클로닝된 합성 프로브가 필요하다. (a) 이러한 프로브들중 몇 가지는 텔로미어에 근접하지 않고, (b) 큰 사이즈의 이러한 프로브들은 작은 재배열은 검출할 수 없고, (c) 프로브에 상동인 서열의 일부와 중복되는 말단 염색체 재배열이 완전한 것으로 기록될 수 있고, (d) 이러한 프로브에서 반복 서열의 혼성화가 과량의 Cot1 DNA에 의해 차단될 수 있다. Cot1 DNA 배치 및 이러한 차단 과정의 효율의 변화성으로 인해 이러한 과정의 실험실 재현성이 저하됨으로써, 임상 및 연구용 테스트에 부적당한 것으로 확인되었다.
대부분의 이러한 방법은 불균형 염색체 보완 및 임상학적 기형을 갖는 자손을 초래할 수 있는 재배열의 어버이 운반체를 확인하는데 필요한 균형 전위를 검출하지 못한다. 프로브에 상동인 서열내에 염색체 파괴점이 포함되거나 상기 프로브가 파괴점으로부터 멀리있는 것으로 알고있는 경우, 통상의 FISH 방법은 이러한 재배열을 검출할 수 있다. 서브텔로미어 프로브가 이러한 재배열을 검출하는 가능성은 아주 낮은데, 염색체 간격(interval)내에서 파괴가 일어나고 정확히 편재되지 않은 거대한 영역과 비교하여 아주 작기때문이다. 대조로, 이러한 재배열을 위한 파괴점은 게놈내의 그 위치가 프로브의 개발동안에 결정되는 이러한 염색체 밴드로부터 유도한 단일 카피 프로브의 조직적 혼성화를 통해 확인될 수 있다. 참고문헌[Knoll 및 Rogan, Am J Med Genet 2003].
특허 또는 출원 파일에는 칼라로 만들어진 사진의 형태로 적어도 하나의 도면을 포함하고 있다. 칼라 도면(들)를 첨부한 특허 또는 특허 출원 공보의 사본이 요청해서 필요한 요금을 지불하면 특허청으로부터 제공될 것이다.
도 1은 다양한 염색체 상의 특정 염색체 위치에 교배시킨 다양한 프로브를 보여주는 12매의 연속 사진이다. 이들 이미지는 도 2 내지 도 13에 확대되어 있다.
도 2는 염색체 5q에 교배시킨 2.6kb 프로브의 사진이다.
도 3은 염색체 7q에 교배시킨 2.5kb 프로브의 사진이다.
도 4는 염색체 9q에 교배시킨 2.2kb와 2.4kb 프로브의 사진이다.
도 5는 염색체 13q에 교배시킨 3.2kb 프로브의 사진이다.
도 6은 염색체 14q에 교배시킨 3.8kb와 1.8kb 프로브의 사진이다.
도 7은 염색체 17p에 교배시킨 2.6kb 프로브의 사진이다.
도 8은 염색체 18q에 교배시킨 2.5kb 프로브의 사진이다.
도 9는 염색체 19q에 교배시킨 2.0kb 프로브의 사진이다.
도 10은 염색체 20p에 교배시킨 2.6kb 프로브의 사진이다.
도 11은 염색체 20q에 교배시킨 2.1kb, 3.0kb 및 3.2kb 프로브의 사진이다.
도 12는 염색체 22q에 교배시킨 3.5kb 프로브의 사진이다.
도 13는 염색체 Xq에 교배시킨 2.5kb 프로브의 사진이다.
도 14는 염색체 19q에 교배시킨 2.3kb 프로브의 사진이다.
도 15는 특정 염색체 아암 상에 배치된 다양한 프로브를 나타내는 일련의 사진들이다.
도 16은 텔로미어(telomere)에 대하여 단일 카피 프로브의 위치를 나타내는 염색체 말단의 구조를 보여주는 개략도이다.
도 17은 티오 13q 아암에서 다양한 유전자 위치들과, 종래 기술 프로브에 대한 이들 위치의 관계와 본 발명에 따른 단일 카피 프로브에 대한 이들 위치의 관계를 보여주는 개략도이다.
도 18은 비정상 또는 파생 염색체 6와 정상 염색체 18을 가진 중기 스프레드(spread)에 교배시킨 단일 카피 염색체 18q 프로브(길이 2530 bp)의 사진이다.
도 19는 정상적이인 중기 세포들에 교배된 염색체 14q (1984 bp) 및 염색체 3p (2093 bp)를 위한 2개의 단일 카피 서브 텔로미어 프로브의 사진이다.
본 발명은 종래 기술의 결점을 극복하고 맹백한 기술의 발전을 제공한다. 특히, 본 발명은 서브텔로미어 기형의 검출을 위한 대응하는 클로닝된 시판 프로브보다 상당히 더 작고 염색체 말단에 더욱 근접하는 독특한 서열의 단일 카피 혼성화 프로브를 개발한다. 각각의 프로브는 단일 염색체 팔(arm)에 특이적인 것이 바람직하다. 추가로, 상기 프로브는 형광 분광분석, 어레이 비교 게놈 혼성화 또는 관련 기술을 이용한 검출에 충분한 길이를 가져야 한다. 본 발명의 프로브는 길이가 바람직하게는 25 kb 이하, 더욱 바람직하게는 약 25 염기쌍 내지 약 15 kb, 더욱 바람직하게는 약 50 염기쌍 내지 약 12 kb, 더욱 바람직하게는 약 60 염기쌍 내지 약 10 kb, 더욱 바람직하게는 약 70 염기쌍 내지 약 9 kb, 더욱 바람직하게는 약 80 염기쌍 내지 약 8 kb, 더욱 바람직하게는 약 90 염기쌍 내지 약 7 kb, 더욱 바람직하게는 약 100 염기쌍 내지 약 6 kb, 더욱 바람직하게는 약 250 염기쌍 내지 약 5 kb, 더욱 바람직하게는 약 500 염기쌍 내지 약 4.5 kb, 더욱 바람직하게는 약 1 kb 내지 약 4 kb, 더욱 바람직하게는 약 1.5 kb 내지 약 3.5 kb 이다. 이러한 바람직한 프로브는 오늘날 이용가능한 프로브보다 100 배까지 더 작아야 한다. 이러한 작은 프로브는 다른 염색체상의 저풍피 이원성 서열에 혼성화되지 않도록 디자인될 수 있다. 이들의 크기 및 이러한 영역에서 이원성 서열의 상대적 풍부함으로 인하여, 오늘날 상업적으로 이용가능한 것들과 같은 거대한 클로닝된 프로브는 다른 염색체상의 이원성 서열을 함유하기 쉽다. 이러한 거대한 프로브는 특이성을 저하시킬 가능성이 크기 때문에 특정 염색체의 서브텔로미어 영역을 다른 게놈 서열과 구별하는데 이상적이지 못하다. 더욱 큰 프로브를 혼성화하는 요건은 왜 이들 클론이 텔로미어로부터 더욱 멀리 위치하는 게놈 서열로 구성되고 또 일부가 이원성 교차 혼성화 서열을 함유하는 지에 대한 한 가지 설명을 제공한다. 또한, 단일 카피 프로브에 의해 인식되는 분리된 짧은 게놈 간격은 서브텔로미어 재배열의 검출을 위해 오늘날 사용되고 있는 합성 DNA 프로브보다 염색체 말단에 더욱 근접하는 특정의 혼성화 간격의 동정을 가능하게 한다. 본 발명의 프로브의 혼성화는 염색체에 전체 프로브가 결합되는지 아니면 그 일부가 결합되는 지에 상관없이 검출될 수 있다. 따라서, 프로브 서열의 일부분만을 포함하는 염색체 영역의 증가 또는 손실의 정도는 종래의 프로브에 의해서는 인식될 수 없지만 본 발명의 프로브에 의해서는 인식될 수 있다. 본 발명의 짧은 프로브는 염색체 서열내에서 파괴점이 발생하는 환자의 게놈을 분석할 때 진단 오류(예를들어, 염색체 결실에 대한 잘못된 음성 결과)를 감소시킬 수 있다.
단일 카피 혼성화를 위한 프로브를 설계하면, 오늘날 이용가능한 것보다 염색체에 상당히 더 근접하는 상당히 더 작은 프로브를 발생할 수 있다. 일반적으로, 상기 방법은 인간 게놈 서열 데이터베이스상에서 염색체 말단상의 말단 뉴클레오티드에서 출발하는 이동 윈도우를 조사하여 말단 염색체 밴드내의 단일 카피 간격을 동정하는 것을 포함한다. 상기 단일 카피 간격(single copy interval)은 텔로미어에 가장 근접하는 서브텔로미어 영역의 단일 카피 간격인 것이 바람직하다. 상기 단일 카피 간격은 바람직하게는 약 8000 kb의 염색체 텔로미어 말단 뉴클레오티드, 더욱 바람직하게는 약 7000 kb의 염색체 텔로미어 말단 뉴클레오티드, 더 바람직하게는 약 6000 kb의 염색체 텔로미어 말단 뉴클레오티드, 더 바람직하게는 약 5000 kb의 염색체 텔로미어 말단 뉴클레오티드, 더 바람직하게는 약 3500 kb의 염색체 텔로미어 말단 뉴클레오티드, 더 바람직하게는 약 2500 kb의 염색체 텔로미어 말단 뉴클레오티드, 더 바람직하게는 약 1500 kb의 염색체 텔로미어 말단 뉴클레오티드, 더 바람직하게는 약 1000 kb의 염색체 텔로미어 말단 뉴클레오티드, 더 바람직하게는 약 800 kb의 염색체 텔로미어 말단 뉴클레오티드, 더 바람직하게는 약 600 kb의 염색체 텔로미어 말단 뉴클레오티드, 더 바람직하게는 약 500 kb의 염색체 텔로미어 말단 뉴클레오티드, 더 바람직하게는 약 400 kb의 염색체 텔로미어 말단 뉴클레오티드, 더 바람직하게는 약 300 kb의 염색체 텔로미어 말단 뉴클레오티드, 더 바람직하게는 약 200 kb의 염색체 텔로미어 말단 뉴클레오티드, 가장 바람직하게는 약 800 kb의 염색체 텔로미어 말단 뉴클레오티드내에 있다. 다음에, 상기 방법은 상기 동정된 간격이 실제로 단일 카피 서열이고 그 간격에서만 존재하는 지를 확인하는 단계를 포함할 수 있다. 이러한 확인은 계산 또는 실험에 의해 실시할 수 있고 바람직한 방법은 두 형태의 확인 모두를 포함한다.
상기 실험적 확인은 단일 카피 서열을 염색체에 실험적으로 혼성화하는 것을 포함한 통상의 방법을 통해 달성할 수 있다. 계산적 확인은 BLAT 또는 BLAST를 이용한 분석을 포함한 게놈 조사를 위한 컴유터 이용 방법을 통해 달성할 수 있다. 그러나, 단일 카피 서열들은 길이에 따라 분류되고 프라이머들은 일부의 간격(바람직하게는, FISH를 이용하여 시각화할 수 있기 때문에 1.5 kb 이상의 길이를 갖는 것 및 텔로미어에 가장 근접하지만 서브텔로미어 영역에 있는 것)마다 디자인된다. 이러한 방법동안에 얻어진 프라이머는 원하는 서열이 통상적인 방법 및 공중이 이용할 수 있는 게놈 데이터베이스를 포함한 공중이 이용할 수 있는 지식을 이용하여 개발될 수 있다는 것을 당업자에게 나타낸다. 이는 프라이머의 좌표가 게놈 데이터베이스에서 확인될 수 있고 이들 프라이머를 이용하여 상기 서열을 얻을 수 있기 때문이다. 또한, 얻어진 서열은 게놈 드라프트와의 비교를 통해 검증할 수 있다. 본 발명자들이 개발한 프라이머 및 이들의 위치가 본원에 제공된다.
그 개시내용이 참조로 본원에 포함되는 미합중국 특허 출원 제 09/573,080호(2000년 5월 16일자 출원) 및 09/854,867호(2001년 5월 14일자 출원)에 개시된 것과 같은 단일 카피 프로브 기술이 서브텔로미어 서열을 개발하는데 적절한데, 이는 대부분의 프로브가 대부분의 염색체내의 정확한 염색체 위치에만 혼성화되기 때문이다. 단일 카피 프로브가 디자인, 증폭, 정제 및 표지될 수 있다. 단일 장소에 혼성화되지 않는 프로브의 경우, 관련 서열이 드라프트 게놈 서열로부터 누락되는 때, 이러한 유전자자리 또는 인접 유전자 자리에 대한 대안의 프라이머가 개발되었다. 또한, 다중 유전자 자리에 대한 혼성화를 나타내는 프로브가, 어느 성분이 이원성 유전자 자리 또는 반복 서열에 혼성화하는 지를 결정하기 위하여 둘 이상의 부분들로 양분될 수 있다. 이러한 양분은 내부 프라이머(새로운 말단 프라이머)를 개발하고 상기 새로운 생성물을 염색체에 혼성화하는 것을 포함한다. 다른 염색체 영역과 다르게, 많은 염색체의 서브텔로미어 간격은 단일 카피 프로브를 디자인하는데 있어서 일부의 예외적인 문제를 제기한다. 이러한 영역들은 유전자가 풍부하지만, 상이한 염색체의 말단 서열들의 사이에에 유전적 물질의 상당한 교환 및 중복이 잇어왔다.
더욱 구체적으로, 서브텔로미어 간격에 해당하는 DNA 프로브 서열의 컴퓨터 소프트웨어 지원 설계를 이용하여 서브텔로미어 단일 카피 프로브가 개발된다. 이것은 대부분의 서브텔로미어 단일 카피 간격을 확인한 다음, 이러한 간격을 게놈 드라프트와 비교하여 상기 서열 간격이 인간 게놈 서열내의 다른 위치에 존재하지 않는다는 것을 확인하는 것을 포함한다. 인간 게놈 서열은 더욱 최근의 버젼(version)에 추가의 데이터가 포함됨에 따라 더욱 정밀해 지는 것으로 판단되므로, 오늘날의 디자인된 프로브를 이러한 게놈 서열 버젼과 비교함으로써 디자인된 프로브의 좌표가 염색체 말단의 300 kb내에 있는 지를 결정한다. 프로브의 제조후 다량의 추가의 서열(300 kb 이상)이 염색체의 드라프트 서열의 텔로미어 말단에 추가된 경우, 염색체 말단에 더욱 근접하는 새로운 프로브가 새로운 서브텔로미어 간격으로부터 디자인된다.
다음에, 각각의 서브텔로미어 영역에 대한 다중쌍의 프라이머 세트를 이용한 PCR을 통해 단편을 합성한다. 다른 방법 또는 단일 카피 프로브의 직접 합성을 실시할 수 있지만(그 개시내용이 참조로 본원에 포함되는 미합중국 특허 6,521,427호 참조), 이러한 방법들은 본 발명보다는 큰 체적의 프로브를 제조하기에 더욱 적당한 것이다. 대부분의 디자인된 프로브들은 증폭될 수 있고 그 증폭은 단일의 동종 PCR 생성물이 생성되도록 최적화될 수 있다. 이를 위하여는, 상기 PCR 증폭 조건이 조심스럽게 최적화되어야 하고, 프라이머 및 증폭 생성물 서열을 다시 검사하여 이들이 다른 염색체상의 서열에 상동성을 나타내는 지를 확인하여야 한다. PCR 증폭이 여전히 달성되지 않는 경우, 이러한 유전자 자리에 특이적인 대안의 프라이머를 제작하고 증폭 과정을 반복한다.
증폭 반응이 최적화되면, 다중 또는 (단일의 큰 용적) 반응을 병행 실시하여 혼성화에 충분한 생성물을 얻는다. 이러한 생성물은 겔 전기영동으로 분리하여 컬럼 원심분리로 정제하거나 또는 반응 혼합물의 비변성 고성능 액체 크로마토그래피를 통해 분리한다, 다음에, 상기 생성물은 틈 번역(nick translation)을 통해 표지하고, 정제하고 두 개체(최소한 하나의 남성)의 정상 중기 염색체에 혼성화하고, 형광 현미경 분석을 통하여 분석한다. 혼성화 효율이 낮은 경우, 상기 프로브를 다시 표지하고, 염색체 혼성화를 반복한다. 인접 간격들로부터의 다중 단일 프로브들이 합쳐져서 혼성화 신호 강도가 증가될 수 있다.
다중 부위에 혼성화되는 프로브의 경우, 몇 가지의 대안의 방법을 이용할 수 있다. 한 가지 방법은 1차 생성물을 합성, 표지 및 혼성화되는 둘 이상의 유도된 생성물로 양분하는 것을 포함한다. 게놈 서열 데이터베이스의 정보에서 프로브 서열이 이원성 카피를 포함하는 것으로 확인되는 경우, 상기 프로브는 이러한 서열이 제외되도록 양분된다. 게놈 드라프트에는 새로운 정보가 연속적으로 업데이트되므로, 상기 영역의 게놈 서열은 게놈 드라프트의 다중 버젼에서 그 위치 및 서열을 검사한다. 양분된 서열이 계속 교차 혼성화되는 경우, 인접한 가까이 위치한 게놈 간격으로부터 단일 카프 프로브를 디자인한다. 이에 선택적으로 또는 추가적으로, 상기 1차 생성물은 C0t1 DNA를 이용하여 예비 어닐닝하여, 다중 염색체 부위로의 혼성화가 감소 또는 제외될 수 있는 지를 결정한다. 이러한 과정이 염색체 특이적 서브텔로미어 혼성화 패턴을 나타내는 경우, 상기 프로브는 프로브 디자인 동안에 검출되지 않은 아주 반복적인 서열을 포함한다는 것을 알 수 있다. 이러한 경우, 인접하여 위치하는 단일 카피 게놈 간격으로부터 단일 카피 프로브를 디자인한다.
따라서, 본 발명은 염색체 재배열을 검출하는데 아주 효과적으로 이용된다. 염색체 말단에 근접한 DNA 서열의 불균형을 초래하는 염색체 재배열이 특발성 정신 지체 또는 기타 임상학적 소견을 갖는 개체의 약 10%를 차지할 수 있는 것으로 추정되어 왔다. 이러한 염색체 영역으로부터의 DNA 프로브를 포함하는 통상적인 형광 동소 혼성화와 같은 특별한 염색체 테스트가 이러한 기형을 검출하는데 필요하다. 인간 게놈 서열을 이용할 수 있게 되므로, 본 발명자들은 이러한 재배열을 검출하는데 통상적으로 이용되는 실질적인 수의 상업적인 DNA 프로브가 존재하지 않는 것으로 인식했다. 본 발명의 프로브들중 많은 것은 오늘날 이용가능한 프로브들보다 염색체 말단에 더욱 근접함으로써, 오늘날 이용가능한 상업적인 프로브에 의해서는 확인될 수 없는 인간 염색체의 말단 재배열을 갖는 일부 환자들을 확인하는 것이 가능하다. 이러한 방법으로 제조되는 프로브는 (a) 기존의 클로닝된 프로브를 이용하여 검출할 수 있는 것보다 더욱 넓은 범위의 비정상 염색체 말단을 검출하고, (b) 이러한 염색체 영역이 어떻게 구성되어야 하는 지를 확인하고, (c) 이러한 염색체 영역의 서열이 서로 어떠한 관계가 있고 다른 염색체 영역과는 어떠한 관계가 있는 지를 확인하는데 유용하게 이용된다. 예전에 본 발명의 발명자들은 인간 게놈 서열을 이용하여, 형광 동소 혼성화(scFISH)를 위한 다양한 염색체 영역으로 표적되는 단일 카피 프로브를 개발했다(그 개시내용이 본원에 참조로 포함되는 2001년 5월 14일자 출원된 미합중국 특허 출원 09/854,867호 참조). 또한, 이러한 프로브는 일부의 환자들에 있어서 예전에는 인식하지 못한 말단 재배열을 검출하는데 유용하게 이용될 수 있다.
또한, 본 발명은 단일 카피 프로브의 어레이를 제조하기 위한 능률적인 방법을 제공한다. 다수의 단일 카피 프로브들의 어레이는 통상적인 재조합 프로브들과 동일한 표적 사이즈를 포함하도록 디자인될 수 있지만, 이러한 어레이들을 다른 특별한 용도로 이용하면 기형을 나타내는 선명도가 증가한다. sc 프로브 어레이를 이용하여, 다중 염색체 영역으로부터 또는 단일의 연속적인 게놈 간격으로부터 표적을 동시에 검출할 수 있고, 단일 카피 어레이의 자동화된 제조는 고처리양 공정이다. 이러한 공정은 모든 진정염색질 염색체 말단으로부터 단일 카피 프로브를 동시에 개발하기 위해 이용되었다. 또한, 이러한 어레이는 서브텔로미어내의 전위, 결실, 및 기타 재배열 경계 파괴점을 정확히 묘사하는데 이용될 수도 있다. 예를 들어, 염색체 9p34로부터 다수의 프로브가 제조되어 왔고, 만성 골수성 백혈병(CML)에서 ABL1 염색체 파괴점을 검출하고 조기 급성기(blast crisis)와 관련이 있는 상류측 ABL1 결실을 검출하기 위하여 상기 프로브들의 상이한 서브세트들이 혼성화되어 왔다(Knoll 및 Rogan, Sequence-Based In Situ Detection of Chromosomal Abnormalities at High Resolution, Am. J. Med. Gen. 121A:245-257(2003).
본 발명의 하나의 양태는 본 발명의 단일 카피 프로브(염색체 3p 및 19q 제외)가 염색체의 밝게 염색되는 말단 G-밴드에 위치한다는 것이다. 이것은 일상적인 세포유적학적 분석에 있어서, 중기 염색체들이 염색체수 및 염색체 구조의 변화를 분석하기 위해 밴딩 및 현미경 검사되기 때문에 중요한 것이다. 염색체 쌍들은 크기 및 밴딩 패턴에 따라 배열된다. 이러한 배열은 핵형이라 불리우고, 세포내의 모든 염색체의 보전성(integrity)을 검사하기 위한 표준적인 기본 방법이다. 정상 인간 세포에는, 46 개의 염색체, 22 쌍의 상염섹체 (1-22번), 및 한쌍의 성염색체(여성의 경우 XX 및 남성의 경우 XY)가 있다. 핵형내에서 염색체들은 그 동원체의 배치에 따라 크기가 최대인 것에서 최소인 것으로 배열되고, 다음에 상기 염색체는 중부, 아중부 및 차단부 염색체로 지정된다. 각각의 염색체는 DNA(독특한 단일 카피의 반복적으로 분산되고 아주 반복적인 DNA) 및 단백질을 함유한다. 각 염색체의 동원체 및 대부분의 염색체 Y 장완은 전사 불할성인 반복 DNA로 구성되는 헤테로크로마틴을 함유한다. 또한 차단부 염색체의 단완은 유전자의 리보좀 RNA로의 다수의 카피외에도 아주 반복적인 DNA를 함유한다. 염색체들의 텔로미어는 염색체의 말단부를 보호하는 기능을 하는 짧은 텔로미어-특이적 DNA 반복 서열(TTAGGG)n을 함유한다. 텔로미어 영역에 인접한 것은 염색체 특이적 DNA 서열 및 텔로미어 관련 반복체들로 부분적으로 구성되는 서브텔로미어 영역이다(도 16). 서브텔로미어 영역의 염색체 특이성에 대한 예외로는 차단부 염색체의 단완과, 헤테로크로마틴을 함유하고 X 염색체 장완의 말단과 상동성이 있는 Y 염색체의 장완이 있다.
열 또는 화학제를 이용할 수 있는 방법으로 염색체를 전처리하면, 22개의 상염색체 및 성염색체 각각은 그 염색체를 특징적으로 확인시키는 특징적 밴드 패턴을 갖는다. 상기 밴드들은 중기 염색체 상에서 어둡거나 밝게 염색되는 구조이며, 염색체 특이적 랜드마크(landmark)로서 이용된다. 클로닝된 DNA 서열들이 이러한 구조상으로 지도작성되어 왔다. 이들은 핵산, 프로브, 서열 표지 부위, ESTs, DNA사슬(contig), 유전자 등을 배치 및 배열하기 위한 기준점으로 이용된다.
임상학적 세포 유전학에서 일반적으로 이용되는 분염(banding pattern)은 G-분염이라하고, 이러한 분염은 흔히 염색체를 트립신으로 전처리한 다음, 이를 Geimsa로 염색함으로써 달성될 수 있지만, 형광 염료(예, 4,6-디아미디노-2-페닐인돌)을 이용하여 염색하는 것과 같은 다른 방법들도 염색체 특이적 분염을 제공한다. R-분염은 역분염으로서, 밝고 어두운 G-밴드의 역분염이다. 세포주기의 상이한 시기(즉, 전중기와 비교한 중기)에 포착된 염색체는 많거나 또는 감소된 밴드를 갖는 염색체이다.
밴딩된 염색체를 핵형화하여 확인한 염색체 기형은 1971년에 처음으로 소개되어 1972년에 발표되고 1995년 버젼으로 전세계적으로 사용되고 있는 세포 유전학 명명 시스템(ISCN)을 이용하여 설명된다. 이러한 명명법은 각각의 시기마다 핵형을 제공할 필요없이 소견이 서로 소통될 수 있도록 염색체 기형을 설명하는것으로 세포유전학자 및 임상학자에게 공통적인 언어이다. 또한, ISCN은 염색체 밴드 해상도(band resolution)에 대한 기준을 제공한다. ISCN은 다수의 가시적인 밴드, 즉 반수체 핵형당 400, 550 및 800 개의 밴드에 의한 상이한 수준의 밴드 해상도를 정의하고 있다. 대표적인 고해상도 세포유전학적 연구는 550개 이상의 밴드 해상도를 이용할 수 있다. 이러한 수준의 해상도에서, 말단 G-밴드는 염색체 3p, 19q 및 Yp를 제외하고 모든 염섹체를 밝게 염색한다. 대부분의 영역에 대한 염색체 밴드는 해상도가 증가함에 따라 밝거나 및/또는 어둡게 염색되는 서브밴드들로 분리된다. 850 개의 밴드 수준에서, 염색체 Yp는 밝게 염색되는 말단 밴드를 가지며, 말단 염색체 3p 밴드 (즉, 3p26)는 세개의 작은 서브밴드(즉, 두개의 밝은 밴드(3p26.1, 3p26.3) 및 하나의 밝은 밴드(3p26.2)로 분리되고, 말단염색체 19 밴드(19q13.4)는 세개의 작은 서브밴드(즉, 두 개의 어두운 밴드(19q13.41, 19q13.43) 및 하나의 밝은 밴드(19q13.42)로 분리된다. 염색체 말단들이 밝게 염색되어 대부분의 염색체마다 동일하게 되는 결과로서, 이들 말단 염색체 밴드 사이에 또는 그들 염색체 영역들의 내에서의 어떠한 교환(즉, 전위)가 일반적인 세포유전학적 방법에 의해서는 인식될 수 없다. 이러한 물리적 특성은, 말단 염색체 밴드 재배열을 확인하기 위하여, 염색체 특이적 핵산 프로브를 이용한 형광 동소 혼성화(FISH)와 같은 다른 분자적 방법을 필요로 한다.
이러한 명명법에 의하여 제공되는 구조적 정의는 당업자가 프로브(우전자 포함)를 염색체 밴드(평균 5백만 염기쌍의 사이즈)로 지도작성하는 것을 가능하게 한다. 부정확하더라도, ISCN 분염법이 안정하다. 또한, 이러한 밴딩된 골격을 참조하여 인간 유전자 서열을 해석할 수 있다. 실제로, 기술의 한계로 인해 (a) 동원체 및 헤테로크로마틴 및 (b) 차단부 염색체(13, 14, 15, 18, 21, 22) p완 서열을 서열분석하는 것이 불가능하기 때문에 상기 서열은 완전하지 않다. 따라서, 기존의 인간 게놈 사슬(contig)의 배열은 명백히 밴딩 정보를 참조하여 상기 골격에 위치할 수 있다. 상기 게놈 서열의 지식을 벗어난 한 가지의 예는 공중용이거나 사적인 인간 게놈 서열 데이터베이스내의 염색체 21의 위치 1이 올바르지 않은 p완의 개시부에서 실질적으로 출발한다는 것이다. 따라서, 서열이 위치하는 장소를 정확하고 일관성있게 설명하기 위하여는, 프로브들을 일제히 연결하는 구조의 형태로 서열 또는 좌표를 사용하는 것이 틀린 결과를 초래할 수 있기 때문에 좌표 및 서열을 함께 이용하여야 한다.
본 발명의 또 다른 실시양태는 서브텔로미어 염색체 서열의 혼성화에 단일 카피 생성물을 이용하는 방법을 제공한다. 당업자는 본 발명의 방법에 의해 합성된 단일 카피 핵산 생성물은 공유 화학적 또는 정전기적 전하 중성화에 의하여 고체 표면에 안정적으로 부착된 다음, 표지된 핵산의 혼합물로 구성되는 용액에 혼성화될 수 있다는 것을 알 수 있다. 대표적으로, 상기 기판은 현미경 슬라이드이지만, 컬럼, 모세관 또는 칩과 같은 다른 표면들도 사용될 수 있다. 상기 핵산 혼합물은 정제된 DNA 완전 게놈, 힙성 클론 세트, DNA 단편, PCR 생성물 또는 cDNA 또는 cRNA의 라이브러리를 포함할 수 있다. 본 발명의 단일 카피 프로브의 어레이는 비교 게놈 혼성화 (CGH) 방법의 표적으로서 이용될 수 있다. 이러한 어레이는 합성 게놈 클론에 기초한 오늘날의 어레이와 비교하여 서브텔로미어 재배열의 검출에 유리하다. 합성 게놈 클론의 어레이에 표지 게놈 DNA를 혼성화하는 반응은 Cot1 DNA로도 알려져 있는 것으로 반복 서열 혼성화를 차단하기 위한 반복 DNA 서열의 첨가를 필요로 한다. 상기 어레이 CGH 방법은 염색체의 서브텔로미어 영역의 일염색체 및 삼염색체를 동시에 확인하기 위한 대안의 방법으로서 이용된다. 이것은 상이한 형광 부분으로 각각 표지되는 정상 및 환자 게놈 서열의 혼성화의 상대 세기를 비교하는 것에 입각한다. 클로닝된 프로브를 이용한 어레이 CGH의 최근의 연구(Cater 등, Cytometry 49:43-48, 2002, 이의 개시내용은 참조로 본원에 이용됨)에서는, 이러한 클론내의 반복 서열 혼성화의 억제의 가변성은 표지 게놈 프로브와 클론의 작은 배치(batch)를 이용하여 작업하는 실험실들 사이에 재현성의 부족에 대한 가장 일반적인 원인이 되는 것으로 확인되었다. 반복 서열 혼성화를 완전히 억제하지 못하게 됨으로써 정상/비정상 형광 세기의 비를 측정하는데 있어서 에러가 발생되었다. 이러한 에러의 출처는 단일 카피 생성물로 구성되는 어레이를 이용하면 존재하지 않게 되는데, 혼성화 반응에 차단 시약을 첨가할 필요가 없기 때문이다. 불균형한 염색체 영역의 경계를 나타내는 것이 단일 카피 생성물로 구성되는 CGH 어레이를 이용하면 더욱 정밀하게 되는데, 염색체내에서 이러한 프로브의 위치는 서브텔로미어 재배열의 어레이 CGH 및 FISH 분석에 전형적으로 사용되어온 많은 합성 게놈 프로브와 대조적으로 뉴클레오티드 수준에서 정확히 한정되었기 때문이다.
본 발명의 또 다른 실시양태에 있어서, 상기 프로브를 이용하고 이들을 임상학적 표형형과 상관시키는 방법이 제공된다. 550개 밴드 해상도 이하에서 세포유전학적으로 정상인 염색체를 갖는 개체에 대하여 합성 DNA 프로브를 이용한 통상적인 FISH에 의해 서브텔로미어 영역이 연구되어 왔다. 또한, 이러한 영역들은 기형을 더욱더 특성화하기 위하여 가시적인 세포유전학적 기형을 갖는 일부의 개체에 대하여도 연구되어 왔다. 이러한 일반적인 염색체 연구의 대상으로는 1) 불임 또는 다수의 유산 경험이 있는 개체, 2) 정신 지체의 일반적인 원인이 배제되고 그 원인이 알려지지 않은채로 남아있는 정신 지체(즉,특발성 절신 지체)를 갖는 개체가 있다. 세포유전학적으로 정상적인 환자 개체군의 경우, 이러한 연구의 서브텔로미어 연구는 다수의 유산 또는 불임을 갖는 개체에서 기형의 증가를 입증하지 못했다. 그러나, 특발성 정신 지체로 진단된 개체의 경우, 서브텔로미어 기형은 역한 정신 지체의 경우에는 약 0.5%, 중간 내지는 심각한 정신 지체 및 기타 임상학적 기형의 경우에는 약 5%(0-10% 범위)로 확인되었다. 중간 내지는 심각하게 지체된 개체의 경우에는, 상이한 연구에서는 서브텔로미어 기형의 빈도수가 넓은 범위에 있다는 것을 보고하고 있다. 아마도 이것은 서브텔로미어 연구 개체군을 한정하는데 사용된 비교적 비특이적인 임상학적 기준의 결과에 따른 편견과 관련이 있다. 중간 내지는 심각하게 지체된 개체에 대하여 서브텔로미어 분석을 수행하기 위한 최적의 임상학적 지표로는 정신 지체, 성장 지체(출생전 또는 출생후), 변형 소견, 및 한종이상의 다른 비변형 소견 및/또는 동종 기형이 있다.
정신 지체는 유전 불균형을 초래하는 서브텔로미어 기형을 갖는 대부분의 환자의 공통적인 특징이다. 특정 세트의 임상학적 특징을 초래하는 몇 개의 서브텔로미어 결실이 있다. 오늘날, 서브텔로미어 기형을 갖는 대부분의 환자는 임상학적 소견의 특징이 없다. 이러한 환자의 경우결서브텔로미어 결손은 상기 영역의 손실(즉, 결실 또는 단염색체성)이거나 또는 불균형한 상호 전위로 인한 또다른 염색체 말단의 상실 또는 증가(즉, 하나의 염색체의 경우에는 부분적 단염색체성, 또다른 염색체의 경우에는 부분적 삼염색체성)이다. 염색체의 수 및 텔로미어 영역의 수를 가정하면, 상이한 서브텔로미어 영역에 대하여는 부분적 단염색체와 부분적 삼염색체의 매우 많은 수의 조합이 있다. 실질적인 수의 가능한 염색체 재배열은 대등하게 다양한 세트의 임상학적 표현형을 나타내는 것으로 보인다. 임상학적 변화성을 일으킬 수 있는 몇 가지의 다른 인자들이 있다. 이러한 인자로는 1) 말단 염색체 밴드의 길이(수백만 염기쌍)를 가정할 때 결실이 없는 말단 밴드(들)의 수, 2) 불균형 전위에서 크로마틴의 감소 및 증가의 크기, 및 3) 동족체상의 열성 대립형질의 가변적인 비차단(unmasking)이 있다. 대부분의 서브텔로미어 기형의 경우, 유사한 기형을 갖는 것으로 보고되는 환자의 수는 제한적이고, 일부의 서브텔로미어 영역은 보고된 경우가 없다. 환자들의 약 절반에 있어서, 서브텔로미어 재배열은 새로운 것으로 보인다. 나머지 절반은 운반 어버이로부터 비정상 염색체(들)의 전달에 의해 유전된다. 이러한 재배열을 갖는 충분한 수의 환자들이 일반적인 임상 소견을 동정하기 위하여 확인되어야 할 것이며, 오늘날 이용가능한 프로브들의 부정확한 편재 및 환자에서 보여진 임상학적 가변성 때문에, 임상 소견을 기준으로 특정의 염색체 불균형을 진단하는 것은 가능하지 않을 것으로 보인다. 따라서, 이러한 그룹의 환자를 분석하기 위한 유일한 실질적인 방법은 모든 서브텔로미어 영역을 포괄적으로 검사하는 것이다. 비정상 서브텔로미어 영역(들)을 확인한 후, 그 말단 염색체 밴드로부터 유도한 프로브들을 이용한 테스트를 실시함으로써 불균형의 크기 및 관련 유전자를 특성화할 수 있다.
특정 세트의 임상학적 특징을 초래하는 몇 개의 서브텔로미어 결실의 경우, 특정의 서브텔로미어 프로브이면 상기 진단을 확인하는데 충분할 것이다. 특정의 서브텔로미어 영역에 대한 프로브 세트는 특정 환자의 특정 임상학적 소견을 한정하는 결실의 크기 또는 길이를 묘사할 것이다. 말단 염색체 밴드의 일부만의 결실에서 비롯되는 몇 가지의 잘 특성화된 증후군으로는 일염색체 1p36 증후군(염색체 1p 결실), Wolf-Hirschorn 증후군(염색체 4p 결실), Cri-du-chat 증후군(염색체 5p 결실) 및 Miller-Dieker 증후군(염색체 17p 결실)이 있다. 그럼에도 불구하고, 이러한 증후군을 갖는 환자는 그 일부가 결실 크기 및 한 종이상의 열성 유전자의 비차단을 포함한 기타 유전적 인자에 따라 변화할 수 있는 임상 소견들을 갖는다.
유전성 또는 체질성 염색체 기형외에도, 백혈병을 포함한 일부의 암에서 관찰되는 후천성 염색체 기형이 서브텔로미어 재배열을 검출하거나 또는 세표유전적으로 가시적인 기형을 더욱더 특성화하기 위하여 서브텔로미어 프로브를 이용하여 조사될 수 있다.
본 발명의 또 다른 실시양태에 있어서, 염색체 재배열을 검출하는데 유용한 서브텔로미어 프로브가 제공된다. 상기 프로브는 일반적으로 25kb 이하, 바람직하게는 10 kb 이하의 길이를 갖는 단일 카피 DNA 서열을 포함하고, 상기 서열은 단일 염색체 팔(arm)의 말단 G-밴드 또는 R-밴드에 혼성화할 수 있는 것이다. G-분염이 사용되는 경우, 그 말단 밴드는 밝게 염색되고, R-분염이 사용되는 경우, 그 말단 밴드는 어둡게 염색된다. 이러한 본 발명의 실시양태에서의 염색체 팔로는 1p, 1q, 2p, 2q, 3p, 4p, 4q, 5p, 5q, 6p, 6q, 7p, 7q, 8p, 8q, 9p, 9q, 10p, 10q, 11p, 11q, 12p, 12q, 13q, 14p, 14q, 15p, 15q, 16p, 16q, 17p, 17q, 18q, 19p, 19q, 20q, 21p, 21q, 22p, 22q, Xp, Xq, 및 Yp가 있다. 대표적인 프로브는 1-3, 5-23, 26-36,38-57, 59-61, 63-67, 69-82, 및 245-251로 구성되는 군에서 일반적으로 선택된다. 상기 프로브는 염색체 텔로미어의 8000 kb내에 있는 것이 바람직하다. 이 점에 있어서, 대표적인 프로브로는 SEQ ID NOS: 1-3, 5-23, 26-36, 38-57, 59-61, 63-67, 69-82, 및 245-251이 있다. 더욱 바람직하게, 상기 프로브는 염색체의 텔로미어의 300 kb내에 있는 것이 더욱 바람직하다. 이 점에 있어서, 상기 프로브는 SEQ ID NO: 36, 80, 46, 47, 49, 51, 56, 248, 57, 78, 59, 75, 76, 74, 63, 250, 251, 66, 65, 67, 4, 3, 1, 9, 6, 11, 10, 17, 20, 19, 18, 21, 81, 26, 29, 28, 31, 32, 43, 42, 41, 40, 44, 45 및 70으로 구성되는 군에서 선택되는 것이 바람직하다. 또한, 바람직한 프로브는 표지되거나 또는 표면에 부착되도록 개질되는 것이다.
본 발명의 또 다른 실시양태에서, 염색체의 서브텔로미어 영역으로부터 단일 카피 DNA 서열프로브를 개발하는 방법을 제공한다. 상기 프로브는 개체의 게놈내의 단일 위치에 혼성화할 수 있는 것이고, 상기 방법은 말단 뉴클레오티드에 가장 근접하는 것으로, 500 개 이상의 염기쌍의 길이를 갖는 단일 카피 서열에 대한 말단 뉴클레오티드에서 시작하여 뉴클레오티드마다(on a nucleotide-by-nucleotide basis) 염색체의 DNA 서열을 검색하는 단계와; 단일 카피 간격을 동정하는 단계와; 상기 단일 카피 간격을 합성하는 단계와, 상기 합성된 단일 카피 간격을 프로브로서 이용하는 단계를 포함한다. 바람직한 방법은 상기 확인된 단일 카피 간격이 단일 게놈 위치에 나타나는지 또는 이원성 서열들이 밀접하게 연결되어 단일 신호만이 검출된다는 것을 계산에 의해 또는 실험에 의해 검증하는 단계를 포함한다. 이 점에 있어서, 상기 단일 카피 서열은 표지되는 것이 바람직하다. 그 밖에, 상기 동정 단계는 계산 및 실험 둘 모두에 의하여 검증하는 것을 포함하는 것이 바람직하다. 바람직한 계산 검증 방법은 소프트 웨어를 이용하여 프로브 서열이 게놈내의 단일 위치에 위치하는 지를 확인하는 것을 포함한다. 바람직한 실험적 검증 방법은 상기 단일 카피 프로브를 염색체에 다시 혼성화하고 상기 프로브를 염색체의 말단 밴드 및 정확한 팔에서 시각화하는 것을 포함한다. 바람직한 단일 카피 간격은 SEQ ID NOS:1-3, 5-23, 26-36, 38-57, 59-61, 63-67, 69-82 및 245-251로 구성되는 군에서 선택된다. 또한, 상기 방법은 상기 단일 카피 프로브를 아주 반복적인 DNA를 이용하여 예비어닐링하는 단계를 포함할 수도 있다.
본 발명의 또 다른 실시양태에서, 염색체 재배열을 동정하기 위한 합성 단일 카피 폴리뉴클레오티드를 제공한다. 상기 폴리뉴클레오티드는 염색체의 텔로미어의 8000 kb 내에 위치하고, 염색체 재배열이 발생하지 않은 경우 특정 염색체상의 단일 위치에 혼성화될 수 있는 것이 바람직하다. 바람직한 폴리뉴클레오티드는 25 kb 이하의 길이를 가지며, 특정의 염색체상의 말단 G-밴드 또는 R-밴드에서 존재하는 것이다. 바람직한 뉴클레오티드는 SEQ ID NOS: 1-3, 5-23, 26-36, 38-57, 59-61, 63-67, 69-82 및 245-251로 구성되는 군에서 선택된다. 특히 바람직한 폴리뉴클레오티드는 특정 염색체의 약 300 kb의 말단 뉴클레오티드내에 위치하는 것이다, 특히 바람직한 폴리뉴클레오티드는 SEQ ID NOS: 36, 80, 46, 47, 49, 51, 56, 248, 57, 78, 59, 75, 76, 74, 63, 250, 251, 66, 65, 67, 4, 3, 1, 9, 6, 11, 10, 17, 20, 19, 18, 21, 81, 26, 29, 28, 31, 32, 43, 42, 41, 40, 44, 45, 및 70으로 구성되는 군에서 선택되는 것이다. 상기 폴리뉴클레오티드는 표지되거나 또는 표면에 부착되도록 화학적으로 개질된 것이 바람직하다.
본 발명의 또 다른 실시양태에서는, 염색체 재배열을 검출할 수 있는 단일 카피 프로브를 유도하기 위해 사용되는 올리고뉴클레오티드 프라이머 쌍을 제공한다. 상기 프라이머는 SEQ ID NOS: 83-244로 구성되는 군에서 선택되는 것이 바람직하다.
본 발명의 또 다른 실시양태에서, 염색체 재배열을 검출하도록 작동할 수 있는 개선된 합성 DNA 프로브를 제공한다. 상기 프로브는 염색체 팔상의 위치에 혼성화할 수 있는 DNA 서열을 포함한다, 상기 프로브의 특징은 25 kb 이하의 길이를 갖는다는 것이다. 그 밖의 개선은 상기 프로브가, 하프 YACS로부터 유도되는 PAC, 코스미드, 포스미드, 박테리오파지 및 P1으로 구성되는 군에서 선택된 클론보다 염색체상에서 텔로미어 말단에 더욱 근접하게 위치하는 프로브의 최소한 일부분을 갖는 단일 카피 서열이라는 것이다. 상기 전체의 프로브는 종래의 클론보다 염색체상에서 텔로미어 말단에 더욱 근접하게 위치하는 것이다. 이러한 본 발명의 실시양태를 위한 바람직한 염색체 팔은 2p, 3p, 7p, 8p, 10p, 11p, 16p, Xp, Yp, 1q, 3q, 4q, 6q, 7q, 8q, 9q, 10q, 12q, 13q, 14q, 15q, 16q, 17q, 18q, 20q, 및 Xq로 구성되는 군에서 선택되는 것이다. 상기 프로브는 염색체 텔로미어의 말단 뉴클레오티드의 8,000 kb내에 위치하는 것이 바람직하다. 상기 프로브는 염색체 텔로미어의 말단 뉴클레오티드의 300 kb내에 위치하는 것이 더욱 바람직하다. 바람직한 형태에 있어서, 상기 프로브는 상기 염색체의 말단 G-밴드 또는 R-밴드내에 위치하는 것이 바람직하다. 이러한 본 발명의 실시양태를 위한 바람직한 프로브는 SEQ ID NOS: 46, 47, 49, 56, 78, 59, 64, 249, 2, 4, 3, 5, 9, 11, 20, 19, 21, 81, 246, 70, 72, 73, 36, 80, 247, 50, 57, 75, 76, 74, 63, 250, 66, 65, 67, 1, 6, 10, 12, 16, 15, 13, 14, 17, 18, 81, 245, 26, 31, 32, 43, 42, 40, 44 및 45로 구성되는 군에서 선택되는 프로브를 포함한다.
본 발명의 또 다른 실시양태에서, 세포유전학적 기형에 대하여 개체를 스크리닝하는 방법을 제공한다. 상기 개체는 임상 소견에 근거한 특발성 정신 지체에 대하여 진단된다. 추가로, 상기 개체는 특발성 정신지체와 관련된 하나 이상의 임상학적 기형을 나타내야 한다. 일반적으로, 상기 방법은 각각 25 kb 이하이 길이를 갖는 다수의 혼성화 프로브를 이용하여 개체의 게놈을 스크리닝하는 단계와; 상기 개체 개놈의 세포유전학적 기형을 나타내는 상기 프로브의 혼성화 패턴을 검출하는 단계를 포함한다. 상기 분석에서 각각의 염색체 팔마다 하나 이상의 프로브를 사용하는 것이 바람직하다. 그러나, 일부의 경우, 임상학적 기형 또는 임상 소견은 전체의 염색체 팔(arm)의 서브세트와 관련이 있기 때문에, 특정의 염색체 팔만을 분석할 필요가 있다. 상기 방법은 상기 혼성화 패턴을 특정의 임상학적 기형과 관련시키는 단계를 추가로 포함할 수 있다, 상기 프로브는 단일 카피프로브인 것이 바람직하며, 이는 상기 프로브가 단일 게놈 위치에서 나타나거나 또는 이원성 서열들이 밀접하게 결합되어 단일의 혼성화 신호만이 검출된다는 것을 의미하는 것이다.
본 발명의 또 다른 실시양태에서는, 염색체 불균형의 정도를 묘사하는 방법을 제공한다. 일반적으로, 상기 방법은 약 25 kb 이하의 길이를 갖는 다수의 혼성화 프로브를 이용하여 염색체팔(chromosome arm)을 분석하는 단계와, 상기 팔상에서 상기 프로브의 혼성화 패턴을 검출하는 단계와, 상기 혼성화 패턴을 상기 팔의 표준 게놈 지도와 비교하여 염색체 불균형의 정도를 묘사하는 단계를 포함한다. 이러한 방법은 다수의 염색체팔상에서 수행될 수 있다. 상기 분석된 팔(들)은 ㄱ체의 임상 소견에 따라 선택될 수 있거나 또는 임상학적 기형이 하나 이상의 팔과 관련될 수 있다. 상기 방법은 상기 팔상의 불균형을 의학적 증상과 상관시키는 단계를 추가로 포함할 수 있다. 바람직한 의학적 증상으로는 특발성 정신 지체 및 암이 있다.
아래의 예들은 본 발명의 바람직한 실시 형태를 설명하고 있다. 이들 예는 예시적으로 제공되었고, 그 속의 어떤 것도 본 발명의 전체 범위에 대한 한정 사항이라고 생각해서는 안된다는 것을 이해할 것이다.
실시예 1
실시예 1은 본 발명에 따라 단일 카피 프로브들을 발현시키는 과정을 설명한다.
물질과 방법
모든 인간 염색체를 위해 서브 텔레미어 단일 카피 FISH 프로브들의 발현과 이들 프로브를 정상적인 인간 염색체에 교배시킴으로써 이들 프로브를 테스트하는 방법
프로브 디자인. 프로브 서열은 이전에 설명한 바와 같이 2001년 4월, 2002년 6월 및 2002년 11월에 인간 게놈 드래프트와 셀레라 게노믹스 인간 게놈 서열로부터 디자인 및 검증되었다[Rogan 등등, Sequence-Based Designs of Single-Copy Genomic DNA Probes for Fluorescence In Situ Hybridization, 11 Gemone Research, 1086-1094쪽 (2001년), 이 자료의 내용과 가르침은 본원에 참조로서 합체되었다]. 주된 목적은 진정 염색체의 염색체 아암 각각의 텔레미어들에 인접한 단일 게놈 위치를 인식하는 단일 카피 프로브들을 선택하는 것이다. 이것은 파라로거스 복제 사건에 의해 진화되었던 염색체 말단에 대한 독특한 도전이다. 파라로거스 비대립유전자형질 복제는 타겟 단일 카피 인터발의 서열과 게놈의 나머지를 비교하여 검출된다. National Laboratory of Medicine에 있는 BLAT 서버가 공중의 인간 게놈 드래프트의 다른 비대립유전자형질 서열에 대한 유사성을 테스트하기 위해 사용된 반면에, 셀레라 서열은 BLAST를 이용하는 Sun 워크스테이션 상에서 국부적으로 검색되었다. 길이 500 bp 이하 및/또는 서열 동일성 80% 이하로 이루어진 비대립유전자형질 서열 블록은 교차 교배를 위한 잠정적인 사이트로서 간주되지 않는데, 이는 그러한 서열 유사성이 FISH에 의해 검출될 수 없기 때문이다.
단일 카피 인터발은 각각의 염색체 말단으로부터 연속하는 100 kb 인터발 내에서 검색된다. 길이가 적어도 1.8 kb인 단일 카피 인터발이 서브텔레미어 서열의 첫번째 100 kb 내에 위치할 수 있는 경우 (게놈 내의 어디에서도 컴퓨터적으로 교차 교배될 수 없는 경우), 이러한 인터발은 프로브로서 선택된다. 그렇지 않은 경우, 약 100 kb 게놈 인터발은 적합한 프로브(들)이 확인될 수 있을 때까지 후보 단일 카피 프로브 서열을 위해 검색된다. 이전에 발현된 단일 카피 프로브들의 대부분은 200 kb의 텔레미어 내에 존재한다. 비록 더 긴 염색체 프로브가 일반적으로 바람직하더라도, 1.5 kb의 프로브가 일반적으로 1.8 kb 단일 카피 인터발로부터 발현될 수 있고 FISH에 의해 가시화될 수 있다.
프로브 생성, 라벨링 및 FISH. 각 염색체 영역을 위한 단일 DNA 조각이 Pfx-Taq(Invitrogen 주식회사)를 가진 긴 PCR 절차를 이용하여 확장되었다. 실험 최적화는 일련의 PCR 반응들을 일으키는 것과 관련되어 있으며, 그 각각의 반응은 프라이머의 예상 어닐링 온도를 포함하는 상이한 어닐링 온도를 가지고 균일한 크기의 확장 생성물을 생성했던 가능한 최고 온도를 결정한다. 또한, 제조업자의 권고에 따라 PCR 강화 용액의 농도를 변화시킴으로써 특수성이 최적화되었다. 어떤 온도 및 강화 농도의 범위 내에서 설정된 주어진 프라이머로 확장이 전혀 달성되지 못한 경우, 선택적인 인접한 단일 카피 인터발이 프로브 발현용으로 선택된다. 그때 조각들은 칼럼 정제와 겔 전기영동을 포함한 종래 기법에 의해 분리되어 반복 서열을 잠정적으로 오염시키는 것을 제거하고, 마이크로 스핀 칼럼(밀리포어:Milipore)을 이용하거나 예비 무변질 고성능 액체 크래마토그래피(Transgenomic, Omaha NE)에 의해 저온 아가로제로부터 정제된다. 그때, 프로브 조각들은 개질 또는 직접 라벨링된 뉴클레오티드(예컨대, digoxigenin-dNTP, flurorochrome-dNTP 등등)을 이용하여 눈금전환(nick translation)에 의해 직접 라벨링된다. 라벨링된 프로브들은 변질되고, 현미경 슬라이드 상에 이동하지 못하게 된 고정 변질 염색체 조제물에 교배된다. 이들 프로브들은 종래의 FISH 방법에 따라 2개의 개체로 이루어진 염색체에 교배된다[Knoll and Lichter, In Situ Hybridization to Metaphase Chromosomes and Interphase Neclei, Current Protocols in Human Genetics, VoL. 1, Unit 4.3 (eds, N.C. Dracopoli et al.)(1994), 이 문헌의 내용 및 가르침은 본원에 참조로서 합체되었다). 프로브 교배는 라베링된 뉴클레오티드를 형광 라벨링된 항체와 결합하고 적절한 필터 세트를 가진 형광 현미경으로 봄으로써 검출된다. 전체 염색체 DNA는 4',6-디아미디노-2-페닐린돌레(청색)으로 대조염색되고, 교배된 프로브 시그널은 플루오로크롬으로 가시화되었다.
확인 검증(Validation). 각각의 상염색체 서브텔레미어 프로브는 정상적인 암수 세포들(2개의 시그널이 예측된다) 속에 있는 상동 염색체 쌍에 교배되었다. X 염색체로부터의 프로브는 수컷 세포 속의 단일 염색체에 교배되고, 암컷 세포 속의 2개 염색체에 교배된다. Y 염색체로부터의 프로브는 오로지 수컷 세포에 교배된다. 2개의 상이한 개체 상의 병렬 교배는 염색체 밴드 위치를 확인하기 위해 실시되었다. 제어 교배는 이전에 확인 검증되었던 프로브와 함께 실시되었다. 최소 10개의 중기 세포는 각각의 프로브에 대한 교배 효율을 결정하기 위해 평가되었다. 일반적으로 종래의 FISH 프로브과 단일 카피 FISH 프로브들은 적어도 90%, 더욱 바람직하게는 적어도 92%, 훨씬 더 바람직하게는 적어도 94%, 훨씬 더 바람직하게는 적어도 96%, 훨씬 더 바람직하게는 적어도 98%, 가장 바람직하게는 100%의 교배 효율을 가진다.
프로브가 염색체 상의 수많은 위칭에 무분별하게 교배되는 경우, 이 프로브는 높은 반복 게놈 서열로 적절하게 포함할 가능성이 높다. 현재의 반복 서열 데이터베이스가 매우 포괄적이고 이러한 교배 패턴이 일반적이지 않는 경우에도, 이 데이터베이스는 소수의 프로브를 위해 관찰된다. 그 결과는 DNA 서열 레벨로 아직 특징을 이루지 못한 인간 게놈에서 반복 서열 패밀리를 나타낸다. 단일 카피 프로브들을 디자인할 때 우리의 이전 경험에 기초하면, 단지 일부의 프로브만이 게놈 전체에 걸쳐 분포되어 있는 무분류 산재 반복 서열 패밀리에 비특정적으로 교배된다. 고도로 반복하는 서열에 게놈 광역 교차 교배 또는 게놈 교차 교배를 행하는 프로브는 미리 어닐링되어 C0t1 DNA로 될 수 있다. 교차 교배는 고도의 반복 (즉 C0t1) DNA로 사전 어닐링에 의해 억제 또는 제거될 수 있다. 프로브 내의 단일 카피 서열의 교배가 급냉되는 경우, 인접한 단일 카피 인터발은 프로브 발현을 위해 선택된다.
하나 이상의 염색체 영역에 교배시키는 프로브의 특성화
단일 카피로 설계되었던 프로브들 속의 고도의 반복 서열 패밀리 외에도, 우리는 프로브가 디자인되었던 염색체 위치 외에 중기 염색체 상의 한정된 무리의 개별 위치에 소정 패턴의 교배를 예상 밖으로 관찰하게 되었다. 이러한 교배 패턴은 프로브가 다른 염색체 상의 서열 또는 동일한 염색체 상의 다른 서열과 고도로 관련되어 있는 복잡하면서 낮은 반복 횟수의 서열을 포함할 때에 생기며, 이것은 파라로거스 서열로 알려져 있다. 이러한 교배 패턴은 게놈 서열이 부정확하고 아직 완전하지 않기 때문에 발생할 수 있다. 그러나 인간 게놈 서열은 특히 이질 염색질을 함유한 영역에서 불완전한 것으로 알려져 있다. 그런 영역 내에 포함된 단일 카피 서열로 이루어진 파라로거스 카피들은 현재의 게놈 드래프트에 포괄적으로 합체될 것같지 않다. 완전하거나 정확하게 결합된 게놈의 다른 영역들은 드래프트에서 "갭" 인터발로 표시된다. 이 영역 내의 단일 카피 프로브의 파라로거스 또는 이중 카피도 역시 비대립유전자형질 위치에 예상을 벗어난 교배에 원인이 있다. 프로브를 선택하는 데에 사용된 소프트웨어는 관련 게놈 서열을 지식기반연구(in silico)로 검출할 수 있지만, 게놈 서열이 아직 완성되지 않았기 때문에 항상 특정 프로브가 어닐링되어 다른 또는 동일 염색체 상에 다른 비특성화 관련 서열로 될 수 있다. 개별 패턴의 염색체 위치에 대한 교차 교배가 고도의 반복 DNA(예컨대, 표 1의 염색체 16에 대한 결과 참조)를 가진 원래의 프로브를 사전 어닐링해도 억제되지 않는 경우, 이것은 프로브가 고도의 반복 서열이라기 보다는 하나 이상의 파라로거스 서열(즉, 낮은 카피에 존재하는)을 포함하고 있다는 것을 나타낸다.
(염색체 혼성화에 의해 실증된 서브텔로미어 scFISH 프로브들의 요약)
*다른 염색체상에서 관찰된 교차 혼성화
**혼성화가 존재할 수 있으며, 추가의 검증이 필요함
***C0t1의 억제에도 불구하고 교차 혼성화가 일어났음
^프로브를 "^"로 표지한 다른 10ptel 프로브와 결합한 경우 혼성화가 검출되었음
+프로브를 "+"로 표지한 다른 10ptel 프로브와 결합한 경우 혼성화가 검출되었음.
게놈 조립체의 후속적인 버전들이 2001년 04월 버전보다 더욱 정확한 것을 가정할 때, 프로브 시퀀스는 더욱 최근의 버전들과 비교되어 오리지날 프로브들에 관계되는 부가적인 시퀀스들이 이들 버전들에 존재하는 가를 결정할 수 있다. 패러로그들을 정의하기 위해, 상기 프로브 시퀀스는 게놈 드래프트들과 비교되어 모사된 카피들에 대한 낮은 정도의 시퀀스 유사성을 허용한다. 더욱 최근의 게놈 시퀀스 드래프트들이 관계되는 시퀀스들의 존재를 나타낼 경우, 두 개의 구별되는 전략들이, 패러로그들이 상기 또는 다른 염색체들 상의 다른 밴드들 내에 존재되는 염색체-특정 프로브들을 생성하기 위해 유용될 수 있는 바, 이들 전략은 (1) 초기 프로브가 충분히 긴 경우 프로브의 이등분 및 프로브의 비-패러로거스 영역의 재증폭 또는 (2) 프로브 발생을 위한 특정의 게놈 패러로그들을 포함하지 않는 다른 단일 카피 구간을 선택하는 것이다. 관련되는 시퀀스가 시퀀스 분석에 의해 식별되지 않는 경우에는, 오리지널 프로브를 염색체 특정화된 시퀀스들로 양분하도록 내부 프라이머들이 생성된다.
어떤 성분이 다중 사이트들로 교배되는 가를 결정하기 위해 상기 오리지널 프로브는 이등분될 수 있다. 생성물의 이등분은, 두 개의 유사한 프로덕트들을 형성하는 내부 프라이머들 및 가능하게는 새로운 (유사한 용융온도들 및 GC 조성을 갖는) 엔드 프라이머들을 생성함으로써 발생된다. 이들 새로운 프로덕트들은 단일 카피 FISH를 위한 프로브들로서 작용한다. 이등분 후에 교차-교배가 잔류되면, 프로브의 추가적인 해부가 가능하거나 또는 이웃하는 게놈 구간으로부터의 새로운 단일 카피 프로브가 FISH에 의해 설계되고 평가된다.
오리지널 프로브를 이등분한 후에, 두가지 교배 패턴 중의 하나가 예상된다. 즉, 하나의 프로덕트는 염색체 특화된 것이고 다른 하나는 다른 염색체 구역들로 교배되거나, 또는 양 프로덕트들이 다중 교배 사이트들을 여전히 나타낸다. 전자의 패턴은 반복적인 또는 패럴로거스 시퀀스를 포함하는 구역을 국부화하고, 후자의 패턴은 구역을 국부화하지는 않지만 내부 프라이머 세트가 상기 반복적인 또는 패럴로거스 시퀀스를 스팬하는 것을 나타낸다.
현재까지, 형광현미기술에 의해 1500 bp 또는 더 큰 길이를 갖는 단편들을 신뢰성있게 시각화할 수 있다. 그러므로, 프로브가 이등분될 때, 최소 1500 bp인 프로브를 생성하는데 기여한다. 또한, 더 짧은 프로브들이 1500 bp 이상의 전체 목표 사이즈를 갖도록 조합될 수 있다. 다른 염색체들 상에서 패럴로거스 시퀀스들로 교차-교배하는 더 큰 프로브를 이등분함에 의해 단지 염색체 4p 터미널 시퀀스들을 검출하는 상기 절차에 의해 프로브가 개발되었다. 이등분된 프로브가 1.5 kb 이상의 길이를 갖도록 설계될 수 없다면 또는 프로브 시퀀스의 길이 전체를 통하여 연장되는 비-대립유전 시퀀스에의 광범위한 패럴로지때문에, 초기 교차-교배 시퀀스에 근접하는 선택적인 단일 카피 구간들이 선택된다.
프로브들이 염색체들의 단부들에 근접하다는 것을 보장하고, 염색체 단부들에 근접한 프로브들을 적당하게 리바이싱함.
2001년 4월 게놈 드래프트로부터 설계된 프로브들의 위치들은 더욱 최근의 게놈 드래프트 버전들 상의 위치들과 전산적으로 비교된다. 위치 좌표들이 염색체의 단부로부터 더욱 이동되었다면, 염색체의 단부에 더욱 근접한 새로운 단일 카피 프로브들이 2001년 4월 드래프트로부터 설계되고, 단일 카피 타겟들을 검출하는 46 서브텔로머 프로브들이 유효화되며, 부가적인 36 서브텔로머 단일 카피 프로브들이 게놈 시퀀스의 후속 버전들로부터 설계되며 맵핑된다. 새로운 프로브들의 생성은, 다른 염색체들 상에서 반복적인 시퀀스 및 패럴로그들이 없는, 서브텔로머 구간들 상에 부수한다. 염색체들의 단부들에 가능한한 근접하는 프로브들을 생성함으로써, 현존하는 클론화된 프로브들을 이용하여 명확하지 않은 터미널 재배열체들을 검출할 가능성이 증가된다.
결과:
통상적인 서브텔로머 FISH 프로브들에 비교하여, 본 발명에 따라 생성된 서브텔로머 단일 카피 프로브들은 이전에 가능하였던 것보다 더욱 작은 (상기 게놈 구역들의 제거 또는 불균형화된 신비한 전위들에 의해 발생되는) 터미널 시퀀스 염색체들의 재배열체들을 검출하였다. 본 발명에 따른 프로브 세트들은 모든 유크로매틱 시퀀스된 서브텔로머 구역들을 검출하도록 설계되었다. 프라이머들이 설계되었고, 이들 프라이머들은, 염색체들 1, 3, 5q, 7, 8, 9q, 10p, 11, 14q, 16q, 17, 19, 20q, Xp 및 Yp의 서브텔로머릭 구역들을 위한 단일 카피 프로브들로서 개발되고 검증된 각각의 서브텔로머 구역 내에서 독특한 시퀀스들을 인식한다(표 2 참조). 이들 시퀀스들이 독특하고 대응되는 인간 게놈 시퀀스가 공개적으로 입수가능하기 때문에, 프라이머들 자체는 게놈에 있어서 하나의 그리고 유일한 프로덕트를 정의한다. 그러므로, SEQ ID NOS 83-244에 리스트된 프라이머들중의 특정의 프라이머들은 SEQ ID NOS 1-3, 5-23, 26-36, 38-57, 59-61, 63-67, 69-82, 및 245-251에 리스트된 프로덕트들과 등가이다.
(프라이머 서열 및 위치)
*인간 게놈 드라프트 서열의 2001년 4월 버젼의 죄표; F: 정방향 프라이머의 좌표; R: 역방향 프라이머의 좌표
잠재적인 프로브들은 터미널 염색체 구역을 횡단하여 조밀하게 배열되며, 좌표들은 정밀하게 마련된다. 본 발명의 프로브들은 대체로 각각의 염색체의 터미널 밴드들 내에서 각각의 염색체 아암의 말단 소립으로부터 특정 범위의 거리들에 걸친다. 개개의 단일-카피 프로브들 또는 이들 프로브들을 조합적으로 이용함으로써, 상기 재배열체 내에 포함되는 염색체 구역의 크기를 매우 정밀하게 묘사할 수 있고 즉, 게인 또는 로스의 길이, 염색체 전위 또는 반전의 중지점의 위치를 묘사할 수 있다.
염색체들 13, 14, 15, 21 및 22의 짧은 것 또는 p-아암들 및 Y 염색체의 길은 것 또는 q-아암에 있어서의 변경은 임상적인 비이상성에 기여하지는 않는 것으로 보여진다. 이들 구역들은 현저하게는 반복적인 시퀀스들로 이루어지고 그들의 전체 시퀀스들은 결정되지 않는다. 그러므로, 이들 구역들을 위한 프로브들은 생성되지 않았지만, 이들 염색체 아암들이 독특한 단일 카피 시퀀스들을 포함하는 것으로 밝혀지면, 본 발명은 이들 구역들을 위한 프로브들을 생성하고 그들을 응용하는 방법을 제공한다.
표 2에는 모든 유크로메틱 염색체 단부들을 위한 단일 카피 프로브들의 결과를 요약하여 나타낸다. 프로브들은 모든 염색체들을 위한 염색체 특정화된 터미널 밴드들로 합성되고, 교배되고 가시화된다. 이전에 언급한 바와 같이, 수 개의 염색체 단부들을 위한 다중 프로브들이 설계되었고 검증되었다. 표 1에서, 수 개의 염색체 터미널 밴드들(11q, 16p, 18p, 20p 및 22q)의 각각의 위한 하나의 프로브는 다른 염색체들 상에서 패럴로거스한 또는 반복적인 시퀀스 군들을 검출한다. 상기 표에 있어서의 잔여 프로브들 및 표 3에 있어서의 모든 부가적인 프로브들은 임상적인 용도를 위해 요청되는 염색체 특정성을 나타낸다.
국부화된 scFISH 및 재조합형 서브텔로머 프로브 위치들의 비교
표 3은 대응되는 단일 카피 프로브의 위치와 유효 염색체 시퀀스의 단부 및 클론화된 서브텔로머 프로브 내에 포함된 서브텔로머 STS 사이의 거리를 비교한다. 상업적으로 입수가능한 (예컨대, Vysis, Inc.사에 의한) 클론화된 서브텔로머 프로브들은 그들 내에 포함된 하나 이상의 시퀀스 택드 사이트(STS)들에 기초해서 (2003년 4월 버전인) 게놈 시퀀스 상에 위치된다. 그러나, 이들 STS 마커들은 더욱 크게 클론화된 체절 내에서 매우 짧은 구간을 나타내며; 그러므로, STS로부터 클론의 근접한 또는 말단의 경계를 묘사하는 것은 가능하지 않지만, 클론의 근사한 게놈 위치는 STS의 위치로부터 추정될 수 있다. 클론의 길이들 및 STS 좌표를 안다고 가정할 경우, 그 클론에 의해 커버되는 게놈 좌표들의 범위를 일괄하여 다루는 것이 가능하게 된다. 표 3으로부터 알 수 있는 바와 같이, 본 발명에 따라 생성되는 단일 카피 프로브들의 대부분은 같은 성질의 재결합 프로브보다 염색체의 단부에 현저히 가깝다. 본 발명의 단일 카피 프로브들과 유용한 클론화된 서브텔로머 프로브들의 위치들 사이의 거리들에 있어서의 가장 큰 차이점들은 8pter, 13qter, 14qter, 및 16pter에서 발견되었고 이들에서 단일 카피 프로브들은 상기 염색체들의 단부들에 ~800 kb 또는 그 이상 근접한다. 단일 카피 프로브들 및 통상적인 프로브를 격리시키는 말단 8pter 구간은 4 이상의 유전자들을 포함하며, 이들 유전자들은 제거될 경우 클론화된 프로브에 의해서는 검출되지 않지만 단일 카피 프로브에 의해서는 검출된다. 말단 13qter 구역(도 17 참조)은 10 이상의 확인된 또는 예견된 유전자들을 포함하고, 말단의 14qter은 3의 확인된 유전자들 및 30-40의 예견된 유전자들을 포함하며, 16pter 구역은 200보다 많은 확인되고 예견된 유전자들을 갖는다. 예컨대, 현존하는 클론화된 서브텔로머 FISH 프로브로의 8p 말단에 있어서의 양호하게 특성화된 유전자 좌들은, p53 바인딩 단백질 군의 멤버, 인터페론 유도 단백질 15 군 멤버, (단백질 카니아제 C 중재 시그널링에 있어서의 역할을 담당하는) 베타 2형 구아닌 뉴클레오타이드-바인딩 단백질, 및 (폐에 있어서 점막 호스트 셀 방어를 위해 요청되는) C5A 리셉터에 관련되는 시퀀스를 인코딩하는 유전자들을 포함한다. 클론화된 서브텔로머 프로브의 말단인 14qter 구역은, 크라니오페이셜 형태 형성, 사지, 흉선 발달 및 와우각 머리 세포 발달에 있어서 근본적인 역할을 담당하는 노치 리셉터의 리간드인, JAG2 유전자를 포함한다. 이들 유전자들(및 철저하게 특징지워지지 않은 다른 유전자들)의 특정의 유전자에 있어서의 단일 대립 유전자의 손실은 해로운 임상 결과를 가져온다는 점은 명백하다. 본 발명에 의해 개발된 단일 카피 프로브들은, 이들 유전자 좌들에서 헤미지고시티(hemizygosity)를 검출할 수 있는 현존의 유일한 서브텔로머 FISH 프로브들이다.
정상적인 중기 염색체들로 교배된 12 서브텔로머 단일 카피 프로브들(또는 프로브들의 결합체들)의 대표적인 복합 패널을 도 1에 도시한다. 각각의 패널은 검출된 말단 소립 및 프로브의 근사 사이즈(표 1로부터의 "근사 사이즈" 칼럼에 일치하는 사이즈들)를 나타낸다. 화살표들은 염색체 단부들로의 프로브 교배물들을 나타낸다. 프로브들의 각각은 특별하게는 시퀀스가 유도되는 상동 염색체 쌍으로 교배된다.
표1은 증폭된 단일 카피 생성물의, 2002년 9월까지 염색체에 의해 혼성화된 모든 프로브, 프라이머 좌표계, 염색체 말단 및 근접한 정확한 크기를 요약한다. 동일한 서브텔로머 구역으로부터의 복합 생성물은 다른 10p 프로브와 결합하여 혼성화된 염색체 10p를 제외하고 개별적으로 혼성화되었다. 표에서 보는 바와 같이, 일부 프로브(예를 들어, 18ptel)은 교차 혼성화를 보여주고, 일부 프로브 (예를 들어, 22q)는 교차 혼성화를 배제하기 전에 추가 확인을 필요로 했다. 또한, 16p 프로브는 Cotl 억제에도 불구하고 교차 혼성화되었다.
표2는 각 프로브를 증폭하기 위해 사용된 프라이머, [인간 게놈 서열의 2001년 4월 버전(California Santa Cruz의 University에서 게놈 브라우저 웹사이트에서 이용가능한 올라인)으로부터 유래한] 프라이머의 좌표 및 서열을 나타내고, 증폭 반응에서 프라이머에 대한 예보되고 그 다음 실험적으로 최적화된 어닐링(annealing) 온도는 PCR 생성물 및 이들 프라이머로 산출된 증폭 생성물의 길이를 산출했다. 통상, 최종 어닐링 온도는 5℃의 예보된 어닐링 온도 내에서 발견되었다. PCR반응 조건의 최적화 후에, 표2에 나타나 있는 모든 생성물은 DHPLC-Wave 시스템(Transgenomic, Omaha) 상에서 전기영동, 또는 특정시점에서 단일의 날까로운 흡수 피이크에 의한 단일의 균일하게 착색된 밴드를 산출했다. 이들 생성물의 일부는 표지되었고, 인간 감수분열 염색체로 국소화되고 표에 포함되어 있다. 표3은 2002년 9월 이후 염색체로 혼성화시킨 추가 프로브뿐만 아니라 다른 구역으로 교차 혼성화되지 않은 표1로부터의 프로브를 포함한다. 가장 최근에 지도작성된 프로브는 게놈 서열의 2003년 4월 버젼으로부터 개발되었고, 많은 경우에, 염색체 말단에 가깝다. 표3은 단일 카피 프로브의 정확한 크기를 제공하고, 염색체 말단으로의 거리를 합성의 시판되는 프로브의 거리와 비교한다.
본 발명자들은 2001년 4월 게놈 서열 또는 차후의 버젼의 서열 분석에 의해서가 아닌, 분자 세포유전 분산에 의해 탐지된 게놈 파라로그(paralog)와 함께 수많은 프로브를 관찰했는데, 이는 게놈 서열이 이들 이원성 서열을 함유하는 구역에서 분완전하다는 것을 나타낸다. 복합 이원성 영역은 또한 이들 구역의 부정확한 집합을 산출함을 보여주었고, 이에 따라 이원성 비대립유전자 카피물의 게놈 자리로의 합병으로 귀결될 수 있었다. 따라서, 본 발명에 따라 계획된 프로브는 환자의 불균형한 재배열의 탐지에의 적용 전에 통상의 대조군에의 혼성화에 의해 확인되어야 한다. 이러한 접근은 인간 게놈 서열의 미래 버젼에서 잠재적인 비집합 구역을 확인하는데 유용한 것으로 될 수 있다. 비서열 도는 부적확하게 서열된 게놈 구역에 대한 교차 혼성화는 전례를 갖는다 (참조, 이전의 파리 연속 출원; US 시리즈 #09/854,867, 그의 기술 및 내용은 참조로 본 명세서에 포함됨). 이전에, 2개의 구역으로부터 프로브를 개발했는데, 그 구역에서, 가깝게 자리잡은 아주 유사한 (>95%) 이원성 서열은 국소화되었다. 그 구역은 염색체 21p 상의 다운(Down) 증후군 및 타입 M4 급성 골수성 백혈병을 위한 염색체 16p 역위 구역을 포함한다. 프로브 모두는 각 염색체 상에서 파라로그로 혼성화되고 단부착사형 염색체의 짧은 암으로 혼성화된다. 이들 예에서, 교차 혼성화는 높은 반복성 DNA로 미리 어닐링하여 억제되었다.
다른 염색체 상에서 또는 동일한 염색체 상의 거리 궤적(>1 Mb)에서 이원성 서열에 대한 혼성화를 갖는 프로브는 프로브가 탐지되도록 계획된 텔로머의 비정상을 탐지하기 위한 분석물의 특성을 포함한다. 그와 같은 경우에, 다른 염색체 궤적에 대한 역리성을 갖는 프로브에서의 서열은 제거되었다. 그와 같은 서열을 제거하기 위한 바람직한 접근은 (1) 인접한 염색체 간격으로부터 대안적인 프로브를 선택하여 산출함, 또는 (2) 다른 염색체 궤적에 대해 역리성인 하부 서열을 프로브를 재계획함. 단일 카피 FISH을 위한 적합한 크기의 단일 카피 간격은 게놈에서 조밀하게 배열되어 있기 때문에, 인접한 게놈 간격으로부터 신규 프로브을 개발함을 통상 선호했다. 이러한 접근은 역리적인 상대물을 갖는 프보브를 이등분하는 것보다 시간이 덜 소비되고 노동이 덜 드지만, 프로브 이등분은, 특히 특정 (작은) 유전자로부터 유래한 프로브가 필요하다면, 일부 예에서 단지 대안적이다. 표1 및 2 에서 표시된 표제어는 다른 염색체에 대한 역리성이 초기 관찰된 텔로머를 위한 대안적인 단일 카피 혼성화 프로브의 예를 나타낸다.
결론
본 발명자들은 인간의 대부분의 서브텔로미어 영역을 포함하는 염색체 재배열을 검출할 수 있는 단일 카피 프로브를 개발, 시험하고 이의 제조 방법을 확인했다. 또한, 42 개의 진정염색질 말단 영역에 대한 팔-특이적 프로브를 개발했고, 이들이 상기 염색체의 말단에 근접하거나, 또는 일반적으로 사용되는 클로닝된 프로브의 경우의 가능한 위치 범위에 포함되지만, 상기 클로닝된 프로브의 정확한 위치가 결정되는 경우에는 더욱 근접할 수 있다는 것을 확인했다. 따라서, 이들 단일 카피 프로브는 기존의 프로브보다 더욱 작고 더욱 많은 수의 염색체 불균형(서브텔로미어 서열)을 검출할 수 있다. 이러한 프로브들은 특발성 정신 지체 또는 이러한 유형의 이수성 질환(aneuploidy)에 기인하는 기타 임상학적 기형을 검출하는데 있어서 높은 감도를 가지게 된다. 염색체상에서 상기 프로브들의 위치가 도 2 내지 도 13에서 도시되어 있는데, 도 1은 도 2 내지 도 13을 편집한 것으로서 이들 도면들의 원본을 이용하여 작성하였다. 도 14는 도1에서 나타내지 않은 19qtel 의 위치를 도시한다.
따라서, 본 발명은 예전에 이용가능했던 것보다 더욱 작고 텔로미어에 더욱 근접하여 위치하는 서브텔로미어 DNA 프로브를 결정 및 개발하는 방법을 제공한다. 이러한 작은 프로브들은, 크기로 인해 검출될 수 없었던 더욱 작은 변이, 결실 및 재배열을 검출할 수 있다. 또한, 더욱 큰 프로브의 서열 내에서 일부의 변이, 결실 및 재배열이 실질적으로 일어날 수 있고, 이러한 서열은 종래 프로브를 이용하여 검출할 수 없었지만 본 발명의 프로브를 이용하면 검출할 수 있다. 또한, 본 발명의 프로브는 예전에 가능했던 것보다 염색체 말단에 더욱 근접하는 염색체 재배열을 검출할 수 있다. 그 이유로서, 본 발명의 프로브는 각 염색체의 각 팔의 아주 말단으로부터 출발하여 한 종 이상의 독특한 서열을 찾기 위해 안쪽으로 진행하면서 작업하여 개발되는 것이기 때문이다. 교차 혼성화 서열은 계산적으로 배제되는 것이 바람직하다. 즉, 동정된 서열을 공지의 서열과 비교함으로써, 프로브가 교차 혼성화되는 지를 실험적으로 측정하는 것보다는 교차 혼성화가 거의 없게 된다. 본 발명의 서브텔로미어 프로브의 특별한 예는 SEQ ID NOS: 83-244로서 본원에 나타낸 바와 같은 프라이머를 이용하여 개발되었다.
실시예 2
이 실시예는 18qtel(2530) 프로브의 디자인, 합성, 확인 및 혼성화를 설명한다.
물질 및 방법:
18번 염색체상의 서브텔로미어 간격의 프로브를 2001 년 4월 1일자 발표된 인간 게놈 서열로부터 2001년 7월 30일자로 개발했다. 상기 염색체로부터의 서열이, 단일 카피 간격을 자동으로 동정하고 중합효소 연쇄 반응용 프라이머 서열을 선택하도록 개발된 소프트웨어에 다운로드하여 분석하였다. 기대된 단일 카피 서열을 동정할 수 있는 방법이라면 본 발명의 목적을 위해 사용될 수 있음은 물론이다. 단일 카피 FISH를 포함하는 Unix 스크립트가 이러한 과정을 제어한다. 사용자는 프로브가 디자인되는 인간 게놈 서열의 버젼, 염색체 영역의 좌표, 및 단일 카피 간격의 최소 길이를 공급하여야 한다. 이러한 간격의 최소 길이는 형광 현미경 분석에 의한 FISH 프로브의 시각화를 용이하게 하기 위하여 1500 개 뉴클레오티드로서 선택되었다. 그러나, 상기 소프트웨어는 어떤 원하는 사이즈의 단일 카피 간격을 동정할 수 있다. 말단 349,999 bp를 갖는 간격이 입력되었고, 상기 스크립트는 켈리포니아 산타 크루즈 대학 웹사이트의 게놈 브라우저로부터 이러한 서열을 검색하였다. 다음에, Perl 프로그램인 findirepeatmask.p1은 RepeatMasker 프로그램(Smit A 및 Green P, 워싱턴 대학)의 출력으로부터 1500bp 이상의 간격들의 좌표를 계산했다. ncifert 웹사이트의 Delila 프로그램인 xyplo는 상기 단일 카피 간격들의 위치를 나타냈다. 다음에, 상기 스크립트는 일련의 서열 분석 프로그램(accelrys. com)을 불러내서, 큰 서열로부터 각각의 단일 카피 서브인터벌의 서열을 추출한 다음, 각 서브인터벌마다 긴 PCR에 적합한 올리고뉴클레오티드 프라이머 서열들을 선정했다. 83,779,017 내지 83,879,017의 18번 염색체 서브인터벌을 선택하여 프라이머를 디자인했다. 프라이머의 선정은 예전에 보고된 바와 같이, 프라이머 어닐링 온도, 생성물 G/C 조성 및 간격 길이를 감소시킴으로써 Perl 스크립트(위스콘신 프로그램 프라임을 실시하는 primwrapper.p1)을 이용하여 실시하였다(Rogan 등, Genome Research, 11:1086-1094, 2001 참조). 350 kb 게놈 영역의 프로브들의 디자인에는 300 MHz Unix 워크스테이션에서 약 1 시간 소요되었다. 이러한 18번 염색체 간격의 경우, 상기 소프트웨어는 25개의 간격들을 긴 PCR 반응에 제공했다. 본 발명의 발명자들은 2003년 4월에 완성한 게놈 기준 서열의 소정의 서열 말단으로부터 80,057 내지 82,584 bp 떨어져 있는 생성물 22를 선택했다. 2001년 4월의 서열에 있어서, 이러한 18번 염색체 서열은 완성되지 않았으며, 상기 프로브 서열은 이용가능한 서열의 말단으로부터 43227 내지 45757 bp에 속했다. 상기 RepeatMasker 소프트웨어가, 인간 게놈내에 공통되는 반복 서열류의 서열을 스크리닝하지만, 이러한 소프트웨어는 반복 서열의 기준을 기술적으로 만족시키지 못하는 것으로, 게놈내의 복잡한 이원성 또는 저카피수의 단편 영역들은 검출하지 못한다. 따라서, 이러한 서열의 단일 카피 조성을 UCSC 게놈 브라우저 웹사이트에서 BLAT 툴을 이용하여 계산적으로 검증하였다. 이러한 툴(tool)은 게놈내의 다른 서열이 질문에 관한 것인지를 신속히 결정하고 만일 그렇다면 상기 질문에 관한 서열의 길이 및 유사성(%)을 신속히 결정한다. 다수의 간격들에 대한 이러한 BLAT 과정을 동시에 자동화하기 위한 스크립트를 개발하였다. 길이가 500 bp 이하인 서열 또는 30% 이상의 차이를 갖는 1000 bp 이하의 서열은 염색체 서열을 검출하기 위해 사용되는 혼성화 및 세척 조건하에서 상기 프로브에 교차 혼성화되지 않을 것으로 보인다. 이러한 문턱값을 초과하는 서열은 일반적으로 불합격처리되었지만, 이러한 관련 서열들은 18q tel 영역의 경우 계산적으로 검출되지 않았다.
이러한 생성물을 증폭하는 PCR 생성물은 30 mer 정방향 및 32mer 역방향 가닥(SEQ ID NOS: 193 및 194)로 구성되었다. 이들 DNA 프라이머는 IDT Inc.에 의해 합성되었고 500 ㎕의 이중 증유수에 재현탁된 다음, 10 μM의 처리 농도로 희석되었다. 상기 프라이머를 게놈내에서 그들 각각의 좌표를 기준으로, 예상 사이즈, 즉 2530 bp의 증폭 생성물을 제조하기 위한 능력을 테스트하였다. 상기 PCR 반응물은 전체 25 ㎕를 포함하고, 정방향 및 역방향 프라이머(각각 0.9 μM), 30 ng의 인간 게놈 고분자량 DNA (4 ℃ 저장; Promega, Madison WI), 1.5 mM MgSO4, 0.625 U의 백금 Pfx 폴리머라제, 10X 반응 완충액, 1.25 mM dNTP, 및 1X PCR 촉진 용액으로 구성되었다(CA주 Carlsbad 에 소재한 Invitrogen의 성분 및 조건). 상기 초기 증폭은 프라이머 디자인 프로그램에 의해 예상되는 온도인 60 ℃에서 수행되었다. 아가로스 겔 전기영동 결과, 상기 생성물은 예상된 크기를 가졌지만, 균일한 생성물을 얻기 위해 추가의 반응 최적화가 요구되었다. Biomek 2000 실험 자동화 워크스테이션을 이용하여 이러한 18qtel 및 다른 생성물에 대한 병행 반응물들을 동시에 세팅하였다. 온도 최적화를 위하여, 상기 병행 반응물들은, 프라이머가 0.3 μM로 첨가되었다는 것을 제외하고, 전술한 바와 동일한 조건에 따라 그레디언트 열사이클러(MJ Research Alpha)상에서 상이항 어닐링 온도, 구체적으로는 53.2, 55.5, 58.4, 61.8, 64.4, 및 66.8 ℃로 PCR 증폭하였다. 열 사이클 조건은 다음과 같다: 94 ℃에서 게놈 주형의 초기 변성, 이어서 상기 어닐링 및 신장 온도에서 5 분간 15 사이클, 및 20분간 변성. 다음에, 동일 온도로 15 사이클을 수행하였지만, 어닐링 및 신장 단계는 사이클당 5분 증가시켰다. 68 ℃로 10분간 프라이머 신장 마무리 단계를 실시한 후, 그 반응물을 냉각하고 0 ℃로 유지했다. 그 생성물을 아가로스 겔 전기영동으로 분리하고 검사하여 가장 순수한 생성물을 발생시킨 최고 수율을 결정하였다. 이러한 프로브 생성물에 대한 최적 온도는 64 ℃인 것으로 확인되었다. 상기 반응물을 200 μl의 최종 용적이 되게 하여, 표지 및 몇 개의 형광 동소 혼성화 분석을 위해 충분한 양의 PCR 생성물을 제조하였다. 상기 생성물을 아가로스 겔상에서 분리한 다음, 그 밴드를 절제하고, Montage 추출 스핀 컬럼(Millipore, Waterdown MA)을 이용하여 정제했다. 상기 컬럼으로부터의 용리액을 에탄올로 침전시키고, 간단히 경사분리한 다음, 이중 증류수에 100 ng/μl의 농도로 다시 현탁하였다. 약 1 μg의 생성물을 회수하였다. 싱기 용액을, Rogan (2001)에서 설명한 바와 같이 디곡시게닌-개질된 또는 비오틴화 dUTP를 이용하여 틈 번역하여 표지하였다. 이러한 과정은 정상 개체 및 환자로부터의 중기 및 간기 염색체를 함유하는 5 개의 슬라이드에 변성 및 혼성화하기 위한 충분한 양의 프로브를 제공했다.
결과:
상기 프로브를 실험적으로 확인한 결과, 상기 프로브는 정상 핵형을 갖는 정상인 세포내의 어떤 다른 염색체 영역에 혼성화되지 않았는데, 이는 이러한 서열이 게놈내의 단일 카피에 존재하였다는 계산적 예상의 결과와 일치하는 것이다. 계산 및 실험적 확인 모두룰 통과한 상기 프로브는 염색체q의 말단 재배열을 가지는 것으로 판단된 환자의 분석을 위해 염색체 18q의 말단에 아주 근접하였기 때문에 선택되었다. 도 18은 6;18 전위를 갖는 환자에서 6번 염색체의 p완상에서 이러한 서열의 말단 밴드로의 전위를 검출하는 상기 프로브의 예를 도시한다. 이러한 도면에서, 18q 서브텔로미어 프로브(2530 bp 길이)는 비정상 중기 세포에 혼성화되지 않았다. 이러한 세포는 6번 염색체의 단완과 18번 염색체의 말단 염색체 밴드의 사이에서 전위가 있다. 상기 전위의 위치는 정상 G-밴딩된 6번 염색체 및 정상 G-밴딩된 18번 염색체상에 화살표로 도시되어 있다. 또한, 전위된 G-밴드 6 및 18번 염색체가 포함되어 있다. 상기 18q 프로브의 위치는 적색으로 도시된다. 적색으로 도시한 염색체 18q 프로브는 좌측에 도시한 바와 같이 정상 염색체 18 및 유도체성 염색체 6에 혼성화되어 있다. 상기 유도체성 염색체 18은 이의 서브텔로미어 영역이 염색체 6p와 교환될 정도로 혼성화되지 않는다.

Claims (40)

  1. 염색체 재배열을 검출하기에 유용한 서브텔로미어 프로브로서,
    길이가 약 25 kb 이하인 단일 카피 서열을 포함하고, 상기 서열은 단일 염색체의 팔의 말단 G-밴드 또는 R-밴드에 혼성화할 수 있는 것을 특징으로 하는 서브텔로미어 프로브.
  2. 제 1 항에 있어서, 상기 말단 밴드는 G-밴드 염색후 밝아지는 것을 특징으로 하는 프로브.
  3. 제 1 항에 있어서, 상기 말단 밴드는 R-밴드 염색후 어두워지는 것을 특징으로 하는 프로브.
  4. 제 1 항에 있어서, 상기 암은 1p, 1q, 2p, 2q, 3p, 4p, 4q, 5p, 5q, 6p, 6q, 7p, 7q, 8p, 8q, 9p, 9q, 10p, 10q, 11p, 11q, 12p, 12q, 13q, 14p, 14q, 15p, 15q, 16p, 16q, 17p, 17q, 18q, 19p, 19q, 20q, 21p, 21q, 22p, 22q, Xp, Xq, 및 Yp로 구성되는 군에서 선택되는 것을 특징으로 하는 프로브.
  5. 제 1 항에 있어서, 상기 프로브는 SEQ ID NOS: 1-3, 5-23, 26-36,38-57, 59-61, 63-67, 69-82, 및 245-251로 구성되는 군에서 선택되는 것을 특징으로 하는 프로브.
  6. 제 1 항에 있어서, 상기 프로브는 길이가 10 kb 이하인 것을 특징으로 하는 프로브.
  7. 제 1 항에 있어서, 상기 프로브는 상기 염색체의 텔로미어의 약 8000 kb 내에 위치하는 것을 특징으로 하는 프로브.
  8. 제 7 항에 있어서, 상기 프로브는 SEQ ID NOS: 1-3, 5-23, 26-36,38-57, 59-61, 63-67, 69-82, 및 245-251로 구성되는 군에서 선택되는 것을 특징으로 하는 프로브.
  9. 제 1 항에 있어서, 상기 프로브는 상기 염색체의 텔로미어의 300 kb 내에 위치하는 것을 특징으로 하는 프로브.
  10. 제 9 항에 있어서, 상기 프로브는 SEQ ID NO: 36, 80, 46, 47, 49, 51, 56, 248, 57, 78, 59, 75, 76, 74, 63, 250, 251, 66, 65, 67, 4, 3, 1, 9, 6, 11, 10, 17, 20, 19, 18, 21, 81, 26, 29, 28, 31, 32, 43, 42, 41, 40, 44, 45 및 70으로 구성되는 군에서 선택되는 것을 특징으로 하는 프로브.
  11. 제 1 항에 있어서, 상기 프로브는 표지되거나 또는 표면에 부착되도록 개질되는 것을 특징으로 하는 프로브.
  12. 염색체의 서브텔로미어 영역으로부터 단일 카피 DNA 서열 프로브를 개발하기 위한 방법으로서, 상기 프로브는 게놈내의 단일 위치에 혼성화할 수 있는 것이고, 상기 방법은
    말단 뉴클레오티드에 가장 근접하는 것으로, 500 개 이상의 염기쌍의 길이를 갖는 단일 카피 서열에 대한 말단 뉴클레오티드에서 시작하여 뉴클레오티드마다 염색체의 DNA 서열을 검색하는 단계와,
    상기 단일 카피 간격을 동정하는 단계와;
    상기 단일 카피 간격을 합성하는 단계와,
    상기 합성된 단일 카피 간격을 프로브로서 이용하는 단계를 포함하는 것을 특징으로 하는 방법.
  13. 제 12 항에 있어서, 상기 동정 단계는 상기 동정된 단일 카피 간격이 단일 게놈 위치에서 나타나거나 또는 이원성 서열들이 밀접하게 결합되어 단일 신호만이 검출된다는 것을 계산적으로 또는 실험적으로 검증하는 단계를 포함하는 것을 특징으로 하는 방법.
  14. 제 13 항에 있어서, 상기 동정 단계는 계산적으로 또는 실험적으로 검증하는 것을 포함하는 것을 특징으로 하는 방법.
  15. 제 13 항에 있어서, 상기 계산적 검증은 소프트웨어를 이용하여 상기 프로브 서열이 게놈내의 단일 장소에 위치하여 있다는 것을 결정하는 것을 포함하는 것을 특징으로 하는 방법.
  16. 제 12 항에 있어서, 상기 방법은 상기 합성된 단일 카피 서열을 표지하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
  17. 제 13 항에 있어서, 상기 실험적 검증은 상기 단일 카피 프로브를 상기 염색체에 다시 혼성화하고 상기 염색체의 말단 밴드 및 정확한 팔상에서 상기 프로브를 시각화하는 것을 포함하는 것을 특징으로 하는 방법.
  18. 제 12 항에 있어서, 상기 단일 카피 간격은 SEQ ID NOS: 1-3, 5-23, 26-36,38-57, 59-61, 63-67, 69-82, 및 245-251로 구성되는 군에서 선택되는 것을 특징으로 하는 방법.
  19. 제 12 항에 있어서, 상기 방법은 아주 반복적인 DNA를 이용하여 상기 단일 카피 프로브를 예비 어닐링하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
  20. 염색체 재배열을 동정하기 위한 합성 단일 카피 폴리뉴클레오티드로서, 상기 폴리뉴클레오티드는 염색체의 말단 뉴클레오티드의 8,000 kb 내에 위치하고, 염색체 재배열이 발생하지 않은 경우에는 특정 염색체상의 단일 위치에 혼성화되고, 길이가 25 kb 이하인 것을 특징으로 하는 폴리뉴클레오티드.
  21. 제 20 항에 있어서, 상기 폴리뉴클레오티드는 상기 특정 염색체의 말단 G-밴드 또는 R-밴드에 존재하는 것을 특징으로 하는 폴리뉴클레오티드.
  22. 제 20 항에 있어서, 상기 폴리뉴클레오티드는 SEQ ID NOS: 1-3, 5-23, 26-36,38-57, 59-61, 63-67, 69-82, 및 245-251로 구성되는 군에서 선택되는 것을 특징으로 하는 폴리뉴클레오티드.
  23. 제 20 항에 있어서, 상기 폴리뉴클레오티드는 상기 특정 염색체의 말단 뉴클레오티드의 약 300 kb 내에 위치하는 것을 특징으로 하는 폴리뉴클레오티드.
  24. 제 23 항에 있어서, 상기 폴리뉴클레오티드는 SEQ ID NOS: 36, 80, 46, 47, 49, 51, 56, 248, 57, 78, 59, 75, 76, 74, 63, 250, 251, 66, 65, 67, 4, 3, 1, 9, 6, 11, 10, 17, 20, 19, 18, 21, 81, 26, 29, 28, 31, 32, 43, 42, 41, 40, 44, 45 및 70으로 구성되는 군에서 선택되는 것을 특징으로 하는 폴리뉴클레오티드.
  25. 제 20 항에 있어서, 상기 폴리뉴클레오티드는 표지되거나 또는 표면에 부착되도록 화학적으로 개질된 것을 특징으로 하는 폴리뉴클레오티드.
  26. 염색체 재배열을 검출할 수 있는 단일 카피 프로브를 유도하기 위해 사용되는 올리고뉴클레오티드 프라이머쌍으로써, SEQ ID NOS: 83-244로 구성되는 군에서 선택되는 서열을 포함하는 것을 특징으로 하는 올리고뉴클레오티드 프라이머쌍.
  27. 염색체 재배열을 검출하도록 작동할 수 있는 개선된 합성 DNA 프로브로서, 상기 프로브는 단일 염색체상의 정확한 위치에 혼성화되도록 작동할 수 있는 DNA 서열을 포함하고, 길이가 25 kb 이하인 것을 특징으로 하는 프로브.
  28. 제 27 항에 있어서, 상기 부분은 전체 프로브를 포함하는 것을 특징으로 하는 개선된 프로브.
  29. 제 27 항에 있어서, 상기 프로브는 하프 YACS로부터 유도된 PAC 클론, 코스미드, 포스미드, 박테리오파지, 및 P1으로 구성되는 군에서 선택된 클론보다 염색체 팔상에서 텔로미어 말단에 더욱 근접하게 위치하고, 상기 염색체 팔은 2p, 3p, 5p, 7p, 8p, 10p, 11p, 12p, 16p, 17p, 18p, Xp, Yp, 1q, 3q, 4q, 6q, 7q, 8q, 9q, 10q, 11q, 12q, 13q, 14q, 15q, 16q, 17q, 18q, 19q, 20q, 21q, 및 22q로 구성되는 군에서 선택되는 것을 특징으로 하는 개선된 프로브.
  30. 제 27 항에 있어서, 상기 프로브는 상기 염색체의 텔로미어의 말단 뉴클레오티드의 8,000 kb내에 위치하는 것을 특징으로 하는 개선된 프로브.
  31. 제 27 항에 있어서, 상기 프로브는 상기 염색체의 텔로미어의 말단 뉴클레오티드의 300 kb내에 위치하는 것을 특징으로 하는 개선된 프로브.
  32. 제 27 항에 있어서, 상기 프로브는 상기 염색체의 말단 G-밴드 또는 R-밴드내에 위치하는 것을 특징으로 하는 개선된 프로브.
  33. 제 27 항에 있어서, 상기 프로브는 46, 47, 49, 56, 78, 59, 64, 249, 2, 4, 3, 5, 9, 11, 20, 19, 21, 81, 246, 70, 72, 73, 36, 80, 247, 50, 57, 75, 76, 74, 63, 250, 66, 65, 67, 1, 6, 10, 12, 16, 15, 13, 14, 17, 18, 81, 245, 26, 31, 32, 43, 42, 40, 44 및 45로 구성되는 군에서 선택되는 것을 특징으로 하는 개선된 프로브.
  34. 세포유전학적 기형에 대하여 개체를 스크리닝하는 방법으로서, 상기 개체는 특발성 정신 지체 장애 또는 정신 장애 및 최소한 하나의 임상학적 기형을 가지며, 상기 방법은
    길이가 각각 약 25 kb 이하인 다수의 혼성화 프로브를 이용하여 상기 개체의 게놈을 스크리닝하는 단계와,
    상기 게놈내의 세포유전학적 기형을 나타내는 프로브의 혼성화 패턴을 검출하는 단계를 포함하는 것을 특징으로 하는 방법.
  35. 제 34 항에 있어서, 상기 혼성화 패턴을 특정의 임상학적 기형과 연관시키는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
  36. 제 34 항에 있어서, 상기 프로브는 단일 게놈 위치에 나타나거나 또는 이원성 서열들이 밀접하게 연결되어 단일 혼성화 신호만이 검출되는 것을 특징으로 하는 방법.
  37. 염색체 불균형의 정도를 묘사하는 방법으로서,
    길이가 약 25 kb인 하나 이상의 혼성화 프로브를 이용하여 염색체 팔을 분석하는 단계와;
    상기 팔상에서 상기 프로브의 혼성화 패턴을 검출하는 단계와;
    상기 혼성화 패턴을 상기 팔의 표준 게놈 지도와 비교하여 염색체 불균형의 정도를 묘사하는 단계를 포함하는 것을 특징으로 하는 방법.
  38. 제 37 항에 있어서, 상기 팔상의 불균형을 특발성 정신 지체 또는 암으로 구성되는 군에서 선택되는 의학적 증상과 상관시키는 단계를 추가로 포함하는 것을 특징으로 하는 방법.
  39. 제 37 항에 있어서, 다수의 프로브를 이용하는 것을 특징으로 하는 방법.
  40. 제 37 항에 있어서, 상기 프로브는 특정의 염색체 팔에 혼성화되는 것을 특징으로 하는 방법.
KR1020057005567A 2002-09-30 2003-09-30 서브텔로미어 디엔에이 프로브 및 이의 제조 방법 KR20050073466A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US41534502P 2002-09-30 2002-09-30
US60/415,345 2002-09-30
US48449403P 2003-07-02 2003-07-02
US60/484,494 2003-07-02

Publications (1)

Publication Number Publication Date
KR20050073466A true KR20050073466A (ko) 2005-07-13

Family

ID=32045315

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057005567A KR20050073466A (ko) 2002-09-30 2003-09-30 서브텔로미어 디엔에이 프로브 및 이의 제조 방법

Country Status (7)

Country Link
US (1) US20040161773A1 (ko)
EP (1) EP1573036A4 (ko)
JP (1) JP2006508691A (ko)
KR (1) KR20050073466A (ko)
AU (1) AU2003275377A1 (ko)
CA (1) CA2500551A1 (ko)
WO (1) WO2004029283A2 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7734424B1 (en) 2005-06-07 2010-06-08 Rogan Peter K Ab initio generation of single copy genomic probes
US8407013B2 (en) 2005-06-07 2013-03-26 Peter K. Rogan AB initio generation of single copy genomic probes
WO2010096036A2 (en) * 2008-05-14 2010-08-26 Millennium Pharmaceuticals, Inc. Methods and kits for monitoring the effects of immunomodulators on adaptive immunity
JP2012525147A (ja) 2009-04-30 2012-10-22 グッド スタート ジェネティクス, インコーポレイテッド 遺伝マーカーを評価するための方法および組成物
US9163281B2 (en) 2010-12-23 2015-10-20 Good Start Genetics, Inc. Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
WO2016040446A1 (en) * 2014-09-10 2016-03-17 Good Start Genetics, Inc. Methods for selectively suppressing non-target sequences
CA3010579A1 (en) 2015-01-06 2016-07-14 Good Start Genetics, Inc. Screening for structural variants
US20230183780A1 (en) 2016-07-25 2023-06-15 InVivo BioTech Services GmbH Dna probes for in situ hybridization on chromosomes

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6007994A (en) * 1995-12-22 1999-12-28 Yale University Multiparametric fluorescence in situ hybridization
AU9393398A (en) * 1997-09-16 1999-04-05 Egea Biosciences, Inc. Method for the complete chemical synthesis and assembly of genes and genomes
AU2549899A (en) * 1998-03-02 1999-09-20 Nikon Corporation Method and apparatus for exposure, method of manufacture of exposure tool, device, and method of manufacture of device
US6100033A (en) * 1998-04-30 2000-08-08 The Regents Of The University Of California Diagnostic test for prenatal identification of Down's syndrome and mental retardation and gene therapy therefor
EP1006199A1 (en) * 1998-12-03 2000-06-07 Kreatech Biotechnology B.V. Applications with and methods for producing selected interstrand crosslinks in nucleic acid
IL152727A0 (en) * 2000-05-16 2003-06-24 Childrens Mercy Hospital Single copy genomic hybridization probes and method of generating same
US6828097B1 (en) * 2000-05-16 2004-12-07 The Childrens Mercy Hospital Single copy genomic hybridization probes and method of generating same
US6400033B1 (en) * 2000-06-01 2002-06-04 Amkor Technology, Inc. Reinforcing solder connections of electronic devices

Also Published As

Publication number Publication date
EP1573036A4 (en) 2007-10-10
AU2003275377A1 (en) 2004-04-19
EP1573036A2 (en) 2005-09-14
US20040161773A1 (en) 2004-08-19
CA2500551A1 (en) 2004-04-08
WO2004029283A3 (en) 2005-11-10
WO2004029283A2 (en) 2004-04-08
JP2006508691A (ja) 2006-03-16

Similar Documents

Publication Publication Date Title
US5830665A (en) Contiguous genomic sequence scanning
US6828097B1 (en) Single copy genomic hybridization probes and method of generating same
US7303880B2 (en) Microdissection-based methods for determining genomic features of single chromosomes
US20090312533A1 (en) Single copy genomic hybridization probes and method of generating same
JP2009148291A (ja) 染色体異常の分子検出
CN101230394A (zh) 短串联重复基因座的多重扩增
JP2022528728A (ja) 単一細胞遺伝的構造変異の包括的検出
KR20050073466A (ko) 서브텔로미어 디엔에이 프로브 및 이의 제조 방법
Qaisar et al. Techniques of chromosomal studies
Wolff Fluorescence in situ hybridization (FISH)
US20080044916A1 (en) Computational selection of probes for localizing chromosome breakpoints
Tönnies Molecular cytogenetics in molecular diagnostics
US9868986B2 (en) Sieving and profiling nucleic acid samples
RU2600874C2 (ru) Набор олигонуклеотидных праймеров и зондов для генотипирования полиморфных локусов днк, ассоциированных с риском развития спорадической формы болезни альцгеймера в российских популяциях
EP1207209A2 (en) Methods using arrays for detection of single nucleotide polymorphisms
Sankar et al. Rational selection of Genetic tests in Clinical Practice Part 1-Cytogenetics, FISH and Microarray
WO2003025198A2 (en) Regulatory single nucleotide polymorphisms and methods therefor
Wyandt et al. Chromosome Variation Detected by Fluorescent In Situ Hybridization (FISH)
Reekie Technological and Biological Studies of Human Structural Variation
Dolf DNA Fingerprinting: Approaches and Applications
Goldstein A Brief Introduction to Genetics
Yang et al. • HLA-DQB1 Genotyping with Simple Automated DNA Sequencing and Single-Strand Conformation Polymorphism Analysis
O’Leary et al. 3 Blots, dots, amplification, and sequencing
Schiffman Integrating mutation panel testing and copy number in clinical genomic studies
LANDEGREN et al. Techniques and Automation

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application