KR102103887B1 - 유전자의 CpG 메틸화 변화를 이용한 간암의 예후 또는 위험도를 평가하는 방법 - Google Patents
유전자의 CpG 메틸화 변화를 이용한 간암의 예후 또는 위험도를 평가하는 방법 Download PDFInfo
- Publication number
- KR102103887B1 KR102103887B1 KR1020190069625A KR20190069625A KR102103887B1 KR 102103887 B1 KR102103887 B1 KR 102103887B1 KR 1020190069625 A KR1020190069625 A KR 1020190069625A KR 20190069625 A KR20190069625 A KR 20190069625A KR 102103887 B1 KR102103887 B1 KR 102103887B1
- Authority
- KR
- South Korea
- Prior art keywords
- chromosome
- sequence
- liver cancer
- seq
- dna
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Hospice & Palliative Care (AREA)
- Biophysics (AREA)
- Oncology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 정상 및 혈액 조직에서 낮은 메틸화 수준을 보이나 암 조직에서만 높은 메틸화 수준을 보이는 하나 이상의 CpG 부위의 메틸화 수준을 측정하여 정상 조직이 섞여 있는 임상 검체를 이용하여 간암의 예후 또는 위험도를 평가하는 방법에 관한 것이다.
Description
본 발명은 특정 유전자 CpG 부위의 메틸화 정도를 측정하여 간암 관련 위험도를 평가하는 방법에 관한 것이다.
암은 세포주기가 조절되지 않아 세포분열을 계속 하는 질병으로, 주위 조직에 침윤하면서 빠르게 성장하고 신체 각 부위에 확산되거나 전이되어 생명을 위협한다.
간에 생긴 암을 간암이라고 하며, 간암은 세계적으로 발병률이 높은 암 가운데 하나이다. 한국에서 간암 사망률은 인구 10만 명당 23명으로 매우 높은 편이며, 한국인의 총 사망률의 약 10%는 간염, 간경화 및 간암과 관계되어 있다.
다른 조직의 암이 간으로 전이되는 전이성 간암과 간세포 자체에서 암이 발생하는 원발성 간암(HCC; hepatocellular carcinoma)으로 간암을 분류할 수 있으나, 원발성 간암이 간암의 90%를 차지하기 때문에 대부분의 간암은 원발성 간암(HCC)을 의미한다.
간암은 초음파검사(ultrasound), 전산화단층촬영(CT), 자기공명촬영(MRI) 및 간동맥조영촬영(Angiography) 등의 영상 진단 방법이 있다. 초음파 검사는 간암의 크기에 따라 민감도에 많은 영향을 받으며, 간암 발생을 알아보는 일차 영상검사 방법으로 이용되고 있다.
5 cm 이상의 큰 간암 조직의 경우 75% 이상의 민감도를 보이는 반면, 1 cm 미만의 작은 간암의 경우 약 42%의 민감도를 보인다(Gomaa et al., World J Gastro., 15:1301, 2009).
전산화단층촬영(CT)은 가장 민감도가 높은 검사로 검사로 2 cm 이상의 간암의 경우 거의 100%, 1-2 cm의 경우 93%, 그리고 1 cm 이하의 간암도 60% 가까운 민감도로 진단할 수 있다(Gomaa et al., World J Gastro., 15:1301, 2009).
하지만 이러한 검사는 비용이 비교적 비싸므로 일반 대중에서 일상적인 스크리닝 검사로 사용하기에는 부담이 되는 검사법이다.
간암의 경우 진단 당시의 종양의 크기가 예후와 있으며, 환자의 생존율을 높이기 위해서는 간암을 조기에 발견하는 것이다. 따라서 높은 민감도로 조기에 간암을 발견 할 수 있는 진단 기술의 개발이 절실히 요구되고 있다.
한편, 후성유전학(epigenetics)은 DNA의 염기서열이 변화하지 않은 상태에서 이루어지는 유전자의 발현 조절을 연구하는 분야이다. 후성유전학은 DNA 메틸화, miRNA 또는 히스톤의 아세틸화, 메틸화, 인산화 및 유비퀴틴화 등과 같은 후성적 변이를 통한 유전자 발현 조절을 연구한다.
이중 DNA 메틸화가 가장 많이 연구가 되어있는 후성적 변이이다. 후성적 변이는 유전자 기능 변이 및 종양 세포로의 변화를 초래할 수 있다. 따라서 DNA 메틸화는 세포 내 질환 조절 유전자의 발현(또는 억제 및 유도와)과 연관되어 있으며, 최근에 DNA 메틸화 측정을 통한 암 진단 방법들이 제시되고 있다.
DNA 메틸화는 주로 특정 유전자의 프로모터 부위의 CpG 아일랜드(CpG island)의 사이토신(cytosine)에서 일어나고, 그로 인하여 전사인자의 결합이 방해를 받게 되어 특정 유전자의 발현이 차단(gene silencing)되는 것으로, 코딩서열(coding sequence)에 돌연변이가 없이도 그 유전자의 기능이 소실되는 주요 기전이다.
유전자의 프로모터 지역 이외에도 인헨서(enhancer), 조절 부위와 같은 비번역지역의 DNA 메틸화도 염색체의 구조변이, 히스톤 변형(modification)과 함께 작용하며 여러 질병의 원인 기전이 된다고 알려져 있다. 암을 포함한 다양한 질병들에서 CpG 아일랜드에서의 이러한 비정상적인 메틸화/탈메틸화가 보고되었으며, 질병 관련 유전자의 프로모터 메틸화를 조사하여 각종 질환의 진단에 사용하려는 시도가 활발하게 이루어지고 있다.
본 발명자들은 간암 발병과 관련 있는 유전자의 메틸화 부위를 선별하였고, 이를 검증하는 실험을 통해 간암의 위험성 또는 예후를 진단하는 방법을 제공하고자 하였다.
본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허 문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명은 전술한 종래 기술의 문제점을 해결하기 위한 것으로, 본 발명의 목적은 간암의 위험성을 초기에 발견하기 위해 정상 조직이나 혈액에서는 낮은 메틸화를 보이나 간암조직에서만 높은 메틸화 수준을 보이는 특정 프로브를 이용하여 검체의 메틸화 수준을 측정하므로서 간암의 위험성 또는 예후를 진단하는 방법을 제공한다.
본 발명의 일 측면에 따르면, (a) 대상체(subject)의 생물학적 시료에서 DNA를 제공하는 단계; 및 (b) 상기 분리된 DNA에서 염색체 #2의 25438725 내지 25439276번째 서열, 염색체 #12의 95941906 내지 95942979번째 서열, 염색체 #10의 134597357 내지 134602649번째 서열, 염색체 #8의 144649774 내지 144651774번째 서열, 염색체 #1의 47998899 내지 47999517번째 서열, 염색체 #2의 26394102 내지 26396102번째 서열 염색체 #8의 104510870 내지 104513913번째 서열, 염색체 #8의 98289604 내지 98290404번째 서열, 염색체 #2의 63281034 내지 63281347번째 서열, 염색체 #8의 67873388 내지 67875600번째 서열, 염색체 #4의 76555366 내지 76556079번째 서열, 염색체 #1의 63782394 내지 63790471번째 서열, 염색체 #5의 7849945 내지 7850439번째 서열, 염색체 #2의 39186777 내지 39187968번째 서열, 및 염색체 #14의 74207665 내지 74208665번째 서열로 이루어진 군에서 선택되는 CpG 부위의 메틸화 수준을 측정하는 단계;를 포함하는 간암의 예후 또는 위험도를 평가하는 방법이 제공된다.
일 실시예에 있어서, 상기 방법은 2 이상의 CpG 부위 메틸화 수준을 측정할 수 있다.
일 실시예에 있어서, 상기 염색체 #2의 25438725 내지 25439276번째 서열은 서열번호 1의 염기서열을 가지고, 상기 염색체 #12의 95941906 내지 95942979번째 서열은 서열번호 2의 염기서열을 가지고, 상기 염색체 #10의 134597357 내지 134602649번째 서열은 서열번호 3의 염기서열을 가지고, 상기 염색체 #8의 144649774 내지 144651774번째 서열은 서열번호 4의 염기서열을 가지고, 상기 염색체 #1의 47998899 내지 47999517번째 서열은 서열번호 5의 염기서열을 가지고, 상기 염색체 #2의 26394102 내지 26396102번째 서열은 서열번호 6의 염기서열을 가지고, 상기 염색체 #8의 104510870 내지 104513913번째 서열은 서열번호 7의 염기서열을 가지고, 상기 염색체 #8의 98289604 내지 98290404번째 서열은 서열번호 8의 염기서열을 가지고, 상기 염색체 #2의 63281034 내지 63281347번째 서열은 서열번호 9의 염기서열을 가지고, 상기 염색체 #8의 67873388 내지 67875600번째 서열은 서열번호 10의 염기서열을 가지고, 상기 염색체 #4의 76555366 내지 76556079번째 서열은 서열번호 11의 염기서열을 가지고, 상기 염색체 #1의 63782394 내지 63790471번째 서열은 서열번호 12의 염기서열을 가지고, 상기 염색체 #5의 7849945 내지 7850439번째 서열은 서열번호 13의 염기서열을 가지고, 상기 염색체 #2의 39186777 내지 39187968번째 서열은 서열번호 14의 염기서열을 가지고, 상기 염색체 #14의 74207665 내지 74208665번째 서열은 서열번호 15의 염기서열을 가질 수 있다.
일 실시예에 있어서, 상기 염색체 #2의 25438725 내지 25439276번째 서열의 CpG 부위는 염색체 #2의 25439110번째에 위치하고, 상기 염색체 #12의 95941906 내지 95942979번째 서열의 CpG 부위는 염색체 #12의 95941988번째에 위치하고, 상기 염색체 #10의 134597357 내지 134602649번째 서열의 CpG 부위는 염색체 #10의 134599823번째에 위치하고, 상기 염색체 #8의 144649774 내지 144651774번째 서열의 CpG 부위는 염색체 #8의 144651002번째에 위치하고, 상기 염색체 #1의 47998899 내지 47999517번째 서열의 CpG 부위는 염색체 #1의 47999163번째에 위치하고, 상기 염색체 #2의 26394102 내지 26396102번째 서열의 CpG 부위는 염색체 #2의 26395458번째에 위치하고, 상기 염색체 #8의 104510870 내지 104513913번째 서열의 CpG 부위는 염색체 #8의 104512877번째에 위치하고, 상기 염색체 #8의 98289604 내지 98290404번째 서열의 CpG 부위는 염색체 #8의 98290148번째에 위치하고, 상기 염색체 #2의 63281034 내지 63281347번째 서열의 CpG 부위는 염색체 #2의 63281139번째에 위치하고, 상기 염색체 #8의 67873388 내지 67875600번째 서열의 CpG 부위는 염색체 #8의 67874178번째에 위치하고, 상기 염색체 #4의 76555366 내지 76556079번째 서열의 CpG 부위는 염색체 #4의 76555832번째에 위치하고, 상기 염색체 #1의 63782394 내지 63790471번째 서열의 CpG 부위는 염색체 #1의 63789278번째에 위치하고, 상기 염색체 #5의 7849945 내지 7850439번째 서열의 CpG 부위는 염색체 #5의 7850070번째에 위치하고, 상기 염색체 #2의 39186777 내지 39187968번째 서열의 CpG 부위는 염색체 #2의 39187533번째에 위치하고, 상기 염색체 #14의 74207665 내지 74208665번째 서열의 CpG 부위는 염색체 #14의 74208165번째에 위치할 수 있다.
일 실시예에 있어서, 상기 생물학적 시료는 간암 의심 환자 또는 진단 대상 유래의 조직, 세포, 혈액, 혈장, 대변 및 소변으로 이루어진 군에서 선택되는 1종일 수 있다.
일 실시예에 있어서, 상기 (b) 단계는 PCR, 메틸화 특이 PCR(methylation specific PCR), 실시간 메틸화 특이 PCR(real time methylation specific PCR), MethyLight PCR, MehtyLight digital PCR, EpiTYPER, 메틸화 DNA 특이적 결합 단백질을 이용한 PCR, 정량 PCR, DNA 칩, 파이로시퀀싱 및 바이설파이트 시퀀싱으로 이루어진 군에서 선택되는 1종의 방법으로 수행될 수 있다.
일 실시예에 있어서, 상기 방법은 (c) 상기 메탈화 수준을 정상 대조군의 메틸화 수준과 비교하는 단계;를 더 포함할 수 있다.
본 발명의 다른 측면에 따르면, 염색체 #2의 25438725 내지 25439276번째 서열, 염색체 #12의 95941906 내지 95942979번째 서열, 염색체 #10의 134597357 내지 134602649번째 서열, 염색체 #8의 144649774 내지 144649774 내지 144651774번째 서열, 염색체 #1의 47998899 내지 47999517번째 서열, 염색체 #2의 26394102 내지 26396102번째 서열 염색체 #8의 104510870 내지 104513913번째 서열, 염색체 #8의 98289604 내지 98290404번째 서열, 염색체 #2의 63281034 내지 63281347번째 서열, 염색체 #8의 67873388 내지 67875600번째 서열, 염색체 #4의 76555366 내지 76556079번째 서열, 염색체 #1의 63782394 내지 63790471번째 서열, 염색체 #5의 7849945 내지 7850439번째 서열, 염색체 #2의 39186777 내지 39187968번째 서열, 및 염색체 #14의 74207665 내지 74208665번째 서열로 이루어진 군에서 선택되는 CpG 부위에 결합하는 프로브를 포함하는 간암 발병 위험도 진단용 키트가 제공된다.
일 실시예에 있어서, 상기 진단용 키트는 상기 CpG 부위에 결합하는 2 이상의 프로브를 포함할 수 있다.
본 발명의 일 측면에 따르면, 암과 정상 조직뿐 아니라 혈액을 포함하는 대부분의 정상세포와 다른 메틸화 수준을 보이는 특정 CpG 부위의 메틸화를 측정함으로써, 정상 조직이 섞여 있는 임상 검체를 이용하여 간암의 발병 가능성을 효과적으로 예측할 수 있다.
본 발명의 효과는 상기한 효과로 한정한 것은 아니며, 본 발명의 상세한 설명 또는 청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.
도 1은 본 발명의 간암 진단 마커 선정 파이프라인을 도식화한 것이다.
도 2는 본 발명의 일 실시예에 따른 DNA 메틸화 데이터 표준화 전(왼쪽), 후(오른쪽)의 간암 환자 분포를 나타낸 그래프이다.
도 3 은 본 발명의 일 실시예에 따른 간암 환자에서 과메틸화되고 정상인에서 저메틸화된 DMPs(Differentially methylated probes)의 히트맵이다.
도 4는 히트맵(Heatmap)을 통해 선별된 프로브에 대한 간암 샘플, 간 정상 샘플, 혈액 샘플에서의 메틸화 정도를 나타낸 히트맵이다. 붉은 색일수록 과메틸화를 나타낸다.
도5는 기계학습을 통해 선별한 본 발명의 일 실시예에 따른 진단 마커를 선별한 결과이다.
도6은 기계학습을 통해 선별한 본 발명의 일 실시예에 따른 진단 마커의 메틸화 정도를 간암 샘플, 간 정상 샘플, 혈액 샘플에서 확인한 히트맵이다.
도 7은 본 발명의 일 실시예에 따른 단일 프로브의 간암 진단 효율을 평가한 결과이다. 프로브 별 간암 진단 효율을 AUC로 표시하였다.
도 8은 Public DB인 TCGA (The Cancer Genome Atlas)의 간암 데이터에서 본 발명의 일 실시예에 따른 단일 프로브의 간암 진단 효율을 평가한 결과이다. 프로브 별 간암 진단 효율을 AUC로 표시하였다.
도 9는 본 발명의 일 실시예에 따른 프로브(15종)의 조합에 따른 진단 효율을 확인한 결과이다.
도 10은 파이로 시퀀싱을 통해 본 발명의 일 실시예에 따라 선발된 프로브의 메틸화 정도를 나타낸 히트맵이다. X축은 독립적 코호트 196명의 간암 및 이에 상응하는 간 정상 샘플 을 의미하고, Y축은 프로브(황색 박스) 및 프로브 부근의 CpG site를 의미한다.
도 11은 EpiTYPER 실험을 통해 본 발명의 일 실시예에 따라 선발된 프로브의 메틸화 정도를 나타낸 히트맵이다. X축은 독립적 코호트 184명의 간암 및 이에 상응하는 간 정상 샘플을 의미하고, Y축은 프로브(황색 박스) 및 프로브 부근의 CpG site를 의미한다.
도 2는 본 발명의 일 실시예에 따른 DNA 메틸화 데이터 표준화 전(왼쪽), 후(오른쪽)의 간암 환자 분포를 나타낸 그래프이다.
도 3 은 본 발명의 일 실시예에 따른 간암 환자에서 과메틸화되고 정상인에서 저메틸화된 DMPs(Differentially methylated probes)의 히트맵이다.
도 4는 히트맵(Heatmap)을 통해 선별된 프로브에 대한 간암 샘플, 간 정상 샘플, 혈액 샘플에서의 메틸화 정도를 나타낸 히트맵이다. 붉은 색일수록 과메틸화를 나타낸다.
도5는 기계학습을 통해 선별한 본 발명의 일 실시예에 따른 진단 마커를 선별한 결과이다.
도6은 기계학습을 통해 선별한 본 발명의 일 실시예에 따른 진단 마커의 메틸화 정도를 간암 샘플, 간 정상 샘플, 혈액 샘플에서 확인한 히트맵이다.
도 7은 본 발명의 일 실시예에 따른 단일 프로브의 간암 진단 효율을 평가한 결과이다. 프로브 별 간암 진단 효율을 AUC로 표시하였다.
도 8은 Public DB인 TCGA (The Cancer Genome Atlas)의 간암 데이터에서 본 발명의 일 실시예에 따른 단일 프로브의 간암 진단 효율을 평가한 결과이다. 프로브 별 간암 진단 효율을 AUC로 표시하였다.
도 9는 본 발명의 일 실시예에 따른 프로브(15종)의 조합에 따른 진단 효율을 확인한 결과이다.
도 10은 파이로 시퀀싱을 통해 본 발명의 일 실시예에 따라 선발된 프로브의 메틸화 정도를 나타낸 히트맵이다. X축은 독립적 코호트 196명의 간암 및 이에 상응하는 간 정상 샘플 을 의미하고, Y축은 프로브(황색 박스) 및 프로브 부근의 CpG site를 의미한다.
도 11은 EpiTYPER 실험을 통해 본 발명의 일 실시예에 따라 선발된 프로브의 메틸화 정도를 나타낸 히트맵이다. X축은 독립적 코호트 184명의 간암 및 이에 상응하는 간 정상 샘플을 의미하고, Y축은 프로브(황색 박스) 및 프로브 부근의 CpG site를 의미한다.
이하에서는 첨부한 도면을 참조하여 본 발명을 설명하기로 한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 따라서 여기에서 설명하는 실시예로 한정되는 것은 아니다.
어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 구비할 수 있다는 것을 의미한다.
달리 정의되지 않는 한, 분자 생물학, 미생물학, 단백질 정제, 단백질 공학, 및 DNA 서열 분석 및 당업자의 능력 범위 안에서 재조합 DNA 분야에서 흔히 사용되는 통상적인 기술에 의해 수행될 수 있다. 상기 기술들은 당업자에게 알려져 있고, 많은 표준화된 교재 및 참고서에 기술되어 있다.
본 명세서에 달리 정의되어 있지 않으면, 사용된 모든 기술 및 과학 용어는 당업계에 통상의 기술자가 통상적으로 이해하는 바와 같은 의미를 가진다.
본 명세서에 포함되는 용어를 포함하는 다양한 과학적 사전이 잘 알려져 있고, 당업계에서 이용가능하다. 본 명세서에 설명된 것과 유사 또는 등가인 임의의 방법 및 물질이 본원의 실행 또는 시험에 사용되는 것으로 발견되나, 몇몇 방법 및 물질이 설명되어 있다. 당업자가 사용하는 맥락에 따라, 다양하게 사용될 수 있기 때문에, 특정 방법학, 프로토콜 및 시약으로 본 발명이 제한되는 것은 아니다.
본 명세서에서 사용되는 바와 같이, 단수형은 문맥이 명확하게 달리 지시하지 않으면 복수의 대상을 포함한다. 또한, 달리 지시된 바가 없으면, 핵산은 각각 왼쪽에서 오른쪽, 5'에서 3' 방향으로 씌여지고, 아미노산 서열은 왼쪽에서 오른쪽, 아미노에서 카르복실 방향으로 씌여진다. 이하 본 발명을 더욱 상세히 설명한다.
본 발명의 일 측면에 따르면, 1종 이상 CpG 부위의 메틸화 수준을 측정하는 단계;를 포함하는 간암의 예후 또는 위험도를 평가하는 방법이 제공된다.
상기 대상체(subject)는 진단 대상으로서 인간일 수 있고, 상기 생물학적 시료는 간암 관련 질환의 위험성을 평가하고자 하는 상기 대상체에서 분리된 시료로써, 조직, 세포, 혈액, 혈장, 복막액, 활막액, 타액, 소변, 대변 등을 포함하나 이에 제한되는 것은 아니다. 바람직하게 상기 생물학적 시료는 혈액일 수 있으며, 구체적으로 혈액에서 분리된 혈장일 수 있다.
또한, 상기 CpG 부위의 메틸화 수준을 개별적으로 분석하여 간암의 예후 또는 위험성 여부를 진단할 수 있으나, 바람직하게는 2종 이상, 3종 이상, 또는 4종 이상의 CpG 부위를 동시에 분석함으로써 진단의 정확성을 향상시킬 수 있다.
상기 진단은 특정 질병 또는 질환에 대한 대상체의 감수성(susceptibility)을 판정하는 것으로, 바람직하게는 대상체가 간암을 현재 가지고 있는지 여부를 판정하는 것, 간암에 걸린 대상체의 예후(prognosis)를 판정하는 것 또는 테라메트릭스(therametrics)를 포함할 수 있다.
상기 "메틸화"는 DNA를 구성하는 염기에 메틸기가 부착되는 것을 뜻한다. 바람직하게 메틸화 여부는 특정 유전자의 특정 CpG 부위의 시토신에서 일어나는 메틸화 여부를 의미한다.
상기 "메틸화 상태"는 DNA 염기서열 내에서의 하나 이상의 CpG 디뉴클레오타이드의 5-메틸-시토신의 존재 또는 비존재를 의미한다. 상기 "메틸화 수준"은 예를 들면 모든 게놈 영역 및 일부 비-게놈 영역 내의 표적 DNA 메틸화 유전자의 DNA 염기서열에 존재하는 메틸화의 양을 의미한다.
상기 메틸화 수준은 PCR, 메틸화 특이 PCR(methylation specific PCR), 실시간 메틸화 특이 PCR(real time methylation specific PCR), MethyLight PCR, MehtyLight digital PCR, EpiTYPER, 메틸화 DNA 특이적 결합 단백질을 이용한 PCR, 정량 PCR, DNA 칩, 파이로시퀀싱 및 바이설파이트 시퀀싱으로 이루어진 군에서 선택되는 1종의 방법으로 수행될 수 있으나, 이에 제한되는 것은 아니다.
상기 메틸화 정도는 마이크로어레이에 의해 식별될 수 있다. 상기 마이크로어레이는 고상표면에 고정화된 프로브를 이용할 수 있다. 상기 프로브는 상기 SNP를 포함하는 각 유전자상의 10 내지 100개의 연속 뉴클레오타이드 서열에 상보적인 서열을 포함할 수 있다.
상기 CpG 부위는 상기 유전자의 DNA 상에 존재하는 CpG 부위를 뜻한다. 상기 유전자의 DNA는 발현하는데 필요하며 서로 작동가능하게 연결되어 있는 일련의 구성 단위를 모두 포함하는 개념으로, 예컨대, 프로모터 영역, 단백질 코딩 영역(open reading frame, ORF) 및 터미네이터 영역을 포함한다.
따라서, 상기 유전자의 CpG 부위는 해당 유전자의 프로모터 영역, 단백질 코딩 영역(open reading frame, ORF) 또는 터미네이터 영역 등에 존재할 수 있다. 바람직한 예로는 상기 유전자의 프로모터 영역에 존재하는 CpG 부위일 수 있다.
상기 CpG 부위는 염색체 #2의 25438725 내지 25439276번째 서열, 염색체 #12의 95941906 내지 95942979번째 서열, 염색체 #10의 134597357 내지 134602649번째 서열, 염색체 #8의 144649774 내지 144651774번째 서열, 염색체 #1의 47998899 내지 47999517번째 서열, 염색체 #2의 26394102 내지 26396102번째 서열 염색체 #8의 104510870 내지 104513913번째 서열, 염색체 #8의 98289604 내지 98290404번째 서열, 염색체 #2의 63281034 내지 63281347번째 서열 염색체 #8의 67873388 내지 67875600번째 서열, 염색체 #4의 76555366 내지 76556079번째 서열, 염색체 #1의 63782394 내지 63790471번째 서열, 염색체 #5의 7849945 내지 7850439번째 서열, 염색체 #2의 39186777 내지 39187968번째 서열, 염색체 #14의 74207665 내지 74208665번째 서열로 이루어진 군에서 선택되는 1종 이상의 염기서열 내에 존재할 수 있다.
상기 염색체 #2의 25438725 내지 25439276번째 서열은 서열번호 1의 염기서열을 가지고, 상기 염색체 #12의 95941906 내지 95942979번째 서열은 서열번호 2의 염기서열을 가지고, 상기 염색체 #10의 134597357 내지 134602649번째 서열은 서열번호 3의 염기서열을 가지고, 상기 염색체 #8의 144649774 내지 144651774번째 서열은 서열번호 4의 염기서열을 가지고, 상기 염색체 #1의 47998899 내지 47999517번째 서열은 서열번호 5의 염기서열을 가지고, 상기 염색체 #2의 26394102 내지 26396102번째 서열은 서열번호 6의 염기서열을 가지고, 상기 염색체 #8의 104510870 내지 104513913번째 서열은 서열번호 7의 염기서열을 가지고, 상기 염색체 #8의 98289604 내지 98290404번째 서열은 서열번호 8의 염기서열을 가지고, 상기 염색체 #2의 63281034 내지 63281347번째 서열은 서열번호 9의 염기서열을 가지고, 상기 염색체 #8의 67873388 내지 67875600번째 서열은 서열번호 10의 염기서열을 가지고, 상기 염색체 #4의 76555366 내지 76556079번째 서열은 서열번호 11의 염기서열을 가지고, 상기 염색체 #1의 63782394 내지 63790471번째 서열은 서열번호 12의 염기서열을 가지고, 상기 염색체 #5의 7849945 내지 7850439번째 서열은 서열번호 13의 염기서열을 가지고, 상기 염색체 #2의 39186777 내지 39187968번째 서열은 서열번호 14의 염기서열을 가지고, 상기 염색체 #14의 74207665 내지 74208665번째 서열은 서열번호 15의 염기서열을 가질 수 있다.
상기 염색체 #2의 25438725 내지 25439276번째 서열의 CpG 부위는 염색체 #2의 25439110번째에 위치하고, 상기 염색체 #12의 95941906 내지 95942979번째 서열의 CpG 부위는 염색체 #12의 95941988번째에 위치하고, 상기 염색체 #10의 134597357 내지 134602649번째 서열의 CpG 부위는 염색체 #10의 134599823번째에 위치하고, 상기 염색체 #8의 144649774 내지 144651774번째 서열의 CpG 부위는 염색체 #8의 144651002번째에 위치하고, 상기 염색체 #1의 47998899 내지 47999517번째 서열의 CpG 부위는 염색체 #1의 47999163번째에 위치하고, 상기 염색체 #2의 26394102 내지 26396102번째 서열의 CpG 부위는 염색체 #2의 26395458번째에 위치하고, 상기 염색체 #8의 104510870 내지 104513913번째 서열의 CpG 부위는 염색체 #8의 104512877번째에 위치하고, 상기 염색체 #8의 98289604 내지 98290404번째 서열의 CpG 부위는 염색체 #8의 98290148번째에 위치하고, 상기 염색체 #2의 63281034 내지 63281347번째 서열의 CpG 부위는 염색체 #2의 63281139번째에 위치하고, 상기 염색체 #8의 67873388 내지 67875600번째 서열의 CpG 부위는 염색체 #8의 67874178번째에 위치하고, 상기 염색체 #4의 76555366 내지 76556079번째 서열의 CpG 부위는 염색체 #4의 76555832번째에 위치하고, 상기 염색체 #1의 63782394 내지 63790471번째 서열의 CpG 부위는 염색체 #1의 63789278번째에 위치하고, 상기 염색체 #5의 7849945 내지 7850439번째 서열의 CpG 부위는 염색체 #5의 7850070번째에 위치하고, 상기 염색체 #2의 39186777 내지 39187968번째 서열의 CpG 부위는 염색체 #2의 39187533번째에 위치하고, 상기 염색체 #14의 74207665 내지 74208665번째 서열의 CpG 부위는 염색체 #14의 74208165번째에 위치할 수 있다.
본 발명의 다른 측면에 따르면, 염색체 #2의 25438725 내지 25439276번째 서열, 염색체 #12의 95941906 내지 95942979번째 서열, 염색체 #10의 134597357 내지 134602649번째 서열, 염색체 #8의 144649774 내지 144651774번째 서열, 염색체 #1의 47998899 내지 47999517번째 서열, 염색체 #2의 26394102 내지 26396102번째 서열 염색체 #8의 104510870 내지 104513913번째 서열, 염색체 #8의 98289604 내지 98290404번째 서열, 염색체 #2의 63281034 내지 63281347번째 서열, 염색체 #8의 67873388 내지 67875600번째 서열, 염색체 #4의 76555366 내지 76556079번째 서열, 염색체 #1의 63782394 내지 63790471번째 서열, 염색체 #5의 7849945 내지 7850439번째 서열, 염색체 #2의 39186777 내지 39187968번째 서열, 및 염색체 #14의 74207665 내지 74208665번째 서열로 이루어진 군에서 선택되는 CpG 부위에 결합하는 프로브를 포함하는 간암 발병 위험도 진단용 키트가 제공된다.
상기 프로브는 혼성화 어레이 요소(hybridizable array element)로서 이용될 수 있고 기체(substrate) 상에 고정화될 수 있다.
상기 기체는 적합한 견고성 또는 반-견고성 지지체로서, 예컨대, 막, 필터, 칩, 슬라이드, 웨이퍼, 파이버, 자기성 비드 또는 비자기성 비드, 겔, 튜빙, 플레이트, 고분자, 미소입자 및 모세관을 포함할 수 있다. 상기 혼성화 어레이 요소는 상기의 기체 상에 배열되고 고정화될 수 있다.
상기 고정화는 화학적 결합 방법 또는 UV와 같은 공유 결합적 방법에 의해 실시될 수 있다. 예컨대, 상기 혼성화 어레이 요소는 에폭시 화합물 또는 알데히드기를 포함하도록 변형된 글래스 표면에 결합될 수 있고, 폴리라이신 코팅 표면에서 UV에 의해 결합될 수도 있다. 또한, 상기 혼성화 어레이 요소는 링커(예: 에틸렌 글리콜 올리고머 및 디아민)를 통해 기체에 결합될 수 있다.
상기 마이크로어레이에 적용되는 시료 DNA는 표지(labeling)될 수 있고, 마이크로어레이상의 어레이 요소와 혼성화될 수 있다. 혼성화 조건은 다양하게 변경할 수 있고, 혼성화 정도의 검출 및 분석은 표지 물질에 따라 다양하게 실시될 수도 있다.
상기 프로브의 표지는 혼성화 여부를 검출케 하는 시그널을 제공할 수 있으며, 올리고뉴클레오타이드에 연결될 수 있다.
상기 표지는 형광단(예컨대, 플루오리신(fluorescein), 피코에리트린(phycoerythrin), 로다민, 리사민(lissamine), 그리고 Cy3와 Cy5(Pharmacia)), 발색단, 화학발광단, 자기입자, 방사능동위원소(P32 및 S35), 매스 표지, 전자밀집입자, 효소(알칼린 포스파타아제 또는 호스래디쉬 퍼옥시다아제), 조인자, 효소에 대한 기질, 중금속(예컨대, 금) 그리고 항체, 스트렙타비딘, 바이오틴, 디곡시게닌과 킬레이팅기와 같은 특정 결합 파트너를 갖는 햅텐을 포함할 수 있으나, 이에 한정되는 것은 아니다.
상기 표지는 당업계에서 통상적으로 실시되는 다양한 방법, 예컨대, 닉 트랜스레이션(nick translation) 방법, 무작위 프라이밍 방법(Multiprime DNA labelling systems booklet, "Amersham"(1989)) 및 카이네이션 방법(Maxam & Gilbert, Methodsin Enzymology, 65:499(1986))에 의해 라벨링될 수 있다.
상기 표지는 형광, 방사능, 발색 측정, 중량 측정, X-선 회절 또는 흡수, 자기, 효소적 활성, 매스 분석, 결합 친화도, 혼성화 고주파, 나노크리스탈에 의하여 검출할 수 있는 시그널을 제공할 수 있다.
상기 분석 대상이 되는 핵산 시료는 다양한 생시료(biosamples)에서 얻은 mRNA를 이용하여 제조할 수 있다. 상기 프로브 대신에 분석 대상이 되는 cDNA를 표지하여 혼성화 반응-기초 분석을 실시할 수도 있다.
상기 프로브를 이용하는 경우, 프로브를 cDNA 분자와 혼성화시킬 수 있다. 상기 적절한 혼성화 조건은 최적화 절차에 의하여 일련의 과정으로 결정될 수 있다. 상기 절차는 연구실에서의 사용을 위한 프로토콜을 수립하고자 당업자에 의하여 일련의 과정으로 실시될 수 있다.
예컨대, 온도, 성분의 농도, 혼성화 및 세척 시간, 완충액 성분 및 이들의 pH 및 이온세기 등의 조건은 프로브의 길이 및 GC 양 및 타깃 뉴클레오타이드 서열 등의 다양한 인자에 의존한다. 상기 혼성화를 위한 상세한 조건은 Joseph Sambrook, et al., MolecularCloning, A LaboratoryManual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001); 및 M.L.M. Anderson, NucleicAcid Hybridization, Springer-Verlag New York Inc. N.Y.(1999)을 참조할 수 있다.
예컨대, 상기 엄격조건 중에서 고 엄격조건은 0.5 M NaHPO4, 7% SDS(sodium dodecyl sulfate), 1 mM EDTA에서 65℃ 조건으로 혼성화하고, 0.1 x SSC(standard saline citrate)/0.1% SDS에서 68℃ 조건으로 세척하는 것을 의미할 수 있다. 또는 상기 고 엄격조건은 6 x SSC/0.05% 소듐 파이로포스페이트에서 48℃ 조건으로 세척하는 것을 의미할 수 있고, 저 엄격조건은 0.2 x SSC/0.1% SDS에서 42℃ 조건으로 세척하는 것을 의미할 수 있다.
상기 혼성화 반응 이후에, 혼성화 반응을 통하여 나오는 혼성화 시그널을 검출할 수 있다. 예컨대, 상기 프로브가 효소에 의해 표지된 경우, 상기 효소의 기질을 혼성화 반응 결과물과 반응시켜 혼성화 여부를 확인할 수 있다.
상기 효소 및 기질은 퍼옥시다아제(예컨대, 호스래디쉬 퍼옥시다아제)와 클로로나프톨, 아미노에틸카바졸, 디아미노벤지딘, D-루시페린, 루시게닌(비스-N-메틸아크리디늄 니트레이트), 레소루핀 벤질 에테르, 루미놀, 암플렉스 레드 시약(10-아세틸-3,7-디하이드록시페녹사진), HYR(p-phenylenediamine-HCl 및 pyrocatechol), TMB(tetramethylbenzidine), ABTS(2,2'-Azine-di[3-ethylbenzthiazoline sulfonate]), o-페닐렌디아민(OPD) 및 나프톨/파이로닌; 알칼린 포스파타아제와 브로모클로로인돌일 포스페이트(BCIP), 니트로 블루 테트라졸리움(NBT), 나프톨-AS-B1-포스페이트(naphthol-AS-B1-phosphate) 및 ECF 기질; 글루코오스 옥시다아제와 t-NBT(nitroblue tetrazolium) 및 m-PMS(phenzaine methosulfate)가 사용될 수 있다.
상기 프로브가 금 입자로 표지된 경우에는 실버 나이트레이트를 이용하여 실버 염색 방법으로 검출할 수도 있다.
상기 간암의 예후 또는 위험도를 평가하는 방법은 다양한 통계처리 방법을 통해 간암 진단 가능성을 평가할 수 있다. 통계적 처리 방법으로 일 구현예에서 머신 러닝(Machine learning) 방법이 사용되며, Maxwell W. Libbrecht, 2015, Nature Reviews Genetics 16: 321-332를 참조할 수 있다.
상기 머신 러닝은 인공지능의 한 분야로 패턴인식과 컴퓨터학습 이론의 연구로부터 진화한 분야이다. 머신 러닝은 경험적 데이터를 기반으로 학습을 하고 예측을 수행하고 스스로의 성능을 향상시키는 시스템과 이를 위한 알고리즘을 연구하고 구축하는 기술이다. 머신 러닝의 알고리즘은 엄격하게 정해진 정적인 프로그램 명령들을 수행하는 것이라기 보다, 입력 데이터를 기반으로 예측이나 결정을 이끌어내기 위해 특정한 모델을 구축하는 방식이다.
이하, 실시예를 통해 본 발명을 더욱 상세히 기술한다.
실시예
1. 간암 발병과 관련된
DMP
선정
샘플
간암 발병과 관련된 DNA 메틸화 지역을 선별하기 위해 서울대병원의 간암환자 184명으로부터 간암 샘플을 얻었다. 간암조직과 상응하는 정상조직은 정상 대조군으로 사용하였다.
컬럼 기반의 DNA 추출 방법( PureLink™Genomic DNA Mini Kit, Invitrogen)과 비드(Bead) 방식의 DNA 추출 방법 (MagListo™5M Genomic DNA Extraction Kit, Bioneer)을 이용하여 각각의 샘플에서 genomic DNA를 추출하였다. 추출된 genomic DNA는 nanodrop를 이용하여 정량하였으며, DNA 상태는 1.5% agarose gel에서 전기영동하여 degradation여부를 확인하였다.
바이설파이트(Bisulfite) 처리
Genomic DNA 에 바이설파이트(Bisulfite)를 처리하면 DNA 염기서열 중 5'-CpG-3' 부위의 사이토신이 메틸화된 경우에는 그대로 유지되지만, 비메틸화된 경우에는 우라실로 바뀌어서 메틸화 정도를 측정할 수 있다.
따라서, 메틸화된 시토신과 비메틸화된 시토신을 구별하기 위하여 genomic DNA를 바이설파이트로 처리하였다. 700ng 의 genomic DNA를 EZ DNA Methylation Kit (Zymoresearch Inc.)을 이용하여 제조사의 매뉴얼에 따라 처리하였고, 이렇게 만들어진 바이설파이트 처리된 DNA를 M-Elution Buffer 로 녹여서 사용시까지 -80℃ 에서 보관하였다.
바이설파이트 처리된 DNA는 1달 이내에 사용하였다.
DNA 메틸화 마이크로어레이
Infinium( Human Methylation 850K BeadChip을 사용하여, DNA 메틸레이션 마이크로어레이를 수행하였다.
Illumina Infinium MethylationEPIC BeadChip kits (Illumina, Inc., San Diego, CA)을 이용하여 제조사의 매뉴얼을 따라, 바이설파이트 처리된 DNA를 증폭하고, 절단(fragmentation), 침전(precipitation) 및 재현탁(resuspension)한 후 BeadChip에 혼성화(hybridization)하였다.
세척 후, BeadChip을 Illumina iScan scanner을 이용하여 스캔하였다.
R 패키지 중, minfi 패키지를 이용하여 패키지의 매뉴얼에 따라 데이터의 품질 관리 (quality control)을 진행했다. 품질 관리 기준을 통과한 샘플들에 한하여 메틸화 정도가 색으로 표시된raw data의 idat 파일을 수치화한 값인β 값을 계산하였다.
DNA 메틸화 정도는 0~1 값을 갖는 β값으로 표시되며 β값 0은 해당 CpG 부위가 완전히 비메틸화 된 것을 의미하며, 1은 완전히 메틸화된 것을 의미한다. 산출된 결과를 표준화 하고 보정하였다. 모든 통계는 R 통계환경(v.3.3.2 이상)에서 수행되었다(도 1).
실시예 2. 진단 마커 후보군 선정
도 1을 참조하면, 182명의 간암 및 이에 상응하는 간 정상 샘플에서 DNA 추출하여 Infinium Methylation EPIC BeadChip을 진행하였다.
자체적으로 구축한 파이프라인으로 메틸화 데이터(methylation data)를 분석하였다. 정상에서 메틸화가 낮고, tumor에서 메틸화 수준이 높은 프로브(probe)를 선정하였다.
먼저 정상과 암 샘플의 메틸화 차이를 보이는 DMP를 선정하였다.
정상 샘플에서 메틸화 수준이 매우 낮고, 70% 이상의 암 환자에서 메틸화가 50% 이상으로 매우 높은 7개의 프로브를 선별하고, 기계학습 방법으로 효율을 검증하였다(도 1, 남색).
정상 샘플에서는 methylation 이 10%이하로 매우 낮고, 간암 환자에서 평균적으로 30% 이상으로 높은 프로브를 선별하고, 기계학습을 진행하여 간암/간정상 샘플을 효과적으로 구분하는 상위 9개의 프로브를 선별하였다(도 1, 갈색).
최종적으로 선별된 15개(1개 중복)의 간암 진단 마커 후보군을 다양한 실험을 통해 검증하였다.
실시예
3.
Heatmap을
통한
프로브
선별
182 간암 샘플 및 127 정상 샘플의 DNA 메틸화를 조사한 결과, 5% 이상의 간암 샘플에서 30% 이상 과메틸화된 100,053 DMP(differentially methylated probes)를 선별하였다.
정상/암 샘플간의 차이를 보이는 DMP중에서 혈액 생검이 가능하도록 정상 샘플에서 methylation이 10%이하로 매우 낮은 13,078 probes를 선별하였다.
선별된 프로브 중에서 70% 이상의 암환자에서 50% 이상 과메틸화된 7개의 프로브를 선별하였다(표 2).
구분 | 프로브 ID | 50% 이상 과메틸화된 간암 비율( % ) |
프로브 1 | cg20172627 | 78.16 |
프로브 2 | cg22538054 | 77.59 |
프로브 3 | cg27583690 | 74.14 |
프로브 4 | cg19951303 | 72.99 |
프로브 5 | cg22524657 | 71.84 |
프로브 6 | cg24563094 | 70.11 |
프로브 7 | cg25744484 | 70.11 |
선발된 7개의 프로브의 간암 환자별 메틸화 값을 확인한 히트맵을 작성하였다(도 3).
실시예
4. 기계학습을 통한
프로브
선별
정상/암 샘플간의 차이를 보이는 DMP중 정상 샘플에서 메틸화 수준이 매우 낮고, 간암 환자에서 평균적으로 30% 이상 높은 프로브를 선별하였다.
상기 프로브를 이용해 기계학습을 진행하여 간암/ 간정상 샘플을 효과적으로 구분하는 상위 9개의 프로브를 선별하였다.
도 4를 참조하면, 청색원은 하나의 프로브를 의미하며 중요도가 높은 순(x, y축)으로 상위 9개의 프로브를 선별하였다.
X축은 기계학습으로 구축된 모델에서 각 프로브의 정확도를 의미하고, Y축은 기계학습으로 구축된 모델에서 각 프로브의 순수도를 의미한다.
기계학습으로 선별된 9개의 프로브의 메틸화 정도를 200명의 whole blood, 125명의 정상 샘플, 180명의 간 암 샘플에서 메틸화 값을 확인한 히트맵을 작성하였다(도 5).
실시예 4 및 5의 방법을 통해 최종적으로 선별된 15개의 프로브 정보는 하기 표 2와 같다.
서열번호 | 프로브 ID | 선별방법 | CpG 위치 |
CGI
region |
||
염색체 | start | end | ||||
1 | cg20172627 | heatmap | chr2 | 25438725 | 25439276 | Island |
2 | cg22538054 | heatmap | chr12 | 95941906 | 95942979 | Island |
3 | cg27583690 | heatmap | chr10 | 134597357 | 134602649 | Island |
4 | cg19951303 | heatmap | chr8 | 144649774 | 144651774 | N_Shelf |
5 | cg22524657 | heatmap | chr1 | 47998899 | 47999517 | Island |
6 | cg24563094 | heatmap | chr2 | 26394102 | 26396102 | N_Shore |
7 | cg25744484 | heatmap | chr8 | 104510870 | 104513913 | Island |
8 | cg18233405 | 기계학습 | chr8 | 98289604 | 98290404 | Island |
9 | cg25622366 | 기계학습 | chr2 | 63281034 | 63281347 | Island |
10 | cg20980783 | 기계학습 | chr8 | 67873388 | 67875600 | Island |
1 | cg20172627 | 기계학습 | chr2 | 25438725 | 25439276 | Island |
11 | cg03757145 | 기계학습 | chr4 | 76555366 | 76556079 | Island |
12 | cg08112534 | 기계학습 | chr1 | 63782394 | 63790471 | Island |
13 | cg25214789 | 기계학습 | chr5 | 7849945 | 7850439 | Island |
14 | cg11176990 | 기계학습 | chr2 | 39186777 | 39187968 | Island |
15 | cg27640070 | 기계학습 | chr14 | 74207665 | 74208665 | - |
실시예
6. 단일
프로브
간암 진단 효율 평가
선별된 15개의 프로브의 간암 진단 효율을 평가하였다(도 6). 도 6은 프로브 별 간암 진단 효율을 AUC로 표시한 결과이다.
15개의 프로브를 단독으로 사용해서 간암 진단 효율(AUC; area under the curve)을 확인한 결과는 하기 표 3과 같다.
서열번호 | 프로브 ID | 선별 방법 | Acuu . | Sen. | Spe . | AUC |
1 | cg20172627 | heatmap | 0.908 | 0.922 | 0.887 | 0.957 |
2 | cg22538054 | heatmap | 0.888 | 0.878 | 0.903 | 0.947 |
3 | cg27583690 | heatmap | 0.863 | 0.856 | 0.873 | 0.938 |
4 | cg19951303 | heatmap | 0.837 | 0.889 | 0.762 | 0.914 |
5 | cg22524657 | heatmap | 0.811 | 0.822 | 0.794 | 0.906 |
6 | cg24563094 | heatmap | 0.889 | 0.922 | 0.841 | 0.953 |
7 | cg25744484 | heatmap | 0.882 | 0.889 | 0.871 | 0.949 |
8 | cg18233405 | 기계학습 | 0.948 | 0.944 | 0.952 | 0.960 |
9 | cg25622366 | 기계학습 | 0.908 | 0.889 | 0.936 | 0.936 |
10 | cg20980783 | 기계학습 | 0.888 | 0.878 | 0.903 | 0.954 |
11 | cg03757145 | 기계학습 | 0.909 | 0.922 | 0.889 | 0.960 |
12 | cg08112534 | 기계학습 | 0.855 | 0.889 | 0.807 | 0.936 |
13 | cg25214789 | 기계학습 | 0.863 | 0.889 | 0.825 | 0.912 |
14 | cg11176990 | 기계학습 | 0.882 | 0.922 | 0.823 | 0.961 |
15 | cg27640070 | 기계학습 | 0.895 | 0.900 | 0.889 | 0.939 |
또한, Public DB에서 단일 프로브의 간암 진단 효율을 검증하였다(도 7). 도 7은 프로브 별 간암 진단 효율을 AUC로 표시한 결과이다.
TCGA LIHC methylation data(450K)를 이용해서 단일 프로브의 효율을 검증한 결과는 하기 표 4와 같다.
회색으로 표시된 영역은 Infinium Methylation 450K BeadChip에는 없고 Infinium Methylation EPIC BeadChip(850K)에만 있는 프로브를 의미한다.
서열번호. | 프로브 ID | 선별 방법 | Acuu . | Sen. | Spe . | AUC |
1 | cg20172627 | heatmap | 0.916 | 0.918 | 0.900 | 0.957 |
2 | cg22538054 | heatmap | 0.797 | 0.786 | 0.880 | 0.897 |
3 | cg27583690 | heatmap | 0.764 | 0.754 | 0.840 | 0.855 |
4 | cg19951303 | heatmap | - | - | - | - |
5 | cg22524657 | heatmap | 0.816 | 0.815 | 0.820 | 0.902 |
6 | cg24563094 | heatmap | 0.870 | 0.876 | 0.820 | 0.919 |
7 | cg25744484 | heatmap | - | - | - | - |
8 | cg18233405 | 기계학습 | 0.893 | 0.902 | 0.820 | 0.919 |
9 | cg25622366 | 기계학습 | 0.888 | 0.879 | 0.960 | 0.967 |
10 | cg20980783 | 기계학습 | 0.897 | 0.897 | 0.900 | 0.935 |
11 | cg03757145 | 기계학습 | 0.890 | 0.879 | 0.980 | 0.939 |
12 | cg08112534 | 기계학습 | - | - | - | - |
13 | cg25214789 | 기계학습 | 0.881 | 0.887 | 0.840 | 0.916 |
14 | cg11176990 | 기계학습 | 0.846 | 0.852 | 0.800 | 0.933 |
15 | cg27640070 | 기계학습 | - | - | - | - |
또한, 15개 패널 프로브의 간암 진단 효율을 분석하고자, 15개의 프로브를 통합하여 간암 진단 효율(AUC; area under the curve)을 확인하였다(도 8). 도 8은 15개 프로브로 기계학습을 진행하여 나온 훈련데이터 및 검증데이터의 confusion matrix 결과이다(2차 교차 검증).
데이터의 편향을 방지하기 위해 무작위로 2개로 나눠주는 2차 교차검증 방법을 10번씩 진행해 테스트 세트(Testing set)와 트레이닝 세트(Training set)로 분류하였다.
트레이닝 세트로 분류된 데이터를 기반으로 정상과 간암의 패턴을 학습하고, 그에 따른 간암 특이적 진단 모델을 구축하였다.
하기 표 5는 트레이닝 세트의 오차행렬이다.
입력 값 | 정상 판정 | 간암 판정 | 오차율 |
정상 | 62 | 1 | 0.159 |
간암 | 3 | 87 | 0.333 |
상기 트레이닝 세트로 구축된 간암 특이적 진단 모델을 기반으로 테스트 세트을 진단하여 간암 진단 효율을 확인하였다(표 6).
샘플 | 정상 판정 | 간암 판정 |
정상 | 61 | 0 |
간암 | 1 | 90 |
표 5 및 6을 참조하면, 머신 러닝을 기반으로 선발된 15개의 프로브로 간암 특이적 진단 모델을 구축할 수 있었으며, 진단 효율은 매우 높은 수준으로 평가되었다.
실시예 7. 복수의 프로브를 이용한 간암 진단 효율 평가
상기 간암 특이적 진단 모델을 기반으로 15개의 프로브 중에서 최대효율을 가지는 최소 프로브 개수를 찾기 위해 프로브의 개수 별 효율을 측정하였다(도 9).
도 9는 가능한 프로브 조합에 대해서 기계학습을 진행하여 산출된 결과이다(2차 교차 검증). X축은 프로브 개수를 의미하고, Y축은 AUC(진단 효율)을 의미한다.
도 9를 참조하면, 프로브 개수가 3개 이상일 때 진단 효율이 99% 이상으로 수렴하므로, 매우 정확한 진단 정보를 제공할 수 있다.
따라서, 단일의 프로브를 이용할 때와 비교하여 복수의 프로브를 이용할 때 진단의 정확도가 현저히 개선될 수 있다.
실시예 8. 파이로시퀀싱을 통한 프로브를 포함하는 CpG 섬의 메틸화 분석
선별된 프로브 중 프로브가 결합되는 CpG 부위의 메틸화 정도를 측정하기 위해 파이로시퀀싱을 실시하였다.
파이로시퀀싱은 뉴클레오티드 첨가에서 방출된 파이로포스페이트(PPi)를 이용한다. PPi는 ATP 설퍼릴라아제에 의해 아데노신 5' 포스포설페이트의 존재 하에서 ATP로 변환된다.
루시퍼라아제는 ATP를 사용하여 루시페린을 옥시루시페린으로 변환하고, 이 반응은 탐지되고 분석될 수 있는 빛을 생성한다.
선발된 프로브의 CpG 부위의 메틸화 정도를 히트맵으로 나타내었다(도 10).
확인결과, normal에서 메틸화 수준이 낮고 tumor에서는 메틸화 수준이 높은 것으로 나타났으며, 선별된 프로브의 CpG 부위와 그 주변의 메틸화 정도가 유사한 것으로 확인되었다.
실시예 9. EpiTYPER을 통한 프로브를 포함하는 CpG 섬의 메틸화 분석
데이터의 검증을 위해, 프로브들 중에서 상위 3개의 프로브의 메틸화 상태를 EpiTYPERTM assay(Sequenom, San Diego, CA)를 이용하여 정량적으로 분석하였다.
PCR 증폭 이후 시험관 내에서 전사시킨 증폭조각(amplicons)들을 shrimp alkaline phosphatase로 처리하고, RNaseA로 절단한 후, 메틸화 상태를 결정하기 위해 MALDI-TOF Mass Spectrometry에 넣어 주었다.
결과는 EpiTYPERTM ver. 1.0 software을 이용해 분석하였다.
선발된 3개의 프로브에 대해서 EpiTYPER로 validation을 진행하였다. 선발된 프로브와 그 주변의 CpG 부위의 메틸화 정도는 히트맵으로 확인하였다(도 11).
도 11을 참조하면, normal에서 메틸화 수준이 낮고 tumor에서는 메틸화 수준이 높은 것으로 나타났으며, 선별된 프로브의 CpG 부위와 그 주변의 메틸화 정도가 유사한 것으로 확인되었다.
따라서 CpG 프로브를 포함하는 CpG 섬 전체의 메틸화 수준도 암 예후 및 위험도 진단에 동일하게 사용될 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 후술하는 청구범위에 의하여 나타내어지며, 청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
<110> Yonsei University
<120> A METHOD FOR ASSESSING RISK OF HEPATOCELLULAR CARCINOMA USING CPG
METHYLATION STATUS OF GENOME
<130> DP-2017-1051
<150> KR 10-2017-0156527
<151> 2017-11-22
<160> 44
<170> KoPatentIn 3.0
<210> 1
<211> 552
<212> DNA
<213> Homo sapiens
<400> 1
tcgccctctg gctcggcacg gaggggggcg ctcagccttt ctggggcaaa tttagtaata 60
tgggacccga gccctcgacc cgaaatacgc ccgaggcatt tatcctaaaa aacgacaagg 120
tccgggcgcc cagcagaacg gcccggctcg accgcgcgca gcttgcaggc aggggggtgt 180
gcaggtcacc gcgccacccc ggcgagcaga gccgcggagg gcgccacgtc ggtgcgctgg 240
ccccgcccga gcggggcggg accttcctgt acccccggaa gcccccgcgg gcagctgggg 300
aggaaaccgc ggccacgcgc tcggggggcc cggctcggga agggcagtgc gcgcgcatgc 360
gttggggcgg ggcgcctggg acctgcgggc cccaggccca gcgcgccgcc agccggagtg 420
cccggcgccc gtcgaaaggc ccctgcgccg gttcaggacc cgcacccagc tacgctgcgg 480
agccccagct cgcagcaccc tcccacccac cgctcctggc tgcttttctc ctgagtctgc 540
ggggcggggt cg 552
<210> 2
<211> 1074
<212> DNA
<213> Homo sapiens
<400> 2
gcggcagcag gtgccggcag cgcggggacc gatcgatgga gagaaggcgg gcaagacgcc 60
gggaagcgca ttcctcctca accgagtgcc acaaccgccc tcccgaagtg ccccggggct 120
tcgagcatca cctcgcggta atccgggagg gtggagggat gcggctggac ccgggcgttg 180
cgtgctccac acagcgccca gcccgtgcca gccccgcgcc cacctctcca cgacgctcgt 240
gccgggatca gcgcgaagcc ccttccagtc cccgaagccc tcgcccgcgc ccgttctccc 300
ccagctcgcc ccctccagcc cgctgcgcct tgccgcagca tctccgggca ctctgaggct 360
gccgccggga cagggtcgga gcgccgcaga acccaccgaa acttcccagg ggggcaattc 420
aaaattcgcc ggacgcgtcg ccgccgcgcg cccctcggct cattcccttc cgcgcgcccg 480
cagccccagg ctctccctct ctcaggaccc cccagcgccc tgcgcggcga gaataggccc 540
ccaggtgcct cccggccccg ggggctgccg tcgcacgtcc gctcccgcag gggtcctcac 600
tccgccaatc gccgcggccg cgcgccctcg cgcacactca ccagcccgag ccggggcggc 660
catcttagcg ctcaccccgg ccccccgccc cccggttcgg cggccgcgac gacccggtgc 720
ggcggctacg acagccgtga cgcgcagcag gccccgcccc ctcccacagc cccacccctg 780
cgccggctct tcgcgggcac cgagaacctg ccggtggccg ccttccgcgc ctcgtggggg 840
ggtcggggcc acggacggtc cccggcgccg caagtgggtc tgcgcgaaca acaagcactg 900
cctccccggg cgggcttcgc acctgtagtg ccgtcgggac acgggagggt aaacccagcg 960
tgtcctgtgt gcctgtgagc cgcagaatca tccacggacg tcgttagtcc ttcctggaat 1020
ttctgcgatt tacacaacgt cgaattgttt ggcagaaacg cgtggcaaac tccg 1074
<210> 3
<211> 5293
<212> DNA
<213> Homo sapiens
<400> 3
acgcgccgag tttaagccct ttctatttcc ctttaacgct tccgcaaatg ccaagagaaa 60
tcgtaccacc gcagtgatat cattatttac atttaatttt taaaaattaa aactcaacag 120
ccacgcccat taagatgcag cgatgggcag ccccggccac agaggctgcg ggaggctgga 180
ggggttttgt cagccgcagt cacagccccg cggagctggc ggcatttcag ggcaggagac 240
gggtcccccg agcccccggc tgggcgctgc gggccttgcc cagggggcct ccggctccct 300
gaccccgcgt gacccacggg aggccccgcc gctccgcggg cggaattatt tcggatttct 360
ctttgcggtc ctagttcgga agaaactgct ttccaccgcg ggaagatctg gcgggatggt 420
gaccgaaggg cctccgtgca gcggatcaga cccggttcca ccggctgagc ccagggcggg 480
cctatgggat ccgctgatgc gcagagggac tttggaaata atcagagcga agccctcggc 540
caagcgggaa cgggtgcccg gtggcaacga gtacgtggcc ccaaagcggg aaaacggaag 600
aagaaaaacc tcccgcgggg actcgaggcg ggtacgcggc tcacccgccc tttcgggaac 660
ccccaagcgc gtccgaatcc gccccgaggc gaggcgggcc gggccgtacc tgctgctccg 720
tccccggctc cgtcccgggc tcctggcggc tgtcgctgcg gttccttccc gcgggccggg 780
ccccttccct gcgccttcgc cgcctcctcg cgcctgcccg gggcccgcag cctccgcacc 840
gggaacccgg aggacccgag gcgggcgcag gggcgaagcc ggggccgggg aggggccgcc 900
tcgctccggg ttcgagacgg aagaaacacg cggcgcaggc tccggagcga cggctccgac 960
ggggacccgt taaataattt attgatgata caaagcgact cgcgcccacc cggggccgcc 1020
cccggattct gcaaaaatag attcgccccc accccgcggg tcctcacaag gcgtcccccg 1080
cgccgccgcc gcacgggctg accagcgcca agttcgaggg tttgtgcttc ttgagcagcc 1140
gcgtgatctt ctcgtcgtcc gagttggggt ccaggggccg gttgtattcg tcgtcgtcct 1200
ccgcgtccga gccgcccacc ttcagcttct cggcgtccga gtcctgcttc ttcttggccg 1260
acgccatctc caccgcgtgc cgcttgcgcc acttggtccg gcggttctgg aaccagacct 1320
gggagtggac ggggcggtca ggcggccgcg gggcccgggg ctggcgctgg ggccgttcgc 1380
aggacgcggg cccccggctc tgctctcccg agccccgccg cgctcacctt cacctggctc 1440
tcggtcatgc ccagcgagta ggcgagacgc gcgcgctccg ggcccgccag gtacttggtc 1500
tgctcgaagg ttttctccag cgcgaagatc tgctggcccg agaaggtcgg gcgcgagtgc 1560
ttcttcttcc cgtccttgtc caggacgccg ccggccgggg ctgcaaggga ggggaaggga 1620
gggaggtcag cggccggcgg ggtccccctc cgcgcccacc cgccccgcac cccccgcgcg 1680
ggccactcac ccgggccagc cagacgcggg tccctccagg gcgcgccctg caccacgccg 1740
ggccagaaga tgggcgggcg ccccggcagc tcggccaggg gcttggggta gccgcgcgcc 1800
acagcggccg cgggcccgaa gtaaacgccg gcggacgacg cgagcccgtt gagccggggc 1860
agccccccca ggaggccccc gcccgccgcg cccacgggcc ggcccaggat gtcgctgatg 1920
ccgtgcgggg tcccgagcgg gagctgcgcg cccaggcccc ccagcgcggg cgccttgaag 1980
ccggccggac cctgcagcgc gtaggggaac agcgacgtct tcatctcggc catgttgtgc 2040
agcgcggcca gcggggcact gctcagcacg aacgcgcccg ggcggttagt gtccatgggc 2100
gccgccgccg ccggcccggg ctcccatccg ggccccgccg ccgccgcccc tgcccgccgg 2160
cccgggaagt ttgcgcgcgg cccgggcggg cgtcggctgc agcgcggggc gcggggcgcg 2220
gggggcgggc gggcggctcc ggcgcggggc gggcgggcgg gcggcggcgg cggcggctcc 2280
ggggccggtc ggagcggcgc cgcgcgggac ggacgcgctg ataacggggg ctccccgggg 2340
cgcggcgcgc gcgctgattg gctgcggacc ccgcggtccg gccattggcc ggcgcccccc 2400
ccccgcccgc gcgcccccgc cggccgcgca ctccatgaag ggcccattag cgcggcaggt 2460
gcctcccggg ctgtaaattc gccccgattt atctccccgg ggacgaaata aatccagctt 2520
ggatgggagt gtagttaggc aaaggttttc atgcgaaatc aggaaaaaat acgagaacgt 2580
attttattaa cggaaagaat gcagatttga ggacccgccc gcgcgctcgg agcgccccac 2640
tcggggaaga gtcccggccc gcgtcccagt cgcgactgct ccgccgcccg tggctggggt 2700
gggtgtgagc ggcagcggac gccggcgggg aacgcgctcc gggcaggtcg gggccacagg 2760
agggcggagg acgcgggcct cgagtccacg gaatccacgg gcctcacggc cgggcgaggc 2820
tcgcacggag ctgcctctgg tttcgccgac acgcggccgg cgcggtggag gagtgaggca 2880
ggcgggagcg gggcggggag gcgggtcccg ggaccacacg cgcggctcgg cacttccccg 2940
tcatcggcct ccaggtctcc cgctgggggt cccccaggat gtgacctggg cccacgactt 3000
cgcccacggg ccgcctctcg cgaatccccg gccgggagaa cagagaccag gacggcctca 3060
gcgcggaagc cctgtccagg gcccgaacgt gggtgcgggc tgggggcgca gcggcagaaa 3120
cgcggcctta gacgcgcgcg gggggccggt gtcccccccg cccccacggc accgggagcc 3180
gctcgctcat ccatcccgca gaccgggcgg tgagatgact ccgagccccg cgcacggcgg 3240
ccgcgagcaa acgctccgac gtctgtggtg acgtctcgta ttgatttagg gacacggggc 3300
ggctgtggct gtggcccacg gctcgtgggg agcccgagtc tgtgcgcagg gaacgccgct 3360
gcgtggcctc tctcgggcct gtgccgcgga ggaaggcggc gcccggggtt cggggccggg 3420
gtctcacgtc cgccccctcg cccccctcca gcgtccgttt tcgttttgtg caggtcgagg 3480
cggggacttg gcgccgtcgg ccgctcctgg atggcggctt ggaaaagcca cctgcggcca 3540
aactccgggg cagtggtgcg gccgccgggt gtgtgcgcgc tcggggctgc cccggcggct 3600
tccggctcca ctgaggtgca gccccgcgtt cacggggggt tcgcttcccc cgtcgactcc 3660
gcactcgatt cgactgggat tgggattcga ttgggcgcgg ccgccccacc ggtgatcggc 3720
ccccgcggag cctggcccgg gaacccccag cgcccgtccg gccccgagac ccgccccggc 3780
ctgtcctgcg ccccgctccc tcggaggaga cacgaggaag ggccctcccg ggtcgggttc 3840
gggcccctcc cagcacccca aggcgacggc gcccgcgccc aaggctcggg ctctgagctg 3900
agacgcggga actgcggggc cggggggggc gggcaggggg agttgggggc gggggctgct 3960
gtcgccctgg gatcccccac tctgcgcggc cgggcagacc ctgggcgggc cgggaggggt 4020
gcgggtcgcc cgaactgagg cccaggaggc gcgcgcgggc ggaacggcgg gaggaagccg 4080
cgctcgggac aggctctggc tcttctcaca gcctggaggg gcggggcagg gggcgtcgct 4140
agcgctgttt tatggctgag gaaacatgga cctggaggcg ctgcgctgcg gcccgataaa 4200
ccctgggtct gtctgcgccc cccggtcctc cctgggctgc cgagggaacg cgtggggtcg 4260
cgggtggggc tggcgtgtca ctggctgcgg agcgcgcggc tctccagggc tcaggggcgc 4320
gggatgaggg gccagggtga gttgggggcg cagaggagcc gggtaagggg gggtccctct 4380
cccacgttct tgtaagccgt ggaagtcttg gcgcgctccg caggtgccgc gtcctacccg 4440
gctccccggc ctgcgcccca cgcgctttcc cgccctcctc ctcgcggagc tgcgcgtggg 4500
tccggtggct tcacctccta cgcttcccgg cgcccactcc gggccccgtc ccctctccgg 4560
cccccgcccg caccttttct cctgcgtccc ccggtgccgc cctctcggaa accaccgagg 4620
caactccccc tcctcccggg aaggtccgag cgcctccgac cgcgatgtct ttgcctgggc 4680
tccgccgccc ggcggccccg ctgcctggag aggtccgcga tgccacctcc tggcccgcga 4740
gcagatgtcc cgcgaggaag gctgccggca tcggcgccga cgctccgcgc tggaaaaccg 4800
agagcgcggg gtttggcaga ggccattcaa gtttgtttta ctcgttcagc ctgtatttgt 4860
ggggctccta ccgcgcccgg gctgtccggg gggtgcaccg tgaacgcagc gggctccggc 4920
ccgggcgcgg gcgggtcaga gcagcaaacg cgctcccccg gcacccccgc ggcgtctgca 4980
ggggagcggg cgacggggag gacggcgggg gtgtcggccc ggaaggagag ccggcctagg 5040
ccccggtgtc cccgcgctgg gggctgaggg gcgacggggg aactccacag agggaaggag 5100
cctgcgttcg ccttcggccg cccaggccat agagttcaca aactctgatt tatcactgag 5160
gtgacttgtc ccgcgcagcc ctaggcgagt tgccaagctg cccgccctga ccgcgccccc 5220
aggccggggg tctcctagca gttcccggca aaggccctgc attgtctttt ttcccgaagt 5280
gagcgcattc ccg 5293
<210> 4
<211> 2001
<212> DNA
<213> Homo sapiens
<400> 4
gcctcaccct ggaacaggga gtccagcagg tcctggttga cacagccggg gctggcgtgg 60
tggacaagga agcctggacc acagcagatg catgagtgca ggccccacag ccccccaggg 120
ggaggctggc ccagctccca aagccccggt gccaggggca gtgtgacccc gggcggcctc 180
acctataagc acggcggctg cccggcgcag ggggtcctgt ggactccgca ggtagccctg 240
ggtctggctc aggaagttgg gcacgtggcc tgggtatcgc tgaacctggg gacaaaaggg 300
ctagtggcag gacaggaggg ctgatcctga gtgcggagga ggctgcagag ctgaatccag 360
gggccggggt tccaggggag cccccagggc aggtggcatg gtcggagacc ttggacttgc 420
cccaccagta gcctatctgg tttggctgca gtagaaacgg ttgggggccc cggtgaaccc 480
tggaacaagt gggctgctga tcataccccc ttgcggtcac cttgcttccc ctactgacca 540
ggcggcagca gaggtggctc agggcctcgg ggctgtcata gtgggccacg gtgaccaact 600
cctccagcag gccccagcaa aaggcgtggt cacagcgggc cagggtccac tctgagctct 660
gggatagggg aagtgagccg ggtcaggggt ccaggaagta gaaaggcaaa aggtggggtg 720
ggaagagggg gagcaagggc atcgggtgag gggcagaaga gcccagggca ggagactgga 780
ttgattctgc tcaagggaag agcagtagta acctggccgc ccgtcacacc tgccactgag 840
gtccttggga tgggtgagtc cctgacctgt aattgtcgga ggggaggcac ggtgggagtg 900
gtgagtgttg gatggcatag gggtgggatg gtgtcggggg ctgctgacct cagcagcgtc 960
cctgctgggg tcatgcaggc gcagcagcag cggcacgaga ctctgcagca ccagcttccg 1020
cagggggccg cggagcccca gccggagccc gccccggccc cggcgcacca gagtcccaag 1080
gagcccgacg gccgaggcgc ggattgagtc ccgtgtctgc gtgggagggc gcagtcaggg 1140
caggcggaga cagagagggg ctgcaagggt gggagggggc ggccagcgcg gagcgaggaa 1200
gcggcgggtc tagggaaggc tgctgactcg gtgtgatctg gggacaggga acagggcctg 1260
gagctggacc tggttgggaa gcctggagag cccctgcagg gggtggggct tgaagggatg 1320
gggtccggaa ggaaaagtcg agcggggagg agcttggcgg gacacggccc tggaggggcg 1380
gagctgggcg acagcaggcg ggaggggcgg gggcggtcag gagggaagaa atctgggacg 1440
gagacactgg ggggacgggg cctgggaggg agaaactgga ggggcggggc ggagcctggg 1500
aggtcagggc ctgggaggga cagactgaca gactgggggg cggggcatgg gaaggagaaa 1560
ctagaggggc gggcggggcc tgggaggcgg ggcctgggag ggagagactg taggggcggg 1620
gcggggcatg agagggagaa acaggagggg cggggcgggg cctgggaggg agactggggg 1680
cggggcctgg gagggagaga ctggaagggc ggggcggggc ctgagagggc ggggcctggg 1740
cgggagagac gggggcgggg cctgggaggg agagactgga agggcggggg cggtgacagc 1800
ggcaggggcg ggacccggag gcggggcgtt tgctcacgtc gtccagtagc ggagggaggc 1860
gcggtcccag ctccgcgctc aggagccgca caggcgcccg gggccgcagc aggagcctcc 1920
tcagggcgcc cagcgctgca cccacgagcc gcgcgtcgcc ttcgcccagt gcgcccagga 1980
gcgccggcag cagcgtgctc a 2001
<210> 5
<211> 619
<212> DNA
<213> Homo sapiens
<400> 5
ccgtccggga ctcgggggga ggcgcgctgg gtggtccggc agccgggggc gggcggtagc 60
ctgcaggcgt aattggcatg cacgccgttg tagctgagac cgcttaataa agcattacat 120
atctcaccgc ttccatattt cattacctca cgcggagcct gtgagagggc cctaatggga 180
gtcagctgtg tttttacttt ctgttgtcgg ccgggacggg tttctctgcg gattctttga 240
aatgaaataa tgtgatgcac gccgcgataa gggccggcct gtaatgaggc ccaggccgcc 300
gggcggctgc tattgctcca ggtgtcgcgt atttgggctg cgaggacaag gaggaggagg 360
gggcggcgcc ggaggatcgg gggggagggg gaagtcgcga ggggcagggg gtgggagaag 420
gcggagggag gaggcagggg gcagggggcg ggcggaagag gggaggaagg agggggcggc 480
gggccgcggc aggccaggcg ggagaagccg gagacagaga gaggacgggg acagtggcgg 540
cctgcagagc cctaggaacc cgggttcaaa tcctgcccgc cagcgtgaga gagcgtttgc 600
ccgcccaggc ggtccaccg 619
<210> 6
<211> 2001
<212> DNA
<213> Homo sapiens
<400> 6
ggctgccatt tctcatgggg ttcgagccat aagatgccag gtgtcagtca cctcagaaga 60
gagggttttg tttgtatttg gtggggttct tccgggggta ccgaggctga ggactgatgg 120
atcgaggcgg gtggatcact tgagttcgga gttcgagacc agcctggcca acatggcgaa 180
accctgtctc tactaaaaat acaaaaatta gccaggtgaa aaattagccg ggcatggtgg 240
tgcttgtctg taatcccagc tacatatgta attccagcta ctcaggaagc tgaggcagga 300
gaattgcttg aacctgcggg gcggaggttg cagtgagccg agatcgtgcc actacactcc 360
cgtgagggag cagcctaggg actaaggccc gctggctccg cgagatcagc caggcccgca 420
tcatccccca attacctgca gagggcgccg cagacacaga gagggcgagg ccgaggccga 480
ggccatctaa gcttctggga agggggtccc aaagggaggc cccgagctgg agtccagggg 540
gcttggaagg aagaggtgag gacagcagaa aaggaaacgc aaattaaaag aagggaacga 600
aggctgggcg cggtggctta cgcctgtaag tccagcactt tgggaggccg agtcgggagg 660
atcgcttgag gtcaggagtt caagaccagc ctggccaaca tggtgaaacg ccgtctctac 720
taaaaataca aaaaaattag ccaggagtgg tggcaggtgc ctgtcatccc agctactccg 780
caggctgagg tgggaggatc gcttgagccc gggaggtggg ggttgcagtg agccgagatc 840
gcgccactgc actccaggct gggtgataga gtgagaccca gtctcaaaaa aagagaagga 900
aaagagagaa gggatggtgg cggtggggga ggaaggcggt tcttgtaatg atccgagagg 960
agaccgcagc accggttacg ccctcgaacc tcggcctcct catctgcaga atggacgcag 1020
tccacaccgc gtgctgtgga agggttggag cgccggttta catgacacag ggctatcggc 1080
taagggggcg ctgggaacgt ggaaggtgct ctatggtggg gcgctgtagg gtgctcttgg 1140
gcagtagggt tggagtcaaa tctgggttga agtccaacct aggttgaagt cctggctgcc 1200
acctgacctc tgcccctcag tttgctcatc agtaaaatgg ggttaaggag gctgcctcgc 1260
ccagctccac ggagccggag gtgatgaagg tcctggaaga gcagaattca gaacccgagc 1320
tttgggcggc ggagcaggac agggcgcggg tgggcgcggc ctccgggagg ccagcacgag 1380
ggggagcggc ggggcccgga cacacccagc cagaaggagg aggccgaccc cgcgccgact 1440
ccgcagatgc cgctcgggac ttcgttgtcc ctccaggcgc ccgccctggg gtcctccatc 1500
acccgccgtc acctgggcgc ggggaagctg gcgggagggg aggcggggct tggcggcagc 1560
ggcgggtggg ggccggggag cgggggcagg ggcgggcgga cggagcgcgg ggctggggac 1620
ccggggtccc agaagggggc gcggggacgg ggtccgagga gagggggccg gggcggggca 1680
gggcggacag ggctgggggc ggaggtccgg gggtgggtcc ggcggcgagt ccgggtcggg 1740
gcggacagag cagggggcgg gggtccggga ggagggggcc ggggtccggg aggagggggc 1800
ggggcccggg ggcggggccg gggtcggcgc cctgcgggga ggccggccac gtgacgcccg 1860
cggcccggcg gggctgccag gcggcgagcg ccgcggcggc cccgggaggt ggcggcgggc 1920
gcgagagcct gggccgcgcg ggactgaccg tcggggcccc gggacggcgg ccccggggcg 1980
cccatgccat ggagaagctg g 2001
<210> 7
<211> 3044
<212> DNA
<213> Homo sapiens
<400> 7
gcgcgcgtgt ggaaggctgg gtggggtgcg cacacacgct cacttgtgta cgtacacaca 60
cacacacaca cacacacaca caggcacaca cacccgagct cagtcaccca cattgcttgc 120
ccagggcgcc tggaagagct ggcgagcccg cccagctctg ttcacccggc cccgccccgc 180
cccctccggg agggctctcc gggcggcgcc cagccccgag cagagcaaag gacggcggcg 240
gccacctccg ttctccggcc gctggtttct cgtctttcct cgtcctttca ttgaacccat 300
ctccgtgctt cgaaaatctg actctaaccc gatctcttcg cgtctccgcc tcttctttct 360
agagtgagcg ccaaaaaggg cctgacagac agaagccttt ggccccagca ccggcccagc 420
ccgtctctag acgattcttg ctcctttcac cctcacagcc tccagtggtc gcttcatctt 480
cgcaccctcc cggccaaccc taactctcct cgtctctcct cgcgctgtct cgcgtcctcc 540
cctcaggatc cttccgcaca ttctcagcgt ccagcgcggt ttcccacaac ttcctcacgc 600
cccgctcccc tcgccctgtc cccgccctcg acaccacctg cgttccccac tcgctccaac 660
ctccctcccc cgctatcccc acttgtgggc ctccagctct ctgccccttt cctggccccc 720
atccctgaca ccccagggac ccttcctccc tcctcacgtt ctccctcctt ccaggatccc 780
gccccgacac ttcggggccc tcccgctacg cgcactcttt ctcctcaggt cctgacacct 840
gggcgccccc tccctgtcac ccaccttcag ctccagccct gactctcggg cgccttgcca 900
cccttacgct ccccgccccg ccccggtccc tcgggcgccc ccactcgccg cctctacctc 960
cctacctgct acacctggca cccctgcccc cacccctgct catactcttc ccccgccccc 1020
gacacctcgg gcgccccctc acacgctcct attctccaca cttccgtccc cgaaaactcg 1080
ggcgccctct cccttcacgc tcagtctctc ctccctcccc gcccggcccc ggacccagcc 1140
tggagatcgc gctcgggagg ggcggctgcc gcccgcgggg cgcccgcggt gcccgggcct 1200
gggcagcgag gaggtgacgc cgcccccgcg ggatgagccc gggaggcgga ggggcggagg 1260
aggtgctggc ggcggcactg agcggcggcg gcgcagggcg cgcgggcctt ccgcgccgac 1320
tccatcgacc caaggggcgg cggcggtggc ggcggctgag cgaccctggg ccgggcgcgt 1380
gatgaggagg ggccggcgcc agaccccgct gcacgtcgga gctcgcctgg atccgggcgt 1440
tggcagccga agggccctgg ccccgggact ctccgccgct agcccccgtc atatcttctc 1500
cgctttcgct tctccactct agccgggggt ggggtgggtg gggttggggt ctccgcgggg 1560
gtttccggcc ccgcggcccg ctcccgggtg tgcctggagg agttctccct ctgtggcgcg 1620
cgggagccct gtgatgcgtc agccggcggg acggatgagt tgcttctccg ggaaaccgtc 1680
ctcgcttcct cacgaccctc tcggctcccg cctgggtgcc cctcgggccg gcagtactcc 1740
gcctccgggc gctcgaagcg agttccccgg gggcttgttc gcaggcaccc cttcccctcc 1800
gaggcggcgc gcgcgctccc ggccctgacc gcggccggac acactcgcgc cccggtccgc 1860
ctgtcgccct cccgcctgct ccctccagtc accccaccct tagctgtccc cgccacctta 1920
ctccaccacc ctcccccgcc tctccgcgca ctccgcgtcc cggcctccag ttcccctttc 1980
ccttgaaccg ctcacttcac agcccttcgc ccccgggaag aagaaacatt tcccgaagcg 2040
cactcctcag ccctccttcc ccacgcgctc gccctcccct ccccctgctt ttcttggggg 2100
aggggggctg tcgccttgga ttgaaggcca ttgatttgta tgtatttgtc ccagcgctgg 2160
aggctgcccc agccgccgcg ccggtgccgc cgctgccagt ggagttgcct ccccgcttcc 2220
ctagggtggt tcggctccac caaacatgtc ggctcctgtc gggccccggg gccgcctggc 2280
tcccatcccg gcggcctctc agccgcctct gcagcccgag atgcctgacc tcagccacct 2340
cacggaggag gagaggaaaa tcatcctggc cgtcatggat aggcagaaga aagaagagga 2400
gaaggagcag tccgtgctca agtaaggacc tggctccata ttcccgcctc tctccctgcc 2460
ctccgccccc tcgcccactg ccctgcggcc gcctgcgcgc cccagttcgc cgccctccct 2520
cccgctggcg gcgcccaggc cacgagggct gcggccagcg ccggccgccc gggctgtttt 2580
aggggtgtct gagagcaggg gtgtgtgtcg gggagggagg gcgccaaggc cggctgaggt 2640
gagggtggcg agccttaggc ggtgtgattt tccttggcgc ctttccggat ttcctcgctg 2700
gtcatcttgg ctccggggcc ccagcgggac tggggctgaa cccaggctct gtgcgtaccc 2760
tctcctttcc cgccgcgctg aggcagtgac tggggcacag aatccaatat ggccgtgcac 2820
aggtgctccc tggacggacc cgggcgaagg cgcgctggca ggggatgcgg acgccaccct 2880
ggtcccacgc ctccgcgggg cggctctacc agcaacgcgg gacagagcag ggctgcccac 2940
agtggctgcg agcagcgggc ggcggcgcgg gctaggggcc taagctctgt cgcggtcggg 3000
tgggtgtgcg tccgccgcca tcttccagcc cctccccctc ggcg 3044
<210> 8
<211> 801
<212> DNA
<213> Homo sapiens
<400> 8
ccgcggtgct acaggtttct ggggccttct tcccggcagg gccacgccgg tttccaacgc 60
ggggggcatt tttcggcctt cccacggttc ccgctgttcc cacgaagaca gtgtctgcgg 120
ccaggcgctc cgagagagat gcggccttcc ccgggccggg cctggccgcg gcctgcccgt 180
ggtcccccgc agctcgggcc cgcagcgcga ggccacagtc cagggggagc cggcaggcgg 240
cctcctcccc gagccggagg agctgcgcgg acgcagcggc ttccaggcca ccccaccccg 300
cgccagcctg cacctgtgcc gcctgggtgt cttccccgag actctggtac tgtgaagggt 360
ccgggtcgcg cggggcgtcg tccggagcag ggcggactcg ggctttggcg cggcctttgc 420
cccggttttt ggcgcgggag gactttcgac cccgacttcg gccgctcatg gtggcggcgg 480
aggcagcttc aaagacacgc tgtgaccctg cggctcctga cgccagctct cggtcgggac 540
cgagcgggtc tctccacggc aaccgccgac gtcacgaacg tacaactgta ccgtcgcgag 600
aggacgtgat gcgcccggtg attggcgccg ccgctgcggc tgcgcaggag acgacccccg 660
cgggcgctcc cacccccatc tcgcgcggac tcgctttagg tctcggcgag tttctctgat 720
atgcgctcgc gggggtgctg ccatttcatc tcttccgcgc gggctcatcg tgctctcagg 780
gtctcgttga acaaggcaac g 801
<210> 9
<211> 314
<212> DNA
<213> Homo sapiens
<400> 9
tcggccgccc gagggagttt cttttattcc cagttcggct ttcttttgcg aaggccgaga 60
tctgggcctg ccaggggcct gcccgagtcc tctatcgcgg gtccacgtgg ccaccaatga 120
cccgcggcgc ccccgcgtgt ccccgcagcc actccgcgga agcagcggcg ggagcgcacc 180
accttcacgc gttcacagct ggacgtgctc gaggcgctct tcgccaagac tcgctaccct 240
gacatcttca tgcgggagga ggtggcgctc aagatcaacc tgccggagtc tagagtccag 300
gtgcgcactc cccg 314
<210> 10
<211> 2213
<212> DNA
<213> Homo sapiens
<400> 10
ccggctttaa acgcctctcc agccacctgt gaaccgcgaa ggagccggct ttcgcggcgg 60
ggaccttgcc accagtaccc tcgcgggccg aggtcgttct cccggtcggc ttcccgcctc 120
acccgaaaag gaattagagc atctacccaa gacggtgact ggcagggcag atcaaggtgt 180
cctggtctcg gccccagccc cgcggtgcgc cccgcccgct taccttgacc gggtgcaggt 240
agccatcgcc gcgcagggcg cccaacccgg cgtccgccgg cgcctcggcg tcgtcctgca 300
ggctgcgggt gagatgcgcg atgtaggtgg tggccagcag cagcacgtcc agcttggaca 360
gcttggtgtc gggcggcacg gacggcagcg tgcgctgcag ctccaggaaa gcgtgccgca 420
gggtctgcac ccggctgcgc tcccgcgccg cattcgccgc cgccggccgc ccgctcccgg 480
aacgcgagcc gcccccaggg cccgccggcc ccggcccggt ccgcccggga cgcgagtcgc 540
ggatggcggc ggccaggggc gcgggctcgg cgctggcgct gagggggctg cccgctgggc 600
ggccgcggtc catggcagct tcccgcgccg cgcgcgctgc aaaggaccga aggtgcggtg 660
aggccggggg gcggtcgggc ttaacccgag aggcgcagcc ccctggttct ccccgtgcgc 720
ccaccagcag cccaacgggg ctaagggcgc tctcaagcga gctcgttttg cctgggacgc 780
gatttgcttc cggacgtctg gggagagttg cggaactccg gagttcttgg gcttcctaga 840
aggataagaa gaggcgcagt gccggctttg cttttcaggg gcaaattaag caaaaggtct 900
actctacccg ggaagaaaga tctcggaagc acagctcagg atcagcactc gttcgcgctt 960
gggtgacttt atccaacccg gcacgcacga gaggtggcgc ggctccttct cgccgacgcc 1020
gcggaaaacc acggctcacc agccgccctc ggcctttcac gccagggggg atttctgccc 1080
gaggagcggg ggacccttag cctcacctcg gggtacggca cccgccaccg ttccgagccc 1140
gagagctgcg cagtacgcgt ctgacgggcc cctcaccttt cctggagcgg ctgagtggag 1200
ctccgctccg tcgtgagggc gggcgagggg cgtggagcag ggcctgtgtg gccagggccg 1260
cgctggtcac tccatcctcg tccggccgat gcccaagtcg acggctgttt ccaacctccg 1320
ctggctgtga cttttatgcg ggcgccccgc ggccaggcgt gtgtgctccg accggctaag 1380
gcaggtcggg cggaggacct ggcccaccgg agaggctacg ccgggggctg aggcggctta 1440
gagggtcatt aatcaaaccc tccggcgggg cgggctcggg ggcggggcgt cctcctggcc 1500
ccgcccctcg gctcactgcc tcacgctgct ttccccgagg cgcctcgctg agggcggcgt 1560
gtggagagtt tggggtgtct gccgccggct gcggtggggc cgggctggag gccgcgggtg 1620
aggcctgtgg ttaacctcgc gctgccgagg tcttacctcc tcgagtccag tctgattcca 1680
ggccgcttcc aggccggtgc ccagctgagg cgggaacgct gcagtttggt tgagcgtgac 1740
ttttaggctc tgtgaggaaa agtcgagcgc gccacatcga ggcgctagcc gtttattcta 1800
ccacaaggta aaagattcat gctgtcctag ttaccctaaa gctgggagat acactgcact 1860
tcctaccaga ccccgaatgc tctcagtgtc tgtaattctt taagaagttc ctagagcaga 1920
cagcccttgg atcgtgggca cttctccccg gggacgggga ccctgctgac cgcctccgct 1980
gcccccgcgg gggccaccgc tctttaatta tttgggcgaa acattctttt ctggttttgc 2040
acttgtggac tcacgggaag cgtgacttgc agcgaggcag gacccgatcc caggcttctt 2100
tagaaagcgg acgctgcgcc ccaaggcctg ttcagagccg ccccaggaag ccgtgggtcc 2160
ccgaccgccc caaaccgcag cggtttctgc aggtcctgga cccgtcgcct tcg 2213
<210> 11
<211> 714
<212> DNA
<213> Homo sapiens
<400> 11
gcggacgcag tcacgagtcc agggcgaagc aggcagggag gcaggtgggc ctcggtccgc 60
cgcaagctca cacttaggag gaccacgggc cgcatgctgt cgtcgtcaag gcaacgacct 120
cactctgtcc ccaaccatag gcacaaagtc ttgggagaca gatacggccc aggtcagaat 180
gcgttcacgg caggcaccaa cacctgtgaa ggccaagggc tagagagcaa ttagctgggt 240
gagaggcacc acctcccagc tcgtaaggcg cccagtacct ggagcctggg aacctgcacc 300
gctccaacta cccctgggcg aaggcgttgg ccgcggagct gcaagggggg gcggtttctc 360
acccgccccg agagcgccag gcctcccttc ttctgattgg ccgagccgag tcgtcacgag 420
ccatgattgg ctcagggcca accaccccgc cccttcacct agggctcggc ccaggttctg 480
ctccctgaca cgcagaggcc ctgcgtcccc acacgccttg gttctcgtca ggaggcgcct 540
ttctgccttc cccagcggga ggaggcgatt gtgatgccca cgcgaagggt aaaggtggcg 600
gttatgtagg actgcgaaga ctatgcaaaa tgcgatacgg tttccctcat agcatcgccg 660
ctggggcagg ggcgggcgcc gggcgccctg agtcgcgtag gcgcggcctg accg 714
<210> 12
<211> 8078
<212> DNA
<213> Homo sapiens
<400> 12
gcgggcaggc ccaagctgcg atgtggagaa ttcgatgtcc gagcgacctc ctcggaggag 60
tgggtcgagt taaatataac cgcgcgaatg gaatggcgct aaaaataagg cagcagctgg 120
cctgtccaca gccctgtccc gggaggggcg ggggccccag tggtcttggg caggaaggcc 180
gcgtccggcc caggggcgag aaggctgcgg cgtccgcagc cagggctgga aggcctggga 240
ggccgcgctc tgtgggcccc ggggcctcca ttcgggctgg gtcgcgggcc tggacgggga 300
ctgtccagag gcatccgaaa gccaggccaa cttgcctgga cgtaacaaga cggaagggct 360
gggcgctgag gtcctgccag cccggccgcc agagggagct gagcgccaga ggaggacaag 420
ccgaaccctt caggaggccg ggcgtctccg gagaccgaag cgccggagga cccgaggagg 480
tctgccccgc gcgctgctct ggagactccc ggggcgggtg gcgctcggcc tttccgctcc 540
cttccttccc acaagtccct tcccgcgcgc gccccacggc cctgcccgcc ctcccgcgtc 600
agcgccccaa ccgtcaagcc agcaattgaa acgtttccaa aacggtctat ttatttgctc 660
ccaataaatc gatcggcggt gattaaagaa tcgatgtggc ctgggtgggc gagtcgcttg 720
aggggaggga ttgggggctt tcgcccggcg cctgcaggga ggccgagggc gggcgcgggc 780
ctgagggagg cgtgtcccgc ccgggccaca cccgaggacc cgacacctgg gctggcaggc 840
cccggcaggc agcgttccct ccggcggaga ggggcgcgcg cccgccgcct gctttcctcg 900
gcccctctcg cctttctcgc gcgccgggga ggctgtggcc gccagtggct gcggagctgc 960
tcagaggctt ttgttgctcc tcggccggct gaatggggat tttgtaaagc gggacagata 1020
aaaatgagca gcatcatatt gtttgacaga atgatctcgc atgatgaagt gtcggctccg 1080
aagggggtga aaatggtgaa ttcctaaaaa cccagccctg ggctcctcct cgagctgccg 1140
gtagcctgga gggacccagc ggacagccgg gcctggccgc atcgctccaa acggtgtcag 1200
aaagactccg gctttcaatg ccaagtcatt tttaagcccc gatcctgtcc aggacctttc 1260
tcctcgtgga tgaaaagaac aattttcgag agaaaggctc gtttttatta aatccgacat 1320
gctgctgata actccatgct aatgtgaaat aattaacata atagccataa ttaaaagcac 1380
gctaacaatg ccataaattt atcacacaat tttactagct ttctgcccct aactgctctc 1440
tcatcgttaa ttaaacgtgt tgccttttac agaatggatg tttatatatt tccaatataa 1500
ataaattcga aaccatcctc tctctcttcc tctttctctc ctcctttcct tttggtctct 1560
cgccatttac aggcacgcct tggcgtggac cctgagtggc agacatcttg aaaataaatg 1620
aagttttgag atgcaaatcc aaacaagaac attaaaatag cctctttttt tccaccccga 1680
aaagatccgg agaggtatac aagggggtag tggtgggtaa gagagttgaa aatcccccgc 1740
tttgggaaat ggaagtaatc tgggtgggtt ggggccttgg gtaccacctc tgccctttcc 1800
caccttcctt ggtggcggcc atccagacaa agaggccggt aatagtttaa caaatctatg 1860
aagattttca agaagcagca gactttgatt gttgcgggcg cgggggtgtt ggggagaaag 1920
gaggggaatt tttctaatag tcccacccac gttttgctcc ctcttggaca aagagtaact 1980
actcttggtg ggggacgcgc ccttcactcc gcggaacctg gtcccaactc cccgtattgt 2040
aagaaaagtg cacccgcgcg cgggcatgat gattctatct cacatcgcgc caacgactta 2100
ttcaagccac tggcactgtc tctgacttaa aagaggagaa aagaggcata tgggttcact 2160
tgggcctggt gaggggtagg tgggcaattc ccgccttccg cactctaacc gtgcccctcc 2220
tccagtgttg accacctaag aacccaaaat gagctgtaat taatttccct ttctccatca 2280
taaatttttc tatccatttc ttccccccca tccccccact ggacgcacac actaaatctc 2340
ccctcccctg gagacgtctc aatttccttc ctatcgatcc ggactccatt cttcttgcct 2400
cctgttgcta gaacctagat ccccactccc cgcacccctc attcccaccg cgtccaggtg 2460
gctttcccag cggggtacca tgtactctgc ccgctccaga ggaaccgaag gggtttcatt 2520
ccattctcct ttggttgaaa catttcaaac atttgagcag gtgaggcagc tggctgccat 2580
cttccttttt aaatctctcc tgggaagttc gcttgttgag actcaaagag tcactcaaac 2640
tcataattgc gtgtgtgtgt ctactcattc tccctctatc tctccaataa ccctttgaga 2700
ctcagaaact ttttatccac atacaccctt tatcacattt tcttcccccc actacatgtg 2760
tctcactttc tctctgtatc tgtctcgctt cttccgtctc tgtcctacag cttggcggta 2820
actgacgacc tgtgagcttt tagctgcaaa ctgcaactac gcggcaaaca atttatttag 2880
cccgacatct agccggtctc cggcaggacc ctgcaccgcg tcgggatcgg acccttccgc 2940
tggggcggcc tcctgcgtca aggccagcag gaaccttcct gtcgccctcc ccggccgccg 3000
cttcgcctcc ttcccgcccc cggaggttgt gcaggcgcta tggtccgcct ggagggagaa 3060
agccggcggc cggttcctga gccgagagcg gccgcggaaa aatcctctgc ctccgctgga 3120
aatcgatatt aggccggcgc gggcgcggga cgtcggggcc gcagccagta ggttgtgcac 3180
gtctcatcat ttagctaatc gagtcgaaaa gtttctgtaa gggccggacc cagcatcaga 3240
tggtaacact gattgaacaa gagattagca caatagatct ctaaccgagg ggaagcgttg 3300
cttttcacgc tacgcgccgt aattaatggt atgaatcaat taatttgact tttattgtgt 3360
cgaaggaaaa aagcgcaaca aatggaaccg gcagctggga gttgttcgtc ctccaccccc 3420
ttccccaggg aggttccaag gagacaccgg ggaatggacg gatcaggctg ggccgtggca 3480
gagggagggt aggaggcagc gaccagcagc gtggagggag tccagagagc tagcctctgc 3540
ggacggcgga atcgaaatta ggctcatttg gagactactt cgagaccggt gaggggagcc 3600
ctgtagccac catcctccgg cgcgcatcca cacatactag tccacgcggg cccagccacc 3660
aaggccgcgg cagggccagc gctgcgcccc gggcccctgc ctttagggct gggcaaccca 3720
agcagagcaa aggaggttcc tgaatgtgta aatttccgct ttttagcttt tttttttttt 3780
ttttttggac cttccgacac ttcggttgct gaggcagttg cagacgcgac ctctgcagtc 3840
ctgggcgatg gccagccagc tcagctcggg tcggtttcgc ggaaagctgt ctagacggca 3900
ttgtaaacgg ttcggagcct gcgggccaca aagctgtgga gctacggaaa tcaactctga 3960
gatgcgtttt agggccgtgt gcaacctcgg gatcatttag ataaagaaaa actgtggagg 4020
ttggcgggcg tctcaggata gtgtcaccac cccctaccct gctcccagcc tcagatgagt 4080
agtgttatat cctgggaaac tgtctaatgg ggatgaaagt caatctgtgt gtctcaatgc 4140
ctgtaatgaa gcaagtttac agatttttaa atttttattt ttattttatt gaattatttt 4200
tggtgtgtct aggccaagga aagaggagat cgtgggtggg gaaacagact gagggaatca 4260
gaagcaccac tgtccatccg gaattaaatc cacatcccag catcttctgc aaatatttca 4320
ctaattattt cctctcggaa ctcctcccct cgtgctcctt cctctggtga ggccggcgct 4380
cccctcccag gccgcagcgg acagacaggg attgggttcc gtgtgcctgc cacaccaggc 4440
aggctcttgc ggctcccaac taggcggcct aaatgaggga ggaaagagga ggcgcatcgc 4500
tgattcaccg cgtcaagagc actgactttc cttggaggtg tgaggtccac gcaccccagc 4560
cacgcacttg ggggtcggtt tgcggtgcct ccccctccag tcccagtgaa atccccacag 4620
tttttcctac tatcactgac ttgccttgca ctccgcgtgc attggccaca catcctcgcc 4680
tcctccaccc gctccgccgc cggttttctt ggaagttaaa tcttggagga tttgtccaca 4740
ccttaagaga agaaaatcca cgttagctgg cagcaacgga gatcccagca tgctggcatg 4800
cccaagtctg cccaggttcc cccaaggcca tgcccgccgc ccgggaagtc actgcccgca 4860
cccctcacgt ttcttcagcc gcccctgggc gctgcgtcta acctgaagac accaggcctc 4920
ttcccggatc cactcgactt acccaggccg ctgccaatcc cagctccttc cccagcgcct 4980
catttccgat tttttcatat gctaagtcgt ttaacaactc caagtagcca gttatggctt 5040
ctttatttat aggttccctg ctattttacg tcgtttttat ttctctcggc aactattcta 5100
gtagattaat caatagccat tttctgacct tcgggaaccc cagctgatgc tttttgtggc 5160
cgcacgaaaa aatacataca ggaaaacacg cccgcatcaa gccgggaaag agcaggtagg 5220
acctgagtgg tttggttggg ggagggggaa aaagacatct cagcaggtgt cttccccgga 5280
atgagcactg aggccagagg ggaatctgaa atctaattag caggagggag ccgggtgcgc 5340
tgctcttact ctttaaagct aaaaacaatg aaacaaaaag caaaacagag actaagtttt 5400
gctttttaaa acacgatatg ggaacctcgt tctaggtcgc ccagtccctg tctaaggagt 5460
gtgacaaagt gggggggaga agggcggaag ggagaggggg cggggaaggc agggcagcga 5520
cagtcgcaca gtcccgcgga cgctcccagg cccacgccct gactcgctca cacccaccca 5580
cactcacacc cacccgctcc ctgggcccca gggcccggat ccagcctggg tgggggggtc 5640
tccgggcggg ccgcagcgcc ctccgtgccc cggggatgct ggcgcacagt gcggagcgga 5700
gttgcgcgtc tctcgtccct ttgttgacaa ttccctgaac caacttgagt ttggccggct 5760
cggccgcggc cctgacgtca cgcacggtca cgtggccccg cctcccgctg gatctttaag 5820
tagaaagtaa tctatcaggc cagtccttaa aacgggactt tcgactaccg gggcttcggc 5880
gtccctgaca cccagccccc tgcccccccg ctactgtccc tgcccgcgcc ctcccgagct 5940
gctcggcgcc cggcgtcccg cgcccgcctg gaccgctcct gcgccccacg ccagggccag 6000
aggccgagga aggcgggcta agtgaggggg cgcggcgtgg agaaccgccg gggccgggag 6060
cggtagcgag cgcctagtac cgagcgccag ggacggcagg agttcgcgga gcgcggccgc 6120
tgggggcgga cggcagagcc cgcgccacgc gatgcggggc cgccgagtgt gagctgagcc 6180
cagcgggccc caagccacct gcggccccct cccctctccc tgccccccat ctttcggggg 6240
cactcaaacc ctcttcccct gagctccgtg gcagcccccg aacaccctca tcgcccgctg 6300
ccccctcccc gccgccgcta ccaaccccga ggagggatga ccctctccgg cggcggcagc 6360
gccagcgaca tgtccggcca gacggtgctg acggccgagg acgtggacat cgatgtggtg 6420
ggcgagggcg acgacgggct ggaagagaag gacagcgacg caggttgcga tagccccgcg 6480
gggccgccgg agctgcgcct ggacgaggcg gacgaggtgc ccccggcggc accccatcac 6540
ggacagcctc agccgcccca ccagcagccc ctgacattgc ccaaggaggc ggccggagcc 6600
ggggccggac cggggggcga cgtgggcgcg ccggaggcgg acggctgcaa gggcggtgtt 6660
ggcggcgagg agggcggcgc gagcggcggc gggcctggcg cgggcagcgg ttcggcggga 6720
ggcctggccc cgagcaagcc caagaacagc ctagtgaagc cgccttactc gtacatcgcg 6780
ctcatcacca tggccatcct gcagagcccg cagaagaagc tgaccctgag cggcatctgc 6840
gagttcatca gcaaccgctt cccctactac agggagaagt tccccgcctg gcagaacagc 6900
atccgccaca acctctcact caacgactgc ttcgtcaaga tcccccgcga gccgggcaac 6960
ccgggcaagg gcaactactg gaccctggac ccgcagtccg aggacatgtt cgacaacggc 7020
agcttcctgc ggcgccggaa acgcttcaag cgccaccagc aggagcacct gcgcgagcag 7080
acggcgctca tgatgcagag cttcggcgct tacagcctgg cggcggcggc cggcgccgcg 7140
ggaccctacg gccgccccta cggcctgcac cctgcggcgg cggccggtgc ctattcgcac 7200
ccggcagcgg cggcggccgc ggctgctgcg gcggcgctcc agtacccgta cgcgctgccg 7260
ccggtggcac cggtgctgcc tcccgctgtg ccgctgctgc cctcgggcga gctgggccgc 7320
aaagcggccg ccttcggctc acagctcggc ccgggcctgc agctgcagct caatagcctg 7380
ggcgccgccg cggccgctgc gggcacagcg ggcgccgcgg gcaccaccgc gtcgctcatc 7440
aagtccgagc caagcgcgcg gccgtcgttc agcatcgaga acatcatagg tgggggcccc 7500
gcggctcctg ggggctcggc ggtgggcgct ggggtcgccg gcggcactgg gggttcaggg 7560
ggcggcagca cggcgcagtc gtttctgcgg ccacccggga ccgtgcagtc ggcagcgctc 7620
atggccaccc accaaccgct gtcgctgagc cggacgactg ccaccatcgc gcccattctt 7680
agcgtgccac tctccggaca gtttctgcag cccgcagcct cggccgccgc cgctgctgcg 7740
gccgccgctc aagccaaatg gccggcgcaa tagggacgcg ccaatggccg ggacccaggg 7800
tccggcggcg gcctcgagca acaaatgcac ctccaggctg cgcgccctgt cccaagcccg 7860
gtcccggtcc cgctgcccaa tcctggactc tgcctctccc caatttcctt tcccctgagc 7920
ccccaacgcc taccttccgc ggcctccatc ccctcgcgca cacctaagct ggtcgagcaa 7980
actcaccgcg cgcccgccgg ggatagcttt ccatacaggt aaaaccgaaa accgaatttt 8040
ccaaaaatgc accccgacgg cgcctgctct tagtaccg 8078
<210> 13
<211> 495
<212> DNA
<213> Homo sapiens
<400> 13
ccgcgccctg gaccatccgg gcgtagtccc ggcagcaagg ccttctttcc ttgctagcct 60
gggcctgccg cagacagacc ccagagggag ccgcgcccag cccgctgggc ggccccggct 120
tcccgcgacc ccctccagac cctgggcaga aagagcgccc tgctgtcccg acagagccac 180
tgtgcttttg agggatcctg acacctagtg gctcccgctc ccttctccga agagcaccgg 240
gtcctatctg agcattcccg cgactcccag cccctgatcg cagctaagac acccattcgc 300
gcacccggct tctcccacat cctcgtccca ggggttcagc tgacactggt agtcgcctga 360
gctgtactct ttggggccca ggcgccttgg cgggagctca ccctccctgt ctccccagct 420
gaccctgccg cgcccccttc atctccgcac gctcccaccc ggccccctcc acaggctgtc 480
cagccccgcc cctcg 495
<210> 14
<211> 1192
<212> DNA
<213> Homo sapiens
<400> 14
tcgggcctcc gctcgacgga ctgccttgtc cactctccgc ctgggaacgg gggttcgtgg 60
gagcgcctta gtggaagttt gtggagctcg ggaggtggca tgcacaggcg cctcggagcg 120
cggccccgag gggcgccggc aggcgagagg cctgcactaa ccggccgtaa gcacagctct 180
tttgtactct gttttccccc taaagacatc tgatgccccc agtgaagaaa agccaacagc 240
agcaaagcct gatggagagc atgcagcccg ggaagcccag tgactgggag ctggagggca 300
ggaagcacga gcggcccgag agccttctgg caccgacgca gttctgcgcg gccgagcagg 360
acgtgaaggc gctggccggg cccctgcagg ccatcccgga gatggacttc gagtcctctc 420
cggcggagcc gctgggcaac gtggagcgct ccctgcgcgc cccggccgag ctcctgcccg 480
atgcccgcgg cttcgtgccc gcggcctacg aagagttcga gtacggcggc gagatcttcg 540
cgctgcccgc gccctacgac gaggagccgt tccaggctcc ggccctcttc gagaactgct 600
cgcctgcctc ctccgagtcc agcctggaca tctgcttcct gcggcccgtc agcttcgcca 660
tggaggccga gcggccggag cacccgctgc agccgctgcc caagagcgct acgtcgccgg 720
cgggcagcag cagcgcctac aaactggagg cggcggcgca ggcgcacggc aaggccaagc 780
cgctgagccg ctctctcaaa gagttcccgc gtgcgccgcc agccgacggc gtggccccac 840
gcctctacag cacgcgcagc agcagcggcg gccgcgcgcc catcaaggcc gagcgcgccg 900
cgcaggcgca cggcccggcc gccgccgccg tcgccgcccg cggcgcatcc aggaccttct 960
tcccccaaca gaggtcccaa agcgaaaaac agacctattt ggaagtaagg agggtaaagt 1020
aaaaccgaac cgaaacccac agcgtcgacg gccccaggcc tagatctgca ggaagcatcc 1080
cgagttctcc tagcgtggag aggagcgggg ccgggccagg ctagggggcg gctgcgcgag 1140
ccgtcggcgg gtggaggcgg agggagagca ggggcagccc ccgcgccctg cg 1192
<210> 15
<211> 1001
<212> DNA
<213> Homo sapiens
<400> 15
cctgggaaga gctgctgggt ggggctgtgg ctgccagagt ctttcccaaa ctagcacaga 60
acctgttttg caaccctggc agggtggagg caggatccag gccaagagct ggtcagcagc 120
tgaccccgcc cctgcctgac ccctgcccct tccactgccg aagagcccct ggcaaatagt 180
gtaactcaga tcgtagaggg tgcagattgc tagaactcag ttccagaagg tttctccacg 240
ataatgtcat gacttaagta cacagttttt ccatttttgt ttcgtaactt gattttttaa 300
agcagtcgct acagaacaga atctagacct gtattttata gcatagctgc ttgcatgtat 360
ttttcaagac ttttctttcc ctcagagtga tgtttgggtt ttgttttttt cctgggaagt 420
tggtgggggt gggagctaca tagcccacct ctttccccag taagattctg gtccctagga 480
agaggggaaa acagctcggg cggctctgaa gaggaaatct caggccctag atgctacagg 540
tcattgttag caaccccagc cgctcccagg aaaccagcca gcagcagcgg agggcagggc 600
tgggcgggca cagggtcccg actataccca gtttgcagtt cggcccaccc ccagcaccag 660
gaatgcccct cccaggctat cgctcctctg caggcttccg cagctcccca gcccctgtgc 720
tcctggagcc tgcctgcctc ctgcccgcct gcgtgactca ctgagggccc cctccctatc 780
tttcactttc acccagcacc cagaagggga gtaatttcct cctccatttc cttcctcagc 840
tcctgggcct tgaagagagt aagagaccct cctcgtgtgc agcctttgtc ttttcatata 900
tgaagctgga gggagggaga ggcacagaga ctaggagggc atccaagtca ccctcacccc 960
cagcaagagg ggagtggggg gatttggaca agaagtgcag a 1001
<210> 16
<211> 2001
<212> DNA
<213> Homo sapiens
<400> 16
taaatgagtg aatgaatgaa aattatttta tttttatttg agctttggtt ctgccatttg 60
ctagcagtgt gactcaagag aagccagtaa cccccctgag cttccctagt tcacaaaatg 120
cttgtcatga agtcgacagc ttccggaggc tgcgaggctc gcaagaaatg cccacatgaa 180
tgtgcgctta gggcgtgagt gctcactcca gaaaactcca acacagtgaa aaggcagaag 240
cggtgttttt cttttttaca tttttataag aatatataaa aaatgatata aatggacatt 300
tacggtagtg ggggaaggca tatatctacg ttaaaaggca ggacattttt aaaagctcta 360
ttttctaaat gaaaactacg aaagcggggt gggttgtggc gggggcagtt gtggccctgt 420
aggaccttcg gtgactgatg atctaagttt cccgaggttt ctcagagcct ctctggttct 480
ttcaatcggg gatgtctgca gagggcagaa agaaaacagg cgttagaaac ctgaggtcaa 540
agatgtgtgg cacatcccgc cctcctctct tgccgtccct accggcattg aaatacttat 600
ggataaagtt ctcgcaatgg cttcacgtgc atgtacccgc cgccaccgct ctcccacacc 660
tccctggtcc agcagctagt ccactgcccg cctggctgct ccaggcgcgc cgaccgctca 720
agcgctccag gtccacccgg cggagggcag agaaagcgcg accgcgcggc ccgcagggtt 780
gcaagaagaa aacgagtgtt atataatgag tctcagtggt tgctcacaat gccaggcgcg 840
aaggcgtgaa gatgtggcct ttcccttccc gcatccccag gcatcttttg cacctggtgc 900
ggagtgagcc agccagcttg cgataaccaa agggcgcctc aggctctggc gctcctcggc 960
ggaatcccgt agcttcccta cgcatgcctg cttctacaaa cccacaaatg gtttccgatc 1020
atttctgaaa caaaatggat gctcatttat tcatgtgctc tggcttctgc cttcctctct 1080
aatctcgttg cgtatgggct ccagctcgcc gttcggttct cccgaggcag catttacact 1140
tgagagtctc aagattattt tattcctgag ggagcatttg cacttgaaag tctcttttta 1200
cgtttattcc tgaggcagca tttgcacttg agtttctttc tcccgtagct tgcattagat 1260
tctccgacca ctctttagct tctcctccta ttcacacttc atatttaccc attgcattgg 1320
ttttataaac tcgctctctg aaaatagatt gttatcttcc ttaacgtctg tttcccaggt 1380
cgggcaagat agcttgggac tgtaatccca gtactttagg aggaggaggg gggatgatcg 1440
cttgagccca gataacatgg tgagaccttc gtctctatta aacaaacaaa caaacccagg 1500
cgtcgtggcg tgcacctgtg gtcccagcta gtcgggaggc tcaggtggga gaaccccttg 1560
agccagggag tttgaggctg cagtgagctg tgatcgcgcc actgcactcc aggttgggca 1620
acagatcgac tctgtctcca aatgtaaacc ccatgagggc aagactcttg tttggtctca 1680
ttcaccttgg cgtgcccacc acctagaaca gggctgatca cgcagtagaa tctaaccata 1740
taattaattg tgcttgaaga gggggtgttg gggagtaaga gaaggaaggg aggagggaag 1800
aaatgaaaga cttgtgtgtt tggattaaat atattaggtt tggttaagag tcgttcagtt 1860
tattcatttg cttgtggccc aattcagtag ttttactccc tctcccactt ggctcctcag 1920
gctttttgct cagccctgga accgcgctgt aattggcagc tccttctaaa tcgggacccg 1980
gatgctagct gtaactggag c 2001
<210> 17
<211> 1834
<212> DNA
<213> Homo sapiens
<400> 17
tcgctccgga atggggaagc ggctgcgccc tggacggaga ggggcgggga cttcgcgact 60
gcaggcggag ggagggcggg tgtcgctggc gcaggcggtg acagggagac accgccgcca 120
ctgagtattc ctatgcaagt ttcttcatct tcctgtgcat cagtgtttac actggggtaa 180
tgataaatgc tgtgttgaaa aattatttga tggggccatg gaaggaacgg aaggaacggc 240
gtcctggccc gctcggggcc cgcgcacgcc gccaccaagc cgcgggggcg ggtcggaggg 300
gagagttgcg tcagccaggc cgctgtcaga tgacgagccc ggggcgtgac ggggtggagc 360
atccccaaaa aagtgcatgc ctaggatccc gcccagtgta tccctgcgcg cggcgggccg 420
ggctgggcag ctttataaac agccgtggtg tgagcctcga agggaaccat cagcgcctcc 480
tgtccacgga gctccaggtc tacaatggca gcggccgcca gccccgcgtt ccttctgtgc 540
ctcccgcttc tgcacctgct gtctggctgg tcccgggcag gatgggtcgg tgagttcggg 600
gatgtagcct aagcagggcg ggggccaaac ctgggaggtt gtggactgca gcgggtttca 660
gaggagggga ggcttctgga aggaccggcg cgatctccct gaacgaacat cgcggtctcc 720
ccgaacgtcg cggtccctcc gaacgtcgcg gtctccccga acatcgcggt gcccccgaac 780
atcgctgtct ccccgaacat cgcgatctcc ccgaacatcg tgatctcccc agacatgccc 840
agctgaaggc actcagttcc cctcggtggc tcctttccgc cgggtccgct tcctgcggct 900
gctgcttgcc cctcaggcca ggaggtttct ggaaggaccg gtgctgtctc cccgaacatc 960
gtggtctccc cgaacatcgc ggcctctccg aacatcgccc tctctccgag caacgcgatc 1020
tccccgaaca tcgcggtctc cccgaaaatc gcgatctccc cgaacattgc catctcaccg 1080
aacatcgcga tctcgccgaa catgcccggc tgaaggcact cagttcccct ccgcggctcc 1140
tttccgccgg gtctgattcc tgcggctgct gcttgccccg caggccagga ggcttctggt 1200
agcaccggcg cgatgccccc gaacatcgcg ttctacccca acatcgcgat ccctccgaac 1260
atcgtgatcc cccccgaaca tcgccgtccc cccgagtaac gcggtctccc cgaacatcgc 1320
ggtccccccg aacatcgcgg tacccccgaa catcgccgtc tccccgtaca ttgcgatccc 1380
ccgaaacatt gcgatctccc cgaacatcgc gatctcgccg aacatgcccg gctgaaggca 1440
ctcagttccc ctccgcggct cctttcctcc gggtccgctt cctgcggctg ctgcttgccc 1500
cataggccag gaggcttctg ggtggaccag cgcgatctcc ccgaatatcg cggtctaccc 1560
gaacatcgcg gcctccccga acatcgcggt ctccccgaac atcgcgatcc cccagaacat 1620
cgcggcctcc ccgaacatcg cggtctcccc gaacatcgcg atcccccaga acatcgcggt 1680
ctacccgaac atcgcggcct ccccgaacat cgcggtctcc ccgaacatcg cgatccccca 1740
gaacatcgcg gtctccccga acatcgctgt ctccccgaac gtgcctggct gaaggcactc 1800
agttcccctc cggggctcct ttccgccgag tccg 1834
<210> 18
<211> 597
<212> DNA
<213> Homo sapiens
<400> 18
acgagtgcgt gcgcttgatc tggtttctgc tctctgggag gtgagtggcc gtgcggggcg 60
gtggcagctg gcgacacctg cgggctgttg ggcaccagcc cggggcgggc gctcgcacct 120
gtcgggcgtg cacaaaggcc cggcgcacgc tgtgggggcg gggcctcccg ggttggccaa 180
tgaaaagctg gcactgggtc ggaggcgcca gccaagtggg gggcggagct tccaccaccg 240
gccaatgggg atctggcttc gggatgtggg cggggtccac ccggtcgcaa cccgttgagt 300
ctctgcacag ctgccgcgct gacgcgtttt ccgcgtgtcc cgagccccgg cggccccgcg 360
agctcggtcc gtgcggggaa agcagggctg acgccgtctg cggagaggac tgcgcagccg 420
ggcttgtgtg gggccgcgcg taacggcagc ggctactccc tgcccaggcc ggccagcaca 480
gggccatggc cgaggcggct gcgcctccgg taagggcgac cctcatggag gcttggggac 540
gtggagccga gtcctgaatt cgccaggagg atgttccacc ccccaccatc tccggcg 597
<210> 19
<211> 481
<212> DNA
<213> Homo sapiens
<400> 19
tcggatcggc ctcccacgcg aagcttgctc cccaccagca tccccacgtt ggtggcgacg 60
ctgccccggc cccacggata cttccgcgcc tgtcagactc cctgatgaac tacccttccc 120
agagtaccgc gggagctcgg gctcctgagg gcgacggtcc tctgatggca gatgcgggag 180
aaactctggc gtcaggcggc cctcgcgtgg agcacacgaa gtcgtggctt attctggctt 240
cagtatgtgg ggtggagaag gcgatccacg cagctgcgtc tatttcctgt ggatcaatcg 300
caaaatacgt tctgtaagcc ccgcccccac tgcgtgcggg cggcttttgt ctccacggca 360
accgtcaact ctggaaacgc ctgtctttct ccatggcaac tgtctacgcc gcaggctgga 420
gctgcccatt accggagccc gtaagcagta tgggtgctgg acaaacagcg tgatcgggtc 480
g 481
<210> 20
<211> 1001
<212> DNA
<213> Homo sapiens
<400> 20
gtctgtgttc cttttcttaa ctgtaagaag aaggctctgg tttcttcagg ttataatttc 60
attaaaataa ttttattgtt ttctgacctg aaaaaattca gaatatgtat atctgcttga 120
tattttcttt tgggcatctt ggtgcaacac ttaaaatcta tttcattttg tagtttggga 180
gccataattg cagcttcacc aggcttggtt cttcttggcc cgggcccttc ccttcccttg 240
ctggttagta ccagccgagc tggtttgctt tttccctttt tggtactatt ctcctcctcc 300
ttcctccacg ttaccttctg ccacggcctc tcttcttttt ccctccattt tcaatttaca 360
cttacatttt ccctcctcct cctggccctc cctagttttt cccctcccct ggtttctagc 420
tcctttttgc tttctgtttg tgttactgag ggcagtgctc caattacctc atatttggag 480
agaggaagct gcagccaatc cggtttctgt ctgcttttag gtcaagtgat ttctgaactg 540
cagtgagatg ctttgaattt gtcttgttgc agctctgagc ctgtaagatg gctgtctgaa 600
tcggcagcgg ctggaagaga cagagagagg cggggaggga gggagaaaga attggaggga 660
ttgccggcat agtgcatgtt tttaaatgtg catcgaatcc gatgaggcca aggttgggat 720
ttctgtggga tcccaggact ggcttagctg cgtttttgct gagattagga gaggaaggaa 780
atgggaaatt cactgggctg ttttaaggag ccgaaagagt caatagctat tcctgagaag 840
gctcccatat ctcctaagaa aagggttcgg ttcaaaagga ggtggagagg gaagaaaatc 900
cctactccag aggcatctca ccaggaagaa acctcagaag gaactggagt cattgaagag 960
actgaaaccc taacgaagtt aacagagagt ctccaaaagg a 1001
<210> 21
<211> 206
<212> DNA
<213> Homo sapiens
<400> 21
acgccaccgg tcgaggacgg caggagaccc ccgagtgcag agaaagctca aaccggcagc 60
gaagtcggtc ctagccaagc tgaaaaaacg tctcggattt cgcggacagc ggcctagaca 120
cagcccgatc ttccagtcct agtgccctgg tcgagacggt tctatccttt tgcaaagaag 180
ccggaaagag ctgggtcccg ggggcg 206
<210> 22
<211> 2001
<212> DNA
<213> Homo sapiens
<400> 22
acccttgtag gccggatgcg gtggcttacg cctgtaatcc cagaactctg ggtggctgag 60
gcgggtggat cacctgaggt tgggagttca agactagcct gaccaacatg gagaaaccct 120
gtctctacta aataaataca aaattagccg ggcgtggtgg cgcatgcctg taatcccagc 180
tactcgggag gctgaggcag gagaattgct tgaagccggg aggcggaggt tgtggtgagc 240
caagctcgcg ccattgcact ctggcctggg caacaagaga gacactccat ctcaaaaaaa 300
aaaaaaaaaa atagaacaac ccttctaaat gtaatccaca gctcactcac cttagtccac 360
acaatgacca ccacattttg gatgtctcca ttctgaagca ctccccagat ttccagacct 420
gggtgttcag ccacctactt aatgcctact taatgtctct gaaacatctc aaactcttac 480
atgaccaaat aaagctcctg ttgtctccag tgaatattac tgttaatacc aacttctcca 540
tctcagttga agaaccatgg ggtcatcgct gaatcctgtt tcactccctc gctgtctaca 600
tcagaaaatt tagttgctcc ctttaaaaat ttgcatccag aatgcaacac atctcctaat 660
caatgactct ggtccattac cctggactgg ctgtagcttc cactctgatc ttctttcctc 720
ttccctcaac cccacagtct gctctccacg ctaacgggat ggaccctgtt aggactttgg 780
taagatcacc tccctcttgt aacccaaatc tctcattacc tccagaatag gtacccaact 840
tctcaggcag ccactgcagt cctgactcct tccccctgct ctttgttccc agctaaaagg 900
aaacagatct atggtttcct caaaaatctc agcttagttt tactaagcac ttgcgcctcc 960
tgataccagt gccagagata acctttcaca agtttccact ggctgacaaa aatgggaaca 1020
cctcagtata acccctgtaa cctctggcat ggacttaaga gccctgggct tggaatttct 1080
ccagggcacc agacccagga ttggggtaac agcacttaag aatactagga aaccacaatc 1140
ccaagaacat gggggtagag gctactgagg gaccgaacac tctccacttc cctatgtgag 1200
ttccatacgc ccttctacaa ctgggagaac cagggaaaga ggaatgcatc cctggtgagg 1260
ctagatgagc tcaagcctcc ctgtagccct gcctggccct gaactcaggc tggctgtttt 1320
actttctggt ctcagtgctg tcacctcttg ccaactgtag ggcaatgaaa aaaagatgta 1380
gcctcccact atctcaatgt cctcatcgcc ccatcgctgc tcttcctgtg aacagtcttt 1440
ggaaaagttt ttaaacccta acatagggcg ggcacggtgg ctcacgcctg taatcccagc 1500
actttgggag gccgaggcag gaggatcact tgtcaggagt tccagaccag tctggccaaa 1560
atggtgaaat cccgtctcta ctaaaaatac aaaaaattag ccggacgttg taatcccagc 1620
tgcaggcttg taatcccagc tgctggggag gctgaggcag gagaatcgct tgaacccggg 1680
agtcggaggt tgcagtgacc cgagatcgcg tcattgcact ccagcctggg cgataagagc 1740
gaaactccgt ctcaaagaaa aaaaaactaa cataaatggc gtccctcctt tgttcagaac 1800
tctccgtggc ttctagcatc ctcacaatga cagtacaacc ctaggagtaa ctccgcctca 1860
tattcttcgt tccctgcaga aaacagcttt ccgaattctc ctggctcagt cgcgcctcaa 1920
cctttgcacg cgccggttcc tccgcctgtc acgctctccc acacctcgtc acacgcagtg 1980
tcaaaaaaag ggccccaccc a 2001
<210> 23
<211> 561
<212> DNA
<213> Homo sapiens
<400> 23
tcgcccggct caaccccgac gtccgcgccc cggccgcctg ttggccatgg cgggcctggg 60
cctgggctcc gccgttcccg tgtggctggc cgaggacgac ctcggctgca tcatctgcca 120
ggggctgctg gactggcccg ccacgctgcc ctgcggccac agcttctgcc gccactgcct 180
ggaggccctg tggggcgccc gcgacgcccg ccgctgggcc tgccccactt gccgccaggg 240
cgccgcgcag cagccgcacc tgcggaagaa cacgctactg caggacctgg ccgacaagta 300
ccgccgcgcc gcacgcgaga tacaggcggg ctccgaccct gcccactgcc cctgcccggg 360
ctccagttcc ctctccagcg cggccgcgag gccccggcgc cgcccggaac tgcagcgggt 420
agggaggccg ggcccgcagc tcccctggct cccccgggct gcccgccgcc tgaccctttc 480
ccatgtggct cgaacccctt tcctcagccg ttctactttt acgttccttt tctcagtcta 540
aaagtcgagt tccgctcttc g 561
<210> 24
<211> 2001
<212> DNA
<213> Homo sapiens
<400> 24
gaaagttcct ctgttgctct gggagagggc gggggagagc aggctcgaga gccaggctcc 60
tccgaggctg gtcttgaggc acttctctag tagcttctcc aaaagactga gagtgccggc 120
gtaggtatga cagtgagggt acctcacaga cccttctcca aagtctggcg ggccttgggg 180
tttttcgggg ccaccaggct cggtggaatt tttgaaacgc tttcgaaata catagtttcc 240
tctgtggagt gagtgcctac aacgcgcagg ccggactgat cccccgttgc tgcaggttgg 300
tgccccaagc tgcgggtgct cgggcgccaa ctaaagccag ctctgtccag acgcggaaag 360
aaaaatgggc tgtgaaaaag caaaaggcct cgtctttgaa tgaaagttaa acattaaaat 420
ctgaccctag agttgtctaa agatcgcgga attttgaagc tccggcagag cggactaaaa 480
aacggtgcta tgagagatgg tgagaatact ctaggcatga acgtgtgcgt gtgtgtttgt 540
gtgtgtgtgt gtgtttcatt cttcccgcaa aacaattttt tgtttttttc ctattcccgg 600
tttgttatcg gcctagggcg ggagaaccac gcagcggctt ctgggcccta aggacaaaag 660
agttaaaaca atgaggctca cccgggaaga gacgctgccc tgggcacaat agggtcgcct 720
gcattactcc tccatacaca catctttaaa tgtgtccctg tgtgtgttcg ttagggtgct 780
gtattacaga aaaagaaagg cctaaaaaca cccccagccc tggtcgcgcc tttcgctacc 840
gcctgagtct ggagccgaca gctccacctc ttctgctccc tggaccgccg cgtctccacg 900
ccacggcgcc ctttttacta aaagatcttt tctcatccta tcagcaaatc gttaagaaag 960
gcttagccat tgcgggggct ccaacttaag gattcccccg gcccactaaa aggctaggcc 1020
cggcctgtag cccagctccg cagaaagcca gagggtgctg ggctttcagc ttcttcctcc 1080
tagacacttg ccccacaaat atatttcgtt ttctctaatc caaataccca tctttttctt 1140
ttttaaaaaa tgataacgta atgggaaatg accaaccgaa ctctgttaca taaagttagt 1200
tctgttagat cttccacccc acccccatcc cgcgggagcg agtaaataga attcatgagc 1260
ttagctcccc aggttcacgc tctggaatgg tttctttttg cctcattccc taagttttct 1320
ctcttctgcc tcctgaatgg agctcaggct aaggagaacg gcagaaagag caaactctga 1380
tctgaatctc taattatgac cccatgtatt acccatttga acataaggcc ctagacgggc 1440
tccgtgcgat ctggggcctc ccaagagaaa acttccccgg gacaggacgt ctgccacgcg 1500
cagctaaaca acttctgttt tttccgccgt ggggaaaata aaagaacctt acaaattcta 1560
aggcgtcata acccctgcaa gaacttctaa ctgtatgaag gcccacgcga gattttgaca 1620
atagataaat gagctgagga aatagggtct ggccagcgaa gggaaacaca cagtagccct 1680
gggtgccttt ctggaatgcc cacgcagggg tccgcgtgga caagcacttg cattcaaata 1740
caggaaaagg cttggacggt cgaaataaat ctccttttaa ttttcttttc atcgactaat 1800
aaaaataatt ccccagcact aaactcaaat accgtaacgg gccacaaaaa cacggagaat 1860
tcataaaact ctatctctgc aggtcacccg ctaatcgcat tattattagc ctcgggagca 1920
tggaaattga actgtcactg cctaaagaga aaatgtaagc gacagctgtc cctcctctga 1980
gttggacagc tttgtggctg a 2001
<210> 25
<211> 2001
<212> DNA
<213> Homo sapiens
<400> 25
gggcagaaat gaaatcaact gtggcaaggc cttggctgct ttcacggagg agtttttctg 60
cgccagtgtc tttttccttc cctttaaaat aaaattaaaa atagcaagca cttctcaggc 120
attcatcaga gatagataga tgcacgagga ttgagtgggc attttcataa agaatgaggc 180
cggctgttat agaccggcgg cctagcagat gaaaacttaa ttagcgtgcc tgtcctaaaa 240
cctaggcata aatctccctc tgccttttgg ataacgctat atctttgctt atgagaaatg 300
ggatgtgagc aactcgctgc acatttctct gattctccag gtcttggtcg gctgacacgc 360
attcgatcaa gtttaaagga atgcgcataa atcagcaagc ccctagcgtc tccttgggag 420
aggtccgcaa atccaggagg gcgcctctga acccaccggg tctggggatt agcagtccag 480
ggcaacctcc gtctctgctc ctgaactcgg gaattcacag aggaagcaag acactgcatc 540
ttcaccaagg cctccaaaca catgcagcag agtgcaatct gcacttacat gtattacaaa 600
gtgaaatctg tgtcaactct ccgcacacaa atgttgcatc tgcagctgaa tttcactgcc 660
tagtggtgaa tttttaagaa aagatttcaa ctaggttgtt ttaatttttt tcttcccttt 720
tctgttaatt ttttttaaaa acccacaact tgaataactt gaatgggtgg cttcagctct 780
gcatcagtca caaataggag tgaaatgcat agcgacattt aacaatcatc cacttaaaat 840
aagtaaataa atatgatagt actgagagca gatagaaaaa gtagcgtttt tttttaaagt 900
cccattttta ttttcttaat tcaggaagag ttttcttttt agaaaaaaat actttaatca 960
ggctttcaac aacattatcc atgggtcagt ggctgatact attattccta tttttcagga 1020
ggtggctggt ctctccttga tttttgtttt tgtttttgtt tttgttttaa ggttttagac 1080
tgattgctat ttgggcatta aaggagccat aataaataat ccatgcccac tttaggttat 1140
ctggtagatc cacagaaatt ttaaatagga ggagagttag gtaagatcga cactatcaat 1200
gaccatttta gaactggggg gaaaaaatcc ccacaacaac cctgaaatgt cttctgtcat 1260
tacagtttca aaaactagag agagaaaaaa agaaggctac tactttaccc agggttcctg 1320
tagtggtgat ggctttcgaa aggggcggga tcccggctgg agagctgctg ttggcctcct 1380
tcctaggctc gaggctcaga atatttctta catctaaaga aaaatatccc ctgtcaacag 1440
aagagtccct tttggagctg ttcttaaaca cacagtttga tccagctttg aggggatttt 1500
ccaccacttt aaacattttg ggagaaagtt gttactttgg cttgatggca gctcatttgg 1560
aaatggagta ctgtttggaa caagaggtgg agaggtgggt ctgaagcaac attatcattt 1620
gtttccacaa gtggagtgaa aatcctcagg gcagcaaaat ataattgaat ttctcgagac 1680
ctttcgatat gtatgtttca acaccagcct gtttttgaga cagctttaga gactctttcg 1740
taattctcat ctataaagaa gttgtgagtc ctcaggagag gttggagagg tttccggcag 1800
ccacttttgt aaccaatcaa tattattttc cataaaatga tgaatctggt tcttccattc 1860
actattactt tcctctaacg taaagataaa attagcctgc atctcacaat tctgcatccc 1920
acggctactg attccaccaa cattttaata catatgcgca tagcatagat ttgacaaaaa 1980
cacattatcc tatgtgtata t 2001
<210> 26
<211> 516
<212> DNA
<213> Homo sapiens
<400> 26
gcggcatccg ggatctggcg ccgcttttgc gtcaggcttc tgcctgagct cggttagggc 60
ctcaccgacc tgcttccacc cctcagggag gcctcagtga ttcggccaca gcctcagcct 120
ccgtcgctct gtgacctgcg ggtattggat gattcgtagc taagactcta cgacatccct 180
gaagccggga aatggtgagt gtgccgggca gggcgtccgg aggcgacgtg gcggggaggc 240
cttatcggaa ccagcgggaa atggcggcag cggtacccag tctgcgaacg gagtccccgc 300
tgccgccgct cagccctcgg tcctcagtcc cctccggtga gggacccgcg ctcctgtcgg 360
gggacccgcg ctcctgtcgg ggtccccgca aggctgctct ggcccagcct gcagccctcc 420
ttgtgcagtt ttgcgcccgc agccccgcac cttccccggg ctgtggggtg aggagtagct 480
catctggaag acgcctgcgt cgcgtgcgcg atgccg 516
<210> 27
<211> 329
<212> DNA
<213> Homo sapiens
<400> 27
acgaacgcct cagtgtcccc gaccctgggc agcggggact cgagcaggcg cccctcactg 60
atggctttag aacgtgggtg ggggaaggtg tgtgaggacg ggaagacgcc gcactcacct 120
gagttggcgt cctcagagtg gccgctgcca tcagactctg cgggtagagc tgggccggga 180
gcgacgggcg acattggtag ggacccgggg acagcggtcc ctatcccagg cctgacgtgg 240
gtcccccagg gcggcgtcgc caaggcttag acgctttcgt gcaggaggga cgacgactcc 300
cctcacgcct tcgtggcccc aactcggcg 329
<210> 28
<211> 4240
<212> DNA
<213> Homo sapiens
<400> 28
ccgcagaaat tactcgtgcg caccatttcc gctgtggggg cattcgtaca agtttccgct 60
gcacacacag cctcccgggc cctctcctcc aaggctctgc cggatcttcc aacgaaatcc 120
cagagcagcc tgcgctgggg agcccgcaag tctctccaga tctctgcacc ccgcaccgcc 180
cggaatctgg gacggcgccc acgcagggct gggccaaggg cagagctcgc accctgcctt 240
cacgcccggt tcacttgcgt ccacgaaagc agcgtgccgg cctcctccat cttcccactc 300
gcgcaacgca cggcgacccg cgcgacactt ctgcaatctg aaggcttgct tcttacaaat 360
aaagggccag agtctcacac ttgccttcgt tggagggact tagaagatcc tccccacgtc 420
cacaccttgt aggaaatgca aaacagatcg atgaaattaa acagttgcat ttggaagccc 480
cagaaagacc taaagacatc gtgccggttt gttggagaga gggttgcggg acagggggag 540
cgggccttac gcaacagaaa aggtgggcac agcgcgctca aaatgaccca gtgaggagtt 600
ggtgccgccg ggccagaggc tgcgagtcca gctggctctg gacttgctcc gcaggcgtca 660
gacgccgtgg gaacctgtgt ctgcttcttc tctccaaagt gtatcggtta aaaaaaaata 720
aaagtagtag tagtagtagt ggtaaggaaa aaaataaaaa taaaaaggag acacaattaa 780
ccaggtcata aaagctaggg caccttcgac cagggctctg gccctccagc gatcgttttg 840
cgttgtttct cttctcaaaa gtagtctcag acccctgcct ttccgctgca gctctgcgac 900
ttccccaaac tccttaatcc tgtaaattct gcaagaaact cccatcctgc aagctgcttt 960
tccccctccc ccctgcgttc cttttttctc tccccacccg cgccgcctct ctatgcccct 1020
ctcttctcag aaaaattcct gccccccgcg cgccccaaag cccgggctgc aaacttttcc 1080
ccgccgggcg cctctgcgcc agatgccgga gcgtctccac aaagcctgag catctgcaca 1140
agttcgcagc ctaactgcgg gataaagacg tttcccccgt agcttaacta gaaaagcgcc 1200
atcgatgggt gtgttaaacg ggataactag agatttcaaa caccttttat ttgcctgtct 1260
tgaaaaaaaa atctaaatga atacgcccgc taccaaaagg caaaataaaa ccaaccttaa 1320
gggtttttgt tgtttttttt ttttttcaaa agtggcgata gggactgttt ggacctgact 1380
ccaacctgcg ccctcccttc ctctatgacc ctcctgcgct tttcctggaa cccaaagctc 1440
tgacttcgtc aaacttacac aattaaaggc aggcggaaga acgcgggctg ggaagcaagc 1500
gggaagattc tagaatggaa gggagcccgc cgagcgccgc gagccgcgcc aggccgggtc 1560
cgatggagca ggcggggatt cctcccccag gcggaccccc gccaccagcc ctgccgggag 1620
ctcgcggcct gcggagcgcc cgggctggcc gctcaccgcc cgcttccccc agcgaacgac 1680
tcggggaagc tccaggaggc catctgtgct gacggttcac accagacagg accacttgca 1740
aggacaaaaa taagaaattt aggaaacgaa aaaagacgta ctggggcgag gggcgcgggc 1800
gcggcgacga cggggccggg ggcacatcct ggcggccgct cggggagaga ggacacgcgc 1860
gggaaggagc gcggcgggtg cacggccgcg ggtgggagta cgcgcctgtg cgcgcggggc 1920
gagggcgagg gcgcgtgcgt gtgaccgcgg ggagggggcg ggcgcgtgtg cggggagcgc 1980
gccgcgccag gggccgagtg tgtggggccg atccagaagt gcgcagcccc ctcacctggc 2040
ccccgtgtca tccccgaaat cccgggaaag ggtgggccgc gcgcgggagt ttggtggagt 2100
tggaactttc ggtcgcgctc gctgcccact ccgctggcgc ccggtggccc gtggtgaagg 2160
gggactaggg tggggaacac cggggccctg cggtcccctc cctttcctgt atttaagaag 2220
ccgccggcgg cgcagaggcc caggcgggct ggcgcggggg cgaggcggcc cggtggcagc 2280
agcgggcggg gcgggcgctc cggagtcggt ggggcccgcg ggttgggggg cggggagagg 2340
ggggagtgga agggaggggg aacgcagggg agggagagga ggggaggagc cgcgcggccc 2400
gcgccgcttc cgaaccggaa agttggtctt gccgaagtcc tgccaccccg gcgtgcgcac 2460
tccgctccgc tccggccgcg agcctccgag cccggccggc cgccggggga agcccgcgga 2520
ggggacgcgg ggccgggcga gaaggtccgg agagcggggg gcacctgagc ccgggcgggc 2580
ccgccgcgct gagcggcgct gagagccgcg gcggagcagc gaaggcggcc ggccgacccc 2640
gcgcgcccgg aacaggaggc gcggcgcccg agcggcccgg gcgagacaaa ggcgccgggt 2700
cggagccctg cccgcggccg ctcgctccgg gaggggccgc ccggcggcgg cggcgggggg 2760
ggcgcgggcg gcggcgcaga cactctataa aggggcgagc ccggcgcgcc ggcggagacg 2820
gcgccgcgcg gacgccgcca aagtttgctg cctgcgccct gcggagggac ggccaccgcg 2880
gcccgcgccg cacccgggcc ccgccacagc cgcacccggg gcggccgagg agcgcggcgc 2940
cggagcccgc gatgtgaggc ggcgccgggc agcgcgcgcc ccggtcccga ggcgccgcgg 3000
ccccctcctc gtcggcgcgg ccgctaattg cgagcgcggc ctcatttgca taggccgccg 3060
gagtccgctg gagcccggcc aatcggcgcg gccctccgct aatggccatg cattattcac 3120
cagcctaatt gctcagcccc atgcgcggcc cgcgcagccg ccgccgcccc gcgccccgcg 3180
ccgcgcgccc gccaggccgc cccgcgccgt ccccgccggc cgccccgctg atgccgctgc 3240
cccgcgcggg gcccgagcgc cgctagcagc atgtctcggc gcaagcaggc caagccccag 3300
cacctcaagt cggacgagga gctgctgccg cctgacgggg ctcccgagca cggtgagggc 3360
cggggctgcg gggtggccgg ggggtctggg gctgcccgtc cgggctgggg aagcgcgtgc 3420
ggcgggagcg gatgcgcgcg tccgggagcg ggagaaagtt ccctgcttcc tgcgggcaag 3480
cgtccgcccc gcgccaggcc ggccgcgggg ccccgggtac ttcgccggag cgcgcgcggc 3540
cgccgagaga gttgtgggcg aagtaaactt ggctcctctc ctcggagtcg gggagctgcc 3600
cgcgaagggc gccgaggccg cggccggctc gaggacggct cggaggccgg ggcgggaggg 3660
agtccacggt gcctccgccg ccgcgccgcc ccccagggtc tctgcgccag gacgctgagg 3720
ccggcggcgg cggggaaggc gaccgcagcc cacctaccgc tggacgcggg ttggggaccc 3780
cgccgcccgg ccagctttgt tcgggggccc gcggcccctc ccgggccccc gcaccgcctc 3840
gggtgacccg cggtgtccca gcgcgttgac gcagcctgtg atccctcgcg aggcgaggag 3900
aaggtcgggg gcttggctct gcctaatggc cgcccgggga attaagctgg gggtgagcgc 3960
agcggcggcg gcctgggcct ggcccctgct cgcggcgtgt ttccggggcg ttcgttgcag 4020
cgtctgcgcg ggccttttct ctcccgtctt tttggatccg ccgaggccgg gcgctggaga 4080
cctcggcttt gcagtcattt cgctggtagg agcgtcctct tcgaaacatc caagagcaaa 4140
gggcaggcgc cgcgaaagtt aagagactgg caaagggctg gacttcccag agtggcgcct 4200
tagccccgca aagtttgggg cgcccccacc cccttcgtcg 4240
<210> 29
<211> 2188
<212> DNA
<213> Homo sapiens
<400> 29
gcgcgcgcgg agcccgctga gacttgaatc aatctggtct aacggtttcc cctaaaccgc 60
taggagccct caatcggcgg gacagcaggg cgcggtgagt caccgccggt gactaagcga 120
ccccacccct ctccctcggg ctttcctctg ccaccgccgt ctcgcaactc ccgccgtccg 180
aagctggact gagcccgtta ggtccctcga cagaacctcc cctcccccca acatctctcc 240
gccaaggcaa gtcgatggac agaggcgcgg gccggagcag cccccctttc caagcgggcg 300
gcgcgcgagg ctgcggcgag gcctgagccc tgcgttcctg cgctgtgcgc gcccccaccc 360
cgcgttccaa tctcaggcgc tctttgtttc tttctccgcg acttcagatc tgagggattc 420
cttactcttt cctcttcccg ctcctttgcc cgcgggtctc cccgcctgac cgcagccccg 480
agaccgccgc gcacctcctc ccacgcccct ttggcgtggt gccaccggac ccctctggtt 540
cagtcccagg cggacccccc cctcaccgcg cgaccccgcc tttttcagca ccccagggtg 600
agcccagctc agactatcat ccggaaagcc cccaaaagtc ccagcccagc gctgaagtaa 660
cgggaccatg cccagtccca ggccccggag caggaaggct cgagggcgcc cccaccccac 720
ccgcccaccc tccccgcttc tcgctaggtc cctattggct ggcgcgctcc gcggctggga 780
tggcagtggg aggggaccct ctttcctaac ggggttataa aaacagcgcc ctcggcgggg 840
tccagtcctc tgccactctc gctccgaggt ccccgcgcca gagacgcagc cgcgctccca 900
ccacccacac ccaccgcgcc ctcgttcgcc tcttctccgg gagccagtcc gcgccaccgc 960
cgccgcccag gccatcgcca ccctccgcag ccatgtccac caggtccgtg tcctcgtcct 1020
cctaccgcag gatgttcggc ggcccgggca ccgcgagccg gccgagctcc agccggagct 1080
acgtgactac gtccacccgc acctacagcc tgggcagcgc gctgcgcccc agcaccagcc 1140
gcagcctcta cgcctcgtcc ccgggcggcg tgtatgccac gcgctcctct gccgtgcgcc 1200
tgcggagcag cgtgcccggg gtgcggctcc tgcaggactc ggtggacttc tcgctggccg 1260
acgccatcaa caccgagttc aagaacaccc gcaccaacga gaaggtggag ctgcaggagc 1320
tgaatgaccg cttcgccaac tacatcgaca aggtgcgctt cctggagcag cagaataaga 1380
tcctgctggc cgagctcgag cagctcaagg gccaaggcaa gtcgcgcctg ggggacctct 1440
acgaggagga gatgcgggag ctgcgccggc aggtggacca gctaaccaac gacaaagccc 1500
gcgtcgaggt ggagcgcgac aacctggccg aggacatcat gcgcctccgg gagaagtaag 1560
gctgcgccca tgcaagtagc tgggcctcgg gagggggctg gagggagagg ggaacgcccc 1620
cccggccccc gcgagagctg ccacgccctt ggggatgtgg ccggggggag gcctgccagg 1680
gagacagcgg agagcggggc tgtggctgtg gtggcgcagc cccgcccaga acccagacct 1740
tgcagttcgc atttcctcct ctgtccccac acattgccca aggacgctcc gtttcaagtt 1800
acagatttct taaaactacc actttgtgtg cagttgaagg cccttgggca caatgagagc 1860
cagtcctcca aactttcaga aagtttcctg ccccttctgg caggctgcca atcaccgggc 1920
gggagaagga aggaggggaa ggcggtggag ggagcgagac aaagggatgg tccctcgggg 1980
gcggggatgg cggggctgtc ctgtaggtct gtgcggccac cgtgattgcc cctctgcgcg 2040
gtgcccgaag tcccgctgaa acctgccgag ggcagcaggt ctgaaagctg caggcgctag 2100
ttgcgcggag gtggcgcagc tgctctggag gcgcagagcg aatacgtggt gtttgggtgt 2160
ggccgccccg cccctggcgg tttcctcg 2188
<210> 30
<211> 2933
<212> DNA
<213> Homo sapiens
<400> 30
gcgccggtcc ggagccggag cgcgggaatc actcgctgcc tcagcccaag cgggttcact 60
gggtgcctgc ggcagctgcg caggtggaga gcgcccagcc tgggaggcag tagtacgggt 120
aatagtagga gggctgcagt ggcagaagcg agggtggccg cagcacttcg ccgggcaggt 180
attgtctctg gtcgtcgcgc accagcacct ttacggccac cttcttggcg gcgggcgccg 240
aggccagcag gtcggctgcc atctgccggc gctttgtctt gtagcgacgg ttctggaacc 300
agattttcac ctgcgtctcg gtgagcttca gcgacgcggc caggtctgcg cgctcgggcc 360
cggacaggta gcgctggtgg ttaaagcggc gctccagctc gaagacctgc gcgtgggaga 420
aagcggcccg cgagcgcttc ttgcgtggct tgggcgccgc cggctcctcc tcctcctccg 480
cgacgcctgc cggcccgctg ccgcccccgc cgccggcccc gctgcacagc gcggacacgt 540
gtgcacctct ggggccaaca ccgtcgtcct cggtccttgg gctgcggtcg cctgcggacc 600
ccggtgggaa cagaaacaag agactgtcag cgccacagac gaggtgaggc cgggcctcaa 660
ctgcaggggt cacgggagtg gggcggaaat acactttgat cccactcaag cggagcggag 720
gtctgggagg ccctgggccc gggagaccag tcttagactc ttgccccact gggtatccca 780
tctaggcctc ttctggggag ggcggcagac tcagccgctg tgtcaacgct gtgttgtcga 840
gaccagctcc ccaccctctc tgggccccag gctcccctca gtaacttggg gcactcgacc 900
cgagcatccg cgaaagccct cccggctctc agcgttgagc attgggattc tagactgcat 960
ttccgtctct ctgcttgggt tcacgcgcct ctccacactt agttcacacg cacacacgcg 1020
cgcgtcctcg cagcacacac ttgtctggtg caggtaaggg aaggtggagg cggatcctgg 1080
ggccaaaggt atttagaatc tttcaccctc agccgcctgg gattgctgtg agagacatgg 1140
aaacaggctg agccgaggcc ttagatgaga ggatggactg gagagtaaag agggagggtt 1200
gcccctgcat cgagtttttg gaccctgatc ccacaccagc ttctcggtct cgtacccgcc 1260
cttccgaaga actccagcag aaaggtccag cggtcccctg tgcttgaggc ctacagaagc 1320
ttgtacccaa ctagggcagg cacccgggtc ttccagacca caggacagga caggccacgg 1380
ctgaggaggc ctctctcctg cctccaggat gaactaaaga cccaatccgg gatcttcggc 1440
ctagggctgc tctcccagac ctggggtctg agaaagccaa accagccctt tccccaaagc 1500
tctagttctg cagattctca gctctggccc actcggaggt gttcttcacc acctatccac 1560
ctactgtggg gcccggccct gggaccttga actggcaggt ctctggtcca gagctaggtc 1620
actggctacc tgaggtctct gaacccctca cttttccgct tccctgattt tggggatttg 1680
gggacagaca cggcagaaag cactggcgac gaactcaaaa actcccgaac gcaaggggca 1740
gcggttctcc caacccagtc taatgcacat tggcccagga tgtctcaggc ctcaccccag 1800
gacgtagggc tctgaggagc tactccggtc tctcgcgggc tcagttcccg aagtgataga 1860
gcagctcgcg ccagagcgca gaacttcggg atttggccag cctccgagcc ccagggcgca 1920
gggtgctcaa gccgaccacc ccactcggcg tggttgccct ccgcgtccat cccctcagcc 1980
cggcccccat ccccgcgaag ccgcagcaga cctgagacgc tggcggacat ctcgctgtcg 2040
ctccggcccg cggcttcctc ctctaggtct ttggaagcgg ccagctcaca gaccggctgg 2100
ccgaggctca aggatccccc cgcaaggccg gccccgctgg ccccccgcgc gtccgcgcag 2160
cgccgcctgc tctcgttctc ctcgctgagc gcggagtccg agtcccagcc ttccgggctc 2220
tccgcagtcc gccccgcagc tgttctggta ccggcaggag acgccagcag agagtcctcg 2280
gcgcccccca acgcgcccgc gtccctctcc ccaaagagcc gccaacagca gacagcggga 2340
gccgcggcca ccgatgccgc tgtgcccccg ggcgccgggc gcccctctgg cgcggccagc 2400
ccgccgcgct cctctttctt gttgaggatc gcctggatgg agaaggacgt caaggtgttg 2460
gcgccgcgca cagccatctg cgccgcgggc aggagcggcc ggcggggcgg gcagctgggg 2520
cgccgagcag ctccgagcgg gacagagagc gccggcggcc gcagcgcgag tgagctgggt 2580
gtgcgaggcc gccgccgccc actgctgcgc ggcccagcag ctcccgcccc actccgtccc 2640
aggatcagcg ccgaccctcg cccccacctt agaggcccac cccgcccgga gaccccctcc 2700
ccccgaatcc agagccagac gctctccttt cgcagctcag ctggattatc tcatcgcttc 2760
tcgcccttag gggcgggctg gggtctgccc cctcggggga cgtgaaggag gattggcggg 2820
ggcccctccg tggcagcagt cccctcccga gcgccgccgg ggcgcacagc ccgagtcact 2880
ttttctttgc gcgtctgtcc cttcctcgcc tgcaggattt cgctcctggc ccg 2933
<210> 31
<211> 2001
<212> DNA
<213> Homo sapiens
<400> 31
agtgtcacat caacaaattt acacatcaat ctaccgcagc taacttcgta acaatgggag 60
aaacattcag aataatactg agcatcctac caagggtctg aaaaattgaa ttcaaatact 120
ctgtgtgtaa aatgcctaga ctctgtcatt ccagcacatc tatgatctga tctagcaagt 180
atatcgttag actacaaatt acctttttcc tatgacgtgt aaaactccat taaaaatgaa 240
ttcttcctaa taaagttttt tatggcgtct aaaattgctg tgaatgttac accttttaca 300
atcacctttt agccagaaag ccattatttg tagaatcctc ctgtatttca gttatttgtc 360
acctatttag gctgggccta atagcaaaac tgtcccccgt tactgaattc agagaattat 420
tcgggcacac gatttatttc ctatcttgat tagactcctg agcccgtgcc ccagcctctc 480
gctaatctcc ctggaccaga caactccatt agaatctggc acccacgttt gttctgccta 540
acactgcagg aaggacagag acttcaaagc acgtgtttgt ttttttgttt tgtttttggc 600
taccaagaag ccaaatttct gtatcctcta ccattcaaaa ccccaattca acaaatttac 660
acgggggttt ttcctccacg ttaagcagtt agtcgggtac tagagataca catataaaac 720
acagactctg ccctcaaaca acccaatgag cagaaaattc tcttaggcac caaaacgctg 780
taatagattc aagtgtgtag aggagaagtt tggtagagtg gatatgacgc tttctttctt 840
tgtagtacag aaaagataaa tctgtagaaa agggagaaag acaactgggt agaaaattta 900
tttcaaatat ctaacccaaa tcttcaacag attttccatt ttaaatattc caaaaagtgt 960
accattgtat attatactaa atgcaggttc atttatcact taaaaatttt taagctaaaa 1020
aatctcaaac aattaacatt tgggaagaaa aacaggactg atacacaaag tagtcaaaat 1080
atttcagctt tctaaactgt atgcactgga ctaactgttc aatattagaa tatctctaca 1140
tttgaatttg gatagcccac agtgataaat actggactga aaaatctgac atcgaacata 1200
tgcaaaacta atggctacta tgaaaaaaga tagaatgggg agagaaaact tgaatgtgcc 1260
aaaacattta aacgctcttt aaaatatcct gagatgctaa attaaggaca aaacgattag 1320
agttccaaga atacaaattt tcatctcttt caagattcaa ctgaatattg aatctcattg 1380
agattatgaa atattctcta agcatgtgct taacttctat ttggctttcc gcatttcacc 1440
acagtgaaca gcccattctt tttccttgtt tacaccaaat gctcgttttg aacacaactc 1500
aaaatggaat tccaggccca aaagtcacca cccctacttt cacccccaca ggcagctact 1560
taacagataa ggaattcaag tgcaggacct gaaggtctta tttccatgca aatttcacaa 1620
tccccgttac ttgcccagat acaacaatta aagcttaaaa ggtggcggga gtgggggact 1680
tgaggactgg tctgaggaga aagtgaatct cccaagggtt cctaaatggt tttgcttcca 1740
gtataaaaac tgcgagctac cagtagaatt taacaacagc tcaaccttgc atttggaaca 1800
gttactatat agttcacttt cttttttcat gggggcgggg tatggtgtct tacctactct 1860
taaatttgaa cgtattaaca ggttcccctc cgcgcacact gacatatttc ttatccccca 1920
taatgaattc agccatatgg cattctttcc catcgaaggc catcgggaat ggctttagga 1980
agctgatttt caagctttaa g 2001
<210> 32
<211> 567
<212> DNA
<213> Homo sapiens
<400> 32
tcggcggccc ccccgctgtc tggcggacac ttgttagtgg ctgcggagaa gccactcaca 60
aagtttccca tcccgttgag ggaaggggtc ctgactgcgc cagcggggca ggcccagaag 120
gcgcggtatc tgggaggtcc ggccgccgca gacgaccccg ccgaggccca aagtgcgcca 180
gcttctccgc gcccctccgc ctcctcctcc tcctcctccc tgcagagggg cgcacgcgca 240
cagacacacg cacgcacgca cgcacttaca cacaaaagga agtcatggaa ggtgctggtc 300
cctgcataca ggcacactcg cgcgggacac acacacaccc cccaaaaaga ggcgtgcggg 360
gttcgccaga cggtgggcaa aagcccgtcc tccccccctt ccagggcctg ctcacttcag 420
ggagcgccca ctcgcccagc cacgggccaa gagcgcacgg acccaggcgg gcggcagccc 480
acccgccacc acgcagctcc acttcgctgt tccacagcca ccaaccgcac agccggcaca 540
gtcccgcccg cgcagctggc ccaatcg 567
<210> 33
<211> 1001
<212> DNA
<213> Homo sapiens
<400> 33
ggcatagttt aaaactatcc ctgctcattc tttaaaataa gtccacagta gagaataaga 60
catcggaaaa tacaaacatt tcttcatatc cgaatctatt tgaatcctaa gatgcagata 120
cggagagttc agagtgccat cagtacaggg cagagaggtt gaagagctca ggaacagaca 180
tagggtgggg gaaaggggta ggggcaacga cgctgacttt tggttaacaa agcccttcca 240
ggctgcggag caacctcctc tgcccttcac ctgcccggcc catctctggc caagaagacc 300
ctgccgccaa atccccacac ccagtccagg tcgcagtgca cagactggcc cttccgaagc 360
ccctcagcgg tagcccgact ccgaagctca ccgaggcatc cgtgagagga gatgccacct 420
agcgcagatc acatctgctc tgaatccttg acaaccgcag cccaaagaat gataaactac 480
aaaggccgga aatgcgtcac cgcggcccgc tctccgcgaa acagcggttc cggctgtgtt 540
ccttctagga aggccggagg tttccacacc tctgtggtcg tcactctgaa tcccgtctgt 600
agtcttaagt gagatactag gtgacacatt gtcttccacg cggcaatata ataacggcca 660
acatagtgtt ttaacacgta ttaattcatt accccgcata acaaccctgt gagttaggta 720
caattatctc catttaacag gtgaggaaac tgaagcacat ttctacattt attagttgcc 780
atttcctgca aagaataccc tttcttttcc ctgccgtctc attttatcac gatgaactca 840
tggattcctt tacaaataat tactgttatt attatgttga tgctcaaatt atttaaaatt 900
tggtcagttg gagccctttc acactgctcc ctctcttttc tttttttgac aaagtctcca 960
ggctggagtg cagtggatgc gatctcagct cactgcaacc t 1001
<210> 34
<211> 383
<212> DNA
<213> Homo sapiens
<400> 34
tcgcacgttc gcaggcgcgg gcttcctgtg cgcggccgag cccgggccca gcgccgcctg 60
cagcctcggg aagggagcgg atagcggagc cccgagccgc ccgcagagca agcgcgggga 120
accaaggaga cgctcctggc actgcaggta cgccgacttc agtctcgcgc tcccgcccgc 180
ctttcctctc ttgaacgtgg cagggacgcc gggggacttc ggtgcgaggg tcaccgccgg 240
gttaactggc gaggcaaggc gggggcagcg cgcacgtggc cgtggagccc ggcctggtcc 300
cgcgcgcgcc tgcgggtgcc ccctggggac tcagtggtgt cgcctcgccc gggaccagag 360
attgcgctgg atggattccc gcg 383
<210> 35
<211> 279
<212> DNA
<213> Homo sapiens
<400> 35
ccgccagggc acggcccccc ctgcgcccca aactgagcgg caaagtcagg gcccgcggcc 60
ggatgctcag agctaaaggc cgcggaggac agatgtgctt cttcctcctt cccgcgtctc 120
cccatacaag tactaccccg cacgtcccat caggcttgcc tgtgggccag gattcagggt 180
cctgagccga aacctaccag gagagagaag gctctggaga cctctgtaac agtcgtgcgg 240
agaagacaaa gtcagctgcg tgcgtctcct ccggcgccg 279
<210> 36
<211> 2775
<212> DNA
<213> Homo sapiens
<400> 36
tcggagtcac gtgagcgccg aggcccctcc cgcggcaggc ggcgaaaggg cttgcgcgcc 60
ctcccctcct ccacagcccc ccgcccctcg cgggcccgcc cctccaggcg aggccaacct 120
ccgcgcccgc cgcccgagcc tcagcggtcc gggaggagct cccggcggcg ctcggcagag 180
ccctcggccg gtgccccgcg gccgccgcgc tcccagggct actggcgcag cgcacggaga 240
acccggttct cggcgcggtg cgtcgtgctg ggcccccgcg ccgggccacc tgaagccaga 300
ggatttgggg cgcactgaag ggactgcgtc tcccagctcg aacccggctt aagtggggcc 360
gggagcgagg tcgggaaagt ctcacccgcc caaagcctca ccaccgagag gcacttaaaa 420
aggaaagcgc agagggaccc tgcccacgcg cgtgtacaca cacacccccc cacacacaca 480
caagcaaaca cgagctcccc gccacttcct ccccagggtc tcctcaaggc caaatattgc 540
tcccaatgac agccagtcac cccttggcga acgcctgcta aggctccgaa gagccgggcc 600
accgatctag ctcccggctg aaagcagccg accttgtcac gcgcggggcc gggaatggga 660
gggagggtgt tagagggtga tcgctgtggg aaagtgagag ggagcggctg ttagtcattg 720
ctccgggtcc attaccgaga atccccaaac ctagtccgcc gctgcgtggc ccctctcccc 780
atgcaaagca gacccccgaa gaagccatgc caggctgagg gacagacgcc ggggctcgaa 840
gctccgggca gattcagaaa gaggcgtcgc tgcagaaagg acgcatcaca gttttcagat 900
cttaatgtgg ccgaggtttt acaactcccg acccggcgca gaaaggaaat cccaccatgt 960
tccccggagt cgagaaaacg gtgaacagct ttcggcctgc gctcgacctc tgcgtctgcg 1020
tctctctcgc ctcggcttcc cttatttttt aaaccaccac cacactcctt cccccgccac 1080
ttccttcccc cacccccttc ctccgttgca ccagcagcag agtcgcacgc agcaaatact 1140
ccttcaagaa ttttacctac ctacagttca agcagttact gggatgtcct gactaatcga 1200
agatgctgcc gcgcgcgtgg gtcgctctgc gcaagggcct cttcgaaaac ccgactaggc 1260
gcaactcagc gttcagcagg gccgggagcg ccaggtcgtc cccggggccc gggccccatg 1320
actcctgccc caaagcccac tccacccgac ctccctttcc tgaggctgtt cccagttgct 1380
gctttgggtc gctccggagc tcaagaactc gggttgcctg ccgccccact ctccacgcac 1440
atacttggtt ttcttcttag gggcattggc aggtagactt tgaggaagaa aagtaaagga 1500
tcgaacagct cagccctccc tcccgaccgt ggatgcccgg agtcgaccaa cacctcaggt 1560
ccgggtgcgg aggccgcggg cgcccctgcg cgaccgtccg cgcccggcaa gagccgcgcg 1620
gctttcgcct ttgctggtcc cgcgccaccg ctggggcggg ctgcgaaagg gttgggaaga 1680
gcaaagggtt tttttgtttt gttttgagac gcagaagccc tttaaaaagc ccggcgagga 1740
gaggtccaga agtagagaaa gcagacggag gcaagctgtg cccgcggggc aaagggacag 1800
tagaaggggc gggcgcccgg gttccccgga aaaccctcgg ccccaaggaa tctcctgggg 1860
cgggagagcg cggttctaaa accgagagga taggaagggg aagggggagt tgtgtttcaa 1920
tttcggattc accaggattc atctctagtc acatttttct tctcaaattt ttaaatcgaa 1980
aagataaaag ccaaaagaac tttcatcccc agagcttttt attgggggaa aggaatgtaa 2040
ctcggggtgg ttgtccttca cttccctact cgaatcttct cctaatgccg aaatgtgttt 2100
acaggtagcc tcagtttacc aagtatgtat cttttggggg tttaacctct cacaaagcct 2160
tcaactcaca aaccgcgatc cttggaaacc atcctccaaa gcagtgcttg gaggcctcta 2220
aggcccccgg accaactccc gctggaagaa gcctgcaggg actcgggaat cacgggaacc 2280
tttcccgtcg gttccgggcc tggagggcca ggaagagccg cgcgtccgcc tttcgtcccg 2340
ccaggaactc cccataggac acgacaccgc aggaacaagc gtcctgggag cccctgggat 2400
cttggctgtc gtctctaggg accctacacc gtgaaatgat agaggcgagg ttccttgggt 2460
tccgcaagtc gacgaaaata gctcgtggag aaggcgcgtc ctgcaactgc agttcgcaag 2520
ctctcagggc gccccgccag ctgggggcca gattgggtga cactcccctc gacgcagcct 2580
ccggagcggc gcgcactctc cagaggccag caggactgcg ctctctaccg cagaacctgc 2640
tccagctagg tgttctctcc ccatctcgcc gtcgctctgc cccctcactc tctctggacc 2700
tcagagccgg ttctctcctt cctcctcccg cgctttccgt ccggggatcg caacctccag 2760
cccgtgggca acgcg 2775
<210> 37
<211> 2255
<212> DNA
<213> Homo sapiens
<400> 37
ccgctttaga ggcagcgctt atagcgctag ctggtcgtgg aatgcgatta cagcgtctcc 60
attggagacc gctgagtgcc tcggtttccc tgtctgtgca aagtgcactc cccagacgcc 120
gctgcctcga gggaccagga aatgcgtctg ggggcgccag gaaagatgag aagataaagt 180
cacgatgcgt ccagctagct atagacacaa gcagaggagc cagtaggcca aaggagacgc 240
acagctgatc cgtgccgagg cgcgggctcc actccctgaa gtggagggac ccttgaatct 300
ttccttgcgt aggcgcgcgg cagagcagcg atttggcgaa aagggccgag actcaggatg 360
cctgcaatgc gagcgagggg cggacagggc gcacggggcg cggcaaggct gcgaggggcg 420
ggcctgggcc ctgagcctcc tgcacttcca gccacagctc tgggccttgg gggcgggaag 480
gggtggagcc acgtggggag gagcaaaacc cggaggtccc gggcaccttg ggcagagcca 540
gagcggcggg agccggtcct gggcgcgttg ccccgggagc gcccgtcgtc cgggcagagc 600
gcagccgcaa ccgcgaccac agccgcagtc gctttccagc ctgccttcgg tgcgcagcgg 660
gggaacaggg ctagtgcagc cgccggaggg gggcacgggc tcctctccca tcccagagct 720
actgggctgc ccttgctgtc ctcgccgccc cagcagaccc cggccggacc tgccacctgc 780
gccctggttg cgccatggat ccttcggaaa agaagatatc ggtgtggatc tgccaggaag 840
agaagctggt gtccggcctc tcccgccgca ccacttgctc cgacgttgtg cgagtgcttt 900
tggaggacgg ctgccggcgg cgacggagac agcggcggag ccggcggctg gggtcggccg 960
gcgacccgca tggcccggga gagctgcccg aacccccgaa cgaggacgac gaggacgacg 1020
acgaggcgct gccgcagggc atgctgtgcg ggcccccgca gtgctattgc atcgtggaga 1080
agtggcgcgg ctttgagcgc atcctcccca acaagacgcg catcttgcgc ctctgggctg 1140
cctggggcga agagcaagag aatgtgcgct tcgtgctagt gcgcagcgag gcatcgctgc 1200
ctaacgccgg cccccgcagc gccgaggcgc gcgtagtgct gagccgagag cgcccctgtc 1260
cggcccgcgg ggccccggcg cggcccagcc tggccatgac ccaggagaaa cagcggcgag 1320
tggtgcgcaa ggcctttcgc aaactggcca agctcaaccg gcggcgccag cagcagacac 1380
cgtcgtcctg ttcgtccact tcgtcgtcca ctgcctcgtc ctgctcttcg tcgccgcgga 1440
cccacgagag cgcgtcggtg gagcgcatgg agacgctggt gcatctggtg ctttcccagg 1500
accacacaat tcgccagcag gtgcagcggc tccacgagct ggaccgcgag atcgatcact 1560
acgaggccaa ggtgcacctg gaccgcatgc ggcgtcacgg ggtcaactac gtgcaggaca 1620
cttacttggt tggggcaggc atcgagctcg acgggtccag accgggagag gagccagaag 1680
aggtggcggc ggaggcggag gaggcggcgg cggcgccccc tctagccggc gaggcgcagg 1740
cggcggcgct ggaggagctg gcccggcgct gcgacgactt gctgcggctt caggagcaac 1800
gggttcagca ggaggagttg ctggagcgcc tttcagccga gattcaggag gaactcaacc 1860
agaggtggat gcgacggcgc caggaggagc tggcggcgcg ggaggagccc ctggagcccg 1920
acggtggccc cgacggcgag ctgctgctgg agcaggaacg ggtcaggacg cagctcagta 1980
ccagccttta cattgggctg cggctcaaca cggacctaga ggccgtcaag tcggacttgg 2040
attacagcca gcagcaatgg gacagcaaga agcgcgagct acagggcctt ctgcaaactt 2100
tgcacacttt ggagctgacg gtggcaccgg atggggctcc tggctctggc agtccctcgc 2160
gggaacctgg gcctcaagcc tgcgccgaca tgtgggtgga ccaggcccgt ggactggcca 2220
agagcggtcc tggcaacgac gaagactcgg atacg 2255
<210> 38
<211> 875
<212> DNA
<213> Homo sapiens
<400> 38
ccgcgccacc cctcggctct ctctctctct ctccctaccc cgcaggatct acaccggctg 60
tgacatggac cgcctgaccc cctcgcccaa cgactcgccg cgctcgcaga tcgtgcccgg 120
ggcccgctac gccatggccg gctctttcct gcaggaccag ttcgtgagca actacgccaa 180
ggcccgcttc cacccgggcg cgggcgcggg ccccgggccg ggtacggacc gcagcgtgcc 240
gcacaccaac gggctgctgt cgccgcagca ggccgaggac ccgggcgcgc cctcgccgca 300
acgctggttt gtgacgccgg ccaacaaccg gctggacttc gcggcctcgg cctatgacac 360
ggccacggac ttcgcgggca acgcggccac gctgctctct tacgcggcgg cgggcgtgaa 420
ggcgctgccg ctgcaggctg caggctgcac tggccgcccg ctcggctact acgccgaccc 480
gtcgggctgg ggcgcccgca gtcccccgca gtactgcggc accaagtcgg gctcggtgct 540
gccctgctgg cccaacagcg ccgcggccgc cgcgcgcatg gccggcgcca atccctacct 600
gggcgaggag gccgagggcc tggccgccga gcgctcgccg ctgccgcccg gcgccgccga 660
ggacgccaag cccaaggacc tgtccgattc cagctggatc gagacgccct cctcgatcaa 720
gtccatcgac tccagcgact cggggattta cgagcaggcc aagcggaggc ggatctcgcc 780
ggccgacacg cccgtgtccg agagttcgtc cccgctcaag agcgaggtgc tggcccagcg 840
ggactgcgag aagaactgcg ccaaggacat tagcg 875
<210> 39
<211> 975
<212> DNA
<213> Homo sapiens
<400> 39
ccgccgggtc actggagtct cagccttccg gaatccgagc cggcccgccc cactccccgc 60
ccttcgcggt cccgcccacg acctctcccc acgcctcccg ctccggcccc caacctcccg 120
gtcggacgtt cgttcccggc tctagccggc ctccgcgcct ctggcctctt tccttccggc 180
cgtcccgacg gagatatttc ttcaatactc cataaataca ccccgccgcg gaacccaccc 240
ggagtgagac gcccaacacg tcgtcgaact ggggttggcc gggggccgct ccccgccgcg 300
ggcccgcaga ctcgtggcgt cgccccgcag ctccgcctgg ccgacgggga accggccgag 360
acccggacac gcacgcccgg gaggacaaaa gcgcgggcgg accccgcagg ctgggacccc 420
ggcggctggc ccgctccccg agaagggccg tggtcggggg gctctcactc acgagccgct 480
ggctctgggt cagccctgcc cccagggcag cgctccatca tgaggctggc ggggcgctga 540
gccgtggcgt cctcgctcct gcgctgcccc tctgcatcct ggccccttcc ctgcacacgc 600
agagctgcca cactgagcgc ccctcagctt acttaagctc ggcaaggctg gagaaggccg 660
tctgggtgac cgggcggagg gggatgctgg ggaaggaaga attcaggcag ctgcaaagag 720
cgcgcgaata tattcattcg acatacctca tgggcgccta ccctgggcct ggtccggggc 780
gggtgtttgc ggggtggggc cgaagcaggg gcgtcgccga gttgaagacg tgtactccga 840
gcgctcctgc gttcattcat tcgctgggtg gagagaggaa ggacaagagc cccgcgccga 900
tcggagggga gcagaatagt aggcacagtt agagggtctt cacggtgcgt ttcggaacct 960
tggctgcccg gctcg 975
<210> 40
<211> 1284
<212> DNA
<213> Homo sapiens
<400> 40
tcgacaaacg caaagcgacc caaaccctgg agggtcacat cccggctgct acaaacctcg 60
gcggggcggc cccgctcttg cggccgggac agcgcagcgg cagcaggggc cgcaggggac 120
ccgcagattg gcacgccgct ccccatcccc gcagcgcgtc tgcaccggag actctgcggg 180
gattgtagcc ggagggcggg ccgggctccg aggcgctgct caggcattgg ggtttgtcct 240
catgagctcc acgtcggcgt gcaccatctc cctcaccagc tcctgcaaca caggggtggg 300
cgtgagggag gagcttctgc cactctctcc tggtgacacc ccaccccggg tgtcggcccc 360
agagaggcct ccgcgtccct cgttccagct cccctcactt ctcccgcacc ccgccttccg 420
ggctttgggc atcgcaggcg cctcaggcgc ccgaccctga gagctgccgc cctgcagccc 480
ggggccccgc agcgggcggc gtgcgcccta agagatactc acatcgaaag cgacccgggg 540
cttccagttc agcttctgtt tcgctttggt gcagtcgccc tgcagaaagt cctagggaag 600
aagaggggga gacgaagcag gcgtgggtcg tgggggtggg ggcagcaggt cccgagcccc 660
gggaactccc accgttccgc tccctctggg cgcacaaggc tccgggtttc cctgctttcg 720
gtccctgctg tgcgcgttca gttgcggctc tcggcgccgt aaatcactag gtcgcggtta 780
agaatgtgct gtgcggaccc gtgaggaccg tgaccgcgat ccacccccag ctacctccac 840
acctcttctc cccaaggcgt cccttgggct cttaatgctt tttttttttt tttttttttt 900
tttttataac atgaagttgt cagggacgct cctatgagaa ctgtttggaa ttgctgcact 960
tctctggcta ggagggaagt gagtaaatca ccaggcgccc ctcccagctg cccgtgtccc 1020
tgcgccgctc agctcctgcc gcagggctgg ccgcgccaag cgcgcgtcct acccaaagcc 1080
accagccccg cggggaaggg actcgggctg tggggcgcga ggccccagga ctcggggacc 1140
cctctacctc ggcggcagcg tgcgaccctc tttctaacgc ggccgtggat gtttcttccc 1200
gggccgcagc caagcgcggt tcttcctggg cggtggcttt gggcttttcg tacccacagt 1260
caagtcagtt cacgtcgcct cccg 1284
<210> 41
<211> 1001
<212> DNA
<213> Homo sapiens
<400> 41
actgctctaa atacttcata tatattaact cctctattct gtacttctgt tcccgtttta 60
tacagcagga aattgaaaca ctgagaggtt aagtaactaa agttacagag ctagagtgac 120
aggagtaaag cttcaactca ggcaacccag acttccagag ttctgatctc cactactaag 180
ctgctagcat agcttttctg gtaactattt ttaattcaaa tataattcga gtgatctatc 240
taacaagtca tcactctgac aactcagtga cttgtaatgt aaaattattc attgtaattc 300
atttaatatt attgtttctc tgtgctgcaa aaatcatagc aatcgagatg taatttatta 360
ctctccctcc cacctccggc atcttgtgct aatccttctg ccctgcggac ctcccccgac 420
tctttactat gcgtgtcaac tgccatcaac ttccttgctt gctggggact ggggccgcga 480
gggcataccc ccgaggggta cggggctagg gctaggcagg ctgtgcggtt gggcggggcc 540
ctgtgcccca ctgcggagtg cgggtcggga agcggagaga gaagcagctg tgtaatccgc 600
tggatgcgga ccagggcgct ccccattccc gtcgggagcc cgccgattgg ctgggtgtgg 660
gcgcacgtga ccgacatgtg gctgtattgg tgcagcccgc cagggtgtca ctggagacag 720
aatggaggtg ctgccggact cggaaatggg gtaggtgctg gagccaccat ggccaggctt 780
gctgcggggg gaggggggaa ggtggttttc cctcgcactg tcttaaaccg atggcctttc 840
cttggcacag ggtccactgc agcatgccaa acgaggaggc aggggcgtcg tccccccgcc 900
ccccactgca gcactggaga tggatttcct gtacttcgga tccagggttt ttgacagaag 960
aggaagaagg gggaggggta gaagtgttaa ggggagtctg c 1001
<210> 42
<211> 859
<212> DNA
<213> Homo sapiens
<400> 42
acgcagaggc cgtggcatct ggccgcagct gggctgcagt gcgtgcgcgc ctggcctggt 60
ggtccgatgg gaagcccggg gcggggcagc cgcggggcgg gggcggggcg tcgcggagat 120
aggccacgcc cctgcccgcc cgcgcaggcg cgctgcgggt cgttagctgt cagagccaag 180
cggcgggctg gcggcgggct ccgacgtctg cgccaggacc tggctggctg agcccggcgc 240
agcagcagca gccagggcag cgcggcccct actccctgtc aggtcgtaga ggcgagcagg 300
gaccagctgg tcgccggccc ctcgggcaag atggggaacc gggagatgga ggagctgatc 360
ccgctggtga accgtctgca ggacgcgttt tcggcgctgg gacagagctg cctgctggag 420
ctgccgcaga tcgccgtggt gggcggccag agcgccggca agagctcggt gctcgagaac 480
ttcgtgggca ggtaagcgcg cagggcgcgg agtaaggatg cggcagtggg gcgaccccgc 540
tgcgggccgt tggaacgtgg acgggcagcg ggagccagag ggtggatgga ccaggcgctg 600
cggtggaatg gggggcagag tggaatgggg ggcagagtgg cggtgtccgt ggggcgggcg 660
gggtcctcca gctctgggca tcctccgtcc cctgccaccc cccgcctggt ggccctcctg 720
cctgcctttc atcgtgcgat acaaagccat ttcctccctg tcctccagtc ggggagtcgg 780
gggaggggtc cgccccgggc tcgaccccca ccccctcggt gcgcgccagc cccgggcagc 840
ctccctgcgt agcgcgccg 859
<210> 43
<211> 2001
<212> DNA
<213> Homo sapiens
<400> 43
gacagaaaac agccagagcg caccactcac ctgagtgcca ggtaaacacc tgggcgcgac 60
agggacagga aacaagggta gggtgcggag gctggggagg aagaggttgg aaagggggga 120
aataaatggg cggggcctag caggtcctgt gcggggctta gggccggggc ggggcccagg 180
aagactcagc agcgggtggg tgagggtcta aaggcggcaa ttccgggccg ggtgcggtgg 240
ctcacgcctg taatcccagc actttggtag gccgaggcgg gcggatcacc tgagatcaag 300
agctcgagac cagcctgggc aacgtggtga aaccccgtct ctactaaaaa tacaaaaatt 360
agctgggcgt ggtggcgggc gcctgtagtc ccagctactt gggaggctga ggcaggagaa 420
tcgcttgaac ccgggacgtg gaggttgcag tgagctgaga tcgcgccact gtactccagc 480
ctgggtcaca acagggaaac tccgtctcaa aaaagaaaaa aaaaaaaggc aattccgagc 540
ccagacaaac cttaaggagg ggatcctgga tcttcagtta agtgggcgac acctggagtg 600
aggggcgggg catatgcaga gtaggtgcgg cctacaagcc aaaaaggaga aagagttgga 660
atggtgggcc tggcttatgc gggtgggcgg ggagagggtg gatcctagag gaggtgaggc 720
ctaacattgg gcgaagaagg cgggagcctg ggccaatgag ctgacggtag gccggggagg 780
gggcggtggg gtggggtggg caatgggcaa tgagacggag ggcggggccg ggacctaata 840
tggcgggtca ggagggtctg gaagacgaag aagagggaca ggcaatgcca ggtctaggac 900
taggagggag gcgcgggcgg tattagcggc tggaggaggc ttcgggaggc ccggccgacg 960
gccgccgcct ggtgctaccc acccaggggc gcgcgaccct cccttcggtc tggctccaaa 1020
gacctagcag cactgacttc acccagctgt ggttccaacg gcgggtccag cggcctcggc 1080
ccggcgccgt cctcctgctg gcccaacagg cccgccagcc cgcccctgta cgtctgtgat 1140
tggacggcgg cggccactga tgttcaagcg acaggtcctg gcccgggagc caatctgcag 1200
gtgttgaggc ccaggctccg agagcgggcc gaggaggcgt ggataccctg attcctaggg 1260
ggcaggcctg gttcccccga ggaggacccg gcctatgaat gactggagtt ctggggttct 1320
ggccgaaaga ggaagtggga cagggccggg tgtgatgggg cctagagtca cagagccttg 1380
cggccctgct gtccctgcaa gaagccagct tctggccagg cgcggtggct cacgcctgta 1440
atcccagcac tttgggaggc cgaggcgggc ggatcacgag gtcaggagat cgagaccatc 1500
ctaacatggt gaaaccctgt ctctactaaa aatacaaaaa attagccagg cgtggtggcg 1560
ggcgcctgta gtcccagcta ctagggaggc tgaggcagga gaacggcgtg aacccaggag 1620
gcggaggttg cagtgagctg agattgcgcc actgcactcc agccagggcg acagagcgag 1680
actccgtctc aaaaaaaaaa aaaaaagcag ccagcttctt cctcctattt tgcaaccttc 1740
tcccgatatc cttgaacatt ttagggacag ccatcactta accatagagc aaccctatta 1800
agtctaagta gcataatcac attcctgtag tatagatcat gaacctgaaa ttcgaggatg 1860
aagtcatttg cctgaagaca tacatcttgt aaaatagcca tccgcaaaga tgtagggaaa 1920
aaggcagcga tctgtggcta cacctcccct tcctcccgga agcagccact ggaacgtttt 1980
tagctttttc tttttttttc a 2001
<210> 44
<211> 1007
<212> DNA
<213> Homo sapiens
<400> 44
acgcggtgac cttgaccccg gcccaggccc tgctaatgaa gaggaaagcc cgtacgcact 60
cggcctgacc cacggcgacc ctctgtgacc aatcatacta ccaacctctt aaacagagct 120
ccaccgacgc aatgcccagg cataaaaagg ccaggccgga gagaccgcca ccagtcacgg 180
accctggacc cagcgcaccc gcaccatggc cggccccagc ctcgcttgct gtctgctcgg 240
cctcctggcg ctgacctccg cctgctacat ccagaactgc cccctgggag gcaagagggc 300
cgcgccggac ctcgacgtgc gcaaggtgag tccccagccc tggtcccgcg gcgctccggg 360
gagggaggga cccgcagcca caggggcgcg ccccgctccg gcctcgcctg agaactccag 420
gagctgagcg gattttgacg ccccgccctt gaccgcggtc gaggccccca cggcgcccca 480
gcgcgtctca gccccgctgt cccgcccgaa ctccgaaccc cggaccccag catccttgcc 540
cggcgcaccc cggccggcct cgcagggtcc tccgagcgag tccccagcgc cgccccggct 600
cccgctcacc ccgcccgtcc ccgcagtgcc tcccctgcgg ccccgggggc aaaggccgct 660
gcttcgggcc caatatctgc tgcgcggaag agctgggctg cttcgtgggc accgccgaag 720
cgctgcgctg ccaggaggag aactacctgc cgtcgccctg ccagtccggc cagaaggcgt 780
gcgggagcgg gggccgctgc gcggtcttgg gcctctgctg cagcccgggt gagcggggca 840
aggcgctccg gggccagggg gaggcgggcg ggggtgcggc cgggattccc ctgactccac 900
ctcttcctcc agacggctgc cacgccgacc ctgcctgcga cgcggaagcc accttctccc 960
agcgctgaaa cttgatggct ccgaacaccc tcgaagcgcg ccactcg 1007
Claims (10)
- (a) 대상체(subject)의 생물학적 시료에서 DNA를 제공하는 단계; 및
(b) 상기 분리된 DNA에서 염색체 #8의 67873388 내지 67875600번째 서열로 이루어진 CpG 부위의 메틸화 수준을 측정하는 단계;를 포함하는 간암의 발병 위험도를 평가하는 방법. - 제1항에 있어서,
상기 (b)는 염색체 #12의 95941906 내지 95942979번째 서열, 염색체 #10의 134597357 내지 134602649번째 서열, 염색체 #8의 144649774 내지 144651774번째 서열, 염색체 #1의 47998899 내지 47999517번째 서열, 염색체 #2의 26394102 내지 26396102번째 서열, 염색체 #8의 104510870 내지 104513913번째 서열, 염색체 #2의 63281034 내지 63281347번째 서열, 염색체 #4의 76555366 내지 76556079번째 서열, 염색체 #1의 63782394 내지 63790471번째 서열, 염색체 #5의 7849945 내지 7850439번째 서열, 염색체 #2의 39186777 내지 39187968번째 서열, 및 염색체 #14의 74207665 내지 74208665번째 서열로 이루어진 군에서 선택되는 CpG 부위의 메틸화 수준을 추가로 측정하는 단계인 것인, 간암의 발병 위험도를 평가하는 방법. - 제2항에 있어서, 상기 간암의 예후 또는 위험도를 평가하는 방법은 최소 2 이상의 CpG 부위의 메틸화 수준을 측정하는 것인, 간암의 발병 위험도를 평가하는 방법.
- 제2항에 있어서,
상기 염색체 #8의 67873388 내지 67875600번째 서열은 서열번호 10의 염기서열을 가지고,
상기 염색체 #12의 95941906 내지 95942979번째 서열은 서열번호 2의 염기서열을 가지고,
상기 염색체 #10의 134597357 내지 134602649번째 서열은 서열번호 3의 염기서열을 가지고,
상기 염색체 #8의 144649774 내지 144651774번째 서열은 서열번호 4의 염기서열을 가지고,
상기 염색체 #1의 47998899 내지 47999517번째 서열은 서열번호 5의 염기서열을 가지고,
상기 염색체 #2의 26394102 내지 26396102번째 서열은 서열번호 6의 염기서열을 가지고,
상기 염색체 #8의 104510870 내지 104513913번째 서열은 서열번호 7의 염기서열을 가지고,
상기 염색체 #2의 63281034 내지 63281347번째 서열은 서열번호 9의 염기서열을 가지고,
상기 염색체 #4의 76555366 내지 76556079번째 서열은 서열번호 11의 염기서열을 가지고,
상기 염색체 #1의 63782394 내지 63790471번째 서열은 서열번호 12의 염기서열을 가지고,
상기 염색체 #5의 7849945 내지 7850439번째 서열은 서열번호 13의 염기서열을 가지고,
상기 염색체 #2의 39186777 내지 39187968번째 서열은 서열번호 14의 염기서열을 가지고,
상기 염색체 #14의 74207665 내지 74208665번째 서열은 서열번호 15의 염기서열을 가지는 간암의 발병 위험도를 평가하는 방법. - 제2항에 있어서,
상기 염색체 #8의 67873388 내지 67875600번째 서열의 CpG 부위는 염색체 #8의 67874178번째에 위치하고,
상기 염색체 #12의 95941906 내지 95942979번째 서열의 CpG 부위는 염색체 #12의 95941988번째에 위치하고,
상기 염색체 #10의 134597357 내지 134602649번째 서열의 CpG 부위는 염색체 #10의 134599823번째에 위치하고,
상기 염색체 #8의 144649774 내지 144651774번째 서열의 CpG 부위는 염색체 #8의 144651002번째에 위치하고,
상기 염색체 #1의 47998899 내지 47999517번째 서열의 CpG 부위는 염색체 #1의 47999163번째에 위치하고,
상기 염색체 #2의 26394102 내지 26396102번째 서열의 CpG 부위는 염색체 #2의 26395458번째에 위치하고,
상기 염색체 #8의 104510870 내지 104513913번째 서열의 CpG 부위는 염색체 #8의 104512877번째에 위치하고,
상기 염색체 #2의 63281034 내지 63281347번째 서열의 CpG 부위는 염색체 #2의 63281139번째에 위치하고,
상기 염색체 #4의 76555366 내지 76556079번째 서열의 CpG 부위는 염색체 #4의 76555832번째에 위치하고,
상기 염색체 #1의 63782394 내지 63790471번째 서열의 CpG 부위는 염색체 #1의 63789278번째에 위치하고,
상기 염색체 #5의 7849945 내지 7850439번째 서열의 CpG 부위는 염색체 #5의 7850070번째에 위치하고,
상기 염색체 #2의 39186777 내지 39187968번째 서열의 CpG 부위는 염색체 #2의 39187533번째에 위치하고,
상기 염색체 #14의 74207665 내지 74208665번째 서열의 CpG 부위는 염색체 #14의 74208165번째에 위치하는 CpG 부위의 메틸화 수준을 측정하는 간암의 발병 위험도를 평가하는 방법. - 제1항에 있어서,
상기 생물학적 시료는 간암 의심 환자 또는 진단 대상 유래의 조직, 세포, 혈액, 혈장, 대변 및 소변으로 이루어진 군에서 선택되는 것인, 간암의 발병 위험도를 평가하는 방법. - 제1항에 있어서,
상기 (b) 단계는 PCR, 메틸화 특이 PCR(methylation specific PCR), 실시간 메틸화 특이 PCR(real time methylation specific PCR), MethyLight PCR, MehtyLight digital PCR, EpiTYPER, 메틸화 DNA 특이적 결합 단백질을 이용한 PCR, 정량 PCR, DNA 칩, 파이로시퀀싱 및 바이설파이트 시퀀싱으로 이루어진 군에서 선택되는 방법으로 수행되는 간암의 발병 위험도를 평가하는 방법. - 제1항에 있어서,
(c) 상기 (b) 단계 이후에, 상기 메틸화 수준을 정상 대조군의 메틸화 수준과 비교하는 단계;를 더 포함하는 간암의 발병 위험도를 평가하는 방법. - 염색체 #8의 67873388 내지 67875600번째 서열로 이루어진 CpG 부위에 결합하는 프로브를 포함하는 간암 발병 위험도 진단용 키트.
- 제9항에 있어서,
상기 간암 발병 위험도 진단용 키트는 염색체 #12의 95941906 내지 95942979번째 서열, 염색체 #10의 134597357 내지 134602649번째 서열, 염색체 #8의 144649774 내지 144651774번째 서열, 염색체 #1의 47998899 내지 47999517번째 서열, 염색체 #2의 26394102 내지 26396102번째 서열, 염색체 #8의 104510870 내지 104513913번째 서열, 염색체 #2의 63281034 내지 63281347번째 서열, 염색체 #4의 76555366 내지 76556079번째 서열, 염색체 #1의 63782394 내지 63790471번째 서열, 염색체 #5의 7849945 내지 7850439번째 서열, 염색체 #2의 39186777 내지 39187968번째 서열, 및 염색체 #14의 74207665 내지 74208665번째 서열로 이루어진 군에서 선택되는 CpG 부위에 결합하는 프로브를 추가로 포함하는 것인, 간암 발병 위험도 진단용 키트.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20170156527 | 2017-11-22 | ||
KR1020170156527 | 2017-11-22 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180137644A Division KR102052089B1 (ko) | 2017-11-22 | 2018-11-09 | 유전자의 CpG 메틸화 변화를 이용한 간암의 위험도를 평가하는 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190087344A KR20190087344A (ko) | 2019-07-24 |
KR102103887B1 true KR102103887B1 (ko) | 2020-05-29 |
Family
ID=66675922
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180137644A KR102052089B1 (ko) | 2017-11-22 | 2018-11-09 | 유전자의 CpG 메틸화 변화를 이용한 간암의 위험도를 평가하는 방법 |
KR1020190069625A KR102103887B1 (ko) | 2017-11-22 | 2019-06-12 | 유전자의 CpG 메틸화 변화를 이용한 간암의 예후 또는 위험도를 평가하는 방법 |
KR1020190069624A KR102103886B1 (ko) | 2017-11-22 | 2019-06-12 | 유전자의 CpG 메틸화 변화를 이용한 간암의 예후 또는 위험도를 평가하는 방법 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180137644A KR102052089B1 (ko) | 2017-11-22 | 2018-11-09 | 유전자의 CpG 메틸화 변화를 이용한 간암의 위험도를 평가하는 방법 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190069624A KR102103886B1 (ko) | 2017-11-22 | 2019-06-12 | 유전자의 CpG 메틸화 변화를 이용한 간암의 예후 또는 위험도를 평가하는 방법 |
Country Status (6)
Country | Link |
---|---|
US (2) | US20210147943A1 (ko) |
EP (2) | EP3715474A4 (ko) |
JP (2) | JP7306723B2 (ko) |
KR (3) | KR102052089B1 (ko) |
CN (1) | CN111386352B (ko) |
SG (1) | SG11202004795RA (ko) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102155044B1 (ko) * | 2019-10-08 | 2020-09-11 | 주식회사 레피다인 | 생물학적 시료의 간암 조직 기원 여부를 판별하는 방법 |
IL280297B (en) * | 2021-01-19 | 2022-09-01 | Nucleix Ltd | Non-invasive cancer detection is based on DNA methylation changes |
CN113621704B (zh) * | 2021-07-22 | 2023-08-29 | 武汉艾米森生命科技有限公司 | 肝癌的检测和诊断的试剂及试剂盒 |
CN113981046A (zh) * | 2021-11-05 | 2022-01-28 | 朱运峰 | 一种基于定量pcr技术dna甲基化检测方法及其试剂盒 |
CN118159669A (zh) * | 2021-11-11 | 2024-06-07 | 深圳华大基因股份有限公司 | 一种用于诊断肝癌的核酸及蛋白检测试剂盒 |
CN118475705A (zh) * | 2021-11-11 | 2024-08-09 | 深圳华大基因股份有限公司 | 一种用于诊断肝癌的核酸检测试剂盒 |
CN113948150B (zh) * | 2021-12-21 | 2022-04-19 | 北京迈基诺基因科技股份有限公司 | Jmml相关基因甲基化水平评估方法、模型及构建方法 |
CN114369663A (zh) * | 2022-01-18 | 2022-04-19 | 博尔诚(北京)科技有限公司 | 用于肝癌筛查的标志物、探针组合物及其应用 |
CN116179694A (zh) * | 2022-11-02 | 2023-05-30 | 武汉艾米森生命科技有限公司 | 检测甲基化水平的试剂在制备前列腺癌诊断产品中的应用以及前列腺癌诊断试剂盒 |
IL300230A (en) * | 2023-01-26 | 2024-08-01 | Nucleix Ltd | disease markers |
KR20240118676A (ko) * | 2023-01-26 | 2024-08-05 | 연세대학교 산학협력단 | 간암 발병의 위험성 예측용 조성물 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0700374D0 (en) * | 2007-01-09 | 2007-02-14 | Oncomethylome Sciences S A | NDRG family methylation markers |
WO2009023725A2 (en) * | 2007-08-14 | 2009-02-19 | The Trustees Of Columbia University In The City Of New York | Early detection of cancer by methylated dna in blood |
KR20100041937A (ko) * | 2008-10-15 | 2010-04-23 | 재단법인서울대학교산학협력재단 | 암 전이 억제 물질의 스크리닝 방법 |
US9447472B2 (en) * | 2011-01-28 | 2016-09-20 | National Cancer Center | Method for assessing risk of hepatocellular carcinoma |
KR101313756B1 (ko) * | 2012-03-09 | 2013-10-01 | (주)지노믹트리 | 간암 특이적 과메틸화 CpG 서열을 이용한 간암의 검출방법 |
WO2014046198A1 (ja) * | 2012-09-19 | 2014-03-27 | シスメックス株式会社 | 肝細胞癌に関する情報の取得方法、ならびに肝細胞癌に関する情報を取得するためのマーカーおよびキット |
JP6369857B2 (ja) * | 2013-05-29 | 2018-08-08 | シスメックス株式会社 | 肝細胞癌に関する情報の取得方法、ならびに肝細胞癌に関する情報を取得するためのマーカーおよびキット |
EP3034624A1 (en) * | 2014-12-18 | 2016-06-22 | Hospital Clínic de Barcelona | Method for the prognosis of hepatocellular carcinoma |
AU2015374019B2 (en) * | 2014-12-31 | 2022-03-10 | Case Western Reserve University | Methods and compositions for detecting esophageal neoplasias and/or metaplasias in the esophagus |
KR20170071724A (ko) * | 2015-12-16 | 2017-06-26 | 연세대학교 산학협력단 | 간암 발생 특이적 유전자 발현에 관여하는 유전자 구조 내 cpg 섬의 dna 메틸화 변이를 이용한 간암의 예측 또는 진단 방법 |
EP3390657B1 (en) * | 2015-12-17 | 2020-09-16 | Illumina, Inc. | Distinguishing methylation levels in complex biological samples |
WO2017143296A2 (en) * | 2016-02-18 | 2017-08-24 | Gill Inderbir Singh | Prostate cancer aggressiveness biomarkers |
US11851711B2 (en) * | 2017-09-29 | 2023-12-26 | Arizona Board Of Regents On Behalf Of The University Of Arizona | DNA methylation biomarkers for cancer diagnosing |
-
2018
- 2018-11-09 KR KR1020180137644A patent/KR102052089B1/ko active IP Right Grant
- 2018-11-19 CN CN201880075735.7A patent/CN111386352B/zh active Active
- 2018-11-19 US US16/766,504 patent/US20210147943A1/en not_active Abandoned
- 2018-11-19 EP EP18881098.0A patent/EP3715474A4/en active Pending
- 2018-11-19 EP EP22196985.0A patent/EP4180540A1/en active Pending
- 2018-11-19 SG SG11202004795RA patent/SG11202004795RA/en unknown
- 2018-11-19 JP JP2020546257A patent/JP7306723B2/ja active Active
-
2019
- 2019-06-12 KR KR1020190069625A patent/KR102103887B1/ko active IP Right Grant
- 2019-06-12 KR KR1020190069624A patent/KR102103886B1/ko active IP Right Grant
-
2022
- 2022-04-25 US US17/728,240 patent/US20220259676A1/en active Pending
- 2022-08-16 JP JP2022129672A patent/JP7452894B2/ja active Active
Non-Patent Citations (1)
Title |
---|
Hepatology, 61(6):1945-56 (2015.03.18.) |
Also Published As
Publication number | Publication date |
---|---|
KR20190087344A (ko) | 2019-07-24 |
KR102103886B1 (ko) | 2020-05-29 |
CN111386352A (zh) | 2020-07-07 |
KR20190059215A (ko) | 2019-05-30 |
JP2022164712A (ja) | 2022-10-27 |
US20220259676A1 (en) | 2022-08-18 |
JP7452894B2 (ja) | 2024-03-19 |
CN111386352B (zh) | 2024-04-16 |
US20210147943A1 (en) | 2021-05-20 |
EP3715474A2 (en) | 2020-09-30 |
EP4180540A1 (en) | 2023-05-17 |
JP2021503956A (ja) | 2021-02-15 |
KR102052089B1 (ko) | 2019-12-05 |
KR20190088924A (ko) | 2019-07-29 |
EP3715474A4 (en) | 2022-02-09 |
SG11202004795RA (en) | 2020-06-29 |
JP7306723B2 (ja) | 2023-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102103887B1 (ko) | 유전자의 CpG 메틸화 변화를 이용한 간암의 예후 또는 위험도를 평가하는 방법 | |
CN110382521B (zh) | 从氧化应激区分肿瘤抑制性foxo活性的方法 | |
CN109790583B (zh) | 对肺腺癌亚型分型的方法 | |
DK2681333T3 (en) | EVALUATION OF RESPONSE TO GASTROENTEROPANCREATIC NEUROENDOCRINE NEOPLASIS (GEP-NENE) THERAPY | |
AU2012345789B2 (en) | Methods of treating breast cancer with taxane therapy | |
CN107743524B (zh) | 前列腺癌预后的方法 | |
AU2012203810B2 (en) | Methods and compositions for the treatment and diagnosis of bladder cancer | |
CN108138237A (zh) | 使用靶基因表达的数学建模评估NFkB细胞信号传导途径活性 | |
CN101688239A (zh) | 结肠癌的早期检测和预后 | |
CA2430981A1 (en) | Gene expression profiling of primary breast carcinomas using arrays of candidate genes | |
KR20140140069A (ko) | 전반적 발달장애의 진단 및 치료용 조성물 및 그 진단 및 치료 방법 | |
CA2324444A1 (en) | P53-regulated genes | |
US20040219579A1 (en) | Methods of diagnosis of cancer, compositions and methods of screening for modulators of cancer | |
WO2018132369A1 (en) | Biomarkers predictive of anti-immune checkpoint response | |
AU2008203227A1 (en) | Colorectal cancer prognostics | |
KR20220098002A (ko) | 감염의 숙주 rna 바이오마커의 식별 | |
CA2666057C (en) | Genetic variations associated with tumors | |
AU2004205270B2 (en) | Colorectal cancer prognostics | |
KR20220008244A (ko) | 전립선암 환자의 예후 진단 및 치료 전략 결정용 연령 특이적 마커 | |
TW201718876A (zh) | 用以診斷與預斷腫瘤的方法 | |
KR102697907B1 (ko) | ATAC-seq 데이터 정규화 및 이의 활용 방법 | |
AU2014201129A1 (en) | Methods and compositions for the treatment and diagnosis of bladder cancer | |
KR20230024344A (ko) | 암 및/또는 cin3를 검출하고 예측하기 위한 방법 | |
KR20190032068A (ko) | 이차성 급성골수성백혈병으로의 이행 여부 판별용 바이오마커 조성물 및 그 검출 방법 | |
KR20130024135A (ko) | 1p36 결실 증후군 진단용 마이크로어레이 및 키트 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |