KR102103886B1 - 유전자의 CpG 메틸화 변화를 이용한 간암의 예후 또는 위험도를 평가하는 방법 - Google Patents

유전자의 CpG 메틸화 변화를 이용한 간암의 예후 또는 위험도를 평가하는 방법 Download PDF

Info

Publication number
KR102103886B1
KR102103886B1 KR1020190069624A KR20190069624A KR102103886B1 KR 102103886 B1 KR102103886 B1 KR 102103886B1 KR 1020190069624 A KR1020190069624 A KR 1020190069624A KR 20190069624 A KR20190069624 A KR 20190069624A KR 102103886 B1 KR102103886 B1 KR 102103886B1
Authority
KR
South Korea
Prior art keywords
chromosome
sequence
liver cancer
seq
dna
Prior art date
Application number
KR1020190069624A
Other languages
English (en)
Other versions
KR20190088924A (ko
Inventor
김영준
김다원
최원영
이정우
정민혁
하정실
김지원
이연수
황정아
김태유
임유주
Original Assignee
주식회사 레피다인
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 레피다인 filed Critical 주식회사 레피다인
Publication of KR20190088924A publication Critical patent/KR20190088924A/ko
Application granted granted Critical
Publication of KR102103886B1 publication Critical patent/KR102103886B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 정상 및 혈액 조직에서 낮은 메틸화 수준을 보이나 암 조직에서만 높은 메틸화 수준을 보이는 하나 이상의 CpG 부위의 메틸화 수준을 측정하여 정상 조직이 섞여 있는 임상 검체를 이용하여 간암의 예후 또는 위험도를 평가하는 방법에 관한 것이다.

Description

유전자의 CpG 메틸화 변화를 이용한 간암의 예후 또는 위험도를 평가하는 방법{A METHOD FOR ASSESSING RISK OF HEPATOCELLULAR CARCINOMA USING CPG METHYLATION STATUS OF GENE}
본 발명은 특정 유전자 CpG 부위의 메틸화 정도를 측정하여 간암 관련 위험도를 평가하는 방법에 관한 것이다.
암은 세포주기가 조절되지 않아 세포분열을 계속 하는 질병으로, 주위 조직에 침윤하면서 빠르게 성장하고 신체 각 부위에 확산되거나 전이되어 생명을 위협한다.
간에 생긴 암을 간암이라고 하며, 간암은 세계적으로 발병률이 높은 암 가운데 하나이다. 한국에서 간암 사망률은 인구 10만 명당 23명으로 매우 높은 편이며, 한국인의 총 사망률의 약 10%는 간염, 간경화 및 간암과 관계되어 있다.
다른 조직의 암이 간으로 전이되는 전이성 간암과 간세포 자체에서 암이 발생하는 원발성 간암(HCC; hepatocellular carcinoma)으로 간암을 분류할 수 있으나, 원발성 간암이 간암의 90%를 차지하기 때문에 대부분의 간암은 원발성 간암(HCC)을 의미한다.
간암은 초음파검사(ultrasound), 전산화단층촬영(CT), 자기공명촬영(MRI) 및 간동맥조영촬영(Angiography) 등의 영상 진단 방법이 있다. 초음파 검사는 간암의 크기에 따라 민감도에 많은 영향을 받으며, 간암 발생을 알아보는 일차 영상검사 방법으로 이용되고 있다.
5 cm 이상의 큰 간암 조직의 경우 75% 이상의 민감도를 보이는 반면, 1 cm 미만의 작은 간암의 경우 약 42%의 민감도를 보인다(Gomaa et al., World J Gastro., 15:1301, 2009).
전산화단층촬영(CT)은 가장 민감도가 높은 검사로 검사로 2 cm 이상의 간암의 경우 거의 100%, 1-2 cm의 경우 93%, 그리고 1 cm 이하의 간암도 60% 가까운 민감도로 진단할 수 있다(Gomaa et al., World J Gastro., 15:1301, 2009).
하지만 이러한 검사는 비용이 비교적 비싸므로 일반 대중에서 일상적인 스크리닝 검사로 사용하기에는 부담이 되는 검사법이다.
간암의 경우 진단 당시의 종양의 크기가 예후와 있으며, 환자의 생존율을 높이기 위해서는 간암을 조기에 발견하는 것이다. 따라서 높은 민감도로 조기에 간암을 발견 할 수 있는 진단 기술의 개발이 절실히 요구되고 있다.
한편, 후성유전학(epigenetics)은 DNA의 염기서열이 변화하지 않은 상태에서 이루어지는 유전자의 발현 조절을 연구하는 분야이다. 후성유전학은 DNA 메틸화, miRNA 또는 히스톤의 아세틸화, 메틸화, 인산화 및 유비퀴틴화 등과 같은 후성적 변이를 통한 유전자 발현 조절을 연구한다.
이중 DNA 메틸화가 가장 많이 연구가 되어있는 후성적 변이이다. 후성적 변이는 유전자 기능 변이 및 종양 세포로의 변화를 초래할 수 있다. 따라서 DNA 메틸화는 세포 내 질환 조절 유전자의 발현(또는 억제 및 유도와)과 연관되어 있으며, 최근에 DNA 메틸화 측정을 통한 암 진단 방법들이 제시되고 있다.
DNA 메틸화는 주로 특정 유전자의 프로모터 부위의 CpG 아일랜드(CpG island)의 사이토신(cytosine)에서 일어나고, 그로 인하여 전사인자의 결합이 방해를 받게 되어 특정 유전자의 발현이 차단(gene silencing)되는 것으로, 코딩서열(coding sequence)에 돌연변이가 없이도 그 유전자의 기능이 소실되는 주요 기전이다.
유전자의 프로모터 지역 이외에도 인헨서(enhancer), 조절 부위와 같은 비번역지역의 DNA 메틸화도 염색체의 구조변이, 히스톤 변형(modification)과 함께 작용하며 여러 질병의 원인 기전이 된다고 알려져 있다. 암을 포함한 다양한 질병들에서 CpG 아일랜드에서의 이러한 비정상적인 메틸화/탈메틸화가 보고되었으며, 질병 관련 유전자의 프로모터 메틸화를 조사하여 각종 질환의 진단에 사용하려는 시도가 활발하게 이루어지고 있다.
본 발명자들은 간암 발병과 관련 있는 유전자의 메틸화 부위를 선별하였고, 이를 검증하는 실험을 통해 간암의 위험성 또는 예후를 진단하는 방법을 제공하고자 하였다.
본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허 문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명은 전술한 종래 기술의 문제점을 해결하기 위한 것으로, 본 발명의 목적은 간암의 위험성을 초기에 발견하기 위해 정상 조직이나 혈액에서는 낮은 메틸화를 보이나 간암조직에서만 높은 메틸화 수준을 보이는 특정 프로브를 이용하여 검체의 메틸화 수준을 측정하므로서 간암의 위험성 또는 예후를 진단하는 방법을 제공한다.
본 발명의 일 측면에 따르면, (a) 대상체(subject)의 생물학적 시료에서 DNA를 제공하는 단계; 및 (b) 상기 분리된 DNA에서 염색체 #2의 25438725 내지 25439276번째 서열, 염색체 #12의 95941906 내지 95942979번째 서열, 염색체 #10의 134597357 내지 134602649번째 서열, 염색체 #8의 144649774 내지 144651774번째 서열, 염색체 #1의 47998899 내지 47999517번째 서열, 염색체 #2의 26394102 내지 26396102번째 서열 염색체 #8의 104510870 내지 104513913번째 서열, 염색체 #8의 98289604 내지 98290404번째 서열, 염색체 #2의 63281034 내지 63281347번째 서열, 염색체 #8의 67873388 내지 67875600번째 서열, 염색체 #4의 76555366 내지 76556079번째 서열, 염색체 #1의 63782394 내지 63790471번째 서열, 염색체 #5의 7849945 내지 7850439번째 서열, 염색체 #2의 39186777 내지 39187968번째 서열, 및 염색체 #14의 74207665 내지 74208665번째 서열로 이루어진 군에서 선택되는 CpG 부위의 메틸화 수준을 측정하는 단계;를 포함하는 간암의 예후 또는 위험도를 평가하는 방법이 제공된다.
일 실시예에 있어서, 상기 방법은 2 이상의 CpG 부위 메틸화 수준을 측정할 수 있다.
일 실시예에 있어서, 상기 염색체 #2의 25438725 내지 25439276번째 서열은 서열번호 1의 염기서열을 가지고, 상기 염색체 #12의 95941906 내지 95942979번째 서열은 서열번호 2의 염기서열을 가지고, 상기 염색체 #10의 134597357 내지 134602649번째 서열은 서열번호 3의 염기서열을 가지고, 상기 염색체 #8의 144649774 내지 144651774번째 서열은 서열번호 4의 염기서열을 가지고, 상기 염색체 #1의 47998899 내지 47999517번째 서열은 서열번호 5의 염기서열을 가지고, 상기 염색체 #2의 26394102 내지 26396102번째 서열은 서열번호 6의 염기서열을 가지고, 상기 염색체 #8의 104510870 내지 104513913번째 서열은 서열번호 7의 염기서열을 가지고, 상기 염색체 #8의 98289604 내지 98290404번째 서열은 서열번호 8의 염기서열을 가지고, 상기 염색체 #2의 63281034 내지 63281347번째 서열은 서열번호 9의 염기서열을 가지고, 상기 염색체 #8의 67873388 내지 67875600번째 서열은 서열번호 10의 염기서열을 가지고, 상기 염색체 #4의 76555366 내지 76556079번째 서열은 서열번호 11의 염기서열을 가지고, 상기 염색체 #1의 63782394 내지 63790471번째 서열은 서열번호 12의 염기서열을 가지고, 상기 염색체 #5의 7849945 내지 7850439번째 서열은 서열번호 13의 염기서열을 가지고, 상기 염색체 #2의 39186777 내지 39187968번째 서열은 서열번호 14의 염기서열을 가지고, 상기 염색체 #14의 74207665 내지 74208665번째 서열은 서열번호 15의 염기서열을 가질 수 있다.
일 실시예에 있어서, 상기 염색체 #2의 25438725 내지 25439276번째 서열의 CpG 부위는 염색체 #2의 25439110번째에 위치하고, 상기 염색체 #12의 95941906 내지 95942979번째 서열의 CpG 부위는 염색체 #12의 95941988번째에 위치하고, 상기 염색체 #10의 134597357 내지 134602649번째 서열의 CpG 부위는 염색체 #10의 134599823번째에 위치하고, 상기 염색체 #8의 144649774 내지 144651774번째 서열의 CpG 부위는 염색체 #8의 144651002번째에 위치하고, 상기 염색체 #1의 47998899 내지 47999517번째 서열의 CpG 부위는 염색체 #1의 47999163번째에 위치하고, 상기 염색체 #2의 26394102 내지 26396102번째 서열의 CpG 부위는 염색체 #2의 26395458번째에 위치하고, 상기 염색체 #8의 104510870 내지 104513913번째 서열의 CpG 부위는 염색체 #8의 104512877번째에 위치하고, 상기 염색체 #8의 98289604 내지 98290404번째 서열의 CpG 부위는 염색체 #8의 98290148번째에 위치하고, 상기 염색체 #2의 63281034 내지 63281347번째 서열의 CpG 부위는 염색체 #2의 63281139번째에 위치하고, 상기 염색체 #8의 67873388 내지 67875600번째 서열의 CpG 부위는 염색체 #8의 67874178번째에 위치하고, 상기 염색체 #4의 76555366 내지 76556079번째 서열의 CpG 부위는 염색체 #4의 76555832번째에 위치하고, 상기 염색체 #1의 63782394 내지 63790471번째 서열의 CpG 부위는 염색체 #1의 63789278번째에 위치하고, 상기 염색체 #5의 7849945 내지 7850439번째 서열의 CpG 부위는 염색체 #5의 7850070번째에 위치하고, 상기 염색체 #2의 39186777 내지 39187968번째 서열의 CpG 부위는 염색체 #2의 39187533번째에 위치하고, 상기 염색체 #14의 74207665 내지 74208665번째 서열의 CpG 부위는 염색체 #14의 74208165번째에 위치할 수 있다.
일 실시예에 있어서, 상기 생물학적 시료는 간암 의심 환자 또는 진단 대상 유래의 조직, 세포, 혈액, 혈장, 대변 및 소변으로 이루어진 군에서 선택되는 1종일 수 있다.
일 실시예에 있어서, 상기 (b) 단계는 PCR, 메틸화 특이 PCR(methylation specific PCR), 실시간 메틸화 특이 PCR(real time methylation specific PCR), MethyLight PCR, MehtyLight digital PCR, EpiTYPER, 메틸화 DNA 특이적 결합 단백질을 이용한 PCR, 정량 PCR, DNA 칩, 파이로시퀀싱 및 바이설파이트 시퀀싱으로 이루어진 군에서 선택되는 1종의 방법으로 수행될 수 있다.
일 실시예에 있어서, 상기 방법은 (c) 상기 메탈화 수준을 정상 대조군의 메틸화 수준과 비교하는 단계;를 더 포함할 수 있다.
본 발명의 다른 측면에 따르면, 염색체 #2의 25438725 내지 25439276번째 서열, 염색체 #12의 95941906 내지 95942979번째 서열, 염색체 #10의 134597357 내지 134602649번째 서열, 염색체 #8의 144649774 내지 144649774 내지 144651774번째 서열, 염색체 #1의 47998899 내지 47999517번째 서열, 염색체 #2의 26394102 내지 26396102번째 서열 염색체 #8의 104510870 내지 104513913번째 서열, 염색체 #8의 98289604 내지 98290404번째 서열, 염색체 #2의 63281034 내지 63281347번째 서열, 염색체 #8의 67873388 내지 67875600번째 서열, 염색체 #4의 76555366 내지 76556079번째 서열, 염색체 #1의 63782394 내지 63790471번째 서열, 염색체 #5의 7849945 내지 7850439번째 서열, 염색체 #2의 39186777 내지 39187968번째 서열, 및 염색체 #14의 74207665 내지 74208665번째 서열로 이루어진 군에서 선택되는 CpG 부위에 결합하는 프로브를 포함하는 간암 발병 위험도 진단용 키트가 제공된다.
일 실시예에 있어서, 상기 진단용 키트는 상기 CpG 부위에 결합하는 2 이상의 프로브를 포함할 수 있다.
본 발명의 일 측면에 따르면, 암과 정상 조직뿐 아니라 혈액을 포함하는 대부분의 정상세포와 다른 메틸화 수준을 보이는 특정 CpG 부위의 메틸화를 측정함으로써, 정상 조직이 섞여 있는 임상 검체를 이용하여 간암의 발병 가능성을 효과적으로 예측할 수 있다.
본 발명의 효과는 상기한 효과로 한정한 것은 아니며, 본 발명의 상세한 설명 또는 청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.
도 1은 본 발명의 간암 진단 마커 선정 파이프라인을 도식화한 것이다.
도 2는 본 발명의 일 실시예에 따른 DNA 메틸화 데이터 표준화 전(왼쪽), 후(오른쪽)의 간암 환자 분포를 나타낸 그래프이다.
도 3 은 본 발명의 일 실시예에 따른 간암 환자에서 과메틸화되고 정상인에서 저메틸화된 DMPs(Differentially methylated probes)의 히트맵이다.
도 4는 히트맵(Heatmap)을 통해 선별된 프로브에 대한 간암 샘플, 간 정상 샘플, 혈액 샘플에서의 메틸화 정도를 나타낸 히트맵이다. 붉은 색일수록 과메틸화를 나타낸다.
도5는 기계학습을 통해 선별한 본 발명의 일 실시예에 따른 진단 마커를 선별한 결과이다.
도6은 기계학습을 통해 선별한 본 발명의 일 실시예에 따른 진단 마커의 메틸화 정도를 간암 샘플, 간 정상 샘플, 혈액 샘플에서 확인한 히트맵이다.
도 7은 본 발명의 일 실시예에 따른 단일 프로브의 간암 진단 효율을 평가한 결과이다. 프로브 별 간암 진단 효율을 AUC로 표시하였다.
도 8은 Public DB인 TCGA (The Cancer Genome Atlas)의 간암 데이터에서 본 발명의 일 실시예에 따른 단일 프로브의 간암 진단 효율을 평가한 결과이다. 프로브 별 간암 진단 효율을 AUC로 표시하였다.
도 9는 본 발명의 일 실시예에 따른 프로브(15종)의 조합에 따른 진단 효율을 확인한 결과이다.
도 10은 파이로 시퀀싱을 통해 본 발명의 일 실시예에 따라 선발된 프로브의 메틸화 정도를 나타낸 히트맵이다. X축은 독립적 코호트 196명의 간암 및 이에 상응하는 간 정상 샘플 을 의미하고, Y축은 프로브(황색 박스) 및 프로브 부근의 CpG site를 의미한다.
도 11은 EpiTYPER 실험을 통해 본 발명의 일 실시예에 따라 선발된 프로브의 메틸화 정도를 나타낸 히트맵이다. X축은 독립적 코호트 184명의 간암 및 이에 상응하는 간 정상 샘플을 의미하고, Y축은 프로브(황색 박스) 및 프로브 부근의 CpG site를 의미한다.
이하에서는 첨부한 도면을 참조하여 본 발명을 설명하기로 한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 따라서 여기에서 설명하는 실시예로 한정되는 것은 아니다.
어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 구비할 수 있다는 것을 의미한다.
달리 정의되지 않는 한, 분자 생물학, 미생물학, 단백질 정제, 단백질 공학, 및 DNA 서열 분석 및 당업자의 능력 범위 안에서 재조합 DNA 분야에서 흔히 사용되는 통상적인 기술에 의해 수행될 수 있다. 상기 기술들은 당업자에게 알려져 있고, 많은 표준화된 교재 및 참고서에 기술되어 있다.
본 명세서에 달리 정의되어 있지 않으면, 사용된 모든 기술 및 과학 용어는 당업계에 통상의 기술자가 통상적으로 이해하는 바와 같은 의미를 가진다.
본 명세서에 포함되는 용어를 포함하는 다양한 과학적 사전이 잘 알려져 있고, 당업계에서 이용가능하다. 본 명세서에 설명된 것과 유사 또는 등가인 임의의 방법 및 물질이 본원의 실행 또는 시험에 사용되는 것으로 발견되나, 몇몇 방법 및 물질이 설명되어 있다. 당업자가 사용하는 맥락에 따라, 다양하게 사용될 수 있기 때문에, 특정 방법학, 프로토콜 및 시약으로 본 발명이 제한되는 것은 아니다.
본 명세서에서 사용되는 바와 같이, 단수형은 문맥이 명확하게 달리 지시하지 않으면 복수의 대상을 포함한다. 또한, 달리 지시된 바가 없으면, 핵산은 각각 왼쪽에서 오른쪽, 5'에서 3' 방향으로 씌여지고, 아미노산 서열은 왼쪽에서 오른쪽, 아미노에서 카르복실 방향으로 씌여진다. 이하 본 발명을 더욱 상세히 설명한다.
본 발명의 일 측면에 따르면, 1종 이상 CpG 부위의 메틸화 수준을 측정하는 단계;를 포함하는 간암의 예후 또는 위험도를 평가하는 방법이 제공된다.
상기 대상체(subject)는 진단 대상으로서 인간일 수 있고, 상기 생물학적 시료는 간암 관련 질환의 위험성을 평가하고자 하는 상기 대상체에서 분리된 시료로써, 조직, 세포, 혈액, 혈장, 복막액, 활막액, 타액, 소변, 대변 등을 포함하나 이에 제한되는 것은 아니다. 바람직하게 상기 생물학적 시료는 혈액일 수 있으며, 구체적으로 혈액에서 분리된 혈장일 수 있다.
또한, 상기 CpG 부위의 메틸화 수준을 개별적으로 분석하여 간암의 예후 또는 위험성 여부를 진단할 수 있으나, 바람직하게는 2종 이상, 3종 이상, 또는 4종 이상의 CpG 부위를 동시에 분석함으로써 진단의 정확성을 향상시킬 수 있다.
상기 진단은 특정 질병 또는 질환에 대한 대상체의 감수성(susceptibility)을 판정하는 것으로, 바람직하게는 대상체가 간암을 현재 가지고 있는지 여부를 판정하는 것, 간암에 걸린 대상체의 예후(prognosis)를 판정하는 것 또는 테라메트릭스(therametrics)를 포함할 수 있다.
상기 "메틸화"는 DNA를 구성하는 염기에 메틸기가 부착되는 것을 뜻한다. 바람직하게 메틸화 여부는 특정 유전자의 특정 CpG 부위의 시토신에서 일어나는 메틸화 여부를 의미한다.
상기 "메틸화 상태"는 DNA 염기서열 내에서의 하나 이상의 CpG 디뉴클레오타이드의 5-메틸-시토신의 존재 또는 비존재를 의미한다. 상기 "메틸화 수준"은 예를 들면 모든 게놈 영역 및 일부 비-게놈 영역 내의 표적 DNA 메틸화 유전자의 DNA 염기서열에 존재하는 메틸화의 양을 의미한다.
상기 메틸화 수준은 PCR, 메틸화 특이 PCR(methylation specific PCR), 실시간 메틸화 특이 PCR(real time methylation specific PCR), MethyLight PCR, MehtyLight digital PCR, EpiTYPER, 메틸화 DNA 특이적 결합 단백질을 이용한 PCR, 정량 PCR, DNA 칩, 파이로시퀀싱 및 바이설파이트 시퀀싱으로 이루어진 군에서 선택되는 1종의 방법으로 수행될 수 있으나, 이에 제한되는 것은 아니다.
상기 메틸화 정도는 마이크로어레이에 의해 식별될 수 있다. 상기 마이크로어레이는 고상표면에 고정화된 프로브를 이용할 수 있다. 상기 프로브는 상기 SNP를 포함하는 각 유전자상의 10 내지 100개의 연속 뉴클레오타이드 서열에 상보적인 서열을 포함할 수 있다.
상기 CpG 부위는 상기 유전자의 DNA 상에 존재하는 CpG 부위를 뜻한다. 상기 유전자의 DNA는 발현하는데 필요하며 서로 작동가능하게 연결되어 있는 일련의 구성 단위를 모두 포함하는 개념으로, 예컨대, 프로모터 영역, 단백질 코딩 영역(open reading frame, ORF) 및 터미네이터 영역을 포함한다.
따라서, 상기 유전자의 CpG 부위는 해당 유전자의 프로모터 영역, 단백질 코딩 영역(open reading frame, ORF) 또는 터미네이터 영역 등에 존재할 수 있다. 바람직한 예로는 상기 유전자의 프로모터 영역에 존재하는 CpG 부위일 수 있다.
상기 CpG 부위는 염색체 #2의 25438725 내지 25439276번째 서열, 염색체 #12의 95941906 내지 95942979번째 서열, 염색체 #10의 134597357 내지 134602649번째 서열, 염색체 #8의 144649774 내지 144651774번째 서열, 염색체 #1의 47998899 내지 47999517번째 서열, 염색체 #2의 26394102 내지 26396102번째 서열 염색체 #8의 104510870 내지 104513913번째 서열, 염색체 #8의 98289604 내지 98290404번째 서열, 염색체 #2의 63281034 내지 63281347번째 서열 염색체 #8의 67873388 내지 67875600번째 서열, 염색체 #4의 76555366 내지 76556079번째 서열, 염색체 #1의 63782394 내지 63790471번째 서열, 염색체 #5의 7849945 내지 7850439번째 서열, 염색체 #2의 39186777 내지 39187968번째 서열, 염색체 #14의 74207665 내지 74208665번째 서열로 이루어진 군에서 선택되는 1종 이상의 염기서열 내에 존재할 수 있다.
상기 염색체 #2의 25438725 내지 25439276번째 서열은 서열번호 1의 염기서열을 가지고, 상기 염색체 #12의 95941906 내지 95942979번째 서열은 서열번호 2의 염기서열을 가지고, 상기 염색체 #10의 134597357 내지 134602649번째 서열은 서열번호 3의 염기서열을 가지고, 상기 염색체 #8의 144649774 내지 144651774번째 서열은 서열번호 4의 염기서열을 가지고, 상기 염색체 #1의 47998899 내지 47999517번째 서열은 서열번호 5의 염기서열을 가지고, 상기 염색체 #2의 26394102 내지 26396102번째 서열은 서열번호 6의 염기서열을 가지고, 상기 염색체 #8의 104510870 내지 104513913번째 서열은 서열번호 7의 염기서열을 가지고, 상기 염색체 #8의 98289604 내지 98290404번째 서열은 서열번호 8의 염기서열을 가지고, 상기 염색체 #2의 63281034 내지 63281347번째 서열은 서열번호 9의 염기서열을 가지고, 상기 염색체 #8의 67873388 내지 67875600번째 서열은 서열번호 10의 염기서열을 가지고, 상기 염색체 #4의 76555366 내지 76556079번째 서열은 서열번호 11의 염기서열을 가지고, 상기 염색체 #1의 63782394 내지 63790471번째 서열은 서열번호 12의 염기서열을 가지고, 상기 염색체 #5의 7849945 내지 7850439번째 서열은 서열번호 13의 염기서열을 가지고, 상기 염색체 #2의 39186777 내지 39187968번째 서열은 서열번호 14의 염기서열을 가지고, 상기 염색체 #14의 74207665 내지 74208665번째 서열은 서열번호 15의 염기서열을 가질 수 있다.
상기 염색체 #2의 25438725 내지 25439276번째 서열의 CpG 부위는 염색체 #2의 25439110번째에 위치하고, 상기 염색체 #12의 95941906 내지 95942979번째 서열의 CpG 부위는 염색체 #12의 95941988번째에 위치하고, 상기 염색체 #10의 134597357 내지 134602649번째 서열의 CpG 부위는 염색체 #10의 134599823번째에 위치하고, 상기 염색체 #8의 144649774 내지 144651774번째 서열의 CpG 부위는 염색체 #8의 144651002번째에 위치하고, 상기 염색체 #1의 47998899 내지 47999517번째 서열의 CpG 부위는 염색체 #1의 47999163번째에 위치하고, 상기 염색체 #2의 26394102 내지 26396102번째 서열의 CpG 부위는 염색체 #2의 26395458번째에 위치하고, 상기 염색체 #8의 104510870 내지 104513913번째 서열의 CpG 부위는 염색체 #8의 104512877번째에 위치하고, 상기 염색체 #8의 98289604 내지 98290404번째 서열의 CpG 부위는 염색체 #8의 98290148번째에 위치하고, 상기 염색체 #2의 63281034 내지 63281347번째 서열의 CpG 부위는 염색체 #2의 63281139번째에 위치하고, 상기 염색체 #8의 67873388 내지 67875600번째 서열의 CpG 부위는 염색체 #8의 67874178번째에 위치하고, 상기 염색체 #4의 76555366 내지 76556079번째 서열의 CpG 부위는 염색체 #4의 76555832번째에 위치하고, 상기 염색체 #1의 63782394 내지 63790471번째 서열의 CpG 부위는 염색체 #1의 63789278번째에 위치하고, 상기 염색체 #5의 7849945 내지 7850439번째 서열의 CpG 부위는 염색체 #5의 7850070번째에 위치하고, 상기 염색체 #2의 39186777 내지 39187968번째 서열의 CpG 부위는 염색체 #2의 39187533번째에 위치하고, 상기 염색체 #14의 74207665 내지 74208665번째 서열의 CpG 부위는 염색체 #14의 74208165번째에 위치할 수 있다.
본 발명의 다른 측면에 따르면, 염색체 #2의 25438725 내지 25439276번째 서열, 염색체 #12의 95941906 내지 95942979번째 서열, 염색체 #10의 134597357 내지 134602649번째 서열, 염색체 #8의 144649774 내지 144651774번째 서열, 염색체 #1의 47998899 내지 47999517번째 서열, 염색체 #2의 26394102 내지 26396102번째 서열 염색체 #8의 104510870 내지 104513913번째 서열, 염색체 #8의 98289604 내지 98290404번째 서열, 염색체 #2의 63281034 내지 63281347번째 서열, 염색체 #8의 67873388 내지 67875600번째 서열, 염색체 #4의 76555366 내지 76556079번째 서열, 염색체 #1의 63782394 내지 63790471번째 서열, 염색체 #5의 7849945 내지 7850439번째 서열, 염색체 #2의 39186777 내지 39187968번째 서열, 및 염색체 #14의 74207665 내지 74208665번째 서열로 이루어진 군에서 선택되는 CpG 부위에 결합하는 프로브를 포함하는 간암 발병 위험도 진단용 키트가 제공된다.
상기 프로브는 혼성화 어레이 요소(hybridizable array element)로서 이용될 수 있고 기체(substrate) 상에 고정화될 수 있다.
상기 기체는 적합한 견고성 또는 반-견고성 지지체로서, 예컨대, 막, 필터, 칩, 슬라이드, 웨이퍼, 파이버, 자기성 비드 또는 비자기성 비드, 겔, 튜빙, 플레이트, 고분자, 미소입자 및 모세관을 포함할 수 있다. 상기 혼성화 어레이 요소는 상기의 기체 상에 배열되고 고정화될 수 있다.
상기 고정화는 화학적 결합 방법 또는 UV와 같은 공유 결합적 방법에 의해 실시될 수 있다. 예컨대, 상기 혼성화 어레이 요소는 에폭시 화합물 또는 알데히드기를 포함하도록 변형된 글래스 표면에 결합될 수 있고, 폴리라이신 코팅 표면에서 UV에 의해 결합될 수도 있다. 또한, 상기 혼성화 어레이 요소는 링커(예: 에틸렌 글리콜 올리고머 및 디아민)를 통해 기체에 결합될 수 있다.
상기 마이크로어레이에 적용되는 시료 DNA는 표지(labeling)될 수 있고, 마이크로어레이상의 어레이 요소와 혼성화될 수 있다. 혼성화 조건은 다양하게 변경할 수 있고, 혼성화 정도의 검출 및 분석은 표지 물질에 따라 다양하게 실시될 수도 있다.
상기 프로브의 표지는 혼성화 여부를 검출케 하는 시그널을 제공할 수 있으며, 올리고뉴클레오타이드에 연결될 수 있다.
상기 표지는 형광단(예컨대, 플루오리신(fluorescein), 피코에리트린(phycoerythrin), 로다민, 리사민(lissamine), 그리고 Cy3와 Cy5(Pharmacia)), 발색단, 화학발광단, 자기입자, 방사능동위원소(P32 및 S35), 매스 표지, 전자밀집입자, 효소(알칼린 포스파타아제 또는 호스래디쉬 퍼옥시다아제), 조인자, 효소에 대한 기질, 중금속(예컨대, 금) 그리고 항체, 스트렙타비딘, 바이오틴, 디곡시게닌과 킬레이팅기와 같은 특정 결합 파트너를 갖는 햅텐을 포함할 수 있으나, 이에 한정되는 것은 아니다.
상기 표지는 당업계에서 통상적으로 실시되는 다양한 방법, 예컨대, 닉 트랜스레이션(nick translation) 방법, 무작위 프라이밍 방법(Multiprime DNA labelling systems booklet, "Amersham"(1989)) 및 카이네이션 방법(Maxam & Gilbert, Methodsin Enzymology, 65:499(1986))에 의해 라벨링될 수 있다.
상기 표지는 형광, 방사능, 발색 측정, 중량 측정, X-선 회절 또는 흡수, 자기, 효소적 활성, 매스 분석, 결합 친화도, 혼성화 고주파, 나노크리스탈에 의하여 검출할 수 있는 시그널을 제공할 수 있다.
상기 분석 대상이 되는 핵산 시료는 다양한 생시료(biosamples)에서 얻은 mRNA를 이용하여 제조할 수 있다. 상기 프로브 대신에 분석 대상이 되는 cDNA를 표지하여 혼성화 반응-기초 분석을 실시할 수도 있다.
상기 프로브를 이용하는 경우, 프로브를 cDNA 분자와 혼성화시킬 수 있다. 상기 적절한 혼성화 조건은 최적화 절차에 의하여 일련의 과정으로 결정될 수 있다. 상기 절차는 연구실에서의 사용을 위한 프로토콜을 수립하고자 당업자에 의하여 일련의 과정으로 실시될 수 있다.
예컨대, 온도, 성분의 농도, 혼성화 및 세척 시간, 완충액 성분 및 이들의 pH 및 이온세기 등의 조건은 프로브의 길이 및 GC 양 및 타깃 뉴클레오타이드 서열 등의 다양한 인자에 의존한다. 상기 혼성화를 위한 상세한 조건은 Joseph Sambrook, et al., MolecularCloning, A LaboratoryManual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001); 및 M.L.M. Anderson, NucleicAcid Hybridization, Springer-Verlag New York Inc. N.Y.(1999)을 참조할 수 있다.
예컨대, 상기 엄격조건 중에서 고 엄격조건은 0.5 M NaHPO4, 7% SDS(sodium dodecyl sulfate), 1 mM EDTA에서 65℃ 조건으로 혼성화하고, 0.1 x SSC(standard saline citrate)/0.1% SDS에서 68℃ 조건으로 세척하는 것을 의미할 수 있다. 또는 상기 고 엄격조건은 6 x SSC/0.05% 소듐 파이로포스페이트에서 48℃ 조건으로 세척하는 것을 의미할 수 있고, 저 엄격조건은 0.2 x SSC/0.1% SDS에서 42℃ 조건으로 세척하는 것을 의미할 수 있다.
상기 혼성화 반응 이후에, 혼성화 반응을 통하여 나오는 혼성화 시그널을 검출할 수 있다. 예컨대, 상기 프로브가 효소에 의해 표지된 경우, 상기 효소의 기질을 혼성화 반응 결과물과 반응시켜 혼성화 여부를 확인할 수 있다.
상기 효소 및 기질은 퍼옥시다아제(예컨대, 호스래디쉬 퍼옥시다아제)와 클로로나프톨, 아미노에틸카바졸, 디아미노벤지딘, D-루시페린, 루시게닌(비스-N-메틸아크리디늄 니트레이트), 레소루핀 벤질 에테르, 루미놀, 암플렉스 레드 시약(10-아세틸-3,7-디하이드록시페녹사진), HYR(p-phenylenediamine-HCl 및 pyrocatechol), TMB(tetramethylbenzidine), ABTS(2,2'-Azine-di[3-ethylbenzthiazoline sulfonate]), o-페닐렌디아민(OPD) 및 나프톨/파이로닌; 알칼린 포스파타아제와 브로모클로로인돌일 포스페이트(BCIP), 니트로 블루 테트라졸리움(NBT), 나프톨-AS-B1-포스페이트(naphthol-AS-B1-phosphate) 및 ECF 기질; 글루코오스 옥시다아제와 t-NBT(nitroblue tetrazolium) 및 m-PMS(phenzaine methosulfate)가 사용될 수 있다.
상기 프로브가 금 입자로 표지된 경우에는 실버 나이트레이트를 이용하여 실버 염색 방법으로 검출할 수도 있다.
상기 간암의 예후 또는 위험도를 평가하는 방법은 다양한 통계처리 방법을 통해 간암 진단 가능성을 평가할 수 있다. 통계적 처리 방법으로 일 구현예에서 머신 러닝(Machine learning) 방법이 사용되며, Maxwell W. Libbrecht, 2015, Nature Reviews Genetics 16: 321-332를 참조할 수 있다.
상기 머신 러닝은 인공지능의 한 분야로 패턴인식과 컴퓨터학습 이론의 연구로부터 진화한 분야이다. 머신 러닝은 경험적 데이터를 기반으로 학습을 하고 예측을 수행하고 스스로의 성능을 향상시키는 시스템과 이를 위한 알고리즘을 연구하고 구축하는 기술이다. 머신 러닝의 알고리즘은 엄격하게 정해진 정적인 프로그램 명령들을 수행하는 것이라기 보다, 입력 데이터를 기반으로 예측이나 결정을 이끌어내기 위해 특정한 모델을 구축하는 방식이다.
이하, 실시예를 통해 본 발명을 더욱 상세히 기술한다.
실시예 1. 간암 발병과 관련된 DMP 선정
샘플
간암 발병과 관련된 DNA 메틸화 지역을 선별하기 위해 서울대병원의 간암환자 184명으로부터 간암 샘플을 얻었다. 간암조직과 상응하는 정상조직은 정상 대조군으로 사용하였다.
컬럼 기반의 DNA 추출 방법( PureLink™Genomic DNA Mini Kit, Invitrogen)과 비드(Bead) 방식의 DNA 추출 방법 (MagListo™5M Genomic DNA Extraction Kit, Bioneer)을 이용하여 각각의 샘플에서 genomic DNA를 추출하였다. 추출된 genomic DNA는 nanodrop를 이용하여 정량하였으며, DNA 상태는 1.5% agarose gel에서 전기영동하여 degradation여부를 확인하였다.
바이설파이트(Bisulfite) 처리
Genomic DNA 에 바이설파이트(Bisulfite)를 처리하면 DNA 염기서열 중 5'-CpG-3' 부위의 사이토신이 메틸화된 경우에는 그대로 유지되지만, 비메틸화된 경우에는 우라실로 바뀌어서 메틸화 정도를 측정할 수 있다.
따라서, 메틸화된 시토신과 비메틸화된 시토신을 구별하기 위하여 genomic DNA를 바이설파이트로 처리하였다. 700ng 의 genomic DNA를 EZ DNA Methylation Kit (Zymoresearch Inc.)을 이용하여 제조사의 매뉴얼에 따라 처리하였고, 이렇게 만들어진 바이설파이트 처리된 DNA를 M-Elution Buffer 로 녹여서 사용시까지 -80℃ 에서 보관하였다.
바이설파이트 처리된 DNA는 1달 이내에 사용하였다.
DNA 메틸화 마이크로어레이
Infinium( Human Methylation 850K BeadChip을 사용하여, DNA 메틸레이션 마이크로어레이를 수행하였다.
Illumina Infinium MethylationEPIC BeadChip kits (Illumina, Inc., San Diego, CA)을 이용하여 제조사의 매뉴얼을 따라, 바이설파이트 처리된 DNA를 증폭하고, 절단(fragmentation), 침전(precipitation) 및 재현탁(resuspension)한 후 BeadChip에 혼성화(hybridization)하였다.
세척 후, BeadChip을 Illumina iScan scanner을 이용하여 스캔하였다.
R 패키지 중, minfi 패키지를 이용하여 패키지의 매뉴얼에 따라 데이터의 품질 관리 (quality control)을 진행했다. 품질 관리 기준을 통과한 샘플들에 한하여 메틸화 정도가 색으로 표시된raw data의 idat 파일을 수치화한 값인β 값을 계산하였다.
DNA 메틸화 정도는 0~1 값을 갖는 β값으로 표시되며 β값 0은 해당 CpG 부위가 완전히 비메틸화 된 것을 의미하며, 1은 완전히 메틸화된 것을 의미한다. 산출된 결과를 표준화 하고 보정하였다. 모든 통계는 R 통계환경(v.3.3.2 이상)에서 수행되었다(도 1).
실시예 2. 진단 마커 후보군 선정
도 1을 참조하면, 182명의 간암 및 이에 상응하는 간 정상 샘플에서 DNA 추출하여 Infinium Methylation EPIC BeadChip을 진행하였다.
자체적으로 구축한 파이프라인으로 메틸화 데이터(methylation data)를 분석하였다. 정상에서 메틸화가 낮고, tumor에서 메틸화 수준이 높은 프로브(probe)를 선정하였다.
먼저 정상과 암 샘플의 메틸화 차이를 보이는 DMP를 선정하였다.
정상 샘플에서 메틸화 수준이 매우 낮고, 70% 이상의 암 환자에서 메틸화가 50% 이상으로 매우 높은 7개의 프로브를 선별하고, 기계학습 방법으로 효율을 검증하였다(도 1, 남색).
정상 샘플에서는 methylation 이 10%이하로 매우 낮고, 간암 환자에서 평균적으로 30% 이상으로 높은 프로브를 선별하고, 기계학습을 진행하여 간암/간정상 샘플을 효과적으로 구분하는 상위 9개의 프로브를 선별하였다(도 1, 갈색).
최종적으로 선별된 15개(1개 중복)의 간암 진단 마커 후보군을 다양한 실험을 통해 검증하였다.
실시예 3. Heatmap을 통한 프로브 선별
182 간암 샘플 및 127 정상 샘플의 DNA 메틸화를 조사한 결과, 5% 이상의 간암 샘플에서 30% 이상 과메틸화된 100,053 DMP(differentially methylated probes)를 선별하였다.
정상/암 샘플간의 차이를 보이는 DMP중에서 혈액 생검이 가능하도록 정상 샘플에서 methylation이 10%이하로 매우 낮은 13,078 probes를 선별하였다.
선별된 프로브 중에서 70% 이상의 암환자에서 50% 이상 과메틸화된 7개의 프로브를 선별하였다(표 2).
구분 프로브 ID 50% 이상 과메틸화된 간암 비율( % )
프로브 1 cg20172627 78.16
프로브 2 cg22538054 77.59
프로브 3 cg27583690 74.14
프로브 4 cg19951303 72.99
프로브 5 cg22524657 71.84
프로브 6 cg24563094 70.11
프로브 7 cg25744484 70.11
선발된 7개의 프로브의 간암 환자별 메틸화 값을 확인한 히트맵을 작성하였다(도 3).
실시예 4. 기계학습을 통한 프로브 선별
정상/암 샘플간의 차이를 보이는 DMP중 정상 샘플에서 메틸화 수준이 매우 낮고, 간암 환자에서 평균적으로 30% 이상 높은 프로브를 선별하였다.
상기 프로브를 이용해 기계학습을 진행하여 간암/ 간정상 샘플을 효과적으로 구분하는 상위 9개의 프로브를 선별하였다.
도 4를 참조하면, 청색원은 하나의 프로브를 의미하며 중요도가 높은 순(x, y축)으로 상위 9개의 프로브를 선별하였다.
X축은 기계학습으로 구축된 모델에서 각 프로브의 정확도를 의미하고, Y축은 기계학습으로 구축된 모델에서 각 프로브의 순수도를 의미한다.
기계학습으로 선별된 9개의 프로브의 메틸화 정도를 200명의 whole blood, 125명의 정상 샘플, 180명의 간 암 샘플에서 메틸화 값을 확인한 히트맵을 작성하였다(도 5).
실시예 4 및 5의 방법을 통해 최종적으로 선별된 15개의 프로브 정보는 하기 표 2와 같다.
서열번호 프로브 ID 선별방법 CpG 위치 CGI
region
염색체 start end
1 cg20172627 heatmap chr2 25438725 25439276 Island
2 cg22538054 heatmap chr12 95941906 95942979 Island
3 cg27583690 heatmap chr10 134597357 134602649 Island
4 cg19951303 heatmap chr8 144649774 144651774 N_Shelf
5 cg22524657 heatmap chr1 47998899 47999517 Island
6 cg24563094 heatmap chr2 26394102 26396102 N_Shore
7 cg25744484 heatmap chr8 104510870 104513913 Island
8 cg18233405 기계학습 chr8 98289604 98290404 Island
9 cg25622366 기계학습 chr2 63281034 63281347 Island
10 cg20980783 기계학습 chr8 67873388 67875600 Island
1 cg20172627 기계학습 chr2 25438725 25439276 Island
11 cg03757145 기계학습 chr4 76555366 76556079 Island
12 cg08112534 기계학습 chr1 63782394 63790471 Island
13 cg25214789 기계학습 chr5 7849945 7850439 Island
14 cg11176990 기계학습 chr2 39186777 39187968 Island
15 cg27640070 기계학습 chr14 74207665 74208665 -
실시예 6. 단일 프로브 간암 진단 효율 평가
선별된 15개의 프로브의 간암 진단 효율을 평가하였다(도 6). 도 6은 프로브 별 간암 진단 효율을 AUC로 표시한 결과이다.
15개의 프로브를 단독으로 사용해서 간암 진단 효율(AUC; area under the curve)을 확인한 결과는 하기 표 3과 같다.
서열번호 프로브 ID 선별 방법 Acuu . Sen. Spe . AUC
1 cg20172627 heatmap 0.908 0.922 0.887 0.957
2 cg22538054 heatmap 0.888 0.878 0.903 0.947
3 cg27583690 heatmap 0.863 0.856 0.873 0.938
4 cg19951303 heatmap 0.837 0.889 0.762 0.914
5 cg22524657 heatmap 0.811 0.822 0.794 0.906
6 cg24563094 heatmap 0.889 0.922 0.841 0.953
7 cg25744484 heatmap 0.882 0.889 0.871 0.949
8 cg18233405 기계학습 0.948 0.944 0.952 0.960
9 cg25622366 기계학습 0.908 0.889 0.936 0.936
10 cg20980783 기계학습 0.888 0.878 0.903 0.954
11 cg03757145 기계학습 0.909 0.922 0.889 0.960
12 cg08112534 기계학습 0.855 0.889 0.807 0.936
13 cg25214789 기계학습 0.863 0.889 0.825 0.912
14 cg11176990 기계학습 0.882 0.922 0.823 0.961
15 cg27640070 기계학습 0.895 0.900 0.889 0.939
또한, Public DB에서 단일 프로브의 간암 진단 효율을 검증하였다(도 7). 도 7은 프로브 별 간암 진단 효율을 AUC로 표시한 결과이다.
TCGA LIHC methylation data(450K)를 이용해서 단일 프로브의 효율을 검증한 결과는 하기 표 4와 같다.
회색으로 표시된 영역은 Infinium Methylation 450K BeadChip에는 없고 Infinium Methylation EPIC BeadChip(850K)에만 있는 프로브를 의미한다.
서열번호. 프로브 ID 선별 방법 Acuu . Sen. Spe . AUC
1 cg20172627 heatmap 0.916 0.918 0.900 0.957
2 cg22538054 heatmap 0.797 0.786 0.880 0.897
3 cg27583690 heatmap 0.764 0.754 0.840 0.855
4 cg19951303 heatmap - - - -
5 cg22524657 heatmap 0.816 0.815 0.820 0.902
6 cg24563094 heatmap 0.870 0.876 0.820 0.919
7 cg25744484 heatmap - - - -
8 cg18233405 기계학습 0.893 0.902 0.820 0.919
9 cg25622366 기계학습 0.888 0.879 0.960 0.967
10 cg20980783 기계학습 0.897 0.897 0.900 0.935
11 cg03757145 기계학습 0.890 0.879 0.980 0.939
12 cg08112534 기계학습 - - - -
13 cg25214789 기계학습 0.881 0.887 0.840 0.916
14 cg11176990 기계학습 0.846 0.852 0.800 0.933
15 cg27640070 기계학습 - - - -
또한, 15개 패널 프로브의 간암 진단 효율을 분석하고자, 15개의 프로브를 통합하여 간암 진단 효율(AUC; area under the curve)을 확인하였다(도 8). 도 8은 15개 프로브로 기계학습을 진행하여 나온 훈련데이터 및 검증데이터의 confusion matrix 결과이다(2차 교차 검증).
데이터의 편향을 방지하기 위해 무작위로 2개로 나눠주는 2차 교차검증 방법을 10번씩 진행해 테스트 세트(Testing set)와 트레이닝 세트(Training set)로 분류하였다.
트레이닝 세트로 분류된 데이터를 기반으로 정상과 간암의 패턴을 학습하고, 그에 따른 간암 특이적 진단 모델을 구축하였다.
하기 표 5는 트레이닝 세트의 오차행렬이다.
입력 값 정상 판정 간암 판정 오차율
정상 62 1 0.159
간암 3 87 0.333
상기 트레이닝 세트로 구축된 간암 특이적 진단 모델을 기반으로 테스트 세트을 진단하여 간암 진단 효율을 확인하였다(표 6).
샘플 정상 판정 간암 판정
정상 61 0
간암 1 90
표 5 및 6을 참조하면, 머신 러닝을 기반으로 선발된 15개의 프로브로 간암 특이적 진단 모델을 구축할 수 있었으며, 진단 효율은 매우 높은 수준으로 평가되었다.
실시예 7. 복수의 프로브를 이용한 간암 진단 효율 평가
상기 간암 특이적 진단 모델을 기반으로 15개의 프로브 중에서 최대효율을 가지는 최소 프로브 개수를 찾기 위해 프로브의 개수 별 효율을 측정하였다(도 9).
도 9는 가능한 프로브 조합에 대해서 기계학습을 진행하여 산출된 결과이다(2차 교차 검증). X축은 프로브 개수를 의미하고, Y축은 AUC(진단 효율)을 의미한다.
도 9를 참조하면, 프로브 개수가 3개 이상일 때 진단 효율이 99% 이상으로 수렴하므로, 매우 정확한 진단 정보를 제공할 수 있다.
따라서, 단일의 프로브를 이용할 때와 비교하여 복수의 프로브를 이용할 때 진단의 정확도가 현저히 개선될 수 있다.
실시예 8. 파이로시퀀싱을 통한 프로브를 포함하는 CpG 섬의 메틸화 분석
선별된 프로브 중 프로브가 결합되는 CpG 부위의 메틸화 정도를 측정하기 위해 파이로시퀀싱을 실시하였다.
파이로시퀀싱은 뉴클레오티드 첨가에서 방출된 파이로포스페이트(PPi)를 이용한다. PPi는 ATP 설퍼릴라아제에 의해 아데노신 5' 포스포설페이트의 존재 하에서 ATP로 변환된다.
루시퍼라아제는 ATP를 사용하여 루시페린을 옥시루시페린으로 변환하고, 이 반응은 탐지되고 분석될 수 있는 빛을 생성한다.
선발된 프로브의 CpG 부위의 메틸화 정도를 히트맵으로 나타내었다(도 10).
확인결과, normal에서 메틸화 수준이 낮고 tumor에서는 메틸화 수준이 높은 것으로 나타났으며, 선별된 프로브의 CpG 부위와 그 주변의 메틸화 정도가 유사한 것으로 확인되었다.
실시예 9. EpiTYPER을 통한 프로브를 포함하는 CpG 섬의 메틸화 분석
데이터의 검증을 위해, 프로브들 중에서 상위 3개의 프로브의 메틸화 상태를 EpiTYPERTM assay(Sequenom, San Diego, CA)를 이용하여 정량적으로 분석하였다.
PCR 증폭 이후 시험관 내에서 전사시킨 증폭조각(amplicons)들을 shrimp alkaline phosphatase로 처리하고, RNaseA로 절단한 후, 메틸화 상태를 결정하기 위해 MALDI-TOF Mass Spectrometry에 넣어 주었다.
결과는 EpiTYPERTM ver. 1.0 software을 이용해 분석하였다.
선발된 3개의 프로브에 대해서 EpiTYPER로 validation을 진행하였다. 선발된 프로브와 그 주변의 CpG 부위의 메틸화 정도는 히트맵으로 확인하였다(도 11).
도 11을 참조하면, normal에서 메틸화 수준이 낮고 tumor에서는 메틸화 수준이 높은 것으로 나타났으며, 선별된 프로브의 CpG 부위와 그 주변의 메틸화 정도가 유사한 것으로 확인되었다.
따라서 CpG 프로브를 포함하는 CpG 섬 전체의 메틸화 수준도 암 예후 및 위험도 진단에 동일하게 사용될 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 후술하는 청구범위에 의하여 나타내어지며, 청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
<110> Yonsei University <120> A METHOD FOR ASSESSING RISK OF HEPATOCELLULAR CARCINOMA USING CPG METHYLATION STATUS OF GENOME <130> DP-2017-1051 <150> KR 10-2017-0156527 <151> 2017-11-22 <160> 44 <170> KoPatentIn 3.0 <210> 1 <211> 552 <212> DNA <213> Homo sapiens <400> 1 tcgccctctg gctcggcacg gaggggggcg ctcagccttt ctggggcaaa tttagtaata 60 tgggacccga gccctcgacc cgaaatacgc ccgaggcatt tatcctaaaa aacgacaagg 120 tccgggcgcc cagcagaacg gcccggctcg accgcgcgca gcttgcaggc aggggggtgt 180 gcaggtcacc gcgccacccc ggcgagcaga gccgcggagg gcgccacgtc ggtgcgctgg 240 ccccgcccga gcggggcggg accttcctgt acccccggaa gcccccgcgg gcagctgggg 300 aggaaaccgc ggccacgcgc tcggggggcc cggctcggga agggcagtgc gcgcgcatgc 360 gttggggcgg ggcgcctggg acctgcgggc cccaggccca gcgcgccgcc agccggagtg 420 cccggcgccc gtcgaaaggc ccctgcgccg gttcaggacc cgcacccagc tacgctgcgg 480 agccccagct cgcagcaccc tcccacccac cgctcctggc tgcttttctc ctgagtctgc 540 ggggcggggt cg 552 <210> 2 <211> 1074 <212> DNA <213> Homo sapiens <400> 2 gcggcagcag gtgccggcag cgcggggacc gatcgatgga gagaaggcgg gcaagacgcc 60 gggaagcgca ttcctcctca accgagtgcc acaaccgccc tcccgaagtg ccccggggct 120 tcgagcatca cctcgcggta atccgggagg gtggagggat gcggctggac ccgggcgttg 180 cgtgctccac acagcgccca gcccgtgcca gccccgcgcc cacctctcca cgacgctcgt 240 gccgggatca gcgcgaagcc ccttccagtc cccgaagccc tcgcccgcgc ccgttctccc 300 ccagctcgcc ccctccagcc cgctgcgcct tgccgcagca tctccgggca ctctgaggct 360 gccgccggga cagggtcgga gcgccgcaga acccaccgaa acttcccagg ggggcaattc 420 aaaattcgcc ggacgcgtcg ccgccgcgcg cccctcggct cattcccttc cgcgcgcccg 480 cagccccagg ctctccctct ctcaggaccc cccagcgccc tgcgcggcga gaataggccc 540 ccaggtgcct cccggccccg ggggctgccg tcgcacgtcc gctcccgcag gggtcctcac 600 tccgccaatc gccgcggccg cgcgccctcg cgcacactca ccagcccgag ccggggcggc 660 catcttagcg ctcaccccgg ccccccgccc cccggttcgg cggccgcgac gacccggtgc 720 ggcggctacg acagccgtga cgcgcagcag gccccgcccc ctcccacagc cccacccctg 780 cgccggctct tcgcgggcac cgagaacctg ccggtggccg ccttccgcgc ctcgtggggg 840 ggtcggggcc acggacggtc cccggcgccg caagtgggtc tgcgcgaaca acaagcactg 900 cctccccggg cgggcttcgc acctgtagtg ccgtcgggac acgggagggt aaacccagcg 960 tgtcctgtgt gcctgtgagc cgcagaatca tccacggacg tcgttagtcc ttcctggaat 1020 ttctgcgatt tacacaacgt cgaattgttt ggcagaaacg cgtggcaaac tccg 1074 <210> 3 <211> 5293 <212> DNA <213> Homo sapiens <400> 3 acgcgccgag tttaagccct ttctatttcc ctttaacgct tccgcaaatg ccaagagaaa 60 tcgtaccacc gcagtgatat cattatttac atttaatttt taaaaattaa aactcaacag 120 ccacgcccat taagatgcag cgatgggcag ccccggccac agaggctgcg ggaggctgga 180 ggggttttgt cagccgcagt cacagccccg cggagctggc ggcatttcag ggcaggagac 240 gggtcccccg agcccccggc tgggcgctgc gggccttgcc cagggggcct ccggctccct 300 gaccccgcgt gacccacggg aggccccgcc gctccgcggg cggaattatt tcggatttct 360 ctttgcggtc ctagttcgga agaaactgct ttccaccgcg ggaagatctg gcgggatggt 420 gaccgaaggg cctccgtgca gcggatcaga cccggttcca ccggctgagc ccagggcggg 480 cctatgggat ccgctgatgc gcagagggac tttggaaata atcagagcga agccctcggc 540 caagcgggaa cgggtgcccg gtggcaacga gtacgtggcc ccaaagcggg aaaacggaag 600 aagaaaaacc tcccgcgggg actcgaggcg ggtacgcggc tcacccgccc tttcgggaac 660 ccccaagcgc gtccgaatcc gccccgaggc gaggcgggcc gggccgtacc tgctgctccg 720 tccccggctc cgtcccgggc tcctggcggc tgtcgctgcg gttccttccc gcgggccggg 780 ccccttccct gcgccttcgc cgcctcctcg cgcctgcccg gggcccgcag cctccgcacc 840 gggaacccgg aggacccgag gcgggcgcag gggcgaagcc ggggccgggg aggggccgcc 900 tcgctccggg ttcgagacgg aagaaacacg cggcgcaggc tccggagcga cggctccgac 960 ggggacccgt taaataattt attgatgata caaagcgact cgcgcccacc cggggccgcc 1020 cccggattct gcaaaaatag attcgccccc accccgcggg tcctcacaag gcgtcccccg 1080 cgccgccgcc gcacgggctg accagcgcca agttcgaggg tttgtgcttc ttgagcagcc 1140 gcgtgatctt ctcgtcgtcc gagttggggt ccaggggccg gttgtattcg tcgtcgtcct 1200 ccgcgtccga gccgcccacc ttcagcttct cggcgtccga gtcctgcttc ttcttggccg 1260 acgccatctc caccgcgtgc cgcttgcgcc acttggtccg gcggttctgg aaccagacct 1320 gggagtggac ggggcggtca ggcggccgcg gggcccgggg ctggcgctgg ggccgttcgc 1380 aggacgcggg cccccggctc tgctctcccg agccccgccg cgctcacctt cacctggctc 1440 tcggtcatgc ccagcgagta ggcgagacgc gcgcgctccg ggcccgccag gtacttggtc 1500 tgctcgaagg ttttctccag cgcgaagatc tgctggcccg agaaggtcgg gcgcgagtgc 1560 ttcttcttcc cgtccttgtc caggacgccg ccggccgggg ctgcaaggga ggggaaggga 1620 gggaggtcag cggccggcgg ggtccccctc cgcgcccacc cgccccgcac cccccgcgcg 1680 ggccactcac ccgggccagc cagacgcggg tccctccagg gcgcgccctg caccacgccg 1740 ggccagaaga tgggcgggcg ccccggcagc tcggccaggg gcttggggta gccgcgcgcc 1800 acagcggccg cgggcccgaa gtaaacgccg gcggacgacg cgagcccgtt gagccggggc 1860 agccccccca ggaggccccc gcccgccgcg cccacgggcc ggcccaggat gtcgctgatg 1920 ccgtgcgggg tcccgagcgg gagctgcgcg cccaggcccc ccagcgcggg cgccttgaag 1980 ccggccggac cctgcagcgc gtaggggaac agcgacgtct tcatctcggc catgttgtgc 2040 agcgcggcca gcggggcact gctcagcacg aacgcgcccg ggcggttagt gtccatgggc 2100 gccgccgccg ccggcccggg ctcccatccg ggccccgccg ccgccgcccc tgcccgccgg 2160 cccgggaagt ttgcgcgcgg cccgggcggg cgtcggctgc agcgcggggc gcggggcgcg 2220 gggggcgggc gggcggctcc ggcgcggggc gggcgggcgg gcggcggcgg cggcggctcc 2280 ggggccggtc ggagcggcgc cgcgcgggac ggacgcgctg ataacggggg ctccccgggg 2340 cgcggcgcgc gcgctgattg gctgcggacc ccgcggtccg gccattggcc ggcgcccccc 2400 ccccgcccgc gcgcccccgc cggccgcgca ctccatgaag ggcccattag cgcggcaggt 2460 gcctcccggg ctgtaaattc gccccgattt atctccccgg ggacgaaata aatccagctt 2520 ggatgggagt gtagttaggc aaaggttttc atgcgaaatc aggaaaaaat acgagaacgt 2580 attttattaa cggaaagaat gcagatttga ggacccgccc gcgcgctcgg agcgccccac 2640 tcggggaaga gtcccggccc gcgtcccagt cgcgactgct ccgccgcccg tggctggggt 2700 gggtgtgagc ggcagcggac gccggcgggg aacgcgctcc gggcaggtcg gggccacagg 2760 agggcggagg acgcgggcct cgagtccacg gaatccacgg gcctcacggc cgggcgaggc 2820 tcgcacggag ctgcctctgg tttcgccgac acgcggccgg cgcggtggag gagtgaggca 2880 ggcgggagcg gggcggggag gcgggtcccg ggaccacacg cgcggctcgg cacttccccg 2940 tcatcggcct ccaggtctcc cgctgggggt cccccaggat gtgacctggg cccacgactt 3000 cgcccacggg ccgcctctcg cgaatccccg gccgggagaa cagagaccag gacggcctca 3060 gcgcggaagc cctgtccagg gcccgaacgt gggtgcgggc tgggggcgca gcggcagaaa 3120 cgcggcctta gacgcgcgcg gggggccggt gtcccccccg cccccacggc accgggagcc 3180 gctcgctcat ccatcccgca gaccgggcgg tgagatgact ccgagccccg cgcacggcgg 3240 ccgcgagcaa acgctccgac gtctgtggtg acgtctcgta ttgatttagg gacacggggc 3300 ggctgtggct gtggcccacg gctcgtgggg agcccgagtc tgtgcgcagg gaacgccgct 3360 gcgtggcctc tctcgggcct gtgccgcgga ggaaggcggc gcccggggtt cggggccggg 3420 gtctcacgtc cgccccctcg cccccctcca gcgtccgttt tcgttttgtg caggtcgagg 3480 cggggacttg gcgccgtcgg ccgctcctgg atggcggctt ggaaaagcca cctgcggcca 3540 aactccgggg cagtggtgcg gccgccgggt gtgtgcgcgc tcggggctgc cccggcggct 3600 tccggctcca ctgaggtgca gccccgcgtt cacggggggt tcgcttcccc cgtcgactcc 3660 gcactcgatt cgactgggat tgggattcga ttgggcgcgg ccgccccacc ggtgatcggc 3720 ccccgcggag cctggcccgg gaacccccag cgcccgtccg gccccgagac ccgccccggc 3780 ctgtcctgcg ccccgctccc tcggaggaga cacgaggaag ggccctcccg ggtcgggttc 3840 gggcccctcc cagcacccca aggcgacggc gcccgcgccc aaggctcggg ctctgagctg 3900 agacgcggga actgcggggc cggggggggc gggcaggggg agttgggggc gggggctgct 3960 gtcgccctgg gatcccccac tctgcgcggc cgggcagacc ctgggcgggc cgggaggggt 4020 gcgggtcgcc cgaactgagg cccaggaggc gcgcgcgggc ggaacggcgg gaggaagccg 4080 cgctcgggac aggctctggc tcttctcaca gcctggaggg gcggggcagg gggcgtcgct 4140 agcgctgttt tatggctgag gaaacatgga cctggaggcg ctgcgctgcg gcccgataaa 4200 ccctgggtct gtctgcgccc cccggtcctc cctgggctgc cgagggaacg cgtggggtcg 4260 cgggtggggc tggcgtgtca ctggctgcgg agcgcgcggc tctccagggc tcaggggcgc 4320 gggatgaggg gccagggtga gttgggggcg cagaggagcc gggtaagggg gggtccctct 4380 cccacgttct tgtaagccgt ggaagtcttg gcgcgctccg caggtgccgc gtcctacccg 4440 gctccccggc ctgcgcccca cgcgctttcc cgccctcctc ctcgcggagc tgcgcgtggg 4500 tccggtggct tcacctccta cgcttcccgg cgcccactcc gggccccgtc ccctctccgg 4560 cccccgcccg caccttttct cctgcgtccc ccggtgccgc cctctcggaa accaccgagg 4620 caactccccc tcctcccggg aaggtccgag cgcctccgac cgcgatgtct ttgcctgggc 4680 tccgccgccc ggcggccccg ctgcctggag aggtccgcga tgccacctcc tggcccgcga 4740 gcagatgtcc cgcgaggaag gctgccggca tcggcgccga cgctccgcgc tggaaaaccg 4800 agagcgcggg gtttggcaga ggccattcaa gtttgtttta ctcgttcagc ctgtatttgt 4860 ggggctccta ccgcgcccgg gctgtccggg gggtgcaccg tgaacgcagc gggctccggc 4920 ccgggcgcgg gcgggtcaga gcagcaaacg cgctcccccg gcacccccgc ggcgtctgca 4980 ggggagcggg cgacggggag gacggcgggg gtgtcggccc ggaaggagag ccggcctagg 5040 ccccggtgtc cccgcgctgg gggctgaggg gcgacggggg aactccacag agggaaggag 5100 cctgcgttcg ccttcggccg cccaggccat agagttcaca aactctgatt tatcactgag 5160 gtgacttgtc ccgcgcagcc ctaggcgagt tgccaagctg cccgccctga ccgcgccccc 5220 aggccggggg tctcctagca gttcccggca aaggccctgc attgtctttt ttcccgaagt 5280 gagcgcattc ccg 5293 <210> 4 <211> 2001 <212> DNA <213> Homo sapiens <400> 4 gcctcaccct ggaacaggga gtccagcagg tcctggttga cacagccggg gctggcgtgg 60 tggacaagga agcctggacc acagcagatg catgagtgca ggccccacag ccccccaggg 120 ggaggctggc ccagctccca aagccccggt gccaggggca gtgtgacccc gggcggcctc 180 acctataagc acggcggctg cccggcgcag ggggtcctgt ggactccgca ggtagccctg 240 ggtctggctc aggaagttgg gcacgtggcc tgggtatcgc tgaacctggg gacaaaaggg 300 ctagtggcag gacaggaggg ctgatcctga gtgcggagga ggctgcagag ctgaatccag 360 gggccggggt tccaggggag cccccagggc aggtggcatg gtcggagacc ttggacttgc 420 cccaccagta gcctatctgg tttggctgca gtagaaacgg ttgggggccc cggtgaaccc 480 tggaacaagt gggctgctga tcataccccc ttgcggtcac cttgcttccc ctactgacca 540 ggcggcagca gaggtggctc agggcctcgg ggctgtcata gtgggccacg gtgaccaact 600 cctccagcag gccccagcaa aaggcgtggt cacagcgggc cagggtccac tctgagctct 660 gggatagggg aagtgagccg ggtcaggggt ccaggaagta gaaaggcaaa aggtggggtg 720 ggaagagggg gagcaagggc atcgggtgag gggcagaaga gcccagggca ggagactgga 780 ttgattctgc tcaagggaag agcagtagta acctggccgc ccgtcacacc tgccactgag 840 gtccttggga tgggtgagtc cctgacctgt aattgtcgga ggggaggcac ggtgggagtg 900 gtgagtgttg gatggcatag gggtgggatg gtgtcggggg ctgctgacct cagcagcgtc 960 cctgctgggg tcatgcaggc gcagcagcag cggcacgaga ctctgcagca ccagcttccg 1020 cagggggccg cggagcccca gccggagccc gccccggccc cggcgcacca gagtcccaag 1080 gagcccgacg gccgaggcgc ggattgagtc ccgtgtctgc gtgggagggc gcagtcaggg 1140 caggcggaga cagagagggg ctgcaagggt gggagggggc ggccagcgcg gagcgaggaa 1200 gcggcgggtc tagggaaggc tgctgactcg gtgtgatctg gggacaggga acagggcctg 1260 gagctggacc tggttgggaa gcctggagag cccctgcagg gggtggggct tgaagggatg 1320 gggtccggaa ggaaaagtcg agcggggagg agcttggcgg gacacggccc tggaggggcg 1380 gagctgggcg acagcaggcg ggaggggcgg gggcggtcag gagggaagaa atctgggacg 1440 gagacactgg ggggacgggg cctgggaggg agaaactgga ggggcggggc ggagcctggg 1500 aggtcagggc ctgggaggga cagactgaca gactgggggg cggggcatgg gaaggagaaa 1560 ctagaggggc gggcggggcc tgggaggcgg ggcctgggag ggagagactg taggggcggg 1620 gcggggcatg agagggagaa acaggagggg cggggcgggg cctgggaggg agactggggg 1680 cggggcctgg gagggagaga ctggaagggc ggggcggggc ctgagagggc ggggcctggg 1740 cgggagagac gggggcgggg cctgggaggg agagactgga agggcggggg cggtgacagc 1800 ggcaggggcg ggacccggag gcggggcgtt tgctcacgtc gtccagtagc ggagggaggc 1860 gcggtcccag ctccgcgctc aggagccgca caggcgcccg gggccgcagc aggagcctcc 1920 tcagggcgcc cagcgctgca cccacgagcc gcgcgtcgcc ttcgcccagt gcgcccagga 1980 gcgccggcag cagcgtgctc a 2001 <210> 5 <211> 619 <212> DNA <213> Homo sapiens <400> 5 ccgtccggga ctcgggggga ggcgcgctgg gtggtccggc agccgggggc gggcggtagc 60 ctgcaggcgt aattggcatg cacgccgttg tagctgagac cgcttaataa agcattacat 120 atctcaccgc ttccatattt cattacctca cgcggagcct gtgagagggc cctaatggga 180 gtcagctgtg tttttacttt ctgttgtcgg ccgggacggg tttctctgcg gattctttga 240 aatgaaataa tgtgatgcac gccgcgataa gggccggcct gtaatgaggc ccaggccgcc 300 gggcggctgc tattgctcca ggtgtcgcgt atttgggctg cgaggacaag gaggaggagg 360 gggcggcgcc ggaggatcgg gggggagggg gaagtcgcga ggggcagggg gtgggagaag 420 gcggagggag gaggcagggg gcagggggcg ggcggaagag gggaggaagg agggggcggc 480 gggccgcggc aggccaggcg ggagaagccg gagacagaga gaggacgggg acagtggcgg 540 cctgcagagc cctaggaacc cgggttcaaa tcctgcccgc cagcgtgaga gagcgtttgc 600 ccgcccaggc ggtccaccg 619 <210> 6 <211> 2001 <212> DNA <213> Homo sapiens <400> 6 ggctgccatt tctcatgggg ttcgagccat aagatgccag gtgtcagtca cctcagaaga 60 gagggttttg tttgtatttg gtggggttct tccgggggta ccgaggctga ggactgatgg 120 atcgaggcgg gtggatcact tgagttcgga gttcgagacc agcctggcca acatggcgaa 180 accctgtctc tactaaaaat acaaaaatta gccaggtgaa aaattagccg ggcatggtgg 240 tgcttgtctg taatcccagc tacatatgta attccagcta ctcaggaagc tgaggcagga 300 gaattgcttg aacctgcggg gcggaggttg cagtgagccg agatcgtgcc actacactcc 360 cgtgagggag cagcctaggg actaaggccc gctggctccg cgagatcagc caggcccgca 420 tcatccccca attacctgca gagggcgccg cagacacaga gagggcgagg ccgaggccga 480 ggccatctaa gcttctggga agggggtccc aaagggaggc cccgagctgg agtccagggg 540 gcttggaagg aagaggtgag gacagcagaa aaggaaacgc aaattaaaag aagggaacga 600 aggctgggcg cggtggctta cgcctgtaag tccagcactt tgggaggccg agtcgggagg 660 atcgcttgag gtcaggagtt caagaccagc ctggccaaca tggtgaaacg ccgtctctac 720 taaaaataca aaaaaattag ccaggagtgg tggcaggtgc ctgtcatccc agctactccg 780 caggctgagg tgggaggatc gcttgagccc gggaggtggg ggttgcagtg agccgagatc 840 gcgccactgc actccaggct gggtgataga gtgagaccca gtctcaaaaa aagagaagga 900 aaagagagaa gggatggtgg cggtggggga ggaaggcggt tcttgtaatg atccgagagg 960 agaccgcagc accggttacg ccctcgaacc tcggcctcct catctgcaga atggacgcag 1020 tccacaccgc gtgctgtgga agggttggag cgccggttta catgacacag ggctatcggc 1080 taagggggcg ctgggaacgt ggaaggtgct ctatggtggg gcgctgtagg gtgctcttgg 1140 gcagtagggt tggagtcaaa tctgggttga agtccaacct aggttgaagt cctggctgcc 1200 acctgacctc tgcccctcag tttgctcatc agtaaaatgg ggttaaggag gctgcctcgc 1260 ccagctccac ggagccggag gtgatgaagg tcctggaaga gcagaattca gaacccgagc 1320 tttgggcggc ggagcaggac agggcgcggg tgggcgcggc ctccgggagg ccagcacgag 1380 ggggagcggc ggggcccgga cacacccagc cagaaggagg aggccgaccc cgcgccgact 1440 ccgcagatgc cgctcgggac ttcgttgtcc ctccaggcgc ccgccctggg gtcctccatc 1500 acccgccgtc acctgggcgc ggggaagctg gcgggagggg aggcggggct tggcggcagc 1560 ggcgggtggg ggccggggag cgggggcagg ggcgggcgga cggagcgcgg ggctggggac 1620 ccggggtccc agaagggggc gcggggacgg ggtccgagga gagggggccg gggcggggca 1680 gggcggacag ggctgggggc ggaggtccgg gggtgggtcc ggcggcgagt ccgggtcggg 1740 gcggacagag cagggggcgg gggtccggga ggagggggcc ggggtccggg aggagggggc 1800 ggggcccggg ggcggggccg gggtcggcgc cctgcgggga ggccggccac gtgacgcccg 1860 cggcccggcg gggctgccag gcggcgagcg ccgcggcggc cccgggaggt ggcggcgggc 1920 gcgagagcct gggccgcgcg ggactgaccg tcggggcccc gggacggcgg ccccggggcg 1980 cccatgccat ggagaagctg g 2001 <210> 7 <211> 3044 <212> DNA <213> Homo sapiens <400> 7 gcgcgcgtgt ggaaggctgg gtggggtgcg cacacacgct cacttgtgta cgtacacaca 60 cacacacaca cacacacaca caggcacaca cacccgagct cagtcaccca cattgcttgc 120 ccagggcgcc tggaagagct ggcgagcccg cccagctctg ttcacccggc cccgccccgc 180 cccctccggg agggctctcc gggcggcgcc cagccccgag cagagcaaag gacggcggcg 240 gccacctccg ttctccggcc gctggtttct cgtctttcct cgtcctttca ttgaacccat 300 ctccgtgctt cgaaaatctg actctaaccc gatctcttcg cgtctccgcc tcttctttct 360 agagtgagcg ccaaaaaggg cctgacagac agaagccttt ggccccagca ccggcccagc 420 ccgtctctag acgattcttg ctcctttcac cctcacagcc tccagtggtc gcttcatctt 480 cgcaccctcc cggccaaccc taactctcct cgtctctcct cgcgctgtct cgcgtcctcc 540 cctcaggatc cttccgcaca ttctcagcgt ccagcgcggt ttcccacaac ttcctcacgc 600 cccgctcccc tcgccctgtc cccgccctcg acaccacctg cgttccccac tcgctccaac 660 ctccctcccc cgctatcccc acttgtgggc ctccagctct ctgccccttt cctggccccc 720 atccctgaca ccccagggac ccttcctccc tcctcacgtt ctccctcctt ccaggatccc 780 gccccgacac ttcggggccc tcccgctacg cgcactcttt ctcctcaggt cctgacacct 840 gggcgccccc tccctgtcac ccaccttcag ctccagccct gactctcggg cgccttgcca 900 cccttacgct ccccgccccg ccccggtccc tcgggcgccc ccactcgccg cctctacctc 960 cctacctgct acacctggca cccctgcccc cacccctgct catactcttc ccccgccccc 1020 gacacctcgg gcgccccctc acacgctcct attctccaca cttccgtccc cgaaaactcg 1080 ggcgccctct cccttcacgc tcagtctctc ctccctcccc gcccggcccc ggacccagcc 1140 tggagatcgc gctcgggagg ggcggctgcc gcccgcgggg cgcccgcggt gcccgggcct 1200 gggcagcgag gaggtgacgc cgcccccgcg ggatgagccc gggaggcgga ggggcggagg 1260 aggtgctggc ggcggcactg agcggcggcg gcgcagggcg cgcgggcctt ccgcgccgac 1320 tccatcgacc caaggggcgg cggcggtggc ggcggctgag cgaccctggg ccgggcgcgt 1380 gatgaggagg ggccggcgcc agaccccgct gcacgtcgga gctcgcctgg atccgggcgt 1440 tggcagccga agggccctgg ccccgggact ctccgccgct agcccccgtc atatcttctc 1500 cgctttcgct tctccactct agccgggggt ggggtgggtg gggttggggt ctccgcgggg 1560 gtttccggcc ccgcggcccg ctcccgggtg tgcctggagg agttctccct ctgtggcgcg 1620 cgggagccct gtgatgcgtc agccggcggg acggatgagt tgcttctccg ggaaaccgtc 1680 ctcgcttcct cacgaccctc tcggctcccg cctgggtgcc cctcgggccg gcagtactcc 1740 gcctccgggc gctcgaagcg agttccccgg gggcttgttc gcaggcaccc cttcccctcc 1800 gaggcggcgc gcgcgctccc ggccctgacc gcggccggac acactcgcgc cccggtccgc 1860 ctgtcgccct cccgcctgct ccctccagtc accccaccct tagctgtccc cgccacctta 1920 ctccaccacc ctcccccgcc tctccgcgca ctccgcgtcc cggcctccag ttcccctttc 1980 ccttgaaccg ctcacttcac agcccttcgc ccccgggaag aagaaacatt tcccgaagcg 2040 cactcctcag ccctccttcc ccacgcgctc gccctcccct ccccctgctt ttcttggggg 2100 aggggggctg tcgccttgga ttgaaggcca ttgatttgta tgtatttgtc ccagcgctgg 2160 aggctgcccc agccgccgcg ccggtgccgc cgctgccagt ggagttgcct ccccgcttcc 2220 ctagggtggt tcggctccac caaacatgtc ggctcctgtc gggccccggg gccgcctggc 2280 tcccatcccg gcggcctctc agccgcctct gcagcccgag atgcctgacc tcagccacct 2340 cacggaggag gagaggaaaa tcatcctggc cgtcatggat aggcagaaga aagaagagga 2400 gaaggagcag tccgtgctca agtaaggacc tggctccata ttcccgcctc tctccctgcc 2460 ctccgccccc tcgcccactg ccctgcggcc gcctgcgcgc cccagttcgc cgccctccct 2520 cccgctggcg gcgcccaggc cacgagggct gcggccagcg ccggccgccc gggctgtttt 2580 aggggtgtct gagagcaggg gtgtgtgtcg gggagggagg gcgccaaggc cggctgaggt 2640 gagggtggcg agccttaggc ggtgtgattt tccttggcgc ctttccggat ttcctcgctg 2700 gtcatcttgg ctccggggcc ccagcgggac tggggctgaa cccaggctct gtgcgtaccc 2760 tctcctttcc cgccgcgctg aggcagtgac tggggcacag aatccaatat ggccgtgcac 2820 aggtgctccc tggacggacc cgggcgaagg cgcgctggca ggggatgcgg acgccaccct 2880 ggtcccacgc ctccgcgggg cggctctacc agcaacgcgg gacagagcag ggctgcccac 2940 agtggctgcg agcagcgggc ggcggcgcgg gctaggggcc taagctctgt cgcggtcggg 3000 tgggtgtgcg tccgccgcca tcttccagcc cctccccctc ggcg 3044 <210> 8 <211> 801 <212> DNA <213> Homo sapiens <400> 8 ccgcggtgct acaggtttct ggggccttct tcccggcagg gccacgccgg tttccaacgc 60 ggggggcatt tttcggcctt cccacggttc ccgctgttcc cacgaagaca gtgtctgcgg 120 ccaggcgctc cgagagagat gcggccttcc ccgggccggg cctggccgcg gcctgcccgt 180 ggtcccccgc agctcgggcc cgcagcgcga ggccacagtc cagggggagc cggcaggcgg 240 cctcctcccc gagccggagg agctgcgcgg acgcagcggc ttccaggcca ccccaccccg 300 cgccagcctg cacctgtgcc gcctgggtgt cttccccgag actctggtac tgtgaagggt 360 ccgggtcgcg cggggcgtcg tccggagcag ggcggactcg ggctttggcg cggcctttgc 420 cccggttttt ggcgcgggag gactttcgac cccgacttcg gccgctcatg gtggcggcgg 480 aggcagcttc aaagacacgc tgtgaccctg cggctcctga cgccagctct cggtcgggac 540 cgagcgggtc tctccacggc aaccgccgac gtcacgaacg tacaactgta ccgtcgcgag 600 aggacgtgat gcgcccggtg attggcgccg ccgctgcggc tgcgcaggag acgacccccg 660 cgggcgctcc cacccccatc tcgcgcggac tcgctttagg tctcggcgag tttctctgat 720 atgcgctcgc gggggtgctg ccatttcatc tcttccgcgc gggctcatcg tgctctcagg 780 gtctcgttga acaaggcaac g 801 <210> 9 <211> 314 <212> DNA <213> Homo sapiens <400> 9 tcggccgccc gagggagttt cttttattcc cagttcggct ttcttttgcg aaggccgaga 60 tctgggcctg ccaggggcct gcccgagtcc tctatcgcgg gtccacgtgg ccaccaatga 120 cccgcggcgc ccccgcgtgt ccccgcagcc actccgcgga agcagcggcg ggagcgcacc 180 accttcacgc gttcacagct ggacgtgctc gaggcgctct tcgccaagac tcgctaccct 240 gacatcttca tgcgggagga ggtggcgctc aagatcaacc tgccggagtc tagagtccag 300 gtgcgcactc cccg 314 <210> 10 <211> 2213 <212> DNA <213> Homo sapiens <400> 10 ccggctttaa acgcctctcc agccacctgt gaaccgcgaa ggagccggct ttcgcggcgg 60 ggaccttgcc accagtaccc tcgcgggccg aggtcgttct cccggtcggc ttcccgcctc 120 acccgaaaag gaattagagc atctacccaa gacggtgact ggcagggcag atcaaggtgt 180 cctggtctcg gccccagccc cgcggtgcgc cccgcccgct taccttgacc gggtgcaggt 240 agccatcgcc gcgcagggcg cccaacccgg cgtccgccgg cgcctcggcg tcgtcctgca 300 ggctgcgggt gagatgcgcg atgtaggtgg tggccagcag cagcacgtcc agcttggaca 360 gcttggtgtc gggcggcacg gacggcagcg tgcgctgcag ctccaggaaa gcgtgccgca 420 gggtctgcac ccggctgcgc tcccgcgccg cattcgccgc cgccggccgc ccgctcccgg 480 aacgcgagcc gcccccaggg cccgccggcc ccggcccggt ccgcccggga cgcgagtcgc 540 ggatggcggc ggccaggggc gcgggctcgg cgctggcgct gagggggctg cccgctgggc 600 ggccgcggtc catggcagct tcccgcgccg cgcgcgctgc aaaggaccga aggtgcggtg 660 aggccggggg gcggtcgggc ttaacccgag aggcgcagcc ccctggttct ccccgtgcgc 720 ccaccagcag cccaacgggg ctaagggcgc tctcaagcga gctcgttttg cctgggacgc 780 gatttgcttc cggacgtctg gggagagttg cggaactccg gagttcttgg gcttcctaga 840 aggataagaa gaggcgcagt gccggctttg cttttcaggg gcaaattaag caaaaggtct 900 actctacccg ggaagaaaga tctcggaagc acagctcagg atcagcactc gttcgcgctt 960 gggtgacttt atccaacccg gcacgcacga gaggtggcgc ggctccttct cgccgacgcc 1020 gcggaaaacc acggctcacc agccgccctc ggcctttcac gccagggggg atttctgccc 1080 gaggagcggg ggacccttag cctcacctcg gggtacggca cccgccaccg ttccgagccc 1140 gagagctgcg cagtacgcgt ctgacgggcc cctcaccttt cctggagcgg ctgagtggag 1200 ctccgctccg tcgtgagggc gggcgagggg cgtggagcag ggcctgtgtg gccagggccg 1260 cgctggtcac tccatcctcg tccggccgat gcccaagtcg acggctgttt ccaacctccg 1320 ctggctgtga cttttatgcg ggcgccccgc ggccaggcgt gtgtgctccg accggctaag 1380 gcaggtcggg cggaggacct ggcccaccgg agaggctacg ccgggggctg aggcggctta 1440 gagggtcatt aatcaaaccc tccggcgggg cgggctcggg ggcggggcgt cctcctggcc 1500 ccgcccctcg gctcactgcc tcacgctgct ttccccgagg cgcctcgctg agggcggcgt 1560 gtggagagtt tggggtgtct gccgccggct gcggtggggc cgggctggag gccgcgggtg 1620 aggcctgtgg ttaacctcgc gctgccgagg tcttacctcc tcgagtccag tctgattcca 1680 ggccgcttcc aggccggtgc ccagctgagg cgggaacgct gcagtttggt tgagcgtgac 1740 ttttaggctc tgtgaggaaa agtcgagcgc gccacatcga ggcgctagcc gtttattcta 1800 ccacaaggta aaagattcat gctgtcctag ttaccctaaa gctgggagat acactgcact 1860 tcctaccaga ccccgaatgc tctcagtgtc tgtaattctt taagaagttc ctagagcaga 1920 cagcccttgg atcgtgggca cttctccccg gggacgggga ccctgctgac cgcctccgct 1980 gcccccgcgg gggccaccgc tctttaatta tttgggcgaa acattctttt ctggttttgc 2040 acttgtggac tcacgggaag cgtgacttgc agcgaggcag gacccgatcc caggcttctt 2100 tagaaagcgg acgctgcgcc ccaaggcctg ttcagagccg ccccaggaag ccgtgggtcc 2160 ccgaccgccc caaaccgcag cggtttctgc aggtcctgga cccgtcgcct tcg 2213 <210> 11 <211> 714 <212> DNA <213> Homo sapiens <400> 11 gcggacgcag tcacgagtcc agggcgaagc aggcagggag gcaggtgggc ctcggtccgc 60 cgcaagctca cacttaggag gaccacgggc cgcatgctgt cgtcgtcaag gcaacgacct 120 cactctgtcc ccaaccatag gcacaaagtc ttgggagaca gatacggccc aggtcagaat 180 gcgttcacgg caggcaccaa cacctgtgaa ggccaagggc tagagagcaa ttagctgggt 240 gagaggcacc acctcccagc tcgtaaggcg cccagtacct ggagcctggg aacctgcacc 300 gctccaacta cccctgggcg aaggcgttgg ccgcggagct gcaagggggg gcggtttctc 360 acccgccccg agagcgccag gcctcccttc ttctgattgg ccgagccgag tcgtcacgag 420 ccatgattgg ctcagggcca accaccccgc cccttcacct agggctcggc ccaggttctg 480 ctccctgaca cgcagaggcc ctgcgtcccc acacgccttg gttctcgtca ggaggcgcct 540 ttctgccttc cccagcggga ggaggcgatt gtgatgccca cgcgaagggt aaaggtggcg 600 gttatgtagg actgcgaaga ctatgcaaaa tgcgatacgg tttccctcat agcatcgccg 660 ctggggcagg ggcgggcgcc gggcgccctg agtcgcgtag gcgcggcctg accg 714 <210> 12 <211> 8078 <212> DNA <213> Homo sapiens <400> 12 gcgggcaggc ccaagctgcg atgtggagaa ttcgatgtcc gagcgacctc ctcggaggag 60 tgggtcgagt taaatataac cgcgcgaatg gaatggcgct aaaaataagg cagcagctgg 120 cctgtccaca gccctgtccc gggaggggcg ggggccccag tggtcttggg caggaaggcc 180 gcgtccggcc caggggcgag aaggctgcgg cgtccgcagc cagggctgga aggcctggga 240 ggccgcgctc tgtgggcccc ggggcctcca ttcgggctgg gtcgcgggcc tggacgggga 300 ctgtccagag gcatccgaaa gccaggccaa cttgcctgga cgtaacaaga cggaagggct 360 gggcgctgag gtcctgccag cccggccgcc agagggagct gagcgccaga ggaggacaag 420 ccgaaccctt caggaggccg ggcgtctccg gagaccgaag cgccggagga cccgaggagg 480 tctgccccgc gcgctgctct ggagactccc ggggcgggtg gcgctcggcc tttccgctcc 540 cttccttccc acaagtccct tcccgcgcgc gccccacggc cctgcccgcc ctcccgcgtc 600 agcgccccaa ccgtcaagcc agcaattgaa acgtttccaa aacggtctat ttatttgctc 660 ccaataaatc gatcggcggt gattaaagaa tcgatgtggc ctgggtgggc gagtcgcttg 720 aggggaggga ttgggggctt tcgcccggcg cctgcaggga ggccgagggc gggcgcgggc 780 ctgagggagg cgtgtcccgc ccgggccaca cccgaggacc cgacacctgg gctggcaggc 840 cccggcaggc agcgttccct ccggcggaga ggggcgcgcg cccgccgcct gctttcctcg 900 gcccctctcg cctttctcgc gcgccgggga ggctgtggcc gccagtggct gcggagctgc 960 tcagaggctt ttgttgctcc tcggccggct gaatggggat tttgtaaagc gggacagata 1020 aaaatgagca gcatcatatt gtttgacaga atgatctcgc atgatgaagt gtcggctccg 1080 aagggggtga aaatggtgaa ttcctaaaaa cccagccctg ggctcctcct cgagctgccg 1140 gtagcctgga gggacccagc ggacagccgg gcctggccgc atcgctccaa acggtgtcag 1200 aaagactccg gctttcaatg ccaagtcatt tttaagcccc gatcctgtcc aggacctttc 1260 tcctcgtgga tgaaaagaac aattttcgag agaaaggctc gtttttatta aatccgacat 1320 gctgctgata actccatgct aatgtgaaat aattaacata atagccataa ttaaaagcac 1380 gctaacaatg ccataaattt atcacacaat tttactagct ttctgcccct aactgctctc 1440 tcatcgttaa ttaaacgtgt tgccttttac agaatggatg tttatatatt tccaatataa 1500 ataaattcga aaccatcctc tctctcttcc tctttctctc ctcctttcct tttggtctct 1560 cgccatttac aggcacgcct tggcgtggac cctgagtggc agacatcttg aaaataaatg 1620 aagttttgag atgcaaatcc aaacaagaac attaaaatag cctctttttt tccaccccga 1680 aaagatccgg agaggtatac aagggggtag tggtgggtaa gagagttgaa aatcccccgc 1740 tttgggaaat ggaagtaatc tgggtgggtt ggggccttgg gtaccacctc tgccctttcc 1800 caccttcctt ggtggcggcc atccagacaa agaggccggt aatagtttaa caaatctatg 1860 aagattttca agaagcagca gactttgatt gttgcgggcg cgggggtgtt ggggagaaag 1920 gaggggaatt tttctaatag tcccacccac gttttgctcc ctcttggaca aagagtaact 1980 actcttggtg ggggacgcgc ccttcactcc gcggaacctg gtcccaactc cccgtattgt 2040 aagaaaagtg cacccgcgcg cgggcatgat gattctatct cacatcgcgc caacgactta 2100 ttcaagccac tggcactgtc tctgacttaa aagaggagaa aagaggcata tgggttcact 2160 tgggcctggt gaggggtagg tgggcaattc ccgccttccg cactctaacc gtgcccctcc 2220 tccagtgttg accacctaag aacccaaaat gagctgtaat taatttccct ttctccatca 2280 taaatttttc tatccatttc ttccccccca tccccccact ggacgcacac actaaatctc 2340 ccctcccctg gagacgtctc aatttccttc ctatcgatcc ggactccatt cttcttgcct 2400 cctgttgcta gaacctagat ccccactccc cgcacccctc attcccaccg cgtccaggtg 2460 gctttcccag cggggtacca tgtactctgc ccgctccaga ggaaccgaag gggtttcatt 2520 ccattctcct ttggttgaaa catttcaaac atttgagcag gtgaggcagc tggctgccat 2580 cttccttttt aaatctctcc tgggaagttc gcttgttgag actcaaagag tcactcaaac 2640 tcataattgc gtgtgtgtgt ctactcattc tccctctatc tctccaataa ccctttgaga 2700 ctcagaaact ttttatccac atacaccctt tatcacattt tcttcccccc actacatgtg 2760 tctcactttc tctctgtatc tgtctcgctt cttccgtctc tgtcctacag cttggcggta 2820 actgacgacc tgtgagcttt tagctgcaaa ctgcaactac gcggcaaaca atttatttag 2880 cccgacatct agccggtctc cggcaggacc ctgcaccgcg tcgggatcgg acccttccgc 2940 tggggcggcc tcctgcgtca aggccagcag gaaccttcct gtcgccctcc ccggccgccg 3000 cttcgcctcc ttcccgcccc cggaggttgt gcaggcgcta tggtccgcct ggagggagaa 3060 agccggcggc cggttcctga gccgagagcg gccgcggaaa aatcctctgc ctccgctgga 3120 aatcgatatt aggccggcgc gggcgcggga cgtcggggcc gcagccagta ggttgtgcac 3180 gtctcatcat ttagctaatc gagtcgaaaa gtttctgtaa gggccggacc cagcatcaga 3240 tggtaacact gattgaacaa gagattagca caatagatct ctaaccgagg ggaagcgttg 3300 cttttcacgc tacgcgccgt aattaatggt atgaatcaat taatttgact tttattgtgt 3360 cgaaggaaaa aagcgcaaca aatggaaccg gcagctggga gttgttcgtc ctccaccccc 3420 ttccccaggg aggttccaag gagacaccgg ggaatggacg gatcaggctg ggccgtggca 3480 gagggagggt aggaggcagc gaccagcagc gtggagggag tccagagagc tagcctctgc 3540 ggacggcgga atcgaaatta ggctcatttg gagactactt cgagaccggt gaggggagcc 3600 ctgtagccac catcctccgg cgcgcatcca cacatactag tccacgcggg cccagccacc 3660 aaggccgcgg cagggccagc gctgcgcccc gggcccctgc ctttagggct gggcaaccca 3720 agcagagcaa aggaggttcc tgaatgtgta aatttccgct ttttagcttt tttttttttt 3780 ttttttggac cttccgacac ttcggttgct gaggcagttg cagacgcgac ctctgcagtc 3840 ctgggcgatg gccagccagc tcagctcggg tcggtttcgc ggaaagctgt ctagacggca 3900 ttgtaaacgg ttcggagcct gcgggccaca aagctgtgga gctacggaaa tcaactctga 3960 gatgcgtttt agggccgtgt gcaacctcgg gatcatttag ataaagaaaa actgtggagg 4020 ttggcgggcg tctcaggata gtgtcaccac cccctaccct gctcccagcc tcagatgagt 4080 agtgttatat cctgggaaac tgtctaatgg ggatgaaagt caatctgtgt gtctcaatgc 4140 ctgtaatgaa gcaagtttac agatttttaa atttttattt ttattttatt gaattatttt 4200 tggtgtgtct aggccaagga aagaggagat cgtgggtggg gaaacagact gagggaatca 4260 gaagcaccac tgtccatccg gaattaaatc cacatcccag catcttctgc aaatatttca 4320 ctaattattt cctctcggaa ctcctcccct cgtgctcctt cctctggtga ggccggcgct 4380 cccctcccag gccgcagcgg acagacaggg attgggttcc gtgtgcctgc cacaccaggc 4440 aggctcttgc ggctcccaac taggcggcct aaatgaggga ggaaagagga ggcgcatcgc 4500 tgattcaccg cgtcaagagc actgactttc cttggaggtg tgaggtccac gcaccccagc 4560 cacgcacttg ggggtcggtt tgcggtgcct ccccctccag tcccagtgaa atccccacag 4620 tttttcctac tatcactgac ttgccttgca ctccgcgtgc attggccaca catcctcgcc 4680 tcctccaccc gctccgccgc cggttttctt ggaagttaaa tcttggagga tttgtccaca 4740 ccttaagaga agaaaatcca cgttagctgg cagcaacgga gatcccagca tgctggcatg 4800 cccaagtctg cccaggttcc cccaaggcca tgcccgccgc ccgggaagtc actgcccgca 4860 cccctcacgt ttcttcagcc gcccctgggc gctgcgtcta acctgaagac accaggcctc 4920 ttcccggatc cactcgactt acccaggccg ctgccaatcc cagctccttc cccagcgcct 4980 catttccgat tttttcatat gctaagtcgt ttaacaactc caagtagcca gttatggctt 5040 ctttatttat aggttccctg ctattttacg tcgtttttat ttctctcggc aactattcta 5100 gtagattaat caatagccat tttctgacct tcgggaaccc cagctgatgc tttttgtggc 5160 cgcacgaaaa aatacataca ggaaaacacg cccgcatcaa gccgggaaag agcaggtagg 5220 acctgagtgg tttggttggg ggagggggaa aaagacatct cagcaggtgt cttccccgga 5280 atgagcactg aggccagagg ggaatctgaa atctaattag caggagggag ccgggtgcgc 5340 tgctcttact ctttaaagct aaaaacaatg aaacaaaaag caaaacagag actaagtttt 5400 gctttttaaa acacgatatg ggaacctcgt tctaggtcgc ccagtccctg tctaaggagt 5460 gtgacaaagt gggggggaga agggcggaag ggagaggggg cggggaaggc agggcagcga 5520 cagtcgcaca gtcccgcgga cgctcccagg cccacgccct gactcgctca cacccaccca 5580 cactcacacc cacccgctcc ctgggcccca gggcccggat ccagcctggg tgggggggtc 5640 tccgggcggg ccgcagcgcc ctccgtgccc cggggatgct ggcgcacagt gcggagcgga 5700 gttgcgcgtc tctcgtccct ttgttgacaa ttccctgaac caacttgagt ttggccggct 5760 cggccgcggc cctgacgtca cgcacggtca cgtggccccg cctcccgctg gatctttaag 5820 tagaaagtaa tctatcaggc cagtccttaa aacgggactt tcgactaccg gggcttcggc 5880 gtccctgaca cccagccccc tgcccccccg ctactgtccc tgcccgcgcc ctcccgagct 5940 gctcggcgcc cggcgtcccg cgcccgcctg gaccgctcct gcgccccacg ccagggccag 6000 aggccgagga aggcgggcta agtgaggggg cgcggcgtgg agaaccgccg gggccgggag 6060 cggtagcgag cgcctagtac cgagcgccag ggacggcagg agttcgcgga gcgcggccgc 6120 tgggggcgga cggcagagcc cgcgccacgc gatgcggggc cgccgagtgt gagctgagcc 6180 cagcgggccc caagccacct gcggccccct cccctctccc tgccccccat ctttcggggg 6240 cactcaaacc ctcttcccct gagctccgtg gcagcccccg aacaccctca tcgcccgctg 6300 ccccctcccc gccgccgcta ccaaccccga ggagggatga ccctctccgg cggcggcagc 6360 gccagcgaca tgtccggcca gacggtgctg acggccgagg acgtggacat cgatgtggtg 6420 ggcgagggcg acgacgggct ggaagagaag gacagcgacg caggttgcga tagccccgcg 6480 gggccgccgg agctgcgcct ggacgaggcg gacgaggtgc ccccggcggc accccatcac 6540 ggacagcctc agccgcccca ccagcagccc ctgacattgc ccaaggaggc ggccggagcc 6600 ggggccggac cggggggcga cgtgggcgcg ccggaggcgg acggctgcaa gggcggtgtt 6660 ggcggcgagg agggcggcgc gagcggcggc gggcctggcg cgggcagcgg ttcggcggga 6720 ggcctggccc cgagcaagcc caagaacagc ctagtgaagc cgccttactc gtacatcgcg 6780 ctcatcacca tggccatcct gcagagcccg cagaagaagc tgaccctgag cggcatctgc 6840 gagttcatca gcaaccgctt cccctactac agggagaagt tccccgcctg gcagaacagc 6900 atccgccaca acctctcact caacgactgc ttcgtcaaga tcccccgcga gccgggcaac 6960 ccgggcaagg gcaactactg gaccctggac ccgcagtccg aggacatgtt cgacaacggc 7020 agcttcctgc ggcgccggaa acgcttcaag cgccaccagc aggagcacct gcgcgagcag 7080 acggcgctca tgatgcagag cttcggcgct tacagcctgg cggcggcggc cggcgccgcg 7140 ggaccctacg gccgccccta cggcctgcac cctgcggcgg cggccggtgc ctattcgcac 7200 ccggcagcgg cggcggccgc ggctgctgcg gcggcgctcc agtacccgta cgcgctgccg 7260 ccggtggcac cggtgctgcc tcccgctgtg ccgctgctgc cctcgggcga gctgggccgc 7320 aaagcggccg ccttcggctc acagctcggc ccgggcctgc agctgcagct caatagcctg 7380 ggcgccgccg cggccgctgc gggcacagcg ggcgccgcgg gcaccaccgc gtcgctcatc 7440 aagtccgagc caagcgcgcg gccgtcgttc agcatcgaga acatcatagg tgggggcccc 7500 gcggctcctg ggggctcggc ggtgggcgct ggggtcgccg gcggcactgg gggttcaggg 7560 ggcggcagca cggcgcagtc gtttctgcgg ccacccggga ccgtgcagtc ggcagcgctc 7620 atggccaccc accaaccgct gtcgctgagc cggacgactg ccaccatcgc gcccattctt 7680 agcgtgccac tctccggaca gtttctgcag cccgcagcct cggccgccgc cgctgctgcg 7740 gccgccgctc aagccaaatg gccggcgcaa tagggacgcg ccaatggccg ggacccaggg 7800 tccggcggcg gcctcgagca acaaatgcac ctccaggctg cgcgccctgt cccaagcccg 7860 gtcccggtcc cgctgcccaa tcctggactc tgcctctccc caatttcctt tcccctgagc 7920 ccccaacgcc taccttccgc ggcctccatc ccctcgcgca cacctaagct ggtcgagcaa 7980 actcaccgcg cgcccgccgg ggatagcttt ccatacaggt aaaaccgaaa accgaatttt 8040 ccaaaaatgc accccgacgg cgcctgctct tagtaccg 8078 <210> 13 <211> 495 <212> DNA <213> Homo sapiens <400> 13 ccgcgccctg gaccatccgg gcgtagtccc ggcagcaagg ccttctttcc ttgctagcct 60 gggcctgccg cagacagacc ccagagggag ccgcgcccag cccgctgggc ggccccggct 120 tcccgcgacc ccctccagac cctgggcaga aagagcgccc tgctgtcccg acagagccac 180 tgtgcttttg agggatcctg acacctagtg gctcccgctc ccttctccga agagcaccgg 240 gtcctatctg agcattcccg cgactcccag cccctgatcg cagctaagac acccattcgc 300 gcacccggct tctcccacat cctcgtccca ggggttcagc tgacactggt agtcgcctga 360 gctgtactct ttggggccca ggcgccttgg cgggagctca ccctccctgt ctccccagct 420 gaccctgccg cgcccccttc atctccgcac gctcccaccc ggccccctcc acaggctgtc 480 cagccccgcc cctcg 495 <210> 14 <211> 1192 <212> DNA <213> Homo sapiens <400> 14 tcgggcctcc gctcgacgga ctgccttgtc cactctccgc ctgggaacgg gggttcgtgg 60 gagcgcctta gtggaagttt gtggagctcg ggaggtggca tgcacaggcg cctcggagcg 120 cggccccgag gggcgccggc aggcgagagg cctgcactaa ccggccgtaa gcacagctct 180 tttgtactct gttttccccc taaagacatc tgatgccccc agtgaagaaa agccaacagc 240 agcaaagcct gatggagagc atgcagcccg ggaagcccag tgactgggag ctggagggca 300 ggaagcacga gcggcccgag agccttctgg caccgacgca gttctgcgcg gccgagcagg 360 acgtgaaggc gctggccggg cccctgcagg ccatcccgga gatggacttc gagtcctctc 420 cggcggagcc gctgggcaac gtggagcgct ccctgcgcgc cccggccgag ctcctgcccg 480 atgcccgcgg cttcgtgccc gcggcctacg aagagttcga gtacggcggc gagatcttcg 540 cgctgcccgc gccctacgac gaggagccgt tccaggctcc ggccctcttc gagaactgct 600 cgcctgcctc ctccgagtcc agcctggaca tctgcttcct gcggcccgtc agcttcgcca 660 tggaggccga gcggccggag cacccgctgc agccgctgcc caagagcgct acgtcgccgg 720 cgggcagcag cagcgcctac aaactggagg cggcggcgca ggcgcacggc aaggccaagc 780 cgctgagccg ctctctcaaa gagttcccgc gtgcgccgcc agccgacggc gtggccccac 840 gcctctacag cacgcgcagc agcagcggcg gccgcgcgcc catcaaggcc gagcgcgccg 900 cgcaggcgca cggcccggcc gccgccgccg tcgccgcccg cggcgcatcc aggaccttct 960 tcccccaaca gaggtcccaa agcgaaaaac agacctattt ggaagtaagg agggtaaagt 1020 aaaaccgaac cgaaacccac agcgtcgacg gccccaggcc tagatctgca ggaagcatcc 1080 cgagttctcc tagcgtggag aggagcgggg ccgggccagg ctagggggcg gctgcgcgag 1140 ccgtcggcgg gtggaggcgg agggagagca ggggcagccc ccgcgccctg cg 1192 <210> 15 <211> 1001 <212> DNA <213> Homo sapiens <400> 15 cctgggaaga gctgctgggt ggggctgtgg ctgccagagt ctttcccaaa ctagcacaga 60 acctgttttg caaccctggc agggtggagg caggatccag gccaagagct ggtcagcagc 120 tgaccccgcc cctgcctgac ccctgcccct tccactgccg aagagcccct ggcaaatagt 180 gtaactcaga tcgtagaggg tgcagattgc tagaactcag ttccagaagg tttctccacg 240 ataatgtcat gacttaagta cacagttttt ccatttttgt ttcgtaactt gattttttaa 300 agcagtcgct acagaacaga atctagacct gtattttata gcatagctgc ttgcatgtat 360 ttttcaagac ttttctttcc ctcagagtga tgtttgggtt ttgttttttt cctgggaagt 420 tggtgggggt gggagctaca tagcccacct ctttccccag taagattctg gtccctagga 480 agaggggaaa acagctcggg cggctctgaa gaggaaatct caggccctag atgctacagg 540 tcattgttag caaccccagc cgctcccagg aaaccagcca gcagcagcgg agggcagggc 600 tgggcgggca cagggtcccg actataccca gtttgcagtt cggcccaccc ccagcaccag 660 gaatgcccct cccaggctat cgctcctctg caggcttccg cagctcccca gcccctgtgc 720 tcctggagcc tgcctgcctc ctgcccgcct gcgtgactca ctgagggccc cctccctatc 780 tttcactttc acccagcacc cagaagggga gtaatttcct cctccatttc cttcctcagc 840 tcctgggcct tgaagagagt aagagaccct cctcgtgtgc agcctttgtc ttttcatata 900 tgaagctgga gggagggaga ggcacagaga ctaggagggc atccaagtca ccctcacccc 960 cagcaagagg ggagtggggg gatttggaca agaagtgcag a 1001 <210> 16 <211> 2001 <212> DNA <213> Homo sapiens <400> 16 taaatgagtg aatgaatgaa aattatttta tttttatttg agctttggtt ctgccatttg 60 ctagcagtgt gactcaagag aagccagtaa cccccctgag cttccctagt tcacaaaatg 120 cttgtcatga agtcgacagc ttccggaggc tgcgaggctc gcaagaaatg cccacatgaa 180 tgtgcgctta gggcgtgagt gctcactcca gaaaactcca acacagtgaa aaggcagaag 240 cggtgttttt cttttttaca tttttataag aatatataaa aaatgatata aatggacatt 300 tacggtagtg ggggaaggca tatatctacg ttaaaaggca ggacattttt aaaagctcta 360 ttttctaaat gaaaactacg aaagcggggt gggttgtggc gggggcagtt gtggccctgt 420 aggaccttcg gtgactgatg atctaagttt cccgaggttt ctcagagcct ctctggttct 480 ttcaatcggg gatgtctgca gagggcagaa agaaaacagg cgttagaaac ctgaggtcaa 540 agatgtgtgg cacatcccgc cctcctctct tgccgtccct accggcattg aaatacttat 600 ggataaagtt ctcgcaatgg cttcacgtgc atgtacccgc cgccaccgct ctcccacacc 660 tccctggtcc agcagctagt ccactgcccg cctggctgct ccaggcgcgc cgaccgctca 720 agcgctccag gtccacccgg cggagggcag agaaagcgcg accgcgcggc ccgcagggtt 780 gcaagaagaa aacgagtgtt atataatgag tctcagtggt tgctcacaat gccaggcgcg 840 aaggcgtgaa gatgtggcct ttcccttccc gcatccccag gcatcttttg cacctggtgc 900 ggagtgagcc agccagcttg cgataaccaa agggcgcctc aggctctggc gctcctcggc 960 ggaatcccgt agcttcccta cgcatgcctg cttctacaaa cccacaaatg gtttccgatc 1020 atttctgaaa caaaatggat gctcatttat tcatgtgctc tggcttctgc cttcctctct 1080 aatctcgttg cgtatgggct ccagctcgcc gttcggttct cccgaggcag catttacact 1140 tgagagtctc aagattattt tattcctgag ggagcatttg cacttgaaag tctcttttta 1200 cgtttattcc tgaggcagca tttgcacttg agtttctttc tcccgtagct tgcattagat 1260 tctccgacca ctctttagct tctcctccta ttcacacttc atatttaccc attgcattgg 1320 ttttataaac tcgctctctg aaaatagatt gttatcttcc ttaacgtctg tttcccaggt 1380 cgggcaagat agcttgggac tgtaatccca gtactttagg aggaggaggg gggatgatcg 1440 cttgagccca gataacatgg tgagaccttc gtctctatta aacaaacaaa caaacccagg 1500 cgtcgtggcg tgcacctgtg gtcccagcta gtcgggaggc tcaggtggga gaaccccttg 1560 agccagggag tttgaggctg cagtgagctg tgatcgcgcc actgcactcc aggttgggca 1620 acagatcgac tctgtctcca aatgtaaacc ccatgagggc aagactcttg tttggtctca 1680 ttcaccttgg cgtgcccacc acctagaaca gggctgatca cgcagtagaa tctaaccata 1740 taattaattg tgcttgaaga gggggtgttg gggagtaaga gaaggaaggg aggagggaag 1800 aaatgaaaga cttgtgtgtt tggattaaat atattaggtt tggttaagag tcgttcagtt 1860 tattcatttg cttgtggccc aattcagtag ttttactccc tctcccactt ggctcctcag 1920 gctttttgct cagccctgga accgcgctgt aattggcagc tccttctaaa tcgggacccg 1980 gatgctagct gtaactggag c 2001 <210> 17 <211> 1834 <212> DNA <213> Homo sapiens <400> 17 tcgctccgga atggggaagc ggctgcgccc tggacggaga ggggcgggga cttcgcgact 60 gcaggcggag ggagggcggg tgtcgctggc gcaggcggtg acagggagac accgccgcca 120 ctgagtattc ctatgcaagt ttcttcatct tcctgtgcat cagtgtttac actggggtaa 180 tgataaatgc tgtgttgaaa aattatttga tggggccatg gaaggaacgg aaggaacggc 240 gtcctggccc gctcggggcc cgcgcacgcc gccaccaagc cgcgggggcg ggtcggaggg 300 gagagttgcg tcagccaggc cgctgtcaga tgacgagccc ggggcgtgac ggggtggagc 360 atccccaaaa aagtgcatgc ctaggatccc gcccagtgta tccctgcgcg cggcgggccg 420 ggctgggcag ctttataaac agccgtggtg tgagcctcga agggaaccat cagcgcctcc 480 tgtccacgga gctccaggtc tacaatggca gcggccgcca gccccgcgtt ccttctgtgc 540 ctcccgcttc tgcacctgct gtctggctgg tcccgggcag gatgggtcgg tgagttcggg 600 gatgtagcct aagcagggcg ggggccaaac ctgggaggtt gtggactgca gcgggtttca 660 gaggagggga ggcttctgga aggaccggcg cgatctccct gaacgaacat cgcggtctcc 720 ccgaacgtcg cggtccctcc gaacgtcgcg gtctccccga acatcgcggt gcccccgaac 780 atcgctgtct ccccgaacat cgcgatctcc ccgaacatcg tgatctcccc agacatgccc 840 agctgaaggc actcagttcc cctcggtggc tcctttccgc cgggtccgct tcctgcggct 900 gctgcttgcc cctcaggcca ggaggtttct ggaaggaccg gtgctgtctc cccgaacatc 960 gtggtctccc cgaacatcgc ggcctctccg aacatcgccc tctctccgag caacgcgatc 1020 tccccgaaca tcgcggtctc cccgaaaatc gcgatctccc cgaacattgc catctcaccg 1080 aacatcgcga tctcgccgaa catgcccggc tgaaggcact cagttcccct ccgcggctcc 1140 tttccgccgg gtctgattcc tgcggctgct gcttgccccg caggccagga ggcttctggt 1200 agcaccggcg cgatgccccc gaacatcgcg ttctacccca acatcgcgat ccctccgaac 1260 atcgtgatcc cccccgaaca tcgccgtccc cccgagtaac gcggtctccc cgaacatcgc 1320 ggtccccccg aacatcgcgg tacccccgaa catcgccgtc tccccgtaca ttgcgatccc 1380 ccgaaacatt gcgatctccc cgaacatcgc gatctcgccg aacatgcccg gctgaaggca 1440 ctcagttccc ctccgcggct cctttcctcc gggtccgctt cctgcggctg ctgcttgccc 1500 cataggccag gaggcttctg ggtggaccag cgcgatctcc ccgaatatcg cggtctaccc 1560 gaacatcgcg gcctccccga acatcgcggt ctccccgaac atcgcgatcc cccagaacat 1620 cgcggcctcc ccgaacatcg cggtctcccc gaacatcgcg atcccccaga acatcgcggt 1680 ctacccgaac atcgcggcct ccccgaacat cgcggtctcc ccgaacatcg cgatccccca 1740 gaacatcgcg gtctccccga acatcgctgt ctccccgaac gtgcctggct gaaggcactc 1800 agttcccctc cggggctcct ttccgccgag tccg 1834 <210> 18 <211> 597 <212> DNA <213> Homo sapiens <400> 18 acgagtgcgt gcgcttgatc tggtttctgc tctctgggag gtgagtggcc gtgcggggcg 60 gtggcagctg gcgacacctg cgggctgttg ggcaccagcc cggggcgggc gctcgcacct 120 gtcgggcgtg cacaaaggcc cggcgcacgc tgtgggggcg gggcctcccg ggttggccaa 180 tgaaaagctg gcactgggtc ggaggcgcca gccaagtggg gggcggagct tccaccaccg 240 gccaatgggg atctggcttc gggatgtggg cggggtccac ccggtcgcaa cccgttgagt 300 ctctgcacag ctgccgcgct gacgcgtttt ccgcgtgtcc cgagccccgg cggccccgcg 360 agctcggtcc gtgcggggaa agcagggctg acgccgtctg cggagaggac tgcgcagccg 420 ggcttgtgtg gggccgcgcg taacggcagc ggctactccc tgcccaggcc ggccagcaca 480 gggccatggc cgaggcggct gcgcctccgg taagggcgac cctcatggag gcttggggac 540 gtggagccga gtcctgaatt cgccaggagg atgttccacc ccccaccatc tccggcg 597 <210> 19 <211> 481 <212> DNA <213> Homo sapiens <400> 19 tcggatcggc ctcccacgcg aagcttgctc cccaccagca tccccacgtt ggtggcgacg 60 ctgccccggc cccacggata cttccgcgcc tgtcagactc cctgatgaac tacccttccc 120 agagtaccgc gggagctcgg gctcctgagg gcgacggtcc tctgatggca gatgcgggag 180 aaactctggc gtcaggcggc cctcgcgtgg agcacacgaa gtcgtggctt attctggctt 240 cagtatgtgg ggtggagaag gcgatccacg cagctgcgtc tatttcctgt ggatcaatcg 300 caaaatacgt tctgtaagcc ccgcccccac tgcgtgcggg cggcttttgt ctccacggca 360 accgtcaact ctggaaacgc ctgtctttct ccatggcaac tgtctacgcc gcaggctgga 420 gctgcccatt accggagccc gtaagcagta tgggtgctgg acaaacagcg tgatcgggtc 480 g 481 <210> 20 <211> 1001 <212> DNA <213> Homo sapiens <400> 20 gtctgtgttc cttttcttaa ctgtaagaag aaggctctgg tttcttcagg ttataatttc 60 attaaaataa ttttattgtt ttctgacctg aaaaaattca gaatatgtat atctgcttga 120 tattttcttt tgggcatctt ggtgcaacac ttaaaatcta tttcattttg tagtttggga 180 gccataattg cagcttcacc aggcttggtt cttcttggcc cgggcccttc ccttcccttg 240 ctggttagta ccagccgagc tggtttgctt tttccctttt tggtactatt ctcctcctcc 300 ttcctccacg ttaccttctg ccacggcctc tcttcttttt ccctccattt tcaatttaca 360 cttacatttt ccctcctcct cctggccctc cctagttttt cccctcccct ggtttctagc 420 tcctttttgc tttctgtttg tgttactgag ggcagtgctc caattacctc atatttggag 480 agaggaagct gcagccaatc cggtttctgt ctgcttttag gtcaagtgat ttctgaactg 540 cagtgagatg ctttgaattt gtcttgttgc agctctgagc ctgtaagatg gctgtctgaa 600 tcggcagcgg ctggaagaga cagagagagg cggggaggga gggagaaaga attggaggga 660 ttgccggcat agtgcatgtt tttaaatgtg catcgaatcc gatgaggcca aggttgggat 720 ttctgtggga tcccaggact ggcttagctg cgtttttgct gagattagga gaggaaggaa 780 atgggaaatt cactgggctg ttttaaggag ccgaaagagt caatagctat tcctgagaag 840 gctcccatat ctcctaagaa aagggttcgg ttcaaaagga ggtggagagg gaagaaaatc 900 cctactccag aggcatctca ccaggaagaa acctcagaag gaactggagt cattgaagag 960 actgaaaccc taacgaagtt aacagagagt ctccaaaagg a 1001 <210> 21 <211> 206 <212> DNA <213> Homo sapiens <400> 21 acgccaccgg tcgaggacgg caggagaccc ccgagtgcag agaaagctca aaccggcagc 60 gaagtcggtc ctagccaagc tgaaaaaacg tctcggattt cgcggacagc ggcctagaca 120 cagcccgatc ttccagtcct agtgccctgg tcgagacggt tctatccttt tgcaaagaag 180 ccggaaagag ctgggtcccg ggggcg 206 <210> 22 <211> 2001 <212> DNA <213> Homo sapiens <400> 22 acccttgtag gccggatgcg gtggcttacg cctgtaatcc cagaactctg ggtggctgag 60 gcgggtggat cacctgaggt tgggagttca agactagcct gaccaacatg gagaaaccct 120 gtctctacta aataaataca aaattagccg ggcgtggtgg cgcatgcctg taatcccagc 180 tactcgggag gctgaggcag gagaattgct tgaagccggg aggcggaggt tgtggtgagc 240 caagctcgcg ccattgcact ctggcctggg caacaagaga gacactccat ctcaaaaaaa 300 aaaaaaaaaa atagaacaac ccttctaaat gtaatccaca gctcactcac cttagtccac 360 acaatgacca ccacattttg gatgtctcca ttctgaagca ctccccagat ttccagacct 420 gggtgttcag ccacctactt aatgcctact taatgtctct gaaacatctc aaactcttac 480 atgaccaaat aaagctcctg ttgtctccag tgaatattac tgttaatacc aacttctcca 540 tctcagttga agaaccatgg ggtcatcgct gaatcctgtt tcactccctc gctgtctaca 600 tcagaaaatt tagttgctcc ctttaaaaat ttgcatccag aatgcaacac atctcctaat 660 caatgactct ggtccattac cctggactgg ctgtagcttc cactctgatc ttctttcctc 720 ttccctcaac cccacagtct gctctccacg ctaacgggat ggaccctgtt aggactttgg 780 taagatcacc tccctcttgt aacccaaatc tctcattacc tccagaatag gtacccaact 840 tctcaggcag ccactgcagt cctgactcct tccccctgct ctttgttccc agctaaaagg 900 aaacagatct atggtttcct caaaaatctc agcttagttt tactaagcac ttgcgcctcc 960 tgataccagt gccagagata acctttcaca agtttccact ggctgacaaa aatgggaaca 1020 cctcagtata acccctgtaa cctctggcat ggacttaaga gccctgggct tggaatttct 1080 ccagggcacc agacccagga ttggggtaac agcacttaag aatactagga aaccacaatc 1140 ccaagaacat gggggtagag gctactgagg gaccgaacac tctccacttc cctatgtgag 1200 ttccatacgc ccttctacaa ctgggagaac cagggaaaga ggaatgcatc cctggtgagg 1260 ctagatgagc tcaagcctcc ctgtagccct gcctggccct gaactcaggc tggctgtttt 1320 actttctggt ctcagtgctg tcacctcttg ccaactgtag ggcaatgaaa aaaagatgta 1380 gcctcccact atctcaatgt cctcatcgcc ccatcgctgc tcttcctgtg aacagtcttt 1440 ggaaaagttt ttaaacccta acatagggcg ggcacggtgg ctcacgcctg taatcccagc 1500 actttgggag gccgaggcag gaggatcact tgtcaggagt tccagaccag tctggccaaa 1560 atggtgaaat cccgtctcta ctaaaaatac aaaaaattag ccggacgttg taatcccagc 1620 tgcaggcttg taatcccagc tgctggggag gctgaggcag gagaatcgct tgaacccggg 1680 agtcggaggt tgcagtgacc cgagatcgcg tcattgcact ccagcctggg cgataagagc 1740 gaaactccgt ctcaaagaaa aaaaaactaa cataaatggc gtccctcctt tgttcagaac 1800 tctccgtggc ttctagcatc ctcacaatga cagtacaacc ctaggagtaa ctccgcctca 1860 tattcttcgt tccctgcaga aaacagcttt ccgaattctc ctggctcagt cgcgcctcaa 1920 cctttgcacg cgccggttcc tccgcctgtc acgctctccc acacctcgtc acacgcagtg 1980 tcaaaaaaag ggccccaccc a 2001 <210> 23 <211> 561 <212> DNA <213> Homo sapiens <400> 23 tcgcccggct caaccccgac gtccgcgccc cggccgcctg ttggccatgg cgggcctggg 60 cctgggctcc gccgttcccg tgtggctggc cgaggacgac ctcggctgca tcatctgcca 120 ggggctgctg gactggcccg ccacgctgcc ctgcggccac agcttctgcc gccactgcct 180 ggaggccctg tggggcgccc gcgacgcccg ccgctgggcc tgccccactt gccgccaggg 240 cgccgcgcag cagccgcacc tgcggaagaa cacgctactg caggacctgg ccgacaagta 300 ccgccgcgcc gcacgcgaga tacaggcggg ctccgaccct gcccactgcc cctgcccggg 360 ctccagttcc ctctccagcg cggccgcgag gccccggcgc cgcccggaac tgcagcgggt 420 agggaggccg ggcccgcagc tcccctggct cccccgggct gcccgccgcc tgaccctttc 480 ccatgtggct cgaacccctt tcctcagccg ttctactttt acgttccttt tctcagtcta 540 aaagtcgagt tccgctcttc g 561 <210> 24 <211> 2001 <212> DNA <213> Homo sapiens <400> 24 gaaagttcct ctgttgctct gggagagggc gggggagagc aggctcgaga gccaggctcc 60 tccgaggctg gtcttgaggc acttctctag tagcttctcc aaaagactga gagtgccggc 120 gtaggtatga cagtgagggt acctcacaga cccttctcca aagtctggcg ggccttgggg 180 tttttcgggg ccaccaggct cggtggaatt tttgaaacgc tttcgaaata catagtttcc 240 tctgtggagt gagtgcctac aacgcgcagg ccggactgat cccccgttgc tgcaggttgg 300 tgccccaagc tgcgggtgct cgggcgccaa ctaaagccag ctctgtccag acgcggaaag 360 aaaaatgggc tgtgaaaaag caaaaggcct cgtctttgaa tgaaagttaa acattaaaat 420 ctgaccctag agttgtctaa agatcgcgga attttgaagc tccggcagag cggactaaaa 480 aacggtgcta tgagagatgg tgagaatact ctaggcatga acgtgtgcgt gtgtgtttgt 540 gtgtgtgtgt gtgtttcatt cttcccgcaa aacaattttt tgtttttttc ctattcccgg 600 tttgttatcg gcctagggcg ggagaaccac gcagcggctt ctgggcccta aggacaaaag 660 agttaaaaca atgaggctca cccgggaaga gacgctgccc tgggcacaat agggtcgcct 720 gcattactcc tccatacaca catctttaaa tgtgtccctg tgtgtgttcg ttagggtgct 780 gtattacaga aaaagaaagg cctaaaaaca cccccagccc tggtcgcgcc tttcgctacc 840 gcctgagtct ggagccgaca gctccacctc ttctgctccc tggaccgccg cgtctccacg 900 ccacggcgcc ctttttacta aaagatcttt tctcatccta tcagcaaatc gttaagaaag 960 gcttagccat tgcgggggct ccaacttaag gattcccccg gcccactaaa aggctaggcc 1020 cggcctgtag cccagctccg cagaaagcca gagggtgctg ggctttcagc ttcttcctcc 1080 tagacacttg ccccacaaat atatttcgtt ttctctaatc caaataccca tctttttctt 1140 ttttaaaaaa tgataacgta atgggaaatg accaaccgaa ctctgttaca taaagttagt 1200 tctgttagat cttccacccc acccccatcc cgcgggagcg agtaaataga attcatgagc 1260 ttagctcccc aggttcacgc tctggaatgg tttctttttg cctcattccc taagttttct 1320 ctcttctgcc tcctgaatgg agctcaggct aaggagaacg gcagaaagag caaactctga 1380 tctgaatctc taattatgac cccatgtatt acccatttga acataaggcc ctagacgggc 1440 tccgtgcgat ctggggcctc ccaagagaaa acttccccgg gacaggacgt ctgccacgcg 1500 cagctaaaca acttctgttt tttccgccgt ggggaaaata aaagaacctt acaaattcta 1560 aggcgtcata acccctgcaa gaacttctaa ctgtatgaag gcccacgcga gattttgaca 1620 atagataaat gagctgagga aatagggtct ggccagcgaa gggaaacaca cagtagccct 1680 gggtgccttt ctggaatgcc cacgcagggg tccgcgtgga caagcacttg cattcaaata 1740 caggaaaagg cttggacggt cgaaataaat ctccttttaa ttttcttttc atcgactaat 1800 aaaaataatt ccccagcact aaactcaaat accgtaacgg gccacaaaaa cacggagaat 1860 tcataaaact ctatctctgc aggtcacccg ctaatcgcat tattattagc ctcgggagca 1920 tggaaattga actgtcactg cctaaagaga aaatgtaagc gacagctgtc cctcctctga 1980 gttggacagc tttgtggctg a 2001 <210> 25 <211> 2001 <212> DNA <213> Homo sapiens <400> 25 gggcagaaat gaaatcaact gtggcaaggc cttggctgct ttcacggagg agtttttctg 60 cgccagtgtc tttttccttc cctttaaaat aaaattaaaa atagcaagca cttctcaggc 120 attcatcaga gatagataga tgcacgagga ttgagtgggc attttcataa agaatgaggc 180 cggctgttat agaccggcgg cctagcagat gaaaacttaa ttagcgtgcc tgtcctaaaa 240 cctaggcata aatctccctc tgccttttgg ataacgctat atctttgctt atgagaaatg 300 ggatgtgagc aactcgctgc acatttctct gattctccag gtcttggtcg gctgacacgc 360 attcgatcaa gtttaaagga atgcgcataa atcagcaagc ccctagcgtc tccttgggag 420 aggtccgcaa atccaggagg gcgcctctga acccaccggg tctggggatt agcagtccag 480 ggcaacctcc gtctctgctc ctgaactcgg gaattcacag aggaagcaag acactgcatc 540 ttcaccaagg cctccaaaca catgcagcag agtgcaatct gcacttacat gtattacaaa 600 gtgaaatctg tgtcaactct ccgcacacaa atgttgcatc tgcagctgaa tttcactgcc 660 tagtggtgaa tttttaagaa aagatttcaa ctaggttgtt ttaatttttt tcttcccttt 720 tctgttaatt ttttttaaaa acccacaact tgaataactt gaatgggtgg cttcagctct 780 gcatcagtca caaataggag tgaaatgcat agcgacattt aacaatcatc cacttaaaat 840 aagtaaataa atatgatagt actgagagca gatagaaaaa gtagcgtttt tttttaaagt 900 cccattttta ttttcttaat tcaggaagag ttttcttttt agaaaaaaat actttaatca 960 ggctttcaac aacattatcc atgggtcagt ggctgatact attattccta tttttcagga 1020 ggtggctggt ctctccttga tttttgtttt tgtttttgtt tttgttttaa ggttttagac 1080 tgattgctat ttgggcatta aaggagccat aataaataat ccatgcccac tttaggttat 1140 ctggtagatc cacagaaatt ttaaatagga ggagagttag gtaagatcga cactatcaat 1200 gaccatttta gaactggggg gaaaaaatcc ccacaacaac cctgaaatgt cttctgtcat 1260 tacagtttca aaaactagag agagaaaaaa agaaggctac tactttaccc agggttcctg 1320 tagtggtgat ggctttcgaa aggggcggga tcccggctgg agagctgctg ttggcctcct 1380 tcctaggctc gaggctcaga atatttctta catctaaaga aaaatatccc ctgtcaacag 1440 aagagtccct tttggagctg ttcttaaaca cacagtttga tccagctttg aggggatttt 1500 ccaccacttt aaacattttg ggagaaagtt gttactttgg cttgatggca gctcatttgg 1560 aaatggagta ctgtttggaa caagaggtgg agaggtgggt ctgaagcaac attatcattt 1620 gtttccacaa gtggagtgaa aatcctcagg gcagcaaaat ataattgaat ttctcgagac 1680 ctttcgatat gtatgtttca acaccagcct gtttttgaga cagctttaga gactctttcg 1740 taattctcat ctataaagaa gttgtgagtc ctcaggagag gttggagagg tttccggcag 1800 ccacttttgt aaccaatcaa tattattttc cataaaatga tgaatctggt tcttccattc 1860 actattactt tcctctaacg taaagataaa attagcctgc atctcacaat tctgcatccc 1920 acggctactg attccaccaa cattttaata catatgcgca tagcatagat ttgacaaaaa 1980 cacattatcc tatgtgtata t 2001 <210> 26 <211> 516 <212> DNA <213> Homo sapiens <400> 26 gcggcatccg ggatctggcg ccgcttttgc gtcaggcttc tgcctgagct cggttagggc 60 ctcaccgacc tgcttccacc cctcagggag gcctcagtga ttcggccaca gcctcagcct 120 ccgtcgctct gtgacctgcg ggtattggat gattcgtagc taagactcta cgacatccct 180 gaagccggga aatggtgagt gtgccgggca gggcgtccgg aggcgacgtg gcggggaggc 240 cttatcggaa ccagcgggaa atggcggcag cggtacccag tctgcgaacg gagtccccgc 300 tgccgccgct cagccctcgg tcctcagtcc cctccggtga gggacccgcg ctcctgtcgg 360 gggacccgcg ctcctgtcgg ggtccccgca aggctgctct ggcccagcct gcagccctcc 420 ttgtgcagtt ttgcgcccgc agccccgcac cttccccggg ctgtggggtg aggagtagct 480 catctggaag acgcctgcgt cgcgtgcgcg atgccg 516 <210> 27 <211> 329 <212> DNA <213> Homo sapiens <400> 27 acgaacgcct cagtgtcccc gaccctgggc agcggggact cgagcaggcg cccctcactg 60 atggctttag aacgtgggtg ggggaaggtg tgtgaggacg ggaagacgcc gcactcacct 120 gagttggcgt cctcagagtg gccgctgcca tcagactctg cgggtagagc tgggccggga 180 gcgacgggcg acattggtag ggacccgggg acagcggtcc ctatcccagg cctgacgtgg 240 gtcccccagg gcggcgtcgc caaggcttag acgctttcgt gcaggaggga cgacgactcc 300 cctcacgcct tcgtggcccc aactcggcg 329 <210> 28 <211> 4240 <212> DNA <213> Homo sapiens <400> 28 ccgcagaaat tactcgtgcg caccatttcc gctgtggggg cattcgtaca agtttccgct 60 gcacacacag cctcccgggc cctctcctcc aaggctctgc cggatcttcc aacgaaatcc 120 cagagcagcc tgcgctgggg agcccgcaag tctctccaga tctctgcacc ccgcaccgcc 180 cggaatctgg gacggcgccc acgcagggct gggccaaggg cagagctcgc accctgcctt 240 cacgcccggt tcacttgcgt ccacgaaagc agcgtgccgg cctcctccat cttcccactc 300 gcgcaacgca cggcgacccg cgcgacactt ctgcaatctg aaggcttgct tcttacaaat 360 aaagggccag agtctcacac ttgccttcgt tggagggact tagaagatcc tccccacgtc 420 cacaccttgt aggaaatgca aaacagatcg atgaaattaa acagttgcat ttggaagccc 480 cagaaagacc taaagacatc gtgccggttt gttggagaga gggttgcggg acagggggag 540 cgggccttac gcaacagaaa aggtgggcac agcgcgctca aaatgaccca gtgaggagtt 600 ggtgccgccg ggccagaggc tgcgagtcca gctggctctg gacttgctcc gcaggcgtca 660 gacgccgtgg gaacctgtgt ctgcttcttc tctccaaagt gtatcggtta aaaaaaaata 720 aaagtagtag tagtagtagt ggtaaggaaa aaaataaaaa taaaaaggag acacaattaa 780 ccaggtcata aaagctaggg caccttcgac cagggctctg gccctccagc gatcgttttg 840 cgttgtttct cttctcaaaa gtagtctcag acccctgcct ttccgctgca gctctgcgac 900 ttccccaaac tccttaatcc tgtaaattct gcaagaaact cccatcctgc aagctgcttt 960 tccccctccc ccctgcgttc cttttttctc tccccacccg cgccgcctct ctatgcccct 1020 ctcttctcag aaaaattcct gccccccgcg cgccccaaag cccgggctgc aaacttttcc 1080 ccgccgggcg cctctgcgcc agatgccgga gcgtctccac aaagcctgag catctgcaca 1140 agttcgcagc ctaactgcgg gataaagacg tttcccccgt agcttaacta gaaaagcgcc 1200 atcgatgggt gtgttaaacg ggataactag agatttcaaa caccttttat ttgcctgtct 1260 tgaaaaaaaa atctaaatga atacgcccgc taccaaaagg caaaataaaa ccaaccttaa 1320 gggtttttgt tgtttttttt ttttttcaaa agtggcgata gggactgttt ggacctgact 1380 ccaacctgcg ccctcccttc ctctatgacc ctcctgcgct tttcctggaa cccaaagctc 1440 tgacttcgtc aaacttacac aattaaaggc aggcggaaga acgcgggctg ggaagcaagc 1500 gggaagattc tagaatggaa gggagcccgc cgagcgccgc gagccgcgcc aggccgggtc 1560 cgatggagca ggcggggatt cctcccccag gcggaccccc gccaccagcc ctgccgggag 1620 ctcgcggcct gcggagcgcc cgggctggcc gctcaccgcc cgcttccccc agcgaacgac 1680 tcggggaagc tccaggaggc catctgtgct gacggttcac accagacagg accacttgca 1740 aggacaaaaa taagaaattt aggaaacgaa aaaagacgta ctggggcgag gggcgcgggc 1800 gcggcgacga cggggccggg ggcacatcct ggcggccgct cggggagaga ggacacgcgc 1860 gggaaggagc gcggcgggtg cacggccgcg ggtgggagta cgcgcctgtg cgcgcggggc 1920 gagggcgagg gcgcgtgcgt gtgaccgcgg ggagggggcg ggcgcgtgtg cggggagcgc 1980 gccgcgccag gggccgagtg tgtggggccg atccagaagt gcgcagcccc ctcacctggc 2040 ccccgtgtca tccccgaaat cccgggaaag ggtgggccgc gcgcgggagt ttggtggagt 2100 tggaactttc ggtcgcgctc gctgcccact ccgctggcgc ccggtggccc gtggtgaagg 2160 gggactaggg tggggaacac cggggccctg cggtcccctc cctttcctgt atttaagaag 2220 ccgccggcgg cgcagaggcc caggcgggct ggcgcggggg cgaggcggcc cggtggcagc 2280 agcgggcggg gcgggcgctc cggagtcggt ggggcccgcg ggttgggggg cggggagagg 2340 ggggagtgga agggaggggg aacgcagggg agggagagga ggggaggagc cgcgcggccc 2400 gcgccgcttc cgaaccggaa agttggtctt gccgaagtcc tgccaccccg gcgtgcgcac 2460 tccgctccgc tccggccgcg agcctccgag cccggccggc cgccggggga agcccgcgga 2520 ggggacgcgg ggccgggcga gaaggtccgg agagcggggg gcacctgagc ccgggcgggc 2580 ccgccgcgct gagcggcgct gagagccgcg gcggagcagc gaaggcggcc ggccgacccc 2640 gcgcgcccgg aacaggaggc gcggcgcccg agcggcccgg gcgagacaaa ggcgccgggt 2700 cggagccctg cccgcggccg ctcgctccgg gaggggccgc ccggcggcgg cggcgggggg 2760 ggcgcgggcg gcggcgcaga cactctataa aggggcgagc ccggcgcgcc ggcggagacg 2820 gcgccgcgcg gacgccgcca aagtttgctg cctgcgccct gcggagggac ggccaccgcg 2880 gcccgcgccg cacccgggcc ccgccacagc cgcacccggg gcggccgagg agcgcggcgc 2940 cggagcccgc gatgtgaggc ggcgccgggc agcgcgcgcc ccggtcccga ggcgccgcgg 3000 ccccctcctc gtcggcgcgg ccgctaattg cgagcgcggc ctcatttgca taggccgccg 3060 gagtccgctg gagcccggcc aatcggcgcg gccctccgct aatggccatg cattattcac 3120 cagcctaatt gctcagcccc atgcgcggcc cgcgcagccg ccgccgcccc gcgccccgcg 3180 ccgcgcgccc gccaggccgc cccgcgccgt ccccgccggc cgccccgctg atgccgctgc 3240 cccgcgcggg gcccgagcgc cgctagcagc atgtctcggc gcaagcaggc caagccccag 3300 cacctcaagt cggacgagga gctgctgccg cctgacgggg ctcccgagca cggtgagggc 3360 cggggctgcg gggtggccgg ggggtctggg gctgcccgtc cgggctgggg aagcgcgtgc 3420 ggcgggagcg gatgcgcgcg tccgggagcg ggagaaagtt ccctgcttcc tgcgggcaag 3480 cgtccgcccc gcgccaggcc ggccgcgggg ccccgggtac ttcgccggag cgcgcgcggc 3540 cgccgagaga gttgtgggcg aagtaaactt ggctcctctc ctcggagtcg gggagctgcc 3600 cgcgaagggc gccgaggccg cggccggctc gaggacggct cggaggccgg ggcgggaggg 3660 agtccacggt gcctccgccg ccgcgccgcc ccccagggtc tctgcgccag gacgctgagg 3720 ccggcggcgg cggggaaggc gaccgcagcc cacctaccgc tggacgcggg ttggggaccc 3780 cgccgcccgg ccagctttgt tcgggggccc gcggcccctc ccgggccccc gcaccgcctc 3840 gggtgacccg cggtgtccca gcgcgttgac gcagcctgtg atccctcgcg aggcgaggag 3900 aaggtcgggg gcttggctct gcctaatggc cgcccgggga attaagctgg gggtgagcgc 3960 agcggcggcg gcctgggcct ggcccctgct cgcggcgtgt ttccggggcg ttcgttgcag 4020 cgtctgcgcg ggccttttct ctcccgtctt tttggatccg ccgaggccgg gcgctggaga 4080 cctcggcttt gcagtcattt cgctggtagg agcgtcctct tcgaaacatc caagagcaaa 4140 gggcaggcgc cgcgaaagtt aagagactgg caaagggctg gacttcccag agtggcgcct 4200 tagccccgca aagtttgggg cgcccccacc cccttcgtcg 4240 <210> 29 <211> 2188 <212> DNA <213> Homo sapiens <400> 29 gcgcgcgcgg agcccgctga gacttgaatc aatctggtct aacggtttcc cctaaaccgc 60 taggagccct caatcggcgg gacagcaggg cgcggtgagt caccgccggt gactaagcga 120 ccccacccct ctccctcggg ctttcctctg ccaccgccgt ctcgcaactc ccgccgtccg 180 aagctggact gagcccgtta ggtccctcga cagaacctcc cctcccccca acatctctcc 240 gccaaggcaa gtcgatggac agaggcgcgg gccggagcag cccccctttc caagcgggcg 300 gcgcgcgagg ctgcggcgag gcctgagccc tgcgttcctg cgctgtgcgc gcccccaccc 360 cgcgttccaa tctcaggcgc tctttgtttc tttctccgcg acttcagatc tgagggattc 420 cttactcttt cctcttcccg ctcctttgcc cgcgggtctc cccgcctgac cgcagccccg 480 agaccgccgc gcacctcctc ccacgcccct ttggcgtggt gccaccggac ccctctggtt 540 cagtcccagg cggacccccc cctcaccgcg cgaccccgcc tttttcagca ccccagggtg 600 agcccagctc agactatcat ccggaaagcc cccaaaagtc ccagcccagc gctgaagtaa 660 cgggaccatg cccagtccca ggccccggag caggaaggct cgagggcgcc cccaccccac 720 ccgcccaccc tccccgcttc tcgctaggtc cctattggct ggcgcgctcc gcggctggga 780 tggcagtggg aggggaccct ctttcctaac ggggttataa aaacagcgcc ctcggcgggg 840 tccagtcctc tgccactctc gctccgaggt ccccgcgcca gagacgcagc cgcgctccca 900 ccacccacac ccaccgcgcc ctcgttcgcc tcttctccgg gagccagtcc gcgccaccgc 960 cgccgcccag gccatcgcca ccctccgcag ccatgtccac caggtccgtg tcctcgtcct 1020 cctaccgcag gatgttcggc ggcccgggca ccgcgagccg gccgagctcc agccggagct 1080 acgtgactac gtccacccgc acctacagcc tgggcagcgc gctgcgcccc agcaccagcc 1140 gcagcctcta cgcctcgtcc ccgggcggcg tgtatgccac gcgctcctct gccgtgcgcc 1200 tgcggagcag cgtgcccggg gtgcggctcc tgcaggactc ggtggacttc tcgctggccg 1260 acgccatcaa caccgagttc aagaacaccc gcaccaacga gaaggtggag ctgcaggagc 1320 tgaatgaccg cttcgccaac tacatcgaca aggtgcgctt cctggagcag cagaataaga 1380 tcctgctggc cgagctcgag cagctcaagg gccaaggcaa gtcgcgcctg ggggacctct 1440 acgaggagga gatgcgggag ctgcgccggc aggtggacca gctaaccaac gacaaagccc 1500 gcgtcgaggt ggagcgcgac aacctggccg aggacatcat gcgcctccgg gagaagtaag 1560 gctgcgccca tgcaagtagc tgggcctcgg gagggggctg gagggagagg ggaacgcccc 1620 cccggccccc gcgagagctg ccacgccctt ggggatgtgg ccggggggag gcctgccagg 1680 gagacagcgg agagcggggc tgtggctgtg gtggcgcagc cccgcccaga acccagacct 1740 tgcagttcgc atttcctcct ctgtccccac acattgccca aggacgctcc gtttcaagtt 1800 acagatttct taaaactacc actttgtgtg cagttgaagg cccttgggca caatgagagc 1860 cagtcctcca aactttcaga aagtttcctg ccccttctgg caggctgcca atcaccgggc 1920 gggagaagga aggaggggaa ggcggtggag ggagcgagac aaagggatgg tccctcgggg 1980 gcggggatgg cggggctgtc ctgtaggtct gtgcggccac cgtgattgcc cctctgcgcg 2040 gtgcccgaag tcccgctgaa acctgccgag ggcagcaggt ctgaaagctg caggcgctag 2100 ttgcgcggag gtggcgcagc tgctctggag gcgcagagcg aatacgtggt gtttgggtgt 2160 ggccgccccg cccctggcgg tttcctcg 2188 <210> 30 <211> 2933 <212> DNA <213> Homo sapiens <400> 30 gcgccggtcc ggagccggag cgcgggaatc actcgctgcc tcagcccaag cgggttcact 60 gggtgcctgc ggcagctgcg caggtggaga gcgcccagcc tgggaggcag tagtacgggt 120 aatagtagga gggctgcagt ggcagaagcg agggtggccg cagcacttcg ccgggcaggt 180 attgtctctg gtcgtcgcgc accagcacct ttacggccac cttcttggcg gcgggcgccg 240 aggccagcag gtcggctgcc atctgccggc gctttgtctt gtagcgacgg ttctggaacc 300 agattttcac ctgcgtctcg gtgagcttca gcgacgcggc caggtctgcg cgctcgggcc 360 cggacaggta gcgctggtgg ttaaagcggc gctccagctc gaagacctgc gcgtgggaga 420 aagcggcccg cgagcgcttc ttgcgtggct tgggcgccgc cggctcctcc tcctcctccg 480 cgacgcctgc cggcccgctg ccgcccccgc cgccggcccc gctgcacagc gcggacacgt 540 gtgcacctct ggggccaaca ccgtcgtcct cggtccttgg gctgcggtcg cctgcggacc 600 ccggtgggaa cagaaacaag agactgtcag cgccacagac gaggtgaggc cgggcctcaa 660 ctgcaggggt cacgggagtg gggcggaaat acactttgat cccactcaag cggagcggag 720 gtctgggagg ccctgggccc gggagaccag tcttagactc ttgccccact gggtatccca 780 tctaggcctc ttctggggag ggcggcagac tcagccgctg tgtcaacgct gtgttgtcga 840 gaccagctcc ccaccctctc tgggccccag gctcccctca gtaacttggg gcactcgacc 900 cgagcatccg cgaaagccct cccggctctc agcgttgagc attgggattc tagactgcat 960 ttccgtctct ctgcttgggt tcacgcgcct ctccacactt agttcacacg cacacacgcg 1020 cgcgtcctcg cagcacacac ttgtctggtg caggtaaggg aaggtggagg cggatcctgg 1080 ggccaaaggt atttagaatc tttcaccctc agccgcctgg gattgctgtg agagacatgg 1140 aaacaggctg agccgaggcc ttagatgaga ggatggactg gagagtaaag agggagggtt 1200 gcccctgcat cgagtttttg gaccctgatc ccacaccagc ttctcggtct cgtacccgcc 1260 cttccgaaga actccagcag aaaggtccag cggtcccctg tgcttgaggc ctacagaagc 1320 ttgtacccaa ctagggcagg cacccgggtc ttccagacca caggacagga caggccacgg 1380 ctgaggaggc ctctctcctg cctccaggat gaactaaaga cccaatccgg gatcttcggc 1440 ctagggctgc tctcccagac ctggggtctg agaaagccaa accagccctt tccccaaagc 1500 tctagttctg cagattctca gctctggccc actcggaggt gttcttcacc acctatccac 1560 ctactgtggg gcccggccct gggaccttga actggcaggt ctctggtcca gagctaggtc 1620 actggctacc tgaggtctct gaacccctca cttttccgct tccctgattt tggggatttg 1680 gggacagaca cggcagaaag cactggcgac gaactcaaaa actcccgaac gcaaggggca 1740 gcggttctcc caacccagtc taatgcacat tggcccagga tgtctcaggc ctcaccccag 1800 gacgtagggc tctgaggagc tactccggtc tctcgcgggc tcagttcccg aagtgataga 1860 gcagctcgcg ccagagcgca gaacttcggg atttggccag cctccgagcc ccagggcgca 1920 gggtgctcaa gccgaccacc ccactcggcg tggttgccct ccgcgtccat cccctcagcc 1980 cggcccccat ccccgcgaag ccgcagcaga cctgagacgc tggcggacat ctcgctgtcg 2040 ctccggcccg cggcttcctc ctctaggtct ttggaagcgg ccagctcaca gaccggctgg 2100 ccgaggctca aggatccccc cgcaaggccg gccccgctgg ccccccgcgc gtccgcgcag 2160 cgccgcctgc tctcgttctc ctcgctgagc gcggagtccg agtcccagcc ttccgggctc 2220 tccgcagtcc gccccgcagc tgttctggta ccggcaggag acgccagcag agagtcctcg 2280 gcgcccccca acgcgcccgc gtccctctcc ccaaagagcc gccaacagca gacagcggga 2340 gccgcggcca ccgatgccgc tgtgcccccg ggcgccgggc gcccctctgg cgcggccagc 2400 ccgccgcgct cctctttctt gttgaggatc gcctggatgg agaaggacgt caaggtgttg 2460 gcgccgcgca cagccatctg cgccgcgggc aggagcggcc ggcggggcgg gcagctgggg 2520 cgccgagcag ctccgagcgg gacagagagc gccggcggcc gcagcgcgag tgagctgggt 2580 gtgcgaggcc gccgccgccc actgctgcgc ggcccagcag ctcccgcccc actccgtccc 2640 aggatcagcg ccgaccctcg cccccacctt agaggcccac cccgcccgga gaccccctcc 2700 ccccgaatcc agagccagac gctctccttt cgcagctcag ctggattatc tcatcgcttc 2760 tcgcccttag gggcgggctg gggtctgccc cctcggggga cgtgaaggag gattggcggg 2820 ggcccctccg tggcagcagt cccctcccga gcgccgccgg ggcgcacagc ccgagtcact 2880 ttttctttgc gcgtctgtcc cttcctcgcc tgcaggattt cgctcctggc ccg 2933 <210> 31 <211> 2001 <212> DNA <213> Homo sapiens <400> 31 agtgtcacat caacaaattt acacatcaat ctaccgcagc taacttcgta acaatgggag 60 aaacattcag aataatactg agcatcctac caagggtctg aaaaattgaa ttcaaatact 120 ctgtgtgtaa aatgcctaga ctctgtcatt ccagcacatc tatgatctga tctagcaagt 180 atatcgttag actacaaatt acctttttcc tatgacgtgt aaaactccat taaaaatgaa 240 ttcttcctaa taaagttttt tatggcgtct aaaattgctg tgaatgttac accttttaca 300 atcacctttt agccagaaag ccattatttg tagaatcctc ctgtatttca gttatttgtc 360 acctatttag gctgggccta atagcaaaac tgtcccccgt tactgaattc agagaattat 420 tcgggcacac gatttatttc ctatcttgat tagactcctg agcccgtgcc ccagcctctc 480 gctaatctcc ctggaccaga caactccatt agaatctggc acccacgttt gttctgccta 540 acactgcagg aaggacagag acttcaaagc acgtgtttgt ttttttgttt tgtttttggc 600 taccaagaag ccaaatttct gtatcctcta ccattcaaaa ccccaattca acaaatttac 660 acgggggttt ttcctccacg ttaagcagtt agtcgggtac tagagataca catataaaac 720 acagactctg ccctcaaaca acccaatgag cagaaaattc tcttaggcac caaaacgctg 780 taatagattc aagtgtgtag aggagaagtt tggtagagtg gatatgacgc tttctttctt 840 tgtagtacag aaaagataaa tctgtagaaa agggagaaag acaactgggt agaaaattta 900 tttcaaatat ctaacccaaa tcttcaacag attttccatt ttaaatattc caaaaagtgt 960 accattgtat attatactaa atgcaggttc atttatcact taaaaatttt taagctaaaa 1020 aatctcaaac aattaacatt tgggaagaaa aacaggactg atacacaaag tagtcaaaat 1080 atttcagctt tctaaactgt atgcactgga ctaactgttc aatattagaa tatctctaca 1140 tttgaatttg gatagcccac agtgataaat actggactga aaaatctgac atcgaacata 1200 tgcaaaacta atggctacta tgaaaaaaga tagaatgggg agagaaaact tgaatgtgcc 1260 aaaacattta aacgctcttt aaaatatcct gagatgctaa attaaggaca aaacgattag 1320 agttccaaga atacaaattt tcatctcttt caagattcaa ctgaatattg aatctcattg 1380 agattatgaa atattctcta agcatgtgct taacttctat ttggctttcc gcatttcacc 1440 acagtgaaca gcccattctt tttccttgtt tacaccaaat gctcgttttg aacacaactc 1500 aaaatggaat tccaggccca aaagtcacca cccctacttt cacccccaca ggcagctact 1560 taacagataa ggaattcaag tgcaggacct gaaggtctta tttccatgca aatttcacaa 1620 tccccgttac ttgcccagat acaacaatta aagcttaaaa ggtggcggga gtgggggact 1680 tgaggactgg tctgaggaga aagtgaatct cccaagggtt cctaaatggt tttgcttcca 1740 gtataaaaac tgcgagctac cagtagaatt taacaacagc tcaaccttgc atttggaaca 1800 gttactatat agttcacttt cttttttcat gggggcgggg tatggtgtct tacctactct 1860 taaatttgaa cgtattaaca ggttcccctc cgcgcacact gacatatttc ttatccccca 1920 taatgaattc agccatatgg cattctttcc catcgaaggc catcgggaat ggctttagga 1980 agctgatttt caagctttaa g 2001 <210> 32 <211> 567 <212> DNA <213> Homo sapiens <400> 32 tcggcggccc ccccgctgtc tggcggacac ttgttagtgg ctgcggagaa gccactcaca 60 aagtttccca tcccgttgag ggaaggggtc ctgactgcgc cagcggggca ggcccagaag 120 gcgcggtatc tgggaggtcc ggccgccgca gacgaccccg ccgaggccca aagtgcgcca 180 gcttctccgc gcccctccgc ctcctcctcc tcctcctccc tgcagagggg cgcacgcgca 240 cagacacacg cacgcacgca cgcacttaca cacaaaagga agtcatggaa ggtgctggtc 300 cctgcataca ggcacactcg cgcgggacac acacacaccc cccaaaaaga ggcgtgcggg 360 gttcgccaga cggtgggcaa aagcccgtcc tccccccctt ccagggcctg ctcacttcag 420 ggagcgccca ctcgcccagc cacgggccaa gagcgcacgg acccaggcgg gcggcagccc 480 acccgccacc acgcagctcc acttcgctgt tccacagcca ccaaccgcac agccggcaca 540 gtcccgcccg cgcagctggc ccaatcg 567 <210> 33 <211> 1001 <212> DNA <213> Homo sapiens <400> 33 ggcatagttt aaaactatcc ctgctcattc tttaaaataa gtccacagta gagaataaga 60 catcggaaaa tacaaacatt tcttcatatc cgaatctatt tgaatcctaa gatgcagata 120 cggagagttc agagtgccat cagtacaggg cagagaggtt gaagagctca ggaacagaca 180 tagggtgggg gaaaggggta ggggcaacga cgctgacttt tggttaacaa agcccttcca 240 ggctgcggag caacctcctc tgcccttcac ctgcccggcc catctctggc caagaagacc 300 ctgccgccaa atccccacac ccagtccagg tcgcagtgca cagactggcc cttccgaagc 360 ccctcagcgg tagcccgact ccgaagctca ccgaggcatc cgtgagagga gatgccacct 420 agcgcagatc acatctgctc tgaatccttg acaaccgcag cccaaagaat gataaactac 480 aaaggccgga aatgcgtcac cgcggcccgc tctccgcgaa acagcggttc cggctgtgtt 540 ccttctagga aggccggagg tttccacacc tctgtggtcg tcactctgaa tcccgtctgt 600 agtcttaagt gagatactag gtgacacatt gtcttccacg cggcaatata ataacggcca 660 acatagtgtt ttaacacgta ttaattcatt accccgcata acaaccctgt gagttaggta 720 caattatctc catttaacag gtgaggaaac tgaagcacat ttctacattt attagttgcc 780 atttcctgca aagaataccc tttcttttcc ctgccgtctc attttatcac gatgaactca 840 tggattcctt tacaaataat tactgttatt attatgttga tgctcaaatt atttaaaatt 900 tggtcagttg gagccctttc acactgctcc ctctcttttc tttttttgac aaagtctcca 960 ggctggagtg cagtggatgc gatctcagct cactgcaacc t 1001 <210> 34 <211> 383 <212> DNA <213> Homo sapiens <400> 34 tcgcacgttc gcaggcgcgg gcttcctgtg cgcggccgag cccgggccca gcgccgcctg 60 cagcctcggg aagggagcgg atagcggagc cccgagccgc ccgcagagca agcgcgggga 120 accaaggaga cgctcctggc actgcaggta cgccgacttc agtctcgcgc tcccgcccgc 180 ctttcctctc ttgaacgtgg cagggacgcc gggggacttc ggtgcgaggg tcaccgccgg 240 gttaactggc gaggcaaggc gggggcagcg cgcacgtggc cgtggagccc ggcctggtcc 300 cgcgcgcgcc tgcgggtgcc ccctggggac tcagtggtgt cgcctcgccc gggaccagag 360 attgcgctgg atggattccc gcg 383 <210> 35 <211> 279 <212> DNA <213> Homo sapiens <400> 35 ccgccagggc acggcccccc ctgcgcccca aactgagcgg caaagtcagg gcccgcggcc 60 ggatgctcag agctaaaggc cgcggaggac agatgtgctt cttcctcctt cccgcgtctc 120 cccatacaag tactaccccg cacgtcccat caggcttgcc tgtgggccag gattcagggt 180 cctgagccga aacctaccag gagagagaag gctctggaga cctctgtaac agtcgtgcgg 240 agaagacaaa gtcagctgcg tgcgtctcct ccggcgccg 279 <210> 36 <211> 2775 <212> DNA <213> Homo sapiens <400> 36 tcggagtcac gtgagcgccg aggcccctcc cgcggcaggc ggcgaaaggg cttgcgcgcc 60 ctcccctcct ccacagcccc ccgcccctcg cgggcccgcc cctccaggcg aggccaacct 120 ccgcgcccgc cgcccgagcc tcagcggtcc gggaggagct cccggcggcg ctcggcagag 180 ccctcggccg gtgccccgcg gccgccgcgc tcccagggct actggcgcag cgcacggaga 240 acccggttct cggcgcggtg cgtcgtgctg ggcccccgcg ccgggccacc tgaagccaga 300 ggatttgggg cgcactgaag ggactgcgtc tcccagctcg aacccggctt aagtggggcc 360 gggagcgagg tcgggaaagt ctcacccgcc caaagcctca ccaccgagag gcacttaaaa 420 aggaaagcgc agagggaccc tgcccacgcg cgtgtacaca cacacccccc cacacacaca 480 caagcaaaca cgagctcccc gccacttcct ccccagggtc tcctcaaggc caaatattgc 540 tcccaatgac agccagtcac cccttggcga acgcctgcta aggctccgaa gagccgggcc 600 accgatctag ctcccggctg aaagcagccg accttgtcac gcgcggggcc gggaatggga 660 gggagggtgt tagagggtga tcgctgtggg aaagtgagag ggagcggctg ttagtcattg 720 ctccgggtcc attaccgaga atccccaaac ctagtccgcc gctgcgtggc ccctctcccc 780 atgcaaagca gacccccgaa gaagccatgc caggctgagg gacagacgcc ggggctcgaa 840 gctccgggca gattcagaaa gaggcgtcgc tgcagaaagg acgcatcaca gttttcagat 900 cttaatgtgg ccgaggtttt acaactcccg acccggcgca gaaaggaaat cccaccatgt 960 tccccggagt cgagaaaacg gtgaacagct ttcggcctgc gctcgacctc tgcgtctgcg 1020 tctctctcgc ctcggcttcc cttatttttt aaaccaccac cacactcctt cccccgccac 1080 ttccttcccc cacccccttc ctccgttgca ccagcagcag agtcgcacgc agcaaatact 1140 ccttcaagaa ttttacctac ctacagttca agcagttact gggatgtcct gactaatcga 1200 agatgctgcc gcgcgcgtgg gtcgctctgc gcaagggcct cttcgaaaac ccgactaggc 1260 gcaactcagc gttcagcagg gccgggagcg ccaggtcgtc cccggggccc gggccccatg 1320 actcctgccc caaagcccac tccacccgac ctccctttcc tgaggctgtt cccagttgct 1380 gctttgggtc gctccggagc tcaagaactc gggttgcctg ccgccccact ctccacgcac 1440 atacttggtt ttcttcttag gggcattggc aggtagactt tgaggaagaa aagtaaagga 1500 tcgaacagct cagccctccc tcccgaccgt ggatgcccgg agtcgaccaa cacctcaggt 1560 ccgggtgcgg aggccgcggg cgcccctgcg cgaccgtccg cgcccggcaa gagccgcgcg 1620 gctttcgcct ttgctggtcc cgcgccaccg ctggggcggg ctgcgaaagg gttgggaaga 1680 gcaaagggtt tttttgtttt gttttgagac gcagaagccc tttaaaaagc ccggcgagga 1740 gaggtccaga agtagagaaa gcagacggag gcaagctgtg cccgcggggc aaagggacag 1800 tagaaggggc gggcgcccgg gttccccgga aaaccctcgg ccccaaggaa tctcctgggg 1860 cgggagagcg cggttctaaa accgagagga taggaagggg aagggggagt tgtgtttcaa 1920 tttcggattc accaggattc atctctagtc acatttttct tctcaaattt ttaaatcgaa 1980 aagataaaag ccaaaagaac tttcatcccc agagcttttt attgggggaa aggaatgtaa 2040 ctcggggtgg ttgtccttca cttccctact cgaatcttct cctaatgccg aaatgtgttt 2100 acaggtagcc tcagtttacc aagtatgtat cttttggggg tttaacctct cacaaagcct 2160 tcaactcaca aaccgcgatc cttggaaacc atcctccaaa gcagtgcttg gaggcctcta 2220 aggcccccgg accaactccc gctggaagaa gcctgcaggg actcgggaat cacgggaacc 2280 tttcccgtcg gttccgggcc tggagggcca ggaagagccg cgcgtccgcc tttcgtcccg 2340 ccaggaactc cccataggac acgacaccgc aggaacaagc gtcctgggag cccctgggat 2400 cttggctgtc gtctctaggg accctacacc gtgaaatgat agaggcgagg ttccttgggt 2460 tccgcaagtc gacgaaaata gctcgtggag aaggcgcgtc ctgcaactgc agttcgcaag 2520 ctctcagggc gccccgccag ctgggggcca gattgggtga cactcccctc gacgcagcct 2580 ccggagcggc gcgcactctc cagaggccag caggactgcg ctctctaccg cagaacctgc 2640 tccagctagg tgttctctcc ccatctcgcc gtcgctctgc cccctcactc tctctggacc 2700 tcagagccgg ttctctcctt cctcctcccg cgctttccgt ccggggatcg caacctccag 2760 cccgtgggca acgcg 2775 <210> 37 <211> 2255 <212> DNA <213> Homo sapiens <400> 37 ccgctttaga ggcagcgctt atagcgctag ctggtcgtgg aatgcgatta cagcgtctcc 60 attggagacc gctgagtgcc tcggtttccc tgtctgtgca aagtgcactc cccagacgcc 120 gctgcctcga gggaccagga aatgcgtctg ggggcgccag gaaagatgag aagataaagt 180 cacgatgcgt ccagctagct atagacacaa gcagaggagc cagtaggcca aaggagacgc 240 acagctgatc cgtgccgagg cgcgggctcc actccctgaa gtggagggac ccttgaatct 300 ttccttgcgt aggcgcgcgg cagagcagcg atttggcgaa aagggccgag actcaggatg 360 cctgcaatgc gagcgagggg cggacagggc gcacggggcg cggcaaggct gcgaggggcg 420 ggcctgggcc ctgagcctcc tgcacttcca gccacagctc tgggccttgg gggcgggaag 480 gggtggagcc acgtggggag gagcaaaacc cggaggtccc gggcaccttg ggcagagcca 540 gagcggcggg agccggtcct gggcgcgttg ccccgggagc gcccgtcgtc cgggcagagc 600 gcagccgcaa ccgcgaccac agccgcagtc gctttccagc ctgccttcgg tgcgcagcgg 660 gggaacaggg ctagtgcagc cgccggaggg gggcacgggc tcctctccca tcccagagct 720 actgggctgc ccttgctgtc ctcgccgccc cagcagaccc cggccggacc tgccacctgc 780 gccctggttg cgccatggat ccttcggaaa agaagatatc ggtgtggatc tgccaggaag 840 agaagctggt gtccggcctc tcccgccgca ccacttgctc cgacgttgtg cgagtgcttt 900 tggaggacgg ctgccggcgg cgacggagac agcggcggag ccggcggctg gggtcggccg 960 gcgacccgca tggcccggga gagctgcccg aacccccgaa cgaggacgac gaggacgacg 1020 acgaggcgct gccgcagggc atgctgtgcg ggcccccgca gtgctattgc atcgtggaga 1080 agtggcgcgg ctttgagcgc atcctcccca acaagacgcg catcttgcgc ctctgggctg 1140 cctggggcga agagcaagag aatgtgcgct tcgtgctagt gcgcagcgag gcatcgctgc 1200 ctaacgccgg cccccgcagc gccgaggcgc gcgtagtgct gagccgagag cgcccctgtc 1260 cggcccgcgg ggccccggcg cggcccagcc tggccatgac ccaggagaaa cagcggcgag 1320 tggtgcgcaa ggcctttcgc aaactggcca agctcaaccg gcggcgccag cagcagacac 1380 cgtcgtcctg ttcgtccact tcgtcgtcca ctgcctcgtc ctgctcttcg tcgccgcgga 1440 cccacgagag cgcgtcggtg gagcgcatgg agacgctggt gcatctggtg ctttcccagg 1500 accacacaat tcgccagcag gtgcagcggc tccacgagct ggaccgcgag atcgatcact 1560 acgaggccaa ggtgcacctg gaccgcatgc ggcgtcacgg ggtcaactac gtgcaggaca 1620 cttacttggt tggggcaggc atcgagctcg acgggtccag accgggagag gagccagaag 1680 aggtggcggc ggaggcggag gaggcggcgg cggcgccccc tctagccggc gaggcgcagg 1740 cggcggcgct ggaggagctg gcccggcgct gcgacgactt gctgcggctt caggagcaac 1800 gggttcagca ggaggagttg ctggagcgcc tttcagccga gattcaggag gaactcaacc 1860 agaggtggat gcgacggcgc caggaggagc tggcggcgcg ggaggagccc ctggagcccg 1920 acggtggccc cgacggcgag ctgctgctgg agcaggaacg ggtcaggacg cagctcagta 1980 ccagccttta cattgggctg cggctcaaca cggacctaga ggccgtcaag tcggacttgg 2040 attacagcca gcagcaatgg gacagcaaga agcgcgagct acagggcctt ctgcaaactt 2100 tgcacacttt ggagctgacg gtggcaccgg atggggctcc tggctctggc agtccctcgc 2160 gggaacctgg gcctcaagcc tgcgccgaca tgtgggtgga ccaggcccgt ggactggcca 2220 agagcggtcc tggcaacgac gaagactcgg atacg 2255 <210> 38 <211> 875 <212> DNA <213> Homo sapiens <400> 38 ccgcgccacc cctcggctct ctctctctct ctccctaccc cgcaggatct acaccggctg 60 tgacatggac cgcctgaccc cctcgcccaa cgactcgccg cgctcgcaga tcgtgcccgg 120 ggcccgctac gccatggccg gctctttcct gcaggaccag ttcgtgagca actacgccaa 180 ggcccgcttc cacccgggcg cgggcgcggg ccccgggccg ggtacggacc gcagcgtgcc 240 gcacaccaac gggctgctgt cgccgcagca ggccgaggac ccgggcgcgc cctcgccgca 300 acgctggttt gtgacgccgg ccaacaaccg gctggacttc gcggcctcgg cctatgacac 360 ggccacggac ttcgcgggca acgcggccac gctgctctct tacgcggcgg cgggcgtgaa 420 ggcgctgccg ctgcaggctg caggctgcac tggccgcccg ctcggctact acgccgaccc 480 gtcgggctgg ggcgcccgca gtcccccgca gtactgcggc accaagtcgg gctcggtgct 540 gccctgctgg cccaacagcg ccgcggccgc cgcgcgcatg gccggcgcca atccctacct 600 gggcgaggag gccgagggcc tggccgccga gcgctcgccg ctgccgcccg gcgccgccga 660 ggacgccaag cccaaggacc tgtccgattc cagctggatc gagacgccct cctcgatcaa 720 gtccatcgac tccagcgact cggggattta cgagcaggcc aagcggaggc ggatctcgcc 780 ggccgacacg cccgtgtccg agagttcgtc cccgctcaag agcgaggtgc tggcccagcg 840 ggactgcgag aagaactgcg ccaaggacat tagcg 875 <210> 39 <211> 975 <212> DNA <213> Homo sapiens <400> 39 ccgccgggtc actggagtct cagccttccg gaatccgagc cggcccgccc cactccccgc 60 ccttcgcggt cccgcccacg acctctcccc acgcctcccg ctccggcccc caacctcccg 120 gtcggacgtt cgttcccggc tctagccggc ctccgcgcct ctggcctctt tccttccggc 180 cgtcccgacg gagatatttc ttcaatactc cataaataca ccccgccgcg gaacccaccc 240 ggagtgagac gcccaacacg tcgtcgaact ggggttggcc gggggccgct ccccgccgcg 300 ggcccgcaga ctcgtggcgt cgccccgcag ctccgcctgg ccgacgggga accggccgag 360 acccggacac gcacgcccgg gaggacaaaa gcgcgggcgg accccgcagg ctgggacccc 420 ggcggctggc ccgctccccg agaagggccg tggtcggggg gctctcactc acgagccgct 480 ggctctgggt cagccctgcc cccagggcag cgctccatca tgaggctggc ggggcgctga 540 gccgtggcgt cctcgctcct gcgctgcccc tctgcatcct ggccccttcc ctgcacacgc 600 agagctgcca cactgagcgc ccctcagctt acttaagctc ggcaaggctg gagaaggccg 660 tctgggtgac cgggcggagg gggatgctgg ggaaggaaga attcaggcag ctgcaaagag 720 cgcgcgaata tattcattcg acatacctca tgggcgccta ccctgggcct ggtccggggc 780 gggtgtttgc ggggtggggc cgaagcaggg gcgtcgccga gttgaagacg tgtactccga 840 gcgctcctgc gttcattcat tcgctgggtg gagagaggaa ggacaagagc cccgcgccga 900 tcggagggga gcagaatagt aggcacagtt agagggtctt cacggtgcgt ttcggaacct 960 tggctgcccg gctcg 975 <210> 40 <211> 1284 <212> DNA <213> Homo sapiens <400> 40 tcgacaaacg caaagcgacc caaaccctgg agggtcacat cccggctgct acaaacctcg 60 gcggggcggc cccgctcttg cggccgggac agcgcagcgg cagcaggggc cgcaggggac 120 ccgcagattg gcacgccgct ccccatcccc gcagcgcgtc tgcaccggag actctgcggg 180 gattgtagcc ggagggcggg ccgggctccg aggcgctgct caggcattgg ggtttgtcct 240 catgagctcc acgtcggcgt gcaccatctc cctcaccagc tcctgcaaca caggggtggg 300 cgtgagggag gagcttctgc cactctctcc tggtgacacc ccaccccggg tgtcggcccc 360 agagaggcct ccgcgtccct cgttccagct cccctcactt ctcccgcacc ccgccttccg 420 ggctttgggc atcgcaggcg cctcaggcgc ccgaccctga gagctgccgc cctgcagccc 480 ggggccccgc agcgggcggc gtgcgcccta agagatactc acatcgaaag cgacccgggg 540 cttccagttc agcttctgtt tcgctttggt gcagtcgccc tgcagaaagt cctagggaag 600 aagaggggga gacgaagcag gcgtgggtcg tgggggtggg ggcagcaggt cccgagcccc 660 gggaactccc accgttccgc tccctctggg cgcacaaggc tccgggtttc cctgctttcg 720 gtccctgctg tgcgcgttca gttgcggctc tcggcgccgt aaatcactag gtcgcggtta 780 agaatgtgct gtgcggaccc gtgaggaccg tgaccgcgat ccacccccag ctacctccac 840 acctcttctc cccaaggcgt cccttgggct cttaatgctt tttttttttt tttttttttt 900 tttttataac atgaagttgt cagggacgct cctatgagaa ctgtttggaa ttgctgcact 960 tctctggcta ggagggaagt gagtaaatca ccaggcgccc ctcccagctg cccgtgtccc 1020 tgcgccgctc agctcctgcc gcagggctgg ccgcgccaag cgcgcgtcct acccaaagcc 1080 accagccccg cggggaaggg actcgggctg tggggcgcga ggccccagga ctcggggacc 1140 cctctacctc ggcggcagcg tgcgaccctc tttctaacgc ggccgtggat gtttcttccc 1200 gggccgcagc caagcgcggt tcttcctggg cggtggcttt gggcttttcg tacccacagt 1260 caagtcagtt cacgtcgcct cccg 1284 <210> 41 <211> 1001 <212> DNA <213> Homo sapiens <400> 41 actgctctaa atacttcata tatattaact cctctattct gtacttctgt tcccgtttta 60 tacagcagga aattgaaaca ctgagaggtt aagtaactaa agttacagag ctagagtgac 120 aggagtaaag cttcaactca ggcaacccag acttccagag ttctgatctc cactactaag 180 ctgctagcat agcttttctg gtaactattt ttaattcaaa tataattcga gtgatctatc 240 taacaagtca tcactctgac aactcagtga cttgtaatgt aaaattattc attgtaattc 300 atttaatatt attgtttctc tgtgctgcaa aaatcatagc aatcgagatg taatttatta 360 ctctccctcc cacctccggc atcttgtgct aatccttctg ccctgcggac ctcccccgac 420 tctttactat gcgtgtcaac tgccatcaac ttccttgctt gctggggact ggggccgcga 480 gggcataccc ccgaggggta cggggctagg gctaggcagg ctgtgcggtt gggcggggcc 540 ctgtgcccca ctgcggagtg cgggtcggga agcggagaga gaagcagctg tgtaatccgc 600 tggatgcgga ccagggcgct ccccattccc gtcgggagcc cgccgattgg ctgggtgtgg 660 gcgcacgtga ccgacatgtg gctgtattgg tgcagcccgc cagggtgtca ctggagacag 720 aatggaggtg ctgccggact cggaaatggg gtaggtgctg gagccaccat ggccaggctt 780 gctgcggggg gaggggggaa ggtggttttc cctcgcactg tcttaaaccg atggcctttc 840 cttggcacag ggtccactgc agcatgccaa acgaggaggc aggggcgtcg tccccccgcc 900 ccccactgca gcactggaga tggatttcct gtacttcgga tccagggttt ttgacagaag 960 aggaagaagg gggaggggta gaagtgttaa ggggagtctg c 1001 <210> 42 <211> 859 <212> DNA <213> Homo sapiens <400> 42 acgcagaggc cgtggcatct ggccgcagct gggctgcagt gcgtgcgcgc ctggcctggt 60 ggtccgatgg gaagcccggg gcggggcagc cgcggggcgg gggcggggcg tcgcggagat 120 aggccacgcc cctgcccgcc cgcgcaggcg cgctgcgggt cgttagctgt cagagccaag 180 cggcgggctg gcggcgggct ccgacgtctg cgccaggacc tggctggctg agcccggcgc 240 agcagcagca gccagggcag cgcggcccct actccctgtc aggtcgtaga ggcgagcagg 300 gaccagctgg tcgccggccc ctcgggcaag atggggaacc gggagatgga ggagctgatc 360 ccgctggtga accgtctgca ggacgcgttt tcggcgctgg gacagagctg cctgctggag 420 ctgccgcaga tcgccgtggt gggcggccag agcgccggca agagctcggt gctcgagaac 480 ttcgtgggca ggtaagcgcg cagggcgcgg agtaaggatg cggcagtggg gcgaccccgc 540 tgcgggccgt tggaacgtgg acgggcagcg ggagccagag ggtggatgga ccaggcgctg 600 cggtggaatg gggggcagag tggaatgggg ggcagagtgg cggtgtccgt ggggcgggcg 660 gggtcctcca gctctgggca tcctccgtcc cctgccaccc cccgcctggt ggccctcctg 720 cctgcctttc atcgtgcgat acaaagccat ttcctccctg tcctccagtc ggggagtcgg 780 gggaggggtc cgccccgggc tcgaccccca ccccctcggt gcgcgccagc cccgggcagc 840 ctccctgcgt agcgcgccg 859 <210> 43 <211> 2001 <212> DNA <213> Homo sapiens <400> 43 gacagaaaac agccagagcg caccactcac ctgagtgcca ggtaaacacc tgggcgcgac 60 agggacagga aacaagggta gggtgcggag gctggggagg aagaggttgg aaagggggga 120 aataaatggg cggggcctag caggtcctgt gcggggctta gggccggggc ggggcccagg 180 aagactcagc agcgggtggg tgagggtcta aaggcggcaa ttccgggccg ggtgcggtgg 240 ctcacgcctg taatcccagc actttggtag gccgaggcgg gcggatcacc tgagatcaag 300 agctcgagac cagcctgggc aacgtggtga aaccccgtct ctactaaaaa tacaaaaatt 360 agctgggcgt ggtggcgggc gcctgtagtc ccagctactt gggaggctga ggcaggagaa 420 tcgcttgaac ccgggacgtg gaggttgcag tgagctgaga tcgcgccact gtactccagc 480 ctgggtcaca acagggaaac tccgtctcaa aaaagaaaaa aaaaaaaggc aattccgagc 540 ccagacaaac cttaaggagg ggatcctgga tcttcagtta agtgggcgac acctggagtg 600 aggggcgggg catatgcaga gtaggtgcgg cctacaagcc aaaaaggaga aagagttgga 660 atggtgggcc tggcttatgc gggtgggcgg ggagagggtg gatcctagag gaggtgaggc 720 ctaacattgg gcgaagaagg cgggagcctg ggccaatgag ctgacggtag gccggggagg 780 gggcggtggg gtggggtggg caatgggcaa tgagacggag ggcggggccg ggacctaata 840 tggcgggtca ggagggtctg gaagacgaag aagagggaca ggcaatgcca ggtctaggac 900 taggagggag gcgcgggcgg tattagcggc tggaggaggc ttcgggaggc ccggccgacg 960 gccgccgcct ggtgctaccc acccaggggc gcgcgaccct cccttcggtc tggctccaaa 1020 gacctagcag cactgacttc acccagctgt ggttccaacg gcgggtccag cggcctcggc 1080 ccggcgccgt cctcctgctg gcccaacagg cccgccagcc cgcccctgta cgtctgtgat 1140 tggacggcgg cggccactga tgttcaagcg acaggtcctg gcccgggagc caatctgcag 1200 gtgttgaggc ccaggctccg agagcgggcc gaggaggcgt ggataccctg attcctaggg 1260 ggcaggcctg gttcccccga ggaggacccg gcctatgaat gactggagtt ctggggttct 1320 ggccgaaaga ggaagtggga cagggccggg tgtgatgggg cctagagtca cagagccttg 1380 cggccctgct gtccctgcaa gaagccagct tctggccagg cgcggtggct cacgcctgta 1440 atcccagcac tttgggaggc cgaggcgggc ggatcacgag gtcaggagat cgagaccatc 1500 ctaacatggt gaaaccctgt ctctactaaa aatacaaaaa attagccagg cgtggtggcg 1560 ggcgcctgta gtcccagcta ctagggaggc tgaggcagga gaacggcgtg aacccaggag 1620 gcggaggttg cagtgagctg agattgcgcc actgcactcc agccagggcg acagagcgag 1680 actccgtctc aaaaaaaaaa aaaaaagcag ccagcttctt cctcctattt tgcaaccttc 1740 tcccgatatc cttgaacatt ttagggacag ccatcactta accatagagc aaccctatta 1800 agtctaagta gcataatcac attcctgtag tatagatcat gaacctgaaa ttcgaggatg 1860 aagtcatttg cctgaagaca tacatcttgt aaaatagcca tccgcaaaga tgtagggaaa 1920 aaggcagcga tctgtggcta cacctcccct tcctcccgga agcagccact ggaacgtttt 1980 tagctttttc tttttttttc a 2001 <210> 44 <211> 1007 <212> DNA <213> Homo sapiens <400> 44 acgcggtgac cttgaccccg gcccaggccc tgctaatgaa gaggaaagcc cgtacgcact 60 cggcctgacc cacggcgacc ctctgtgacc aatcatacta ccaacctctt aaacagagct 120 ccaccgacgc aatgcccagg cataaaaagg ccaggccgga gagaccgcca ccagtcacgg 180 accctggacc cagcgcaccc gcaccatggc cggccccagc ctcgcttgct gtctgctcgg 240 cctcctggcg ctgacctccg cctgctacat ccagaactgc cccctgggag gcaagagggc 300 cgcgccggac ctcgacgtgc gcaaggtgag tccccagccc tggtcccgcg gcgctccggg 360 gagggaggga cccgcagcca caggggcgcg ccccgctccg gcctcgcctg agaactccag 420 gagctgagcg gattttgacg ccccgccctt gaccgcggtc gaggccccca cggcgcccca 480 gcgcgtctca gccccgctgt cccgcccgaa ctccgaaccc cggaccccag catccttgcc 540 cggcgcaccc cggccggcct cgcagggtcc tccgagcgag tccccagcgc cgccccggct 600 cccgctcacc ccgcccgtcc ccgcagtgcc tcccctgcgg ccccgggggc aaaggccgct 660 gcttcgggcc caatatctgc tgcgcggaag agctgggctg cttcgtgggc accgccgaag 720 cgctgcgctg ccaggaggag aactacctgc cgtcgccctg ccagtccggc cagaaggcgt 780 gcgggagcgg gggccgctgc gcggtcttgg gcctctgctg cagcccgggt gagcggggca 840 aggcgctccg gggccagggg gaggcgggcg ggggtgcggc cgggattccc ctgactccac 900 ctcttcctcc agacggctgc cacgccgacc ctgcctgcga cgcggaagcc accttctccc 960 agcgctgaaa cttgatggct ccgaacaccc tcgaagcgcg ccactcg 1007

Claims (10)

  1. (a) 대상체(subject)의 생물학적 시료에서 DNA를 제공하는 단계; 및
    (b) 상기 분리된 DNA에서 염색체 #8의 98289604 내지 98290404번째 서열로 이루어진 CpG 부위의 메틸화 수준을 측정하는 단계;를 포함하는 간암의 발병 위험도를 평가하는 방법.
  2. 제1항에 있어서,
    상기 (b)는 염색체 #12의 95941906 내지 95942979번째 서열, 염색체 #10의 134597357 내지 134602649번째 서열, 염색체 #8의 144649774 내지 144651774번째 서열, 염색체 #1의 47998899 내지 47999517번째 서열, 염색체 #2의 26394102 내지 26396102번째 서열, 염색체 #8의 104510870 내지 104513913번째 서열, 염색체 #2의 63281034 내지 63281347번째 서열, 염색체 #8의 67873388 내지 67875600번째 서열, 염색체 #4의 76555366 내지 76556079번째 서열, 염색체 #1의 63782394 내지 63790471번째 서열, 염색체 #5의 7849945 내지 7850439번째 서열, 염색체 #2의 39186777 내지 39187968번째 서열, 및 염색체 #14의 74207665 내지 74208665번째 서열로 이루어진 군에서 선택되는 CpG 부위의 메틸화 수준을 추가로 측정하는 단계인 것인, 간암의 발병 위험도를 평가하는 방법.
  3. 제2항에 있어서, 상기 간암의 예후 또는 위험도를 평가하는 방법은 최소 2 이상의 CpG 부위의 메틸화 수준을 측정하는 것인, 간암의 발병 위험도를 평가하는 방법.
  4. 제2항에 있어서,
    상기 염색체 #8의 98289604 내지 98290404번째 서열은 서열번호 8의 염기서열을 가지고,
    상기 염색체 #12의 95941906 내지 95942979번째 서열은 서열번호 2의 염기서열을 가지고,
    상기 염색체 #10의 134597357 내지 134602649번째 서열은 서열번호 3의 염기서열을 가지고,
    상기 염색체 #8의 144649774 내지 144651774번째 서열은 서열번호 4의 염기서열을 가지고,
    상기 염색체 #1의 47998899 내지 47999517번째 서열은 서열번호 5의 염기서열을 가지고,
    상기 염색체 #2의 26394102 내지 26396102번째 서열은 서열번호 6의 염기서열을 가지고,
    상기 염색체 #8의 104510870 내지 104513913번째 서열은 서열번호 7의 염기서열을 가지고,
    상기 염색체 #2의 63281034 내지 63281347번째 서열은 서열번호 9의 염기서열을 가지고,
    상기 염색체 #8의 67873388 내지 67875600번째 서열은 서열번호 10의 염기서열을 가지고,
    상기 염색체 #4의 76555366 내지 76556079번째 서열은 서열번호 11의 염기서열을 가지고,
    상기 염색체 #1의 63782394 내지 63790471번째 서열은 서열번호 12의 염기서열을 가지고,
    상기 염색체 #5의 7849945 내지 7850439번째 서열은 서열번호 13의 염기서열을 가지고,
    상기 염색체 #2의 39186777 내지 39187968번째 서열은 서열번호 14의 염기서열을 가지고,
    상기 염색체 #14의 74207665 내지 74208665번째 서열은 서열번호 15의 염기서열을 가지는 간암의 발병 위험도를 평가하는 방법.
  5. 제2항에 있어서,
    상기 염색체 #8의 98289604 내지 98290404번째 서열의 CpG 부위는 염색체 #8의 98290148번째에 위치하고,
    상기 염색체 #12의 95941906 내지 95942979번째 서열의 CpG 부위는 염색체 #12의 95941988번째에 위치하고,
    상기 염색체 #10의 134597357 내지 134602649번째 서열의 CpG 부위는 염색체 #10의 134599823번째에 위치하고,
    상기 염색체 #8의 144649774 내지 144651774번째 서열의 CpG 부위는 염색체 #8의 144651002번째에 위치하고,
    상기 염색체 #1의 47998899 내지 47999517번째 서열의 CpG 부위는 염색체 #1의 47999163번째에 위치하고,
    상기 염색체 #2의 26394102 내지 26396102번째 서열의 CpG 부위는 염색체 #2의 26395458번째에 위치하고,
    상기 염색체 #8의 104510870 내지 104513913번째 서열의 CpG 부위는 염색체 #8의 104512877번째에 위치하고,
    상기 염색체 #2의 63281034 내지 63281347번째 서열의 CpG 부위는 염색체 #2의 63281139번째에 위치하고,
    상기 염색체 #8의 67873388 내지 67875600번째 서열의 CpG 부위는 염색체 #8의 67874178번째에 위치하고,
    상기 염색체 #4의 76555366 내지 76556079번째 서열의 CpG 부위는 염색체 #4의 76555832번째에 위치하고,
    상기 염색체 #1의 63782394 내지 63790471번째 서열의 CpG 부위는 염색체 #1의 63789278번째에 위치하고,
    상기 염색체 #5의 7849945 내지 7850439번째 서열의 CpG 부위는 염색체 #5의 7850070번째에 위치하고,
    상기 염색체 #2의 39186777 내지 39187968번째 서열의 CpG 부위는 염색체 #2의 39187533번째에 위치하고,
    상기 염색체 #14의 74207665 내지 74208665번째 서열의 CpG 부위는 염색체 #14의 74208165번째에 위치하는 CpG 부위의 메틸화 수준을 측정하는 간암의 발병 위험도를 평가하는 방법.
  6. 제1항에 있어서,
    상기 생물학적 시료는 간암 의심 환자 또는 진단 대상 유래의 조직, 세포, 혈액, 혈장, 대변 및 소변으로 이루어진 군에서 선택되는 것인, 간암의 발병 위험도를 평가하는 방법.
  7. 제1항에 있어서,
    상기 (b) 단계는 PCR, 메틸화 특이 PCR(methylation specific PCR), 실시간 메틸화 특이 PCR(real time methylation specific PCR), MethyLight PCR, MehtyLight digital PCR, EpiTYPER, 메틸화 DNA 특이적 결합 단백질을 이용한 PCR, 정량 PCR, DNA 칩, 파이로시퀀싱 및 바이설파이트 시퀀싱으로 이루어진 군에서 선택되는 방법으로 수행되는 간암의 발병 위험도를 평가하는 방법.
  8. 제1항에 있어서,
    (c) 상기 (b) 단계 이후에, 상기 메틸화 수준을 정상 대조군의 메틸화 수준과 비교하는 단계;를 더 포함하는 간암의 발병 위험도를 평가하는 방법.
  9. 염색체 #8의 98289604 내지 98290404번째 서열로 이루어진 CpG 부위에 결합하는 프로브를 포함하는 간암 발병 위험도 진단용 키트.
  10. 제9항에 있어서,
    상기 키트는 염색체 #12의 95941906 내지 95942979번째 서열, 염색체 #10의 134597357 내지 134602649번째 서열, 염색체 #8의 144649774 내지 144651774번째 서열, 염색체 #1의 47998899 내지 47999517번째 서열, 염색체 #2의 26394102 내지 26396102번째 서열, 염색체 #8의 104510870 내지 104513913번째 서열, 염색체 #2의 63281034 내지 63281347번째 서열, 염색체 #8의 67873388 내지 67875600번째 서열, 염색체 #4의 76555366 내지 76556079번째 서열, 염색체 #1의 63782394 내지 63790471번째 서열, 염색체 #5의 7849945 내지 7850439번째 서열, 염색체 #2의 39186777 내지 39187968번째 서열, 및 염색체 #14의 74207665 내지 74208665번째 서열로 이루어진 군에서 선택되는 CpG 부위에 결합하는 프로브를 추가로 포함하는 것인, 간암 발병 위험도 진단용 키트.
KR1020190069624A 2017-11-22 2019-06-12 유전자의 CpG 메틸화 변화를 이용한 간암의 예후 또는 위험도를 평가하는 방법 KR102103886B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020170156527 2017-11-22
KR20170156527 2017-11-22

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020180137644A Division KR102052089B1 (ko) 2017-11-22 2018-11-09 유전자의 CpG 메틸화 변화를 이용한 간암의 위험도를 평가하는 방법

Publications (2)

Publication Number Publication Date
KR20190088924A KR20190088924A (ko) 2019-07-29
KR102103886B1 true KR102103886B1 (ko) 2020-05-29

Family

ID=66675922

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020180137644A KR102052089B1 (ko) 2017-11-22 2018-11-09 유전자의 CpG 메틸화 변화를 이용한 간암의 위험도를 평가하는 방법
KR1020190069625A KR102103887B1 (ko) 2017-11-22 2019-06-12 유전자의 CpG 메틸화 변화를 이용한 간암의 예후 또는 위험도를 평가하는 방법
KR1020190069624A KR102103886B1 (ko) 2017-11-22 2019-06-12 유전자의 CpG 메틸화 변화를 이용한 간암의 예후 또는 위험도를 평가하는 방법

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020180137644A KR102052089B1 (ko) 2017-11-22 2018-11-09 유전자의 CpG 메틸화 변화를 이용한 간암의 위험도를 평가하는 방법
KR1020190069625A KR102103887B1 (ko) 2017-11-22 2019-06-12 유전자의 CpG 메틸화 변화를 이용한 간암의 예후 또는 위험도를 평가하는 방법

Country Status (6)

Country Link
US (2) US20210147943A1 (ko)
EP (2) EP4180540A1 (ko)
JP (2) JP7306723B2 (ko)
KR (3) KR102052089B1 (ko)
CN (1) CN111386352B (ko)
SG (1) SG11202004795RA (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102155044B1 (ko) * 2019-10-08 2020-09-11 주식회사 레피다인 생물학적 시료의 간암 조직 기원 여부를 판별하는 방법
IL280297B (en) * 2021-01-19 2022-09-01 Nucleix Ltd Non-invasive cancer detection is based on DNA methylation changes
CN113621704B (zh) * 2021-07-22 2023-08-29 武汉艾米森生命科技有限公司 肝癌的检测和诊断的试剂及试剂盒
CN113981046A (zh) * 2021-11-05 2022-01-28 朱运峰 一种基于定量pcr技术dna甲基化检测方法及其试剂盒
CN118159669A (zh) * 2021-11-11 2024-06-07 深圳华大基因股份有限公司 一种用于诊断肝癌的核酸及蛋白检测试剂盒
WO2023082140A1 (zh) * 2021-11-11 2023-05-19 华大数极生物科技(深圳)有限公司 一种用于诊断肝癌的核酸检测试剂盒
CN113948150B (zh) * 2021-12-21 2022-04-19 北京迈基诺基因科技股份有限公司 Jmml相关基因甲基化水平评估方法、模型及构建方法
CN114369663A (zh) * 2022-01-18 2022-04-19 博尔诚(北京)科技有限公司 用于肝癌筛查的标志物、探针组合物及其应用
CN116179694A (zh) * 2022-11-02 2023-05-30 武汉艾米森生命科技有限公司 检测甲基化水平的试剂在制备前列腺癌诊断产品中的应用以及前列腺癌诊断试剂盒

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0700374D0 (en) * 2007-01-09 2007-02-14 Oncomethylome Sciences S A NDRG family methylation markers
WO2009023725A2 (en) * 2007-08-14 2009-02-19 The Trustees Of Columbia University In The City Of New York Early detection of cancer by methylated dna in blood
KR20100041937A (ko) * 2008-10-15 2010-04-23 재단법인서울대학교산학협력재단 암 전이 억제 물질의 스크리닝 방법
JP6054750B2 (ja) * 2011-01-28 2016-12-27 国立研究開発法人国立がん研究センター 肝細胞癌のリスク評価方法
KR101313756B1 (ko) * 2012-03-09 2013-10-01 (주)지노믹트리 간암 특이적 과메틸화 CpG 서열을 이용한 간암의 검출방법
WO2014046198A1 (ja) * 2012-09-19 2014-03-27 シスメックス株式会社 肝細胞癌に関する情報の取得方法、ならびに肝細胞癌に関する情報を取得するためのマーカーおよびキット
JP6369857B2 (ja) * 2013-05-29 2018-08-08 シスメックス株式会社 肝細胞癌に関する情報の取得方法、ならびに肝細胞癌に関する情報を取得するためのマーカーおよびキット
EP3034624A1 (en) * 2014-12-18 2016-06-22 Hospital Clínic de Barcelona Method for the prognosis of hepatocellular carcinoma
EP3240912A4 (en) * 2014-12-31 2018-07-25 Case Western Reserve University Methods and compositions for detecting esophageal neoplasias and/or metaplasias in the esophagus
KR20170071724A (ko) * 2015-12-16 2017-06-26 연세대학교 산학협력단 간암 발생 특이적 유전자 발현에 관여하는 유전자 구조 내 cpg 섬의 dna 메틸화 변이를 이용한 간암의 예측 또는 진단 방법
CN115881230A (zh) * 2015-12-17 2023-03-31 伊路敏纳公司 区分复杂生物样品中的甲基化水平
WO2017143296A2 (en) * 2016-02-18 2017-08-24 Gill Inderbir Singh Prostate cancer aggressiveness biomarkers
CA3076386A1 (en) * 2017-09-29 2019-04-04 Lukas Vrba Dna methylation biomarkers for cancer diagnosing

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Hepatology, 61(6):1945-56 (2015.03.18.)

Also Published As

Publication number Publication date
US20210147943A1 (en) 2021-05-20
EP3715474A4 (en) 2022-02-09
JP2022164712A (ja) 2022-10-27
KR20190059215A (ko) 2019-05-30
JP7452894B2 (ja) 2024-03-19
KR20190088924A (ko) 2019-07-29
US20220259676A1 (en) 2022-08-18
KR20190087344A (ko) 2019-07-24
KR102052089B1 (ko) 2019-12-05
JP7306723B2 (ja) 2023-07-11
EP4180540A1 (en) 2023-05-17
KR102103887B1 (ko) 2020-05-29
CN111386352B (zh) 2024-04-16
CN111386352A (zh) 2020-07-07
JP2021503956A (ja) 2021-02-15
SG11202004795RA (en) 2020-06-29
EP3715474A2 (en) 2020-09-30

Similar Documents

Publication Publication Date Title
KR102103886B1 (ko) 유전자의 CpG 메틸화 변화를 이용한 간암의 예후 또는 위험도를 평가하는 방법
CN109790583B (zh) 对肺腺癌亚型分型的方法
DK2681333T3 (en) EVALUATION OF RESPONSE TO GASTROENTEROPANCREATIC NEUROENDOCRINE NEOPLASIS (GEP-NENE) THERAPY
RU2719194C2 (ru) Оценка активности клеточных сигнальных путей с применением вероятностного моделирования экспрессии целевых генов
CN107941681B (zh) 鉴定生物样品中定量细胞组成的方法
AU2012345789B2 (en) Methods of treating breast cancer with taxane therapy
CN107743524B (zh) 前列腺癌预后的方法
US6773883B2 (en) Prognostic classification of endometrial cancer
CN110382521A (zh) 从氧化应激区分肿瘤抑制性foxo活性的方法
AU2012203810B2 (en) Methods and compositions for the treatment and diagnosis of bladder cancer
CN108138237A (zh) 使用靶基因表达的数学建模评估NFkB细胞信号传导途径活性
CA2430981A1 (en) Gene expression profiling of primary breast carcinomas using arrays of candidate genes
KR20140140069A (ko) 전반적 발달장애의 진단 및 치료용 조성물 및 그 진단 및 치료 방법
CA2324444A1 (en) P53-regulated genes
US20040219579A1 (en) Methods of diagnosis of cancer, compositions and methods of screening for modulators of cancer
WO2018132369A1 (en) Biomarkers predictive of anti-immune checkpoint response
AU2008203227A1 (en) Colorectal cancer prognostics
KR20220098002A (ko) 감염의 숙주 rna 바이오마커의 식별
CA2666057C (en) Genetic variations associated with tumors
AU2004205270B2 (en) Colorectal cancer prognostics
TW201718876A (zh) 用以診斷與預斷腫瘤的方法
KR20210090086A (ko) ATAC-seq 데이터 정규화 및 이의 활용 방법
AU2014201129A1 (en) Methods and compositions for the treatment and diagnosis of bladder cancer
KR20230024344A (ko) 암 및/또는 cin3를 검출하고 예측하기 위한 방법
KR20220008244A (ko) 전립선암 환자의 예후 진단 및 치료 전략 결정용 연령 특이적 마커

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right