KR100991673B1 - 결장직장암의 검사방법 - Google Patents

결장직장암의 검사방법 Download PDF

Info

Publication number
KR100991673B1
KR100991673B1 KR1020030019816A KR20030019816A KR100991673B1 KR 100991673 B1 KR100991673 B1 KR 100991673B1 KR 1020030019816 A KR1020030019816 A KR 1020030019816A KR 20030019816 A KR20030019816 A KR 20030019816A KR 100991673 B1 KR100991673 B1 KR 100991673B1
Authority
KR
South Korea
Prior art keywords
gene
colorectal cancer
misc
microarray
feature
Prior art date
Application number
KR1020030019816A
Other languages
English (en)
Other versions
KR20030078802A (ko
Inventor
왕이신
Original Assignee
오르토-클리니칼 다이아그노스틱스, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오르토-클리니칼 다이아그노스틱스, 인코포레이티드 filed Critical 오르토-클리니칼 다이아그노스틱스, 인코포레이티드
Publication of KR20030078802A publication Critical patent/KR20030078802A/ko
Application granted granted Critical
Publication of KR100991673B1 publication Critical patent/KR100991673B1/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

본 발명은 일군의 유전자 발현을 분석하여 결장직장암이 있는 것으로 추정되는 환자의 결장직장암의 존재 유무 또는 가능한 증상을 검사하는 방법에 관한 것이다. 마이크로어레이 등의 각종 매체에 제공된 유전자 발현 프로필은 물론 이 프로필을 포함하는 키트도 포함한다.
유전자 발현, 결장직장암, 마이크로어레이 및 차등 변조

Description

결장직장암의 검사방법{Assessing colorectal cancer}
본 출원은 2002년 3월 29일자로 출원된 미국 가출원 번호 제60/368,798호의 우선권을 주장한다.
본 발명은 생물학적 샘플의 유전자 발현 프로필에 기초한 결장직장암의 검사방법 및 예후방법에 관한 것이다.
결장직장암은 3가지 주요 분자 기작, 즉 1) 염색체 불안정과 결부된 β-카테닌 유전자 또는 선종성 결장폴립증 (APC) 유전자의 돌연변이, 2) 짧은 반복체를 포함하는 유전자의 돌연변이 및 현미부수체 (microsatellite) 불안정과 관련있는 DNA 부정합 회복 유전자, 예를 들면, MLH1, MSH2, PMS1, PMS2 및 MSH6의 돌연변이 및 3) 종양 억제인자 유전자의 프로모터 영역의 과메틸화에 의해 유도된 유전자 침묵을 통해 발생하는 것으로 추정되는 종양으로 이루어진 이질 질환이다. 각각의 결장직장암의 유전자 상보체는 유전자 불안정, 특이적 돌연변이 및 유전자 침묵의 여러 조합을 포함할 가능성이 있다. 염색체 불안정성 (CIN)은 일반적으로 암의 공통된 특징이다. 이것은 염색체 전체 또는 대부분이 상실되거나 증가된 이수체 표현형을 나타낸다. 마이크로좀 불안정성 (MIN)은 짧은 반복체의 돌연변이율이 증가된 이배체 종양에서 발견된다. 이 두 형태의 유전자 불안정성은 모두 결장직장암에서 나타난다.
따라서, 결장직장암은 기원이 복잡하고 수많은 여러 생물학적 경로가 상호작용하고 있다. 진단, 예후 또는 치료 모니터링 결정에 도움을 주기 위해 지금까지 사용된 혈청 마커, 조직검사 및 세포검사는 충분한 신뢰성을 제공하지 못하는 경우가 종종 있다. 이와 마찬가지로, 단일 유전자 마커 (예를 들면, 특정 유전자의 발현 증가)의 사용이 유리할 수 있지만, 암의 다양성은 유전자 마커의 포트폴리오가 최선의 방법일 가능성을 높이고 있다.
본 발명은 결장직장암이 있는 것으로 추정되는 환자의 결장직장암의 존재 유무 또는 가능한 증상을 검사하는 방법에 관한 것이다. 이 방법에서는, 환자가 결장직장암을 앓고 있는지, 환자가 결장직장암을 앓고 있지 않은지, 환자가 결장직장암에 걸릴 가능성이 있는지 또는 결장직장암 치료를 받는 환자의 치료에 대한 반응을 측정하기 위하여 환자 샘플의 유전자 발현 프로필을 분석한다.
또한, 본 발명은 다른 관점으로서 상기 방법을 수행하는데 사용되는 물품에 관한 것이다. 이 물품은 컴퓨터 판독 매체와 같은 기계판독식 매체에 배치되는 유전자 발현 프로필 또는 이 프로필의 표현물 (representation)을 포함하는 것이다.
유전자 발현 프로필을 확인하는데 사용되는 물품은 또한 유전자 발현의 존재 유무 또는 발현 정도를 포착하고/하거나 나타내는 마이크로어레이와 같은 기판 또는 표면을 포함할 수 있다.
특정 핵산 서열이 조직 샘플에 존재하는지의 여부 만으로 진단적 또는 예후적 가치를 둔 적은 별로 없다. 하지만, 다양한 단백질, 펩타이드 또는 mRNA의 발현에 대한 정보는 점차 중요하게 여겨지고 있다. 게놈 자체내에 단백질, 펩타이드 또는 mRNA (예컨대, "유전자"로 지칭되는 서열)를 발현할 잠재성이 있는 핵산 서열의 존재만으로는 소정 세포내에서 단백질, 펩타이드 또는 mRNA가 발현되는지의 여부를 결정할 수 없다. 단백질, 펩타이드 또는 mRNA를 발현할 수 있는 소정 유전자가 발현할 지의 여부, 및 발현된다면, 이러한 발현이 일어나는 정도는 다양한 복합적인 요인에 따라 결정된다. 이러한 요인을 규명하고 검사하는 데에는 어려움이 있지만, 이에 상관없이 유전자 발현의 분석은 종양원성, 전이, 아폽토시스 및 다른 임상 관련 현상 등의 주요 증상의 발생에 대한 유용한 정보를 제공할 수 있다. 유전자가 활성 또는 비활성 정도의 상대적 표시는 유전자 발현 프로필을 통해 알 수 있다. 본 발명의 유전자 발현 프로필은 결장직장암 환자의 검사 및 치료에 사용된다.
샘플 준비를 위해 환자 샘플을 수집한다. 본 발명의 방법에 사용한 환자의 샘플은 결장 샘플로부터 또는 절제연 (surgical margin)으로부터 취한 상피 세포와 같은 질병 세포를 포함할 것으로 의심되는 것이다. 의심되는 샘플을 수득하는데 유용한 1가지 기법은 레이저 캡춰 미세해부법 (LCM)이다. LCM 기술은 세포 종류의 이종원성에 의한 가변성을 최소화하면서 연구할 세포를 선택하는 방법을 제공한다. 즉, 정상 세포와 암 세포 사이의 유전자 발현의 중간 정도의 변화 또는 적은 변화도 용이하게 검진할 수 있다. 바람직한 방법은 샘플이 말초 혈액에서 추출한 순환성 상피 세포를 포함하는 것이다. 이것은 다양한 방법에 따라 수득할 수 있지만, 가장 바람직한 방법은 본원에 참고인용된 미국 특허 제6,136,182호 (Immunivest Corp)에 기재된 자기 분리 기법이다. 일단 목적하는 세포를 포함하는 샘플을 수득하였으면 RNA를 추출하여 증폭시키고 적당한 포트폴리오의 유전자들에 대하여 유전자 발현 프로필을, 바람직하게는 마이크로어레이를 통해 수득한다.
유전자 발현 프로필을 구축하는 바람직한 방법은 단백질이나 펩타이드를 암호할 수 있는 유전자에 의해 생산되는 RNA의 양을 측정하는 것을 포함한다. 이것은 역전사효소 PCR (RT-PCR), 경쟁적 RT-PCR, 실시간 RT-PCR, 차등적 표시 RT-PCR, 노던 블롯 분석 및 다른 관련 시험을 통해 수행한다. 각각의 PCR 반응을 이용하는 상기 기술을 수행하는 것도 가능하지만 가장 바람직한 것은 mRNA로부터 생산된 상보성 DNA (cDNA) 또는 상보성 RNA (cRNA)를 증폭시키고 이것을 마이크로어레이를 통해 분석하는 것이다. 이의 생산을 위한 다양한 많은 어레이 배열과 방법에 대해서는 당해 기술분야에 공지되어 있고, 특히 미국 특허문헌, 예를 들면, 제5,445,934호; 제5,532,128호; 제5,556,752호; 제5,242,974호; 제5,384,261호; 제5,405,783호; 제5,412,087호; 제5,424,186호; 제5,429,807호; 제5,436,327호; 제5,472,672호; 제5,527,681호; 제5,529,756호; 제5,545,531호; 제5,554,501호; 제5,561,071호; 제5,571,639호; 제5,593,839호; 제5,599,695호; 제5,624,711호; 제5,658,734호; 및 제5,700,637호에 설명되어 있으며, 이 문헌들은 모두 본 명세서에 참고인용되고 있다.
마이크로어레이 기술은 수천가지 유전자의 안정된 mRNA 농도를 동시에 측정할 수 있게 하며, 이에 따라 비제어성 세포 증식의 개시, 정지 또는 변조와 같은 효과를 확인하는데 강력한 도구로 나타나고 있다. 현재 2가지 마이크로어레이 기술이 널리 사용되고 있다. 그 한 가지는 cDNA 어레이이고 다른 한 가지는 올리고뉴클레오타이드 어레이이다. 이 칩들을 제작하는 데에 차이가 있기는 하지만, 사실상 모든 후속 데이터 분석과 결과물은 동일하다. 이 분석의 산물은 일반적으로 마이크로어레이에 공지의 위치에 있는 핵산 서열과 하이브리드하는 샘플 유래의 cDNA 서열을 측정하는데 사용된 표지된 프로브로부터 수신된 시그널 강도의 측정값이다. 일반적으로, 시그널의 강도는 샘플 세포에서 발현된 cDNA 및 이에 따른 mRNA의 함량과 비례한다. 이와 같은 기법으로는 이용할 수 있고 유용한 다양한 기법이 있다. 유전자 발현을 측정하는 바람직한 방법은 미국 특허 제6,271,002호 (Linsley et al.); 제6,218,122호 (Friend, et al.); 제6,218,114호 (Peck, et al.); 및 제6,004,755호 (Wang et al.)에 기재되어 있으며, 이 문헌들은 모두 본 명세서에 참고인용된 것이다.
발현량의 분석은 이와 같은 강도를 비교하여 수행한다. 이것은 대조 샘플에 존재하는 유전자의 발현 강도에 대한 시험 샘플에 존재하는 유전자의 발현 강도의 비율 행렬 (ratio matrix)을 작성하여 수행하는 것이 가장 좋다. 예를 들어, 질병 조직 유래의 유전자 발현 강도와 동종의 정상 조직 유래의 유전자 발현 강도를 비교한다 (예를 들어 질병 결장 조직 샘플 대 정상 결장 조직 샘플). 이 발현 강도의 비율은 시험 샘플와 대조 샘플 사이의 유전자 발현의 변화율을 나타낸다.
유전자 발현 프로필은 또한 다양한 방식으로 나타낼 수 있다. 가장 일반적인 방법은 원 형광 강도 또는 비율 행렬을, 종렬이 시험 샘플을 나타내고 횡렬이 유전자를 나타내는 계통수 그래프로 배열하는 것이다. 이 데이터는 발현 프로필이 유사한 유전자가 서로 근접하도록 배열된다. 예를 들어, 각 유전자의 발현 비율은 색으로 확인된다. 예를 들어, 1 미만의 비율 (하향-조절을 나타냄)은 스펙트럼의 청색부분에서 나타나고, 1 초과의 비율 (상향-조절을 나타냄)은 스펙트럼의 적색부분에서 색으로 나타날 수 있다. 이러한 데이터를 나타내기 위하여 "GENESPRING" (실리콘 제네틱스, 인코포레이티드) 및 "DISCOVERY"와 "INFER" 소프트웨어 (파텍 인코포레이티드)를 비롯한 시판되는 컴퓨터 소프트웨어 프로그램을 이용할 수 있다.
본 발명의 방법에서 변조된 유전자는 표 1에 제시하였다. 차등 발현되는 유전자는 질병 세포에서 상향-조절 또는 하향-조절되는 것을 나타낸다. 상향-조절과 하향-조절은 유전자 발현의 함량이 어느 기준선에 상대적으로 검출되는 차이 (측정에 사용된 시스템에서 노이즈 이상의 차이)가 있다는 것을 의미하는 상대적 용어이다. 이 경우에, 기준선은 정상 세포에서 측정된 유전자 발현량이다. 질병 세포 중의 당해 유전자는 동일한 측정법을 사용했을 때 기준 양보다 상향-조절되거나 하향-조절된다. 이 내용에서 질병이란 세포의 비제어성 증식을 일으키는 바 신체 기능의 정상 수행력을 방해하거나 방해할 잠재성이 있는 신체 상태의 변화를 의미한다. 사람의 유전자형이나 표현형의 일부가 질병 존재시와 동일하다면 그 사람은 질병이 있는 것으로 간주한다. 하지만, 검진이나 예후를 수행하는 행위는 치료 모니터링과 같은 질병/상태를 결정하는 문제를 수반한다. 치료 모니터링에서 임상적 판단은 일정 시간 동안의 유전자 발현을 비교하여 유전자 발현 프로필이 정상 조직과 보다 일치하는 패턴으로 변화가 이루어졌거나 변화가 이루어지고 있는지를 측정함으로써 주어진 치료 과정의 효과를 주시하면서 이루어진다.
상향-조절과 하향-조절의 정도는 하이브리드화된 마이크로어레이 프로브의 강도 측정값의 변화율에 기초하여 구분하는 것이 바람직하다. 2.0배의 차이는 이러한 구분 또는 0.05 미만의 p값을 만드는데 바람직하다. 즉, 질병 세포가 정상 세포 보다 적어도 2배 이상, 또는 2배 미만으로 산출한다면 유전자는 정상 세포에 비해 질병 세포에서 차등 발현된다고 한다. 그 배수 차이가 크면 클수록 유전자는 진단용으로 사용하기가 더 좋다. 본 발명의 유전자 발현 프로필을 위해 선택한 유전자는 임상용 실험 기구 사용시의 배경값을 초과하는 양만큼 정상 유전자 또는 비변조성 유전자의 발현량과 구분되는 시그널을 생성하는 발현량을 나타내는 것이다.
비변조성 유전자와 노이즈로부터 변조된 유전자를 신뢰성있게 구분하기 위하여 통계값을 사용할 수 있다. 통계 시험은 다양한 그룹의 샘플 사이에 가장 유의적인 차이가 있는 유전자를 찾아낸다. 스튜던트 t 검정은 두 그룹 사이의 유의적인 차이를 찾는데 사용할 수 있는 강력한 통계 시험의 일례이다. p값이 낮을수록, 유전자가 여러 그룹 사이의 차이를 보여준다는 증거가 더욱 확고해진다. 그러나, 마이크로어레이는 한번에 1 이상의 유전자를 측정하기 때문에 수십만의 통계 시험이 한번에 요구될 수 있다. 이 때문에 작은 p값이 단지 우연히 나타날 가능성이 있고, 이에 대하여 시닥 (Sidak) 보정을 이용한 조정은 물론 무작위/과돌연변이 실험이 실시될 수 있다. t-검정에 의한 0.05 미만의 p값은 그 유전자의 유의적 차이를 입증하는 것이다. 이 보다 확고한 입증은 시닥 보정이 이루어진 후의 p값이 0.05 미만인 것이다. 각 그룹의 다수의 샘플들에 대한 무작위/과돌연변이 시험 후의 0.05 미만의 p값은 유의적 차이를 가장 확고하게 입증하는 것이다.
비변조된 유전자 또는 노이즈의 시그널 보다 큰 시그널을 나타내는 유전자를 선택하는데 사용할 수 있는 다른 변수는 절대 시그널 차이 측정값이다. 변조된 유전자 발현에 의해 나타나는 시그널은 정상 또는 비변조된 유전자의 시그널 보다 20% 이상 차이가 나는 것이 바람직하다 (절대값 기준). 보다 바람직하게는, 유전자가 정상 또는 비변조된 유전자의 시그널과 30% 이상의 차이가 나는 발현 패턴을 나타내는 것이다.
유전자는 그룹내 유전자 세트에 대해 수득된 정보가 진단, 예후 또는 치료 선택과 같은 임상과 관련된 판단시의 유효한 기준을 제공하도록 그룹화될 수 있다. 이러한 세트의 유전자는 본 발명의 포트폴리오를 구성한다. 이 경우에, 그 포트폴리오에 의해 지지되는 판단은 결장직장암을 포함한다. 유전자 발현 프로필의 포트폴리오는 실시예 3에 기재된 유전자 조합으로 이루어질 수 있다. 대부분의 진단 마커와 마찬가지로 정확한 의학적 판단을 하기에 충분한 최소한의 마커를 이용하는 것이 바람직한 경우가 종종 있다. 이것은 추가 분석 동안의 치료 지연과 더불어 부적당한 시간과 자산의 사용을 방지한다. 이 경우에는, 실시예 4에 제시된 유전자 조합으로 상기한 최소 포트폴리오를 구성할 수 있다.
포트폴리오는 이 포트폴리오내 유전자 조합이 각각의 유전자 또는 무작위 선발된 유전자 조합에 비하여 개선된 감도와 특이성을 나타내는 것이 바람직하다. 본 발명의 내용 중에서 포트폴리오의 감도는 정상 상태에 대한 상대적인 질병 상태에서의 유전자 발현에 의해 나타나는 차이 배수로 알 수 있다. 특이성은 당해 증상과 유전자 발현 시그널 전달의 상관관계를 측정한 통계를 통해 알 수 있다. 예를 들어, 이러한 척도로서 표준 편차를 사용할 수 있다. 일군의 유전자를 포트폴리오에 포함시키고자 하는 경우에 발현 측정값의 작은 표준 편차는 특이성이 보다 크다는 상관관련성을 의미한다. 상관관계 계수와 같은 변화의 다른 측정값도 이와 같은 역할에 사용할 수 있다.
유전자 발현 포트폴리오를 구축하는데 가장 바람직한 방법은 스톡 포트폴리오 구축에 널리 사용되는 평균 분산 알고리듬과 같은 최적화 알고리듬의 사용을 통한 것이다. 이 방법은 팀 자트코에 (Tim Jarkoe) 등에 의해 동일자로 출원되고 공계류중인 특허출원 "포트폴리오 선발 (Portfolio Selection)"에 상세히 설명되어 있다. 사실상, 이 방법은 복귀값 (예, 발생된 시그널)을 최적화하는 입력값 세트 (재정 분야에서는 스톡, 본원에서는 강도로 측정되는 발현)의 구축을 필요로 하며, 복귀값의 가변성을 최소화하면서 이를 사용하기 위해 수취한다. 시판되는 많은 소프트웨어 프로그램은 이러한 작업에 이용될 수 있다. 본 명세서에서 "바그너 (Wagner) 소프트웨어"라고 부르는 "Wagner Associates Mean-Variance Optimization Application"이 바람직하다. 이 소프트웨어는 "Wagner Associates Mean-Variance Optimization Library" 유래의 기능을 이용하여 마르코비츠식의 최적의 포트폴리오와 효율적인 경계를 결정하여 바람직하다.
이러한 종류의 소프트웨어는, 이 소프트웨어가 재정 분석용으로 사용될 때에는 스톡 복귀값과 위험 척도가 사용되는 방식으로, 입력값으로 처리될 수 있도록 마이크로어레이 데이터가 변형될 것을 요구한다. 예를 들어, 바그너 소프트웨어를 마이크로어레이 강도 측정값과 함께 사용할 때에는 다음과 같은 데이터 변환법을 사용한다.
먼저, 적어도 약간의 최소 발현 수준의 차이를 나타내는 유전자를 확인하여 예비선발한다. 이 예비선발 과정은 다음과 같이 실시하는 것이 바람직하다. 기준군을 선발한다. 일반적으로, 기준군에는 당해 증상을 가지지 않는 개체군 유래의 유전자가 포함된다. 예를 들어, 유방암 진단용인 유전자 포트폴리오를 선발하고자 하는 경우에는, 유방암이 없는 환자의 샘플을 사용하여 기준군을 구성한다. 기준군을 일단 선발하고 난 뒤, 기준군 샘플에 속하는 각 유전자의 유전자 발현 지시인자로 산술적 평균값과 표준 편차를 계산한다. 이 지시인자는 일반적으로 마이크로어레이 판독값의 형광 강도이다. 그 다음, 전산화된 통계 데이터를 이용하여 각 유전자 마다의 (X*표준편차 + 평균)의 기준값을 계산한다. 이것은 다른 모든 샘플이 비교될 수 있는 유전자에 대한 기준 판독값이다. X는 포트폴리오를 구축하는 사람에 의해 선택되는 엄중도 변수이다. X 값이 높을수록 낮은 것보다 엄중도가 높아진다. X는 0.5 내지 3 범위인 것이 바람직하고, 2 내지 3인 것이 보다 바람직하며, 3인 것이 가장 바람직하다.
그 다음, 각 실험 샘플마다의 기준 판독값에 대한 비율을 계산한다. 이 비율을 기본 10 로그값으로 변환시켜 소프트웨어가 데이터를 용이하게 취급할 수 있도록 한다. 이것은 하향-조절된 유전자의 경우 바그너 소프트웨어를 이용한 마크만 (Markman) 평균 분산 알고리듬에 따라 최적화에 필요한 음의 값을 나타낼 수 있게 해준다.
이와 같이 변환된 비율을 포함하는 예비처리된 데이터는 재정 분석용으로 사용될 때 바그너 스프트웨어에서 일반적으로 사용되는 자산 복귀값 대신에 입력값으로 사용된다.
일단 효율적인 경계가 조성되면, 경계 상의 한 점에 해당하는 소정의 입력 레벨 (복귀값) 또는 분산에 최적화된 포트폴리오를 선발한다. 이러한 입력값 또는 분산은 포트폴리오의 조성자에 의해 정해지는 소정의 표준값이다. 다르게 말하면, 최적의 포트폴리오를 구하고자 하는 사람은 허용되는 입력 레벨 (감도) 또는 소정 분산 레벨 (특이성)을 측정하여 그 입력 레벨 또는 분산에 상응하는 효율적인 경계를 따라 위치하는 유전자를 선발한다. 바그너 소프트웨어는 입력 레벨 또는 분산이 선발되었을 때 상기와 같은 유전자를 선발할 수 있다. 또한, 스톡 포트폴리오에서 스톡에 대한 것처럼 이 포트폴리오에 속한 각 유전자마다 가중치를 실어줄 수 있다.
샘플이 그 포트폴리오의 진단 목적에 맞는 조건을 갖고 있는지는 환자 샘플에서의 포트폴리오내 유전자 발현을 포트폴리오 구축에 사용된 차등 발현된 유전자의 계산값과 비교하여 측정할 수 있다. 먼저 포트폴리오 선발 과정에서 각 유전자에 할당된 가중치와 그 포트폴리오내 각 유전자의 강도값의 곱셈값을 합하여 포트폴리오값을 얻는 것이 바람직하다. 그 다음, 경계값은 (기준 그룹의 Y* 표준편차 + 포트폴리오 평균값)으로 계산하는데, 여기에서 Y는 전술한 X값과 동일한 의미를 갖는 엄중도 값이다. 포트폴리오 값이 기준군의 포트폴리오 값보다 큰 샘플은 조건을 갖춘 것으로 분류한다. 필요하다면, 이 방법은 신뢰율을 향상시키기 위한 공지의 통계법에 따라 반복하여 실시할 수 있다.
경우에 따라서는 최상의 예측 정확도가 얻어질 때까지 이 방법을 반복할 수도 있다.
미지의 포트폴리오 선발 및 특성화하는 방법을 요약하면 다음과 같다:
1. 기준군을 선택한다.
2. 기준군 샘플에 속한 각 유전자의 평균값과 표준편차를 계산한다.
3. 각 유전자 마다 (X*표준편차 + 평균값)을 계산한다. 이것은 다른 모든 샘플이 비교되는 기준 판독값이다. X는 값이 높을수록 낮은 것보다 더욱 엄중해지는 엄중도 변수이다.
4. 단계 3에서 계산된 기준 판독값에 대한 각 실험 샘플 사이의 비율을 계산한다.
5. 1 미만의 비율이 음의 값을 갖도록 비율을 변환시킨다 (예를 들면, 기본 로그 10 사용) (이제, 하향-조절된 유전자는 MV 최적화에 필요한 음의 값을 정확하게 갖는다).
6. 이와 같이 변환된 비율을, 소프트웨어 적용에 일반적으로 사용되는 자산 복귀값 대신에 입력값으로서 사용한다.
7. 이 소프트웨어는 효율적인 경계를 플롯팅하고 이 경계를 따라 임의의 지점에 최적화된 포트폴리오를 복귀시킨다.
8. 효율적인 경계 상에서 바람직한 복귀값 + 분산을 선택한다.
9. 포트폴리오 선발 알고리듬에 의해 산출된 가중치와 각 유전자의 강도값의 곱셈값을 합하여 각 샘플에 대한 포트폴리오값을 계산한다.
10. 다음, 경계값은 기준 포트폴리오 값의 표준편차에 Y를 곱한 값에 기준 그룹의 포트폴리오 평균값을 더하여 계산한다. 이 경계값 보다 큰 값은 실험 군으로 분류할 수 있다.
11. 경우에 따라 최상의 예측 정확도가 얻어질 때까지 이 방법을 반복하여 실시할 수 있다.
대안적으로, 유전자는 약간의 최소 발현 레벨의 차이를 나타내는 유전자를 확인하여 먼저 예비선발할 수 있다. 이 대안법에서의 예비선발은 하기 식으로 표시되는 한계값에 기초하는 것이 바람직하다:
Figure 112003011248564-pat00001
이 식에서 μt는 질병이나 증상이 있는 것으로 알려진 서브세트의 평균값이고, μn은 정상 샘플의 서브세트의 평균값이며, σtn은 표준편차의 합을 나타낸다. 노이즈에 대한 시그널 컷오프값은 관계식
Figure 112008010045417-pat00002
에 따라 데이터를 예비선발하여 사용할 수 있다. 이것은 차등 변조에 기초하여 예비선발된 유전자가 임상적으로 유의적 차이를 나타낼 수 있도록 한다. 즉, 기구의 노이즈 레벨 이상의 값이 진단상의 변수를 측정하는 임무에 적당하다. 이러한 기준에 따라 예비선발된 각 마커마다 종렬이 샘플을 나타내고 횡렬이 마커를 나타내며, 각 요소는 관계식
Figure 112008010045417-pat00003
(이 식에서 I는 강도 측정값이다)에 따라 그 마커의 발현에 대한 정규화된 강도 측정값을 나타내는 행렬을 구축한다.
또한, 최적의 포트폴리오를 규정하는 부가 한계 조건을 설정할 수도 있다. 예를 들어, 포트폴리오 크기를 고정된 범위 또는 수의 마커에 한정할 수 있다. 이것은 데이터 예비선발 기준으로 보다 엄격하게 하거나 (예를 들면,
Figure 112010023237372-pat00004
대신
Figure 112010023237372-pat00005
사용) 또는 포트폴리오 크기 제한과 같은 프로그래밍된 특징을 사용하여 실시할 수 있다. 예를 들면, 효율적인 경계를 단지 가장 최적인 10개의 유전자 중에서 선발해야 하는 한계 조건을 설정할 수 있다. 또한, 효율적인 경계에는 예비선발된 모든 유전자를 사용한 뒤 선발된 유전자의 수를 제한 (예를 들면, 10개 이하)할 수 있다.
또한, 포트폴리오 선발 방법에는 경험 (heuristic) 규칙을 적용할 수도 있다. 이 규칙은 임상 결과를 나타내는데 사용된 기법의 이해와 생물학에 기초하여 구성되는 것이 바람직하다. 특히, 최적화 방법으로부터 얻어진 결과물에 적용되는 것이 보다 바람직하다. 예를 들어, 포트폴리오 선발의 평균 분산 방법을 유방암 환자에게서 차등 발현되는 많은 유전자들에 대한 마이크로어레이 데이터에 적용할 수 있다. 이 방법의 결과물은 질병 유방 조직은 물론 말초 혈액에서 발현되는 일부 유전자를 포함할 수 있는 최적화된 유전자 세트일 수 있다. 이 시험 방법에 사용된 샘플이 말초 혈액에서 얻은 것이고 유방암의 증례에서 차등 발현되는 특정 유전자가 또한 말초 혈액에서도 차등 발현된다면, 말초 혈액에서 차등 발현되는 유전자를 제외하고는 경험 규칙을 적용하여 효율적인 경계 중에서 포트폴리오를 선발한다. 물론, 예를 들어 데이터 예비선발 동안 규칙을 적용하는 등과 같이 효율적인 경계 형성 전에 규칙을 적용할 수 있다.
당해 생물학에 필연적 관련성이 없는 다른 경험 규칙을 적용할 수도 있다. 예를 들어, 다만 소정 비율의 포트폴리오만이 특정 유전자(들)를 나타낼 수 있는 규칙을 적용할 수 있다. 바그너 소프트웨어와 같이 시판되는 소프트웨어는 이러한 유형의 경험을 용이하게 수용한다. 이것은, 예를 들어, 정확성 이외의 다른 요인 (예를 들면, 예상 라이센싱 비용)가 1 이상의 유전자를 포함시키고자 하는 목적에 영향을 줄 때 유용할 수 있다.
본 발명의 한 가지 방법은 전술한 진단법을 수행하는 다양한 유전자 (또는 포트폴리오)의 유전자 발현 프로필을 비교하는 것을 포함한다. 포트폴리오를 포함하는 각 유전자의 유전자 발현 프로필을 컴퓨터 판독 매체와 같은 매체에 배치시킨다. 이러한 배치에는 다양한 형태를 이용할 수 있다. 예를 들어, 질병을 나타내는 시그널 (예, 강도 측정값) 범위를 입력한 표를 작성할 수 있다. 이 표의 값을 실제 환자의 데이터와 비교하여 환자 샘플이 정상인지 질병이 있는지 결정한다. 보다 복잡한 양태에 있어서, 발현 시그널 (예, 형광 강도)의 패턴을 수치나 그래프로 기록한다. 환자 샘플와 함께 사용한 유전자 포트폴리오의 유전자 발현 패턴을 그 다음 상기 발현 패턴과 비교한다. 그 다음, 패턴 비교 소프트웨어를 사용하여 환자 샘플이 당해 질병을 나타내는 패턴이 있는지 결정한다. 물론, 이러한 비교는 환자 결과물이 정상인지를 결정하는데에도 사용할 수 있다. 샘플의 발현 프로필을 그 다음 정상이나 대조 세포의 포트폴리오와 비교한다. 샘플의 발현 패턴이 결장직장암의 발현 패턴과 일치하면 (상쇄되는 의학적 고찰이 없는 가운데) 그 환자는 결장직장암 양성으로 진단한다. 샘플 발현 패턴이 정상/대조 세포의 발현 패턴과 일치하면 그 환자는 결장직장암 음성으로 진단한다.
패턴 인식 방법으로는 다양한 공지의 방법을 이용할 수 있다. 다음과 같은 참고문헌에 몇가지 예가 있다:
가중된 투표법에 대한 문헌:
Golub, TR., Slonim, DK., Tamaya, P., Huard, C., Gaasenbeek, M., Mesirov, JP., Coller H., Loh, L., Downing, JR., Caligiuri, MA., Bloomfield, CD., Lander, ES. Molecular classification of cancer: class discovery and class prediction by gene expression monitoring. Science 286: 531-537, 1999.
지지체 벡터 기구에 대한 문헌:
Su, AI., Welsh, JB., Sapinoso, LM., Kern, SG., Dimitrov, P., Lapp, H., Schultz, PG., Powell, SM., Moskaluk, CA., Frierson, HF. Jr., Hampton, GM. Molecular classification of human carcinomas by use of gene expression signatures. Cancer Research 61: 7388-93, 2001.
Ramaswamy, S., Tamayo, P., Rifkin, R., Mukherjee, S., Yeang, CH., Angelo, M., Ladd, C., Reich, M., Latulippe, E., Mesirov, JP., Poggio, T., Gerald, W., Loda, M., Lander, ES., Gould, TR. Multiclass cancer diagnosis using tumor gene expression signatures Proceedings of the National Academy of Sciences of the USA 98: 15149-15154, 2001.
K-최근접 이웃에 대한 문헌:
Ramaswamy, S., Tamayo, P., Rifkin, R., Mukherjee, S., Yeang, CH., Angelo, M., Ladd, C., Reich, M., Latulippe, E., Mesirov, JP., Poggio, T., Gerald, W., Loda, M., Lander, ES., Gould, TR. muticlass cancer diagnosis using tumor gene expression signatures Proceedings of the National Academy of Sciences of the USA 98: 15149-15154, 2001.
상관관계 계수에 대한 문헌:
van't Veer LJ, Dai H, van de Vijver MJ, He YD, Hart AA, Mao M, Peterse HL, van der Kooy K, Marton MJ, Witteveen AT, Schreiber GJ, Kerkhoven RM, Roberts C, Linsley PS, Bernards R, Friend SH. Gene expression profiling predicts clinical outcome of breast cancer. Nature. 2002 Jan 31; 415(6871): 530-6.
본 발명의 유전자 발현 프로필은 또한 암 진단, 예후 또는 치료 모니터링에 유용한 다른 비유전자성 진단 방법과 함께 사용될 수 있다. 예를 들어, 전술한 유전자 발현에 기초한 방법의 진단력과 혈청 단백질 마커 (예, 암배 항원)와 같은 통상의 마커로부터 얻어진 데이터를 조합하는 것이 유리하다. 이와 같은 마커의 범위에는 CA19-9, CA125, CK-BB 및 구아닐릴 사이클라제 C와 같은 피분석물 등이 있다. 이와 같은 방법의 하나로서, 치료중인 환자로부터 혈액을 주기적으로 채혈한 뒤, 전술한 혈청 마커 중의 하나를 가지고 효소면역분석법을 실시한다. 마커 농도가 종양 복귀 또는 치료 실패를 암시하면 유전자 발현 분석이 용이한 샘플 공급원을 채취한다. 의심되는 덩어리가 존재한다면, 미세바늘 흡인물을 취하고 그 덩어리에서 취한 세포의 유전자 발현 프로필을 전술한 바와 같이 분석한다. 대안적으로, 이전에 종양이 제거되었던 조직에 인접한 구역에서 조직 샘플을 채취할 수도 있다. 이 방법은 다른 시험 결과가 모호할 때 특히 유용하다.
다른 진단과 유전자 마커 사용의 조합은 다른 진단의 신뢰성이 의심스러울 때 가장 바람직하다. 예를 들어, CEA의 혈청 농도는 환자의 암 상태와 전혀 무관한 요인에 의해 상당한 영향을 받을 수 있다는 것이 알려져 있다. 결장직장암 치료 후 모니터링한 환자가 통상의 CEA 분석값이 상승된 수준인 경우에는 유전자 발현/CEA 분석의 조합법을 사용하는 것이 유리하다.
본 발명의 물품은 치료, 진단, 예후 및 다른 질환 검사에 유용한 유전자 발현 프로필의 표현물을 포함한다. 이러한 프로필 표현물은 컴퓨터 판독 매체 (자기, 광학 등)와 같은 기계에 의해 자동 판독될 수 있는 매체로 변형된다. 이 물품은 또한 이러한 매체에서 유전자 발현 프로필을 검사하는 지침서를 포함할 수 있다. 예를 들어, 이 물품은 전술한 유전자 포트폴리오의 유전자 발현 프로필을 비교하기 위한 컴퓨터 지침을 구비한 CD 롬 (ROM)을 포함할 수 있다. 이 물품은 또한 환자 샘플의 유전자 발현 데이터와 비교할 수 있도록 수치 기록된 유전자 발현 프로필을 구비할 수 있다. 또는, 이 프로필은 다른 표현 방식으로 기록될 수도 있다. 이러한 방식의 하나가 그래프 기록이다. 전술한 "GENESPRING" 및 "DISCOVER" 컴퓨터 프로그램에 포함된 것과 같은 클러스터 알고리듬은 이러한 데이터의 가시화에 최선의 도움을 줄 수 있다.
본 발명에 제시된 상이한 유형의 제조 물품은 유전자 발현 프로필을 나타내는데 사용되는 매체 또는 포맷된 분석물이다. 이는 예를 들어 서열 상보체 또는 프로브가 당해 유전자를 나타내는 서열이 결합된 매트릭스에 배치되어 그 존재에 대한 판독가능한 결정값을 산출하는 마이크로어레이를 포함할 수 있다. 대안적으로, 본 발명의 물품은 결장직장암을 검사하기 위한 하이브리드화, 증폭 및 당해 유전자의 발현 수준을 나타내는 시그널 생성을 수행하기 위한 시약 키트로 제조될 수 있다.
본 발명에 따라 제조되는 키트는 유전자 발현 프로필을 측정하는 포맷된 분석물을 포함한다. 이 키트에는 시약과 지침서와 같은 분석 수행에 필요한 모든 재료 또는 일부 재료가 포함될 수 있다.
본 발명은 다음의 실시예를 통해 보다 상세하게 설명되지만, 이것에 국한되는 것은 아니다.
실시예
본 발명에 따라 분석된 유전자는 진뱅크 (GenBank) 데이터베이스에서 부쳐진 유전자 ID 번호를 참고하여 표시하였다. 이 유전자는 일반적으로 단백질 또는 펩타이드의 생산을 위해 암호화하는 전장의 핵산 서열에 관한 것이다. 당업자라면 전장의 서열이 분석적 측면에 필수적인 것은 아니라는 것을 잘 알고 있을 것이다. 즉, 해당 유전자의 유전자 발현을 검사하기 위해 프로브를 디자인할 수 있는 공지의 원리에 따라 서열의 일부분 또는 EST를 선발할 수 있다.
실시예 1
샘플 취급 및 LCM
27개의 새로운 동결 조직 샘플을 결장직장 종양 수술을 받은 적이 있는 환자로부터 수집하였다. 19개의 샘플은 결장직장 악성 표본이고 8개는 정상 결장 점막 샘플이다. 이 조직을 수집한 지 20 내지 30분 내에 액체 질소하에 순간 동결시킨 후 -80℃에 보관하였다. 레이저 포착을 위해, 샘플을 절단 (6㎛)하고 한쪽 단편은 유리 슬라이드 상에 올려놓고 다른쪽 단편은 유리 슬라이드 (Micro Slides, Colofrost, VWR Scientific, Media, PA) 상에 고정시킨 필름 (P.A.L.M) 상에 올려놓았다. 유리 슬라이드 상에 올린 단편은 저온 아세톤에 고정시킨 후 메이어 헤마톡실린 (Sigma, St.Louis, MO)으로 염색시켰다. 이 샘플을 병리학자에게 분석하게 하여 진단 및 등급화하였다. 임상 단계는 수반되는 외과 병리 및 임상 보고서를 통해 듀크스 (Dukes) 분류에 따라 추정하였다. 필름에 올린 단편은 100% 에탄올에 5분 동안 고정시킨 후 에오신/100% 에탄올 (무수 에탄올 100ml에 에오신 100㎍)에서 1분 동안 대비염색시킨 뒤, 100% 에탄올에 즉시 빠르게 침지시켜 유리 염색액을 제거하고 10분 동안 공기건조시켰다.
결장직장 선암 중 2개는 등급 1로, 10개는 등급 2로 5개는 등급 3으로 분석되었다. 악성 샘플 중 1개는 맹장 카르시노이드 종양이고 1개는 전이성 흑색종 병변이었다. 선암 샘플중 2개는 점막 아형이었고 1개는 인장 세포 아형이었다. 듀크스 분류는 선암을 다음과 같이 분류하였다: 듀크스 A:2, 듀크스 B:5, 듀크스 C:7, 듀크스 D:3. 선암 중 6개는 수술전에 방사선조사 처리하였다.
LCM에 사용하기 전에 막 (LPC-MEMBRANE PEN FOIL 1.35㎛ No 8100, P.A.L.M. GmbH Mikrolaser, Technologie, Bernried, Germany)과 슬라이드를 예비처리하여 RNase를 제거하고 필름 상에 조직 샘플이 더 잘 부착되도록 하였다. 간략히 살펴보면, 슬라이드는 DEP H2O로 세척하고, 필름은 RNase AWAY (Molecular Bioproducts, Inc., San Diego, CA)과 DEP H2O로 세척하였다. 유리 슬라이드 위에 필름을 부착시킨 후 슬라이드를 +120℃에서 8시간 동안 소성하고, TI-SAD (Diagnostic Products Corporation, Los Angeles, CA, DEP H2O 중에 1:50으로 희석시킨 뒤 면양모를 통해 여과시킨 것)로 처리한 다음, +37℃에서 30분 동안 항온처리하였다. 사용하기 바로 전에 RNase 억제제 용액[Rnasin Inhibitor 2500U=33U/㎕ N211A, Promega GmbH, Mannheim, Germany, 동결 용액 (0.15mol NaCl, 10mmol Tris pH 8.0, 0.25mmol 디티오트레이톨 함유) 400㎕ 중에 0.5㎕]의 10㎕ 분취량을 필름상에 도말하고, 조직 샘플을 올려놓았다.
필름상에 올린 조직 단편은 LCM 분석에 사용하였다. 체이스 액시오버트 (Zeiss Axiovert) 135 현미경 (Carl Zeiss Jena GmbH, Jena, Germany)에 연결시킨 PALM Robot-Microbeam 기술 (P.A.L.M. Mikrolaser Technologie, Carl Zeiss, Inc., Thornwood, NY)을 사용하여 약 2000개 상피세포/샘플을 포획하였다. 정상 점막의 주위 간질 및 암 샘플에서 때로 나타나는 개재성 간질 성분이 포함되어 있었다. 포획한 세포를 100% 에탄올 함유 튜브에 넣고 -80℃에 보관하였다.
실시예 2
RNA 추출 및 증폭
자이모-스핀 (Zymo-Spin) 컬럼 (Zymo Research, Orange, CA 92867)을 사용하여 LCM 포착 샘플로부터 총 RNA를 추출하였다. 총 RNA 약 2ng을 물 10㎕에 재현탁시키고 T7 RNA 폴리머라제-이용 증폭을 2회 실시하여 증폭된 RNA 약 50㎍을 수득하였다.
실시예 3
cDNA 마이크로어레이 하이브리드화 및 정량
약 20,000개 사람 cDNA 클론으로 이루어진 cDNA 마이크로어레이 세트를 사용하여 샘플을 시험하였다. 약 30개의 식물 유전자도 비특이적 하이브리드화의 대조군으로서 마이크로어레이에 프린트하였다. Cy3 표지된 cDNA 프로브는 LCM 포획 세포의 RNA 5㎍으로부터 합성하였다. 이 프로브를 퀴아겐 (Qiagen)의 뉴클레오타이드 제거 컬럼으로 정제한 뒤, 상기 마이크로어레이에 14 내지 16시간 동안 하이브리드화하였다. 이 슬라이드를 세척하고 스캐닝하기 전에 공기 건조하였다. cDNA 마이크로어레이는 cy3 형광으로 스캐닝하고 ImaGene 소프트웨어 (Biodiscovery, Los Angeles, CA)로 정량하였다. 각각의 cDNA 클론 마다 반복 스폿과 반복 어레이를 사용하여 4회의 측정값을 얻고, 그 강도를 평균하였다.
cDNA는 아미노 실란 코팅된 슬라이드 (Corning) 상에 제너레이션 III 마이크로어레이 스포터 (Molecular Dynamics)를 사용하여 프린트하였다. cDNA를 PCR 증폭시킨 뒤, 정제 (퀴아겐 PCR 정제 키트)한 뒤 10M NaSCN 프린트 완충액과 1:1로 혼합하였다. 하이브리드화 이전에 마이크로어레이를 실온에서 이소프로판올과 10분동안 항온처리하였다. 프로브는 95℃에서 2분 동안, 실온에서 5분 동안 항온처리한 뒤, 3반복으로 슬라이드 상에 적용하였다. 슬라이드 상에 DPX (Fluka)와 커버 슬립을 씌우고 42℃에서 하룻밤동안 항온처리하였다. 그 다음, 슬라이드를 1X SSC/0.2% SDS 및 0.1X SSC/0.2% SDS에 55℃에서 5분 동안 세척하고 0.1X SSC에 침지시킨 후 건조시킨 다음 GenIII 어레이 스캐너 (Molecular Dynamics)로 스캐닝하였다. 각 스팟의 형광 강도는 AUTOGENE 소프트웨어 (Biodiscovery, Los Angeles)로 분석하였다.
칩 강도는 각 칩마다 75 백분율로 판독되는 강도를 100 값에 해당하도록 직선형으로 정규화하였다. 칩 상의 모든 유전자는 그 유전자에서 판독되는 강도를 모든 샘플에서 판독된 유전자 발현값의 평균값으로 나누어 정규화하였다. 클러스터화하기 전에, 1 이상의 샘플에서 판독되는 강도가 100 이상이 아닌 유전자는 유사성 미터법에 배경 영향을 제한하기 위하여 여과제거하였다. 클러스터 분석을 위해 6225개 유전자 세트를 선발하였다. 유사성의 척도로서 상관관계를 사용하여 계층적 클러스터화를 실시하여 부정적인 변화는 고려하지 않고 긍정적인 변화를 나타내는 유전자와 샘플을 함께 그룹화하였다 (Silicon Genetics, Sunnyville, CA). 계통수의 각각의 주요 마디는 샘플의 아군으로 간주하였다. 각각의 종양 아군을 정상 그룹과 비교하여 차등 발현 유전자를 확인하였다. 선발은 하기 식으로 표시되는 노이즈에 대한 시그널 측정 한계치에 기초하여 실시하였다:
Figure 112003011248564-pat00006
이 식에서 μt는 질병이나 증상이 있는 것으로 알려진 서브세트의 평균값이고, μn은 정상 샘플의 서브세트의 평균값이며, σtn은 표준편차의 합을 나타낸다. 유전자의 강도 판독값에 대한 그룹내 분산 계수는 짝끼리의 상호비교에 유전자를 포함시키기 위해서는 0.33 미만이어야 했다. 정상 그룹의 평균값 보다 종양 그룹의 평균값은 상향-조절시 2 이상, 하향-조절시 0.5 이하이어야 했다. 유전자가 그 기준을 만족시키면 그 유전자를 선발하였다. 모든 비교에서 선발된 유전자는 결장직장암에서 계속 이상조절되는 것으로 간주하였다. 통계적 유의성에 대한 p값은 불균일한 분산을 추정하는 t-검정으로 계산하였다. 클러스터화를 위한 유전자 세트는 소프트웨어 팩키지 (Partek, St Louis, MO)를 사용하여 주요 성분 분석 (PCA)으로 처리하였다. 그 다음 데이터를 축소된 3차원 공간에 투영하였다. 정상 샘플와 결장직장암 샘플을 투영된 발현량으로 나타내었다.
종양 샘플와 정상 샘플 사이의 차이를 구분하기 위하여 상향-조절차가 큰 유전자를 목록화하였다. 노이즈에 대한 시그널 컷오프로서
Figure 112008010045417-pat00007
를 사용하여 123개 유전자를 예비선발하였다. 또한
Figure 112008010045417-pat00008
인 유전자도 포함시켰다. 정상 세포와 종양 세포 사이에 적어도 3배 이상의 발현차를 각각 나타내는 4개 유전자의 포트폴리오를 구축하였다.
결장직장암에서 차등 발현된 유전자. 모든 종양 샘플에서 정상 결장 점막과 비교했을 때 39개 유전자가 차등 발현되었다. 이 중 37개는 분리물 (outlier)을 제외하고는 모든 종양에서 유의적으로 하향-조절되었고, 2개는 상향-조절되었다. 이 유전자들의 확인은 마이크로어레이 상에 존재하는 cDNA 클론의 서열분석으로 검증되었다. 그 결과를 표 1에 제시하였다.
변조된 유전자
평가 유전자 기재 평균
시그날
강도
(정상)
평균
시그날
강도
(종양)
p-값
AF071569 CaM 키나제 II 유전자 아유형 δ 2. 93 39 4.64E-09 서열 1
AB014530 KIAA0630 단백질에 대한 호모 사피엔스 mRNA 108 50 4.83E-07 서열 2
AK000319 사람 cDNA KIAA0630 236 69 7.84E-06 서열 3
U81504 AP-3 복합체 mRNA의 β-3A-아답틴 아단위 241 75 3.52E-05 서열 4
AB011166 사람 cDNA KIAA0594 116 55 3.53E-05 서열 5
AB040914 사람 cDNA KIAA1481 187 59 8.85E-05 서열 6
AK025205 사람 cDNA FLJ21552 322 97 0.00013 서열 7
AJ278219 지방산 하이드록실라제 143 53 0.00011 서열 8
AB046854 사람 cDNA KIAA1634 142 59 0.00020 서열 9
R00585 미확인 149 57 1.28E-09 서열 10
S45844 Spi-B 전사 인자 140 43 0.00043 서열 11
X98311 암배아 항원 계열 일원 2(CGM2) 6137 223 0.00044 서열 12
BAA78050 NADPH 옥시도리덕타제 동족체 153 84 0.00048 서열 40
N72128 미확인 164 77 0.00068 서열 13
AB040955 사람 cDNA KIAA1552 334 120 0.00067 서열 14
AF125101 HSPC040 단백질 363 115 0.0011 서열 15
AB023229 사람 cDNA KIAA1012 263 88 0.00099 서열 16
N95761 a-L-푸코시다제 유전자 429 104 0.00047 서열 17
AK025033 사람 cDNA FLJ21380 180 85 0.0010 서열 18
L10844 사람 세포 성장 조절 단백질 206 101 0.0013 서열 19
H96534 gp25L2 단백질에 대한 호모 사피엔스 mRNA 147 58 0.0015 서열 20
AK001521 사람 cDNA FLJ10659 157 60 0.0019 서열 21
AF151039 HSPC205 단백질 117 60 0.0017 서열 22
AF052059 SEL 1L 단백질 168 53 0.0016 서열 23
N24597 미확인 166 62 0.0016 서열 24
AK001950 내부 중심체 단백질 148 64 0.0029 서열 25
BAA02649 대식세포 스캐빈저 수용체 유형 I 118 44 0.0031 서열 41
N75004 미확인 98 48 0.0031 서열 26
W16916 사람 cDNA KIAA0260 162 61 0.0037 서열 27
X52001 호모 사피엔스 엔도텔린 3 mRNA 89 33 0.0042 서열 28
T50788 미확인 364 102 0.0059 서열 38
AJ005866 추정 Sqv-7 유사 단백질 381 163 0.0049 서열 29
AF113535 MAID 단백질 218 100 0.0053 서열 39
AB037789 사람 cDNA KIAA1368 164 62 0.0068 서열 30
M33987 탄산탈수소효소 652 46 0.0074 서열 31
M77830 데스모플라킨 1(DPI) 184 81 0.0092 서열 32
H81220 EST 도메인 전사 인자 ELF1 113 55 0.017 서열 33
AF000592 사람 염색체 21q11-q21 게놈 클론 33 69 1.16E-05 서열 35
AK021701 사람 cDNA FLJ11639 31 63 0.00070 서열 36
실시예 4
결장직장 종양의 최적화된 포트폴리오
복수의 유전자를 기본으로 한 조인 (signature)을 만들기 위해 평균 분산 최적화 알고리듬을 사용하였고, 포함되는 유전자는 정상 샘플와 종양 샘플을 구분하기 위하여 조합하여 사용할 수 있다. 실시예 1 내지 3에 기술한 샘플와 마이크로어레이를 사용하여 강도 측정값을 처리하였다. 분석할 데이터는 먼저 종양 세포와 정상 세포 사이에 사전규정된 5배 차이를 기준으로 예비선발하였다. 이 기준에 따라 예비선발된 유전자의 발현 데이터는 다음과 같이 사용하였다. 각 유전자의 강도 측정값의 평균값과 표준편차는, 기준값으로 비전이성 샘플을 사용하여 계산하였다. 그 다음, 각각의 기준 유전자 (X는 3임)에 대하여 X* (표준편차+평균값)의 구별값을 계산하였다. 이 값은 결과적으로 수득되는 포트폴리오가 엄중해지도록 하기 위한 것이다. 그 다음, 각각의 전이 샘플에 대하여 기준값에 대한 구별값의 비율을 계산하였다. 이 비율은 그 다음 공통 로그값으로 변환시켰다. 이 데이터를 바그너 소프트웨어에 입력하여 효율적인 경계값을 얻고, 이로부터 4개 유전자의 포트폴리오를 선발하였다. 이 세트에는 미지의 서열, 프로콜라겐 타입 I, 리보솜 단백질 L21의 대형 서브유닛 및 피브로넥틴이 포함되어 있었다. 이 유전자는 서열번호 42, 43, 44 및 45로 표시하였다. 또는, 포트폴리오를 구성하는데 사용된 유전자 조합을 사용하여 결장직장암에 관한 임상 결정을 내리는데 유용한 진단 정보를 제공할 수 있다. 이것은 특히 포트폴리오로부터 선발된 유전자 조합을 부가 마커 (유전자 여부에 관계없이)와 조합할 때 유리하다.
최적화된 유전자 포트폴리오:
>gi┃1264443┃gb┃N92134.1┃N92134 za23f09.r1 Soares fetal liver spleen 1NFLS Homo sapiens cDNA clone IMAGE: 293417 5' similar to gb┃M87908┃HUMALNE32 Human carcinoma cell-derived Alu RNA transcript, (rRNA); gb: X57025_rna1 INSULIN-LIKE GROWTH FACTRO IA PRECURSOR(HUMAN).
>gi┃2221047┃gb┃AA490172.1┃AA490172 ab06b08.s1 Stratagene fetal retina 937202 Homo sapiens cDNA clone IMAGE: 839991 3' similar to gb: J03464 PROCOLLAGEN ALPHA 2(I) CHAIN PRECURSOR(HUMAN).
>gi┃2188918┃gb┃AA464034.1┃AA464034 zx86b09.r1 Soares ovary tumor NbHOT Homo sapiens cDNA clone IMAGE: 810617 5' similar to SW: RL21_HUMAN P46778 60S RIBOSOMAL PROTEIN L21.
>gi┃834491┃gb┃R62612.1┃R62612 yil2d01.s1 Soares placenta Nb2HP Homo sapiens cDNA clone IMAGE: 139009 3' similar to gb: X02761_ cds1 FIBRONECTIN PRECURSOR (HUMAN);
동일한 방법이나 다른 기준의 세트를 사용하여 다른 4가지 유전자 포트폴리오를 소프트웨어로부터 선발하였다. 이것은 서열번호 46, 47, 48 및 49로 표시하였다. 이 중 2개의 유전자는 처음 4개의 유전자 포트폴리오와 중복되는 것이었다. 최적화된 2개의 포트폴리오를 다시 조합하여 6개 유전자 포트폴리오를 구성할 수 있다.
최적화된 유전자 포트폴리오:
>gi┃2114953┃gb┃AA431245.1┃AA431245 zw78d06.r1 Soares_testis NHT Homo sapiens cDNA clone IMAGE: 782315 5' similar to WP:F36H1.2 CE05814 ANKYRIN LIKE
>gi┃2156172┃gb┃AA4434497.1┃AA443497 zw34d03.r1 Soares ovary tumor NbHOT Homo sapiens cDNA clone IMAGE: 771173
>gi┃2221047┃gb┃2┃AA490172 ab06b08.s1 Stratagene fetal retina 937202 Homo sapiens cDNA clone IMAGE: 839991 3' similar to gb: J03464 PROCOLLAGEN ALPHA 2(I) CHAIN PRECURSOR (HUMAN)
>gi┃1264443┃gb┃N92134.1┃N92134 za23f09.r1 Soares fetal liver spleen 1NFLS Homo sapiens cDNA clone IMAGE: 293417 5' similar to gb┃M87908┃HUMALNE32 Human carcinoma cell-derived Alu RNA transcript, (rRNA); gb: X57025_rna1 INSULIN-LIKE GROWTH FACTOR IA PRECURSOR(HUMAN);
본 발명에 따라, 일군의 유전자 발현을 분석하여 결장직장암이 있는 것으로 추정되는 환자의 결장직장암의 존재 유무 또는 가능한 증상을 검사하는 방법을 제공한다.
<110> Ortho-Clinical Diagnostics, Inc. <120> Assessing colorectal cancer <130> CDS 267 US NP <150> US 60/368,798 <151> 2002-03-29 <160> 49 <170> KopatentIn 1.71 <210> 1 <211> 1500 <212> DNA <213> human <400> 1 atggcttcga ccaccacctg caccaggttc acggacgagt atcagctttt cgaggagctt 60 ggaaaggggg cattctcagt ggtgagaaga tgtatgaaaa ttcctactgg acaaggatat 120 gctgccaaaa ttatcaacac caaaaagctt tctgctaggg atcatcagaa actagaaaga 180 gaagctagaa tctgccgtct tttgaagcac cctaatattg tgcgacttca tgatagcata 240 tcagaagagg gctttcacta cttggtgttt gatttagtta ctggaggtga actgtttgaa 300 gacatagtgg caagagaata ctacagtgaa gctgatgcca gtcattgtat acagcagatt 360 ctagaaagtg ttaatcattg tcacctaaat ggcatagttc acagggacct gaagcctgag 420 aatttgcttt tagctagcaa atccaaggga gcagctgtga aattggcaga ctttggctta 480 gccatagaag ttcaagggga ccagcaggcg tggtttggtt ttgctggcac acctggatat 540 ctttctccag aagttttacg taaagatcct tatggaaagc cagtggatat gtgggcatgt 600 ggtgtcattc tctatattct acttgtgggg tatccaccct tctgggatga agaccaacac 660 agactctatc agcagatcaa ggctggagct tatgattttc catcaccaga atgggacacg 720 gtgactcctg aagccaaaga cctcatcaat aaaatgctta ctatcaaccc tgccaaacgc 780 atcacagcct cagaggcact gaagcaccca tggatctgtc aacgttctac tgttgcttcc 840 atgatgcaca gacaggagac tgtagactgc ttgaagaaat ttaatgctag aagaaaacta 900 aagggtgcca tcttgacaac tatgctggct acaaggaatt tctcagcagc caagagtttg 960 ttgaagaaac cagatggagt aaaggagtca actgagagtt caaatacaac aattgaggat 1020 gaagatgtga aagcacgaaa gcaagagatt atcaaagtca ctgaacaact gatcgaagct 1080 atcaacaatg gggactttga agcctacaca aaaatctgtg acccaggcct tactgctttt 1140 gaacctgaag ctttgggtaa tttagtggaa gggatggatt ttcaccgatt ctactttgaa 1200 aatgctttgt ccaaaagcaa taaaccaatc cacactatta ttctaaaccc tcatgtacat 1260 ctggtagggg atgatgccgc ctgcatagca tatattaggc tcacacagta catggatggc 1320 agtggaatgc caaagacaat gcagtcagaa gagactcgtg tgtggcaccg ccgggatgga 1380 aagtggcaga atgttcattt tcatcgctcg gggtcaccaa cagtacccat caagccaccc 1440 tgtattccaa atgggaaaga aaacttctca ggaggcacct ctttgtggca aaacatctga 1500 <210> 2 <211> 5761 <212> DNA <213> human <400> 2 cacaccgcag tatgcggtgc cctttactct gagctgcgca gccggccggc cggcgctggt 60 tgaacagact gccgctgtac tggcgtggcc tggagggact cagcaaattc tcctgccttc 120 aacttggcaa cagttgcctg gggtagctct acacaactct gtccagccca cagcaatgat 180 tccagaggcc atggggagtg gacagcagct agctgactgg aggaatgccc actctcatgg 240 caaccagtac agcactatca tgcagcagcc atccttgctg actaaccatg tgacattggc 300 cactgctcag cctctgaatg ttggtgttgc ccatgttgtc agacaacaac aatccagttc 360 cctcccttcg aagaagaata agcagtcagc tccagtctct tccaagtcct ctctagatgt 420 tctgccttcc caagtctatt ctctggttgg gagcagtccc ctccgcacca catcttctta 480 taattccttg gtccctgtcc aagatcagca tcagcccatc atcattccag atactcccag 540 ccctcctgtg agtgtcatca ctatccgaag tgacactgat gaggaagagg acaacaaata 600 caagcccagt agctctggac tgaagccaag gtctaatgtc atcagttatg tcactgtcaa 660 tgattctcca gactctgact cttctttgag cagcccttat tccactgata ccctgagtgc 720 tctccgaggc aatagtggat ccgttttgga ggggcctggc agagttgtgg cagatggcac 780 tggcacccgc actatcattg tgcctccact gaaaactcag cttggtgact gcactgtagc 840 aacccaggcc tcaggtctcc tgagcaataa gactaagcca gtcgcttcag tgagtgggca 900 gtcatctgga tgctgtatca cccccacagg gtatcgagct caacgcgggg ggaccagtgc 960 agcacaacca ctcaatctta gccagaacca gcagtcatcg gcggctccaa cctcacagga 1020 gagaagcagc aacccagccc cccgcaggca gcaggcgttt gtggcccctc tctcccaagc 1080 cccctacacc ttccagcatg gcagcccgct acactcgaca gggcacccac accttgcccc 1140 ggcccctgct cacctgccaa gccaggctca tctgtatacg tatgctgccc cgacttctgc 1200 tgctgcactg ggctcaacca gctccattgc tcatcttttc tccccacagg gttcctcaag 1260 gcatgctgca gcctatacca ctcaccctag cactttggtg caccaggtcc ctgtcagtgt 1320 tgggcccagc ctcctcactt ctgccagcgt ggcccctgct cagtaccaac accagtttgc 1380 cacccaatcc tacattgggt cttcccgagg ctcaacaatt tacactggat acccgctgag 1440 tcctaccaag atcagccagt attcctactt atagttggtg agcatgaggg aggaggaatc 1500 atggctacct tctcctggcc ctgcgttctt aatattgggc tatggagaga tcctccttta 1560 ccctcttgaa atttcttagc cagcaacttg ttctgcaggg gcccactgaa gcagaaggtt 1620 tttctctggg ggaacctgtc tcagtgttga ctgcattgtt gtagtcttcc caaagtttgc 1680 cctattttta aattcattat ttttgtgaca gtaattttgg tacttggaag agttcagatg 1740 cccatcttct gcagttacca aggaagagag attgttctga agttaccctc tgaaaaatat 1800 tttgtctctc tgacttgatt tctataaatg cttttaaaaa caagtgaagc ccctctttat 1860 ttcattttgt gttattgtga ttgctggtca ggaaaaatgc tgatagaagg agttgaaatc 1920 tgatgacaaa aaaagaaaaa ttactttttg tttgtttata aactcagact tgcctatttt 1980 attttaaaag cggcttacac aatctccctt ttgtttattg gacatttaaa cttacagagt 2040 ttcagttttg ttttaatgtc atattatact taatgggcaa ttgttatttt tgcaaaactg 2100 gttacgtatt actctgtgtt actattgaga ttctctcaat tgctcctgtg tttgttataa 2160 agtagtgttt aaaaggcagc tcaccatttg ctggtaactt aatgtgagag aatccatatc 2220 tgcgtgaaaa caccaagtat tctttttaaa tgaagcacca tgaattcttt tttaaattat 2280 tttttaaaag tctttctctc tctgattcag cttaaatttt tttatcgaaa aagccattaa 2340 ggtggttatt attacatggt ggtggtggtt ttattatatg caaaatctct gtctattatg 2400 agatactggc attgatgagc tttgcctaaa gattagtatg aattttcagt aatacacctc 2460 tgttttgctc atctctccct tctgttttat gtgatttgtt tggggagaaa gctaaaaaaa 2520 cctgaaacca gataagaaca tttcttgtgt atagctttta tacttcaaag tagcttcctt 2580 tgtatgccag cagcaaattg aatgctctct tattaagact tatataataa gtgcatgtag 2640 gaattgcaaa aaatatttta aaaatttatt actgaattta aaaatatttt agaagttttg 2700 taatggtggt gttttaatat tttacataat taaatatgta catattgatt agaaaaatat 2760 aacaagcaat ttttcctgct aacccaaaat gttatttgta atcaaatgtg tagtgattac 2820 acttgaattg tgtacttagt gtgtatgtga tcctccagtg ttatcccgga gatggattga 2880 tgtctccatt gtatttaaac caaaatgaac tgatacttgt tggaatgtat gtgaactaat 2940 tgcaattata ttagagcata ttactgtagt gctgaatgag caggggcatt gcctgcaagg 3000 agaggagacc cttggaattg ttttgcacag gtgtgtctgg tgaggagttt ttcagtgtgt 3060 gtctcttcct tccctttctt cctccttccc ttattgtagt gccttatatg ataatgtagt 3120 ggttaataga gtttacagtg agcttgcctt aggatggacc agcaagcccc cgtggaccct 3180 aagttgttca ccgggattta tcagaacagg attagtagct gtattgtgta atgcattgtt 3240 ctcagtttcc ctgccaacat tgaaaaataa aaacagcagc ttttctcctt taccaccacc 3300 tctacccctt tccattttgg attctcggct gagttctcac agaagcattt tccccatgtg 3360 gctctctcac tgtgcgttgc taccttgctt ctgtgagaat tcaggaagca ggtgagagga 3420 gtcaagccaa tattaaatat gcattctttt aaagtatgtg caatcacttt tagaatgaat 3480 ttttttttcc ttttcccatg tggcagtcct tcctgcacat agttgacatt cctagtaaaa 3540 tatttgcttg ttgaaaaaaa catgttaaca gatgtgttta taccaaagag cctgttgtat 3600 tgcttaccat gtccccatac tatgaggaga agttttgtgg tgccgctggt gacaaggaac 3660 tcacagaaag gtttcttagc tggtgaagaa tatagagaag gaaccaaagc ctgttgagtc 3720 attgaggctt ttgaggtttc ttttttaaca gcttgtatag tcttggggcc cttcaagctg 3780 tgaaattgtc cttgtactct cagctcctgc atggatctgg gtcaagtaga aggtactggg 3840 gatggggaca ttcctgccca taaaggattt ggggaaagaa gattaatcct aaaatacagg 3900 tgtgttccat ccgaattgaa aatgatatat ttgagatata attttaggac tggttctgtg 3960 tagatagaga tggtgtcaag gaggtgcagg atggagatgg gagatttcat ggagcctggt 4020 cagccagctc tgtaccaggt tgaacaccga ggagctgtca aagtatttgg agtttcttca 4080 ttgtaaggag taagggcttc caagatgggg caggtagtcc gtacagccta ccaggaacat 4140 gttgtgtttt ctttattttt taaaatcatt atattgagtt gtgttttcag cactatattg 4200 gtcaagatag ccaagcagtt tgtataattt ctgtcactag tgtcatacag ttttctggtc 4260 aacatgtgtg atctttgtgt ctcctttttg ccaagcacat tctgattttc ttgttggaac 4320 acaggtctag tttctaaagg acaaattttt tgttccttgt cttttttctg taagggacaa 4380 gatttgttgt ttttgtaaga aatgagatgc aggaaagaaa accaaatccc attcctgcac 4440 cccagtccaa taagcagata ccacttaaga taggagtcta aactccacag aaaaggataa 4500 taccaagagc ttgtattgtt accttagtca cttgcctagc agtgtgtggc tttaaaaact 4560 agagattttt cagtcttagt ctgcaaactg gcatttccga ttttccagca taaaaatcca 4620 cctgtgtctg ctgaatgtgt atgtatgtgc tcactgtggc tttagattct gtccctgggg 4680 ttagccctgt tggccctgac aggaagggag gaagcctggt gaatttagtg agcagctggc 4740 ctgggtcaca gtgacctgac ctcaaaccag cttaaggctt taagtcctct ctcagaactt 4800 ggcatttcca acttcttcct ttccgggtga gagaagaagc ggagaagggt tcagtgtagc 4860 cactctgggc tcatagggac acttggtcac tccagagttt ttaatagctc ccaggaggtg 4920 atattatttt cagtgctcag ctgaaatacc aaccccagga ataagaactc catttcaaac 4980 agttctggcc attctgagcc tgcttttgtg attgctcatc cattgtcctc cactagaggg 5040 gctaagcttg actgccctta gccaggcaag cacagtaatg tgtgttttgt tcagcattat 5100 tatgcaaaaa ttcactagtt gagatggttt gttttaggat aggaaatgaa attgcctctc 5160 agtgacagga gtggcccgag cctgcttcct attttgattt tttttttttt taactgatag 5220 atggtgcagc atgtctacat ggttgtttgt tgctaaactt tatataatgt gtggtttcaa 5280 ttcagcttga aaaataatct cactacatgt agcagtacat tatatgtaca ttatatgtaa 5340 tgttagtatt tctgctttga atccttgata ttgcaatgga attcctactt tattaaatgt 5400 atttgatatg ctagttattg tgtgcgattt aaactttttt tgctttctcc ctttttttgg 5460 ttgtgcgctt tcttttacaa caagcctcta gaaacagata gtttctgaga attactgagc 5520 tatgtttgta atgcagatgt acttagggag tatgtaaaat aatcatttta acaaaagaaa 5580 tagatattta aaatttaata ctaactatgg gaaaagggtc cattgtgtaa aacatagttt 5640 atctttggat tcaatgtttg tctttggttt tacaaagtag cttgtatttt cagtattttc 5700 tacataatat ggtaaaatgt agagcaattg caatgcatca ataaaatggg taaattttct 5760 g 5761 <210> 3 <211> 2129 <212> DNA <213> human <400> 3 ctgtattgag acaaaggaag ggatctgtca gaaagcaaca cttgttatct tgggcttggc 60 agcaaggaag aggacaggta gtggagatcc tgcaatctga aaagcagact gaaaggtgac 120 aaagaagctg aagatgggtg gtggagagag gtataacatt ccagcccctc aatctagaaa 180 tgttagtaag aaccaacaac agcttaacag acagaagacc aaggaacaga attcccagat 240 gaagattgtt cataagaaaa aagaaagagg acatggttat aactcatcag cagctgcctg 300 gcaggccatg caaaatgggg ggaagaacaa aaattttcca aataatcaaa gttggaattc 360 tagcttatca ggtcccaggt tactttttaa atctcaagct aatcagaact atgctggtgc 420 caaatttagt gagccgccat caccaagtgt tcttcccaaa ccaccaagcc actgggtccc 480 tgtttccttt aatccttcag ataaggaaat aatgacattt caacttaaaa ccttacttaa 540 agtacaggta taaaataaga caaatgttta aatttagtta tgttcacggg tagttgtcaa 600 ttggtctgaa acaaatttgc tagggaatct atttgtgtag aactaattaa tgtaaaaaaa 660 atagaccatc tcgtgttgtg tgcactgtga tataatggta gtatcagtgc aacttaaact 720 aatgattgta cttgatatta agtgttctca actgagtaac ttttaagtgg aaaccaagtt 780 tagatttggg gagtggtaaa ggaatcagct ttttctattg ttaggggaag acagtaattt 840 atcattcatg gaccagtaga ttgttgaaag ttggtgaatc ggattataag cttctagcta 900 acacaaggat tcagaattag gtaaacatct gaaggtttag tatattagaa acacccaaac 960 cagtaatatg ctaacctgat gcactgctga aagaaaatgt gaatttttcg taataattgc 1020 attttagtga attgtacagt gggtggaaag ggcatttgga gctcattaga atgagacata 1080 gtacacccca atggccctgt ttattaaatg tagtggatta agtgtctgtc aacaaataca 1140 ccaaaaccat tttttataga aacagtattt aatggtcact caatagcttt caaaatacat 1200 ttttgtatta cagcactgca caagctattc taatagtgct ctggcctcat cattcctgca 1260 aagcttgctt tggggagttg gataatgtga aaattttaag tacctagggg agaaagagcc 1320 atgtaaatat ctgtaataaa cttgtagcat atgtaaagtt ttcttggcct ttatcttaca 1380 aaaatggagt attttagtat gaatttgctg aatgtaagac cgtggactgt tttttataat 1440 atggcctaat tttaaaggtc caaaataact tgtttttaaa gtttgccctt gtgctaaagt 1500 gccagtgtat gtatgttata cttgatttgg ttgtaaacta tatttcaaag taaaccctag 1560 tgtaataagt tttataacta aaaaggttta agctgctaaa actattttta agagatgtga 1620 aatgcagtat gggactatct ttttttcctc ctctaagccc aaagattaac tagagtccct 1680 ccaaccttat agattgttgg ctttcacaat cttataacct aggatacagg tagtttcgag 1740 tatggtgcca gtgatgtttt gtttttgttt ggtcaagggg taggtgcaac ccaatggacc 1800 acttatgcaa aagatgtaaa ctcttgcata atacattgat aacatgtttt gccaacttta 1860 aatgcttaaa cataagcgaa accagtagca agtatgtggg tcagcttaaa aattttgatt 1920 gttaatgccc tattttctaa tttggcacct cttgatgcct aagcaggtaa gcagatgcct 1980 aagctgtatt tctccaaata aatcaagatg aagtactgcc caagttaaat attgatagcc 2040 taaagacaag tttatgtagt acttaatgta catgatatga agcataaaat taaataaaat 2100 ttttccccat tgaaaaaaaa aaaaaaaaa 2129 <210> 4 <211> 3950 <212> DNA <213> human <400> 4 cgagaactag ttttgttccg tgccctctgg actggaacct tttggagaga acccccggca 60 ggaccaaccc cgcacccgcc agcaccgcgg caatgtccag caatagtttt ccttacaatg 120 agcagtccgg aggaggggag gcgacggagc tgggtcagga ggcgacctca accatttccc 180 cctcgggggc cttcggcctc tttagcagcg atttgaagaa gaatgaagat ctaaagcaaa 240 tgttagagag caacaaagat tctgctaaac tggatgctat gaagcggatt gttgggatga 300 ttgcaaaagg gaaaaatgca tctgaactgt ttcctgctgt tgtgaagaat gtggccagta 360 aaaatattga gatcaagaag ttggtatatg tttacctggt tcgatatgct gaagaacagc 420 aggatcttgc actcctgtcc ataagcactt ttcagcgagc tctgaaggac ccaaaccaac 480 taattcgtgc aagcgctttg agagttctgt caagtattag agtgccaatt attgtaccta 540 tcatgatgct tgctattaag gaagcttctg ctgacttatc accatatgtt aggaagaatg 600 cagcccatgc aatacaaaaa ttatacagcc ttgatccaga gcagaaggaa atgttaattg 660 aagtaattga aaaacttctg aaagataaaa gcacattggt agctggcagt gttgtgatgg 720 cttttgaaga agtatgcccg gacagaatag atctgattca taaaaattac cgcaagctat 780 gtaacttact agtggatgtt gaagagtggg ggcaggttgt cataatccac atgctaactc 840 gatatgctcg gacacagttt gtcagccctt ggaaagaggg tgatgaatta gaagacaatg 900 gaaagaattt ctacgaatct gatgatgatc agaaggaaaa gactgacaaa aagaagaagc 960 cgtatactat ggatccagat catagactct taattagaaa tacaaagcct ttgcttcaga 1020 gcaggaatgc tgcggtggtt atggcagttg ctcagctgta ttggcacata tcaccaaaat 1080 ctgaagctgg cataatttct aaatcactag tgcgtttact tcgtagcaat agggaggtgc 1140 agtatattgt cctacaaaat atagcaacta tgtcaattca aagaaagggg atgtttgaac 1200 cttatctgaa gagtttctat gttaggtcaa ctgatccaac tatgatcaag acactgaagc 1260 ttgaaatttt gacaaacttg gcaaatgaag ccaacatatc aactcttctt cgagaatttc 1320 agacctatgt gaaaagccag gataaacaat ttgcagcagc cactattcag actataggca 1380 gatgtgcaac caacatcttg gaagtcactg acacgtgcct caatggcttg gtctgtctgc 1440 tgtccaacag ggatgaaata gttgttgctg aaagtgtggt tgttataaag aaattactgc 1500 aaatgcaacc tgcacaacat ggtgaaatta ttaaacatat ggccaaactc ctggacagta 1560 tcactgttcc tgttgctaga gcaagtattc tttggctaat tggagaaaac tgtgaacgag 1620 ttcctaaaat tgcccctgat gttttgagga agatggctaa aagcttcact agtgaagatg 1680 atctggtaaa actgcagata ttaaatctgg gagcaaaatt gtatttaacc aactccaaac 1740 agacaaaatt gcttacccag tacatattaa atctcggcaa gtatgatcaa aactacgaca 1800 tcagagaccg tacaagattt attaggcagc ttattgttcc gaatgaaaag agtggagctt 1860 taagtaaata tgccaaaaaa atattcctag cacaaaagcc tgcaccactg cttgagtctc 1920 cttttaaaga tagagatcat ttccagcttg gcaccttatc tcatactctc aacattaaag 1980 ctactgggta cctggaatta tctaattggc cagaggtggc gcccgaccca tcagttcgaa 2040 atgtagaagt aatagagttg gcaaaagaat ggaccccagc aggaaaagca aagcaagaga 2100 attctgctaa gaagttttat tctgaatctg aggaagagga ggactcttct gatagtagca 2160 gtgacagtga gagtgaatct ggaagtgaaa gtggagaaca aggcgaaagt ggggaggaag 2220 gagacagcaa tgaggacagc agtgaggact cctccagtga gcaggacagt gagagtggac 2280 gggagtcagg cctagaaaac aaaagaacag ccaagaggaa ctcaaaagcc aaaggaaaaa 2340 gtgattctga agatggggag aaggaaaatg aaaaatctaa aacttcagat tcttcaaatg 2400 acgaatctag ttcaatagaa gacagttctt ccgattctga atcagagtca gaacctgaaa 2460 gtgaatctga atccagaaga gtcactaagg agaaagaaaa gaaaacaaag caagatagaa 2520 ctcctcttac caaagatgtt tcacttctag atctggatga ttttaaccca gtatccactc 2580 cagttgcact tcccacacca gctctttctc caagtttgat ggctgatctt gaaggtttac 2640 acttgtcaac ttcctcttca gtcatcagtg tcagtactcc tgcatttgta ccaacgaaaa 2700 ctcacgtgct gcttcatcga atgagtggaa aaggactagc tgcccattat ttctttccaa 2760 gacagccttg catttttggt gataagatgg tctctataca aataacactg aataacacta 2820 ctgatcgaaa gatagaaaat atccacatag gggaaaaaaa acttcctata ggcatgaaaa 2880 tgcatgtttt taatccaata gactctcttg agcctgaggg atccattaca gtttcaatgg 2940 gtattgactt ttgtgattct actcagactg ccagtttcca gttgtgtacc aaggatgatt 3000 gcttcaatgt taatattcag ccacctgttg gagaactgct tttacctgtg gccatgtcag 3060 agaaagattt taagaaagag caaggagtgc taacaggaat gaatgaaact tctgctgtaa 3120 tcattgctgc accacagaat ttcactccct ctgtgatctt tcagaaggtt gtaaatgtag 3180 ccaatgtagg tgcagtccct tctggccagg ataatataca caggtttgca gctaaaactg 3240 tgcacagtgg gtcattgatg ctagtcacag tggaactgaa ggaaggctct acagcccagc 3300 ttatcataaa cactgagaaa actgtgattg gctctgttct gctgcgggaa ctgaagcctg 3360 tcctgtctca ggggtaacct gcttacatct ggactttaga atctggcaca caacaaaagt 3420 gcctggcatc cactactgct gcctttcatt tataataata gcccttccat ctggcagtgg 3480 gggtagaata cactcttgac attcttgtct cctgctttag aatgctagtg tgtatctatc 3540 atgtatgcaa tactttcccc ctttttgctt tgctaaccga agagcatata ttttactgtc 3600 agttgtctca actcttgaat ccatgtggcg ttttctctgt cctgctgctt cttttggcct 3660 cctcgttttc cttctctttt tcgacaatgg tagacatgaa tgagatattt aaagttcatt 3720 ggaaatcttc ttccctacag cagtaagcaa aaattagcaa agagatagtc taaatggcct 3780 ctcagcttgg tatgtgaaaa tgagatcaca tactttttaa atccaaatac aaaagcatag 3840 tctctgcaag attttgttct ttgaatttct tgatattgta attgattatt gataactgtc 3900 atcatgaaat tatctctcaa taataagata aataaactag catatgaatc 3950 <210> 5 <211> 5191 <212> DNA <213> human <400> 5 gagaaagaaa aacagctcga gacctcatgc aaagagaaaa ctgagtatct acagaaaatg 60 gttcagagga atgaaagata taaacaagat gtggagaggt tctatgaacg gaagcgacat 120 ttagatttaa ttgagatgct tgaagcaaaa aggccatggg tggaatatga aaatgttcgt 180 caggaatatg aagaagtaaa actagttcgt gaccgagtga aggaagaggt cagaaaactt 240 aaagaagggc agattcctat aacatgtcga attgaagaaa tggaaaacga gcgtcacaat 300 ttggaggctc gaatcaaaga aaaggcaaca gatattaagg aggcatctca aaaatgcaaa 360 cagaagcaag atgttataga aaggaaagat aaacatattg aggaacttca gcaggcttta 420 atagtaaagc aaaatgaaga gcttgaccga cagaggagaa taggtaatac ccgcaaaatg 480 atagaggatt tgcaaaatga actaaagacc acggaaaact gcgagaatct tcagccccag 540 attgatgcca ttacaaatga tctgagacgg attcaggatg aaaaggcatt atgtgaaggc 600 gaaataattg ataagcgaag agagagggaa actctagaga aggagaaaaa gagtgtggac 660 gatcatattg tacgttttga caatcttatg aatcagaagg aagataagct aagacagaga 720 ttccgtgaca cgtatgatgc tgttttatgg ctaagaaata acagagacaa atttaaacaa 780 agagtctgtg agcccataat gctcacgatc aatatgaaag ataataaaaa tgccaaatat 840 attgaaaatc atattccatc aaatgactta agagcctttg tatttgaaag tcaagaagat 900 atggaggttt tcctcaaaga ggttcgtgac aataaaaaat taagagtaaa tgctgttatt 960 gctcccaaga gttcatatgc agacaaagca ccttcaagat ctttgaatga acttaaacaa 1020 tacggatttt tctcttattt gagagaatta tttgatgcac ctgatcctgt aatgagttac 1080 ctttgctgtc agtatcatat tcatgaagtt cctgtaggaa ctgaaaagac cagagaaaga 1140 attgaacggg taatacaaga aacccgatta aaacagattt atacagcaga agaaaagtat 1200 gtggtgaaaa cttcttttta ttcaaacaaa gttatttcta gtaacacatc tctaaaagta 1260 gcgcagtttc tcactgtcac tgtggaccta gagcagagaa gacacttaga agaacagcta 1320 aaggaaattc atagaaaatt gcaagcagtg gattcagggt tgattgcctt acgtgaaaca 1380 agcaaacatc tggagcacaa agacaatgaa cttagacaaa agaagaagga gcttcttgag 1440 agaaaaacca agaaaagaca actggaacaa aaaatcagtt ccaaactagg aagtttaaag 1500 ctgatggaac aggatacttg caatcttgaa gaggaagagc gaaaagcaag taccaaaatc 1560 aaagaaataa atgttcaaaa agcgaaactt gttaccgaat taacaaacct aataaagatt 1620 tgtacttctt tgcatataca aaaagtagat ttaattctcc aaaatactac agtgatctct 1680 gagaagaaca aattagaatc agattatatg gccgcatctt cacaactccg tcttacagag 1740 caacatttca ttgaattgga tgaaaataga cagagattat tgcagaaatg caaggaactt 1800 atgaaaagag ctaggcaagt atgtaacctg ggtgcagagc agactcttcc tcaagaatac 1860 cagacacaag tacccaccat tccaaatgga cacaactcct cactccccat ggttttccaa 1920 gaccttccaa acacattgga tgaaattgat gctttattaa ctgaagaaag atcaagagct 1980 tcctgcttca cgggactgaa tcctacaatt gttcaggaat atacaaaaag agaagaagaa 2040 atagaacagt taactgagga actaaaggga aagaaagttg aactagatca atacagggaa 2100 aacatttcac aggtaaaaga aaggtggctt aatcctttaa aagagctggt agaaaaaatt 2160 aatgaaaaat tcagcaattt ttttagttcc atgcagtgtg ctggtgaagt tgatctccat 2220 acagaaaatg aggaagatta tgataaatat ggaattcgaa ttagagtcaa atttcgaagt 2280 agtactcaac tgcatgaatt aactcctcat catcaaagtg gaggtgaaag aagtgtttct 2340 accatgttat acttgatggc acttcaggag ctaaatagat gtccattcag agtagttgat 2400 gaaatcaatc agggaatgga cccaatcaat gaacggagag tgtttgaaat ggttgtaaat 2460 actgcctgta aagaaaatac atctcaatac tttttcataa caccaaagct cctgcaaaat 2520 cttccttatt ctgaaaagat gacagttttg tttgtctaca atggccctca tatgctggaa 2580 ccaaacacat ggaatttaaa ggctttccaa aggcggcggc gccgtattac attcactcaa 2640 ccttcttaat aaaagtaaag agagggaact tgggaatttt ttttgttaaa ttctgtttat 2700 aagtatggct caactgaata aaaggagatt cactaaaacg aaaagcagtt atttttggaa 2760 acctgctttt aaatacaaat aggttgataa tggaaactat aatgaccttt ccaaaatagc 2820 agctggtagt aaaagttaag tcttcttcag tcttggttga acttgagttc ttggcactct 2880 gaccatgagt cattcagttc tcatgttaaa atgtacttaa tattacaaat caaaggtaca 2940 gtggaagaag ggttaatcac aagaagttac ttatatggta gccctgagct ttaattgcag 3000 agtaacttta attactttta gagcctaaag atgactctag agcctaagtc ctagtttctc 3060 ccaatgttat atttaatttt aaaaaattga tatgaaaatg tctaatgtat agtaataatt 3120 tatgacagat ctagtcattt cttcctatta aaaaagatta ccttatctcc agtaggaaat 3180 ggaattttat gggcctttaa aagaaagttt tatgaaactt gatgctataa ttttattggt 3240 atttcaaggg gaaaaaagca ctggggttca aaaatggtag cagaactgct ttgaaatgct 3300 gcaaggtggc cactagatga tgcaaaatac aaccaaaaga ttgactgaga ataaaattag 3360 gtgacaaggg tttttaaaga ataacctttt aaagtgtggg ggcaggggtt gctttttttt 3420 attttattta aagtcaatta tattttacat cttacatttc taaaagcatt ttataattat 3480 ttttagtaag atttttctta aaatttcata tactggtttc tacaatttat atttgaaatt 3540 tctcagtgtt atgtaaagag tgatggaaaa gcattgattt ctttaaaacc gtaatgtttt 3600 tagaacttaa gcctataggg cctttcttac aatgttgatg tacccattat cttagaaaat 3660 ctagtttaaa ctgttttctt tcaccgcaaa agaattaaat gggaaaatca tttgtttatc 3720 tctaagttat actaattagt agaaccaaac aaattatctt cttttaaaaa ataaatctta 3780 taggaaaata gacagtccaa agtcatgtct ttgaacagtg gattggatct gtgccagtaa 3840 tgacaaaatt atttttttga cttgcttgcc tgaataaatt gaagaattgc tttcagtttg 3900 ggttttgtat attcttaagt agccattgaa atttatattc ttaactaggt caaaaaataa 3960 tgagccataa gtttatgtcc tctcacttag acattttctc tttaaaaagg tattttcttc 4020 tttataaaca ttttaaaaga gccttccctt cttaaactaa ctccagtgca tgaagtgtga 4080 aaatatttta aaatgacatt tttactaata tgagcaagtc atgtaaacat tgaagaactt 4140 ggtaacatat tagtaaatgg atattaccaa atgttttcat cgttaattac tttgcgttcc 4200 accaaaatat ctttactaaa atgtgcttgg tgtagtttgt ttattgtcta aattagtacc 4260 agtcatctta tttctgcaaa atgagtatca atgtgaaaaa gacacgtgaa gattaagcat 4320 gtttgaaaat aaaatggtca attacatttc aatttacata ggccaacaac tgttccatac 4380 tttgtttgta aacatttaat ttctctactg gacaaaatta atatttggct ttacattgaa 4440 ttttgagctg tgaagaataa attatgtatc attttagcat attaaacagt agtaagtcta 4500 gcacatagtc tcagccactt aaaacaaaag tttttttgtt tgtttgtttg tttgtttttt 4560 tgagatggag tctcactctg ttgcccaggc tggagtgcag tggcgtgatc tcggcttact 4620 gcaacctccg cctcccgggt tcaagcgatt ctcctgcctc agcctcccaa gtaactggga 4680 caacaggcgc gtcccaccac acccagctaa ttttttatac ttttagtaga gatggggttt 4740 cagcatattg gccaggctgg tctcgaactc ctgaccttgt gatccacccg cctcggcctc 4800 ccaaagtgct gggattatag gcgtgagccc ctgcacccgg ccaaaagttg atttttaatt 4860 acataaaaat cgtaaaaact tctagtaaaa acttgatttg gtgaatacag ttatatttta 4920 aaaccttaag gtgacaagca ttttctatgc ctaaatcttc attggtttgc ctggaaagag 4980 tctctgttaa aagattttcc atattcaaag taaaaggaaa gatttcttgc ttcctaattg 5040 tcttttggac acatgcctat tttctttgag gtataaacct ttagatgtga aaaatgtaat 5100 ttcattctgc tattgtgtgt gcttgtgtgt gtgtaattga aaaaactggg aaatcctgct 5160 ttgttggtaa taaatcaata tttttatatt c 5191 <210> 6 <211> 4755 <212> DNA <213> human <400> 6 aagagatctt ccaggctctc agagccctgg gagggcgatt tccaggaaga ccacaatgcc 60 aacctctgga ggaggctgga gagagaaggc ctaggccaga gcctgtcagg caactttggc 120 aagaccaagt cagccttctc atctctccag aacattcctg agagtctgag aagacacagc 180 agcctggagc taggccgggg aacccaggag ggttaccccg ggggcaggcc cacctgtgca 240 gtcaacacca aggcagaaga ccctgggagg aaagccgctc ctgacctcgg gagccatctg 300 gaccggcagg tttcctaccc gcggcccgag gggaggaccg gtgcctcggc ttctttcaac 360 agcacagacc caagtcccga agagccgcct gccccctcgc acccgcacac atccagtctg 420 ggccggaggg ggcccggccc aggcagcgcc tcggctcttc agggctttca gtacgggaag 480 ccccactgct cggtgctgga gaaggtctcc aaattcgagc agcgagagca agggagccag 540 agaccgagtg tgggcggctc tggttttggc cataactata ggccccacag gaccgtctca 600 acttccagta cttctgggaa tgacttcgag gagacaaaag cacacattcg tttctctgag 660 tcagctgaac ccctaggcaa cggggagcag cacttcaaaa acggggagct gaagttggaa 720 gaggcttccc ggcagccctg cggtcagcag ctgagcggag gagcgtcgga cagcggccgt 780 ggcccccaga ggccggacgc tcggctcctc cgtagccaga gcaccttcca gctctccagc 840 gagccagaga gggagcccga gtggcgggac aggcccggct cgcccgaatc gcccctgctg 900 gatgccccct tcagccgcgc ctaccggaac agcatcaagg acgcacagtc ccgtgtcttg 960 ggggccacct cctttcgacg tcgagacctg gagctggggg cgcccgtggc gtcgaggtcc 1020 tggcggccac ggccttcctc ggcccacgtg gggctgcgga gccccgaggc gtcggcctcc 1080 gcctccccgc acacgccccg ggagcggcac agcgtgaccc ctgctgaggg cgacctggcc 1140 aggcccgtgc cccctgccgc ccggagaggt gctcgccggc gcctgactcc cgagcagaag 1200 aagcgctcct actcggagcc cgagaagatg aacgaggtgg ggatcgtgga ggaggccgaa 1260 ccggcacccc tgggcccgca gagaaatggg atgcgtttcc cggagagcag cgtggccgac 1320 cggcgccgtc tcttcgagcg cgatggcaag gcctgctcca cgctcagcct gtcggggccc 1380 gagctgaagc agttccagca gagcgccctg gcggactaca tccagcgcaa gaccggcaag 1440 cggcctacct ccgccgccgg ctgcagcctc caggagcccg ggccactgcg tgagcgcgcc 1500 cagagtgcct acctccagcc cggccccgcg gcgctcgaag gctccggcct cgcctcggcc 1560 tccagcttga gctcactgcg ggagcccagc ctgcagcccc gcagggaggc cacgctcctg 1620 ccggccacag ttgcagaaac ccagcaggct ccccgagatc gcagcagctc cttcgccggt 1680 ggccgccgcc tcggggaacg gcgacgcggg gacctgctta gcggagcaaa cggtggaaca 1740 aggggcaccc agagagggga tgagaccccc agggagccat cctcctgggg ggccagggcc 1800 gggaagtcca tgtcggccga ggacctgctg gaacgctcgg acgtccttgc gggccctgtc 1860 catgtgaggt ccaggtcatc tcccgccacc gcagacaagc gccaggatgt gcttttgggg 1920 caagacagtg gctttggtct tgtgaaggat ccatgttatt tggctggtcc tggatctagg 1980 tcactcagtt gttcagaaag aggccaagaa gagatgctgc tgctcttcca ccatctcacc 2040 cctcgttggg gtggttcagg ctgcaaagcc attggtgatt cctccgttcc tagtgaatgt 2100 cctggaaccc tggaccatca gaggcaagcc agtaggacac cctgccccag gccaccactg 2160 gcaggaacgc aagggctggt cacagacacc agggctgcac ccctgacccc aattggcacc 2220 cctctgcctt cagccattcc ctctggctac tgctcacagg acggtcagac agggcgacag 2280 cctctcccgc cctacacccc tgccatgatg cacagaagca atggtcacac cctgacccag 2340 cctcccggtc caagaggctg tgagggcgat ggcccagagc atggggtaga agagggaacg 2400 aggaagaggg tctcgctgcc tcagtggcca cctccttctc gagcaaagtg ggcccacgca 2460 gccagagagg acagccttcc tgaggaatcc tcagcccctg attttgcaaa cctgaagcac 2520 tatcaaaaac agcagagtct tccaagttta tgcagcactt ctgacccaga cacacctctt 2580 ggggccccga gcactccagg gaggatctcc ctccgaatat ctgagtctgt cctgcgggac 2640 tccccgccac ctcatgagga ttatgaagac gaagtgtttg tgagggatcc gcaccccaag 2700 gccacgtcca gccccacatt tgaacctctt cccccacccc cacctcctcc accgagtcag 2760 gaaaccccgg tgtatagcat ggatgacttc cctccacctc ctccccacac tgtatgtgag 2820 gcgcagctgg acagtgagga tcccgagggg ccacgcccca gcttcaacaa actttctaaa 2880 gtgacaattg caagggaaag gcacatgcct ggtgcagccc atgtggtagg tagtcagaca 2940 ctggcttcca gactccaaac ttctatcaag ggttcagagg ctgagtccac accaccctcc 3000 ttcatgagcg ttcacgccca acttgctggg tctcttggtg ggcagccagc acccatccag 3060 actcaaagcc tcagccatga tccagtcagt ggaactcagg gtttagaaaa gaaagtcagt 3120 cctgatcctc agaagagttc agaagacatc agaacagagg ctttggccaa ggaaattgtc 3180 caccaagaca aatctctagc agacattttg gatccagact ccaggctgaa gacaacaatg 3240 gacctgatgg aaggtttgtt tccccgagat gtgaacttgc tgaaggaaaa cagtgtaaag 3300 aggaaggcca tacagagaac tgtcagctct tcaggatgtg aaggcaagag gaatgaagac 3360 aaggaagcag tgagcatgtt ggttaactgc cctgcctact acagtgtgtc tgctcccaag 3420 gctgagctac tgaacaaaat caaagagatg ccagcagaag tgaatgagga agaggaacag 3480 gcagatgtca atgaaaagaa ggctgagctc attggaagtc tcacccacaa gctggagacc 3540 ctccaggagg cgaaggggag cctgctcacg gacatcaagc tcaacaacgc cctgggagaa 3600 gaggtggagg ctctgatcag cgagctctgc aagcccaatg agtttgacaa gtataggatg 3660 ttcatagggg atttggacaa ggtggtcaac ctgctgctct ccctctcggg gcgtctagcc 3720 cgtgttgaga atgtccttag cggccttggt gaagatgcca gtaatgaaga aaggagctct 3780 ctttacgaga aaaggaagat cctggctggt cagcatgagg atgcccggga gctgaaggag 3840 aacctggatc gcagggagcg agtagtgctg ggcatcttgg ccaattacct ttcagaggag 3900 cagctccagg actaccagca cttcgtgaaa atgaagtcca cgctcctcat tgagcaacgg 3960 aagctggatg acaagatcaa gctgggccag gagcaggtca agtgtctgct ggagagcctg 4020 ccctcagatt tcattcccaa ggctggggcc ctggctctgc ccccaaacct cacgagtgag 4080 cccattcctg ctgggggctg tactttcagt ggtattttcc caacattaac ctctccactt 4140 taacctcttc taaaataccc aaccaaaaga tcactgtttc tctcaacact atttaatctg 4200 aaaaatgttt cagtacaaac cactgtttga actatctggg ttattggtgt ttgttcctga 4260 tgaaaggaaa aaaattctct ccaggaggaa gcctttttcc ttcttgccct tcctgattga 4320 tcttctgaga gctcgaatgc tgctggacac gtaccccttt ctattattac tttgtagtag 4380 aaagaaagtt aatgaaactg agaactgatt ggagggtgtt tgatcattta gtttttaaca 4440 ggctgaggca acatggatca gtgtgtgtcc ccctcaggaa tgtatccaca gtggccttcc 4500 ttgctggtgg gcagtgtatc ctgatggcag ggtacaagta ccattaatga agggtctgca 4560 acataaagcc ttaaaaagac acacactaag aaaactgtaa aaccttgaac attgttattt 4620 atatttttta aaatggaaaa gatcactatg tttgttgtgc taaccactta tttgattctg 4680 ttttgtggtg gacatagatg attacgtttg agctttgtat tttgtgaaaa ccttaatgaa 4740 atgaattcca aagat 4755 <210> 7 <211> 2045 <212> DNA <213> human <400> 7 gaaacttgac cccggctcat cctgtctctg gctgtggccc ggcaaagcac tgaaaacccc 60 tctggtctca gagacagtag gggcagtgcc actttctaca acctgccaac ccacacactg 120 gagtaattct gaaaaaaatt attcctaaac tctctaagtg tggacggaga atgagcaagc 180 cccagaagta ttttacaacc agagtgggta atgaggaggg ggcttactgg aatcgtcata 240 tctctgaata ttgaaaacaa caactaaaaa agtggacctt ctcagaaaaa aagggcagca 300 aatgaccaag ggcgcccctt ctggccgtgc ttggcttgag taactgtctc tctttcccca 360 cccccatcac agggctttca gtttggcaaa ggaaaagcag ataaaaacag aacattccat 420 atgtttcttt ctccatcggc caaaaacatt ttgacacaat gtttgtgaaa cacctttgga 480 gaggtgcact tctgaatgct gcctctgccg taaatcctgg ggcaagggat cagcctcttc 540 ccaggaacca tcgccttcta taaaccgtga actcaagcag gcattttttt tttcttaccg 600 aaaggctgct attgtgcaag ggcacataat gggtctgttg ctcttattgg cttccaaatg 660 tgcatggcaa agagagagat gtgggcctag agcagatata ttcagcaagg tgacagcttc 720 ccataacaat tctaacactt cttatcttat gtgagaataa aatatttaag ggttgaacct 780 tattttgcca aatgtatctt ttctgctttt gaattgggca gaagatttta gcaactatat 840 tctacaaatg ttacttataa cacacacaca cacatctgaa atatatgccg aaaattgacg 900 tctttgacct cagggagagc acctgtccag gtctgcctaa aggaaatggc tccagtgggt 960 ctaaacaacc acatcctatc catggatagg tctagtcata acactttaga gagaatgtca 1020 gagcaggagg gaggcaagcc gcctcttctc ggccatcaac tgcagatgat gaaagagcgg 1080 gattcaactt tgttttcttt tcctgtggcc ccagtgaaac ctcctgccct ccctgcacgt 1140 ctgtgtcttc atttctaaaa tgggggtgat gctttcatat tgacctcacc ccatactacc 1200 tcacagatgt gttgtgagga ttaataaaat tatgtctatg gtattttcag tttctggaga 1260 aaaatactta tagacagttt aactattaca tagatatata agtgatctca gtttcttgtt 1320 tgctgtgata ctaatgtgtt gttttaactt attccataaa atgacagttg tgtcctagcc 1380 acatcagaca gctatctaag ctctggacta cccctttgtg cagctgaatc actgcagggt 1440 cgaccatgcc tggtgccaca gccatggttt ccatttctag atgaaaggat ggcctaggac 1500 ataggtctca aagactcttg gatcagaatc aggagattag ggaaaacagg atggatacct 1560 gagcactaac agcagtagac gtagacctct gtcctttacc atctgaggtc ttctggattc 1620 tttgtggggt taattttgat ttgatgtcat ctgtttgccc ttcatcttgc ttgcaagtgt 1680 gcatggttca atccctcaca tccaggaaat gaattttgca attgggccag atgctaattt 1740 gcacgttgat tcaccttctt tgcctttaag cctttttttt cttttttttt ttttttggca 1800 aatgaatgta ccatttcaac tttgatttta atagtgctag ttgatattgg taataatgct 1860 aaccaagaga tcaatgccag atttttctct tggggtaagt tagctgaagt catttaaaga 1920 tggaaaggtg ggaaaattct ttgatatttg atgtcattgt atccacattt gttgtaagac 1980 atattgcata ccaattataa ttatatcaat taaagttgat aaaagcttca aaaaaaaaaa 2040 aaaaa 2045 <210> 8 <211> 2096 <212> DNA <213> human <400> 8 atggagaacg agcctgtagc ccttgaggaa actcagaaga cagatcctgc tatggaacca 60 cggttcaaag tggtggattg ggacaaggac ctggtggact ggcgaaagcc tctcctgtgg 120 caggtgggcc acttgggaga gaagtacgat gagtgggttc accagccggt gaccaggccc 180 atccgcctct tccactcaga cctcattgag ggcctctcta agactgtctg gtacagtgtc 240 cccatcatct gggtgcccct ggtgctgtat ctcagctggt cctactaccg aacctttgcc 300 cagggcaacg tccgactctt cacgtcattt acaacagagt acacggtggc agtgcccaag 360 tccatgttcc ccgggctctt catgctgggg acattcctct ggagcctcat cgagtacctc 420 atccaccgct tcctgttcca catgaagccc cccagcgaca gctattacct catcatgctg 480 cacttcgtca tgcacggcca gcaccacaag gcacccttcg acggctcccg cctggtcttc 540 ccccctgtgc cagcctccct ggtgatcggc gtcttctact tgtgcatgca gctcatcctg 600 cccgaggcag tagggggcac tgtgtttgcg gggggcctcc tgggctacgt cctctatgac 660 atgacccatt actacctgca ctttggctcg ccgcacaagg gctcctacct gtacagcctg 720 aaggcccacc acgtcaagca ccactttgca catcagaagt caggatttgg tatcagcact 780 aaattgtggg attactgttt ccacaccctc actccagaga aaccccacct gaagacgcag 840 tgacaactcc caccccctcc gtcctgccct cagcccggcc ctggcccctt cccgaccccc 900 acccgccatt cagaccccat taagaaggtt ggcttggcca ggcaggatgg gctgtgtccg 960 gccctgcagc ctagtggaag gtgctgaggg ggccctgagg caggaccgcc ctcctgaccc 1020 ctggtaggag ggtcacatcc acttggtgca ggtggccctt ggtgacccac ttcttcctgg 1080 agcgtccctg cctagagctc agcccacagg actgcttcag gccgtggcca caggtagcag 1140 ccgcaagggg aaatgaagaa aactgagccc tcgtggccac ctgtgtcacc cttgtgcctt 1200 agcctcatgg gctgcctagg agctgcctgc acggcacagc tcgctttcac agtcagaagt 1260 gggtctgtgg gatctgtggt ccctgtcctc cctgctgtcc cttctgggga ggctttggtg 1320 gctctgaggt ggacaaagag ctctcgcaag aagagacagc gtgatgcctc ccacagtcca 1380 ccccagaccc tggggcagcc cctctggccc tgccagctgc ctgcgtcgtt gggcccaggg 1440 tggctggcag gagtcccagc tgcttgcttt aggacctggc agcttttctt gccgtccctc 1500 ccctgcctcc agaatcacag cccttctccc caagggaggc tgaggaggct tctccaccag 1560 tggcagcccc accccgtccc tggccattct tggcctccac cccgctcagg cccctactcg 1620 ggcgctccca gaaggagcca cctctcagtg cctcacctcc ccctgcctcc cagcctccgc 1680 agatgaggtt cctgcccctt cctcctcgta accaaaaccc tcactgctcc caggacggtc 1740 ttatttataa accagataca tgttcttagt ctggtcccag accaaggagc tggtcagacg 1800 gccctttcta atcctacatg ttgagcttat gtaaaaaatg ttgtttcctc ctgtttttgg 1860 ttcctttctt acccacaaac cattactact tgaaacttaa aaaactcgcc aagtgtaaag 1920 gctaaagaga agcagtttga cggaccttgt gatttgtact gtttgctgcg gagctattta 1980 aagattttgg aataaatata caaaactacg gttgtgaaat aaaaacttaa attgtatatt 2040 ttgaaaaata aaacactgaa aagaaaccaa caaaaaaaaa aaaaaaaaaa aaaaaa 2096 <210> 9 <211> 5640 <212> DNA <213> human <400> 9 ggaaacgcag aaaacagaga gaggcattct gagtcatctg actggatgaa gactgttcca 60 agttacaacc aaacaaatag ctccatggac tttagaaatt atatgatgag agatgagact 120 ctggaaccac tgcccaaaaa ctgggaaatg gcctacactg acacagggat gatctacttc 180 attgaccaca ataccaagac aaccacctgg ttggatcctc gtctttgtaa gaaagccaaa 240 gcccctgaag actgtgaaga tggagagctt ccttatggct gggagaaaat agaggaccct 300 cagtatggga catactatgt tgatcacctt aaccagaaaa cccagtttga aaatccagtg 360 gaggaagcca aaaggaaaaa gcagttagga caggttgaaa ttgggtcttc aaaaccagat 420 atggaaaaat cacacttcac aagagatcca tcccagctta aaggtgtcct tgttcgagca 480 tcactgaaaa aaagcacaat gggatttggt tttactatta ttggtggaga tagacctgat 540 gagttcctac aagtgaaaaa tgtgctgaaa gatggtcccg cagctcagga tgggaaaatt 600 gcaccaggcg atgttattgt agacatcaat ggcaactgtg tcctcggtca cactcatgca 660 gatgttgtcc agatgtttca attggtacct gtcaatcagt atgtaaacct cactttatgt 720 cgtggttatc cacttcctga tgacagtgaa gatcctgttg tggacattgt tgctgctacc 780 cctgtcatca atggacagtc attaaccaag ggagagactt gcatgaatcc tcaggatttt 840 aagccaggag caatggttct ggagcagaat ggaaaatcgg gacacacttt gactggtgat 900 ggtctcaatg gaccatcaga tgcaagtgag cagagagtat ccatggcatc gtcaggcagc 960 tcccagcctg aactagtgac tatccctttg attaagggcc ctaaagggtt tgggtttgca 1020 attgctgaca gccctactgg acagaaggtg aaaatgatac tggatagtca gtggtgtcaa 1080 ggccttcaga aaggagatat aattaaggaa atataccatc aaaatgtgca gaatttaaca 1140 catctccaag tggtagaggt gctaaagcag tttccagtag gtgctgatgt accattgctt 1200 atcttaagag gaggtcctcc ttcaccaacc aaaactgcca aaatgaaaac agataaaaag 1260 gaaaatgcag gaagtttgga ggccataaat gagcctattc ctcagcctat gccttttcca 1320 ccgagcatta tcaggtcagg atccccaaaa ttggatcctt ctgaggtcta cctgaaatct 1380 aagactttat atgaagataa accaccaaac accaaagatt tggatgtttt tcttcgaaaa 1440 caagagtcag ggtttggctt cagggtgcta ggaggagatg gacctgacca gtctatatat 1500 attggggcta ttattcccct gggagcagct gagaaagatg gtcggctccg cgcagctgat 1560 gaactaatgt gcattgatgg aattcctgtt aaagggaaat cacacaaaca agtcttggac 1620 ctcatgacaa ctgctgctcg aaatggccat gtgttactaa ctgtcagacg gaagatcttc 1680 tatggagaaa aacaacccga ggacgacagc tctcaggcct tcatttcaac acagaatgga 1740 tctccccgcc tgaaccgggc agaggtccca gccaggcctg caccccagga gccctatgat 1800 gttgtcttgc aacgaaaaga aaatgaagga tttggctttg tcatcctcac ctccaaaaac 1860 aaaccacctc caggagttat tcctcataaa attggccgag tcatagaagg aagtccggct 1920 gaccgctgtg gaaaactgaa agttggagat catatctctg cagtgaatgg gcagtccatt 1980 gttgaactgt ctcatgataa cattgttcag ctgatcaaag atgctggtgt caccgtcaca 2040 ctaacggtca ttgctgaaga agagcatcat ggtccaccat caggaacaaa ctcagccagg 2100 caaagcccag ccctgcagca caggcccatg ggacagtcac aggccaacca catacctggg 2160 gacagaagtg ccctagaagg tgaaattgga aaagatgtct ccacttctta cagacattct 2220 tggtcagacc acaagcacct tgcacagcct gacaccgcag taatttcagt tgtaggcagt 2280 cggcacaatc agaaccttgg ttgttatcca gtagagctgg agagaggccc ccggggcttt 2340 ggattcagcc tccgaggggg gaaggagtac aacatggggc tgttcatcct tcgtcttgct 2400 gaagatggtc ctgccatcaa agatggcaga attcatgttg gtgaccagat tgttgaaatc 2460 aatggggaac ctacacaagg aatcacacat actcgagcaa ttgagctcat tcaggctggt 2520 ggaaataaag ttcttcttct tttgaggcca ggaactggct tgatacctga ccatggtttg 2580 gctccttccg gtctgtgctc ctacgtgaaa cccgagcaac attaaggctt tcagggcttt 2640 tcttggtctt tccttaaaaa gacttggtga ttgggatatt aataatcctt cgtcttcaaa 2700 tgtgatttat gatgaacagt caccattacc cccatcttca cattttgctt ccatatttga 2760 agagtctcac gtgccagtaa ttgaagaatc tttgagagtt cagatatgtg aaaaggcaga 2820 agaattaaag gacattgtgc ctgaaaagaa aagcacttta aatgaaaatc agcctgagat 2880 aaagcatcag tctcttctcc agaaaaatgt gagtaagagg gatccaccca gcagtcatgg 2940 gcacagtaac aagaaaaatc tattaaaagt agaaaatggt gttacacgaa gaggtagatc 3000 ggttagtccc aaaaagccag ccagtcaaca ttcagaggaa catttggata agattcctag 3060 tcctctaaaa aataacccca aaagaagacc cagagatcaa tccctcagcc ccagcaaagg 3120 ggaaaataaa agttgtcagg tcagcaccag ggcaggctct ggacaagatc agtgcagaaa 3180 aagcagaggt cggtcggcca gcccaaaaaa gcagcaaaaa attgaaggaa gcaaagctcc 3240 atcaaatgct gaggccaaat tattagaggg taagagtcga agaatagcag gctatacggg 3300 cagtaatgct gagcagatcc cagatgggaa ggaaaaatca gacgtcatca ggaaagatgc 3360 aaagcagaat cagttggaaa aaagcagaac aaggtctcca gagaaaaaaa tcaaaagaat 3420 ggttgagaaa tctcttccat ccaaaatgac taataagact acaagtaaag aagtatctga 3480 aaatgaaaaa ggaaagaaag taaccacagg agaaacaagt tctagtaacg ataaaatagg 3540 agaaaatgtc cagctatcag aaaagaggct gaagcaagaa cctgaagaga aggtagtttc 3600 aaacaaaaca gaagatcaca aagggaaaga actagaggca gctgacaaaa acaaagagac 3660 tggaaggttc aaaccggaaa gcagttctcc agttaagaaa acactgataa ctccagggcc 3720 ctggaaggtt ccaagtggaa ataaagtcac aggcactatt ggtatggctg agaaacggca 3780 gtaaccttta gtataaaaca aagaaaaaca agttgtaatc ttttcttaca gcagcatttt 3840 tccagaaaaa gccttttttt ttttttcaga tattctgaaa cagataagta catgttaatg 3900 tgagcctcaa gttacctagg ctgcatgaag ggcctttagg attgctaaga accaactgtc 3960 cccctggccg gctgccctcc ctcgctctca ggaaggagct gcatccacat gctcatctga 4020 cccgccctgc tcaggctgcc cagctcgtct tcatgagtgt ctgaacaaat gacatatgtt 4080 gatattaaca atgtggtcac aactcacttt gtatttgtgc caagttatct actgtatcat 4140 gtctgttttt atcctttttg ttcagctgtt tccacagtaa tgaaaaagtt aggtttggct 4200 tggaagttga tgatctcaat agcatgttgc atgtttacag agagaaatat gtgagtcctt 4260 gcagaagaag agactgttaa ctcatcgtta aagatggccg ttgtctcttc taacagctac 4320 tgatgatgtc ccactttaaa aataaaaccc ccaaacatca ctactttaag gaaaaaaaaa 4380 atgtagtcca atattgatgc tttcttatgg ctttttattt taatttggct ggataagttg 4440 tttcaaataa ctgttaaaga tattacttac aattgaatgt ttgaaataag aaagtacttt 4500 aagcaataga gttcatctcc tgctgtgtta tccaacctcg atgtatactt acagcatctc 4560 aggtcaccct ttttatttca gttatttaat tatgaaacca taaagaagca tgtggaaata 4620 gtgtttattg ctctttgaag aaaaaccacc aactatttct ggatattttg gctgtaccta 4680 ctactaaagt cattagtctt taatacataa tacatatttg aaaagtaaac atattatata 4740 gattatgtga gggacttaat catgaaacca gtttcacagt ccaagtacca actcttctgg 4800 tagcaggtgc acaagcttgg gtgtttaaaa acaacctgtg tagggtatgc ccagcaaatg 4860 aggacaaatg tgtagacagt acttactgga tcttatttaa cttttagcta cattaactaa 4920 ctttcttatt taaaaacaag aaagggagac taaacatctg cttaacttgt acacattttc 4980 agaattcttt ttaaaagtct agttaaagat gtttcttaga agttggagac tgttaacaac 5040 ttccataaaa tagatccagg tttttcagtt ccctgaagca gcattcagta gcatctatat 5100 aaataaaggc accttctgag aataaaacta ttttatggag tgtgtgaaca cacttgttct 5160 gtcacctggg ttcatcttgt tgtgaagcac attaggtcca ggtccttccc tctgggagtc 5220 tgactgtgaa actctttaac ccaacaactc aattagcccc tgtagataag acatgcttcc 5280 cagagtgaga tttttgaaat ccccttttca tccagaacta tatttaccca cctattgtaa 5340 ctattcaaat agagcaaaat taggaggctt gataaatact aagaatttag taccacagaa 5400 attatttatt attttccctg tagtccacaa ttagtgataa cgaatcctat ttttgttaac 5460 tgtgacataa ctttgatgtc atatgttgtc ctatgtggtt cttcctaagt aaactctgta 5520 ctgattatat actgacttag caatgtggcc ttggaatgct gagcaaaatg tggatgtact 5580 ggttgtaaat gtttatatat tgtacagtac ctttatatat acacttgagg ttctgattag 5640 <210> 10 <211> 457 <212> DNA <213> human <220> <221> misc_feature <222> (242)..(242) <223> any kind of base <220> <221> misc_feature <222> (369)..(369) <223> any kind of base <220> <221> misc_feature <222> (394)..(394) <223> any kind of base <220> <221> misc_feature <222> (406)..(406) <223> any kind of base <220> <221> misc_feature <222> (457)..(457) <223> any kind of base <400> 10 tcagtcactc tttcaccctg ccaaagcttc actgtcctac tgattgaatt gtatgtgaga 60 aataaaatgt catcatatta agccactggg atttgtatgt ttatctgtta tagcagcaag 120 tcttaattta cctaatacac acattgtgac agatgttctt aatgtcccac cccatattgt 180 tacatgtcca gctttgagga tccctggcat gtgggggtag gagtttctgg gcatgctgga 240 tncaattccc acttttaagg catctgtggc ctctgtggcc tctgtggcct tcactgttat 300 ggaagggatt tatctggggc accataggaa actttaccat ggcacagtgg acaacctagg 360 agggggtgng gaggaggggc cttcaggccc aacngggggg accagngttc gtggggttag 420 ggtggtttgg ggggttttcc ctcttacccg tgggggn 457 <210> 11 <211> 1493 <212> DNA <213> human <400> 11 aatagggttg gcggctgcag cgggcggcaa acagcccgcc cggcaccacc atgctcgccc 60 tggaggctgc acagctcgac gggccacact tcagctgtct gtacccagat ggcgtcttct 120 atgacctgga cagctgcaag cattccagct accctgattc agagggggct cctgactccc 180 tgtgggactg gactgtggcc ccacctgtcc cagccacccc ctatgaagcc ttcgacccgg 240 cagcagccgc ttttagccac ccccaggctg cccagctctg ctacgaaccc cccacctaca 300 gccctgcagg gaacctcgaa ctggccccca gcctggaggc cccggggcct ggcctccccg 360 cataccccac ggagaacttc gctagccaga ccctggttcc cccggcatat gccccgtacc 420 ccagccctgt gctatcagag gaggaagact taccgttgga cagccctgcc ctggaggtct 480 cggacagcga gtcggatgag gccctcgtgg ctggccccga ggggaaggga tccgaggcag 540 ggactcgcaa gaagctgcgc ctgtaccagt tcctgctggg gctactgacg cgcggggaca 600 tgcgtgagtg cgtgtggtgg gtggagccag gcgccggcgt cttccagttc tcctccaagc 660 acaaggaact cctggcgcgc cgctggggcc agcagaaggg gaaccgcaag cgcatgacct 720 accagaagct ggcgcgcgcc ctccgaaact acgccaagac cggcgagatc cgcaaggtca 780 agcgcaagct cacctaccag ttcgacagcg cgctgctgcc tgcagtccgc cgggcctgag 840 cacacccgag gctcccacct gcggagccgc tgggggacct cacgtcccag ccaggatccc 900 cctggaagaa aaagggcgtc cccacactct aggtgatagg acttacgcat ccccaccttt 960 tggggtaagg ggagtgctgc cctgccataa tccccaagcc cagcccgggc ctgtctggga 1020 ttccccactt gtgcctgggg tccctctggg atttctttgt catgtacaga ctccctggga 1080 tcctcatgtt ttgggtgaca ggacctatgg accactatac tcggggaggc agggtagcag 1140 tgcttccaga gtcccaagag cttctctggg attttcttgt gatatctgat tccccagtga 1200 ggcctgggac ctttttaaga tcgctgtgtg tctgtaaacc ctgaatctca tctggggtgg 1260 gggccctgct ggcaaccctg agccctgtcc aaggttccct cttgtcagat ctgagatttc 1320 ctagttatgt ctggggccct ctgggagctg ttatcatctc agatctcttc gcccatctat 1380 ggctgtgttg tcacatctgt cccctcattt ttgagatccc ccaattctct ggaactattc 1440 tgctgcccct ttttatgtgt ctggagttcc ccaatcacat ctagggctcc tcc 1493 <210> 12 <211> 2292 <212> DNA <213> human <400> 12 ccatgggttc cccttcagcc tgtccataca gagtgtgcat tccctggcag gggctcctgc 60 tcacagcctc gcttttaacc ttctggaacc tgccaaacag tgcccagacc aatattgatg 120 tcgtgccgtt caatgtcgca gaagggaagg aggtccttct agtagtccat aatgagtccc 180 agaatcttta tggctacaac tggtacaaag gggaaagggt gcatgccaac tatcgaatta 240 taggatatgt aaaaaatata agtcaagaaa atgccccagg gcccgcacac aacggtcgag 300 agacaatata ccccaatgga accctgctga tccagaacgt tacccacaat gacgcaggat 360 tctataccct acacgttata aaagaaaatc ttgtgaatga agaagtaacc agacaattct 420 acgtattctc ggagccaccc aagccctcca tcaccagcaa caacttcaat ccggtggaga 480 acaaagatat tgtggtttta acctgtcaac ctgagactca gaacacaacc tacctgtggt 540 gggtaaacaa tcagagcctc ctggtcagtc ccaggctgct gctctccact gacaacagga 600 ccctcgttct actcagcgcc acaaagaatg acataggacc ctatgaatgt gaaatacaga 660 acccagtggg tgccagccgc agtgacccag tcaccctgaa tgtccgctat gagtcagtac 720 aagcaagttc acctgacctc tcagctggga ccgctgtcag catcatgatt ggagtactgg 780 ctgggatggc tctgatatag cagccttggt gtagtttctg catttcggga agagtgtttt 840 tattatccac ctgcagactg gactggattc ttctagctcc ttcaatccca ttttctcctg 900 tggcatcact aagtataaga cctgctctct tcctgaagac ctataagctg gaggtggaca 960 actcaatgta aatttcaagg aaaaaccctc atgcctgaga tgtgggccac tcagagctaa 1020 ccaaaatgtt caacaccata actagagaca ctcaaattgc caaccaggac aagaagttga 1080 tgacttcatg ctgtggacag tttttcccaa gatgtcccaa gcctcatcgt gacgaggctc 1140 ttatcccact ccatttttcc ctgctcatgc ctgcctcttt aatttggtaa gataatgctg 1200 taactagaat ttcacaatca gcgccttgtg caggcaattt gacagagtgt tggatgtgtc 1260 atgtcatcat gtcaaaccca aatatttgac ctaagggatc ctttattctg cccagtggct 1320 aactttaaca acatccctaa tacaactgtt tattcaaatg cacggtggtc cctgttagag 1380 ttagacctct agactcacct gttctcacgc cctgttttaa tttaacccag ctatgggatg 1440 ccagataaca gaattgctgc ctacgagctg aacagggagg agtttgtgca gttgctgaca 1500 cttcttgttg cacataaata aatacagtgg gtactataga gactcagttg caaaaattaa 1560 caaatatgct gcttgattaa aatgggtagg cttctcatgt ggctcattct ttaatctatt 1620 ctcttttatt tggtttggtt catggggtct ctgcctatgg atcatacttc aaactcttgg 1680 tgtgatcctc ctgattgtca caatattagt taccctggtg tgctgtattc tctaaaacct 1740 ttaaatgttt gcatgcagcc attcgtcaaa tgtcaaatat tctctctttg gctggaatga 1800 caaaaactca aataaatgta tgattaggag gacatcataa cctatgaatg atggaagtcc 1860 aaaatgatgg taactgacag tagtgttaat gccttatgtt tagtcaaact ctcatttagg 1920 tgacagcctg gtgactccag aatggagcca gtcatgctaa atgccatata ctcacactga 1980 aacatgagga agcaggtaga tcccagaaca gacaaaactt tcctaaaaac atgagagtcc 2040 aggctgtctg agtcagcaca gtaagaaagt cctttctgct ttaactctta gaaaaaagta 2100 atatgaagta ttctgaaatt aaccaatcag tttatttaaa tcaatttatt tatattcttc 2160 tgttcctgga ttcccatttt acaaaaccca ctgttctact gttgtattgc ccagtaggag 2220 ctatcactat attttgcaga atggaaactg ccctgactct tgaatcacaa ataaaagcca 2280 attgtatctg tt 2292 <210> 13 <211> 519 <212> DNA <213> human <220> <221> misc_feature <222> (212)..(212) <223> any kind of base <220> <221> misc_feature <222> (451)..(451) <223> any kind of base <400> 13 gaaacaacaa cagtgtaatc tttaacaggg atgttaaagg taagaagtca ggaagataaa 60 ccaaaatgat tgagtatgat aaagaatttt gcatggcgat taaaatagaa aacctataaa 120 tgtagaaaaa gcaggtctgg acttagcaaa gaaacaatat agtttggaga aggcatgaaa 180 taagttcttt tcatgttcac tgctggtcac ancataacag agagtgatgt ggagagcttt 240 gggaaggttt cacgttgagt tacatcagtg gtcaacaatg gagcaacaag actccgtaga 300 ggatgccacc ctgggagaat tgcaagggaa aggaggctga agcacaactg gtaatagcct 360 tcagatattt aatggatatg caaataaagc tctgattaat tgtattttca cttattatat 420 atcatctttg gacctttcta aaagtgggac nctagaaaag atatactgaa actccaaaag 480 aatacttcag ctcgagttga atggattcaa gatgttgtt 519 <210> 14 <211> 5294 <212> DNA <213> human <400> 14 ggctcgcatc cccatagtgc tgggttacag tgaaggtacg ccccgcgctc tgctctggag 60 aggcagggtg ggatagggaa cgtctcgagt ggcgcccgca gtcatggtgg tgttcgttgg 120 ccgccgcctc ccggcgctcc tagggctgtt taagaagaag ggctctgcca aggctgagaa 180 tgacaaacat ctaagtgtag ggcctggcca ggggccaggg tctgcagtgg atgagcacca 240 ggacaacgtc ttctttccca gtgggcgacc cccccacctg gaagagctgc acactcaggc 300 ccaggagggg ctccgctccc tacaacacca agagaaacag aaactgaaca agggtggctg 360 ggaccatgga gacacccaga gtatccagtc ctcccggacg gggccggatg aagacaacat 420 ctccttctgc agtcagacca catcctacgt ggctgagagc tccacagcag aggacgcgct 480 ctccatccgc tcggagatga tccagcgcaa aggctccacc ttccgacccc atgactcatt 540 tcccaaatct ggaaagtcag ggcggcgtcg gcgggagcgg cggagcactg tgctgggact 600 cccgcagcat gtgcagaagg agcttggcct gaggaatgag cgtgaggcac caggcacgcc 660 ccgggctcct ggtgcacggg atgccgtacg catccccaca gtggacggcc gcccccgagg 720 cacctcaggg atgggggccc gggtgtccct gcaggcgctg gaggcggagg cagaggctgg 780 cgctgagaca gaggccatgc tgcagcgcca cattgaccgt gtctaccggg atgacacctt 840 tgttggccgg tccacgggta cccgggcccc accattgacc cggcccatgt ccctagcagt 900 gcctggattg acaggagggg cagggcctgc agagcccctg agcccggcca tgtccatctc 960 cccccaggcc acctacctgt cgaagttgat tccacatgct gtgctgccgc ctacagtgga 1020 cgtggtggcc ctaggccgct gcagcctgcg cacactaagc cgctgcagcc tgcactcggc 1080 cagcccagcc tcagtccgct cgctggggcg cttctcctcc gtctccagcc cacagccccg 1140 cagccgccac ccatcctcct ccagtgacac ctggagccac tctcaatcct ccgacaccat 1200 tgtgtctgac ggttccaccc tctcctctaa gggtggctct gagggccagc cggagagctc 1260 tacggctagc aatagcgtgg taccccctcc ccagggaggc agtgggaggg gctctcccag 1320 tgggggcagc actgctgagg cctcagacac actcagcatt cggagcagtg ggcagttgtc 1380 tggccggagt gtgtccctgc gtaagctgaa gcggcctcca ccccctcccc gccggaccca 1440 ctccctccat cagcggggct tagcagtgcc tgatgggcca ttagggttgc cccctaagcc 1500 tgagcgtaag cagcagcccc agctgcctcg gccacccacc actggtggct cagaaggggc 1560 gggggcagca ccctgtccac ccaacccagc caacagctgg gtacctggct tgtctccggg 1620 tggttcccgg cgccccccac ggtccccaga acggacactt tcgccctcca gtggatactc 1680 gagccaaagt ggtactccca ccctccctcc caagggcctg gcaggtcccc ctgcttcccc 1740 aggcaaggcc cagcccccta aaccagagcg tgtcacgtct cttcgctccc ctggggcctc 1800 cgtctcctct tccctcacgt ctttatgttc ctcctcctct gacccagccc cctcagaccg 1860 ctctgggcca cagatattga cccccctggg tgacaggttt gtcatacctc ctcaccccaa 1920 ggtgcctgcc cccttctccc cacctccctc caagcccagg agccctaacc cagctgcccc 1980 tgctctagcc gcccctgctg tggttcctgg gcctgtttct accactgacg ccagtcctca 2040 gtcccctccc actccccaga caaccttgac tccactgcag gagtctcctg tcatctccaa 2100 agaccagtca cccccacctt ccccaccccc atcttatcat ccacccccac cacccactaa 2160 gaagccagag gtggttgtgg aggcaccatc tgcctcagag actgctgagg agcccctcca 2220 agatcccaac tggccccctc ccccaccccc tgcccctgag gagcaggacc tgtccatggc 2280 tgacttcccc ccaccagagg aggctttttt ctctgtggcc agccctgagc ctgcaggccc 2340 ttcaggctcc ccagagcttg tcagctcccc ggctgcttcg tcctcctcag ctactgcttt 2400 gcagattcag cccccgggta gcccagaccc tcctccagct ccgccagccc cagctcctgc 2460 tagttccgcc ccagggcatg tggccaagct ccctcagaag gaaccggtgg gctgtagcaa 2520 gggtggtggg cctcccaggg aggacgtagg tgcgcccctg gtcacgccct cgctcctgca 2580 gatggtgcgg ctgcgctccg tgggtgctcc aggaggggct cccaccccag cactggggcc 2640 atcggccccc cagaaaccac tgcgaagggc cctgtcaggg cgggccagcc cagtgcctgc 2700 cccctcctca gggctccatg ctgcggtccg actcaaggcc tgcagcctgg ccgccagtga 2760 aggcctctca agtgctcagc ccaacggacc gcctgaggca gagccacggc ctccccagtc 2820 ccctgcctca acggccagtt tcatcttctc caagggctct aggaagctgc agctggagcg 2880 gcccgtgtcc cctgagaccc aggctgacct ccagcggaat ctggtggcag aactccggag 2940 catctcagag cagcggccac cccaggcccc aaagaagtca cctaaggctc ccccacctgt 3000 ggcccgcaag ccgtctgtgg gagtcccccc acccgcctcc cccagttacc ctcgagctga 3060 gccccttact gctcctccca ccaatgggct ccctcacacc caggacagga ctaagaggga 3120 gctggcggag aatggaggtg tcctgcagct ggtgggccca gaggagaaga tgggcctccc 3180 gggctcagac tcacagaaag agctggcctg accaccaggc acctcactgg cactgctgac 3240 ccatcccaga aacacaatct cagggacccg agcagctcca aggacgagag gatacagcag 3300 acacaaccta atagagaggg cgcctgcagc cttaacctcc acggccttcg atacttatgc 3360 aagcctggtg ttgctcctgt cctcagagtc atcctgcgct catgcctttt cccgaatggg 3420 ttcacctctg gcagttgccg cttcagtctt ggccttagcc tcatcttgaa gtgggtagct 3480 ggcgggagag ggtggctgcg ccccctgctg gccctgaggc tgcagagttg ggagcaggac 3540 acctcacctg agtttcattt tttttcatgt ccaaaccatg cacatactat agtccagaat 3600 caaagcactt ttgaaaagtg gctgcatggc catcctccag ggcccaggaa gttgcattcc 3660 aagggcctgt ttacatggca gcagaatcca tccccggcag tcagcccata gcttgggacc 3720 agtctgtgcc ctcctgccca gtccagttta ctcctcttgg ttcctgaagg tggccaagtc 3780 attgtgttcc cacaggcttc tctaggctgg gggcaggtgt ggggctgtgg aattccaaag 3840 cacaaaaggt gcagagggga ttggccttcc tgtgcctcaa ctcaccaacc accctcctgc 3900 cttccagttc tgccaggtgc tccatgctgg ggacaagtag gagactgcca gggcccaaag 3960 aaatgggtga gcagtagagt catctcgggg cacttggcag tgtcaagcac ctgccccttg 4020 cctccttgac cacactgggg tgggtgggcc cccagcactt cagaggcagg agcctttggg 4080 ctgagcaagc actgaggagg tggatggaag ggagcatctg gaggggggga gcttccttga 4140 gcagtgggcc caggcctggc cctccacact tcattctctg acctttctct ctcctcattt 4200 cggtgcatgt cctttctgca gctgcctttc agcacaggtg gttccactgg gggcagctaa 4260 cgctgagtga caaggatggg aagccacagg tgcattttac tcaagtcttc tctagtcaat 4320 gaggggcacc cagtgcttct agggcaggct gggtggtggt cccctaggta tcagcctctc 4380 ttactgtact ctccgggaat gttaaccttt ctattttcag cctgtgccac ctgtctaggc 4440 aagctggctt ccccattggc ccctgtgggt ccacagcagc gtggctgccc cccagggcca 4500 ccgcttcttt cttgatcctc tttccttaac agtgacttgg gcttgagtct ggcaaggaac 4560 cttgctttta gcttcaccac caaggagaga ggttgacatg acctccccgc cccctcacca 4620 aggctgggaa cagaggggat gtggtgagag ccaggttcct ctggccctct ccagggtgtt 4680 ttccactagt cactactgtc ttctccttgt agctaatcaa tcaatattct tcccttgcct 4740 gtgggcagtg gagagtgctg ctgggtgtac gctgcacctg cccactgagt tggggaaaga 4800 ggataatcag tgagcactgt tctgctcaga gctcctgatc taccccaccc cctaggatcc 4860 aggactgggt caaagctgca tgaaaccagg ccctggcagc aacctgggaa tggctggagg 4920 tgggagagaa cctgacttct ctttccctct ccctcctcca acattactgg aactctatcc 4980 tgttaggatc ttctgagctt gtttccctgc tgggtgggac agaggacaaa ggagaaggga 5040 gggtctagaa gaggcagccc ttctttgtcc tctggggtaa atgagcttga cctagagtaa 5100 atggagagac caaaagcctc tgatttttaa tttccataaa atgttagaag tatatatata 5160 catatatata tttctttaaa tttttgagtc tttgatatgt ctaaaaatcc attccctctg 5220 ccctgaagcc tgagtgagac acatgaagaa aactgtgttt catttaaaga tgttaattaa 5280 atgattgaaa cttg 5294 <210> 15 <211> 988 <212> DNA <213> human <400> 15 gtcgtgaggc gggccttcgg gctggctcgc cgtcggctgc cggggggttg gcctgggtgt 60 cattggctct gggaagcggc agcagaggca gggaccactc ggggtctggt gtcggcacag 120 ccatggcggg cgcgttggtg cggaaagcgg cggactatgt ccgaagcaag gatttccggg 180 actacctcat gagtacgcac ttctggggcc cagtagccaa ctggggtctt cccattgctg 240 ccatcaatga tatgaaaaag tctccagaga ttatcagtgg gcggatgaca tttgccctct 300 gttgctattc tttgacattc atgagatttg cctacaaggt acagcctcgg aactggcttc 360 tgtttgcatg ccacgcaaca aatgaagtag cccagctcat ccagggaggg cggcttatca 420 aacacgagat gactaaaacg gcatctgcat aacaatggga aaaggaagaa caaggtcttg 480 aagggacagc attgccagct gctgctgagt cacagatttc attataaata gcctccctaa 540 ggaaaataca ctgaatgcta tttttactaa ccattctatt tttatagaaa tagctgagag 600 tttctaaacc aactctctgc tgccttacaa gtattaaata ttttacttct ttccataaag 660 agtagctcaa aatatgcaat taatttaata atttctgatg atgttttatc tgcagtaata 720 tgtatatcat ctattagaat ttacttaatg aaaaactgaa gagaacaaaa tttgtaacca 780 ctagcactta agtactcctg attcttaaca ttgtctttaa tgaccacaag acaaccaaca 840 gctggccacg tacttaaaat tttgtcccca ctgtttaaaa atgttacctg tgtatttcca 900 tgcagtgtat atattgagat gctgtaactt aatggcaata aatgatttaa atatttgtta 960 aaaaaaaaaa aaaaaaaaaa aaaaaaaa 988 <210> 16 <211> 4908 <212> DNA <213> human <400> 16 ggataacctc gcagggtggg ccggagggcg ggcgccgccg ctgcctgtgc tgcggcgatg 60 gcccagtgtg tacaatcagt gcaggagcta atcccggact ccttcgtccc ctgtgtcgct 120 gcgctgtgca gcgacgaagc cgagcggctc actcgtctca atcacctcag cttcgcggag 180 ctgcttaagc ccttctcccg cctcacttcc gaggttcaca tgagagatcc taataatcaa 240 cttcacgtaa ttaaaaattt gaagatagca gtaagcaaca ttgtcaccca gccacctcag 300 cctggagcca tccggaagct tttgaatgat gttgtttctg gcagtcagcc tgcagaagga 360 ttagtagcta atgtgattac agcaggagat tatgacctta acatcagtgc cactactcca 420 tggtttgagt cttacagaga aacctttctt cagtcgatgc cagcatcgga tcatgaattt 480 ctgaaccact atttagcatg tatgttggta gcgtcatcta gtgaagctga acctgtggaa 540 cagttttcaa agttgtcaca agaacagcat cgaattcagc acaacagtga ttattcctac 600 cccaagtggt ttataccaaa tacacttaaa tactatgtac ttttacatga tgtaagtgca 660 ggagatgaac agagagctga atcaatttat gaagaaatga aacagaaata tggaactcag 720 ggttgctatt tacttaaaat taattctcga acatctaatc gagcatcaga tgaacagata 780 ccagatcctt ggagtcagta tctccagaaa aatagtattc aaaaccagga atcatatgaa 840 gatggccctt gtactataac ttcaaataag aattctgata ataacttgct ttcattggat 900 ggattagata acgaagtcaa agatggctta ccaaataact ttagagctca cccacttcag 960 ttggagcaat ccagtgaccc ttctaacagt attgatggcc cagatcatct aagatctgct 1020 tcatcgttac atgaaacaaa gaaaggaaat actggaataa ttcatggtgc atgtttaaca 1080 cttactgatc atgatagaat tcgacagttt atacaagagt tcacatttcg gggccttttg 1140 ccacatatag agaaaacaat taggcaatta aacgatcagc taatatcaag aaaaggtttg 1200 agtcgatctc tattttctgc aactaaaaaa tggtttagtg gcagtaaagt tccagaaaag 1260 agcattaatg acctgaaaaa tacatctggc ttgctgtatc ctccggaagc accagaactt 1320 caaatcagga aaatggctga cttatgtttt ttggtgcagc attatgattt ggcttacagt 1380 tgctatcata ctgcaaagaa agattttctt aatgatcaag caatgcttta tgcagctggt 1440 gccttggaaa tggcagcagt gtctgctttt cttcaaccag gagcacctag gccatatcct 1500 gctcattaca tggatacagc aattcagaca tacagagata tctgcaagaa tatggtgttg 1560 gctgaaagat gtgtgttgct tagtgctgaa cttttaaaaa gccaaagcaa atattcagag 1620 gctgcagctc tcctaatacg gttgaccagt gaggattctg atcttcgaag tgcacttctt 1680 ttggaacagg cagcacattg ctttataaac atgaaaagtc ccatggttag aaaatatgca 1740 tttcatatga tattggcagg ccatcgattt agtaaagcag ggcagaaaaa gcatgcttta 1800 cgctgttatt gtcaagccat gcaagtttac aaaggaaaag gctggtctct tgcagaggat 1860 cacattaatt tcactattgg gcgccagtcc tatactctta gacagctgga taatgctgtg 1920 tctgctttta ggcatattct aattaatgaa agtaaacaat ctgctgctca acagggggct 1980 ttcctcagag aatatcttta tgtttacaag aatgtaagtc agctgtcacc agatggtcct 2040 ttgccacagc ttcctttacc gtatattaac agttcagcaa cacgggtttt ttttggccat 2100 gacagacgac cagcggatgg tgaaaaacaa gcagctactc atgtaagtct tgatcaagaa 2160 tatgattctg aatcctctca gcagtggcga gaacttgagg aacaagttgt ttctgtggtt 2220 aacaaaggag taattccatc caattttcat cccacacaat actgtttgaa cagttactca 2280 gataattcaa gatttccact tgcagttgta gaagaaccaa ttacagtgga agtggctttt 2340 agaaaccctt tgaaagttct acttttgttg actgatttgt cattgctttg gaagtttcat 2400 cctaaagatt tcagtggaaa ggataatgaa gaagttaaac aactagttac aagtgaacct 2460 gaaatgattg gagctgaagt tatttcagag ttcttaatta atggcgaaga atcaaaagtg 2520 gcaagactaa agctctttcc ccatcacata ggggagctgc atattctggg agttgtttat 2580 aatcttggca ctattcaggg ctctatgaca gtagatggca ttggtgctct tcccggatgt 2640 cacacaggaa aatattcctt gagtatgtca gtccgaggga agcaggattt agaaattcaa 2700 ggtcctcgac ttaacaacac aaaagaagag aaaacatctg ttaaatatgg ccctgatcga 2760 cgtttagatc ccataatcac agaagaaatg ccactgttgg aggtgttctt tatacatttt 2820 cctacagggc ttctctgtgg agaaatccga aaagcatatg tagaatttgt caatgtcagc 2880 aaatgtccac ttactggatt gaaggttgtt tctaaacgtc cagagttctt tactttcggt 2940 ggtaatactg ctgttctaac accactaagt ccctcagctt ctgagaattg tagtgcttac 3000 aagactgttg tgacagatgc tacctctgtg tgtacagcac tcatatcatc agcttcttct 3060 gtagactttg gcattggcac aggaagtcaa ccagaggtga ttcctgttcc ccttcctgac 3120 actgttcttc tacccggagc ctcagtgcag ctgccaatgt ggttacgtgg gcctgatgaa 3180 gaaggtgtcc atgaaattaa ctttttgttt tactatgaaa gtgtcaaaaa gcagccaaaa 3240 atacggcaca gaatattaag acacactgca attatttgta ccagtcggtc tttaaatgta 3300 cgggccactg tctgcagaag taattctctt gaaaatgaag aaggcagagg aggcaatatg 3360 ctagtctttg tggatgtgga aaataccaat actagtgaag caggcgttaa ggaattccac 3420 atagtgcaag tatcaagtag tagcaaacac tggaagttac agaaatctgt aaatctttct 3480 gaaaacaaag atgccaaact tgccagtagg gagaagggaa agttttgctt taaggcaata 3540 agatgtgaga aagaagaagc ggccacacag tcctctgaaa aatatacctt tgcagatatc 3600 atctttggaa atgaacagat aataagttca gcaagcccat gtgcagactt cttttatcga 3660 agtttatctt ctgaattgaa aaaaccacaa gctcacttgc ctgtgcatac agaaaaacag 3720 tcaacagagg atgctgtgag attgattcaa aaatgcagtg aggtagattt gaatattgtc 3780 atattatgga aggcatacgt tgtggaagac agtaaacagc ttattttgga aggtcaacat 3840 catgttattc ttcgcactat aggaaaagaa gccttttcat atcctcagaa acaggagcca 3900 ccagaaatgg aactattgaa atttttcagg ccagaaaaca ttacagtttc ctcaaggcca 3960 tcagtagagc agctttctag tctcattaaa acgagtcttc actacccaga atcatttaat 4020 catccatttc atcaaaaaag cctttgttta gtaccagtca ctcttttact ttccaattgt 4080 tctaaggctg atgtagatgt catagttgat cttcggcata aaacaacaag tccagaagca 4140 ctggaaatcc atggatcatt cacatggctt ggacaaacac agtataaact tcaacttaaa 4200 agccaggaga ttcacagtct gcagctgaaa gcatgctttg ttcatacagg tgtttataac 4260 cttggaactc ctagggtatt tgccaagtta tcggaccaag ttacagtgtt tgaaacaagt 4320 cagcagaatt ccatgcctgc cctgatcatc atcagtaatg tgtgacaact tggaaatttg 4380 tactgaaatc cacaataatc agtttttgct ggatgggttt tacagcagta tttgatatac 4440 ctaacttgtt atggaggttg attgatatct gatccctgca aaatactttg acttgtcatt 4500 ttgttgatga tgcaaagcac gttggactga gaatacttaa cattcttttt ctgtatttct 4560 ttaaaccctg agaataattt acatgctcat aatacaggat atcagcatat ttgtgcacct 4620 tattaagccc catcttaaga aaacacaaag tctaagtctg ctgttacaac ttgtcaatgg 4680 tatacgaata ttaggagatg attctgagaa aggaaaggcc ttgttggcag tactcctgtt 4740 aagccattag tctctaaatt ccagctttac tgtgaagttc tatagagtgt taaatacaaa 4800 ttttcctgtc ttgcttcaca cagttcctta aaatcagttt tgaactttgg tcatagagtc 4860 ttcatatttc agtatttggt ggtccctatg acttatacat aactttgt 4908 <210> 17 <211> 435 <212> DNA <213> human <220> <221> misc_feature <222> (30)..(30) <223> any kind of base <220> <221> misc_feature <222> (49)..(49) <223> any kind of base <220> <221> misc_feature <222> (75)..(75) <223> any kind of base <220> <221> misc_feature <222> (76)..(76) <223> any kind of base <220> <221> misc_feature <222> (78)..(78) <223> any kind of base <220> <221> misc_feature <222> (79)..(79) <223> any kind of base <220> <221> misc_feature <222> (109)..(109) <223> any kind of base <220> <221> misc_feature <222> (136)..(136) <223> any kind of base <220> <221> misc_feature <222> (137)..(137) <223> any kind of base <220> <221> misc_feature <222> (149)..(149) <223> any kind of base <220> <221> misc_feature <222> (227)..(227) <223> any kind of base <220> <221> misc_feature <222> (236)..(236) <223> any kind of base <220> <221> misc_feature <222> (246)..(246) <223> any kind of base <220> <221> misc_feature <222> (342)..(342) <223> any kind of base <220> <221> misc_feature <222> (363)..(363) <223> any kind of base <220> <221> misc_feature <222> (389)..(389) <223> any kind of base <220> <221> misc_feature <222> (426)..(426) <223> any kind of base <400> 17 ggtagaaatg attgtgatgt acaaattttn tattttgatc atacttaana agacagagca 60 gactcacatt cattnncnna atagtatcac tgtacacata gcgaatttnt ggcgctttta 120 gattgctctg aaaatnnctg aagagttgnc catagcagcc tggtaagcct tttcctttcc 180 cccaaagctc tcctgccctt tgcagaaaga ctgttggtga caactgntgc taactnaata 240 gcatgnggtt gaacttcgcc aaaatccttc cacctcctcc catagggcaa caggggtgac 300 ttgggcttaa agggcattga gtaagcaagt aggttatcag anaacagagg gaagattcca 360 ttntagataa tttccaaata ttacaattng tggaactcag agttcaactg ctcagttcct 420 tcttcngctg accct 435 <210> 18 <211> 2224 <212> DNA <213> human <400> 18 ctttagatct gtgcagcctt tgcgtgccaa acttgtgaaa ttccttttac cttttttgga 60 gtacttgcta taaagccacc tgtcaacaaa cccccattat gtacagaata ggacctatcc 120 agtagccagg ccagtaggca gttggggaag gtgggaagga tccagcgagg cccctgagcc 180 tgcacctgga caggtgtacg tctgcaccca tcaccctcag caccaggcca ccctgcagtc 240 cacttactgt actgtgttgt ggaaggatat gctaagtgat gaaagttgcg agcagtctca 300 ctggtcgtgt aaactttttt ttttttttgg aaattgaagc tgtagagtgc tgcccgaaat 360 ctctaggaag ttggtggcaa gggacagcac tcacactctt ctggtcatga tctctgatct 420 ccacctcaaa tgacaataaa aaactggtcc aacgaagaca ctgctcagca cttcagccat 480 caggactaat ccatcgatga ctggaaaaga ggctagcttt gaggaaaaca gcctgggctc 540 ttgggagcag agtccagtgg gtgtgaggct gacttgccga cggtcggcag gtaatggctc 600 tcagccggcg aggcggtccc acagctctcc tcccagggca gcctgaggag gaggaggccg 660 ggtgcctgtt tggtggcagc ttcagcctag ggatacctga agctgttgag caacaccttt 720 atgaaatgtt gccagagcag caacacttcc ctgtgggcac agccccggga aatccggtac 780 caagtgagca aggtggcagg acccacccaa gcctgatacg catctgggcc cgccgggctc 840 agcaggggag gctgctacgg ctgcccactt cccagcaccg tctgtcaggc ttgaacccct 900 ctgtgctgtt cccttcctgg ctaataggga gacccttcgc aggcacccac tgtttcaact 960 tgaccctccc accccctgct actctcctcc acacacccct ccgttccgct agcctaccct 1020 gtcagccttt caataaaagt tatgcacaaa tgtgaacacc tgagatggag ctgaacattt 1080 cttcactttg ttctttttct gaagtcaaac tcttatcaaa tgccctaaaa ttattaccac 1140 ccaagagaaa caggaaaaag gttacatgtt tttgtttact gagagtaaga tcacctgcat 1200 ctggaagacg ggctggtaaa ttggtttggc tacagaacag aaagaaaaca aaaacaaacc 1260 tcgtaaggga agtatcgcac tcagacacca ccacttccta gagccaaatg agcaatccca 1320 aactgcaagt gccgtaagtg ggcctgtgac gtcacaccgc ccggcccgag gtatcgcatg 1380 tgcgggggag gcccacacta cagctgtcct ctcgtctaga aggcaccacc tcgctttcat 1440 gtcccgtgtg ttttggaaaa gcagtatggt gtgtcatgtc tagcggcgaa cacttccctc 1500 cctctgtcct tgaggttgta atataaaaac tgtgtttctg tacgtgtggg tgggaattct 1560 ctgacggtgc tcgttcatag cacaagctta cgctgagttc tgaactgtcg ttcacagctg 1620 cgtgtctgca tggtgtcgca tctgttgtac ctttggggaa aatttgtatg taaatgtaca 1680 gaaataaaaa cgttgcccca ttaacagatt tcctctggaa tgtcttccct acctcacctg 1740 atggtatcca ccgaagggca tttcactacc attaatggtg agtaataaaa tcctccgtgt 1800 tcattcagac ctcactgcgt cactactttg aacgcctctg taagctgtgt cttcacccgc 1860 cccgaggtgg gtggagggag gcctctcact ctgcttcgag tcctggtctt aaaggtagtc 1920 agaggcagag gctggattaa acacacactg tttaccaagt gccactctca gaccacctga 1980 gagacggggg gccatcagta aaattaagag gaattttttt cccttgttcg tgtatgttct 2040 gctgatccgt ggcctgaagg ttcctagaga cgtcaagaaa tgaatatctt acactgtgat 2100 tctgtgagga aagactggta acccaaaact ctcttctcta atgtattttt taacgaaaat 2160 gacaatattt ctttaataaa gtatttatac caaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220 aaaa 2224 <210> 19 <211> 2244 <212> DNA <213> human <400> 19 gttgtttaaa agcaaggcat gcttgtggat gactctgtaa cagactaatt ggaattgttg 60 aagctgctcc ctggttccac tctggagagt aatctgggac atcttagtgt tttgttttgt 120 ttttttccct cctctttttt tgggggggag tgtgtgtggg gtttgttttt tagtcttgtt 180 tttttaattc attaaccagt ggttagcctt aaggggagga ggacggattg attccacatt 240 ccacttccta gatctagttt agaaaacatg ttccccatct ggtgctctta ggaaggagta 300 tagtaaatgc ctcatttaat aacatactcc tttttgaaag ttgccttttc tctccaccct 360 tgagtagatc cagtatttga tgaaactcat gaaagtgggt ggagcccatc ttccccctcc 420 tcttttctag gacgcactat atgtgactgt gactttaagg acatttgttt gccatttgct 480 gatttttttg ggaagttaat ttctaacttc tttcactgat aaatgaagaa aagtattgca 540 cctttgaaat gcaccaaatg aattgagttt gtaattaaaa aaattttttt tccctttcag 600 tcattgtctt atatgcttag catagatttg cagctcagta gtatatgtgt tcctagaatg 660 cagctgaaga cctgttatgt agaggaaata cgaggggtgg tgctagaaga cagacatctg 720 tggaatgatt cacatcctct caagttagga ggatggaggc ctgcttcatt aagaagctgg 780 gggtagggtg ggggtgggga gaacacttaa caacatgggg accagtcagg ggaatcccct 840 tatttctgtt ttgcatatga ggaaccctag agcagccagg tgaggctctc tagtttaata 900 aaaatcatgg aaagactctt aatgcagact cttcttaagt gttaataggg attttttcag 960 cttattttgg ttgcagtttc caatttttaa aaatgttgag gtaatctttc ccaccttccc 1020 aaacctaatt cttgtagatg cattagtgtt gaaccaatgc ttctcatgtc tcaatcttgt 1080 atatcatctt ttcagatgta ttaacaaaca aaaccttaaa aagagtagat gaattgccaa 1140 acacaattcc taccaataat aaatcgatca actctatcta ttcaggaaag caggaagcat 1200 ttggaccaca gtgcatgaaa acttcaacat tctgttatta gataatgaat caaccaaatg 1260 aacaatccag agaaaagaaa attgcaataa taaaaggtaa attaacagaa agataatata 1320 agcaagatag taatagttga ccattctgaa aagcttataa catcactcat catccagcat 1380 cctttctgaa aacaaaggat ttttaaatca ctttatgcac atatacaaca taggaggttg 1440 gcaaaataat gcactatttc ttaacagcca tgtctcttgt agaacttcaa gttaatctac 1500 aaatgaccat tgtgtcttaa tttagattat gaataccaca ttagtcaggt atttgcacta 1560 acccttaata gtatatacag tttctatgga aaattcagtg gtccaaaaat ttccgtagaa 1620 tttgagagga cgttggtggg ctgaagatag ctccttgagg gtcactgatg taggctgcaa 1680 tgggggttca caaggccctg acaccgtatt tatagtctaa cctttttatg aaaatctgac 1740 tacagctatt taaggagtag tcttaatagc tgaaaatgaa gatagagaaa gacaccaaga 1800 atatgacaca gtttacattc tagtgaggga cacaacaaaa tcaaatttaa aaaagagtgt 1860 aatagatgct gataaatact gtagataaag cacataagaa aatagaaata aaggctgtca 1920 atggagaagt catgattttt attttattta tttatttatt tatttgagac agagtcaggc 1980 tctgtgcagg ctggagtgca atggtgtgat ctcgctcact acaacctctg ctcctggctc 2040 aagctatcct cccacctcag ctctcaagta gctgggatca caggtgcgtg ctaccatgcc 2100 cggctaattt tttgtagaga tgaggttttg ccatgttgcc caggctggtc tcgaactcct 2160 ggactcaact gaccccacct cggcctctca aagtgctgag attataggcg tgcagccggc 2220 agctggccat tgtttatgtt ctgc 2244 <210> 20 <211> 351 <212> DNA <213> human <220> <221> misc_feature <222> (62)..(62) <223> any kind of base <220> <221> misc_feature <222> (121)..(121) <223> any kind of base <220> <221> misc_feature <222> (207)..(207) <223> any kind of base <220> <221> misc_feature <222> (220)..(220) <223> any kind of base <220> <221> misc_feature <222> (276)..(276) <223> any kind of base <220> <221> misc_feature <222> (300)..(300) <223> any kind of base <220> <221> misc_feature <222> (315)..(315) <223> any kind of base <220> <221> misc_feature <222> (336)..(336) <223> any kind of base <400> 20 tctacttcca catcggcgag accgagaagc gctgtttcat cgaggaaatc cccgacgaga 60 cnatggtcat cggcaactat cgtacccaga tgtgggataa gcagaaggag gtcttcctgc 120 nctcgacccc tggcctgggc atgcacgtgg aagtgaagga ccccgacggc aaggtggtgc 180 tgtcctggca gtacggctcg gagggcnctt tcacgttcan ctcccacacg cccggtgacc 240 atcaaatctg tctgcactcc aattcttacc aggatngctc tctttcgctg gtgggcaaan 300 tgcgtgttgc atctngacat ccaggtttgg gggagnatgc caacaaatta c 351 <210> 21 <211> 2631 <212> DNA <213> human <400> 21 accttccaac ccagccctcg gctgagccgc gccgcaccat gcccgccgtg gacaagctcc 60 tgctagagga ggcgttgcag gacagccccc agactcgctc tttactgagc gtgtttgaag 120 aagatgctgg caccctcaca gactatacca accagctgct ccaggcaatg cagcgcgtct 180 atggagccca gaatgagatg tgcctggcca cacaacagct ttctaagcaa ctgctggcat 240 atgaaaaaca gaactttgct cttggcaaag gtgatgaaga agtaatttca acactccact 300 atttttccaa agtggtggat gagcttaatc ttctccatac agagctggct aaacagttgg 360 cagacacaat ggttctacct atcatacaat tccgagaaaa ggatctcaca gaagtaagca 420 ctttaaagga tctatttgga ctcgctagca atgagcatga cctctcaatg gcaaaataca 480 gcaggctgcc taagaaaaag gagaatgaga aggtgaagac cgaagtcgga aaagaggtgg 540 ccgcggcccg gcggaagcag cacctctcct cccttcagta ctactgtgcc ctcaacgcgc 600 tgcagtacag aaagcaaatg gccatgatgg agcccatgat aggctttgcc catggacaga 660 ttaacttttt taagaaggga gcagagatgt tttccaaacg tatggacagc tttttatcct 720 ccgttgcaga catggttcaa agcattcagg tagaactgga accgaggcgg aaaagatgcg 780 ggtgtcccag caagaattac tttctgttga tgaatctgtt tacactccag actctgatgt 840 ggccgcacca cagatcaaca ggaacctcat ccagaaggct ggttacctta atcttagaaa 900 caaaacaggg ctggtcaccg ccacctggga gaggctttat ttcttcaccc aaggcgggaa 960 tctcatgtgt cagcccaggg gagccgtggc tggaggtttg atccaggacc tggacaactg 1020 ctcagtgatg gccgtggatt gcgaagaccg gcgctactgc tttcagatca ccacgcccaa 1080 tggaaaatcg ggaataatcc tccaggctga gagcagaaag gaaaatgaag agtggatatg 1140 tgcaataaac aacatctcca gacagatcta cctgaccgac aaccctgagg cagtcgcgat 1200 caagttgaat cagaccgctc tgcaagcagt gactcctatt acaagttttg gaaaaaaaca 1260 agaaagctca tgccccagcc agaacctgaa aaattcagag atggaaaatg aaaatgacaa 1320 gattgttccc aaagcaacag ccagtctacc tgaagcagag gagctgatcg cgcctggagc 1380 gccgattcaa ttcgatattg tgcttcctgc tacagaattc cttgatcaga acagagggag 1440 caggcgtacc aacccttttg gtgaaactga ggatgaatca tttccagaag cagaagattc 1500 tcttttgcag cagatgttta tagttcggtt tttgggatca atggcagtta aaacagacag 1560 cactactgaa gtgatttatg aagcgatgag acaagtattg gctgctcggg ctattcataa 1620 catcttccgc atgacagaat cccatctgat ggtcaccagc caatctttga ggttgataga 1680 tccacagact caagtatcaa gggccaattt tgaacttacc agtgtcacac aatttgctgc 1740 tcatcaagaa aacaagagac tggttggttt tgtcatccgt gttcctgaat ccactggaga 1800 agaatctctg agtacataca tttttgaaag caactcagaa ggcgaaaaga tatgttatgc 1860 tattaatttg ggaaaagaaa ttattgaggt tcagaaggat ccagaagcac tggctcaatt 1920 aatgctgtcc ataccactaa ccaatgatgg aaaatatgta ctgttaaacg atcaaccaga 1980 tgacgatgat ggaaatccaa atgaacatag aggcgcagaa tccgaagcat aactcacttg 2040 cgcctgtggg ggaagagcga acaggaagga gagctacctc ctaagggttt taacgtctct 2100 gacatacagg cacactgacc tgatttccga aggctgacaa tcgtttgtgg aatgtaatct 2160 tgatgccttg atactgagac ttgggaggga aactaagaaa tggttgacag cgttcccacc 2220 catctacaat gttattttag gtgctttgtg gtaagtcttt tttcttagat tgcgctaaaa 2280 tttcttagat tgttcagcgc tcagaacaaa agtttgaaaa atgcattgtt catatgaatg 2340 tcatctcttt tcagtttcca gtatcctttt taaaaaatgg caaaagccta gatttacaat 2400 ttgatgaaca ctaaatattt cttattaata taatctattt ttgtatttta cttaatgagc 2460 tttaagtgcc tgtcgttctg aaaattgtgt atttataatt cagcttatct cataattgga 2520 cctaatagca tttctttgtg cagttaggtg atgagcactg ctttgaggcc caagcactag 2580 tagagatgcg cgatacaggt ctagtttcgg taactgttcc agacatcaag c 2631 <210> 22 <211> 2851 <212> DNA <213> human <400> 22 agcatctcag gccatcatcc tgaaacttgg cagccttcgt ggagtataag gacagcatta 60 ttagccatca ttgggtttac tgccaacaaa aggagaggga gccataggtt ctctagatta 120 cactcctgag gaaagaagag cacttgccaa aaaatcacaa gatttctgtt gtgaaggatg 180 tggctctgcc atgaaggatg tcctgttgcc tttaaaatct ggaagcgatt caagccaagc 240 tgaccaagaa gccaaagaac tggctaggca aataagcttt aaggcagaag tcaattcatc 300 tggaaagact atctctgagt cagacttaaa ccactctttt tcactaactg atttacaaga 360 tgatatacct acaacattcc agggtgctac ggccagtaca tcgtacggac tccagaattc 420 ctcagcagca tcctttcatc aacctaccca acctgtagct aagaatacct ccatgagccc 480 tcgacagcgc cgggcccagc agcagagtca gagaaggttg tctacttcac cagatgtaat 540 ccagggccac cagccaagag acaaccacac tgatcatggt gggtcagctg tactgattgt 600 catcctgact ttggcattgg cagctcttat attccgacga atatatctgg caaacgaata 660 catatttgac tttgagttat aatatggttt tgtgacttat gagctgtgac tcaactgctt 720 cattaaacat tctgcattgg gtataatcta agaattgttt acaaaaagat tattttgtat 780 ttacccttca ttcctttttt tgatccttgt aagtttagta taaatatatc tagacattca 840 gactgtgtct agcagttacg tcctgcttaa agggactaga agtcaaagtt ccttgtctca 900 ctatttgatc tgctttgcag ggaaataact tgttttttct catgtttcat cttcttttta 960 tgtaaatttg taatactttc ctatattgcc ctttgaaatt tttggataaa agatgatgtt 1020 ttaagttcca atgagtatta ctagttactc aataccactt attgagtact ctgtttctac 1080 gtatgtagaa tgtataggga tagaagagtt gaaaagggaa agcaaaactt cttaagtggc 1140 ttccttaaaa tgtcattcat aggagatgta ctggaattgc tcattctgtg actttatttg 1200 tgtcctaaac attcttcagt gaaaataatt ttatttcagt caaacattta tgaggaaatg 1260 agatcacatc tttgtcactg gatgctactt gaagagggag tactttgtaa ccactttgat 1320 atgctgttat caccaccccc tgccctctgc tgccataatc acacaaattt aaaaagaaag 1380 aaaacagtct tccatagatt tttaaggaag aaagggccca agtcaggaga tcgcttggtt 1440 ttcttccaga agttaaatgg ggggatctga agatttgaat gttcggtctg ctttgaaatg 1500 tatgtctttt gggaatgtat tatatgccta gctttataat caggtataaa attttaatta 1560 ttcccaggaa tatgcataat attgaatatt tcatgtccta ttttaataga aaacctcagg 1620 gcccaagtaa ccagtgatag aagttagaaa aaccccttta cttagaattg tccacctagt 1680 cagagcccaa gaaagaattt tcagtggaaa aatcaatata taacttagtg ctagctagcg 1740 ccacagactc tagtagataa tattatcatc ataatggctg gtgaaaccat ataatcacag 1800 aaaaacattg ccttcagcat gttcagttcg cagcactgag ggcactcttg agggtgttgt 1860 taatgaagat ttaattttta aatacaggtg gttccaagct ttcaaatagg ttatgctcca 1920 aaagtgttat ttgtaagtta atttttttac aagtcaaaca atgttggaag tggtatttag 1980 gttctagatc ggtccacgaa agttagccca tatgtatatc ttgaatagta taggggaggg 2040 tattcataaa gtccttatgt ggttttaact aagtgaaatt atggacaaga gaaataattg 2100 taaaatcgtc ttaaaggcaa atttaatttt tacccctgtt tatgggacat tcgttctatt 2160 aactgtcaga cacaatttct gttttcatct gagagccagg tttcctttat ttctacatct 2220 aaaataagaa catattgtac actattatat aatacagaat tgtcttacac tttaataaat 2280 tcgcatttta aaggtgttta caggattatt ttttatatct gtagctgaat ttgttaaagt 2340 ctaaaaagct caaggacttt atgaagatct cattatatga ggaaaatcat aggttaccat 2400 tttataactc tattgccata agaaaataca ctctaaaatc ttgatttgaa acatattaga 2460 aaccttgatt cagtgctcag tggtctccta gtaagaagtc accgacggta gcgtcatatg 2520 agaagaaaga aatccccacc acctcaacct ctgctgagat tgtgtgctag gaacagcctt 2580 ccctccgttt cccctcagtc aaacttgagc cagcctctgg atcgatgtga tcttattgca 2640 tgtttccatg gggtgtacct atactttaag ccaatcctgc tgcattcact gctaagttaa 2700 ataaaaagcc aagaagaaaa aaaaaatttt gcactgtgca gatcctttgc tatctgactt 2760 gcatctcttc ccccacctgt cagctagcca cctgcttgtt tgtgttggga tattttttag 2820 cacctgaagc accatctgaa aggggcacca t 2851 <210> 23 <211> 3473 <212> DNA <213> human <400> 23 aagagcagcg gcgaggcggc ggtggtggct gagtccgtgg tggcagaggc gaaggcgaca 60 gctctagggg ttggcaccgg ccccgagagg aggatgcggg tccggatagg gctgacgctg 120 ctgctgtgtg cggtgctgct gagcttggcc tcggcgtcct cggatgaaga aggcagccag 180 gatgaatcct tagattccaa gactactttg acatcagatg agtcagtaaa ggaccacact 240 actgcaggca gagtagttgc tggtcaaata tttcttgatt cagaagaatc tgaattagaa 300 tcctctattc aagaagagga agacagcctc aagagccaag agggggagag tgtcacagaa 360 gatatcagct ttctagagtc tccaaatcca gaaaacaagg actatgaaga gccaaagaaa 420 gtacggaaac cagctttgac cgccattgaa ggcacagcac atggggagcc ctgccacttc 480 ccttttcttt tcctagataa ggagtatgat gaatgtacat cagatgggag ggaagatggc 540 agactgtggt gtgctacaac ctatgactac aaagcagatg aaaagtgggg cttttgtgaa 600 actgaagaag aggctgctaa gagacggcag atgcaggaag cagaaatggt gtatcaaact 660 ggaatgaaaa tccttaatgg aagcaataag aaaagccaaa aaagagaagc atatcggtat 720 ctccaaaagg cagcaagcat gaaccatacc aaagccctgg agagagtgtc atatgctctt 780 ttatttggtg attacttgcc acagaatatc caggcagcga gagagatgtt tgagaagctg 840 actgaggaag gctctcccaa gggacagact gctcttggct ttctgtatgc ctctggactt 900 ggtgttaatt caagtcaggc aaaggctctt gtatattata catttggagc tcttgggggc 960 aatctaatag cccacatggt tttgggttac agatactggg ctggcatcgg cgtcctccag 1020 agttgtgaat ctgccctgac tcactatcgt cttgttgcca atcatgttgc tagtgatatc 1080 tcgctaacag gaggctcagt agtacagaga atacggctgc ctgatgaagt ggaaaatcca 1140 ggaatgaaca gtggaatgct agaagaagat ttgattcaat attaccagtt cctagctgaa 1200 aaaggtgatg tacaagcaca ggttggtctt ggacaactgc acctgcacgg agggcgtgga 1260 gtagaacaga atcatcagag agcatttgac tacttcaatt tagcagcaaa tgctggcaat 1320 tcacatgcca tggccttttt gggaaagatg tattcggaag gaagtgacat tgtacctcag 1380 agtaatgaga cagctctcca ctactttaag aaagctgctg acatgggcaa cccagttgga 1440 cagagtgggc ttggaatggc ctacctctat gggagaggag ttcaagttaa ttatgatcta 1500 gcccttaagt atttccagaa agctgctgaa caaggctggg tggatgggca gctacagctt 1560 ggttccatgt actataatgg cattggagtc aagagagatt ataaacaggc cttgaagtat 1620 tttaatttag cttctcaggg aggccatatc ttggctttct ataacctagc tcagatgcat 1680 gccagtggca ccggcgtgat gcgatcatgt cacactgcag tggagttgtt taagaatgta 1740 tgtgaacgag gccgttggtc tgaaaggctt atgactgcct ataacagcta taaagatggc 1800 gattacaatg ctgcagtgat ccagtacctc ctcctggctg aacagggcta tgaagtggca 1860 caaagcaatg cagcctttat tcttgatcag agagaagcaa gcattgtagg tgagaatgaa 1920 acttatccca gagctttgct acattggaac agggccgcct ctcaaggcta tactgtggct 1980 agaattaagc tcggagacta ccatttctat gggtttggca ccgatgtaga ttatgaaact 2040 gcatttattc attaccgtct ggcttctgag cagcaacaca gtgcacaagc tatgtttaat 2100 ctgggatata tgcatgagaa aggactgggc attaaacagg atattcacct tgcgaaacgt 2160 ttttatgaca tggcagctga agccagccca gatgcacaag ttccagtctt cctagccctc 2220 tgcaaattgg gcgtcgtcta tttcttgcag tacatacggg aaacaaacat tcgagatatg 2280 ttcacccaac ttgatatgga ccagcttttg ggacctgagt gggaccttta cctcatgacc 2340 atcattgcgc tgctgttggg aacagtcata gcttacaggc aaaggcagca ccaagacatg 2400 cctgcaccca ggcctccagg gccacggcca gctccacccc agcaggaggg gccaccagag 2460 cagcagccac cacagtaata ggcactgggt ccagccttga tcagtgacag cgaaggaagt 2520 tatctgctgg gaacacttgc atttgattta ggaccttgga tcagtggtca cctcccagaa 2580 gaggcacggc acaaggaagc attgaattcc taaagctgct tagaatctga tgcctttatt 2640 ttcagggata agtaactctt acctaaactg agctgaatgt ttgtttcagt gccatatgga 2700 ataacaactt tcagtggctt ttttttttct tttctggaaa catatgtgag acactcagag 2760 taatgtctac tgtatccagc tatctttctt ggatcctttt ggtcattatt tcagtgtgca 2820 taagttctta atgtcaacca tctttaaggt attgtgcatc gacactaaaa actgatcagt 2880 gtaaaaagga aaacccagtt gcaagtttaa acgtgttcga aagtctgaaa atagaacttg 2940 ccttttaagt taaaaaaaaa aaaagctatc ttgaaaatgt tttggaactg cgataactga 3000 gaaactctta ccagtccaca tgcaattaga catattcagc atatttgtta ttttaaaagg 3060 gagggttggg aggtttctta ttggtgattg tcacacggta taccatactc ctctccttca 3120 aagaatgaaa ggccttgtta aggagttttt tgtgagcttt acttctttgg aatggaatat 3180 acttatgcaa aaccttgtga actgactcct tgcactaacg cgagtttgcc ccacctactc 3240 tgtaatttgc ttgtttgttt tgaatataca gagccttgat ccagaagcca gaggatggac 3300 taagtgggag aaattagaaa acaaaacgaa ctctggttgg ggtactacga tcacagacac 3360 agacatactt ttcctaaagt tgaagcattt gttcccagga tttattttac tttgcatttc 3420 cttttgcaca aagaacacat caccatttcc ttttgcacaa agaacacatc acc 3473 <210> 24 <211> 401 <212> DNA <213> human <220> <221> misc_feature <222> (252)..(252) <223> any kind of base <220> <221> misc_feature <222> (303)..(303) <223> any kind of base <220> <221> misc_feature <222> (390)..(390) <223> any kind of base <400> 24 ttagattatt ttcaatttat tattcagaat aaatatatct tttttcttta acttctcaaa 60 tagttattga attgtattgg tttaaattaa atgcgtcatg tgtatatatc agtattaatt 120 caagagatac aaaaggaaat tgagtgaaaa ataagtctgc ctccttccca tcactctcat 180 gtctctacct agaggcaatt attgtcaaca gtttttgatg tgtctttcaa aaaatagtcc 240 attaagcctg gngtactaga tctcttttaa aagtttacaa cctgttacag aatatatata 300 aangttcaat tactagtaac accttattac agatacagat tacaacttag gaaatatatt 360 ttcatggacc attgatgtca tttggattcn cccctacaat c 401 <210> 25 <211> 1820 <212> DNA <213> human <400> 25 aatgtcttag aaaaaggctt tctaaaagaa aaagagcaag aggccatttc ttttcaagat 60 agatacaaag aacttcagga aaaacataaa caagaattgg aagacatgag gaaagctggt 120 cacgaagccc tcagcattat tgtggatgaa tataaggcac tactgcagtc ttcagttaag 180 caacaagtag aagctattga aaaacagtac atttctgcaa ttgagaaaca ggcacacaag 240 tgtgaggagt tgctaaatgc tcagcatcag aggctccttg aaatgctaga tacagagaag 300 gaactgttaa aagaaaaaat aaaggaagct ttgattcagc aatctcaaga acagaaggaa 360 atattggaaa agtgtttgga ggaagaaagg caaagaaata aagaggcatt agtatccgct 420 gcaaagcttg aaaaagaagc agtgaaggat gcagttttaa aagtcgtaga agaagaaaga 480 aaaaatttag aaaaagcgca tgctgaagaa agggaattat ggaagacaga acatgcaaaa 540 gatcaagaaa aagtatctca ggaaattcaa aaagctatac aagaacaaag aaaaataagt 600 caggaaactg ttaaggcagc aataatagaa gagcagaaac gaagtgaaaa ggctgtggaa 660 gaggcagtga aaagaacaag agatgaattg atagagtata taaaagaaca gaaaaggctc 720 gatcaagtca tccgccaaag aagcctgtcc agtttggaac tgttcctctc ctgtgcacag 780 aaacagttaa gtgctttaat agctacggaa ccagttgaca ttgaataaaa agaacatgac 840 aaacccacac tggcattgga taaatcatat tacaccttca aaatacacac tctgaattat 900 aaagatgtgt ttgttttctt tccaaatcat gtagaattga tttccagttc aaggataaac 960 caaaacaata tttagaacta tcaagtgatc taatttattt tcttttggtt tcttctttac 1020 atttactgtt attttattat tattagtagt agcagcaaca gagtatgata tgacccaaaa 1080 gccattgtaa agtgccacat taccaaaatt aattaagtaa actttatagc ctgtgggagt 1140 ctattatata ttattttgca aaagtagtaa atatattatt gtttcatgat gactcttgat 1200 gagatgctag aatgtaacca tacatttatc ttattttgag gatagaaata gcatggattt 1260 caacatcact tatttatctg tataattgga aataaaacac cgatatgata gagaatcatt 1320 ccggcattac ctaacctctt ctgcagttgg atctatgtat tttcattggt ctactgaaaa 1380 cgaacaatac aattaaaagc actaaagatt attatattaa ttcaactttg atctgatata 1440 tcacttaaac taaaggggtg tgtgtggtgt atgcttgttt cctatttctg ctctttaaag 1500 atactttgaa tcaataaaac cattagtcta caaatcaaat tgtgaactta atctctagaa 1560 agagaatata actcagccat ttataggaat ttaggttcaa gtacaggata tatgaaatct 1620 tttcccagta tttcagaatg tacttaattc acaggcagga tgcttcaatg caaaatcatg 1680 aatattttta attcaaaact aaaatgtcat taatatgtat gtatgcaaat gttttatctt 1740 attttctgaa atgcatctac tttcatgggc tttgtacgtt tctgagattt ctcagtgtaa 1800 taaaaagagc tcccaaactt 1820 <210> 26 <211> 280 <212> DNA <213> human <220> <221> misc_feature <222> (261)..(261) <223> any kind of base <220> <221> misc_feature <222> (237)..(237) <223> any kind of base <400> 26 tcaagtcata agataaagtt taatcatttg atcatgttaa aagacacaaa acacagccaa 60 tctaaccaaa tttcaggcat gcatttacat aaatatatta aattaagaaa agaaattgta 120 cacttaaacg tccttttcac ctagaaatca ttaaatccac agatcaacaa taaaaccaat 180 tctctgcatt taccacttca agatacaatt gttctatttt aaagataaca caaactncac 240 tagtctggtt aggaatttat ntgcattata catatattat 280 <210> 27 <211> 392 <212> DNA <213> human <400> 27 ttggtttgaa atggcacccc aggactttgg gcctgcctta cttgatagcc tcgttcagtg 60 agcaaagact tagtgagcag ctcttgtatg ccaagtattt tgctaagctc tggaaaaaag 120 ataaacaaga catggttctt gctttcaagg agtgtgtaat tctttagcca gatatggaaa 180 cctggaccct gagtgggaga aaggagacag atgaaaggag tccgtgattt tgtaaccaag 240 agctgcctgc atggttatga gtatcactga ttttagggac gcccacagag ctaaagcatt 300 tttttaatcc gagaagactt ttgtaactca tattagttaa tcttctagct ctgagatagc 360 aacacagctc ttagaattct gtaagtaagc tt 392 <210> 28 <211> 2299 <212> DNA <213> human <400> 28 cgaaccccca cagctggagg gcgaggccag ctgtacccgg ccccagtgcc ctttcgcggc 60 cacaagcggc cgtcctcctg gtccggtgct ccggcgcctg atctaggttc atggagccgg 120 ggctgtggct ccttttcggg ctcacagtga cctccgccgc aggattcgtg ccttgctccc 180 agtctgggga tgctggcagg cgcggcgtgt cccaggcccc cactgcagcc agatctgagg 240 gggactgtga agagactgtg gctggccctg gcgaggagac tgtggctggc cctggcgagg 300 ggactgtggc cccgacagca ctgcagggtc caagccctgg aagccctggg caggagcagg 360 cggccgaggg ggcccctgag caccaccgat ccaggcgctg cacgtgcttc acctacaagg 420 acaaggagtg tgtctactat tgccacctgg acatcatttg gatcaacact cccgaacaga 480 cggtgcccta tggactgtcc aactacagag gaagcttccg gggcaagagg tctgcggggc 540 cacttccagg gaatctgcag ctctcacatc ggccacactt gcgctgcgct tgtgtgggga 600 gatatgacaa ggcctgcctg cacttttgca cccaaactct ggacgtcagc agacaggttg 660 aagtcaagga ccaacaaagc aagcaggctt tagacctcca ccatccaaag ctcatgcccg 720 gcagtggact cgccctcgct ccatctacct gcccccgctg cctctttcag gaaggagccc 780 cttaggagga caggcctgca gcatcctggt ctcgggaggc ttctgtcatt gctcacacac 840 agttcagatt tccacctctt tatagacaag aagtgaattt gcctggggca gaacacccac 900 ccaaagagtc cccacttaac aatacccccc ccccacggca agaatgccca aatccgaatg 960 accccagttt tcctaatgag taaaatgatc ccagatgtgc cccagagcat gacgcctgca 1020 gctccggttt catgcaggaa attggttttg gagagttttg gcaagttgga aagccactta 1080 ctggcttttg acatgacttc tcttggagaa taagtggact ccaagctaac tctttgcaaa 1140 tgtaaacaca tgtccatctt gtaataaatg caaaatgccc gtgcagcaga agcatgcgac 1200 tttcatatcc ttgcctagaa taggctgcat ggtgtatgtc agtgagggcc acgaggcgtc 1260 ggctttagac acagatcata gctctacagg agtttatgaa tttgaagctt atgggatttt 1320 ggcagagaaa ttttcagctg tgcttgatac ccaccaaaag aatgtatctc gaaagaatga 1380 aggaagaaga aaaaaggatc cttgatgttt gtgacaagaa aatgagaaag ttagtatctg 1440 caatacagag cttgttcctg ttcagtgact gaccctctgt attctgtata gacaccaggc 1500 cgatacacag tggagttccc aggccttgtt tgcaggaagc cgactgtaaa gacagcccca 1560 gctcaaggct attaggttga atatttgctt tcatgagtaa atgtggatct ttggggaatg 1620 gcttcaaaat aagtcacgaa cacaaattct ttgtaaatta tgtaaattcc tgtttatata 1680 aattggcaac aacttatacc gtctgacagt tcaaaatctc tttcagctgc gctcttccca 1740 ccgagccgag cttactgtga gtgtggagat gttatcccac catgtaaagt cgcctgcgca 1800 ggggagggct gcccatctcc ccaacccagt cacagagaga taggaaacgg catttgagtg 1860 ggtgtccagg gccccgtaga gagacattta agatggtgta tgacagagca ttggccttga 1920 ccaaatgtta aatcctctgt gtgtatttca taagttatta caggtataaa agtgatgacc 1980 tatcatgagg aaatgaaagt ggctgatttg ctggtaggat tttgtacagt ttagagaagc 2040 gattatttat tgtgaaactg ttctccactc caactccttt atgtggatct gttcaaagta 2100 gtcactgtat atacgtatag agaggtagat aggtaggtag attttaaatt gcattctgaa 2160 tacaaactca tactccttag agcttgaatt acatttttaa aatgcatatg tgctgtttgg 2220 caccgtggca agatggtatc agagagaaac ccatcaattg ctcaaatact cagaaagtac 2280 tgtcaaaagc ctaataaaa 2299 <210> 29 <211> 1339 <212> DNA <213> human <400> 29 ctaaacaaaa tcattcactt ccctgatttt gataagaaaa ttcctgtaaa gctgtttcct 60 ctgcctctcc tctacgttgg aaaccacata agtggattat caagcacaag taaattaagc 120 ctaccgatgt tcaccgtgct caggaaattc accattccac ttaccttact tctggaaacc 180 atcatacttg ggaagcagta ttcactcaac atcatcctca gtgtctttgc cattattctc 240 ggggctttca tagcagctgg gtctgacctt gcttttaact tagaaggcta tatttttgta 300 ttcctgaatg atatcttcac atcagcaaat ggagtttata ccaaacagaa aatggaccca 360 aaggagctag ggaaatacgg agtacttttc tacaatgcct gcttcatgat tatcccaact 420 cttattatta gtgtctccac tggagacctc caacaggcta ctgaattcaa ccaatggaag 480 aatgttgtgt ttatcctaca gtttcttctt tcctgttttt tggggtttct gctgatgtac 540 tccacggttc tgtgcagcta ttacaattca gccctgacga cagcagtggt tggagccatc 600 aagaatgtat ccgttgccta cattgggata ttaatcggtg gagactacat tttctctttg 660 ttaaactttg tagggttaaa tatttgcatg gcagggggct tgagatattc ctttttaaca 720 ctgagcagcc agttaaaacc taaacctgtg ggtgaagaaa acatctgttt ggatttgaag 780 agctaaagag tctgcagcag gattggagac tgacttgtga ctgcgggctg ggggggcatt 840 cccagtagga atgtgaagcc agaggtttcg gattcgtgac atccaccccc tgggcaagtg 900 agagcatctg caaaatgcaa agagaactac ctcatatgca ggatgagcca atggcagtct 960 caagaaatgt actcgggcga caccttacct gtggaaagca aatcttttca aaataagcca 1020 ctgggactcg gtaggtggag ccccagctgc tcttctaggg acctatgggg ccttcgtggc 1080 atctctgtgc tgtgtgctgg ggaggaggtt gatgtaatgg tgactctttt ctgatcagca 1140 ccttggccgt gattcccaag gtcccagcca aagcaaaggg ccagttgttt cagtttaaac 1200 agacatgtct ttagtctaat aaaattagtt aactgccagt aaagttattt gttagctttg 1260 atgaaagcta tgttggtatc tttccctaat catcaaagta aataaaaaat catttctatg 1320 taaaaaaaaa aaaaaaaaa 1339 <210> 30 <211> 4250 <212> DNA <213> human <400> 30 gaacacatcg cgtttgcatc ccagaaagta gtcgccgcga ctatttcccc caaagagaca 60 agcacacatg taggaatgac aaaggcttgc gaaggagaga gcgcagcccg cggcccggag 120 agatcccctc gataatggat tactaaatgg gatacacgct gtaccagttc gctccgagcc 180 ccggccgcct gtccgtcgat gcaccgaaaa gggtgaagta gagaaataaa gtctccccgc 240 tgaactacta tgaggtcaga agccttgctg ctatatttca cactgctaca ctttgctggg 300 gctggtttcc cagaagattc tgagccaatc agtatttcgc atggcaacta tacaaaacag 360 tatccggtgt ttgtgggcca caagccagga cggaacacca cacagaggca caggctggac 420 atccagatga ttatgatcat gaacggaacc ctctacattg ctgctaggga ccatatttat 480 actgttgata tagacacatc acacacggaa gaaatttatt gtagcaaaaa actgacatgg 540 aaatctagac aggccgatgt agacacatgc agaatgaagg gaaaacataa ggatgagtgc 600 cacaacttta ttaaagttct tctaaagaaa aacgatgatg cattgtttgt ctgtggaact 660 aatgccttca acccttcctg cagaaactat aagatggata cattggaacc attcggggat 720 gaattcagcg gaatggccag atgcccatat gatgccaaac atgccaacgt tgcactgttt 780 gcagatggaa aactatactc agccacagtg actgacttcc ttgccattga cgcagtcatt 840 taccggagtc ttggagaaag ccctaccctg cggaccgtca agcacgattc aaaatggttg 900 aaagaaccat actttgttca agccgtggat tacggagatt atatctactt cttcttcagg 960 gaaatagcag tggagtataa caccatggga aaggtagttt tcccaagagt ggctcaggtt 1020 tgtaagaatg atatgggagg atctcaaaga gtcctggaga aacagtggac gtcgttcctg 1080 aaggcgcgct tgaactgctc agttcctgga gactctcatt tttatttcaa cattctccag 1140 gcagttacag atgtgattcg tatcaacggg cgtgatgttg tcctggcaac gttttctaca 1200 ccttataaca gcatccctgg gtctgcagtc tgtgcctatg acatgcttga cattgccagt 1260 gtttttactg ggagattcaa ggaacagaag tctcctgatt ccacctggac accagttcct 1320 gatgaacgag ttcctaagcc caggccaggt tgctgtgctg gctcatcctc cttagaaaga 1380 tatgcaacct ccaatgagtt ccctgatgat accctgaact tcatcaagac gcacccgctc 1440 atggatgagg cagtgccctc catcttcaac aggccatggt tcctgagaac aatggtcaga 1500 taccgcctta ccaaaattgc agtggacaca gctgctgggc catatcagaa tcacactgtg 1560 gtttttctgg gatcagagaa gggaatcatc ttgaagtttt tggccagaat aggaaatagt 1620 ggttttctaa atgacagcct tttcctggag gagatgagtg tttacaactc tgaaaaatgc 1680 agctatgatg gagtcgaaga caaaaggatc atgggcatgc agctggacag agcaagcagc 1740 tctctgtatg ttgcgttctc tacctgtgtg ataaaggttc cccttggccg gtgtgaacga 1800 catgggaagt gtaaaaaaac ctgtattgcc tccagagacc catattgtgg atggataaag 1860 gaaggtggtg cctgcagcca tttatcaccc aacagcagac tgacttttga gcaggacata 1920 gagcgtggca atacagatgg tctgggggac tgtcacaatt cctttgtggc actgaatgac 1980 atttcaactc ctctaccaga taatgaaatg tcttacaaca cagtgtatgg gcattccagt 2040 tccctcttgc ccagcacaac cacatcagat tcgacggctc aagaggggta tgagtctagg 2100 ggaggaatgc tggactggaa gcatctgctt gactcacctg acagcacaga ccctttgggg 2160 gcagtgtctt cccataatca ccaagacaag aagggagtga ttcgggaaag ttacctcaaa 2220 ggccacgacc agctggttcc cgtcaccctc ttggccattg cagtcatcct ggctttcgtc 2280 atgggggccg tcttctcggg catcaccgtc tactgcgtct gtgatcatcg gcgcaaagac 2340 gtggctgtgg tgcagcgcaa ggagaaggag ctcacccact cgcgccgggg ctccatgagc 2400 agcgtcacca agctcagcgg cctctttggg gacactcaat ccaaagaccc aaagccggag 2460 gccatcctca cgccactcat gcacaacggc aagctcgcca ctcccggcaa cacggccaag 2520 atgctcatta aagcagacca gcaccacctg gacctgacgg ccctccccac cccagagtca 2580 accccaacgc tgcagcagaa gcggaagccc agccgcggca gccgcgagtg ggagaggaac 2640 cagaacctca tcaatgcctg cacaaaggac atgcccccca tgggctcccc tgtgattccc 2700 acggacctgc ccctgcgggc ctcccccagc cacatcccca gcgtggtggt cctgcccatc 2760 acgcagcagg gctaccagca tgagtacgtg gaccagccca aaatgagcga ggtggcccag 2820 atggcgctgg aggaccaggc cgccacactg gagtataaga ccatcaagga acatctcagc 2880 agcaagagtc ccaaccatgg ggtgaacctt gtggagaacc tggacagcct gccccccaaa 2940 gttccacagc gggaggcctc cctgggtccc ccgggagcct ccctgtctca gaccggtcta 3000 agcaagcggc tggaaatgca ccactcctct tcctacgggg ttgactataa gaggagctac 3060 cccacgaact cgctcacgag aagccaccag gccaccactc tcaaaagaaa caacactaac 3120 tcctccaatt cctctcacct ctccagaaac cagagctttg gcaggggaga caacccgccg 3180 cccgccccgc agagggtgga ctccatccag gtgcacagct cccagccatc tggccaggcc 3240 gtgactgtct cgaggcagcc cagcctcaac gcctacaact cactgacaag gtcggggctg 3300 aagcgtacgc cctcgctaaa gccggacgta ccccccaaac catcctttgc tcccctttcc 3360 acatccatga agcccaatga tgcgtgtaca taatcccagg gggagggggt caggtgtcga 3420 accagcaggc aaggcgaggt gcccgctcag ctcagcaagg ttctcaactg cctcgagtac 3480 ccaccagacc aagaaggcct gcggcagagc cgaggacgct gggtcctcct ctctgggaca 3540 caggggtact cacgaaaact gggccgcgtg gtttggtgaa ggtttgcaac ggcggggact 3600 caccttcatt ctcttccttc actttccccc acaccctaca acaggtcgga cccacaaaag 3660 acttcagtta tcatcacaaa catgagccaa aagcacatac ctaccccatc ccccaccccc 3720 acacacacac acacatgcac acaacacata cacacacacg cacagaggtg aacagaaact 3780 gaaacatttt gtccacaact tcacgggacg tggccagact gggtttgcgt tccaacctgc 3840 aaaacacaaa tacatttttt aaaatcaaga aaatttaaaa agacaaaaaa aaaagaattc 3900 attgataatt ctaactcaga ctttaacaat ggcagaagtt tactatgcgc aaatactgtg 3960 aaatgcccgc cagtgttaca gctttctgtt gcagcagata aatgccatgt tgggcaacta 4020 tgtcatagat ttctgctcct cctctctttt aatgaaataa cgtgaccgtt aacgcaagta 4080 actctttatt tattgttcac cctttttttc cttaaggaaa ggactcttcc aaatatcatc 4140 ctatgaacag ctcttcagaa agcccattga aagttaaact atttaacgtg aaatccatta 4200 actggaataa ttgagtttct ttatttttac aataaattca ctgagtaaat 4250 <210> 31 <211> 2785 <212> DNA <213> human <400> 31 ctttagccca acagtcaaaa ataattgatg ctaccctaca aatgtccaaa actctagtat 60 atcatatttc taagttacag caaatattag tcctgctaaa ccagggagct ttggcaaaaa 120 tgttttttga cagtaaattt gtccttgatt atatattaac tagtcaaaga ggtgtttgta 180 acattattag agcttcttgt tgtaggtggg ttaacaccac caatcaagag gtcattctaa 240 cagaaagcct ggatcagaaa accatcaccc taaaaaaaca tgccttacat atttaacaca 300 ctctgaaatc cagtcaaaat atgactaaag gcccttgcca tgactgatgt attctcctgg 360 ccaacgccaa acaaatggga gcctggttac gagtcagcct tcagggactt gtcacatttc 420 tacttggttt cttccttgtt attgtcataa taaaatgttt tctatgctgt ttagtgcaac 480 ttaggcccta ttctgtagaa gtctcctcta ctattcaggc cactcaaaca ccccaaataa 540 ttgagttcaa aatcgacatc aagatataaa ggaatcagtg actaaatata tttcatatat 600 ggtattttta ttgattattg tgctgtcttg acctagtatg gaggccttgg ctagaggctg 660 gtcagtttcc tctcttgagc agctgattaa atccacaccc caaccacttc ccttatcagg 720 ttctcacact ctggggccac tatgtaccca ctctaatcac cacagggcca gacatcagac 780 aattaaggac agcgcccatg ccccaaagcc cgccaaaatt atgcaaatta ttcaaaatta 840 ttcaacctag ctaaccccac cctttttgct gtacataagc tgcccattcc ccctccagcc 900 tgtggtaccc agtcctcagg tgcaaccccc tgcgtggtcc tctgtggcag ccttctctca 960 ttcagagctg ttttccacag aggtagtgaa aagaactgga ttttcaagtt cactttgcaa 1020 gagaaaaaga aaactcagta gaagataatg gcaagtccag actggggata tgatgacaaa 1080 aatggtcctg aacaatggag caagctgtat cccattgcca atggaaataa ccaatcccct 1140 gttgatatta aaaccagtga aaccaaacat gacacctctc tgaaacctat tagtgtctcc 1200 tacaacccag ccacagccaa agaaattatc aatgtggggc attctttcca tgtaaatttt 1260 gaggacaacg ataaccgatc agtgctgaaa ggtggtcctt tctctgacag ctacaggctc 1320 tttcagtttc attttcactg gggcagtaca aatgagcatg gttcagaaca tacagtggat 1380 ggagtcaaat attctgccga gcttcacgta gctcactgga attctgcaaa gtactccagc 1440 cttgctgaag ctgcctcaaa ggctgatggt ttggcagtta ttggtgtttt gatgaaggtt 1500 ggtgaggcca acccaaagct gcagaaagta cttgatgccc tccaagcaat taaaaccaag 1560 ggcaaacgag ccccattcac aaattttgac ccctctactc tccttccttc atccctggat 1620 ttctggacct accctggctc tctgactcat cctcctcttt atgagagtgt aacttggatc 1680 atctgtaagg agagcatcag tgtcagctca gagcagctgg cacaattccg cagccttcta 1740 tcaaatgttg aaggtgataa cgctgtcccc atgcagcaca acaaccgccc aacccaacct 1800 ctgaagggca gaacagtgag agcttcattt tgatgattct gagaagaaac ttgtccttcc 1860 tcaagaacac agccctgctt ctgacataat ccagttaaaa taataatttt taagaaataa 1920 atttatttca atattagcaa gacagcatgc cttcaaatca atctgtaaaa ctaagaaact 1980 taaattttag ttcttactgc ttaattcaaa taataattag taagctagca aatagtaatc 2040 tgtaagcata agcttatctt aaattcaagt ttagtttgag gaattcttta aaattacaac 2100 taagtgattt gtatgtctat ttttttcagt ttatttgaac caataaaata attttatctc 2160 tttctttctg ttgtgcattc agtttctaaa accattaagt ttctactcca tttacattca 2220 aaaatcttaa atactttact tgcaagagta ttttgcttca aatacaacaa cctaagagca 2280 gctggagatg aaatattggg aaattcattt gcttactcct gaagacaaaa atatagctga 2340 gatgaccact ggatttaata tcgttatgct ggcccaacat tgctaccatt tgtgttgtct 2400 gtgatcaaaa tgattatctt ttatatagga agatgacgct tctggatatt gctttcactt 2460 cttctcccca cgttagcaag gacaatgctt ctctgccatt attacaacta gttagtttgc 2520 atggagaatc tttactttaa aattggaaga aaagtcacaa gtgaatggtt tataaaaatg 2580 ctaaagaagt cattcttgct tagaatcata tagaaacatc atgcaatctt ttagtcagat 2640 gtgcgcttca ccttatgcta tttttatctt taattgacac acaataattg tacatgttta 2700 tggagtatag tgtggtgttt tctgtttgtt tgtttgtttt ttgagacaag gtctcactct 2760 gccagtcagg gtggagtgcg atggt 2785 <210> 32 <211> 9588 <212> DNA <213> human <400> 32 ccgaccaaca ccaacaccca gctccgacgc agctcctctg cgcccttgcc gccctccgag 60 ccacagcttt cctcccgctc ctgcccccgg cccgtcgccg tctccgcgct cgcagcggcc 120 tcgggagggc ccaggtagcg agcagcgacc tcgcgagcct tccgcactcc cgcccggttc 180 cccggccgtc cgcctatcct tggccccctc cgctttctcc gcgccggccc gcctcgctta 240 tgcctcggcg ctgagccgct ctcccgattg cccgccgaca tgagctgcaa cggaggctcc 300 cacccgcgga tcaacactct gggccgcatg atccgcgccg agtctggccc ggacctgcgc 360 tacgaggtga ccagcggcgg cgggggcacc agcaggatgt actattctcg gcgcggcgtg 420 atcaccgacc agaactcgga cggctactgt caaaccggca cgatgtccag gcaccagaac 480 cagaacacca tccaggagct gctgcagaac tgctccgact gcttgatgcg agcagagctc 540 atcgtgcagc ctgaattgaa gtatggagat ggaatacaac tgactcggag tcgagaattg 600 gatgagtgtt ttgcccaggc caatgaccaa atggaaatcc tcgacagctt gatcagagag 660 atgcggcaga tgggccagcc ctgtgatgct taccagaaaa ggcttcttca gctccaagag 720 caaatgcgag ccctttataa agccatcagt gtccctcgag tccgcagggc cagctccaag 780 ggtggtggag gctacacttg tcagagtggc tctggctggg atgagttcac caaacatgtc 840 accagtgaat gtttggggtg gatgaggcag caaagggcgg agatggacat ggtggcctgg 900 ggtgtggacc tggcctcagt ggagcagcac attaacagcc accggggcat ccacaactcc 960 atcggcgact atcgctggca gctggacaaa atcaaagccg acctgcgcga gaaatctgcg 1020 atctaccagt tggaggagga gtatgaaaac ctgctgaaag cgtcctttga gaggatggat 1080 cacctgcgac agctgcagaa catcattcag gccacgtcca gggagatcat gtggatcaat 1140 gactgcgagg aggaggagct gctgtacgac tggagcgaca agaacaccaa catcgctcag 1200 aaacaggagg ccttctccat acgcatgagt caactggaag ttaaagaaaa agagctcaat 1260 aagctgaaac aagaaagtga ccaacttgtc ctcaatcagc atccagcttc agacaaaatt 1320 gaggcctata tggacactct gcagacgcag tggagttgga ttcttcagat caccaagtgc 1380 attgatgttc atctgaaaga aaatgctgcc tactttcagt tttttgaaga ggcgcagtct 1440 actgaagcat acctgaaggg gctccaggac tccatcagga agaagtaccc ctgcgacaag 1500 aacatgcccc tgcagcacct gctggaacag atcaaggagc tggagaaaga acgagagaaa 1560 atccttgaat acaagcgtca ggtgcagaac ttggtaaaca agtctaagaa gattgtacag 1620 ctgaagcctc gtaacccaga ctacagaagc aataaaccca ttattctcag agctctctgt 1680 gactacaaac aagatcagaa aatcgtgcat aagggggatg agtgtatcct gaaggacaac 1740 aacgagcgca gcaagtggta cgtgacgggc ccgggaggcg ttgacatgct tgttccctct 1800 gtggggctga tcatccctcc tccgaaccca ctggccgtgg acctctcttg caagattgag 1860 cagtactacg aagccatctt ggctctgtgg aaccagctct acatcaacat gaagagcctg 1920 gtgtcctggc actactgcat gattgacata gagaagatca gggccatgac aatcgccaag 1980 ctgaaaacaa tgcggcagga agattacatg aagacgatag ccgaccttga gttacattac 2040 caagagttca tcagaaatag ccaaggctca gagatgtttg gagatgatga caagcggaaa 2100 atacagtctc agttcaccga tgcccagaag cattaccaga ccctggtcat tcagctccct 2160 ggctatcccc agcaccagac agtgaccaca actgaaatca ctcatcatgg aacctgccaa 2220 gatgtcaacc ataataaagt aattgaaacc aacagagaaa atgacaagca agaaacatgg 2280 atgctgatgg agctgcagaa gattcgcagg cagatagagc actgcgaggg caggatgact 2340 ctcaaaaacc tccctctagc agaccagggg tcttctcacc acatcacagt gaaaattaac 2400 gagcttaaga gtgtgcagaa tgattcacaa gcaattgctg aggttctcaa ccagcttaaa 2460 gatatgcttg ccaacttcag aggttctgaa aagtactgct atttacagaa tgaagtattt 2520 ggactatttc agaaactgga aaatatcaat ggtgttacag atggctactt aaatagctta 2580 tgcacagtaa gggcactgct ccaggctatt ctccaaacag aagacatgtt aaaggtttat 2640 gaagccaggc tcactgagga ggaaactgtc tgcctggacc tggataaagt ggaagcttac 2700 cgctgtggac tgaagaaaat aaaaaatgac ttgaacttga agaagtcgtt gttggccact 2760 atgaagacag aactacagaa agcccagcag atccactctc agacttcaca gcagtatcca 2820 ctttatgatc tggacttggg caagttcggt gaaaaagtca cacagctgac agaccgctgg 2880 caaaggatag ataaacagat cgactttaga ttatgggacc tggagaaaca aatcaagcaa 2940 ttgaggaatt atcgtgataa ctatcaggct ttctgcaagt ggctctatga tcgtaaacgc 3000 cgccaggatt ccttagaatc catgaaattt ggagattcca acacagtcat gcggtttttg 3060 aatgagcaga agaacttgca cagtgaaata tctggcaaac gagacaaatc agaggaagta 3120 caaaaaattg ctgaactttg cgccaattca attaaggatt atgagctcca gctggcctca 3180 tacacctcag gactggaaac tctgctgaac atacctatca agaggaccat gattcagtcc 3240 ccttctgggg tgattctgca agaggctgca gatgttcatg ctcggtacat tgaactactt 3300 acaagatctg gagactatta caggttctta agtgagatgc tgaagagttt ggaagatctg 3360 aagctgaaaa ataccaagat cgaagttttg gaagaggagc tcagactggc ccgagatgcc 3420 aactcggaaa actgtaataa gaacaaattc ctggatcaga acctgcagaa ataccaggca 3480 gagtgttccc agttcaaagc gaagcttgcg agcctggagg agctgaagag acaggctgag 3540 ctggatggga agtcggctaa gcaaaatcta gacaagtgct acggccaaat aaaagaactc 3600 aatgagaaga tcacccgact gacttatgag attgaagatg aaaagagaag aagaaaatct 3660 gtggaagaca gatttgacca acagaagaat gactatgacc aactgcagaa agcaaggcaa 3720 tgtgaaaagg agaaccttgg ttggcagaaa ttagagtctg agaaagccat caaggagaag 3780 gagtacgaga ttgaaaggtt gagggttcta ctgcaggaag aaggcacccg gaagagagaa 3840 tatgaaaatg agctggcaaa ggtaagaaac cactataatg aggagatgag taatttaagg 3900 aacaagtatg aaacagagat taacattacg aagaccacca tcaaggagat atccatgcaa 3960 aaagaggatg attccaaaaa tcttagaaac cagcttgata gactttcaag ggaaaatcga 4020 gatctgaagg atgaaattgt caggctcaat gacagcatct tgcaggccac tgagcagcga 4080 aggcgagctg aagaaaacgc ccttcagcaa aaggcctgtg gctctgagat aatgcagaag 4140 aagcagcatc tggagataga actgaagcag gtcatgcagc agcgctctga ggacaatgcc 4200 cggcacaagc agtccctgga ggaggctgcc aagaccattc aggacaaaaa taaggagatc 4260 gagagactca aagctgagtt tcaggaggag gccaagcgcc gctgggaata tgaaaatgaa 4320 ctgagtaagg taagaaacaa ttatgatgag gagatcatta gcttaaaaaa tcagtttgag 4380 accgagatca acatcaccaa gaccaccatc caccagctca ccatgcagaa ggaagaggat 4440 accagtggct accgggctca gatagacaat ctcacccgag aaaacaggag cttatctgaa 4500 gaaataaaga ggctgaagaa cactctaacc cagaccacag agaatctcag gagggtggaa 4560 gaagacatcc aacagcaaaa ggccactggc tctgaggtgt ctcagaggaa acagcagctg 4620 gaggttgagc tgagacaagt cactcagatg cgaacagagg agagcgtaag atataagcaa 4680 tctcttgatg atgctgccaa aaccatccag gataaaaaca aggagataga aaggttaaaa 4740 caactgatcg acaaagaaac aaatgaccgg aaatgcctgg aagatgaaaa cgcgagatta 4800 caaagggtcc agtatgacct gcagaaagca aacagtagtg cgacggagac aataaacaaa 4860 ctgaaggttc aggagcaaga actgacacgc ctgaggatcg actatgaaag ggtttcccag 4920 gagaggactg tgaaggacca ggatatcacg cggttccaga actctctgaa agagctgcag 4980 ctgcagaagc agaaggtgga agaggagctg aatcggctga agaggaccgc gtcagaagac 5040 tcctgcaaga ggaagaagct ggaggaagag ctggaaggca tgaggaggtc gctgaaggag 5100 caagccatca aaatcaccaa cctgacccag cagctggagc aggcatccat tgttaagaag 5160 aggagtgagg atgacctccg gcagcagagg gacgtgctgg atggccacct gagggaaaag 5220 cagaggaccc aggaagagct gaggaggctc tcttctgagg tcgaggccct gaggcggcag 5280 ttactccagg aacaggaaag tgtcaaacaa gctcacttga ggaatgagca tttccagaag 5340 gcgatagaag ataaaagcag aagcttaaat gaaagcaaaa tagaaattga gaggctgcag 5400 tctctcacag agaacctgac caaggagcac ttgatgttag aagaagaact gcggaacctg 5460 aggctggagt acgatgacct gaggagagga cgaagcgaag cggacagtga taaaaatgca 5520 accatcttgg aactaaggag ccagctgcag atcagcaaca accggaccct ggaactgcag 5580 gggctgatta atgatttaca gagagagagg gaaaatttga gacaggaaat tgagaaattc 5640 caaaagcagg ctttagaggc atctaatagg attcaggaat caaagaatca gtgtactcag 5700 gtggtacagg aaagagagag ccttctggtg aaaatcaaag tcctggagca agacaaggca 5760 aggctgcaga ggctggagga tgagctgaat cgtgcaaaat caactctaga ggcagaaacc 5820 agggtgaaac agcgcctgga gtgtgagaaa cagcaaattc agaatgacct gaatcagtgg 5880 aagactcaat attcccgcaa ggaggaggct attaggaaga tagaatcgga aagagaaaag 5940 agtgagagag agaagaacag tcttaggagt gagatcgaaa gactccaagc agagatcaag 6000 agaattgaag agaggtgcag gcgtaagctg gaggattcta ccagggagac acagtcacag 6060 ttagaaacag aacgctcccg atatcagagg gagattgata aactcagaca gcgcccatat 6120 gggtcccatc gagagaccca gactgagtgt gagtggaccg ttgacacctc caagctggtg 6180 tttgatgggc tgaggaagaa ggtgacagca atgcagctct atgagtgtca gctgatcgac 6240 aaaacaacct tggacaaact attgaagggg aagaagtcag tggaagaagt tgcttctgaa 6300 atccagccat tccttcgggg tgcaggatct atcgctggag catctgcttc tcctaaggaa 6360 aaatactctt tggtagaggc caagagaaag aaattaatca gcccagaatc cacagtcatg 6420 cttctggagg cccaggcagc tacaggtggt ataattgatc cccatcggaa tgagaagctg 6480 actgtcgaca gtgccatagc tcgggacctc attgacttcg atgaccgtca gcagatatat 6540 gcagcagaaa aagctatcac tggttttgat gatccatttt caggcaagac agtatctgtt 6600 tcagaagcca tcaagaaaaa tttgattgat agagaaaccg gaatgcgcct gctggaagcc 6660 cagattgctt cagggggtgt agtagaccct gtgaacagtg tctttttgcc aaaagatgtc 6720 gccttggccc gggggctgat tgatagagat ttgtatcgat ccctgaatga tccccgagat 6780 agtcagaaaa actttgtgga tccagtcacc aaaaagaagg tcagttacgt gcagctgaag 6840 gaacggtgca gaatcgaacc acatactggt ctgctcttgc tttcagtaca gaagagaagc 6900 atgtccttcc aaggaatcag acaacctgtg accgtcactg agctagtaga ttctggtata 6960 ttgagaccgt ccactgtcaa tgaactggaa tctggtcaga tttcttatga cgaggttggt 7020 gagagaatta aggacttcct ccagggttca agctgcatag caggcatata caatgagacc 7080 acaaaacaga agcttggcat ttatgaggcc atgaaaattg gcttagtccg acctggtact 7140 gctctggagt tgctggaagc ccaagcagct actggcttta tagtggatcc tgttagcaac 7200 ttgaggttac cagtggagga agcctacaag agaggtctgg tgggcattga gttcaaagag 7260 aagctcctgt ctgcagaacg agctgtcact gggtataatg atcctgaaac aggaaacatc 7320 atctctttgt tccaagccat gaataaggaa ctcatcgaaa agggccacgg tattcgctta 7380 ttagaagcac agatcgcaac cggggggatc attgacccaa aggagagcca tcgtttacca 7440 gttgacatag catataagag gggctatttc aatgaggaac tcagtgagat tctctcagat 7500 ccaagtgatg ataccaaagg attttttgac cccaacactg aagaaaatct tacctatctg 7560 caactaaaag aaagatgcat taaggatgag gaaacagggc tctgtcttct gcctctgaaa 7620 gaaaagaaga aacaggtgca gacatcacaa aagaataccc tcaggaagcg tagagtggtc 7680 atagttgacc cagaaaccaa taaagaaatg tctgttcagg aggcctacaa gaagggccta 7740 attgattatg aaaccttcaa agaactgtgt gagcaggaat gtgaatggga agaaataacc 7800 atcacgggat cagatggctc caccagggtg gtcctggtag atagaaagac aggcagtcag 7860 tatgatattc aagatgctat tgacaagggc cttgttgaca ggaagttctt tgatcagtac 7920 cgatccggca gcctcagcct cactcaattt gctgacatga tctccttgaa aaatggtgtc 7980 ggcaccagca gcagcatggg cagtggtgtc agcgatgatg tttttagcag ctcccgacat 8040 gaatcagtaa gtaagatttc caccatatcc agcgtcagga atttaaccat aaggagcagc 8100 tctttttcag acaccctgga agaatcgagc cccattgcag ccatctttga cacagaaaac 8160 ctggagaaaa tctccattac agaaggtata gagcggggca tcgttgacag catcacgggt 8220 cagaggcttc tggaggctca ggcctgcaca ggtggcatca tccacccaac cacgggccag 8280 aagctgtcac ttcaggacgc agtctcccag ggtgtgattg accaagacat ggccaccagc 8340 gtgaagcctg ctcagaaagc cttcataggc ttcgagggtg tgaagggaaa gaagaagatg 8400 tcagcagcag aggcagtgaa agaaaaatgg ctcccgtatg aggctggcca gcgcttcctg 8460 gagttccagt acctcacggg aggtcttgtt gacccggaag tgcatgggag gataagcacc 8520 gaagaagcca tccggaaggg gttcatagat ggccgcgccg cacagaggct gcaagacacc 8580 agcagctatg ccaaaatcct gacctgcccc aaaaccaaat taaaaatatc ctataaggat 8640 gccataaatc gctccatggt agaagatatc actgggctgc gccttctgga agccgcctcc 8700 gtgtcgtcca agggcttacc cagcccttac aacatgtctt cggctccggg gtcccgctcc 8760 ggctcccgct cgggatctcg ctccggatct cgctccgggt cccgcagtgg gtcccggaga 8820 ggaagctttg acgccacagg gaattcttcc tactcttatt cctactcatt tagcagtagt 8880 tctattgggc actagtagtc agttgggagt ggttgctata ccttgacttc atttatatga 8940 atttccactt tattaaataa tagaaaagaa aatcccggtg cttgcagtag agtgatagga 9000 cattctatgc ttacagaaaa tatagccatg attgaaatca aatagtaaag gctgttctgg 9060 ctttttatct tcttagctca tcttaaataa gcagtacact tggatgcagt gcgtctgaag 9120 tgctaatcag ttgtaacaat agcacaaatc gaacttagga tttgtttctt ctcttctgtg 9180 tttcgatttt tgatcaattc tttaattttg gaagcctata atacagtttt ctattcttgg 9240 agataaaaat taaatggatc actgatattt tagtcattct gcttctcatc taaatatttc 9300 catattctgt attaggagaa aattaccctc ccagcaccag cccccctctc aaacccccaa 9360 cccaaaacca agcattttgg aatgagtctc ctttagtttc agagtgtgga ttgtataacc 9420 catatactct tcgatgtact tgtttggttt ggtattaatt tgactgtgca tgacagcggc 9480 aatcttttct ttggtcaaag ttttctgttt attttgcttg tcatattcga tgtactttaa 9540 ggtgtcttta tgaagtttgc tattctggca ataaactttt agactttt 9588 <210> 33 <211> 366 <212> DNA <213> human <220> <221> misc_feature <222> (351)..(351) <223> any kind of base <400> 33 gaagtgccat ttatatttat acaaaaatat tacataattc agttagtatt ggtgacataa 60 tttagttagt atgggtgata taatggtcat aatttttagc atctaataaa gatcttttta 120 tgagtcccat ataaaatatg tgaacaaagc aatcttgtca taagatttgt gatgatttag 180 gagaaagtac tttgagataa tttttttctg tctctttgtg aactctctca acagtagttc 240 tctttagatt agagccagca ggtcggccat aacagttttc ttcaaatttg ggcaacagtt 300 atacaaatgc ttgaatttca agacaacata ttaaagggtc tatgaactgg naatctaacc 360 tgggtt 366 <210> 34 <211> 1466 <212> DNA <213> human <400> 34 agccccaagc ttaccacctg cacccggaga gctgtgtgtc accatgtggg tcccggttgt 60 cttcctcacc ctgtccgtga cgtggattgg tgctgcaccc ctcatcctgt ctcggattgt 120 gggaggctgg gagtgcgaga agcattccca accctggcag gtgcttgtgg cctctcgtgg 180 cagggcagtc tgcggcggtg ttctggtgca cccccagtgg gtcctcacag ctgcccactg 240 catcaggaac aaaagcgtga tcttgctggg tcggcacagc ctgtttcatc ctgaagacac 300 aggccaggta tttcaggtca gccacagctt cccacacccg ctctacgata tgagcctcct 360 gaagaatcga ttcctcaggc caggtgatga ctccagccac gacctcatgc tgctccgcct 420 gtcagagcct gccgagctca cggatgctgt gaaggtcatg gacctgccca cccaggagcc 480 agcactgggg accacctgct acgcctcagg ctggggcagc attgaaccag aggagttctt 540 gaccccaaag aaacttcagt gtgtggacct ccatgttatt tccaatgacg tgtgtgcgca 600 agttcaccct cagaaggtga ccaagttcat gctgtgtgct ggacgctgga cagggggcaa 660 aagcacctgc tcgggtgatt ctgggggccc acttgtctgt aatggtgtgc ttcaaggtat 720 cacgtcatgg ggcagtgaac catgtgccct gcccgaaagg ccttccctgt acaccaaggt 780 ggtgcattac cggaagtgga tcaaggacac catcgtggcc aacccctgag cacccctatc 840 aaccccctat tgtagtaaac ttggaacctt ggaaatgacc aggccaagac tcaagcctcc 900 ccagttctac tgacctttgt ccttaggtgt gaggtccagg gttgctagga aaagaaatca 960 gcagacacag gtgtagacca gagtgtttct taaatggtgt aattttgtcc tctctgtgtc 1020 ctggggaata ctggccatgc ctggagacat atcactcaat ttctctgagg acacagatag 1080 gatggggtgt ctgtgttatt tgtggggtac agagatgaaa gaggggtggg atccacactg 1140 agagagtgga gagtgacatg tgctggacac tgtccatgaa gcactgagca gaagctggag 1200 gcacaacgca ccagacactc acagcaagga tggagctgaa aacataaccc actctgtcct 1260 ggaggcactg ggaagcctag agaaggctgt gagccaagga gggagggtct tcctttggca 1320 tgggatgggg atgaagtaag gagagggact ggaccccctg gaagctgatt cactatgggg 1380 ggaggtgtat tgaagtcctc cagacaaccc tcagatttga tgatttccta gtagaactca 1440 cagaaataaa gagctgttat actgtg 1466 <210> 35 <211> 187 <212> DNA <213> human <400> 35 gatctggtgc attccggtcg acactctcgt ttatttggac tgtaagtctg acctctatga 60 ataattactt cagcccctga gtgctcccgg gccaagctcc ttggccaaac tttcacctta 120 gcttctgata agtcttgggc caagctaagc agcatctatc aatcatccct tcagctcctg 180 attgatc 187 <210> 36 <211> 2913 <212> DNA <213> human <400> 36 actgggtacc gaggactggg tgtgtttaag gcagacagcc aggtgaggat cccagctact 60 ggggcctgct gtcatctcct gggagtaccc gggggtcagg agcctagggg actcttgcac 120 ttcacatcca gccatgctaa ttacactttt tggcaaagga aacagctagg agcagtttct 180 ttcactccta cagccccgtt ttctcagtgt ttagacctcg aattattact gggctagagg 240 gaaggcagcc tctgaagtgt ggcaggagga ggggaagtct gcctgcatct tggtgtgtct 300 gtcagatgcc agcactaata acctggcttc tgtgaggcct gtcagtgctc tcaggaatga 360 aaggggaccc ctgagaggtg ctcagtacca gcaggctgtg aatgctctct acccaccacc 420 ctcacctcct cgttaaagat ggtgctacct gccacacagc agacatctgg tcgctgcaca 480 cccgaaagac cccaaggcag tctgcccctt gtccagccac acgccagcac ccaccctcct 540 ggcccctgcc tcggcctccc cagaccagct gcacccagcc cccaacacgc accccttctc 600 cagatgtgtg cagggcctca ttttgcagag caaagacaga tgtttcagcc acacgcttta 660 ttaacttcta aaacctgtgc tcaggacact cttcaacagt catgaaaagt ttgatcactt 720 gccacagtca ggacctttgt gtggggctct gatctgatgt tcggtctcat catctcccaa 780 accagcagtc gtttgtaccc caaccctctg ctcaggggct cataccccca aatgattttc 840 ctgatttatg tatttcccta caaagggctt tctataccta gcatctgcct ccagcatgag 900 aagggggaat aggtgagacc catttgccag tagcagacgg ggaccctggg gagaaaatgg 960 cagagcctgt tggagactcc ctgtctccag ctgaccagcc aatgggattc ctcttccctc 1020 cactgtctcc cacaaagtag aagaatcctg gtacatttag cccatgagcc tggcacagat 1080 ccctatctag acatgaggcc ctttagacat gactttggca ttgaccagcc tgttggcaat 1140 gggtcgggga ggcagagggg atgctcacac cagtaattct catcccctga atgcttggga 1200 tcacctgggg agagttcaca aaatactggt gcaggggtcc cacctctgat gatgctgagt 1260 ggtgggtctg gggtgtggcc caggcatcat gatgtttcag gcccccaggt gacttcttag 1320 gcagcccagc taagccccta gagccttgca atttccccca aatgacctca gagggcccga 1380 tttgagggaa atgcctaact tcaggggccg taagaatccc ccagggagca tgtgaaatgc 1440 agataccagg cccaccccca gagatgagct gaggtgggtc aggggtgaag tgcagggatc 1500 agtgtttttc acaagctcca tacctccagg aaatggtgtt gtggttgggc ccgtagaaaa 1560 cattctgaga gtcctgttgc ctgtgccttg gtgcacgtgg ggtggaatcc cagtggccct 1620 gccttgagga ggatgtgcat taacgtggta ggggagacag agacagctcc acctgccccc 1680 tgtcccaccg gggacctcca aaaacttcat ggatgttaga gcaagcagcc atgctgcagc 1740 agaggatgag gctggcggat ttagtaagag ccctctgtgt ttgggctgag ttctttctct 1800 agttgccctg tcatctggcc tctggataac ccacctctcc tccctcatcc taaaattaca 1860 gatggcgaaa gacggccaca tttagtgaga cccctaaggt cctccaacta gggtgggtcc 1920 acagtggccc ctggtgcatg gaccacacac tctcttccct cctctggctc aggactacgg 1980 tctgaaatta gggagatatg aatgtctttc ttgaaaactt ctcttcccag tcttcccact 2040 ttgcttgggg gtccttggtc aaggccagct ttggactagg gcttgttgcg actaccagct 2100 gtctcatttt gctgtactgc aaactcaggc ttggttccaa gcttatgggg gccctgtcct 2160 tcccctagta gggtttgttt tggggtcaca tctggtcata cccttcagag agctcttccc 2220 cagcctctac atcagggaga gaggtaggta gggaggagca ttcaaggatt agaagaagga 2280 ctaaagtaca acagccttgg aggaactgcc aggaactaag ggcgagcact ggagaaggca 2340 acctgggacc ccctgcgctt ctgagcagga agaccaagac cttcaggggc cctaagcact 2400 gaaaacatca ttcctcatcc ccaagccctg gcatccccct gttcttctaa aataattctt 2460 ttctaggtat ttctgattgc aaaattctgg atgggttcat ccaagctgac ctttgctgtt 2520 ttttcccttc ccaacaaggc ctcacttttt ggagccacct tagttggtgc ctaggcagag 2580 gggcagtcag cagtggttat caggatcctg gctctatggg ttgccttcct cctggtctgt 2640 aaagcccctg caggcaggga cttcttagat agctgcttcc ttagggcatg gcatgtggtg 2700 ggtggttaat gaatggaaga gagggaatga gtgatcaagg gagggaggag ggagtggagt 2760 ggagatttct catcctttcc tgttaattta tgacatcctc ctgcctatga gtccttgact 2820 ctggagtttt acaaagcagt cacatttcaa ataaaagtct gggaaagcaa cacatcatcg 2880 ccaactttta attttgctaa ataaggatat tag 2913 <210> 37 <211> 1466 <212> DNA <213> human <400> 37 agccccaagc ttaccacctg cacccggaga gctgtgtgtc accatgtggg tcccggttgt 60 cttcctcacc ctgtccgtga cgtggattgg tgctgcaccc ctcatcctgt ctcggattgt 120 gggaggctgg gagtgcgaga agcattccca accctggcag gtgcttgtgg cctctcgtgg 180 cagggcagtc tgcggcggtg ttctggtgca cccccagtgg gtcctcacag ctgcccactg 240 catcaggaac aaaagcgtga tcttgctggg tcggcacagc ctgtttcatc ctgaagacac 300 aggccaggta tttcaggtca gccacagctt cccacacccg ctctacgata tgagcctcct 360 gaagaatcga ttcctcaggc caggtgatga ctccagccac gacctcatgc tgctccgcct 420 gtcagagcct gccgagctca cggatgctgt gaaggtcatg gacctgccca cccaggagcc 480 agcactgggg accacctgct acgcctcagg ctggggcagc attgaaccag aggagttctt 540 gaccccaaag aaacttcagt gtgtggacct ccatgttatt tccaatgacg tgtgtgcgca 600 agttcaccct cagaaggtga ccaagttcat gctgtgtgct ggacgctgga cagggggcaa 660 aagcacctgc tcgggtgatt ctgggggccc acttgtctgt aatggtgtgc ttcaaggtat 720 cacgtcatgg ggcagtgaac catgtgccct gcccgaaagg ccttccctgt acaccaaggt 780 ggtgcattac cggaagtgga tcaaggacac catcgtggcc aacccctgag cacccctatc 840 aaccccctat tgtagtaaac ttggaacctt ggaaatgacc aggccaagac tcaagcctcc 900 ccagttctac tgacctttgt ccttaggtgt gaggtccagg gttgctagga aaagaaatca 960 gcagacacag gtgtagacca gagtgtttct taaatggtgt aattttgtcc tctctgtgtc 1020 ctggggaata ctggccatgc ctggagacat atcactcaat ttctctgagg acacagatag 1080 gatggggtgt ctgtgttatt tgtggggtac agagatgaaa gaggggtggg atccacactg 1140 agagagtgga gagtgacatg tgctggacac tgtccatgaa gcactgagca gaagctggag 1200 gcacaacgca ccagacactc acagcaagga tggagctgaa aacataaccc actctgtcct 1260 ggaggcactg ggaagcctag agaaggctgt gagccaagga gggagggtct tcctttggca 1320 tgggatgggg atgaagtaag gagagggact ggaccccctg gaagctgatt cactatgggg 1380 ggaggtgtat tgaagtcctc cagacaaccc tcagatttga tgatttccta gtagaactca 1440 cagaaataaa gagctgttat actgtg 1466 <210> 38 <211> 462 <212> DNA <213> human <220> <221> misc_feature <222> (197)..(197) <223> any kind of base <220> <221> misc_feature <222> (116)..(116) <223> any kind of base <220> <221> misc_feature <222> (334)..(334) <223> any kind of base <220> <221> misc_feature <222> (402)..(402) <223> any kind of base <220> <221> misc_feature <222> (429)..(429) <223> any kind of base <220> <221> misc_feature <222> (438)..(438) <223> any kind of base <220> <221> misc_feature <222> (443)..(443) <223> any kind of base <220> <221> misc_feature <222> (459)..(459) <223> any kind of base <400> 38 taaggtttta taattatttt tatttttctt ttcttttttt tttatggctt ggatgacact 60 ttattttcag atccaatact agaagttgtt tccatgttca cattttcctt cctggnttaa 120 aaaaaagagt tgtatttttt ttttttgctt tttttaaatt atactttaag ttttagggta 180 catgtgcaca acgcagnggt tagctacata tgtatacatg tgccatgttg gcgtgctgca 240 tccagtaact cgtcatttaa cattaggtat atctccaaat gctatccttc cccccattgt 300 atttttcata gcttaaaaat cattgacata ggantaattc caactaaagt acggtattaa 360 atccctgggg gaataaattt tgtcttaaca agggtaaggt tngtgaaaag gatggttttg 420 tcacagggna aaaggganat ccncccattt taaaacccnc ct 462 <210> 39 <211> 1490 <212> DNA <213> human <400> 39 ctcgtgcccc ccacggaggg gactgctctc ccccgctgca tcctttctgt gaggtacctt 60 acccacctca gcacctgaga gggtgaaata gaattctaac ctcgacattc gggaagtgtt 120 tttgagaagt ctcggtcggt aagggaagtc ttccaagtcc gtgcagcact aacgtattgg 180 cacctgcctc ctcttcggcc accccccaga tgaggcagct gtgactgtgt caagggaagc 240 cacgactctg accatagtct tctctcagct tccactgccg tctccacagg aaacccagaa 300 gttctgtgaa caagtccatg ctgccatcaa ggcatttatt gcagtgtact atttgcttcc 360 aaaggatcag gggatcaccc tgagaaagct ggtacggggc gccaccctgg acatcgtgga 420 tggcatggct cagctcatgg aagtactttc cgtcactcca actcagagcc ctgagaacaa 480 tgaccttatt tcctacaaca gtgtctgggt tgcgtgccag cagatgcctc agataccaag 540 agataacaaa gctgcagctc ttttgatgct gaccaagaat gtggattttg tgaaggatgc 600 acatgaagaa atggagcagg ctgtggaaga atgtgaccct tactctggcc tcttgaatga 660 tactgaggag aacaactctg acaaccacaa tcatgaggat gatgtgttgg ggtttcccag 720 caatcaggac ttgtattggt cagaggacga tcaagagctc ataatcccat gccttgcgct 780 ggtgagagca tccaaagcct gcctgaagaa aattcggatg ttagtggcag agaatgggaa 840 gaaggatcag gtggcacagc tggatgacat tgtggatatt tctgatgaaa tcagccctag 900 tgtggatgat ttggctctga gcatatatcc acctatgtgt cacctgaccg tgcgaatcaa 960 ttctgcgaaa cttgtatctg ttttaaagaa ggcacttgaa attacaaaag caagtcatgt 1020 gacccctcag ccagaagata gttggatccc tttacttatt aatgccattg atcattgcat 1080 gaatagaatc aaggagctca ctcagagtga acttgaatta tgacttttca ggctcatttg 1140 tactctcttc ccctctcatc gtcatggtca ggctctgata cctgctttta aaatggagct 1200 agaatgcttg ctggattgaa agggagtgcc tatctatatt tagcaagaga cactattacc 1260 aaagattgtt ggttaggcca gattgacacc tatttataaa ccatatgcgt atatttttct 1320 gtgctatata tgaaaaataa ttgcatgatt tctcattcct gagtcatttc tcagagattc 1380 ctaggaaagc tgccttattc tctttttgca gtaaagtatg ttgttttcat tgtaaagatg 1440 ttgatggtct caataaaatg ctaacttgcc agtgattaaa aaaaaaaaaa 1490 <210> 40 <211> 1677 <212> DNA <213> human <400> 40 cttgacccta tttatagtgg ctctaaaggt ggtgttatta tgttttctag agcacttcga 60 ttatacaaac gtcaaggaat ccgagttaat gtgctttgcc ctgagtttgt tgaaacagac 120 atgggcacaa tgatcggtcc caaattcctt agtatgatgg ggggctttgt acctatggaa 180 atggtggtga aaggtgcttt tgagctcatc actgatgaga ataaagccgg cgattgccta 240 tggattacta atcggcgagg tcttgagtac tggcccaccc catcagaaga agcaaagtac 300 ttgctgcgtt ctacacgttc caggagaaga actgaataca aagctccacc aattaaacta 360 cctgagagtt ttgagaaaat agttgttcag accttgactc acaactttcg gaatgctacc 420 agtgtagtaa gagcaccact gagattacct atcaaaccaa actatgttct tgtgaagata 480 atctatgctg gtgtaaatgc tagtgatgta aattttagct caggtcgcta ttttggtggc 540 aataacagtg acactgcatc ccgtcttccg tttgatgcag gatttgaggc tgtgggagta 600 attgcagcag ttggggattc tgttactgac ttgaaagttg gcatgccttg tgcgttcatg 660 acttttggag gctatgctga atttacaatg attccttcga aatacgccct tccaatgcct 720 agaccagaac cggaaggtgt tgccatgctt acatcaggat taacagcttc aattgctcta 780 gaaaaggcag gacagatgga atctggaaaa gtggtccttg ttactgctgc ggcaggagga 840 actggtcagt ttgctgttca gcttgcaaaa ttagctggta ataccgtggt tgccacttgt 900 ggaggtgggg caaaggccaa gcttctgaaa gaattgggag tcgacagagt catagactat 960 cacagtgaag atataaaaac ggttctaagg aaagagttcc cgaaaggtat tgatatcatc 1020 tacgaatctg ttggtgggga catgttaaag ttgtgcttgg atgctttggc agtccatgga 1080 cgactcattg tcattggcat gatttctcag tatcaaggag aaaatggttg gacgccatca 1140 aaatatcctg gactatgtga gaagctcttg tcaaagagtc aaactgtggc tggctttttc 1200 ctggtgcaat atagtcacat gtaccaagaa caccttaaca agttatttga cctttactct 1260 tccggaaaac taaaggttgc tgtggatcca aagagattta taggccttca ttctgttgct 1320 gatgctgttg agtatctcca ttcaggcaaa agcgttggga aggtggttgt ctgcgtggac 1380 ccgaccttcg gtcatcaagt agccaaatta tgaatgaaca cggtgtcaaa tacagaaaga 1440 agtgaagttt tcaattctta gtctagagat tgttctcgaa tgttactgaa aatagctgct 1500 agaccagtgc tggaatattt attctcaatg ctttttcaat tttggattac ttgaaagaat 1560 aatccattta tgtataccat gtttatgttt acactataca acaactatga gcagaagaaa 1620 gcgagatatc tacaaaataa attataatcc tttcatttta aaaaaaaaaa aaaaaaa 1677 <210> 41 <211> 1330 <212> DNA <213> human <400> 41 atggcgcagt gggacagctt cactgatcaa caggaggaca ctgatagctg ttcagaatct 60 gtgaagtttg atgctcgctc caatacagct ttgcttcccc caaatcctaa aaatggccct 120 ccacttcaag aaaagctgaa atccttcaaa gctgcactga ttgcccttta tctccttgtg 180 tttgctgttc tcattcctat catcgcaata atggcagctc aactcctgaa gtgggaaatg 240 aagaattgca cagttggttc aattaatgca aacagtgtat cctccagtct cctgggaaga 300 ggaaatgaca gtgaagatga agtgagattt cgagaagttg ttatggaaca cattagcaag 360 atggagaaaa gaatccaata tatttcagat actgaagaaa atctcgtaga ttcagagcat 420 tttcaaaatt tcagtgtgac aactgatcaa cgatttgctg atgttcttct ccaactaagt 480 accttggttc ccacagtcca gggacatggg aatgccgtag atgaaatcac caggtcctta 540 ataagtctga ataccacgct gcttgatttg cacctctatg tagaaacact gaatgtcaaa 600 ttccaggaga atacacttaa agggcaagag gaaatcagca aattaaagga gcgtgtgcac 660 aatgcatcag cagaaattat gtctatgaaa gaagaacaag tgcatttgga acaggaaata 720 aaaagagaag tgaaagtcct gaataacatc actaatgatc tcaggctgaa agattgggaa 780 cattctcaga cgttgagaaa tatcacttta attcaaggtc ctcctggacc cccaggagaa 840 aaaggagata gaggtccaac cggagaaagt ggtccaccag gcgttccagg tccagtaggt 900 cctccaggtc ttaagggtga tcgaggatct attggctttc cgggaagtcg aggatatcca 960 ggacaatcag ggaagactgg gaggacagga tatcctggac caaaaggcca aaagggagaa 1020 aaaggcagtg gaagcatcct gactccttct gcgactgtcc gactggttgg tggccgtggc 1080 cctcatgagg gtagagtgga gatattgcac aatggacagt ggggcacagt ttgtgatgat 1140 cactgggaac tgcgtgccgg gcaggttgtc tgcaggagct tgggataccg aggtgttaag 1200 agtgtgcaca agaaagctta ttttggacaa ggtactggtc ccatttggct gaatgaagta 1260 ccctgtttgg ggatggagtc atccattgaa gagtgcaaaa tcagacagtg gggcgtgaga 1320 gtctgttcac 1330 <210> 42 <211> 431 <212> DNA <213> human <220> <221> misc_feature <222> (97)..(97) <223> any kind of base <220> <221> misc_feature <222> (347)..(347) <223> any kind of base <220> <221> misc_feature <222> (349)..(349) <223> any kind of base <220> <221> misc_feature <222> (361)..(361) <223> any kind of base <220> <221> misc_feature <222> (362)..(362) <223> any kind of base <220> <221> misc_feature <222> (363)..(363) <223> any kind of base <220> <221> misc_feature <222> (401)..(401) <223> any kind of base <220> <221> misc_feature <222> (428)..(428) <223> any kind of base <400> 42 ctttttatat ttattttcat cgctacacaa acatttttta ggagtttgat tctacctcca 60 ttttggttag atatacaaac tctaccccat gagggantgt atggtgtatt tctagattta 120 gcaacaattt tcttgaaaaa tgtacaatac tatagaaaaa tgaagatagt aaataccagg 180 tataagttaa taacagtgtt tcttttgttc agtaataatg aactgtgtac tagcactgaa 240 ctttaggccc tcctatttgc gtattttctg tttgtatatt tttaaataga ggaattgtga 300 ttataatatt attattttgg aatatcctaa atcataaatt caaaacntna tttagttttt 360 nnnttttttt tttaagatgg agtcccgctt tgtcccaggc nggagtgcag tggcatgatc 420 tcagctcnct g 431 <210> 43 <211> 669 <212> DNA <213> human <220> <221> misc_feature <222> (641)..(641) <223> any kind of base <400> 43 ttcttttgga aaaccaaaca tgctttattt catttttttc acaatttatt taaacatctc 60 acatatacaa aataggtaca atttaatttt tctgcttgcc caagaaacaa agcttctgtg 120 gaaccatgga agaagatgaa aatgagactg gcaaagaaca aatgctgaat ctgaagaaga 180 ggacaacttt gggcaaataa tctgcatact tttaattggg aataagatgg aaaatatgaa 240 tgctaaatca aattttttaa aaaatacacc acacgataca actcaataca ggagtatttc 300 ttctcaaatt cttctagcac catcaacatt cttcaagtat ctgaaatact attaattagc 360 acctttgtat tatgaacaaa acaaaacaag gacctcagtt catctctgtc taggtcagca 420 cctaacaatg tggatcacac tcatgggaaa gtgttttgag gtagtttaaa cctttggaag 480 tttgggtttt aaacttccct ctgtggaaga tattcaaaag ccacaagtgg tgcaaatgtt 540 tatggttttt atttttcaat ttttattttg gttttcttac aaaggttgac atttttcata 600 acaggtgtaa gagtgttgaa aaaaaaattt caatttttgg ngggaacggg ggaaggagtt 660 aatgaaact 669 <210> 44 <211> 287 <212> DNA <213> human <400> 44 gccggagagt ctacaatgtt acccagcatg ctgttggcat tgttgtaaac aaacaagtta 60 agggcaagat tcttgccaag agaattaatg tgcgtattga gcacattaag cactctaaga 120 gccgagatag cttcctgaaa cgtgtgaagg aaaatgatca gaaaaagaaa gaagccaaag 180 agaaaggtac ctgggttcaa ctaaagcgcc acgctgctcc acccagagaa gcacactttg 240 tgagaaccaa tgggaaggag cctgagctgc tggaacctat tccctat 287 <210> 45 <211> 383 <212> DNA <213> human <220> <221> misc_feature <222> (147)..(147) <223> any kind of base <220> <221> misc_feature <222> (309)..(309) <223> any kind of base <220> <221> misc_feature <222> (349)..(349) <223> any kind of base <220> <221> misc_feature <222> (365)..(365) <223> any kind of base <220> <221> misc_feature <222> (372)..(372) <223> any kind of base <220> <221> misc_feature <222> (380)..(380) <223> any kind of base <400> 45 ggaacggaaa aggagaattc aagtgtgacc ctcatgaggc aacgtgttat gatgatggga 60 agacatacca cgtaggagaa cagtggcaga aggaatatct cggtgccatt tgctcctgca 120 catgctttgg aggccagcgg ggctcgnctt gtgacaactg ccgcagacct ggggggtgaa 180 cccagtcccg aaggcactac tggccagtcc tacaaccagt attcttcaga gataccattc 240 agagaacaaa cactaatgtt taatttgccc aatttgagtg cttcatgcct tttaggatgt 300 tacaggctng acagagaagg ttttcccgag gagttaaatc atctttttnc catttcccga 360 ggggncaagg cntgtttttn ttt 383 <210> 46 <211> 523 <212> DNA <213> human <400> 46 cagaggggca gggcggacgg ctaggagttc aagaaacatc ctggtctgag ggaaaggctg 60 cagctgcacc gccatgaata agcttttcag cttctggaag aggaagaatg agacccgcag 120 ccagggctac aaccttcgag aaaaggattt aaagaaactt cacagagctg cttcagtcgg 180 ggatttgaag aagctgaagg aataccttca gatcaagaaa tatgatgtaa atatgcagga 240 ctatgaatac agaacacctt tgcacctagc ctgtgctaat ggacatacag atgttgtact 300 tttcctaatt gagcaacaat gcaagataaa tgtccgggat agtgaaaaca aatccccatt 360 gattaaggca gtacagtgtc aaaatgagga ttgtgctact attctgctaa actttggtgc 420 agacccagat ctgagggata ttcgttataa tactgttctt cactatgctg tttgtggtca 480 aagtttgtca ttagttgaaa aactgcttga atacgaagct gat 523 <210> 47 <211> 390 <212> DNA <213> human <400> 47 tccaaggtca tggcaaaaca tctgaagttc atcgccagga ctgtgatggt acaggaaggg 60 aacgtggaaa gcgcatacag gaccctaaac agaatcctca ctatggatgg gctcattgag 120 gacattaagc atcggcggta ttatgagaag ccatgccgcc gcgacagagg gaaagctatg 180 aaaggtgccg gcggatctac aacatggaaa tggctcgcaa gatcaacttc ttgatgcgaa 240 agaatcgggc agatccgtgg cagggctgct gaggcctgtg ggtgggacac cagtgcgaaa 300 ccctcatcca gttttctctc catctctttt ctttgtacaa tcccatttcc tattaccatt 360 ctctgcaata aactcaaatc acatgtctgc 390 <210> 48 <211> 669 <212> DNA <213> human <220> <221> misc_feature <222> (641)..(641) <223> any kind of base <400> 48 ttcttttgga aaaccaaaca tgctttattt catttttttc acaatttatt taaacatctc 60 acatatacaa aataggtaca atttaatttt tctgcttgcc caagaaacaa agcttctgtg 120 gaaccatgga agaagatgaa aatgagactg gcaaagaaca aatgctgaat ctgaagaaga 180 ggacaacttt gggcaaataa tctgcatact tttaattggg aataagatgg aaaatatgaa 240 tgctaaatca aattttttaa aaaatacacc acacgataca actcaataca ggagtatttc 300 ttctcaaatt cttctagcac catcaacatt cttcaagtat ctgaaatact attaattagc 360 acctttgtat tatgaacaaa acaaaacaag gacctcagtt catctctgtc taggtcagca 420 cctaacaatg tggatcacac tcatgggaaa gtgttttgag gtagtttaaa cctttggaag 480 tttgggtttt aaacttccct ctgtggaaga tattcaaaag ccacaagtgg tgcaaatgtt 540 tatggttttt atttttcaat ttttattttg gttttcttac aaaggttgac atttttcata 600 acaggtgtaa gagtgttgaa aaaaaaattt caatttttgg ngggaacggg ggaaggagtt 660 aatgaaact 669 <210> 49 <211> 431 <212> DNA <213> human <220> <221> misc_feature <222> (97)..(97) <223> any kind of base <220> <221> misc_feature <222> (347)..(347) <223> any kind of base <220> <221> misc_feature <222> (349)..(349) <223> any kind of base <220> <221> misc_feature <222> (361)..(361) <223> any kind of base <220> <221> misc_feature <222> (362)..(362) <223> any kind of base <220> <221> misc_feature <222> (363)..(363) <223> any kind of base <220> <221> misc_feature <222> (401)..(401) <223> any kind of base <220> <221> misc_feature <222> (428)..(428) <223> any kind of base <400> 49 ctttttatat ttattttcat cgctacacaa acatttttta ggagtttgat tctacctcca 60 ttttggttag atatacaaac tctaccccat gagggantgt atggtgtatt tctagattta 120 gcaacaattt tcttgaaaaa tgtacaatac tatagaaaaa tgaagatagt aaataccagg 180 tataagttaa taacagtgtt tcttttgttc agtaataatg aactgtgtac tagcactgaa 240 ctttaggccc tcctatttgc gtattttctg tttgtatatt tttaaataga ggaattgtga 300 ttataatatt attattttgg aatatcctaa atcataaatt caaaacntna tttagttttt 360 nnnttttttt tttaagatgg agtcccgctt tgtcccaggc nggagtgcag tggcatgatc 420 tcagctcnct g 431

Claims (17)

  1. 서열번호 42 내지 47의 유전자 조합에서 (정상 개체군에서의 동일 유전자의 유전자 발현과 비교하여) 변조된 유전자 발현 차이가 2배 이상이고 차등 변조를 나타내는 p값이 0.05 미만인 각각의 유전자의 차등적 변조를 확인하는 단계를 포함하는 결장직장암 상태의 검사방법.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서, 결장직장암 마커에 대한 효소 면역검정을 이용하는 것을 추가로 포함하는 검사방법.
  5. 제4항에 있어서, 결장직장암 마커가 암배 항원, CA19-9, CA 125, CK-BB 및 구아닐릴 사이클라제 (Guanylyl Cyclase) C로 이루어진 그룹 중에서 선택되는 검사방법.
  6. 서열번호 42 내지 47의 유전자 조합의 분리된 핵산 서열, 이의 상보체 또는 이의 일부분을 포함하는 결장직장암 상태를 검사하기 위한 마이크로어레이.
  7. 삭제
  8. 삭제
  9. 제6항에 있어서, 마이크로어레이가 cDNA 마이크로어레이인 마이크로어레이.
  10. 제6항에 있어서, 마이크로어레이가 올리고뉴클레오타이드 마이크로어레이인 마이크로어레이.
  11. 서열번호 42 내지 47의 유전자 조합의 분리된 핵산 서열, 이의 상보체 또는 이의 일부분을 포함하는 결장직장암을 진단하기 위한 키트.
  12. 제11항에 있어서, 마이크로어레이 분석을 수행하기 위한 시약을 추가로 포함하는 키트.
  13. 제11항에 있어서, 핵산 서열, 이의 상보체 또는 이의 일부분을 분석하는 매체를 추가로 포함하는 키트.
  14. 서열번호 42 내지 47의 유전자 조합에서 (정상 개체군에서의 동일 유전자의 발현과 비교하여) 변조된 유전자 발현 차이가 2배 이상이고, 차등 변조를 나타내는 p값이 0.05 미만인 각각의 유전자의 차등적 변조를 확인하는 단계를 포함하여, 결장직장암의 치료에 대한 반응을 검사하는 방법.
  15. 제14항에 있어서, 치료에 대한 반응 검사가 환자의 호전 여부, 재발, 호전 가능성 또는 재발 가능성의 측정을 포함하는 것인 방법.
  16. 삭제
  17. 삭제
KR1020030019816A 2002-03-29 2003-03-29 결장직장암의 검사방법 KR100991673B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US36879802P 2002-03-29 2002-03-29
US60/368,798 2002-03-29

Publications (2)

Publication Number Publication Date
KR20030078802A KR20030078802A (ko) 2003-10-08
KR100991673B1 true KR100991673B1 (ko) 2010-11-04

Family

ID=28675541

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030019816A KR100991673B1 (ko) 2002-03-29 2003-03-29 결장직장암의 검사방법

Country Status (10)

Country Link
US (1) US20030186302A1 (ko)
EP (1) EP1355149A3 (ko)
JP (2) JP4354724B2 (ko)
KR (1) KR100991673B1 (ko)
CN (2) CN100516233C (ko)
AR (1) AR039617A1 (ko)
AU (1) AU2003203562A1 (ko)
BR (1) BR0303091A (ko)
CA (1) CA2422298C (ko)
MX (1) MXPA03002866A (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4517189B2 (ja) * 2003-05-19 2010-08-04 生化学工業株式会社 糖ヌクレオチド運搬作用を有するタンパク質、組織の癌化の検出方法
JP2009528825A (ja) * 2006-03-03 2009-08-13 ベリデックス・エルエルシー デュークスb大腸がんの再発を予測するための分子的解析
ES2332557B1 (es) * 2007-12-04 2011-02-02 Universidad Autonoma De Madrid Huella genomica para el pronostico de la evolucion de adenocarcinoma colorectal.
TWI483736B (zh) * 2009-10-23 2015-05-11 Millennium Pharm Inc 抗-gcc抗體分子及其相關之組合物及方法
WO2012088146A2 (en) * 2010-12-20 2012-06-28 The University Of Notre Dame Biomarkers and uses thereof in prognosis and treatment strategies for right-side colon cancer disease and left-side colon cancer disease
US20120172244A1 (en) 2010-12-20 2012-07-05 Steven Buechler Biomarkers and uses thereof in prognosis and treatment strategies for right-side colon cancer disease and left-side colon cancer disease
CN102586423B (zh) * 2011-12-27 2015-01-07 盛司潼 一种检测结直肠癌易感基因的方法及试剂盒
CN102586420B (zh) * 2011-12-27 2014-10-22 盛司潼 一种检测乳腺癌易感基因的方法及试剂盒
CN106367527A (zh) * 2016-11-17 2017-02-01 苏州大学附属第二医院 直肠癌放化疗疗效相关靶基因的鉴定
CN112831563A (zh) * 2021-02-08 2021-05-25 复旦大学附属肿瘤医院 一种遗传性结直肠癌的检测panel及检测试剂盒

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5700637A (en) * 1988-05-03 1997-12-23 Isis Innovation Limited Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays
GB8822228D0 (en) * 1988-09-21 1988-10-26 Southern E M Support-bound oligonucleotides
US5143854A (en) * 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5242974A (en) * 1991-11-22 1993-09-07 Affymax Technologies N.V. Polymer reversal on solid surfaces
US5527681A (en) * 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
DE3924454A1 (de) * 1989-07-24 1991-02-07 Cornelis P Prof Dr Hollenberg Die anwendung von dna und dna-technologie fuer die konstruktion von netzwerken zur verwendung in der chip-konstruktion und chip-produktion (dna chips)
IL103674A0 (en) * 1991-11-19 1993-04-04 Houston Advanced Res Center Method and apparatus for molecule detection
US5412087A (en) * 1992-04-24 1995-05-02 Affymax Technologies N.V. Spatially-addressable immobilization of oligonucleotides and other biological polymers on surfaces
US5384261A (en) * 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
US5554501A (en) * 1992-10-29 1996-09-10 Beckman Instruments, Inc. Biopolymer synthesis using surface activated biaxially oriented polypropylene
US5472672A (en) * 1993-10-22 1995-12-05 The Board Of Trustees Of The Leland Stanford Junior University Apparatus and method for polymer synthesis using arrays
US5429807A (en) * 1993-10-28 1995-07-04 Beckman Instruments, Inc. Method and apparatus for creating biopolymer arrays on a solid support surface
US5571639A (en) * 1994-05-24 1996-11-05 Affymax Technologies N.V. Computer-aided engineering system for design of sequence arrays and lithographic masks
US5556752A (en) * 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
US6350576B1 (en) * 1994-12-20 2002-02-26 Cold Spring Harbor Laboratory Cancer detection probes
US5599695A (en) * 1995-02-27 1997-02-04 Affymetrix, Inc. Printing molecular library arrays using deprotection agents solely in the vapor phase
US5624711A (en) * 1995-04-27 1997-04-29 Affymax Technologies, N.V. Derivatization of solid supports and methods for oligomer synthesis
US5545531A (en) * 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
US5658734A (en) * 1995-10-17 1997-08-19 International Business Machines Corporation Process for synthesizing chemical compounds
US6275814B1 (en) * 1996-11-27 2001-08-14 Investment Strategies Network Investment portfolio selection system and method
US6003018A (en) * 1998-03-27 1999-12-14 Michaud Partners Llp Portfolio optimization by means of resampled efficient frontiers
US6218114B1 (en) * 1998-03-27 2001-04-17 Academia Sinica Methods for detecting differentially expressed genes
US6004755A (en) * 1998-04-07 1999-12-21 Incyte Pharmaceuticals, Inc. Quantitative microarray hybridizaton assays
US6218122B1 (en) * 1998-06-19 2001-04-17 Rosetta Inpharmatics, Inc. Methods of monitoring disease states and therapies using gene expression profiles
EP1108021A2 (en) * 1998-08-31 2001-06-20 Bayer Corporation Human genes differentially expressed in colorectal cancer
US6175824B1 (en) * 1999-07-14 2001-01-16 Chi Research, Inc. Method and apparatus for choosing a stock portfolio, based on patent indicators
AU780829B2 (en) * 1999-07-15 2005-04-21 Research Development Foundation Corticotropin releasing factor receptor 2 deficient mice and uses thereof
US6271002B1 (en) * 1999-10-04 2001-08-07 Rosetta Inpharmatics, Inc. RNA amplification method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
J Cell Sci, Vol. 114, No. Pt 11, pp2055-2064 (2001.06)*
J Nutr, Vol. 131, No 11 Suppl, pp3109S-3120S (2001.11)*

Also Published As

Publication number Publication date
JP2003325190A (ja) 2003-11-18
AU2003203562A1 (en) 2003-10-23
US20030186302A1 (en) 2003-10-02
CN1495273A (zh) 2004-05-12
MXPA03002866A (es) 2004-08-11
CA2422298A1 (en) 2003-09-29
JP2009153522A (ja) 2009-07-16
CN101603092A (zh) 2009-12-16
AR039617A1 (es) 2005-03-02
EP1355149A3 (en) 2004-08-25
JP4354724B2 (ja) 2009-10-28
CN100516233C (zh) 2009-07-22
EP1355149A2 (en) 2003-10-22
KR20030078802A (ko) 2003-10-08
CN101603092B (zh) 2012-11-07
BR0303091A (pt) 2004-02-17
CA2422298C (en) 2013-07-30

Similar Documents

Publication Publication Date Title
US10889865B2 (en) Thyroid tumors identified
DK2681333T3 (en) EVALUATION OF RESPONSE TO GASTROENTEROPANCREATIC NEUROENDOCRINE NEOPLASIS (GEP-NENE) THERAPY
CA2442820A1 (en) Microarray gene expression profiling in clear cell renal cell carcinoma: prognosis and drug target identification
KR100984996B1 (ko) 결장직장암의 검사방법
KR100991673B1 (ko) 결장직장암의 검사방법
US20040241725A1 (en) Lung cancer detection
CA2403946A1 (en) Genes expressed in foam cell differentiation
AU2008203227A1 (en) Colorectal cancer prognostics
KR20060122927A (ko) 내피 세포의 발현 프로파일을 이용하여 조직 염증 반응을평가하는 방법
US20230022417A1 (en) Chemical compositions and methods of use
AU2016377391A1 (en) Triage biomarkers and uses therefor
EP2027290A1 (de) Praediktives genexpressionsmuster fuer kolorektale karzinome
US20070298419A1 (en) K-Ras Oligonucleotide Microarray and Method for Detecting K-Ras Mutations Employing the Same
CN1856573A (zh) 用于神经母细胞瘤预后诊断的微阵列和神经母细胞瘤预后诊断方法
CA3064732A1 (en) Methods for melanoma detection
KR101774275B1 (ko) 고추의 여교배 육종을 위한 단일염기다형성 마커 세트 및 이의 용도
KR102632423B1 (ko) 비근침윤성 방광암의 예후 예측을 위한 바이오마커 및 이의 용도
JP2002112799A (ja) 癌疾患の予後判定法
CN115362268A (zh) 用于判断色素沉着皮肤类型的基因多态性标记及其用途
WO2013059152A2 (en) Methods and kits for selection of a treatment for breast cancer
US20040146878A1 (en) Method for gene diagnosis of bovine Hsp70 deficiency

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20131001

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20141007

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20151002

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160929

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee