KR100991673B1 - 결장직장암의 검사방법 - Google Patents
결장직장암의 검사방법 Download PDFInfo
- Publication number
- KR100991673B1 KR100991673B1 KR1020030019816A KR20030019816A KR100991673B1 KR 100991673 B1 KR100991673 B1 KR 100991673B1 KR 1020030019816 A KR1020030019816 A KR 1020030019816A KR 20030019816 A KR20030019816 A KR 20030019816A KR 100991673 B1 KR100991673 B1 KR 100991673B1
- Authority
- KR
- South Korea
- Prior art keywords
- gene
- colorectal cancer
- misc
- microarray
- feature
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6834—Enzymatic or biochemical coupling of nucleic acids to a solid phase
- C12Q1/6837—Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Pathology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 일군의 유전자 발현을 분석하여 결장직장암이 있는 것으로 추정되는 환자의 결장직장암의 존재 유무 또는 가능한 증상을 검사하는 방법에 관한 것이다. 마이크로어레이 등의 각종 매체에 제공된 유전자 발현 프로필은 물론 이 프로필을 포함하는 키트도 포함한다.
유전자 발현, 결장직장암, 마이크로어레이 및 차등 변조
Description
본 출원은 2002년 3월 29일자로 출원된 미국 가출원 번호 제60/368,798호의 우선권을 주장한다.
본 발명은 생물학적 샘플의 유전자 발현 프로필에 기초한 결장직장암의 검사방법 및 예후방법에 관한 것이다.
결장직장암은 3가지 주요 분자 기작, 즉 1) 염색체 불안정과 결부된 β-카테닌 유전자 또는 선종성 결장폴립증 (APC) 유전자의 돌연변이, 2) 짧은 반복체를 포함하는 유전자의 돌연변이 및 현미부수체 (microsatellite) 불안정과 관련있는 DNA 부정합 회복 유전자, 예를 들면, MLH1, MSH2, PMS1, PMS2 및 MSH6의 돌연변이 및 3) 종양 억제인자 유전자의 프로모터 영역의 과메틸화에 의해 유도된 유전자 침묵을 통해 발생하는 것으로 추정되는 종양으로 이루어진 이질 질환이다. 각각의 결장직장암의 유전자 상보체는 유전자 불안정, 특이적 돌연변이 및 유전자 침묵의 여러 조합을 포함할 가능성이 있다. 염색체 불안정성 (CIN)은 일반적으로 암의 공통된 특징이다. 이것은 염색체 전체 또는 대부분이 상실되거나 증가된 이수체 표현형을 나타낸다. 마이크로좀 불안정성 (MIN)은 짧은 반복체의 돌연변이율이 증가된 이배체 종양에서 발견된다. 이 두 형태의 유전자 불안정성은 모두 결장직장암에서 나타난다.
따라서, 결장직장암은 기원이 복잡하고 수많은 여러 생물학적 경로가 상호작용하고 있다. 진단, 예후 또는 치료 모니터링 결정에 도움을 주기 위해 지금까지 사용된 혈청 마커, 조직검사 및 세포검사는 충분한 신뢰성을 제공하지 못하는 경우가 종종 있다. 이와 마찬가지로, 단일 유전자 마커 (예를 들면, 특정 유전자의 발현 증가)의 사용이 유리할 수 있지만, 암의 다양성은 유전자 마커의 포트폴리오가 최선의 방법일 가능성을 높이고 있다.
본 발명은 결장직장암이 있는 것으로 추정되는 환자의 결장직장암의 존재 유무 또는 가능한 증상을 검사하는 방법에 관한 것이다. 이 방법에서는, 환자가 결장직장암을 앓고 있는지, 환자가 결장직장암을 앓고 있지 않은지, 환자가 결장직장암에 걸릴 가능성이 있는지 또는 결장직장암 치료를 받는 환자의 치료에 대한 반응을 측정하기 위하여 환자 샘플의 유전자 발현 프로필을 분석한다.
또한, 본 발명은 다른 관점으로서 상기 방법을 수행하는데 사용되는 물품에 관한 것이다. 이 물품은 컴퓨터 판독 매체와 같은 기계판독식 매체에 배치되는 유전자 발현 프로필 또는 이 프로필의 표현물 (representation)을 포함하는 것이다.
유전자 발현 프로필을 확인하는데 사용되는 물품은 또한 유전자 발현의 존재 유무 또는 발현 정도를 포착하고/하거나 나타내는 마이크로어레이와 같은 기판 또는 표면을 포함할 수 있다.
특정 핵산 서열이 조직 샘플에 존재하는지의 여부 만으로 진단적 또는 예후적 가치를 둔 적은 별로 없다. 하지만, 다양한 단백질, 펩타이드 또는 mRNA의 발현에 대한 정보는 점차 중요하게 여겨지고 있다. 게놈 자체내에 단백질, 펩타이드 또는 mRNA (예컨대, "유전자"로 지칭되는 서열)를 발현할 잠재성이 있는 핵산 서열의 존재만으로는 소정 세포내에서 단백질, 펩타이드 또는 mRNA가 발현되는지의 여부를 결정할 수 없다. 단백질, 펩타이드 또는 mRNA를 발현할 수 있는 소정 유전자가 발현할 지의 여부, 및 발현된다면, 이러한 발현이 일어나는 정도는 다양한 복합적인 요인에 따라 결정된다. 이러한 요인을 규명하고 검사하는 데에는 어려움이 있지만, 이에 상관없이 유전자 발현의 분석은 종양원성, 전이, 아폽토시스 및 다른 임상 관련 현상 등의 주요 증상의 발생에 대한 유용한 정보를 제공할 수 있다. 유전자가 활성 또는 비활성 정도의 상대적 표시는 유전자 발현 프로필을 통해 알 수 있다. 본 발명의 유전자 발현 프로필은 결장직장암 환자의 검사 및 치료에 사용된다.
샘플 준비를 위해 환자 샘플을 수집한다. 본 발명의 방법에 사용한 환자의 샘플은 결장 샘플로부터 또는 절제연 (surgical margin)으로부터 취한 상피 세포와 같은 질병 세포를 포함할 것으로 의심되는 것이다. 의심되는 샘플을 수득하는데 유용한 1가지 기법은 레이저 캡춰 미세해부법 (LCM)이다. LCM 기술은 세포 종류의 이종원성에 의한 가변성을 최소화하면서 연구할 세포를 선택하는 방법을 제공한다. 즉, 정상 세포와 암 세포 사이의 유전자 발현의 중간 정도의 변화 또는 적은 변화도 용이하게 검진할 수 있다. 바람직한 방법은 샘플이 말초 혈액에서 추출한 순환성 상피 세포를 포함하는 것이다. 이것은 다양한 방법에 따라 수득할 수 있지만, 가장 바람직한 방법은 본원에 참고인용된 미국 특허 제6,136,182호 (Immunivest Corp)에 기재된 자기 분리 기법이다. 일단 목적하는 세포를 포함하는 샘플을 수득하였으면 RNA를 추출하여 증폭시키고 적당한 포트폴리오의 유전자들에 대하여 유전자 발현 프로필을, 바람직하게는 마이크로어레이를 통해 수득한다.
유전자 발현 프로필을 구축하는 바람직한 방법은 단백질이나 펩타이드를 암호할 수 있는 유전자에 의해 생산되는 RNA의 양을 측정하는 것을 포함한다. 이것은 역전사효소 PCR (RT-PCR), 경쟁적 RT-PCR, 실시간 RT-PCR, 차등적 표시 RT-PCR, 노던 블롯 분석 및 다른 관련 시험을 통해 수행한다. 각각의 PCR 반응을 이용하는 상기 기술을 수행하는 것도 가능하지만 가장 바람직한 것은 mRNA로부터 생산된 상보성 DNA (cDNA) 또는 상보성 RNA (cRNA)를 증폭시키고 이것을 마이크로어레이를 통해 분석하는 것이다. 이의 생산을 위한 다양한 많은 어레이 배열과 방법에 대해서는 당해 기술분야에 공지되어 있고, 특히 미국 특허문헌, 예를 들면, 제5,445,934호; 제5,532,128호; 제5,556,752호; 제5,242,974호; 제5,384,261호; 제5,405,783호; 제5,412,087호; 제5,424,186호; 제5,429,807호; 제5,436,327호; 제5,472,672호; 제5,527,681호; 제5,529,756호; 제5,545,531호; 제5,554,501호; 제5,561,071호; 제5,571,639호; 제5,593,839호; 제5,599,695호; 제5,624,711호; 제5,658,734호; 및 제5,700,637호에 설명되어 있으며, 이 문헌들은 모두 본 명세서에 참고인용되고 있다.
마이크로어레이 기술은 수천가지 유전자의 안정된 mRNA 농도를 동시에 측정할 수 있게 하며, 이에 따라 비제어성 세포 증식의 개시, 정지 또는 변조와 같은 효과를 확인하는데 강력한 도구로 나타나고 있다. 현재 2가지 마이크로어레이 기술이 널리 사용되고 있다. 그 한 가지는 cDNA 어레이이고 다른 한 가지는 올리고뉴클레오타이드 어레이이다. 이 칩들을 제작하는 데에 차이가 있기는 하지만, 사실상 모든 후속 데이터 분석과 결과물은 동일하다. 이 분석의 산물은 일반적으로 마이크로어레이에 공지의 위치에 있는 핵산 서열과 하이브리드하는 샘플 유래의 cDNA 서열을 측정하는데 사용된 표지된 프로브로부터 수신된 시그널 강도의 측정값이다. 일반적으로, 시그널의 강도는 샘플 세포에서 발현된 cDNA 및 이에 따른 mRNA의 함량과 비례한다. 이와 같은 기법으로는 이용할 수 있고 유용한 다양한 기법이 있다. 유전자 발현을 측정하는 바람직한 방법은 미국 특허 제6,271,002호 (Linsley et al.); 제6,218,122호 (Friend, et al.); 제6,218,114호 (Peck, et al.); 및 제6,004,755호 (Wang et al.)에 기재되어 있으며, 이 문헌들은 모두 본 명세서에 참고인용된 것이다.
발현량의 분석은 이와 같은 강도를 비교하여 수행한다. 이것은 대조 샘플에 존재하는 유전자의 발현 강도에 대한 시험 샘플에 존재하는 유전자의 발현 강도의 비율 행렬 (ratio matrix)을 작성하여 수행하는 것이 가장 좋다. 예를 들어, 질병 조직 유래의 유전자 발현 강도와 동종의 정상 조직 유래의 유전자 발현 강도를 비교한다 (예를 들어 질병 결장 조직 샘플 대 정상 결장 조직 샘플). 이 발현 강도의 비율은 시험 샘플와 대조 샘플 사이의 유전자 발현의 변화율을 나타낸다.
유전자 발현 프로필은 또한 다양한 방식으로 나타낼 수 있다. 가장 일반적인 방법은 원 형광 강도 또는 비율 행렬을, 종렬이 시험 샘플을 나타내고 횡렬이 유전자를 나타내는 계통수 그래프로 배열하는 것이다. 이 데이터는 발현 프로필이 유사한 유전자가 서로 근접하도록 배열된다. 예를 들어, 각 유전자의 발현 비율은 색으로 확인된다. 예를 들어, 1 미만의 비율 (하향-조절을 나타냄)은 스펙트럼의 청색부분에서 나타나고, 1 초과의 비율 (상향-조절을 나타냄)은 스펙트럼의 적색부분에서 색으로 나타날 수 있다. 이러한 데이터를 나타내기 위하여 "GENESPRING" (실리콘 제네틱스, 인코포레이티드) 및 "DISCOVERY"와 "INFER" 소프트웨어 (파텍 인코포레이티드)를 비롯한 시판되는 컴퓨터 소프트웨어 프로그램을 이용할 수 있다.
본 발명의 방법에서 변조된 유전자는 표 1에 제시하였다. 차등 발현되는 유전자는 질병 세포에서 상향-조절 또는 하향-조절되는 것을 나타낸다. 상향-조절과 하향-조절은 유전자 발현의 함량이 어느 기준선에 상대적으로 검출되는 차이 (측정에 사용된 시스템에서 노이즈 이상의 차이)가 있다는 것을 의미하는 상대적 용어이다. 이 경우에, 기준선은 정상 세포에서 측정된 유전자 발현량이다. 질병 세포 중의 당해 유전자는 동일한 측정법을 사용했을 때 기준 양보다 상향-조절되거나 하향-조절된다. 이 내용에서 질병이란 세포의 비제어성 증식을 일으키는 바 신체 기능의 정상 수행력을 방해하거나 방해할 잠재성이 있는 신체 상태의 변화를 의미한다. 사람의 유전자형이나 표현형의 일부가 질병 존재시와 동일하다면 그 사람은 질병이 있는 것으로 간주한다. 하지만, 검진이나 예후를 수행하는 행위는 치료 모니터링과 같은 질병/상태를 결정하는 문제를 수반한다. 치료 모니터링에서 임상적 판단은 일정 시간 동안의 유전자 발현을 비교하여 유전자 발현 프로필이 정상 조직과 보다 일치하는 패턴으로 변화가 이루어졌거나 변화가 이루어지고 있는지를 측정함으로써 주어진 치료 과정의 효과를 주시하면서 이루어진다.
상향-조절과 하향-조절의 정도는 하이브리드화된 마이크로어레이 프로브의 강도 측정값의 변화율에 기초하여 구분하는 것이 바람직하다. 2.0배의 차이는 이러한 구분 또는 0.05 미만의 p값을 만드는데 바람직하다. 즉, 질병 세포가 정상 세포 보다 적어도 2배 이상, 또는 2배 미만으로 산출한다면 유전자는 정상 세포에 비해 질병 세포에서 차등 발현된다고 한다. 그 배수 차이가 크면 클수록 유전자는 진단용으로 사용하기가 더 좋다. 본 발명의 유전자 발현 프로필을 위해 선택한 유전자는 임상용 실험 기구 사용시의 배경값을 초과하는 양만큼 정상 유전자 또는 비변조성 유전자의 발현량과 구분되는 시그널을 생성하는 발현량을 나타내는 것이다.
비변조성 유전자와 노이즈로부터 변조된 유전자를 신뢰성있게 구분하기 위하여 통계값을 사용할 수 있다. 통계 시험은 다양한 그룹의 샘플 사이에 가장 유의적인 차이가 있는 유전자를 찾아낸다. 스튜던트 t 검정은 두 그룹 사이의 유의적인 차이를 찾는데 사용할 수 있는 강력한 통계 시험의 일례이다. p값이 낮을수록, 유전자가 여러 그룹 사이의 차이를 보여준다는 증거가 더욱 확고해진다. 그러나, 마이크로어레이는 한번에 1 이상의 유전자를 측정하기 때문에 수십만의 통계 시험이 한번에 요구될 수 있다. 이 때문에 작은 p값이 단지 우연히 나타날 가능성이 있고, 이에 대하여 시닥 (Sidak) 보정을 이용한 조정은 물론 무작위/과돌연변이 실험이 실시될 수 있다. t-검정에 의한 0.05 미만의 p값은 그 유전자의 유의적 차이를 입증하는 것이다. 이 보다 확고한 입증은 시닥 보정이 이루어진 후의 p값이 0.05 미만인 것이다. 각 그룹의 다수의 샘플들에 대한 무작위/과돌연변이 시험 후의 0.05 미만의 p값은 유의적 차이를 가장 확고하게 입증하는 것이다.
비변조된 유전자 또는 노이즈의 시그널 보다 큰 시그널을 나타내는 유전자를 선택하는데 사용할 수 있는 다른 변수는 절대 시그널 차이 측정값이다. 변조된 유전자 발현에 의해 나타나는 시그널은 정상 또는 비변조된 유전자의 시그널 보다 20% 이상 차이가 나는 것이 바람직하다 (절대값 기준). 보다 바람직하게는, 유전자가 정상 또는 비변조된 유전자의 시그널과 30% 이상의 차이가 나는 발현 패턴을 나타내는 것이다.
유전자는 그룹내 유전자 세트에 대해 수득된 정보가 진단, 예후 또는 치료 선택과 같은 임상과 관련된 판단시의 유효한 기준을 제공하도록 그룹화될 수 있다. 이러한 세트의 유전자는 본 발명의 포트폴리오를 구성한다. 이 경우에, 그 포트폴리오에 의해 지지되는 판단은 결장직장암을 포함한다. 유전자 발현 프로필의 포트폴리오는 실시예 3에 기재된 유전자 조합으로 이루어질 수 있다. 대부분의 진단 마커와 마찬가지로 정확한 의학적 판단을 하기에 충분한 최소한의 마커를 이용하는 것이 바람직한 경우가 종종 있다. 이것은 추가 분석 동안의 치료 지연과 더불어 부적당한 시간과 자산의 사용을 방지한다. 이 경우에는, 실시예 4에 제시된 유전자 조합으로 상기한 최소 포트폴리오를 구성할 수 있다.
포트폴리오는 이 포트폴리오내 유전자 조합이 각각의 유전자 또는 무작위 선발된 유전자 조합에 비하여 개선된 감도와 특이성을 나타내는 것이 바람직하다. 본 발명의 내용 중에서 포트폴리오의 감도는 정상 상태에 대한 상대적인 질병 상태에서의 유전자 발현에 의해 나타나는 차이 배수로 알 수 있다. 특이성은 당해 증상과 유전자 발현 시그널 전달의 상관관계를 측정한 통계를 통해 알 수 있다. 예를 들어, 이러한 척도로서 표준 편차를 사용할 수 있다. 일군의 유전자를 포트폴리오에 포함시키고자 하는 경우에 발현 측정값의 작은 표준 편차는 특이성이 보다 크다는 상관관련성을 의미한다. 상관관계 계수와 같은 변화의 다른 측정값도 이와 같은 역할에 사용할 수 있다.
유전자 발현 포트폴리오를 구축하는데 가장 바람직한 방법은 스톡 포트폴리오 구축에 널리 사용되는 평균 분산 알고리듬과 같은 최적화 알고리듬의 사용을 통한 것이다. 이 방법은 팀 자트코에 (Tim Jarkoe) 등에 의해 동일자로 출원되고 공계류중인 특허출원 "포트폴리오 선발 (Portfolio Selection)"에 상세히 설명되어 있다. 사실상, 이 방법은 복귀값 (예, 발생된 시그널)을 최적화하는 입력값 세트 (재정 분야에서는 스톡, 본원에서는 강도로 측정되는 발현)의 구축을 필요로 하며, 복귀값의 가변성을 최소화하면서 이를 사용하기 위해 수취한다. 시판되는 많은 소프트웨어 프로그램은 이러한 작업에 이용될 수 있다. 본 명세서에서 "바그너 (Wagner) 소프트웨어"라고 부르는 "Wagner Associates Mean-Variance Optimization Application"이 바람직하다. 이 소프트웨어는 "Wagner Associates Mean-Variance Optimization Library" 유래의 기능을 이용하여 마르코비츠식의 최적의 포트폴리오와 효율적인 경계를 결정하여 바람직하다.
이러한 종류의 소프트웨어는, 이 소프트웨어가 재정 분석용으로 사용될 때에는 스톡 복귀값과 위험 척도가 사용되는 방식으로, 입력값으로 처리될 수 있도록 마이크로어레이 데이터가 변형될 것을 요구한다. 예를 들어, 바그너 소프트웨어를 마이크로어레이 강도 측정값과 함께 사용할 때에는 다음과 같은 데이터 변환법을 사용한다.
먼저, 적어도 약간의 최소 발현 수준의 차이를 나타내는 유전자를 확인하여 예비선발한다. 이 예비선발 과정은 다음과 같이 실시하는 것이 바람직하다. 기준군을 선발한다. 일반적으로, 기준군에는 당해 증상을 가지지 않는 개체군 유래의 유전자가 포함된다. 예를 들어, 유방암 진단용인 유전자 포트폴리오를 선발하고자 하는 경우에는, 유방암이 없는 환자의 샘플을 사용하여 기준군을 구성한다. 기준군을 일단 선발하고 난 뒤, 기준군 샘플에 속하는 각 유전자의 유전자 발현 지시인자로 산술적 평균값과 표준 편차를 계산한다. 이 지시인자는 일반적으로 마이크로어레이 판독값의 형광 강도이다. 그 다음, 전산화된 통계 데이터를 이용하여 각 유전자 마다의 (X*표준편차 + 평균)의 기준값을 계산한다. 이것은 다른 모든 샘플이 비교될 수 있는 유전자에 대한 기준 판독값이다. X는 포트폴리오를 구축하는 사람에 의해 선택되는 엄중도 변수이다. X 값이 높을수록 낮은 것보다 엄중도가 높아진다. X는 0.5 내지 3 범위인 것이 바람직하고, 2 내지 3인 것이 보다 바람직하며, 3인 것이 가장 바람직하다.
그 다음, 각 실험 샘플마다의 기준 판독값에 대한 비율을 계산한다. 이 비율을 기본 10 로그값으로 변환시켜 소프트웨어가 데이터를 용이하게 취급할 수 있도록 한다. 이것은 하향-조절된 유전자의 경우 바그너 소프트웨어를 이용한 마크만 (Markman) 평균 분산 알고리듬에 따라 최적화에 필요한 음의 값을 나타낼 수 있게 해준다.
이와 같이 변환된 비율을 포함하는 예비처리된 데이터는 재정 분석용으로 사용될 때 바그너 스프트웨어에서 일반적으로 사용되는 자산 복귀값 대신에 입력값으로 사용된다.
일단 효율적인 경계가 조성되면, 경계 상의 한 점에 해당하는 소정의 입력 레벨 (복귀값) 또는 분산에 최적화된 포트폴리오를 선발한다. 이러한 입력값 또는 분산은 포트폴리오의 조성자에 의해 정해지는 소정의 표준값이다. 다르게 말하면, 최적의 포트폴리오를 구하고자 하는 사람은 허용되는 입력 레벨 (감도) 또는 소정 분산 레벨 (특이성)을 측정하여 그 입력 레벨 또는 분산에 상응하는 효율적인 경계를 따라 위치하는 유전자를 선발한다. 바그너 소프트웨어는 입력 레벨 또는 분산이 선발되었을 때 상기와 같은 유전자를 선발할 수 있다. 또한, 스톡 포트폴리오에서 스톡에 대한 것처럼 이 포트폴리오에 속한 각 유전자마다 가중치를 실어줄 수 있다.
샘플이 그 포트폴리오의 진단 목적에 맞는 조건을 갖고 있는지는 환자 샘플에서의 포트폴리오내 유전자 발현을 포트폴리오 구축에 사용된 차등 발현된 유전자의 계산값과 비교하여 측정할 수 있다. 먼저 포트폴리오 선발 과정에서 각 유전자에 할당된 가중치와 그 포트폴리오내 각 유전자의 강도값의 곱셈값을 합하여 포트폴리오값을 얻는 것이 바람직하다. 그 다음, 경계값은 (기준 그룹의 Y* 표준편차 + 포트폴리오 평균값)으로 계산하는데, 여기에서 Y는 전술한 X값과 동일한 의미를 갖는 엄중도 값이다. 포트폴리오 값이 기준군의 포트폴리오 값보다 큰 샘플은 조건을 갖춘 것으로 분류한다. 필요하다면, 이 방법은 신뢰율을 향상시키기 위한 공지의 통계법에 따라 반복하여 실시할 수 있다.
경우에 따라서는 최상의 예측 정확도가 얻어질 때까지 이 방법을 반복할 수도 있다.
미지의 포트폴리오 선발 및 특성화하는 방법을 요약하면 다음과 같다:
1. 기준군을 선택한다.
2. 기준군 샘플에 속한 각 유전자의 평균값과 표준편차를 계산한다.
3. 각 유전자 마다 (X*표준편차 + 평균값)을 계산한다. 이것은 다른 모든 샘플이 비교되는 기준 판독값이다. X는 값이 높을수록 낮은 것보다 더욱 엄중해지는 엄중도 변수이다.
4. 단계 3에서 계산된 기준 판독값에 대한 각 실험 샘플 사이의 비율을 계산한다.
5. 1 미만의 비율이 음의 값을 갖도록 비율을 변환시킨다 (예를 들면, 기본 로그 10 사용) (이제, 하향-조절된 유전자는 MV 최적화에 필요한 음의 값을 정확하게 갖는다).
6. 이와 같이 변환된 비율을, 소프트웨어 적용에 일반적으로 사용되는 자산 복귀값 대신에 입력값으로서 사용한다.
7. 이 소프트웨어는 효율적인 경계를 플롯팅하고 이 경계를 따라 임의의 지점에 최적화된 포트폴리오를 복귀시킨다.
8. 효율적인 경계 상에서 바람직한 복귀값 + 분산을 선택한다.
9. 포트폴리오 선발 알고리듬에 의해 산출된 가중치와 각 유전자의 강도값의 곱셈값을 합하여 각 샘플에 대한 포트폴리오값을 계산한다.
10. 다음, 경계값은 기준 포트폴리오 값의 표준편차에 Y를 곱한 값에 기준 그룹의 포트폴리오 평균값을 더하여 계산한다. 이 경계값 보다 큰 값은 실험 군으로 분류할 수 있다.
11. 경우에 따라 최상의 예측 정확도가 얻어질 때까지 이 방법을 반복하여 실시할 수 있다.
대안적으로, 유전자는 약간의 최소 발현 레벨의 차이를 나타내는 유전자를 확인하여 먼저 예비선발할 수 있다. 이 대안법에서의 예비선발은 하기 식으로 표시되는 한계값에 기초하는 것이 바람직하다:
이 식에서 μt는 질병이나 증상이 있는 것으로 알려진 서브세트의 평균값이고, μn은 정상 샘플의 서브세트의 평균값이며, σt+σn은 표준편차의 합을 나타낸다. 노이즈에 대한 시그널 컷오프값은 관계식 에 따라 데이터를 예비선발하여 사용할 수 있다. 이것은 차등 변조에 기초하여 예비선발된 유전자가 임상적으로 유의적 차이를 나타낼 수 있도록 한다. 즉, 기구의 노이즈 레벨 이상의 값이 진단상의 변수를 측정하는 임무에 적당하다. 이러한 기준에 따라 예비선발된 각 마커마다 종렬이 샘플을 나타내고 횡렬이 마커를 나타내며, 각 요소는 관계식 (이 식에서 I는 강도 측정값이다)에 따라 그 마커의 발현에 대한 정규화된 강도 측정값을 나타내는 행렬을 구축한다.
또한, 최적의 포트폴리오를 규정하는 부가 한계 조건을 설정할 수도 있다. 예를 들어, 포트폴리오 크기를 고정된 범위 또는 수의 마커에 한정할 수 있다. 이것은 데이터 예비선발 기준으로 보다 엄격하게 하거나 (예를 들면, 대신 사용) 또는 포트폴리오 크기 제한과 같은 프로그래밍된 특징을 사용하여 실시할 수 있다. 예를 들면, 효율적인 경계를 단지 가장 최적인 10개의 유전자 중에서 선발해야 하는 한계 조건을 설정할 수 있다. 또한, 효율적인 경계에는 예비선발된 모든 유전자를 사용한 뒤 선발된 유전자의 수를 제한 (예를 들면, 10개 이하)할 수 있다.
또한, 포트폴리오 선발 방법에는 경험 (heuristic) 규칙을 적용할 수도 있다. 이 규칙은 임상 결과를 나타내는데 사용된 기법의 이해와 생물학에 기초하여 구성되는 것이 바람직하다. 특히, 최적화 방법으로부터 얻어진 결과물에 적용되는 것이 보다 바람직하다. 예를 들어, 포트폴리오 선발의 평균 분산 방법을 유방암 환자에게서 차등 발현되는 많은 유전자들에 대한 마이크로어레이 데이터에 적용할 수 있다. 이 방법의 결과물은 질병 유방 조직은 물론 말초 혈액에서 발현되는 일부 유전자를 포함할 수 있는 최적화된 유전자 세트일 수 있다. 이 시험 방법에 사용된 샘플이 말초 혈액에서 얻은 것이고 유방암의 증례에서 차등 발현되는 특정 유전자가 또한 말초 혈액에서도 차등 발현된다면, 말초 혈액에서 차등 발현되는 유전자를 제외하고는 경험 규칙을 적용하여 효율적인 경계 중에서 포트폴리오를 선발한다. 물론, 예를 들어 데이터 예비선발 동안 규칙을 적용하는 등과 같이 효율적인 경계 형성 전에 규칙을 적용할 수 있다.
당해 생물학에 필연적 관련성이 없는 다른 경험 규칙을 적용할 수도 있다. 예를 들어, 다만 소정 비율의 포트폴리오만이 특정 유전자(들)를 나타낼 수 있는 규칙을 적용할 수 있다. 바그너 소프트웨어와 같이 시판되는 소프트웨어는 이러한 유형의 경험을 용이하게 수용한다. 이것은, 예를 들어, 정확성 이외의 다른 요인 (예를 들면, 예상 라이센싱 비용)가 1 이상의 유전자를 포함시키고자 하는 목적에 영향을 줄 때 유용할 수 있다.
본 발명의 한 가지 방법은 전술한 진단법을 수행하는 다양한 유전자 (또는 포트폴리오)의 유전자 발현 프로필을 비교하는 것을 포함한다. 포트폴리오를 포함하는 각 유전자의 유전자 발현 프로필을 컴퓨터 판독 매체와 같은 매체에 배치시킨다. 이러한 배치에는 다양한 형태를 이용할 수 있다. 예를 들어, 질병을 나타내는 시그널 (예, 강도 측정값) 범위를 입력한 표를 작성할 수 있다. 이 표의 값을 실제 환자의 데이터와 비교하여 환자 샘플이 정상인지 질병이 있는지 결정한다. 보다 복잡한 양태에 있어서, 발현 시그널 (예, 형광 강도)의 패턴을 수치나 그래프로 기록한다. 환자 샘플와 함께 사용한 유전자 포트폴리오의 유전자 발현 패턴을 그 다음 상기 발현 패턴과 비교한다. 그 다음, 패턴 비교 소프트웨어를 사용하여 환자 샘플이 당해 질병을 나타내는 패턴이 있는지 결정한다. 물론, 이러한 비교는 환자 결과물이 정상인지를 결정하는데에도 사용할 수 있다. 샘플의 발현 프로필을 그 다음 정상이나 대조 세포의 포트폴리오와 비교한다. 샘플의 발현 패턴이 결장직장암의 발현 패턴과 일치하면 (상쇄되는 의학적 고찰이 없는 가운데) 그 환자는 결장직장암 양성으로 진단한다. 샘플 발현 패턴이 정상/대조 세포의 발현 패턴과 일치하면 그 환자는 결장직장암 음성으로 진단한다.
패턴 인식 방법으로는 다양한 공지의 방법을 이용할 수 있다. 다음과 같은 참고문헌에 몇가지 예가 있다:
가중된 투표법에 대한 문헌:
Golub, TR., Slonim, DK., Tamaya, P., Huard, C., Gaasenbeek, M., Mesirov, JP., Coller H., Loh, L., Downing, JR., Caligiuri, MA., Bloomfield, CD., Lander, ES. Molecular classification of cancer: class discovery and class prediction by gene expression monitoring. Science 286: 531-537, 1999.
지지체 벡터 기구에 대한 문헌:
Su, AI., Welsh, JB., Sapinoso, LM., Kern, SG., Dimitrov, P., Lapp, H., Schultz, PG., Powell, SM., Moskaluk, CA., Frierson, HF. Jr., Hampton, GM. Molecular classification of human carcinomas by use of gene expression signatures. Cancer Research 61: 7388-93, 2001.
Ramaswamy, S., Tamayo, P., Rifkin, R., Mukherjee, S., Yeang, CH., Angelo, M., Ladd, C., Reich, M., Latulippe, E., Mesirov, JP., Poggio, T., Gerald, W., Loda, M., Lander, ES., Gould, TR. Multiclass cancer diagnosis using tumor gene expression signatures Proceedings of the National Academy of Sciences of the USA 98: 15149-15154, 2001.
K-최근접 이웃에 대한 문헌:
Ramaswamy, S., Tamayo, P., Rifkin, R., Mukherjee, S., Yeang, CH., Angelo, M., Ladd, C., Reich, M., Latulippe, E., Mesirov, JP., Poggio, T., Gerald, W., Loda, M., Lander, ES., Gould, TR. muticlass cancer diagnosis using tumor gene expression signatures Proceedings of the National Academy of Sciences of the USA 98: 15149-15154, 2001.
상관관계 계수에 대한 문헌:
van't Veer LJ, Dai H, van de Vijver MJ, He YD, Hart AA, Mao M, Peterse HL, van der Kooy K, Marton MJ, Witteveen AT, Schreiber GJ, Kerkhoven RM, Roberts C, Linsley PS, Bernards R, Friend SH. Gene expression profiling predicts clinical outcome of breast cancer. Nature. 2002 Jan 31; 415(6871): 530-6.
본 발명의 유전자 발현 프로필은 또한 암 진단, 예후 또는 치료 모니터링에 유용한 다른 비유전자성 진단 방법과 함께 사용될 수 있다. 예를 들어, 전술한 유전자 발현에 기초한 방법의 진단력과 혈청 단백질 마커 (예, 암배 항원)와 같은 통상의 마커로부터 얻어진 데이터를 조합하는 것이 유리하다. 이와 같은 마커의 범위에는 CA19-9, CA125, CK-BB 및 구아닐릴 사이클라제 C와 같은 피분석물 등이 있다. 이와 같은 방법의 하나로서, 치료중인 환자로부터 혈액을 주기적으로 채혈한 뒤, 전술한 혈청 마커 중의 하나를 가지고 효소면역분석법을 실시한다. 마커 농도가 종양 복귀 또는 치료 실패를 암시하면 유전자 발현 분석이 용이한 샘플 공급원을 채취한다. 의심되는 덩어리가 존재한다면, 미세바늘 흡인물을 취하고 그 덩어리에서 취한 세포의 유전자 발현 프로필을 전술한 바와 같이 분석한다. 대안적으로, 이전에 종양이 제거되었던 조직에 인접한 구역에서 조직 샘플을 채취할 수도 있다. 이 방법은 다른 시험 결과가 모호할 때 특히 유용하다.
다른 진단과 유전자 마커 사용의 조합은 다른 진단의 신뢰성이 의심스러울 때 가장 바람직하다. 예를 들어, CEA의 혈청 농도는 환자의 암 상태와 전혀 무관한 요인에 의해 상당한 영향을 받을 수 있다는 것이 알려져 있다. 결장직장암 치료 후 모니터링한 환자가 통상의 CEA 분석값이 상승된 수준인 경우에는 유전자 발현/CEA 분석의 조합법을 사용하는 것이 유리하다.
본 발명의 물품은 치료, 진단, 예후 및 다른 질환 검사에 유용한 유전자 발현 프로필의 표현물을 포함한다. 이러한 프로필 표현물은 컴퓨터 판독 매체 (자기, 광학 등)와 같은 기계에 의해 자동 판독될 수 있는 매체로 변형된다. 이 물품은 또한 이러한 매체에서 유전자 발현 프로필을 검사하는 지침서를 포함할 수 있다. 예를 들어, 이 물품은 전술한 유전자 포트폴리오의 유전자 발현 프로필을 비교하기 위한 컴퓨터 지침을 구비한 CD 롬 (ROM)을 포함할 수 있다. 이 물품은 또한 환자 샘플의 유전자 발현 데이터와 비교할 수 있도록 수치 기록된 유전자 발현 프로필을 구비할 수 있다. 또는, 이 프로필은 다른 표현 방식으로 기록될 수도 있다. 이러한 방식의 하나가 그래프 기록이다. 전술한 "GENESPRING" 및 "DISCOVER" 컴퓨터 프로그램에 포함된 것과 같은 클러스터 알고리듬은 이러한 데이터의 가시화에 최선의 도움을 줄 수 있다.
본 발명에 제시된 상이한 유형의 제조 물품은 유전자 발현 프로필을 나타내는데 사용되는 매체 또는 포맷된 분석물이다. 이는 예를 들어 서열 상보체 또는 프로브가 당해 유전자를 나타내는 서열이 결합된 매트릭스에 배치되어 그 존재에 대한 판독가능한 결정값을 산출하는 마이크로어레이를 포함할 수 있다. 대안적으로, 본 발명의 물품은 결장직장암을 검사하기 위한 하이브리드화, 증폭 및 당해 유전자의 발현 수준을 나타내는 시그널 생성을 수행하기 위한 시약 키트로 제조될 수 있다.
본 발명에 따라 제조되는 키트는 유전자 발현 프로필을 측정하는 포맷된 분석물을 포함한다. 이 키트에는 시약과 지침서와 같은 분석 수행에 필요한 모든 재료 또는 일부 재료가 포함될 수 있다.
본 발명은 다음의 실시예를 통해 보다 상세하게 설명되지만, 이것에 국한되는 것은 아니다.
실시예
본 발명에 따라 분석된 유전자는 진뱅크 (GenBank) 데이터베이스에서 부쳐진 유전자 ID 번호를 참고하여 표시하였다. 이 유전자는 일반적으로 단백질 또는 펩타이드의 생산을 위해 암호화하는 전장의 핵산 서열에 관한 것이다. 당업자라면 전장의 서열이 분석적 측면에 필수적인 것은 아니라는 것을 잘 알고 있을 것이다. 즉, 해당 유전자의 유전자 발현을 검사하기 위해 프로브를 디자인할 수 있는 공지의 원리에 따라 서열의 일부분 또는 EST를 선발할 수 있다.
실시예 1
샘플 취급 및 LCM
27개의 새로운 동결 조직 샘플을 결장직장 종양 수술을 받은 적이 있는 환자로부터 수집하였다. 19개의 샘플은 결장직장 악성 표본이고 8개는 정상 결장 점막 샘플이다. 이 조직을 수집한 지 20 내지 30분 내에 액체 질소하에 순간 동결시킨 후 -80℃에 보관하였다. 레이저 포착을 위해, 샘플을 절단 (6㎛)하고 한쪽 단편은 유리 슬라이드 상에 올려놓고 다른쪽 단편은 유리 슬라이드 (Micro Slides, Colofrost, VWR Scientific, Media, PA) 상에 고정시킨 필름 (P.A.L.M) 상에 올려놓았다. 유리 슬라이드 상에 올린 단편은 저온 아세톤에 고정시킨 후 메이어 헤마톡실린 (Sigma, St.Louis, MO)으로 염색시켰다. 이 샘플을 병리학자에게 분석하게 하여 진단 및 등급화하였다. 임상 단계는 수반되는 외과 병리 및 임상 보고서를 통해 듀크스 (Dukes) 분류에 따라 추정하였다. 필름에 올린 단편은 100% 에탄올에 5분 동안 고정시킨 후 에오신/100% 에탄올 (무수 에탄올 100ml에 에오신 100㎍)에서 1분 동안 대비염색시킨 뒤, 100% 에탄올에 즉시 빠르게 침지시켜 유리 염색액을 제거하고 10분 동안 공기건조시켰다.
결장직장 선암 중 2개는 등급 1로, 10개는 등급 2로 5개는 등급 3으로 분석되었다. 악성 샘플 중 1개는 맹장 카르시노이드 종양이고 1개는 전이성 흑색종 병변이었다. 선암 샘플중 2개는 점막 아형이었고 1개는 인장 세포 아형이었다. 듀크스 분류는 선암을 다음과 같이 분류하였다: 듀크스 A:2, 듀크스 B:5, 듀크스 C:7, 듀크스 D:3. 선암 중 6개는 수술전에 방사선조사 처리하였다.
LCM에 사용하기 전에 막 (LPC-MEMBRANE PEN FOIL 1.35㎛ No 8100, P.A.L.M. GmbH Mikrolaser, Technologie, Bernried, Germany)과 슬라이드를 예비처리하여 RNase를 제거하고 필름 상에 조직 샘플이 더 잘 부착되도록 하였다. 간략히 살펴보면, 슬라이드는 DEP H2O로 세척하고, 필름은 RNase AWAY (Molecular Bioproducts, Inc., San Diego, CA)과 DEP H2O로 세척하였다. 유리 슬라이드 위에 필름을 부착시킨 후 슬라이드를 +120℃에서 8시간 동안 소성하고, TI-SAD (Diagnostic Products Corporation, Los Angeles, CA, DEP H2O 중에 1:50으로 희석시킨 뒤 면양모를 통해 여과시킨 것)로 처리한 다음, +37℃에서 30분 동안 항온처리하였다. 사용하기 바로 전에 RNase 억제제 용액[Rnasin Inhibitor 2500U=33U/㎕ N211A, Promega GmbH, Mannheim, Germany, 동결 용액 (0.15mol NaCl, 10mmol Tris pH 8.0, 0.25mmol 디티오트레이톨 함유) 400㎕ 중에 0.5㎕]의 10㎕ 분취량을 필름상에 도말하고, 조직 샘플을 올려놓았다.
필름상에 올린 조직 단편은 LCM 분석에 사용하였다. 체이스 액시오버트 (Zeiss Axiovert) 135 현미경 (Carl Zeiss Jena GmbH, Jena, Germany)에 연결시킨 PALM Robot-Microbeam 기술 (P.A.L.M. Mikrolaser Technologie, Carl Zeiss, Inc., Thornwood, NY)을 사용하여 약 2000개 상피세포/샘플을 포획하였다. 정상 점막의 주위 간질 및 암 샘플에서 때로 나타나는 개재성 간질 성분이 포함되어 있었다. 포획한 세포를 100% 에탄올 함유 튜브에 넣고 -80℃에 보관하였다.
실시예 2
RNA 추출 및 증폭
자이모-스핀 (Zymo-Spin) 컬럼 (Zymo Research, Orange, CA 92867)을 사용하여 LCM 포착 샘플로부터 총 RNA를 추출하였다. 총 RNA 약 2ng을 물 10㎕에 재현탁시키고 T7 RNA 폴리머라제-이용 증폭을 2회 실시하여 증폭된 RNA 약 50㎍을 수득하였다.
실시예 3
cDNA 마이크로어레이 하이브리드화 및 정량
약 20,000개 사람 cDNA 클론으로 이루어진 cDNA 마이크로어레이 세트를 사용하여 샘플을 시험하였다. 약 30개의 식물 유전자도 비특이적 하이브리드화의 대조군으로서 마이크로어레이에 프린트하였다. Cy3 표지된 cDNA 프로브는 LCM 포획 세포의 RNA 5㎍으로부터 합성하였다. 이 프로브를 퀴아겐 (Qiagen)의 뉴클레오타이드 제거 컬럼으로 정제한 뒤, 상기 마이크로어레이에 14 내지 16시간 동안 하이브리드화하였다. 이 슬라이드를 세척하고 스캐닝하기 전에 공기 건조하였다. cDNA 마이크로어레이는 cy3 형광으로 스캐닝하고 ImaGene 소프트웨어 (Biodiscovery, Los Angeles, CA)로 정량하였다. 각각의 cDNA 클론 마다 반복 스폿과 반복 어레이를 사용하여 4회의 측정값을 얻고, 그 강도를 평균하였다.
cDNA는 아미노 실란 코팅된 슬라이드 (Corning) 상에 제너레이션 III 마이크로어레이 스포터 (Molecular Dynamics)를 사용하여 프린트하였다. cDNA를 PCR 증폭시킨 뒤, 정제 (퀴아겐 PCR 정제 키트)한 뒤 10M NaSCN 프린트 완충액과 1:1로 혼합하였다. 하이브리드화 이전에 마이크로어레이를 실온에서 이소프로판올과 10분동안 항온처리하였다. 프로브는 95℃에서 2분 동안, 실온에서 5분 동안 항온처리한 뒤, 3반복으로 슬라이드 상에 적용하였다. 슬라이드 상에 DPX (Fluka)와 커버 슬립을 씌우고 42℃에서 하룻밤동안 항온처리하였다. 그 다음, 슬라이드를 1X SSC/0.2% SDS 및 0.1X SSC/0.2% SDS에 55℃에서 5분 동안 세척하고 0.1X SSC에 침지시킨 후 건조시킨 다음 GenIII 어레이 스캐너 (Molecular Dynamics)로 스캐닝하였다. 각 스팟의 형광 강도는 AUTOGENE 소프트웨어 (Biodiscovery, Los Angeles)로 분석하였다.
칩 강도는 각 칩마다 75 백분율로 판독되는 강도를 100 값에 해당하도록 직선형으로 정규화하였다. 칩 상의 모든 유전자는 그 유전자에서 판독되는 강도를 모든 샘플에서 판독된 유전자 발현값의 평균값으로 나누어 정규화하였다. 클러스터화하기 전에, 1 이상의 샘플에서 판독되는 강도가 100 이상이 아닌 유전자는 유사성 미터법에 배경 영향을 제한하기 위하여 여과제거하였다. 클러스터 분석을 위해 6225개 유전자 세트를 선발하였다. 유사성의 척도로서 상관관계를 사용하여 계층적 클러스터화를 실시하여 부정적인 변화는 고려하지 않고 긍정적인 변화를 나타내는 유전자와 샘플을 함께 그룹화하였다 (Silicon Genetics, Sunnyville, CA). 계통수의 각각의 주요 마디는 샘플의 아군으로 간주하였다. 각각의 종양 아군을 정상 그룹과 비교하여 차등 발현 유전자를 확인하였다. 선발은 하기 식으로 표시되는 노이즈에 대한 시그널 측정 한계치에 기초하여 실시하였다:
이 식에서 μt는 질병이나 증상이 있는 것으로 알려진 서브세트의 평균값이고, μn은 정상 샘플의 서브세트의 평균값이며, σt+σn은 표준편차의 합을 나타낸다. 유전자의 강도 판독값에 대한 그룹내 분산 계수는 짝끼리의 상호비교에 유전자를 포함시키기 위해서는 0.33 미만이어야 했다. 정상 그룹의 평균값 보다 종양 그룹의 평균값은 상향-조절시 2 이상, 하향-조절시 0.5 이하이어야 했다. 유전자가 그 기준을 만족시키면 그 유전자를 선발하였다. 모든 비교에서 선발된 유전자는 결장직장암에서 계속 이상조절되는 것으로 간주하였다. 통계적 유의성에 대한 p값은 불균일한 분산을 추정하는 t-검정으로 계산하였다. 클러스터화를 위한 유전자 세트는 소프트웨어 팩키지 (Partek, St Louis, MO)를 사용하여 주요 성분 분석 (PCA)으로 처리하였다. 그 다음 데이터를 축소된 3차원 공간에 투영하였다. 정상 샘플와 결장직장암 샘플을 투영된 발현량으로 나타내었다.
종양 샘플와 정상 샘플 사이의 차이를 구분하기 위하여 상향-조절차가 큰 유전자를 목록화하였다. 노이즈에 대한 시그널 컷오프로서 를 사용하여 123개 유전자를 예비선발하였다. 또한 인 유전자도 포함시켰다. 정상 세포와 종양 세포 사이에 적어도 3배 이상의 발현차를 각각 나타내는 4개 유전자의 포트폴리오를 구축하였다.
결장직장암에서 차등 발현된 유전자. 모든 종양 샘플에서 정상 결장 점막과 비교했을 때 39개 유전자가 차등 발현되었다. 이 중 37개는 분리물 (outlier)을 제외하고는 모든 종양에서 유의적으로 하향-조절되었고, 2개는 상향-조절되었다. 이 유전자들의 확인은 마이크로어레이 상에 존재하는 cDNA 클론의 서열분석으로 검증되었다. 그 결과를 표 1에 제시하였다.
평가 | 유전자 기재 | 평균 시그날 강도 (정상) |
평균 시그날 강도 (종양) |
p-값 | |
AF071569 | CaM 키나제 II 유전자 아유형 δ 2. | 93 | 39 | 4.64E-09 | 서열 1 |
AB014530 | KIAA0630 단백질에 대한 호모 사피엔스 mRNA | 108 | 50 | 4.83E-07 | 서열 2 |
AK000319 | 사람 cDNA KIAA0630 | 236 | 69 | 7.84E-06 | 서열 3 |
U81504 | AP-3 복합체 mRNA의 β-3A-아답틴 아단위 | 241 | 75 | 3.52E-05 | 서열 4 |
AB011166 | 사람 cDNA KIAA0594 | 116 | 55 | 3.53E-05 | 서열 5 |
AB040914 | 사람 cDNA KIAA1481 | 187 | 59 | 8.85E-05 | 서열 6 |
AK025205 | 사람 cDNA FLJ21552 | 322 | 97 | 0.00013 | 서열 7 |
AJ278219 | 지방산 하이드록실라제 | 143 | 53 | 0.00011 | 서열 8 |
AB046854 | 사람 cDNA KIAA1634 | 142 | 59 | 0.00020 | 서열 9 |
R00585 | 미확인 | 149 | 57 | 1.28E-09 | 서열 10 |
S45844 | Spi-B 전사 인자 | 140 | 43 | 0.00043 | 서열 11 |
X98311 | 암배아 항원 계열 일원 2(CGM2) | 6137 | 223 | 0.00044 | 서열 12 |
BAA78050 | NADPH 옥시도리덕타제 동족체 | 153 | 84 | 0.00048 | 서열 40 |
N72128 | 미확인 | 164 | 77 | 0.00068 | 서열 13 |
AB040955 | 사람 cDNA KIAA1552 | 334 | 120 | 0.00067 | 서열 14 |
AF125101 | HSPC040 단백질 | 363 | 115 | 0.0011 | 서열 15 |
AB023229 | 사람 cDNA KIAA1012 | 263 | 88 | 0.00099 | 서열 16 |
N95761 | a-L-푸코시다제 유전자 | 429 | 104 | 0.00047 | 서열 17 |
AK025033 | 사람 cDNA FLJ21380 | 180 | 85 | 0.0010 | 서열 18 |
L10844 | 사람 세포 성장 조절 단백질 | 206 | 101 | 0.0013 | 서열 19 |
H96534 | gp25L2 단백질에 대한 호모 사피엔스 mRNA | 147 | 58 | 0.0015 | 서열 20 |
AK001521 | 사람 cDNA FLJ10659 | 157 | 60 | 0.0019 | 서열 21 |
AF151039 | HSPC205 단백질 | 117 | 60 | 0.0017 | 서열 22 |
AF052059 | SEL 1L 단백질 | 168 | 53 | 0.0016 | 서열 23 |
N24597 | 미확인 | 166 | 62 | 0.0016 | 서열 24 |
AK001950 | 내부 중심체 단백질 | 148 | 64 | 0.0029 | 서열 25 |
BAA02649 | 대식세포 스캐빈저 수용체 유형 I | 118 | 44 | 0.0031 | 서열 41 |
N75004 | 미확인 | 98 | 48 | 0.0031 | 서열 26 |
W16916 | 사람 cDNA KIAA0260 | 162 | 61 | 0.0037 | 서열 27 |
X52001 | 호모 사피엔스 엔도텔린 3 mRNA | 89 | 33 | 0.0042 | 서열 28 |
T50788 | 미확인 | 364 | 102 | 0.0059 | 서열 38 |
AJ005866 | 추정 Sqv-7 유사 단백질 | 381 | 163 | 0.0049 | 서열 29 |
AF113535 | MAID 단백질 | 218 | 100 | 0.0053 | 서열 39 |
AB037789 | 사람 cDNA KIAA1368 | 164 | 62 | 0.0068 | 서열 30 |
M33987 | 탄산탈수소효소 | 652 | 46 | 0.0074 | 서열 31 |
M77830 | 데스모플라킨 1(DPI) | 184 | 81 | 0.0092 | 서열 32 |
H81220 | EST 도메인 전사 인자 ELF1 | 113 | 55 | 0.017 | 서열 33 |
AF000592 | 사람 염색체 21q11-q21 게놈 클론 | 33 | 69 | 1.16E-05 | 서열 35 |
AK021701 | 사람 cDNA FLJ11639 | 31 | 63 | 0.00070 | 서열 36 |
실시예 4
결장직장 종양의 최적화된 포트폴리오
복수의 유전자를 기본으로 한 조인 (signature)을 만들기 위해 평균 분산 최적화 알고리듬을 사용하였고, 포함되는 유전자는 정상 샘플와 종양 샘플을 구분하기 위하여 조합하여 사용할 수 있다. 실시예 1 내지 3에 기술한 샘플와 마이크로어레이를 사용하여 강도 측정값을 처리하였다. 분석할 데이터는 먼저 종양 세포와 정상 세포 사이에 사전규정된 5배 차이를 기준으로 예비선발하였다. 이 기준에 따라 예비선발된 유전자의 발현 데이터는 다음과 같이 사용하였다. 각 유전자의 강도 측정값의 평균값과 표준편차는, 기준값으로 비전이성 샘플을 사용하여 계산하였다. 그 다음, 각각의 기준 유전자 (X는 3임)에 대하여 X* (표준편차+평균값)의 구별값을 계산하였다. 이 값은 결과적으로 수득되는 포트폴리오가 엄중해지도록 하기 위한 것이다. 그 다음, 각각의 전이 샘플에 대하여 기준값에 대한 구별값의 비율을 계산하였다. 이 비율은 그 다음 공통 로그값으로 변환시켰다. 이 데이터를 바그너 소프트웨어에 입력하여 효율적인 경계값을 얻고, 이로부터 4개 유전자의 포트폴리오를 선발하였다. 이 세트에는 미지의 서열, 프로콜라겐 타입 I, 리보솜 단백질 L21의 대형 서브유닛 및 피브로넥틴이 포함되어 있었다. 이 유전자는 서열번호 42, 43, 44 및 45로 표시하였다. 또는, 포트폴리오를 구성하는데 사용된 유전자 조합을 사용하여 결장직장암에 관한 임상 결정을 내리는데 유용한 진단 정보를 제공할 수 있다. 이것은 특히 포트폴리오로부터 선발된 유전자 조합을 부가 마커 (유전자 여부에 관계없이)와 조합할 때 유리하다.
최적화된 유전자 포트폴리오:
>gi┃1264443┃gb┃N92134.1┃N92134 za23f09.r1 Soares fetal liver spleen 1NFLS Homo sapiens cDNA clone IMAGE: 293417 5' similar to gb┃M87908┃HUMALNE32 Human carcinoma cell-derived Alu RNA transcript, (rRNA); gb: X57025_rna1 INSULIN-LIKE GROWTH FACTRO IA PRECURSOR(HUMAN).
>gi┃2221047┃gb┃AA490172.1┃AA490172 ab06b08.s1 Stratagene fetal retina 937202 Homo sapiens cDNA clone IMAGE: 839991 3' similar to gb: J03464 PROCOLLAGEN ALPHA 2(I) CHAIN PRECURSOR(HUMAN).
>gi┃2188918┃gb┃AA464034.1┃AA464034 zx86b09.r1 Soares ovary tumor NbHOT Homo sapiens cDNA clone IMAGE: 810617 5' similar to SW: RL21_HUMAN P46778 60S RIBOSOMAL PROTEIN L21.
>gi┃834491┃gb┃R62612.1┃R62612 yil2d01.s1 Soares placenta Nb2HP Homo sapiens cDNA clone IMAGE: 139009 3' similar to gb: X02761_ cds1 FIBRONECTIN PRECURSOR (HUMAN);
동일한 방법이나 다른 기준의 세트를 사용하여 다른 4가지 유전자 포트폴리오를 소프트웨어로부터 선발하였다. 이것은 서열번호 46, 47, 48 및 49로 표시하였다. 이 중 2개의 유전자는 처음 4개의 유전자 포트폴리오와 중복되는 것이었다. 최적화된 2개의 포트폴리오를 다시 조합하여 6개 유전자 포트폴리오를 구성할 수 있다.
최적화된 유전자 포트폴리오:
>gi┃2114953┃gb┃AA431245.1┃AA431245 zw78d06.r1 Soares_testis NHT Homo sapiens cDNA clone IMAGE: 782315 5' similar to WP:F36H1.2 CE05814 ANKYRIN LIKE
>gi┃2156172┃gb┃AA4434497.1┃AA443497 zw34d03.r1 Soares ovary tumor NbHOT Homo sapiens cDNA clone IMAGE: 771173
>gi┃2221047┃gb┃2┃AA490172 ab06b08.s1 Stratagene fetal retina 937202 Homo sapiens cDNA clone IMAGE: 839991 3' similar to gb: J03464 PROCOLLAGEN ALPHA 2(I) CHAIN PRECURSOR (HUMAN)
>gi┃1264443┃gb┃N92134.1┃N92134 za23f09.r1 Soares fetal liver spleen 1NFLS Homo sapiens cDNA clone IMAGE: 293417 5' similar to gb┃M87908┃HUMALNE32 Human carcinoma cell-derived Alu RNA transcript, (rRNA); gb: X57025_rna1 INSULIN-LIKE GROWTH FACTOR IA PRECURSOR(HUMAN);
본 발명에 따라, 일군의 유전자 발현을 분석하여 결장직장암이 있는 것으로 추정되는 환자의 결장직장암의 존재 유무 또는 가능한 증상을 검사하는 방법을 제공한다.
<110> Ortho-Clinical Diagnostics, Inc.
<120> Assessing colorectal cancer
<130> CDS 267 US NP
<150> US 60/368,798
<151> 2002-03-29
<160> 49
<170> KopatentIn 1.71
<210> 1
<211> 1500
<212> DNA
<213> human
<400> 1
atggcttcga ccaccacctg caccaggttc acggacgagt atcagctttt cgaggagctt 60
ggaaaggggg cattctcagt ggtgagaaga tgtatgaaaa ttcctactgg acaaggatat 120
gctgccaaaa ttatcaacac caaaaagctt tctgctaggg atcatcagaa actagaaaga 180
gaagctagaa tctgccgtct tttgaagcac cctaatattg tgcgacttca tgatagcata 240
tcagaagagg gctttcacta cttggtgttt gatttagtta ctggaggtga actgtttgaa 300
gacatagtgg caagagaata ctacagtgaa gctgatgcca gtcattgtat acagcagatt 360
ctagaaagtg ttaatcattg tcacctaaat ggcatagttc acagggacct gaagcctgag 420
aatttgcttt tagctagcaa atccaaggga gcagctgtga aattggcaga ctttggctta 480
gccatagaag ttcaagggga ccagcaggcg tggtttggtt ttgctggcac acctggatat 540
ctttctccag aagttttacg taaagatcct tatggaaagc cagtggatat gtgggcatgt 600
ggtgtcattc tctatattct acttgtgggg tatccaccct tctgggatga agaccaacac 660
agactctatc agcagatcaa ggctggagct tatgattttc catcaccaga atgggacacg 720
gtgactcctg aagccaaaga cctcatcaat aaaatgctta ctatcaaccc tgccaaacgc 780
atcacagcct cagaggcact gaagcaccca tggatctgtc aacgttctac tgttgcttcc 840
atgatgcaca gacaggagac tgtagactgc ttgaagaaat ttaatgctag aagaaaacta 900
aagggtgcca tcttgacaac tatgctggct acaaggaatt tctcagcagc caagagtttg 960
ttgaagaaac cagatggagt aaaggagtca actgagagtt caaatacaac aattgaggat 1020
gaagatgtga aagcacgaaa gcaagagatt atcaaagtca ctgaacaact gatcgaagct 1080
atcaacaatg gggactttga agcctacaca aaaatctgtg acccaggcct tactgctttt 1140
gaacctgaag ctttgggtaa tttagtggaa gggatggatt ttcaccgatt ctactttgaa 1200
aatgctttgt ccaaaagcaa taaaccaatc cacactatta ttctaaaccc tcatgtacat 1260
ctggtagggg atgatgccgc ctgcatagca tatattaggc tcacacagta catggatggc 1320
agtggaatgc caaagacaat gcagtcagaa gagactcgtg tgtggcaccg ccgggatgga 1380
aagtggcaga atgttcattt tcatcgctcg gggtcaccaa cagtacccat caagccaccc 1440
tgtattccaa atgggaaaga aaacttctca ggaggcacct ctttgtggca aaacatctga 1500
<210> 2
<211> 5761
<212> DNA
<213> human
<400> 2
cacaccgcag tatgcggtgc cctttactct gagctgcgca gccggccggc cggcgctggt 60
tgaacagact gccgctgtac tggcgtggcc tggagggact cagcaaattc tcctgccttc 120
aacttggcaa cagttgcctg gggtagctct acacaactct gtccagccca cagcaatgat 180
tccagaggcc atggggagtg gacagcagct agctgactgg aggaatgccc actctcatgg 240
caaccagtac agcactatca tgcagcagcc atccttgctg actaaccatg tgacattggc 300
cactgctcag cctctgaatg ttggtgttgc ccatgttgtc agacaacaac aatccagttc 360
cctcccttcg aagaagaata agcagtcagc tccagtctct tccaagtcct ctctagatgt 420
tctgccttcc caagtctatt ctctggttgg gagcagtccc ctccgcacca catcttctta 480
taattccttg gtccctgtcc aagatcagca tcagcccatc atcattccag atactcccag 540
ccctcctgtg agtgtcatca ctatccgaag tgacactgat gaggaagagg acaacaaata 600
caagcccagt agctctggac tgaagccaag gtctaatgtc atcagttatg tcactgtcaa 660
tgattctcca gactctgact cttctttgag cagcccttat tccactgata ccctgagtgc 720
tctccgaggc aatagtggat ccgttttgga ggggcctggc agagttgtgg cagatggcac 780
tggcacccgc actatcattg tgcctccact gaaaactcag cttggtgact gcactgtagc 840
aacccaggcc tcaggtctcc tgagcaataa gactaagcca gtcgcttcag tgagtgggca 900
gtcatctgga tgctgtatca cccccacagg gtatcgagct caacgcgggg ggaccagtgc 960
agcacaacca ctcaatctta gccagaacca gcagtcatcg gcggctccaa cctcacagga 1020
gagaagcagc aacccagccc cccgcaggca gcaggcgttt gtggcccctc tctcccaagc 1080
cccctacacc ttccagcatg gcagcccgct acactcgaca gggcacccac accttgcccc 1140
ggcccctgct cacctgccaa gccaggctca tctgtatacg tatgctgccc cgacttctgc 1200
tgctgcactg ggctcaacca gctccattgc tcatcttttc tccccacagg gttcctcaag 1260
gcatgctgca gcctatacca ctcaccctag cactttggtg caccaggtcc ctgtcagtgt 1320
tgggcccagc ctcctcactt ctgccagcgt ggcccctgct cagtaccaac accagtttgc 1380
cacccaatcc tacattgggt cttcccgagg ctcaacaatt tacactggat acccgctgag 1440
tcctaccaag atcagccagt attcctactt atagttggtg agcatgaggg aggaggaatc 1500
atggctacct tctcctggcc ctgcgttctt aatattgggc tatggagaga tcctccttta 1560
ccctcttgaa atttcttagc cagcaacttg ttctgcaggg gcccactgaa gcagaaggtt 1620
tttctctggg ggaacctgtc tcagtgttga ctgcattgtt gtagtcttcc caaagtttgc 1680
cctattttta aattcattat ttttgtgaca gtaattttgg tacttggaag agttcagatg 1740
cccatcttct gcagttacca aggaagagag attgttctga agttaccctc tgaaaaatat 1800
tttgtctctc tgacttgatt tctataaatg cttttaaaaa caagtgaagc ccctctttat 1860
ttcattttgt gttattgtga ttgctggtca ggaaaaatgc tgatagaagg agttgaaatc 1920
tgatgacaaa aaaagaaaaa ttactttttg tttgtttata aactcagact tgcctatttt 1980
attttaaaag cggcttacac aatctccctt ttgtttattg gacatttaaa cttacagagt 2040
ttcagttttg ttttaatgtc atattatact taatgggcaa ttgttatttt tgcaaaactg 2100
gttacgtatt actctgtgtt actattgaga ttctctcaat tgctcctgtg tttgttataa 2160
agtagtgttt aaaaggcagc tcaccatttg ctggtaactt aatgtgagag aatccatatc 2220
tgcgtgaaaa caccaagtat tctttttaaa tgaagcacca tgaattcttt tttaaattat 2280
tttttaaaag tctttctctc tctgattcag cttaaatttt tttatcgaaa aagccattaa 2340
ggtggttatt attacatggt ggtggtggtt ttattatatg caaaatctct gtctattatg 2400
agatactggc attgatgagc tttgcctaaa gattagtatg aattttcagt aatacacctc 2460
tgttttgctc atctctccct tctgttttat gtgatttgtt tggggagaaa gctaaaaaaa 2520
cctgaaacca gataagaaca tttcttgtgt atagctttta tacttcaaag tagcttcctt 2580
tgtatgccag cagcaaattg aatgctctct tattaagact tatataataa gtgcatgtag 2640
gaattgcaaa aaatatttta aaaatttatt actgaattta aaaatatttt agaagttttg 2700
taatggtggt gttttaatat tttacataat taaatatgta catattgatt agaaaaatat 2760
aacaagcaat ttttcctgct aacccaaaat gttatttgta atcaaatgtg tagtgattac 2820
acttgaattg tgtacttagt gtgtatgtga tcctccagtg ttatcccgga gatggattga 2880
tgtctccatt gtatttaaac caaaatgaac tgatacttgt tggaatgtat gtgaactaat 2940
tgcaattata ttagagcata ttactgtagt gctgaatgag caggggcatt gcctgcaagg 3000
agaggagacc cttggaattg ttttgcacag gtgtgtctgg tgaggagttt ttcagtgtgt 3060
gtctcttcct tccctttctt cctccttccc ttattgtagt gccttatatg ataatgtagt 3120
ggttaataga gtttacagtg agcttgcctt aggatggacc agcaagcccc cgtggaccct 3180
aagttgttca ccgggattta tcagaacagg attagtagct gtattgtgta atgcattgtt 3240
ctcagtttcc ctgccaacat tgaaaaataa aaacagcagc ttttctcctt taccaccacc 3300
tctacccctt tccattttgg attctcggct gagttctcac agaagcattt tccccatgtg 3360
gctctctcac tgtgcgttgc taccttgctt ctgtgagaat tcaggaagca ggtgagagga 3420
gtcaagccaa tattaaatat gcattctttt aaagtatgtg caatcacttt tagaatgaat 3480
ttttttttcc ttttcccatg tggcagtcct tcctgcacat agttgacatt cctagtaaaa 3540
tatttgcttg ttgaaaaaaa catgttaaca gatgtgttta taccaaagag cctgttgtat 3600
tgcttaccat gtccccatac tatgaggaga agttttgtgg tgccgctggt gacaaggaac 3660
tcacagaaag gtttcttagc tggtgaagaa tatagagaag gaaccaaagc ctgttgagtc 3720
attgaggctt ttgaggtttc ttttttaaca gcttgtatag tcttggggcc cttcaagctg 3780
tgaaattgtc cttgtactct cagctcctgc atggatctgg gtcaagtaga aggtactggg 3840
gatggggaca ttcctgccca taaaggattt ggggaaagaa gattaatcct aaaatacagg 3900
tgtgttccat ccgaattgaa aatgatatat ttgagatata attttaggac tggttctgtg 3960
tagatagaga tggtgtcaag gaggtgcagg atggagatgg gagatttcat ggagcctggt 4020
cagccagctc tgtaccaggt tgaacaccga ggagctgtca aagtatttgg agtttcttca 4080
ttgtaaggag taagggcttc caagatgggg caggtagtcc gtacagccta ccaggaacat 4140
gttgtgtttt ctttattttt taaaatcatt atattgagtt gtgttttcag cactatattg 4200
gtcaagatag ccaagcagtt tgtataattt ctgtcactag tgtcatacag ttttctggtc 4260
aacatgtgtg atctttgtgt ctcctttttg ccaagcacat tctgattttc ttgttggaac 4320
acaggtctag tttctaaagg acaaattttt tgttccttgt cttttttctg taagggacaa 4380
gatttgttgt ttttgtaaga aatgagatgc aggaaagaaa accaaatccc attcctgcac 4440
cccagtccaa taagcagata ccacttaaga taggagtcta aactccacag aaaaggataa 4500
taccaagagc ttgtattgtt accttagtca cttgcctagc agtgtgtggc tttaaaaact 4560
agagattttt cagtcttagt ctgcaaactg gcatttccga ttttccagca taaaaatcca 4620
cctgtgtctg ctgaatgtgt atgtatgtgc tcactgtggc tttagattct gtccctgggg 4680
ttagccctgt tggccctgac aggaagggag gaagcctggt gaatttagtg agcagctggc 4740
ctgggtcaca gtgacctgac ctcaaaccag cttaaggctt taagtcctct ctcagaactt 4800
ggcatttcca acttcttcct ttccgggtga gagaagaagc ggagaagggt tcagtgtagc 4860
cactctgggc tcatagggac acttggtcac tccagagttt ttaatagctc ccaggaggtg 4920
atattatttt cagtgctcag ctgaaatacc aaccccagga ataagaactc catttcaaac 4980
agttctggcc attctgagcc tgcttttgtg attgctcatc cattgtcctc cactagaggg 5040
gctaagcttg actgccctta gccaggcaag cacagtaatg tgtgttttgt tcagcattat 5100
tatgcaaaaa ttcactagtt gagatggttt gttttaggat aggaaatgaa attgcctctc 5160
agtgacagga gtggcccgag cctgcttcct attttgattt tttttttttt taactgatag 5220
atggtgcagc atgtctacat ggttgtttgt tgctaaactt tatataatgt gtggtttcaa 5280
ttcagcttga aaaataatct cactacatgt agcagtacat tatatgtaca ttatatgtaa 5340
tgttagtatt tctgctttga atccttgata ttgcaatgga attcctactt tattaaatgt 5400
atttgatatg ctagttattg tgtgcgattt aaactttttt tgctttctcc ctttttttgg 5460
ttgtgcgctt tcttttacaa caagcctcta gaaacagata gtttctgaga attactgagc 5520
tatgtttgta atgcagatgt acttagggag tatgtaaaat aatcatttta acaaaagaaa 5580
tagatattta aaatttaata ctaactatgg gaaaagggtc cattgtgtaa aacatagttt 5640
atctttggat tcaatgtttg tctttggttt tacaaagtag cttgtatttt cagtattttc 5700
tacataatat ggtaaaatgt agagcaattg caatgcatca ataaaatggg taaattttct 5760
g 5761
<210> 3
<211> 2129
<212> DNA
<213> human
<400> 3
ctgtattgag acaaaggaag ggatctgtca gaaagcaaca cttgttatct tgggcttggc 60
agcaaggaag aggacaggta gtggagatcc tgcaatctga aaagcagact gaaaggtgac 120
aaagaagctg aagatgggtg gtggagagag gtataacatt ccagcccctc aatctagaaa 180
tgttagtaag aaccaacaac agcttaacag acagaagacc aaggaacaga attcccagat 240
gaagattgtt cataagaaaa aagaaagagg acatggttat aactcatcag cagctgcctg 300
gcaggccatg caaaatgggg ggaagaacaa aaattttcca aataatcaaa gttggaattc 360
tagcttatca ggtcccaggt tactttttaa atctcaagct aatcagaact atgctggtgc 420
caaatttagt gagccgccat caccaagtgt tcttcccaaa ccaccaagcc actgggtccc 480
tgtttccttt aatccttcag ataaggaaat aatgacattt caacttaaaa ccttacttaa 540
agtacaggta taaaataaga caaatgttta aatttagtta tgttcacggg tagttgtcaa 600
ttggtctgaa acaaatttgc tagggaatct atttgtgtag aactaattaa tgtaaaaaaa 660
atagaccatc tcgtgttgtg tgcactgtga tataatggta gtatcagtgc aacttaaact 720
aatgattgta cttgatatta agtgttctca actgagtaac ttttaagtgg aaaccaagtt 780
tagatttggg gagtggtaaa ggaatcagct ttttctattg ttaggggaag acagtaattt 840
atcattcatg gaccagtaga ttgttgaaag ttggtgaatc ggattataag cttctagcta 900
acacaaggat tcagaattag gtaaacatct gaaggtttag tatattagaa acacccaaac 960
cagtaatatg ctaacctgat gcactgctga aagaaaatgt gaatttttcg taataattgc 1020
attttagtga attgtacagt gggtggaaag ggcatttgga gctcattaga atgagacata 1080
gtacacccca atggccctgt ttattaaatg tagtggatta agtgtctgtc aacaaataca 1140
ccaaaaccat tttttataga aacagtattt aatggtcact caatagcttt caaaatacat 1200
ttttgtatta cagcactgca caagctattc taatagtgct ctggcctcat cattcctgca 1260
aagcttgctt tggggagttg gataatgtga aaattttaag tacctagggg agaaagagcc 1320
atgtaaatat ctgtaataaa cttgtagcat atgtaaagtt ttcttggcct ttatcttaca 1380
aaaatggagt attttagtat gaatttgctg aatgtaagac cgtggactgt tttttataat 1440
atggcctaat tttaaaggtc caaaataact tgtttttaaa gtttgccctt gtgctaaagt 1500
gccagtgtat gtatgttata cttgatttgg ttgtaaacta tatttcaaag taaaccctag 1560
tgtaataagt tttataacta aaaaggttta agctgctaaa actattttta agagatgtga 1620
aatgcagtat gggactatct ttttttcctc ctctaagccc aaagattaac tagagtccct 1680
ccaaccttat agattgttgg ctttcacaat cttataacct aggatacagg tagtttcgag 1740
tatggtgcca gtgatgtttt gtttttgttt ggtcaagggg taggtgcaac ccaatggacc 1800
acttatgcaa aagatgtaaa ctcttgcata atacattgat aacatgtttt gccaacttta 1860
aatgcttaaa cataagcgaa accagtagca agtatgtggg tcagcttaaa aattttgatt 1920
gttaatgccc tattttctaa tttggcacct cttgatgcct aagcaggtaa gcagatgcct 1980
aagctgtatt tctccaaata aatcaagatg aagtactgcc caagttaaat attgatagcc 2040
taaagacaag tttatgtagt acttaatgta catgatatga agcataaaat taaataaaat 2100
ttttccccat tgaaaaaaaa aaaaaaaaa 2129
<210> 4
<211> 3950
<212> DNA
<213> human
<400> 4
cgagaactag ttttgttccg tgccctctgg actggaacct tttggagaga acccccggca 60
ggaccaaccc cgcacccgcc agcaccgcgg caatgtccag caatagtttt ccttacaatg 120
agcagtccgg aggaggggag gcgacggagc tgggtcagga ggcgacctca accatttccc 180
cctcgggggc cttcggcctc tttagcagcg atttgaagaa gaatgaagat ctaaagcaaa 240
tgttagagag caacaaagat tctgctaaac tggatgctat gaagcggatt gttgggatga 300
ttgcaaaagg gaaaaatgca tctgaactgt ttcctgctgt tgtgaagaat gtggccagta 360
aaaatattga gatcaagaag ttggtatatg tttacctggt tcgatatgct gaagaacagc 420
aggatcttgc actcctgtcc ataagcactt ttcagcgagc tctgaaggac ccaaaccaac 480
taattcgtgc aagcgctttg agagttctgt caagtattag agtgccaatt attgtaccta 540
tcatgatgct tgctattaag gaagcttctg ctgacttatc accatatgtt aggaagaatg 600
cagcccatgc aatacaaaaa ttatacagcc ttgatccaga gcagaaggaa atgttaattg 660
aagtaattga aaaacttctg aaagataaaa gcacattggt agctggcagt gttgtgatgg 720
cttttgaaga agtatgcccg gacagaatag atctgattca taaaaattac cgcaagctat 780
gtaacttact agtggatgtt gaagagtggg ggcaggttgt cataatccac atgctaactc 840
gatatgctcg gacacagttt gtcagccctt ggaaagaggg tgatgaatta gaagacaatg 900
gaaagaattt ctacgaatct gatgatgatc agaaggaaaa gactgacaaa aagaagaagc 960
cgtatactat ggatccagat catagactct taattagaaa tacaaagcct ttgcttcaga 1020
gcaggaatgc tgcggtggtt atggcagttg ctcagctgta ttggcacata tcaccaaaat 1080
ctgaagctgg cataatttct aaatcactag tgcgtttact tcgtagcaat agggaggtgc 1140
agtatattgt cctacaaaat atagcaacta tgtcaattca aagaaagggg atgtttgaac 1200
cttatctgaa gagtttctat gttaggtcaa ctgatccaac tatgatcaag acactgaagc 1260
ttgaaatttt gacaaacttg gcaaatgaag ccaacatatc aactcttctt cgagaatttc 1320
agacctatgt gaaaagccag gataaacaat ttgcagcagc cactattcag actataggca 1380
gatgtgcaac caacatcttg gaagtcactg acacgtgcct caatggcttg gtctgtctgc 1440
tgtccaacag ggatgaaata gttgttgctg aaagtgtggt tgttataaag aaattactgc 1500
aaatgcaacc tgcacaacat ggtgaaatta ttaaacatat ggccaaactc ctggacagta 1560
tcactgttcc tgttgctaga gcaagtattc tttggctaat tggagaaaac tgtgaacgag 1620
ttcctaaaat tgcccctgat gttttgagga agatggctaa aagcttcact agtgaagatg 1680
atctggtaaa actgcagata ttaaatctgg gagcaaaatt gtatttaacc aactccaaac 1740
agacaaaatt gcttacccag tacatattaa atctcggcaa gtatgatcaa aactacgaca 1800
tcagagaccg tacaagattt attaggcagc ttattgttcc gaatgaaaag agtggagctt 1860
taagtaaata tgccaaaaaa atattcctag cacaaaagcc tgcaccactg cttgagtctc 1920
cttttaaaga tagagatcat ttccagcttg gcaccttatc tcatactctc aacattaaag 1980
ctactgggta cctggaatta tctaattggc cagaggtggc gcccgaccca tcagttcgaa 2040
atgtagaagt aatagagttg gcaaaagaat ggaccccagc aggaaaagca aagcaagaga 2100
attctgctaa gaagttttat tctgaatctg aggaagagga ggactcttct gatagtagca 2160
gtgacagtga gagtgaatct ggaagtgaaa gtggagaaca aggcgaaagt ggggaggaag 2220
gagacagcaa tgaggacagc agtgaggact cctccagtga gcaggacagt gagagtggac 2280
gggagtcagg cctagaaaac aaaagaacag ccaagaggaa ctcaaaagcc aaaggaaaaa 2340
gtgattctga agatggggag aaggaaaatg aaaaatctaa aacttcagat tcttcaaatg 2400
acgaatctag ttcaatagaa gacagttctt ccgattctga atcagagtca gaacctgaaa 2460
gtgaatctga atccagaaga gtcactaagg agaaagaaaa gaaaacaaag caagatagaa 2520
ctcctcttac caaagatgtt tcacttctag atctggatga ttttaaccca gtatccactc 2580
cagttgcact tcccacacca gctctttctc caagtttgat ggctgatctt gaaggtttac 2640
acttgtcaac ttcctcttca gtcatcagtg tcagtactcc tgcatttgta ccaacgaaaa 2700
ctcacgtgct gcttcatcga atgagtggaa aaggactagc tgcccattat ttctttccaa 2760
gacagccttg catttttggt gataagatgg tctctataca aataacactg aataacacta 2820
ctgatcgaaa gatagaaaat atccacatag gggaaaaaaa acttcctata ggcatgaaaa 2880
tgcatgtttt taatccaata gactctcttg agcctgaggg atccattaca gtttcaatgg 2940
gtattgactt ttgtgattct actcagactg ccagtttcca gttgtgtacc aaggatgatt 3000
gcttcaatgt taatattcag ccacctgttg gagaactgct tttacctgtg gccatgtcag 3060
agaaagattt taagaaagag caaggagtgc taacaggaat gaatgaaact tctgctgtaa 3120
tcattgctgc accacagaat ttcactccct ctgtgatctt tcagaaggtt gtaaatgtag 3180
ccaatgtagg tgcagtccct tctggccagg ataatataca caggtttgca gctaaaactg 3240
tgcacagtgg gtcattgatg ctagtcacag tggaactgaa ggaaggctct acagcccagc 3300
ttatcataaa cactgagaaa actgtgattg gctctgttct gctgcgggaa ctgaagcctg 3360
tcctgtctca ggggtaacct gcttacatct ggactttaga atctggcaca caacaaaagt 3420
gcctggcatc cactactgct gcctttcatt tataataata gcccttccat ctggcagtgg 3480
gggtagaata cactcttgac attcttgtct cctgctttag aatgctagtg tgtatctatc 3540
atgtatgcaa tactttcccc ctttttgctt tgctaaccga agagcatata ttttactgtc 3600
agttgtctca actcttgaat ccatgtggcg ttttctctgt cctgctgctt cttttggcct 3660
cctcgttttc cttctctttt tcgacaatgg tagacatgaa tgagatattt aaagttcatt 3720
ggaaatcttc ttccctacag cagtaagcaa aaattagcaa agagatagtc taaatggcct 3780
ctcagcttgg tatgtgaaaa tgagatcaca tactttttaa atccaaatac aaaagcatag 3840
tctctgcaag attttgttct ttgaatttct tgatattgta attgattatt gataactgtc 3900
atcatgaaat tatctctcaa taataagata aataaactag catatgaatc 3950
<210> 5
<211> 5191
<212> DNA
<213> human
<400> 5
gagaaagaaa aacagctcga gacctcatgc aaagagaaaa ctgagtatct acagaaaatg 60
gttcagagga atgaaagata taaacaagat gtggagaggt tctatgaacg gaagcgacat 120
ttagatttaa ttgagatgct tgaagcaaaa aggccatggg tggaatatga aaatgttcgt 180
caggaatatg aagaagtaaa actagttcgt gaccgagtga aggaagaggt cagaaaactt 240
aaagaagggc agattcctat aacatgtcga attgaagaaa tggaaaacga gcgtcacaat 300
ttggaggctc gaatcaaaga aaaggcaaca gatattaagg aggcatctca aaaatgcaaa 360
cagaagcaag atgttataga aaggaaagat aaacatattg aggaacttca gcaggcttta 420
atagtaaagc aaaatgaaga gcttgaccga cagaggagaa taggtaatac ccgcaaaatg 480
atagaggatt tgcaaaatga actaaagacc acggaaaact gcgagaatct tcagccccag 540
attgatgcca ttacaaatga tctgagacgg attcaggatg aaaaggcatt atgtgaaggc 600
gaaataattg ataagcgaag agagagggaa actctagaga aggagaaaaa gagtgtggac 660
gatcatattg tacgttttga caatcttatg aatcagaagg aagataagct aagacagaga 720
ttccgtgaca cgtatgatgc tgttttatgg ctaagaaata acagagacaa atttaaacaa 780
agagtctgtg agcccataat gctcacgatc aatatgaaag ataataaaaa tgccaaatat 840
attgaaaatc atattccatc aaatgactta agagcctttg tatttgaaag tcaagaagat 900
atggaggttt tcctcaaaga ggttcgtgac aataaaaaat taagagtaaa tgctgttatt 960
gctcccaaga gttcatatgc agacaaagca ccttcaagat ctttgaatga acttaaacaa 1020
tacggatttt tctcttattt gagagaatta tttgatgcac ctgatcctgt aatgagttac 1080
ctttgctgtc agtatcatat tcatgaagtt cctgtaggaa ctgaaaagac cagagaaaga 1140
attgaacggg taatacaaga aacccgatta aaacagattt atacagcaga agaaaagtat 1200
gtggtgaaaa cttcttttta ttcaaacaaa gttatttcta gtaacacatc tctaaaagta 1260
gcgcagtttc tcactgtcac tgtggaccta gagcagagaa gacacttaga agaacagcta 1320
aaggaaattc atagaaaatt gcaagcagtg gattcagggt tgattgcctt acgtgaaaca 1380
agcaaacatc tggagcacaa agacaatgaa cttagacaaa agaagaagga gcttcttgag 1440
agaaaaacca agaaaagaca actggaacaa aaaatcagtt ccaaactagg aagtttaaag 1500
ctgatggaac aggatacttg caatcttgaa gaggaagagc gaaaagcaag taccaaaatc 1560
aaagaaataa atgttcaaaa agcgaaactt gttaccgaat taacaaacct aataaagatt 1620
tgtacttctt tgcatataca aaaagtagat ttaattctcc aaaatactac agtgatctct 1680
gagaagaaca aattagaatc agattatatg gccgcatctt cacaactccg tcttacagag 1740
caacatttca ttgaattgga tgaaaataga cagagattat tgcagaaatg caaggaactt 1800
atgaaaagag ctaggcaagt atgtaacctg ggtgcagagc agactcttcc tcaagaatac 1860
cagacacaag tacccaccat tccaaatgga cacaactcct cactccccat ggttttccaa 1920
gaccttccaa acacattgga tgaaattgat gctttattaa ctgaagaaag atcaagagct 1980
tcctgcttca cgggactgaa tcctacaatt gttcaggaat atacaaaaag agaagaagaa 2040
atagaacagt taactgagga actaaaggga aagaaagttg aactagatca atacagggaa 2100
aacatttcac aggtaaaaga aaggtggctt aatcctttaa aagagctggt agaaaaaatt 2160
aatgaaaaat tcagcaattt ttttagttcc atgcagtgtg ctggtgaagt tgatctccat 2220
acagaaaatg aggaagatta tgataaatat ggaattcgaa ttagagtcaa atttcgaagt 2280
agtactcaac tgcatgaatt aactcctcat catcaaagtg gaggtgaaag aagtgtttct 2340
accatgttat acttgatggc acttcaggag ctaaatagat gtccattcag agtagttgat 2400
gaaatcaatc agggaatgga cccaatcaat gaacggagag tgtttgaaat ggttgtaaat 2460
actgcctgta aagaaaatac atctcaatac tttttcataa caccaaagct cctgcaaaat 2520
cttccttatt ctgaaaagat gacagttttg tttgtctaca atggccctca tatgctggaa 2580
ccaaacacat ggaatttaaa ggctttccaa aggcggcggc gccgtattac attcactcaa 2640
ccttcttaat aaaagtaaag agagggaact tgggaatttt ttttgttaaa ttctgtttat 2700
aagtatggct caactgaata aaaggagatt cactaaaacg aaaagcagtt atttttggaa 2760
acctgctttt aaatacaaat aggttgataa tggaaactat aatgaccttt ccaaaatagc 2820
agctggtagt aaaagttaag tcttcttcag tcttggttga acttgagttc ttggcactct 2880
gaccatgagt cattcagttc tcatgttaaa atgtacttaa tattacaaat caaaggtaca 2940
gtggaagaag ggttaatcac aagaagttac ttatatggta gccctgagct ttaattgcag 3000
agtaacttta attactttta gagcctaaag atgactctag agcctaagtc ctagtttctc 3060
ccaatgttat atttaatttt aaaaaattga tatgaaaatg tctaatgtat agtaataatt 3120
tatgacagat ctagtcattt cttcctatta aaaaagatta ccttatctcc agtaggaaat 3180
ggaattttat gggcctttaa aagaaagttt tatgaaactt gatgctataa ttttattggt 3240
atttcaaggg gaaaaaagca ctggggttca aaaatggtag cagaactgct ttgaaatgct 3300
gcaaggtggc cactagatga tgcaaaatac aaccaaaaga ttgactgaga ataaaattag 3360
gtgacaaggg tttttaaaga ataacctttt aaagtgtggg ggcaggggtt gctttttttt 3420
attttattta aagtcaatta tattttacat cttacatttc taaaagcatt ttataattat 3480
ttttagtaag atttttctta aaatttcata tactggtttc tacaatttat atttgaaatt 3540
tctcagtgtt atgtaaagag tgatggaaaa gcattgattt ctttaaaacc gtaatgtttt 3600
tagaacttaa gcctataggg cctttcttac aatgttgatg tacccattat cttagaaaat 3660
ctagtttaaa ctgttttctt tcaccgcaaa agaattaaat gggaaaatca tttgtttatc 3720
tctaagttat actaattagt agaaccaaac aaattatctt cttttaaaaa ataaatctta 3780
taggaaaata gacagtccaa agtcatgtct ttgaacagtg gattggatct gtgccagtaa 3840
tgacaaaatt atttttttga cttgcttgcc tgaataaatt gaagaattgc tttcagtttg 3900
ggttttgtat attcttaagt agccattgaa atttatattc ttaactaggt caaaaaataa 3960
tgagccataa gtttatgtcc tctcacttag acattttctc tttaaaaagg tattttcttc 4020
tttataaaca ttttaaaaga gccttccctt cttaaactaa ctccagtgca tgaagtgtga 4080
aaatatttta aaatgacatt tttactaata tgagcaagtc atgtaaacat tgaagaactt 4140
ggtaacatat tagtaaatgg atattaccaa atgttttcat cgttaattac tttgcgttcc 4200
accaaaatat ctttactaaa atgtgcttgg tgtagtttgt ttattgtcta aattagtacc 4260
agtcatctta tttctgcaaa atgagtatca atgtgaaaaa gacacgtgaa gattaagcat 4320
gtttgaaaat aaaatggtca attacatttc aatttacata ggccaacaac tgttccatac 4380
tttgtttgta aacatttaat ttctctactg gacaaaatta atatttggct ttacattgaa 4440
ttttgagctg tgaagaataa attatgtatc attttagcat attaaacagt agtaagtcta 4500
gcacatagtc tcagccactt aaaacaaaag tttttttgtt tgtttgtttg tttgtttttt 4560
tgagatggag tctcactctg ttgcccaggc tggagtgcag tggcgtgatc tcggcttact 4620
gcaacctccg cctcccgggt tcaagcgatt ctcctgcctc agcctcccaa gtaactggga 4680
caacaggcgc gtcccaccac acccagctaa ttttttatac ttttagtaga gatggggttt 4740
cagcatattg gccaggctgg tctcgaactc ctgaccttgt gatccacccg cctcggcctc 4800
ccaaagtgct gggattatag gcgtgagccc ctgcacccgg ccaaaagttg atttttaatt 4860
acataaaaat cgtaaaaact tctagtaaaa acttgatttg gtgaatacag ttatatttta 4920
aaaccttaag gtgacaagca ttttctatgc ctaaatcttc attggtttgc ctggaaagag 4980
tctctgttaa aagattttcc atattcaaag taaaaggaaa gatttcttgc ttcctaattg 5040
tcttttggac acatgcctat tttctttgag gtataaacct ttagatgtga aaaatgtaat 5100
ttcattctgc tattgtgtgt gcttgtgtgt gtgtaattga aaaaactggg aaatcctgct 5160
ttgttggtaa taaatcaata tttttatatt c 5191
<210> 6
<211> 4755
<212> DNA
<213> human
<400> 6
aagagatctt ccaggctctc agagccctgg gagggcgatt tccaggaaga ccacaatgcc 60
aacctctgga ggaggctgga gagagaaggc ctaggccaga gcctgtcagg caactttggc 120
aagaccaagt cagccttctc atctctccag aacattcctg agagtctgag aagacacagc 180
agcctggagc taggccgggg aacccaggag ggttaccccg ggggcaggcc cacctgtgca 240
gtcaacacca aggcagaaga ccctgggagg aaagccgctc ctgacctcgg gagccatctg 300
gaccggcagg tttcctaccc gcggcccgag gggaggaccg gtgcctcggc ttctttcaac 360
agcacagacc caagtcccga agagccgcct gccccctcgc acccgcacac atccagtctg 420
ggccggaggg ggcccggccc aggcagcgcc tcggctcttc agggctttca gtacgggaag 480
ccccactgct cggtgctgga gaaggtctcc aaattcgagc agcgagagca agggagccag 540
agaccgagtg tgggcggctc tggttttggc cataactata ggccccacag gaccgtctca 600
acttccagta cttctgggaa tgacttcgag gagacaaaag cacacattcg tttctctgag 660
tcagctgaac ccctaggcaa cggggagcag cacttcaaaa acggggagct gaagttggaa 720
gaggcttccc ggcagccctg cggtcagcag ctgagcggag gagcgtcgga cagcggccgt 780
ggcccccaga ggccggacgc tcggctcctc cgtagccaga gcaccttcca gctctccagc 840
gagccagaga gggagcccga gtggcgggac aggcccggct cgcccgaatc gcccctgctg 900
gatgccccct tcagccgcgc ctaccggaac agcatcaagg acgcacagtc ccgtgtcttg 960
ggggccacct cctttcgacg tcgagacctg gagctggggg cgcccgtggc gtcgaggtcc 1020
tggcggccac ggccttcctc ggcccacgtg gggctgcgga gccccgaggc gtcggcctcc 1080
gcctccccgc acacgccccg ggagcggcac agcgtgaccc ctgctgaggg cgacctggcc 1140
aggcccgtgc cccctgccgc ccggagaggt gctcgccggc gcctgactcc cgagcagaag 1200
aagcgctcct actcggagcc cgagaagatg aacgaggtgg ggatcgtgga ggaggccgaa 1260
ccggcacccc tgggcccgca gagaaatggg atgcgtttcc cggagagcag cgtggccgac 1320
cggcgccgtc tcttcgagcg cgatggcaag gcctgctcca cgctcagcct gtcggggccc 1380
gagctgaagc agttccagca gagcgccctg gcggactaca tccagcgcaa gaccggcaag 1440
cggcctacct ccgccgccgg ctgcagcctc caggagcccg ggccactgcg tgagcgcgcc 1500
cagagtgcct acctccagcc cggccccgcg gcgctcgaag gctccggcct cgcctcggcc 1560
tccagcttga gctcactgcg ggagcccagc ctgcagcccc gcagggaggc cacgctcctg 1620
ccggccacag ttgcagaaac ccagcaggct ccccgagatc gcagcagctc cttcgccggt 1680
ggccgccgcc tcggggaacg gcgacgcggg gacctgctta gcggagcaaa cggtggaaca 1740
aggggcaccc agagagggga tgagaccccc agggagccat cctcctgggg ggccagggcc 1800
gggaagtcca tgtcggccga ggacctgctg gaacgctcgg acgtccttgc gggccctgtc 1860
catgtgaggt ccaggtcatc tcccgccacc gcagacaagc gccaggatgt gcttttgggg 1920
caagacagtg gctttggtct tgtgaaggat ccatgttatt tggctggtcc tggatctagg 1980
tcactcagtt gttcagaaag aggccaagaa gagatgctgc tgctcttcca ccatctcacc 2040
cctcgttggg gtggttcagg ctgcaaagcc attggtgatt cctccgttcc tagtgaatgt 2100
cctggaaccc tggaccatca gaggcaagcc agtaggacac cctgccccag gccaccactg 2160
gcaggaacgc aagggctggt cacagacacc agggctgcac ccctgacccc aattggcacc 2220
cctctgcctt cagccattcc ctctggctac tgctcacagg acggtcagac agggcgacag 2280
cctctcccgc cctacacccc tgccatgatg cacagaagca atggtcacac cctgacccag 2340
cctcccggtc caagaggctg tgagggcgat ggcccagagc atggggtaga agagggaacg 2400
aggaagaggg tctcgctgcc tcagtggcca cctccttctc gagcaaagtg ggcccacgca 2460
gccagagagg acagccttcc tgaggaatcc tcagcccctg attttgcaaa cctgaagcac 2520
tatcaaaaac agcagagtct tccaagttta tgcagcactt ctgacccaga cacacctctt 2580
ggggccccga gcactccagg gaggatctcc ctccgaatat ctgagtctgt cctgcgggac 2640
tccccgccac ctcatgagga ttatgaagac gaagtgtttg tgagggatcc gcaccccaag 2700
gccacgtcca gccccacatt tgaacctctt cccccacccc cacctcctcc accgagtcag 2760
gaaaccccgg tgtatagcat ggatgacttc cctccacctc ctccccacac tgtatgtgag 2820
gcgcagctgg acagtgagga tcccgagggg ccacgcccca gcttcaacaa actttctaaa 2880
gtgacaattg caagggaaag gcacatgcct ggtgcagccc atgtggtagg tagtcagaca 2940
ctggcttcca gactccaaac ttctatcaag ggttcagagg ctgagtccac accaccctcc 3000
ttcatgagcg ttcacgccca acttgctggg tctcttggtg ggcagccagc acccatccag 3060
actcaaagcc tcagccatga tccagtcagt ggaactcagg gtttagaaaa gaaagtcagt 3120
cctgatcctc agaagagttc agaagacatc agaacagagg ctttggccaa ggaaattgtc 3180
caccaagaca aatctctagc agacattttg gatccagact ccaggctgaa gacaacaatg 3240
gacctgatgg aaggtttgtt tccccgagat gtgaacttgc tgaaggaaaa cagtgtaaag 3300
aggaaggcca tacagagaac tgtcagctct tcaggatgtg aaggcaagag gaatgaagac 3360
aaggaagcag tgagcatgtt ggttaactgc cctgcctact acagtgtgtc tgctcccaag 3420
gctgagctac tgaacaaaat caaagagatg ccagcagaag tgaatgagga agaggaacag 3480
gcagatgtca atgaaaagaa ggctgagctc attggaagtc tcacccacaa gctggagacc 3540
ctccaggagg cgaaggggag cctgctcacg gacatcaagc tcaacaacgc cctgggagaa 3600
gaggtggagg ctctgatcag cgagctctgc aagcccaatg agtttgacaa gtataggatg 3660
ttcatagggg atttggacaa ggtggtcaac ctgctgctct ccctctcggg gcgtctagcc 3720
cgtgttgaga atgtccttag cggccttggt gaagatgcca gtaatgaaga aaggagctct 3780
ctttacgaga aaaggaagat cctggctggt cagcatgagg atgcccggga gctgaaggag 3840
aacctggatc gcagggagcg agtagtgctg ggcatcttgg ccaattacct ttcagaggag 3900
cagctccagg actaccagca cttcgtgaaa atgaagtcca cgctcctcat tgagcaacgg 3960
aagctggatg acaagatcaa gctgggccag gagcaggtca agtgtctgct ggagagcctg 4020
ccctcagatt tcattcccaa ggctggggcc ctggctctgc ccccaaacct cacgagtgag 4080
cccattcctg ctgggggctg tactttcagt ggtattttcc caacattaac ctctccactt 4140
taacctcttc taaaataccc aaccaaaaga tcactgtttc tctcaacact atttaatctg 4200
aaaaatgttt cagtacaaac cactgtttga actatctggg ttattggtgt ttgttcctga 4260
tgaaaggaaa aaaattctct ccaggaggaa gcctttttcc ttcttgccct tcctgattga 4320
tcttctgaga gctcgaatgc tgctggacac gtaccccttt ctattattac tttgtagtag 4380
aaagaaagtt aatgaaactg agaactgatt ggagggtgtt tgatcattta gtttttaaca 4440
ggctgaggca acatggatca gtgtgtgtcc ccctcaggaa tgtatccaca gtggccttcc 4500
ttgctggtgg gcagtgtatc ctgatggcag ggtacaagta ccattaatga agggtctgca 4560
acataaagcc ttaaaaagac acacactaag aaaactgtaa aaccttgaac attgttattt 4620
atatttttta aaatggaaaa gatcactatg tttgttgtgc taaccactta tttgattctg 4680
ttttgtggtg gacatagatg attacgtttg agctttgtat tttgtgaaaa ccttaatgaa 4740
atgaattcca aagat 4755
<210> 7
<211> 2045
<212> DNA
<213> human
<400> 7
gaaacttgac cccggctcat cctgtctctg gctgtggccc ggcaaagcac tgaaaacccc 60
tctggtctca gagacagtag gggcagtgcc actttctaca acctgccaac ccacacactg 120
gagtaattct gaaaaaaatt attcctaaac tctctaagtg tggacggaga atgagcaagc 180
cccagaagta ttttacaacc agagtgggta atgaggaggg ggcttactgg aatcgtcata 240
tctctgaata ttgaaaacaa caactaaaaa agtggacctt ctcagaaaaa aagggcagca 300
aatgaccaag ggcgcccctt ctggccgtgc ttggcttgag taactgtctc tctttcccca 360
cccccatcac agggctttca gtttggcaaa ggaaaagcag ataaaaacag aacattccat 420
atgtttcttt ctccatcggc caaaaacatt ttgacacaat gtttgtgaaa cacctttgga 480
gaggtgcact tctgaatgct gcctctgccg taaatcctgg ggcaagggat cagcctcttc 540
ccaggaacca tcgccttcta taaaccgtga actcaagcag gcattttttt tttcttaccg 600
aaaggctgct attgtgcaag ggcacataat gggtctgttg ctcttattgg cttccaaatg 660
tgcatggcaa agagagagat gtgggcctag agcagatata ttcagcaagg tgacagcttc 720
ccataacaat tctaacactt cttatcttat gtgagaataa aatatttaag ggttgaacct 780
tattttgcca aatgtatctt ttctgctttt gaattgggca gaagatttta gcaactatat 840
tctacaaatg ttacttataa cacacacaca cacatctgaa atatatgccg aaaattgacg 900
tctttgacct cagggagagc acctgtccag gtctgcctaa aggaaatggc tccagtgggt 960
ctaaacaacc acatcctatc catggatagg tctagtcata acactttaga gagaatgtca 1020
gagcaggagg gaggcaagcc gcctcttctc ggccatcaac tgcagatgat gaaagagcgg 1080
gattcaactt tgttttcttt tcctgtggcc ccagtgaaac ctcctgccct ccctgcacgt 1140
ctgtgtcttc atttctaaaa tgggggtgat gctttcatat tgacctcacc ccatactacc 1200
tcacagatgt gttgtgagga ttaataaaat tatgtctatg gtattttcag tttctggaga 1260
aaaatactta tagacagttt aactattaca tagatatata agtgatctca gtttcttgtt 1320
tgctgtgata ctaatgtgtt gttttaactt attccataaa atgacagttg tgtcctagcc 1380
acatcagaca gctatctaag ctctggacta cccctttgtg cagctgaatc actgcagggt 1440
cgaccatgcc tggtgccaca gccatggttt ccatttctag atgaaaggat ggcctaggac 1500
ataggtctca aagactcttg gatcagaatc aggagattag ggaaaacagg atggatacct 1560
gagcactaac agcagtagac gtagacctct gtcctttacc atctgaggtc ttctggattc 1620
tttgtggggt taattttgat ttgatgtcat ctgtttgccc ttcatcttgc ttgcaagtgt 1680
gcatggttca atccctcaca tccaggaaat gaattttgca attgggccag atgctaattt 1740
gcacgttgat tcaccttctt tgcctttaag cctttttttt cttttttttt ttttttggca 1800
aatgaatgta ccatttcaac tttgatttta atagtgctag ttgatattgg taataatgct 1860
aaccaagaga tcaatgccag atttttctct tggggtaagt tagctgaagt catttaaaga 1920
tggaaaggtg ggaaaattct ttgatatttg atgtcattgt atccacattt gttgtaagac 1980
atattgcata ccaattataa ttatatcaat taaagttgat aaaagcttca aaaaaaaaaa 2040
aaaaa 2045
<210> 8
<211> 2096
<212> DNA
<213> human
<400> 8
atggagaacg agcctgtagc ccttgaggaa actcagaaga cagatcctgc tatggaacca 60
cggttcaaag tggtggattg ggacaaggac ctggtggact ggcgaaagcc tctcctgtgg 120
caggtgggcc acttgggaga gaagtacgat gagtgggttc accagccggt gaccaggccc 180
atccgcctct tccactcaga cctcattgag ggcctctcta agactgtctg gtacagtgtc 240
cccatcatct gggtgcccct ggtgctgtat ctcagctggt cctactaccg aacctttgcc 300
cagggcaacg tccgactctt cacgtcattt acaacagagt acacggtggc agtgcccaag 360
tccatgttcc ccgggctctt catgctgggg acattcctct ggagcctcat cgagtacctc 420
atccaccgct tcctgttcca catgaagccc cccagcgaca gctattacct catcatgctg 480
cacttcgtca tgcacggcca gcaccacaag gcacccttcg acggctcccg cctggtcttc 540
ccccctgtgc cagcctccct ggtgatcggc gtcttctact tgtgcatgca gctcatcctg 600
cccgaggcag tagggggcac tgtgtttgcg gggggcctcc tgggctacgt cctctatgac 660
atgacccatt actacctgca ctttggctcg ccgcacaagg gctcctacct gtacagcctg 720
aaggcccacc acgtcaagca ccactttgca catcagaagt caggatttgg tatcagcact 780
aaattgtggg attactgttt ccacaccctc actccagaga aaccccacct gaagacgcag 840
tgacaactcc caccccctcc gtcctgccct cagcccggcc ctggcccctt cccgaccccc 900
acccgccatt cagaccccat taagaaggtt ggcttggcca ggcaggatgg gctgtgtccg 960
gccctgcagc ctagtggaag gtgctgaggg ggccctgagg caggaccgcc ctcctgaccc 1020
ctggtaggag ggtcacatcc acttggtgca ggtggccctt ggtgacccac ttcttcctgg 1080
agcgtccctg cctagagctc agcccacagg actgcttcag gccgtggcca caggtagcag 1140
ccgcaagggg aaatgaagaa aactgagccc tcgtggccac ctgtgtcacc cttgtgcctt 1200
agcctcatgg gctgcctagg agctgcctgc acggcacagc tcgctttcac agtcagaagt 1260
gggtctgtgg gatctgtggt ccctgtcctc cctgctgtcc cttctgggga ggctttggtg 1320
gctctgaggt ggacaaagag ctctcgcaag aagagacagc gtgatgcctc ccacagtcca 1380
ccccagaccc tggggcagcc cctctggccc tgccagctgc ctgcgtcgtt gggcccaggg 1440
tggctggcag gagtcccagc tgcttgcttt aggacctggc agcttttctt gccgtccctc 1500
ccctgcctcc agaatcacag cccttctccc caagggaggc tgaggaggct tctccaccag 1560
tggcagcccc accccgtccc tggccattct tggcctccac cccgctcagg cccctactcg 1620
ggcgctccca gaaggagcca cctctcagtg cctcacctcc ccctgcctcc cagcctccgc 1680
agatgaggtt cctgcccctt cctcctcgta accaaaaccc tcactgctcc caggacggtc 1740
ttatttataa accagataca tgttcttagt ctggtcccag accaaggagc tggtcagacg 1800
gccctttcta atcctacatg ttgagcttat gtaaaaaatg ttgtttcctc ctgtttttgg 1860
ttcctttctt acccacaaac cattactact tgaaacttaa aaaactcgcc aagtgtaaag 1920
gctaaagaga agcagtttga cggaccttgt gatttgtact gtttgctgcg gagctattta 1980
aagattttgg aataaatata caaaactacg gttgtgaaat aaaaacttaa attgtatatt 2040
ttgaaaaata aaacactgaa aagaaaccaa caaaaaaaaa aaaaaaaaaa aaaaaa 2096
<210> 9
<211> 5640
<212> DNA
<213> human
<400> 9
ggaaacgcag aaaacagaga gaggcattct gagtcatctg actggatgaa gactgttcca 60
agttacaacc aaacaaatag ctccatggac tttagaaatt atatgatgag agatgagact 120
ctggaaccac tgcccaaaaa ctgggaaatg gcctacactg acacagggat gatctacttc 180
attgaccaca ataccaagac aaccacctgg ttggatcctc gtctttgtaa gaaagccaaa 240
gcccctgaag actgtgaaga tggagagctt ccttatggct gggagaaaat agaggaccct 300
cagtatggga catactatgt tgatcacctt aaccagaaaa cccagtttga aaatccagtg 360
gaggaagcca aaaggaaaaa gcagttagga caggttgaaa ttgggtcttc aaaaccagat 420
atggaaaaat cacacttcac aagagatcca tcccagctta aaggtgtcct tgttcgagca 480
tcactgaaaa aaagcacaat gggatttggt tttactatta ttggtggaga tagacctgat 540
gagttcctac aagtgaaaaa tgtgctgaaa gatggtcccg cagctcagga tgggaaaatt 600
gcaccaggcg atgttattgt agacatcaat ggcaactgtg tcctcggtca cactcatgca 660
gatgttgtcc agatgtttca attggtacct gtcaatcagt atgtaaacct cactttatgt 720
cgtggttatc cacttcctga tgacagtgaa gatcctgttg tggacattgt tgctgctacc 780
cctgtcatca atggacagtc attaaccaag ggagagactt gcatgaatcc tcaggatttt 840
aagccaggag caatggttct ggagcagaat ggaaaatcgg gacacacttt gactggtgat 900
ggtctcaatg gaccatcaga tgcaagtgag cagagagtat ccatggcatc gtcaggcagc 960
tcccagcctg aactagtgac tatccctttg attaagggcc ctaaagggtt tgggtttgca 1020
attgctgaca gccctactgg acagaaggtg aaaatgatac tggatagtca gtggtgtcaa 1080
ggccttcaga aaggagatat aattaaggaa atataccatc aaaatgtgca gaatttaaca 1140
catctccaag tggtagaggt gctaaagcag tttccagtag gtgctgatgt accattgctt 1200
atcttaagag gaggtcctcc ttcaccaacc aaaactgcca aaatgaaaac agataaaaag 1260
gaaaatgcag gaagtttgga ggccataaat gagcctattc ctcagcctat gccttttcca 1320
ccgagcatta tcaggtcagg atccccaaaa ttggatcctt ctgaggtcta cctgaaatct 1380
aagactttat atgaagataa accaccaaac accaaagatt tggatgtttt tcttcgaaaa 1440
caagagtcag ggtttggctt cagggtgcta ggaggagatg gacctgacca gtctatatat 1500
attggggcta ttattcccct gggagcagct gagaaagatg gtcggctccg cgcagctgat 1560
gaactaatgt gcattgatgg aattcctgtt aaagggaaat cacacaaaca agtcttggac 1620
ctcatgacaa ctgctgctcg aaatggccat gtgttactaa ctgtcagacg gaagatcttc 1680
tatggagaaa aacaacccga ggacgacagc tctcaggcct tcatttcaac acagaatgga 1740
tctccccgcc tgaaccgggc agaggtccca gccaggcctg caccccagga gccctatgat 1800
gttgtcttgc aacgaaaaga aaatgaagga tttggctttg tcatcctcac ctccaaaaac 1860
aaaccacctc caggagttat tcctcataaa attggccgag tcatagaagg aagtccggct 1920
gaccgctgtg gaaaactgaa agttggagat catatctctg cagtgaatgg gcagtccatt 1980
gttgaactgt ctcatgataa cattgttcag ctgatcaaag atgctggtgt caccgtcaca 2040
ctaacggtca ttgctgaaga agagcatcat ggtccaccat caggaacaaa ctcagccagg 2100
caaagcccag ccctgcagca caggcccatg ggacagtcac aggccaacca catacctggg 2160
gacagaagtg ccctagaagg tgaaattgga aaagatgtct ccacttctta cagacattct 2220
tggtcagacc acaagcacct tgcacagcct gacaccgcag taatttcagt tgtaggcagt 2280
cggcacaatc agaaccttgg ttgttatcca gtagagctgg agagaggccc ccggggcttt 2340
ggattcagcc tccgaggggg gaaggagtac aacatggggc tgttcatcct tcgtcttgct 2400
gaagatggtc ctgccatcaa agatggcaga attcatgttg gtgaccagat tgttgaaatc 2460
aatggggaac ctacacaagg aatcacacat actcgagcaa ttgagctcat tcaggctggt 2520
ggaaataaag ttcttcttct tttgaggcca ggaactggct tgatacctga ccatggtttg 2580
gctccttccg gtctgtgctc ctacgtgaaa cccgagcaac attaaggctt tcagggcttt 2640
tcttggtctt tccttaaaaa gacttggtga ttgggatatt aataatcctt cgtcttcaaa 2700
tgtgatttat gatgaacagt caccattacc cccatcttca cattttgctt ccatatttga 2760
agagtctcac gtgccagtaa ttgaagaatc tttgagagtt cagatatgtg aaaaggcaga 2820
agaattaaag gacattgtgc ctgaaaagaa aagcacttta aatgaaaatc agcctgagat 2880
aaagcatcag tctcttctcc agaaaaatgt gagtaagagg gatccaccca gcagtcatgg 2940
gcacagtaac aagaaaaatc tattaaaagt agaaaatggt gttacacgaa gaggtagatc 3000
ggttagtccc aaaaagccag ccagtcaaca ttcagaggaa catttggata agattcctag 3060
tcctctaaaa aataacccca aaagaagacc cagagatcaa tccctcagcc ccagcaaagg 3120
ggaaaataaa agttgtcagg tcagcaccag ggcaggctct ggacaagatc agtgcagaaa 3180
aagcagaggt cggtcggcca gcccaaaaaa gcagcaaaaa attgaaggaa gcaaagctcc 3240
atcaaatgct gaggccaaat tattagaggg taagagtcga agaatagcag gctatacggg 3300
cagtaatgct gagcagatcc cagatgggaa ggaaaaatca gacgtcatca ggaaagatgc 3360
aaagcagaat cagttggaaa aaagcagaac aaggtctcca gagaaaaaaa tcaaaagaat 3420
ggttgagaaa tctcttccat ccaaaatgac taataagact acaagtaaag aagtatctga 3480
aaatgaaaaa ggaaagaaag taaccacagg agaaacaagt tctagtaacg ataaaatagg 3540
agaaaatgtc cagctatcag aaaagaggct gaagcaagaa cctgaagaga aggtagtttc 3600
aaacaaaaca gaagatcaca aagggaaaga actagaggca gctgacaaaa acaaagagac 3660
tggaaggttc aaaccggaaa gcagttctcc agttaagaaa acactgataa ctccagggcc 3720
ctggaaggtt ccaagtggaa ataaagtcac aggcactatt ggtatggctg agaaacggca 3780
gtaaccttta gtataaaaca aagaaaaaca agttgtaatc ttttcttaca gcagcatttt 3840
tccagaaaaa gccttttttt ttttttcaga tattctgaaa cagataagta catgttaatg 3900
tgagcctcaa gttacctagg ctgcatgaag ggcctttagg attgctaaga accaactgtc 3960
cccctggccg gctgccctcc ctcgctctca ggaaggagct gcatccacat gctcatctga 4020
cccgccctgc tcaggctgcc cagctcgtct tcatgagtgt ctgaacaaat gacatatgtt 4080
gatattaaca atgtggtcac aactcacttt gtatttgtgc caagttatct actgtatcat 4140
gtctgttttt atcctttttg ttcagctgtt tccacagtaa tgaaaaagtt aggtttggct 4200
tggaagttga tgatctcaat agcatgttgc atgtttacag agagaaatat gtgagtcctt 4260
gcagaagaag agactgttaa ctcatcgtta aagatggccg ttgtctcttc taacagctac 4320
tgatgatgtc ccactttaaa aataaaaccc ccaaacatca ctactttaag gaaaaaaaaa 4380
atgtagtcca atattgatgc tttcttatgg ctttttattt taatttggct ggataagttg 4440
tttcaaataa ctgttaaaga tattacttac aattgaatgt ttgaaataag aaagtacttt 4500
aagcaataga gttcatctcc tgctgtgtta tccaacctcg atgtatactt acagcatctc 4560
aggtcaccct ttttatttca gttatttaat tatgaaacca taaagaagca tgtggaaata 4620
gtgtttattg ctctttgaag aaaaaccacc aactatttct ggatattttg gctgtaccta 4680
ctactaaagt cattagtctt taatacataa tacatatttg aaaagtaaac atattatata 4740
gattatgtga gggacttaat catgaaacca gtttcacagt ccaagtacca actcttctgg 4800
tagcaggtgc acaagcttgg gtgtttaaaa acaacctgtg tagggtatgc ccagcaaatg 4860
aggacaaatg tgtagacagt acttactgga tcttatttaa cttttagcta cattaactaa 4920
ctttcttatt taaaaacaag aaagggagac taaacatctg cttaacttgt acacattttc 4980
agaattcttt ttaaaagtct agttaaagat gtttcttaga agttggagac tgttaacaac 5040
ttccataaaa tagatccagg tttttcagtt ccctgaagca gcattcagta gcatctatat 5100
aaataaaggc accttctgag aataaaacta ttttatggag tgtgtgaaca cacttgttct 5160
gtcacctggg ttcatcttgt tgtgaagcac attaggtcca ggtccttccc tctgggagtc 5220
tgactgtgaa actctttaac ccaacaactc aattagcccc tgtagataag acatgcttcc 5280
cagagtgaga tttttgaaat ccccttttca tccagaacta tatttaccca cctattgtaa 5340
ctattcaaat agagcaaaat taggaggctt gataaatact aagaatttag taccacagaa 5400
attatttatt attttccctg tagtccacaa ttagtgataa cgaatcctat ttttgttaac 5460
tgtgacataa ctttgatgtc atatgttgtc ctatgtggtt cttcctaagt aaactctgta 5520
ctgattatat actgacttag caatgtggcc ttggaatgct gagcaaaatg tggatgtact 5580
ggttgtaaat gtttatatat tgtacagtac ctttatatat acacttgagg ttctgattag 5640
<210> 10
<211> 457
<212> DNA
<213> human
<220>
<221> misc_feature
<222> (242)..(242)
<223> any kind of base
<220>
<221> misc_feature
<222> (369)..(369)
<223> any kind of base
<220>
<221> misc_feature
<222> (394)..(394)
<223> any kind of base
<220>
<221> misc_feature
<222> (406)..(406)
<223> any kind of base
<220>
<221> misc_feature
<222> (457)..(457)
<223> any kind of base
<400> 10
tcagtcactc tttcaccctg ccaaagcttc actgtcctac tgattgaatt gtatgtgaga 60
aataaaatgt catcatatta agccactggg atttgtatgt ttatctgtta tagcagcaag 120
tcttaattta cctaatacac acattgtgac agatgttctt aatgtcccac cccatattgt 180
tacatgtcca gctttgagga tccctggcat gtgggggtag gagtttctgg gcatgctgga 240
tncaattccc acttttaagg catctgtggc ctctgtggcc tctgtggcct tcactgttat 300
ggaagggatt tatctggggc accataggaa actttaccat ggcacagtgg acaacctagg 360
agggggtgng gaggaggggc cttcaggccc aacngggggg accagngttc gtggggttag 420
ggtggtttgg ggggttttcc ctcttacccg tgggggn 457
<210> 11
<211> 1493
<212> DNA
<213> human
<400> 11
aatagggttg gcggctgcag cgggcggcaa acagcccgcc cggcaccacc atgctcgccc 60
tggaggctgc acagctcgac gggccacact tcagctgtct gtacccagat ggcgtcttct 120
atgacctgga cagctgcaag cattccagct accctgattc agagggggct cctgactccc 180
tgtgggactg gactgtggcc ccacctgtcc cagccacccc ctatgaagcc ttcgacccgg 240
cagcagccgc ttttagccac ccccaggctg cccagctctg ctacgaaccc cccacctaca 300
gccctgcagg gaacctcgaa ctggccccca gcctggaggc cccggggcct ggcctccccg 360
cataccccac ggagaacttc gctagccaga ccctggttcc cccggcatat gccccgtacc 420
ccagccctgt gctatcagag gaggaagact taccgttgga cagccctgcc ctggaggtct 480
cggacagcga gtcggatgag gccctcgtgg ctggccccga ggggaaggga tccgaggcag 540
ggactcgcaa gaagctgcgc ctgtaccagt tcctgctggg gctactgacg cgcggggaca 600
tgcgtgagtg cgtgtggtgg gtggagccag gcgccggcgt cttccagttc tcctccaagc 660
acaaggaact cctggcgcgc cgctggggcc agcagaaggg gaaccgcaag cgcatgacct 720
accagaagct ggcgcgcgcc ctccgaaact acgccaagac cggcgagatc cgcaaggtca 780
agcgcaagct cacctaccag ttcgacagcg cgctgctgcc tgcagtccgc cgggcctgag 840
cacacccgag gctcccacct gcggagccgc tgggggacct cacgtcccag ccaggatccc 900
cctggaagaa aaagggcgtc cccacactct aggtgatagg acttacgcat ccccaccttt 960
tggggtaagg ggagtgctgc cctgccataa tccccaagcc cagcccgggc ctgtctggga 1020
ttccccactt gtgcctgggg tccctctggg atttctttgt catgtacaga ctccctggga 1080
tcctcatgtt ttgggtgaca ggacctatgg accactatac tcggggaggc agggtagcag 1140
tgcttccaga gtcccaagag cttctctggg attttcttgt gatatctgat tccccagtga 1200
ggcctgggac ctttttaaga tcgctgtgtg tctgtaaacc ctgaatctca tctggggtgg 1260
gggccctgct ggcaaccctg agccctgtcc aaggttccct cttgtcagat ctgagatttc 1320
ctagttatgt ctggggccct ctgggagctg ttatcatctc agatctcttc gcccatctat 1380
ggctgtgttg tcacatctgt cccctcattt ttgagatccc ccaattctct ggaactattc 1440
tgctgcccct ttttatgtgt ctggagttcc ccaatcacat ctagggctcc tcc 1493
<210> 12
<211> 2292
<212> DNA
<213> human
<400> 12
ccatgggttc cccttcagcc tgtccataca gagtgtgcat tccctggcag gggctcctgc 60
tcacagcctc gcttttaacc ttctggaacc tgccaaacag tgcccagacc aatattgatg 120
tcgtgccgtt caatgtcgca gaagggaagg aggtccttct agtagtccat aatgagtccc 180
agaatcttta tggctacaac tggtacaaag gggaaagggt gcatgccaac tatcgaatta 240
taggatatgt aaaaaatata agtcaagaaa atgccccagg gcccgcacac aacggtcgag 300
agacaatata ccccaatgga accctgctga tccagaacgt tacccacaat gacgcaggat 360
tctataccct acacgttata aaagaaaatc ttgtgaatga agaagtaacc agacaattct 420
acgtattctc ggagccaccc aagccctcca tcaccagcaa caacttcaat ccggtggaga 480
acaaagatat tgtggtttta acctgtcaac ctgagactca gaacacaacc tacctgtggt 540
gggtaaacaa tcagagcctc ctggtcagtc ccaggctgct gctctccact gacaacagga 600
ccctcgttct actcagcgcc acaaagaatg acataggacc ctatgaatgt gaaatacaga 660
acccagtggg tgccagccgc agtgacccag tcaccctgaa tgtccgctat gagtcagtac 720
aagcaagttc acctgacctc tcagctggga ccgctgtcag catcatgatt ggagtactgg 780
ctgggatggc tctgatatag cagccttggt gtagtttctg catttcggga agagtgtttt 840
tattatccac ctgcagactg gactggattc ttctagctcc ttcaatccca ttttctcctg 900
tggcatcact aagtataaga cctgctctct tcctgaagac ctataagctg gaggtggaca 960
actcaatgta aatttcaagg aaaaaccctc atgcctgaga tgtgggccac tcagagctaa 1020
ccaaaatgtt caacaccata actagagaca ctcaaattgc caaccaggac aagaagttga 1080
tgacttcatg ctgtggacag tttttcccaa gatgtcccaa gcctcatcgt gacgaggctc 1140
ttatcccact ccatttttcc ctgctcatgc ctgcctcttt aatttggtaa gataatgctg 1200
taactagaat ttcacaatca gcgccttgtg caggcaattt gacagagtgt tggatgtgtc 1260
atgtcatcat gtcaaaccca aatatttgac ctaagggatc ctttattctg cccagtggct 1320
aactttaaca acatccctaa tacaactgtt tattcaaatg cacggtggtc cctgttagag 1380
ttagacctct agactcacct gttctcacgc cctgttttaa tttaacccag ctatgggatg 1440
ccagataaca gaattgctgc ctacgagctg aacagggagg agtttgtgca gttgctgaca 1500
cttcttgttg cacataaata aatacagtgg gtactataga gactcagttg caaaaattaa 1560
caaatatgct gcttgattaa aatgggtagg cttctcatgt ggctcattct ttaatctatt 1620
ctcttttatt tggtttggtt catggggtct ctgcctatgg atcatacttc aaactcttgg 1680
tgtgatcctc ctgattgtca caatattagt taccctggtg tgctgtattc tctaaaacct 1740
ttaaatgttt gcatgcagcc attcgtcaaa tgtcaaatat tctctctttg gctggaatga 1800
caaaaactca aataaatgta tgattaggag gacatcataa cctatgaatg atggaagtcc 1860
aaaatgatgg taactgacag tagtgttaat gccttatgtt tagtcaaact ctcatttagg 1920
tgacagcctg gtgactccag aatggagcca gtcatgctaa atgccatata ctcacactga 1980
aacatgagga agcaggtaga tcccagaaca gacaaaactt tcctaaaaac atgagagtcc 2040
aggctgtctg agtcagcaca gtaagaaagt cctttctgct ttaactctta gaaaaaagta 2100
atatgaagta ttctgaaatt aaccaatcag tttatttaaa tcaatttatt tatattcttc 2160
tgttcctgga ttcccatttt acaaaaccca ctgttctact gttgtattgc ccagtaggag 2220
ctatcactat attttgcaga atggaaactg ccctgactct tgaatcacaa ataaaagcca 2280
attgtatctg tt 2292
<210> 13
<211> 519
<212> DNA
<213> human
<220>
<221> misc_feature
<222> (212)..(212)
<223> any kind of base
<220>
<221> misc_feature
<222> (451)..(451)
<223> any kind of base
<400> 13
gaaacaacaa cagtgtaatc tttaacaggg atgttaaagg taagaagtca ggaagataaa 60
ccaaaatgat tgagtatgat aaagaatttt gcatggcgat taaaatagaa aacctataaa 120
tgtagaaaaa gcaggtctgg acttagcaaa gaaacaatat agtttggaga aggcatgaaa 180
taagttcttt tcatgttcac tgctggtcac ancataacag agagtgatgt ggagagcttt 240
gggaaggttt cacgttgagt tacatcagtg gtcaacaatg gagcaacaag actccgtaga 300
ggatgccacc ctgggagaat tgcaagggaa aggaggctga agcacaactg gtaatagcct 360
tcagatattt aatggatatg caaataaagc tctgattaat tgtattttca cttattatat 420
atcatctttg gacctttcta aaagtgggac nctagaaaag atatactgaa actccaaaag 480
aatacttcag ctcgagttga atggattcaa gatgttgtt 519
<210> 14
<211> 5294
<212> DNA
<213> human
<400> 14
ggctcgcatc cccatagtgc tgggttacag tgaaggtacg ccccgcgctc tgctctggag 60
aggcagggtg ggatagggaa cgtctcgagt ggcgcccgca gtcatggtgg tgttcgttgg 120
ccgccgcctc ccggcgctcc tagggctgtt taagaagaag ggctctgcca aggctgagaa 180
tgacaaacat ctaagtgtag ggcctggcca ggggccaggg tctgcagtgg atgagcacca 240
ggacaacgtc ttctttccca gtgggcgacc cccccacctg gaagagctgc acactcaggc 300
ccaggagggg ctccgctccc tacaacacca agagaaacag aaactgaaca agggtggctg 360
ggaccatgga gacacccaga gtatccagtc ctcccggacg gggccggatg aagacaacat 420
ctccttctgc agtcagacca catcctacgt ggctgagagc tccacagcag aggacgcgct 480
ctccatccgc tcggagatga tccagcgcaa aggctccacc ttccgacccc atgactcatt 540
tcccaaatct ggaaagtcag ggcggcgtcg gcgggagcgg cggagcactg tgctgggact 600
cccgcagcat gtgcagaagg agcttggcct gaggaatgag cgtgaggcac caggcacgcc 660
ccgggctcct ggtgcacggg atgccgtacg catccccaca gtggacggcc gcccccgagg 720
cacctcaggg atgggggccc gggtgtccct gcaggcgctg gaggcggagg cagaggctgg 780
cgctgagaca gaggccatgc tgcagcgcca cattgaccgt gtctaccggg atgacacctt 840
tgttggccgg tccacgggta cccgggcccc accattgacc cggcccatgt ccctagcagt 900
gcctggattg acaggagggg cagggcctgc agagcccctg agcccggcca tgtccatctc 960
cccccaggcc acctacctgt cgaagttgat tccacatgct gtgctgccgc ctacagtgga 1020
cgtggtggcc ctaggccgct gcagcctgcg cacactaagc cgctgcagcc tgcactcggc 1080
cagcccagcc tcagtccgct cgctggggcg cttctcctcc gtctccagcc cacagccccg 1140
cagccgccac ccatcctcct ccagtgacac ctggagccac tctcaatcct ccgacaccat 1200
tgtgtctgac ggttccaccc tctcctctaa gggtggctct gagggccagc cggagagctc 1260
tacggctagc aatagcgtgg taccccctcc ccagggaggc agtgggaggg gctctcccag 1320
tgggggcagc actgctgagg cctcagacac actcagcatt cggagcagtg ggcagttgtc 1380
tggccggagt gtgtccctgc gtaagctgaa gcggcctcca ccccctcccc gccggaccca 1440
ctccctccat cagcggggct tagcagtgcc tgatgggcca ttagggttgc cccctaagcc 1500
tgagcgtaag cagcagcccc agctgcctcg gccacccacc actggtggct cagaaggggc 1560
gggggcagca ccctgtccac ccaacccagc caacagctgg gtacctggct tgtctccggg 1620
tggttcccgg cgccccccac ggtccccaga acggacactt tcgccctcca gtggatactc 1680
gagccaaagt ggtactccca ccctccctcc caagggcctg gcaggtcccc ctgcttcccc 1740
aggcaaggcc cagcccccta aaccagagcg tgtcacgtct cttcgctccc ctggggcctc 1800
cgtctcctct tccctcacgt ctttatgttc ctcctcctct gacccagccc cctcagaccg 1860
ctctgggcca cagatattga cccccctggg tgacaggttt gtcatacctc ctcaccccaa 1920
ggtgcctgcc cccttctccc cacctccctc caagcccagg agccctaacc cagctgcccc 1980
tgctctagcc gcccctgctg tggttcctgg gcctgtttct accactgacg ccagtcctca 2040
gtcccctccc actccccaga caaccttgac tccactgcag gagtctcctg tcatctccaa 2100
agaccagtca cccccacctt ccccaccccc atcttatcat ccacccccac cacccactaa 2160
gaagccagag gtggttgtgg aggcaccatc tgcctcagag actgctgagg agcccctcca 2220
agatcccaac tggccccctc ccccaccccc tgcccctgag gagcaggacc tgtccatggc 2280
tgacttcccc ccaccagagg aggctttttt ctctgtggcc agccctgagc ctgcaggccc 2340
ttcaggctcc ccagagcttg tcagctcccc ggctgcttcg tcctcctcag ctactgcttt 2400
gcagattcag cccccgggta gcccagaccc tcctccagct ccgccagccc cagctcctgc 2460
tagttccgcc ccagggcatg tggccaagct ccctcagaag gaaccggtgg gctgtagcaa 2520
gggtggtggg cctcccaggg aggacgtagg tgcgcccctg gtcacgccct cgctcctgca 2580
gatggtgcgg ctgcgctccg tgggtgctcc aggaggggct cccaccccag cactggggcc 2640
atcggccccc cagaaaccac tgcgaagggc cctgtcaggg cgggccagcc cagtgcctgc 2700
cccctcctca gggctccatg ctgcggtccg actcaaggcc tgcagcctgg ccgccagtga 2760
aggcctctca agtgctcagc ccaacggacc gcctgaggca gagccacggc ctccccagtc 2820
ccctgcctca acggccagtt tcatcttctc caagggctct aggaagctgc agctggagcg 2880
gcccgtgtcc cctgagaccc aggctgacct ccagcggaat ctggtggcag aactccggag 2940
catctcagag cagcggccac cccaggcccc aaagaagtca cctaaggctc ccccacctgt 3000
ggcccgcaag ccgtctgtgg gagtcccccc acccgcctcc cccagttacc ctcgagctga 3060
gccccttact gctcctccca ccaatgggct ccctcacacc caggacagga ctaagaggga 3120
gctggcggag aatggaggtg tcctgcagct ggtgggccca gaggagaaga tgggcctccc 3180
gggctcagac tcacagaaag agctggcctg accaccaggc acctcactgg cactgctgac 3240
ccatcccaga aacacaatct cagggacccg agcagctcca aggacgagag gatacagcag 3300
acacaaccta atagagaggg cgcctgcagc cttaacctcc acggccttcg atacttatgc 3360
aagcctggtg ttgctcctgt cctcagagtc atcctgcgct catgcctttt cccgaatggg 3420
ttcacctctg gcagttgccg cttcagtctt ggccttagcc tcatcttgaa gtgggtagct 3480
ggcgggagag ggtggctgcg ccccctgctg gccctgaggc tgcagagttg ggagcaggac 3540
acctcacctg agtttcattt tttttcatgt ccaaaccatg cacatactat agtccagaat 3600
caaagcactt ttgaaaagtg gctgcatggc catcctccag ggcccaggaa gttgcattcc 3660
aagggcctgt ttacatggca gcagaatcca tccccggcag tcagcccata gcttgggacc 3720
agtctgtgcc ctcctgccca gtccagttta ctcctcttgg ttcctgaagg tggccaagtc 3780
attgtgttcc cacaggcttc tctaggctgg gggcaggtgt ggggctgtgg aattccaaag 3840
cacaaaaggt gcagagggga ttggccttcc tgtgcctcaa ctcaccaacc accctcctgc 3900
cttccagttc tgccaggtgc tccatgctgg ggacaagtag gagactgcca gggcccaaag 3960
aaatgggtga gcagtagagt catctcgggg cacttggcag tgtcaagcac ctgccccttg 4020
cctccttgac cacactgggg tgggtgggcc cccagcactt cagaggcagg agcctttggg 4080
ctgagcaagc actgaggagg tggatggaag ggagcatctg gaggggggga gcttccttga 4140
gcagtgggcc caggcctggc cctccacact tcattctctg acctttctct ctcctcattt 4200
cggtgcatgt cctttctgca gctgcctttc agcacaggtg gttccactgg gggcagctaa 4260
cgctgagtga caaggatggg aagccacagg tgcattttac tcaagtcttc tctagtcaat 4320
gaggggcacc cagtgcttct agggcaggct gggtggtggt cccctaggta tcagcctctc 4380
ttactgtact ctccgggaat gttaaccttt ctattttcag cctgtgccac ctgtctaggc 4440
aagctggctt ccccattggc ccctgtgggt ccacagcagc gtggctgccc cccagggcca 4500
ccgcttcttt cttgatcctc tttccttaac agtgacttgg gcttgagtct ggcaaggaac 4560
cttgctttta gcttcaccac caaggagaga ggttgacatg acctccccgc cccctcacca 4620
aggctgggaa cagaggggat gtggtgagag ccaggttcct ctggccctct ccagggtgtt 4680
ttccactagt cactactgtc ttctccttgt agctaatcaa tcaatattct tcccttgcct 4740
gtgggcagtg gagagtgctg ctgggtgtac gctgcacctg cccactgagt tggggaaaga 4800
ggataatcag tgagcactgt tctgctcaga gctcctgatc taccccaccc cctaggatcc 4860
aggactgggt caaagctgca tgaaaccagg ccctggcagc aacctgggaa tggctggagg 4920
tgggagagaa cctgacttct ctttccctct ccctcctcca acattactgg aactctatcc 4980
tgttaggatc ttctgagctt gtttccctgc tgggtgggac agaggacaaa ggagaaggga 5040
gggtctagaa gaggcagccc ttctttgtcc tctggggtaa atgagcttga cctagagtaa 5100
atggagagac caaaagcctc tgatttttaa tttccataaa atgttagaag tatatatata 5160
catatatata tttctttaaa tttttgagtc tttgatatgt ctaaaaatcc attccctctg 5220
ccctgaagcc tgagtgagac acatgaagaa aactgtgttt catttaaaga tgttaattaa 5280
atgattgaaa cttg 5294
<210> 15
<211> 988
<212> DNA
<213> human
<400> 15
gtcgtgaggc gggccttcgg gctggctcgc cgtcggctgc cggggggttg gcctgggtgt 60
cattggctct gggaagcggc agcagaggca gggaccactc ggggtctggt gtcggcacag 120
ccatggcggg cgcgttggtg cggaaagcgg cggactatgt ccgaagcaag gatttccggg 180
actacctcat gagtacgcac ttctggggcc cagtagccaa ctggggtctt cccattgctg 240
ccatcaatga tatgaaaaag tctccagaga ttatcagtgg gcggatgaca tttgccctct 300
gttgctattc tttgacattc atgagatttg cctacaaggt acagcctcgg aactggcttc 360
tgtttgcatg ccacgcaaca aatgaagtag cccagctcat ccagggaggg cggcttatca 420
aacacgagat gactaaaacg gcatctgcat aacaatggga aaaggaagaa caaggtcttg 480
aagggacagc attgccagct gctgctgagt cacagatttc attataaata gcctccctaa 540
ggaaaataca ctgaatgcta tttttactaa ccattctatt tttatagaaa tagctgagag 600
tttctaaacc aactctctgc tgccttacaa gtattaaata ttttacttct ttccataaag 660
agtagctcaa aatatgcaat taatttaata atttctgatg atgttttatc tgcagtaata 720
tgtatatcat ctattagaat ttacttaatg aaaaactgaa gagaacaaaa tttgtaacca 780
ctagcactta agtactcctg attcttaaca ttgtctttaa tgaccacaag acaaccaaca 840
gctggccacg tacttaaaat tttgtcccca ctgtttaaaa atgttacctg tgtatttcca 900
tgcagtgtat atattgagat gctgtaactt aatggcaata aatgatttaa atatttgtta 960
aaaaaaaaaa aaaaaaaaaa aaaaaaaa 988
<210> 16
<211> 4908
<212> DNA
<213> human
<400> 16
ggataacctc gcagggtggg ccggagggcg ggcgccgccg ctgcctgtgc tgcggcgatg 60
gcccagtgtg tacaatcagt gcaggagcta atcccggact ccttcgtccc ctgtgtcgct 120
gcgctgtgca gcgacgaagc cgagcggctc actcgtctca atcacctcag cttcgcggag 180
ctgcttaagc ccttctcccg cctcacttcc gaggttcaca tgagagatcc taataatcaa 240
cttcacgtaa ttaaaaattt gaagatagca gtaagcaaca ttgtcaccca gccacctcag 300
cctggagcca tccggaagct tttgaatgat gttgtttctg gcagtcagcc tgcagaagga 360
ttagtagcta atgtgattac agcaggagat tatgacctta acatcagtgc cactactcca 420
tggtttgagt cttacagaga aacctttctt cagtcgatgc cagcatcgga tcatgaattt 480
ctgaaccact atttagcatg tatgttggta gcgtcatcta gtgaagctga acctgtggaa 540
cagttttcaa agttgtcaca agaacagcat cgaattcagc acaacagtga ttattcctac 600
cccaagtggt ttataccaaa tacacttaaa tactatgtac ttttacatga tgtaagtgca 660
ggagatgaac agagagctga atcaatttat gaagaaatga aacagaaata tggaactcag 720
ggttgctatt tacttaaaat taattctcga acatctaatc gagcatcaga tgaacagata 780
ccagatcctt ggagtcagta tctccagaaa aatagtattc aaaaccagga atcatatgaa 840
gatggccctt gtactataac ttcaaataag aattctgata ataacttgct ttcattggat 900
ggattagata acgaagtcaa agatggctta ccaaataact ttagagctca cccacttcag 960
ttggagcaat ccagtgaccc ttctaacagt attgatggcc cagatcatct aagatctgct 1020
tcatcgttac atgaaacaaa gaaaggaaat actggaataa ttcatggtgc atgtttaaca 1080
cttactgatc atgatagaat tcgacagttt atacaagagt tcacatttcg gggccttttg 1140
ccacatatag agaaaacaat taggcaatta aacgatcagc taatatcaag aaaaggtttg 1200
agtcgatctc tattttctgc aactaaaaaa tggtttagtg gcagtaaagt tccagaaaag 1260
agcattaatg acctgaaaaa tacatctggc ttgctgtatc ctccggaagc accagaactt 1320
caaatcagga aaatggctga cttatgtttt ttggtgcagc attatgattt ggcttacagt 1380
tgctatcata ctgcaaagaa agattttctt aatgatcaag caatgcttta tgcagctggt 1440
gccttggaaa tggcagcagt gtctgctttt cttcaaccag gagcacctag gccatatcct 1500
gctcattaca tggatacagc aattcagaca tacagagata tctgcaagaa tatggtgttg 1560
gctgaaagat gtgtgttgct tagtgctgaa cttttaaaaa gccaaagcaa atattcagag 1620
gctgcagctc tcctaatacg gttgaccagt gaggattctg atcttcgaag tgcacttctt 1680
ttggaacagg cagcacattg ctttataaac atgaaaagtc ccatggttag aaaatatgca 1740
tttcatatga tattggcagg ccatcgattt agtaaagcag ggcagaaaaa gcatgcttta 1800
cgctgttatt gtcaagccat gcaagtttac aaaggaaaag gctggtctct tgcagaggat 1860
cacattaatt tcactattgg gcgccagtcc tatactctta gacagctgga taatgctgtg 1920
tctgctttta ggcatattct aattaatgaa agtaaacaat ctgctgctca acagggggct 1980
ttcctcagag aatatcttta tgtttacaag aatgtaagtc agctgtcacc agatggtcct 2040
ttgccacagc ttcctttacc gtatattaac agttcagcaa cacgggtttt ttttggccat 2100
gacagacgac cagcggatgg tgaaaaacaa gcagctactc atgtaagtct tgatcaagaa 2160
tatgattctg aatcctctca gcagtggcga gaacttgagg aacaagttgt ttctgtggtt 2220
aacaaaggag taattccatc caattttcat cccacacaat actgtttgaa cagttactca 2280
gataattcaa gatttccact tgcagttgta gaagaaccaa ttacagtgga agtggctttt 2340
agaaaccctt tgaaagttct acttttgttg actgatttgt cattgctttg gaagtttcat 2400
cctaaagatt tcagtggaaa ggataatgaa gaagttaaac aactagttac aagtgaacct 2460
gaaatgattg gagctgaagt tatttcagag ttcttaatta atggcgaaga atcaaaagtg 2520
gcaagactaa agctctttcc ccatcacata ggggagctgc atattctggg agttgtttat 2580
aatcttggca ctattcaggg ctctatgaca gtagatggca ttggtgctct tcccggatgt 2640
cacacaggaa aatattcctt gagtatgtca gtccgaggga agcaggattt agaaattcaa 2700
ggtcctcgac ttaacaacac aaaagaagag aaaacatctg ttaaatatgg ccctgatcga 2760
cgtttagatc ccataatcac agaagaaatg ccactgttgg aggtgttctt tatacatttt 2820
cctacagggc ttctctgtgg agaaatccga aaagcatatg tagaatttgt caatgtcagc 2880
aaatgtccac ttactggatt gaaggttgtt tctaaacgtc cagagttctt tactttcggt 2940
ggtaatactg ctgttctaac accactaagt ccctcagctt ctgagaattg tagtgcttac 3000
aagactgttg tgacagatgc tacctctgtg tgtacagcac tcatatcatc agcttcttct 3060
gtagactttg gcattggcac aggaagtcaa ccagaggtga ttcctgttcc ccttcctgac 3120
actgttcttc tacccggagc ctcagtgcag ctgccaatgt ggttacgtgg gcctgatgaa 3180
gaaggtgtcc atgaaattaa ctttttgttt tactatgaaa gtgtcaaaaa gcagccaaaa 3240
atacggcaca gaatattaag acacactgca attatttgta ccagtcggtc tttaaatgta 3300
cgggccactg tctgcagaag taattctctt gaaaatgaag aaggcagagg aggcaatatg 3360
ctagtctttg tggatgtgga aaataccaat actagtgaag caggcgttaa ggaattccac 3420
atagtgcaag tatcaagtag tagcaaacac tggaagttac agaaatctgt aaatctttct 3480
gaaaacaaag atgccaaact tgccagtagg gagaagggaa agttttgctt taaggcaata 3540
agatgtgaga aagaagaagc ggccacacag tcctctgaaa aatatacctt tgcagatatc 3600
atctttggaa atgaacagat aataagttca gcaagcccat gtgcagactt cttttatcga 3660
agtttatctt ctgaattgaa aaaaccacaa gctcacttgc ctgtgcatac agaaaaacag 3720
tcaacagagg atgctgtgag attgattcaa aaatgcagtg aggtagattt gaatattgtc 3780
atattatgga aggcatacgt tgtggaagac agtaaacagc ttattttgga aggtcaacat 3840
catgttattc ttcgcactat aggaaaagaa gccttttcat atcctcagaa acaggagcca 3900
ccagaaatgg aactattgaa atttttcagg ccagaaaaca ttacagtttc ctcaaggcca 3960
tcagtagagc agctttctag tctcattaaa acgagtcttc actacccaga atcatttaat 4020
catccatttc atcaaaaaag cctttgttta gtaccagtca ctcttttact ttccaattgt 4080
tctaaggctg atgtagatgt catagttgat cttcggcata aaacaacaag tccagaagca 4140
ctggaaatcc atggatcatt cacatggctt ggacaaacac agtataaact tcaacttaaa 4200
agccaggaga ttcacagtct gcagctgaaa gcatgctttg ttcatacagg tgtttataac 4260
cttggaactc ctagggtatt tgccaagtta tcggaccaag ttacagtgtt tgaaacaagt 4320
cagcagaatt ccatgcctgc cctgatcatc atcagtaatg tgtgacaact tggaaatttg 4380
tactgaaatc cacaataatc agtttttgct ggatgggttt tacagcagta tttgatatac 4440
ctaacttgtt atggaggttg attgatatct gatccctgca aaatactttg acttgtcatt 4500
ttgttgatga tgcaaagcac gttggactga gaatacttaa cattcttttt ctgtatttct 4560
ttaaaccctg agaataattt acatgctcat aatacaggat atcagcatat ttgtgcacct 4620
tattaagccc catcttaaga aaacacaaag tctaagtctg ctgttacaac ttgtcaatgg 4680
tatacgaata ttaggagatg attctgagaa aggaaaggcc ttgttggcag tactcctgtt 4740
aagccattag tctctaaatt ccagctttac tgtgaagttc tatagagtgt taaatacaaa 4800
ttttcctgtc ttgcttcaca cagttcctta aaatcagttt tgaactttgg tcatagagtc 4860
ttcatatttc agtatttggt ggtccctatg acttatacat aactttgt 4908
<210> 17
<211> 435
<212> DNA
<213> human
<220>
<221> misc_feature
<222> (30)..(30)
<223> any kind of base
<220>
<221> misc_feature
<222> (49)..(49)
<223> any kind of base
<220>
<221> misc_feature
<222> (75)..(75)
<223> any kind of base
<220>
<221> misc_feature
<222> (76)..(76)
<223> any kind of base
<220>
<221> misc_feature
<222> (78)..(78)
<223> any kind of base
<220>
<221> misc_feature
<222> (79)..(79)
<223> any kind of base
<220>
<221> misc_feature
<222> (109)..(109)
<223> any kind of base
<220>
<221> misc_feature
<222> (136)..(136)
<223> any kind of base
<220>
<221> misc_feature
<222> (137)..(137)
<223> any kind of base
<220>
<221> misc_feature
<222> (149)..(149)
<223> any kind of base
<220>
<221> misc_feature
<222> (227)..(227)
<223> any kind of base
<220>
<221> misc_feature
<222> (236)..(236)
<223> any kind of base
<220>
<221> misc_feature
<222> (246)..(246)
<223> any kind of base
<220>
<221> misc_feature
<222> (342)..(342)
<223> any kind of base
<220>
<221> misc_feature
<222> (363)..(363)
<223> any kind of base
<220>
<221> misc_feature
<222> (389)..(389)
<223> any kind of base
<220>
<221> misc_feature
<222> (426)..(426)
<223> any kind of base
<400> 17
ggtagaaatg attgtgatgt acaaattttn tattttgatc atacttaana agacagagca 60
gactcacatt cattnncnna atagtatcac tgtacacata gcgaatttnt ggcgctttta 120
gattgctctg aaaatnnctg aagagttgnc catagcagcc tggtaagcct tttcctttcc 180
cccaaagctc tcctgccctt tgcagaaaga ctgttggtga caactgntgc taactnaata 240
gcatgnggtt gaacttcgcc aaaatccttc cacctcctcc catagggcaa caggggtgac 300
ttgggcttaa agggcattga gtaagcaagt aggttatcag anaacagagg gaagattcca 360
ttntagataa tttccaaata ttacaattng tggaactcag agttcaactg ctcagttcct 420
tcttcngctg accct 435
<210> 18
<211> 2224
<212> DNA
<213> human
<400> 18
ctttagatct gtgcagcctt tgcgtgccaa acttgtgaaa ttccttttac cttttttgga 60
gtacttgcta taaagccacc tgtcaacaaa cccccattat gtacagaata ggacctatcc 120
agtagccagg ccagtaggca gttggggaag gtgggaagga tccagcgagg cccctgagcc 180
tgcacctgga caggtgtacg tctgcaccca tcaccctcag caccaggcca ccctgcagtc 240
cacttactgt actgtgttgt ggaaggatat gctaagtgat gaaagttgcg agcagtctca 300
ctggtcgtgt aaactttttt ttttttttgg aaattgaagc tgtagagtgc tgcccgaaat 360
ctctaggaag ttggtggcaa gggacagcac tcacactctt ctggtcatga tctctgatct 420
ccacctcaaa tgacaataaa aaactggtcc aacgaagaca ctgctcagca cttcagccat 480
caggactaat ccatcgatga ctggaaaaga ggctagcttt gaggaaaaca gcctgggctc 540
ttgggagcag agtccagtgg gtgtgaggct gacttgccga cggtcggcag gtaatggctc 600
tcagccggcg aggcggtccc acagctctcc tcccagggca gcctgaggag gaggaggccg 660
ggtgcctgtt tggtggcagc ttcagcctag ggatacctga agctgttgag caacaccttt 720
atgaaatgtt gccagagcag caacacttcc ctgtgggcac agccccggga aatccggtac 780
caagtgagca aggtggcagg acccacccaa gcctgatacg catctgggcc cgccgggctc 840
agcaggggag gctgctacgg ctgcccactt cccagcaccg tctgtcaggc ttgaacccct 900
ctgtgctgtt cccttcctgg ctaataggga gacccttcgc aggcacccac tgtttcaact 960
tgaccctccc accccctgct actctcctcc acacacccct ccgttccgct agcctaccct 1020
gtcagccttt caataaaagt tatgcacaaa tgtgaacacc tgagatggag ctgaacattt 1080
cttcactttg ttctttttct gaagtcaaac tcttatcaaa tgccctaaaa ttattaccac 1140
ccaagagaaa caggaaaaag gttacatgtt tttgtttact gagagtaaga tcacctgcat 1200
ctggaagacg ggctggtaaa ttggtttggc tacagaacag aaagaaaaca aaaacaaacc 1260
tcgtaaggga agtatcgcac tcagacacca ccacttccta gagccaaatg agcaatccca 1320
aactgcaagt gccgtaagtg ggcctgtgac gtcacaccgc ccggcccgag gtatcgcatg 1380
tgcgggggag gcccacacta cagctgtcct ctcgtctaga aggcaccacc tcgctttcat 1440
gtcccgtgtg ttttggaaaa gcagtatggt gtgtcatgtc tagcggcgaa cacttccctc 1500
cctctgtcct tgaggttgta atataaaaac tgtgtttctg tacgtgtggg tgggaattct 1560
ctgacggtgc tcgttcatag cacaagctta cgctgagttc tgaactgtcg ttcacagctg 1620
cgtgtctgca tggtgtcgca tctgttgtac ctttggggaa aatttgtatg taaatgtaca 1680
gaaataaaaa cgttgcccca ttaacagatt tcctctggaa tgtcttccct acctcacctg 1740
atggtatcca ccgaagggca tttcactacc attaatggtg agtaataaaa tcctccgtgt 1800
tcattcagac ctcactgcgt cactactttg aacgcctctg taagctgtgt cttcacccgc 1860
cccgaggtgg gtggagggag gcctctcact ctgcttcgag tcctggtctt aaaggtagtc 1920
agaggcagag gctggattaa acacacactg tttaccaagt gccactctca gaccacctga 1980
gagacggggg gccatcagta aaattaagag gaattttttt cccttgttcg tgtatgttct 2040
gctgatccgt ggcctgaagg ttcctagaga cgtcaagaaa tgaatatctt acactgtgat 2100
tctgtgagga aagactggta acccaaaact ctcttctcta atgtattttt taacgaaaat 2160
gacaatattt ctttaataaa gtatttatac caaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220
aaaa 2224
<210> 19
<211> 2244
<212> DNA
<213> human
<400> 19
gttgtttaaa agcaaggcat gcttgtggat gactctgtaa cagactaatt ggaattgttg 60
aagctgctcc ctggttccac tctggagagt aatctgggac atcttagtgt tttgttttgt 120
ttttttccct cctctttttt tgggggggag tgtgtgtggg gtttgttttt tagtcttgtt 180
tttttaattc attaaccagt ggttagcctt aaggggagga ggacggattg attccacatt 240
ccacttccta gatctagttt agaaaacatg ttccccatct ggtgctctta ggaaggagta 300
tagtaaatgc ctcatttaat aacatactcc tttttgaaag ttgccttttc tctccaccct 360
tgagtagatc cagtatttga tgaaactcat gaaagtgggt ggagcccatc ttccccctcc 420
tcttttctag gacgcactat atgtgactgt gactttaagg acatttgttt gccatttgct 480
gatttttttg ggaagttaat ttctaacttc tttcactgat aaatgaagaa aagtattgca 540
cctttgaaat gcaccaaatg aattgagttt gtaattaaaa aaattttttt tccctttcag 600
tcattgtctt atatgcttag catagatttg cagctcagta gtatatgtgt tcctagaatg 660
cagctgaaga cctgttatgt agaggaaata cgaggggtgg tgctagaaga cagacatctg 720
tggaatgatt cacatcctct caagttagga ggatggaggc ctgcttcatt aagaagctgg 780
gggtagggtg ggggtgggga gaacacttaa caacatgggg accagtcagg ggaatcccct 840
tatttctgtt ttgcatatga ggaaccctag agcagccagg tgaggctctc tagtttaata 900
aaaatcatgg aaagactctt aatgcagact cttcttaagt gttaataggg attttttcag 960
cttattttgg ttgcagtttc caatttttaa aaatgttgag gtaatctttc ccaccttccc 1020
aaacctaatt cttgtagatg cattagtgtt gaaccaatgc ttctcatgtc tcaatcttgt 1080
atatcatctt ttcagatgta ttaacaaaca aaaccttaaa aagagtagat gaattgccaa 1140
acacaattcc taccaataat aaatcgatca actctatcta ttcaggaaag caggaagcat 1200
ttggaccaca gtgcatgaaa acttcaacat tctgttatta gataatgaat caaccaaatg 1260
aacaatccag agaaaagaaa attgcaataa taaaaggtaa attaacagaa agataatata 1320
agcaagatag taatagttga ccattctgaa aagcttataa catcactcat catccagcat 1380
cctttctgaa aacaaaggat ttttaaatca ctttatgcac atatacaaca taggaggttg 1440
gcaaaataat gcactatttc ttaacagcca tgtctcttgt agaacttcaa gttaatctac 1500
aaatgaccat tgtgtcttaa tttagattat gaataccaca ttagtcaggt atttgcacta 1560
acccttaata gtatatacag tttctatgga aaattcagtg gtccaaaaat ttccgtagaa 1620
tttgagagga cgttggtggg ctgaagatag ctccttgagg gtcactgatg taggctgcaa 1680
tgggggttca caaggccctg acaccgtatt tatagtctaa cctttttatg aaaatctgac 1740
tacagctatt taaggagtag tcttaatagc tgaaaatgaa gatagagaaa gacaccaaga 1800
atatgacaca gtttacattc tagtgaggga cacaacaaaa tcaaatttaa aaaagagtgt 1860
aatagatgct gataaatact gtagataaag cacataagaa aatagaaata aaggctgtca 1920
atggagaagt catgattttt attttattta tttatttatt tatttgagac agagtcaggc 1980
tctgtgcagg ctggagtgca atggtgtgat ctcgctcact acaacctctg ctcctggctc 2040
aagctatcct cccacctcag ctctcaagta gctgggatca caggtgcgtg ctaccatgcc 2100
cggctaattt tttgtagaga tgaggttttg ccatgttgcc caggctggtc tcgaactcct 2160
ggactcaact gaccccacct cggcctctca aagtgctgag attataggcg tgcagccggc 2220
agctggccat tgtttatgtt ctgc 2244
<210> 20
<211> 351
<212> DNA
<213> human
<220>
<221> misc_feature
<222> (62)..(62)
<223> any kind of base
<220>
<221> misc_feature
<222> (121)..(121)
<223> any kind of base
<220>
<221> misc_feature
<222> (207)..(207)
<223> any kind of base
<220>
<221> misc_feature
<222> (220)..(220)
<223> any kind of base
<220>
<221> misc_feature
<222> (276)..(276)
<223> any kind of base
<220>
<221> misc_feature
<222> (300)..(300)
<223> any kind of base
<220>
<221> misc_feature
<222> (315)..(315)
<223> any kind of base
<220>
<221> misc_feature
<222> (336)..(336)
<223> any kind of base
<400> 20
tctacttcca catcggcgag accgagaagc gctgtttcat cgaggaaatc cccgacgaga 60
cnatggtcat cggcaactat cgtacccaga tgtgggataa gcagaaggag gtcttcctgc 120
nctcgacccc tggcctgggc atgcacgtgg aagtgaagga ccccgacggc aaggtggtgc 180
tgtcctggca gtacggctcg gagggcnctt tcacgttcan ctcccacacg cccggtgacc 240
atcaaatctg tctgcactcc aattcttacc aggatngctc tctttcgctg gtgggcaaan 300
tgcgtgttgc atctngacat ccaggtttgg gggagnatgc caacaaatta c 351
<210> 21
<211> 2631
<212> DNA
<213> human
<400> 21
accttccaac ccagccctcg gctgagccgc gccgcaccat gcccgccgtg gacaagctcc 60
tgctagagga ggcgttgcag gacagccccc agactcgctc tttactgagc gtgtttgaag 120
aagatgctgg caccctcaca gactatacca accagctgct ccaggcaatg cagcgcgtct 180
atggagccca gaatgagatg tgcctggcca cacaacagct ttctaagcaa ctgctggcat 240
atgaaaaaca gaactttgct cttggcaaag gtgatgaaga agtaatttca acactccact 300
atttttccaa agtggtggat gagcttaatc ttctccatac agagctggct aaacagttgg 360
cagacacaat ggttctacct atcatacaat tccgagaaaa ggatctcaca gaagtaagca 420
ctttaaagga tctatttgga ctcgctagca atgagcatga cctctcaatg gcaaaataca 480
gcaggctgcc taagaaaaag gagaatgaga aggtgaagac cgaagtcgga aaagaggtgg 540
ccgcggcccg gcggaagcag cacctctcct cccttcagta ctactgtgcc ctcaacgcgc 600
tgcagtacag aaagcaaatg gccatgatgg agcccatgat aggctttgcc catggacaga 660
ttaacttttt taagaaggga gcagagatgt tttccaaacg tatggacagc tttttatcct 720
ccgttgcaga catggttcaa agcattcagg tagaactgga accgaggcgg aaaagatgcg 780
ggtgtcccag caagaattac tttctgttga tgaatctgtt tacactccag actctgatgt 840
ggccgcacca cagatcaaca ggaacctcat ccagaaggct ggttacctta atcttagaaa 900
caaaacaggg ctggtcaccg ccacctggga gaggctttat ttcttcaccc aaggcgggaa 960
tctcatgtgt cagcccaggg gagccgtggc tggaggtttg atccaggacc tggacaactg 1020
ctcagtgatg gccgtggatt gcgaagaccg gcgctactgc tttcagatca ccacgcccaa 1080
tggaaaatcg ggaataatcc tccaggctga gagcagaaag gaaaatgaag agtggatatg 1140
tgcaataaac aacatctcca gacagatcta cctgaccgac aaccctgagg cagtcgcgat 1200
caagttgaat cagaccgctc tgcaagcagt gactcctatt acaagttttg gaaaaaaaca 1260
agaaagctca tgccccagcc agaacctgaa aaattcagag atggaaaatg aaaatgacaa 1320
gattgttccc aaagcaacag ccagtctacc tgaagcagag gagctgatcg cgcctggagc 1380
gccgattcaa ttcgatattg tgcttcctgc tacagaattc cttgatcaga acagagggag 1440
caggcgtacc aacccttttg gtgaaactga ggatgaatca tttccagaag cagaagattc 1500
tcttttgcag cagatgttta tagttcggtt tttgggatca atggcagtta aaacagacag 1560
cactactgaa gtgatttatg aagcgatgag acaagtattg gctgctcggg ctattcataa 1620
catcttccgc atgacagaat cccatctgat ggtcaccagc caatctttga ggttgataga 1680
tccacagact caagtatcaa gggccaattt tgaacttacc agtgtcacac aatttgctgc 1740
tcatcaagaa aacaagagac tggttggttt tgtcatccgt gttcctgaat ccactggaga 1800
agaatctctg agtacataca tttttgaaag caactcagaa ggcgaaaaga tatgttatgc 1860
tattaatttg ggaaaagaaa ttattgaggt tcagaaggat ccagaagcac tggctcaatt 1920
aatgctgtcc ataccactaa ccaatgatgg aaaatatgta ctgttaaacg atcaaccaga 1980
tgacgatgat ggaaatccaa atgaacatag aggcgcagaa tccgaagcat aactcacttg 2040
cgcctgtggg ggaagagcga acaggaagga gagctacctc ctaagggttt taacgtctct 2100
gacatacagg cacactgacc tgatttccga aggctgacaa tcgtttgtgg aatgtaatct 2160
tgatgccttg atactgagac ttgggaggga aactaagaaa tggttgacag cgttcccacc 2220
catctacaat gttattttag gtgctttgtg gtaagtcttt tttcttagat tgcgctaaaa 2280
tttcttagat tgttcagcgc tcagaacaaa agtttgaaaa atgcattgtt catatgaatg 2340
tcatctcttt tcagtttcca gtatcctttt taaaaaatgg caaaagccta gatttacaat 2400
ttgatgaaca ctaaatattt cttattaata taatctattt ttgtatttta cttaatgagc 2460
tttaagtgcc tgtcgttctg aaaattgtgt atttataatt cagcttatct cataattgga 2520
cctaatagca tttctttgtg cagttaggtg atgagcactg ctttgaggcc caagcactag 2580
tagagatgcg cgatacaggt ctagtttcgg taactgttcc agacatcaag c 2631
<210> 22
<211> 2851
<212> DNA
<213> human
<400> 22
agcatctcag gccatcatcc tgaaacttgg cagccttcgt ggagtataag gacagcatta 60
ttagccatca ttgggtttac tgccaacaaa aggagaggga gccataggtt ctctagatta 120
cactcctgag gaaagaagag cacttgccaa aaaatcacaa gatttctgtt gtgaaggatg 180
tggctctgcc atgaaggatg tcctgttgcc tttaaaatct ggaagcgatt caagccaagc 240
tgaccaagaa gccaaagaac tggctaggca aataagcttt aaggcagaag tcaattcatc 300
tggaaagact atctctgagt cagacttaaa ccactctttt tcactaactg atttacaaga 360
tgatatacct acaacattcc agggtgctac ggccagtaca tcgtacggac tccagaattc 420
ctcagcagca tcctttcatc aacctaccca acctgtagct aagaatacct ccatgagccc 480
tcgacagcgc cgggcccagc agcagagtca gagaaggttg tctacttcac cagatgtaat 540
ccagggccac cagccaagag acaaccacac tgatcatggt gggtcagctg tactgattgt 600
catcctgact ttggcattgg cagctcttat attccgacga atatatctgg caaacgaata 660
catatttgac tttgagttat aatatggttt tgtgacttat gagctgtgac tcaactgctt 720
cattaaacat tctgcattgg gtataatcta agaattgttt acaaaaagat tattttgtat 780
ttacccttca ttcctttttt tgatccttgt aagtttagta taaatatatc tagacattca 840
gactgtgtct agcagttacg tcctgcttaa agggactaga agtcaaagtt ccttgtctca 900
ctatttgatc tgctttgcag ggaaataact tgttttttct catgtttcat cttcttttta 960
tgtaaatttg taatactttc ctatattgcc ctttgaaatt tttggataaa agatgatgtt 1020
ttaagttcca atgagtatta ctagttactc aataccactt attgagtact ctgtttctac 1080
gtatgtagaa tgtataggga tagaagagtt gaaaagggaa agcaaaactt cttaagtggc 1140
ttccttaaaa tgtcattcat aggagatgta ctggaattgc tcattctgtg actttatttg 1200
tgtcctaaac attcttcagt gaaaataatt ttatttcagt caaacattta tgaggaaatg 1260
agatcacatc tttgtcactg gatgctactt gaagagggag tactttgtaa ccactttgat 1320
atgctgttat caccaccccc tgccctctgc tgccataatc acacaaattt aaaaagaaag 1380
aaaacagtct tccatagatt tttaaggaag aaagggccca agtcaggaga tcgcttggtt 1440
ttcttccaga agttaaatgg ggggatctga agatttgaat gttcggtctg ctttgaaatg 1500
tatgtctttt gggaatgtat tatatgccta gctttataat caggtataaa attttaatta 1560
ttcccaggaa tatgcataat attgaatatt tcatgtccta ttttaataga aaacctcagg 1620
gcccaagtaa ccagtgatag aagttagaaa aaccccttta cttagaattg tccacctagt 1680
cagagcccaa gaaagaattt tcagtggaaa aatcaatata taacttagtg ctagctagcg 1740
ccacagactc tagtagataa tattatcatc ataatggctg gtgaaaccat ataatcacag 1800
aaaaacattg ccttcagcat gttcagttcg cagcactgag ggcactcttg agggtgttgt 1860
taatgaagat ttaattttta aatacaggtg gttccaagct ttcaaatagg ttatgctcca 1920
aaagtgttat ttgtaagtta atttttttac aagtcaaaca atgttggaag tggtatttag 1980
gttctagatc ggtccacgaa agttagccca tatgtatatc ttgaatagta taggggaggg 2040
tattcataaa gtccttatgt ggttttaact aagtgaaatt atggacaaga gaaataattg 2100
taaaatcgtc ttaaaggcaa atttaatttt tacccctgtt tatgggacat tcgttctatt 2160
aactgtcaga cacaatttct gttttcatct gagagccagg tttcctttat ttctacatct 2220
aaaataagaa catattgtac actattatat aatacagaat tgtcttacac tttaataaat 2280
tcgcatttta aaggtgttta caggattatt ttttatatct gtagctgaat ttgttaaagt 2340
ctaaaaagct caaggacttt atgaagatct cattatatga ggaaaatcat aggttaccat 2400
tttataactc tattgccata agaaaataca ctctaaaatc ttgatttgaa acatattaga 2460
aaccttgatt cagtgctcag tggtctccta gtaagaagtc accgacggta gcgtcatatg 2520
agaagaaaga aatccccacc acctcaacct ctgctgagat tgtgtgctag gaacagcctt 2580
ccctccgttt cccctcagtc aaacttgagc cagcctctgg atcgatgtga tcttattgca 2640
tgtttccatg gggtgtacct atactttaag ccaatcctgc tgcattcact gctaagttaa 2700
ataaaaagcc aagaagaaaa aaaaaatttt gcactgtgca gatcctttgc tatctgactt 2760
gcatctcttc ccccacctgt cagctagcca cctgcttgtt tgtgttggga tattttttag 2820
cacctgaagc accatctgaa aggggcacca t 2851
<210> 23
<211> 3473
<212> DNA
<213> human
<400> 23
aagagcagcg gcgaggcggc ggtggtggct gagtccgtgg tggcagaggc gaaggcgaca 60
gctctagggg ttggcaccgg ccccgagagg aggatgcggg tccggatagg gctgacgctg 120
ctgctgtgtg cggtgctgct gagcttggcc tcggcgtcct cggatgaaga aggcagccag 180
gatgaatcct tagattccaa gactactttg acatcagatg agtcagtaaa ggaccacact 240
actgcaggca gagtagttgc tggtcaaata tttcttgatt cagaagaatc tgaattagaa 300
tcctctattc aagaagagga agacagcctc aagagccaag agggggagag tgtcacagaa 360
gatatcagct ttctagagtc tccaaatcca gaaaacaagg actatgaaga gccaaagaaa 420
gtacggaaac cagctttgac cgccattgaa ggcacagcac atggggagcc ctgccacttc 480
ccttttcttt tcctagataa ggagtatgat gaatgtacat cagatgggag ggaagatggc 540
agactgtggt gtgctacaac ctatgactac aaagcagatg aaaagtgggg cttttgtgaa 600
actgaagaag aggctgctaa gagacggcag atgcaggaag cagaaatggt gtatcaaact 660
ggaatgaaaa tccttaatgg aagcaataag aaaagccaaa aaagagaagc atatcggtat 720
ctccaaaagg cagcaagcat gaaccatacc aaagccctgg agagagtgtc atatgctctt 780
ttatttggtg attacttgcc acagaatatc caggcagcga gagagatgtt tgagaagctg 840
actgaggaag gctctcccaa gggacagact gctcttggct ttctgtatgc ctctggactt 900
ggtgttaatt caagtcaggc aaaggctctt gtatattata catttggagc tcttgggggc 960
aatctaatag cccacatggt tttgggttac agatactggg ctggcatcgg cgtcctccag 1020
agttgtgaat ctgccctgac tcactatcgt cttgttgcca atcatgttgc tagtgatatc 1080
tcgctaacag gaggctcagt agtacagaga atacggctgc ctgatgaagt ggaaaatcca 1140
ggaatgaaca gtggaatgct agaagaagat ttgattcaat attaccagtt cctagctgaa 1200
aaaggtgatg tacaagcaca ggttggtctt ggacaactgc acctgcacgg agggcgtgga 1260
gtagaacaga atcatcagag agcatttgac tacttcaatt tagcagcaaa tgctggcaat 1320
tcacatgcca tggccttttt gggaaagatg tattcggaag gaagtgacat tgtacctcag 1380
agtaatgaga cagctctcca ctactttaag aaagctgctg acatgggcaa cccagttgga 1440
cagagtgggc ttggaatggc ctacctctat gggagaggag ttcaagttaa ttatgatcta 1500
gcccttaagt atttccagaa agctgctgaa caaggctggg tggatgggca gctacagctt 1560
ggttccatgt actataatgg cattggagtc aagagagatt ataaacaggc cttgaagtat 1620
tttaatttag cttctcaggg aggccatatc ttggctttct ataacctagc tcagatgcat 1680
gccagtggca ccggcgtgat gcgatcatgt cacactgcag tggagttgtt taagaatgta 1740
tgtgaacgag gccgttggtc tgaaaggctt atgactgcct ataacagcta taaagatggc 1800
gattacaatg ctgcagtgat ccagtacctc ctcctggctg aacagggcta tgaagtggca 1860
caaagcaatg cagcctttat tcttgatcag agagaagcaa gcattgtagg tgagaatgaa 1920
acttatccca gagctttgct acattggaac agggccgcct ctcaaggcta tactgtggct 1980
agaattaagc tcggagacta ccatttctat gggtttggca ccgatgtaga ttatgaaact 2040
gcatttattc attaccgtct ggcttctgag cagcaacaca gtgcacaagc tatgtttaat 2100
ctgggatata tgcatgagaa aggactgggc attaaacagg atattcacct tgcgaaacgt 2160
ttttatgaca tggcagctga agccagccca gatgcacaag ttccagtctt cctagccctc 2220
tgcaaattgg gcgtcgtcta tttcttgcag tacatacggg aaacaaacat tcgagatatg 2280
ttcacccaac ttgatatgga ccagcttttg ggacctgagt gggaccttta cctcatgacc 2340
atcattgcgc tgctgttggg aacagtcata gcttacaggc aaaggcagca ccaagacatg 2400
cctgcaccca ggcctccagg gccacggcca gctccacccc agcaggaggg gccaccagag 2460
cagcagccac cacagtaata ggcactgggt ccagccttga tcagtgacag cgaaggaagt 2520
tatctgctgg gaacacttgc atttgattta ggaccttgga tcagtggtca cctcccagaa 2580
gaggcacggc acaaggaagc attgaattcc taaagctgct tagaatctga tgcctttatt 2640
ttcagggata agtaactctt acctaaactg agctgaatgt ttgtttcagt gccatatgga 2700
ataacaactt tcagtggctt ttttttttct tttctggaaa catatgtgag acactcagag 2760
taatgtctac tgtatccagc tatctttctt ggatcctttt ggtcattatt tcagtgtgca 2820
taagttctta atgtcaacca tctttaaggt attgtgcatc gacactaaaa actgatcagt 2880
gtaaaaagga aaacccagtt gcaagtttaa acgtgttcga aagtctgaaa atagaacttg 2940
ccttttaagt taaaaaaaaa aaaagctatc ttgaaaatgt tttggaactg cgataactga 3000
gaaactctta ccagtccaca tgcaattaga catattcagc atatttgtta ttttaaaagg 3060
gagggttggg aggtttctta ttggtgattg tcacacggta taccatactc ctctccttca 3120
aagaatgaaa ggccttgtta aggagttttt tgtgagcttt acttctttgg aatggaatat 3180
acttatgcaa aaccttgtga actgactcct tgcactaacg cgagtttgcc ccacctactc 3240
tgtaatttgc ttgtttgttt tgaatataca gagccttgat ccagaagcca gaggatggac 3300
taagtgggag aaattagaaa acaaaacgaa ctctggttgg ggtactacga tcacagacac 3360
agacatactt ttcctaaagt tgaagcattt gttcccagga tttattttac tttgcatttc 3420
cttttgcaca aagaacacat caccatttcc ttttgcacaa agaacacatc acc 3473
<210> 24
<211> 401
<212> DNA
<213> human
<220>
<221> misc_feature
<222> (252)..(252)
<223> any kind of base
<220>
<221> misc_feature
<222> (303)..(303)
<223> any kind of base
<220>
<221> misc_feature
<222> (390)..(390)
<223> any kind of base
<400> 24
ttagattatt ttcaatttat tattcagaat aaatatatct tttttcttta acttctcaaa 60
tagttattga attgtattgg tttaaattaa atgcgtcatg tgtatatatc agtattaatt 120
caagagatac aaaaggaaat tgagtgaaaa ataagtctgc ctccttccca tcactctcat 180
gtctctacct agaggcaatt attgtcaaca gtttttgatg tgtctttcaa aaaatagtcc 240
attaagcctg gngtactaga tctcttttaa aagtttacaa cctgttacag aatatatata 300
aangttcaat tactagtaac accttattac agatacagat tacaacttag gaaatatatt 360
ttcatggacc attgatgtca tttggattcn cccctacaat c 401
<210> 25
<211> 1820
<212> DNA
<213> human
<400> 25
aatgtcttag aaaaaggctt tctaaaagaa aaagagcaag aggccatttc ttttcaagat 60
agatacaaag aacttcagga aaaacataaa caagaattgg aagacatgag gaaagctggt 120
cacgaagccc tcagcattat tgtggatgaa tataaggcac tactgcagtc ttcagttaag 180
caacaagtag aagctattga aaaacagtac atttctgcaa ttgagaaaca ggcacacaag 240
tgtgaggagt tgctaaatgc tcagcatcag aggctccttg aaatgctaga tacagagaag 300
gaactgttaa aagaaaaaat aaaggaagct ttgattcagc aatctcaaga acagaaggaa 360
atattggaaa agtgtttgga ggaagaaagg caaagaaata aagaggcatt agtatccgct 420
gcaaagcttg aaaaagaagc agtgaaggat gcagttttaa aagtcgtaga agaagaaaga 480
aaaaatttag aaaaagcgca tgctgaagaa agggaattat ggaagacaga acatgcaaaa 540
gatcaagaaa aagtatctca ggaaattcaa aaagctatac aagaacaaag aaaaataagt 600
caggaaactg ttaaggcagc aataatagaa gagcagaaac gaagtgaaaa ggctgtggaa 660
gaggcagtga aaagaacaag agatgaattg atagagtata taaaagaaca gaaaaggctc 720
gatcaagtca tccgccaaag aagcctgtcc agtttggaac tgttcctctc ctgtgcacag 780
aaacagttaa gtgctttaat agctacggaa ccagttgaca ttgaataaaa agaacatgac 840
aaacccacac tggcattgga taaatcatat tacaccttca aaatacacac tctgaattat 900
aaagatgtgt ttgttttctt tccaaatcat gtagaattga tttccagttc aaggataaac 960
caaaacaata tttagaacta tcaagtgatc taatttattt tcttttggtt tcttctttac 1020
atttactgtt attttattat tattagtagt agcagcaaca gagtatgata tgacccaaaa 1080
gccattgtaa agtgccacat taccaaaatt aattaagtaa actttatagc ctgtgggagt 1140
ctattatata ttattttgca aaagtagtaa atatattatt gtttcatgat gactcttgat 1200
gagatgctag aatgtaacca tacatttatc ttattttgag gatagaaata gcatggattt 1260
caacatcact tatttatctg tataattgga aataaaacac cgatatgata gagaatcatt 1320
ccggcattac ctaacctctt ctgcagttgg atctatgtat tttcattggt ctactgaaaa 1380
cgaacaatac aattaaaagc actaaagatt attatattaa ttcaactttg atctgatata 1440
tcacttaaac taaaggggtg tgtgtggtgt atgcttgttt cctatttctg ctctttaaag 1500
atactttgaa tcaataaaac cattagtcta caaatcaaat tgtgaactta atctctagaa 1560
agagaatata actcagccat ttataggaat ttaggttcaa gtacaggata tatgaaatct 1620
tttcccagta tttcagaatg tacttaattc acaggcagga tgcttcaatg caaaatcatg 1680
aatattttta attcaaaact aaaatgtcat taatatgtat gtatgcaaat gttttatctt 1740
attttctgaa atgcatctac tttcatgggc tttgtacgtt tctgagattt ctcagtgtaa 1800
taaaaagagc tcccaaactt 1820
<210> 26
<211> 280
<212> DNA
<213> human
<220>
<221> misc_feature
<222> (261)..(261)
<223> any kind of base
<220>
<221> misc_feature
<222> (237)..(237)
<223> any kind of base
<400> 26
tcaagtcata agataaagtt taatcatttg atcatgttaa aagacacaaa acacagccaa 60
tctaaccaaa tttcaggcat gcatttacat aaatatatta aattaagaaa agaaattgta 120
cacttaaacg tccttttcac ctagaaatca ttaaatccac agatcaacaa taaaaccaat 180
tctctgcatt taccacttca agatacaatt gttctatttt aaagataaca caaactncac 240
tagtctggtt aggaatttat ntgcattata catatattat 280
<210> 27
<211> 392
<212> DNA
<213> human
<400> 27
ttggtttgaa atggcacccc aggactttgg gcctgcctta cttgatagcc tcgttcagtg 60
agcaaagact tagtgagcag ctcttgtatg ccaagtattt tgctaagctc tggaaaaaag 120
ataaacaaga catggttctt gctttcaagg agtgtgtaat tctttagcca gatatggaaa 180
cctggaccct gagtgggaga aaggagacag atgaaaggag tccgtgattt tgtaaccaag 240
agctgcctgc atggttatga gtatcactga ttttagggac gcccacagag ctaaagcatt 300
tttttaatcc gagaagactt ttgtaactca tattagttaa tcttctagct ctgagatagc 360
aacacagctc ttagaattct gtaagtaagc tt 392
<210> 28
<211> 2299
<212> DNA
<213> human
<400> 28
cgaaccccca cagctggagg gcgaggccag ctgtacccgg ccccagtgcc ctttcgcggc 60
cacaagcggc cgtcctcctg gtccggtgct ccggcgcctg atctaggttc atggagccgg 120
ggctgtggct ccttttcggg ctcacagtga cctccgccgc aggattcgtg ccttgctccc 180
agtctgggga tgctggcagg cgcggcgtgt cccaggcccc cactgcagcc agatctgagg 240
gggactgtga agagactgtg gctggccctg gcgaggagac tgtggctggc cctggcgagg 300
ggactgtggc cccgacagca ctgcagggtc caagccctgg aagccctggg caggagcagg 360
cggccgaggg ggcccctgag caccaccgat ccaggcgctg cacgtgcttc acctacaagg 420
acaaggagtg tgtctactat tgccacctgg acatcatttg gatcaacact cccgaacaga 480
cggtgcccta tggactgtcc aactacagag gaagcttccg gggcaagagg tctgcggggc 540
cacttccagg gaatctgcag ctctcacatc ggccacactt gcgctgcgct tgtgtgggga 600
gatatgacaa ggcctgcctg cacttttgca cccaaactct ggacgtcagc agacaggttg 660
aagtcaagga ccaacaaagc aagcaggctt tagacctcca ccatccaaag ctcatgcccg 720
gcagtggact cgccctcgct ccatctacct gcccccgctg cctctttcag gaaggagccc 780
cttaggagga caggcctgca gcatcctggt ctcgggaggc ttctgtcatt gctcacacac 840
agttcagatt tccacctctt tatagacaag aagtgaattt gcctggggca gaacacccac 900
ccaaagagtc cccacttaac aatacccccc ccccacggca agaatgccca aatccgaatg 960
accccagttt tcctaatgag taaaatgatc ccagatgtgc cccagagcat gacgcctgca 1020
gctccggttt catgcaggaa attggttttg gagagttttg gcaagttgga aagccactta 1080
ctggcttttg acatgacttc tcttggagaa taagtggact ccaagctaac tctttgcaaa 1140
tgtaaacaca tgtccatctt gtaataaatg caaaatgccc gtgcagcaga agcatgcgac 1200
tttcatatcc ttgcctagaa taggctgcat ggtgtatgtc agtgagggcc acgaggcgtc 1260
ggctttagac acagatcata gctctacagg agtttatgaa tttgaagctt atgggatttt 1320
ggcagagaaa ttttcagctg tgcttgatac ccaccaaaag aatgtatctc gaaagaatga 1380
aggaagaaga aaaaaggatc cttgatgttt gtgacaagaa aatgagaaag ttagtatctg 1440
caatacagag cttgttcctg ttcagtgact gaccctctgt attctgtata gacaccaggc 1500
cgatacacag tggagttccc aggccttgtt tgcaggaagc cgactgtaaa gacagcccca 1560
gctcaaggct attaggttga atatttgctt tcatgagtaa atgtggatct ttggggaatg 1620
gcttcaaaat aagtcacgaa cacaaattct ttgtaaatta tgtaaattcc tgtttatata 1680
aattggcaac aacttatacc gtctgacagt tcaaaatctc tttcagctgc gctcttccca 1740
ccgagccgag cttactgtga gtgtggagat gttatcccac catgtaaagt cgcctgcgca 1800
ggggagggct gcccatctcc ccaacccagt cacagagaga taggaaacgg catttgagtg 1860
ggtgtccagg gccccgtaga gagacattta agatggtgta tgacagagca ttggccttga 1920
ccaaatgtta aatcctctgt gtgtatttca taagttatta caggtataaa agtgatgacc 1980
tatcatgagg aaatgaaagt ggctgatttg ctggtaggat tttgtacagt ttagagaagc 2040
gattatttat tgtgaaactg ttctccactc caactccttt atgtggatct gttcaaagta 2100
gtcactgtat atacgtatag agaggtagat aggtaggtag attttaaatt gcattctgaa 2160
tacaaactca tactccttag agcttgaatt acatttttaa aatgcatatg tgctgtttgg 2220
caccgtggca agatggtatc agagagaaac ccatcaattg ctcaaatact cagaaagtac 2280
tgtcaaaagc ctaataaaa 2299
<210> 29
<211> 1339
<212> DNA
<213> human
<400> 29
ctaaacaaaa tcattcactt ccctgatttt gataagaaaa ttcctgtaaa gctgtttcct 60
ctgcctctcc tctacgttgg aaaccacata agtggattat caagcacaag taaattaagc 120
ctaccgatgt tcaccgtgct caggaaattc accattccac ttaccttact tctggaaacc 180
atcatacttg ggaagcagta ttcactcaac atcatcctca gtgtctttgc cattattctc 240
ggggctttca tagcagctgg gtctgacctt gcttttaact tagaaggcta tatttttgta 300
ttcctgaatg atatcttcac atcagcaaat ggagtttata ccaaacagaa aatggaccca 360
aaggagctag ggaaatacgg agtacttttc tacaatgcct gcttcatgat tatcccaact 420
cttattatta gtgtctccac tggagacctc caacaggcta ctgaattcaa ccaatggaag 480
aatgttgtgt ttatcctaca gtttcttctt tcctgttttt tggggtttct gctgatgtac 540
tccacggttc tgtgcagcta ttacaattca gccctgacga cagcagtggt tggagccatc 600
aagaatgtat ccgttgccta cattgggata ttaatcggtg gagactacat tttctctttg 660
ttaaactttg tagggttaaa tatttgcatg gcagggggct tgagatattc ctttttaaca 720
ctgagcagcc agttaaaacc taaacctgtg ggtgaagaaa acatctgttt ggatttgaag 780
agctaaagag tctgcagcag gattggagac tgacttgtga ctgcgggctg ggggggcatt 840
cccagtagga atgtgaagcc agaggtttcg gattcgtgac atccaccccc tgggcaagtg 900
agagcatctg caaaatgcaa agagaactac ctcatatgca ggatgagcca atggcagtct 960
caagaaatgt actcgggcga caccttacct gtggaaagca aatcttttca aaataagcca 1020
ctgggactcg gtaggtggag ccccagctgc tcttctaggg acctatgggg ccttcgtggc 1080
atctctgtgc tgtgtgctgg ggaggaggtt gatgtaatgg tgactctttt ctgatcagca 1140
ccttggccgt gattcccaag gtcccagcca aagcaaaggg ccagttgttt cagtttaaac 1200
agacatgtct ttagtctaat aaaattagtt aactgccagt aaagttattt gttagctttg 1260
atgaaagcta tgttggtatc tttccctaat catcaaagta aataaaaaat catttctatg 1320
taaaaaaaaa aaaaaaaaa 1339
<210> 30
<211> 4250
<212> DNA
<213> human
<400> 30
gaacacatcg cgtttgcatc ccagaaagta gtcgccgcga ctatttcccc caaagagaca 60
agcacacatg taggaatgac aaaggcttgc gaaggagaga gcgcagcccg cggcccggag 120
agatcccctc gataatggat tactaaatgg gatacacgct gtaccagttc gctccgagcc 180
ccggccgcct gtccgtcgat gcaccgaaaa gggtgaagta gagaaataaa gtctccccgc 240
tgaactacta tgaggtcaga agccttgctg ctatatttca cactgctaca ctttgctggg 300
gctggtttcc cagaagattc tgagccaatc agtatttcgc atggcaacta tacaaaacag 360
tatccggtgt ttgtgggcca caagccagga cggaacacca cacagaggca caggctggac 420
atccagatga ttatgatcat gaacggaacc ctctacattg ctgctaggga ccatatttat 480
actgttgata tagacacatc acacacggaa gaaatttatt gtagcaaaaa actgacatgg 540
aaatctagac aggccgatgt agacacatgc agaatgaagg gaaaacataa ggatgagtgc 600
cacaacttta ttaaagttct tctaaagaaa aacgatgatg cattgtttgt ctgtggaact 660
aatgccttca acccttcctg cagaaactat aagatggata cattggaacc attcggggat 720
gaattcagcg gaatggccag atgcccatat gatgccaaac atgccaacgt tgcactgttt 780
gcagatggaa aactatactc agccacagtg actgacttcc ttgccattga cgcagtcatt 840
taccggagtc ttggagaaag ccctaccctg cggaccgtca agcacgattc aaaatggttg 900
aaagaaccat actttgttca agccgtggat tacggagatt atatctactt cttcttcagg 960
gaaatagcag tggagtataa caccatggga aaggtagttt tcccaagagt ggctcaggtt 1020
tgtaagaatg atatgggagg atctcaaaga gtcctggaga aacagtggac gtcgttcctg 1080
aaggcgcgct tgaactgctc agttcctgga gactctcatt tttatttcaa cattctccag 1140
gcagttacag atgtgattcg tatcaacggg cgtgatgttg tcctggcaac gttttctaca 1200
ccttataaca gcatccctgg gtctgcagtc tgtgcctatg acatgcttga cattgccagt 1260
gtttttactg ggagattcaa ggaacagaag tctcctgatt ccacctggac accagttcct 1320
gatgaacgag ttcctaagcc caggccaggt tgctgtgctg gctcatcctc cttagaaaga 1380
tatgcaacct ccaatgagtt ccctgatgat accctgaact tcatcaagac gcacccgctc 1440
atggatgagg cagtgccctc catcttcaac aggccatggt tcctgagaac aatggtcaga 1500
taccgcctta ccaaaattgc agtggacaca gctgctgggc catatcagaa tcacactgtg 1560
gtttttctgg gatcagagaa gggaatcatc ttgaagtttt tggccagaat aggaaatagt 1620
ggttttctaa atgacagcct tttcctggag gagatgagtg tttacaactc tgaaaaatgc 1680
agctatgatg gagtcgaaga caaaaggatc atgggcatgc agctggacag agcaagcagc 1740
tctctgtatg ttgcgttctc tacctgtgtg ataaaggttc cccttggccg gtgtgaacga 1800
catgggaagt gtaaaaaaac ctgtattgcc tccagagacc catattgtgg atggataaag 1860
gaaggtggtg cctgcagcca tttatcaccc aacagcagac tgacttttga gcaggacata 1920
gagcgtggca atacagatgg tctgggggac tgtcacaatt cctttgtggc actgaatgac 1980
atttcaactc ctctaccaga taatgaaatg tcttacaaca cagtgtatgg gcattccagt 2040
tccctcttgc ccagcacaac cacatcagat tcgacggctc aagaggggta tgagtctagg 2100
ggaggaatgc tggactggaa gcatctgctt gactcacctg acagcacaga ccctttgggg 2160
gcagtgtctt cccataatca ccaagacaag aagggagtga ttcgggaaag ttacctcaaa 2220
ggccacgacc agctggttcc cgtcaccctc ttggccattg cagtcatcct ggctttcgtc 2280
atgggggccg tcttctcggg catcaccgtc tactgcgtct gtgatcatcg gcgcaaagac 2340
gtggctgtgg tgcagcgcaa ggagaaggag ctcacccact cgcgccgggg ctccatgagc 2400
agcgtcacca agctcagcgg cctctttggg gacactcaat ccaaagaccc aaagccggag 2460
gccatcctca cgccactcat gcacaacggc aagctcgcca ctcccggcaa cacggccaag 2520
atgctcatta aagcagacca gcaccacctg gacctgacgg ccctccccac cccagagtca 2580
accccaacgc tgcagcagaa gcggaagccc agccgcggca gccgcgagtg ggagaggaac 2640
cagaacctca tcaatgcctg cacaaaggac atgcccccca tgggctcccc tgtgattccc 2700
acggacctgc ccctgcgggc ctcccccagc cacatcccca gcgtggtggt cctgcccatc 2760
acgcagcagg gctaccagca tgagtacgtg gaccagccca aaatgagcga ggtggcccag 2820
atggcgctgg aggaccaggc cgccacactg gagtataaga ccatcaagga acatctcagc 2880
agcaagagtc ccaaccatgg ggtgaacctt gtggagaacc tggacagcct gccccccaaa 2940
gttccacagc gggaggcctc cctgggtccc ccgggagcct ccctgtctca gaccggtcta 3000
agcaagcggc tggaaatgca ccactcctct tcctacgggg ttgactataa gaggagctac 3060
cccacgaact cgctcacgag aagccaccag gccaccactc tcaaaagaaa caacactaac 3120
tcctccaatt cctctcacct ctccagaaac cagagctttg gcaggggaga caacccgccg 3180
cccgccccgc agagggtgga ctccatccag gtgcacagct cccagccatc tggccaggcc 3240
gtgactgtct cgaggcagcc cagcctcaac gcctacaact cactgacaag gtcggggctg 3300
aagcgtacgc cctcgctaaa gccggacgta ccccccaaac catcctttgc tcccctttcc 3360
acatccatga agcccaatga tgcgtgtaca taatcccagg gggagggggt caggtgtcga 3420
accagcaggc aaggcgaggt gcccgctcag ctcagcaagg ttctcaactg cctcgagtac 3480
ccaccagacc aagaaggcct gcggcagagc cgaggacgct gggtcctcct ctctgggaca 3540
caggggtact cacgaaaact gggccgcgtg gtttggtgaa ggtttgcaac ggcggggact 3600
caccttcatt ctcttccttc actttccccc acaccctaca acaggtcgga cccacaaaag 3660
acttcagtta tcatcacaaa catgagccaa aagcacatac ctaccccatc ccccaccccc 3720
acacacacac acacatgcac acaacacata cacacacacg cacagaggtg aacagaaact 3780
gaaacatttt gtccacaact tcacgggacg tggccagact gggtttgcgt tccaacctgc 3840
aaaacacaaa tacatttttt aaaatcaaga aaatttaaaa agacaaaaaa aaaagaattc 3900
attgataatt ctaactcaga ctttaacaat ggcagaagtt tactatgcgc aaatactgtg 3960
aaatgcccgc cagtgttaca gctttctgtt gcagcagata aatgccatgt tgggcaacta 4020
tgtcatagat ttctgctcct cctctctttt aatgaaataa cgtgaccgtt aacgcaagta 4080
actctttatt tattgttcac cctttttttc cttaaggaaa ggactcttcc aaatatcatc 4140
ctatgaacag ctcttcagaa agcccattga aagttaaact atttaacgtg aaatccatta 4200
actggaataa ttgagtttct ttatttttac aataaattca ctgagtaaat 4250
<210> 31
<211> 2785
<212> DNA
<213> human
<400> 31
ctttagccca acagtcaaaa ataattgatg ctaccctaca aatgtccaaa actctagtat 60
atcatatttc taagttacag caaatattag tcctgctaaa ccagggagct ttggcaaaaa 120
tgttttttga cagtaaattt gtccttgatt atatattaac tagtcaaaga ggtgtttgta 180
acattattag agcttcttgt tgtaggtggg ttaacaccac caatcaagag gtcattctaa 240
cagaaagcct ggatcagaaa accatcaccc taaaaaaaca tgccttacat atttaacaca 300
ctctgaaatc cagtcaaaat atgactaaag gcccttgcca tgactgatgt attctcctgg 360
ccaacgccaa acaaatggga gcctggttac gagtcagcct tcagggactt gtcacatttc 420
tacttggttt cttccttgtt attgtcataa taaaatgttt tctatgctgt ttagtgcaac 480
ttaggcccta ttctgtagaa gtctcctcta ctattcaggc cactcaaaca ccccaaataa 540
ttgagttcaa aatcgacatc aagatataaa ggaatcagtg actaaatata tttcatatat 600
ggtattttta ttgattattg tgctgtcttg acctagtatg gaggccttgg ctagaggctg 660
gtcagtttcc tctcttgagc agctgattaa atccacaccc caaccacttc ccttatcagg 720
ttctcacact ctggggccac tatgtaccca ctctaatcac cacagggcca gacatcagac 780
aattaaggac agcgcccatg ccccaaagcc cgccaaaatt atgcaaatta ttcaaaatta 840
ttcaacctag ctaaccccac cctttttgct gtacataagc tgcccattcc ccctccagcc 900
tgtggtaccc agtcctcagg tgcaaccccc tgcgtggtcc tctgtggcag ccttctctca 960
ttcagagctg ttttccacag aggtagtgaa aagaactgga ttttcaagtt cactttgcaa 1020
gagaaaaaga aaactcagta gaagataatg gcaagtccag actggggata tgatgacaaa 1080
aatggtcctg aacaatggag caagctgtat cccattgcca atggaaataa ccaatcccct 1140
gttgatatta aaaccagtga aaccaaacat gacacctctc tgaaacctat tagtgtctcc 1200
tacaacccag ccacagccaa agaaattatc aatgtggggc attctttcca tgtaaatttt 1260
gaggacaacg ataaccgatc agtgctgaaa ggtggtcctt tctctgacag ctacaggctc 1320
tttcagtttc attttcactg gggcagtaca aatgagcatg gttcagaaca tacagtggat 1380
ggagtcaaat attctgccga gcttcacgta gctcactgga attctgcaaa gtactccagc 1440
cttgctgaag ctgcctcaaa ggctgatggt ttggcagtta ttggtgtttt gatgaaggtt 1500
ggtgaggcca acccaaagct gcagaaagta cttgatgccc tccaagcaat taaaaccaag 1560
ggcaaacgag ccccattcac aaattttgac ccctctactc tccttccttc atccctggat 1620
ttctggacct accctggctc tctgactcat cctcctcttt atgagagtgt aacttggatc 1680
atctgtaagg agagcatcag tgtcagctca gagcagctgg cacaattccg cagccttcta 1740
tcaaatgttg aaggtgataa cgctgtcccc atgcagcaca acaaccgccc aacccaacct 1800
ctgaagggca gaacagtgag agcttcattt tgatgattct gagaagaaac ttgtccttcc 1860
tcaagaacac agccctgctt ctgacataat ccagttaaaa taataatttt taagaaataa 1920
atttatttca atattagcaa gacagcatgc cttcaaatca atctgtaaaa ctaagaaact 1980
taaattttag ttcttactgc ttaattcaaa taataattag taagctagca aatagtaatc 2040
tgtaagcata agcttatctt aaattcaagt ttagtttgag gaattcttta aaattacaac 2100
taagtgattt gtatgtctat ttttttcagt ttatttgaac caataaaata attttatctc 2160
tttctttctg ttgtgcattc agtttctaaa accattaagt ttctactcca tttacattca 2220
aaaatcttaa atactttact tgcaagagta ttttgcttca aatacaacaa cctaagagca 2280
gctggagatg aaatattggg aaattcattt gcttactcct gaagacaaaa atatagctga 2340
gatgaccact ggatttaata tcgttatgct ggcccaacat tgctaccatt tgtgttgtct 2400
gtgatcaaaa tgattatctt ttatatagga agatgacgct tctggatatt gctttcactt 2460
cttctcccca cgttagcaag gacaatgctt ctctgccatt attacaacta gttagtttgc 2520
atggagaatc tttactttaa aattggaaga aaagtcacaa gtgaatggtt tataaaaatg 2580
ctaaagaagt cattcttgct tagaatcata tagaaacatc atgcaatctt ttagtcagat 2640
gtgcgcttca ccttatgcta tttttatctt taattgacac acaataattg tacatgttta 2700
tggagtatag tgtggtgttt tctgtttgtt tgtttgtttt ttgagacaag gtctcactct 2760
gccagtcagg gtggagtgcg atggt 2785
<210> 32
<211> 9588
<212> DNA
<213> human
<400> 32
ccgaccaaca ccaacaccca gctccgacgc agctcctctg cgcccttgcc gccctccgag 60
ccacagcttt cctcccgctc ctgcccccgg cccgtcgccg tctccgcgct cgcagcggcc 120
tcgggagggc ccaggtagcg agcagcgacc tcgcgagcct tccgcactcc cgcccggttc 180
cccggccgtc cgcctatcct tggccccctc cgctttctcc gcgccggccc gcctcgctta 240
tgcctcggcg ctgagccgct ctcccgattg cccgccgaca tgagctgcaa cggaggctcc 300
cacccgcgga tcaacactct gggccgcatg atccgcgccg agtctggccc ggacctgcgc 360
tacgaggtga ccagcggcgg cgggggcacc agcaggatgt actattctcg gcgcggcgtg 420
atcaccgacc agaactcgga cggctactgt caaaccggca cgatgtccag gcaccagaac 480
cagaacacca tccaggagct gctgcagaac tgctccgact gcttgatgcg agcagagctc 540
atcgtgcagc ctgaattgaa gtatggagat ggaatacaac tgactcggag tcgagaattg 600
gatgagtgtt ttgcccaggc caatgaccaa atggaaatcc tcgacagctt gatcagagag 660
atgcggcaga tgggccagcc ctgtgatgct taccagaaaa ggcttcttca gctccaagag 720
caaatgcgag ccctttataa agccatcagt gtccctcgag tccgcagggc cagctccaag 780
ggtggtggag gctacacttg tcagagtggc tctggctggg atgagttcac caaacatgtc 840
accagtgaat gtttggggtg gatgaggcag caaagggcgg agatggacat ggtggcctgg 900
ggtgtggacc tggcctcagt ggagcagcac attaacagcc accggggcat ccacaactcc 960
atcggcgact atcgctggca gctggacaaa atcaaagccg acctgcgcga gaaatctgcg 1020
atctaccagt tggaggagga gtatgaaaac ctgctgaaag cgtcctttga gaggatggat 1080
cacctgcgac agctgcagaa catcattcag gccacgtcca gggagatcat gtggatcaat 1140
gactgcgagg aggaggagct gctgtacgac tggagcgaca agaacaccaa catcgctcag 1200
aaacaggagg ccttctccat acgcatgagt caactggaag ttaaagaaaa agagctcaat 1260
aagctgaaac aagaaagtga ccaacttgtc ctcaatcagc atccagcttc agacaaaatt 1320
gaggcctata tggacactct gcagacgcag tggagttgga ttcttcagat caccaagtgc 1380
attgatgttc atctgaaaga aaatgctgcc tactttcagt tttttgaaga ggcgcagtct 1440
actgaagcat acctgaaggg gctccaggac tccatcagga agaagtaccc ctgcgacaag 1500
aacatgcccc tgcagcacct gctggaacag atcaaggagc tggagaaaga acgagagaaa 1560
atccttgaat acaagcgtca ggtgcagaac ttggtaaaca agtctaagaa gattgtacag 1620
ctgaagcctc gtaacccaga ctacagaagc aataaaccca ttattctcag agctctctgt 1680
gactacaaac aagatcagaa aatcgtgcat aagggggatg agtgtatcct gaaggacaac 1740
aacgagcgca gcaagtggta cgtgacgggc ccgggaggcg ttgacatgct tgttccctct 1800
gtggggctga tcatccctcc tccgaaccca ctggccgtgg acctctcttg caagattgag 1860
cagtactacg aagccatctt ggctctgtgg aaccagctct acatcaacat gaagagcctg 1920
gtgtcctggc actactgcat gattgacata gagaagatca gggccatgac aatcgccaag 1980
ctgaaaacaa tgcggcagga agattacatg aagacgatag ccgaccttga gttacattac 2040
caagagttca tcagaaatag ccaaggctca gagatgtttg gagatgatga caagcggaaa 2100
atacagtctc agttcaccga tgcccagaag cattaccaga ccctggtcat tcagctccct 2160
ggctatcccc agcaccagac agtgaccaca actgaaatca ctcatcatgg aacctgccaa 2220
gatgtcaacc ataataaagt aattgaaacc aacagagaaa atgacaagca agaaacatgg 2280
atgctgatgg agctgcagaa gattcgcagg cagatagagc actgcgaggg caggatgact 2340
ctcaaaaacc tccctctagc agaccagggg tcttctcacc acatcacagt gaaaattaac 2400
gagcttaaga gtgtgcagaa tgattcacaa gcaattgctg aggttctcaa ccagcttaaa 2460
gatatgcttg ccaacttcag aggttctgaa aagtactgct atttacagaa tgaagtattt 2520
ggactatttc agaaactgga aaatatcaat ggtgttacag atggctactt aaatagctta 2580
tgcacagtaa gggcactgct ccaggctatt ctccaaacag aagacatgtt aaaggtttat 2640
gaagccaggc tcactgagga ggaaactgtc tgcctggacc tggataaagt ggaagcttac 2700
cgctgtggac tgaagaaaat aaaaaatgac ttgaacttga agaagtcgtt gttggccact 2760
atgaagacag aactacagaa agcccagcag atccactctc agacttcaca gcagtatcca 2820
ctttatgatc tggacttggg caagttcggt gaaaaagtca cacagctgac agaccgctgg 2880
caaaggatag ataaacagat cgactttaga ttatgggacc tggagaaaca aatcaagcaa 2940
ttgaggaatt atcgtgataa ctatcaggct ttctgcaagt ggctctatga tcgtaaacgc 3000
cgccaggatt ccttagaatc catgaaattt ggagattcca acacagtcat gcggtttttg 3060
aatgagcaga agaacttgca cagtgaaata tctggcaaac gagacaaatc agaggaagta 3120
caaaaaattg ctgaactttg cgccaattca attaaggatt atgagctcca gctggcctca 3180
tacacctcag gactggaaac tctgctgaac atacctatca agaggaccat gattcagtcc 3240
ccttctgggg tgattctgca agaggctgca gatgttcatg ctcggtacat tgaactactt 3300
acaagatctg gagactatta caggttctta agtgagatgc tgaagagttt ggaagatctg 3360
aagctgaaaa ataccaagat cgaagttttg gaagaggagc tcagactggc ccgagatgcc 3420
aactcggaaa actgtaataa gaacaaattc ctggatcaga acctgcagaa ataccaggca 3480
gagtgttccc agttcaaagc gaagcttgcg agcctggagg agctgaagag acaggctgag 3540
ctggatggga agtcggctaa gcaaaatcta gacaagtgct acggccaaat aaaagaactc 3600
aatgagaaga tcacccgact gacttatgag attgaagatg aaaagagaag aagaaaatct 3660
gtggaagaca gatttgacca acagaagaat gactatgacc aactgcagaa agcaaggcaa 3720
tgtgaaaagg agaaccttgg ttggcagaaa ttagagtctg agaaagccat caaggagaag 3780
gagtacgaga ttgaaaggtt gagggttcta ctgcaggaag aaggcacccg gaagagagaa 3840
tatgaaaatg agctggcaaa ggtaagaaac cactataatg aggagatgag taatttaagg 3900
aacaagtatg aaacagagat taacattacg aagaccacca tcaaggagat atccatgcaa 3960
aaagaggatg attccaaaaa tcttagaaac cagcttgata gactttcaag ggaaaatcga 4020
gatctgaagg atgaaattgt caggctcaat gacagcatct tgcaggccac tgagcagcga 4080
aggcgagctg aagaaaacgc ccttcagcaa aaggcctgtg gctctgagat aatgcagaag 4140
aagcagcatc tggagataga actgaagcag gtcatgcagc agcgctctga ggacaatgcc 4200
cggcacaagc agtccctgga ggaggctgcc aagaccattc aggacaaaaa taaggagatc 4260
gagagactca aagctgagtt tcaggaggag gccaagcgcc gctgggaata tgaaaatgaa 4320
ctgagtaagg taagaaacaa ttatgatgag gagatcatta gcttaaaaaa tcagtttgag 4380
accgagatca acatcaccaa gaccaccatc caccagctca ccatgcagaa ggaagaggat 4440
accagtggct accgggctca gatagacaat ctcacccgag aaaacaggag cttatctgaa 4500
gaaataaaga ggctgaagaa cactctaacc cagaccacag agaatctcag gagggtggaa 4560
gaagacatcc aacagcaaaa ggccactggc tctgaggtgt ctcagaggaa acagcagctg 4620
gaggttgagc tgagacaagt cactcagatg cgaacagagg agagcgtaag atataagcaa 4680
tctcttgatg atgctgccaa aaccatccag gataaaaaca aggagataga aaggttaaaa 4740
caactgatcg acaaagaaac aaatgaccgg aaatgcctgg aagatgaaaa cgcgagatta 4800
caaagggtcc agtatgacct gcagaaagca aacagtagtg cgacggagac aataaacaaa 4860
ctgaaggttc aggagcaaga actgacacgc ctgaggatcg actatgaaag ggtttcccag 4920
gagaggactg tgaaggacca ggatatcacg cggttccaga actctctgaa agagctgcag 4980
ctgcagaagc agaaggtgga agaggagctg aatcggctga agaggaccgc gtcagaagac 5040
tcctgcaaga ggaagaagct ggaggaagag ctggaaggca tgaggaggtc gctgaaggag 5100
caagccatca aaatcaccaa cctgacccag cagctggagc aggcatccat tgttaagaag 5160
aggagtgagg atgacctccg gcagcagagg gacgtgctgg atggccacct gagggaaaag 5220
cagaggaccc aggaagagct gaggaggctc tcttctgagg tcgaggccct gaggcggcag 5280
ttactccagg aacaggaaag tgtcaaacaa gctcacttga ggaatgagca tttccagaag 5340
gcgatagaag ataaaagcag aagcttaaat gaaagcaaaa tagaaattga gaggctgcag 5400
tctctcacag agaacctgac caaggagcac ttgatgttag aagaagaact gcggaacctg 5460
aggctggagt acgatgacct gaggagagga cgaagcgaag cggacagtga taaaaatgca 5520
accatcttgg aactaaggag ccagctgcag atcagcaaca accggaccct ggaactgcag 5580
gggctgatta atgatttaca gagagagagg gaaaatttga gacaggaaat tgagaaattc 5640
caaaagcagg ctttagaggc atctaatagg attcaggaat caaagaatca gtgtactcag 5700
gtggtacagg aaagagagag ccttctggtg aaaatcaaag tcctggagca agacaaggca 5760
aggctgcaga ggctggagga tgagctgaat cgtgcaaaat caactctaga ggcagaaacc 5820
agggtgaaac agcgcctgga gtgtgagaaa cagcaaattc agaatgacct gaatcagtgg 5880
aagactcaat attcccgcaa ggaggaggct attaggaaga tagaatcgga aagagaaaag 5940
agtgagagag agaagaacag tcttaggagt gagatcgaaa gactccaagc agagatcaag 6000
agaattgaag agaggtgcag gcgtaagctg gaggattcta ccagggagac acagtcacag 6060
ttagaaacag aacgctcccg atatcagagg gagattgata aactcagaca gcgcccatat 6120
gggtcccatc gagagaccca gactgagtgt gagtggaccg ttgacacctc caagctggtg 6180
tttgatgggc tgaggaagaa ggtgacagca atgcagctct atgagtgtca gctgatcgac 6240
aaaacaacct tggacaaact attgaagggg aagaagtcag tggaagaagt tgcttctgaa 6300
atccagccat tccttcgggg tgcaggatct atcgctggag catctgcttc tcctaaggaa 6360
aaatactctt tggtagaggc caagagaaag aaattaatca gcccagaatc cacagtcatg 6420
cttctggagg cccaggcagc tacaggtggt ataattgatc cccatcggaa tgagaagctg 6480
actgtcgaca gtgccatagc tcgggacctc attgacttcg atgaccgtca gcagatatat 6540
gcagcagaaa aagctatcac tggttttgat gatccatttt caggcaagac agtatctgtt 6600
tcagaagcca tcaagaaaaa tttgattgat agagaaaccg gaatgcgcct gctggaagcc 6660
cagattgctt cagggggtgt agtagaccct gtgaacagtg tctttttgcc aaaagatgtc 6720
gccttggccc gggggctgat tgatagagat ttgtatcgat ccctgaatga tccccgagat 6780
agtcagaaaa actttgtgga tccagtcacc aaaaagaagg tcagttacgt gcagctgaag 6840
gaacggtgca gaatcgaacc acatactggt ctgctcttgc tttcagtaca gaagagaagc 6900
atgtccttcc aaggaatcag acaacctgtg accgtcactg agctagtaga ttctggtata 6960
ttgagaccgt ccactgtcaa tgaactggaa tctggtcaga tttcttatga cgaggttggt 7020
gagagaatta aggacttcct ccagggttca agctgcatag caggcatata caatgagacc 7080
acaaaacaga agcttggcat ttatgaggcc atgaaaattg gcttagtccg acctggtact 7140
gctctggagt tgctggaagc ccaagcagct actggcttta tagtggatcc tgttagcaac 7200
ttgaggttac cagtggagga agcctacaag agaggtctgg tgggcattga gttcaaagag 7260
aagctcctgt ctgcagaacg agctgtcact gggtataatg atcctgaaac aggaaacatc 7320
atctctttgt tccaagccat gaataaggaa ctcatcgaaa agggccacgg tattcgctta 7380
ttagaagcac agatcgcaac cggggggatc attgacccaa aggagagcca tcgtttacca 7440
gttgacatag catataagag gggctatttc aatgaggaac tcagtgagat tctctcagat 7500
ccaagtgatg ataccaaagg attttttgac cccaacactg aagaaaatct tacctatctg 7560
caactaaaag aaagatgcat taaggatgag gaaacagggc tctgtcttct gcctctgaaa 7620
gaaaagaaga aacaggtgca gacatcacaa aagaataccc tcaggaagcg tagagtggtc 7680
atagttgacc cagaaaccaa taaagaaatg tctgttcagg aggcctacaa gaagggccta 7740
attgattatg aaaccttcaa agaactgtgt gagcaggaat gtgaatggga agaaataacc 7800
atcacgggat cagatggctc caccagggtg gtcctggtag atagaaagac aggcagtcag 7860
tatgatattc aagatgctat tgacaagggc cttgttgaca ggaagttctt tgatcagtac 7920
cgatccggca gcctcagcct cactcaattt gctgacatga tctccttgaa aaatggtgtc 7980
ggcaccagca gcagcatggg cagtggtgtc agcgatgatg tttttagcag ctcccgacat 8040
gaatcagtaa gtaagatttc caccatatcc agcgtcagga atttaaccat aaggagcagc 8100
tctttttcag acaccctgga agaatcgagc cccattgcag ccatctttga cacagaaaac 8160
ctggagaaaa tctccattac agaaggtata gagcggggca tcgttgacag catcacgggt 8220
cagaggcttc tggaggctca ggcctgcaca ggtggcatca tccacccaac cacgggccag 8280
aagctgtcac ttcaggacgc agtctcccag ggtgtgattg accaagacat ggccaccagc 8340
gtgaagcctg ctcagaaagc cttcataggc ttcgagggtg tgaagggaaa gaagaagatg 8400
tcagcagcag aggcagtgaa agaaaaatgg ctcccgtatg aggctggcca gcgcttcctg 8460
gagttccagt acctcacggg aggtcttgtt gacccggaag tgcatgggag gataagcacc 8520
gaagaagcca tccggaaggg gttcatagat ggccgcgccg cacagaggct gcaagacacc 8580
agcagctatg ccaaaatcct gacctgcccc aaaaccaaat taaaaatatc ctataaggat 8640
gccataaatc gctccatggt agaagatatc actgggctgc gccttctgga agccgcctcc 8700
gtgtcgtcca agggcttacc cagcccttac aacatgtctt cggctccggg gtcccgctcc 8760
ggctcccgct cgggatctcg ctccggatct cgctccgggt cccgcagtgg gtcccggaga 8820
ggaagctttg acgccacagg gaattcttcc tactcttatt cctactcatt tagcagtagt 8880
tctattgggc actagtagtc agttgggagt ggttgctata ccttgacttc atttatatga 8940
atttccactt tattaaataa tagaaaagaa aatcccggtg cttgcagtag agtgatagga 9000
cattctatgc ttacagaaaa tatagccatg attgaaatca aatagtaaag gctgttctgg 9060
ctttttatct tcttagctca tcttaaataa gcagtacact tggatgcagt gcgtctgaag 9120
tgctaatcag ttgtaacaat agcacaaatc gaacttagga tttgtttctt ctcttctgtg 9180
tttcgatttt tgatcaattc tttaattttg gaagcctata atacagtttt ctattcttgg 9240
agataaaaat taaatggatc actgatattt tagtcattct gcttctcatc taaatatttc 9300
catattctgt attaggagaa aattaccctc ccagcaccag cccccctctc aaacccccaa 9360
cccaaaacca agcattttgg aatgagtctc ctttagtttc agagtgtgga ttgtataacc 9420
catatactct tcgatgtact tgtttggttt ggtattaatt tgactgtgca tgacagcggc 9480
aatcttttct ttggtcaaag ttttctgttt attttgcttg tcatattcga tgtactttaa 9540
ggtgtcttta tgaagtttgc tattctggca ataaactttt agactttt 9588
<210> 33
<211> 366
<212> DNA
<213> human
<220>
<221> misc_feature
<222> (351)..(351)
<223> any kind of base
<400> 33
gaagtgccat ttatatttat acaaaaatat tacataattc agttagtatt ggtgacataa 60
tttagttagt atgggtgata taatggtcat aatttttagc atctaataaa gatcttttta 120
tgagtcccat ataaaatatg tgaacaaagc aatcttgtca taagatttgt gatgatttag 180
gagaaagtac tttgagataa tttttttctg tctctttgtg aactctctca acagtagttc 240
tctttagatt agagccagca ggtcggccat aacagttttc ttcaaatttg ggcaacagtt 300
atacaaatgc ttgaatttca agacaacata ttaaagggtc tatgaactgg naatctaacc 360
tgggtt 366
<210> 34
<211> 1466
<212> DNA
<213> human
<400> 34
agccccaagc ttaccacctg cacccggaga gctgtgtgtc accatgtggg tcccggttgt 60
cttcctcacc ctgtccgtga cgtggattgg tgctgcaccc ctcatcctgt ctcggattgt 120
gggaggctgg gagtgcgaga agcattccca accctggcag gtgcttgtgg cctctcgtgg 180
cagggcagtc tgcggcggtg ttctggtgca cccccagtgg gtcctcacag ctgcccactg 240
catcaggaac aaaagcgtga tcttgctggg tcggcacagc ctgtttcatc ctgaagacac 300
aggccaggta tttcaggtca gccacagctt cccacacccg ctctacgata tgagcctcct 360
gaagaatcga ttcctcaggc caggtgatga ctccagccac gacctcatgc tgctccgcct 420
gtcagagcct gccgagctca cggatgctgt gaaggtcatg gacctgccca cccaggagcc 480
agcactgggg accacctgct acgcctcagg ctggggcagc attgaaccag aggagttctt 540
gaccccaaag aaacttcagt gtgtggacct ccatgttatt tccaatgacg tgtgtgcgca 600
agttcaccct cagaaggtga ccaagttcat gctgtgtgct ggacgctgga cagggggcaa 660
aagcacctgc tcgggtgatt ctgggggccc acttgtctgt aatggtgtgc ttcaaggtat 720
cacgtcatgg ggcagtgaac catgtgccct gcccgaaagg ccttccctgt acaccaaggt 780
ggtgcattac cggaagtgga tcaaggacac catcgtggcc aacccctgag cacccctatc 840
aaccccctat tgtagtaaac ttggaacctt ggaaatgacc aggccaagac tcaagcctcc 900
ccagttctac tgacctttgt ccttaggtgt gaggtccagg gttgctagga aaagaaatca 960
gcagacacag gtgtagacca gagtgtttct taaatggtgt aattttgtcc tctctgtgtc 1020
ctggggaata ctggccatgc ctggagacat atcactcaat ttctctgagg acacagatag 1080
gatggggtgt ctgtgttatt tgtggggtac agagatgaaa gaggggtggg atccacactg 1140
agagagtgga gagtgacatg tgctggacac tgtccatgaa gcactgagca gaagctggag 1200
gcacaacgca ccagacactc acagcaagga tggagctgaa aacataaccc actctgtcct 1260
ggaggcactg ggaagcctag agaaggctgt gagccaagga gggagggtct tcctttggca 1320
tgggatgggg atgaagtaag gagagggact ggaccccctg gaagctgatt cactatgggg 1380
ggaggtgtat tgaagtcctc cagacaaccc tcagatttga tgatttccta gtagaactca 1440
cagaaataaa gagctgttat actgtg 1466
<210> 35
<211> 187
<212> DNA
<213> human
<400> 35
gatctggtgc attccggtcg acactctcgt ttatttggac tgtaagtctg acctctatga 60
ataattactt cagcccctga gtgctcccgg gccaagctcc ttggccaaac tttcacctta 120
gcttctgata agtcttgggc caagctaagc agcatctatc aatcatccct tcagctcctg 180
attgatc 187
<210> 36
<211> 2913
<212> DNA
<213> human
<400> 36
actgggtacc gaggactggg tgtgtttaag gcagacagcc aggtgaggat cccagctact 60
ggggcctgct gtcatctcct gggagtaccc gggggtcagg agcctagggg actcttgcac 120
ttcacatcca gccatgctaa ttacactttt tggcaaagga aacagctagg agcagtttct 180
ttcactccta cagccccgtt ttctcagtgt ttagacctcg aattattact gggctagagg 240
gaaggcagcc tctgaagtgt ggcaggagga ggggaagtct gcctgcatct tggtgtgtct 300
gtcagatgcc agcactaata acctggcttc tgtgaggcct gtcagtgctc tcaggaatga 360
aaggggaccc ctgagaggtg ctcagtacca gcaggctgtg aatgctctct acccaccacc 420
ctcacctcct cgttaaagat ggtgctacct gccacacagc agacatctgg tcgctgcaca 480
cccgaaagac cccaaggcag tctgcccctt gtccagccac acgccagcac ccaccctcct 540
ggcccctgcc tcggcctccc cagaccagct gcacccagcc cccaacacgc accccttctc 600
cagatgtgtg cagggcctca ttttgcagag caaagacaga tgtttcagcc acacgcttta 660
ttaacttcta aaacctgtgc tcaggacact cttcaacagt catgaaaagt ttgatcactt 720
gccacagtca ggacctttgt gtggggctct gatctgatgt tcggtctcat catctcccaa 780
accagcagtc gtttgtaccc caaccctctg ctcaggggct cataccccca aatgattttc 840
ctgatttatg tatttcccta caaagggctt tctataccta gcatctgcct ccagcatgag 900
aagggggaat aggtgagacc catttgccag tagcagacgg ggaccctggg gagaaaatgg 960
cagagcctgt tggagactcc ctgtctccag ctgaccagcc aatgggattc ctcttccctc 1020
cactgtctcc cacaaagtag aagaatcctg gtacatttag cccatgagcc tggcacagat 1080
ccctatctag acatgaggcc ctttagacat gactttggca ttgaccagcc tgttggcaat 1140
gggtcgggga ggcagagggg atgctcacac cagtaattct catcccctga atgcttggga 1200
tcacctgggg agagttcaca aaatactggt gcaggggtcc cacctctgat gatgctgagt 1260
ggtgggtctg gggtgtggcc caggcatcat gatgtttcag gcccccaggt gacttcttag 1320
gcagcccagc taagccccta gagccttgca atttccccca aatgacctca gagggcccga 1380
tttgagggaa atgcctaact tcaggggccg taagaatccc ccagggagca tgtgaaatgc 1440
agataccagg cccaccccca gagatgagct gaggtgggtc aggggtgaag tgcagggatc 1500
agtgtttttc acaagctcca tacctccagg aaatggtgtt gtggttgggc ccgtagaaaa 1560
cattctgaga gtcctgttgc ctgtgccttg gtgcacgtgg ggtggaatcc cagtggccct 1620
gccttgagga ggatgtgcat taacgtggta ggggagacag agacagctcc acctgccccc 1680
tgtcccaccg gggacctcca aaaacttcat ggatgttaga gcaagcagcc atgctgcagc 1740
agaggatgag gctggcggat ttagtaagag ccctctgtgt ttgggctgag ttctttctct 1800
agttgccctg tcatctggcc tctggataac ccacctctcc tccctcatcc taaaattaca 1860
gatggcgaaa gacggccaca tttagtgaga cccctaaggt cctccaacta gggtgggtcc 1920
acagtggccc ctggtgcatg gaccacacac tctcttccct cctctggctc aggactacgg 1980
tctgaaatta gggagatatg aatgtctttc ttgaaaactt ctcttcccag tcttcccact 2040
ttgcttgggg gtccttggtc aaggccagct ttggactagg gcttgttgcg actaccagct 2100
gtctcatttt gctgtactgc aaactcaggc ttggttccaa gcttatgggg gccctgtcct 2160
tcccctagta gggtttgttt tggggtcaca tctggtcata cccttcagag agctcttccc 2220
cagcctctac atcagggaga gaggtaggta gggaggagca ttcaaggatt agaagaagga 2280
ctaaagtaca acagccttgg aggaactgcc aggaactaag ggcgagcact ggagaaggca 2340
acctgggacc ccctgcgctt ctgagcagga agaccaagac cttcaggggc cctaagcact 2400
gaaaacatca ttcctcatcc ccaagccctg gcatccccct gttcttctaa aataattctt 2460
ttctaggtat ttctgattgc aaaattctgg atgggttcat ccaagctgac ctttgctgtt 2520
ttttcccttc ccaacaaggc ctcacttttt ggagccacct tagttggtgc ctaggcagag 2580
gggcagtcag cagtggttat caggatcctg gctctatggg ttgccttcct cctggtctgt 2640
aaagcccctg caggcaggga cttcttagat agctgcttcc ttagggcatg gcatgtggtg 2700
ggtggttaat gaatggaaga gagggaatga gtgatcaagg gagggaggag ggagtggagt 2760
ggagatttct catcctttcc tgttaattta tgacatcctc ctgcctatga gtccttgact 2820
ctggagtttt acaaagcagt cacatttcaa ataaaagtct gggaaagcaa cacatcatcg 2880
ccaactttta attttgctaa ataaggatat tag 2913
<210> 37
<211> 1466
<212> DNA
<213> human
<400> 37
agccccaagc ttaccacctg cacccggaga gctgtgtgtc accatgtggg tcccggttgt 60
cttcctcacc ctgtccgtga cgtggattgg tgctgcaccc ctcatcctgt ctcggattgt 120
gggaggctgg gagtgcgaga agcattccca accctggcag gtgcttgtgg cctctcgtgg 180
cagggcagtc tgcggcggtg ttctggtgca cccccagtgg gtcctcacag ctgcccactg 240
catcaggaac aaaagcgtga tcttgctggg tcggcacagc ctgtttcatc ctgaagacac 300
aggccaggta tttcaggtca gccacagctt cccacacccg ctctacgata tgagcctcct 360
gaagaatcga ttcctcaggc caggtgatga ctccagccac gacctcatgc tgctccgcct 420
gtcagagcct gccgagctca cggatgctgt gaaggtcatg gacctgccca cccaggagcc 480
agcactgggg accacctgct acgcctcagg ctggggcagc attgaaccag aggagttctt 540
gaccccaaag aaacttcagt gtgtggacct ccatgttatt tccaatgacg tgtgtgcgca 600
agttcaccct cagaaggtga ccaagttcat gctgtgtgct ggacgctgga cagggggcaa 660
aagcacctgc tcgggtgatt ctgggggccc acttgtctgt aatggtgtgc ttcaaggtat 720
cacgtcatgg ggcagtgaac catgtgccct gcccgaaagg ccttccctgt acaccaaggt 780
ggtgcattac cggaagtgga tcaaggacac catcgtggcc aacccctgag cacccctatc 840
aaccccctat tgtagtaaac ttggaacctt ggaaatgacc aggccaagac tcaagcctcc 900
ccagttctac tgacctttgt ccttaggtgt gaggtccagg gttgctagga aaagaaatca 960
gcagacacag gtgtagacca gagtgtttct taaatggtgt aattttgtcc tctctgtgtc 1020
ctggggaata ctggccatgc ctggagacat atcactcaat ttctctgagg acacagatag 1080
gatggggtgt ctgtgttatt tgtggggtac agagatgaaa gaggggtggg atccacactg 1140
agagagtgga gagtgacatg tgctggacac tgtccatgaa gcactgagca gaagctggag 1200
gcacaacgca ccagacactc acagcaagga tggagctgaa aacataaccc actctgtcct 1260
ggaggcactg ggaagcctag agaaggctgt gagccaagga gggagggtct tcctttggca 1320
tgggatgggg atgaagtaag gagagggact ggaccccctg gaagctgatt cactatgggg 1380
ggaggtgtat tgaagtcctc cagacaaccc tcagatttga tgatttccta gtagaactca 1440
cagaaataaa gagctgttat actgtg 1466
<210> 38
<211> 462
<212> DNA
<213> human
<220>
<221> misc_feature
<222> (197)..(197)
<223> any kind of base
<220>
<221> misc_feature
<222> (116)..(116)
<223> any kind of base
<220>
<221> misc_feature
<222> (334)..(334)
<223> any kind of base
<220>
<221> misc_feature
<222> (402)..(402)
<223> any kind of base
<220>
<221> misc_feature
<222> (429)..(429)
<223> any kind of base
<220>
<221> misc_feature
<222> (438)..(438)
<223> any kind of base
<220>
<221> misc_feature
<222> (443)..(443)
<223> any kind of base
<220>
<221> misc_feature
<222> (459)..(459)
<223> any kind of base
<400> 38
taaggtttta taattatttt tatttttctt ttcttttttt tttatggctt ggatgacact 60
ttattttcag atccaatact agaagttgtt tccatgttca cattttcctt cctggnttaa 120
aaaaaagagt tgtatttttt ttttttgctt tttttaaatt atactttaag ttttagggta 180
catgtgcaca acgcagnggt tagctacata tgtatacatg tgccatgttg gcgtgctgca 240
tccagtaact cgtcatttaa cattaggtat atctccaaat gctatccttc cccccattgt 300
atttttcata gcttaaaaat cattgacata ggantaattc caactaaagt acggtattaa 360
atccctgggg gaataaattt tgtcttaaca agggtaaggt tngtgaaaag gatggttttg 420
tcacagggna aaaggganat ccncccattt taaaacccnc ct 462
<210> 39
<211> 1490
<212> DNA
<213> human
<400> 39
ctcgtgcccc ccacggaggg gactgctctc ccccgctgca tcctttctgt gaggtacctt 60
acccacctca gcacctgaga gggtgaaata gaattctaac ctcgacattc gggaagtgtt 120
tttgagaagt ctcggtcggt aagggaagtc ttccaagtcc gtgcagcact aacgtattgg 180
cacctgcctc ctcttcggcc accccccaga tgaggcagct gtgactgtgt caagggaagc 240
cacgactctg accatagtct tctctcagct tccactgccg tctccacagg aaacccagaa 300
gttctgtgaa caagtccatg ctgccatcaa ggcatttatt gcagtgtact atttgcttcc 360
aaaggatcag gggatcaccc tgagaaagct ggtacggggc gccaccctgg acatcgtgga 420
tggcatggct cagctcatgg aagtactttc cgtcactcca actcagagcc ctgagaacaa 480
tgaccttatt tcctacaaca gtgtctgggt tgcgtgccag cagatgcctc agataccaag 540
agataacaaa gctgcagctc ttttgatgct gaccaagaat gtggattttg tgaaggatgc 600
acatgaagaa atggagcagg ctgtggaaga atgtgaccct tactctggcc tcttgaatga 660
tactgaggag aacaactctg acaaccacaa tcatgaggat gatgtgttgg ggtttcccag 720
caatcaggac ttgtattggt cagaggacga tcaagagctc ataatcccat gccttgcgct 780
ggtgagagca tccaaagcct gcctgaagaa aattcggatg ttagtggcag agaatgggaa 840
gaaggatcag gtggcacagc tggatgacat tgtggatatt tctgatgaaa tcagccctag 900
tgtggatgat ttggctctga gcatatatcc acctatgtgt cacctgaccg tgcgaatcaa 960
ttctgcgaaa cttgtatctg ttttaaagaa ggcacttgaa attacaaaag caagtcatgt 1020
gacccctcag ccagaagata gttggatccc tttacttatt aatgccattg atcattgcat 1080
gaatagaatc aaggagctca ctcagagtga acttgaatta tgacttttca ggctcatttg 1140
tactctcttc ccctctcatc gtcatggtca ggctctgata cctgctttta aaatggagct 1200
agaatgcttg ctggattgaa agggagtgcc tatctatatt tagcaagaga cactattacc 1260
aaagattgtt ggttaggcca gattgacacc tatttataaa ccatatgcgt atatttttct 1320
gtgctatata tgaaaaataa ttgcatgatt tctcattcct gagtcatttc tcagagattc 1380
ctaggaaagc tgccttattc tctttttgca gtaaagtatg ttgttttcat tgtaaagatg 1440
ttgatggtct caataaaatg ctaacttgcc agtgattaaa aaaaaaaaaa 1490
<210> 40
<211> 1677
<212> DNA
<213> human
<400> 40
cttgacccta tttatagtgg ctctaaaggt ggtgttatta tgttttctag agcacttcga 60
ttatacaaac gtcaaggaat ccgagttaat gtgctttgcc ctgagtttgt tgaaacagac 120
atgggcacaa tgatcggtcc caaattcctt agtatgatgg ggggctttgt acctatggaa 180
atggtggtga aaggtgcttt tgagctcatc actgatgaga ataaagccgg cgattgccta 240
tggattacta atcggcgagg tcttgagtac tggcccaccc catcagaaga agcaaagtac 300
ttgctgcgtt ctacacgttc caggagaaga actgaataca aagctccacc aattaaacta 360
cctgagagtt ttgagaaaat agttgttcag accttgactc acaactttcg gaatgctacc 420
agtgtagtaa gagcaccact gagattacct atcaaaccaa actatgttct tgtgaagata 480
atctatgctg gtgtaaatgc tagtgatgta aattttagct caggtcgcta ttttggtggc 540
aataacagtg acactgcatc ccgtcttccg tttgatgcag gatttgaggc tgtgggagta 600
attgcagcag ttggggattc tgttactgac ttgaaagttg gcatgccttg tgcgttcatg 660
acttttggag gctatgctga atttacaatg attccttcga aatacgccct tccaatgcct 720
agaccagaac cggaaggtgt tgccatgctt acatcaggat taacagcttc aattgctcta 780
gaaaaggcag gacagatgga atctggaaaa gtggtccttg ttactgctgc ggcaggagga 840
actggtcagt ttgctgttca gcttgcaaaa ttagctggta ataccgtggt tgccacttgt 900
ggaggtgggg caaaggccaa gcttctgaaa gaattgggag tcgacagagt catagactat 960
cacagtgaag atataaaaac ggttctaagg aaagagttcc cgaaaggtat tgatatcatc 1020
tacgaatctg ttggtgggga catgttaaag ttgtgcttgg atgctttggc agtccatgga 1080
cgactcattg tcattggcat gatttctcag tatcaaggag aaaatggttg gacgccatca 1140
aaatatcctg gactatgtga gaagctcttg tcaaagagtc aaactgtggc tggctttttc 1200
ctggtgcaat atagtcacat gtaccaagaa caccttaaca agttatttga cctttactct 1260
tccggaaaac taaaggttgc tgtggatcca aagagattta taggccttca ttctgttgct 1320
gatgctgttg agtatctcca ttcaggcaaa agcgttggga aggtggttgt ctgcgtggac 1380
ccgaccttcg gtcatcaagt agccaaatta tgaatgaaca cggtgtcaaa tacagaaaga 1440
agtgaagttt tcaattctta gtctagagat tgttctcgaa tgttactgaa aatagctgct 1500
agaccagtgc tggaatattt attctcaatg ctttttcaat tttggattac ttgaaagaat 1560
aatccattta tgtataccat gtttatgttt acactataca acaactatga gcagaagaaa 1620
gcgagatatc tacaaaataa attataatcc tttcatttta aaaaaaaaaa aaaaaaa 1677
<210> 41
<211> 1330
<212> DNA
<213> human
<400> 41
atggcgcagt gggacagctt cactgatcaa caggaggaca ctgatagctg ttcagaatct 60
gtgaagtttg atgctcgctc caatacagct ttgcttcccc caaatcctaa aaatggccct 120
ccacttcaag aaaagctgaa atccttcaaa gctgcactga ttgcccttta tctccttgtg 180
tttgctgttc tcattcctat catcgcaata atggcagctc aactcctgaa gtgggaaatg 240
aagaattgca cagttggttc aattaatgca aacagtgtat cctccagtct cctgggaaga 300
ggaaatgaca gtgaagatga agtgagattt cgagaagttg ttatggaaca cattagcaag 360
atggagaaaa gaatccaata tatttcagat actgaagaaa atctcgtaga ttcagagcat 420
tttcaaaatt tcagtgtgac aactgatcaa cgatttgctg atgttcttct ccaactaagt 480
accttggttc ccacagtcca gggacatggg aatgccgtag atgaaatcac caggtcctta 540
ataagtctga ataccacgct gcttgatttg cacctctatg tagaaacact gaatgtcaaa 600
ttccaggaga atacacttaa agggcaagag gaaatcagca aattaaagga gcgtgtgcac 660
aatgcatcag cagaaattat gtctatgaaa gaagaacaag tgcatttgga acaggaaata 720
aaaagagaag tgaaagtcct gaataacatc actaatgatc tcaggctgaa agattgggaa 780
cattctcaga cgttgagaaa tatcacttta attcaaggtc ctcctggacc cccaggagaa 840
aaaggagata gaggtccaac cggagaaagt ggtccaccag gcgttccagg tccagtaggt 900
cctccaggtc ttaagggtga tcgaggatct attggctttc cgggaagtcg aggatatcca 960
ggacaatcag ggaagactgg gaggacagga tatcctggac caaaaggcca aaagggagaa 1020
aaaggcagtg gaagcatcct gactccttct gcgactgtcc gactggttgg tggccgtggc 1080
cctcatgagg gtagagtgga gatattgcac aatggacagt ggggcacagt ttgtgatgat 1140
cactgggaac tgcgtgccgg gcaggttgtc tgcaggagct tgggataccg aggtgttaag 1200
agtgtgcaca agaaagctta ttttggacaa ggtactggtc ccatttggct gaatgaagta 1260
ccctgtttgg ggatggagtc atccattgaa gagtgcaaaa tcagacagtg gggcgtgaga 1320
gtctgttcac 1330
<210> 42
<211> 431
<212> DNA
<213> human
<220>
<221> misc_feature
<222> (97)..(97)
<223> any kind of base
<220>
<221> misc_feature
<222> (347)..(347)
<223> any kind of base
<220>
<221> misc_feature
<222> (349)..(349)
<223> any kind of base
<220>
<221> misc_feature
<222> (361)..(361)
<223> any kind of base
<220>
<221> misc_feature
<222> (362)..(362)
<223> any kind of base
<220>
<221> misc_feature
<222> (363)..(363)
<223> any kind of base
<220>
<221> misc_feature
<222> (401)..(401)
<223> any kind of base
<220>
<221> misc_feature
<222> (428)..(428)
<223> any kind of base
<400> 42
ctttttatat ttattttcat cgctacacaa acatttttta ggagtttgat tctacctcca 60
ttttggttag atatacaaac tctaccccat gagggantgt atggtgtatt tctagattta 120
gcaacaattt tcttgaaaaa tgtacaatac tatagaaaaa tgaagatagt aaataccagg 180
tataagttaa taacagtgtt tcttttgttc agtaataatg aactgtgtac tagcactgaa 240
ctttaggccc tcctatttgc gtattttctg tttgtatatt tttaaataga ggaattgtga 300
ttataatatt attattttgg aatatcctaa atcataaatt caaaacntna tttagttttt 360
nnnttttttt tttaagatgg agtcccgctt tgtcccaggc nggagtgcag tggcatgatc 420
tcagctcnct g 431
<210> 43
<211> 669
<212> DNA
<213> human
<220>
<221> misc_feature
<222> (641)..(641)
<223> any kind of base
<400> 43
ttcttttgga aaaccaaaca tgctttattt catttttttc acaatttatt taaacatctc 60
acatatacaa aataggtaca atttaatttt tctgcttgcc caagaaacaa agcttctgtg 120
gaaccatgga agaagatgaa aatgagactg gcaaagaaca aatgctgaat ctgaagaaga 180
ggacaacttt gggcaaataa tctgcatact tttaattggg aataagatgg aaaatatgaa 240
tgctaaatca aattttttaa aaaatacacc acacgataca actcaataca ggagtatttc 300
ttctcaaatt cttctagcac catcaacatt cttcaagtat ctgaaatact attaattagc 360
acctttgtat tatgaacaaa acaaaacaag gacctcagtt catctctgtc taggtcagca 420
cctaacaatg tggatcacac tcatgggaaa gtgttttgag gtagtttaaa cctttggaag 480
tttgggtttt aaacttccct ctgtggaaga tattcaaaag ccacaagtgg tgcaaatgtt 540
tatggttttt atttttcaat ttttattttg gttttcttac aaaggttgac atttttcata 600
acaggtgtaa gagtgttgaa aaaaaaattt caatttttgg ngggaacggg ggaaggagtt 660
aatgaaact 669
<210> 44
<211> 287
<212> DNA
<213> human
<400> 44
gccggagagt ctacaatgtt acccagcatg ctgttggcat tgttgtaaac aaacaagtta 60
agggcaagat tcttgccaag agaattaatg tgcgtattga gcacattaag cactctaaga 120
gccgagatag cttcctgaaa cgtgtgaagg aaaatgatca gaaaaagaaa gaagccaaag 180
agaaaggtac ctgggttcaa ctaaagcgcc acgctgctcc acccagagaa gcacactttg 240
tgagaaccaa tgggaaggag cctgagctgc tggaacctat tccctat 287
<210> 45
<211> 383
<212> DNA
<213> human
<220>
<221> misc_feature
<222> (147)..(147)
<223> any kind of base
<220>
<221> misc_feature
<222> (309)..(309)
<223> any kind of base
<220>
<221> misc_feature
<222> (349)..(349)
<223> any kind of base
<220>
<221> misc_feature
<222> (365)..(365)
<223> any kind of base
<220>
<221> misc_feature
<222> (372)..(372)
<223> any kind of base
<220>
<221> misc_feature
<222> (380)..(380)
<223> any kind of base
<400> 45
ggaacggaaa aggagaattc aagtgtgacc ctcatgaggc aacgtgttat gatgatggga 60
agacatacca cgtaggagaa cagtggcaga aggaatatct cggtgccatt tgctcctgca 120
catgctttgg aggccagcgg ggctcgnctt gtgacaactg ccgcagacct ggggggtgaa 180
cccagtcccg aaggcactac tggccagtcc tacaaccagt attcttcaga gataccattc 240
agagaacaaa cactaatgtt taatttgccc aatttgagtg cttcatgcct tttaggatgt 300
tacaggctng acagagaagg ttttcccgag gagttaaatc atctttttnc catttcccga 360
ggggncaagg cntgtttttn ttt 383
<210> 46
<211> 523
<212> DNA
<213> human
<400> 46
cagaggggca gggcggacgg ctaggagttc aagaaacatc ctggtctgag ggaaaggctg 60
cagctgcacc gccatgaata agcttttcag cttctggaag aggaagaatg agacccgcag 120
ccagggctac aaccttcgag aaaaggattt aaagaaactt cacagagctg cttcagtcgg 180
ggatttgaag aagctgaagg aataccttca gatcaagaaa tatgatgtaa atatgcagga 240
ctatgaatac agaacacctt tgcacctagc ctgtgctaat ggacatacag atgttgtact 300
tttcctaatt gagcaacaat gcaagataaa tgtccgggat agtgaaaaca aatccccatt 360
gattaaggca gtacagtgtc aaaatgagga ttgtgctact attctgctaa actttggtgc 420
agacccagat ctgagggata ttcgttataa tactgttctt cactatgctg tttgtggtca 480
aagtttgtca ttagttgaaa aactgcttga atacgaagct gat 523
<210> 47
<211> 390
<212> DNA
<213> human
<400> 47
tccaaggtca tggcaaaaca tctgaagttc atcgccagga ctgtgatggt acaggaaggg 60
aacgtggaaa gcgcatacag gaccctaaac agaatcctca ctatggatgg gctcattgag 120
gacattaagc atcggcggta ttatgagaag ccatgccgcc gcgacagagg gaaagctatg 180
aaaggtgccg gcggatctac aacatggaaa tggctcgcaa gatcaacttc ttgatgcgaa 240
agaatcgggc agatccgtgg cagggctgct gaggcctgtg ggtgggacac cagtgcgaaa 300
ccctcatcca gttttctctc catctctttt ctttgtacaa tcccatttcc tattaccatt 360
ctctgcaata aactcaaatc acatgtctgc 390
<210> 48
<211> 669
<212> DNA
<213> human
<220>
<221> misc_feature
<222> (641)..(641)
<223> any kind of base
<400> 48
ttcttttgga aaaccaaaca tgctttattt catttttttc acaatttatt taaacatctc 60
acatatacaa aataggtaca atttaatttt tctgcttgcc caagaaacaa agcttctgtg 120
gaaccatgga agaagatgaa aatgagactg gcaaagaaca aatgctgaat ctgaagaaga 180
ggacaacttt gggcaaataa tctgcatact tttaattggg aataagatgg aaaatatgaa 240
tgctaaatca aattttttaa aaaatacacc acacgataca actcaataca ggagtatttc 300
ttctcaaatt cttctagcac catcaacatt cttcaagtat ctgaaatact attaattagc 360
acctttgtat tatgaacaaa acaaaacaag gacctcagtt catctctgtc taggtcagca 420
cctaacaatg tggatcacac tcatgggaaa gtgttttgag gtagtttaaa cctttggaag 480
tttgggtttt aaacttccct ctgtggaaga tattcaaaag ccacaagtgg tgcaaatgtt 540
tatggttttt atttttcaat ttttattttg gttttcttac aaaggttgac atttttcata 600
acaggtgtaa gagtgttgaa aaaaaaattt caatttttgg ngggaacggg ggaaggagtt 660
aatgaaact 669
<210> 49
<211> 431
<212> DNA
<213> human
<220>
<221> misc_feature
<222> (97)..(97)
<223> any kind of base
<220>
<221> misc_feature
<222> (347)..(347)
<223> any kind of base
<220>
<221> misc_feature
<222> (349)..(349)
<223> any kind of base
<220>
<221> misc_feature
<222> (361)..(361)
<223> any kind of base
<220>
<221> misc_feature
<222> (362)..(362)
<223> any kind of base
<220>
<221> misc_feature
<222> (363)..(363)
<223> any kind of base
<220>
<221> misc_feature
<222> (401)..(401)
<223> any kind of base
<220>
<221> misc_feature
<222> (428)..(428)
<223> any kind of base
<400> 49
ctttttatat ttattttcat cgctacacaa acatttttta ggagtttgat tctacctcca 60
ttttggttag atatacaaac tctaccccat gagggantgt atggtgtatt tctagattta 120
gcaacaattt tcttgaaaaa tgtacaatac tatagaaaaa tgaagatagt aaataccagg 180
tataagttaa taacagtgtt tcttttgttc agtaataatg aactgtgtac tagcactgaa 240
ctttaggccc tcctatttgc gtattttctg tttgtatatt tttaaataga ggaattgtga 300
ttataatatt attattttgg aatatcctaa atcataaatt caaaacntna tttagttttt 360
nnnttttttt tttaagatgg agtcccgctt tgtcccaggc nggagtgcag tggcatgatc 420
tcagctcnct g 431
Claims (17)
- 서열번호 42 내지 47의 유전자 조합에서 (정상 개체군에서의 동일 유전자의 유전자 발현과 비교하여) 변조된 유전자 발현 차이가 2배 이상이고 차등 변조를 나타내는 p값이 0.05 미만인 각각의 유전자의 차등적 변조를 확인하는 단계를 포함하는 결장직장암 상태의 검사방법.
- 삭제
- 삭제
- 제1항에 있어서, 결장직장암 마커에 대한 효소 면역검정을 이용하는 것을 추가로 포함하는 검사방법.
- 제4항에 있어서, 결장직장암 마커가 암배 항원, CA19-9, CA 125, CK-BB 및 구아닐릴 사이클라제 (Guanylyl Cyclase) C로 이루어진 그룹 중에서 선택되는 검사방법.
- 서열번호 42 내지 47의 유전자 조합의 분리된 핵산 서열, 이의 상보체 또는 이의 일부분을 포함하는 결장직장암 상태를 검사하기 위한 마이크로어레이.
- 삭제
- 삭제
- 제6항에 있어서, 마이크로어레이가 cDNA 마이크로어레이인 마이크로어레이.
- 제6항에 있어서, 마이크로어레이가 올리고뉴클레오타이드 마이크로어레이인 마이크로어레이.
- 서열번호 42 내지 47의 유전자 조합의 분리된 핵산 서열, 이의 상보체 또는 이의 일부분을 포함하는 결장직장암을 진단하기 위한 키트.
- 제11항에 있어서, 마이크로어레이 분석을 수행하기 위한 시약을 추가로 포함하는 키트.
- 제11항에 있어서, 핵산 서열, 이의 상보체 또는 이의 일부분을 분석하는 매체를 추가로 포함하는 키트.
- 서열번호 42 내지 47의 유전자 조합에서 (정상 개체군에서의 동일 유전자의 발현과 비교하여) 변조된 유전자 발현 차이가 2배 이상이고, 차등 변조를 나타내는 p값이 0.05 미만인 각각의 유전자의 차등적 변조를 확인하는 단계를 포함하여, 결장직장암의 치료에 대한 반응을 검사하는 방법.
- 제14항에 있어서, 치료에 대한 반응 검사가 환자의 호전 여부, 재발, 호전 가능성 또는 재발 가능성의 측정을 포함하는 것인 방법.
- 삭제
- 삭제
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US36879802P | 2002-03-29 | 2002-03-29 | |
US60/368,798 | 2002-03-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20030078802A KR20030078802A (ko) | 2003-10-08 |
KR100991673B1 true KR100991673B1 (ko) | 2010-11-04 |
Family
ID=28675541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030019816A KR100991673B1 (ko) | 2002-03-29 | 2003-03-29 | 결장직장암의 검사방법 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20030186302A1 (ko) |
EP (1) | EP1355149A3 (ko) |
JP (2) | JP4354724B2 (ko) |
KR (1) | KR100991673B1 (ko) |
CN (2) | CN100516233C (ko) |
AR (1) | AR039617A1 (ko) |
AU (1) | AU2003203562A1 (ko) |
BR (1) | BR0303091A (ko) |
CA (1) | CA2422298C (ko) |
MX (1) | MXPA03002866A (ko) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4517189B2 (ja) * | 2003-05-19 | 2010-08-04 | 生化学工業株式会社 | 糖ヌクレオチド運搬作用を有するタンパク質、組織の癌化の検出方法 |
JP2009528825A (ja) * | 2006-03-03 | 2009-08-13 | ベリデックス・エルエルシー | デュークスb大腸がんの再発を予測するための分子的解析 |
ES2332557B1 (es) * | 2007-12-04 | 2011-02-02 | Universidad Autonoma De Madrid | Huella genomica para el pronostico de la evolucion de adenocarcinoma colorectal. |
TWI483736B (zh) * | 2009-10-23 | 2015-05-11 | Millennium Pharm Inc | 抗-gcc抗體分子及其相關之組合物及方法 |
WO2012088146A2 (en) * | 2010-12-20 | 2012-06-28 | The University Of Notre Dame | Biomarkers and uses thereof in prognosis and treatment strategies for right-side colon cancer disease and left-side colon cancer disease |
US20120172244A1 (en) | 2010-12-20 | 2012-07-05 | Steven Buechler | Biomarkers and uses thereof in prognosis and treatment strategies for right-side colon cancer disease and left-side colon cancer disease |
CN102586423B (zh) * | 2011-12-27 | 2015-01-07 | 盛司潼 | 一种检测结直肠癌易感基因的方法及试剂盒 |
CN102586420B (zh) * | 2011-12-27 | 2014-10-22 | 盛司潼 | 一种检测乳腺癌易感基因的方法及试剂盒 |
CN106367527A (zh) * | 2016-11-17 | 2017-02-01 | 苏州大学附属第二医院 | 直肠癌放化疗疗效相关靶基因的鉴定 |
CN112831563A (zh) * | 2021-02-08 | 2021-05-25 | 复旦大学附属肿瘤医院 | 一种遗传性结直肠癌的检测panel及检测试剂盒 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5700637A (en) * | 1988-05-03 | 1997-12-23 | Isis Innovation Limited | Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays |
GB8822228D0 (en) * | 1988-09-21 | 1988-10-26 | Southern E M | Support-bound oligonucleotides |
US5143854A (en) * | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
US5242974A (en) * | 1991-11-22 | 1993-09-07 | Affymax Technologies N.V. | Polymer reversal on solid surfaces |
US5527681A (en) * | 1989-06-07 | 1996-06-18 | Affymax Technologies N.V. | Immobilized molecular synthesis of systematically substituted compounds |
DE3924454A1 (de) * | 1989-07-24 | 1991-02-07 | Cornelis P Prof Dr Hollenberg | Die anwendung von dna und dna-technologie fuer die konstruktion von netzwerken zur verwendung in der chip-konstruktion und chip-produktion (dna chips) |
IL103674A0 (en) * | 1991-11-19 | 1993-04-04 | Houston Advanced Res Center | Method and apparatus for molecule detection |
US5412087A (en) * | 1992-04-24 | 1995-05-02 | Affymax Technologies N.V. | Spatially-addressable immobilization of oligonucleotides and other biological polymers on surfaces |
US5384261A (en) * | 1991-11-22 | 1995-01-24 | Affymax Technologies N.V. | Very large scale immobilized polymer synthesis using mechanically directed flow paths |
US5554501A (en) * | 1992-10-29 | 1996-09-10 | Beckman Instruments, Inc. | Biopolymer synthesis using surface activated biaxially oriented polypropylene |
US5472672A (en) * | 1993-10-22 | 1995-12-05 | The Board Of Trustees Of The Leland Stanford Junior University | Apparatus and method for polymer synthesis using arrays |
US5429807A (en) * | 1993-10-28 | 1995-07-04 | Beckman Instruments, Inc. | Method and apparatus for creating biopolymer arrays on a solid support surface |
US5571639A (en) * | 1994-05-24 | 1996-11-05 | Affymax Technologies N.V. | Computer-aided engineering system for design of sequence arrays and lithographic masks |
US5556752A (en) * | 1994-10-24 | 1996-09-17 | Affymetrix, Inc. | Surface-bound, unimolecular, double-stranded DNA |
US6350576B1 (en) * | 1994-12-20 | 2002-02-26 | Cold Spring Harbor Laboratory | Cancer detection probes |
US5599695A (en) * | 1995-02-27 | 1997-02-04 | Affymetrix, Inc. | Printing molecular library arrays using deprotection agents solely in the vapor phase |
US5624711A (en) * | 1995-04-27 | 1997-04-29 | Affymax Technologies, N.V. | Derivatization of solid supports and methods for oligomer synthesis |
US5545531A (en) * | 1995-06-07 | 1996-08-13 | Affymax Technologies N.V. | Methods for making a device for concurrently processing multiple biological chip assays |
US5658734A (en) * | 1995-10-17 | 1997-08-19 | International Business Machines Corporation | Process for synthesizing chemical compounds |
US6275814B1 (en) * | 1996-11-27 | 2001-08-14 | Investment Strategies Network | Investment portfolio selection system and method |
US6003018A (en) * | 1998-03-27 | 1999-12-14 | Michaud Partners Llp | Portfolio optimization by means of resampled efficient frontiers |
US6218114B1 (en) * | 1998-03-27 | 2001-04-17 | Academia Sinica | Methods for detecting differentially expressed genes |
US6004755A (en) * | 1998-04-07 | 1999-12-21 | Incyte Pharmaceuticals, Inc. | Quantitative microarray hybridizaton assays |
US6218122B1 (en) * | 1998-06-19 | 2001-04-17 | Rosetta Inpharmatics, Inc. | Methods of monitoring disease states and therapies using gene expression profiles |
EP1108021A2 (en) * | 1998-08-31 | 2001-06-20 | Bayer Corporation | Human genes differentially expressed in colorectal cancer |
US6175824B1 (en) * | 1999-07-14 | 2001-01-16 | Chi Research, Inc. | Method and apparatus for choosing a stock portfolio, based on patent indicators |
AU780829B2 (en) * | 1999-07-15 | 2005-04-21 | Research Development Foundation | Corticotropin releasing factor receptor 2 deficient mice and uses thereof |
US6271002B1 (en) * | 1999-10-04 | 2001-08-07 | Rosetta Inpharmatics, Inc. | RNA amplification method |
-
2003
- 2003-03-21 US US10/393,892 patent/US20030186302A1/en not_active Abandoned
- 2003-03-28 CA CA2422298A patent/CA2422298C/en not_active Expired - Fee Related
- 2003-03-28 AU AU2003203562A patent/AU2003203562A1/en not_active Abandoned
- 2003-03-28 BR BR0303091-1A patent/BR0303091A/pt not_active IP Right Cessation
- 2003-03-29 CN CNB031312055A patent/CN100516233C/zh not_active Expired - Fee Related
- 2003-03-29 CN CN2009101489673A patent/CN101603092B/zh not_active Expired - Fee Related
- 2003-03-29 KR KR1020030019816A patent/KR100991673B1/ko not_active IP Right Cessation
- 2003-03-31 EP EP03252022A patent/EP1355149A3/en not_active Withdrawn
- 2003-03-31 JP JP2003094400A patent/JP4354724B2/ja not_active Expired - Fee Related
- 2003-03-31 MX MXPA03002866A patent/MXPA03002866A/es unknown
- 2003-04-01 AR ARP030101130A patent/AR039617A1/es not_active Application Discontinuation
-
2009
- 2009-03-31 JP JP2009087574A patent/JP2009153522A/ja active Pending
Non-Patent Citations (2)
Title |
---|
J Cell Sci, Vol. 114, No. Pt 11, pp2055-2064 (2001.06)* |
J Nutr, Vol. 131, No 11 Suppl, pp3109S-3120S (2001.11)* |
Also Published As
Publication number | Publication date |
---|---|
JP2003325190A (ja) | 2003-11-18 |
AU2003203562A1 (en) | 2003-10-23 |
US20030186302A1 (en) | 2003-10-02 |
CN1495273A (zh) | 2004-05-12 |
MXPA03002866A (es) | 2004-08-11 |
CA2422298A1 (en) | 2003-09-29 |
JP2009153522A (ja) | 2009-07-16 |
CN101603092A (zh) | 2009-12-16 |
AR039617A1 (es) | 2005-03-02 |
EP1355149A3 (en) | 2004-08-25 |
JP4354724B2 (ja) | 2009-10-28 |
CN100516233C (zh) | 2009-07-22 |
EP1355149A2 (en) | 2003-10-22 |
KR20030078802A (ko) | 2003-10-08 |
CN101603092B (zh) | 2012-11-07 |
BR0303091A (pt) | 2004-02-17 |
CA2422298C (en) | 2013-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10889865B2 (en) | Thyroid tumors identified | |
DK2681333T3 (en) | EVALUATION OF RESPONSE TO GASTROENTEROPANCREATIC NEUROENDOCRINE NEOPLASIS (GEP-NENE) THERAPY | |
CA2442820A1 (en) | Microarray gene expression profiling in clear cell renal cell carcinoma: prognosis and drug target identification | |
KR100984996B1 (ko) | 결장직장암의 검사방법 | |
KR100991673B1 (ko) | 결장직장암의 검사방법 | |
US20040241725A1 (en) | Lung cancer detection | |
CA2403946A1 (en) | Genes expressed in foam cell differentiation | |
AU2008203227A1 (en) | Colorectal cancer prognostics | |
KR20060122927A (ko) | 내피 세포의 발현 프로파일을 이용하여 조직 염증 반응을평가하는 방법 | |
US20230022417A1 (en) | Chemical compositions and methods of use | |
AU2016377391A1 (en) | Triage biomarkers and uses therefor | |
EP2027290A1 (de) | Praediktives genexpressionsmuster fuer kolorektale karzinome | |
US20070298419A1 (en) | K-Ras Oligonucleotide Microarray and Method for Detecting K-Ras Mutations Employing the Same | |
CN1856573A (zh) | 用于神经母细胞瘤预后诊断的微阵列和神经母细胞瘤预后诊断方法 | |
CA3064732A1 (en) | Methods for melanoma detection | |
KR101774275B1 (ko) | 고추의 여교배 육종을 위한 단일염기다형성 마커 세트 및 이의 용도 | |
KR102632423B1 (ko) | 비근침윤성 방광암의 예후 예측을 위한 바이오마커 및 이의 용도 | |
JP2002112799A (ja) | 癌疾患の予後判定法 | |
CN115362268A (zh) | 用于判断色素沉着皮肤类型的基因多态性标记及其用途 | |
WO2013059152A2 (en) | Methods and kits for selection of a treatment for breast cancer | |
US20040146878A1 (en) | Method for gene diagnosis of bovine Hsp70 deficiency |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20131001 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20141007 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20151002 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20160929 Year of fee payment: 7 |
|
LAPS | Lapse due to unpaid annual fee |