KR20140006898A - 결장암 유전자 발현 시그니처 및 이용 방법 - Google Patents
결장암 유전자 발현 시그니처 및 이용 방법 Download PDFInfo
- Publication number
- KR20140006898A KR20140006898A KR1020137021973A KR20137021973A KR20140006898A KR 20140006898 A KR20140006898 A KR 20140006898A KR 1020137021973 A KR1020137021973 A KR 1020137021973A KR 20137021973 A KR20137021973 A KR 20137021973A KR 20140006898 A KR20140006898 A KR 20140006898A
- Authority
- KR
- South Korea
- Prior art keywords
- colon cancer
- nucleic acid
- transcripts
- sample
- dna
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/574—Immunoassay; Biospecific binding assay; Materials therefor for cancer
- G01N33/57407—Specifically defined cancers
- G01N33/57419—Specifically defined cancers of colon
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/112—Disease subtyping, staging or classification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Pathology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Hematology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Urology & Nephrology (AREA)
- Food Science & Technology (AREA)
- General Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Cell Biology (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
결장암의 유전자 발현 시그니처, 이들을 포함하는 마이크로어레이 및 결장 유전자 발현 시그니처의 사용 방법이 제공된다. 유전자 발현 시그니처는 특히 결장암, 예를 들어, II기 결장암으로 진단된 환자의 예후를 결정하는데 유용하다. 본 명세서에 기재된 유전자 시그니처는 또한 보조 화학요법과 함께의 또는 이것이 없는 외과적 절제술의 유효성을 결정하고, 결장암 환자에서 암 재발 가능성을 결정하는데 유용하다.
Description
본 발명은 결장 조직, 예를 들어, 결정암 조직에서의 유전자 발현 프로파일링(profiling)에 관한 것이다. 특히, 본 발명은 보관된 파라핀-포매된(embedded) 생검 물질을 포함하는 생검된 결장 종양 조직 내의 mRNA 수준을 측정하는 민감한 방법에 관한 것이다. 또한, 본 발명은 결장암의 예후, 진단 및 치료를 위한 유전자 발현 시그니처를 형성하는 발현된 전사체의 세트를 제공한다.
본 출원은 전문이 본 명세서에 참고로 포함되는 미국 임시 특허 출원 제61/435,922호(출원일: 2011년 1월 25일)의 이익을 주장한다.
모든 결장암 환자의 대략 30%가 II기 질환으로 진단된다(문헌[Jemal et al., CA Cancer J. Clin., 2004]). 외과술로 치료되는 II기 결장암 환자에 대한 5년 생존율은 대략 75 내지 80%이며, 이는 대부분의 환자가 외과술만으로 치유됨을 입증한다(문헌[Benson, The Oncologist, 2006; Nauta et al., Arch. Surg., 1989]). 그럼에도 불구하고, 이들 환자의 대략 20 내지 25%는 그들의 생애에 재발 질환이 발생할 것이다(문헌[Benson, The Oncologist, 2006; Gill et al., J. Clin. Oncol., 2004]). 이론상, 이들 환자는 보조 화학요법으로부터 이익을 얻을 것이다. 그러나, II기 결장암에서 보조 화학요법을 사용하여, 대략 3 내지 4%의 환자만이 5년에 완전한 생존의 향상을 갖는다(문헌[Benson, The Oncologist, 2006; Andre et al., Annals of Surgical Oncology 2006]). 결과적으로, 미국 임상 암협회 지침에 의하면, 이들 환자를 통상적으로 보조 화학요법으로 치료하지 않아야 한다고 권고하고 있다(문헌[Benson et al., J. Clin. Oncol., 2004]). 이에도 불구하고, 재발 위험이 높은 II기 결장암 환자의 대략 20%가 보조 치료에 대한 후보일 수 있음이 명백하다(문헌[Benson, The Oncologist, 2006]; 문헌[Nauta et al., Arch. Surg., 1989]; 문헌[Gill et al., J. Clin. Oncol., 2004]; 문헌[Andre et al., Annals of Surgical Oncology 2006]).
결장암과 같은 질환에서, 처음의 치료가 종종 가장 중요하며, 가장 큰 성공의 기회를 제공하여, 처음의 치료로서 환자의 특정 결장암 병기에 가장 효과적인 치료를 사용할 필요가 있다. 이는 어떠한 약물 치료가 특정 개체의 생리학에 대해 가장 효과적일지를 예측하기 위한 방법이 이용가능하지 않았기 때문에 종래에 불가능하였다. 환자는 여러 번 불필요하게 독성 약물 요법을 겪을 것이다. 예를 들어, II기 종양 결절 전이(tumor node metastasis: TNM) 결장암에서, 환자가 외과술 후의 보조 화학요법에 반응할지를 결정하는 방법이 존재하지 않는다. 수술 후에 재발의 위험이 있는 II기 환자의 20%의 오직 1/3만이 화학요법으로부터 임의의 이익을 얻는다. 이는 보조 화학요법의 처방이 일부 환자를 비필수적인 치료에 노출시키는 것을 의미한다. 대안적으로, 이러한 단계에서 보조 화학요법의 거부에 대한 결정은 일부 환자를 암 재발의 높은 위험에 노출시킬 것이다.
현재, 임상 시험에 사용되는 진단 시험은 단일의 분석물 시험에 기초하며, 이에 따라 수십 개의 상이한 마커 간의 관계의 인식의 잠재적 가치를 담아내지 않는다. 더욱이, 진단 시험은 조직면역화학에 의존적이어서, 자주 정량적인 것이 아니다. 이러한 방법은 종종 상이한 실험실에서 상이한 결과를 제공하는데, 이는 부분적으로 시약이 표준화되지 않기 때문이며, 부분적으로 해석이 주관적일 수 있으며, 용이하게 정량화되지 않을 수 있기 때문이다. RNA 기반의 시험은 시간이 지남에 따른 RNA 분해의 문제와 분석을 위해 환자로부터 신선한 조직 샘플을 수득하는 것이 어렵다는 사실 때문에, 자주 사용되지는 않았다. 고정된 파라핀-포매된 조직은 더욱 용이하게 입수할 수 있으며, 고정된 조직에서 RNA를 검출하는 방법이 확립되어 있다. 그러나, 이들 방법은 전형적으로, 소량의 재료로부터 다수의 유전자(DNA 또는 RNA)의 연구를 가능하게 하지 않는다. 따라서, 통상적으로 고정된 조직은 단백질의 면역조직화학적 검출 이외의 것을 위해 좀처럼 사용되지 않는다.
최근에, 몇몇 그룹에 의해, 마이크로어레이 유전자 발현 분석에 의한 다양한 암 유형의 분류에 관한 연구가 공개되었다(예를 들어, 문헌[Golub et al., Science 286:531 537(1999)]; 문헌[Bhattacharjae et al., Proc. Natl. Acad. Sci. USA 98:13790 13795(2001)]; 문헌[Chen-Hsiang et al., Bioinformatics 17(Suppl. 1):S316 S322(2001)]; 문헌[Ramaswamy et al., Proc. Natl. Acad. Sci. USA 98:15149 15154 (2001)], 문헌[Salazar et al., Journal of Clinical Oncology 29: 17-24(2010)], 문헌[O'Conneell et al., Journal of Clinical Oncology 28: 937-3944(2010)] 및 문헌[Kerr et al., Journal of Clinical Oncology 27(suppl) 15s(2009)] 참조). 그러나, 이들 연구는 주로, 이미 확립되어 있는 다양한 암의 유형의 분류를 개선시키고 개량하는데 집중되어 있으며, 일반적으로, 암 치료법의 임상적 결과를 향상시키기 위하여, 차등적으로 발현되는 유전자의 관계에 대한 새로운 시야를 제공하지 않으며, 관찰을 치료 전략에 연결시키지 않는다. 또한, 암 치료 및 결장암 임상 시험은 여전히 종양의 유전자 구성 및 환자의 유전형을 사용하여 개인 약제 계획(regime)을 확립하는 통합적인 약리유전체학(pharmacogenomics) 방법보다는 신규한 활성 화합물의 입수가능성에 기초하여 계속되고 있다.
비록 현대 분자 생물학 및 생화학에 의해, 활성이 종양 세포의 거동, 그들의 분화 상태 및 특정 치료 약물에 대한 그들의 감수성 또는 내성에 영향을 미치는 100개가 넘는 유전자가 드러났지만, 일부 예외와 함께, 이들 유전자의 상태는 통상적으로 약물 처리에 관한 임상적 결정을 내리는 목적을 위해 조사된 적이 없다.
결장암 환자의 예후를 예측하는데 유용한 바이오마커를 동정할 필요가 있다. 고위험(불량한 예후) 또는 저위험(양호한 예후)으로 환자를 분류하는 능력에 의해, 이들 환자에 대한 적절한 치료법의 선택이 가능해질 것이다. 예를 들어, 고-위험 환자는 아마도 공격적인 치료법으로부터 이익을 얻을 수 있는 한편, 치료법은 저위 험 환자에 대해서는 유의미한 이점을 갖지 않을 수 있다. 그러나, 이러한 요구에도 불구하고, 이러한 문제에 대한 해결책이 이용가능하지 않다.
따라서, 특정 치료 요법, 예를 들어, 화학요법을 동반하거나 또는 이를 동반하지 않는 절제술의 실시 후에, 회복 또는 재발 가능성에 대한 정보를 내과의에게 제공하는 마이크로어레이 기반의 예후 기술이 필요하다. 또한, 결장 질환을 정확하게 진단할 수 있는, 특히 특정 결장암 병기를 진단할 수 있거나, 특정 치료법에 대한 결장 질환 환자의 반응을 예측할 수 있는 기술도 필요하다. 암 환자에서 종양에 관한 특정 지식은 관해(remission)의 연장, 환자 삶의 질 증가 및 건강관리 비용의 감소에 아주 유용할 것이다. 또한, 이러한 기술을 사용하여, 후보 환자를 신규한 치료 화합물 및 방법을 위한 임상 시험에 대해 스크리닝하여, 규제적 승인 과정을 용이하게 할 수 있다.
이들 요구를 만족시키는 결장암으로부터의 발현 시그니처가 개시된다. 개시된 시그니처는 결장암의 예후, 결장암의 진단 및 환자 그룹의 분류에서의 적용을 위해 사용될 수 있다. 일부 실시 형태에서, 이들 결과는 결장암의 치료를 위한 단독의 외과술 또는 보조 화학요법과 병용한 외과술의 효능의 게놈의 증거의 평가를 가능하게 한다. 본 명세서에 기재된 시그니처는 2가지 진단 또는 예후 결과를 구분하는데 유의미할 수 있으며, 그를 구분할 수 있다. 본 발명의 중요한 태양은 결장암 조직에서 특정 유전자의 측정된 발현을 사용하여, 환자를 가장 적절한 치료에 매치(match)시키고, 예후 정보를 제공하는 것이다. 따라서, 이러한 결장암 시그니처의 사용 방법이 개시된다. 개시된 방법은 대상체로부터 수득되는 핵산을 포함하는 샘플에서 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계 및 상기 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유래된 결정 점수(decision score)를 대조군 임계값(control threshold)과 비교하는 단계를 포함한다. 요청되는 예측에 따라, 대조군 임계값은 결장암의 진단을 나타내거나, 공지되어 있는 결장암의 분류를 나타내거나, 공지되어 있는 치료에 대한 반응을 나타내거나, 장기간 생존의 이력을 갖는 것을 나타내거나, 재발의 이력을 나타내는 등일 수 있다.
다양한 실시 형태에서, RNA는 결장 조직 샘플로부터 단리되며, 유전자 발현 프로파일을 생성하기 위해 사용된다. 암의 예후를 포함하는 특정 실시 형태에서, 샘플은 대장 종양 시료, 예를 들어, 결장암 샘플이다. 특정 실시형태에서, 유전자 발현 프로파일은 표 6에 열거되고, 표 1 및/또는 표 2에 열거된 것일 수도 있는 적어도 50개의 전사체의 발현을 검출하는 것을 수반한다. 유전자 발현 프로파일에서 검출되는 전사체의 총 개수는 달라질 수 있다. 예를 들어, 일부 실시 형태에서, 프로파일에서 검출되는 전사체의 총 개수는 약 200 내지 약 1000개 또는 약 400개 내지 약 800개이거나, 또는 다른 실시형태에서, 전사체의 개수는 약 500 내지 약 700개 또는 약 550 내지 약 650개이다. 다양한 실시 형태에서, 표 6에 열거된 적어도 약 50개, 적어도 약 100개, 적어도 약 200개, 적어도 약 300개, 적어도 약 400개, 적어도 약 500개, 적어도 약 600개 또는 모든 전사체가 전사체의 총 개수의 일부로서 검출된다. 추가의 전사체가 검출되는 경우(표 6의 것에 더하여), 추가의 전사체는 임의로 신호 또는 발현 수준 대조군으로부터 선택될 수 있으며, 일부 실시형태에서, 결장암에서 발현되는 것으로 공지되어 있는 전사체, 예를 들어, 대장암 DSA(상표명)의해 결정된 것이다. 특정 실시 형태에서, 추가의 전사체는 또한 결장암 예후를 나타낼 수 있다.
환자의 발현 프로파일은 고위험 및 저위험 환자 그룹, 예를 들어, 임상적 재발 위험이 높거나 낮은 환자에서 표 6에 열거된 전사체의 발현 수준에 기초하여, 발현 시그니처에 대하여 점수를 매기며, 결과를 사용하여 일련의 치료를 결정할 수 있다. 예를 들어, 고위험 환자인 것으로 결정된 환자는 외과술 후에 보조 화학요법으로 치료될 수 있다. 저위험 환자인 것으로 여겨지는 환자에 대하여, 외과술 후에 보조 화학요법이 보류될 수 있다. 따라서, 본 발명은 특정 태양에서, 재발의 위험을 나타내는 결장암 종양의 유전자 발현 프로파일의 생성 방법을 제공한다.
본 발명은 추가로 결장암의 예후를 위한 방법을 제공한다. 이러한 태양에 따른 방법은 결장암 시료(예를 들어, 본 명세서에 기재된 바와 같은)의 유전자 발현 프로파일을 생성하는 것을 포함한다. 그 다음, 유전자 발현 프로파일을 본 명세서에 기재된 유전자 발현 시그니처에 대하여 분류하거나 점수를 매긴다. 다양한 실시형태에서, 유전자 발현 시그니처는 표 6에 열거되고, 표 1 및/또는 표 2에 열거된 것일 수도 있는 적어도 50개의 전사체의 발현 수준에 기초한다. 일부 실시 형태에서, 시그니처의 기초가 되는 전사체의 총 개수는 약 800개 미만, 약 700개 미만, 약 600개 미만, 약 500개 미만, 약 400개 미만, 약 300개 미만, 약 200개 미만 또는 약 100개 미만의 전사체이며, 표 6으로부터의 전사체를 포함한다. 예를 들어, 시그니처는 표 6으로부터의 적어도 약 400개, 적어도 약 500개 또는 적어도 약 600개의 전사체의 발현 수준에 기초할 수 있다. 임의로, 표 6으로부터의 전사체는 표 1에 열거된 전사체를 포함한다.
또한, 대상체에 대한 맞춤형 결장암 유전체학 프로파일의 생성 방법이 개시된다. 상기 방법은 대상체로부터 수득되는 핵산을 포함하는 샘플에서 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계 및 유전자 발현 분석에 의해 수득되는 데이터를 요약하는 리포트를 생성하는 단계를 포함한다.
개시된 방법의 일부 예에서, 발현 수준은 대상체로부터 수득되는 대장 조직의 샘플, 예를 들어, 결장암 샘플로부터 추출되는 RNA 및/또는 RNA로부터 전사되는 cDNA를 포함하는 대상체로부터 수득되는 핵산으로부터 결정된다.
또한, 결장암에 대한 유전자 발현 시그니처를 검출하기 위한 핵산 프로브 및 프라이머(뿐만 아니라 이러한 프로브 및 프라이머의 세트)가 개시된다. 일부 예에서, 프로브는 결장암 시그니처의 검출에 사용하기 위한 어레이의 일부이다.
본 발명의 상기의 및 기타 특징 및 이점은 첨부된 도면을 참조하여 진행되는 하기의 일부 실시 형태의 상세한 설명으로부터 더욱 명백해질 것이다.
도 1은 결장암 전사체 발현 시그니처를 유도하는데 사용되는 예시적인 절차를 보여주는 흐름도이다.
도 2는 대장암 DSA(상표명)를 사용하는 II기 결장암 예후 시그니처 생성 및 검증의 예시적인 개요를 보여주는 흐름도이다.
도 3a는 트레이닝 세트에서 636개 전사체 예후 시그니처의 수신자 조작 특성(receiver operating characteristic: ROC) 곡선의 그래프이다.
도 3b는 후보 모델로부터의 트레이닝 데이터로부터의 재발의 카플란-마이어 플롯(Kaplan-Meier plot)이다.
도 4a는 검증 세트에서 636개 전사체 예후 시그니처의 수신자 조작 특성(ROC) 곡선의 그래프이다.
도 4b는 후보 모델로부터의 검증 데이터로부터의 재발의 카플란-마이어 플롯이다.
도 5는 후보 모델로부터의 검증 데이터로부터의 전체 생존의 카플란-마이어 플롯이다.
도 6은 후술하는 바와 같은 표 3이다.
도 7은 후술하는 바와 같은 표 6이다.
표의 간단한 설명
표 1은 핵심 결장 시그니처에 포함되는 10개 후보 전사체의 목록을 제공한다. 이들 전사체는 샘플의 불량한 예후 그룹 및 양호한 예후 그룹으로의 분류에 가장 큰 영향을 갖는 것으로 동정되었다.
표 2는 결장 시그니처에 포함되는 178개의 독특한 전사체의 목록을 제공한다. 이러한 표는 636개 전사체 시그니처에서의 전사체의 가중치 순위뿐 아니라 결장 조직에서 발현되는 전사체의 배향을 포함한다.
표 3은 636개 전사체 시그니처를 동정하기 위한 연구에서 주요 환자 및 종양 특징을 제공한다.
표 4는 전사체 시그니처를 동정하기 위하여 사용되는 교차-검증된 트레이닝 세트 및 검증 세트에 대한 성능 메트릭(performance metrics)을 제공한다.
표 5는 환자 연령, 환자 성별, pT-병기, 종양 등급(tumor grade), 종양 위치 및 점액성/비-점액성 하위유형 상태에 대한 위험비를 보여주는 통계 분석의 결과를 제공한다.
표 6은 636개 전사체 결장 시그니처에 포함되는 전사체의 목록을 제공한다.
서열 목록
첨부된 서열 목록에 열거된 핵산 및 아미노산 서열은 37 C.F.R. §1.822에 정의된 바와 같은 뉴클레오타이드 염기에 대한 표준 문자 약어를 사용하여 나타낸다. 각 핵산 서열의 오직 한 가닥을 나타내었으나, 임의로 디스플레이된 가닥을 참조하여 상보적인 가닥이 포함되는 것으로 이해된다. 첨부 서열 목록에서,
서열 번호 1 내지 636은 인간 결장암으로부터의 올리고뉴클레오타이드 전사체이다.
서열 목록은 파일명 ADL-0311_Sequence_Listing.txt의 형태의 ASCII 텍스트 파일로 제출되며, 이 파일은 2012년 1월 25일에 생성되었고, 232,154 바이트이며, 본 명세서에 참고로 포함된다.
도 2는 대장암 DSA(상표명)를 사용하는 II기 결장암 예후 시그니처 생성 및 검증의 예시적인 개요를 보여주는 흐름도이다.
도 3a는 트레이닝 세트에서 636개 전사체 예후 시그니처의 수신자 조작 특성(receiver operating characteristic: ROC) 곡선의 그래프이다.
도 3b는 후보 모델로부터의 트레이닝 데이터로부터의 재발의 카플란-마이어 플롯(Kaplan-Meier plot)이다.
도 4a는 검증 세트에서 636개 전사체 예후 시그니처의 수신자 조작 특성(ROC) 곡선의 그래프이다.
도 4b는 후보 모델로부터의 검증 데이터로부터의 재발의 카플란-마이어 플롯이다.
도 5는 후보 모델로부터의 검증 데이터로부터의 전체 생존의 카플란-마이어 플롯이다.
도 6은 후술하는 바와 같은 표 3이다.
도 7은 후술하는 바와 같은 표 6이다.
표의 간단한 설명
표 1은 핵심 결장 시그니처에 포함되는 10개 후보 전사체의 목록을 제공한다. 이들 전사체는 샘플의 불량한 예후 그룹 및 양호한 예후 그룹으로의 분류에 가장 큰 영향을 갖는 것으로 동정되었다.
표 2는 결장 시그니처에 포함되는 178개의 독특한 전사체의 목록을 제공한다. 이러한 표는 636개 전사체 시그니처에서의 전사체의 가중치 순위뿐 아니라 결장 조직에서 발현되는 전사체의 배향을 포함한다.
표 3은 636개 전사체 시그니처를 동정하기 위한 연구에서 주요 환자 및 종양 특징을 제공한다.
표 4는 전사체 시그니처를 동정하기 위하여 사용되는 교차-검증된 트레이닝 세트 및 검증 세트에 대한 성능 메트릭(performance metrics)을 제공한다.
표 5는 환자 연령, 환자 성별, pT-병기, 종양 등급(tumor grade), 종양 위치 및 점액성/비-점액성 하위유형 상태에 대한 위험비를 보여주는 통계 분석의 결과를 제공한다.
표 6은 636개 전사체 결장 시그니처에 포함되는 전사체의 목록을 제공한다.
서열 목록
첨부된 서열 목록에 열거된 핵산 및 아미노산 서열은 37 C.F.R. §1.822에 정의된 바와 같은 뉴클레오타이드 염기에 대한 표준 문자 약어를 사용하여 나타낸다. 각 핵산 서열의 오직 한 가닥을 나타내었으나, 임의로 디스플레이된 가닥을 참조하여 상보적인 가닥이 포함되는 것으로 이해된다. 첨부 서열 목록에서,
서열 번호 1 내지 636은 인간 결장암으로부터의 올리고뉴클레오타이드 전사체이다.
서열 목록은 파일명 ADL-0311_Sequence_Listing.txt의 형태의 ASCII 텍스트 파일로 제출되며, 이 파일은 2012년 1월 25일에 생성되었고, 232,154 바이트이며, 본 명세서에 참고로 포함된다.
I. 용어의 요약
달리 다르게 정의되지 않는 한, 본 명세서에 사용되는 기술 및 과학 용어는 본 발명이 속하는 분야의 숙련자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 분자 생물학에서 통상적인 용어의 정의는 문헌[Benjamin Lewin, Genes IX, published by Jones and Bartlet, 2008(ISBN 0763752223)]; 문헌[Kendrew et al. eds.), The Encyclopedia of Molecular Biology, published by Blackwell Science Ltd., 1994(ISBN 0632021829)]; 문헌[Robert A. Meyers(ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH publishers, Inc., 1995(ISBN 9780471185710)]; 문헌[Singleton et al., Dictionary of Microbiology and Molecular Biology 2nd ed., J. Wiley & Sons(New York, N.Y. 1994)] 및 문헌[March, Advanced Organic Chemistry Reactions, Mechanisms and Structure 4th ed., John Wiley & Sons(New York, N.Y. 1992)]에서 찾을 수 있다.
용어의 단수 표현은 문맥에서 명백히 달리 지시하지 않는 한 복수의 지시 대상을 포함한다. 유사하게, "또는"이라는 단어는 문맥에서 명백히 달리 지시하지 않는 한 "및"을 포함하는 것으로 의도된다. "포함한다"라는 용어는 "함유하다"라는 의미이다. 상충되는 경우에, 용어의 설명을 포함하는 본 명세서가 좌우할 것이다.
본 발명의 다양한 실시 형태의 검토를 용이하게 하기 위하여 하기의 용어의 설명이 제공된다.
ㆍ핵산 분자의 증폭: 핵산 분자, 예를 들어, 유전자 또는 유전자의 단편, 예를 들어, 표 6에 나타낸 전사체의 카피수를 증가시키기 위한 것. 생성된 산물은 증폭 산물로 지칭된다.
시험관 내 증폭의 일 예는 중합효소 연쇄 반응(PCR)이다. 시험관 내 증폭 기술의 다른 예에는 정량적 실시간 PCR, 가닥 치환 증폭(미국 특허 제5,744,311호 참조); 전사 부재 등온 증폭(transcription-free isothermal amplification)(미국 특허 제6,033,881호 참조); 수선 연쇄 반응 증폭(repair chain reaction amplification)(국제 특허 출원 공개 제WO 90/01069호 참조); 리가제(ligase) 연쇄 반응 증폭(EP-A-320 308호 참조); 갭 필링(gap filling) 리가제 연쇄 반응 증폭(미국 특허 제5,427,930호 참조); 결합된 리가제 검출 및 PCR(미국 특허 제6,027,889호 참조); 및 NASBA(상표명) RNA 전사 부재 증폭(미국 특허 제6,025,134호 참조)이 포함된다.
ㆍ어레이: 기판 상의 또는 그 내의 주소결정 가능한(addressable) 위치에서, 분자, 예를 들어, 생물학적 거대분자(이러한 핵산 분자) 또는 생물학적 샘플(예를 들어, 조직 섹션)의 장치. 일부 예에서, 어레이는 혼성화 절차 동안 실질적으로 제거되지 않도록 고체 기판에 결합된 폴리뉴클레오타이드 프로브(예를 들어, 표 6에 나타낸 핵산 서열 또는 그의 상보체에 혼성화하는 프로브)의 어레이이다. "마이크로 어레이"는 평가 또는 분석을 위해 현미경 검사를 필요로 하거나 그에 의해 지원되도록 소형화된 어레이이다. 어레이는 때때로 DNA 칩 또는 바이오칩으로 지칭된다.
분자("피처(feature)")의 어레이는 샘플 상에서 매우 다수의 분석을 동시에 수행할 수 있게 한다. 특정 어레이 예에서, 하나 이상의 분자(예를 들어, 올리고뉴클레오타이드 프로브)가 다수 회(예를 들어, 2회) 어레이 상에서 존재하여, 예를 들어, 내부 대조군을 제공할 것이다.
특정 예에서, 어레이는 핵산 분자, 예를 들어, 올리고뉴클레오타이드 서열을 포함한다. 어레이 상에서 사용되는 폴리뉴클레오타이드는 통상적으로 약 500 내지 5000개 염기 길이의 cDNA("cDNA 어레이")일 수 있지만, 더 짧거나 더 긴 cDNA도 또한 사용될 수 있다. 대안적으로, 폴리뉴클레오타이드는 전형적으로 약 20 내지 80개 염기 길이인 올리고뉴클레오타이드일 수 있지만, 더 짧거나 더 긴 올리고뉴클레오타이드도 또한 적절하다. 일 예에서, 분자는 그들의 5'- 또는 3'-말단을 통하여 어레이에 부착되는 올리고뉴클레오타이드를 포함한다.
어레이 내에서, 각 배열된 샘플은 그의 위치가 적어도 2차원의 어레이 내에서 신뢰할 수 있게, 그리고 일관되게 결정될 수 있다는 점에서, 주소결정 가능하다. 어레이 상의 주소결정 가능한 위치의 수는 예를 들어, 적어도 4 내지 적어도 9개, 적어도 10개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 30개, 적어도 50개, 적어도 75개, 적어도 100개, 적어도 150개, 적어도 200개, 적어도 300개, 적어도 500개, 적어도 550개, 적어도 600개, 적어도 800개, 적어도 1000개, 적어도 10,000개 이상으로 달라질 수 있다. 어레이 상의 피처 적용 위치는 상이한 형상을 취할 수 있다. 예를 들어, 어레이는 규칙적이거나(예를 들어, 균일한 행과 열로 배열된) 불규칙적일 수 있다. 따라서, 정렬된 어레이에서, 각 샘플의 위치는 어레이에 적용되는 때에 샘플에 할당되며, 색인(key)이 각 위치를 적절한 표적 또는 피처 위치와 상호 관련시키기 위하여 제공될 수 있다. 종종, 정렬된 어레이는 대칭적인 격자 패턴으로 배열되나, 샘플은 다른 패턴으로(예를 들어, 방사상 분포 라인, 나선형 라인 또는 정렬된 클러스터로) 배열될 수 있다. 주소결정 가능한 어레이는 통상 컴퓨터가 어레이 상의 특정 주소를 그 위치에서 샘플에 관한 정보(예를 들어, 신호 세기를 포함하는 혼성화 또는 결합 데이터와 같은)와 상호 관련시키도록 프로그램화될 수 있다는 점에서 컴퓨터 판독가능하다. 컴퓨터 판독 가능한 형식의 일부 예에서, 어레이 내의 개별 피처는 예를 들어, 컴퓨터에 의해 정보를 다룰 수 있도록 상호 관련될 수 있는 데카르트 격자(Cartesian grid) 패턴으로 규칙적으로 배열된다.
ㆍ결합 또는 안정한 결합: 2가지 물질 또는 분자 간의 회합, 예를 들어, 핵산의 다른 핵산으로의 회합(예를 들어, 프로브의 표 6에 나타낸 전사체 또는 그의 상보체로의 결합), 또는 한 단백질의 다른 단백질 또는 핵산 분자와의 회합. 결합은 예를 들어, 핵산의 경우에 표적:올리고뉴클레오타이드 복합체의 물리적 또는 기능적 특성에 의해서와 같이, 당업자에게 공지되어 있는 임의의 절차에 의해 검출될 수 있다.
상보적 가닥의 핵산 분자의 결합을 검출하는 물리적 방법에는 DNase I 또는 화학적 풋프린팅(footprinting), 겔 이동(gel shift) 및 친화성 절단 검정법(affinity cleavage assay), 노던 블롯팅(Northern blotting), 돗트 블롯팅(dot blotting) 및 흡광 검출 절차와 같은 방법이 포함되나 이들에 한정되지 않는다. 예를 들어, 하나의 방법은 온도가 천천히 증가함에 따라, 올리고뉴클레오타이드(또는 유사체) 및 표적 핵산을 함유하는 용액의 흡광의 변화를 220㎚ 내지 300㎚에서 관찰하는 것을 수반한다. 올리고뉴클레오타이드 또는 유사체가 그의 표적에 결합된다면, 올리고뉴클레오타이드(또는 유사체) 및 표적이 서로 분리되거나 또는 용융됨에 따라 특징적인 온도에서 흡광도의 급작스러운 증가가 존재한다. 다른 예에서, 방법은 신호, 예를 들어 하나 또는 둘 모두의 핵산 분자(또는 필요에 따라, 항체 또는 단백질) 상에 존재하는 검출 가능한 표지를 검출하는 것을 수반한다.
올리고머 및 그의 표적 핵산 간의 결합은 종종 올리고머의 50%가 그의 표적으로부터 용융되는 온도(Tm)를 특징으로 한다. 보다 높은 (Tm)은 보다 낮은 (Tm)을 갖는 복합체에 비해 더욱 강력하거나 더욱 안정한 복합체를 의미한다.
ㆍcDNA(상보적 DNA): 내부 비-암호화 세그먼트(segment)(인트론) 및 전사를 결정하는 조절 서열이 결여된 DNA의 조각. cDNA는 세포 및/또는 조직 샘플, 예를 들어, 결장암 샘플을 포함하는 결장 샘플로부터 추출되는 메신저 RNA(mRNA)로부터 역전사에 의해 합성될 수 있다.
ㆍ임상적 결과: 질환 또는 장애에 대한 치료 후의 또는 치료의 부재 하의 환자의 건강 상태를 말한다. 임상적 결과에는 사망까지의 기간의 증가, 사망까지의 기간의 감소, 생존 기회의 증가, 사망 위험의 증가, 생존, 무-질환 생존, 만성 질환, 전이, 진행성(advanced) 또는 침습성(aggressive) 질환, 질환 재발, 사망 및 치료법에 대한 양호하거나 불량한 반응이 포함되나, 이들에 한정되지 않는다.
ㆍ결장암: 결장(대장의 가장 긴 부분)의 조직에 형성되는 암. 대부분의 결장암은 선암종(장기를 이루고 분비샘(gland)-유사 특성을 갖는 세포에서 시작되는 암)이다. 암 진행은 체 내의 암의 병기 또는 범위를 특징으로 한다. 병기결정(staging)은 보통 종양의 크기, 림프절이 암을 함유하는지 여부 및 암이 원래의 부위로부터 다른 신체 부분으로 확산되는지 여부에 기초한다. 결장암의 병기는 I기, II기, III기 및 IV기를 포함한다. 달리 특정되지 않는 한, 용어 결장암은 0기, I기, II기(IIA 또는 IIB기 포함), III기(IIIA, IIIB 또는 IIIC기 포함) 또는 IV기의 결장암을 지칭한다. 본 명세서의 일부 실시 형태에서, 결장암은 임의의 병기로부터의 암이다. 다른 실시 형태에서, 결장암은 II기 결장암이다.
ㆍ화학치료제: 비정상적인 세포 성장을 특징으로 하는 질환의 치료에서 치료적 유용성을 갖는 임의의 화학적 제제(agent). 이러한 질환에는 종양, 신생물 및 암 뿐만 아니라 과다형성 성장을 특징으로 하는 질환, 예를 들어 건선이 포함된다. 일 실시 형태에서, 화학치료제는 결장암의 치료에 사용되는 제제이다. 일 실시 형태에서, 화학치료제는 방사성 화합물이다. 당업자는 유용한 화학치료제를 용이하게 동정할 수 있다(예를 들어, 문헌[Slapak and Kufe, Principles of Cancer Therapy, Chapter 86 in Harrison's Principles of Internal Medicine, 14th edition]; 문헌[Perry et al., Chemotherapy, Ch. 17 in Abeloff, Clinical Oncology 2nd ed., 2000 Churchill Livingstone, Inc]; 문헌[Baltzer and Berkery.(eds): Oncology Pocket Guide to Chemotherapy, 2nd ed. St. Louis, Mosby-Year Book, 1995]; 문헌[Fischer Knobf, and Durivage(eds): The Cancer Chemotherapy Handbook, 4th ed. St. Louis, Mosby-Year Book, 1993] 참조). 결장암의 치료에 사용되는 화학치료제는 소분자, 예를 들어, 5-플루오로우라실, 류코보린, 이리노테칸, 옥살리플라틴 및 카페시타빈 및 항체, 예를 들어, 베바쿠지맙 및 세툭시맙을 포함한다. 병용 화학요법은 암을 치료하기 위한 한 가지 초과의 제제의 투여이다.
ㆍ접촉: 직접적으로 물리적으로 회합되는 배치 고체 및 액체 형태 둘 모두를 포함. 접촉은 하나의 분자와 다른 분자 간의 접촉, 예를 들어, 샘플과 핵산 프로브, 예를 들어, 표 6에 나타낸 임의의 서열에 대한 프로브의 접촉을 포함한다.
ㆍ대조군: "대조군"은 실험적 샘플, 예를 들어, 결장암 환자로부터 수득되는 종양 샘플과의 비교를 위해 사용되는 샘플 또는 표준물질을 말한다. 일부 실시 형태에서, 대조군은 건강한 환자로부터 수득되는 샘플 또는 결장암으로 진단된 환자로부터 수득된 비-암 조직 샘플, 예를 들어, 종양이 존재하는 동일한 장기로부터의 비-암 조직 샘플(예를 들어, 비-암 결장 조직은 결장암에 대한 대조군으로 소용될 수 있다)이다. 일부 실시 형태에서, 대조군은 종래의 대조군 또는 표준물질 값(다시 말하면, 기준선 또는 정상 값을 나타내는 이전에 시험한 대조군 샘플 또는 샘플의 그룹)이다.
차등적 발현의 결정을 위해, 샘플과 비교하기 위한 대조군 또는 표준물질은 정상인 것으로 여겨지는 샘플(그들, 예를 들어, 결장암을 갖지 않는 대상체로부터의 샘플이 원하는 특성에 대하여 변경되지 않는다는 점에서)뿐 아니라 비록 아마도 자의적으로 설정될지라도 실험실 값을 포함한다. 실험실 표준물질 및 값은 공지되어 있거나 결정된 집단의 값에 기초하여 설정될 수 있으며, 측정된, 실험에 의해 결정된 값의 비교를 가능하게 하는 그래프 또는 표의 형식으로 제공될 수 있다.
ㆍ발현의 검출: 핵산을 검출할 수 있는 정성적 또는 정량적 방식 중 어느 하나로의 발현 수준의 결정. 예시적인 방법에는 마이크로어레이 분석, RT-PCR 및 노던 블롯이 포함된다. 일부 예에서, 발현의 검출은 표 6에서의 하나 이상의 전사체의 발현의 검출을 포함한다.
ㆍ차등의 발현 또는 변경된 발현: 유전자(예를 들어, 표 1, 표 2로부터의 임의의 유전자 및/또는 표 6의 핵산 전사체)에서 암호화된 정보의 메신저(messenger) RNA로의 전환, mRNA의 단백질로의 전환, 또는 둘 모두의 차이, 예를 들어, 증가 또는 감소. 일부 예에서, 차이는 대조군 또는 참조 값, 예를 들어, 동일한 대상체로부터 질환, 예를 들어, 결장암에 의해 영향을 받지 않은 조직에서의 핵산 전사체의 발현량 또는 결장암을 갖지 않는 상이한 대상체에서 예상되는 양에 비한 것이다. 또한, 차이는 결장암이 진행되지 않는 상이한 대상체로부터의 조직에 비해, 대상체(동일한 장기에서 암을 갖는)로부터의 비-암 조직에 존재할 수 있다. 차등적 발현의 검출은 유전자 또는 단백질 발현의 변화, 예를 들어, 표 1, 표 2에 열거된 하나 이상의 유전자의 발현 및/또는 표 6에 나타낸 하나 이상의 전사체의 발현의 변화의 측정을 포함할 수 있다.
ㆍ하향조절 또는 감소: 핵산 분자의 발현에 관하여 사용되는 경우, 핵산의 생성의 감소를 야기하는 임의의 과정을 말한다. 유전자 산물은 RNA(예를 들어, mRNA, rRNA, tRNA 및 구조적 RNA) 또는 단백질일 수 있다. 따라서, 유전자 하향조절 또는 불활성화는 유전자의 전사 또는 mRNA의 번역을 감소시키는 과정을 포함한다.
유전자 하향조절은 유전자 산물의 생성의 임의의 검출가능한 감소를 포함한다. 특정 예에서, 유전자 산물의 생성은 대조군(예를 들어, 유전자 발현, 예를 들어, 정상 세포 내의 정규화된 유전자 발현의 양)에 비해 적어도 1.2배, 예를 들어, 적어도 2배, 적어도 3배 또는 적어도 4배 감소된다. 일부 예에서, 대조군은 결장암을 갖지 않는 하나 이상의 대상체에서의 상대적인 유전자 발현 또는 단백질 발현의 양, 예를 들어, 임의의 알려져 있는 암을 갖지 않는 "암-부재 대상체"에서의 상대적인 유전자 발현 또는 단백질 발현의 양이다.
ㆍ엑손: 이론적으로, 메신저 RNA 산물에 나타나는 비연속 유전자의 세그먼트. 이론적으로, 용어 "인트론"은 인트론의 양측 상의 엑손을 함께 스플라이싱함으로써 전사되지만, 전사체 내로부터 제거되는 DNA의 임의의 세그먼트를 말한다. 작동가능하게, 엑손 서열은 참조 서열 번호로 정의된 바와 같은 유전자의 mRNA 서열에서 발생한다. 작동가능하게, 인트론 서열은 그들의 5' 및 3' 경계에 GT 및 AG 스플라이스 컨센서스 서열을 가지며, 엑손 서열에 의해 묶여지는 유전자의 게놈 DNA의 개재 서열이다.
ㆍ발현: 암호화된 유전자의 정보가 세포의 작동, 비-작동 또는 구조적 부분으로 전환되는 과정, 예를 들어, 핵산 또는 단백질의 합성. 유전자 발현은 외부 신호에 의해 영향을 받을 수 있다. 예를 들어, 호르몬에 대한 세포의 노출에 의해 호르몬-유도성 유전자의 발현이 자극될 수 있다. 상이한 유형의 세포가 동일한 신호에 대하여 상이하게 반응할 수 있다. 또한, 유전자의 발현은 DNA로부터, RNA, 단백질로의 경로의 어느 곳에서 조절될 수 있다. 조절은 전사, 번역, RNA 수송 및 프로세싱, 중개 분자, 예를 들어, mRNA의 분해에 대한 조절, 또는 특정 단백질 분자가 생성된 후에 그들의 활성화, 불활성화, 구획화 또는 분해를 통한 조절을 포함할 수 있다. 핵산 분자의 발현은 예를 들어, 정상(예를 들어, 비-암) 샘플에서의 발현에 비하여 변경될 수 있다. 유전자 발현의 변경, 예를 들어, 차등 발현은 (1)과 발현 (2) 저발현(underexpression); 또는 (3) 발현의 억제를 포함하나 이들에 한정되지 않는다. 핵산 분자의 발현의 변경은 해당하는 단백질의 발현의 변화와 관련이 있을 수 있으며, 사실상 이를 야기한다. "발현" 및/또는 "상대적 발현"은 발현 시그니처, 예를 들어, 결장암 발현 시그니처에서 모든 다른 전사체의 발현의 맥락에서 정의되는 임계값에 대한 특정 전사체의 정규화 후의 발현 값으로 고려될 수 있다. 주어진 시료에 대한 전반적 발현 데이터는 해당 분야의 숙련자에게 공지되어 있는 방법을 사용하여 정규화되어, 상이한 양의 출발 물질, 다양한 추출 효능 및 증폭 반응 등에 대하여 보정한다. 효율적으로 진단 또는 예후 호출(call)(예를 들어, 양호한 또는 불량한 예후)을 이루기 위하여 정규화된 데이터 상에 선형 분류자(linear classifier)를 사용하는 것은 데이터 공간, 다시 말하면, 시그니처에서 모든 유전자에 대한 발현 값의 모든 가능한 조합을 분리 평면의 수단에 의하여 해체된 2개의 절반으로 분할하는 것을 의미한다. 이러한 분할은, 예를 들어, 양호한 예후 및 불량한 예후를 갖는 환자로부터의 큰 세트의 트레이닝(training) 예에서 실험에 의해 유래된다. 일반성의 상실 없이, 하나가 아닌 모든 유전자에 대한 소정의 고정된 세트의 값을 추정할 수 있으며, 이는 이러한 남아있는 유전자에 대한 임계값을 자동적으로 정의할 것이며, 결정은 예를 들어, 양호한 예후로부터 불량한 예후로 변경될 것이다. 이어서, 이러한 역학적 임계값을 초과하는 발현 값은 양호한(음의 가중치를 갖는 유전자에 대하여) 또는 불량한(양의 가중치를 갖는 유전자에 대하여) 예후 중 어느 하나를 나타낼 것이다. 이러한 임계값의 정확한 값은 시그니처 내의 모든 다른 유전자의 실제 측정된 발현 프로파일에 좌우되나, 특정 유전자의 일반적인 표시는 고정되어 유지되며, 다시 말하면, 높은 값 또는 "상대적인 과발현"은 항상 불량한 예후 결정(양의 가중치를 갖는 유전자) 또는 양호한 예후(음의 가중치를 갖는 유전자) 결정 중 어느 하나에 기여한다. 따라서, 전체 유전자 발현 시그니처에 관하여, 상대적 발현은 특정 전사체의 상향- 또는 하향-조절 중 어느 하나가 양호한 또는 불량한 예후를 나타내는지를 표시할 수 있다.
ㆍ유전자 증폭: 다수의 카피의 유전자 또는 유전자 단편이 특정 세포 또는 세포주에서 형성되는 과정. 중복된 영역(증폭된 DNA의 스트레치(stretch))은 종종 "앰플리콘(amplicon)"으로 지칭된다. 통상, 생성되는 메신저 RNA(mRNA)의 양, 다시 말하면, 유전자 발현의 수준도 또한 발현되는 특정 유전자로 이루어진 카피수에 비례하여 증가한다.
ㆍ발현 프로파일(또는 핑거프린트(fingerprint) 또는 시그니처): 특정 병기 또는 특정 예후 결과를 특징으로 하거나 이와 관련된 유전자 발현 패턴. 유전자 발현 시그니처는 일련의 정보(informative) 유전자 또는 그의 암호화 또는 비-암호화 전사체 둘 모두에 의해 표현될 수 있다. 시그니처 내의 전사체의 발현 수준을 평가하여, 본 명세서에 제공된 방법에 제한되지 않는 예후 결정을 할 수 있다. 유전자 발현 수준을 사용하여 2가지 임상적 증상 또는 결과, 예를 들어, 진단을 위하여 정상 및 이환 조직을 구별하거나, 또는 예후 방법을 위하여 비-반응성에 비하여 반응성을 구별하고, 예측 방법을 위하여 비-재발에 비하여 재발을 구별할 수 있다. 차등 또는 변경된 유전자 발현은 검출가능한 양의 유전자 발현(예를 들어, cDNA 또는 mRNA)의 변화 또는 그들 유전자에 의해 발현되는 검출가능한 양의 단백질의 변화에 의해 검출될 수 있다. 별개의 또는 식별가능한 유전자 발현 패턴, 예를 들어, 정의된 세트의 유전자 또는 유전자-지시 핵산, 예를 들어, EST의 고발현 및 저발현 패턴 일부 예에서, 1 또는 2개만큼 적은 유전자는 프로파일을 제공하지만, 더 많은 유전자, 예를 들어, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 9개, 적어도 10개 또는 적어도 11개 등은 프로파일에 사용될 수 있다. 일부 실시형태에서, 프로파일은 약 200개 이상의 유전자(또는 "전사체") 및 약 1000개 이하의 전사체, 예를 들어, 약 400개 전사체 내지 약 800개 전사체, 또는 약 500개 전사체 내지 약 700개 전사체를 포함한다. 프로파일은 일부 실시 형태에서, 표 6에 열거된 636개 전사체를 비롯한 표 6으로부터의 전사체를 포함한다(예를 들어, 표 6으로부터의 적어도 100개, 적어도 200개, 적어도 300개, 적어도 400개, 적어도 500개 또는 적어도 600개의 전사체). 본 명세서에 사용되는 용어 "유전자"는 발현된 전사체를 말하며, 이는 특징지어진 유전자이거나, 발현된 전사체, 예를 들어, EST일 수 있다. 일부 실시형태에서, 검출 플랫폼은 마이크로어레이이며, 각 프로브는 개별 "유전자" 또는 "전사체"의 발현을 결정하는 것으로 간주된다.
유전자 발현 프로파일(핑거프린트 또는 시그니처로도 지칭)은 조직 또는 세포 유형(예를 들어, 결장 조직), 특정 정상 조직 성장 단계 또는 특정 질환 진행 단계(예를 들어, 결장암), 또는 예측가능한 방식으로 유전자 발현에 영향을 미치는 임의의 다른 별개의 또는 식별가능한 조건과 결합될 수 있다. 유전자 발현 프로파일은 특정 유전자의 상대적인 발현 수준뿐 아니라 절대적인 발현 수준을 포함할 수 있으며, 기준선 또는 대조군 샘플 프로파일(예를 들어, 결장암을 갖지 않는 대상체로부터의 샘플)에 비하여 시험 샘플에 관하여 관찰될 수 있다. 일 예에서, 대상체에서의 유전자 발현 프로파일은 어레이(예를 들어, 핵산 어레이) 상에서 판독된다.
ㆍ혼성화: 2 가닥의 DNA, RNA 또는 DNA와 RNA 사이의 상보적 영역 간에 염기쌍을 형성하여, 이에 의해, 듀플렉스(duplex) 분자, 예를 들어, 프로브와 표 6에 나타낸 임의의 핵산 서열 또는 그의 상보체 간에 형성되는 듀플레스를 형성하는 것. 특정 엄격도를 야기하는 혼성화 조건은 혼성화 방법의 성질 및 혼성화 핵산 서열의 조성 및 길이에 따라 달라질 것이다. 일반적으로, 혼성화 온도 및 혼성화 완충액의 이온 세기(예를 들어, Na+ 농도)는 혼성화의 엄격성을 결정할 것이다. 특정 엄격도에 이르기 위한 혼성화 조건에 관한 계산은 문헌[Sambrook et al.,(1989) Molecular Cloning, second edition, Cold Spring Harbor Laboratory, Plainview, NY(chapters 9 and 11)]에 논의되어 있다. 다음은 예시적인 혼성화 조건의 세트이며, 한정되지 않는다.
매우 높은 엄격성(적어도 90% 동일성을 공유하는 서열을 검출)
혼성화: 65℃에서 16시간 동안 5×SSC
2회 세정: 각각 실온(RT)에서 15분 동안 2×SSC
2회 세정: 각각 65℃에서 20분 동안 0.5×SSC
높은 엄격성(적어도 80% 동일성을 공유하는 서열을 검출)
혼성화: 65℃ 내지 70℃에서 16 내지 20시간 동안 5× 내지 6×SSC
2회 세정: 각각 실온에서 5 내지 20분 동안 2×SSC
2회 세정: 각각 55℃ 내지 70℃에서 30분 동안 1×SSC
낮은 엄격성(적어도 60% 동일성을 공유하는 서열을 검출)
혼성화: 실온 내지 55℃에서 16 내지 20시간 동안 6×SSC
적어도 2회 세정: 각각 실온 내지 55℃에서 20 내지 30분 동안 2× 내지 3×SSC.
ㆍ단리된: "단리된" 생물학적 성분(예를 들어, 핵산 분자, 단백질 또는 세포)은 유기체의 세포 내의 다른 생물학적 성분 또는 유기체 그 자체로부터 실질적으로 분리되거나 정제되며, 여기서, 성분, 예를 들어, 다른 염색체 및 염색체-외 DNA 및 RNA, 단백질 및 세포는 천연적으로 존재한다. 또한, 상기 용어는 숙주 세포 내의 재조합 발현에 의해 제조되는 핵산 분자뿐 아니라 화학적으로 합성된 핵산 분자를 포함한다. 예를 들어, 단리된 세포, 예컨대 결장암 세포는 다른 유형의 세포로부터 실질적으로 분리된 것이다.
ㆍ표지: 예를 들어, ELISA, 분광 광도법, 유세포 분석법 또는 마이크로어레이 또는 기타 광학적 기술에 의해 검출할 수 있는 제제. 예를 들어, 표지는 핵산 분자 또는 단백질에 부착되어, 핵산 분자 또는 단백질의 검출을 가능하게 할 수 있다. 예를 들어, 표적 분자, 예컨대 표적 핵산 분자에 특이적으로 결합하는 핵산 분자 또는 항체가 있다. 표지의 예에는 방사성 동위원소, 효소 기질, 보조-인자, 리간드, 화학 발광제, 형광단, 합텐, 효소 및 그들의 조합이 포함되나 이들에 한정되지 않는다. 표지화 방법 및 다양한 목적에 적절한 표지의 선택에서의 지침은 예를 들어, 문헌[Sambrook et al.(Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, New York, 1989)] 및 문헌[Ausubel et al.(In Current Protocols in Molecular Biology, John Wiley & Sons, New York, 1998)]에 논의되어 있다.
ㆍ장기간 생존: 결장암을 위한 외과술 또는 다른 치료(예를 들어, 화학요법) 후 적어도 3년, 더욱 바람직하게는 적어도 5년, 더더욱 바람직하게는 적어도 8년 동안의 무-질환 생존.
ㆍ보다 침습적인: 본 명세서에서 사용되는 "보다 침습적인" 형태의 결장암은 (예컨대, 종양의 외과술 제거 후) 전이 또는 재발이 위험이 상대적으로 증가된 결장암이다. 또한 "보다 침습적인" 결장암은 결장암 대상체에서의 사망 가능성의 증가 또는 사망까지의 시간의 감소를 부여하는 결장암을 말할 수 있다. "보다 침습적인" 형태의 결장암을 갖는 대상체는 고위험(불량한 예후)으로 간주된다.
ㆍ유전자를 대표하는 핵산 분자: 해당하는 유전자, 예를 들어, 표 1 또는 표 2에 열거된 것, 예를 들어, 표 6에 열거된 전사체에 대한 정보를 제공하는, 프로브 또는 다른 지시 분자로 사용하기에 적절한 임의의 길이의 임의의 핵산, 예를 들어 DNA(인트론 또는 엑손 또는 둘 모두), cDNA 또는 RNA(예를 들어, mRNA).
ㆍ올리고뉴클레오타이드: 제한 없이, 단일-가닥 데옥시리보뉴클레오타이드, 단일- 또는 이중-가닥 리보뉴클레오타이드, RNA:DNA 하이브리드 및 이중-가닥 DNA를 포함하는 상대적으로 짧은 폴리뉴클레오타이드. 올리고뉴클레오타이드, 예를 들어, 단일-가닥 DNA 프로브 올리고뉴클레오타이드는 종종 화학적 방법, 예를 들어, 구매가능한 자동화 올리고뉴클레오타이드 합성기를 사용하여 합성된다. 그러나, 올리고뉴클레오타이드는 시험관 내 재조합 DNA-매개의 기술을 포함하는 다양한 다른 방법 및 세포 및 유기체에서의 DNA의 발현에 의해 제조될 수 있다.
ㆍ환자: 본 명세서에 사용되는 용어 "환자"는 인간 및 비-인간 동물을 포함한다. 치료에 바람직한 환자는 인간이다. "환자" 및 "대상체"는 본 명세서에서 상호교환가능하게 사용된다.
ㆍ환자 반응: (1) 종양 성장의 어느 정도까지의 억제, 예를 들어 저속화 및 완전한 성장 정지 (2) 종양 세포의 수 감소 (3) 종양 크기의 감소 (4) 인접한 말초 장기 및/또는 조직으로의 종양 세포 침윤의 억제(즉, 감소, 저속화 또는 완전한 정지); (5) 전이의 억제(즉, 감소, 저속화 또는 완전한 정지); (6) 종양의 퇴행 또는 거부를 야기할 수 있으나 반드시 그러한 것은 아닌, 항-종양 면역 반응의 증진 (7) 종양과 관련된 하나 이상의 징후의 어느 정도까지의 경감 (8) 치료 후 생존 기간의 증가 및/또는 (9) 치료 후 주어진 시점에서의 사망률 감소를 포함하지만 이에 제한되지 않는, 환자에 대한 이익을 나타내는 임의의 종점을 이용하여 평가할 수 있다.
ㆍ폴리뉴클레오타이드: 단수 또는 복수로 사용되는 경우, 일반적으로 비변형 RNA 또는 DNA, 또는 변형 RNA 또는 DNA, 또는 심지어 이들의 조합일 수 있는 임의의 폴리리보뉴클레오타이드 또는 폴리데옥시리보뉴클레오타이드를 말한다. 따라서, 예를 들어, 본 명세서에 정의된 바와 같은 폴리뉴클레오타이드는 제한 없이, 단일- 및 이중-가닥 DNA, 단일- 및 이중-가닥 영역을 포함하는 DNA, 단일- 및 이중-가닥 RNA 및 단일- 및 이중-가닥 영역을 포함하는 RNA, 단일-가닥 또는 더욱 전형적으로 이중-가닥일 수 있는 DNA 및 RNA를 포함하거나 단일- 및 이중-가닥 영역을 포함하는 하이브리드 분자를 포함한다. 또한, 용어 "폴리뉴클레오타이드"는 하나 이상의 변형된 염기를 함유하는 DNA 및 RNA를 포함한다. 따라서, 안정성을 위해 또는 다른 이유로 변형된 백본(backbone)이 있는 DNA 또는 RNA는 그 용어가 본 명세서에서 의도되는 바와 같은 "폴리뉴클레오타이드"이다. 더욱이, 특이한 염기, 예를 들어, 이노신 또는 변형된 염기, 예를 들어, 3중수소 염기(tritiated base)를 포함하는 DNA 또는 RNA가 본 명세서에 정의된 바와 같은 용어 "폴리뉴클레오타이드" 내에 포함된다. 일반적으로, 용어 "폴리뉴클레오타이드"는 모든 화학적, 효소적 및/또는 대사적으로 변형된 형태의 비변형된 폴리뉴클레오타이드뿐 아니라, 단순 및 복합 세포를 포함하는 세포 및 바이러스의 특징적인 화학적 형태의 DNA 및 RNA를 포함한다.
ㆍ프로브 및 프라이머: 프로브는 표적 핵산(표 6에 나타낸 핵산 서열 또는 그의 상보체 중 하나)에 혼성화될 수 있는 단리된 핵산을 포함한다. 검출 가능한 표지 또는 리포터(reporter) 분자는 프로브에 부착될 수 있다. 전형적인 표지에는 방사성 동위 원소, 효소 기질, 보조-인자, 리간드, 화학 발광체 또는 형광제(fluorescent agent), 합텐 및 효소가 포함된다. 핵산 프로브 및 프라이머의 제조 및 이용 방법은 예를 들어, 문헌[Sambrook et al.(In Molecular Cloning: A Laboratory Manual, CSHL, New York, 1989)], 문헌[Ausubel et al.(ed.)(In Current Protocols in Molecular Biology, John Wiley & Sons, New York, 1998)] 및 문헌[Innis et al.(PCR Protocols, A Guide to Methods and Applications, Academic Press, Inc., San Diego, CA, 1990)]에 기재되어 있다. 표지화 방법 및 다양한 목적에 적절한 표지의 선택에서 표지화 방법은 예를 들어, 문헌[Sambrook et al.(In Molecular Cloning: A Laboratory Manual, CSHL, New York, 1989)] 및 문헌[Ausubel et al.(In Current Protocols in Molecular Biology, John Wiley & Sons, New York, 1998)]에 논의되어 있다.
프로브는 일반적으로 표적 핵산 분자에 상보적인 길이가 적어도 12개 뉴클레오타이드, 예를 들어, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 21개, 적어도 22개, 적어도 23개, 적어도 24개, 적어도 25개, 적어도 26개, 적어도 27개, 적어도 28개, 적어도 29개, 적어도 30개, 적어도 31개, 적어도 32개, 적어도 33개, 적어도 34개, 적어도 35개, 적어도 36개, 적어도 37개, 적어도 38개, 적어도 39개, 적어도 40개, 적어도 45개, 적어도 50개 이상의 인접 뉴클레오타이드, 예를 들어, 15 내지 50개 뉴클레오타이드, 20 내지 50개 뉴클레오타이드 또는 15 내지 30개 뉴클레오타이드의 프라미어이다. 일부 예에서, 프로브, 예를 들어, cDNA 프로브는 훨씬 더 길고, 이는 길이가 약 500개 내지 5000개 초과의 뉴클레오타이드일 수 있다.
프라이머는 프라이머와 표적 핵산 가닥 간에 하이브리드를 형성하는 핵산 혼성화에 의해 상보적인 표적 핵산 분자에 어닐링될 수 있는 짧은 핵산 분자, 예를 들어, 길이가 10개 이상의 뉴클레오타이드인 DNA 올리고뉴클레오타이드이다. 프라이머는 중합효소에 의해 표적 핵산 분자를 따라 연장될 수 있다. 따라서, 프라이머를 사용하여 표적 핵산 분자(예를 들어, 표 6에 나타낸 핵산 서열)를 증폭시킬 수 있다.
프라이머 및/또는 프로브의 특이성은 그의 길이와 함께 증가한다. 따라서, 예를 들어, 30개 연속 뉴클레오타이드를 포함하는 프라이머는 오직 15개 뉴클레오타이드의 상응하는 프라이머보다 더 높은 특이성으로 표적 서열에 어닐링할 것이다. 따라서, 보다 큰 특이성을 얻기 위하여, 적어도 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개 이상의 연속 뉴클레오타이드를 포함하는 프로브 및 프라이머가 선택될 수 있다. 특정 예에서, 프라이머는 길이가 적어도 15개 뉴클레오타이드, 예를 들어, 표적 핵산 분자에 상보적인 적어도 15개 인접 뉴클레오타이드이다. 본 발명의 방법을 실시하는데 사용될 수 있는 특정 길이의 프라이머는 증폭시킬 표적 핵산 분자에 상보적인 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 21개, 적어도 22개, 적어도 23개, 적어도 24개, 적어도 25개, 적어도 26개, 적어도 27개, 적어도 28개, 적어도 29개, 적어도 30개, 적어도 31개, 적어도 32개, 적어도 33개, 적어도 34개, 적어도 35개, 적어도 36개, 적어도 37개, 적어도 38개, 적어도 39개, 적어도 40개, 적어도 45개, 적어도 50개 이상의 인접 뉴클레오타이드를 갖는 프라이머, 예를 들어, 15 내지 50개 뉴클레오타이드, 20 내지 50개 뉴클레오타이드 또는 15 내지 30개 뉴클레오타이드의 프라이머를 포함한다. PCR 프라이머 설계에 고려되는 가장 중요한 인자 중 하나는 프라이머 길이, 용융 온도(Tm) 및 GC 함량, 특이성, 상보적 프라이머 서열 및 3'-말단 서열을 포함한다. 일반적으로, 최적의 PCR 프라이머는 일반적으로 길이가 17 내지 30개 염기이며, 약 20 내지 80%, 예를 들어, 약 50% 내지 60% G+C 염기를 함유한다. 50℃ 내지 80℃의 Tm, 예를 들어, 약 50℃ 내지 70℃가 전형적으로 바람직하다.
예를 들어, PCR, 리얼-타임(real-time) PCR 또는 당업계에 공지되어 있는 다른 핵산 증폭 방법에 의한 핵산 서열의 증폭을 위해 프라이머 쌍이 사용될 수 있다. "업스트림" 또는 "정방향" 프라이머는 핵산 서열 상의 참조 점에 대하여 5'인 프라이머이다. "다운스트림" 또는 "역방향" 프라이머는 핵산 서열 상의 참조 점에 대하여 3'인 프라이머이다. 일반적으로, 적어도 하나의 정방향 및 하나의 역방향 프라이머가 증폭 반응에 포함된다.
핵산 프로브 및 프라이머는 예를 들어, 그 목적을 위해 의도된 컴퓨터 프로그램, 예를 들어, 프라이머(Primer)(버전 0.5, ⓒ 1991, 미국 매사추세츠주 캠브리지 소재의 화이트헤드 생의료연구소(Whitehead Institute for Biomedical Research)) 또는 프라이머 익스프레스(PRIMER EXPRESS)(등록 상표) 소프트웨어(미국 캘리포니아주 포스터 시티 소재의 어플라이드 바이오시트템즈, 아베(Applied Biosystems, AB))를 사용함으로써 본 명세서에 제공된 핵산 분자에 기초하여 용이하게 제조될 수 있다.
PCR 프라이머 및 프로브 설계를 위한 추가의 지침은 문헌[Dieffenbach et al., General Concepts for PCR Primer Design in: PCR Primer, A Laboratory Manual, Cold Spring Harbor Laboratory Press, New York, 1995, pp. 133 155]; 문헌[Innis and Gelfand, Optimization of PCRs in: PCR Protocols, A Guide to Methods and Applications, CRC Press, London, 1994, pp. 511]; 및 문헌[Plasterer, Primerselect: Primer and probe design. Methods Mol. Biol. 70:520 527, 1997]에서 관찰될 수 있다.
ㆍ예후: 특정 질환 또는 장애를 앓고 있는 대상체에 대한 임상적 결과의 가능성. 암과 관련하여, 예후는 대상체가 (예를 들어, 1년, 2년, 3년, 4년 또는 5년 동안) 생존할 우도(가능성) 및/또는 종양이 전이할 우도(가능성)의 표현이다. 용어 "예측"은 본 명세서에서 환자가 약물 또는 일련의 약물에 유리하게 또는 유리하지 않게 반응할 우도 및 그 반응의 정도를 말한다. 본 발명의 예측적 방법을 임상적으로 사용하여, 임의의 특정 환자에 가장 적절한 치료 요법을 선택함으로써 치료 결정을 할 수 있다. 본 발명의 예측적 방법은 환자가 치료 요법, 예를 들어, 외과적 개입, 주어진 약물 또는 약물 조합과의 화학요법 및/또는 방사성 요법에 유리하게 반응할 것 같은지를 예측하는데 있어서 가치있는 도구이다.
ㆍ정제된: 용어 "정제된"은 절대 순도를 요구하지 않으며 오히려, 상대적 용어로 의도된다. 따라서, 예를 들어, 정제된 올리고뉴클레오타이드 제제는 올리고뉴클레오타이드가 올리고뉴클레오타이드의 복합 혼합물을 포함하는 환경에서보다는 더욱 순수한 것이다.
ㆍ 샘플: 대상체로부터 수득되는 게놈 DNA, RNA(mRNA 및 마이크로RNA를 포함), 단백질 또는 그들의 조합을 함유하는 생물학적 시료. 예에는 혈액, 소변, 타액, 조직 생검, 흡인물(aspirate), 외과적 시료 및 부검 물질이 포함되나 이들에 한정되지 않으며, 고정된 및/또는 파라핀 포매된 샘플을 포함한다. 일 예에서, 샘플은 (공지되어 있는 질환 또는 장애로 고통받지 않는 대상체, 예를 들어, 비-암 대상체로부터의)결장의 생검(예를 들어, 결정암 종양), 비암 조직의 샘플 또는 정상 조직의 샘플을 포함한다.
ㆍ서열 동일성/유사성: 둘 이상의 핵산 서열 또는 둘 이상의 아미노산 서열 사이의 동일성/유사성은 서열 간의 동일성 또는 유사성의 견지에서 표현된다. 서열 동일성은 동일성 백분율의 견지에서 측정될 수 있으며 백분율이 높을수록 서열이 더 많이 동일하다. 서열 유사성은 유사성 백분율의 견지에서 측정될 수 있으며(보존적 아미노산 치환을 설명하는); 백분율이 높을수록 서열이 더 유사하다.
비교를 위한 정렬 방법이 당업계에 잘 알려져 있다. 다양한 프로그램 및 정렬 알고리듬이 문헌[Smith & Waterman, Adv. Appl. Math. 2:482, 1981]; 문헌 [Needleman & Wunsch, J. Mol. Biol. 48:443, 1970]; 문헌[Pearson & Lipman, Proc. Natl. Acad. Sci. USA 85:2444, 1988]; 문헌[Higgins & Sharp, Gene, 73:237-44, 1988]; 문헌[Higgins & Sharp, CABIOS 5:151-3, 1989]; 문헌[Corpet et al., Nuc. Acids Res. 16:10881-90, 1988]; 문헌[Huang et al. Computer Appls. in the Biosciences 8, 155-65, 1992]; 및 문헌[Pearson et al., Meth. Mol. Bio. 24:307-31, 1994. Altschul et al., J. Mol. Biol. 215:403-10, 1990]에서 개시되어 있으며, 서열 정렬 방법 및 상동성 측정에 대해 상세하게 다루고 있다.
NCBI 기본 국소 정렬 검색 도구(Basic Local Alignment Search Tool)(BLAST)(문헌[Altschul et al., J. Mol. Biol. 215:403-10, 1990])는 국립 생명공학 센터(National Center for Biotechnology)(NCBI, 미국 메릴랜드주 20894 베테스다 소재의 룸 8N805, 빌딩 38A, 국립 의학 도서관)를 포함한 인터넷에서 서열 분석 프로그램 blastp, blastn, blastx, tblastn 및 tblastx와 연계하여 사용하기 위한 몇몇 공급처로부터 이용가능하다. 추가적인 정보는 NCBI 웹 사이트에서 찾을 수 있다.
BLASTP가 아미노산 서열을 비교하기 위해 이용되는 반면, BLASTN은 핵산 서열을 비교하기 위해 이용된다. 만약 2개의 비교 서열이 상동성을 공유하지 않는다면, 지정된 결과 파일은 정렬된 서열로서 상동성의 영역을 제시하지 않을 것이다. 2개의 비교 서열이 상동성을 공유하지 않는다면, 지정된 출력 파일은 정렬된 서열을 제시하지 않을 것이다.
일단 정렬되면, 동일한 뉴클레오타이드 또는 아미노산 잔기가 양 서열에 존재하는 위치의 개수를 계수함으로써 매치 개수가 결정된다. 서열 동일성 백분율은 매치 개수를 동정된 서열에 기재된 서열 길이 또는 연결된 길이(예를 들어, 동정된 서열에 기재된 서열로부터의 100개의 연속적인 뉴클레오타이드나 아미노산 잔기)로 나누고, 결과 값에 100을 곱해서 결정된다. 예를 들면, 1554개 뉴클레오타이드를 갖는 시험트 서열과 정렬되는 경우, 1166개의 매치를 갖는 핵산 서열은 시험 서열에 대해 75.0% 동일하다(1166÷1554*100=75.0). 서열 동일성 백분율 수치는 가장 가까운 1/10으로 반올림된다. 예를 들어, 75.11, 75.12, 75.13 및 75.14는 75.1이 되고, 75.15, 75.16, 75.17, 75.18 및 75.19는 75.2가 된다. 길이 값은 항상 정수일 것이다. 길이 값은 항상 정수일 것이다. 다른 예에서, 후술되는 동정된 서열로부터의 20개 연속 뉴클레오타이드와 정렬되는 20-뉴클레오타이드 영역을 함유하는 표적 서열은 동정된 서열에 대하여 75%의 서열 동일성을 공유하는 영역을 함유한다(다시 말하면, 15÷20*100=75).
2가지 핵산 분자가 밀접하게 관련되어 있다는 하나의 지시는 2가지 분자가 상술된 바와 같이, 엄격한 조건 하에서 서로 혼성화된다는 것이다. 높은 정도의 동일성을 보이지 않는 핵산 서열은 그럼에도 불구하고 유전 코드의 축퇴성 때문에 동일하거나 유사한(보존적) 아미노산 서열을 암호화할 수 있다. 핵산 서열에서의 변화는 모두가 실질적으로 동일한 단백질을 암호화하는 다수의 핵산 분자를 생성하기 위해 이러한 축퇴성을 이용하여 만들어질 수 있다. 예를 들면, 그러한 상동성 핵산 서열은 이러한 방법에 의해 결정된 표 6에 열거된 분자에 대하여 적어도 약 60%, 70%, 80%, 90%, 95%, 98% 또는 99% 서열 동일성을 가질 수 있다.
당업자는 이들 서열 동일성 범위는 단지 지침을 위해 제공되는 것이고, 제공된 범위가 아니더라도 상당히 유의미한 상동체를 얻을 수 있다는 것을 이해할 것이다.
ㆍ스플라이싱 또는 RNA 스플라이싱: 인트론을 제거하고 엑손을 연결하여, 진핵 세포의 세포질로 이동하는 연속 암호화 서열이 있는 성숙 mRNA를 생성하는 RNA 프로세싱.
ㆍ 전사체 또는 유전자 산물: 그의 상응하는 DNA 또는 cDNA 주형으로부터의 전사의 과정을 통하여 생성되거나 유래된 RNA 분자. 전사체는 단백질로 번역되지 않는 넓은 범위의 기타 전사체, 예를 들어, 소형 핵 RNA(snRNA), 안티센스 분자, 예를 들어, 짧은 간섭 RNA(siRNA) 및 마이크로RNA(miRNA) 및 알려지지 않은 기능의 기타 RNA 전사체에 더하여, 암호화 및 비-암호화 RNA 분자, 예를 들어, 비제한적으로 메신저 RNA(mRNA), 대안적으로 스플라이싱된 mRNA, 리보솜 RNA(rRNA), 트랜스퍼(transfer) RNA(tRNA)를 포함한다. 일부 실시형태에서, 전사체는 표 6에 나타낸 핵산 서열이다.
ㆍ치료적: 진단 및 치료 둘 모두를 포함하는 일반 용어.
ㆍ치료: 치료적 치료 및 예방적 또는 방지적 조치 모두를 포함하고, 그 목적은 표적화된 병리학적 증상 또는 장애를 예방하거나 늦추는(줄이는) 것이다. 치료를 필요로 하는 대상체에는 이미 장애가 있는 대상체뿐 아니라 장애를 갖기 쉬운 대상체 또는 장애가 예방되어야 하는 대상체가 포함된다. 종양(예를 들어, 암) 치료에서, 치료, 예를 들어, 외과술, 화학요법 또는 방사성요법은 직접적으로 종양 세포의 병적 측면을 감소시키거나, 종양 세포가 추가의 치료에 민감하게 할 수 있다.
ㆍ종양, 신생물(neoplasia), 악성 종양 또는 암: 악성이든지 양성이든지, 신생물 세포 성장 및 증식, 및 모든 전암성 및 암성 세포 및 조직, 및 세포의 비정상 및 비조절된 성장의 결과이다. 용어 "암" 및 "암성"은 통상 비조절된 세포 성장을 특징으로 하는 포유류에서의 생리학적 증상을 지칭하거나 이를 말한다. 신생물, 악성 종양, 암 및 종양은 종종 상호교환가능하게 사용되며, 과도한 세포 분열로부터 야기되는 조직 또는 세포의 비정상적 성장을 지칭한다. 개체에서의 종양의 양은 "종양 부하(tumor burden)"이며, 이는 종양의 개수, 부피 또는 중량으로 측정될 수 있다. 전이되지 않는 종양은 "양성"으로 지칭된다. 주변 조직을 침습하고/거나 전이될 수 있는 종양은 "악성"으로 지칭된다. "비-암성 조직"은 악성 신생물이 형성되나 신생물의 특징적인 병적 측면을 갖지 않는 동일한 장기로부터의 조직이다. 일반적으로, 비암성 조직은 조직학적으로 정상인 것으로 보인다. "정상 조직"은 장기의 암 또는 다른 질환 또는 장애에 의해 영향을 받지 않는 장기로부터의 조직이다. "암-부재" 대상체는 그 장기가 암으로 진단되지 않고, 검출가능한 암을 갖지 않는다.
암의 "병적 측면"은 환자의 안녕을 위태롭게 하는 모든 현상을 포함한다. 이것은 비제한적으로, 비정상적 또는 조절 불가능한 세포 성장, 전이, 인접 세포의 정상 기능의 방해, 사이토카인 또는 다른 분비 생성물의 비정상적 수준의 방출, 염증성 또는 면역학적 반응의 억제 또는 악화, 신생물, 전암 상태, 악성종양, 주변의 또는 먼 조직 또는 장기, 예를 들면 림프절 등의 침윤을 포함한다.
ㆍ종양-결절-전이(TNM): 악성 종양의 TNM 분류는 환자의 체 내에서 암의 크기를 기재하기 위한 암 병기 시스템이다. T는 원발성 종양이 인근의 조직을 침습하는지 여부를 말하며 N은 포함되는 임의의 림프절을 말하며 M은 전이를 말한다. TNM은 암이 퍼진 정도를 분류하기 위한 하나의 전세계적으로 인식되는 표준에 대한 합의를 달성하기 위하여 국제암연합(International Union Against Cancer)에 의해 개발되고 유지된다.
ㆍ상향조절 또는 활성화: 핵산 분자의 발현을 참조하여 사용되는 경우, 유전자 산물의 생성의 증가를 야기하는 임의의 과정을 말한다. 유전자 산물은 RNA(예를 들어, mRNA, rRNA, tRNA 및 구조적 RNA) 또는 단백질일 수 있다. 이에 따라, 유전자 상향조절 또는 활성화는 유전자의 전사 또는 mRNA, 예를 들어, 염증 유전자의 번역을 증가시키는 과정을 포함한다.
전사를 증가시키는 과정의 예에는 전사 개시 복합체의 형성을 촉진시키는 과정, 전사 연장 속도를 증가시키는 과정, 전사의 진행성을 증가시키는 과정 및 전사 억제(예를 들어, 전사 억제제의 결합의 차단에 의한)를 완화시키는 과정이 포함된다. 유전자 상향조절은 억제의 저해뿐 아니라, 기존 수준 초과의 발현의 자극을 포함할 수 있다. 번역을 증가시키는 과정의 예에는 번역 개시를 증가시키는 과정, 번역 연장을 증가시키는 과정 및 mRNA 안정성을 증가시키는 과정이 포함된다.
유전자 상향조절은 유전자 산물, 예를 들어, 염증 유전자의 생성의 임의의 검출 가능한 증가를 포함한다. 특정 예에서, 유전자 산물의 생성은 대조군에 비해 적어도 1.2배, 예를 들어, 적어도 2배, 적어도 3배, 적어도 4배, 적어도 5배, 적어도 8배, 적어도 10배 또는 적어도 15배 증가한다(예를 들어, 정상 세포에서의 유전자 발현 및/또는 정규화된 유전자 발현의 양).
ㆍ가중치: 본 명세서에 개시된 유전자 시그니처에 관하여, 통계적 계산에서 항목의 상대적 중요성, 예를 들어, 표 6의 전사체의 상대적 중요성을 말한다. 유전자 발현 시그니처에서 각 전사체의 가중치는 당업계에 공지되어 있는 분석 방법을 사용하여 환자 샘플의 데이터 세트에서 결정될 수 있다. 예시적인 절차는 후술된다.
본 발명의 실시 또는 시험에 적절한 방법 및 재료가 후술된다. 이러한 방법 및 재료는 단지 예시적인 것이며, 제한하는 것으로 의도되지 않는다. 본 명세서에 기재된 것과 유사하거나 동등한 방법 및 재료가 사용될 수 있다. 예를 들어, 본 발명이 속하는 분야에 널리 공지되어 있는 통상의 방법은 예를 들어 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, 1989]; 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual, 3d ed., Cold Spring Harbor Press, 2001]; 문헌[Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Associates, 1992(and Supplements to 2000)]; 문헌[Ausubel et al., Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, 4th ed., Wiley & Sons, 1999]; 문헌[Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1990]; 문헌[Harlow and Lane, Using Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1999 Oligonucleotide Synthesis,(M. J. Gait, ed., 1984)]; 문헌[Animal Cell Culture, Freshney, ed., 1987]; 문헌[Methods in Enzymology, Academic Press, Inc.)]; 문헌[Handbook of Experimental Immunology, 4.sup.th ed., D. M. Weir & C. C. Blackwell, eds., Blackwell Science Inc., 1987]; 문헌[Gene Transfer Vectors for Mammalian Cells, J. M. Miller & M. P. Calos, eds., 1987)]; 및 문헌[PCR: The Polymerase Chain Reaction, Mullis et al., eds., 1994]을 포함하는 다양한 일반적이며 더욱 구체적인 참고문헌에서 기재된다. 또한, 재료, 방법 및 예는 오직 예시적인 것이며, 제한되는 것으로 의도되지 않는다.
II. 일부 실시 형태의 기재
A. 결장암 발현 시그니처 및 이용 방법
결장암으로부터의 발현 시그니처가 본 명세서에 개시된다. 개시된 시그니처는 결장암의 예후, 결장암의 진단 및 환자 그룹의 분류에서의 응용에 사용될 수 있다. 일부 실시 형태에서, 대상체, 예를 들어, 환자로부터 수득되는 샘플은 조직 샘플에서 발현되는 전사체를 나타내는 일련의 폴리뉴클레오타이드 결합 표적으로 처리된다. 폴리뉴클레오타이드 결합 표적은 본 명세서에 기재된 시그니처를 나타내거나 이에 해당하는 상보적 폴리뉴클레오타이드 프로브로 조사하여, 전사체의 발현 수준에 대한 정보를 수득한다. 시그니처에서 전사체의 발현 수준을 나타내는 결정 점수가 임의로 계산된다. 이어서, 결정 점수를 대조군, 예를 들어, 환자 집단과 비교하며, 유전적으로 유사한 샘플은 공지되어 있는 환자 반응 또는 임상적 결과와 상호 관련된다. 예를 들어, 결장암을 위한 치료, 예를 들어, 외과적 절제술 및/또는 화학요법 후에 그에 대한 환자 반응 및 예후를 예측하기 위한 감수성 방법도 또한 제공된다. 일반적으로, 조직학적 환자 집단 데이터 및 조직 샘플을 분석하여, 결장암의 과거 병력을 갖는 환자에 대한 유전자 프로파일을 생성한다. 일부 실시 형태에서, 환자 샘플의 유전자 프로파일이 결정 점수로 전환된다. 각 환자의 임상적 결과는 각 환자의 개별 암에 대한 유전자 프로파일로부터 수학적으로 유래된 유전자 프로파일 또는 결정 점수와 상호 관련된다.
일부 실시 형태에서, 조직학적 환자 데이터를 사용하여 수학적 알고리듬이 생성되며, 결장암이 있는 새로운 환자를 위한 예측 방법에 적용된다. 일부 실시 형태에서, 알고리듬은 선택 기준, 예를 들어, 환자 결과, 치료법에 대한 반응 및 재발 등에 따라 2개의 그룹의 환자를 분리하는 임계값을 생성한다. 일부 예에서, 수학적 알고리듬 또는 임계값이 본 명세서에 기재된 예측 방법에 사용되기 전에 추가의 조직학적 환자 집단 데이터를 사용하여 입증된다. 이어서, 수학적 알고리듬 또는 임계값을 참고, 예를 들어, 대조군으로서 사용되어, 결장암의 예측 방법을 원하는 환자의 유전자 프로파일링으로부터 유래된 결정 점수를 비교할 수 있다. 일부 실시 형태에서, 이들 결과는 단독의 또는 결장암의 치료를 위한 보조 화학요법과 병용한 외과술의 효능의 게놈 증거의 평가를 가능하게 한다.
본 명세서에 기재된 시그니처는 2가지 진단 또는 예후 결과를 식별하는데 유의미하고 이를 식별할 수 있다. 본 발명의 중요한 태양은 환자를 가장 적절한 치료와 매치시키고, 예후 정보를 제공하기 위하여, 결장암 조직에서 특정 유전자의 측정된 발현을 사용하는 것이다.
일부 실시 형태에서, 대장암-집중 마이크로어레이 연구 도구를 사용하여 시그니처가 개발된다. 특정 실시 형태에서, 이러한 연구 도구는 정확한 발현 데이터를 전달할 수 있는 알맥 디아그노스틱스, 리미티드(Almac Diagnostics, Ltd.)(북 아일랜드 소재의 알맥 디아그노스틱스, 리미티드)에 의해 개발된 대장암 트랜스크립톰-집중 연구 어레이이다.
대장암 DSA(Colorectal Cancer DSA)(상표명) 연구 도구는 61,528개의 프로브 세트를 함유하며, 결장암 및 정상 조직에서 발현되는 것으로 확인된 52,306개의 전사체를 암호화한다. BLAST 분석을 사용하여 미국 국가 생물공학 센터(National Center for Biotechnology Information) 인간 참고 서열(RefSeq) RNA 데이터베이스(월드와이드웹(ncbi.nlm.nih.gov/RefSeq/)에서 이용 가능함)에 대하여 대장암 DSA(상표명) 연구 도구를 비교하여, 21,968개(42%) 전사체가 존재하며, 26,676개 (51%)의 전사체가 인간 참조서열(RefSeq) 데이터베이스로부터 부재였다. 추가로, 내용물의 7%는 주석을 단 유전자에 대한 발현된 안티센스 전사체를 나타낸다(문헌[Johnston et al., J. Clin. Oncol. 24: 3519, 2006]; 문헌[Pruitt et al., Nucleic Acids Research 33: D501-D504, 2005]). 또한, 선두적인 범용 검정법으로 비교되는 대장암 DSA(상표명)의 프로브-수준 분석에 의해, 대략 20,000개(40%)의 전사체가 선두적인 범용 플랫폼(아피메트릭스(Affymetrix)) 상에 포함되지 않으며, 대장암 DSA(상표명)에 독특한 것이 강조된다. 따라서, 대장암 DSA(상표명) 연구 도구는 지금까지 수행된 유전자 발현 연구에서 입수할 수 없는 전사체를 포함한다.
일부 실시 형태에서, 유전자 발현 시그니처에서의 전사체의 발현은 대상 증상 간에 발현 수준이 증가되거나 감소된다면, 유익한 것으로 고려된다. 유전자 발현의 증가 또는 감소는 배수 변화, t-검정, F-검정, 윌콕슨(Wilcoxon) 순위-합계 검정, ANOVA(문헌[Cui et al., Genome Biology 4:210, 2003]) 또는 마이크로어레이의 유의성 검정과 같은 차등 발현을 검출하기 위한 전용의 방법(문헌[Tusher et al., Proc. Natl. Acad. Sci. USA 98:5116-21, 2001]) 또는 LIMMA(문헌[Smyth, Stat. Appl. Genet. Mol. Biol., 3:Art.3, 2004])를 사용하는 것을 포함하나 이들에 한정되지 않는 당업자에게 공지되어 있는 방법에 의해 평가될 수 있다.
일부 실시 형태에서, 시그니처에서의 전사체를 사용하여 그들의 신호의 가중총량을 형성하며, 여기서, 개별 가중치는 양성이거나 음성일 수 있다. 생성된 총량(결정적인 기능)은 사전-결정된 참조 점과 비교한다. 참조 점과의 비교를 사용하여, 임상 증상 또는 결과를 진단하거나 예측할 수 있다.
당업자는 표 1, 표 2 및/또는 표 6에 제공된 시그니처에 포함되는 전사체가 결장암의 진단 또는 예후를 위한 시그니처에서 동등하지 않은 가중치를 지닐 것임을 인식할 것이다. 따라서, 1개만큼 적은 서열을 사용하여, 결과를 진단하거나 예측할 수 있는 한편, 특이성 및 민감성 또는 진단 또는 예측 정확성은 더 많은 서열을 사용하여 증가될 수 있다. 표 6에는 교차-검증 하에서 측정되는 화합물 결정 점수 함수에서의 평균 가중치의 순위로 정의되는, 시그니처에서의 가중치의 감소 순서로 전사체가 평가된다. 또한, 가중치 순위는 첨부된 서열 목록에서 서열 번호에 해당하며, 이에 따라 가장 큰 가중치를 갖는 전사체는 서열 번호 1이다.
일부 실시 형태에서, 시그니처는 교차-검증 하에서 측정된 화합물 결정 점수 함수에서의 평균 가중치의 순위로 정의되며, 여전히 예후 값을 갖는 가장 큰 가중치를 지니는 표 6에서의 적어도 2개, 예를 들어, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 125개, 적어도 150개, 적어도 175개, 적어도 200개, 적어도 225개, 적어도 250개, 적어도 275개, 적어도 300개, 적어도 325개, 적어도 350개, 적어도 375개, 적어도 400개, 적어도 425개, 적어도 450개, 적어도 475개, 적어도 500개, 적어도 525개, 적어도 550개, 적어도 575개, 적어도 600개, 적어도 634개 또는 심지어 모든 636개의 전사체를 포함한다. 일부 실시형태에서, 시그니처는 표 6에 열거된 가장 높은 10개의 가중 전사체, 두 번째로 가장 높은 10개의 가중 전사체, 세 번째로 가장 높은 10개의 가중 전사체, 네 번째로 가장 높은 10개의 가중 전사체, 다섯 번째로 가장 높은 10개의 가중 전사체, 여섯 번째로 가장 높은 10개의 가중 전사체, 일곱 번째로 가장 높은 10개의 가중 전사체, 여덟 번째로 가장 높은 10개의 가중 전사체, 아홉 번째로 가장 높은 10개의 가중 전사체 또는 열 번째로 가장 높은 10개의 가중 전사체를 포함한다. 추가의 실시 형태에서, 시그니처는 표 6에 열거된 가장 큰 가중치를 갖는 636, 634, 620, 610, 600, 590, 580, 570, 560, 550, 540, 530, 520, 510, 500, 490, 480, 470, 460, 450, 440, 430, 420, 410, 400, 390, 380, 370, 360, 350, 340, 330, 320, 310, 300, 290, 280, 270, 260, 250, 240, 230, 220, 210, 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 20 또는 10개의 전사체를 포함한다. 일부 실시 형태에서, 시그니처는 상술된 바와 같은 표 6으로부터의 것(예를 들어, 표 6으로부터의 적어도 약 50개, 적어도 약 100개, 적어도 약 200개, 적어도 약 300개, 적어도 약 400개, 적어도 약 500개, 또는 적어도 약 600개 또는 모든 전사체)을 포함하는 약 200 내지 약 1000개의 전사체, 예를 들어, 약 400 내지 약 800개의 전사체, 예를 들어, 약 500 내지 약 700개의 전사체, 또는 일부 실시형태에서, 약 550 내지 약 650개의 전사체의 발현 수준에 기초한다.
일 실시 형태에서, 특이적 시그니처가 MUM1 및 SIGMAR1에 대한 전사체를 포함하는 본 명세서에 개시된 방법을 위해 사용될 수 있다. 다른 실시 형태에서, 시그니처는 MUM1, SIGMAR1, ARSD, SULT1C2 및 PPFIBP1에 대한 전사체를 포함하는 본 명세서에 개시된 방법을 위해 사용될 수 있다. 또 다른 실시형태에서, 시그니처는 ARSD, CXCL9, PCLO, SLC2A3, FCGBP, SLC2A14, SLC2A3, BCL9L에 대한 전사체, 및 MUC3A, OLFM4 및 RNF39의 안티센스 서열을 포함하는 본 명세서에 개시된 방법을 위해 사용될 수 있다. 이러한 시그니처는 하기의 표 1에 나타나 있다.
[표 1]
일부 실시 형태에서, 시그니처의 성능에 대한 각 636개의 프로브세트의 기여를 결정하기 위한 개별 연구를 통해 동정된 결장암 시그니처에서의 유전자 전사체의 핵심 세트가 제공된다. 이러한 실시형태에서, 636개 프로브 세트 시그니처로부터의 10개 프로브 세트를 제거하고, 새로운 시그니처를 트레이닝 데이터 세트를 사용하여, 636개 프로브 세트에 기초하여 생성하였다. 이어서, 새로운 시그니처를 사용하여, 검증 데이터 세트를 예측하고(임계값 없이), AUC를 측정하였다. 636개 프로브 세트 시그니처로부터의 AUC의 차이를 기록하였다. 이러한 과정을 50만 번 반복하고, 상기 프로브 세트가 결여된 시그니처에 대하여 발생된 AUC의 평균 차이를 기록하였다. 가장 큰 음의 ΔAUC를 갖는 프로브 세트는 표 1에 보고되어 있다. 이러한 실시 형태에서, 이러한 10개 전사체의 세트는 시그니처에 부재인 유전자의 후보 핵심 세트가 시그니처의 예측 성능을 유의미하게 손상시키는 것을 나타낸다. 따라서, 특정 실시 형태에서, 표 1의 유전자를 나타내는 전사체가 결장암 시그니처에 포함된다. 표 1에서, DAUC는 이러한 전사체가 시그니처로부터 생략된다면 검증 AUC의 강하를 나타낸다. 배향은 결장 조직에서 발현되는 전사체의 배향을 기재한다. 이러한 시그니처에서 3개의 전사체는 MUC3A, OLFM4 및 RNF39의 안티센스 전사체로 발현된다.
일부 실시 형태에서, 시그니처는 ARSD, CXCL9, PCLO, SLC2A3, FCGBP, SLC2A14, SLC2A3, BCL9L, MUC3A, OLFM4 및 RNF39를 포함하는 표 6으로부터의 626 내지 636개의 전사체의 조합을 포함한다. 또 다른 실시 형태에서, 시그니처는 ARSD, CXCL9, PCLO, SLC2A3, FCGBP, SLC2A14, SLC2A3, BCL9L, MUC3A, OLFM4 및 RNF39를 포함하는 표 6에 열거된 전사체 10 내지 636, 10 내지 50, 50 내지 636, 100 내지 636개를 포함하며, 전사체 배향은 표 6에 나타나 있다.
명백하게 176개 전사체는 프로브-수준 분석에 의해 선두적인 포괄적인 어레이에 의해 나타나지 않는 것으로 동정되었다(다시 말하면, 그들은 상술된 대장암 DSA(상표명)에 대해 "독특하다"). 표 2에 열거된 176개 전사체의 이러한 그룹은 본 명세서에서 결장암 시그니처 및 이용 방법에 독특한 전사체로 본 명세서에 기재되어 있다. 프로브-서열-수준 상동성 검색에 의해, 이들 전사체가 선두적인 포괄적인 어레이(아피메트릭스(Affymetrix))에 함유되지 않는 것으로 확인되었다(다시 말하면, 그들은 상술된 대장암 DSA(상표명) 연구 도구에 "독특하다"). 수많은 이들 전사체는 이전에 발현되는 것으로 보고되지 않은 안티센스 전사체이다. 이들 176개 전사체는 하기 표 2에 제시되어 있으며, 여기서, 가중치 순위가 표 6에 나타낸 범위에 해당한다. 이들 독특한 전사체의 서열은 표 6에서 찾을 수 있다.
[표 2]
일부 실시 형태에서, 시그니처는 표 2에 열거된 적어도 2개, 예를 들어 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 125개, 적어도 150개, 또는 모든 176개의 전사체, 예를 들어, 교차-검증 하에 측정되는 화합물 결정 점수 함수에서 평균 가중치의 순위로 정의되는 가장 큰 가중치를 지니며, 여전히 예후 값을 갖는 것들을 포함한다. 일부 실시 형태에서, 시그니처는 표 2에 열거된 가장 높은 10개의 가중 전사체, 두 번째로 가장 높은 10개의 가중 전사체, 세 번째로 가장 높은 10개의 가중 전사체, 네 번째로 가장 높은 10개의 가중 전사체, 다섯 번째로 가장 높은 10개의 가중 전사체, 여섯 번째로 가장 높은 10개의 가중 전사체, 일곱 번째로 가장 높은 10개의 가중 전사체, 여덟 번째로 가장 높은 10개의 가중 전사체, 아홉 번째로 가장 높은 10개의 가중 전사체 또는 열 번째로 가장 높은 10개의 가중 전사체를 포함한다. 추가의 실시 형태에서, 시그니처는 표 2에 열거된 가장 큰 가중치를 갖는 176, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 20 또는 10 개의 전사체를 포함한다. 추가의 실시형태에서, 시그니처는 표 2에 열거된 가장 큰 가중치를 갖는 전사체를 포함한다.
일부 실시 형태에서, 본 명세서에 기재된 방법은 환자로부터 단리된 RNA를 유전자 발현 프로파일링으로 처리하는 단계를 포함한다. 따라서, 유전자 발현 프로파일은 일부 예에서 후술하는 바와 같이 정규화되는 표 6에 열거된 전사체 중 적어도 2개를 포함하는 유전자의 세트에 대하여 완료될 수 있다. 본 명세서에 개시된 방법의 특정 실시 형태에서, 표 6의 적어도 2개, 예를 들어, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 125개, 적어도 150개, 적어도 175개, 적어도 200개, 적어도 225개, 적어도 250개, 적어도 275개, 적어도 300개, 적어도 325개, 적어도 350개, 적어도 375개, 적어도 400개, 적어도 425개, 적어도 450개, 적어도 474개, 적어도 500개, 적어도 525개, 적어도 550개, 적어도 575개, 적어도 600개, 적어도 634개, 또는 심지어 모든 636개의 전사체, 예를 들어, 교차-검증 하에서 측정되는 화합물 결정 점수 함수에서 평균 가중치의 순위로 정의되는 가장 큰 가중치를 지니며 여전히 예후 값을 갖는 표 6의 전사체 또는 그들의 발현 산물 및/또는 상보체의 발현 수준이 결정된다. 이러한 방법의 일부 실시 형태에서, 본 명세서에 개시된 방법의 특정 실시 형태에서, 표 2의 적어도 2개, 예를 들어, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 125개, 적어도 150개, 또는 심지어 모든 적어도 176개의 전사체, 또는 그들의 발현 산물 및/또는 상보체, 예를 들어, 교차-검증 하에서 측정되는 화합물 결정 점수 함수에서 평균 가중치의 순위로 정의되는 가장 큰 가중치를 지니며 여전히 예후 값을 갖는 것들의 발현 수준이 결정된다. 본 명세서에 기재된 방법에서, 전사체의 조합은 시그니처 또는 발현 시그니처로 지칭될 수 있다.
결장 조직에서 전사체의 상대적 발현 수준을 측정하여, 유전자 발현 프로파일을 형성한다. 일 실시형태에서, 환자 조직 샘플로부터의 전사체의 세트의 유전자 발현 프로파일은 화합물 결정 점수의 형태로, 대조군 임계값와 비교하여 요약되어 있으며, 이러한 임계값에 의해 환자 데이터의 트레이닝 세트로부터 수학적으로 유도된다. 임계값에 의해 양호한/불량한 예후, 치료에 대한 반응성/비-반응성, 암 검출/진단 및 암 분류와 같으나 이에 한정되지 않는 상이한 특징에 기초하여 환자 그룹이 분류된다. 환자 트레이닝 세트 데이터는 바람직하게는 예후, 재발 가능성 또는 장기간 생존, 진단, 암 분류, 맞춤화된 유전체학 프로파일, 임상 결과, 치료 반응을 특징으로 하는 결장 조직 샘플로부터 유래된다. 환자 샘플로부터의 발현 프로파일 및 해당하는 결정 점수는 수학적으로 유도된 결정 임계값의 샘플 측 상에 있는 트레이닝 세트 내의 환자 샘플의 특징과 상호 관련될 수 있다. 이러한 실시형태에서, 선형 분류 화합물 결정 점수의 임계값을 최적화시켜, 트레이닝 데이터 세트 내에서 적용되는 교차-검증 하에서 감수성 및 특이성의 합을 최대화시켰다. 이들 방법은 또한 결장암, 특정 실시 형태에서, II기 결장암 환자의 예후를 결정하는데 유용하다. 일부 예에서, 개시된 방법은 불량한 임상 결과를 예측하는 것이며, 이는 예를 들어, 암의 외과적 제거 후에, 또는 보조 화학요법과 병용한 암의 외과적 제거 후에, 단축된 생존 또는 증가된 암 재발 위험과 관련하여 측정될 수 있다.
대상체로부터 수득되는 샘플에서 결장암을 진단하는 방법이 제공된다. 이러한 방법은 대상체로부터 수득되는 핵산을 포함하는 샘플 중의 표 6에 열거된 적어도 2개의 결장암 관련 핵산 분자의 발현 수준을 검출하는 단계 및 적어도 2개의 결장암 관련 핵산 분자의 발현 수준 또는 그들로부터 유도된 결정 점수를 결장암의 진단을 나타내는 대조군 임계값와 비교하는 단계를 포함하며, 여기서, 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도된 결정 점수는 결장암의 진단을 나타낸다. 일부 예에서, 대조군 임계값은 알려져 있는 결장암 샘플(들)에서 표 6에 열거된 결장암 관련 핵산 분자로부터의 해당하는 전사체로부터 유도되는 임계값이다.
결장암 샘플을 분류하는 방법이 제공된다. 이러한 방법은 대상체로부터 수득되는 핵산을 포함하는 샘플 중의 표 6에 열거된 적어도 2개의 결장암 관련 핵산 분자의 발현 수준을 검출하는 단계 및 적어도 2개의 결장암 관련 핵산 분자의 발현 수준 또는 그들로부터 유도된 결정 점수를 결장암의 진단을 나타내는 대조군 임계값와 비교하는 단계를 포함하며, 여기서, 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도된 결정 점수는 결장암 시료의 분류를 가능하게 한다. 일부 예에서, 대조군 임계값은 공지되어 있는 분류의 결장암 샘플(들)에서의 표 6에 열거된 결장암-관련 핵산 분자로부터의 해당하는 전사체로부터 유도되는 임계값이다. 일부 예에서, 결장암 시료는 I기, II기, III기 및 IV기로 분류된다. 일부 예에서, 상기 방법은 분류된 결장암에 효율적일 치료 계획, 예를 들어, 외과적 절제술, 화학요법, 방사선 또는 이들의 임의의 조합을 선택하는 단계를 추가로 포함한다.
결장암, 예를 들어, II기 결장암 대상체를 위한 치료에 대한 반응을 예측하는 방법이 제공된다. 이러한 방법은 대상체로부터 수득되는 핵산을 포함하는 시료 중의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계 및 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유도되는 결정 점수를 치료에 대한 공지되어 있는 반응을 나타내는 대조군 임계값와 비교하는 단계를 포함하며, 여기서, 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도되는 결정 점수는 치료에 대한 유사한 반응을 나타내며, 이에 의해, 치료에 대한 반응이 예측된다. 일부 대조군에서, 임계값은 치료에 대한 반응이 공지되어 있는 결장암 샘플(들)에서의 표 6에 열거된 결장암-관련 핵산 분자로부터의 해당하는 전사체로부터 유도되는 임계값이다. 일부 실시 형태에서, 상기 방법은 외과적 절제술, 화학요법, 방사선 또는 그들의 임의의 조합으로부터의 반응을 예측하는 방법이다.
결장암 대상체, 예를 들어, II기 결장암으로 진단된 대상체의 장기간 생존을 예측하는 방법이 제공된다. 이들 방법은 대상체로부터 수득되는 핵산을 포함하는 시료 중의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계, 및 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유도되는 결정 점수를 장기간 생존의 병력을 갖는 것을 나타내는 대조군 임계값와 비교하는 단계를 포함하며, 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도되는 결정 점수는 대상체의 장기간 생존을 나타내며, 이에 의해 대상체의 장기간 생존을 예측한다. 일부 예에서, 대조군 임계값은 장기간 생존의 이력을 갖는 대상체(들)로부터 수득되는 결장암 샘플(들)에서의 표 6에 열거된 결장암 관련 핵산 분자로부터의 해당하는 전사체로부터 유도된 임계값이다.
또한, II기 결장암을 갖는 것으로 진단된 대상체와 같은 대상체에서 결장암의 재발을 예측하는 방법이 제공된다. 이들 방법은 대상체로부터 수득되는 핵산을 포함하는 시료 중의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계 및 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유도된 결정 점수를 재발의 이력을 나타내는 대조군 임계값와 비교하는 단계를 포함하며, 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도된 결정 점수는 대상체에서의 재발을 나타낸다. 일부 예에서, 대조군 임계값은 재발의 이력을 갖는 결장암 샘플(들)에서의 표 6에 열거된 결장암-관련 핵산 분자로부터의 해당하는 전사체로부터 유래된 임계값이다.
대상체에 대한 맞춤형 결장암 유전체학 프로파일의 제조 방법이 제공된다. 상기 방법은 대상체로부터 수득되는 핵산을 포함하는 시료 중의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계 및 유전자 발현 분석에 의해 수득되는 데이터를 요약한 리포트를 생성하는 단계를 포함한다.
본 명세서에 개시된 방법의 특정 실시형태에서, 표 6에서의 적어도 2개, 예를 들어, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 125개, 적어도 150개, 적어도 175개, 적어도 200개, 적어도 225개, 적어도 250개, 적어도 275개, 적어도 300개, 적어도 325개, 적어도 350개, 적어도 375개, 적어도 400개, 적어도 425개, 적어도 450개, 적어도 474개, 적어도 500개, 적어도 525개, 적어도 550개, 적어도 575개, 적어도 600개, 적어도 634개 또는 심지어 모든 636개의 전사체에 대한 발현 수준 또는 그들의 발현 생성물을 결정하고, 대조군 임계값와 비교한다. 이들 방법의 다른 실시 형태에서, MUM1 및 SIGMAR1에 대한 발현 수준 또는 그들의 발현 생성물을 결정하고, 대조군 임계값와 비교한다. 다른 실시 형태에서, MUM1, SIGMAR1, ARSD, SULT1C2 및 PPFIBP1에 대한 발현 수준 또는 그들의 발현 생성물을 결정하고, 대조군 임계값와 비교한다. 추가의 실시 형태에서, ARSD, CXCL9, PCLO, SLC2A3, FCGBP, SLC2A14, SLC2A3, BCL9L, 및 MUC3A, OLFM4 RNF39의 안티센스 서열에 대한 발현 수준 또는 그들의 발현 생성물을 결정하고, 대조군 임계값와 비교한다. 또 다른 실시형태에서, 표 1, 표 2 및/또는 표 6 중 하나에 열거된 실질적으로 모든 전사체에 대한 발현 수준을 단계에서 결정하고 대조군 임계값과 비교한다.
개시된 방법의 일부 실시 형태에서, RNA 수준을 검정되는 RNA의 양의 차이 및 사용되는 RNA의 질의 가변성 둘 모두에 대하여 보정한다(정규화시킨다). 대조군 전사체는 양성 또는 음성 대조군으로서 검정법에 포함될 수 있으며, 판독치를 정규화시키고 신뢰성 있는 측정 데이터를 보장하나, 바람직하게는 실제의 예후를 수행하기 위해 생략된다. 전자의 정확한 아이덴티티(identity)는 전형적으로 중요하지 않으며, 매우 다양한 전사체가 본 명세서에 개시된 모든 목적을 위해 고찰된다. 정규화 대조군을 위하여, 매우 다양한 전사체가 고찰될 수 있지만, 그들은 특히, 고려 중인 예후 그룹 간에 표적 대상 조직에 대한 매우 다양한 대상체 또는 증상 간의 대략 불변의 안정한 발현의 기본적인 요건을 충족시켜야 한다. 유사하게, RNA 분해 대조군은 (과도하게) 분해된 RNA를 나타내는데 적절한 강도의 거동을 보여야 한다. 이는 양성 대조군으로서 시료의 전반적 RNA 분해와 상관없이 안정적인 강도를 보이는 RNA 대조군을 포함하거나 포함하지 않을 수 있다. 이들 대조군에 관하여, RNA 분해 단계에 대한 강도 의존성이 관찰되는 적절한 다른 RNA 대조군을 위한 강도 패턴을 분석할 것이다. 이는 전사체의 3' 말단에 대하여 프로브 서열의 다양한 위치에 따라 특정 분석을 포함하거나 포함하지 않을 수 있다.
마이크로어레이가 유전자 발현을 정량화하는데 사용되는 개시된 방법의 일부 실시 형태에서, 하나 이상의 하기의 대조군이 사용될 수 있다.
(a) 어레이 상의 특정 위치에 결합하는 표지된 형태로 고정된 특정 전사체이며, 스캐닝된 어레이의 이미지 처리에서 적절한 그리드(grid) 정렬을 보장하는 정렬 대조군.
(b) 시료 mRNA와 동일한 처리를 수행하여, cDNA 합성 및 이후의 증폭 반응의 적절한 수행을 보장하게 하는, 임의의 증폭을 수행하기 전에 고정된 특정 비표지된 전사체, 예를 들어, 폴리-A 대조군 전사체인 증폭 대조군.
(c) 이전의 증폭 반응으로부터 따로 이들 2개의 단계의 효율을 조절하기 위하여, 칩으로의 표지화 및 혼성화 전에 고정된 특정 대조군인 표지화 및 혼성화 대조군.
(d) 해당하는 표적 서열이 시료에서 이용가능하지 않은 마이크로어레이 상의 프로브 서열인 백그라운드 대조군. 따라서, 원칙적으로, 특정 표적 결합이 발생하지 않아야 한다. 이들 대조군을 사용하여, 백그라운드 또는 교차-혼성화 세기를 확립하였다. 이들은 잠재적으로 상이한 GC-함량 및 전체 마이크로어레이 상의 적절한 공간적인 분포를 특징으로 할 것이다.
(e) 측정 장치의 다양한 투입 mRNA 양, 다양한 수율의 증폭 반응 및 다양한 전반적인 감수성을 위해 보정하도록 선택되는 시료로부터 특이적으로 선택된 표적 서열을 검출하는 프로브 서열인 정규화 대조군. 이들을 사용하여, 측정된 세기 값을 보정하고, 이에 따라 예비 실험실 단계를 포함하여 전체 측정 장치의 분석 정확성의 증가를 보장할 것이다.
(f) RNA 질을 나타내고 RNA 분해를 검출하도록 고안된 그들의 각 유전자의 3' 위치에 대하여 다양한 위치로부터의 프로브 서열인 RNA 질 및 분해 대조군. 다수의 유전자로부터의 해당하는 프로브(들) 세트는 상이한 RNA 종으로부터의 상이한 RNA 분해 거동을 나타낸다.
대조군 a) 내지 d)가 서열 고려 사항에 기초하여 순수하게 유도될 수 있고 대상 조직 및 증상에 천연으로 존재하지 않아야 하지만, 대조군 e) 및 f)는 이전의 환자 데이터의 적절한 분석에 의해 선택될 수 있다. 이는 예후 유전자 시그니처가 유래되는 동일한 트레이닝 데이터이거나 그것이 아닐 수 있다.
상기 대조군이 오직 예로 제공되며, 유사한 작용성을 갖는 상이한 대조군이 사용될 본 발명의 다른 실시 형태가 예상될 수 있음(예를 들어, qPCR)이 이해되어야 한다.
B. 프로브, 프라이머 및 어레이
개시된 결장암 유전자 시그니처에 특이적인 프로브 및 프라이머가 개시된다. 또한, 개시된 결장암 시그니처에 대한 프로브를 포함하는 어레이가 개시된다. 일부 실시 형태에서, 개시된 결장암 유전자 시그니처에 특이적인 프로브는 서열 번호 1 내지 636 중 하나에 특이적으로 혼성화되는 핵산 서열 또는 그의 상보체를 포함한다. 일부 실시 형태에서, 개시된 결장암 시그니처에 대한 프로브 세트는 교차-검증 하에 측정되는 화합물 결정 점수 함수에서 평균 가중치의 순위로 정의되는 가장 큰 가중치를 지니는 표 6의 적어도 2개, 예를 들어, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 125개, 적어도 150개, 적어도 175개, 적어도 200개, 적어도 225개, 적어도 250개, 적어도 275개, 적어도 300개, 적어도 325개, 적어도 350개, 적어도 375개, 적어도 400개, 적어도 425개, 적어도 450개, 적어도 474개, 적어도 500개, 적어도 525개, 적어도 550개, 적어도 575개, 적어도 600개, 적어도 634개 또는 심지어 모든 636개의 전사체에 특이적으로 혼성화되는 프로브, 예를 들어, 서열 번호 1 내지 636 또는 그의 상보체 중 어느 하나에 특이적으로 혼성화하는 프로브를 포함하며, 여전히 예후 값을 갖는다. 일부 실시 형태에서, 개시된 결장암 시그니처에 대한 프로브 세트는 표 6에 열거된 가장 높은 10개의 가중 전사체, 두 번째로 가장 높은 10개의 가중 전사체, 세 번째로 가장 높은 10개의 가중 전사체, 네 번째로 가장 높은 10개의 가중 전사체, 다섯 번째로 가장 높은 10개의 가중 전사체, 여섯 번째로 가장 높은 10개의 가중 전사체, 일곱 번째로 가장 높은 10개의 가중 전사체, 여덟 번째로 가장 높은 10개의 가중 전사체, 아홉 번째로 가장 높은 10개의 가중 전사체 또는 열 번째로 가장 높은 10개의 가중 전사체에 특이적으로 혼성화하는 프로브를 포함한다. 추가의 실시 형태에서, 개시된 결정암 시그니처에 대한 프로브 세트는 표 6에 열거된 가장 큰 가중치를 갖는 636, 634, 620, 610, 600, 590, 580, 570, 560, 550, 540, 530, 520, 510, 500, 490, 480, 470, 460, 450, 440, 430, 420, 410, 400, 390, 380, 370, 360, 350, 340, 330, 320, 310, 300, 290, 280, 270, 260, 250, 240, 230, 220, 210, 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 20 또는 10개의 전사체 또는 그의 상보체에 특이적으로 혼성화하는 프로브를 포함한다. 일부 실시 형태에서, 개시된 암 시그니처에 대한 프로브 세트는 약 200 내지 약 1000개 프로브, 예를 들어, 약 400 내지 약 800개 프로브, 예를 들어, 약 500 내지 약 700개 프로브, 예를 들어, 약 550 내지 약 650개 프로브를 포함하며, 여기서, 프로브는 표 6으로부터의 전사체를 검출한다. 추가의 프로브는 임의로 결장암에서 발현되는 전사체를 검출하거나 신호 대조군 또는 발현 수준 대조군으로 기능하는 것으로부터 선택될 수 있다. 이러한 임의의 프로브는 대장암 DSA(상표명) 도구 상에 포함되는 것들로부터 선택될 수 있다.
일부 실시 형태에서, 개시된 결장암 시그니처에 대한 프로브 세트는 MUM1 및 SIGMAR1에 대한 전사체에 특이적으로 혼성화하는 프로브를 포함한다. 다른 실시 형태에서, 개시된 결장암 시그니처에 대한 프로브 세트는 MUM1, SIGMAR1, ARSD, SULT1C2 및 PPFIBP1에 대한 전사체에 특이적으로 혼성화하는 프로브를 포함한다. 또 다른 실시 형태에서, 개시된 결장암 시그니처에 대한 프로브 세트는 ARSD, CXCL9, PCLO, SLC2A3, FCGBP, SLC2A14, SLC2A3, BCL9L에 대한 전사체, 및 MUC3A, OLFM4 및 RNF39의 안티센스 서열에 특이적으로 혼성화하는 프로브를 포함한다. 실질적으로 유전자 발현 시그니처를 대표하는 프로브 또는 프라이머의 세트가 제조될 수 있다. "유전자 발현 시그니처를 실질적으로 대표하는"은 유전자 발현 시그니처에서 암호화 또는 비-암호화 전사체의 적어도 50%, 60%, 70%, 80%, 90%, 95%, 99%, 또는 100%, 예를 들어, 표 1, 2 또는 6에 나타낸 유전자 발현 시그니처에서 암호화 또는 비-암호화 전사체 또는 그의 상보체의 적어도 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 100%에 특이적으로 혼성화하는 프로브 세트를 말한다.
유전자 발현 시그니처에서의 전사체의 3' 영역에 결합하는 프로브를 사용하는 것이 유리하며, 여기서, 특히 유전자 발현을 위해 분석해야 하는 환자 조직은 파라핀 포매된 조직으로부터 추출되는 RNA이다. 전형적으로, 각 프로브는 전사체의 3' 말단의 1kb 또는 500bp 또는 300bp 또는 200bp 또는 100bp에서 발생하는 각 전사체 내의 상보적 서열에 혼성화될 수 있다. mRNA의 경우에, "전사체의 3' 말단"은 본 명세서에서 폴리(A) 테일을 포함하지 않는 폴리아데닐화 부위로 정의된다.
일 실시 형태에서, 시그니처의 전체 절대 가중치의 30%를 구성하는 프로브의 풀(pool)을 사용한다. 대안적인 실시 형태에서, 시그니처의 전체 절대 가중치의 40%, 60%, 70%, 80%, 90%, 95% 또는 100%를 구성하는 프로브의 푸울을 본 명세서에 기재된 방법에서 사용한다. 마커의 포함에 대한 기초뿐 아니라, 참조 세트에 대한 mRNA 수준 변이의 임상적 유의성이 하기에 나타나 있다. 일부 실시 형태에서, 개시된 프로브는 어레이의 일부이며, 예를 들어, 프로브는 고체 기재에 결합된다. 예시적인 핵산 어레이 및 이러한 어레이의 제조 방법이 하기 섹션 D에 논의되어 있다.
일부 실시 형태에서, 개시된 결장암 유전자 시그니처에 특이적인 프로브는 핵산 어레이, 예를 들어, 마이크로어레이의 일부이다. 일부 예에서, 이러한 어레이는 서열 번호 1 내지 636 중 하나에 특이적으로 혼성화되는 핵산 서열 또는 그의 상보체이다. 일부 실시 형태에서, 핵산 어레이, 예를 들어, 마이크로어레이는 표 6의 적어도 2개, 예를 들어, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 125개, 적어도 150개, 적어도 175개, 적어도 200개, 적어도 225개, 적어도 250개, 적어도 275개, 적어도 300개, 적어도 325개, 적어도 350개, 적어도 375개, 적어도 400개, 적어도 425개, 적어도 450개, 적어도 474개, 적어도 500개, 적어도 525개, 적어도 550개, 적어도 575개, 적어도 600개, 적어도 634개, 또는 심지어 모든 636개의 전사체에 특이적으로 혼성화되는 프로브를 포함한다. 일부 실시 형태에서, 개시된 결장암 시그니처에 대한 핵산 어레이는 표 6에 열거된 가장 높은 10개의 가중 전사체, 두 번째로 가장 높은 10개의 가중 전사체, 세 번째로 가장 높은 10개의 가중 전사체, 네 번째로 가장 높은 10개의 가중 전사체, 다섯 번째로 가장 높은 10개의 가중 전사체, 여섯 번째로 가장 높은 10개의 가중 전사체, 일곱 번째로 가장 높은 10개의 가중 전사체, 여덟 번째로 가장 높은 10개의 가중 전사체, 아홉 번째로 가장 높은 10개의 가중 전사체 또는 열 번째로 가장 높은 10개의 가중 전사체에 특이적으로 혼성화하는 프로브를 포함한다. 추가의 실시 형태에서, 개시된 결장암 시그니처에 대한 핵산 어레이는 표 6에 열거된 가장 큰 가중치를 갖는 636개, 634개, 620개, 610개, 600개, 590개, 580개, 570개, 560개, 550개, 540개, 530개, 520개, 510개, 500개, 490개, 480개, 470개, 460개, 450개, 440개, 430개, 420개, 410개, 400개, 390개, 380개, 370개, 360개, 350개, 340개, 330개, 320개, 310개, 300개, 290개, 280개, 270개, 260개, 250개, 240개, 230개, 220개, 210개, 200개, 190개, 180개, 170개, 160개, 150개, 140개, 130개, 120개, 110개, 100개, 90개, 80개, 70개, 60개, 50개, 40개, 30개, 20개 또는 10개의 전사체 또는 그의 상보체에 특이적으로 혼성화하는 프로브를 포함한다. 일부 실시 형태에서, 개시된 결장암 시그니처에 대한 핵산 어레이는 약 200개 내지 약 1000개의 프로브, 예를 들어, 약 400개 내지 약 800개 프로브, 예를 들어, 약 500개 내지 약 700개 프로브, 예를 들어, 약 550 내지 약 650개 프로브를 포함하며, 여기서, 프로브는 표 6으로부터의 전사체를 검출한다. 추가의 프로브는 임의로 결장암에 발현되는 전사체를 검출하거나 신호 대조군 또는 발현 수준 대조군으로 기능하는 것으로부터 선택될 수 있다. 이러한 임의의 프로브는 대장암 DSA(상표명) 도구에 포함되는 것으로부터 선택될 수 있다. 일부 실시 형태에서, 개시된 결장암 시그니처에 대한 핵산 어레이는 약 1000개 초과의 프로브를 포함한다.
또한, 결장암 핵산을 위한 유전자 발현 시그니처의 증폭을 위한 프라이머 쌍이 개시된다. 일부 예에서, 프라이머 쌍은 서열 번호 1 내지 636에 기재된 핵산 서열 중 임의의 것 또는 그의 상보체에 특이적으로 혼성화하는 핵산 서열을 포함하는 정방향 프라이머 15 내지 40개 뉴클레오타이드 길이 및 서열 번호 1 내지 636에 기재된 핵산 서열 중 임의의 것 또는 그의 상보체에 특이적으로 혼성화하는 핵산 서열을 포함하는 역방향 프라이머 15 내지 40개 뉴클레오타이드 길이를 포함하며, 여기서, 프라이머의 세트는 핵산의 증폭을 지시할 수 있다.
또한, 결장암 핵산에 대한 유전자 발현 시그니처의 증폭을 위한 프라이머 쌍의 세트가 개시된다. 일부 실시 형태에서, 개시된 결장암 시그니처에 대한 프라이머 세트는 교차-검정 하에 측정되는 화합물 결정 점수 기능에서 평균 가중치의 순위로 결정되는 가장 큰 가중치를 지니는 표 6의 적어도 2개, 예를 들어 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 125개, 적어도 150개, 적어도 175개, 적어도 200개, 적어도 225개, 적어도 250개, 적어도 275개, 적어도 300개, 적어도 325개, 적어도 350개, 적어도 375개, 적어도 400개, 적어도 425개, 적어도 450개, 적어도 474개, 적어도 500개, 적어도 525개, 적어도 550개, 적어도 575개, 적어도 600개, 적어도 634개, 또는 심지어 모든 636개의 전사체에 특이적으로 혼성화되고 이를 증폭시킬 수 있으며, 여전히 예후 값을 갖는 프라이머, 예를 들어, 서열 번호 1 내지 636 또는 그의 상보체 중 어느 것에 특이적으로 혼성화되고 이를 증폭시킬 수 있는 프라이머를 포함한다. 일부 실시 형태에서, 개시된 결장암 시그니처에 대한 프라이머 세트는 표 6에 열거된 가장 높은 10개의 가중 전사체, 두 번째로 가장 높은 10개의 가중 전사체, 세 번째로 가장 높은 10개의 가중 전사체, 네 번째로 가장 높은 10개의 가중 전사체, 다섯 번째로 가장 높은 10개의 가중 전사체, 여섯 번째로 가장 높은 10개의 가중 전사체, 일곱 번째로 가장 높은 10개의 가중 전사체, 여덟 번째로 가장 높은 10개의 가중 전사체, 아홉 번째로 가장 높은 10개의 가중 전사체 또는 열 번째로 가장 높은 10개의 가중 전사체에 특이적으로 혼성화하고 이를 증폭시킬 수 있는 프라이머를 포함한다. 추가의 실시 형태에서, 개시된 결장암 시그니처에 대한 프라이머 세트는 표 6에 열거된 가장 큰 가중치를 갖는 636개, 634개, 620개, 610개, 600개, 590개, 580개, 570개, 560개, 550개, 540개, 530개, 520개, 510개, 500개, 490개, 480개, 470개, 460개, 450개, 440개, 430개, 420개, 410개, 400개, 390개, 380개, 370개, 360개, 350개, 340개, 330개, 320개, 310개, 300개, 290개, 280개, 270개, 260개, 250개, 240개, 230개, 220개, 210개, 200개, 190개, 180개, 170개, 160개, 150개, 140개, 130개, 120개, 110개, 100개, 90개, 80개, 70개, 60개, 50개, 40개, 30개, 20개 또는 10개의 전사체 또는 그들의 상보체에 특이적으로 혼성화되고 이를 증폭시킬 수 있는 프라이머를 포함한다.
일부 실시 형태에서, 개시된 결장암 시그니처에 대한 프라이머 세트는 MUM1 및 SIGMAR1에 대한 전사체에 특이적으로 혼성화되고, 이를 증폭시킬 수 있는 프라이머를 포함한다. 다른 실시 형태에서, 개시된 결장암 시그니처에 대한 프라이머 세트는 MUM1, SIGMAR1, ARSD, SULT1C2 및 PPFIBP1에 대한 전사체에 특이적으로 혼성화되고 이를 증폭시킬 수 있는 프라이머를 포함한다. 또 다른 실시 형태에서, 개시된 결장암 시그니처에 대한 프로브 세트는 ARSD, CXCL9, PCLO, SLC2A3, FCGBP, SLC2A14, SLC2A3, BCL9L에 대한 전사체, 및 MUC3A, OLFM4 및 RNF39의 안티센스 서열에 특이적으로 혼성화되는 프로브를 포함한다. 실질적으로 유전자 발현 시그니처를 나타내는 프로브 또는 프라이머의 세트가 제조될 수 있다. "실질적으로 유전자 발현 시그니처를 나타내는"은 유전자 발현 시그니처에서의 암호화 또는 비-암호화 전사체의 적어도 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 100%, 예를 들어, 표 1, 2 또는 6에 나타낸 유전자 발현 시그니처에서 암호화 또는 비-암호화 전사체 또는 그의 상보체의 적어도 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 100%에 특이적으로 혼성화되는 프로브 세트를 말한다.
C. 결장암 시그니처의 통계적 결정
개시된 결장암 시그니처는 통계적 방법에 의해 평가될 수 있다. 일부 실시 형태에서, 환자 조직 샘플의 유전자 발현 프로파일은 선형 분류자에 의해 평가된다. 본 명세서에 사용되는 선형 분류자는 화합물 결정 점수("결정 함수")로의 개별 유전자 세기의 가중 총량을 말한다. 이어서, 결정 점수는 샘플이 임계값 초과인지(양의 결정 함수) 미만인지(음의 결정 함수)를 나타내는 감수성 및 특이성의 면에서 특정 설정점에 해당하는 사전-정의된 컷-오프 임계값와 비교된다.
효과적으로, 이는 데이터 공간, 다시 말하면, 유전자 발현 값의 모든 가능한 조합의 세트가 상이한 임상적 분류 또는 예측에 해당하는 2가지 상호 배타적인 절반, 예를 들어, 양호한 예후에 해당하는 것과 불량한 예후에 해당하는 것으로 나누는 것을 의미한다. 전체 시그니처의 맥락에서, 특정 유전자의 상대적 과발현은 결정 점수를 증가(양의 가중치)시키거나 그를 감소(음의 가중치)시킬 수 있으며, 이에 따라, 예를 들어, 불량한 또는 양호한 예후의 전반적인 결정에 기여한다.
이러한 양의 해석, 즉 양호환 대 불량한 예후에 대한 컷-오프 임계값은 공지되어 있는 결과가 있는 환자의 세트로부터의 개발 단계("트레이닝")에서 유도된다. 결정 점수에 대한 해당하는 가중치 및 양호한/불량한 예후 컷-오프 임계값은 해당 분야의 숙련자에게 공지되어 있는 방법에 의해 트레이닝 데이터로부터 선험적으로 고정된다. 본 발명의 방법의 바람직한 실시 형태에서, 부분 최소 제곱 분석(PLS-DA)은 가중치를 결정하는데 사용된다(문헌[Stahle, J. Chemom. 1 185-196, 1987]; 문헌[Nguyen and Rocke, Bioinformatics 18 39-50, 2002]). 또한, 해당 분야의 숙련자에게 공지되어 있는 분류를 수행하는 다른 방법은 결장암 시그니처의 전사체에 적용되는 경우, 본 명세서에 기재된 방법으로 이루어질 수 있다.
상이한 방법을 사용하여, 이들 유전자 또는 그들의 산물에서 측정되는 정량적 데이터를 예후 또는 다른 예측적 이용으로 전환시킬 수 있다. 이들 방법은 패턴 인식(문헌[Duda et al. Pattern Classification, 2nd ed., John Wiley, New York 2001]), 머신 런닝(machine learning)(문헌[Schoelkopf et al. Learning with Kernels, MIT Press, Cambridge 2002], 문헌[Bishop, Neural Networks for Pattern Recognition, Clarendon Press, Oxford 1995]), 통계학(문헌[Hastie et al. The Elements of Statistical Learning, Springer, New York 2001]), 생물정보학(문헌[Dudoit et al., J. Am. Statist. Assoc. 97:77-87, 2002]; 문헌[Tibshirani et al., Proc. Natl. Acad. Sci. USA 99:6567-6572, 2002]) 또는 케모메트릭스(chemometrics)(문헌[Vandeginste, et al., Handbook of Chemometrics and Qualimetrics, Part B, Elsevier, Amsterdam 1998])를 포함하나 이들에 한정되지 않는다.
일부 실시 형태에서, 트레이닝 단계에서, 양호한 및 불량한 예후 경우에 대해 환자 샘플의 세트를 측정하고, 이러한 트레이닝 데이터로부터 고유 정보를 사용하여 최적화하고, 트레이닝 세트 또는 장래의 샘플 세트를 최적으로 예측한다. 사용되는 이러한 트레이닝 단계에서, 방법은 특정 세기 패턴으로부터 특정 예후 요구를 예측하기 위해 트레이닝되고 지표화된다. 적절한 변화 또는 사전-처리 단계를 예후 단계 또는 알고리듬으로 처리하기 전에, 이를 측정된 데이터를 사용하여 수행될 수 있다.
일부 실시 형태에서, 각 전사체에 대한 사전-처리된 세기 값의 가중 총량이 형성되며, 트레이닝 세트에 최적화된 임계값 값과 비교한다(문헌[Duda et al. Pattern Classification, 2nd ed., John Wiley, New York 2001]). 가중치는 부분최소자승법(PLS, (문헌[Nguyen et al., 2002, Bioinformatics 18 (2002) 39-50])) 또는 지지 벡터 기계(Support Vector Machines)(SVM, (문헌[SchOlkopf et al. Learning with Kernels, MIT Press, Cambridge 2002]))를 포함하나 이에 한정되지 않는 다수의 선형 분류 방법으로 유도될 수 있다.
일부 실시 형태에서, 데이터는 예를 들어, 상기 기재된 바와 같이, 가중 총량을 적용하기 전에 비-선형으로 변환된다. 이러한 비-선형 변환은 데이터의 차원수를 증가시키는 것을 포함할 수 있다. 또한, 비-선형 변환 및 가중 총량은 예를 들어, 커널 함수의 사용을 통하여, 맹목적으로 수행될 수 있다(문헌[Scholkopf et al. Learning with Kernels, MIT Press, Cambridge 2002]).
일부 실시 형태에서, 새로운 데이터 샘플을 측정된 트레이닝 샘플 또는 인공으로 생성된 프로토타입 중 어느 하나인 둘 이상의 분류의 프로토타입과 비교한다. 이러한 비교는 적절한 유사성 측정치, 예를 들어, 비제한적으로, 유클리드 거리(문헌[Duda et al. Pattern Classification, 2nd ed., John Wiley, New York 2001]), 상관 계수(문헌[van't Veer, et al., Nature 415:530, 2002]) 등을 사용하여 수행된다. 이어서, 새로운 샘플은 가장 가까운 프로토타입 또는 근처에 있는 가장 큰 수의 프로토타입을 갖는 예후 그룹에 할당된다.
일부 실시 형태에서, 결정수(문헌[Hastie et al. The Elements of Statistical Learning, Springer, New York 2001]) 또는 랜덤 포레스트(random forests)(문헌[Breiman, 2001Random Forests, Machine Learning 45:5])를 사용하여, 전사체 세트 또는 그들의 산물에 대한 측정된 세기 데이터로부터 예후 호출을 만든다.
일부 실시 형태에서, 신경망(문헌[Bishop, Neural Networks for Pattern Recognition, Clarendon Press, Oxford 1995])을 사용하여 전사체 세트 또는 그들의 산물에 대한 측정된 세기 데이터로부터 예후 호출을 만든다.
일부 실시 형태에서, 선형, 대각선형(diagonal linear), 이차 및 로지스틱 판별 분석을 포함하나 이에 한정되지 않는 판별 분석(문헌[Duda et al. Pattern Classification, 2nd ed., John Wiley, New York 2001])을 사용하여 전사체 세트 또는 그들의 산물에 대한 측정된 세기 데이터로부터 예후 호출을 만든다.
일부 실시 형태에서, 마이크로어레이용의 예측 분석(Prediction Analysis for Microarrays : PAM)(문헌[Tibshirani et al., Proc. Natl. Acad. Sci. USA 99:6567-6572, 2002])을 사용하여 전사체 세트 또는 그들의 산물에 대한 측정된 세기 데이터로부터 예후 호출을 만든다.
일부 실시 형태에서, 클래스 유사의 소프트 독립적 모델링(Soft Independent Modelling of Class Analogy; SIMCA)(문헌[Wold, 1976, Pattern Recogn. 8:127-139])을 사용하여, 전사체 세트 또는 그들의 산물에 대한 측정된 세기 데이터로부터 예후 호출을 만든다.
D. mRNA의 결정을 위한 방법
유전자 발현이 대상 유전자를 암호화하는 mRNA의 검출에 의해 평가될 수 있다. 따라서, 개시된 방법은 mRNA를 평가하는 것을 포함할 수 있다. RNA는 상업적으로 입수할 수 있는 키트를 포함하는 해당 분야에 널리 알려져 있는 방법을 사용하여 대상체로부터의 종양의 샘플(예를 들어, 결장암 종양), 대상체로부터의 인접한 비-종양 조직의 샘플, 정상의(건강한) 대상체로부터의 종양-부재 조직의 샘플 또는 그들의 조합으로부터 단리될 수 있다.
일반적인 mRNA 추출 방법이 해당 분야에 널리 알려져 있으며, 문헌[Ausubel et al., Current Protocols of Molecular Biology, John Wiley and Sons (1997)]을 포함하는 분자 생물학의 표준 교과서에 개시되어 있다. 파라핀 포매된 조직으로부터의 RNA 추출 방법이 예를 들어[Rupp and Locker, Biotechniques 6:56-60, 1988] 및 문헌[De Andres et al., Biotechniques 18:42-44, 1995]에 개시되어 있다. 일 예에서, RNA 분리는 제조처의 지시에 따라 상업적 제조처, 예를 들어, 퀴아젠(QIAGEN)(등록 상표)(미국 캘리포니아주 발렌시아 소재)으로부터의 정제 키트, 완충제 세트 및 프로테아제를 사용하여 수행될 수 있다. 예를 들어, 배양물(예를 들어, 대상체로부터 수득되는 것) 중의 세포로부터의 전체 RNA는 퀴아젠(QIAGEN)(등록 상표) RNeasy(등록 상표) 미니-컬럼을 사용하여 단리될 수 있다. 다른 상업적으로 입수할 수 있는 RNA 단리 키트는 마스터퓨어(MASTERPURE)(등록 상표) 완전 DNA 및 RNA 정제 키트(에피센터(EPICENTRE)(미국 위스콘신주 매디슨 소재), 및 파라핀 블록 RNA 단리 키트(앰비온, 인코포레이티드(Ambion, Inc.))를 포함한다. 조직 샘플로부터의 전체 RNA는 RNA Stat-60(텔-테스트(Tel-Test))를 사용하여 단리될 수 있다. 종양 또는 다른 생물학적 샘플로부터 제조되는 RNA는 예를 들어, 염화세슘 밀도 구배 원심분리에 의해 단리될 수 있다.
본 명세서에 기재된 본 발명의 시그니처 및 방법은 세트 내의 모든 마커의 검정을 위하여 보존 파라핀-포매된 생검 재료의 이용을 수용하며, 이에 따라, 가장 널리 이용가능한 유형의 생검 물질과 양립할 수 있다. 결장 조직 샘플 중의 전사체의 발현 수준은 포르말린-고정된, 파라핀-포매된 조직 샘플, 용액, 예를 들어, RNAlater(등록 상표)에서 저장되는 신선한 동결된 조직 또는 신선한 조직으로부터 수득되는 RNA를 사용하여 결정될 수 있다. RNA의 단리는 예를 들어, 상기 기재된 또는 출원서의 임의의 절차 후에 또는 당업계에 공지되어 있는 임의의 다른 방법에 의해 수행될 수 있다. 모든 유전자 발현 프로파일링 기술뿐 아니라 단백질 유전 정보학 기술이 본 명세서에 기재된 방법을 수행하는데 사용하기에 적절한 한편, 유전자 발현 수준은 종종 DNA 마이크로어레이 기술에 의해 결정된다.
조직의 공급원이 포르말린-고정된, 파라핀 포매된 조직 샘플이면, RNA가 단편화되어 정보의 소실이 야기될 수 있다. 본 명세서에 제공된 시그니처는 그들의 3' 말단으로부터 시퀀싱된 전사체의 푸울로부터 유도되며, 이에 의해, 조직의 트랜스크립톰의 정확한 표현이 제공된다. 따라서, 본 명세서에 제공된 시그니처는 신선한 동결된 및 고정된 파라핀-포매된 조직 둘 모두에 유용하다. 일부 실시 형태에서, 본 명세서에 기재된 방법에 사용되는 RNA 샘플은 하나 이상의 하기의 단계, 예를 들어, 모든 하기의 단계를 사용하여, 고정된, 왁스-포매된 결장 조직 시료로부터 제조될 수 있다.
(a) 통상의 방법을 사용하고, 유기 용매 중에서의 다수의 세정 단계를 사용한 탈파라핀화(deparaffinizing).
(b) 대기 건조 및 조직으로부터의 RNA의 방출을 야기하는 세포간- 및 세포내 결합을 파괴하기 위한 프로테아제로의 처리.
(c) 오염하는 게놈 DNA의 제거.
(d) 유기 용매 중에서의 세정 및 적절한 RNase-부재 용리 완충제에서의 용리.
또한, RNA-추출 방법은 이러한 방식으로 보존된 조직에서 발생하는 포르말린 가교 결합을 역전시키는 추가의 기능을 가져, 다운스트림 검정법에서의 성능을 위하여 RNA 수율 및 질을 향상시키는 고도의 변성 용해 완충제 중에서의 조직의 인큐베이션을 포함할 수 있다.
RNA 회수 후에, RNA는 임의로 추가로 정제되어, 오염 DNA 또는 단백질이 실질적으로 없는 RNA가 야기될 수 있다. 추가의 RNA 정제는 임의의 상술된 RNA 회수 기술에 의해 또는 상업적으로 입수할 수 있는 RNA 클린업(cleanup) 키트, 예를 들어, RNeasy(등록 상표) MinElute(등록 상표) 클린업 키트(Cleanup Kit)(퀴아젠(QIAGEN)(등록 상표))의 사용으로 달성될 수 있다. 조직 시료는 예를 들어, 종양으로부터 수득될 수 있으며, RNA는 종양 세포가 풍부한 조직 시료의 미세절개 부분으로부터 수득될 수 있다.
유전자 발현 프로파일링 방법은 폴리뉴클레오타이드의 혼성화 분석에 기초한 방법 및 폴리뉴클레오타이드의 시퀀싱에 기초한 방법을 포함한다. 일부 예에서, 샘플 중의 mRNA 발현은 노던 블롯팅(Northern blotting) 또는 동소 혼성화(in situ hybridization)(문헌[Parker & Barnes, Methods in Molecular Biology 106:247-283, 1999]); RNAse 보호 검정법(문헌[Hod, Biotechniques 13:852-4, 1992]); 및 PCR-기반의 방법, 예를 들어, 역전사 중합효소 연쇄 반응(RT-PCR)(문헌[Weis et al., Trends in Genetics 8:263-4, 1992])을 사용하여 정량화된다. 대안적으로, DNA 듀플렉스(duplex), RNA 듀플렉스 및 DNA-RNA 하이브리드 듀플렉스 또는 DNA-단백질 듀플렉스를 포함하는 특이적 듀플렉스를 인식할 수 있는 항체가 사용될 수 있다. 시퀀싱-기반의 유전자 발현 분석을 위한 대표적인 방법은 SAGE(Serial Analysis of Gene Expression) 및 MPSS(massively parallel signature sequencing)에 의한 유전자 발현 분석을 포함한다. 일 예에서, RT-PCR을 사용하여 상이한 샘플 중의 mRNA 수준을 비교하여, 유전자 발현의 패턴을 특성화하여, 밀접하게 관련된 mRNA를 판별하고 RNA 구조를 분석할 수 있다. 특정 예에서, 개시된 결장암 시그니처는 핵산 마이크로어레이 기술, PCR 기술 또는 그들의 조합에 의해 분석된다.
1. 마이크로어레이 방법을 사용한 유전자 발현 프로파일링
일부 실시 형태에서, 결장암-관련 유전자 및/또는 전사체, 예를 들어, 표 6에 나타낸 것의 발현 프로파일은 마이크로어레이 기술을 사용하여 신선한 또는 파라핀-포매된 종양 조직 중 어느 하나에서 측정할 수 있다. 이러한 방법에서, 대상 폴리뉴클레오타이드 서열. 예를 들어, 표 6에 나타낸 핵산 서열 또는 그의 상보체에 특이적으로 혼성화되는 폴리뉴클레오타이드 서열은 마이크로칩 기판 상에 플레이팅되거나 배열된다. 이어서, 배열된 서열은 대상 세포 또는 조직으로부터의 핵산과 혼성화된다.
RT-PCR 방법(하기 참조)에서와 같이, mRNA의 공급원은 통상 인간 종양 또는 종양 세포주 및 해당하는 정상 조직 또는 세포주로부터 단리된 전체 RNA이다. 따라서, RNA는 다양한 원발성 종양 또는 종양 세포주로부터 단리될 수 있다. mRNA의 공급원이 원발성 종양이면, mRNA는 매일의 임상 실습에서 통상적으로 제조되고 보존된, 예를 들어, 동결되거나 보존 파라핀-포매된 및/또는 고정된(예를 들어, 포르말린-고정된) 조직 샘플로부터 추출될 수 있다.
마이크로어레이 기술의 특정 실시형태에서, cDNA 클론 또는 올리고뉴클레오타이드의 PCR 증폭된 삽입물은 덴스 어레이(dense array)에서 기판에 적용된다. 또한, 짧은 올리고뉴클레오타이드는 예를 들어, 반도체-기반의 포토리소그래피 및 고체상 화학적 합성 기술의 조합을 사용하여 기판 상에서 직접 합성될 수 있다(미국 캘리포니아주 산타클라라 소재의 아피메트릭스, 인코포레이티드(Affymetrix, Inc.)). 일 실시형태에서, 적어도 10,000개의 뉴클레오타이드 서열이 기판 상에 존재한다. 기판 상에 고정화된 미세배열된 전사체는 엄격한 조건 하에서의 혼성화에 적절하다. 형광 표지된 뉴클레오타이드 프로브는 대상 조직으로부터 추출된 RNA의 역전사에 의한 형광 뉴클레오타이드의 혼입을 통해 생성될 수 있다. 어레이에 적용되는 표지된 프로브는 어레이 상의 각 뉴클레오타이드에 특이적으로 혼성화된다. 비특이적으로 결합된 프로브를 제거하기 위한 세정 후에, 어레이는 공초점 레이저 현미경에 의해 또는 다른 검출 방법, 예를 들어, CCD 카메라에 의해 스캐닝된다. 각각의 배열된 요소의 혼성화의 정량화에 의해, 해당하는 전사체 존재비의 평가가 가능해진다.
이중 색상 형광을 사용하여, 2가지 공급원으로부터 생성되는 따로 표지된 뉴클레오타이드 프로브가 어레이에 쌍으로 혼성화될 수 있다. 소형화된 규모의 혼성화는 매우 다수의 유전자에 대한 발현 패턴의 편리하고 신속한 평가를 제공한다. 이러한 방법은 세포당 소수의 카피로 발현되는 드문 전사체를 검출하고, 발현 수준의 적어도 대략 2배의 차이를 재생가능하게 검출하는데 필요한 감수성을 갖는 것으로 보인다(문헌[Schena et al., Proc. Natl. Acad. Sci. USA 93(2):106 149 (1996)]). 또한, 마이크로어레이 분석은 제조처의 프로토콜에 따라, 예를 들어, 아피메트릭스 진칩(등록 상표) 기술(미국 캘리포니아주 산타 클라라 소재의 아피메트릭스, 인코포레이티드) 또는 아질런트 마이크로어레이 기술(미국 캘리포니아주 산타 클라라 소재의 아질런트 테크놀로지즈, 인코포레이티드(Agilent Technologies, Inc.))을 사용하여, 상업적으로 입수할 수 있는 장비에 의해 수행될 수 있다.
유전자 발현의 대규모 분석을 위한 마이크로어레이 방법의 개발에 의해, 다양한 종양 유형, 예를 들어, 결장암 종양에서 암 분류 및 결과 예측의 분자 마커를 통합적으로 검색할 수 있게 된다.
본 명세서에 제공되는 특정 실시 형태에서, 어레이를 사용하여 결장암 유전자 발현 프로파일을 평가할 수 있으며, 예를 들어, 결장암 환자를 예후하거나 진단할 수 있다. 표 1, 표 2에 열거된 유전자 및/또는 표 6에 열거된 전사체에 특이적인 프로브 또는 프라이머로 본질적으로 이루어진 어레이를 기재하는 경우, 이러한 어레이는 이들 결장암 관련 유전자에 특이적인 프로브 또는 프라이머를 포함하며, 대조군 프로브를 추가로 포함할 수 있다(예를 들어, 인큐베이션 조건을 확인하기 위해 충분함). 예시적인 대조군 프로브는 GAPDH, β-액틴 및 18S RNA를 포함한다.
i. 어레이 기판
어레이의 고체 지지체는 무기 재료(예를 들어, 유리) 또는 유기 폴리머로부터 형성될 수 있다. 고체 지지체에 적절한 재료에는 폴리프로필렌, 폴리에틸렌, 폴리부틸렌, 폴리아이소부틸렌, 폴리부타다이엔, 폴리아이소프렌, 폴리비닐피롤리딘, 폴리테트라플루오로에틸렌, 폴리비닐리덴 다이플루오라이드, 폴리플루오로에틸렌-프로필렌, 폴리에틸렌비닐 알코올, 폴리메틸펜텐, 폴리클로로트라이플루오로에틸렌, 폴리설폰, 하이드록실화 2축 연신 폴리프로필렌, 에틸렌아크릴산, 에틸렌 메타크릴산 및 그들의 코폴리머의 배합물(미국 특허 제5,985,567호 참조)이 포함되나 이들에 한정되지 않는다.
일반적으로, 고체 지지체 표면을 형성하기 위해 사용될 수 있는 물질의 적절한 특징은 활성화 시에, 지지체의 표면에 생물분자, 예를 들어, 올리고뉴클레오타이드를 공유 부착시킬 수 있도록 표면 활성화되기 쉬움. 생물분자가 "동소에서" 합성되기 쉬움 올리고뉴클레오타이드에 의해 점유되지 않는 지지체 상의 영역에서, 비특이적으로 결합되기 쉽지 않거나, 비특이적인 결합이 발생하는 경우, 이러한 재료가 올리고뉴클레오타이드의 제거 없이 표면으로부터 용이하게 제거될 수 있도록 화학적으로 불활성임.
다른 예에서, 표면 활성화 유기 폴리머는 고체 지지체 표면으로 사용된다. 표면 활성화 유기 폴리머의 일 예는 무선 주파수 플라스마 방전을 통하여 아민화된 폴리프로필렌 물질이다. 또한, 다른 반응성 기, 예를 들어, 하이드록실화, 티올화 또는 활성 에스테르기가 사용될 수 있다.
ii. 어레이 형식
매우 다양한 어레이 형식은 본 발명에 따라 사용될 수 있다. 일 예는 일반적으로, 해당 분야에서 딥스틱(dipstick)으로 지칭되는 올리고뉴클레오타이드 밴드의 직선 어레이를 포함한다. 다른 적절한 형식은 2차원 패턴의 별개의 셀(예를 들어, 64×64 어레이 내의 4096개 사각형)을 포함한다. 당업자에 의해 인식되는 바와 같이, 슬롯(slot)(직사각형) 및 원형 어레이를 포함하나 이들에 한정되지 않는 다른 어레이 형식이 균등하게 사용하기에 적절하다(미국 특허 제5,981,185호 참조). 일부 예에서, 어레이는 다중-웰 플레이트이다. 일 예에서, 어레이는 쓰레드(thread), 막 또는 필름인 폴리머 매체 상에 형성된다. 유기 폴리머 매체의 일 예는 두께가 약 1mil(0.001 인치) 내지 약 20mil인 폴리프로필렌 시트이지만, 필름의 두께는 중요하지 않으며, 상당히 넓은 범위에 걸쳐 다양할 수 있다. 어레이는 2축 연신된 폴리프로필렌(BOPP) 필름을 포함할 수 있으며, 이는 그들의 내구성에 더하여, 낮은 백그라운드 형광을 나타낸다.
본 발명의 어레이 형식은 다양한 상이한 유형의 형식에 포함될 수 있다. "형식"은 고체 지지체가 고정될 수 있는 임의의 형식. 예를 들어 마이크로타이터 플레이트(예를 들어, 다중-웰 플레이트), 시험 튜브, 무기 시트, 딥스틱 등을 포함한다. 예를 들어, 고체 지지체가 폴리프로필렌 쓰레드인 경우, 하나 이상의 폴리프로필렌 쓰레드는 플라스틱 딥스틱형 장치에 고정될 수 있으며 폴리프로필렌 막은 유리 슬라이드에 고정될 수 있다. 특정 형식은 그것 자체는 중요하지 않다. 필요한 모든 것은 고체 지지체가 고체 지지체 또는 그 위에 흡수된 바이오폴리머의 기능의 거동에 영향을 미치지 않고 그에 고정될 수 있으며, 형식(예를 들어, 딥스틱 또는 슬라이드)이 장치가 도입되는 임의의 물질(예를 들어, 임상 샘플 및 혼성화 용액)에 대해 안정한 것이다.
본 발명의 어레이는 다양한 방법으로 제조될 수 있다. 일 예에서, 올리고뉴클레오타이드 또는 단백질 서열은 따로 합성된 다음, 고체 지지체에 부착된다(미국 특허 제6,013,789호 참조). 다른 예에서, 서열은 지지체 상에서 직접 합성되어, 원하는 어레이를 제공한다(미국 특허 제5,554,501호 참조). 올리고뉴클레오타이드 및 단백질을 고체 지지체에 공유 결합시키고, 올리고뉴클레오타이드 또는 단백질을 지지체 상에 직접 합성하는 적절한 방법은 해당 분야에 공지되어 있으며 적절한 방법의 요약은 문헌[Matson et al., Anal. Biochem. 217:306-10, 1994]에서 찾을 수 있다. 일 예에서, 올리고뉴클레오타이드는 고체 지지체 상에서 올리고뉴클레오타이드를 제조하기 위한 통상의 화학적 기술을 사용하여 지지체 상에 합성된다(예를 들어, PCT 출원 WO 85/01051호 및 WO 89/10977호 또는 미국 특허 제5,554,501호).
자동화 수단을 사용하여 적절한 어레이가 생성되어, 사전 결정된 패턴으로 4개의 염기에 대한 전구체를 놓음으로써 어레이의 셀 내에서 올리고뉴클레오타이드가 합성될 수 있다. 약술하면, 다중-채널 자동화된 화학적 전달 시스템을 사용하여, 기판을 가로질러 평행한 줄(전달 시스템 내의 모든 채널의 수에 해당) 내에 올리고뉴클레오타이드 프로브 집단을 생성한다. 이어서, 제1 방향으로의 올리고뉴클레오타이드 합성의 완료 후에, 기판을 90° 회전시켜, 이제 제1 세트에 수직인 제2 세트의 줄 내에서 합성이 진행되게 할 수 있다. 이러한 과정에 의해 다수의 채널 어레이가 생성되며, 그의 교차점은 복수의 별개의 셀을 생성한다.
올리고뉴클레오타이드는 올리고뉴클레오타이드의 3' 말단 또는 올리고뉴클레오타이드의 5' 말단에 의해 폴리프로필렌 지지체에 결합될 수 있다. 일 예에서, 올리고뉴클레오타이드는 3' 말단에 의해 고체 지지체에 결합된다. 그러나, 당업자는 올리고뉴클레오타이드의 3' 말단 또는 5' 말단의 사용이 고체 지지체로의 결합에 적절한지 여부를 결정할 수 있다. 일반적으로, 3' 말단 및 5' 말단의 영역 내의 올리고뉴클레오타이드 프로브의 내부 상보성에 의해 지지체로의 결합이 결정된다.
특정 예에서, 어레이 상의 올리고뉴클레오타이드 프로브는 올리고뉴클레오타이드 프로브:표적 서열 혼성화 복합체의 검출을 가능하게 하는 하나 이상의 표지를 포함한다.
2. 마이크로어레이 방법을 사용한 유전자 발현 프로파일링
가장 민감하고 가장 유연한 정량적 방법 중 하나는 RT-PCR인데, 이를 사용하여, 약물 처리와 함께 또는 그것 없이, 정상 및 종양 조직 내의 상이한 샘플 집단 내의 mRNA 수준을 비교하여, 유전자 발현의 패턴을 특성화하고, 밀접하게 관련된 mRNA를 판별하고, RNA 구조를 분석할 수 있다.
제1 단계는 표적 샘플, 예를 들어, 인간 종양 또는 종양 세포주 및 각각의 해당하는 정상 조직 또는 세포주로부터의 RNA의 단리이다. RNA의 공급원이 원발성 종양이면, RNA는 예를 들어, 동결된 또는 보존 파라핀-포매된 및/또는 고정된(예를 들어, 포르말린-고정된) 조직 샘플로부터 추출될 수 있다.
RT-PCR의 변화는 실시간 정량화 RT-PCR이며, 이에 의해, 이중-표지된 형광원 프로브(예를 들어, 택맨(TaqMan)(등록 상표) 프로브)를 통해 PCR 산물 축적을 측정한다. 실시간 PCR은 정량적 경쟁 PCR과 상용성이며, 여기서, 각 대상 서열에 대한 내부 경쟁자다 정규화를 위해 사용되는 경우, RT-PCR을 위한 하우스키핑 유전자 또는 샘플 내에 포함되는 정규화 유전자를 사용한 정량적 비교 PCR과 상용성이다(문헌[Heid et al., Genome Research 6:986-994, 1996] 참조). 또한, 정량적 PCR은 미국 특허 제5,538,848호에 기재되어 있다. 관련 프로브 및 정량적 증폭 절차는 미국 특허 제5,716,784호 및 미국 특허 제5,723,591호에 기재되어 있다. 마이크로타이터 플레이터에서 정량적 PCR을 수행하기 위한 기기는 피이 어플라이드 바이오시스템즈(PE Applied Biosystems)(미국 캘리포니아주 포스터 시티 소재)로부터 입수할 수 있다.
다른 예에서, mRNA 수준을 택맨(등록 상표) RT-PCR 기술을 사용하여 측정된다. 택맨(등록 상표) RT-PCR은 상업적으로 입수할 수 있는 장비를 사용하여 수행될 수 있다. 시스템은 써모사이클러(thermocycler), 레이저, 전하-결합 소자(CCD) 카메라 및 컴퓨터를 포함할 수 있다. 일부 예에서, 시스템은 써모사이클러 상에서 96-웰 형식에서 샘플을 증폭시킨다. 증폭 동안, 레이저-유도된 형광 신호는 모든 96개 웰에 대하여 광섬유 케이블을 통하여 실시간으로 수집되고 CCD에서 검출된다. 시스템은 기구의 수행 및 데이터의 분석을 위한 소프트웨어를 포함한다.
오류 및 샘플-대-샘플 변화의 영향을 최소화하기 위하여, 내부 표준물질을 사용하여 RT-PCR이 수행될 수 있다. 이상적인 내부 표준물질은 상이한 조직 간에 고정된 수준으로 발현되며, 실험적 처리에 의해 영향을 받지 않는다. 유전자 발현 패턴을 정규화하기 위해 통상 사용되는 RNA는 하우스키핑 유전자 GAPDH에 대한 mRNA, β-액틴 및 18S 리보솜 RNA를 포함한다.
mRNA 단리, 정제, 프라이머 연장 및 증폭을 포함하는, RNA 공급원으로서 고정된, 파라핀-포매된 조직을 사용하여 유전자 발현을 정량화하기 위한 대표적인 프로토콜의 단계는 다양한 공개된 저널 기사에 제공되어 있다(문헌[Godfrey et al., J. Mol. Diag. 2:84 91, 2000]; 문헌[Specht et al., Am. J. Pathol. 158:419-29, 2001] 참조). 약술하면, 대표적인 과정은 파라핀-포매된 종양 조직 샘플의 약 10㎛ 두께의 섹션을 절단함으로써 시작한다. 이어서, RNA를 추출하고, 단백질 및 DNA를 제거한다. 대안적으로, RNA를 종양 샘플 또는 다른 조직 샘플로부터 직접 단리한다. RNA 농도의 분석 후에, RNA 수선 및/또는 증폭 단계가 필요에 따라 포함될 수 있으며, RNA는 유전자 특이적 프로모터를 사용하여 역전사되고, RT-PCR 및/또는 핵산 어레이로의 혼성화로 이어진다.
대안적인 실시 형태에서, 샘플 중의 mRNA 발현의 정량화를 위해 해당 분야에 공지되어 있는 통상적으로 사용되는 방법은 본 명세서에 제공되는 결장 시그니처로 사용될 수 있다. 이러한 방법은 노던 블롯팅 및 동소 혼성화(문헌[Parker & Barnes, Methods in Molecular Biology 106:247 283 (1999)]); RNase 보호 검정법(문헌[Hod, Biotechniques 13:852 854 (1992)])을 포함하나 이들에 한정되지 않는다. 대안적으로, DNA 듀플렉스, RNA 듀플렉스 및 DNA-RNA 하이브리드 듀플렉스 또는 DNA-단백질 듀플렉스를 포함하는 특정 듀플렉스를 인식할 수 있는 항체가 사용될 수 있다.
추가로, PCR기반의 기술은 예를 들어, 차등 디스플레이(문헌[Liang and Pardee, Science 257:967 971 (1992)]); 증폭 단편 길이 다형성(amplified fragment length polymorphism(iAFLP))(문헌[Kawamoto et al., Genome Res. 12:1305 1312 (1999)]); 비드어레이(BeadArray)(상표명) 기술(문헌[Illumina, San Diego, Calif.]; 문헌[Oliphant et al., Discovery of Markers for Disease (Supplement to Biotechniques), June 2002]; 문헌[Ferguson et al., Analytical Chemistry 72:5618(2000)]); 유전자 발현을 위한 신속한 검정법에서 상업적으로 입수할 수 있는 Luminex100 LabMAP 시스템 및 다중 색상-코딩된 미소구체를 사용한 BADGE(BeadsArray for Detection of Gene Expression)(미국 텍사스주 오스틴 소재의 루미넥스 코포레이션(Luminex Corp.))(문헌[Yang et al., Genome Res. 11:1888 1898 (2001)]); 경쟁적 PCR 및 MassARRAY(문헌[Oeth et al., 2004, SEQUONOME Application Note]); 및 HiCEP(high coverage expression profiling) 분석(문헌[Fukumura et al., Nucl. Acids. Res. 31(16) e94 (2003)])을 포함한다.
증폭을 위해 사용되는 프라이머는 대상 유전자(예를 들어, 표 1 및 표 6의 유전자)의 독특한 세그먼트가 증폭되도록 선택된다. 사용될 수 있는 프라이머는 상업적으로 입수할 수 있거나, 예를 들어, 진뱅크(GENBANK)(등록 상표)에서 입수할 수 있는 이들 유전자의 서열을 사용하여 널리 공지되어 있는 방법에 따라 고안되고 합성될 수 있다.
대안적인 정량적 핵산 증폭 절차는 미국 특허 제5,219,727호에 기재되어 있다. 이러한 절차에서, 샘플 중의 표적 서열의 양은 표적 서열 및 내부 표준물질 핵산 세그먼트를 동시에 증폭시킴으로써 결정된다. 각 세그먼트로부터 증폭되는 DNA의 양을 결정하고, 표준 곡선과 비교하여, 증폭 전에 샘플에 존재하였던 표적 핵산 세그먼트의 양을 결정한다.
일부 예에서, 마이크로어레이 기술을 사용하여 유전자 발현이 동정되거나 확인된다. 따라서, 발현 프로파일은 마이크로어레이 기술을 사용하여 신선한 또는 파라핀-포매된 종양 조직에서 측정될 수 있다. 이러한 방법에서, 대상 결장암 시그니처 핵산 서열(cDNA 및 올리고뉴클레오타이드 포함)은 마이크로칩 기판 상에 플레이팅되거나 배열된다. 이어서, 배열된 서열은 대상 세포 또는 조직으로부터의 단리된 핵산(예를 들어, cDNA 및 mRNA)과 혼성화된다. RT-PCR 방법에서와 같이, mRNA의 공급원은 통상 인간 종양 및 임의로 해당하는 비암성 조직 및 정상 조직 또는 세포주로부터 단리된 전체 RNA이다.
마이크로어레이 기술의 특정 실시 형태에서, cDNA 클론의 PCR 증폭된 삽입물은 덴스 어레이(dense array)에서 기판에 적용된다. 일부 예에서, 어레이는 표 1, 2 및 6의 적어도 2개의 결장암 시그니처 유전자에 특이적인 프로브를 포함한다. 미세배열된 핵산은 엄격한 조건 하에서의 혼성화에 적절하다. 형광 표지된 cDNA 프로브는 대상 조직으로부터 추출된 RNA의 역전사에 의한 형광 뉴클레오타이드의 혼입을 통해 생성될 수 있다. 칩에 적용되는 표지된 cDNA 프로브는 어레이 상의 각 DNA 스폿에 특이적으로 혼성화된다. 비특이적으로 결합된 프로브를 제거하기 위한 엄격한 세정 후에, 칩은 공초점 레이저 현미경에 의해 또는 다른 검출 방법, 예를 들어, CCD 카메라에 의해 스캐닝된다. 각각의 배열된 요소의 혼성화의 정량화에 의해, 해당하는 전사체 존재비의 평가가 가능해진다. 이중 색상 형광을 사용하여, RNA의 2가지 공급원으로부터 생성되는 따로 표지된 cDNA 프로브가 어레이에 쌍으로 혼성화된다. 따라서, 각각의 특정 유전자에 해당하는 2가지 공급원으로부터의 전사체의 상대적 존재비가 동시에 결정된다. 소형화된 규모의 혼성화는 표 1, 표 2 및 표 6의 결장안 시그니처 유전자에 대한 발현 패턴의 편리하고 신속한 평가를 제공한다. 마이크로어레이 분석은 제조처의 프로토콜에 따라, 예를 들어, 아피메트릭스 진칩(등록 상표) 기술(미국 캘리포니아주 산타 클라라 소재의 아피메트릭스, 인코포레이티드) 또는 아질런트 마이크로어레이 기술(미국 캘리포니아주 산타 클라라 소재의 아질런트 테크놀로지즈, 인코포레이티드)과 함께 공급되는 것과 같이, 상업적으로 입수할 수 있는 장비에 의해 수행될 수 있다.
3. 추가의 유전자 발현 분석 방법
SAGE는 각 전사체에 대한 개별 혼성화 프로브를 제공할 필요 없이, 다수의 유전자 전사체의 동시의 및 정량적 분석을 가능하게 하는 다른 방법이다. 먼저, 전사체를 독특하게 정량화하기에 충분한 정보를 함유하는 짧은 서열 태그(약 10 내지 14 염기쌍)가 생성되지만, 태그는 각 전사체 내의 독특한 위치로부터 수득된다. 이어서, 많은 전사체는 함께 연결되어 시퀀싱될 수 있는 긴 연속 분자를 형성하여, 다수의 태그의 아이덴티티를 동시에 드러낸다. 임의의 전사체 집단의 발현 패턴은 개별 태그의 존재비를 결정하고 각 태그에 해당하는 유전자를 동정함으로써 정량적으로 평가될 수 있다(예를 들어, 문헌[Velculescu et al., Science 270:484-7, 1995]; 및 문헌[Velculescu et al., Cell 88:243-51, 1997] 참조).
동소 혼성화(ISH)는 대상 유전자의 발현을 검출하고 비교하는 다른 방법이다. ISH는 핵산 혼성화 기술을 적용하고 단일 세포 수준으로 추론하고, 세포화학, 면역세포화학 및 면역조직화학의 기술과 병용하여, 유지되고 동정되어야 하는 세포 마커의 형태의 유지 및 동정을 가능하게 하고, 집단, 예를 들어, 조직 및 혈액 샘플 내의 특정 세포에 대한 서열의 국소화를 가능하게 한다. ISH는 조직의 일부 또는 섹션에(동소에), 또는 조직이 충분히 작다면, 전체 조직(홀 마운트(whole mount) ISH) 내에 하나 이상의 특이적 핵산 서열을 국소화시키기 위하여 상보적 핵산을 사용하는 하나의 유형의 혼성화이다. RNA ISH는 조직 내에서 발현 패턴, 예를 들어, 암 생존 인자-관련 유전자의 발현을 검정하기 위해 사용될 수 있다.
샘플 세포 또는 조직을 그들의 투과성이 증가되도록 처리하여, 프로브, 예를 들어, 암 생존 인자-관련 유전자-특이적 프로브가 세포에 유입되게 한다. 프로브를 처리된 세포에 첨가하여, 적절한 온도에서 혼성화되게 하고, 과잉의 프로브를 세정해낸다. 상보적 프로브는 예를 들어, 자가방사선술(autoradiography), 형광 현미경 또는 면역검정법을 사용하여 조직 내의 프로브의 위치 및 양이 결정될 수 있도록 표지된다. 샘플은 본 명세서에 기재된 바와 같은 임의의 샘플, 예를 들어, 비-종양 샘플 또는 유방 또는 폐 종양 샘플일 수 있다. 대상 암 생존 인자-관련 유전자의 서열이 공지되어 있기 때문에, 이에 따라 프로브가 대상 유전자에 특이적으로 결합하도록 프로브가 설계될 수 있다.
동소 PCR은 ISH 전의 표적 핵산 서열의 PCR 기반의 증폭이다. RNA의 검출을 위하여, 세포내 역전사 단계를 도입하여, 동소 PCR 전에 RNA 주형으로부터 상보적 DNA를 생성한다. 이는 저 카피 RNA 서열의 검출을 가능하게 한다.
동소 PCR 전에, 세포 또는 조직 샘플을 고정하고 투과화시켜, 형태를 보존하고, PCR 시약의 증폭시킬 세포내 서열로의 접근을 가능하게 한다. 대상 서열의 PCR 증폭은 다음으로 유리 슬라이드 상의 조직 섹션 또는 세포원심분리 제제에 직접적으로, 또는 현탁액 중에 유지되는 무손상 세포 중에서 수행한다. 이전의 방법에서, PCR 반응 혼합물 중에 현탁화된 고정된 세포는 통상의 써멀 사이클러(thermal cycler)를 사용하여 열 순환시킨다. PCR 후에, ISH 또는 면역조직화학에 의한 세포내 PCR 산물의 가시화와 함께, 세포를 유리 슬라이드 상으로 세포원심분리하였다. 유리 슬라이드 상에서 커버슬립 하에서 샘플에 PCR 혼합물을 더한 다음, 반응 혼합물의 증발을 방지하도록 밀봉함으로써 동소 PCR을 수행한다. 써멀 사이클링은 유리 슬라이드를 통상의 가열 블록(heating block) 또는 특별히 설계된 써멀 사이클러의 상측에 직접 배치하거나 써멀 사이클링 오븐을 사용함으로써 달성된다.
세포내 PCR 산물의 검출은 일반적으로 2가지 상이한 기술, 즉, PCR-산물 특이적 프로브를 사용하는 ISH에 의한 간접적인 동소 PCR 또는 써멀 사이클링 동안 PCR 산물로 혼입되는 표지된 뉴클레오타이드(예를 들어, 디곡시게닌-11-dUTP, 플루오레세인-dUTP, 3H-CTP 또는 비오틴-16-dUTP)의 직접적인 검출을 통하여 ISH 없이, 직접적인 동소 PCR 중 하나에 의해 달성된다.
검출 방법의 일부 실시 형태에서, 하나 이상의 "하우스키핑" 유전자 또는 "내부 대조군"의 발현도 또한 평가될 수 있다. 이들 용어는 임의의 구성적으로 또는 전반적으로 발현되는 유전자(또는 하기에 논의된 바와 같은 단백질)을 포함하며, 그의 존재는 암 생존 인자-관련 유전자(또는 단백질) 수준의 평가를 가능하게 한다. 이러한 평가는 RNA(또는 단백질) 회수에서의 변이에 대하여 대조군 및 유전자 전사의 전체 구성요소 수준의 결정을 포함한다.
본 발명은 하기의 비제한적인 실시예에 의해 추가로 예시된다.
실시예 1
본 실시예는 본 명세서에 개시된 방법 및 시약을 사용한 결장암 샘플의 범주화를 위한 예시적인 예측 도구의 생성 및 검증을 기재한다. 본 실시예는 본 명세서에 전문이 참고로 포함되는 문헌[Kennedy et al, J. Clin. Oncol., 29(35) 4620-4626, 2011]에서 대상 기술의 발명자에 의해 공개된 재료를 포함한다.
FFPE 유도의 RNA로부터 정확한 발현 데이터를 절단할 수 있는 대장암 81/190 트랜스크립톰 집중 연구 어레이를 개발하였다(대장암 DSA(상표명)(북 아일랜드 소재의 알맥 디아그노스틱스, 리미티드 월드 와이드 웹(almac-diagnostics.com)에서 찾을 수 있음)(문헌[Johnston et al., J Clin. Oncol. 24: 3519, 2006]).
대장암 DSA(상표명) 연구 도구는 61,528개의 프로브 세트를 함유하며, 결장암 및 정상 조직에서 발현되는 것으로 확인된 52,306개의 전사체를 암호화한다. BLAST 분석을 사용하여 미국 국가 생물공학 센터(National Center for Biotechnology Information)(NCBI) 인간 참고 서열(RefSeq) RNA 데이터베이스(월드와이드웹(ncbi.nlm.nih.gov/RefSeq/)에서 이용 가능함)에 대하여 대장암 DSA(상표명) 연구 도구를 비교하여, 21,968개(42%)의 전사체가 존재하며, 26,676개 (51%)의 전사체가 인간 RefSeq 데이터베이스로부터 부재였다. 추가로, 내용물의 7%는 주석을 단 유전자에 대한 발현된 안티센스 전사체를 나타낸다(문헌[Johnston et al., J. Clin. Oncol. 24: 3519, 2006]; 문헌[Pruitt et al., Nucleic Acids Research 33: D501-D504, 2005]). 또한, 선두적인 범용 검정법으로 비교되는 대장암 DSA(상표명)의 프로브-수준 분석에 의해, 대략 20,000개(40%)의 전사체가 선두적인 범용 플랫폼(아피메트릭스(Affymetrix)) 상에 포함되지 않으며, 대장암 DSA(상표명)에 독특한 것이 강조된다. 따라서, 대장암 DSA(상표명) 연구 도구는 지금까지 수행된 유전자 발현 연구에서 입수할 수 없는 전사체를 포함한다. 마지막으로, 대장암 DSA(상표명)를 설계하기 위해 사용되는 전사체 정보가 고효율 시퀀싱 방법에 의해 부분적으로 생성되기 때문에, 다른 범용 마이크로어레이 상에 함유되는 전사체의 3' 말단에 더 가깝게 프로브를 생성할 수 있다. 관련 질환 특이적 내용물 및 3' 기반의 프로브 설계의 조합에 의해, FFPE 유래의 RNA로부터 강력하게 프로파일링할 수 있는 독특한 생성물이 제공된다.
본 연구의 목적은 수술 후 재발 위험이 낮거나 높은 II기 결장암을 정확하게 분류할 수 있는 예후 유전자 시그니처를 생성하고 독립적으로 검증하기 위하여, FFPE 유도의 종양 물질을 사용하여 대장암 DSA(상표명) 연구 어레이의 이용을 평가하는 것이다. 본 실시예에서 사용되는 II기 결장암은 AJCC T3 또는 T4 결정 음성(NO) 비전이성(MO) 결장암이다.
방법
샘플 선택
샘플을 하기의 적격성 기준을 사용하여 후향적으로 수집하였다: 잔류 종양의 증거가 없는 유일한 II기 결장 선암종 1차 수술 시의 45세 이상의 환자 연령 6개 이상의 국소 림프절 평가 최소 50%의 종양 세포가 종양 섹션에 존재 결장암의 가족력이 없음 수술전 암 치료법 또는 수술 1년 내의 수술후 암 치료법 없음(재발 후에 제공되는 치료법이 허용가능하였지만); 및 저위험 환자에 대한 5년의 최소 환자 후속 조치. 저위험 환자는 1차 수술 5년 내에 암 재발이 없는 환자로 정의되었다. 고위험 환자는 1차 수술 5년 내에 전이암 재발이 있는 환자로 정의되었다. 국소 질환 재발이 있는 환자를 배제하였는데, 이는 이러한 재발이 전이 종양보다는 수술 후에 국소 잔류 질환의 결과일 수 있기 때문이다. 샘플을 12개의 센터로부터 수집하였다. 모든 샘플에 병리학자에 의한 독립적인 조직병리학적 검토를 수행하였다. 데이터 세트를 감시, 역학 및 최종 결과 데이터베이스와 비교하여, 이것이 II기 결장암이 있는 일반적인 집단을 나타내게 하였다. 주요 환자 및 종양 특징은 표 3에 제공되어 있다(도 6 참조).
FFPE 조직으로부터의 유전자 발현 프로파일링
전체 RNA를 로슈 하이 퓨어 RNA 파라핀 키트(Roche High Pure RNA Paraffin Kit)(스위스 바젤 소재의 로슈(Roche))를 사용하여 FFPE 종양 샘플로부터 추출하였다. 증폭된 cDNA 표적을 누겐(Nugen) FL-오베이션(Ovation)(등록 상표) cDNA 비오틴 모듈(Biotin Module) v2와 함께 누겐 WT-오베이션(등록 상표) FFPE 시스템 v2를 사용하여 제조하고, 제조처의 지침에 따라 수행하였다. 표지된 단편화 cDNA의 혼성화, 세정, 염색 및 스캐닝을 표준 아피메트릭스 프로토콜에 따라 수행하였다.3.0 내지 3.5㎍의 표지된 단편화 cDNA를 아피메트릭스 7G 스캐너(미국 캘리포니아주 산타 클라라 소재의 아피메트릭스) 상의 대장암 DSA(상표명) 마이크로어레이(영국 크레이개번 소재의 알맥)에 혼성화시켰다. 조작자, 시약 및 재료 로트(material lot)에 더한 표적화된 임상 및 샘플 특성 인자에 대하여 무작화시킨 배취(batch)로의 샘플의 계층화에 수반되는 샘플 프로파일 스케쥴링 전략을 사용하였다. 품질 관리 기준을 적용하고, 생물학적 및 기술적 인자가 저위험 샘플과 고위험 샘플 사이에 균형을 이루게 하였다. 이를 수행하여, 체계적 편향을 최소화하고, 임의의 잔류 기술적 편향을 기술적 변이로 분산시켰다.
분류자 모델 동정
프로브 세트의 차등적 분해의 문제를 피하기 위하여 FFPE 고정 하에 안정하고/거나 유사한 추적 안정성으로 동정된 5,014개의 프로브 세트로 모델 개발을 시작하였다. 5-폴드(fold) 교차 검증의 10회의 반복 동안 재귀적 피처 제거(recursive feature elimination: RFE)에 기초하여 중요한 피처의 선택을 사용하는 부분최소자승법 분류 방법을 사용하여 시그니처 생성을 이후에 수행하였다. 모델 개발의 모든 태양은 가장 낮은 변이와 세기를 갖는 프로브 세트의 50%를 제거하기 위한 초기 여과, 참조-물질 기반의 탄탄한 멀티칩 평균(RefRMA) 정규화 및 요약, 및 각 반복에 가장 적게 중요한 10%의 프로브 세트를 폐기하는 RFE를 포함하는 교차 검증 내에 적절하게 끼워 넣었다. 최종 모델에 포함시킬 피쳐의 총 개수를 교차 검증 하에서 수신 조작 특성 곡선(AUC) 하의 가장 큰 평균 영역을 갖는 피쳐 길이에 의해 결정하였다. 각 모델로부터 예측의 이분화를 위한 임계값을 교차-검증된 트레이닝 데이터로부터의 감수성 및 특이성의 최대 합에 기초하여 선택하였다(문헌[minimum of the Youden J statistic(Youden, Cancer 3:32-35, 1950]). 대체로 동일한 성능을 갖는 다수의 임계값의 경우에, 콕스 비례적 위험 회귀로부터의 위험비(hazard ratio, HR)를 타이브레이커(tiebreaker)로 사용하여, 더 높은 HR 값을 지지하였다.
임상 샘플을 사용하여 동시에 프로파일링시킨 FFPE에 포매된 대장암 세포주(HCT116)의 기술적 반복검증을 예측함으로써 예측의 정밀성을 평가하였다. 이러한 샘플의 반복된 기술적 측정은 모델 개발에 포함되지 않았으나, 높은 반복성 및 재현성을 갖는 모델을 선택할 목적으로, 독립적인 시험 세트로서 총 50회의 교차-검증 트레이닝 서브세트에 의해 예측하였다. 추가로, 순열 시험을 수행하였으며, 여기서, 실제 분류 표지를 무작위로 100회 자리를 바꾸고, 완전한 모델 개발로 이어졌다. 이를 행하여, 어떠한 분류 성능이 유사한 특징을 갖는 데이터 세트로부터의 우연히 예상될 수 있는지를 평가하고, 시그니처 생성 절차에서 임의의 편향을 나타내었다.
공지되어 있는 임상적 인자의 면에서 최종 모델의 독립성을 단일변인 및 다변인 콕스 비례적 위험 회귀를 사용하여 평가하였다. 사용되는 입력은 종양 병기, 환자 종양 등급, 종양 위치, 환자 연령, 환자 성별, 점액소/비점액소 하위유형 및 검색된 림프절의 개수와 함께 예측된 분기 분류 표지였다. 미소부수체(microsatellite) 불안정성을 하나의 인자로 포함시켰는데, 이는 이러한 정보를 대다수의 샘플에 대하여 입수할 수 없었기 때문이다. 유전자 존재론 주석 및 유전자 존재론 생물학적 과정 및 분자 기능의 강화를 최종 시그니처에서의 유전자에 기초하여 내부적으로 개발된 도구를 사용하여 수행하였다. 오류발견률(false discovery rate) 다중 시험 보정을 갖는 초기하 분포를 사용하여, 상당히 농축된 유전자의 기능적 분류를 결정하였다. 경로 분석을 정교한 경로 분석(Ingenuity Pathway Analysis)의 사용을 통해 생성하였다(미국 캘리포니아주 레드우드 시티 소재의 인제뉴어티 시스템즈(Ingenuity Systems)).
샘플의 균형유지, 무작위화 및 품질 관리(Quality Control: QC)
표적 집단: 어레이를 트레이닝하는데 사용되는 집단을 매치시켜, SEER 및 CRUK 데이터베이스로부터의 일반적 집단 특성을 반영하였다. 고려되는 하기의 특성을 다음과 같았다.
ㆍ성별. II기 집단 중의 성별의 유병률은 대략 50 내지 60%의 남성(영국에서는 56%, 미국에서는 57%)이었다.
ㆍ종양 위치(원위/근위). II기 집단에서의 유병률은 근위가 대략 55% 내지 65%이고, 원위가 35% 내지 45%이다.
ㆍ환자 연령. 2001년 내지 2005년의 미국국립암센터의 SEER 암 통계 개요 결장 및 직장 섹션에 따라, 0.1%의 환자가 20세 미만에서 20 내지 34세에 1.0%; 35 내지 44세에 3.7%; 45 내지 54세에 11.6%; 55 내지 64세에 18.3%; 65 내지 74세에 25.1%; 75 내지 84세에 28.2%; 그리고 85세 이상의 연령에 12.2%가 진단되었다.
ㆍ재발-부재 생존율. II기 집단에서 재발-부재 생존율은 13% 내지 22%이고(문헌[Gattaj et al, European Journal of Cancer, 2006]), SEER 데이터베이스로부터 약 30%인 것으로 보고되었다.
ㆍ사전-균형유지: 혼성화를 위해 제시된 샘플 세트가 상기 제시된 일반 집단 통계를 유지하면서 선택된 임상 공변인에 대하여 균형을 유지하도록 사전-균형유지를 수행하였다. 이에 의해, 재발-부재 생존을 배제하고, 이를 의도적으로 풍부하게 하여, 바이오마커 발견의 능력을 증가시켰다. 트레이닝 세트는 5년 후에 사건을 갖는 임의의 샘플을 함유하지 않은 반면, 이는 검증 세트에서의 제약이 아니었다. 시그니처 생성(즉, 트레이닝 세트에서)을 위해 5년 후에 재발하는 샘플을 사용하지 않는 이유는 바이오마커 발견을 수행하는 경우 추가의 이종성을 샘플 집단에 도입하는 것을 피하려는 것이다.
균형유지 절차의 주요 목적은 종점(2차 변인으로 나타내는 고/저 위험)과 후술되는 임의의 인자 간의 연관성(존재한다면)을 감소시키는 것이었다. 이들 인자와 고/저 위험 종점 간의 임의의 연관성은 어레이의 임상적 유용성을 제한할 수 있는 혼란을 도입할 것이다. 603개의 대장 샘플을 사전-균형유지로 처리하여, 예후와 하기의 임의의 인자 간의 강력한 연관성을 감소시켰다: 성별, 장 내의 종양 위치 환자 연령 기여 센터 FFPE 블록 시기(수술일); 종양 내용물 및 RNA 품질.
콜모고로브-스미르노프(Kolmogorov-Smirnoff) 시험을 사용하여 연속 파라미터를 시험하고, 범주 파라미터를 카이-스퀘어(chi-squared) 시험을 사용하여 시험하였다. 모든 파라미터에 대한 0.4의 p-값은 균형유지를 달성하는데 필요하였다. 504개의 샘플은 균형유지 후에 유지되었으며(335개의 저위험 및 169개의 고위험), 어레이 프로파일링에 제시하였다.
ㆍ어레이 프로파일링 동안의 샘플의 무작위화: 샘플의 무작위화를 공지되어 있는 기술적 및 생물학적 인자, 주로 대상 종점(예후) 간의 교란을 피하기 위하여 수행하였다. 이러한 연구 오퍼레이터에서, 혼성화-세정-염색 (HWS) 키트 로트, 검정법 로트 및 검정법 배치를 기여 센터 및 예후와 함께 고려하였다. 각 어레이 배취가 동일한 비율의 예후와 기여 센터를 갖도록 먼저 어레이 배치로 무작위화시켰다. 이어서, 오퍼레이터를 이용가능성에 따라 각 어레이 배치에 할당하였다. 이어서, 각 어레이 배치를 HWS 키트에 할당하여, 각 오퍼레이터가 동일한 비의 각 키트에 사용되게 보장하였다. 어레이 로트를 각 어레이 배치에 할당하여, 그들이 어레이 배치 중에 균일하게 분포되게 하였다.
트레이닝 데이터의 품질 관리: QC 절차를 주로 다양한 품질-관련 파라미터를 함유하는 아피메트릭스 RPT 파일 내의 값에 기초하여, 생성된 어레이에 적용하였다. 모든 샘플에 대한 각 파라미터를 위한 분포의 시각적 조사에 기초하여, 한계를 계산하였다: %는 판단을 나타내며(20%가 요구됨); 이미지 아티팩트(artefact)를 확인하여, 뚜렷한 반점이 있는 어레이를 제거하고 Q 잔류 및 호텔링즈(Hotelling's) T2에 기초하여, 주성분분석(PCA)으로부터 가외치를 검출하였다.
성별 유전자의 평가를 사용하여, 관찰된 발현 수준이 임상 정보에 공지되어 있는 성별과 매치되는 것을 결정하였다.
또한, 하기의 아피메트릭스 품질 파라미터를 광범위하게 다음과 같이 범주화되는 분포의 가시적인 검사 동안 고려하였다: RNA 품질: 신호 품질 및 검출 호: 백그라운드 및 노이즈: 및 백그라운드 균질성.
총 319개의 대장 샘플을 QC 절차를 통과시켰다. 직장 샘플에 의해 도입되는 이질성을 시사하는 예비 결과 때문에, 결장 샘플을 제거하여, 249개 콜로니 세트를 형성하고, 이를 최종(QC 후) 균형유지를 위해 제시하였다.
ㆍ최종 QC-후 균형유지: QC를 통과한 249개의 결장 샘플을 저위험 및 고위험 그룹 둘 모두에서와 유사한 호 분포를 제시한 %에 대한 기준의 부가와 함께(이러한 정보는 오직 혼성화후에만 이용가능하다) 동일한 원래 사전-균형유지를 사용하여 균형을 유지하였다. 215개 샘플의 최종 세트는 QC 및 균형유지 후에 유지되었다.
215개 샘플이 있는 최종 결장 세트는 공지되어 있는 집단 분포에 비하여 하기의 특성을 갖는다: 성별: 53% 남성(집단 내의 50-60%); 종양 위치(원위/근위): 62% 근위(집단 내의 55-65% 근위); 환자 연령: 집단의 연속 분포를 거의 따름: 및 34% 불량한 예후(고위험). 집단에 비해 의도적으로 약 15 내지 20% 풍부함.
ㆍ검증 세트 및 장래의 샘플 세트의 품질 관리: 트레이닝 세트 상의 맞춤 제작된 QC 절차를 사용하는 것은 고 품질 데이터 세트로부터의 바이오마커의 동정을 용이하게 하기 위한 중요한 단계이다. 그러나, 장래의 샘플의 예측을 위하여, QC는 한 번에 하나의 샘플 상에 적용되어야 한다. 또한, QC 절차는 데이터가 생성되는 시스템 및 데이터 세트에 너무 특이적일 수 없다. 이러한 목적을 위하여, 개별 평가를 2가지 시스템 및 스캐너에 복제되는 40개의 샘플을 사용하여 수행하여, 시스템을 가로질러 안정한 QC 파라미터를 확인하였다. AvgSigA 파라미터(부재의 프로브 세트의 평균 신호)는 상이한 시스템에 걸쳐 가장 안정한 파라미터이며, 이에 따라 시스템-독립적 QC 절차에 대한 최적의 후보물질인 것으로 결정되었다. 이러한 파라미터를 위하여, 더 높은 값은 더 낮은 품질을 암시하며, 더 낮은 값은 더 높은 품질을 암시한다. AvgSigA 값은 통상적으로 사용되는 QC 파라미터이며 트레이닝 세트에 사용되는 1차 QC 파라미터인 % 제시 호 파라미터와 강력하게 음으로 상호관련이 있다. 트레이닝 세트로부터의 % 제시 호의 하위 허용 값을 20%로 설정하였으며, 이는 대략적으로 이러한 데이터 세트에 대한 AvgSigA 파라미터에 대한 43의 상위 허용 값에 해당한다. 보다 신생의 FFPE 샘플을 수용하기 위하여, AvgSigA 상에 하위 임계값을 도입하는 것을 결정하지 않았다(이는 고품질 샘플의 포함을 가능하게 할 것이다). 이에 따라, 이러한 연구로부터 유래된 최종 포함 범위는 43 이하인 AvgSigA였으며, 이는 독립적인 검증 세트에 적용되는 QC 미터법이었으며, 장래의 샘플에 적용될 QC이다.
ㆍFFPE 블록 시기에 대하여 안정한 프로브 세트의 동정: mRNA 전사체가 FFPE 샘플 중에서 상이한 비율 및 상이한 수준으로 분해되기 쉬우며, 이는 오래된 물질로부터 생성되는 시그니처가 신선한 FFPE 물질에서 예상되는 것만큼 수행되지 않은 것을 야기할 수 있음이 인식되었다. 따라서, 2가지 독립적인 종적인 연구를 수행하여, FFPE 블록 시기에 걸쳐 안정한 프로브 세트를 동정하였다. 제1 연구에서, 9개의 FFPE 블록은 연속 섹션화하고, 고정 후 16주의 시간에 7개의 시점에 DNA 마이크로어레이에 의해 분석하였다. 이들 샘플은 1년 기간에 3회의 6개월 간격에 제2 종단 연구에 의해 보충되었으며, 여기서, 8개의 FFPE 블록은 6개월 내지 4년의 시기 범위였으며, 이를 연속 섹션화하고, DNA 마이크로어레이에 의해 분석하여, 분석을 위한 113개의 개별 샘플을 야기하였다. 시간에 따라 추가의 분해를 겪지 않거나, 고정 후에 동등한 속도로 파괴되는 5014개의 전사체를 동정하였다. 프로브 세트의 목록을 이후에 시그니처 생성을 위해 사용하였다. 본 연구로부터 상세 사항을 제시하기 위한 개별 매뉴스크립트(manuscript)는 준비 중에 있다.
ㆍ모델 개발 동안 분류자의 정밀성 평가: 기술적 반복검증으로부터 동일한 산출량을 지속적으로 생성하는 분류자의 능력은 시험 설정에 사용되는 검정법의 중요한 태양이다. 이러한 목적을 위하여, 동일한 대장암 세포주(HCT114)의 기술적 반복검증인 39개 참조 샘플의 세트를 임상 샘플과 함께 혼성화시켰다. 모델 개발 동안 이러한 세트는 교차-검증 동안 외부 시험 세트로 예측하여, 모델 개발 과정의 각 단계에서 상대 변인을 추정하였다. 교차-검증 동안 트레이닝 세트 및 39개 샘플 참조 세트 간에 정보가 공유되지 않았다. 예측된 시그니처 점수로부터의 표준 편차를 계산하고, 95% 신뢰 한계를 갖는 평균으로 가시화시켰다. 가변성은 더 긴 시그니처에 대하여 낮았으며, 이는 이어서, 피처 선택 절차에 걸쳐 점차 증가하며, 이는 또한 더 짧은 시그니처에 대한 더 낮은 정확성(AUC)에 반영된다. 선택된 시그니처 길이(634개 프로브 세트)에서, 모델은 높은 정밀성과 정확성을 보인다.
ㆍ분류 성능의 순열 분석: 순열 분석을 수행하여, 어떠한 분류 성능의 것이 유사한 특성을 갖는 데이터 세트로부터 예상될 수 있는 지를 평가하였다. 실제 분류 표지(즉, 실제 예후)를 무작위로 다시 셔플링시키고, 이후에 전체 모델 개발 과정(여과, 정규화, 피처 선택 및 분류를 사용한)을 반복함으로써 이를 수행하였다.시그니처 성능은 여기서, 프로브 세트의 개수가 634개인 선택된 것에서 특이적으로, 그리고 더 긴 시그니처 길이에서의 기회보다 유의미하게 더 낫다. 추가로, 순열 시험에 의해, 분류자를 개발하는데 사용되는 데이터 세트 및/또는 방법에서 임의의 근원적인 편향을 드러냈다. 무작위 표적 상의 AUC 중앙값은 0.5이며, 이는 사용되는 절차에서 명백한 편향이 존재하지 않는 것을 확인하는 기회를 나타낸다.
결과
FFPE 조직으로부터의 II기 결장암 예후 시그니처의 개발
5년의 질환-부재 생존을 이러한 연구를 위한 1차 종점으로 사용하였다. 임상 인자에 대하여 균형을 유지하고, 품질 관리 기준을 초기 데이터 세트에 적용한 후에, 215명의 환자(142명의 저위험 및 73명의 고위험 환자)의 트레이닝 세트를 확인하였다. 50% 분산 -세기 여과, RefRMA 정규화, RFE 피처 선택 및 부분 최소 자승 분류를 분류 성능의 평가를 위하 5-폴드 교차 검증의 10회의 반복 하에 수행하였다. 교차 검증에 의해, 634-전사체 시그니처가 예후 분류에 대하여 최적인 것이 나타났다. 0.68의 AUC(P < .001)를 갖는 수신자 조직 특징 곡선을 생성하였으며, 이는 시그니처 점수와 예후 간의 유의미한 관련성을 나타낸다(도 3a). 관찰된 AUC는 순열 분석에서 무작위보다 유의미하게 더 높았으며, 기술적 반복검증으로부터 정밀성의 평가에서 낮은 분산을 나타내었다. 시그니처 예측 점수의 이분화를 위한 0.465의 임계값을 문헌[Youden J statistics]으로부터 확립하여, 2.62의 HR을 제공하였다(P < .001; 도 3b). 표 4는 교차 검증 동안 시그니처 생성에 대한 분류 성능의 요약을 포함한다.
[표 4]
95% 신뢰 구간(CI)은 교차 검증(트레이닝 세트) 또는 1,000회의 반복을 사용한 부트스트랩핑(bootstrapping)(검증 세트)으로부터의 ±2 표준 편차 각각 NPV 및 PPV를 계산하는 경우, 이전의 80% 및 20%가 사용된다. 임계값 t=0.465를 시그니처 점수의 이분화를 위해 사용하였다. 약어: AUC, 수신자 작동 특징 곡선 아래 영역 HR, 위험비 NPV, 음성 예측 값(음성은 낮은 위험이다); PPV, 양성 예측값(양성은 높은 위험이다).
ㆍII기 결장암 예후 시그니처의 독립적인 검증: 예후 시그니처를 트레이닝 세트에서 확인된 임계값 점수를 사용하여 재발이 풍부한 144명의 환자(85명의 저위험 및 59명의 고위험 환자)의 독립적인 검증 세트에 적용하였다. 샘플 분석을 따로, 그리고 이후에 트레이닝 세트에 수행하였다. 시그니처에 의해, 고위험 그룹에서 2.53의 HR(P < .001)을 갖는 질환 재발이 예측되었다(도 4 및 표 4). 또한, 시그니처에 의해, 고위험 그룹에서 2.21의 HR(P < .0084)을 갖는 암-관련 사망이 예측되었다(도 5).
본 명세서에 기재된 시그니처가 FFPE 유래의 종양 물질로부터 개발되었다는 사실에 의해, 기존의 FFPE 종양 은행의 회고적 분석에 기초한 대규모 검증 전략이 용이하게 한다.
위험비는 저위험으로 분류자에 의해 확인된 환자에서 발생하는 사건의 위험의 비로서의, 고위험으로 분류자에 의해 확인된 II기 결장암 환자에서 발생하는 사건의 기회 또는 위험의 표현이다. 수술 후 5년 내에, 불량한 예후를 갖는 것으로 예측된 것에 비하여 양호한 예후를 갖는 것으로 예측된 그룹에 대한 유의미하게 더 낮은 재발 가능성이 있었다. 음성 예측 값은 정확하게 진단된(예측된 음성) 음성 시험 결과를 갖는 환자의 비율이다(예측적 음성). 예후 설정에서, NPV는 질환 재발의 유병률에 좌우된다. 양성 예측 값은 정확하게 진단된 양성 시험 결과를 갖는 환자의 비율이다(예측적 양성). 예후 설정에서, PPV는 질환 재발의 유병률에 좌우된다. 20%의 불량한 예후 샘플의 집단 유병률에 기초하여, 이는 예측된 불량한 예후를 갖는 환자가 33%의 재발 가능성을 가지며, 예측된 양호한 예후를 갖는 환자가 5년 내에 13%의 재발 가능성을 갖는 것을 암시할 것이다.
ㆍ공지되어 있는 예후 인자로부터의 시그니처 독립성의 평가: 유용한 예후 검정법을 위하여, 이는 임상에 사용되는 공지되어 있는 예후 인자로부터 독립적으로 수행하여야 한다. 따라서, 검정법의 독립성을 단일변인 및 다변인 분석 둘 모두에서 평가하였다(표 5).
[표 5]
단일변인 및 다변인 분석 둘 모두를 로그-우도비 시험으로부터 비롯된 P 값을 갖는 콕스 비례적 위험 회귀를 사용하여 수행하였다. 종양 등급에 대하여, 1 등급을 HR의 계산을 위한 참조점으로 사용하였다. 환자 연령 및 검색된 결정의 개수를 연속 인자로 분석하였다. 환자 연령의 HR의 해석은 1세의 연령의 변화에 대한 증가된 위험이며, 이에 부응하게, 검색되는 결절의 개수의 HR의 해석은 검색된 결절의 증가에 대한 증가된 위험이다. 약어: HR, 위험비.
예후의 예측은 단일변인(P < .001) 및 다변인(P < .001) 분석 둘 모두에서 유의미하였으며, 이는 시그니처가 통상의 위험 인자에 더하여 예후 정보를 제공하는 것을 입증한다. 추가로, 시그니처의 독립성은 샘플 중의 림프혈관 침윤의 첨가를 사용하여 평가하였으며, 이를 기록하였다(검증 세트에서 144개의 샘플 중 100개). 시그니처를 단일변인(P < .001) 및 다변인(P < .001) 분석에서 독립적으로 수행하였다.
ㆍ예후 시그니처에서 유전자의 기능 분석: 다음으로, 검정법에 의해 결장암 재발과 관련이 있는 것으로 공지된 생물학적 과정이 검출되는지를 구하였다. 634개의 프로브 세트를 정교한 경로 분석을 사용하여 분석하고, 통계적으로 유의미한 경로의 목록을 확인하였으며, 그의 최상위는 IGF-1 신호전달이다.
논의
본 명세서에 개시된 바와 같이, II기 결장암을 위한 수술 후에 재발의 위험이 더 높은 환자를 확인하는 DNA마이크로어레이-기반의 검정법을 개발하였다. 구체적으로, 시그니처에 의해, 독립적인 검증 세트에서 2.53의 재발의 HR 및 2.21의 암-관련 사망의 HR이 있는 고위험 코호트를 확인하였다. 완전하게 분리된 세트를 사용한 예후 검정법의 검증은 트레이닝 세트로부터 시그니처의 성능의 과대평가를 피하는데 필요하다. 재발에 대한 2.53의 HR은 현재 임상에서 결정하는데 사용되는 조직 인자와 유리하게 비교되며, 이는 통상 대략 1.5 이하의 HR을 갖는다. 더욱이, 시그니처는 개별 해석을 필요로 하지 않으며, 통상적인 조직병리학 인자보다 더욱 표준화된 방법을 제공할 수 있다. 중요하게는, 검정법은 FFPE 조직에서 수행되고, 이에 따라 현재의 의료 행위에서 용이하게 적용된다.
비록 몇몇 암 유형에서 몇몇 DNA마이크로어레이 기반의 예후 시험이 공개되었지만, 오직 하나가 임상 시험에 도입되며, 현재까지 결정암에서 사용되지 않았다. 이는 2가지 주요 인자의 결과일 수 있다. 먼저, 많은 시그니처를 신선한 또는 동결된 조직으로부터 개발하였다. 두 번째로, 부적절한 연구 방법은 독립적인 데이터 세트에서 시험 입증의 실패를 야기하였다.
동결된 조직 샘플의 이용에 관하여, 일어한 조직 유형이 뛰어난 마이크로어레이 데이터를 제공하지만, 이러한 조직으로부터 생성되는 시험은 FFPE 조직에서 부적당하게 수행될 것 같다. 이에 의해, 예후 시험을 개발하고, 이를 독립적으로 검증하기 위하여 충분한 샘플을 수집하는데 어려움이 생길 수 있다. 또한, 신선한 조직 기반의 검정법의 이행은 샘플이 수술 시에 수집될 필요가 있기 때문에, 임상 시험에서의 변화를 필요로 한다.
FFPE는 종양 보관을 위한 표준물질이며, 검정법 개발을 위해 이미 수많은 종양 은행이 존재한다. 중요한 것은, 샘플 수집 및 처리에서 FFPE-기반의 검정법의 개발 및 임상적 이행을 위해 변화가 필요하지 않다는 것이다.
FFPE 조직을 사용하나, DNA 마이크로어레이 플랫폼을 사용하여 운용하여, 이에 의해, 정량적 중합효소 연쇄 반응 기술에 비하여 생물학적 과정과 검출 가능한 mRNA 전사체의 수를 크게 증가시키기 위한 개시된 방법을 개발하였다. 마이크로어레이 플랫폼을 사용한 FFPE 물질을 사용한 결과로서, 몇몇 방법의 문제가 고려될 필요가 있다. 포르말린 고정은 RNA의 단백질로의 교차 결합을 통하여 mRNA 전사체의 분해를 야기한다. 이러한 분해의 대부분이 즉시 발생하나, 일부 전사체는 시간에 따라 계속 분해한다. 연구를 위해 사용되는 DNA마이크로어레이 플랫폼은 mRNA 전사체의 3' 말단에 대하여 설계된 프로브 세트를 가져, 분해된 전사체를 검출하는 능력을 증진시킨다. 또한, 결장암 샘플의 개별 세트를 시간에 따라 분석하여, 프로브 세트를 혼입시킬 수 없었음을 보장하였다. 시그니처의 일부로서 불안정하거나 달리 안정한 mRNA 전사체를 검출하는 프로브 세트가 혼입되지 않았음을 보장하였다.
시그니처의 예측 값은 공지되어 있는 예후 임상 공변량의 초과이거나 미만이다. 이러한 성능은 대체로 적절한 트레이닝 세트의 확립의 일부로 수행하였던 생물학적 및 기술적 인자에 대한 예후의 초기 균형유지에 기여할 수 있다. 고려되는 생물학적 인자는 공지되어 있는 예후 인자, 예를 들어, pT 병기 및 등급뿐 아니라 종양 위치, 환자 연령 및 성별을 비롯한 영향을 받은 유전자 발현을 가질 수 있는 다른 비예후 인자를 포함한다. 또한, 기술적 인자, 예를 들어, FFPE 블록 시기 및 기여 센터는 트레이닝 세트에서 고위험 및 저위험 샘플 간에 균형을 유지시켰다. 또한, 작동자 및 시약 키트의 무작위화를 수행하여, 기술적 인자와 공지되어 있는 임상적 인자 간의 교락을 피하였다. 이는 검정법이 작동자에 좌우되거나, 특정 센터로부터 샘플의 이용 또는 특정 시약의 배취의 이용에 좌우되는 위험을 최소화시켰다. 공지되어 있는 예후 인자로부터 독립적인 검정법을 개발하였기 때문에, 본 발명자들은 몇몇 인자를 도입한 멀티파라미터 시험을 개발하여, 심지어 더욱 정확한 예후 지시자(indicator)를 제공하는 것이 가능할 수 있는 것으로 여겼다.
유전자 시그니처의 기능 분석에 의해, IGF-1 신호전달, TGF-β 신호전달 및 HMGB1 신호전달이 동정돤 가장 유의미한 경로 중 하나인 것이 드러났다. 이들 모두는 종양 성장의 증진, 침윤 및 전이 및 아폽토시스의 예방을 통하여 결장암에서 불량한 예후를 부여하는 것으로 이전에 보고되었다. 결론적으로, FFPE 보관된 종양 조직으로부터의 II기 결장암에 대한 검증된 강력한 예후 DNA 마이크로어레이 시그니처가 본 명세서에 개시된다.
개시된 시그니처는 내과의가 재발의 위험 및 보조제 화학요법으로부터 유익할 가능성에 관하여 더욱 정통한 임상 결정을 하게 할 수 있다(문헌[Andre et al., Annals of Surgical Oncology 13:887-898, 2006]; 문헌[Diaz-Rubio et al., Clin. Transl. Oncol. 7: 3-11, 2005]; 문헌[Monga et al., Ann. Surg. Oncol. 13: 1021-1134, 2006]; 문헌[Sobrero, Lancet Oncol. 7: 515-516, 2006]). 추가로, 많은 환자는 그들의 치유 가능성과 치료 위험/이익을 알고 싶어 한다(문헌[Gill et al., J. Clin. Oncol. 22: 1797-1806, 2004]; 문헌[Kinney et al., Cancer 91: 57-65, 2001]; 문헌[Carney et al, Ann. R. Coll. Surg. Engl. 88: 447-449, 2006]; 문헌[Salkeld, Health Expect 7: 104-1014, 2004]). 환자의 예후를 예측할 수 있는 것은 임상의 및 환자에게 더 나은 위험/이익의 평가 및 치료법의 선택을 제공한다. 개별화된 환자 관리를 제공하는 능력은 잘된다면 이들 환자에 대한 향상된 생존 및 삶의 질을 야기할 것이다.
과거에, 많은 연구는 확실한 통계적 증거의 결여에 대한 1차적 이유로서 샘플 크기가 원인임을 보여주며, 더 큰 시험이 보조 치료의 이익을 입증하는데 필요함을 시사한다. 검증된 예후 마커, 예를 들어, 이러한 연구에서 생성되는 유전자 시그니처를 사용하여, II기 환자를 고위험 및 저위험 하위-집단으로 계층화할 수 있다. 이러한 방법은 높은 재발 위험 환자에 집중함으로써 개선된 임상 시험 설계를 보조할 수 있으며, 이에 따라 보조 치료법으로부터 이익을 더욱 유도할 것 같다. 따라서, 대장암 DSA(상표명)는 임상 시험에서의 포함에 대해 환자를 계층화하기 위한, 보조 치료 및 신보조 치료에 관한 결정을 위한, 그리고, 추가의 약물 개발을 위한 신규한 경로 또는 분자 표적의 동정을 위한 유용한 연구 도구일 수 있다.
표 6에 보고된 예후 시그니처는 II기 결장암에 대한 재발을 정확하게 예측하며, 독립적인 FFPE 검증 세트에서 평가한다. 이들 이질적 질환애 대한 재발의 예측을 위한 전반적인 정확성은 현저하였다. 20% 불량한 예후 샘플의 집단 유병률에 기초하여, 이는 불량한 예후가 예측된 환자가 33%의 재발 가능성을 갖는 한편, 양호한 예후가 예측된 환자가 5년 내에 13%의 재발 가능성을 가짐을 암시할 것이다. 현재의 방법의 주요 이점 중 하나는 이것이 대다수의 이용가능한 조직 은행에 대한 바람직한 보관 방법인 FFPE 조직으로부터의 발현 프로파일링에 기초한다는 것이다(문헌[Abramovitz Proteome Sci. 4:5, 2006]). FFPE 조직 샘플로부터 추출되는 RNA는 분해 및 포르말린-유도 변형에 기인하여 더 짧은 길이 중앙값을 갖는 경향이 있으며, 이는 범용의 어레이가 검출하기 어렵게 만든다. 결장암 트랜스크립톰을 정의하는 경우, 각 전사체의 3' 첨단에 대한 프로브세트의 설계를 용이하게 하는 3'-기반의 시퀀싱 방법을 사용하였다. 이러한 방법은 훨씬 더 높은 탐지율을 보장하며, 이에 따라 신선하게 동결된 및 FFPE 조직 샘플 둘 모두로부터 RNA 전사체를 검출하기 위해 최적으로 설계된다. 현재의 연구로부터의 결과에 의해, 알맥 디아그노스틱스 대장암 DSA(상표명) 연구 도구가 FFPE 유도 조직으로부터 생물학적으로 의미있고, 재현성있는 데이터를 생성할 수 있음이 나타났다.
실시예 2
암의 예후
본 실시예에는 결장암으로 진단된 대상체를 예후하는데 사용될 수 있는 특정 방법이 기재된다. 그러나, 당업자는 또한 이들 특정 방법으로부터 이탈된 방법을 사용하여, 결장암 대상체의 예후를 성공적으로 제공할 수 있음을 인식할 것이다.
종양 샘플 및 인접 비-종양 샘플을 대상체로부터 수득한다. 예를 들어, 세침 흡인물을 사용하여 각 샘플 유형에 대해 대략 1㎍ 내지 100㎍의 조직을 수득한다. RNA 및/또는 단백질을 통상의 방법을 사용하여(예를 들어, 상용의 키트를 사용하여) 종양 및 비-종양 조직으로부터 단리한다.
일 예에서, 결장암 종양의 예후는 마이크로어레이 분석 또는 실시간 정량적 PCR에 의해 대상체로부터 수득되는 종양 샘플에서 표 1, 표 2 및/또는 표 6의 2개 이상의 전사체의 발현 수준의 검출에 의해 결정된다. 예를 들어, 개시된 유전자 시그니처가 사용될 수 있다. 종양 샘플에서의 상대적 발현 수준은 대조군(예를 들어, 대상체로부터의 인접 비-종양 조직으로부터 단리된 RNA)과 비교된다. 다른 경우에, 대조군은 참조 값, 예를 들어, 건강한 대상체 또는 암 대상체의 그룹으로부터 수득되는 비-종양 샘플에 존재하는 이러한 분자의 상대적 양이다.
본 발명의 원리가 적용될 수 있는 많은 가능한 실시 형태의 관점에서 예시된 실시 형태를 인식하여야 한다.
SEQUENCE LISTING
<110> Almac Diagnostics Limited
Harkin, Denis Paul
Proutski, Vitali
Black, Julie
Kerr, Peter
Kennedy, Richard
Winter, Andreas
Davison, Timothy
Bylesjo, Max
Farztdinov, Vadim
Wilson, Claire
Holt, Robert James
<120> Colon Cancer Gene Expression Signatures and Methods of Use
<130> ADL-0311WP
<150> US 61/435,922
<151> 2011-01-25
<160> 636
<170> PatentIn version 3.5
<210> 1
<211> 76
<212> DNA
<213> Homo sapiens
<400> 1
ctgttttttc ccgtgtagat ttctgatact tcaatcccct actcccccaa aacagttgaa 60
gcccagccca ctctta 76
<210> 2
<211> 87
<212> DNA
<213> Homo sapiens
<400> 2
ccggtatacc aagggagcca gttgtgttca gacacacaca tcacagcttg actcactaac 60
tgaggccttt ccatagctcc acagctt 87
<210> 3
<211> 75
<212> DNA
<213> Homo sapiens
<400> 3
ttggccagtg tgttttctaa gtcaattcta gtgtgtttca tcctcacctc ttccctctgt 60
ggctttgatg atgga 75
<210> 4
<211> 220
<212> DNA
<213> Homo sapiens
<400> 4
aggctggtct taactgactg ctttttatta ttaccatgca ctggcaattc caaacaatgt 60
cagtgttaaa atgcttctcc ctgaaaaaga gaaaaaaaaa aggaaaaaaa gaaaagaaaa 120
gtgaaaagaa aaactcttat tggcctaagt tctaaataat agctaggtta ccactgagtt 180
ttaactatat gtatatgagc ttcaaataag caccttttta 220
<210> 5
<211> 138
<212> DNA
<213> Homo sapiens
<400> 5
aaatgctgca gcaggtatgt gcagaggcca gaaccaagat gggatttccc tgctgaacta 60
tgtgagatgc tgcatttcta tgttgtgttt gctctgatgc agcagtaagt tttttgattc 120
acttagacca gcacatta 138
<210> 6
<211> 239
<212> DNA
<213> Homo sapiens
<400> 6
gaaggtcagg actttgtgaa catataaaac tgcagatggc tattagatat ccaagtagag 60
atgctgaaga gatgaatgta tatagaagtc tgaatttggg agagagatct ggataggaga 120
tacttacctg gtgtttaaca gcttacagat tgtgtaaagt catgaaacgg ataagaacct 180
taaaagagag aaaagggaat agaggttacc aaatgaattg cagtttccaa attgcagag 239
<210> 7
<211> 253
<212> DNA
<213> Homo sapiens
<400> 7
ctctgatttg cacacctgaa aatcgcggaa ttgagtttcg atagattgat ttttaaaact 60
tttttggagt agggggtata ggggaatcat ttaatttaaa tcattaagat tcccctgctc 120
aaacccagat tcctgtgtac agatgctatt tagagggaat cagaaaaatg ccaagccttt 180
tctctttgaa tgtgctattt ttataactga acttgtacat atgtataaag agagacacat 240
cttcctttta cta 253
<210> 8
<211> 42
<212> DNA
<213> Homo sapiens
<400> 8
gcttccttgc ctgatgacaa taaagcttgt tgactcagct aa 42
<210> 9
<211> 289
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (258)..(258)
<223> n is a, c, g, or t
<400> 9
gggtcagaaa gatgccttca gttttggtca gtgtctaaaa gttaagtctg tttaggccaa 60
gcatggtggc tcacgcctga aatcccagca cttggggagg ccgaggcaag tggatcacaa 120
ggtcaggaga tgagaccatc ttagccaaca tggtgaaacc ccgtctctac taaaatacaa 180
aaaaattagc caggcgtggg ggtgcgtgcc tataatccca gctacttggg aggctgaggc 240
aggggaatcg cttgaacncg ggaggcagag gtcacgccat ggactccag 289
<210> 10
<211> 293
<212> DNA
<213> Homo sapiens
<400> 10
ctttctaaaa gttgcatgtt atgtgagtca gcttatagga agtaccaaga acagtcaaac 60
ccatggagac agaaagtaga atagtggttg ccaatgtctc agggaggttg aaataggaga 120
tgaccactaa ttgatagaac gtttctttgt gtcgtgatga aaactttcta aatttcagta 180
atggtgatgg ttgtaacttt gcgaatatac taaacatcat tgatttttaa tcattttaag 240
tgcatgaaat gtatgctttg tacatgacac ttcaataaag ctatccagaa aaa 293
<210> 11
<211> 64
<212> DNA
<213> Homo sapiens
<400> 11
agcaagctta ctaaaaactg cacttcacac ttagcttaat gtttgaggga attaacttca 60
taaa 64
<210> 12
<211> 113
<212> DNA
<213> Homo sapiens
<400> 12
accatggcaa cgaggtagtc tgttctattt ttggagtatg aaagtagtgc cttcttaaat 60
ctaataataa atgagagttc cagaaaacca gtgcttcaaa caaatttgat tta 113
<210> 13
<211> 227
<212> DNA
<213> Homo sapiens
<400> 13
tgggcttaaa actcagctct gccacttaca ttcctcattt ctttctatcc tgggtctgcc 60
aaaatgtaag aaaagttttc acattttttt accagttttt ctcacccatg accaccctgt 120
ctcaaaatga ttatgcaaca gcccagagtc ccccattcca aaattctttg caaagagcaa 180
gatttccctc gctatttctg aattcatcca cacctctatt tctctct 227
<210> 14
<211> 170
<212> DNA
<213> Homo sapiens
<400> 14
actccccaag ggttctcaat tctcttttcc caggctcgtc catgactgtt tcttgtcctc 60
agagcccttg ccttccttgc tgcctcctca gtcccattct ctgtctcttt cagcggcccc 120
atccttatct accttcccca gtgcatccca gaaaaacatc tgtcccttcc 170
<210> 15
<211> 78
<212> DNA
<213> Homo sapiens
<400> 15
cctgagcttg ggtgactcat tgtgtgctaa gaaaaaaaat caaatttcag aacatgcgag 60
acctcgaccc aggtaaat 78
<210> 16
<211> 211
<212> DNA
<213> Homo sapiens
<400> 16
gactggagaa agaagaggtg gcataggatt gactaagatg aaggaagggg gccaggcgtg 60
gtggctcacc cctgtaaccc caacactttg ggaggctgag gcgggcagat cacctgaggt 120
caggaattca agaccagcct ggccaacatg gtgaaacccc atctctacta aaagtacaaa 180
aattagccag gcggtagtgg tgtgtgccta t 211
<210> 17
<211> 275
<212> DNA
<213> Homo sapiens
<400> 17
atcctcaaca gctaatcact ctttaactcc tgaattctgg ctcctgtccc cactacttta 60
atgaaattat actctaaact tcgccagtct tctcccaacc aactgccaaa tctcatgaca 120
tggttttaag cctctctctc ttaacttctc agctttccac aagtagacaa gtcttcttct 180
ggaaactctc cacgcatgtc ctctatactc tcactactgt ctccctcttc ttccttctcc 240
acctgccccc atctcctggc atttctactc tcttt 275
<210> 18
<211> 274
<212> DNA
<213> Homo sapiens
<400> 18
ttctcccagt tcatcctacc tggaatctga cccactaccc acctgcaaca agtcttccag 60
aggcaggaag ataggccctg ccctggcagg atgggttggg gtcacttgac ccctgctccc 120
cctttgaggg gaaaggggtg gaactaagat gggtttataa ctggaacctc caatgaccag 180
atgtatatag agatttacaa agatttttat attaatttaa taaaacaaat tcttaaatag 240
aacaaaataa acacctaatg agccacttat atat 274
<210> 19
<211> 83
<212> DNA
<213> Homo sapiens
<400> 19
atggtggata aatgggactt aggactaaaa ctcatgcctt ggtgtgtttt tgcagtgatg 60
ttttgttctg gggtgcatca caa 83
<210> 20
<211> 95
<212> DNA
<213> Homo sapiens
<400> 20
gcgtagctaa gtgaaaaggt catagctgag attcctggtt cgggtgttac gcacacgtac 60
ttaaatgaaa gcatgtggca tgttcatcgt ataac 95
<210> 21
<211> 223
<212> DNA
<213> Homo sapiens
<400> 21
actctcaaga acagtagagg gaaaagaaaa aagaaaaaga acagtggagg ttgtggtaaa 60
ggacatttga gaagagattc atgaaacagg ccaaatggta ggtttgctag ttcgcagggg 120
gagaaccaat gaattaattt agaaagagct tctctgggat tagaatgaaa ataaatcact 180
ggctgggtgc acacctgtaa ttctagctat tcaggcagga gga 223
<210> 22
<211> 138
<212> DNA
<213> Homo sapiens
<400> 22
ttgtctcagc atcagtatat cccatgcaat atttgaggtg tgctcatact aaaattattt 60
gtgtatctga aattcaaatt aaactgggtg tctttttctt ttcatctggc aaccctacta 120
agatcataaa cccttgga 138
<210> 23
<211> 226
<212> DNA
<213> Homo sapiens
<400> 23
acttgggagg aaatacacag tagttagaaa aagcctccta ggtgattttg atgaatccca 60
gtctcaaatt tcttcatttg gaaatgataa tgtaggccac acgtattact ggagaaaaat 120
gtgctcccga gactttccag agcagcagag ctgggactag gcaggtgagg cagctacgtg 180
caagtgtagc cctgagaatg agcacctctt taaagaatgt accttg 226
<210> 24
<211> 66
<212> DNA
<213> Homo sapiens
<400> 24
gagaggttgt ctgtggccag aatttaaacc tatactcact ttcccaaatt gaatcactgc 60
tcacac 66
<210> 25
<211> 107
<212> DNA
<213> Homo sapiens
<400> 25
ttgcattagg tattagtcta gggataaagt atacaggcgg atgtgcgttg gttatataca 60
aatatgtcat tttatgtaag ggacttgagt atacttggat ttttggt 107
<210> 26
<211> 271
<212> DNA
<213> Homo sapiens
<400> 26
gaaaaagcgg tacgatgcct tcctgacctc accggcctcc ccaagggtgc cggcactctg 60
ggtggactca cggctgctgg gccccacgtc aaaggtcaag tgagacgtag gtcaagtcct 120
acgtcggggc ccagacatcc tggggtcctg gtctgtcaga caggctgccc tagagcccca 180
cccagtccgg ggggactggg agcagttcca agaccacccc accccttttt gtaaatcttg 240
ttcattgtaa atcaaataca gcgtcttttt c 271
<210> 27
<211> 44
<212> DNA
<213> Homo sapiens
<400> 27
tgcctctggt ccttggactc ttgtccatgg ttcctgagct gtgg 44
<210> 28
<211> 244
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (200)..(208)
<223> n is a, c, g, or t
<400> 28
gcccagcctt gaagtcatgt tctaaattgt atttgaattt gtgcctcttt gtttttcccc 60
aaaccaaagc cctcaaattg tagtctctgt cggcttctgc agaattctgg aaaatgccag 120
ttttcctccc ccgcccttgt tttccataaa acatatttat atattgtgat gaggagtact 180
ttctgaagag tacttcgtan nnnnnnnnaa ttgccttgtt tgccttcaac ttccttgatt 240
ttca 244
<210> 29
<211> 189
<212> DNA
<213> Homo sapiens
<400> 29
aaaagtctag attggtcttg atattgagat aataaaaagt aagtagcatt aagaaaggta 60
acaatcttca ttctacagat gaactcattg aaacaattta ggggaatgag gggcaaaagg 120
ggagaaatac tgctaaagaa catgagcata aaaacgcgtg cgtttcagtg tttaagaagg 180
cttgataaa 189
<210> 30
<211> 241
<212> DNA
<213> Homo sapiens
<400> 30
ataattatgg gctcacttcc tactggagat gttgaaagtc taaatcggtt tgaccatttt 60
gattgatggc acaatctggt ttagaaaact ttgtttagat caatgacata accctgctgc 120
ctctgcctgc ccttcccctc ccttctccca tccccttttc cctatctggt gtctgtactt 180
tgatgaaggt gagctataat attggtggtt aatataatcc agaaggctta gttctgtgtg 240
t 241
<210> 31
<211> 286
<212> DNA
<213> Homo sapiens
<400> 31
gaggaagggc tgaaatgctt tctattggat actatctggg catattactt cctgtggttc 60
actgtctggg tgacaggatt catagaagcc caaactttag caccacgcag catacccttg 120
taacaaagcc gcacacgtac gccctcaagc taaaacaaaa gtggaccggg agccgaggtg 180
ggggatcatg agggtcagga gtttgagacc agcctggcag ataacggtga aaccccgtct 240
ctactaaaat accaaaaaag gttagccgac atggtgcagg tccttt 286
<210> 32
<211> 75
<212> DNA
<213> Homo sapiens
<400> 32
ctttctctct tacctgccta tgcttgaagc ccccgcccct cttcaagttg tcctgccttt 60
caagaccaat gtaca 75
<210> 33
<211> 278
<212> DNA
<213> Homo sapiens
<400> 33
gaaaaagtag tccaccacga tccacctttg ctctttgacc tctcaagaga cccttctgag 60
acccacatcc tcacaccagc ctcagagccc gtgttctatc aggtgatgga acgagtccag 120
caggcggtgt gggaacacca gcggacactc agcccagttc ctctgcagct ggacaggctg 180
ggcaatatct ggagaccgtg gctgcagccc tgctgtggcc cgttccccct ctgctggtgc 240
cttagggaag atgacccaca ataaatgtct gcagtgaa 278
<210> 34
<211> 194
<212> DNA
<213> Homo sapiens
<400> 34
tcttctgtga agacaggacc tatgcaacgc acagacactt ttggagaccg taaaacaaca 60
gcgccccctc ccttccagtc ctgagccggg aaccatctcc caggaccttg ccctgctcac 120
cctatgtggt cccacctatc ctcctgggcc tttttcaagt gctttggctg tgactttcat 180
actctgctct tagt 194
<210> 35
<211> 158
<212> DNA
<213> Homo sapiens
<400> 35
gtcatgagac gggatttggt caccaaggaa gtgagtatat atagagaaga ggtccaaggg 60
ctgggccctt gaatatttaa tataatttag aagtctgtaa cgatgaagta gttagcagaa 120
gaaacttgag gagagaccag tgaggtgggt agcaaaac 158
<210> 36
<211> 179
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (61)..(61)
<223> n is a, c, g, or t
<400> 36
ccactggaaa ggagtgttgt aagactaggt tttggctaag aacttctcac ctcagcccta 60
nagagggagc ctgtgggttc tcagagagat atcacaattt gagtcccaaa gaagaggcca 120
gatacccacc caccttcccc caaatcttaa gcacctgcgc cagtacagtc aagaagagg 179
<210> 37
<211> 222
<212> DNA
<213> Homo sapiens
<400> 37
tttgcccttc ctgctaactc tattaccccc acgattcttc accgatgatg accacccaca 60
ctcaacctcc ctctgacctc ataacctaat ggccttggac accagattct tacccattct 120
gtccatgaat catcttcccc acacacaatc attcatatct actcacctaa cagcaacact 180
ggggagagcc tggagcatcc ggacttgccc tatgggagag gg 222
<210> 38
<211> 239
<212> DNA
<213> Homo sapiens
<400> 38
ggaagagctc ggtgagcatg atcatggctc aggttctcca tccacatgcc taagacaggg 60
gtgagtgtga agatgggaac tgactcagaa ttaactgtgt gatcatgggc aagttgccaa 120
gttaaccctc atatctaaat tcaggtatcc ttgaacaaac atagacagat actgatgatc 180
cgccatgttt actataacca taaactcttt gtgaattaaa aatggcctct caacctgga 239
<210> 39
<211> 35
<212> DNA
<213> Homo sapiens
<400> 39
cagggccata cagggtgtgt acatcacaga taggg 35
<210> 40
<211> 270
<212> DNA
<213> Homo sapiens
<400> 40
gtactctcaa gaacagtaga gggaaaagaa aaaagaaaaa gaacagtgga ggttgtggta 60
aaggacattt gagaagagat tcatgaaaca ggccaaatgg taggtttgct agttcgcagg 120
gggagaacca atgaattaat ttagaaagag cttctctggg attagaatga aaataaatca 180
ctggctgggt gcacacctgt aattctagct attcaggcag gaggatggct cgagcctagg 240
agttggaggt cagcataggc aacataggga 270
<210> 41
<211> 125
<212> DNA
<213> Homo sapiens
<400> 41
caagaccggc ccttggctgt tgttacagag atgttgggca gagctatgca ggtgtttcat 60
tgtgaactct agctttgatc atggtaaaaa gttaaccttt tctatttttt aatggatgtt 120
atacc 125
<210> 42
<211> 79
<212> DNA
<213> Homo sapiens
<400> 42
gagagacaaa gcaagtggtg atgtcaagga gaagaaaggg aaggggtctc ttggctccca 60
aggggccaag gacgagcca 79
<210> 43
<211> 241
<212> DNA
<213> Homo sapiens
<400> 43
agcggcggct caaggatcag gaccaggacg aggatgagga ggagaaggag aaacgtggcc 60
gcaggaaggc gagcgagctg cgcatccacg acctggagga cgacctggag atgtcgtccg 120
atgccagtga tgccagtggt gaggaggggg gcagagtctc cgaggccaag aagaacgcgc 180
cgctggctca tggcgggcgg agaaagaaga agaagaaggg ttcagacgac gaggccttcg 240
a 241
<210> 44
<211> 201
<212> DNA
<213> Homo sapiens
<400> 44
gggagtccag gattaaggtt ttgcagggtt tggtttctag tgagggcttt cttcctggct 60
tgcagatggc catcttctct ccataggcta acatggcctc tactttgtgt gtgggagagt 120
cagagataga gcaagccctc ttgtgtctct tcatataagc ctactaatcc ccatcagacc 180
aggtccctta tgatcttaaa c 201
<210> 45
<211> 126
<212> DNA
<213> Homo sapiens
<400> 45
agcaaggtgt ctcagaaccc aattcttacc agtttgttgc aaatcacagg gaacgggggg 60
tctaccattg gctcgagtcc aacccctcct catcacaacg cgccacctgt ctcttcgatg 120
gccggc 126
<210> 46
<211> 95
<212> DNA
<213> Homo sapiens
<400> 46
caggtgttgg gacagtccca ccctccctgc tatttatatc cctctgccta tttattgaat 60
cgaacttcgc ctctgtctcc atctgtaaat atgtg 95
<210> 47
<211> 145
<212> DNA
<213> Homo sapiens
<400> 47
agagtggcag tttgcatggc gaacccccca cttcctcttt gctgcccctt cactttcttg 60
ctgccccttt cccagtctct cttcacaccc actcctggtc tgtcctgatc ccctcttctg 120
tatcaggttt attggttgta catat 145
<210> 48
<211> 245
<212> DNA
<213> Homo sapiens
<400> 48
gaatattctg gctggcgaac tcctacacat ccttcaaaac ccacctggta ctgttccagc 60
atcttccctg gatggctgga ggaactccag aaaatatcca tcttcttttt gtggctgcta 120
atggcagaag tgcctgtgct agagttccaa ctgtggatgc atccgtcccg tttgagtcaa 180
agtcttactt ccctgctctc acctactcac agacggggat gctaagccgt gcacctgctg 240
tgggt 245
<210> 49
<211> 193
<212> DNA
<213> Homo sapiens
<400> 49
taagacctac tatctgatag ccccacatgg tgactatagt aaataataac ttaattgcac 60
atttaaaaat aacttaaaca gtgtaattgg gttgtttgta attgaaagga taaatgcttg 120
ggggagtgga taccccattc tccatgatgt gcttattgca tactgcatgc ctggaccaaa 180
atatgtaccc cat 193
<210> 50
<211> 36
<212> DNA
<213> Homo sapiens
<400> 50
atttactacc ttattatgaa gtgtgccctc caaaat 36
<210> 51
<211> 43
<212> DNA
<213> Homo sapiens
<400> 51
cttttctggg tcacagaggc caaatgtgag agcattgaat aaa 43
<210> 52
<211> 213
<212> DNA
<213> Homo sapiens
<400> 52
gaccttttca tcaatagatc gcccttaaag acccattgta aggtcataaa aaacctcggc 60
caactgcaca aagatggtgc ctcactgcaa caagaaacct taaggtgtct taccgacgaa 120
ataaaaaaca taaatgattg ttctccaagg cctgagggca agactcatga tgggcaagtc 180
aaccccaatc tggaacaatg tccctcctct tag 213
<210> 53
<211> 122
<212> DNA
<213> Homo sapiens
<400> 53
gattatgttt tccatggaag gacaagtctg actgttcata ggctgatttt ctttaagagg 60
attattctgt tttacaattt caattctaga tcacatttta tatatgctgc atgccaaaaa 120
aa 122
<210> 54
<211> 96
<212> DNA
<213> Homo sapiens
<400> 54
acctgtccct gtcctacctt aactgatcaa tcgaccttgt gacagtcttc ttctggacaa 60
tgggtcttat catctcccca ccatgtacct tgtgac 96
<210> 55
<211> 203
<212> DNA
<213> Homo sapiens
<400> 55
tagacagtat gagtcaatgt gcagtgtagc ccacacttga gaggatgaat gtatgtgcac 60
tgtcactttg ctctgggtgg aagtacgtta ttgttgactt attttctctg tgtttgttcc 120
tacagcccct ttttcatatg ttgctcagtc tccctttccc ttcttggtgc ttacacatct 180
cagacccttt agccaaaccc ttg 203
<210> 56
<211> 223
<212> DNA
<213> Homo sapiens
<400> 56
aagacctact atctgatagc cccacatggt gactatagta aataataact taattgcaca 60
tttaaaaata acttaaacag tgtaattggg ttgtttgtaa ttgaaaggat aaatgcttgg 120
gggagtggat accccattct ccatgatgtg cttattgcat actgcatgcc tggaccaaaa 180
tatgtacccc ataaatatat acacctacta tgtgcccccg aaa 223
<210> 57
<211> 240
<212> DNA
<213> Homo sapiens
<400> 57
gaatttggtt ttgatctccc tattgagaga ctggtgtaca gtatttgtct atccctgcac 60
aaattattaa agcaagtttt gccattctgt tatccttcct catgaatatc ttgattactt 120
ttggccctaa ctcatcaagt tccacagaaa tcccaattgg aatcttagtt aaaattgtgt 180
tgtctatgga ccagttgaag aaaactgaca catttataat actgactctg ttccataaag 240
<210> 58
<211> 211
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (123)..(131)
<223> n is a, c, g, or t
<400> 58
ccagctttaa aggtgagatt gtagagatgc tgtcaaaggg ataaggaaat agcaagattt 60
ttaagtagtg tgtttgtgaa gactgatccc cattttacaa ctgcctgttc tttctccagt 120
ccnnnnnnnn ncagccagct tgactattag aaaagtatga aactggttgg ggtttattta 180
atatttttaa tatattgaga agcatggtct g 211
<210> 59
<211> 56
<212> DNA
<213> Homo sapiens
<400> 59
aaattcaata tggaacttga ggccaaaaaa acagaaggtt actctcaatg ccatcc 56
<210> 60
<211> 73
<212> DNA
<213> Homo sapiens
<400> 60
tatgtgccaa atctactaga cattggagaa acagtaggaa caacacatgg taccggcaca 60
tggatctttc agg 73
<210> 61
<211> 266
<212> DNA
<213> Homo sapiens
<400> 61
agtctggttc taatcttctg agctgccttt ggaaggaagt tatgaggtag aagattctac 60
tgacttttag taaggtggac aatgagagaa aagaaaaagc aggtgcctca tctacagatc 120
cttctgggat ttatttgcca tgtacaattt aatgcataaa aaggcctctc tccataaaac 180
tcagcacttt acagatgtag aatatataag catgccaaat ttacttatct gtcacataca 240
aagcatcatt ccaggtgcta gtgagg 266
<210> 62
<211> 243
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (128)..(218)
<223> n is a, c, g, or t
<400> 62
gtaggacagt aggacagtac acagtagaac agtctaggac agttcagagt acacagtagg 60
acagttcaca gtaagacagt tcacggtacc cagtaggaca gtacacagta gaacagttca 120
cagtgcannn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnat aggacagttc acagtaagac 240
agt 243
<210> 63
<211> 228
<212> DNA
<213> Homo sapiens
<400> 63
gaagctgcca gagggtaatt ggttttccca gaagttctta aatttgggag ctgtcttgcc 60
gcaagccatt gagactggaa attcttggag ttggtattgt ttttgtaaat tgactaatag 120
agagttaggg aagcctggag acttgttggg ggtgagttct ctaaatggtt ttaggcttgt 180
ctgtgtactt ttgcaacgag attgtctaat tctatgggcc tctgaggt 228
<210> 64
<211> 158
<212> DNA
<213> Homo sapiens
<400> 64
ttcttgtgca ttattacatt tactcatacc tccaggacaa tgttgaagag aaatgatgta 60
ttagtccatt ttcacactgc tataaagaac tgcctgtatt agcctagcat ggtggcggac 120
acctgtaatc ccagctatgc aagaggctga gacgagaa 158
<210> 65
<211> 183
<212> DNA
<213> Homo sapiens
<400> 65
aacccaacct taaagctgaa gacagtcccg gctaaatcct catactgaat tgagaacctg 60
tcttcccatt tggtgtgctt tcctccgatt gatcccaacc cttcacctat tttacgtata 120
cctgcccttt cctaattggt ttttacactg ctgtgcccac cttttgagtg gtgcctttgc 180
ata 183
<210> 66
<211> 37
<212> DNA
<213> Homo sapiens
<400> 66
tggtgaaatt ttgtaccccg gatgcagttg gcacttt 37
<210> 67
<211> 138
<212> DNA
<213> Homo sapiens
<400> 67
aaaaatgttg gttgggctac acagttaact agtggagctg tgtgggttca gtttaatgat 60
gggtcccagt tggttgtgca ggcaggagtg tcttctatca gttatacctc accaaatggt 120
caaacaacta ggtatgga 138
<210> 68
<211> 39
<212> DNA
<213> Homo sapiens
<400> 68
ttggagataa ggcttttagg aagtcattaa agtgagatg 39
<210> 69
<211> 177
<212> DNA
<213> Homo sapiens
<400> 69
caggttgttt tgttctagtt ctaatttctt aaaaaccact acatggttac aaaattggaa 60
taacatttgg ggacaactgg gttaactaca aagaggagga ttttaagagg agatgtgttg 120
tattgactca ttttgtatta tttttggctt acagttccca tagctgttag agtctgg 177
<210> 70
<211> 284
<212> DNA
<213> Homo sapiens
<400> 70
ggccaatgag aacccagcct tcaaataaac aagcttctca ttgttaacac agggttcaaa 60
ggcagggagg ttggaggtgt tttgcagggt atccagaatt ctgatcgctg aatactttag 120
ggcaaagagt aagatttccc acacctcccc ctaaatctta caattccctg atgaggcagg 180
aacatgggaa aaaaaagata caggttaaat tacaaagcag aaaaatatgc ccagctagaa 240
gctaaagacc tggtctcaaa acactgaacc gaggagcact gatt 284
<210> 71
<211> 254
<212> DNA
<213> Homo sapiens
<400> 71
ccctggcctg agaggttgct tttaagtctt ccaccccttg ttccatctgc ctgccaaccc 60
atcggaaagg aatccacatc atattggaga tgaccccatc aaccccaggg ctccagcact 120
accaagttgg aattccacgc ccgggagtgg ggtagaggaa gacgagacag gacgaggcag 180
aaaagcacat tttaaaaacc agacaagatg gctaggccat caccaaccaa cggacttacc 240
ttacatcttt gtag 254
<210> 72
<211> 70
<212> DNA
<213> Homo sapiens
<400> 72
ttttttctat ccctgccatt cagtctccat tagcactcta ttctctctca tttattccac 60
cccgtcttcc 70
<210> 73
<211> 178
<212> DNA
<213> Homo sapiens
<400> 73
gaaacacgtg tattatggga acaactgaaa ggtcagcctg aagacttttg ccctgttgct 60
ttctgagagt gctggatatg agtccctgtc tctgaaactt ctaaaaatat gcacccttaa 120
ccagctttcc acggagggat aagcctttgt caatacaaat ggtacagtga gcagcaga 178
<210> 74
<211> 176
<212> DNA
<213> Homo sapiens
<400> 74
agtctggccc catagtgact tttgccccat gattctgctt cactgttgga atcctctttg 60
aagttccccc tctctttgct aaagcagtga aggaagagaa cagagacaaa ctctttggac 120
tgtgaaagag aaggtagaga attccaggca acagtctgac caagggtgta aaccag 176
<210> 75
<211> 274
<212> DNA
<213> Homo sapiens
<400> 75
gggaggggga gatacacata tataatatta aaaaaatgtc atcttccaca gaaaacactg 60
actctgcctt ccaaaagtca caagtacaga tggagtccaa gttcaggagt ggtgcccaaa 120
cccagatact caaaccaaac tgcagaaaca ttcaggaaaa aacaagccaa agccattatt 180
ttagaaacac aacgcaaaac aataagataa aattaagtaa aagggaagta acagatggaa 240
taaaaaccaa gatatcacat tccataaagg gcaa 274
<210> 76
<211> 290
<212> DNA
<213> Homo sapiens
<400> 76
gtggtggtta tcgacaggaa tctgtcagag agcataccca tggagcattt ataattggga 60
gccattccag aattctggtt tgcatacaac tctttaaaaa gccagctacc ctgaaatgta 120
cactatctga gctctgcctt tgcctgtgat gagtgatgtt ggtcctgcct cttagttctg 180
ctctcagtct ccaccatcgg cttctcagat tttccttcca ggaccagcag gcaggtgggt 240
gtggtgactt tgtggcagac actgtggcag attaaaggtg gttgcaaatt 290
<210> 77
<211> 242
<212> DNA
<213> Homo sapiens
<400> 77
accacctgaa ggaccaccag aatgggtcca tggctgctgt gaatggacac accaacagct 60
tttcacccct ggaaaacaat gtgaagccaa ggaagctgcg gaaggatgga agtcaaagaa 120
ttgaaaccct ccaaaccacg tcatctgatt gtaagcacaa tatgagttgt gccccaatgc 180
tcgttaacag ctgctgtaac tagtctggcc tacaatagtg tgattcatgt aggacttctt 240
tc 242
<210> 78
<211> 89
<212> DNA
<213> Homo sapiens
<400> 78
cttgtagctg acatttggca aaagcgtcac tgaaaggcaa gctaaatgta gttattttat 60
cctgtggccc tgaagcacaa aataaaaat 89
<210> 79
<211> 284
<212> DNA
<213> Homo sapiens
<400> 79
gtttaccgaa ggcaccagtt cagccaggag tgaaatccgg agaggagcaa cgccagcctg 60
ggtcacagtc catcaaaccc catgagcccg accactctcg ctcttcctta cattcccacg 120
tcccccttct ctcccaaccc ctcatatcag caagggaaat taattaatga gatttgataa 180
atcagtagat agaatgaggt cccccttttg aaatatttag cagactggaa cccccccgca 240
agcctctgta gggggtggat ggagacactt ctaactttaa taaa 284
<210> 80
<211> 46
<212> DNA
<213> Homo sapiens
<400> 80
ctggaggagt gagtccctat gctgacccca atacttgcag aggtga 46
<210> 81
<211> 230
<212> DNA
<213> Homo sapiens
<400> 81
gcattcacac atgtgcatgc tcacacagag acggttctgg agttgtggag ggaagcctgc 60
cccgccttcc ggccccactc cctgaaccta cagctctctc catggccccc ctcacctgct 120
cgggctgggc cggggcttag ggcgagaggc aggggcaggg actttcaggg atccggcagt 180
ctcagtgatg agagcacacc agctggggag aaaggccaaa tccctgggca 230
<210> 82
<211> 298
<212> DNA
<213> Homo sapiens
<400> 82
aggattcctt cttgtgttta agcaggagca ggcagaaaag cctaacaacc cccgtctttc 60
ccatcggcag ccccacgccc atcatcacac aaggccccaa ggatgggaaa gagaaaagct 120
agaaggaccc aggggcctcg ggactacagg aagagtggaa agttacagac tgtaaataga 180
gtcgggtagg cttgtgccct tccttatttg tccggttctt tcatttgctg cttctgttta 240
agctcaaggg tcagtcacca tgaaatgaat ttgcacctcg gtttctcttt aggctcca 298
<210> 83
<211> 278
<212> DNA
<213> Homo sapiens
<400> 83
ctcagagaag gaaaggttgg ccaaagacac atccaggagg ggaacagaag gaggggacag 60
aagcaagtct gcagatcaga ggaaagaaga aagagcagag gagggagatt ggaagtagaa 120
atgctgaatg cagaggcaaa aaaggaaaat gaaggacagg aggattaaac agacagaggc 180
aaggatgatg agagaggagc agacagcaag aatgaaaagc agaaaataca atagaggaaa 240
tgaagaaaag taggcctgct ggagctagat gatgatgt 278
<210> 84
<211> 218
<212> DNA
<213> Homo sapiens
<400> 84
gggcccatgg attaacgccc tcatcccaag gtccgtccca tgacataaca ctccacaccc 60
gccccagcca acttcatggg tcactttttc tggaaaataa tgatctgtac agacaggaca 120
gaatgaaact cctgcggctc tttggcctga aagttgggaa tggttgggga gagaaggcag 180
cagcttattg gtggtctttt caccattggc agaaacag 218
<210> 85
<211> 179
<212> DNA
<213> Homo sapiens
<400> 85
gggaaactct gtcactactg aaaatacaaa agtacaaaaa aaaaaaaaaa attagctggg 60
catggtggtg caagcctata ctcccagcta ctcaggaggc tgaatttgga ggatcccttg 120
agcccagggg ggttgaggct gcattgaggt ataattttgc cactgtattt cagcctggg 179
<210> 86
<211> 146
<212> DNA
<213> Homo sapiens
<400> 86
ggctctgcca ccctacctgt tcagtgtccc gggcccgttg aggatgaggc cgctagaggc 60
ctgaggatga gctggaagga gtgagagggg acaaaaccca ccttgttgga gcctgcaggg 120
tggtgctggg actgagccag tcccag 146
<210> 87
<211> 166
<212> DNA
<213> Homo sapiens
<400> 87
gggcctcggg actacaggaa gagtggaaag ttacagactg taaatagagt cgggtaggct 60
tgtgcccttc cttatttgtc cggttctttc atttgctgct tctgtttaag ctcaagggtc 120
agtcaccatg aaatgaattt gcacctcggt ttctctttag gctcca 166
<210> 88
<211> 217
<212> DNA
<213> Homo sapiens
<400> 88
gagagctctg cctagtctgg tttggcgagg gcccttgatc accttgcccc tcctccctgt 60
cttctctgat tcttttccct caaaatagtc ctgagaacta attgtcacag acattggaat 120
atttgtactg ctctcgtgcc atttgagagg ctgctgcccc aggcaggcca gcccctactc 180
ctcttggcta cactcatgtt gctcagacta tatttca 217
<210> 89
<211> 211
<212> DNA
<213> Homo sapiens
<400> 89
ctgggaactg gcactgggtc gcttttggga ttacctgcgc tgggtgcaga cactgtctga 60
gcaggtgcag gaggagctgc tcagctccca ggtcacccag gaactgaggg cgctgatgga 120
cgagaccatg aaggagttga aggcctacaa atcggaactg gaggaacaac tgaccccggt 180
ggcggaggag acgcgggcac ggctgtccaa g 211
<210> 90
<211> 94
<212> DNA
<213> Homo sapiens
<400> 90
gatgaagagg gctgattgta tctaacttag ggtcttgcat gcagctggca cttaatgcat 60
tttattgact gttttagcta acattcaatg gaca 94
<210> 91
<211> 197
<212> DNA
<213> Homo sapiens
<400> 91
gccagactgg gctgtagtta gcttttcatc cctaaagaag gctttcccta aggaaccata 60
gaagagagga agaaaacaaa gggcatgtgt gagggaagct gcttgggtgg gtgttagggc 120
tatgaaatct tggatttggg gctgaggggt gggagggagg gcagagctct gcacactcaa 180
aggctaaact ggtgtca 197
<210> 92
<211> 39
<212> DNA
<213> Homo sapiens
<400> 92
aagctgagaa actacctgag gtgtctaaag aaatgtatt 39
<210> 93
<211> 212
<212> DNA
<213> Homo sapiens
<400> 93
ggaattaagg ctattactct gaagaaagtt ggggggccag ggctcctatt tttttgctga 60
ggagatggaa gatcagggct tgtattcaat aagaatggga ggggccaggg gatgcctggc 120
aaaagccttg cactgtgagg tgcaggtaga ggcttttatt ctggtgagag gacatggact 180
ctctctctcc cctcaggtaa ctgtgccctg ta 212
<210> 94
<211> 104
<212> DNA
<213> Homo sapiens
<400> 94
actccgcagg ggctgtgaat cccactggga gggcggcggg cctgcagccc gaggaaggct 60
tgtgtgtcct cagttaaaac tgtgcatatc gaaatatatt ttgt 104
<210> 95
<211> 251
<212> DNA
<213> Homo sapiens
<400> 95
ggagttctac gggatctgag agaaaaacca tgaggaaagt tttcaggatc cttaaacaat 60
ttttggagcg tgtgatgtgg gggactggaa aagatgtgga gtatgtaaaa gggattttgg 120
aagaagcttt tggaatatga tgctgagagt cctctggaga tttcaggcaa ttgctggaga 180
tttttagaat gagtgggggt ggggaagggg atcccggtga agatcactgg gctacatgag 240
ggtgatctct a 251
<210> 96
<211> 155
<212> DNA
<213> Homo sapiens
<400> 96
ggagcggcgc aaggagagac aggaagccct ggaggctaaa cttgaggaaa aaaggaaaaa 60
ggaagaagag aaacggttaa gagaagaaga gaagcgcatt aaagcagaga aggccgaaat 120
cacgaggttc ttccagaaac caaagactcc acagg 155
<210> 97
<211> 220
<212> DNA
<213> Homo sapiens
<400> 97
ttaattttca tgttgcggag cccctactac aagtatgaag agaaaagaaa aaaaaaatga 60
aggaaacaac cactggccca gggtagagat gcctacaggg tggttgcttg ttggatacaa 120
tacaaggaac actgctcaga acccacgtct tcagcagcat ttgaaacact ggcagcaatg 180
cacaagagca agatggtgtc aggaaccatg tcaaaccctc 220
<210> 98
<211> 119
<212> DNA
<213> Homo sapiens
<400> 98
taagctttta agcatcatga agaacaattt atgttcacat taagatacgt tctaaagggg 60
gatggccaag gggtgacatc ttaattccta aactacctta gctgcatagt ggaagagga 119
<210> 99
<211> 103
<212> DNA
<213> Homo sapiens
<400> 99
gcctggagcg tgagcccaga cccaactcca gccccagccc cagccccggc caggcctctg 60
agaccccgca cccacgaccc tcataataaa cacgtcgatt ctg 103
<210> 100
<211> 122
<212> DNA
<213> Homo sapiens
<400> 100
tatgtgccaa atctactaga cattggagaa acagtaggaa caacacatgg taccggcaca 60
tggatctttc aggaaaacga agtaggtaat aaacaggaaa aagcccgagt ctgatgctaa 120
ga 122
<210> 101
<211> 93
<212> DNA
<213> Homo sapiens
<400> 101
ctgcctgtat cctcattggt gggagcccag ccatggccct aattgtgcct gagcttgact 60
ttcagtcagg gccacagtga gcattaaatt att 93
<210> 102
<211> 70
<212> DNA
<213> Homo sapiens
<400> 102
ggagttaaat gtagtgcttt ccaggatagt tccttccata ctccttctgt tcctttcatt 60
gtgcccctct 70
<210> 103
<211> 238
<212> DNA
<213> Homo sapiens
<400> 103
cagccgtttc cctgcagaat cagctctgtc tcatgtggaa gtggagaatc agccttgcct 60
ggcctttagg aacttttgtg gggaagagag ctttgaagag aggaggggga ctttagagag 120
ggatgaaaat gagccctggg agggaggaag ggacgaggag gggtggctgc atgttaccgt 180
cccctacctc tccccacgtg gagggtggag cagttatgag ggaggaagtc aactgctg 238
<210> 104
<211> 269
<212> DNA
<213> Homo sapiens
<400> 104
caggcattcc tttctatcga taattactct ttcaaccaat tgccaatcag aaaattgtta 60
tatctaccta taatctagaa gcccccacat caagttgttt tgcctttctg gacaggacca 120
atgtatatct taaatgtatt tgattgatct ctcatgtctc cctaaaatgt ataaaaccac 180
gctgttcccc gaccacctgg agcacatgtt ctcagggtct cctgagggct gtgtcacagg 240
ccatgttcac ttacatttgg ctcagaata 269
<210> 105
<211> 291
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (258)..(258)
<223> n is a, c, g, or t
<400> 105
gggtcagaaa gatgccttca gttttggtca gtgtctaaaa gttaagtctg tttaggccaa 60
gcatggtggc tcacgcctga aatcccagca cttggggagg ccgaggcaag tggatcacaa 120
ggtcaggaga tgagaccatc ttagccaaca tggtgaaacc ccgtctctac taaaatacaa 180
aaaaattagc caggcgtggg ggtgcgtgcc tataatccca gctacttggg aggctgaggc 240
aggggaatcg cttgaacncg ggaggcagag gtcacgccat ggactccagc c 291
<210> 106
<211> 36
<212> DNA
<213> Homo sapiens
<400> 106
cgcaccattg cactagtgat aagatcgaaa ctccat 36
<210> 107
<211> 243
<212> DNA
<213> Homo sapiens
<400> 107
tttgaaatca ccatgtctga taaaaacatg caattgcttt ggtgaatttg tttgttttat 60
tgttgttgct ttgagtgaat gcttcagttt gctctagatt ttactttgtt tgttaaaaat 120
taccatgttt taacccccga aaacatttaa tgtttttgaa atgatttttt cataacaatc 180
ttatgagtct attatataat aggaagtatt ttggaaattt aatggtgata tttctttgga 240
aaa 243
<210> 108
<211> 220
<212> DNA
<213> Homo sapiens
<400> 108
tgtgcacagg agactcagga cagtgggggg aaaagtcact tctccacata agaggctcaa 60
atcccaacgc caccctccgt cagacccctt tggccccagc tccgacccct ccagggttta 120
ccaagttggg ctttcacagc atgtctgagc aaacacgcag cgacctttta cataattgca 180
acctcctcca gagaggagag aggccacatt ctctcggccc 220
<210> 109
<211> 263
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (116)..(116)
<223> n is a, c, g, or t
<400> 109
taacggagtg tcactttcaa ccggcctccc ctacccctgc tggccgggga tggagacatg 60
tcatttgtaa aagcagaaaa aggttgcatt tgttcacttt tgtaatattg tcctgngcct 120
gtgttggggt gttgggggaa gctgggcatc agtggccaca tgggcatcag gggctggccc 180
cacagagacc ccacagggca gtgagctctg tcttccccca cctgcctagc ccatcatcta 240
tctaaccggt ccttgattta ata 263
<210> 110
<211> 278
<212> DNA
<213> Homo sapiens
<400> 110
catgcacaga tggccacatt ctgcctccat ccactcaatg ccaacaggca cgattcctcc 60
accgacaacg ctcaaggcca cagggtccac ccacacagcg ccaacaatga cgctgaccac 120
cagcgggacc agccaagccc tgagctcatt aaacacagcc aaaacctcta catccctaca 180
ttcacacact tcctccacac accatgctga agccacctca acttctacca ccaacatcac 240
ccccaaaccc accagtacag gaaccccacc aatgacag 278
<210> 111
<211> 107
<212> DNA
<213> Homo sapiens
<400> 111
ccccattatg tcatgacctc acttaagtgg aacactatat cataacccag agattcgtcc 60
cagccccaga gtccgacaga ctgtctggtc cctattccta atgaggg 107
<210> 112
<211> 292
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (65)..(99)
<223> n is a, c, g, or t
<400> 112
cacatctggc ctgacgttct cgttgcatca agccatcatc caccgggcgc ccctggacgc 60
gcgtnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnna atgctgaccc actcagtaga 120
gcaggggcca gccagagggg gacgaagtca ccaatccagg caccaccttc ccacatgtcc 180
ctgcaacttc tctctttcca gtgtgctgaa gaagggaggt gccacccctc ctccagataa 240
atggccccag aaaacgatcc aaaaaaatac ccagggagcg attccttatg ta 292
<210> 113
<211> 157
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (64)..(64)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (69)..(69)
<223> n is a, c, g, or t
<400> 113
gatgatcaac tctgctagga agcggggtgg gaagaaggga ggggatgggg ttgggagagg 60
tganggcang attaagatcc ccactgtcaa tgggggattg tctcagcccc tcttcccttc 120
ccctcacctg gaagcttctt caaccaatcc cttcaca 157
<210> 114
<211> 236
<212> DNA
<213> Homo sapiens
<400> 114
gcagtctcag acaccaagga ggggagagtg actagaaaga aaaccttctt gcagagacat 60
aggggatggg gaagaactgc agactgaact ggggcaaagg actgtaggac ttaaccagag 120
agatttgagg gagagatgag gctgagagcc aggggatcct gccatgtccc agcataaaaa 180
cagtacctga cacagatagg tgcttgggaa gctgttgtcg gatgaatgag tggaca 236
<210> 115
<211> 137
<212> DNA
<213> Homo sapiens
<400> 115
aagctggcaa ctggtgagag tatagcagtc aaaaaaagaa aatgctcact cttagatacc 60
taagaattca aagcgtttca acctagagca accactaaaa aacctgcaca gagatgacag 120
tcaatattac aatagag 137
<210> 116
<211> 65
<212> DNA
<213> Homo sapiens
<400> 116
agcccagcag atcctacaca cattttcaca aactaacccc agaacaggct gcaaacctat 60
accaa 65
<210> 117
<211> 269
<212> DNA
<213> Homo sapiens
<400> 117
tcactttcct ggattgtcac tgtgagtgta attccggttg gctggaaccg cttttggaaa 60
ggattgggag agatgaaaca gcagttgtgt gtcctgttat agacacaatt gattggaata 120
cttttgaatt ctatatgcag ataggggagc ccatgattgg tgggtttgac tggcgtttag 180
catttcagtg gcattctgtc cccaaacagg aaagggacag gcggatatca agaattgacc 240
ccatcagatc acctaccatg gctggagga 269
<210> 118
<211> 225
<212> DNA
<213> Homo sapiens
<400> 118
tagtgttttg ccctaaatct aaggatggtg cctagtggtg gccctgtgtt ctgaggacag 60
agagagctgg aggggtggag gggaatgcat cggcactcat ttggtgtaac caagaagagg 120
gggaaagatg tcttgataga atcaaagttg ccaaaaacaa agaagagtct atcaagcaga 180
tttctaacat ttagctagaa actacttcat agctctcatt tttag 225
<210> 119
<211> 61
<212> DNA
<213> Homo sapiens
<400> 119
cactaccgcc ccgcgctggc ttgccctcct gttctccaga gcaataaagt tggacgagac 60
t 61
<210> 120
<211> 36
<212> DNA
<213> Homo sapiens
<400> 120
gagagccacc acaagactaa gtaaagaccg agttga 36
<210> 121
<211> 35
<212> DNA
<213> Homo sapiens
<400> 121
gaataaatgg ggttgggcat atcaaactaa agatg 35
<210> 122
<211> 260
<212> DNA
<213> Homo sapiens
<400> 122
ttctctgcat cggtcaggtt agtgatatta acagcgaaaa gagatttttg tttaggggaa 60
agtaattaag ttaacactgt ggatcacctt cggccaaggg acacgactgg agattaaacg 120
taagtaattt ttcactattg tcttctgaaa tttgggtctg atggccagta ttgactttta 180
gaggcttaaa taggagtttg gtaaagattg gtaaatgagg gcatttaaga tttgccatgg 240
gttgcaaaag ttaaactcag 260
<210> 123
<211> 285
<212> DNA
<213> Homo sapiens
<400> 123
caaatataca aaatgcctcc aagctcaaat agctataact gtaccaaaga catggaagaa 60
accaaaagat cggacccgaa ccactgaaga gatgttagag gcagaattgg agcttaaagc 120
tgaagaggag ctttccattg acaaagtact tgaatctgaa caagataaaa tgagccaggg 180
gtttcatcct gaaagagacc cctctgacct aaaaaaagtg aaagctgtgg aagaaaatgg 240
agaagaagct gagccagtac gtaatggtgc tgagagtgtt tctga 285
<210> 124
<211> 39
<212> DNA
<213> Homo sapiens
<400> 124
ccgcaggcag gtgtcaggac cggcctaata aacatgtgt 39
<210> 125
<211> 266
<212> DNA
<213> Homo sapiens
<400> 125
aaatgtgact gctttgtaaa actccagagt caaggactca taggcaggag gatgtcataa 60
attaacagga aaggatgaga aatctccact ccactccctc ctccctccct tgatcactca 120
ttccctctct tccattcatt aaccacccac tacatgccat gccctaagga agcagctatc 180
taagaagtcc ctgcctgcag gggctttaca gaccaggagg aaggcaaccc atagagccag 240
gatcctgata accactgctg actgcc 266
<210> 126
<211> 159
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (42)..(42)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (56)..(56)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (90)..(90)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (93)..(93)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (98)..(98)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (100)..(100)
<223> n is a, c, g, or t
<400> 126
aaaccctgga agaatctttc acttgaactc aacttgactg gngttcagtc aaccantctc 60
aggggaaggg gggaagcact atctccacan cancactnan tctgggcctc ccgccccatc 120
tcccccagcc cctctcagca actaggccag gcttcagct 159
<210> 127
<211> 262
<212> DNA
<213> Homo sapiens
<400> 127
gcagggctgc cggagcgtcg aggagttcca gtgcctgaac aggatcgagg agggcaccta 60
tggagtggtc tacagagcaa aagacaagaa aacagatgaa attgtggctc taaagcggct 120
gaagatggag aaggagaagg agggcttccc gatcacgtcg ctgagggaga tcaacaccat 180
cctcaaggcc cagcatccca acatcgtcac cgttagagag attgtggtgg gcacacatta 240
tggaggcgca gtcgcctacg ca 262
<210> 128
<211> 59
<212> DNA
<213> Homo sapiens
<400> 128
aggagtcagg agaacaagtc agggattagg agacagcggt ttggtttatt gttatccag 59
<210> 129
<211> 267
<212> DNA
<213> Homo sapiens
<400> 129
aataattctc aatttcttag tctcttaatt cttaaattta aaaaggttgt ttcttacctt 60
ttaaaatttt taaaaataat tatgtcaagt aatttttgaa tatagtaacc tgattctaca 120
tttctcatgg gataaattct aaggtaaaaa aaattgcaaa taaatcttaa actttattta 180
gtaggtttat tattagcagc agatgtctag ccagggtaga ttacttttat cagaccaacc 240
tctcaccaac aactactaga agagcta 267
<210> 130
<211> 129
<212> DNA
<213> Homo sapiens
<400> 130
ctgggaaatc cagtgtttgt atgtaaaaat aaaaggtaag ttaattctag attgaggggc 60
agaggctatt tcttaatctc caatctcctt gggaagggaa agtattagga ggcagtaatg 120
gagtagaaa 129
<210> 131
<211> 276
<212> DNA
<213> Homo sapiens
<400> 131
ggtacactgg gcacgcaatg cgcgtgttag tagccaaata gtaaaagggc cgtatttcaa 60
cagcgactcc aagacaactg gcgttgccca ttctcagtct ccggcctatc ctacacatct 120
aatacccggc tacaatataa agctatagta aaggttcacg gggtcttttc gtcccgttgc 180
gggtaatcgg catcttcacc gatactacaa tttcaccgag ctcgcggttg agacagtgcc 240
cagatcgtta caccattcgt gtatggacgg gctctg 276
<210> 132
<211> 71
<212> DNA
<213> Homo sapiens
<400> 132
ggacagcagc cactcagttc ttcctccacc tccacccagt gatcccaata aacgaattct 60
gtctccccgt g 71
<210> 133
<211> 279
<212> DNA
<213> Homo sapiens
<400> 133
acagatggcc acattctgcc tccatccact caatgccaac aggcacgatt cctccaccga 60
caacgctcaa ggccacaggg tccacccaca cagcgccaac aatgacgctg accaccagcg 120
ggaccagcca agccctgagc tcattaaaca cagccaaaac ctctacatcc ctacattcac 180
acacttcctc cacacaccat gctgaagcca cctcaacttc taccaccaac atcaccccca 240
aacccaccag tacaggaacc ccaccaatga cagtgacca 279
<210> 134
<211> 237
<212> DNA
<213> Homo sapiens
<400> 134
tagtacctgc ctcattcagc taacgtgagg atctagagca gcatttgcat aaatgacgcg 60
tggggcacag agcagactca acacagagca gcttacgtta tgaggcttgg caggctggga 120
gctcctgtcg gcctctctcc tcagctctgt gcccactgag ctcggcacaa gggttggccc 180
atgacaggtg tttattatgt ggaaataaat gagagggaca agacatttgc tgatttc 237
<210> 135
<211> 170
<212> DNA
<213> Homo sapiens
<400> 135
gcctcatcag ggaattgtaa gatttagggg gaggtgtggg aaatcttact ctttgcccta 60
aagtattcag cgatcagaat tctggatacc ctgcaaaaca cctccaacct ccctgccttt 120
gaaccctgtg ttaacaatga gaagcttgtt tatttgaagg ctgggttctc 170
<210> 136
<211> 292
<212> DNA
<213> Homo sapiens
<400> 136
ggacagatga agactcttaa gatgacagaa ggtgattttt ctggtgatcg aggacttccg 60
gggtaatgac agtgatgaaa tgcaggggac ctggttgccc ccaagtttcc tggcagtgtg 120
tgatactgag gaggtgagct tgtttctgga gctgtgcttt aagattcatg ttacatgtaa 180
agctgtcctc atttgtgact atggacctat ggagttggga caatctctat gggaagcaga 240
aggcaaggac cccggtcatt ttaggtagaa acaacagcat gctaatgcaa aa 292
<210> 137
<211> 194
<212> DNA
<213> Homo sapiens
<400> 137
aagagagaag cttctgcacg ccagaggcac ccagtcccac aggcgcctac ctgccccgga 60
taagaggttc cctgccattt ctctagtctc cccccttcaa cagcacacca aataagccca 120
agaagatgac aggaaccgtc cccgccaact tcacacgagt gctaaggcga agacagccat 180
cttgggcctt cgga 194
<210> 138
<211> 202
<212> DNA
<213> Homo sapiens
<400> 138
tgcctgatgc ctcaggtgac agaaggcagg acgttccatg ccgaggctgc cccctcaccc 60
agaagtctga gcccagcctc aggaggggcc aagaaccagg gggccatcaa aagcatcggg 120
atttggcatt ggttccagat gagcttttaa agcaaacata gcagttgttt gccatttctt 180
gcactcagac ctgtgtaata ta 202
<210> 139
<211> 86
<212> DNA
<213> Homo sapiens
<400> 139
gccccaacct gggattgctg agcagggaag ctttgcatgt tgctctaagg tacattttta 60
aagagttgtt ttttggccgg gcgcag 86
<210> 140
<211> 199
<212> DNA
<213> Homo sapiens
<400> 140
accaaagttt gcagcctata cctcaataaa acagggatat tttaaatcac atacctgcag 60
acaaactgga gcaatgttat ttttaaaggg tttttttcac ctccttattc ttagattatt 120
aatgtattag ggaagaatga gacaattttg tgtaggcttt ttctaaagtc cagtactttg 180
tccagatttt agattctca 199
<210> 141
<211> 297
<212> DNA
<213> Homo sapiens
<400> 141
attgattcct gaccatagca gtgagaggcc attttttgtg caggaaatgt gcttaggact 60
cagtcttgtt ttcgattatc caccacagaa accctgagac acagagcagc ttagaagtct 120
ctacccaggc gtaaatagag ctccctactc cagaccacct gccacccacc tcccaagttg 180
agaacacaag ctccagctgg gctggagagt caggcttggt gcagggtgac tttggcgaag 240
ttttgtcaga tccataaagc aaactggaat ttgagctttc acttacccta gtatacg 297
<210> 142
<211> 110
<212> DNA
<213> Homo sapiens
<400> 142
ttctttccac agaagctcca ggtagagggt gtgtaagtag ataggccatg ggcactgtgg 60
gtagacacac atgaagtcca agcatttaga tgtataggtt gatggtggta 110
<210> 143
<211> 269
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (92)..(115)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (118)..(118)
<223> n is a, c, g, or t
<400> 143
tgagttgttt gttcaccagt gatgctatgt tatgcatttg tttacatctc ataacatgtg 60
gtaaatattt atgcaagatg gctagccaga cnnnnnnnnn nnnnnnnnnn nnnnncancc 120
gtgaaataga gaatgcaggg tgacccatgt aaacaggcta gagatacatt tgaaaaagat 180
gagggttaaa gagtgtgtac atgttggcag gtaaagagat agcatcctct agggaggata 240
ttatcaggag tcagagtaat cttggtaaa 269
<210> 144
<211> 106
<212> DNA
<213> Homo sapiens
<400> 144
aatcattgat tgacttgtct gtgaacttgc aggaactgtt tcatagtttc attacacaga 60
gtaaactgtt tgccatgcaa ggttattttg catctgcatt taagtg 106
<210> 145
<211> 184
<212> DNA
<213> Homo sapiens
<400> 145
gacattaact cattagactg gaacttgaac tgattcacat ctcatttttc cgtaaaaatg 60
atttcagtag cacaagttat ttaaatctgt ttttctaact gggggaaaag attcccaccc 120
aattcaaaac attgtgccat gtcaaacaaa tagtctatca accccagaca ctggtttgaa 180
gaat 184
<210> 146
<211> 247
<212> DNA
<213> Homo sapiens
<400> 146
gtatgtgaaa gtctctattt gtgtatttct ctcctaaagt tgtgtctctt tgggaattgg 60
atttgatttt tattatttaa tacctcactt tggcccgtcc cccctcccaa cacttctgta 120
tcctcgccct gccgccccag cctggacgct ctgcgtggaa gtgcgtgttt gtagcagctc 180
gggcctcatc tcagcgctcg gatccctcct gctgccagaa tccactggcc tctgtctcat 240
tcttggg 247
<210> 147
<211> 277
<212> DNA
<213> Homo sapiens
<400> 147
tccctcagga agcagtcccc tcgtctccct ttctgggcag cttccttgag gacagaaact 60
tgaaaacaaa cacaaaccaa agtttctggc catctgtggc tggagggttc tgaatgtcct 120
ctctccatgt caggcagagg gtcagccccc atgcttctgc ctcaggcccc accccacccc 180
accccaggcc tgcccctcac ctcagggcca tacccacagc gccctgatgg aggaaccaga 240
ccgcaggctg tgccaccatt aaacaagagc ggctgtg 277
<210> 148
<211> 32
<212> DNA
<213> Homo sapiens
<400> 148
aaggaggcag atgagatttc atatcaaaaa ga 32
<210> 149
<211> 174
<212> DNA
<213> Homo sapiens
<400> 149
tgacttctac ctcccatgtt tgctctccca actcattagc tcctgggcag catcctcctg 60
agccacatgt gcaggtactg gaaaacctcc atcttggctc ccagagctct aggaactctt 120
catcacaact agatttgcct cttctaagtg tctatgagct tgcaccatat ttaa 174
<210> 150
<211> 37
<212> DNA
<213> Homo sapiens
<400> 150
ccaccgtaaa gtactgcgcg acaatatcca gggcatc 37
<210> 151
<211> 248
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (223)..(223)
<223> n is a, c, g, or t
<400> 151
gtggaataag ttctcctagc tcagaaggat ctcaacctct tgcaagttac ttttcacttt 60
taagggccct taaagaagca tttgcttagc tctgtatcca ggccatctct ccctccccga 120
agagcaacag accagcaact gacattaagg tcacatgggt gggtggggag tagaattgcg 180
ggggtgacag ttccagccaa tccagacacg aatcatgttt ganggacccg agcctcaagg 240
gtgattcc 248
<210> 152
<211> 39
<212> DNA
<213> Homo sapiens
<400> 152
agacatatga caatgttcag caggtcatct ttaatgcag 39
<210> 153
<211> 53
<212> DNA
<213> Homo sapiens
<400> 153
acgaaagcgc aagaaatccc ggtataagtc ctggagcgtt ccctgtgggc ctt 53
<210> 154
<211> 215
<212> DNA
<213> Homo sapiens
<400> 154
cctcgtggat catcaaggac gacgcggagg tggagcggct gacctgtgag gaggaggagg 60
agaagatgtt cggccgtggc tcccgccacc gcaaggaggt ggactacagc gactcactga 120
cggagaagca gtggctcaag gccatcgagg agggcacgct ggaggagatc gaagaggagg 180
tccggcagaa gaaatcatca cggaagcgca agcga 215
<210> 155
<211> 277
<212> DNA
<213> Homo sapiens
<400> 155
tagggtttct ctccactatg aatgatctga tgtatagtaa ggttcgaaga ccacttaaaa 60
attttgccac aatctttgca tttgtagggt ttgtctccag tatgaactat gttatgttga 120
gtaaggcctg aggaatagta aaaagctttg ccacattctt cacatttata gggtttctct 180
caagtatgaa ttcttttatg ttctttcagt tttgaggatt ttctaaaggc tttgccacat 240
tcatcacatt tgtagggttt ctctcccata tgaataa 277
<210> 156
<211> 125
<212> DNA
<213> Homo sapiens
<400> 156
actggagggt ctccgggcac actctggccc ttcccagaaa gggggtcgtt tttctcgaat 60
cttcaaccag ttgtgtattg gaaactaggg cgcattttac tattgatcac agtcattata 120
ttgtt 125
<210> 157
<211> 151
<212> DNA
<213> Homo sapiens
<400> 157
ttcggaaata gggaagactg tctctgaaga aggaggaagt gtagcttatg ggaggctgag 60
gagtttggag tttctccttg tgggaaggtg ggagccatgg aggctgaaga cagttgtcca 120
actcagggca tacaaattga tgaggaactc a 151
<210> 158
<211> 233
<212> DNA
<213> Homo sapiens
<400> 158
aggacctcag agatgtaagc attttagcag ccacacaaaa tctctggcta tgaaagggac 60
ttcatgacca tccagtccaa tataacactt gcagacagag aaactgaggt cttccatgac 120
ttgcctagtc tcccagctag tttgaggcaa aactggattc ccactctggt attctttctt 180
ccttttacat cattttccct cctttaaaat gtcctgagag accagaactc aca 233
<210> 159
<211> 169
<212> DNA
<213> Homo sapiens
<400> 159
actaaagaca ttaagcattt gcacttaatt gggtacttcg ggaaagaagt gtgtaggttg 60
gcattaaagg tacttcttac actgcatgtt ctgtaaggac agcaaaatac atctatatag 120
gttcactgtt aaattctcga ggactaatgg atccgcatgt gaaaagtaa 169
<210> 160
<211> 123
<212> DNA
<213> Homo sapiens
<400> 160
tgagccccgt gcctggcctg gtcatttctc ttgctgtgcc caacctgcca ttaatcccat 60
ccatcctgag cccgacgtgg tcatttctct caccacccag cataccgccc aacgtggtcc 120
ttt 123
<210> 161
<211> 274
<212> DNA
<213> Homo sapiens
<400> 161
taagtactta agtcctgtct ccttggccaa gccagactag gcccaacacc ctcaattcac 60
cctggctcca aagagggcaa aagcaactct ctttctctaa ggccagggaa gtatctacca 120
caatctctga aacctgtgaa cttttctgtg ggcctgtagt ttcaagtccc accttaactg 180
tccttaaaaa aaaaaccaaa caatgaccta cctaatccat ctaatttctc aactaactgc 240
caccatctct actatatcca cctgcatcct attt 274
<210> 162
<211> 53
<212> DNA
<213> Homo sapiens
<400> 162
taggcttagc ttgatttctg ggcccactgt ctgtgttctt aagatgccaa cct 53
<210> 163
<211> 169
<212> DNA
<213> Homo sapiens
<400> 163
tatgatgcac agttcgtgtc aacaggaaat gatggatgtc aagcaattca ttggtaaact 60
cctacctcca attgattgac gtcactaaga ggccttgtgt agaagtacac cagcatcatt 120
gtagtagagt gtaaaccttt tcccatgccc agtcttcaaa tttctaatg 169
<210> 164
<211> 260
<212> DNA
<213> Homo sapiens
<400> 164
cagctgggcc ctggctgatg tcatgagcca actcaagaag aagagggcag ccactacatt 60
agatgagaag attgagaaag ttcgaaagaa aaggaaaaca gaggataaag aagccaagtc 120
tgggaagttg gaaaaggtag aaagaagcaa aggaaggctc tgaaccaaag gagcaggaag 180
accttcaaga gaatgatgag gaaggctcag aagatgaagc ctcggagact gactactcat 240
cagctgatga gaacatcctc 260
<210> 165
<211> 239
<212> DNA
<213> Homo sapiens
<400> 165
aacccactcc aattaggcat tgctcccact cctccccatc agtgctctca caaggtcacc 60
agtggcttct acattgccaa tctagcgatc aaatctcagt aagtgtcatt tgatataact 120
gatctttcac ttcctctttg aaaccccatc atgtggtttc caggaccaca cactccctcc 180
ctctcctcct gccatgggtg tcagtctcca gggctctccc taacctccat gtgtaagaa 239
<210> 166
<211> 278
<212> DNA
<213> Homo sapiens
<400> 166
tgcccattct ccaaaaagca cgtgcccagc ccccaatccc ctctatatct cagctgaagc 60
atcacctcca ttaatgaagc ctagtccttt cctgcctcgt gtgttgcttt gttgctgctc 120
acacctttag acaagacttg ctgccactga ctcccaccag tccctgttcc ctggaagaaa 180
tcaaggaagc ccaccttgat ctcatttgag ctcctaattt tacagaaata gggacaaagg 240
ttcaaaggga gcctcacagg tcgcatggtg aaccaagc 278
<210> 167
<211> 214
<212> DNA
<213> Homo sapiens
<400> 167
agcatctgaa actatatcca gaatgacact ggattttcat aaaagtgttg atcctcacac 60
ctctttatag tcttgcacct agcacagtgg agtgaaacac tttaaatagc acttgttcct 120
tgagtatata tggaaaaaag tgaagtattg ataagtgctc agctaatatg agcagcatct 180
caggagtctc caattcttga attaccaggg agta 214
<210> 168
<211> 193
<212> DNA
<213> Homo sapiens
<400> 168
ggagttggag cccactctgg ggaaaacatg ttgagatctt gcctctgcaa aaataaagta 60
aaataaaatt taaaaaaagt aaaaaaataa aatcagctga gcatggtgac atgcacctgt 120
ggtaccagct actttggagg ctaagttgag aggcactgat gggaggatca tttgacggcc 180
cagaggttga ggc 193
<210> 169
<211> 240
<212> DNA
<213> Homo sapiens
<400> 169
ggcagctggc ggtcatttac atccccccgc tgcagagggt cttccagacg gagaacctgg 60
gagcgcttga tttgctgttt ttaactggat tggcctcatc cgtcttcatt ttgtcagagc 120
tcctcaaact atgtgaaaaa tactgttgca gccccaagag agtccagatg caccctgaag 180
atgtgtagtg gaccgcactc cgcggcacct tccctaatca tctcgatctg gttgtgactg 240
<210> 170
<211> 284
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (213)..(213)
<223> n is a, c, g, or t
<400> 170
atagtgttgg gcactgtctg accatgttgc atttggaagg ctaaatgggg ccatgaagaa 60
ggctggaagg gacaggtggt gatggcagcc tacctggtgt cccctacccc acctgttctc 120
ggagaaccaa gttgctacac aggaagttct ccaaggtcca gtttcctttc tcccaccagt 180
tggtggaggc ttcagggaag accagagtcc tgnacagaga gggtaacagg aggagtcggg 240
gataaacatc aaacatcaat cgtgtgtcct gatttgggag tgat 284
<210> 171
<211> 245
<212> DNA
<213> Homo sapiens
<400> 171
gggccttccg tgctggcaga acaaagaaat gaatggatgc atggacagat agagagacta 60
atgcagcttg ttgagacagg ggctacagct tcactgatgt aagaacaact ccaccctcat 120
gccccagcct ttttcttggg gcaggggcac atgataacct ttctcccaca ctaaaccttg 180
ctcactacca gactagtagg ccttaaactc tgggagcaag aatggaactc cttcctatct 240
caaca 245
<210> 172
<211> 142
<212> DNA
<213> Homo sapiens
<400> 172
ctccactatg aatgatctga tgtatagtaa ggttcgaaga ccacttaaaa attttgccac 60
aatctttgca tttgtagggt ttgtctccag tatgaactat gttatgttga gtaaggcctg 120
aggaatagta aaaagctttg cc 142
<210> 173
<211> 256
<212> DNA
<213> Homo sapiens
<400> 173
aactagtggc tagcatcggc ttgacctgcc tcattcccct cgaataactg aagatcctgt 60
acaacaatgg agactctcgg aacatttatc cacagtgcaa ttacagaaag cagttcgtga 120
tttctctaga aataataaat atggctcact ggtgaccatt cccctcacgt gtcctctgtg 180
gtgcccacac gtgcgccggg atgtgcaggc gtggacgcag agacgcccct gtggaaagca 240
cacatgcggt gcacac 256
<210> 174
<211> 99
<212> DNA
<213> Homo sapiens
<400> 174
tggaggtgcc acaaaaatca tctggtaaat tgtttaaagt aatcccaaat gcaactcaaa 60
tctacagaat cccaggtgaa gctcagtaat ctgtatttt 99
<210> 175
<211> 227
<212> DNA
<213> Homo sapiens
<400> 175
tgtctcctcg tgtccgcatt gctggagctc cacctccctc ttggtttctc cgcacccgcc 60
cattttcctt ctgtctttac ctgcttcgta tcctttccct gctgatgtgg ctgacccctc 120
tcccacccct ccctgcaggc ggctggccag gtgggcaggt gccagccgga gctgtaaata 180
gagcgctgcg cttttgtgct ggtttgtgcg tgtgctgtat ttctgtg 227
<210> 176
<211> 41
<212> DNA
<213> Homo sapiens
<400> 176
ccatgggcca caaatctcta caagtgcctg ctatccctct c 41
<210> 177
<211> 270
<212> DNA
<213> Homo sapiens
<400> 177
gtatctgctc aagtagaagc ttccgtctct cttgtaacag gtcagtgctt cagttaccac 60
tgccattgaa ttacccactc gctatcactt gcctcttatt tccataaaaa aagaaacgga 120
ggaaaaaact gtttaagttt taccttgttt aaaagtaaca cgagtgcttt tgttattctg 180
taaactaaat acataaatga aggcaaagga aggaaactga gggaagggaa caaaatgtga 240
gtgatgaaaa cacggagttc attaaatgaa 270
<210> 178
<211> 191
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (109)..(126)
<223> n is a, c, g, or t
<400> 178
gcaggtcaaa aacctgccct cctgtgactt attccctgag acttttcagg agagccagcc 60
cacagatgat gaagaaatga tggaagttca tttggagagt caaatgggnn nnnnnnnnnn 120
nnnnnnctgc ctttgataca ggcaattcag tggactataa taatagtgga gggttgagat 180
gtagagtttt t 191
<210> 179
<211> 211
<212> DNA
<213> Homo sapiens
<400> 179
gtgctatggg aaccaggtgc caggtgaggc caggtgaaga caggtgaggc caggtgaaga 60
taggtgaggc caggtgaaga cagatgttac gggaaccagc aggtagaaag ctaagtgctg 120
tggagaaaga gcgggaagaa atggaggagg tgtctgggac aacagaactt gaaaagaacc 180
tgcttctcag tagccccaag tcctgtgtgt g 211
<210> 180
<211> 205
<212> DNA
<213> Homo sapiens
<400> 180
tgaagagcct tctgggtacc tagaggtgct gggaaggagt ttggatttaa tcttggctgt 60
cctgtgacag ggattcggag gccatggggg agggttgagc agggagacag gagacaggca 120
agaggcgctg tgagaagcgt gggctgagtg acctgctcct tggtgagtga gaagtcctag 180
aactgagcac catggcatgc acctg 205
<210> 181
<211> 287
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (235)..(248)
<223> n is a, c, g, or t
<400> 181
atccttccac agtctgcaaa ccagttcctt ctgcagtgtt ttcctctggg agtgtcttgg 60
gctaagccac agcggtgtca ccccaccaca cacactgccc tgcaaaagga ctgccaatac 120
ccccagccca ttccccagcc tcacatataa ataaggactt gcgacccaga atcacatcca 180
gaagggaagt ttcacatggc ttggaatcct ttaaaaaagg acagcaaacc aaatnnnnnn 240
nnnnnnnncc ctccctaccc acaacatcca gcctgatccc gggaatt 287
<210> 182
<211> 294
<212> DNA
<213> Homo sapiens
<400> 182
cgacagccct gtttcggtca ccagactctg aacatgctac atcctgccca agactgcacc 60
tctggaggtg cagggcaccc ttgagaagcc cctcacccct aggccgcctc caggtgctac 120
ccaggagtcc cctccatgta cacacacaca actcagggaa ggaggtcctg ggactccaag 180
ttcagcgctc caggtctggg acagggcctg catgcagtca ggctggcagt ggcgcggtac 240
agggagggaa ctggtgcata ttttagcctc aggaataaag atttgtctgc tcaa 294
<210> 183
<211> 193
<212> DNA
<213> Homo sapiens
<400> 183
atgagtactg agacctgacc actgcgttaa gcaacataga ggtcagtgtc catgacatgc 60
tggaaccaga gcttgattgc agttggttct agaaaaaaat gggggaggca atgtttgaga 120
gcatatatag acaactcttt tcaagggatt tgctataggg agaaaaaaag cgatgggaca 180
aaactagagg gac 193
<210> 184
<211> 168
<212> DNA
<213> Homo sapiens
<400> 184
gaccagttta ggcaacatag tggaaccctg tgtctacaaa aaataaaaaa atttagctgg 60
gcattttggc atatgcctat agtcccagct acttgggagg ctgaggaggg aggatcactt 120
gagcccagga ggtcaagttt gcagtgaact acgattgcac cattgcat 168
<210> 185
<211> 156
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (131)..(131)
<223> n is a, c, g, or t
<400> 185
gggcactcgc atttggtcat tctcttgaga gctaggaggg gtcagcctga ggccggagag 60
gaagggcttt tgcctggggt gagagggtga gagacttgac ctgaaagcag ctcctgcccc 120
tgaggtgcaa nccagagtcc tgtgtgcgga cagaga 156
<210> 186
<211> 109
<212> DNA
<213> Homo sapiens
<400> 186
aatttttact attggtcatt tgcagaacag taaattctgt gtgttggtac agagtgctct 60
gtaccagtgc tcatcatccc ttcttcatac caacggtccc tagttatag 109
<210> 187
<211> 106
<212> DNA
<213> Homo sapiens
<400> 187
tagagatggg ttcttctggt tgatacagac tatgcattgc gtctagcaga tggggtaaac 60
tggcctaaaa caagtctttg cagaatacat gccaatttcc aaaaaa 106
<210> 188
<211> 188
<212> DNA
<213> Homo sapiens
<400> 188
tctccctgcc tcacaggatt gtgactcccc agcccctgcc ctcaaagctt cagacccctc 60
aggtagcagc aggaccttgt gatcttggcc ccttggatct gagatggttt tgcatctttc 120
caggagagcc tcacattctt cttccaggtt gtatcacccc cgagttagca tatcccaggc 180
tcgcagac 188
<210> 189
<211> 148
<212> DNA
<213> Homo sapiens
<400> 189
ggtagccatt ggttcttgga tctgtgttag aatgagtgct ttcccttcct actgatgtga 60
ttgtggatta ggaattcgtg accgagtgat ttttggccag tggttgggtt taaaattcta 120
ttaaaatttg tagtttgggc tgggtgct 148
<210> 190
<211> 184
<212> DNA
<213> Homo sapiens
<400> 190
gaaggtttgg acgattattt gactcgcctg atagaagaaa gggatacttt gatgagaacg 60
ggtgtgtata atcacgagga tcgaataata agtgaactcg accgacagat cagagagatt 120
ttggcaaaaa gcaatgccag taattaataa catttggaaa agctttatag agactctaag 180
tcta 184
<210> 191
<211> 123
<212> DNA
<213> Homo sapiens
<400> 191
ttgccaggca cggcggctca tgcctgtagt cgcaacactt tgggagacca aggcaggagg 60
atcacttgag tccaggagtt tgagaccagc ctgggcaaca tacagatgtc tacaaaaata 120
aaa 123
<210> 192
<211> 263
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (65)..(76)
<223> n is a, c, g, or t
<400> 192
tcatacaaca aatcccatct ctgtcccctg aaattcccct agtttcattc attagaaggg 60
gattnnnnnn nnnnnngact taaagagcac tttacagcag cattcagctt tcctatgaaa 120
tactcagcat cttaaatatt atatacaact ctttttttag taagctagac actggcttca 180
gagttcgtgg gagtggggga aatcaaccca ttcaaaacta ctctagaaat tgtcttttgg 240
cagaatagca ggtatccaag tta 263
<210> 193
<211> 45
<212> DNA
<213> Homo sapiens
<400> 193
agttctaggg gatatttgtg caataaatac acatgtcaac ttgaa 45
<210> 194
<211> 125
<212> DNA
<213> Homo sapiens
<400> 194
aaagcaggta gttagttacc atttggagag ggattccgga acctagagag agatgaggct 60
gaagaggcgg gaagaaacca gatggcaagg actttgtctc atgcgcaaag catataattt 120
ataga 125
<210> 195
<211> 233
<212> DNA
<213> Homo sapiens
<400> 195
agaggtaata tccttcctat tcttccttca cttctgcccc tcctcccacc tcttcccagc 60
ctccctcacc tgacctattt agggggtgat gggatgaaaa gaagagagtg aaggatatgt 120
aatcaagtgc aaaatactgt ggtaagtaca gagaatgaat aaggtggaaa ggaaagtgaa 180
aagtgtggga tggttagggg ctttaaggac ttcccaggaa aataggattc tgg 233
<210> 196
<211> 197
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (142)..(142)
<223> n is a, c, g, or t
<400> 196
gaccagggcc tctcctgtgg gatctttgtt ttgtgtttaa ccataatggt tgtgtactga 60
accacttcat atttgttata tataatatat atatatataa tctccttaag actcagcctc 120
ctggtttacc cccccggcct gngcatctga cctcccccac cccagtgtga tttaacatcc 180
aggaactgag gcctgaa 197
<210> 197
<211> 289
<212> DNA
<213> Homo sapiens
<400> 197
taagagctgt ggaggactga aaactggata aaaagggggt ccttttcctt gcccctgtct 60
ctcactcaga tgcgcttctt tttcgccact gtttggcaaa gttttctgtt aagcccccct 120
ccccctgccc cagttctcca ggtgcgttac tatttctggg atcatggggt cagttttagg 180
acacttgaac acttcttttc cccccttccc ttcacagtaa ctggggcagg ggcctacggg 240
gaggggcttg tactgaacta tctagtgatc acgttaacac ctaactctc 289
<210> 198
<211> 195
<212> DNA
<213> Homo sapiens
<400> 198
ggactgcagc taagtgtcca ctccccaaag tcttcctatt cctaactcca tgacagctcc 60
tcagtagagc tttcctcctc agaagcaact agaacaatgc agttaacatt atttggcccc 120
aacggcgttt actgtgtatt ttggctgaga tctttagaag cccgaggcct aaacaattaa 180
ctgaggaaca tctaa 195
<210> 199
<211> 213
<212> DNA
<213> Homo sapiens
<400> 199
ttactgaact acagcctggt ttgtagactt cctgtttcta cactgctgct cttcaccatt 60
ggaattcact gtggtattta tattactggc ttcagtccga gccacaggta ataaaaggat 120
atcatctgta tttctcaacc atatcatggt gtatagatgc tgttattcag gcgaacttgc 180
tcatgggtgg actaacacct ggtttggtac aga 213
<210> 200
<211> 221
<212> DNA
<213> Homo sapiens
<400> 200
gagccatgat tgtgttactg ccttccagcc tgggcaacag agtgagactc catctcaaaa 60
aaaaaaaaaa gaaagaaaga aaatcagact ctgaggctgc aggcggtggc tcactcttgt 120
aatcccagca ctttgagagg ctgaggcagg aagattgctt gagcccagga gtttgagacc 180
aacttgagca acacagtggc accctatctc tacctaaaaa a 221
<210> 201
<211> 278
<212> DNA
<213> Homo sapiens
<400> 201
ggagccgcca cggaattgcg aaagcccagc tacgcagaga tttgtcagag aacgagtaaa 60
gagcctcctt cttccccatt gcaaccccaa aaagaacaaa agccaaacac tgttggttgt 120
gggaaggagg aaaagaagct ggcagagccc gcagagagat accgggagcc cccagccctc 180
aagtccacac ctggagcccc cagagaccag aggcggccgg cggggggccg gccctcgccc 240
tcggccatgg ggaagcgtct cagccgagag cagagcac 278
<210> 202
<211> 198
<212> DNA
<213> Homo sapiens
<400> 202
cgtgctacca tcacagctga atgcaatgaa aggcggtcct ctgagaggag cagggtggag 60
atgctaaagt ggaggccccg tcccattgct gatagatcct catctggcat gcgctccacc 120
ctccccattc tctgctccca cgtatcgtag ccccatcaca gaagatgcga catggaaaaa 180
cgcactgtgt ccacccta 198
<210> 203
<211> 50
<212> DNA
<213> Homo sapiens
<400> 203
gctgtgccca acctgccatt aatcccatcc atcctgagcc cgacgtggtc 50
<210> 204
<211> 217
<212> DNA
<213> Homo sapiens
<400> 204
ttttagcaac cagccagaga gggcgtgggt tcatgaaaaa cgggtacgag agtataaagg 60
tcataaacag tatgaagaat tactggctga ggcaaccaaa caagccagca atcactctga 120
gaaacaaaag attcggaaac cccgacctca gagagaacgt gctcagtggg atattggcat 180
tgcccatgca gagaaagcat tgaaaatgac tcgagaa 217
<210> 205
<211> 175
<212> DNA
<213> Homo sapiens
<400> 205
cctcgtgggc acgtggagaa gggcccacgt gtctccacac gccagccaca ggggagccct 60
ggccaggcgc ccagccaggg gagcgtgtgc ctgggatggg tcacagaacc agcgggcacc 120
tgtgaggctg gccagcaccg tggggctgtg ggaatcgctc ttatttatat ttaaa 175
<210> 206
<211> 265
<212> DNA
<213> Homo sapiens
<400> 206
ttccaagtgc gacctcaaat gacaactttc tcaggtggtg cctggatagg aaaggcaccg 60
gaacagaatc tgtagaaaac caaacctatc atgatcagca ttcctacccg acgttaacct 120
cctagactag ctgaccttat ttattttgaa agcaaatcaa gtgtatacag tctcttttta 180
aaaaactgtg taaacgttgt aaagttttta ggggctgttt ataatctgaa gatttataaa 240
aaattactgg acttgttagg actat 265
<210> 207
<211> 223
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (115)..(132)
<223> n is a, c, g, or t
<400> 207
tgagatgatc agacaccgga gttcaacgtc ccagcagtct tggtaaaagg agggagccta 60
ctgagccagg agggagaaaa gaagattgac cagcttgcta gaaaaatact tagcnnnnnn 120
nnnnnnnnnn nngtggaggg gggacggaga ggaacaagga tggggaggta ggaatgaggt 180
atagaaaaga gatagcatct tctttggcac aagactagtg gct 223
<210> 208
<211> 188
<212> DNA
<213> Homo sapiens
<400> 208
cccaggatgc gtcagtctgt tcagtggtca gcaggccccc caccccccgc cgactgccct 60
cgccatcgtg gtcagacccc cctcccaaca caacacgctg ctggtctgtg tcagcctttg 120
taacgtggga ggctctgccg tgtcttccgg gtgaactgta tttggattgc gcgcattgtc 180
acggtccg 188
<210> 209
<211> 254
<212> DNA
<213> Homo sapiens
<400> 209
ataggtagca aagctaaggc ccagaaaggt taagtaattt tcccaaagtc acacagcttt 60
gatatacagc aaaactcata tccctgagct ttctactcac tgttcttccg gttattatcc 120
ctgaggtcat aaatctccac ccgcaaaccc aatagcacca gtacaagaaa tctggactgg 180
agatacttta tccacaccta ccactgcccc aaaaagtaaa atctgactct gtgattctaa 240
tgtaccaatg gtac 254
<210> 210
<211> 158
<212> DNA
<213> Homo sapiens
<400> 210
atttttattg cagtaggagg aaatatattt aaaatatttg tagatttata gcaaatagag 60
actcgttatt taaaggttaa ataacaattt gttcttttgt tgtttttgcc agtttagggc 120
agtagctgct tttgtcataa atatcttcct accacatc 158
<210> 211
<211> 135
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (94)..(94)
<223> n is a, c, g, or t
<400> 211
cttgagtaaa gacattttgc ttaatttctt ttttcttatt ccccacttgt atatccccta 60
ccagtaccgg gatctgcaca catctttttg cagntacctc ttcatagcca tgaaccaaaa 120
cgttctatga ggagc 135
<210> 212
<211> 248
<212> DNA
<213> Homo sapiens
<400> 212
ccttcctgat tgtttacagt cattggaata aggcatggct cagatcggcc acagggcggt 60
accttgtgcc cagggttttg ccccaagtcc tcatttaaaa gcataaggcc ggacgcatct 120
caaaacagag ggctgcattc gaagaaaccc ttgctgcttt agtcccgata gggtatttga 180
ccccgatata ttttagcatt ttaattctct ccccctattt attgactttg acaattactc 240
aggtttga 248
<210> 213
<211> 259
<212> DNA
<213> Homo sapiens
<400> 213
tcctgtcctt gcaggtaaga cctgctccgg ggtccccgcc ccgccgccgc acactcccgc 60
ggtcgtctgg gctgtcacta ggagatccgt agcccagacg gtgactttcg tatgagctat 120
ttaactttat tttcttcaga atctgctgta gattgagctg tgcgtgaaat tgctagtaag 180
ttctgacatg ttaatgcgtc tgtctttaaa tctgaattgt taccataaac gtgtttaatg 240
gaacttgctg gtctgtgga 259
<210> 214
<211> 262
<212> DNA
<213> Homo sapiens
<400> 214
acctcatccc cgaataataa ctaagcacta gagtgatgct ggggatgctg gggcttggtt 60
taggtggctg gggaagttat cttggaggtg agactccagt ggactctgcg gatgggtaag 120
gtctcagaga ggttggggaa gttatcttgg aggtgagact ccagtggact ctgcggattg 180
gtaaggtctc agagaggttg aggttaagaa gagagcattc cagaccattc caaaatcagc 240
acataacaca catggcttga aa 262
<210> 215
<211> 161
<212> DNA
<213> Homo sapiens
<400> 215
gtttctacag ttcacttgtc tgcatagagg tcgtgctgtg cctggcagta atctccactg 60
cccttcagaa actccataaa tgtgtgacca agaacaccac agaattgagg aatatgttta 120
ctcattgaag attgtggcct aatcatacag ccggtcccga g 161
<210> 216
<211> 135
<212> DNA
<213> Homo sapiens
<400> 216
atgcaagtag gcagccagcc cgtctgttcc ctctccgccc cgccccgccc cgcccccgtc 60
actgcgcttc tgttatacca tctttgcctg actctctacg gcttctccat tgaatggcta 120
atgtgtatgt gaaat 135
<210> 217
<211> 278
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (177)..(247)
<223> n is a, c, g, or t
<400> 217
tacacaaact ttattacagg cacaaaatta tcaaaaatac ggtataaaat taccttaagg 60
ctatgtatat aagggatgtg tgtatgtgtg tatacacaca aaaataaatt ttgtgtttcc 120
acttggatcc cctccctaag ataactcatt gtgtacatgc aaatattaga aaatgcnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240
nnnnnnncta ttttatcacc attttcatgc tgtattaa 278
<210> 218
<211> 242
<212> DNA
<213> Homo sapiens
<400> 218
aactgcatga tgcacctgct ccgctccctg cccgacccca acctcatcac cttcctcttc 60
ctgctggaac acttgaaaag ggttgccgag aaggagccca tcaacaaaat gtcacttcac 120
aacctggcta ccgtgtttgg acccacgtaa ctgagaccct cagaagtgga gagcaaagca 180
caactcacct cggctgcgga catctggccc catgacgtca tggcgcaggt ccaggtcctc 240
ct 242
<210> 219
<211> 205
<212> DNA
<213> Homo sapiens
<400> 219
gctcataaca aatataccag cattcatgat agcatttcag cattttccaa ggtaccaagt 60
gtacttattt tgttgttgtt gttgttgttg tattttagaa ggaattcagc tctgatgttt 120
ttaaagaaaa ccagcatctc tgatgttgca acatacgtgt aaaatgggtg ttacatctat 180
cctgccattt aaccccacag ttaat 205
<210> 220
<211> 94
<212> DNA
<213> Homo sapiens
<400> 220
tatccaacgg tatagatcac aaggggggga tgttaaatgt taatctaaaa tatagctaaa 60
aaaagatttt gacataaaag agccttgatt ttaa 94
<210> 221
<211> 273
<212> DNA
<213> Homo sapiens
<400> 221
gacaaagctc taggatgatg gctgaggggt agaagaaggg gcaagggaga cagaggtctt 60
ggagatgacg cccatatctc tggcatgagc aacccagatg gcagggggtg gggcctggtt 120
tgtgggaagg ggtgtcccac tagcagatgt gtacccagtg gaggtgcagc tcagattgga 180
gctggccatg ggtatttgaa aatcatgtgc gcacaggtag ccactgaagc catgggagtg 240
aaagagaaca cttggaaagt gaactctggg aaa 273
<210> 222
<211> 168
<212> DNA
<213> Homo sapiens
<400> 222
tggaccgtcc aagaaggagc tacatcagag gttttggtag atgctgctgt agacctcata 60
tccgatgaat gggaagctgc taatgccata cccagcagag agaaggaagc aggatgcagc 120
cccgcttgag gccgccagcg tgccttctgc agactgtgag cagagcaa 168
<210> 223
<211> 277
<212> DNA
<213> Homo sapiens
<400> 223
agctttgcag ttataggctc taacctggac atgtcagaag ccaactacaa actgatggaa 60
cttaatctgg aaataagaga gtctctacgc atggtgcaat cataccaact tctagcacag 120
gccaaaccaa tgggaaatat ggtgagcact ggattctgag acacttcagg ccttttagga 180
aagaaactaa actgaagatg atgaagaata ttaaccaagc accttttaat ggacccttgc 240
ttcactgata actttctggc agcatctact ttttagt 277
<210> 224
<211> 290
<212> DNA
<213> Homo sapiens
<400> 224
aggtctagga gatgcctgag cctccactga cctctgtgca tgtggcccac cagtggccac 60
tctgtccttt tggaaactgt cctctggctt tctaggaacc ccatgttttt ggtcttctcc 120
tctggcccct ccttctcagt ctcctcagca ggactctatt cctgtaccca ttcctaaaat 180
gtcacgaact cgtttctggc cttgtccttc tttgagtgca tctctggttc ttcatctatc 240
cctgttgaga tgctcaccct tctttggtga gctcccaacc ggtacaggta 290
<210> 225
<211> 68
<212> DNA
<213> Homo sapiens
<400> 225
aattgtgcct acctcagata gacagtgcca gaattaagtg agtcaagcca agtaaagccc 60
agagaaga 68
<210> 226
<211> 105
<212> DNA
<213> Homo sapiens
<400> 226
tcttcacaca gacaattcga tcagtccttc aggtcttaag tcacttctca agaatgccgt 60
acttgcctag gctagattag atcctactgt tacatgctcc cttta 105
<210> 227
<211> 98
<212> DNA
<213> Homo sapiens
<400> 227
tttagtaggt acgtcatgac aactaccatt tttttaagat gttgagaatg ggaacagttt 60
ttttagggtt tattcttgac cacagatctt aagaaaat 98
<210> 228
<211> 206
<212> DNA
<213> Homo sapiens
<400> 228
ggcggcgtcc ccagctggtt cgggctgtga cggggtggcc agcagggacg cgccccaggt 60
gggcagctgt ggcagagcag cgacccgcgg cggggcggca tccccagctg gttcgggccg 120
tgacggggcg gccagcaggg acgcgcccca ggtgggcagc tgtggcagag cagtcccgac 180
acctaaataa aagtcttgct gcagga 206
<210> 229
<211> 99
<212> DNA
<213> Homo sapiens
<400> 229
agataaattg ttgcctgctt ctgtgtctct gccagcctgt gatcatattg ggttagagtt 60
agaaatccgc tgtttgcctt tcttactggt aggatcctt 99
<210> 230
<211> 147
<212> DNA
<213> Homo sapiens
<400> 230
atcctcgcca ttcgaatttc agttctgtac atctgcctat attccttgtg atagtgcttt 60
gctttttcat agataagctt cctccttgcc tttcgaagca tcttttgggc aaacttcttt 120
ctcaggcgct tgatcttcag ctctgcg 147
<210> 231
<211> 57
<212> DNA
<213> Homo sapiens
<400> 231
aaacgaactg taaaagacca tgcaagaggc aaaataaaac ttgaagtgaa tgcttaa 57
<210> 232
<211> 269
<212> DNA
<213> Homo sapiens
<400> 232
agcacgctac caaatctcaa aatatcctaa gactaacaca aggcagctgt gtctgagccc 60
aacccttcta aacggtgacc tttagtgcca acttcccctc taactggaca gcctcttctg 120
tcccacagtc tccacgagag aaatcaggcc tgatgagggg gaattcctgg aacctggacc 180
ccagccttgg tgggggagcc ctctggaatg catggggcgg gtcctagctg ttagggacat 240
ttccaagctg ttagttgctg tttaaaata 269
<210> 233
<211> 204
<212> DNA
<213> Homo sapiens
<400> 233
catcatgttt ttgtgggcaa atacaagttg ttataattaa aacccctaat ttgaatattt 60
ttgttaccaa gaaccaaggc aaatgtttaa tttgttataa aacctgtttg tgaagtgctg 120
tgttaaattg tgctgctggc taataggcct catttcaatt taataaatat ttattgagga 180
ctggctttat gtctggccct gtgc 204
<210> 234
<211> 155
<212> DNA
<213> Homo sapiens
<400> 234
agtatctgat atgtgtgtgg aggcagccat cttttcctga aagtcctttt aggaatcatt 60
atttctggtc ctctgaagtt tgccgctacc actcataaat atctatccac accccttaca 120
agaagaataa ggaagatctt aagacctaga aggaa 155
<210> 235
<211> 272
<212> DNA
<213> Homo sapiens
<400> 235
acttgaccta ggcagtgacc attctctccc actttcacac atgttcactt gacttccagg 60
ccatactctt agtttccatt ttacctcact gcctcactcg ttatcatctt ccttgcctcg 120
ttcctcaact ctctatgcta gagtacttca gggatcagtc cttgatcctc tccttttctc 180
tatacttact cctttgaggg tttatctagt ctcacagatt taaatatctt tgatatgctg 240
acaactctct aattatctaa ttcaccctgc cc 272
<210> 236
<211> 277
<212> DNA
<213> Homo sapiens
<400> 236
aaaatttctc tttgctcttt cgtagaaata aaacttaaca gttggatagg ccctgatccc 60
agctttctgg catgtctgag cataagcctg acagtctact tttccagctt tcacttttcc 120
tttaatcatc ctagccaaga gctcaaattc tggagcaaaa ttctggcaag gtccacacca 180
aggagcatag aaatcaatca cccaatgatt tttcccttgt agaacttttt cactgaaagt 240
ctgaggtgtt agatctgtgg atacttgatc ccgggaa 277
<210> 237
<211> 272
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (106)..(189)
<223> n is a, c, g, or t
<400> 237
ggcacaacat ttttgaggac aattaaaatt ttatatctac atagtcttca ccccaactct 60
tccatttcta gatatctatg ctacaggaat acttgcccac taagcnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnt ggggtgaccc tctaagtcct aggaaggaaa gaaattatga agtgaaagaa 240
tatcatataa gtgataccat gaagtgaaag aa 272
<210> 238
<211> 300
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (36)..(213)
<223> n is a, c, g, or t
<400> 238
ggagtagcca agactcctgt ttctctgcat ttttcnnnnn nnnnnnnnnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnntggggtc cctgttgccc agcatgcctg 240
gaccctcaac acttaatagt gataataaca tatatccaac ccttggtaaa tgccaggact 300
<210> 239
<211> 229
<212> DNA
<213> Homo sapiens
<400> 239
ggcctttagt taacatccga gtgacgaagc cgggttcccc agtacagctg tcttttgggt 60
gcggtcattg tgaggaaggg gatgagtgag tgtgggtgtg gctggaggag gagctagatg 120
ccggtggaca gtgggcaggt ggatttgggg aggagaggat cagcagcagc agaagtactc 180
agtgataggg ggctggctgg gtcaggaatg gtgagatgaa catgcaagt 229
<210> 240
<211> 51
<212> DNA
<213> Homo sapiens
<400> 240
acttgaaccc cgaaggcagt gtttgtggtg agcagaaatt gcttcattgc a 51
<210> 241
<211> 300
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (203)..(203)
<223> n is a, c, g, or t
<400> 241
gggccatggc actgctgttc agctcaggca caggggcaca gcagaggttt gggaagcggt 60
ctccccaccg gcactgggat tggcgggtcc aagcccagca accggcttcg ctccacaaca 120
cacaccacac ctgggactgt ttttaataca tagcaacaga ctgggttatt tatttaagat 180
gtgtattgtg tcatatgaag ttnaagagac ataaatggca ttttgttatt tattaagaca 240
aactccaatt gttctctggc tgtttttttc agttgtgtct agcaaatact tatctgccct 300
<210> 242
<211> 286
<212> DNA
<213> Homo sapiens
<400> 242
agactgactg ctaaactgta tgaatgatga ggggatttgc acgtataatc ttaactgtac 60
atcaaatgtt aattttttat tttatccact gtctttgaaa acctaactct tgactaagaa 120
ctgactttcc tgtacttgtt gttgactcta agtaaacttc caattccaca tagtccaaag 180
atgatgtgct gagaaatctc tcaaaggaaa aatgctaaga atacaggcag agttatgcgg 240
caaattttgc agaattaaca caattgcact tgtgagtatg aagcac 286
<210> 243
<211> 109
<212> DNA
<213> Homo sapiens
<400> 243
atggacagaa cggagactag gttccgtaag aggggacaga ttacgggaaa gatcacgacc 60
agccgtcaac cccaccccca gaatgagcag agtccccagc ggagcacct 109
<210> 244
<211> 37
<212> DNA
<213> Homo sapiens
<400> 244
tttgttacat atgcaataaa ctcacgactt tacattt 37
<210> 245
<211> 34
<212> DNA
<213> Homo sapiens
<400> 245
ggaagtggac gcaaagtgga tgcggcagca gaaa 34
<210> 246
<211> 287
<212> DNA
<213> Homo sapiens
<400> 246
tggccatgca tgatggctta cacctgtaat tccaacactt tgggagtctg aggtgggagg 60
attgcttggg tccaggagtt taagaccagc ctggccaaca tggtgaaacc ctgcctctac 120
aaaaaataca aaaattaggc aggcatgatg gtgtgcacct gtggtcccag ctactcagga 180
tgctgaggtg ggaggatcac ttgagcctgg gagatggagg ttgcagtgag ccgtgatcat 240
gccattgcac tccagcctgg gtgacagggt aagaaactgt ctcaaaa 287
<210> 247
<211> 196
<212> DNA
<213> Homo sapiens
<400> 247
tggagtgcat aggtagcagt gcttctcccc caaggctggg gcgatggaat cagttagact 60
attgagggca tctggaaggg catctgtgtc agggttagtc ctcagggtat ggtggccaat 120
gggtttcttt tggttgactg ttgacaatgc gtttgttgaa tggcagcctg cactaggtga 180
cgctgaagcc acagaa 196
<210> 248
<211> 189
<212> DNA
<213> Homo sapiens
<400> 248
ttcattccca caaaaacctg aggcagctct tttgcccaga gcgttccctg tagccacccc 60
caccccactt gcccttggtt ctttagaagg agcacacaca tcccttgatt cctccctgat 120
gtggtaaact ggcacactcc aggggtctaa aacataaaac agttgtgttt agggaacctt 180
aagtcatgc 189
<210> 249
<211> 35
<212> DNA
<213> Homo sapiens
<400> 249
acagaggctt cttcagatca gtgcttgagt ttggg 35
<210> 250
<211> 247
<212> DNA
<213> Homo sapiens
<400> 250
attctgcatg attcacggac taggagtccc tggtcaaaaa cttcaaaaac taagtgatgg 60
gtcccaagtt actcagtggc agaaacttga ttcagtaaca tgtcagcttg tgggcttgaa 120
aagtcttaag tgtctctact tcttctatcc ttgtgctttc ccgggacttt acacaatccc 180
acctcccact ggacaattgt caaatcccag agagtatggg aagtctgttc atctctgatc 240
accataa 247
<210> 251
<211> 282
<212> DNA
<213> Homo sapiens
<400> 251
gacggtccgc cgtgcccaag aggaacggga tgacattcaa ctgggacttg cctcaccttg 60
gcttggggga cctcgagagc ggtcccgtgg gggcagtgtt actcgtggtg gtagaagtgg 120
agggcgtgtc cgggtacttg agttcatggg catctctccc gccgcctctc agcctatctg 180
caccatgtct cacacgttca gttgcagctc ttaccgtttt gaaggcgcac gtgggcaaga 240
agtcctgggc agcacaagaa agtcaatcac gttgagacag ag 282
<210> 252
<211> 226
<212> DNA
<213> Homo sapiens
<400> 252
gactctagcc acagcctaac caaggattat caaaggaggt ggacactcaa ggaagggcca 60
cgccaggctg cgtttcctgc aaggactcag atgttcagta ccttatgata cagggaagat 120
agttttctta caagtagttt ggtaatattt tttttcttaa gttgtacatt tgactcagct 180
gtcaaatttc tcacacttgt atatatctac acacaactaa gttaaa 226
<210> 253
<211> 188
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (135)..(144)
<223> n is a, c, g, or t
<400> 253
gggaacaggg aatgccgatt ttatatacat ggtacacaga gaggggtgtc acttcacaaa 60
atcttccagc atgttcttca gaatattaat ttatatgcga ggtgaggttg ggaatgaaaa 120
gaacaggtca gcacnnnnnn nnnncctata acatacaaaa gaacatggtg gactttcagg 180
gagtgcaa 188
<210> 254
<211> 269
<212> DNA
<213> Homo sapiens
<400> 254
gagatttttg tggtcggtgt attcgagaat tccttaaatg gtccattaag caaataacac 60
cacagcagca ggagaagagt ccagtaaaca ccaaatcgct tttcaagcga ctttatagcc 120
ttgcgcttca ccccaatgct ttcaagaggc tgggagcatc acttgccttt aataatatct 180
acagggaatt cagggaagaa gagtctctgg tggaacagtt tgtgtttgaa gccttggtga 240
tatacatgga gagtctggcc ttagcacat 269
<210> 255
<211> 273
<212> DNA
<213> Homo sapiens
<400> 255
ttccttctga gtttgctgtt ggtgcaggaa taagggaaag gcccaaggta tccaagcctg 60
gggaagggca ggccagccag cacctctgcc ttctcaggga caagagtagt cctttaccac 120
cctcactctg cctgtcccct ctcctactct acagcattaa agactgtggg accaggaccc 180
taagtctcct ttccttctgg gtggggagtt ctggggttct tggtgtgtgg gagaagtttt 240
ataattgctt ccaaacagct gggtttaaat ata 273
<210> 256
<211> 279
<212> DNA
<213> Homo sapiens
<400> 256
ttctggatgt atcttcagga gcattagcat tccctggtag gttgaagatg ggccagtaag 60
ggaaacagaa gggtcaaagg tgatgccaag atttttgccc aaagcacctg aaagatggag 120
ttgcccatga ctaagatggg gaagcacggg gtcagcaccg atttgggggg aagatcagga 180
tttcattctt ggatgtgctg agtttgaaac atctgagtca tatccaagtg aagagtttga 240
ataggccgtt ggatatattt aggataaaag cctgggcta 279
<210> 257
<211> 174
<212> DNA
<213> Homo sapiens
<400> 257
accagcgcat cctcgagttc tttggcctga agaaggaaga gtgcccggcc gtgcgcctca 60
tcaccctgga ggaggagatg accaagtaca agcccgaatc ggaggagctg acggcagaga 120
ggatcacaga gttctgccac cgcttcctgg agggcaaaat caagccccac ctga 174
<210> 258
<211> 109
<212> DNA
<213> Homo sapiens
<400> 258
cgtgctacca tcacagctga atgcaatgaa aggcggtcct ctgagaggag cagggtggag 60
atgctaaagt ggaggccccg tcccattgct gatagatcct catctggca 109
<210> 259
<211> 167
<212> DNA
<213> Homo sapiens
<400> 259
tgatctagag gtcccccttc ggaaataggg aagactgtct ctgaagaagg aggaagtgta 60
gcttatggga ggctgaggag tttggagttt ctccttgtgg gaaggtggga gccatggagg 120
ctgaagacag ttgtccaact cagggcatac aaattgatga ggaactc 167
<210> 260
<211> 155
<212> DNA
<213> Homo sapiens
<400> 260
ctgcccctcg agtgagactg ggacaagatg ctctgctgga cttgagcttt gcctacatgc 60
cccccacctc cgaggccgcc tcatctctgg ctccgggtcc ccctcccttt gggctagagt 120
ggcgacgcca gcacctgggt aagggacatc tgctc 155
<210> 261
<211> 37
<212> DNA
<213> Homo sapiens
<400> 261
gtgagccaag ttcgaactcc tgcattccaa ccagcct 37
<210> 262
<211> 110
<212> DNA
<213> Homo sapiens
<400> 262
gatgggataa tttgggaggc ttctcattct ggcttctatt tctatgtgag taccagcata 60
tagagtgttt taaaaacaga tacatgtcat ataatttatc tgcacagact 110
<210> 263
<211> 190
<212> DNA
<213> Homo sapiens
<400> 263
accaaatacc acaggttctc agttgtgagt gggagctaaa tgatgagaac tcatgaacac 60
aatgaaggga acagacacta gggtctactt gagggtggaa gatgggaaga gggagaggag 120
cagaaaaagt acctattggt gatgaagtac tctgtacaac aaacccgtga caagagtttc 180
cctatataac 190
<210> 264
<211> 291
<212> DNA
<213> Homo sapiens
<400> 264
aacagctgct tttggtatca ataccctgtt ggttattagt ttaaaatttt agtcaatgat 60
gctttttggg tgggtgtgaa gggggaagaa aatcttgagc atgtaatgac ttaaattgtt 120
tcccaaatca aattaaattc tgggccagta taagacctac acactcacat ttcacaagtg 180
agggcatgga tgggggtagg ggcaggcagg gaaaggagaa aagaggacaa tcagcacccc 240
tgaggggctg aacatagggg gcatccaaaa cgtgcttgct gtgggaagaa t 291
<210> 265
<211> 263
<212> DNA
<213> Homo sapiens
<400> 265
cattttggat gacgacacga tcataaccac tctggagaac ctgaagagag aggctgcaga 60
ggtcaccagg aaagttgagg agacggacat tgtcatgcag gaggtggaga ccgtgtccca 120
gcagtacctc ccgctctcca ccgcctgcag cagcatctac ttcaccatgg agtccctcaa 180
gcagatacac ttcttgtacc agtactccct ccagtttttc ctggacattt atcacaacgt 240
cctatacgag aacccgaacc tga 263
<210> 266
<211> 144
<212> DNA
<213> Homo sapiens
<400> 266
atgacataca gtgcatggct cacaatccca ggagatgagg gcagcacagc tgcagagcaa 60
cacagagtgg ggagaacatc caggatgcac attcaaccag caggtgggga gcaagacaga 120
cagggacctg tgggccaaag cgtt 144
<210> 267
<211> 248
<212> DNA
<213> Homo sapiens
<400> 267
taggcttagc ttgatttctg ggcccactgt ctgtgttctt aagatgccaa cctgttgctt 60
tttttttttt ttttccccca tttaaaagga tagtacctac tccctctaac cacctcaccc 120
cattcttgaa tgacatttta tccttcggaa agaacaaggc tgtgatgtag tgactattgt 180
ctgtgtctcc tgtgtgtgtc tgttcttgtc acaaatgtat ttggggacgt tggatgcatt 240
cattttct 248
<210> 268
<211> 45
<212> DNA
<213> Homo sapiens
<400> 268
gccccactgt cactaactgt aaactcaggc tcaggcttca actgc 45
<210> 269
<211> 265
<212> DNA
<213> Homo sapiens
<400> 269
aagattcttc tttgtatatg aggatggtca ggtgggcgat gccaacatta atactcagga 60
ccccaagata cagaaggaaa tcatgcgtgt gatcggaact caggtttaca caaactgagg 120
gggccccagc cctcgtacca cccctgttac cccaggatcc atctgccctc ataaaagtgt 180
tcaggtacag cagctgaggc tgccctgagg aatcaagggg ccattaccaa ggggcaggaa 240
aaggatatgt aagaggtggc cttca 265
<210> 270
<211> 33
<212> DNA
<213> Homo sapiens
<400> 270
ttgcagcgag tcaggatcgc agcactacac tcc 33
<210> 271
<211> 234
<212> DNA
<213> Homo sapiens
<400> 271
ttcacaggaa gtaggtaaac accgaaattt agtcagtgtc attattagag ttgtgctttc 60
ataaaaagaa tctctcaagt gtgacaaggc taaattagaa agaagagact ggaggtagag 120
gccagttagg agatccttgt aataatccac agttgatgga atgaggatct atagtagcca 180
ggctggaggt aacaaagagg gacaggaggg caggagtact ctactttaaa gtag 234
<210> 272
<211> 61
<212> DNA
<213> Homo sapiens
<400> 272
agttgttaag tgtatcagat gtgttgggca tgtgaatctc caagtgcctg tgtaataaat 60
a 61
<210> 273
<211> 157
<212> DNA
<213> Homo sapiens
<400> 273
gtggttgtca tgtgatgggt cccctccagg ttactaaagg gtgcatgtcc cctgcttgaa 60
cactgaaggg caggtggtgg gccatggcca tggtccccag ctgaggagca ggtgtccctg 120
agaacccaaa cttcccagag agtatgtgag aaccaac 157
<210> 274
<211> 293
<212> DNA
<213> Homo sapiens
<400> 274
ggagacatcg atctcttttg caaattccct cacagcctca ttagggtctt cataagtgaa 60
ggggtcgatg tagaccttag taccatgtcc gatgagatac tgtccgtgtt tgtccgaata 120
ttctgcttct ctcccattgc tctgcttcct gaggcagaga actgcgacca caatgaccac 180
caggaccagg accacaccca cgactgccgt gcccgcaatc agggccagct gctcccgcca 240
gccctcgctc tcatccagtt gggtccggct gtgatgttcc tggccgaagg gcc 293
<210> 275
<211> 253
<212> DNA
<213> Homo sapiens
<400> 275
ggagtttgtg actagatggg caatatagta agatgtcatc ttttaaaaat gaaaaaatta 60
gctggccact gtggcacacg cctgtagtcc cagctacttg ggaagctgag gtaggaggat 120
tgcttgagcc caggagttca aggctgcagt gagctatgat tgtgcttatg aatagccact 180
gcactccagt ctgggcaata gtgagtcggt caaattccat ttccccctcc gccccatacc 240
tcttcaaatg ttt 253
<210> 276
<211> 195
<212> DNA
<213> Homo sapiens
<400> 276
actgcatcag gtctcagtgt ccctatctgt aagatcaaca agaaacacgg ttaagggagg 60
tcgtcactgg ggtgggagaa gaggggctgg tagaccgaag ccttgtgcat aaggattttt 120
tcccaggaaa agatagactt tataaacagt gggagcccat gaacaaacat ataaaagtag 180
caacagataa tgacc 195
<210> 277
<211> 195
<212> DNA
<213> Homo sapiens
<400> 277
tattgtaact cttccgccct tttcaggcgc agacaacaga acaaagtata gaggaacaac 60
aaaatatata attagccctc cctccccccc ataaagcaat tcacggatac agaatacatt 120
ctcttcacag taaacctaag aacacttgta acaattgccc acagcgcgca tgctaactaa 180
agtaacctct tttga 195
<210> 278
<211> 297
<212> DNA
<213> Homo sapiens
<400> 278
tactgcttgc atatcctttc ctcagctaac cgtcctcctg ggcccttctg cttctgaccc 60
cctcaggacc ttaggacata atcactccct gcttctatct tcagtatctc ctcattacaa 120
ataaagcatt tgctgcagct catttaactc ttgtgtccac agtgagtctc ttccattact 180
taatcacact taattctctg tcctgactcc tgtccccagc cttttctttc actttgcccg 240
tctgtcaggc tctcatgctt ctccatttgg caacttcagg aaggtacgcg agctccc 297
<210> 279
<211> 256
<212> DNA
<213> Homo sapiens
<400> 279
gccagtcacc ctgcggatcg agagaggggg tagagtcttc ttcaaatggc agttttactt 60
caaatggcag atttcacaag agttggttat tttttacaat ggtttaggtt gttaagtctc 120
ctttgtatgt aaggtagttt tttcaacatc taaaattttt gttttagcct tcaaaaccaa 180
cttaccaacc tcagtccagc tgggaaggca gcgttgatta tggtagtttg tcaagaatat 240
atggacctgg aaacac 256
<210> 280
<211> 223
<212> DNA
<213> Homo sapiens
<400> 280
cactgctcag ggttggaggc tcagtccctt tgccctgtct gttccagctc tggagctaac 60
tcagggatcc ctgatcaggg ttacataggt ttggtaaaat gagtgctgga aattaacttt 120
ctcccagtag tcttaggtca tgctcagtga acttaaactt tatccagata tggttttcct 180
tcagcctttc tattcccttt ctagccagtg aaagacccgc tgc 223
<210> 281
<211> 140
<212> DNA
<213> Homo sapiens
<400> 281
cgagagtata tcagttaaag ggtaagaaat gtagacccca tattttaatt cagtagcacc 60
agttcaaatc cagttattca gaattaacaa agcaactgtt gctcaaaaaa atgccaataa 120
actcccgagc caactgagat 140
<210> 282
<211> 112
<212> DNA
<213> Homo sapiens
<400> 282
accaaggagc tggtcagacg gccctttcta atcctacatg ttgagcttat gtaaaaaatg 60
ttgtttcctc ctgtttttgg ttcctttctt acccacaaac cattactact tg 112
<210> 283
<211> 34
<212> DNA
<213> Homo sapiens
<400> 283
caacagagtg agacttaatc ttgaaaaata aata 34
<210> 284
<211> 166
<212> DNA
<213> Homo sapiens
<400> 284
agtagagggc cctcaaccca cacactggct gaaactgcca ccaactgcca cgatgaaccc 60
aactgctgtt tatgccccca ttttcctttt tttgtatcta cacccacacg attcccaatg 120
ttggatattt ctacatgaat aaagcaagga tcagtgcctc ttatgt 166
<210> 285
<211> 288
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (78)..(157)
<223> n is a, c, g, or t
<400> 285
agggcaaaac aggagatgag gaaatgttaa aggataaagg aaagccagag agtgagggag 60
aggcaaaaga aggaaagnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnntga aggagagcca gggagtgaaa 180
caagggctgc aggaaagcgc ccagctgagg atgatgtacc caggaaagcc aaaagaaaaa 240
ctaataaggg gctggctcat tacctcaagg agtataaaga ggccatac 288
<210> 286
<211> 276
<212> DNA
<213> Homo sapiens
<400> 286
tgtggggtga cagttttaca tttacttttt cttcttaatg cagctggatc taagtaaaat 60
gttttgaagt ttatcagaaa ctaaatgtac ttttaaaacg tatagggtca gggttggggg 120
aaaaatacag gtatagtaag taagaaaagt gacccatgaa gaaagcatcg tgaggttgta 180
tgttggttga ctgtgattaa aatgcggggc tggtgtaagt tgtaagtggt ggctgattgc 240
cgtgtactat gtacatgatt gttgggatgg ctgtcc 276
<210> 287
<211> 183
<212> DNA
<213> Homo sapiens
<400> 287
gaaaacctat aacatgatga gtaagagttc tatggtagag aggtaggaga ggaaaggtga 60
aaactgccac aagccaaatg agactgcagc aaagtatgta aggagcctgt tctcaggtcc 120
acccacatcc agctatcacc ctctctgacc gccttttccc atgagcctga aagggtcaca 180
gac 183
<210> 288
<211> 295
<212> DNA
<213> Homo sapiens
<400> 288
gacgcacaac cttcaacact aattgccctt tactaagccg accagggcta gacactaagc 60
cagaaaagcc ttttccagag tttcctcttc cgcacaaaag ctttccttct gtcactccac 120
ccaaccaccc agctcctccc ttaagtgttt gaaagataat tctaaaagtc tcctcccccg 180
aaccgctgcg tttcttaagg ccacaccatt ttaaaaatac tgtattgctt ttgccaggct 240
gttgggacct cttccatctc atttctatct aagagtggtt ggtacacacg aggac 295
<210> 289
<211> 285
<212> DNA
<213> Homo sapiens
<400> 289
aaagcagatg ggtgtgttca gacaagatct ggaagctgtg gcatggcaga caaagggaga 60
tgggacccct ttggcactgg aggaagaggc ttgaatcttc ttggagcact aaaagttcca 120
aaagacctaa gcagaaaatg cttccgaaga ggaggatctg tatggcaaga tgactgtaat 180
caggctcata aaagtaagac cttacataaa tacaagtgag ggggaagaca tttcatgtag 240
gaggaatggc tcaagcaaaa ataccaaggc gggaaattgc gtggt 285
<210> 290
<211> 129
<212> DNA
<213> Homo sapiens
<400> 290
agaagttttg agaagcagtt ttgtttgggt caaggggtac tttcaaatta cacttatgag 60
tcagtatcta taaaaagttt cagaagtacc tacaatttag ccctctacat ccaagcagta 120
gctttgcag 129
<210> 291
<211> 70
<212> DNA
<213> Homo sapiens
<400> 291
cagtgagcta taatacaagg cttcattgca ctccagccta ggcattagag cgagaccgtg 60
tttatttaaa 70
<210> 292
<211> 135
<212> DNA
<213> Homo sapiens
<400> 292
gcagatgcag gaaacaccta gagcagcccc agagtcacgg ggctgagggg gcgggagctg 60
cccctgtcat agggaggggg attcccagcg tctgtagtgc ttcctgtttg ctgaataaag 120
gtctctttct cacac 135
<210> 293
<211> 156
<212> DNA
<213> Homo sapiens
<400> 293
cagaaatgtt agtgccgtgc tctaaccaag taagcttagt gttccccaca gtgatctgta 60
tctggcctga gtctcctcaa gcagcaaccc ccactgtcca gcatgtggaa ggtagatcct 120
tatgacaaca ccagacccat agttaccagg aaagaa 156
<210> 294
<211> 175
<212> DNA
<213> Homo sapiens
<400> 294
gtgtttaagg gcatttcaca gatgggaaat aaggtgcaga gggctagaga gatgggctca 60
aggctgtggt gccagtgaca ctggcttccc ctgtgttgtc ctttgctctt gaacatcacg 120
ccacgcagca gcagaacaaa gataaagaac caattccaaa accaggcgtg gtggc 175
<210> 295
<211> 112
<212> DNA
<213> Homo sapiens
<400> 295
ggccgagaag atgctgggca cccacccagc acccccatct accaacacca gcggctgggg 60
gcgggggcgg accttgtgag gctcagttga cccgttactt gcaacctgaa aa 112
<210> 296
<211> 149
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (46)..(86)
<223> n is a, c, g, or t
<400> 296
caagaatctg gcatttctct tcagttatct tatatgtaca tataannnnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnnnnggag atgaaggtct cagtctctta cccactgcac 120
tctagcccag gcggtaagag agactccat 149
<210> 297
<211> 239
<212> DNA
<213> Homo sapiens
<400> 297
cctctacgcc agagaaggga atggagaggt caggctggct agagagtggg gttgagtcgt 60
ccatgccctt gaatgccagg atgagggcta aagagtcaaa tggaatgggt gacttcatat 120
gcagaagttt ttacaagaga agagaactca gttgggccaa gagaagtggg gtcgtcatgt 180
gggtaatcac gtaacagtga tcgttcagtc atgcggaatg ctttcaaggt gttggacac 239
<210> 298
<211> 278
<212> DNA
<213> Homo sapiens
<400> 298
cctctacgag gtgtgctatt ctcatcctca tcttataggc aagttaactg aggtataagg 60
aggttggtta tgtaacttga ccaaagtcac acaataaggg actgggagat ctgggatttg 120
agccctggca gatggactcc atccaaagtc ctcactatcc tagcacctct ctatcccctc 180
cctttcctct ctcctacctt cttctgtgct gctttcaaac agacagttat ctctaccctt 240
aaaaacacag ctgtgctgac tactctgctt agatgccc 278
<210> 299
<211> 145
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (79)..(112)
<223> n is a, c, g, or t
<400> 299
cctctgggac aagtaagtca atgtgggcag ttcagtcgtc tgggtttttt ccccttttct 60
gttcatttca tctggctcnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nntgcttccc 120
ctcactgccc aggtcgatca agtgg 145
<210> 300
<211> 42
<212> DNA
<213> Homo sapiens
<400> 300
tggtcaagaa ggactatgac gcccttcgga agaggtacag tg 42
<210> 301
<211> 256
<212> DNA
<213> Homo sapiens
<400> 301
agaatagcaa ctggctcagt cctttaggtg tctacactaa tatcaaagga acaggccagg 60
cccaaggaga gagagggaat atgtttctgt gcctgatcct ttctctagat tttatctcag 120
ttgtatgaca ttgaagcacc tgactgagca attgagcatg atgtgttctc ctgaccatcc 180
ttctaaaacc attttccacc agtttctacc ttctgatggc gctttagtca cctgcactta 240
caaacaggtg cccaaa 256
<210> 302
<211> 274
<212> DNA
<213> Homo sapiens
<400> 302
ggctctgatg atggaccctc agtgatggat gaaacaagca atgatgcctt tgattcttta 60
gaaaggaagt gtatggaaaa agaaaaatgt aaaaaaccct ctagtttaaa acctgaaaag 120
attccttcca agagcctaaa gtcagcccgt cccattgccc ctgccatccc cccacagcaa 180
atctacacct tccagacagc caccttcaca gcagcgagcc caggctcttc ctcaggcttg 240
accgccacag tggcacaagc catgcccaac agtc 274
<210> 303
<211> 78
<212> DNA
<213> Homo sapiens
<400> 303
ttttcatgca gattagttag aattcactgc caggtttctt ctgcccacca aaatgatcca 60
gtctggaata acattttg 78
<210> 304
<211> 137
<212> DNA
<213> Homo sapiens
<400> 304
gtaggctagg gatcatgggg gaatagttag taatgacagg gatagttgaa cttaaaaaaa 60
aagtttgtga ggctgacaaa gatgaaacgg acacatttcc tgatcttgga gggttcatag 120
ggtagaagat ggtagat 137
<210> 305
<211> 161
<212> DNA
<213> Homo sapiens
<400> 305
gatggtggga tatttgtgtc tgtgttctta taatatatta ttattcttcc ttggttctag 60
aaaaatagat aaatatattt ttttcaggaa atagtgtggt gtttccagtt tgatgttgct 120
gggtggttga gtgagtgaat tttcatgtgg ctgggtgggt t 161
<210> 306
<211> 255
<212> DNA
<213> Homo sapiens
<400> 306
gaaacagcat gggaccgtgt gattgggtcc aggctgggct gtcagggaag cgccctggtg 60
tctccgactc atcaattctc gggtcttttt ttaaaagcca ggctccccaa agcactcttt 120
gtctcgcaat tttgaggagg ttgttccgac ctggaagcgt taaactgctg catgtcatct 180
ggcgtcagct gtgaggctgc gctctgcgtg ttgtgcgttt gcaaaatgta ttggcgtgac 240
tgtaaacaca tcgtt 255
<210> 307
<211> 289
<212> DNA
<213> Homo sapiens
<400> 307
gtcaagctca gttgagggtt aatgatgagg caggctgatg cgggttcttt gcccagtccc 60
agggttccaa gaagccttcc tgggagaggg ggcctgagtt gaatggtgca agatgaacaa 120
gaaatggcaa gatagagaaa ggtggggagg gcttcccagg cagaagagag agcatggcta 180
aagggctagg ggcatgaagc agcaggggac ccccagccat gtagtatcac tggaggatga 240
gaataagggg gagaaggagg gagggagaga aggtatactt ctgagggca 289
<210> 308
<211> 181
<212> DNA
<213> Homo sapiens
<400> 308
agttcagggc tatagtgcgc tatgttgatc tggtgttcat gctaagttcc gcatcaatat 60
ggtgacttct agggagtggg ggaccaccag gttgcctaag gaggggtgaa cctgcctacg 120
ttggaaatag agctggtcaa aactcctgtg ctcatcagta gtagaatagc acctgtgaat 180
a 181
<210> 309
<211> 253
<212> DNA
<213> Homo sapiens
<400> 309
gacagcttgg aaggaaggat tgaccatggg ttgattccat ggaggtagag aagcaagaga 60
gacctgatga ttacaatgat ggctaagtgt agtatgccca ttaggattga attgaattag 120
gggaaattgt gtgaagtgtt tggaaggaag caatattgtg tgattagctc caaagctggc 180
cactggtaga agttgtttca atggaagaac aaggatggaa ttgagtgggc cagagagccc 240
tagattaatg ggt 253
<210> 310
<211> 159
<212> DNA
<213> Homo sapiens
<400> 310
tattcagcga aacttacctg aaggggttgc catggaagta acaaagacac aattagaaca 60
gttaccagaa cacatcaagg agccaatctg ggaaaacact atcagaagaa aaagaagaaa 120
gctagtcata aagcctcagg gaggccattt ttgcctaaa 159
<210> 311
<211> 269
<212> DNA
<213> Homo sapiens
<400> 311
caaatgcgag atcttcagtt gcagtgtgaa gccaatgtcc gcgaactgca tcagctgcag 60
aatgaaaaat gccacttgtt ggttgagcat gagactcaga aactgaagga gttagatgag 120
gaacatagcc aagaattaaa ggagtggaga gagaaattga gacctaggag aaaggcactg 180
gaagaagagt ttgccaggaa actacaggaa caggaagtat tatataaaat gactggggag 240
tctgaatgcc ttaacacatc aaccccgga 269
<210> 312
<211> 234
<212> DNA
<213> Homo sapiens
<400> 312
tttcagaaac tgtcaaatgt accatatttg tattaagagt tgttgggaat ttttgtacaa 60
tgaatttaca tttatttatg gtgacatatt tacgcttgtg atcaaataat gatgttaaat 120
tcttaaatca tatttgctat gcagctgaag atgatatttt gatttgtatt ttgggggtac 180
ctgtgttgag ttgataaaca tttccatctt cattaaaact gcttccaaac taaa 234
<210> 313
<211> 32
<212> DNA
<213> Homo sapiens
<400> 313
taaagcatgg atctcgcttt ggttgtaaaa aa 32
<210> 314
<211> 221
<212> DNA
<213> Homo sapiens
<400> 314
atggtggggg tctctcacct tcttgaccct ctctccatca ttcagctgcc agcccaggct 60
tcacacccaa gctggctcag cagccgagcc tggcaccgag ggtccctgca ggctccctgg 120
gcagggagag ggccaaggac aattgggagg gcagcaggca gcccgcagat ggtggccatg 180
tggcacgctg ctgagacgac actaccaata aaccaaactg c 221
<210> 315
<211> 238
<212> DNA
<213> Homo sapiens
<400> 315
ctgcccgtct gtaagttcca ggtggtgatt ccgaaatcct aagcctgcct cgcacctgct 60
gagccgcact gctgcccctg gcctcaccgg cctcaggaga cggtggggcc gctgcatttc 120
ggggtggtct tgggaatccc aggccctagg ggtcacattt gctcaggaag tgggtatcaa 180
attgaggtgg gggtgtcaga ggaggcaaag gggtcccagc tgcggtcagg actgtggt 238
<210> 316
<211> 36
<212> DNA
<213> Homo sapiens
<400> 316
cctgggtgac ggaataagac tcggtctcca aaagaa 36
<210> 317
<211> 87
<212> DNA
<213> Homo sapiens
<400> 317
aaggctgcta gggatgttag acctcggcca ggacccacca cattgcttcc taatacccac 60
ccttcctcac gacctcattt ctgggca 87
<210> 318
<211> 59
<212> DNA
<213> Homo sapiens
<400> 318
tacctgttta tctgtaactg ttatccaaac aaattaaata ctgtggatgc ctttaaaaa 59
<210> 319
<211> 299
<212> DNA
<213> Homo sapiens
<400> 319
gacagtggat aactttcaaa gaggcatctt tgtgtggccc atgaactttg gttggagaac 60
aattcctcca gatgtcactg caaaaaaaca gaattaaaga aactgataca ataaggtgcc 120
ctgtcatggc tggtggattg ttttctactg acaaaagtta cttttttgaa cttggaacat 180
acgaccctgg ccttgatgtt tggggtgggg aaaatatgga gctctcattc aaggtgtgga 240
tgtgtggtgg tgaaattgag atcattccct gctcccgagt gggccatata ttcagaaat 299
<210> 320
<211> 260
<212> DNA
<213> Homo sapiens
<400> 320
atgagtatct cagctccttc aaggtggcac agtacgtcgt gcgggaagaa gacaagattg 60
aggaaattga gcgagagatc atcaagcagg aggagaatgt ggaccctgac tactgggaga 120
agctgctgag gcatcactat gagcaacagc aggaagacct agcccggaat ctaggcaagg 180
gcaagcgggt tcgcaagcaa gttaactaca atgatgctgc tcaggaagac caagacaacc 240
agtcagagta ctcggtgggt 260
<210> 321
<211> 131
<212> DNA
<213> Homo sapiens
<400> 321
ctatggccgg ataactaagg atgtggtgct ccaatgggga gaaatgccca cgtctgtggc 60
ctacattcat tccaatcaga taatgggctg gggcgagaaa gctattgaga tccggtcagt 120
ggaaacagga c 131
<210> 322
<211> 137
<212> DNA
<213> Homo sapiens
<400> 322
ccaccattgc gggtccccca ggaagccagg tgaccccagg tgggaggctg tgtgtggagg 60
ccatcctgga aggaagttta gacctgccca ggtgtggagc gaggggcaca ggggcatcct 120
aacctcagaa actgaaa 137
<210> 323
<211> 277
<212> DNA
<213> Homo sapiens
<400> 323
agcaaagtgt attctccatc tggcctcaga gcagatgcca agcctaattg ggccaccaga 60
tccgtgaagg tggtttgctg ttttccagcc agctcaataa cttgtttggc agaatcagga 120
attaggacct gatcaatcaa atggatcaca ccattagttg gtcacaatat cctttgttgt 180
tcaccatttt gattccattt actgttatac tgtcaccgtc acatcctatc tcaattgtat 240
ttccttccag cgtctcaaga ctgctactcc cataata 277
<210> 324
<211> 271
<212> DNA
<213> Homo sapiens
<400> 324
gcttgcccca gaacttagtc tctttgccca gcctcacccc tcctggtgct catcagactc 60
ttgccacccc tggctcccac tccctgcttg cctctggtgg agctgcacag agctctggga 120
agaggccctc ttcctccccg cactggggcg atgggcgcac ctcagactta cccactgctg 180
ctgccaccac caaccccttg atccctcagt cctcccacac agcttctgtc caccccaggt 240
ttccctcacc ccacctttgc taagtcttcc t 271
<210> 325
<211> 225
<212> DNA
<213> Homo sapiens
<400> 325
gccctgctgc gaagtggagt ccgaggtcat gatgagtgac tatgagagcg gggacgacgg 60
tcacttcgaa gaggtgacga tcccgcccct ggattcccag cagcacacgg aagtctgact 120
ctcaactccc cccaaagtgc ctgactttag tgaacctaga ggtgatgtgc gtcatccgcg 180
ctgttctttg cagcagtgct tccaagcttt tttgggtgag ccgaa 225
<210> 326
<211> 68
<212> DNA
<213> Homo sapiens
<400> 326
agaagcaaca cgatgatggg ccccccagtt tgaatttcag acagtggagg agggaatatt 60
gctaggag 68
<210> 327
<211> 272
<212> DNA
<213> Homo sapiens
<400> 327
tactctcagc agtcagaggc ttgcttgctc tgtgcagatt tttaattttc ttttttggcc 60
ctaggctggt tgggacctct acagcttcat tctttcacca ttaaatagtg gcctttttca 120
gtattttccc tcttcccctt tataaattat gctaaagcca caaagcacat ttttggggat 180
catagaaggt tggggttcca gaaaggcatc tgtgtgatgg ttccattgat gtgggatttc 240
cctacttgct gtattctcag tttctaataa aa 272
<210> 328
<211> 285
<212> DNA
<213> Homo sapiens
<400> 328
aaggactgtc caagagccag ccagttcagg gctcaggcct cacccattgc ccactcctgg 60
ggagaccatc acctggctca tcgtttccac caagagtgcc ccacaggagt gccccacaga 120
cccgctggac cagcctgctg cgggtcctgg ccaggggtct ggctaacggt gagggctgac 180
tctgaactgt ctctcagtct ccagaaagtg ttcaagcctg ttgtgttccc aaatctgatt 240
cctcctattg tcttgtaaat caaactctaa gtgaaaactt cccat 285
<210> 329
<211> 231
<212> DNA
<213> Homo sapiens
<400> 329
gaaggtcata acagtttcaa acaatagcca gggaagttag agtcacctag agacatcctt 60
aacacgtgcc cctgagctac ttttcagaaa cccagacccc caccaaatgg attcacacag 120
acgtcagata agggggaaca ccagggacta aactctgacc tccattcttt gctctcagtt 180
tcttcctgag gggcctggcc agaccttaat gttcctttct gcggacccca a 231
<210> 330
<211> 273
<212> DNA
<213> Homo sapiens
<400> 330
cacctgcact ctagtgaccc tgggtgccgc cagacccttc tcttctacaa agaccccagc 60
aggagtggga gggtctgcaa tggcatcgcc ctgtcctgcc ttggccagaa gcctggagct 120
ttggtttgag gaggtagaga tatgtgtatc cataggaaga gatctgtcag aacaggcagc 180
tgttgagctc ggggtgtctt cctcaaggca tgtggctcag cagcaagaaa ggcaagttgc 240
tcctgctggg gccctggact ctgccttagc tcc 273
<210> 331
<211> 133
<212> DNA
<213> Homo sapiens
<400> 331
tctctccagc ctctcttagg aggggtaatg gtggagttgg catcttgtaa ctctcctttc 60
tcctttcttc ccctttctct gcccgccttt cccatcctgc tgtagacttc ttgattgtca 120
gtctgtgtca cat 133
<210> 332
<211> 292
<212> DNA
<213> Homo sapiens
<400> 332
atccacggcc gcgttagaaa gagggtcgca cgctgccgcc gaggtagagg ggtccccgag 60
tcctggggcc tcgcacccca cagcccgagt cccttccccg cggaagggac tcgtggctgt 120
gggtagagac gcgcgcttgg cgcggccagc cctgcaggca ggagctgagc ggcgcaggga 180
cacgggcagc tgggaggggc gcctggtgat ttactcactt ccctcctagc cagagaagtg 240
cagcaattcc aaacagttct cataggagcg tccctgacaa cttcatgtta ta 292
<210> 333
<211> 211
<212> DNA
<213> Homo sapiens
<400> 333
gtaccacaaa cacactcaac ttgtctatga attagagaac aagatactgc tgctgcttct 60
ttttgacttt tgaaatatac aatgttttgt aggctctgcc cttcaatgtg aaagcaggac 120
attaaatttg aaattatttg acaattaaat gtttaggacc atctaacttc aactgcaaaa 180
ctaaacagat ctaccttgtc cttccttcaa a 211
<210> 334
<211> 142
<212> DNA
<213> Homo sapiens
<400> 334
ggttcatttt agtttcagat agatggcttc accaaagaac tcttgaaaga atactgatta 60
gggaggggca gggaagtagg agcttatggt atattataag gctgggaaaa atctatgatg 120
caaacccttt ccacatagta ct 142
<210> 335
<211> 208
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (56)..(56)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (65)..(65)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (114)..(114)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (142)..(142)
<223> n is a, c, g, or t
<400> 335
actcattctt aacctaatca cctaaaataa ttcttatcat ctattcttct tcaggnaaaa 60
atggngccct gggtgttatt ttaacgactt gccatccttc ctgttttgag agtntctttg 120
ttaactgggg gcataccttc gngacccggt cctaccttcc tcattcagac ctgtgctgtt 180
cattgctgta ttcccagtcc cttaaaaa 208
<210> 336
<211> 227
<212> DNA
<213> Homo sapiens
<400> 336
atatctgaca gatgtgtaaa ccaagttacc agcatggtgt ggaatcgtag ttccaagtca 60
tataatacca gacattcaag aaaactagtg ccctgttaac tgggggaagc aaatttatat 120
ccttttggaa gaaagtcacc ttattctgtg tatcagaaat ctctttcaaa taacctttca 180
gaactataga gcatcataca aagatgacca agcatacaag aaaacaa 227
<210> 337
<211> 101
<212> DNA
<213> Homo sapiens
<400> 337
aacatcaaag ctggattaga acatctgcca ccagctgaac aggccaaagg cagactacag 60
ctggttcttg aagctgctgc aaaagctgat gaagcattga a 101
<210> 338
<211> 212
<212> DNA
<213> Homo sapiens
<400> 338
agccttagca aaaatgcctc ctcaccactc cccaggagaa tttttataaa aagcataatc 60
actgattcct tcactgacat aatgtaggaa gcctctgagg agaaaaacaa agggagaaac 120
atagagaacg gttgctactg gcagaagcat aagatctttg tacaatattg ctggccctgg 180
ttcacctgtt tactgttatc acaataatgc ta 212
<210> 339
<211> 235
<212> DNA
<213> Homo sapiens
<400> 339
acagagtcat ttgagctttc tcccctcccg ctagtatctt tacaggagca gggaagagca 60
gtagaggatg tataattttg ggcgaagtta aattacaatt tatttgaggt tattcctaaa 120
cctatttatt tggtgttttg gaggagatca cacactaaga gaacgttgat tgcctcggct 180
attgtgctgg ctggacactt tggtcacttt tgaagcatgt taataaatgt cactg 235
<210> 340
<211> 271
<212> DNA
<213> Homo sapiens
<400> 340
tccaaacacc ggcagaaaac ggagagtgct tgggtggtgg gtgctggagg attttccagt 60
tctgacacac gtatttatat ttggaaagag accagcaccg agctcggcac ctccccggcc 120
tctctcttcc cagctgcaga tgccacacct gctccttctt gctttccccg ggggaggaag 180
ggggttgtgg tcggggagct ggggtacagg tttggggagg gggaagagaa atttttattt 240
ttgaacccct gtgtcccttt tgcataagat t 271
<210> 341
<211> 270
<212> DNA
<213> Homo sapiens
<400> 341
tgaggagcgg gagggttccg ccactccagt tttctcctct gcttctttgc ctccctcaga 60
tagaaaacag cccccactcc agtccactcc tgacccctct cctcaaggga aggccttggg 120
tggccccctc tccttctcct agctctggag gtgctgctct agggcaggga attatgggag 180
aagtgggggc agcccaggcg gtttcacgcc ccacactttg tacagaccga gaggccagtt 240
gatctgctct gttttatact agtgacaata 270
<210> 342
<211> 207
<212> DNA
<213> Homo sapiens
<400> 342
aaagactcat cataagggtc cttcctcttt tctatcctcc ctccatattc agttgctaag 60
tctcaactac tttgctccca tcaagattct ctttactatt tcttctatcc agaccttcct 120
ctttattcct attgtcattg tcttatttta ggttctcatc atctttcact aagataacta 180
caacagcttc gtgaccagcg taggcaa 207
<210> 343
<211> 189
<212> DNA
<213> Homo sapiens
<400> 343
gctcaaatag ctataactgt accaaagaca tggaagaaac caaaagatcg gacccgaacc 60
actgaagaga tgttagaggc agaattggag cttaaagctg aagaggagct ttccattgac 120
aaagtacttg aatctgaaca agataaaatg agccaggggt ttcatcctga aagagacccc 180
tctgaccta 189
<210> 344
<211> 292
<212> DNA
<213> Homo sapiens
<400> 344
tgcgaatctt ctgcagctcc atcagcatcc atgtatcttg cttgtcattt tctctgttgg 60
ttacaattac tttattatgg ttgacatctt ggcaggttcc atgatgagtg atttcagtag 120
tggtcactgt ctggtgctgg ggatagccag ggagctgaat gaccagggtc tggtaatgct 180
tctgggcatc ggtgaactga gactgtattt tccgcttgtc atcatctcca aacatctcta 240
agccttggct atttctgatg aactcttggc actgtaactc aaggtcggat at 292
<210> 345
<211> 286
<212> DNA
<213> Homo sapiens
<400> 345
caactatgcg gagcgggtcg gtgctggagc gccggtgtac ctggcggcgg tgctggagta 60
cctgaccgcc gagatcctgg agctggctgg caacgcggcc cgcgacaaca agaagactcg 120
catcatcccg cgtcacctcc agctggccat ccgcaacgat gaggagctca acaagcttct 180
gggcaaagtc accatcgcac agggtggcgt cctgcccaac atccaggccg tgctgctgcc 240
aaagaaaact gagagccacc acaagactaa gtaaagaccg agttga 286
<210> 346
<211> 247
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (80)..(131)
<223> n is a, c, g, or t
<400> 346
catatttcag cggatcatca actttttctc ctaccatact atcctcagac aaagaaacca 60
ttgaaattat agacctagcn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120
nnnnnnnnnn ngtggctggt aaagaggata atacagacac tgaccaagag aagaaagaag 180
aaaagggtgt ttcggaaaga gaaaacaatg aattagaagt ggaagaaagt caagaagtga 240
gtgatca 247
<210> 347
<211> 55
<212> DNA
<213> Homo sapiens
<400> 347
tgctcttaaa cccaaagggg cttcactgaa gagcccactt ccaagtcaat aaaaa 55
<210> 348
<211> 291
<212> DNA
<213> Homo sapiens
<400> 348
cttctcttgg gctgagatgc tgctgccagc tctaaaacag cactctgttc tcaaaacctc 60
atggcaggct cctggctcca atactcagct gccaaacatg atgctgattc ttcacgaatt 120
tgcaacccag ttctctcggg tttgcacacc cccactgtgg gccggggaac cgggtcccgg 180
ccttcgcaga ctccaggctc tggcagatgt ggccctccat aacaacggga atgaaaaggt 240
cacaccttat gtgcgccagg cccttaagga gtcggaatat cccaatcctc c 291
<210> 349
<211> 47
<212> DNA
<213> Homo sapiens
<400> 349
tgctgtggta ctttgctgtg tactccgtgg catcatgtta ctgtgta 47
<210> 350
<211> 255
<212> DNA
<213> Homo sapiens
<400> 350
ggagtttgtg actagatggg caatatagta agatgtcatc ttttaaaaat gaaaaaatta 60
gctggccact gtggcacacg cctgtagtcc cagctacttg ggaagctgag gtaggaggat 120
tgcttgagcc caggagttca aggctgcagt gagctatgat tgtgcttatg aatagccact 180
gcactccagt ctgggcaata gtgagtcggt caaattccat ttccccctcc gccccatacc 240
tcttcaaatg tttaa 255
<210> 351
<211> 145
<212> DNA
<213> Homo sapiens
<400> 351
cacttcctga cggatgccag cttgggcact gctgtctact gaccccaacc cttgatgata 60
tgtatttatt catttgttat tttaccagct atttattgag tgtcttttat gtaggctaaa 120
tgaacatagg tctctggcct cacgg 145
<210> 352
<211> 150
<212> DNA
<213> Homo sapiens
<400> 352
agcctaggca atgcagcgag gccttgtcta gaaaatttaa aaaaaaaaaa aaaaattagc 60
tgggcgtggt ggcacgtacc tgtagttcca gctactcggg aggctgaggc ggcaggatct 120
cttgagctaa gtagttcgag gctgaagtga 150
<210> 353
<211> 173
<212> DNA
<213> Homo sapiens
<400> 353
ttagccaagt atggtggcac gcgcctgtaa tcccagcaac ttggaaggct gaggcaggag 60
aatcgcttga acctgggagg cagaggttgc agtgagccaa gatcagacca ctaccgcccc 120
gcgctggctt gccctcctgt tctccagagc aataaagttg gacgagacta ccc 173
<210> 354
<211> 178
<212> DNA
<213> Homo sapiens
<400> 354
cacagctctt cttggcgtat ttatactcac tgagtcttaa cttttcacca ggggtgctca 60
cctctgcccc tattgggaga ggtcataaaa tgtctcgagt cctaaggcct taggggtcat 120
gtatgatgag catacacaca ggtaattata aacccacatt cttaccattt cacacata 178
<210> 355
<211> 295
<212> DNA
<213> Homo sapiens
<400> 355
ggatggcacc atgtttgaga ggctacagag gagacccaga gccagtaagc aagacataga 60
gtttatagag aggacttaca gcatagtcca gtggcagcgg gctagacagg agaaccgcaa 120
tggcttgaaa aagcacgaag tataaagcgt tgagctcaac ggtttatact tcagagaaac 180
tcaacaatca actgaaggca ctaactgaga aaaacaaaga acttgaaatg gctcaggatc 240
gcaatatggc cattcagagc caatttacaa gaccaaagga agcatcagaa gctga 295
<210> 356
<211> 255
<212> DNA
<213> Homo sapiens
<400> 356
atttctttag ctgaccatag tgagtcttcc ttgagttcac gtttcttccc aatttcattt 60
tcttgagata ttttgctact ttctggtact gcttcatcac tgaaagtgtc atttgtttct 120
atatccatcc ttggcctttt tctaacattg acatcttcct cctgtttttg aactttcaca 180
tcaatttcta actctggttt tgtgtccttg aataactgtt ccaatacttc atcttctatg 240
gccacatcat ccatt 255
<210> 357
<211> 266
<212> DNA
<213> Homo sapiens
<400> 357
gtatcaaatt cacgccatgc aaaaagatta taaatgtaat aagcatgtat gtgtgtgagg 60
agattcagtc ataacccaac gctcattcaa catcaaagaa tttataccta agagaactta 120
tttgggtgta gtaaatggca gatctttcaa taggagttta actagtcttt gtcatatcag 180
aatatccata gtagacaaga atttgatgta acgcaaatgg aaaaactcga caccacattt 240
caggctttac ccaacatcga aataat 266
<210> 358
<211> 271
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (136)..(136)
<223> n is a, c, g, or t
<400> 358
cgttcagtac aaacatttat gcggtaggct cagatgttgt aatttgcact taggtaccag 60
gtgtcaggaa acagactaaa aagaattcca ccaggctgtt tggagatcct catcttggag 120
ctttttcaaa agcggngctt catctgcaaa gggccctttc atcttgaagt ttttcccctc 180
cgtctttccc ctcccctggc atggacacct tgtgtttagg atcatctctg caagtttcct 240
aggtctgaat ctgcgagtag atgaacctgc a 271
<210> 359
<211> 204
<212> DNA
<213> Homo sapiens
<400> 359
gtaccacaaa cacactcaac ttgtctatga attagagaac aagatactgc tgctgcttct 60
ttttgacttt tgaaatatac aatgttttgt aggctctgcc cttcaatgtg aaagcaggac 120
attaaatttg aaattatttg acaattaaat gtttaggacc atctaacttc aactgcaaaa 180
ctaaacagat ctaccttgtc cttc 204
<210> 360
<211> 185
<212> DNA
<213> Homo sapiens
<400> 360
attacagtta tagctctctc aagcaaaaaa acagcagaga aaaacttagt ttaccttagg 60
ggctatttat ttacttaggg atttgttaaa aggtcgaatg gggtcacaca gaatactaag 120
aagagctgtt cacccaggcc tcactaagaa ctcttcttca ttcagtagct gtatagtaac 180
atgac 185
<210> 361
<211> 54
<212> DNA
<213> Homo sapiens
<400> 361
ctttagtagt ttctcgtcag tcccgcagcc accgcagccg ggtcccccct cgtg 54
<210> 362
<211> 261
<212> DNA
<213> Homo sapiens
<400> 362
agagaggggg ctcacctctt atcctcggcg acccactgca caagcaggcc gctctcccag 60
acttaaaatg tatcaccact aacctgtgag ggggacccaa tctggactcc ttccccgcct 120
tgggacatcg caggccggga agcagtgccc gccaggcctg ggccaggaga gctccaggaa 180
gggcactgag cgctgctggc gcgaggcctc ggacatccgc aggcaccagg gaaagtctcc 240
tggggcgatc tgtaaataaa c 261
<210> 363
<211> 236
<212> DNA
<213> Homo sapiens
<400> 363
ctgaatgggc agagctggat tttacagggt tgggattttg ccaggtgagt aagatagagg 60
ggagaagtgg gaccaggaag ttccaggtct gtgaacgggc ctggctgagg agctggatca 120
tgaaatctcg agtcaagtaa gaaggaaatt gaggacacga gttgggtatt gcatagtgtt 180
actgtgttaa ggtcaggggt caaagactta ctggcatgga gtaaccagag taagtg 236
<210> 364
<211> 179
<212> DNA
<213> Homo sapiens
<400> 364
caggcaaaaa cgtccccgaa gccagcagtt gtagagactg ttacaacagc caagccacag 60
cagatacaag cgctgatgga tgaagtgaca aaacaaggaa acattgtccg aaaactgaaa 120
gcacaaaagg cagacaagaa cgaggttgct gcggaggtgg cgaaactctt ggatctaaa 179
<210> 365
<211> 167
<212> DNA
<213> Homo sapiens
<400> 365
cagagtcccg tgtgtcctaa aaatctccta aaaccagtct atgaactcag ggctttaaaa 60
catttttaat ttatttggtc attcaattta cttgttttta atacatgatt ctctatgaaa 120
ttgatgggct caaactagct gtgaatcttc tgagagtgaa agcaaca 167
<210> 366
<211> 280
<212> DNA
<213> Homo sapiens
<400> 366
tataaagtaa ccctatgatg ctccccttac gagaaaacaa aactgtacac atttataaac 60
aaacagtctc tcccatcagt taacacacag agccttctct acaccaaagt ctctttccgt 120
ttgccaccag aaagggcttt gtccctcgct cttcggatgc cgggctgtgt ctggtgtgtc 180
tttaagctct tgctgtcctc tgccatctgc atgccagagc cacatctgta agcgttttca 240
tcaacttcta cctgagtaac actggaaact gtcctcgtgc 280
<210> 367
<211> 176
<212> DNA
<213> Homo sapiens
<400> 367
acagctcctt tgacctcagt gacaggcact cacctacctg acccccaaac tgaagcctca 60
cttttcccag ccgtgtccac accctctggg ctaccccatt accatgacaa gtattccctc 120
tgctccagga gaaaagccag gtcccagacc tgacccatta aaacccaatc attcca 176
<210> 368
<211> 69
<212> DNA
<213> Homo sapiens
<400> 368
gaccaggaag tcctataaag aattatattt ctatagaatt aaaaatgcag ttctgtcagc 60
ctggacaac 69
<210> 369
<211> 200
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (55)..(55)
<223> n is a, c, g, or t
<400> 369
ataagaactt atgggatttc ctacacggag acaaaaaaag atattccttt atgtngttta 60
aaagtggcag ctgctctttc tttattccat tttaatcaat gagtattgat tcaagttttc 120
ctttctattt ttccttatga taagtttctt acagtagctt atacaacaac aaatagcata 180
gaaaaactac tggattcaat 200
<210> 370
<211> 110
<212> DNA
<213> Homo sapiens
<400> 370
acaggtaacc ttctcactaa gtgggggtgt ctgaggccag ggagagctct actcattccc 60
ctgtgtgatc ccagcagtga gcatagagca ggtgccctgc aatgttaagc 110
<210> 371
<211> 156
<212> DNA
<213> Homo sapiens
<400> 371
agaaagaata aagcaggatc catagaaata attaggaaaa cgatgaacct gcaggaaagt 60
gaatgatggt ttgttgttct tctttcctaa attagtgatc ccttcaaagg ggctgatctg 120
gccaaagtat tcaataaaac gtaagatttc ttcatt 156
<210> 372
<211> 50
<212> DNA
<213> Homo sapiens
<400> 372
gattgctgag cagggaagct ttgcatgttg ctctaaggta catttttaaa 50
<210> 373
<211> 64
<212> DNA
<213> Homo sapiens
<400> 373
caccccatgc actgtacaaa tactgcaaac actatagttg cattcatagg accattaaaa 60
aaaa 64
<210> 374
<211> 95
<212> DNA
<213> Homo sapiens
<400> 374
ttctgaggga ctgcttctgg agccggccct cttgtgtgat tgaattagtc agtgatggtt 60
ctcaggacta gattagattg ttactcttaa aataa 95
<210> 375
<211> 291
<212> DNA
<213> Homo sapiens
<400> 375
ggccgcttca gacaaccacc tgaaaaagcc aaagcacaga gacccagaga aagccaaatt 60
ggacaaaagc aagcaaggtc tggacagctt tgacacagga aaaggagcag gagacctgtt 120
gcccaaggta aaagagaagg gttctaacaa cctaaagact ccagaaggga aagtcaaaac 180
taatttggat agaaagtcac tgggctccct ccctaaagtt gaggagacag atatggagga 240
tgaattcgag cagccaacca tgtcttttga atcctacctc agctatgacc a 291
<210> 376
<211> 269
<212> DNA
<213> Homo sapiens
<400> 376
acaactggaa ttaggatttt ctcctgatga aggaaaaaaa gacattaagt ctgcattata 60
tttttaaacc catgaaaaga ctgaaaccaa ccaaacaaaa gaaaaacttg acttgttatt 120
agaacagtca ttattatttt ttttcttctt caaaactgtt attttaccat gttgtatctt 180
cttcccaaag taatatgcag atgaagcaaa ataactcagc aaagtgtcat ggaccaagcc 240
ctttccatca tttctagcat taaagtgaa 269
<210> 377
<211> 291
<212> DNA
<213> Homo sapiens
<400> 377
tggatgtgtt gctgttggcc aagaagaatg agaaggagcg aatttgggca gtgggacctc 60
caggcagcct tacagttttc agttggggag tgagatgaga cctggaattt aggggtctgt 120
gtagttaaaa ccatgcggtg tacaagattg cccagattga gtatgtggaa ggtgtgatgg 180
ggaggagaga gagtgttagg aagtgctggg gtcctgccat ctgagaacag gagcccagag 240
gcagcatatg cagcccgaaa ggagagaatc catgctgagg gtcgtgaata c 291
<210> 378
<211> 43
<212> DNA
<213> Homo sapiens
<400> 378
gagaaacagc tgtcacctcc cgcagaccct aatcctctct cgc 43
<210> 379
<211> 44
<212> DNA
<213> Homo sapiens
<400> 379
aatattgttg ctgatttcag agggatattc actaataaat gtat 44
<210> 380
<211> 187
<212> DNA
<213> Homo sapiens
<400> 380
attctgaatc atcactggga gcaaaacaca gactcacaag aggaagggca agagaagggt 60
aaagaacaag agagaccacc tgaggcagtg agcaagtttg caaagcggaa caatgaagaa 120
actgtaatgt cagctagaga caggtacttg gccaggcaga tggcgcgggt taatgcaaag 180
acctata 187
<210> 381
<211> 152
<212> DNA
<213> Homo sapiens
<400> 381
attgcttgaa ctgggtaact gatttgatgt aaatgccaaa ggagaaggag taaaaggaaa 60
atgacataga gtctgagcta gagtaacagg gacagtatta attaatatta accaaatatc 120
aaataagaac atttaagaga cgagccacca tg 152
<210> 382
<211> 272
<212> DNA
<213> Homo sapiens
<400> 382
ctgctgtggt gttatttgct taatggacca tttaaggaat tctcgaatac accgaccaca 60
aaaatctctt aaagtactgt caacagggtc cacaattcca tccaatatag cttctagtaa 120
ggcaacagta tcctgacttt caaatttctt gttgttagtg aaccagtgaa tcagctgcat 180
aactagtggc tcatacagtt gccttgtcac ctgatcaaca tcacacgcaa gtcgaagcag 240
cacaggaaac gtccgcttat agagctggta ca 272
<210> 383
<211> 184
<212> DNA
<213> Homo sapiens
<400> 383
ctgaatttgc ccatccacct gggtcacttt gagagttgtg caggggggct gggagcactg 60
gtgttcacgt gggaccacag gctgcaccat aagacccact cacaataaaa aaataaaagg 120
ccgagccggg catggttgct cactcccgta ataaaaaaat aaaagaacag gctgagccgg 180
gaaa 184
<210> 384
<211> 191
<212> DNA
<213> Homo sapiens
<400> 384
ccagaaaaag caccccatgc actgtacaaa tactgcaaac actatagttg cattcatagg 60
accattaaaa aaaaagagcc aaattacaaa acaatctata ttttacaaac atttcagttg 120
ggttcttaag ctaaagatat tactgtttac tttggtacga taactagaaa acacaaacat 180
tatgctccag a 191
<210> 385
<211> 278
<212> DNA
<213> Homo sapiens
<400> 385
tctttgtcct ggtcgtcttg gtaaatgtgt agtcgcgtat ctgagacata gattgtgctt 60
tattcggtgc tgtggagagt agaaactagc agcagtacct ggaaaggggc cctgatctgc 120
gggtgtggat gagtagagac tcttcagttg agatttagct ctagtgaggg ttgggtgcaa 180
caaatgtagg aaagagtgaa gagatgagca gctcatgtct gagtttattc tgtttctgtt 240
actgtgtcac agaccagcct cagatcatag ttcatgat 278
<210> 386
<211> 281
<212> DNA
<213> Homo sapiens
<400> 386
gctcattgct gactgttttc cttaaaagct gggaaggctg tgggtcaatt cagctcgcca 60
cctgtttctg tactgcccac aagctgagaa tgaattttgt acttttaaat ggttgggggg 120
aggggagaat attttctgac acaagatata tgacattcac acttgagtgt caaagttttt 180
aggaacacag ccacgcccat ttgtttacac tttactcctt ccactttaca atgaagaggt 240
atgaggagct gctacagaaa ccttctggct tgcaaagttt a 281
<210> 387
<211> 94
<212> DNA
<213> Homo sapiens
<400> 387
attttggaga aaaatacgct agattttaaa tgttagagct gttcccggag acttattgca 60
gaaatagatg agaagcaaat caagactact attc 94
<210> 388
<211> 265
<212> DNA
<213> Homo sapiens
<400> 388
gctgacagtg agtactgatg gcctggatgt aggggtgaga gaaagagagg gggctaggat 60
gaccctgagg tttgggcctg gacaccagct gaggggtgaa gatactgcat tgagggaccc 120
cagggtcggg gtttgcaggg agtggccaga aggccttgtg aagaatcaga gacgtggctg 180
agtctgttcg gtgctgggtg cccgtcagac agctgcgtga gatggcaagg agacagttgg 240
atacgcatac ctgaagttga gagag 265
<210> 389
<211> 261
<212> DNA
<213> Homo sapiens
<400> 389
actgcctggc agaacatacc actgaactag tatgtgctag aggagggcac aaacatccgc 60
tccttcccta ggcctgctgg ctctggtttt ctatgcagat gattcattgg attgggggtg 120
agtgttttgt ttttctgggg gcagtgtgag ctttgagggt tggaatattg ggaggcattc 180
cttagtttcc tcaactagcc tggaaagtta ggagtctagg gtaattaccc cccaatgagt 240
ctagcctact attcactgct t 261
<210> 390
<211> 194
<212> DNA
<213> Homo sapiens
<400> 390
aaagctgtgt ttatatggaa gaaagtaagg tgcttggagt ttacctggct tatttaatat 60
gcttataacc tagttaaaga aaggaaaaga aaacaaaaaa cgaatgaaaa taactgaatt 120
tggaggctgg agtaatcaga ttactgcttt aatcagaaac cctcattgtg tttctaccgg 180
agagagaatg tatt 194
<210> 391
<211> 268
<212> DNA
<213> Homo sapiens
<400> 391
aaagaacttc tatccagaat gcataaagaa ttaccgctca gcaacaaaaa acaataaaat 60
tagaaatggg caaaaaagaa acttcactaa agataatggg tgtagccaat aagcacaaga 120
aaaagtgctt gacatcatta ttcatcaggg aattgcaaat gtaaactaca gtaagaagcc 180
acggcatacc caccagaatg gctaaaatta aaaagactga caccaccaaa tgttggtaca 240
tatgtagaac aaccaattcc acacatag 268
<210> 392
<211> 262
<212> DNA
<213> Homo sapiens
<400> 392
ttttatagcg tgtagttgac ccttgaacaa tttgagtgcc aacctcctgt gcagctgaaa 60
ttcatgtata acttttgact ccccaaaaat ttaactacta atagcctatt gttgaccaga 120
agccttacct ataatataaa cagttgattc acacatattt tgcatgttat atatatatta 180
tatacagtat tcttttttct ttgcacatta aaaaaagaca tttattctgc atcatgatca 240
gacttacatt tagcaatcaa ca 262
<210> 393
<211> 203
<212> DNA
<213> Homo sapiens
<400> 393
gaggtgcatg atattgttag ccaaaaggga gaagacatac agacggttaa tatcgatgcc 60
agaaaagaga tgaccccccg acaagaaggg actgacaatg aggatccagt cgtgtgcctg 120
gacaagaaac cagtgatcat cattttcgat gagcccatgg acatccggtc tgcctataag 180
agactttcaa ctatctttga gga 203
<210> 394
<211> 230
<212> DNA
<213> Homo sapiens
<400> 394
gaggagtcga acatgatctt gaggactcta ctcttggagg cttaaaggaa tgtgttgtct 60
gtaattgtca cagggaatca ggaaggaaga gccagttagg gtcaagcgtt agaatatgtt 120
aagcttaata ggctttgaca ctcagatgtg cccatcaagc agttaggaat tggattattt 180
tgtttggaag aggtcagaac tagtcaagag atttcatagt ccttggtaaa 230
<210> 395
<211> 235
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (66)..(98)
<223> n is a, c, g, or t
<400> 395
cagaattcta tgcttctctg gcaacaacaa taactattag aaaatcttaa cctcacccag 60
aagttnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnca gcttacttaa ataattgtgc 120
taaatagctt atcttcacaa tttaaaagta aaaacctttg aaaaagaagg acttcaccaa 180
aaacaaacac actctcccta tagccctgaa gatctggcca gaaaagctcc attaa 235
<210> 396
<211> 283
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (124)..(124)
<223> n is a, c, g, or t
<400> 396
gataataacc tttaatgaac tcaatactcg ggaaaggctt cacatttctg ggactcagca 60
ttatccaaaa tatctattaa gagccataca ccattctagc tgcaattgat tatacaaaaa 120
aaangaccaa agtggttaca ataataaaat agaacacaga gaaagaagaa aactacatgt 180
gttacaattt ggtaagataa acaaacaaac aacaaaaatt aatcactttt tttggtcctg 240
tgacacacat gataattttt gtcttaattc tcctaacaaa tga 283
<210> 397
<211> 259
<212> DNA
<213> Homo sapiens
<400> 397
cggcagggtc ctggatcacc aaggaccttg aaagcatgtg gaagactttg atcaatgggg 60
gaatcattaa ggggttttgc attccggaac tatcatcagc ttcagcgggg ggcagggggt 120
aggatagagg cagggaggca ggaagttctc gcagggtcca ggcaagagat ggtggagtgt 180
ggtcctgggg aagggggcag tggacggatc tgagggaggt tcagttagga tgggcaagga 240
ttgagatctg gctggatcc 259
<210> 398
<211> 202
<212> DNA
<213> Homo sapiens
<400> 398
gggacatccg aaagctacac cacagatgcc agtggttcat gccttcttcc cgcaacttta 60
ggaaaattta tttatttatt gtttattagt tatgggggga gaggggagat ttaaaggacc 120
agggacatgg gaaccaagcc atagggatca gagggccttg tccttgaaca ctactggggt 180
atattcaggc tcatccacgc ag 202
<210> 399
<211> 257
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (90)..(90)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (164)..(164)
<223> n is a, c, g, or t
<400> 399
caggcaagaa aagcgcagag aaatcggtgt ctgacgattt tggaaatgag aacaatctca 60
aaaaaaaaaa aaaaaaaaaa aaaaaaaaan gaaaagagaa aaaaaagact agccagccag 120
gaagatgaat cctagcttct tccattggaa aatttaagac aagntcaaca acaaaacatt 180
tgctctgggg ggcagggaaa acacagatgt gttgcaaagg taggttgaag ggacctctct 240
cttaccagta ccagaaa 257
<210> 400
<211> 91
<212> DNA
<213> Homo sapiens
<400> 400
agagcaggag agacggcaga gatatgttgc taggtgaata tatatttata taataaatcc 60
gtaagttaat aaagtaaata gtaattctct g 91
<210> 401
<211> 132
<212> DNA
<213> Homo sapiens
<400> 401
gtatggactg agaggcattt aaattctggc aagggaggtg gaaatgctga caatgaggag 60
gaagcttata gtgggtcaaa caaggaggtg tctagtgtgt tgtttaaaaa gaaggcttac 120
aattagccag gc 132
<210> 402
<211> 158
<212> DNA
<213> Homo sapiens
<400> 402
tcccaagggt cgctagaaac tcgtcttcgc gttgccccct ttctggctct cagcgccgtc 60
gccactcggg agaggctggg tgaggcccgt gtgaggactg accctggatt cctcgaaact 120
gccattgtga tcattactct gctctttgga aatggctg 158
<210> 403
<211> 271
<212> DNA
<213> Homo sapiens
<400> 403
gttacatgaa atagtgccag ctggaggttc tttgccagca ccatgccaag tgaaataata 60
tatttactct ctctattata caccagtgtg tgcctgcagc agcctccaca gccacgatgg 120
gtttgtttct gttttcttgg gtggggagca gggacgggcg gagggaggag agcaggtttc 180
agatccttac ttgccgagcc gtttgtttag gtagagaaga caagtccaaa gagtgtgtgg 240
gctttcctgt ttctaaactt tcgctactat a 271
<210> 404
<211> 77
<212> DNA
<213> Homo sapiens
<400> 404
tgtctgtgcc tcatggaatt gccaatgaag atattgtctc tcaaaacccc ggagaactct 60
cttgtaagcg tggggat 77
<210> 405
<211> 131
<212> DNA
<213> Homo sapiens
<400> 405
ccctgtgctt tttgccgtcg ggcctctgca cctgggtcca tggggtctgc ggggtctgcg 60
gggtctgcct ggcctgtggg ttctgccggt ggggcttcag gagtaataaa gtgtcaccct 120
atccttgtaa a 131
<210> 406
<211> 226
<212> DNA
<213> Homo sapiens
<400> 406
ggccatccga aaatagcaac aacccagact ggctcctcac tcccttttcc atcactaaaa 60
atcacagagc agtcagaggg acccagtaag accaaaggag gggaggacag agcatgaaaa 120
ccaaaatcca tgcaaatgaa atgtaattgg cacgaccctc acccccaaat cttacatctc 180
aattcccatc ctaaaaagca ctcatacttt atgcatcccc gcagct 226
<210> 407
<211> 171
<212> DNA
<213> Homo sapiens
<400> 407
gatatttgtc tatgaacagt agcacagacc ctctaattcc atagggaatc atttccatga 60
cttcccccaa ataccctact cttctctatc tctgtgacag tctctggccc tgctccctcc 120
taaactgctc aaaatcctta ccaaaatggc ttacaaatct ctctcctccg g 171
<210> 408
<211> 266
<212> DNA
<213> Homo sapiens
<400> 408
ccctgtggat cccaaccagg aagttcctcc tgggccacct cggttccagc aagttcctac 60
ggatgccctg gccaacaagt tgtttggtgc tcctgagccc tccaccatcg cccgctctct 120
accaaccact gtcccagagt caccaaacta ccgcaacacc aggacccctc gcactccccg 180
gacaccacag ctcaaagact caagccagac atcacggttt tacccagtgg tgaaagaagg 240
acggacactg gatgccaaga tgcctc 266
<210> 409
<211> 300
<212> DNA
<213> Homo sapiens
<400> 409
tatagttctg ttgtaggcta cacatgaaca gcaaccaaaa agaggaaaaa tcttctttgt 60
ccccatgctt tttccttgaa ttctgcactt ttcatattaa cattagccct tgctttgtga 120
tttgcctttg ctttatttta ccctgtctta atcttaacct tcccaaatat ttccatacag 180
ggtgcacctc tcctagacaa cacacagcgg agagtgtgct tcccatgtat tcaatcttcg 240
tctcttgaaa ggagaggtgc cctcattaca cttcactgtg acacaggata cccttggttt 300
<210> 410
<211> 67
<212> DNA
<213> Homo sapiens
<400> 410
atggaaaaga acacgatgag aattagacac tggaaaatat gtatgtgtgg ttaataaagt 60
gctttaa 67
<210> 411
<211> 274
<212> DNA
<213> Homo sapiens
<400> 411
tcaggttgtg aggtttatta gtccccaagg caaacacaaa tattagatta ataatccaac 60
tttaatagta tacatttaaa agaaaaaaaa caaaagccct ggaagttgag gccaagcctg 120
ctgagtattg cagctgcatt tgcccaaagg gaatccagaa caagtccctc cctgtatttt 180
gttcttgaga ggggtcagtc tagaagctag atcctatcag gatgaggagc agcagcccag 240
ggcttgtctg gatcagcacc aacgatttta aaga 274
<210> 412
<211> 265
<212> DNA
<213> Homo sapiens
<400> 412
gtggtgttct tgatgtagtg agctcaagtc tgcggctgtt tctggggacg tggtggaggc 60
tgcatgttct gttctctcca ggaagagcta gtggttttct accctgtgtg ttggtgagca 120
atgtgcagag gcagagccgc tgaagtatgg ttcctgaggg gtggcgaagc accgccctca 180
ctccaggtca cctcatcagc cctcgttttt ttttgggccc caccttgggg cttgccaaac 240
tgagaggcat tcaaaaccat ggcac 265
<210> 413
<211> 120
<212> DNA
<213> Homo sapiens
<400> 413
aggacgcggg ctctcgctgg cccgagctct acctctactc gagggctgac gaagtagtcc 60
tggccagaga catagaacgc atggtggagg cacgcctggc acgccgggtc ctggcgcgtt 120
<210> 414
<211> 102
<212> DNA
<213> Homo sapiens
<400> 414
gaagcatttg gaggaattcc tagacattgc gttttctgtg ttgccaaaat cccttccgac 60
atttctcaga catctcccaa gttcccatca cgtcagattt gg 102
<210> 415
<211> 281
<212> DNA
<213> Homo sapiens
<400> 415
atgtctccag attccaggtg caggttctta gcacctccgc agccgctctc tcttgagtcc 60
atcctcagtc tctcctaccc cttgaagtag ggggaccctg aatttgccca tccacctggg 120
tcactttgag agttgtgcag gggggctggg agcactggtg ttcacgtggg accacaggct 180
gcaccataag acccactcac aataaaaaaa taaaaggccg agccgggcat ggttgctcac 240
tcccgtaata aaaaaataaa agaacaggct gagccgggaa a 281
<210> 416
<211> 265
<212> DNA
<213> Homo sapiens
<400> 416
tgtgattgtc agcaatgacc atgctgggaa actgtgtggg gcctgtggaa actttgacgg 60
ggaccagacc aatgattggc atgactccca ggagaagcca gcgatggaga aatggagagc 120
gcaggacttc tccccatgtt atggctgatc agtcatccac caggaacgaa gatttcctga 180
agaagacctg gtccctctgg aggttgcggt ggctgaagga tgcatcatgt gctcctaccc 240
tgctctaccg cttttctggg tcaca 265
<210> 417
<211> 203
<212> DNA
<213> Homo sapiens
<400> 417
acattggaaa gttaagagag ttcgagggaa gaattataaa gactaggagt cctagaaaga 60
gaaaatttag agaataaaag gagaggcagt acttgaaaga taacacaatt tttacaaatt 120
tgttggaaaa acatgaattc ataaattcag gaagcacaat atatacccaa catatattta 180
aataaaatcc aggcctagac tca 203
<210> 418
<211> 274
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (108)..(118)
<223> n is a, c, g, or t
<400> 418
ttcccccttt gaatgaggtc ttccatgttt gagggaaagt cttgcactat tgcatatatt 60
ttggggacac agattttcat agtttccatt tttggggggc ttaaggannn nnnnnnnnct 120
gtttgaaaca gttttatact ttctgatata gtacttgaaa ttcttaccag aaaattactt 180
tggagttttg aagcctttat taatactact tttaaagaag cagttgtttt attgtcaatg 240
ttttttttcc cccacgcata ttttcttgta tttc 274
<210> 419
<211> 71
<212> DNA
<213> Homo sapiens
<400> 419
tgagatggtt tgatggtttg ctgcattaaa ggtatttggg caaacaaaat tggagggcaa 60
gtgactgcag t 71
<210> 420
<211> 269
<212> DNA
<213> Homo sapiens
<400> 420
tactaacttt cctgcactaa accaccaagt ctgtctcctc tgcaatgtgt agttcctgat 60
ggctccggtt tttcccccca cctttttatt ttgaagcctg acttgcagga gatacccctc 120
taactgtata gcttcctact ccattaaaga ttagtcagag atggtaatca acccacctga 180
gctctttcac tacctgctgc tgcaactatg gtcaggataa ggggagcaca ctcacacttc 240
aggccttcac gtctgttcca gttactttt 269
<210> 421
<211> 47
<212> DNA
<213> Homo sapiens
<400> 421
ctttgaacca ctttgcaatt gtagattccc aacaataaaa ttgaaga 47
<210> 422
<211> 149
<212> DNA
<213> Homo sapiens
<400> 422
ggactaggaa gggctattcc aggctcagcc ctgctcctgc agctttgccg ctgagtgtag 60
gaaaaacagg catgacagac cagggtgagg gttgtgccca gctgggccac ggccatgcgt 120
ggggtggccc aataaacacc gtggactcc 149
<210> 423
<211> 185
<212> DNA
<213> Homo sapiens
<400> 423
tttctctttc tgtccggtgt ccggactttc ctaattggag tttgaggccc ctaagctggc 60
atcaacccca ggccacgctc gctctttcct tccctcccct ccccctctgc cttttgtacg 120
ccagttctca gaaataaaga tcttttgtcc gtttttttaa cctcggattc tgtaattggt 180
tctta 185
<210> 424
<211> 105
<212> DNA
<213> Homo sapiens
<400> 424
ccacaggtaa ccttctcact aagtgggggt gtctgaggcc agggagagct ctactcattc 60
ccctgtgtga tcccagcagt gagcatagag caggtgccct gcaat 105
<210> 425
<211> 122
<212> DNA
<213> Homo sapiens
<400> 425
cccccatgcc ctgtggagat ggaggtgtgt gctgatccct cgtgcccctg tggagataga 60
ggtgtgtact gatcccctgt tcccctatct agatgaaggt gtgtactgct gatcccccgt 120
cc 122
<210> 426
<211> 255
<212> DNA
<213> Homo sapiens
<400> 426
tttttgacag tgttgaaaat gttcagaagg ttgctctaga ttgagagaag agacaaacac 60
ctcccaggag acagttcaag aaagcttcaa actgcatgat tcatgccaat tagcaattga 120
ctgtcactgt tccttgtcac tggtagacca aaataaaacc agctctactg gtcttgtgga 180
attgggagct tgggaatgga tcctggagga tgcccaatta gggcctagcc ttaatcagtc 240
ctcagagatt tcttc 255
<210> 427
<211> 236
<212> DNA
<213> Homo sapiens
<400> 427
cccactctgt gtagtcttaa cttatttctt ctaaactcac cattaaccta aataatagtc 60
aaatttaggg gggctgtatt tgtcttactc gagtcttcta ccatagttga aactgtcgta 120
cccaaacgag ttacagagaa atgccacact ttgagacgaa ttcaggagtc ctttattagc 180
tggtgactga gagacggcta acacaggaaa tactctcggc cctaaagaat gggcta 236
<210> 428
<211> 275
<212> DNA
<213> Homo sapiens
<400> 428
gaagacgcca atgatggctg aagagttttt cccagattta caagccactg gagacccctt 60
ttttctgata caatgcacga ttctctgcgc gcaaggaccc tcgactcacc cccatgtttc 120
agtgtcacag agacattctt tgataaggaa atggcacaaa cataaaggga aaggctgcta 180
attttctttg gcagattgta ttggccagca ggaaagcaag ctctccagag aatgccccca 240
gttaaatacc tcctctacct ttacctaagt tgctc 275
<210> 429
<211> 223
<212> DNA
<213> Homo sapiens
<400> 429
tgatctggtc agtagtggaa ttcgatttta tgcagactgg atgtaatatt tgtaatccct 60
gtgcaatttt gtgacgtgcg gttctaattc atgtgcagtg atatagtata gataaaagaa 120
tgagtaaaag aaaatacaag aattctaaag aaagttggtt ttagcccctt tgatagtcca 180
tggttaagac atcctttata aaccaaagat ggccagcaca ctg 223
<210> 430
<211> 273
<212> DNA
<213> Homo sapiens
<400> 430
cagaagaggg ctcaacttag ccaatatttt gatgctgtca agaatgctca gcatgtggaa 60
gtggagagta ttcctttgcc agatatgcca catgctcctt ccaacatttt gatccaggac 120
attccacttc ctgggtgccc agccaccctc tatcctaaag aaaacctcag cctatggacc 180
tcccaactcg ggccagtttc tatccttccc tccttccttg gacatggggg tttccaccgt 240
ttgcccccct ggcagaaaaa cctccctggg cct 273
<210> 431
<211> 112
<212> DNA
<213> Homo sapiens
<400> 431
gagtccaaga gaatggccga gttcatgagc tgcacacgat gtaagttgta ctctctgaaa 60
ttgttggtcc acctttcatc ttcatcaaat gagcatcccc tccaatacct gg 112
<210> 432
<211> 262
<212> DNA
<213> Homo sapiens
<400> 432
gagtcacgaa ccttattctc caaaacaaaa gcaacaagga ctttgacttc tcagcagcac 60
tcagctctgg ttcttgaaac acccccgtta cttgctattc ctcctacctc ataacaatct 120
ccttcccagc ctctactgct gccttctctg agttcttccc agggtcctag gctcagatgt 180
agtgtagctc aaccctgcta cacaaagaat cttctgaaag cctgtaaaaa tgtccatgca 240
tgttctgtga gtgatctacc aa 262
<210> 433
<211> 152
<212> DNA
<213> Homo sapiens
<400> 433
ccggggtagc cattggttct tggatctgtg ttagaatgag tgctttccct tcctactgat 60
gtgattgtgg attaggaatt cgtgaccgag tgatttttgg ccagtggttg ggtttaaaat 120
tctattaaaa tttgtagttt gggctgggtg ct 152
<210> 434
<211> 99
<212> DNA
<213> Homo sapiens
<400> 434
gtggaggccc attaccgggc ctgcttgtat gctggagtca agattgcggg gactaatgcc 60
gaggtcatgc ctgcccagtg ggaatttcag attggacct 99
<210> 435
<211> 207
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (115)..(115)
<223> n is a, c, g, or t
<400> 435
ttcatttttc ttcccctctg ctagtttgga agttatatta taccaagttt tttagtatta 60
gcctagaaat cttaacataa agacttctaa taagcaatat ctttaatttt ttttncctac 120
ccaatactag atcatgagca ttttcccaca tcataaagaa ttggtcacaa gtcagcccca 180
aacatagtcc agtggaatcc aatgata 207
<210> 436
<211> 231
<212> DNA
<213> Homo sapiens
<400> 436
aaggcaacac ttctgtcagt agaattgctt tggattgtaa atatgtttac ttcagaggaa 60
atcagtcaga gtggatggct cagcaaaacc catcacaact gcggaaaaag gaagtgactg 120
gctagaggta aggaaataga ttttctctaa gttaactggc ctacgtgtga atcgaaccct 180
gcaccctggc ctcattagca ccaacactgt gaagaacagc tgtggcagag a 231
<210> 437
<211> 133
<212> DNA
<213> Homo sapiens
<400> 437
ttcacccctc tacttacata ttgtaaagtt gtataaatct atcattgaaa ggtcccctct 60
gccagcagtg gtgccaccct ttggtttgct gtggtacttt gctgtgtact ccgtggcatc 120
atgttactgt gta 133
<210> 438
<211> 66
<212> DNA
<213> Homo sapiens
<400> 438
tttctctttc tgtccggtgt ccggactttc ctaattggag tttgaggccc ctaagctggc 60
atcaac 66
<210> 439
<211> 233
<212> DNA
<213> Homo sapiens
<400> 439
tacaaagagt accacgagac acgagaaacc ttgtgggaac acagggggac caccccctaa 60
ggctaaatac tacttggtga ccgatagcga acaagtaccg tgagggaaag gtgaaaagaa 120
ccccgagagg ggagtgaaaa agaatctgaa acctagtgtt tacaagcagc gaaaatggca 180
caagccatga atcgtgtact ttttgtagaa cgggccagcg agttatgaca aaa 233
<210> 440
<211> 260
<212> DNA
<213> Homo sapiens
<400> 440
tctcttccga ggtcgaggcc ctgaggcggc agttactcca ggaacaggaa agtgtcaaac 60
aagctcactt gaggaatgag catttccaga aggcgataga agataaaagc agaagcttaa 120
gtgaaagcaa aatacgaaat tgagaggctg cagtctctca cagagaacct gaccaaggag 180
cacttgatgt tagaagaaga actgcggaac ctgaggctgg agtacgatga cctgaggaga 240
gacgaaacga gccccacagc 260
<210> 441
<211> 270
<212> DNA
<213> Homo sapiens
<400> 441
catagccaag gcttcaagct ctcaggactt ggctatggag gaggacgaag aaggcaggag 60
ctcatccagt ccagccttac ctacagcagg aaactgcacc agctagactc cattctggga 120
ccatctccag gagtccatga gaggctttct tctcctatgt cccaattctc agaactcaga 180
tgtggctaga ccaacccctg ggaaactgcc ccagcttctc ccaccatagg ggccggaccc 240
ccatcaccag cctagatcca gggctgcctc 270
<210> 442
<211> 156
<212> DNA
<213> Homo sapiens
<400> 442
aacttgtgcg cgcagcccaa actaacctca cgtgaagtga cggactgttc tatgactgca 60
aagatggaaa cgaccttcta tgacgatgcc ctcaacgcct cgttcctccc gtccgagagc 120
ggaccttatg gctacagtaa ccccaagatc ctgaaa 156
<210> 443
<211> 103
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (48)..(48)
<223> n is a, c, g, or t
<400> 443
gttttgagat catacactgt tacagagaaa gagaggaggc atattatnaa cgtgtggact 60
tcagtgttat tccttctctt caaaatgatg ttccaggtgt cta 103
<210> 444
<211> 101
<212> DNA
<213> Homo sapiens
<400> 444
ctcggcggcc tttatttatt ctgttccccc agctcggcca cttctctgaa ggagggctgg 60
gttctgggcc tgtatcgaat aaacacaaac ctggatggcg c 101
<210> 445
<211> 144
<212> DNA
<213> Homo sapiens
<400> 445
ggaggatggt caggcgtcac caacaacccc atcacccagt aacaagaacc ttgactctcg 60
tcagtccctc tgcatcaaga cacttaccca tttcccacct catgcctgct aacttgaatg 120
aaacaatcgc tgggaaagca ttaa 144
<210> 446
<211> 276
<212> DNA
<213> Homo sapiens
<400> 446
atgtgagagt gctttgcagt tggaaagtgc tgtaggaacc ctgaattcat ctgaaactgt 60
agcttagtgt ttaaatgatg tctgttatta cttttttgaa tagtctggag tgcttgttaa 120
agaaaaaatt attctgtgat atttgttgaa tgaagcacag tgaggaagac tttactcagg 180
gcccttgtaa tagctatagg gaccactgca atagggtctt gcagtggggg agagagaata 240
ggctcaattc tgaatacatc atcatgggca agtggg 276
<210> 447
<211> 48
<212> DNA
<213> Homo sapiens
<400> 447
tctaaagctg tttttaactc cgagattaca acttagagga accaagga 48
<210> 448
<211> 168
<212> DNA
<213> Homo sapiens
<400> 448
aaattgaagg atttgctgtt attcctacct gcattggact tgacctgggt gttgggtgag 60
tagcaatctg ttactgtttc tctatgtgga cgatgaggaa agggttgaga aatccagcga 120
aaggacactt ctgttaatag ctcaatctgc tgcccatggt tgggaaaa 168
<210> 449
<211> 147
<212> DNA
<213> Homo sapiens
<400> 449
tttttctgta tgaaacccag atgtcaccaa atggacatta atagttgcat taaggatcag 60
tagcattaac aaaagttgct ttaaaagcca ttatgtaaat caagacttga aaatgagtga 120
gggaatttta gcgacactgt ctgagca 147
<210> 450
<211> 272
<212> DNA
<213> Homo sapiens
<400> 450
tgaattccca actttccgag atgttgttta atgagactca cccttatttt tcaattcttc 60
cttcattctc tccctcttaa ctggtttcct cttacccaag aaaagccttt ctcttaactg 120
caagcttatt tgaattttac cttattgaat atctttcaac tatttggcag acctttaact 180
ttccctacca tgccaatggt cactaaacac cttaaatgcc actcttaaca ccttaaatgc 240
cacccttaac agtattcttt cagtcctcat tc 272
<210> 451
<211> 267
<212> DNA
<213> Homo sapiens
<400> 451
tgtccagcaa gtgcagggtg cctgcacttc accctgtgca gagaggtggg atggggccgt 60
gcacacaggg atgcccgctc cacatcctgc ctgcccctca gccctggccc aggccccttt 120
tggaggcagc tgaggaagga tgctggggaa agccctcttc tgcagctttg tggaaggctg 180
atcagtggct gctgggtggc gggtaccctt gctcagatgc ctggcagggc tgggtggcga 240
ttcataaaga cctcgtgttg attcccc 267
<210> 452
<211> 138
<212> DNA
<213> Homo sapiens
<400> 452
caggagagaa gaggccccgg catggggatc tgggttctag agggcatgtg atgactgtaa 60
atgttcactg ggtgggtagg gagtggtatc cagtgttcaa gtgcagaaat ctttggcttt 120
gctaccagtt ccatatga 138
<210> 453
<211> 176
<212> DNA
<213> Homo sapiens
<400> 453
ggttaatctt tgttactagc cctcactact cagaattggt gagacctctc catttctgct 60
tcactcagct tacgtggttt gctcacactg acaccaacaa acacctgtca atccctatgt 120
ccctcctgtc ttccaaaaat acctagaaat tgctgctcta ttgacggtag tatttc 176
<210> 454
<211> 256
<212> DNA
<213> Homo sapiens
<400> 454
gctctaaaag ttatgaacct gacattcttg gtcttacaca atctggaccc agtctactct 60
tctataacca tcttccactt aatttacaaa tctttattaa ggcacaggta ctcctactta 120
tcccctattg cctctctcat gctgaatcaa tcatgccaaa agctaagaaa acatgagcat 180
gcttgggact aaagaaacag aactgaggat ttcctacaca tcctaactgc aaggacagtc 240
catcaaaagc cagaga 256
<210> 455
<211> 101
<212> DNA
<213> Homo sapiens
<400> 455
ggaagcttta gctaccaatc cagtaccctc ctaactagaa tgtatacaca tcagccagga 60
ctgactgact acttcattag agatatactg tactcattgg g 101
<210> 456
<211> 230
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (131)..(131)
<223> n is a, c, g, or t
<400> 456
tacctgtggt tccaggtacc tggagggctg acgtaggagg attgcctgag cccagcaggc 60
caaagctaca gtgagctgtg attgtgccac tgcactccag cctgggcgag gagagcaaga 120
ctctgtctca naaataaata cataaaatac agcgtccaaa agtgtgtcat cttctttctc 180
ttcacaattt tataataagg gggtaaaatg cctgtgagtc tattcattat 230
<210> 457
<211> 38
<212> DNA
<213> Homo sapiens
<400> 457
ctttggacta aagaatatat tgggcgaaga atagaggg 38
<210> 458
<211> 154
<212> DNA
<213> Homo sapiens
<400> 458
ttctgctttt cctgttccct atccttacgc aggattgttt tactgttagc caggttaagt 60
ttaagcttct tgaggacttt agtactgaaa gacaatggct cacttgtaag acctagttga 120
agagtacaga tttagatttg ttcagtgtgc tgtg 154
<210> 459
<211> 156
<212> DNA
<213> Homo sapiens
<400> 459
aacatatgtg tagtgtgctg cagcataaga tggaagaact taaagaaggc ctgcggcaaa 60
gagatgagct tattgagaaa catggcttag ttataatccc cgatggcact cccaatggtg 120
atgtcagtca tgaaccagtg gctggagcca tcactg 156
<210> 460
<211> 267
<212> DNA
<213> Homo sapiens
<400> 460
aagcttttag agaatacact acaccaggga gtatgactac tagtatgact attaggaggg 60
taataccaag agttggacta cgcaccttag gcaagataca aaccaactaa aatagaataa 120
agaatgagtc agatgagtgt agccatttta accaagcagc acatttgtta atttctacaa 180
cttagtctca gcgataccca ttgtatttag ccatgttcaa caacaagtgt cagaaactgc 240
acagactcct ccctgttcag ctggtag 267
<210> 461
<211> 143
<212> DNA
<213> Homo sapiens
<400> 461
ctttgtccgc tgtcatgatt cgccacgtgc cttcttctgt cctctcacgg ctaggcctcc 60
agtgaaaggt agacagtaag cctgggcatt cagtcttctg aatttctcac atcaattcca 120
gggaaaatcc aaccactcca aca 143
<210> 462
<211> 270
<212> DNA
<213> Homo sapiens
<400> 462
atccagcaag gaatagtgca gcacctaggg actagcaatg ataggaagtt gcaccatatt 60
tggcccagca agggcaaagg gagagagtag ttgtgggagt ccagagagac cctggttgtt 120
gcttctcatt tattgaaccc gatttaaagc cagagaacaa agagcccagt ttatgtagta 180
catgacgcag cctcctaggc acagggtaaa ggatggagaa tagatctgga ggattaaata 240
gtaacaacaa cgcgcgagat cctctaagtc 270
<210> 463
<211> 88
<212> DNA
<213> Homo sapiens
<400> 463
ttgagaacag aaatagtggc attgcatgcc cagcaagatc gggcccttac ccagacagac 60
aggaagatcg aaactgaggt tgctggcc 88
<210> 464
<211> 102
<212> DNA
<213> Homo sapiens
<400> 464
tatttcttat gctgtcagat tacatttttc ctttgagtgc tttgggtgca gccgtggaat 60
cctgatgtaa aagcataggt tcttgcatta ctgagtaaac at 102
<210> 465
<211> 221
<212> DNA
<213> Homo sapiens
<400> 465
gcagatggca agtgcaccaa ggagaaggca ggaacactgg agcctgcaat aagggaggag 60
aggggactgg agagtgtggg gaatgggaag aagtagttta ctttggacta aagaatatat 120
tgggcgaaga atagaggggg agcttgcagg aaccagcaat gagaaggcca ggaaaagaaa 180
gagctgaaaa tggagaaaac cagagttaga actgttggat a 221
<210> 466
<211> 281
<212> DNA
<213> Homo sapiens
<400> 466
cacccttctt gaccacaaaa aggtggccat cctgactggt ctctaccttc aggaaaacaa 60
atggggacct gagggcgctc aaccacccca gaccacccag aagtcacagg agcacggaac 120
aggaagcagg gagacagcac acagtaagca catggcaagc acacagtaaa cacacggcaa 180
gtacatggca aatacacagc aggtacacag cgagcacaca gtaagcacac ggtaaacact 240
cagcaagtac atggcaaatg cacagcaggt acacagcgag c 281
<210> 467
<211> 133
<212> DNA
<213> Homo sapiens
<400> 467
cccgggccag gcaaggtggg tcacacctgt aatcccagca ctttggggaa caaggtggga 60
gaatcacttg agtccggcag tttgagacca gcctggccaa cataatgaga ccgcatcttc 120
acaaaaaata tgt 133
<210> 468
<211> 62
<212> DNA
<213> Homo sapiens
<400> 468
agctcggcca cttctctgaa ggagggctgg gttctgggcc tgtatcgaat aaacacaaac 60
ct 62
<210> 469
<211> 266
<212> DNA
<213> Homo sapiens
<400> 469
acttcaggaa caggagcaac tactaaaaga gggatttcaa aaagaaagca gaataatgaa 60
aaatgagata caggatctcc agacgaaaat gagacgacga aaggcatgta ccataagcta 120
aagaccagag ccttcctgtc acccctaacc aaggcataat tgaaacaatt ttagaatttg 180
gaacaagcgt cactacattt gataataatt agatcttgca tcataacacc aaaagtttat 240
aaaggcatgt ggtacaatga tcaaaa 266
<210> 470
<211> 147
<212> DNA
<213> Homo sapiens
<400> 470
gcccagcctg gatatttaaa ttgttctgtg ctctcctcct tttttttctc tctgtgattc 60
tctttgtcag ctcctttgcc tatatttgca tctcagttga cacccctgat tctgacttgt 120
ccttatcttc ctaccagtct ctgccga 147
<210> 471
<211> 187
<212> DNA
<213> Homo sapiens
<400> 471
gtaggagtgc tcatggttct gtcattcttg gacctctcct ggctgagctc tgattccctg 60
tgagcacgat gctgatgcaa tagtcctgtg tcatcactgc agcggtcctc aggagctgcc 120
agggccaatt gctacagagt gtctgggtgt gtggcatagg aggaaggttt gcttgtgaaa 180
tgaggct 187
<210> 472
<211> 235
<212> DNA
<213> Homo sapiens
<400> 472
atctacgcca ctcgctctgg tgggaccctc gtgcttgtgg ggctgggctc tgagatgacc 60
accgtacccc tactgcatgc agccatccgg gaggtggata tcaagggcgt gtttcgatac 120
tgcaacacgt ggccagtggc gatttcgatg cttgcgtcca agtctgtgaa tgtaaaaccc 180
ctcgtcaccc ataggtttcc tctggagaaa gctctggagg cctttgaaac attta 235
<210> 473
<211> 177
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (59)..(71)
<223> n is a, c, g, or t
<400> 473
gaagtaagcc tcatcatcag agcctttcct caaaactgga gtcccaaatg tcatcaggnn 60
nnnnnnnnnn ncagccacta agaacccctc tgcttttaac tctagaattt gggcttggac 120
cagatctaac atcttgaata ctctgccctc tagagccttc agccttaatg gaaggtt 177
<210> 474
<211> 34
<212> DNA
<213> Homo sapiens
<400> 474
taaagcgtgg ccgtggctcg cgtgcctgcc atct 34
<210> 475
<211> 268
<212> DNA
<213> Homo sapiens
<400> 475
aagtcctcct caggcttgga gaacttcctc agcgtcacct ccttcattga gccttctctg 60
atcactccat ccctctccta cccctccctc ccccaaccct caatgtataa attgcttctt 120
gatgcttagc attcacaatt tttgattgat cgttatttgt gtgtgtgtgt ccgatctcac 180
aagtatattg taaacccttc ggtgggtggg ggccatatcc tagacctctc tgtatccccc 240
agactatctg taacagtgcc aggcacac 268
<210> 476
<211> 244
<212> DNA
<213> Homo sapiens
<400> 476
tcactgtaag gtacagttag ggtaacactt tagaggttta ttatttttaa aaaacttttc 60
ttgaactcct ggccagcatg gtgaaacccc gtctctacta aaaataccaa aattagccag 120
gcgtgatggt gggtgcctgt gatctcagct acttgggagg ctgaagcagg agaactgcct 180
gaacccagga ggcggaggtt gcagtgagtc gagatcgtgc tactactgcc tgggtggcaa 240
gggt 244
<210> 477
<211> 57
<212> DNA
<213> Homo sapiens
<400> 477
tgccattttc caagaatgac ggtggtggct tttagtcaga aaatggcctt ctgtgct 57
<210> 478
<211> 153
<212> DNA
<213> Homo sapiens
<400> 478
ggagagaagc agaatattcg gacaaacacg gacagtatct catcggacat ggtactaagg 60
tctacatcga ccccttcact tatgaagacc ctaatgaggc tgtgagggaa tttgcaaaag 120
agatcgatgt ctcctacgtc aagattgaag agg 153
<210> 479
<211> 247
<212> DNA
<213> Homo sapiens
<400> 479
agctgcccct ttcccgtcct gggcaccccg agtctccccc gaccccgggt cccaggtatg 60
ctcccacctc cacctgcccc actcaccacc tctgctagtt ccagacacct ccacgcccac 120
ctggtcctct cccatcgccc acaaaagggg gggcacgagg gacgagctta gctgagctgg 180
gaggagcagg gtgagggtgg gcgacccagg attccccctc cccttcccaa ataaagatga 240
gggtact 247
<210> 480
<211> 154
<212> DNA
<213> Homo sapiens
<400> 480
agcggagcaa gtgtcccggg ccttcagcca gccctggata gctacttcca tcccccgggg 60
actcccgcgc cgggacgcgg ggtgggacca ggtgcgggac ctggggcggg cgacgggact 120
taaataaagg cagacgctgt tttctaccca aaaa 154
<210> 481
<211> 292
<212> DNA
<213> Homo sapiens
<400> 481
agatgtgcac aaacagagcc cccgcgtaca ggtccagctg cggagggaga gagccttgtg 60
tggggctgtt attcccaggg ctccagcaag ccactccctg ggtgacctcc ggcaaggccc 120
tctctgggcc tcggtggcct gtggataagg aggggagacc cccactcgcc tgcctgcctg 180
catcacgggg ccattgtgag gttgggggaa gacctggccg tggagctaca agcttgtgcg 240
gatgtcaggg gacattactg ttgctaataa agtccaaagt ggccaatgcc tt 292
<210> 482
<211> 248
<212> DNA
<213> Homo sapiens
<400> 482
cggtgaactt ctggatcccg tttctgatgc agattcttgt cttgttctcc acttgtgctg 60
ttagaactca ctggcccagt ggtgttctac ctcctacccc acccaccccc tgcctgtccc 120
caaattgaag atccttcctt gcctgtggct tgatgcgggg cgggtaaagg gtattttaac 180
ttaggggtag ttcctgctgt gagtggttac agctgatcct cgggaagaac aaagctaaag 240
ctgccttt 248
<210> 483
<211> 271
<212> DNA
<213> Homo sapiens
<400> 483
gcgatgaacc caacctccct gaagccaaaa cttcccaccc tgccgcacac tccggaccac 60
cccacttgcc accaagcaca tcctctccaa atccaaccct tatttgcgac ccttcagtga 120
tgacccagca gacctccaaa aagcctcctc tgcccagatc tccagccggg tctggggctg 180
ggttgcggag gggagggtct gggagtccac acttctccac caacttccct tcccactctc 240
ttattccaca ttgcagtgtt tggaataaac c 271
<210> 484
<211> 37
<212> DNA
<213> Homo sapiens
<400> 484
tgtcctgggc accgtagcga gactctgctt tctacaa 37
<210> 485
<211> 110
<212> DNA
<213> Homo sapiens
<400> 485
gcaggcagta agaagcaggg atttcttcaa atgctagtaa gcacaaagag agggagaagt 60
ttttgtaagt aacgaacagg gccgggcatg gtggcgtgag aggccgaggt 110
<210> 486
<211> 238
<212> DNA
<213> Homo sapiens
<400> 486
gagcaccaga tcctatagag cctttagacc atcgtagaga ctttgctttt ctctgagtgc 60
tttggtaggg atttgaggaa aggagtgaca tcgtatgaat gactttatta tgtgcccacg 120
tggaggtgtc aaataggcag ctattgtgtt gcaggtcccc aggttcattg attcactaag 180
aggactcaaa agactcagca cgtagtccta ctcacagctg tgatttatta tcgcacaa 238
<210> 487
<211> 226
<212> DNA
<213> Homo sapiens
<400> 487
cagattcttt tttatggtgg ctttgcttgt tttaaatttt tgcatgactt ttcatctttt 60
tatgtgtgtt tcctgtagtt tgatccgaag gaaaagagta tagtagcctg agaatcagga 120
gatgggagtt ttagtcgtag gccttatgat aattaccccg cggtggtgtg tagaaaagta 180
tgtaaatttg ctctgtttta agactttgaa ctacctcaag aagagg 226
<210> 488
<211> 271
<212> DNA
<213> Homo sapiens
<400> 488
gtgggagaag ttggcgtcct aggctgggga ttggtcgggg gaccttaaag aaaaaggcca 60
gggctgaggg tcctgaggag agagagagag gccacgtgga tggaggactg tcaccccctt 120
ctcggttctg tcaccccctt gagtctaact cactgttgag gggaggaaga agggggatgg 180
acggaaggga gaccgaggaa aggctttcgg gagtggggac attatccacc cagaggtgtg 240
ctacccacaa ccaccgcgag atccttagag t 271
<210> 489
<211> 109
<212> DNA
<213> Homo sapiens
<400> 489
ctgtgctctg gaaaggctac caaatactgg ccaaggtcag gaggagcaaa aatgagccag 60
caccagcgcc ttggctttgt gttagcattt cctcctgaag tgttctgtt 109
<210> 490
<211> 134
<212> DNA
<213> Homo sapiens
<400> 490
gctacagctg gcgaacccca aagagttcta ccacgaggtg cacaggccct ctcacttcct 60
caactttgct ctcctgcagg agggggaggt ttactctgcg gatcgggagg acctgtatgc 120
ctgaccgttt ccct 134
<210> 491
<211> 74
<212> DNA
<213> Homo sapiens
<400> 491
gggaagccaa atataggcca agagcagcct gtggatgatg ctgcagaagt ccctcagagg 60
gaaccagaga agga 74
<210> 492
<211> 201
<212> DNA
<213> Homo sapiens
<400> 492
tacatccctt caccaggtgg tgccatgtct cccagctact cgccaacgtc acctgcctac 60
gagccccgct ctcctggggg ctacacaccc cagagtccct cttattcccc cacttcaccc 120
tcctactccc ctacctctcc atcctattct ccaaccagtc ccaactatag tcccacatca 180
cccagctatt cgccaacgtc a 201
<210> 493
<211> 253
<212> DNA
<213> Homo sapiens
<400> 493
gaagaggatt cagggtcagc ctaggggacc ctggctccct ccgataggca ggaaggagga 60
gggatgcgga ggagaggctg agccttccac gggcctcctg ttaggggtgt tggtggaggc 120
caggttgggg agggaagcct aaggaccctc cacacctccc acagccagag tcagttgagg 180
ctgggacaaa ggggaaggag agagggaagg aggaccgcct gaccttgccc agaaggagct 240
tcctctaaac tgc 253
<210> 494
<211> 43
<212> DNA
<213> Homo sapiens
<400> 494
gtaaaggagt gggtgatttg caaataaagc acattataca caa 43
<210> 495
<211> 250
<212> DNA
<213> Homo sapiens
<400> 495
tgctgctcct cataataagc cgccactgtc tccaggtagc cctctttgaa gtcgtcctcc 60
agctctgcca ggctcgacat cacctgtcca cgtcctgatt ctgcattttg cattttatca 120
taaaatcttt ctatggcctg gtgcattcgg gccttcagct tcttcatgtc atcagagagg 180
accttcggga agcacatggc ggccaaaagt tcaaggagcc aaggcctgag atgacccagc 240
tccaaaggga 250
<210> 496
<211> 262
<212> DNA
<213> Homo sapiens
<400> 496
tccccaacaa cacaacgcgt cctgttccac ctacgtagga tctgtgaaac aggctcagtg 60
cctttgaggg aggagggaac gtttagattg agaccacccc actcccgggt gattaaataa 120
atatgtctct cccccacccc acgcaggatt ggaaaaagtt aattgtggtt tcagaaaagt 180
taacccctgc gttgcttcga ccccttctct ccagggaagg gttgggtaaa tgtctacgaa 240
tcgccttgag agagaactaa ag 262
<210> 497
<211> 170
<212> DNA
<213> Homo sapiens
<400> 497
tacacagttt ccaatttaag taggcagact gagcatgccc atcagtttcc tattgctgct 60
tccatccctc gaaatgatag aaaagatttt aaacagcaaa taaagaatga gaaaaagaag 120
aaattataag tgggttttaa aaagttgcag tgggccaggc atcatggctc 170
<210> 498
<211> 89
<212> DNA
<213> Homo sapiens
<400> 498
tgcccgatca cacaggagta tgcccaaact ctctcaggcc tctagcagct gacaaccact 60
gctttaaatc cctattacat ttattatga 89
<210> 499
<211> 242
<212> DNA
<213> Homo sapiens
<400> 499
cctgggggca ggacccacag ccagtgggct aagaccttta aaaaattttt ttctttaatg 60
tatgggactg aaatcaaacc atgaaagcca attattgacc ttccttcctt ccttccttcc 120
ctcccttcct ccttctctcc ttctctcctc ctctctcctc tcctctcctc tctttccttc 180
cttccttcct ttttttcttt ttctctttct tctttatttc ttgggtctca ctctcatcac 240
cc 242
<210> 500
<211> 220
<212> DNA
<213> Homo sapiens
<400> 500
tcaagacgag cctggacaac acaacaagac ccccaattct actaaatttt tttttttaat 60
tagccagatg tggtaatgca tgcctctgta gtcccagcta ctcaggaggc tgaggtggga 120
ggatcacttg agtgcaggaa ttcaaagctg cagtgagcta taatacaagg cttcattgca 180
ctccagccta ggcattagag cgagaccgtg tttatttaaa 220
<210> 501
<211> 271
<212> DNA
<213> Homo sapiens
<400> 501
ttaaaggaca aactcaagaa ggcacaacat gaaagagaac aacttgaatg tcagttgaag 60
acagagaagg atgaaaagga actttataag ggtacatttg aagaatacag aaatagaaaa 120
taccaagctt atgtcagagg tccagacttt aaaaaattta gatgggaaca aagaaagcgt 180
gattactcat ttcaaaaaga gattggcagg ctgcagttat gtttggctga aaggaaatct 240
gcaagacttt cctgcttaca acctcaagta a 271
<210> 502
<211> 133
<212> DNA
<213> Homo sapiens
<400> 502
caacatggac atttatacta ataaggaggg cagaggcgaa tatgtgagaa ggtccaccac 60
ctcagagctt gaatcagctt cacgatgatg gaaaggtaag ctttatcact gatctcaaca 120
gcagactggt ggc 133
<210> 503
<211> 119
<212> DNA
<213> Homo sapiens
<400> 503
gagtcaggct tactaatgct gccctcactg cctctttgca gtaggggaga gagcagagaa 60
gtacaggtca tctgctggga tctagttttc caagtaacat tttgtggtga cagaagcct 119
<210> 504
<211> 87
<212> DNA
<213> Homo sapiens
<400> 504
gatcaaatca agtcttggtt gtggcttgct gaattaaata tttatgagtg gtgcattttt 60
aagtatcgtg accaagacac catatta 87
<210> 505
<211> 298
<212> DNA
<213> Homo sapiens
<400> 505
aatacagaac tgagcctagg ccagggaact gggattgggg ttagatctaa gcaagatcag 60
catgtaagtg atagtggaga aagtaaatgg agaggtgagg actcatcccc ttggtggaaa 120
ttcggaatta ataaagcagg aggagagtca ggataatggg ctgttgaata aagaaagtaa 180
gtgacaagga agaggtaatg tgtatccaag aagtaggaaa gaaatgagac ttaaagcgta 240
gggggttagg ctgtgtaaga gctcagtacc caacaggtgc tcagtcaagt aacttgac 298
<210> 506
<211> 247
<212> DNA
<213> Homo sapiens
<400> 506
tgggattgca gtcgcctgcc accgtgcccg gctaactttt gtattttggt tgagacaggg 60
tttcgccgtg ttggccaggc tggtctagaa ctcctgacct caggtgatcc acccgccttg 120
gcctcccaaa gtgctgggat tacaggcgtg agccaccaca cccggccaaa aaaaaaattt 180
tttttctatc cctgccattc agtctccatt agcactctat tctctctcat ttattccacc 240
ccgtctt 247
<210> 507
<211> 204
<212> DNA
<213> Homo sapiens
<400> 507
accaccccta gctttgtgtg tagtgtagtg attttctggc tgtcactcat actcactggg 60
caccagcctt gccctcttag cctccatcca tccagacagc ccttcccacc tcctggtggt 120
gagccagtct gcattcccac gccatcccaa agccctttca tcttacccgt gcattgtaga 180
tggaaggagc acccatgcca ttca 204
<210> 508
<211> 179
<212> DNA
<213> Homo sapiens
<400> 508
aaaaaggtct atgatcttga gggcagacag cagaattcct cttataaaga aaactgtttg 60
ggaaaatacg ttgagggaga gaagaccttg ggccaagatg ctaaatggga atgcaaagct 120
tgagctgctc tgcaagaaaa aataagcagg acagaggatt tgctctggac agagatgga 179
<210> 509
<211> 291
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (39)..(83)
<223> n is a, c, g, or t
<400> 509
tggtgaattt tctaggagcg atgatgtact gtaattgtnn nnnnnnnnnn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnnnnn nnnaatgctt gttctaagac atttctgaat gtagaccatt 120
ttccaaaaag gaaactttat tttcaaaaac ctaatccgta gtaattccta atcttggaga 180
ataaaaaagg gcggtggagg ggaaaacatt aagaatttat tcattatttc tcgagtactt 240
tcagaaagtc tgacactttc attgttgtgc cagctggttg aaattaaaac t 291
<210> 510
<211> 282
<212> DNA
<213> Homo sapiens
<400> 510
gatagtgatg ggtcttccca ttgtccttaa accctgtaca tattgtgcag cctggcctgg 60
gactggatgt ttcagtagaa ataacacagg ggacaccaga ggcaagcctg gaggtcagct 120
cagtcgttag gcagtggagg cacaaggtgg ggcagttttt cccaggtgtt tgatgatgac 180
tgacttgagc cagagacccc taaagataga gtggagtcca gggaatgatc tagaacttca 240
ggtgacaggc aggagctgcc cggatttaac agcagaacca ta 282
<210> 511
<211> 164
<212> DNA
<213> Homo sapiens
<400> 511
ctaactctgt cctgaagagt gggacaaatg cagccgggcg gcagatctag cgggagctca 60
aagggatgtg ggcgaaatct tgagtcttct gagaaaactg tacaagacac tacgggaaca 120
gtttgcctct ctcccagcct caaccacaat tcttccatgc tggg 164
<210> 512
<211> 294
<212> DNA
<213> Homo sapiens
<400> 512
gatggacagg gttctgaaaa aactgaaaat gaattctaga aagcagcatt tgagagggaa 60
aagagaagtg atcagcattt aggaatatga actgtctgga gctagagaaa cagcctggga 120
aaagagcaaa gggctagagc aggaaagaga aaagagaatg agactagcgg tggtttggat 180
attatttgta accaaagtca aaggacggga gatctagagt ccagccaaca aagaacttgc 240
tcctataaaa accaaatgga ccccaccctt cacttgacgt agaggtcctt tcct 294
<210> 513
<211> 262
<212> DNA
<213> Homo sapiens
<400> 513
aacatggtcc tggaggttac agtgtagtga ggggcaaaga catggagcca atggttgagc 60
tgaaacctca tgtgaggagt taactggatg gagaaaggag tcaagagagt tctaggtaga 120
ggaggcagca tgtcaaaggc acagtaaagg gaggatgaat ggtccatttc agggatggaa 180
gaaggctgct agattggaac atagggaagg agggaatgtg tgatacaagc tggagctaga 240
aaggtaggtg gtcagaacat ag 262
<210> 514
<211> 81
<212> DNA
<213> Homo sapiens
<400> 514
gaaaaattta cacagctaga tttggaagat gttcaagtta gagaaaagtt aaaacatgcc 60
acgagtaaag ccaaaaaact g 81
<210> 515
<211> 296
<212> DNA
<213> Homo sapiens
<400> 515
ttaaaaggtc ctgctctatc gttctgtgtc tggctctgca aactgctggt atgtaaaaga 60
ccctctttcc agacaggcca cgaactcccc gaaggccggg ctggcctctt ctctgcctct 120
gtcccaacct ccctgacaca ccctccatcc acgttaataa aacagggaac acaccagagg 180
gctcagtaga gaaaaacaca tcataatgac tgatttataa tttttatagc tttaaaataa 240
taaatttatt tttttccatt aaagtattat aacacgatta caaaaagccc tcgtgc 296
<210> 516
<211> 285
<212> DNA
<213> Homo sapiens
<400> 516
tagatgccgt catcttccgt ggtcacgccc acaatcttca gcgtggcctc tcccaggtca 60
ctgtaggaga tgctgtagtg accatcgttg ttcaaggtgt tgtgttcagg gcccttccag 120
gtaattgagg ctttggggcg gccacagact cgacatctag gaacaacggt ctcccctgtc 180
tcacacgtga cctcactcaa tggaatgacg aattctgggg gaacgtcata aatgtagttg 240
ggattgagaa gcttgttgct gagtccttcc cgtgacttcc gataa 285
<210> 517
<211> 148
<212> DNA
<213> Homo sapiens
<400> 517
cactatgcag ttactgtgac tgtgggaggc aagcaacact tgctcggact gtatgacacc 60
gcgggacagg aggactacaa ccagctgagg ccactctcct accccaacac ggatgtgttt 120
ttgatctgct tctctgtcgt aaaccctg 148
<210> 518
<211> 269
<212> DNA
<213> Homo sapiens
<400> 518
gaccaggaag tcctataaag aattatattt ctatagaatt aaaaatgcag ttctgtcagc 60
ctggacaaca aagtgagacc cccatagcta caaaaaaaaa aaaaaaagtt tttttaagag 120
ttgggcatgg tggcacacgc ctgtagtcct agcttctcgg gaggctgagg tgggaggatt 180
gcttgagatt gggaggttga ggctgcagtg agccgtgatc acaccactgc actccatcct 240
gggtaacaga gtgagaccac ttaaattaa 269
<210> 519
<211> 263
<212> DNA
<213> Homo sapiens
<400> 519
caaagcaaca aatggaggca tatgaaattc ctcatcgagg aaacactgga gatgttgctg 60
ttgagatgat gtggaaacct gcctatgatt ttctgtatac ctggagtgct cactatggaa 120
ataactacag agatgtgtta caagaccttc agtcagcttt ggacagaatg aaaaaccctg 180
tgactaaaca ctggagagaa ttaactggag ttttaatact agtaaattct ttggaggttt 240
tgagagtaac tgcattctcc act 263
<210> 520
<211> 182
<212> DNA
<213> Homo sapiens
<400> 520
tgttaaccca ttccagtaca gtattctttt aaaattcaaa agtattgaaa gccaacaact 60
ctgcctttat gatgctaagc tgatattatt tcttctctta tcctctctct cttctaggcc 120
cattgtcctc cttttcactt tattgctatc gccctccttt cccttattgc ctcccaggca 180
ag 182
<210> 521
<211> 276
<212> DNA
<213> Homo sapiens
<400> 521
agccacagtt ggtgtggctg gttcaggggc tggcattgga accgtgtttg gcagcttgat 60
cattggctat gccaggaacc cgtctctcaa gcagcagctc ttctcctatg ccattcttgg 120
ctttgccctc tctgaggcca tggggctttt ctgtttgatg gtcgccttcc tcatcctctt 180
cgccatgtga ggctccatgg ggggtcaccg gcctgttgct actgcaactc cacaccattc 240
ttggtgctgg ggtgtgttaa gctttaccat taaaca 276
<210> 522
<211> 288
<212> DNA
<213> Homo sapiens
<400> 522
ggcttaacca gctagacatt cctctaaata catacgtaac aaaaattgat ggcaggagat 60
tttattggga tcactggata cctacactca acaggcagaa cttggctaat tccatttata 120
ccactactga gacagtgaag acaaattaag aatcagaaca ggaagcacat agcataggga 180
tacccgtgtc agcgacatat ttaatatgcc cctcagctta agactcaata ctgaacagac 240
caaaaggcca cctcaattgc cgctcccgcc acacttgcta ttgaaact 288
<210> 523
<211> 210
<212> DNA
<213> Homo sapiens
<400> 523
ccaaggcatt gctaatctct gtacttcagt aaacactgaa aagtcaacgt aactctatag 60
gtcgcatatt cttgaatgac agggaaaggc aaacatctct acagaggtgt gatcgaaagc 120
attttacatt aggtacacag aaactttaaa ctcacactat gtaagcctct aatcagcctg 180
agcaaaatcc attgcctaca cagtcattta 210
<210> 524
<211> 54
<212> DNA
<213> Homo sapiens
<400> 524
ggttgaaaga tgaaatgcct gtatgtgctc tgaagaaatg gtaattccag attg 54
<210> 525
<211> 277
<212> DNA
<213> Homo sapiens
<400> 525
tccacctgcc gagaagctga gattatagtc actgtgcctg gctggaatat agccttttga 60
ctccatgtca ttacccgcac tcttcgctct tcctggaatg tatttcctga gcctgtctgc 120
cctaaaaatt ccaatttctc ctttaagctt tggctcaaat gctatctata ctctgctgcc 180
tcccccaagt ccccctagtg acacacaggg tcctcttctg ctcttcctta tgttcttctt 240
tgtcagagca acatcacagc agtaccccaa catttgg 277
<210> 526
<211> 39
<212> DNA
<213> Homo sapiens
<400> 526
gcggcgggca gggcttgcct ttcttagtct gatgccaag 39
<210> 527
<211> 223
<212> DNA
<213> Homo sapiens
<400> 527
gggccatgac acctgatcat tggatcaaga ggggcactgc tctactcatg agcctggaca 60
gctgagacct cctcctcttc tccgcttgag agagagggtc agggactcca ggagctaaga 120
cagatgttgc acctaggact gaggccggac ctcactcaga ctttgacctt ggccgaattt 180
gtgtgatgtg gccctggaga tacctagttg tgttagccat aaa 223
<210> 528
<211> 239
<212> DNA
<213> Homo sapiens
<400> 528
caggaaggcc tcgaggccac acaggggctg ctggccggcg agtgggcccc acccctctgg 60
gagctgggca gcctcttcca ggccttcgtg aagagggaga gccaggctta tgcgtaagct 120
tcatagcttc tgctggcctg gggtggaccc aggacccctg gggcctgggt gccctgagtg 180
gtggtaaagt ggagcaatcc cttcacgctc cttggccatg ttctgagcgg ccagcttgg 239
<210> 529
<211> 211
<212> DNA
<213> Homo sapiens
<400> 529
ctggtggact attccatcac ccatgcagag cccgccaacg tgttcgacat caattcccac 60
acgggggaga tctggctcaa gaattccatc cgctccctgg atgccctgca caacatcaca 120
cctggaaggg actgcctatg gtccctagag gtgcaggcca aggaccgggg ctcccacatc 180
acttcagcac cacagcctta ctcaagattg a 211
<210> 530
<211> 256
<212> DNA
<213> Homo sapiens
<400> 530
tcggcctcag attccatatt tgaacaccag ctgattgaga gaaggggaat gagaagagct 60
ggatgagttt aaataactca ttgttcagat tcctgaacag gagttgggat aatggccatc 120
ttttctttcc tatcctttct tcccccctca ctgtgaaaaa taacagtcca ccccaagtca 180
tacactggac ccagtgcctg cggggacagg actgtgggtt tcttggtcac acctgtgttg 240
gtgctcaatg cagtgt 256
<210> 531
<211> 250
<212> DNA
<213> Homo sapiens
<400> 531
tagtttcatt tactctttag gcagaaaata ggttcaaggg tctagtaaag gaggcaaatg 60
ggcagaaaac aacctcttgt ttgctatccc actgcacttg aaatggacct ctataattca 120
ctaccattta taagtgtctc gcatatcaac atcacattag gtaatttact gcctccaatt 180
cctggtccat aactattcca tcctgaaaag tcataataca atgttattgg aacaatctat 240
tcatatggta 250
<210> 532
<211> 143
<212> DNA
<213> Homo sapiens
<400> 532
atgtatacaa agtaaattct tagccaggtg tagtggctca tgcctgtaat cccagcactt 60
tgggaggctg aggcgggtgg atcacttgag gtcagaagtt caagaccagc ctgaccaaca 120
tcgtgaaatg ccgtctttac aaa 143
<210> 533
<211> 273
<212> DNA
<213> Homo sapiens
<400> 533
agtggcttcc ttggagtagt gggtgaaagt ctgcttaaaa agagggctta ggagagaatt 60
gggggaagga attgaaatac atcaacatag acaactcttg aggagttttg ccatgaagag 120
acactttgca tccagaggac actttgcatc cagagagtgg cttccttgga gtagtgggtg 180
aaagtctgct taaaaagagg gcttaggaga gaattggggg aaggaattga aatacatcaa 240
catagacaac tcttgaggag ttttgccatg aag 273
<210> 534
<211> 250
<212> DNA
<213> Homo sapiens
<400> 534
gagctggaaa aaagtcagac tctccacaga ccccctatgg gggaccccca actcaaggcc 60
aaggactggg cgtatcggat gctcataaca cccctggcct ggccccttta ctgagaagac 120
tccttggata tttcccaaga accccccaca tacacccctc acaagccacc cctcctgaga 180
ggcagggggc cctccgcccc ctccccatgt attccccacc tgtgttccgt ttgaccagca 240
cagaaatatt 250
<210> 535
<211> 91
<212> DNA
<213> Homo sapiens
<400> 535
gggagcacac agtcacctct cacagctcca ttatccagcg gctgccgggc tctgacaacc 60
tatatgatga cccctaccag ccagagataa c 91
<210> 536
<211> 250
<212> DNA
<213> Homo sapiens
<400> 536
gctgccattg ctgtggttat gggcatttag aaaacttgaa agtcagcact aaaggatggg 60
cagaggttca acccacacct ccactttgct tctgaaggcc cattcattag accacttgta 120
aagattactc caacccagtt tttatatctt tggttcaaaa cggcatgtct ctccaacaat 180
ttaagtgcct gatacaaagt ccaaagtata aacatgctcc tttactctct tgctgctact 240
cttgcttttg 250
<210> 537
<211> 64
<212> DNA
<213> Homo sapiens
<400> 537
gtagctattg atgtacactt cgcaacggag tgtctgaaat tgtggtggtc ctgatttata 60
ggat 64
<210> 538
<211> 299
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (224)..(232)
<223> n is a, c, g, or t
<400> 538
cagaggtctt gcagcccctg tggatgcccc cgccgaggtc ccccgatccc cgcacccgga 60
ctgctgctcc ctgccccacc attgcgggtc ccccaggaag ccaggtgacc ccaggtggga 120
ggctgtgtgt ggaggccatc ctggaaggaa gtttagacct gcccaggtgt ggagcgaggg 180
gcacaggggc atcctaacct cagaaactga aataaagcct ttgnnnnnnn nntctgtaaa 240
acatcaaccc ccaatcagaa gatggcaaat ggggaataaa aatagcaggt aacacgtca 299
<210> 539
<211> 195
<212> DNA
<213> Homo sapiens
<400> 539
tgacagcagc tgatgttgtt aaacagtgga aggaaaagaa gaaaaagaaa aagccaattc 60
aggagccaga ggtgcctcag attgatgttc caaatctcaa acccattttt ggaattcctt 120
tggctgatgc agtagagagg accatgatgt atgatggcat tcggctgcca gccgttttcc 180
gtgaatgtat agatt 195
<210> 540
<211> 171
<212> DNA
<213> Homo sapiens
<400> 540
aaaatagaac atcctgagtt acagaaattc agccctagtg tatcctggcc taaaaataca 60
gaacaatcaa gttgagtggt tggaaatgag aggctaggca gggttggaaa catgctaatg 120
tttactgagt gaaatctttc cttctcagta gagttgccct tgcagctgaa a 171
<210> 541
<211> 44
<212> DNA
<213> Homo sapiens
<400> 541
tctctggctg atatgttccc tgagatgaat gaggtctgtc aaga 44
<210> 542
<211> 249
<212> DNA
<213> Homo sapiens
<400> 542
gttacaggtg ctacgcatga tggtcggagt aaatatctca gatgagcagc tgggcagcat 60
cgcagacagg accattcagg aggctgatca ggatggggac agtgccatat ctttcacaga 120
atttgttaag gttttggaga aggtggatgt agaacagaaa atgagcatcc gatttcttca 180
ctaaaggaga ccaaactgtt ccttgcggtc tagtatttaa gaactggaac ttgaaagtcc 240
tccttctac 249
<210> 543
<211> 213
<212> DNA
<213> Homo sapiens
<400> 543
gaatccatta tcaatgttgc tagtgtaata cacaagaaaa cccaatgaga gaaattcaaa 60
tattaagaaa caagcttttg ttgattgagc tttaaatggc cacacaccat tataatatct 120
aagatgcttg tgctccccaa taaccaattt ttgcctccaa tgaggatgca agtcctaact 180
tctatgctcc cgaatttatc atactagcac cta 213
<210> 544
<211> 242
<212> DNA
<213> Homo sapiens
<400> 544
taataagtgt tagcatcgtg tgtcttgaag tatacttttg cactgtaact tgggttacgt 60
taaagagagc ttagcaccaa aggtagataa tgaagaaatg gcataggaaa gtggagatga 120
taaaaagttg attgttgaac caaaaagggt ttgaagggaa gcttcgactg agtatcagaa 180
attacttaag gcacatagga cctgaatcag graaccagca cttcttacaa ctgccagttt 240
ta 242
<210> 545
<211> 215
<212> DNA
<213> Homo sapiens
<400> 545
tgcaaggact cacctccttg agccttggtt tttgttgtag ggattaaatg agataatatg 60
agtggcagct cttcatgagt cctgcagtgc taagcaaatg tcagaaattg gtgtattaga 120
ctatttatct ttgatcttct gaatggattg ctgtcatgga cacggacacg gatcttcatc 180
tggttcattg tatttatatg tgagggatgg atggc 215
<210> 546
<211> 237
<212> DNA
<213> Homo sapiens
<400> 546
ggagaagtta agcaacatct agcaaatgtt atgcataaag tcagtgccca actgttatag 60
gttgttggat aaatcagtgg ttatttaggg aactgcttga cgtaggaacg gtaaatttct 120
gtgggagaat tcttacatgt tttctttgct ttaagtgtaa ctggcagttt tccattggtt 180
tacctgtgaa atagttcaaa gcctagttta tatacaatta tatcagtcct ctttcaa 237
<210> 547
<211> 257
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (220)..(220)
<223> n is a, c, g, or t
<400> 547
gaattgtcat tcataactct gtgctatatt acttgagggg ctaagaaaaa tgtatggtca 60
gtgaaacaca gtagtgtacc cttaaatgcc ttataaaaga ccatccatcc agtctgcgct 120
tttgactgtg tgcaagtatc agtaataatg cttttggggg ctcagatgaa cagcgaacac 180
caatcagcca ggactctgga aggaaagctc caaaaatgan gaagtccttt caacaccatt 240
ttccattact gttctca 257
<210> 548
<211> 34
<212> DNA
<213> Homo sapiens
<400> 548
tttgattaat aaaaatgcgt tgagcctagt tata 34
<210> 549
<211> 194
<212> DNA
<213> Homo sapiens
<400> 549
gttgcttccc caccctgagg agaggacacc atggcttact actcaggaca agtatgcccc 60
gctcagggtg tgatttcagg tggcttccaa acttgtacgc agtttaaaga tggtggggac 120
agactttgcc tctacctagt gaaccccact taaagaataa ggagcatttg aatctcttgg 180
aaaaggccat gaag 194
<210> 550
<211> 198
<212> DNA
<213> Homo sapiens
<400> 550
tgggaaatat agtgaaactc ctgtccctac aaaaaataca aaaattagcc gggtgtggta 60
gtgcatgcct gtagtcccag ctacttggga ggctgaagtg ggaggatggc ctgagctcaa 120
ggagatgcag gctgcagtgg gctgtgattg tgccactgca ctccagcctg ggcaccaatg 180
tgagaacctg tcttggaa 198
<210> 551
<211> 292
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (76)..(77)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (101)..(101)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (106)..(106)
<223> n is a, c, g, or t
<400> 551
ttgaaagaca ccagtgcaca cccaaactcc tggccttctg tgggttccct ttgctccaga 60
acacagatgt gtctanngaa aaacaaacga aaaccgagcc naaacnacca aaccccaggg 120
gggggccgct ctaaagaatc cctcgagggg cccaagctta cgcgtaccca gcttttcttg 180
tacaaagggg cccctaaagg ggagtcggaa taaaaaacta aaggcccttg gcccgtcctt 240
tttacaacgc cccggaactg gggaaaacat gccaaccttg ggggatcttt tg 292
<210> 552
<211> 268
<212> DNA
<213> Homo sapiens
<400> 552
gatgctcttc agttcaacta tattccctat ctgataattc cagaatctct atcatgtctg 60
agtctgggtc tgatgctttc attgtttctt cagattgtga tttttcttgc ctcccagtgt 120
gacttgtaat ttttaattga aagctggata tgatgtattt ggcaatggga agtgagggaa 180
atatgttttt agtgtgaggg tttatgttaa tctttctcag agttgggctg tttaatgttt 240
tgctgtggtc tgaatgttcc ttaaaact 268
<210> 553
<211> 269
<212> DNA
<213> Homo sapiens
<400> 553
aaggattggg ggtcgtgcag cccagccagc aggagggact gaggccctct aggaggaaag 60
cccagaggga gggggccctc attccttcag acccagtttt cccccaccct ccttaccccg 120
ctgggctagg tctccgccag ggctggcctc agtttctcct caacaggcct gggggcagcc 180
cttcccctgc ctagtccccg cctgagtgcc agcsccccac cccgcctgcc gccccctgtt 240
caggttccct ccccgccaca gtgaaataa 269
<210> 554
<211> 297
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (47)..(47)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (52)..(52)
<223> n is a, c, g, or t
<400> 554
tgcggaggcg ctagtccacc agagcbcctc cccgcccctc ttcccantcc gnatccctcg 60
cccccctccc cacctcccac cccccaccct gtaaactagg cggctgcagc aagcagacct 120
tcgcatcaac mcmscasaca ccamaaacca gtgagasccc cgctctctac cgcccgggcc 180
cagcactcgc tagctttcct gacacctgga actgtgcacc tggcaccaag cggaaaataa 240
actccaagca gccagtagcc ccgatggtgt gtgcctgacc tgtgtggccg gaggttc 297
<210> 555
<211> 35
<212> DNA
<213> Homo sapiens
<400> 555
ttaggtaggt aaggaatgat cacattggag tttgg 35
<210> 556
<211> 273
<212> DNA
<213> Homo sapiens
<400> 556
acgtgcttat taggaaatga gtctgtatgg aaatctcacc acagataatg gttaacgaac 60
cgggtcgaca tcacaaagga gggtggagac tctttttact aacttgaatg agacaaaagc 120
agtggtgtca gtttataatc ctgatgcatt tcagtaataa tgtagaaaaa cattatttta 180
aaaaagttcc aacacacagc catgaggagc ctcagttttg aaagaggtgc ataataaaac 240
tactaaccag aggagtctat gccattttaa gaa 273
<210> 557
<211> 256
<212> DNA
<213> Homo sapiens
<400> 557
gccaggagtt ggagcccact ctggggaaaa catgttgaga tcttgcctct gcaaaaataa 60
agtaaaataa aatttaaaaa aagtaaaaaa ataaaatcag ctgagcatgg tgacatgcac 120
ctgtggtacc agctactttg gaggctaagt tgagaggcac tgatgggagg atcatttgac 180
ggcccagagg ttgaggctgc agtgagctgt gtttgtgtca ttgcactcca gcctgcgtaa 240
cagagtaaaa ccttct 256
<210> 558
<211> 185
<212> DNA
<213> Homo sapiens
<400> 558
cttggagcca gagaagcgat tagaaacccc tgagggccga ttactgacat cataaatcat 60
gagtttgggg gctttgcctg ggtgatgttg gtaccaggag acatagttat aaccaccaac 120
gtcactgctg gttccagtgc aggagatggt gatcgactgt ccaggagacc cagacacgga 180
ggcag 185
<210> 559
<211> 246
<212> DNA
<213> Homo sapiens
<400> 559
gtctgaatat cttactcaca gctcaccttt ttggtgcctt tgatccgtat tagaaattat 60
ccacatcttc tctctgggca atattctact ttttatattg acccaattat tttactgctt 120
tggtgtgtcc tttctcctaa cacatatggg ttcactttga aaccctgaaa cccacattta 180
caaaaacatt ttcaatatga aacattgttc catgactcat tactggagta ccatcaacat 240
ttacat 246
<210> 560
<211> 242
<212> DNA
<213> Homo sapiens
<400> 560
gcaggtattt tctacgggtg tttgatgttc ctgaagtgga agctgtgtgt tggcgtgcca 60
cggtggggat ttcgtgactc tataatgatt gttactcccc ctcccttttc aaattccaat 120
gtgaccaatt ccggatcagg gtgtgaggag gctggggcta aggggctccc ctgaatatct 180
tctctgctca cttccaccat ctaagaggaa aaggtgagtt gctcatgctg attaggattg 240
aa 242
<210> 561
<211> 285
<212> DNA
<213> Homo sapiens
<400> 561
tcctctgtca atgttcgatt atctccagga aaagagacca gatgcagccc accttccttc 60
acctataagt acacacctga agaggagcag gaattggaaa agcgggtgat ggaacatgat 120
ggtcagtctt tagttaaatc gaccattttc atctctccat catctgtgaa gaaagaagaa 180
gccccccaga gtgaggcgcc gcgggtggag gaatgccatc atggaaggac tcctacctgt 240
tcacggcttg ctccaccacc aatgtctcag tctacctgtt ccctt 285
<210> 562
<211> 271
<212> DNA
<213> Homo sapiens
<400> 562
ggtaatgagc tcaatgcctc catttaatca cttttataag gctctctcca ataaggctgc 60
tgtgctgtgc tcctgccagt gttggagtaa tataacattt ttactgcaca caccttatgg 120
gaaagtgttt atactgagtg tagttttagg aggggtaaat gaagattatt tccacaaatt 180
aagattgcac ttagtacacg cctttacaca actctgatgg tatttaccaa aacatggcat 240
gtcttttcac gtatattcct gaaaacacca a 271
<210> 563
<211> 211
<212> DNA
<213> Homo sapiens
<400> 563
agctttaaga ggaaagagct ctatttttct tgttttcttc tctgagctag actgagctgg 60
ggatctaaga tgtacttctc tgactacaaa agggacagta tcatttagat tttttgcagt 120
tggaagaaat gggttgttga gtgtgttaag gctgggatga agaagggctg ggcagtactc 180
ttctggaaag gctcacctag cacgaacctg c 211
<210> 564
<211> 276
<212> DNA
<213> Homo sapiens
<400> 564
ggtaataaag agagccctcc ttgtcaaccc aaaatgtgag ccccctgtgg caaaaccacc 60
ccctacccca ttaacaaatc aacagacaaa attctccgag tcctttgcct cttttgataa 120
catgttgttc tgttttgtaa agtgtgtgtg cttggggttc cgaggtgtgg gattgagttc 180
tctgctttgt ttttttttaa gatattgtat gtaaatgtaa aaagttattt aaatatatat 240
tttaaagaac cctaactgcc aacttttgct gaaaaa 276
<210> 565
<211> 257
<212> DNA
<213> Homo sapiens
<400> 565
gagtcacctt tagtcacctg gtccgtaacc atctttcctg tctaaacttc tcaccccacc 60
actctggctt atacccctgc tctctttaaa atagccagtc agaattagct tagattgtgc 120
ggtccaaccc tagcccatag gggaacaaca cagcagtagg gggtacctgc atcagggata 180
agaacccatt cccctccctt gttccggtgt gctctcgcca ttgcaccatc catgagacgc 240
actcttgtat agaagta 257
<210> 566
<211> 198
<212> DNA
<213> Homo sapiens
<400> 566
gggaacctct gaataccata ggattaatat atgaaaaaat ttccctccct aaagtacatc 60
cacgttatga tttagacggg gatgctagca tggctaaggc aataacaggg gttgtgtgtt 120
atgcctgcag aattgccagt accttactgc tttatcagga attaatgcga aaggggatac 180
gatggctgat tgaattaa 198
<210> 567
<211> 228
<212> DNA
<213> Homo sapiens
<400> 567
taaaagaaac acctgcggcg gctccgcgcc tccctccctc cctcccaggc tcacctccta 60
ccttccttac ttcccttgta aaggcatagc caggggacat tgtcccccag cttcacatcc 120
acatgtctcc tagcatggca catgcatatc ctgcccaagg agcatgaagt cagaccagca 180
aactgaacac gaggcacagt cctgcatgct ctgggaccga gcactgag 228
<210> 568
<211> 201
<212> DNA
<213> Homo sapiens
<400> 568
agctgaagct gcgtcggcgg ctcacggagc tcctgggggc gcaggacggg gcgctgctgg 60
tgcggctgct gcaggcgctg cgcgtggcca ggatgcccgg gctggagcgg agcgtccgtg 120
agcgcttcct ccctgtgcac tgatcctggc cccctcttat ttattctaca tccttggcac 180
cccacttgca ctgaaagagg c 201
<210> 569
<211> 211
<212> DNA
<213> Homo sapiens
<400> 569
agctttaaga ggaaagagct ctatttttct tgttttcttc tctgagctag actgagctgg 60
ggatctaaga tgtacttctc tgactacaaa agggacagta tcatttagat tttttgcagt 120
tggaagaaat gggttgttga gtgtgttaag gctgggatga agaagggctg ggcagtactc 180
ttctggaaag gctcacctag cacgaacctg c 211
<210> 570
<211> 233
<212> DNA
<213> Homo sapiens
<400> 570
ggaatgggag ttggcgggca gtgaacgagt gtggggaagg attggtggtg gggcaacagg 60
aaggggcctg gggccgtttg ggtgccctaa ctttggtagc tcagtgtgca tttagagtgg 120
gactggggag ggaggtaagc ttggggtggg ctgcttgggg cttggcatag ggtggaaagg 180
gctaccctgg ggctttgacc cccctgtagt atgtgtggag ggtgccctcc cgt 233
<210> 571
<211> 251
<212> DNA
<213> Homo sapiens
<400> 571
aaactgctat ttctaactct tcatgaaagc attacctttg gaaagttaaa cttttttttt 60
cctttcatca ccgtctttga aacaaattat tttccaattc ataagaactt tggtaaaaaa 120
aaaaataaaa ggaaattata tgtttttctt tggacattca ttggaaggct tgttgaagac 180
atgatccccc agaagcctta gtgacccaga tctcaaccag agactcaaga tagcctcaaa 240
tacagtgaaa g 251
<210> 572
<211> 218
<212> DNA
<213> Homo sapiens
<400> 572
aactgtattt taacttagca caattaactg cagcatattt acttcatagc cccttaacat 60
gtcactttta ccaacaaagc tttttccttc atattctaat cacaaaaatt tctcaacaat 120
ttataacaat ctgtaaatct gaccttgcaa taaatagtca taaaacgtta tttttattac 180
tattattatt tttagagaca aggtctcctc gtgccgaa 218
<210> 573
<211> 250
<212> DNA
<213> Homo sapiens
<400> 573
tcccacacca aaatagattc ccaaatagat attacaagta ggagaatttt tatgactact 60
cagataaaac gaccattgat cacttacaaa catacaagtc ataaacaata cagaaataat 120
atgtgtatac aaaaacacag aaattattat attgggaata gacatatgac tgattcatat 180
gtaactttgt ctccacgctg tcttaaagtg tacagagttg aatattgtca ttcacaattg 240
tcacacaaaa 250
<210> 574
<211> 32
<212> DNA
<213> Homo sapiens
<400> 574
caccaaagtt ctgaggcatt aagccagcag aa 32
<210> 575
<211> 245
<212> DNA
<213> Homo sapiens
<400> 575
taaaactctc tgagactgtt ttccccccat gtcaaaacac ctattttgca tggctatatg 60
gaaattaaat gaaatagcaa atatgaaaaa cttttggccc agtgtataat tcatatcagg 120
cactgatctg ttttcttttt gccctaacct acttttcctg catcatatac cactacacct 180
ctttacaaac cttattaata gagccactct agactacttt atttccccaa gccatacaat 240
gtact 245
<210> 576
<211> 192
<212> DNA
<213> Homo sapiens
<400> 576
aaaacccacc ttgttggagc ctgcagggtg gtgctgggac tgagccagtc ccaggggcat 60
gtattggcct ggaggtgggg ttgggattgg gggctggtgc cagccttcct ctgcagctga 120
cctctgttgt cctccccttg ggcggctgag agccccagct gacatggaaa tacagttgtt 180
ggcctccggc ct 192
<210> 577
<211> 269
<212> DNA
<213> Homo sapiens
<400> 577
ctagacccac tgctggtccc ctttctccct cctgcttctc acctgaagcc acctgcccct 60
cctttgtgcc ctcccttgct tcctcctggg ctctgtcccc tgctccccct ttgtcctcca 120
tcccgactcc atctccccca ccaggctggt caccccaggc cagcgtctgt tgaaggatga 180
agcagctcct gtccggccca gccctgcctc acagctgtgc gagctctgcc cttctcagct 240
ctcaaacctg aataaatgca ccaagccca 269
<210> 578
<211> 172
<212> DNA
<213> Homo sapiens
<400> 578
tggcagagca acacttcgtc tcagaaaaaa aaaaaaaaac caaaaaccaa aaagccaagt 60
gtggtggtgt gcacctatag tcccagctac tcaggaagct gagacaagag gatcaattga 120
gcccaggagt tcaaagctgt agtgagctgt cattgtgcca ctatcctcca gt 172
<210> 579
<211> 269
<212> DNA
<213> Homo sapiens
<400> 579
ggagcagtgc ccaccaaggg tttgtcagat tcaagcctca ggcaagagaa aaatcaaaag 60
ccttctgcta ctctctccct ctgggcctct ggtctgccca gaggctggga ctccttcctc 120
taccttgctc tcaatctgga gggtgctggg gggtgcctcc atcttactgg gcccctggct 180
ggcttgtggg ctgaggtgct aatggggtct agtagctgct gtgctccctt cttcatgccc 240
agtctgaaac aggtgctccc ctaacccag 269
<210> 580
<211> 144
<212> DNA
<213> Homo sapiens
<400> 580
cagggaggcc tctctgcccc tatggggctc tgtcctgcac ccctcaggga tggcgacagc 60
aggccagaca cagtctgatg ccagctggga gtcttgctga ccctgccccg ggtccgaggg 120
tgtcaataaa gtgctgtcca gtga 144
<210> 581
<211> 204
<212> DNA
<213> Homo sapiens
<400> 581
aggatccgag tggtagtgtt tctgagagtc agggtctagg tgctggagtg cgcacggagg 60
ccgatgtaga ggaggaggcc ctgaggagga agctggagga gctgaccagc aacgtcagtg 120
accaggagac ctcgtccgag gaggaggagg ccaaggacga aaaggcagag cccaacaggg 180
acaaatcagt tgggcctcta gcgt 204
<210> 582
<211> 214
<212> DNA
<213> Homo sapiens
<400> 582
agtaacaata gccagaggtt gaagggcggg gtagaagagg ggggaatgtt gcagcgtaat 60
ccttcatacc acctggttct tgatattctg ccgcctgttc aagttcaaga ataaaagcga 120
cagcaggacc caaatgcagc tcccaaccca ctccccaggc tagacatgct tgtgtccaca 180
cagcacacca atgtgatact tccactgacc ggct 214
<210> 583
<211> 95
<212> DNA
<213> Homo sapiens
<400> 583
atgcagtgtg ttctgaggtc ctgtcacccc tgaggctgtg tgtgtccttt gccaaattaa 60
agagtcttac tgaatgcggt gcatccagga gacag 95
<210> 584
<211> 244
<212> DNA
<213> Homo sapiens
<400> 584
acttttattt tctatgcaaa ggtgattcag agaatttata taaaggcggg cgaggggcag 60
ccgagcaggg agctttggga cagggctggg gcccccatat cccccccggg ccacctgctt 120
tccctcctat ggctcccctg gaacaggagg gagagccaag ggggcggccc agcctggaca 180
gcgcccgctc ctgcctgggt gcacacacgg cgggcctgag ctccagcatc tgagtttggg 240
ggta 244
<210> 585
<211> 170
<212> DNA
<213> Homo sapiens
<400> 585
tgcacattgt gacatgtaca ctaaaactta aagtataata ataataaaat aaaaaaaaaa 60
gaaaagaacc tagtgtgtta aaccttaaat gcccttagaa ataacctaga ccagtgtttc 120
ttaaactgtg gtcatgagat cagttgaatg gattatgacc aacattgaaa 170
<210> 586
<211> 233
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (160)..(183)
<223> n is a, c, g, or t
<400> 586
cttgctttcc ctaggagttg aatccttctc cctgcctacc tgcagcatct cctttccctt 60
taaaatgacc atgtagtggc aagcagcctt ttactcttct gttagctctg gactcttaac 120
acttaagtta ctcttctgaa attgctagga ccattggggn nnnnnnnnnn nnnnnnnnnn 180
nnnatgtccg acctgtgatc gtggtacagc attagctgaa atttaccctt gtt 233
<210> 587
<211> 240
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (191)..(191)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (207)..(207)
<223> n is a, c, g, or t
<400> 587
aaggaccctg aaaaatgact tctcatttcc tgcctgcaga aaagagaaat attaggatag 60
tgttgtgtgc aaaaaaatgc aagcttgcaa tgagagatgc agagtgtgag ggagagaggc 120
acgaaggggg tggagaaaaa agacagagaa tttgaggttg actcacggct ttgaagggaa 180
aacaggaaga ngaagaaagt ctgtctncca tgggtcggca acccacactt tacacatttt 240
<210> 588
<211> 273
<212> DNA
<213> Homo sapiens
<400> 588
ataagtgtac caggactcta aaagaaactt gtttgtataa tgctatccaa ggtatgtagc 60
ccagggaata accaacctga tgtgtgttat gacccatttt aagcctcccg tgatcacagt 120
ttttaaaata aaattaagga ctggtcctat ttctaggtga cacaagtaag gtaatagcta 180
gaacgggaaa aaagaggggc ccccaaaaat gtaaccttaa aatttggtgc ttgtgccgct 240
attgatagta agcagcatgg aataggatgt ggt 273
<210> 589
<211> 179
<212> DNA
<213> Homo sapiens
<400> 589
taacagtgca taaatcaatc caaatttaga ccctggcaac cagttcccca ttgctcatct 60
acgggactct gtcaacggta aataggcaat catctctctt gaaaagtata catcctctct 120
cgcactggtg gaaagcaaat tgactttttg tttgctgtat aaaaccctta gcacttcaa 179
<210> 590
<211> 186
<212> DNA
<213> Homo sapiens
<400> 590
ggcaggaccg tgccacacca gctgtccaga gtcggaggac cccagctcct cagcttgcat 60
ggactctgcc ttcccagcgc ttgtcccccg aggaaagcgg ctgggcgggc ggggagctgg 120
gcctggagga tcctggagtc tcattaaatg cctgatttgt gaccatgtcc accagtatct 180
ggggtg 186
<210> 591
<211> 238
<212> DNA
<213> Homo sapiens
<400> 591
ttcggcattc tccaagtcat ctagcccttc atcctcctcc acatcatcaa agtcgtcgcc 60
atcaaaattg tcctcgttgt ctgacatgac accctcgcct cagcgacccc gctgcgcccc 120
ggtcccgcgc ggagacccgc aaacagcgac actacgactc gcgcggctcc tagcttatct 180
tgcgcctcgt gccgaattcg ccacccaggc ctcgctacaa ttacggaccg ttatagta 238
<210> 592
<211> 148
<212> DNA
<213> Homo sapiens
<400> 592
caacctttta gctatgatga cacataacaa aagatgttta tgtactaata gttgaaatct 60
gcctttttct cattcaagaa ggcatacaaa tatctgagag tgactttgtt gtatggctac 120
ccttgtgatc tacagtaatt tattcttt 148
<210> 593
<211> 271
<212> DNA
<213> Homo sapiens
<400> 593
gtgggagaag ttggcgtcct aggctgggga ttggtcgggg gaccttaaag aaaaaggcca 60
gggctgaggg tcctgaggag agagagagag gccacgtgga tggaggactg tcaccccctt 120
ctcggttctg tcaccccctt gagtctaact cactgttgag gggaggaaga agggggatgg 180
acggaaggga gaccgaggaa aggctttcgg gagtggggac attatccacc cagaggtgtg 240
ctacccacaa ccaccgcgag atccttagag t 271
<210> 594
<211> 233
<212> DNA
<213> Homo sapiens
<400> 594
gaactgattt caaggaatgg gtccttccct tcagagccac atgtgtgcgg gacacccaga 60
cagaaaacac aaacacaaag tcgagtggag ggcatttgga aggagcagtg aagccgagcc 120
aggaaatacc aagatggcga gccagtgtgc ttgtagagat tgtagagagg gtagaattga 180
cactgtggac cctggcctcg atagagaaag gcatcagcta aggaagttgt tca 233
<210> 595
<211> 217
<212> DNA
<213> Homo sapiens
<400> 595
gaacattctg gatagcaagc ccactgcaaa caagaagtgc gacctgatca gcatccccaa 60
gaaaaccaca gacacggcca gtgtgcaaaa tgaagccaag ttggatgaga ttttaaaaga 120
gatcaaatct ataaaagaca caatctgcaa tcaagatgag ccgtatttcc aagttagaac 180
aagcagatgg caaagatagc agcctgaagg tcccacc 217
<210> 596
<211> 267
<212> DNA
<213> Homo sapiens
<400> 596
tgataatctc aagactcctc ccttagctac tcaggaggcc gaggcggaaa aaccacccaa 60
acccaagagg tggagggtgg atgaggtgga acaatcaccg aaacccaaga ggcggagggc 120
ggatgaggtg gaacaatcgc ccaagcccaa gaggcagagg gaggccgagg cacaacaatt 180
acccaaaccc aagaggcgga ggttgagtaa gctgagaaca cgccattgca ctcaagcctg 240
ggcaataaga ataaatccgt gggtcga 267
<210> 597
<211> 275
<212> DNA
<213> Homo sapiens
<400> 597
aatttaccaa gccacatatt gggaatggta ccccaggcag aaggagtaga gtaagcaagc 60
cagaaaggaa atactatggt gcttttgagt aactgcagtg tggctgaaga atgtggaaaa 120
tgatgaggat aaagaggtgg acagggaact aggtaaggga gggccttcct tttaaataat 180
tagaccttgt cctgtgtaca tttaatggga ttttaatcag gccataatgc caaatttctt 240
tacttcggaa ggatctttat ggtgatggtt tcaga 275
<210> 598
<211> 35
<212> DNA
<213> Homo sapiens
<400> 598
atttttcttg gcctagttgt gtgccatgga tattt 35
<210> 599
<211> 156
<212> DNA
<213> Homo sapiens
<400> 599
gagggatatt attttccata gccattacca tgatacatat gatactgcct aggtagagct 60
gggactgtag ggtggggaac caatgctgtc ctgcacactg aaactatgaa tgccaagata 120
tcactgccag atccttctgt ggatagctgg cggcat 156
<210> 600
<211> 243
<212> DNA
<213> Homo sapiens
<400> 600
gaagcctgac cccaagtgtg tcttcaccta tgtgcagtcg ctctacaacc acctgcgacg 60
ccacgaactg cgcctgcgcg gcaagaatgt ctagcctgcc cgcccgcatg gccagccagt 120
ggcaagctgc cgcccccact ctccgggcac cgtctcctgc ctgtgcgtcc gcccaccgct 180
gccctgtctg ttgcgacacc ctccccccca catacacacg cagcgttttg ataaattatt 240
ggt 243
<210> 601
<211> 229
<212> DNA
<213> Homo sapiens
<400> 601
gcattattac tgatacttgc acacagtcaa aagcgcagac tggatggatg gtcttttata 60
aggcatttaa gggtacacta ctgtgtttca ctgaccatac atttttctta gcccctcaag 120
taatatagca cagagttatg aatgacaatt cccctaacca ttcctcttca tatctgcctc 180
ttccccttac catcgtaatt ctccaaactg gtcataaagg cactctgtg 229
<210> 602
<211> 93
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (33)..(48)
<223> n is a, c, g, or t
<400> 602
cattaagtcc tctgtaaggt gtcaggcaag ccnnnnnnnn nnnnnnnntg ggtaagtcct 60
aaccccccac aaaggtgttc ccagtgacta cct 93
<210> 603
<211> 273
<212> DNA
<213> Homo sapiens
<400> 603
ttcgctggtt ctgaatgtca tttttcctcc ctggtgtggt tttacatttt cagcttcttt 60
cccttttctt ctctcccacc ctcaaaattc tgccttagca tttgtgtgct taattaaatc 120
cactctgtgc tttatagttg gagaatgtgg acaatacaaa gatttggggt ggggtcatac 180
agtgtataca aaacacagac actatgtgtt tggacaaatt cgcctagcgt gagaatcatc 240
agtagtgagt taaacgtttg aaatcagagc caa 273
<210> 604
<211> 164
<212> DNA
<213> Homo sapiens
<220>
<221> misc_feature
<222> (80)..(98)
<223> n is a, c, g, or t
<400> 604
taattattgc tgtggatttc tctctagcat tttagctcat tccagtaaat gatttttttc 60
tttatgaaat agaactaccn nnnnnnnnnn nnnnnnnngt tcaacaacaa caaactgaag 120
ggggagaaaa atacaccatt accacagcaa caaattagtt tatg 164
<210> 605
<211> 275
<212> DNA
<213> Homo sapiens
<400> 605
ttctcccagt acctcatttg cacaagcctt cctgccattc ttcaaatatg cgaagcctgt 60
tctcacctca aagccattgt acttgctgtt tcctatgcct gaatgttctt cccacagatg 120
ttgacaagac ttgctccttc acttcaatga cattcagata tcttattctc agagagcatt 180
tgacaaccta tctaaaatag ctccccctca ctgttcctgc ccatgctctt tataccccat 240
tttactttca tctttcttcc tagtactgac attat 275
<210> 606
<211> 271
<212> DNA
<213> Homo sapiens
<400> 606
agaactagca aaagccaagg ccctggggcg gggaggagcc tggtatgttc aaggggcaga 60
agggaggctg aagcagagtg atcaagcgga cagggcaggc agagcctcaa atcccagact 120
gaggaacatg gtgaacgagg acacttcggg ggtccacaca taaagacgga gacagagact 180
cagggcagga aagtcacatg ccctgggaca ccccagtaaa cagagccaaa ctcaaacctc 240
agcctgtctg cagctgacat aggatgaagt t 271
<210> 607
<211> 160
<212> DNA
<213> Homo sapiens
<400> 607
taagttatta actgaggctg accagagggg aggacccccc ctttaccacc ccatgcactt 60
tgcgagctgc cccttcttcc cccacatcag agagaaatgc ccccacacca gagccccaag 120
ggtagggctg ccgatcagag ctgtgagtta acacaacagg 160
<210> 608
<211> 155
<212> DNA
<213> Homo sapiens
<400> 608
agcaccagta gtggttgggg ccctcccctc aggctccatt tttaataagt ttttagtatt 60
tttgttaatg tgaggcattg agctgttggg ttttgtatat tatttatata gagaccccag 120
agctgttgca cccaatacac agagcttctt tgcaa 155
<210> 609
<211> 252
<212> DNA
<213> Homo sapiens
<400> 609
tacacacatg tgagtctggc tgggctggta ttttgtttga tcttcctgga aatgagcagt 60
gactaacgct cacataactg gttttttttt ttatctgggc tgatgaatac atttacctaa 120
gaaactcatt tcgttttact taagagggga agtgcagttt tcttttggca gttcagaatc 180
caagcacttg atttgctggg tttggaaaac tccttttttg gccttctatg tgcttagcca 240
taacaattcc at 252
<210> 610
<211> 286
<212> DNA
<213> Homo sapiens
<400> 610
agaggggtca ccatactttt cttcagttcc atgttaactg aacaatcttt ttcttgctaa 60
tctgaacacc ctgtgcaata gagtctgact ccattttttg atgtttgact gcagacatct 120
tttcagccta acccttccat cttctctttc tgtccaacac tggggcaagc tgacaaaaat 180
cctcaggtgc tcctcttctg taaccagcag taagttcgaa tcatacactg ccaccctcac 240
cccaaccctg tcccttaacc acattaaaac ccaaagccag tctcct 286
<210> 611
<211> 80
<212> DNA
<213> Homo sapiens
<400> 611
gggcctgttg aagatgcttg tattttactt ttcccttgta aatgctattc ccatcacagc 60
tgaacttgtt gagatccccg 80
<210> 612
<211> 290
<212> DNA
<213> Homo sapiens
<400> 612
gaggagataa actaacagag gtcaagaaga tgaagagttg tttcaaacat ggtacagttg 60
agattcctag cattattcta gtcagacgtg tctgtcaagt aggccattgg atatcgggat 120
tgggatttga ggggaatcca tagatggaaa tataagttca agaggcatca gcatggatac 180
cctatttgga tctggatgaa attacctaaa ggagaaaatg caggaggacg tgatgctggg 240
tgattttaga ggagaaacca tgaaggattc caaggagcag cagttggtca 290
<210> 613
<211> 117
<212> DNA
<213> Homo sapiens
<400> 613
aaaaattcat cccatatcca gaaagtacca gttataaaga ttgctgacca agcaaagttt 60
tgcatcaaag tgtcacctca ttgctctgac caaagactga ctgttgtggt tttaact 117
<210> 614
<211> 214
<212> DNA
<213> Homo sapiens
<400> 614
acaccagtgt gctacagtgg cgggtggtct gatgcggcca gggaagagtc aggtgtcagg 60
gcaggaattc tattttcggg agatgtctat tgccgagtag agtaatatat acccagagta 120
tgtctatagc agagggggtt atgggggcgg gagggtagac tgacatacag aagtctctat 180
ttatccgggt gggaagaggg agtcacatcg cttt 214
<210> 615
<211> 283
<212> DNA
<213> Homo sapiens
<400> 615
ccagctggag gtgacgaggg atgatgcgcg tcttcttgtt gtcccgagcc gcgttgcccg 60
ccagctccag gatctcggcg gtcagatact cgaggaccgc agccatgtag acgggcgcgc 120
cggcccccac tcgctccgcg tagttgcctt tgcgcagcaa gcgatgcact cgccctaccg 180
ggaactgaag gccagcgcgg gacgagcgcg acttggcctt ggcgcgggcc ttgcctcctt 240
gcttgccacg accagacatg acagcgatag tagtcaccga gag 283
<210> 616
<211> 192
<212> DNA
<213> Homo sapiens
<400> 616
gaactatgat tgcactactg tgctccagct tgggcaacag agtgagatct tgtctccaaa 60
agtccttgaa ggattttagg aagttgttaa aagtcttgaa acgatgtttg ggggcatgtt 120
agggttcttg aatgtttaat tcctctaata actgcttatt caagagaagc atttctgact 180
gggtgcaggg ca 192
<210> 617
<211> 234
<212> DNA
<213> Homo sapiens
<400> 617
atgaactttt gtgcttagtg agtgcaacga aatatttaaa caagttttgt attttttgct 60
tttgtgtttt ggaatttgcc ttatttttct tggatgcgat gttcagaggc tgtttcctgc 120
agcatgtatt tccatggccc acacagctat gtgtttgagc agcgaagagt ctttgagctg 180
aatgagccag agtgataatt tcagtgcaac gaactttctg ctgaattaat ggta 234
<210> 618
<211> 146
<212> DNA
<213> Homo sapiens
<400> 618
ggaggatgaa gaaggttata acgatggaga ggtagatgac gaggaagatg aagaagagct 60
tggtgaagaa gaaaggggtc agaagcgaaa acgagaacct gaagatgagg gagaagatga 120
tgactaagtg gataacctat tttgaa 146
<210> 619
<211> 63
<212> DNA
<213> Homo sapiens
<400> 619
gtgagctgtg atgttgccgc tacactccag gtgacagagc aagaccctaa gaccttatct 60
ctt 63
<210> 620
<211> 149
<212> DNA
<213> Homo sapiens
<400> 620
atcaactgaa tccaatattt cctgtggcaa ataacacttt cctcatttca taccttttct 60
cctctcttcc atgccaacat ttctccaccc acaacgtaca ctttttattt ctccatcaat 120
atttgaaagc gagtgatttg tgaccagga 149
<210> 621
<211> 151
<212> DNA
<213> Homo sapiens
<400> 621
cagcaacccc tgcattcctt ttttttaccg ggctgacgag aatgatgagg tgaagatcac 60
tgtcatctaa aagccggcta ctgtcagcaa agcctgaaga agtggggctg gataccctgc 120
ccccaccata tccctaccat cccttctcag t 151
<210> 622
<211> 258
<212> DNA
<213> Homo sapiens
<400> 622
acaagcagac atgcactctc ttcttctcct ggcacacgcc gctggcctgc gagcaagcga 60
ccgaatgttc cgtgaggaat ggaagctcta ttgttgactt gtctcccctt attcatcgca 120
ctggtggtta tgaggcttat ggtaagagtg aggatgatgc ctccgatacc aaccctgatt 180
tctacatcaa tatttgtcag ccactaaatc ccatgcacgg agtgccctgt cctgccggag 240
ccgctgtgtg caaagttc 258
<210> 623
<211> 278
<212> DNA
<213> Homo sapiens
<400> 623
tctcctcttc agtcttcatc atgtttttgt ccctcaaaca tcagccttac gtcctctttt 60
cttccctctg catcctctct ccttgagaga cctcatccag cccatgtttt caacaatcat 120
ctatacaaca atgatcttct acatacattc ctggcccaga tccctgccct gaattcccag 180
cctatagatc caacaaccct cctccaatac tgtctttccc agccattctc caggcctctg 240
ctatggtctg aatgtttgtg tccaaaaaca tgatgaag 278
<210> 624
<211> 290
<212> DNA
<213> Homo sapiens
<400> 624
aagacagtcc tcagaaaacc caagctttca tacagatgcc aaaaaagtcc atggggttta 60
attctttgac cattttgagt gcagggactt attcatgctt acatcctcac aactcagctt 120
ggggactgcc tcacacctgg cagctgatcc tttttgtttt ttaaatgtaa gaagccacac 180
tgagggctct ccaggcggaa aaagttagga cacaggacca gcatttcttt ccagccactt 240
gtggatccct gattgaatgt cacccttgac tgcctaactc atctctttcc 290
<210> 625
<211> 292
<212> DNA
<213> Homo sapiens
<400> 625
cgactaatca tcttacggca gagaacaaac accaccacca agtaaaaata tccctgcaac 60
aaacacaacg gattccaatt ccttccggcc aacccaatgt tccacggcgt ggacacatac 120
tggttgggcg caggcatcct cgcagtgacg tcccctgtac tcgtggctgc agttgcagtg 180
ataggagccg tgcgtgttct cacagagggc cccgtgcagg caagggtttc cagagcactc 240
gtcgatatca ctctgacacc tttctcccct aaaacccgaa tcacactgac aa 292
<210> 626
<211> 249
<212> DNA
<213> Homo sapiens
<400> 626
actatccagg aaaggaaatt tacagtatat ctcattttgg ggtttggaag gatgtgtaca 60
aaatagtgta attgaaaatt gataaaataa aaaatcttat atacttatat tgggtaaagg 120
aagataggag aagtgacaga gcgagagaga gagagagtgt ttatgtgtga aggaaataag 180
aaagctcagt cttataagaa gtctcagata atgtgtagac tttacagaaa agcagtttaa 240
gaatggtat 249
<210> 627
<211> 262
<212> DNA
<213> Homo sapiens
<400> 627
gtatccaagt ccattgttac taggttggag gctggagatt ctaaatggct tccagaccat 60
ctctctgatt ctctttggga gatggggtct gaaagacaat gtcagtagtt ttgggaaatt 120
ctagaaagtg tgcttggaaa cgtgggaaga gctcttgcct agtgcctaaa tgctccattt 180
gcagctctag ccaagtagat acttggtagg tatagagccg ggtttgcgtt tatattagca 240
aaacctatgt cagagttgaa ga 262
<210> 628
<211> 147
<212> DNA
<213> Homo sapiens
<400> 628
ttctttatgg tggtgggatg attattgtaa tcatacttgg gaacagaagt gatgaaaaag 60
gtatgttact tgagatatgg gaaacgctat tttccatgtt tagttatggg gtattcaagt 120
ctaactagtg gaaagtatgg atacatt 147
<210> 629
<211> 97
<212> DNA
<213> Homo sapiens
<400> 629
tctgtgattc tctttgtcag ctcctttgcc tatatttgca tctcagttga cacccctgat 60
tctgacttgt ccttatcttc ctaccagtct ctgccga 97
<210> 630
<211> 234
<212> DNA
<213> Homo sapiens
<400> 630
gttgtatcaa caatgattaa ctcctttatt atacatacac atgaatgtgc atttttggta 60
aatgcataaa tgagattcta taatgtttac tgatctttat attacagatt ttctcttctt 120
ttaggattag ctcagcttgc cccccctttc catctccacc atctatagtg agcctctcca 180
taattagtgc caaccattag tctcgttcat atttttacac caggagtcaa caaa 234
<210> 631
<211> 115
<212> DNA
<213> Homo sapiens
<400> 631
ccccagccca agagatgaac atctggggac taatatcata gacccatctg gaggctccca 60
tgggctagga gccagtgtga ggctgtaact tatactaaag gttgtgttgc ctgct 115
<210> 632
<211> 56
<212> DNA
<213> Homo sapiens
<400> 632
gaagactaaa cagaaaccag aactgaaaca ttcacctggt agcaaatgac actttg 56
<210> 633
<211> 251
<212> DNA
<213> Homo sapiens
<400> 633
ttctcgcccc acctagggac agattccccc tgctcttttt gtcctagaaa ccccgctagt 60
ttgggatggt agcgtctggg gtggggaggg cttccccttc cccactcgag ggtgcgggtg 120
gggaaggggg ggtgggtgga gacagccctg gggcagggag gatggtctct ccactgtaga 180
aagtagagta ggattgtggt cagacttaat ttgaggcatc tagtgaagac acgtacaaat 240
ccaccaagga a 251
<210> 634
<211> 294
<212> DNA
<213> Homo sapiens
<400> 634
gctggtcatc tcaatggcag gtggtagggt actcagaagg gtggttgact ccgtgagagg 60
ggaagaggtg gaccgagagg tctgaggggt tgaggactca ggcggaggat tggatgtggt 120
caactcagca atcggtgctg tgcttgtgtg ggtggggggc cccgtgcttc cagtggtggg 180
tgttggggtt ggggtcaccg tagtggtggt gctgatgggt atcatggttg gggtctgtgt 240
gccggtgggt gttggggttg cggtcaccga tagttgtggt ggtgatgggt gtca 294
<210> 635
<211> 221
<212> DNA
<213> Homo sapiens
<400> 635
tttgaaaaat gtttacagct ccacaaagat agacaaattt ccttgatgta tgaaaaatgt 60
caacaaacca ataaaaagac taacaattca gtagaaaaat ggacaaagaa caaatatgga 120
gattcataga aatgagagat aaatgtcatg atgagaaggt gaggtgctca cttgatttat 180
aagagaaatg aaaattaaaa ctacaccaga tgccattttt t 221
<210> 636
<211> 279
<212> DNA
<213> Homo sapiens
<400> 636
cgcggcgatt cttgaggtcg atgtcgcgga tagcgccgta tttgtagaac acgtcctcaa 60
tgtccttggt tcggatgtct ggaggtaagt tacccacgta gatgcggcaa tcgttgttcc 120
ctgcggggcc acgaatcaca ccacctcccg acatggcggt gacgaaaagc gcggactcga 180
gaacaggcct tcccaccaag cctagcgcac ggcagagcga gcccgcagcg gcaccacgtc 240
tcccgcggcc cctccaaaat ggcgccttta tcagctcgg 279
Claims (67)
- 대상체로부터 수득되는 샘플에서 결장암을 진단하는 방법으로서,
대상체로부터 수득되는 핵산을 포함하는 샘플에서의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계: 및
상기 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유도된 결정 점수를 결장암의 진단을 나타내는 대조군 임계값과 비교하는 단계를 포함하되,
임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도된 결정 점수가 결장암의 진단을 나타내며, 이에 의해, 상기 대상체로부터 수득되는 샘플에서 결장암을 진단하는 것을 특징으로 하는 샘플에서의 결장암의 진단 방법. - 제1항에 있어서, 상기 대조군 임계값이 공지되어 있는 결장암 샘플(들)에서의 표 6에 열거된 결장암-관련 핵산 분자로부터의 해당하는 전사체 유래의 임계값을 포함하며, 공지되어 있는 결장암 그룹으로서 임계값의 동일한 측상의 발현 수준 또는 그로부터 유래된 결정 점수가 결장암의 진단을 나타내는 것을 특징으로 하는 샘플에서의 결장암의 진단 방법.
- 결장암 샘플을 분류하는 방법으로서,
대상체로부터 수득되는 핵산을 포함하는 샘플에서의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계: 및
상기 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유도된 결정 점수를 공지되어 있는 분류를 나타내는 대조군 임계값과 비교하는 단계를 포함하되,
임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도된 결정 점수가 결장암 샘플의 분류를 가능하게 하는 것을 특징으로 하는 결장암 샘플의 분류 방법. - 제3항에 있어서, 상기 대조군 임계값이 공지되어 있는 분류의 결장암 샘플(들)에서의 표 6에 열거된 결장암-관련 핵산 분자로부터의 해당하는 전사체 유래의 임계값을 포함하며, 공지되어 있는 분류의 결장암 샘플(들)로서 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유래된 결정 점수가 결장암 샘플의 분류를 가능하게 하는 것을 특징으로 하는 결장암 샘플에서의 결장암의 진단 방법.
- 제3항 또는 제4항에 있어서, 상기 결장암 샘플이, I기, II기, III기 및 IV기로 분류되는 것을 특징으로 하는 결장암 샘플에서의 결장암의 진단 방법.
- 제3항 내지 제5항 중 어느 한 항에 있어서, 상기 분류된 결장암에 효과적일 치료 계획을 선택하는 단계를 추가로 포함하는 것을 특징으로 하는 결장암 샘플에서의 결장암의 진단 방법.
- 제6항에 있어서, 상기 치료가 외과적 절제술, 화학요법, 방사선 또는 그들의 임의의 조합인 것을 특징으로 하는 결장암 샘플에서의 결장암의 진단 방법.
- 결장암을 위한 치료에 대한 반응을 예측하는 방법으로서,
대상체로부터 수득되는 핵산을 포함하는 샘플에서의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계: 및
상기 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유도된 결정 점수를 공지되어 있는 치료에 대한 반응을 나타내는 대조군 임계값과 비교하는 단계를 포함하되,
임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도된 결정 점수가 치료에 대한 유사한 반응을 나타내며, 이에 의해, 치료에 대한 반응을 예측하는 것을 특징으로 하는 결장암을 위한 치료에 대한 반응의 예측 방법. - 제8항에 있어서, 상기 대조군 임계값이 공지되어 있는 치료에 대한 반응을 갖는 결장암 샘플(들)에서의 표 6에 열거된 결장암-관련 핵산 분자로부터의 해당하는 전사체 유래의 임계값을 포함하며, 공지되어 있는 치료에 대한 반응을 갖는 결장암 샘플(들)로서 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유래된 결정 점수가 치료에 대한 유사한 반응을 나타내며, 이에 의해 치료에 대한 반응을 예측하는 것을 특징으로 하는 결장암을 위한 치료에 대한 반응의 예측 방법.
- 제8항 또는 제9항에 있어서, 상기 치료가 외과적 절제술인 것을 특징으로 하는 결장암을 위한 치료에 대한 반응의 예측 방법.
- 제8항 내지 제10항 중 어느 한 항에 있어서, 상기 치료가 화학요법 및/또는 방사선인 것을 특징으로 하는 결장암을 위한 치료에 대한 반응의 예측 방법.
- 결장암 대상체의 장기간 생존을 예측하는 방법으로서,
대상체로부터 수득되는 핵산을 포함하는 샘플에서의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계: 및
상기 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유도된 결정 점수를 장기간 생존의 이력을 갖는 것을 나타내는 대조군 임계값과 비교하는 단계를 포함하되,
임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도된 결정 점수가 대상체의 장기간 생존을 나타내며, 이에 의해, 대상체의 장기간 생존을 예측하는 것을 특징으로 하는 결장암 대상체의 장기간 생존의 예측 방법. - 제12항에 있어서, 상기 대조군 임계값이 장기간 생존의 이력을 갖는 대상체(들)로부터 수득되는 결장암 샘플(들)에서의 표 6에 열거된 결장암-관련 핵산 분자로부터의 해당하는 전사체 유래의 임계값을 포함하며, 장기간 생존의 이력을 갖는 대상체(들)로부터 수득된 결장암 샘플(들)로서 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유래된 결정 점수가 상기 대상체의 장기간 생존을 나타내며, 이에 의해, 대상체의 장기간 생존을 예측하는 것을 특징으로 하는 결장암 대상체의 장기간 생존의 예측 방법.
- 제13항에 있어서, 상기 장기간 생존은 적어도 5년의 생존을 포함하는 것을 특징으로 하는 결장암 대상체의 장기간 생존의 예측 방법.
- 대상체에서의 결장암 재발을 예측하는 방법으로서,
대상체로부터 수득되는 핵산을 포함하는 샘플에서의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계: 및
상기 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유도된 결정 점수를 재발의 이력을 나타내는 대조군 임계값과 비교하는 단계를 포함하되,
임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도된 결정 점수가 대상체에서의 재발을 나타내는 것을 특징으로 하는 대상체에서의 결장암 재발의 예측 방법. - 제15항에 있어서, 상기 대조군 임계값이 재발의 이력을 갖는 결장암 샘플(들)에서의 표 6에 열거된 결장암-관련 핵산 분자로부터의 해당하는 전사체 유래의 임계값을 포함하며, 재발의 이력이 공지되어 있는 결장암 샘플(들)로서 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유래된 결정 점수가 상기 대상체에서의 재발을 나타내는 것을 특징으로 하는 대상체에서의 결장암 재발의 예측 방법.
- 대상체에 대한 맞춤형(personalized) 결장암 유전체학 프로파일을 제조하는 방법으로서,
대상체로부터 수득되는 핵산을 포함하는 샘플에서의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계: 및
유전자 발현 분석에 의해 수득되는 데이터를 요약하는 리포트(report)를 생성하는 단계를 포함하는 것을 특징으로 하는 대상체에 대한 맞춤형 결장암 유전체학 프로파일의 제조 방법. - 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 대상체로부터 수득되는 핵산은 상기 대상체로부터 수득되는 대장 조직의 샘플로부터 추출된 RNA 및/또는 RNA로부터 전사되는 cDNA를 포함하는 것을 특징으로 하는 대상체에 대한 맞춤형 결장암 유전체학 프로파일의 제조 방법.
- 제18항에 있어서, 상기 샘플은 생검 샘플인 것을 특징으로 하는 대상체에 대한 맞춤형 결장암 유전체학 프로파일의 제조 방법.
- 제18항 또는 제19항에 있어서, 상기 샘플은 고정된 및/또는 파라핀 포매된(embedded) 샘플인 것을 특징으로 하는 대상체에 대한 맞춤형 결장암 유전체학 프로파일의 제조 방법.
- 제1항 내지 제20항 중 어느 한 항에 있어서, 상기 발현 수준은 대조군 유전자(들)에 대해 정규화되는 것을 특징으로 하는 방법.
- 제1항 내지 제21항 중 어느 한 항에 있어서, 상기 발현 수준은 PCR 및/또는 마이크로어레이-기반의 방법으로 결정되는 것을 특징으로 하는 방법.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계는 MUM1 및 SIGMAR1 전사체에 대한 발현 수준을 검출하는 것을 포함하는 것을 특징으로 하는 방법.
- 제1항 내지 제23항 중 어느 한 항에 있어서, 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계는 MUM1, SIGMAR1, ARSD, SULT1C2 및 PPFIBP1 전사체에 대한 발현 수준을 검출하는 것을 포함하는 것을 특징으로 하는 방법.
- 제1항 내지 제24항 중 어느 한 항에 있어서, 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계는 ARSD, CXCL9, PCLO, SLC2A3, FCGBP, SLC2A14, SLC2A3, BCL9L, 및 MUC3A, OLFM4 및 RNF39 전사체에 대한 안티센스 서열에 대한 발현 수준을 검출하는 것을 포함하는 것을 특징으로 하는 방법.
- 제1항 내지 제25항 중 어느 한 항에 있어서, 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계는 표 1에 열거된 전사체에 대한 발현 수준을 검출하는 것을 포함하는 것을 특징으로 하는 방법.
- 제1항 내지 제26항 중 어느 한 항에 있어서, 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계가 표 2에 열거된 전사체에 대한 발현 수준을 검출하는 것을 포함하는 것을 특징으로 하는 방법.
- 서열 번호 1 내지 636에 기재된 핵산 서열 또는 그의 상보체 중 하나에 특이적으로 혼성화할 수 있는, 길이가 20 내지 40개 뉴클레오타이드인 핵산 분자를 포함하거나, 실질적으로 그로 이루어진 결장암에 대한 유전자 발현 시그니처(signature)의 검출을 위한 핵산 프로브.
- 제28항에 있어서, 상기 프로브는 표지되는 것을 특징으로 하는 핵산 프로브.
- 제29항에 있어서, 상기 프로브는 방사성 표지되거나, 형광 표지되거나, 비오틴 표지되거나, 효소에 의해 표지되거나, 화학적으로 표지되는 것을 특징으로 하는 핵산 프로브.
- 프로브 세트로서, 2개 이상의 프로브를 포함하되, 각 프로브가 서열 번호 1 내지 636에 기재된 핵산 서열 또는 그의 상보체 중 하나에 특이적으로 혼성화할 수 있는, 길이가 20 내지 40개 뉴클레오타이드인 핵산 분자를 포함하거나, 실질적으로 그로 이루어진, 결장암에 대한 유전자 발현 시그니처의 검출을 위한 프로브 세트.
- 제31항에 있어서, 상기 프로브는 표지되는 것을 특징으로 하는 프로브 세트.
- 제32항에 있어서, 방사성 표지되거나, 형광 표지되거나, 비오틴 표지되거나, 효소에 의해 표지되거나, 화학적으로 표지되는 것을 특징으로 하는 프로브 세트.
- 제31항 내지 제33항 중 어느 한 항에 있어서, 상기 세트는 표 6에 열거된 각 전사체에 상보적인 적어도 하나의 프로브를 함유하는 것을 특징으로 하는 프로브 세트.
- 제34항에 있어서, 표 6에 열거된 전사체의 서브세트(subset)에서 각 전사체에 상보적인 적어도 하나의 프로브를 포함하는 프로브 세트로서, 상기 서브세트가 표 6의 전사체의 적어도 1%, 5%, 10%, 25%, 50%, 75% 또는 95%를 포함하는 것을 특징으로 하는 프로브 세트.
- 제31항 내지 제35항 중 어느 한 항의 프로브의 세트를 포함하는 핵산 어레이를 포함하는, 결장암에 대한 유전자 발현 시그니처의 검출을 위한 디바이스(device).
- 결장암 핵산에 대한 유전자 발현 시그니처의 증폭을 위한 프라이머의 쌍으로서,
서열 번호 1 내지 636으로 기재된 핵산 서열 또는 그의 상보체 중 임의의 것에 특이적으로 혼성화되는 핵산 서열을 포함하는, 길이가 15 내지 40개 뉴클레오타이드인 정방향 프라이머: 및
서열 번호 1 내지 636으로 기재된 핵산 서열 또는 그의 상보체 중 임의의 것에 특이적으로 혼성화되는 핵산 서열을 포함하는 길이가 15 내지 40개 뉴클레오타이드인 역방향 프라이머를 포함하되,
프라이머 세트가 핵산의 증폭을 유도할 수 있는 것을 특징으로 하는 프라이머의 쌍. - 결장암 핵산에 대한 유전자 발현 시그니처의 증폭을 위한 프라이머 쌍의 세트로서, 서열 번호 1 내지 636으로 기재된 핵산 서열 중 임의의 것의 증폭에 사용하기에 적절한 적어도 2개의 프라이머 쌍을 포함하는 것을 특징으로 하는 프라이머 쌍의 세트.
- 제38항에 있어서, 상기 프라이머 쌍의 세트는 서열 번호 1 내지 636에 기재된 핵산 서열의 서브세트의 증폭에 사용하기에 적절한 프라이머 쌍을 포함하며, 상기 서브세트가 서열 번호 1 내지 636으로 기재된 핵산 서열의 적어도 1%, 5%, 10%, 25%, 50%, 75% 또는 95%를 포함하는 것을 특징으로하는 프라이머 쌍의 세트.
- 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법으로서, 결장암 시료로부터 단리된 RNA를 포함하는 샘플에서 1000개 미만의 전사체의 발현 수준을 검출하는 단계로서, 표 6에 열거된 적어도 50개의 전사체가 검출되는 단계를 포함하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
- 제40항에 있어서, 400개 내지 800개 전사체 발현 수준이 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
- 제40항 또는 제41항에 있어서, 500개 내지 700개 전사체 발현 수준이 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
- 제40항 내지 제42항 중 어느 한 항에 있어서, 표 6으로부터의 적어도 100개의 전사체가 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
- 제40항 내지 제43항 중 어느 한 항에 있어서, 표 6으로부터의 적어도 200개의 전사체가 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
- 제40항 내지 제44항 중 어느 한 항에 있어서, 표 6으로부터의 적어도 300개의 전사체가 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
- 제40항 내지 제45항 중 어느 한 항에 있어서, 표 6으로부터의 적어도 400개의 전사체가 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
- 제40항 내지 제46항 중 어느 한 항에 있어서, 표 6으로부터의 적어도 500개의 전사체가 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
- 제40항 내지 제47항 중 어느 한 항에 있어서, 표 6으로부터의 적어도 600개의 전사체가 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
- 제40항 내지 제48항 중 어느 한 항에 있어서, 표 6에 열거된 모든 전사체가 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
- 제40항 내지 제49항 중 어느 한 항에 있어서, 표 6에 열거된 전사체가 표 1에 열거된 전사체를 포함하는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
- 제40항 내지 제50항 중 어느 한 항에 있어서, 상기 결장암 시료는 포르말린 고정된 파라핀-포매 조직 샘플인 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
- 제40항 내지 제51항 중 어느 한 항에 있어서, 표 6에 열거된 전사체의 발현 수준 또는 그로부터 유도된 결정 점수를 고위험 및 저위험 환자 집단에 대한 해당하는 수준 또는 점수에 대하여 점수화하는 단계를 추가로 포함하는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
- 제52항에 있어서, 환자가 고위험 그룹에 있는 것으로 결정된 경우, 보조 화학요법을 선택하는 단계를 추가로 포함하는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
- 결장암의 예후 방법으로서,
단리된 RNA를 포함하는 결장암 시료에 대한 유전자 발현 프로파일을 제조하는 단계: 및
저위험 또는 고위험 그룹에서 표 6에 열거된 적어도 50개의 전사체의 발현 수준 또는 그로부터 유도된 결정 점수에 기초하여 상기 시료를 분류하는 단계를 포함하는 것을 특징으로 하는 결장암의 예후 방법. - 제54항에 있어서, 1000개 미만의 전사체의 수준이 상기 유전자 발현 프로파일에서 검출되는 것을 특징으로 하는 결장암의 예후 방법.
- 제54항 또는 제55항에 있어서, 800개 미만의 전사체의 수준이 상기 유전자 발현 프로파일에서 검출되는 것을 특징으로 하는 결장암의 예후 방법.
- 제54항 내지 제56항 중 어느 한 항에 있어서, 700개 미만의 전사체의 수준이 상기 유전자 발현 프로파일에서 검출되는 것을 특징으로 하는 결장암의 예후 방법.
- 제54항 내지 제57항 중 어느 한 항에 있어서, 상기 시료가 표 6으로부터의 적어도 100개의 전사체의 발현 수준에 기초하여 분류되는 것을 특징으로 하는 결장암의 예후 방법.
- 제54항 내지 제58항 중 어느 한 항에 있어서, 상기 시료가 표 6으로부터의 적어도 200개의 전사체의 발현 수준에 기초하여 분류되는 것을 특징으로 하는 결장암의 예후 방법.
- 제54항 내지 제59항 중 어느 한 항에 있어서, 상기 시료가 표 6으로부터의 적어도 300개의 전사체의 발현 수준에 기초하여 분류되는 것을 특징으로 하는 결장암의 예후 방법.
- 제54항 내지 제60항 중 어느 한 항에 있어서, 상기 시료가 표 6으로부터의 적어도 400개의 전사체의 발현 수준에 기초하여 분류되는 것을 특징으로 하는 결장암의 예후 방법.
- 제54항 내지 제61항 중 어느 한 항에 있어서, 상기 시료가 표 6으로부터의 적어도 500개의 전사체의 발현 수준에 기초하여 분류되는 것을 특징으로 하는 결장암의 예후 방법.
- 제54항 내지 제62항 중 어느 한 항에 있어서, 상기 시료가 표 6으로부터의 적어도 600개의 전사체의 발현 수준에 기초하여 분류되는 것을 특징으로 하는 결장암의 예후 방법.
- 제54항 내지 제63항 중 어느 한 항에 있어서, 표 6에 열거된 모든 전사체의 발현 수준을 사용하여 상기 시료를 분류하는 것을 특징으로 하는 결장암의 예후 방법.
- 제54항 내지 제64항 중 어느 한 항에 있어서, 표 6에 열거된 전사체가 표 1에 열거된 전사체를 포함하는 것을 특징으로 하는 결장암의 예후 방법.
- 제54항 내지 제65항 중 어느 한 항에 있어서, 상기 결장암 시료가 포르말린 고정된 파라핀-포매 조직 샘플인 것을 특징으로 하는 결장암의 예후 방법.
- 제54항 내지 제66항 중 어느 한 항에 있어서, 환자가 고위험 그룹에 있는 것으로 결정되는 경우 보조 화학요법을 선택하는 단계를 추가로 포함하는 것을 특징으로 하는 결장암의 예후 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161435922P | 2011-01-25 | 2011-01-25 | |
US61/435,922 | 2011-01-25 | ||
PCT/US2012/022594 WO2012103250A2 (en) | 2011-01-25 | 2012-01-25 | Colon cancer gene expression signatures and methods of use |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20140006898A true KR20140006898A (ko) | 2014-01-16 |
Family
ID=46581385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137021973A KR20140006898A (ko) | 2011-01-25 | 2012-01-25 | 결장암 유전자 발현 시그니처 및 이용 방법 |
Country Status (14)
Country | Link |
---|---|
US (1) | US10196691B2 (ko) |
EP (1) | EP2668296B1 (ko) |
JP (1) | JP2014509189A (ko) |
KR (1) | KR20140006898A (ko) |
CN (1) | CN103403543B9 (ko) |
AU (1) | AU2012209074A1 (ko) |
BR (1) | BR112013018924A2 (ko) |
CA (1) | CA2825218A1 (ko) |
EA (1) | EA201391074A1 (ko) |
IL (1) | IL227643A0 (ko) |
MX (1) | MX2013008367A (ko) |
SG (1) | SG192108A1 (ko) |
WO (1) | WO2012103250A2 (ko) |
ZA (1) | ZA201305024B (ko) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190300945A1 (en) | 2010-04-05 | 2019-10-03 | Prognosys Biosciences, Inc. | Spatially Encoded Biological Assays |
JP5893607B2 (ja) | 2010-04-05 | 2016-03-23 | プログノシス バイオサイエンシズ インコーポレイテッドPrognosys Biosciences,Inc. | 空間コード化生物学的アッセイ |
US10787701B2 (en) | 2010-04-05 | 2020-09-29 | Prognosys Biosciences, Inc. | Spatially encoded biological assays |
GB201106254D0 (en) | 2011-04-13 | 2011-05-25 | Frisen Jonas | Method and product |
US20130074201A1 (en) * | 2011-09-16 | 2013-03-21 | The Johns Hopkins University | Cancer-specific genetic rearrangements |
WO2014210223A1 (en) | 2013-06-25 | 2014-12-31 | Prognosys Biosciences, Inc. | Spatially encoded biological assays using a microfluidic device |
US9652722B1 (en) * | 2013-12-05 | 2017-05-16 | The Mathworks, Inc. | Methods and systems for robust supervised machine learning |
EP3108254B8 (en) * | 2014-02-17 | 2019-06-12 | Ventana Medical Systems, Inc. | G-alpha, interacting vesicle associated protein (giv) as a predictive marker in stage ii colorectal cancer |
EP3129509B1 (en) * | 2014-04-10 | 2020-06-17 | Bio-Marcare Technologies Ltd. | Methods and kits for identifying pre-cancerous colorectal polyps and colorectal cancer |
ES2935860T3 (es) | 2015-04-10 | 2023-03-13 | Spatial Transcriptomics Ab | Análisis de ácidos nucleicos múltiplex, espacialmente distinguidos de especímenes biológicos |
CN108020672A (zh) * | 2016-11-03 | 2018-05-11 | 中国医学科学院基础医学研究所 | 检测rhbdd1蛋白的elisa方法及试剂盒 |
WO2018107023A1 (en) * | 2016-12-08 | 2018-06-14 | Dana-Farber Cancer Institute, Inc. | Metabolic profiling of fixed samples |
CN107158388B (zh) * | 2017-07-11 | 2021-03-23 | 上海市第一人民医院 | MIIP pS303阻断剂在制备抗肿瘤药物中的应用 |
ES2917629T3 (es) * | 2018-01-22 | 2022-07-11 | Liquid Biopsy Res Llc | Métodos para la detección del cáncer de colon y monitorización del tratamiento |
CA3096391A1 (en) * | 2018-04-12 | 2019-10-17 | Board Of Regents, The University Of Texas System | Biomarker for detecting cancer |
JP2020028278A (ja) * | 2018-08-24 | 2020-02-27 | 国立大学法人九州大学 | 被検体に生じるイベントを予測するための判別器の生成方法、及び前記判別器を用いた被検体の層別化方法 |
CN111321220A (zh) * | 2018-12-14 | 2020-06-23 | 中国医学科学院肿瘤医院 | 用于检测直肠癌放化疗敏感性的组合物、微阵列和计算机系统 |
CN110079607B (zh) * | 2019-04-04 | 2022-08-02 | 陕西师范大学 | 一种引物组、检测血液样品种属的方法及应用 |
WO2020243579A1 (en) | 2019-05-30 | 2020-12-03 | 10X Genomics, Inc. | Methods of detecting spatial heterogeneity of a biological sample |
CN116249785A (zh) | 2020-06-02 | 2023-06-09 | 10X基因组学有限公司 | 用于抗原-受体的空间转录组学 |
EP4025692A2 (en) | 2020-06-02 | 2022-07-13 | 10X Genomics, Inc. | Nucleic acid library methods |
EP4162074B1 (en) | 2020-06-08 | 2024-04-24 | 10X Genomics, Inc. | Methods of determining a surgical margin and methods of use thereof |
CN111951883A (zh) * | 2020-08-04 | 2020-11-17 | 广东省第二人民医院(广东省卫生应急医院) | 一种特征mRNA表达谱组合及结肠癌早期预测方法 |
CN115786518A (zh) * | 2022-11-29 | 2023-03-14 | 广东医科大学附属医院 | 嗅素结构域家族蛋白4(olfm4)在结肠癌检测产品中的应用 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2548112B2 (ja) | 1983-09-02 | 1996-10-30 | シンジェン,インコーポレイテッド | 担体およびオリゴヌクレオチドの合成 |
AU622426B2 (en) | 1987-12-11 | 1992-04-09 | Abbott Laboratories | Assay using template-dependent nucleic acid probe reorganization |
GB8810400D0 (en) | 1988-05-03 | 1988-06-08 | Southern E | Analysing polynucleotide sequences |
ATE138106T1 (de) | 1988-07-20 | 1996-06-15 | David Segev | Verfahren zur amplifizierung und zum nachweis von nukleinsäuresequenzen |
US5219727A (en) | 1989-08-21 | 1993-06-15 | Hoffmann-Laroche Inc. | Quantitation of nucleic acids using the polymerase chain reaction |
US5427930A (en) | 1990-01-26 | 1995-06-27 | Abbott Laboratories | Amplification of target nucleic acids using gap filling ligase chain reaction |
US5554501A (en) | 1992-10-29 | 1996-09-10 | Beckman Instruments, Inc. | Biopolymer synthesis using surface activated biaxially oriented polypropylene |
US5538848A (en) | 1994-11-16 | 1996-07-23 | Applied Biosystems Division, Perkin-Elmer Corp. | Method for detecting nucleic acid amplification using self-quenching fluorescence probe |
US5648211A (en) | 1994-04-18 | 1997-07-15 | Becton, Dickinson And Company | Strand displacement amplification using thermophilic enzymes |
AU2360195A (en) | 1994-05-05 | 1995-11-29 | Beckman Instruments, Inc. | Oligonucleotide repeat arrays |
EP0776376B1 (en) | 1994-07-15 | 2001-11-21 | Akzo Nobel N.V. | Use of rna polymerase to improve nucleic acid amplification process |
AT402203B (de) | 1995-06-13 | 1997-03-25 | Himmler Gottfried Dipl Ing Dr | Verfahren zur transkriptionsfreien amplifizierung von nucleinsäuren |
US5716784A (en) | 1996-02-05 | 1998-02-10 | The Perkin-Elmer Corporation | Fluorescence detection assay for homogeneous PCR hybridization systems |
CA2255774C (en) | 1996-05-29 | 2008-03-18 | Cornell Research Foundation, Inc. | Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions |
US5985567A (en) | 1997-08-15 | 1999-11-16 | Beckman Coulter, Inc. | Hybridization detection by pretreating bound single-stranded probes |
US6013789A (en) | 1998-02-20 | 2000-01-11 | Beckman Coulter, Inc. | Covalent attachment of biomolecules to derivatized polypropylene supports |
US20010055596A1 (en) | 2000-03-24 | 2001-12-27 | Meagher Madeleine Joy | Compositions and methods for therapy and diagnosis of colon cancer |
JP2005523688A (ja) | 2002-01-18 | 2005-08-11 | ブリストル−マイヤーズ スクイブ カンパニー | タンパク質チロシンキナーゼおよび/またはタンパク質チロシンキナーゼ経路と相互作用する化合物の活性を予測するためのポリヌクレオチドおよびポリペプチドの同定 |
JP2006507841A (ja) | 2002-11-14 | 2006-03-09 | ダーマコン, インコーポレイテッド | 機能的siRNAおよび超機能的siRNA |
US7250496B2 (en) * | 2002-11-14 | 2007-07-31 | Rosetta Genomics Ltd. | Bioinformatically detectable group of novel regulatory genes and uses thereof |
WO2004066941A2 (en) | 2003-01-24 | 2004-08-12 | Bayer Pharmaceuticals Corporation | Expression profiles for colon cancer and methods of use |
US20050287544A1 (en) * | 2003-12-01 | 2005-12-29 | Francois Bertucci | Gene expression profiling of colon cancer with DNA arrays |
KR20070052694A (ko) * | 2004-01-09 | 2007-05-22 | 더 리젠트스 오브 더 유니이버시티 오브 캘리포니아 | 유전자 발현을 위한 세포-유형-특이적 패턴 |
US20060195266A1 (en) | 2005-02-25 | 2006-08-31 | Yeatman Timothy J | Methods for predicting cancer outcome and gene signatures for use therein |
WO2005083128A2 (en) | 2004-02-25 | 2005-09-09 | University Of South Florida | Methods for predicting cancer outcome and gene signatures for use therein |
CA2569079A1 (en) * | 2004-06-03 | 2005-12-15 | The Johns Hopkins University | Methods of screening for cell proliferation or neoplastic disorders |
JP2008518610A (ja) | 2004-11-03 | 2008-06-05 | アルマック ダイアグノスティックス リミテッド | トランスクリプトームマイクロアレイ技法およびそれを使用する方法 |
EP2319941A3 (en) * | 2005-10-21 | 2011-08-17 | GeneNews Inc. | Method and apparatus for correlating levels of biomarker products with disease |
ES2491222T3 (es) * | 2006-01-11 | 2014-09-05 | Genomic Health, Inc. | Marcadores de expresión génica para el pronóstico de cáncer colorrectal |
WO2007112330A2 (en) | 2006-03-24 | 2007-10-04 | Diadexus, Inc. | Compositions and methods for detection, prognosis and treatment of colon cancer |
WO2008093323A2 (en) * | 2007-01-29 | 2008-08-07 | Compugen Ltd. | Novel nucleotide and amino acid sequences, and methods of use thereof for diagnosis |
NZ562237A (en) * | 2007-10-05 | 2011-02-25 | Pacific Edge Biotechnology Ltd | Proliferation signature and prognosis for gastrointestinal cancer |
EP2285979B2 (en) | 2008-05-27 | 2020-02-19 | Dako Denmark A/S | Hybridization compositions and methods |
WO2010060055A1 (en) | 2008-11-21 | 2010-05-27 | Duke University | Predicting cancer risk and treatment success |
-
2012
- 2012-01-25 AU AU2012209074A patent/AU2012209074A1/en not_active Abandoned
- 2012-01-25 CA CA2825218A patent/CA2825218A1/en not_active Abandoned
- 2012-01-25 SG SG2013056254A patent/SG192108A1/en unknown
- 2012-01-25 JP JP2013551314A patent/JP2014509189A/ja active Pending
- 2012-01-25 EP EP12739742.0A patent/EP2668296B1/en not_active Not-in-force
- 2012-01-25 EA EA201391074A patent/EA201391074A1/ru unknown
- 2012-01-25 BR BR112013018924A patent/BR112013018924A2/pt not_active IP Right Cessation
- 2012-01-25 WO PCT/US2012/022594 patent/WO2012103250A2/en active Application Filing
- 2012-01-25 MX MX2013008367A patent/MX2013008367A/es unknown
- 2012-01-25 US US13/981,601 patent/US10196691B2/en not_active Expired - Fee Related
- 2012-01-25 KR KR1020137021973A patent/KR20140006898A/ko not_active Application Discontinuation
- 2012-01-25 CN CN201280010123.2A patent/CN103403543B9/zh not_active Expired - Fee Related
-
2013
- 2013-07-04 ZA ZA2013/05024A patent/ZA201305024B/en unknown
- 2013-07-24 IL IL227643A patent/IL227643A0/en unknown
Also Published As
Publication number | Publication date |
---|---|
EP2668296B1 (en) | 2018-08-15 |
CN103403543A (zh) | 2013-11-20 |
AU2012209074A1 (en) | 2013-07-11 |
EP2668296A4 (en) | 2015-09-02 |
MX2013008367A (es) | 2013-08-12 |
JP2014509189A (ja) | 2014-04-17 |
CN103403543B9 (zh) | 2017-05-17 |
CN103403543B (zh) | 2016-11-09 |
US20140094379A1 (en) | 2014-04-03 |
WO2012103250A3 (en) | 2012-10-11 |
SG192108A1 (en) | 2013-08-30 |
WO2012103250A2 (en) | 2012-08-02 |
IL227643A0 (en) | 2013-09-30 |
EA201391074A1 (ru) | 2013-12-30 |
CA2825218A1 (en) | 2012-08-02 |
EP2668296A2 (en) | 2013-12-04 |
NZ612471A (en) | 2015-11-27 |
BR112013018924A2 (pt) | 2018-05-08 |
ZA201305024B (en) | 2014-03-26 |
US10196691B2 (en) | 2019-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20140006898A (ko) | 결장암 유전자 발현 시그니처 및 이용 방법 | |
AU2019201577B2 (en) | Cancer diagnostics using biomarkers | |
CN109790583B (zh) | 对肺腺癌亚型分型的方法 | |
US10889865B2 (en) | Thyroid tumors identified | |
DK2681333T3 (en) | EVALUATION OF RESPONSE TO GASTROENTEROPANCREATIC NEUROENDOCRINE NEOPLASIS (GEP-NENE) THERAPY | |
RU2721916C2 (ru) | Способы прогнозирования рака предстательной железы | |
CN109863251B (zh) | 对肺鳞状细胞癌亚型分型的方法 | |
DK2644712T3 (en) | A method for diagnosing neoplasms | |
KR20140044341A (ko) | 암에 대한 분자적 진단 검사 | |
KR20150090246A (ko) | 암을 위한 분자 진단 테스트 | |
KR20160052729A (ko) | 폐암에 대한 분자적 진단 검사 | |
AU2018210695A1 (en) | Molecular subtyping, prognosis, and treatment of bladder cancer | |
KR20160117606A (ko) | 항-혈관형성 약물에 대한 반응 및 암의 예후를 예측하기 위한 분자적 진단 시험 | |
CN101258249A (zh) | 检测黑素瘤的方法和试剂 | |
KR20110057188A (ko) | 바이오마커 프로파일 측정 시스템 및 방법 | |
CN101573453A (zh) | 使用生物学途径基因表达分析来预测淋巴结阴性原发性乳腺癌的远处转移的方法 | |
AU2020201779B2 (en) | Method for using gene expression to determine prognosis of prostate cancer | |
KR20190026769A (ko) | 유전자 발현 프로파일을 사용하여 폐암을 진단하기 위한 조성물 및 방법 | |
CN101111768A (zh) | 肺癌预后 | |
CN111742061A (zh) | 基于pde4d7表达和术前临床变量的术前风险分层 | |
AU2004205270B2 (en) | Colorectal cancer prognostics | |
US20030175761A1 (en) | Identification of genes whose expression patterns distinguish benign lymphoid tissue and mantle cell, follicular, and small lymphocytic lymphoma | |
AU2018304242B2 (en) | Methods for detection of plasma cell dyscrasia | |
US20030175704A1 (en) | Genes expressed in lung cancer | |
KR102480128B1 (ko) | 면역력 강화 소 African Humped Cattle (AFH) 품종 특이적 단일염기다형성 및 그의 용도 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |