KR20140006898A

KR20140006898A - 결장암 유전자 발현 시그니처 및 이용 방법

Info

Publication number: KR20140006898A
Application number: KR1020137021973A
Authority: KR
Inventors: 데니스 폴 하킨; 비탈리 프로우트스키; 줄리 블랙; 피터 커; 리차드 케네디; 안드레아스 윈터; 티모시 데이비슨; 맥스 바이레스조; 바딤 파르즈디노브; 클레어 윌슨; 로버트 제임스 홀트
Original assignee: 알막 다이아그노스틱스 리미티드
Priority date: 2011-01-25
Filing date: 2012-01-25
Publication date: 2014-01-16
Also published as: EP2668296B1; CN103403543A; AU2012209074A1; EP2668296A4; MX2013008367A; JP2014509189A; CN103403543B9; CN103403543B; US20140094379A1; WO2012103250A3; SG192108A1; WO2012103250A2; IL227643A0; EA201391074A1; CA2825218A1; EP2668296A2; NZ612471A; BR112013018924A2; ZA201305024B; US10196691B2

Abstract

결장암의 유전자 발현 시그니처, 이들을 포함하는 마이크로어레이 및 결장 유전자 발현 시그니처의 사용 방법이 제공된다. 유전자 발현 시그니처는 특히 결장암, 예를 들어, II기 결장암으로 진단된 환자의 예후를 결정하는데 유용하다. 본 명세서에 기재된 유전자 시그니처는 또한 보조 화학요법과 함께의 또는 이것이 없는 외과적 절제술의 유효성을 결정하고, 결장암 환자에서 암 재발 가능성을 결정하는데 유용하다.

Description

결장암 유전자 발현 시그니처 및 이용 방법{COLON CANCER GENE EXPRESSION SIGNATURES AND METHODS OF USE}

본 발명은 결장 조직, 예를 들어, 결정암 조직에서의 유전자 발현 프로파일링(profiling)에 관한 것이다. 특히, 본 발명은 보관된 파라핀-포매된(embedded) 생검 물질을 포함하는 생검된 결장 종양 조직 내의 mRNA 수준을 측정하는 민감한 방법에 관한 것이다. 또한, 본 발명은 결장암의 예후, 진단 및 치료를 위한 유전자 발현 시그니처를 형성하는 발현된 전사체의 세트를 제공한다.

본 출원은 전문이 본 명세서에 참고로 포함되는 미국 임시 특허 출원 제61/435,922호(출원일: 2011년 1월 25일)의 이익을 주장한다.

모든 결장암 환자의 대략 30%가 II기 질환으로 진단된다(문헌[Jemal et al., CA Cancer J. Clin., 2004]). 외과술로 치료되는 II기 결장암 환자에 대한 5년 생존율은 대략 75 내지 80%이며, 이는 대부분의 환자가 외과술만으로 치유됨을 입증한다(문헌[Benson, The Oncologist, 2006; Nauta et al., Arch. Surg., 1989]). 그럼에도 불구하고, 이들 환자의 대략 20 내지 25%는 그들의 생애에 재발 질환이 발생할 것이다(문헌[Benson, The Oncologist, 2006; Gill et al., J. Clin. Oncol., 2004]). 이론상, 이들 환자는 보조 화학요법으로부터 이익을 얻을 것이다. 그러나, II기 결장암에서 보조 화학요법을 사용하여, 대략 3 내지 4%의 환자만이 5년에 완전한 생존의 향상을 갖는다(문헌[Benson, The Oncologist, 2006; Andre et al., Annals of Surgical Oncology 2006]). 결과적으로, 미국 임상 암협회 지침에 의하면, 이들 환자를 통상적으로 보조 화학요법으로 치료하지 않아야 한다고 권고하고 있다(문헌[Benson et al., J. Clin. Oncol., 2004]). 이에도 불구하고, 재발 위험이 높은 II기 결장암 환자의 대략 20%가 보조 치료에 대한 후보일 수 있음이 명백하다(문헌[Benson, The Oncologist, 2006]; 문헌[Nauta et al., Arch. Surg., 1989]; 문헌[Gill et al., J. Clin. Oncol., 2004]; 문헌[Andre et al., Annals of Surgical Oncology 2006]).

결장암과 같은 질환에서, 처음의 치료가 종종 가장 중요하며, 가장 큰 성공의 기회를 제공하여, 처음의 치료로서 환자의 특정 결장암 병기에 가장 효과적인 치료를 사용할 필요가 있다. 이는 어떠한 약물 치료가 특정 개체의 생리학에 대해 가장 효과적일지를 예측하기 위한 방법이 이용가능하지 않았기 때문에 종래에 불가능하였다. 환자는 여러 번 불필요하게 독성 약물 요법을 겪을 것이다. 예를 들어, II기 종양 결절 전이(tumor node metastasis: TNM) 결장암에서, 환자가 외과술 후의 보조 화학요법에 반응할지를 결정하는 방법이 존재하지 않는다. 수술 후에 재발의 위험이 있는 II기 환자의 20%의 오직 1/3만이 화학요법으로부터 임의의 이익을 얻는다. 이는 보조 화학요법의 처방이 일부 환자를 비필수적인 치료에 노출시키는 것을 의미한다. 대안적으로, 이러한 단계에서 보조 화학요법의 거부에 대한 결정은 일부 환자를 암 재발의 높은 위험에 노출시킬 것이다.

현재, 임상 시험에 사용되는 진단 시험은 단일의 분석물 시험에 기초하며, 이에 따라 수십 개의 상이한 마커 간의 관계의 인식의 잠재적 가치를 담아내지 않는다. 더욱이, 진단 시험은 조직면역화학에 의존적이어서, 자주 정량적인 것이 아니다. 이러한 방법은 종종 상이한 실험실에서 상이한 결과를 제공하는데, 이는 부분적으로 시약이 표준화되지 않기 때문이며, 부분적으로 해석이 주관적일 수 있으며, 용이하게 정량화되지 않을 수 있기 때문이다. RNA 기반의 시험은 시간이 지남에 따른 RNA 분해의 문제와 분석을 위해 환자로부터 신선한 조직 샘플을 수득하는 것이 어렵다는 사실 때문에, 자주 사용되지는 않았다. 고정된 파라핀-포매된 조직은 더욱 용이하게 입수할 수 있으며, 고정된 조직에서 RNA를 검출하는 방법이 확립되어 있다. 그러나, 이들 방법은 전형적으로, 소량의 재료로부터 다수의 유전자(DNA 또는 RNA)의 연구를 가능하게 하지 않는다. 따라서, 통상적으로 고정된 조직은 단백질의 면역조직화학적 검출 이외의 것을 위해 좀처럼 사용되지 않는다.

최근에, 몇몇 그룹에 의해, 마이크로어레이 유전자 발현 분석에 의한 다양한 암 유형의 분류에 관한 연구가 공개되었다(예를 들어, 문헌[Golub et al., Science 286:531 537(1999)]; 문헌[Bhattacharjae et al., Proc. Natl. Acad. Sci. USA 98:13790 13795(2001)]; 문헌[Chen-Hsiang et al., Bioinformatics 17(Suppl. 1):S316 S322(2001)]; 문헌[Ramaswamy et al., Proc. Natl. Acad. Sci. USA 98:15149 15154 (2001)], 문헌[Salazar et al., Journal of Clinical Oncology 29: 17-24(2010)], 문헌[O'Conneell et al., Journal of Clinical Oncology 28: 937-3944(2010)] 및 문헌[Kerr et al., Journal of Clinical Oncology 27(suppl) 15s(2009)] 참조). 그러나, 이들 연구는 주로, 이미 확립되어 있는 다양한 암의 유형의 분류를 개선시키고 개량하는데 집중되어 있으며, 일반적으로, 암 치료법의 임상적 결과를 향상시키기 위하여, 차등적으로 발현되는 유전자의 관계에 대한 새로운 시야를 제공하지 않으며, 관찰을 치료 전략에 연결시키지 않는다. 또한, 암 치료 및 결장암 임상 시험은 여전히 종양의 유전자 구성 및 환자의 유전형을 사용하여 개인 약제 계획(regime)을 확립하는 통합적인 약리유전체학(pharmacogenomics) 방법보다는 신규한 활성 화합물의 입수가능성에 기초하여 계속되고 있다.

비록 현대 분자 생물학 및 생화학에 의해, 활성이 종양 세포의 거동, 그들의 분화 상태 및 특정 치료 약물에 대한 그들의 감수성 또는 내성에 영향을 미치는 100개가 넘는 유전자가 드러났지만, 일부 예외와 함께, 이들 유전자의 상태는 통상적으로 약물 처리에 관한 임상적 결정을 내리는 목적을 위해 조사된 적이 없다.

결장암 환자의 예후를 예측하는데 유용한 바이오마커를 동정할 필요가 있다. 고위험(불량한 예후) 또는 저위험(양호한 예후)으로 환자를 분류하는 능력에 의해, 이들 환자에 대한 적절한 치료법의 선택이 가능해질 것이다. 예를 들어, 고-위험 환자는 아마도 공격적인 치료법으로부터 이익을 얻을 수 있는 한편, 치료법은 저위 험 환자에 대해서는 유의미한 이점을 갖지 않을 수 있다. 그러나, 이러한 요구에도 불구하고, 이러한 문제에 대한 해결책이 이용가능하지 않다.

따라서, 특정 치료 요법, 예를 들어, 화학요법을 동반하거나 또는 이를 동반하지 않는 절제술의 실시 후에, 회복 또는 재발 가능성에 대한 정보를 내과의에게 제공하는 마이크로어레이 기반의 예후 기술이 필요하다. 또한, 결장 질환을 정확하게 진단할 수 있는, 특히 특정 결장암 병기를 진단할 수 있거나, 특정 치료법에 대한 결장 질환 환자의 반응을 예측할 수 있는 기술도 필요하다. 암 환자에서 종양에 관한 특정 지식은 관해(remission)의 연장, 환자 삶의 질 증가 및 건강관리 비용의 감소에 아주 유용할 것이다. 또한, 이러한 기술을 사용하여, 후보 환자를 신규한 치료 화합물 및 방법을 위한 임상 시험에 대해 스크리닝하여, 규제적 승인 과정을 용이하게 할 수 있다.

이들 요구를 만족시키는 결장암으로부터의 발현 시그니처가 개시된다. 개시된 시그니처는 결장암의 예후, 결장암의 진단 및 환자 그룹의 분류에서의 적용을 위해 사용될 수 있다. 일부 실시 형태에서, 이들 결과는 결장암의 치료를 위한 단독의 외과술 또는 보조 화학요법과 병용한 외과술의 효능의 게놈의 증거의 평가를 가능하게 한다. 본 명세서에 기재된 시그니처는 2가지 진단 또는 예후 결과를 구분하는데 유의미할 수 있으며, 그를 구분할 수 있다. 본 발명의 중요한 태양은 결장암 조직에서 특정 유전자의 측정된 발현을 사용하여, 환자를 가장 적절한 치료에 매치(match)시키고, 예후 정보를 제공하는 것이다. 따라서, 이러한 결장암 시그니처의 사용 방법이 개시된다. 개시된 방법은 대상체로부터 수득되는 핵산을 포함하는 샘플에서 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계 및 상기 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유래된 결정 점수(decision score)를 대조군 임계값(control threshold)과 비교하는 단계를 포함한다. 요청되는 예측에 따라, 대조군 임계값은 결장암의 진단을 나타내거나, 공지되어 있는 결장암의 분류를 나타내거나, 공지되어 있는 치료에 대한 반응을 나타내거나, 장기간 생존의 이력을 갖는 것을 나타내거나, 재발의 이력을 나타내는 등일 수 있다.

다양한 실시 형태에서, RNA는 결장 조직 샘플로부터 단리되며, 유전자 발현 프로파일을 생성하기 위해 사용된다. 암의 예후를 포함하는 특정 실시 형태에서, 샘플은 대장 종양 시료, 예를 들어, 결장암 샘플이다. 특정 실시형태에서, 유전자 발현 프로파일은 표 6에 열거되고, 표 1 및/또는 표 2에 열거된 것일 수도 있는 적어도 50개의 전사체의 발현을 검출하는 것을 수반한다. 유전자 발현 프로파일에서 검출되는 전사체의 총 개수는 달라질 수 있다. 예를 들어, 일부 실시 형태에서, 프로파일에서 검출되는 전사체의 총 개수는 약 200 내지 약 1000개 또는 약 400개 내지 약 800개이거나, 또는 다른 실시형태에서, 전사체의 개수는 약 500 내지 약 700개 또는 약 550 내지 약 650개이다. 다양한 실시 형태에서, 표 6에 열거된 적어도 약 50개, 적어도 약 100개, 적어도 약 200개, 적어도 약 300개, 적어도 약 400개, 적어도 약 500개, 적어도 약 600개 또는 모든 전사체가 전사체의 총 개수의 일부로서 검출된다. 추가의 전사체가 검출되는 경우(표 6의 것에 더하여), 추가의 전사체는 임의로 신호 또는 발현 수준 대조군으로부터 선택될 수 있으며, 일부 실시형태에서, 결장암에서 발현되는 것으로 공지되어 있는 전사체, 예를 들어, 대장암 DSA(상표명)의해 결정된 것이다. 특정 실시 형태에서, 추가의 전사체는 또한 결장암 예후를 나타낼 수 있다.

환자의 발현 프로파일은 고위험 및 저위험 환자 그룹, 예를 들어, 임상적 재발 위험이 높거나 낮은 환자에서 표 6에 열거된 전사체의 발현 수준에 기초하여, 발현 시그니처에 대하여 점수를 매기며, 결과를 사용하여 일련의 치료를 결정할 수 있다. 예를 들어, 고위험 환자인 것으로 결정된 환자는 외과술 후에 보조 화학요법으로 치료될 수 있다. 저위험 환자인 것으로 여겨지는 환자에 대하여, 외과술 후에 보조 화학요법이 보류될 수 있다. 따라서, 본 발명은 특정 태양에서, 재발의 위험을 나타내는 결장암 종양의 유전자 발현 프로파일의 생성 방법을 제공한다.

본 발명은 추가로 결장암의 예후를 위한 방법을 제공한다. 이러한 태양에 따른 방법은 결장암 시료(예를 들어, 본 명세서에 기재된 바와 같은)의 유전자 발현 프로파일을 생성하는 것을 포함한다. 그 다음, 유전자 발현 프로파일을 본 명세서에 기재된 유전자 발현 시그니처에 대하여 분류하거나 점수를 매긴다. 다양한 실시형태에서, 유전자 발현 시그니처는 표 6에 열거되고, 표 1 및/또는 표 2에 열거된 것일 수도 있는 적어도 50개의 전사체의 발현 수준에 기초한다. 일부 실시 형태에서, 시그니처의 기초가 되는 전사체의 총 개수는 약 800개 미만, 약 700개 미만, 약 600개 미만, 약 500개 미만, 약 400개 미만, 약 300개 미만, 약 200개 미만 또는 약 100개 미만의 전사체이며, 표 6으로부터의 전사체를 포함한다. 예를 들어, 시그니처는 표 6으로부터의 적어도 약 400개, 적어도 약 500개 또는 적어도 약 600개의 전사체의 발현 수준에 기초할 수 있다. 임의로, 표 6으로부터의 전사체는 표 1에 열거된 전사체를 포함한다.

또한, 대상체에 대한 맞춤형 결장암 유전체학 프로파일의 생성 방법이 개시된다. 상기 방법은 대상체로부터 수득되는 핵산을 포함하는 샘플에서 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계 및 유전자 발현 분석에 의해 수득되는 데이터를 요약하는 리포트를 생성하는 단계를 포함한다.

개시된 방법의 일부 예에서, 발현 수준은 대상체로부터 수득되는 대장 조직의 샘플, 예를 들어, 결장암 샘플로부터 추출되는 RNA 및/또는 RNA로부터 전사되는 cDNA를 포함하는 대상체로부터 수득되는 핵산으로부터 결정된다.

또한, 결장암에 대한 유전자 발현 시그니처를 검출하기 위한 핵산 프로브 및 프라이머(뿐만 아니라 이러한 프로브 및 프라이머의 세트)가 개시된다. 일부 예에서, 프로브는 결장암 시그니처의 검출에 사용하기 위한 어레이의 일부이다.

본 발명의 상기의 및 기타 특징 및 이점은 첨부된 도면을 참조하여 진행되는 하기의 일부 실시 형태의 상세한 설명으로부터 더욱 명백해질 것이다.

도 1은 결장암 전사체 발현 시그니처를 유도하는데 사용되는 예시적인 절차를 보여주는 흐름도이다.
도 2는 대장암 DSA(상표명)를 사용하는 II기 결장암 예후 시그니처 생성 및 검증의 예시적인 개요를 보여주는 흐름도이다.
도 3a는 트레이닝 세트에서 636개 전사체 예후 시그니처의 수신자 조작 특성(receiver operating characteristic: ROC) 곡선의 그래프이다.
도 3b는 후보 모델로부터의 트레이닝 데이터로부터의 재발의 카플란-마이어 플롯(Kaplan-Meier plot)이다.
도 4a는 검증 세트에서 636개 전사체 예후 시그니처의 수신자 조작 특성(ROC) 곡선의 그래프이다.
도 4b는 후보 모델로부터의 검증 데이터로부터의 재발의 카플란-마이어 플롯이다.
도 5는 후보 모델로부터의 검증 데이터로부터의 전체 생존의 카플란-마이어 플롯이다.
도 6은 후술하는 바와 같은 표 3이다.
도 7은 후술하는 바와 같은 표 6이다.
표의 간단한 설명
표 1은 핵심 결장 시그니처에 포함되는 10개 후보 전사체의 목록을 제공한다. 이들 전사체는 샘플의 불량한 예후 그룹 및 양호한 예후 그룹으로의 분류에 가장 큰 영향을 갖는 것으로 동정되었다.
표 2는 결장 시그니처에 포함되는 178개의 독특한 전사체의 목록을 제공한다. 이러한 표는 636개 전사체 시그니처에서의 전사체의 가중치 순위뿐 아니라 결장 조직에서 발현되는 전사체의 배향을 포함한다.
표 3은 636개 전사체 시그니처를 동정하기 위한 연구에서 주요 환자 및 종양 특징을 제공한다.
표 4는 전사체 시그니처를 동정하기 위하여 사용되는 교차-검증된 트레이닝 세트 및 검증 세트에 대한 성능 메트릭(performance metrics)을 제공한다.
표 5는 환자 연령, 환자 성별, pT-병기, 종양 등급(tumor grade), 종양 위치 및 점액성/비-점액성 하위유형 상태에 대한 위험비를 보여주는 통계 분석의 결과를 제공한다.
표 6은 636개 전사체 결장 시그니처에 포함되는 전사체의 목록을 제공한다.
서열 목록
첨부된 서열 목록에 열거된 핵산 및 아미노산 서열은 37 C.F.R. §1.822에 정의된 바와 같은 뉴클레오타이드 염기에 대한 표준 문자 약어를 사용하여 나타낸다. 각 핵산 서열의 오직 한 가닥을 나타내었으나, 임의로 디스플레이된 가닥을 참조하여 상보적인 가닥이 포함되는 것으로 이해된다. 첨부 서열 목록에서,
서열 번호 1 내지 636은 인간 결장암으로부터의 올리고뉴클레오타이드 전사체이다.
서열 목록은 파일명 ADL-0311_Sequence_Listing.txt의 형태의 ASCII 텍스트 파일로 제출되며, 이 파일은 2012년 1월 25일에 생성되었고, 232,154 바이트이며, 본 명세서에 참고로 포함된다.

I. 용어의 요약

달리 다르게 정의되지 않는 한, 본 명세서에 사용되는 기술 및 과학 용어는 본 발명이 속하는 분야의 숙련자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 분자 생물학에서 통상적인 용어의 정의는 문헌[Benjamin Lewin, Genes IX, published by Jones and Bartlet, 2008(ISBN 0763752223)]; 문헌[Kendrew et al. eds.), The Encyclopedia of Molecular Biology, published by Blackwell Science Ltd., 1994(ISBN 0632021829)]; 문헌[Robert A. Meyers(ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH publishers, Inc., 1995(ISBN 9780471185710)]; 문헌[Singleton et al., Dictionary of Microbiology and Molecular Biology 2nd ed., J. Wiley & Sons(New York, N.Y. 1994)] 및 문헌[March, Advanced Organic Chemistry Reactions, Mechanisms and Structure 4th ed., John Wiley & Sons(New York, N.Y. 1992)]에서 찾을 수 있다.

용어의 단수 표현은 문맥에서 명백히 달리 지시하지 않는 한 복수의 지시 대상을 포함한다. 유사하게, "또는"이라는 단어는 문맥에서 명백히 달리 지시하지 않는 한 "및"을 포함하는 것으로 의도된다. "포함한다"라는 용어는 "함유하다"라는 의미이다. 상충되는 경우에, 용어의 설명을 포함하는 본 명세서가 좌우할 것이다.

본 발명의 다양한 실시 형태의 검토를 용이하게 하기 위하여 하기의 용어의 설명이 제공된다.

ㆍ핵산 분자의 증폭: 핵산 분자, 예를 들어, 유전자 또는 유전자의 단편, 예를 들어, 표 6에 나타낸 전사체의 카피수를 증가시키기 위한 것. 생성된 산물은 증폭 산물로 지칭된다.

시험관 내 증폭의 일 예는 중합효소 연쇄 반응(PCR)이다. 시험관 내 증폭 기술의 다른 예에는 정량적 실시간 PCR, 가닥 치환 증폭(미국 특허 제5,744,311호 참조); 전사 부재 등온 증폭(transcription-free isothermal amplification)(미국 특허 제6,033,881호 참조); 수선 연쇄 반응 증폭(repair chain reaction amplification)(국제 특허 출원 공개 제WO 90/01069호 참조); 리가제(ligase) 연쇄 반응 증폭(EP-A-320 308호 참조); 갭 필링(gap filling) 리가제 연쇄 반응 증폭(미국 특허 제5,427,930호 참조); 결합된 리가제 검출 및 PCR(미국 특허 제6,027,889호 참조); 및 NASBA(상표명) RNA 전사 부재 증폭(미국 특허 제6,025,134호 참조)이 포함된다.

ㆍ어레이: 기판 상의 또는 그 내의 주소결정 가능한(addressable) 위치에서, 분자, 예를 들어, 생물학적 거대분자(이러한 핵산 분자) 또는 생물학적 샘플(예를 들어, 조직 섹션)의 장치. 일부 예에서, 어레이는 혼성화 절차 동안 실질적으로 제거되지 않도록 고체 기판에 결합된 폴리뉴클레오타이드 프로브(예를 들어, 표 6에 나타낸 핵산 서열 또는 그의 상보체에 혼성화하는 프로브)의 어레이이다. "마이크로 어레이"는 평가 또는 분석을 위해 현미경 검사를 필요로 하거나 그에 의해 지원되도록 소형화된 어레이이다. 어레이는 때때로 DNA 칩 또는 바이오칩으로 지칭된다.

분자("피처(feature)")의 어레이는 샘플 상에서 매우 다수의 분석을 동시에 수행할 수 있게 한다. 특정 어레이 예에서, 하나 이상의 분자(예를 들어, 올리고뉴클레오타이드 프로브)가 다수 회(예를 들어, 2회) 어레이 상에서 존재하여, 예를 들어, 내부 대조군을 제공할 것이다.

특정 예에서, 어레이는 핵산 분자, 예를 들어, 올리고뉴클레오타이드 서열을 포함한다. 어레이 상에서 사용되는 폴리뉴클레오타이드는 통상적으로 약 500 내지 5000개 염기 길이의 cDNA("cDNA 어레이")일 수 있지만, 더 짧거나 더 긴 cDNA도 또한 사용될 수 있다. 대안적으로, 폴리뉴클레오타이드는 전형적으로 약 20 내지 80개 염기 길이인 올리고뉴클레오타이드일 수 있지만, 더 짧거나 더 긴 올리고뉴클레오타이드도 또한 적절하다. 일 예에서, 분자는 그들의 5'- 또는 3'-말단을 통하여 어레이에 부착되는 올리고뉴클레오타이드를 포함한다.

어레이 내에서, 각 배열된 샘플은 그의 위치가 적어도 2차원의 어레이 내에서 신뢰할 수 있게, 그리고 일관되게 결정될 수 있다는 점에서, 주소결정 가능하다. 어레이 상의 주소결정 가능한 위치의 수는 예를 들어, 적어도 4 내지 적어도 9개, 적어도 10개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 30개, 적어도 50개, 적어도 75개, 적어도 100개, 적어도 150개, 적어도 200개, 적어도 300개, 적어도 500개, 적어도 550개, 적어도 600개, 적어도 800개, 적어도 1000개, 적어도 10,000개 이상으로 달라질 수 있다. 어레이 상의 피처 적용 위치는 상이한 형상을 취할 수 있다. 예를 들어, 어레이는 규칙적이거나(예를 들어, 균일한 행과 열로 배열된) 불규칙적일 수 있다. 따라서, 정렬된 어레이에서, 각 샘플의 위치는 어레이에 적용되는 때에 샘플에 할당되며, 색인(key)이 각 위치를 적절한 표적 또는 피처 위치와 상호 관련시키기 위하여 제공될 수 있다. 종종, 정렬된 어레이는 대칭적인 격자 패턴으로 배열되나, 샘플은 다른 패턴으로(예를 들어, 방사상 분포 라인, 나선형 라인 또는 정렬된 클러스터로) 배열될 수 있다. 주소결정 가능한 어레이는 통상 컴퓨터가 어레이 상의 특정 주소를 그 위치에서 샘플에 관한 정보(예를 들어, 신호 세기를 포함하는 혼성화 또는 결합 데이터와 같은)와 상호 관련시키도록 프로그램화될 수 있다는 점에서 컴퓨터 판독가능하다. 컴퓨터 판독 가능한 형식의 일부 예에서, 어레이 내의 개별 피처는 예를 들어, 컴퓨터에 의해 정보를 다룰 수 있도록 상호 관련될 수 있는 데카르트 격자(Cartesian grid) 패턴으로 규칙적으로 배열된다.

ㆍ결합 또는 안정한 결합: 2가지 물질 또는 분자 간의 회합, 예를 들어, 핵산의 다른 핵산으로의 회합(예를 들어, 프로브의 표 6에 나타낸 전사체 또는 그의 상보체로의 결합), 또는 한 단백질의 다른 단백질 또는 핵산 분자와의 회합. 결합은 예를 들어, 핵산의 경우에 표적：올리고뉴클레오타이드 복합체의 물리적 또는 기능적 특성에 의해서와 같이, 당업자에게 공지되어 있는 임의의 절차에 의해 검출될 수 있다.

상보적 가닥의 핵산 분자의 결합을 검출하는 물리적 방법에는 DNase I 또는 화학적 풋프린팅(footprinting), 겔 이동(gel shift) 및 친화성 절단 검정법(affinity cleavage assay), 노던 블롯팅(Northern blotting), 돗트 블롯팅(dot blotting) 및 흡광 검출 절차와 같은 방법이 포함되나 이들에 한정되지 않는다. 예를 들어, 하나의 방법은 온도가 천천히 증가함에 따라, 올리고뉴클레오타이드(또는 유사체) 및 표적 핵산을 함유하는 용액의 흡광의 변화를 220㎚ 내지 300㎚에서 관찰하는 것을 수반한다. 올리고뉴클레오타이드 또는 유사체가 그의 표적에 결합된다면, 올리고뉴클레오타이드(또는 유사체) 및 표적이 서로 분리되거나 또는 용융됨에 따라 특징적인 온도에서 흡광도의 급작스러운 증가가 존재한다. 다른 예에서, 방법은 신호, 예를 들어 하나 또는 둘 모두의 핵산 분자(또는 필요에 따라, 항체 또는 단백질) 상에 존재하는 검출 가능한 표지를 검출하는 것을 수반한다.

올리고머 및 그의 표적 핵산 간의 결합은 종종 올리고머의 50%가 그의 표적으로부터 용융되는 온도(Tm)를 특징으로 한다. 보다 높은 (Tm)은 보다 낮은 (Tm)을 갖는 복합체에 비해 더욱 강력하거나 더욱 안정한 복합체를 의미한다.

ㆍcDNA(상보적 DNA): 내부 비-암호화 세그먼트(segment)(인트론) 및 전사를 결정하는 조절 서열이 결여된 DNA의 조각. cDNA는 세포 및/또는 조직 샘플, 예를 들어, 결장암 샘플을 포함하는 결장 샘플로부터 추출되는 메신저 RNA(mRNA)로부터 역전사에 의해 합성될 수 있다.

ㆍ임상적 결과: 질환 또는 장애에 대한 치료 후의 또는 치료의 부재 하의 환자의 건강 상태를 말한다. 임상적 결과에는 사망까지의 기간의 증가, 사망까지의 기간의 감소, 생존 기회의 증가, 사망 위험의 증가, 생존, 무-질환 생존, 만성 질환, 전이, 진행성(advanced) 또는 침습성(aggressive) 질환, 질환 재발, 사망 및 치료법에 대한 양호하거나 불량한 반응이 포함되나, 이들에 한정되지 않는다.

ㆍ결장암: 결장(대장의 가장 긴 부분)의 조직에 형성되는 암. 대부분의 결장암은 선암종(장기를 이루고 분비샘(gland)-유사 특성을 갖는 세포에서 시작되는 암)이다. 암 진행은 체 내의 암의 병기 또는 범위를 특징으로 한다. 병기결정(staging)은 보통 종양의 크기, 림프절이 암을 함유하는지 여부 및 암이 원래의 부위로부터 다른 신체 부분으로 확산되는지 여부에 기초한다. 결장암의 병기는 I기, II기, III기 및 IV기를 포함한다. 달리 특정되지 않는 한, 용어 결장암은 0기, I기, II기(IIA 또는 IIB기 포함), III기(IIIA, IIIB 또는 IIIC기 포함) 또는 IV기의 결장암을 지칭한다. 본 명세서의 일부 실시 형태에서, 결장암은 임의의 병기로부터의 암이다. 다른 실시 형태에서, 결장암은 II기 결장암이다.

ㆍ화학치료제: 비정상적인 세포 성장을 특징으로 하는 질환의 치료에서 치료적 유용성을 갖는 임의의 화학적 제제(agent). 이러한 질환에는 종양, 신생물 및 암 뿐만 아니라 과다형성 성장을 특징으로 하는 질환, 예를 들어 건선이 포함된다. 일 실시 형태에서, 화학치료제는 결장암의 치료에 사용되는 제제이다. 일 실시 형태에서, 화학치료제는 방사성 화합물이다. 당업자는 유용한 화학치료제를 용이하게 동정할 수 있다(예를 들어, 문헌[Slapak and Kufe, Principles of Cancer Therapy, Chapter 86 in Harrison's Principles of Internal Medicine, 14th edition]; 문헌[Perry et al., Chemotherapy, Ch. 17 in Abeloff, Clinical Oncology 2nd ed., 2000 Churchill Livingstone, Inc]; 문헌[Baltzer and Berkery.(eds): Oncology Pocket Guide to Chemotherapy, 2nd ed. St. Louis, Mosby-Year Book, 1995]; 문헌[Fischer Knobf, and Durivage(eds): The Cancer Chemotherapy Handbook, 4th ed. St. Louis, Mosby-Year Book, 1993] 참조). 결장암의 치료에 사용되는 화학치료제는 소분자, 예를 들어, 5-플루오로우라실, 류코보린, 이리노테칸, 옥살리플라틴 및 카페시타빈 및 항체, 예를 들어, 베바쿠지맙 및 세툭시맙을 포함한다. 병용 화학요법은 암을 치료하기 위한 한 가지 초과의 제제의 투여이다.

ㆍ접촉: 직접적으로 물리적으로 회합되는 배치 고체 및 액체 형태 둘 모두를 포함. 접촉은 하나의 분자와 다른 분자 간의 접촉, 예를 들어, 샘플과 핵산 프로브, 예를 들어, 표 6에 나타낸 임의의 서열에 대한 프로브의 접촉을 포함한다.

ㆍ대조군: "대조군"은 실험적 샘플, 예를 들어, 결장암 환자로부터 수득되는 종양 샘플과의 비교를 위해 사용되는 샘플 또는 표준물질을 말한다. 일부 실시 형태에서, 대조군은 건강한 환자로부터 수득되는 샘플 또는 결장암으로 진단된 환자로부터 수득된 비-암 조직 샘플, 예를 들어, 종양이 존재하는 동일한 장기로부터의 비-암 조직 샘플(예를 들어, 비-암 결장 조직은 결장암에 대한 대조군으로 소용될 수 있다)이다. 일부 실시 형태에서, 대조군은 종래의 대조군 또는 표준물질 값(다시 말하면, 기준선 또는 정상 값을 나타내는 이전에 시험한 대조군 샘플 또는 샘플의 그룹)이다.

차등적 발현의 결정을 위해, 샘플과 비교하기 위한 대조군 또는 표준물질은 정상인 것으로 여겨지는 샘플(그들, 예를 들어, 결장암을 갖지 않는 대상체로부터의 샘플이 원하는 특성에 대하여 변경되지 않는다는 점에서)뿐 아니라 비록 아마도 자의적으로 설정될지라도 실험실 값을 포함한다. 실험실 표준물질 및 값은 공지되어 있거나 결정된 집단의 값에 기초하여 설정될 수 있으며, 측정된, 실험에 의해 결정된 값의 비교를 가능하게 하는 그래프 또는 표의 형식으로 제공될 수 있다.

ㆍ발현의 검출: 핵산을 검출할 수 있는 정성적 또는 정량적 방식 중 어느 하나로의 발현 수준의 결정. 예시적인 방법에는 마이크로어레이 분석, RT-PCR 및 노던 블롯이 포함된다. 일부 예에서, 발현의 검출은 표 6에서의 하나 이상의 전사체의 발현의 검출을 포함한다.

ㆍ차등의 발현 또는 변경된 발현: 유전자(예를 들어, 표 1, 표 2로부터의 임의의 유전자 및/또는 표 6의 핵산 전사체)에서 암호화된 정보의 메신저(messenger) RNA로의 전환, mRNA의 단백질로의 전환, 또는 둘 모두의 차이, 예를 들어, 증가 또는 감소. 일부 예에서, 차이는 대조군 또는 참조 값, 예를 들어, 동일한 대상체로부터 질환, 예를 들어, 결장암에 의해 영향을 받지 않은 조직에서의 핵산 전사체의 발현량 또는 결장암을 갖지 않는 상이한 대상체에서 예상되는 양에 비한 것이다. 또한, 차이는 결장암이 진행되지 않는 상이한 대상체로부터의 조직에 비해, 대상체(동일한 장기에서 암을 갖는)로부터의 비-암 조직에 존재할 수 있다. 차등적 발현의 검출은 유전자 또는 단백질 발현의 변화, 예를 들어, 표 1, 표 2에 열거된 하나 이상의 유전자의 발현 및/또는 표 6에 나타낸 하나 이상의 전사체의 발현의 변화의 측정을 포함할 수 있다.

ㆍ하향조절 또는 감소: 핵산 분자의 발현에 관하여 사용되는 경우, 핵산의 생성의 감소를 야기하는 임의의 과정을 말한다. 유전자 산물은 RNA(예를 들어, mRNA, rRNA, tRNA 및 구조적 RNA) 또는 단백질일 수 있다. 따라서, 유전자 하향조절 또는 불활성화는 유전자의 전사 또는 mRNA의 번역을 감소시키는 과정을 포함한다.

유전자 하향조절은 유전자 산물의 생성의 임의의 검출가능한 감소를 포함한다. 특정 예에서, 유전자 산물의 생성은 대조군(예를 들어, 유전자 발현, 예를 들어, 정상 세포 내의 정규화된 유전자 발현의 양)에 비해 적어도 1.2배, 예를 들어, 적어도 2배, 적어도 3배 또는 적어도 4배 감소된다. 일부 예에서, 대조군은 결장암을 갖지 않는 하나 이상의 대상체에서의 상대적인 유전자 발현 또는 단백질 발현의 양, 예를 들어, 임의의 알려져 있는 암을 갖지 않는 "암-부재 대상체"에서의 상대적인 유전자 발현 또는 단백질 발현의 양이다.

ㆍ엑손: 이론적으로, 메신저 RNA 산물에 나타나는 비연속 유전자의 세그먼트. 이론적으로, 용어 "인트론"은 인트론의 양측 상의 엑손을 함께 스플라이싱함으로써 전사되지만, 전사체 내로부터 제거되는 DNA의 임의의 세그먼트를 말한다. 작동가능하게, 엑손 서열은 참조 서열 번호로 정의된 바와 같은 유전자의 mRNA 서열에서 발생한다. 작동가능하게, 인트론 서열은 그들의 5' 및 3' 경계에 GT 및 AG 스플라이스 컨센서스 서열을 가지며, 엑손 서열에 의해 묶여지는 유전자의 게놈 DNA의 개재 서열이다.

ㆍ발현: 암호화된 유전자의 정보가 세포의 작동, 비-작동 또는 구조적 부분으로 전환되는 과정, 예를 들어, 핵산 또는 단백질의 합성. 유전자 발현은 외부 신호에 의해 영향을 받을 수 있다. 예를 들어, 호르몬에 대한 세포의 노출에 의해 호르몬-유도성 유전자의 발현이 자극될 수 있다. 상이한 유형의 세포가 동일한 신호에 대하여 상이하게 반응할 수 있다. 또한, 유전자의 발현은 DNA로부터, RNA, 단백질로의 경로의 어느 곳에서 조절될 수 있다. 조절은 전사, 번역, RNA 수송 및 프로세싱, 중개 분자, 예를 들어, mRNA의 분해에 대한 조절, 또는 특정 단백질 분자가 생성된 후에 그들의 활성화, 불활성화, 구획화 또는 분해를 통한 조절을 포함할 수 있다. 핵산 분자의 발현은 예를 들어, 정상(예를 들어, 비-암) 샘플에서의 발현에 비하여 변경될 수 있다. 유전자 발현의 변경, 예를 들어, 차등 발현은 (1)과 발현 (2) 저발현(underexpression); 또는 (3) 발현의 억제를 포함하나 이들에 한정되지 않는다. 핵산 분자의 발현의 변경은 해당하는 단백질의 발현의 변화와 관련이 있을 수 있으며, 사실상 이를 야기한다. "발현" 및/또는 "상대적 발현"은 발현 시그니처, 예를 들어, 결장암 발현 시그니처에서 모든 다른 전사체의 발현의 맥락에서 정의되는 임계값에 대한 특정 전사체의 정규화 후의 발현 값으로 고려될 수 있다. 주어진 시료에 대한 전반적 발현 데이터는 해당 분야의 숙련자에게 공지되어 있는 방법을 사용하여 정규화되어, 상이한 양의 출발 물질, 다양한 추출 효능 및 증폭 반응 등에 대하여 보정한다. 효율적으로 진단 또는 예후 호출(call)(예를 들어, 양호한 또는 불량한 예후)을 이루기 위하여 정규화된 데이터 상에 선형 분류자(linear classifier)를 사용하는 것은 데이터 공간, 다시 말하면, 시그니처에서 모든 유전자에 대한 발현 값의 모든 가능한 조합을 분리 평면의 수단에 의하여 해체된 2개의 절반으로 분할하는 것을 의미한다. 이러한 분할은, 예를 들어, 양호한 예후 및 불량한 예후를 갖는 환자로부터의 큰 세트의 트레이닝(training) 예에서 실험에 의해 유래된다. 일반성의 상실 없이, 하나가 아닌 모든 유전자에 대한 소정의 고정된 세트의 값을 추정할 수 있으며, 이는 이러한 남아있는 유전자에 대한 임계값을 자동적으로 정의할 것이며, 결정은 예를 들어, 양호한 예후로부터 불량한 예후로 변경될 것이다. 이어서, 이러한 역학적 임계값을 초과하는 발현 값은 양호한(음의 가중치를 갖는 유전자에 대하여) 또는 불량한(양의 가중치를 갖는 유전자에 대하여) 예후 중 어느 하나를 나타낼 것이다. 이러한 임계값의 정확한 값은 시그니처 내의 모든 다른 유전자의 실제 측정된 발현 프로파일에 좌우되나, 특정 유전자의 일반적인 표시는 고정되어 유지되며, 다시 말하면, 높은 값 또는 "상대적인 과발현"은 항상 불량한 예후 결정(양의 가중치를 갖는 유전자) 또는 양호한 예후(음의 가중치를 갖는 유전자) 결정 중 어느 하나에 기여한다. 따라서, 전체 유전자 발현 시그니처에 관하여, 상대적 발현은 특정 전사체의 상향- 또는 하향-조절 중 어느 하나가 양호한 또는 불량한 예후를 나타내는지를 표시할 수 있다.

ㆍ유전자 증폭: 다수의 카피의 유전자 또는 유전자 단편이 특정 세포 또는 세포주에서 형성되는 과정. 중복된 영역(증폭된 DNA의 스트레치(stretch))은 종종 "앰플리콘(amplicon)"으로 지칭된다. 통상, 생성되는 메신저 RNA(mRNA)의 양, 다시 말하면, 유전자 발현의 수준도 또한 발현되는 특정 유전자로 이루어진 카피수에 비례하여 증가한다.

ㆍ발현 프로파일(또는 핑거프린트(fingerprint) 또는 시그니처): 특정 병기 또는 특정 예후 결과를 특징으로 하거나 이와 관련된 유전자 발현 패턴. 유전자 발현 시그니처는 일련의 정보(informative) 유전자 또는 그의 암호화 또는 비-암호화 전사체 둘 모두에 의해 표현될 수 있다. 시그니처 내의 전사체의 발현 수준을 평가하여, 본 명세서에 제공된 방법에 제한되지 않는 예후 결정을 할 수 있다. 유전자 발현 수준을 사용하여 2가지 임상적 증상 또는 결과, 예를 들어, 진단을 위하여 정상 및 이환 조직을 구별하거나, 또는 예후 방법을 위하여 비-반응성에 비하여 반응성을 구별하고, 예측 방법을 위하여 비-재발에 비하여 재발을 구별할 수 있다. 차등 또는 변경된 유전자 발현은 검출가능한 양의 유전자 발현(예를 들어, cDNA 또는 mRNA)의 변화 또는 그들 유전자에 의해 발현되는 검출가능한 양의 단백질의 변화에 의해 검출될 수 있다. 별개의 또는 식별가능한 유전자 발현 패턴, 예를 들어, 정의된 세트의 유전자 또는 유전자-지시 핵산, 예를 들어, EST의 고발현 및 저발현 패턴 일부 예에서, 1 또는 2개만큼 적은 유전자는 프로파일을 제공하지만, 더 많은 유전자, 예를 들어, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 9개, 적어도 10개 또는 적어도 11개 등은 프로파일에 사용될 수 있다. 일부 실시형태에서, 프로파일은 약 200개 이상의 유전자(또는 "전사체") 및 약 1000개 이하의 전사체, 예를 들어, 약 400개 전사체 내지 약 800개 전사체, 또는 약 500개 전사체 내지 약 700개 전사체를 포함한다. 프로파일은 일부 실시 형태에서, 표 6에 열거된 636개 전사체를 비롯한 표 6으로부터의 전사체를 포함한다(예를 들어, 표 6으로부터의 적어도 100개, 적어도 200개, 적어도 300개, 적어도 400개, 적어도 500개 또는 적어도 600개의 전사체). 본 명세서에 사용되는 용어 "유전자"는 발현된 전사체를 말하며, 이는 특징지어진 유전자이거나, 발현된 전사체, 예를 들어, EST일 수 있다. 일부 실시형태에서, 검출 플랫폼은 마이크로어레이이며, 각 프로브는 개별 "유전자" 또는 "전사체"의 발현을 결정하는 것으로 간주된다.

유전자 발현 프로파일(핑거프린트 또는 시그니처로도 지칭)은 조직 또는 세포 유형(예를 들어, 결장 조직), 특정 정상 조직 성장 단계 또는 특정 질환 진행 단계(예를 들어, 결장암), 또는 예측가능한 방식으로 유전자 발현에 영향을 미치는 임의의 다른 별개의 또는 식별가능한 조건과 결합될 수 있다. 유전자 발현 프로파일은 특정 유전자의 상대적인 발현 수준뿐 아니라 절대적인 발현 수준을 포함할 수 있으며, 기준선 또는 대조군 샘플 프로파일(예를 들어, 결장암을 갖지 않는 대상체로부터의 샘플)에 비하여 시험 샘플에 관하여 관찰될 수 있다. 일 예에서, 대상체에서의 유전자 발현 프로파일은 어레이(예를 들어, 핵산 어레이) 상에서 판독된다.

ㆍ혼성화: 2 가닥의 DNA, RNA 또는 DNA와 RNA 사이의 상보적 영역 간에 염기쌍을 형성하여, 이에 의해, 듀플렉스(duplex) 분자, 예를 들어, 프로브와 표 6에 나타낸 임의의 핵산 서열 또는 그의 상보체 간에 형성되는 듀플레스를 형성하는 것. 특정 엄격도를 야기하는 혼성화 조건은 혼성화 방법의 성질 및 혼성화 핵산 서열의 조성 및 길이에 따라 달라질 것이다. 일반적으로, 혼성화 온도 및 혼성화 완충액의 이온 세기(예를 들어, Na+ 농도)는 혼성화의 엄격성을 결정할 것이다. 특정 엄격도에 이르기 위한 혼성화 조건에 관한 계산은 문헌[Sambrook et al.,(1989) Molecular Cloning, second edition, Cold Spring Harbor Laboratory, Plainview, NY(chapters 9 and 11)]에 논의되어 있다. 다음은 예시적인 혼성화 조건의 세트이며, 한정되지 않는다.

매우 높은 엄격성(적어도 90% 동일성을 공유하는 서열을 검출)

혼성화: 65℃에서 16시간 동안 5×SSC

2회 세정: 각각 실온(RT)에서 15분 동안 2×SSC

2회 세정: 각각 65℃에서 20분 동안 0.5×SSC

높은 엄격성(적어도 80% 동일성을 공유하는 서열을 검출)

혼성화: 65℃ 내지 70℃에서 16 내지 20시간 동안 5× 내지 6×SSC

2회 세정: 각각 실온에서 5 내지 20분 동안 2×SSC

2회 세정: 각각 55℃ 내지 70℃에서 30분 동안 1×SSC

낮은 엄격성(적어도 60% 동일성을 공유하는 서열을 검출)

혼성화: 실온 내지 55℃에서 16 내지 20시간 동안 6×SSC

적어도 2회 세정: 각각 실온 내지 55℃에서 20 내지 30분 동안 2× 내지 3×SSC.

ㆍ단리된: "단리된" 생물학적 성분(예를 들어, 핵산 분자, 단백질 또는 세포)은 유기체의 세포 내의 다른 생물학적 성분 또는 유기체 그 자체로부터 실질적으로 분리되거나 정제되며, 여기서, 성분, 예를 들어, 다른 염색체 및 염색체-외 DNA 및 RNA, 단백질 및 세포는 천연적으로 존재한다. 또한, 상기 용어는 숙주 세포 내의 재조합 발현에 의해 제조되는 핵산 분자뿐 아니라 화학적으로 합성된 핵산 분자를 포함한다. 예를 들어, 단리된 세포, 예컨대 결장암 세포는 다른 유형의 세포로부터 실질적으로 분리된 것이다.

ㆍ표지: 예를 들어, ELISA, 분광 광도법, 유세포 분석법 또는 마이크로어레이 또는 기타 광학적 기술에 의해 검출할 수 있는 제제. 예를 들어, 표지는 핵산 분자 또는 단백질에 부착되어, 핵산 분자 또는 단백질의 검출을 가능하게 할 수 있다. 예를 들어, 표적 분자, 예컨대 표적 핵산 분자에 특이적으로 결합하는 핵산 분자 또는 항체가 있다. 표지의 예에는 방사성 동위원소, 효소 기질, 보조-인자, 리간드, 화학 발광제, 형광단, 합텐, 효소 및 그들의 조합이 포함되나 이들에 한정되지 않는다. 표지화 방법 및 다양한 목적에 적절한 표지의 선택에서의 지침은 예를 들어, 문헌[Sambrook et al.(Molecular Cloning: A Laboratory Manual, Cold Spring Harbor, New York, 1989)] 및 문헌[Ausubel et al.(In Current Protocols in Molecular Biology, John Wiley & Sons, New York, 1998)]에 논의되어 있다.

ㆍ장기간 생존: 결장암을 위한 외과술 또는 다른 치료(예를 들어, 화학요법) 후 적어도 3년, 더욱 바람직하게는 적어도 5년, 더더욱 바람직하게는 적어도 8년 동안의 무-질환 생존.

ㆍ보다 침습적인: 본 명세서에서 사용되는 "보다 침습적인" 형태의 결장암은 (예컨대, 종양의 외과술 제거 후) 전이 또는 재발이 위험이 상대적으로 증가된 결장암이다. 또한 "보다 침습적인" 결장암은 결장암 대상체에서의 사망 가능성의 증가 또는 사망까지의 시간의 감소를 부여하는 결장암을 말할 수 있다. "보다 침습적인" 형태의 결장암을 갖는 대상체는 고위험(불량한 예후)으로 간주된다.

ㆍ유전자를 대표하는 핵산 분자: 해당하는 유전자, 예를 들어, 표 1 또는 표 2에 열거된 것, 예를 들어, 표 6에 열거된 전사체에 대한 정보를 제공하는, 프로브 또는 다른 지시 분자로 사용하기에 적절한 임의의 길이의 임의의 핵산, 예를 들어 DNA(인트론 또는 엑손 또는 둘 모두), cDNA 또는 RNA(예를 들어, mRNA).

ㆍ올리고뉴클레오타이드: 제한 없이, 단일-가닥 데옥시리보뉴클레오타이드, 단일- 또는 이중-가닥 리보뉴클레오타이드, RNA:DNA 하이브리드 및 이중-가닥 DNA를 포함하는 상대적으로 짧은 폴리뉴클레오타이드. 올리고뉴클레오타이드, 예를 들어, 단일-가닥 DNA 프로브 올리고뉴클레오타이드는 종종 화학적 방법, 예를 들어, 구매가능한 자동화 올리고뉴클레오타이드 합성기를 사용하여 합성된다. 그러나, 올리고뉴클레오타이드는 시험관 내 재조합 DNA-매개의 기술을 포함하는 다양한 다른 방법 및 세포 및 유기체에서의 DNA의 발현에 의해 제조될 수 있다.

ㆍ환자: 본 명세서에 사용되는 용어 "환자"는 인간 및 비-인간 동물을 포함한다. 치료에 바람직한 환자는 인간이다. "환자" 및 "대상체"는 본 명세서에서 상호교환가능하게 사용된다.

ㆍ환자 반응: (1) 종양 성장의 어느 정도까지의 억제, 예를 들어 저속화 및 완전한 성장 정지 (2) 종양 세포의 수 감소 (3) 종양 크기의 감소 (4) 인접한 말초 장기 및/또는 조직으로의 종양 세포 침윤의 억제(즉, 감소, 저속화 또는 완전한 정지); (5) 전이의 억제(즉, 감소, 저속화 또는 완전한 정지); (6) 종양의 퇴행 또는 거부를 야기할 수 있으나 반드시 그러한 것은 아닌, 항-종양 면역 반응의 증진 (7) 종양과 관련된 하나 이상의 징후의 어느 정도까지의 경감 (8) 치료 후 생존 기간의 증가 및/또는 (9) 치료 후 주어진 시점에서의 사망률 감소를 포함하지만 이에 제한되지 않는, 환자에 대한 이익을 나타내는 임의의 종점을 이용하여 평가할 수 있다.

ㆍ폴리뉴클레오타이드: 단수 또는 복수로 사용되는 경우, 일반적으로 비변형 RNA 또는 DNA, 또는 변형 RNA 또는 DNA, 또는 심지어 이들의 조합일 수 있는 임의의 폴리리보뉴클레오타이드 또는 폴리데옥시리보뉴클레오타이드를 말한다. 따라서, 예를 들어, 본 명세서에 정의된 바와 같은 폴리뉴클레오타이드는 제한 없이, 단일- 및 이중-가닥 DNA, 단일- 및 이중-가닥 영역을 포함하는 DNA, 단일- 및 이중-가닥 RNA 및 단일- 및 이중-가닥 영역을 포함하는 RNA, 단일-가닥 또는 더욱 전형적으로 이중-가닥일 수 있는 DNA 및 RNA를 포함하거나 단일- 및 이중-가닥 영역을 포함하는 하이브리드 분자를 포함한다. 또한, 용어 "폴리뉴클레오타이드"는 하나 이상의 변형된 염기를 함유하는 DNA 및 RNA를 포함한다. 따라서, 안정성을 위해 또는 다른 이유로 변형된 백본(backbone)이 있는 DNA 또는 RNA는 그 용어가 본 명세서에서 의도되는 바와 같은 "폴리뉴클레오타이드"이다. 더욱이, 특이한 염기, 예를 들어, 이노신 또는 변형된 염기, 예를 들어, 3중수소 염기(tritiated base)를 포함하는 DNA 또는 RNA가 본 명세서에 정의된 바와 같은 용어 "폴리뉴클레오타이드" 내에 포함된다. 일반적으로, 용어 "폴리뉴클레오타이드"는 모든 화학적, 효소적 및/또는 대사적으로 변형된 형태의 비변형된 폴리뉴클레오타이드뿐 아니라, 단순 및 복합 세포를 포함하는 세포 및 바이러스의 특징적인 화학적 형태의 DNA 및 RNA를 포함한다.

ㆍ프로브 및 프라이머: 프로브는 표적 핵산(표 6에 나타낸 핵산 서열 또는 그의 상보체 중 하나)에 혼성화될 수 있는 단리된 핵산을 포함한다. 검출 가능한 표지 또는 리포터(reporter) 분자는 프로브에 부착될 수 있다. 전형적인 표지에는 방사성 동위 원소, 효소 기질, 보조-인자, 리간드, 화학 발광체 또는 형광제(fluorescent agent), 합텐 및 효소가 포함된다. 핵산 프로브 및 프라이머의 제조 및 이용 방법은 예를 들어, 문헌[Sambrook et al.(In Molecular Cloning: A Laboratory Manual, CSHL, New York, 1989)], 문헌[Ausubel et al.(ed.)(In Current Protocols in Molecular Biology, John Wiley & Sons, New York, 1998)] 및 문헌[Innis et al.(PCR Protocols, A Guide to Methods and Applications, Academic Press, Inc., San Diego, CA, 1990)]에 기재되어 있다. 표지화 방법 및 다양한 목적에 적절한 표지의 선택에서 표지화 방법은 예를 들어, 문헌[Sambrook et al.(In Molecular Cloning: A Laboratory Manual, CSHL, New York, 1989)] 및 문헌[Ausubel et al.(In Current Protocols in Molecular Biology, John Wiley & Sons, New York, 1998)]에 논의되어 있다.

프로브는 일반적으로 표적 핵산 분자에 상보적인 길이가 적어도 12개 뉴클레오타이드, 예를 들어, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 21개, 적어도 22개, 적어도 23개, 적어도 24개, 적어도 25개, 적어도 26개, 적어도 27개, 적어도 28개, 적어도 29개, 적어도 30개, 적어도 31개, 적어도 32개, 적어도 33개, 적어도 34개, 적어도 35개, 적어도 36개, 적어도 37개, 적어도 38개, 적어도 39개, 적어도 40개, 적어도 45개, 적어도 50개 이상의 인접 뉴클레오타이드, 예를 들어, 15 내지 50개 뉴클레오타이드, 20 내지 50개 뉴클레오타이드 또는 15 내지 30개 뉴클레오타이드의 프라미어이다. 일부 예에서, 프로브, 예를 들어, cDNA 프로브는 훨씬 더 길고, 이는 길이가 약 500개 내지 5000개 초과의 뉴클레오타이드일 수 있다.

프라이머는 프라이머와 표적 핵산 가닥 간에 하이브리드를 형성하는 핵산 혼성화에 의해 상보적인 표적 핵산 분자에 어닐링될 수 있는 짧은 핵산 분자, 예를 들어, 길이가 10개 이상의 뉴클레오타이드인 DNA 올리고뉴클레오타이드이다. 프라이머는 중합효소에 의해 표적 핵산 분자를 따라 연장될 수 있다. 따라서, 프라이머를 사용하여 표적 핵산 분자(예를 들어, 표 6에 나타낸 핵산 서열)를 증폭시킬 수 있다.

프라이머 및/또는 프로브의 특이성은 그의 길이와 함께 증가한다. 따라서, 예를 들어, 30개 연속 뉴클레오타이드를 포함하는 프라이머는 오직 15개 뉴클레오타이드의 상응하는 프라이머보다 더 높은 특이성으로 표적 서열에 어닐링할 것이다. 따라서, 보다 큰 특이성을 얻기 위하여, 적어도 15개, 20개, 25개, 30개, 35개, 40개, 45개, 50개 이상의 연속 뉴클레오타이드를 포함하는 프로브 및 프라이머가 선택될 수 있다. 특정 예에서, 프라이머는 길이가 적어도 15개 뉴클레오타이드, 예를 들어, 표적 핵산 분자에 상보적인 적어도 15개 인접 뉴클레오타이드이다. 본 발명의 방법을 실시하는데 사용될 수 있는 특정 길이의 프라이머는 증폭시킬 표적 핵산 분자에 상보적인 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 21개, 적어도 22개, 적어도 23개, 적어도 24개, 적어도 25개, 적어도 26개, 적어도 27개, 적어도 28개, 적어도 29개, 적어도 30개, 적어도 31개, 적어도 32개, 적어도 33개, 적어도 34개, 적어도 35개, 적어도 36개, 적어도 37개, 적어도 38개, 적어도 39개, 적어도 40개, 적어도 45개, 적어도 50개 이상의 인접 뉴클레오타이드를 갖는 프라이머, 예를 들어, 15 내지 50개 뉴클레오타이드, 20 내지 50개 뉴클레오타이드 또는 15 내지 30개 뉴클레오타이드의 프라이머를 포함한다. PCR 프라이머 설계에 고려되는 가장 중요한 인자 중 하나는 프라이머 길이, 용융 온도(Tm) 및 GC 함량, 특이성, 상보적 프라이머 서열 및 3'-말단 서열을 포함한다. 일반적으로, 최적의 PCR 프라이머는 일반적으로 길이가 17 내지 30개 염기이며, 약 20 내지 80%, 예를 들어, 약 50% 내지 60% G+C 염기를 함유한다. 50℃ 내지 80℃의 Tm, 예를 들어, 약 50℃ 내지 70℃가 전형적으로 바람직하다.

예를 들어, PCR, 리얼-타임(real-time) PCR 또는 당업계에 공지되어 있는 다른 핵산 증폭 방법에 의한 핵산 서열의 증폭을 위해 프라이머 쌍이 사용될 수 있다. "업스트림" 또는 "정방향" 프라이머는 핵산 서열 상의 참조 점에 대하여 5'인 프라이머이다. "다운스트림" 또는 "역방향" 프라이머는 핵산 서열 상의 참조 점에 대하여 3'인 프라이머이다. 일반적으로, 적어도 하나의 정방향 및 하나의 역방향 프라이머가 증폭 반응에 포함된다.

핵산 프로브 및 프라이머는 예를 들어, 그 목적을 위해 의도된 컴퓨터 프로그램, 예를 들어, 프라이머(Primer)(버전 0.5, ⓒ 1991, 미국 매사추세츠주 캠브리지 소재의 화이트헤드 생의료연구소(Whitehead Institute for Biomedical Research)) 또는 프라이머 익스프레스(PRIMER EXPRESS)(등록 상표) 소프트웨어(미국 캘리포니아주 포스터 시티 소재의 어플라이드 바이오시트템즈, 아베(Applied Biosystems, AB))를 사용함으로써 본 명세서에 제공된 핵산 분자에 기초하여 용이하게 제조될 수 있다.

PCR 프라이머 및 프로브 설계를 위한 추가의 지침은 문헌[Dieffenbach et al., General Concepts for PCR Primer Design in: PCR Primer, A Laboratory Manual, Cold Spring Harbor Laboratory Press, New York, 1995, pp. 133 155]; 문헌[Innis and Gelfand, Optimization of PCRs in: PCR Protocols, A Guide to Methods and Applications, CRC Press, London, 1994, pp. 511]; 및 문헌[Plasterer, Primerselect: Primer and probe design. Methods Mol. Biol. 70:520 527, 1997]에서 관찰될 수 있다.

ㆍ예후: 특정 질환 또는 장애를 앓고 있는 대상체에 대한 임상적 결과의 가능성. 암과 관련하여, 예후는 대상체가 (예를 들어, 1년, 2년, 3년, 4년 또는 5년 동안) 생존할 우도(가능성) 및/또는 종양이 전이할 우도(가능성)의 표현이다. 용어 "예측"은 본 명세서에서 환자가 약물 또는 일련의 약물에 유리하게 또는 유리하지 않게 반응할 우도 및 그 반응의 정도를 말한다. 본 발명의 예측적 방법을 임상적으로 사용하여, 임의의 특정 환자에 가장 적절한 치료 요법을 선택함으로써 치료 결정을 할 수 있다. 본 발명의 예측적 방법은 환자가 치료 요법, 예를 들어, 외과적 개입, 주어진 약물 또는 약물 조합과의 화학요법 및/또는 방사성 요법에 유리하게 반응할 것 같은지를 예측하는데 있어서 가치있는 도구이다.

ㆍ정제된: 용어 "정제된"은 절대 순도를 요구하지 않으며 오히려, 상대적 용어로 의도된다. 따라서, 예를 들어, 정제된 올리고뉴클레오타이드 제제는 올리고뉴클레오타이드가 올리고뉴클레오타이드의 복합 혼합물을 포함하는 환경에서보다는 더욱 순수한 것이다.

ㆍ 샘플: 대상체로부터 수득되는 게놈 DNA, RNA(mRNA 및 마이크로RNA를 포함), 단백질 또는 그들의 조합을 함유하는 생물학적 시료. 예에는 혈액, 소변, 타액, 조직 생검, 흡인물(aspirate), 외과적 시료 및 부검 물질이 포함되나 이들에 한정되지 않으며, 고정된 및/또는 파라핀 포매된 샘플을 포함한다. 일 예에서, 샘플은 (공지되어 있는 질환 또는 장애로 고통받지 않는 대상체, 예를 들어, 비-암 대상체로부터의)결장의 생검(예를 들어, 결정암 종양), 비암 조직의 샘플 또는 정상 조직의 샘플을 포함한다.

ㆍ서열 동일성/유사성: 둘 이상의 핵산 서열 또는 둘 이상의 아미노산 서열 사이의 동일성/유사성은 서열 간의 동일성 또는 유사성의 견지에서 표현된다. 서열 동일성은 동일성 백분율의 견지에서 측정될 수 있으며 백분율이 높을수록 서열이 더 많이 동일하다. 서열 유사성은 유사성 백분율의 견지에서 측정될 수 있으며(보존적 아미노산 치환을 설명하는); 백분율이 높을수록 서열이 더 유사하다.

비교를 위한 정렬 방법이 당업계에 잘 알려져 있다. 다양한 프로그램 및 정렬 알고리듬이 문헌[Smith & Waterman, Adv. Appl. Math. 2:482, 1981]; 문헌 [Needleman & Wunsch, J. Mol. Biol. 48:443, 1970]; 문헌[Pearson & Lipman, Proc. Natl. Acad. Sci. USA 85:2444, 1988]; 문헌[Higgins & Sharp, Gene, 73:237-44, 1988]; 문헌[Higgins & Sharp, CABIOS 5:151-3, 1989]; 문헌[Corpet et al., Nuc. Acids Res. 16:10881-90, 1988]; 문헌[Huang et al. Computer Appls. in the Biosciences 8, 155-65, 1992]; 및 문헌[Pearson et al., Meth. Mol. Bio. 24:307-31, 1994. Altschul et al., J. Mol. Biol. 215:403-10, 1990]에서 개시되어 있으며, 서열 정렬 방법 및 상동성 측정에 대해 상세하게 다루고 있다.

NCBI 기본 국소 정렬 검색 도구(Basic Local Alignment Search Tool)(BLAST)(문헌[Altschul et al., J. Mol. Biol. 215:403-10, 1990])는 국립 생명공학 센터(National Center for Biotechnology)(NCBI, 미국 메릴랜드주 20894 베테스다 소재의 룸 8N805, 빌딩 38A, 국립 의학 도서관)를 포함한 인터넷에서 서열 분석 프로그램 blastp, blastn, blastx, tblastn 및 tblastx와 연계하여 사용하기 위한 몇몇 공급처로부터 이용가능하다. 추가적인 정보는 NCBI 웹 사이트에서 찾을 수 있다.

BLASTP가 아미노산 서열을 비교하기 위해 이용되는 반면, BLASTN은 핵산 서열을 비교하기 위해 이용된다. 만약 2개의 비교 서열이 상동성을 공유하지 않는다면, 지정된 결과 파일은 정렬된 서열로서 상동성의 영역을 제시하지 않을 것이다. 2개의 비교 서열이 상동성을 공유하지 않는다면, 지정된 출력 파일은 정렬된 서열을 제시하지 않을 것이다.

일단 정렬되면, 동일한 뉴클레오타이드 또는 아미노산 잔기가 양 서열에 존재하는 위치의 개수를 계수함으로써 매치 개수가 결정된다. 서열 동일성 백분율은 매치 개수를 동정된 서열에 기재된 서열 길이 또는 연결된 길이(예를 들어, 동정된 서열에 기재된 서열로부터의 100개의 연속적인 뉴클레오타이드나 아미노산 잔기)로 나누고, 결과 값에 100을 곱해서 결정된다. 예를 들면, 1554개 뉴클레오타이드를 갖는 시험트 서열과 정렬되는 경우, 1166개의 매치를 갖는 핵산 서열은 시험 서열에 대해 75.0% 동일하다(1166÷1554*100=75.0). 서열 동일성 백분율 수치는 가장 가까운 1/10으로 반올림된다. 예를 들어, 75.11, 75.12, 75.13 및 75.14는 75.1이 되고, 75.15, 75.16, 75.17, 75.18 및 75.19는 75.2가 된다. 길이 값은 항상 정수일 것이다. 길이 값은 항상 정수일 것이다. 다른 예에서, 후술되는 동정된 서열로부터의 20개 연속 뉴클레오타이드와 정렬되는 20-뉴클레오타이드 영역을 함유하는 표적 서열은 동정된 서열에 대하여 75%의 서열 동일성을 공유하는 영역을 함유한다(다시 말하면, 15÷20*100=75).

2가지 핵산 분자가 밀접하게 관련되어 있다는 하나의 지시는 2가지 분자가 상술된 바와 같이, 엄격한 조건 하에서 서로 혼성화된다는 것이다. 높은 정도의 동일성을 보이지 않는 핵산 서열은 그럼에도 불구하고 유전 코드의 축퇴성 때문에 동일하거나 유사한(보존적) 아미노산 서열을 암호화할 수 있다. 핵산 서열에서의 변화는 모두가 실질적으로 동일한 단백질을 암호화하는 다수의 핵산 분자를 생성하기 위해 이러한 축퇴성을 이용하여 만들어질 수 있다. 예를 들면, 그러한 상동성 핵산 서열은 이러한 방법에 의해 결정된 표 6에 열거된 분자에 대하여 적어도 약 60%, 70%, 80%, 90%, 95%, 98% 또는 99% 서열 동일성을 가질 수 있다.

당업자는 이들 서열 동일성 범위는 단지 지침을 위해 제공되는 것이고, 제공된 범위가 아니더라도 상당히 유의미한 상동체를 얻을 수 있다는 것을 이해할 것이다.

ㆍ스플라이싱 또는 RNA 스플라이싱: 인트론을 제거하고 엑손을 연결하여, 진핵 세포의 세포질로 이동하는 연속 암호화 서열이 있는 성숙 mRNA를 생성하는 RNA 프로세싱.

ㆍ 전사체 또는 유전자 산물: 그의 상응하는 DNA 또는 cDNA 주형으로부터의 전사의 과정을 통하여 생성되거나 유래된 RNA 분자. 전사체는 단백질로 번역되지 않는 넓은 범위의 기타 전사체, 예를 들어, 소형 핵 RNA(snRNA), 안티센스 분자, 예를 들어, 짧은 간섭 RNA(siRNA) 및 마이크로RNA(miRNA) 및 알려지지 않은 기능의 기타 RNA 전사체에 더하여, 암호화 및 비-암호화 RNA 분자, 예를 들어, 비제한적으로 메신저 RNA(mRNA), 대안적으로 스플라이싱된 mRNA, 리보솜 RNA(rRNA), 트랜스퍼(transfer) RNA(tRNA)를 포함한다. 일부 실시형태에서, 전사체는 표 6에 나타낸 핵산 서열이다.

ㆍ치료적: 진단 및 치료 둘 모두를 포함하는 일반 용어.

ㆍ치료: 치료적 치료 및 예방적 또는 방지적 조치 모두를 포함하고, 그 목적은 표적화된 병리학적 증상 또는 장애를 예방하거나 늦추는(줄이는) 것이다. 치료를 필요로 하는 대상체에는 이미 장애가 있는 대상체뿐 아니라 장애를 갖기 쉬운 대상체 또는 장애가 예방되어야 하는 대상체가 포함된다. 종양(예를 들어, 암) 치료에서, 치료, 예를 들어, 외과술, 화학요법 또는 방사성요법은 직접적으로 종양 세포의 병적 측면을 감소시키거나, 종양 세포가 추가의 치료에 민감하게 할 수 있다.

ㆍ종양, 신생물(neoplasia), 악성 종양 또는 암: 악성이든지 양성이든지, 신생물 세포 성장 및 증식, 및 모든 전암성 및 암성 세포 및 조직, 및 세포의 비정상 및 비조절된 성장의 결과이다. 용어 "암" 및 "암성"은 통상 비조절된 세포 성장을 특징으로 하는 포유류에서의 생리학적 증상을 지칭하거나 이를 말한다. 신생물, 악성 종양, 암 및 종양은 종종 상호교환가능하게 사용되며, 과도한 세포 분열로부터 야기되는 조직 또는 세포의 비정상적 성장을 지칭한다. 개체에서의 종양의 양은 "종양 부하(tumor burden)"이며, 이는 종양의 개수, 부피 또는 중량으로 측정될 수 있다. 전이되지 않는 종양은 "양성"으로 지칭된다. 주변 조직을 침습하고/거나 전이될 수 있는 종양은 "악성"으로 지칭된다. "비-암성 조직"은 악성 신생물이 형성되나 신생물의 특징적인 병적 측면을 갖지 않는 동일한 장기로부터의 조직이다. 일반적으로, 비암성 조직은 조직학적으로 정상인 것으로 보인다. "정상 조직"은 장기의 암 또는 다른 질환 또는 장애에 의해 영향을 받지 않는 장기로부터의 조직이다. "암-부재" 대상체는 그 장기가 암으로 진단되지 않고, 검출가능한 암을 갖지 않는다.

암의 "병적 측면"은 환자의 안녕을 위태롭게 하는 모든 현상을 포함한다. 이것은 비제한적으로, 비정상적 또는 조절 불가능한 세포 성장, 전이, 인접 세포의 정상 기능의 방해, 사이토카인 또는 다른 분비 생성물의 비정상적 수준의 방출, 염증성 또는 면역학적 반응의 억제 또는 악화, 신생물, 전암 상태, 악성종양, 주변의 또는 먼 조직 또는 장기, 예를 들면 림프절 등의 침윤을 포함한다.

ㆍ종양-결절-전이(TNM): 악성 종양의 TNM 분류는 환자의 체 내에서 암의 크기를 기재하기 위한 암 병기 시스템이다. T는 원발성 종양이 인근의 조직을 침습하는지 여부를 말하며 N은 포함되는 임의의 림프절을 말하며 M은 전이를 말한다. TNM은 암이 퍼진 정도를 분류하기 위한 하나의 전세계적으로 인식되는 표준에 대한 합의를 달성하기 위하여 국제암연합(International Union Against Cancer)에 의해 개발되고 유지된다.

ㆍ상향조절 또는 활성화: 핵산 분자의 발현을 참조하여 사용되는 경우, 유전자 산물의 생성의 증가를 야기하는 임의의 과정을 말한다. 유전자 산물은 RNA(예를 들어, mRNA, rRNA, tRNA 및 구조적 RNA) 또는 단백질일 수 있다. 이에 따라, 유전자 상향조절 또는 활성화는 유전자의 전사 또는 mRNA, 예를 들어, 염증 유전자의 번역을 증가시키는 과정을 포함한다.

전사를 증가시키는 과정의 예에는 전사 개시 복합체의 형성을 촉진시키는 과정, 전사 연장 속도를 증가시키는 과정, 전사의 진행성을 증가시키는 과정 및 전사 억제(예를 들어, 전사 억제제의 결합의 차단에 의한)를 완화시키는 과정이 포함된다. 유전자 상향조절은 억제의 저해뿐 아니라, 기존 수준 초과의 발현의 자극을 포함할 수 있다. 번역을 증가시키는 과정의 예에는 번역 개시를 증가시키는 과정, 번역 연장을 증가시키는 과정 및 mRNA 안정성을 증가시키는 과정이 포함된다.

유전자 상향조절은 유전자 산물, 예를 들어, 염증 유전자의 생성의 임의의 검출 가능한 증가를 포함한다. 특정 예에서, 유전자 산물의 생성은 대조군에 비해 적어도 1.2배, 예를 들어, 적어도 2배, 적어도 3배, 적어도 4배, 적어도 5배, 적어도 8배, 적어도 10배 또는 적어도 15배 증가한다(예를 들어, 정상 세포에서의 유전자 발현 및/또는 정규화된 유전자 발현의 양).

ㆍ가중치: 본 명세서에 개시된 유전자 시그니처에 관하여, 통계적 계산에서 항목의 상대적 중요성, 예를 들어, 표 6의 전사체의 상대적 중요성을 말한다. 유전자 발현 시그니처에서 각 전사체의 가중치는 당업계에 공지되어 있는 분석 방법을 사용하여 환자 샘플의 데이터 세트에서 결정될 수 있다. 예시적인 절차는 후술된다.

본 발명의 실시 또는 시험에 적절한 방법 및 재료가 후술된다. 이러한 방법 및 재료는 단지 예시적인 것이며, 제한하는 것으로 의도되지 않는다. 본 명세서에 기재된 것과 유사하거나 동등한 방법 및 재료가 사용될 수 있다. 예를 들어, 본 발명이 속하는 분야에 널리 공지되어 있는 통상의 방법은 예를 들어 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, 1989]; 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual, 3d ed., Cold Spring Harbor Press, 2001]; 문헌[Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Associates, 1992(and Supplements to 2000)]; 문헌[Ausubel et al., Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, 4th ed., Wiley & Sons, 1999]; 문헌[Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1990]; 문헌[Harlow and Lane, Using Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1999 Oligonucleotide Synthesis,(M. J. Gait, ed., 1984)]; 문헌[Animal Cell Culture, Freshney, ed., 1987]; 문헌[Methods in Enzymology, Academic Press, Inc.)]; 문헌[Handbook of Experimental Immunology, 4.sup.th ed., D. M. Weir & C. C. Blackwell, eds., Blackwell Science Inc., 1987]; 문헌[Gene Transfer Vectors for Mammalian Cells, J. M. Miller & M. P. Calos, eds., 1987)]; 및 문헌[PCR: The Polymerase Chain Reaction, Mullis et al., eds., 1994]을 포함하는 다양한 일반적이며 더욱 구체적인 참고문헌에서 기재된다. 또한, 재료, 방법 및 예는 오직 예시적인 것이며, 제한되는 것으로 의도되지 않는다.

II. 일부 실시 형태의 기재

A. 결장암 발현 시그니처 및 이용 방법

결장암으로부터의 발현 시그니처가 본 명세서에 개시된다. 개시된 시그니처는 결장암의 예후, 결장암의 진단 및 환자 그룹의 분류에서의 응용에 사용될 수 있다. 일부 실시 형태에서, 대상체, 예를 들어, 환자로부터 수득되는 샘플은 조직 샘플에서 발현되는 전사체를 나타내는 일련의 폴리뉴클레오타이드 결합 표적으로 처리된다. 폴리뉴클레오타이드 결합 표적은 본 명세서에 기재된 시그니처를 나타내거나 이에 해당하는 상보적 폴리뉴클레오타이드 프로브로 조사하여, 전사체의 발현 수준에 대한 정보를 수득한다. 시그니처에서 전사체의 발현 수준을 나타내는 결정 점수가 임의로 계산된다. 이어서, 결정 점수를 대조군, 예를 들어, 환자 집단과 비교하며, 유전적으로 유사한 샘플은 공지되어 있는 환자 반응 또는 임상적 결과와 상호 관련된다. 예를 들어, 결장암을 위한 치료, 예를 들어, 외과적 절제술 및/또는 화학요법 후에 그에 대한 환자 반응 및 예후를 예측하기 위한 감수성 방법도 또한 제공된다. 일반적으로, 조직학적 환자 집단 데이터 및 조직 샘플을 분석하여, 결장암의 과거 병력을 갖는 환자에 대한 유전자 프로파일을 생성한다. 일부 실시 형태에서, 환자 샘플의 유전자 프로파일이 결정 점수로 전환된다. 각 환자의 임상적 결과는 각 환자의 개별 암에 대한 유전자 프로파일로부터 수학적으로 유래된 유전자 프로파일 또는 결정 점수와 상호 관련된다.

일부 실시 형태에서, 조직학적 환자 데이터를 사용하여 수학적 알고리듬이 생성되며, 결장암이 있는 새로운 환자를 위한 예측 방법에 적용된다. 일부 실시 형태에서, 알고리듬은 선택 기준, 예를 들어, 환자 결과, 치료법에 대한 반응 및 재발 등에 따라 2개의 그룹의 환자를 분리하는 임계값을 생성한다. 일부 예에서, 수학적 알고리듬 또는 임계값이 본 명세서에 기재된 예측 방법에 사용되기 전에 추가의 조직학적 환자 집단 데이터를 사용하여 입증된다. 이어서, 수학적 알고리듬 또는 임계값을 참고, 예를 들어, 대조군으로서 사용되어, 결장암의 예측 방법을 원하는 환자의 유전자 프로파일링으로부터 유래된 결정 점수를 비교할 수 있다. 일부 실시 형태에서, 이들 결과는 단독의 또는 결장암의 치료를 위한 보조 화학요법과 병용한 외과술의 효능의 게놈 증거의 평가를 가능하게 한다.

본 명세서에 기재된 시그니처는 2가지 진단 또는 예후 결과를 식별하는데 유의미하고 이를 식별할 수 있다. 본 발명의 중요한 태양은 환자를 가장 적절한 치료와 매치시키고, 예후 정보를 제공하기 위하여, 결장암 조직에서 특정 유전자의 측정된 발현을 사용하는 것이다.

일부 실시 형태에서, 대장암-집중 마이크로어레이 연구 도구를 사용하여 시그니처가 개발된다. 특정 실시 형태에서, 이러한 연구 도구는 정확한 발현 데이터를 전달할 수 있는 알맥 디아그노스틱스, 리미티드(Almac Diagnostics, Ltd.)(북 아일랜드 소재의 알맥 디아그노스틱스, 리미티드)에 의해 개발된 대장암 트랜스크립톰-집중 연구 어레이이다.

대장암 DSA(Colorectal Cancer DSA)(상표명) 연구 도구는 61,528개의 프로브 세트를 함유하며, 결장암 및 정상 조직에서 발현되는 것으로 확인된 52,306개의 전사체를 암호화한다. BLAST 분석을 사용하여 미국 국가 생물공학 센터(National Center for Biotechnology Information) 인간 참고 서열(RefSeq) RNA 데이터베이스(월드와이드웹(ncbi.nlm.nih.gov/RefSeq/)에서 이용 가능함)에 대하여 대장암 DSA(상표명) 연구 도구를 비교하여, 21,968개(42%) 전사체가 존재하며, 26,676개 (51%)의 전사체가 인간 참조서열(RefSeq) 데이터베이스로부터 부재였다. 추가로, 내용물의 7%는 주석을 단 유전자에 대한 발현된 안티센스 전사체를 나타낸다(문헌[Johnston et al., J. Clin. Oncol. 24: 3519, 2006]; 문헌[Pruitt et al., Nucleic Acids Research 33: D501-D504, 2005]). 또한, 선두적인 범용 검정법으로 비교되는 대장암 DSA(상표명)의 프로브-수준 분석에 의해, 대략 20,000개(40%)의 전사체가 선두적인 범용 플랫폼(아피메트릭스(Affymetrix)) 상에 포함되지 않으며, 대장암 DSA(상표명)에 독특한 것이 강조된다. 따라서, 대장암 DSA(상표명) 연구 도구는 지금까지 수행된 유전자 발현 연구에서 입수할 수 없는 전사체를 포함한다.

일부 실시 형태에서, 유전자 발현 시그니처에서의 전사체의 발현은 대상 증상 간에 발현 수준이 증가되거나 감소된다면, 유익한 것으로 고려된다. 유전자 발현의 증가 또는 감소는 배수 변화, t-검정, F-검정, 윌콕슨(Wilcoxon) 순위-합계 검정, ANOVA(문헌[Cui et al., Genome Biology 4:210, 2003]) 또는 마이크로어레이의 유의성 검정과 같은 차등 발현을 검출하기 위한 전용의 방법(문헌[Tusher et al., Proc. Natl. Acad. Sci. USA 98:5116-21, 2001]) 또는 LIMMA(문헌[Smyth, Stat. Appl. Genet. Mol. Biol., 3:Art.3, 2004])를 사용하는 것을 포함하나 이들에 한정되지 않는 당업자에게 공지되어 있는 방법에 의해 평가될 수 있다.

일부 실시 형태에서, 시그니처에서의 전사체를 사용하여 그들의 신호의 가중총량을 형성하며, 여기서, 개별 가중치는 양성이거나 음성일 수 있다. 생성된 총량(결정적인 기능)은 사전-결정된 참조 점과 비교한다. 참조 점과의 비교를 사용하여, 임상 증상 또는 결과를 진단하거나 예측할 수 있다.

당업자는 표 1, 표 2 및/또는 표 6에 제공된 시그니처에 포함되는 전사체가 결장암의 진단 또는 예후를 위한 시그니처에서 동등하지 않은 가중치를 지닐 것임을 인식할 것이다. 따라서, 1개만큼 적은 서열을 사용하여, 결과를 진단하거나 예측할 수 있는 한편, 특이성 및 민감성 또는 진단 또는 예측 정확성은 더 많은 서열을 사용하여 증가될 수 있다. 표 6에는 교차-검증 하에서 측정되는 화합물 결정 점수 함수에서의 평균 가중치의 순위로 정의되는, 시그니처에서의 가중치의 감소 순서로 전사체가 평가된다. 또한, 가중치 순위는 첨부된 서열 목록에서 서열 번호에 해당하며, 이에 따라 가장 큰 가중치를 갖는 전사체는 서열 번호 1이다.

일부 실시 형태에서, 시그니처는 교차-검증 하에서 측정된 화합물 결정 점수 함수에서의 평균 가중치의 순위로 정의되며, 여전히 예후 값을 갖는 가장 큰 가중치를 지니는 표 6에서의 적어도 2개, 예를 들어, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 125개, 적어도 150개, 적어도 175개, 적어도 200개, 적어도 225개, 적어도 250개, 적어도 275개, 적어도 300개, 적어도 325개, 적어도 350개, 적어도 375개, 적어도 400개, 적어도 425개, 적어도 450개, 적어도 475개, 적어도 500개, 적어도 525개, 적어도 550개, 적어도 575개, 적어도 600개, 적어도 634개 또는 심지어 모든 636개의 전사체를 포함한다. 일부 실시형태에서, 시그니처는 표 6에 열거된 가장 높은 10개의 가중 전사체, 두 번째로 가장 높은 10개의 가중 전사체, 세 번째로 가장 높은 10개의 가중 전사체, 네 번째로 가장 높은 10개의 가중 전사체, 다섯 번째로 가장 높은 10개의 가중 전사체, 여섯 번째로 가장 높은 10개의 가중 전사체, 일곱 번째로 가장 높은 10개의 가중 전사체, 여덟 번째로 가장 높은 10개의 가중 전사체, 아홉 번째로 가장 높은 10개의 가중 전사체 또는 열 번째로 가장 높은 10개의 가중 전사체를 포함한다. 추가의 실시 형태에서, 시그니처는 표 6에 열거된 가장 큰 가중치를 갖는 636, 634, 620, 610, 600, 590, 580, 570, 560, 550, 540, 530, 520, 510, 500, 490, 480, 470, 460, 450, 440, 430, 420, 410, 400, 390, 380, 370, 360, 350, 340, 330, 320, 310, 300, 290, 280, 270, 260, 250, 240, 230, 220, 210, 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 20 또는 10개의 전사체를 포함한다. 일부 실시 형태에서, 시그니처는 상술된 바와 같은 표 6으로부터의 것(예를 들어, 표 6으로부터의 적어도 약 50개, 적어도 약 100개, 적어도 약 200개, 적어도 약 300개, 적어도 약 400개, 적어도 약 500개, 또는 적어도 약 600개 또는 모든 전사체)을 포함하는 약 200 내지 약 1000개의 전사체, 예를 들어, 약 400 내지 약 800개의 전사체, 예를 들어, 약 500 내지 약 700개의 전사체, 또는 일부 실시형태에서, 약 550 내지 약 650개의 전사체의 발현 수준에 기초한다.

일 실시 형태에서, 특이적 시그니처가 MUM1 및 SIGMAR1에 대한 전사체를 포함하는 본 명세서에 개시된 방법을 위해 사용될 수 있다. 다른 실시 형태에서, 시그니처는 MUM1, SIGMAR1, ARSD, SULT1C2 및 PPFIBP1에 대한 전사체를 포함하는 본 명세서에 개시된 방법을 위해 사용될 수 있다. 또 다른 실시형태에서, 시그니처는 ARSD, CXCL9, PCLO, SLC2A3, FCGBP, SLC2A14, SLC2A3, BCL9L에 대한 전사체, 및 MUC3A, OLFM4 및 RNF39의 안티센스 서열을 포함하는 본 명세서에 개시된 방법을 위해 사용될 수 있다. 이러한 시그니처는 하기의 표 1에 나타나 있다.

[표 1]

일부 실시 형태에서, 시그니처의 성능에 대한 각 636개의 프로브세트의 기여를 결정하기 위한 개별 연구를 통해 동정된 결장암 시그니처에서의 유전자 전사체의 핵심 세트가 제공된다. 이러한 실시형태에서, 636개 프로브 세트 시그니처로부터의 10개 프로브 세트를 제거하고, 새로운 시그니처를 트레이닝 데이터 세트를 사용하여, 636개 프로브 세트에 기초하여 생성하였다. 이어서, 새로운 시그니처를 사용하여, 검증 데이터 세트를 예측하고(임계값 없이), AUC를 측정하였다. 636개 프로브 세트 시그니처로부터의 AUC의 차이를 기록하였다. 이러한 과정을 50만 번 반복하고, 상기 프로브 세트가 결여된 시그니처에 대하여 발생된 AUC의 평균 차이를 기록하였다. 가장 큰 음의 ΔAUC를 갖는 프로브 세트는 표 1에 보고되어 있다. 이러한 실시 형태에서, 이러한 10개 전사체의 세트는 시그니처에 부재인 유전자의 후보 핵심 세트가 시그니처의 예측 성능을 유의미하게 손상시키는 것을 나타낸다. 따라서, 특정 실시 형태에서, 표 1의 유전자를 나타내는 전사체가 결장암 시그니처에 포함된다. 표 1에서, DAUC는 이러한 전사체가 시그니처로부터 생략된다면 검증 AUC의 강하를 나타낸다. 배향은 결장 조직에서 발현되는 전사체의 배향을 기재한다. 이러한 시그니처에서 3개의 전사체는 MUC3A, OLFM4 및 RNF39의 안티센스 전사체로 발현된다.

일부 실시 형태에서, 시그니처는 ARSD, CXCL9, PCLO, SLC2A3, FCGBP, SLC2A14, SLC2A3, BCL9L, MUC3A, OLFM4 및 RNF39를 포함하는 표 6으로부터의 626 내지 636개의 전사체의 조합을 포함한다. 또 다른 실시 형태에서, 시그니처는 ARSD, CXCL9, PCLO, SLC2A3, FCGBP, SLC2A14, SLC2A3, BCL9L, MUC3A, OLFM4 및 RNF39를 포함하는 표 6에 열거된 전사체 10 내지 636, 10 내지 50, 50 내지 636, 100 내지 636개를 포함하며, 전사체 배향은 표 6에 나타나 있다.

명백하게 176개 전사체는 프로브-수준 분석에 의해 선두적인 포괄적인 어레이에 의해 나타나지 않는 것으로 동정되었다(다시 말하면, 그들은 상술된 대장암 DSA(상표명)에 대해 "독특하다"). 표 2에 열거된 176개 전사체의 이러한 그룹은 본 명세서에서 결장암 시그니처 및 이용 방법에 독특한 전사체로 본 명세서에 기재되어 있다. 프로브-서열-수준 상동성 검색에 의해, 이들 전사체가 선두적인 포괄적인 어레이(아피메트릭스(Affymetrix))에 함유되지 않는 것으로 확인되었다(다시 말하면, 그들은 상술된 대장암 DSA(상표명) 연구 도구에 "독특하다"). 수많은 이들 전사체는 이전에 발현되는 것으로 보고되지 않은 안티센스 전사체이다. 이들 176개 전사체는 하기 표 2에 제시되어 있으며, 여기서, 가중치 순위가 표 6에 나타낸 범위에 해당한다. 이들 독특한 전사체의 서열은 표 6에서 찾을 수 있다.

[표 2]

일부 실시 형태에서, 시그니처는 표 2에 열거된 적어도 2개, 예를 들어 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 125개, 적어도 150개, 또는 모든 176개의 전사체, 예를 들어, 교차-검증 하에 측정되는 화합물 결정 점수 함수에서 평균 가중치의 순위로 정의되는 가장 큰 가중치를 지니며, 여전히 예후 값을 갖는 것들을 포함한다. 일부 실시 형태에서, 시그니처는 표 2에 열거된 가장 높은 10개의 가중 전사체, 두 번째로 가장 높은 10개의 가중 전사체, 세 번째로 가장 높은 10개의 가중 전사체, 네 번째로 가장 높은 10개의 가중 전사체, 다섯 번째로 가장 높은 10개의 가중 전사체, 여섯 번째로 가장 높은 10개의 가중 전사체, 일곱 번째로 가장 높은 10개의 가중 전사체, 여덟 번째로 가장 높은 10개의 가중 전사체, 아홉 번째로 가장 높은 10개의 가중 전사체 또는 열 번째로 가장 높은 10개의 가중 전사체를 포함한다. 추가의 실시 형태에서, 시그니처는 표 2에 열거된 가장 큰 가중치를 갖는 176, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 20 또는 10 개의 전사체를 포함한다. 추가의 실시형태에서, 시그니처는 표 2에 열거된 가장 큰 가중치를 갖는 전사체를 포함한다.

일부 실시 형태에서, 본 명세서에 기재된 방법은 환자로부터 단리된 RNA를 유전자 발현 프로파일링으로 처리하는 단계를 포함한다. 따라서, 유전자 발현 프로파일은 일부 예에서 후술하는 바와 같이 정규화되는 표 6에 열거된 전사체 중 적어도 2개를 포함하는 유전자의 세트에 대하여 완료될 수 있다. 본 명세서에 개시된 방법의 특정 실시 형태에서, 표 6의 적어도 2개, 예를 들어, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 125개, 적어도 150개, 적어도 175개, 적어도 200개, 적어도 225개, 적어도 250개, 적어도 275개, 적어도 300개, 적어도 325개, 적어도 350개, 적어도 375개, 적어도 400개, 적어도 425개, 적어도 450개, 적어도 474개, 적어도 500개, 적어도 525개, 적어도 550개, 적어도 575개, 적어도 600개, 적어도 634개, 또는 심지어 모든 636개의 전사체, 예를 들어, 교차-검증 하에서 측정되는 화합물 결정 점수 함수에서 평균 가중치의 순위로 정의되는 가장 큰 가중치를 지니며 여전히 예후 값을 갖는 표 6의 전사체 또는 그들의 발현 산물 및/또는 상보체의 발현 수준이 결정된다. 이러한 방법의 일부 실시 형태에서, 본 명세서에 개시된 방법의 특정 실시 형태에서, 표 2의 적어도 2개, 예를 들어, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 125개, 적어도 150개, 또는 심지어 모든 적어도 176개의 전사체, 또는 그들의 발현 산물 및/또는 상보체, 예를 들어, 교차-검증 하에서 측정되는 화합물 결정 점수 함수에서 평균 가중치의 순위로 정의되는 가장 큰 가중치를 지니며 여전히 예후 값을 갖는 것들의 발현 수준이 결정된다. 본 명세서에 기재된 방법에서, 전사체의 조합은 시그니처 또는 발현 시그니처로 지칭될 수 있다.

결장 조직에서 전사체의 상대적 발현 수준을 측정하여, 유전자 발현 프로파일을 형성한다. 일 실시형태에서, 환자 조직 샘플로부터의 전사체의 세트의 유전자 발현 프로파일은 화합물 결정 점수의 형태로, 대조군 임계값와 비교하여 요약되어 있으며, 이러한 임계값에 의해 환자 데이터의 트레이닝 세트로부터 수학적으로 유도된다. 임계값에 의해 양호한/불량한 예후, 치료에 대한 반응성/비-반응성, 암 검출/진단 및 암 분류와 같으나 이에 한정되지 않는 상이한 특징에 기초하여 환자 그룹이 분류된다. 환자 트레이닝 세트 데이터는 바람직하게는 예후, 재발 가능성 또는 장기간 생존, 진단, 암 분류, 맞춤화된 유전체학 프로파일, 임상 결과, 치료 반응을 특징으로 하는 결장 조직 샘플로부터 유래된다. 환자 샘플로부터의 발현 프로파일 및 해당하는 결정 점수는 수학적으로 유도된 결정 임계값의 샘플 측 상에 있는 트레이닝 세트 내의 환자 샘플의 특징과 상호 관련될 수 있다. 이러한 실시형태에서, 선형 분류 화합물 결정 점수의 임계값을 최적화시켜, 트레이닝 데이터 세트 내에서 적용되는 교차-검증 하에서 감수성 및 특이성의 합을 최대화시켰다. 이들 방법은 또한 결장암, 특정 실시 형태에서, II기 결장암 환자의 예후를 결정하는데 유용하다. 일부 예에서, 개시된 방법은 불량한 임상 결과를 예측하는 것이며, 이는 예를 들어, 암의 외과적 제거 후에, 또는 보조 화학요법과 병용한 암의 외과적 제거 후에, 단축된 생존 또는 증가된 암 재발 위험과 관련하여 측정될 수 있다.

대상체로부터 수득되는 샘플에서 결장암을 진단하는 방법이 제공된다. 이러한 방법은 대상체로부터 수득되는 핵산을 포함하는 샘플 중의 표 6에 열거된 적어도 2개의 결장암 관련 핵산 분자의 발현 수준을 검출하는 단계 및 적어도 2개의 결장암 관련 핵산 분자의 발현 수준 또는 그들로부터 유도된 결정 점수를 결장암의 진단을 나타내는 대조군 임계값와 비교하는 단계를 포함하며, 여기서, 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도된 결정 점수는 결장암의 진단을 나타낸다. 일부 예에서, 대조군 임계값은 알려져 있는 결장암 샘플(들)에서 표 6에 열거된 결장암 관련 핵산 분자로부터의 해당하는 전사체로부터 유도되는 임계값이다.

결장암 샘플을 분류하는 방법이 제공된다. 이러한 방법은 대상체로부터 수득되는 핵산을 포함하는 샘플 중의 표 6에 열거된 적어도 2개의 결장암 관련 핵산 분자의 발현 수준을 검출하는 단계 및 적어도 2개의 결장암 관련 핵산 분자의 발현 수준 또는 그들로부터 유도된 결정 점수를 결장암의 진단을 나타내는 대조군 임계값와 비교하는 단계를 포함하며, 여기서, 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도된 결정 점수는 결장암 시료의 분류를 가능하게 한다. 일부 예에서, 대조군 임계값은 공지되어 있는 분류의 결장암 샘플(들)에서의 표 6에 열거된 결장암-관련 핵산 분자로부터의 해당하는 전사체로부터 유도되는 임계값이다. 일부 예에서, 결장암 시료는 I기, II기, III기 및 IV기로 분류된다. 일부 예에서, 상기 방법은 분류된 결장암에 효율적일 치료 계획, 예를 들어, 외과적 절제술, 화학요법, 방사선 또는 이들의 임의의 조합을 선택하는 단계를 추가로 포함한다.

결장암, 예를 들어, II기 결장암 대상체를 위한 치료에 대한 반응을 예측하는 방법이 제공된다. 이러한 방법은 대상체로부터 수득되는 핵산을 포함하는 시료 중의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계 및 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유도되는 결정 점수를 치료에 대한 공지되어 있는 반응을 나타내는 대조군 임계값와 비교하는 단계를 포함하며, 여기서, 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도되는 결정 점수는 치료에 대한 유사한 반응을 나타내며, 이에 의해, 치료에 대한 반응이 예측된다. 일부 대조군에서, 임계값은 치료에 대한 반응이 공지되어 있는 결장암 샘플(들)에서의 표 6에 열거된 결장암-관련 핵산 분자로부터의 해당하는 전사체로부터 유도되는 임계값이다. 일부 실시 형태에서, 상기 방법은 외과적 절제술, 화학요법, 방사선 또는 그들의 임의의 조합으로부터의 반응을 예측하는 방법이다.

결장암 대상체, 예를 들어, II기 결장암으로 진단된 대상체의 장기간 생존을 예측하는 방법이 제공된다. 이들 방법은 대상체로부터 수득되는 핵산을 포함하는 시료 중의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계, 및 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유도되는 결정 점수를 장기간 생존의 병력을 갖는 것을 나타내는 대조군 임계값와 비교하는 단계를 포함하며, 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도되는 결정 점수는 대상체의 장기간 생존을 나타내며, 이에 의해 대상체의 장기간 생존을 예측한다. 일부 예에서, 대조군 임계값은 장기간 생존의 이력을 갖는 대상체(들)로부터 수득되는 결장암 샘플(들)에서의 표 6에 열거된 결장암 관련 핵산 분자로부터의 해당하는 전사체로부터 유도된 임계값이다.

또한, II기 결장암을 갖는 것으로 진단된 대상체와 같은 대상체에서 결장암의 재발을 예측하는 방법이 제공된다. 이들 방법은 대상체로부터 수득되는 핵산을 포함하는 시료 중의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계 및 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유도된 결정 점수를 재발의 이력을 나타내는 대조군 임계값와 비교하는 단계를 포함하며, 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도된 결정 점수는 대상체에서의 재발을 나타낸다. 일부 예에서, 대조군 임계값은 재발의 이력을 갖는 결장암 샘플(들)에서의 표 6에 열거된 결장암-관련 핵산 분자로부터의 해당하는 전사체로부터 유래된 임계값이다.

대상체에 대한 맞춤형 결장암 유전체학 프로파일의 제조 방법이 제공된다. 상기 방법은 대상체로부터 수득되는 핵산을 포함하는 시료 중의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계 및 유전자 발현 분석에 의해 수득되는 데이터를 요약한 리포트를 생성하는 단계를 포함한다.

본 명세서에 개시된 방법의 특정 실시형태에서, 표 6에서의 적어도 2개, 예를 들어, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 125개, 적어도 150개, 적어도 175개, 적어도 200개, 적어도 225개, 적어도 250개, 적어도 275개, 적어도 300개, 적어도 325개, 적어도 350개, 적어도 375개, 적어도 400개, 적어도 425개, 적어도 450개, 적어도 474개, 적어도 500개, 적어도 525개, 적어도 550개, 적어도 575개, 적어도 600개, 적어도 634개 또는 심지어 모든 636개의 전사체에 대한 발현 수준 또는 그들의 발현 생성물을 결정하고, 대조군 임계값와 비교한다. 이들 방법의 다른 실시 형태에서, MUM1 및 SIGMAR1에 대한 발현 수준 또는 그들의 발현 생성물을 결정하고, 대조군 임계값와 비교한다. 다른 실시 형태에서, MUM1, SIGMAR1, ARSD, SULT1C2 및 PPFIBP1에 대한 발현 수준 또는 그들의 발현 생성물을 결정하고, 대조군 임계값와 비교한다. 추가의 실시 형태에서, ARSD, CXCL9, PCLO, SLC2A3, FCGBP, SLC2A14, SLC2A3, BCL9L, 및 MUC3A, OLFM4 RNF39의 안티센스 서열에 대한 발현 수준 또는 그들의 발현 생성물을 결정하고, 대조군 임계값와 비교한다. 또 다른 실시형태에서, 표 1, 표 2 및/또는 표 6 중 하나에 열거된 실질적으로 모든 전사체에 대한 발현 수준을 단계에서 결정하고 대조군 임계값과 비교한다.

개시된 방법의 일부 실시 형태에서, RNA 수준을 검정되는 RNA의 양의 차이 및 사용되는 RNA의 질의 가변성 둘 모두에 대하여 보정한다(정규화시킨다). 대조군 전사체는 양성 또는 음성 대조군으로서 검정법에 포함될 수 있으며, 판독치를 정규화시키고 신뢰성 있는 측정 데이터를 보장하나, 바람직하게는 실제의 예후를 수행하기 위해 생략된다. 전자의 정확한 아이덴티티(identity)는 전형적으로 중요하지 않으며, 매우 다양한 전사체가 본 명세서에 개시된 모든 목적을 위해 고찰된다. 정규화 대조군을 위하여, 매우 다양한 전사체가 고찰될 수 있지만, 그들은 특히, 고려 중인 예후 그룹 간에 표적 대상 조직에 대한 매우 다양한 대상체 또는 증상 간의 대략 불변의 안정한 발현의 기본적인 요건을 충족시켜야 한다. 유사하게, RNA 분해 대조군은 (과도하게) 분해된 RNA를 나타내는데 적절한 강도의 거동을 보여야 한다. 이는 양성 대조군으로서 시료의 전반적 RNA 분해와 상관없이 안정적인 강도를 보이는 RNA 대조군을 포함하거나 포함하지 않을 수 있다. 이들 대조군에 관하여, RNA 분해 단계에 대한 강도 의존성이 관찰되는 적절한 다른 RNA 대조군을 위한 강도 패턴을 분석할 것이다. 이는 전사체의 3' 말단에 대하여 프로브 서열의 다양한 위치에 따라 특정 분석을 포함하거나 포함하지 않을 수 있다.

마이크로어레이가 유전자 발현을 정량화하는데 사용되는 개시된 방법의 일부 실시 형태에서, 하나 이상의 하기의 대조군이 사용될 수 있다.

(a) 어레이 상의 특정 위치에 결합하는 표지된 형태로 고정된 특정 전사체이며, 스캐닝된 어레이의 이미지 처리에서 적절한 그리드(grid) 정렬을 보장하는 정렬 대조군.

(b) 시료 mRNA와 동일한 처리를 수행하여, cDNA 합성 및 이후의 증폭 반응의 적절한 수행을 보장하게 하는, 임의의 증폭을 수행하기 전에 고정된 특정 비표지된 전사체, 예를 들어, 폴리-A 대조군 전사체인 증폭 대조군.

(c) 이전의 증폭 반응으로부터 따로 이들 2개의 단계의 효율을 조절하기 위하여, 칩으로의 표지화 및 혼성화 전에 고정된 특정 대조군인 표지화 및 혼성화 대조군.

(d) 해당하는 표적 서열이 시료에서 이용가능하지 않은 마이크로어레이 상의 프로브 서열인 백그라운드 대조군. 따라서, 원칙적으로, 특정 표적 결합이 발생하지 않아야 한다. 이들 대조군을 사용하여, 백그라운드 또는 교차-혼성화 세기를 확립하였다. 이들은 잠재적으로 상이한 GC-함량 및 전체 마이크로어레이 상의 적절한 공간적인 분포를 특징으로 할 것이다.

(e) 측정 장치의 다양한 투입 mRNA 양, 다양한 수율의 증폭 반응 및 다양한 전반적인 감수성을 위해 보정하도록 선택되는 시료로부터 특이적으로 선택된 표적 서열을 검출하는 프로브 서열인 정규화 대조군. 이들을 사용하여, 측정된 세기 값을 보정하고, 이에 따라 예비 실험실 단계를 포함하여 전체 측정 장치의 분석 정확성의 증가를 보장할 것이다.

(f) RNA 질을 나타내고 RNA 분해를 검출하도록 고안된 그들의 각 유전자의 3' 위치에 대하여 다양한 위치로부터의 프로브 서열인 RNA 질 및 분해 대조군. 다수의 유전자로부터의 해당하는 프로브(들) 세트는 상이한 RNA 종으로부터의 상이한 RNA 분해 거동을 나타낸다.

대조군 a) 내지 d)가 서열 고려 사항에 기초하여 순수하게 유도될 수 있고 대상 조직 및 증상에 천연으로 존재하지 않아야 하지만, 대조군 e) 및 f)는 이전의 환자 데이터의 적절한 분석에 의해 선택될 수 있다. 이는 예후 유전자 시그니처가 유래되는 동일한 트레이닝 데이터이거나 그것이 아닐 수 있다.

상기 대조군이 오직 예로 제공되며, 유사한 작용성을 갖는 상이한 대조군이 사용될 본 발명의 다른 실시 형태가 예상될 수 있음(예를 들어, qPCR)이 이해되어야 한다.

B. 프로브, 프라이머 및 어레이

개시된 결장암 유전자 시그니처에 특이적인 프로브 및 프라이머가 개시된다. 또한, 개시된 결장암 시그니처에 대한 프로브를 포함하는 어레이가 개시된다. 일부 실시 형태에서, 개시된 결장암 유전자 시그니처에 특이적인 프로브는 서열 번호 1 내지 636 중 하나에 특이적으로 혼성화되는 핵산 서열 또는 그의 상보체를 포함한다. 일부 실시 형태에서, 개시된 결장암 시그니처에 대한 프로브 세트는 교차-검증 하에 측정되는 화합물 결정 점수 함수에서 평균 가중치의 순위로 정의되는 가장 큰 가중치를 지니는 표 6의 적어도 2개, 예를 들어, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 125개, 적어도 150개, 적어도 175개, 적어도 200개, 적어도 225개, 적어도 250개, 적어도 275개, 적어도 300개, 적어도 325개, 적어도 350개, 적어도 375개, 적어도 400개, 적어도 425개, 적어도 450개, 적어도 474개, 적어도 500개, 적어도 525개, 적어도 550개, 적어도 575개, 적어도 600개, 적어도 634개 또는 심지어 모든 636개의 전사체에 특이적으로 혼성화되는 프로브, 예를 들어, 서열 번호 1 내지 636 또는 그의 상보체 중 어느 하나에 특이적으로 혼성화하는 프로브를 포함하며, 여전히 예후 값을 갖는다. 일부 실시 형태에서, 개시된 결장암 시그니처에 대한 프로브 세트는 표 6에 열거된 가장 높은 10개의 가중 전사체, 두 번째로 가장 높은 10개의 가중 전사체, 세 번째로 가장 높은 10개의 가중 전사체, 네 번째로 가장 높은 10개의 가중 전사체, 다섯 번째로 가장 높은 10개의 가중 전사체, 여섯 번째로 가장 높은 10개의 가중 전사체, 일곱 번째로 가장 높은 10개의 가중 전사체, 여덟 번째로 가장 높은 10개의 가중 전사체, 아홉 번째로 가장 높은 10개의 가중 전사체 또는 열 번째로 가장 높은 10개의 가중 전사체에 특이적으로 혼성화하는 프로브를 포함한다. 추가의 실시 형태에서, 개시된 결정암 시그니처에 대한 프로브 세트는 표 6에 열거된 가장 큰 가중치를 갖는 636, 634, 620, 610, 600, 590, 580, 570, 560, 550, 540, 530, 520, 510, 500, 490, 480, 470, 460, 450, 440, 430, 420, 410, 400, 390, 380, 370, 360, 350, 340, 330, 320, 310, 300, 290, 280, 270, 260, 250, 240, 230, 220, 210, 200, 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50, 40, 30, 20 또는 10개의 전사체 또는 그의 상보체에 특이적으로 혼성화하는 프로브를 포함한다. 일부 실시 형태에서, 개시된 암 시그니처에 대한 프로브 세트는 약 200 내지 약 1000개 프로브, 예를 들어, 약 400 내지 약 800개 프로브, 예를 들어, 약 500 내지 약 700개 프로브, 예를 들어, 약 550 내지 약 650개 프로브를 포함하며, 여기서, 프로브는 표 6으로부터의 전사체를 검출한다. 추가의 프로브는 임의로 결장암에서 발현되는 전사체를 검출하거나 신호 대조군 또는 발현 수준 대조군으로 기능하는 것으로부터 선택될 수 있다. 이러한 임의의 프로브는 대장암 DSA(상표명) 도구 상에 포함되는 것들로부터 선택될 수 있다.

일부 실시 형태에서, 개시된 결장암 시그니처에 대한 프로브 세트는 MUM1 및 SIGMAR1에 대한 전사체에 특이적으로 혼성화하는 프로브를 포함한다. 다른 실시 형태에서, 개시된 결장암 시그니처에 대한 프로브 세트는 MUM1, SIGMAR1, ARSD, SULT1C2 및 PPFIBP1에 대한 전사체에 특이적으로 혼성화하는 프로브를 포함한다. 또 다른 실시 형태에서, 개시된 결장암 시그니처에 대한 프로브 세트는 ARSD, CXCL9, PCLO, SLC2A3, FCGBP, SLC2A14, SLC2A3, BCL9L에 대한 전사체, 및 MUC3A, OLFM4 및 RNF39의 안티센스 서열에 특이적으로 혼성화하는 프로브를 포함한다. 실질적으로 유전자 발현 시그니처를 대표하는 프로브 또는 프라이머의 세트가 제조될 수 있다. "유전자 발현 시그니처를 실질적으로 대표하는"은 유전자 발현 시그니처에서 암호화 또는 비-암호화 전사체의 적어도 50%, 60%, 70%, 80%, 90%, 95%, 99%, 또는 100%, 예를 들어, 표 1, 2 또는 6에 나타낸 유전자 발현 시그니처에서 암호화 또는 비-암호화 전사체 또는 그의 상보체의 적어도 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 100%에 특이적으로 혼성화하는 프로브 세트를 말한다.

유전자 발현 시그니처에서의 전사체의 3' 영역에 결합하는 프로브를 사용하는 것이 유리하며, 여기서, 특히 유전자 발현을 위해 분석해야 하는 환자 조직은 파라핀 포매된 조직으로부터 추출되는 RNA이다. 전형적으로, 각 프로브는 전사체의 3' 말단의 1kb 또는 500bp 또는 300bp 또는 200bp 또는 100bp에서 발생하는 각 전사체 내의 상보적 서열에 혼성화될 수 있다. mRNA의 경우에, "전사체의 3' 말단"은 본 명세서에서 폴리(A) 테일을 포함하지 않는 폴리아데닐화 부위로 정의된다.

일 실시 형태에서, 시그니처의 전체 절대 가중치의 30%를 구성하는 프로브의 풀(pool)을 사용한다. 대안적인 실시 형태에서, 시그니처의 전체 절대 가중치의 40%, 60%, 70%, 80%, 90%, 95% 또는 100%를 구성하는 프로브의 푸울을 본 명세서에 기재된 방법에서 사용한다. 마커의 포함에 대한 기초뿐 아니라, 참조 세트에 대한 mRNA 수준 변이의 임상적 유의성이 하기에 나타나 있다. 일부 실시 형태에서, 개시된 프로브는 어레이의 일부이며, 예를 들어, 프로브는 고체 기재에 결합된다. 예시적인 핵산 어레이 및 이러한 어레이의 제조 방법이 하기 섹션 D에 논의되어 있다.

일부 실시 형태에서, 개시된 결장암 유전자 시그니처에 특이적인 프로브는 핵산 어레이, 예를 들어, 마이크로어레이의 일부이다. 일부 예에서, 이러한 어레이는 서열 번호 1 내지 636 중 하나에 특이적으로 혼성화되는 핵산 서열 또는 그의 상보체이다. 일부 실시 형태에서, 핵산 어레이, 예를 들어, 마이크로어레이는 표 6의 적어도 2개, 예를 들어, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 125개, 적어도 150개, 적어도 175개, 적어도 200개, 적어도 225개, 적어도 250개, 적어도 275개, 적어도 300개, 적어도 325개, 적어도 350개, 적어도 375개, 적어도 400개, 적어도 425개, 적어도 450개, 적어도 474개, 적어도 500개, 적어도 525개, 적어도 550개, 적어도 575개, 적어도 600개, 적어도 634개, 또는 심지어 모든 636개의 전사체에 특이적으로 혼성화되는 프로브를 포함한다. 일부 실시 형태에서, 개시된 결장암 시그니처에 대한 핵산 어레이는 표 6에 열거된 가장 높은 10개의 가중 전사체, 두 번째로 가장 높은 10개의 가중 전사체, 세 번째로 가장 높은 10개의 가중 전사체, 네 번째로 가장 높은 10개의 가중 전사체, 다섯 번째로 가장 높은 10개의 가중 전사체, 여섯 번째로 가장 높은 10개의 가중 전사체, 일곱 번째로 가장 높은 10개의 가중 전사체, 여덟 번째로 가장 높은 10개의 가중 전사체, 아홉 번째로 가장 높은 10개의 가중 전사체 또는 열 번째로 가장 높은 10개의 가중 전사체에 특이적으로 혼성화하는 프로브를 포함한다. 추가의 실시 형태에서, 개시된 결장암 시그니처에 대한 핵산 어레이는 표 6에 열거된 가장 큰 가중치를 갖는 636개, 634개, 620개, 610개, 600개, 590개, 580개, 570개, 560개, 550개, 540개, 530개, 520개, 510개, 500개, 490개, 480개, 470개, 460개, 450개, 440개, 430개, 420개, 410개, 400개, 390개, 380개, 370개, 360개, 350개, 340개, 330개, 320개, 310개, 300개, 290개, 280개, 270개, 260개, 250개, 240개, 230개, 220개, 210개, 200개, 190개, 180개, 170개, 160개, 150개, 140개, 130개, 120개, 110개, 100개, 90개, 80개, 70개, 60개, 50개, 40개, 30개, 20개 또는 10개의 전사체 또는 그의 상보체에 특이적으로 혼성화하는 프로브를 포함한다. 일부 실시 형태에서, 개시된 결장암 시그니처에 대한 핵산 어레이는 약 200개 내지 약 1000개의 프로브, 예를 들어, 약 400개 내지 약 800개 프로브, 예를 들어, 약 500개 내지 약 700개 프로브, 예를 들어, 약 550 내지 약 650개 프로브를 포함하며, 여기서, 프로브는 표 6으로부터의 전사체를 검출한다. 추가의 프로브는 임의로 결장암에 발현되는 전사체를 검출하거나 신호 대조군 또는 발현 수준 대조군으로 기능하는 것으로부터 선택될 수 있다. 이러한 임의의 프로브는 대장암 DSA(상표명) 도구에 포함되는 것으로부터 선택될 수 있다. 일부 실시 형태에서, 개시된 결장암 시그니처에 대한 핵산 어레이는 약 1000개 초과의 프로브를 포함한다.

또한, 결장암 핵산을 위한 유전자 발현 시그니처의 증폭을 위한 프라이머 쌍이 개시된다. 일부 예에서, 프라이머 쌍은 서열 번호 1 내지 636에 기재된 핵산 서열 중 임의의 것 또는 그의 상보체에 특이적으로 혼성화하는 핵산 서열을 포함하는 정방향 프라이머 15 내지 40개 뉴클레오타이드 길이 및 서열 번호 1 내지 636에 기재된 핵산 서열 중 임의의 것 또는 그의 상보체에 특이적으로 혼성화하는 핵산 서열을 포함하는 역방향 프라이머 15 내지 40개 뉴클레오타이드 길이를 포함하며, 여기서, 프라이머의 세트는 핵산의 증폭을 지시할 수 있다.

또한, 결장암 핵산에 대한 유전자 발현 시그니처의 증폭을 위한 프라이머 쌍의 세트가 개시된다. 일부 실시 형태에서, 개시된 결장암 시그니처에 대한 프라이머 세트는 교차-검정 하에 측정되는 화합물 결정 점수 기능에서 평균 가중치의 순위로 결정되는 가장 큰 가중치를 지니는 표 6의 적어도 2개, 예를 들어 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 적어도 50개, 적어도 55개, 적어도 60개, 적어도 65개, 적어도 70개, 적어도 75개, 적어도 80개, 적어도 85개, 적어도 90개, 적어도 95개, 적어도 100개, 적어도 125개, 적어도 150개, 적어도 175개, 적어도 200개, 적어도 225개, 적어도 250개, 적어도 275개, 적어도 300개, 적어도 325개, 적어도 350개, 적어도 375개, 적어도 400개, 적어도 425개, 적어도 450개, 적어도 474개, 적어도 500개, 적어도 525개, 적어도 550개, 적어도 575개, 적어도 600개, 적어도 634개, 또는 심지어 모든 636개의 전사체에 특이적으로 혼성화되고 이를 증폭시킬 수 있으며, 여전히 예후 값을 갖는 프라이머, 예를 들어, 서열 번호 1 내지 636 또는 그의 상보체 중 어느 것에 특이적으로 혼성화되고 이를 증폭시킬 수 있는 프라이머를 포함한다. 일부 실시 형태에서, 개시된 결장암 시그니처에 대한 프라이머 세트는 표 6에 열거된 가장 높은 10개의 가중 전사체, 두 번째로 가장 높은 10개의 가중 전사체, 세 번째로 가장 높은 10개의 가중 전사체, 네 번째로 가장 높은 10개의 가중 전사체, 다섯 번째로 가장 높은 10개의 가중 전사체, 여섯 번째로 가장 높은 10개의 가중 전사체, 일곱 번째로 가장 높은 10개의 가중 전사체, 여덟 번째로 가장 높은 10개의 가중 전사체, 아홉 번째로 가장 높은 10개의 가중 전사체 또는 열 번째로 가장 높은 10개의 가중 전사체에 특이적으로 혼성화하고 이를 증폭시킬 수 있는 프라이머를 포함한다. 추가의 실시 형태에서, 개시된 결장암 시그니처에 대한 프라이머 세트는 표 6에 열거된 가장 큰 가중치를 갖는 636개, 634개, 620개, 610개, 600개, 590개, 580개, 570개, 560개, 550개, 540개, 530개, 520개, 510개, 500개, 490개, 480개, 470개, 460개, 450개, 440개, 430개, 420개, 410개, 400개, 390개, 380개, 370개, 360개, 350개, 340개, 330개, 320개, 310개, 300개, 290개, 280개, 270개, 260개, 250개, 240개, 230개, 220개, 210개, 200개, 190개, 180개, 170개, 160개, 150개, 140개, 130개, 120개, 110개, 100개, 90개, 80개, 70개, 60개, 50개, 40개, 30개, 20개 또는 10개의 전사체 또는 그들의 상보체에 특이적으로 혼성화되고 이를 증폭시킬 수 있는 프라이머를 포함한다.

일부 실시 형태에서, 개시된 결장암 시그니처에 대한 프라이머 세트는 MUM1 및 SIGMAR1에 대한 전사체에 특이적으로 혼성화되고, 이를 증폭시킬 수 있는 프라이머를 포함한다. 다른 실시 형태에서, 개시된 결장암 시그니처에 대한 프라이머 세트는 MUM1, SIGMAR1, ARSD, SULT1C2 및 PPFIBP1에 대한 전사체에 특이적으로 혼성화되고 이를 증폭시킬 수 있는 프라이머를 포함한다. 또 다른 실시 형태에서, 개시된 결장암 시그니처에 대한 프로브 세트는 ARSD, CXCL9, PCLO, SLC2A3, FCGBP, SLC2A14, SLC2A3, BCL9L에 대한 전사체, 및 MUC3A, OLFM4 및 RNF39의 안티센스 서열에 특이적으로 혼성화되는 프로브를 포함한다. 실질적으로 유전자 발현 시그니처를 나타내는 프로브 또는 프라이머의 세트가 제조될 수 있다. "실질적으로 유전자 발현 시그니처를 나타내는"은 유전자 발현 시그니처에서의 암호화 또는 비-암호화 전사체의 적어도 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 100%, 예를 들어, 표 1, 2 또는 6에 나타낸 유전자 발현 시그니처에서 암호화 또는 비-암호화 전사체 또는 그의 상보체의 적어도 50%, 60%, 70%, 80%, 90%, 95%, 99% 또는 100%에 특이적으로 혼성화되는 프로브 세트를 말한다.

C. 결장암 시그니처의 통계적 결정

개시된 결장암 시그니처는 통계적 방법에 의해 평가될 수 있다. 일부 실시 형태에서, 환자 조직 샘플의 유전자 발현 프로파일은 선형 분류자에 의해 평가된다. 본 명세서에 사용되는 선형 분류자는 화합물 결정 점수("결정 함수")로의 개별 유전자 세기의 가중 총량을 말한다. 이어서, 결정 점수는 샘플이 임계값 초과인지(양의 결정 함수) 미만인지(음의 결정 함수)를 나타내는 감수성 및 특이성의 면에서 특정 설정점에 해당하는 사전-정의된 컷-오프 임계값와 비교된다.

효과적으로, 이는 데이터 공간, 다시 말하면, 유전자 발현 값의 모든 가능한 조합의 세트가 상이한 임상적 분류 또는 예측에 해당하는 2가지 상호 배타적인 절반, 예를 들어, 양호한 예후에 해당하는 것과 불량한 예후에 해당하는 것으로 나누는 것을 의미한다. 전체 시그니처의 맥락에서, 특정 유전자의 상대적 과발현은 결정 점수를 증가(양의 가중치)시키거나 그를 감소(음의 가중치)시킬 수 있으며, 이에 따라, 예를 들어, 불량한 또는 양호한 예후의 전반적인 결정에 기여한다.

이러한 양의 해석, 즉 양호환 대 불량한 예후에 대한 컷-오프 임계값은 공지되어 있는 결과가 있는 환자의 세트로부터의 개발 단계("트레이닝")에서 유도된다. 결정 점수에 대한 해당하는 가중치 및 양호한/불량한 예후 컷-오프 임계값은 해당 분야의 숙련자에게 공지되어 있는 방법에 의해 트레이닝 데이터로부터 선험적으로 고정된다. 본 발명의 방법의 바람직한 실시 형태에서, 부분 최소 제곱 분석(PLS-DA)은 가중치를 결정하는데 사용된다(문헌[Stahle, J. Chemom. 1 185-196, 1987]; 문헌[Nguyen and Rocke, Bioinformatics 18 39-50, 2002]). 또한, 해당 분야의 숙련자에게 공지되어 있는 분류를 수행하는 다른 방법은 결장암 시그니처의 전사체에 적용되는 경우, 본 명세서에 기재된 방법으로 이루어질 수 있다.

상이한 방법을 사용하여, 이들 유전자 또는 그들의 산물에서 측정되는 정량적 데이터를 예후 또는 다른 예측적 이용으로 전환시킬 수 있다. 이들 방법은 패턴 인식(문헌[Duda et al. Pattern Classification, 2nd ed., John Wiley, New York 2001]), 머신 런닝(machine learning)(문헌[Schoelkopf et al. Learning with Kernels, MIT Press, Cambridge 2002], 문헌[Bishop, Neural Networks for Pattern Recognition, Clarendon Press, Oxford 1995]), 통계학(문헌[Hastie et al. The Elements of Statistical Learning, Springer, New York 2001]), 생물정보학(문헌[Dudoit et al., J. Am. Statist. Assoc. 97:77-87, 2002]; 문헌[Tibshirani et al., Proc. Natl. Acad. Sci. USA 99:6567-6572, 2002]) 또는 케모메트릭스(chemometrics)(문헌[Vandeginste, et al., Handbook of Chemometrics and Qualimetrics, Part B, Elsevier, Amsterdam 1998])를 포함하나 이들에 한정되지 않는다.

일부 실시 형태에서, 트레이닝 단계에서, 양호한 및 불량한 예후 경우에 대해 환자 샘플의 세트를 측정하고, 이러한 트레이닝 데이터로부터 고유 정보를 사용하여 최적화하고, 트레이닝 세트 또는 장래의 샘플 세트를 최적으로 예측한다. 사용되는 이러한 트레이닝 단계에서, 방법은 특정 세기 패턴으로부터 특정 예후 요구를 예측하기 위해 트레이닝되고 지표화된다. 적절한 변화 또는 사전-처리 단계를 예후 단계 또는 알고리듬으로 처리하기 전에, 이를 측정된 데이터를 사용하여 수행될 수 있다.

일부 실시 형태에서, 각 전사체에 대한 사전-처리된 세기 값의 가중 총량이 형성되며, 트레이닝 세트에 최적화된 임계값 값과 비교한다(문헌[Duda et al. Pattern Classification, 2^nd ed., John Wiley, New York 2001]). 가중치는 부분최소자승법(PLS, (문헌[Nguyen et al., 2002, Bioinformatics 18 (2002) 39-50])) 또는 지지 벡터 기계(Support Vector Machines)(SVM, (문헌[SchOlkopf et al. Learning with Kernels, MIT Press, Cambridge 2002]))를 포함하나 이에 한정되지 않는 다수의 선형 분류 방법으로 유도될 수 있다.

일부 실시 형태에서, 데이터는 예를 들어, 상기 기재된 바와 같이, 가중 총량을 적용하기 전에 비-선형으로 변환된다. 이러한 비-선형 변환은 데이터의 차원수를 증가시키는 것을 포함할 수 있다. 또한, 비-선형 변환 및 가중 총량은 예를 들어, 커널 함수의 사용을 통하여, 맹목적으로 수행될 수 있다(문헌[Scholkopf et al. Learning with Kernels, MIT Press, Cambridge 2002]).

일부 실시 형태에서, 새로운 데이터 샘플을 측정된 트레이닝 샘플 또는 인공으로 생성된 프로토타입 중 어느 하나인 둘 이상의 분류의 프로토타입과 비교한다. 이러한 비교는 적절한 유사성 측정치, 예를 들어, 비제한적으로, 유클리드 거리(문헌[Duda et al. Pattern Classification, 2^nd ed., John Wiley, New York 2001]), 상관 계수(문헌[van't Veer, et al., Nature 415:530, 2002]) 등을 사용하여 수행된다. 이어서, 새로운 샘플은 가장 가까운 프로토타입 또는 근처에 있는 가장 큰 수의 프로토타입을 갖는 예후 그룹에 할당된다.

일부 실시 형태에서, 결정수(문헌[Hastie et al. The Elements of Statistical Learning, Springer, New York 2001]) 또는 랜덤 포레스트(random forests)(문헌[Breiman, 2001Random Forests, Machine Learning 45:5])를 사용하여, 전사체 세트 또는 그들의 산물에 대한 측정된 세기 데이터로부터 예후 호출을 만든다.

일부 실시 형태에서, 신경망(문헌[Bishop, Neural Networks for Pattern Recognition, Clarendon Press, Oxford 1995])을 사용하여 전사체 세트 또는 그들의 산물에 대한 측정된 세기 데이터로부터 예후 호출을 만든다.

일부 실시 형태에서, 선형, 대각선형(diagonal linear), 이차 및 로지스틱 판별 분석을 포함하나 이에 한정되지 않는 판별 분석(문헌[Duda et al. Pattern Classification, 2^nd ed., John Wiley, New York 2001])을 사용하여 전사체 세트 또는 그들의 산물에 대한 측정된 세기 데이터로부터 예후 호출을 만든다.

일부 실시 형태에서, 마이크로어레이용의 예측 분석(Prediction Analysis for Microarrays : PAM)(문헌[Tibshirani et al., Proc. Natl. Acad. Sci. USA 99:6567-6572, 2002])을 사용하여 전사체 세트 또는 그들의 산물에 대한 측정된 세기 데이터로부터 예후 호출을 만든다.

일부 실시 형태에서, 클래스 유사의 소프트 독립적 모델링(Soft Independent Modelling of Class Analogy; SIMCA)(문헌[Wold, 1976, Pattern Recogn. 8:127-139])을 사용하여, 전사체 세트 또는 그들의 산물에 대한 측정된 세기 데이터로부터 예후 호출을 만든다.

D. mRNA의 결정을 위한 방법

유전자 발현이 대상 유전자를 암호화하는 mRNA의 검출에 의해 평가될 수 있다. 따라서, 개시된 방법은 mRNA를 평가하는 것을 포함할 수 있다. RNA는 상업적으로 입수할 수 있는 키트를 포함하는 해당 분야에 널리 알려져 있는 방법을 사용하여 대상체로부터의 종양의 샘플(예를 들어, 결장암 종양), 대상체로부터의 인접한 비-종양 조직의 샘플, 정상의(건강한) 대상체로부터의 종양-부재 조직의 샘플 또는 그들의 조합으로부터 단리될 수 있다.

일반적인 mRNA 추출 방법이 해당 분야에 널리 알려져 있으며, 문헌[Ausubel et al., Current Protocols of Molecular Biology, John Wiley and Sons (1997)]을 포함하는 분자 생물학의 표준 교과서에 개시되어 있다. 파라핀 포매된 조직으로부터의 RNA 추출 방법이 예를 들어[Rupp and Locker, Biotechniques 6:56-60, 1988] 및 문헌[De Andres et al., Biotechniques 18:42-44, 1995]에 개시되어 있다. 일 예에서, RNA 분리는 제조처의 지시에 따라 상업적 제조처, 예를 들어, 퀴아젠(QIAGEN)(등록 상표)(미국 캘리포니아주 발렌시아 소재)으로부터의 정제 키트, 완충제 세트 및 프로테아제를 사용하여 수행될 수 있다. 예를 들어, 배양물(예를 들어, 대상체로부터 수득되는 것) 중의 세포로부터의 전체 RNA는 퀴아젠(QIAGEN)(등록 상표) RNeasy(등록 상표) 미니-컬럼을 사용하여 단리될 수 있다. 다른 상업적으로 입수할 수 있는 RNA 단리 키트는 마스터퓨어(MASTERPURE)(등록 상표) 완전 DNA 및 RNA 정제 키트(에피센터(EPICENTRE)(미국 위스콘신주 매디슨 소재), 및 파라핀 블록 RNA 단리 키트(앰비온, 인코포레이티드(Ambion, Inc.))를 포함한다. 조직 샘플로부터의 전체 RNA는 RNA Stat-60(텔-테스트(Tel-Test))를 사용하여 단리될 수 있다. 종양 또는 다른 생물학적 샘플로부터 제조되는 RNA는 예를 들어, 염화세슘 밀도 구배 원심분리에 의해 단리될 수 있다.

본 명세서에 기재된 본 발명의 시그니처 및 방법은 세트 내의 모든 마커의 검정을 위하여 보존 파라핀-포매된 생검 재료의 이용을 수용하며, 이에 따라, 가장 널리 이용가능한 유형의 생검 물질과 양립할 수 있다. 결장 조직 샘플 중의 전사체의 발현 수준은 포르말린-고정된, 파라핀-포매된 조직 샘플, 용액, 예를 들어, RNAlater(등록 상표)에서 저장되는 신선한 동결된 조직 또는 신선한 조직으로부터 수득되는 RNA를 사용하여 결정될 수 있다. RNA의 단리는 예를 들어, 상기 기재된 또는 출원서의 임의의 절차 후에 또는 당업계에 공지되어 있는 임의의 다른 방법에 의해 수행될 수 있다. 모든 유전자 발현 프로파일링 기술뿐 아니라 단백질 유전 정보학 기술이 본 명세서에 기재된 방법을 수행하는데 사용하기에 적절한 한편, 유전자 발현 수준은 종종 DNA 마이크로어레이 기술에 의해 결정된다.

조직의 공급원이 포르말린-고정된, 파라핀 포매된 조직 샘플이면, RNA가 단편화되어 정보의 소실이 야기될 수 있다. 본 명세서에 제공된 시그니처는 그들의 3' 말단으로부터 시퀀싱된 전사체의 푸울로부터 유도되며, 이에 의해, 조직의 트랜스크립톰의 정확한 표현이 제공된다. 따라서, 본 명세서에 제공된 시그니처는 신선한 동결된 및 고정된 파라핀-포매된 조직 둘 모두에 유용하다. 일부 실시 형태에서, 본 명세서에 기재된 방법에 사용되는 RNA 샘플은 하나 이상의 하기의 단계, 예를 들어, 모든 하기의 단계를 사용하여, 고정된, 왁스-포매된 결장 조직 시료로부터 제조될 수 있다.

(a) 통상의 방법을 사용하고, 유기 용매 중에서의 다수의 세정 단계를 사용한 탈파라핀화(deparaffinizing).

(b) 대기 건조 및 조직으로부터의 RNA의 방출을 야기하는 세포간- 및 세포내 결합을 파괴하기 위한 프로테아제로의 처리.

(c) 오염하는 게놈 DNA의 제거.

(d) 유기 용매 중에서의 세정 및 적절한 RNase-부재 용리 완충제에서의 용리.

또한, RNA-추출 방법은 이러한 방식으로 보존된 조직에서 발생하는 포르말린 가교 결합을 역전시키는 추가의 기능을 가져, 다운스트림 검정법에서의 성능을 위하여 RNA 수율 및 질을 향상시키는 고도의 변성 용해 완충제 중에서의 조직의 인큐베이션을 포함할 수 있다.

RNA 회수 후에, RNA는 임의로 추가로 정제되어, 오염 DNA 또는 단백질이 실질적으로 없는 RNA가 야기될 수 있다. 추가의 RNA 정제는 임의의 상술된 RNA 회수 기술에 의해 또는 상업적으로 입수할 수 있는 RNA 클린업(cleanup) 키트, 예를 들어, RNeasy(등록 상표) MinElute(등록 상표) 클린업 키트(Cleanup Kit)(퀴아젠(QIAGEN)(등록 상표))의 사용으로 달성될 수 있다. 조직 시료는 예를 들어, 종양으로부터 수득될 수 있으며, RNA는 종양 세포가 풍부한 조직 시료의 미세절개 부분으로부터 수득될 수 있다.

유전자 발현 프로파일링 방법은 폴리뉴클레오타이드의 혼성화 분석에 기초한 방법 및 폴리뉴클레오타이드의 시퀀싱에 기초한 방법을 포함한다. 일부 예에서, 샘플 중의 mRNA 발현은 노던 블롯팅(Northern blotting) 또는 동소 혼성화(in situ hybridization)(문헌[Parker & Barnes, Methods in Molecular Biology 106:247-283, 1999]); RNAse 보호 검정법(문헌[Hod, Biotechniques 13:852-4, 1992]); 및 PCR-기반의 방법, 예를 들어, 역전사 중합효소 연쇄 반응(RT-PCR)(문헌[Weis et al., Trends in Genetics 8:263-4, 1992])을 사용하여 정량화된다. 대안적으로, DNA 듀플렉스(duplex), RNA 듀플렉스 및 DNA-RNA 하이브리드 듀플렉스 또는 DNA-단백질 듀플렉스를 포함하는 특이적 듀플렉스를 인식할 수 있는 항체가 사용될 수 있다. 시퀀싱-기반의 유전자 발현 분석을 위한 대표적인 방법은 SAGE(Serial Analysis of Gene Expression) 및 MPSS(massively parallel signature sequencing)에 의한 유전자 발현 분석을 포함한다. 일 예에서, RT-PCR을 사용하여 상이한 샘플 중의 mRNA 수준을 비교하여, 유전자 발현의 패턴을 특성화하여, 밀접하게 관련된 mRNA를 판별하고 RNA 구조를 분석할 수 있다. 특정 예에서, 개시된 결장암 시그니처는 핵산 마이크로어레이 기술, PCR 기술 또는 그들의 조합에 의해 분석된다.

1. 마이크로어레이 방법을 사용한 유전자 발현 프로파일링

일부 실시 형태에서, 결장암-관련 유전자 및/또는 전사체, 예를 들어, 표 6에 나타낸 것의 발현 프로파일은 마이크로어레이 기술을 사용하여 신선한 또는 파라핀-포매된 종양 조직 중 어느 하나에서 측정할 수 있다. 이러한 방법에서, 대상 폴리뉴클레오타이드 서열. 예를 들어, 표 6에 나타낸 핵산 서열 또는 그의 상보체에 특이적으로 혼성화되는 폴리뉴클레오타이드 서열은 마이크로칩 기판 상에 플레이팅되거나 배열된다. 이어서, 배열된 서열은 대상 세포 또는 조직으로부터의 핵산과 혼성화된다.

RT-PCR 방법(하기 참조)에서와 같이, mRNA의 공급원은 통상 인간 종양 또는 종양 세포주 및 해당하는 정상 조직 또는 세포주로부터 단리된 전체 RNA이다. 따라서, RNA는 다양한 원발성 종양 또는 종양 세포주로부터 단리될 수 있다. mRNA의 공급원이 원발성 종양이면, mRNA는 매일의 임상 실습에서 통상적으로 제조되고 보존된, 예를 들어, 동결되거나 보존 파라핀-포매된 및/또는 고정된(예를 들어, 포르말린-고정된) 조직 샘플로부터 추출될 수 있다.

마이크로어레이 기술의 특정 실시형태에서, cDNA 클론 또는 올리고뉴클레오타이드의 PCR 증폭된 삽입물은 덴스 어레이(dense array)에서 기판에 적용된다. 또한, 짧은 올리고뉴클레오타이드는 예를 들어, 반도체-기반의 포토리소그래피 및 고체상 화학적 합성 기술의 조합을 사용하여 기판 상에서 직접 합성될 수 있다(미국 캘리포니아주 산타클라라 소재의 아피메트릭스, 인코포레이티드(Affymetrix, Inc.)). 일 실시형태에서, 적어도 10,000개의 뉴클레오타이드 서열이 기판 상에 존재한다. 기판 상에 고정화된 미세배열된 전사체는 엄격한 조건 하에서의 혼성화에 적절하다. 형광 표지된 뉴클레오타이드 프로브는 대상 조직으로부터 추출된 RNA의 역전사에 의한 형광 뉴클레오타이드의 혼입을 통해 생성될 수 있다. 어레이에 적용되는 표지된 프로브는 어레이 상의 각 뉴클레오타이드에 특이적으로 혼성화된다. 비특이적으로 결합된 프로브를 제거하기 위한 세정 후에, 어레이는 공초점 레이저 현미경에 의해 또는 다른 검출 방법, 예를 들어, CCD 카메라에 의해 스캐닝된다. 각각의 배열된 요소의 혼성화의 정량화에 의해, 해당하는 전사체 존재비의 평가가 가능해진다.

이중 색상 형광을 사용하여, 2가지 공급원으로부터 생성되는 따로 표지된 뉴클레오타이드 프로브가 어레이에 쌍으로 혼성화될 수 있다. 소형화된 규모의 혼성화는 매우 다수의 유전자에 대한 발현 패턴의 편리하고 신속한 평가를 제공한다. 이러한 방법은 세포당 소수의 카피로 발현되는 드문 전사체를 검출하고, 발현 수준의 적어도 대략 2배의 차이를 재생가능하게 검출하는데 필요한 감수성을 갖는 것으로 보인다(문헌[Schena et al., Proc. Natl. Acad. Sci. USA 93(2):106 149 (1996)]). 또한, 마이크로어레이 분석은 제조처의 프로토콜에 따라, 예를 들어, 아피메트릭스 진칩(등록 상표) 기술(미국 캘리포니아주 산타 클라라 소재의 아피메트릭스, 인코포레이티드) 또는 아질런트 마이크로어레이 기술(미국 캘리포니아주 산타 클라라 소재의 아질런트 테크놀로지즈, 인코포레이티드(Agilent Technologies, Inc.))을 사용하여, 상업적으로 입수할 수 있는 장비에 의해 수행될 수 있다.

유전자 발현의 대규모 분석을 위한 마이크로어레이 방법의 개발에 의해, 다양한 종양 유형, 예를 들어, 결장암 종양에서 암 분류 및 결과 예측의 분자 마커를 통합적으로 검색할 수 있게 된다.

본 명세서에 제공되는 특정 실시 형태에서, 어레이를 사용하여 결장암 유전자 발현 프로파일을 평가할 수 있으며, 예를 들어, 결장암 환자를 예후하거나 진단할 수 있다. 표 1, 표 2에 열거된 유전자 및/또는 표 6에 열거된 전사체에 특이적인 프로브 또는 프라이머로 본질적으로 이루어진 어레이를 기재하는 경우, 이러한 어레이는 이들 결장암 관련 유전자에 특이적인 프로브 또는 프라이머를 포함하며, 대조군 프로브를 추가로 포함할 수 있다(예를 들어, 인큐베이션 조건을 확인하기 위해 충분함). 예시적인 대조군 프로브는 GAPDH, β-액틴 및 18S RNA를 포함한다.

i. 어레이 기판

어레이의 고체 지지체는 무기 재료(예를 들어, 유리) 또는 유기 폴리머로부터 형성될 수 있다. 고체 지지체에 적절한 재료에는 폴리프로필렌, 폴리에틸렌, 폴리부틸렌, 폴리아이소부틸렌, 폴리부타다이엔, 폴리아이소프렌, 폴리비닐피롤리딘, 폴리테트라플루오로에틸렌, 폴리비닐리덴 다이플루오라이드, 폴리플루오로에틸렌-프로필렌, 폴리에틸렌비닐 알코올, 폴리메틸펜텐, 폴리클로로트라이플루오로에틸렌, 폴리설폰, 하이드록실화 2축 연신 폴리프로필렌, 에틸렌아크릴산, 에틸렌 메타크릴산 및 그들의 코폴리머의 배합물(미국 특허 제5,985,567호 참조)이 포함되나 이들에 한정되지 않는다.

일반적으로, 고체 지지체 표면을 형성하기 위해 사용될 수 있는 물질의 적절한 특징은 활성화 시에, 지지체의 표면에 생물분자, 예를 들어, 올리고뉴클레오타이드를 공유 부착시킬 수 있도록 표면 활성화되기 쉬움. 생물분자가 "동소에서" 합성되기 쉬움 올리고뉴클레오타이드에 의해 점유되지 않는 지지체 상의 영역에서, 비특이적으로 결합되기 쉽지 않거나, 비특이적인 결합이 발생하는 경우, 이러한 재료가 올리고뉴클레오타이드의 제거 없이 표면으로부터 용이하게 제거될 수 있도록 화학적으로 불활성임.

다른 예에서, 표면 활성화 유기 폴리머는 고체 지지체 표면으로 사용된다. 표면 활성화 유기 폴리머의 일 예는 무선 주파수 플라스마 방전을 통하여 아민화된 폴리프로필렌 물질이다. 또한, 다른 반응성 기, 예를 들어, 하이드록실화, 티올화 또는 활성 에스테르기가 사용될 수 있다.

ii. 어레이 형식

매우 다양한 어레이 형식은 본 발명에 따라 사용될 수 있다. 일 예는 일반적으로, 해당 분야에서 딥스틱(dipstick)으로 지칭되는 올리고뉴클레오타이드 밴드의 직선 어레이를 포함한다. 다른 적절한 형식은 2차원 패턴의 별개의 셀(예를 들어, 64×64 어레이 내의 4096개 사각형)을 포함한다. 당업자에 의해 인식되는 바와 같이, 슬롯(slot)(직사각형) 및 원형 어레이를 포함하나 이들에 한정되지 않는 다른 어레이 형식이 균등하게 사용하기에 적절하다(미국 특허 제5,981,185호 참조). 일부 예에서, 어레이는 다중-웰 플레이트이다. 일 예에서, 어레이는 쓰레드(thread), 막 또는 필름인 폴리머 매체 상에 형성된다. 유기 폴리머 매체의 일 예는 두께가 약 1mil(0.001 인치) 내지 약 20mil인 폴리프로필렌 시트이지만, 필름의 두께는 중요하지 않으며, 상당히 넓은 범위에 걸쳐 다양할 수 있다. 어레이는 2축 연신된 폴리프로필렌(BOPP) 필름을 포함할 수 있으며, 이는 그들의 내구성에 더하여, 낮은 백그라운드 형광을 나타낸다.

본 발명의 어레이 형식은 다양한 상이한 유형의 형식에 포함될 수 있다. "형식"은 고체 지지체가 고정될 수 있는 임의의 형식. 예를 들어 마이크로타이터 플레이트(예를 들어, 다중-웰 플레이트), 시험 튜브, 무기 시트, 딥스틱 등을 포함한다. 예를 들어, 고체 지지체가 폴리프로필렌 쓰레드인 경우, 하나 이상의 폴리프로필렌 쓰레드는 플라스틱 딥스틱형 장치에 고정될 수 있으며 폴리프로필렌 막은 유리 슬라이드에 고정될 수 있다. 특정 형식은 그것 자체는 중요하지 않다. 필요한 모든 것은 고체 지지체가 고체 지지체 또는 그 위에 흡수된 바이오폴리머의 기능의 거동에 영향을 미치지 않고 그에 고정될 수 있으며, 형식(예를 들어, 딥스틱 또는 슬라이드)이 장치가 도입되는 임의의 물질(예를 들어, 임상 샘플 및 혼성화 용액)에 대해 안정한 것이다.

본 발명의 어레이는 다양한 방법으로 제조될 수 있다. 일 예에서, 올리고뉴클레오타이드 또는 단백질 서열은 따로 합성된 다음, 고체 지지체에 부착된다(미국 특허 제6,013,789호 참조). 다른 예에서, 서열은 지지체 상에서 직접 합성되어, 원하는 어레이를 제공한다(미국 특허 제5,554,501호 참조). 올리고뉴클레오타이드 및 단백질을 고체 지지체에 공유 결합시키고, 올리고뉴클레오타이드 또는 단백질을 지지체 상에 직접 합성하는 적절한 방법은 해당 분야에 공지되어 있으며 적절한 방법의 요약은 문헌[Matson et al., Anal. Biochem. 217:306-10, 1994]에서 찾을 수 있다. 일 예에서, 올리고뉴클레오타이드는 고체 지지체 상에서 올리고뉴클레오타이드를 제조하기 위한 통상의 화학적 기술을 사용하여 지지체 상에 합성된다(예를 들어, PCT 출원 WO 85/01051호 및 WO 89/10977호 또는 미국 특허 제5,554,501호).

자동화 수단을 사용하여 적절한 어레이가 생성되어, 사전 결정된 패턴으로 4개의 염기에 대한 전구체를 놓음으로써 어레이의 셀 내에서 올리고뉴클레오타이드가 합성될 수 있다. 약술하면, 다중-채널 자동화된 화학적 전달 시스템을 사용하여, 기판을 가로질러 평행한 줄(전달 시스템 내의 모든 채널의 수에 해당) 내에 올리고뉴클레오타이드 프로브 집단을 생성한다. 이어서, 제1 방향으로의 올리고뉴클레오타이드 합성의 완료 후에, 기판을 90° 회전시켜, 이제 제1 세트에 수직인 제2 세트의 줄 내에서 합성이 진행되게 할 수 있다. 이러한 과정에 의해 다수의 채널 어레이가 생성되며, 그의 교차점은 복수의 별개의 셀을 생성한다.

올리고뉴클레오타이드는 올리고뉴클레오타이드의 3' 말단 또는 올리고뉴클레오타이드의 5' 말단에 의해 폴리프로필렌 지지체에 결합될 수 있다. 일 예에서, 올리고뉴클레오타이드는 3' 말단에 의해 고체 지지체에 결합된다. 그러나, 당업자는 올리고뉴클레오타이드의 3' 말단 또는 5' 말단의 사용이 고체 지지체로의 결합에 적절한지 여부를 결정할 수 있다. 일반적으로, 3' 말단 및 5' 말단의 영역 내의 올리고뉴클레오타이드 프로브의 내부 상보성에 의해 지지체로의 결합이 결정된다.

특정 예에서, 어레이 상의 올리고뉴클레오타이드 프로브는 올리고뉴클레오타이드 프로브:표적 서열 혼성화 복합체의 검출을 가능하게 하는 하나 이상의 표지를 포함한다.

2. 마이크로어레이 방법을 사용한 유전자 발현 프로파일링

가장 민감하고 가장 유연한 정량적 방법 중 하나는 RT-PCR인데, 이를 사용하여, 약물 처리와 함께 또는 그것 없이, 정상 및 종양 조직 내의 상이한 샘플 집단 내의 mRNA 수준을 비교하여, 유전자 발현의 패턴을 특성화하고, 밀접하게 관련된 mRNA를 판별하고, RNA 구조를 분석할 수 있다.

제1 단계는 표적 샘플, 예를 들어, 인간 종양 또는 종양 세포주 및 각각의 해당하는 정상 조직 또는 세포주로부터의 RNA의 단리이다. RNA의 공급원이 원발성 종양이면, RNA는 예를 들어, 동결된 또는 보존 파라핀-포매된 및/또는 고정된(예를 들어, 포르말린-고정된) 조직 샘플로부터 추출될 수 있다.

RT-PCR의 변화는 실시간 정량화 RT-PCR이며, 이에 의해, 이중-표지된 형광원 프로브(예를 들어, 택맨(TaqMan)(등록 상표) 프로브)를 통해 PCR 산물 축적을 측정한다. 실시간 PCR은 정량적 경쟁 PCR과 상용성이며, 여기서, 각 대상 서열에 대한 내부 경쟁자다 정규화를 위해 사용되는 경우, RT-PCR을 위한 하우스키핑 유전자 또는 샘플 내에 포함되는 정규화 유전자를 사용한 정량적 비교 PCR과 상용성이다(문헌[Heid et al., Genome Research 6:986-994, 1996] 참조). 또한, 정량적 PCR은 미국 특허 제5,538,848호에 기재되어 있다. 관련 프로브 및 정량적 증폭 절차는 미국 특허 제5,716,784호 및 미국 특허 제5,723,591호에 기재되어 있다. 마이크로타이터 플레이터에서 정량적 PCR을 수행하기 위한 기기는 피이 어플라이드 바이오시스템즈(PE Applied Biosystems)(미국 캘리포니아주 포스터 시티 소재)로부터 입수할 수 있다.

다른 예에서, mRNA 수준을 택맨(등록 상표) RT-PCR 기술을 사용하여 측정된다. 택맨(등록 상표) RT-PCR은 상업적으로 입수할 수 있는 장비를 사용하여 수행될 수 있다. 시스템은 써모사이클러(thermocycler), 레이저, 전하-결합 소자(CCD) 카메라 및 컴퓨터를 포함할 수 있다. 일부 예에서, 시스템은 써모사이클러 상에서 96-웰 형식에서 샘플을 증폭시킨다. 증폭 동안, 레이저-유도된 형광 신호는 모든 96개 웰에 대하여 광섬유 케이블을 통하여 실시간으로 수집되고 CCD에서 검출된다. 시스템은 기구의 수행 및 데이터의 분석을 위한 소프트웨어를 포함한다.

오류 및 샘플-대-샘플 변화의 영향을 최소화하기 위하여, 내부 표준물질을 사용하여 RT-PCR이 수행될 수 있다. 이상적인 내부 표준물질은 상이한 조직 간에 고정된 수준으로 발현되며, 실험적 처리에 의해 영향을 받지 않는다. 유전자 발현 패턴을 정규화하기 위해 통상 사용되는 RNA는 하우스키핑 유전자 GAPDH에 대한 mRNA, β-액틴 및 18S 리보솜 RNA를 포함한다.

mRNA 단리, 정제, 프라이머 연장 및 증폭을 포함하는, RNA 공급원으로서 고정된, 파라핀-포매된 조직을 사용하여 유전자 발현을 정량화하기 위한 대표적인 프로토콜의 단계는 다양한 공개된 저널 기사에 제공되어 있다(문헌[Godfrey et al., J. Mol. Diag. 2:84 91, 2000]; 문헌[Specht et al., Am. J. Pathol. 158:419-29, 2001] 참조). 약술하면, 대표적인 과정은 파라핀-포매된 종양 조직 샘플의 약 10㎛ 두께의 섹션을 절단함으로써 시작한다. 이어서, RNA를 추출하고, 단백질 및 DNA를 제거한다. 대안적으로, RNA를 종양 샘플 또는 다른 조직 샘플로부터 직접 단리한다. RNA 농도의 분석 후에, RNA 수선 및/또는 증폭 단계가 필요에 따라 포함될 수 있으며, RNA는 유전자 특이적 프로모터를 사용하여 역전사되고, RT-PCR 및/또는 핵산 어레이로의 혼성화로 이어진다.

대안적인 실시 형태에서, 샘플 중의 mRNA 발현의 정량화를 위해 해당 분야에 공지되어 있는 통상적으로 사용되는 방법은 본 명세서에 제공되는 결장 시그니처로 사용될 수 있다. 이러한 방법은 노던 블롯팅 및 동소 혼성화(문헌[Parker & Barnes, Methods in Molecular Biology 106:247 283 (1999)]); RNase 보호 검정법(문헌[Hod, Biotechniques 13:852 854 (1992)])을 포함하나 이들에 한정되지 않는다. 대안적으로, DNA 듀플렉스, RNA 듀플렉스 및 DNA-RNA 하이브리드 듀플렉스 또는 DNA-단백질 듀플렉스를 포함하는 특정 듀플렉스를 인식할 수 있는 항체가 사용될 수 있다.

추가로, PCR기반의 기술은 예를 들어, 차등 디스플레이(문헌[Liang and Pardee, Science 257:967 971 (1992)]); 증폭 단편 길이 다형성(amplified fragment length polymorphism(iAFLP))(문헌[Kawamoto et al., Genome Res. 12:1305 1312 (1999)]); 비드어레이(BeadArray)(상표명) 기술(문헌[Illumina, San Diego, Calif.]; 문헌[Oliphant et al., Discovery of Markers for Disease (Supplement to Biotechniques), June 2002]; 문헌[Ferguson et al., Analytical Chemistry 72:5618(2000)]); 유전자 발현을 위한 신속한 검정법에서 상업적으로 입수할 수 있는 Luminex100 LabMAP 시스템 및 다중 색상-코딩된 미소구체를 사용한 BADGE(BeadsArray for Detection of Gene Expression)(미국 텍사스주 오스틴 소재의 루미넥스 코포레이션(Luminex Corp.))(문헌[Yang et al., Genome Res. 11:1888 1898 (2001)]); 경쟁적 PCR 및 MassARRAY(문헌[Oeth et al., 2004, SEQUONOME Application Note]); 및 HiCEP(high coverage expression profiling) 분석(문헌[Fukumura et al., Nucl. Acids. Res. 31(16) e94 (2003)])을 포함한다.

증폭을 위해 사용되는 프라이머는 대상 유전자(예를 들어, 표 1 및 표 6의 유전자)의 독특한 세그먼트가 증폭되도록 선택된다. 사용될 수 있는 프라이머는 상업적으로 입수할 수 있거나, 예를 들어, 진뱅크(GENBANK)(등록 상표)에서 입수할 수 있는 이들 유전자의 서열을 사용하여 널리 공지되어 있는 방법에 따라 고안되고 합성될 수 있다.

대안적인 정량적 핵산 증폭 절차는 미국 특허 제5,219,727호에 기재되어 있다. 이러한 절차에서, 샘플 중의 표적 서열의 양은 표적 서열 및 내부 표준물질 핵산 세그먼트를 동시에 증폭시킴으로써 결정된다. 각 세그먼트로부터 증폭되는 DNA의 양을 결정하고, 표준 곡선과 비교하여, 증폭 전에 샘플에 존재하였던 표적 핵산 세그먼트의 양을 결정한다.

일부 예에서, 마이크로어레이 기술을 사용하여 유전자 발현이 동정되거나 확인된다. 따라서, 발현 프로파일은 마이크로어레이 기술을 사용하여 신선한 또는 파라핀-포매된 종양 조직에서 측정될 수 있다. 이러한 방법에서, 대상 결장암 시그니처 핵산 서열(cDNA 및 올리고뉴클레오타이드 포함)은 마이크로칩 기판 상에 플레이팅되거나 배열된다. 이어서, 배열된 서열은 대상 세포 또는 조직으로부터의 단리된 핵산(예를 들어, cDNA 및 mRNA)과 혼성화된다. RT-PCR 방법에서와 같이, mRNA의 공급원은 통상 인간 종양 및 임의로 해당하는 비암성 조직 및 정상 조직 또는 세포주로부터 단리된 전체 RNA이다.

마이크로어레이 기술의 특정 실시 형태에서, cDNA 클론의 PCR 증폭된 삽입물은 덴스 어레이(dense array)에서 기판에 적용된다. 일부 예에서, 어레이는 표 1, 2 및 6의 적어도 2개의 결장암 시그니처 유전자에 특이적인 프로브를 포함한다. 미세배열된 핵산은 엄격한 조건 하에서의 혼성화에 적절하다. 형광 표지된 cDNA 프로브는 대상 조직으로부터 추출된 RNA의 역전사에 의한 형광 뉴클레오타이드의 혼입을 통해 생성될 수 있다. 칩에 적용되는 표지된 cDNA 프로브는 어레이 상의 각 DNA 스폿에 특이적으로 혼성화된다. 비특이적으로 결합된 프로브를 제거하기 위한 엄격한 세정 후에, 칩은 공초점 레이저 현미경에 의해 또는 다른 검출 방법, 예를 들어, CCD 카메라에 의해 스캐닝된다. 각각의 배열된 요소의 혼성화의 정량화에 의해, 해당하는 전사체 존재비의 평가가 가능해진다. 이중 색상 형광을 사용하여, RNA의 2가지 공급원으로부터 생성되는 따로 표지된 cDNA 프로브가 어레이에 쌍으로 혼성화된다. 따라서, 각각의 특정 유전자에 해당하는 2가지 공급원으로부터의 전사체의 상대적 존재비가 동시에 결정된다. 소형화된 규모의 혼성화는 표 1, 표 2 및 표 6의 결장안 시그니처 유전자에 대한 발현 패턴의 편리하고 신속한 평가를 제공한다. 마이크로어레이 분석은 제조처의 프로토콜에 따라, 예를 들어, 아피메트릭스 진칩(등록 상표) 기술(미국 캘리포니아주 산타 클라라 소재의 아피메트릭스, 인코포레이티드) 또는 아질런트 마이크로어레이 기술(미국 캘리포니아주 산타 클라라 소재의 아질런트 테크놀로지즈, 인코포레이티드)과 함께 공급되는 것과 같이, 상업적으로 입수할 수 있는 장비에 의해 수행될 수 있다.

3. 추가의 유전자 발현 분석 방법

SAGE는 각 전사체에 대한 개별 혼성화 프로브를 제공할 필요 없이, 다수의 유전자 전사체의 동시의 및 정량적 분석을 가능하게 하는 다른 방법이다. 먼저, 전사체를 독특하게 정량화하기에 충분한 정보를 함유하는 짧은 서열 태그(약 10 내지 14 염기쌍)가 생성되지만, 태그는 각 전사체 내의 독특한 위치로부터 수득된다. 이어서, 많은 전사체는 함께 연결되어 시퀀싱될 수 있는 긴 연속 분자를 형성하여, 다수의 태그의 아이덴티티를 동시에 드러낸다. 임의의 전사체 집단의 발현 패턴은 개별 태그의 존재비를 결정하고 각 태그에 해당하는 유전자를 동정함으로써 정량적으로 평가될 수 있다(예를 들어, 문헌[Velculescu et al., Science 270:484-7, 1995]; 및 문헌[Velculescu et al., Cell 88:243-51, 1997] 참조).

동소 혼성화(ISH)는 대상 유전자의 발현을 검출하고 비교하는 다른 방법이다. ISH는 핵산 혼성화 기술을 적용하고 단일 세포 수준으로 추론하고, 세포화학, 면역세포화학 및 면역조직화학의 기술과 병용하여, 유지되고 동정되어야 하는 세포 마커의 형태의 유지 및 동정을 가능하게 하고, 집단, 예를 들어, 조직 및 혈액 샘플 내의 특정 세포에 대한 서열의 국소화를 가능하게 한다. ISH는 조직의 일부 또는 섹션에(동소에), 또는 조직이 충분히 작다면, 전체 조직(홀 마운트(whole mount) ISH) 내에 하나 이상의 특이적 핵산 서열을 국소화시키기 위하여 상보적 핵산을 사용하는 하나의 유형의 혼성화이다. RNA ISH는 조직 내에서 발현 패턴, 예를 들어, 암 생존 인자-관련 유전자의 발현을 검정하기 위해 사용될 수 있다.

샘플 세포 또는 조직을 그들의 투과성이 증가되도록 처리하여, 프로브, 예를 들어, 암 생존 인자-관련 유전자-특이적 프로브가 세포에 유입되게 한다. 프로브를 처리된 세포에 첨가하여, 적절한 온도에서 혼성화되게 하고, 과잉의 프로브를 세정해낸다. 상보적 프로브는 예를 들어, 자가방사선술(autoradiography), 형광 현미경 또는 면역검정법을 사용하여 조직 내의 프로브의 위치 및 양이 결정될 수 있도록 표지된다. 샘플은 본 명세서에 기재된 바와 같은 임의의 샘플, 예를 들어, 비-종양 샘플 또는 유방 또는 폐 종양 샘플일 수 있다. 대상 암 생존 인자-관련 유전자의 서열이 공지되어 있기 때문에, 이에 따라 프로브가 대상 유전자에 특이적으로 결합하도록 프로브가 설계될 수 있다.

동소 PCR은 ISH 전의 표적 핵산 서열의 PCR 기반의 증폭이다. RNA의 검출을 위하여, 세포내 역전사 단계를 도입하여, 동소 PCR 전에 RNA 주형으로부터 상보적 DNA를 생성한다. 이는 저 카피 RNA 서열의 검출을 가능하게 한다.

동소 PCR 전에, 세포 또는 조직 샘플을 고정하고 투과화시켜, 형태를 보존하고, PCR 시약의 증폭시킬 세포내 서열로의 접근을 가능하게 한다. 대상 서열의 PCR 증폭은 다음으로 유리 슬라이드 상의 조직 섹션 또는 세포원심분리 제제에 직접적으로, 또는 현탁액 중에 유지되는 무손상 세포 중에서 수행한다. 이전의 방법에서, PCR 반응 혼합물 중에 현탁화된 고정된 세포는 통상의 써멀 사이클러(thermal cycler)를 사용하여 열 순환시킨다. PCR 후에, ISH 또는 면역조직화학에 의한 세포내 PCR 산물의 가시화와 함께, 세포를 유리 슬라이드 상으로 세포원심분리하였다. 유리 슬라이드 상에서 커버슬립 하에서 샘플에 PCR 혼합물을 더한 다음, 반응 혼합물의 증발을 방지하도록 밀봉함으로써 동소 PCR을 수행한다. 써멀 사이클링은 유리 슬라이드를 통상의 가열 블록(heating block) 또는 특별히 설계된 써멀 사이클러의 상측에 직접 배치하거나 써멀 사이클링 오븐을 사용함으로써 달성된다.

세포내 PCR 산물의 검출은 일반적으로 2가지 상이한 기술, 즉, PCR-산물 특이적 프로브를 사용하는 ISH에 의한 간접적인 동소 PCR 또는 써멀 사이클링 동안 PCR 산물로 혼입되는 표지된 뉴클레오타이드(예를 들어, 디곡시게닌-11-dUTP, 플루오레세인-dUTP, 3H-CTP 또는 비오틴-16-dUTP)의 직접적인 검출을 통하여 ISH 없이, 직접적인 동소 PCR 중 하나에 의해 달성된다.

검출 방법의 일부 실시 형태에서, 하나 이상의 "하우스키핑" 유전자 또는 "내부 대조군"의 발현도 또한 평가될 수 있다. 이들 용어는 임의의 구성적으로 또는 전반적으로 발현되는 유전자(또는 하기에 논의된 바와 같은 단백질)을 포함하며, 그의 존재는 암 생존 인자-관련 유전자(또는 단백질) 수준의 평가를 가능하게 한다. 이러한 평가는 RNA(또는 단백질) 회수에서의 변이에 대하여 대조군 및 유전자 전사의 전체 구성요소 수준의 결정을 포함한다.

본 발명은 하기의 비제한적인 실시예에 의해 추가로 예시된다.

실시예 1

본 실시예는 본 명세서에 개시된 방법 및 시약을 사용한 결장암 샘플의 범주화를 위한 예시적인 예측 도구의 생성 및 검증을 기재한다. 본 실시예는 본 명세서에 전문이 참고로 포함되는 문헌[Kennedy et al, J. Clin. Oncol., 29(35) 4620-4626, 2011]에서 대상 기술의 발명자에 의해 공개된 재료를 포함한다.

FFPE 유도의 RNA로부터 정확한 발현 데이터를 절단할 수 있는 대장암 81/190 트랜스크립톰 집중 연구 어레이를 개발하였다(대장암 DSA(상표명)(북 아일랜드 소재의 알맥 디아그노스틱스, 리미티드 월드 와이드 웹(almac-diagnostics.com)에서 찾을 수 있음)(문헌[Johnston et al., J Clin. Oncol. 24: 3519, 2006]).

대장암 DSA(상표명) 연구 도구는 61,528개의 프로브 세트를 함유하며, 결장암 및 정상 조직에서 발현되는 것으로 확인된 52,306개의 전사체를 암호화한다. BLAST 분석을 사용하여 미국 국가 생물공학 센터(National Center for Biotechnology Information)(NCBI) 인간 참고 서열(RefSeq) RNA 데이터베이스(월드와이드웹(ncbi.nlm.nih.gov/RefSeq/)에서 이용 가능함)에 대하여 대장암 DSA(상표명) 연구 도구를 비교하여, 21,968개(42%)의 전사체가 존재하며, 26,676개 (51%)의 전사체가 인간 RefSeq 데이터베이스로부터 부재였다. 추가로, 내용물의 7%는 주석을 단 유전자에 대한 발현된 안티센스 전사체를 나타낸다(문헌[Johnston et al., J. Clin. Oncol. 24: 3519, 2006]; 문헌[Pruitt et al., Nucleic Acids Research 33: D501-D504, 2005]). 또한, 선두적인 범용 검정법으로 비교되는 대장암 DSA(상표명)의 프로브-수준 분석에 의해, 대략 20,000개(40%)의 전사체가 선두적인 범용 플랫폼(아피메트릭스(Affymetrix)) 상에 포함되지 않으며, 대장암 DSA(상표명)에 독특한 것이 강조된다. 따라서, 대장암 DSA(상표명) 연구 도구는 지금까지 수행된 유전자 발현 연구에서 입수할 수 없는 전사체를 포함한다. 마지막으로, 대장암 DSA(상표명)를 설계하기 위해 사용되는 전사체 정보가 고효율 시퀀싱 방법에 의해 부분적으로 생성되기 때문에, 다른 범용 마이크로어레이 상에 함유되는 전사체의 3' 말단에 더 가깝게 프로브를 생성할 수 있다. 관련 질환 특이적 내용물 및 3' 기반의 프로브 설계의 조합에 의해, FFPE 유래의 RNA로부터 강력하게 프로파일링할 수 있는 독특한 생성물이 제공된다.

본 연구의 목적은 수술 후 재발 위험이 낮거나 높은 II기 결장암을 정확하게 분류할 수 있는 예후 유전자 시그니처를 생성하고 독립적으로 검증하기 위하여, FFPE 유도의 종양 물질을 사용하여 대장암 DSA(상표명) 연구 어레이의 이용을 평가하는 것이다. 본 실시예에서 사용되는 II기 결장암은 AJCC T3 또는 T4 결정 음성(NO) 비전이성(MO) 결장암이다.

방법

샘플 선택

샘플을 하기의 적격성 기준을 사용하여 후향적으로 수집하였다: 잔류 종양의 증거가 없는 유일한 II기 결장 선암종 1차 수술 시의 45세 이상의 환자 연령 6개 이상의 국소 림프절 평가 최소 50%의 종양 세포가 종양 섹션에 존재 결장암의 가족력이 없음 수술전 암 치료법 또는 수술 1년 내의 수술후 암 치료법 없음(재발 후에 제공되는 치료법이 허용가능하였지만); 및 저위험 환자에 대한 5년의 최소 환자 후속 조치. 저위험 환자는 1차 수술 5년 내에 암 재발이 없는 환자로 정의되었다. 고위험 환자는 1차 수술 5년 내에 전이암 재발이 있는 환자로 정의되었다. 국소 질환 재발이 있는 환자를 배제하였는데, 이는 이러한 재발이 전이 종양보다는 수술 후에 국소 잔류 질환의 결과일 수 있기 때문이다. 샘플을 12개의 센터로부터 수집하였다. 모든 샘플에 병리학자에 의한 독립적인 조직병리학적 검토를 수행하였다. 데이터 세트를 감시, 역학 및 최종 결과 데이터베이스와 비교하여, 이것이 II기 결장암이 있는 일반적인 집단을 나타내게 하였다. 주요 환자 및 종양 특징은 표 3에 제공되어 있다(도 6 참조).

FFPE 조직으로부터의 유전자 발현 프로파일링

전체 RNA를 로슈 하이 퓨어 RNA 파라핀 키트(Roche High Pure RNA Paraffin Kit)(스위스 바젤 소재의 로슈(Roche))를 사용하여 FFPE 종양 샘플로부터 추출하였다. 증폭된 cDNA 표적을 누겐(Nugen) FL-오베이션(Ovation)(등록 상표) cDNA 비오틴 모듈(Biotin Module) v2와 함께 누겐 WT-오베이션(등록 상표) FFPE 시스템 v2를 사용하여 제조하고, 제조처의 지침에 따라 수행하였다. 표지된 단편화 cDNA의 혼성화, 세정, 염색 및 스캐닝을 표준 아피메트릭스 프로토콜에 따라 수행하였다.3.0 내지 3.5㎍의 표지된 단편화 cDNA를 아피메트릭스 7G 스캐너(미국 캘리포니아주 산타 클라라 소재의 아피메트릭스) 상의 대장암 DSA(상표명) 마이크로어레이(영국 크레이개번 소재의 알맥)에 혼성화시켰다. 조작자, 시약 및 재료 로트(material lot)에 더한 표적화된 임상 및 샘플 특성 인자에 대하여 무작화시킨 배취(batch)로의 샘플의 계층화에 수반되는 샘플 프로파일 스케쥴링 전략을 사용하였다. 품질 관리 기준을 적용하고, 생물학적 및 기술적 인자가 저위험 샘플과 고위험 샘플 사이에 균형을 이루게 하였다. 이를 수행하여, 체계적 편향을 최소화하고, 임의의 잔류 기술적 편향을 기술적 변이로 분산시켰다.

분류자 모델 동정

프로브 세트의 차등적 분해의 문제를 피하기 위하여 FFPE 고정 하에 안정하고/거나 유사한 추적 안정성으로 동정된 5,014개의 프로브 세트로 모델 개발을 시작하였다. 5-폴드(fold) 교차 검증의 10회의 반복 동안 재귀적 피처 제거(recursive feature elimination: RFE)에 기초하여 중요한 피처의 선택을 사용하는 부분최소자승법 분류 방법을 사용하여 시그니처 생성을 이후에 수행하였다. 모델 개발의 모든 태양은 가장 낮은 변이와 세기를 갖는 프로브 세트의 50%를 제거하기 위한 초기 여과, 참조-물질 기반의 탄탄한 멀티칩 평균(RefRMA) 정규화 및 요약, 및 각 반복에 가장 적게 중요한 10%의 프로브 세트를 폐기하는 RFE를 포함하는 교차 검증 내에 적절하게 끼워 넣었다. 최종 모델에 포함시킬 피쳐의 총 개수를 교차 검증 하에서 수신 조작 특성 곡선(AUC) 하의 가장 큰 평균 영역을 갖는 피쳐 길이에 의해 결정하였다. 각 모델로부터 예측의 이분화를 위한 임계값을 교차-검증된 트레이닝 데이터로부터의 감수성 및 특이성의 최대 합에 기초하여 선택하였다(문헌[minimum of the Youden J statistic(Youden, Cancer 3:32-35, 1950]). 대체로 동일한 성능을 갖는 다수의 임계값의 경우에, 콕스 비례적 위험 회귀로부터의 위험비(hazard ratio, HR)를 타이브레이커(tiebreaker)로 사용하여, 더 높은 HR 값을 지지하였다.

임상 샘플을 사용하여 동시에 프로파일링시킨 FFPE에 포매된 대장암 세포주(HCT116)의 기술적 반복검증을 예측함으로써 예측의 정밀성을 평가하였다. 이러한 샘플의 반복된 기술적 측정은 모델 개발에 포함되지 않았으나, 높은 반복성 및 재현성을 갖는 모델을 선택할 목적으로, 독립적인 시험 세트로서 총 50회의 교차-검증 트레이닝 서브세트에 의해 예측하였다. 추가로, 순열 시험을 수행하였으며, 여기서, 실제 분류 표지를 무작위로 100회 자리를 바꾸고, 완전한 모델 개발로 이어졌다. 이를 행하여, 어떠한 분류 성능이 유사한 특징을 갖는 데이터 세트로부터의 우연히 예상될 수 있는지를 평가하고, 시그니처 생성 절차에서 임의의 편향을 나타내었다.

공지되어 있는 임상적 인자의 면에서 최종 모델의 독립성을 단일변인 및 다변인 콕스 비례적 위험 회귀를 사용하여 평가하였다. 사용되는 입력은 종양 병기, 환자 종양 등급, 종양 위치, 환자 연령, 환자 성별, 점액소/비점액소 하위유형 및 검색된 림프절의 개수와 함께 예측된 분기 분류 표지였다. 미소부수체(microsatellite) 불안정성을 하나의 인자로 포함시켰는데, 이는 이러한 정보를 대다수의 샘플에 대하여 입수할 수 없었기 때문이다. 유전자 존재론 주석 및 유전자 존재론 생물학적 과정 및 분자 기능의 강화를 최종 시그니처에서의 유전자에 기초하여 내부적으로 개발된 도구를 사용하여 수행하였다. 오류발견률(false discovery rate) 다중 시험 보정을 갖는 초기하 분포를 사용하여, 상당히 농축된 유전자의 기능적 분류를 결정하였다. 경로 분석을 정교한 경로 분석(Ingenuity Pathway Analysis)의 사용을 통해 생성하였다(미국 캘리포니아주 레드우드 시티 소재의 인제뉴어티 시스템즈(Ingenuity Systems)).

샘플의 균형유지, 무작위화 및 품질 관리(Quality Control: QC)

표적 집단: 어레이를 트레이닝하는데 사용되는 집단을 매치시켜, SEER 및 CRUK 데이터베이스로부터의 일반적 집단 특성을 반영하였다. 고려되는 하기의 특성을 다음과 같았다.

ㆍ성별. II기 집단 중의 성별의 유병률은 대략 50 내지 60%의 남성(영국에서는 56%, 미국에서는 57%)이었다.

ㆍ종양 위치(원위/근위). II기 집단에서의 유병률은 근위가 대략 55% 내지 65%이고, 원위가 35% 내지 45%이다.

ㆍ환자 연령. 2001년 내지 2005년의 미국국립암센터의 SEER 암 통계 개요 결장 및 직장 섹션에 따라, 0.1%의 환자가 20세 미만에서 20 내지 34세에 1.0%; 35 내지 44세에 3.7%; 45 내지 54세에 11.6%; 55 내지 64세에 18.3%; 65 내지 74세에 25.1%; 75 내지 84세에 28.2%; 그리고 85세 이상의 연령에 12.2%가 진단되었다.

ㆍ재발-부재 생존율. II기 집단에서 재발-부재 생존율은 13% 내지 22%이고(문헌[Gattaj et al, European Journal of Cancer, 2006]), SEER 데이터베이스로부터 약 30%인 것으로 보고되었다.

ㆍ사전-균형유지: 혼성화를 위해 제시된 샘플 세트가 상기 제시된 일반 집단 통계를 유지하면서 선택된 임상 공변인에 대하여 균형을 유지하도록 사전-균형유지를 수행하였다. 이에 의해, 재발-부재 생존을 배제하고, 이를 의도적으로 풍부하게 하여, 바이오마커 발견의 능력을 증가시켰다. 트레이닝 세트는 5년 후에 사건을 갖는 임의의 샘플을 함유하지 않은 반면, 이는 검증 세트에서의 제약이 아니었다. 시그니처 생성(즉, 트레이닝 세트에서)을 위해 5년 후에 재발하는 샘플을 사용하지 않는 이유는 바이오마커 발견을 수행하는 경우 추가의 이종성을 샘플 집단에 도입하는 것을 피하려는 것이다.

균형유지 절차의 주요 목적은 종점(2차 변인으로 나타내는 고/저 위험)과 후술되는 임의의 인자 간의 연관성(존재한다면)을 감소시키는 것이었다. 이들 인자와 고/저 위험 종점 간의 임의의 연관성은 어레이의 임상적 유용성을 제한할 수 있는 혼란을 도입할 것이다. 603개의 대장 샘플을 사전-균형유지로 처리하여, 예후와 하기의 임의의 인자 간의 강력한 연관성을 감소시켰다: 성별, 장 내의 종양 위치 환자 연령 기여 센터 FFPE 블록 시기(수술일); 종양 내용물 및 RNA 품질.

콜모고로브-스미르노프(Kolmogorov-Smirnoff) 시험을 사용하여 연속 파라미터를 시험하고, 범주 파라미터를 카이-스퀘어(chi-squared) 시험을 사용하여 시험하였다. 모든 파라미터에 대한 0.4의 p-값은 균형유지를 달성하는데 필요하였다. 504개의 샘플은 균형유지 후에 유지되었으며(335개의 저위험 및 169개의 고위험), 어레이 프로파일링에 제시하였다.

ㆍ어레이 프로파일링 동안의 샘플의 무작위화: 샘플의 무작위화를 공지되어 있는 기술적 및 생물학적 인자, 주로 대상 종점(예후) 간의 교란을 피하기 위하여 수행하였다. 이러한 연구 오퍼레이터에서, 혼성화-세정-염색 (HWS) 키트 로트, 검정법 로트 및 검정법 배치를 기여 센터 및 예후와 함께 고려하였다. 각 어레이 배취가 동일한 비율의 예후와 기여 센터를 갖도록 먼저 어레이 배치로 무작위화시켰다. 이어서, 오퍼레이터를 이용가능성에 따라 각 어레이 배치에 할당하였다. 이어서, 각 어레이 배치를 HWS 키트에 할당하여, 각 오퍼레이터가 동일한 비의 각 키트에 사용되게 보장하였다. 어레이 로트를 각 어레이 배치에 할당하여, 그들이 어레이 배치 중에 균일하게 분포되게 하였다.

트레이닝 데이터의 품질 관리: QC 절차를 주로 다양한 품질-관련 파라미터를 함유하는 아피메트릭스 RPT 파일 내의 값에 기초하여, 생성된 어레이에 적용하였다. 모든 샘플에 대한 각 파라미터를 위한 분포의 시각적 조사에 기초하여, 한계를 계산하였다: %는 판단을 나타내며(20%가 요구됨); 이미지 아티팩트(artefact)를 확인하여, 뚜렷한 반점이 있는 어레이를 제거하고 Q 잔류 및 호텔링즈(Hotelling's) T2에 기초하여, 주성분분석(PCA)으로부터 가외치를 검출하였다.

성별 유전자의 평가를 사용하여, 관찰된 발현 수준이 임상 정보에 공지되어 있는 성별과 매치되는 것을 결정하였다.

또한, 하기의 아피메트릭스 품질 파라미터를 광범위하게 다음과 같이 범주화되는 분포의 가시적인 검사 동안 고려하였다: RNA 품질: 신호 품질 및 검출 호: 백그라운드 및 노이즈: 및 백그라운드 균질성.

총 319개의 대장 샘플을 QC 절차를 통과시켰다. 직장 샘플에 의해 도입되는 이질성을 시사하는 예비 결과 때문에, 결장 샘플을 제거하여, 249개 콜로니 세트를 형성하고, 이를 최종(QC 후) 균형유지를 위해 제시하였다.

ㆍ최종 QC-후 균형유지: QC를 통과한 249개의 결장 샘플을 저위험 및 고위험 그룹 둘 모두에서와 유사한 호 분포를 제시한 %에 대한 기준의 부가와 함께(이러한 정보는 오직 혼성화후에만 이용가능하다) 동일한 원래 사전-균형유지를 사용하여 균형을 유지하였다. 215개 샘플의 최종 세트는 QC 및 균형유지 후에 유지되었다.

215개 샘플이 있는 최종 결장 세트는 공지되어 있는 집단 분포에 비하여 하기의 특성을 갖는다: 성별: 53% 남성(집단 내의 50-60%); 종양 위치(원위/근위): 62% 근위(집단 내의 55-65% 근위); 환자 연령: 집단의 연속 분포를 거의 따름: 및 34% 불량한 예후(고위험). 집단에 비해 의도적으로 약 15 내지 20% 풍부함.

ㆍ검증 세트 및 장래의 샘플 세트의 품질 관리: 트레이닝 세트 상의 맞춤 제작된 QC 절차를 사용하는 것은 고 품질 데이터 세트로부터의 바이오마커의 동정을 용이하게 하기 위한 중요한 단계이다. 그러나, 장래의 샘플의 예측을 위하여, QC는 한 번에 하나의 샘플 상에 적용되어야 한다. 또한, QC 절차는 데이터가 생성되는 시스템 및 데이터 세트에 너무 특이적일 수 없다. 이러한 목적을 위하여, 개별 평가를 2가지 시스템 및 스캐너에 복제되는 40개의 샘플을 사용하여 수행하여, 시스템을 가로질러 안정한 QC 파라미터를 확인하였다. AvgSigA 파라미터(부재의 프로브 세트의 평균 신호)는 상이한 시스템에 걸쳐 가장 안정한 파라미터이며, 이에 따라 시스템-독립적 QC 절차에 대한 최적의 후보물질인 것으로 결정되었다. 이러한 파라미터를 위하여, 더 높은 값은 더 낮은 품질을 암시하며, 더 낮은 값은 더 높은 품질을 암시한다. AvgSigA 값은 통상적으로 사용되는 QC 파라미터이며 트레이닝 세트에 사용되는 1차 QC 파라미터인 % 제시 호 파라미터와 강력하게 음으로 상호관련이 있다. 트레이닝 세트로부터의 % 제시 호의 하위 허용 값을 20%로 설정하였으며, 이는 대략적으로 이러한 데이터 세트에 대한 AvgSigA 파라미터에 대한 43의 상위 허용 값에 해당한다. 보다 신생의 FFPE 샘플을 수용하기 위하여, AvgSigA 상에 하위 임계값을 도입하는 것을 결정하지 않았다(이는 고품질 샘플의 포함을 가능하게 할 것이다). 이에 따라, 이러한 연구로부터 유래된 최종 포함 범위는 43 이하인 AvgSigA였으며, 이는 독립적인 검증 세트에 적용되는 QC 미터법이었으며, 장래의 샘플에 적용될 QC이다.

ㆍFFPE 블록 시기에 대하여 안정한 프로브 세트의 동정: mRNA 전사체가 FFPE 샘플 중에서 상이한 비율 및 상이한 수준으로 분해되기 쉬우며, 이는 오래된 물질로부터 생성되는 시그니처가 신선한 FFPE 물질에서 예상되는 것만큼 수행되지 않은 것을 야기할 수 있음이 인식되었다. 따라서, 2가지 독립적인 종적인 연구를 수행하여, FFPE 블록 시기에 걸쳐 안정한 프로브 세트를 동정하였다. 제1 연구에서, 9개의 FFPE 블록은 연속 섹션화하고, 고정 후 16주의 시간에 7개의 시점에 DNA 마이크로어레이에 의해 분석하였다. 이들 샘플은 1년 기간에 3회의 6개월 간격에 제2 종단 연구에 의해 보충되었으며, 여기서, 8개의 FFPE 블록은 6개월 내지 4년의 시기 범위였으며, 이를 연속 섹션화하고, DNA 마이크로어레이에 의해 분석하여, 분석을 위한 113개의 개별 샘플을 야기하였다. 시간에 따라 추가의 분해를 겪지 않거나, 고정 후에 동등한 속도로 파괴되는 5014개의 전사체를 동정하였다. 프로브 세트의 목록을 이후에 시그니처 생성을 위해 사용하였다. 본 연구로부터 상세 사항을 제시하기 위한 개별 매뉴스크립트(manuscript)는 준비 중에 있다.

ㆍ모델 개발 동안 분류자의 정밀성 평가: 기술적 반복검증으로부터 동일한 산출량을 지속적으로 생성하는 분류자의 능력은 시험 설정에 사용되는 검정법의 중요한 태양이다. 이러한 목적을 위하여, 동일한 대장암 세포주(HCT114)의 기술적 반복검증인 39개 참조 샘플의 세트를 임상 샘플과 함께 혼성화시켰다. 모델 개발 동안 이러한 세트는 교차-검증 동안 외부 시험 세트로 예측하여, 모델 개발 과정의 각 단계에서 상대 변인을 추정하였다. 교차-검증 동안 트레이닝 세트 및 39개 샘플 참조 세트 간에 정보가 공유되지 않았다. 예측된 시그니처 점수로부터의 표준 편차를 계산하고, 95% 신뢰 한계를 갖는 평균으로 가시화시켰다. 가변성은 더 긴 시그니처에 대하여 낮았으며, 이는 이어서, 피처 선택 절차에 걸쳐 점차 증가하며, 이는 또한 더 짧은 시그니처에 대한 더 낮은 정확성(AUC)에 반영된다. 선택된 시그니처 길이(634개 프로브 세트)에서, 모델은 높은 정밀성과 정확성을 보인다.

ㆍ분류 성능의 순열 분석: 순열 분석을 수행하여, 어떠한 분류 성능의 것이 유사한 특성을 갖는 데이터 세트로부터 예상될 수 있는 지를 평가하였다. 실제 분류 표지(즉, 실제 예후)를 무작위로 다시 셔플링시키고, 이후에 전체 모델 개발 과정(여과, 정규화, 피처 선택 및 분류를 사용한)을 반복함으로써 이를 수행하였다.시그니처 성능은 여기서, 프로브 세트의 개수가 634개인 선택된 것에서 특이적으로, 그리고 더 긴 시그니처 길이에서의 기회보다 유의미하게 더 낫다. 추가로, 순열 시험에 의해, 분류자를 개발하는데 사용되는 데이터 세트 및/또는 방법에서 임의의 근원적인 편향을 드러냈다. 무작위 표적 상의 AUC 중앙값은 0.5이며, 이는 사용되는 절차에서 명백한 편향이 존재하지 않는 것을 확인하는 기회를 나타낸다.

결과

FFPE 조직으로부터의 II기 결장암 예후 시그니처의 개발

5년의 질환-부재 생존을 이러한 연구를 위한 1차 종점으로 사용하였다. 임상 인자에 대하여 균형을 유지하고, 품질 관리 기준을 초기 데이터 세트에 적용한 후에, 215명의 환자(142명의 저위험 및 73명의 고위험 환자)의 트레이닝 세트를 확인하였다. 50% 분산 -세기 여과, RefRMA 정규화, RFE 피처 선택 및 부분 최소 자승 분류를 분류 성능의 평가를 위하 5-폴드 교차 검증의 10회의 반복 하에 수행하였다. 교차 검증에 의해, 634-전사체 시그니처가 예후 분류에 대하여 최적인 것이 나타났다. 0.68의 AUC(P < .001)를 갖는 수신자 조직 특징 곡선을 생성하였으며, 이는 시그니처 점수와 예후 간의 유의미한 관련성을 나타낸다(도 3a). 관찰된 AUC는 순열 분석에서 무작위보다 유의미하게 더 높았으며, 기술적 반복검증으로부터 정밀성의 평가에서 낮은 분산을 나타내었다. 시그니처 예측 점수의 이분화를 위한 0.465의 임계값을 문헌[Youden J statistics]으로부터 확립하여, 2.62의 HR을 제공하였다(P < .001; 도 3b). 표 4는 교차 검증 동안 시그니처 생성에 대한 분류 성능의 요약을 포함한다.

[표 4]

95% 신뢰 구간(CI)은 교차 검증(트레이닝 세트) 또는 1,000회의 반복을 사용한 부트스트랩핑(bootstrapping)(검증 세트)으로부터의 ±2 표준 편차 각각 NPV 및 PPV를 계산하는 경우, 이전의 80% 및 20%가 사용된다. 임계값 t=0.465를 시그니처 점수의 이분화를 위해 사용하였다. 약어: AUC, 수신자 작동 특징 곡선 아래 영역 HR, 위험비 NPV, 음성 예측 값(음성은 낮은 위험이다); PPV, 양성 예측값(양성은 높은 위험이다).

ㆍII기 결장암 예후 시그니처의 독립적인 검증: 예후 시그니처를 트레이닝 세트에서 확인된 임계값 점수를 사용하여 재발이 풍부한 144명의 환자(85명의 저위험 및 59명의 고위험 환자)의 독립적인 검증 세트에 적용하였다. 샘플 분석을 따로, 그리고 이후에 트레이닝 세트에 수행하였다. 시그니처에 의해, 고위험 그룹에서 2.53의 HR(P < .001)을 갖는 질환 재발이 예측되었다(도 4 및 표 4). 또한, 시그니처에 의해, 고위험 그룹에서 2.21의 HR(P < .0084)을 갖는 암-관련 사망이 예측되었다(도 5).

본 명세서에 기재된 시그니처가 FFPE 유래의 종양 물질로부터 개발되었다는 사실에 의해, 기존의 FFPE 종양 은행의 회고적 분석에 기초한 대규모 검증 전략이 용이하게 한다.

위험비는 저위험으로 분류자에 의해 확인된 환자에서 발생하는 사건의 위험의 비로서의, 고위험으로 분류자에 의해 확인된 II기 결장암 환자에서 발생하는 사건의 기회 또는 위험의 표현이다. 수술 후 5년 내에, 불량한 예후를 갖는 것으로 예측된 것에 비하여 양호한 예후를 갖는 것으로 예측된 그룹에 대한 유의미하게 더 낮은 재발 가능성이 있었다. 음성 예측 값은 정확하게 진단된(예측된 음성) 음성 시험 결과를 갖는 환자의 비율이다(예측적 음성). 예후 설정에서, NPV는 질환 재발의 유병률에 좌우된다. 양성 예측 값은 정확하게 진단된 양성 시험 결과를 갖는 환자의 비율이다(예측적 양성). 예후 설정에서, PPV는 질환 재발의 유병률에 좌우된다. 20%의 불량한 예후 샘플의 집단 유병률에 기초하여, 이는 예측된 불량한 예후를 갖는 환자가 33%의 재발 가능성을 가지며, 예측된 양호한 예후를 갖는 환자가 5년 내에 13%의 재발 가능성을 갖는 것을 암시할 것이다.

ㆍ공지되어 있는 예후 인자로부터의 시그니처 독립성의 평가: 유용한 예후 검정법을 위하여, 이는 임상에 사용되는 공지되어 있는 예후 인자로부터 독립적으로 수행하여야 한다. 따라서, 검정법의 독립성을 단일변인 및 다변인 분석 둘 모두에서 평가하였다(표 5).

[표 5]

단일변인 및 다변인 분석 둘 모두를 로그-우도비 시험으로부터 비롯된 P 값을 갖는 콕스 비례적 위험 회귀를 사용하여 수행하였다. 종양 등급에 대하여, 1 등급을 HR의 계산을 위한 참조점으로 사용하였다. 환자 연령 및 검색된 결정의 개수를 연속 인자로 분석하였다. 환자 연령의 HR의 해석은 1세의 연령의 변화에 대한 증가된 위험이며, 이에 부응하게, 검색되는 결절의 개수의 HR의 해석은 검색된 결절의 증가에 대한 증가된 위험이다. 약어: HR, 위험비.

예후의 예측은 단일변인(P < .001) 및 다변인(P < .001) 분석 둘 모두에서 유의미하였으며, 이는 시그니처가 통상의 위험 인자에 더하여 예후 정보를 제공하는 것을 입증한다. 추가로, 시그니처의 독립성은 샘플 중의 림프혈관 침윤의 첨가를 사용하여 평가하였으며, 이를 기록하였다(검증 세트에서 144개의 샘플 중 100개). 시그니처를 단일변인(P < .001) 및 다변인(P < .001) 분석에서 독립적으로 수행하였다.

ㆍ예후 시그니처에서 유전자의 기능 분석: 다음으로, 검정법에 의해 결장암 재발과 관련이 있는 것으로 공지된 생물학적 과정이 검출되는지를 구하였다. 634개의 프로브 세트를 정교한 경로 분석을 사용하여 분석하고, 통계적으로 유의미한 경로의 목록을 확인하였으며, 그의 최상위는 IGF-1 신호전달이다.

논의

본 명세서에 개시된 바와 같이, II기 결장암을 위한 수술 후에 재발의 위험이 더 높은 환자를 확인하는 DNA마이크로어레이-기반의 검정법을 개발하였다. 구체적으로, 시그니처에 의해, 독립적인 검증 세트에서 2.53의 재발의 HR 및 2.21의 암-관련 사망의 HR이 있는 고위험 코호트를 확인하였다. 완전하게 분리된 세트를 사용한 예후 검정법의 검증은 트레이닝 세트로부터 시그니처의 성능의 과대평가를 피하는데 필요하다. 재발에 대한 2.53의 HR은 현재 임상에서 결정하는데 사용되는 조직 인자와 유리하게 비교되며, 이는 통상 대략 1.5 이하의 HR을 갖는다. 더욱이, 시그니처는 개별 해석을 필요로 하지 않으며, 통상적인 조직병리학 인자보다 더욱 표준화된 방법을 제공할 수 있다. 중요하게는, 검정법은 FFPE 조직에서 수행되고, 이에 따라 현재의 의료 행위에서 용이하게 적용된다.

비록 몇몇 암 유형에서 몇몇 DNA마이크로어레이 기반의 예후 시험이 공개되었지만, 오직 하나가 임상 시험에 도입되며, 현재까지 결정암에서 사용되지 않았다. 이는 2가지 주요 인자의 결과일 수 있다. 먼저, 많은 시그니처를 신선한 또는 동결된 조직으로부터 개발하였다. 두 번째로, 부적절한 연구 방법은 독립적인 데이터 세트에서 시험 입증의 실패를 야기하였다.

동결된 조직 샘플의 이용에 관하여, 일어한 조직 유형이 뛰어난 마이크로어레이 데이터를 제공하지만, 이러한 조직으로부터 생성되는 시험은 FFPE 조직에서 부적당하게 수행될 것 같다. 이에 의해, 예후 시험을 개발하고, 이를 독립적으로 검증하기 위하여 충분한 샘플을 수집하는데 어려움이 생길 수 있다. 또한, 신선한 조직 기반의 검정법의 이행은 샘플이 수술 시에 수집될 필요가 있기 때문에, 임상 시험에서의 변화를 필요로 한다.

FFPE는 종양 보관을 위한 표준물질이며, 검정법 개발을 위해 이미 수많은 종양 은행이 존재한다. 중요한 것은, 샘플 수집 및 처리에서 FFPE-기반의 검정법의 개발 및 임상적 이행을 위해 변화가 필요하지 않다는 것이다.

FFPE 조직을 사용하나, DNA 마이크로어레이 플랫폼을 사용하여 운용하여, 이에 의해, 정량적 중합효소 연쇄 반응 기술에 비하여 생물학적 과정과 검출 가능한 mRNA 전사체의 수를 크게 증가시키기 위한 개시된 방법을 개발하였다. 마이크로어레이 플랫폼을 사용한 FFPE 물질을 사용한 결과로서, 몇몇 방법의 문제가 고려될 필요가 있다. 포르말린 고정은 RNA의 단백질로의 교차 결합을 통하여 mRNA 전사체의 분해를 야기한다. 이러한 분해의 대부분이 즉시 발생하나, 일부 전사체는 시간에 따라 계속 분해한다. 연구를 위해 사용되는 DNA마이크로어레이 플랫폼은 mRNA 전사체의 3' 말단에 대하여 설계된 프로브 세트를 가져, 분해된 전사체를 검출하는 능력을 증진시킨다. 또한, 결장암 샘플의 개별 세트를 시간에 따라 분석하여, 프로브 세트를 혼입시킬 수 없었음을 보장하였다. 시그니처의 일부로서 불안정하거나 달리 안정한 mRNA 전사체를 검출하는 프로브 세트가 혼입되지 않았음을 보장하였다.

시그니처의 예측 값은 공지되어 있는 예후 임상 공변량의 초과이거나 미만이다. 이러한 성능은 대체로 적절한 트레이닝 세트의 확립의 일부로 수행하였던 생물학적 및 기술적 인자에 대한 예후의 초기 균형유지에 기여할 수 있다. 고려되는 생물학적 인자는 공지되어 있는 예후 인자, 예를 들어, pT 병기 및 등급뿐 아니라 종양 위치, 환자 연령 및 성별을 비롯한 영향을 받은 유전자 발현을 가질 수 있는 다른 비예후 인자를 포함한다. 또한, 기술적 인자, 예를 들어, FFPE 블록 시기 및 기여 센터는 트레이닝 세트에서 고위험 및 저위험 샘플 간에 균형을 유지시켰다. 또한, 작동자 및 시약 키트의 무작위화를 수행하여, 기술적 인자와 공지되어 있는 임상적 인자 간의 교락을 피하였다. 이는 검정법이 작동자에 좌우되거나, 특정 센터로부터 샘플의 이용 또는 특정 시약의 배취의 이용에 좌우되는 위험을 최소화시켰다. 공지되어 있는 예후 인자로부터 독립적인 검정법을 개발하였기 때문에, 본 발명자들은 몇몇 인자를 도입한 멀티파라미터 시험을 개발하여, 심지어 더욱 정확한 예후 지시자(indicator)를 제공하는 것이 가능할 수 있는 것으로 여겼다.

유전자 시그니처의 기능 분석에 의해, IGF-1 신호전달, TGF-β 신호전달 및 HMGB1 신호전달이 동정돤 가장 유의미한 경로 중 하나인 것이 드러났다. 이들 모두는 종양 성장의 증진, 침윤 및 전이 및 아폽토시스의 예방을 통하여 결장암에서 불량한 예후를 부여하는 것으로 이전에 보고되었다. 결론적으로, FFPE 보관된 종양 조직으로부터의 II기 결장암에 대한 검증된 강력한 예후 DNA 마이크로어레이 시그니처가 본 명세서에 개시된다.

개시된 시그니처는 내과의가 재발의 위험 및 보조제 화학요법으로부터 유익할 가능성에 관하여 더욱 정통한 임상 결정을 하게 할 수 있다(문헌[Andre et al., Annals of Surgical Oncology 13:887-898, 2006]; 문헌[Diaz-Rubio et al., Clin. Transl. Oncol. 7: 3-11, 2005]; 문헌[Monga et al., Ann. Surg. Oncol. 13: 1021-1134, 2006]; 문헌[Sobrero, Lancet Oncol. 7: 515-516, 2006]). 추가로, 많은 환자는 그들의 치유 가능성과 치료 위험/이익을 알고 싶어 한다(문헌[Gill et al., J. Clin. Oncol. 22: 1797-1806, 2004]; 문헌[Kinney et al., Cancer 91: 57-65, 2001]; 문헌[Carney et al, Ann. R. Coll. Surg. Engl. 88: 447-449, 2006]; 문헌[Salkeld, Health Expect 7: 104-1014, 2004]). 환자의 예후를 예측할 수 있는 것은 임상의 및 환자에게 더 나은 위험/이익의 평가 및 치료법의 선택을 제공한다. 개별화된 환자 관리를 제공하는 능력은 잘된다면 이들 환자에 대한 향상된 생존 및 삶의 질을 야기할 것이다.

과거에, 많은 연구는 확실한 통계적 증거의 결여에 대한 1차적 이유로서 샘플 크기가 원인임을 보여주며, 더 큰 시험이 보조 치료의 이익을 입증하는데 필요함을 시사한다. 검증된 예후 마커, 예를 들어, 이러한 연구에서 생성되는 유전자 시그니처를 사용하여, II기 환자를 고위험 및 저위험 하위-집단으로 계층화할 수 있다. 이러한 방법은 높은 재발 위험 환자에 집중함으로써 개선된 임상 시험 설계를 보조할 수 있으며, 이에 따라 보조 치료법으로부터 이익을 더욱 유도할 것 같다. 따라서, 대장암 DSA(상표명)는 임상 시험에서의 포함에 대해 환자를 계층화하기 위한, 보조 치료 및 신보조 치료에 관한 결정을 위한, 그리고, 추가의 약물 개발을 위한 신규한 경로 또는 분자 표적의 동정을 위한 유용한 연구 도구일 수 있다.

표 6에 보고된 예후 시그니처는 II기 결장암에 대한 재발을 정확하게 예측하며, 독립적인 FFPE 검증 세트에서 평가한다. 이들 이질적 질환애 대한 재발의 예측을 위한 전반적인 정확성은 현저하였다. 20% 불량한 예후 샘플의 집단 유병률에 기초하여, 이는 불량한 예후가 예측된 환자가 33%의 재발 가능성을 갖는 한편, 양호한 예후가 예측된 환자가 5년 내에 13%의 재발 가능성을 가짐을 암시할 것이다. 현재의 방법의 주요 이점 중 하나는 이것이 대다수의 이용가능한 조직 은행에 대한 바람직한 보관 방법인 FFPE 조직으로부터의 발현 프로파일링에 기초한다는 것이다(문헌[Abramovitz Proteome Sci. 4:5, 2006]). FFPE 조직 샘플로부터 추출되는 RNA는 분해 및 포르말린-유도 변형에 기인하여 더 짧은 길이 중앙값을 갖는 경향이 있으며, 이는 범용의 어레이가 검출하기 어렵게 만든다. 결장암 트랜스크립톰을 정의하는 경우, 각 전사체의 3' 첨단에 대한 프로브세트의 설계를 용이하게 하는 3'-기반의 시퀀싱 방법을 사용하였다. 이러한 방법은 훨씬 더 높은 탐지율을 보장하며, 이에 따라 신선하게 동결된 및 FFPE 조직 샘플 둘 모두로부터 RNA 전사체를 검출하기 위해 최적으로 설계된다. 현재의 연구로부터의 결과에 의해, 알맥 디아그노스틱스 대장암 DSA(상표명) 연구 도구가 FFPE 유도 조직으로부터 생물학적으로 의미있고, 재현성있는 데이터를 생성할 수 있음이 나타났다.

실시예 2

암의 예후

본 실시예에는 결장암으로 진단된 대상체를 예후하는데 사용될 수 있는 특정 방법이 기재된다. 그러나, 당업자는 또한 이들 특정 방법으로부터 이탈된 방법을 사용하여, 결장암 대상체의 예후를 성공적으로 제공할 수 있음을 인식할 것이다.

종양 샘플 및 인접 비-종양 샘플을 대상체로부터 수득한다. 예를 들어, 세침 흡인물을 사용하여 각 샘플 유형에 대해 대략 1㎍ 내지 100㎍의 조직을 수득한다. RNA 및/또는 단백질을 통상의 방법을 사용하여(예를 들어, 상용의 키트를 사용하여) 종양 및 비-종양 조직으로부터 단리한다.

일 예에서, 결장암 종양의 예후는 마이크로어레이 분석 또는 실시간 정량적 PCR에 의해 대상체로부터 수득되는 종양 샘플에서 표 1, 표 2 및/또는 표 6의 2개 이상의 전사체의 발현 수준의 검출에 의해 결정된다. 예를 들어, 개시된 유전자 시그니처가 사용될 수 있다. 종양 샘플에서의 상대적 발현 수준은 대조군(예를 들어, 대상체로부터의 인접 비-종양 조직으로부터 단리된 RNA)과 비교된다. 다른 경우에, 대조군은 참조 값, 예를 들어, 건강한 대상체 또는 암 대상체의 그룹으로부터 수득되는 비-종양 샘플에 존재하는 이러한 분자의 상대적 양이다.

본 발명의 원리가 적용될 수 있는 많은 가능한 실시 형태의 관점에서 예시된 실시 형태를 인식하여야 한다.

SEQUENCE LISTING <110> Almac Diagnostics Limited Harkin, Denis Paul Proutski, Vitali Black, Julie Kerr, Peter Kennedy, Richard Winter, Andreas Davison, Timothy Bylesjo, Max Farztdinov, Vadim Wilson, Claire Holt, Robert James <120> Colon Cancer Gene Expression Signatures and Methods of Use <130> ADL-0311WP <150> US 61/435,922 <151> 2011-01-25 <160> 636 <170> PatentIn version 3.5 <210> 1 <211> 76 <212> DNA <213> Homo sapiens <400> 1 ctgttttttc ccgtgtagat ttctgatact tcaatcccct actcccccaa aacagttgaa 60 gcccagccca ctctta 76 <210> 2 <211> 87 <212> DNA <213> Homo sapiens <400> 2 ccggtatacc aagggagcca gttgtgttca gacacacaca tcacagcttg actcactaac 60 tgaggccttt ccatagctcc acagctt 87 <210> 3 <211> 75 <212> DNA <213> Homo sapiens <400> 3 ttggccagtg tgttttctaa gtcaattcta gtgtgtttca tcctcacctc ttccctctgt 60 ggctttgatg atgga 75 <210> 4 <211> 220 <212> DNA <213> Homo sapiens <400> 4 aggctggtct taactgactg ctttttatta ttaccatgca ctggcaattc caaacaatgt 60 cagtgttaaa atgcttctcc ctgaaaaaga gaaaaaaaaa aggaaaaaaa gaaaagaaaa 120 gtgaaaagaa aaactcttat tggcctaagt tctaaataat agctaggtta ccactgagtt 180 ttaactatat gtatatgagc ttcaaataag caccttttta 220 <210> 5 <211> 138 <212> DNA <213> Homo sapiens <400> 5 aaatgctgca gcaggtatgt gcagaggcca gaaccaagat gggatttccc tgctgaacta 60 tgtgagatgc tgcatttcta tgttgtgttt gctctgatgc agcagtaagt tttttgattc 120 acttagacca gcacatta 138 <210> 6 <211> 239 <212> DNA <213> Homo sapiens <400> 6 gaaggtcagg actttgtgaa catataaaac tgcagatggc tattagatat ccaagtagag 60 atgctgaaga gatgaatgta tatagaagtc tgaatttggg agagagatct ggataggaga 120 tacttacctg gtgtttaaca gcttacagat tgtgtaaagt catgaaacgg ataagaacct 180 taaaagagag aaaagggaat agaggttacc aaatgaattg cagtttccaa attgcagag 239 <210> 7 <211> 253 <212> DNA <213> Homo sapiens <400> 7 ctctgatttg cacacctgaa aatcgcggaa ttgagtttcg atagattgat ttttaaaact 60 tttttggagt agggggtata ggggaatcat ttaatttaaa tcattaagat tcccctgctc 120 aaacccagat tcctgtgtac agatgctatt tagagggaat cagaaaaatg ccaagccttt 180 tctctttgaa tgtgctattt ttataactga acttgtacat atgtataaag agagacacat 240 cttcctttta cta 253 <210> 8 <211> 42 <212> DNA <213> Homo sapiens <400> 8 gcttccttgc ctgatgacaa taaagcttgt tgactcagct aa 42 <210> 9 <211> 289 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (258)..(258) <223> n is a, c, g, or t <400> 9 gggtcagaaa gatgccttca gttttggtca gtgtctaaaa gttaagtctg tttaggccaa 60 gcatggtggc tcacgcctga aatcccagca cttggggagg ccgaggcaag tggatcacaa 120 ggtcaggaga tgagaccatc ttagccaaca tggtgaaacc ccgtctctac taaaatacaa 180 aaaaattagc caggcgtggg ggtgcgtgcc tataatccca gctacttggg aggctgaggc 240 aggggaatcg cttgaacncg ggaggcagag gtcacgccat ggactccag 289 <210> 10 <211> 293 <212> DNA <213> Homo sapiens <400> 10 ctttctaaaa gttgcatgtt atgtgagtca gcttatagga agtaccaaga acagtcaaac 60 ccatggagac agaaagtaga atagtggttg ccaatgtctc agggaggttg aaataggaga 120 tgaccactaa ttgatagaac gtttctttgt gtcgtgatga aaactttcta aatttcagta 180 atggtgatgg ttgtaacttt gcgaatatac taaacatcat tgatttttaa tcattttaag 240 tgcatgaaat gtatgctttg tacatgacac ttcaataaag ctatccagaa aaa 293 <210> 11 <211> 64 <212> DNA <213> Homo sapiens <400> 11 agcaagctta ctaaaaactg cacttcacac ttagcttaat gtttgaggga attaacttca 60 taaa 64 <210> 12 <211> 113 <212> DNA <213> Homo sapiens <400> 12 accatggcaa cgaggtagtc tgttctattt ttggagtatg aaagtagtgc cttcttaaat 60 ctaataataa atgagagttc cagaaaacca gtgcttcaaa caaatttgat tta 113 <210> 13 <211> 227 <212> DNA <213> Homo sapiens <400> 13 tgggcttaaa actcagctct gccacttaca ttcctcattt ctttctatcc tgggtctgcc 60 aaaatgtaag aaaagttttc acattttttt accagttttt ctcacccatg accaccctgt 120 ctcaaaatga ttatgcaaca gcccagagtc ccccattcca aaattctttg caaagagcaa 180 gatttccctc gctatttctg aattcatcca cacctctatt tctctct 227 <210> 14 <211> 170 <212> DNA <213> Homo sapiens <400> 14 actccccaag ggttctcaat tctcttttcc caggctcgtc catgactgtt tcttgtcctc 60 agagcccttg ccttccttgc tgcctcctca gtcccattct ctgtctcttt cagcggcccc 120 atccttatct accttcccca gtgcatccca gaaaaacatc tgtcccttcc 170 <210> 15 <211> 78 <212> DNA <213> Homo sapiens <400> 15 cctgagcttg ggtgactcat tgtgtgctaa gaaaaaaaat caaatttcag aacatgcgag 60 acctcgaccc aggtaaat 78 <210> 16 <211> 211 <212> DNA <213> Homo sapiens <400> 16 gactggagaa agaagaggtg gcataggatt gactaagatg aaggaagggg gccaggcgtg 60 gtggctcacc cctgtaaccc caacactttg ggaggctgag gcgggcagat cacctgaggt 120 caggaattca agaccagcct ggccaacatg gtgaaacccc atctctacta aaagtacaaa 180 aattagccag gcggtagtgg tgtgtgccta t 211 <210> 17 <211> 275 <212> DNA <213> Homo sapiens <400> 17 atcctcaaca gctaatcact ctttaactcc tgaattctgg ctcctgtccc cactacttta 60 atgaaattat actctaaact tcgccagtct tctcccaacc aactgccaaa tctcatgaca 120 tggttttaag cctctctctc ttaacttctc agctttccac aagtagacaa gtcttcttct 180 ggaaactctc cacgcatgtc ctctatactc tcactactgt ctccctcttc ttccttctcc 240 acctgccccc atctcctggc atttctactc tcttt 275 <210> 18 <211> 274 <212> DNA <213> Homo sapiens <400> 18 ttctcccagt tcatcctacc tggaatctga cccactaccc acctgcaaca agtcttccag 60 aggcaggaag ataggccctg ccctggcagg atgggttggg gtcacttgac ccctgctccc 120 cctttgaggg gaaaggggtg gaactaagat gggtttataa ctggaacctc caatgaccag 180 atgtatatag agatttacaa agatttttat attaatttaa taaaacaaat tcttaaatag 240 aacaaaataa acacctaatg agccacttat atat 274 <210> 19 <211> 83 <212> DNA <213> Homo sapiens <400> 19 atggtggata aatgggactt aggactaaaa ctcatgcctt ggtgtgtttt tgcagtgatg 60 ttttgttctg gggtgcatca caa 83 <210> 20 <211> 95 <212> DNA <213> Homo sapiens <400> 20 gcgtagctaa gtgaaaaggt catagctgag attcctggtt cgggtgttac gcacacgtac 60 ttaaatgaaa gcatgtggca tgttcatcgt ataac 95 <210> 21 <211> 223 <212> DNA <213> Homo sapiens <400> 21 actctcaaga acagtagagg gaaaagaaaa aagaaaaaga acagtggagg ttgtggtaaa 60 ggacatttga gaagagattc atgaaacagg ccaaatggta ggtttgctag ttcgcagggg 120 gagaaccaat gaattaattt agaaagagct tctctgggat tagaatgaaa ataaatcact 180 ggctgggtgc acacctgtaa ttctagctat tcaggcagga gga 223 <210> 22 <211> 138 <212> DNA <213> Homo sapiens <400> 22 ttgtctcagc atcagtatat cccatgcaat atttgaggtg tgctcatact aaaattattt 60 gtgtatctga aattcaaatt aaactgggtg tctttttctt ttcatctggc aaccctacta 120 agatcataaa cccttgga 138 <210> 23 <211> 226 <212> DNA <213> Homo sapiens <400> 23 acttgggagg aaatacacag tagttagaaa aagcctccta ggtgattttg atgaatccca 60 gtctcaaatt tcttcatttg gaaatgataa tgtaggccac acgtattact ggagaaaaat 120 gtgctcccga gactttccag agcagcagag ctgggactag gcaggtgagg cagctacgtg 180 caagtgtagc cctgagaatg agcacctctt taaagaatgt accttg 226 <210> 24 <211> 66 <212> DNA <213> Homo sapiens <400> 24 gagaggttgt ctgtggccag aatttaaacc tatactcact ttcccaaatt gaatcactgc 60 tcacac 66 <210> 25 <211> 107 <212> DNA <213> Homo sapiens <400> 25 ttgcattagg tattagtcta gggataaagt atacaggcgg atgtgcgttg gttatataca 60 aatatgtcat tttatgtaag ggacttgagt atacttggat ttttggt 107 <210> 26 <211> 271 <212> DNA <213> Homo sapiens <400> 26 gaaaaagcgg tacgatgcct tcctgacctc accggcctcc ccaagggtgc cggcactctg 60 ggtggactca cggctgctgg gccccacgtc aaaggtcaag tgagacgtag gtcaagtcct 120 acgtcggggc ccagacatcc tggggtcctg gtctgtcaga caggctgccc tagagcccca 180 cccagtccgg ggggactggg agcagttcca agaccacccc accccttttt gtaaatcttg 240 ttcattgtaa atcaaataca gcgtcttttt c 271 <210> 27 <211> 44 <212> DNA <213> Homo sapiens <400> 27 tgcctctggt ccttggactc ttgtccatgg ttcctgagct gtgg 44 <210> 28 <211> 244 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (200)..(208) <223> n is a, c, g, or t <400> 28 gcccagcctt gaagtcatgt tctaaattgt atttgaattt gtgcctcttt gtttttcccc 60 aaaccaaagc cctcaaattg tagtctctgt cggcttctgc agaattctgg aaaatgccag 120 ttttcctccc ccgcccttgt tttccataaa acatatttat atattgtgat gaggagtact 180 ttctgaagag tacttcgtan nnnnnnnnaa ttgccttgtt tgccttcaac ttccttgatt 240 ttca 244 <210> 29 <211> 189 <212> DNA <213> Homo sapiens <400> 29 aaaagtctag attggtcttg atattgagat aataaaaagt aagtagcatt aagaaaggta 60 acaatcttca ttctacagat gaactcattg aaacaattta ggggaatgag gggcaaaagg 120 ggagaaatac tgctaaagaa catgagcata aaaacgcgtg cgtttcagtg tttaagaagg 180 cttgataaa 189 <210> 30 <211> 241 <212> DNA <213> Homo sapiens <400> 30 ataattatgg gctcacttcc tactggagat gttgaaagtc taaatcggtt tgaccatttt 60 gattgatggc acaatctggt ttagaaaact ttgtttagat caatgacata accctgctgc 120 ctctgcctgc ccttcccctc ccttctccca tccccttttc cctatctggt gtctgtactt 180 tgatgaaggt gagctataat attggtggtt aatataatcc agaaggctta gttctgtgtg 240 t 241 <210> 31 <211> 286 <212> DNA <213> Homo sapiens <400> 31 gaggaagggc tgaaatgctt tctattggat actatctggg catattactt cctgtggttc 60 actgtctggg tgacaggatt catagaagcc caaactttag caccacgcag catacccttg 120 taacaaagcc gcacacgtac gccctcaagc taaaacaaaa gtggaccggg agccgaggtg 180 ggggatcatg agggtcagga gtttgagacc agcctggcag ataacggtga aaccccgtct 240 ctactaaaat accaaaaaag gttagccgac atggtgcagg tccttt 286 <210> 32 <211> 75 <212> DNA <213> Homo sapiens <400> 32 ctttctctct tacctgccta tgcttgaagc ccccgcccct cttcaagttg tcctgccttt 60 caagaccaat gtaca 75 <210> 33 <211> 278 <212> DNA <213> Homo sapiens <400> 33 gaaaaagtag tccaccacga tccacctttg ctctttgacc tctcaagaga cccttctgag 60 acccacatcc tcacaccagc ctcagagccc gtgttctatc aggtgatgga acgagtccag 120 caggcggtgt gggaacacca gcggacactc agcccagttc ctctgcagct ggacaggctg 180 ggcaatatct ggagaccgtg gctgcagccc tgctgtggcc cgttccccct ctgctggtgc 240 cttagggaag atgacccaca ataaatgtct gcagtgaa 278 <210> 34 <211> 194 <212> DNA <213> Homo sapiens <400> 34 tcttctgtga agacaggacc tatgcaacgc acagacactt ttggagaccg taaaacaaca 60 gcgccccctc ccttccagtc ctgagccggg aaccatctcc caggaccttg ccctgctcac 120 cctatgtggt cccacctatc ctcctgggcc tttttcaagt gctttggctg tgactttcat 180 actctgctct tagt 194 <210> 35 <211> 158 <212> DNA <213> Homo sapiens <400> 35 gtcatgagac gggatttggt caccaaggaa gtgagtatat atagagaaga ggtccaaggg 60 ctgggccctt gaatatttaa tataatttag aagtctgtaa cgatgaagta gttagcagaa 120 gaaacttgag gagagaccag tgaggtgggt agcaaaac 158 <210> 36 <211> 179 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (61)..(61) <223> n is a, c, g, or t <400> 36 ccactggaaa ggagtgttgt aagactaggt tttggctaag aacttctcac ctcagcccta 60 nagagggagc ctgtgggttc tcagagagat atcacaattt gagtcccaaa gaagaggcca 120 gatacccacc caccttcccc caaatcttaa gcacctgcgc cagtacagtc aagaagagg 179 <210> 37 <211> 222 <212> DNA <213> Homo sapiens <400> 37 tttgcccttc ctgctaactc tattaccccc acgattcttc accgatgatg accacccaca 60 ctcaacctcc ctctgacctc ataacctaat ggccttggac accagattct tacccattct 120 gtccatgaat catcttcccc acacacaatc attcatatct actcacctaa cagcaacact 180 ggggagagcc tggagcatcc ggacttgccc tatgggagag gg 222 <210> 38 <211> 239 <212> DNA <213> Homo sapiens <400> 38 ggaagagctc ggtgagcatg atcatggctc aggttctcca tccacatgcc taagacaggg 60 gtgagtgtga agatgggaac tgactcagaa ttaactgtgt gatcatgggc aagttgccaa 120 gttaaccctc atatctaaat tcaggtatcc ttgaacaaac atagacagat actgatgatc 180 cgccatgttt actataacca taaactcttt gtgaattaaa aatggcctct caacctgga 239 <210> 39 <211> 35 <212> DNA <213> Homo sapiens <400> 39 cagggccata cagggtgtgt acatcacaga taggg 35 <210> 40 <211> 270 <212> DNA <213> Homo sapiens <400> 40 gtactctcaa gaacagtaga gggaaaagaa aaaagaaaaa gaacagtgga ggttgtggta 60 aaggacattt gagaagagat tcatgaaaca ggccaaatgg taggtttgct agttcgcagg 120 gggagaacca atgaattaat ttagaaagag cttctctggg attagaatga aaataaatca 180 ctggctgggt gcacacctgt aattctagct attcaggcag gaggatggct cgagcctagg 240 agttggaggt cagcataggc aacataggga 270 <210> 41 <211> 125 <212> DNA <213> Homo sapiens <400> 41 caagaccggc ccttggctgt tgttacagag atgttgggca gagctatgca ggtgtttcat 60 tgtgaactct agctttgatc atggtaaaaa gttaaccttt tctatttttt aatggatgtt 120 atacc 125 <210> 42 <211> 79 <212> DNA <213> Homo sapiens <400> 42 gagagacaaa gcaagtggtg atgtcaagga gaagaaaggg aaggggtctc ttggctccca 60 aggggccaag gacgagcca 79 <210> 43 <211> 241 <212> DNA <213> Homo sapiens <400> 43 agcggcggct caaggatcag gaccaggacg aggatgagga ggagaaggag aaacgtggcc 60 gcaggaaggc gagcgagctg cgcatccacg acctggagga cgacctggag atgtcgtccg 120 atgccagtga tgccagtggt gaggaggggg gcagagtctc cgaggccaag aagaacgcgc 180 cgctggctca tggcgggcgg agaaagaaga agaagaaggg ttcagacgac gaggccttcg 240 a 241 <210> 44 <211> 201 <212> DNA <213> Homo sapiens <400> 44 gggagtccag gattaaggtt ttgcagggtt tggtttctag tgagggcttt cttcctggct 60 tgcagatggc catcttctct ccataggcta acatggcctc tactttgtgt gtgggagagt 120 cagagataga gcaagccctc ttgtgtctct tcatataagc ctactaatcc ccatcagacc 180 aggtccctta tgatcttaaa c 201 <210> 45 <211> 126 <212> DNA <213> Homo sapiens <400> 45 agcaaggtgt ctcagaaccc aattcttacc agtttgttgc aaatcacagg gaacgggggg 60 tctaccattg gctcgagtcc aacccctcct catcacaacg cgccacctgt ctcttcgatg 120 gccggc 126 <210> 46 <211> 95 <212> DNA <213> Homo sapiens <400> 46 caggtgttgg gacagtccca ccctccctgc tatttatatc cctctgccta tttattgaat 60 cgaacttcgc ctctgtctcc atctgtaaat atgtg 95 <210> 47 <211> 145 <212> DNA <213> Homo sapiens <400> 47 agagtggcag tttgcatggc gaacccccca cttcctcttt gctgcccctt cactttcttg 60 ctgccccttt cccagtctct cttcacaccc actcctggtc tgtcctgatc ccctcttctg 120 tatcaggttt attggttgta catat 145 <210> 48 <211> 245 <212> DNA <213> Homo sapiens <400> 48 gaatattctg gctggcgaac tcctacacat ccttcaaaac ccacctggta ctgttccagc 60 atcttccctg gatggctgga ggaactccag aaaatatcca tcttcttttt gtggctgcta 120 atggcagaag tgcctgtgct agagttccaa ctgtggatgc atccgtcccg tttgagtcaa 180 agtcttactt ccctgctctc acctactcac agacggggat gctaagccgt gcacctgctg 240 tgggt 245 <210> 49 <211> 193 <212> DNA <213> Homo sapiens <400> 49 taagacctac tatctgatag ccccacatgg tgactatagt aaataataac ttaattgcac 60 atttaaaaat aacttaaaca gtgtaattgg gttgtttgta attgaaagga taaatgcttg 120 ggggagtgga taccccattc tccatgatgt gcttattgca tactgcatgc ctggaccaaa 180 atatgtaccc cat 193 <210> 50 <211> 36 <212> DNA <213> Homo sapiens <400> 50 atttactacc ttattatgaa gtgtgccctc caaaat 36 <210> 51 <211> 43 <212> DNA <213> Homo sapiens <400> 51 cttttctggg tcacagaggc caaatgtgag agcattgaat aaa 43 <210> 52 <211> 213 <212> DNA <213> Homo sapiens <400> 52 gaccttttca tcaatagatc gcccttaaag acccattgta aggtcataaa aaacctcggc 60 caactgcaca aagatggtgc ctcactgcaa caagaaacct taaggtgtct taccgacgaa 120 ataaaaaaca taaatgattg ttctccaagg cctgagggca agactcatga tgggcaagtc 180 aaccccaatc tggaacaatg tccctcctct tag 213 <210> 53 <211> 122 <212> DNA <213> Homo sapiens <400> 53 gattatgttt tccatggaag gacaagtctg actgttcata ggctgatttt ctttaagagg 60 attattctgt tttacaattt caattctaga tcacatttta tatatgctgc atgccaaaaa 120 aa 122 <210> 54 <211> 96 <212> DNA <213> Homo sapiens <400> 54 acctgtccct gtcctacctt aactgatcaa tcgaccttgt gacagtcttc ttctggacaa 60 tgggtcttat catctcccca ccatgtacct tgtgac 96 <210> 55 <211> 203 <212> DNA <213> Homo sapiens <400> 55 tagacagtat gagtcaatgt gcagtgtagc ccacacttga gaggatgaat gtatgtgcac 60 tgtcactttg ctctgggtgg aagtacgtta ttgttgactt attttctctg tgtttgttcc 120 tacagcccct ttttcatatg ttgctcagtc tccctttccc ttcttggtgc ttacacatct 180 cagacccttt agccaaaccc ttg 203 <210> 56 <211> 223 <212> DNA <213> Homo sapiens <400> 56 aagacctact atctgatagc cccacatggt gactatagta aataataact taattgcaca 60 tttaaaaata acttaaacag tgtaattggg ttgtttgtaa ttgaaaggat aaatgcttgg 120 gggagtggat accccattct ccatgatgtg cttattgcat actgcatgcc tggaccaaaa 180 tatgtacccc ataaatatat acacctacta tgtgcccccg aaa 223 <210> 57 <211> 240 <212> DNA <213> Homo sapiens <400> 57 gaatttggtt ttgatctccc tattgagaga ctggtgtaca gtatttgtct atccctgcac 60 aaattattaa agcaagtttt gccattctgt tatccttcct catgaatatc ttgattactt 120 ttggccctaa ctcatcaagt tccacagaaa tcccaattgg aatcttagtt aaaattgtgt 180 tgtctatgga ccagttgaag aaaactgaca catttataat actgactctg ttccataaag 240 <210> 58 <211> 211 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (123)..(131) <223> n is a, c, g, or t <400> 58 ccagctttaa aggtgagatt gtagagatgc tgtcaaaggg ataaggaaat agcaagattt 60 ttaagtagtg tgtttgtgaa gactgatccc cattttacaa ctgcctgttc tttctccagt 120 ccnnnnnnnn ncagccagct tgactattag aaaagtatga aactggttgg ggtttattta 180 atatttttaa tatattgaga agcatggtct g 211 <210> 59 <211> 56 <212> DNA <213> Homo sapiens <400> 59 aaattcaata tggaacttga ggccaaaaaa acagaaggtt actctcaatg ccatcc 56 <210> 60 <211> 73 <212> DNA <213> Homo sapiens <400> 60 tatgtgccaa atctactaga cattggagaa acagtaggaa caacacatgg taccggcaca 60 tggatctttc agg 73 <210> 61 <211> 266 <212> DNA <213> Homo sapiens <400> 61 agtctggttc taatcttctg agctgccttt ggaaggaagt tatgaggtag aagattctac 60 tgacttttag taaggtggac aatgagagaa aagaaaaagc aggtgcctca tctacagatc 120 cttctgggat ttatttgcca tgtacaattt aatgcataaa aaggcctctc tccataaaac 180 tcagcacttt acagatgtag aatatataag catgccaaat ttacttatct gtcacataca 240 aagcatcatt ccaggtgcta gtgagg 266 <210> 62 <211> 243 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (128)..(218) <223> n is a, c, g, or t <400> 62 gtaggacagt aggacagtac acagtagaac agtctaggac agttcagagt acacagtagg 60 acagttcaca gtaagacagt tcacggtacc cagtaggaca gtacacagta gaacagttca 120 cagtgcannn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnat aggacagttc acagtaagac 240 agt 243 <210> 63 <211> 228 <212> DNA <213> Homo sapiens <400> 63 gaagctgcca gagggtaatt ggttttccca gaagttctta aatttgggag ctgtcttgcc 60 gcaagccatt gagactggaa attcttggag ttggtattgt ttttgtaaat tgactaatag 120 agagttaggg aagcctggag acttgttggg ggtgagttct ctaaatggtt ttaggcttgt 180 ctgtgtactt ttgcaacgag attgtctaat tctatgggcc tctgaggt 228 <210> 64 <211> 158 <212> DNA <213> Homo sapiens <400> 64 ttcttgtgca ttattacatt tactcatacc tccaggacaa tgttgaagag aaatgatgta 60 ttagtccatt ttcacactgc tataaagaac tgcctgtatt agcctagcat ggtggcggac 120 acctgtaatc ccagctatgc aagaggctga gacgagaa 158 <210> 65 <211> 183 <212> DNA <213> Homo sapiens <400> 65 aacccaacct taaagctgaa gacagtcccg gctaaatcct catactgaat tgagaacctg 60 tcttcccatt tggtgtgctt tcctccgatt gatcccaacc cttcacctat tttacgtata 120 cctgcccttt cctaattggt ttttacactg ctgtgcccac cttttgagtg gtgcctttgc 180 ata 183 <210> 66 <211> 37 <212> DNA <213> Homo sapiens <400> 66 tggtgaaatt ttgtaccccg gatgcagttg gcacttt 37 <210> 67 <211> 138 <212> DNA <213> Homo sapiens <400> 67 aaaaatgttg gttgggctac acagttaact agtggagctg tgtgggttca gtttaatgat 60 gggtcccagt tggttgtgca ggcaggagtg tcttctatca gttatacctc accaaatggt 120 caaacaacta ggtatgga 138 <210> 68 <211> 39 <212> DNA <213> Homo sapiens <400> 68 ttggagataa ggcttttagg aagtcattaa agtgagatg 39 <210> 69 <211> 177 <212> DNA <213> Homo sapiens <400> 69 caggttgttt tgttctagtt ctaatttctt aaaaaccact acatggttac aaaattggaa 60 taacatttgg ggacaactgg gttaactaca aagaggagga ttttaagagg agatgtgttg 120 tattgactca ttttgtatta tttttggctt acagttccca tagctgttag agtctgg 177 <210> 70 <211> 284 <212> DNA <213> Homo sapiens <400> 70 ggccaatgag aacccagcct tcaaataaac aagcttctca ttgttaacac agggttcaaa 60 ggcagggagg ttggaggtgt tttgcagggt atccagaatt ctgatcgctg aatactttag 120 ggcaaagagt aagatttccc acacctcccc ctaaatctta caattccctg atgaggcagg 180 aacatgggaa aaaaaagata caggttaaat tacaaagcag aaaaatatgc ccagctagaa 240 gctaaagacc tggtctcaaa acactgaacc gaggagcact gatt 284 <210> 71 <211> 254 <212> DNA <213> Homo sapiens <400> 71 ccctggcctg agaggttgct tttaagtctt ccaccccttg ttccatctgc ctgccaaccc 60 atcggaaagg aatccacatc atattggaga tgaccccatc aaccccaggg ctccagcact 120 accaagttgg aattccacgc ccgggagtgg ggtagaggaa gacgagacag gacgaggcag 180 aaaagcacat tttaaaaacc agacaagatg gctaggccat caccaaccaa cggacttacc 240 ttacatcttt gtag 254 <210> 72 <211> 70 <212> DNA <213> Homo sapiens <400> 72 ttttttctat ccctgccatt cagtctccat tagcactcta ttctctctca tttattccac 60 cccgtcttcc 70 <210> 73 <211> 178 <212> DNA <213> Homo sapiens <400> 73 gaaacacgtg tattatggga acaactgaaa ggtcagcctg aagacttttg ccctgttgct 60 ttctgagagt gctggatatg agtccctgtc tctgaaactt ctaaaaatat gcacccttaa 120 ccagctttcc acggagggat aagcctttgt caatacaaat ggtacagtga gcagcaga 178 <210> 74 <211> 176 <212> DNA <213> Homo sapiens <400> 74 agtctggccc catagtgact tttgccccat gattctgctt cactgttgga atcctctttg 60 aagttccccc tctctttgct aaagcagtga aggaagagaa cagagacaaa ctctttggac 120 tgtgaaagag aaggtagaga attccaggca acagtctgac caagggtgta aaccag 176 <210> 75 <211> 274 <212> DNA <213> Homo sapiens <400> 75 gggaggggga gatacacata tataatatta aaaaaatgtc atcttccaca gaaaacactg 60 actctgcctt ccaaaagtca caagtacaga tggagtccaa gttcaggagt ggtgcccaaa 120 cccagatact caaaccaaac tgcagaaaca ttcaggaaaa aacaagccaa agccattatt 180 ttagaaacac aacgcaaaac aataagataa aattaagtaa aagggaagta acagatggaa 240 taaaaaccaa gatatcacat tccataaagg gcaa 274 <210> 76 <211> 290 <212> DNA <213> Homo sapiens <400> 76 gtggtggtta tcgacaggaa tctgtcagag agcataccca tggagcattt ataattggga 60 gccattccag aattctggtt tgcatacaac tctttaaaaa gccagctacc ctgaaatgta 120 cactatctga gctctgcctt tgcctgtgat gagtgatgtt ggtcctgcct cttagttctg 180 ctctcagtct ccaccatcgg cttctcagat tttccttcca ggaccagcag gcaggtgggt 240 gtggtgactt tgtggcagac actgtggcag attaaaggtg gttgcaaatt 290 <210> 77 <211> 242 <212> DNA <213> Homo sapiens <400> 77 accacctgaa ggaccaccag aatgggtcca tggctgctgt gaatggacac accaacagct 60 tttcacccct ggaaaacaat gtgaagccaa ggaagctgcg gaaggatgga agtcaaagaa 120 ttgaaaccct ccaaaccacg tcatctgatt gtaagcacaa tatgagttgt gccccaatgc 180 tcgttaacag ctgctgtaac tagtctggcc tacaatagtg tgattcatgt aggacttctt 240 tc 242 <210> 78 <211> 89 <212> DNA <213> Homo sapiens <400> 78 cttgtagctg acatttggca aaagcgtcac tgaaaggcaa gctaaatgta gttattttat 60 cctgtggccc tgaagcacaa aataaaaat 89 <210> 79 <211> 284 <212> DNA <213> Homo sapiens <400> 79 gtttaccgaa ggcaccagtt cagccaggag tgaaatccgg agaggagcaa cgccagcctg 60 ggtcacagtc catcaaaccc catgagcccg accactctcg ctcttcctta cattcccacg 120 tcccccttct ctcccaaccc ctcatatcag caagggaaat taattaatga gatttgataa 180 atcagtagat agaatgaggt cccccttttg aaatatttag cagactggaa cccccccgca 240 agcctctgta gggggtggat ggagacactt ctaactttaa taaa 284 <210> 80 <211> 46 <212> DNA <213> Homo sapiens <400> 80 ctggaggagt gagtccctat gctgacccca atacttgcag aggtga 46 <210> 81 <211> 230 <212> DNA <213> Homo sapiens <400> 81 gcattcacac atgtgcatgc tcacacagag acggttctgg agttgtggag ggaagcctgc 60 cccgccttcc ggccccactc cctgaaccta cagctctctc catggccccc ctcacctgct 120 cgggctgggc cggggcttag ggcgagaggc aggggcaggg actttcaggg atccggcagt 180 ctcagtgatg agagcacacc agctggggag aaaggccaaa tccctgggca 230 <210> 82 <211> 298 <212> DNA <213> Homo sapiens <400> 82 aggattcctt cttgtgttta agcaggagca ggcagaaaag cctaacaacc cccgtctttc 60 ccatcggcag ccccacgccc atcatcacac aaggccccaa ggatgggaaa gagaaaagct 120 agaaggaccc aggggcctcg ggactacagg aagagtggaa agttacagac tgtaaataga 180 gtcgggtagg cttgtgccct tccttatttg tccggttctt tcatttgctg cttctgttta 240 agctcaaggg tcagtcacca tgaaatgaat ttgcacctcg gtttctcttt aggctcca 298 <210> 83 <211> 278 <212> DNA <213> Homo sapiens <400> 83 ctcagagaag gaaaggttgg ccaaagacac atccaggagg ggaacagaag gaggggacag 60 aagcaagtct gcagatcaga ggaaagaaga aagagcagag gagggagatt ggaagtagaa 120 atgctgaatg cagaggcaaa aaaggaaaat gaaggacagg aggattaaac agacagaggc 180 aaggatgatg agagaggagc agacagcaag aatgaaaagc agaaaataca atagaggaaa 240 tgaagaaaag taggcctgct ggagctagat gatgatgt 278 <210> 84 <211> 218 <212> DNA <213> Homo sapiens <400> 84 gggcccatgg attaacgccc tcatcccaag gtccgtccca tgacataaca ctccacaccc 60 gccccagcca acttcatggg tcactttttc tggaaaataa tgatctgtac agacaggaca 120 gaatgaaact cctgcggctc tttggcctga aagttgggaa tggttgggga gagaaggcag 180 cagcttattg gtggtctttt caccattggc agaaacag 218 <210> 85 <211> 179 <212> DNA <213> Homo sapiens <400> 85 gggaaactct gtcactactg aaaatacaaa agtacaaaaa aaaaaaaaaa attagctggg 60 catggtggtg caagcctata ctcccagcta ctcaggaggc tgaatttgga ggatcccttg 120 agcccagggg ggttgaggct gcattgaggt ataattttgc cactgtattt cagcctggg 179 <210> 86 <211> 146 <212> DNA <213> Homo sapiens <400> 86 ggctctgcca ccctacctgt tcagtgtccc gggcccgttg aggatgaggc cgctagaggc 60 ctgaggatga gctggaagga gtgagagggg acaaaaccca ccttgttgga gcctgcaggg 120 tggtgctggg actgagccag tcccag 146 <210> 87 <211> 166 <212> DNA <213> Homo sapiens <400> 87 gggcctcggg actacaggaa gagtggaaag ttacagactg taaatagagt cgggtaggct 60 tgtgcccttc cttatttgtc cggttctttc atttgctgct tctgtttaag ctcaagggtc 120 agtcaccatg aaatgaattt gcacctcggt ttctctttag gctcca 166 <210> 88 <211> 217 <212> DNA <213> Homo sapiens <400> 88 gagagctctg cctagtctgg tttggcgagg gcccttgatc accttgcccc tcctccctgt 60 cttctctgat tcttttccct caaaatagtc ctgagaacta attgtcacag acattggaat 120 atttgtactg ctctcgtgcc atttgagagg ctgctgcccc aggcaggcca gcccctactc 180 ctcttggcta cactcatgtt gctcagacta tatttca 217 <210> 89 <211> 211 <212> DNA <213> Homo sapiens <400> 89 ctgggaactg gcactgggtc gcttttggga ttacctgcgc tgggtgcaga cactgtctga 60 gcaggtgcag gaggagctgc tcagctccca ggtcacccag gaactgaggg cgctgatgga 120 cgagaccatg aaggagttga aggcctacaa atcggaactg gaggaacaac tgaccccggt 180 ggcggaggag acgcgggcac ggctgtccaa g 211 <210> 90 <211> 94 <212> DNA <213> Homo sapiens <400> 90 gatgaagagg gctgattgta tctaacttag ggtcttgcat gcagctggca cttaatgcat 60 tttattgact gttttagcta acattcaatg gaca 94 <210> 91 <211> 197 <212> DNA <213> Homo sapiens <400> 91 gccagactgg gctgtagtta gcttttcatc cctaaagaag gctttcccta aggaaccata 60 gaagagagga agaaaacaaa gggcatgtgt gagggaagct gcttgggtgg gtgttagggc 120 tatgaaatct tggatttggg gctgaggggt gggagggagg gcagagctct gcacactcaa 180 aggctaaact ggtgtca 197 <210> 92 <211> 39 <212> DNA <213> Homo sapiens <400> 92 aagctgagaa actacctgag gtgtctaaag aaatgtatt 39 <210> 93 <211> 212 <212> DNA <213> Homo sapiens <400> 93 ggaattaagg ctattactct gaagaaagtt ggggggccag ggctcctatt tttttgctga 60 ggagatggaa gatcagggct tgtattcaat aagaatggga ggggccaggg gatgcctggc 120 aaaagccttg cactgtgagg tgcaggtaga ggcttttatt ctggtgagag gacatggact 180 ctctctctcc cctcaggtaa ctgtgccctg ta 212 <210> 94 <211> 104 <212> DNA <213> Homo sapiens <400> 94 actccgcagg ggctgtgaat cccactggga gggcggcggg cctgcagccc gaggaaggct 60 tgtgtgtcct cagttaaaac tgtgcatatc gaaatatatt ttgt 104 <210> 95 <211> 251 <212> DNA <213> Homo sapiens <400> 95 ggagttctac gggatctgag agaaaaacca tgaggaaagt tttcaggatc cttaaacaat 60 ttttggagcg tgtgatgtgg gggactggaa aagatgtgga gtatgtaaaa gggattttgg 120 aagaagcttt tggaatatga tgctgagagt cctctggaga tttcaggcaa ttgctggaga 180 tttttagaat gagtgggggt ggggaagggg atcccggtga agatcactgg gctacatgag 240 ggtgatctct a 251 <210> 96 <211> 155 <212> DNA <213> Homo sapiens <400> 96 ggagcggcgc aaggagagac aggaagccct ggaggctaaa cttgaggaaa aaaggaaaaa 60 ggaagaagag aaacggttaa gagaagaaga gaagcgcatt aaagcagaga aggccgaaat 120 cacgaggttc ttccagaaac caaagactcc acagg 155 <210> 97 <211> 220 <212> DNA <213> Homo sapiens <400> 97 ttaattttca tgttgcggag cccctactac aagtatgaag agaaaagaaa aaaaaaatga 60 aggaaacaac cactggccca gggtagagat gcctacaggg tggttgcttg ttggatacaa 120 tacaaggaac actgctcaga acccacgtct tcagcagcat ttgaaacact ggcagcaatg 180 cacaagagca agatggtgtc aggaaccatg tcaaaccctc 220 <210> 98 <211> 119 <212> DNA <213> Homo sapiens <400> 98 taagctttta agcatcatga agaacaattt atgttcacat taagatacgt tctaaagggg 60 gatggccaag gggtgacatc ttaattccta aactacctta gctgcatagt ggaagagga 119 <210> 99 <211> 103 <212> DNA <213> Homo sapiens <400> 99 gcctggagcg tgagcccaga cccaactcca gccccagccc cagccccggc caggcctctg 60 agaccccgca cccacgaccc tcataataaa cacgtcgatt ctg 103 <210> 100 <211> 122 <212> DNA <213> Homo sapiens <400> 100 tatgtgccaa atctactaga cattggagaa acagtaggaa caacacatgg taccggcaca 60 tggatctttc aggaaaacga agtaggtaat aaacaggaaa aagcccgagt ctgatgctaa 120 ga 122 <210> 101 <211> 93 <212> DNA <213> Homo sapiens <400> 101 ctgcctgtat cctcattggt gggagcccag ccatggccct aattgtgcct gagcttgact 60 ttcagtcagg gccacagtga gcattaaatt att 93 <210> 102 <211> 70 <212> DNA <213> Homo sapiens <400> 102 ggagttaaat gtagtgcttt ccaggatagt tccttccata ctccttctgt tcctttcatt 60 gtgcccctct 70 <210> 103 <211> 238 <212> DNA <213> Homo sapiens <400> 103 cagccgtttc cctgcagaat cagctctgtc tcatgtggaa gtggagaatc agccttgcct 60 ggcctttagg aacttttgtg gggaagagag ctttgaagag aggaggggga ctttagagag 120 ggatgaaaat gagccctggg agggaggaag ggacgaggag gggtggctgc atgttaccgt 180 cccctacctc tccccacgtg gagggtggag cagttatgag ggaggaagtc aactgctg 238 <210> 104 <211> 269 <212> DNA <213> Homo sapiens <400> 104 caggcattcc tttctatcga taattactct ttcaaccaat tgccaatcag aaaattgtta 60 tatctaccta taatctagaa gcccccacat caagttgttt tgcctttctg gacaggacca 120 atgtatatct taaatgtatt tgattgatct ctcatgtctc cctaaaatgt ataaaaccac 180 gctgttcccc gaccacctgg agcacatgtt ctcagggtct cctgagggct gtgtcacagg 240 ccatgttcac ttacatttgg ctcagaata 269 <210> 105 <211> 291 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (258)..(258) <223> n is a, c, g, or t <400> 105 gggtcagaaa gatgccttca gttttggtca gtgtctaaaa gttaagtctg tttaggccaa 60 gcatggtggc tcacgcctga aatcccagca cttggggagg ccgaggcaag tggatcacaa 120 ggtcaggaga tgagaccatc ttagccaaca tggtgaaacc ccgtctctac taaaatacaa 180 aaaaattagc caggcgtggg ggtgcgtgcc tataatccca gctacttggg aggctgaggc 240 aggggaatcg cttgaacncg ggaggcagag gtcacgccat ggactccagc c 291 <210> 106 <211> 36 <212> DNA <213> Homo sapiens <400> 106 cgcaccattg cactagtgat aagatcgaaa ctccat 36 <210> 107 <211> 243 <212> DNA <213> Homo sapiens <400> 107 tttgaaatca ccatgtctga taaaaacatg caattgcttt ggtgaatttg tttgttttat 60 tgttgttgct ttgagtgaat gcttcagttt gctctagatt ttactttgtt tgttaaaaat 120 taccatgttt taacccccga aaacatttaa tgtttttgaa atgatttttt cataacaatc 180 ttatgagtct attatataat aggaagtatt ttggaaattt aatggtgata tttctttgga 240 aaa 243 <210> 108 <211> 220 <212> DNA <213> Homo sapiens <400> 108 tgtgcacagg agactcagga cagtgggggg aaaagtcact tctccacata agaggctcaa 60 atcccaacgc caccctccgt cagacccctt tggccccagc tccgacccct ccagggttta 120 ccaagttggg ctttcacagc atgtctgagc aaacacgcag cgacctttta cataattgca 180 acctcctcca gagaggagag aggccacatt ctctcggccc 220 <210> 109 <211> 263 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (116)..(116) <223> n is a, c, g, or t <400> 109 taacggagtg tcactttcaa ccggcctccc ctacccctgc tggccgggga tggagacatg 60 tcatttgtaa aagcagaaaa aggttgcatt tgttcacttt tgtaatattg tcctgngcct 120 gtgttggggt gttgggggaa gctgggcatc agtggccaca tgggcatcag gggctggccc 180 cacagagacc ccacagggca gtgagctctg tcttccccca cctgcctagc ccatcatcta 240 tctaaccggt ccttgattta ata 263 <210> 110 <211> 278 <212> DNA <213> Homo sapiens <400> 110 catgcacaga tggccacatt ctgcctccat ccactcaatg ccaacaggca cgattcctcc 60 accgacaacg ctcaaggcca cagggtccac ccacacagcg ccaacaatga cgctgaccac 120 cagcgggacc agccaagccc tgagctcatt aaacacagcc aaaacctcta catccctaca 180 ttcacacact tcctccacac accatgctga agccacctca acttctacca ccaacatcac 240 ccccaaaccc accagtacag gaaccccacc aatgacag 278 <210> 111 <211> 107 <212> DNA <213> Homo sapiens <400> 111 ccccattatg tcatgacctc acttaagtgg aacactatat cataacccag agattcgtcc 60 cagccccaga gtccgacaga ctgtctggtc cctattccta atgaggg 107 <210> 112 <211> 292 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (65)..(99) <223> n is a, c, g, or t <400> 112 cacatctggc ctgacgttct cgttgcatca agccatcatc caccgggcgc ccctggacgc 60 gcgtnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnna atgctgaccc actcagtaga 120 gcaggggcca gccagagggg gacgaagtca ccaatccagg caccaccttc ccacatgtcc 180 ctgcaacttc tctctttcca gtgtgctgaa gaagggaggt gccacccctc ctccagataa 240 atggccccag aaaacgatcc aaaaaaatac ccagggagcg attccttatg ta 292 <210> 113 <211> 157 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (64)..(64) <223> n is a, c, g, or t <220> <221> misc_feature <222> (69)..(69) <223> n is a, c, g, or t <400> 113 gatgatcaac tctgctagga agcggggtgg gaagaaggga ggggatgggg ttgggagagg 60 tganggcang attaagatcc ccactgtcaa tgggggattg tctcagcccc tcttcccttc 120 ccctcacctg gaagcttctt caaccaatcc cttcaca 157 <210> 114 <211> 236 <212> DNA <213> Homo sapiens <400> 114 gcagtctcag acaccaagga ggggagagtg actagaaaga aaaccttctt gcagagacat 60 aggggatggg gaagaactgc agactgaact ggggcaaagg actgtaggac ttaaccagag 120 agatttgagg gagagatgag gctgagagcc aggggatcct gccatgtccc agcataaaaa 180 cagtacctga cacagatagg tgcttgggaa gctgttgtcg gatgaatgag tggaca 236 <210> 115 <211> 137 <212> DNA <213> Homo sapiens <400> 115 aagctggcaa ctggtgagag tatagcagtc aaaaaaagaa aatgctcact cttagatacc 60 taagaattca aagcgtttca acctagagca accactaaaa aacctgcaca gagatgacag 120 tcaatattac aatagag 137 <210> 116 <211> 65 <212> DNA <213> Homo sapiens <400> 116 agcccagcag atcctacaca cattttcaca aactaacccc agaacaggct gcaaacctat 60 accaa 65 <210> 117 <211> 269 <212> DNA <213> Homo sapiens <400> 117 tcactttcct ggattgtcac tgtgagtgta attccggttg gctggaaccg cttttggaaa 60 ggattgggag agatgaaaca gcagttgtgt gtcctgttat agacacaatt gattggaata 120 cttttgaatt ctatatgcag ataggggagc ccatgattgg tgggtttgac tggcgtttag 180 catttcagtg gcattctgtc cccaaacagg aaagggacag gcggatatca agaattgacc 240 ccatcagatc acctaccatg gctggagga 269 <210> 118 <211> 225 <212> DNA <213> Homo sapiens <400> 118 tagtgttttg ccctaaatct aaggatggtg cctagtggtg gccctgtgtt ctgaggacag 60 agagagctgg aggggtggag gggaatgcat cggcactcat ttggtgtaac caagaagagg 120 gggaaagatg tcttgataga atcaaagttg ccaaaaacaa agaagagtct atcaagcaga 180 tttctaacat ttagctagaa actacttcat agctctcatt tttag 225 <210> 119 <211> 61 <212> DNA <213> Homo sapiens <400> 119 cactaccgcc ccgcgctggc ttgccctcct gttctccaga gcaataaagt tggacgagac 60 t 61 <210> 120 <211> 36 <212> DNA <213> Homo sapiens <400> 120 gagagccacc acaagactaa gtaaagaccg agttga 36 <210> 121 <211> 35 <212> DNA <213> Homo sapiens <400> 121 gaataaatgg ggttgggcat atcaaactaa agatg 35 <210> 122 <211> 260 <212> DNA <213> Homo sapiens <400> 122 ttctctgcat cggtcaggtt agtgatatta acagcgaaaa gagatttttg tttaggggaa 60 agtaattaag ttaacactgt ggatcacctt cggccaaggg acacgactgg agattaaacg 120 taagtaattt ttcactattg tcttctgaaa tttgggtctg atggccagta ttgactttta 180 gaggcttaaa taggagtttg gtaaagattg gtaaatgagg gcatttaaga tttgccatgg 240 gttgcaaaag ttaaactcag 260 <210> 123 <211> 285 <212> DNA <213> Homo sapiens <400> 123 caaatataca aaatgcctcc aagctcaaat agctataact gtaccaaaga catggaagaa 60 accaaaagat cggacccgaa ccactgaaga gatgttagag gcagaattgg agcttaaagc 120 tgaagaggag ctttccattg acaaagtact tgaatctgaa caagataaaa tgagccaggg 180 gtttcatcct gaaagagacc cctctgacct aaaaaaagtg aaagctgtgg aagaaaatgg 240 agaagaagct gagccagtac gtaatggtgc tgagagtgtt tctga 285 <210> 124 <211> 39 <212> DNA <213> Homo sapiens <400> 124 ccgcaggcag gtgtcaggac cggcctaata aacatgtgt 39 <210> 125 <211> 266 <212> DNA <213> Homo sapiens <400> 125 aaatgtgact gctttgtaaa actccagagt caaggactca taggcaggag gatgtcataa 60 attaacagga aaggatgaga aatctccact ccactccctc ctccctccct tgatcactca 120 ttccctctct tccattcatt aaccacccac tacatgccat gccctaagga agcagctatc 180 taagaagtcc ctgcctgcag gggctttaca gaccaggagg aaggcaaccc atagagccag 240 gatcctgata accactgctg actgcc 266 <210> 126 <211> 159 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (42)..(42) <223> n is a, c, g, or t <220> <221> misc_feature <222> (56)..(56) <223> n is a, c, g, or t <220> <221> misc_feature <222> (90)..(90) <223> n is a, c, g, or t <220> <221> misc_feature <222> (93)..(93) <223> n is a, c, g, or t <220> <221> misc_feature <222> (98)..(98) <223> n is a, c, g, or t <220> <221> misc_feature <222> (100)..(100) <223> n is a, c, g, or t <400> 126 aaaccctgga agaatctttc acttgaactc aacttgactg gngttcagtc aaccantctc 60 aggggaaggg gggaagcact atctccacan cancactnan tctgggcctc ccgccccatc 120 tcccccagcc cctctcagca actaggccag gcttcagct 159 <210> 127 <211> 262 <212> DNA <213> Homo sapiens <400> 127 gcagggctgc cggagcgtcg aggagttcca gtgcctgaac aggatcgagg agggcaccta 60 tggagtggtc tacagagcaa aagacaagaa aacagatgaa attgtggctc taaagcggct 120 gaagatggag aaggagaagg agggcttccc gatcacgtcg ctgagggaga tcaacaccat 180 cctcaaggcc cagcatccca acatcgtcac cgttagagag attgtggtgg gcacacatta 240 tggaggcgca gtcgcctacg ca 262 <210> 128 <211> 59 <212> DNA <213> Homo sapiens <400> 128 aggagtcagg agaacaagtc agggattagg agacagcggt ttggtttatt gttatccag 59 <210> 129 <211> 267 <212> DNA <213> Homo sapiens <400> 129 aataattctc aatttcttag tctcttaatt cttaaattta aaaaggttgt ttcttacctt 60 ttaaaatttt taaaaataat tatgtcaagt aatttttgaa tatagtaacc tgattctaca 120 tttctcatgg gataaattct aaggtaaaaa aaattgcaaa taaatcttaa actttattta 180 gtaggtttat tattagcagc agatgtctag ccagggtaga ttacttttat cagaccaacc 240 tctcaccaac aactactaga agagcta 267 <210> 130 <211> 129 <212> DNA <213> Homo sapiens <400> 130 ctgggaaatc cagtgtttgt atgtaaaaat aaaaggtaag ttaattctag attgaggggc 60 agaggctatt tcttaatctc caatctcctt gggaagggaa agtattagga ggcagtaatg 120 gagtagaaa 129 <210> 131 <211> 276 <212> DNA <213> Homo sapiens <400> 131 ggtacactgg gcacgcaatg cgcgtgttag tagccaaata gtaaaagggc cgtatttcaa 60 cagcgactcc aagacaactg gcgttgccca ttctcagtct ccggcctatc ctacacatct 120 aatacccggc tacaatataa agctatagta aaggttcacg gggtcttttc gtcccgttgc 180 gggtaatcgg catcttcacc gatactacaa tttcaccgag ctcgcggttg agacagtgcc 240 cagatcgtta caccattcgt gtatggacgg gctctg 276 <210> 132 <211> 71 <212> DNA <213> Homo sapiens <400> 132 ggacagcagc cactcagttc ttcctccacc tccacccagt gatcccaata aacgaattct 60 gtctccccgt g 71 <210> 133 <211> 279 <212> DNA <213> Homo sapiens <400> 133 acagatggcc acattctgcc tccatccact caatgccaac aggcacgatt cctccaccga 60 caacgctcaa ggccacaggg tccacccaca cagcgccaac aatgacgctg accaccagcg 120 ggaccagcca agccctgagc tcattaaaca cagccaaaac ctctacatcc ctacattcac 180 acacttcctc cacacaccat gctgaagcca cctcaacttc taccaccaac atcaccccca 240 aacccaccag tacaggaacc ccaccaatga cagtgacca 279 <210> 134 <211> 237 <212> DNA <213> Homo sapiens <400> 134 tagtacctgc ctcattcagc taacgtgagg atctagagca gcatttgcat aaatgacgcg 60 tggggcacag agcagactca acacagagca gcttacgtta tgaggcttgg caggctggga 120 gctcctgtcg gcctctctcc tcagctctgt gcccactgag ctcggcacaa gggttggccc 180 atgacaggtg tttattatgt ggaaataaat gagagggaca agacatttgc tgatttc 237 <210> 135 <211> 170 <212> DNA <213> Homo sapiens <400> 135 gcctcatcag ggaattgtaa gatttagggg gaggtgtggg aaatcttact ctttgcccta 60 aagtattcag cgatcagaat tctggatacc ctgcaaaaca cctccaacct ccctgccttt 120 gaaccctgtg ttaacaatga gaagcttgtt tatttgaagg ctgggttctc 170 <210> 136 <211> 292 <212> DNA <213> Homo sapiens <400> 136 ggacagatga agactcttaa gatgacagaa ggtgattttt ctggtgatcg aggacttccg 60 gggtaatgac agtgatgaaa tgcaggggac ctggttgccc ccaagtttcc tggcagtgtg 120 tgatactgag gaggtgagct tgtttctgga gctgtgcttt aagattcatg ttacatgtaa 180 agctgtcctc atttgtgact atggacctat ggagttggga caatctctat gggaagcaga 240 aggcaaggac cccggtcatt ttaggtagaa acaacagcat gctaatgcaa aa 292 <210> 137 <211> 194 <212> DNA <213> Homo sapiens <400> 137 aagagagaag cttctgcacg ccagaggcac ccagtcccac aggcgcctac ctgccccgga 60 taagaggttc cctgccattt ctctagtctc cccccttcaa cagcacacca aataagccca 120 agaagatgac aggaaccgtc cccgccaact tcacacgagt gctaaggcga agacagccat 180 cttgggcctt cgga 194 <210> 138 <211> 202 <212> DNA <213> Homo sapiens <400> 138 tgcctgatgc ctcaggtgac agaaggcagg acgttccatg ccgaggctgc cccctcaccc 60 agaagtctga gcccagcctc aggaggggcc aagaaccagg gggccatcaa aagcatcggg 120 atttggcatt ggttccagat gagcttttaa agcaaacata gcagttgttt gccatttctt 180 gcactcagac ctgtgtaata ta 202 <210> 139 <211> 86 <212> DNA <213> Homo sapiens <400> 139 gccccaacct gggattgctg agcagggaag ctttgcatgt tgctctaagg tacattttta 60 aagagttgtt ttttggccgg gcgcag 86 <210> 140 <211> 199 <212> DNA <213> Homo sapiens <400> 140 accaaagttt gcagcctata cctcaataaa acagggatat tttaaatcac atacctgcag 60 acaaactgga gcaatgttat ttttaaaggg tttttttcac ctccttattc ttagattatt 120 aatgtattag ggaagaatga gacaattttg tgtaggcttt ttctaaagtc cagtactttg 180 tccagatttt agattctca 199 <210> 141 <211> 297 <212> DNA <213> Homo sapiens <400> 141 attgattcct gaccatagca gtgagaggcc attttttgtg caggaaatgt gcttaggact 60 cagtcttgtt ttcgattatc caccacagaa accctgagac acagagcagc ttagaagtct 120 ctacccaggc gtaaatagag ctccctactc cagaccacct gccacccacc tcccaagttg 180 agaacacaag ctccagctgg gctggagagt caggcttggt gcagggtgac tttggcgaag 240 ttttgtcaga tccataaagc aaactggaat ttgagctttc acttacccta gtatacg 297 <210> 142 <211> 110 <212> DNA <213> Homo sapiens <400> 142 ttctttccac agaagctcca ggtagagggt gtgtaagtag ataggccatg ggcactgtgg 60 gtagacacac atgaagtcca agcatttaga tgtataggtt gatggtggta 110 <210> 143 <211> 269 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (92)..(115) <223> n is a, c, g, or t <220> <221> misc_feature <222> (118)..(118) <223> n is a, c, g, or t <400> 143 tgagttgttt gttcaccagt gatgctatgt tatgcatttg tttacatctc ataacatgtg 60 gtaaatattt atgcaagatg gctagccaga cnnnnnnnnn nnnnnnnnnn nnnnncancc 120 gtgaaataga gaatgcaggg tgacccatgt aaacaggcta gagatacatt tgaaaaagat 180 gagggttaaa gagtgtgtac atgttggcag gtaaagagat agcatcctct agggaggata 240 ttatcaggag tcagagtaat cttggtaaa 269 <210> 144 <211> 106 <212> DNA <213> Homo sapiens <400> 144 aatcattgat tgacttgtct gtgaacttgc aggaactgtt tcatagtttc attacacaga 60 gtaaactgtt tgccatgcaa ggttattttg catctgcatt taagtg 106 <210> 145 <211> 184 <212> DNA <213> Homo sapiens <400> 145 gacattaact cattagactg gaacttgaac tgattcacat ctcatttttc cgtaaaaatg 60 atttcagtag cacaagttat ttaaatctgt ttttctaact gggggaaaag attcccaccc 120 aattcaaaac attgtgccat gtcaaacaaa tagtctatca accccagaca ctggtttgaa 180 gaat 184 <210> 146 <211> 247 <212> DNA <213> Homo sapiens <400> 146 gtatgtgaaa gtctctattt gtgtatttct ctcctaaagt tgtgtctctt tgggaattgg 60 atttgatttt tattatttaa tacctcactt tggcccgtcc cccctcccaa cacttctgta 120 tcctcgccct gccgccccag cctggacgct ctgcgtggaa gtgcgtgttt gtagcagctc 180 gggcctcatc tcagcgctcg gatccctcct gctgccagaa tccactggcc tctgtctcat 240 tcttggg 247 <210> 147 <211> 277 <212> DNA <213> Homo sapiens <400> 147 tccctcagga agcagtcccc tcgtctccct ttctgggcag cttccttgag gacagaaact 60 tgaaaacaaa cacaaaccaa agtttctggc catctgtggc tggagggttc tgaatgtcct 120 ctctccatgt caggcagagg gtcagccccc atgcttctgc ctcaggcccc accccacccc 180 accccaggcc tgcccctcac ctcagggcca tacccacagc gccctgatgg aggaaccaga 240 ccgcaggctg tgccaccatt aaacaagagc ggctgtg 277 <210> 148 <211> 32 <212> DNA <213> Homo sapiens <400> 148 aaggaggcag atgagatttc atatcaaaaa ga 32 <210> 149 <211> 174 <212> DNA <213> Homo sapiens <400> 149 tgacttctac ctcccatgtt tgctctccca actcattagc tcctgggcag catcctcctg 60 agccacatgt gcaggtactg gaaaacctcc atcttggctc ccagagctct aggaactctt 120 catcacaact agatttgcct cttctaagtg tctatgagct tgcaccatat ttaa 174 <210> 150 <211> 37 <212> DNA <213> Homo sapiens <400> 150 ccaccgtaaa gtactgcgcg acaatatcca gggcatc 37 <210> 151 <211> 248 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (223)..(223) <223> n is a, c, g, or t <400> 151 gtggaataag ttctcctagc tcagaaggat ctcaacctct tgcaagttac ttttcacttt 60 taagggccct taaagaagca tttgcttagc tctgtatcca ggccatctct ccctccccga 120 agagcaacag accagcaact gacattaagg tcacatgggt gggtggggag tagaattgcg 180 ggggtgacag ttccagccaa tccagacacg aatcatgttt ganggacccg agcctcaagg 240 gtgattcc 248 <210> 152 <211> 39 <212> DNA <213> Homo sapiens <400> 152 agacatatga caatgttcag caggtcatct ttaatgcag 39 <210> 153 <211> 53 <212> DNA <213> Homo sapiens <400> 153 acgaaagcgc aagaaatccc ggtataagtc ctggagcgtt ccctgtgggc ctt 53 <210> 154 <211> 215 <212> DNA <213> Homo sapiens <400> 154 cctcgtggat catcaaggac gacgcggagg tggagcggct gacctgtgag gaggaggagg 60 agaagatgtt cggccgtggc tcccgccacc gcaaggaggt ggactacagc gactcactga 120 cggagaagca gtggctcaag gccatcgagg agggcacgct ggaggagatc gaagaggagg 180 tccggcagaa gaaatcatca cggaagcgca agcga 215 <210> 155 <211> 277 <212> DNA <213> Homo sapiens <400> 155 tagggtttct ctccactatg aatgatctga tgtatagtaa ggttcgaaga ccacttaaaa 60 attttgccac aatctttgca tttgtagggt ttgtctccag tatgaactat gttatgttga 120 gtaaggcctg aggaatagta aaaagctttg ccacattctt cacatttata gggtttctct 180 caagtatgaa ttcttttatg ttctttcagt tttgaggatt ttctaaaggc tttgccacat 240 tcatcacatt tgtagggttt ctctcccata tgaataa 277 <210> 156 <211> 125 <212> DNA <213> Homo sapiens <400> 156 actggagggt ctccgggcac actctggccc ttcccagaaa gggggtcgtt tttctcgaat 60 cttcaaccag ttgtgtattg gaaactaggg cgcattttac tattgatcac agtcattata 120 ttgtt 125 <210> 157 <211> 151 <212> DNA <213> Homo sapiens <400> 157 ttcggaaata gggaagactg tctctgaaga aggaggaagt gtagcttatg ggaggctgag 60 gagtttggag tttctccttg tgggaaggtg ggagccatgg aggctgaaga cagttgtcca 120 actcagggca tacaaattga tgaggaactc a 151 <210> 158 <211> 233 <212> DNA <213> Homo sapiens <400> 158 aggacctcag agatgtaagc attttagcag ccacacaaaa tctctggcta tgaaagggac 60 ttcatgacca tccagtccaa tataacactt gcagacagag aaactgaggt cttccatgac 120 ttgcctagtc tcccagctag tttgaggcaa aactggattc ccactctggt attctttctt 180 ccttttacat cattttccct cctttaaaat gtcctgagag accagaactc aca 233 <210> 159 <211> 169 <212> DNA <213> Homo sapiens <400> 159 actaaagaca ttaagcattt gcacttaatt gggtacttcg ggaaagaagt gtgtaggttg 60 gcattaaagg tacttcttac actgcatgtt ctgtaaggac agcaaaatac atctatatag 120 gttcactgtt aaattctcga ggactaatgg atccgcatgt gaaaagtaa 169 <210> 160 <211> 123 <212> DNA <213> Homo sapiens <400> 160 tgagccccgt gcctggcctg gtcatttctc ttgctgtgcc caacctgcca ttaatcccat 60 ccatcctgag cccgacgtgg tcatttctct caccacccag cataccgccc aacgtggtcc 120 ttt 123 <210> 161 <211> 274 <212> DNA <213> Homo sapiens <400> 161 taagtactta agtcctgtct ccttggccaa gccagactag gcccaacacc ctcaattcac 60 cctggctcca aagagggcaa aagcaactct ctttctctaa ggccagggaa gtatctacca 120 caatctctga aacctgtgaa cttttctgtg ggcctgtagt ttcaagtccc accttaactg 180 tccttaaaaa aaaaaccaaa caatgaccta cctaatccat ctaatttctc aactaactgc 240 caccatctct actatatcca cctgcatcct attt 274 <210> 162 <211> 53 <212> DNA <213> Homo sapiens <400> 162 taggcttagc ttgatttctg ggcccactgt ctgtgttctt aagatgccaa cct 53 <210> 163 <211> 169 <212> DNA <213> Homo sapiens <400> 163 tatgatgcac agttcgtgtc aacaggaaat gatggatgtc aagcaattca ttggtaaact 60 cctacctcca attgattgac gtcactaaga ggccttgtgt agaagtacac cagcatcatt 120 gtagtagagt gtaaaccttt tcccatgccc agtcttcaaa tttctaatg 169 <210> 164 <211> 260 <212> DNA <213> Homo sapiens <400> 164 cagctgggcc ctggctgatg tcatgagcca actcaagaag aagagggcag ccactacatt 60 agatgagaag attgagaaag ttcgaaagaa aaggaaaaca gaggataaag aagccaagtc 120 tgggaagttg gaaaaggtag aaagaagcaa aggaaggctc tgaaccaaag gagcaggaag 180 accttcaaga gaatgatgag gaaggctcag aagatgaagc ctcggagact gactactcat 240 cagctgatga gaacatcctc 260 <210> 165 <211> 239 <212> DNA <213> Homo sapiens <400> 165 aacccactcc aattaggcat tgctcccact cctccccatc agtgctctca caaggtcacc 60 agtggcttct acattgccaa tctagcgatc aaatctcagt aagtgtcatt tgatataact 120 gatctttcac ttcctctttg aaaccccatc atgtggtttc caggaccaca cactccctcc 180 ctctcctcct gccatgggtg tcagtctcca gggctctccc taacctccat gtgtaagaa 239 <210> 166 <211> 278 <212> DNA <213> Homo sapiens <400> 166 tgcccattct ccaaaaagca cgtgcccagc ccccaatccc ctctatatct cagctgaagc 60 atcacctcca ttaatgaagc ctagtccttt cctgcctcgt gtgttgcttt gttgctgctc 120 acacctttag acaagacttg ctgccactga ctcccaccag tccctgttcc ctggaagaaa 180 tcaaggaagc ccaccttgat ctcatttgag ctcctaattt tacagaaata gggacaaagg 240 ttcaaaggga gcctcacagg tcgcatggtg aaccaagc 278 <210> 167 <211> 214 <212> DNA <213> Homo sapiens <400> 167 agcatctgaa actatatcca gaatgacact ggattttcat aaaagtgttg atcctcacac 60 ctctttatag tcttgcacct agcacagtgg agtgaaacac tttaaatagc acttgttcct 120 tgagtatata tggaaaaaag tgaagtattg ataagtgctc agctaatatg agcagcatct 180 caggagtctc caattcttga attaccaggg agta 214 <210> 168 <211> 193 <212> DNA <213> Homo sapiens <400> 168 ggagttggag cccactctgg ggaaaacatg ttgagatctt gcctctgcaa aaataaagta 60 aaataaaatt taaaaaaagt aaaaaaataa aatcagctga gcatggtgac atgcacctgt 120 ggtaccagct actttggagg ctaagttgag aggcactgat gggaggatca tttgacggcc 180 cagaggttga ggc 193 <210> 169 <211> 240 <212> DNA <213> Homo sapiens <400> 169 ggcagctggc ggtcatttac atccccccgc tgcagagggt cttccagacg gagaacctgg 60 gagcgcttga tttgctgttt ttaactggat tggcctcatc cgtcttcatt ttgtcagagc 120 tcctcaaact atgtgaaaaa tactgttgca gccccaagag agtccagatg caccctgaag 180 atgtgtagtg gaccgcactc cgcggcacct tccctaatca tctcgatctg gttgtgactg 240 <210> 170 <211> 284 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (213)..(213) <223> n is a, c, g, or t <400> 170 atagtgttgg gcactgtctg accatgttgc atttggaagg ctaaatgggg ccatgaagaa 60 ggctggaagg gacaggtggt gatggcagcc tacctggtgt cccctacccc acctgttctc 120 ggagaaccaa gttgctacac aggaagttct ccaaggtcca gtttcctttc tcccaccagt 180 tggtggaggc ttcagggaag accagagtcc tgnacagaga gggtaacagg aggagtcggg 240 gataaacatc aaacatcaat cgtgtgtcct gatttgggag tgat 284 <210> 171 <211> 245 <212> DNA <213> Homo sapiens <400> 171 gggccttccg tgctggcaga acaaagaaat gaatggatgc atggacagat agagagacta 60 atgcagcttg ttgagacagg ggctacagct tcactgatgt aagaacaact ccaccctcat 120 gccccagcct ttttcttggg gcaggggcac atgataacct ttctcccaca ctaaaccttg 180 ctcactacca gactagtagg ccttaaactc tgggagcaag aatggaactc cttcctatct 240 caaca 245 <210> 172 <211> 142 <212> DNA <213> Homo sapiens <400> 172 ctccactatg aatgatctga tgtatagtaa ggttcgaaga ccacttaaaa attttgccac 60 aatctttgca tttgtagggt ttgtctccag tatgaactat gttatgttga gtaaggcctg 120 aggaatagta aaaagctttg cc 142 <210> 173 <211> 256 <212> DNA <213> Homo sapiens <400> 173 aactagtggc tagcatcggc ttgacctgcc tcattcccct cgaataactg aagatcctgt 60 acaacaatgg agactctcgg aacatttatc cacagtgcaa ttacagaaag cagttcgtga 120 tttctctaga aataataaat atggctcact ggtgaccatt cccctcacgt gtcctctgtg 180 gtgcccacac gtgcgccggg atgtgcaggc gtggacgcag agacgcccct gtggaaagca 240 cacatgcggt gcacac 256 <210> 174 <211> 99 <212> DNA <213> Homo sapiens <400> 174 tggaggtgcc acaaaaatca tctggtaaat tgtttaaagt aatcccaaat gcaactcaaa 60 tctacagaat cccaggtgaa gctcagtaat ctgtatttt 99 <210> 175 <211> 227 <212> DNA <213> Homo sapiens <400> 175 tgtctcctcg tgtccgcatt gctggagctc cacctccctc ttggtttctc cgcacccgcc 60 cattttcctt ctgtctttac ctgcttcgta tcctttccct gctgatgtgg ctgacccctc 120 tcccacccct ccctgcaggc ggctggccag gtgggcaggt gccagccgga gctgtaaata 180 gagcgctgcg cttttgtgct ggtttgtgcg tgtgctgtat ttctgtg 227 <210> 176 <211> 41 <212> DNA <213> Homo sapiens <400> 176 ccatgggcca caaatctcta caagtgcctg ctatccctct c 41 <210> 177 <211> 270 <212> DNA <213> Homo sapiens <400> 177 gtatctgctc aagtagaagc ttccgtctct cttgtaacag gtcagtgctt cagttaccac 60 tgccattgaa ttacccactc gctatcactt gcctcttatt tccataaaaa aagaaacgga 120 ggaaaaaact gtttaagttt taccttgttt aaaagtaaca cgagtgcttt tgttattctg 180 taaactaaat acataaatga aggcaaagga aggaaactga gggaagggaa caaaatgtga 240 gtgatgaaaa cacggagttc attaaatgaa 270 <210> 178 <211> 191 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (109)..(126) <223> n is a, c, g, or t <400> 178 gcaggtcaaa aacctgccct cctgtgactt attccctgag acttttcagg agagccagcc 60 cacagatgat gaagaaatga tggaagttca tttggagagt caaatgggnn nnnnnnnnnn 120 nnnnnnctgc ctttgataca ggcaattcag tggactataa taatagtgga gggttgagat 180 gtagagtttt t 191 <210> 179 <211> 211 <212> DNA <213> Homo sapiens <400> 179 gtgctatggg aaccaggtgc caggtgaggc caggtgaaga caggtgaggc caggtgaaga 60 taggtgaggc caggtgaaga cagatgttac gggaaccagc aggtagaaag ctaagtgctg 120 tggagaaaga gcgggaagaa atggaggagg tgtctgggac aacagaactt gaaaagaacc 180 tgcttctcag tagccccaag tcctgtgtgt g 211 <210> 180 <211> 205 <212> DNA <213> Homo sapiens <400> 180 tgaagagcct tctgggtacc tagaggtgct gggaaggagt ttggatttaa tcttggctgt 60 cctgtgacag ggattcggag gccatggggg agggttgagc agggagacag gagacaggca 120 agaggcgctg tgagaagcgt gggctgagtg acctgctcct tggtgagtga gaagtcctag 180 aactgagcac catggcatgc acctg 205 <210> 181 <211> 287 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (235)..(248) <223> n is a, c, g, or t <400> 181 atccttccac agtctgcaaa ccagttcctt ctgcagtgtt ttcctctggg agtgtcttgg 60 gctaagccac agcggtgtca ccccaccaca cacactgccc tgcaaaagga ctgccaatac 120 ccccagccca ttccccagcc tcacatataa ataaggactt gcgacccaga atcacatcca 180 gaagggaagt ttcacatggc ttggaatcct ttaaaaaagg acagcaaacc aaatnnnnnn 240 nnnnnnnncc ctccctaccc acaacatcca gcctgatccc gggaatt 287 <210> 182 <211> 294 <212> DNA <213> Homo sapiens <400> 182 cgacagccct gtttcggtca ccagactctg aacatgctac atcctgccca agactgcacc 60 tctggaggtg cagggcaccc ttgagaagcc cctcacccct aggccgcctc caggtgctac 120 ccaggagtcc cctccatgta cacacacaca actcagggaa ggaggtcctg ggactccaag 180 ttcagcgctc caggtctggg acagggcctg catgcagtca ggctggcagt ggcgcggtac 240 agggagggaa ctggtgcata ttttagcctc aggaataaag atttgtctgc tcaa 294 <210> 183 <211> 193 <212> DNA <213> Homo sapiens <400> 183 atgagtactg agacctgacc actgcgttaa gcaacataga ggtcagtgtc catgacatgc 60 tggaaccaga gcttgattgc agttggttct agaaaaaaat gggggaggca atgtttgaga 120 gcatatatag acaactcttt tcaagggatt tgctataggg agaaaaaaag cgatgggaca 180 aaactagagg gac 193 <210> 184 <211> 168 <212> DNA <213> Homo sapiens <400> 184 gaccagttta ggcaacatag tggaaccctg tgtctacaaa aaataaaaaa atttagctgg 60 gcattttggc atatgcctat agtcccagct acttgggagg ctgaggaggg aggatcactt 120 gagcccagga ggtcaagttt gcagtgaact acgattgcac cattgcat 168 <210> 185 <211> 156 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (131)..(131) <223> n is a, c, g, or t <400> 185 gggcactcgc atttggtcat tctcttgaga gctaggaggg gtcagcctga ggccggagag 60 gaagggcttt tgcctggggt gagagggtga gagacttgac ctgaaagcag ctcctgcccc 120 tgaggtgcaa nccagagtcc tgtgtgcgga cagaga 156 <210> 186 <211> 109 <212> DNA <213> Homo sapiens <400> 186 aatttttact attggtcatt tgcagaacag taaattctgt gtgttggtac agagtgctct 60 gtaccagtgc tcatcatccc ttcttcatac caacggtccc tagttatag 109 <210> 187 <211> 106 <212> DNA <213> Homo sapiens <400> 187 tagagatggg ttcttctggt tgatacagac tatgcattgc gtctagcaga tggggtaaac 60 tggcctaaaa caagtctttg cagaatacat gccaatttcc aaaaaa 106 <210> 188 <211> 188 <212> DNA <213> Homo sapiens <400> 188 tctccctgcc tcacaggatt gtgactcccc agcccctgcc ctcaaagctt cagacccctc 60 aggtagcagc aggaccttgt gatcttggcc ccttggatct gagatggttt tgcatctttc 120 caggagagcc tcacattctt cttccaggtt gtatcacccc cgagttagca tatcccaggc 180 tcgcagac 188 <210> 189 <211> 148 <212> DNA <213> Homo sapiens <400> 189 ggtagccatt ggttcttgga tctgtgttag aatgagtgct ttcccttcct actgatgtga 60 ttgtggatta ggaattcgtg accgagtgat ttttggccag tggttgggtt taaaattcta 120 ttaaaatttg tagtttgggc tgggtgct 148 <210> 190 <211> 184 <212> DNA <213> Homo sapiens <400> 190 gaaggtttgg acgattattt gactcgcctg atagaagaaa gggatacttt gatgagaacg 60 ggtgtgtata atcacgagga tcgaataata agtgaactcg accgacagat cagagagatt 120 ttggcaaaaa gcaatgccag taattaataa catttggaaa agctttatag agactctaag 180 tcta 184 <210> 191 <211> 123 <212> DNA <213> Homo sapiens <400> 191 ttgccaggca cggcggctca tgcctgtagt cgcaacactt tgggagacca aggcaggagg 60 atcacttgag tccaggagtt tgagaccagc ctgggcaaca tacagatgtc tacaaaaata 120 aaa 123 <210> 192 <211> 263 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (65)..(76) <223> n is a, c, g, or t <400> 192 tcatacaaca aatcccatct ctgtcccctg aaattcccct agtttcattc attagaaggg 60 gattnnnnnn nnnnnngact taaagagcac tttacagcag cattcagctt tcctatgaaa 120 tactcagcat cttaaatatt atatacaact ctttttttag taagctagac actggcttca 180 gagttcgtgg gagtggggga aatcaaccca ttcaaaacta ctctagaaat tgtcttttgg 240 cagaatagca ggtatccaag tta 263 <210> 193 <211> 45 <212> DNA <213> Homo sapiens <400> 193 agttctaggg gatatttgtg caataaatac acatgtcaac ttgaa 45 <210> 194 <211> 125 <212> DNA <213> Homo sapiens <400> 194 aaagcaggta gttagttacc atttggagag ggattccgga acctagagag agatgaggct 60 gaagaggcgg gaagaaacca gatggcaagg actttgtctc atgcgcaaag catataattt 120 ataga 125 <210> 195 <211> 233 <212> DNA <213> Homo sapiens <400> 195 agaggtaata tccttcctat tcttccttca cttctgcccc tcctcccacc tcttcccagc 60 ctccctcacc tgacctattt agggggtgat gggatgaaaa gaagagagtg aaggatatgt 120 aatcaagtgc aaaatactgt ggtaagtaca gagaatgaat aaggtggaaa ggaaagtgaa 180 aagtgtggga tggttagggg ctttaaggac ttcccaggaa aataggattc tgg 233 <210> 196 <211> 197 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (142)..(142) <223> n is a, c, g, or t <400> 196 gaccagggcc tctcctgtgg gatctttgtt ttgtgtttaa ccataatggt tgtgtactga 60 accacttcat atttgttata tataatatat atatatataa tctccttaag actcagcctc 120 ctggtttacc cccccggcct gngcatctga cctcccccac cccagtgtga tttaacatcc 180 aggaactgag gcctgaa 197 <210> 197 <211> 289 <212> DNA <213> Homo sapiens <400> 197 taagagctgt ggaggactga aaactggata aaaagggggt ccttttcctt gcccctgtct 60 ctcactcaga tgcgcttctt tttcgccact gtttggcaaa gttttctgtt aagcccccct 120 ccccctgccc cagttctcca ggtgcgttac tatttctggg atcatggggt cagttttagg 180 acacttgaac acttcttttc cccccttccc ttcacagtaa ctggggcagg ggcctacggg 240 gaggggcttg tactgaacta tctagtgatc acgttaacac ctaactctc 289 <210> 198 <211> 195 <212> DNA <213> Homo sapiens <400> 198 ggactgcagc taagtgtcca ctccccaaag tcttcctatt cctaactcca tgacagctcc 60 tcagtagagc tttcctcctc agaagcaact agaacaatgc agttaacatt atttggcccc 120 aacggcgttt actgtgtatt ttggctgaga tctttagaag cccgaggcct aaacaattaa 180 ctgaggaaca tctaa 195 <210> 199 <211> 213 <212> DNA <213> Homo sapiens <400> 199 ttactgaact acagcctggt ttgtagactt cctgtttcta cactgctgct cttcaccatt 60 ggaattcact gtggtattta tattactggc ttcagtccga gccacaggta ataaaaggat 120 atcatctgta tttctcaacc atatcatggt gtatagatgc tgttattcag gcgaacttgc 180 tcatgggtgg actaacacct ggtttggtac aga 213 <210> 200 <211> 221 <212> DNA <213> Homo sapiens <400> 200 gagccatgat tgtgttactg ccttccagcc tgggcaacag agtgagactc catctcaaaa 60 aaaaaaaaaa gaaagaaaga aaatcagact ctgaggctgc aggcggtggc tcactcttgt 120 aatcccagca ctttgagagg ctgaggcagg aagattgctt gagcccagga gtttgagacc 180 aacttgagca acacagtggc accctatctc tacctaaaaa a 221 <210> 201 <211> 278 <212> DNA <213> Homo sapiens <400> 201 ggagccgcca cggaattgcg aaagcccagc tacgcagaga tttgtcagag aacgagtaaa 60 gagcctcctt cttccccatt gcaaccccaa aaagaacaaa agccaaacac tgttggttgt 120 gggaaggagg aaaagaagct ggcagagccc gcagagagat accgggagcc cccagccctc 180 aagtccacac ctggagcccc cagagaccag aggcggccgg cggggggccg gccctcgccc 240 tcggccatgg ggaagcgtct cagccgagag cagagcac 278 <210> 202 <211> 198 <212> DNA <213> Homo sapiens <400> 202 cgtgctacca tcacagctga atgcaatgaa aggcggtcct ctgagaggag cagggtggag 60 atgctaaagt ggaggccccg tcccattgct gatagatcct catctggcat gcgctccacc 120 ctccccattc tctgctccca cgtatcgtag ccccatcaca gaagatgcga catggaaaaa 180 cgcactgtgt ccacccta 198 <210> 203 <211> 50 <212> DNA <213> Homo sapiens <400> 203 gctgtgccca acctgccatt aatcccatcc atcctgagcc cgacgtggtc 50 <210> 204 <211> 217 <212> DNA <213> Homo sapiens <400> 204 ttttagcaac cagccagaga gggcgtgggt tcatgaaaaa cgggtacgag agtataaagg 60 tcataaacag tatgaagaat tactggctga ggcaaccaaa caagccagca atcactctga 120 gaaacaaaag attcggaaac cccgacctca gagagaacgt gctcagtggg atattggcat 180 tgcccatgca gagaaagcat tgaaaatgac tcgagaa 217 <210> 205 <211> 175 <212> DNA <213> Homo sapiens <400> 205 cctcgtgggc acgtggagaa gggcccacgt gtctccacac gccagccaca ggggagccct 60 ggccaggcgc ccagccaggg gagcgtgtgc ctgggatggg tcacagaacc agcgggcacc 120 tgtgaggctg gccagcaccg tggggctgtg ggaatcgctc ttatttatat ttaaa 175 <210> 206 <211> 265 <212> DNA <213> Homo sapiens <400> 206 ttccaagtgc gacctcaaat gacaactttc tcaggtggtg cctggatagg aaaggcaccg 60 gaacagaatc tgtagaaaac caaacctatc atgatcagca ttcctacccg acgttaacct 120 cctagactag ctgaccttat ttattttgaa agcaaatcaa gtgtatacag tctcttttta 180 aaaaactgtg taaacgttgt aaagttttta ggggctgttt ataatctgaa gatttataaa 240 aaattactgg acttgttagg actat 265 <210> 207 <211> 223 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (115)..(132) <223> n is a, c, g, or t <400> 207 tgagatgatc agacaccgga gttcaacgtc ccagcagtct tggtaaaagg agggagccta 60 ctgagccagg agggagaaaa gaagattgac cagcttgcta gaaaaatact tagcnnnnnn 120 nnnnnnnnnn nngtggaggg gggacggaga ggaacaagga tggggaggta ggaatgaggt 180 atagaaaaga gatagcatct tctttggcac aagactagtg gct 223 <210> 208 <211> 188 <212> DNA <213> Homo sapiens <400> 208 cccaggatgc gtcagtctgt tcagtggtca gcaggccccc caccccccgc cgactgccct 60 cgccatcgtg gtcagacccc cctcccaaca caacacgctg ctggtctgtg tcagcctttg 120 taacgtggga ggctctgccg tgtcttccgg gtgaactgta tttggattgc gcgcattgtc 180 acggtccg 188 <210> 209 <211> 254 <212> DNA <213> Homo sapiens <400> 209 ataggtagca aagctaaggc ccagaaaggt taagtaattt tcccaaagtc acacagcttt 60 gatatacagc aaaactcata tccctgagct ttctactcac tgttcttccg gttattatcc 120 ctgaggtcat aaatctccac ccgcaaaccc aatagcacca gtacaagaaa tctggactgg 180 agatacttta tccacaccta ccactgcccc aaaaagtaaa atctgactct gtgattctaa 240 tgtaccaatg gtac 254 <210> 210 <211> 158 <212> DNA <213> Homo sapiens <400> 210 atttttattg cagtaggagg aaatatattt aaaatatttg tagatttata gcaaatagag 60 actcgttatt taaaggttaa ataacaattt gttcttttgt tgtttttgcc agtttagggc 120 agtagctgct tttgtcataa atatcttcct accacatc 158 <210> 211 <211> 135 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (94)..(94) <223> n is a, c, g, or t <400> 211 cttgagtaaa gacattttgc ttaatttctt ttttcttatt ccccacttgt atatccccta 60 ccagtaccgg gatctgcaca catctttttg cagntacctc ttcatagcca tgaaccaaaa 120 cgttctatga ggagc 135 <210> 212 <211> 248 <212> DNA <213> Homo sapiens <400> 212 ccttcctgat tgtttacagt cattggaata aggcatggct cagatcggcc acagggcggt 60 accttgtgcc cagggttttg ccccaagtcc tcatttaaaa gcataaggcc ggacgcatct 120 caaaacagag ggctgcattc gaagaaaccc ttgctgcttt agtcccgata gggtatttga 180 ccccgatata ttttagcatt ttaattctct ccccctattt attgactttg acaattactc 240 aggtttga 248 <210> 213 <211> 259 <212> DNA <213> Homo sapiens <400> 213 tcctgtcctt gcaggtaaga cctgctccgg ggtccccgcc ccgccgccgc acactcccgc 60 ggtcgtctgg gctgtcacta ggagatccgt agcccagacg gtgactttcg tatgagctat 120 ttaactttat tttcttcaga atctgctgta gattgagctg tgcgtgaaat tgctagtaag 180 ttctgacatg ttaatgcgtc tgtctttaaa tctgaattgt taccataaac gtgtttaatg 240 gaacttgctg gtctgtgga 259 <210> 214 <211> 262 <212> DNA <213> Homo sapiens <400> 214 acctcatccc cgaataataa ctaagcacta gagtgatgct ggggatgctg gggcttggtt 60 taggtggctg gggaagttat cttggaggtg agactccagt ggactctgcg gatgggtaag 120 gtctcagaga ggttggggaa gttatcttgg aggtgagact ccagtggact ctgcggattg 180 gtaaggtctc agagaggttg aggttaagaa gagagcattc cagaccattc caaaatcagc 240 acataacaca catggcttga aa 262 <210> 215 <211> 161 <212> DNA <213> Homo sapiens <400> 215 gtttctacag ttcacttgtc tgcatagagg tcgtgctgtg cctggcagta atctccactg 60 cccttcagaa actccataaa tgtgtgacca agaacaccac agaattgagg aatatgttta 120 ctcattgaag attgtggcct aatcatacag ccggtcccga g 161 <210> 216 <211> 135 <212> DNA <213> Homo sapiens <400> 216 atgcaagtag gcagccagcc cgtctgttcc ctctccgccc cgccccgccc cgcccccgtc 60 actgcgcttc tgttatacca tctttgcctg actctctacg gcttctccat tgaatggcta 120 atgtgtatgt gaaat 135 <210> 217 <211> 278 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (177)..(247) <223> n is a, c, g, or t <400> 217 tacacaaact ttattacagg cacaaaatta tcaaaaatac ggtataaaat taccttaagg 60 ctatgtatat aagggatgtg tgtatgtgtg tatacacaca aaaataaatt ttgtgtttcc 120 acttggatcc cctccctaag ataactcatt gtgtacatgc aaatattaga aaatgcnnnn 180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 240 nnnnnnncta ttttatcacc attttcatgc tgtattaa 278 <210> 218 <211> 242 <212> DNA <213> Homo sapiens <400> 218 aactgcatga tgcacctgct ccgctccctg cccgacccca acctcatcac cttcctcttc 60 ctgctggaac acttgaaaag ggttgccgag aaggagccca tcaacaaaat gtcacttcac 120 aacctggcta ccgtgtttgg acccacgtaa ctgagaccct cagaagtgga gagcaaagca 180 caactcacct cggctgcgga catctggccc catgacgtca tggcgcaggt ccaggtcctc 240 ct 242 <210> 219 <211> 205 <212> DNA <213> Homo sapiens <400> 219 gctcataaca aatataccag cattcatgat agcatttcag cattttccaa ggtaccaagt 60 gtacttattt tgttgttgtt gttgttgttg tattttagaa ggaattcagc tctgatgttt 120 ttaaagaaaa ccagcatctc tgatgttgca acatacgtgt aaaatgggtg ttacatctat 180 cctgccattt aaccccacag ttaat 205 <210> 220 <211> 94 <212> DNA <213> Homo sapiens <400> 220 tatccaacgg tatagatcac aaggggggga tgttaaatgt taatctaaaa tatagctaaa 60 aaaagatttt gacataaaag agccttgatt ttaa 94 <210> 221 <211> 273 <212> DNA <213> Homo sapiens <400> 221 gacaaagctc taggatgatg gctgaggggt agaagaaggg gcaagggaga cagaggtctt 60 ggagatgacg cccatatctc tggcatgagc aacccagatg gcagggggtg gggcctggtt 120 tgtgggaagg ggtgtcccac tagcagatgt gtacccagtg gaggtgcagc tcagattgga 180 gctggccatg ggtatttgaa aatcatgtgc gcacaggtag ccactgaagc catgggagtg 240 aaagagaaca cttggaaagt gaactctggg aaa 273 <210> 222 <211> 168 <212> DNA <213> Homo sapiens <400> 222 tggaccgtcc aagaaggagc tacatcagag gttttggtag atgctgctgt agacctcata 60 tccgatgaat gggaagctgc taatgccata cccagcagag agaaggaagc aggatgcagc 120 cccgcttgag gccgccagcg tgccttctgc agactgtgag cagagcaa 168 <210> 223 <211> 277 <212> DNA <213> Homo sapiens <400> 223 agctttgcag ttataggctc taacctggac atgtcagaag ccaactacaa actgatggaa 60 cttaatctgg aaataagaga gtctctacgc atggtgcaat cataccaact tctagcacag 120 gccaaaccaa tgggaaatat ggtgagcact ggattctgag acacttcagg ccttttagga 180 aagaaactaa actgaagatg atgaagaata ttaaccaagc accttttaat ggacccttgc 240 ttcactgata actttctggc agcatctact ttttagt 277 <210> 224 <211> 290 <212> DNA <213> Homo sapiens <400> 224 aggtctagga gatgcctgag cctccactga cctctgtgca tgtggcccac cagtggccac 60 tctgtccttt tggaaactgt cctctggctt tctaggaacc ccatgttttt ggtcttctcc 120 tctggcccct ccttctcagt ctcctcagca ggactctatt cctgtaccca ttcctaaaat 180 gtcacgaact cgtttctggc cttgtccttc tttgagtgca tctctggttc ttcatctatc 240 cctgttgaga tgctcaccct tctttggtga gctcccaacc ggtacaggta 290 <210> 225 <211> 68 <212> DNA <213> Homo sapiens <400> 225 aattgtgcct acctcagata gacagtgcca gaattaagtg agtcaagcca agtaaagccc 60 agagaaga 68 <210> 226 <211> 105 <212> DNA <213> Homo sapiens <400> 226 tcttcacaca gacaattcga tcagtccttc aggtcttaag tcacttctca agaatgccgt 60 acttgcctag gctagattag atcctactgt tacatgctcc cttta 105 <210> 227 <211> 98 <212> DNA <213> Homo sapiens <400> 227 tttagtaggt acgtcatgac aactaccatt tttttaagat gttgagaatg ggaacagttt 60 ttttagggtt tattcttgac cacagatctt aagaaaat 98 <210> 228 <211> 206 <212> DNA <213> Homo sapiens <400> 228 ggcggcgtcc ccagctggtt cgggctgtga cggggtggcc agcagggacg cgccccaggt 60 gggcagctgt ggcagagcag cgacccgcgg cggggcggca tccccagctg gttcgggccg 120 tgacggggcg gccagcaggg acgcgcccca ggtgggcagc tgtggcagag cagtcccgac 180 acctaaataa aagtcttgct gcagga 206 <210> 229 <211> 99 <212> DNA <213> Homo sapiens <400> 229 agataaattg ttgcctgctt ctgtgtctct gccagcctgt gatcatattg ggttagagtt 60 agaaatccgc tgtttgcctt tcttactggt aggatcctt 99 <210> 230 <211> 147 <212> DNA <213> Homo sapiens <400> 230 atcctcgcca ttcgaatttc agttctgtac atctgcctat attccttgtg atagtgcttt 60 gctttttcat agataagctt cctccttgcc tttcgaagca tcttttgggc aaacttcttt 120 ctcaggcgct tgatcttcag ctctgcg 147 <210> 231 <211> 57 <212> DNA <213> Homo sapiens <400> 231 aaacgaactg taaaagacca tgcaagaggc aaaataaaac ttgaagtgaa tgcttaa 57 <210> 232 <211> 269 <212> DNA <213> Homo sapiens <400> 232 agcacgctac caaatctcaa aatatcctaa gactaacaca aggcagctgt gtctgagccc 60 aacccttcta aacggtgacc tttagtgcca acttcccctc taactggaca gcctcttctg 120 tcccacagtc tccacgagag aaatcaggcc tgatgagggg gaattcctgg aacctggacc 180 ccagccttgg tgggggagcc ctctggaatg catggggcgg gtcctagctg ttagggacat 240 ttccaagctg ttagttgctg tttaaaata 269 <210> 233 <211> 204 <212> DNA <213> Homo sapiens <400> 233 catcatgttt ttgtgggcaa atacaagttg ttataattaa aacccctaat ttgaatattt 60 ttgttaccaa gaaccaaggc aaatgtttaa tttgttataa aacctgtttg tgaagtgctg 120 tgttaaattg tgctgctggc taataggcct catttcaatt taataaatat ttattgagga 180 ctggctttat gtctggccct gtgc 204 <210> 234 <211> 155 <212> DNA <213> Homo sapiens <400> 234 agtatctgat atgtgtgtgg aggcagccat cttttcctga aagtcctttt aggaatcatt 60 atttctggtc ctctgaagtt tgccgctacc actcataaat atctatccac accccttaca 120 agaagaataa ggaagatctt aagacctaga aggaa 155 <210> 235 <211> 272 <212> DNA <213> Homo sapiens <400> 235 acttgaccta ggcagtgacc attctctccc actttcacac atgttcactt gacttccagg 60 ccatactctt agtttccatt ttacctcact gcctcactcg ttatcatctt ccttgcctcg 120 ttcctcaact ctctatgcta gagtacttca gggatcagtc cttgatcctc tccttttctc 180 tatacttact cctttgaggg tttatctagt ctcacagatt taaatatctt tgatatgctg 240 acaactctct aattatctaa ttcaccctgc cc 272 <210> 236 <211> 277 <212> DNA <213> Homo sapiens <400> 236 aaaatttctc tttgctcttt cgtagaaata aaacttaaca gttggatagg ccctgatccc 60 agctttctgg catgtctgag cataagcctg acagtctact tttccagctt tcacttttcc 120 tttaatcatc ctagccaaga gctcaaattc tggagcaaaa ttctggcaag gtccacacca 180 aggagcatag aaatcaatca cccaatgatt tttcccttgt agaacttttt cactgaaagt 240 ctgaggtgtt agatctgtgg atacttgatc ccgggaa 277 <210> 237 <211> 272 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (106)..(189) <223> n is a, c, g, or t <400> 237 ggcacaacat ttttgaggac aattaaaatt ttatatctac atagtcttca ccccaactct 60 tccatttcta gatatctatg ctacaggaat acttgcccac taagcnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnnnnnnnnt ggggtgaccc tctaagtcct aggaaggaaa gaaattatga agtgaaagaa 240 tatcatataa gtgataccat gaagtgaaag aa 272 <210> 238 <211> 300 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (36)..(213) <223> n is a, c, g, or t <400> 238 ggagtagcca agactcctgt ttctctgcat ttttcnnnnn nnnnnnnnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 180 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnntggggtc cctgttgccc agcatgcctg 240 gaccctcaac acttaatagt gataataaca tatatccaac ccttggtaaa tgccaggact 300 <210> 239 <211> 229 <212> DNA <213> Homo sapiens <400> 239 ggcctttagt taacatccga gtgacgaagc cgggttcccc agtacagctg tcttttgggt 60 gcggtcattg tgaggaaggg gatgagtgag tgtgggtgtg gctggaggag gagctagatg 120 ccggtggaca gtgggcaggt ggatttgggg aggagaggat cagcagcagc agaagtactc 180 agtgataggg ggctggctgg gtcaggaatg gtgagatgaa catgcaagt 229 <210> 240 <211> 51 <212> DNA <213> Homo sapiens <400> 240 acttgaaccc cgaaggcagt gtttgtggtg agcagaaatt gcttcattgc a 51 <210> 241 <211> 300 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (203)..(203) <223> n is a, c, g, or t <400> 241 gggccatggc actgctgttc agctcaggca caggggcaca gcagaggttt gggaagcggt 60 ctccccaccg gcactgggat tggcgggtcc aagcccagca accggcttcg ctccacaaca 120 cacaccacac ctgggactgt ttttaataca tagcaacaga ctgggttatt tatttaagat 180 gtgtattgtg tcatatgaag ttnaagagac ataaatggca ttttgttatt tattaagaca 240 aactccaatt gttctctggc tgtttttttc agttgtgtct agcaaatact tatctgccct 300 <210> 242 <211> 286 <212> DNA <213> Homo sapiens <400> 242 agactgactg ctaaactgta tgaatgatga ggggatttgc acgtataatc ttaactgtac 60 atcaaatgtt aattttttat tttatccact gtctttgaaa acctaactct tgactaagaa 120 ctgactttcc tgtacttgtt gttgactcta agtaaacttc caattccaca tagtccaaag 180 atgatgtgct gagaaatctc tcaaaggaaa aatgctaaga atacaggcag agttatgcgg 240 caaattttgc agaattaaca caattgcact tgtgagtatg aagcac 286 <210> 243 <211> 109 <212> DNA <213> Homo sapiens <400> 243 atggacagaa cggagactag gttccgtaag aggggacaga ttacgggaaa gatcacgacc 60 agccgtcaac cccaccccca gaatgagcag agtccccagc ggagcacct 109 <210> 244 <211> 37 <212> DNA <213> Homo sapiens <400> 244 tttgttacat atgcaataaa ctcacgactt tacattt 37 <210> 245 <211> 34 <212> DNA <213> Homo sapiens <400> 245 ggaagtggac gcaaagtgga tgcggcagca gaaa 34 <210> 246 <211> 287 <212> DNA <213> Homo sapiens <400> 246 tggccatgca tgatggctta cacctgtaat tccaacactt tgggagtctg aggtgggagg 60 attgcttggg tccaggagtt taagaccagc ctggccaaca tggtgaaacc ctgcctctac 120 aaaaaataca aaaattaggc aggcatgatg gtgtgcacct gtggtcccag ctactcagga 180 tgctgaggtg ggaggatcac ttgagcctgg gagatggagg ttgcagtgag ccgtgatcat 240 gccattgcac tccagcctgg gtgacagggt aagaaactgt ctcaaaa 287 <210> 247 <211> 196 <212> DNA <213> Homo sapiens <400> 247 tggagtgcat aggtagcagt gcttctcccc caaggctggg gcgatggaat cagttagact 60 attgagggca tctggaaggg catctgtgtc agggttagtc ctcagggtat ggtggccaat 120 gggtttcttt tggttgactg ttgacaatgc gtttgttgaa tggcagcctg cactaggtga 180 cgctgaagcc acagaa 196 <210> 248 <211> 189 <212> DNA <213> Homo sapiens <400> 248 ttcattccca caaaaacctg aggcagctct tttgcccaga gcgttccctg tagccacccc 60 caccccactt gcccttggtt ctttagaagg agcacacaca tcccttgatt cctccctgat 120 gtggtaaact ggcacactcc aggggtctaa aacataaaac agttgtgttt agggaacctt 180 aagtcatgc 189 <210> 249 <211> 35 <212> DNA <213> Homo sapiens <400> 249 acagaggctt cttcagatca gtgcttgagt ttggg 35 <210> 250 <211> 247 <212> DNA <213> Homo sapiens <400> 250 attctgcatg attcacggac taggagtccc tggtcaaaaa cttcaaaaac taagtgatgg 60 gtcccaagtt actcagtggc agaaacttga ttcagtaaca tgtcagcttg tgggcttgaa 120 aagtcttaag tgtctctact tcttctatcc ttgtgctttc ccgggacttt acacaatccc 180 acctcccact ggacaattgt caaatcccag agagtatggg aagtctgttc atctctgatc 240 accataa 247 <210> 251 <211> 282 <212> DNA <213> Homo sapiens <400> 251 gacggtccgc cgtgcccaag aggaacggga tgacattcaa ctgggacttg cctcaccttg 60 gcttggggga cctcgagagc ggtcccgtgg gggcagtgtt actcgtggtg gtagaagtgg 120 agggcgtgtc cgggtacttg agttcatggg catctctccc gccgcctctc agcctatctg 180 caccatgtct cacacgttca gttgcagctc ttaccgtttt gaaggcgcac gtgggcaaga 240 agtcctgggc agcacaagaa agtcaatcac gttgagacag ag 282 <210> 252 <211> 226 <212> DNA <213> Homo sapiens <400> 252 gactctagcc acagcctaac caaggattat caaaggaggt ggacactcaa ggaagggcca 60 cgccaggctg cgtttcctgc aaggactcag atgttcagta ccttatgata cagggaagat 120 agttttctta caagtagttt ggtaatattt tttttcttaa gttgtacatt tgactcagct 180 gtcaaatttc tcacacttgt atatatctac acacaactaa gttaaa 226 <210> 253 <211> 188 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (135)..(144) <223> n is a, c, g, or t <400> 253 gggaacaggg aatgccgatt ttatatacat ggtacacaga gaggggtgtc acttcacaaa 60 atcttccagc atgttcttca gaatattaat ttatatgcga ggtgaggttg ggaatgaaaa 120 gaacaggtca gcacnnnnnn nnnncctata acatacaaaa gaacatggtg gactttcagg 180 gagtgcaa 188 <210> 254 <211> 269 <212> DNA <213> Homo sapiens <400> 254 gagatttttg tggtcggtgt attcgagaat tccttaaatg gtccattaag caaataacac 60 cacagcagca ggagaagagt ccagtaaaca ccaaatcgct tttcaagcga ctttatagcc 120 ttgcgcttca ccccaatgct ttcaagaggc tgggagcatc acttgccttt aataatatct 180 acagggaatt cagggaagaa gagtctctgg tggaacagtt tgtgtttgaa gccttggtga 240 tatacatgga gagtctggcc ttagcacat 269 <210> 255 <211> 273 <212> DNA <213> Homo sapiens <400> 255 ttccttctga gtttgctgtt ggtgcaggaa taagggaaag gcccaaggta tccaagcctg 60 gggaagggca ggccagccag cacctctgcc ttctcaggga caagagtagt cctttaccac 120 cctcactctg cctgtcccct ctcctactct acagcattaa agactgtggg accaggaccc 180 taagtctcct ttccttctgg gtggggagtt ctggggttct tggtgtgtgg gagaagtttt 240 ataattgctt ccaaacagct gggtttaaat ata 273 <210> 256 <211> 279 <212> DNA <213> Homo sapiens <400> 256 ttctggatgt atcttcagga gcattagcat tccctggtag gttgaagatg ggccagtaag 60 ggaaacagaa gggtcaaagg tgatgccaag atttttgccc aaagcacctg aaagatggag 120 ttgcccatga ctaagatggg gaagcacggg gtcagcaccg atttgggggg aagatcagga 180 tttcattctt ggatgtgctg agtttgaaac atctgagtca tatccaagtg aagagtttga 240 ataggccgtt ggatatattt aggataaaag cctgggcta 279 <210> 257 <211> 174 <212> DNA <213> Homo sapiens <400> 257 accagcgcat cctcgagttc tttggcctga agaaggaaga gtgcccggcc gtgcgcctca 60 tcaccctgga ggaggagatg accaagtaca agcccgaatc ggaggagctg acggcagaga 120 ggatcacaga gttctgccac cgcttcctgg agggcaaaat caagccccac ctga 174 <210> 258 <211> 109 <212> DNA <213> Homo sapiens <400> 258 cgtgctacca tcacagctga atgcaatgaa aggcggtcct ctgagaggag cagggtggag 60 atgctaaagt ggaggccccg tcccattgct gatagatcct catctggca 109 <210> 259 <211> 167 <212> DNA <213> Homo sapiens <400> 259 tgatctagag gtcccccttc ggaaataggg aagactgtct ctgaagaagg aggaagtgta 60 gcttatggga ggctgaggag tttggagttt ctccttgtgg gaaggtggga gccatggagg 120 ctgaagacag ttgtccaact cagggcatac aaattgatga ggaactc 167 <210> 260 <211> 155 <212> DNA <213> Homo sapiens <400> 260 ctgcccctcg agtgagactg ggacaagatg ctctgctgga cttgagcttt gcctacatgc 60 cccccacctc cgaggccgcc tcatctctgg ctccgggtcc ccctcccttt gggctagagt 120 ggcgacgcca gcacctgggt aagggacatc tgctc 155 <210> 261 <211> 37 <212> DNA <213> Homo sapiens <400> 261 gtgagccaag ttcgaactcc tgcattccaa ccagcct 37 <210> 262 <211> 110 <212> DNA <213> Homo sapiens <400> 262 gatgggataa tttgggaggc ttctcattct ggcttctatt tctatgtgag taccagcata 60 tagagtgttt taaaaacaga tacatgtcat ataatttatc tgcacagact 110 <210> 263 <211> 190 <212> DNA <213> Homo sapiens <400> 263 accaaatacc acaggttctc agttgtgagt gggagctaaa tgatgagaac tcatgaacac 60 aatgaaggga acagacacta gggtctactt gagggtggaa gatgggaaga gggagaggag 120 cagaaaaagt acctattggt gatgaagtac tctgtacaac aaacccgtga caagagtttc 180 cctatataac 190 <210> 264 <211> 291 <212> DNA <213> Homo sapiens <400> 264 aacagctgct tttggtatca ataccctgtt ggttattagt ttaaaatttt agtcaatgat 60 gctttttggg tgggtgtgaa gggggaagaa aatcttgagc atgtaatgac ttaaattgtt 120 tcccaaatca aattaaattc tgggccagta taagacctac acactcacat ttcacaagtg 180 agggcatgga tgggggtagg ggcaggcagg gaaaggagaa aagaggacaa tcagcacccc 240 tgaggggctg aacatagggg gcatccaaaa cgtgcttgct gtgggaagaa t 291 <210> 265 <211> 263 <212> DNA <213> Homo sapiens <400> 265 cattttggat gacgacacga tcataaccac tctggagaac ctgaagagag aggctgcaga 60 ggtcaccagg aaagttgagg agacggacat tgtcatgcag gaggtggaga ccgtgtccca 120 gcagtacctc ccgctctcca ccgcctgcag cagcatctac ttcaccatgg agtccctcaa 180 gcagatacac ttcttgtacc agtactccct ccagtttttc ctggacattt atcacaacgt 240 cctatacgag aacccgaacc tga 263 <210> 266 <211> 144 <212> DNA <213> Homo sapiens <400> 266 atgacataca gtgcatggct cacaatccca ggagatgagg gcagcacagc tgcagagcaa 60 cacagagtgg ggagaacatc caggatgcac attcaaccag caggtgggga gcaagacaga 120 cagggacctg tgggccaaag cgtt 144 <210> 267 <211> 248 <212> DNA <213> Homo sapiens <400> 267 taggcttagc ttgatttctg ggcccactgt ctgtgttctt aagatgccaa cctgttgctt 60 tttttttttt ttttccccca tttaaaagga tagtacctac tccctctaac cacctcaccc 120 cattcttgaa tgacatttta tccttcggaa agaacaaggc tgtgatgtag tgactattgt 180 ctgtgtctcc tgtgtgtgtc tgttcttgtc acaaatgtat ttggggacgt tggatgcatt 240 cattttct 248 <210> 268 <211> 45 <212> DNA <213> Homo sapiens <400> 268 gccccactgt cactaactgt aaactcaggc tcaggcttca actgc 45 <210> 269 <211> 265 <212> DNA <213> Homo sapiens <400> 269 aagattcttc tttgtatatg aggatggtca ggtgggcgat gccaacatta atactcagga 60 ccccaagata cagaaggaaa tcatgcgtgt gatcggaact caggtttaca caaactgagg 120 gggccccagc cctcgtacca cccctgttac cccaggatcc atctgccctc ataaaagtgt 180 tcaggtacag cagctgaggc tgccctgagg aatcaagggg ccattaccaa ggggcaggaa 240 aaggatatgt aagaggtggc cttca 265 <210> 270 <211> 33 <212> DNA <213> Homo sapiens <400> 270 ttgcagcgag tcaggatcgc agcactacac tcc 33 <210> 271 <211> 234 <212> DNA <213> Homo sapiens <400> 271 ttcacaggaa gtaggtaaac accgaaattt agtcagtgtc attattagag ttgtgctttc 60 ataaaaagaa tctctcaagt gtgacaaggc taaattagaa agaagagact ggaggtagag 120 gccagttagg agatccttgt aataatccac agttgatgga atgaggatct atagtagcca 180 ggctggaggt aacaaagagg gacaggaggg caggagtact ctactttaaa gtag 234 <210> 272 <211> 61 <212> DNA <213> Homo sapiens <400> 272 agttgttaag tgtatcagat gtgttgggca tgtgaatctc caagtgcctg tgtaataaat 60 a 61 <210> 273 <211> 157 <212> DNA <213> Homo sapiens <400> 273 gtggttgtca tgtgatgggt cccctccagg ttactaaagg gtgcatgtcc cctgcttgaa 60 cactgaaggg caggtggtgg gccatggcca tggtccccag ctgaggagca ggtgtccctg 120 agaacccaaa cttcccagag agtatgtgag aaccaac 157 <210> 274 <211> 293 <212> DNA <213> Homo sapiens <400> 274 ggagacatcg atctcttttg caaattccct cacagcctca ttagggtctt cataagtgaa 60 ggggtcgatg tagaccttag taccatgtcc gatgagatac tgtccgtgtt tgtccgaata 120 ttctgcttct ctcccattgc tctgcttcct gaggcagaga actgcgacca caatgaccac 180 caggaccagg accacaccca cgactgccgt gcccgcaatc agggccagct gctcccgcca 240 gccctcgctc tcatccagtt gggtccggct gtgatgttcc tggccgaagg gcc 293 <210> 275 <211> 253 <212> DNA <213> Homo sapiens <400> 275 ggagtttgtg actagatggg caatatagta agatgtcatc ttttaaaaat gaaaaaatta 60 gctggccact gtggcacacg cctgtagtcc cagctacttg ggaagctgag gtaggaggat 120 tgcttgagcc caggagttca aggctgcagt gagctatgat tgtgcttatg aatagccact 180 gcactccagt ctgggcaata gtgagtcggt caaattccat ttccccctcc gccccatacc 240 tcttcaaatg ttt 253 <210> 276 <211> 195 <212> DNA <213> Homo sapiens <400> 276 actgcatcag gtctcagtgt ccctatctgt aagatcaaca agaaacacgg ttaagggagg 60 tcgtcactgg ggtgggagaa gaggggctgg tagaccgaag ccttgtgcat aaggattttt 120 tcccaggaaa agatagactt tataaacagt gggagcccat gaacaaacat ataaaagtag 180 caacagataa tgacc 195 <210> 277 <211> 195 <212> DNA <213> Homo sapiens <400> 277 tattgtaact cttccgccct tttcaggcgc agacaacaga acaaagtata gaggaacaac 60 aaaatatata attagccctc cctccccccc ataaagcaat tcacggatac agaatacatt 120 ctcttcacag taaacctaag aacacttgta acaattgccc acagcgcgca tgctaactaa 180 agtaacctct tttga 195 <210> 278 <211> 297 <212> DNA <213> Homo sapiens <400> 278 tactgcttgc atatcctttc ctcagctaac cgtcctcctg ggcccttctg cttctgaccc 60 cctcaggacc ttaggacata atcactccct gcttctatct tcagtatctc ctcattacaa 120 ataaagcatt tgctgcagct catttaactc ttgtgtccac agtgagtctc ttccattact 180 taatcacact taattctctg tcctgactcc tgtccccagc cttttctttc actttgcccg 240 tctgtcaggc tctcatgctt ctccatttgg caacttcagg aaggtacgcg agctccc 297 <210> 279 <211> 256 <212> DNA <213> Homo sapiens <400> 279 gccagtcacc ctgcggatcg agagaggggg tagagtcttc ttcaaatggc agttttactt 60 caaatggcag atttcacaag agttggttat tttttacaat ggtttaggtt gttaagtctc 120 ctttgtatgt aaggtagttt tttcaacatc taaaattttt gttttagcct tcaaaaccaa 180 cttaccaacc tcagtccagc tgggaaggca gcgttgatta tggtagtttg tcaagaatat 240 atggacctgg aaacac 256 <210> 280 <211> 223 <212> DNA <213> Homo sapiens <400> 280 cactgctcag ggttggaggc tcagtccctt tgccctgtct gttccagctc tggagctaac 60 tcagggatcc ctgatcaggg ttacataggt ttggtaaaat gagtgctgga aattaacttt 120 ctcccagtag tcttaggtca tgctcagtga acttaaactt tatccagata tggttttcct 180 tcagcctttc tattcccttt ctagccagtg aaagacccgc tgc 223 <210> 281 <211> 140 <212> DNA <213> Homo sapiens <400> 281 cgagagtata tcagttaaag ggtaagaaat gtagacccca tattttaatt cagtagcacc 60 agttcaaatc cagttattca gaattaacaa agcaactgtt gctcaaaaaa atgccaataa 120 actcccgagc caactgagat 140 <210> 282 <211> 112 <212> DNA <213> Homo sapiens <400> 282 accaaggagc tggtcagacg gccctttcta atcctacatg ttgagcttat gtaaaaaatg 60 ttgtttcctc ctgtttttgg ttcctttctt acccacaaac cattactact tg 112 <210> 283 <211> 34 <212> DNA <213> Homo sapiens <400> 283 caacagagtg agacttaatc ttgaaaaata aata 34 <210> 284 <211> 166 <212> DNA <213> Homo sapiens <400> 284 agtagagggc cctcaaccca cacactggct gaaactgcca ccaactgcca cgatgaaccc 60 aactgctgtt tatgccccca ttttcctttt tttgtatcta cacccacacg attcccaatg 120 ttggatattt ctacatgaat aaagcaagga tcagtgcctc ttatgt 166 <210> 285 <211> 288 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (78)..(157) <223> n is a, c, g, or t <400> 285 agggcaaaac aggagatgag gaaatgttaa aggataaagg aaagccagag agtgagggag 60 aggcaaaaga aggaaagnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnntga aggagagcca gggagtgaaa 180 caagggctgc aggaaagcgc ccagctgagg atgatgtacc caggaaagcc aaaagaaaaa 240 ctaataaggg gctggctcat tacctcaagg agtataaaga ggccatac 288 <210> 286 <211> 276 <212> DNA <213> Homo sapiens <400> 286 tgtggggtga cagttttaca tttacttttt cttcttaatg cagctggatc taagtaaaat 60 gttttgaagt ttatcagaaa ctaaatgtac ttttaaaacg tatagggtca gggttggggg 120 aaaaatacag gtatagtaag taagaaaagt gacccatgaa gaaagcatcg tgaggttgta 180 tgttggttga ctgtgattaa aatgcggggc tggtgtaagt tgtaagtggt ggctgattgc 240 cgtgtactat gtacatgatt gttgggatgg ctgtcc 276 <210> 287 <211> 183 <212> DNA <213> Homo sapiens <400> 287 gaaaacctat aacatgatga gtaagagttc tatggtagag aggtaggaga ggaaaggtga 60 aaactgccac aagccaaatg agactgcagc aaagtatgta aggagcctgt tctcaggtcc 120 acccacatcc agctatcacc ctctctgacc gccttttccc atgagcctga aagggtcaca 180 gac 183 <210> 288 <211> 295 <212> DNA <213> Homo sapiens <400> 288 gacgcacaac cttcaacact aattgccctt tactaagccg accagggcta gacactaagc 60 cagaaaagcc ttttccagag tttcctcttc cgcacaaaag ctttccttct gtcactccac 120 ccaaccaccc agctcctccc ttaagtgttt gaaagataat tctaaaagtc tcctcccccg 180 aaccgctgcg tttcttaagg ccacaccatt ttaaaaatac tgtattgctt ttgccaggct 240 gttgggacct cttccatctc atttctatct aagagtggtt ggtacacacg aggac 295 <210> 289 <211> 285 <212> DNA <213> Homo sapiens <400> 289 aaagcagatg ggtgtgttca gacaagatct ggaagctgtg gcatggcaga caaagggaga 60 tgggacccct ttggcactgg aggaagaggc ttgaatcttc ttggagcact aaaagttcca 120 aaagacctaa gcagaaaatg cttccgaaga ggaggatctg tatggcaaga tgactgtaat 180 caggctcata aaagtaagac cttacataaa tacaagtgag ggggaagaca tttcatgtag 240 gaggaatggc tcaagcaaaa ataccaaggc gggaaattgc gtggt 285 <210> 290 <211> 129 <212> DNA <213> Homo sapiens <400> 290 agaagttttg agaagcagtt ttgtttgggt caaggggtac tttcaaatta cacttatgag 60 tcagtatcta taaaaagttt cagaagtacc tacaatttag ccctctacat ccaagcagta 120 gctttgcag 129 <210> 291 <211> 70 <212> DNA <213> Homo sapiens <400> 291 cagtgagcta taatacaagg cttcattgca ctccagccta ggcattagag cgagaccgtg 60 tttatttaaa 70 <210> 292 <211> 135 <212> DNA <213> Homo sapiens <400> 292 gcagatgcag gaaacaccta gagcagcccc agagtcacgg ggctgagggg gcgggagctg 60 cccctgtcat agggaggggg attcccagcg tctgtagtgc ttcctgtttg ctgaataaag 120 gtctctttct cacac 135 <210> 293 <211> 156 <212> DNA <213> Homo sapiens <400> 293 cagaaatgtt agtgccgtgc tctaaccaag taagcttagt gttccccaca gtgatctgta 60 tctggcctga gtctcctcaa gcagcaaccc ccactgtcca gcatgtggaa ggtagatcct 120 tatgacaaca ccagacccat agttaccagg aaagaa 156 <210> 294 <211> 175 <212> DNA <213> Homo sapiens <400> 294 gtgtttaagg gcatttcaca gatgggaaat aaggtgcaga gggctagaga gatgggctca 60 aggctgtggt gccagtgaca ctggcttccc ctgtgttgtc ctttgctctt gaacatcacg 120 ccacgcagca gcagaacaaa gataaagaac caattccaaa accaggcgtg gtggc 175 <210> 295 <211> 112 <212> DNA <213> Homo sapiens <400> 295 ggccgagaag atgctgggca cccacccagc acccccatct accaacacca gcggctgggg 60 gcgggggcgg accttgtgag gctcagttga cccgttactt gcaacctgaa aa 112 <210> 296 <211> 149 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (46)..(86) <223> n is a, c, g, or t <400> 296 caagaatctg gcatttctct tcagttatct tatatgtaca tataannnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnnnnggag atgaaggtct cagtctctta cccactgcac 120 tctagcccag gcggtaagag agactccat 149 <210> 297 <211> 239 <212> DNA <213> Homo sapiens <400> 297 cctctacgcc agagaaggga atggagaggt caggctggct agagagtggg gttgagtcgt 60 ccatgccctt gaatgccagg atgagggcta aagagtcaaa tggaatgggt gacttcatat 120 gcagaagttt ttacaagaga agagaactca gttgggccaa gagaagtggg gtcgtcatgt 180 gggtaatcac gtaacagtga tcgttcagtc atgcggaatg ctttcaaggt gttggacac 239 <210> 298 <211> 278 <212> DNA <213> Homo sapiens <400> 298 cctctacgag gtgtgctatt ctcatcctca tcttataggc aagttaactg aggtataagg 60 aggttggtta tgtaacttga ccaaagtcac acaataaggg actgggagat ctgggatttg 120 agccctggca gatggactcc atccaaagtc ctcactatcc tagcacctct ctatcccctc 180 cctttcctct ctcctacctt cttctgtgct gctttcaaac agacagttat ctctaccctt 240 aaaaacacag ctgtgctgac tactctgctt agatgccc 278 <210> 299 <211> 145 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (79)..(112) <223> n is a, c, g, or t <400> 299 cctctgggac aagtaagtca atgtgggcag ttcagtcgtc tgggtttttt ccccttttct 60 gttcatttca tctggctcnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nntgcttccc 120 ctcactgccc aggtcgatca agtgg 145 <210> 300 <211> 42 <212> DNA <213> Homo sapiens <400> 300 tggtcaagaa ggactatgac gcccttcgga agaggtacag tg 42 <210> 301 <211> 256 <212> DNA <213> Homo sapiens <400> 301 agaatagcaa ctggctcagt cctttaggtg tctacactaa tatcaaagga acaggccagg 60 cccaaggaga gagagggaat atgtttctgt gcctgatcct ttctctagat tttatctcag 120 ttgtatgaca ttgaagcacc tgactgagca attgagcatg atgtgttctc ctgaccatcc 180 ttctaaaacc attttccacc agtttctacc ttctgatggc gctttagtca cctgcactta 240 caaacaggtg cccaaa 256 <210> 302 <211> 274 <212> DNA <213> Homo sapiens <400> 302 ggctctgatg atggaccctc agtgatggat gaaacaagca atgatgcctt tgattcttta 60 gaaaggaagt gtatggaaaa agaaaaatgt aaaaaaccct ctagtttaaa acctgaaaag 120 attccttcca agagcctaaa gtcagcccgt cccattgccc ctgccatccc cccacagcaa 180 atctacacct tccagacagc caccttcaca gcagcgagcc caggctcttc ctcaggcttg 240 accgccacag tggcacaagc catgcccaac agtc 274 <210> 303 <211> 78 <212> DNA <213> Homo sapiens <400> 303 ttttcatgca gattagttag aattcactgc caggtttctt ctgcccacca aaatgatcca 60 gtctggaata acattttg 78 <210> 304 <211> 137 <212> DNA <213> Homo sapiens <400> 304 gtaggctagg gatcatgggg gaatagttag taatgacagg gatagttgaa cttaaaaaaa 60 aagtttgtga ggctgacaaa gatgaaacgg acacatttcc tgatcttgga gggttcatag 120 ggtagaagat ggtagat 137 <210> 305 <211> 161 <212> DNA <213> Homo sapiens <400> 305 gatggtggga tatttgtgtc tgtgttctta taatatatta ttattcttcc ttggttctag 60 aaaaatagat aaatatattt ttttcaggaa atagtgtggt gtttccagtt tgatgttgct 120 gggtggttga gtgagtgaat tttcatgtgg ctgggtgggt t 161 <210> 306 <211> 255 <212> DNA <213> Homo sapiens <400> 306 gaaacagcat gggaccgtgt gattgggtcc aggctgggct gtcagggaag cgccctggtg 60 tctccgactc atcaattctc gggtcttttt ttaaaagcca ggctccccaa agcactcttt 120 gtctcgcaat tttgaggagg ttgttccgac ctggaagcgt taaactgctg catgtcatct 180 ggcgtcagct gtgaggctgc gctctgcgtg ttgtgcgttt gcaaaatgta ttggcgtgac 240 tgtaaacaca tcgtt 255 <210> 307 <211> 289 <212> DNA <213> Homo sapiens <400> 307 gtcaagctca gttgagggtt aatgatgagg caggctgatg cgggttcttt gcccagtccc 60 agggttccaa gaagccttcc tgggagaggg ggcctgagtt gaatggtgca agatgaacaa 120 gaaatggcaa gatagagaaa ggtggggagg gcttcccagg cagaagagag agcatggcta 180 aagggctagg ggcatgaagc agcaggggac ccccagccat gtagtatcac tggaggatga 240 gaataagggg gagaaggagg gagggagaga aggtatactt ctgagggca 289 <210> 308 <211> 181 <212> DNA <213> Homo sapiens <400> 308 agttcagggc tatagtgcgc tatgttgatc tggtgttcat gctaagttcc gcatcaatat 60 ggtgacttct agggagtggg ggaccaccag gttgcctaag gaggggtgaa cctgcctacg 120 ttggaaatag agctggtcaa aactcctgtg ctcatcagta gtagaatagc acctgtgaat 180 a 181 <210> 309 <211> 253 <212> DNA <213> Homo sapiens <400> 309 gacagcttgg aaggaaggat tgaccatggg ttgattccat ggaggtagag aagcaagaga 60 gacctgatga ttacaatgat ggctaagtgt agtatgccca ttaggattga attgaattag 120 gggaaattgt gtgaagtgtt tggaaggaag caatattgtg tgattagctc caaagctggc 180 cactggtaga agttgtttca atggaagaac aaggatggaa ttgagtgggc cagagagccc 240 tagattaatg ggt 253 <210> 310 <211> 159 <212> DNA <213> Homo sapiens <400> 310 tattcagcga aacttacctg aaggggttgc catggaagta acaaagacac aattagaaca 60 gttaccagaa cacatcaagg agccaatctg ggaaaacact atcagaagaa aaagaagaaa 120 gctagtcata aagcctcagg gaggccattt ttgcctaaa 159 <210> 311 <211> 269 <212> DNA <213> Homo sapiens <400> 311 caaatgcgag atcttcagtt gcagtgtgaa gccaatgtcc gcgaactgca tcagctgcag 60 aatgaaaaat gccacttgtt ggttgagcat gagactcaga aactgaagga gttagatgag 120 gaacatagcc aagaattaaa ggagtggaga gagaaattga gacctaggag aaaggcactg 180 gaagaagagt ttgccaggaa actacaggaa caggaagtat tatataaaat gactggggag 240 tctgaatgcc ttaacacatc aaccccgga 269 <210> 312 <211> 234 <212> DNA <213> Homo sapiens <400> 312 tttcagaaac tgtcaaatgt accatatttg tattaagagt tgttgggaat ttttgtacaa 60 tgaatttaca tttatttatg gtgacatatt tacgcttgtg atcaaataat gatgttaaat 120 tcttaaatca tatttgctat gcagctgaag atgatatttt gatttgtatt ttgggggtac 180 ctgtgttgag ttgataaaca tttccatctt cattaaaact gcttccaaac taaa 234 <210> 313 <211> 32 <212> DNA <213> Homo sapiens <400> 313 taaagcatgg atctcgcttt ggttgtaaaa aa 32 <210> 314 <211> 221 <212> DNA <213> Homo sapiens <400> 314 atggtggggg tctctcacct tcttgaccct ctctccatca ttcagctgcc agcccaggct 60 tcacacccaa gctggctcag cagccgagcc tggcaccgag ggtccctgca ggctccctgg 120 gcagggagag ggccaaggac aattgggagg gcagcaggca gcccgcagat ggtggccatg 180 tggcacgctg ctgagacgac actaccaata aaccaaactg c 221 <210> 315 <211> 238 <212> DNA <213> Homo sapiens <400> 315 ctgcccgtct gtaagttcca ggtggtgatt ccgaaatcct aagcctgcct cgcacctgct 60 gagccgcact gctgcccctg gcctcaccgg cctcaggaga cggtggggcc gctgcatttc 120 ggggtggtct tgggaatccc aggccctagg ggtcacattt gctcaggaag tgggtatcaa 180 attgaggtgg gggtgtcaga ggaggcaaag gggtcccagc tgcggtcagg actgtggt 238 <210> 316 <211> 36 <212> DNA <213> Homo sapiens <400> 316 cctgggtgac ggaataagac tcggtctcca aaagaa 36 <210> 317 <211> 87 <212> DNA <213> Homo sapiens <400> 317 aaggctgcta gggatgttag acctcggcca ggacccacca cattgcttcc taatacccac 60 ccttcctcac gacctcattt ctgggca 87 <210> 318 <211> 59 <212> DNA <213> Homo sapiens <400> 318 tacctgttta tctgtaactg ttatccaaac aaattaaata ctgtggatgc ctttaaaaa 59 <210> 319 <211> 299 <212> DNA <213> Homo sapiens <400> 319 gacagtggat aactttcaaa gaggcatctt tgtgtggccc atgaactttg gttggagaac 60 aattcctcca gatgtcactg caaaaaaaca gaattaaaga aactgataca ataaggtgcc 120 ctgtcatggc tggtggattg ttttctactg acaaaagtta cttttttgaa cttggaacat 180 acgaccctgg ccttgatgtt tggggtgggg aaaatatgga gctctcattc aaggtgtgga 240 tgtgtggtgg tgaaattgag atcattccct gctcccgagt gggccatata ttcagaaat 299 <210> 320 <211> 260 <212> DNA <213> Homo sapiens <400> 320 atgagtatct cagctccttc aaggtggcac agtacgtcgt gcgggaagaa gacaagattg 60 aggaaattga gcgagagatc atcaagcagg aggagaatgt ggaccctgac tactgggaga 120 agctgctgag gcatcactat gagcaacagc aggaagacct agcccggaat ctaggcaagg 180 gcaagcgggt tcgcaagcaa gttaactaca atgatgctgc tcaggaagac caagacaacc 240 agtcagagta ctcggtgggt 260 <210> 321 <211> 131 <212> DNA <213> Homo sapiens <400> 321 ctatggccgg ataactaagg atgtggtgct ccaatgggga gaaatgccca cgtctgtggc 60 ctacattcat tccaatcaga taatgggctg gggcgagaaa gctattgaga tccggtcagt 120 ggaaacagga c 131 <210> 322 <211> 137 <212> DNA <213> Homo sapiens <400> 322 ccaccattgc gggtccccca ggaagccagg tgaccccagg tgggaggctg tgtgtggagg 60 ccatcctgga aggaagttta gacctgccca ggtgtggagc gaggggcaca ggggcatcct 120 aacctcagaa actgaaa 137 <210> 323 <211> 277 <212> DNA <213> Homo sapiens <400> 323 agcaaagtgt attctccatc tggcctcaga gcagatgcca agcctaattg ggccaccaga 60 tccgtgaagg tggtttgctg ttttccagcc agctcaataa cttgtttggc agaatcagga 120 attaggacct gatcaatcaa atggatcaca ccattagttg gtcacaatat cctttgttgt 180 tcaccatttt gattccattt actgttatac tgtcaccgtc acatcctatc tcaattgtat 240 ttccttccag cgtctcaaga ctgctactcc cataata 277 <210> 324 <211> 271 <212> DNA <213> Homo sapiens <400> 324 gcttgcccca gaacttagtc tctttgccca gcctcacccc tcctggtgct catcagactc 60 ttgccacccc tggctcccac tccctgcttg cctctggtgg agctgcacag agctctggga 120 agaggccctc ttcctccccg cactggggcg atgggcgcac ctcagactta cccactgctg 180 ctgccaccac caaccccttg atccctcagt cctcccacac agcttctgtc caccccaggt 240 ttccctcacc ccacctttgc taagtcttcc t 271 <210> 325 <211> 225 <212> DNA <213> Homo sapiens <400> 325 gccctgctgc gaagtggagt ccgaggtcat gatgagtgac tatgagagcg gggacgacgg 60 tcacttcgaa gaggtgacga tcccgcccct ggattcccag cagcacacgg aagtctgact 120 ctcaactccc cccaaagtgc ctgactttag tgaacctaga ggtgatgtgc gtcatccgcg 180 ctgttctttg cagcagtgct tccaagcttt tttgggtgag ccgaa 225 <210> 326 <211> 68 <212> DNA <213> Homo sapiens <400> 326 agaagcaaca cgatgatggg ccccccagtt tgaatttcag acagtggagg agggaatatt 60 gctaggag 68 <210> 327 <211> 272 <212> DNA <213> Homo sapiens <400> 327 tactctcagc agtcagaggc ttgcttgctc tgtgcagatt tttaattttc ttttttggcc 60 ctaggctggt tgggacctct acagcttcat tctttcacca ttaaatagtg gcctttttca 120 gtattttccc tcttcccctt tataaattat gctaaagcca caaagcacat ttttggggat 180 catagaaggt tggggttcca gaaaggcatc tgtgtgatgg ttccattgat gtgggatttc 240 cctacttgct gtattctcag tttctaataa aa 272 <210> 328 <211> 285 <212> DNA <213> Homo sapiens <400> 328 aaggactgtc caagagccag ccagttcagg gctcaggcct cacccattgc ccactcctgg 60 ggagaccatc acctggctca tcgtttccac caagagtgcc ccacaggagt gccccacaga 120 cccgctggac cagcctgctg cgggtcctgg ccaggggtct ggctaacggt gagggctgac 180 tctgaactgt ctctcagtct ccagaaagtg ttcaagcctg ttgtgttccc aaatctgatt 240 cctcctattg tcttgtaaat caaactctaa gtgaaaactt cccat 285 <210> 329 <211> 231 <212> DNA <213> Homo sapiens <400> 329 gaaggtcata acagtttcaa acaatagcca gggaagttag agtcacctag agacatcctt 60 aacacgtgcc cctgagctac ttttcagaaa cccagacccc caccaaatgg attcacacag 120 acgtcagata agggggaaca ccagggacta aactctgacc tccattcttt gctctcagtt 180 tcttcctgag gggcctggcc agaccttaat gttcctttct gcggacccca a 231 <210> 330 <211> 273 <212> DNA <213> Homo sapiens <400> 330 cacctgcact ctagtgaccc tgggtgccgc cagacccttc tcttctacaa agaccccagc 60 aggagtggga gggtctgcaa tggcatcgcc ctgtcctgcc ttggccagaa gcctggagct 120 ttggtttgag gaggtagaga tatgtgtatc cataggaaga gatctgtcag aacaggcagc 180 tgttgagctc ggggtgtctt cctcaaggca tgtggctcag cagcaagaaa ggcaagttgc 240 tcctgctggg gccctggact ctgccttagc tcc 273 <210> 331 <211> 133 <212> DNA <213> Homo sapiens <400> 331 tctctccagc ctctcttagg aggggtaatg gtggagttgg catcttgtaa ctctcctttc 60 tcctttcttc ccctttctct gcccgccttt cccatcctgc tgtagacttc ttgattgtca 120 gtctgtgtca cat 133 <210> 332 <211> 292 <212> DNA <213> Homo sapiens <400> 332 atccacggcc gcgttagaaa gagggtcgca cgctgccgcc gaggtagagg ggtccccgag 60 tcctggggcc tcgcacccca cagcccgagt cccttccccg cggaagggac tcgtggctgt 120 gggtagagac gcgcgcttgg cgcggccagc cctgcaggca ggagctgagc ggcgcaggga 180 cacgggcagc tgggaggggc gcctggtgat ttactcactt ccctcctagc cagagaagtg 240 cagcaattcc aaacagttct cataggagcg tccctgacaa cttcatgtta ta 292 <210> 333 <211> 211 <212> DNA <213> Homo sapiens <400> 333 gtaccacaaa cacactcaac ttgtctatga attagagaac aagatactgc tgctgcttct 60 ttttgacttt tgaaatatac aatgttttgt aggctctgcc cttcaatgtg aaagcaggac 120 attaaatttg aaattatttg acaattaaat gtttaggacc atctaacttc aactgcaaaa 180 ctaaacagat ctaccttgtc cttccttcaa a 211 <210> 334 <211> 142 <212> DNA <213> Homo sapiens <400> 334 ggttcatttt agtttcagat agatggcttc accaaagaac tcttgaaaga atactgatta 60 gggaggggca gggaagtagg agcttatggt atattataag gctgggaaaa atctatgatg 120 caaacccttt ccacatagta ct 142 <210> 335 <211> 208 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (56)..(56) <223> n is a, c, g, or t <220> <221> misc_feature <222> (65)..(65) <223> n is a, c, g, or t <220> <221> misc_feature <222> (114)..(114) <223> n is a, c, g, or t <220> <221> misc_feature <222> (142)..(142) <223> n is a, c, g, or t <400> 335 actcattctt aacctaatca cctaaaataa ttcttatcat ctattcttct tcaggnaaaa 60 atggngccct gggtgttatt ttaacgactt gccatccttc ctgttttgag agtntctttg 120 ttaactgggg gcataccttc gngacccggt cctaccttcc tcattcagac ctgtgctgtt 180 cattgctgta ttcccagtcc cttaaaaa 208 <210> 336 <211> 227 <212> DNA <213> Homo sapiens <400> 336 atatctgaca gatgtgtaaa ccaagttacc agcatggtgt ggaatcgtag ttccaagtca 60 tataatacca gacattcaag aaaactagtg ccctgttaac tgggggaagc aaatttatat 120 ccttttggaa gaaagtcacc ttattctgtg tatcagaaat ctctttcaaa taacctttca 180 gaactataga gcatcataca aagatgacca agcatacaag aaaacaa 227 <210> 337 <211> 101 <212> DNA <213> Homo sapiens <400> 337 aacatcaaag ctggattaga acatctgcca ccagctgaac aggccaaagg cagactacag 60 ctggttcttg aagctgctgc aaaagctgat gaagcattga a 101 <210> 338 <211> 212 <212> DNA <213> Homo sapiens <400> 338 agccttagca aaaatgcctc ctcaccactc cccaggagaa tttttataaa aagcataatc 60 actgattcct tcactgacat aatgtaggaa gcctctgagg agaaaaacaa agggagaaac 120 atagagaacg gttgctactg gcagaagcat aagatctttg tacaatattg ctggccctgg 180 ttcacctgtt tactgttatc acaataatgc ta 212 <210> 339 <211> 235 <212> DNA <213> Homo sapiens <400> 339 acagagtcat ttgagctttc tcccctcccg ctagtatctt tacaggagca gggaagagca 60 gtagaggatg tataattttg ggcgaagtta aattacaatt tatttgaggt tattcctaaa 120 cctatttatt tggtgttttg gaggagatca cacactaaga gaacgttgat tgcctcggct 180 attgtgctgg ctggacactt tggtcacttt tgaagcatgt taataaatgt cactg 235 <210> 340 <211> 271 <212> DNA <213> Homo sapiens <400> 340 tccaaacacc ggcagaaaac ggagagtgct tgggtggtgg gtgctggagg attttccagt 60 tctgacacac gtatttatat ttggaaagag accagcaccg agctcggcac ctccccggcc 120 tctctcttcc cagctgcaga tgccacacct gctccttctt gctttccccg ggggaggaag 180 ggggttgtgg tcggggagct ggggtacagg tttggggagg gggaagagaa atttttattt 240 ttgaacccct gtgtcccttt tgcataagat t 271 <210> 341 <211> 270 <212> DNA <213> Homo sapiens <400> 341 tgaggagcgg gagggttccg ccactccagt tttctcctct gcttctttgc ctccctcaga 60 tagaaaacag cccccactcc agtccactcc tgacccctct cctcaaggga aggccttggg 120 tggccccctc tccttctcct agctctggag gtgctgctct agggcaggga attatgggag 180 aagtgggggc agcccaggcg gtttcacgcc ccacactttg tacagaccga gaggccagtt 240 gatctgctct gttttatact agtgacaata 270 <210> 342 <211> 207 <212> DNA <213> Homo sapiens <400> 342 aaagactcat cataagggtc cttcctcttt tctatcctcc ctccatattc agttgctaag 60 tctcaactac tttgctccca tcaagattct ctttactatt tcttctatcc agaccttcct 120 ctttattcct attgtcattg tcttatttta ggttctcatc atctttcact aagataacta 180 caacagcttc gtgaccagcg taggcaa 207 <210> 343 <211> 189 <212> DNA <213> Homo sapiens <400> 343 gctcaaatag ctataactgt accaaagaca tggaagaaac caaaagatcg gacccgaacc 60 actgaagaga tgttagaggc agaattggag cttaaagctg aagaggagct ttccattgac 120 aaagtacttg aatctgaaca agataaaatg agccaggggt ttcatcctga aagagacccc 180 tctgaccta 189 <210> 344 <211> 292 <212> DNA <213> Homo sapiens <400> 344 tgcgaatctt ctgcagctcc atcagcatcc atgtatcttg cttgtcattt tctctgttgg 60 ttacaattac tttattatgg ttgacatctt ggcaggttcc atgatgagtg atttcagtag 120 tggtcactgt ctggtgctgg ggatagccag ggagctgaat gaccagggtc tggtaatgct 180 tctgggcatc ggtgaactga gactgtattt tccgcttgtc atcatctcca aacatctcta 240 agccttggct atttctgatg aactcttggc actgtaactc aaggtcggat at 292 <210> 345 <211> 286 <212> DNA <213> Homo sapiens <400> 345 caactatgcg gagcgggtcg gtgctggagc gccggtgtac ctggcggcgg tgctggagta 60 cctgaccgcc gagatcctgg agctggctgg caacgcggcc cgcgacaaca agaagactcg 120 catcatcccg cgtcacctcc agctggccat ccgcaacgat gaggagctca acaagcttct 180 gggcaaagtc accatcgcac agggtggcgt cctgcccaac atccaggccg tgctgctgcc 240 aaagaaaact gagagccacc acaagactaa gtaaagaccg agttga 286 <210> 346 <211> 247 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (80)..(131) <223> n is a, c, g, or t <400> 346 catatttcag cggatcatca actttttctc ctaccatact atcctcagac aaagaaacca 60 ttgaaattat agacctagcn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 120 nnnnnnnnnn ngtggctggt aaagaggata atacagacac tgaccaagag aagaaagaag 180 aaaagggtgt ttcggaaaga gaaaacaatg aattagaagt ggaagaaagt caagaagtga 240 gtgatca 247 <210> 347 <211> 55 <212> DNA <213> Homo sapiens <400> 347 tgctcttaaa cccaaagggg cttcactgaa gagcccactt ccaagtcaat aaaaa 55 <210> 348 <211> 291 <212> DNA <213> Homo sapiens <400> 348 cttctcttgg gctgagatgc tgctgccagc tctaaaacag cactctgttc tcaaaacctc 60 atggcaggct cctggctcca atactcagct gccaaacatg atgctgattc ttcacgaatt 120 tgcaacccag ttctctcggg tttgcacacc cccactgtgg gccggggaac cgggtcccgg 180 ccttcgcaga ctccaggctc tggcagatgt ggccctccat aacaacggga atgaaaaggt 240 cacaccttat gtgcgccagg cccttaagga gtcggaatat cccaatcctc c 291 <210> 349 <211> 47 <212> DNA <213> Homo sapiens <400> 349 tgctgtggta ctttgctgtg tactccgtgg catcatgtta ctgtgta 47 <210> 350 <211> 255 <212> DNA <213> Homo sapiens <400> 350 ggagtttgtg actagatggg caatatagta agatgtcatc ttttaaaaat gaaaaaatta 60 gctggccact gtggcacacg cctgtagtcc cagctacttg ggaagctgag gtaggaggat 120 tgcttgagcc caggagttca aggctgcagt gagctatgat tgtgcttatg aatagccact 180 gcactccagt ctgggcaata gtgagtcggt caaattccat ttccccctcc gccccatacc 240 tcttcaaatg tttaa 255 <210> 351 <211> 145 <212> DNA <213> Homo sapiens <400> 351 cacttcctga cggatgccag cttgggcact gctgtctact gaccccaacc cttgatgata 60 tgtatttatt catttgttat tttaccagct atttattgag tgtcttttat gtaggctaaa 120 tgaacatagg tctctggcct cacgg 145 <210> 352 <211> 150 <212> DNA <213> Homo sapiens <400> 352 agcctaggca atgcagcgag gccttgtcta gaaaatttaa aaaaaaaaaa aaaaattagc 60 tgggcgtggt ggcacgtacc tgtagttcca gctactcggg aggctgaggc ggcaggatct 120 cttgagctaa gtagttcgag gctgaagtga 150 <210> 353 <211> 173 <212> DNA <213> Homo sapiens <400> 353 ttagccaagt atggtggcac gcgcctgtaa tcccagcaac ttggaaggct gaggcaggag 60 aatcgcttga acctgggagg cagaggttgc agtgagccaa gatcagacca ctaccgcccc 120 gcgctggctt gccctcctgt tctccagagc aataaagttg gacgagacta ccc 173 <210> 354 <211> 178 <212> DNA <213> Homo sapiens <400> 354 cacagctctt cttggcgtat ttatactcac tgagtcttaa cttttcacca ggggtgctca 60 cctctgcccc tattgggaga ggtcataaaa tgtctcgagt cctaaggcct taggggtcat 120 gtatgatgag catacacaca ggtaattata aacccacatt cttaccattt cacacata 178 <210> 355 <211> 295 <212> DNA <213> Homo sapiens <400> 355 ggatggcacc atgtttgaga ggctacagag gagacccaga gccagtaagc aagacataga 60 gtttatagag aggacttaca gcatagtcca gtggcagcgg gctagacagg agaaccgcaa 120 tggcttgaaa aagcacgaag tataaagcgt tgagctcaac ggtttatact tcagagaaac 180 tcaacaatca actgaaggca ctaactgaga aaaacaaaga acttgaaatg gctcaggatc 240 gcaatatggc cattcagagc caatttacaa gaccaaagga agcatcagaa gctga 295 <210> 356 <211> 255 <212> DNA <213> Homo sapiens <400> 356 atttctttag ctgaccatag tgagtcttcc ttgagttcac gtttcttccc aatttcattt 60 tcttgagata ttttgctact ttctggtact gcttcatcac tgaaagtgtc atttgtttct 120 atatccatcc ttggcctttt tctaacattg acatcttcct cctgtttttg aactttcaca 180 tcaatttcta actctggttt tgtgtccttg aataactgtt ccaatacttc atcttctatg 240 gccacatcat ccatt 255 <210> 357 <211> 266 <212> DNA <213> Homo sapiens <400> 357 gtatcaaatt cacgccatgc aaaaagatta taaatgtaat aagcatgtat gtgtgtgagg 60 agattcagtc ataacccaac gctcattcaa catcaaagaa tttataccta agagaactta 120 tttgggtgta gtaaatggca gatctttcaa taggagttta actagtcttt gtcatatcag 180 aatatccata gtagacaaga atttgatgta acgcaaatgg aaaaactcga caccacattt 240 caggctttac ccaacatcga aataat 266 <210> 358 <211> 271 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (136)..(136) <223> n is a, c, g, or t <400> 358 cgttcagtac aaacatttat gcggtaggct cagatgttgt aatttgcact taggtaccag 60 gtgtcaggaa acagactaaa aagaattcca ccaggctgtt tggagatcct catcttggag 120 ctttttcaaa agcggngctt catctgcaaa gggccctttc atcttgaagt ttttcccctc 180 cgtctttccc ctcccctggc atggacacct tgtgtttagg atcatctctg caagtttcct 240 aggtctgaat ctgcgagtag atgaacctgc a 271 <210> 359 <211> 204 <212> DNA <213> Homo sapiens <400> 359 gtaccacaaa cacactcaac ttgtctatga attagagaac aagatactgc tgctgcttct 60 ttttgacttt tgaaatatac aatgttttgt aggctctgcc cttcaatgtg aaagcaggac 120 attaaatttg aaattatttg acaattaaat gtttaggacc atctaacttc aactgcaaaa 180 ctaaacagat ctaccttgtc cttc 204 <210> 360 <211> 185 <212> DNA <213> Homo sapiens <400> 360 attacagtta tagctctctc aagcaaaaaa acagcagaga aaaacttagt ttaccttagg 60 ggctatttat ttacttaggg atttgttaaa aggtcgaatg gggtcacaca gaatactaag 120 aagagctgtt cacccaggcc tcactaagaa ctcttcttca ttcagtagct gtatagtaac 180 atgac 185 <210> 361 <211> 54 <212> DNA <213> Homo sapiens <400> 361 ctttagtagt ttctcgtcag tcccgcagcc accgcagccg ggtcccccct cgtg 54 <210> 362 <211> 261 <212> DNA <213> Homo sapiens <400> 362 agagaggggg ctcacctctt atcctcggcg acccactgca caagcaggcc gctctcccag 60 acttaaaatg tatcaccact aacctgtgag ggggacccaa tctggactcc ttccccgcct 120 tgggacatcg caggccggga agcagtgccc gccaggcctg ggccaggaga gctccaggaa 180 gggcactgag cgctgctggc gcgaggcctc ggacatccgc aggcaccagg gaaagtctcc 240 tggggcgatc tgtaaataaa c 261 <210> 363 <211> 236 <212> DNA <213> Homo sapiens <400> 363 ctgaatgggc agagctggat tttacagggt tgggattttg ccaggtgagt aagatagagg 60 ggagaagtgg gaccaggaag ttccaggtct gtgaacgggc ctggctgagg agctggatca 120 tgaaatctcg agtcaagtaa gaaggaaatt gaggacacga gttgggtatt gcatagtgtt 180 actgtgttaa ggtcaggggt caaagactta ctggcatgga gtaaccagag taagtg 236 <210> 364 <211> 179 <212> DNA <213> Homo sapiens <400> 364 caggcaaaaa cgtccccgaa gccagcagtt gtagagactg ttacaacagc caagccacag 60 cagatacaag cgctgatgga tgaagtgaca aaacaaggaa acattgtccg aaaactgaaa 120 gcacaaaagg cagacaagaa cgaggttgct gcggaggtgg cgaaactctt ggatctaaa 179 <210> 365 <211> 167 <212> DNA <213> Homo sapiens <400> 365 cagagtcccg tgtgtcctaa aaatctccta aaaccagtct atgaactcag ggctttaaaa 60 catttttaat ttatttggtc attcaattta cttgttttta atacatgatt ctctatgaaa 120 ttgatgggct caaactagct gtgaatcttc tgagagtgaa agcaaca 167 <210> 366 <211> 280 <212> DNA <213> Homo sapiens <400> 366 tataaagtaa ccctatgatg ctccccttac gagaaaacaa aactgtacac atttataaac 60 aaacagtctc tcccatcagt taacacacag agccttctct acaccaaagt ctctttccgt 120 ttgccaccag aaagggcttt gtccctcgct cttcggatgc cgggctgtgt ctggtgtgtc 180 tttaagctct tgctgtcctc tgccatctgc atgccagagc cacatctgta agcgttttca 240 tcaacttcta cctgagtaac actggaaact gtcctcgtgc 280 <210> 367 <211> 176 <212> DNA <213> Homo sapiens <400> 367 acagctcctt tgacctcagt gacaggcact cacctacctg acccccaaac tgaagcctca 60 cttttcccag ccgtgtccac accctctggg ctaccccatt accatgacaa gtattccctc 120 tgctccagga gaaaagccag gtcccagacc tgacccatta aaacccaatc attcca 176 <210> 368 <211> 69 <212> DNA <213> Homo sapiens <400> 368 gaccaggaag tcctataaag aattatattt ctatagaatt aaaaatgcag ttctgtcagc 60 ctggacaac 69 <210> 369 <211> 200 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (55)..(55) <223> n is a, c, g, or t <400> 369 ataagaactt atgggatttc ctacacggag acaaaaaaag atattccttt atgtngttta 60 aaagtggcag ctgctctttc tttattccat tttaatcaat gagtattgat tcaagttttc 120 ctttctattt ttccttatga taagtttctt acagtagctt atacaacaac aaatagcata 180 gaaaaactac tggattcaat 200 <210> 370 <211> 110 <212> DNA <213> Homo sapiens <400> 370 acaggtaacc ttctcactaa gtgggggtgt ctgaggccag ggagagctct actcattccc 60 ctgtgtgatc ccagcagtga gcatagagca ggtgccctgc aatgttaagc 110 <210> 371 <211> 156 <212> DNA <213> Homo sapiens <400> 371 agaaagaata aagcaggatc catagaaata attaggaaaa cgatgaacct gcaggaaagt 60 gaatgatggt ttgttgttct tctttcctaa attagtgatc ccttcaaagg ggctgatctg 120 gccaaagtat tcaataaaac gtaagatttc ttcatt 156 <210> 372 <211> 50 <212> DNA <213> Homo sapiens <400> 372 gattgctgag cagggaagct ttgcatgttg ctctaaggta catttttaaa 50 <210> 373 <211> 64 <212> DNA <213> Homo sapiens <400> 373 caccccatgc actgtacaaa tactgcaaac actatagttg cattcatagg accattaaaa 60 aaaa 64 <210> 374 <211> 95 <212> DNA <213> Homo sapiens <400> 374 ttctgaggga ctgcttctgg agccggccct cttgtgtgat tgaattagtc agtgatggtt 60 ctcaggacta gattagattg ttactcttaa aataa 95 <210> 375 <211> 291 <212> DNA <213> Homo sapiens <400> 375 ggccgcttca gacaaccacc tgaaaaagcc aaagcacaga gacccagaga aagccaaatt 60 ggacaaaagc aagcaaggtc tggacagctt tgacacagga aaaggagcag gagacctgtt 120 gcccaaggta aaagagaagg gttctaacaa cctaaagact ccagaaggga aagtcaaaac 180 taatttggat agaaagtcac tgggctccct ccctaaagtt gaggagacag atatggagga 240 tgaattcgag cagccaacca tgtcttttga atcctacctc agctatgacc a 291 <210> 376 <211> 269 <212> DNA <213> Homo sapiens <400> 376 acaactggaa ttaggatttt ctcctgatga aggaaaaaaa gacattaagt ctgcattata 60 tttttaaacc catgaaaaga ctgaaaccaa ccaaacaaaa gaaaaacttg acttgttatt 120 agaacagtca ttattatttt ttttcttctt caaaactgtt attttaccat gttgtatctt 180 cttcccaaag taatatgcag atgaagcaaa ataactcagc aaagtgtcat ggaccaagcc 240 ctttccatca tttctagcat taaagtgaa 269 <210> 377 <211> 291 <212> DNA <213> Homo sapiens <400> 377 tggatgtgtt gctgttggcc aagaagaatg agaaggagcg aatttgggca gtgggacctc 60 caggcagcct tacagttttc agttggggag tgagatgaga cctggaattt aggggtctgt 120 gtagttaaaa ccatgcggtg tacaagattg cccagattga gtatgtggaa ggtgtgatgg 180 ggaggagaga gagtgttagg aagtgctggg gtcctgccat ctgagaacag gagcccagag 240 gcagcatatg cagcccgaaa ggagagaatc catgctgagg gtcgtgaata c 291 <210> 378 <211> 43 <212> DNA <213> Homo sapiens <400> 378 gagaaacagc tgtcacctcc cgcagaccct aatcctctct cgc 43 <210> 379 <211> 44 <212> DNA <213> Homo sapiens <400> 379 aatattgttg ctgatttcag agggatattc actaataaat gtat 44 <210> 380 <211> 187 <212> DNA <213> Homo sapiens <400> 380 attctgaatc atcactggga gcaaaacaca gactcacaag aggaagggca agagaagggt 60 aaagaacaag agagaccacc tgaggcagtg agcaagtttg caaagcggaa caatgaagaa 120 actgtaatgt cagctagaga caggtacttg gccaggcaga tggcgcgggt taatgcaaag 180 acctata 187 <210> 381 <211> 152 <212> DNA <213> Homo sapiens <400> 381 attgcttgaa ctgggtaact gatttgatgt aaatgccaaa ggagaaggag taaaaggaaa 60 atgacataga gtctgagcta gagtaacagg gacagtatta attaatatta accaaatatc 120 aaataagaac atttaagaga cgagccacca tg 152 <210> 382 <211> 272 <212> DNA <213> Homo sapiens <400> 382 ctgctgtggt gttatttgct taatggacca tttaaggaat tctcgaatac accgaccaca 60 aaaatctctt aaagtactgt caacagggtc cacaattcca tccaatatag cttctagtaa 120 ggcaacagta tcctgacttt caaatttctt gttgttagtg aaccagtgaa tcagctgcat 180 aactagtggc tcatacagtt gccttgtcac ctgatcaaca tcacacgcaa gtcgaagcag 240 cacaggaaac gtccgcttat agagctggta ca 272 <210> 383 <211> 184 <212> DNA <213> Homo sapiens <400> 383 ctgaatttgc ccatccacct gggtcacttt gagagttgtg caggggggct gggagcactg 60 gtgttcacgt gggaccacag gctgcaccat aagacccact cacaataaaa aaataaaagg 120 ccgagccggg catggttgct cactcccgta ataaaaaaat aaaagaacag gctgagccgg 180 gaaa 184 <210> 384 <211> 191 <212> DNA <213> Homo sapiens <400> 384 ccagaaaaag caccccatgc actgtacaaa tactgcaaac actatagttg cattcatagg 60 accattaaaa aaaaagagcc aaattacaaa acaatctata ttttacaaac atttcagttg 120 ggttcttaag ctaaagatat tactgtttac tttggtacga taactagaaa acacaaacat 180 tatgctccag a 191 <210> 385 <211> 278 <212> DNA <213> Homo sapiens <400> 385 tctttgtcct ggtcgtcttg gtaaatgtgt agtcgcgtat ctgagacata gattgtgctt 60 tattcggtgc tgtggagagt agaaactagc agcagtacct ggaaaggggc cctgatctgc 120 gggtgtggat gagtagagac tcttcagttg agatttagct ctagtgaggg ttgggtgcaa 180 caaatgtagg aaagagtgaa gagatgagca gctcatgtct gagtttattc tgtttctgtt 240 actgtgtcac agaccagcct cagatcatag ttcatgat 278 <210> 386 <211> 281 <212> DNA <213> Homo sapiens <400> 386 gctcattgct gactgttttc cttaaaagct gggaaggctg tgggtcaatt cagctcgcca 60 cctgtttctg tactgcccac aagctgagaa tgaattttgt acttttaaat ggttgggggg 120 aggggagaat attttctgac acaagatata tgacattcac acttgagtgt caaagttttt 180 aggaacacag ccacgcccat ttgtttacac tttactcctt ccactttaca atgaagaggt 240 atgaggagct gctacagaaa ccttctggct tgcaaagttt a 281 <210> 387 <211> 94 <212> DNA <213> Homo sapiens <400> 387 attttggaga aaaatacgct agattttaaa tgttagagct gttcccggag acttattgca 60 gaaatagatg agaagcaaat caagactact attc 94 <210> 388 <211> 265 <212> DNA <213> Homo sapiens <400> 388 gctgacagtg agtactgatg gcctggatgt aggggtgaga gaaagagagg gggctaggat 60 gaccctgagg tttgggcctg gacaccagct gaggggtgaa gatactgcat tgagggaccc 120 cagggtcggg gtttgcaggg agtggccaga aggccttgtg aagaatcaga gacgtggctg 180 agtctgttcg gtgctgggtg cccgtcagac agctgcgtga gatggcaagg agacagttgg 240 atacgcatac ctgaagttga gagag 265 <210> 389 <211> 261 <212> DNA <213> Homo sapiens <400> 389 actgcctggc agaacatacc actgaactag tatgtgctag aggagggcac aaacatccgc 60 tccttcccta ggcctgctgg ctctggtttt ctatgcagat gattcattgg attgggggtg 120 agtgttttgt ttttctgggg gcagtgtgag ctttgagggt tggaatattg ggaggcattc 180 cttagtttcc tcaactagcc tggaaagtta ggagtctagg gtaattaccc cccaatgagt 240 ctagcctact attcactgct t 261 <210> 390 <211> 194 <212> DNA <213> Homo sapiens <400> 390 aaagctgtgt ttatatggaa gaaagtaagg tgcttggagt ttacctggct tatttaatat 60 gcttataacc tagttaaaga aaggaaaaga aaacaaaaaa cgaatgaaaa taactgaatt 120 tggaggctgg agtaatcaga ttactgcttt aatcagaaac cctcattgtg tttctaccgg 180 agagagaatg tatt 194 <210> 391 <211> 268 <212> DNA <213> Homo sapiens <400> 391 aaagaacttc tatccagaat gcataaagaa ttaccgctca gcaacaaaaa acaataaaat 60 tagaaatggg caaaaaagaa acttcactaa agataatggg tgtagccaat aagcacaaga 120 aaaagtgctt gacatcatta ttcatcaggg aattgcaaat gtaaactaca gtaagaagcc 180 acggcatacc caccagaatg gctaaaatta aaaagactga caccaccaaa tgttggtaca 240 tatgtagaac aaccaattcc acacatag 268 <210> 392 <211> 262 <212> DNA <213> Homo sapiens <400> 392 ttttatagcg tgtagttgac ccttgaacaa tttgagtgcc aacctcctgt gcagctgaaa 60 ttcatgtata acttttgact ccccaaaaat ttaactacta atagcctatt gttgaccaga 120 agccttacct ataatataaa cagttgattc acacatattt tgcatgttat atatatatta 180 tatacagtat tcttttttct ttgcacatta aaaaaagaca tttattctgc atcatgatca 240 gacttacatt tagcaatcaa ca 262 <210> 393 <211> 203 <212> DNA <213> Homo sapiens <400> 393 gaggtgcatg atattgttag ccaaaaggga gaagacatac agacggttaa tatcgatgcc 60 agaaaagaga tgaccccccg acaagaaggg actgacaatg aggatccagt cgtgtgcctg 120 gacaagaaac cagtgatcat cattttcgat gagcccatgg acatccggtc tgcctataag 180 agactttcaa ctatctttga gga 203 <210> 394 <211> 230 <212> DNA <213> Homo sapiens <400> 394 gaggagtcga acatgatctt gaggactcta ctcttggagg cttaaaggaa tgtgttgtct 60 gtaattgtca cagggaatca ggaaggaaga gccagttagg gtcaagcgtt agaatatgtt 120 aagcttaata ggctttgaca ctcagatgtg cccatcaagc agttaggaat tggattattt 180 tgtttggaag aggtcagaac tagtcaagag atttcatagt ccttggtaaa 230 <210> 395 <211> 235 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (66)..(98) <223> n is a, c, g, or t <400> 395 cagaattcta tgcttctctg gcaacaacaa taactattag aaaatcttaa cctcacccag 60 aagttnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnca gcttacttaa ataattgtgc 120 taaatagctt atcttcacaa tttaaaagta aaaacctttg aaaaagaagg acttcaccaa 180 aaacaaacac actctcccta tagccctgaa gatctggcca gaaaagctcc attaa 235 <210> 396 <211> 283 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (124)..(124) <223> n is a, c, g, or t <400> 396 gataataacc tttaatgaac tcaatactcg ggaaaggctt cacatttctg ggactcagca 60 ttatccaaaa tatctattaa gagccataca ccattctagc tgcaattgat tatacaaaaa 120 aaangaccaa agtggttaca ataataaaat agaacacaga gaaagaagaa aactacatgt 180 gttacaattt ggtaagataa acaaacaaac aacaaaaatt aatcactttt tttggtcctg 240 tgacacacat gataattttt gtcttaattc tcctaacaaa tga 283 <210> 397 <211> 259 <212> DNA <213> Homo sapiens <400> 397 cggcagggtc ctggatcacc aaggaccttg aaagcatgtg gaagactttg atcaatgggg 60 gaatcattaa ggggttttgc attccggaac tatcatcagc ttcagcgggg ggcagggggt 120 aggatagagg cagggaggca ggaagttctc gcagggtcca ggcaagagat ggtggagtgt 180 ggtcctgggg aagggggcag tggacggatc tgagggaggt tcagttagga tgggcaagga 240 ttgagatctg gctggatcc 259 <210> 398 <211> 202 <212> DNA <213> Homo sapiens <400> 398 gggacatccg aaagctacac cacagatgcc agtggttcat gccttcttcc cgcaacttta 60 ggaaaattta tttatttatt gtttattagt tatgggggga gaggggagat ttaaaggacc 120 agggacatgg gaaccaagcc atagggatca gagggccttg tccttgaaca ctactggggt 180 atattcaggc tcatccacgc ag 202 <210> 399 <211> 257 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (90)..(90) <223> n is a, c, g, or t <220> <221> misc_feature <222> (164)..(164) <223> n is a, c, g, or t <400> 399 caggcaagaa aagcgcagag aaatcggtgt ctgacgattt tggaaatgag aacaatctca 60 aaaaaaaaaa aaaaaaaaaa aaaaaaaaan gaaaagagaa aaaaaagact agccagccag 120 gaagatgaat cctagcttct tccattggaa aatttaagac aagntcaaca acaaaacatt 180 tgctctgggg ggcagggaaa acacagatgt gttgcaaagg taggttgaag ggacctctct 240 cttaccagta ccagaaa 257 <210> 400 <211> 91 <212> DNA <213> Homo sapiens <400> 400 agagcaggag agacggcaga gatatgttgc taggtgaata tatatttata taataaatcc 60 gtaagttaat aaagtaaata gtaattctct g 91 <210> 401 <211> 132 <212> DNA <213> Homo sapiens <400> 401 gtatggactg agaggcattt aaattctggc aagggaggtg gaaatgctga caatgaggag 60 gaagcttata gtgggtcaaa caaggaggtg tctagtgtgt tgtttaaaaa gaaggcttac 120 aattagccag gc 132 <210> 402 <211> 158 <212> DNA <213> Homo sapiens <400> 402 tcccaagggt cgctagaaac tcgtcttcgc gttgccccct ttctggctct cagcgccgtc 60 gccactcggg agaggctggg tgaggcccgt gtgaggactg accctggatt cctcgaaact 120 gccattgtga tcattactct gctctttgga aatggctg 158 <210> 403 <211> 271 <212> DNA <213> Homo sapiens <400> 403 gttacatgaa atagtgccag ctggaggttc tttgccagca ccatgccaag tgaaataata 60 tatttactct ctctattata caccagtgtg tgcctgcagc agcctccaca gccacgatgg 120 gtttgtttct gttttcttgg gtggggagca gggacgggcg gagggaggag agcaggtttc 180 agatccttac ttgccgagcc gtttgtttag gtagagaaga caagtccaaa gagtgtgtgg 240 gctttcctgt ttctaaactt tcgctactat a 271 <210> 404 <211> 77 <212> DNA <213> Homo sapiens <400> 404 tgtctgtgcc tcatggaatt gccaatgaag atattgtctc tcaaaacccc ggagaactct 60 cttgtaagcg tggggat 77 <210> 405 <211> 131 <212> DNA <213> Homo sapiens <400> 405 ccctgtgctt tttgccgtcg ggcctctgca cctgggtcca tggggtctgc ggggtctgcg 60 gggtctgcct ggcctgtggg ttctgccggt ggggcttcag gagtaataaa gtgtcaccct 120 atccttgtaa a 131 <210> 406 <211> 226 <212> DNA <213> Homo sapiens <400> 406 ggccatccga aaatagcaac aacccagact ggctcctcac tcccttttcc atcactaaaa 60 atcacagagc agtcagaggg acccagtaag accaaaggag gggaggacag agcatgaaaa 120 ccaaaatcca tgcaaatgaa atgtaattgg cacgaccctc acccccaaat cttacatctc 180 aattcccatc ctaaaaagca ctcatacttt atgcatcccc gcagct 226 <210> 407 <211> 171 <212> DNA <213> Homo sapiens <400> 407 gatatttgtc tatgaacagt agcacagacc ctctaattcc atagggaatc atttccatga 60 cttcccccaa ataccctact cttctctatc tctgtgacag tctctggccc tgctccctcc 120 taaactgctc aaaatcctta ccaaaatggc ttacaaatct ctctcctccg g 171 <210> 408 <211> 266 <212> DNA <213> Homo sapiens <400> 408 ccctgtggat cccaaccagg aagttcctcc tgggccacct cggttccagc aagttcctac 60 ggatgccctg gccaacaagt tgtttggtgc tcctgagccc tccaccatcg cccgctctct 120 accaaccact gtcccagagt caccaaacta ccgcaacacc aggacccctc gcactccccg 180 gacaccacag ctcaaagact caagccagac atcacggttt tacccagtgg tgaaagaagg 240 acggacactg gatgccaaga tgcctc 266 <210> 409 <211> 300 <212> DNA <213> Homo sapiens <400> 409 tatagttctg ttgtaggcta cacatgaaca gcaaccaaaa agaggaaaaa tcttctttgt 60 ccccatgctt tttccttgaa ttctgcactt ttcatattaa cattagccct tgctttgtga 120 tttgcctttg ctttatttta ccctgtctta atcttaacct tcccaaatat ttccatacag 180 ggtgcacctc tcctagacaa cacacagcgg agagtgtgct tcccatgtat tcaatcttcg 240 tctcttgaaa ggagaggtgc cctcattaca cttcactgtg acacaggata cccttggttt 300 <210> 410 <211> 67 <212> DNA <213> Homo sapiens <400> 410 atggaaaaga acacgatgag aattagacac tggaaaatat gtatgtgtgg ttaataaagt 60 gctttaa 67 <210> 411 <211> 274 <212> DNA <213> Homo sapiens <400> 411 tcaggttgtg aggtttatta gtccccaagg caaacacaaa tattagatta ataatccaac 60 tttaatagta tacatttaaa agaaaaaaaa caaaagccct ggaagttgag gccaagcctg 120 ctgagtattg cagctgcatt tgcccaaagg gaatccagaa caagtccctc cctgtatttt 180 gttcttgaga ggggtcagtc tagaagctag atcctatcag gatgaggagc agcagcccag 240 ggcttgtctg gatcagcacc aacgatttta aaga 274 <210> 412 <211> 265 <212> DNA <213> Homo sapiens <400> 412 gtggtgttct tgatgtagtg agctcaagtc tgcggctgtt tctggggacg tggtggaggc 60 tgcatgttct gttctctcca ggaagagcta gtggttttct accctgtgtg ttggtgagca 120 atgtgcagag gcagagccgc tgaagtatgg ttcctgaggg gtggcgaagc accgccctca 180 ctccaggtca cctcatcagc cctcgttttt ttttgggccc caccttgggg cttgccaaac 240 tgagaggcat tcaaaaccat ggcac 265 <210> 413 <211> 120 <212> DNA <213> Homo sapiens <400> 413 aggacgcggg ctctcgctgg cccgagctct acctctactc gagggctgac gaagtagtcc 60 tggccagaga catagaacgc atggtggagg cacgcctggc acgccgggtc ctggcgcgtt 120 <210> 414 <211> 102 <212> DNA <213> Homo sapiens <400> 414 gaagcatttg gaggaattcc tagacattgc gttttctgtg ttgccaaaat cccttccgac 60 atttctcaga catctcccaa gttcccatca cgtcagattt gg 102 <210> 415 <211> 281 <212> DNA <213> Homo sapiens <400> 415 atgtctccag attccaggtg caggttctta gcacctccgc agccgctctc tcttgagtcc 60 atcctcagtc tctcctaccc cttgaagtag ggggaccctg aatttgccca tccacctggg 120 tcactttgag agttgtgcag gggggctggg agcactggtg ttcacgtggg accacaggct 180 gcaccataag acccactcac aataaaaaaa taaaaggccg agccgggcat ggttgctcac 240 tcccgtaata aaaaaataaa agaacaggct gagccgggaa a 281 <210> 416 <211> 265 <212> DNA <213> Homo sapiens <400> 416 tgtgattgtc agcaatgacc atgctgggaa actgtgtggg gcctgtggaa actttgacgg 60 ggaccagacc aatgattggc atgactccca ggagaagcca gcgatggaga aatggagagc 120 gcaggacttc tccccatgtt atggctgatc agtcatccac caggaacgaa gatttcctga 180 agaagacctg gtccctctgg aggttgcggt ggctgaagga tgcatcatgt gctcctaccc 240 tgctctaccg cttttctggg tcaca 265 <210> 417 <211> 203 <212> DNA <213> Homo sapiens <400> 417 acattggaaa gttaagagag ttcgagggaa gaattataaa gactaggagt cctagaaaga 60 gaaaatttag agaataaaag gagaggcagt acttgaaaga taacacaatt tttacaaatt 120 tgttggaaaa acatgaattc ataaattcag gaagcacaat atatacccaa catatattta 180 aataaaatcc aggcctagac tca 203 <210> 418 <211> 274 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (108)..(118) <223> n is a, c, g, or t <400> 418 ttcccccttt gaatgaggtc ttccatgttt gagggaaagt cttgcactat tgcatatatt 60 ttggggacac agattttcat agtttccatt tttggggggc ttaaggannn nnnnnnnnct 120 gtttgaaaca gttttatact ttctgatata gtacttgaaa ttcttaccag aaaattactt 180 tggagttttg aagcctttat taatactact tttaaagaag cagttgtttt attgtcaatg 240 ttttttttcc cccacgcata ttttcttgta tttc 274 <210> 419 <211> 71 <212> DNA <213> Homo sapiens <400> 419 tgagatggtt tgatggtttg ctgcattaaa ggtatttggg caaacaaaat tggagggcaa 60 gtgactgcag t 71 <210> 420 <211> 269 <212> DNA <213> Homo sapiens <400> 420 tactaacttt cctgcactaa accaccaagt ctgtctcctc tgcaatgtgt agttcctgat 60 ggctccggtt tttcccccca cctttttatt ttgaagcctg acttgcagga gatacccctc 120 taactgtata gcttcctact ccattaaaga ttagtcagag atggtaatca acccacctga 180 gctctttcac tacctgctgc tgcaactatg gtcaggataa ggggagcaca ctcacacttc 240 aggccttcac gtctgttcca gttactttt 269 <210> 421 <211> 47 <212> DNA <213> Homo sapiens <400> 421 ctttgaacca ctttgcaatt gtagattccc aacaataaaa ttgaaga 47 <210> 422 <211> 149 <212> DNA <213> Homo sapiens <400> 422 ggactaggaa gggctattcc aggctcagcc ctgctcctgc agctttgccg ctgagtgtag 60 gaaaaacagg catgacagac cagggtgagg gttgtgccca gctgggccac ggccatgcgt 120 ggggtggccc aataaacacc gtggactcc 149 <210> 423 <211> 185 <212> DNA <213> Homo sapiens <400> 423 tttctctttc tgtccggtgt ccggactttc ctaattggag tttgaggccc ctaagctggc 60 atcaacccca ggccacgctc gctctttcct tccctcccct ccccctctgc cttttgtacg 120 ccagttctca gaaataaaga tcttttgtcc gtttttttaa cctcggattc tgtaattggt 180 tctta 185 <210> 424 <211> 105 <212> DNA <213> Homo sapiens <400> 424 ccacaggtaa ccttctcact aagtgggggt gtctgaggcc agggagagct ctactcattc 60 ccctgtgtga tcccagcagt gagcatagag caggtgccct gcaat 105 <210> 425 <211> 122 <212> DNA <213> Homo sapiens <400> 425 cccccatgcc ctgtggagat ggaggtgtgt gctgatccct cgtgcccctg tggagataga 60 ggtgtgtact gatcccctgt tcccctatct agatgaaggt gtgtactgct gatcccccgt 120 cc 122 <210> 426 <211> 255 <212> DNA <213> Homo sapiens <400> 426 tttttgacag tgttgaaaat gttcagaagg ttgctctaga ttgagagaag agacaaacac 60 ctcccaggag acagttcaag aaagcttcaa actgcatgat tcatgccaat tagcaattga 120 ctgtcactgt tccttgtcac tggtagacca aaataaaacc agctctactg gtcttgtgga 180 attgggagct tgggaatgga tcctggagga tgcccaatta gggcctagcc ttaatcagtc 240 ctcagagatt tcttc 255 <210> 427 <211> 236 <212> DNA <213> Homo sapiens <400> 427 cccactctgt gtagtcttaa cttatttctt ctaaactcac cattaaccta aataatagtc 60 aaatttaggg gggctgtatt tgtcttactc gagtcttcta ccatagttga aactgtcgta 120 cccaaacgag ttacagagaa atgccacact ttgagacgaa ttcaggagtc ctttattagc 180 tggtgactga gagacggcta acacaggaaa tactctcggc cctaaagaat gggcta 236 <210> 428 <211> 275 <212> DNA <213> Homo sapiens <400> 428 gaagacgcca atgatggctg aagagttttt cccagattta caagccactg gagacccctt 60 ttttctgata caatgcacga ttctctgcgc gcaaggaccc tcgactcacc cccatgtttc 120 agtgtcacag agacattctt tgataaggaa atggcacaaa cataaaggga aaggctgcta 180 attttctttg gcagattgta ttggccagca ggaaagcaag ctctccagag aatgccccca 240 gttaaatacc tcctctacct ttacctaagt tgctc 275 <210> 429 <211> 223 <212> DNA <213> Homo sapiens <400> 429 tgatctggtc agtagtggaa ttcgatttta tgcagactgg atgtaatatt tgtaatccct 60 gtgcaatttt gtgacgtgcg gttctaattc atgtgcagtg atatagtata gataaaagaa 120 tgagtaaaag aaaatacaag aattctaaag aaagttggtt ttagcccctt tgatagtcca 180 tggttaagac atcctttata aaccaaagat ggccagcaca ctg 223 <210> 430 <211> 273 <212> DNA <213> Homo sapiens <400> 430 cagaagaggg ctcaacttag ccaatatttt gatgctgtca agaatgctca gcatgtggaa 60 gtggagagta ttcctttgcc agatatgcca catgctcctt ccaacatttt gatccaggac 120 attccacttc ctgggtgccc agccaccctc tatcctaaag aaaacctcag cctatggacc 180 tcccaactcg ggccagtttc tatccttccc tccttccttg gacatggggg tttccaccgt 240 ttgcccccct ggcagaaaaa cctccctggg cct 273 <210> 431 <211> 112 <212> DNA <213> Homo sapiens <400> 431 gagtccaaga gaatggccga gttcatgagc tgcacacgat gtaagttgta ctctctgaaa 60 ttgttggtcc acctttcatc ttcatcaaat gagcatcccc tccaatacct gg 112 <210> 432 <211> 262 <212> DNA <213> Homo sapiens <400> 432 gagtcacgaa ccttattctc caaaacaaaa gcaacaagga ctttgacttc tcagcagcac 60 tcagctctgg ttcttgaaac acccccgtta cttgctattc ctcctacctc ataacaatct 120 ccttcccagc ctctactgct gccttctctg agttcttccc agggtcctag gctcagatgt 180 agtgtagctc aaccctgcta cacaaagaat cttctgaaag cctgtaaaaa tgtccatgca 240 tgttctgtga gtgatctacc aa 262 <210> 433 <211> 152 <212> DNA <213> Homo sapiens <400> 433 ccggggtagc cattggttct tggatctgtg ttagaatgag tgctttccct tcctactgat 60 gtgattgtgg attaggaatt cgtgaccgag tgatttttgg ccagtggttg ggtttaaaat 120 tctattaaaa tttgtagttt gggctgggtg ct 152 <210> 434 <211> 99 <212> DNA <213> Homo sapiens <400> 434 gtggaggccc attaccgggc ctgcttgtat gctggagtca agattgcggg gactaatgcc 60 gaggtcatgc ctgcccagtg ggaatttcag attggacct 99 <210> 435 <211> 207 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (115)..(115) <223> n is a, c, g, or t <400> 435 ttcatttttc ttcccctctg ctagtttgga agttatatta taccaagttt tttagtatta 60 gcctagaaat cttaacataa agacttctaa taagcaatat ctttaatttt ttttncctac 120 ccaatactag atcatgagca ttttcccaca tcataaagaa ttggtcacaa gtcagcccca 180 aacatagtcc agtggaatcc aatgata 207 <210> 436 <211> 231 <212> DNA <213> Homo sapiens <400> 436 aaggcaacac ttctgtcagt agaattgctt tggattgtaa atatgtttac ttcagaggaa 60 atcagtcaga gtggatggct cagcaaaacc catcacaact gcggaaaaag gaagtgactg 120 gctagaggta aggaaataga ttttctctaa gttaactggc ctacgtgtga atcgaaccct 180 gcaccctggc ctcattagca ccaacactgt gaagaacagc tgtggcagag a 231 <210> 437 <211> 133 <212> DNA <213> Homo sapiens <400> 437 ttcacccctc tacttacata ttgtaaagtt gtataaatct atcattgaaa ggtcccctct 60 gccagcagtg gtgccaccct ttggtttgct gtggtacttt gctgtgtact ccgtggcatc 120 atgttactgt gta 133 <210> 438 <211> 66 <212> DNA <213> Homo sapiens <400> 438 tttctctttc tgtccggtgt ccggactttc ctaattggag tttgaggccc ctaagctggc 60 atcaac 66 <210> 439 <211> 233 <212> DNA <213> Homo sapiens <400> 439 tacaaagagt accacgagac acgagaaacc ttgtgggaac acagggggac caccccctaa 60 ggctaaatac tacttggtga ccgatagcga acaagtaccg tgagggaaag gtgaaaagaa 120 ccccgagagg ggagtgaaaa agaatctgaa acctagtgtt tacaagcagc gaaaatggca 180 caagccatga atcgtgtact ttttgtagaa cgggccagcg agttatgaca aaa 233 <210> 440 <211> 260 <212> DNA <213> Homo sapiens <400> 440 tctcttccga ggtcgaggcc ctgaggcggc agttactcca ggaacaggaa agtgtcaaac 60 aagctcactt gaggaatgag catttccaga aggcgataga agataaaagc agaagcttaa 120 gtgaaagcaa aatacgaaat tgagaggctg cagtctctca cagagaacct gaccaaggag 180 cacttgatgt tagaagaaga actgcggaac ctgaggctgg agtacgatga cctgaggaga 240 gacgaaacga gccccacagc 260 <210> 441 <211> 270 <212> DNA <213> Homo sapiens <400> 441 catagccaag gcttcaagct ctcaggactt ggctatggag gaggacgaag aaggcaggag 60 ctcatccagt ccagccttac ctacagcagg aaactgcacc agctagactc cattctggga 120 ccatctccag gagtccatga gaggctttct tctcctatgt cccaattctc agaactcaga 180 tgtggctaga ccaacccctg ggaaactgcc ccagcttctc ccaccatagg ggccggaccc 240 ccatcaccag cctagatcca gggctgcctc 270 <210> 442 <211> 156 <212> DNA <213> Homo sapiens <400> 442 aacttgtgcg cgcagcccaa actaacctca cgtgaagtga cggactgttc tatgactgca 60 aagatggaaa cgaccttcta tgacgatgcc ctcaacgcct cgttcctccc gtccgagagc 120 ggaccttatg gctacagtaa ccccaagatc ctgaaa 156 <210> 443 <211> 103 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (48)..(48) <223> n is a, c, g, or t <400> 443 gttttgagat catacactgt tacagagaaa gagaggaggc atattatnaa cgtgtggact 60 tcagtgttat tccttctctt caaaatgatg ttccaggtgt cta 103 <210> 444 <211> 101 <212> DNA <213> Homo sapiens <400> 444 ctcggcggcc tttatttatt ctgttccccc agctcggcca cttctctgaa ggagggctgg 60 gttctgggcc tgtatcgaat aaacacaaac ctggatggcg c 101 <210> 445 <211> 144 <212> DNA <213> Homo sapiens <400> 445 ggaggatggt caggcgtcac caacaacccc atcacccagt aacaagaacc ttgactctcg 60 tcagtccctc tgcatcaaga cacttaccca tttcccacct catgcctgct aacttgaatg 120 aaacaatcgc tgggaaagca ttaa 144 <210> 446 <211> 276 <212> DNA <213> Homo sapiens <400> 446 atgtgagagt gctttgcagt tggaaagtgc tgtaggaacc ctgaattcat ctgaaactgt 60 agcttagtgt ttaaatgatg tctgttatta cttttttgaa tagtctggag tgcttgttaa 120 agaaaaaatt attctgtgat atttgttgaa tgaagcacag tgaggaagac tttactcagg 180 gcccttgtaa tagctatagg gaccactgca atagggtctt gcagtggggg agagagaata 240 ggctcaattc tgaatacatc atcatgggca agtggg 276 <210> 447 <211> 48 <212> DNA <213> Homo sapiens <400> 447 tctaaagctg tttttaactc cgagattaca acttagagga accaagga 48 <210> 448 <211> 168 <212> DNA <213> Homo sapiens <400> 448 aaattgaagg atttgctgtt attcctacct gcattggact tgacctgggt gttgggtgag 60 tagcaatctg ttactgtttc tctatgtgga cgatgaggaa agggttgaga aatccagcga 120 aaggacactt ctgttaatag ctcaatctgc tgcccatggt tgggaaaa 168 <210> 449 <211> 147 <212> DNA <213> Homo sapiens <400> 449 tttttctgta tgaaacccag atgtcaccaa atggacatta atagttgcat taaggatcag 60 tagcattaac aaaagttgct ttaaaagcca ttatgtaaat caagacttga aaatgagtga 120 gggaatttta gcgacactgt ctgagca 147 <210> 450 <211> 272 <212> DNA <213> Homo sapiens <400> 450 tgaattccca actttccgag atgttgttta atgagactca cccttatttt tcaattcttc 60 cttcattctc tccctcttaa ctggtttcct cttacccaag aaaagccttt ctcttaactg 120 caagcttatt tgaattttac cttattgaat atctttcaac tatttggcag acctttaact 180 ttccctacca tgccaatggt cactaaacac cttaaatgcc actcttaaca ccttaaatgc 240 cacccttaac agtattcttt cagtcctcat tc 272 <210> 451 <211> 267 <212> DNA <213> Homo sapiens <400> 451 tgtccagcaa gtgcagggtg cctgcacttc accctgtgca gagaggtggg atggggccgt 60 gcacacaggg atgcccgctc cacatcctgc ctgcccctca gccctggccc aggccccttt 120 tggaggcagc tgaggaagga tgctggggaa agccctcttc tgcagctttg tggaaggctg 180 atcagtggct gctgggtggc gggtaccctt gctcagatgc ctggcagggc tgggtggcga 240 ttcataaaga cctcgtgttg attcccc 267 <210> 452 <211> 138 <212> DNA <213> Homo sapiens <400> 452 caggagagaa gaggccccgg catggggatc tgggttctag agggcatgtg atgactgtaa 60 atgttcactg ggtgggtagg gagtggtatc cagtgttcaa gtgcagaaat ctttggcttt 120 gctaccagtt ccatatga 138 <210> 453 <211> 176 <212> DNA <213> Homo sapiens <400> 453 ggttaatctt tgttactagc cctcactact cagaattggt gagacctctc catttctgct 60 tcactcagct tacgtggttt gctcacactg acaccaacaa acacctgtca atccctatgt 120 ccctcctgtc ttccaaaaat acctagaaat tgctgctcta ttgacggtag tatttc 176 <210> 454 <211> 256 <212> DNA <213> Homo sapiens <400> 454 gctctaaaag ttatgaacct gacattcttg gtcttacaca atctggaccc agtctactct 60 tctataacca tcttccactt aatttacaaa tctttattaa ggcacaggta ctcctactta 120 tcccctattg cctctctcat gctgaatcaa tcatgccaaa agctaagaaa acatgagcat 180 gcttgggact aaagaaacag aactgaggat ttcctacaca tcctaactgc aaggacagtc 240 catcaaaagc cagaga 256 <210> 455 <211> 101 <212> DNA <213> Homo sapiens <400> 455 ggaagcttta gctaccaatc cagtaccctc ctaactagaa tgtatacaca tcagccagga 60 ctgactgact acttcattag agatatactg tactcattgg g 101 <210> 456 <211> 230 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (131)..(131) <223> n is a, c, g, or t <400> 456 tacctgtggt tccaggtacc tggagggctg acgtaggagg attgcctgag cccagcaggc 60 caaagctaca gtgagctgtg attgtgccac tgcactccag cctgggcgag gagagcaaga 120 ctctgtctca naaataaata cataaaatac agcgtccaaa agtgtgtcat cttctttctc 180 ttcacaattt tataataagg gggtaaaatg cctgtgagtc tattcattat 230 <210> 457 <211> 38 <212> DNA <213> Homo sapiens <400> 457 ctttggacta aagaatatat tgggcgaaga atagaggg 38 <210> 458 <211> 154 <212> DNA <213> Homo sapiens <400> 458 ttctgctttt cctgttccct atccttacgc aggattgttt tactgttagc caggttaagt 60 ttaagcttct tgaggacttt agtactgaaa gacaatggct cacttgtaag acctagttga 120 agagtacaga tttagatttg ttcagtgtgc tgtg 154 <210> 459 <211> 156 <212> DNA <213> Homo sapiens <400> 459 aacatatgtg tagtgtgctg cagcataaga tggaagaact taaagaaggc ctgcggcaaa 60 gagatgagct tattgagaaa catggcttag ttataatccc cgatggcact cccaatggtg 120 atgtcagtca tgaaccagtg gctggagcca tcactg 156 <210> 460 <211> 267 <212> DNA <213> Homo sapiens <400> 460 aagcttttag agaatacact acaccaggga gtatgactac tagtatgact attaggaggg 60 taataccaag agttggacta cgcaccttag gcaagataca aaccaactaa aatagaataa 120 agaatgagtc agatgagtgt agccatttta accaagcagc acatttgtta atttctacaa 180 cttagtctca gcgataccca ttgtatttag ccatgttcaa caacaagtgt cagaaactgc 240 acagactcct ccctgttcag ctggtag 267 <210> 461 <211> 143 <212> DNA <213> Homo sapiens <400> 461 ctttgtccgc tgtcatgatt cgccacgtgc cttcttctgt cctctcacgg ctaggcctcc 60 agtgaaaggt agacagtaag cctgggcatt cagtcttctg aatttctcac atcaattcca 120 gggaaaatcc aaccactcca aca 143 <210> 462 <211> 270 <212> DNA <213> Homo sapiens <400> 462 atccagcaag gaatagtgca gcacctaggg actagcaatg ataggaagtt gcaccatatt 60 tggcccagca agggcaaagg gagagagtag ttgtgggagt ccagagagac cctggttgtt 120 gcttctcatt tattgaaccc gatttaaagc cagagaacaa agagcccagt ttatgtagta 180 catgacgcag cctcctaggc acagggtaaa ggatggagaa tagatctgga ggattaaata 240 gtaacaacaa cgcgcgagat cctctaagtc 270 <210> 463 <211> 88 <212> DNA <213> Homo sapiens <400> 463 ttgagaacag aaatagtggc attgcatgcc cagcaagatc gggcccttac ccagacagac 60 aggaagatcg aaactgaggt tgctggcc 88 <210> 464 <211> 102 <212> DNA <213> Homo sapiens <400> 464 tatttcttat gctgtcagat tacatttttc ctttgagtgc tttgggtgca gccgtggaat 60 cctgatgtaa aagcataggt tcttgcatta ctgagtaaac at 102 <210> 465 <211> 221 <212> DNA <213> Homo sapiens <400> 465 gcagatggca agtgcaccaa ggagaaggca ggaacactgg agcctgcaat aagggaggag 60 aggggactgg agagtgtggg gaatgggaag aagtagttta ctttggacta aagaatatat 120 tgggcgaaga atagaggggg agcttgcagg aaccagcaat gagaaggcca ggaaaagaaa 180 gagctgaaaa tggagaaaac cagagttaga actgttggat a 221 <210> 466 <211> 281 <212> DNA <213> Homo sapiens <400> 466 cacccttctt gaccacaaaa aggtggccat cctgactggt ctctaccttc aggaaaacaa 60 atggggacct gagggcgctc aaccacccca gaccacccag aagtcacagg agcacggaac 120 aggaagcagg gagacagcac acagtaagca catggcaagc acacagtaaa cacacggcaa 180 gtacatggca aatacacagc aggtacacag cgagcacaca gtaagcacac ggtaaacact 240 cagcaagtac atggcaaatg cacagcaggt acacagcgag c 281 <210> 467 <211> 133 <212> DNA <213> Homo sapiens <400> 467 cccgggccag gcaaggtggg tcacacctgt aatcccagca ctttggggaa caaggtggga 60 gaatcacttg agtccggcag tttgagacca gcctggccaa cataatgaga ccgcatcttc 120 acaaaaaata tgt 133 <210> 468 <211> 62 <212> DNA <213> Homo sapiens <400> 468 agctcggcca cttctctgaa ggagggctgg gttctgggcc tgtatcgaat aaacacaaac 60 ct 62 <210> 469 <211> 266 <212> DNA <213> Homo sapiens <400> 469 acttcaggaa caggagcaac tactaaaaga gggatttcaa aaagaaagca gaataatgaa 60 aaatgagata caggatctcc agacgaaaat gagacgacga aaggcatgta ccataagcta 120 aagaccagag ccttcctgtc acccctaacc aaggcataat tgaaacaatt ttagaatttg 180 gaacaagcgt cactacattt gataataatt agatcttgca tcataacacc aaaagtttat 240 aaaggcatgt ggtacaatga tcaaaa 266 <210> 470 <211> 147 <212> DNA <213> Homo sapiens <400> 470 gcccagcctg gatatttaaa ttgttctgtg ctctcctcct tttttttctc tctgtgattc 60 tctttgtcag ctcctttgcc tatatttgca tctcagttga cacccctgat tctgacttgt 120 ccttatcttc ctaccagtct ctgccga 147 <210> 471 <211> 187 <212> DNA <213> Homo sapiens <400> 471 gtaggagtgc tcatggttct gtcattcttg gacctctcct ggctgagctc tgattccctg 60 tgagcacgat gctgatgcaa tagtcctgtg tcatcactgc agcggtcctc aggagctgcc 120 agggccaatt gctacagagt gtctgggtgt gtggcatagg aggaaggttt gcttgtgaaa 180 tgaggct 187 <210> 472 <211> 235 <212> DNA <213> Homo sapiens <400> 472 atctacgcca ctcgctctgg tgggaccctc gtgcttgtgg ggctgggctc tgagatgacc 60 accgtacccc tactgcatgc agccatccgg gaggtggata tcaagggcgt gtttcgatac 120 tgcaacacgt ggccagtggc gatttcgatg cttgcgtcca agtctgtgaa tgtaaaaccc 180 ctcgtcaccc ataggtttcc tctggagaaa gctctggagg cctttgaaac attta 235 <210> 473 <211> 177 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (59)..(71) <223> n is a, c, g, or t <400> 473 gaagtaagcc tcatcatcag agcctttcct caaaactgga gtcccaaatg tcatcaggnn 60 nnnnnnnnnn ncagccacta agaacccctc tgcttttaac tctagaattt gggcttggac 120 cagatctaac atcttgaata ctctgccctc tagagccttc agccttaatg gaaggtt 177 <210> 474 <211> 34 <212> DNA <213> Homo sapiens <400> 474 taaagcgtgg ccgtggctcg cgtgcctgcc atct 34 <210> 475 <211> 268 <212> DNA <213> Homo sapiens <400> 475 aagtcctcct caggcttgga gaacttcctc agcgtcacct ccttcattga gccttctctg 60 atcactccat ccctctccta cccctccctc ccccaaccct caatgtataa attgcttctt 120 gatgcttagc attcacaatt tttgattgat cgttatttgt gtgtgtgtgt ccgatctcac 180 aagtatattg taaacccttc ggtgggtggg ggccatatcc tagacctctc tgtatccccc 240 agactatctg taacagtgcc aggcacac 268 <210> 476 <211> 244 <212> DNA <213> Homo sapiens <400> 476 tcactgtaag gtacagttag ggtaacactt tagaggttta ttatttttaa aaaacttttc 60 ttgaactcct ggccagcatg gtgaaacccc gtctctacta aaaataccaa aattagccag 120 gcgtgatggt gggtgcctgt gatctcagct acttgggagg ctgaagcagg agaactgcct 180 gaacccagga ggcggaggtt gcagtgagtc gagatcgtgc tactactgcc tgggtggcaa 240 gggt 244 <210> 477 <211> 57 <212> DNA <213> Homo sapiens <400> 477 tgccattttc caagaatgac ggtggtggct tttagtcaga aaatggcctt ctgtgct 57 <210> 478 <211> 153 <212> DNA <213> Homo sapiens <400> 478 ggagagaagc agaatattcg gacaaacacg gacagtatct catcggacat ggtactaagg 60 tctacatcga ccccttcact tatgaagacc ctaatgaggc tgtgagggaa tttgcaaaag 120 agatcgatgt ctcctacgtc aagattgaag agg 153 <210> 479 <211> 247 <212> DNA <213> Homo sapiens <400> 479 agctgcccct ttcccgtcct gggcaccccg agtctccccc gaccccgggt cccaggtatg 60 ctcccacctc cacctgcccc actcaccacc tctgctagtt ccagacacct ccacgcccac 120 ctggtcctct cccatcgccc acaaaagggg gggcacgagg gacgagctta gctgagctgg 180 gaggagcagg gtgagggtgg gcgacccagg attccccctc cccttcccaa ataaagatga 240 gggtact 247 <210> 480 <211> 154 <212> DNA <213> Homo sapiens <400> 480 agcggagcaa gtgtcccggg ccttcagcca gccctggata gctacttcca tcccccgggg 60 actcccgcgc cgggacgcgg ggtgggacca ggtgcgggac ctggggcggg cgacgggact 120 taaataaagg cagacgctgt tttctaccca aaaa 154 <210> 481 <211> 292 <212> DNA <213> Homo sapiens <400> 481 agatgtgcac aaacagagcc cccgcgtaca ggtccagctg cggagggaga gagccttgtg 60 tggggctgtt attcccaggg ctccagcaag ccactccctg ggtgacctcc ggcaaggccc 120 tctctgggcc tcggtggcct gtggataagg aggggagacc cccactcgcc tgcctgcctg 180 catcacgggg ccattgtgag gttgggggaa gacctggccg tggagctaca agcttgtgcg 240 gatgtcaggg gacattactg ttgctaataa agtccaaagt ggccaatgcc tt 292 <210> 482 <211> 248 <212> DNA <213> Homo sapiens <400> 482 cggtgaactt ctggatcccg tttctgatgc agattcttgt cttgttctcc acttgtgctg 60 ttagaactca ctggcccagt ggtgttctac ctcctacccc acccaccccc tgcctgtccc 120 caaattgaag atccttcctt gcctgtggct tgatgcgggg cgggtaaagg gtattttaac 180 ttaggggtag ttcctgctgt gagtggttac agctgatcct cgggaagaac aaagctaaag 240 ctgccttt 248 <210> 483 <211> 271 <212> DNA <213> Homo sapiens <400> 483 gcgatgaacc caacctccct gaagccaaaa cttcccaccc tgccgcacac tccggaccac 60 cccacttgcc accaagcaca tcctctccaa atccaaccct tatttgcgac ccttcagtga 120 tgacccagca gacctccaaa aagcctcctc tgcccagatc tccagccggg tctggggctg 180 ggttgcggag gggagggtct gggagtccac acttctccac caacttccct tcccactctc 240 ttattccaca ttgcagtgtt tggaataaac c 271 <210> 484 <211> 37 <212> DNA <213> Homo sapiens <400> 484 tgtcctgggc accgtagcga gactctgctt tctacaa 37 <210> 485 <211> 110 <212> DNA <213> Homo sapiens <400> 485 gcaggcagta agaagcaggg atttcttcaa atgctagtaa gcacaaagag agggagaagt 60 ttttgtaagt aacgaacagg gccgggcatg gtggcgtgag aggccgaggt 110 <210> 486 <211> 238 <212> DNA <213> Homo sapiens <400> 486 gagcaccaga tcctatagag cctttagacc atcgtagaga ctttgctttt ctctgagtgc 60 tttggtaggg atttgaggaa aggagtgaca tcgtatgaat gactttatta tgtgcccacg 120 tggaggtgtc aaataggcag ctattgtgtt gcaggtcccc aggttcattg attcactaag 180 aggactcaaa agactcagca cgtagtccta ctcacagctg tgatttatta tcgcacaa 238 <210> 487 <211> 226 <212> DNA <213> Homo sapiens <400> 487 cagattcttt tttatggtgg ctttgcttgt tttaaatttt tgcatgactt ttcatctttt 60 tatgtgtgtt tcctgtagtt tgatccgaag gaaaagagta tagtagcctg agaatcagga 120 gatgggagtt ttagtcgtag gccttatgat aattaccccg cggtggtgtg tagaaaagta 180 tgtaaatttg ctctgtttta agactttgaa ctacctcaag aagagg 226 <210> 488 <211> 271 <212> DNA <213> Homo sapiens <400> 488 gtgggagaag ttggcgtcct aggctgggga ttggtcgggg gaccttaaag aaaaaggcca 60 gggctgaggg tcctgaggag agagagagag gccacgtgga tggaggactg tcaccccctt 120 ctcggttctg tcaccccctt gagtctaact cactgttgag gggaggaaga agggggatgg 180 acggaaggga gaccgaggaa aggctttcgg gagtggggac attatccacc cagaggtgtg 240 ctacccacaa ccaccgcgag atccttagag t 271 <210> 489 <211> 109 <212> DNA <213> Homo sapiens <400> 489 ctgtgctctg gaaaggctac caaatactgg ccaaggtcag gaggagcaaa aatgagccag 60 caccagcgcc ttggctttgt gttagcattt cctcctgaag tgttctgtt 109 <210> 490 <211> 134 <212> DNA <213> Homo sapiens <400> 490 gctacagctg gcgaacccca aagagttcta ccacgaggtg cacaggccct ctcacttcct 60 caactttgct ctcctgcagg agggggaggt ttactctgcg gatcgggagg acctgtatgc 120 ctgaccgttt ccct 134 <210> 491 <211> 74 <212> DNA <213> Homo sapiens <400> 491 gggaagccaa atataggcca agagcagcct gtggatgatg ctgcagaagt ccctcagagg 60 gaaccagaga agga 74 <210> 492 <211> 201 <212> DNA <213> Homo sapiens <400> 492 tacatccctt caccaggtgg tgccatgtct cccagctact cgccaacgtc acctgcctac 60 gagccccgct ctcctggggg ctacacaccc cagagtccct cttattcccc cacttcaccc 120 tcctactccc ctacctctcc atcctattct ccaaccagtc ccaactatag tcccacatca 180 cccagctatt cgccaacgtc a 201 <210> 493 <211> 253 <212> DNA <213> Homo sapiens <400> 493 gaagaggatt cagggtcagc ctaggggacc ctggctccct ccgataggca ggaaggagga 60 gggatgcgga ggagaggctg agccttccac gggcctcctg ttaggggtgt tggtggaggc 120 caggttgggg agggaagcct aaggaccctc cacacctccc acagccagag tcagttgagg 180 ctgggacaaa ggggaaggag agagggaagg aggaccgcct gaccttgccc agaaggagct 240 tcctctaaac tgc 253 <210> 494 <211> 43 <212> DNA <213> Homo sapiens <400> 494 gtaaaggagt gggtgatttg caaataaagc acattataca caa 43 <210> 495 <211> 250 <212> DNA <213> Homo sapiens <400> 495 tgctgctcct cataataagc cgccactgtc tccaggtagc cctctttgaa gtcgtcctcc 60 agctctgcca ggctcgacat cacctgtcca cgtcctgatt ctgcattttg cattttatca 120 taaaatcttt ctatggcctg gtgcattcgg gccttcagct tcttcatgtc atcagagagg 180 accttcggga agcacatggc ggccaaaagt tcaaggagcc aaggcctgag atgacccagc 240 tccaaaggga 250 <210> 496 <211> 262 <212> DNA <213> Homo sapiens <400> 496 tccccaacaa cacaacgcgt cctgttccac ctacgtagga tctgtgaaac aggctcagtg 60 cctttgaggg aggagggaac gtttagattg agaccacccc actcccgggt gattaaataa 120 atatgtctct cccccacccc acgcaggatt ggaaaaagtt aattgtggtt tcagaaaagt 180 taacccctgc gttgcttcga ccccttctct ccagggaagg gttgggtaaa tgtctacgaa 240 tcgccttgag agagaactaa ag 262 <210> 497 <211> 170 <212> DNA <213> Homo sapiens <400> 497 tacacagttt ccaatttaag taggcagact gagcatgccc atcagtttcc tattgctgct 60 tccatccctc gaaatgatag aaaagatttt aaacagcaaa taaagaatga gaaaaagaag 120 aaattataag tgggttttaa aaagttgcag tgggccaggc atcatggctc 170 <210> 498 <211> 89 <212> DNA <213> Homo sapiens <400> 498 tgcccgatca cacaggagta tgcccaaact ctctcaggcc tctagcagct gacaaccact 60 gctttaaatc cctattacat ttattatga 89 <210> 499 <211> 242 <212> DNA <213> Homo sapiens <400> 499 cctgggggca ggacccacag ccagtgggct aagaccttta aaaaattttt ttctttaatg 60 tatgggactg aaatcaaacc atgaaagcca attattgacc ttccttcctt ccttccttcc 120 ctcccttcct ccttctctcc ttctctcctc ctctctcctc tcctctcctc tctttccttc 180 cttccttcct ttttttcttt ttctctttct tctttatttc ttgggtctca ctctcatcac 240 cc 242 <210> 500 <211> 220 <212> DNA <213> Homo sapiens <400> 500 tcaagacgag cctggacaac acaacaagac ccccaattct actaaatttt tttttttaat 60 tagccagatg tggtaatgca tgcctctgta gtcccagcta ctcaggaggc tgaggtggga 120 ggatcacttg agtgcaggaa ttcaaagctg cagtgagcta taatacaagg cttcattgca 180 ctccagccta ggcattagag cgagaccgtg tttatttaaa 220 <210> 501 <211> 271 <212> DNA <213> Homo sapiens <400> 501 ttaaaggaca aactcaagaa ggcacaacat gaaagagaac aacttgaatg tcagttgaag 60 acagagaagg atgaaaagga actttataag ggtacatttg aagaatacag aaatagaaaa 120 taccaagctt atgtcagagg tccagacttt aaaaaattta gatgggaaca aagaaagcgt 180 gattactcat ttcaaaaaga gattggcagg ctgcagttat gtttggctga aaggaaatct 240 gcaagacttt cctgcttaca acctcaagta a 271 <210> 502 <211> 133 <212> DNA <213> Homo sapiens <400> 502 caacatggac atttatacta ataaggaggg cagaggcgaa tatgtgagaa ggtccaccac 60 ctcagagctt gaatcagctt cacgatgatg gaaaggtaag ctttatcact gatctcaaca 120 gcagactggt ggc 133 <210> 503 <211> 119 <212> DNA <213> Homo sapiens <400> 503 gagtcaggct tactaatgct gccctcactg cctctttgca gtaggggaga gagcagagaa 60 gtacaggtca tctgctggga tctagttttc caagtaacat tttgtggtga cagaagcct 119 <210> 504 <211> 87 <212> DNA <213> Homo sapiens <400> 504 gatcaaatca agtcttggtt gtggcttgct gaattaaata tttatgagtg gtgcattttt 60 aagtatcgtg accaagacac catatta 87 <210> 505 <211> 298 <212> DNA <213> Homo sapiens <400> 505 aatacagaac tgagcctagg ccagggaact gggattgggg ttagatctaa gcaagatcag 60 catgtaagtg atagtggaga aagtaaatgg agaggtgagg actcatcccc ttggtggaaa 120 ttcggaatta ataaagcagg aggagagtca ggataatggg ctgttgaata aagaaagtaa 180 gtgacaagga agaggtaatg tgtatccaag aagtaggaaa gaaatgagac ttaaagcgta 240 gggggttagg ctgtgtaaga gctcagtacc caacaggtgc tcagtcaagt aacttgac 298 <210> 506 <211> 247 <212> DNA <213> Homo sapiens <400> 506 tgggattgca gtcgcctgcc accgtgcccg gctaactttt gtattttggt tgagacaggg 60 tttcgccgtg ttggccaggc tggtctagaa ctcctgacct caggtgatcc acccgccttg 120 gcctcccaaa gtgctgggat tacaggcgtg agccaccaca cccggccaaa aaaaaaattt 180 tttttctatc cctgccattc agtctccatt agcactctat tctctctcat ttattccacc 240 ccgtctt 247 <210> 507 <211> 204 <212> DNA <213> Homo sapiens <400> 507 accaccccta gctttgtgtg tagtgtagtg attttctggc tgtcactcat actcactggg 60 caccagcctt gccctcttag cctccatcca tccagacagc ccttcccacc tcctggtggt 120 gagccagtct gcattcccac gccatcccaa agccctttca tcttacccgt gcattgtaga 180 tggaaggagc acccatgcca ttca 204 <210> 508 <211> 179 <212> DNA <213> Homo sapiens <400> 508 aaaaaggtct atgatcttga gggcagacag cagaattcct cttataaaga aaactgtttg 60 ggaaaatacg ttgagggaga gaagaccttg ggccaagatg ctaaatggga atgcaaagct 120 tgagctgctc tgcaagaaaa aataagcagg acagaggatt tgctctggac agagatgga 179 <210> 509 <211> 291 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (39)..(83) <223> n is a, c, g, or t <400> 509 tggtgaattt tctaggagcg atgatgtact gtaattgtnn nnnnnnnnnn nnnnnnnnnn 60 nnnnnnnnnn nnnnnnnnnn nnnaatgctt gttctaagac atttctgaat gtagaccatt 120 ttccaaaaag gaaactttat tttcaaaaac ctaatccgta gtaattccta atcttggaga 180 ataaaaaagg gcggtggagg ggaaaacatt aagaatttat tcattatttc tcgagtactt 240 tcagaaagtc tgacactttc attgttgtgc cagctggttg aaattaaaac t 291 <210> 510 <211> 282 <212> DNA <213> Homo sapiens <400> 510 gatagtgatg ggtcttccca ttgtccttaa accctgtaca tattgtgcag cctggcctgg 60 gactggatgt ttcagtagaa ataacacagg ggacaccaga ggcaagcctg gaggtcagct 120 cagtcgttag gcagtggagg cacaaggtgg ggcagttttt cccaggtgtt tgatgatgac 180 tgacttgagc cagagacccc taaagataga gtggagtcca gggaatgatc tagaacttca 240 ggtgacaggc aggagctgcc cggatttaac agcagaacca ta 282 <210> 511 <211> 164 <212> DNA <213> Homo sapiens <400> 511 ctaactctgt cctgaagagt gggacaaatg cagccgggcg gcagatctag cgggagctca 60 aagggatgtg ggcgaaatct tgagtcttct gagaaaactg tacaagacac tacgggaaca 120 gtttgcctct ctcccagcct caaccacaat tcttccatgc tggg 164 <210> 512 <211> 294 <212> DNA <213> Homo sapiens <400> 512 gatggacagg gttctgaaaa aactgaaaat gaattctaga aagcagcatt tgagagggaa 60 aagagaagtg atcagcattt aggaatatga actgtctgga gctagagaaa cagcctggga 120 aaagagcaaa gggctagagc aggaaagaga aaagagaatg agactagcgg tggtttggat 180 attatttgta accaaagtca aaggacggga gatctagagt ccagccaaca aagaacttgc 240 tcctataaaa accaaatgga ccccaccctt cacttgacgt agaggtcctt tcct 294 <210> 513 <211> 262 <212> DNA <213> Homo sapiens <400> 513 aacatggtcc tggaggttac agtgtagtga ggggcaaaga catggagcca atggttgagc 60 tgaaacctca tgtgaggagt taactggatg gagaaaggag tcaagagagt tctaggtaga 120 ggaggcagca tgtcaaaggc acagtaaagg gaggatgaat ggtccatttc agggatggaa 180 gaaggctgct agattggaac atagggaagg agggaatgtg tgatacaagc tggagctaga 240 aaggtaggtg gtcagaacat ag 262 <210> 514 <211> 81 <212> DNA <213> Homo sapiens <400> 514 gaaaaattta cacagctaga tttggaagat gttcaagtta gagaaaagtt aaaacatgcc 60 acgagtaaag ccaaaaaact g 81 <210> 515 <211> 296 <212> DNA <213> Homo sapiens <400> 515 ttaaaaggtc ctgctctatc gttctgtgtc tggctctgca aactgctggt atgtaaaaga 60 ccctctttcc agacaggcca cgaactcccc gaaggccggg ctggcctctt ctctgcctct 120 gtcccaacct ccctgacaca ccctccatcc acgttaataa aacagggaac acaccagagg 180 gctcagtaga gaaaaacaca tcataatgac tgatttataa tttttatagc tttaaaataa 240 taaatttatt tttttccatt aaagtattat aacacgatta caaaaagccc tcgtgc 296 <210> 516 <211> 285 <212> DNA <213> Homo sapiens <400> 516 tagatgccgt catcttccgt ggtcacgccc acaatcttca gcgtggcctc tcccaggtca 60 ctgtaggaga tgctgtagtg accatcgttg ttcaaggtgt tgtgttcagg gcccttccag 120 gtaattgagg ctttggggcg gccacagact cgacatctag gaacaacggt ctcccctgtc 180 tcacacgtga cctcactcaa tggaatgacg aattctgggg gaacgtcata aatgtagttg 240 ggattgagaa gcttgttgct gagtccttcc cgtgacttcc gataa 285 <210> 517 <211> 148 <212> DNA <213> Homo sapiens <400> 517 cactatgcag ttactgtgac tgtgggaggc aagcaacact tgctcggact gtatgacacc 60 gcgggacagg aggactacaa ccagctgagg ccactctcct accccaacac ggatgtgttt 120 ttgatctgct tctctgtcgt aaaccctg 148 <210> 518 <211> 269 <212> DNA <213> Homo sapiens <400> 518 gaccaggaag tcctataaag aattatattt ctatagaatt aaaaatgcag ttctgtcagc 60 ctggacaaca aagtgagacc cccatagcta caaaaaaaaa aaaaaaagtt tttttaagag 120 ttgggcatgg tggcacacgc ctgtagtcct agcttctcgg gaggctgagg tgggaggatt 180 gcttgagatt gggaggttga ggctgcagtg agccgtgatc acaccactgc actccatcct 240 gggtaacaga gtgagaccac ttaaattaa 269 <210> 519 <211> 263 <212> DNA <213> Homo sapiens <400> 519 caaagcaaca aatggaggca tatgaaattc ctcatcgagg aaacactgga gatgttgctg 60 ttgagatgat gtggaaacct gcctatgatt ttctgtatac ctggagtgct cactatggaa 120 ataactacag agatgtgtta caagaccttc agtcagcttt ggacagaatg aaaaaccctg 180 tgactaaaca ctggagagaa ttaactggag ttttaatact agtaaattct ttggaggttt 240 tgagagtaac tgcattctcc act 263 <210> 520 <211> 182 <212> DNA <213> Homo sapiens <400> 520 tgttaaccca ttccagtaca gtattctttt aaaattcaaa agtattgaaa gccaacaact 60 ctgcctttat gatgctaagc tgatattatt tcttctctta tcctctctct cttctaggcc 120 cattgtcctc cttttcactt tattgctatc gccctccttt cccttattgc ctcccaggca 180 ag 182 <210> 521 <211> 276 <212> DNA <213> Homo sapiens <400> 521 agccacagtt ggtgtggctg gttcaggggc tggcattgga accgtgtttg gcagcttgat 60 cattggctat gccaggaacc cgtctctcaa gcagcagctc ttctcctatg ccattcttgg 120 ctttgccctc tctgaggcca tggggctttt ctgtttgatg gtcgccttcc tcatcctctt 180 cgccatgtga ggctccatgg ggggtcaccg gcctgttgct actgcaactc cacaccattc 240 ttggtgctgg ggtgtgttaa gctttaccat taaaca 276 <210> 522 <211> 288 <212> DNA <213> Homo sapiens <400> 522 ggcttaacca gctagacatt cctctaaata catacgtaac aaaaattgat ggcaggagat 60 tttattggga tcactggata cctacactca acaggcagaa cttggctaat tccatttata 120 ccactactga gacagtgaag acaaattaag aatcagaaca ggaagcacat agcataggga 180 tacccgtgtc agcgacatat ttaatatgcc cctcagctta agactcaata ctgaacagac 240 caaaaggcca cctcaattgc cgctcccgcc acacttgcta ttgaaact 288 <210> 523 <211> 210 <212> DNA <213> Homo sapiens <400> 523 ccaaggcatt gctaatctct gtacttcagt aaacactgaa aagtcaacgt aactctatag 60 gtcgcatatt cttgaatgac agggaaaggc aaacatctct acagaggtgt gatcgaaagc 120 attttacatt aggtacacag aaactttaaa ctcacactat gtaagcctct aatcagcctg 180 agcaaaatcc attgcctaca cagtcattta 210 <210> 524 <211> 54 <212> DNA <213> Homo sapiens <400> 524 ggttgaaaga tgaaatgcct gtatgtgctc tgaagaaatg gtaattccag attg 54 <210> 525 <211> 277 <212> DNA <213> Homo sapiens <400> 525 tccacctgcc gagaagctga gattatagtc actgtgcctg gctggaatat agccttttga 60 ctccatgtca ttacccgcac tcttcgctct tcctggaatg tatttcctga gcctgtctgc 120 cctaaaaatt ccaatttctc ctttaagctt tggctcaaat gctatctata ctctgctgcc 180 tcccccaagt ccccctagtg acacacaggg tcctcttctg ctcttcctta tgttcttctt 240 tgtcagagca acatcacagc agtaccccaa catttgg 277 <210> 526 <211> 39 <212> DNA <213> Homo sapiens <400> 526 gcggcgggca gggcttgcct ttcttagtct gatgccaag 39 <210> 527 <211> 223 <212> DNA <213> Homo sapiens <400> 527 gggccatgac acctgatcat tggatcaaga ggggcactgc tctactcatg agcctggaca 60 gctgagacct cctcctcttc tccgcttgag agagagggtc agggactcca ggagctaaga 120 cagatgttgc acctaggact gaggccggac ctcactcaga ctttgacctt ggccgaattt 180 gtgtgatgtg gccctggaga tacctagttg tgttagccat aaa 223 <210> 528 <211> 239 <212> DNA <213> Homo sapiens <400> 528 caggaaggcc tcgaggccac acaggggctg ctggccggcg agtgggcccc acccctctgg 60 gagctgggca gcctcttcca ggccttcgtg aagagggaga gccaggctta tgcgtaagct 120 tcatagcttc tgctggcctg gggtggaccc aggacccctg gggcctgggt gccctgagtg 180 gtggtaaagt ggagcaatcc cttcacgctc cttggccatg ttctgagcgg ccagcttgg 239 <210> 529 <211> 211 <212> DNA <213> Homo sapiens <400> 529 ctggtggact attccatcac ccatgcagag cccgccaacg tgttcgacat caattcccac 60 acgggggaga tctggctcaa gaattccatc cgctccctgg atgccctgca caacatcaca 120 cctggaaggg actgcctatg gtccctagag gtgcaggcca aggaccgggg ctcccacatc 180 acttcagcac cacagcctta ctcaagattg a 211 <210> 530 <211> 256 <212> DNA <213> Homo sapiens <400> 530 tcggcctcag attccatatt tgaacaccag ctgattgaga gaaggggaat gagaagagct 60 ggatgagttt aaataactca ttgttcagat tcctgaacag gagttgggat aatggccatc 120 ttttctttcc tatcctttct tcccccctca ctgtgaaaaa taacagtcca ccccaagtca 180 tacactggac ccagtgcctg cggggacagg actgtgggtt tcttggtcac acctgtgttg 240 gtgctcaatg cagtgt 256 <210> 531 <211> 250 <212> DNA <213> Homo sapiens <400> 531 tagtttcatt tactctttag gcagaaaata ggttcaaggg tctagtaaag gaggcaaatg 60 ggcagaaaac aacctcttgt ttgctatccc actgcacttg aaatggacct ctataattca 120 ctaccattta taagtgtctc gcatatcaac atcacattag gtaatttact gcctccaatt 180 cctggtccat aactattcca tcctgaaaag tcataataca atgttattgg aacaatctat 240 tcatatggta 250 <210> 532 <211> 143 <212> DNA <213> Homo sapiens <400> 532 atgtatacaa agtaaattct tagccaggtg tagtggctca tgcctgtaat cccagcactt 60 tgggaggctg aggcgggtgg atcacttgag gtcagaagtt caagaccagc ctgaccaaca 120 tcgtgaaatg ccgtctttac aaa 143 <210> 533 <211> 273 <212> DNA <213> Homo sapiens <400> 533 agtggcttcc ttggagtagt gggtgaaagt ctgcttaaaa agagggctta ggagagaatt 60 gggggaagga attgaaatac atcaacatag acaactcttg aggagttttg ccatgaagag 120 acactttgca tccagaggac actttgcatc cagagagtgg cttccttgga gtagtgggtg 180 aaagtctgct taaaaagagg gcttaggaga gaattggggg aaggaattga aatacatcaa 240 catagacaac tcttgaggag ttttgccatg aag 273 <210> 534 <211> 250 <212> DNA <213> Homo sapiens <400> 534 gagctggaaa aaagtcagac tctccacaga ccccctatgg gggaccccca actcaaggcc 60 aaggactggg cgtatcggat gctcataaca cccctggcct ggccccttta ctgagaagac 120 tccttggata tttcccaaga accccccaca tacacccctc acaagccacc cctcctgaga 180 ggcagggggc cctccgcccc ctccccatgt attccccacc tgtgttccgt ttgaccagca 240 cagaaatatt 250 <210> 535 <211> 91 <212> DNA <213> Homo sapiens <400> 535 gggagcacac agtcacctct cacagctcca ttatccagcg gctgccgggc tctgacaacc 60 tatatgatga cccctaccag ccagagataa c 91 <210> 536 <211> 250 <212> DNA <213> Homo sapiens <400> 536 gctgccattg ctgtggttat gggcatttag aaaacttgaa agtcagcact aaaggatggg 60 cagaggttca acccacacct ccactttgct tctgaaggcc cattcattag accacttgta 120 aagattactc caacccagtt tttatatctt tggttcaaaa cggcatgtct ctccaacaat 180 ttaagtgcct gatacaaagt ccaaagtata aacatgctcc tttactctct tgctgctact 240 cttgcttttg 250 <210> 537 <211> 64 <212> DNA <213> Homo sapiens <400> 537 gtagctattg atgtacactt cgcaacggag tgtctgaaat tgtggtggtc ctgatttata 60 ggat 64 <210> 538 <211> 299 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (224)..(232) <223> n is a, c, g, or t <400> 538 cagaggtctt gcagcccctg tggatgcccc cgccgaggtc ccccgatccc cgcacccgga 60 ctgctgctcc ctgccccacc attgcgggtc ccccaggaag ccaggtgacc ccaggtggga 120 ggctgtgtgt ggaggccatc ctggaaggaa gtttagacct gcccaggtgt ggagcgaggg 180 gcacaggggc atcctaacct cagaaactga aataaagcct ttgnnnnnnn nntctgtaaa 240 acatcaaccc ccaatcagaa gatggcaaat ggggaataaa aatagcaggt aacacgtca 299 <210> 539 <211> 195 <212> DNA <213> Homo sapiens <400> 539 tgacagcagc tgatgttgtt aaacagtgga aggaaaagaa gaaaaagaaa aagccaattc 60 aggagccaga ggtgcctcag attgatgttc caaatctcaa acccattttt ggaattcctt 120 tggctgatgc agtagagagg accatgatgt atgatggcat tcggctgcca gccgttttcc 180 gtgaatgtat agatt 195 <210> 540 <211> 171 <212> DNA <213> Homo sapiens <400> 540 aaaatagaac atcctgagtt acagaaattc agccctagtg tatcctggcc taaaaataca 60 gaacaatcaa gttgagtggt tggaaatgag aggctaggca gggttggaaa catgctaatg 120 tttactgagt gaaatctttc cttctcagta gagttgccct tgcagctgaa a 171 <210> 541 <211> 44 <212> DNA <213> Homo sapiens <400> 541 tctctggctg atatgttccc tgagatgaat gaggtctgtc aaga 44 <210> 542 <211> 249 <212> DNA <213> Homo sapiens <400> 542 gttacaggtg ctacgcatga tggtcggagt aaatatctca gatgagcagc tgggcagcat 60 cgcagacagg accattcagg aggctgatca ggatggggac agtgccatat ctttcacaga 120 atttgttaag gttttggaga aggtggatgt agaacagaaa atgagcatcc gatttcttca 180 ctaaaggaga ccaaactgtt ccttgcggtc tagtatttaa gaactggaac ttgaaagtcc 240 tccttctac 249 <210> 543 <211> 213 <212> DNA <213> Homo sapiens <400> 543 gaatccatta tcaatgttgc tagtgtaata cacaagaaaa cccaatgaga gaaattcaaa 60 tattaagaaa caagcttttg ttgattgagc tttaaatggc cacacaccat tataatatct 120 aagatgcttg tgctccccaa taaccaattt ttgcctccaa tgaggatgca agtcctaact 180 tctatgctcc cgaatttatc atactagcac cta 213 <210> 544 <211> 242 <212> DNA <213> Homo sapiens <400> 544 taataagtgt tagcatcgtg tgtcttgaag tatacttttg cactgtaact tgggttacgt 60 taaagagagc ttagcaccaa aggtagataa tgaagaaatg gcataggaaa gtggagatga 120 taaaaagttg attgttgaac caaaaagggt ttgaagggaa gcttcgactg agtatcagaa 180 attacttaag gcacatagga cctgaatcag graaccagca cttcttacaa ctgccagttt 240 ta 242 <210> 545 <211> 215 <212> DNA <213> Homo sapiens <400> 545 tgcaaggact cacctccttg agccttggtt tttgttgtag ggattaaatg agataatatg 60 agtggcagct cttcatgagt cctgcagtgc taagcaaatg tcagaaattg gtgtattaga 120 ctatttatct ttgatcttct gaatggattg ctgtcatgga cacggacacg gatcttcatc 180 tggttcattg tatttatatg tgagggatgg atggc 215 <210> 546 <211> 237 <212> DNA <213> Homo sapiens <400> 546 ggagaagtta agcaacatct agcaaatgtt atgcataaag tcagtgccca actgttatag 60 gttgttggat aaatcagtgg ttatttaggg aactgcttga cgtaggaacg gtaaatttct 120 gtgggagaat tcttacatgt tttctttgct ttaagtgtaa ctggcagttt tccattggtt 180 tacctgtgaa atagttcaaa gcctagttta tatacaatta tatcagtcct ctttcaa 237 <210> 547 <211> 257 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (220)..(220) <223> n is a, c, g, or t <400> 547 gaattgtcat tcataactct gtgctatatt acttgagggg ctaagaaaaa tgtatggtca 60 gtgaaacaca gtagtgtacc cttaaatgcc ttataaaaga ccatccatcc agtctgcgct 120 tttgactgtg tgcaagtatc agtaataatg cttttggggg ctcagatgaa cagcgaacac 180 caatcagcca ggactctgga aggaaagctc caaaaatgan gaagtccttt caacaccatt 240 ttccattact gttctca 257 <210> 548 <211> 34 <212> DNA <213> Homo sapiens <400> 548 tttgattaat aaaaatgcgt tgagcctagt tata 34 <210> 549 <211> 194 <212> DNA <213> Homo sapiens <400> 549 gttgcttccc caccctgagg agaggacacc atggcttact actcaggaca agtatgcccc 60 gctcagggtg tgatttcagg tggcttccaa acttgtacgc agtttaaaga tggtggggac 120 agactttgcc tctacctagt gaaccccact taaagaataa ggagcatttg aatctcttgg 180 aaaaggccat gaag 194 <210> 550 <211> 198 <212> DNA <213> Homo sapiens <400> 550 tgggaaatat agtgaaactc ctgtccctac aaaaaataca aaaattagcc gggtgtggta 60 gtgcatgcct gtagtcccag ctacttggga ggctgaagtg ggaggatggc ctgagctcaa 120 ggagatgcag gctgcagtgg gctgtgattg tgccactgca ctccagcctg ggcaccaatg 180 tgagaacctg tcttggaa 198 <210> 551 <211> 292 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (76)..(77) <223> n is a, c, g, or t <220> <221> misc_feature <222> (101)..(101) <223> n is a, c, g, or t <220> <221> misc_feature <222> (106)..(106) <223> n is a, c, g, or t <400> 551 ttgaaagaca ccagtgcaca cccaaactcc tggccttctg tgggttccct ttgctccaga 60 acacagatgt gtctanngaa aaacaaacga aaaccgagcc naaacnacca aaccccaggg 120 gggggccgct ctaaagaatc cctcgagggg cccaagctta cgcgtaccca gcttttcttg 180 tacaaagggg cccctaaagg ggagtcggaa taaaaaacta aaggcccttg gcccgtcctt 240 tttacaacgc cccggaactg gggaaaacat gccaaccttg ggggatcttt tg 292 <210> 552 <211> 268 <212> DNA <213> Homo sapiens <400> 552 gatgctcttc agttcaacta tattccctat ctgataattc cagaatctct atcatgtctg 60 agtctgggtc tgatgctttc attgtttctt cagattgtga tttttcttgc ctcccagtgt 120 gacttgtaat ttttaattga aagctggata tgatgtattt ggcaatggga agtgagggaa 180 atatgttttt agtgtgaggg tttatgttaa tctttctcag agttgggctg tttaatgttt 240 tgctgtggtc tgaatgttcc ttaaaact 268 <210> 553 <211> 269 <212> DNA <213> Homo sapiens <400> 553 aaggattggg ggtcgtgcag cccagccagc aggagggact gaggccctct aggaggaaag 60 cccagaggga gggggccctc attccttcag acccagtttt cccccaccct ccttaccccg 120 ctgggctagg tctccgccag ggctggcctc agtttctcct caacaggcct gggggcagcc 180 cttcccctgc ctagtccccg cctgagtgcc agcsccccac cccgcctgcc gccccctgtt 240 caggttccct ccccgccaca gtgaaataa 269 <210> 554 <211> 297 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (47)..(47) <223> n is a, c, g, or t <220> <221> misc_feature <222> (52)..(52) <223> n is a, c, g, or t <400> 554 tgcggaggcg ctagtccacc agagcbcctc cccgcccctc ttcccantcc gnatccctcg 60 cccccctccc cacctcccac cccccaccct gtaaactagg cggctgcagc aagcagacct 120 tcgcatcaac mcmscasaca ccamaaacca gtgagasccc cgctctctac cgcccgggcc 180 cagcactcgc tagctttcct gacacctgga actgtgcacc tggcaccaag cggaaaataa 240 actccaagca gccagtagcc ccgatggtgt gtgcctgacc tgtgtggccg gaggttc 297 <210> 555 <211> 35 <212> DNA <213> Homo sapiens <400> 555 ttaggtaggt aaggaatgat cacattggag tttgg 35 <210> 556 <211> 273 <212> DNA <213> Homo sapiens <400> 556 acgtgcttat taggaaatga gtctgtatgg aaatctcacc acagataatg gttaacgaac 60 cgggtcgaca tcacaaagga gggtggagac tctttttact aacttgaatg agacaaaagc 120 agtggtgtca gtttataatc ctgatgcatt tcagtaataa tgtagaaaaa cattatttta 180 aaaaagttcc aacacacagc catgaggagc ctcagttttg aaagaggtgc ataataaaac 240 tactaaccag aggagtctat gccattttaa gaa 273 <210> 557 <211> 256 <212> DNA <213> Homo sapiens <400> 557 gccaggagtt ggagcccact ctggggaaaa catgttgaga tcttgcctct gcaaaaataa 60 agtaaaataa aatttaaaaa aagtaaaaaa ataaaatcag ctgagcatgg tgacatgcac 120 ctgtggtacc agctactttg gaggctaagt tgagaggcac tgatgggagg atcatttgac 180 ggcccagagg ttgaggctgc agtgagctgt gtttgtgtca ttgcactcca gcctgcgtaa 240 cagagtaaaa ccttct 256 <210> 558 <211> 185 <212> DNA <213> Homo sapiens <400> 558 cttggagcca gagaagcgat tagaaacccc tgagggccga ttactgacat cataaatcat 60 gagtttgggg gctttgcctg ggtgatgttg gtaccaggag acatagttat aaccaccaac 120 gtcactgctg gttccagtgc aggagatggt gatcgactgt ccaggagacc cagacacgga 180 ggcag 185 <210> 559 <211> 246 <212> DNA <213> Homo sapiens <400> 559 gtctgaatat cttactcaca gctcaccttt ttggtgcctt tgatccgtat tagaaattat 60 ccacatcttc tctctgggca atattctact ttttatattg acccaattat tttactgctt 120 tggtgtgtcc tttctcctaa cacatatggg ttcactttga aaccctgaaa cccacattta 180 caaaaacatt ttcaatatga aacattgttc catgactcat tactggagta ccatcaacat 240 ttacat 246 <210> 560 <211> 242 <212> DNA <213> Homo sapiens <400> 560 gcaggtattt tctacgggtg tttgatgttc ctgaagtgga agctgtgtgt tggcgtgcca 60 cggtggggat ttcgtgactc tataatgatt gttactcccc ctcccttttc aaattccaat 120 gtgaccaatt ccggatcagg gtgtgaggag gctggggcta aggggctccc ctgaatatct 180 tctctgctca cttccaccat ctaagaggaa aaggtgagtt gctcatgctg attaggattg 240 aa 242 <210> 561 <211> 285 <212> DNA <213> Homo sapiens <400> 561 tcctctgtca atgttcgatt atctccagga aaagagacca gatgcagccc accttccttc 60 acctataagt acacacctga agaggagcag gaattggaaa agcgggtgat ggaacatgat 120 ggtcagtctt tagttaaatc gaccattttc atctctccat catctgtgaa gaaagaagaa 180 gccccccaga gtgaggcgcc gcgggtggag gaatgccatc atggaaggac tcctacctgt 240 tcacggcttg ctccaccacc aatgtctcag tctacctgtt ccctt 285 <210> 562 <211> 271 <212> DNA <213> Homo sapiens <400> 562 ggtaatgagc tcaatgcctc catttaatca cttttataag gctctctcca ataaggctgc 60 tgtgctgtgc tcctgccagt gttggagtaa tataacattt ttactgcaca caccttatgg 120 gaaagtgttt atactgagtg tagttttagg aggggtaaat gaagattatt tccacaaatt 180 aagattgcac ttagtacacg cctttacaca actctgatgg tatttaccaa aacatggcat 240 gtcttttcac gtatattcct gaaaacacca a 271 <210> 563 <211> 211 <212> DNA <213> Homo sapiens <400> 563 agctttaaga ggaaagagct ctatttttct tgttttcttc tctgagctag actgagctgg 60 ggatctaaga tgtacttctc tgactacaaa agggacagta tcatttagat tttttgcagt 120 tggaagaaat gggttgttga gtgtgttaag gctgggatga agaagggctg ggcagtactc 180 ttctggaaag gctcacctag cacgaacctg c 211 <210> 564 <211> 276 <212> DNA <213> Homo sapiens <400> 564 ggtaataaag agagccctcc ttgtcaaccc aaaatgtgag ccccctgtgg caaaaccacc 60 ccctacccca ttaacaaatc aacagacaaa attctccgag tcctttgcct cttttgataa 120 catgttgttc tgttttgtaa agtgtgtgtg cttggggttc cgaggtgtgg gattgagttc 180 tctgctttgt ttttttttaa gatattgtat gtaaatgtaa aaagttattt aaatatatat 240 tttaaagaac cctaactgcc aacttttgct gaaaaa 276 <210> 565 <211> 257 <212> DNA <213> Homo sapiens <400> 565 gagtcacctt tagtcacctg gtccgtaacc atctttcctg tctaaacttc tcaccccacc 60 actctggctt atacccctgc tctctttaaa atagccagtc agaattagct tagattgtgc 120 ggtccaaccc tagcccatag gggaacaaca cagcagtagg gggtacctgc atcagggata 180 agaacccatt cccctccctt gttccggtgt gctctcgcca ttgcaccatc catgagacgc 240 actcttgtat agaagta 257 <210> 566 <211> 198 <212> DNA <213> Homo sapiens <400> 566 gggaacctct gaataccata ggattaatat atgaaaaaat ttccctccct aaagtacatc 60 cacgttatga tttagacggg gatgctagca tggctaaggc aataacaggg gttgtgtgtt 120 atgcctgcag aattgccagt accttactgc tttatcagga attaatgcga aaggggatac 180 gatggctgat tgaattaa 198 <210> 567 <211> 228 <212> DNA <213> Homo sapiens <400> 567 taaaagaaac acctgcggcg gctccgcgcc tccctccctc cctcccaggc tcacctccta 60 ccttccttac ttcccttgta aaggcatagc caggggacat tgtcccccag cttcacatcc 120 acatgtctcc tagcatggca catgcatatc ctgcccaagg agcatgaagt cagaccagca 180 aactgaacac gaggcacagt cctgcatgct ctgggaccga gcactgag 228 <210> 568 <211> 201 <212> DNA <213> Homo sapiens <400> 568 agctgaagct gcgtcggcgg ctcacggagc tcctgggggc gcaggacggg gcgctgctgg 60 tgcggctgct gcaggcgctg cgcgtggcca ggatgcccgg gctggagcgg agcgtccgtg 120 agcgcttcct ccctgtgcac tgatcctggc cccctcttat ttattctaca tccttggcac 180 cccacttgca ctgaaagagg c 201 <210> 569 <211> 211 <212> DNA <213> Homo sapiens <400> 569 agctttaaga ggaaagagct ctatttttct tgttttcttc tctgagctag actgagctgg 60 ggatctaaga tgtacttctc tgactacaaa agggacagta tcatttagat tttttgcagt 120 tggaagaaat gggttgttga gtgtgttaag gctgggatga agaagggctg ggcagtactc 180 ttctggaaag gctcacctag cacgaacctg c 211 <210> 570 <211> 233 <212> DNA <213> Homo sapiens <400> 570 ggaatgggag ttggcgggca gtgaacgagt gtggggaagg attggtggtg gggcaacagg 60 aaggggcctg gggccgtttg ggtgccctaa ctttggtagc tcagtgtgca tttagagtgg 120 gactggggag ggaggtaagc ttggggtggg ctgcttgggg cttggcatag ggtggaaagg 180 gctaccctgg ggctttgacc cccctgtagt atgtgtggag ggtgccctcc cgt 233 <210> 571 <211> 251 <212> DNA <213> Homo sapiens <400> 571 aaactgctat ttctaactct tcatgaaagc attacctttg gaaagttaaa cttttttttt 60 cctttcatca ccgtctttga aacaaattat tttccaattc ataagaactt tggtaaaaaa 120 aaaaataaaa ggaaattata tgtttttctt tggacattca ttggaaggct tgttgaagac 180 atgatccccc agaagcctta gtgacccaga tctcaaccag agactcaaga tagcctcaaa 240 tacagtgaaa g 251 <210> 572 <211> 218 <212> DNA <213> Homo sapiens <400> 572 aactgtattt taacttagca caattaactg cagcatattt acttcatagc cccttaacat 60 gtcactttta ccaacaaagc tttttccttc atattctaat cacaaaaatt tctcaacaat 120 ttataacaat ctgtaaatct gaccttgcaa taaatagtca taaaacgtta tttttattac 180 tattattatt tttagagaca aggtctcctc gtgccgaa 218 <210> 573 <211> 250 <212> DNA <213> Homo sapiens <400> 573 tcccacacca aaatagattc ccaaatagat attacaagta ggagaatttt tatgactact 60 cagataaaac gaccattgat cacttacaaa catacaagtc ataaacaata cagaaataat 120 atgtgtatac aaaaacacag aaattattat attgggaata gacatatgac tgattcatat 180 gtaactttgt ctccacgctg tcttaaagtg tacagagttg aatattgtca ttcacaattg 240 tcacacaaaa 250 <210> 574 <211> 32 <212> DNA <213> Homo sapiens <400> 574 caccaaagtt ctgaggcatt aagccagcag aa 32 <210> 575 <211> 245 <212> DNA <213> Homo sapiens <400> 575 taaaactctc tgagactgtt ttccccccat gtcaaaacac ctattttgca tggctatatg 60 gaaattaaat gaaatagcaa atatgaaaaa cttttggccc agtgtataat tcatatcagg 120 cactgatctg ttttcttttt gccctaacct acttttcctg catcatatac cactacacct 180 ctttacaaac cttattaata gagccactct agactacttt atttccccaa gccatacaat 240 gtact 245 <210> 576 <211> 192 <212> DNA <213> Homo sapiens <400> 576 aaaacccacc ttgttggagc ctgcagggtg gtgctgggac tgagccagtc ccaggggcat 60 gtattggcct ggaggtgggg ttgggattgg gggctggtgc cagccttcct ctgcagctga 120 cctctgttgt cctccccttg ggcggctgag agccccagct gacatggaaa tacagttgtt 180 ggcctccggc ct 192 <210> 577 <211> 269 <212> DNA <213> Homo sapiens <400> 577 ctagacccac tgctggtccc ctttctccct cctgcttctc acctgaagcc acctgcccct 60 cctttgtgcc ctcccttgct tcctcctggg ctctgtcccc tgctccccct ttgtcctcca 120 tcccgactcc atctccccca ccaggctggt caccccaggc cagcgtctgt tgaaggatga 180 agcagctcct gtccggccca gccctgcctc acagctgtgc gagctctgcc cttctcagct 240 ctcaaacctg aataaatgca ccaagccca 269 <210> 578 <211> 172 <212> DNA <213> Homo sapiens <400> 578 tggcagagca acacttcgtc tcagaaaaaa aaaaaaaaac caaaaaccaa aaagccaagt 60 gtggtggtgt gcacctatag tcccagctac tcaggaagct gagacaagag gatcaattga 120 gcccaggagt tcaaagctgt agtgagctgt cattgtgcca ctatcctcca gt 172 <210> 579 <211> 269 <212> DNA <213> Homo sapiens <400> 579 ggagcagtgc ccaccaaggg tttgtcagat tcaagcctca ggcaagagaa aaatcaaaag 60 ccttctgcta ctctctccct ctgggcctct ggtctgccca gaggctggga ctccttcctc 120 taccttgctc tcaatctgga gggtgctggg gggtgcctcc atcttactgg gcccctggct 180 ggcttgtggg ctgaggtgct aatggggtct agtagctgct gtgctccctt cttcatgccc 240 agtctgaaac aggtgctccc ctaacccag 269 <210> 580 <211> 144 <212> DNA <213> Homo sapiens <400> 580 cagggaggcc tctctgcccc tatggggctc tgtcctgcac ccctcaggga tggcgacagc 60 aggccagaca cagtctgatg ccagctggga gtcttgctga ccctgccccg ggtccgaggg 120 tgtcaataaa gtgctgtcca gtga 144 <210> 581 <211> 204 <212> DNA <213> Homo sapiens <400> 581 aggatccgag tggtagtgtt tctgagagtc agggtctagg tgctggagtg cgcacggagg 60 ccgatgtaga ggaggaggcc ctgaggagga agctggagga gctgaccagc aacgtcagtg 120 accaggagac ctcgtccgag gaggaggagg ccaaggacga aaaggcagag cccaacaggg 180 acaaatcagt tgggcctcta gcgt 204 <210> 582 <211> 214 <212> DNA <213> Homo sapiens <400> 582 agtaacaata gccagaggtt gaagggcggg gtagaagagg ggggaatgtt gcagcgtaat 60 ccttcatacc acctggttct tgatattctg ccgcctgttc aagttcaaga ataaaagcga 120 cagcaggacc caaatgcagc tcccaaccca ctccccaggc tagacatgct tgtgtccaca 180 cagcacacca atgtgatact tccactgacc ggct 214 <210> 583 <211> 95 <212> DNA <213> Homo sapiens <400> 583 atgcagtgtg ttctgaggtc ctgtcacccc tgaggctgtg tgtgtccttt gccaaattaa 60 agagtcttac tgaatgcggt gcatccagga gacag 95 <210> 584 <211> 244 <212> DNA <213> Homo sapiens <400> 584 acttttattt tctatgcaaa ggtgattcag agaatttata taaaggcggg cgaggggcag 60 ccgagcaggg agctttggga cagggctggg gcccccatat cccccccggg ccacctgctt 120 tccctcctat ggctcccctg gaacaggagg gagagccaag ggggcggccc agcctggaca 180 gcgcccgctc ctgcctgggt gcacacacgg cgggcctgag ctccagcatc tgagtttggg 240 ggta 244 <210> 585 <211> 170 <212> DNA <213> Homo sapiens <400> 585 tgcacattgt gacatgtaca ctaaaactta aagtataata ataataaaat aaaaaaaaaa 60 gaaaagaacc tagtgtgtta aaccttaaat gcccttagaa ataacctaga ccagtgtttc 120 ttaaactgtg gtcatgagat cagttgaatg gattatgacc aacattgaaa 170 <210> 586 <211> 233 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (160)..(183) <223> n is a, c, g, or t <400> 586 cttgctttcc ctaggagttg aatccttctc cctgcctacc tgcagcatct cctttccctt 60 taaaatgacc atgtagtggc aagcagcctt ttactcttct gttagctctg gactcttaac 120 acttaagtta ctcttctgaa attgctagga ccattggggn nnnnnnnnnn nnnnnnnnnn 180 nnnatgtccg acctgtgatc gtggtacagc attagctgaa atttaccctt gtt 233 <210> 587 <211> 240 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (191)..(191) <223> n is a, c, g, or t <220> <221> misc_feature <222> (207)..(207) <223> n is a, c, g, or t <400> 587 aaggaccctg aaaaatgact tctcatttcc tgcctgcaga aaagagaaat attaggatag 60 tgttgtgtgc aaaaaaatgc aagcttgcaa tgagagatgc agagtgtgag ggagagaggc 120 acgaaggggg tggagaaaaa agacagagaa tttgaggttg actcacggct ttgaagggaa 180 aacaggaaga ngaagaaagt ctgtctncca tgggtcggca acccacactt tacacatttt 240 <210> 588 <211> 273 <212> DNA <213> Homo sapiens <400> 588 ataagtgtac caggactcta aaagaaactt gtttgtataa tgctatccaa ggtatgtagc 60 ccagggaata accaacctga tgtgtgttat gacccatttt aagcctcccg tgatcacagt 120 ttttaaaata aaattaagga ctggtcctat ttctaggtga cacaagtaag gtaatagcta 180 gaacgggaaa aaagaggggc ccccaaaaat gtaaccttaa aatttggtgc ttgtgccgct 240 attgatagta agcagcatgg aataggatgt ggt 273 <210> 589 <211> 179 <212> DNA <213> Homo sapiens <400> 589 taacagtgca taaatcaatc caaatttaga ccctggcaac cagttcccca ttgctcatct 60 acgggactct gtcaacggta aataggcaat catctctctt gaaaagtata catcctctct 120 cgcactggtg gaaagcaaat tgactttttg tttgctgtat aaaaccctta gcacttcaa 179 <210> 590 <211> 186 <212> DNA <213> Homo sapiens <400> 590 ggcaggaccg tgccacacca gctgtccaga gtcggaggac cccagctcct cagcttgcat 60 ggactctgcc ttcccagcgc ttgtcccccg aggaaagcgg ctgggcgggc ggggagctgg 120 gcctggagga tcctggagtc tcattaaatg cctgatttgt gaccatgtcc accagtatct 180 ggggtg 186 <210> 591 <211> 238 <212> DNA <213> Homo sapiens <400> 591 ttcggcattc tccaagtcat ctagcccttc atcctcctcc acatcatcaa agtcgtcgcc 60 atcaaaattg tcctcgttgt ctgacatgac accctcgcct cagcgacccc gctgcgcccc 120 ggtcccgcgc ggagacccgc aaacagcgac actacgactc gcgcggctcc tagcttatct 180 tgcgcctcgt gccgaattcg ccacccaggc ctcgctacaa ttacggaccg ttatagta 238 <210> 592 <211> 148 <212> DNA <213> Homo sapiens <400> 592 caacctttta gctatgatga cacataacaa aagatgttta tgtactaata gttgaaatct 60 gcctttttct cattcaagaa ggcatacaaa tatctgagag tgactttgtt gtatggctac 120 ccttgtgatc tacagtaatt tattcttt 148 <210> 593 <211> 271 <212> DNA <213> Homo sapiens <400> 593 gtgggagaag ttggcgtcct aggctgggga ttggtcgggg gaccttaaag aaaaaggcca 60 gggctgaggg tcctgaggag agagagagag gccacgtgga tggaggactg tcaccccctt 120 ctcggttctg tcaccccctt gagtctaact cactgttgag gggaggaaga agggggatgg 180 acggaaggga gaccgaggaa aggctttcgg gagtggggac attatccacc cagaggtgtg 240 ctacccacaa ccaccgcgag atccttagag t 271 <210> 594 <211> 233 <212> DNA <213> Homo sapiens <400> 594 gaactgattt caaggaatgg gtccttccct tcagagccac atgtgtgcgg gacacccaga 60 cagaaaacac aaacacaaag tcgagtggag ggcatttgga aggagcagtg aagccgagcc 120 aggaaatacc aagatggcga gccagtgtgc ttgtagagat tgtagagagg gtagaattga 180 cactgtggac cctggcctcg atagagaaag gcatcagcta aggaagttgt tca 233 <210> 595 <211> 217 <212> DNA <213> Homo sapiens <400> 595 gaacattctg gatagcaagc ccactgcaaa caagaagtgc gacctgatca gcatccccaa 60 gaaaaccaca gacacggcca gtgtgcaaaa tgaagccaag ttggatgaga ttttaaaaga 120 gatcaaatct ataaaagaca caatctgcaa tcaagatgag ccgtatttcc aagttagaac 180 aagcagatgg caaagatagc agcctgaagg tcccacc 217 <210> 596 <211> 267 <212> DNA <213> Homo sapiens <400> 596 tgataatctc aagactcctc ccttagctac tcaggaggcc gaggcggaaa aaccacccaa 60 acccaagagg tggagggtgg atgaggtgga acaatcaccg aaacccaaga ggcggagggc 120 ggatgaggtg gaacaatcgc ccaagcccaa gaggcagagg gaggccgagg cacaacaatt 180 acccaaaccc aagaggcgga ggttgagtaa gctgagaaca cgccattgca ctcaagcctg 240 ggcaataaga ataaatccgt gggtcga 267 <210> 597 <211> 275 <212> DNA <213> Homo sapiens <400> 597 aatttaccaa gccacatatt gggaatggta ccccaggcag aaggagtaga gtaagcaagc 60 cagaaaggaa atactatggt gcttttgagt aactgcagtg tggctgaaga atgtggaaaa 120 tgatgaggat aaagaggtgg acagggaact aggtaaggga gggccttcct tttaaataat 180 tagaccttgt cctgtgtaca tttaatggga ttttaatcag gccataatgc caaatttctt 240 tacttcggaa ggatctttat ggtgatggtt tcaga 275 <210> 598 <211> 35 <212> DNA <213> Homo sapiens <400> 598 atttttcttg gcctagttgt gtgccatgga tattt 35 <210> 599 <211> 156 <212> DNA <213> Homo sapiens <400> 599 gagggatatt attttccata gccattacca tgatacatat gatactgcct aggtagagct 60 gggactgtag ggtggggaac caatgctgtc ctgcacactg aaactatgaa tgccaagata 120 tcactgccag atccttctgt ggatagctgg cggcat 156 <210> 600 <211> 243 <212> DNA <213> Homo sapiens <400> 600 gaagcctgac cccaagtgtg tcttcaccta tgtgcagtcg ctctacaacc acctgcgacg 60 ccacgaactg cgcctgcgcg gcaagaatgt ctagcctgcc cgcccgcatg gccagccagt 120 ggcaagctgc cgcccccact ctccgggcac cgtctcctgc ctgtgcgtcc gcccaccgct 180 gccctgtctg ttgcgacacc ctccccccca catacacacg cagcgttttg ataaattatt 240 ggt 243 <210> 601 <211> 229 <212> DNA <213> Homo sapiens <400> 601 gcattattac tgatacttgc acacagtcaa aagcgcagac tggatggatg gtcttttata 60 aggcatttaa gggtacacta ctgtgtttca ctgaccatac atttttctta gcccctcaag 120 taatatagca cagagttatg aatgacaatt cccctaacca ttcctcttca tatctgcctc 180 ttccccttac catcgtaatt ctccaaactg gtcataaagg cactctgtg 229 <210> 602 <211> 93 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (33)..(48) <223> n is a, c, g, or t <400> 602 cattaagtcc tctgtaaggt gtcaggcaag ccnnnnnnnn nnnnnnnntg ggtaagtcct 60 aaccccccac aaaggtgttc ccagtgacta cct 93 <210> 603 <211> 273 <212> DNA <213> Homo sapiens <400> 603 ttcgctggtt ctgaatgtca tttttcctcc ctggtgtggt tttacatttt cagcttcttt 60 cccttttctt ctctcccacc ctcaaaattc tgccttagca tttgtgtgct taattaaatc 120 cactctgtgc tttatagttg gagaatgtgg acaatacaaa gatttggggt ggggtcatac 180 agtgtataca aaacacagac actatgtgtt tggacaaatt cgcctagcgt gagaatcatc 240 agtagtgagt taaacgtttg aaatcagagc caa 273 <210> 604 <211> 164 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (80)..(98) <223> n is a, c, g, or t <400> 604 taattattgc tgtggatttc tctctagcat tttagctcat tccagtaaat gatttttttc 60 tttatgaaat agaactaccn nnnnnnnnnn nnnnnnnngt tcaacaacaa caaactgaag 120 ggggagaaaa atacaccatt accacagcaa caaattagtt tatg 164 <210> 605 <211> 275 <212> DNA <213> Homo sapiens <400> 605 ttctcccagt acctcatttg cacaagcctt cctgccattc ttcaaatatg cgaagcctgt 60 tctcacctca aagccattgt acttgctgtt tcctatgcct gaatgttctt cccacagatg 120 ttgacaagac ttgctccttc acttcaatga cattcagata tcttattctc agagagcatt 180 tgacaaccta tctaaaatag ctccccctca ctgttcctgc ccatgctctt tataccccat 240 tttactttca tctttcttcc tagtactgac attat 275 <210> 606 <211> 271 <212> DNA <213> Homo sapiens <400> 606 agaactagca aaagccaagg ccctggggcg gggaggagcc tggtatgttc aaggggcaga 60 agggaggctg aagcagagtg atcaagcgga cagggcaggc agagcctcaa atcccagact 120 gaggaacatg gtgaacgagg acacttcggg ggtccacaca taaagacgga gacagagact 180 cagggcagga aagtcacatg ccctgggaca ccccagtaaa cagagccaaa ctcaaacctc 240 agcctgtctg cagctgacat aggatgaagt t 271 <210> 607 <211> 160 <212> DNA <213> Homo sapiens <400> 607 taagttatta actgaggctg accagagggg aggacccccc ctttaccacc ccatgcactt 60 tgcgagctgc cccttcttcc cccacatcag agagaaatgc ccccacacca gagccccaag 120 ggtagggctg ccgatcagag ctgtgagtta acacaacagg 160 <210> 608 <211> 155 <212> DNA <213> Homo sapiens <400> 608 agcaccagta gtggttgggg ccctcccctc aggctccatt tttaataagt ttttagtatt 60 tttgttaatg tgaggcattg agctgttggg ttttgtatat tatttatata gagaccccag 120 agctgttgca cccaatacac agagcttctt tgcaa 155 <210> 609 <211> 252 <212> DNA <213> Homo sapiens <400> 609 tacacacatg tgagtctggc tgggctggta ttttgtttga tcttcctgga aatgagcagt 60 gactaacgct cacataactg gttttttttt ttatctgggc tgatgaatac atttacctaa 120 gaaactcatt tcgttttact taagagggga agtgcagttt tcttttggca gttcagaatc 180 caagcacttg atttgctggg tttggaaaac tccttttttg gccttctatg tgcttagcca 240 taacaattcc at 252 <210> 610 <211> 286 <212> DNA <213> Homo sapiens <400> 610 agaggggtca ccatactttt cttcagttcc atgttaactg aacaatcttt ttcttgctaa 60 tctgaacacc ctgtgcaata gagtctgact ccattttttg atgtttgact gcagacatct 120 tttcagccta acccttccat cttctctttc tgtccaacac tggggcaagc tgacaaaaat 180 cctcaggtgc tcctcttctg taaccagcag taagttcgaa tcatacactg ccaccctcac 240 cccaaccctg tcccttaacc acattaaaac ccaaagccag tctcct 286 <210> 611 <211> 80 <212> DNA <213> Homo sapiens <400> 611 gggcctgttg aagatgcttg tattttactt ttcccttgta aatgctattc ccatcacagc 60 tgaacttgtt gagatccccg 80 <210> 612 <211> 290 <212> DNA <213> Homo sapiens <400> 612 gaggagataa actaacagag gtcaagaaga tgaagagttg tttcaaacat ggtacagttg 60 agattcctag cattattcta gtcagacgtg tctgtcaagt aggccattgg atatcgggat 120 tgggatttga ggggaatcca tagatggaaa tataagttca agaggcatca gcatggatac 180 cctatttgga tctggatgaa attacctaaa ggagaaaatg caggaggacg tgatgctggg 240 tgattttaga ggagaaacca tgaaggattc caaggagcag cagttggtca 290 <210> 613 <211> 117 <212> DNA <213> Homo sapiens <400> 613 aaaaattcat cccatatcca gaaagtacca gttataaaga ttgctgacca agcaaagttt 60 tgcatcaaag tgtcacctca ttgctctgac caaagactga ctgttgtggt tttaact 117 <210> 614 <211> 214 <212> DNA <213> Homo sapiens <400> 614 acaccagtgt gctacagtgg cgggtggtct gatgcggcca gggaagagtc aggtgtcagg 60 gcaggaattc tattttcggg agatgtctat tgccgagtag agtaatatat acccagagta 120 tgtctatagc agagggggtt atgggggcgg gagggtagac tgacatacag aagtctctat 180 ttatccgggt gggaagaggg agtcacatcg cttt 214 <210> 615 <211> 283 <212> DNA <213> Homo sapiens <400> 615 ccagctggag gtgacgaggg atgatgcgcg tcttcttgtt gtcccgagcc gcgttgcccg 60 ccagctccag gatctcggcg gtcagatact cgaggaccgc agccatgtag acgggcgcgc 120 cggcccccac tcgctccgcg tagttgcctt tgcgcagcaa gcgatgcact cgccctaccg 180 ggaactgaag gccagcgcgg gacgagcgcg acttggcctt ggcgcgggcc ttgcctcctt 240 gcttgccacg accagacatg acagcgatag tagtcaccga gag 283 <210> 616 <211> 192 <212> DNA <213> Homo sapiens <400> 616 gaactatgat tgcactactg tgctccagct tgggcaacag agtgagatct tgtctccaaa 60 agtccttgaa ggattttagg aagttgttaa aagtcttgaa acgatgtttg ggggcatgtt 120 agggttcttg aatgtttaat tcctctaata actgcttatt caagagaagc atttctgact 180 gggtgcaggg ca 192 <210> 617 <211> 234 <212> DNA <213> Homo sapiens <400> 617 atgaactttt gtgcttagtg agtgcaacga aatatttaaa caagttttgt attttttgct 60 tttgtgtttt ggaatttgcc ttatttttct tggatgcgat gttcagaggc tgtttcctgc 120 agcatgtatt tccatggccc acacagctat gtgtttgagc agcgaagagt ctttgagctg 180 aatgagccag agtgataatt tcagtgcaac gaactttctg ctgaattaat ggta 234 <210> 618 <211> 146 <212> DNA <213> Homo sapiens <400> 618 ggaggatgaa gaaggttata acgatggaga ggtagatgac gaggaagatg aagaagagct 60 tggtgaagaa gaaaggggtc agaagcgaaa acgagaacct gaagatgagg gagaagatga 120 tgactaagtg gataacctat tttgaa 146 <210> 619 <211> 63 <212> DNA <213> Homo sapiens <400> 619 gtgagctgtg atgttgccgc tacactccag gtgacagagc aagaccctaa gaccttatct 60 ctt 63 <210> 620 <211> 149 <212> DNA <213> Homo sapiens <400> 620 atcaactgaa tccaatattt cctgtggcaa ataacacttt cctcatttca taccttttct 60 cctctcttcc atgccaacat ttctccaccc acaacgtaca ctttttattt ctccatcaat 120 atttgaaagc gagtgatttg tgaccagga 149 <210> 621 <211> 151 <212> DNA <213> Homo sapiens <400> 621 cagcaacccc tgcattcctt ttttttaccg ggctgacgag aatgatgagg tgaagatcac 60 tgtcatctaa aagccggcta ctgtcagcaa agcctgaaga agtggggctg gataccctgc 120 ccccaccata tccctaccat cccttctcag t 151 <210> 622 <211> 258 <212> DNA <213> Homo sapiens <400> 622 acaagcagac atgcactctc ttcttctcct ggcacacgcc gctggcctgc gagcaagcga 60 ccgaatgttc cgtgaggaat ggaagctcta ttgttgactt gtctcccctt attcatcgca 120 ctggtggtta tgaggcttat ggtaagagtg aggatgatgc ctccgatacc aaccctgatt 180 tctacatcaa tatttgtcag ccactaaatc ccatgcacgg agtgccctgt cctgccggag 240 ccgctgtgtg caaagttc 258 <210> 623 <211> 278 <212> DNA <213> Homo sapiens <400> 623 tctcctcttc agtcttcatc atgtttttgt ccctcaaaca tcagccttac gtcctctttt 60 cttccctctg catcctctct ccttgagaga cctcatccag cccatgtttt caacaatcat 120 ctatacaaca atgatcttct acatacattc ctggcccaga tccctgccct gaattcccag 180 cctatagatc caacaaccct cctccaatac tgtctttccc agccattctc caggcctctg 240 ctatggtctg aatgtttgtg tccaaaaaca tgatgaag 278 <210> 624 <211> 290 <212> DNA <213> Homo sapiens <400> 624 aagacagtcc tcagaaaacc caagctttca tacagatgcc aaaaaagtcc atggggttta 60 attctttgac cattttgagt gcagggactt attcatgctt acatcctcac aactcagctt 120 ggggactgcc tcacacctgg cagctgatcc tttttgtttt ttaaatgtaa gaagccacac 180 tgagggctct ccaggcggaa aaagttagga cacaggacca gcatttcttt ccagccactt 240 gtggatccct gattgaatgt cacccttgac tgcctaactc atctctttcc 290 <210> 625 <211> 292 <212> DNA <213> Homo sapiens <400> 625 cgactaatca tcttacggca gagaacaaac accaccacca agtaaaaata tccctgcaac 60 aaacacaacg gattccaatt ccttccggcc aacccaatgt tccacggcgt ggacacatac 120 tggttgggcg caggcatcct cgcagtgacg tcccctgtac tcgtggctgc agttgcagtg 180 ataggagccg tgcgtgttct cacagagggc cccgtgcagg caagggtttc cagagcactc 240 gtcgatatca ctctgacacc tttctcccct aaaacccgaa tcacactgac aa 292 <210> 626 <211> 249 <212> DNA <213> Homo sapiens <400> 626 actatccagg aaaggaaatt tacagtatat ctcattttgg ggtttggaag gatgtgtaca 60 aaatagtgta attgaaaatt gataaaataa aaaatcttat atacttatat tgggtaaagg 120 aagataggag aagtgacaga gcgagagaga gagagagtgt ttatgtgtga aggaaataag 180 aaagctcagt cttataagaa gtctcagata atgtgtagac tttacagaaa agcagtttaa 240 gaatggtat 249 <210> 627 <211> 262 <212> DNA <213> Homo sapiens <400> 627 gtatccaagt ccattgttac taggttggag gctggagatt ctaaatggct tccagaccat 60 ctctctgatt ctctttggga gatggggtct gaaagacaat gtcagtagtt ttgggaaatt 120 ctagaaagtg tgcttggaaa cgtgggaaga gctcttgcct agtgcctaaa tgctccattt 180 gcagctctag ccaagtagat acttggtagg tatagagccg ggtttgcgtt tatattagca 240 aaacctatgt cagagttgaa ga 262 <210> 628 <211> 147 <212> DNA <213> Homo sapiens <400> 628 ttctttatgg tggtgggatg attattgtaa tcatacttgg gaacagaagt gatgaaaaag 60 gtatgttact tgagatatgg gaaacgctat tttccatgtt tagttatggg gtattcaagt 120 ctaactagtg gaaagtatgg atacatt 147 <210> 629 <211> 97 <212> DNA <213> Homo sapiens <400> 629 tctgtgattc tctttgtcag ctcctttgcc tatatttgca tctcagttga cacccctgat 60 tctgacttgt ccttatcttc ctaccagtct ctgccga 97 <210> 630 <211> 234 <212> DNA <213> Homo sapiens <400> 630 gttgtatcaa caatgattaa ctcctttatt atacatacac atgaatgtgc atttttggta 60 aatgcataaa tgagattcta taatgtttac tgatctttat attacagatt ttctcttctt 120 ttaggattag ctcagcttgc cccccctttc catctccacc atctatagtg agcctctcca 180 taattagtgc caaccattag tctcgttcat atttttacac caggagtcaa caaa 234 <210> 631 <211> 115 <212> DNA <213> Homo sapiens <400> 631 ccccagccca agagatgaac atctggggac taatatcata gacccatctg gaggctccca 60 tgggctagga gccagtgtga ggctgtaact tatactaaag gttgtgttgc ctgct 115 <210> 632 <211> 56 <212> DNA <213> Homo sapiens <400> 632 gaagactaaa cagaaaccag aactgaaaca ttcacctggt agcaaatgac actttg 56 <210> 633 <211> 251 <212> DNA <213> Homo sapiens <400> 633 ttctcgcccc acctagggac agattccccc tgctcttttt gtcctagaaa ccccgctagt 60 ttgggatggt agcgtctggg gtggggaggg cttccccttc cccactcgag ggtgcgggtg 120 gggaaggggg ggtgggtgga gacagccctg gggcagggag gatggtctct ccactgtaga 180 aagtagagta ggattgtggt cagacttaat ttgaggcatc tagtgaagac acgtacaaat 240 ccaccaagga a 251 <210> 634 <211> 294 <212> DNA <213> Homo sapiens <400> 634 gctggtcatc tcaatggcag gtggtagggt actcagaagg gtggttgact ccgtgagagg 60 ggaagaggtg gaccgagagg tctgaggggt tgaggactca ggcggaggat tggatgtggt 120 caactcagca atcggtgctg tgcttgtgtg ggtggggggc cccgtgcttc cagtggtggg 180 tgttggggtt ggggtcaccg tagtggtggt gctgatgggt atcatggttg gggtctgtgt 240 gccggtgggt gttggggttg cggtcaccga tagttgtggt ggtgatgggt gtca 294 <210> 635 <211> 221 <212> DNA <213> Homo sapiens <400> 635 tttgaaaaat gtttacagct ccacaaagat agacaaattt ccttgatgta tgaaaaatgt 60 caacaaacca ataaaaagac taacaattca gtagaaaaat ggacaaagaa caaatatgga 120 gattcataga aatgagagat aaatgtcatg atgagaaggt gaggtgctca cttgatttat 180 aagagaaatg aaaattaaaa ctacaccaga tgccattttt t 221 <210> 636 <211> 279 <212> DNA <213> Homo sapiens <400> 636 cgcggcgatt cttgaggtcg atgtcgcgga tagcgccgta tttgtagaac acgtcctcaa 60 tgtccttggt tcggatgtct ggaggtaagt tacccacgta gatgcggcaa tcgttgttcc 120 ctgcggggcc acgaatcaca ccacctcccg acatggcggt gacgaaaagc gcggactcga 180 gaacaggcct tcccaccaag cctagcgcac ggcagagcga gcccgcagcg gcaccacgtc 240 tcccgcggcc cctccaaaat ggcgccttta tcagctcgg 279

Claims

대상체로부터 수득되는 샘플에서 결장암을 진단하는 방법으로서,
대상체로부터 수득되는 핵산을 포함하는 샘플에서의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계: 및
상기 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유도된 결정 점수를 결장암의 진단을 나타내는 대조군 임계값과 비교하는 단계를 포함하되,
임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도된 결정 점수가 결장암의 진단을 나타내며, 이에 의해, 상기 대상체로부터 수득되는 샘플에서 결장암을 진단하는 것을 특징으로 하는 샘플에서의 결장암의 진단 방법.
제1항에 있어서, 상기 대조군 임계값이 공지되어 있는 결장암 샘플(들)에서의 표 6에 열거된 결장암-관련 핵산 분자로부터의 해당하는 전사체 유래의 임계값을 포함하며, 공지되어 있는 결장암 그룹으로서 임계값의 동일한 측상의 발현 수준 또는 그로부터 유래된 결정 점수가 결장암의 진단을 나타내는 것을 특징으로 하는 샘플에서의 결장암의 진단 방법.
결장암 샘플을 분류하는 방법으로서,
대상체로부터 수득되는 핵산을 포함하는 샘플에서의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계: 및
상기 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유도된 결정 점수를 공지되어 있는 분류를 나타내는 대조군 임계값과 비교하는 단계를 포함하되,
임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도된 결정 점수가 결장암 샘플의 분류를 가능하게 하는 것을 특징으로 하는 결장암 샘플의 분류 방법.
제3항에 있어서, 상기 대조군 임계값이 공지되어 있는 분류의 결장암 샘플(들)에서의 표 6에 열거된 결장암-관련 핵산 분자로부터의 해당하는 전사체 유래의 임계값을 포함하며, 공지되어 있는 분류의 결장암 샘플(들)로서 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유래된 결정 점수가 결장암 샘플의 분류를 가능하게 하는 것을 특징으로 하는 결장암 샘플에서의 결장암의 진단 방법.
제3항 또는 제4항에 있어서, 상기 결장암 샘플이, I기, II기, III기 및 IV기로 분류되는 것을 특징으로 하는 결장암 샘플에서의 결장암의 진단 방법.
제3항 내지 제5항 중 어느 한 항에 있어서, 상기 분류된 결장암에 효과적일 치료 계획을 선택하는 단계를 추가로 포함하는 것을 특징으로 하는 결장암 샘플에서의 결장암의 진단 방법.
제6항에 있어서, 상기 치료가 외과적 절제술, 화학요법, 방사선 또는 그들의 임의의 조합인 것을 특징으로 하는 결장암 샘플에서의 결장암의 진단 방법.
결장암을 위한 치료에 대한 반응을 예측하는 방법으로서,
대상체로부터 수득되는 핵산을 포함하는 샘플에서의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계: 및
상기 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유도된 결정 점수를 공지되어 있는 치료에 대한 반응을 나타내는 대조군 임계값과 비교하는 단계를 포함하되,
임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도된 결정 점수가 치료에 대한 유사한 반응을 나타내며, 이에 의해, 치료에 대한 반응을 예측하는 것을 특징으로 하는 결장암을 위한 치료에 대한 반응의 예측 방법.
제8항에 있어서, 상기 대조군 임계값이 공지되어 있는 치료에 대한 반응을 갖는 결장암 샘플(들)에서의 표 6에 열거된 결장암-관련 핵산 분자로부터의 해당하는 전사체 유래의 임계값을 포함하며, 공지되어 있는 치료에 대한 반응을 갖는 결장암 샘플(들)로서 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유래된 결정 점수가 치료에 대한 유사한 반응을 나타내며, 이에 의해 치료에 대한 반응을 예측하는 것을 특징으로 하는 결장암을 위한 치료에 대한 반응의 예측 방법.
제8항 또는 제9항에 있어서, 상기 치료가 외과적 절제술인 것을 특징으로 하는 결장암을 위한 치료에 대한 반응의 예측 방법.
제8항 내지 제10항 중 어느 한 항에 있어서, 상기 치료가 화학요법 및/또는 방사선인 것을 특징으로 하는 결장암을 위한 치료에 대한 반응의 예측 방법.
결장암 대상체의 장기간 생존을 예측하는 방법으로서,
대상체로부터 수득되는 핵산을 포함하는 샘플에서의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계: 및
상기 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유도된 결정 점수를 장기간 생존의 이력을 갖는 것을 나타내는 대조군 임계값과 비교하는 단계를 포함하되,
임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도된 결정 점수가 대상체의 장기간 생존을 나타내며, 이에 의해, 대상체의 장기간 생존을 예측하는 것을 특징으로 하는 결장암 대상체의 장기간 생존의 예측 방법.
제12항에 있어서, 상기 대조군 임계값이 장기간 생존의 이력을 갖는 대상체(들)로부터 수득되는 결장암 샘플(들)에서의 표 6에 열거된 결장암-관련 핵산 분자로부터의 해당하는 전사체 유래의 임계값을 포함하며, 장기간 생존의 이력을 갖는 대상체(들)로부터 수득된 결장암 샘플(들)로서 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유래된 결정 점수가 상기 대상체의 장기간 생존을 나타내며, 이에 의해, 대상체의 장기간 생존을 예측하는 것을 특징으로 하는 결장암 대상체의 장기간 생존의 예측 방법.
제13항에 있어서, 상기 장기간 생존은 적어도 5년의 생존을 포함하는 것을 특징으로 하는 결장암 대상체의 장기간 생존의 예측 방법.
대상체에서의 결장암 재발을 예측하는 방법으로서,
대상체로부터 수득되는 핵산을 포함하는 샘플에서의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계: 및
상기 적어도 2개의 결장암-관련 핵산 분자의 발현 수준 또는 그로부터 유도된 결정 점수를 재발의 이력을 나타내는 대조군 임계값과 비교하는 단계를 포함하되,
임계값의 동일한 측 상의 발현 수준 또는 그로부터 유도된 결정 점수가 대상체에서의 재발을 나타내는 것을 특징으로 하는 대상체에서의 결장암 재발의 예측 방법.
제15항에 있어서, 상기 대조군 임계값이 재발의 이력을 갖는 결장암 샘플(들)에서의 표 6에 열거된 결장암-관련 핵산 분자로부터의 해당하는 전사체 유래의 임계값을 포함하며, 재발의 이력이 공지되어 있는 결장암 샘플(들)로서 임계값의 동일한 측 상의 발현 수준 또는 그로부터 유래된 결정 점수가 상기 대상체에서의 재발을 나타내는 것을 특징으로 하는 대상체에서의 결장암 재발의 예측 방법.
대상체에 대한 맞춤형(personalized) 결장암 유전체학 프로파일을 제조하는 방법으로서,
대상체로부터 수득되는 핵산을 포함하는 샘플에서의 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계: 및
유전자 발현 분석에 의해 수득되는 데이터를 요약하는 리포트(report)를 생성하는 단계를 포함하는 것을 특징으로 하는 대상체에 대한 맞춤형 결장암 유전체학 프로파일의 제조 방법.
제1항 내지 제17항 중 어느 한 항에 있어서, 상기 대상체로부터 수득되는 핵산은 상기 대상체로부터 수득되는 대장 조직의 샘플로부터 추출된 RNA 및/또는 RNA로부터 전사되는 cDNA를 포함하는 것을 특징으로 하는 대상체에 대한 맞춤형 결장암 유전체학 프로파일의 제조 방법.
제18항에 있어서, 상기 샘플은 생검 샘플인 것을 특징으로 하는 대상체에 대한 맞춤형 결장암 유전체학 프로파일의 제조 방법.
제18항 또는 제19항에 있어서, 상기 샘플은 고정된 및/또는 파라핀 포매된(embedded) 샘플인 것을 특징으로 하는 대상체에 대한 맞춤형 결장암 유전체학 프로파일의 제조 방법.
제1항 내지 제20항 중 어느 한 항에 있어서, 상기 발현 수준은 대조군 유전자(들)에 대해 정규화되는 것을 특징으로 하는 방법.
제1항 내지 제21항 중 어느 한 항에 있어서, 상기 발현 수준은 PCR 및/또는 마이크로어레이-기반의 방법으로 결정되는 것을 특징으로 하는 방법.
제1항 내지 제22항 중 어느 한 항에 있어서, 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계는 MUM1 및 SIGMAR1 전사체에 대한 발현 수준을 검출하는 것을 포함하는 것을 특징으로 하는 방법.
제1항 내지 제23항 중 어느 한 항에 있어서, 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계는 MUM1, SIGMAR1, ARSD, SULT1C2 및 PPFIBP1 전사체에 대한 발현 수준을 검출하는 것을 포함하는 것을 특징으로 하는 방법.
제1항 내지 제24항 중 어느 한 항에 있어서, 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계는 ARSD, CXCL9, PCLO, SLC2A3, FCGBP, SLC2A14, SLC2A3, BCL9L, 및 MUC3A, OLFM4 및 RNF39 전사체에 대한 안티센스 서열에 대한 발현 수준을 검출하는 것을 포함하는 것을 특징으로 하는 방법.
제1항 내지 제25항 중 어느 한 항에 있어서, 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계는 표 1에 열거된 전사체에 대한 발현 수준을 검출하는 것을 포함하는 것을 특징으로 하는 방법.
제1항 내지 제26항 중 어느 한 항에 있어서, 표 6에 열거된 적어도 2개의 결장암-관련 핵산 분자의 발현 수준을 검출하는 단계가 표 2에 열거된 전사체에 대한 발현 수준을 검출하는 것을 포함하는 것을 특징으로 하는 방법.
서열 번호 1 내지 636에 기재된 핵산 서열 또는 그의 상보체 중 하나에 특이적으로 혼성화할 수 있는, 길이가 20 내지 40개 뉴클레오타이드인 핵산 분자를 포함하거나, 실질적으로 그로 이루어진 결장암에 대한 유전자 발현 시그니처(signature)의 검출을 위한 핵산 프로브.
제28항에 있어서, 상기 프로브는 표지되는 것을 특징으로 하는 핵산 프로브.
제29항에 있어서, 상기 프로브는 방사성 표지되거나, 형광 표지되거나, 비오틴 표지되거나, 효소에 의해 표지되거나, 화학적으로 표지되는 것을 특징으로 하는 핵산 프로브.
프로브 세트로서, 2개 이상의 프로브를 포함하되, 각 프로브가 서열 번호 1 내지 636에 기재된 핵산 서열 또는 그의 상보체 중 하나에 특이적으로 혼성화할 수 있는, 길이가 20 내지 40개 뉴클레오타이드인 핵산 분자를 포함하거나, 실질적으로 그로 이루어진, 결장암에 대한 유전자 발현 시그니처의 검출을 위한 프로브 세트.
제31항에 있어서, 상기 프로브는 표지되는 것을 특징으로 하는 프로브 세트.
제32항에 있어서, 방사성 표지되거나, 형광 표지되거나, 비오틴 표지되거나, 효소에 의해 표지되거나, 화학적으로 표지되는 것을 특징으로 하는 프로브 세트.
제31항 내지 제33항 중 어느 한 항에 있어서, 상기 세트는 표 6에 열거된 각 전사체에 상보적인 적어도 하나의 프로브를 함유하는 것을 특징으로 하는 프로브 세트.
제34항에 있어서, 표 6에 열거된 전사체의 서브세트(subset)에서 각 전사체에 상보적인 적어도 하나의 프로브를 포함하는 프로브 세트로서, 상기 서브세트가 표 6의 전사체의 적어도 1%, 5%, 10%, 25%, 50%, 75% 또는 95%를 포함하는 것을 특징으로 하는 프로브 세트.
제31항 내지 제35항 중 어느 한 항의 프로브의 세트를 포함하는 핵산 어레이를 포함하는, 결장암에 대한 유전자 발현 시그니처의 검출을 위한 디바이스(device).
결장암 핵산에 대한 유전자 발현 시그니처의 증폭을 위한 프라이머의 쌍으로서,
서열 번호 1 내지 636으로 기재된 핵산 서열 또는 그의 상보체 중 임의의 것에 특이적으로 혼성화되는 핵산 서열을 포함하는, 길이가 15 내지 40개 뉴클레오타이드인 정방향 프라이머: 및
서열 번호 1 내지 636으로 기재된 핵산 서열 또는 그의 상보체 중 임의의 것에 특이적으로 혼성화되는 핵산 서열을 포함하는 길이가 15 내지 40개 뉴클레오타이드인 역방향 프라이머를 포함하되,
프라이머 세트가 핵산의 증폭을 유도할 수 있는 것을 특징으로 하는 프라이머의 쌍.
결장암 핵산에 대한 유전자 발현 시그니처의 증폭을 위한 프라이머 쌍의 세트로서, 서열 번호 1 내지 636으로 기재된 핵산 서열 중 임의의 것의 증폭에 사용하기에 적절한 적어도 2개의 프라이머 쌍을 포함하는 것을 특징으로 하는 프라이머 쌍의 세트.
제38항에 있어서, 상기 프라이머 쌍의 세트는 서열 번호 1 내지 636에 기재된 핵산 서열의 서브세트의 증폭에 사용하기에 적절한 프라이머 쌍을 포함하며, 상기 서브세트가 서열 번호 1 내지 636으로 기재된 핵산 서열의 적어도 1%, 5%, 10%, 25%, 50%, 75% 또는 95%를 포함하는 것을 특징으로하는 프라이머 쌍의 세트.
결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법으로서, 결장암 시료로부터 단리된 RNA를 포함하는 샘플에서 1000개 미만의 전사체의 발현 수준을 검출하는 단계로서, 표 6에 열거된 적어도 50개의 전사체가 검출되는 단계를 포함하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
제40항에 있어서, 400개 내지 800개 전사체 발현 수준이 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
제40항 또는 제41항에 있어서, 500개 내지 700개 전사체 발현 수준이 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
제40항 내지 제42항 중 어느 한 항에 있어서, 표 6으로부터의 적어도 100개의 전사체가 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
제40항 내지 제43항 중 어느 한 항에 있어서, 표 6으로부터의 적어도 200개의 전사체가 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
제40항 내지 제44항 중 어느 한 항에 있어서, 표 6으로부터의 적어도 300개의 전사체가 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
제40항 내지 제45항 중 어느 한 항에 있어서, 표 6으로부터의 적어도 400개의 전사체가 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
제40항 내지 제46항 중 어느 한 항에 있어서, 표 6으로부터의 적어도 500개의 전사체가 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
제40항 내지 제47항 중 어느 한 항에 있어서, 표 6으로부터의 적어도 600개의 전사체가 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
제40항 내지 제48항 중 어느 한 항에 있어서, 표 6에 열거된 모든 전사체가 검출되는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
제40항 내지 제49항 중 어느 한 항에 있어서, 표 6에 열거된 전사체가 표 1에 열거된 전사체를 포함하는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
제40항 내지 제50항 중 어느 한 항에 있어서, 상기 결장암 시료는 포르말린 고정된 파라핀-포매 조직 샘플인 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
제40항 내지 제51항 중 어느 한 항에 있어서, 표 6에 열거된 전사체의 발현 수준 또는 그로부터 유도된 결정 점수를 고위험 및 저위험 환자 집단에 대한 해당하는 수준 또는 점수에 대하여 점수화하는 단계를 추가로 포함하는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
제52항에 있어서, 환자가 고위험 그룹에 있는 것으로 결정된 경우, 보조 화학요법을 선택하는 단계를 추가로 포함하는 것을 특징으로 하는 결장암 예후를 나타내는 유전자 발현 프로파일의 제조 방법.
결장암의 예후 방법으로서,
단리된 RNA를 포함하는 결장암 시료에 대한 유전자 발현 프로파일을 제조하는 단계: 및
저위험 또는 고위험 그룹에서 표 6에 열거된 적어도 50개의 전사체의 발현 수준 또는 그로부터 유도된 결정 점수에 기초하여 상기 시료를 분류하는 단계를 포함하는 것을 특징으로 하는 결장암의 예후 방법.
제54항에 있어서, 1000개 미만의 전사체의 수준이 상기 유전자 발현 프로파일에서 검출되는 것을 특징으로 하는 결장암의 예후 방법.
제54항 또는 제55항에 있어서, 800개 미만의 전사체의 수준이 상기 유전자 발현 프로파일에서 검출되는 것을 특징으로 하는 결장암의 예후 방법.
제54항 내지 제56항 중 어느 한 항에 있어서, 700개 미만의 전사체의 수준이 상기 유전자 발현 프로파일에서 검출되는 것을 특징으로 하는 결장암의 예후 방법.
제54항 내지 제57항 중 어느 한 항에 있어서, 상기 시료가 표 6으로부터의 적어도 100개의 전사체의 발현 수준에 기초하여 분류되는 것을 특징으로 하는 결장암의 예후 방법.
제54항 내지 제58항 중 어느 한 항에 있어서, 상기 시료가 표 6으로부터의 적어도 200개의 전사체의 발현 수준에 기초하여 분류되는 것을 특징으로 하는 결장암의 예후 방법.
제54항 내지 제59항 중 어느 한 항에 있어서, 상기 시료가 표 6으로부터의 적어도 300개의 전사체의 발현 수준에 기초하여 분류되는 것을 특징으로 하는 결장암의 예후 방법.
제54항 내지 제60항 중 어느 한 항에 있어서, 상기 시료가 표 6으로부터의 적어도 400개의 전사체의 발현 수준에 기초하여 분류되는 것을 특징으로 하는 결장암의 예후 방법.
제54항 내지 제61항 중 어느 한 항에 있어서, 상기 시료가 표 6으로부터의 적어도 500개의 전사체의 발현 수준에 기초하여 분류되는 것을 특징으로 하는 결장암의 예후 방법.
제54항 내지 제62항 중 어느 한 항에 있어서, 상기 시료가 표 6으로부터의 적어도 600개의 전사체의 발현 수준에 기초하여 분류되는 것을 특징으로 하는 결장암의 예후 방법.
제54항 내지 제63항 중 어느 한 항에 있어서, 표 6에 열거된 모든 전사체의 발현 수준을 사용하여 상기 시료를 분류하는 것을 특징으로 하는 결장암의 예후 방법.
제54항 내지 제64항 중 어느 한 항에 있어서, 표 6에 열거된 전사체가 표 1에 열거된 전사체를 포함하는 것을 특징으로 하는 결장암의 예후 방법.
제54항 내지 제65항 중 어느 한 항에 있어서, 상기 결장암 시료가 포르말린 고정된 파라핀-포매 조직 샘플인 것을 특징으로 하는 결장암의 예후 방법.
제54항 내지 제66항 중 어느 한 항에 있어서, 환자가 고위험 그룹에 있는 것으로 결정되는 경우 보조 화학요법을 선택하는 단계를 추가로 포함하는 것을 특징으로 하는 결장암의 예후 방법.