KR20140040694A - 결장직장암 재발에 대한 예후 서명 - Google Patents

결장직장암 재발에 대한 예후 서명 Download PDF

Info

Publication number
KR20140040694A
KR20140040694A KR1020137020961A KR20137020961A KR20140040694A KR 20140040694 A KR20140040694 A KR 20140040694A KR 1020137020961 A KR1020137020961 A KR 1020137020961A KR 20137020961 A KR20137020961 A KR 20137020961A KR 20140040694 A KR20140040694 A KR 20140040694A
Authority
KR
South Korea
Prior art keywords
seq
colorectal cancer
patient
recurrence
prognostic
Prior art date
Application number
KR1020137020961A
Other languages
English (en)
Inventor
피터 에프. 레헤한
윌리엄 피. 워젤
아르핏 알말
데이빗 더블유. 프라이
Original Assignee
에버리스트 게노믹스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에버리스트 게노믹스, 인크. filed Critical 에버리스트 게노믹스, 인크.
Publication of KR20140040694A publication Critical patent/KR20140040694A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

본 발명의 검정 시스템은 환자에서 결장직장암의 재발 및/또는 비-재발을 예측하는 데에 유용하다. 상기 검정 시스템은 결장직장암 재발과 상관된 예후 유전자 프로파일의 양적 발현에 대하여 환자 샘플을 분석하도록 적합화되어 있다. 상기 프로파일은 서열 1, 2, 3, 4 및 5의 핵산 서열의 발현을 포함한다.

Description

결장직장암 재발에 대한 예후 서명 {PROGNOSTIC SIGNATURE FOR COLORECTAL CANCER RECURRENCE}
관련 출원의 상호 참조
본 출원은 발명의 명칭이 "결장직장암 재발에 대한 5-유전자 예후 서명 {5-GENE PROGNOSTIC SIGNATURE FOR COLORECTAL CANCER RECURRENCE}"인 2011년 1월 18일자로 출원된 미국 특허 가출원 일련 번호 61/433,798에 대한 우선권을 주장하는 바, 그의 개시내용은 전문이 본원에 참조로 포함된다.
발명의 분야
본 발명은 일반적으로 진단 시험에 관한 것이다. 더 구체적으로, 본 발명은 결장직장암과 연관된 서명을 위한 진단 시험에 관한 것이다.
결장직장암은 미국에서 세 번째로 많이 자주 진단되는 암으로써, 매년 150,000 건 가량이 진단되며, 암-관련 사망의 세 번째로 큰 원인이기도 하다. 수술만으로 결절-음성(node-negative) 결장직장암에 대하여 치료된 환자들 중 사분의 일이 "치유"되었으나 5년 안에 재발을 겪게 되는 것으로 생각되고 있다. 현재는, 국립 종합 암 네트워트(National Comprehensive Cancer Network) (NCCN) 임상 실행 지침이 결장직장암 환자에서 재발의 위험성을 예측하는 데에 사용되고 있다. NCCN 지침에 의해 제공되는 것보다 더 우수한 위험성 예측에 의해 더 우수한 치료 계획 및 환자 성과를 달성하기 위해서, 더 높은 암 재발 위험성이 있는 환자를 확인하기 위한 개선된 기술이 요구되고 있다.
개요
전기한 요구는 한 측면에서 적어도 어느 정도까지 결장직장암 재발의 예측을 향상시키는 진단 시험이 개시된 본 발명에 의해 크게 충족된다.
본 발명은 환자에서 결장직장암 재발 및/또는 비-재발의 가능성을 예측하는 데에 유용한 예후 바이오마커 유전자들을 제공한다. 구체적으로, 유전적 프로그래밍 분석(genetic programming analysis)에 의해, 특정 유전자들이 결장직장암 재발 및 비-재발의 예측에 중요한 것으로 확인되었다. 이러한 예후 바이오마커 유전자들은 지도 학습(supervised learning) 기술을 사용하여 예후 규칙 (알고리즘)을 생성시키기 위한 기초를 제공한다. 생성된 예후 규칙은 예를 들어 예후 규칙을 포함하는 기계-판독가능 소프트웨어에 의해 개별 대상체에서의 결장직장암의 재발 및/또는 비-재발 위험성의 예측에 적용된다.
지도 학습 모드의 유전적 프로그래밍을 사용하여, 확인된 예후 바이오마커 유전자인 BMI1, ETV6, H3F3B, RPS10 및 VEGFA의 발현 수준을 기초로 하는 대표적인 예후 규칙이 생성되었다. 이와 같은 규칙, 및 이후의 다양한 지도 학습 기술, 예컨대 유전적 프로그래밍, CART 분석, 지지 벡터 머신(Support Vector Machine) 및 선형 판별 분석(Linear Discriminant Analysis)의 적용에 의해 상기 확인된 예후 바이오마커 유전자들로부터 생성될 수 있는 다른 규칙은 결장직장암 환자의 암 재발 또는 비-재발 위험성을 예측하는 데에 유용한 도구를 제공한다.
본 발명은 대상체의 결장직장암 재발 및/또는 비-재발 위험성을 예측하는 데에 본 발명의 예후 바이오마커 유전자 (BMI1, ETV6, H3F3B, RPS10 및 VEGFA) 및/또는 예후 규칙(들)을 이용하도록 적합화된 시스템, 도구, 키트, 핵산 어레이, 매트릭스, 소프트웨어, 컴퓨터 프로그램 등을 제공한다. 예를 들어, 시스템, 검정, 키트 또는 표면은 대상체의 측정된 유전자 발현 수준을 예후 규칙(들)에 적용하여 결장직장암 재발 및/또는 비-재발 위험성의 평가를 생성하도록 적합화 및/또는 설계된 개시 바이오마커 유전자, 증폭 프로브, 혼성화 프로브, 검정 시약, 데이터 수집물, 컴퓨터 연산(computation), 및 출력 모듈, 컴퓨터 소프트웨어, 기계-판독가능 매체 등 중 1종 이상을 포함할 수 있다.
본 발명은 또한 환자로부터 수득된 샘플에서 예후 바이오마커 유전자 (BMI1, ETV6, H3F3B, RPS10 및 VEGFA)의 유전자 발현 양을 측정하는 단계, 및 해당 위험성을 측정하기 위하여 바이오마커 유전자 발현의 측정된 양을 예후 규칙에 적용하는 단계를 포함하는, 결장직장암 재발 및/또는 비-재발 위험성의 예측 방법을 제공한다. 예후 규칙은 하기 실시예에 확인되어 있는 규칙일 수 있거나, 또는 재발 또는 비-재발을 나타내는 것으로 분류된 결장직장 환자 샘플 군집에서의 바이오마커 유전자 BMI, ETV6, H3F3B, RPS10 및 VEGFA 발현의 지도 학습 분석에 의해 생성될 수 있다. 재발 또는 비-재발의 위험성을 예측하기 위한 바람직한 규칙은 하기에 나타낸 규칙 1이다: [(((BMI1/H3F3B) * VEGFA) - ((ETV6/RPS10) * H3F3B)) ≥ -4.4777]일 경우, 재발함.
이에 따라, 본원에서의 그의 상세한 설명이 더 잘 이해될 수 있도록, 그리고 업계에 대한 본원의 기여를 더 잘 알 수 있도록, 소정의 본 발명 실시양태들이 비교적 광범위하게 개괄되었다. 물론, 하기에 기술되어 본원에 첨부된 청구범위의 주제를 형성하게 될 본 발명의 추가적인 실시양태들도 제시되어 있다.
이와 관련하여, 본 발명의 하나 이상 실시양태를 상세하게 설명하기 전에, 본 발명이 그의 적용에 있어서 구성상의 세부사항으로 제한되는 것은 아니며, 하기 상세한 설명에 제시되어 있거나 도면에 도시되어 있는 구성요소의 배열로 제한되는 것은 아니라는 것이 이해되어야 한다. 본 발명은 기술되어 있는 것들 이외의 실시양태를 수용할 수 있으며, 다양한 방식으로 실시 및 수행될 수 있다. 또한, 본원은 물론 요약서에서 사용되는 어구 및 용어는 설명을 목적으로 하는 것으로써, 제한하는 것으로 간주되어서는 안된다는 것이 이해되어야 한다.
따라서, 업계 숙련자라면, 본 개시가 기초하는 개념이 본 발명의 몇 가지 목적을 수행하는 다른 구조, 방법 및 시스템의 설계를 위한 기초로서 용이하게 이용될 수 있다는 것을 알고 있을 것이다. 이에 따라, 그것이 본 발명의 기술사상 및 영역에서 벗어나지 않는 한, 그와 같은 등가의 구성들은 청구범위에 포함되는 것으로 간주된다는 것이 중요하다.
도 1은 실시예 2에서 예후 규칙 1에 따라 결장직장암 재발의 높거나 낮은 위험성을 가지는 것으로 예측된 환자 샘플에 있어서의 3년 기간 동안의 무-재발 환자의 비율을 나타내는 그래프이다.
도 2는 상기 도 1에 나타낸 것과 동일하지만 결장직장암 재발의 높거나 낮은 위험성을 예측하는 데에 NCCN 지침을 사용한 환자 샘플에 있어서의 생존 곡선을 나타내는 그래프이다.
정의
다르게 주지되지 않는 한, 본 발명은 분자 생물학 및 관련 분야의 통상적인 기술을 사용한다. 그와 같은 기술에 대해서는 예를 들어 문헌 [Sambrook et al., 2001, Molecular Cloning: A Laboratory Manual] 및 [Ausubel, et al., 2002, Short Protocols in Molecular Biology, (2002)]과 같은 교재를 포함한 문헌에 기술되어 있다. 본원에서 언급되는 모든 특허, 특허 출원 및 공개는 그 전체가 본원에 참조로 명시적으로 포함된다.
다르게 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어들은 본 발명이 속하는 업계의 사람들에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 바람직한 방법 및 물질들이 기술되지만, 본 발명의 실시 또는 시험에서는, 본원에서 기술되는 것들과 유사하거나 등가인 소정의 방법 및 물질들이 사용될 수 있다. 본 발명의 목적상, 하기의 용어들은 하기에서 정의되는 바와 같다.
본원에서, 관사 "a" 및 "an"은 하나이거나 하나를 초과하는 (즉, 하나 이상인) 관사의 문법적 대상을 지칭하는 데에 사용된다. 예를 들자면, "요소(an element)"는 하나 이상의 요소를 의미한다.
본원에서 사용될 때의 "환자 샘플"이라는 용어는 환자 또는 대상체로부터 수득되어 바이오마커 유전자 발현에 대하여 검정될 수 있는 샘플을 지칭한다. 환자 샘플에는 생물학적 유체, 조직 생검물 등이 포함될 수 있다. 바람직한 실시양태에서, 샘플은 조직 샘플, 예를 들어 종양 조직으로써, 생, 냉동, 및/또는 기록용(archival) 파라핀 매립 조직일 수 있다.
본원에서 사용될 때의 "유전자"라는 용어는 세포 게놈의 소정의 그리고 모든 별개 코딩 영역은 물론, 관련 비-코딩 및 조절 영역을 지칭한다. 유전자는 또한 특정 폴리펩티드, 인트론, 및 발현의 조절에 관련된 인접 5' 및 3' 비-코딩 뉴클레오티드 서열을 코딩하는 오픈 리딩 프레임(open reading frame)을 의미하고자 하는 것이다. 이와 관련하여, 유전자는 추가적으로 조절 신호 예컨대 프로모터, 인핸서, 자연상에서 주어진 유전자와 연관되어 있는 종료 및/또는 폴리아데닐화 신호, 또는 이종유래 조절 신호를 포함할 수 있다. DNA 서열은 cDNA 또는 게놈 DNA, 또는 이들의 단편일 수 있다.
"예후 유전자 프로파일(prognostic gene profile)"은 그의 양적인 발현 수준이 환자에서 암 재발 및/또는 비-재발의 위험성을 예측하기 위한 예후 규칙에 사용될 수 있는 핵산 서열들의 조합을 지칭한다. 본원에서 확인되는 예후 유전자 프로파일은 하기의 실시예에서 확인되는 하기 바이오마커 유전자들의 조합을 포함한다: BMI1, ETV6, H3F3B, RPS10 및 VEGFA.
본 발명의 "예후 바이오마커 유전자"는 하기의 유전자들을 지칭한다: BMI1, ETV6, H3F3B, RPS10, VEGFA, AKT1, ARAF, ARHGDIB, B2M, CD82, DIABLO, FGFR4, GUSB, HMOX1, ITGB1, MAPK14, MAX, MMP2, NFKB1, POLR2L, PSMB6, PTK2 및 UBC.
"예후 규칙"은 결장직장암 환자로부터 수득되는 샘플에서의 예후 바이오마커 유전자들의 양적 발현을 암 재발 및/또는 비-재발의 위험성과 관련시키는 하나 이상 일련의 수학식 또는 알고리즘을 지칭한다.
표 1의 예후 바이오마커 유전자들로부터의 예후 규칙의 생성에 적용될 때의 "지도 학습"은 일련의 데이터에 적용되는 다양한 수학적 학습 기술을 지칭하는 것으로써, 출력은 예를 들어 재발 또는 비-재발로 정의되며, 분석은 제공되는 예로부터 학습한다. 지도 학습 기술에는 예를 들어 유전자 프로그래밍, CART 분석, 지지 벡터 머신, 및 선형 판별 분석 등이 포함된다.
"재발"은 치료 36개월 이내의 환자에 대한 결장직장암의 복귀를 지칭한다.
"비-재발"은 치료 후 36개월 이상 동안의, 환자에서의 확인된 결장직장암의 부재를 지칭한다.
"핵산 마이크로어레이(nucleic acid microarray)"는 일반적으로 기판상에 위치되며 비-공유 결합 상호작용을 통하여 상보적 서열을 가지는 샘플에 결합할 수 있는 폴리뉴클레오티드 프로브와 같은 혼성화가능 핵산 어레이 요소의 정돈된 배열을 지칭한다.
펩티드의 "단편" 또는 "일부"는 또 다른 펩티드 서열의 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 또는 250개의 연속되는 아미노산 잔기를 포함하는 펩티드를 지칭한다.
유전자 또는 폴리뉴클레오티의 "단편" 또는 "일부"는 또 다른 폴리뉴클레오티드 서열의 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 또는 250개의 연속되는 핵산 잔기를 포함하는 핵산 분자를 지칭한다.
핵산 서열과 관련하여 사용되는 "상보체(complement)"라는 용어는 그 서열이 제2의 핵산 서열의 것과 상보적이며 그에 따라 제2 서열에 혼성화될 수 있는 폴리뉴클레오티드를 지칭한다.
"프로브"는 비공유 (예컨대 수소 결합) 상호작용을 통해 폴리뉴클레오티드 표적 서열을 인식하여 혼성화될 수 있는 올리고뉴클레오티드 또는 그의 유사체이다. 프로브는 일반적으로 길이가 8개 뉴클레오티드 이상이나 유전자의 전체 길이 미만인 것이다. 프로브는 검출가능한 태그 및/또는 켄처(quencher) 분자를 사용하여 변형될 수 있다.
"단리된" 및/또는 "정제된"이라는 용어는 해당 자연 상태에서 보통 그것에 동반되는 성분으로부터 분리된 물질을 지칭한다. 예를 들어, 본원에서 사용될 때의 "단리된 폴리뉴클레오티드"는 보통 해당 단편에 인접하는 서열로부터 제거된 DNA 단편과 같이, 자연-발생 상태에서 그 폴리뉴클레오티드에 인접동반되는 서열로부터 정제된 폴리뉴클레오티드를 지칭한다.
"특이적으로 ~에 혼성화되는" 등의 구는 해당 서열이 복합 혼합물, 예를 들어 총 세포 DNA 또는 RNA, 또는 그의 혼합 폴리뉴클레오티드 추출물 중에 존재할 때, 염격 조건하에서 특정 뉴클레오티드 서열에만 분자가 결합, 이중체화 또는 혼성화되는 것을 지칭한다.
바이오마커의 확인
하기 실시예에서 기술되는 바와 같이, 유전적 프로그래밍 분석에 의해, 암 재발을 나타내는 환자 및 재발을 나타내지 않은 환자로부터 수득된 샘플들 사이에서, 특정 예후 바이오마커 유전자들이 단독 또는 다른 유전자와의 조합 중 어느 하나로써 상당히 차별적인 발현을 나타내는 것으로 확인되었다. 구체적으로는, 하기 5종 바이오마커 유전자들의 발현 수준이 결장직장암 재발의 위험성을 예측하는 데에 특히 유용한 것으로 확인되었다: BMI1, ETV6, H3F3B, RPS10 및 VEGFA.
이들 5종의 중요한 바이오마커 유전자들의 발현 수준은 이들 유전자의 조합 (예후 유전자 프로파일)의 양적 발현을 결장직장암 재발 및/또는 비-재발의 예측에 적용하는 예후 규칙을 생성시키기 위하여 하기 실시예에 기술되어 있는 바와 같은 추가 분석에 적용될 수 있다. 결장직장암 재발을 예측하는 데에 유용한 예후 유전자 프로파일은 하기 실시예에서 확인되는 하기 바이오마커 유전자들의 조합을 포함한다: BMI1, ETV6, H3F3B, RPS10 및 VEGFA.
확인된 예후 바이오마커 유전자들로부터, 다양한 패턴 인식 기술 및 상관 분석, 예컨대 유전적 프로그래밍, 선형 회귀, 로지스틱 회귀(logistic regression), 인공 신경 네트워크, 지지 벡터 머신 (SVM), 클러스터링 모델(clustering model), CART 분석 등을 사용하여 예후 규칙이 생성될 수 있다. 바람직한 실시양태에서는, 바이오마커 유전자들의 유전적 프로그래밍 분석이 예후 규칙을 생성시키는 데에 사용된다. 생성되는 예후 규칙은 예후 바이오마커 유전자들의 양적 발현을 결장직장암 재발 및/또는 비-재발의 위험성에 관련시키는 수학식 (알고리즘)이다. 하기 실시예에 기술되어 있는 바와 같은 유전적 프로그래밍을 사용하여 개발된 대표적인 예후 규칙은 하기의 바람직한 규칙이다:
[(((BMI1/H3F3B) * VEGFA) - ((ETV6/RPS10) * H3F3B)) ≥ -4.4777]일 경우, 재발함.
분석에서는, "가계 유전자(housekeeping gene)"의 발현이 대조로 사용될 수 있다. 그와 같은 가계 유전자에는 예를 들어 GAPDH, 베타-액틴, S9 리보좀, 유비퀴틴, 알파-튜불린, 18S rRNA, GUS, HPRT, B2M, TBP, CYC, HuPO, PGK, HuTfR, G6PDH (문헌 [Blanquicett, et al ., 2002, Anal Biochem, 303: 209-14]); RPLP0, GAPD, HPRT1, B2M, POLR2A, RPS14, MAN1B1, ACTB, MTR (문헌 [Dydensborg et al ., 2006, Am J Physiol Gastrointest Liver Physiol, 290: G1067-74]); HPRT, ADA, TAF2, POLR2L, CETN2, ACTB, UBE2D2, PSMB6, CAPN2, TXNRD1, SDHA, GUS, CYCC, PMM1, AGPATI, HDAC10, B2M (문헌 [Rubie et al ., 2005, Mol Cell Probes, 19: 101-9])이 포함된다.
유전자 발현 분석
유전자 발현은 다양한 공지의 방법, 예를 들어 샘플, 예컨대 조직 샘플에서 유전자 발현에 의해 생성된 mRNA, cDNA 또는 단백질의 양을 측정하는 것에 의해 양적으로 분석될 수 있다. 추가 분석을 위한 조직 샘플로부터의 mRNA의 단리 방법에 대해서는 알려져 있는데, 예를 들어 문헌 [Ausubel et al ., 2002, Short Protocols in Molecular Biology]을 참조하라. 파라핀 매립 조직으로부터의 mRNA의 단리 방법에 대해서는 예를 들어 문헌 [De Andres et al ., 1995, BioTechniques 18:42044]에 논의되어 있다. 예를 들어 파라핀 블록(Paraffin Block) RNA 단리 키트 (암비온, 인크.(Ambion, Inc.) 사, 텍사스 오스틴 소재)를 포함하여, RNA 단리 키트들이 상업적으로 입수가능하다.
단리된 RNA는 cDNA로 전환되거나, 및/또는 예를 들어 서열분석 또는 혼성화 분석에 의해 증폭, 확인 및 정량될 수 있다. 유전자 발현의 양을 측정하기 위한 다른 방법으로는 예를 들어 노던 블러팅 (문헌 [Brown, 2001 May, Curr Protoc Immunol, Chapter 10:Unit 10.12]; [Parker & Barnes, 1999, Methods in Molecular Biology 106:247-283]), 역전사효소 폴리머라제 연쇄 반응 (RT-PCR) (문헌 [Nygaard et al . 2009, Front Biosci. 14:552-69]; [Weis et al ., 1992, Trends in Genetics 8:263-64]), RNAse 보호 검정 (문헌 [Emery, 1999, Methods Mol Biol . 362:343-8]; [Hod, 1992 Biotechniques 13:852-54]), 대규모 병렬 서명 서열분석(massively parallel signature sequencing) (MPSS) (문헌 [Kutlu, 2009, BMC Med Genomics ., 2:3]; [Brenner, 2000, Nature Biotechnol. 18: 1021]), 유전자 발현의 직렬 분석(Serial Analysis) (SAGE) (문헌 [Boon 2009, PLoS ONE. 4:e5134]; [Velculescu, 1995, Science 270:368-9, 371]), 및 DNA 또는 RNA 이중체에 결합할 수 있는 항체의 사용, RNA-매개 어닐링(annealing), 선택, 및 결찰 (RASL) 검정 (문헌 [Yeakley, 2002, Nat Biotechnol; 20:353-8]), cDNA 매개 어닐링, 선택, 연장, 및 결찰 (DASL) 검정 (문헌 [Abramovitz, 2008, Biotechniques, 44:417-423]; [Fan, 2004, Genome Research 14:878-85]), 마이크로어레이 기술 (문헌 [Ravo et al., 2008, Lab Invest, 88:430-40]; [Schena, 1996, Proc . Natl . Acad . Sci . USA, 93: 106-149]), 예를 들어 인사이트 마이크로어레이(Incyte's microarray) 기술 또는 어피메트릭스 젠칩(Affymetrix's GenChip) 기술; 또는 454 라이프 사이언시즈, 인크.(Life Sciences, Inc.) 사 (코네티컷 브랜포드 소재)에 의해 개발된 고처리량 서열분석 기술 (문헌 [Marguilies, 2005, Nature, 437:376-80]이 포함된다.
한 실시양태에서, 선택된 바이오마커 유전자들의 양적 발현은 규칙 1의 5종 바이오마커 각각에 대하여 구입가능한 특이적 택맨(TAQMAN)® 유전자 발현 검정을 포함하여, 어플라이드 바이오시스템즈(APPLIED BIOSYSTEMS) 사에 구입가능한 것들과 같은 시중의 시약들을 사용하여 분석될 수 있다. 예시적인 택맨® 유전자 발현 검정을 하기에 목록화하였다. 이들은 하기에 기술되는 실시예 2에서 사용되었다.
Figure pct00001
DASL
양적 유전자 발현을 측정하기 위한 DASL 검정법에는 비오티닐화 프라이머를 사용한 총 RNA의 cDNA로의 전환이 포함된다. 비오티닐화된 DNA가 스트렙타비딘 고체 지지체에 결합된 후, cDNA 중 그의 표적 서열에 대한 검정 올리고뉴클레오티드의 어닐링이 이어진다. 일반적으로 유전자 당 3 내지 10개 표적 부위로, 주어진 표적 부위에 대하여 올리고뉴클레오티드 쌍이 어닐링된다. 상류의 어닐링된 올리고뉴클레오티드는 연장되어 하류의 상응 뉴클레오티드에 결찰됨으로써 PCR 주형을 생성시키고, 그것은 예를 들어 범용 PCR 프라이머를 사용하여 증폭된다. 예컨대 표지된 프라이머의 도입에 의해 표지된 PCR 생성물이 고체 지지체 어레이상의 포획 서열에 혼성화된 후, 각 비드에 대하여 형광 강도가 측정된다.
유전자 당 1-3개의 프로브 군을 포함하는 1536개까지의 유전자에 대한 완전 맞춤형 설계 DASL 검정 패널들은 물론, 암과 연관되어 있는 502개의 유전자를 표적으로 하는 일련의 프로브 군들을 포함하는 표준 DASL 인간 암 패널이 일루미나, 인크.(Illumina, Inc.) 사 (캘리포니아 샌디에고 소재)로부터 상업적으로 입수가능하다.
매스어레이
매스어레이(MassARRAY) 시스템은 RNA를 단리하여 cDNA로 역전사하는 데에 사용된다. cDNA는 증폭되어, 탈인산화되고, 프라이머를 사용하여 연장된 후, MALDI-TOF 질량 분광측정법을 통한 양적 분석을 위하여 칩 어레이(chip array)상에 배치된다. 매스어레이 분석을 수행하기 위한 하드웨어 및 소프트웨어는 세퀘놈, 인크. (Sequenom, Inc.) 사 (캘리포니아 샌디에고 소재)로부터 상업적으로 입수가능하다.
SAGE
SAGE에서는, 각각 RNA 전사체 내의 고유 위치에 상응하는 약 10-14개 염기쌍의 다수의 서열 태그들이 서로 연결되어 다수 태그의 서열들을 동시에 서열분석하여 확인하기 위한 연장된 분자를 형성시킨다. 전사체의 발현 패턴은 주어진 태그의 풍부도를 측정하고, 그 태그에 상응하는 유전자를 확인하는 것에 의해 정량될 수 있다. 예컨대 I-SAGE 키트 (인비트로겐(Invitrogen) 사, 캘리포니아 칼스배드 소재)를 포함하여, SAGE를 수행하기 위한 키트는 물론, SAGE 데이터를 분석하기 위한 소프트웨어가 상업적으로 입수가능하다. SAGE 데이터는 예를 들어 인터넷을 통하여 접근가능한 SAGEmap 데이터베이스를 검색하는 데에 사용될 수 있다.
유전적 프로그래밍
바람직한 실시양태에서는, 대상체의 결장직장암 재발 및/또는 비-재발 위험성을 표시해주는 예후 유전자 프로파일 및 예후 규칙에 사용하기 위한 충분한 예측력을 가지는 바이오마커 유전자들의 군을 확인하기 위하여 유전자 발현 데이터를 분석하는 데에, 유전적 프로그래밍이 사용된다.
유전적 프로그래밍은 사용자에 의해 규정되는 임무를 수행할 수 있는 컴퓨터 알고리즘을 개발하는 데에 생물학적 진화의 원리를 사용하는 인공 지능/기계 학습 기술이다 (예를 들어 문헌 [Banzhaf et al ., 1998, Genetic Programming : An Introduction : On the Automatic Evolution of Computer Programs and Its Applications]; [Koza, J.R., 1992, Genetic Programming : On the Programming of Computers by Means of Natural Selection, MIT Press] 참조).
유전적 프로그래밍은 프로그램 군집의 "자연선택"을 수행하는 각 프로그램의 적합성 측정을 사용하여 반복적인 방식으로 그것을 진화시키는 것에 의해 원하는 임무를 수행하도록, 일련의 컴퓨터 프로그램들을 최적화한다. 본 발명의 실시양태에서, 상기 임무는 환자에서 암의 재발을 예측하는 데에 유용한 하나 이상의 예후 규칙을 생성시키는 것이었으며, 적합성의 척도 또는 "적합성 함수"는 종양 조직 샘플을 재발 또는 비-재발을 겪게 될 환자에 속하는 것으로 올바르게 분류하는 주어진 컴퓨터 프로그램의 능력이었다.
컴퓨터 프로그램 군집의 진화는 다양한 공지의 방법으로 수행될 수 있다. 보편적인 한 가지 방법은 한 프로그램의 노드(node)가 군집에 존재하는 또 다른 프로그램으로부터의 노드와 교환되는 교차(crossover) 전략을 사용한다. 컴퓨터 프로그램을 진화시키는 또 다른 방법은 프로그램에 속하는 노드 또는 그 노드에 포함되어 있는 정보가 군집의 어떠한 다른 프로그램에도 영향을 주지 않고 교체되는 돌연변이에 의한다. 이러한 방법들은 단독으로, 또는 프로그램들간 프로그래밍 요소의 구성 성분의 교환을 수반하는 다른 방법과 함께 사용될 수 있다. 각 진화 라운드 후, 군집의 각 컴퓨터 프로그램은 적합성 척도를 사용한 시험에 적용된다.
하기 실시예에 기술되어 있는 바와 같이, 유전적 프로그래밍 시스템은 표적 질환 및 건강 조직 모두의 알려져 있는 샘플로부터 취한 유전자 발현 데이터와 함께 제공되어, 결장직장암의 재발/비-재발과 같은 표적 질환 종류에 대한 단정적인 IF-THEN 항목을 도출하는 데에 사용될 수 있다. 실시양태에서, 단정적인 IF-THEN 항목은 종양 조직에서의 다양한 유전자의 발현량을 환자에서의 암 재발 가능성에 관련시키는 수학식이다. 도출되는 규칙은 올바르게 분류된 샘플의 수가 후보 규칙의 적합성 척도인 훈련용 샘플 세트를 사용하여 개발된다.
적합성 척도는 더 적은 거짓 양성 오류를 생성시키는 규칙에 더 무게를 두도록, 또는 더 적은 거짓 "음성" 오류를 생성시키는 규칙에 더 신뢰를 부여하도록, 달라질 수 있다. 적합성 척도는 유전적 프로그래밍 시스템 자체에 대해서는 외부적이나 원하는 목표를 더 잘 반영하는 다른 이유로 달라질 수도 있다. 예를 들어, 한 실시양태에서는, 선택된 종양 조직으로부터 방출되어 혈류를 통해 전신적으로 신체에 진입하는 것으로 알려져 있는 단백질과 같이, 특정 종류의 단백질을 코딩하는 유전자만을 도입하는 규칙을 생성시키는 것이 바람직할 수 있다.
일단 예후 규칙이 개발되고 나면, 규칙은 미지의 샘플을 표준화하는 그의 능력을 평가하기 위하여 시험 샘플 세트에 대하여 점검된다. 각 적합성 평가 라운드 후, 최고 성능의 프로그램들이 다음 라운드에서의 추가 진화용으로 유지된다. 다음 진화 반복을 위한 컴퓨터 프로그램 군집을 선택하는 데에는 다양한 방법들이 사용될 수 있다. 한 실시양태에서는, 예컨대 교차(crossover)를 사용하여 2종의 최적합 프로그램들이 서로 "교류(mated)"된 후, 자손 프로그램이 적합성 평가에 따른 최소 적합성 프로그램을 대체하여 다음 진화 라운드를 위한 프로그램 군집에 첨가된다. 추가적인 진화의 반복 및 적합성 시험은 사전-선택된 기준에 따라 적합한 효용을 가지는 하나 이상의 예후 규칙이 수득될 때까지, 또는 추가적인 적합성의 향상이 관찰되지 않을 때까지 계속될 수 있다.
유전적 프로그래밍의 주목할만한 장점은 종종 예상치 않은 방식으로 변수들을 조합하는 것에 의해, 높은 예측력을 보유하는 알고리즘을 생성시키는 데에 다수의 변수 및 연산자를 이용하는 그의 능력이다. 다른 모델링 기술들에 대비한 추가적인 장점은 예를 들어 계층적 클러스터 분석(hierarchical cluster analysis)을 사용하는 경우에 필요할 수 있는 바와 같은 연구중인 질환에 상당히 중요한 것으로 생각되는 생물학적 과정과의 연관성을 기초로 하는 선택 유전자의 검토분석이 필요할 수 있는 어떠한 연산자의 입력 없이도, 저절로 예후 규칙이 생성될 수 있다는 것이다.
어느 분석 방법이나 그러하듯이, 차선의 조건이 존재할 경우, 유전적 프로그래밍의 효용은 훼손될 수 있다. 예를 들어, 이상적으로는 큰 데이터 세트가 대규모 훈련용 및 시험용 세트로 분할하는 데에 가용하다. 그러나, 많은 경우에서 입력 데이터의 총량은 적은데, 유전적 프로그래밍 시스템이 잠재적으로 가용한 대부분의 일반적인 분류 개념을 학습할 수 없음을 의미한다. 마찬가지로, 소규모 시험은 학습된 개념의 일반성의 아주 철저한 평가는 허용하지 않는다. 이러한 경우, 유전적 프로그래밍으로부터 수득되는 결과를 평가하기 위한 것으로써, 유전적 프로그래밍 시스템 자체에는 외부적인 공지의 방법들이 존재한다. 예를 들어, n-중 교차 확인(n-fold cross validation)이 적은 데이터 세트를 극복하는 데에 사용될 수 있다. 숙련자라면, 전체 범위의 공지의 확인 방법들 중에서 선택할 수 있을 것이다.
다양한 유전적 프로그래밍 기술들이 본 발명을 실시하는 데에 사용될 수 있다. 예를 들어, 유전적 프로그래밍은 미국 특허 번호 6,327,582에 기술되어 있는 기술에 따라 수행될 수 있다.
기타 분석 방법
일단 고도의 예측력을 가지는 예후 바이오마커 유전자 세트가 확인되고 나면, 유전적 프로그래밍이 아닌 다른 분석 방법들이 예후 바이오마커 유전자들의 상대적인 발현 수준을 암 재발 및/또는 비-재발에 관련시키는 하나 이상의 예후 규칙을 생성시키는 데에 사용될 수 있다는 것을 알고 있을 것이다. 예를 들어, 공지의 회귀 및 기타 패턴 인식 기술들이 예측성 규칙을 생성시키는 데에 사용될 수 있다. CART 분석, 지지 벡터 머신, 및 선형 또는 비-선형 판별 분석 등과 같은 지도 학습 기술들이 일단 예후 바이오마커 유전자들이 알려지고 난 후 예후 규칙을 개발하는 데에 유용하다.
예후 규칙
환자에서 결장직장암 재발 및/또는 비-재발의 가능성을 예측하기 위한 예후 규칙은 하기의 실시예에서 확인되며, 확인된 예후 바이오마커 유전자들의 분석에 의해서도 생성될 수 있다. 예후 규칙은 일반적으로 바이오마커 유전자 발현의 양을 결장직장암 재발 및/또는 비-재발의 위험성에 관련시키는 부울 식(Boolean expression)이다.
환자의 결장직장암 재발 가능성은 환자의 측정된 바이오마커 유전자 발현 수준을 예후 규칙에 적용함으로써 예측된다. 일 예에서, 컴퓨터화된 시스템은 유전자 발현 값을 수용하기 위한 입력 모듈; 유전자 발현 값을 예후 규칙에 적용하여 규칙에 따른 위험성 예측을 계산하기 위한 분석 모듈; 및 규칙에 의해 계산되어 생성되는 재발 및/또는 비-재발의 위험성 예측을 예컨대 디스플레이 또는 다른 전달 기작에 의해 사용자에게 전달하기 위한 출력 모듈을 포함한다. 또 다른 예에서는, 2종 이상의 규칙이 분석 모듈에 적용될 수도 있다.
도구, 키트 , 시스템 및 예후 유전자 프로파일
본 발명은 결장직장암 환자에서의 재발 및/또는 비-재발 위험성에 대한 중요한 바이오마커로 확인된 유전자 군을 제공한다. 이러한 예후 바이오마커 유전자들은 상기 표 1에 목록화되어 있다. 대표적인 환자 샘플에서의 이러한 예후 바이오마커 유전자들의 양적 발현의 수학적 분석에 의해 유도되는 예후 유전자 프로파일 및 예후 규칙은 개별 환자의 해당 예후 바이오마커 유전자들의 발현 수준으로부터 그 환자가 결장직장암의 높은 재발 및/또는 비-재발 위험성을 가지고 있는 군집에 속할 가능성의 예측을 측정하기 위한 검정 방법, 시스템, 도구, 시약, 소프트웨어, 장치 등에, 그리고 예측된 예후에 기초한 결장직장암 환자의 합리적인 치료에 적용된다.
대표적인 도구에는 예를 들어 예후 바이오마커 유전자, 유전자 프로파일, 및 특정 예후 규칙의 유전자의 발현량을 측정하도록 적합화된 검정 시스템, 예컨대 마이크로어레이, 혼성화, 증폭, PCR, DASL, SAGE, 및 유사 검정 시스템은 물론, 환자에서 결장직장암의 재발 또는 비-재발을 예측하기 위한 장치, 시스템 또는 방법에 사용되는 키트, 칩, 카드, 다중-웰 검정 플레이트, 프로브, 프라이머, 데이터 저장 시스템, 소프트웨어 프로그램, 컴퓨터 시스템 등이 포함된다.
1종 이상 예후 바이오마커 유전자의 발현 수준을 증폭 및 검출하기 위하여, 핵산 프로브 및/또는 프라이머의 패널이 설계된다. 그와 같은 프로브에는 예를 들어 단리된 유전자 mRNA, cDNA, 및 이들의 일부, 유전자 발현 수준의 정량 측정에 유용한 증폭된 핵산이 포함된다. 그와 같은 프라이머에는 원하는 앰플리콘에 측접하며 유전자 발현을 정량하기 위하여 원하는 유전자 또는 유전자의 일부를 증폭하는 데에 유용한 핵산이 포함된다.
혼성화 플레이트, 칩 또는 카드와 같은 검정용 기판은 대상체로부터 수득된 샘플에서 확인된 바이오마커 유전자의 발현을 증폭하고/거나 확인하고/거나 서열분석함으로써 정량하는 프라이머 쌍 및/또는 프로브가 포함되도록 적합화 및 설계된다.
키트에는 본 발명 예후 규칙 중의 그의 존재로 인하여 결장직장암 재발과 연관되는 확인된 바이오마커 유전자의 발현 수준을 정량하는 데에 유용한 시약 및 도구가 포함되는데, 예를 들어 표 1에 목록화되어 있는 바이오마커 유전자들의 발현을 정량하도록 설계된 핵산 프로브 및/또는 프라이머들이 포함된다.
도구, 키트 및 시스템에는 또한 예측되는 결장직장암 재발 및/또는 비-재발 위험성을 계산하는 예후 규칙을 저장하고 적용하도록 적합화된 컴퓨터 시스템, 소프트웨어 및 모듈이 포함된다. 컴퓨터 시스템은 예를 들어 양적인 바이오마커 유전자 발현 데이터를 수용하기 위한 입력 모듈, 예후 규칙 및 바이오마커 유전자 발현 수준을 적용하여 규칙의 수학적 결과를 계산하기 위한 분석 모듈, 및 예측 위험성 결과를 제공하기 위한 출력 모듈이 포함될 수 있다.
치료 또는 예방 방법
본 발명은 환자에서의 결장직장암 재발 및/또는 비-재발 위험성의 예측 방법을 포함한다. 일반적으로, 상기 방법은 환자의 샘플로부터 표 1에 목록화되어 있는 확인된 예후 유전자 프로파일 중 유전자의 발현 수준을 정량적으로 측정하는 것, 측정된 발현 값을 예후 규칙에 적용하는 것, 및 유전자 발현 수준을 예후 규칙에 따라 해석함으로써 환자의 결장직장암 재발 위험성을 측정하는 것을 포함한다. 치료 요법은 환자의 유전자 발현 데이터를 예후 규칙에 적용한 결과에 의해 확인되는 바와 같은 환자 예후에 따라 개인화된다. 일 예로써, 환자 샘플의 분석이 재발 가능성을 나타내는 경우에는, 더 공격적인 항암 요법이 적용된다.
실시예
하기의 비-제한적인 실시예에 기술되어 있는 구체적인 실시양태들을 참조하게 되면, 본 발명이 용이하게 이해 및 실시될 수 있다. 하기의 실시예에는, 일련의 발현된 예측 유전자들을 선택하는 데에 이용되는 다양한 검정들이 기술되어 있다. 구체적으로는, cDNA-매개의 어닐링, 선택, 연장, 및 결찰 (DASL) 검정, 및 역전사효소 폴리머라제 연쇄 반응 (RT-PCR) 검정이 기술되어 있다. 그러나, 본 발명의 다양한 실시양태가 DASL 및 RT-PCR로 제한되는 것은 아니며, 오히려 어떠한 적합한 게놈 물질 선택 검정도 포함할 수 있다.
실시예 1: DASL 법을 사용한 단계 I/ II 결장직장 1차 선암종 조직의 유전자 발현 프로파일 생성
단계 I 및 단계 II 결장직장암에 걸린 145명의 환자로부터 (104명 결장, 41명 직장), 치료 수술 과정에서 기록용 포르말린-고정된 파라핀-매립 (FFPE) 1차 선암종 조직을 수득하였다. 모든 환자들이 수술-후 36개월 (mo) 이내에 재발되거나 (R) (n=67; 51명 단계 II), 또는 ≥36 mo 동안 비-재발이 확인되는 것 (NR) (n=78; 56명 단계 II) 중 어느 하나였으며; 아무도 네오아주반트 또는 아주반트 요법을 받지 않았다. R 상태, 1차 재발까지의 시간, 우 대 좌-측 종양 등에 의해 환자를 계층화한 다음, 무작위로 훈련용 세트 (T세트) (n=73; 34R, 39NR) 또는 확인 세트 (V세트) (n=72; 33R, 39NR)로 할당하였다.
맞춤형 512개 유전자 패널을 사용하여, DASL 검정 (일루미나 사, 캘리포니아 샌디에고 소재) (문헌 [Abramovitz, 2008, Biotechniques, 44:417-423]; [Fan et al ., 2004, Genome Research 14:878-85])에 의해, 훈련용 세트 종양 유전자 발현을 정량하였다. R 및 NR 군들 사이에 차별적인 발현 수준을 나타내는 관심 유전자를 확인하고, 인터넷을 통하여 가용한 U.C.S.C. 게놈 브라우저에 목록화되어 있는 바와 같은 인간 게놈상의 참조 서열 위치, 그리고 인터넷을 통하여 가용한 진뱅크(GenBank) 사에서 입수되는 대표적인 핵산 서열과 함께 표 2에 나타내었다. 확인되는 바와 같은 U.C.S.C. 브라우저 및 진뱅크 사의 서열들은 본원에 참조로 포함된다.
RT - PCR 법을 사용한 단계 I/ II 결장직장 1차 선암종 조직의 유전자 발현 프로파일 생성
DASL법의 대안으로써 또는 그에 더하여, RT-PCR법을 사용하여 유전자 발현 프로파일이 생성될 수 있다. 예를 들어, 1개의 미국 (미네소타 로체스터; n=45) 및 2개 별도의 유럽 (러시아 연방 모스크바)의 장소에서 60명의 결장암 (AJCC pT1-4 pN0 cM0) 및 14명의 직장암 (AJCC pT2-3 pN0 cM0) 환자에 대하여, 치료 의도의 최초 수술 절제 (R0)에서 수득된 칠십사개 (74개)의 기록용이며 임상 주석이 달린 포르말린-고정 파라핀 매립 (FFPE) 1차 암종 조직을 회수하였다. 아무도 네오아주반트 또는 아주반트 요법을 받지 않았다. 각 경우에 대하여 그 장소의 직원에 의한 의료 기록 열람에 의해 삼십육 (36)-개월 R 및 NR 상태를 확인하였다. 모든 환자에 대하여 사전고지 동의서를 입수하였다.
재발 상태, 1차 재발까지의 시간, 결장암 대 직장암, R- 대 L-측 결장, 및 조직 공급원에 의한 계층화 후, 74 사례를 무작위로 훈련용 세트 (n=37; 16R, 21NR) 및 동일한 크기의 시험용 세트 (n=37; 16R, 21NR)로 분할하였다.
맞춤형의 집중식 마이크로어레이(custom focussed microarray)를 구성하기 위하여, 맞춤형 384-웰 택맨® 저밀도 어레이 (어플라이드 바이오시스템즈(Applied Biosystems) 사, 캘리포니아 포스터 시티 소재)를 사용하는 RT-PCR에 의해, 종양 유전자 발현을 평가하였다. 그것이 하기의 기준들 중 하나 이상을 충족하는지에 기초하여, 417개 암-연관 유전자의 패널을 어레이용으로 예비-선택하였다: (1) 종양생성, 종양 진행 또는 전이와 연관됨; (2) 세포 주기 진행, 혈관형성, 생존 또는 아폽토시스의 핵심 조절 단백질을 코딩함; (3) CRC의 개시 및 진행에 관련됨; (4) CRC의 예후인 것으로 보고되어 있음; (5) CRC 화학요법에 대한 종양 반응을 예보하거나 거기에 영향을 줌; (6) 정상 및 악성 CRC 조직 사이에 차별적으로 발현됨.
NCBI 엔트레즈(Entrez) 뉴클레오티드 데이터베이스를 통하여 접근한 각 유전자 및 공통서열에 대하여 적절한 mRNA 참조 서열 (REFSEQ) 접근 번호를 확인하였다. 어플라이드 바이오시스템즈 사에서 RT-PCR 프라이머 및 프로브를 설계하였다. 앰플리콘 크기는 최소한으로 유지하여, 대부분이 길이 100 염기 미만이었다.
각 사례에 대하여, 독립적인 위장관 병리학자에 의한 H&E 염색 슬라이드상 FFPE 악성 조직의 확인 및 위치지정 후, 별도의 유리 슬라이드에 고정된 상응 미염색 종양 조직을 1회용 스캘펄(scalpel)을 사용하여 무-RNAse 미세원심분리 튜브로 긁어내었다. 크실렌 중에서 조직을 탈-파라핀화한 후, RNA를 추출하고, 리커버올(RecoverAll)™ 총 핵산 단리 키트 (어플라이드 바이오시스템즈/암비온 사, 텍사스 오스틴 소재)를 사용하여 정제하였다. 나노드롭(Nanodrop) 1000 UV/Vis 분광광도측정기를 사용하여 260/280 nm의 UV 흡수비를 측정함으로써, RNA 용액의 순도 및 양을 측정하였다. 프라이머로서 무작위 육량체를 사용하는 고성능 cDNA 역전사 키트 (어플라이드 바이오시스템즈 사)를 사용하여, 최소 100 ng의 RNA를 단일 가닥 cDNA로 전사하였다. cDNA는 즉시 RT-PCR에 사용하거나, -80℃에서 저장하였다.
택맨® 맞춤형 어레이 384-웰 미세유동 카드(microfluidic card) (어플라이드 바이오시스템즈 사)를 사용하여, 실시간 PCR을 통한 유전자 발현을 검정하였다. 48 웰 당 100 μl의 cDNA (1 ng/μl)를 카드에 적용한 후, 7900HT 속성 실시간 PCR 시스템을 사용하여 2반복으로 모든 검정을 수행하였다. 출력 데이터는 증폭 곡선에서 0.2로 설정된 일정한 역치, 즉 주기 역치 (Ct)에 도달하는 데에 요구되는 PCR 주기의 수로 나타내었다. 5종의 가계 (HK) 유전자를 사용하여 데이터를 표준화함으로써, 각 검정에서의 RNA 완전성 및 양의 잠재적인 기술적 변이성 및 편차에 대하여 보정하였다. 선택된 5종의 HK 유전자 (B2M, GUSB, POLR2L, PSMB6, UBC)는 CRC 및 다른 조직에서 상시 발현되는 것으로 잘 알려져 있는 9종의 후보 유전자들 중 최소 수준의 발현 변이성을 나타내었다. 개별 유전자 발현 복제물의 각 쌍을 일치도에 대하여 검사하고, 각각에 대하여 상관 계수를 생성시켰다. 복제물들을 평균하고, 5종 HK 유전자들의 평균 (Ave. 5HK Ct)으로부터 각 규칙 유전자에 대한 Ct (RG Ct)를 차감함으로써, 생성 데이터를 표준화하였다. Ct 값은 2를 밑으로 하는 대수로 나타내었기 때문에, 역대수를 취함으로써 데이터를 선형화하고, 결과를 100배로 확대하였다. 이에 따라, 데이터의 최종 형태는 하기였다:
유전자 발현 값 = 2( Ave . 5 HK Ct - RG Ct ) × 100.
연구 전체에 있어서, 추출된 RNA 및 RT-PCR 결과의 허용을 위한 최소한의 기준은 하기였다: (1) RNA 농도: ≥ 10 ng/μl; (2) RNA는 ≥ 1.8의 260/280 nm 비를 가질 필요가 있음; (3) 5종 HK 유전자의 평균 발현: ≤ 32.0 Ct; 및 (4) 모든 개별 Ct 값: ≤ 35.
Figure pct00002
실시예 2: 유전적 프로그래밍을 통한, 결장직장암 재발의 위험성을 측정하기 위한 규칙의 생성
바이오마커 유전자들의 발현 수준에 기초하는 예후 규칙을 진화시키기 위하여, 훈련용 세트 유전자 발현 데이터의 연속 유전적 프로그래밍(GP) 분석을 사용하여, 실시예 1에서 확인된 예후 바이오마커 유전자들을 분석하였다. 하기에 나타낸 이러한 규칙들은 확인 데이터 세트에서 결장직장암 환자가 재발 또는 비-재발을 겪게될지 여부를 예측하는 데에 유용하였다.
확인된 예후 바이오마커 유전자들의 유전적 프로그래밍 분석에서는, 표 2 유전자들의 다양한 조합을 포함한 잠재적 규칙들의 군집을 무작위로 생성시킴으로써, 일련의 후보 규칙들을 산출하였다. 다음에, 각 후보 규칙을 적합성에 대하여 시험하였다.
"재발" 대 "비-재발"로 올바르게 분류된 종양 조직 샘플의 수가 후보 규칙에 있어서의 적합성의 척도로 사용되었다. 또 다른 예에서는, 민감성과 특이성의 합계, 또는 양성 예측가능성, 음성 예측가능성 등의 합계가 적합성의 척도로 이용된다. 또 다른 예에서는, 수용체 작용제 곡선 (ROC)의 곡선하 면적 (AUC)이 적합성의 척도로 사용된다. 충분히 높은 적합성을 가지는 것으로 판단된 후보 규칙이 발견된 경우, 유전적 프로그래밍을 종료하고, 최적합성 후보를 예후 규칙으로 선택하였다. 죵료 기준이 충족되지 않은 경우에는, 최고 적합성을 가지는 후보 규칙들을 교류시켜 새로운 자손 후보 규칙들의 군집을 생성시키고, 더 낮은 적합성을 가지는 것으로 밝혀진 후보 규칙을 폐기하였다.
종료 기준이 충족되어 적합한 적합성을 가지는 하나 이상의 규칙이 발견될 때까지, 유전적 프로그래밍 방법의 추가적인 반복을 수행하였다. 표 2 유전자들의 연속적인 GP 분석 후, 입력 데이터가 재발을 예측하는 예후 서명 규칙을 산출하였다 (표 3 참조).
Figure pct00003
실시예 3: 재발을 예측하기 위한 예후 GP 규칙의 사용
표 3의 규칙을 사용하여 결장직장암 환자에서 재발을 예측하였다. 미국 2개 장소 및 유럽 2개 장소에서, 86명의 단계 I/II (pT1-4 pN0 M0) 결장암 환자 및 29명의 단계 I (pT1-2, pN0 M0) 직장암 환자에 대하여, 치료 의도의 최초 수술 절제에서 수득된 기록용 포르말린-고정 파라핀-매립 1차 선암종 조직 (저장 중앙값 7년; 4-15년 범위)을 회수하였다. 이들 장소 및 샘플들은 실시예 1 및 2에 대하여 상기한 바와 같이 분자 시험을 생성시키는 데에 사용되었던 샘플들과는 다른 것이었다.
수득된 샘플에는 수술 36개월 이내에 종양이 재발되었던 (R) 환자로부터의 것들 (n=46), 및 수술 후 36개월 이상 동안 비-재발로 확인된 (NR) 환자로부터의 것들 (n=69)이 포함되었다. 어느 환자도 네오아주반트 또는 아주반트 요법을 받지 않았다.
이들 샘플에서, 어플라이드 바이오시스템즈 사로부터 입수된 맞춤형 384-웰 택맨® 저밀도 어레이를 사용하여, 그리고 일련의 엄격한 품질 조절 파라미터들을 충족시킨 RNA를 사용하여, qRT-PCR에 의해 종양 유전자 발현을 평가하였다. 문제의 5개 유전자 각각의 택맨® 검정 번호 및 프로브 길이를 하기 표 4에 나타내었다:
Figure pct00004
이와 같은 환자 데이터 세트 (V세트)에서 규칙 1의 예측 민감성 및 특이성을 분석하고, 결장직장암에 대하여 현행 국립 종합 암 네트워트 (NCCN)를 사용하여 수득된 것과 비교하였다. 단계 I/II CRC (n=115)의 경우, 상기 양분 규칙은 70%의 민감성 및 55%의 특이성으로 32/46명의 R 및 38/69명의 NR V세트 환자를 올바르게 분류하였다. 양성 예측 값 (PPV) 51%, 음성 예측 값 (NPV) 73%, 및 상대적 위험도 (HR) 2.06 (95% CI: 1.1 내지 3.86; p=0.020)으로써, '고위험'으로 간주된 환자들은 '저위험'으로 표지된 환자들에 비해 36개월 이내에 상당히 더 높은 재발 가능성을 가졌다.
반면, NCCN 지침 (버젼 1.2011)은 72%의 민감성 및 42%의 특이성, 45%의 양성 예측 값 및 69%의 음성 예측 값을 가짐으로써, 본 군집에서만큼 잘 36-개월 재발 대 비-재발을 구별할 수 없었다. 위험도 비는 1.38 (95% CI: 0.73-2.53, p=0.315)이었다. 분자 시험의 특이성은 NCCN에서의 것에 비해 상당히 더 컸다 (p=0.05).
단계 I 직장암 환자의 경우 (n=29; 13명 재발), 분자 시험의 예후 정확도는 NCCN 지침 (16/29)의 55% 특이성 (16/29)을 능가하는 79%의 특이성 (23/29)을 나타내었다.
본 실시예에서, 예후 바이오마커 유전자들로부터 유도된 예후 규칙이 FFPE 종양 조직에서의 유전자 발현 수준의 유전적 프로그래밍 분석에 의한 결장직장암 재발 및/또는 비-재발의 측정에 중요하며, 3년 이내의 재발에 대하여 고위험성 대 저위험성인 초기 단계 CRC 환자를 현행 NCCN 지침에 비해 더 우수하게 구별할 수 있는 것으로 확인되었다.
실시예 4: 재발을 예측하기 위한 예후 GP 규칙의 사용
상기한 바와 같이, 유전적 프로그래밍을 사용하여 예후 바이오마커 유전자들을 확인하고 (실시예 1), 결장직장암 재발의 위험성을 측정하기 위한 예후 규칙을 생성시켰다 (실시예 2 및 3). 표 2에 목록화되어 있는 예후 바이오마커 유전자들의 발현 수준이 결장직장암 재발에 대하여 고도로 예측성이었기 때문에, 비-GP 분석 방법을 사용하여서도 이들 예후 바이오마커 유전자들의 발현에 기초하는 예후 규칙이 생성될 수 있다는 가설을 세웠다.
다른 분석 방법들의 유용성을 입증하는 것으로써, 분류 및 회귀 나무 (CART) 알고리즘 (문헌 [Freund et al . 1999, The alternating decision tree learning algorithm])을 사용하여, 표 2에 목록화되어 있는 예후 바이오마커 유전자들의 발현으로부터 유도되는 예후 규칙이 생성될 수 있다.
다양한 분석 기술들에 의해 생성되는 예후 규칙에서의 상기 예후 바이오마커 유전자들의 용도를 추가적으로 입증하는 것으로써, 표 2에 목록화되어 있는 유전자들에 대한 발현 데이터, 및 공지의 재발 및 비-재발 시험 데이터를 사용하여 (예를 들어 문헌 [Mocellin et al . 2003 Ann Surg Oncol. 2006 13: 1113-1122] 참조) 지지 벡터 머신이 생성될 수 있다. 계수 및 벡터들에 의해 생성되는 지지 벡터 머신 (SVM)은 분류기구(classifier)의 확실성을 시험하기 위한 훈련용 데이터 (T세트)에서의 4-중 교차확인을 수행하는 데에 사용된다. 분류기구를 3중으로 훈련시킨 후, 네 번째에 정확도가 시험된다. 분석은 단일 정확도 (%) 및 총 정확도 (4반복에 걸친 평균) (%)로 기록된다. SVM에 의해 개발된 규칙을 사용한 확인 세트 (V세트)의 시험은 기록되는 정확도 (%)를 산출한다.
다양한 분석 기술들에 의해 생성되는 예후 규칙에서의 상기 예후 바이오마커 유전자들의 용도를 추가적으로 입증하는 것으로써, 표 2에 목록화되어 있는 유전자들에 대한 양적 발현 데이터 및 공지의 재발 및 비-재발 시험 데이터를 사용하여 (예를 들어 문헌 [Mocellin et al . 2003 Ann Surg Oncol. 2006 13: 1113-1122] 참조) 지지 벡터 머신이 생성될 수 있다. 계수 및 벡터들에 의해 생성되는 지지 벡터 머신은 분류기구의 확실성을 시험하기 위한 훈련용 데이터 (T세트)에서의 4-중 교차-확인을 수행하는 데에 사용된다. 분류기구를 3중으로 훈련시킨 후, 네 번째에 정확도가 시험된다.
표 2에 목록화되어 있는 예후 바이오마커 유전자들의 고도의 예측력을 추가 입증하는 것으로써, 선형 판별 분석을 사용하여 (예를 들어 문헌 [Marchevsky et al., 2004 JMD, Vol. 6]: [1Estevez et al ., 2004, Eur Clin Nutr 58:449-455] 참조) 표 2에 목록화되어 있는 유전자들의 양적 발현에 기초하여 결장직장암 재발의 가능성을 예측하는 예후 규칙이 생성된다.
선형 판별 (LD) 분석은 샘플을 2개의 군으로 분류하는 데에 각 유전자의 개별 측정치 및 모든 유전자 조합의 계산된 측정치 모두를 사용한다. 각 유전자에 대하여, 군 1 및 군 2 군의 평균 및 표준 편차로부터 비중이 유도된다. 모든 유전자에 비중을 곱하고, 이들 값의 합계가 집합적인 판별 점수로 이어진다. 다음에, 이와 같은 판별 점수는 군 1 및 군 2 군의 집합적 중심값에 비교된다. 이러한 중심값은 각각 모든 군 1 및 군 2 샘플들의 평균이다. 이에 따라, 각 유전자는 전체 예측에 기여한다. 이와 같은 기여는 그 유전자에 대한 군 1과 군 2 샘플들 사이의 상대적인 거리가 클 경우 큰 양 또는 음의 수이며, 상대적인 거리가 작을 경우 작은 수인 비중에 따라 달라진다. 각 미지 샘플에 대한 판별 점수 및 중심값은 미지 샘플이 어느 군에 속하는지에 관하여 0 내지 1 사이의 가능성을 계산하는 데에 사용될 수 있다.
본 발명의 또 다른 실시양태에서는, 표 1에 목록화되어 있는 것들 이외의 유전자들이 유전자 발현 프로파일을 생성시키는 데에 이용된다.
실시예 5: RT - PCR 법을 사용한 단계 I/ II 결장직장 1차 선암종 조직의 유전자 발현 프로파일의 생성
1개의 미국 (미네소타 로체스터; n=45) 및 2개 별도의 유럽 (러시아 연방 모스크바)의 장소에서 60명의 결장암 (AJCC pT1-4 pN0 cM0) 및 14명의 직장암 (AJCC pT2-3 pN0 cM0) 환자에 대하여, 치료 의도의 최초 수술 절제 (R0)에서 수득된 칠십사개 (74개)의 기록용이며 임상 주석이 달린 포르말린-고정 파라핀 매립 (FFPE) 1차 암종 조직을 회수하였다. 아무도 네오아주반트 또는 아주반트 요법을 받지 않았다. 각 경우에 대하여 그 장소의 직원에 의한 의료 기록 열람에 의해 삼십육 (36)-개월 R 및 NR 상태를 확인하였다. 모든 환자에 대하여 사전고지 동의서를 입수하였다.
재발 상태, 1차 재발까지의 시간, 결장암 대 직장암, R- 대 L-측 결장, 및 조직 공급원에 의한 계층화 후, 74 사례를 무작위로 훈련용 세트 (n=37; 16R, 21NR) 및 동일한 크기의 시험용 세트 (n=37; 16R, 21NR)로 분할하였다.
맞춤형의 집중식 마이크로어레이를 구성하기 위하여, 맞춤형 384-웰 택맨® 저밀도 어레이 (어플라이드 바이오시스템즈 사, 캘리포니아 포스터 시티 소재)를 사용하는 RT-PCR에 의해, 종양 유전자 발현을 평가하였다. 그것이 하기의 기준들 중 하나 이상을 충족하는지에 기초하여, 417개 암-연관 유전자의 패널을 어레이용으로 예비-선택하였다: (1) 종양생성, 종양 진행 또는 전이와 연관됨; (2) 세포 주기 진행, 혈관형성, 생존 또는 아폽토시스의 핵심 조절 단백질을 코딩함; (3) CRC의 개시 및 진행에 관련됨; (4) CRC의 예후인 것으로 보고되어 있음; (5) CRC 화학요법에 대한 종양 반응을 예보하거나 거기에 영향을 줌; (6) 정상 및 악성 CRC 조직 사이에 차별적으로 발현됨.
NCBI 엔트레즈 뉴클레오티드 데이터베이스를 통하여 접근한 각 유전자 및 공통서열에 대하여 적절한 mRNA 참조 서열 (REFSEQ) 접근 번호를 확인하였다. 어플라이드 바이오시스템즈 사에서 RT-PCR 프라이머 및 프로브를 설계하였다. 앰플리콘 크기는 최소한으로 유지하여, 대부분이 길이 100 염기 미만이었다.
각 사례에 대하여, 독립적인 위장관 병리학자에 의한 H&E 염색 슬라이드상 FFPE 악성 조직의 확인 및 위치지정 후, 별도의 유리 슬라이드에 고정된 상응 미염색 종양 조직을 1회용 스캘펄을 사용하여 무-RNAse 미세원심분리 튜브로 긁어내었다. 크실렌 중에서 조직을 탈-파라핀화한 후, RNA를 추출하고, 리커버올™ 총 핵산 단리 키트 (어플라이드 바이오시스템즈/암비온 사, 텍사스 오스틴 소재)를 사용하여 정제하였다. 나노드롭 1000 UV/Vis 분광광도측정기를 사용하여 260/280 nm의 UV 흡수비를 측정함으로써, RNA 용액의 순도 및 양을 측정하였다. 프라이머로서 무작위 육량체를 사용하는 고성능 cDNA 역전사 키트 (어플라이드 바이오시스템즈 사)를 사용하여, 최소 100 ng의 RNA를 단일 가닥 cDNA로 전사하였다. cDNA는 즉시 RT-PCR에 사용하거나, -80℃에서 저장하였다.
택맨® 맞춤형 어레이 384-웰 미세유동 카드 (어플라이드 바이오시스템즈 사)를 사용하여, 실시간 PCR을 통한 유전자 발현을 검정하였다. 48 웰 당 100 μl의 cDNA (1 ng/μl)를 카드에 적용한 후, 7900HT 속성 실시간 PCR 시스템을 사용하여 2반복으로 모든 검정을 수행하였다. 출력 데이터는 증폭 곡선에서 0.2로 설정된 일정한 역치, 즉 주기 역치 (Ct)에 도달하는 데에 요구되는 PCR 주기의 수로 나타내었다. 5종의 가계 (HK) 유전자를 사용하여 데이터를 표준화함으로써, 각 검정에서의 RNA 완전성 및 양의 잠재적인 기술적 변이성 및 편차에 대하여 보정하였다. 선택된 5종의 HK 유전자 (B2M, GUSB, POLR2L, PSMB6, UBC)는 CRC 및 다른 조직에서 상시 발현되는 것으로 잘 알려져 있는 9종의 후보 유전자들 중 최소 수준의 발현 변이성을 나타내었다. 개별 유전자 발현 복제물의 각 쌍을 일치도에 대하여 검사하고, 각각에 대하여 상관 계수를 생성시켰다. 복제물들을 평균하고, 5종 HK 유전자들의 평균 (Ave. 5HK Ct)으로부터 각 규칙 유전자에 대한 Ct (RG Ct)를 차감함으로써, 생성 데이터를 표준화하였다. Ct 값은 2를 밑으로 하는 대수로 나타내었기 때문에, 역대수를 취함으로써 데이터를 선형화하고, 결과를 100배로 확대하였다. 이에 따라, 데이터의 최종 형태는 하기였다:
유전자 발현 값 = 2( Ave . 5 HK Ct - RG Ct ) × 100.
연구 전체에 있어서, 추출된 RNA 및 RT-PCR 결과의 허용을 위한 최소한의 기준은 하기였다: (1) RNA 농도: ≥ 10 ng/μl; (2) RNA는 ≥ 1.8의 260/280 nm 비를 가질 필요가 있음; (3) 5종 HK 유전자의 평균 발현: ≤ 32.0 Ct; 및 (4) 모든 개별 Ct 값: ≤ 35.
본원에서 기술되는 RT-PCR 검정에 의해 R 및 NR 군들 사이에 차별적인 발현 수준을 나타내는 관심 유전자를 확인하고, 인터넷을 통하여 가용한 U.C.S.C. 게놈 브라우저에 목록화되어 있는 바와 같은 인간 게놈상의 참조 서열 위치, 그리고 인터넷을 통하여 가용한 진뱅크 사에서 입수되는 대표적인 핵산 서열과 함께 표 5에 나타내었다. 확인되는 바와 같은 U.C.S.C. 브라우저 및 진뱅크 사의 서열들은 본원에 참조로 포함된다.
Figure pct00005
실시예 6: 유전적 프로그래밍을 통한, 결장직장암 재발의 위험성을 측정하기 위한 규칙의 생성
바이오마커 유전자들의 발현 수준에 기초하는 예후 규칙을 진화시키기 위하여, 훈련용 세트 유전자 발현 데이터의 연속 유전적 프로그래밍(GP) 분석을 사용하여, 실시예 5에서 확인된 예후 바이오마커 유전자들을 분석하였다. 하기에 나타낸 이러한 규칙들은 확인 데이터 세트에서 결장직장암 환자가 재발 또는 비-재발을 겪게될지 여부를 예측하는 데에 유용하였다.
확인된 예후 바이오마커 유전자들의 유전적 프로그래밍 분석에서는, 표 5 유전자들의 다양한 조합을 포함한 잠재적 규칙들의 군집을 무작위로 생성시킴으로써, 일련의 후보 규칙들을 산출하였다. 다음에, 각 후보 규칙을 적합성에 대하여 시험하였다.
"재발" 대 "비-재발"로 올바르게 분류된 종양 조직 샘플의 수가 후보 규칙에 있어서의 적합성의 척도로 사용되었다. 충분히 높은 적합성을 가지는 것으로 판단된 후보 규칙이 발견된 경우, 유전적 프로그래밍을 종료하고, 최적합성 후보를 예후 규칙으로 선택하였다. 죵료 기준이 충족되지 않은 경우에는, 최고 적합성을 가지는 후보 규칙들을 교류시켜 새로운 자손 후보 규칙들의 군집을 생성시키고, 더 낮은 적합성을 가지는 것으로 밝혀진 후보 규칙을 폐기하였다.
종료 기준이 충족되어 적합한 적합성을 가지는 하나 이상의 규칙이 발견될 때까지, 유전적 프로그래밍 방법의 추가적인 반복을 수행하였다. 표 5 유전자들의 연속적인 GP 분석 후, 입력 데이터가 재발을 예측하는 예후 서명 규칙을 산출하였다 (표 6 참조).
Figure pct00006
실시예 7: 재발을 예측하기 위한 예후 GP 규칙의 사용
표 6의 규칙을 사용하여 결장직장암 환자에서 재발을 예측하였다. 미국 2개 장소 및 유럽 2개 장소에서, 86명의 단계 I/II (pT1-4 pN0 M0) 결장암 환자 및 29명의 단계 I (pT1-2, pN0 M0) 직장암 환자에 대하여, 치료 의도의 최초 수술 절제에서 수득된 기록용 포르말린-고정 파라핀-매립 1차 선암종 조직 (저장 중앙값 7년; 4-15년 범위)을 회수하였다. 이들 장소 및 샘플들은 실시예 5 및 6에 대하여 상기한 바와 같이 분자 시험을 생성시키는 데에 사용되었던 샘플들과는 다른 것이었다.
수득된 샘플에는 수술 36개월 이내에 종양이 재발되었던 (R) 환자로부터의 것들 (n=46), 및 수술 후 36개월 이상 동안 비-재발로 확인된 (NR) 환자로부터의 것들 (n=69)이 포함되었다. 어느 환자도 네오아주반트 또는 아주반트 요법을 받지 않았다.
이들 샘플에서, 어플라이드 바이오시스템즈 사로부터 입수된 맞춤형 384-웰 택맨® 저밀도 어레이를 사용하여, 그리고 일련의 엄격한 품질 조절 파라미터들을 충족시킨 RNA를 사용하여, qRT-PCR에 의해 종양 유전자 발현을 평가하였다. 문제의 23개 유전자 각각의 택맨® 검정 번호 및 프로브 길이를 하기 표 7에 나타내었다:
Figure pct00007
이와 같은 환자 데이터 세트 (V세트)에서 규칙 1 내지 8의 예측 민감성 및 특이성을 분석하고, 결장직장암에 대하여 현행 국립 종합 암 네트워트 (NCCN) 지침을 사용하여 수득된 것과 비교하였다. 단계 I/II CRC (n=115)의 경우, 상기 양분 규칙은 70%의 민감성 및 55%의 특이성으로 32/46명의 R 및 38/69명의 NR V세트 환자를 올바르게 분류하였다. 양성 예측 값 (PPV) 51%, 음성 예측 값 (NPV) 73%, 및 상대적 위험도 (HR) 2.06 (95% CI: 1.1 내지 3.86; p=0.020)으로써, '고위험'으로 간주된 환자들은 '저위험'으로 표지된 환자들에 비해 36개월 이내에 상당히 더 높은 재발 가능성을 가졌다.
반면, NCCN 지침 (버젼 1.2011)은 72%의 민감성 및 42%의 특이성, 45%의 양성 예측 값 및 69%의 음성 예측 값으로써, 이와 같은 군집에서 36-개월 재발 대 비-재발을 구별할 수 없었다. 위험도 비는 1.38 (95% CI: 0.73-2.53, p=0.315)이었다. 분자 시험의 특이성은 NCCN에서의 것에 비해 상당히 더 컸다 (p=0.05).
단계 I 직장암 환자의 경우 (n=29; 13명 재발), 분자 시험의 예후 정확도는 NCCN 지침의 55% 특이성 (16/29)을 능가하는 79%의 특이성 (23/29)을 나타내었다.
본 실시예에서, 예후 바이오마커 유전자들로부터 유도된 예후 규칙이 FFPE 종양 조직에서의 유전자 발현 수준의 유전적 프로그래밍 분석에 의한 결장직장암 재발 및/또는 비-재발의 측정에 중요하며, 3년 이내의 재발에 대하여 고위험성 대 저위험성인 초기 단계 CRC 환자를 현행 NCCN 지침에 비해 더 우수하게 구별할 수 있는 것으로 확인되었다.
실시예 8: 재발을 예측하기 위한 예후 GP 규칙의 사용
상기한 바와 같이, 유전적 프로그래밍을 사용하여 예후 바이오마커 유전자들을 확인하고 (실시예 5), 결장직장암 재발의 위험성을 측정하기 위한 예후 규칙을 생성시켰다 (실시예 6 및 7). 표 5에 목록화되어 있는 예후 바이오마커 유전자들의 발현 수준이 결장직장암 재발에 대하여 고도로 예측성이었기 때문에, 비-GP 분석 방법을 사용하여서도 이들 예후 바이오마커 유전자들의 발현에 기초하는 예후 규칙이 생성될 수 있다는 가설을 세웠다.
다른 분석 방법들의 유용성을 입증하는 것으로써, 분류 및 회귀 나무 (CART) 알고리즘 (문헌 [Freund et al . 1999, The alternating decision tree learning algorithm])을 사용하여, 표 5에 목록화되어 있는 예후 바이오마커 유전자들의 발현으로부터 유도되는 예후 규칙이 생성될 수 있다.
다양한 분석 기술들에 의해 생성되는 예후 규칙에서의 상기 예후 바이오마커 유전자들의 용도를 추가적으로 입증하는 것으로써, 표 5에 목록화되어 있는 유전자들에 대한 발현 데이터, 및 공지의 재발 및 비-재발 시험 데이터를 사용하여 (예를 들어 문헌 [Mocellin et al . 2003 Ann Surg Oncol. 2006 13: 1113-1122] 참조) 지지 벡터 머신이 생성될 수 있다. 계수 및 벡터들에 의해 생성되는 지지 벡터 머신 (SVM)은 분류기구의 확실성을 시험하기 위한 훈련용 데이터 (T세트)에서의 4-중 교차확인을 수행하는 데에 사용된다. 분류기구를 3중으로 훈련시킨 후, 네 번째에 정확도가 시험된다. 분석은 단일 정확도 (%) 및 총 정확도 (4반복에 걸친 평균) (%)로 기록된다. SVM에 의해 개발된 규칙을 사용한 확인 세트 (V세트)의 시험은 기록되는 정확도 (%)를 산출한다.
다양한 분석 기술들에 의해 생성되는 예후 규칙에서의 상기 예후 바이오마커 유전자들의 용도를 추가적으로 입증하는 것으로써, 표 5에 목록화되어 있는 유전자들에 대한 양적 발현 데이터 및 공지의 재발 및 비-재발 시험 데이터를 사용하여 (예를 들어 문헌 [Mocellin et al . 2003 Ann Surg Oncol. 2006 13: 1113-1122] 참조) 지지 벡터 머신이 생성될 수 있다. 계수 및 벡터들에 의해 생성되는 지지 벡터 머신은 분류기구의 확실성을 시험하기 위한 훈련용 데이터 (T세트)에서의 4-중 교차-확인을 수행하는 데에 사용된다. 분류기구를 3중으로 훈련시킨 후, 네 번째에 정확도가 시험된다.
표 5에 목록화되어 있는 예후 바이오마커 유전자들의 고도의 예측력을 추가 입증하는 것으로써, 선형 판별 분석을 사용하여 (예를 들어 문헌 [Marchevsky et al., 2004 JMD, Vol. 6]: [1Estevez et al ., 2004, Eur Clin Nutr 58:449-455] 참조) 표 5에 목록화되어 있는 유전자들의 양적 발현에 기초하여 결장직장암 재발의 가능성을 예측하는 예후 규칙이 생성된다.
선형 판별 (LD) 분석은 샘플을 2개의 군으로 분류하는 데에 각 유전자의 개별 측정치 및 모든 유전자 조합의 계산된 측정치 모두를 사용한다. 각 유전자에 대하여, 군 1 및 군 2 군의 평균 및 표준 편차로부터 비중이 유도된다. 모든 유전자에 비중을 곱하고, 이들 값의 합계가 집합적인 판별 점수로 이어진다. 다음에, 이와 같은 판별 점수는 군 1 및 군 2 군의 집합적 중심값에 비교된다. 이러한 중심값은 각각 모든 군 1 및 군 2 샘플들의 평균이다. 이에 따라, 각 유전자는 전체 예측에 기여한다. 이와 같은 기여는 그 유전자에 대한 군 1과 군 2 샘플들 사이의 상대적인 거리가 클 경우 큰 양 또는 음의 수이며, 상대적인 거리가 작을 경우 작은 수인 비중에 따라 달라진다. 각 미지 샘플에 대한 판별 점수 및 중심값은 미지 샘플이 어느 군에 속하는지에 관하여 0 내지 1 사이의 가능성을 계산하는 데에 사용될 수 있다.
상세한 설명에서 본 발명의 많은 특징 및 장점들이 드러났으므로, 첨부된 청구범위로써 본 발명의 진정한 기술사상 및 영역에 속하는 그와 같은 본 발명의 모든 특징 및 장점들을 포괄하고자 한다. 또한, 수많은 변형 및 변종들이 업계 숙련자에게 쉽게 떠오르게 될 것이므로, 본 발명을 예시 및 기술된 정확한 구성 및 작용으로 제한하는 것은 바람직하지 않으며, 그에 따라 모든 적합한 변형 및 등가물들은 본 발명의 영역에 속하는 것으로 재분류될 수 있다.
[서열 목록]
Figure pct00008
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
Figure pct00025

SEQUENCE LISTING <110> Worzel, William P <120> PROGNOSTIC SIGNATURE FOR COLORECTAL CANCER RECURRENCE <130> 42609.21501 <150> US 61/433,798 <151> 2011-01-18 <160> 23 <170> PatentIn version 3.5 <210> 1 <211> 3435 <212> DNA <213> Homo sapiens <400> 1 acagcaacta tgaaataatc gtagtatgag aggcagagat cggggcgaga caatggggat 60 gtgggcgcgg gagccccgtt ccggcttagc agcacctccc agccccgcag aataaaaccg 120 atcgcgcccc ctccgcgcgc gccctccccc gagtgcggag cgggaggagg cggcggcggc 180 cgaggaggag gaggaggagg ccccggagga ggaggcgttg gaggtcgagg cggaggcgga 240 ggaggaggag gccgaggcgc cggaggaggc cgaggcgccg gagcaggagg aggccggccg 300 gaggcggcat gagacgagcg tggcggccgc ggctgctcgg ggccgcgctg gttgcccatt 360 gacagcggcg tctgcagctc gcttcaagat ggccgcttgg ctcgcattca ttttctgctg 420 aacgactttt aactttcatt gtcttttccg cccgcttcga tcgcctcgcg ccggctgctc 480 tttccgggat tttttatcaa gcagaaatgc atcgaacaac gagaatcaag atcactgagc 540 taaatcccca cctgatgtgt gtgctttgtg gagggtactt cattgatgcc acaaccataa 600 tagaatgtct acattccttc tgtaaaacgt gtattgttcg ttacctggag accagcaagt 660 attgtcctat ttgtgatgtc caagttcaca agaccagacc actactgaat ataaggtcag 720 ataaaactct ccaagatatt gtatacaaat tagttccagg gcttttcaaa aatgaaatga 780 agagaagaag ggatttttat gcagctcatc cttctgctga tgctgccaat ggctctaatg 840 aagatagagg agaggttgca gatgaagata agagaattat aactgatgat gagataataa 900 gcttatccat tgaattcttt gaccagaaca gattggatcg gaaagtaaac aaagacaaag 960 agaaatctaa ggaggaggtg aatgataaaa gatacttacg atgcccagca gcaatgactg 1020 tgatgcactt aagaaagttt ctcagaagta aaatggacat acctaatact ttccagattg 1080 atgtcatgta tgaggaggaa cctttaaagg attattatac actaatggat attgcctaca 1140 tttatacctg gagaaggaat ggtccacttc cattgaaata cagagttcga cctacttgta 1200 aaagaatgaa gatcagtcac cagagagatg gactgacaaa tgctggagaa ctggaaagtg 1260 actctgggag tgacaaggcc aacagcccag caggaggtat tccctccacc tcttcttgtt 1320 tgcctagccc cagtactcca gtgcagtctc ctcatccaca gtttcctcac atttccagta 1380 ctatgaatgg aaccagcaac agccccagcg gtaaccacca atcttctttt gccaatagac 1440 ctcgaaaatc atcagtaaat gggtcatcag caacttcttc tggttgatac ctgagactgt 1500 taaggaaaaa aattttaaac ccctgattta tatagatatc ttcatgccat tacagctttc 1560 tagatgctaa tacatgtgac tatcgtccaa tttgctttct tttgtagtga cattaaattt 1620 ggctataaaa gatggactac atgtgatact cctatggacg ttaattgaaa agaaagattg 1680 ttgttataaa gaattggttt cttggaaagc aggcaagact ttttctctgt gttaggaaag 1740 atgggaaatg gtttctgtaa ccattgtttg gatttggaag tactctgcag tggacataag 1800 cattgggcca tagtttgtta atctcaacta acgcctacat tacattctcc ttgatcgttc 1860 ttgttattac gctgttttgt gaacctgtag aaaacaagtg ctttttatct tgaaattcaa 1920 ccaacggaaa gaatatgcat agaataatgc attctatgta gccatgtcac tgtgaataac 1980 gatttcttgc atatttagcc attttgattc ctgtttgatt tatacttctc tgttgctacg 2040 caaaaccgat caaagaaaag tgaacttcag ttttacaatc tgtatgccta aaagcgggta 2100 ctaccgttta ttttactgac ttgtttaaat gattcgcttt tgtaagaatc agatggcatt 2160 atgcttgttg tacaatgcca tattggtata tgacataaca ggaaacagta ttgtatgata 2220 tatttataaa tgctataaag aaatattgtg tttcatgcat tcagaaatga ttgttaaaat 2280 tctcccaact ggttcgacct ttgcagatac ccataaccta tgttgagcct tgcttaccag 2340 caaagaatat ttttaatgtg gatatctaat tctaaagtct gttccattag aagcaattgg 2400 cacatctttc tatactttat atacttttct ccagtaatac atgtttactt taaagattgt 2460 tgcagtgaag aaaaaccttt aactgagaaa tatggaaacc gtcttaattt tccattggct 2520 atgatggaat taatattgta ttttaaaaat gcatattgat cactataatt ctaaaacaat 2580 tttttaaata aaccagcagg ttgctaaaag aaggcatttt atctaaagtt attttaatag 2640 gtggtatagc agtaatttta aatttaagag ttgcttttac agttaacaat ggaatatgcc 2700 ttctctgcta tgtctgaaaa tagaagctat ttattatgag cttctacagg tatttttaaa 2760 tagagcaagc atgttgaatt taaaatatga ataaccccac ccaacaattt tcagtttatt 2820 ttttgctttg gtcgaacttg gtgtgtgttc atcacccatc agttatttgt gagggtgttt 2880 attctatatg aatattgttt catgtttgta tgggaaaatt gtagctaaac atttcattgt 2940 ccccagtctg caaaagaagc acaattctat tgctttgtct tgcttatagt cattaaatca 3000 ttacttttac atatattgct gttacttctg ctttctttaa aaatatagta aaggatgttt 3060 tatgaagtca caagatacat atatttttat tttgacctaa atttgtacag tcccattgta 3120 agtgttgttt ctaattatag atgtaaaatg aaatttcatt tgtaattgga aaaaatccaa 3180 taaaaaggat attcatttag aaaatagcta agatctttaa taaaaatttg atatgaaaag 3240 cacaatgtgc agaagttatg gaaaacctat agaggattac aacaggtaaa cgttaaagag 3300 aatacattgc tgacttatag tgatgtggct aagaagtaca tgctttgttg taaaattgct 3360 tgaaagccca ttgaaagatg tatctgttta tttacagtct ttgaagtaaa agttaccaat 3420 gtttgccaat aaaaa 3435 <210> 2 <211> 5989 <212> DNA <213> Homo sapiens <400> 2 gcgtcccggg tccccgcgcc gcgccgcgac ctgcagaccc cgccgccgcg ctcgggcccg 60 tctcccacgc ccccgccgcc ccgcgcgccc aactccgccg gccgccccgc cccgccccgc 120 gcgctccaga cccccggggc ggctgccggg agagatgctg gaagaaactt cttaaatgac 180 cgcgtctggc tggccgtgga gcctttctgg gttggggaga ggaaaggaaa gtggaaaaaa 240 cctgagaact tcctgatctc tctcgctgtg agacatgtct gagactcctg ctcagtgtag 300 cattaagcag gaacgaattt catatacacc tccagagagc ccagtgccga gttacgcttc 360 ctcgacgcca cttcatgttc cagtgcctcg agcgctcagg atggaggaag actcgatccg 420 cctgcctgcg cacctgcgct tgcagccaat ttactggagc agggatgacg tagcccagtg 480 gctcaagtgg gctgaaaatg agttttcttt aaggccaatt gacagcaaca cgtttgaaat 540 gaatggcaaa gctctcctgc tgctgaccaa agaggacttt cgctatcgat ctcctcattc 600 aggtgatgtg ctctatgaac tccttcagca tattctgaag cagaggaaac ctcggattct 660 tttttcacca ttcttccacc ctggaaactc tatacacaca cagccggagg tcatactgca 720 tcagaaccat gaagaagata actgtgtcca gaggaccccc aggccatccg tggataatgt 780 gcaccataac cctcccacca ttgaactgtt gcaccgctcc aggtcaccta tcacgacaaa 840 tcaccggcct tctcctgacc ccgagcagcg gcccctccgg tcccccctgg acaacatgat 900 ccgccgcctc tccccggctg agagagctca gggacccagg ccgcaccagg agaacaacca 960 ccaggagtcc taccctctgt cagtgtctcc catggagaat aatcactgcc cagcgtcctc 1020 cgagtcccac ccgaagccat ccagcccccg gcaggagagc acacgcgtga tccagctgat 1080 gcccagcccc atcatgcacc ctctgatcct gaacccccgg cactccgtgg atttcaaaca 1140 gtccaggctc tccgaggacg ggctgcatag ggaagggaag cccatcaacc tctctcatcg 1200 ggaagacctg gcttacatga accacatcat ggtctctgtc tccccgcctg aagagcacgc 1260 catgcccatt gggagaatag cagactgtag actgctttgg gattacgtct atcagttgct 1320 ttctgacagc cggtacgaaa acttcatccg atgggaggac aaagaatcca aaatattccg 1380 gatagtggat cccaacggac tggctcgact gtggggaaac cataagaaca gaacaaacat 1440 gacctatgag aaaatgtcca gagccctgcg ccactactac aaactaaaca ttatcaggaa 1500 ggagccagga caaaggcttt tgttcaggtt tatgaaaacc ccagatgaaa tcatgagtgg 1560 ccgaacagac cgtctggagc acctagagtc ccaggagctg gatgaacaaa tataccaaga 1620 agatgaatgc tgaaggaacc aacagtccac ctcagcgggc cagcagccca gggaacccct 1680 gcccaccagg attgctggaa gtgtgacgga gcaggcgggc tgaggagagt ggaaaaggaa 1740 gcgacccaga aatggcaggg acacttctct tgcagaccaa gagggaccct ggagcacctt 1800 agacaaacta cccagcacag gcggggctgg aattctggcg gagggcatga gcctgggact 1860 ccatgtcacg tttccttctg atttggaatc tctccatctg taattcctca ccctcaccct 1920 tccaccgttg ttagtatcat ggtgtttttg tttttgtttt tgttttaaga acctgcagtt 1980 tgactcttca tcgttcatct aggggaagac atctgatgtt gttttcctat ggaaatatat 2040 atctattata tatatatttt ttgcaaatct cacaaagtgc ggcaagccca gctggtcagg 2100 aaagagaata cttgcagagg ggttcaggtt cctctttttc ctgccacgtg gatcaggtct 2160 gttcctgtta ctgttgggtc ttggctgaaa aaaaaaaatg cttttaaaaa agataaaatg 2220 aaaaggagag ctctcttttt ctctctcttg ctctgttctt cccttggtcc cctctgtcct 2280 cccgccctgc ctgcagttga gattcagatg ccttctgaca gagttcagcc tcttggagag 2340 tcttggggat tgttggcacc taaacagaat cagtgacccg ggtgctttgt ggccagcagc 2400 acagaatcaa acccgcatcc cagcattggg ccacccatct gagggaggcc aaaatcatca 2460 cagatgctgc tgtgctgcag acagatacat gctagtccag agagccgccc ctgagatggc 2520 tgtgagaacc atgtgtctaa ggcgtaagat aaggatggaa ggctgtccaa gttatttgga 2580 aggcctcggc agcttgggat tagcttggga gcgcagcgct gcaaagtgga aaatatgaaa 2640 agaccacaca ggcccagcag tccagaaact gggcaaaaat attctgcagt ggggatttat 2700 ttttccaaag caggtaacag aggctagtga gaaagaaaag ctcctctctg ctccattcca 2760 aaggccatct tgtggtcagt ttcatgccct cacctgattt tttttttttt tttttttttt 2820 caattcctaa ccttttttaa agtttcctgg tctccactgg acacagagct ttggagacgg 2880 aggatcccag agggcagtct cagttgcaat cagtgtgtgc ccagcctggg cagacaggaa 2940 attcctcgga tacattattt tttctttctt tcatagctgt gtctcagaaa ggacccattt 3000 gtggctcttt ttcacctcaa aataagatcg atggtatctt gtaaaatgag ggtagtgcca 3060 cttcttagta tttttgaaag ctgttttaga tttttttttt ttttcctttt ctagccatct 3120 aaattgactc ttccaatata ggtctcagaa atccaatatt tggagtacaa tttcttttaa 3180 tccagattac acctgcctta caaagcaccc cctccttgtt cccctctgtt tcctctactc 3240 agttggggga gaaactcaca gctcctccgg gatacatatg tgccctcagc agcagctccc 3300 aggtgaagtt accagacccc tgggcttctc cccagctttt tctgagttga gtcagacatg 3360 tagagtttgg gtcacacagg caagaggaat tttccctcgg ccttactgac aaggacacca 3420 acctagggtg caaacagatg gactatggtt caaggacact ggaattgagg agctgatcaa 3480 ggctctcttc agccttgctc tgtccctgcc tcttatcaga gcacaggtag acacacgggc 3540 atagccagcc cactcctact gtcacaggcg ccccaccatt caaccttccg ggaggtcagg 3600 gaccttctat atgaggcgag tgggtctcag tctgcttgaa tggtgatgag attctgctgg 3660 atctcagcac gctgcaggtg tcttttgaga gcattcagta ggacatggtg atccctattt 3720 cagcctctaa gatgactggt attctatctg aaatgcagag attaagccaa atacctgatg 3780 tattgtgaaa gccactgatt ttaagaatgg agagaaaggg attttttact gcatccctct 3840 gtatgaatat gaaatcagag accagggcat gatgttgcta ggattagagc ctctcagtct 3900 ggcctcttca cccaagtgca agaactcagt ctcttactgt tcaaagaatc ttaacagttg 3960 aattatggag ggaaattccc ttttgcccca agcatttcta tatttaaagc aatatcccag 4020 gagaatatgt tagacttagg atgatacctt cagccacttg aagaagaaat agaaggcgct 4080 cattccaata tagtctttat ttcccattca gatacaggtt gagcatccct aatctgaaca 4140 gttaaaaccc ccaaatgccc caaaatccaa accttcctga acgctatgac accatgagtg 4200 gaaaattcca cacctaacaa acacatttgc tttcttatgg ttcaatgtac acaaactgtt 4260 ttatatagaa aatgatttca aatatcataa aattaccttc aggctatgtg tataaagtat 4320 atatgagcca taaatgaatt ttgtgtttag actttgtgtc catccccaag atctctcatt 4380 ttatatatat atatatatat atatatatat atatatatat atatatatac acacacacac 4440 acatacacaa atattccagg atacaaaaaa aaacatttaa aaatccgaga cccagaacac 4500 ttctggtccc aagcatttca gataagggat atcaatctgt actaccaata aggatttcgt 4560 aattccccta actgcaaatg tcctcttcat ttgttcttta tgagaaaacc cgggtagtgc 4620 cagcacctgg atacagtatt tacaccctgc agaccctaaa gatttcagat tcagttagca 4680 aaccttgatg aagcacctgc tggacactga gggacccaaa gctcaatcag ccataatccc 4740 tgctttcaga gtttatattg tacctgccta atccacccgg cgtgactcat ttcaacacta 4800 agtactaggg gtgttgtcag gagacaaatc tgaagtcagg agaggaaaat gcaaaggagc 4860 cctgccgtgt gatggatgtg cattctcact tgggtcttga agttctcatt cctacatctc 4920 aagctagcca ggcagtctcc tctctatcag aagaaagcac tggtaattgg ctagactggc 4980 tatgttgaag gtaacatgaa ctctaagatc ttgacccagg gcgacttggt tttgcttaag 5040 gtggcatcac caatgttcca aatcctttag ggagatgagg gtatccccac agaaaaagag 5100 gaataataga ccaatggatt ttctcctttc accagtatgt ttggaaccct ctgatccaat 5160 gtcttttgat actgatctct tgtccaaatg agaatgtcgc tttagctgaa attcaaatgg 5220 ctgtgacaat ttaccgaaat gatgaagtaa ccaccattcc cacctttcac tgcctaggct 5280 ccaagtctga atacattttt gaaataggaa ctcccttttg caaaaaagaa acctgggtgt 5340 cagggaggtg aagtgacttg ccctaggagc agacagcatg ccaagaatgg aattaggctc 5400 aggatccagc ctgggctcac cctgtgtggc tcattcccac ccaggaaact gaagataaaa 5460 gatttgggaa aacacaccaa gaaaaagggg cagttttctt tgcccaagca tttggtgcta 5520 gttagaggct gttcactctc tcctgctcct cttcggagta gaaataaagg ctgtgacaca 5580 aggaagccag tggggtggga gggaggcacc ataatccctc cctaaaaccc acagaagact 5640 aacctgatac tcttttgacc caactgcatc aacactaaac agctgcagac cccctgaatc 5700 tttcacacat gccaagtgaa cattcttgat gatttctctt tgtgaccgca accacctgca 5760 aaccagaacg actctagaat ttccttcccc gccccccttt ttgtttagtt tctaatctct 5820 tgtttatgag gtgtggggtt tataagggac tgaatcaaat gaatgtaaca aaaaagaaaa 5880 aaaaaacaaa aaaaaatgcc ttttctcagg gccagtgagt tgcaaataat ttttaaagaa 5940 aagcctataa ttacatcatc tcaataaatt ttttataaaa aaaaaaaaa 5989 <210> 3 <211> 2753 <212> DNA <213> Homo sapiens <400> 3 gagcgcagag cggtttggtc gttcgttggg cggtgctggt ttttcgctcg tcgactgcgg 60 ctcttcctcg ggcagcggaa gcggcgcggc ggtcggagaa gtggcctaaa acttcggcgt 120 tgggtgaaag aaaatggccc gaaccaagca gactgctcgt aagtccaccg gtgggaaagc 180 cccccgcaaa cagctggcca cgaaagccgc caggaaaagc gctccctcta ccggcggggt 240 gaagaagcct catcgctaca ggcccgggac cgtggcgctt cgagagattc gtcgttatca 300 gaagtcgacc gagctgctca tccggaagct gcccttccag aggttggtga gggagatcgc 360 gcaggatttc aaaaccgacc tgaggtttca gagcgcagcc atcggtgcgc tgcaggaggc 420 tagcgaagcg tacctggtgg gtctgttcga agataccaac ctgtgtgcca tccacgctaa 480 gagagtcacc atcatgccca aagacatcca gttggctcgc cggatacggg gagagagagc 540 ttaagtgaag gcagttttta tggcgttttg tagtaaattc tgtaaaatac tttggtttaa 600 tttgtgactt tttttgtaag aaattgttta taatatgttg catttgtact taagtcattc 660 catctttcac tcaggatgaa tgcgaaaagt gactgttcac agacctcagt gatgtgagca 720 ctgttgctca ggagtgacaa gttgctaata tgcagaaggg atgggtgata cttcttgctt 780 ctcatgatgc atgtttctgt atgttaatga cttgttgggt agctattaag gtactagagt 840 tgataaatgt gtacagggtc cttttgcaat aaaactggtt atgacttgat ccaagtgttt 900 aacaattggg gctgttaagt ctgaccatac atcactgtga tagaatgtgg gctttttcaa 960 gggtgaagat acaagtctta accacagtgt aacttacagt ttcctttaaa aaaaaaaaaa 1020 gtaaacctgg cagctataga atacactatg tgcatttata atagctattt tatatattgt 1080 agtatcaaca tttttaaatt aaatgtttta cattcacaag tggtggggag tcttgtcatt 1140 aaggtgtgtg taatttagag tccagttggt tttcttctga ctgcacttgt tctcatagta 1200 gtaaaatgct atgcgcattt ataccttgca taagtcctca ttctaccaca tgttaaccct 1260 ctagctgata atgcaaacac taactggggg attttattta taagggctct agaaaaaacg 1320 agttattcac accagcatca tcttaactaa cattctgaac tagttagtgc agcttttcat 1380 tgtgttgtgt ggttggtctc ataactaggt tgagtttttc tcctctgctg aggaaacagt 1440 accgaagttc tttttcttgt ggcatttgta ttataaaaac ttggtgtggg ggaggagcac 1500 aaaactccag cccactgaac ctctgccaat taagatggtg ttgggttagg ttacatctgg 1560 ttactgtcct gggaaaatca tttttataga gatggccttc caagtggttt taaaatttac 1620 tgaagttttt aggtcaatta tgtatgttga ctaaatttac aaataaactt gtttatccaa 1680 ctaagtgtcc aaaacctaaa ttgaatgtac taagttttca catgtcccat tatctaggtc 1740 cttgtatact aatgttttga acttagatca tttcaggtgt tgtttggtgg ataaaggaac 1800 cttttattta taaagatact gtagaaagca tgtgaacagc tctctgcttg attaagatgc 1860 cataatagtg ctgtatttgc agtgtgggct aagacaaagt atattaataa gcttttcagc 1920 ccccccactc ccgttccgta gtgtagaagc ccacaggtgt agaactcagt cttaaacttc 1980 agtatgaaac cagtttcctt gtgcgatgat ggccactaaa gcatagtacg tggatgtcag 2040 tgagacagca tgagagccag cagtcatcaa agcgttccac gtttgaagtt agcaactgct 2100 taaagttatg ccctattaaa attgctttct caaaagtttg ggttagtttc aaatgtgata 2160 ttttggaggg aaggtaaagt aggtatcttt caggtcgtga taatgagctc ctatgaaagg 2220 atgcaatata atgacccgct tttctagaaa gttcataatc agctctggaa caagcacact 2280 tgattcctca ctgtgcttca gaatgagatt aagatcagat gttggaacgt gctatgctgt 2340 agcgtgtctg gaaacaaagt acacaaacct ggctacggtg atgagttagc ttctgcttac 2400 tacctgtgac aacccaagtg ggtgacacta gtgaaccttc tccagtctgc aggctggcat 2460 agaaggctct tagattatat tgggcagctt gcaatctgcc gaagcagtga cttgcatttc 2520 cacacttggc ttgagcactc aacccagaag gcgaagatag cttttggttg taggcggctt 2580 cctgtatggg atatccctcg gtaagggtaa aggagcagag gcaaaggaga aaagcagaag 2640 ttgcagctga tgcaggtatc ctatgccctt gatggatgag actaaaataa aatttttgaa 2700 gttaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 2753 <210> 4 <211> 672 <212> DNA <213> Homo sapiens <400> 4 gagagagagc gagagaacta gtctcgagtt tttttttttt tttttttttt tttttttttt 60 tttttttttt tttccagccc cggtaccgga ccctgcagcc gcagagatgt tgatgcctaa 120 aaaaaaccgg attgccattt atgaactcct ttttaaggag ggagtcatgg tggccaagaa 180 ggatgtccac atgcctaagc acccggagct ggcagacaag aatgtgccca accttcatgt 240 catgaaggcc atgcagtctc tcaagtcccg aggctacgtg aaggaacagt ttgcctggag 300 acatttctac tggtacctta ccaatgaggg tatccagtat ctccgtgatt accttcatct 360 gcccccggag attgtgcctg ccaccctacg ccgtagccgt ccagagactg gcaggcctcg 420 gcctaaaggt ctggagggtg agcgacctgc gagactcaca agaggggaag ctgacagaga 480 tacctacaga cggagtgctg tgccacctgg tgccgacaag aaagccgagg ctggggctgg 540 gtcagcaacc gaattccagt ttagaggcgg atttggtcgt ggacgtggtc agccacctca 600 gtaaaattgg agaggattct tttgcattga ataaacttac agccaaaaaa ccttaaaaaa 660 aaaaaaaaaa aa 672 <210> 5 <211> 3677 <212> DNA <213> Homo sapiens <400> 5 tcgcggaggc ttggggcagc cgggtagctc ggaggtcgtg gcgctggggg ctagcaccag 60 cgctctgtcg ggaggcgcag cggttaggtg gaccggtcag cggactcacc ggccagggcg 120 ctcggtgctg gaatttgata ttcattgatc cgggttttat ccctcttctt ttttcttaaa 180 catttttttt taaaactgta ttgtttctcg ttttaattta tttttgcttg ccattcccca 240 cttgaatcgg gccgacggct tggggagatt gctctacttc cccaaatcac tgtggatttt 300 ggaaaccagc agaaagagga aagaggtagc aagagctcca gagagaagtc gaggaagaga 360 gagacggggt cagagagagc gcgcgggcgt gcgagcagcg aaagcgacag gggcaaagtg 420 agtgacctgc ttttgggggt gaccgccgga gcgcggcgtg agccctcccc cttgggatcc 480 cgcagctgac cagtcgcgct gacggacaga cagacagaca ccgcccccag ccccagctac 540 cacctcctcc ccggccggcg gcggacagtg gacgcggcgg cgagccgcgg gcaggggccg 600 gagcccgcgc ccggaggcgg ggtggagggg gtcggggctc gcggcgtcgc actgaaactt 660 ttcgtccaac ttctgggctg ttctcgcttc ggaggagccg tggtccgcgc gggggaagcc 720 gagccgagcg gagccgcgag aagtgctagc tcgggccggg aggagccgca gccggaggag 780 ggggaggagg aagaagagaa ggaagaggag agggggccgc agtggcgact cggcgctcgg 840 aagccgggct catggacggg tgaggcggcg gtgtgcgcag acagtgctcc agccgcgcgc 900 gctccccagg ccctggcccg ggcctcgggc cggggaggaa gagtagctcg ccgaggcgcc 960 gaggagagcg ggccgcccca cagcccgagc cggagaggga gcgcgagccg cgccggcccc 1020 ggtcgggcct ccgaaaccat gaactttctg ctgtcttggg tgcattggag ccttgccttg 1080 ctgctctacc tccaccatgc caagtggtcc caggctgcac ccatggcaga aggaggaggg 1140 cagaatcatc acgaagtggt gaagttcatg gatgtctatc agcgcagcta ctgccatcca 1200 atcgagaccc tggtggacat cttccaggag taccctgatg agatcgagta catcttcaag 1260 ccatcctgtg tgcccctgat gcgatgcggg ggctgctgca atgacgaggg cctggagtgt 1320 gtgcccactg aggagtccaa catcaccatg cagattatgc ggatcaaacc tcaccaaggc 1380 cagcacatag gagagatgag cttcctacag cacaacaaat gtgaatgcag accaaagaaa 1440 gatagagcaa gacaagaaaa aaaatcagtt cgaggaaagg gaaaggggca aaaacgaaag 1500 cgcaagaaat cccggtataa gtcctggagc gtgtacgttg gtgcccgctg ctgtctaatg 1560 ccctggagcc tccctggccc ccatccctgt gggccttgct cagagcggag aaagcatttg 1620 tttgtacaag atccgcagac gtgtaaatgt tcctgcaaaa acacagactc gcgttgcaag 1680 gcgaggcagc ttgagttaaa cgaacgtact tgcagatgtg acaagccgag gcggtgagcc 1740 gggcaggagg aaggagcctc cctcagggtt tcgggaacca gatctctcac caggaaagac 1800 tgatacagaa cgatcgatac agaaaccacg ctgccgccac cacaccatca ccatcgacag 1860 aacagtcctt aatccagaaa cctgaaatga aggaagagga gactctgcgc agagcacttt 1920 gggtccggag ggcgagactc cggcggaagc attcccgggc gggtgaccca gcacggtccc 1980 tcttggaatt ggattcgcca ttttattttt cttgctgcta aatcaccgag cccggaagat 2040 tagagagttt tatttctggg attcctgtag acacacccac ccacatacat acatttatat 2100 atatatatat tatatatata taaaaataaa tatctctatt ttatatatat aaaatatata 2160 tattcttttt ttaaattaac agtgctaatg ttattggtgt cttcactgga tgtatttgac 2220 tgctgtggac ttgagttggg aggggaatgt tcccactcag atcctgacag ggaagaggag 2280 gagatgagag actctggcat gatctttttt ttgtcccact tggtggggcc agggtcctct 2340 cccctgccca ggaatgtgca aggccagggc atgggggcaa atatgaccca gttttgggaa 2400 caccgacaaa cccagccctg gcgctgagcc tctctacccc aggtcagacg gacagaaaga 2460 cagatcacag gtacagggat gaggacaccg gctctgacca ggagtttggg gagcttcagg 2520 acattgctgt gctttgggga ttccctccac atgctgcacg cgcatctcgc ccccaggggc 2580 actgcctgga agattcagga gcctgggcgg ccttcgctta ctctcacctg cttctgagtt 2640 gcccaggaga ccactggcag atgtcccggc gaagagaaga gacacattgt tggaagaagc 2700 agcccatgac agctcccctt cctgggactc gccctcatcc tcttcctgct ccccttcctg 2760 gggtgcagcc taaaaggacc tatgtcctca caccattgaa accactagtt ctgtcccccc 2820 aggagacctg gttgtgtgtg tgtgagtggt tgaccttcct ccatcccctg gtccttccct 2880 tcccttcccg aggcacagag agacagggca ggatccacgt gcccattgtg gaggcagaga 2940 aaagagaaag tgttttatat acggtactta tttaatatcc ctttttaatt agaaattaaa 3000 acagttaatt taattaaaga gtagggtttt ttttcagtat tcttggttaa tatttaattt 3060 caactattta tgagatgtat cttttgctct ctcttgctct cttatttgta ccggtttttg 3120 tatataaaat tcatgtttcc aatctctctc tccctgatcg gtgacagtca ctagcttatc 3180 ttgaacagat atttaatttt gctaacactc agctctgccc tccccgatcc cctggctccc 3240 cagcacacat tcctttgaaa taaggtttca atatacatct acatactata tatatatttg 3300 gcaacttgta tttgtgtgta tatatatata tatatgttta tgtatatatg tgattctgat 3360 aaaatagaca ttgctattct gttttttata tgtaaaaaca aaacaagaaa aaatagagaa 3420 ttctacatac taaatctctc tcctttttta attttaatat ttgttatcat ttatttattg 3480 gtgctactgt ttatccgtaa taattgtggg gaaaagatat taacatcacg tctttgtctc 3540 tagtgcagtt tttcgagata ttccgtagta catatttatt tttaaacaac gacaaagaaa 3600 tacagatata tcttaaaaaa aaaaaagcat tttgtattaa agaatttaat tctgatctca 3660 aaaaaaaaaa aaaaaaa 3677 <210> 6 <211> 2729 <212> DNA <213> Homo sapiens <400> 6 ggcggccgag caccgagcgc tgggcaccgg gcaccgagcg gcggcggcac gcgaggcccg 60 gccccgagca gcgcccccgc ccgccgcggc ctccagcccg gccccgccca gcgccggccc 120 gcggggatgc ggagcggcgg gcgccggagg ccgcggcccg gctaggcccg cgctcgcgcc 180 cggacgcggc ggcccgaggc tgtggccagg ccagctgggc tcggggagcg ccagcctgag 240 aggagcgcgt gagcgtcgcg ggagcctcgg gcaccatgag cgacgtggct attgtgaagg 300 agggttggct gcacaaacga ggggagtaca tcaagacctg gcggccacgc tacttcctcc 360 tcaagaatga tggcaccttc attggctaca aggagcggcc gcaggatgtg gaccaacgtg 420 aggctcccct caacaacttc tctgtggcgc agtgccagct gatgaagacg gagcggcccc 480 ggcccaacac cttcatcatc cgctgcctgc agtggaccac tgtcatcgaa cgcaccttcc 540 atgtggagac tcctgaggag cgggaggagt ggacaaccgc catccagact gtggctgacg 600 gcctcaagaa gcaggaggag gaggagatgg acttccggtc gggctcaccc agtgacaact 660 caggggctga agagatggag gtgtccctgg ccaagcccaa gcaccgcgtg accatgaacg 720 agtttgagta cctgaagctg ctgggcaagg gcactttcgg caaggtgatc ctggtgaagg 780 agaaggccac aggccgctac tacgccatga agatcctcaa gaaggaagtc atcgtggcca 840 aggacgaggt ggcccacaca ctcaccgaga accgcgtcct gcagaactcc aggcacccct 900 tcctcacagc cctgaagtac tctttccaga cccacgaccg cctctgcttt gtcatggagt 960 acgccaacgg gggcgagctg ttcttccacc tgtcccggga gcgtgtgttc tccgaggacc 1020 gggcccgctt ctatggcgct gagattgtgt cagccctgga ctacctgcac tcggagaaga 1080 acgtggtgta ccgggacctc aagctggaga acctcatgct ggacaaggac gggcacatta 1140 agatcacaga cttcgggctg tgcaaggagg ggatcaagga cggtgccacc atgaagacct 1200 tttgcggcac acctgagtac ctggcccccg aggtgctgga ggacaatgac tacggccgtg 1260 cagtggactg gtgggggctg ggcgtggtca tgtacgagat gatgtgcggt cgcctgccct 1320 tctacaacca ggaccatgag aagctttttg agctcatcct catggaggag atccgcttcc 1380 cgcgcacgct tggtcccgag gccaagtcct tgctttcagg gctgctcaag aaggacccca 1440 agcagaggct tggcgggggc tccgaggacg ccaaggagat catgcagcat cgcttctttg 1500 ccggtatcgt gtggcagcac gtgtacgaga agaagctcag cccacccttc aagccccagg 1560 tcacgtcgga gactgacacc aggtattttg atgaggagtt cacggcccag atgatcacca 1620 tcacaccacc tgaccaagat gacagcatgg agtgtgtgga cagcgagcgc aggccccact 1680 tcccccagtt ctcctactcg gccagcggca cggcctgagg cggcggtgga ctgcgctgga 1740 cgatagcttg gagggatgga gaggcggcct cgtgccatga tctgtattta atggttttta 1800 tttctcgggt gcatttgaga gaagccacgc tgtcctctcg agcccagatg gaaagacgtt 1860 tttgtgctgt gggcagcacc ctcccccgca gcggggtagg gaagaaaact atcctgcggg 1920 ttttaattta tttcatccag tttgttctcc gggtgtggcc tcagccctca gaacaatccg 1980 attcacgtag ggaaatgtta aggacttctg cagctatgcg caatgtggca ttggggggcc 2040 gggcaggtcc tgcccatgtg tcccctcact ctgtcagcca gccgccctgg gctgtctgtc 2100 accagctatc tgtcatctct ctggggccct gggcctcagt tcaacctggt ggcaccagat 2160 gcaacctcac tatggtatgc tggccagcac cctctcctgg gggtggcagg cacacagcag 2220 ccccccagca ctaaggccgt gtctctgagg acgtcatcgg aggctgggcc cctgggatgg 2280 gaccagggat gggggatggg ccagggttta cccagtggga cagaggagca aggtttaaat 2340 ttgttattgt gtattatgtt gttcaaatgc attttggggg tttttaatct ttgtgacagg 2400 aaagccctcc cccttcccct tctgtgtcac agttcttggt gactgtccca ccgggagcct 2460 ccccctcaga tgatctctcc acggtagcac ttgacctttt cgacgcttaa cctttccgct 2520 gtcgccccag gccctccctg actccctgtg ggggtggcca tccctgggcc cctccacgcc 2580 tcctggccag acgctgccgc tgccgctgca ccacggcgtt tttttacaac attcaacttt 2640 agtattttta ctattataat ataatatgga accttccctc caaattcttc aataaaagtt 2700 gcttttcaaa aaaaaaaaaa aaaaaaaaa 2729 <210> 7 <211> 1680 <212> DNA <213> Homo sapiens <400> 7 gagacggcgg cggctgtagc ggcgtgacag gagccccatg gcacctgccc agccccacct 60 cagcccatct tgacaaaatc taaggctcca tggagccacc acggggcccc cctgccaatg 120 gggccgagcc atcccgggca gtgggcaccg tcaaagtata cctgcccaac aagcaacgca 180 cggtggtgac tgtccgggat ggcatgagtg tctacgactc tctagacaag gccctgaagg 240 tgcggggtct aaatcaggac tgctgtgtgg tctaccgact catcaaggga cgaaagacgg 300 tcactgcctg ggacacagcc attgctcccc tggatggcga ggagctcatt gtcgaggtcc 360 ttgaagatgt cccgctgacc atgcacaatt ttgtacggaa gaccttcttc agcctggcgt 420 tctgtgactt ctgccttaag tttctgttcc atggcttccg ttgccaaacc tgtggctaca 480 agttccacca gcattgttcc tccaaggtcc ccacagtctg tgttgacatg agtaccaacc 540 gccaacagcc ctcaaggttc taccacagtg tccaggattt gtccggaggc tccagacagc 600 atgaggctcc ctcgaaccgc cccctgaatg agttgctaac cccccagggt cccagccccc 660 gcacccagca ctgtgacccg gagcacttcc ccttccctgc cccagccaat gcccccctac 720 agcgcatccg ctccacgtcc actcccaacg tccatatggt cagcaccacg gcccccatgg 780 actccaacct catccagctc actggccaga gtttcagcac tgatgctgcc ggtagtagag 840 gaggtagtga tggaaccccc cgggggagcc ccagcccagc cagcgtgtcc tcggggagga 900 agtccccaca ttccaagtca ccagcagagc agcgcgagcg gaagtccttg gccgatgaca 960 agaagaaagt gaagaacctg gggtaccggg actcaggcta ttactgggag gtaccaccca 1020 gtgaggtgca gctgctgaag aggatcggga cgggctcgtt tggcaccgtg tttcgagggc 1080 ggtggcatgg cgatgtggcc gtgaaggtgc tcaaggtgtc ccagcccaca gctgagcagg 1140 cccaggcttt caagaatgag atgcaggtgc tcaggaagac gcgacatgtc aacatcttgc 1200 tgtttatggg cttcatgacc cggccgggat ttgccatcat cacacagtgg tgtgagggct 1260 ccagcctcta ccatcacctg catgtggccg acacacgctt cgacatggtc cagctcatcg 1320 acgtggcccg gcagactgcc cagggcatgg actacctcca tgccaagaac atcatccacc 1380 gagatctcaa gtctaacaac atcttcctac atgaggggct cacggtgaag atcggtgact 1440 ttggcttggc cacagtgaag actcgatgga gcggggccca gcccttggag cagccctcag 1500 gatctgtgct gtggatggca gctgaggtga tccgtatgca ggacccgaac ccctacagct 1560 tccagtcaga cgtctatgcc tacggggttg tgctctacga gcttatgact ggctcactgc 1620 cttacagcca cattggctgc cgtgaccaga ttatctttat ggtgggccgt ggctatctgt 1680 <210> 8 <211> 1216 <212> DNA <213> Homo sapiens <400> 8 ctcattgact tccttcctgt tctaactgcc agtactcaga agtcagagtt gagagacaga 60 ggcaccccgg acagagacgt gaagcactga ataaatagat cagaatgact gaaaaagccc 120 cagagccaca tgtggaggag gatgatgatg atgagctgga cagcaagctc aattataagc 180 ctccaccaca gaagtccctg aaagagctgc aggaaatgga caaagatgat gagagtctaa 240 ttaagtacaa gaaaacgctg ctgggagatg gtcctgtggt gacagatccg aaagccccca 300 atgtcgttgt cacccggctc accctggttt gtgagagtgc cccgggacca atcaccatgg 360 accttactgg agatctggaa gccctcaaaa aggaaaccat tgtgttaaag gaaggttctg 420 aatatagagt caaaattcac ttcaaagtga acagggatat tgtgtcaggc ctgaaatacg 480 ttcagcacac ctacaggact ggggtgaaag tggataaagc aacatttatg gttggcagct 540 atggacctcg gcctgaggag tatgagttcc tcactccagt tgaggaggct cccaagggca 600 tgctggcgcg aggcacgtac cacaacaagt ccttcttcac cgacgatgac aagcaagacc 660 acctcagctg ggagtggaac ctgtcgatta agaaggagtg gacagaatga atgcatccac 720 ccctttcccc acccttgcca cctggaagaa ttctctcagg cgtgttcagc accctgtccc 780 tcctccctgt ccacagctgg gtccctcttc aacactgcca catttcctta ttgatgcatc 840 ttttcccacc ctgtcactca acgtggtccc tagaacaaga ggcttaaaac cgggctttca 900 cccaacctgc tccctctgat cctccatcag ggccagatct tccacgtctc catctcagta 960 cacaatcatt taatatttcc ctgtcttacc cctattcaag caactagagg ccagaaaatg 1020 ggcaaattat cactaacagg tctttgactc aggttccagt agttcattct aatgcctaga 1080 ttcttttgtg gttgttgctg gcccaatgag tccctagtca catcccctgc cagagggagt 1140 tcttcttttg tgagagacac tgtaaacgac acaagagaac aagaataaaa caataactgt 1200 gtgtgttctg gctgag 1216 <210> 9 <211> 987 <212> DNA <213> Homo sapiens <400> 9 aatataagtg gaggcgtcgc gctggcgggc attcctgaag ctgacagcat tcgggccgag 60 atgtctcgct ccgtggcctt agctgtgctc gcgctactct ctctttctgg cctggaggct 120 atccagcgta ctccaaagat tcaggtttac tcacgtcatc cagcagagaa tggaaagtca 180 aatttcctga attgctatgt gtctgggttt catccatccg acattgaagt tgacttactg 240 aagaatggag agagaattga aaaagtggag cattcagact tgtctttcag caaggactgg 300 tctttctatc tcttgtacta cactgaattc acccccactg aaaaagatga gtatgcctgc 360 cgtgtgaacc atgtgacttt gtcacagccc aagatagtta agtgggatcg agacatgtaa 420 gcagcatcat ggaggtttga agatgccgca tttggattgg atgaattcca aattctgctt 480 gcttgctttt taatattgat atgcttatac acttacactt tatgcacaaa atgtagggtt 540 ataataatgt taacatggac atgatcttct ttataattct actttgagtg ctgtctccat 600 gtttgatgta tctgagcagg ttgctccaca ggtagctcta ggagggctgg caacttagag 660 gtggggagca gagaattctc ttatccaaca tcaacatctt ggtcagattt gaactcttca 720 atctcttgca ctcaaagctt gttaagatag ttaagcgtgc ataagttaac ttccaattta 780 catactctgc ttagaatttg ggggaaaatt tagaaatata attgacagga ttattggaaa 840 tttgttataa tgaatgaaac attttgtcat ataagattca tatttacttc ttatacattt 900 gataaagtaa ggcatggttg tggttaatct ggtttatttt tgttccacaa gttaaataaa 960 tcataaaact tgatgtgtta tctctta 987 <210> 10 <211> 1613 <212> DNA <213> Homo sapiens <400> 10 gtgacgctgg gcctgcagcg cggagcagaa agcagaaccc gcagagtcct ccctgctgct 60 gtgtggacga cacgtgggca caggcagaag tgggccctgt gaccagctgc actggtttcg 120 tggaaggaag ctccaggact ggcgggatgg gctcagcctg tatcaaagtc accaaatact 180 ttctcttcct cttcaacttg atcttcttta tcctgggcgc agtgatcctg ggcttcgggg 240 tgtggatcct ggccgacaag agcagtttca tctctgtcct gcaaacctcc tccagctcgc 300 ttaggatggg ggcctatgtc ttcatcggcg tgggggcagt cactatgctc atgggcttcc 360 tgggctgcat cggcgccgtc aacgaggtcc gctgcctgct ggggctgtac tttgctttcc 420 tgctcctgat cctcattgcc caggtgacgg ccggggccct cttctacttc aacatgggca 480 agctgaagca ggagatgggc ggcatcgtga ctgagctcat tcgagactac aacagcagtc 540 gcgaggacag cctgcaggat gcctgggact acgtgcaggc tcaggtgaag tgctgcggct 600 gggtcagctt ctacaactgg acagacaacg ctgagctcat gaatcgccct gaggtcacct 660 acccctgttc ctgcgaagtc aagggggaag aggacaacag cctttctgtg aggaagggct 720 tctgcgaggc ccccggcaac aggacccaga gtggcaacca ccctgaggac tggcctgtgt 780 accaggaggg ctgcatggag aaggtgcagg cgtggctgca ggagaacctg ggcatcatcc 840 tcggcgtggg cgtgggtgtg gccatcgtcg agctcctggg gatggtcctg tccatctgct 900 tgtgccggca cgtccattcc gaagactaca gcaaggtccc caagtactga ggcagctgct 960 atccccatct ccctgcctgg cccccaacct cagggctccc aggggtctcc ctggctccct 1020 cctccaggcc tgcctcccac ttcactgcga agaccctctt gcccaccctg actgaaagta 1080 gggggctttc tggggcctag cgatctctcc tggcctatcc gctgccagcc ttgagccctg 1140 gctgttctgt ggttcctctg ctcaccgccc atcagggttc tcttagcaac tcagagaaaa 1200 atgctcccca cagcgtccct ggcgcaggtg ggctggactt ctacctgccc tcaagggtgt 1260 gtatattgta taggggcaac tgtatgaaaa attggggagg agggggccgg gcgcggtggc 1320 tcacgcctgt aatcccagca ctttgggagg ccgaggcggg tggatcacga ggtcaggaga 1380 tcgagaccat cctggctaac atggtgaaac cccgtctcta ctaaaaatac aaaaaaaatt 1440 tagccgggcg cggtggcggg cacctgtagt cccagctact tgggaggctg aggcaggaga 1500 atggtgtgaa cccgggagcg gaggttgcag tgagctgaga tcgtgctact gcactccagc 1560 ctgggggaca gaaagagact ccgtctcaaa aaaaaaaaaa aaaaaaaaaa aaa 1613 <210> 11 <211> 2265 <212> DNA <213> Homo sapiens <400> 11 acgcggaggt tgtaattggt ctctagacca cacctagttg ttgagtgccg ctgcttgaaa 60 atctcagttc tgccgagatc gcagaataca cacaagctac ctttgggcac cagagcagac 120 agaaccgcgg agcttcaggg tggaagattc gtggaaactt tgccaaggcc aggacctcgt 180 gtgttcccgt ccgcccctct gggacggcgc cagcccggca ggccgccgac cgtcctgggg 240 ctcccgcgca gcgcgatgcc ggcctcgtcc accgtccacg tgctgcagct gctgcgggag 300 ctgctcgcct tcgtgctcct cagctacacg gtgctcatcg gggcgctgct gctggccggc 360 tggaccactt acttcctggt gctgaagtga cagcgccgtc gccgcgcccg gccccgcctc 420 ccgcccggcc ccgcctcccg cccggccccg cctccctaac tcaccaggaa attcccttca 480 agccctggcc cgaactgagt ccccgcccac ccgccagcgt cacggcgccc gactcagctc 540 cgcgccggac ccacctccgc gccctcaggc cctgcatatg ccccgccccg cgcggaagtt 600 ccggcggttg gttgccttgc gcggccgtta cagcctttgc cctaagcctc gccccctttc 660 cccctgcctg cccaatcccg actgcttcct tgggtggggg cgtggctatg gggcgaggcg 720 ctctcaggtg gaggccgtgc cccgctccgc gctcacgaag ctgcgtcact tccggcgtgt 780 gcgtctggcg tccgcgcgct gcacaatggc ggctctgaag agttggctgt cgcgcagcgt 840 aacttcattc ttcaggtaca gacagtgttt gtgtgttcct gttgtggcta actttaagaa 900 gcggtgtttc tcagaattga taagaccatg gcacaaaact gtgacgattg gctttggagt 960 aaccctgtgt gcggttccta ttgcacagaa atcagagcct cattccctta gtagtgaagc 1020 attgatgagg agagcagtgt ctttggtaac agatagcacc tctacctttc tctctcagac 1080 cacatatgcg ttgattgaag ctattactga atatactaag gctgtttata ccttaacttc 1140 tctttaccga caatatacaa gtttacttgg gaaaatgaat tcagaggagg aagatgaagt 1200 gtggcaggtg atcataggag ccagagctga gatgacttca aaacaccaag agtacttgaa 1260 gctggaaacc acttggatga ctgcagttgg tctttcagag atggcagcag aagctgcata 1320 tcaaactggc gcagatcagg cctctataac cgccaggaat cacattcagc tggtgaaact 1380 gcaggtggaa gaggtgcacc agctctcccg gaaagcagaa accaagctgg cagaagcaca 1440 gatagaagag ctccgtcaga aaacacagga ggaaggggag gagcgggctg agtcggagca 1500 ggaggcctac ctgcgtgagg attgagggcc tgagcacact gccctgtctc cccactcagt 1560 ggggaaagca ggggcagatg ccaccctgcc cagggttggc atgactgtct gtgcaccgag 1620 aagaggcggc agatcctgcc ctggccaatc aggcgagacg cctttgtgag ctgtgagtgc 1680 ctcctgtggt ctcaggcttg cgctggacct ggttcttagc ccttgggcac tgcaccctgt 1740 ttaacatttc accccactct gtacagctgc tcttacccat tttttttacc tcacacccaa 1800 agcattttgc ctacctgggt cagagagagg agtccttttt gtcatgccct taagttcagc 1860 aactgtttaa cctgttttca gtcttattta cgtcgtcaaa aatgatttag tacttgttcc 1920 ctctgttggg atgccagttg tggcaggggg aggggaacct gtccagtttg tacgatttct 1980 ttgtatgtat ttctgatgtg ttctctgatc tgcccccact gtcctgtgag gacagctgag 2040 gccaaggagt gaaaaaccta ttactactaa gagaaggggt gcagagtgtt tacctggtgc 2100 tctcaacagg acttaacatc aacaggactt aacacaggcc tcttgttcct tcctttcttt 2160 ccgtttctct attgtatcca aaggagaaga gtgtaagatt ttgtttgcat ctgaaagaga 2220 aaatgcgtct ctcctggggt cctaaaaaaa aaaaaaaaaa aaaaa 2265 <210> 12 <211> 3031 <212> DNA <213> Homo sapiens <400> 12 caatcgcgaa accccgagga gcgctcgggc tgtctgcgga ccctgccgcg tgcaggggtc 60 gcggccggct ggagctggga gtgaggcggc ggaggagcca ggtgaggagg agccaggaag 120 gcagttggtg ggaagtccag cttgggtccc tgaggagctg tgagaaggag atgcggctgc 180 tgctggccct gttgggggtc ctgctgagtg tgcctgggcc tccagtcttg tccctggagg 240 cctctgagga agtggagctt gagccctgcc tggctcccag cctggagcag caagagcagg 300 agctgacagt agcccttggg cagcctgtgc gtctgtgctg tgggcgggct gagcgtggtg 360 gccactggta caaggagggc agtcgcctgg cacctgctgg ccgtgtacgg ggctggaggg 420 gccgcctaga gattgccagc ttcctacctg aggatgctgg ccgctacctc tgcctggcac 480 gaggctccat gatcgtcctg cagaatctca ccttgattac aggtgactcc ttgacctcca 540 gcaacgatga tgaggacccc aagtcccata gggacccctc gaataggcac agttaccccc 600 agcaagcacc ctactggaca cacccccagc gcatggagaa gaaactgcat gcagtacctg 660 cggggaacac cgtcaagttc cgctgtccag ctgcaggcaa ccccacgccc accatccgct 720 ggcttaagga tggacaggcc tttcatgggg agaaccgcat tggaggcatt cggctgcgcc 780 atcagcactg gagtctcgtg atggagagcg tggtgccctc ggaccgcggc acatacacct 840 gcctggtaga gaacgctgtg ggcagcatcc gctataacta cctgctagat gtgctggagc 900 ggtccccgca ccggcccatc ctgcaggccg ggctcccggc caacaccaca gccgtggtgg 960 gcagcgacgt ggagctgctg tgcaaggtgt acagcgatgc ccagccccac atccagtggc 1020 tgaagcacat cgtcatcaac ggcagcagct tcggagccga cggtttcccc tatgtgcaag 1080 tcctaaagac tgcagacatc aatagctcag aggtggaggt cctgtacctg cggaacgtgt 1140 cagccgagga cgcaggcgag tacacctgcc tcgcaggcaa ttccatcggc ctctcctacc 1200 agtctgcctg gctcacggtg ctgccagagg aggaccccac atggaccgca gcagcgcccg 1260 aggccaggta tacggacatc atcctgtacg cgtcgggctc cctggccttg gctgtgctcc 1320 tgctgctggc cgggctgtat cgagggcagg cgctccacgg ccggcacccc cgcccgcccg 1380 ccactgtgca gaagctctcc cgcttccctc tggcccgaca gttctccctg gagtcaggct 1440 cttccggcaa gtcaagctca tccctggtac gaggcgtgcg tctctcctcc agcggccccg 1500 ccttgctcgc cggcctcgtg agtctagatc tacctctcga cccactatgg gagttccccc 1560 gggacaggct ggtgcttggg aagcccctag gcgagggctg ctttggccag gtagtacgtg 1620 cagaggcctt tggcatggac cctgcccggc ctgaccaagc cagcactgtg gccgtcaaga 1680 tgctcaaaga caacgcctct gacaaggacc tggccgacct ggtctcggag atggaggtga 1740 tgaagctgat cggccgacac aagaacatca tcaacctgct tggtgtctgc acccaggaag 1800 ggcccctgta cgtgatcgtg gagtgcgccg ccaagggaaa cctgcgggag ttcctgcggg 1860 cccggcgccc cccaggcccc gacctcagcc ccgacggtcc tcggagcagt gaggggccgc 1920 tctccttccc agtcctggtc tcctgcgcct accaggtggc ccgaggcatg cagtatctgg 1980 agtcccggaa gtgtatccac cgggacctgg ctgcccgcaa tgtgctggtg actgaggaca 2040 atgtgatgaa gattgctgac tttgggctgg cccgcggcgt ccaccacatt gactactata 2100 agaaaaccag caacggccgc ctgcctgtga agtggatggc gcccgaggcc ttgtttgacc 2160 gggtgtacac acaccagagt gacgtgtggt cttttgggat cctgctatgg gagatcttca 2220 ccctcggggg ctccccgtat cctggcatcc cggtggagga gctgttctcg ctgctgcggg 2280 agggacatcg gatggaccga cccccacact gccccccaga gctgtacggg ctgatgcgtg 2340 agtgctggca cgcagcgccc tcccagaggc ctaccttcaa gcagctggtg gaggcgctgg 2400 acaaggtcct gctggccgtc tctgaggagt acctcgacct ccgcctgacc ttcggaccct 2460 attccccctc tggtggggac gccagcagca cctgctcctc cagcgattct gtcttcagcc 2520 acgaccccct gccattggga tccagctcct tccccttcgg gtctggggtg cagacatgag 2580 caaggctcaa ggctgtgcag gcacataggc tggtggcctt gggccttggg gctcagccac 2640 agcctgacac agtgctcgac cttgatagca tggggcccct ggcccagagt tgctgtgccg 2700 tgtccaaggg ccgtgccctt gcccttggag ctgccgtgcc tgtgtcctga tggcccaaat 2760 gtcagggttc tgctcggctt cttggaccaa ggcgcttagt ccccatcccg ggtttggctg 2820 agcctggctg gagagctgct atgctaaacc tcctgcctcc caataccagc aggaggttct 2880 gggcctctga accccctttc cccacacctc cccctgctgc tgctgcccca gcgtcttgac 2940 gggagcattg gcccctgagc ccagagaagc tggaagcctg ccgaaaacag gagcaaatgg 3000 cgttttataa attatttttt tgaaataaaa a 3031 <210> 13 <211> 2321 <212> DNA <213> Homo sapiens <400> 13 gtcctcaacc aagatggcgc ggatggcttc aggcgcatca cgacaccggc gcgtcacgcg 60 acccgcccta cgggcacctc ccgcgctttt cttagcgccg cagacggtgg ccgagcgggg 120 gaccgggaag catggcccgg gggtcggcgg ttgcctgggc ggcgctcggg ccgttgttgt 180 ggggctgcgc gctggggctg cagggcggga tgctgtaccc ccaggagagc ccgtcgcggg 240 agtgcaagga gctggacggc ctctggagct tccgcgccga cttctctgac aaccgacgcc 300 ggggcttcga ggagcagtgg taccggcggc cgctgtggga gtcaggcccc accgtggaca 360 tgccagttcc ctccagcttc aatgacatca gccaggactg gcgtctgcgg cattttgtcg 420 gctgggtgtg gtacgaacgg gaggtgatcc tgccggagcg atggacccag gacctgcgca 480 caagagtggt gctgaggatt ggcagtgccc attcctatgc catcgtgtgg gtgaatgggg 540 tcgacacgct agagcatgag gggggctacc tccccttcga ggccgacatc agcaacctgg 600 tccaggtggg gcccctgccc tcccggctcc gaatcactat cgccatcaac aacacactca 660 cccccaccac cctgccacca gggaccatcc aatacctgac tgacacctcc aagtatccca 720 agggttactt tgtccagaac acatattttg actttttcaa ctacgctgga ctgcagcggt 780 ctgtacttct gtacacgaca cccaccacct acatcgatga catcaccgtc accaccagcg 840 tggagcaaga cagtgggctg gtgaattacc agatctctgt caagggcagt aacctgttca 900 agttggaagt gcgtcttttg gatgcagaaa acaaagtcgt ggcgaatggg actgggaccc 960 agggccaact taaggtgcca ggtgtcagcc tctggtggcc gtacctgatg cacgaacgcc 1020 ctgcctatct gtattcattg gaggtgcagc tgactgcaca gacgtcactg gggcctgtgt 1080 ctgacttcta cacactccct gtggggatcc gcactgtggc tgtcaccaag agccagttcc 1140 tcatcaatgg gaaacctttc tatttccacg gtgtcaacaa gcatgaggat gcggacatcc 1200 gagggaaggg cttcgactgg ccgctgctgg tgaaggactt caacctgctt cgctggcttg 1260 gtgccaacgc tttccgtacc agccactacc cctatgcaga ggaagtgatg cagatgtgtg 1320 accgctatgg gattgtggtc atcgatgagt gtcccggcgt gggcctggcg ctgccgcagt 1380 tcttcaacaa cgtttctctg catcaccaca tgcaggtgat ggaagaagtg gtgcgtaggg 1440 acaagaacca ccccgcggtc gtgatgtggt ctgtggccaa cgagcctgcg tcccacctag 1500 aatctgctgg ctactacttg aagatggtga tcgctcacac caaatccttg gacccctccc 1560 ggcctgtgac ctttgtgagc aactctaact atgcagcaga caagggggct ccgtatgtgg 1620 atgtgatctg tttgaacagc tactactctt ggtatcacga ctacgggcac ctggagttga 1680 ttcagctgca gctggccacc cagtttgaga actggtataa gaagtatcag aagcccatta 1740 ttcagagcga gtatggagca gaaacgattg cagggtttca ccaggatcca cctctgatgt 1800 tcactgaaga gtaccagaaa agtctgctag agcagtacca tctgggtctg gatcaaaaac 1860 gcagaaaata cgtggttgga gagctcattt ggaattttgc cgatttcatg actgaacagt 1920 caccgacgag agtgctgggg aataaaaagg ggatcttcac tcggcagaga caaccaaaaa 1980 gtgcagcgtt ccttttgcga gagagatact ggaagattgc caatgaaacc aggtatcccc 2040 actcagtagc caagtcacaa tgtttggaaa acagcctgtt tacttgagca agactgatac 2100 cacctgcgtg tcccttcctc cccgagtcag ggcgacttcc acagcagcag aacaagtgcc 2160 tcctggactg ttcacggcag accagaacgt ttctggcctg ggttttgtgg tcatctattc 2220 tagcagggaa cactaaaggt ggaaataaaa gattttctat tatggaaata aagagttggc 2280 atgaaagtgg ctactgaaaa aaaaaaaaaa aaaaaaaaaa a 2321 <210> 14 <211> 1606 <212> DNA <213> Homo sapiens <400> 14 aaatgtgacc ggccgcggct ccggcagtca acgcctgcct cctctcgagc gtcctcagcg 60 cagccgccgc ccgcggagcc agcacgaacg agcccagcac cggccggatg gagcgtccgc 120 aacccgacag catgccccag gatttgtcag aggccctgaa ggaggccacc aaggaggtgc 180 acacccaggc agagaatgct gagttcatga ggaactttca gaagggccag gtgacccgag 240 acggcttcaa gctggtgatg gcctccctgt accacatcta tgtggccctg gaggaggaga 300 ttgagcgcaa caaggagagc ccagtcttcg cccctgtcta cttcccagaa gagctgcacc 360 gcaaggctgc cctggagcag gacctggcct tctggtacgg gccccgctgg caggaggtca 420 tcccctacac accagccatg cagcgctatg tgaagcggct ccacgaggtg gggcgcacag 480 agcccgagct gctggtggcc cacgcctaca cccgctacct gggtgacctg tctgggggcc 540 aggtgctcaa aaagattgcc cagaaagccc tggacctgcc cagctctggc gagggcctgg 600 ccttcttcac cttccccaac attgccagtg ccaccaagtt caagcagctc taccgctccc 660 gcatgaactc cctggagatg actcccgcag tcaggcagag ggtgatagaa gaggccaaga 720 ctgcgttcct gctcaacatc cagctctttg aggagttgca ggagctgctg acccatgaca 780 ccaaggacca gagcccctca cgggcaccag ggcttcgcca gcgggccagc aacaaagtgc 840 aagattctgc ccccgtggag actcccagag ggaagccccc actcaacacc cgctcccagg 900 ctccgcttct ccgatgggtc cttacactca gctttctggt ggcgacagtt gctgtagggc 960 tttatgccat gtgaatgcag gcatgctggc tcccagggcc atgaactttg tccggtggaa 1020 ggccttcttt ctagagaggg aattctcttg gctggcttcc ttaccgtggg cactgaaggc 1080 tttcagggcc tccagccctc tcactgtgtc cctctctctg gaaaggagga aggagcctat 1140 ggcatcttcc ccaacgaaaa gcacatccag gcaatggcct aaacttcaga gggggcgaag 1200 ggatcagccc tgcccttcag catcctcagt tcctgcagca gagcctggaa gacaccctaa 1260 tgtggcagct gtctcaaacc tccaaaagcc ctgagtttca agtatccttg ttgacacggc 1320 catgaccact ttccccgtgg gccatggcaa tttttacaca aacctgaaaa gatgttgtgt 1380 cttgtgtttt tgtcttattt ttgttggagc cactctgttc ctggctcagc ctcaaatgca 1440 gtatttttgt tgtgttctgt tgtttttata gcagggttgg ggtggttttt gagccatgcg 1500 tgggtgggga gggaggtgtt taacggcact gtggccttgg tctaactttt gtgtgaaata 1560 ataaacaaca ttgtctgata gtagcttgaa aaaaaaaaaa aaaaaa 1606 <210> 15 <211> 3879 <212> DNA <213> Homo sapiens <400> 15 atcagacgcg cagaggaggc ggggccgcgg ctggtttcct gccggggggc ggctctgggc 60 cgccgagtcc cctcctcccg cccctgagga ggaggagccg ccgccacccg ccgcgcccga 120 cacccgggag gccccgccag cccgcgggag aggcccagcg ggagtcgcgg aacagcaggc 180 ccgagcccac cgcgccgggc cccggacgcc gcgcggaaaa gatgaattta caaccaattt 240 tctggattgg actgatcagt tcagtttgct gtgtgtttgc tcaaacagat gaaaatagat 300 gtttaaaagc aaatgccaaa tcatgtggag aatgtataca agcagggcca aattgtgggt 360 ggtgcacaaa ttcaacattt ttacaggaag gaatgcctac ttctgcacga tgtgatgatt 420 tagaagcctt aaaaaagaag ggttgccctc cagatgacat agaaaatccc agaggctcca 480 aagatataaa gaaaaataaa aatgtaacca accgtagcaa aggaacagca gagaagctca 540 agccagagga tattactcag atccaaccac agcagttggt tttgcgatta agatcagggg 600 agccacagac atttacatta aaattcaaga gagctgaaga ctatcccatt gacctctact 660 accttatgga cctgtcttac tcaatgaaag acgatttgga gaatgtaaaa agtcttggaa 720 cagatctgat gaatgaaatg aggaggatta cttcggactt cagaattgga tttggctcat 780 ttgtggaaaa gactgtgatg ccttacatta gcacaacacc agctaagctc aggaaccctt 840 gcacaagtga acagaactgc accagcccat ttagctacaa aaatgtgctc agtcttacta 900 ataaaggaga agtatttaat gaacttgttg gaaaacagcg catatctgga aatttggatt 960 ctccagaagg tggtttcgat gccatcatgc aagttgcagt ttgtggatca ctgattggct 1020 ggaggaatgt tacacggctg ctggtgtttt ccacagatgc cgggtttcac tttgctggag 1080 atgggaaact tggtggcatt gttttaccaa atgatggaca atgtcacctg gaaaataata 1140 tgtacacaat gagccattat tatgattatc cttctattgc tcaccttgtc cagaaactga 1200 gtgaaaataa tattcagaca atttttgcag ttactgaaga atttcagcct gtttacaagg 1260 agctgaaaaa cttgatccct aagtcagcag taggaacatt atctgcaaat tctagcaatg 1320 taattcagtt gatcattgat gcatacaatt ccctttcctc agaagtcatt ttggaaaacg 1380 gcaaattgtc agaaggcgta acaataagtt acaaatctta ctgcaagaac ggggtgaatg 1440 gaacagggga aaatggaaga aaatgttcca atatttccat tggagatgag gttcaatttg 1500 aaattagcat aacttcaaat aagtgtccaa aaaaggattc tgacagcttt aaaattaggc 1560 ctctgggctt tacggaggaa gtagaggtta ttcttcagta catctgtgaa tgtgaatgcc 1620 aaagcgaagg catccctgaa agtcccaagt gtcatgaagg aaatgggaca tttgagtgtg 1680 gcgcgtgcag gtgcaatgaa gggcgtgttg gtagacattg tgaatgcagc acagatgaag 1740 ttaacagtga agacatggat gcttactgca ggaaagaaaa cagttcagaa atctgcagta 1800 acaatggaga gtgcgtctgc ggacagtgtg tttgtaggaa gagggataat acaaatgaaa 1860 tttattctgg caaattctgc gagtgtgata atttcaactg tgatagatcc aatggcttaa 1920 tttgtggagg aaatggtgtt tgcaagtgtc gtgtgtgtga gtgcaacccc aactacactg 1980 gcagtgcatg tgactgttct ttggatacta gtacttgtga agccagcaac ggacagatct 2040 gcaatggccg gggcatctgc gagtgtggtg tctgtaagtg tacagatccg aagtttcaag 2100 ggcaaacgtg tgagatgtgt cagacctgcc ttggtgtctg tgctgagcat aaagaatgtg 2160 ttcagtgcag agccttcaat aaaggagaaa agaaagacac atgcacacag gaatgttcct 2220 attttaacat taccaaggta gaaagtcggg acaaattacc ccagccggtc caacctgatc 2280 ctgtgtccca ttgtaaggag aaggatgttg acgactgttg gttctatttt acgtattcag 2340 tgaatgggaa caacgaggtc atggttcatg ttgtggagaa tccagagtgt cccactggtc 2400 cagacatcat tccaattgta gctggtgtgg ttgctggaat tgttcttatt ggccttgcat 2460 tactgctgat atggaagctt ttaatgataa ttcatgacag aagggagttt gctaaatttg 2520 aaaaggagaa aatgaatgcc aaatgggaca cgggtgaaaa tcctatttat aagagtgccg 2580 taacaactgt ggtcaatccg aagtatgagg gaaaatgagt actgcccgtg caaatcccac 2640 aacactgaat gcaaagtagc aatttccata gtcacagtta ggtagcttta gggcaatatt 2700 gccatggttt tactcatgtg caggttttga aaatgtacaa tatgtataat ttttaaaatg 2760 ttttattatt ttgaaaataa tgttgtaatt catgccaggg actgacaaaa gacttgagac 2820 aggatggtta ctcttgtcag ctaaggtcac attgtgcctt tttgaccttt tcttcctgga 2880 ctattgaaat caagcttatt ggattaagtg atatttctat agcgattgaa agggcaatag 2940 ttaaagtaat gagcatgatg agagtttctg ttaatcatgt attaaaactg atttttagct 3000 ttacaaatat gtcagtttgc agttatgcag aatccaaagt aaatgtcctg ctagctagtt 3060 aaggattgtt ttaaatctgt tattttgcta tttgcctgtt agacatgact gatgacatat 3120 ctgaaagaca agtatgttga gagttgctgg tgtaaaatac gtttgaaata gttgatctac 3180 aaaggccatg ggaaaaattc agagagttag gaaggaaaaa ccaatagctt taaaacctgt 3240 gtgccatttt aagagttact taatgtttgg taacttttat gccttcactt tacaaattca 3300 agccttagat aaaagaaccg agcaattttc tgctaaaaag tccttgattt agcactattt 3360 acatacaggc catactttac aaagtatttg ctgaatgggg accttttgag ttgaatttat 3420 tttattattt ttattttgtt taatgtctgg tgctttctgt cacctcttct aatcttttaa 3480 tgtatttgtt tgcaattttg gggtaagact ttttttatga gtactttttc tttgaagttt 3540 tagcggtcaa tttgcctttt taatgaacat gtgaagttat actgtggcta tgcaacagct 3600 ctcacctacg cgagtcttac tttgagttag tgccataaca gaccactgta tgtttacttc 3660 tcaccatttg agttgcccat cttgtttcac actagtcaca ttcttgtttt aagtgccttt 3720 agttttaaca gttcactttt tacagtgcta tttactgaag ttatttatta aatatgccta 3780 aaatacttaa atcggatgtc ttgactctga tgtattttat caggttgtgt gcatgaaatt 3840 tttatagatt aaagaagttg aggaaaagca aaaaaaaaa 3879 <210> 16 <211> 3751 <212> DNA <213> Homo sapiens <400> 16 cgggcgcagc agctggaacg ggagtactgc gacgcggccc ggagtcggcc ttgtaggggc 60 gaaggtgcag ggagatcgcg gcgggcgcag tcttgagcgc cggagcgcgt ccctgccctt 120 agcggggctt gccccagtcg caggggcaca tccagccgct gcggctgaca gcagccgcgc 180 gcgcgggagt ctgcggggtc gcggcagccg cacctgcgcg ggcgaccagc gcaaggtccc 240 cgcccggctg ggcgggcagc aagggccggg gagagggtgc gggtgcaggc gggggcccca 300 cagggccacc ttcttgcccg gcggctgccg ctggaaaatg tctcaggaga ggcccacgtt 360 ctaccggcag gagctgaaca agacaatctg ggaggtgccc gagcgttacc agaacctgtc 420 tccagtgggc tctggcgcct atggctctgt gtgtgctgct tttgacacaa aaacggggtt 480 acgtgtggca gtgaagaagc tctccagacc atttcagtcc atcattcatg cgaaaagaac 540 ctacagagaa ctgcggttac ttaaacatat gaaacatgaa aatgtgattg gtctgttgga 600 cgtttttaca cctgcaaggt ctctggagga attcaatgat gtgtatctgg tgacccatct 660 catgggggca gatctgaaca acattgtgaa atgtcagaag cttacagatg accatgttca 720 gttccttatc taccaaattc tccgaggtct aaagtatata cattcagctg acataattca 780 cagggaccta aaacctagta atctagctgt gaatgaagac tgtgagctga agattctgga 840 ttttggactg gctcggcaca cagatgatga aatgacaggc tacgtggcca ctaggtggta 900 cagggctcct gagatcatgc tgaactggat gcattacaac cagacagttg atatttggtc 960 agtgggatgc ataatggccg agctgttgac tggaagaaca ttgtttcctg gtacagacca 1020 tattgatcag ttgaagctca ttttaagact cgttggaacc ccaggggctg agcttttgaa 1080 gaaaatctcc tcagagtctg caagaaacta tattcagtct ttgactcaga tgccgaagat 1140 gaactttgcg aatgtattta ttggtgccaa tcccctggct gtcgacttgc tggagaagat 1200 gcttgtattg gactcagata agagaattac agcggcccaa gcccttgcac atgcctactt 1260 tgctcagtac cacgatcctg atgatgaacc agtggccgat ccttatgatc agtcctttga 1320 aagcagggac ctccttatag atgagtggaa aagcctgacc tatgatgaag tcatcagctt 1380 tgtgccacca ccccttgacc aagaagagat ggagtcctga gcacctggtt tctgttctgt 1440 tgatcccact tcactgtgag gggaaggcct tttcatggga actctccaaa tattattcaa 1500 gtgcctcttg ttgcagagat ttcctccatg gtggaagggg gtgtgcgtgc gtgtgcgtgc 1560 gtgttagtgt gtgtgcatgt gtgtgtctgt ctttgtggga gggtaagaca atatgaacaa 1620 actatgatca cagtgacttt acaggaggtt gtggatgctc cagggcagcc tccaccttgc 1680 tcttctttct gagagttggc tcaggcagac aagagctgct gtccttttag gaatatgttc 1740 aatgcaaagt aaaaaaatat gaattgtccc caatcccggt catgcttttg ccactttggc 1800 ttctcctgtg accccacctt gacggtgggg cgtagacttg acaacatccc acagtggcac 1860 ggagagaagg cccatacctt ctggttgctt cagacctgac accgtccctc agtgatacgt 1920 acagccaaaa aggaccaact ggcttctgtg cactagcctg tgattaactt gcttagtatg 1980 gttctcagat cttgacagta tatttgaaac tgtaaatatg tttgtgcctt aaaaggagag 2040 aagaaagtgt agatagttaa aagactgcag ctgctgaagt tctgagccgg gcaagtcgag 2100 agggctgttg gacagctgct tgtgggcccg gagtaatcag gcagccttca taggcggtca 2160 tgtgtgcatg tgagcacatg cgtatatgtg cgtctctctt tctccctcac ccccaggtgt 2220 tgccatttct ctgcttaccc ttcacctttg gtgcagaggt ttcttgaata tctgccccag 2280 tagtcagaag caggttcttg atgtcatgta cttcctgtgt actctttatt tctagcagag 2340 tgaggatgtg ttttgcacgt cttgctattt gagcatgcac agctgcttgt cctgctctct 2400 tcaggaggcc ctggtgtcag gcaggtttgc cagtgaagac ttcttgggta gtttagatcc 2460 catgtcacct cagctgatat tatggcaagt gatatcacct ctcttcagcc cctagtgcta 2520 ttctgtgttg aacacaattg atacttcagg tgcttttgat gtgaaaatca tgaaaagagg 2580 aacaggtgga tgtatagcat ttttattcat gccatctgtt ttcaaccaac tatttttgag 2640 gaattatcat gggaaaagac cagggctttt cccaggaata tcccaaactt cggaaacaag 2700 ttattctctt cactcccaat aactaatgct aagaaatgct gaaaatcaaa gtaaaaaatt 2760 aaagcccata aggccagaaa ctccttttgc tgtctttctc taaatatgat tactttaaaa 2820 taaaaaagta acaaggtgtc ttttccactc ctatggaaaa gggtcttctt ggcagcttaa 2880 cattgacttc ttggtttggg gagaaataaa ttttgtttca gaattttgta tattgtagga 2940 atcctttgag aatgtgattc cttttgatgg ggagaaaggg caaattattt taatattttg 3000 tattttcaac tttataaaga taaaatatcc tcaggggtgg agaagtgtcg ttttcataac 3060 ttgctgaatt tcaggcattt tgttctacat gaggactcat atatttaagc cttttgtgta 3120 ataagaaagt ataaagtcac ttccagtgtt ggctgtatga cagaatcttg tatttgggcc 3180 aaggtgtttc catttctcaa tcagtgcagt gatacatgta ctccagaggg acagggtgga 3240 ccccctgagt caactggagc aagaaggaag gaggcagact gatggcgatt ccctctcacc 3300 cgggactctc cccctttcaa ggaaagtgaa cctttaaagt aaaggcctca tctcctttat 3360 tgcagttcaa atcctcacca tccacagcaa gatgaatttt atcagccatg tttggttgta 3420 aatgctcgtg tgatttccta cagaaatact gctctgaata ttttgtaata aaggtctttg 3480 cacatgtgac cacatacgtg ttaggaggct gcatgctctg gaagcctgga ctctaagctg 3540 gagctcttgg aagagctctt cggtttctga gcataatgct cccatctcct gatttctctg 3600 aacagaaaac aaaagagaga atgagggaaa ttgctatttt atttgtattc atgaacttgg 3660 ctgtaatcag ttatgccgta taggatgtca gacaatacca ctggttaaaa taaagcctat 3720 ttttcaaaaa aaaaaaaaaa aaaaaaaaaa a 3751 <210> 17 <211> 3171 <212> DNA <213> Homo sapiens <400> 17 gggtgtgtgt gtgagtgaga gagcgagtga gtgagtgagt gagtgtgtgt gtggggggga 60 ctcggcttgt tgttgtcggt gacttccccc tccccttcac cccttcccct ccccgccgcc 120 gctgcagtgg ccgctccctg ggccgtagga aatgagcgat aacgatgaca tcgaggtgga 180 gagcgacgaa gagcaacaga ggtttcaatc tgcggctgac aaacgggctc atcataatgc 240 actggaacga aaacgtaggg accacatcaa agacagcttt cacagtttgc gggactcagt 300 cccatcactc caaggagaga aggcatcccg ggcccaaatc ctagacaaag ccacagaata 360 tatccagtat atgcgaagga aaaaccacac acaccagcaa gatattgacg acctcaagcg 420 gcagaatgct cttctggagc agcaaggtga gcacccgagc tcgtggggca gctggccctg 480 ctgtgctcca gccaggtcag gctttggcac ctgggcctgc agagtcagag ccagtcatgg 540 agtatgtgct cagtagcagg cttggtcctg cttcttgggg cctgagtaac tgagtgttag 600 agccgtcctg aggaaggacc tgaggcgcca gtgaggagac agtggaagct aggaagttgg 660 acatctggag acttgtatct tttctggcct gacctctccc gttcttgggt ctcaggtgct 720 ctgcctgcag tagggatcac acctggcatc aggtgtctga aaagagcttt gaggtccttg 780 gagtggaatg tgctgtgtaa gtaccagaga ctccaggtgt tcagggacag tgagccctcc 840 ccattgtcaa tggtagtcca atcagggcag cctatgggct aggcccatgc tgttctcaat 900 gctcacaccc gccttttcct acaaccacag gggaaagcga gagctgatca agttctttgt 960 tcctggggaa ttcacttctc ttcctccctc atggaagatg caagtaaaag gaaatgcaag 1020 taaccacctg ggttagaaaa cctcaaataa aataaaataa aataaattaa atgggttgac 1080 cttccaggct caagctgagc tgaaccaagg gatgggcagt gggtggtgtc agtgggttgg 1140 ttactgggcc aggcagcctg catgtagggg ctatttgaaa agcccaggta ttttatgtgt 1200 attggtgact tgcttccaag tgtccagctt gtcattccaa gtggatcttg tacacgagag 1260 ctaagccaaa actgttcttt ggctgatacg tcttatgtca tcctttcctg ctgttgtgtg 1320 gcctcacacc ttgtggagcc tcatgctcct gggccagctt ctcctctgtt attgcactgc 1380 tgaatcccac agggagctca cgctccagtc tctccacggg gcttccacgg caggacggtg 1440 acatcacaag ccttctcttc agagttgggt gggattgcag agtgtctgct ggctcccagg 1500 tccagctggg aaaggcggga gggaaatgaa gtgtgtgagt gaacagccac ccgaagggag 1560 ctacttctga gcatcttgag cctcgggggc caacaagcaa gcccttagga agaacaggct 1620 ggaccctgag tctgagactc ggttactccc caagtctcca gaaggcagta acacactccc 1680 ttggttgcct tttagtccgt gcactggaga aggcgaggtc aagtgcccaa ctgcagacca 1740 actacccctc ctcagacaac agcctctaca ccaacgccaa gggcagcacc atctctgcct 1800 tcgatggggg ctcggactcc agctcggagt ctgagcctga agagccccaa agcaggaaga 1860 agctccggat ggaggccagc taagccactc ggggcaggcc agcaataaaa actgtctgtc 1920 tccatcgtct catcctcctt tcagttcgtt ggtagagccc tcagaaccat ttaaaagact 1980 ctttattttt ctctttctcc cttttttttt taaattttta tttttacgta gaagctcttg 2040 gacaacagct ctcgttctcc ttccccattt ccactgtata ttttttaatg tattcccttc 2100 agggattccc tgtccccaac aggaattttt aaaccaaaac accccaactt ggcagctttt 2160 tctgtggagg acagacggcc ggccggacct ctgagcacat agtgtcctgc ccaccctacc 2220 agctcctcca gccctgccag gcacatgccc gggggacgcc tgccctgccc aggtggcctc 2280 ctggcctgcc ctcacctctg atagactttg tgaatctgaa ctgctctact ttgagaagat 2340 gaccggtttg gagtaatcag aatgaaccct cctccttttt aagggttttt tttttttcct 2400 ttttctaaaa agctatgtat cgctcctatt gaaagaccag atccttaaag aagtttgtgg 2460 tataaaaaga aagtggggac agattcgcag cacagagtcg ctggcatgtt tcactcctgc 2520 ttctctcagc cagctgttta agcctgcggc gccagcctca cggagggccg tgtgacactc 2580 tcgtggtatg tatgggagac ggcagcagtg aagcagcagc caccagggag tggccatttg 2640 gggttgggac agggagggtg ttttgggtgg catagaggtt ttgtattgag ggccagtgat 2700 gatgttttga tatttatttc ctgctactta aatttgaatc tgagtgaatt gtacctattt 2760 ctgatgatgt cggtcttgca aagcgacaga ttcataaagt aatgatgaaa tctttctttc 2820 ttcccgtgtg tatttctaag aaatagagcc aactgatttt gtatgtaaat accaagagca 2880 atttacctgg tactaaaccc gcaccccagt gcggaccctt cccagccctc atcccacttc 2940 ctttcctact gtcctggaac ctgtctccat tgtgtgatcc agccctggtt ctggctgtgg 3000 tcagcagatc ccagtgaagg gttttgtgtg tttaggcctc atttctttgt ctttttccta 3060 ctccgttcct ggcatttgct gatttctagt gtatactctg tagtcagttc gtgtttgatt 3120 ccattccatg gaaataaaaa gtatgttgta catacaaaaa aaaaaaaaaa a 3171 <210> 18 <211> 3065 <212> DNA <213> Homo sapiens <400> 18 ctcaggcggt ggctggaggc tgcgcatctg gggctttaaa catacaaagg gattgccagg 60 acctgcggcg gcggcggcgg cggcgggggc tggggcgcgg gggccggacc atgagccgct 120 gagccgggca aaccccaggc caccgagcca gcggaccctc ggagcgcagc cctgcgccgc 180 ggagcaggct ccaaccaggc ggcgacgcgg ccacacgcac cgagccagcg acccccgggc 240 gacgcgcggg gccagggagc gctacgatgg aggcgctaat ggcccggggc gcgctcacgg 300 gtcccctgag ggcgctctgt ctcctgggct gcctgctgag ccacgccgcc gccgcgccgt 360 cgcccatcat caagttcccc ggcgatgtcg cccccaaaac ggacaaagag ttggcagtgc 420 aatacctgaa caccttctat ggctgcccca aggagagctg caacctgttt gtgctgaagg 480 acacactaaa gaagatgcag aagttctttg gactgcccca gacaggtgat cttgaccaga 540 ataccatcga gaccatgcgg aagccacgct gcggcaaccc agatgtggcc aactacaact 600 tcttccctcg caagcccaag tgggacaaga accagatcac atacaggatc attggctaca 660 cacctgatct ggacccagag acagtggatg atgcctttgc tcgtgccttc caagtctgga 720 gcgatgtgac cccactgcgg ttttctcgaa tccatgatgg agaggcagac atcatgatca 780 actttggccg ctgggagcat ggcgatggat acccctttga cggtaaggac ggactcctgg 840 ctcatgcctt cgccccaggc actggtgttg ggggagactc ccattttgat gacgatgagc 900 tatggacctt gggagaaggc caagtggtcc gtgtgaagta tggcaacgcc gatggggagt 960 actgcaagtt ccccttcttg ttcaatggca aggagtacaa cagctgcact gataccggcc 1020 gcagcgatgg cttcctctgg tgctccacca cctacaactt tgagaaggat ggcaagtacg 1080 gcttctgtcc ccatgaagcc ctgttcacca tgggcggcaa cgctgaagga cagccctgca 1140 agtttccatt ccgcttccag ggcacatcct atgacagctg caccactgag ggccgcacgg 1200 atggctaccg ctggtgcggc accactgagg actacgaccg cgacaagaag tatggcttct 1260 gccctgagac cgccatgtcc actgttggtg ggaactcaga aggtgccccc tgtgtcttcc 1320 ccttcacttt cctgggcaac aaatatgaga gctgcaccag cgccggccgc agtgacggaa 1380 agatgtggtg tgcgaccaca gccaactacg atgacgaccg caagtggggc ttctgccctg 1440 accaagggta cagcctgttc ctcgtggcag cccacgagtt tggccacgcc atggggctgg 1500 agcactccca agaccctggg gccctgatgg cacccattta cacctacacc aagaacttcc 1560 gtctgtccca ggatgacatc aagggcattc aggagctcta tggggcctct cctgacattg 1620 accttggcac cggccccacc cccacactgg gccctgtcac tcctgagatc tgcaaacagg 1680 acattgtatt tgatggcatc gctcagatcc gtggtgagat cttcttcttc aaggaccggt 1740 tcatttggcg gactgtgacg ccacgtgaca agcccatggg gcccctgctg gtggccacat 1800 tctggcctga gctcccggaa aagattgatg cggtatacga ggccccacag gaggagaagg 1860 ctgtgttctt tgcagggaat gaatactgga tctactcagc cagcaccctg gagcgagggt 1920 accccaagcc actgaccagc ctgggactgc cccctgatgt ccagcgagtg gatgccgcct 1980 ttaactggag caaaaacaag aagacataca tctttgctgg agacaaattc tggagataca 2040 atgaggtgaa gaagaaaatg gatcctggct ttcccaagct catcgcagat gcctggaatg 2100 ccatccccga taacctggat gccgtcgtgg acctgcaggg cggcggtcac agctacttct 2160 tcaagggtgc ctattacctg aagctggaga accaaagtct gaagagcgtg aagtttggaa 2220 gcatcaaatc cgactggcta ggctgctgag ctggccctgg ctcccacagg cccttcctct 2280 ccactgcctt cgatacaccg ggcctggaga actagagaag gacccggagg ggcctggcag 2340 ccgtgccttc agctctacag ctaatcagca ttctcactcc tacctggtaa tttaagattc 2400 cagagagtgg ctcctcccgg tgcccaagaa tagatgctga ctgtactcct cccaggcgcc 2460 ccttccccct ccaatcccac caaccctcag agccacccct aaagagatcc tttgatattt 2520 tcaacgcagc cctgctttgg gctgccctgg tgctgccaca cttcaggctc ttctcctttc 2580 acaaccttct gtggctcaca gaacccttgg agccaatgga gactgtctca agagggcact 2640 ggtggcccga cagcctggca cagggcagtg ggacagggca tggccaggtg gccactccag 2700 acccctggct tttcactgct ggctgcctta gaacctttct tacattagca gtttgctttg 2760 tatgcacttt gtttttttct ttgggtcttg tttttttttt ccacttagaa attgcatttc 2820 ctgacagaag gactcaggtt gtctgaagtc actgcacagt gcatctcagc ccacatagtg 2880 atggttcccc tgttcactct acttagcatg tccctaccga gtctcttctc cactggatgg 2940 aggaaaacca agccgtggct tcccgctcag ccctccctgc ccctcccttc aaccattccc 3000 catgggaaat gtcaacaagt atgaataaag acacctactg agtgaaaaaa aaaaaaaaaa 3060 aaaaa 3065 <210> 19 <211> 4093 <212> DNA <213> Homo sapiens <400> 19 gtgagagagt gagcgagaca gaaagagaga gaagtgcacc agcgagccgg ggcaggaaga 60 ggaggtttcg ccaccggagc ggcccggcga cgcgctgaca gcttcccctg cccttcccgt 120 cggtcgggcc gccagccgcc gcagccctcg gcctgcacgc agccaccggc cccgctcccg 180 gagcccagcg ccgccgaggc cgcagccgcc cggccagtaa ggcggcgccg ccgcccggcc 240 accgcgcgcc ctgcgcttcc ctccgcccgc gctgcggcca tggcgcggcg ctgactggcc 300 tggcccggcc ccgccgcgct cccgctcgcc ccgacccgca ctcgggcccg cccgggctcc 360 ggcctgccgc cgcctcttcc ttctccagcc ggcaggcccg cgccgcttag gagggagagc 420 ccacccgcgc caggaggccg aacgcggact cgccacccgg cttcagaatg gcagaagatg 480 atccatattt gggaaggcct gaacaaatgt ttcatttgga tccttctttg actcatacaa 540 tatttaatcc agaagtattt caaccacaga tggcactgcc aacagcagat ggcccatacc 600 ttcaaatatt agagcaacct aaacagagag gatttcgttt ccgttatgta tgtgaaggcc 660 catcccatgg tggactacct ggtgcctcta gtgaaaagaa caagaagtct taccctcagg 720 tcaaaatctg caactatgtg ggaccagcaa aggttattgt tcagttggtc acaaatggaa 780 aaaatatcca cctgcatgcc cacagcctgg tgggaaaaca ctgtgaggat gggatctgca 840 ctgtaactgc tggacccaag gacatggtgg tcggcttcgc aaacctgggt atacttcatg 900 tgacaaagaa aaaagtattt gaaacactgg aagcacgaat gacagaggcg tgtataaggg 960 gctataatcc tggactcttg gtgcaccctg accttgccta tttgcaagca gaaggtggag 1020 gggaccggca gctgggagat cgggaaaaag agctaatccg ccaagcagct ctgcagcaga 1080 ccaaggagat ggacctcagc gtggtgcggc tcatgtttac agcttttctt ccggatagca 1140 ctggcagctt cacaaggcgc ctggaacccg tggtatcaga cgccatctat gacagtaaag 1200 cccccaatgc atccaacttg aaaattgtaa gaatggacag gacagctgga tgtgtgactg 1260 gaggggagga aatttatctt ctttgtgaca aagttcagaa agatgacatc cagattcgat 1320 tttatgaaga ggaagaaaat ggtggagtct gggaaggatt tggagatttt tcccccacag 1380 atgttcatag acaatttgcc attgtcttca aaactccaaa gtataaagat attaatatta 1440 caaaaccagc ctctgtgttt gtccagcttc ggaggaaatc tgacttggaa actagtgaac 1500 caaaaccttt cctctactat cctgaaatca aagataaaga agaagtgcag aggaaacgtc 1560 agaagctcat gcccaatttt tcggatagtt tcggcggtgg tagtggtgct ggagctggag 1620 gcggaggcat gtttggtagt ggcggtggag gagggggcac tggaagtaca ggtccagggt 1680 atagcttccc acactatgga tttcctactt atggtgggat tactttccat cctggaacta 1740 ctaaatctaa tgctgggatg aagcatggaa ccatggacac tgaatctaaa aaggaccctg 1800 aaggttgtga caaaagtgat gacaaaaaca ctgtaaacct ctttgggaaa gttattgaaa 1860 ccacagagca agatcaggag cccagcgagg ccaccgttgg gaatggtgag gtcactctaa 1920 cgtatgcaac aggaacaaaa gaagagagtg ctggagttca ggataacctc tttctagaga 1980 aggctatgca gcttgcaaag aggcatgcca atgccctttt cgactacgcg gtgacaggag 2040 acgtgaagat gctgctggcc gtccagcgcc atctcactgc tgtgcaggat gagaatgggg 2100 acagtgtctt acacttagca atcatccacc ttcattctca acttgtgagg gatctactag 2160 aagtcacatc tggtttgatt tctgatgaca ttatcaacat gagaaatgat ctgtaccaga 2220 cgcccttgca cttggcagtg atcactaagc aggaagatgt ggtggaggat ttgctgaggg 2280 ctggggccga cctgagcctt ctggaccgct tgggtaactc tgttttgcac ctagctgcca 2340 aagaaggaca tgataaagtt ctcagtatct tactcaagca caaaaaggca gcactacttc 2400 ttgaccaccc caacggggac ggtctgaatg ccattcatct agccatgatg agcaatagcc 2460 tgccatgttt gctgctgctg gtggccgctg gggctgacgt caatgctcag gagcagaagt 2520 ccgggcgcac agcactgcac ctggctgtgg agcacgacaa catctcattg gcaggctgcc 2580 tgctcctgga gggtgatgcc catgtggaca gtactaccta cgatggaacc acacccctgc 2640 atatagcagc tgggagaggg tccaccaggc tggcagctct tctcaaagca gcaggagcag 2700 atcccctggt ggagaacttt gagcctctct atgacctgga tgactcttgg gaaaatgcag 2760 gagaggatga aggagttgtg cctggaacca cgcctctaga tatggccacc agctggcagg 2820 tatttgacat attaaatggg aaaccatatg agccagagtt tacatctgat gatttactag 2880 cacaaggaga catgaaacag ctggctgaag atgtgaagct gcagctgtat aagttactag 2940 aaattcctga tccagacaaa aactgggcta ctctggcgca gaaattaggt ctggggatac 3000 ttaataatgc cttccggctg agtcctgctc cttccaaaac acttatggac aactatgagg 3060 tctctggggg tacagtcaga gagctggtgg aggccctgag acaaatgggc tacaccgaag 3120 caattgaagt gatccaggca gcctccagcc cagtgaagac cacctctcag gcccactcgc 3180 tgcctctctc gcctgcctcc acaaggcagc aaatagacga gctccgagac agtgacagtg 3240 tctgcgacag cggcgtggag acatccttcc gcaaactcag ctttaccgag tctctgacca 3300 gtggtgcctc actgctaact ctcaacaaaa tgccccatga ttatgggcag gaaggacctc 3360 tagaaggcaa aatttagcct gctgacaatt tcccacaccg tgtaaaccaa agccctaaaa 3420 ttccactgcg ttgtccacaa gacagaagct gaagtgcatc caaaggtgct cagagagccg 3480 gcccgcctga atcattctcg atttaactcg agaccttttc aacttggctt cctttcttgg 3540 ttcataaatg aattttagtt tggttcactt acagatagta tctagcaatc acaacactgg 3600 ctgagcggat gcatctgggg atgaggttgc ttactaagct ttgccagctg ctgctggatc 3660 acagctgctt tctgttgtca ttgctgttgt ccctctgcta cgttcctatt gtcattaaag 3720 gtatcacggt cgccacctgg cattccttct gaccacagca tcattttgca ttcaaattaa 3780 gggttaagaa aagagatatt ttaaaatgag agtcacttga tgtgccattt taaaaaaaaa 3840 ggcatattgc tttttctaat gtggttattt ctctgatttg caaaaaaaaa aaaaaaaaaa 3900 atacttgtca atatttaaac atggttacaa tcattgctga aaatggtatt ttcccccttt 3960 tctgcatttt gctattgtaa atatgttttt tagatcaaat actttaaagg aaaaaatgtt 4020 ggatttataa atgctatttt ttattttact tttataataa aaggaaaagc aaattgatga 4080 cctcaaaaaa aaa 4093 <210> 20 <211> 925 <212> DNA <213> Homo sapiens <400> 20 agtctgggac gcgccgccgc catgatcatc cctgtacgct gcttcacttg tggcaagatc 60 gtcggcaaca agtgggaggc ttacctgggg ctgctgcagg ccgagtacac cgagggggat 120 gcgctggatg ccctgggcct gaagcgctac tgctgccgcc ggatgctgct ggcccacgtg 180 gacctgatcg agaagctgct caattatgca cccctggaga agtgaccacg ctggaaccca 240 cccacccgct gtgctgacca tgggccctga gcgtcctgcc ccgaattcac gaggctgagg 300 catccgggag ctggcgtaat gcctggccgc agtgtgtgtg tatccgatac cccactctgg 360 aaggaaccat ccagtaaagg tctttcagaa ccactaaggt cccagccctc actaggatgt 420 caggagccag gtctaggccc agctttcaca ctgtggcagc ccagtgaagc agactgggcc 480 atgaactctc ctagccctgg ggccagcctg ttccacaggc acccctgcag gaggcgctgc 540 caggagagcc ttccatctcg gggctctttg aggttccctc cttctgggtg ttcttcaggc 600 tgagcagaga ggctcctgta ccctctctct cggaatctga agagccagat ttaggccggg 660 caaaggggct cacccctata atcccaggac tttgggaggc caaggcagga ggatcacttg 720 agtccagaaa ttcaagaccc gcctgggcat cataatgaga ccccatctct acaacaaaat 780 ttaataaatt agctgggcac agtgttcaca cctgtagtcc cggccactcg gggctgaggc 840 aggaggatca ctggaacctg ggaggttgcc actgcaaaaa aaaaaaaaaa aaaaaaaaaa 900 aaaaaaaaaa aaaaaaaaaa aaaaa 925 <210> 21 <211> 849 <212> DNA <213> Homo sapiens <400> 21 acagttgctt tgaggcagta ccggaggaga aagatggcgg ctaccttact agctgctcgg 60 ggagccgggc cagcaccggc ttgggggccg gaggcgttca ctccagactg ggaaagccga 120 gaagtttcca ctgggaccac tatcatggcc gtgcagtttg acgggggcgt ggttctgggg 180 gcggactcca gaacaaccac tgggtcctac atcgccaatc gagtgactga caagctgaca 240 cctattcacg accgcatttt ctgctgtcgc tcaggctcag ctgctgatac ccaggcagta 300 gctgatgctg tcacctacca gctcggtttc cacagcattg aactgaatga gcctccactg 360 gtccacacag cagccagcct ctttaaggag atgtgttacc gataccggga agacctgatg 420 gcgggaatca tcatcgcagg ctgggaccct caagaaggag ggcaggtgta ctcagtgcct 480 atggggggta tgatggtaag gcagtccttt gccattggag gctccgggag ctcctacatc 540 tatggctatg ttgatgctac ctaccgggaa ggcatgacca aggaagagtg tctgcaattc 600 actgccaatg ctctcgcttt ggccatggag cgggatggct ccagtggagg agtgatccgc 660 ctggcagcca ttgcagagtc aggggtagag cggcaagtac ttttgggaga ccagataccc 720 aaattcgccg ttgccacttt accacccgcc tgaatcctgg gattctagta tgcaataaga 780 gatgccctgt actgatgcaa aatttaataa agtttgtcac agagaaaaaa aaaaaaaaaa 840 aaaaaaaaa 849 <210> 22 <211> 4142 <212> DNA <213> Homo sapiens <400> 22 atatgacaga tacctagcat ctagcaaaat aatggcagct gcttaccttg accccaactt 60 gaatcacaca ccaaattcga gtactaagac tcacctgggt actggtatgg aacgttctcc 120 tggtgcaatg gagcgagtat taaaggtctt tcattatttt gaaagcaata gtgagccaac 180 cacctgggcc agtattatca ggcatggaga tgctactgat gtcaggggca tcattcagaa 240 gatagtggac agtcacaaag taaagcatgt ggcctgctat ggattccgcc tcagtcacct 300 gcggtcagag gaggttcact ggcttcacgt ggatatgggc gtctccagtg tgagggagaa 360 gtatgagctt gctcacccac cagaggagtg gaaatatgaa ttgagaattc gttatttgcc 420 aaaaggattt ctaaaccagt ttactgaaga taagccaact ttgaatttct tctatcaaca 480 ggtgaagagc gattatatgt tagagatagc tgatcaagtg gaccaggaaa ttgctttgaa 540 gttgggttgt ctagaaatac ggcgatcata ctgggagatg cggggcaatg cactagaaaa 600 gaagtctaac tatgaagtat tagaaaaaga tgttggttta aagcgatttt ttcctaagag 660 tttactggat tctgtcaagg ccaaaacact aagaaaactg atccaacaaa catttagaca 720 atttgccaac cttaatagag aagaaagtat tctgaaattc tttgagatcc tgtctccagt 780 ctacagattt gataaggaat gcttcaagtg tgctcttggt tcaagctgga ttatttcagt 840 ggaactggca atcggcccag aagaaggaat cagttaccta acggacaagg gctgcaatcc 900 cacacatctt gctgacttca ctcaagtgca aaccattcag tattcaaaca gtgaagacaa 960 ggacagaaaa ggaatgctac aactaaaaat agcaggtgca cccgagcctc tgacagtgac 1020 ggcaccatcc ctaaccattg cggagaatat ggctgaccta atagatgggt actgccggct 1080 ggtgaatgga acctcgcagt catttatcat cagacctcag aaagaaggtg aacgggcttt 1140 gccatcaata ccaaagttgg ccaacagcga aaagcaaggc atgcggacac acgccgtctc 1200 tgtgtcagaa acagatgatt atgctgagat tatagatgaa gaagatactt acaccatgcc 1260 ctcaaccagg gattatgaga ttcaaagaga aagaatagaa cttggacgat gtattggaga 1320 aggccaattt ggagatgtac atcaaggcat ttatatgagt ccagagaatc cagctttggc 1380 ggttgcaatt aaaacatgta aaaactgtac ttcggacagc gtgagagaga aatttcttca 1440 agaagcctta acaatgcgtc agtttgacca tcctcatatt gtgaagctga ttggagtcat 1500 cacagagaat cctgtctgga taatcatgga gctgtgcaca cttggagagc tgaggtcatt 1560 tttgcaagta aggaaataca gtttggatct agcatctttg atcctgtatg cctatcagct 1620 tagtacagct cttgcatatc tagagagcaa aagatttgta cacagggaca ttgctgctcg 1680 gaatgttctg gtgtcctcaa atgattgtgt aaaattagga gactttggat tatcccgata 1740 tatggaagat agtacttact acaaagcttc caaaggaaaa ttgcctatta aatggatggc 1800 tccagagtca atcaattttc gacgttttac ctcagctagt gacgtatgga tgtttggtgt 1860 gtgtatgtgg gagatactga tgcatggtgt gaagcctttt caaggagtga agaacaatga 1920 tgtaatcggt cgaattgaaa atggggaaag attaccaatg cctccaaatt gtcctcctac 1980 cctctacagc cttatgacga aatgctgggc ctatgacccc agcaggcggc ccaggtttac 2040 tgaacttaaa gctcagctca gcacaatcct ggaggaagag aaggctcagc aagaagagcg 2100 catgaggatg gagtccagaa gacaggccac agtgtcctgg gactccggag ggtctgatga 2160 agcaccgccc aagcccagca gaccgggtta tcccagtccg aggtccagcg aaggatttta 2220 tcccagccca cagcacatgg tacaaaccaa tcattaccag gactctacag tattggacct 2280 gcgagggatt gggcaagtgt tgccaaccca tctgatggaa gagcgtctaa tccgacagca 2340 acaggaaatg gaagaagatc agcgctggct ggaaaaagag gaaagatttc tgaaacctga 2400 tgtgagactc tctcgaggca gtattgacag ggaggatgga agtcttcagg gtccgattgg 2460 aaaccaacat atatatcagc ctgtgggtaa accagatcct gcagctccac caaagaaacc 2520 gcctcgccct ggagctcccg gtcatctggg aagccttgcc agcctcagca gccctgctga 2580 cagctacaac gagggtgtca agcttcagcc ccaggaaatc agcccccctc ctactgccaa 2640 cctggaccgg tcgaatgata aggtgtacga gaatgtgacg ggcctggtga aagctgtcat 2700 cgagatgtcc agtaaaatcc agccagcccc accagaggag tatgtcccta tggtgaagga 2760 agtcggcttg gccctgagga cattattggc cactgtggat gagaccattc ccctcctacc 2820 agccagcacc caccgagaga ttgagatggc acagaagcta ttgaactctg acctgggtga 2880 gctcatcaac aagatgaaac tggcccagca gtatgtcatg accagcctcc agcaagagta 2940 caaaaagcaa atgctgactg ctgctcacgc cctggctgtg gatgccaaaa acttactcga 3000 tgtcattgac caagcaagac tgaaaatgct tgggcagacg agaccacact gagcctcccc 3060 taggagcacg tcttgctacc ctcttttgaa gatgttctct agccttccac cagcagcgag 3120 gaattaaccc tgtgtcctca gtcgccagca cttacagctc caactttttt gaatgaccat 3180 ctggttgaaa aatctttctc atataagttt aaccacactt tgatttgggt tcattttttg 3240 ttttgttttt ttcaatcatg atattcagaa aaatccagga tccaaaatgt ggcgtttttc 3300 taagaatgaa aattatatgt aagcttttaa gcatcatgaa gaacaattta tgttcacatt 3360 aagatacgtt ctaaaggggg atggccaagg ggtgacatct taattcctaa actaccttag 3420 ctgcatagtg gaagaggaga gcatgaagca aagaattcca ggaaacccaa gaggctgaga 3480 attcttttgt ctaccataga attattatcc agactggaat ttttgtttgt tagaacaccc 3540 ttcagttgca atatgctaat cccactttac aaagaatata aaagctatat tttgaagact 3600 tgagttattt cagaaaaaac tacagccctt tttgtcttac ctgcctttta ctttcgtgtg 3660 gatatgtgaa gcattgggtc gggaactagc tgtagaacac aactaaaaac tcatgtcttt 3720 tttcacagaa taatgtgcca gttttttgta gcaatgatat ttctcttgga agcagaaatg 3780 ctttgtacca gagcacctcc aaactgcatt gaggagaagt tccagaacca tccccttttt 3840 ccatttttat ataatttata aagaaagatt aaagccatgt tgactatttt acagccactg 3900 gagttaacta acccttcctt gtatctgtct tcccaggaga gaatgaagca aaacaggaat 3960 ttggttttct tttgatgtcc agttacacca tccattctgt taattttgaa aaaatatacc 4020 ctccctttag tttgttgggg gatataaatt attctcagga agaatataat gaactgtaca 4080 gttactttga cctattaaaa aggtgttacc agtaaagttc ttgttgtaaa aaaaaaaaaa 4140 aa 4142 <210> 23 <211> 2594 <212> DNA <213> Homo sapiens <400> 23 aggggccgcg gagccgcggc taaggaacgc gggccgccca cccgctcccg gtgcagcggc 60 ctccgcgccg ggttttggcg cctcccgcgg gcgcccccct cctcacggcg agcgctgcca 120 cgtcagacga agggcgcagc gagcgtcctg atccttccgc ccggacgctc aggacagcgg 180 cccgctgctc ataagactcg gccttagaac cccagtatca gcagaaggac attttaggac 240 gggacttggg tgactctagg gcactggttt tctttccaga gagcggaaca ggcgaggaaa 300 agtagtccct tctcggcgat tctgcggagg gatctccgtg gggcggtgaa cgccgatgat 360 tatataagga cgcgccgggt gtggcacagc tagttccgtc gcagccggga tttgggtcgc 420 agttcttgtt tgtggatcgc tgtgatcgtc acttgacaat gcagatcttc gtgaagactc 480 tgactggtaa gaccatcacc ctcgaggttg agcccagtga caccatcgag aatgtcaagg 540 caaagatcca agataaggaa ggcatccctc ctgaccagca gaggctgatc tttgctggaa 600 aacagctgga agatgggcgc accctgtctg actacaacat ccagaaagag tccaccctgc 660 acctggtgct ccgtctcaga ggtgggatgc aaatcttcgt gaagacactc actggcaaga 720 ccatcaccct tgaggtcgag cccagtgaca ccatcgagaa cgtcaaagca aagatccagg 780 acaaggaagg cattcctcct gaccagcaga ggttgatctt tgccggaaag cagctggaag 840 atgggcgcac cctgtctgac tacaacatcc agaaagagtc taccctgcac ctggtgctcc 900 gtctcagagg tgggatgcag atcttcgtga agaccctgac tggtaagacc atcaccctcg 960 aggtggagcc cagtgacacc atcgagaatg tcaaggcaaa gatccaagat aaggaaggca 1020 ttccttctga tcagcagagg ttgatctttg ccggaaaaca gctggaagat ggtcgtaccc 1080 tgtctgacta caacatccag aaagagtcca ccttgcacct ggtactccgt ctcagaggtg 1140 ggatgcaaat cttcgtgaag acactcactg gcaagaccat cacccttgag gtcgagccca 1200 gtgacactat cgagaacgtc aaagcaaaga tccaagacaa ggaaggcatt cctcctgacc 1260 agcagaggtt gatctttgcc ggaaagcagc tggaagatgg gcgcaccctg tctgactaca 1320 acatccagaa agagtctacc ctgcacctgg tgctccgtct cagaggtggg atgcagatct 1380 tcgtgaagac cctgactggt aagaccatca ctctcgaagt ggagccgagt gacaccattg 1440 agaatgtcaa ggcaaagatc caagacaagg aaggcatccc tcctgaccag cagaggttga 1500 tctttgccgg aaaacagctg gaagatggtc gtaccctgtc tgactacaac atccagaaag 1560 agtccacctt gcacctggtg ctccgtctca gaggtgggat gcagatcttc gtgaagaccc 1620 tgactggtaa gaccatcact ctcgaggtgg agccgagtga caccattgag aatgtcaagg 1680 caaagatcca agacaaggaa ggcatccctc ctgaccagca gaggttgatc tttgctggga 1740 aacagctgga agatggacgc accctgtctg actacaacat ccagaaagag tccaccctgc 1800 acctggtgct ccgtcttaga ggtgggatgc agatcttcgt gaagaccctg actggtaaga 1860 ccatcactct cgaagtggag ccgagtgaca ccattgagaa tgtcaaggca aagatccaag 1920 acaaggaagg catccctcct gaccagcaga ggttgatctt tgctgggaaa cagctggaag 1980 atggacgcac cctgtctgac tacaacatcc agaaagagtc caccctgcac ctggtgctcc 2040 gtcttagagg tgggatgcag atcttcgtga agaccctgac tggtaagacc atcactctcg 2100 aagtggagcc gagtgacacc attgagaatg tcaaggcaaa gatccaagac aaggaaggca 2160 tccctcctga ccagcagagg ttgatctttg ctgggaaaca gctggaagat ggacgcaccc 2220 tgtctgacta caacatccag aaagagtcca ccctgcacct ggtgctccgt ctcagaggtg 2280 ggatgcaaat cttcgtgaag accctgactg gtaagaccat caccctcgag gtggagccca 2340 gtgacaccat cgagaatgtc aaggcaaaga tccaagataa ggaaggcatc cctcctgatc 2400 agcagaggtt gatctttgct gggaaacagc tggaagatgg acgcaccctg tctgactaca 2460 acatccagaa agagtccact ctgcacttgg tcctgcgctt gagggggggt gtctaagttt 2520 ccccttttaa ggtttcaaca aatttcattg cactttcctt tcaataaagt tgttgcattc 2580 ccaaaaaaaa aaaa 2594

Claims (19)

  1. 결장직장암 재발과 상관된 예후 유전자 프로파일의 양적 발현에 대하여 환자 샘플을 분석하도록 적합화된 검정 시스템이며, 상기 프로파일은 서열 1, 2, 3, 4 및 5의 핵산 서열의 발현을 포함하는 것인, 환자에서 결장직장암의 재발 및/또는 비-재발을 예측하기 위한 검정 시스템.
  2. 제1항에 있어서, 서열 1, 2, 3, 4 및 5의 핵산 서열의 양적 발현을 분석하도록 적합화된 검정 시스템.
  3. 제1항에 있어서, 서열 6 내지 23의 핵산 서열 중 하나 이상의 발현을 양적으로 분석하도록 추가로 적합화된 검정 시스템.
  4. 제1항에 따른 검정 시스템을 포함하는 장치.
  5. 환자의 샘플로부터 수득된 유전자 발현 데이터를 하기의 예후 규칙에 적용하도록 설계된 컴퓨터 소프트웨어를 포함하는, 환자에서 결장직장암의 재발 및/또는 비-재발을 예측하기 위한 분석 시스템:
    [(((서열 1 / 서열 3) × 서열 5) - ((서열 2 / 서열 4) × 서열 3)) ≥ -4.4777]일 경우, 재발함.
  6. 제5항에 따른 분석 시스템을 포함하는 장치.
  7. 제6항에 따른 검정 시스템 및 제5항에 따른 분석 시스템을 포함하는 장치.
  8. 환자의 샘플로부터 수득된 유전자 발현 데이터를 하기의 예후 규칙에 적용하도록 설계된 컴퓨터 소프트웨어를 포함하는, 환자에서 결장직장암의 재발 및/또는 비-재발을 예측하기 위한 분석 시스템:
    규칙이 서열 1-23을 사용할 경우, 재발함.
  9. a) 적어도 서열 1, 2, 3, 4 및 5의 핵산 서열 각각의 코딩 서열을 나타내는 단리 및 정제된 폴리뉴클레오티드;
    b) 서열 1, 2, 3, 4 및 5의 핵산 서열 각각의 단리된 RNA, cDNA 또는 gDNA 분자;
    c) a) 또는 b)의 상보체 또는 일부;
    d) a), b) 또는 c)를 증폭하도록 설계된 증폭 프로브; 또는
    e) a), b) 또는 c)의 발현을 분석하도록 설계된 혼성화 프로브
    를 포함하며, 결장직장암 재발의 위험성을 측정하도록 적합화된 장치 또는 키트.
  10. 서열 1, 2, 3, 4 및 5의 핵산 서열을 함유하는 예후 결장직장암 유전자 프로파일 발현의 양적 분석에 적합화된 프로브를 포함하는 매트릭스.
  11. 제10항에 따른 매트릭스를 포함하는 결장직장암 예후 핵산 마이크로어레이.
  12. a) 서열 1, 2, 3, 4 및 5의 핵산 서열을 함유하는 예후 결장직장암 유전자 프로파일의 각 유전자에 대한 환자의 측정된 발현 수준을 제5항에 따른 분석 시스템에 제공하는 단계;
    b) 환자의 측정된 유전자 발현 수준을 분석 시스템의 규칙에 적용하는 단계; 및
    c) 규칙에 적용된 환자의 유전자 발현 수준의 분석 결과가 -4.4777 이상일 경우, 환자에서 비교적 높은 결장직장암 재발 위험성을 예측하는 단계
    를 포함하는, 환자에서의 결장직장암 재발 위험성의 예측 방법.
  13. 환자의 샘플로부터 수득된 양적 유전자 발현 데이터를 서열 1, 2, 3, 4 및 5의 핵산 서열 전체 또는 그의 하위세트로 구성되는 결장직장암 예후 유전자 프로파일로부터 유도된 예후 규칙에 적용하도록 설계된 컴퓨터 소프트웨어를 포함하는, 환자에서 결장직장암의 재발 및/또는 비-재발을 예측하기 위한 분석 시스템.
  14. a) 서열 1, 2, 3, 4 및 5, 또는 유도된 규칙의 하위세트의 핵산 서열을 함유하는 예후 결장직장암 유전자 프로파일의 각 유전자에 대한 환자의 측정된 발현 수준을 제13항에 따른 분석 시스템에 제공하는 단계;
    b) 환자의 측정된 유전자 발현 수준을 분석 시스템의 규칙에 적용하는 단계; 및
    c) 규칙에 적용된 환자의 유전자 발현 수준의 분석 결과가 -4.4777 이상일 경우, 환자에서 비교적 높은 결장직장암 재발 위험성을 예측하는 단계
    를 포함하는, 환자에서의 결장직장암 재발 위험성의 예측 방법.
  15. 결장직장암 재발과 상관된 예후 유전자 프로파일의 양적 발현에 대하여 환자 샘플을 분석하도록 적합화된 검정 시스템이며, 상기 프로파일은 서열 1, 2, 3, 4, 5, 6, 7, 8, 10, 14, 18 및 19의 핵산 서열의 발현을 포함하는 것인, 환자에서 결장직장암의 재발 및/또는 비-재발을 예측하기 위한 검정 시스템.
  16. 제15항에 있어서, 환자의 샘플로부터 수득된 유전자 발현 데이터를 하기를 포함하는 하나 이상의 예후 규칙에 적용하도록 설계된 컴퓨터 소프트웨어를 포함하는, 환자에서 결장직장암의 재발 및/또는 비-재발을 예측하도록 적합화된 검정 시스템:
    1. [(((서열 1 / 서열 3) * 서열 5) - ((서열 2 / 서열 4) * 서열 3)) ≥ -4.4777]일 경우, 재발함;
    2. [((서열 6 * 서열 1) * (서열 4 / 서열 18))] >= 90.169556일 경우, 재발함;
    3. [((서열 14 / 서열 8) * (서열 6 / 서열 3))] >= 0.087297일 경우, 재발함;
    4. [((서열 6 / 서열 19) * (서열 4 / 서열 10))] >= 7.500713일 경우, 재발함;
    5. [((서열 6 / 서열 2) * (서열 4 / 서열 10))] >= 14.345780일 경우, 재발함;
    6. [(서열 7 / (서열 18 * (서열 8 / 서열 14)))] >= 0.049082일 경우, 재발함;
    7. [((서열 6 / 서열 3) * (서열 1 / 서열 14))] >= 0.305097일 경우, 재발함; 및
    8. [((서열 6 * 서열 4) * (서열 14 / 서열 18))] >= 110.769318일 경우, 재발함.
  17. a) 적어도 서열 1, 2, 3, 4, 5, 6, 7, 8, 10, 14, 18 및 19의 핵산 서열 각각의 코딩 서열을 나타내는 단리 및 정제된 폴리뉴클레오티드;
    b) 서열 1, 2, 3, 4, 5, 6, 7, 8, 10, 14, 18 및 19의 핵산 서열 각각의 단리된 RNA, cDNA 또는 gDNA 분자;
    c) a) 또는 b)의 상보체 또는 일부;
    d) a), b) 또는 c)를 증폭하도록 설계된 증폭 프로브; 또는
    e) a), b) 또는 c)의 발현을 분석하도록 설계된 혼성화 프로브
    를 포함하며, 결장직장암 재발의 위험성을 측정하도록 적합화된 장치.
  18. a) 적어도 서열 1, 2, 3, 4, 5, 6, 7, 8, 10, 14, 18 및 19의 핵산 서열 각각의 코딩 서열을 나타내는 단리 및 정제된 폴리뉴클레오티드;
    b) 서열 1, 2, 3, 4, 5, 6, 7, 8, 10, 14, 18 및 19의 핵산 서열 각각의 단리된 RNA, cDNA 또는 gDNA 분자;
    c) a) 또는 b)의 상보체 또는 일부;
    d) a), b) 또는 c)를 증폭하도록 설계된 증폭 프로브; 또는
    e) a), b) 또는 c)의 발현을 분석하도록 설계된 혼성화 프로브
    를 포함하며, 결장직장암 재발의 위험성을 측정하도록 적합화된 키트.
  19. a) 결장직장암 재발과 상관된 예후 유전자 프로파일의 양적 발현에 대하여 환자 샘플을 분석하도록 적합화된 분석 시스템이며, 상기 프로파일은 서열 1, 2, 3, 4, 5, 6, 7, 8, 10, 14, 18 및 19의 핵산 서열의 발현을 포함하는 것인, 환자에서 결장직장암의 재발 및/또는 비-재발을 예측하기 위한 분석 시스템을 제공하는 단계;
    b) 환자의 측정된 유전자 발현 수준을 하기를 포함하는 하나 이상의 예후 규칙에 적용하는 단계:
    1. [(((서열 1 / 서열 3) * 서열 5) - ((서열 2 / 서열 4) * 서열 3)) ≥ -4.4777]일 경우, 재발함;
    2. [((서열 6 * 서열 1) * (서열 4 / 서열 18))] >= 90.169556일 경우, 재발함;
    3. [((서열 14 / 서열 8) * (서열 6 / 서열 3))] >= 0.087297일 경우, 재발함;
    4. [((서열 6 / 서열 19) * (서열 4 / 서열 10))] >= 7.500713일 경우, 재발함;
    5. [((서열 6 / 서열 2) * (서열 4 / 서열 10))] >= 14.345780일 경우, 재발함;
    6. [(서열 7 / (서열 18 * (서열 8 / 서열 14)))] >= 0.049082일 경우, 재발함;
    7. [((서열 6 / 서열 3) * (서열 1 / 서열 14))] >= 0.305097일 경우, 재발함; 및
    8. [((서열 6 * 서열 4) * (서열 14 / 서열 18))] >= 110.769318일 경우, 재발함; 및
    c) 적용된 하나 이상의 예후 규칙에 대한 반응으로 환자에서 결장직장암 재발의 위험성을 예측하는 단계
    를 포함하는, 환자에서의 결장직장암 재발 위험성의 예측 방법.
KR1020137020961A 2011-01-18 2012-01-17 결장직장암 재발에 대한 예후 서명 KR20140040694A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161433798P 2011-01-18 2011-01-18
US61/433,798 2011-01-18
PCT/US2012/021539 WO2012099872A1 (en) 2011-01-18 2012-01-17 Prognostic signature for colorectal cancer recurrence

Publications (1)

Publication Number Publication Date
KR20140040694A true KR20140040694A (ko) 2014-04-03

Family

ID=46516038

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137020961A KR20140040694A (ko) 2011-01-18 2012-01-17 결장직장암 재발에 대한 예후 서명

Country Status (10)

Country Link
US (1) US9234245B2 (ko)
EP (1) EP2665835B1 (ko)
JP (1) JP2014503222A (ko)
KR (1) KR20140040694A (ko)
CN (1) CN103403187A (ko)
AU (1) AU2012207442B2 (ko)
CA (1) CA2825046A1 (ko)
IL (1) IL227419A (ko)
MX (1) MX2013008252A (ko)
WO (1) WO2012099872A1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6757560B2 (ja) * 2014-09-26 2020-09-23 シスメックス株式会社 大腸癌の再発リスク診断を補助する方法、プログラムおよびコンピュータシステム
US10900084B2 (en) 2015-09-16 2021-01-26 Sysmex Corporation Method for supporting diagnosis of risk of colorectal cancer recurrence, treatment of colorectal cancer, and administration of anticancer drug
SE540173C2 (en) * 2016-04-20 2018-04-24 Hiloprobe Ab Marker genes for colorectal cancer classification, method for judging lymph node metastasis for prognosis of colorectal cancer and kit therefor
CN112004945A (zh) * 2018-01-22 2020-11-27 液体活检研究有限责任公司 用于结肠癌检测和治疗监控的方法
EP3888021B1 (en) 2018-11-30 2024-02-21 Caris MPI, Inc. Next-generation molecular profiling
CN111321221B (zh) * 2018-12-14 2022-09-23 中国医学科学院肿瘤医院 用于预测直肠癌局部切除手术后复发风险的组合物、微阵列和计算机系统
CN109929934B (zh) * 2019-03-27 2022-09-09 中山大学附属第六医院 免疫相关基因在结直肠癌预后的试剂盒和系统中的应用
CN113436741B (zh) * 2021-07-16 2023-02-28 四川大学华西医院 基于组织特异增强子区域dna甲基化的肺癌复发预测方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6582908B2 (en) * 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
GB9425138D0 (en) * 1994-12-12 1995-02-08 Dynal As Isolation of nucleic acid
US20020068277A1 (en) * 1998-11-20 2002-06-06 Simpson Andrew John George Method for determining nucleotide sequences using arbitrary primers and low stringency
EP1509614A4 (en) * 2002-02-15 2007-09-12 Gen Hospital Corp MAP KINASE INHIBITORS FOR REGULATING TUMOR ASSOCIATED ANTIGENE EXPRESSION
GB0323226D0 (en) * 2003-10-03 2003-11-05 Ncc Technology Ventures Pte Lt Materials and methods relating to breast cancer diagnosis
WO2005085861A2 (en) * 2004-03-03 2005-09-15 Oridis Biomed Forschungs- Und Entwicklungs Gmbh Nucleic acids and encoded polypeptides for use in liver disorders and epithelial cancer
AU2005321898B2 (en) 2004-12-29 2012-07-19 Mannkind Corporation Use of compositions comprising various tumor-associated antigens as anti-cancer vaccines
WO2006110314A2 (en) * 2005-03-25 2006-10-19 Ambion, Inc. Methods and compositions for depleting abundant rna transcripts
WO2008021290A2 (en) * 2006-08-09 2008-02-21 Homestead Clinical Corporation Organ-specific proteins and methods of their use
EP2506172A1 (en) * 2006-11-03 2012-10-03 Baylor Research Institute Diagnosis of metastatic melanoma and monitoring indicators of immunosuppression through blood leukocyte microarray analysis
AT504702A1 (de) * 2006-12-22 2008-07-15 Arc Austrian Res Centers Gmbh Set von tumormarkern
JP2010178650A (ja) * 2009-02-04 2010-08-19 Univ Of Tokyo 固形癌の再発予測のための試験方法および再発予防剤
GB0904904D0 (en) 2009-03-23 2009-05-06 Univ Leiden Medical Ct Angiogenesis methods, medicaments and agents

Also Published As

Publication number Publication date
US9234245B2 (en) 2016-01-12
EP2665835A4 (en) 2016-07-20
US20120185174A1 (en) 2012-07-19
CA2825046A1 (en) 2012-07-26
EP2665835B1 (en) 2018-03-14
AU2012207442B2 (en) 2017-02-23
JP2014503222A (ja) 2014-02-13
AU2012207442A1 (en) 2013-08-01
WO2012099872A1 (en) 2012-07-26
IL227419A0 (en) 2013-09-30
CN103403187A (zh) 2013-11-20
MX2013008252A (es) 2014-04-14
IL227419A (en) 2017-01-31
EP2665835A1 (en) 2013-11-27

Similar Documents

Publication Publication Date Title
AU2012207442B2 (en) Prognostic signature for colorectal cancer recurrence
DK2681333T3 (en) EVALUATION OF RESPONSE TO GASTROENTEROPANCREATIC NEUROENDOCRINE NEOPLASIS (GEP-NENE) THERAPY
RU2721916C2 (ru) Способы прогнозирования рака предстательной железы
DK2644713T3 (en) A Method for Diagnosing Neoplasms II
KR20140006898A (ko) 결장암 유전자 발현 시그니처 및 이용 방법
AU2012203810B2 (en) Methods and compositions for the treatment and diagnosis of bladder cancer
KR20140044341A (ko) 암에 대한 분자적 진단 검사
KR20160117606A (ko) 항-혈관형성 약물에 대한 반응 및 암의 예후를 예측하기 위한 분자적 진단 시험
BRPI0616090A2 (pt) métodos e materiais para identificação da origem de um carcinoma de origem primária desconhecida
CA2430981A1 (en) Gene expression profiling of primary breast carcinomas using arrays of candidate genes
BRPI0708534A2 (pt) ensaio molecular para prognosticar a recorrência de cáncer do cólon dukes b
CN111448325A (zh) 使用靶基因表达的数学建模评估jak-stat3细胞信号传导途径活性
AU2020201779B2 (en) Method for using gene expression to determine prognosis of prostate cancer
AU2008203227A1 (en) Colorectal cancer prognostics
KR101128112B1 (ko) 결장 직장암의 예후 진단법
US20030175761A1 (en) Identification of genes whose expression patterns distinguish benign lymphoid tissue and mantle cell, follicular, and small lymphocytic lymphoma
KR102631854B1 (ko) Bub1의 비근침윤성 방광암의 예후 예측용 바이오마커로의 용도
KR20100115283A (ko) 간암 예후 마커
CN115505640A (zh) 检测肺癌的dna甲基化标志物及应用
AU2014201129A1 (en) Methods and compositions for the treatment and diagnosis of bladder cancer
CN101405406A (zh) 诊断胰癌的方法
NZ618191B2 (en) Molecular diagnostic test for cancer
MXPA04008401A (en) Colorectal cancer prognostics

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid