KR20140040694A - 결장직장암 재발에 대한 예후 서명 - Google Patents
결장직장암 재발에 대한 예후 서명 Download PDFInfo
- Publication number
- KR20140040694A KR20140040694A KR1020137020961A KR20137020961A KR20140040694A KR 20140040694 A KR20140040694 A KR 20140040694A KR 1020137020961 A KR1020137020961 A KR 1020137020961A KR 20137020961 A KR20137020961 A KR 20137020961A KR 20140040694 A KR20140040694 A KR 20140040694A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- colorectal cancer
- patient
- recurrence
- prognostic
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Hospice & Palliative Care (AREA)
- Biophysics (AREA)
- Oncology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
본 발명의 검정 시스템은 환자에서 결장직장암의 재발 및/또는 비-재발을 예측하는 데에 유용하다. 상기 검정 시스템은 결장직장암 재발과 상관된 예후 유전자 프로파일의 양적 발현에 대하여 환자 샘플을 분석하도록 적합화되어 있다. 상기 프로파일은 서열 1, 2, 3, 4 및 5의 핵산 서열의 발현을 포함한다.
Description
관련 출원의 상호 참조
본 출원은 발명의 명칭이 "결장직장암 재발에 대한 5-유전자 예후 서명 {5-GENE PROGNOSTIC SIGNATURE FOR COLORECTAL CANCER RECURRENCE}"인 2011년 1월 18일자로 출원된 미국 특허 가출원 일련 번호 61/433,798에 대한 우선권을 주장하는 바, 그의 개시내용은 전문이 본원에 참조로 포함된다.
발명의 분야
본 발명은 일반적으로 진단 시험에 관한 것이다. 더 구체적으로, 본 발명은 결장직장암과 연관된 서명을 위한 진단 시험에 관한 것이다.
결장직장암은 미국에서 세 번째로 많이 자주 진단되는 암으로써, 매년 150,000 건 가량이 진단되며, 암-관련 사망의 세 번째로 큰 원인이기도 하다. 수술만으로 결절-음성(node-negative) 결장직장암에 대하여 치료된 환자들 중 사분의 일이 "치유"되었으나 5년 안에 재발을 겪게 되는 것으로 생각되고 있다. 현재는, 국립 종합 암 네트워트(National Comprehensive Cancer Network) (NCCN) 임상 실행 지침이 결장직장암 환자에서 재발의 위험성을 예측하는 데에 사용되고 있다. NCCN 지침에 의해 제공되는 것보다 더 우수한 위험성 예측에 의해 더 우수한 치료 계획 및 환자 성과를 달성하기 위해서, 더 높은 암 재발 위험성이 있는 환자를 확인하기 위한 개선된 기술이 요구되고 있다.
개요
전기한 요구는 한 측면에서 적어도 어느 정도까지 결장직장암 재발의 예측을 향상시키는 진단 시험이 개시된 본 발명에 의해 크게 충족된다.
본 발명은 환자에서 결장직장암 재발 및/또는 비-재발의 가능성을 예측하는 데에 유용한 예후 바이오마커 유전자들을 제공한다. 구체적으로, 유전적 프로그래밍 분석(genetic programming analysis)에 의해, 특정 유전자들이 결장직장암 재발 및 비-재발의 예측에 중요한 것으로 확인되었다. 이러한 예후 바이오마커 유전자들은 지도 학습(supervised learning) 기술을 사용하여 예후 규칙 (알고리즘)을 생성시키기 위한 기초를 제공한다. 생성된 예후 규칙은 예를 들어 예후 규칙을 포함하는 기계-판독가능 소프트웨어에 의해 개별 대상체에서의 결장직장암의 재발 및/또는 비-재발 위험성의 예측에 적용된다.
지도 학습 모드의 유전적 프로그래밍을 사용하여, 확인된 예후 바이오마커 유전자인 BMI1, ETV6, H3F3B, RPS10 및 VEGFA의 발현 수준을 기초로 하는 대표적인 예후 규칙이 생성되었다. 이와 같은 규칙, 및 이후의 다양한 지도 학습 기술, 예컨대 유전적 프로그래밍, CART 분석, 지지 벡터 머신(Support Vector Machine) 및 선형 판별 분석(Linear Discriminant Analysis)의 적용에 의해 상기 확인된 예후 바이오마커 유전자들로부터 생성될 수 있는 다른 규칙은 결장직장암 환자의 암 재발 또는 비-재발 위험성을 예측하는 데에 유용한 도구를 제공한다.
본 발명은 대상체의 결장직장암 재발 및/또는 비-재발 위험성을 예측하는 데에 본 발명의 예후 바이오마커 유전자 (BMI1, ETV6, H3F3B, RPS10 및 VEGFA) 및/또는 예후 규칙(들)을 이용하도록 적합화된 시스템, 도구, 키트, 핵산 어레이, 매트릭스, 소프트웨어, 컴퓨터 프로그램 등을 제공한다. 예를 들어, 시스템, 검정, 키트 또는 표면은 대상체의 측정된 유전자 발현 수준을 예후 규칙(들)에 적용하여 결장직장암 재발 및/또는 비-재발 위험성의 평가를 생성하도록 적합화 및/또는 설계된 개시 바이오마커 유전자, 증폭 프로브, 혼성화 프로브, 검정 시약, 데이터 수집물, 컴퓨터 연산(computation), 및 출력 모듈, 컴퓨터 소프트웨어, 기계-판독가능 매체 등 중 1종 이상을 포함할 수 있다.
본 발명은 또한 환자로부터 수득된 샘플에서 예후 바이오마커 유전자 (BMI1, ETV6, H3F3B, RPS10 및 VEGFA)의 유전자 발현 양을 측정하는 단계, 및 해당 위험성을 측정하기 위하여 바이오마커 유전자 발현의 측정된 양을 예후 규칙에 적용하는 단계를 포함하는, 결장직장암 재발 및/또는 비-재발 위험성의 예측 방법을 제공한다. 예후 규칙은 하기 실시예에 확인되어 있는 규칙일 수 있거나, 또는 재발 또는 비-재발을 나타내는 것으로 분류된 결장직장 환자 샘플 군집에서의 바이오마커 유전자 BMI, ETV6, H3F3B, RPS10 및 VEGFA 발현의 지도 학습 분석에 의해 생성될 수 있다. 재발 또는 비-재발의 위험성을 예측하기 위한 바람직한 규칙은 하기에 나타낸 규칙 1이다: [(((BMI1/H3F3B) * VEGFA) - ((ETV6/RPS10) * H3F3B)) ≥ -4.4777]일 경우, 재발함.
이에 따라, 본원에서의 그의 상세한 설명이 더 잘 이해될 수 있도록, 그리고 업계에 대한 본원의 기여를 더 잘 알 수 있도록, 소정의 본 발명 실시양태들이 비교적 광범위하게 개괄되었다. 물론, 하기에 기술되어 본원에 첨부된 청구범위의 주제를 형성하게 될 본 발명의 추가적인 실시양태들도 제시되어 있다.
이와 관련하여, 본 발명의 하나 이상 실시양태를 상세하게 설명하기 전에, 본 발명이 그의 적용에 있어서 구성상의 세부사항으로 제한되는 것은 아니며, 하기 상세한 설명에 제시되어 있거나 도면에 도시되어 있는 구성요소의 배열로 제한되는 것은 아니라는 것이 이해되어야 한다. 본 발명은 기술되어 있는 것들 이외의 실시양태를 수용할 수 있으며, 다양한 방식으로 실시 및 수행될 수 있다. 또한, 본원은 물론 요약서에서 사용되는 어구 및 용어는 설명을 목적으로 하는 것으로써, 제한하는 것으로 간주되어서는 안된다는 것이 이해되어야 한다.
따라서, 업계 숙련자라면, 본 개시가 기초하는 개념이 본 발명의 몇 가지 목적을 수행하는 다른 구조, 방법 및 시스템의 설계를 위한 기초로서 용이하게 이용될 수 있다는 것을 알고 있을 것이다. 이에 따라, 그것이 본 발명의 기술사상 및 영역에서 벗어나지 않는 한, 그와 같은 등가의 구성들은 청구범위에 포함되는 것으로 간주된다는 것이 중요하다.
도 1은 실시예 2에서 예후 규칙 1에 따라 결장직장암 재발의 높거나 낮은 위험성을 가지는 것으로 예측된 환자 샘플에 있어서의 3년 기간 동안의 무-재발 환자의 비율을 나타내는 그래프이다.
도 2는 상기 도 1에 나타낸 것과 동일하지만 결장직장암 재발의 높거나 낮은 위험성을 예측하는 데에 NCCN 지침을 사용한 환자 샘플에 있어서의 생존 곡선을 나타내는 그래프이다.
도 2는 상기 도 1에 나타낸 것과 동일하지만 결장직장암 재발의 높거나 낮은 위험성을 예측하는 데에 NCCN 지침을 사용한 환자 샘플에 있어서의 생존 곡선을 나타내는 그래프이다.
정의
다르게 주지되지 않는 한, 본 발명은 분자 생물학 및 관련 분야의 통상적인 기술을 사용한다. 그와 같은 기술에 대해서는 예를 들어 문헌 [Sambrook et al., 2001, Molecular Cloning: A Laboratory Manual] 및 [Ausubel, et al., 2002, Short Protocols in Molecular Biology, (2002)]과 같은 교재를 포함한 문헌에 기술되어 있다. 본원에서 언급되는 모든 특허, 특허 출원 및 공개는 그 전체가 본원에 참조로 명시적으로 포함된다.
다르게 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어들은 본 발명이 속하는 업계의 사람들에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 바람직한 방법 및 물질들이 기술되지만, 본 발명의 실시 또는 시험에서는, 본원에서 기술되는 것들과 유사하거나 등가인 소정의 방법 및 물질들이 사용될 수 있다. 본 발명의 목적상, 하기의 용어들은 하기에서 정의되는 바와 같다.
본원에서, 관사 "a" 및 "an"은 하나이거나 하나를 초과하는 (즉, 하나 이상인) 관사의 문법적 대상을 지칭하는 데에 사용된다. 예를 들자면, "요소(an element)"는 하나 이상의 요소를 의미한다.
본원에서 사용될 때의 "환자 샘플"이라는 용어는 환자 또는 대상체로부터 수득되어 바이오마커 유전자 발현에 대하여 검정될 수 있는 샘플을 지칭한다. 환자 샘플에는 생물학적 유체, 조직 생검물 등이 포함될 수 있다. 바람직한 실시양태에서, 샘플은 조직 샘플, 예를 들어 종양 조직으로써, 생, 냉동, 및/또는 기록용(archival) 파라핀 매립 조직일 수 있다.
본원에서 사용될 때의 "유전자"라는 용어는 세포 게놈의 소정의 그리고 모든 별개 코딩 영역은 물론, 관련 비-코딩 및 조절 영역을 지칭한다. 유전자는 또한 특정 폴리펩티드, 인트론, 및 발현의 조절에 관련된 인접 5' 및 3' 비-코딩 뉴클레오티드 서열을 코딩하는 오픈 리딩 프레임(open reading frame)을 의미하고자 하는 것이다. 이와 관련하여, 유전자는 추가적으로 조절 신호 예컨대 프로모터, 인핸서, 자연상에서 주어진 유전자와 연관되어 있는 종료 및/또는 폴리아데닐화 신호, 또는 이종유래 조절 신호를 포함할 수 있다. DNA 서열은 cDNA 또는 게놈 DNA, 또는 이들의 단편일 수 있다.
"예후 유전자 프로파일(prognostic gene profile)"은 그의 양적인 발현 수준이 환자에서 암 재발 및/또는 비-재발의 위험성을 예측하기 위한 예후 규칙에 사용될 수 있는 핵산 서열들의 조합을 지칭한다. 본원에서 확인되는 예후 유전자 프로파일은 하기의 실시예에서 확인되는 하기 바이오마커 유전자들의 조합을 포함한다: BMI1, ETV6, H3F3B, RPS10 및 VEGFA.
본 발명의 "예후 바이오마커 유전자"는 하기의 유전자들을 지칭한다: BMI1, ETV6, H3F3B, RPS10, VEGFA, AKT1, ARAF, ARHGDIB, B2M, CD82, DIABLO, FGFR4, GUSB, HMOX1, ITGB1, MAPK14, MAX, MMP2, NFKB1, POLR2L, PSMB6, PTK2 및 UBC.
"예후 규칙"은 결장직장암 환자로부터 수득되는 샘플에서의 예후 바이오마커 유전자들의 양적 발현을 암 재발 및/또는 비-재발의 위험성과 관련시키는 하나 이상 일련의 수학식 또는 알고리즘을 지칭한다.
표 1의 예후 바이오마커 유전자들로부터의 예후 규칙의 생성에 적용될 때의 "지도 학습"은 일련의 데이터에 적용되는 다양한 수학적 학습 기술을 지칭하는 것으로써, 출력은 예를 들어 재발 또는 비-재발로 정의되며, 분석은 제공되는 예로부터 학습한다. 지도 학습 기술에는 예를 들어 유전자 프로그래밍, CART 분석, 지지 벡터 머신, 및 선형 판별 분석 등이 포함된다.
"재발"은 치료 36개월 이내의 환자에 대한 결장직장암의 복귀를 지칭한다.
"비-재발"은 치료 후 36개월 이상 동안의, 환자에서의 확인된 결장직장암의 부재를 지칭한다.
"핵산 마이크로어레이(nucleic acid microarray)"는 일반적으로 기판상에 위치되며 비-공유 결합 상호작용을 통하여 상보적 서열을 가지는 샘플에 결합할 수 있는 폴리뉴클레오티드 프로브와 같은 혼성화가능 핵산 어레이 요소의 정돈된 배열을 지칭한다.
펩티드의 "단편" 또는 "일부"는 또 다른 펩티드 서열의 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 또는 250개의 연속되는 아미노산 잔기를 포함하는 펩티드를 지칭한다.
유전자 또는 폴리뉴클레오티의 "단편" 또는 "일부"는 또 다른 폴리뉴클레오티드 서열의 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 또는 250개의 연속되는 핵산 잔기를 포함하는 핵산 분자를 지칭한다.
핵산 서열과 관련하여 사용되는 "상보체(complement)"라는 용어는 그 서열이 제2의 핵산 서열의 것과 상보적이며 그에 따라 제2 서열에 혼성화될 수 있는 폴리뉴클레오티드를 지칭한다.
"프로브"는 비공유 (예컨대 수소 결합) 상호작용을 통해 폴리뉴클레오티드 표적 서열을 인식하여 혼성화될 수 있는 올리고뉴클레오티드 또는 그의 유사체이다. 프로브는 일반적으로 길이가 8개 뉴클레오티드 이상이나 유전자의 전체 길이 미만인 것이다. 프로브는 검출가능한 태그 및/또는 켄처(quencher) 분자를 사용하여 변형될 수 있다.
"단리된" 및/또는 "정제된"이라는 용어는 해당 자연 상태에서 보통 그것에 동반되는 성분으로부터 분리된 물질을 지칭한다. 예를 들어, 본원에서 사용될 때의 "단리된 폴리뉴클레오티드"는 보통 해당 단편에 인접하는 서열로부터 제거된 DNA 단편과 같이, 자연-발생 상태에서 그 폴리뉴클레오티드에 인접동반되는 서열로부터 정제된 폴리뉴클레오티드를 지칭한다.
"특이적으로 ~에 혼성화되는" 등의 구는 해당 서열이 복합 혼합물, 예를 들어 총 세포 DNA 또는 RNA, 또는 그의 혼합 폴리뉴클레오티드 추출물 중에 존재할 때, 염격 조건하에서 특정 뉴클레오티드 서열에만 분자가 결합, 이중체화 또는 혼성화되는 것을 지칭한다.
바이오마커의
확인
하기 실시예에서 기술되는 바와 같이, 유전적 프로그래밍 분석에 의해, 암 재발을 나타내는 환자 및 재발을 나타내지 않은 환자로부터 수득된 샘플들 사이에서, 특정 예후 바이오마커 유전자들이 단독 또는 다른 유전자와의 조합 중 어느 하나로써 상당히 차별적인 발현을 나타내는 것으로 확인되었다. 구체적으로는, 하기 5종 바이오마커 유전자들의 발현 수준이 결장직장암 재발의 위험성을 예측하는 데에 특히 유용한 것으로 확인되었다: BMI1, ETV6, H3F3B, RPS10 및 VEGFA.
이들 5종의 중요한 바이오마커 유전자들의 발현 수준은 이들 유전자의 조합 (예후 유전자 프로파일)의 양적 발현을 결장직장암 재발 및/또는 비-재발의 예측에 적용하는 예후 규칙을 생성시키기 위하여 하기 실시예에 기술되어 있는 바와 같은 추가 분석에 적용될 수 있다. 결장직장암 재발을 예측하는 데에 유용한 예후 유전자 프로파일은 하기 실시예에서 확인되는 하기 바이오마커 유전자들의 조합을 포함한다: BMI1, ETV6, H3F3B, RPS10 및 VEGFA.
확인된 예후 바이오마커 유전자들로부터, 다양한 패턴 인식 기술 및 상관 분석, 예컨대 유전적 프로그래밍, 선형 회귀, 로지스틱 회귀(logistic regression), 인공 신경 네트워크, 지지 벡터 머신 (SVM), 클러스터링 모델(clustering model), CART 분석 등을 사용하여 예후 규칙이 생성될 수 있다. 바람직한 실시양태에서는, 바이오마커 유전자들의 유전적 프로그래밍 분석이 예후 규칙을 생성시키는 데에 사용된다. 생성되는 예후 규칙은 예후 바이오마커 유전자들의 양적 발현을 결장직장암 재발 및/또는 비-재발의 위험성에 관련시키는 수학식 (알고리즘)이다. 하기 실시예에 기술되어 있는 바와 같은 유전적 프로그래밍을 사용하여 개발된 대표적인 예후 규칙은 하기의 바람직한 규칙이다:
[(((BMI1/H3F3B) * VEGFA) - ((ETV6/RPS10) * H3F3B)) ≥ -4.4777]일 경우, 재발함.
분석에서는, "가계 유전자(housekeeping gene)"의 발현이 대조로 사용될 수 있다. 그와 같은 가계 유전자에는 예를 들어 GAPDH, 베타-액틴, S9 리보좀, 유비퀴틴, 알파-튜불린, 18S rRNA, GUS, HPRT, B2M, TBP, CYC, HuPO, PGK, HuTfR, G6PDH (문헌 [Blanquicett, et al ., 2002, Anal Biochem, 303: 209-14]); RPLP0, GAPD, HPRT1, B2M, POLR2A, RPS14, MAN1B1, ACTB, MTR (문헌 [Dydensborg et al ., 2006, Am J Physiol Gastrointest Liver Physiol, 290: G1067-74]); HPRT, ADA, TAF2, POLR2L, CETN2, ACTB, UBE2D2, PSMB6, CAPN2, TXNRD1, SDHA, GUS, CYCC, PMM1, AGPATI, HDAC10, B2M (문헌 [Rubie et al ., 2005, Mol Cell Probes, 19: 101-9])이 포함된다.
유전자 발현 분석
유전자 발현은 다양한 공지의 방법, 예를 들어 샘플, 예컨대 조직 샘플에서 유전자 발현에 의해 생성된 mRNA, cDNA 또는 단백질의 양을 측정하는 것에 의해 양적으로 분석될 수 있다. 추가 분석을 위한 조직 샘플로부터의 mRNA의 단리 방법에 대해서는 알려져 있는데, 예를 들어 문헌 [Ausubel et al ., 2002, Short Protocols in Molecular Biology]을 참조하라. 파라핀 매립 조직으로부터의 mRNA의 단리 방법에 대해서는 예를 들어 문헌 [De Andres et al ., 1995, BioTechniques 18:42044]에 논의되어 있다. 예를 들어 파라핀 블록(Paraffin Block) RNA 단리 키트 (암비온, 인크.(Ambion, Inc.) 사, 텍사스 오스틴 소재)를 포함하여, RNA 단리 키트들이 상업적으로 입수가능하다.
단리된 RNA는 cDNA로 전환되거나, 및/또는 예를 들어 서열분석 또는 혼성화 분석에 의해 증폭, 확인 및 정량될 수 있다. 유전자 발현의 양을 측정하기 위한 다른 방법으로는 예를 들어 노던 블러팅 (문헌 [Brown, 2001 May, Curr Protoc Immunol, Chapter 10:Unit 10.12]; [Parker & Barnes, 1999, Methods in Molecular Biology 106:247-283]), 역전사효소 폴리머라제 연쇄 반응 (RT-PCR) (문헌 [Nygaard et al . 2009, Front Biosci. 14:552-69]; [Weis et al ., 1992, Trends in Genetics 8:263-64]), RNAse 보호 검정 (문헌 [Emery, 1999, Methods Mol Biol . 362:343-8]; [Hod, 1992 Biotechniques 13:852-54]), 대규모 병렬 서명 서열분석(massively parallel signature sequencing) (MPSS) (문헌 [Kutlu, 2009, BMC Med Genomics ., 2:3]; [Brenner, 2000, Nature Biotechnol. 18: 1021]), 유전자 발현의 직렬 분석(Serial Analysis) (SAGE) (문헌 [Boon 2009, PLoS ONE. 4:e5134]; [Velculescu, 1995, Science 270:368-9, 371]), 및 DNA 또는 RNA 이중체에 결합할 수 있는 항체의 사용, RNA-매개 어닐링(annealing), 선택, 및 결찰 (RASL) 검정 (문헌 [Yeakley, 2002, Nat Biotechnol; 20:353-8]), cDNA 매개 어닐링, 선택, 연장, 및 결찰 (DASL) 검정 (문헌 [Abramovitz, 2008, Biotechniques, 44:417-423]; [Fan, 2004, Genome Research 14:878-85]), 마이크로어레이 기술 (문헌 [Ravo et al., 2008, Lab Invest, 88:430-40]; [Schena, 1996, Proc . Natl . Acad . Sci . USA, 93: 106-149]), 예를 들어 인사이트 마이크로어레이(Incyte's microarray) 기술 또는 어피메트릭스 젠칩(Affymetrix's GenChip) 기술; 또는 454 라이프 사이언시즈, 인크.(Life Sciences, Inc.) 사 (코네티컷 브랜포드 소재)에 의해 개발된 고처리량 서열분석 기술 (문헌 [Marguilies, 2005, Nature, 437:376-80]이 포함된다.
한 실시양태에서, 선택된 바이오마커 유전자들의 양적 발현은 규칙 1의 5종 바이오마커 각각에 대하여 구입가능한 특이적 택맨(TAQMAN)® 유전자 발현 검정을 포함하여, 어플라이드 바이오시스템즈(APPLIED BIOSYSTEMS) 사에 구입가능한 것들과 같은 시중의 시약들을 사용하여 분석될 수 있다. 예시적인 택맨® 유전자 발현 검정을 하기에 목록화하였다. 이들은 하기에 기술되는 실시예 2에서 사용되었다.
DASL
양적 유전자 발현을 측정하기 위한 DASL 검정법에는 비오티닐화 프라이머를 사용한 총 RNA의 cDNA로의 전환이 포함된다. 비오티닐화된 DNA가 스트렙타비딘 고체 지지체에 결합된 후, cDNA 중 그의 표적 서열에 대한 검정 올리고뉴클레오티드의 어닐링이 이어진다. 일반적으로 유전자 당 3 내지 10개 표적 부위로, 주어진 표적 부위에 대하여 올리고뉴클레오티드 쌍이 어닐링된다. 상류의 어닐링된 올리고뉴클레오티드는 연장되어 하류의 상응 뉴클레오티드에 결찰됨으로써 PCR 주형을 생성시키고, 그것은 예를 들어 범용 PCR 프라이머를 사용하여 증폭된다. 예컨대 표지된 프라이머의 도입에 의해 표지된 PCR 생성물이 고체 지지체 어레이상의 포획 서열에 혼성화된 후, 각 비드에 대하여 형광 강도가 측정된다.
유전자 당 1-3개의 프로브 군을 포함하는 1536개까지의 유전자에 대한 완전 맞춤형 설계 DASL 검정 패널들은 물론, 암과 연관되어 있는 502개의 유전자를 표적으로 하는 일련의 프로브 군들을 포함하는 표준 DASL 인간 암 패널이 일루미나, 인크.(Illumina, Inc.) 사 (캘리포니아 샌디에고 소재)로부터 상업적으로 입수가능하다.
매스어레이
매스어레이(MassARRAY) 시스템은 RNA를 단리하여 cDNA로 역전사하는 데에 사용된다. cDNA는 증폭되어, 탈인산화되고, 프라이머를 사용하여 연장된 후, MALDI-TOF 질량 분광측정법을 통한 양적 분석을 위하여 칩 어레이(chip array)상에 배치된다. 매스어레이 분석을 수행하기 위한 하드웨어 및 소프트웨어는 세퀘놈, 인크. (Sequenom, Inc.) 사 (캘리포니아 샌디에고 소재)로부터 상업적으로 입수가능하다.
SAGE
SAGE에서는, 각각 RNA 전사체 내의 고유 위치에 상응하는 약 10-14개 염기쌍의 다수의 서열 태그들이 서로 연결되어 다수 태그의 서열들을 동시에 서열분석하여 확인하기 위한 연장된 분자를 형성시킨다. 전사체의 발현 패턴은 주어진 태그의 풍부도를 측정하고, 그 태그에 상응하는 유전자를 확인하는 것에 의해 정량될 수 있다. 예컨대 I-SAGE 키트 (인비트로겐(Invitrogen) 사, 캘리포니아 칼스배드 소재)를 포함하여, SAGE를 수행하기 위한 키트는 물론, SAGE 데이터를 분석하기 위한 소프트웨어가 상업적으로 입수가능하다. SAGE 데이터는 예를 들어 인터넷을 통하여 접근가능한 SAGEmap 데이터베이스를 검색하는 데에 사용될 수 있다.
유전적 프로그래밍
바람직한 실시양태에서는, 대상체의 결장직장암 재발 및/또는 비-재발 위험성을 표시해주는 예후 유전자 프로파일 및 예후 규칙에 사용하기 위한 충분한 예측력을 가지는 바이오마커 유전자들의 군을 확인하기 위하여 유전자 발현 데이터를 분석하는 데에, 유전적 프로그래밍이 사용된다.
유전적 프로그래밍은 사용자에 의해 규정되는 임무를 수행할 수 있는 컴퓨터 알고리즘을 개발하는 데에 생물학적 진화의 원리를 사용하는 인공 지능/기계 학습 기술이다 (예를 들어 문헌 [Banzhaf et al ., 1998, Genetic Programming : An Introduction : On the Automatic Evolution of Computer Programs and Its Applications]; [Koza, J.R., 1992, Genetic Programming : On the Programming of Computers by Means of Natural Selection, MIT Press] 참조).
유전적 프로그래밍은 프로그램 군집의 "자연선택"을 수행하는 각 프로그램의 적합성 측정을 사용하여 반복적인 방식으로 그것을 진화시키는 것에 의해 원하는 임무를 수행하도록, 일련의 컴퓨터 프로그램들을 최적화한다. 본 발명의 실시양태에서, 상기 임무는 환자에서 암의 재발을 예측하는 데에 유용한 하나 이상의 예후 규칙을 생성시키는 것이었으며, 적합성의 척도 또는 "적합성 함수"는 종양 조직 샘플을 재발 또는 비-재발을 겪게 될 환자에 속하는 것으로 올바르게 분류하는 주어진 컴퓨터 프로그램의 능력이었다.
컴퓨터 프로그램 군집의 진화는 다양한 공지의 방법으로 수행될 수 있다. 보편적인 한 가지 방법은 한 프로그램의 노드(node)가 군집에 존재하는 또 다른 프로그램으로부터의 노드와 교환되는 교차(crossover) 전략을 사용한다. 컴퓨터 프로그램을 진화시키는 또 다른 방법은 프로그램에 속하는 노드 또는 그 노드에 포함되어 있는 정보가 군집의 어떠한 다른 프로그램에도 영향을 주지 않고 교체되는 돌연변이에 의한다. 이러한 방법들은 단독으로, 또는 프로그램들간 프로그래밍 요소의 구성 성분의 교환을 수반하는 다른 방법과 함께 사용될 수 있다. 각 진화 라운드 후, 군집의 각 컴퓨터 프로그램은 적합성 척도를 사용한 시험에 적용된다.
하기 실시예에 기술되어 있는 바와 같이, 유전적 프로그래밍 시스템은 표적 질환 및 건강 조직 모두의 알려져 있는 샘플로부터 취한 유전자 발현 데이터와 함께 제공되어, 결장직장암의 재발/비-재발과 같은 표적 질환 종류에 대한 단정적인 IF-THEN 항목을 도출하는 데에 사용될 수 있다. 실시양태에서, 단정적인 IF-THEN 항목은 종양 조직에서의 다양한 유전자의 발현량을 환자에서의 암 재발 가능성에 관련시키는 수학식이다. 도출되는 규칙은 올바르게 분류된 샘플의 수가 후보 규칙의 적합성 척도인 훈련용 샘플 세트를 사용하여 개발된다.
적합성 척도는 더 적은 거짓 양성 오류를 생성시키는 규칙에 더 무게를 두도록, 또는 더 적은 거짓 "음성" 오류를 생성시키는 규칙에 더 신뢰를 부여하도록, 달라질 수 있다. 적합성 척도는 유전적 프로그래밍 시스템 자체에 대해서는 외부적이나 원하는 목표를 더 잘 반영하는 다른 이유로 달라질 수도 있다. 예를 들어, 한 실시양태에서는, 선택된 종양 조직으로부터 방출되어 혈류를 통해 전신적으로 신체에 진입하는 것으로 알려져 있는 단백질과 같이, 특정 종류의 단백질을 코딩하는 유전자만을 도입하는 규칙을 생성시키는 것이 바람직할 수 있다.
일단 예후 규칙이 개발되고 나면, 규칙은 미지의 샘플을 표준화하는 그의 능력을 평가하기 위하여 시험 샘플 세트에 대하여 점검된다. 각 적합성 평가 라운드 후, 최고 성능의 프로그램들이 다음 라운드에서의 추가 진화용으로 유지된다. 다음 진화 반복을 위한 컴퓨터 프로그램 군집을 선택하는 데에는 다양한 방법들이 사용될 수 있다. 한 실시양태에서는, 예컨대 교차(crossover)를 사용하여 2종의 최적합 프로그램들이 서로 "교류(mated)"된 후, 자손 프로그램이 적합성 평가에 따른 최소 적합성 프로그램을 대체하여 다음 진화 라운드를 위한 프로그램 군집에 첨가된다. 추가적인 진화의 반복 및 적합성 시험은 사전-선택된 기준에 따라 적합한 효용을 가지는 하나 이상의 예후 규칙이 수득될 때까지, 또는 추가적인 적합성의 향상이 관찰되지 않을 때까지 계속될 수 있다.
유전적 프로그래밍의 주목할만한 장점은 종종 예상치 않은 방식으로 변수들을 조합하는 것에 의해, 높은 예측력을 보유하는 알고리즘을 생성시키는 데에 다수의 변수 및 연산자를 이용하는 그의 능력이다. 다른 모델링 기술들에 대비한 추가적인 장점은 예를 들어 계층적 클러스터 분석(hierarchical cluster analysis)을 사용하는 경우에 필요할 수 있는 바와 같은 연구중인 질환에 상당히 중요한 것으로 생각되는 생물학적 과정과의 연관성을 기초로 하는 선택 유전자의 검토분석이 필요할 수 있는 어떠한 연산자의 입력 없이도, 저절로 예후 규칙이 생성될 수 있다는 것이다.
어느 분석 방법이나 그러하듯이, 차선의 조건이 존재할 경우, 유전적 프로그래밍의 효용은 훼손될 수 있다. 예를 들어, 이상적으로는 큰 데이터 세트가 대규모 훈련용 및 시험용 세트로 분할하는 데에 가용하다. 그러나, 많은 경우에서 입력 데이터의 총량은 적은데, 유전적 프로그래밍 시스템이 잠재적으로 가용한 대부분의 일반적인 분류 개념을 학습할 수 없음을 의미한다. 마찬가지로, 소규모 시험은 학습된 개념의 일반성의 아주 철저한 평가는 허용하지 않는다. 이러한 경우, 유전적 프로그래밍으로부터 수득되는 결과를 평가하기 위한 것으로써, 유전적 프로그래밍 시스템 자체에는 외부적인 공지의 방법들이 존재한다. 예를 들어, n-중 교차 확인(n-fold cross validation)이 적은 데이터 세트를 극복하는 데에 사용될 수 있다. 숙련자라면, 전체 범위의 공지의 확인 방법들 중에서 선택할 수 있을 것이다.
다양한 유전적 프로그래밍 기술들이 본 발명을 실시하는 데에 사용될 수 있다. 예를 들어, 유전적 프로그래밍은 미국 특허 번호 6,327,582에 기술되어 있는 기술에 따라 수행될 수 있다.
기타 분석 방법
일단 고도의 예측력을 가지는 예후 바이오마커 유전자 세트가 확인되고 나면, 유전적 프로그래밍이 아닌 다른 분석 방법들이 예후 바이오마커 유전자들의 상대적인 발현 수준을 암 재발 및/또는 비-재발에 관련시키는 하나 이상의 예후 규칙을 생성시키는 데에 사용될 수 있다는 것을 알고 있을 것이다. 예를 들어, 공지의 회귀 및 기타 패턴 인식 기술들이 예측성 규칙을 생성시키는 데에 사용될 수 있다. CART 분석, 지지 벡터 머신, 및 선형 또는 비-선형 판별 분석 등과 같은 지도 학습 기술들이 일단 예후 바이오마커 유전자들이 알려지고 난 후 예후 규칙을 개발하는 데에 유용하다.
예후 규칙
환자에서 결장직장암 재발 및/또는 비-재발의 가능성을 예측하기 위한 예후 규칙은 하기의 실시예에서 확인되며, 확인된 예후 바이오마커 유전자들의 분석에 의해서도 생성될 수 있다. 예후 규칙은 일반적으로 바이오마커 유전자 발현의 양을 결장직장암 재발 및/또는 비-재발의 위험성에 관련시키는 부울 식(Boolean expression)이다.
환자의 결장직장암 재발 가능성은 환자의 측정된 바이오마커 유전자 발현 수준을 예후 규칙에 적용함으로써 예측된다. 일 예에서, 컴퓨터화된 시스템은 유전자 발현 값을 수용하기 위한 입력 모듈; 유전자 발현 값을 예후 규칙에 적용하여 규칙에 따른 위험성 예측을 계산하기 위한 분석 모듈; 및 규칙에 의해 계산되어 생성되는 재발 및/또는 비-재발의 위험성 예측을 예컨대 디스플레이 또는 다른 전달 기작에 의해 사용자에게 전달하기 위한 출력 모듈을 포함한다. 또 다른 예에서는, 2종 이상의 규칙이 분석 모듈에 적용될 수도 있다.
도구,
키트
, 시스템 및 예후 유전자 프로파일
본 발명은 결장직장암 환자에서의 재발 및/또는 비-재발 위험성에 대한 중요한 바이오마커로 확인된 유전자 군을 제공한다. 이러한 예후 바이오마커 유전자들은 상기 표 1에 목록화되어 있다. 대표적인 환자 샘플에서의 이러한 예후 바이오마커 유전자들의 양적 발현의 수학적 분석에 의해 유도되는 예후 유전자 프로파일 및 예후 규칙은 개별 환자의 해당 예후 바이오마커 유전자들의 발현 수준으로부터 그 환자가 결장직장암의 높은 재발 및/또는 비-재발 위험성을 가지고 있는 군집에 속할 가능성의 예측을 측정하기 위한 검정 방법, 시스템, 도구, 시약, 소프트웨어, 장치 등에, 그리고 예측된 예후에 기초한 결장직장암 환자의 합리적인 치료에 적용된다.
대표적인 도구에는 예를 들어 예후 바이오마커 유전자, 유전자 프로파일, 및 특정 예후 규칙의 유전자의 발현량을 측정하도록 적합화된 검정 시스템, 예컨대 마이크로어레이, 혼성화, 증폭, PCR, DASL, SAGE, 및 유사 검정 시스템은 물론, 환자에서 결장직장암의 재발 또는 비-재발을 예측하기 위한 장치, 시스템 또는 방법에 사용되는 키트, 칩, 카드, 다중-웰 검정 플레이트, 프로브, 프라이머, 데이터 저장 시스템, 소프트웨어 프로그램, 컴퓨터 시스템 등이 포함된다.
1종 이상 예후 바이오마커 유전자의 발현 수준을 증폭 및 검출하기 위하여, 핵산 프로브 및/또는 프라이머의 패널이 설계된다. 그와 같은 프로브에는 예를 들어 단리된 유전자 mRNA, cDNA, 및 이들의 일부, 유전자 발현 수준의 정량 측정에 유용한 증폭된 핵산이 포함된다. 그와 같은 프라이머에는 원하는 앰플리콘에 측접하며 유전자 발현을 정량하기 위하여 원하는 유전자 또는 유전자의 일부를 증폭하는 데에 유용한 핵산이 포함된다.
혼성화 플레이트, 칩 또는 카드와 같은 검정용 기판은 대상체로부터 수득된 샘플에서 확인된 바이오마커 유전자의 발현을 증폭하고/거나 확인하고/거나 서열분석함으로써 정량하는 프라이머 쌍 및/또는 프로브가 포함되도록 적합화 및 설계된다.
키트에는 본 발명 예후 규칙 중의 그의 존재로 인하여 결장직장암 재발과 연관되는 확인된 바이오마커 유전자의 발현 수준을 정량하는 데에 유용한 시약 및 도구가 포함되는데, 예를 들어 표 1에 목록화되어 있는 바이오마커 유전자들의 발현을 정량하도록 설계된 핵산 프로브 및/또는 프라이머들이 포함된다.
도구, 키트 및 시스템에는 또한 예측되는 결장직장암 재발 및/또는 비-재발 위험성을 계산하는 예후 규칙을 저장하고 적용하도록 적합화된 컴퓨터 시스템, 소프트웨어 및 모듈이 포함된다. 컴퓨터 시스템은 예를 들어 양적인 바이오마커 유전자 발현 데이터를 수용하기 위한 입력 모듈, 예후 규칙 및 바이오마커 유전자 발현 수준을 적용하여 규칙의 수학적 결과를 계산하기 위한 분석 모듈, 및 예측 위험성 결과를 제공하기 위한 출력 모듈이 포함될 수 있다.
치료 또는 예방 방법
본 발명은 환자에서의 결장직장암 재발 및/또는 비-재발 위험성의 예측 방법을 포함한다. 일반적으로, 상기 방법은 환자의 샘플로부터 표 1에 목록화되어 있는 확인된 예후 유전자 프로파일 중 유전자의 발현 수준을 정량적으로 측정하는 것, 측정된 발현 값을 예후 규칙에 적용하는 것, 및 유전자 발현 수준을 예후 규칙에 따라 해석함으로써 환자의 결장직장암 재발 위험성을 측정하는 것을 포함한다. 치료 요법은 환자의 유전자 발현 데이터를 예후 규칙에 적용한 결과에 의해 확인되는 바와 같은 환자 예후에 따라 개인화된다. 일 예로써, 환자 샘플의 분석이 재발 가능성을 나타내는 경우에는, 더 공격적인 항암 요법이 적용된다.
실시예
하기의 비-제한적인 실시예에 기술되어 있는 구체적인 실시양태들을 참조하게 되면, 본 발명이 용이하게 이해 및 실시될 수 있다. 하기의 실시예에는, 일련의 발현된 예측 유전자들을 선택하는 데에 이용되는 다양한 검정들이 기술되어 있다. 구체적으로는, cDNA-매개의 어닐링, 선택, 연장, 및 결찰 (DASL) 검정, 및 역전사효소 폴리머라제 연쇄 반응 (RT-PCR) 검정이 기술되어 있다. 그러나, 본 발명의 다양한 실시양태가 DASL 및 RT-PCR로 제한되는 것은 아니며, 오히려 어떠한 적합한 게놈 물질 선택 검정도 포함할 수 있다.
실시예
1:
DASL
법을 사용한 단계 I/
II
결장직장 1차 선암종 조직의 유전자 발현 프로파일 생성
단계 I 및 단계 II 결장직장암에 걸린 145명의 환자로부터 (104명 결장, 41명 직장), 치료 수술 과정에서 기록용 포르말린-고정된 파라핀-매립 (FFPE) 1차 선암종 조직을 수득하였다. 모든 환자들이 수술-후 36개월 (mo) 이내에 재발되거나 (R) (n=67; 51명 단계 II), 또는 ≥36 mo 동안 비-재발이 확인되는 것 (NR) (n=78; 56명 단계 II) 중 어느 하나였으며; 아무도 네오아주반트 또는 아주반트 요법을 받지 않았다. R 상태, 1차 재발까지의 시간, 우 대 좌-측 종양 등에 의해 환자를 계층화한 다음, 무작위로 훈련용 세트 (T세트) (n=73; 34R, 39NR) 또는 확인 세트 (V세트) (n=72; 33R, 39NR)로 할당하였다.
맞춤형 512개 유전자 패널을 사용하여, DASL 검정 (일루미나 사, 캘리포니아 샌디에고 소재) (문헌 [Abramovitz, 2008, Biotechniques, 44:417-423]; [Fan et al ., 2004, Genome Research 14:878-85])에 의해, 훈련용 세트 종양 유전자 발현을 정량하였다. R 및 NR 군들 사이에 차별적인 발현 수준을 나타내는 관심 유전자를 확인하고, 인터넷을 통하여 가용한 U.C.S.C. 게놈 브라우저에 목록화되어 있는 바와 같은 인간 게놈상의 참조 서열 위치, 그리고 인터넷을 통하여 가용한 진뱅크(GenBank) 사에서 입수되는 대표적인 핵산 서열과 함께 표 2에 나타내었다. 확인되는 바와 같은 U.C.S.C. 브라우저 및 진뱅크 사의 서열들은 본원에 참조로 포함된다.
RT
-
PCR
법을 사용한 단계 I/
II
결장직장 1차 선암종 조직의 유전자 발현 프로파일 생성
DASL법의 대안으로써 또는 그에 더하여, RT-PCR법을 사용하여 유전자 발현 프로파일이 생성될 수 있다. 예를 들어, 1개의 미국 (미네소타 로체스터; n=45) 및 2개 별도의 유럽 (러시아 연방 모스크바)의 장소에서 60명의 결장암 (AJCC pT1-4 pN0 cM0) 및 14명의 직장암 (AJCC pT2-3 pN0 cM0) 환자에 대하여, 치료 의도의 최초 수술 절제 (R0)에서 수득된 칠십사개 (74개)의 기록용이며 임상 주석이 달린 포르말린-고정 파라핀 매립 (FFPE) 1차 암종 조직을 회수하였다. 아무도 네오아주반트 또는 아주반트 요법을 받지 않았다. 각 경우에 대하여 그 장소의 직원에 의한 의료 기록 열람에 의해 삼십육 (36)-개월 R 및 NR 상태를 확인하였다. 모든 환자에 대하여 사전고지 동의서를 입수하였다.
재발 상태, 1차 재발까지의 시간, 결장암 대 직장암, R- 대 L-측 결장, 및 조직 공급원에 의한 계층화 후, 74 사례를 무작위로 훈련용 세트 (n=37; 16R, 21NR) 및 동일한 크기의 시험용 세트 (n=37; 16R, 21NR)로 분할하였다.
맞춤형의 집중식 마이크로어레이(custom focussed microarray)를 구성하기 위하여, 맞춤형 384-웰 택맨® 저밀도 어레이 (어플라이드 바이오시스템즈(Applied Biosystems) 사, 캘리포니아 포스터 시티 소재)를 사용하는 RT-PCR에 의해, 종양 유전자 발현을 평가하였다. 그것이 하기의 기준들 중 하나 이상을 충족하는지에 기초하여, 417개 암-연관 유전자의 패널을 어레이용으로 예비-선택하였다: (1) 종양생성, 종양 진행 또는 전이와 연관됨; (2) 세포 주기 진행, 혈관형성, 생존 또는 아폽토시스의 핵심 조절 단백질을 코딩함; (3) CRC의 개시 및 진행에 관련됨; (4) CRC의 예후인 것으로 보고되어 있음; (5) CRC 화학요법에 대한 종양 반응을 예보하거나 거기에 영향을 줌; (6) 정상 및 악성 CRC 조직 사이에 차별적으로 발현됨.
NCBI 엔트레즈(Entrez) 뉴클레오티드 데이터베이스를 통하여 접근한 각 유전자 및 공통서열에 대하여 적절한 mRNA 참조 서열 (REFSEQ) 접근 번호를 확인하였다. 어플라이드 바이오시스템즈 사에서 RT-PCR 프라이머 및 프로브를 설계하였다. 앰플리콘 크기는 최소한으로 유지하여, 대부분이 길이 100 염기 미만이었다.
각 사례에 대하여, 독립적인 위장관 병리학자에 의한 H&E 염색 슬라이드상 FFPE 악성 조직의 확인 및 위치지정 후, 별도의 유리 슬라이드에 고정된 상응 미염색 종양 조직을 1회용 스캘펄(scalpel)을 사용하여 무-RNAse 미세원심분리 튜브로 긁어내었다. 크실렌 중에서 조직을 탈-파라핀화한 후, RNA를 추출하고, 리커버올(RecoverAll)™ 총 핵산 단리 키트 (어플라이드 바이오시스템즈/암비온 사, 텍사스 오스틴 소재)를 사용하여 정제하였다. 나노드롭(Nanodrop) 1000 UV/Vis 분광광도측정기를 사용하여 260/280 nm의 UV 흡수비를 측정함으로써, RNA 용액의 순도 및 양을 측정하였다. 프라이머로서 무작위 육량체를 사용하는 고성능 cDNA 역전사 키트 (어플라이드 바이오시스템즈 사)를 사용하여, 최소 100 ng의 RNA를 단일 가닥 cDNA로 전사하였다. cDNA는 즉시 RT-PCR에 사용하거나, -80℃에서 저장하였다.
택맨® 맞춤형 어레이 384-웰 미세유동 카드(microfluidic card) (어플라이드 바이오시스템즈 사)를 사용하여, 실시간 PCR을 통한 유전자 발현을 검정하였다. 48 웰 당 100 μl의 cDNA (1 ng/μl)를 카드에 적용한 후, 7900HT 속성 실시간 PCR 시스템을 사용하여 2반복으로 모든 검정을 수행하였다. 출력 데이터는 증폭 곡선에서 0.2로 설정된 일정한 역치, 즉 주기 역치 (Ct)에 도달하는 데에 요구되는 PCR 주기의 수로 나타내었다. 5종의 가계 (HK) 유전자를 사용하여 데이터를 표준화함으로써, 각 검정에서의 RNA 완전성 및 양의 잠재적인 기술적 변이성 및 편차에 대하여 보정하였다. 선택된 5종의 HK 유전자 (B2M, GUSB, POLR2L, PSMB6, UBC)는 CRC 및 다른 조직에서 상시 발현되는 것으로 잘 알려져 있는 9종의 후보 유전자들 중 최소 수준의 발현 변이성을 나타내었다. 개별 유전자 발현 복제물의 각 쌍을 일치도에 대하여 검사하고, 각각에 대하여 상관 계수를 생성시켰다. 복제물들을 평균하고, 5종 HK 유전자들의 평균 (Ave. 5HK Ct)으로부터 각 규칙 유전자에 대한 Ct (RG Ct)를 차감함으로써, 생성 데이터를 표준화하였다. Ct 값은 2를 밑으로 하는 대수로 나타내었기 때문에, 역대수를 취함으로써 데이터를 선형화하고, 결과를 100배로 확대하였다. 이에 따라, 데이터의 최종 형태는 하기였다:
유전자 발현 값 = 2( Ave . 5 HK Ct - RG Ct ) × 100.
연구 전체에 있어서, 추출된 RNA 및 RT-PCR 결과의 허용을 위한 최소한의 기준은 하기였다: (1) RNA 농도: ≥ 10 ng/μl; (2) RNA는 ≥ 1.8의 260/280 nm 비를 가질 필요가 있음; (3) 5종 HK 유전자의 평균 발현: ≤ 32.0 Ct; 및 (4) 모든 개별 Ct 값: ≤ 35.
실시예
2: 유전적 프로그래밍을 통한, 결장직장암 재발의 위험성을 측정하기 위한 규칙의 생성
바이오마커 유전자들의 발현 수준에 기초하는 예후 규칙을 진화시키기 위하여, 훈련용 세트 유전자 발현 데이터의 연속 유전적 프로그래밍(GP) 분석을 사용하여, 실시예 1에서 확인된 예후 바이오마커 유전자들을 분석하였다. 하기에 나타낸 이러한 규칙들은 확인 데이터 세트에서 결장직장암 환자가 재발 또는 비-재발을 겪게될지 여부를 예측하는 데에 유용하였다.
확인된 예후 바이오마커 유전자들의 유전적 프로그래밍 분석에서는, 표 2 유전자들의 다양한 조합을 포함한 잠재적 규칙들의 군집을 무작위로 생성시킴으로써, 일련의 후보 규칙들을 산출하였다. 다음에, 각 후보 규칙을 적합성에 대하여 시험하였다.
"재발" 대 "비-재발"로 올바르게 분류된 종양 조직 샘플의 수가 후보 규칙에 있어서의 적합성의 척도로 사용되었다. 또 다른 예에서는, 민감성과 특이성의 합계, 또는 양성 예측가능성, 음성 예측가능성 등의 합계가 적합성의 척도로 이용된다. 또 다른 예에서는, 수용체 작용제 곡선 (ROC)의 곡선하 면적 (AUC)이 적합성의 척도로 사용된다. 충분히 높은 적합성을 가지는 것으로 판단된 후보 규칙이 발견된 경우, 유전적 프로그래밍을 종료하고, 최적합성 후보를 예후 규칙으로 선택하였다. 죵료 기준이 충족되지 않은 경우에는, 최고 적합성을 가지는 후보 규칙들을 교류시켜 새로운 자손 후보 규칙들의 군집을 생성시키고, 더 낮은 적합성을 가지는 것으로 밝혀진 후보 규칙을 폐기하였다.
종료 기준이 충족되어 적합한 적합성을 가지는 하나 이상의 규칙이 발견될 때까지, 유전적 프로그래밍 방법의 추가적인 반복을 수행하였다. 표 2 유전자들의 연속적인 GP 분석 후, 입력 데이터가 재발을 예측하는 예후 서명 규칙을 산출하였다 (표 3 참조).
실시예
3: 재발을 예측하기 위한 예후
GP
규칙의 사용
표 3의 규칙을 사용하여 결장직장암 환자에서 재발을 예측하였다. 미국 2개 장소 및 유럽 2개 장소에서, 86명의 단계 I/II (pT1-4 pN0 M0) 결장암 환자 및 29명의 단계 I (pT1-2, pN0 M0) 직장암 환자에 대하여, 치료 의도의 최초 수술 절제에서 수득된 기록용 포르말린-고정 파라핀-매립 1차 선암종 조직 (저장 중앙값 7년; 4-15년 범위)을 회수하였다. 이들 장소 및 샘플들은 실시예 1 및 2에 대하여 상기한 바와 같이 분자 시험을 생성시키는 데에 사용되었던 샘플들과는 다른 것이었다.
수득된 샘플에는 수술 36개월 이내에 종양이 재발되었던 (R) 환자로부터의 것들 (n=46), 및 수술 후 36개월 이상 동안 비-재발로 확인된 (NR) 환자로부터의 것들 (n=69)이 포함되었다. 어느 환자도 네오아주반트 또는 아주반트 요법을 받지 않았다.
이들 샘플에서, 어플라이드 바이오시스템즈 사로부터 입수된 맞춤형 384-웰 택맨® 저밀도 어레이를 사용하여, 그리고 일련의 엄격한 품질 조절 파라미터들을 충족시킨 RNA를 사용하여, qRT-PCR에 의해 종양 유전자 발현을 평가하였다. 문제의 5개 유전자 각각의 택맨® 검정 번호 및 프로브 길이를 하기 표 4에 나타내었다:
이와 같은 환자 데이터 세트 (V세트)에서 규칙 1의 예측 민감성 및 특이성을 분석하고, 결장직장암에 대하여 현행 국립 종합 암 네트워트 (NCCN)를 사용하여 수득된 것과 비교하였다. 단계 I/II CRC (n=115)의 경우, 상기 양분 규칙은 70%의 민감성 및 55%의 특이성으로 32/46명의 R 및 38/69명의 NR V세트 환자를 올바르게 분류하였다. 양성 예측 값 (PPV) 51%, 음성 예측 값 (NPV) 73%, 및 상대적 위험도 (HR) 2.06 (95% CI: 1.1 내지 3.86; p=0.020)으로써, '고위험'으로 간주된 환자들은 '저위험'으로 표지된 환자들에 비해 36개월 이내에 상당히 더 높은 재발 가능성을 가졌다.
반면, NCCN 지침 (버젼 1.2011)은 72%의 민감성 및 42%의 특이성, 45%의 양성 예측 값 및 69%의 음성 예측 값을 가짐으로써, 본 군집에서만큼 잘 36-개월 재발 대 비-재발을 구별할 수 없었다. 위험도 비는 1.38 (95% CI: 0.73-2.53, p=0.315)이었다. 분자 시험의 특이성은 NCCN에서의 것에 비해 상당히 더 컸다 (p=0.05).
단계 I 직장암 환자의 경우 (n=29; 13명 재발), 분자 시험의 예후 정확도는 NCCN 지침 (16/29)의 55% 특이성 (16/29)을 능가하는 79%의 특이성 (23/29)을 나타내었다.
본 실시예에서, 예후 바이오마커 유전자들로부터 유도된 예후 규칙이 FFPE 종양 조직에서의 유전자 발현 수준의 유전적 프로그래밍 분석에 의한 결장직장암 재발 및/또는 비-재발의 측정에 중요하며, 3년 이내의 재발에 대하여 고위험성 대 저위험성인 초기 단계 CRC 환자를 현행 NCCN 지침에 비해 더 우수하게 구별할 수 있는 것으로 확인되었다.
실시예
4: 재발을 예측하기 위한 예후
GP
규칙의 사용
상기한 바와 같이, 유전적 프로그래밍을 사용하여 예후 바이오마커 유전자들을 확인하고 (실시예 1), 결장직장암 재발의 위험성을 측정하기 위한 예후 규칙을 생성시켰다 (실시예 2 및 3). 표 2에 목록화되어 있는 예후 바이오마커 유전자들의 발현 수준이 결장직장암 재발에 대하여 고도로 예측성이었기 때문에, 비-GP 분석 방법을 사용하여서도 이들 예후 바이오마커 유전자들의 발현에 기초하는 예후 규칙이 생성될 수 있다는 가설을 세웠다.
다른 분석 방법들의 유용성을 입증하는 것으로써, 분류 및 회귀 나무 (CART) 알고리즘 (문헌 [Freund et al . 1999, The alternating decision tree learning algorithm])을 사용하여, 표 2에 목록화되어 있는 예후 바이오마커 유전자들의 발현으로부터 유도되는 예후 규칙이 생성될 수 있다.
다양한 분석 기술들에 의해 생성되는 예후 규칙에서의 상기 예후 바이오마커 유전자들의 용도를 추가적으로 입증하는 것으로써, 표 2에 목록화되어 있는 유전자들에 대한 발현 데이터, 및 공지의 재발 및 비-재발 시험 데이터를 사용하여 (예를 들어 문헌 [Mocellin et al . 2003 Ann Surg Oncol. 2006 13: 1113-1122] 참조) 지지 벡터 머신이 생성될 수 있다. 계수 및 벡터들에 의해 생성되는 지지 벡터 머신 (SVM)은 분류기구(classifier)의 확실성을 시험하기 위한 훈련용 데이터 (T세트)에서의 4-중 교차확인을 수행하는 데에 사용된다. 분류기구를 3중으로 훈련시킨 후, 네 번째에 정확도가 시험된다. 분석은 단일 정확도 (%) 및 총 정확도 (4반복에 걸친 평균) (%)로 기록된다. SVM에 의해 개발된 규칙을 사용한 확인 세트 (V세트)의 시험은 기록되는 정확도 (%)를 산출한다.
다양한 분석 기술들에 의해 생성되는 예후 규칙에서의 상기 예후 바이오마커 유전자들의 용도를 추가적으로 입증하는 것으로써, 표 2에 목록화되어 있는 유전자들에 대한 양적 발현 데이터 및 공지의 재발 및 비-재발 시험 데이터를 사용하여 (예를 들어 문헌 [Mocellin et al . 2003 Ann Surg Oncol. 2006 13: 1113-1122] 참조) 지지 벡터 머신이 생성될 수 있다. 계수 및 벡터들에 의해 생성되는 지지 벡터 머신은 분류기구의 확실성을 시험하기 위한 훈련용 데이터 (T세트)에서의 4-중 교차-확인을 수행하는 데에 사용된다. 분류기구를 3중으로 훈련시킨 후, 네 번째에 정확도가 시험된다.
표 2에 목록화되어 있는 예후 바이오마커 유전자들의 고도의 예측력을 추가 입증하는 것으로써, 선형 판별 분석을 사용하여 (예를 들어 문헌 [Marchevsky et al., 2004 JMD, Vol. 6]: [1Estevez et al ., 2004, Eur Clin Nutr 58:449-455] 참조) 표 2에 목록화되어 있는 유전자들의 양적 발현에 기초하여 결장직장암 재발의 가능성을 예측하는 예후 규칙이 생성된다.
선형 판별 (LD) 분석은 샘플을 2개의 군으로 분류하는 데에 각 유전자의 개별 측정치 및 모든 유전자 조합의 계산된 측정치 모두를 사용한다. 각 유전자에 대하여, 군 1 및 군 2 군의 평균 및 표준 편차로부터 비중이 유도된다. 모든 유전자에 비중을 곱하고, 이들 값의 합계가 집합적인 판별 점수로 이어진다. 다음에, 이와 같은 판별 점수는 군 1 및 군 2 군의 집합적 중심값에 비교된다. 이러한 중심값은 각각 모든 군 1 및 군 2 샘플들의 평균이다. 이에 따라, 각 유전자는 전체 예측에 기여한다. 이와 같은 기여는 그 유전자에 대한 군 1과 군 2 샘플들 사이의 상대적인 거리가 클 경우 큰 양 또는 음의 수이며, 상대적인 거리가 작을 경우 작은 수인 비중에 따라 달라진다. 각 미지 샘플에 대한 판별 점수 및 중심값은 미지 샘플이 어느 군에 속하는지에 관하여 0 내지 1 사이의 가능성을 계산하는 데에 사용될 수 있다.
본 발명의 또 다른 실시양태에서는, 표 1에 목록화되어 있는 것들 이외의 유전자들이 유전자 발현 프로파일을 생성시키는 데에 이용된다.
실시예
5:
RT
-
PCR
법을 사용한 단계 I/
II
결장직장 1차
선암종
조직의 유전자 발현 프로파일의 생성
1개의 미국 (미네소타 로체스터; n=45) 및 2개 별도의 유럽 (러시아 연방 모스크바)의 장소에서 60명의 결장암 (AJCC pT1-4 pN0 cM0) 및 14명의 직장암 (AJCC pT2-3 pN0 cM0) 환자에 대하여, 치료 의도의 최초 수술 절제 (R0)에서 수득된 칠십사개 (74개)의 기록용이며 임상 주석이 달린 포르말린-고정 파라핀 매립 (FFPE) 1차 암종 조직을 회수하였다. 아무도 네오아주반트 또는 아주반트 요법을 받지 않았다. 각 경우에 대하여 그 장소의 직원에 의한 의료 기록 열람에 의해 삼십육 (36)-개월 R 및 NR 상태를 확인하였다. 모든 환자에 대하여 사전고지 동의서를 입수하였다.
재발 상태, 1차 재발까지의 시간, 결장암 대 직장암, R- 대 L-측 결장, 및 조직 공급원에 의한 계층화 후, 74 사례를 무작위로 훈련용 세트 (n=37; 16R, 21NR) 및 동일한 크기의 시험용 세트 (n=37; 16R, 21NR)로 분할하였다.
맞춤형의 집중식 마이크로어레이를 구성하기 위하여, 맞춤형 384-웰 택맨® 저밀도 어레이 (어플라이드 바이오시스템즈 사, 캘리포니아 포스터 시티 소재)를 사용하는 RT-PCR에 의해, 종양 유전자 발현을 평가하였다. 그것이 하기의 기준들 중 하나 이상을 충족하는지에 기초하여, 417개 암-연관 유전자의 패널을 어레이용으로 예비-선택하였다: (1) 종양생성, 종양 진행 또는 전이와 연관됨; (2) 세포 주기 진행, 혈관형성, 생존 또는 아폽토시스의 핵심 조절 단백질을 코딩함; (3) CRC의 개시 및 진행에 관련됨; (4) CRC의 예후인 것으로 보고되어 있음; (5) CRC 화학요법에 대한 종양 반응을 예보하거나 거기에 영향을 줌; (6) 정상 및 악성 CRC 조직 사이에 차별적으로 발현됨.
NCBI 엔트레즈 뉴클레오티드 데이터베이스를 통하여 접근한 각 유전자 및 공통서열에 대하여 적절한 mRNA 참조 서열 (REFSEQ) 접근 번호를 확인하였다. 어플라이드 바이오시스템즈 사에서 RT-PCR 프라이머 및 프로브를 설계하였다. 앰플리콘 크기는 최소한으로 유지하여, 대부분이 길이 100 염기 미만이었다.
각 사례에 대하여, 독립적인 위장관 병리학자에 의한 H&E 염색 슬라이드상 FFPE 악성 조직의 확인 및 위치지정 후, 별도의 유리 슬라이드에 고정된 상응 미염색 종양 조직을 1회용 스캘펄을 사용하여 무-RNAse 미세원심분리 튜브로 긁어내었다. 크실렌 중에서 조직을 탈-파라핀화한 후, RNA를 추출하고, 리커버올™ 총 핵산 단리 키트 (어플라이드 바이오시스템즈/암비온 사, 텍사스 오스틴 소재)를 사용하여 정제하였다. 나노드롭 1000 UV/Vis 분광광도측정기를 사용하여 260/280 nm의 UV 흡수비를 측정함으로써, RNA 용액의 순도 및 양을 측정하였다. 프라이머로서 무작위 육량체를 사용하는 고성능 cDNA 역전사 키트 (어플라이드 바이오시스템즈 사)를 사용하여, 최소 100 ng의 RNA를 단일 가닥 cDNA로 전사하였다. cDNA는 즉시 RT-PCR에 사용하거나, -80℃에서 저장하였다.
택맨® 맞춤형 어레이 384-웰 미세유동 카드 (어플라이드 바이오시스템즈 사)를 사용하여, 실시간 PCR을 통한 유전자 발현을 검정하였다. 48 웰 당 100 μl의 cDNA (1 ng/μl)를 카드에 적용한 후, 7900HT 속성 실시간 PCR 시스템을 사용하여 2반복으로 모든 검정을 수행하였다. 출력 데이터는 증폭 곡선에서 0.2로 설정된 일정한 역치, 즉 주기 역치 (Ct)에 도달하는 데에 요구되는 PCR 주기의 수로 나타내었다. 5종의 가계 (HK) 유전자를 사용하여 데이터를 표준화함으로써, 각 검정에서의 RNA 완전성 및 양의 잠재적인 기술적 변이성 및 편차에 대하여 보정하였다. 선택된 5종의 HK 유전자 (B2M, GUSB, POLR2L, PSMB6, UBC)는 CRC 및 다른 조직에서 상시 발현되는 것으로 잘 알려져 있는 9종의 후보 유전자들 중 최소 수준의 발현 변이성을 나타내었다. 개별 유전자 발현 복제물의 각 쌍을 일치도에 대하여 검사하고, 각각에 대하여 상관 계수를 생성시켰다. 복제물들을 평균하고, 5종 HK 유전자들의 평균 (Ave. 5HK Ct)으로부터 각 규칙 유전자에 대한 Ct (RG Ct)를 차감함으로써, 생성 데이터를 표준화하였다. Ct 값은 2를 밑으로 하는 대수로 나타내었기 때문에, 역대수를 취함으로써 데이터를 선형화하고, 결과를 100배로 확대하였다. 이에 따라, 데이터의 최종 형태는 하기였다:
유전자 발현 값 = 2( Ave . 5 HK Ct - RG Ct ) × 100.
연구 전체에 있어서, 추출된 RNA 및 RT-PCR 결과의 허용을 위한 최소한의 기준은 하기였다: (1) RNA 농도: ≥ 10 ng/μl; (2) RNA는 ≥ 1.8의 260/280 nm 비를 가질 필요가 있음; (3) 5종 HK 유전자의 평균 발현: ≤ 32.0 Ct; 및 (4) 모든 개별 Ct 값: ≤ 35.
본원에서 기술되는 RT-PCR 검정에 의해 R 및 NR 군들 사이에 차별적인 발현 수준을 나타내는 관심 유전자를 확인하고, 인터넷을 통하여 가용한 U.C.S.C. 게놈 브라우저에 목록화되어 있는 바와 같은 인간 게놈상의 참조 서열 위치, 그리고 인터넷을 통하여 가용한 진뱅크 사에서 입수되는 대표적인 핵산 서열과 함께 표 5에 나타내었다. 확인되는 바와 같은 U.C.S.C. 브라우저 및 진뱅크 사의 서열들은 본원에 참조로 포함된다.
실시예
6: 유전적 프로그래밍을 통한, 결장직장암 재발의 위험성을 측정하기 위한 규칙의 생성
바이오마커 유전자들의 발현 수준에 기초하는 예후 규칙을 진화시키기 위하여, 훈련용 세트 유전자 발현 데이터의 연속 유전적 프로그래밍(GP) 분석을 사용하여, 실시예 5에서 확인된 예후 바이오마커 유전자들을 분석하였다. 하기에 나타낸 이러한 규칙들은 확인 데이터 세트에서 결장직장암 환자가 재발 또는 비-재발을 겪게될지 여부를 예측하는 데에 유용하였다.
확인된 예후 바이오마커 유전자들의 유전적 프로그래밍 분석에서는, 표 5 유전자들의 다양한 조합을 포함한 잠재적 규칙들의 군집을 무작위로 생성시킴으로써, 일련의 후보 규칙들을 산출하였다. 다음에, 각 후보 규칙을 적합성에 대하여 시험하였다.
"재발" 대 "비-재발"로 올바르게 분류된 종양 조직 샘플의 수가 후보 규칙에 있어서의 적합성의 척도로 사용되었다. 충분히 높은 적합성을 가지는 것으로 판단된 후보 규칙이 발견된 경우, 유전적 프로그래밍을 종료하고, 최적합성 후보를 예후 규칙으로 선택하였다. 죵료 기준이 충족되지 않은 경우에는, 최고 적합성을 가지는 후보 규칙들을 교류시켜 새로운 자손 후보 규칙들의 군집을 생성시키고, 더 낮은 적합성을 가지는 것으로 밝혀진 후보 규칙을 폐기하였다.
종료 기준이 충족되어 적합한 적합성을 가지는 하나 이상의 규칙이 발견될 때까지, 유전적 프로그래밍 방법의 추가적인 반복을 수행하였다. 표 5 유전자들의 연속적인 GP 분석 후, 입력 데이터가 재발을 예측하는 예후 서명 규칙을 산출하였다 (표 6 참조).
실시예
7: 재발을 예측하기 위한 예후
GP
규칙의 사용
표 6의 규칙을 사용하여 결장직장암 환자에서 재발을 예측하였다. 미국 2개 장소 및 유럽 2개 장소에서, 86명의 단계 I/II (pT1-4 pN0 M0) 결장암 환자 및 29명의 단계 I (pT1-2, pN0 M0) 직장암 환자에 대하여, 치료 의도의 최초 수술 절제에서 수득된 기록용 포르말린-고정 파라핀-매립 1차 선암종 조직 (저장 중앙값 7년; 4-15년 범위)을 회수하였다. 이들 장소 및 샘플들은 실시예 5 및 6에 대하여 상기한 바와 같이 분자 시험을 생성시키는 데에 사용되었던 샘플들과는 다른 것이었다.
수득된 샘플에는 수술 36개월 이내에 종양이 재발되었던 (R) 환자로부터의 것들 (n=46), 및 수술 후 36개월 이상 동안 비-재발로 확인된 (NR) 환자로부터의 것들 (n=69)이 포함되었다. 어느 환자도 네오아주반트 또는 아주반트 요법을 받지 않았다.
이들 샘플에서, 어플라이드 바이오시스템즈 사로부터 입수된 맞춤형 384-웰 택맨® 저밀도 어레이를 사용하여, 그리고 일련의 엄격한 품질 조절 파라미터들을 충족시킨 RNA를 사용하여, qRT-PCR에 의해 종양 유전자 발현을 평가하였다. 문제의 23개 유전자 각각의 택맨® 검정 번호 및 프로브 길이를 하기 표 7에 나타내었다:
이와 같은 환자 데이터 세트 (V세트)에서 규칙 1 내지 8의 예측 민감성 및 특이성을 분석하고, 결장직장암에 대하여 현행 국립 종합 암 네트워트 (NCCN) 지침을 사용하여 수득된 것과 비교하였다. 단계 I/II CRC (n=115)의 경우, 상기 양분 규칙은 70%의 민감성 및 55%의 특이성으로 32/46명의 R 및 38/69명의 NR V세트 환자를 올바르게 분류하였다. 양성 예측 값 (PPV) 51%, 음성 예측 값 (NPV) 73%, 및 상대적 위험도 (HR) 2.06 (95% CI: 1.1 내지 3.86; p=0.020)으로써, '고위험'으로 간주된 환자들은 '저위험'으로 표지된 환자들에 비해 36개월 이내에 상당히 더 높은 재발 가능성을 가졌다.
반면, NCCN 지침 (버젼 1.2011)은 72%의 민감성 및 42%의 특이성, 45%의 양성 예측 값 및 69%의 음성 예측 값으로써, 이와 같은 군집에서 36-개월 재발 대 비-재발을 구별할 수 없었다. 위험도 비는 1.38 (95% CI: 0.73-2.53, p=0.315)이었다. 분자 시험의 특이성은 NCCN에서의 것에 비해 상당히 더 컸다 (p=0.05).
단계 I 직장암 환자의 경우 (n=29; 13명 재발), 분자 시험의 예후 정확도는 NCCN 지침의 55% 특이성 (16/29)을 능가하는 79%의 특이성 (23/29)을 나타내었다.
본 실시예에서, 예후 바이오마커 유전자들로부터 유도된 예후 규칙이 FFPE 종양 조직에서의 유전자 발현 수준의 유전적 프로그래밍 분석에 의한 결장직장암 재발 및/또는 비-재발의 측정에 중요하며, 3년 이내의 재발에 대하여 고위험성 대 저위험성인 초기 단계 CRC 환자를 현행 NCCN 지침에 비해 더 우수하게 구별할 수 있는 것으로 확인되었다.
실시예
8: 재발을 예측하기 위한 예후
GP
규칙의 사용
상기한 바와 같이, 유전적 프로그래밍을 사용하여 예후 바이오마커 유전자들을 확인하고 (실시예 5), 결장직장암 재발의 위험성을 측정하기 위한 예후 규칙을 생성시켰다 (실시예 6 및 7). 표 5에 목록화되어 있는 예후 바이오마커 유전자들의 발현 수준이 결장직장암 재발에 대하여 고도로 예측성이었기 때문에, 비-GP 분석 방법을 사용하여서도 이들 예후 바이오마커 유전자들의 발현에 기초하는 예후 규칙이 생성될 수 있다는 가설을 세웠다.
다른 분석 방법들의 유용성을 입증하는 것으로써, 분류 및 회귀 나무 (CART) 알고리즘 (문헌 [Freund et al . 1999, The alternating decision tree learning algorithm])을 사용하여, 표 5에 목록화되어 있는 예후 바이오마커 유전자들의 발현으로부터 유도되는 예후 규칙이 생성될 수 있다.
다양한 분석 기술들에 의해 생성되는 예후 규칙에서의 상기 예후 바이오마커 유전자들의 용도를 추가적으로 입증하는 것으로써, 표 5에 목록화되어 있는 유전자들에 대한 발현 데이터, 및 공지의 재발 및 비-재발 시험 데이터를 사용하여 (예를 들어 문헌 [Mocellin et al . 2003 Ann Surg Oncol. 2006 13: 1113-1122] 참조) 지지 벡터 머신이 생성될 수 있다. 계수 및 벡터들에 의해 생성되는 지지 벡터 머신 (SVM)은 분류기구의 확실성을 시험하기 위한 훈련용 데이터 (T세트)에서의 4-중 교차확인을 수행하는 데에 사용된다. 분류기구를 3중으로 훈련시킨 후, 네 번째에 정확도가 시험된다. 분석은 단일 정확도 (%) 및 총 정확도 (4반복에 걸친 평균) (%)로 기록된다. SVM에 의해 개발된 규칙을 사용한 확인 세트 (V세트)의 시험은 기록되는 정확도 (%)를 산출한다.
다양한 분석 기술들에 의해 생성되는 예후 규칙에서의 상기 예후 바이오마커 유전자들의 용도를 추가적으로 입증하는 것으로써, 표 5에 목록화되어 있는 유전자들에 대한 양적 발현 데이터 및 공지의 재발 및 비-재발 시험 데이터를 사용하여 (예를 들어 문헌 [Mocellin et al . 2003 Ann Surg Oncol. 2006 13: 1113-1122] 참조) 지지 벡터 머신이 생성될 수 있다. 계수 및 벡터들에 의해 생성되는 지지 벡터 머신은 분류기구의 확실성을 시험하기 위한 훈련용 데이터 (T세트)에서의 4-중 교차-확인을 수행하는 데에 사용된다. 분류기구를 3중으로 훈련시킨 후, 네 번째에 정확도가 시험된다.
표 5에 목록화되어 있는 예후 바이오마커 유전자들의 고도의 예측력을 추가 입증하는 것으로써, 선형 판별 분석을 사용하여 (예를 들어 문헌 [Marchevsky et al., 2004 JMD, Vol. 6]: [1Estevez et al ., 2004, Eur Clin Nutr 58:449-455] 참조) 표 5에 목록화되어 있는 유전자들의 양적 발현에 기초하여 결장직장암 재발의 가능성을 예측하는 예후 규칙이 생성된다.
선형 판별 (LD) 분석은 샘플을 2개의 군으로 분류하는 데에 각 유전자의 개별 측정치 및 모든 유전자 조합의 계산된 측정치 모두를 사용한다. 각 유전자에 대하여, 군 1 및 군 2 군의 평균 및 표준 편차로부터 비중이 유도된다. 모든 유전자에 비중을 곱하고, 이들 값의 합계가 집합적인 판별 점수로 이어진다. 다음에, 이와 같은 판별 점수는 군 1 및 군 2 군의 집합적 중심값에 비교된다. 이러한 중심값은 각각 모든 군 1 및 군 2 샘플들의 평균이다. 이에 따라, 각 유전자는 전체 예측에 기여한다. 이와 같은 기여는 그 유전자에 대한 군 1과 군 2 샘플들 사이의 상대적인 거리가 클 경우 큰 양 또는 음의 수이며, 상대적인 거리가 작을 경우 작은 수인 비중에 따라 달라진다. 각 미지 샘플에 대한 판별 점수 및 중심값은 미지 샘플이 어느 군에 속하는지에 관하여 0 내지 1 사이의 가능성을 계산하는 데에 사용될 수 있다.
상세한 설명에서 본 발명의 많은 특징 및 장점들이 드러났으므로, 첨부된 청구범위로써 본 발명의 진정한 기술사상 및 영역에 속하는 그와 같은 본 발명의 모든 특징 및 장점들을 포괄하고자 한다. 또한, 수많은 변형 및 변종들이 업계 숙련자에게 쉽게 떠오르게 될 것이므로, 본 발명을 예시 및 기술된 정확한 구성 및 작용으로 제한하는 것은 바람직하지 않으며, 그에 따라 모든 적합한 변형 및 등가물들은 본 발명의 영역에 속하는 것으로 재분류될 수 있다.
[서열 목록]
SEQUENCE LISTING
<110> Worzel, William P
<120> PROGNOSTIC SIGNATURE FOR COLORECTAL CANCER RECURRENCE
<130> 42609.21501
<150> US 61/433,798
<151> 2011-01-18
<160> 23
<170> PatentIn version 3.5
<210> 1
<211> 3435
<212> DNA
<213> Homo sapiens
<400> 1
acagcaacta tgaaataatc gtagtatgag aggcagagat cggggcgaga caatggggat 60
gtgggcgcgg gagccccgtt ccggcttagc agcacctccc agccccgcag aataaaaccg 120
atcgcgcccc ctccgcgcgc gccctccccc gagtgcggag cgggaggagg cggcggcggc 180
cgaggaggag gaggaggagg ccccggagga ggaggcgttg gaggtcgagg cggaggcgga 240
ggaggaggag gccgaggcgc cggaggaggc cgaggcgccg gagcaggagg aggccggccg 300
gaggcggcat gagacgagcg tggcggccgc ggctgctcgg ggccgcgctg gttgcccatt 360
gacagcggcg tctgcagctc gcttcaagat ggccgcttgg ctcgcattca ttttctgctg 420
aacgactttt aactttcatt gtcttttccg cccgcttcga tcgcctcgcg ccggctgctc 480
tttccgggat tttttatcaa gcagaaatgc atcgaacaac gagaatcaag atcactgagc 540
taaatcccca cctgatgtgt gtgctttgtg gagggtactt cattgatgcc acaaccataa 600
tagaatgtct acattccttc tgtaaaacgt gtattgttcg ttacctggag accagcaagt 660
attgtcctat ttgtgatgtc caagttcaca agaccagacc actactgaat ataaggtcag 720
ataaaactct ccaagatatt gtatacaaat tagttccagg gcttttcaaa aatgaaatga 780
agagaagaag ggatttttat gcagctcatc cttctgctga tgctgccaat ggctctaatg 840
aagatagagg agaggttgca gatgaagata agagaattat aactgatgat gagataataa 900
gcttatccat tgaattcttt gaccagaaca gattggatcg gaaagtaaac aaagacaaag 960
agaaatctaa ggaggaggtg aatgataaaa gatacttacg atgcccagca gcaatgactg 1020
tgatgcactt aagaaagttt ctcagaagta aaatggacat acctaatact ttccagattg 1080
atgtcatgta tgaggaggaa cctttaaagg attattatac actaatggat attgcctaca 1140
tttatacctg gagaaggaat ggtccacttc cattgaaata cagagttcga cctacttgta 1200
aaagaatgaa gatcagtcac cagagagatg gactgacaaa tgctggagaa ctggaaagtg 1260
actctgggag tgacaaggcc aacagcccag caggaggtat tccctccacc tcttcttgtt 1320
tgcctagccc cagtactcca gtgcagtctc ctcatccaca gtttcctcac atttccagta 1380
ctatgaatgg aaccagcaac agccccagcg gtaaccacca atcttctttt gccaatagac 1440
ctcgaaaatc atcagtaaat gggtcatcag caacttcttc tggttgatac ctgagactgt 1500
taaggaaaaa aattttaaac ccctgattta tatagatatc ttcatgccat tacagctttc 1560
tagatgctaa tacatgtgac tatcgtccaa tttgctttct tttgtagtga cattaaattt 1620
ggctataaaa gatggactac atgtgatact cctatggacg ttaattgaaa agaaagattg 1680
ttgttataaa gaattggttt cttggaaagc aggcaagact ttttctctgt gttaggaaag 1740
atgggaaatg gtttctgtaa ccattgtttg gatttggaag tactctgcag tggacataag 1800
cattgggcca tagtttgtta atctcaacta acgcctacat tacattctcc ttgatcgttc 1860
ttgttattac gctgttttgt gaacctgtag aaaacaagtg ctttttatct tgaaattcaa 1920
ccaacggaaa gaatatgcat agaataatgc attctatgta gccatgtcac tgtgaataac 1980
gatttcttgc atatttagcc attttgattc ctgtttgatt tatacttctc tgttgctacg 2040
caaaaccgat caaagaaaag tgaacttcag ttttacaatc tgtatgccta aaagcgggta 2100
ctaccgttta ttttactgac ttgtttaaat gattcgcttt tgtaagaatc agatggcatt 2160
atgcttgttg tacaatgcca tattggtata tgacataaca ggaaacagta ttgtatgata 2220
tatttataaa tgctataaag aaatattgtg tttcatgcat tcagaaatga ttgttaaaat 2280
tctcccaact ggttcgacct ttgcagatac ccataaccta tgttgagcct tgcttaccag 2340
caaagaatat ttttaatgtg gatatctaat tctaaagtct gttccattag aagcaattgg 2400
cacatctttc tatactttat atacttttct ccagtaatac atgtttactt taaagattgt 2460
tgcagtgaag aaaaaccttt aactgagaaa tatggaaacc gtcttaattt tccattggct 2520
atgatggaat taatattgta ttttaaaaat gcatattgat cactataatt ctaaaacaat 2580
tttttaaata aaccagcagg ttgctaaaag aaggcatttt atctaaagtt attttaatag 2640
gtggtatagc agtaatttta aatttaagag ttgcttttac agttaacaat ggaatatgcc 2700
ttctctgcta tgtctgaaaa tagaagctat ttattatgag cttctacagg tatttttaaa 2760
tagagcaagc atgttgaatt taaaatatga ataaccccac ccaacaattt tcagtttatt 2820
ttttgctttg gtcgaacttg gtgtgtgttc atcacccatc agttatttgt gagggtgttt 2880
attctatatg aatattgttt catgtttgta tgggaaaatt gtagctaaac atttcattgt 2940
ccccagtctg caaaagaagc acaattctat tgctttgtct tgcttatagt cattaaatca 3000
ttacttttac atatattgct gttacttctg ctttctttaa aaatatagta aaggatgttt 3060
tatgaagtca caagatacat atatttttat tttgacctaa atttgtacag tcccattgta 3120
agtgttgttt ctaattatag atgtaaaatg aaatttcatt tgtaattgga aaaaatccaa 3180
taaaaaggat attcatttag aaaatagcta agatctttaa taaaaatttg atatgaaaag 3240
cacaatgtgc agaagttatg gaaaacctat agaggattac aacaggtaaa cgttaaagag 3300
aatacattgc tgacttatag tgatgtggct aagaagtaca tgctttgttg taaaattgct 3360
tgaaagccca ttgaaagatg tatctgttta tttacagtct ttgaagtaaa agttaccaat 3420
gtttgccaat aaaaa 3435
<210> 2
<211> 5989
<212> DNA
<213> Homo sapiens
<400> 2
gcgtcccggg tccccgcgcc gcgccgcgac ctgcagaccc cgccgccgcg ctcgggcccg 60
tctcccacgc ccccgccgcc ccgcgcgccc aactccgccg gccgccccgc cccgccccgc 120
gcgctccaga cccccggggc ggctgccggg agagatgctg gaagaaactt cttaaatgac 180
cgcgtctggc tggccgtgga gcctttctgg gttggggaga ggaaaggaaa gtggaaaaaa 240
cctgagaact tcctgatctc tctcgctgtg agacatgtct gagactcctg ctcagtgtag 300
cattaagcag gaacgaattt catatacacc tccagagagc ccagtgccga gttacgcttc 360
ctcgacgcca cttcatgttc cagtgcctcg agcgctcagg atggaggaag actcgatccg 420
cctgcctgcg cacctgcgct tgcagccaat ttactggagc agggatgacg tagcccagtg 480
gctcaagtgg gctgaaaatg agttttcttt aaggccaatt gacagcaaca cgtttgaaat 540
gaatggcaaa gctctcctgc tgctgaccaa agaggacttt cgctatcgat ctcctcattc 600
aggtgatgtg ctctatgaac tccttcagca tattctgaag cagaggaaac ctcggattct 660
tttttcacca ttcttccacc ctggaaactc tatacacaca cagccggagg tcatactgca 720
tcagaaccat gaagaagata actgtgtcca gaggaccccc aggccatccg tggataatgt 780
gcaccataac cctcccacca ttgaactgtt gcaccgctcc aggtcaccta tcacgacaaa 840
tcaccggcct tctcctgacc ccgagcagcg gcccctccgg tcccccctgg acaacatgat 900
ccgccgcctc tccccggctg agagagctca gggacccagg ccgcaccagg agaacaacca 960
ccaggagtcc taccctctgt cagtgtctcc catggagaat aatcactgcc cagcgtcctc 1020
cgagtcccac ccgaagccat ccagcccccg gcaggagagc acacgcgtga tccagctgat 1080
gcccagcccc atcatgcacc ctctgatcct gaacccccgg cactccgtgg atttcaaaca 1140
gtccaggctc tccgaggacg ggctgcatag ggaagggaag cccatcaacc tctctcatcg 1200
ggaagacctg gcttacatga accacatcat ggtctctgtc tccccgcctg aagagcacgc 1260
catgcccatt gggagaatag cagactgtag actgctttgg gattacgtct atcagttgct 1320
ttctgacagc cggtacgaaa acttcatccg atgggaggac aaagaatcca aaatattccg 1380
gatagtggat cccaacggac tggctcgact gtggggaaac cataagaaca gaacaaacat 1440
gacctatgag aaaatgtcca gagccctgcg ccactactac aaactaaaca ttatcaggaa 1500
ggagccagga caaaggcttt tgttcaggtt tatgaaaacc ccagatgaaa tcatgagtgg 1560
ccgaacagac cgtctggagc acctagagtc ccaggagctg gatgaacaaa tataccaaga 1620
agatgaatgc tgaaggaacc aacagtccac ctcagcgggc cagcagccca gggaacccct 1680
gcccaccagg attgctggaa gtgtgacgga gcaggcgggc tgaggagagt ggaaaaggaa 1740
gcgacccaga aatggcaggg acacttctct tgcagaccaa gagggaccct ggagcacctt 1800
agacaaacta cccagcacag gcggggctgg aattctggcg gagggcatga gcctgggact 1860
ccatgtcacg tttccttctg atttggaatc tctccatctg taattcctca ccctcaccct 1920
tccaccgttg ttagtatcat ggtgtttttg tttttgtttt tgttttaaga acctgcagtt 1980
tgactcttca tcgttcatct aggggaagac atctgatgtt gttttcctat ggaaatatat 2040
atctattata tatatatttt ttgcaaatct cacaaagtgc ggcaagccca gctggtcagg 2100
aaagagaata cttgcagagg ggttcaggtt cctctttttc ctgccacgtg gatcaggtct 2160
gttcctgtta ctgttgggtc ttggctgaaa aaaaaaaatg cttttaaaaa agataaaatg 2220
aaaaggagag ctctcttttt ctctctcttg ctctgttctt cccttggtcc cctctgtcct 2280
cccgccctgc ctgcagttga gattcagatg ccttctgaca gagttcagcc tcttggagag 2340
tcttggggat tgttggcacc taaacagaat cagtgacccg ggtgctttgt ggccagcagc 2400
acagaatcaa acccgcatcc cagcattggg ccacccatct gagggaggcc aaaatcatca 2460
cagatgctgc tgtgctgcag acagatacat gctagtccag agagccgccc ctgagatggc 2520
tgtgagaacc atgtgtctaa ggcgtaagat aaggatggaa ggctgtccaa gttatttgga 2580
aggcctcggc agcttgggat tagcttggga gcgcagcgct gcaaagtgga aaatatgaaa 2640
agaccacaca ggcccagcag tccagaaact gggcaaaaat attctgcagt ggggatttat 2700
ttttccaaag caggtaacag aggctagtga gaaagaaaag ctcctctctg ctccattcca 2760
aaggccatct tgtggtcagt ttcatgccct cacctgattt tttttttttt tttttttttt 2820
caattcctaa ccttttttaa agtttcctgg tctccactgg acacagagct ttggagacgg 2880
aggatcccag agggcagtct cagttgcaat cagtgtgtgc ccagcctggg cagacaggaa 2940
attcctcgga tacattattt tttctttctt tcatagctgt gtctcagaaa ggacccattt 3000
gtggctcttt ttcacctcaa aataagatcg atggtatctt gtaaaatgag ggtagtgcca 3060
cttcttagta tttttgaaag ctgttttaga tttttttttt ttttcctttt ctagccatct 3120
aaattgactc ttccaatata ggtctcagaa atccaatatt tggagtacaa tttcttttaa 3180
tccagattac acctgcctta caaagcaccc cctccttgtt cccctctgtt tcctctactc 3240
agttggggga gaaactcaca gctcctccgg gatacatatg tgccctcagc agcagctccc 3300
aggtgaagtt accagacccc tgggcttctc cccagctttt tctgagttga gtcagacatg 3360
tagagtttgg gtcacacagg caagaggaat tttccctcgg ccttactgac aaggacacca 3420
acctagggtg caaacagatg gactatggtt caaggacact ggaattgagg agctgatcaa 3480
ggctctcttc agccttgctc tgtccctgcc tcttatcaga gcacaggtag acacacgggc 3540
atagccagcc cactcctact gtcacaggcg ccccaccatt caaccttccg ggaggtcagg 3600
gaccttctat atgaggcgag tgggtctcag tctgcttgaa tggtgatgag attctgctgg 3660
atctcagcac gctgcaggtg tcttttgaga gcattcagta ggacatggtg atccctattt 3720
cagcctctaa gatgactggt attctatctg aaatgcagag attaagccaa atacctgatg 3780
tattgtgaaa gccactgatt ttaagaatgg agagaaaggg attttttact gcatccctct 3840
gtatgaatat gaaatcagag accagggcat gatgttgcta ggattagagc ctctcagtct 3900
ggcctcttca cccaagtgca agaactcagt ctcttactgt tcaaagaatc ttaacagttg 3960
aattatggag ggaaattccc ttttgcccca agcatttcta tatttaaagc aatatcccag 4020
gagaatatgt tagacttagg atgatacctt cagccacttg aagaagaaat agaaggcgct 4080
cattccaata tagtctttat ttcccattca gatacaggtt gagcatccct aatctgaaca 4140
gttaaaaccc ccaaatgccc caaaatccaa accttcctga acgctatgac accatgagtg 4200
gaaaattcca cacctaacaa acacatttgc tttcttatgg ttcaatgtac acaaactgtt 4260
ttatatagaa aatgatttca aatatcataa aattaccttc aggctatgtg tataaagtat 4320
atatgagcca taaatgaatt ttgtgtttag actttgtgtc catccccaag atctctcatt 4380
ttatatatat atatatatat atatatatat atatatatat atatatatac acacacacac 4440
acatacacaa atattccagg atacaaaaaa aaacatttaa aaatccgaga cccagaacac 4500
ttctggtccc aagcatttca gataagggat atcaatctgt actaccaata aggatttcgt 4560
aattccccta actgcaaatg tcctcttcat ttgttcttta tgagaaaacc cgggtagtgc 4620
cagcacctgg atacagtatt tacaccctgc agaccctaaa gatttcagat tcagttagca 4680
aaccttgatg aagcacctgc tggacactga gggacccaaa gctcaatcag ccataatccc 4740
tgctttcaga gtttatattg tacctgccta atccacccgg cgtgactcat ttcaacacta 4800
agtactaggg gtgttgtcag gagacaaatc tgaagtcagg agaggaaaat gcaaaggagc 4860
cctgccgtgt gatggatgtg cattctcact tgggtcttga agttctcatt cctacatctc 4920
aagctagcca ggcagtctcc tctctatcag aagaaagcac tggtaattgg ctagactggc 4980
tatgttgaag gtaacatgaa ctctaagatc ttgacccagg gcgacttggt tttgcttaag 5040
gtggcatcac caatgttcca aatcctttag ggagatgagg gtatccccac agaaaaagag 5100
gaataataga ccaatggatt ttctcctttc accagtatgt ttggaaccct ctgatccaat 5160
gtcttttgat actgatctct tgtccaaatg agaatgtcgc tttagctgaa attcaaatgg 5220
ctgtgacaat ttaccgaaat gatgaagtaa ccaccattcc cacctttcac tgcctaggct 5280
ccaagtctga atacattttt gaaataggaa ctcccttttg caaaaaagaa acctgggtgt 5340
cagggaggtg aagtgacttg ccctaggagc agacagcatg ccaagaatgg aattaggctc 5400
aggatccagc ctgggctcac cctgtgtggc tcattcccac ccaggaaact gaagataaaa 5460
gatttgggaa aacacaccaa gaaaaagggg cagttttctt tgcccaagca tttggtgcta 5520
gttagaggct gttcactctc tcctgctcct cttcggagta gaaataaagg ctgtgacaca 5580
aggaagccag tggggtggga gggaggcacc ataatccctc cctaaaaccc acagaagact 5640
aacctgatac tcttttgacc caactgcatc aacactaaac agctgcagac cccctgaatc 5700
tttcacacat gccaagtgaa cattcttgat gatttctctt tgtgaccgca accacctgca 5760
aaccagaacg actctagaat ttccttcccc gccccccttt ttgtttagtt tctaatctct 5820
tgtttatgag gtgtggggtt tataagggac tgaatcaaat gaatgtaaca aaaaagaaaa 5880
aaaaaacaaa aaaaaatgcc ttttctcagg gccagtgagt tgcaaataat ttttaaagaa 5940
aagcctataa ttacatcatc tcaataaatt ttttataaaa aaaaaaaaa 5989
<210> 3
<211> 2753
<212> DNA
<213> Homo sapiens
<400> 3
gagcgcagag cggtttggtc gttcgttggg cggtgctggt ttttcgctcg tcgactgcgg 60
ctcttcctcg ggcagcggaa gcggcgcggc ggtcggagaa gtggcctaaa acttcggcgt 120
tgggtgaaag aaaatggccc gaaccaagca gactgctcgt aagtccaccg gtgggaaagc 180
cccccgcaaa cagctggcca cgaaagccgc caggaaaagc gctccctcta ccggcggggt 240
gaagaagcct catcgctaca ggcccgggac cgtggcgctt cgagagattc gtcgttatca 300
gaagtcgacc gagctgctca tccggaagct gcccttccag aggttggtga gggagatcgc 360
gcaggatttc aaaaccgacc tgaggtttca gagcgcagcc atcggtgcgc tgcaggaggc 420
tagcgaagcg tacctggtgg gtctgttcga agataccaac ctgtgtgcca tccacgctaa 480
gagagtcacc atcatgccca aagacatcca gttggctcgc cggatacggg gagagagagc 540
ttaagtgaag gcagttttta tggcgttttg tagtaaattc tgtaaaatac tttggtttaa 600
tttgtgactt tttttgtaag aaattgttta taatatgttg catttgtact taagtcattc 660
catctttcac tcaggatgaa tgcgaaaagt gactgttcac agacctcagt gatgtgagca 720
ctgttgctca ggagtgacaa gttgctaata tgcagaaggg atgggtgata cttcttgctt 780
ctcatgatgc atgtttctgt atgttaatga cttgttgggt agctattaag gtactagagt 840
tgataaatgt gtacagggtc cttttgcaat aaaactggtt atgacttgat ccaagtgttt 900
aacaattggg gctgttaagt ctgaccatac atcactgtga tagaatgtgg gctttttcaa 960
gggtgaagat acaagtctta accacagtgt aacttacagt ttcctttaaa aaaaaaaaaa 1020
gtaaacctgg cagctataga atacactatg tgcatttata atagctattt tatatattgt 1080
agtatcaaca tttttaaatt aaatgtttta cattcacaag tggtggggag tcttgtcatt 1140
aaggtgtgtg taatttagag tccagttggt tttcttctga ctgcacttgt tctcatagta 1200
gtaaaatgct atgcgcattt ataccttgca taagtcctca ttctaccaca tgttaaccct 1260
ctagctgata atgcaaacac taactggggg attttattta taagggctct agaaaaaacg 1320
agttattcac accagcatca tcttaactaa cattctgaac tagttagtgc agcttttcat 1380
tgtgttgtgt ggttggtctc ataactaggt tgagtttttc tcctctgctg aggaaacagt 1440
accgaagttc tttttcttgt ggcatttgta ttataaaaac ttggtgtggg ggaggagcac 1500
aaaactccag cccactgaac ctctgccaat taagatggtg ttgggttagg ttacatctgg 1560
ttactgtcct gggaaaatca tttttataga gatggccttc caagtggttt taaaatttac 1620
tgaagttttt aggtcaatta tgtatgttga ctaaatttac aaataaactt gtttatccaa 1680
ctaagtgtcc aaaacctaaa ttgaatgtac taagttttca catgtcccat tatctaggtc 1740
cttgtatact aatgttttga acttagatca tttcaggtgt tgtttggtgg ataaaggaac 1800
cttttattta taaagatact gtagaaagca tgtgaacagc tctctgcttg attaagatgc 1860
cataatagtg ctgtatttgc agtgtgggct aagacaaagt atattaataa gcttttcagc 1920
ccccccactc ccgttccgta gtgtagaagc ccacaggtgt agaactcagt cttaaacttc 1980
agtatgaaac cagtttcctt gtgcgatgat ggccactaaa gcatagtacg tggatgtcag 2040
tgagacagca tgagagccag cagtcatcaa agcgttccac gtttgaagtt agcaactgct 2100
taaagttatg ccctattaaa attgctttct caaaagtttg ggttagtttc aaatgtgata 2160
ttttggaggg aaggtaaagt aggtatcttt caggtcgtga taatgagctc ctatgaaagg 2220
atgcaatata atgacccgct tttctagaaa gttcataatc agctctggaa caagcacact 2280
tgattcctca ctgtgcttca gaatgagatt aagatcagat gttggaacgt gctatgctgt 2340
agcgtgtctg gaaacaaagt acacaaacct ggctacggtg atgagttagc ttctgcttac 2400
tacctgtgac aacccaagtg ggtgacacta gtgaaccttc tccagtctgc aggctggcat 2460
agaaggctct tagattatat tgggcagctt gcaatctgcc gaagcagtga cttgcatttc 2520
cacacttggc ttgagcactc aacccagaag gcgaagatag cttttggttg taggcggctt 2580
cctgtatggg atatccctcg gtaagggtaa aggagcagag gcaaaggaga aaagcagaag 2640
ttgcagctga tgcaggtatc ctatgccctt gatggatgag actaaaataa aatttttgaa 2700
gttaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 2753
<210> 4
<211> 672
<212> DNA
<213> Homo sapiens
<400> 4
gagagagagc gagagaacta gtctcgagtt tttttttttt tttttttttt tttttttttt 60
tttttttttt tttccagccc cggtaccgga ccctgcagcc gcagagatgt tgatgcctaa 120
aaaaaaccgg attgccattt atgaactcct ttttaaggag ggagtcatgg tggccaagaa 180
ggatgtccac atgcctaagc acccggagct ggcagacaag aatgtgccca accttcatgt 240
catgaaggcc atgcagtctc tcaagtcccg aggctacgtg aaggaacagt ttgcctggag 300
acatttctac tggtacctta ccaatgaggg tatccagtat ctccgtgatt accttcatct 360
gcccccggag attgtgcctg ccaccctacg ccgtagccgt ccagagactg gcaggcctcg 420
gcctaaaggt ctggagggtg agcgacctgc gagactcaca agaggggaag ctgacagaga 480
tacctacaga cggagtgctg tgccacctgg tgccgacaag aaagccgagg ctggggctgg 540
gtcagcaacc gaattccagt ttagaggcgg atttggtcgt ggacgtggtc agccacctca 600
gtaaaattgg agaggattct tttgcattga ataaacttac agccaaaaaa ccttaaaaaa 660
aaaaaaaaaa aa 672
<210> 5
<211> 3677
<212> DNA
<213> Homo sapiens
<400> 5
tcgcggaggc ttggggcagc cgggtagctc ggaggtcgtg gcgctggggg ctagcaccag 60
cgctctgtcg ggaggcgcag cggttaggtg gaccggtcag cggactcacc ggccagggcg 120
ctcggtgctg gaatttgata ttcattgatc cgggttttat ccctcttctt ttttcttaaa 180
catttttttt taaaactgta ttgtttctcg ttttaattta tttttgcttg ccattcccca 240
cttgaatcgg gccgacggct tggggagatt gctctacttc cccaaatcac tgtggatttt 300
ggaaaccagc agaaagagga aagaggtagc aagagctcca gagagaagtc gaggaagaga 360
gagacggggt cagagagagc gcgcgggcgt gcgagcagcg aaagcgacag gggcaaagtg 420
agtgacctgc ttttgggggt gaccgccgga gcgcggcgtg agccctcccc cttgggatcc 480
cgcagctgac cagtcgcgct gacggacaga cagacagaca ccgcccccag ccccagctac 540
cacctcctcc ccggccggcg gcggacagtg gacgcggcgg cgagccgcgg gcaggggccg 600
gagcccgcgc ccggaggcgg ggtggagggg gtcggggctc gcggcgtcgc actgaaactt 660
ttcgtccaac ttctgggctg ttctcgcttc ggaggagccg tggtccgcgc gggggaagcc 720
gagccgagcg gagccgcgag aagtgctagc tcgggccggg aggagccgca gccggaggag 780
ggggaggagg aagaagagaa ggaagaggag agggggccgc agtggcgact cggcgctcgg 840
aagccgggct catggacggg tgaggcggcg gtgtgcgcag acagtgctcc agccgcgcgc 900
gctccccagg ccctggcccg ggcctcgggc cggggaggaa gagtagctcg ccgaggcgcc 960
gaggagagcg ggccgcccca cagcccgagc cggagaggga gcgcgagccg cgccggcccc 1020
ggtcgggcct ccgaaaccat gaactttctg ctgtcttggg tgcattggag ccttgccttg 1080
ctgctctacc tccaccatgc caagtggtcc caggctgcac ccatggcaga aggaggaggg 1140
cagaatcatc acgaagtggt gaagttcatg gatgtctatc agcgcagcta ctgccatcca 1200
atcgagaccc tggtggacat cttccaggag taccctgatg agatcgagta catcttcaag 1260
ccatcctgtg tgcccctgat gcgatgcggg ggctgctgca atgacgaggg cctggagtgt 1320
gtgcccactg aggagtccaa catcaccatg cagattatgc ggatcaaacc tcaccaaggc 1380
cagcacatag gagagatgag cttcctacag cacaacaaat gtgaatgcag accaaagaaa 1440
gatagagcaa gacaagaaaa aaaatcagtt cgaggaaagg gaaaggggca aaaacgaaag 1500
cgcaagaaat cccggtataa gtcctggagc gtgtacgttg gtgcccgctg ctgtctaatg 1560
ccctggagcc tccctggccc ccatccctgt gggccttgct cagagcggag aaagcatttg 1620
tttgtacaag atccgcagac gtgtaaatgt tcctgcaaaa acacagactc gcgttgcaag 1680
gcgaggcagc ttgagttaaa cgaacgtact tgcagatgtg acaagccgag gcggtgagcc 1740
gggcaggagg aaggagcctc cctcagggtt tcgggaacca gatctctcac caggaaagac 1800
tgatacagaa cgatcgatac agaaaccacg ctgccgccac cacaccatca ccatcgacag 1860
aacagtcctt aatccagaaa cctgaaatga aggaagagga gactctgcgc agagcacttt 1920
gggtccggag ggcgagactc cggcggaagc attcccgggc gggtgaccca gcacggtccc 1980
tcttggaatt ggattcgcca ttttattttt cttgctgcta aatcaccgag cccggaagat 2040
tagagagttt tatttctggg attcctgtag acacacccac ccacatacat acatttatat 2100
atatatatat tatatatata taaaaataaa tatctctatt ttatatatat aaaatatata 2160
tattcttttt ttaaattaac agtgctaatg ttattggtgt cttcactgga tgtatttgac 2220
tgctgtggac ttgagttggg aggggaatgt tcccactcag atcctgacag ggaagaggag 2280
gagatgagag actctggcat gatctttttt ttgtcccact tggtggggcc agggtcctct 2340
cccctgccca ggaatgtgca aggccagggc atgggggcaa atatgaccca gttttgggaa 2400
caccgacaaa cccagccctg gcgctgagcc tctctacccc aggtcagacg gacagaaaga 2460
cagatcacag gtacagggat gaggacaccg gctctgacca ggagtttggg gagcttcagg 2520
acattgctgt gctttgggga ttccctccac atgctgcacg cgcatctcgc ccccaggggc 2580
actgcctgga agattcagga gcctgggcgg ccttcgctta ctctcacctg cttctgagtt 2640
gcccaggaga ccactggcag atgtcccggc gaagagaaga gacacattgt tggaagaagc 2700
agcccatgac agctcccctt cctgggactc gccctcatcc tcttcctgct ccccttcctg 2760
gggtgcagcc taaaaggacc tatgtcctca caccattgaa accactagtt ctgtcccccc 2820
aggagacctg gttgtgtgtg tgtgagtggt tgaccttcct ccatcccctg gtccttccct 2880
tcccttcccg aggcacagag agacagggca ggatccacgt gcccattgtg gaggcagaga 2940
aaagagaaag tgttttatat acggtactta tttaatatcc ctttttaatt agaaattaaa 3000
acagttaatt taattaaaga gtagggtttt ttttcagtat tcttggttaa tatttaattt 3060
caactattta tgagatgtat cttttgctct ctcttgctct cttatttgta ccggtttttg 3120
tatataaaat tcatgtttcc aatctctctc tccctgatcg gtgacagtca ctagcttatc 3180
ttgaacagat atttaatttt gctaacactc agctctgccc tccccgatcc cctggctccc 3240
cagcacacat tcctttgaaa taaggtttca atatacatct acatactata tatatatttg 3300
gcaacttgta tttgtgtgta tatatatata tatatgttta tgtatatatg tgattctgat 3360
aaaatagaca ttgctattct gttttttata tgtaaaaaca aaacaagaaa aaatagagaa 3420
ttctacatac taaatctctc tcctttttta attttaatat ttgttatcat ttatttattg 3480
gtgctactgt ttatccgtaa taattgtggg gaaaagatat taacatcacg tctttgtctc 3540
tagtgcagtt tttcgagata ttccgtagta catatttatt tttaaacaac gacaaagaaa 3600
tacagatata tcttaaaaaa aaaaaagcat tttgtattaa agaatttaat tctgatctca 3660
aaaaaaaaaa aaaaaaa 3677
<210> 6
<211> 2729
<212> DNA
<213> Homo sapiens
<400> 6
ggcggccgag caccgagcgc tgggcaccgg gcaccgagcg gcggcggcac gcgaggcccg 60
gccccgagca gcgcccccgc ccgccgcggc ctccagcccg gccccgccca gcgccggccc 120
gcggggatgc ggagcggcgg gcgccggagg ccgcggcccg gctaggcccg cgctcgcgcc 180
cggacgcggc ggcccgaggc tgtggccagg ccagctgggc tcggggagcg ccagcctgag 240
aggagcgcgt gagcgtcgcg ggagcctcgg gcaccatgag cgacgtggct attgtgaagg 300
agggttggct gcacaaacga ggggagtaca tcaagacctg gcggccacgc tacttcctcc 360
tcaagaatga tggcaccttc attggctaca aggagcggcc gcaggatgtg gaccaacgtg 420
aggctcccct caacaacttc tctgtggcgc agtgccagct gatgaagacg gagcggcccc 480
ggcccaacac cttcatcatc cgctgcctgc agtggaccac tgtcatcgaa cgcaccttcc 540
atgtggagac tcctgaggag cgggaggagt ggacaaccgc catccagact gtggctgacg 600
gcctcaagaa gcaggaggag gaggagatgg acttccggtc gggctcaccc agtgacaact 660
caggggctga agagatggag gtgtccctgg ccaagcccaa gcaccgcgtg accatgaacg 720
agtttgagta cctgaagctg ctgggcaagg gcactttcgg caaggtgatc ctggtgaagg 780
agaaggccac aggccgctac tacgccatga agatcctcaa gaaggaagtc atcgtggcca 840
aggacgaggt ggcccacaca ctcaccgaga accgcgtcct gcagaactcc aggcacccct 900
tcctcacagc cctgaagtac tctttccaga cccacgaccg cctctgcttt gtcatggagt 960
acgccaacgg gggcgagctg ttcttccacc tgtcccggga gcgtgtgttc tccgaggacc 1020
gggcccgctt ctatggcgct gagattgtgt cagccctgga ctacctgcac tcggagaaga 1080
acgtggtgta ccgggacctc aagctggaga acctcatgct ggacaaggac gggcacatta 1140
agatcacaga cttcgggctg tgcaaggagg ggatcaagga cggtgccacc atgaagacct 1200
tttgcggcac acctgagtac ctggcccccg aggtgctgga ggacaatgac tacggccgtg 1260
cagtggactg gtgggggctg ggcgtggtca tgtacgagat gatgtgcggt cgcctgccct 1320
tctacaacca ggaccatgag aagctttttg agctcatcct catggaggag atccgcttcc 1380
cgcgcacgct tggtcccgag gccaagtcct tgctttcagg gctgctcaag aaggacccca 1440
agcagaggct tggcgggggc tccgaggacg ccaaggagat catgcagcat cgcttctttg 1500
ccggtatcgt gtggcagcac gtgtacgaga agaagctcag cccacccttc aagccccagg 1560
tcacgtcgga gactgacacc aggtattttg atgaggagtt cacggcccag atgatcacca 1620
tcacaccacc tgaccaagat gacagcatgg agtgtgtgga cagcgagcgc aggccccact 1680
tcccccagtt ctcctactcg gccagcggca cggcctgagg cggcggtgga ctgcgctgga 1740
cgatagcttg gagggatgga gaggcggcct cgtgccatga tctgtattta atggttttta 1800
tttctcgggt gcatttgaga gaagccacgc tgtcctctcg agcccagatg gaaagacgtt 1860
tttgtgctgt gggcagcacc ctcccccgca gcggggtagg gaagaaaact atcctgcggg 1920
ttttaattta tttcatccag tttgttctcc gggtgtggcc tcagccctca gaacaatccg 1980
attcacgtag ggaaatgtta aggacttctg cagctatgcg caatgtggca ttggggggcc 2040
gggcaggtcc tgcccatgtg tcccctcact ctgtcagcca gccgccctgg gctgtctgtc 2100
accagctatc tgtcatctct ctggggccct gggcctcagt tcaacctggt ggcaccagat 2160
gcaacctcac tatggtatgc tggccagcac cctctcctgg gggtggcagg cacacagcag 2220
ccccccagca ctaaggccgt gtctctgagg acgtcatcgg aggctgggcc cctgggatgg 2280
gaccagggat gggggatggg ccagggttta cccagtggga cagaggagca aggtttaaat 2340
ttgttattgt gtattatgtt gttcaaatgc attttggggg tttttaatct ttgtgacagg 2400
aaagccctcc cccttcccct tctgtgtcac agttcttggt gactgtccca ccgggagcct 2460
ccccctcaga tgatctctcc acggtagcac ttgacctttt cgacgcttaa cctttccgct 2520
gtcgccccag gccctccctg actccctgtg ggggtggcca tccctgggcc cctccacgcc 2580
tcctggccag acgctgccgc tgccgctgca ccacggcgtt tttttacaac attcaacttt 2640
agtattttta ctattataat ataatatgga accttccctc caaattcttc aataaaagtt 2700
gcttttcaaa aaaaaaaaaa aaaaaaaaa 2729
<210> 7
<211> 1680
<212> DNA
<213> Homo sapiens
<400> 7
gagacggcgg cggctgtagc ggcgtgacag gagccccatg gcacctgccc agccccacct 60
cagcccatct tgacaaaatc taaggctcca tggagccacc acggggcccc cctgccaatg 120
gggccgagcc atcccgggca gtgggcaccg tcaaagtata cctgcccaac aagcaacgca 180
cggtggtgac tgtccgggat ggcatgagtg tctacgactc tctagacaag gccctgaagg 240
tgcggggtct aaatcaggac tgctgtgtgg tctaccgact catcaaggga cgaaagacgg 300
tcactgcctg ggacacagcc attgctcccc tggatggcga ggagctcatt gtcgaggtcc 360
ttgaagatgt cccgctgacc atgcacaatt ttgtacggaa gaccttcttc agcctggcgt 420
tctgtgactt ctgccttaag tttctgttcc atggcttccg ttgccaaacc tgtggctaca 480
agttccacca gcattgttcc tccaaggtcc ccacagtctg tgttgacatg agtaccaacc 540
gccaacagcc ctcaaggttc taccacagtg tccaggattt gtccggaggc tccagacagc 600
atgaggctcc ctcgaaccgc cccctgaatg agttgctaac cccccagggt cccagccccc 660
gcacccagca ctgtgacccg gagcacttcc ccttccctgc cccagccaat gcccccctac 720
agcgcatccg ctccacgtcc actcccaacg tccatatggt cagcaccacg gcccccatgg 780
actccaacct catccagctc actggccaga gtttcagcac tgatgctgcc ggtagtagag 840
gaggtagtga tggaaccccc cgggggagcc ccagcccagc cagcgtgtcc tcggggagga 900
agtccccaca ttccaagtca ccagcagagc agcgcgagcg gaagtccttg gccgatgaca 960
agaagaaagt gaagaacctg gggtaccggg actcaggcta ttactgggag gtaccaccca 1020
gtgaggtgca gctgctgaag aggatcggga cgggctcgtt tggcaccgtg tttcgagggc 1080
ggtggcatgg cgatgtggcc gtgaaggtgc tcaaggtgtc ccagcccaca gctgagcagg 1140
cccaggcttt caagaatgag atgcaggtgc tcaggaagac gcgacatgtc aacatcttgc 1200
tgtttatggg cttcatgacc cggccgggat ttgccatcat cacacagtgg tgtgagggct 1260
ccagcctcta ccatcacctg catgtggccg acacacgctt cgacatggtc cagctcatcg 1320
acgtggcccg gcagactgcc cagggcatgg actacctcca tgccaagaac atcatccacc 1380
gagatctcaa gtctaacaac atcttcctac atgaggggct cacggtgaag atcggtgact 1440
ttggcttggc cacagtgaag actcgatgga gcggggccca gcccttggag cagccctcag 1500
gatctgtgct gtggatggca gctgaggtga tccgtatgca ggacccgaac ccctacagct 1560
tccagtcaga cgtctatgcc tacggggttg tgctctacga gcttatgact ggctcactgc 1620
cttacagcca cattggctgc cgtgaccaga ttatctttat ggtgggccgt ggctatctgt 1680
<210> 8
<211> 1216
<212> DNA
<213> Homo sapiens
<400> 8
ctcattgact tccttcctgt tctaactgcc agtactcaga agtcagagtt gagagacaga 60
ggcaccccgg acagagacgt gaagcactga ataaatagat cagaatgact gaaaaagccc 120
cagagccaca tgtggaggag gatgatgatg atgagctgga cagcaagctc aattataagc 180
ctccaccaca gaagtccctg aaagagctgc aggaaatgga caaagatgat gagagtctaa 240
ttaagtacaa gaaaacgctg ctgggagatg gtcctgtggt gacagatccg aaagccccca 300
atgtcgttgt cacccggctc accctggttt gtgagagtgc cccgggacca atcaccatgg 360
accttactgg agatctggaa gccctcaaaa aggaaaccat tgtgttaaag gaaggttctg 420
aatatagagt caaaattcac ttcaaagtga acagggatat tgtgtcaggc ctgaaatacg 480
ttcagcacac ctacaggact ggggtgaaag tggataaagc aacatttatg gttggcagct 540
atggacctcg gcctgaggag tatgagttcc tcactccagt tgaggaggct cccaagggca 600
tgctggcgcg aggcacgtac cacaacaagt ccttcttcac cgacgatgac aagcaagacc 660
acctcagctg ggagtggaac ctgtcgatta agaaggagtg gacagaatga atgcatccac 720
ccctttcccc acccttgcca cctggaagaa ttctctcagg cgtgttcagc accctgtccc 780
tcctccctgt ccacagctgg gtccctcttc aacactgcca catttcctta ttgatgcatc 840
ttttcccacc ctgtcactca acgtggtccc tagaacaaga ggcttaaaac cgggctttca 900
cccaacctgc tccctctgat cctccatcag ggccagatct tccacgtctc catctcagta 960
cacaatcatt taatatttcc ctgtcttacc cctattcaag caactagagg ccagaaaatg 1020
ggcaaattat cactaacagg tctttgactc aggttccagt agttcattct aatgcctaga 1080
ttcttttgtg gttgttgctg gcccaatgag tccctagtca catcccctgc cagagggagt 1140
tcttcttttg tgagagacac tgtaaacgac acaagagaac aagaataaaa caataactgt 1200
gtgtgttctg gctgag 1216
<210> 9
<211> 987
<212> DNA
<213> Homo sapiens
<400> 9
aatataagtg gaggcgtcgc gctggcgggc attcctgaag ctgacagcat tcgggccgag 60
atgtctcgct ccgtggcctt agctgtgctc gcgctactct ctctttctgg cctggaggct 120
atccagcgta ctccaaagat tcaggtttac tcacgtcatc cagcagagaa tggaaagtca 180
aatttcctga attgctatgt gtctgggttt catccatccg acattgaagt tgacttactg 240
aagaatggag agagaattga aaaagtggag cattcagact tgtctttcag caaggactgg 300
tctttctatc tcttgtacta cactgaattc acccccactg aaaaagatga gtatgcctgc 360
cgtgtgaacc atgtgacttt gtcacagccc aagatagtta agtgggatcg agacatgtaa 420
gcagcatcat ggaggtttga agatgccgca tttggattgg atgaattcca aattctgctt 480
gcttgctttt taatattgat atgcttatac acttacactt tatgcacaaa atgtagggtt 540
ataataatgt taacatggac atgatcttct ttataattct actttgagtg ctgtctccat 600
gtttgatgta tctgagcagg ttgctccaca ggtagctcta ggagggctgg caacttagag 660
gtggggagca gagaattctc ttatccaaca tcaacatctt ggtcagattt gaactcttca 720
atctcttgca ctcaaagctt gttaagatag ttaagcgtgc ataagttaac ttccaattta 780
catactctgc ttagaatttg ggggaaaatt tagaaatata attgacagga ttattggaaa 840
tttgttataa tgaatgaaac attttgtcat ataagattca tatttacttc ttatacattt 900
gataaagtaa ggcatggttg tggttaatct ggtttatttt tgttccacaa gttaaataaa 960
tcataaaact tgatgtgtta tctctta 987
<210> 10
<211> 1613
<212> DNA
<213> Homo sapiens
<400> 10
gtgacgctgg gcctgcagcg cggagcagaa agcagaaccc gcagagtcct ccctgctgct 60
gtgtggacga cacgtgggca caggcagaag tgggccctgt gaccagctgc actggtttcg 120
tggaaggaag ctccaggact ggcgggatgg gctcagcctg tatcaaagtc accaaatact 180
ttctcttcct cttcaacttg atcttcttta tcctgggcgc agtgatcctg ggcttcgggg 240
tgtggatcct ggccgacaag agcagtttca tctctgtcct gcaaacctcc tccagctcgc 300
ttaggatggg ggcctatgtc ttcatcggcg tgggggcagt cactatgctc atgggcttcc 360
tgggctgcat cggcgccgtc aacgaggtcc gctgcctgct ggggctgtac tttgctttcc 420
tgctcctgat cctcattgcc caggtgacgg ccggggccct cttctacttc aacatgggca 480
agctgaagca ggagatgggc ggcatcgtga ctgagctcat tcgagactac aacagcagtc 540
gcgaggacag cctgcaggat gcctgggact acgtgcaggc tcaggtgaag tgctgcggct 600
gggtcagctt ctacaactgg acagacaacg ctgagctcat gaatcgccct gaggtcacct 660
acccctgttc ctgcgaagtc aagggggaag aggacaacag cctttctgtg aggaagggct 720
tctgcgaggc ccccggcaac aggacccaga gtggcaacca ccctgaggac tggcctgtgt 780
accaggaggg ctgcatggag aaggtgcagg cgtggctgca ggagaacctg ggcatcatcc 840
tcggcgtggg cgtgggtgtg gccatcgtcg agctcctggg gatggtcctg tccatctgct 900
tgtgccggca cgtccattcc gaagactaca gcaaggtccc caagtactga ggcagctgct 960
atccccatct ccctgcctgg cccccaacct cagggctccc aggggtctcc ctggctccct 1020
cctccaggcc tgcctcccac ttcactgcga agaccctctt gcccaccctg actgaaagta 1080
gggggctttc tggggcctag cgatctctcc tggcctatcc gctgccagcc ttgagccctg 1140
gctgttctgt ggttcctctg ctcaccgccc atcagggttc tcttagcaac tcagagaaaa 1200
atgctcccca cagcgtccct ggcgcaggtg ggctggactt ctacctgccc tcaagggtgt 1260
gtatattgta taggggcaac tgtatgaaaa attggggagg agggggccgg gcgcggtggc 1320
tcacgcctgt aatcccagca ctttgggagg ccgaggcggg tggatcacga ggtcaggaga 1380
tcgagaccat cctggctaac atggtgaaac cccgtctcta ctaaaaatac aaaaaaaatt 1440
tagccgggcg cggtggcggg cacctgtagt cccagctact tgggaggctg aggcaggaga 1500
atggtgtgaa cccgggagcg gaggttgcag tgagctgaga tcgtgctact gcactccagc 1560
ctgggggaca gaaagagact ccgtctcaaa aaaaaaaaaa aaaaaaaaaa aaa 1613
<210> 11
<211> 2265
<212> DNA
<213> Homo sapiens
<400> 11
acgcggaggt tgtaattggt ctctagacca cacctagttg ttgagtgccg ctgcttgaaa 60
atctcagttc tgccgagatc gcagaataca cacaagctac ctttgggcac cagagcagac 120
agaaccgcgg agcttcaggg tggaagattc gtggaaactt tgccaaggcc aggacctcgt 180
gtgttcccgt ccgcccctct gggacggcgc cagcccggca ggccgccgac cgtcctgggg 240
ctcccgcgca gcgcgatgcc ggcctcgtcc accgtccacg tgctgcagct gctgcgggag 300
ctgctcgcct tcgtgctcct cagctacacg gtgctcatcg gggcgctgct gctggccggc 360
tggaccactt acttcctggt gctgaagtga cagcgccgtc gccgcgcccg gccccgcctc 420
ccgcccggcc ccgcctcccg cccggccccg cctccctaac tcaccaggaa attcccttca 480
agccctggcc cgaactgagt ccccgcccac ccgccagcgt cacggcgccc gactcagctc 540
cgcgccggac ccacctccgc gccctcaggc cctgcatatg ccccgccccg cgcggaagtt 600
ccggcggttg gttgccttgc gcggccgtta cagcctttgc cctaagcctc gccccctttc 660
cccctgcctg cccaatcccg actgcttcct tgggtggggg cgtggctatg gggcgaggcg 720
ctctcaggtg gaggccgtgc cccgctccgc gctcacgaag ctgcgtcact tccggcgtgt 780
gcgtctggcg tccgcgcgct gcacaatggc ggctctgaag agttggctgt cgcgcagcgt 840
aacttcattc ttcaggtaca gacagtgttt gtgtgttcct gttgtggcta actttaagaa 900
gcggtgtttc tcagaattga taagaccatg gcacaaaact gtgacgattg gctttggagt 960
aaccctgtgt gcggttccta ttgcacagaa atcagagcct cattccctta gtagtgaagc 1020
attgatgagg agagcagtgt ctttggtaac agatagcacc tctacctttc tctctcagac 1080
cacatatgcg ttgattgaag ctattactga atatactaag gctgtttata ccttaacttc 1140
tctttaccga caatatacaa gtttacttgg gaaaatgaat tcagaggagg aagatgaagt 1200
gtggcaggtg atcataggag ccagagctga gatgacttca aaacaccaag agtacttgaa 1260
gctggaaacc acttggatga ctgcagttgg tctttcagag atggcagcag aagctgcata 1320
tcaaactggc gcagatcagg cctctataac cgccaggaat cacattcagc tggtgaaact 1380
gcaggtggaa gaggtgcacc agctctcccg gaaagcagaa accaagctgg cagaagcaca 1440
gatagaagag ctccgtcaga aaacacagga ggaaggggag gagcgggctg agtcggagca 1500
ggaggcctac ctgcgtgagg attgagggcc tgagcacact gccctgtctc cccactcagt 1560
ggggaaagca ggggcagatg ccaccctgcc cagggttggc atgactgtct gtgcaccgag 1620
aagaggcggc agatcctgcc ctggccaatc aggcgagacg cctttgtgag ctgtgagtgc 1680
ctcctgtggt ctcaggcttg cgctggacct ggttcttagc ccttgggcac tgcaccctgt 1740
ttaacatttc accccactct gtacagctgc tcttacccat tttttttacc tcacacccaa 1800
agcattttgc ctacctgggt cagagagagg agtccttttt gtcatgccct taagttcagc 1860
aactgtttaa cctgttttca gtcttattta cgtcgtcaaa aatgatttag tacttgttcc 1920
ctctgttggg atgccagttg tggcaggggg aggggaacct gtccagtttg tacgatttct 1980
ttgtatgtat ttctgatgtg ttctctgatc tgcccccact gtcctgtgag gacagctgag 2040
gccaaggagt gaaaaaccta ttactactaa gagaaggggt gcagagtgtt tacctggtgc 2100
tctcaacagg acttaacatc aacaggactt aacacaggcc tcttgttcct tcctttcttt 2160
ccgtttctct attgtatcca aaggagaaga gtgtaagatt ttgtttgcat ctgaaagaga 2220
aaatgcgtct ctcctggggt cctaaaaaaa aaaaaaaaaa aaaaa 2265
<210> 12
<211> 3031
<212> DNA
<213> Homo sapiens
<400> 12
caatcgcgaa accccgagga gcgctcgggc tgtctgcgga ccctgccgcg tgcaggggtc 60
gcggccggct ggagctggga gtgaggcggc ggaggagcca ggtgaggagg agccaggaag 120
gcagttggtg ggaagtccag cttgggtccc tgaggagctg tgagaaggag atgcggctgc 180
tgctggccct gttgggggtc ctgctgagtg tgcctgggcc tccagtcttg tccctggagg 240
cctctgagga agtggagctt gagccctgcc tggctcccag cctggagcag caagagcagg 300
agctgacagt agcccttggg cagcctgtgc gtctgtgctg tgggcgggct gagcgtggtg 360
gccactggta caaggagggc agtcgcctgg cacctgctgg ccgtgtacgg ggctggaggg 420
gccgcctaga gattgccagc ttcctacctg aggatgctgg ccgctacctc tgcctggcac 480
gaggctccat gatcgtcctg cagaatctca ccttgattac aggtgactcc ttgacctcca 540
gcaacgatga tgaggacccc aagtcccata gggacccctc gaataggcac agttaccccc 600
agcaagcacc ctactggaca cacccccagc gcatggagaa gaaactgcat gcagtacctg 660
cggggaacac cgtcaagttc cgctgtccag ctgcaggcaa ccccacgccc accatccgct 720
ggcttaagga tggacaggcc tttcatgggg agaaccgcat tggaggcatt cggctgcgcc 780
atcagcactg gagtctcgtg atggagagcg tggtgccctc ggaccgcggc acatacacct 840
gcctggtaga gaacgctgtg ggcagcatcc gctataacta cctgctagat gtgctggagc 900
ggtccccgca ccggcccatc ctgcaggccg ggctcccggc caacaccaca gccgtggtgg 960
gcagcgacgt ggagctgctg tgcaaggtgt acagcgatgc ccagccccac atccagtggc 1020
tgaagcacat cgtcatcaac ggcagcagct tcggagccga cggtttcccc tatgtgcaag 1080
tcctaaagac tgcagacatc aatagctcag aggtggaggt cctgtacctg cggaacgtgt 1140
cagccgagga cgcaggcgag tacacctgcc tcgcaggcaa ttccatcggc ctctcctacc 1200
agtctgcctg gctcacggtg ctgccagagg aggaccccac atggaccgca gcagcgcccg 1260
aggccaggta tacggacatc atcctgtacg cgtcgggctc cctggccttg gctgtgctcc 1320
tgctgctggc cgggctgtat cgagggcagg cgctccacgg ccggcacccc cgcccgcccg 1380
ccactgtgca gaagctctcc cgcttccctc tggcccgaca gttctccctg gagtcaggct 1440
cttccggcaa gtcaagctca tccctggtac gaggcgtgcg tctctcctcc agcggccccg 1500
ccttgctcgc cggcctcgtg agtctagatc tacctctcga cccactatgg gagttccccc 1560
gggacaggct ggtgcttggg aagcccctag gcgagggctg ctttggccag gtagtacgtg 1620
cagaggcctt tggcatggac cctgcccggc ctgaccaagc cagcactgtg gccgtcaaga 1680
tgctcaaaga caacgcctct gacaaggacc tggccgacct ggtctcggag atggaggtga 1740
tgaagctgat cggccgacac aagaacatca tcaacctgct tggtgtctgc acccaggaag 1800
ggcccctgta cgtgatcgtg gagtgcgccg ccaagggaaa cctgcgggag ttcctgcggg 1860
cccggcgccc cccaggcccc gacctcagcc ccgacggtcc tcggagcagt gaggggccgc 1920
tctccttccc agtcctggtc tcctgcgcct accaggtggc ccgaggcatg cagtatctgg 1980
agtcccggaa gtgtatccac cgggacctgg ctgcccgcaa tgtgctggtg actgaggaca 2040
atgtgatgaa gattgctgac tttgggctgg cccgcggcgt ccaccacatt gactactata 2100
agaaaaccag caacggccgc ctgcctgtga agtggatggc gcccgaggcc ttgtttgacc 2160
gggtgtacac acaccagagt gacgtgtggt cttttgggat cctgctatgg gagatcttca 2220
ccctcggggg ctccccgtat cctggcatcc cggtggagga gctgttctcg ctgctgcggg 2280
agggacatcg gatggaccga cccccacact gccccccaga gctgtacggg ctgatgcgtg 2340
agtgctggca cgcagcgccc tcccagaggc ctaccttcaa gcagctggtg gaggcgctgg 2400
acaaggtcct gctggccgtc tctgaggagt acctcgacct ccgcctgacc ttcggaccct 2460
attccccctc tggtggggac gccagcagca cctgctcctc cagcgattct gtcttcagcc 2520
acgaccccct gccattggga tccagctcct tccccttcgg gtctggggtg cagacatgag 2580
caaggctcaa ggctgtgcag gcacataggc tggtggcctt gggccttggg gctcagccac 2640
agcctgacac agtgctcgac cttgatagca tggggcccct ggcccagagt tgctgtgccg 2700
tgtccaaggg ccgtgccctt gcccttggag ctgccgtgcc tgtgtcctga tggcccaaat 2760
gtcagggttc tgctcggctt cttggaccaa ggcgcttagt ccccatcccg ggtttggctg 2820
agcctggctg gagagctgct atgctaaacc tcctgcctcc caataccagc aggaggttct 2880
gggcctctga accccctttc cccacacctc cccctgctgc tgctgcccca gcgtcttgac 2940
gggagcattg gcccctgagc ccagagaagc tggaagcctg ccgaaaacag gagcaaatgg 3000
cgttttataa attatttttt tgaaataaaa a 3031
<210> 13
<211> 2321
<212> DNA
<213> Homo sapiens
<400> 13
gtcctcaacc aagatggcgc ggatggcttc aggcgcatca cgacaccggc gcgtcacgcg 60
acccgcccta cgggcacctc ccgcgctttt cttagcgccg cagacggtgg ccgagcgggg 120
gaccgggaag catggcccgg gggtcggcgg ttgcctgggc ggcgctcggg ccgttgttgt 180
ggggctgcgc gctggggctg cagggcggga tgctgtaccc ccaggagagc ccgtcgcggg 240
agtgcaagga gctggacggc ctctggagct tccgcgccga cttctctgac aaccgacgcc 300
ggggcttcga ggagcagtgg taccggcggc cgctgtggga gtcaggcccc accgtggaca 360
tgccagttcc ctccagcttc aatgacatca gccaggactg gcgtctgcgg cattttgtcg 420
gctgggtgtg gtacgaacgg gaggtgatcc tgccggagcg atggacccag gacctgcgca 480
caagagtggt gctgaggatt ggcagtgccc attcctatgc catcgtgtgg gtgaatgggg 540
tcgacacgct agagcatgag gggggctacc tccccttcga ggccgacatc agcaacctgg 600
tccaggtggg gcccctgccc tcccggctcc gaatcactat cgccatcaac aacacactca 660
cccccaccac cctgccacca gggaccatcc aatacctgac tgacacctcc aagtatccca 720
agggttactt tgtccagaac acatattttg actttttcaa ctacgctgga ctgcagcggt 780
ctgtacttct gtacacgaca cccaccacct acatcgatga catcaccgtc accaccagcg 840
tggagcaaga cagtgggctg gtgaattacc agatctctgt caagggcagt aacctgttca 900
agttggaagt gcgtcttttg gatgcagaaa acaaagtcgt ggcgaatggg actgggaccc 960
agggccaact taaggtgcca ggtgtcagcc tctggtggcc gtacctgatg cacgaacgcc 1020
ctgcctatct gtattcattg gaggtgcagc tgactgcaca gacgtcactg gggcctgtgt 1080
ctgacttcta cacactccct gtggggatcc gcactgtggc tgtcaccaag agccagttcc 1140
tcatcaatgg gaaacctttc tatttccacg gtgtcaacaa gcatgaggat gcggacatcc 1200
gagggaaggg cttcgactgg ccgctgctgg tgaaggactt caacctgctt cgctggcttg 1260
gtgccaacgc tttccgtacc agccactacc cctatgcaga ggaagtgatg cagatgtgtg 1320
accgctatgg gattgtggtc atcgatgagt gtcccggcgt gggcctggcg ctgccgcagt 1380
tcttcaacaa cgtttctctg catcaccaca tgcaggtgat ggaagaagtg gtgcgtaggg 1440
acaagaacca ccccgcggtc gtgatgtggt ctgtggccaa cgagcctgcg tcccacctag 1500
aatctgctgg ctactacttg aagatggtga tcgctcacac caaatccttg gacccctccc 1560
ggcctgtgac ctttgtgagc aactctaact atgcagcaga caagggggct ccgtatgtgg 1620
atgtgatctg tttgaacagc tactactctt ggtatcacga ctacgggcac ctggagttga 1680
ttcagctgca gctggccacc cagtttgaga actggtataa gaagtatcag aagcccatta 1740
ttcagagcga gtatggagca gaaacgattg cagggtttca ccaggatcca cctctgatgt 1800
tcactgaaga gtaccagaaa agtctgctag agcagtacca tctgggtctg gatcaaaaac 1860
gcagaaaata cgtggttgga gagctcattt ggaattttgc cgatttcatg actgaacagt 1920
caccgacgag agtgctgggg aataaaaagg ggatcttcac tcggcagaga caaccaaaaa 1980
gtgcagcgtt ccttttgcga gagagatact ggaagattgc caatgaaacc aggtatcccc 2040
actcagtagc caagtcacaa tgtttggaaa acagcctgtt tacttgagca agactgatac 2100
cacctgcgtg tcccttcctc cccgagtcag ggcgacttcc acagcagcag aacaagtgcc 2160
tcctggactg ttcacggcag accagaacgt ttctggcctg ggttttgtgg tcatctattc 2220
tagcagggaa cactaaaggt ggaaataaaa gattttctat tatggaaata aagagttggc 2280
atgaaagtgg ctactgaaaa aaaaaaaaaa aaaaaaaaaa a 2321
<210> 14
<211> 1606
<212> DNA
<213> Homo sapiens
<400> 14
aaatgtgacc ggccgcggct ccggcagtca acgcctgcct cctctcgagc gtcctcagcg 60
cagccgccgc ccgcggagcc agcacgaacg agcccagcac cggccggatg gagcgtccgc 120
aacccgacag catgccccag gatttgtcag aggccctgaa ggaggccacc aaggaggtgc 180
acacccaggc agagaatgct gagttcatga ggaactttca gaagggccag gtgacccgag 240
acggcttcaa gctggtgatg gcctccctgt accacatcta tgtggccctg gaggaggaga 300
ttgagcgcaa caaggagagc ccagtcttcg cccctgtcta cttcccagaa gagctgcacc 360
gcaaggctgc cctggagcag gacctggcct tctggtacgg gccccgctgg caggaggtca 420
tcccctacac accagccatg cagcgctatg tgaagcggct ccacgaggtg gggcgcacag 480
agcccgagct gctggtggcc cacgcctaca cccgctacct gggtgacctg tctgggggcc 540
aggtgctcaa aaagattgcc cagaaagccc tggacctgcc cagctctggc gagggcctgg 600
ccttcttcac cttccccaac attgccagtg ccaccaagtt caagcagctc taccgctccc 660
gcatgaactc cctggagatg actcccgcag tcaggcagag ggtgatagaa gaggccaaga 720
ctgcgttcct gctcaacatc cagctctttg aggagttgca ggagctgctg acccatgaca 780
ccaaggacca gagcccctca cgggcaccag ggcttcgcca gcgggccagc aacaaagtgc 840
aagattctgc ccccgtggag actcccagag ggaagccccc actcaacacc cgctcccagg 900
ctccgcttct ccgatgggtc cttacactca gctttctggt ggcgacagtt gctgtagggc 960
tttatgccat gtgaatgcag gcatgctggc tcccagggcc atgaactttg tccggtggaa 1020
ggccttcttt ctagagaggg aattctcttg gctggcttcc ttaccgtggg cactgaaggc 1080
tttcagggcc tccagccctc tcactgtgtc cctctctctg gaaaggagga aggagcctat 1140
ggcatcttcc ccaacgaaaa gcacatccag gcaatggcct aaacttcaga gggggcgaag 1200
ggatcagccc tgcccttcag catcctcagt tcctgcagca gagcctggaa gacaccctaa 1260
tgtggcagct gtctcaaacc tccaaaagcc ctgagtttca agtatccttg ttgacacggc 1320
catgaccact ttccccgtgg gccatggcaa tttttacaca aacctgaaaa gatgttgtgt 1380
cttgtgtttt tgtcttattt ttgttggagc cactctgttc ctggctcagc ctcaaatgca 1440
gtatttttgt tgtgttctgt tgtttttata gcagggttgg ggtggttttt gagccatgcg 1500
tgggtgggga gggaggtgtt taacggcact gtggccttgg tctaactttt gtgtgaaata 1560
ataaacaaca ttgtctgata gtagcttgaa aaaaaaaaaa aaaaaa 1606
<210> 15
<211> 3879
<212> DNA
<213> Homo sapiens
<400> 15
atcagacgcg cagaggaggc ggggccgcgg ctggtttcct gccggggggc ggctctgggc 60
cgccgagtcc cctcctcccg cccctgagga ggaggagccg ccgccacccg ccgcgcccga 120
cacccgggag gccccgccag cccgcgggag aggcccagcg ggagtcgcgg aacagcaggc 180
ccgagcccac cgcgccgggc cccggacgcc gcgcggaaaa gatgaattta caaccaattt 240
tctggattgg actgatcagt tcagtttgct gtgtgtttgc tcaaacagat gaaaatagat 300
gtttaaaagc aaatgccaaa tcatgtggag aatgtataca agcagggcca aattgtgggt 360
ggtgcacaaa ttcaacattt ttacaggaag gaatgcctac ttctgcacga tgtgatgatt 420
tagaagcctt aaaaaagaag ggttgccctc cagatgacat agaaaatccc agaggctcca 480
aagatataaa gaaaaataaa aatgtaacca accgtagcaa aggaacagca gagaagctca 540
agccagagga tattactcag atccaaccac agcagttggt tttgcgatta agatcagggg 600
agccacagac atttacatta aaattcaaga gagctgaaga ctatcccatt gacctctact 660
accttatgga cctgtcttac tcaatgaaag acgatttgga gaatgtaaaa agtcttggaa 720
cagatctgat gaatgaaatg aggaggatta cttcggactt cagaattgga tttggctcat 780
ttgtggaaaa gactgtgatg ccttacatta gcacaacacc agctaagctc aggaaccctt 840
gcacaagtga acagaactgc accagcccat ttagctacaa aaatgtgctc agtcttacta 900
ataaaggaga agtatttaat gaacttgttg gaaaacagcg catatctgga aatttggatt 960
ctccagaagg tggtttcgat gccatcatgc aagttgcagt ttgtggatca ctgattggct 1020
ggaggaatgt tacacggctg ctggtgtttt ccacagatgc cgggtttcac tttgctggag 1080
atgggaaact tggtggcatt gttttaccaa atgatggaca atgtcacctg gaaaataata 1140
tgtacacaat gagccattat tatgattatc cttctattgc tcaccttgtc cagaaactga 1200
gtgaaaataa tattcagaca atttttgcag ttactgaaga atttcagcct gtttacaagg 1260
agctgaaaaa cttgatccct aagtcagcag taggaacatt atctgcaaat tctagcaatg 1320
taattcagtt gatcattgat gcatacaatt ccctttcctc agaagtcatt ttggaaaacg 1380
gcaaattgtc agaaggcgta acaataagtt acaaatctta ctgcaagaac ggggtgaatg 1440
gaacagggga aaatggaaga aaatgttcca atatttccat tggagatgag gttcaatttg 1500
aaattagcat aacttcaaat aagtgtccaa aaaaggattc tgacagcttt aaaattaggc 1560
ctctgggctt tacggaggaa gtagaggtta ttcttcagta catctgtgaa tgtgaatgcc 1620
aaagcgaagg catccctgaa agtcccaagt gtcatgaagg aaatgggaca tttgagtgtg 1680
gcgcgtgcag gtgcaatgaa gggcgtgttg gtagacattg tgaatgcagc acagatgaag 1740
ttaacagtga agacatggat gcttactgca ggaaagaaaa cagttcagaa atctgcagta 1800
acaatggaga gtgcgtctgc ggacagtgtg tttgtaggaa gagggataat acaaatgaaa 1860
tttattctgg caaattctgc gagtgtgata atttcaactg tgatagatcc aatggcttaa 1920
tttgtggagg aaatggtgtt tgcaagtgtc gtgtgtgtga gtgcaacccc aactacactg 1980
gcagtgcatg tgactgttct ttggatacta gtacttgtga agccagcaac ggacagatct 2040
gcaatggccg gggcatctgc gagtgtggtg tctgtaagtg tacagatccg aagtttcaag 2100
ggcaaacgtg tgagatgtgt cagacctgcc ttggtgtctg tgctgagcat aaagaatgtg 2160
ttcagtgcag agccttcaat aaaggagaaa agaaagacac atgcacacag gaatgttcct 2220
attttaacat taccaaggta gaaagtcggg acaaattacc ccagccggtc caacctgatc 2280
ctgtgtccca ttgtaaggag aaggatgttg acgactgttg gttctatttt acgtattcag 2340
tgaatgggaa caacgaggtc atggttcatg ttgtggagaa tccagagtgt cccactggtc 2400
cagacatcat tccaattgta gctggtgtgg ttgctggaat tgttcttatt ggccttgcat 2460
tactgctgat atggaagctt ttaatgataa ttcatgacag aagggagttt gctaaatttg 2520
aaaaggagaa aatgaatgcc aaatgggaca cgggtgaaaa tcctatttat aagagtgccg 2580
taacaactgt ggtcaatccg aagtatgagg gaaaatgagt actgcccgtg caaatcccac 2640
aacactgaat gcaaagtagc aatttccata gtcacagtta ggtagcttta gggcaatatt 2700
gccatggttt tactcatgtg caggttttga aaatgtacaa tatgtataat ttttaaaatg 2760
ttttattatt ttgaaaataa tgttgtaatt catgccaggg actgacaaaa gacttgagac 2820
aggatggtta ctcttgtcag ctaaggtcac attgtgcctt tttgaccttt tcttcctgga 2880
ctattgaaat caagcttatt ggattaagtg atatttctat agcgattgaa agggcaatag 2940
ttaaagtaat gagcatgatg agagtttctg ttaatcatgt attaaaactg atttttagct 3000
ttacaaatat gtcagtttgc agttatgcag aatccaaagt aaatgtcctg ctagctagtt 3060
aaggattgtt ttaaatctgt tattttgcta tttgcctgtt agacatgact gatgacatat 3120
ctgaaagaca agtatgttga gagttgctgg tgtaaaatac gtttgaaata gttgatctac 3180
aaaggccatg ggaaaaattc agagagttag gaaggaaaaa ccaatagctt taaaacctgt 3240
gtgccatttt aagagttact taatgtttgg taacttttat gccttcactt tacaaattca 3300
agccttagat aaaagaaccg agcaattttc tgctaaaaag tccttgattt agcactattt 3360
acatacaggc catactttac aaagtatttg ctgaatgggg accttttgag ttgaatttat 3420
tttattattt ttattttgtt taatgtctgg tgctttctgt cacctcttct aatcttttaa 3480
tgtatttgtt tgcaattttg gggtaagact ttttttatga gtactttttc tttgaagttt 3540
tagcggtcaa tttgcctttt taatgaacat gtgaagttat actgtggcta tgcaacagct 3600
ctcacctacg cgagtcttac tttgagttag tgccataaca gaccactgta tgtttacttc 3660
tcaccatttg agttgcccat cttgtttcac actagtcaca ttcttgtttt aagtgccttt 3720
agttttaaca gttcactttt tacagtgcta tttactgaag ttatttatta aatatgccta 3780
aaatacttaa atcggatgtc ttgactctga tgtattttat caggttgtgt gcatgaaatt 3840
tttatagatt aaagaagttg aggaaaagca aaaaaaaaa 3879
<210> 16
<211> 3751
<212> DNA
<213> Homo sapiens
<400> 16
cgggcgcagc agctggaacg ggagtactgc gacgcggccc ggagtcggcc ttgtaggggc 60
gaaggtgcag ggagatcgcg gcgggcgcag tcttgagcgc cggagcgcgt ccctgccctt 120
agcggggctt gccccagtcg caggggcaca tccagccgct gcggctgaca gcagccgcgc 180
gcgcgggagt ctgcggggtc gcggcagccg cacctgcgcg ggcgaccagc gcaaggtccc 240
cgcccggctg ggcgggcagc aagggccggg gagagggtgc gggtgcaggc gggggcccca 300
cagggccacc ttcttgcccg gcggctgccg ctggaaaatg tctcaggaga ggcccacgtt 360
ctaccggcag gagctgaaca agacaatctg ggaggtgccc gagcgttacc agaacctgtc 420
tccagtgggc tctggcgcct atggctctgt gtgtgctgct tttgacacaa aaacggggtt 480
acgtgtggca gtgaagaagc tctccagacc atttcagtcc atcattcatg cgaaaagaac 540
ctacagagaa ctgcggttac ttaaacatat gaaacatgaa aatgtgattg gtctgttgga 600
cgtttttaca cctgcaaggt ctctggagga attcaatgat gtgtatctgg tgacccatct 660
catgggggca gatctgaaca acattgtgaa atgtcagaag cttacagatg accatgttca 720
gttccttatc taccaaattc tccgaggtct aaagtatata cattcagctg acataattca 780
cagggaccta aaacctagta atctagctgt gaatgaagac tgtgagctga agattctgga 840
ttttggactg gctcggcaca cagatgatga aatgacaggc tacgtggcca ctaggtggta 900
cagggctcct gagatcatgc tgaactggat gcattacaac cagacagttg atatttggtc 960
agtgggatgc ataatggccg agctgttgac tggaagaaca ttgtttcctg gtacagacca 1020
tattgatcag ttgaagctca ttttaagact cgttggaacc ccaggggctg agcttttgaa 1080
gaaaatctcc tcagagtctg caagaaacta tattcagtct ttgactcaga tgccgaagat 1140
gaactttgcg aatgtattta ttggtgccaa tcccctggct gtcgacttgc tggagaagat 1200
gcttgtattg gactcagata agagaattac agcggcccaa gcccttgcac atgcctactt 1260
tgctcagtac cacgatcctg atgatgaacc agtggccgat ccttatgatc agtcctttga 1320
aagcagggac ctccttatag atgagtggaa aagcctgacc tatgatgaag tcatcagctt 1380
tgtgccacca ccccttgacc aagaagagat ggagtcctga gcacctggtt tctgttctgt 1440
tgatcccact tcactgtgag gggaaggcct tttcatggga actctccaaa tattattcaa 1500
gtgcctcttg ttgcagagat ttcctccatg gtggaagggg gtgtgcgtgc gtgtgcgtgc 1560
gtgttagtgt gtgtgcatgt gtgtgtctgt ctttgtggga gggtaagaca atatgaacaa 1620
actatgatca cagtgacttt acaggaggtt gtggatgctc cagggcagcc tccaccttgc 1680
tcttctttct gagagttggc tcaggcagac aagagctgct gtccttttag gaatatgttc 1740
aatgcaaagt aaaaaaatat gaattgtccc caatcccggt catgcttttg ccactttggc 1800
ttctcctgtg accccacctt gacggtgggg cgtagacttg acaacatccc acagtggcac 1860
ggagagaagg cccatacctt ctggttgctt cagacctgac accgtccctc agtgatacgt 1920
acagccaaaa aggaccaact ggcttctgtg cactagcctg tgattaactt gcttagtatg 1980
gttctcagat cttgacagta tatttgaaac tgtaaatatg tttgtgcctt aaaaggagag 2040
aagaaagtgt agatagttaa aagactgcag ctgctgaagt tctgagccgg gcaagtcgag 2100
agggctgttg gacagctgct tgtgggcccg gagtaatcag gcagccttca taggcggtca 2160
tgtgtgcatg tgagcacatg cgtatatgtg cgtctctctt tctccctcac ccccaggtgt 2220
tgccatttct ctgcttaccc ttcacctttg gtgcagaggt ttcttgaata tctgccccag 2280
tagtcagaag caggttcttg atgtcatgta cttcctgtgt actctttatt tctagcagag 2340
tgaggatgtg ttttgcacgt cttgctattt gagcatgcac agctgcttgt cctgctctct 2400
tcaggaggcc ctggtgtcag gcaggtttgc cagtgaagac ttcttgggta gtttagatcc 2460
catgtcacct cagctgatat tatggcaagt gatatcacct ctcttcagcc cctagtgcta 2520
ttctgtgttg aacacaattg atacttcagg tgcttttgat gtgaaaatca tgaaaagagg 2580
aacaggtgga tgtatagcat ttttattcat gccatctgtt ttcaaccaac tatttttgag 2640
gaattatcat gggaaaagac cagggctttt cccaggaata tcccaaactt cggaaacaag 2700
ttattctctt cactcccaat aactaatgct aagaaatgct gaaaatcaaa gtaaaaaatt 2760
aaagcccata aggccagaaa ctccttttgc tgtctttctc taaatatgat tactttaaaa 2820
taaaaaagta acaaggtgtc ttttccactc ctatggaaaa gggtcttctt ggcagcttaa 2880
cattgacttc ttggtttggg gagaaataaa ttttgtttca gaattttgta tattgtagga 2940
atcctttgag aatgtgattc cttttgatgg ggagaaaggg caaattattt taatattttg 3000
tattttcaac tttataaaga taaaatatcc tcaggggtgg agaagtgtcg ttttcataac 3060
ttgctgaatt tcaggcattt tgttctacat gaggactcat atatttaagc cttttgtgta 3120
ataagaaagt ataaagtcac ttccagtgtt ggctgtatga cagaatcttg tatttgggcc 3180
aaggtgtttc catttctcaa tcagtgcagt gatacatgta ctccagaggg acagggtgga 3240
ccccctgagt caactggagc aagaaggaag gaggcagact gatggcgatt ccctctcacc 3300
cgggactctc cccctttcaa ggaaagtgaa cctttaaagt aaaggcctca tctcctttat 3360
tgcagttcaa atcctcacca tccacagcaa gatgaatttt atcagccatg tttggttgta 3420
aatgctcgtg tgatttccta cagaaatact gctctgaata ttttgtaata aaggtctttg 3480
cacatgtgac cacatacgtg ttaggaggct gcatgctctg gaagcctgga ctctaagctg 3540
gagctcttgg aagagctctt cggtttctga gcataatgct cccatctcct gatttctctg 3600
aacagaaaac aaaagagaga atgagggaaa ttgctatttt atttgtattc atgaacttgg 3660
ctgtaatcag ttatgccgta taggatgtca gacaatacca ctggttaaaa taaagcctat 3720
ttttcaaaaa aaaaaaaaaa aaaaaaaaaa a 3751
<210> 17
<211> 3171
<212> DNA
<213> Homo sapiens
<400> 17
gggtgtgtgt gtgagtgaga gagcgagtga gtgagtgagt gagtgtgtgt gtggggggga 60
ctcggcttgt tgttgtcggt gacttccccc tccccttcac cccttcccct ccccgccgcc 120
gctgcagtgg ccgctccctg ggccgtagga aatgagcgat aacgatgaca tcgaggtgga 180
gagcgacgaa gagcaacaga ggtttcaatc tgcggctgac aaacgggctc atcataatgc 240
actggaacga aaacgtaggg accacatcaa agacagcttt cacagtttgc gggactcagt 300
cccatcactc caaggagaga aggcatcccg ggcccaaatc ctagacaaag ccacagaata 360
tatccagtat atgcgaagga aaaaccacac acaccagcaa gatattgacg acctcaagcg 420
gcagaatgct cttctggagc agcaaggtga gcacccgagc tcgtggggca gctggccctg 480
ctgtgctcca gccaggtcag gctttggcac ctgggcctgc agagtcagag ccagtcatgg 540
agtatgtgct cagtagcagg cttggtcctg cttcttgggg cctgagtaac tgagtgttag 600
agccgtcctg aggaaggacc tgaggcgcca gtgaggagac agtggaagct aggaagttgg 660
acatctggag acttgtatct tttctggcct gacctctccc gttcttgggt ctcaggtgct 720
ctgcctgcag tagggatcac acctggcatc aggtgtctga aaagagcttt gaggtccttg 780
gagtggaatg tgctgtgtaa gtaccagaga ctccaggtgt tcagggacag tgagccctcc 840
ccattgtcaa tggtagtcca atcagggcag cctatgggct aggcccatgc tgttctcaat 900
gctcacaccc gccttttcct acaaccacag gggaaagcga gagctgatca agttctttgt 960
tcctggggaa ttcacttctc ttcctccctc atggaagatg caagtaaaag gaaatgcaag 1020
taaccacctg ggttagaaaa cctcaaataa aataaaataa aataaattaa atgggttgac 1080
cttccaggct caagctgagc tgaaccaagg gatgggcagt gggtggtgtc agtgggttgg 1140
ttactgggcc aggcagcctg catgtagggg ctatttgaaa agcccaggta ttttatgtgt 1200
attggtgact tgcttccaag tgtccagctt gtcattccaa gtggatcttg tacacgagag 1260
ctaagccaaa actgttcttt ggctgatacg tcttatgtca tcctttcctg ctgttgtgtg 1320
gcctcacacc ttgtggagcc tcatgctcct gggccagctt ctcctctgtt attgcactgc 1380
tgaatcccac agggagctca cgctccagtc tctccacggg gcttccacgg caggacggtg 1440
acatcacaag ccttctcttc agagttgggt gggattgcag agtgtctgct ggctcccagg 1500
tccagctggg aaaggcggga gggaaatgaa gtgtgtgagt gaacagccac ccgaagggag 1560
ctacttctga gcatcttgag cctcgggggc caacaagcaa gcccttagga agaacaggct 1620
ggaccctgag tctgagactc ggttactccc caagtctcca gaaggcagta acacactccc 1680
ttggttgcct tttagtccgt gcactggaga aggcgaggtc aagtgcccaa ctgcagacca 1740
actacccctc ctcagacaac agcctctaca ccaacgccaa gggcagcacc atctctgcct 1800
tcgatggggg ctcggactcc agctcggagt ctgagcctga agagccccaa agcaggaaga 1860
agctccggat ggaggccagc taagccactc ggggcaggcc agcaataaaa actgtctgtc 1920
tccatcgtct catcctcctt tcagttcgtt ggtagagccc tcagaaccat ttaaaagact 1980
ctttattttt ctctttctcc cttttttttt taaattttta tttttacgta gaagctcttg 2040
gacaacagct ctcgttctcc ttccccattt ccactgtata ttttttaatg tattcccttc 2100
agggattccc tgtccccaac aggaattttt aaaccaaaac accccaactt ggcagctttt 2160
tctgtggagg acagacggcc ggccggacct ctgagcacat agtgtcctgc ccaccctacc 2220
agctcctcca gccctgccag gcacatgccc gggggacgcc tgccctgccc aggtggcctc 2280
ctggcctgcc ctcacctctg atagactttg tgaatctgaa ctgctctact ttgagaagat 2340
gaccggtttg gagtaatcag aatgaaccct cctccttttt aagggttttt tttttttcct 2400
ttttctaaaa agctatgtat cgctcctatt gaaagaccag atccttaaag aagtttgtgg 2460
tataaaaaga aagtggggac agattcgcag cacagagtcg ctggcatgtt tcactcctgc 2520
ttctctcagc cagctgttta agcctgcggc gccagcctca cggagggccg tgtgacactc 2580
tcgtggtatg tatgggagac ggcagcagtg aagcagcagc caccagggag tggccatttg 2640
gggttgggac agggagggtg ttttgggtgg catagaggtt ttgtattgag ggccagtgat 2700
gatgttttga tatttatttc ctgctactta aatttgaatc tgagtgaatt gtacctattt 2760
ctgatgatgt cggtcttgca aagcgacaga ttcataaagt aatgatgaaa tctttctttc 2820
ttcccgtgtg tatttctaag aaatagagcc aactgatttt gtatgtaaat accaagagca 2880
atttacctgg tactaaaccc gcaccccagt gcggaccctt cccagccctc atcccacttc 2940
ctttcctact gtcctggaac ctgtctccat tgtgtgatcc agccctggtt ctggctgtgg 3000
tcagcagatc ccagtgaagg gttttgtgtg tttaggcctc atttctttgt ctttttccta 3060
ctccgttcct ggcatttgct gatttctagt gtatactctg tagtcagttc gtgtttgatt 3120
ccattccatg gaaataaaaa gtatgttgta catacaaaaa aaaaaaaaaa a 3171
<210> 18
<211> 3065
<212> DNA
<213> Homo sapiens
<400> 18
ctcaggcggt ggctggaggc tgcgcatctg gggctttaaa catacaaagg gattgccagg 60
acctgcggcg gcggcggcgg cggcgggggc tggggcgcgg gggccggacc atgagccgct 120
gagccgggca aaccccaggc caccgagcca gcggaccctc ggagcgcagc cctgcgccgc 180
ggagcaggct ccaaccaggc ggcgacgcgg ccacacgcac cgagccagcg acccccgggc 240
gacgcgcggg gccagggagc gctacgatgg aggcgctaat ggcccggggc gcgctcacgg 300
gtcccctgag ggcgctctgt ctcctgggct gcctgctgag ccacgccgcc gccgcgccgt 360
cgcccatcat caagttcccc ggcgatgtcg cccccaaaac ggacaaagag ttggcagtgc 420
aatacctgaa caccttctat ggctgcccca aggagagctg caacctgttt gtgctgaagg 480
acacactaaa gaagatgcag aagttctttg gactgcccca gacaggtgat cttgaccaga 540
ataccatcga gaccatgcgg aagccacgct gcggcaaccc agatgtggcc aactacaact 600
tcttccctcg caagcccaag tgggacaaga accagatcac atacaggatc attggctaca 660
cacctgatct ggacccagag acagtggatg atgcctttgc tcgtgccttc caagtctgga 720
gcgatgtgac cccactgcgg ttttctcgaa tccatgatgg agaggcagac atcatgatca 780
actttggccg ctgggagcat ggcgatggat acccctttga cggtaaggac ggactcctgg 840
ctcatgcctt cgccccaggc actggtgttg ggggagactc ccattttgat gacgatgagc 900
tatggacctt gggagaaggc caagtggtcc gtgtgaagta tggcaacgcc gatggggagt 960
actgcaagtt ccccttcttg ttcaatggca aggagtacaa cagctgcact gataccggcc 1020
gcagcgatgg cttcctctgg tgctccacca cctacaactt tgagaaggat ggcaagtacg 1080
gcttctgtcc ccatgaagcc ctgttcacca tgggcggcaa cgctgaagga cagccctgca 1140
agtttccatt ccgcttccag ggcacatcct atgacagctg caccactgag ggccgcacgg 1200
atggctaccg ctggtgcggc accactgagg actacgaccg cgacaagaag tatggcttct 1260
gccctgagac cgccatgtcc actgttggtg ggaactcaga aggtgccccc tgtgtcttcc 1320
ccttcacttt cctgggcaac aaatatgaga gctgcaccag cgccggccgc agtgacggaa 1380
agatgtggtg tgcgaccaca gccaactacg atgacgaccg caagtggggc ttctgccctg 1440
accaagggta cagcctgttc ctcgtggcag cccacgagtt tggccacgcc atggggctgg 1500
agcactccca agaccctggg gccctgatgg cacccattta cacctacacc aagaacttcc 1560
gtctgtccca ggatgacatc aagggcattc aggagctcta tggggcctct cctgacattg 1620
accttggcac cggccccacc cccacactgg gccctgtcac tcctgagatc tgcaaacagg 1680
acattgtatt tgatggcatc gctcagatcc gtggtgagat cttcttcttc aaggaccggt 1740
tcatttggcg gactgtgacg ccacgtgaca agcccatggg gcccctgctg gtggccacat 1800
tctggcctga gctcccggaa aagattgatg cggtatacga ggccccacag gaggagaagg 1860
ctgtgttctt tgcagggaat gaatactgga tctactcagc cagcaccctg gagcgagggt 1920
accccaagcc actgaccagc ctgggactgc cccctgatgt ccagcgagtg gatgccgcct 1980
ttaactggag caaaaacaag aagacataca tctttgctgg agacaaattc tggagataca 2040
atgaggtgaa gaagaaaatg gatcctggct ttcccaagct catcgcagat gcctggaatg 2100
ccatccccga taacctggat gccgtcgtgg acctgcaggg cggcggtcac agctacttct 2160
tcaagggtgc ctattacctg aagctggaga accaaagtct gaagagcgtg aagtttggaa 2220
gcatcaaatc cgactggcta ggctgctgag ctggccctgg ctcccacagg cccttcctct 2280
ccactgcctt cgatacaccg ggcctggaga actagagaag gacccggagg ggcctggcag 2340
ccgtgccttc agctctacag ctaatcagca ttctcactcc tacctggtaa tttaagattc 2400
cagagagtgg ctcctcccgg tgcccaagaa tagatgctga ctgtactcct cccaggcgcc 2460
ccttccccct ccaatcccac caaccctcag agccacccct aaagagatcc tttgatattt 2520
tcaacgcagc cctgctttgg gctgccctgg tgctgccaca cttcaggctc ttctcctttc 2580
acaaccttct gtggctcaca gaacccttgg agccaatgga gactgtctca agagggcact 2640
ggtggcccga cagcctggca cagggcagtg ggacagggca tggccaggtg gccactccag 2700
acccctggct tttcactgct ggctgcctta gaacctttct tacattagca gtttgctttg 2760
tatgcacttt gtttttttct ttgggtcttg tttttttttt ccacttagaa attgcatttc 2820
ctgacagaag gactcaggtt gtctgaagtc actgcacagt gcatctcagc ccacatagtg 2880
atggttcccc tgttcactct acttagcatg tccctaccga gtctcttctc cactggatgg 2940
aggaaaacca agccgtggct tcccgctcag ccctccctgc ccctcccttc aaccattccc 3000
catgggaaat gtcaacaagt atgaataaag acacctactg agtgaaaaaa aaaaaaaaaa 3060
aaaaa 3065
<210> 19
<211> 4093
<212> DNA
<213> Homo sapiens
<400> 19
gtgagagagt gagcgagaca gaaagagaga gaagtgcacc agcgagccgg ggcaggaaga 60
ggaggtttcg ccaccggagc ggcccggcga cgcgctgaca gcttcccctg cccttcccgt 120
cggtcgggcc gccagccgcc gcagccctcg gcctgcacgc agccaccggc cccgctcccg 180
gagcccagcg ccgccgaggc cgcagccgcc cggccagtaa ggcggcgccg ccgcccggcc 240
accgcgcgcc ctgcgcttcc ctccgcccgc gctgcggcca tggcgcggcg ctgactggcc 300
tggcccggcc ccgccgcgct cccgctcgcc ccgacccgca ctcgggcccg cccgggctcc 360
ggcctgccgc cgcctcttcc ttctccagcc ggcaggcccg cgccgcttag gagggagagc 420
ccacccgcgc caggaggccg aacgcggact cgccacccgg cttcagaatg gcagaagatg 480
atccatattt gggaaggcct gaacaaatgt ttcatttgga tccttctttg actcatacaa 540
tatttaatcc agaagtattt caaccacaga tggcactgcc aacagcagat ggcccatacc 600
ttcaaatatt agagcaacct aaacagagag gatttcgttt ccgttatgta tgtgaaggcc 660
catcccatgg tggactacct ggtgcctcta gtgaaaagaa caagaagtct taccctcagg 720
tcaaaatctg caactatgtg ggaccagcaa aggttattgt tcagttggtc acaaatggaa 780
aaaatatcca cctgcatgcc cacagcctgg tgggaaaaca ctgtgaggat gggatctgca 840
ctgtaactgc tggacccaag gacatggtgg tcggcttcgc aaacctgggt atacttcatg 900
tgacaaagaa aaaagtattt gaaacactgg aagcacgaat gacagaggcg tgtataaggg 960
gctataatcc tggactcttg gtgcaccctg accttgccta tttgcaagca gaaggtggag 1020
gggaccggca gctgggagat cgggaaaaag agctaatccg ccaagcagct ctgcagcaga 1080
ccaaggagat ggacctcagc gtggtgcggc tcatgtttac agcttttctt ccggatagca 1140
ctggcagctt cacaaggcgc ctggaacccg tggtatcaga cgccatctat gacagtaaag 1200
cccccaatgc atccaacttg aaaattgtaa gaatggacag gacagctgga tgtgtgactg 1260
gaggggagga aatttatctt ctttgtgaca aagttcagaa agatgacatc cagattcgat 1320
tttatgaaga ggaagaaaat ggtggagtct gggaaggatt tggagatttt tcccccacag 1380
atgttcatag acaatttgcc attgtcttca aaactccaaa gtataaagat attaatatta 1440
caaaaccagc ctctgtgttt gtccagcttc ggaggaaatc tgacttggaa actagtgaac 1500
caaaaccttt cctctactat cctgaaatca aagataaaga agaagtgcag aggaaacgtc 1560
agaagctcat gcccaatttt tcggatagtt tcggcggtgg tagtggtgct ggagctggag 1620
gcggaggcat gtttggtagt ggcggtggag gagggggcac tggaagtaca ggtccagggt 1680
atagcttccc acactatgga tttcctactt atggtgggat tactttccat cctggaacta 1740
ctaaatctaa tgctgggatg aagcatggaa ccatggacac tgaatctaaa aaggaccctg 1800
aaggttgtga caaaagtgat gacaaaaaca ctgtaaacct ctttgggaaa gttattgaaa 1860
ccacagagca agatcaggag cccagcgagg ccaccgttgg gaatggtgag gtcactctaa 1920
cgtatgcaac aggaacaaaa gaagagagtg ctggagttca ggataacctc tttctagaga 1980
aggctatgca gcttgcaaag aggcatgcca atgccctttt cgactacgcg gtgacaggag 2040
acgtgaagat gctgctggcc gtccagcgcc atctcactgc tgtgcaggat gagaatgggg 2100
acagtgtctt acacttagca atcatccacc ttcattctca acttgtgagg gatctactag 2160
aagtcacatc tggtttgatt tctgatgaca ttatcaacat gagaaatgat ctgtaccaga 2220
cgcccttgca cttggcagtg atcactaagc aggaagatgt ggtggaggat ttgctgaggg 2280
ctggggccga cctgagcctt ctggaccgct tgggtaactc tgttttgcac ctagctgcca 2340
aagaaggaca tgataaagtt ctcagtatct tactcaagca caaaaaggca gcactacttc 2400
ttgaccaccc caacggggac ggtctgaatg ccattcatct agccatgatg agcaatagcc 2460
tgccatgttt gctgctgctg gtggccgctg gggctgacgt caatgctcag gagcagaagt 2520
ccgggcgcac agcactgcac ctggctgtgg agcacgacaa catctcattg gcaggctgcc 2580
tgctcctgga gggtgatgcc catgtggaca gtactaccta cgatggaacc acacccctgc 2640
atatagcagc tgggagaggg tccaccaggc tggcagctct tctcaaagca gcaggagcag 2700
atcccctggt ggagaacttt gagcctctct atgacctgga tgactcttgg gaaaatgcag 2760
gagaggatga aggagttgtg cctggaacca cgcctctaga tatggccacc agctggcagg 2820
tatttgacat attaaatggg aaaccatatg agccagagtt tacatctgat gatttactag 2880
cacaaggaga catgaaacag ctggctgaag atgtgaagct gcagctgtat aagttactag 2940
aaattcctga tccagacaaa aactgggcta ctctggcgca gaaattaggt ctggggatac 3000
ttaataatgc cttccggctg agtcctgctc cttccaaaac acttatggac aactatgagg 3060
tctctggggg tacagtcaga gagctggtgg aggccctgag acaaatgggc tacaccgaag 3120
caattgaagt gatccaggca gcctccagcc cagtgaagac cacctctcag gcccactcgc 3180
tgcctctctc gcctgcctcc acaaggcagc aaatagacga gctccgagac agtgacagtg 3240
tctgcgacag cggcgtggag acatccttcc gcaaactcag ctttaccgag tctctgacca 3300
gtggtgcctc actgctaact ctcaacaaaa tgccccatga ttatgggcag gaaggacctc 3360
tagaaggcaa aatttagcct gctgacaatt tcccacaccg tgtaaaccaa agccctaaaa 3420
ttccactgcg ttgtccacaa gacagaagct gaagtgcatc caaaggtgct cagagagccg 3480
gcccgcctga atcattctcg atttaactcg agaccttttc aacttggctt cctttcttgg 3540
ttcataaatg aattttagtt tggttcactt acagatagta tctagcaatc acaacactgg 3600
ctgagcggat gcatctgggg atgaggttgc ttactaagct ttgccagctg ctgctggatc 3660
acagctgctt tctgttgtca ttgctgttgt ccctctgcta cgttcctatt gtcattaaag 3720
gtatcacggt cgccacctgg cattccttct gaccacagca tcattttgca ttcaaattaa 3780
gggttaagaa aagagatatt ttaaaatgag agtcacttga tgtgccattt taaaaaaaaa 3840
ggcatattgc tttttctaat gtggttattt ctctgatttg caaaaaaaaa aaaaaaaaaa 3900
atacttgtca atatttaaac atggttacaa tcattgctga aaatggtatt ttcccccttt 3960
tctgcatttt gctattgtaa atatgttttt tagatcaaat actttaaagg aaaaaatgtt 4020
ggatttataa atgctatttt ttattttact tttataataa aaggaaaagc aaattgatga 4080
cctcaaaaaa aaa 4093
<210> 20
<211> 925
<212> DNA
<213> Homo sapiens
<400> 20
agtctgggac gcgccgccgc catgatcatc cctgtacgct gcttcacttg tggcaagatc 60
gtcggcaaca agtgggaggc ttacctgggg ctgctgcagg ccgagtacac cgagggggat 120
gcgctggatg ccctgggcct gaagcgctac tgctgccgcc ggatgctgct ggcccacgtg 180
gacctgatcg agaagctgct caattatgca cccctggaga agtgaccacg ctggaaccca 240
cccacccgct gtgctgacca tgggccctga gcgtcctgcc ccgaattcac gaggctgagg 300
catccgggag ctggcgtaat gcctggccgc agtgtgtgtg tatccgatac cccactctgg 360
aaggaaccat ccagtaaagg tctttcagaa ccactaaggt cccagccctc actaggatgt 420
caggagccag gtctaggccc agctttcaca ctgtggcagc ccagtgaagc agactgggcc 480
atgaactctc ctagccctgg ggccagcctg ttccacaggc acccctgcag gaggcgctgc 540
caggagagcc ttccatctcg gggctctttg aggttccctc cttctgggtg ttcttcaggc 600
tgagcagaga ggctcctgta ccctctctct cggaatctga agagccagat ttaggccggg 660
caaaggggct cacccctata atcccaggac tttgggaggc caaggcagga ggatcacttg 720
agtccagaaa ttcaagaccc gcctgggcat cataatgaga ccccatctct acaacaaaat 780
ttaataaatt agctgggcac agtgttcaca cctgtagtcc cggccactcg gggctgaggc 840
aggaggatca ctggaacctg ggaggttgcc actgcaaaaa aaaaaaaaaa aaaaaaaaaa 900
aaaaaaaaaa aaaaaaaaaa aaaaa 925
<210> 21
<211> 849
<212> DNA
<213> Homo sapiens
<400> 21
acagttgctt tgaggcagta ccggaggaga aagatggcgg ctaccttact agctgctcgg 60
ggagccgggc cagcaccggc ttgggggccg gaggcgttca ctccagactg ggaaagccga 120
gaagtttcca ctgggaccac tatcatggcc gtgcagtttg acgggggcgt ggttctgggg 180
gcggactcca gaacaaccac tgggtcctac atcgccaatc gagtgactga caagctgaca 240
cctattcacg accgcatttt ctgctgtcgc tcaggctcag ctgctgatac ccaggcagta 300
gctgatgctg tcacctacca gctcggtttc cacagcattg aactgaatga gcctccactg 360
gtccacacag cagccagcct ctttaaggag atgtgttacc gataccggga agacctgatg 420
gcgggaatca tcatcgcagg ctgggaccct caagaaggag ggcaggtgta ctcagtgcct 480
atggggggta tgatggtaag gcagtccttt gccattggag gctccgggag ctcctacatc 540
tatggctatg ttgatgctac ctaccgggaa ggcatgacca aggaagagtg tctgcaattc 600
actgccaatg ctctcgcttt ggccatggag cgggatggct ccagtggagg agtgatccgc 660
ctggcagcca ttgcagagtc aggggtagag cggcaagtac ttttgggaga ccagataccc 720
aaattcgccg ttgccacttt accacccgcc tgaatcctgg gattctagta tgcaataaga 780
gatgccctgt actgatgcaa aatttaataa agtttgtcac agagaaaaaa aaaaaaaaaa 840
aaaaaaaaa 849
<210> 22
<211> 4142
<212> DNA
<213> Homo sapiens
<400> 22
atatgacaga tacctagcat ctagcaaaat aatggcagct gcttaccttg accccaactt 60
gaatcacaca ccaaattcga gtactaagac tcacctgggt actggtatgg aacgttctcc 120
tggtgcaatg gagcgagtat taaaggtctt tcattatttt gaaagcaata gtgagccaac 180
cacctgggcc agtattatca ggcatggaga tgctactgat gtcaggggca tcattcagaa 240
gatagtggac agtcacaaag taaagcatgt ggcctgctat ggattccgcc tcagtcacct 300
gcggtcagag gaggttcact ggcttcacgt ggatatgggc gtctccagtg tgagggagaa 360
gtatgagctt gctcacccac cagaggagtg gaaatatgaa ttgagaattc gttatttgcc 420
aaaaggattt ctaaaccagt ttactgaaga taagccaact ttgaatttct tctatcaaca 480
ggtgaagagc gattatatgt tagagatagc tgatcaagtg gaccaggaaa ttgctttgaa 540
gttgggttgt ctagaaatac ggcgatcata ctgggagatg cggggcaatg cactagaaaa 600
gaagtctaac tatgaagtat tagaaaaaga tgttggttta aagcgatttt ttcctaagag 660
tttactggat tctgtcaagg ccaaaacact aagaaaactg atccaacaaa catttagaca 720
atttgccaac cttaatagag aagaaagtat tctgaaattc tttgagatcc tgtctccagt 780
ctacagattt gataaggaat gcttcaagtg tgctcttggt tcaagctgga ttatttcagt 840
ggaactggca atcggcccag aagaaggaat cagttaccta acggacaagg gctgcaatcc 900
cacacatctt gctgacttca ctcaagtgca aaccattcag tattcaaaca gtgaagacaa 960
ggacagaaaa ggaatgctac aactaaaaat agcaggtgca cccgagcctc tgacagtgac 1020
ggcaccatcc ctaaccattg cggagaatat ggctgaccta atagatgggt actgccggct 1080
ggtgaatgga acctcgcagt catttatcat cagacctcag aaagaaggtg aacgggcttt 1140
gccatcaata ccaaagttgg ccaacagcga aaagcaaggc atgcggacac acgccgtctc 1200
tgtgtcagaa acagatgatt atgctgagat tatagatgaa gaagatactt acaccatgcc 1260
ctcaaccagg gattatgaga ttcaaagaga aagaatagaa cttggacgat gtattggaga 1320
aggccaattt ggagatgtac atcaaggcat ttatatgagt ccagagaatc cagctttggc 1380
ggttgcaatt aaaacatgta aaaactgtac ttcggacagc gtgagagaga aatttcttca 1440
agaagcctta acaatgcgtc agtttgacca tcctcatatt gtgaagctga ttggagtcat 1500
cacagagaat cctgtctgga taatcatgga gctgtgcaca cttggagagc tgaggtcatt 1560
tttgcaagta aggaaataca gtttggatct agcatctttg atcctgtatg cctatcagct 1620
tagtacagct cttgcatatc tagagagcaa aagatttgta cacagggaca ttgctgctcg 1680
gaatgttctg gtgtcctcaa atgattgtgt aaaattagga gactttggat tatcccgata 1740
tatggaagat agtacttact acaaagcttc caaaggaaaa ttgcctatta aatggatggc 1800
tccagagtca atcaattttc gacgttttac ctcagctagt gacgtatgga tgtttggtgt 1860
gtgtatgtgg gagatactga tgcatggtgt gaagcctttt caaggagtga agaacaatga 1920
tgtaatcggt cgaattgaaa atggggaaag attaccaatg cctccaaatt gtcctcctac 1980
cctctacagc cttatgacga aatgctgggc ctatgacccc agcaggcggc ccaggtttac 2040
tgaacttaaa gctcagctca gcacaatcct ggaggaagag aaggctcagc aagaagagcg 2100
catgaggatg gagtccagaa gacaggccac agtgtcctgg gactccggag ggtctgatga 2160
agcaccgccc aagcccagca gaccgggtta tcccagtccg aggtccagcg aaggatttta 2220
tcccagccca cagcacatgg tacaaaccaa tcattaccag gactctacag tattggacct 2280
gcgagggatt gggcaagtgt tgccaaccca tctgatggaa gagcgtctaa tccgacagca 2340
acaggaaatg gaagaagatc agcgctggct ggaaaaagag gaaagatttc tgaaacctga 2400
tgtgagactc tctcgaggca gtattgacag ggaggatgga agtcttcagg gtccgattgg 2460
aaaccaacat atatatcagc ctgtgggtaa accagatcct gcagctccac caaagaaacc 2520
gcctcgccct ggagctcccg gtcatctggg aagccttgcc agcctcagca gccctgctga 2580
cagctacaac gagggtgtca agcttcagcc ccaggaaatc agcccccctc ctactgccaa 2640
cctggaccgg tcgaatgata aggtgtacga gaatgtgacg ggcctggtga aagctgtcat 2700
cgagatgtcc agtaaaatcc agccagcccc accagaggag tatgtcccta tggtgaagga 2760
agtcggcttg gccctgagga cattattggc cactgtggat gagaccattc ccctcctacc 2820
agccagcacc caccgagaga ttgagatggc acagaagcta ttgaactctg acctgggtga 2880
gctcatcaac aagatgaaac tggcccagca gtatgtcatg accagcctcc agcaagagta 2940
caaaaagcaa atgctgactg ctgctcacgc cctggctgtg gatgccaaaa acttactcga 3000
tgtcattgac caagcaagac tgaaaatgct tgggcagacg agaccacact gagcctcccc 3060
taggagcacg tcttgctacc ctcttttgaa gatgttctct agccttccac cagcagcgag 3120
gaattaaccc tgtgtcctca gtcgccagca cttacagctc caactttttt gaatgaccat 3180
ctggttgaaa aatctttctc atataagttt aaccacactt tgatttgggt tcattttttg 3240
ttttgttttt ttcaatcatg atattcagaa aaatccagga tccaaaatgt ggcgtttttc 3300
taagaatgaa aattatatgt aagcttttaa gcatcatgaa gaacaattta tgttcacatt 3360
aagatacgtt ctaaaggggg atggccaagg ggtgacatct taattcctaa actaccttag 3420
ctgcatagtg gaagaggaga gcatgaagca aagaattcca ggaaacccaa gaggctgaga 3480
attcttttgt ctaccataga attattatcc agactggaat ttttgtttgt tagaacaccc 3540
ttcagttgca atatgctaat cccactttac aaagaatata aaagctatat tttgaagact 3600
tgagttattt cagaaaaaac tacagccctt tttgtcttac ctgcctttta ctttcgtgtg 3660
gatatgtgaa gcattgggtc gggaactagc tgtagaacac aactaaaaac tcatgtcttt 3720
tttcacagaa taatgtgcca gttttttgta gcaatgatat ttctcttgga agcagaaatg 3780
ctttgtacca gagcacctcc aaactgcatt gaggagaagt tccagaacca tccccttttt 3840
ccatttttat ataatttata aagaaagatt aaagccatgt tgactatttt acagccactg 3900
gagttaacta acccttcctt gtatctgtct tcccaggaga gaatgaagca aaacaggaat 3960
ttggttttct tttgatgtcc agttacacca tccattctgt taattttgaa aaaatatacc 4020
ctccctttag tttgttgggg gatataaatt attctcagga agaatataat gaactgtaca 4080
gttactttga cctattaaaa aggtgttacc agtaaagttc ttgttgtaaa aaaaaaaaaa 4140
aa 4142
<210> 23
<211> 2594
<212> DNA
<213> Homo sapiens
<400> 23
aggggccgcg gagccgcggc taaggaacgc gggccgccca cccgctcccg gtgcagcggc 60
ctccgcgccg ggttttggcg cctcccgcgg gcgcccccct cctcacggcg agcgctgcca 120
cgtcagacga agggcgcagc gagcgtcctg atccttccgc ccggacgctc aggacagcgg 180
cccgctgctc ataagactcg gccttagaac cccagtatca gcagaaggac attttaggac 240
gggacttggg tgactctagg gcactggttt tctttccaga gagcggaaca ggcgaggaaa 300
agtagtccct tctcggcgat tctgcggagg gatctccgtg gggcggtgaa cgccgatgat 360
tatataagga cgcgccgggt gtggcacagc tagttccgtc gcagccggga tttgggtcgc 420
agttcttgtt tgtggatcgc tgtgatcgtc acttgacaat gcagatcttc gtgaagactc 480
tgactggtaa gaccatcacc ctcgaggttg agcccagtga caccatcgag aatgtcaagg 540
caaagatcca agataaggaa ggcatccctc ctgaccagca gaggctgatc tttgctggaa 600
aacagctgga agatgggcgc accctgtctg actacaacat ccagaaagag tccaccctgc 660
acctggtgct ccgtctcaga ggtgggatgc aaatcttcgt gaagacactc actggcaaga 720
ccatcaccct tgaggtcgag cccagtgaca ccatcgagaa cgtcaaagca aagatccagg 780
acaaggaagg cattcctcct gaccagcaga ggttgatctt tgccggaaag cagctggaag 840
atgggcgcac cctgtctgac tacaacatcc agaaagagtc taccctgcac ctggtgctcc 900
gtctcagagg tgggatgcag atcttcgtga agaccctgac tggtaagacc atcaccctcg 960
aggtggagcc cagtgacacc atcgagaatg tcaaggcaaa gatccaagat aaggaaggca 1020
ttccttctga tcagcagagg ttgatctttg ccggaaaaca gctggaagat ggtcgtaccc 1080
tgtctgacta caacatccag aaagagtcca ccttgcacct ggtactccgt ctcagaggtg 1140
ggatgcaaat cttcgtgaag acactcactg gcaagaccat cacccttgag gtcgagccca 1200
gtgacactat cgagaacgtc aaagcaaaga tccaagacaa ggaaggcatt cctcctgacc 1260
agcagaggtt gatctttgcc ggaaagcagc tggaagatgg gcgcaccctg tctgactaca 1320
acatccagaa agagtctacc ctgcacctgg tgctccgtct cagaggtggg atgcagatct 1380
tcgtgaagac cctgactggt aagaccatca ctctcgaagt ggagccgagt gacaccattg 1440
agaatgtcaa ggcaaagatc caagacaagg aaggcatccc tcctgaccag cagaggttga 1500
tctttgccgg aaaacagctg gaagatggtc gtaccctgtc tgactacaac atccagaaag 1560
agtccacctt gcacctggtg ctccgtctca gaggtgggat gcagatcttc gtgaagaccc 1620
tgactggtaa gaccatcact ctcgaggtgg agccgagtga caccattgag aatgtcaagg 1680
caaagatcca agacaaggaa ggcatccctc ctgaccagca gaggttgatc tttgctggga 1740
aacagctgga agatggacgc accctgtctg actacaacat ccagaaagag tccaccctgc 1800
acctggtgct ccgtcttaga ggtgggatgc agatcttcgt gaagaccctg actggtaaga 1860
ccatcactct cgaagtggag ccgagtgaca ccattgagaa tgtcaaggca aagatccaag 1920
acaaggaagg catccctcct gaccagcaga ggttgatctt tgctgggaaa cagctggaag 1980
atggacgcac cctgtctgac tacaacatcc agaaagagtc caccctgcac ctggtgctcc 2040
gtcttagagg tgggatgcag atcttcgtga agaccctgac tggtaagacc atcactctcg 2100
aagtggagcc gagtgacacc attgagaatg tcaaggcaaa gatccaagac aaggaaggca 2160
tccctcctga ccagcagagg ttgatctttg ctgggaaaca gctggaagat ggacgcaccc 2220
tgtctgacta caacatccag aaagagtcca ccctgcacct ggtgctccgt ctcagaggtg 2280
ggatgcaaat cttcgtgaag accctgactg gtaagaccat caccctcgag gtggagccca 2340
gtgacaccat cgagaatgtc aaggcaaaga tccaagataa ggaaggcatc cctcctgatc 2400
agcagaggtt gatctttgct gggaaacagc tggaagatgg acgcaccctg tctgactaca 2460
acatccagaa agagtccact ctgcacttgg tcctgcgctt gagggggggt gtctaagttt 2520
ccccttttaa ggtttcaaca aatttcattg cactttcctt tcaataaagt tgttgcattc 2580
ccaaaaaaaa aaaa 2594
Claims (19)
- 결장직장암 재발과 상관된 예후 유전자 프로파일의 양적 발현에 대하여 환자 샘플을 분석하도록 적합화된 검정 시스템이며, 상기 프로파일은 서열 1, 2, 3, 4 및 5의 핵산 서열의 발현을 포함하는 것인, 환자에서 결장직장암의 재발 및/또는 비-재발을 예측하기 위한 검정 시스템.
- 제1항에 있어서, 서열 1, 2, 3, 4 및 5의 핵산 서열의 양적 발현을 분석하도록 적합화된 검정 시스템.
- 제1항에 있어서, 서열 6 내지 23의 핵산 서열 중 하나 이상의 발현을 양적으로 분석하도록 추가로 적합화된 검정 시스템.
- 제1항에 따른 검정 시스템을 포함하는 장치.
- 환자의 샘플로부터 수득된 유전자 발현 데이터를 하기의 예후 규칙에 적용하도록 설계된 컴퓨터 소프트웨어를 포함하는, 환자에서 결장직장암의 재발 및/또는 비-재발을 예측하기 위한 분석 시스템:
[(((서열 1 / 서열 3) × 서열 5) - ((서열 2 / 서열 4) × 서열 3)) ≥ -4.4777]일 경우, 재발함. - 제5항에 따른 분석 시스템을 포함하는 장치.
- 제6항에 따른 검정 시스템 및 제5항에 따른 분석 시스템을 포함하는 장치.
- 환자의 샘플로부터 수득된 유전자 발현 데이터를 하기의 예후 규칙에 적용하도록 설계된 컴퓨터 소프트웨어를 포함하는, 환자에서 결장직장암의 재발 및/또는 비-재발을 예측하기 위한 분석 시스템:
규칙이 서열 1-23을 사용할 경우, 재발함. - a) 적어도 서열 1, 2, 3, 4 및 5의 핵산 서열 각각의 코딩 서열을 나타내는 단리 및 정제된 폴리뉴클레오티드;
b) 서열 1, 2, 3, 4 및 5의 핵산 서열 각각의 단리된 RNA, cDNA 또는 gDNA 분자;
c) a) 또는 b)의 상보체 또는 일부;
d) a), b) 또는 c)를 증폭하도록 설계된 증폭 프로브; 또는
e) a), b) 또는 c)의 발현을 분석하도록 설계된 혼성화 프로브
를 포함하며, 결장직장암 재발의 위험성을 측정하도록 적합화된 장치 또는 키트. - 서열 1, 2, 3, 4 및 5의 핵산 서열을 함유하는 예후 결장직장암 유전자 프로파일 발현의 양적 분석에 적합화된 프로브를 포함하는 매트릭스.
- 제10항에 따른 매트릭스를 포함하는 결장직장암 예후 핵산 마이크로어레이.
- a) 서열 1, 2, 3, 4 및 5의 핵산 서열을 함유하는 예후 결장직장암 유전자 프로파일의 각 유전자에 대한 환자의 측정된 발현 수준을 제5항에 따른 분석 시스템에 제공하는 단계;
b) 환자의 측정된 유전자 발현 수준을 분석 시스템의 규칙에 적용하는 단계; 및
c) 규칙에 적용된 환자의 유전자 발현 수준의 분석 결과가 -4.4777 이상일 경우, 환자에서 비교적 높은 결장직장암 재발 위험성을 예측하는 단계
를 포함하는, 환자에서의 결장직장암 재발 위험성의 예측 방법. - 환자의 샘플로부터 수득된 양적 유전자 발현 데이터를 서열 1, 2, 3, 4 및 5의 핵산 서열 전체 또는 그의 하위세트로 구성되는 결장직장암 예후 유전자 프로파일로부터 유도된 예후 규칙에 적용하도록 설계된 컴퓨터 소프트웨어를 포함하는, 환자에서 결장직장암의 재발 및/또는 비-재발을 예측하기 위한 분석 시스템.
- a) 서열 1, 2, 3, 4 및 5, 또는 유도된 규칙의 하위세트의 핵산 서열을 함유하는 예후 결장직장암 유전자 프로파일의 각 유전자에 대한 환자의 측정된 발현 수준을 제13항에 따른 분석 시스템에 제공하는 단계;
b) 환자의 측정된 유전자 발현 수준을 분석 시스템의 규칙에 적용하는 단계; 및
c) 규칙에 적용된 환자의 유전자 발현 수준의 분석 결과가 -4.4777 이상일 경우, 환자에서 비교적 높은 결장직장암 재발 위험성을 예측하는 단계
를 포함하는, 환자에서의 결장직장암 재발 위험성의 예측 방법. - 결장직장암 재발과 상관된 예후 유전자 프로파일의 양적 발현에 대하여 환자 샘플을 분석하도록 적합화된 검정 시스템이며, 상기 프로파일은 서열 1, 2, 3, 4, 5, 6, 7, 8, 10, 14, 18 및 19의 핵산 서열의 발현을 포함하는 것인, 환자에서 결장직장암의 재발 및/또는 비-재발을 예측하기 위한 검정 시스템.
- 제15항에 있어서, 환자의 샘플로부터 수득된 유전자 발현 데이터를 하기를 포함하는 하나 이상의 예후 규칙에 적용하도록 설계된 컴퓨터 소프트웨어를 포함하는, 환자에서 결장직장암의 재발 및/또는 비-재발을 예측하도록 적합화된 검정 시스템:
1. [(((서열 1 / 서열 3) * 서열 5) - ((서열 2 / 서열 4) * 서열 3)) ≥ -4.4777]일 경우, 재발함;
2. [((서열 6 * 서열 1) * (서열 4 / 서열 18))] >= 90.169556일 경우, 재발함;
3. [((서열 14 / 서열 8) * (서열 6 / 서열 3))] >= 0.087297일 경우, 재발함;
4. [((서열 6 / 서열 19) * (서열 4 / 서열 10))] >= 7.500713일 경우, 재발함;
5. [((서열 6 / 서열 2) * (서열 4 / 서열 10))] >= 14.345780일 경우, 재발함;
6. [(서열 7 / (서열 18 * (서열 8 / 서열 14)))] >= 0.049082일 경우, 재발함;
7. [((서열 6 / 서열 3) * (서열 1 / 서열 14))] >= 0.305097일 경우, 재발함; 및
8. [((서열 6 * 서열 4) * (서열 14 / 서열 18))] >= 110.769318일 경우, 재발함. - a) 적어도 서열 1, 2, 3, 4, 5, 6, 7, 8, 10, 14, 18 및 19의 핵산 서열 각각의 코딩 서열을 나타내는 단리 및 정제된 폴리뉴클레오티드;
b) 서열 1, 2, 3, 4, 5, 6, 7, 8, 10, 14, 18 및 19의 핵산 서열 각각의 단리된 RNA, cDNA 또는 gDNA 분자;
c) a) 또는 b)의 상보체 또는 일부;
d) a), b) 또는 c)를 증폭하도록 설계된 증폭 프로브; 또는
e) a), b) 또는 c)의 발현을 분석하도록 설계된 혼성화 프로브
를 포함하며, 결장직장암 재발의 위험성을 측정하도록 적합화된 장치. - a) 적어도 서열 1, 2, 3, 4, 5, 6, 7, 8, 10, 14, 18 및 19의 핵산 서열 각각의 코딩 서열을 나타내는 단리 및 정제된 폴리뉴클레오티드;
b) 서열 1, 2, 3, 4, 5, 6, 7, 8, 10, 14, 18 및 19의 핵산 서열 각각의 단리된 RNA, cDNA 또는 gDNA 분자;
c) a) 또는 b)의 상보체 또는 일부;
d) a), b) 또는 c)를 증폭하도록 설계된 증폭 프로브; 또는
e) a), b) 또는 c)의 발현을 분석하도록 설계된 혼성화 프로브
를 포함하며, 결장직장암 재발의 위험성을 측정하도록 적합화된 키트. - a) 결장직장암 재발과 상관된 예후 유전자 프로파일의 양적 발현에 대하여 환자 샘플을 분석하도록 적합화된 분석 시스템이며, 상기 프로파일은 서열 1, 2, 3, 4, 5, 6, 7, 8, 10, 14, 18 및 19의 핵산 서열의 발현을 포함하는 것인, 환자에서 결장직장암의 재발 및/또는 비-재발을 예측하기 위한 분석 시스템을 제공하는 단계;
b) 환자의 측정된 유전자 발현 수준을 하기를 포함하는 하나 이상의 예후 규칙에 적용하는 단계:
1. [(((서열 1 / 서열 3) * 서열 5) - ((서열 2 / 서열 4) * 서열 3)) ≥ -4.4777]일 경우, 재발함;
2. [((서열 6 * 서열 1) * (서열 4 / 서열 18))] >= 90.169556일 경우, 재발함;
3. [((서열 14 / 서열 8) * (서열 6 / 서열 3))] >= 0.087297일 경우, 재발함;
4. [((서열 6 / 서열 19) * (서열 4 / 서열 10))] >= 7.500713일 경우, 재발함;
5. [((서열 6 / 서열 2) * (서열 4 / 서열 10))] >= 14.345780일 경우, 재발함;
6. [(서열 7 / (서열 18 * (서열 8 / 서열 14)))] >= 0.049082일 경우, 재발함;
7. [((서열 6 / 서열 3) * (서열 1 / 서열 14))] >= 0.305097일 경우, 재발함; 및
8. [((서열 6 * 서열 4) * (서열 14 / 서열 18))] >= 110.769318일 경우, 재발함; 및
c) 적용된 하나 이상의 예후 규칙에 대한 반응으로 환자에서 결장직장암 재발의 위험성을 예측하는 단계
를 포함하는, 환자에서의 결장직장암 재발 위험성의 예측 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161433798P | 2011-01-18 | 2011-01-18 | |
US61/433,798 | 2011-01-18 | ||
PCT/US2012/021539 WO2012099872A1 (en) | 2011-01-18 | 2012-01-17 | Prognostic signature for colorectal cancer recurrence |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20140040694A true KR20140040694A (ko) | 2014-04-03 |
Family
ID=46516038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137020961A KR20140040694A (ko) | 2011-01-18 | 2012-01-17 | 결장직장암 재발에 대한 예후 서명 |
Country Status (10)
Country | Link |
---|---|
US (1) | US9234245B2 (ko) |
EP (1) | EP2665835B1 (ko) |
JP (1) | JP2014503222A (ko) |
KR (1) | KR20140040694A (ko) |
CN (1) | CN103403187A (ko) |
AU (1) | AU2012207442B2 (ko) |
CA (1) | CA2825046A1 (ko) |
IL (1) | IL227419A (ko) |
MX (1) | MX2013008252A (ko) |
WO (1) | WO2012099872A1 (ko) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6757560B2 (ja) * | 2014-09-26 | 2020-09-23 | シスメックス株式会社 | 大腸癌の再発リスク診断を補助する方法、プログラムおよびコンピュータシステム |
US10900084B2 (en) | 2015-09-16 | 2021-01-26 | Sysmex Corporation | Method for supporting diagnosis of risk of colorectal cancer recurrence, treatment of colorectal cancer, and administration of anticancer drug |
SE540173C2 (en) * | 2016-04-20 | 2018-04-24 | Hiloprobe Ab | Marker genes for colorectal cancer classification, method for judging lymph node metastasis for prognosis of colorectal cancer and kit therefor |
CN112004945A (zh) * | 2018-01-22 | 2020-11-27 | 液体活检研究有限责任公司 | 用于结肠癌检测和治疗监控的方法 |
EP3888021B1 (en) | 2018-11-30 | 2024-02-21 | Caris MPI, Inc. | Next-generation molecular profiling |
CN111321221B (zh) * | 2018-12-14 | 2022-09-23 | 中国医学科学院肿瘤医院 | 用于预测直肠癌局部切除手术后复发风险的组合物、微阵列和计算机系统 |
CN109929934B (zh) * | 2019-03-27 | 2022-09-09 | 中山大学附属第六医院 | 免疫相关基因在结直肠癌预后的试剂盒和系统中的应用 |
CN113436741B (zh) * | 2021-07-16 | 2023-02-28 | 四川大学华西医院 | 基于组织特异增强子区域dna甲基化的肺癌复发预测方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6582908B2 (en) * | 1990-12-06 | 2003-06-24 | Affymetrix, Inc. | Oligonucleotides |
GB9425138D0 (en) * | 1994-12-12 | 1995-02-08 | Dynal As | Isolation of nucleic acid |
US20020068277A1 (en) * | 1998-11-20 | 2002-06-06 | Simpson Andrew John George | Method for determining nucleotide sequences using arbitrary primers and low stringency |
EP1509614A4 (en) * | 2002-02-15 | 2007-09-12 | Gen Hospital Corp | MAP KINASE INHIBITORS FOR REGULATING TUMOR ASSOCIATED ANTIGENE EXPRESSION |
GB0323226D0 (en) * | 2003-10-03 | 2003-11-05 | Ncc Technology Ventures Pte Lt | Materials and methods relating to breast cancer diagnosis |
WO2005085861A2 (en) * | 2004-03-03 | 2005-09-15 | Oridis Biomed Forschungs- Und Entwicklungs Gmbh | Nucleic acids and encoded polypeptides for use in liver disorders and epithelial cancer |
AU2005321898B2 (en) | 2004-12-29 | 2012-07-19 | Mannkind Corporation | Use of compositions comprising various tumor-associated antigens as anti-cancer vaccines |
WO2006110314A2 (en) * | 2005-03-25 | 2006-10-19 | Ambion, Inc. | Methods and compositions for depleting abundant rna transcripts |
WO2008021290A2 (en) * | 2006-08-09 | 2008-02-21 | Homestead Clinical Corporation | Organ-specific proteins and methods of their use |
EP2506172A1 (en) * | 2006-11-03 | 2012-10-03 | Baylor Research Institute | Diagnosis of metastatic melanoma and monitoring indicators of immunosuppression through blood leukocyte microarray analysis |
AT504702A1 (de) * | 2006-12-22 | 2008-07-15 | Arc Austrian Res Centers Gmbh | Set von tumormarkern |
JP2010178650A (ja) * | 2009-02-04 | 2010-08-19 | Univ Of Tokyo | 固形癌の再発予測のための試験方法および再発予防剤 |
GB0904904D0 (en) | 2009-03-23 | 2009-05-06 | Univ Leiden Medical Ct | Angiogenesis methods, medicaments and agents |
-
2012
- 2012-01-17 KR KR1020137020961A patent/KR20140040694A/ko not_active Application Discontinuation
- 2012-01-17 US US13/351,485 patent/US9234245B2/en not_active Expired - Fee Related
- 2012-01-17 AU AU2012207442A patent/AU2012207442B2/en not_active Ceased
- 2012-01-17 EP EP12736444.6A patent/EP2665835B1/en not_active Not-in-force
- 2012-01-17 CN CN2012800105712A patent/CN103403187A/zh active Pending
- 2012-01-17 JP JP2013549609A patent/JP2014503222A/ja active Pending
- 2012-01-17 MX MX2013008252A patent/MX2013008252A/es not_active Application Discontinuation
- 2012-01-17 WO PCT/US2012/021539 patent/WO2012099872A1/en active Application Filing
- 2012-01-17 CA CA2825046A patent/CA2825046A1/en not_active Abandoned
-
2013
- 2013-07-10 IL IL227419A patent/IL227419A/en active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
US9234245B2 (en) | 2016-01-12 |
EP2665835A4 (en) | 2016-07-20 |
US20120185174A1 (en) | 2012-07-19 |
CA2825046A1 (en) | 2012-07-26 |
EP2665835B1 (en) | 2018-03-14 |
AU2012207442B2 (en) | 2017-02-23 |
JP2014503222A (ja) | 2014-02-13 |
AU2012207442A1 (en) | 2013-08-01 |
WO2012099872A1 (en) | 2012-07-26 |
IL227419A0 (en) | 2013-09-30 |
CN103403187A (zh) | 2013-11-20 |
MX2013008252A (es) | 2014-04-14 |
IL227419A (en) | 2017-01-31 |
EP2665835A1 (en) | 2013-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2012207442B2 (en) | Prognostic signature for colorectal cancer recurrence | |
DK2681333T3 (en) | EVALUATION OF RESPONSE TO GASTROENTEROPANCREATIC NEUROENDOCRINE NEOPLASIS (GEP-NENE) THERAPY | |
RU2721916C2 (ru) | Способы прогнозирования рака предстательной железы | |
DK2644713T3 (en) | A Method for Diagnosing Neoplasms II | |
KR20140006898A (ko) | 결장암 유전자 발현 시그니처 및 이용 방법 | |
AU2012203810B2 (en) | Methods and compositions for the treatment and diagnosis of bladder cancer | |
KR20140044341A (ko) | 암에 대한 분자적 진단 검사 | |
KR20160117606A (ko) | 항-혈관형성 약물에 대한 반응 및 암의 예후를 예측하기 위한 분자적 진단 시험 | |
BRPI0616090A2 (pt) | métodos e materiais para identificação da origem de um carcinoma de origem primária desconhecida | |
CA2430981A1 (en) | Gene expression profiling of primary breast carcinomas using arrays of candidate genes | |
BRPI0708534A2 (pt) | ensaio molecular para prognosticar a recorrência de cáncer do cólon dukes b | |
CN111448325A (zh) | 使用靶基因表达的数学建模评估jak-stat3细胞信号传导途径活性 | |
AU2020201779B2 (en) | Method for using gene expression to determine prognosis of prostate cancer | |
AU2008203227A1 (en) | Colorectal cancer prognostics | |
KR101128112B1 (ko) | 결장 직장암의 예후 진단법 | |
US20030175761A1 (en) | Identification of genes whose expression patterns distinguish benign lymphoid tissue and mantle cell, follicular, and small lymphocytic lymphoma | |
KR102631854B1 (ko) | Bub1의 비근침윤성 방광암의 예후 예측용 바이오마커로의 용도 | |
KR20100115283A (ko) | 간암 예후 마커 | |
CN115505640A (zh) | 检测肺癌的dna甲基化标志物及应用 | |
AU2014201129A1 (en) | Methods and compositions for the treatment and diagnosis of bladder cancer | |
CN101405406A (zh) | 诊断胰癌的方法 | |
NZ618191B2 (en) | Molecular diagnostic test for cancer | |
MXPA04008401A (en) | Colorectal cancer prognostics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |