KR102353374B1 - 결장직장암 분류를 위한 마커 유전자, 결장직장암의 예후를 위한 림프노드 전이를 판단하는 방법 및 이를 위한 키트 - Google Patents

결장직장암 분류를 위한 마커 유전자, 결장직장암의 예후를 위한 림프노드 전이를 판단하는 방법 및 이를 위한 키트 Download PDF

Info

Publication number
KR102353374B1
KR102353374B1 KR1020187029589A KR20187029589A KR102353374B1 KR 102353374 B1 KR102353374 B1 KR 102353374B1 KR 1020187029589 A KR1020187029589 A KR 1020187029589A KR 20187029589 A KR20187029589 A KR 20187029589A KR 102353374 B1 KR102353374 B1 KR 102353374B1
Authority
KR
South Korea
Prior art keywords
ceacam5
postn
determining
gene expression
slc35d3
Prior art date
Application number
KR1020187029589A
Other languages
English (en)
Other versions
KR20180134896A (ko
Inventor
리나 올슨
스텐 하마슈트룀
마리에-루이즈 하마슈트룀
구드런 린드마크
앤 이스라엘슨
Original Assignee
힐로프로베 아베
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 힐로프로베 아베 filed Critical 힐로프로베 아베
Publication of KR20180134896A publication Critical patent/KR20180134896A/ko
Application granted granted Critical
Publication of KR102353374B1 publication Critical patent/KR102353374B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57419Specifically defined cancers of colon
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 결장직장암 대상체의 분류, 예후 예측 및 치료 결정 안내를 위한 객관적 및 정량적 방법에 사용하기 위한 유전자 SLC35 D3, POSTN, KLK6 및 MUC2를 포함하는 분자 바이오 마커 군을 제공한다. 보다 상세하게는, 본 발명은 대상체로부터 얻어진 국소 림프노드, 원발성 장 종양, 혈액 또는 대변 샘플에서 유전자 SLC35D3, POSTN, KLK6 및/또는 MUC2의 유전자 발현 수준을 결정하는 단계를 포함하는, 대상체의 결장직장암의 전이 가능성 및/또는 종양 공격성을 결정하는 방법을 제공한다.

Description

결장직장암 분류를 위한 마커 유전자, 결장직장암의 예후를 위한 림프노드 전이를 판단하는 방법 및 이를 위한 키트
본 발명은 암, 특히 결장직장암의 분류, 예후 및 치료 분야에 관한 것이다.
결장직장암(colorectal cancer, CRC)은 전 세계의 암 환자 중에서 두 번째로 주된 사망 원인이며, 전 세계적으로 세 번째로 가장 많이 진단되는 암의 형태이다. 이는 의료 시스템에 막대한 부담을 안겨준다. CRC의 가장 중요한 예후 특징은 림프노드(lymph node) 전이의 존재 또는 부재이다(Chang G. J. et al. J. Natl. Cancer Inst., vol.99, p. 433-441 (2007); Iddings D. and Bilchik A. J. Surg. Oncol., vol. 96, p. 671-677 (2007); Nicastri D. G. et al. J. Mol. Diagn., vol. 9, p. 563-571 (2007)). 관련 림프노드는 환자가 치료를 위해 절제될 경우에만 조사할 수 있다. 따라서, 절제된 종양 표본에서 림프노드 상태의 철저한 결정이 중요하다. 현재, 종양 세포 양성 림프노드가 있는, 즉 III기 CRC(임의의 TN1-2M0) 환자의 대략 50% 및 종양 세포 양성 림프노드가 검출되지 않은, 즉 I기(T1-2 N0M0) 및 II기(T3-4N0M0) 환자의 약 25%는 재발할 것이다(Bockelman C. et al. Acta Oncol., vol. 54, p. 5-16 (2015)). 이들 결과는 림프노드에서의 종양 세포가 공격성이 다양할 수 있고, 많은 경우 노드에서 종양 세포의 존재를 현재의 표준 방법에 의해 놓치게 된다는 점을 강력하게 시사한다. 따라서, 1) 림프노드에서 종양 세포의 존재를 정확하게 검출하고, 2) 그것들의 전이 가능성, 즉, 그것들의 공격성을 결정하는 것이 가장 중요하다. 림프노드 상태의 결정인 N 병기결정(N-staging)을 개선하고 확산 종양 세포에 대한 공격성 파라미터를 도입함으로써 개선된 병기 결정이 달성될 것이며, 이에 의해 I기 및 II기 환자의 불충분한 치료 및 III기 환자의 과잉 치료를 피할 것이다. 또한, 림프노드에 종양 세포가 있는 환자가 재발 및 암 사망 위험의 차이에 따라 하위 그룹으로 분류될 수 있을 경우, 이 정보는 현재의 약물치료를 위해서뿐만 아니라, 새로운 약물, 새로운 치료 스케줄의 개발에, 그리고 재발 등의 위험에 대해 조정된 후속 스케줄을 위해서도 이용될 수 있다.
임상 실무에서, 림프노드 전이의 존재 또는 부재는 현재 절제된 국소(regional) 림프노드의 헤마톡실린 & 에오신(H&E) 염색된 조직 절편의 조직병리학적 검사에 의해 결정된다. 현재의 지침은 적어도 12개의 림프노드를 검사해야 한다고 규정하고 있다(Tsai H. L. et al. BMC Surg., vol. 16, p. 17 (2016)). TNM 분류에서, N1은 1개 내지 3개의 검사된 노드가 종양 세포의 존재에 대해 양성이었고, N2는 4개 내지 6개의 노드가 양성이었음을 나타낸다. N2 환자는 N1 환자보다 더 불량한 예후를 갖는다. 게다가, 림프노드 비율, 즉, 검사한 림프노드의 총 수에 대한 양성 림프노드의 수는 중요한 예후 인자이며, 비율이 높을수록 예후가 더 나쁘다(Parnaby C. N. et al, Br. J. Cancer, vol. 113, p. 212-219 (2015)). 통상의 방법에 의해 세포를 놓치는 주된 이유는 두 가지이다: 너무 작은 샘플 크기와 불충분한 민감도. 기껏해야 림프노드 부피의 몇 %만이 조직 절편의 H&E 염색에 의해 검사된다. 대안적인 방법은 이 유형의 모든 종양 세포에서 발현되는 하나 또는 여러 개의 바이오 마커의 mRNA 수준을 결정하는 것, 그리고 전체 림프노드로부터 또는 윤리적인 이유로 현재의 옵션인 절반의 림프노드로부터 RNA를 추출하는 것이다. 카피 표준물질(copy standard)을 이용한 실시간 정량적 역전사효소-중합효소 연쇄반응(qRT-PCR) 분석법은 바이오 마커의 mRNA 분석에 가장 유용한 방법인 것으로 밝혀진 바 있다. 이 분석법은 매우 민감하고, 객관적이며, 정량적이고, 자동화를 위해 수정 가능하다. 바이오 마커인 암배아 항원(CEA, CEACAM5)의 mRNA 분석은 대장으로부터 유래하는 종양 세포의 검출에 매우 유용한 것으로 나타났다. 이 바이오 마커는 현재의 최적 표준(gold standard), 즉 H&E 염색된 절편의 조직병리학에 의해 검출되지 않은 림프노드에 종양 세포가 있는 I기 및 II기 환자의 확인을 가능하게 하였다(Ohlsson L. et al. Br. J. Cancer, vol. 95, p. 218-225 (2006); Ohlsson L. et al. Int. J. Cancer, vol. 130, p. 1833-1843 (2012)). 이들 환자 중 일부는 재발성 질환으로 사망하였다(Ohlsson L. et al. Br. J. Cancer, vol. 95, p. 218-225 (2006); Ohlsson L. et al. Int.J. Cancer, vol. 130, p. 1833-1843 (2012)). 따라서 최적 표준만을 비교하였을 때 이 마커를 사용함으로써 더욱 정교한 계층화가 얻어졌다. 바이오 마커 시토케라틴 20(CK20) 또한 다소 민감도가 떨어지긴 하지만 이 목적에 유용하다(Ohlsson L. et al. Br. J. Cancer, vol. 95, p. 218-225 (2006). 현재 공격성 마커의 성질을 나타내는 공개된 CRC 바이오 마커는 단 하나, 즉 칼리크레인 관련 펩티드 분해효소 6(kallikrein related peptidase 6, KLK6)이다(Ohlsson L. et al. Br. J. Cancer, vol. 107, p. 150-157 (2012)) 뿐이다. 그것은 CRC 종양 세포에서 이소성으로(ectopically) 발현되며, 공격성이 증가함에 따라 점점 더 높은 수준으로 발현되는 것으로 보인다.
CRC에서 원격 전이의 발생에 대해 일반적으로 수용되는 경로는 종양 세포가 림프관을 통해 결장 또는 직장의 원발(primary) 부위를 떠나 국소 림프노드에 먼저 자리잡고, 그 후에 간과 같은 먼 부위로 확산되는 것이다. 결국, 환자를 사망하게 하는 것은 원격 전이이다. 이 경로에 대한 증거는 국소 림프노드에서의 종양 세포의 존재 또는 부재가 CRC 사망 또는 생존에 대한 최선의 예후 마커라는 사실이다.
본 발명은 1) CRC에 대한 2개의 새로운 공격성 바이오 마커; CRC 종양 세포 자체에서 발현되는 바이오 마커 및 림프노드의 미세환경에서의 지지 세포에서 발현되는 바이오 마커의 확인, 및 2) 림프노드에서 종양 세포의 존재 또는 부재를 정확하게 검출하는 것 이외에도 이들 세포의 공격성에 대한 정보를 제공하는, 림프노드 상태의 결정 방법에 관한 것이다. 제안된 방법에서, 2개의 새로운 바이오 마커 및 3개의 이전에 기술된 바이오 마커의 정량적 mRNA 수준이 결정된다. CRC 림프노드 분석에 적용될 경우, 그것은 림프노드 병발(involvement)을 정확하게 결정하고, CRC 환자를 1차 치료, 즉 종양의 외과적 절제 후 재발 및 암 사망의 위험과 관련하여 상이한 위험군으로 분류할 수 있게 한다. 이 목표는 지금까지는 달성할 수 없었다.
본 발명의 목적은 결장직장암을 앓는 대상체의 분류, 예후의 예측 및 치료 결정 안내(guiding)에 유용한 분자 바이오 마커 군을 제공하는 것이다.
본 발명의 또 다른 목적은 대상체에서 결장직장암을 분류하기 위한 것뿐만 아니라, 대상체의 예후를 예측하고 대상체에 대한 치료 결정을 내리기 위한 분류에 사용하기 위한 객관적이고 정량적인 방법을 제공하는 것이다.
본 발명자들은 유전자 용질 담체 패밀리 35 멤버 D3(solute carrier family 35 member D3, SLC35D3)(GenBank NM_001008783) 및 골아세포 특이적 인자인 페리오스틴(periostin, osteoblast specific factor, POSTN)(GenBank NM_006475)의 발현 수준을 대상체에서 결장직장암의 전이 가능성 및/또는 종양 공격성을 결정하는 데 이용할 수 있는 분자 바이오 마커로서 확인하였다.
유전자 SLC35D3 및 POSTN의 발현 수준은 전이 가능성 및/또는 종양 공격성 결정을 위하여, 바람직하게는 유전자 칼리크레인 관련 펩티드 분해효소 6(kallikrein related peptidase 6, KLK6)(GenBank NM_002774)의 발현 수준과 함께 이용될 수 있고, 훨씬 더 바람직하게는 유전자 뮤신 2(올리고머성 점액/겔 형성)(MUC2)(GenBank NM_002457)의 발현 수준과도 함께 이용될 수 있다.
방법은 대상체로부터 얻은 국소 림프노드 샘플에서 또는 대상체로부터 얻은 원발성 장 종양, 혈액 및/또는 대변 샘플에서 유전자 발현 수준을 결정하기 위하여 적용될 수 있다.
이들 유전자의 발현 수준은 공지된 종양 마커이고/이거나 18S rRNA의 수준과 관련이 있는 유전자인 암배아 항원 관련 세포 부착 분자 5(carcinoembryonic antigen related cell adhesion molecule 5, CEACAM5)(GenBank NM_004363)의 발현 수준과 관련될 수 있다.
따라서, 본 발명의 일 양태는 대상체에서 결장직장암의 전이 가능성 및/또는 종양 공격성을 결정하는 방법을 제공하며, 이는
a) 대상체로부터 얻어진 국소 림프노드 샘플에서 유전자 SLC35D3 및 POSTN의 유전자 발현 수준을 결정하는 단계; 및
b) 단계 a)에서 결정된 유전자 발현 수준을 기준(reference) 환자 집단에서의 동일한 유전자의 기준 유전자 발현 수준과 비교하는 단계
를 포함하고,
여기에서 기준과 비교하여 유전자 SLC35D3 및 POSTN의 더 높은 발현 수준은 증가된 전이 가능성 및/또는 종양 공격성과 관련이 있다.
바람직하게는, 방법은 상기 샘플에서 유전자 KLK6의 유전자 발현 수준을 결정하는 단계를 더 포함할 수 있다.
따라서, 일 구현예에서, 본 발명의 제1 양태는 대상체에서 결장직장암의 전이 가능성 및/또는 종양 공격성을 결정하는 방법을 제공하며, 이는
a) 대상체로부터 얻어진 국소 림프노드 샘플에서 유전자 SLC35D3, POSTN 및 KLK6의 유전자 발현 수준을 결정하는 단계; 및
b) 단계 a)에서 결정된 유전자 발현 수준을 기준 환자 집단에서의 동일한 유전자의 기준 유전자 발현 수준과 비교하는 단계
를 포함하고,
여기에서 기준과 비교하여 유전자 SLC35D3, POSTN 및 KLK6의 더 높은 발현 수준은 증가된 전이 가능성 및/또는 종양 공격성과 관련이 있다.
바람직하게는, 방법은 상기 샘플에서 유전자 MUC2의 유전자 발현 수준을 결정하는 단계를 더 포함할 수 있다.
따라서, 또 다른 구현예에서, 본 발명의 제1 양태는 대상체에서 결장직장암의 전이 가능성 및/또는 종양 공격성을 결정하는 방법을 제공하며, 이는
a) 대상체로부터 얻어진 국소 림프노드 샘플에서 유전자 SLC35D3, POSTN, KLK6 및 MUC2의 유전자 발현 수준을 결정하는 단계; 및
b) 단계 a)에서 결정된 유전자 발현 수준을 기준 환자 집단에서의 동일한 유전자의 기준 유전자 발현 수준과 비교하는 단계
를 포함하고,
여기에서 기준과 비교하여 유전자 SLC35D3, POSTN, KLK6 및 MUC2의 더 높은 발현 수준은 증가된 전이 가능성 및/또는 종양 공격성과 관련이 있다.
바람직하게는, 방법은
c) 상기 샘플에서 유전자 CEACAM5의 유전자 발현 수준 및 18S rRNA의 수준을 결정하는 단계;
d) 단계 a) 및 c)에서 얻어진 결과를 기초로, SLC35D3/CEACAM5, KLK6/CEACAM5, POSTN/18S rRNA 및 MUC2/CEACAM5의 비율을 계산하는 단계;
e) 단계 d)에서 얻어진 비율이 상기 기준 환자 집단에서의 동일한 비율에 기초한 컷오프(cut-off) 값보다 큰지에 따라 상기 비율에 (+1) 또는 (0)의 값을 제공하고, 컷오프 값보다 큰 비율은 (+1)의 값을 얻고 컷오프 값보다 작은 값은 (0)의 값을 얻는 단계; 및
f) 단계 e)에서 얻어진 비율 및 식 [A = SLC35D3/CEACAM5 + KLK6/CEACAM5 + POSTN/18S rRNA - MUC2/CEACAM5]를 이용하여 지수(index)를 계산하는 단계
를 더 포함할 수 있고, 여기에서 지수 (+3)은 매우 높은 전이 가능성 및/또는 종양 공격성과 관련이 있고, 지수 (+2) 및 (+1)은 높은 전이 가능성 및/또는 종양 공격성과 관련이 있으며, 지수 (0) 및 (-1)은 낮은 전이 가능성 및/또는 종양 공격성과 관련이 있다.
상기 컷오프 값은 상기 기준 환자 집단의 7 십분위(7th decile)의 비율, 상기 기준 환자 집단의 3 사분위(3rd quartile)의 비율, 또는 상기 기준 환자 집단의 8 십분위의 비율일 수 있다.
방법은 시험관 내(in vitro)에서 및/또는 생체 외(ex vivo)에서 수행될 수 있다.
방법은 이를 필요로 하는 대상체에서 결장직장암을 치료하는 추가적인 단계를 더 포함할 수 있다.
또 다른 양태에서, 본 발명은 대상체에서 결장직장암의 전이 가능성 및/또는 종양 공격성을 결정하는 방법을 제공하며, 이는
a) 대상체로부터 얻어진 원발성 장 종양, 혈액 또는 대변 샘플에서 유전자 SLC35D3, KLK6, MUC2 및 CEACAM5의 유전자 발현 수준을 결정하는 단계;
b) 단계 a)에서 얻어진 결과를 기초로, SLC35D3/CEACAM5, KLK6/CEACAM5 및 MUC2/CEACAM5의 비율을 계산하는 단계; 및
c) 단계 b)에서 결정된 비율을 기준 환자 집단에서의 동일한 유전자의 발현 수준으로부터 계산된 기준 비율과 비교하는 단계
를 포함하고,
여기에서 기준과 비교하여 더 높은 SLC35D3/CEACAM5 및 KLK6/CEACAM5의 비율은 증가된 전이 가능성 및/또는 종양 공격성과 관련이 있고, 기준과 비교하여 더 높은 MUC2/CEACAM5의 비율은 감소된 전이 가능성 및/또는 종양 공격성과 관련이 있다.
방법은 시험관 내에서 및/또는 생체 외에서 수행될 수 있다.
방법은 이를 필요로 하는 대상체에서 결장직장암을 치료하는 추가적인 단계를 더 포함할 수 있다.
본 발명에 따르면, 유전자 발현 수준은 상기 유전자로부터 발현된 mRNA의 양을 정량함으로써 결정될 수 있다.
mRNA의 양은 혼성화, 시퀀싱 또는 정량적 RT-PCR에 의해 결정될 수 있다.
보다 상세하게는, mRNA의 양은 마이크로어레이 및 비드 어레이 기술, 전사체(transcriptome) 시퀀싱, 실시간 정량적 RT-PCR, 다중 정량 RT-PCR로부터 선택되는 방법을 이용하여 결정될 수 있다.
방법에 따르면, 유전자 발현 수준은 RNA 또는 DNA 카피 표준물질을 이용하여 결정될 수 있고/있거나, 18S rRNA 수준은 18S rRNA 표준물질을 이용하여 결정될 수 있다.
본 발명의 또 다른 양태는 결장직장암으로 진단된 대상체의 예후를 결정하는 방법을 제공한다. 상기 방법은 본 발명에 따른 방법을 이용하여 대상체에서 결장직장암의 전이 가능성 및/또는 종양 공격성을 결정하는 단계를 포함할 수 있다.
상기 방법은 전이 가능성 및/또는 종양 공격성이 낮은 경우 대상체가 좋은 예후를 갖는다고 결정하거나, 전이 가능성 및/또는 종양 공격성이 높은 경우 대상체가 불량한 예후를 갖는다고 결정하는 단계를 포함할 수 있다. 불량한 예후는 좋은 예후와 비교하여 생존 가능성이 감소하는 것일 수 있다.
방법은 시험관 내에서 및/또는 생체 외에서 수행될 수 있다.
방법은 이를 필요로 하는 대상체에서 결장직장암을 치료하는 추가적인 단계를 더 포함할 수 있다.
본 발명의 또 다른 양태는 결장직장암으로 진단되고 종양을 가지고 있는 대상체의 치료를 결정하는 방법을 제공한다. 상기 방법은 본 발명에 따른 방법을 이용하여 대상체에서 결장직장암의 전이 가능성 및/또는 종양 공격성을 결정하는 단계 및 전이 가능성 및/또는 종양 공격성이 결정됨에 따라 상기 대상체에 대한 치료를 결정하는 단계를 포함할 수 있다.
방법은 시험관 내에서 및/또는 생체 외에서 수행될 수 있다.
방법은 이를 필요로 하는 대상체에서 결장직장암을 치료하는 추가적인 단계를 더 포함할 수 있다.
치료는 높은 전이 가능성 및/또는 종양 공격성을 갖는 것으로 결정된 환자에게 수술 후 치료, 예를 들어 화학요법을 제공하는 것일 수 있다.
치료는 낮은 전이 가능성 및/또는 종양 공격성을 갖는 환자에 대한 수술 후 치료를 중단하는 것일 수 있다.
본 발명의 또 다른 양태는 결장직장암으로 진단된 대상체의 전이 가능성 및/또는 종양 공격성을 결정하기 위한 키트를 제공한다. 키트는 유전자 CEACAM5, KLK6, POSTN, SLC35D3 및 MUC2 중 1종 이상의 유전자 발현 수준의 결정을 위한 핵산 프라이머와 프로브 및 선택적으로 18S rRNA의 수준의 결정을 위한 핵산 프라이머와 프로브를 포함할 수 있다.
일 구현예에서, 본 발명은 유전자 SLC35D3 및 POSTN의 유전자 발현 수준의 결정을 위한 핵산 프라이머 및 프로브를 포함하는, 결장직장암으로 진단된 대상체의 전이 가능성 및/또는 종양 공격성을 결정하기 위한 키트를 제공한다.
또 다른 구현예에서, 본 발명은 유전자 SLC35D3, POSTN 및 KLK6의 유전자 발현 수준의 결정을 위한 핵산 프라이머 및 프로브를 포함하는, 결장직장암으로 진단된 대상체의 전이 가능성 및/또는 종양 공격성을 결정하기 위한 키트를 제공한다.
또 다른 구현예에서, 본 발명은 유전자 SLC35D3, POSTN 및 MUC2의 유전자 발현 수준의 결정을 위한 핵산 프라이머 및 프로브를 포함하는, 결장직장암으로 진단된 대상체의 전이 가능성 및/또는 종양 공격성을 결정하기 위한 키트를 제공한다.
또 다른 구현예에서, 본 발명은 유전자 SLC35D3, POSTN, KLK6 및 MUC2의 유전자 발현 수준의 결정을 위한 핵산 프라이머 및 프로브를 포함하는, 결장직장암으로 진단된 대상체의 전이 가능성 및/또는 종양 공격성을 결정하기 위한 키트를 제공한다.
또 다른 구현예에서, 본 발명은 유전자 SLC35D3, POSTN, KLK6, MUC2 및 CEACAM5의 유전자 발현 수준의 결정을 위한 핵산 프라이머 및 프로브를 포함하는, 결장직장암으로 진단된 대상체의 전이 가능성 및/또는 종양 공격성을 결정하기 위한 키트를 제공한다.
핵산 프라이머 및 프로브는 표 1에 제공된 것들로부터 선택될 수 있다. 더욱 구체적으로는, 핵산 프라이머 및 프로브는 서열 번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15로부터 선택될 수 있다.
키트는 mRNA, RNA 및/또는 DNA 카피 표준물질을 더 포함할 수 있다.
본 발명의 또 다른 양태는 결장직장암의 치료 방법을 제공한다. 상기 방법은 본 발명에 따른 방법을 이용하여 대상체에서 결장직장암의 전이 가능성 및/또는 종양 공격성을 결정하는 단계 및 전이 가능성 및/또는 종양 공격성이 결정됨에 따라 상기 대상체를 치료하는 단계를 포함할 수 있다.
치료는 높은 전이 가능성 및/또는 종양 공격성을 갖는 것으로 결정된 환자에게 수술 후 치료, 예를 들어 화학요법을 제공하는 것일 수 있다.
치료는 낮은 전이 가능성 및/또는 종양 공격성을 갖는 환자에게 수술 후 치료를 중단하는 것일 수 있다.
도 1. 원발성 CRC 종양(●)(n = 56) 및 정상 결장 조직(n = 5)(○)에서 CEACAM5, MUC2, KLK6, POSTN 및 SLC35D3 mRNA의 발현 수준.
도 2. I기 내지 IV기 CRC 환자 및 대조군 환자(Ctr)의 림프노드에서 (A) SLC35D3 및 (B) POSTN mRNA 발현 수준. 166명의 CRC 환자 및 23명의 대조군 환자 각각은 최고 mRNA 값을 갖는 림프노드로 대표된다.
도 3. I기 내지 IV기 CRC 환자로부터의 림프노드에서 CEACAM5 mRNA에 대한 바이오 마커 mRNA의 비율. 166명의 환자 각각은 최고 mRNA 값을 갖는 림프노드로 대표되며, 채워진 원으로 나타낸다.
도 4. CRC 환자(n = 166)에 대한 카플란-마이어(Kaplan-Meier)에 따른 누적 생존 곡선. 환자는 바이오 마커 SLC35D3, POSTN, KLK6, MUC2 및 CEACAM5의 mRNA 값에 기초하여 그룹(-1, 0, +1, +2 및 +3)으로 분류되고, 식에 따라 계산된다(식 A = SLC35D3/CEACAM5 + KLK6/CEACAM5 + POSTN/18S rRNA - MUC2/CEACAM5). 각 마커에 대한 mRNA 값의 8 십분위를 이용하여 마커 값을 양성 또는 음성으로 분류하여, 전자에 (1)의 값을 후자에 (0)의 값을 부여하였다. 최고 CEACAM5 mRNA 값을 갖는 림프노드가 환자를 대표하는 것으로 선택되었다. 자세한 사항은 본문 참조.
도 5. CRC 환자(n = 166)에 대한 카플란-마이어에 따른 누적 생존 곡선. 환자는 바이오 마커 SLC35D3, KLK6, MUC2 및 CEACAM5의 mRNA 값에 기초하여 환자를 그룹(-1, 0, +1, 및 +2)으로 분류되고, 식에 따라 계산된다(식 E = SLC35D3/CEACAM5 + KLK6/CEACAM5 - MUC2/CEACAM5). 자세한 사항은 도 4에 대한 설명 및 본문 참조.
실시예
결장직장암 대상체에서의 암 사망 위험과 유의미하게 관련이 있는 유전자 및 유전자 표지(gene signature)의 확인
종양 진행에 중요한 유전자는 원발성 종양 조직 및 장에서 배액시키는 국소 림프노드에 존재하는 2차 종양 양쪽 모두에서 발현될 가능성이 크다. III기 CRC 환자 4명의 4개의 상이한 H&E 양성 림프노드(즉, 종양 세포를 함유하는 림프노드) 및 이들 환자 중 3명으로부터의 3개의 원발성 종양으로부터 RNA를 분석하여 진행 마커에 대한 마이크로어레이 탐색을 수행하였다. 또한, 7명의 대조군 환자(2명의 궤양성 대장염 환자, 1명의 크론 대장염 환자, 1명의 대장 지방종 환자로부터의 림프노드 및 3개의 정상 결장 상피세포 샘플)로부터의 RNA를 분석하였다. CRC 샘플을 하나의 그룹으로서 모든 대조군 샘플에 대하여 개별적으로 비교하였다. 마이크로어레이 데이터는 통계적 유의성을 P < 0.05로, 배수 변화를 ≥ 5로, 최소 강도를 15로 설정하여 필터링 하였다. 이러한 방식으로 배수 변화가 ≥ 5배인 대부분의 CRC 샘플(≥ 5/7)에서 발현된 다수의 유전자를 확인하였다. 이들 중에 SLC35D3, POSTN 및 KLK6이 있었다.
상업적으로 이용 가능한 실시간 qRT-PCR 분석법을 이용하여 POSTN, SLC35D3 및 KLK6에 대한 마이크로어레이 결과(TaqMan 유전자 발현 분석법)를 검증하였다. 후자의 경우, 상이한 스플라이스 형태에 대해 3가지 경우를 분석하였다. 세 개의 유전자 모두가 원발성 CRC 종양 샘플의 패널(n = 8)에서 발현되었고, SLC35D3 및 KLK6은 모든 CRC 세포주(n = 5)에서 발현되었으나, POSTN은 그렇지 않았다.
SLC35D3, POSTN, KLK6, MUC2, CEACAM5 및 18S rRNA에 대한 qRT-PCR 분석법에 이용된 프라이머 및 프로브 서열
유전자 3' 프라이머 서열
(역방향)
5' 프라이머 서열
(정방향)
프로브 서열
SLC35D3 AGC ACT CCC GTG ACG TAC C
(서열 번호 1)
TCA TCA CCA CCT GCG GC
(서열 번호 2)
CCT GGC AGG AGC CGG CGA
(서열 번호 3)
POSTN CCC TTG CTT ACT CCC TTT CTC
(서열 번호 4)
ACA GCT CAG AGT CTT CGT ATA TCG
(서열 번호 5)
ACA GCT GTC TGC ATT GA
(서열 번호 6)
KLK6 AAG GTT ATG CTT CCC CAG G
(서열 번호 7)
CTT ATC CAT CCA CTG TGG GTC
(서열 번호 8)
CAC TGC AAA AAA CCG AAT CTT CAG GTC
(서열 번호 9)
MUC2 TAG TGT CCA GCT CCA GCA TGA
(서열 번호 10)
AAG AGC GAT GCC TAC ACC AAA
(서열 번호 11)
TCC CGG TTC CAC ATG A
(서열 번호 12)
CEACAM5 TGT AGC TGT TGC AAA TGC TTT AAG
(서열 번호 13)
CTG ATA TAG CAG CCC TGG TGT AGT
(서열 번호 14)
AGG AAG ACT GAC AGT TGT
(서열 번호 15)
18S rRNA CCG CTC CCA AGA TCC AA
(서열 번호 16)
GTA ATT CCA GCT CCA ATA GCG TA
(서열 번호 17)
CTG CAG TTA AAA AGC
(서열 번호 18)
기술된 바와 같은 Taqman EZ RT-PCR 기술((Fahlgren A. et al. Clin. Exp. Immunol., vol. 131, p. 90-101 (2003); Ohlsson L. Thesis, ISBN 978-91-7459-318-1 (2011))을 이용하여 RNA 카피 표준물질을 이용한 실시간 qRT-PCR 분석법을 구축하였다. SLC35D3, POSTN, KLK6, MUC2 및 CEA, mRNA에 대한 실시간 qRT-PCR 분석을 위한 프라이머 및 프로브 서열을 표 1에 나타내고, RNA 카피 표준물질의 제작을 위한 프라이머를 표 2에 나타낸다. 이들 분석법을 이용하여, 원발성 CRC 종양, 정상 결장 조직 및 정제된 결장 상피세포, CRC 세포주, 말초 혈액 단핵구 세포(peripheral blood mononuclear cell, PBMC), 상이한 면역 세포주 및 섬유아세포 세포주를 포함하는 RNA 샘플의 패널을 분석하였다(표 3). 56개의 원발성 CRC 종양 및 5개의 정상 결장 샘플의 개별 값을 도 1에 나타낸다. 비교를 위해, CEACAM5 및 MUC2에 대한 결과가 포함되어 있다(Ohlsson L. Thesis, ISBN 978-91-7459-318-1 (2011)).
비록 특정 mRNA가 암호화하는 단백질 분자의 풍부도(abundance)를 반영하는, CEACAM5에 대한 164의 중간값에서 SLC35D3에 대한 0.17까지의, 샘플 내의 18S rRNA 함량에 대해 정규화된 비록 매우 상이한 카피 수(copy number) 수준이긴 하지만, 모든 5개의 바이오 마커 mRNA가 원발성 CRC 종양에서 발현된다는 것은 명백하다.
둘째, CRC 세포주는 POSTN을 제외한 모든 마커 mRNA를 발현하며, POSTN은 대신 섬유아세포 세포주에서 높은 수준으로 발현된다.
셋째, 어떠한 마커도 면역 세포주에서 유의미한 정도로 발현되지 않는다.
넷째, CEACAM5는 원발성 CRC 종양 및 정상 결장 상피세포에서 유사한 수준으로 발현된다. 후자의 발견 및 이전의 지식(Ohlsson L. et al. Br. J. Cancer, vol. 95, p. 218-225 (2006))에 기초하여, CEACAM5는 대장으로부터 유래하는 세포에 대한 바람직한 마커인 것으로 간주하였다. 나아가, 그것의 높은 발현 수준은 림프노드에서 결장직장암 세포의 검출을 위한 매우 민감한 마커가 된다.
다섯째, 결장 및 직장에서 지배적인 뮤신인 MUC2는 CRC 종양이 어느 정도까지 점액성인지의 여부를 측정한다. 점액성 종양 환자는 비 점액성 종양 환자보다 더 좋은 예후를 갖는다(Byrd J. C. and Bresalier R. S. Cancer Metastasis Review, vol. 23, p. 77-99 (204); Ohlsson L. et al. Int. J. Cancer, vol. 130, p. 1833-1843 (2012)).
마지막으로, CEACAM5 및 MUC2와 대조적으로, KLK6 및 SLC35D3는 둘 다 CRC 종양 및 대부분의 CRC 세포주에서 발현되었으나, 정상 결장 상피세포에서는 그렇지 않았다. 즉, 그것들은 CRC 종양에서 이소적으로 발현된다.
SLC35D3, POSTN, KLK6, MUC2, CEACAM5 및 18S rRNA를 위한 cDNA의 클로닝 및 RNA 카피 표준물질의 제작을 위한 RT-PCR에 사용된 프라이머 서열
유전자 3' 프라이머 서열
(역방향)
5' 프라이머 서열
(정방향)
SLC35D3 CAGCACTCCCGTGACGTAC
(서열 번호 19)
CATCGGCGTCCTGGTTC
(서열 번호 20)
POSTN CCCTTGCTTACTCCCTTTCTC
(서열 번호 4)
ACAGCTCAGAGTCTTCGTATATCG
(서열 번호 5)
KLK6 TGGATCACAGCCCGGA
(서열 번호 21)
TACACCTCGGGCCACTTG
(서열 번호 22)
MUC2 TAGTGTCCAGCTCCAGCATGA
(서열 번호 10)
CCGGGCTGCTCATTGAGA
(서열 번호 23)
CEACAM5 TGGCTAGGATGGTCTCGAT
(서열 번호 24)
GGACCTATGCCTGTTTTGTCT
(서열 번호 25)
18S rRNA CGCTCCCAAGATCCAACTAC
(서열 번호 26)
GTAATTCCAGCTCCAATAGCGTA
(서열 번호 17)
원발성 CRC 종양, 정상 결장, 정상 결장 상피세포, CRC 세포주, 면역 세포주, 섬유아세포 세포주, CRC 간 전이 및 정상 간에서의 SLC35D3, POSTN, KLK6, MUC2 및 CEACAM5 mRNA의 발현 수준
공급원 n mRNA 카피/ 18S rRNA 단위
SLC35D3 POSTN KLK6 MUC2 CEACAM5
원발성 CRC 종양 56 0.1*
(0.04-0.4)
9.7
(4.6 - 22.2)
2.9
(0.9-8.5)
1.1
(0.3 - 4.2)
175
(107- 283)
CRC 세포주 1** LS174T 0 0 79 4.3 328
1 HT29 0.02 0 256 0.01 32
1 T84 0.7 0 316 0.5 33
1 HCT8 0.07 0 32 0.02 32
1 CaCo2 0.09 0.0009 0.4 0.04 3
정상 결장 조직 5 0.02 5.9 0 9 222*
정상 결장 EC 5 0.0009 0.2 0 32 300
PBMC 1 0.06 0 0 0 0
활성화 PBMC 1 0 0 0 0 0
T 세포주 1 Jurkat 0 0.009 0 0 0
B 세포주 1 B6+KR4 0 0 0 0 0
혈장 세포주 1 U266 0 0.005 0 0 0
단핵구 세포주 1 U937 0 0 0 0 0.005
과립구 세포주 1 HL60 0 0 0 0 0
전-적혈구 세포주 1 K562 0.09 0.001 0 0 0
섬유아세포 세포주 1 FSU 0 5.5 0 0.004 0.0002
간 전이 2 0.07 22.6 2 0.003 78
정상 간 2 0 2.3 0 0.00004 0.01
* 중간값 및 25 내지 75 백분위수(percentile)의 사분위간 범위. ** 세포주 및 PBMC, 3회 결정의 평균값. EC, 정제된 상피세포; PBMC, 말초 혈액 단핵구 세포; 0, < 0.00001 mRNA 카피/18S rRNA 단위.
CRC-사망 가능성 예측을 위한 혼합 바이오 마커 mRNA 분석의 적용
166명의 수술 치료를 받은 모두 4개의 TNM 시기결정(TNM staging)을 나타내는 CRC 환자로부터의 림프 노드의 임상 재료를 대상으로, 공지된 CEACAM5 mRNA, KLK6 mRNA, MUC2 mRNA 및 18S rRNA 발현 수준을 이용하여 SLC35D3 mRNA 및 POSTN mRNA의 발현 수준을 분석하였다. 600개가 넘는 림프노드로부터 총 mRNA를 분석하였다. mRNA 값을 18S rRNA에 대해 정규화하고, mRNA 카피/18S rRNA 단위로 표현하였다. 본 발명자 집단의 이전 연구는 18S rRNA가 정규화를 위한 우수한 RNA 종임을 증명한 바 있다(Bas A. et al, Scand. J. Immunol., vol. 59, p. 566-573 (2004); Ohlsson L. et al. Int. J. Cancer, vol. 130, p. 1833-1843 (2012)). 최고 mRNA 발현 수준을 갖는 노드를 추가 분석에서 환자를 대표하는 데 사용하였다. 이것은 H&E 양성 노드가 유익한 것으로 간주되는 반면, H&E 음성 노드는 모든 노드가 음성인 경우를 제외하고는 비정보적인 것으로 간주된다는 점에서 현재의 임상 실무와 유사하다. 도 2는 그 결과를 보여준다. 도 2는 또한, 비 CRC 대조군 환자로부터의 림프노드에 대한 mRNA 값을 보여주며, 점선은 이 대조군의 최고값을 나타낸다. III기 및 IV기 환자로부터의 림프노드는 I기 및 II기 환자로부터의 노드보다 더 많은 부분의 컷오프 수준 이상의 mRNA 값을 가진 노드를 나타낸다[SLC35D3: I기 = 18%, II기 = 9%, III기 = 25% 및 IV기 = 79%; POSTN: I기 =25%, II기 = 13%, III기 = 32% 및 IV기 = 69%].
SLC35D3- 및 POSTN mRNA 발현 수준의 분석 결과를 CRC 환자의 동일한 노드에서의 CEACAM5-, KLK6- 및 MUC2 mRNA에 대한 공지된 발현 수준과 조합하여 이용하였다(Ohlsson L. et al. Br. J. Cancer, vol. 95, p. 218-225 (2006); Ohlsson L. Thesis, ISBN 978-91-7459-318-1 (2011); Ohlsson L. et al. Br. J. Cancer, vol. 107, p. 150-157 (2012)). 5개의 바이오 마커에 대한 컷오프 수준을 다음과 같이 결정하였다: 최고 림프노드에서의 바이오 마커 발현 수준에 따라 환자의 순위를 매긴 다음, 동일한 수의 환자로 구성된 다섯 개 그룹으로 나누었다. 콕스 회귀 분석을 이용하여 무 질병(disease-free) 생존율와 관련하여 그룹을 비교하였다. 이 분석으로부터, 컷오프 수준을 8 십분위에서의 mRNA 발현 수준으로 정의하였는데, 이는 모든 5개의 마커에 대해, 8 십분위 미만의 그룹은 무 질병 생존율에서 유의미하게 다르지 않았기 때문이다. CRC 이외의 원인으로 사망한 환자는 무 질병으로 간주하였다. 환자를 컷오프 값보다 높은 mRNA 발현값과 컷오프 값보다 낮은 mRNA 발현값의 두 개의 그룹으로 나누고, 각 그룹에 대해 수술 후 평균 생존 기간을 카플란-마이어에 따른 누적 생존 분석에 의해 계산하고, CRC 재발 위험을 일변량 콕스 회귀 분석에 따라 추정하였다. 5개의 바이오 마커에 대한 결과를 표 4에 나타낸다. 보다시피, 바이오 마커 전부에 대해 컷오프 수준 이상의 mRNA 값은 매우 유의미한 P-값을 갖는 더 불량한 예후와 상관관계가 있었다.
바이오 마커(+) 또는 바이오 마커(-) 림프노드를 갖는 CRC 환자의 평균 생존 기간 및 질병 재발 위험의 비교 분석
바이오
마커

mRNA
(카피/18S rRNA 단위)

수술 후 생존기간(개월) CRC 재발 위험
수준 평균
차이 대(vs)
마커 (-)
P -값 위험 비율 P -값
SLC35D3 (-) <0.0059* 103**
SLC35D3 (+) >0.0059 54 49 0.002 2.48*** 0.002
POSTN (-) <11.05 107
POSTN (+) >11.05 76 31 0.001 2.52 0.002
KLK6 (-) <0.0831 110
KLK6 (+) >0.0831 46 64 <0 0001 4.01 <0.0001
MUC2 (-) <0.0045 108
MUC2 (+) >0 0045 64 44 0.001 2.53 0.001
CEA (-) <4.2 112
CEA (+) >4.2 44 68 <0.0001 4.67 <0.0001
* 컷오프 수준은 환자 집단의 8 십분위수이다.
** 카플란-마이어에 따른 누적 생존 분석에 의해 계산된 수술 후 평균 생존 기간.
*** 일변량 콕스 회귀 분석에 따라 계산된 위험 비율.
5종의 바이오 마커 모두에 대한 수준 결정 및 상이한 측정치 조합으로 환자 그룹을 생존과 관련하여 추가적으로 차별화하였다. 본 발명의 일 구현예에서는, 수술 후 생존을 예측하기 위하여 바이오 마커 분석으로부터 도출된 조합 정보가 다음과 같이 사용된다: 각각의 최고 림프노드에 대하여, 바이오 마커 SLC35D3, KLK6 및 MUC2에 대한 값을 먼저 그것들의 상응하는 CEACAM5 값으로 나눈다. 그런 다음, SLC35D3/CEACAM5 및 KLK6/CEACAM5의 경우, 비율을 두 개의 그룹 >0.00001 또는 < 0.00001 중 하나로 표시하였다(도 3). 전자 그룹에는 1의 값을 부여하였고, 후자 그룹에는 0의 값을 부여하였다. MUC2/CEACAM5의 경우, 분할은 3.0의 비율에서 이루어졌고, 3.0 이상의 값을 갖는 노드에는 1의 값을 부여하였고, 그 이하의 값의 노드에는 0의 값을 부여하였다(도 3). POSTN의 경우, POSTN/18S rRNA 비율 및 임상적 컷오프(8.0 카피/18S rRNA 단위; 2)를 이용하여 두 개의 그룹을 달성하였고, 임상적 컷오프 이상인 경우 1의 값을, 그 이하인 경우 0의 값을 부여하였다. 식 (식 A: SLC35D3/CEACAM5 + KLK6/CEACAM5 + POSTN/18S rRNA - MUC2/CEACAM5)을 이용하여 각각의 환자를 다섯 개 그룹 중 하나로 분류하였고(식 결과: -1, 0, +1, +2, +3), 카플란-마이어에 따른 누적 생존 분석을 이들 그룹에 대해 수행하였다. 결과를 도 4에 나타낸다. 다섯 개의 상이한 곡선을 얻었다. 그룹 (-1) 및 (0)은 양호한 3년 및 5년 생존을 보여주고, 그룹 (+1) 및 (+2)는 상대적으로 불량한 생존을 보여주며, 그룹 (+3)은 매우 불량한 생존을 보여준다(표 5). 그룹 (-1)과 비교하여, 그룹 (0), (+1), (+2) 및 (+3)에 대해 일변량 콕스 회귀 분석에 따라 계산한 위험 비율을 표 6에 나타낸다.
본 발명의 다른 구현예에서, 이들 식, 예를 들어 식 B 내지 식 E에서, 조건(term) 중 하나를 체계적으로 배제시켰다는 점을 제외하고는 바이오 마커 mRNA 측정치를 식 A에서와 동일한 방법으로 계산하였다. 도 5는 식 E에 따라 계산한, 카플란-마이어에 따른 누적 생존을 보여준다. 표 5는 다섯 개의 식(식 A 내지 식 E)에 의해 결정된 바와 같은 바이오 마커 mRNA 측정치에 대한 3년 및 5년 생존을 요약한 것이고, 표 6은 식 A, B 및 C에 의해 결정된 바와 같은 바이오 마커 mRNA 측정치에 대한 위험 비율을 요약한 것이다. 수술 후 생존과 관련한 유용한 정보는 식 B 내지 식 E에 따라 처리된 바이오 마커 데이터에 의해 생성되지만, 식 A에 따라 바이오 마커 mRNA 데이터를 처리하는 것이 이들 바이오 마커 전부가 결과에 기여한다는 것을 보여주는 가장 유익한 정보임이 분명하다.
카플란-마이어에 따른 누적 생존으로 결정된 바와 같은, 수술 이후 3년 및 5년 후에 암으로 사망한 CRC 환자의 백분율. 식 A, B, C, D 및 E에 따라 그룹으로 분류된 환자 간 비교.
A B C D E A B C D E
그룹 3년 5년
-1 7 10 5 - 10 14 15 12 - 18
0 10 13 14 9 10 20 26 21 15 19
+1 28 31 34 20 29 37 38 42 32 38
+2 42 57 41 51 42 47 84 80 58 65
+3 56 - - 34 - 84 - - 60 -
식 A: [SLC35D3/CEACAM5 + POSTN/18S rRNA + KLK6/CEACAM5 - MUC2/CEACAM5], 그룹 -1, 0, +1, +2, +3 제공
식 B: [SLC35D3/CEACAM5 + POSTN/18S rRNA - MUC2/CEACAM5], 그룹 -1, 0, +1, +2 제공
식 C: [KLK6/CEACAM5 + POSTN/18S rRNA - MUC2/CEACAM5], 그룹 -1, 0, +1, +2 제공
식 D: [SLC35D3/CEACAM5 + KLK6/CEACAM5 + POSTN/18S rRNA], 그룹 0, +1, +2, +3 제공
식 E: [SLC35D3/CEACAM5 + KLK6/CEACAM5 - MUC2/CEACAM5], 그룹 -1, 0, +1, +2 제공
일변량 콕스 회귀 분석에 따라 계산된 바와 같은, 수술 후 CRC의 재발 위험. 식 A, B 및 C에 따라 그룹으로 분류된 환자 간 비교.
식 A 식 B 식 C
그룹 위험 비율 P-값 위험 비율 P-값 위험 비율 P-값
-1 * * *
0 1.33 ns 0.49 Ns 0.41 ns
+1 3.15 0.028 2.34 Ns 3.3 0.008
+2 3.64 0.021 5.56 0.001 6.59 <0.0001
+3 6.98 0.001
식 A: [SLC35D3/CEACAM5 + POSTN/18S rRNA + KLK6/CEACAM5 - MUC2/CEACAM5], 그룹 -1, 0, +1, +2 및 +3 제공
식 B: [POSTN/18S rRNA + SLC/CEACAM5 - MUC2/CEACAM5], 그룹 - 1, 0, +1, +2 제공
식 C: [POSTN/18S rRNA + KLK6/CEACAM5 - MUC2/CEACAM5], 그룹 -1, 0, +1 및 +2 제공.
바이오 마커 mRNA의 결정을 위한 키트
본 발명은 또한 바이오 마커 mRNA 및 18S rRNA의 분석 및 미가공 데이터의 식 A 내지 식 E의 식으로 설명된 바와 같은 임상적으로 유용한 정보로의 변환을 위한 키트를 포함한다.
본 발명의 일 구현예에서, 표 1에 제공된 특정한 정방향 및 역방향 프라이머 및 프로브 서열이 실시간 정량적 RT-PCR에 사용된다. 정량화는 특정 카피 표준물질(RNA)과 샘플 내의 18S rRNA 함량 및/또는 CEACAM5 mRNA의 함량에 대해 정규화된 바이오 마커 mRNA 값을 갖는 역전사를 위한 3' 프라이머를 이용하여 달성된다. 수술 치료 CRC 환자로부터의 림프노드의 임상적 재료 분석으로부터 결정된 컷오프 수준을 갖는 바이오 마커 수준에 따라, 정규화된 값이 두 그룹(1 = 높은 재발 위험 및 0 = 낮은 재발 위험) 중 하나에 할당된다. 특별히 설계된 알고리즘을 이용하여, 각 바이오 마커에 대한 (1) 및 (0) 값은 -1, 0, +1, +2, +3의 범위를 갖는, 암 사망의 상대적인 위험의 추정치로 전환되며, 여기서 식: SLC35D3/CEACAM5 + KLK6/CEACAM5 + POSTN/18S rRNA - MUC2/CEACAM5를 기초로 하여, -1은 가장 낮은 위험을 나타내고, +3은 가장 높은 위험을 나타낸다.
도 4도 5표 5표 6에 예시된 바와 같이 본 발명의 구현예에서, 바람직하게는, 가장 높은 바이오 마커 mRNA를 갖는 림프노드로부터의 정보만이 가치가 있다. 그러나 다수의 환자는 종양 세포를 포함하고 있는 림프노드를 하나 이상 가지고 있다. 본 발명에 따른 방법은 또한 이 경우, 즉 N1 및 N2 병기 환자 간의 차별화를 위해 사용되어 예후 값을 추가한다.
실험 방법
일반적인 방법
생물정보학 분석 - 마이크로어레이 유전자 발현 분석 결과를 직접 혼성화 분석법에 대한 일루미나 비드스튜디오(Illumina Beadstudio) 소프트웨어(버전 3.3)를 이용하여 분석하였다. 강도 데이터는 백그라운드를 빼고 비드스튜디오스 큐빅 스플라인 알고리즘으로 정규화하였다. 발현에서의 유의미한 차이는 벤자미니 및 혹버그 위발견율(Benjamini and Hochberg False Discovery Rate)을 이용한 다중검정교정(multiple testing correction)과 함께 비드스튜디오 소프트웨어 오차 모델 일루미나 커스텀(Error Model Illumina Custom)을 이용하여 계산하였다(Reiner A. et al. Bioinformatics, vol. 19, p. 368-375 (2003)). 유전자 발현의 차이를 배수 변화(fold change)로서 계산하였고, 대조군의 평균 신호에 대해 관심 CRC 샘플의 신호를 나누었다.
세포주 및 말초 혈액 단핵구 세포 - 다음의 확립된 인간 세포주를 이용하였다: LS174T, HT29, T84, HCT8 및 CaCo2(모두 결장암), Jurkat 및 Molt-4(T-세포 림프종), B6 및 KR4(EBV-형질전환 B 세포주), U266(형질세포종), U937(단핵구 유사 세포주), K562(적아구성 세포주(erythroblastoid cell line)), HL60(과립구 세포주), FSU(섬유아세포 세포주). 말초 혈액 단핵구 세포(PBMC)를 피콜-이소파크(Ficoll-Isopaque) 밀도 구배 원심분리에 의해 건강한 성인의 말초 혈액으로부터 단리하였다. PBMC를 0.4% 인간 혈청 알부민이 첨가된 HEPES 완충 RPMI 1640 중 OKT3 단일클론항체(50 ng/ml)와의 배양에 의해 시험관 내에서 활성화시켰다. 일곱 명의 개체로부터의 PBMC를 4, 7, 20, 48 및 72시간 동안 동종 배양액 중에서의 자극과 함께 배양하고, 세척하여 모으고, RNA를 추출하였다.
CRC 환자 및 대조군의 임상적 특징 - CRC 치료를 위한 수술을 166명의 환자에서 수행하였다[81명의 남자, 85명의 여자, 중간 연령 72세(범위 42 내지 90세)]. 종양 중 13개는 직장에 위치하였고, 153개는 결장에 위치하였다. 직장암 환자 중 일곱 명은 25 Gy의 수술 전 방사선치료를 받았다. 국소적 근치 종양 절제를 모든 환자에서 수행하였다. 종양 분화도는 11개 종양, 145개 종양 및 10개 종양에서 각각 불량, 중간 및 높음이었다. 2,351개 림프노드에 대해 통상적인 헤마톡실린 및 에오신(H&E) 염색을 수행하여, 환자당 13개(범위 1 내지 51개) 노드의 중간값을 제공하였다. TNM 분류에 따르면, 30명의 환자는 I기(T1-2N0M0), 74명은 II기(T3-4N0M0), 46명은 III기(임의의 TN1-2M0) 및 16명은 IV기(임의의 T 임의의 NM1)이었다. 34명의 환자(4명은 II기, 19명은 III기, 11명은 IV기)는 수술 후 화학요법을 받았다. 후속 조치 기간 중간값은 75(범위 33 내지 147)개월이었고, 어떠한 환자도 후속 조치에서 누락되지 않았다.
대조군은 궤양성 대장염(n=18), 크론 대장염(n=3), 직장탈출증(n=1) 및 대장 지방종(n=1)에 대한 수술을 겪은 18명의 남자와 5명의 여자를 포함하였다[중간 연령 25세(범위 10 내지 61세)].
환자 및 1건의 사례에서는 환자의 부모로부터 사전동의를 얻었다. 스웨덴 우메오 대학교 의학부 연구윤리위원회가 연구를 승인하였다.
원발성 및 원격 CRC 종양 및 정상 결장 조직 - 85개 원발성 CRC 종양으로부터의 113개 샘플을 대상으로 바이오 마커 mRNA 수준을 분석하였다(16명의 I기 환자로부터 22개 샘플, 35명의 II기 환자로부터 44개 샘플, 25명의 II기 환자로부터 41개 샘플 및 8명의 IV기 환자로부터 8개 샘플). 원발성 종양 병기 분포(pT1-pT4)는 각각 2, 14, 55 및 13이었다. 분화도는 11개 종양에서 불량, 71개 종양에서 중간 및 3개 종양에서 높음이었다. 크기가 대략 0.5 x 0.5 x 0.5 cm인 1개 내지 4개의 샘플을 절제 직후 원발성 종양 표본으로부터 수집하고, 스냅 동결(snap-frozen)하여, RNA 추출 시까지 -70℃에 보관하였다. 근위 또는 원위 절제연(resection margin)으로부터 회수한 여섯 개의 정상 결장 샘플 및 두 개의 원격 간 전이 샘플을 수집하여, 원발성 CRC 종양과 동일한 방식으로 처리하였다.
결장 조직으로부터의 상피세포 - 기술된 바와 같이 절제연에서 정상 결장 점막으로부터 결장 상피세포(EC)를 단리하였다(Fahlgren A. et al. Clin. Exp. Immunol., vol. 131, p. 90-101 (2003)).
림프노드 - 절제된 표본으로부터 림프노드를 회수하고, 별도의 멸균 칼로 2등분하였다. 각 림프노드의 절반을 통상적인 H&E-염색을 위해 10% 완충 포르말린에 고정시켰다. 다른 절반은 액체 질소에 스냅 동결하여 RNA 추출 시까지 -70℃에 보관하였다. CRC 환자로부터 503개의 림프노드(I기 내지 IV기 환자로부터 각각 91개, 253개, 107개 및 52개의 노드)를 수집하였다. 환자당 중간값 2개(범위 1 내지 15개)의 림프노드를 입수하였다.
대조군 환자로부터, 108개의 림프노드(궤양성 대장염, 크론 대장염, 대장 지방종 및 직장 탈출증으로부터 각각 82개, 9개, 13개 및 4개의 노드)를 수집하였다.
RNA 단리 -제1 균질화 단계에서 25 mg 조직당 4 M 구아니디늄 티오시아네이트, 25 mM 시트르산 나트륨(pH 7.0), 0.5% 사르코실 및 0.1 M 2-머캅토에탄올을 함유하는 용액 0.5 ml 및 최대 2.5 × 106개 세포를 첨가함으로써 산 구아니딘 페놀 클로로포름 방법(Chomczynski P and Sacchi N. Analyt. Biochem., vol. 162, p. 156-159 (1987))을 사용하여 림프노드, 정상 및 종양 결장 조직, 결장 상피세포, PBMC 및 세포주로부터 총 RNA를 추출하였다. 추출된 RNA를 리보핵산 분해효소(RNAse) 억제제인 RNAsin(1 U/μl; 프로메가(Promega), 미국 위스콘신 주 매디슨 소재)을 함유하는, 리보핵산 분해효소를 포함하지 않는 물(RNAse-free water)에 용해시켰다. 나노드롭(NanoDrop) ND-1000 분광광도계(나노드롭 테크놀로지스(NanoDrop Technologies))로 RNA 농도를 측정하고, 비드 마이크로어세이 분석을 위해 RNA 나노 분석법을 이용하는 2100 바이오분석기(애질런트 테크놀로지스(Agilent Technologies))로 RNA의 온전성(integrity)을 분석하였다.
RNA 카피 표준물질의 제조 - 원발성 CRC 종양, 두 명의 CRC 환자로부터의 두 개의 림프노드 및 결장암 세포주 LS174T 및 T84로부터의 총 RNA를 카피 표준물질 제조를 위한 출발물질로 이용하였다. RT- PCR에 이용된 프라이머는 표 2에 제공된다. 정량적 RT-PCR에서 증폭된 각각의 서열이 포함된 PCR 생성물을 클로닝하고, 시퀀싱하여, T7 중합효소/리보프로브 인 비트로 전사 시스템(T7 polymerase/RiboProbe In Vitro Transcription Systems, 프로메가)을 이용한 시험관 내 전사용 주형으로 이용하였다. 선형화된 DNA 3 내지 7 μg을 2 내지 3시간 동안 37℃에서 수행되는 대규모 합성 반응에 사용하였다. 그런 다음, 반응 생성물을 1 U/μg의 리보핵산 분해효소 불포함 DNA 분해효소(DNase, 프로메가)로 37℃에서 30 내지 40분 동안 처리하고, 페놀:클로로포름:이소아밀알코올(25:24:1) 및 클로로포름:이소아밀알코올(24:1)로 추출하였다. -70℃에서 적어도 1시간 동안 2.5 부피의 99.5% 에탄올 및 0.5 부피의 7.5 M 아세트산 암모늄으로 RNA를 침전시켰다. DNA 분해효소 처리를 적어도 2회 반복하였다. 마지막으로 카피 표준물질을 RT-PCR 및 PCR로 확인하여 DNA의 함량을 평가하였으며, DNA의 함량은 그것들 전부에 대해 0.2% 미만인 것으로 나타났다. 전사체 농도를 OD260 값, 전사체의 분자량 및 아보가드로 수를 기초로 하여 계산하였다. 표준물질을 최종적으로 108 카피/μl로 희석하였다.
실시간 qRT-PCR - Tacman EZ RT-PCR 기술(어플라이드 바이오시스템즈(Applied Biosystems), 미국 캘리포니아 주 포스터 시티 소재)을 이용하여 SLC35D3, POSTN, KLK6, CEACAM5 및 MUC2에 대해 RNA 카피 표준물질을 이용한 실시간 qRT-PCR 분석법을 구축하였다. 프라이머 및 프로브 서열은 표 1에 나타낸다. RT-PCR 프로파일은 2분 동안 49℃, 30분 동안 59℃, 5분 동안 94℃에 이어, 20초 동안 93℃ 및 1분 동안 61℃의 45 사이클이었다. 103 내지 108 카피/μl 농도의 각각의 RNA 카피 표준물질의 단계적 희석액을 각 분석에 포함시켰다. 모든 qRT-PCR 분석은 3반복(in triplicate) 수행하였다. 방출된 리포터 염료로부터의 방사를 ABI 프리즘 7900 서열 검출 시스템(퍼킨-엘머(Perkin-Elmer), 미국 매사추세츠 주 웰즐리 소재)으로 관찰하였다. mRNA 수준의 정규화를 위해, 제조업체의 프로토콜(어플라이드 바이오시스템즈)에 따라 실시간 qRT-PCR에 의해, 또는 표 1에 제공된 프라이머 및 프로브(서열 번호 16 내지 18) 및 표 2에 제공된 프라이머(서열 번호 26, 17)를 이용하여 제조된 카피 표준물질을 이용하여, 각 샘플에서 18S rRNA의 농도를 결정하였다. 결과를 18S rRNA 단위당 mRNA 카피 또는 18S rRNA 카피당 RNA 카피로 나타내고, 양자 모두의 경우에서 직접적으로 비교할만한 수준의 바이오 마커를 수득하였다.
통계 분석 - 환자 그룹 간 무질병 생존 및 수술 후 재발성 질병의 위험의 차이를 로그 순위 검정 및 일변량 콕스 회귀 분석과 조합한 카플란-마이어 생존 모델에 따라 계산하였다. P 값이 <0.05인 생존 기간 및 위험 비율의 차이는 통계적으로 유의미한 것으로 간주하였다. 사용된 소프트웨어는 SPSS(버전 18)이었다.
SEQUENCE LISTING <110> Hiloprobe AB <120> Marker genes for colorectal cancer classification <130> 21090160 <160> 32 <170> PatentIn version 3.5 <210> 1 <211> 19 <212> DNA <213> human <400> 1 agcactcccg tgacgtacc 19 <210> 2 <211> 17 <212> DNA <213> human <400> 2 tcatcaccac ctgcggc 17 <210> 3 <211> 18 <212> DNA <213> human <400> 3 cctggcagga gccggcga 18 <210> 4 <211> 21 <212> DNA <213> human <400> 4 cccttgctta ctccctttct c 21 <210> 5 <211> 24 <212> DNA <213> human <400> 5 acagctcaga gtcttcgtat atcg 24 <210> 6 <211> 17 <212> DNA <213> human <400> 6 acagctgtct gcattga 17 <210> 7 <211> 19 <212> DNA <213> human <400> 7 aaggttatgc ttccccagg 19 <210> 8 <211> 21 <212> DNA <213> human <400> 8 cttatccatc cactgtgggt c 21 <210> 9 <211> 27 <212> DNA <213> human <400> 9 cactgcaaaa aaccgaatct tcaggtc 27 <210> 10 <211> 21 <212> DNA <213> human <400> 10 tagtgtccag ctccagcatg a 21 <210> 11 <211> 21 <212> DNA <213> human <400> 11 aagagcgatg cctacaccaa a 21 <210> 12 <211> 16 <212> DNA <213> human <400> 12 tcccggttcc acatga 16 <210> 13 <211> 24 <212> DNA <213> human <400> 13 tgtagctgtt gcaaatgctt taag 24 <210> 14 <211> 24 <212> DNA <213> human <400> 14 ctgatatagc agccctggtg tagt 24 <210> 15 <211> 18 <212> DNA <213> human <400> 15 aggaagactg acagttgt 18 <210> 16 <211> 17 <212> DNA <213> human <400> 16 ccgctcccaa gatccaa 17 <210> 17 <211> 23 <212> DNA <213> human <400> 17 gtaattccag ctccaatagc gta 23 <210> 18 <211> 15 <212> DNA <213> human <400> 18 ctgcagttaa aaagc 15 <210> 19 <211> 19 <212> DNA <213> human <400> 19 cagcactccc gtgacgtac 19 <210> 20 <211> 17 <212> DNA <213> human <400> 20 catcggcgtc ctggttc 17 <210> 21 <211> 16 <212> DNA <213> human <400> 21 tggatcacag cccgga 16 <210> 22 <211> 18 <212> DNA <213> human <400> 22 tacacctcgg gccacttg 18 <210> 23 <211> 18 <212> DNA <213> human <400> 23 ccgggctgct cattgaga 18 <210> 24 <211> 19 <212> DNA <213> human <400> 24 tggctaggat ggtctcgat 19 <210> 25 <211> 21 <212> DNA <213> human <400> 25 ggacctatgc ctgttttgtc t 21 <210> 26 <211> 20 <212> DNA <213> human <400> 26 cgctcccaag atccaactac 20 <210> 27 <211> 3420 <212> DNA <213> human <223> SLC35D3 <400> 27 agtcggacgc agagctgcct aaccgcaaga acgcctggcc ggagctgccc tctgcagccg 60 agccggcgcc ccctgccctt cgccgccgcg ctgggcgggc gcccccgccg ccctcactcc 120 gctgctcccg gctcctcgcg cgcaggtcgc ggagctccgc caccgctggg tgcggcgagg 180 ccggcgcgat gcggcagctg tgccggggcc gcgtgctggg catctcggtg gccatcgcgc 240 acggggtctt ctcgggctcc ctcaacatct tgctcaagtt cctcatcagc cgctaccagt 300 tctccttcct gaccctggtg cagtgcctga ccagctccac cgcggcgctg agcctggagc 360 tgctgcggcg cctcgggctc atcgccgtgc cccccttcgg tctgagcctg gcgcgctcct 420 tcgcgggggt cgcggtgctc tccacgctgc agtccagcct cacgctctgg tccctgcgcg 480 gcctcagcct gcccatgtac gtggtcttca agcgctgcct gcccctggtc accatgctca 540 tcggcgtcct ggtgctcaag aacggcgcgc cctcgccagg ggtgctggcg gcggtgctca 600 tcaccacctg cggcgccgcc ctggcaggtg agcgggcccc cgcgccgacc cccagccgac 660 cccacccacc ccgctccgtc gggcagagac cgcggggatc actgagttca acgacctcac 720 ttccagatgg ggagactgag gcagagagag ccggagagct ttgagagtgg tcgctcagct 780 cgcaaaaggg acttccgaga cccagagagc tccccagcgc cccaccaagt ccccctgccc 840 cctaatgtcc tggcttccga ccctcgccca tgcttcaccc ggcatcgccc ttcctgtcgc 900 cccctctcct ggtcttcccc tgtcacccca ttctccggga gaggtgggag ggccgcctga 960 gcctgggagc tggagtcctc caagcctgga ccaagccgga aggagggggc cgtgaacttc 1020 cttgggtcac gaggggctgg aatggaggtg ggggatgggg gcgaagctga gggttcccgg 1080 ggctactgcg gggtgtctcg tgctgcgcag ggggctgcgg ccctggggca gacgacccag 1140 gtgctgagcg agacgagagc ctgggcaggg ggaagcttca ctgggggcca gaacaggcgt 1200 tctcccccgc gcctggcccg ctccgggttg caggccactg gctggggctc cctctccctt 1260 tggtgcccca cggggcaggg gctccggggt gcaggtacca cgcgcccaag tgacctcggt 1320 gccagctcgg ggaagccaca gcacctgccc cgagggcatc tgcgctctcc ggggcctttg 1380 tcttggacag aggaagatgg agtgacccgg ggatatggcg ggaaggcgct ctgagcactg 1440 agtttggctg tcgcatttga cacgggtggc cgagggacgg cgggcgtctg tcactcagga 1500 atccggtggg cagagctggg gcgcgaaccc agtctccttt cctacccgac gcgttttccc 1560 cgtgggtccc cgcccacgcc aacctgctgt cttctctctt tttccttccc gcccgggctc 1620 ggccgtcctc ctcgtgcgcc gcaggagccg gcgacctgac gggcgacccc atcgggtacg 1680 tcacgggagt gctggcggtg ctggtgcacg ctgcctacct ggtgctcatc cagaaggcca 1740 gcgcagacac cgagcacggg ccgctcaccg cgcagtacgt catcgccgtc tctgccaccc 1800 cgctgctggt catctgctcc ttcgccagca ccgactccat ccacgcctgg accttcccgg 1860 gctggaagga cccggccatg gtctgcatct tcgtggcctg catcctgatc ggctgcgcca 1920 tgaacttcac cacgctgcac tgcacctaca tcaattcggc cgtgaccacc agcttcgtgg 1980 gtgtggtgaa gagcatcgcc accatcacgg tgggcatggt ggccttcagc gacgtggagc 2040 ccacctctct gttcattgcc ggcgtggtgg tgaacaccct gggctctatc atttactgtg 2100 tggccaagtt catggagacc agaaagcaaa gcaactacga ggacctggag gcccagcctc 2160 ggggagagga ggcgcagcta agtggagacc agctgccgtt cgtgatggag gagctgcccg 2220 gggagggagg aaatggccgg tcagaaggtg gggaggcagc aggtggcccc gctcaggaga 2280 gcaggcaaga ggtcaggggc agcccccgag gagtcccgct ggtggctggg agctctgaag 2340 aagggagcag gaggtcgtta aaagatgctt acctcgaggt atggaggttg gttaggggaa 2400 ccaggtatat gaagaaggat tatttgatag aaaacgagga gttacccagt ccttgagaag 2460 gaggtgcatg tacgtaccta tgtgcataca cttattttat atgttagaaa tgacgtgttt 2520 taatgagagg cctccccgtt ttattctttg aggagtgggg aagggaagaa aagaaagaag 2580 ctgaaaggta ctgacacaga gcaacaaaat tagcacctgt gtgaattatt tagtgtgact 2640 tcacctgagg catcacagag acaaaagaat gtgaagctac ttaacaaagt aaggcaacgt 2700 ttctgcttca gactcctggc acatttactt tttgtcatta taaccataac taaatatctg 2760 catgtaccaa gagtccctaa gccaccccct ccaaagatgg agtgtagaaa tgatgacagc 2820 acttagtaag ttcaaagatg acattcaggg atgcattttt tgatgataga actacagttt 2880 ttatcgccag ctgggcaaag agtatattgc tgaaatgata tataaatata ttgaattgat 2940 gtttactgtt tatagtcatc tgaaatatca tatttactct gattctactc acttgttttt 3000 taaaaataag tgtcctatta ttgtattata tattgataga aactgttaaa gctattttga 3060 aaatatgagt tcttagcttt aatcatgaag tctgaagttt gctttcagta attattttaa 3120 aagttgtttt ggttcattgc tttataatat ttattattga atgccaaacc tgttcttttt 3180 tttactgtgt ccaatattct ttcaagcaaa tgcaatggct ggaatataat tcagaattaa 3240 ctgaaaccca gccagaagag ggaccacctg taaagcaagt cctttcaagt ttcactgcac 3300 atcccaaacc atgttacaaa aagagcaact gctatattca cattatgata tttttctatc 3360 ttaaatttgt caaaataaag tatgagtcta actattaaag gatacattgt tagaaattta 3420 <210> 28 <211> 36263 <212> DNA <213> Human <223> POSTN <400> 28 taatttcatt caatttcctt taatgagtac ttgttacagt aaaagaggta taaagtcctg 60 ttcccaagtc caaaccactt tttaacttaa atcttgagtt tttctgaatt actcaatttg 120 aagtaattct ctttatatct gaaaaatggt tttattgaaa cgtttgagat taaaaaatat 180 gcattgcaag aagcatatga caaacattct gagagtacaa aattagttgt aaaaaataac 240 ataatttacc agtaaaccca ctcatataga aatgtgcaaa gccttttgat ataaaaagtt 300 ttgtacacca agcacctatt tttataactt agcttcccat ggagagataa tggcttgcgt 360 gcattttatg tatccataac atacatacaa ggctcggtct tttcaatggg ataacagttc 420 acaactcttc gatttgaatt gtaatgaatc tggtgacaag gatttttctc taatggattc 480 caaagttagc cagaactttt aatgtcaaga tgaaaaaggg tgtaaggtgt tatattttct 540 tcaattcctt taccacagga ggctaactcc acaatttccc tcatgtttct cattcagaaa 600 aaaaaatatt aaatttgtgt tcagaattat ttgatgattg cttctttgtg ctgatgtttc 660 agttcctgaa gtcaacttgg ctctcacaat tttctaaggt caggttattg acttagggtt 720 gtataaacat ttttttctgg tttttggatt ttcactgaga acgaccttcc cttaatcgtc 780 ttctagatcc taattagaaa gaaaggagaa tgtatagact gtaaatgtta ggaaatttta 840 aaatttaaga atatattatt ctctgtatat ctatcagagg ccattatttt ttgtaataaa 900 ccttagatta tgttttctta atatcttcaa cttatggtga agcaaatatt atattttgat 960 caaaagtata taaaataata atttgaaatt taataatttt aactctttag aaaatttgtg 1020 tcaatttgga tatttacata gatttactga cacattcttt agttaaaaaa tatctgtgca 1080 gttgatcttt tactttcaaa ggtctgtata ttggattggt ttaaagtaag aagttcctat 1140 agcgcattga taagccttgt gtctcctttt cactactagt atctaattaa cccagaaatt 1200 ccaaacttgc aattccaaac ttgcaattta ctctagcttc cacaagggaa attcttgctc 1260 tctcaatgta ttggaatgta agataactta agtggaggaa ttagcaaatg cacatagtgt 1320 aattatgaaa taaattgtaa tgcacatgtg atatatacat atataatcta catatttaaa 1380 tgaacatttt gtaaatagct atattaatgg ttttttgcat atatacattt cttatttact 1440 tatgtctcaa actgtagcat tgtctcacat aataacattt ttaaggattc aggtccacct 1500 gcaatctaca tttgtttatc tctgatattc aacaatttct ttttgactta actcttatat 1560 acacaaaatt atatgtatac ttgtatatac aaaacattac atatatatat atatatatat 1620 atatatatat atatatatat atatatatgt atggagaata tacacttgag tctatctcaa 1680 gggttcaata tgcctagcag tttacatgag tatgttgacc tttcccttaa tatttgttat 1740 tagattctga tagtatagaa catgagaaat ttattttctg attgttatca aaattgtttt 1800 catcaaaact ggctagcttt tctctctgat cgataacaag tttcaataaa atactttaaa 1860 atctttccta ttgtttgatt tctcttcatg taacaaaaga ggccatatac acacattact 1920 atagccaata cacttacctt gaactttttt gttggcttgc aacttcctca cgggtgtgtc 1980 taaaattaaa ttgttgtagt tagaaatact tcgcaattat ggctaaaatc agacaggaga 2040 ccatggttaa acagaacagt gtaaagtctt aaataagtat cacttaaaca cgaagattat 2100 ttttagtagt taaattttat gatcctcaga gttttacatt ttttcgtaaa ggacaagtag 2160 acagacagtg ttttccatat atcataatga atgtttctta gttgcaaaac acattgtttc 2220 attatggatt ttggaacccc acctaatgtg ccatttttgc agagtaaatg acttacatga 2280 ttttttcaat ctttttgtaa aaaacattgc cttatgatga agggttatta aatgtcatat 2340 aaagtttaac acaagtatct tcccagagtt agccacccat ttttgcagtc atacctatgt 2400 gcaatgtctg cctctgtaaa attatcacta agatcaattt gtgattcctt tattgtacat 2460 tgacgacaac aaagtagcac tgacctaatg attctagaaa tgttataata agtaattcag 2520 aaagaatatg ccatcaccct tgttccacct cccaacctga ttcagtgtca atcctatgag 2580 atccttttaa aaaattaact aataaaagct tttatattta agaactgcaa gtgtttcaaa 2640 actatgctgt tttgtgttgt tatagttgta acatatttct caattttcct gtttttcttt 2700 tagtttattg acaagactac ctggtcggcc taaattcaca ttttcattca gtttttgggc 2760 atttgagatc aaagagtaag tatggtttct acagttactt catttttcta cttatctttt 2820 taaatttttt ctccaaattt tgacttcttt tatatgtatc atctatactc agcatgaagt 2880 ccagtttttt ctattatata catgttttca attcgctgaa atcatataaa aagtaagcaa 2940 tgaaactgtc accatgaata gttttggcta tatgacacca agcaaatttt ttaaaaaaga 3000 aataacattc aaaacaactt atatattctg tttctgtcta cttagcacat tttcacattt 3060 ctttcccccc agaatataag gcatataatc atttataaaa ccacattaat actagagtaa 3120 aatatagaac tatagaaaaa tctcactatg ttggataatg gggagaagtc tgtgtaaaac 3180 aaccaagtct gagttatgaa atattctcca acagatataa atagatgtaa atataaatat 3240 ttcttaactt caggtttatt tggtaacgaa ataatggctt ctaaaaaatt gtcaagaaga 3300 gacagatcca acctttaatt ggtgtgcagg cacattgctt atagtggact tattaaattc 3360 caaatagcag ttaattgtat aacttaaaac tgcatcatag aagtatttac caatttcttt 3420 tcaaaacaag tgtgctcact cagatttcct ttcataattt tgatagcatc caattaatga 3480 ggttttgctg tgataatatt ccagaataaa aaacattcaa tgtgtcaaac aaatactttg 3540 aaagaacagc ttgattaatg tgtagaaaac aggtttactc ctagcagctc tctgctatgt 3600 caacatgaat gagagttata ttagatcatg tttagagcag caaaacatgg gaagataaac 3660 caattacttg aatatattgg cacaaagaac caccctacat cttatttcct aaagcatgca 3720 aagtactcag ctcaattatt ttgacatttt atttgcatgt ttgttttttg tatgtttcca 3780 tggttatgac tatggaaatt taaagttggg tgagaaacat tacttaattg accatgttaa 3840 tgtcaattga tgattgacag taacatttga tgacagctta ctttgtgctg aacattgttc 3900 taagagcttg tcatatatta acttatttag actgtaggta tcactactat cctcactttc 3960 agatgaagga aacaagcaag aaaagagtca actaatttgg gattgagttg gggctcagac 4020 tgaatgcaga cctacaactc gatctactat tctctataga ggttacaaat cttaacctct 4080 tatgttggca gatttgcgaa aaccttcaaa aatgactttt tgttgttgtt cctttcgaca 4140 tagtctgtta ttctccttta attgcttgag tcgtttcaga atgcataatt ctaaggtaag 4200 cccaaaaatt ttatgcattt aatgagaaat tttttcagtt aaggtcttgg aagtgtatca 4260 gtgacaaatc acaacatcag tactcaaagt accagttagc catgttaata gtcatgactt 4320 aaatgattga gaaatatact caaattacca aaagtacaaa aaatgtacta catggccggg 4380 cgcggtggct cacgcctgta atcccagcac tttgggaggc cgaggcgggc ggatcacgag 4440 gtcaggagat cgagaccatc ccggctaaaa cggtgaaacc ccgtctctac taaaaataca 4500 aaacattagc cgggcgtagt ggcgggcgcc tgtagtccca gctacttggg aggctgaggc 4560 aggagaatgg cgtgaacccg ggaggcggag cttgcagtga gccgagatcc cgccactgca 4620 ctccagcctg ggcgacagag cgagactccg tctcaaaaaa aaaaaaaaaa aatgtactac 4680 atgtaccaca atgtatacga tatgaactgt ttagatagaa aattcagttt taggtagaac 4740 ttattgagtt gaagagcatg gttcagatat gtattaattg gccagacctt ggaaaaaaaa 4800 aaagtcttac atagtgtaat ctttactagc ttcttttatc aatgcctttt aggatctaga 4860 caaggggata cttgtgactc agtaatgacc tgatggtttt agatagctgg aaaaaagaaa 4920 acaagcatgt ccaattaatg ctggtactag taattctacc gcatatagtg tttttcctac 4980 aaaaagcaaa accttggaga aatgatttga taaaaacttt taattttttt tgttttttca 5040 caatgctata atagttgacg tggcattgtg aaaaccgatg ccttacagat atgtagagag 5100 atcatacact gggaactaaa ggaataaact tctgggatga tcagaggcaa gagctaagaa 5160 aggagttcat taactaaaaa ttgaatgtca tatacttaac ttgtagcagt tatatgtttt 5220 cttggctgaa gcaattcttt agtatttaac tggatttttc atagtggcct caataacagg 5280 ggcttatcaa aggggaagaa aatatactta cctgaaattt aatcctaaat gaattaaagc 5340 aatataaact gatgcagcta ctaatttatt gattccctaa aaagcactac cattctacaa 5400 agctgcttac tatggcaagg actgaaagaa aaaaaaaaga attcaattta atcttcataa 5460 tgtgtttgtc tcttccctca aatccttaga tttttttcct agcagacagt tgagcattta 5520 ggggtagata gtgaattctt tgttagatcc tacaggaatc tttggttccg ttatggctct 5580 gttgtgctat gtactcttag aattctggga ggaaacttgt atttttcaga catatatatt 5640 tctattgagg gaaaattcaa tcattggttg aattaaaaat ttttaaacta tcactgacaa 5700 gtttctaaat actatttaag agattttacg tttattaaac tacagaatat agaaataata 5760 attgctaaaa atatagaaag tcccaagata atttacattt tcttggacat agtgatacag 5820 ttttaaaaag tataagctga aaagccatct ggactgtgtt ttggataaac atcaaacttc 5880 agttatgttt ctcaattaat agtatatttc aaagtgccta tttggttttt ctaaagaata 5940 taaatacatg tttcacaaaa aataattttt cagcttaatt ctttccttgt taaaaaatga 6000 agtagaaatt tgtttattca aatgccaatg atacaaatta tgtatctata taaacaacat 6060 ctttgaataa ttactatgta gggtttgtgt aagattttga attctttttt ttttgttctt 6120 aaggttcatt taatgccaca gacagagaac attccataaa agattaagat taattttata 6180 tgcaaaataa cttatatcta caggtataga ttatcactca aactgttaga agaaacagat 6240 attcattccc aagaatatag ttttggaaaa gaatgttact aaatgcacta tttttggcta 6300 tatctatgta tagaatttaa agacatgcct tgattgctct tatgggggca gtgaatataa 6360 ttttttaaat ataaaaagta tatcaaattt gggcttgttt aacagctagc aatttaacaa 6420 ttatttccct tttgcatact taaaaggccc ttaaaattat ctgaatcaaa gcaaaaaaaa 6480 tattcattgc tccccaaact ttataccata gaacttttta aagactgttt aaactagtaa 6540 tcatttcttc ataactatta actaccattg aaccaatcca tctattaaga caacagtgga 6600 tgttgtcttt ttttttttta acccaattaa aagaaaaaat ctgcttgctc agtctttaaa 6660 aagttgaact cagtcactag aacctgttaa gggggttagt tgttgtcctt ttactaacct 6720 ccctgaagca gtcttttaat ttcttcatct tcaaataaat gaccatcacc accttcaatg 6780 aatttggtga ccttggtgac ctctgagagg atacatgttt atagcagaaa ttggtttata 6840 taacaaaata aagacagcag actttatgtc ataaataatg gcatctgccc aataatgaat 6900 tccagcccaa cactcgattc tttcacaaat tttagtgctg ttttctgaca tactaatatt 6960 cttataaagt tgttgaacaa aatactgtat aaaaaatatg actgccattt atgcttaatt 7020 ccttattctt gtgctttttt cttgttggta tggaaatgaa caatagattg agatagagta 7080 gaaaacatgt agaatgttat tttagacttg tatatggata gcttaggtaa agtcacattc 7140 ttattttcct agaaatgctg accttcttgt aacaatttct tcagagtttc ttctgtttct 7200 ccacctccag tagaaatcct agtgtatttt atttcaggac ctatgagaag gacaatgaaa 7260 aaggtctaaa acagaagtag gcaaacttct tctgcgaagt gacagagagt aagtatttta 7320 cacttgtggg ccatgtagtc tgtgttgcca ttgttcaact ctgatacttc agtgtgaaag 7380 cagccttagg tattatataa atggatggga aagactgtgt tccgataaaa ctttatttcc 7440 ataaatgggt ggcacaagcc acacttgctc actaattgtt taaacaaata cttaaagaat 7500 agctgaatta aggattttcg gcgaatttta ggctaatttg gaccaactgg acgctagttt 7560 ggaagtctga tatgaggttt actgaaaata ttgatcaatt gctttgtata aacttgcttc 7620 tattttggca ggtagatgta cagaccttaa gattaatgga agctcaaatg aggaaatggc 7680 ttttcttcta gggtcctcta actcattaac aaacagtaaa gtgaaaatgg aatatcatat 7740 caatggtata tcatattaca tgtatgtatg catacatgta ataaaaacaa atgcttttag 7800 atttgtctac aaattttcaa ttcagagtaa aacatagatt acatatttag aataatatta 7860 tatctgccaa aatatgaagt aactttagta atcactatga aaatgacttg tttctttaat 7920 gattcttata tttggggatt aactataatt tgatctttat aatctaggca tagatccatg 7980 tatggaatta atggctacct gtaatgattc gttcttctcg tgtctctttt tcagttattt 8040 ccacaggcac tccatcaatg attttggtgt attttttaat aattggctct aaaagcaggg 8100 gaatacaaat gcatttgatt taccctcata ttgtgactat acatccataa gctagacatt 8160 gtaatgatta actatatttc tacaaatatt accatttaag attcaatcat aaacattttt 8220 agaacatatc ccccaaaaat catatcaata gggatctaaa aggtaatagc tatgtcctga 8280 atcttggttg agagagaggg ccatttgaca tcctaactct ccatgtcata cttgttttct 8340 ggatgtggaa taaatactta gtgagaatcc agggagttct atatcattgg aatgggagcc 8400 ctatcataaa tcctagtagt ggagtggctt attagacaga gacttataca atggtcattt 8460 tttcctactg tttctaatat ttccttttat actgacatta atgttacaat tttattccac 8520 aatcctcact tgtatatgca aaaatcatga cattttgttg ggcccagtga cttaatagat 8580 aaattaattc caactagatc cattaaaagc taactatgtt ttatttctga ccagctaata 8640 agaactcata gctgaggaaa taattcccac aatttttata aaataagaac taagagaaaa 8700 tatcagatgt tcaatatttc taaaccaaca ctatttcaaa ataatcacag cgaaggtagt 8760 cggccccagg taacataagg aacgcacctc catggatcac ttcagttatt gtttcacctt 8820 ctttaatcag tctgaattca ggttcacctt caattttgac ttttgttagt gtgggtcctg 8880 ggacattatt ttaggagaca aattatcatg ttaaaacagt cctttaaatt taccggaata 8940 ggacatttat ttcaacattc ggtgtgactc aactcaaatg tcaaagtggt ttcaggctct 9000 atgaaatcac ttttaaatat ttcccattgt cttcaaatta gacaagagtt atgagaacaa 9060 atgatttagt ctgtttgtgt gctactaaaa ttactttcat ctgctttagc ttttaaacag 9120 atggataaat ccatctgttt attcgtagtt ataaagtatg attatgcaaa atattatatg 9180 tggctacact ttgcagatca tgcagtatgt acacatttgt gtttctctga taactggtgt 9240 agatcccact ttatcatact gatattgtct attacttttt ccttattaaa atttttcatt 9300 taagttttaa aatcactcag taccttatat ttttgatcta gtgggtatag gagtgaacat 9360 aagaaagtac caaatgtata cctaccttta agatgctgaa tgtcaggttt tatgaggaaa 9420 ataatttgag tacttacctt ctgtatggga atgatacaca attaaccagt taatagttaa 9480 acagtccttc aaatgcaaaa gataaactag tgttgcattt gacttgcaaa atgattttgc 9540 taccacagaa aatcattttg aaggttagaa agctgcttac tacattagtt aattaagact 9600 gtttcacaga ggagtaagaa aaataagttc agtacattta actcatactg taatagcctt 9660 caatagtgga atgcaactgt tgcttgctta tctttgagag catttttttt tgcttgttca 9720 gaaattgtca atgtacatga ttaccaaaac gaaaccagcc tagaacaatc caaaataatg 9780 aaaataaaag taaagttttt tgaaaccata agtatttcat gccataatat ttgatatata 9840 aggccaaggg atattgagca caaaacataa agccaggttt ttaaggtgcg gtaacttcaa 9900 aagaaaggac gcctaaggaa tttaagaacc aaaaatgcgt taataaaata tctaaatcaa 9960 tatttcttta gaaaagccaa actgaaattt tggaaacatc ctttatagtt aagctctata 10020 aaagaagaga ttttctcaaa attgttttcc tatttactcc caacacctca gaaagtaccc 10080 agcagaatag ctgctcaata actatttgtt gaattgaatt ttagctgatt tattcttaat 10140 tccaaaatgc tgttatgtat cttttataag agacacctta aaattgtgtc ctggagttta 10200 attcatttag taagaattta aaagtcatca ataaatctgt aattgttcaa atagtaagaa 10260 ggaaatgcca gtagcaatcc tggaagctgg accattgtaa attactacta agataaatat 10320 ttgtttcctt cattatgcta cacaggagtg taatttctga actcaagtta ttaatgagta 10380 ggtgacacaa ctccattttt catccatgtt ccctttataa gaagaagcca tgtagagatg 10440 acccgccagt atgatcttaa ctgaataaag attagtagga tagaatccta ctgacaaaga 10500 ttgaggagat aaataagttg aataaagaag cttcaaagga gaagaatctt tgaaaataag 10560 aacattggca catgtaaata atttcaggta aagaagctgt gcacaattat agtgcaaaat 10620 tttagggaat ctgattttta aaaacaggac aagatttgat tttaaaatca attgtattat 10680 caaagatcat tgtgtcatgt tttattacaa tgatcaagga acattttttc aacaaaactt 10740 tctgatttaa tttcttctta aaataccgaa ttgtcttcat cactatagaa agtcgattaa 10800 ataattataa ttatagtatt tttttcaaga aaaaaacaag gatagatttc aaagaataac 10860 tcaattttaa gtctcaagaa taaatactaa tatagataac taattagcta ggaaataagt 10920 ttttacctat gtattttcag tgtataaatt taaattaatg acttacttta aaaaatatag 10980 ataaaagtat tcaagaagtt accttctcaa accaccaaaa gaaatagcaa aaccaaacat 11040 aagtataatt acagtttccc aaagattcca tcaaagatat aatctgttct ctttttggaa 11100 gactgtttct agctttctta tagcacaaag gagataacta gttcttttct ctgggtaagt 11160 tgctacatta agatgcttat acatggaaat cttaaaaaat ttaaattgtg atccttggac 11220 ataattaaaa tacatgaaat gaaagtaaca tcaaagatgt tgaagttggc taacatacat 11280 agtgggagta gagagaaaag taactgctta tttaatgttc tagtctgaaa catcaggaga 11340 gaatgtgtgt gtgtgtctgt attatatata tctcatgtat aatatatacg tctgtatgta 11400 ataatatgtt cagggctgga attaagtatt ttaaaaatca attcactgca taaactactc 11460 attttgtttt ataattctga tggtctaatt aaaaaatatc tcatgcgtgg ttgtaatttt 11520 aaaagctttc agtaaacata gcttctatgc tatcttatgt tacacaatga aaaatgccta 11580 tacttttttt ttttggaaga gcttcttgca ctgttataag aaagaacatg tgggagattg 11640 caaacaaagc aacataaaga gtatacagcc tgtaggagtc tgactaaagt aaaaaaaact 11700 catgtctttg tttagtgagt atctgtatac taagttaatg caatgccaat tagattcaaa 11760 ttaaatcaag tacaagcaaa tgtactgaaa gtattaggaa tgcatcatct actttgctaa 11820 ataatttgca ctccgcattc tgcaattaca tgagcatgcc attggtataa tattggttat 11880 ataacattta acatgttagt ttttaaaaga atgtagatac attcatagag atcagtattt 11940 ttacagatgt ttttactata aaaggaacca tgtataacat tgatttttac cttcagtttt 12000 gataataggc tgaagactgc cttcaatcac tttaattttt ggttccacaa ctttggttat 12060 aattttagtt gctgaaagta tagaaagtgg aacatgaaaa atatttacat aaaaacctga 12120 acaaaggttt tttttttttt tccttttctt ttttgtctct gtaggatact aaggcacagg 12180 atgtggtaat atgttcaggc agtcagatac aggaaatatt tatggtacat aatataatat 12240 cttctcatgt ccaggtgttg aactctgaag tctagtgact tgaatttgat ctagtgaaat 12300 atatactcac aaagtgagga attatatcta gaaatctgta atttttaatt gtaccgctaa 12360 agcgctttac cttcttttgt acttcttgaa aatactggct gcattgcaac agaagacaaa 12420 tatgattaat gtcatgcaat tcataatatc ttaaattgca ttgctggatt ctttctcaat 12480 taaaagaaaa aatgaaagaa aaaggctttt aaaatgtttt tcatgcatct gataacagtg 12540 acatagaaag gaaaaaatga aacatagttc agaatactta aaagtaagaa taaatttcag 12600 ccagccagac atgagctcta ttcaacaaac atgatatgat cagtatttaa gttataggct 12660 aaaatgtctt taattttcag ctttgttatc actatccttt ttttttttta atttaaaggt 12720 atatatttta aacgtgtgtc gtctacctaa gtaagataat agtctttgaa ctaggtacta 12780 tgtttgctgt ttgggtgatg ggttcactag aagcctaaac cccagcatta ctcaatatat 12840 ccatctatca aacctacgtg tgtacccccc tagatctata ataaaagtaa attaaaataa 12900 attaaatacc agtcaactat ttggttgact ttggttgtac tgattaactg gaaatgtgcc 12960 tctgaagcca cacagccaga gcaactggct ttttgtcatt tctaatgaaa agccttgaaa 13020 gatggttcta ttagataacg ggccacactg aagctaactg tgcatctaga tcacatcaaa 13080 gcagtagagg tgagatgtta gcacagcttt ggtttctgca gttctcacct catgcttgta 13140 agatgtttag ctgtgtcaac tttttgaatt aatgtgggtt cttagccttc atagaccctg 13200 tgtttcagcc ttattaggtt ttgtattttg agatctcaaa ttgtgaagct ctaaaataaa 13260 acaaatctgt gtgtttaggt actagttcca caggtggtct tgccacagaa gaacctttcc 13320 atgaaagtcg aatacgaata cacagggctc tctattgctg ctatcaaaat ggactaattc 13380 cttttagctt acatttttta catcatgtta aggaatttga cgttttggat gttcagctgg 13440 ttggtagttt tcatttcaat cttgattttc tgcagactta aatagttttg acaggtgaag 13500 ctctgaggat taaatattga ttttagccct ctccaggtca aatgttccat atttgacaac 13560 ttataccaaa aacagcatcc ttcccctcaa ctatacactt taaaatggat gttattttgg 13620 ggatgaggat aatatgcagc aaaaaattat aggaatttta gaaacaagtc aacaacgaaa 13680 tataaaaata gaaaatttgg tttaatttat ctttacttct actttaaaat acttcttaat 13740 aacagcatac cgtctaagga ggagtaaaag aaacatctta cattggaatg taaatgttag 13800 agctgtttca aggcctctgg gtaggtaggg aaggaccatt gaacatgtgt gtcttaataa 13860 aatgtagctt atgctctgtg agtgaggatg taatttagta ggagaaaata attatatttt 13920 tgctcattgt aatcaagata ttgcattcac atatatagaa agtagtgaaa ctaagatgga 13980 taaagaaggg aagctaaaga aatgtagtgg gaatgtgtat atatatatat gcatatgtat 14040 atatttatac ctttgatgaa gaaagatgac ataacatgtc tgatgaatag agcccataag 14100 gattgcttaa ttttcagaaa acatattttt tacaagattg tattcccatg gtgaatcata 14160 actattccaa ttaaatcttt aatacagtgc tgagctggcc tgatcctgga attgcatgtt 14220 attattgcat aattgaaatc aacaacagca gcagacattt tgttttgctc cttacattgg 14280 ctttactcct tttccatatc tagtataaat cttaagggaa attttcttaa ttaaataact 14340 ggatgctcat ggtataaaat ggaatgattt tctagccaga ataaatgtgg gtattgaagt 14400 aatgttttag ctactgatac actttgagtg tttaattaca gagccaaaac aaaatgaaaa 14460 gaatttctgc ttgaaagcta cagtgaaata aagaaagaga gaaaagataa acagagaaaa 14520 agccatgatg gaaaagatat actactagct acacttatga gaatgaaata ccctttatca 14580 ttgttaagta gtagaggttt aattttgata atctggttgt gtcagagatc aaagaaccct 14640 ggaatttgga aactttaaat ttgtcacatg gcagattttt ttgttccttt gtccaatttt 14700 ggatgggaga gtttttgaac tgccacctta taaacattgg tattcttcaa cacgtgcttc 14760 tcagcctgcc cttagatagc tcagggcttg agggtggcgt gaacaacaag tcttggctaa 14820 ggtcatttct gtgtccacac atctgaattt ttagatattt ctagagggtc ttttcgccat 14880 ctcttccctt tatatgtctt tttattttcc tggctctttg ccacgctaat attatatttt 14940 gctgtctttc tcatgtcata tcatttctgt ttttccaatg agtggggaag aagttcattg 15000 gagttgaagg ttatctgaga cctcaatcct tttttcaagt gaaatgagat tggccatagt 15060 ttggaattct aaataccaga ttatcaataa tctctgtaaa tacaaagaaa tgtattgttt 15120 tcttttttca taccttgcca cccaggtggc caatatttat tatatactta ctatagacag 15180 tcacggggat ttctttgaag gtgctaccac gaacaaactg aaaataaatg tttatattta 15240 gtaacatgaa aggtgatagt tgtgttaaca aaaccatggc accactttaa ttcttattaa 15300 agtaaaaata gtgaagctat tattacactt aatagaagtg aagtcctcat ataaatcatc 15360 ttccaattca atgctatcag gtcagagggc ataaaaatca ttggattcat tactcagaga 15420 tttaaaaatt atataataat taatccaaag ttaaatatat ttatgaaaca caattttatg 15480 tttcctgcta cttttaccct acattgaaaa agaagaaaaa tattccgttc cctttaatct 15540 gtgatgagtg acaatttttt ataagtgaat gttctttcct ttatattctg cagtgaaagt 15600 attgaatgat acaacgattt tagtcattta tgtaccattt tatttttcta aattggactg 15660 taaacttttt gaataaagac atgtccaatt taaatacata tttttcataa cactttacac 15720 aatacttggt cctgagtagc ttttaataga tatttgttga acaaaaccat gaagaaatga 15780 tgccatttct ttacaggtgg gtcagtggta cataaacaac aaagagtaat ccaagcccag 15840 tacatactta cttattaatg cgtacatttc tagcctgtta tgttaaacct gtaatatatg 15900 ttctacatat tagaaataaa tcaagtaact tttaggctag gcgcggtggc tcacgcctgt 15960 aatcctggca ctttaggagg ctgaggcggg tggatcacga ggtcaggaga tcgagaccat 16020 cctggcgaac acagtgaaac cccatctctc ctaaaaatac aaaaaaaatt agctgggtgt 16080 ggtggtgggc gcctgtagtc ccagctactc gggaggctga ggcaggagaa tggagtgaac 16140 atgggaggcg gagcttgcag tgagctgaga tcatgccact gcactacagc ctgggcgaca 16200 aagcgagact ccatctcaaa aaaaaaaaaa aaaaaagaaa taaatcaagt aacttttagt 16260 accttaattt ggatgtattt gattaattta ttaagtattt ccagcagttg atcatttcca 16320 acaggtgtgt ctatgaagag aaatattaaa tgaatattgg taagaaagca taaaataaaa 16380 atcgaggttc atattaaaaa aagacttagc ctatcaatga gttcaataat tacaaacctg 16440 ctggatagag gagtttatct acaacatgaa ttacaccatt tgttgtcatg atgtcagatt 16500 cttttgattt caattcattc accagaagtg tatcatttac ctatcaaaat aggaggcaat 16560 ttcaatgagg aaatttcatt aaggatgaat atttagataa cttaatgatg gatgaacact 16620 atcataaatt cattctagac aacttacttc tttcagaaag attttgcttc cttgtgtggt 16680 ctttaaaatg ttagtaacac caggttcaaa tccttttcca atgaaaactc ctggtgtcag 16740 gtgataaaga atgatgtttt gaagagcatt tttgtcccct aggggaaaat atatgtttat 16800 ttttattgaa taatatgact ttttgataag gactaagaaa caaaacactt attagtcttt 16860 atctttttcc atattgtact ttctcataat atcattattc tctcaagtag atatcgatgc 16920 tatttcaaaa catagttatt tcaattagcc taatcaaaat agaacccaac ttactgggag 16980 aaaaaaatct atttattttc taaattataa ctgttttctt ctttgtcccc tgattacatg 17040 gtctttaata gaaaccacat aagtgaacat ctagcccaac aacataacag ttcacagttt 17100 aagaacatta ctgagtgacc ctccacacat cccaagtgga cgaaataaaa ggaaactaaa 17160 gctaaccatg aataccagag agggggcatt tttaaggcag acatctggac aggaaagctt 17220 gagaaagaag tgagatcctg aaatgaaagg gaaaatatct ggaattcact tccacttacg 17280 tatcagaatt tctttttctt cactagtcat tcccttaaaa gcatcattgg ttggcacaaa 17340 taatgtccag tctccaggtt gtgtcaggag ctctttcaag tctgcagctt caagtaggct 17400 gaggaaggtg ctaagtggga agaatgtata tgtattttgt cagatttaga tttaggtatg 17460 ttcacctaca gtgcatgtaa tagaatagaa tccatgtatt gtggaaagca tgagagaact 17520 gctcatacat tttcatatgt ttcgaataca atttacctgt taaaagtttt atcatgaaaa 17580 atgactgaaa tatacaatac aatttttaat ttttttcatc tgatttcatc ctataaaact 17640 tgacaaggtc acacataaca aaaaagaagc atttttatca tgtaatactc tacaagatag 17700 tctttgctat atataccatc aatttctaaa aactataaga aaaatgtcaa gaagtagttt 17760 agtctgttag atttgttttc acacatgaaa tcatataacg gtgtaccaga aagtagcagc 17820 gaaaacatat atcaattttg aaaacacttg tatgaacatt ttattctaaa ttccattttc 17880 aaccacatag gagactgaat gccttttggg ataccgccta tgaaacaaaa atatgccaat 17940 agctctcatt ctctgtggag gtgccactaa taggcttacc taaagcgctt atcttgtttt 18000 aacttttcat ggagggattt ctctgctggc ttgatgatct cgcggaatat gtgaatcgca 18060 ccgtttctcc cttgcttact ccctttctcc atgcatgaat tttcaatgca gacagcctag 18120 gaaaggaaag aaaggtatgg ggtgtcattt tccttgcttg aaatttcccg tatagatgta 18180 actacataat taagtttccg gatcggccct tctgagaggt tgcctggtgt ctgaggccac 18240 gggaacagct tctttcctct gttttcaatg gctcacacaa actcacaaga cacttcttat 18300 ctagccgggt tttttattaa aagtcaagct accttatgga tcaggcaggt aattttgtca 18360 ataaattaca aaagttccat ggaatcccac ttctacattt tttataattt ctattcagat 18420 ttgaactatt tctctagacc ctcttttggc caacactatc tgtaaggttt cctcacttta 18480 gtgcttttag tgatcttcac aaatatttac tttattttct tgactgtaag accctattca 18540 tcattgtaag tcaaatcatt gacatattca tagctttttg aacgaacgtg atatatatat 18600 acacacatat atttgtatat acaaaattta aagtgcagca catttaatgc atacttaaaa 18660 atgtttggaa ttttgtagct gcagggagct gctgacatgt gccagattca gttctaggta 18720 atgcctgact tcctgtgaag tcttttagtt gtagctgtac gtgttatctg gacaaatact 18780 gaacgtatca ttagttgaac tgtaattttg ataagcaata tttctataaa ttttcctgca 18840 gcaaaatgta tgttagggct gggtgcagcg gctcatgcct gtaatcccag cacattggga 18900 ggccaaagta ggaggttcac tggaggctga aagtttgaga ccagcctggg aaatgtagca 18960 agaccctgtc tcaagaaaaa ttaaattaaa aaattaacta gggtgatgtt gtgcacctat 19020 agtcctagct actcagaaga ccgaggtggg agggtcccct ggagccaagg agtttaaggt 19080 tacagtgagc tatgattgtg ccactgcact ccagcctggg tgacagagtg aaattctgtc 19140 ccttaaaaaa aaaaagtaca ttaaaaccct tttttagagt ccagaaatct ctatgtgcca 19200 ataaaggttt atcttgaaag ccattcaaaa gatattcaga tgctgactgg ttattttaca 19260 gtataagatc accttgcata tttgattcat tataatgaaa tgttttgaaa tgaaaaacat 19320 tttagtagag acagcatagt gctaacacat tgtatgtgta gtcaatgcag aaactaatca 19380 acaccttgta aaacatttat tatttcttat tgcaaacaat catcataaag aaaaatggtg 19440 tgtaggcaga gaacagaatt accttgaaaa ttgtaaagta ctctgcaaag gaaaagttta 19500 ttttaaaaaa tttactgctt tctggaattt aaaataattg atgctctaga atagaaagtt 19560 attcataatg aaacacatgc aaaatatcta tctgagtttt gaatacatag cacttgttgt 19620 ggactttgct cacagtcttt tcacccaagc tacccagttc cctgatgctt ctatgaatat 19680 ttactattag aaccacactc ataaaattct gtgaaatatt cattgaaaca gcattatttg 19740 acatgtcatt tgacagactt tttattttgt tgtgattcac ttactgtacg atatacgaag 19800 actctgagct gtttgcctcc gatggtttcc agtatttgcc cgttgtaaag ctcattaagg 19860 ccaactttta ctttcaatat gtgattctgc agaattaatt taaggaggcg ctgatccatg 19920 ctgagagtat catctgtaaa taaattcatt aagaaagagc attattttat ttagaaaaca 19980 ttgaagtttc tcccggtaag acagaatcat ataaacagat aatccctgac attattgata 20040 tcatggattt tgcactcata taatacatga atcaaccaaa tgctaaaaac taacaattca 20100 attcaccaag tagaaactct gtgacctatt gtattaaatg acaataatac agttccaacc 20160 agttcaatca atgagtttca cctctgtaag ggctacatag ttttatagtg gtcactggca 20220 aatgctaaac cttaatggtg gccaaggctt tgtctgataa ttagatatct gttagtcaca 20280 tgaaagaact actgatgaat cctttgtaaa ttaatcttga ttactggaaa gagaatcaaa 20340 gcaaacaacc tcttaaatat gggttattgt caaaacacat gggcaggatt attacaaaga 20400 agaaagtcag gatatctagg aattcaattt ttttgattaa tagtttttat atcacaattt 20460 agcatttgga aaaacaaaaa attgtgttac ctatttttaa ttaataaatg ttgcctaaca 20520 atttaaatat gtctgtgaaa tcattttcct gagaaaggtc gaaggttgca tgaatctgaa 20580 catggtctgt gaatagcaac tactaggtga aatatttata tatactattt tacatcatga 20640 tatggaagtg tataagtctc ttcattttat ttatttataa tttgacaccc ttactgtcca 20700 aattttgaga tgcaaaacac acctatttat ttctaaatat tattatgttg gtatcaaata 20760 aagaaatcag ttttattttt ttagagatct gtcaatgcat ccttattgtg ctggaaatat 20820 tagattcaca gagaaactaa atatgctttt ttttaagttt cgtttttttt ttttttttga 20880 gacggagtct cactctgtcg cccaggctag agtgcagtgg tgccatctgc ttcctgggtt 20940 cagttcaatt ctcctgcctc agcctcccga gtagctggga ttacaggagt gcaccaccac 21000 acctggctaa tttttgtatt tttagtagag atgggttctc accatgctgg ccaggctggt 21060 ctcaaactcc tgatctcaag tgatctgcct gtcttggcct cccgaagtgc tgggattaca 21120 ggtgtgagcc accacgcctg gcctgaatag tcttaattac aaattacaaa tttcactctc 21180 tgtaggctat tatccattat aatgaaatgt ttagaaatga agaacatttt agtagagacc 21240 atgtagtgtt aacacattgt atgtgtagcc aatgcagaaa ctaatcaaca cctcctaaaa 21300 catttattgt ttcttattgc aaacaatcat cataaagaaa aaaaggtgtg taggcagaga 21360 gcaggaacaa cagtgtccag cacataccag aaaatgcatt attcacaggt gccagcaaag 21420 tgtattctcc atctggcctc agagcagatg ccaagcctaa ttgggccaca agatccgtga 21480 aggtggtttg ctgttttcca gccagctcaa taacttgttt ggctgaaaaa taaaccatca 21540 ccatcacaac aatgtcatca ttgctattat ctccatcatg aaactagtaa atcaattcct 21600 gactcttttc taatattgta agctatttac tgcaatgtca gtgtgataag acatcctcct 21660 cctccctaat aagagagttc cacttccatt ttttggtggg agttgataat cacgataaat 21720 ttcagaagga aaatattttt ctgtcttcct actacatgtt tctttaattc tctattgttc 21780 atctctcatc tttctctcta tactgtgagt tccatagctt ttccatttat ccaaagctga 21840 ccatttggtt agatctttcc ttctctttcc aagaaaaact ctggcactgt gaaaacggtt 21900 ataaatatta gatgtcagaa accctagaaa gccaaagatt catgcatgga gttcccatca 21960 ctacactgcc tatctatgga gtgctcaagt agctcactat ttattgtgtt agtgctttgc 22020 atgccattct ttatactgca cattcatttt tcatggactt actctttgag acagcataat 22080 tagtaaatta cagtaagtaa aaaaacaaaa acaaaaacaa aaaaagttgc ttaccagaat 22140 caggaattag gacctgatca atcaaatgga tcacaccatt atttgtcaca atatcctttt 22200 tgttcaccat tttgattcca tttactgtta tactgtcacc gtcacatcct atctcaattg 22260 tatttccttc cagcgtctca aagactgctc ctcccataat agactcagaa cactggagag 22320 tatttaagat gtggtacttc ataagagctg gagaacacaa taaaaacagg tagctttcag 22380 atcaagggaa ataacatttg accctgaaaa gatgtgtttc actgtggaac taagtattcc 22440 ttaaaatgta gtaaaaccta aggattcact aacagcttta aaatcctatt tatgttctaa 22500 aagttttttc ctatcaacta taaaatagaa acagctcagc ttcgtaggaa taataagagg 22560 agatcagctt caggaaatga ttggtgcagt attagaaaac gtggtaggtt aagttccagc 22620 tatcataaaa aagtaactcc tgatgtgaaa gcaagaattg ttcctttcag aggaactttg 22680 actggcacaa gggctcacac ctgtaatccc aacactttgg gaggcctagg tgagaggatt 22740 gtttgaggcc gggagttcaa gaccatgatg agaaacacag caagatccct ctctaccaaa 22800 agagaaagaa aaggaaggcc tgtgaaattc caaaataccc aagagcagta tcttgtaata 22860 gctgctcata gcagaatatt tgtatataac atgtaatgag gtcgatagag gctgaggata 22920 agacaaatta tttccggaag gcaacttcta gaaagtaacc aaataaagat gattcattga 22980 aggacctctg gagggatcta tgcctcaact acattatatc tatcctgcat cctaaaattt 23040 tctcatctta aattggttaa atgtattttg ggataggctg agtaagtgaa gtatgcaagc 23100 acaatgtaaa acctatctga caacagcaaa gaagcttgga aagccaccaa attcttatgt 23160 gtatcagtaa ttagaggccc aagagaacca tacagttctc acaactcaat atcttttggc 23220 ataaatacag aattaaaagc attgcataac gtgcatacaa tattaaaatt tgatgatcta 23280 atatttcttt ccaacacctg ctaatccttc tgaatatcta ctacttattt acttgaaagc 23340 agtatgaaag aatgtgatct tgagagtatt cttattattt aagaattata ctctgcctac 23400 tcttttaagg acttttggaa gacatagtac atctcagaat aaaaattttt ccctgccttt 23460 gcttattaaa actaatatta ttggtaagga ctagcctctt ttttattccc ttctcagaat 23520 gctgggagac tccttagaga tgaagacatt aaactacctt cggaagccac tttgtctccc 23580 atgatccttt ctaggacacc tcgtggaagt ttctcaaaag cctcattggt gggagcaaag 23640 agtgtgaagt gaccgtctct tccaagggcc tccaatatgt ccgatgtgat ggcagctgcc 23700 tgaaacacaa atgtgctttt cagagacttt cacattgtaa atccagaaaa agattgcaac 23760 acacttagcc taggctgaca tgaaggagct gattcctaca ctatagaggt ttgttgttgt 23820 taaatcttca aaatattact ttttgacaca accatgtctt ttccaacttt cttcaaattg 23880 tgtttgcaag aatgggaatt ctgcccatgt ttatgggact gtagcaatat ccagcagtac 23940 atataataac agatgaacac gttctaaatg agctaaatac acgccagtca tgtgactaac 24000 cattcttact ctatcatgtc cacagaaata ttattatttc atatgagatg gtttcttctg 24060 tgtaaaatga aaatagtagt cctttcaaaa aatatgtgtt acatttttgc cagatttaat 24120 agcattttta ttgtttttag attttgacag gagaagaaga gggatttcaa tgactcaaga 24180 caatctgctc ttggacttac tctaaaagat gaaaggtcat cttctgcttc aatgaagtct 24240 tgaattgagg taccaatttg tgtaagcaca cggtcaatga catggacaac accatttgtt 24300 gcaatctggt tcccatggat gattcgagca caattaacag tgacaaccta taattatttg 24360 gaaaaatcaa agtgctgaaa ccagagatac ccattgacca ctgagactgc aagcccattc 24420 ccagtttttc atttatacta gtaaatgtaa catacaggaa actacattgt aaatgtaaac 24480 gctgtggatg aagatttaca tgttgttata tctaaaaaag aaactgtaag agaaaaggga 24540 accagttgag aacccaagtc aagtcatact taacatatct agcaacataa ggcaaaggtg 24600 tttttttcat ttaaattatt gcttttctct tttatgcaaa tagtcataaa ctttttaatg 24660 tgggtcaatg aattaggtaa agaagtctaa tcagtcctaa aatttaagtt ttgagaggga 24720 gaaacaaata attattgtat agatataatt agttacatta caagaacttc ctaaaaattg 24780 tttcttcatt gacctctttc gtccctgaga atttggctgg ctgtggaaaa agtcctatga 24840 ccctgttggc agtttcccac aaaatctgat ccaaacacac aagtacttca gttagtacag 24900 tagctagagg gggagtaaaa gaacactcat tctttgatta ttctttttgc tactacgata 24960 aattatttca aacatatcaa ctactaaaat ttccttttct agaatacctg tctactgtca 25020 atgaactgtt catgtaattt gtcctttaca atcactcttt agtagaaatt aataaccaga 25080 ttggaaattt acatgcccta gatttggggg taaagtcata atatagcact taccttattc 25140 tcactaacat tttattattt ttgtgagcat tatataaaaa gtatagacaa aattaaagaa 25200 ggtatttttc ataagtgtac tttttactga taaaacttac cccattagga taatggttaa 25260 tgaaaagccc caaattgtta tacattgaag gaataatcat gccatttttt aagtccttgg 25320 tcaacattct cttattaatc atgtgactat gtaaagcatt cagtaattca acattcacgt 25380 tgctctccaa acctctacgg atatcctagg aaaaattgca atgatagaaa ttcaatttat 25440 tgtggaacat tagtaaaagt cttacgatca ccctatttct actctcttgc tattttctca 25500 tttcattatc agatggtcat acaaaattga cataaataac ttaaaattat attattctaa 25560 ttggttaagg gattttgtaa gttcagatac ttacttaagg atcctgaatg tgatacagta 25620 cttagaacac aatttttaaa gtgaatatgt tgatgaagag acaatcttga tataaataat 25680 aaaatgataa gaaagggaga tatgaaatta tcacatattt aaaatacttt aaatggcaaa 25740 caaaagaaaa caaaaatgac attatatttg tatgcaacac ttaagtttta acaagggttt 25800 catgtttatt ccataacaaa ttcaagaatt caactgtcct gtaccttttt atctatccaa 25860 cactatgtgt catattatgc tttactcaat gctatgggaa atataatgat aagtaaagca 25920 aaaagtcaca actgtttatc atatagcagc aggtaaaagt agacagagta agatatagga 25980 cagaggggaa aaatgctttc agggctccaa taagaaagaa cagctattcg gaagtagttt 26040 ggagatagac catgagattt aaatgaatag gaatggtgtg gtggtctttt aaatccagtg 26100 ctgagatagg gtgaatgcca agagagcaaa agttgtccag tttggttaat acacactttt 26160 atgtttctca gataatacta agaaatttag aagggtatgt gggacaataa cgtggataac 26220 tttaatgccc taagaggagt gaaataaact ggccataagg aaccactgaa gattttgtgg 26280 cattggaatt taatgattag aaccaggctt caggaaggtt gagtggtaat gtacagcaga 26340 aattagagta ttagggggat cactttagat gaaacatgag atgaggctaa cagcagtttt 26400 taagaattgg agaaagggga ggtaaggatg gcttacaaat ttcaagtctg aacattgaca 26460 ctggtactgc caattgtggg gaaaagacaa caaaaaaaac caattattta ttggggggaa 26520 agaaaattgc atatgtttta gataactttt gtttaaagat gcagatggta tatccaagga 26580 taaatgctaa gataaacaat agaaatattc tactgaggtt ccaagaagaa acaagtccaa 26640 acaacaagcg taggtttact gtttgtatgc actaaagtga tagttgaaac catgataagt 26700 gcatttaaag agcagagtca agtgctggaa gaaattctta taagttccat tctttttatt 26760 tttattttta ctttttatta ttatacttta agttttaggg tacatgtgca caacgtgaag 26820 gtttgttaca tatgtataca tgtgccatgt tggtgtgctg cacccattaa ctcgtcattt 26880 agcattaggt atatctccta atgctatccc tcccccctcc tcccacccca caacagtccc 26940 tggtgtgtga tattcccctt gctgtgtcca tgtgttctca ttgctcaatt ctttaaggca 27000 aggaagaaga tgagtcagca aaaggaactg gagaggtggt tagagatgcg gtgaaagaca 27060 accagaggag cgatttctat aatcaagcaa ttaaccacac agctagtgta gcaagataat 27120 gcctacagat atatacctac attttattat gtatatttca ctctagtaat aattatcaat 27180 tcatctccat atctagtaga aagtaggaat gtatttttat atcagtttta tagattcgga 27240 aattgagtaa taatttaagg cattgtaaat tagactgtgc acaaaagtct gaaaatcaaa 27300 tgtattttca catttcattt aactatccac atacatgtat acaaatttga caacctgaac 27360 atccatatat atacatataa ttaaacatac gtaataaaat attgctgtat aatactgctt 27420 atgataattt taaatttcag taggcttctt aacttacctt tctgttagac atgttatctg 27480 aaattacata catatcctca caaacaaaca ggaaagagga aaggagtaaa atagaatagt 27540 aagtgccctt ttagctgatt cttgattccc cttcttaaaa aaattaaagt ataagtctcc 27600 tggagattta ttctatttac ggatgtatta agatatttta cttcccttaa taactcatcc 27660 ctttaggtat tctcatatat gtacaataga aagatataaa atttctacta atatccaagt 27720 taataagtca gttaaaatga aataacaata acagcaaaaa ataaatatat tgataaaaat 27780 aatgaattac agaatccaag ttgtcccaag cctcattact cggtgcaaag taagtgaagg 27840 atccctttcc ctcgatctcc tccctcagtt ttgaggcgtc agaatagcgc tgcgttgtgg 27900 tggctcccac gatgcccaga gtgccataaa catggtcaat gggcaaaact gaaataatca 27960 agaaatgaat cagtactggg gataatattc tcaggatatt attcataatc atttaaactt 28020 tatgctgtgt ttcccaagac atttagctaa taattttagc aatacaatta tatgaataat 28080 catttttata taaaagttat cttttgagtg ctaaataata aaatgctact gaaaaacatt 28140 attttacata tcctttgtgt tgaggaaaaa aaaatttaaa ctgtcatcct ggtttaacat 28200 ttaacctatt tagatctcaa tcctgctatg tcaataataa ttcaattata attcaatatt 28260 atctgttatt taaatctatc atttttatag atttgggtcc ctaaaaatat gtaggcctgc 28320 ttgttttcat tacaatttct gggagcaaat gatttaaaat attcaatcct tccagattat 28380 ttctcccgaa cgtcagaaga aagattcatg aatgaatgtc agcctgaagg gatttatctg 28440 gtaatgtgca gtcaacttat tttttctgac cctatttatt tgaaaattag tataatttga 28500 ttaatagcat agaatcaatg gttattaaat ttgtgaatat ccttagattt ggtgacacaa 28560 ctattaagta taaaaccagg attttaaaag accctaaaaa gatggagaaa ttgagtcaaa 28620 atgaacaagg ttaaatttaa caaggttcca tgtaattcct atgcctaaat tgagaaaaac 28680 aaatcctaga gacctgactt aatagtgtat gtaaaaaaaa ctgtaatcaa ttttaattga 28740 ttctaaattc aatataagct aatgatgtaa catggttacc aatgacatta tccaaagtgc 28800 aaggtgtccc caaatcaggt acttatcttg gtattgtctt aaatgctcag acccacatgg 28860 atggacttta aatatcagtc taggtttgta ttcagaagaa agattactgg actagagact 28920 ttctgtgggt tggtgttata atggggaggg cttcaaagtc tgtgtcatat taaaagaatt 28980 ggggatggtt agccagagaa tagaagactt tattcaagaa gagaaggtag ctggaggaaa 29040 ggtgtggtga ttggcatgaa atatctgaat ggctgccatt tcaaagagga aatagatgag 29100 ctattttttt tttctctagt tggcagaagt agaggaaacc aaatttcaat ataaagaata 29160 ttataaaatc agagctgttc aactagagaa gatgaagttt tgccaagtag ttgagttcca 29220 tgttcctaga caagttcaaa gaacaggatt ttgtaaagag ttttgttcct gaagggaagc 29280 tgaactaatt taaatttgtg actaagtttc tgttgtattg cccagcatcc agtgcatgag 29340 aaatatgctc ttatatttta tcattcataa attcatgatt aacacaaaaa taggagggat 29400 atatcttgga tttaggatgg tgctgaatac acacatacac aattggcttc tccacaagcc 29460 acctcaaccc tttctttgca tataattcct tatttaattc aaaaaattga gattttacct 29520 gctgggcagc ctttcattcc ttccattctc atataaccag ggcaacattc atataacaca 29580 gtcctgtaca taggaagaaa attaatatta aaatgagaaa ctaaatagga tacattttta 29640 cataaatttg acaaaatatt tcacttattg acttgatttg ttgaggttct aaaaatcagg 29700 ttttttttcc cccctgattt tttctttttt cttttgagac ggagtctcgc tctgtcgccc 29760 aggctggagt gcagtggcgc gatctgggtt cactgcaagc tccgcctctc gggttcacgc 29820 cattctcctg cctcaacctc ccgagtagct gggactacag gcgcctacca ccacgcctgg 29880 ctaatttttt gtatttttag tagagatggg gtttcgccgt gctagccagg atggtctcaa 29940 tttcctgacc tcatgatccg cccacctggg cctcccaaag tgttgggatt acaggcatga 30000 gccactgcgc ccggccgatt ttttctatat ttctatgagt ttgatttctc actacagtct 30060 catgttacta tagaaaagtt ccataatgtt gatccagaag aacgacattt gggtcctagt 30120 tctactactt ggttgacatg tgaaccttga gcaagtcatt taatcaatag gagtccctgt 30180 ttccccaagc atttaacatg aatatagtag ctataatatc tactcacaga gtaattgtga 30240 atctcaaatg aaataatgct tttgaaatca ttttgtaaac taaaaatggc tagaaatctg 30300 ctttaatata attggaaaca taagaaaata cattgaccca ttggagtccg taacatgcta 30360 tctcattgct agataaaata atgccatatt tggtttgaat tgttggtagg attattaatt 30420 gtattatatt atatataaac tttaaaatct ttttattttt gtaaaatttg ataaaaataa 30480 tctaagtaag tttattttaa tattagagtt tagtattcaa gaaagtggca tcctgtttaa 30540 agttaacgaa gtgtgttaag ttctataggc aataattaag gtaacagacc agaaaattca 30600 agatatcacg atatacaaaa aataagttta tctaatttac tatattttga gggaaaataa 30660 taatttaaaa ttatatataa ttgcttacaa aataaaaact gattatatta atgtataatt 30720 atattattaa tattataata taatcctaat ttttattttt tcgcatttca tagaatattt 30780 tctggacttc atcatctaac ataggtagcc tattttaact caaattttac atagttactt 30840 atgtttcctt tcaaaagaaa tataaaggta catgtaccaa acaattagaa atagggggat 30900 tattacaagt aaaaaataaa tgcacatcgt tttgtaattt ttaattgata aatatcatgt 30960 caaacagatt atgacaatta tagattaatt attttgcaat tcactaatta aacatgaatc 31020 agcttattca aatgctattt cttttctggc tttttatcca gttgtcttaa ttgtattcaa 31080 gaagtatgaa tgaataaaat aatttagaca tgaaagagat cgccaagtat aagaataaaa 31140 tcttttttta gtatgataaa aatgataaaa gcaaactatc aagaagcaaa aattttaatg 31200 atataaaaga tgattttata gagttgaata aaagtaaata aatgttttca aattgaaccc 31260 tgctacacta agtaattatc taggatttgt agtctggttt ataaccttgg atcctcattc 31320 tttatttgtt aataaaaaat tcctggcatg aaatattggc ttaagaataa tagatagcta 31380 aaaatacaga caaaattaaa tgggaaatac ccacttcaag ttattctcta attttaatat 31440 agtttgaaga atagttggta ttggaaacat ataaaaggta tataggagcc ttatgcaaat 31500 cataatagag cctctaaata attttattta catgagctct tgtaaataaa tctaattatt 31560 ggatgtcaaa agattgatta acaattgctt atatattagc tttagcatat gttgtaaaca 31620 atttaaaaaa tgagatacaa atgtgcttag tccatagatt gataatactt acttgaagta 31680 aaatagtgaa tagaaaagga aatttaacaa aaaattatta ttagcaaatg ctaatatgac 31740 aagggtcagt cataatgtag agaattaatg cagtagatga gataaaattc cagcagttca 31800 ttgtaatatc atcagataat tgaacaatgt ggttatctct gagcggatat tttgaaaaga 31860 aaaaaaaagc agtttttttc agaagaacat ttatgctacc caaaactcaa tgttcccata 31920 tggtcagtag ggcaaaacaa gagtaaaaaa aatattgcta tacatagctc taaacatgag 31980 aaatttattt ttgttttcag aatagtatct aacatttcat gagatgccag ctaaaaatat 32040 cacagacatt ctctagagga agtttccaga atactatatt actagaccaa tatatatttt 32100 ggacaatatc ttgaccctag gaagcttcac gtttttcatt aggcctgctc agtttacttt 32160 tctcaaatcc ccagagcaac tgtcagctga aaggcaaaca tttctgtcat ctgatcataa 32220 agtcctgatg atatctctgg aaatttcagc agaagcaagc agatggcaga ccagtcagtc 32280 ttcctgtcaa tagtattgat ttctttggtt atttgaaatt agcatttaca tttatttcag 32340 tgcccagacg taactatgtt tttgaaaatg aatctacttt agaaaaataa gctaatacaa 32400 ttgaacaaag gagacactgt tacatttctg gttaaaaaaa aaaaaagcca ggcttcaaag 32460 tagtgatttt ttttttttta atggaaagca agaaagaatt ttggcatagc ctctgtacaa 32520 gccttgacat ctctcatata tttagatggt taaagtaaat ttatggcatt cttctctatc 32580 ttctaggaag gatgtaataa gcattctccc taacatttca gggtgaaggt cctttcttat 32640 ctagttaagt gtgcatttca aatatgcttc atggtatcca agaatataaa taacaaagag 32700 gaaaactcag agccttagag tccctactgg ggcctagctt gcagcatggc agagatcatt 32760 gtaacaactg attgcattat aattgtgtga atgactcaca agtctagcag aagtctgcac 32820 aataatagga ataatgttca ggtcaaaaga taacatcatg ttgaaactct attaagccaa 32880 tgagcaggag atggtcagca aagtcctctg gtgccctaga cttggttacc atgtggagat 32940 gcaacccagc taagcttaaa tgccttgtat acatggttct tacttagaaa taaagacaat 33000 cttgtgcatt tcaaataggc atctggtcac aacttccttt cctgtctaca tctatgcatt 33060 tgtttaaaag agtttaattt taagaacaat tgatattatg cattatggtt acttagtaat 33120 ttcacattta tcaattcatt ttattttctc agaaactcta taatatagct attaaatcca 33180 tgttttacag gtaagtctac aagaagttaa gtgattccat atttagtatc tttttttttt 33240 tttttttgag acagagtctc actctgttgc ccactcggga gtgcagtggt gccatctcgg 33300 ctcactgcaa cctccacctc ctaggttcaa gcgattctcc tgcctcagcc tcccaaatag 33360 gtgcctgcca ccacatccgg ctaatttttg tatttttttt tactagagat ggggttcacc 33420 atgttggcca ggctggtctc gaactcctgg ccacaagtga tccacctgtc tcagcccccc 33480 caaagtgctg ggattacagg tgtgagccac cactcctggc ccatgtttag gatttatacc 33540 aatattatta acttagaaat aagtttctaa taaattattc cacccgaact tagggtaact 33600 gaattttaat gctgatgtat taagcaggtt cttcctgggg tcttttgatt ctcaagggat 33660 ccttcactga gggtggactt caaattaata ggaagcagga aggagccact tgcactgttt 33720 tcttgactgg ggatgacacc taaacctttc tgattgcatt acttgcccta tttatgactg 33780 gtctccctca ttgtaaaata aagactttgg atcacaggag tggttcttga ccttaataag 33840 tccagagtgt ttattacttt tttccaccaa tatttattgg taaaataaac cagaaggcat 33900 gtctattaag taataaataa tgctttcaaa ttttaagcta atcagtgaaa catatgttaa 33960 aacataatca tcctttgggc tattgagata ttaactataa tgatgagctt ccgttatcac 34020 cttgtggacc tctggggatg gagcatcttg aacggagaat cactggatta aataaagaga 34080 taaaactcaa gtatttttta actttaaact ttgatgaaaa ctctccggta aactggaata 34140 ctttagacaa tttccaaatg actagagaca aacattaact ttttgcctca gaaactctga 34200 tattttaaat cagtttgttt ttctggccca cttttttata aaatgaggaa actaagtcac 34260 agaggttaag tgacttgcct aagataaaag agggccaaac caggagtaga aacaacatca 34320 tttactcaca cggattctat acccaatcct gagccatgtg atctgcttcc ttctggcctc 34380 catgtcacat ggattcagga agaaatctga gttctaatag taatattgga gatgcaggga 34440 gaacttcttt attcacgtat gtattccttt cttttcttta aataactctc acaattttgg 34500 tcagtatttt caagaagaat ggtgtgtaca cccaggggaa ggcatataca tcatgatgtt 34560 gtttttggaa ctgacatatt atgaaaaaaa aaagagactt acgttttctg tccacagatg 34620 gactttttat accagttctt acaagtgctg aagtatttct ttttggtgcc caaaatctgt 34680 tgaagggcac agacatttgg gctggaggat agagggaaag gaaaaaagtt aatgtcctaa 34740 taatgactag tttttcgtat ctaaagattg gttgatagaa gaaaatgttg agatgtggat 34800 ttgatatcca aagacatgat tctagccttg cacaaatcta attattgaca caatcctact 34860 gaattgttga aaaaccgaaa gtctacagga ggtggcaggg agagagagaa aaattataca 34920 tttctgagag taaaatacaa gcttttcaaa aagttaacca actaggacta ttcaaacagt 34980 atgaacgtaa ttttatttct atgtgcctta ttacttttaa tggtagataa tctactgacc 35040 ctttttaaac caagcatgtg ctcatttgga ggatggccat aacttcaggg ctctctggaa 35100 caatgagagg tcagagagca aaagagacaa ggtttattat gtacacagac actatactct 35160 gtaattttct aggtaagtaa tcacagaagt aaatgtgcta aaattaactt tgaaacaata 35220 tggttgcaca aaggagaatt tatctttttg aatggaagta acagatcaga acatcctctg 35280 tcacaatttt aaggttcccc ttcccctctt aaagggacag aagtcttttt tcactgtaag 35340 tcaaagaagc ttgtgaacat tatgaaaatt cctgtgaggc ataggaagaa gtgccaagat 35400 ccgcttaaaa aattataaat ggttggataa gttacaaaat tatgtgtaat tttaaaaatg 35460 cttagttgta gttgcattag ttctataaaa tataaattac ctttgcaaat tttacagaat 35520 tcagagttta aaagtaactt aaatgcttca aagaattcag agaactagtt acattaccca 35580 gtatttaacc ttcatatgta atttaaataa aattttctct aacatcatgt gagatatttc 35640 aatgctgttt gcatacatat gatagttcct aacaatagat tttttaattt tgaaaactca 35700 atttcagatt tttggaagaa aataaaaaca taaataaatg gaattataaa agaatgccca 35760 gctaaattgt gttaattaga ttagaattat ataacatttc ataagaaagc aattatattc 35820 aaggtattta gagagcaatt aagtcttaaa gcttaaaagt gcatagataa atcacagaat 35880 actcacattt tccttttttt cctattactt tataataatt aggaaaaaaa accctgaggc 35940 atatatgaga aactttatgc atacttgaac atctaacaag ctgaggaaaa agaaaaatgg 36000 tttataaaac caaaccactc acttaccctt ggtcccgacc cctgatacga ctatgagcca 36060 agatcttgtc ataatgattg ttggcgttta tagggttaac aataagcagc aatagtagag 36120 aaaacatggg taaaaaggga atcatcttga gtctctccgt tgcagttagt ccccgaagag 36180 aactggcagt gggctttgga gagctcagaa tttatataca tgtcagagtt gtgggaggga 36240 acactgcatc aacctgagag tct 36263 <210> 29 <211> 11043 <212> DNA <213> Human <223> KLK6 <400> 29 tcataataaa attcattctt tattgagtgc atggtggccc aggtgctatt ccatgtatgt 60 cataggtgtg aaaccttaaa tctttccaac agccactgcc ttatggagac tgtatcatcc 120 ttatcttcat cttacaggtg agaaatctgc agtgaagaaa ggtacatccc aaggggacac 180 cgacagtaag cagcggagct gggattccag acacgtggct gggcctctgc aggaagaaat 240 caaacgtgtg gaagggttgg ggagaggaga tgcctagaag ggattttcct gtattctctt 300 agtggtgggg gtaagaccga ggacccaagt cctcactcat cacgtcctcc ccagtgatgc 360 aaggatggag ctggggtaaa accagggaga atcaggaccc tcacgtcgct gcgtttatta 420 agcatcaggg tcagagctgg gcaggagagg aggggaggca aggtctaggt gagagacgtt 480 ctggaaccag ccagtggggt ggtaggtcgg gaggtagatg tcacatgtca gggtcacttg 540 gcctgaatgg ttttttggat ccagttcgtg tatctgcaga cgttggtgta gactcctggc 600 ttctcctttg atccacaggg gatgttaccc catgacacaa ggcctcggag gtggtctcca 660 cataccagcg gacccccaga atcaccctgc aggaaagagg gagaaagtca gatacagata 720 gaaacccaga gactgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtga 780 cagagagaga ggtagaaagg gacagaggta cttactgaaa gatggagaga aagactcagg 840 gacagagaga cagagagaga gacagtaaga cacacaaagg cacagagaga gaatggtaga 900 gagagaataa aggagactca aagacacaga gataggaatg ccaagatgca gaggaacata 960 gagagcaaga aagagaaaca atttaagaat ggagactgag aggtgtggag agaggcagag 1020 gtgtagagac cgatggagag agaggaggag gaagaggaga aggaggagga agaggagaag 1080 gagaggagga agaggaggag gaagaggagg aggaggaaga ggaggaggaa gaggagaagg 1140 aggaggagga ggaagaggag gaggaagagg agaaggagga ggaggaagag gaggaggaag 1200 aggagaagaa ggaggaagaa gaggaggagg aagaggagga ggaggaagag gaggaggagg 1260 aagaggagga ggagaaggaa gaggaggaga agaggaggaa aaggaggagg aggaaaaggg 1320 ggaggaggaa gaggaggagg aggaagagga gaacgaggag gaggaagagg agaaggaaga 1380 ggagaaggag gaggaggagg gggaagacga ggaggaggag ggagaggagg ggggaggagg 1440 agggggagga ggagggggag gaggatgggg agggggagga ggatggagag ggggaggagg 1500 atggggaggg ggaggagggg gaggaggaga cgataagacc caggtgggag aggtagggag 1560 ggcccaggga gagatatgcc tggcactatt ctgtccaggg acacctctcc acctcgtgtc 1620 ttgaggacag tctcgcccac ctgccctttc tttgcgtcca acttgctatg tatcgctttc 1680 cctgtctctg tccctgtttc tgcctgtgtc tccgtttctg cctgtgtctc ccccttggtt 1740 ggtctctgca catccctcag tgcattagtc attctggcat aaagaggaga gcctggatgg 1800 atgacaatgg aggaaaccca agttaaagta ttcgggaggg agtccccttt ccccagctag 1860 tgtctccctc ctccagagcc tggtcgtttc tgagcaggac tcgtgggggc tctgtttgag 1920 gaaggacagt cccctcacac catctgcttc cttactactt ctctttggtt ctttttgttt 1980 ttagacagag tctggctctg tccccaggct ggagtgcagt ggcgtgatct cagctcactg 2040 cagcctctgc ctcctgggtt taagcaattc tccagcctca gcctcccgag tagctgggac 2100 tacaggtgtg tcccaccatg cttgcgtaat ttttgttttt tggttttttt ttgagacgga 2160 atcttgctct gttgccaggc tggagtgcag tagcatgatc tcgactcact gcaacaacct 2220 ccgcctccag gttcaagtga ttctcctgcc acagcctcct gagtagctgg gactacaggc 2280 gcctgccacc acgcccagct aatttttgta tttttagtag agatgaggtt tccccatatc 2340 ggccaggctg gtctcaatct cttgacctgg ttattcaccc acctcggcct cccaaggtgc 2400 tgggattaca ggcatgagcc actgtgccca tcctaatttt tgtattttta gtagagatag 2460 ggtttcacca tgttgatcag gctggtctcg aactcctgac cccaggtgat cctcctgctt 2520 cggcctccca aggtgctggg attacaggca tgagccactg tgcccatcct aatttttgta 2580 tttttagtag agatagggtt tcaccatgtt gatcaggctg gtctcgaact cctgacccca 2640 ggtgatcctc ctgcttcggc ctcccaaggt gctgggatta caggcatgag ccactgtgcc 2700 catcctaatt tttgtatttt tagtagagat agggtttcac catgttgatc aggctggtct 2760 cgaactcctg accctaggtg atcctcctgc ttcggcctcc caaagtgccg ggattacagg 2820 catgagccgc tgctcctggc ctctctggtt cttgatcccg cggcctccat ccttgtctct 2880 gcacttcctg tctctgctgg ctgtgtcttt atatctctgc atatccctga ctgtgtctct 2940 gtgtgttgaa ctaagtctct tcttttcaag gcttgggttc tccctcagcc tgtctctatc 3000 tgtctctgta aagctctctt ttggcctgtg tctctctctt cctgtgtctg gccatgtttt 3060 tgtgacttcg tcctgtccct ggctgtgtaa gtggcagatc cgggtcacct cacctggcag 3120 gaatccttcc cgtacttctc atccccagca cacaacatgt tctgggtgat ctggccaggg 3180 taggcatgct cacactcctc acgggacacc aggtggatgt atgcacactg gatggtgtca 3240 gggaaatcac ctgttagggg agagatgggc cagactcagc ccaggccttg cactcccctc 3300 atcctcccca gtcacccccc aacccctata agtcctccat cctctattgg tccctctttt 3360 ctattggcac ccctcttcct gtttgtctct cattcttaca tctcattacc atcgtccctg 3420 cctcctaatt ggtccctctt tctatcattc ttccccccca ttggctgtct tcctcattaa 3480 tagtctcttc tccaggagtc ctcatttcct attggttttc cttttctctt aggtccctcc 3540 tccacttttc tctcttccac tggtcccacc ttcttcagta gtttcagttg acctggagga 3600 ctcttcctct gttacgccct cctctactgt acccctcctg atcagtagtc cattcttcat 3660 tggacacttc ctgcccattg attcatcttg attggtcact ctgtgaccat tggtcttttc 3720 ctaactggcc atgccctctc ccattggttc ttcctttcta ttggttcttc atccaatggt 3780 ccacctccat cattggtcct tttctaactg tccccaccct ccctcatgga tcctcccttt 3840 ctattggccc ttcctccaat ggtctacctt cctcattggt cctttcctaa ctggccctgc 3900 cctccctcat tggctctctc ttcctattgg tctgcttccc tccttggtcc ttttctaact 3960 ggcctcacca tcccccactg gctctccctt cctattagcc cttcatccaa tggtccacct 4020 ccctcattgg tccttttcta acttgccgca tcctccccca ttgtctctgc cttcccactg 4080 gcccttcatc caatggttca cctttcttat tggcccttca cacacaggcc caccttcatg 4140 gatcctgctg atctattgga cctgtttttt cctctagtga ctcctctgga ccattgatcc 4200 tttcccctta gtccctcttc catcagctat acccccattc actgtctcaa ttcacatcct 4260 tcagttggct tttgtgcttt attggtttct cttcttccat cagttccttc tccattattc 4320 cttcctgctg ttcaatgaat cctgatcagt cccctttgac ctttgacatc cttcctgatt 4380 agcatctccc cactgacctt ccctctttat tgaaccttca tcttatgttc catctctccc 4440 atgctattca cccattggtc tacattttcc attggctgtt cactcactgg cccagctccc 4500 aaattcactc tccctccccc ttgacctttc tcccattgaa accctgtccc attggtcctc 4560 accattagcc catcttccca tggcccctca ccaattttcc cactccccat cctttggcac 4620 acttccccaa gtagccagta gcctgctccc caccagcctc ccactactga ccatctgctg 4680 tcttgcccca gcccaggatg tggcagctgg tggtgttggc tgagcagtcc ctctccaggg 4740 gaaggggctg gatgagttca gagagtttgg ctgggcgtgc caggcgcaac agcatgatgt 4800 cctggtcatg gctggcggca tcatagtcag ggtggatcac agcccggaca acagaactct 4860 gctcctggga actctccctt tgccgaaggt tatgcttccc caggaagacc tgaagattcc 4920 tgggaaggaa gagggctggg tctcacctgg agcccttggg ctgcagttga ggcttcagag 4980 agggctggga agtcatgaat cgctggcctg ctcctcccac agtcttcccc agctgggtaa 5040 atggcaattc catcctttca gaataatctt gggggctatt cttcactctc tttatttcat 5100 gccctacatc caagctgtcc agaattcctt ttgcctctct gaagcatatc cagaatctgg 5160 ccacatctca cctttcccac ggctaccatc ttggtttgag ctgccttttc acttcctacc 5220 tgaactagag cagtagcctc ctcactgggc tccctgctct gtctctggtc ccccacagtc 5280 catcctccac aaagcaacca gagatatttt aacaatgtaa gttggtcctg tgcctcctct 5340 gctcagcccc tcctatgact cccatctcac tcagaatcaa agccaaagtt ctcaacgtgg 5400 cacaccaggc cttgcaagca ctgccccatc atctcacaga catcttctcc tcccactctc 5460 cccttctctc cctctgctcc agccaaacgc tggcttccct gtcttgcctt gaacacaata 5520 gtgatcttcc cacctcaggg cctttgcact gctgttccct ctgccagcaa gtctgtcctc 5580 caagtatctg catagctcac tccctcactt cctttaaatg tcgcctctca gggaagcctt 5640 ccttagttgc ccaattaaaa tacaaatacc tgttagtagg caattcctat ctccctcccc 5700 tgctttctgt tccaccagag aacctatcac aatcatccga cctgctatat atttattgtt 5760 aaatatttac tcattgtgtt atttctcctc cttgcagagc aatgctgtcc actaaatgct 5820 acgatgccat gatctcgatc tgcactgtcc agaggtggct gggggaacca caagctacag 5880 gtggctgctg agtacttgaa atgtggcttg tggattttcc atttcattaa tttcaatgta 5940 atttgctata tgtggctgat ggctaccata ttagacagtg cagctctagg atgtcaagat 6000 ggggattttt gttctattca gatatagtat ctccagtgcg ttgatcagca cctggcacag 6060 gataggtgtt tgatacatat tcctgaaaca gagagtcact cccttgctca gacatcaccc 6120 atggctcccc attgtcctaa gaataaagcc tgggctcctc cacttggcac tggagcccct 6180 gtgtgatctg gctgtagtca ctttccaacc ttatctccca gcaccttctg ccccccagtg 6240 aacgggaaat tttattttct gagaatactc aagacggttc tcacctcagg ggtgttatca 6300 cagcctttcc tctgccctga acattccttt tcccatcttc atgcctccgc ttggatttta 6360 tctcattaga aagtccttcc tgaccctcct ccatctaaag taggtacccg tattcttttc 6420 cttcataatt tgtaattata tggggttttg aagggtttgc ttcttttgtt tgtttgtttt 6480 tttgagacag ggtctcgctc tgtcacccag gctggatctg cagtggtgtt ctgtagatca 6540 cagctcactg cagctttgta ctcctgggct cgagtgatcc acccgcctcg gcctcccaaa 6600 gtgctgggat tacaggcatg agccaccacg gccagcccaa tttgctgctt ctttctttcc 6660 tttttttttt tttagacaga gtctcgctct gtggttcagg ctggagtgca gtggcgcgat 6720 ctcggctcac tgcaacctcc gcctcccacg ttcaagcaat tctcctgcct tagcctccca 6780 agttgctgga attacagaag cccaccacca cgcctggcta attttttgta ttttcagtag 6840 agacagggtt gagccatgtt ggccaagctg gtctcgaact caggtaatcc acccacctcg 6900 gcctcccaaa gtgctgggat tacaggcgtg agccaccatg cccagccctc actttgcttg 6960 tctgcacctt tctgtccttg tgctcccgag ggcagggatg acgtgtgtgt cccatccatt 7020 gctgaatctc cactgcccaa ctcgaatgtg gcacttagca ggtgctctta gtcaatgtac 7080 atcaaaggaa tgaatgatgg tggtgagagt catccaaggt ctccttgggg tcaggggaac 7140 caccccaggg attgtcactt gctatttccc tgcacctcag tttcctcatt tgcaaaatgg 7200 tgccaagagt cccttgtggt gggcattcca ggaaaggtgt gtacatggtt tcactcagca 7260 cctgattggt agttagcatc aaacaagtgg cagctgtcgt gaatctgact agtgaggatc 7320 agcgcccagg gtttttgtcc tgggccctcc agctcctcca actatgccag ctttttggat 7380 gatctcatct agtcccatgg ctttaaatac acctgtttgc tgacgatgcc ttcattttaa 7440 cctccagccc tgacctctcc tctgagctcc agagtcctcc ctggcctccc tgctgggaca 7500 tctccccggc atctccaact catcgtggct aaagcaaaat gtcagatgct cccctgccta 7560 cacccggcct gtttctcttt ccctctccca caactcagag aaagacgtgg caaaacaccc 7620 agttgttcag gacaaataca cggaagccag ccgtgcttct tcctctccct cctgttcctc 7680 gttgccagat tctgctggct cagtctcaga attccacatc ccaagatatt caacatccct 7740 ccatccccac tgcgaccgcc tgggttcaag ccaccctcct atgtcgccgg atgaaagcaa 7800 cagcccccac gtgggcctcc ctccctctct cttgcccaga ccacgttcca cgtggtagcc 7860 agggtgcttg taaaaatgta aatcaggctg ggtgtggtgg tggctcatgc ctgtaatccc 7920 agctctttgg gagggcgagg cgggcggatc acctgaggtc aggagttcga gaccagcctg 7980 gccaacatgg tgaaaccccg tctctaccaa acatacaaaa attagccagg caaggtggtg 8040 cacacctgta atctcagcta cttggggtgc tgaggcagga gaatcgctgg aacctgggag 8100 gcagaggttg cagtgagctg agatcatgcc actacactcc agcctgggtg acagagcgag 8160 actgtgtctc aaaaaacaaa caaacaacaa aaacaaaact gcccagtggc ttcctactgt 8220 gctcagaatt aaatccaaat gcccatcacg ccctgcaggt ccccaaatga tccaattccc 8280 ccattagaaa gtaagttcag gaaaacagca attttgcttg tttttttttg ttttcttttt 8340 tttattttct tttccactgc tatgcccgca gggcctggca cacattaagt actcaattaa 8400 gcaacagccg aatgcacctg gctatcagat ggcctcgtgc tgggatgggg gggatgccta 8460 tgtcacctcc tgcctgacat ctataagaca ccctcagggt tcagtcgcat ctgctgttca 8520 tttacagtgt agactcacgg ttttttgcag tgggcagctg tgaggaccca cagtggatgg 8580 ataaggaccc caccacagag caagtggccc gaggtgtaga gggcagcttg gtaggggtga 8640 gatgtcttgt cgcagggtcc gccatgcacc aacttattct gctcctctgc ccaggctgag 8700 ggagagaaga tctgagtcag agaggagttc tggagaaacc aagcgcatcc ccctcaacat 8760 gaactccagt caagattggt caggtgcagt ggcttatgcc tgtaatccca gctgaggcag 8820 gaggatcgct tgagcccagg agtttgagac cagcctcggt aacacagtga gacctcatct 8880 ccacacacac acacacacac acacacacac acacacacac aaattagcag ggtatggtgg 8940 catacgcctg tagtcccagc tacttgggag gctgaggtgg gagggtcact tgagacccaa 9000 gagttcaagt ctgcagtgaa ctatggatca tgccactaca ctccagcctg ggtgacagag 9060 tgagaccctg tctcaaaaaa aaaaagcttc tctgtatttc cactcccaaa cttaccccat 9120 tcccattaca aacccaactg tatcccctat tcccgggctc tctccaactt tccaacctac 9180 ctcctacctc ttctatgttt agatccccat ccctaaagcc aaccccaccc caaaccctca 9240 tatcttcaaa cccacctccc accaccctcc ctatctgtat tccccaccct tagcctaatc 9300 cccaacgtct tcctcatttc aaagctcccc caccccaacc ctgtgcatat ccccatcccc 9360 aataccagcc tcttctccat caacaagccc aaccctgtct gcaagcctcc cccatccaaa 9420 tgccctttcc ccacctgcag caatcagact cagcaccacc atcagcttct tcatggccgc 9480 tcctgagagg ggaagccaca tggtccatta gtcactgcct cgaccctccc cccatccctc 9540 tgtctgctcc ctctgcatcc tctccttcct tcctggcctg ctatggtctc ctgccttgac 9600 ctctgtcctt cccatctagc ctcctgattt attcttcctc agcccacatc ttccatcaga 9660 ggatcccacg aaaacagtgc caaagagaat tcagaactac gtccactggt ccagtaaccc 9720 atggtgagat tctgattaga tctttctact ttcttgggca ctgatttgcc ttcctgtcga 9780 caggagaggg ttaccctagg gggccctagc gttcttcctc tgtatgggag ttttcctcgg 9840 agcctggctc tgtgcgcaat ggccacccac cccgcccacc cggcaggttc tgtgatgtct 9900 gtgatctcac ctgctgcagg cctccgggct ccggggattc ttgagtcggg ggaaggaaca 9960 gctttgagac gaggaggcag aaagagttag aaatgcgggg agccgtgagg agagaagaca 10020 ctcagatgca gtggcagagc caagcggagg acgcaggggc cgcagagccc agggctgcag 10080 ggactgccag acacacaccc ccagctccca ggcctccctg gaagaggctg gttctgtccc 10140 cagatgcttc tggaacgtcc ttttaacccc tgtctctcag gtccctgagc caggagactg 10200 gctacaccct tttcctcctt acccaggcct cccacacaca ttcctcccgc ccccacgctc 10260 tgctcttggt gacccctgac caggcctcca gggaagggag cactggtccc tgagtgcagt 10320 gagggcctgg actcctgggt ctgagggagg aggggcttgg gggcctggac tcctgagtct 10380 gagggaggag gggctggggg cctggaccct tgcgtctgag ggaggagggg cttggggcct 10440 ggactcctgg gtctgaggga ggaggtgaga acttggactc ctgggtctga gggaggaggg 10500 gctgggggcc tggactcctg agtctgaggg aggaggtggg aacttggact cctgggtctg 10560 agggaggagg ggctaggacc taaactcctg ggtctgaggg aggaggggct ggggcctgaa 10620 tctgaggcag aggaagttct agtcggctca gtccttagac ctccgggttt tggagaaaga 10680 aagtgtctga agacaaattc cggcctctgg ggcaagcaga tggtgcccca ggcctccctg 10740 cacccccagc actctctgtg ccacccaggg acctgcaggc cctcactccg ggctctagag 10800 ccctccggca ctgggaagca gcctgcccag gttcagtgcg gttggggtga ctcacacacc 10860 tgcccgtagg tccctctgtg tgctgcctgc cgacctctgt gtccccagga gagagcgagc 10920 cagccagccg gggagacagc tacagcgtgt gtcaccacac tggcccccgc ccctgccccg 10980 ggctggggag caggcccagg cgcgatgggg aaagggccca ggaacaatcg ggctttgtcc 11040 gcc 11043 <210> 30 <211> 35634 <212> DNA <213> Human <223> MUC2 <400> 30 caacccacac cgcccctgcc agccaccatg gggctgccac tagcccgcct ggcggctgtg 60 tgcctggccc tgtctttggc agggggctcg gagctccaga caggtgagag agcagacaca 120 ggggtctggg gcctggcaga gtgtcctggg ggcagggcga ggcgggcggg caagtcgcgt 180 ctgggaggag gagctggtcc cagagtgcag cctgcgcggc tctgctgagg ctcctggccc 240 gggttggtcc ctggaagccc ccggccctgc tgactttcaa ggagctggaa ggtcggggct 300 cccctgctat tcctttgggg ttgactgccc gacgacagtg tgggtcttgg ggccagcacc 360 aggtggaaac agcaggtcag gccccagtga actgggtcat tgtccatagg ggaggaaggg 420 gtggccagga tcccaccaga aggccccatt ctcaggtggc agagaccctt gaagagttgg 480 ggcagcacag cccttgctgg ggagcggggt gcccagaatg ccctctccta catcccgctt 540 ggcacccggc cgcactcctc accaggccgg gggtagaagc cctgagaccc ctgtggtggg 600 gtgaccaagg cccagcagag ggcccgagga taggaaggaa cctttcccgg ccaggggccc 660 tgtgctgggc tcgaagctgc ttccaggtgc ttcttcaggg gccttctctc gagggtagct 720 tgggcagcct tccccctccg gggccactca cccctcattc cccgctgctc cctcagaggg 780 cagaacccga aaccacggcc acaacgtctg cagcacctgg ggcaacttcc actacaagac 840 cttcgacggg gacgtcttcc gcttccccgg cccctgcgac tacaacttcg cctccgactg 900 ccgaggctcc tacaaggaat ttgctgtgca cctgaagcgg ggtccgggcc aggctgaggc 960 ccccgccggg gtggagtcca tcctgctgac catcaaggat gacaccatct acctcacccg 1020 ccacctggct gtgcttaacg gggccgtgtg agtgtggtcg gtggcacccc tcccacatcc 1080 tagcaacggg ggctgatgtt tcccaaaggg atattccttg tagccctaga agaccccttc 1140 cgccccagca cacagctcag gagaacagcc ttgaggtttg ggttcaggtc actaattcat 1200 tcaacaaaca ctgatgagcc cccaccattc cccccatagg caaggggttt cagttatccc 1260 tttgcctgtg tgtccctgac agcccctccc ctcggagccc accaggctcc ggacagactt 1320 ggcacccctg gaggctgcat gtctctggtc ctgtgcatgg agtggccgtg tgtgccctcc 1380 ccaggctaga gttacagaag ccggtgcagg gggctgtggg acccccttcc ccatccccag 1440 ctattgctcc cctattgtct ccagaacaat gaggccctgt aagtgcgttc ccatccagcg 1500 cctgcccctc ttctgcctgg ggatttagtt tcctgcaagg cgccccagca tgggcatggg 1560 caggcgggtg gaggccctca ggcatgggca tgggcaggcg ggtgggtaga ggccctcagg 1620 cgtgagtgcg ggcgggtggg tggatagaag ccgtcaggca tgggtgcagg cgggtgggta 1680 gaggtcctca ggtgtgggca tgggcaggtg ggtgggtaga ggccgtcagg tgtgggcgcg 1740 ggtgggtggg tagaggccct caggcatggg tgcaggcggg tgggtgggta gaggccctca 1800 ggcgtgggcg cgggtgggtg gatagaggcc gtcaggcgta ggtgcgggcg ggtgggtaga 1860 ggtcctcagg tgtgggcgca ggtgggtggg tgggtagagg ccctcaggca tggcacaggt 1920 gggtgggtag aggccctcag gcatgggcgc aggcgggtgg gtgggtaggg gccctcaggc 1980 atgggtgttg gcaggtgggt gggtagaggc tttcaggcat gggcaggcag gtagaggccc 2040 ttgaggaccg aggcacagag gctggggtga gtgcctctac ctggaccagc aaggggcact 2100 ggcaggaggt ggggtagggc ccctgacgtt ctcaggggca gcctgggggg ctctgggggg 2160 tttgggaccc catgggggga tgttccacca agcagggggc ctggaagggg gctgggcagc 2220 ctggtcctcc ctcctctccc aacctggtgc cctcagggcc tctgaggggg gaccctgccc 2280 aggaccgtgc cccgaggagg gagtggagag gaggggcgtg caggcaggag gtggctctgc 2340 cggggaagcc cggccagcgg agatggacag gtgctctttg gccactgcct atgtccctcc 2400 accccagagg ccggccaagt tggtgatccc agggcaggag ctgggcctgg cagagccatc 2460 tccaccaccc caggtgccca gcttcagtcc cctctgggcg gcggggtccc gggaggacaa 2520 gctggggcgg gggggcctgg gtggtggacc caagagtgac cccgatgtgc ctccgccagg 2580 gtcagcaccc cgcactacag ccccgggctg ctcattgaga agagcgatgc ctacaccaaa 2640 gtctactccc gcgccggcct caccctcatg tggaaccggg aggatgcact catggtgctc 2700 aggggtcccc ggactcgtgg ggctggtggg ggctccgtca ggcctctggg cagaccccaa 2760 gggagggcag ggagggcagt gctctgaccc ctcaccgaga gggcatgggt ggggcagggc 2820 ctcggcagcg cagggcgtcg gtgctggact tggggggcag cagcagaagc cgacctggcc 2880 ctgacccccc caggcctcag ccttccccca aacgcactcg gcttctcagg gacctgccct 2940 gccaggccgc tccctggctg ctgaccccag ccttcctgcc ccaccttcct ctggctcaaa 3000 caagccacga gtcttggggg ttcctggcgg ctgtgggccg ggcgggaggc cagctcacct 3060 gctccctccc gcaacagctg gagctggaca ctaagttccg gaaccacacc tgtggcctct 3120 gcggggacta caacggcctg cagagctatt cagaattcct ctctgacggt gaggcccgga 3180 gggcttggag ggggcagggt aggctacggg cccccaggag ccctagctga agggccgtgc 3240 atccccaggc gtgctcttca gtcccctgga gtttgggaac atgcagaaga tcaaccagcc 3300 cgatgtggtg tgtgaggatc ccgaggagga ggtggccccc gcatcctgct ccgagcacgt 3360 gagtcccctc ggtccggggt gggggtcctg gcggagctgg cctctgaata gcatgctcac 3420 cctgcgtctg tccccagcgc gccgagtgtg agaggctgct gaccgccgag gccttcgcgg 3480 actgtcagga cctggtgccg ctggagccgt atctgcgcgc ctgccagcag gaccgctgcc 3540 ggtgcccggg cggtgacacc tgcgtctgca gcaccgtggc cgagttctcc cgccagtgct 3600 cccacgccgg cggccggccc gggaactgga ggaccgccac gctctgccgt aagccccggc 3660 gccttgtggg caggggaccc cagggagacc ccacgctggt gctttcccca agcccgggtg 3720 ggagctgtgt ctgtgccggg caccttgagc tggggggaca ctcaccgcac cgggcacctt 3780 gagctggggg aacactaacc gtgccgggca ccgggagctg gggggacact caccgtgccg 3840 ggcaccttga gctgggggga cactcaccgt gccgggcacc gggagctggg gggacactca 3900 ccacgggcac cgagagctgg ggggacactc accgtgccgg gcaccgggag ctggggggac 3960 actcaccgtg acgggcaccg ggagctgggg ggacactcac cgtgacgggc accgggagct 4020 ggggggacac tcaccgtgcc gggcaccggg agctgggggg acactcacca cgggcaccgg 4080 gagctggggg gacactcacc gtgccgggca ccttgagctg gggggacact caccgtgccg 4140 ggcaccggga gctgggggga cactcaccgt gccgggcacc gggagctggg gggacactca 4200 ccgcgccggg caccgggagc tggggggaca ctcaccgtgc cgggcaccgg gagctggggg 4260 gacactcacc acgggcaccg agagctgggg ggacactcac cgcgccgggc accgggagct 4320 ggggggacac tcactgtgac gggcaccggg agctgggggg acactcaccg tgccgggcac 4380 cgggagctgg ggggacactc accacgggca ctgggagctg gggggacact cactgagggc 4440 accgggagct ggggggacac tcactgtgac gggcaccgag agctgggggg acactcactg 4500 tgacgggcac cgggagctgg ggggacactc actgtgacgg gcaccgggag ctggggggac 4560 actcaccgtg ccgggcaccg ggagctgggg ggacactcac tgagggcacc gggagctggg 4620 gggacactca ccgtgccggg caccgggagc tggggggaca ctcaccacgg gcaccgggag 4680 ctggggggac actcaccgtg ccgggcaccg ggagctgggg ggacactcac cgtgccgggc 4740 accgggagct ggggggacac tcactgaggg caccgggagc tggggggaca ctcactgtga 4800 cgggcaccga gagctggggg gacactcact gtgacgggca ccgggagctg gggggacact 4860 cactgtgacg ggcaccggga gctgggggga cactcaccgt gccgggcacc gggagctggg 4920 gggacactca ctgagggcac cgggagctgg ggggacactc accgcgccgg gcaccgggag 4980 ctggggggac actcactgag ggcaccgaga gctgggggga cactcactgt gacgggcacc 5040 gggagctggg gggacactca ccgcgccggg caccgggagc tggggggaca ctcaccgtga 5100 cgggcaccga gagctggggg gacactcact gtgacgggca ccttgagctg gggggacact 5160 caccacgggc actgggagct ggggggacac tcaccgcgcc gggcaccggg agctgggggg 5220 acactcactg agggcaccgg gagctggggg gacactcacc gtgccgggca ccgggagctg 5280 gggggacact cactgagggc accgggagct ggggggacac tcactgaggg caccgggagc 5340 tggggggaca ctcactgagg gcaccaagag ctggggggac actcaccacg ggcaccgaga 5400 gctgggggga cactcaccgt gacgggcacc gggagctggg gggacactca ccacgggcac 5460 cgggagctgg ggggacactc accgtgacgg gcaccgggag ctggggggac actcactgag 5520 ggcaccggga gctgggggga cactcaccac gggcaccggg agctgggggg acactcaccg 5580 cgccgggcac cgggagctgg ggggacactc accacgggca ctgggagctg gggggacact 5640 caccacgggc actgggagct ggggggacac tcaccacggg caccgggagc tggggggaca 5700 ctcaccgtga cgggcaccgg gagctggggg gacactcacc acgggcaccg ggagctgggg 5760 ggacactcac cacgggcacc gggagctggg gggacactca ccacgggcac cgggagctgg 5820 ggggacactc accgcgggca ctgggagctg gggggacact caccacgggc actgggagct 5880 ggggggacac tcaccacggg caccgggagc tggggggaca ctcaccgtga cgggcaccgg 5940 gagctggggg gacactcacc acgggcaccg ggagctgggg ggacactcac cacgggcacc 6000 gggagctggg gggacactca ccacgggcac cgggagctgg ggggacactc accgtgccgg 6060 gcaccgggag ctggggggac actcactgag ggcaccggga gctgggggga cactcaccac 6120 gggcaccgag agctgggggg acactcactg tgccgggcac cgggagctgg ggggacactc 6180 accacgggca ccgggagctg gggggacact caccgtgacg ggcaccggga gctgggggga 6240 cactcaccac gggcaccggg agctgggggg acactcaccg tgccgggcac cgggagctgg 6300 ggggacactc actgagggca ccgggagctg gggggacact caccacgggc accgagagct 6360 ggggggacac tcactgtgcc gggcaccggg agctgggggg acactcacca cgggcaccgg 6420 gagctggggg gacactcacc gtgacgggca ccgggagctg gggggacact cactgagggc 6480 accgggagct ggggggacac tcaccacggg caccgggagc tggggggaca ctcaccacgg 6540 gcaccgggag ctggggggac actcaccgtg ccgggcaccg ggagctgggg ggacactcac 6600 cacgggcacc gggagctggg gggacactca ccacgggcac cgggagctgg ggggacactc 6660 accgcgccgg gcaccgggag ctggggggac actcaccgtg ggctgagagc ccttctcggt 6720 gcacttcggg gtggagcggc tgctgtgccc cagcctcacc ctcactgcgt ggcctctgcg 6780 gttccagcca agacctgccc cgggaacctg gtgtacctgg agagcggctc gccctgcatg 6840 gacacctgct cacacctgga ggtgagcagc ctgtgcgagg agcaccgcat ggacggctgt 6900 ttctgcccag aaggtgcgtg tggaggatgg ccccgccctg gcactgccca ccagatgaga 6960 ggcagccctg gcctggggtt ctcgcctgcg ctgaggggac ggctccgctg ggtggtgggg 7020 gcagcggcgg cacagaagtg cctctccctc cacccgatac cgggggagaa ggggcctcgg 7080 tgtgaggccc ttcccaaagg gtggcttcag ggaggccggg aagggggctg ccttcctggt 7140 tatcaccctg gggacagacc tcctcctgcc cggcccctgg cctggtgcct gaggcctttg 7200 ggagcagctc gattgtcagg ggcaggaagg tggcctggag gctggacccc catggccaga 7260 ccccaaccca gggaccaggt ggggaccgca ggcgtcagca caggggacca gtggtgcctg 7320 cgggtgggag gcctggctgg cagcccctcg gtggggattc tggctctttc tgagccagcc 7380 ggggtgacat cgcctccctg gctgtcccag gcaccgtata tgacgacatc ggggacagtg 7440 gctgcgttcc tgtgagccag tgccactgca ggctgcacgg acacctgtac acaccgggcc 7500 aggagatcac caatgactgc gagcagtggt gagtcccggg gccagggctg ggcacagcag 7560 aggctggggc ggctgagccc tgaccctgtg ccccgctgcc caacagtgtc tgtaacgctg 7620 gccgctgggt gtgcaaagac ctgccctgcc ccggcacctg tgccctggaa ggcggctccc 7680 acatcaccac cttcgatggg aagacgtaca ccttccacgg ggactgctac tatgtcctgg 7740 ccaaggtagg ctgcccaggg tctggggcat ggggcagagc tggggctggc atccaggccc 7800 ttggctgtcc cggggtgggt gggctggctg tccctgaagc agagggtgcc tgtgggctgt 7860 cctggggcag gtgaccatgc ttctgctctc tggctggaga ataagaagca ggccttcctt 7920 tctaagccac tgccgggtcc tagggtgcag ggtgctgccc gtcccggccc tcagcagctg 7980 cactgcctct tgccccatca cagggtgacc acaacgattc ctacgctctc ctgggcgagc 8040 tggccccctg tggctccaca gacaagcaga cctgcctgaa gacggtggtg ctgctggctg 8100 acaagaagaa gaatgtgagt ggtcctgccc cctccttctg gagccccagg tcccccgagg 8160 ggggcccttc tcagccctga gcaacctcgg ccttccctgc aggtggtggt cttcaagtcc 8220 gatggcagtg tactgctcaa cgagctgcag gtgaacctgc cccacgtgac cggtgagttg 8280 cgccccaggg aggggcccgg gcccttcgag ctccactggg cctgcagtga ttcggacagt 8340 ccagccacct cggacccagg aggctgggtg ggaaggttcc acggggggag ggtccctgcg 8400 gcacccagca ggctccgtcc tgggtcctct gctggagggg gtggtgggag ggtgacaccc 8460 tcccgctgct cacctgggcc aggcaggtcc cgggagcccc gcccctcgcc atgcccctta 8520 ccgtgtccct catcgtgccc ctgcccacag cgagcttctc tgtcttccgc ccgtcttcct 8580 accacatcat ggtgagcatg gccattggcg tccggctgca ggtgcagctg gccccagtca 8640 tgcaactctt tgtgacactg gaccaggcct cccaggggca ggtgcagggt aagtggcccc 8700 accggggttg ccccaacaaa ggcccacagg ggggcctgct agccccagac tcttcccaac 8760 cctgtcctgg cccctcaggc ctctgcggga acttcaacgg cctggaaggt gacgacttca 8820 agacggccag cgggctggtg gaggccacgg gggccggctt tgccaacacc tggaaggcac 8880 agtcaacctg ccatgacaag ctggactggt tggacgatcc ctgctccctg aacatcgaga 8940 gcggtgaggc tcggcaacac gggcgccccc acctagcgtg cctagggtac ccggcccatg 9000 gcctggaagg gcagacgggg ctcccagcag gaagcatggg tggtgagggg cagaagtgag 9060 gtggctctcc tccaggggca gcccggcccc tgctgcttcc tgctgtggct agtttatggc 9120 ggccatggtg gcagcctgcc aggtgacctg gaagagggcc tgggctggtc cctacctgcc 9180 ccgtcatgtc caggatgctg ggcccttggg ggtgagagac gggaggtggt gggtgccctg 9240 caggggtttc tatctagcca ggagctgcct ggaaatttga ctcacgggga ggaaggggcc 9300 tgggcatcgg tgcacagagg gaaccatatc tggggcctag gcagccaggc agcagggccc 9360 aggggatctc acgggggtcc cgggccccgc tgaagttccg atcccccact ccccagccaa 9420 ctacgccgag cactggtgct ccctcctgaa gaagacagag accccctttg gcaggtgcca 9480 ctcggctgtg gaccctgctg agtattacaa ggtgggtggg acccacaccc ccaggccccc 9540 atgccatcaa ggtggactca gggcaccccc agccccccat gccacccgtg aggtggactc 9600 agagcacccg gttgggccca ctggttgctg tgtgtgcgtg tgagcttgcg tctgtgagcg 9660 ccaggccaca ctctgcctcc ctgcctcact gcccgtccac cttgctctgt cgcccagagg 9720 tgcaaatatg acacgtgtaa ctgtcagaac aatgaggact gcctgtgcgc cgccctgtcc 9780 tcctacgcgc gcgcctgcac cgccaagggc gtcatgctgt ggggctggcg ggagcatgtc 9840 tgcagtgagt gccgtccccg tgggctgcat cctggggatg gggtccgggc tttgagctcc 9900 tgggacgggg ctgggggccc tgagcacggg tggtccaggg agaggggttg gccccctgca 9960 gccacggacc aggctccagc ttcgtcggcc ggtggtagca ggaaaccagc aactcctata 10020 gcaaggggcg gccacgtagc aggggcagaa cctggggtgg gcctggagct gtggcggccg 10080 agtgtgggag tgggtcccag agtgtgcact ccctggcccc ctggccaccc tggggatggg 10140 agctgggcgt ctggctcttc ccgtccctca caccaccccg tggtcctctg cagacaagga 10200 tgtgggctcc tgccccaact cgcaggtctt cctgtacaac ctgaccacct gccagcagac 10260 ctgccgctcc ctctccgagg ccgacagcca ctgtctcgag ggctttgcgc ctgtggacgg 10320 ctgcggctgc cctgaccaca ccttcctgga cgagaagggc cgctgcgtac ccctggccaa 10380 gtgctcctgt taccaccgcg gtctctacct ggaggcgggg gacgtggtcg tcaggcagga 10440 agaacgatgg tgggtacctg ctcgggggtc aggtgtggcg tgggggcggg ggaactcctt 10500 ctgaacctgc cccaagcgga gacctgggag tctctacctg gggaagctga gacacccaag 10560 gctgaggggt gcctggggtg gggggcgctg agaggcatca ggctcacatc tgcggggaag 10620 ctgctggctg tctgtggccg tcctgcatgg gccccgctca tccctggcct tttccacagt 10680 gtgtgccggg atgggcggct gcactgtagg cagatccggc tgatcggcca gagtaagtgg 10740 cactgccccg gccacccctc cccagccacc cctccctgcc tgccctggcc accctccccg 10800 gccacccctc ccgggcctgc ctgagaccct cagcttcagc tggagctgag gtggcccctc 10860 cgtcccacag gctgcacggc cccaaagatc cacatggact gcagcaacct gactgcactg 10920 gccacctcga agccccgagc cctcagctgc cagacgctgg ccgccggcta tgtgcgtgtt 10980 gggggcgctg ctgtgggcgg gcagggattc ctggctggct gagcctggct cttgtgctgt 11040 gcccccgcta gggtctgggt gccgagtcct gaggacgcag gccctgttga tgctgtccct 11100 ggccctggga gggaagtggc agcctgtgag ccactggggc acaggggcca gtgtagggcc 11160 cttggccggc agccctcacc agtctcactg ccctgtggcg ggcccaaggg gagggaagcc 11220 tgagcccagg ccagggggag tggtgggagg tctgggacat gacagagact gcatggtcag 11280 gcctttcctg gttgcacatc caatcctgac cccagggagg gctgcagcct cacctgtcca 11340 cccctgaacc ccactctctg gctgtcccca gtaccacaca gagtgtgtca gtggctgtgt 11400 gtgccccgac gggctgatgg atgacggccg gggtggctgc gtggtggaga aggaatgccc 11460 ttgcgtccat aacaacgacc tgtattcttc cggcgccaag atcaaggtgg actgcaatac 11520 ctggtaagct ggcccggcct gtcctggctg cctcccaggc cccacgtgct ccgcaggggt 11580 ggccactgga gagcggtcca aggggcaagt gcctctcctg ggggttccgc ctgggtcttg 11640 cgagatcctg tggtggcccc tgtcccacgg gcagggtggt ctctcatgtc aaccgctggt 11700 cttgaagcca tgggggaagg gacatttgga gccacttttg gggcctgcag gtgtcctgtg 11760 tgggaggcac agggagctgt ctgcacggtg cccagggtct cctccagcca cccatgagca 11820 ggtcctgggt cccttcaggc tcctctcctg tcctcctcag cacctgcaag agaggacgct 11880 gggtgtgcac ccaggctgtg tgccatggca cctgctccat ttacgggagt ggccactaca 11940 tcacctttga cgggaagtac tacgactttg acggacactg ctcctacgtg gctgttcagg 12000 tgtggtcacg ggcactgcct ggtcgggctg cttatggtca gggaccctct gcctgcccca 12060 agtgcagtgc ttagctcccc gagaaaccct gagacttggg aaggccggcc tttcctcagc 12120 cccagacccg cacctgcacc cgcaggagga ttcgttcttc tagccagggc tgggtagggg 12180 tggtaaaacc cctctgtact gcccagttct gtggttctcc tctgggtcct cctccgggtc 12240 ctcctccggg tcctcatctg ggtcctccct cctctggcct cctctgggtc ctccctcctc 12300 tgggtcctcc tctgggtcct ccctcctctg gcctcctctg ggtcctccct cctctgggtc 12360 ctccctcctc tgggtcctcc tccaggtcct cctctgggtc ctccctcctc tgggtcctcc 12420 ctcctctggg tcctcctcca ggtcctcctc tgggtcctcc ctcctctggg tcctcctctg 12480 ggtcctcctc tgagtcctcc ctcctctggg tcctcctcta ggtcctcctc tgtggtcctc 12540 atttgggtcc tcctctgggt cctcctctgg gtccttctct gggtgcacaa ggtgggtgca 12600 ccagccatgg ggactgaggg cacctgtttg gggagctgag taaaggccag ggctaggccg 12660 ctgcccgcgc ggctctccag atccaaatcc cacagccctt tgaggcaccg tgatccccag 12720 ggacagggga caggcctgca gcagggtcag gtccttggat gggccaggcc agggcctggt 12780 ttgtctgctc agtggctgtg accctgccaa ctggggcggg tgtgccccgg gacacctggg 12840 gtccagctgt cctggctgac cttgccctcc tggcccccag gactactgcg gccagaactc 12900 ctcactgggc tcattcagca tcatcaccga gaacgtcccc tgtggcacta cgggcgtcac 12960 ctgctccaag gccatcaaga tcttcatggg ggtgagtgct gctggccctg gggacgcgtg 13020 agccctgcgg gaccctcaga ccagccagtg actgggcctc tcctccgggc agaggacgga 13080 gctgaagttg gaagacaagc accgtgtggt gatccagcgt gatgagggtc accacgtggc 13140 ctacaccacg cgggaggtgg gccagtacct ggtggtggag tccagcacgg gcatcatcgt 13200 catctgggac aagaggacca ccgtgttcat caagctggct ccctcctaca aggtgggctg 13260 cctccctgcc tgccctgccc cctcctggcc agccccccac cccctgccct ggtgtttgca 13320 ggacaagccc ctgtcctccc tccagcccct ttttggagcc cctgtgatgc ttgtctcttg 13380 cagggcaccg tgtgtggcct gtgtgggaac tttgaccacc gctccaacaa cgacttcacc 13440 acgcgggacc acatggtggt gagcagcgag ctggacttcg ggaacagctg gaaggaggcc 13500 cccacctgcc cagatgtgag caccaacccc gagccctgca gcctgaaccc gcaccgccgc 13560 tcctgggccg agaagcagtg cagcatcctc aaaagcagcg tgttcagcat ctgccacagc 13620 aaggtgggct ggccgggcca tggtggggca agtaggcaga ggagggctgt aggtgggctg 13680 tgactgtggg ctggggccat gggcggggcc gactgtaggc agagcagggc tgtagggggc 13740 ctgtgactat aggccggggc atggcggggc taactaggca gagcagggct gtaggtgggc 13800 tacagctgtg ggcggggcca tgggcggggc cgactaagca gagcagggct gtaggtgggc 13860 tatagctgtg ggcggggcca cgggcggggc cgactgtagg cagagcaggg ctgtaggtgg 13920 actatagctg tgggcggggc catgggcggg gccgactgta ggcagagcag ggctgtaggt 13980 gggctgtggc tgtgggcggg gccgactagg cagagcgggg ctatgggctg actgtggacg 14040 tggtgagggt gccgtagagc atgctaatga ccagggcgtg gtcatagcag ggtagggtct 14100 tgggtgctcc tggggctggg gggcttctcc acatgctccc cacaccttca ggagtcgccc 14160 tgctgcgtca cgcaccacac ggcgcttgtc ctccagcttt ggctctggcc gctgcctcct 14220 ttggtcacat gaccgtataa tcggcctccc ctctgagacc ctgggctgga cccccggcct 14280 ccctctgcct ccccaggctc agatattcac ccggagggag aaaggacatg tgtcccccat 14340 gcccacacat ccccagctac aggcagctgg ggaggacggg ttctaggatg gccatgttac 14400 agctgaggat gcagaggggt tgggtgatgg gtctgcacag ccacggcggg acaggtgtct 14460 ctggaccctc tccccaaggt tggccctgcc ggggccctgg ctggctggtg ctgggtaatg 14520 tgccctgtcc caggagcagg gccggcctca gggtcctgag ctccagggca ctggggaagt 14580 cctggctcca tgagggcagc acgggcccag gacagaccag ggtgttctcc ccaggtggac 14640 cccaagccct tctacgaggc ctgtgtgcac gactcgtgct cctgtgacac gggtggggac 14700 tgtgagtgct tctgctctgc cgtggcctcc tacgcccagg agtgtaccaa agagggggcc 14760 tgcgtgttct ggaggacgcc ggacctgtgc cgtaagagcc tgcccgaact gcactcaggg 14820 ccgggacggg ggctgggagg tgctgtattg cgggccgggg tgacactcct tgtccatcca 14880 ggtgatgggt gtgcatcacc caccctttcc ccgacttctc cagtgtcctt ctttggggcc 14940 ctgtgggacc cgggttggca gagcaagctt gatgcgtctg cgtcccagcc cccgacccca 15000 gattcgccct caccccggcc caggcctgag ccctcctgcg tctgaccctg gccctgtctc 15060 ccccaagcca tattctgcga ctactacaac cctccgcatg agtgtgagtg gcactatgag 15120 ccatgtggga accggagctt cgagacctgc aggaccatca atggcatcca ctccaacatc 15180 tccgtgtcct acctggaggg tgagcagggt ggggcgggct tcagcggggg tgatggccga 15240 ggggcctgga ggctgagtgg ggcagccctc gggagaggca acagtccact ggcctggagg 15300 gtgagccagg cggccctcgg gggaggctac ggccgacggg cctggcactg tggggctgaa 15360 ggctgatgtc tggagaccca tggggacacc cggagggagg cctgaccctc agggtaccca 15420 cagcccaggg cagccaggct ccccttgctg caggatcagg agggaagcag gctatcgtgg 15480 aaactgggag tggcaggggt gggaggtgct gaggttcgtg cagagcaggg cgggttgggg 15540 agcatttcag gcacaggtca ggggaggccc ctgccgggtg ctggtgtctg agctgagaac 15600 cagtgacgtg aaggagggac tggtgggaag tttgggagga gtatcccgcc atgggagagg 15660 aacatgggtc ttgggactca gggctgctcg gggggcccga tgagactggg cagggctcct 15720 cagcaggcag cgttcagggc tcagtggggt ggggagatcc aggccctgcc tttccaatcc 15780 ccggccttcc cagaggggca tcctgcagag aagggcctgc cagggtaggg acggtgggtg 15840 gggtgtggtg gactgcggtg gtcccaaccc tatgccctgt gtccaccagg ctgctacccc 15900 cggtgcccca aggacaggcc catctatgag gaggatctga agaagtgtgt cactgcagac 15960 aagtgtggct gctatgtcga ggacacccac tacccacctg gagcatcggt tcccaccgag 16020 gagacctgca agtcctggta cctaagccca cgtggcaggg ggcctggggg agctgcacat 16080 atgggcacat gagtacacac acacgtgtga gcacacagtg tacacagtac acagacacac 16140 aaccgttcca catgggtgca catgcacaca aacgcacaca gcataccacg tgcatacaca 16200 cggtcacatg catgcatggt gcacacatgc acacatgaat ggatgccaac atgcaggcac 16260 acacagtcac acatgcacac agcgcacaca tggacacatg cctagacgca gatacccagg 16320 catacactca cggttacaca ctcacgcaca tatgcatgga tgcagacacg caggcacaca 16380 cggtcatata gtcatacacc acatgcacac atgcacagac acccaggcac acacagttac 16440 acagtcacac atgcacacat gcatggacgc agacacgcag gtgcacacac acatgcacag 16500 tgcacacatg tacacatgcc tagacacaga tacccaggca cacacagtca cacatgcatg 16560 gacacagagt cacatgtgta cacatacaca cgtgtggaca gacataggca cagtcacgtg 16620 cacacatgca ctcacactca gtcacacatg aacatgtgct cacatgcatg gacactgaca 16680 cgcaaggaca cacagtcaca catgcacaca tgcatagaca cagacaccca ggcacacaca 16740 gttacacagt cacacatgca tggatgcaga cacgcagtca cacagtcaca catgcacaca 16800 ctgcacacat gtacacatgc ctagacacag atatgcaggc acacacacat agtcaaacat 16860 gcacacatgc atggacacaa agtcacacgt gcacacatgc acacatgcat ggacagacac 16920 aggcacacac agtcacgtgc acagatgcac tcacagtcac acatgaacac atgctcacat 16980 gcacagacac tgacacgcag gcacacacag tcacacatgt acacgtgcct agacacagat 17040 acccagacac acacaattac acagtcgcac agtcacacat gcatggatgc agacacacag 17100 gtacacaagg tcacacagtc atataatgca cacatgcaca catgcataga tacagacacc 17160 caggtacaca ctcacggtga cacagtcaca catgcacaca tgcatggagg cagacacaca 17220 agcacacaca gtcacacagt cacacatgca cacaggagcc aggctacaga ggtaccagtc 17280 cctcactgcg gcggggggtc ttctgttctc atcccatcct ctgggtctgg ctttttcctt 17340 cctctcctcg cccctgctct gttcccacag ttacaaccca gtggggggct cttccggagc 17400 tggctttggg gcagtgcctg ggggctttgg gctcggtact agccacatgg ggaagctggg 17460 ggtctgagca gcgtgggcgc gttgtcagtg gagtgggact tgtagccatg tgcttgcttt 17520 gcagcgtgtg taccaactcc tcccaagtcg tctgcaggcc ggaggaaggt aagctgccct 17580 ctgctgccag ccctgcggtg gccgggccca tcctggggaa gcctgtgggg ccttggatcg 17640 gtggggggtg ctggtctcct cctgggctct gcccctttgg tcccccccca gctcagaccc 17700 acctccgatg tgtatcagcc ctggggggct gctgtgaccc attttgtttc ttctggggtg 17760 tcggtgtcct gtggggaatt tccgtcaccc tctcccgtga tccagcttct gcgttctgat 17820 gagattccct ttattcaaag agaggggctc tgggacgggt gcagtctcac tggagcattt 17880 cttagctgct tgtgggggct cgggcacacc tggccttctt cctatcttgc tcctgatgag 17940 gtgattcttg gcctcaccct cacccccagg aaagattctt aaccagaccc aggatggcgc 18000 cttctgctac tgggagatct gtggccccaa cgggacggtg gagaagcact tcaacatctg 18060 ttccattacg acacgcccgt ccaccctgac caccttcacc accatcaccc tccccaccac 18120 ccccaccacc ttcaccacta ccaccaccac caccaccccg acctccagca caggtaaggc 18180 cccctggttc cctccatgct tcctcgggct ctcaccttcc cctgcatcca gcatccagca 18240 cagagggctc tttcgggggc aggccccggc ctggtgcagc caggctgtga cccctgcaca 18300 ccagctgcag agtgaggtga cagtggcatt cctctgcact gaggtgtgag ggggcctgcc 18360 ctggctcccc tggcctggtg cattgagata gtagcatcct gaccacatcc ccaagcccag 18420 accacagtgg aggatcacct ggggagattt ctgaaaacca gcaggaaact atccctaagg 18480 gttagagaaa ttttcttatg ttcccctgcg tttgttctgg ttgaaatcct agctaccact 18540 gaacaagcca ccaggggtat gatagccaca gaaaaaagaa acttttttta aaaaaggcaa 18600 gattttaaaa gatcttgaac tatataatga tatcctcttt tcttcctgct ttattgcagt 18660 tttatcaaca actccgagta agtgacggtg atgatattca tgatgacaag cagggtggga 18720 ggagcgaagt cttataaaat cacctgcagg atgcttcctt cagggcccag atgtgaggct 18780 ggcggggctg gactcctctg cttatggacc aaagatggat gtattttggc cacttcattc 18840 atggtttgct gaggccaggg gctaaagtga gacctgattg gctgtcggtg acaatattgc 18900 tggttaagag tggagacaaa gccccttccg tcacacttcc ttactggaat gggaagctct 18960 cttgttattg attctttgaa aaaaaagtat tgaaaatagc tgaggaaagg gtccatcaca 19020 cccaggtgtg gccctgggtg gccccgtctc tttgggctca ggttttcagt tgcaaaatga 19080 ggatggaagt ggtgtccagc cctgagctct ctggccctgc actctggttt tttggcaatg 19140 acagggaaaa gagagattgc agctggggga tggtcatgga ggtccctggg tcctctgaat 19200 cctggtggct tcctggaggt gcctctcccc aggtgtgaga gacaagaact tggttttgct 19260 tccctagagc tgtgctgcct ctggtctgac tggatcaatg aggaccaccc cagcagtggc 19320 agcgacgacg gtgaccgaga aacatttgat ggggtctgcg gggcccctga ggacatcgag 19380 tgcaggtcgg tcaaggatcc ccacctcagc ttggagcagc taggccagaa ggtgcagtgt 19440 gatgtctctg ttgggttcat ttgcaagaat gaagaccagt ttggaaatgg accatttgga 19500 ctgtgttacg actacaagat acgtgtcaat tgttgctggc ccatggataa gtgtatcacc 19560 actcccagcc ctccaactac cactcccagc cctccaccaa ccagcacgac cacccttcca 19620 ccaaccacca cccccagccc tccaaccacc accacaacca cccctccacc aaccaccacc 19680 cccagccctc caataaccac cacgaccacc cctccaccaa ccaccactcc cagccctcca 19740 ataagcacca caaccacccc tccaccaacc accactccca gccctccaac caccactccc 19800 agccctccaa ccaccactcc cagccctcca acaaccacca caaccacccc tccaccaacc 19860 accactccca gccctccaac gactacgccc atcactccac cagccagcac taccaccctt 19920 ccaccaacca ccactcccag ccctccaaca accaccacaa ccacccctcc accaaccacc 19980 actcccagtc ctccaacgac tacgcccatc actccaccaa ccagcactac tacccttcca 20040 ccaaccacca ctcccagccc tccaccaacc accacaacca cccctccacc aaccaccact 20100 cccagccctc caacaaccac cactcccagt cctccaacaa tcaccacaac cacccctcca 20160 ccaaccacca ctcccagccc tccaacaacc accacgacca cccttccacc aaccaccact 20220 tccagccctc taacaactac tcctctacct ccatcaataa ctcctcctac attttcacca 20280 ttctcaacga caacccctac taccccatgc gtgcctctct gcaattggac tggctggctg 20340 gattctggaa aacccaactt tcacaaacca ggtggagaca cagaattgat tggagacgtc 20400 tgtggaccag gctgggcagc taacatctct tgcagagcca ccatgtatcc tgatgttccc 20460 attggacagc ttggacaaac agtggtgtgt gatgtctctg tggggctgat atgcaaaaat 20520 gaagaccaaa agccaggtgg ggtcatccct atggccttct gcctcaacta cgagatcaac 20580 gttcagtgct gtgagtgtgt cacccaaccc accaccatga caaccaccac cacagagaac 20640 ccaactccga caccaatcac caccaccact acggtgaccc caaccccaac acccaccagc 20700 acacagagta caacaccaac acccatcacc accaccaata cggtaacccc aaccccaacc 20760 cccactggca cacagacccc aaccccgaca cccatcacca ccaccaccac tatggtgacc 20820 ccaacaccaa caatcaccag cacacagacc ccaaccccga cacccatcac caccactacg 20880 gtgaccccaa ccccaacacc caccagcaca cagagaacaa caccgacatc catcaccacc 20940 accaccacgg tgaccccaac cccaacaccc accggcacac agaccccaac cacgacaccc 21000 atcaccacca ccaccacggt gaccccaacc ccaacaccca ccggcacaca gaccccaaca 21060 acgacaccca tcaccaccac caccatggtg accccaaccc caacacccac tggaacacag 21120 acccaaaccc caacacccat caccaccacc actacggtga ccccaacccc tacacccacc 21180 ggcacacaga ccccaacatc gacacccatc agcaccacca ctacggtgac cccaacacca 21240 acacccaccg gcacacagac cccaaccctg acacccatca ccaccaccac tacggtgacc 21300 ccaaccccaa cacccaccgg cacacagacc ccaaccacga cacccatcac caccaccact 21360 acggtgaccc caaccccaac acccaccggc acaaagagta caaccccgac atccatcacc 21420 accaccacta tggtgacccc aaccccacca cccactggca cacagacccc aaccacgaca 21480 cccatcacca ccaccactac ggtgacccca accccaacac ccaccggcac acagacccca 21540 accccgacac ccatcaccac caccaccacg gtgaccccaa ccccaacacc caccggcaca 21600 cagaccccaa catcgacacc catcaccacc aacactacgg tgaccccaac cccaacacca 21660 accggcacac cgagtacaac cctgacaccc atcaccacca ccactatggt gaccccaacc 21720 ccaacaccca ccggcacaca gaccccaaca tcgacaccca tcagcaccac cactacggtg 21780 accccaacct caacacccac cggcacacag accccaaccc cgacacccat ctccaccacc 21840 actacggtga ccccaacccc gacacccatc tccaccacca ctacagtgac cccaacccca 21900 acacccaccg gcacacagac cccaaccatg acacccatca ccaccaccac cacggtgacc 21960 ccaaccccaa cacccaccgg cacacagacc ccaacaacga cacccatcag caccaccacc 22020 acagtgaccc caaccccaac acccaccggc acacagaccc caacatcgac acccatcacc 22080 accaccacta cggtgacccc aaccccaaca cccaccggca cacagacccc aaccacgaca 22140 cccatcacca ccaccaccac ggtgacccca accccaacac ccaccggcac acagagtaca 22200 accctgacac ccatcaccac caccaccacg gtgacaccaa ccccaacacc caccggcaca 22260 cagaccccaa ccccgacacc catctccacc accactacgg tgaccccaac cccaacaccc 22320 accggcacac agaccccaac cacgacaccc atcaccacca ccaccacggt gaccccaacc 22380 ccaacaccca ccggcacaca gaccccaaca acgacaccca tcagcaccac caccacggtg 22440 accccaaccc caacacccac cggcacacag accccaacat cgacacccat caccaccacc 22500 actacggtga ccccaacccc aacacccacc ggcacacaga ccccaaccac gacacccatc 22560 accaccacca ccacggtgac cccaacccca acacccactg gcacacaggc cccaacccca 22620 acagccatca ccaccaccac tacggtgacc ccaaccccaa cacccaccgg cacacagacc 22680 ccaacaacga cacccatcac caccaccacc atggtgaccc caaccccaac acccaccggc 22740 acacagaccc caacatcgac acccatcacc accaccacta cggtgacccc aaccccaaca 22800 cccaccggca cacagacccc aaccccgaca cccatctcca ccaccactac ggtgacccca 22860 accccaacac ccaccggcac acagacccca accatgacac ccatcaccac caccaccacg 22920 gtgaccccaa ccccaacacc caccggcaca cagaccccaa caacgacacc catcagcacc 22980 accaccacgg tgaccccaac cccaacaccc accggcacac agaccccaac atcgacaccc 23040 atcaccacca ccactacggt gaccccaacc ccaacaccca ccggcacaca gaccccaacc 23100 ccgacaccca tcaccaccac caccacggtg accccaaccc caacacccac cggcacacag 23160 accccaacat cgacacccat caccaccacc actacggtga ccccaacccc aacacccacc 23220 ggcacacaga ccccaaccac gacacccatc accaccacca ccacggtgac cccaacccca 23280 acacccaccg gcacacagag tacaaccctg acacccatca ccaccaccac cacggtgaac 23340 accaaccccc aacacccacc ggcacacaaa accccaacat caacacccat caccacccac 23400 cactacggtt gaccccaacc cccaaaaccc accggcacac agaccccaac cccaacaccc 23460 attctccacc accaataacg ggtgacccca accccaacaa cccaccggca cacagacccc 23520 aaccatgaca cccatcacca ccaccaccac ggtgacccca accccaacac ccaccggcac 23580 acagacccca acatcgacac ccatcaccac caccactacg gtgaccccaa ccccaacacc 23640 caccggcaca cagaccccaa ccatgacacc catcaccacc accaccacgg tgaccccaac 23700 cccaacaccc actggcacac aggccccaac cccaacagcc atcaccacca ccactacggt 23760 gaccccaacc ccaacaccca ccggcacaca gaccccaacc acgacaccca tcaccaccac 23820 caccacggtg accccaaccc caacacccac cggcacacag agtacaaccc tgacacccat 23880 caccaccacc accacggtga caccaacccc aacacccacc ggcacacaga ccccaacccc 23940 gacacccatc tccaccacca ctacggtgac cccaacccca acacccaccg gcacacagac 24000 cccaaccatg acacccatca ccaccaccac cacggtgacc ccaaccccaa cacccaccgg 24060 cacacagacc ccaacaacga cacccatcag caccaccacc acggtgaccc caaccccaac 24120 acccaccggc acacagaccc caacatcgac acccatcacc accaccacta cggtgacccc 24180 aaccccaaca cccaccggca cacagacccc aaccacgaca cccatcacca ccaccaccac 24240 ggtgacccca accccaacac ccactggcac acaggcccca accccaacag ccatcaccac 24300 caccagtacg gtgaccccaa ccccaacacc caccggcaca cagaccccaa ccacgacacc 24360 catcaccacc accactacgg tgacaccaac cccaacaccc accggcacac agtccccaac 24420 cccaacagcc atcaccacca ccactacggt gaccccaacc ccaacaccca ccggcacaca 24480 gaccccaaca ttgacgccca tcaccaccac cactacggtg accccaaccc caacacccac 24540 cggcacacag accccaaccc cgacacccat ctccaccacc actacggtga ccccaacccc 24600 aacacccacc ggcacacaga ccccaaccac gacacccatc accaccacca ccacggtgac 24660 cccaaccccg acacccaccg gcacacagac cccaaccacg gtactcatca ccaccaccac 24720 tacgatgacc ccaaccccaa cacccaccag cacaaagagt acaaccgtga cacccatcac 24780 caccacaact acggtgaccg caaccccaac acccaccggc acacagaccc caaccatgat 24840 acccatcagc accaccacta cggtgacccc aaccccaaca cccaccactg gaagcacggg 24900 gccccccacc cacacaagca cagcaccgat tgctgagttg accacatcca atcctccgcc 24960 tgagtcctca acccctcaga cctctcggtc cacctcttcc cctctcacgg agtcaaccac 25020 ccttctgagt accctaccac ctgccattga gatgaccagc acggccccac cctccacacc 25080 cacggcaccc acgaccacga gcggaggcca cacactgtct ccaccgccca gcaccaccac 25140 gtcccctcca ggtaagcaga gccgcttggt tcctctggcc tgggatgctt cttcctcccc 25200 ttgtgccggg caggactgtc ccaggaaggc tcaaggcacg ttctgggcgc ctctctgccc 25260 acgaagcttg gtcactgtgt gggcagaagc cactgacact ggccagtgct gggcagtgaa 25320 gccaaaggcc attccgcttg cccataggac agccttctga ggagctgctg acaccggcca 25380 gtgctgggca gtggagccct tggctatcct gctcgcccat aagacggcct tcttcagggg 25440 cccactgcta tgtgatgcgg tgctgtggga gcccatcaag gctggggggc agagagaggc 25500 tgccagtgag gtgcctgcgg gtccacctgc ttctggctgc agcccctcct tggggccttt 25560 tcctggtgga cggcatgcca cagccagtgc cttctggacg cctcttgctg gccatcggct 25620 tggccagcaa gctgtgttgc tgccagagca ccaggtcacc tgcaggctct cgtgacactc 25680 ggctgtggtg atactggcct tgccgctcca ccctgcctgg tgactctgag agcctgggag 25740 gtgggcacga ggccctggtc ctccagttct gccacccggt cggctgtctg gctcccttgc 25800 agctggggag tggcagttgg gaccctgtgg catctgagat gtgcaacgtc tcagccctca 25860 ctggtgtctc ctgctctcac aggcaccccc actcgcggta ccacgactgg gtcatcttca 25920 gcccccaccc ccagcactgt gcagacgacc accaccagtg cctggacccc cacgccgacc 25980 ccactctcca cacccagcat catcaggacc acaggcctga ggccctaccc ttcctctgtg 26040 cttatctgct gtgtcctgaa cgacacctac tacgcaccag gtactcaggc tgttcacatc 26100 ctgtgcttgg gtggccgagg ctggccccgg catgtaccaa tgggtcaggt gccagggctg 26160 agatcgcagt agaagcgtct caggaggcag cagccgtcga gggtggctgt gtccagggca 26220 cggcttccct tgggtggcct ctgtggggac ctccgctgtg gggacctcca cggggtccag 26280 cggctagccc tgcctccggc tagccctgcc tctggacggt gtgatcgtgg gtctgtctcc 26340 cttcgcaggt gaggaggtgt acaacggcac atacggagac acctgttatt tcgtcaactg 26400 ctcactgagc tgtacgttgg agttctataa ctggtcctgc ccatccacgc cctccccaac 26460 acccacgccc tccaagtcga cgcccacgcc ttccaagcca tcgtccacgc cctccaagcc 26520 gacgcccggc accaagcccc ccgagtgccc agactttgat cctcccagac aggtcagtgg 26580 gctgcaggcg gctttgtccc catggcactc tgcgcagcat gtccgggcag ctgaggcccc 26640 aggcaccact tcctgctggt cgtctgaggg ccgaggcctc cagcaaccct tgggtgcagg 26700 gtctgccgag ccctccacat tttcaccgtg ccccgctgtg cctggcgagg tggctggctg 26760 cagtgaggtc cgtggaagcc acttcggcct ccagcctccc ggctcagcac ccgcccctcc 26820 tgagcgcaga ccaccccatc ctgtgccggt ccccctgacg tcccttgcct cccgtcccca 26880 ggagaacgag acttggtggc tgtgcgactg cttcatggcc acgtgcaagt acaacaacac 26940 ggtggagatc gtgaaggtgg agtgtgagcc gccgcccatg cccacctgct ccaacggcct 27000 ccaacccgtg cgcgtcgagg accccgacgg ctgctgctgg cactgggagt gcgactgtga 27060 gtccggggcc cccaggccct ccccgcatct cctgccctct ccgtgggtgg gggctgcagg 27120 gcccgtctcc cgggggcgga agggctgagg ctccttgggc acagatccca ctgaggtgtt 27180 cgctgaggct gggtgacttc tgagggtctt ctcacagccc tgcttttgcc tcattgggtg 27240 gggagggcct gggcaggtgg agggcttgcc tggtggagtt agggctcctc cctggaacaa 27300 gggtgcttct gaggcaagag ggggctgagt tgaagtttga accctggtcc gtcctgcaga 27360 atgggccact gtgggtgcgc cagggcaagt gcagctcaga catccccgtg cccacgcaca 27420 ggagtggggt tttcaggccc cagcttcctg ctggctcttc ctgactatgc cccagcccag 27480 cccttgcacc cgaccccggc cgaggggcac aggtggcacg gctcactccg gctcccttgc 27540 aggctactgc acgggctggg gcgacccgca ctatgtcacc ttcgacggac tctactacag 27600 ctaccagggc aactgcacct acgtgctggt ggaggagatc agcccctccg tggacaactt 27660 cggagtttac atcgacaact accactgcga tcccaacgac aaggtgtcct gcccccgcac 27720 cctcatcgtg cgccacgaga cccaggaggt gctgatcaag accgtgcata tgatgcccat 27780 gcaggtgcag gtaggcacag cgtggccaca ggaggctggc atggaggcgg gtgctgacat 27840 gggccccaat gcaccctggt tccccagggg ccagaggact gggctgtggg ggtgccaagg 27900 catagcctct cctagagttg ggctagaagg taggatgggg tgggcgactg gctccgggac 27960 atatcagctc ttcctgcagg ccctccaggt gtgtcctggg cccctcgagc cctggcacca 28020 tgccacgctg ggcacagtct ctgcagcaga agctgcctcc tgaggacaga gtcagggaca 28080 gggctctgca cacccttggc tgagatgccc ctacttgcag gggaatcatt ggttctgagg 28140 ctcaggaggc cccgggagcc tgcgccgggc tccacagtcc ccaggtgctc ccaggagagc 28200 tccttcactg gctcacccat gggaccaggg tctggttggg agcagtggag tggaagcaag 28260 aaagggggca ggaaagcggg gtaggcaggg ccctctccct acatgtgtag gtcagagagc 28320 aggcggggtg gggcagccct ggagctctca caaggagagg accgaggcag ctgcagctcc 28380 catggtgtgt cggccacagg tgcaggtgaa caggcaggcg gtggcactgc cctacaagaa 28440 gtacgggctg gaggtgtacc agtctggcat caactacgtg gtggacatcc ccgagctggg 28500 tgtcctcgtc tcctacaatg gcctgtcctt ctccgtcagg ctgccctacc accggtttgg 28560 caacaacacc aagggccagt gtggtgagtt ccgtgacccc catggccccc gaggccccca 28620 cggctcccac cgtcccctgt gcccccatgt cctgccccag ggcgggtggc caggccaggc 28680 tgaggctgag gctgcgtgta aacacccatg ggcctggctg tgggcctctt gccccgctgc 28740 tcggggctgc tgtggccatc acccgggttc agtctctgtg aggagccaac aggagggggc 28800 ctggcctggt ctctgccctc ggccctggct ggccggtcct gggcatctgg gctggagaag 28860 ggcagggctt accctgtctg caacgtggcc tctctcactg atacaggcac ctgcaccaac 28920 accacctccg acgactgcat tctgcccagc ggggagatcg tctccaactg tgaggctgcg 28980 gctgaccagt ggctggtgaa cgacccctcc aagccacact gcccccacag cagctccacg 29040 accaagcgcc cggccgtcac tgtgcccggg ggcggtaaaa cgaccccaca caaggactgc 29100 accccatctc ccctctgcca gctcatcaag gacaggtgac cccgcccagg cctgcctgtg 29160 gccacgacac caataagctg agggcctctg tgccccagcc cccagctctt gcaaagagga 29220 aggaggcagc gcgtggggcc tggcgctggg gctgggaagg cacggagccg cggaaccagg 29280 atcaggcgct aggtcgccgt ggggtccagg acccaggccc ttgggttcca cggggctgag 29340 ctgctacgtg cggcctgtgc ctttgctgaa ctccagtctc tcctggctcc cgggaaggtg 29400 cagggctggc cgagtgtgag gcccggagta aaccagtcaa cccaggacag agctcagggc 29460 tgatattggg agggcagatt tgggctttga cagagagggg gtgctcctaa cgctggcagt 29520 catggggggt cagcatcctg tccctggaag tataggggcc aggtataggc tgggtgtcca 29580 tctgccaggg ttgctggagg gggtcctgaa gctgatgacc acatagacgt ggtttctatc 29640 tctgggagcc gggctgcaga gccaccttgc tcggccatcc cttggtctgt ccctgagctg 29700 tccccctggc tggcctgtcc cttgaccctc catcagccac aggcgcctct ctggcgggtg 29760 ccggactcca ggaggacagt ccgggcagag acgctggggt agagagcagg ggagaggcag 29820 gtgccacctg agtgtgacct gtgcctctcc ctgcgcagcc tgtttgccca gtgccacgca 29880 ctggtgcccc cgcagcacta ctacgatgcc tgcgtgttcg acagctgctt catgccgggc 29940 tcgagcctgg agtgcgccag tctgcaggcc tacgcagccc tctgtgccca gcagaacatc 30000 tgcctcgact ggcggaacca cacgcatggg gcctgctgta agtgcccatc tgcccctgcc 30060 ctggagctgg gggcctgcag gccagacgtg gtctctaggc tctgccaggt gctgtgccca 30120 gcctgaagct agacctagat gggctgcggc cagggacgca gagatggcgg gtgtgagacc 30180 agggctgggg ccatggggtg gggaaggcca ggctggaggg gctgaggtgc tggggcttct 30240 gccagcatcg ctaaatgcaa ctgggtgccc accacccagc tcgggacaac ctcgagggtg 30300 gaggttgatg cccaggcagc tggtcaccct cctccgtgtg tggggcactg ggcagctgtc 30360 actcaagggg gtccaggctc ctccgcctga catgaggcag ccctctgacc tctgcccatg 30420 tccctcagtg gtggagtgcc catctcacag ggagtaccag gcctgtggcc ctgcagaaga 30480 gcccacgtgc aaatccaggt atgttgtttg agggtccacc aggaccgtgg gctcgccttc 30540 tgcagtgcgg agggtggcat catctgggca tagcagtccc acctgccagc tccccagccc 30600 caccccacct gtctgacaat gccctcccgc ccccagctcc tcccagcaga acaacacagt 30660 cctggtggaa ggctgcttct gtcctgaggg caccatgaac tacgctcctg gctttgatgt 30720 ctgcgtgaag acctgcggta cgccacccac tcacactgtc ccctcctgcc tccctcctgc 30780 ctcctcctgg gtgtccacgg aggctgggac caggacgctg accacccccc acctctgatc 30840 cctgttgcac aaggactctg ctaacacaac ttgtctcctg ggtgtccatg gaggctggga 30900 ccaggaggct gaccaccccc acccctgctc cctgctgcac aaggactctg ctaacacaac 30960 ttgtttcttc cctcttccta ggctgtgtgg gacctgacaa tgtgcccaga gaggtaggcc 31020 ccaccgtgtt gctgggggat ccttccacaa attctgaatt ctggggagtg agggatggac 31080 atgaaaacct ggagcctcaa agattgagga atgaggtcat ctaagtcctg gatggctgag 31140 ttggcatgga caccacccac tcacccaccc atccttccac ccacccactc atccacctgt 31200 gcacccatct acccactcac ctacccctcc atccttccac ctacctagtc atcacccact 31260 catctatgca cccccccacc cacccactca tccatccatc catccaccat ccacctaccc 31320 aaccatccac ccatccatcc accatccatc taccatccac catccaccca accatccacc 31380 atccatccat ccacccatca tccatctacc atccacccac ccacctatcc atccatccat 31440 ccaccatctg tctaccatcc acccacccac tcatccatcc atccatccac catctgtcta 31500 ccatccaccc acccacctat ccatccaccc atccatccat ccatccatcc atccatccat 31560 ccatccatcc acccaccatc tgtctaccat ccacccaccc acctatccac ccatccaccc 31620 acccatccat ccacccaacc atccaccatc catccatcca tccatccatc caccatccat 31680 ctaccatcca ccctcccatc catccacgca tccacccaac catccatcca tccatccacc 31740 atccacccac catccaccca tttatccatc cattctccct ccctccattc accacccatt 31800 ggtcatatga tactctgtct agaagctctg acatgacatc ttggccacct ctgtgctgcc 31860 catgcctcct acctgtggta gcagccatgt ggatgattcc ttagctaaat tctgtacaaa 31920 cctgagaggc ctgagtggag aatttgccac gtgccaagcc cctgcttgtc gatgctggtg 31980 agcaggtaat ggctttgtga tatcagtgaa tgagcagcta ctgtcctatc ccagaacctg 32040 cctggtgtgc tcagaagtga ggagggacat ggttttcccc caggatccct cagcactctg 32100 ctcagggtgg ctgtttctcc ccgctgacca cagctgcagc tccggggctg tggtgaggtg 32160 gggcctgcct ggtgccacct gtcctctcta ctcacccttc tttccctgca gtttggggag 32220 cacttcgagt tcgactgcaa gaactgtgtc tgcctggagg gtggaagtgg catcatctgc 32280 caacccaaga ggtgcagcca gaagcccgtt acccactgcg tggaagacgg cacctacctc 32340 gccacggagg tcaaccctgc cgacacctgc tgcaacatta ccgtctgcag taaggccatc 32400 ccctggggcc catgccacct ctcaggggtg cacacatccc tgtaggctgg gctgcctgct 32460 gtcccctcct tggcaagtga ggaaacagct ggcttggggg cctctgctgt gccccttgag 32520 agggcttggg agggggccgc tgggcccagt ccaggcatcc ctgctgcagg gcctgacctg 32580 ggtggggagg ggacccttgg aggtgctgga ggcccgaccc tgtgcagtgg ccccgggggc 32640 tttgcctggg aggagccacc ctcacggccg cgtgcgcacc ctgtcttcag agtgcaacac 32700 cagcctgtgc agtggccccg ggggcttggc ctgggaggag ccaccctcac ggccgcgtgc 32760 acaccctgtc ttcagagtgc aacaccagcc tgtgcaaaga gaagccctcc gtgtgcccgc 32820 tgggattcga agtgaagagc aagatggtgc ctggaaggtg ctgtcctttc tactggtgtg 32880 gtaagcaggg ctggtgggca gggcagggag gaggctgccg cccggggtgg ggtggctgta 32940 agggggttgg ctccctcctg ggggtctcag attctgggga cacagatggc tgtacgcttg 33000 gctgatgcac ccaccccagc cctgagcgct cgctccatcc actgggtgtg caccgggagt 33060 gggggtctgg ccaggtggcc gccccggggc agtctccaac gaacggcctt ctccgttctt 33120 tctcccaaga gtccaagggg gtgtgtgttc acgggaatgc tgagtaccag gtgagccctg 33180 ggctgggtga gagggaggag gggaggaggt cggctgcagc gtgggggtcc tggcaggctg 33240 ttgggctggc tgggatgctg gagaggcccc tgcctcatgt ctctccctgt gcccgaagcc 33300 cggttctcca gtttattcct ccaagtgcca ggactgcgtg tgcacggaca aggtggacaa 33360 caacaccctg ctcaacgtca tcgcctgcac ccacgtgccc tgcaacacct cctgcagccc 33420 tgtaagcggc caccctcctc cttcagcctg cccttttccc tcctcccaga caagcacccg 33480 ggcccatgtc tgcatcgtga ccctttcttt cctcctttca acgccaacct gtccctgtcc 33540 ccacctctcc atcctgacac ctgcccagcc tggggcctcc tccaggtggg ggggtctcgg 33600 cagccctgca ggctttgtgt ggtgtggggt acagcctggg agttcagttg cagtggcgtg 33660 tctatgtgcg cagggcttcg aactcatgga ggcccccggg gagtgctgta agaagtgtga 33720 acagacgcac tgtatcatca aacggcccga caaccagcac gtcatcctga aggtaggtgt 33780 gcactgccgg ccccgacgcg gccgggttgc ttgagcccag ggcaaggcgc gggccaccca 33840 ggatccccca gctgagtcct cccagtcctg ggcgcagctg tgatgggcgc cctggggctg 33900 ccatgacaaa tgagcaggcg tcttcagggc agaaagggat tctcctggtt ctgcggccca 33960 gaaatccata gagcaaaggg cctcagggct gtgctccctc ggaggcgcta ggcaaggacc 34020 tttcccagcc tctggtcact ctaggtgccc cttggctgtg accacgaggt ttccttccct 34080 gtgtctgcct ctcctctccc ttttaaggat ttaggcaccc caagcaggat gatctcatct 34140 taggatcctt cacttaatga caccttcaaa gacccccttt ccaaggcagg tcacattcat 34200 agattcagag ttagaacaca gacagacctt tgagggttgt gtgggctcca ggctggtgcc 34260 tgatgtgggg ccccgcccat gtcacttgtc ctgtggccct gggcctcacc aggaagcctc 34320 cccggccagg tgtctccagg gtgtcttcct ggccgggctg gggctgggcc tgctgccctc 34380 cctcaccaga gctccctgcc ccacagcccg gggacttcaa gagcgacccg aagaacaact 34440 gcacattctt cagctgcgtg aagatccaca accagctcat ctcgtccgtc tccaacatca 34500 cctgccccaa ctttgatgcc agcatttgca tcccggtgag ttggccacct ggggcctggc 34560 tgtgtgtact ctgccgggag tgggggtgcc tggtgttctg gggggctggg gccccagtgc 34620 tgcgacagtg acctcgggcc tggtctgagc tgccgcagga ggctttgcct ggggctttct 34680 gcagcagcta cccccgccca cggcatcgtg ggaaggtgct ctcatcccca ggaatgtccg 34740 ggggtcccgg gctcattctc ctttccctct agggctccat cacattcatg cccaatggat 34800 gctgcaagac ctgtgagtac agggcacagc ctggggggta ggcagggtgg gggcacaagg 34860 gctggtgccc tcagccccgc ctggggtggc tggaggctgg acaacggcct ctgggtgggc 34920 agtgagggct gggggctgag gccgagcctg gggaggggac gcagcgaggg agagcctcct 34980 cgaagatgtg gaggccctgc cctaagccgc tgcccgctct ccccaggcac ccctcgcaat 35040 gagaccaggg tgccctgctc caccgtcccc gtcaccacgg aggtttcgta cgccggctgc 35100 accaagaccg tcctcatgaa tcattgctcc gggtcctgcg ggacatttgt catgtgagtc 35160 ccaggctggg agtgtgcctg gagggggtgg tggagacccc agggaggcga gaggccagcg 35220 ctggccccgg aaggtcaccc ctcactccgc cctcccccca ggtactcggc caaggcccag 35280 gccctggacc acagctgctc ctgctgcaaa gaggagaaaa ccagccagcg tgaggtggtc 35340 ctgagctgcc ccaatggcgg ctcgctgaca cacacctaca cccacatcga gagctgccag 35400 tgccaggaca ccgtctgcgg gctccccacc ggcacctccc gccgggcccg gcgctcccct 35460 aggcatctgg ggagcgggtg agcggggtgg gcacagcccc cttcactgcc ctcgacagct 35520 ttacctcccc cggaccctct gagcctccta agctcggctt cctctcttca gatatttatt 35580 gtctgagtct ttgttcagtc cttgctttcc aataataaac tcagggggac atgc 35634 <210> 31 <211> 21849 <212> DNA <213> Human <223> CEACAM5 <400> 31 gatgctgaga agtactcctg ccctaggaag agactcaggg cagagggagg aaggacagca 60 gaccagacag tcacagcagc cttgacaaaa cgttcctgga actcaagctc ttctccacag 120 aggaggacag agcagacagc agagaccatg gagtctccct cggcccctcc ccacagatgg 180 tgcatcccct ggcagaggct cctgctcaca ggtgaaggga ggacaacctg ggagagggtg 240 ggaggaggga gctggggtct cctgggtagg acagggctgt gagacggaca gagggctcct 300 gttggagcct gaatagggaa gaggacatca gagagggaca ggagtcacac cagaaaaatc 360 aaattgaact ggaattggaa aggggcagga aaacctcaag agttctattt tcctagttaa 420 ttgtcactgg ccactacgtt tttaaaaatc ataataactg catcagatga cactttaaat 480 aaaaacataa ccagggcatg aaacactgtc ctcatccgcc taccgcggac attggaaaat 540 aagccccagg ctgtggaggg ccctgggaac cctcatgaac tcatccacag gaatctgcag 600 cctgtcccag gcactggggt gcaaccaaga tcacacaaat ccctgccctc atgaagctca 660 tgctctcatg gggaggaaga cagacataca aagagatcta gaatgtgagg tcaggtgttg 720 acaagagccc tggagggaat agagcaggga aaggtcagaa aaggaagacc cagggtctct 780 agaggaggtg tcagggaagg gatctcccaa gaatgccctg atgtgagcag gacctgaagg 840 caatggggag ggagccgtga agacccctgg aaaagcagat tccacacagg gaaatgccaa 900 ggtcagaggt gctaaggaaa taggagacac actgctgacc ttgacctagt aggacacaca 960 cacacacaca cacacacaca cactcactca ctccagggct gggggatgaa gagacctgct 1020 caggacccag gaccccattt ttccacccta atgcataggt cccaatattg accgatgctc 1080 tctgctctct cctagcctca cttctaacct tctggaaccc gcccaccact gccaagctca 1140 ctattgaatc cacgccgttc aatgtcgcag aggggaagga ggtgcttcta cttgtccaca 1200 atctgcccca gcatcttttt ggctacagct ggtacaaagg tgaaagagtg gatggcaacc 1260 gtcaaattat aggatatgta ataggaactc aacaagctac cccagggccc gcatacagtg 1320 gtcgagagat aatatacccc aatgcatccc tgctgatcca gaacatcatc cagaatgaca 1380 caggattcta caccctacac gtcataaagt cagatcttgt gaatgaagaa gcaactggcc 1440 agttccgggt ataccgtgag tgattccccc atgacctctg ggtgttgggg gtcagttcta 1500 cttcccacac acaggattat caggcctggg ctgtgcctgt ggccccctct gcattacgca 1560 ccatgttagg gtttgggcat ttagtgcagg atacacacag aagagacaaa cttcaacaga 1620 tcagaattcc tttccggcat ccagaccctg cagacactca ctgcagagga aggacagtct 1680 gatgtggggg acttagcagg gggaggtcag tctcagccaa gcaccccgtg ccctccccgt 1740 aaacctgacc ctgagaaaga ccctggagaa ctgcatcaga gcctggcctg agggacccct 1800 gggatattca cagagaagct cagccccagg gctcctggtt ccaggtgact caggggagcc 1860 tgtgccaggg ctgtgttgtg gcctcctggg caaggctaac tggaagcaag gacttagcag 1920 ctgtccaagg gctgtggctc ctggagctgg attctggatg cagaatcgga ctttctggcc 1980 acacttgttc cctgtcccca gagtctcatt tggacaagga cagagccttg tcctttactt 2040 gagactcaat gtggggagga tagatagaca aggttattag ggtgtcagtc cattgccctg 2100 gggacatagg tgactccatg ggaagctcag tgtccccagg aagaggaaca gaggagagaa 2160 gatgctcccg gcagctcctt gtccaccagg gatcaggccc agggccttct ctcttggagg 2220 caaataaaca taaatgatgt tcatttgagc agctcctctg tgcagagctg agatcaagta 2280 attgtaaata ttttgaggtt aattcacaaa caacctcaca gccaaatagc acttatccta 2340 cttattgaaa ggaaattgag gcacagggag acagtcacta acaagggtca cacaggccat 2400 aggtgtcaga ttgaagtcac atgaggtctg tctgtagcca cagccccctc ctctcctcaa 2460 ctgggggtgg gtggggctgt ttgttgttag gcatctgcat ctgagaccag tcatgggctt 2520 gcgttctttt gtcttgggca tccacagctc agaagcggag attctggtct ggagagtgat 2580 aagtaaatgg agaaataatc agttttactc tagaactaga tcacctcaac agtcagggtc 2640 agtgccggga ttgtccaggc ctctccctga gatccacagc cccctcacat gacctcaaat 2700 cctgtgtttc ccgatgtgtc agtgtcactc ccacggaagg ataaaggaaa ggacttcgct 2760 ttctctcccc actcacaccc tgtgccaaca gaggcccaaa gtgagacaca cgcttgctca 2820 gtagctctct catgaagggg ggaatgagtg aaggaatgat ccataacctc tatagagact 2880 ggatcctgga tgcagaatcc tgggaggttc tgaccacacc tgttccgtgt ccatcagggg 2940 ctgagatcca tgtaccattc ctctgacccc ctgtcccgaa agccacccta tctcatgtga 3000 ctctggggtt ccttggccat gggagggttt tcaaggctcc ctggtcctgg tcgggacagc 3060 caagggactc ctagtcctgg ggtctccgag gtcactatac cccgcatggc tcattgccat 3120 gggcatttct gactttcttc tattcctcca tgttcttcgt cttcctccct cttcattcca 3180 gctgagatgc ccatccctga acatcttcct ccactcttag gccttcccca gacactccct 3240 tgaacaaggc tggctgtcct gttttcttgc cgctcacact gtgtcctggc ccacttccca 3300 ggcaataggg aaggcacaga aatcacaggc aatagggaag gcacagatgg agcccctgcc 3360 aggctccatc acaagccaat gtcaacaggt caccaggaga atgagcttcc gctgtgttcc 3420 tgcccagggc tctttacttc catgaggcca acacacggaa caggcagcag gacgggaatg 3480 agcgactcct ccatccactc cctacactga ctcaccaggg ggtcagaggc agaaggacag 3540 gtctgcagtc cccaaagccc gcatgcttat ttcactcact tcactaccca ctccatcttc 3600 atcctggtgt ggggctcaca tcctccagtg gatcctggga cctcccccag gtggagctgg 3660 ccaggcaggt gctgtctgat aggtttgctg cccattccac atacacctgt gtcctcatga 3720 tgatgccatt gtcataaggt ggagtccctt ggactgagaa gtgaaccagc cactggcgtc 3780 tcacttagac tctacccagt tacaaaaact taaactctag ttgtgttttc tgaggttgat 3840 aggagaggaa gaaaaccttt cacatgcctg ttttgaggct tctcctcttt ttgcctaact 3900 ctgcacagga actaggggca gggagcgctt tctaaattta ctaacatcac acacattgct 3960 tctcctaact tggcatcatt tctcccttta tgtaattgac acacctaaga gttcctctct 4020 gaccggttct gtcctcttaa caggtctcac atccctctct ctgttcaggg agtcactgat 4080 ttcaaaccac tttcagcatc ttcctttgag cataatgtga tcactttgga attcagagca 4140 gacctaaacc ttagcataat attaaaagaa gtactacttc cagcaattga tcttagatct 4200 ttaggccatt gataagaatt tccacttatg gaaaaaattt aatgtttccc ccaaatgtct 4260 ttcacttttt taactatagt cagaaaataa catgagatct aaactcctga caaattttta 4320 agggcaaatt atagtactac agattgagta tcccaaatcc taaaatccaa aatctgaaat 4380 gctccaaaat ccaacatttt ttgaccactg acatgattct caaaagaaat gctcactgaa 4440 ggccgggcac ggtggctcat gcctgtaatc ccagcacttc gggaggccaa ggcgggaaga 4500 tcacaaagtc aagagatcaa gaccatcctg gccaacatgg tgaaaccccg tctctactaa 4560 aaatacaaaa attagctggg cgtggtggca tgcacctaca gtctcagcta ctttggaggc 4620 tgaggcagga gaatcgcttg aacccgggag gtggaggttg cagtgagctg agatcgtgcc 4680 actgcactcc agcctggcaa cagagcgaga ctccatctca aaaaaaagaa aaagaaagaa 4740 aagaaaagaa aaaagaaagg ctcactggag cactttggat tccgtatttt cagatttggg 4800 gtgctaaact ggtaagtata ttgcaaatat tcaaaactca aaaacagtca gaaatccaaa 4860 acacttttag tcctaagcct tacacataag acatactcaa tctgtatgaa ctataggcac 4920 caagctgaac agcagatccc tagaacctcc tcatcctgca taactgaaac tgcagaccca 4980 tgaacaactc tccattcccc cagttcccag gctttgacaa ccaccattct actctctgat 5040 tccacaagtg tgactactct agggacttca tataagtgga atcctacagt atctgccctg 5100 tgagtggctt atttcattta gcataatgtc caatgggaga aaataattgc aaaacttctt 5160 ctcaaagttc tgtctcataa ctgtcaaaca cacatggtcc ttgagggcca gatttccagc 5220 agttcatgct cccccttttc caccagtcag ttctgcattt gcaaatgtcc acatgtattt 5280 atggagagat ccacagcatc ctcgcctgcc ctctgcaagg ggagaaggga cattaaagac 5340 caaagacagg ccgggtgcag tggctcatgc ttgtaatccc agcactttgg gaggccaagg 5400 tgggcagaac acctgaggtc agaagttcaa gaccagcctg accaatatgg tgaaacccca 5460 tctctactaa aaatacaaaa tttagctggg tgtggtggtg ggcgcctgta gtcccagcta 5520 ctcgggaggc tgagacagga gaatcgcttg aacccgggag gcagaggttg ccatgagccg 5580 agatcgtgcc tggccaacac agcaagactc catctcaaaa aacaaacaaa caaacaaaga 5640 ccaaagacaa agaacataca tatggttctg ctgttaaatc cgggcagctc ctgcctgtca 5700 cctgaagttc tagatcattc cctggactcc actctatctt taggggtctc tggctcaagt 5760 cagtcatcat caaacacctg ggaaaaactg ccccaccttg tgcctccact gcctaacgac 5820 tgagctgacc tccaggcttg cctctggtgt cccctgtgtt atttctactg aaacatccag 5880 tcccaggcca ggctgcacaa tatgtacagg gtttaaggac aatgggaaga cccatcacta 5940 tccatttcta ggatgtcctt gcaaagggaa accacagaaa aaatatacct agggaaacaa 6000 agtaggactg aaggtggaag ggacccagca cttgaatgtt ccaggtgagg accctacagt 6060 gggccaagta gtcaactggt cagggaggga ccaggagagg caccaggagc tgtgacctcc 6120 cccccagtcc tgtgtctgtt cacagcccaa tgctgctgct taattcacac ttgagaaagt 6180 ctgtgcttcc cccacaccga gcaggcagcc tcgcagtctc tgagatctca gatcatcgtg 6240 catctgtctt gtgacacatg cacccaccgt gggtttttaa gggctcaggt gggctgagag 6300 gtggaaggtg ccaactctga ttgaaagatg cctgtgagga atcaaaggtg ccacacaggg 6360 caatcttctc tctgttatct gcacagcgga gctgcccaag ccctccatct ccagcaacaa 6420 ctccaaaccc gtggaggaca aggatgctgt ggccttcacc tgtgaacctg agactcagga 6480 cgcaacctac ctgtggtggg taaacaatca gagcctcccg gtcagtccca ggctgcagct 6540 gtccaatggc aacaggaccc tcactctatt caatgtcaca agaaatgaca cagcaagcta 6600 caaatgtgaa acccagaacc cagtgagtgc caggcgcagt gattcagtca tcctgaatgt 6660 cctctgtgag tatatctgct cctctctggc ccaggctgcc agcccaaatc cacagggcca 6720 gaggcaggat ttctcagtcc ctctcaggtt caagtacaca gaccctcaac cctggacatc 6780 cagactgtct gtgactttct gccccagaaa aacctgggca gaccaagtct tgaccaagaa 6840 taggagggga ggggctgctt ctgtcctggg aggctcaggg tccacaccct atgatgggag 6900 aaacaggtga atatctcaga ctcaggctca gtagatacaa gaggggtttg gctgagactt 6960 taggattgtg attcagctta gagggacact gtggtccttc catagaccag gaacttccac 7020 ttccctctga caatatcacc tgtggcttta ttttgtttgc tccagatggc ccggatgccc 7080 ccaccatttc ccctctaaac acatcttaca gatcagggga aaatctgaac ctctcctgcc 7140 acgcagcctc taacccacct gcacagtact cttggtttgt caatgggact ttccagcaat 7200 ccacccaaga gctctttatc cccaacatca ctgtgaataa tagtggatcc tatacgtgcc 7260 aagcccataa ctcagacact ggcctcaata ggaccacagt cacgacgatc acagtctatg 7320 gtaagtggat ccacgaagca ctgacatcat gttttgaggt ggagtctgtc tggttttcaa 7380 acaagagcca ggaagacatt ttctatccca gcctgtgtcc agtgggcaca agcaaatccc 7440 agattctccc actgaacctc cccaatatgt ctctacagac tcttttcttc ttgttctgat 7500 ttctcatggc gggccccagg tccagcttgg aatgtgggga ggaggctccc tcagccccac 7560 agccctgtgt agtggaggaa gcttcacaga gcgggaagga gcaagggttc tcaaggtcaa 7620 gttgcttctc tctgtcacca atgtgtccct ttctgtcacc tctttgtgtt cttttgccta 7680 ctccatgagc tacaagcaac attcaaggct ttgaaacaag ctcatacttt tttcccaaat 7740 gagagaagga agccccttgg gtgagggaga cacagctcag actgctccct gctctgctct 7800 gggctcccct gggtgactgg ccttgcctga ctccacctag gtgggaacga ggtgtgtgga 7860 gaaggagccc gggtggtctg tcctgaattc ggctaaatca agctgccaat caacaccaaa 7920 gcttcccttc gtcccagtca ggctgcagga aaatggaaag agagggagcc tcagggcaga 7980 ctcctgagct gcgtcctggc tctgatgtca ccagctatat gaggctgtgg gcacagcaca 8040 tgggacacag cacaggggac agcaagtgac ccacacttgg agaaatcagg agattcacca 8100 caggggctct gcacggcagg gaatggcagt gtcaaaaatc gtgtgtttat acagatggta 8160 acagtacata tctaacacaa acttaccatc ttaacttttc tacacatgca gttcagtggt 8220 attaaatata ttccccttgt tctgcttcca tcaccaccat ctacccacag gactcttttc 8280 ttcctcccaa aatgaaactc tgttcccatc aaactcctgg gcagagctgc cccatctatg 8340 gcccacagtc tgatccctga cttgtcacct ctagacatgc tcctagtctc ctgcactatt 8400 tctgctcaaa catccatctc catcatcacc tatctctagg atgtccttaa atagcaaagc 8460 ctcagagcaa acacaacttg gctgggtggt gtgggactgt gcagctggaa gaaacgcagc 8520 tccttcaaat tccaggtgag gaccccaatg ggccaggcag ccagccagtc aggaaaggac 8580 cagaagtgct gggggctgtg acccccagcc ctgtgtctgt ccacaaccca atgctactgc 8640 ccaattcaca cttgagaaag tctgtgcttc tcccacacaa aacagccagc ctcatggtct 8700 ctgagccctc agatcattgt gcatctgtct tgtgacgcac acacacctgc catgagcttt 8760 taaggactca gttgggctga gaggtgggag atgccaactc tgattgatag atgcccgtgg 8820 aggaatcaca ggtgccacac agggcaatct tctctctgtt atctgcacag cagagccacc 8880 caaacccttc atcaccagca acaactccaa ccccgtggag gatgaggatg ctgtagcctt 8940 aacctgtgaa cctgagattc agaacacaac ctacctgtgg tgggtaaata atcagagcct 9000 cccggtcagt cccaggctgc agctgtccaa tgacaacagg accctcactc tactcagtgt 9060 cacaaggaat gatgtaggac cctatgagtg tggaatccag aacgaattaa gtgttgacca 9120 cagcgaccca gtcatcctga atgtcctctg tgagtatctt ctgttcctct gtggctcagg 9180 ctgccagccc aaatccacat agccaaagtc caggcctctc agtccctctc aggcccaagg 9240 acagagactt ttacccctgg acatccaggc tggccctacc cccagcaaat ccatgcaggc 9300 ccagtcctga ccaagaatag gaggggaggg tctgctcctg tcctgtaaca ctcgggatcc 9360 acagctagtg atgggagaaa cagatgaatg tctcagactc tggctaattg gatacagtag 9420 gggtttggtt aggacttcag gattgtgact tggctcaggg ggacactgtt gccctttcac 9480 agaccaggag cttccccttt gctctgatga cattcacctg tggccctatt ctctttgctc 9540 cagatggccc agacgacccc accatttccc cctcatacac ctattaccgt ccaggggtga 9600 acctcagcct ctcctgccat gcagcctcta acccacctgc acagtattct tggctgattg 9660 atgggaacat ccagcaacac acacaagagc tctttatctc caacatcact gagaagaaca 9720 gcggactcta tacctgccag gccaataact cagccagtgg ccacagcagg actacagtca 9780 agacaatcac agtctctggt aagtggatcc ctggaccgtt agcaatatgt tctggagcgg 9840 aatctgtctg gttttcagaa aagagccagg aagaaatttt ctttcctagt atgcatccaa 9900 tgggcacaag caatcccaaa ttcaatcctg agcactccca atttgtctct acaaacactc 9960 ttccccttgt ttttctgatt tctcatggct gaccttgtgt ccaccctgag aaatgtgggg 10020 aggggtcttc atcagccctg agccctatgt agtggaaggg gcttcacaga gggggaagca 10080 agaagggtcc tcaaggtcaa gttgctcctc tctgtcacca atatgtccct ttctgacacc 10140 actttgtgtt cttttaccta atccatgagc tacaaggaac aactgaggct ttgaaacaag 10200 ctcacacttt ttccccaaat gagaggagga tgccccttgg atgagggagg agcagctcag 10260 actctgctcc cggctccgct ccgggctccc ccagtgactg gccctgccct gatttcacct 10320 ggggtgggat ccgggcatgt ggagaaggtg ctcaggtggc ctgtcctgaa tctggctaag 10380 tcaagatgcc agatgaagcc aagccttccc agggtcaggc tacagggaaa taagaagaga 10440 gggagcctcg gggcagactc ctgagctgtg tcctggagtc tgaagtcacc ggctgtatga 10500 gattgtgggc acagcacatg ggacacagca cagaagacag tcagtggcac acacttggag 10560 acacacagag attcacccat ggggactcaa catggcaggg aaggggcagt gccaaaaagt 10620 gtgtgtttat agacagggta agaataccag ccactatata tatctaacat aagacaccat 10680 tttaaccttt ctatgtatgc agtttagtag cattaaatat tttcccatta ttctgctacc 10740 atcatcacca tccacccaca gaactctttt cttcttccta aaatgaaact ctgttcccat 10800 caaactcttg ggtagagctg cccacctgtg gcccacagcc tgacccctga actcacctct 10860 agacttgctc ctggtctcct gagctatttc tgcttaaaca cccatccccg tcatcaccca 10920 tctccaggat agccttgaaa caaaaggctc agagaaaaca ccccacggtt gggtggtgtg 10980 ggaccgtgca gctgaacgga attcagcacc cacaagtccc caggttggcc aggccgtcag 11040 ccatcaggga agaaccaaag gaggtgctgg gggctgtgac tcccagtcct gggtctgtcc 11100 acaacccaac gctgctgccc aattcacact tgagaaagtc tgtgcttccc ccacacaaag 11160 cagccggcct tacagtctct gagccctcag atcatcgtac atctgtcttg tgatacacac 11220 acctgccatg ggcttttaag gactcgggtg ggctgaaggg tgggagttgc caactctgat 11280 tgaaagatgc ctgtgaggaa tcaaaagtgc cacacagggc aatcttctct ctgttatctg 11340 cacagcggag ctgcccaagc cctccatctc cagcaacaac tccaaacccg tggaggacaa 11400 ggatgctgtg gccttcacct gtgaacctga ggctcagaac acaacctacc tgtggtgggt 11460 aaatggtcag agcctcccag tcagtcccag gctgcagctg tccaatggca acaggaccct 11520 cactctattc aatgtcacaa gaaatgacgc aagagcctat gtatgtggaa tccagaactc 11580 agtgagtgca aaccgcagtg acccagtcac cctggatgtc ctctgtgagt atcttctgtt 11640 cctctgtggc cctggtttcc aacccaaatc cacacagcca gaggccagga ctctcagttc 11700 tcctcaggtc caaagaggca gactcccacc cctggacacc caggctggcc ataacttcct 11760 gtcccaggaa aatttgggca acctcagcct ggaccaagaa taggagggga gaggctgctc 11820 ctgtcctagg aggctcagag tccacagcct atgatgggag aaacagatga acgtctcaga 11880 cccagactca gtggacatga gggttatggt ttggactttt tttttttttt tttttttttt 11940 gagacggagt ctcgctcttt cgcccaggct ggactgcagt ggtgtgatct cggctcactg 12000 caagctccgc ctcctaggtt cacaccattc tcctgcctca gcctcccgag taactgggat 12060 tacacacacg tgccgccatg cccagctaat gttttttgta tttttagtag agacggggtt 12120 tcaccatgtt ggtcaggctg gtctcgaact cctgatctgc ccgcctcggc ctcccaaagt 12180 gctgggatta caggcgtgag ccaccgcacc cggccgattt ggacttttta acacaggatt 12240 gggacaggat tcagagggac actgtggccc ttctacaatc aggagcttcc cctttcctct 12300 gatgacatca cctgtggctt tgttctcttt gttccagatg ggccggacac ccccatcatt 12360 tcccccccag actcgtctta cctttcggga gcgaacctca acctctcctg ccactcggcc 12420 tctaacccat ccccgcagta ttcttggcgt atcaatggga taccgcagca acacacacaa 12480 gttctcttta tcgccaaaat cacgccaaat aataacggga cctatgcctg ttttgtctct 12540 aacttggcta ctggccgcaa taattccata gtcaagagca tcacagtctc tggtaagtgg 12600 ctccctggag catcagcatc atattctggg gtggagtcta tctggttctc accaaagagc 12660 caagaagaca ttttctttcc cagtctgtgt tccatgggca caaggaaatc ccaaattcta 12720 tcctgagccc cctcactcca tctcggccaa ctctctcctc cccggcttct ctgatatctc 12780 acggctgacc tcgggtccag cctggaatgt ggggaggggc ctcccttagc cccagaaggc 12840 ccccaatagt gaaagggact tcatagtcca gaagaaagaa gggtccttaa ggtcgagttg 12900 ctcctctcta tcaccaatat gtccctttct gtcacctctt tgtgtttttt cacctactct 12960 gtgagctaca aggaacaagg aggctttgaa accagcccac actttttccc caaatgagag 13020 gaggaagccc cttggatgag gcaggagcag ctcagactct gctccctgct ctgcgcccgg 13080 ctcacccggt gactggctct gccctggctc cacttggggt gggaccgggg catgtggaga 13140 aggtgtccag gtggcctgtt ttgaatctgg gtaaatcaag ctgccaatcc acagcagagc 13200 ctcccttggg tcaggttgca gggaaatggg aaaagaggga gcctcgggac agactcctga 13260 gctgtgtcct ggctctgaag tcactggctg tatgaggctg tggacacagc acataggaca 13320 cagcagagga aagtgagtga cacacacttg gagaaatagg gagattcagc cataggggct 13380 ctgcatggga gggaacaggc agtgccaaaa agtgtgtgtt tatagagagg gtaagactat 13440 cagccactat atatatctaa cataaaactt accattaacc atttctaagt gtacaattaa 13500 gtgaaacagc ataaatatca atcaagtata ttgcccggtg tggtggctca tccctgtaat 13560 cccagcactt tgggaggcca aggcgagtgg atcacctgag gtcaggagtt caagatacag 13620 aaaaaaaaaa atagctaggc atggtggtgg gtgcctgtaa tcccagctac tcgggaggct 13680 gaggcaggag aatcgctcga acctgggcgg tgtagtttgc agtgagccga gattgagcca 13740 ctgcactcca gcctgggtga cagagtgaga ctacatcaca aaaaaaaaaa aaaaaaggaa 13800 aaaataaatc aagtcttttt atactcatgt ctaaccatca catcacacta tccatttcca 13860 gaactttttc atcttaccat actaaacctc tgtacccaat aaacagtaac tccttctctc 13920 ccctaaactc tggtaatctc cattctactt tctgtctcta ggtaatcaac tattctaacg 13980 atcttacaaa aatggaatta tataatagtt gtccttttgt gtctgcccta tttcacttag 14040 cataatgtct tcaaggttca tccattttgc accatgtatc acaatttctt ccttgttaag 14100 gttgaagaac attccattgt atggatacac ctcatttttc tatccactta tctttcaatg 14160 gacttttcag ttgtttccac cttttggcta ttgtgagtaa tgctgctgtg aacatcagtg 14220 tacaaatatc tgttcaaatc actgccttca attctttttg gtgtatgtcc agaaatggaa 14280 ttggtagatc aaatgttaat tctttttttt gtttgtttgt ttgtttgttt gtttgttttt 14340 tgagatggag tctcgctctg tcgaccaggc tggagtgcac tggcgcgatc tcggctcact 14400 gcaagctccg cctcccgtgt tcacgccatt ctcctgcctc agcctcccga gtagctggga 14460 ctacaggtgc ccgccaacaa gcttggctaa tttttttttt tttattttta gtagagactg 14520 agtttcacag tgttagccag gatggtctcg atctcctgac ctcgtgatcc gcctgccttg 14580 gcctcccaaa gtgctgggat tacaggcatg agccaccgtg tccggcccca aatgttaatt 14640 atttatttaa ttttttgagg aaccaccata ccattttcca cagtagctaa tatttcacat 14700 ttctatcagc aatgcactag agttccaatt tttccacctc cttgaaaaca cttattgttt 14760 tgtggccatc ctgatgtgtg tgaggtggag tatcattgtg gctttgactt gcatatctct 14820 aagtgttagt gatgttgagc atatttgcat gtgcttgttg gccatttgta tatcttccta 14880 ggagaaatct ctactttagt cctttgtcca tttattaatt gggattttgg atttttgtgg 14940 ttgttgattt gtaagagttc ttcatatatt ctggaaatta atcccttatc agatatatga 15000 tttgcaaata tatttcccat ttcataggtt gccttttcac tttctcgata atgttcttta 15060 atatataaaa gtttttaatt ttcgaggccc tgcacggtgg ttcctgtaat cccagcactt 15120 tgggaggccg aggcaggtag attacaaggt caggagatca agaccatcct ggctaacaca 15180 gtgaaacccc gtctctacta aaaatacaaa aaaaattatc caggcgtggt ggtgggcgcc 15240 tgtagtccca gctactcaag aggctgaggc aggagaatgg catgaaccca ggaggcatag 15300 cttgcagtga gctgagatcg caccactgca ctccagccag ggtgacagag cgagactctg 15360 tcaaaaaaaa aaaaaaaaag tttttaattt tcatgaagtc cagtttatca atttttttct 15420 tttgttgcct atttgttgtt ataaccaaga catgactgtg aaattaaatg tcattaagct 15480 tttttcccta tgttttcttc tcagagtttt atacttttca ctcttacatt taggtctttg 15540 atccatttta ggttaatttg catatatggt atcaggcaaa gattcaactt gttcttgtgc 15600 atggatattc agctttccct atatcatttg ttgaaaagac tgtcctttcc ccattaaatg 15660 gtcttggcac cgttatcaaa aatcatttgg ccatatatgc aagcatttct ttctgggctc 15720 tatattctat tgctttggtt tcaatatctt cctttatgcc aataccacac tgtattgatt 15780 actgtggctt tatagcaaat gctgaaatca ggaagtgtga gtcctccagc ttcattcttt 15840 attttccagg ttgtttggct atttagagtc ctgagattcc atatgaattt caggatatgt 15900 ttttctattt ctgcaaaaaa tgtcactggg actctggtac aaattgcgtt gaacctgcag 15960 ctcactttga gtggtattgt cctcctagca atattgagac ttcccatcca tgaaaaaaaa 16020 atgtctttcc atctattgat gttgtcttta atttccttca gcagtgtttt atagttttca 16080 gggtacaatc ctttcacctc cttggttaag cttatttcta actattttat actattttat 16140 gttaatgtga attggaaatt ttttcttaat ttccttttag attgttcatt gttagtgtgt 16200 agaagtacaa ctgatgtttg cgtgttgatt ttgtatcctg caacatcact gaatttattt 16260 attaactcta acaagttttt taatcttcag ggttttctac agagaagtcc aagttatctg 16320 aaaacacaga tcattttact tctttccaat ttggatgtct ttttttttct tgcctaattt 16380 ctctggctag gacttctaat actgtgtcga atagacgtgg caaaagcagg cattcttgtc 16440 ttgttcctgg tcttacaggg aaagctttca gtctttctcc attgagtatc atgttagcat 16500 tgggcttttc acacattgcc tttattatgc tgaggtggtt tccttccatt cataattaga 16560 gtgtttttgt tgtgaaagaa tggtgaattt tgtcaaatgc ttttattggt tctatctaat 16620 tataggccta ttaaattttt ttgtgtttcc aggaatttgt ccatttcatc taggttattc 16680 aacagtttgt tggcatacaa ttattcatag cattcttgta gtccttaata tttctgtaga 16740 atttgtagca ttggtagcaa tatctccatt ttcttttttt ttttcttttt tttttttaag 16800 agacagggtc tcactctgta gcccagcaca agctagagtg cagtggtgcc atcatagctt 16860 actgcagcct caacctccaa ggctcaagtg atcttctgcc ccagcctctt gagaagctgg 16920 gactacagac atgtgacacc aagcctggat agttttttaa agaaattttg tagacactgt 16980 gtctgcctat gttgcccagg ctggtcttga cctcctgacc tcaagtaatc ctcttgcttg 17040 agtctcccaa tgtgctggga ttaaatgtgt gagccgctat acctccattt tcatttctga 17100 ttttagtaat ttgaatcttc tctctttttt cttagtcaat ctaataaatg attgtcaatt 17160 ttgttgatct tttttgaaga accaactttt ggtttcattg attccttcta ttgtttttca 17220 attttccatt ttatttattt aaactctaat ccttattatt tccttcatgt actatctgtg 17280 gtttgaggtg gttctttttc tgtatcctga agttgtaaag ttaggttgtt gatttgagat 17340 ctctctttat atttaatgta tttaccatta aatttctcac acaagattct taacttctct 17400 gagccttcaa ttcttcaact gaaaattgta ataattctca tcaccaggaa atggaggaaa 17460 aatgaaaatt gcaataagaa tgactgttta acagtattgt tttaaagatt taatgtaata 17520 ttcgattaag ctttcagcaa aatgctacac acagagggaa acttcataaa tattagctgc 17580 tattatcact actgttatta ttagcttgaa gttaggcagt tctagagcca aatcctagat 17640 ccacttctca ctaattatat gactttggat aagttttttc accactccaa gtctctgtca 17700 tttcatctgt aagatggaaa tcatgcctac ccaacagggt tattgtatgg atcaaatgag 17760 atgccagaaa agcatttaca gtagctaaca tagcattaat catcagcctg agttgactag 17820 tgagagccaa gccccaaatg aaaacccact aggacatggt tactggctaa aaatggggga 17880 gagaaaaaaa agttaagtgc aaagaatcaa gcctggtatg ttagttttca tccactgaga 17940 ttcagccaag atggaattag aggtgcaaga taatttaccg gggggaacca ccatgaggaa 18000 aagtggagta gaagtgggag gagcctgaga gagccctcag accacgatgc agatctgatt 18060 cctgagaagg agaaagagga gagagtttta gatagtgatg cagttctcag agtttccaca 18120 aggctggtgg ggcgtcctca agcccctcac ccatgagaga gaagcagagt cccccagaac 18180 tgggcttttc attcccctgg tgggagccca tgagaagcga gttctctgtg caacggactt 18240 agtaaataca gaatgcacta gcctgggcct tctgccaatc aagtccctgc cacagagacc 18300 caacagactt atttatgcct accacaactg agacactgag aaaaagatgc aaccatgaaa 18360 agatagaaag ttctaatgac acgcaaaaat agcaatcaga ctttctcaaa tttcaaagcc 18420 ttcagaaata gctgagtgca gacaggccag ggtggaattg acagaagact gatcaccaac 18480 tagcaacaca gtgagagaga aaaaattgca actttcccac aaaactaatg cattccttga 18540 agcaacaagt agagactgct tcatgctgag agctggaacc tggggcaccc cactgtaaaa 18600 taacatcaca ttcattcctt ctcttttctt tccatgacgg acgattcagc atctggaact 18660 tctcctggtc tctcagctgg ggccactgtc ggcatcatga ttggagtgct ggttggggtt 18720 gctctgatat agcagccctg gtgtagtttc ttcatttcag gaagactggt aggtataatg 18780 gcctttcctc ttgttctgtt tcctgcagtg ctgactgcca tgcttgggag agggaaggga 18840 tttcttcacc tgtatctggg actggatctc ttcctcctac ccccaagctc ctgcttctca 18900 gcactaattc ctgcaggtct cttcttccct ggtcttcatg ctccctgtac gccactgtct 18960 cttagatata attatcccca ccctctgctc atttgtttcc cagattcaat acattgtcaa 19020 agcctcttgg tcctttttta acatctcaca cttgtgtcat tctctccatt cccataaacc 19080 tcaacaactg ctcaaagtcc tgcttgaccc cttgttgcca gtctttgaaa tctttcttgc 19140 atatgactgc ctcattacct tcctaaaatc tagttcactc gcctactcaa gaagacacag 19200 gggcctactg tggtgtatta gataagttca catttcttct ctttactaat cttttttact 19260 tcctttacca ccactccctt atataattcc atcatcctaa tagatctgtt tccctacaca 19320 tccctgcctc tccaccccac atgtacacag aattcttagt tccggtgtta cacctaaaaa 19380 catgtcaaac agggtgacct ccttccactg tctgcactgt ggagttaccc acacccttaa 19440 tcacaagcaa cttctgacct catgaagaac aaagactgta gcattaacct gtgagtctta 19500 agctcaggac acaactgtgc ctgtgactga gaaccttttc ctgataacca attcatatgt 19560 tcataacaga tacagaaatg aagaaggcaa ggtccttaat tctataacag gagacaaaac 19620 ctgaaaaata atcataatgc caaaatagaa aggagtgaac atcacaagaa attagagaaa 19680 tctgacggaa aatatagcta cacattggaa tcactcagaa acattttata aaatggatac 19740 ttaagtccca ccgataaatt ccgatttact ggtctggagt gggacccagg cattcgtaat 19800 ttttaagcct ccccagatgc tactaatgtg tagccaggat ggagaaaccc tgttctaaat 19860 aggtaggact tggggctaaa cccatgactt tcagctagga ggattagaat tgcccatgga 19920 gtttttctgg ctgggcacgg tggctcacgc ctataatccc agcactttgg gaggccaagg 19980 cggacggatc aggagttcaa gaccagcctg accaacatgg tgaaaccccc tctctactaa 20040 aaatacaaaa aaatcagctg ggcatggtgg cacgtgcctg taattccagc tactcagaag 20100 gctgaggcag gagaatcgct tgaacccggg aggtggagat tgcagtgagc cgagatcgtg 20160 ccactgcact ccagcctggg cgacagagca agactccgtc tcaaaaaaaa aaaaaaaaaa 20220 agaattgcct gtggagtttt tcaacatacg taagcctata ctttgttggc cctgttcatt 20280 aatgggctcc accaggaaat taggaatcta gttgagaaac agaagctgaa tggaaaggcc 20340 accttatttg atatgttaaa ttatatggga agcactgtca aatcattagt gatgttaaac 20400 cttctctaag ttatatttat gagtatgtta ttgatgtatt ccaaaagtta tataagaaat 20460 tctagaaatc taattggtta tcagccataa tgtcatatgc cacagaagta actaaatttc 20520 tatgtgagtt gtgttcttat tataataaat tatcatcaga tttttaactg tactcatttt 20580 aaatctttgt cattcacaga cagttgtttt gcttcttcct taaagcattt gcaacagcta 20640 cagtctaaaa ttgcttcttt accaaggata tttacagaaa agactctgac cagagatcga 20700 gaccatccta gccaacatcg tgaaacccca tctctactaa aaatacaaaa atgagctggg 20760 cttggtggcg cacacctgta gtcccagtta ctcgggaggc tgaggcagga gaatcgcttg 20820 aacccgggag gtggagattg cagtgagccc agatcgcacc actgcactcc agtctggcaa 20880 cagagcaaga ctccatctca aaaagaaaag aaaagaagac tctgacctgt actcttgaat 20940 acaagtttct gataccactg cactgtctga gaatttccaa aactttaatg aactaactga 21000 cagcttcatg aaactgtcca ccaagatcaa gcagagaaaa taattaattt catgggacta 21060 aatgaactaa tgaggataat attttcataa ttttttattt gaaattttgc tgattcttta 21120 aatgtcttgt ttcccagatt tcaggaaact ttttttcttt taagctatcc acagcttaca 21180 gcaatttgat aaaatatact tttgtgaaca aaaattgaga catttacatt ttctccctat 21240 gtggtcgctc cagacttggg aaactattca tgaatattta tattgtatgg taatatagtt 21300 attgcacaag ttcaataaaa atctgctctt tgtatgacag aatacatttg aaaacattgg 21360 ttatattacc aagactttga ctagaatgtc gtatttgagg atataaaccc ataggtaata 21420 aacccacagg tactacaaac aaagtctgaa gtcagccttg gtttggcttc ctagtgtcaa 21480 ttaaacttct aaaagtttaa tctgagattc cttataaaaa cttccagcaa agcaacttta 21540 aaaaagtctg tgtgggccgg gcgcggtggc tcacgcctgt aatcccagca ctttgatccg 21600 ccgaggcggg cggatcacga ggtcaggaga tccagaccat cctggctaac acagtgaaac 21660 cccgtctcta ctaaaaatac aaaaaaagtt agccgggcgt ggtggtgggg gcctgtagtc 21720 ccagctactc aggaggctga ggcaggagaa cggcatgaac ccgggaggca gggcttgcag 21780 tgagccaaga tcatgccgct gcactccagc ctgggagaca aagtgagact ccgtcaaaaa 21840 aaaaaaaaa 21849 <210> 32 <211> 1869 <212> DNA <213> Human <223> RNA18SN5 <400> 32 tacctggttg atcctgccag tagcatatgc ttgtctcaaa gattaagcca tgcatgtctg 60 agtacgcacg gccggtacag tgaaactgcg aatggctcat taaatcagtt atggttcctt 120 tggtcgctcg ctcctctcct acttggataa ctgtggtaat tctagagcta atacatgccg 180 acgggcgctg acccccttcg cgggggggat gcgtgcattt atcagatcaa aaccaacccg 240 gtcagcccct ctccggcccc ggccgggggg cgggcgccgg cggctttggt gactctagat 300 aacctcgggc cgatcgcacg ccccccgtgg cggcgacgac ccattcgaac gtctgcccta 360 tcaactttcg atggtagtcg ccgtgcctac catggtgacc acgggtgacg gggaatcagg 420 gttcgattcc ggagagggag cctgagaaac ggctaccaca tccaaggaag gcagcaggcg 480 cgcaaattac ccactcccga cccggggagg tagtgacgaa aaataacaat acaggactct 540 ttcgaggccc tgtaattgga atgagtccac tttaaatcct ttaacgagga tccattggag 600 ggcaagtctg gtgccagcag ccgcggtaat tccagctcca atagcgtata ttaaagttgc 660 tgcagttaaa aagctcgtag ttggatcttg ggagcgggcg ggcggtccgc cgcgaggcga 720 gccaccgccc gtccccgccc cttgcctctc ggcgccccct cgatgctctt agctgagtgt 780 cccgcggggc ccgaagcgtt tactttgaaa aaattagagt gttcaaagca ggcccgagcc 840 gcctggatac cgcagctagg aataatggaa taggaccgcg gttctatttt gttggttttc 900 ggaactgagg ccatgattaa gagggacggc cgggggcatt cgtattgcgc cgctagaggt 960 gaaattcttg gaccggcgca agacggacca gagcgaaagc atttgccaag aatgttttca 1020 ttaatcaaga acgaaagtcg gaggttcgaa gacgatcaga taccgtcgta gttccgacca 1080 taaacgatgc cgaccggcga tgcggcggcg ttattcccat gacccgccgg gcagcttccg 1140 ggaaaccaaa gtctttgggt tccgggggga gtatggttgc aaagctgaaa cttaaaggaa 1200 ttgacggaag ggcaccacca ggagtggagc ctgcggctta atttgactca acacgggaaa 1260 cctcacccgg cccggacacg gacaggattg acagattgat agctctttct cgattccgtg 1320 ggtggtggtg catggccgtt cttagttggt ggagcgattt gtctggttaa ttccgataac 1380 gaacgagact ctggcatgct aactagttac gcgacccccg agcggtcggc gtcccccaac 1440 ttcttagagg gacaagtggc gttcagccac ccgagattga gcaataacag gtctgtgatg 1500 cccttagatg tccggggctg cacgcgcgct acactgactg gctcagcgtg tgcctaccct 1560 acgccggcag gcgcgggtaa cccgttgaac cccattcgtg atggggatcg gggattgcaa 1620 ttattcccca tgaacgagga attcccagta agtgcgggtc ataagcttgc gttgattaag 1680 tccctgccct ttgtacacac cgcccgtcgc tactaccgat tggatggttt agtgaggccc 1740 tcggatcggc cccgccgggg tcggcccacg gccctggcgg agcgctgaga agacggtcga 1800 acttgactat ctagaggaag taaaagtcgt aacaaggttt ccgtaggtga acctgcggaa 1860 ggatcatta 1869

Claims (24)

  1. a) 대상체로부터 얻어진 국소 림프노드 샘플에서 유전자 SLC35D3 및 POSTN의 유전자 발현 수준을 결정하는 단계; 및
    b) 단계 a)에서 결정된 유전자 발현 수준을 기준(reference) 환자 집단에서의 동일한 유전자의 기준 유전자 발현 수준과 비교하는 단계
    를 포함하며,
    여기에서 기준과 비교하여 유전자 SLC35D3 및 POSTN의 더 높은 발현 수준은 증가된 전이 가능성 및/또는 종양 공격성과 관련이 있는 것인, 대상체의 결장직장암의 전이 가능성 및/또는 종양 공격성을 결정하는 방법.
  2. 제1항에 있어서,
    a) 대상체로부터 얻어진 국소 림프노드 샘플에서 유전자 SLC35D3, POSTN 및 KLK6의 유전자 발현 수준을 결정하는 단계; 및
    b) 단계 a)에서 결정된 유전자 발현 수준을 기준 환자 집단에서의 동일한 유전자의 기준 유전자 발현 수준과 비교하는 단계;
    를 포함하며,
    여기에서 기준과 비교하여 유전자 SLC35D3, POSTN 및 KLK6의 더 높은 발현 수준은 증가된 전이 가능성 및/또는 종양 공격성과 관련이 있는 것인 방법.
  3. 제1항에 있어서,
    a) 대상체로부터 얻어진 국소 림프노드 샘플에서 유전자 SLC35D3, POSTN 및 MUC2의 유전자 발현 수준을 결정하는 단계; 및
    b) 단계 a)에서 결정된 유전자 발현 수준을 기준 환자 집단에서의 동일한 유전자의 기준 유전자 발현 수준과 비교하는 단계
    를 포함하며,
    여기에서 기준과 비교하여 유전자 SLC35D3, POSTN 및 MUC2의 더 높은 발현 수준은 증가된 전이 가능성 및/또는 종양 공격성과 관련이 있는 것인 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    a) 대상체로부터 얻어진 국소 림프노드 샘플에서 유전자 SLC35D3, POSTN, KLK6 및 MUC2의 유전자 발현 수준을 결정하는 단계; 및
    b) 단계 a)에서 결정된 유전자 발현 수준을 기준 환자 집단에서의 동일한 유전자의 기준 유전자 발현 수준과 비교하는 단계
    를 포함하며,
    여기에서 기준과 비교하여 유전자 SLC35D3, POSTN, KLK6 및 MUC2의 더 높은 발현 수준은 증가된 전이 가능성 및/또는 종양 공격성과 관련이 있는 것인 방법.
  5. 제4항에 있어서,
    c) 상기 샘플에서 유전자 CEACAM5의 유전자 발현 수준 및 18S rRNA의 수준을 결정하는 단계;
    d) 단계 a) 및 c)에서 얻어진 결과를 기초로, SLC35D3/CEACAM5, KLK6/CEACAM5, POSTN/18S rRNA 및 MUC2/CEACAM5의 비율을 계산하는 단계;
    e) 단계 d)에서 얻어진 비율이 상기 기준 환자 집단에서의 동일한 비율에 기초한 컷오프(cut-off) 값보다 큰지에 따라 상기 비율에 (+1) 또는 (0)의 값을 제공하고, 컷오프 값보다 큰 비율은 (+1)의 값을 얻고 컷오프 값보다 작은 값은 (0)의 값을 얻는 단계; 및
    f) 단계 e)에서 얻어진 비율 및 식 [A = SLC35D3/CEACAM5 + KLK6/CEACAM5 + POSTN/18S rRNA - MUC2/CEACAM5]를 이용하여 지수(index) A를 계산하는 단계
    를 더 포함하며,
    여기에서 지수 (+3)은 매우 높은 전이 가능성 및/또는 종양 공격성과 관련이 있고, 지수 (+2) 및 (+1)은 높은 전이 가능성 및/또는 종양 공격성과 관련이 있으며, 지수 (0) 및 (-1)은 낮은 전이 가능성 및/또는 종양 공격성과 관련이 있는 것인 방법.
  6. 제5항에 있어서,
    상기 컷오프 값은 상기 기준 환자 집단의 7 십분위(7th decile)의 비율, 상기 기준 환자 집단의 3 사분위(3rd quartile)의 비율, 또는 상기 기준 환자 집단의 8 십분위(8th decile)의 비율인 것인 방법.
  7. 대상체의 결장직장암의 전이 가능성 및/또는 종양 공격성을 결정하는 방법으로서,
    a) 대상체로부터 얻어진 원발성 장 종양, 혈액 또는 대변 샘플에서 유전자 SLC35D3, KLK6, MUC2 및 CEACAM5의 유전자 발현 수준을 결정하는 단계;
    b) 단계 a)에서 얻어진 결과를 기초로, SLC35D3/CEACAM5, KLK6/CEACAM5 및 MUC2/CEACAM5의 비율을 계산하는 단계; 및
    c) 단계 b)에서 결정된 비율을 기준 환자 집단에서의 동일한 유전자의 발현 수준으로부터 계산된 기준 비율과 비교하는 단계
    를 포함하며,
    여기에서 기준과 비교하여 더 높은 SLC35D3/CEACAM5 및 KLK6/CEACAM5의 비율은 증가된 전이 가능성 및/또는 종양 공격성과 관련이 있고, 기준과 비교하여 더 높은 MUC2/CEACAM5의 비율은 감소된 전이 가능성 및/또는 종양 공격성과 관련이 있는 것인, 방법.
  8. 제1항 내지 제3항 중 어느 한 항에 있어서,
    유전자 발현 수준은 상기 유전자로부터 발현된 mRNA의 양을 정량함으로써 결정되는 것인 방법.
  9. 제4항에 있어서,
    유전자 발현 수준은 상기 유전자로부터 발현된 mRNA의 양을 정량함으로써 결정되는 것인 방법.
  10. 제8항에 있어서,
    상기 mRNA의 양은 혼성화, 시퀀싱 또는 정량적 RT-PCR에 의해 결정되는 것인 방법.
  11. 제10항에 있어서,
    상기 mRNA의 양은 마이크로어레이 및 비드 어레이 기술, 전사체 시퀀싱, 실시간 정량적 RT-PCR, 다중 정량 RT-PCR로부터 선택되는 방법을 이용하여 결정되는 것인 방법.
  12. 제8항에 있어서,
    상기 mRNA의 양은 RNA 또는 DNA 카피 표준물질(copy standard)을 이용하여 결정되는 것인 방법.
  13. a) 제1항 내지 제3항 중 어느 한 항에 따른 방법을 이용하여 전이 가능성 및/또는 종양 공격성을 결정하는 단계; 및
    b) 전이 가능성 및/또는 종양 공격성이 낮은 경우 대상체는 좋은 예후를 갖는다고 결정하거나, 또는 전이 가능성 및/또는 종양 공격성이 높은 경우 대상체는 불량한 예후를 갖는다고 결정하는 단계
    를 포함하는 것인, 결장직장암으로 진단되고 종양을 가지고 있는 대상체의 예후를 결정하는 방법.
  14. a) 제4항에 따른 방법을 이용하여 전이 가능성 및/또는 종양 공격성을 결정하는 단계; 및
    b) 전이 가능성 및/또는 종양 공격성이 낮은 경우 대상체는 좋은 예후를 갖는다고 결정하거나, 또는 전이 가능성 및/또는 종양 공격성이 높은 경우 대상체는 불량한 예후를 갖는다고 결정하는 단계
    를 포함하는 것인, 결장직장암으로 진단되고 종양을 가지고 있는 대상체의 예후를 결정하는 방법.
  15. 제13항에 있어서,
    불량한 예후는 좋은 예후와 비교하여 생존 가능성이 감소하는 것인 방법.
  16. 유전자 SLC35D3 및 POSTN의 유전자 발현 수준의 결정을 위한 핵산 프라이머 및 프로브를 포함하는, 결장직장암으로 진단된 대상체의 전이 가능성 및/또는 종양 공격성을 결정하기 위한 키트.
  17. 제16항에 있어서,
    유전자 SLC35D3, POSTN 및 KLK6의 유전자 발현 수준의 결정을 위한 핵산 프라이머 및 프로브를 포함하는 키트.
  18. 제16항에 있어서,
    유전자 SLC35D3, POSTN 및 MUC2의 유전자 발현 수준의 결정을 위한 핵산 프라이머 및 프로브를 포함하는 키트.
  19. 제16항에 있어서,
    유전자 SLC35D3, POSTN, KLK6 및 MUC2의 유전자 발현 수준의 결정을 위한 핵산 프라이머 및 프로브를 포함하는 키트.
  20. 제16항에 있어서,
    유전자 SLC35D3, POSTN, KLK6, MUC2 및 CEACAM5의 유전자 발현 수준의 결정을 위한 핵산 프라이머 및 프로브를 포함하는 키트.
  21. 제16항 내지 제20항 중 어느 한 항에 있어서,
    핵산 프라이머 및 프로브는 서열 번호 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15로부터 선택되는 것인 키트.
  22. 제16항 내지 제20항 중 어느 한 항에 있어서,
    mRNA, RNA 및/또는 DNA 카피 표준물질을 더 포함하는 키트.
  23. 삭제
  24. 삭제
KR1020187029589A 2016-04-20 2017-04-12 결장직장암 분류를 위한 마커 유전자, 결장직장암의 예후를 위한 림프노드 전이를 판단하는 방법 및 이를 위한 키트 KR102353374B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE1630095A SE540173C2 (en) 2016-04-20 2016-04-20 Marker genes for colorectal cancer classification, method for judging lymph node metastasis for prognosis of colorectal cancer and kit therefor
SE1630095-6 2016-04-20
PCT/SE2017/050368 WO2017184059A1 (en) 2016-04-20 2017-04-12 Marker genes for colorectal cancer classification, method for judging lymph node metastasis for prognosis of colorectal cancer and kit therefor

Publications (2)

Publication Number Publication Date
KR20180134896A KR20180134896A (ko) 2018-12-19
KR102353374B1 true KR102353374B1 (ko) 2022-01-18

Family

ID=60116279

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187029589A KR102353374B1 (ko) 2016-04-20 2017-04-12 결장직장암 분류를 위한 마커 유전자, 결장직장암의 예후를 위한 림프노드 전이를 판단하는 방법 및 이를 위한 키트

Country Status (8)

Country Link
US (2) US10988811B2 (ko)
EP (1) EP3446122B1 (ko)
JP (1) JP6968822B2 (ko)
KR (1) KR102353374B1 (ko)
CN (1) CN109073651A (ko)
AU (1) AU2017254347B2 (ko)
SE (1) SE540173C2 (ko)
WO (1) WO2017184059A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111781356A (zh) * 2019-04-04 2020-10-16 清华大学 一种胃癌极早期细胞标志和胃癌前病变早期细胞标志及其在诊断试剂盒中的应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008079269A2 (en) 2006-12-19 2008-07-03 Genego, Inc. Novel methods for functional analysis of high-throughput experimental data and gene groups identified therfrom
US20120282167A1 (en) 2009-08-10 2012-11-08 Institut Curie Method for predicting the sensitivity of a tumor to an epigenetic treatment

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1352086B1 (en) * 2000-05-01 2008-11-12 Gen-Probe Incorporated Polynucleotide probes for detection and quantitation of candida species
CA2575614A1 (en) * 2004-07-29 2006-02-09 Stem Cell Innovations, Inc. Differentiation of stem cells
US20090028793A1 (en) * 2006-02-22 2009-01-29 Philogen Spa Vascular Tumor Markers
WO2007112330A2 (en) * 2006-03-24 2007-10-04 Diadexus, Inc. Compositions and methods for detection, prognosis and treatment of colon cancer
JPWO2009044899A1 (ja) * 2007-10-03 2011-02-17 協和発酵キリン株式会社 細胞の増殖を制御する核酸
KR101007567B1 (ko) 2007-10-30 2011-01-14 한국생명공학연구원 대장암 과발현 유전자를 이용한 대장암 진단 마커
EP2265730B1 (en) * 2008-03-12 2018-06-06 The Rockefeller University Methods and compositions for translational profiling and molecular phenotyping
JP5907732B2 (ja) * 2009-01-14 2016-04-26 ザ ユナイテッド ステイツ オブ アメリカ, アズ リプレゼンテッド バイ ザ セクレタリー, デパートメント オブ ヘルス アンド ヒューマン サービシーズ 比に基づく生体マーカーおよびそれを使用する方法
CA2787027A1 (en) * 2010-01-13 2011-07-21 Caris Life Sciences Luxembourg Holdings, S.A.R.L. Detection of gastrointestinal disorders
EP2593566B1 (en) * 2010-07-14 2018-01-24 The Regents of The University of California Biomarkers for diagnosis of transient ischemic attacks
US8741905B2 (en) 2010-11-05 2014-06-03 The Broad Institute, Inc. Compounds and methods for treating autoimmune diseases
KR20140040694A (ko) * 2011-01-18 2014-04-03 에버리스트 게노믹스, 인크. 결장직장암 재발에 대한 예후 서명
AU2012301589A1 (en) * 2011-08-31 2014-02-27 Oncocyte Corporation Methods and compositions for the treatment and diagnosis of colorectal cancer
AU2012301664A1 (en) * 2011-08-31 2014-02-27 Oncocyte Corporation Methods and compositions for the treatment and diagnosis of cancer
WO2013052480A1 (en) * 2011-10-03 2013-04-11 The Board Of Regents Of The University Of Texas System Marker-based prognostic risk score in colon cancer
JP5805518B2 (ja) * 2011-12-21 2015-11-04 株式会社島津製作所 マルチプレックス大腸がんマーカーパネル
WO2015120069A1 (en) 2014-02-04 2015-08-13 Beth Israel Deaconess Medical Center, Inc. Methods and kits for the diagnosis and treatment of pancreatic cancer

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008079269A2 (en) 2006-12-19 2008-07-03 Genego, Inc. Novel methods for functional analysis of high-throughput experimental data and gene groups identified therfrom
US20120282167A1 (en) 2009-08-10 2012-11-08 Institut Curie Method for predicting the sensitivity of a tumor to an epigenetic treatment

Also Published As

Publication number Publication date
EP3446122C0 (en) 2024-03-27
US20190136328A1 (en) 2019-05-09
SE1630095A1 (en) 2017-10-21
EP3446122A4 (en) 2020-01-08
EP3446122A1 (en) 2019-02-27
AU2017254347B2 (en) 2023-04-20
AU2017254347A1 (en) 2018-10-18
KR20180134896A (ko) 2018-12-19
CN109073651A (zh) 2018-12-21
EP3446122B1 (en) 2024-03-27
JP2019514365A (ja) 2019-06-06
WO2017184059A1 (en) 2017-10-26
US10988811B2 (en) 2021-04-27
JP6968822B2 (ja) 2021-11-17
US20210246513A1 (en) 2021-08-12
SE540173C2 (en) 2018-04-24

Similar Documents

Publication Publication Date Title
AU2020270508B2 (en) C/EBP alpha short activating RNA compositions and methods of use
CN107941681B (zh) 鉴定生物样品中定量细胞组成的方法
ES2744098T3 (es) Composiciones y sus usos dirigidos a la huntingtina
KR101708544B1 (ko) 세포 증식 질환을 분석하기 위한 방법 및 핵산
KR102657306B1 (ko) 전립선암의 진단 및 치료에서 필라민을 포함하는 마커의 용도
CN101874120B (zh) 作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型
CN107250373A (zh) 通过微流体递送实现的基因编辑
KR20160027968A (ko) Foxp3 발현을 조절하기 위한 조성물 및 방법
US20090305284A1 (en) Methods for Identifying Risk of Breast Cancer and Treatments Thereof
CA2941594A1 (en) Genetic polymorphisms of the protein receptor c (procr) associated with myocardial infarction, methods of detection and uses thereof
CA2514187A1 (en) Expression profiles for colon cancer and methods of use
CN101687050A (zh) 用于鉴别原发起源不明的癌的起源的方法和材料
TW201632629A (zh) 用於癌症診斷與預後的方法
CN106604988B (zh) 用于获得整体活化的单核细胞的方法
KR20120099363A (ko) 탯줄 혈액으로부터의 유도 만능 줄기 세포의 생성
KR20150023904A (ko) 전립선암의 진단 및 치료에서의 마커의 용도
KR20180049093A (ko) 신규한 바이오마커 및 암의 치료 방법
KR101695866B1 (ko) 전립선 암 마커로서의 포스포디에스테라제 9a
CA2497597A1 (en) Methods for identifying subjects at risk of melanoma and treatments
DK2951317T3 (en) PROCEDURE FOR PREDICTING THE BENEFIT OF INCLUSING TAXAN IN A CHEMOTHERAPY PLAN FOR BREAST CANCER PATIENTS
KR102353374B1 (ko) 결장직장암 분류를 위한 마커 유전자, 결장직장암의 예후를 위한 림프노드 전이를 판단하는 방법 및 이를 위한 키트
US20220265798A1 (en) Cancer vaccine compositions and methods for using same to prevent and/or treat cancer
KR20190126812A (ko) 질환 진단용 바이오마커
WO2006022638A1 (en) Methods for identifying risk of type ii diabetes and treatments thereof
US20090258344A1 (en) Methods for identifying risk of breast cancer and treatments thereof

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant