KR20090106430A - Her-2 유전자를 이용한 폐암 감수성 진단용 마커 및 이를 이용한 폐암 감수성 진단 방법 - Google Patents

Her-2 유전자를 이용한 폐암 감수성 진단용 마커 및 이를 이용한 폐암 감수성 진단 방법 Download PDF

Info

Publication number
KR20090106430A
KR20090106430A KR1020080101903A KR20080101903A KR20090106430A KR 20090106430 A KR20090106430 A KR 20090106430A KR 1020080101903 A KR1020080101903 A KR 1020080101903A KR 20080101903 A KR20080101903 A KR 20080101903A KR 20090106430 A KR20090106430 A KR 20090106430A
Authority
KR
South Korea
Prior art keywords
base
seq
gene
lung cancer
polynucleotide
Prior art date
Application number
KR1020080101903A
Other languages
English (en)
Other versions
KR101090742B1 (ko
Inventor
김열홍
조욱현
한슬기로
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Publication of KR20090106430A publication Critical patent/KR20090106430A/ko
Application granted granted Critical
Publication of KR101090742B1 publication Critical patent/KR101090742B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Oncology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Hospice & Palliative Care (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 폐암 발생 위험도의 예측 및 선별을 가능하게 하는 폐암 감수성 진단용 마커에 관한 것으로, 보다 구체적으로 새로이 발견한 유전자의 단일 염기 다형성(SNP)인 -3444C>T, -1985 G>T, P1170A C>G를 이용한 폐암 감수성 진단용 마커, 진단키트 및 이를 이용한 폐암 감수성 예측 및 진단 방법에 관한 것이다.
본 발명에 의하면, 환자군이 폐암 발암 고위험군에 속하는지 여부의 예측 및 선별이 가능하여 폐암의 조기진단 및 치료 등에 유용하게 이용될 수 있다.
폐암, HER-2, 단일 염기 다형성(SNP;single nucleotide polymorphism), 일배체형(haplotype)

Description

HER-2 유전자를 이용한 폐암 감수성 진단용 마커 및 이를 이용한 폐암 감수성 진단 방법{Makers for the diagnosis of susceptibility to lung cancer using HER-2 gene and method for predicting and analyzing susceptibility to lung cancer using the same}
본 발명은 폐암 발생 위험도의 예측 및 선별을 가능하게 하는 폐암 감수성 진단용 마커에 관한 것으로, 보다 구체적으로 새로이 발견한 HER-2 유전자의 단일 염기 다형성(SNP)인 -3444C>T, -1985 G>T, P1170A C>G를 이용한 폐암 감수성 진단용 마커, 진단키트 및 이를 이용한 폐암 감수성 예측 및 진단 방법에 관한 것이다.
폐암은 폐에 발생하는 암이다. 흡연, 공해 등이 가장 큰 원인인 선진국형 암으로, 20세기에 들어서면서 구미 각국에서 급격히 증가하기 시작하여 전 세계적으로 매년 130만 명 이상이 폐암으로 사망하며, 암으로 인한 사망에서 가장 높은 비중을 차지하고 있다. 한국의 경우에도, 매년 10여 만 명의 암 환자가 새로 발생하고 5만 여명의 암 환자가 사망하고 있는 것으로 보고되었다. 더욱이 암의 발생 빈 도는 최근 들어 더욱 증가하는 추세로 현재 암은 우리나라 성인 사망 원인의 2위를 차지하고 있다. 특히, 폐암은 한국 성인에서 발생하는 암중에서 약 12%를 차지하며 위암, 간암에 이어 제3위의 발생률을 보이며 매년 남녀 모두에서 발생율이 증가하고 있다. 폐암의 발생율은 여성보다 남성에서 현저히 높으며 상대적으로 45세 미만의 젊은 환자의 비율이 높은 것으로 보고 되었다. 더구나 폐암은 진단 당시 이미 다른 장기로 전이를 하였거나 전이가 없는 경우에도 국소적으로 진행되어 근치적절제술, 함암화학요법, 방사선치료 등의 다양한 치료법에도 불구하고 치료 후 재발과 전이에 의해 5년 생존율이 5% 정도에 머무르는 완치율이 매우 낮은 종양으로 암에 의한 사망율 1위를 차지하고 있다. 따라서 치료 성적을 높이기 위해서는 폐암의 발생 및 그의 원인 기전, 암의 성장, 그리고 전이에 관여하는 분자생물학적 조절기전 등을 규명하여 각 단계별로 대응하는 새로운 진단 및 치료 방법의 개발이 절실히 요구된다.
1970년대부터 분자 생물학의 발달과 함께 종양 유전자 및 종양억제 유전자가 발굴되면서 암은 다단계 유전자 변이 질환임이 규명되었다. 즉, 암은 단일 유전자 결손 질환과 달리 여러개의 유전자가 유전자 돌연변이, 증폭, 결손, 치환 등의 단계적 변화 결과 악성으로 이행한다는 발암 기전이 제시되었다. 지금까지 '종양 유전학' 분야에서는 이러한 분자생물학적 다단계 모델 하에 미리 예측한 특정 1-2개의 유전자를 대상으로 그 발현이나 또는 돌연변이 유무를 조사해왔으나 종양의 다단계 모델을 완벽하게 밝히거나 발암 기전 규명에 효과적이지 못했다.
생명과학 분야의 발달로 한꺼번에 수많은 유전자들의 발현을 측정할 수 있는 기법들이 개발되었거나 개발 중이기 때문에 21세기 생명 공학 분야는 엄청나게 축적된 유전암호들을 분석해서 그 유전자의 기능과 상호작용을 밝히는 functional genomics 시대로 이행해 가고 있다. 유전정보를 집중화하고 컴퓨터를 이용하여 비교 분석하는 생물정보학과 더불어 초정밀 집적 마이크로어레이를 이용한 다량의 유전자 발현을 고속 검색할 수 있는 기술은 분자생물학적 지식과 현대 기계 및 전자공학의 기술을 접목시킨 것으로 유전자 발현 연구에 획기적인 전지를 마련하였을 뿐만 아니라 functional genomics 라는 새로운 학문의 장을 개척하는 등 다양한 용도로 활용될 중요 기반 기술이다.
최근 동일한 발암요인에 대해서도 개인이 지닌 유전적 감수성에 따라 위험도가 달라지며 이러한 개인 및 인종 간의 감수성을 구분 짓는 가장 중요한 표지자로 SNP(single nucleotide polymorphism)가 제시되고 있다.
SNP란 개인과 개인 간의 DNA에 존재하는 한 염기쌍(single base-pair variation)의 차이를 말하는 것으로 DNA sequence 다형성(polymorphism)중에서 가장 많이 존재하는 형태이다 (약 1개/1kb).
SNP가 주목을 끄는 이유는 가장 높은 빈도를 보이는 변이 형태이며, 상당히 안정적인 변이이고 낮은 변이율을 보인다는 점이다. 특히, 단백질을 만드는 유전자 부위에 위치한 core SNP의 경우는 기능적 중요성을 갖기 때문에 연구가 집중되고 있으며, 중요한 유전자들의 발현을 조절하는 부위에 대한 해당 유전자의 검색도 수행되고 있다. 또한, SNP는 DNA chip 기술과 접목되어 질병 발생에 대한 개인의 감수성 차이를 규명하여 21세기 맞춤의학 혹은 예측의학이라는 새로운 시대로 나가는데 있어 가장 핵심적인 역할을 할 것으로 예상된다. 암 진단 및 치료의 초기 단계에서 이와 같은 약제학적으로 중요한 단백질의 유전적 다양성에 대한 효과를 고려하는 것은 항암치료의 실패에 대한 위험성을 낮출 수 있는 중요한 요소로 작용하여개체간의 정확하고 신뢰할 수 있는 진단 및 치료 정보를 제공할 것이다.
이와 같은 SNP 연구는 세계적으로 활발히 진행되고 있지만 각 나라마다 인종적인 차이 때문에 한계가 있다. 따라서 국내 SNP 연구는 국제적인 경쟁력이 충분히 있으며, 호흡기암에 대한 cSNPs에 대한 연구는 많지 않으므로 SNP의 쳬계적인 발굴과 기능 연구 등에 대한 효율적인 투자가 필요한 실정이다.
HER-2 (erbB-2 또는 neu) 원형-암유전자(proto-oncogene)는 염색체 17q21에 위치하며 티로신 키나아제 활성을 갖으며, 약 1,255개의 아미노산 길이의 185 kD의 예상 상대 분자량을 지니는 막횡단 당단백질이다. 최근에, HER-2 유전자가 증폭되며, 이의 단백질은 유방암 환자의 약 30%에서 과다 발현된다는 것이 밝혀졌다. HER-2/neu 과다발현은 유방암 이외에도 난소암, 신장세포암, 전립선암, 췌장암, 결장암, 비소세포폐암, 위암, 타액선암, 방광암 및 구강 편평세포암을 포함하는 다수의 상이한 악성 종양에서 보고되었다. 폐암을 지니는 환자의 경우, 다른 암유전자들과 달리 HER-2 유전자는 강한 발암 유전적 변이를 가지고 있지는 않으나 HER-2 과다발현은 불충분한 예후 인자이다. 또한, 몇몇 화학치료제에 대해 내성인 것으로 예상된다. 많은 HER-2 유전자들이 보고되어 있고 이들 다형성들이 HER-2 유전자의 과발현이나 티로신 키나아제의 활성에 변화에 관여할 수 있다는 가능성이 있다.
HER-2 유전자 다형성은 한국인 군집에서 유방암 발생의 위험성과 연관되어 있는 것으로 알려졌으나 폐암환자에서 HER-2 유전자 다형성과 폐암 발암 위험도와의 잠재적인 연관성에 대한 분석은 본 발명의 출원일 이전에 보고된 바 없다. 또한, 하버드 대학의 메튜 메이어슨 박사는 "Nature"에서 폐암 환자들에게서 총 57종의 유전자 변화를 찾아내어 발표한 바 있다. 그러나 여기에 역시 HER-2 유전자의 변이에 대한 내용은 포함되어 있지 않았다.
이에 본 발명자들은 환자군-대조군 연구 및 통계분석을 통해 본 발명의 HER-2 다형성 표지 인자가 폐암 발생 위험도를 예측하는데 사용될 수 있음을 확인함으로써 본 발명을 완성하였다.
본 발명의 목적은 HER-2 유전자의 다형성 부위를 포함하는 폐암 감수성 진단용 마커를 제공하기 위한 것이다.
또한, 본 발명의 목적은 HER-2 유전자의 다형성 부위를 포함하는 폴리뉴클레오티드를 증폭하거나 혼성화할 수 있는 올리고뉴클레오티드 또는 폴리뉴클레오티드 를 포함하는 폐암 감수성 진단용 키트 및 마이크로어레이를 제공하기 위한 것이다.
또한, 본 발명의 목적은 상기 폐암 감수성 진단용 마커를 이용하여 폐암의 감수성 예측 및 판단하는 방법을 제공하기 위한 것이다.
상기 목적을 달성하기 위하여,
본 발명은 HER-2 유전자의 다형성 부위를 포함하는 폐암 감수성 진단용 마커를 제공한다.
또한, 본 발명은 HER-2 유전자의 다형성 부위를 포함하는 폴리뉴클레오티드를 증폭하거나 혼성화할 수 있는 올리고뉴클레오티드 또는 폴리뉴클레오티드를 포함하는 폐암 감수성 진단용 키트 및 마이크로어레이를 제공한다.
또한, 본 발명은 상기 폐암 감수성 진단용 마커를 이용하여 폐암의 감수성 예측 및 판단하는 방법을 제공한다.
본 발명은 서열번호 1로 이루어지는 폴리뉴클레오티드에서 서열번호 1의 1316번째 염기(HER-2 유전자의 번역시작점으로부터 -3444번째) C가 T로 치환되고 상기 1316번째 염기를 포함하는 100-500개의 연속적인 DNA단편으로 구성되는 폴리뉴클레오티드, 서열번호 1의 2771번째 염기(HER-2 유전자의 번역시작점으로부터 -1985번째) G가 T로 치환되고 상기 2771번째 염기를 포함하는 100-500개의 연속적인 DNA단편으로 구성되는 폴리뉴클레오티드, 서열번호 1의 32301번째 염기(HER-2 유전자의 1170번째 코돈에서 1번째 염기) C가 G로 치환되고 상기 32301번째 염기를 포함하는 100-500개의 연속적인 DNA단편으로 구성되는 폴리뉴클레오티드 및 이들의 상보적인 폴리뉴클레오티드로 이루어진 군 중에서 선택된 하나 이상의 폴리뉴클레오티드로 이루어지는 폐암 감수성 진단용 마커를 제공한다.
보다 구체적으로, 본 발명은
1) 서열번호 1의 1316번째 염기(HER-2 유전자의 번역시작점으로부터 -3444번째) C가 T로 치환되고 상기 1316번째 염기를 포함하는 100-500개의 연속적인 DNA단편으로 구성되는 폴리뉴클레오티드 및 이들의 상보적인 폴리뉴클레오티드를 제공한다. 한편 상기의 다형성 부위를 -3444 C>T로 표시한다.
2) 서열번호 1의 2771번째 염기(HER-2 유전자의 번역시작점으로부터 -1985번째) G가 T로 치환되고 상기 2771번째 염기를 포함하는 100-500개의 연속적인 DNA단편으로 구성되는 폴리뉴클레오티드 및 이들의 상보적인 폴리뉴클레오티드를 제공한다. 한편, 상기의 다형성 부위를 -1985 G>T로 표시한다.
3) 서열번호 1의 32301번째 염기(HER-2 유전자의 1170번째 코돈에서 1번째 염기) C가 G로 치환되고 상기 32301번째 염기를 포함하는 100-500개의 연속적인 DNA단편으로 구성되는 폴리뉴클레오티드 및 이들의 상보적인 폴리뉴클레오티드를 제공한다. 한편, 상기의 다형성 부위를 P1170A C>G로 표시한다.
본 발명에서 용어 "진단"은 질병 발생 가능성을 예측하거나 질병 발생 위험 도를 결정하거나 도출시키는데 사용되는 모든 유형의 분석을 포함한다.
본 발명에서 용어 "감수성"은 폐암에 대한 민감도, 즉 폐암 발생 위험도의 증가 및 감소를 나타낸다.
본 발명에서 용어 "다형성(polymorphism)"은 유전학적으로 결정된 집단 내에서 2 이상의 대체적 서열 또는 대체적 대립형질의 발생을 의미한다. 바람직한 다형성 마커는 선택된 집단에서 1% 이상, 더욱 바람직하기로는 10% 또는 20% 이상의 발생빈도를 나타내는 2개의 대립형질을 의미한다. 다형성 중에서, 사람에 따라 단일 염기만이 다른 것을 단일 염기 다형성(SNP)이라 한다.
본 발명에서 용어, "마커"는 게놈에 있는 특정 서열로 특정 형질 다형성(polymorphism)을 가리키는 표지로서 이용될 수 있는 것을 의미한다.
본 발명에서 용어, "뉴클레오티드"는 단일 가닥 또는 이중 가닥 형태로 존재하는 디옥시리보뉴클레오티드 또는 리보뉴클레오티드이며, 다르게 특별하게 언급되어 있지 않은 한 자연의 뉴클레오티드의 유사체를 포함한다.(Scheit, Nucleotide Analogs, John Wiley, New York(1980); Uhlman 및 Peyman, Chemical Reviews, 90:543-584(1990))
본 명세서 용어, "폐암 발생 위험성이 낮은" 및 "폐암 감수성이 낮은"는 특별한 언급이 없는 한 동일한 의미로 사용하였다.
본 발명에서 폐암 발생 위험도를 예측하기 위한 표지 인자로 선택된 인간 염색체 17q21에 위치하는 HER-2 유전자는 Gene Bank 등재번호 NC_000017로 공지되어 있으며, 본 발명에서는 상기 서열 중 35093919-35138441번째 염기를 나타낸 것으로 NC_000017 서열 중 35093919번째 염기를 서열번호 1의 1번째 염기로 나타내었다.
염색체 17q21 상의 HER-2 유전자 다형성은 단일 염기 다형성이 위치하는 염색체 번호, 염색체 상의 동원체를 중심으로 한 장완 (long arm: q)부분 및 밴드 번호를 알 수 있는바, 이는 17번 염색체 상의 장완 부분의 21밴드 상에 존재함을 의미한다.
DNA 단편의 크기는 전체 유전자의 full length가 아닌 한 다형성 부위의 염기를 포함하는 어떤 크기의 단편이라도 무방하나, 바람직하게는 10 내지 수백 염기인 것을 특징으로 하며, 더욱 바람직하게는 100-500개 염기인 것을 특징으로 한다.
100-500개 염기의 경우는 상기 SNP를 탐지하기 위한 프로브 내지는 프라이머로 이용할 수 있으며, 그 이상의 염기의 경우는 PCR-RFLP 등에 이용될 수 있다.
본 발명자들은 유방암 발생의 위험성에만 관련 있는 것으로 알려져 오고 폐암 발암의 위험성과의 관련성에 대해서는 연구된 바 없는 HER-2 유전자의 단일 염기 다형성(-3444C>T, -1985 G>T, P1170A C>G)을 선별하여 HER-2 유전자의 단일 염기 다형성과 폐암 감수성간의 관련성을 조사하였다.
폐암 환자군과 대조군의 대립인자 빈도수(allele frequencies)와 유전자형 분포(genotype distributions)에 대한 폐암 감수성과의 관계를 성별, 흡연력, 음주력 여부에 따라 구분하여 표 3에서 도시하였다.
각 단일 염기 다형성의 대립 형질들과 폐암 감수성 간에는 환자군과 대조군에서 유의적인 차이를 보이지 않았다(표 2).
그러나 성별, 흡연력, 음주력을 변수로 하여 분석한 결과 -3444 C>T에서 T 유전자형, -1985 G>T에서 T 유전자형을 가진 여성 (-3444; OR=2.71 (1.13 - 6.51) p-값=0.026, -1985; OR=2.569(0.985 - 6.702) p-값=0.044, 및 -3444 C>T에서 T 유전자형, -1985 G>T에서 T 유전자형, P1170A C>G에서 G 유전자형을 가진 비흡연자 (-3444; OR=2.29(1.17 - 4.46) p-값=0.015, asORb=2.69(1.30 - 5.56) p-값=0.008, -1985; OR=2.15(1.11 - 4.16) p-값=0.023, asORb=2.46(1.20 - 5.01) p-값=0.014, P1170; OR=1.92(1.00 - 3.71) p-값=0.051, asORb=2.20(1.08 - 4.47) p-값=0.029) 및 비음주자 (-3444; OR=2.85(1.23 - 6.62) p-값=0.015, asORb=3.60(1.47 - 8.84) p-값=0.005 , -1985; OR=2.85(1.23 - 6.62) p-값=0.025, asORb=3.60(1.47 - 8.84) p-값=0.005, P1170; OR=2.72(1.17 - 6.34) p-값=0.020, asORb=3.59(1.46 - 8.88) p-값=0.006)에게서 단일 염기 다형성과 폐암 감수성간에 관련성이 있음을 알 수 있다. 즉, 한국인 여성, 비흡연자, 비음주자 집단에서 -3444 C>T에서 T 유전자형, -1985 G>T에서 T 유전자형, P1170A C>G에서 G 유전자형을 가진 경우 폐암 발병 가능성이 높게 나타났다 (표 3).
따라서, 본 발명의 마커는 사람에게 적용되며, 바람직하게는 한국인에게 적용되며, 가장 바람직하게는 여성, 비흡연자, 비음주자인 한국인에게 적용될 수 있다.
폐암 환자군과 대조군의 혈액으로부터 유래된 DNA의  -3444C>T, -1985 G>T, P1170A C>G 세 개의 단일 염기 다형성을 포함하는 유전자형 빈도수는 대상군 모두 Hardy-Weinberg equilibrium 평형 상태에 있다. 두 개의 다형성은 강한 linkage disequilibrium (r2 = 0.90,│D’│ = 1.00)을 이룬다.
또한, 본 발명은 서열번호 1의 1316번째 (HER-2 유전자의 번역시작점으로부터 -3444번째) 염기 또는 서열번호 1의 2771번째 (HER-2 유전자의 번역시작점으로부터 -1985번째) 염기 또는 서열번호 1의 32301번째 (HER-2 유전자의 1170번째 코돈에서 1번째 염기) 염기를 포함하는 폴리뉴클레오티드를 증폭할 수 있는 프라이머를 제공한다.
본 발명의 용어 "프라이머"는 적절한 버퍼 중의 적절한 조건(예를 들면, 4개의 다른 뉴클레오시드 트리포스페이트 및 DNA, RNA 폴리머라제 또는 역전사 효소와 같은 중합체) 및 적당한 온도 하에서 주형-지시 DNA합성의 시작점으로 작용할 수 있는 단일가닥 올리고뉴클레오티드를 말한다. 상기 프라이머의 적절한 길이는 사용 목적에 따라 달라질 수 있으나, 통상 18-25 뉴클레오티드이다. 짧은 프라이머 분자 는 일반적으로 주형과 안정한 혼성체를 형성하기 위해서 더 낮은 온도를 필요로 한다. 프라이머 서열은 주형과 완전하게 상보적일 필요는 없으나, 주형과 혼성화 할 정도로 충분히 상보적이여야 한다. 프라이머 서열은 그 3'말단이 서열번호 1의 다형성 부위와 정렬하는 것이 바람직하다. 상기 프라이머는 다형성 부위를 포함하는 표적 DNA에 혼성화 하고, 완전한 상동성을 보이는 대립형질 형태의 증폭을 개시한다. 이 프라이머의 반대편에 혼성화하는 제2프라이머와 쌍을 이루어 사용된다. 증폭에 의하여 두개의 프라이머로부터 산물이 증폭되고, 이는 특정 대립형질 행태가 존재한다는 것을 의미한다.
유전자의 폐암 발암 관련 다형성 부위를 탐색하기 위해서는 프라이머 디자인이 중요하다. 당업자가 디자인할 수 있는 모든 프라이머가 본 발명의 프라이머 범위에 포함될 수 있으나 바람직하게는 상기 프라이머는 서열번호 2 및 3 또는 서열번호 4 및 5 또는 서열번호 6 및 7로 표시된 올리고뉴클레오티드로 구성되는 것을 특징으로 하는 프라이머이다.
즉, 본 발명의 -3444 C>T 에 대한 프라이머의 서열은 5'-ACC CCA GCA TAG TAT GTC AGA TG-3'(23mer) (정방향;서열번호 2)와 5'-ATC CTA GGG AGT TGA GAA ACA GG-3'(23mer) (역방향;서열번호 3)이다.
-1985 G>T 에 대한 프라이머 서열은 5'- ACC CCT GCC CTG CTG TTG-3'(18mer) (정방향;서열번호 4)이고, 프라이머 서열은 5'-TGG CAC AGA GTA GGG TCC-3'(18mer) (역방향;서열번호 5)이다. 유전자형 분석시 SNP-IT 기법에 이용하기 위 하여 하나의 프라이머는 포스포로올레이션 시킬 수 있다. 본 발명에서는 서열번호 5의 프라이머를 포스포올레이션 시켰다.
P1170A C>G 에 대한 프라이머 서열은 5'- AAA AAC GTC TTT GAC GAC CC-3'(20mer) (역방향;서열번호 6)이고, 포스포로티올레이티드 프라이머 서열은 5'- TTT CAG AAT ATG TGA ACC AGC C -3'(22mer) (정방향;서열번호 7)이다. 유전자형 분석시 SNP-IT 기법에 이용하기 위하여 하나의 프라이머는 포스포로올레이션 시킬 수 있다. 본 발명에서는 서열번호 7의 프라이머를 포스포올레이션 시켰다.
프라이머는 다형성 부위 염기에 인접한 서열과 어닐링 할 수 있는 뉴클레오티드 서열을 포함하여, 상기 프라이머 3` 말단은 상기 다형성 부위 염기에 매칭되는 염기를 갖는다.
예를 들어, 1316번째 뉴클레오티드에 있는 단일 염기 다형성인 "T"를 검출하여 HER-2 유전자 변이체를 동정하는 경우, 상기 단일 염기 다형성의 업스트림에 상보적인 서열을 정방향 프라이머로서 이용할 수 있으며, 역방향 프라이머 3` 말단은 상기 단일 염기 다형성에 매칭되는 염기 즉, "T" 염기를 가지며, 나머지 부분은 서열번호 1에서 1316번째 뉴클레오티드의 다운스트림에 위치한 서열과 실질적으로 대응되는 서열을 갖는다. 이러한 프라이머쌍을 이용하여 1316번째 단일 염기 다형성을 검출하는 증폭 반응을 실시할 수 있다.
또한, 본 발명은 상기 프라이머를 포함하는 폐암 감수성 진단용 키트를 제공 한다. 본 발명의 키트는 상술한 프라이머를 필수 구성요소로 하는바, 프라이머에 대한 상세한 설명은 본 발명의 키트에 이용되는 프라이머에도 적용된다. 따라서, 반복적인 기재에 따른 본 명세서의 과도한 복잡성을 피하기 위해 그 기재를 생략한다. 본 발명의 키트가 PCR 증폭반응에 적용되는 경우, 예컨대 본 발명의 키트는 선택적으로, PCR 증폭에 필요한 시약, 예컨대, 완충액, 각 종의 중합효소 (예컨대, Thermus aquaticus (Taq), Thermus thermophilus (Tth), Thermusfiliformis, Thermis flavus, Thermococcus literalis 또는 Pyrococcus furiosus (Pfu)로부터 수득한 열 안정성 DNA 중합효소), DNA 중합 효소 조인자 및 dNTPs를 포함할 수 있다. 본 발명의 키트는 상기한 시약 성분을 포함하는 다수의 별도 패키징 또는 컴파트먼트로 제작될 수 있다.
또한, 본 발명은 서열번호 1로 이루어지는 폴리뉴클레오티드에서 서열번호 1의 1316번째 염기(HER-2 유전자의 번역시작점으로부터 -3444번째) C가 T로 치환되고 상기 1316번째 염기를 포함하는 100-500개의 연속적인 DNA단편으로 구성되는 폴리뉴클레오티드, 서열번호 1의 2771번째 염기(HER-2 유전자의 번역시작점으로부터 -1985번째) G가 T로 치환되고 상기 2771번째 염기를 포함하는 100-500개의 연속적인 DNA단편으로 구성되는 폴리뉴클레오티드, 서열번호 1의 32301번째 염기(HER-2 유전자의 1170번째 코돈에서 1번째 염기) C가 G로 치환되고 상기 32301번째 염기를 포함하는 100-500개의 연속적인 DNA단편으로 구성되는 폴리뉴클레오티드 및 이들의 상보적인 폴리뉴클레오티드로 이루어진 군 중에서 선택된 하나 이상의 폴리뉴클레 오티드로 이루어진 군 중에서 선택된 하나 이상의 폴리뉴클레오티드로 이루어지는 폐암 감수성 진단용 마이크로어레이를 제공한다.
상기 마이크로어레이는 DNA 또는 RNA 폴리뉴클레오티드를 포함하는 것일 수 있다. 상기 마이크로어레이는 프로브 폴리뉴클레오티드에 본 발명의 폴리뉴클레오티드를 포함하는 것을 제외하고는 통상적인 마이크로어레이로 이루어진다. 프로브 폴리뉴클레오티드를 기판 상에 고정화하여 마이크로어레이를 제조하는 방법은 당업계에서 잘 알려져 있다. 상기 "프로브 폴리뉴클레오티드"는 혼성화할 수 있는 폴리뉴클레오티드를 포함하는 것으로, 핵산의 상보성 가작에 서열 특이적으로 결합할 수 있는 올리고뉴클레오티드를 의미한다.
즉, 본 발명에서 용어 "프로브"는 특정 뉴클레오티드 서열에 혼성화될 수 있는 디옥시뉴클레오티드 및 리보뉴클레오티드를 포함하는 자연 또는 변형되는 모노머 또는 결합을 갖는 성형의 올리고머를 의미한다. 바람직하게는, 프로브는 혼성화에서의 최대 효율을 위하여 단일가닥일 수 있다. 프로브는 바람직하게는 디옥시리보뉴클레오티드일 수 있다. 본 발명에 이용되는 프로브로서, 본 발명의 다형성 부위에 완전하게(perfectly) 상보적인 서열이 이용될 수 있으나, 특이적 혼성화를 방해하지 않는 범위 내에서 실질적으로(substantially) 상보적인 서열이 될 수도 있다.
본 발명에서, 프로브는 서열번호 1의 1316번째(HER-2 유전자의 번역시작점으로부터 -3444번째) 염기 또는 서열번호 1의 2771번째 (HER-2 유전자의 번역시작점으로부터 -1985번째) 염기 또는 서열번호 1의 32301번째 (HER-2 유전자의 1170번째 코돈에서 1번째 염기) 염기를 포함하는 폴리뉴클레오티드에 혼성화할 수 있는 서열을 포함한다.
보다 바람직하게는, 상기 프로브의 3` 말단, 5` 말단은 상기 단일 변이 염기에 상보적인 염기를 갖는다. 일반적으로, 혼성화에 의해 형성되는 듀플렉스(deuplex)의 안정성은 말단의 서열의 일치에 의해 결정되는 경향이 있기 때문에, 3` 말단, 5` 말단에 단일 변이 염기에 상보적인 염기를 갖는 프로브에서 말단 부분이 혼성화되지 않으면, 이러한 듀플렉스는 해체될 수도 있다. 이러한 프로브에는 Nielsen 등, Science 254, 1497-1500(1991)에 기재된 펩티드 핵산을 포함한다. 본 발명의 프로브는 대립형질 특이적 프로브로서, 핵산 단편 중에 다형성 부위가 존재하여, 다형성 부위에 단일염기변이 치환된 염기가 존재하는 DNA 단편에는 혼성화하나, 치환되지 않은 염기가 존재하는 DNA 단편에는 혼성화하지 않는다.
혼성화에 적합한 조건은 Joseph Sambrook, et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001) 및 Haymes, B. D., et al., Nucleic Acid Hybridization, A Practical Approach, IRL Press, Washington, D.C. (1985)에 개시된 사항을 참조하여 결정할 수 있다. 혼성화에 이용되는 조건은 온도, 이온세기 (완충액 농도) 및 유기 용매와 같은 화합물의 존재 등을 조절하여 결정될 수 있다. 이러한 조건은 혼성화되는 서열에 의존하여 다르게 결정될 수 있다. 다만, 혼성화 조건은 대립형질간의 혼성화 강도에 있어서 유의한 차이를 보여, 대립형질 중 하나에만 혼성화하도록 설정되어야 한다.
본 발명의 프로브 폴리뉴클레오티드를 기판 상에 고정시키는 단계도 또한 당업계에 알려진 방법으로 용이하게 제조할 수 있다. 또한, 마이크로어레이 상에서의 핵산 혼성화 및 혼성화 결과의 검출 방법 역시 당업계에 알려진 방법대로 수행될 수 있다. 예를 들면, 핵산 시료를 검출 가능한 신호를 발생시키는 표지 물질(예를 들어, 형광물질)로 표지한 다음 마이크로어레이 상에 혼성화하고 상기 표지물질로부터 발생하는 신호를 검출함으로써 혼성화 결과를 검출할 수 있다.
또한, 본 발명은 폐암 감수성을 예측 및 판단하는 방법을 제공한다.
보다 구체적으로,
1) 피검체로부터 핵산시료를 수득하는 단계;
2) 수득한 핵산시료로부터 서열번호 1의 1316번째 (HER-2 유전자의 번역시작점으로부터 -3444번째) 염기 또는 서열번호 1의 2771번째 (HER-2 유전자의 번역시작점으로부터 -1985번째) 염기 또는 서열번호 1의 32301번째 (HER-2 유전자의 1170번째 코돈에서 1번째 염기) 염기 다형성 부위를 증폭하는 단계; 및
3) 상기 2)에서 증폭된 다형성 부위의 염기를 결정하여 폐암 발생 위험도를 분석하는 단계를 포함하는 폐암 감수성 예측 및 판단 방법을 제공한다.
본 발명에서의 용어 "핵산시료"는 DNA(gDNA, cDNA) 그리고 RNA 분자를 포괄적으로 포함하는 의미를 갖는다.
본 발명의 방법에서 출발물질이 gDNA인 경우, gDNA의 분리는 당업계에 공지 된 통상의 방법에 따라 실시될 수 있다(참조: Rogers & Bendich (1994)). 출발물질이 mRNA인 경우에는, 당업계에 공지된 통상의 방법에 총 RNA를 분리하여 실시된다(참조: Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001); Tesniere, C.et al., Plant Mol. Biol. Rep., 9:242(1991); Ausubel, F.M. et al., Current Protocols in Molecular Biology, John Willey & Sons(1987); 및 Chomczynski, P. et al., Anal. Biochem. 162:156(1987)). 분리된 총 RNA는 역전사효소를 이용하여 cDNA로 합성한다.
본 발명의 방법에 있어서, 피검체로부터 DNA를 분리하는 방법은 당업계에 알려진 방법을 통하여 이루어질 수 있다. 예를 들면, 조직 또는 세포로부터 DNA를 직접적으로 정제하거나 PCR과 같은 증폭 방법을 사용하여 특정한 영역을 특이적으로 증폭하고 이를 분리함으로써 이루어질 수 있다. 본 발명에 있어서, DNA란 DNA 뿐만 아니라 mRNA로부터 합성되는 cDNA도 포함하는 의미이다. 피검체로부터 핵산을 얻는 단계는 예를 들면, PCR 증폭법, 리가제 연쇄 반응(LCR)(Wu 및 Wallace, Genomics 4, 560(1989), Landegren 등, Science 241, 1077(1988)), 전사증폭(transcription amplification) (Kwoh 등, Proc. Natl. Acad. Sci. USA 86, 1173(1989)) 및 자가유지 서열 복제 (Guatelli 등, Proc. Natl. Acad. Sci.USA 87, 1874(1990)) 및 핵산에 근거한 서열 증폭 (NASBA)이 사용될 수 있다.
분리된 DNA의 염기서열의 결정은 당업계에 알려진 다양한 방법에 의하여 이루어질 수 있다. 예를 들면, 디데옥시 법에 의하여 직접적인 핵산의 뉴클레오티드 서열의 결정을 통하여 이루어지거나 단일 염기 다형성 부위의 서열을 포함하는 프로브 또는 그에 상보적인 프로브를 상기 DNA와 혼성화시키고 그로부터 얻어지는 혼성화 정도를 측정함으로써 다형성 부위의 뉴클레오티드 서열을 결정하는 방법 등이 이용될 수 있다. 혼성화의 정도는 예를 들면, 검출가능한 표지를 표적 DNA에 표지하여, 혼성화된 표적 DNA 만을 특이적으로 검출함으로써 이루어질 수 있으나, 그 외 전기적 신호 검출방법 등이 사용될 수 있다.
다형성 부위를 증폭하는 단계는 당업계에 공지된 다양한 방법을 응용하여 실시될 수 있다. 예를 들어, 본 발명에 응용될 수 있는 기술은, 본 발명의 방법에 이용될 수 있는 증폭 기술은 PCR증폭 (참조: Miller, H. I. (WO 89/06700) 및 Davey, C. et al. (EP 329,822)), 리가아제 체인 반응 (LCR, Wu, D.Y. et al., Genomics 4:560 (1989)), 중합효소 리가아제 체인 반응 (Barany, PCR Methods and Applic., 1:5-16(1991)), Gap-LCR (WO 90/01069), 리페어 체인 반응 (EP 439,182), 3SR (Kwoh et al., PNAS, USA, 86:1173(1989)) 및 NASBA (U.S. Pat. No. 5,130,238)을 포함하나, 이에 한정되는 것은 아니다. 가장 바람직하게는 PCR 증폭에 따라 증폭한다.
염기를 결정하는 단계는 당업계에 공지된 다양한 방법을 응용하여 수행될 수 있다. 예를 들어, DNA 서열분석 (sequencing), PCR-SSCP (single stranded conformation polymorphism) 분석, PCR-RFLP (restriction fragment length polymorphism) 분석, SNP-IT (single-nucleotide polymorphism-identification technology) 분석, 대립형질 (allele) 특이적 혼성화 방법, DNA 칩 방법, ELISA (enzyme-linked immunosorbent assay) 방법 및 면역블랏 (immunoblot) 방법, SNaPShot 분석 방법, TDGS(Two-dimensional Gene Scanning), Taq-Man®및 TOGATM 으로 구성된 군으로부터 선택된 하나 이상의 방법에 의해 수행되는 것을 특징으로 하는 방법을 포함하나, 이에 한정되는 것은 아니다.
상기 SNP-IT 분석 방법은 미국 Beckman Coulter사의 SNP scoring technology로서, 이하 5단계를 거친다. 1. PCR; 한쪽 방향에 Phosphorothioate 처리된 primer를 이용하여 SNP가 포함된 Fragment를 증폭한다. 2. Exonuclease처리; PCR product에 Exonuclease를 처리하여 one strand만 남긴다. (다만, Phosphorothioate가 달려있는 strand는 Exonuclease로부터 보호된다) 3. Hybridization; SNP 바로 앞까지 붙을 수 있도록 고안된 Genotyping primer가 부착되어 있는 plate에 one strand만 남긴 PCR Product를 옮긴다. 4. Extension; Genotype으로 나올 수 있는 조합에 해당하는 extension mix를 첨가한다. 5. Detection; Extension된 산물에 Anti-Fluorescein-AP 또는 streptavidin-HRP를 binding시킨 후 여기에 substrate로서 PNPP(p-Nitrophenyl Phosphate) 또는 TMB(3,3',5,5'-tetramethylbenzidine)를 반응시킨다. 6. Analysis; 발색반응으로 나오는 각각의 absorbance 값은 fluorstar plate reader가 읽어 자동으로 결과를 내게 되고 analysis program(QC Review)상에 서 결과를 확인한다.
SNP-IT 분석 방법은 SNPstream 25K system (Orchid Biosciences, Princeton, NJ)을 이용하여 분석하는 것으로 PCR 이후의 모든 과정이 완전 자동화 되어 있다.
본 발명에서는 바람직하게는 -3444 C>T 단일 염기 다형성의 유전자형 분석 프라이머로 5'-TGT CCG GAA AGG TTA GTC CAG TCA G-3' (25mer) (역방향; 서열번호 8)와 P1170A C>G 단일 염기 다형성의 유전자형 분석 프라이머로 5'--ACC TGC TGG TGC CAC TCT GGA AAG G-3' (25mer) (역방향; 서열번호 9)를 사용할 수 있다.
폐암 발생의 위험도를 분석하는 단계는 당업계에 공지된 다양한 방법을 응용하여 수행될 수 있다. 예를 들어, 스튜던트 t -검정 (Student's t-test), 카이-스퀘어 검정 (Chi-square test) 및 다중 로지스틱 회귀 분석 (multiple logistic regression analysis)으로 구성된 군으로부터 선택된 하나 이상의 방법에 의해 수행되는 것을 특징으로 하는 방법을 포함하나, 이에 한정되는 것은 아니다.
예를 들어, 폐암 발생의 위험도 분석에 있어서 오즈비와 95% 신뢰구간의 결과가 폐암 발생의 위험도를 분석하는 기준이 된다.
상기 오즈비는 대조군에서 해당 단일 염기 다형성/일배체형을 가질 확률에 대한 환자군 중에서 해당 단일 염기 다형성/일배체형을 가질 확률의 비율을 나타낸다. 오즈비가 1을 초과하는 경우 해당 단일 염기 다형성/일배체형이 환자군과 연관성이 있음을 나태낸다. 오즈비가 클수록 상기 연관성도 증가한다.
상기 95% 신뢰구간은 해당 오즈비가 존재할 확률이 95%인 구간을 나타내는 것이다. 즉, 신뢰구간의 하계가 1이하이고 상계가 1이상인 경우에는 질병과의 연관성을 유의하다고 판단할 수 없다.
p-value< 0.05일 때 폐암과의 연관성이 유의하다고 판단할 수 있다. 즉, 위험도 오즈비가 유의한 것으로 판단할 수 있다.
보다 구체적으로 본 발명에서 상기 3)단계에서 결정된 서열번호 1의 1316번째(HER-2 유전자의 번역시작점으로부터 -3444번째) 염기가 T이거나, 서열번호 1의 2771번째 (HER-2 유전자의 번역시작점으로부터 -1985번째) 염기가 T이거나, 서열번호 1의 2771번째 (HER-2 유전자의 1170번째 코돈에서 1번째 염기) 염기가 G인 경우에 폐암 발생 위험도가 증가되는 것으로 예측 및 판단할 수 있다.
본 명세서 전체에 걸쳐 다수의 논문 및 특허논문이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당업계에서 통 상의 지식을 가진 자에 있어서 자명할 것이다.
이상, 상기에서 살펴본 바와 같이, 본 발명 HER-2 유전자 상에 위치하는 -3444 C>T, -1985 G>T, P1170A C>G 3 다형성은 폐암 발생 위험도와 밀접한 관계를 나타내므로 폐암 발암 고위험군에 속하는지 여부의 예측 및 선별이 가능하도록 마커로 사용될 수 있으며, 이를 탐색할 수 있는 키트는 장차 폐암의 특정 환자군에 대한 조기진단 및 치료분야에 유용하게 이용될 수 있다.
실시예 1. 피검자의 선정 및 측정
본 연구는 2001년 8월과 2005년 6월 사이에 폐암 및 유방암, 난소암 유전체센터/고려대 병원 (안암, 안산, 구로), 인하대 병원에서 폐암 진단받은 환자군 407명과 심혈관 유전체센터, 알러지/호흡계질환 유전체센터와 계명대 동산 병원에서 모집된 정상군 407명에게서 동의서를 받아 진행되었다. 식이, 흡연, 음주와 과거병력 등을 인터뷰를 통해 확인하였다. 본 연구는 해당기관의 생명윤리 심의위원회 심의를 통과하여 진행되었다. 모든 참여자로부터 내용설명 동의서를 받았다. 본 연구에 참여자 환자군과 정상군 모두 한국인이였다.
피검자들의 임상학적 특징을 하기 표 1에 나타내었다.
<표 1> 폐암 환자 및 정상 대조군의 임상학적 특징
특징 대조군 실험군 p -value
연령 n = 407 n = 407
평균 연령 60.8 60.8
범위 30 - 84 30 - 78
성별, n , (%) n = 407, (%) n = 407, (%)
남성 302, (74.2) 303, (74.5) 0.94
여성 105, (25.8) 104, (25.6)
흡연, n , (%) n = 309, (%) n = 396, (%)
비흡연자 162, (52.4) 108, (27.3) <0.0001
흡연자 147, (47.6) 288, (72.7)
음주, n , (%) n = 224, (%) n = 310, (%)
금주자 78, (34.8) 118, (38.1) 0.44
음주자 146, (65.2) 192, (61.9)
OR, odds ration; CI, confidence interval.
실시예 2. genomic DNA 준비와 HER-2 유전자의 direct sequencing
Puregene blood DNA kit (Gentra, Minneapolis, MN)을 사용하여 환자군과 정상군의 말초 혈액을 채취하여 gDNA를 준비하였다.
한국인의 HER-2 유전자의 다형성 사이트를 확인하기 위해, 폐암환자 말초혈액의 gDNA를 기초로 direct sequencing을 통해 HER-2 유전자의 프로모터 부위에 (~2Kbp) 존재하는 단일 염기 다형성을 발굴하였다. PCR 증폭은 AmpliTagGold (Roche, Branchburg, NJ)을 사용하여 PTC-225 Peltier Thermal cycler (MJ Research Inc, Waltham, MA)를 통해 수행하였다. 모든 증폭은 95℃에서 30초, 64℃ 1분, 72℃ 1분에서 35 cycle 후 72℃에서 10분간 수행되었다. PCR 생성물은 Montage PCR96 Cleanup kit (Millipore, Bedfore, MA)를 사용하여 정제하고 20㎕ nuclease free water로 희석시켰다. BigDye Terminator V 3.1 Cycle Sequencing kit (Perkin Elmer, Foster City, CA)를 사용하여 sequencing을 하였다. Multiscreen SEQ 384 well filter plates(Millipore, Bedfore, MA)를 사용하여 dye terminator를 제거하였고, Applied Biosystems 3700 DNA analyzer(Applied Biosystems, Foster City, CA)를 사용하여 서열을 분석하였다. 모든 단일 염기 다형성과 서열은 Polyphred software (http://droog.gs.washington.edu/polyphred)를 사용하여 분석하였다.
실시예 3. 유전자형 분석
HER-2 다형성의 유전자형 분석은 Polymerase chain reaction-restriction fragment length polymorphism (PCR-RFLP) 와 single-nucleotide polymorphism-identification technology (SNP-IT) 기법에 따라 수행하였다. 1985 G>T는 PCR-RFLP에 의해 분석하였고, -3444 C>T 와 P1170 C>G SNPs는 SNP-IT 기법으로 분석하였다.
3-1. 피검자의 genomic DNA 준비
Puregene blood DNA kit (Gentra, Minneapolis, MN)를 사용하여 814명의 혈액으로부터 genomic DNA를 추출하였다.
3-2. 표적 DNA의 증폭 및 SNP 분석
표지유전자를 한 번의 PCR 반응과 효소처리로서 유전자형을 탐색 진단해 낼 수 있는 효율적인 방법의 하나로써 PCR-RFLP 방법을 이용하였다. Restriction mapper sofrware program을 이용해서 새롭게 밝혀낸 SNP부위를 인식할 수 있는 제한효소(Restriction enzyme)를 찾아내었고, 그렇게 찾아낸 제한효소의 처리에 따라서 다르게 나타나는 band 길이를 통해 유전자형을 알아내었다.
-1985 G>T SNP는 PCR-RFLP 방법을 이용하여 분석하였다.
PCR 반응시 프라이머는 정방향 (5'-ACC CCA GCA TAG TAT GTC AGA TG-3')(서열번호 4)와 역방향 (5'-ATC CTA GGG AGT TGA GAA ACA GG-3')(서열번호 5)로 제작하여 각각 1㎕(20pmol/㎕)씩 첨가하였고, 그 외의 반응 첨가물은 10×PCR buffer(100mM Tris-Cl; pH 8.3, 500mM KCl, 15mM Mg2Cl) 5㎕, 10×dNTP mix(each 25mM) 5㎕, 10×Enhancer 5㎕, Taq DNA polymerase(5 unit/㎕; Genenmed) 0.5㎕ 와 ddH2O 30.5㎕, Template DNA 2㎕(약 100ng)였다. PCR 반응에는 GeneAmp PCR system 2400(Perkin-Elmer Co., USA)기기를 사용하였고, PCR 반응조건은 94℃에서 5분간 pre-denaturation 한 후, 94℃에서 denaturation 1분, annealing 60℃ 1분, extension 72℃ 1분을 한 cycle로 하여 35cycle을 반복한 후, 마지막으로 72℃에서 15분으로 PCR 반응을 종료하였다.
이렇게 확보된 HER-2을 estriction mapper sofrware program을 이용해서 찾아낸 Xmn I 제한효소로 처리하였다. Xmn I 제한효소 처리 첨가물은 Xmn I 제한효소 2㎕(2 unit/㎕, NEB(New England BioLabs)), 10×Enzyme buffer 1.5㎕, 10×BSA 1.5㎕, 10×S-adenosylmethionine(SAM, 200㎛/㎕) 1.5㎕, ddH2O 5.5㎕, PCR product 3㎕로 총 volume이 15㎕였다. 이 혼합물을 25℃ Incubator에서 약 16시간 동안 반응시키고, PAGE(Poly-acrylamide Gel Electrophoresis)를 이용하여 3% gel electrophoresis으로 band를 분리하여 그 band pattern을 확인하였다(도 3).
그 결과, Xmn I 제한효소 싸이트에 C allele가 있는 경우 즉, -1590번째 유전자형이 T인 경우에는 470bp 절편이 370 bp 절편과 100 bp 절편으로 절단된다. 유전자형이 G인 경우에는 Xmn I 로 절단되지 않으므로 470 bp 길이의 단일 밴드로 나타난다. 또한, the heterozygous genotype (TG)의 경우에는 세개의 절단 밴드(470, 370, and 100 bp)가 나타난다.
또한, SNP-IT assay을 이용하여 유전자형을 분석하였다.
-3444 C>T 및 P1170 C>G SNPs 유전자형 분석은 stream 25K System (Orchid Biosciences, Princeton, NJ)을 사용하여 SNP-IT assay으로 수행하였다. 하나의 포스포로티올레이티드 프라이머 (-3444; 5'- TGG CAC AGA GTA GGG TCC-3'(18mer), P117A; 5'- TTT CAG AAT ATG TGA ACC AGC C-3' (22mer))와 일반 프라이머(-3444; 5'- ACC CCT GCC CTG CTG TTG-3' (18mer), P117A; 5'- AAA AAC GTC TTT GAC GAC CC-3' (20mer))로 SNP 영역을 PCR 증폭하였다.
증폭된 PCR 산물을 T7 Gene 6 Exonuclease (Amersham Biosciences, USA)으 로 처리하면, PCR 산물 중 포스포로티올레이티드 가닥만이 남는다. SNP 영역 부근에 즉시 혼성화할 수 있도록 디자인된 SNP-IT extension primer (-3444; genotyping primer 5'- TGT CCG GAA AGG TTA GTC CAG TCA G-3' (25mer),and P1170A; 5'-ACC TGC TGG TGC CAC TCT GGA AAG G-3' (25mer))를 부착한 a 384-well plate 내로 포스포로티올레이티드 가닥인 single-stranded PCR template를 옮겼다. Genotype으로 나올 수 있는 조합에 해당하는 extension mix (fluorescein isothiocyanate (FITC) 혹은 biotin이 tagging한 dideoxynucleotide 혼합물과 DNA polymerase)를 첨가하고 The SNP-IT primer를 사용하여 extention 과정을 거쳤다. Extension된 산물에 Anti-Fluorescein-AP(Roche Diagnostics Corp, Indianapolis, Ind) 또는 streptavidin-HRP(BioLegend Corp., San Diego, CA)를 binding시킨 후 여기에 substrate로서 PNPP (Thermo Sientific, Rockford, IL)또는 TMB (Thermo Sientific, Rockford, IL)를 반응시켰다. 파란색 혹은 노란색 발색반응으로 나오는 각각의 absorbance 값은 an ELISA reader가 읽어 자동으로 결과를 내게 되고 analysis program(QC Review)상에서 결과를 확인하였다.
실시예 4. 본 발명의 kit를 이용한 폐암 발암 위험성 진단
이하는 상기 분석 방법을 통해 본 발명의 kit를 이용하여 IGFBP-3 프로모터 단일 염기 다형성 과 폐암 발생 위험도와의 연관성을 분석한 결과를 나타낸 것이다.
<표 2> 한국인 집단 내에서 HER-2 유전자의 단일 염기 다형성 빈도와 폐암 감수성과의 관련성
Genotype Case ( n =407) Control ( n =407) asOR (95% CI) a p-value
-3444 C>T CC 141 140 1
CT 201 205 0.97 (0.72 - 1.32) 0.86
TT 65 62 1.04 (0.68 - 1.58) 0.85
CT+TT 266 267 0.99 (0.74 - 1.32) 0.94
CC+CT 342 345 1
TT 65 62 1.06 (0.72 - 1.55) 0.77
-1985 G>T GG 144 140 1
GT 196 205 0.93 (0.69 - 1.26) 0.64
TT 67 62 1.05 (0.69 - 1.59) 0.82
GT+TT 263 267 0.96 (0.72, 1.28) 0.77
GG+GT 340 345 1
TT 67 62 1 0.63
I655V A>G AA 304 300 1
AG 97 97 0.99 (0.71 - 1.36) 0.93
GG 5 6 0.82 (0.25 - 2.72) 0.75
AG+GG 102 103 0.98 (0.71 - 1.34) 0.88
AA+AG 401 397 1.00
GG 5 6 0.83 (0.25 - 2.73) 0.75
P1170A C>G CC 144 137 1
CG 199 206 0.92 (0.68 - 1.25) 0.59
GG 64 64 0.95 (0.63 - 1.45) 0.82
CG+GG 263 270 0.93 (0.69 - 1.24) 0.61
CC+CG 343 343 1
GG 64 64 1.00 (0.69 - 1.46) 1
OR, odds ratio; CI, confidence interval.
aasOR are adjusted for age and gender.
<표 3> 성별, 흡연력, 음주력에 따른 HER-2 유전자 단일 염기 다형성 빈도와 폐암 감수성과의 관련성 비교 분석
Female Genotype Cases (n=104) Controls (n=105) OR (95% CI) p-value asOR (95% CI) a p-value
-3444 C>T CC 35 39 1   1
CT 50 58 0.96 (0.53 - 1.74) 0.89 0.94 (0.51 - 1.72) 0.85
TT 19 8 2.65 (1.03 - 6.80) 0.04 2.23 (0.85 - 5.84) 0.10
CT+TT 69 66 1.17 (0.66 - 2.06) 0.60 1.11 (0.62 - 1.98) 0.73
CC+CT 85 97 1   1  
TT 19 8 2.71 (1.13 - 6.51) 0.03 2.31 (0.95 - 5.64) 0.07
-1985 G>T GG 36 39 1   1
GT 49 57 0.93 (0.52 - 1.68) 0.81 0.93 (0.51 - 1.70) 0.81
TT 19 9 2.29 (0.92 - 5.70) 0.08 1.93 (0.76 - 4.91) 0.17
GT+TT 68 66 1.12 (0.63 - 1.97) 0.70 1.07 (0.60 - 1.92) 0.81
GG+GT 85 96 1   1  
TT 19 9 2.38 (1.02 - 5.55) 0.04 2.02 (0.85 - 4.78) 0.11
P1170A C>G CC 37 37 1   1
CG 49 58 0.85 (0.47 - 1.53) 0.58 0.84 (0.46 - 1.55) 0.59
GG 18 10 1.80 (0.73 - 4.42) 0.20 1.57 (0.63 - 3.91) 0.34
CG+GG 67 68 0.99 (0.56 - 1.74) 0.96 0.96 (0.53 - 1.72) 0.88
CC+CG 86 95 1   1  
GG 18 10 1.99 (0.87 - 4.54) 0.10 1.73 (0.75 - 4.02) 0.20
Non-smoker Genotype Cases (n=108) Controls (n=162) OR (95% CI) p-value asOR (95% CI) b p-value
-3444 C>T CC 36 61 1   1
CT 48 83 0.98 (0.57 - 1.69) 0.94 0.99 (0.56 - 1.74) 0.96
TT 24 18 2.26 (1.08 - 4.72) 0.03 2.67 (1.20 - 5.91) b 0.02
CT+TT 72 101 1.21 (0.73 - 2.01) 0.47 1.25 (0.73 - 2.14) 0.41
CC+CT 84 144 1   1  
TT 24 18 2.29 (1.17 - 4.46) 0.02 2.69 (1.30 - 5.56) b 0.01
-1985 G>T GG 37 61 1   1
GT 47 82 0.94 (0.55 - 1.63) 0.84 0.97 (0.55 - 1.71) 0.91
TT 24 19 2.08 (1.01 - 4.31) 0.05 2.41 (1.10 - 5.27) b 0.03
GT+TT 71 101 1.16 (0.70 - 1.93) 0.57 1.21 (0.71 - 2.07) 0.48
GG+GT 84 143 1   1  
TT 24 19 2.15 (1.11 - 4.16) 0.02 2.46 (1.20 - 5.01) b 0.01
P1170A C>G CC 37 58 1   1
CG 48 84 0.90 (0.52 - 1.54) 0.69 0.89 (0.50 - 1.57) 0.68
GG 23 20 1.80 (0.87 - 3.73) 0.11 2.05 (0.94 - 4.47) 0.07
CG+GG 71 104 1.07 (0.64 - 1.78) 0.79 1.09 (0.64 - 1.86) 0.76
CC+CG 85 142 1   1  
GG 23 20 1.92 (1.00 - 3.71) 0.05 2.20 (1.08 - 4.47) b 0.03
Non-drinker Genotype Cases (n=118) Controls (n=78) OR (95% CI) p-value asOR (95% CI) b p-value
-3444 C>T CC 38 23 1   1
CT 51 47 0.66 (0.34 - 1.26) 0.21 0.69 (0.35 - 1.35) 0.28
TT 29 8 2.19 (0.86 - 5.61) 0.10 2.85 (1.06 - 7.69) b 0.04
CT+TT 80 55 0.88 (0.47 - 1.64) 0.69 0.96 (0.51 - 1.82) 0.90
CC+CT 89 70 1   1  
TT 29 8 2.85 (1.23 - 6.62) 0.01 3.60 (1.47 - 8.84) b 0.01
-1985 G>T GG 39 23 1   1
GT 50 47 0.63 (0.33 - 1.20) 0.16 0.67 (0.34 - 1.31) 0.24
TT 29 8 2.14 (0.84 - 5.46) 0.11 2.81 (1.04 - 7.56) b 0.04
GT+TT 79 55 0.85 (0.46 - 1.57) 0.60 0.94 (0.50 - 1.78) 0.85
GG+GT 89 70 1   1  
TT 29 8 2.85 (1.23 - 6.62) 0.01 3.60 (1.47 - 8.84) b 0.01
P1170A C>G CC 40 22 1   1
CG 50 48 0.57 (0.30 - 1.10) 0.10 0.61 (0.31 - 1.21) 0.16
GG 28 8 1.93 (0.75 - 4.94) 0.17 2.64 (0.97 - 7.18) 0.06
CG+GG 78 56 0.77 (0.41 - 1.43) 0.40 0.86 (0.45 - 1.63) 0.64
CC+CG 90 70 1   1  
GG 28 8 2.72 (1.17 - 6.34) 0.02 3.59 (1.46 - 8.88) b 0.01
OR, odds ratio; CI, confidence interval.
a aOR are adjusted for age.
b asOR are adjusted for age and gender.
대립형질 빈도 (allele frequency)와 유전자형 빈도를 구해 단일 염기 다형성을 이용하여 하디-와이버그 평형 (Hardy-Weinberg equilibrium; HWE)여부를 확인하였다. p-value < 0.05일때 하디-와이버그 평형이 성립하는 것으로 보았다. Linkage disequilibrium (LD)분석 (D′)은 Haploview program version 3.2을 사용하였다. 유전자형과 일배체형의 빈도수는 SAS 프로그램(SAS Institute, Cary, NC)을 이용하여 나이, 성별, 흡연 상태를 고려하여 보정한 오즈비 (Odd ratio; OR), 95% 신뢰구간 (95% CI)과 p-value를 구하여 폐암 발생 위험도와의 연관성을 확인하였다. 또한, 본페로니 분석 방법 (p c value)으로 엄격한 다중 분석을 시행하였다. 신뢰구간의 상, 하안값이 1을 포함하지 않고 p-value < 0.05일때 폐암과의 연관성분석 즉, 위험도 오즈비율이 유의한 것으로 판단한다.
표 2에서 나타나는 바와 같이 각 단일 염기 다형성의 대립 형질들과 폐암 감수성 간에는 환자군과 대조군에서 유의적인 차이를 보이지 않았다 (표 2의 overall).
그러나 성별, 흡연력, 음주력을 변수로 하여 분석한 결과 -3444 C>T에서 T 유전자형, -1985 G>T에서 T 유전자형을 가진 여성 (-3444; OR=2.71 (1.13 - 6.51) p-값=0.026, -1985; OR=2.569(0.985 - 6.702) p-값=0.044, 및 -3444 C>T에서 T 유전자형, -1985 G>T에서 T 유전자형, P1170A C>G에서 G 유전자형을 가진 비흡연자 (-3444; OR=2.29(1.17 - 4.46) p-값=0.015, asORb=2.69(1.30 - 5.56) p-값=0.008, -1985; OR=2.15(1.11 - 4.16) p-값=0.023, asORb=2.46(1.20 - 5.01) p-값=0.014, P1170; OR=1.92(1.00 - 3.71) p-값=0.051, asORb=2.20(1.08 - 4.47) p-값=0.029) 및 비음주자 (-3444; OR=2.85(1.23 - 6.62) p-값=0.015, asORb=3.60(1.47 - 8.84) p-값=0.005 , -1985; OR=2.85(1.23 - 6.62) p-값=0.025, asORb=3.60(1.47 - 8.84) p-값=0.005, P1170; OR=2.72(1.17 - 6.34) p-값=0.020, asORb=3.59(1.46 - 8.88) p-값 =0.006)에게서 단일 염기 다형성과 폐암 감수성간에 관련성이 있음을 알 수 있다. 즉, 한국인 여성, 비흡연자, 비음주자 집단에서 -3444 C>T에서 T 유전자형, -1985 G>T에서 T 유전자형, P1170A C>G에서 G 유전자형을 가진 경우 폐암 발병 가능성이 높게 나타났다 (표 3의 Females, Non-smokers, Non-drinkers).
본 발명 HER-2 유전자 상에 위치하는 -3444 C>T, -1985 G>T, P1170A C>G 다형성은 폐암 발생 위험도와 밀접한 관계를 나타내므로 폐암 발암 고위험군에 속하는지 여부의 예측 및 선별이 가능하도록 마커로 사용될 수 있으며, 이를 탐색할 수 있는 키트는 장차 폐암의 특정 환자군에 대한 조기진단 및 치료분야에 유용하게 이용될 수 있다.
도 1a은 HER-2 유전자상의 SNPs 위치를 나타낸 것이다. 1에서 6까지 5'에서 3' 방향으로 번호를 매긴 것이다. [1, rs2643194; 2, rs2517951; 3, rs2643195; 4, rs2934971; 5, rs1801200; 6, rs1058808] 화살표 +1는 번역 시작점을 표시한 것이고 엑손은 작은 블록들로 나타내었다.
도 1b는 6개의 단일 염기 다형성 들 상호 간에 연관 불균형 상태에 있는지 여부를 검토한 결과이다. 강한 연관 불균형 상태에 있는 쌍들은 어둡게 표시하였다. 특히, 세개의 단일 염기 다형성 (1,2,3)은 완벽히 연관 불균형상태에 있다.
도 2는 HER-2 유전자의 -1985 번째 단일 염기 다형성 부위를 Xmn I 제한 효소로 절단하였을 때 대립인자의 유전자형에 따른 DNA 절편의 표현형을 나타낸 것이다.
도 3은 HER-2 유전자의 -1985 번째 단일 염기 다형성 부위를 Xmn I 제한 효소로 절단하였을 때 PCR-RFLP 분석 결과를 나타낸 것이다.
<110> Korea university industry and academy collaboration foundation <120> Makers for the diagnosis of susceptibility to lung cancer using HER-2 gene and method for predicting and analyzing susceptibility to lung cancer using the same <150> US61042761 <151> 2008-04-06 <160> 9 <170> KopatentIn 1.71 <210> 1 <211> 33179 <212> DNA <213> NC_000017:35093919-35138441 Homo sapiens chromosome 17 <400> 1 cctcaagcct actctgagga actctttcca atgaactaat tcctacagtc acttccccag 60 caacctgtgc ctcagcctca aggcactgtg gggtaggcct cagtttgtgg cctggacatc 120 ggactgtgga ccagacgact cctcccgatt tctgtttgtt ttcagtcctc tgaccccaag 180 ctggctggtg aagtaggtag agggaggaga ctttggtgca tgcatacaca cacacacaca 240 cacacacaca cacacacaca cacacacaca cacacacacg tctcctgtgc cccccagtct 300 ccatggctgg tcaatgattg actggcattt cacaggccgc tggttgcagc cccagcctgt 360 tgacttagag gtcaccctcg gaagctagag ccctgtcctg cctcttcagt gtcagtggtc 420 actccactgc ccacaggctg gggtcttggg caaaacacac gcatctgccc tgatctgagt 480 ttgctgccct ctgtcccgca gtcagcccca ctctgttccc actccctctc cccagccccc 540 tagctagacc cctctcacca gcaccccttt cccttccctg agggtccccc tcgctgtctt 600 tgtccctcag acatcctctt tcctgggctc tcctgccagg ccctgctgga gggacagtta 660 aggaggaaat cgaatcagca gcgcccaccc ctgcccccct tcctctcctc ttgtcagaca 720 ccagacgagg ttttttcctc tggcttccca gctctgaatg ggctcattct ttttcagagg 780 ctcggcccct ctcgagcctc ctccccaggg cgtgagttct gaccccagct cctcccccca 840 tccccactcc agccccctct ccagcttgct ccaccctctc taccgcccac cgggactggg 900 cattgtctgc cagtccgggt ttcttcctgg gatttgggat gcagagagga tgggtttgct 960 tgggcggggg ggtggagagt gaagggggga agcaggatct ttgtagaggg agggacctac 1020 agttacctgg acttctttcc tctgtctccc ctcttggtac ccttgactgg ggctcttgag 1080 ggtaatgggt gaagccaaat ctgccatggc tcagttccca gctcagctct gtgaccttgg 1140 gaaagttcct ttagctcgtg gaatctcaag gctcaaggtt cctcttctgc aaaatgggga 1200 atgataacac ctgcctcctc tggagtcttg gggactcagt gttctgagga acgtggctgt 1260 aggtcagagt ggcacagagt agggtccaat gaagcatggc gtccacagta gctttcctga 1320 ctggactaac ctttccggac acaacagcag ggcaggggtg gggcggggag aaaggacacc 1380 tctacctgat cctaacatcc cgatggcctc taaggctgcc tgcacactca tccaggtgca 1440 agccctccaa ggtgtggtgt gatgaaccag tgactcctgg agccaggtca gcgcatcctc 1500 ttcccgcagg gctgtaagct gcaggactga gaggcaggtt gaccaggtcc tgggctggat 1560 gatggggtga gagtaagggg tcagttttga tacatgccca acttttctct ctagccctaa 1620 gacatcctgg gcaaattgct tacctcagtt cccctgatcc tcaccctaac cctaacacca 1680 gctcaagaga aaatagggat attgatggcc atccagaagg gctgctgtgt tccatacaca 1740 gcaatatttc tcgaatgttt gtgacagcgg tccaaggaat aagttaattt tacattatca 1800 ctctggatac ctgtacaaaa ctccacctta tccttactat atgaatgtgc tagggttgtt 1860 tttttgtttt gttttttttt tttttttttg agacagagtt tcgctcttgt tgcccaggct 1920 ggagtacaat ggcgcgatct tggctcaccg caacctccgc ttcccaggtt caagcgattc 1980 acctgcctca gccttcccga gtagctggga ttacaggcat gcgccaccat gcccggctaa 2040 ttttgtgttt ttagtagaga cagggtttct ccatgttggt caggctggta ccaaactccc 2100 gacctcaggt gatccacctg ccttggcctc ccaaagtgct gcaattacag gcatgagcca 2160 ccgcacccag ccgtgctagg gtctttttct gttcaattcc tttctctctc ttgctctctt 2220 tctttctttc aatggagtct tactctgtca cccaggctgg agtgcagtgg caagatctca 2280 gctcactgca acctctgccc tctgagttca agcaattctc ctgcctcagc ctcccgagta 2340 gctgggatta caggtgcctg ccaccacacc tagttaattt ttgtactttt agtagagatg 2400 gggttttgtc atgttggcca ggctggtctc gaactcctga cctcgtgatc tgcctgtctt 2460 ggcctcccaa agtgctggga ttacaggcat gagccgccat actcggccaa ctttgtatta 2520 ctttcttaaa gagagtttcc caaattatat aagcttcagg ccccacaaaa cctagatctg 2580 ccccagtata actaaatctg ggaccattta ttgagcaatt attatgtgcc aagtattgcg 2640 ctgagtgctt ccagagcatt atctccttta accccagcat agtatgtcag atgctgtttt 2700 acagatgagc caactgagac cagagatgct cagtcacttg cccaaggtga catgactgat 2760 atggaataga gtcaagattt tttttttttt ttttgacacg gagtctcact ctgtctccca 2820 ggctggagtg cagaggcgca atctcagctc actgcaagct ctgcctccca ggttcacgcc 2880 attctcctgc ctcagcctcc tgagtagctg ggactacagg cacccgccac cacacctggc 2940 taattttttg tatttttagc agagacaggg tttcaccgtg ttagccagga tggtctcgat 3000 ctcctgacct cgtgatctgc ctgcctcggc ctcccaaagt gctggaatta caggtgtgag 3060 ccaccgcgac tggccagatt caagatttga acccaggtcc tcttggtccc agaggcccct 3120 gtttctcaac tccctaggat ggcatagcaa cctgtcccac aagaggtgcc tgctttaagt 3180 gtgctcagca catggaagca agtttagaaa tgcaagtgta tacctgtaaa gaggtgtggg 3240 agatgggggg gagggaagag agaaagagat gctggtgtcc ttcattctcc agtccctgat 3300 aggtgccttt gatcccttct tgaccagtat agctgcattc ttggctgggg cattccaact 3360 agaactgcca aatttagcac ataaaaataa ggaggcccag ttaaatttga atttcagata 3420 aacaatgaat aatttgttag tataaatatg tcccatgcaa tatcttgttg aaattaaaaa 3480 aaaaaaaaaa agtcttcctt ccatccccac ccctaccact aggcctaagg aatagggtca 3540 ggggctccaa atagaatgtg gttgagaagt ggaattaagc aggctaatag aaggcaaggg 3600 gcaaagaaga aaccttgaat gcattgggtg ctgggtgcct ccttaaataa gcaagaaggg 3660 tgcattttga agaattgaga tagaagtctt tttgggctgg gtgcagttgc tcgtggttgt 3720 aattccagca ctttgggagg ctgaggcggg aggatcacct gaggttggga gttcaagacc 3780 agcctcacca acgtggagaa accctgtctt tactaaaaat acaaaaaatt agctggtcat 3840 ggtggcacat gcctgtaatc ccagctgctc gggaggctga ggcaggagaa tcacttgaac 3900 cagggaggca gaggttgtgg tgagcagaga tcgcgccatt gctctccagc ctgggcaaca 3960 agagcaaaag ttcgtttaaa aaaaaaaaaa agtcctttcg atgtgactgt ctcctcccaa 4020 atttgtagac cctcttaaga tcatgctttt cagatacttc aaagattcca gaagatatgc 4080 cccgggggtc ctggaagcca caaggtaaac acaacacatc cccctccttg actatcaatt 4140 ttactagagg atgtggtggg aaaaccatta tttgatatta aaacaaatag gcttgggatg 4200 gagtaggatg caagctcccc aggaaagttt aagataaaac ctgagactta aaagggtgtt 4260 aagagtggca gcctagggaa tttatcccgg actccggggg agggggcaga gtcaccagcc 4320 tctgcattta gggattctcc gaggaaaagt gtgagaacgg ctgcaggcaa cccaggcgtc 4380 ccggcgctag gagggacgca cccaggcctg cgcgaagaga gggagaaagt gaagctggga 4440 gttgccactc ccagacttgt tggaatgcag ttggaggggg cgagctggga gcgcgcttgc 4500 tcccaatcac aggagaagga ggaggtggag gaggagggct gcttgaggaa gtataagaat 4560 gaagttgtga agctgagatt cccctccatt gggaccggag aaaccagggg agccccccgg 4620 gcagccgcgc gccccttccc acggggccct ttactgcgcc gcgcgcccgg cccccacccc 4680 tcgcagcacc ccgcgccccg cgccctccca gccgggtcca gccggagcca tggggccgga 4740 gccgcagtga gcaccatgga gctggcggcc ttgtgccgct gggggctcct cctcgccctc 4800 ttgccccccg gagccgcgag cacccaaggt gggtctggtg tggggagggg acggagcagc 4860 ggcgggaccc tgccctgtgg atgccccgcc gaggtcccgc ggccggcggg gccagagggg 4920 cccggacgag ctctcctatc ccgaagttgt ggacagtcga gacgctcagg gcagccgggc 4980 cctggggccc tcgggcggga gggggcagtt acacggcagc ggctcgagat ggcccatcca 5040 agagactggc gctttccagg ctccgagggg ctccgggaac ttgtcaaaga agttctctga 5100 aattgttcag aaagttttcc cgcaaagggt gtattgcgta gagcgcgcgc gcgcgtttcc 5160 ccccttcttg agccccctca agctttctca aagcctttcc agttggcagc ctccgcctcc 5220 ggactggcct gggctggatt ccttgggggg gtcctctgcc ctgcccctcc tccagcccct 5280 ccccgctccc cttcagacga ttttggtttg gttgctcctg cttctggcgg ggtcgggtgt 5340 gtgtgtgtgt ggtggagtgg agggtggcat agcaacctgt cccaaccaga gccggggagg 5400 aaagggtggc ccggagggtg gcctcttgct ggggtctggg ttgggggcgg gggagacgtt 5460 tgctttgaac agattcttgg ggccagctta gggactgtgc tctgtgactt ttggagcgcg 5520 tggaccatgg aggggtgggg gtgggtttct tggggtgtaa agtgggagag ttcccagaga 5580 aggaagctaa gaaataaggc cagatgggag cctagggagg gctgcgttgt tctgctgcct 5640 tttccttggt gctgtgcgtg gggaagggtg agtgggggca gtgtgtatcc tgacccatct 5700 gtccacctgt gtgcattaat cataaaagct aacatatagc ctgggccagg tatactctgc 5760 caggaactgt ttgtggtgtt ttgcatgcat tctcctttaa tcctagaaca cccctatagt 5820 ggaagttctg ccagcattct ggactgagta gcagtccaga ggttgagtag cagctagtaa 5880 gtggtggggt caagatggga ccccaggcag tgcgaccccc aaccatgcat tcgaaatcgc 5940 tatatggatg agtgcacctg gagcaatgag ggacactgct ccctgagtca ctgggctgca 6000 ggggagacaa aatgaaagtg ttctgggagt cgtgggtggt ctccataggt cagagggtct 6060 ggggagggag tgggtgtcat cgtggctgtg tgttgcccga ggggccctct gtgagtgagt 6120 gcatggccgt gttatctctg caggtctacg ccagggtgtt cctcagttgt gtggtctttg 6180 tatttgtgtg tctgggcttt gtgttgccaa acagcagtct ctctgctgac ttggggacac 6240 aggctgaact ctgtcctctg caggaactcc cttaaggtgc tgggccagat ctgccataaa 6300 cagagggagg tagccttcta tggccacgcc ttcttgctga ggaagaaggt tcctctcttc 6360 cagggagtac atccttgccc tccctgtttc ccagacaagc atcttcacct ctcatcttct 6420 gatgagaagg gtgaggccat actgagctgt caggctgagc tgctgccctt cctcaccttg 6480 ggctgggagt tgatcaggga atggcagttg ctgcagagct ggatttgagg gctgggttct 6540 ctggatgggg cctcctcatg tcctcacccc tcaacctgca ctattgattg tgttgtgcag 6600 gagttagtta aaaagtcatt gcacagcctg ggcaacaagg caaaactctg tacaaaaaat 6660 acaaaaatta gttggatgtg attacacgtg cctgtagtcc cagctactcc ggaggctgag 6720 gcaggaggat cacctgagcc caggaagttg aggcttgcag tgagctgtga ttgcaaatgc 6780 tctccagcct gggtgacagt gtgagactcc gtttcagaaa aaaagtatac cacccagctg 6840 cctccagcac ccagatttta cccaaggggt gaggtctggg gcaggaatgt gggggaaggg 6900 gaggcctagg gggagcccca gaggggtcag gatttttctg aaatcctttc ttagaggtat 6960 gggttttaca aattgcagca aatacatcct tttaatcttg cagaactcct tcatatttta 7020 attccagtat gattcttcca acagcctcct ctctttacta tacttgggga aagtactcat 7080 tttatttgtc aagaaaaaaa caattgaaaa gatagggatc aaatgtaaaa agaaaaaata 7140 cgtggcattc caaagtcaaa cacaaagcat gtttaatttt ctcgtggttt gggattaccc 7200 atattcctgc tgtatgaacc tgtcttgtct taacttttaa gaaatgtacg gtgtacttcc 7260 tatatgctag gtttttatcc atgctttcat ttaatctctg tgacagtcct gtgaagtagg 7320 tgcacagatg agaaaatgga agttcagaga aatgaagcaa cttatccaag gctcccagct 7380 acccagtaat gtccagggaa tttttggact ctgaagagga ggcattaaga ggtggttaga 7440 gtcttattcc agccaacaat aatgggttga acaaagcctt aggggcaggc aggtggccag 7500 atgggaggag aagcgctcct cttgttcagg cgaatgacct ttccatccac ttctctaggc 7560 tgtagaaagt ggagctgagc tgggggccct gaggttccct cttgacttca gagtcctctc 7620 ccttcctgtc cagccaatgc ctgtcttcct tttgggccct accagcatga cagggggctg 7680 cgggcaggag gggacagagg ccacgttgac acacagggct gtgggtgaga gagacagctg 7740 aagtgtcagc gtgaggggcc agtgtggggc tgcggctggg agggctgggg tggggcccag 7800 ggtagttgtg cctgtccttg ggtgatggaa tgatctggaa agagattcct tccctgccct 7860 ccacctgtga gaagcccctc tagagtgaca tctccatctt atgtttggcc acccatcctc 7920 cccctgggaa gagagccgag gtggggtaag ggatgtgtac tctttcaagg agtgggagaa 7980 ttattctagc gaatgtttgt gttgtcccag ttctgtttac aaagcctcgt catgtttaca 8040 gatggctgcg caattcatta cctcatttaa ctctcatgta cctcctctga gggagtaaga 8100 gctgttacag ccaagtttag gtcagtaaat attcaccaag ttgcaggtac tgcagggcat 8160 agagatgaat ccgatttagc ttctgccctg gaggtctggg aacttgctca agatcactca 8220 gtgagcagct gagctagggt tctcaactaa agaccctggg cccaggccct ggtctgatgt 8280 caggcctgat acaccaggtg tttgtggtcg gggaatccca gtgtcacttg aatgggctgt 8340 gacattatgg gtctgggaga gctgagcttt ggggacacag gtcattttac tgtagtattc 8400 atggaaacca agggaagtat tggcttttct gctgtgagca agaggagcag ctggggctgc 8460 aagctggtgg ggaggagaga acccacctga gagaaacctc aggactgggg tcaagtcctg 8520 accaccagag tccagagaga catgaaggac tgtgaccagc tctgagcaga gagatggatt 8580 ccatgacctc aactggtccc ttttgttcgg agactcgtga ctggacttca ttcatccact 8640 cattcattca ttcactcagc agacacttat ctagcgctcc ctgtggctgg tcctgcctca 8700 tactgtcttt gctctggaga attggaggtt ggggttcctg aggggcaggg tcctggagac 8760 aaggacactc ctgggtagaa ttaggaccta ccccccagga aatcaacggg gaccaggtgc 8820 cgtggctcac acctgtaatc ccagcacttt gggaggccga gacgggcgga tcacaaggtc 8880 agcagttcag gaccagcctg gccaacatgg tgaaacccgc ctcaactaaa aatacaaaaa 8940 ttagccaggt gtggtgtcag gcacccgtaa tcccagctac tgaggaggct gaggcaggag 9000 aattgcttga acccgggagg cagaggttgc agtgagccga gattgcgcca ctgcactcca 9060 gcctggcgac agggcgagac tccatctcaa aaaaagaaaa ccaatgggac agggcagata 9120 tggggacaat ggtaaggaga tgggagagtg ggagggaggt gtcaggaaga ccttcttgac 9180 ttcatgtagg ctggtggggg tgttagccag caagcctcca gttccctggg aaccgttctc 9240 agggtaccaa ttttaccacc tgtctgcaaa cactttaaga ttcttaatca gactcaaatt 9300 ggccacaaat caggtaaaca aactcactag tggggtgggg ctaccacccg ttctgaccct 9360 ccagcccaac ccagcccagc caccctgccc tccgtagagc ctgtggtgtt tatcggtggc 9420 attgggagaa ttagtgtgta tttatgttgg cgtggggtgt ggggtggatt tgtgtgtgtg 9480 cagttaggcc tagtggaagg aatgtgggat ctgaaggcag gccagcctga gttccagtcc 9540 tgcctgttgc tcacaagctt tatgaggcga gagctaaccc ctgccagcct cagttgtctt 9600 ctttgcaaga tggaggttgc agccccagtc tctggagcat gttatgcaga tccaccgaga 9660 gtgcctgcca ggcacacagt aggtgctcag ctcagttact gtggcggccc ccactcccca 9720 ttgttgttgt tttcctattg cctggcggcc acagctggta tcccttgaaa agggctacag 9780 ggggtggagt cggaccctgc cccagccctg tggagaccct gggcttgggc cagggcctgg 9840 ggtctgggcc tgcagacagc tgtgtctata aagcagctga agggctgagg ccgggggagg 9900 tcctggcagc agggcgttat tttgggcctg gcctgccacc cccagctcct gtttctcttg 9960 ggagtctgtt gggggaggaa gtgtggggaa gaggaggggg tgcaagtggg tgaggcatgg 10020 agtggggagg cctccctcag ggacatggac ccttgagttc tatttctgtt cctccctcct 10080 gttcctccct ctttgtcctt atctgcctag agaggtggga atagaggcca ttctgagtat 10140 cactaggaga ccaccagttt gtggccactg gccactggcc caggcaggga acctgggggc 10200 ttgccctacc agcctctccc agcaatctga aggcaggggg tacctcgtat taccccctag 10260 gatttgacct taggctccaa cttgctggga gagcagtgcc tctggtgtca gaccccaagc 10320 cagcccttgt gctgtccctg aatctgcatg tagcctgtgg gaggcggagc agtgaccggc 10380 aggaattctg ggcagctcag gcacctgtgg gcctgagggt gccctctgcc cccacccttc 10440 cgatctcctg ggcaagacac gccaggtgat tcatctcacc agagcagaaa aacaagttca 10500 actgggcact ttaatctccc ctcactggca ggcctggtgt gagctgctac cccggcgccc 10560 ctcaccaggg gtgctttacc tcctctagta ttcctgacct tagtgggcat ttctggtctc 10620 agggatacca ggctggggtc caagtgggcc aggtgtggca gttcagccct atgccccatg 10680 gctgatggct cgcgctgggc aggtatgcag ggctgacgta gtgcctttgt ggcagcagtt 10740 tcgtggcaca cattctgcca gctggttctg gagtcttgcc ctgaggaggt ggccagggtg 10800 agggtgccag cgcaggaacc tttggcgcat gcttcaccct ggcctgggat ctgcagcctg 10860 ggtccagatg cccacaactg gaatctgacg ctccttttct cttcatgggg gactcccaga 10920 ggtctctgca atgaccagag ccccggttgt cccatgcctc agctgcaact ccagctgacc 10980 ctccttcccc actctctggg tggcattacg ggggtgtgga tcccttgcca agaggttggc 11040 atgtgggtgt gctggaatgg catagggaga atgcaccgag tttgtttgct tgggagaggg 11100 gcagggggta tccagaagat tcatgattcg tcatcgcctc tcttggggga tttttacccc 11160 tttgccctga gttgtgcctt tgggacaaag gaagcctttc tttgccagcc aacaccctgt 11220 actggcgggc gagctcccca gggctggcac gctggggcag cctctgaatg cacagggtgg 11280 gcctagtcag aagaagcctt tcccctgaaa tccctctact tcccaagcac gcaagctttc 11340 tcctgctgtt aaacctgcag tgtgcaaggg acatgggcgg aggggtcctt cagtcaggct 11400 tctccctgtc tgaggtggca tgacttggag tgagtttgga tggggtggcc aggtctgaga 11460 aggtcccccg ccagtgtcct ctgacccatc tgctctctcc tgccagtgtg caccggcaca 11520 gacatgaagc tgcggctccc tgccagtccc gagacccacc tggacatgct ccgccacctc 11580 taccagggct gccaggtggt gcagggaaac ctggaactca cctacctgcc caccaatgcc 11640 agcctgtcct tcctgcaggt gaggcccgtg ggcaacccag ccaggccctg cctccagctg 11700 ggctgagccc tctgtttaca ggtgggtggc agaagaaggt gccctgccct tctgtttcct 11760 ctcttgttgt ggtttctcaa ccaggaagtc ctttctaaca tctaaccccc attcatttta 11820 ctgcagaatc agttgactct ctctataacg tggctggccg aggtcatgtc tggatgggat 11880 gcgtctgtgt ttccgctaaa tcttgtgctc tcttgccagc atgatcatgt cccctgtcca 11940 cctgctccag ccactatccc tctcccactt acagcagaag aaagggctgg tgagaaaggt 12000 ggattacagg cccacttctg ccactgacga gccctatgaa tgtggcctac acccccttag 12060 cttcactggg tctcagtttc cctatctgta tattgggagc agttgtgaag ctcagaagag 12120 aaatgtctgt gaaaaggtta tgaacaggag ggagagtgga aaccaacctg ctggatcgtg 12180 tccacagacc ctggaatggg gccacatgct tggtttgtca aattgcagac gccggccggg 12240 tgcgatggct catgcctgta atcccagcac tttgggaggc cgaggcggac agatcacttg 12300 aggtcgggag ttcgagacca gcctgaccaa catggagaaa ccccgtctct actgaaaata 12360 caaaattagc caggcatggt ggcacatgcc tataatccca gctacttggg aaggctgagg 12420 caggagaatc acttgaacct gggagacgga ggttgtggtg agcctagatc gtgccattgt 12480 actccagcct gggcaacaag agtgaaactc cgtctcaaaa aaaaaaaatt tgcagacgcc 12540 atcccatcca ggcctttgct ttcactgatg aagaaactga gatacagaga gggcagggca 12600 cctgttcgga gtttatgaaa tgccccccca ccattatctt tcttgatcat ataagaatct 12660 ggtgaggcaa ggtagggcgt gatctttatc tctattttat cgttttattt aagcgggaac 12720 aggactgctc agtggctggg ggccttgccc aagatctcca agtactgggg aaccccaggg 12780 aggccctggg gggtggcagt gttcctattt cagccccact ctgcttcccc ctcccaggat 12840 atccaggagg tgcagggcta cgtgctcatc gctcacaacc aagtgaggca ggtcccactg 12900 cagaggctgc ggattgtgcg aggcacccag ctctttgagg acaactatgc cctggccgtg 12960 ctagacaatg gagacccgct gaacaatacc acccctgtca caggggcctc cccaggaggc 13020 ctgcgggagc tgcagcttcg aagcctcaca ggtggccttc accgtcattg aaaccttctc 13080 ttggttattc agagctgacc agggccactg ctaaccaggg ggaggctttg tgtgcattag 13140 aaatggtgtc ccttctgggc agacgcaggc agagcccggg aagacgccct cagaagattg 13200 gaaaaagatt ccccttcttc ctgggaagtt gtagcttgcg tcagcacata taattcaatc 13260 gtgagaatgc aggctgggtt tttgccccca cttggctgag tgaagtgtac agtgaacaac 13320 ctatgtaact atttgctggc cctggagccg actctgcccc agagtctggg tgccaggtgc 13380 tttgcccgca tggcccattt cagtcacgct gcagtcctgt caggaaaaaa tcagtgttat 13440 tctcattcta catatgagaa aactgaggct tgcagatata agggccaaaa gttacacagc 13500 tagtgagtga tggggctgag tttcagactc cacagtctct taaccaccaa gcagcatgcc 13560 cagagtagag gtgagaagga aggagagagc tgcggtccac atgagcatct ggacctagca 13620 tggacaactc actcctccct ggctctcgct ttgttcttgt tgcgggtgtg gtggtggtgg 13680 gactcaaaga cggtaaagat agctttctct cctccctggg gaatctgggg gttgtttaaa 13740 aggcctgctc ctcttttaga aggcaggagg gccccaaggg aagcagaagg tgacagaagg 13800 ggaaagggtc ctctgatcat tgctcacccc acagagatct tgaaaggagg ggtcttgatc 13860 cagcggaacc cccagctctg ctaccaggac acgattttgt ggaaggacat cttccacaag 13920 aacaaccagc tggctctcac actgatagac accaaccgct ctcgggcctg taagccatgc 13980 ccctccctgc tgcctcttct ctcagacagc ctgaccccag ccgcaaactc ccaacttaca 14040 acccagtgcc tgcccgccac tgccccagcc gcctacacca cccatttcct ccctctctgt 14100 ccctcctgcc atctccctgt gcctcttcat ctctggggtt ctctgtcttg tctccctctg 14160 cttataggtt gtgcctctgg tttgggggcc tctcagcctg tctgggtccc tcccttgctg 14220 tgcagttggc ctcgtggcct ctgctgctgt ttgtgcctct ctctgttact aacccgtcct 14280 ctcgctgtta gacatctctc tcactgcctg tctctggttc tgtcctcagg ccacccctgt 14340 tctccgatgt gtaagggctc ccgctgctgg ggagagagtt ctgaggattg tcagagccgt 14400 gagtctcagg gaggcctgga gtcagggaag gggagggctg gggccgggtg gaatgcaggt 14460 gtcatacagg tgacatggga ggggtgggat aacaggcttg ggatgtctcc cctgggccag 14520 gtagtctccc tagaaggtga tgctgatgag ggtctggtgc ccagggcgcc actcagccct 14580 catcctgccc tttgcccaac agtgacgcgc actgtctgtg ccggtggctg tgcccgctgc 14640 aaggggccac tgcccactga ctgctgccat gagcagtgtg ctgccggctg cacgggcccc 14700 aagcactctg actgcctggt atgtgcctct gctttgtgcc caatgtgctc taccccccag 14760 gatgcaaggg gtgggcaccc tgcctggtac tgccctattg cccctggcac accagggcaa 14820 aacagcacag tgaaagccag ccacctgtcc ccccaggcct gcctccactt caaccacagt 14880 ggcatctgtg agctgcactg cccagccctg gtcacctaca acacagacac gtttgagtcc 14940 atgcccaatc ccgagggccg gtatacattc ggcgccagct gtgtgactgc ctgtccctgt 15000 gagtgccagg gagaaacaca gttttctcat tttggtgggg aggtttgttt ctgtaaatgg 15060 gagcatatgg ggagcactgt ctgcatcttg ctttgagagc tggtcatgac agttcctgcc 15120 gagctgcctt gttctttcaa cagctgtgga gcaggtggca gtaaggagag gcagctaaga 15180 gcccagactt gggagccaga ctgcctgggt ttgaaaccca gctctatcaa ttagtaggca 15240 cgtgaccctc ttgctgtgcc tcagtttcct catcagtaaa atgggggcaa gaatagtccc 15300 aactgcataa gatggttata acatttgaaa gagttaatat ttgtaaagct cttagaacgg 15360 tgcctggtat gtactaagtg ctcctaaatg ttagctttta ttctatagcc tggtgaggtc 15420 agttttacct ttcgttttgt ttttgagacc gaatttagtt agctctatcg cagtggcgcg 15480 atctcggctc actgcaacct ccgcctccca ggttcgtgct attctcgtgt ctcagcctcc 15540 tgagtagctg ggattacagg cgcccaccac catgcctcgc taaattttgt atttttagta 15600 gagacagggt ttcaccacgt tggccagact ggtctcgaac tcctgacttc aggcgatcca 15660 cctgcctcgg cctctgaaag tgctgggatt acaggcgtga gccactgcac ccggactttt 15720 ttttttttgg cagagtctcg ctccattgcc caggctggag tgcagtggtg caattttggc 15780 tcactgcaac ctctgccttc cgcattcaag caattcttgt gcctcagact cttgagtagg 15840 tggaactaca ggcatgcacc accatggctg ggtaattttt gtatttttag tagagacgga 15900 gtttcactat gttggccaag ctggtctcga actcctgacc tcaagtgatc cacccgcctt 15960 ggtctcccaa agtgctggga ttacaggcat gagccatcgt gcctggccta gctcagtttt 16020 atttaacaga tcacctattt actgatgggc gtttatggac tgggctcaga cctggggaac 16080 ctctttcctc ctctcacagg aacaggagtg ggccttcaga tcctggctga ctgtgttagg 16140 gagaggacaa aatgtagagc cagaccattt gggttcaaat cctcgctcct ccactcacta 16200 gcacaatgac cttgaataat ttacagaact ctctgctttg gtctcccttt ttgcaaaatg 16260 ggaatctcac agtgctgatc ccgtctggtt gttgtgaggg gtaaatggat gtcaggtgct 16320 gatgcgtggt agggcattta agtattggtt gatattattc ttcttgtgcc tgggcacggt 16380 aatgctgctc atggtggtgc acgaagggcc agggtatgtg gctacatgtt cctgatctcc 16440 ttagacaact acctttctac ggacgtggga tcctgcaccc tcgtctgccc cctgcacaac 16500 caagaggtga cagcagagga tggaacacag cggtgtgaga agtgcagcaa gccctgtgcc 16560 cgaggtaccc actcactgcc cccgaggcca gctgcagttc ctgtccctct gcgcatgcag 16620 cctggcccag cccaccctgt cctatccttc ctcagaccct cttgggacct agtctctgcc 16680 ttctactctc tacccctggc ccccctcagc cctacaagtg tccctatatc ccctgtcagt 16740 gtggggaggg gcccggaccc tgatgctcat gtggctgttg acctgtcccg gtatgaaggc 16800 tgagacggcc ccttccccac ccacccccac ctcctcagtg tgctatggtc tgggcatgga 16860 gcacttgcga gaggtgaggg cagttaccag tgccaatatc caggagtttg ctggctgcaa 16920 gaagatcttt gggagcctgg catttctgcc ggagagcttt gatgggtaag agtgggcacg 16980 atgacctgag acagtgtcag ggcagacaga gtcctgagga tccagatgtg gcagcatctc 17040 ttggggatgg caggagacag aagtgggggg atcaagaatg caaagaaagc agatgggaga 17100 ccagaggagc agggcctttg gtgggtgggg gtgattattt ttgtaaatga catgctatcc 17160 gtgaacaagg acttgtatgg aggtcagacc atctagataa agtaaaattc cctttgagtt 17220 catagcagct ttattcaaaa tatccccaaa ttggaaataa ctcaaatgtg catcactagg 17280 tgaaggaata aacaagtggc agtgtatcca tttggtgaag ttctacttag caaccaaagg 17340 aaatgaacta ccgatacaac ataaatgaat ctcagaaaca ttacattgag caaaagaagc 17400 cagagacaag attccatact gtctgatccc ctttatgtga ggctctgaac cgaaaaaacc 17460 actctgtggt gggagagatc agaacggtgg ttgccccagg gtggggggct tcaaaaggga 17520 ggcacacaag gacatttctg gggtaataga aatgctctgt atagtgattg gggtagtgga 17580 tacatgagcg aatccatttg tcaaaactca tcaaactgtg tgataagagt ctgtgcattt 17640 tatttatttc attttatttt ttgagataga gtctcactct gtcagcaggc tggagtgcag 17700 tggtacgatc ttggctcact gcaacctctg cctcctggat tcaagcaatt ctcctgcctc 17760 agtctcctga gtagctggga ctacaggtgt gtgccaccat gcccagctaa tttttgtatt 17820 tttaatagag atggggtttc accatgttgg caaggatggt ctcgatctct tgacgtcgtg 17880 atccgcccac ctcagcctcc caaagtgctg ggattacagg catgagccac cacacccggt 17940 gcattttatt gtatataagt tatacttcaa taagaaatga attggggcca ggcacggtgg 18000 ctcacgcctg taatcccagc actttgggag gccgaggcag gcagatcact tgaggtcagg 18060 agttcaagac cagcctggcc aacatggtga aaccccatct ctactaaaaa atataaaaaa 18120 ttagccaggc ttcctggcat gcgcctatca tcccagctac ttgggaggct gaggcaggag 18180 aattgcatga actcgggagg tggaggttgt agtgagctga gatttcgcta ttgcactcca 18240 gcctgggcga cagagtgaga ccctgtctca aaaagaaaaa aaaaaaaaag ggtcaggcgc 18300 cgtggtgcac acctgtaatc ccagcacttt gggaggctga agcaggaaga ttgcttgagc 18360 ccaggaattc aagaacagcg tgggcaacat agtgagatcc catctctaca aaaaaacaca 18420 aaaaattagc cgggcatggt ggtacgcacc tgtagtctca gctactaggg agactgaggt 18480 gggagaatca cctgagcctg ggaggtggag gttgcagtgg gttgaaatca tgtcactgta 18540 ctccagcctg ggtgacagaa tgagaccctg tctcaaaaaa aaaaaaaaaa aaaaaattcc 18600 ctttcacact tcctttacct ccactcccct ttccagaggg ggccatggtt aacagtgtgt 18660 gtgttcacct agaccgttta tgcatctgta gacacacaca cagtgaagtg tggttttcgt 18720 cgttttggtg gggaggttgg tttctgtaaa tgggaacata tagggagcac tgtctgcacc 18780 ttgctttgag agccggtcat gacagttccc attgaactgc cttgttcttt caatagctgc 18840 agagcaggtg gcggcaagga gaggcagcta agagcccaga cttgggagcc agactgcctg 18900 ggtttgaaac ccggctctac cacttactag gcatgtgacc cttgtgctgt gcctcagttt 18960 cttcatctgt aaagtggggg caagaacagt cccaacttca taagatggtt ataccaccat 19020 gcctggccag atgattataa agtttgaatg agttaatatt tgtaaagctc ttagaacagt 19080 gcctggcaga tactaggtgc tcctaaatgt tggtttttat tatgtggctg ggtggctcgg 19140 ggttttattt aacagctccc ctatttacta atagacattt agatcatgtt ccattttcac 19200 tcttacaaac agttccactt tgtgtgtggc tctgggaaca tgggccagtg tctccctagg 19260 ccacattcct agaaataaga tttcttttct tttttttttt tttttgagac agagtctcgc 19320 tttatcgcca ggctggtgtg cagtagtgtg atctcggctc actgcaacct ctgcctcccg 19380 ggttcaagtg attctcctgc ctcagcctct cgagtaactg ggactatagg cgcgcggcac 19440 cacacccagc taatttttgt atttgtagta gagatggggt ttcaccatgt tggccaggat 19500 ggtctccatc tcttgacttc gtgatccgcc cgcctcggcc tcccaaagtg ctgggattac 19560 aggcgtgagc cactgagccc aggcagaaat aagatttcta gatcaaagga tataaatact 19620 gttttgatag atgttgccga actaaggcct gggctttgaa gcccaggatg ggaacagctg 19680 ggctcgatgg gcaaagggtt tgagtgaagg cattcatggt ggggagtggc tggcatggcc 19740 agtgctggga gtgatgtcca ccctgttcct ggccctgctg actcctctcc tgacccctcc 19800 agggacccag cctccaacac tgccccgctc cagccagagc agctccaagt gtttgagact 19860 ctggaagaga tcacaggtgg gctctgtctc tgcatcctgt tctgcagggg ctgggagtcc 19920 ttgtcctgtc cccactcctt taatctcacc ctctgcctgc aggttaccta tacatctcag 19980 catggccgga cagcctgcct gacctcagcg tcttccagaa cctgcaagta atccggggac 20040 gaattctgca caagtgagca ctgagaaaga gggggcctga tggggaggag tcccagggag 20100 gagtccctgt gggaagcttt gggcctgagg gagtactcct gtagcagtaa cctttccatg 20160 aaagtctgca gagtgtgctg gggatggagg aagatgagaa tagcctttgc tgaccgggaa 20220 ggggtccgtg gtaaggtgcc cacctttctc ccatagtggc gcctactcgc tgaccctgca 20280 agggctgggc atcagctggc tggggctgcg ctcactgagg gaactgggca gtggactggc 20340 cctcatccac cataacaccc acctctgctt cgtgcacacg gtgccctggg accagctctt 20400 tcggaacccg caccaagctc tgctccacac tgccaaccgg ccagaggacg agtgtggtaa 20460 gacagggagc ccagtgtgcg cactccccat ctgccagcac acagcagtgc ccagggggcc 20520 ctggcagcag cgttcttgga cttgtgcaga ctgcccgtct ctgtgcaccc ttcttgactc 20580 agcacagctc tggctggctt ggcctcttgg catggcttct ctagctgggt cctacctgcc 20640 ttggcatcct tccctccccc tctgtttctg aaatctcaga actcttcctc tccctacatc 20700 ggccccacct gtccccaccc ctccagccca cagccatgcc cacagccagt tccctggttc 20760 acttggacct ggggcctccc ctaaaagtcc cctgcggtcc cttcctcctc actgcagtgg 20820 gcgagggcct ggcctgccac cagctgtgcg cccgagggca ctgctggggt ccagggccca 20880 cccagtgtgt caactgcagc cagttccttc ggggccagga gtgcgtggag gaatgccgag 20940 tactgcaggg gtatgagggg cggaggagag ggtggctgga ggggtgcatg gggctcctct 21000 cagaccccct caccactgtc ccttctctca ggctccccag ggagtatgtg aatgccaggc 21060 actgtttgcc gtgccaccct gagtgtcagc cccagaatgg ctcagtgacc tgttttggac 21120 cggtgagctg ctggcgggct cagagctggg tggagggggg cagcgagggg gattgccagg 21180 gacttggcag gatggcgaga tgcagtaggg tgtgctatct ggtaaaatat ccctggagag 21240 ggctcagcgc tcagacctga acagcaacag agtggcagaa aaggggcctg ggggacactg 21300 gggcccttca gactatgaaa aggttctaag gaggtctgtg ttggtggctg tgactgtggc 21360 tgtgctaggg tggtgagccc tgtgggctca ggcgtcagac tacctggatt cagacccagc 21420 tcctgcttcc aaccttggtt ttttattcct aaaatgggta ttgtaataat acctaccttg 21480 ctggggtgtg gcaagaatga aattaaacag ggcttggcac agtgaagcac gggaaaggct 21540 ttctacagag cagtgactgt tgttactcgc tgttacacct taggtaatgc gttttcctct 21600 ctgggtgcct cccattttct ggctcaagtc cctgcccagg atcaagcttg gaggagggcc 21660 ccgagggagg ggccacagag actgggtgaa gagcaagggt gtttgtccca ggagcatggc 21720 gaaaattgct gctgggtggc cttgggaagc acaaagggga cccaactaag ggcctgatcc 21780 tactgccctg ggggtgtcag tgccagcccc ccacaaatct tttctgcccc ccccaggagg 21840 ctgaccagtg tgtggcctgt gcccactata aggaccctcc cttctgcgtg gcccgctgcc 21900 ccagcggtgt gaaacctgac ctctcctaca tgcccatctg gaagtttcca gatgaggagg 21960 gcgcatgcca gccttgcccc atcaactgca cccactcgtg agtccaacgg tcttttctgc 22020 agaaaggagg actttccttt caggggtctt tctggggctc ttactataaa aggggaccaa 22080 ctctcccttt gtcatatctt gtttctgatg acaaaaataa cacattgtta aaattgtaaa 22140 attaaaacat gaaatataaa ttaatgccct agcagttcta tccccactgt taataatttg 22200 aaatattttt cctctagtta tttttgtctg tgcacattct aatatgtata tataagttaa 22260 catatattaa tattattctc cagttatttt tatctgtgca cattttaaca cacacacaca 22320 cacacacaca cacacacata tgtattttta gacggagttt cactctgtcg cccaggctgg 22380 agtgcagtag tacaatcttg gctcactgca gcctccacct cctgggttta agcaattctc 22440 ctgcttccgc ctcctgagta gctgggatta cgggaacgtg ctaccttgcc tggctaattt 22500 ttgtattttt agtacatagg atttcaccat gttggccagg ctggtctcga acccctgacc 22560 tcaggtgatc tgccagcctc ggtcccccaa agtgttggga ttacagcggt gagccaccat 22620 gcccagtcat atatttcttt ttaacaaata gaatcataga tcatacatat tgtttgcaaa 22680 ttgctttttc tcactttcca gaaccttgaa atgtttttcc atgttctaac atggtgatct 22740 accttattct tttaattttt cttatttagt tgtctttaca catgaaacac atgaatacat 22800 ccttgtgata aacattttca gtaacataaa agtataaatg ttacaaagcc aacgtgccct 22860 ttcactcaac tccctgtcca cccagtctct cctgtctgct gggagaacca ccgcattgac 22920 ttgtgtgttc acccttccag gctcttttct gcacacttat atagacatac tacatttata 22980 ttaggtcgag tcaaataaga ttgctgtttg tgtaaaccaa aaagtgtcaa gagcctgggc 23040 gcagtgactc acacctgtaa tcccagcact ttgggaggct gaggcaggca gatcacttga 23100 gatcaggagt tcgagaccaa tctggccaac atagcgagac cccgtctcta ctaaaaatac 23160 aaaaactagc caggtgtggt gatgctgttc tgcactttgc tttccccccg acttgaggta 23220 tcctttcttg tgagtacaga cggatctacc acctttattt tttttttaat tactcaacct 23280 gtaacatgga tgtaatttca ctttgttttt gagggatatt gagcttgttt ccctgttttt 23340 gcagtttatt gcaattgagc tccacacaca agtgagccct cttttgtatg ccccctagtg 23400 ggaatacagt gctggcaatg tttatcacaa ggatatattc atgcatttca atttaaagac 23460 aactaaatga gaaaaattaa aagaatatgg atccaggctg ggcatggtgg ctcacgcctg 23520 taatcccagc actttgggag gccgaggcag gcagatcacc tgaggtcagg agttcaagac 23580 cagcctggcc aacatggcaa aaccccgtct ctactaaaaa tacaaaaatt agccaggcgt 23640 ggtggtgggc gcctgtaatc ccagctattt gagaggttga gacaggagaa ttgcttgaac 23700 ctgggcagcg gaggttgcag tgagacgaga ttgcaccagt gcactccaac ctgggcaaca 23760 cagtgcaact ccttctcaag aaaaaaaaga aaaaaaaaaa gaatatgggt ccagatccat 23820 atggatccta gatccagatc acggtgttag aacatggaaa aacattgcaa gattctgcta 23880 agtgaaaaaa gcatttgcaa acagtatgta cagtctatat tcagaggagg aactgctggg 23940 tcatagatga tatttcatag gtattgccaa accgttctct ggagaagtgg tatgggttta 24000 ccctgggatt cttctatgga gggaatagtt gagctcccgg gcttgctctt ctgggtgccc 24060 ctccccgctt cctatccacc acaaggagct gcaggggagc ggggcatgcc ggttccttgg 24120 ctggagaagg agtctccttg tgaggtggta gaaggagcac tgacggcctt gagcccagtt 24180 tctgcctttg tcaaatgggg ataatgaccc agccacaccc ctcccagggt tgttgtgagg 24240 ctggaaaggt ggttcccaag agggtggttc ccagaattgt tgatgagact gtttctcctg 24300 cagctgtgtg gacctggatg acaagggctg ccccgccgag cagagagcca ggttggcctg 24360 gaccccagga tgtacccttc attgcccttc actcccccac tggatgctgg gtggtcactg 24420 ctgtagggag gggaccccct gacatatgtc ccttcccacc cactcttcca ctgtggaacc 24480 tcctgtcatt ttccacttca ccaagtgaca gaggacctgc tcagatgctg aggggagggg 24540 actgcaagga aagatggcta ggaaacccag tccctccaca ccctagagta acttgatgcc 24600 ttgtgaggga cacaggcaaa gttcaattcc ttggaagtca agggagactg agaagagtac 24660 agctgcagca ctgagggagt gatgaattct taactgggga tggtgggagg cttcgagtgg 24720 gaggtggcat ttgagctagg ctttgagaga ggagcaggta ttgcacttgc atttaggtag 24780 aaagcattgg ggtgcaaggt gacactggag ggggaggcat caggaaatcc aggatgtctt 24840 caaagttctg gtgtcggggg ctgttgagta agcacaggaa taagggggtc aagttagagt 24900 cagggtgggg tctgacctgg atgccatagg acctgatccc caagccacag ggtgggactt 24960 gactgggcag tggggacctt tggaaaggac tttggggaga aaaacagact ggagtctgtc 25020 ttaggcgatc atcggtccgt gaaatgagca tgtgttacag gcttggtatg taccagaccc 25080 tgtgctaagc aagggggtat ggagaggaga gggtgacaag aatattggat caacacccgg 25140 gagctccatc tatcccagga tgcactatct tttttttatt tttttgagac ggagtctcac 25200 tctgcctgca ggctggagtg cagtggctcc atctcggttc actgcaacct ctgcctcctg 25260 ggttcaagcg cttcttgtgc ctcagcctcc caagtagctg ggattacagg cacatgccac 25320 cacacccagc taatttttgt atttttagta gagacggggt ttcaccatgt tggccaggat 25380 ggtctcgatc tcttgacctc aagatccgcc caccttggcc tcccaaagtg ctgggattac 25440 agacatgagc caccgtgccc agccagatac gctatctttt tattgagtga ttgagacagg 25500 gtcttgctct cttgtccagt cttgaatgtg gtggtgtaat cacaggctca ctgcagcctt 25560 gacctcctgg gctcaagtta cccttctgca gtagctggga ctataggagc gtgccaccac 25620 gcctgggtaa tttaaaaaat tttttttgta tagacagggt ctcactatgt tgcccgagct 25680 ggtctcaaac tcgtgggctc aagtgatcct ccagttttgg cctcccaaaa tgttgggatc 25740 acaggagtga gccaccactc ctggcgatga gccaagtctt tttttttttt tttttttttt 25800 gatatggagt cttgctctgt tgcccaggct ggagtgcaat gacacgatct tggctcactg 25860 caacctctgc ctcccaggtt caagcagttc aagcaatcct cctgtctcag ccccccagta 25920 gctgggatta caggcatgcg ctaccacgtc cggctaattt ttgtattttt agtagagatg 25980 aggttttgcc atgttggcca ggctggtctt gaactgctga cctcaggtga tccacctgcc 26040 tcggcctccc aaagtgctgg gattacaggt gtgagccatc gtgcctggcg gagccgagtc 26100 ttaaaagatg accctgtgga gaaatggtgg tccaggctga agggacagcc tatgcaaaca 26160 ctgggaggtg tggaaaatca tgacctgtgg gtggaaattt tggctagaac atcaaaatca 26220 tcaggtgtac attcctgtac ccatgcagca gtcagaatct ctgggggtgg ggccccaaaa 26280 ttgtatgcat acagactgtg tgctgatttg tgatattact taggattttt tgactttaca 26340 atggtggaaa agcaataata tacattcagt ataaaccgta ctttgaatac ccatacagcc 26400 attctgtttt tcacttttat ttttatttat ttatttattt attatttatt ttgagatgtc 26460 attttgctgt tgttacccag gctggagtgc aatggcgcag tcttggctca ccgcaacctc 26520 cacctctcag gttcaaacga ttctcctgct tcagcctcca gagtggctgg gattacaggc 26580 aggcaccacc acacccggct aattttgtat ttttagtaga gacggggttt ctccatgtta 26640 gtcaggctgg tctcgaactc gagagctcag gtgatctgcc catctcagcc tcaagccacc 26700 atgcccagcc ctactttcag tattcaataa attacatagc caggcaccgt ggctcacacc 26760 tgtaatccca gcactttagg aggccaaggt gggaggatcc tttgaggcca gaagctcgag 26820 accagcctgg gcaacatagt gagaccccat ttctacaaaa aataaaaaaa ctagctgagt 26880 gtggtggcgt gtgtctgtag tcccagctac ttgggcagct gaggtggaaa gactgcttga 26940 gcccagaggt cagggctgca gtgggccatg atctcaccac tgcactcagc ctgggcaaca 27000 cagcaaggcc ctgtctcaaa aataaataaa taaataacac aaacttattt aacagtttac 27060 tataaaatag gctttgtgtc agatgattct gcccaactgt aagctgctgg cagtgtaaat 27120 gttctgagca cgtgtaagcc aggctaggtg tcttaaatgc attttcagtt tcaacttaga 27180 attggtttat caggacgtag ccccttggtg ttgaggggca tgtgtattaa cagtctcctt 27240 agtgactttt ttttttttga gatggagtct tgcactggcc gtagtgcagt ggcacaatct 27300 cagctcactg caacctcttg tctcccgggt tcaagcgatt ctcctgcctc agtctcccaa 27360 gtagctggga ttacaggcac ccacaccacg cccagctaat ttttgtgtgt gtgtattttt 27420 agtagagacg ggggtttcac tatgttggcc aggctggtct cgaactcctg accttgtgat 27480 ctgcccacct cagactctca aagtgctagg attccaggca tgagccaccg cgcccagagt 27540 ccttagtgat ttttacacca tgaattgttg aagccctaag ccagagccaa gggcaagagt 27600 atagagaatc tggagatgcg gagagggttc tgattgccta caaggagttt ggactttatt 27660 gtggaggcag cggggagcca aggcaggttt tagagtagga gagggtccaa gcctgtgggt 27720 cacccttccg acttcccttt ccgaatgcca aacaccttca tgtcccccgt gggccccctt 27780 tgtccctccc accccaaact agccctcaat ccctgaccct ggcttccgcc cccagccctc 27840 tgacgtccat catctctgcg gtggttggca ttctgctggt cgtggtcttg ggggtggtct 27900 ttgggatcct catcaagcga cggcagcaga agatccggaa gtacacgatg cggagactgc 27960 tgcaggaaac ggaggtgagg cggggtgaag tcctcccagc ccgcgtgggg tctgcaccgg 28020 cccccggcac tgacccacca ccccctcacc ccagctggtg gagccgctga cacctagcgg 28080 agcgatgccc aaccaggcgc agatgcggat cctgaaagag acggagctga ggaaggtgaa 28140 ggtgcttgga tctggcgctt ttggcacagt ctacaaggtc agggccaggt cctggggtgg 28200 gcggccccag aggatggggg cggtgcctgg aggggtgtgg tcggcagttc tgatgggagg 28260 ggcaagagct ggaggcagtg tttgggggag ggcagttaca gcggagaagg gagcggggcc 28320 aagccctagg gtggtgaagg atgtttggag gacaagtaat gatctcctgg aaggcaggta 28380 ggatccagcc cacgctcttc tcactcatat cctcctcttt ctgcccaggg catctggatc 28440 cctgatgggg agaatgtgaa aattccagtg gccatcaaag tgttgaggga aaacacatcc 28500 cccaaagcca acaaagaaat cttagacgta agcccctcca ccctctcctg ctaggaggac 28560 aggaaggacc ccatggctgc aggtctgggc tctggtctct cttcattggg gtttggggag 28620 atatgactcc cgcaaaccta gactattttt ttggagacgg agtcttgctc tgtcacccag 28680 gctggagtgc agtggcgtta tctcggctca ctgcaacctc cacctcctgg actcaagcga 28740 ttttcatgcc tcaggctcct gagtagctgg gattacaagc gcccgctaat tttttttttt 28800 tttttgagac agagtctcgc tctgtcaccc aggctagagt gaaatggtgc ggtctcagct 28860 cagcctccca ggttaaagcg attcttctcc ctcagtctcc tgagtagctg ggattacagg 28920 cgcgagccac cacgcccggc taatttttgt atttttagta gagatgggat ttcaccatgt 28980 tggccaggtt ggtgtcaaac tcctgacctc atgatccgcc cgcctcggcc tcccaaagtg 29040 ctgggattac aggtgtgagc caccgtgccc ggcctaatct ttgtattttt agtagagaca 29100 gggtttcacc atgttgtcca ggctggtact ttgagccttc acaggctgtg ggccatggct 29160 gtggtttgtg atggttggga ggctgtgtgg tgtttggggg tgtgtggtct cccataccct 29220 ctcagcgtac ccttgtcccc aggaagcata cgtgatggct ggtgtgggct ccccatatgt 29280 ctcccgcctt ctgggcatct gcctgacatc cacggtgcag ctggtgacac agcttatgcc 29340 ctatggctgc ctcttagacc atgtccggga aaaccgcgga cgcctgggct cccaggacct 29400 gctgaactgg tgtatgcaga ttgccaaggt atgcacctgg gctctttgca ggtctctccg 29460 gagcaaaccc ctatgtccac aaggggctag gatggggact cttgctgggc atgtggccag 29520 gcccaggccc tcccagaagg tctacatggg tgcttcccat tccaggggat gagctacctg 29580 gaggatgtgc ggctcgtaca cagggacttg gccgctcgga acgtgctggt caagagtccc 29640 aaccatgtca aaattacaga cttcgggctg gctcggctgc tggacattga cgagacagag 29700 taccatgcag atgggggcaa ggttaggtga aggaccaagg agcagaggag gctgggtgga 29760 gtggtgtcta gcccatggga gaactctgag tggccacctc cccacaacac acagttggag 29820 gacttcctct tctgccctcc caggtgccca tcaagtggat ggcgctggag tccattctcc 29880 gccggcggtt cacccaccag agtgatgtgt ggagttatgg tgtgtgatgg ggggtgttgg 29940 gaggggtggg tgaggagcca tggctggagg gaggatgaga gctgggatgg ggagaattac 30000 ggggccacct cagcatgtga agggagggaa ggggctgcct gtgccccacc ttgcagggtc 30060 tgtgcacttc ccaggattag ggaaagaccg ggtagggtct gtctcctggc atcacatctc 30120 cccctgctac ctgccatgat gctagactcc tgagcagaac ctctggctca gtacactaaa 30180 gctccctctg gccctcccac tcctgaccct gtctctgcct taggtgtgac tgtgtgggag 30240 ctgatgactt ttggggccaa accttacgat gggatcccag cccgggagat ccctgacctg 30300 ctggaaaagg gggagcggct gccccagccc cccatctgca ccattgatgt ctacatgatc 30360 atggtcaaat gtgcgtggct gagctgtgct ggctgcctgg aggagggtgg gaggtcctgg 30420 gtggaggagc ccacaagggg catgaaaggg gaccaggatg tatgtagacc caggagccct 30480 agtatgttag gagcctcaaa accttcttgt atccctttta cagtcaaagt ccaaagccac 30540 tcttgaggaa cactcttgta caaaattaag ctgggcacag tggctcatgc ctgtaatccc 30600 agtacttttg gaggctgagg tgggaggatc ccttgaagcc aggagttcaa gaccagcctg 30660 ggcaacatag tgagatccta tctctacaaa aaataaaaaa attatctggg tgtggtggtg 30720 tgtgccagta gtcccagcta ctcaggagag gctgaggcag gaagatcact tgagcctagt 30780 ttaaggttgc agtaagctat gattgcacca ctgaaatcca gcctgggtga cagagcgaaa 30840 cctcatctca aaaaaataaa aaagcaaaca aaaagaaaaa aaaaattaaa agggaaacta 30900 gaagagatgc caaaggttct ggctgaagac cccagagtct ggtgctactt ctctaccacc 30960 tgagggcttt gggctgtccc ttgggactgt ctagaccaga ctggaggggg agtgggaggg 31020 gagaggcagc aagcacacag ggcctgggac tagcatgctg acctccctcc tgccccaggt 31080 tggatgattg actctgaatg tcggccaaga ttccgggagt tggtgtctga attctcccgc 31140 atggccaggg acccccagcg ctttgtggtc atccaggtac tgggcctctg tgccccatcc 31200 ctgcctgtgg ctaagagcac cctcctgcag agggtgggaa ggagagatga gtccagtatg 31260 ccaggcccct cacggaaggc tgcatgctgg gctggggagg ggccaccatc ctgcctctcc 31320 ttcctccaca gaatgaggac ttgggcccag ccagtccctt ggacagcacc ttctaccgct 31380 cactgctgga ggacgatgac atgggggacc tggtggatgc tgaggagtat ctggtacccc 31440 agcagggctt cttctgtcca gaccctgccc cgggcgctgg gggcatggtc caccacaggc 31500 accgcagctc atctaccagg gtcagtgccc tcggtcacac tgtgtggctg tctgcttacc 31560 tcccccaacc ccggtggact agggtccctt tctctgatgt tccctcaact gtcacctctc 31620 aaggaaaccc cattatccct acaaaaaatt cttactgcct tccaacccct gtgaccccat 31680 tctctccacg gtgactgtgt cataccccaa aggtgacctc tgtttttctc ctgtgaccct 31740 gtcaccttcc atggagtccc catcccagat ccgtgagtga cccccatcat gactttcttt 31800 cttgtcccca gagtggcggt ggggacctga cactagggct ggagccctct gaagaggagg 31860 cccccaggtc tccactggca ccctccgaag gggctggctc cgatgtattt gatggtgacc 31920 tgggaatggg ggcagccaag gggctgcaaa gcctccccac acatgacccc agccctctac 31980 agcggtacag tgaggacccc acagtacccc tgccctctga gactgatggc tacgttgccc 32040 ccctgacctg cagcccccag cctggtatgg agtccagtct aagcagagag actgatgggc 32100 aggggaggtg ggaccttcag cccagggtcc actgtggggg cagagggagt ggcagagaca 32160 ccggggttcc ttcccctaat gggtcacctt ctcttgacct ttcagaatat gtgaaccagc 32220 cagatgttcg gccccagccc ccttcgcccc gagagggccc tctgcctgct gcccgacctg 32280 ctggtgccac tctggaaagg cccaagactc tctccccagg gaagaatggg gtcgtcaaag 32340 acgtttttgc ctttgggggt gccgtggaga accccgagta cttgacaccc cagggaggag 32400 ctgcccctca gccccaccct cctcctgcct tcagcccagc cttcgacaac ctctattact 32460 gggaccagga cccaccagag cggggggctc cacccagcac cttcaaaggg acacctacgg 32520 cagagaaccc agagtacctg ggtctggacg tgccagtgtg aaccagaagg ccaagtccgc 32580 agaagccctg atgtgtcctc agggagcagg gaaggcctga cttctgctgg catcaagagg 32640 tgggagggcc ctccgaccac ttccagggga acctgccatg ccaggaacct gtcctaagga 32700 accttccttc ctgcttgagt tcccagatgg ctggaagggg tccagcctcg ttggaagagg 32760 aacagcactg gggagtcttt gtggattctg aggccctgcc caatgagact ctagggtcca 32820 gtggatgcca cagcccagct tggccctttc cttccagatc ctgggtactg aaagccttag 32880 ggaagctggc ctgagagggg aagcggccct aagggagtgt ctaagaacaa aagcgaccca 32940 ttcagagact gtccctgaaa cctagtactg ccccccatga ggaaggaaca gcaatggtgt 33000 cagtatccag gctttgtaca gagtgctttt ctgtttagtt tttacttttt ttgttttgtt 33060 tttttaaaga tgaaataaag acccaggggg agaatgggtg ttgtatgggg aggcaagtgt 33120 ggggggtcct tctccacacc cactttgtcc atttgcaaat atattttgga aaacagcta 33179 <210> 2 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> The HER-2 gene forward primer for -3444 C>T polymorphism <400> 2 accccagcat agtatgtcag atg 23 <210> 3 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> The HER-2 gene reverse primer for -3444 C>T polymorphism <400> 3 atcctaggga gttgagaaac agg 23 <210> 4 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> The HER-2 gene forward primer for -1985 G>T polymorphism <400> 4 acccctgccc tgctgttg 18 <210> 5 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> The HER-2 gene reverse primer for -1985 G>T polymorphism <400> 5 tggcacagag tagggtcc 18 <210> 6 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> The HER-2 gene reverse primer for P1170A C>G polymorphism <400> 6 aaaaacgtct ttgacgaccc 20 <210> 7 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> The HER-2 gene forward primer for P1170A C>G polymorphism <400> 7 tttcagaata tgtgaaccag cc 22 <210> 8 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> The HER-2 gene reverse primer for genotyping of -3444 C>T polymorphism <400> 8 tgtccggaaa ggttagtcca gtcag 25 <210> 9 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> The HER-2 gene reverse primer for genotyping of P1170A C>G polymorphism <400> 9 acctgctggt gccactctgg aaagg 25

Claims (10)

  1. 서열번호 1로 이루어지는 폴리뉴클레오티드에서 서열번호 1의 1316번째 염기(HER-2 유전자의 번역시작점으로부터 -3444번째) C가 T로 치환되고 상기 1316번째 염기를 포함하는 100-500개의 연속적인 DNA단편으로 구성되는 폴리뉴클레오티드, 서열번호 1의 2771번째 염기(HER-2 유전자의 번역시작점으로부터 -1985번째) G가 T로 치환되고 상기 2771번째 염기를 포함하는 100-500개의 연속적인 DNA단편으로 구성되는 폴리뉴클레오티드, 서열번호 1의 32301번째 염기(HER-2 유전자의 1170 번째 코돈에서 1번째 염기) C가 G로 치환되고 상기 32301번째 염기를 포함하는 100-500개의 연속적인 DNA단편으로 구성되는 폴리뉴클레오티드 및 이들의 상보적인 폴리뉴클레오티드로 이루어진 군 중에서 선택된 하나 이상의 폴리뉴클레오티드로 이루어지는 폐암 감수성 진단용 마커.
  2. 서열번호 1의 1316번째(HER-2 유전자의 번역시작점으로부터 -3444번째) 염기 또는 서열번호 1의 2771번째(HER-2 유전자의 번역시작점으로부터 -1985번째) 염기 또는 서열번호 1의 32301번째 (HER-2 유전자의 1170번째 코돈에서 1번째 염기) 염기를 포함하는 폴리뉴클레오티드를 증폭할 수 있는 프라이머.
  3. 제2항에 있어서, 상기 프라이머는 서열번호 2 및 3 또는 서열번호 4 및 5 또는 서열번호 6 및 7로 표시된 올리고뉴클레오티드로 구성되는 것을 특징으로 하는 프라이머.
  4. 제2항 또는 제3항의 프라이머를 포함하는 폐암 감수성 진단용 키트.
  5. 서열번호 1로 이루어지는 폴리뉴클레오티드에서 서열번호 1의 1316번째 염기(HER-2 유전자의 번역시작점으로부터 -3444번째) C가 T로 치환되고 상기 1316번째 염기를 포함하는 100-500개의 연속적인 DNA단편으로 구성되는 폴리뉴클레오티드, 서열번호 1의 2771번째 염기(HER-2 유전자의 번역시작점으로부터 -1985번째) G가 T로 치환되고 상기 2771번째 염기를 포함하는 100-500개의 연속적인 DNA단편으로 구성되는 폴리뉴클레오티드, 서열번호 1의 32301번째 염기(HER-2 유전자의 1170번째 코돈에서 1번째 염기) C가 G로 치환되고 상기 32301번째 염기를 포함하는 100-500개의 연속적인 DNA단편으로 구성되는 폴리뉴클레오티드 및 이들의 상보적인 폴리뉴클레오티드로 이루어진 군 중에서 선택된 하나 이상의 폴리뉴클레오티드로 이루어진 군 중에서 선택된 하나 이상의 폴리뉴클레오티드로 이루어지는 폐암 감수성 진단용 마이크로어레이.
  6. 1) 피검체로부터 핵산시료를 수득하는 단계
    2) 수득한 핵산시료로부터 서열번호 1의 1316번째(HER-2 유전자의 번역시작점으로부터 -3444번째) 염기 또는 서열번호 1의 2771번째 (HER-2 유전자의 번역시작점으로부터 -1985번째) 염기 또는 서열번호 1의 32301번째 (HER-2 유전자의 1170번째 코돈에서 1번째 염기) 염기 다형성 부위를 증폭하는 단계 및
    3) 상기 2)에서 증폭된 다형성 부위의 염기를 결정하여 폐암 발생 위험도를 분석하는 단계를 포함하는 폐암 감수성 예측 및 판단 방법.
  7. 제6항에 있어서, 3) 단계의 염기 결정은 DNA 서열분석 (sequencing), PCR-SSCP (single stranded conformation polymorphism) 분석, PCR-RFLP (restriction fragment length polymorphism) 분석, SNP-IT (single-nucleotide polymorphism-identification technology) 분석, 대립형질 (allele) 특이적 혼성화 방법, DNA 칩 방법, ELISA (enzyme-linked immunosorbent assay) 방법 및 면역블롯 (immunoblot) 방법, 스냅샷(SNaPShot) 분석 방법, TDGS(Two-dimensional Gene Scanning), Taq-Man®및 TOGATM 으로 구성된 군으로부터 선택된 하나 이상의 방법에 의해 수행되는 것을 특징으로 하는 방법.
  8. 제6항에 있어서, 상기 SNP-IT 분석 방법은 서열번호 8 또는 서열번호 9로 표시된 올리고뉴클레오티드로 구성되는 프라이머로 수행되는 것을 특징으로 하는 방법.
  9. 제6항에 있어서, 상기 3) 단계의 폐암 발생 위험도 분석은 스튜던트 t -검정 (Student's t-test), 카이-스퀘어 검정 (Chi-square test) 및 다중 기호 회귀 분석 (multiple logistic regression analysis)으로 구성된 군으로부터 선택된 하나 이상의 방법에 의해 수행되는 것을 특징으로 하는 방법.
  10. 제6항에 있어서, 상기 3)단계에서 결정된 서열번호 1의 1316번째 (HER-2 유전자의 번역시작점으로부터 -3444번째) 염기가 T이고, 서열번호 1의 2771번째 (HER-2 유전자의 번역시작점으로부터 -1985번째) 염기가 T이고, 서열번호 1의 32301번째 (HER-2 유전자의 1170번째 코돈에서 1번째 염기) 염기 G인 경우에 폐암 발생 위험도가 증가되는 것을 특징으로 하는 방법.
KR1020080101903A 2008-04-06 2008-10-17 Her-2 유전자를 이용한 폐암 감수성 진단용 마커 및 이를 이용한 폐암 감수성 진단 방법 KR101090742B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US4276108P 2008-04-06 2008-04-06
US61/042,761 2008-04-06

Publications (2)

Publication Number Publication Date
KR20090106430A true KR20090106430A (ko) 2009-10-09
KR101090742B1 KR101090742B1 (ko) 2011-12-08

Family

ID=41536320

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080101903A KR101090742B1 (ko) 2008-04-06 2008-10-17 Her-2 유전자를 이용한 폐암 감수성 진단용 마커 및 이를 이용한 폐암 감수성 진단 방법

Country Status (1)

Country Link
KR (1) KR101090742B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111139301A (zh) * 2020-03-10 2020-05-12 无锡市第五人民医院 一种乳腺癌相关基因ERBB2位点g.39723319C>A突变体及其应用

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111139301A (zh) * 2020-03-10 2020-05-12 无锡市第五人民医院 一种乳腺癌相关基因ERBB2位点g.39723319C>A突变体及其应用

Also Published As

Publication number Publication date
KR101090742B1 (ko) 2011-12-08

Similar Documents

Publication Publication Date Title
KR102657306B1 (ko) 전립선암의 진단 및 치료에서 필라민을 포함하는 마커의 용도
CN111183234A (zh) 在表达pnpla3 i148m变异的患者的肝病治疗中对hsd17b13的抑制
CA2514187A1 (en) Expression profiles for colon cancer and methods of use
KR20080051128A (ko) 타입 2 당뇨병의 위험에 대한 진단 마커인 tcf7l2유전자의 유전적 변이체
CN101687050A (zh) 用于鉴别原发起源不明的癌的起源的方法和材料
KR20110081807A (ko) 갑상선암의 위험도 평가를 위해 유용한 유전적 변이
ES2524643T3 (es) Genes control para la normalización de datos de análisis de expresión génica
CN101874120A (zh) 作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型
KR102613599B1 (ko) 뇌경색 발증 리스크 예측 방법
KR20150023904A (ko) 전립선암의 진단 및 치료에서의 마커의 용도
CA2651376A1 (en) Method for diagnosis and treatment of a mental disease
WO2015114146A1 (en) Method for predicting the response to an anti-her2 containing therapy and/or chemotherapy in patients with breast cancer
US20030099958A1 (en) Diagnosis and treatment of vascular disease
CN113767179A (zh) 脑梗塞发病风险预测方法
KR20230154009A (ko) 두경부 암의 진단 및 위험 평가
KR102102051B1 (ko) 아토피 피부염 진단을 위한 마커 조성물 및 이를 이용한 아토피 피부염 예측또는 진단 방법
KR100901147B1 (ko) 자궁암 환자의 방사선 치료 후 재발 예측용 마커, 그를포함하는 키트 및 마이크로어레이, 및 상기 마커를 이용한자궁암 환자 재발 여부 예측 방법
KR101090742B1 (ko) Her-2 유전자를 이용한 폐암 감수성 진단용 마커 및 이를 이용한 폐암 감수성 진단 방법
CN112877428B (zh) 癌症检测套组
WO2006022634A1 (en) Methods for identifying risk of type ii diabetes and treatments thereof
WO2006022638A1 (en) Methods for identifying risk of type ii diabetes and treatments thereof
KR101114033B1 (ko) 단일염기다형을 포함하는 폴리뉴클레오티드, 이를 포함하는 마이크로어레이 및 진단키트, 및 이를 이용한 분석방법
CN113825839A (zh) 用固醇调节元件结合蛋白切割激活蛋白(scap)抑制剂治疗脂质水平升高
KR101818352B1 (ko) 방광암의 진단 및 예후 예측용 바이오 마커 및 그의 용도
US20090258344A1 (en) Methods for identifying risk of breast cancer and treatments thereof

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140822

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151005

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20171016

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20181101

Year of fee payment: 8