KR101374304B1 - 타입 2 당뇨병의 위험에 대한 진단 마커인 tcf7l2유전자의 유전적 변이체 - Google Patents

타입 2 당뇨병의 위험에 대한 진단 마커인 tcf7l2유전자의 유전적 변이체 Download PDF

Info

Publication number
KR101374304B1
KR101374304B1 KR1020087001376A KR20087001376A KR101374304B1 KR 101374304 B1 KR101374304 B1 KR 101374304B1 KR 1020087001376 A KR1020087001376 A KR 1020087001376A KR 20087001376 A KR20087001376 A KR 20087001376A KR 101374304 B1 KR101374304 B1 KR 101374304B1
Authority
KR
South Korea
Prior art keywords
tcf7l2
diabetes
type
allele
nucleic acid
Prior art date
Application number
KR1020087001376A
Other languages
English (en)
Other versions
KR20080051128A (ko
Inventor
스트루안 에프. 에이. 그란트
Original Assignee
디코드 제네틱스 이에이치에프
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 디코드 제네틱스 이에이치에프 filed Critical 디코드 제네틱스 이에이치에프
Publication of KR20080051128A publication Critical patent/KR20080051128A/ko
Application granted granted Critical
Publication of KR101374304B1 publication Critical patent/KR101374304B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/08Drugs for disorders of the metabolism for glucose homeostasis
    • A61P3/10Drugs for disorders of the metabolism for glucose homeostasis for hyperglycaemia, e.g. antidiabetics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • C12N15/1006Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor by means of a solid support carrier, e.g. particles, polymers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes

Abstract

타입 II 당뇨병에 대한 감수성 유전자에 대한 관련성 분석(association analysis)에 의해 유전자 TCF7L2의 다형성(polymorphism)이 제시된다. 당뇨병에 대한 감수성, 당뇨병에 대한 감소된 감수성을 진단하는 방법, 및 당뇨병에 대한 보호 방법, 및 타입 II 당뇨병에 대한 치료방법이 개시된다.
타입 II 당뇨병, TCF7L2, 다형성, 연관 불균형, 관련성(association)

Description

타입 2 당뇨병의 위험에 대한 진단 마커인 TCF7L2 유전자의 유전적 변이체{Genetic variants in the TCF7L2 gene as diagnostic markers for risk of type 2 diabetes mellitus}
본 발명은 이전에 TCF4 유전자(T-세포 전사 인자 4)로 지칭되었던, TCF7L2(전사 인자 7-유사 2(transcription factor 7-like 2) (T-세포 특이적, HMG-박스)) 유전자에 관한 특정한 마커 또는 하플로타입(haplotype)을 평가하는 단계에 의해, 타입 II 당뇨병에 대한 감소된 감수성(susceptibility)을 진단하거나 또는 타입 II 당뇨병에 대한 보호를 진단하는 방법 및 타입 II 당뇨병에 대한 증가된 감수성을 진단하는 방법에 관한 것이다. 본 발명의 방법은 TCF7L2 유전자의 엑손 4 LD 블럭과 관련된 유전자 마커를 검출하는 단계를 포함한다.
탄수화물 이용이 감소되고 지질 및 단백질 이용이 증가되는 대사 질환인 당뇨병은 인슐린의 절대적 결핍 또는 상대적 결핍에 의해 유발된다. 보다 심각한 경우에, 당뇨병은 만성 고혈당증, 당뇨(glycosuria), 물 및 전해질 손실, 케톤산증 및 혼수(coma)를 특징으로 한다. 장기적인 합병증은 신경병증(neuropathy), 망막병증(retinopathy), 신장병증(nephropathy), 대혈관 및 소혈관에서의 전신 퇴행성 변화(generalized degenerative change) 및 감염에 대한 증가된 감수성을 포함한 다. 당뇨병의 가장 일반적인 형태는 표적 조직에서의 손상된 인슐린 분비 및 인슐린 저항성에 따른 고혈당증을 특징으로 하는 타입 II의 인슐린-비 의존성 당뇨병(Type II, non-insulin-dependent diabetes)이다. 유전적 인자 및 환경적 인자가 타입 II 당뇨병에 기여한다. 예를 들면, 비만은 타입 II 당뇨병의 발병에 주요한 역할을 한다. 타입 II 당뇨병은 종종 점진적인 발병의 경미한 당뇨병(mild form of diabetes mellitus of gradual onset)이다.
타입 II 당뇨병의 보건에 미치는 영향은 엄청나다. 1995년에, 전세계적으로 1억3천5백만 명의 성인이 당뇨병을 가졌다. 2025년에는 약 3억만 명이 당뇨병을 가질 것으로 추정된다(King H., et al, Diabetes Care, 21(9): 1414-1431 (1998)). 아이슬란드에서 성인 인구의 타입 II 당뇨병의 유병률(prevalence)은 2.5%이고(Vilbergsson, S., et al, Diabet. Med., 14(6): 491-498 (1997)), 이는 당뇨병을 가진 34세 이상인 약 5000명을 포함한다. 당뇨병의 높은 유병률 및 증가되는 당뇨병에 걸린 인구는 관련된 위험 인자들을 보다 정확하게 정의하기 위해 타입 II 당뇨병에 관련된 유전적 인자를 정의해야 하는 의학적 요구가 충족되지 않았다는 것을 보여준다. 또한, 타입 II 당뇨병의 예방을 위한 치료제가 요구된다.
본 발명은 이전에 TCF4 유전자(T-세포 전사 인자 4)로 지칭되었던, TCF7L2(전사 인자 7-유사 2(transcription factor 7-like 2) (T-세포 특이적, HMG-박스)) 유전자에 관한 특정한 마커 또는 하플로타입(haplotype)을 평가하는 단계에 의해, 타입 II 당뇨병에 대한 감소된 감수성(susceptibility)을 진단하거나 또는 타입 II 당뇨병에 대한 보호를 진단하는 방법 및 타입 II 당뇨병에 대한 증가된 감수성을 진단하는 방법에 관한 것이다. 본 발명의 방법은 TCF7L2 유전자의 엑손 4 LD 블럭과 관련된 유전자 마커를 검출하는 단계를 포함한다.
제1 양태에서, 본 발명은 개체로부터 수득된 핵산 시료를 TCF7L2의 엑손 4 LD 블럭과 관련된 마커 또는 하플로타입(haplotype)에 대해 분석하는 단계를 포함하는, 개체에서 타입 II 당뇨병의 감수성을 진단하는 방법으로서, 상기 마커 또는 하플로타입의 존재는 타입 II 당뇨병에 대한 감수성을 표시하는 것인 방법에 관한 것이다. 일 구체예에서, 마커 또는 하플로타입은 표 6에 열거된 마커들로부터 선택된 하나 이상의 마커를 포함한다. 또 다른 구체예에서, 마커 또는 하플로타입은 마커이다.
하나의 바람직한 구체예에서, 마커 또는 하플로타입은 타입 II 당뇨병의 증가된 감수성을 표시한다. 증가된 감수성은 일 구체예에서 1.3 이상의 상대적 위험(relative risk) 및 1.4 이상의 상대적 위험을 포함하는, 1.2 이상의 상대적 위험을 특징으로 한다. 일 구체예에서, 마커는 DG10S478, rs12255372, rs7895340, rs1ll96205, rs7901695, rs7903146, rs12243326, 및 rs4506565로 구성된 군으로부터 선택되고, DG10S478에서 0이 아닌 대립형질(non-0 allele)(예를 들면, -4, 4, 8, 12, 16, 20, 또는 기타 0이 아닌 대립형질), rs12255372에서 T 대립형질; rs7895340에서 A 대립형질; rs11196205에서 C 대립형질; rs7901695에서 C 대립형질; rs7903146에서 T 대립형질; rs 12243326에서 C 대립형질; 또는 rs4506565에서 T 대립형질의 존재는 타입 II 당뇨병에 대한 증가된 감수성을 표시한다. 바람직한 구체예에서, 마커는 DG10S478 및 rs7903146로 구성된 군으로부터 선택되고, DG10S478에서 0이 아닌 대립형질 또는 rs7903146에서 T 대립형질의 존재는 타입 II 당뇨병에 대한 증가된 감수성을 표시한다. 또 다른 바람직한 구체예에서, 마커는 rs7903146이고, rs7903146에서 T 대립형질의 존재는 타입 II 당뇨병에 대한 증가된 감수성을 표시한다.
또 다른 바람직한 구체예에서, 마커 또는 하플로타입은 타입 II 당뇨병의 감소된 감수성을 표시한다. 감소된 감수성은 일 구체예에서, 0.7 미만의 상대적 위험을 포함한, 0.8 미만의 상대적 위험을 특징으로 한다. 일 구체예에서, 마커는 DG10S478, rs12255372, rs7895340, rs11196205, rs7901695, rs7903146, rs12243326, 및 rs4506565로 구성된 군으로부터 선택되고, DG10S478에서 0 대립형질, SNP rs12255372에서 G 대립형질; rs7895340에서 G 대립형질; rs11196205에서 G 대립형질; rs7901695에서 T 대립형질; rs7903146에서 C 대립형질; rs12243326에서 T 대립형질; 또는 rs4506565에서 A 대립형질의 존재는 타입 II 당뇨병에 대한 감소된 감수성을 표시한다. 바람직한 구체예에서, 마커는 DG10S478이고, DG10S478에서 0 대립형질의 존재는 타입 II 당뇨병에 대한 감소된 감수성을 표시한다. 또 다른 바람직한 구체예에서, 마커는 rs7903146이고, rs7903146에서 C 대립형질의 존재는 타입 II 당뇨병에 대한 감소된 감수성을 표시한다.
제2 양태에서, 본 발명은 타입 II 당뇨병에 대한 감수성을 검출하기 위해 개체로부터의 시료를 분석하기 위한 키트로서, 상기 키트는 TCF7L2의 엑손 4 LD 블럭과 관련된 하나 이상의 마커를 검출하기 위한 하나 이상의 시약을 포함하는 것인 키트에 관한 것이다. 일 구체예에서, 상기 하나 이상의 시약은 TCF7L2의 엑손 4 LD 블럭과 관련된 하나 이상의 마커를 포함하는 영역에 대해 완전히 상보적인 하나 이상의 연속된 뉴클레오티드 서열을 포함한다. 일 구체예에서, 하나 이상의 마커는 DG10S478, rs12255372, rs7895340, rs11196205, rs7901695, rs7903146, rs12243326, 및 rs4506565로 구성된 군으로부터 선택된다. 하나의 바람직한 구체예에서, 하나 이상의 마커는 DG10S478 또는 rs7903146이다. 또 다른 바람직한 구체예에서, 마커는 rs7903146의 C 대립형질이다.
또 다른 양태에서, 본 발명은 TCF7L2의 엑손 4 LD 블럭과 관련된 마커를 검출하는 단계를 포함하고, 상기 마커의 존재는 TCF7L2 치료제에 대한 양성 반응의 가능성(probability)을 표시하는 것인 TCF7L2 치료제에 대한 반응의 가능성에 대해 개체를 평가하는 방법에 관한 것이다. 일 구체예에서, 마커는 DG10S478, rs12255372, rs7895340, rs11196205, rs7901695, rs7903146, rs12243326, 및 rs4506565로 구성된 군으로부터 선택된다. 또 다른 구체예에서, 마커는 마커 DG10S478 또는 마커 rs7903146이고, DG10S478에서 0이 아닌 대립형질 또는 rs7903146에서 T 대립형질의 존재는 TCF7L2 치료제에 대한 양성 반응의 가능성을 표시한다.
본 발명의 또 다른 양태는 타입 II 당뇨병의 치료용 약제의 제조를 위한 TCF7L2 치료제의 용도에 관한 것이다. 일 구체예에서, TCF7L2 치료제는 Wnt 신호전달(signaling) 경로 또는 카데린(cadherin) 경로에서 활성을 변화시키는 작용제이다. 또 다른 구체예에서, TCF7L2 치료제는 하기의 작용제 표(Agnet Table)에 표시된 그룹으로부터 선택된다.
본 발명의 전술된 목적, 특징 및 장점 및 다른 목적, 특징 및 장점은 하기에 기재된 본 발명의 바람직한 구체예의 보다 상세한 설명으로부터 명확할 것이다.
발명의 상세한 설명
본 발명의 바람직한 구체예의 설명이 하기에 기재된다.
타입 II 당뇨병과 관련된 유전자좌 (Loci Associated with Type II Diabetes)
타입 II 당뇨병은 손상된 인슐린 분비, 말단 조직의 인슐린 저항성 및 간에 의한 증가된 포도당 생성과 같은 메카니즘을 통해 일어날 수 있는 고혈당증을 특징으로 한다. 대부분의 타입 II 당뇨병 환자들은 신장병증, 신경병증, 망막병증을 포함한 만성 고혈당증의 심각한 합병증 및 심혈관질환의 가속화된 발생을 겪는다. 전세계적으로 타입 II 당뇨병의 유병률은 현재 6%이나, 향후 10년 동안 상승할 것으로 예측된다(1). 타입 II 당뇨병의 유병률의 증가는 인구의 증가된 연령 및 비만증의 증가에 기인한다.
다양한 인종 그룹간의 유병률 차이(2, 3), 이란성 쌍동이보다는 일란성 쌍동이간의 보다 높은 일치율(concordance rate)(4, 5) 및 유럽 인구 중 타입 II 당뇨병에 대한 약 3.5(6)의 친족의 상대적 위험(sibling relative risk)(λs)을 포함한, 타입 II 당뇨병의 위험에 대한 유전적 성분에 대한 증거가 있다. 현재까지 타입 II 당뇨병과 연관된 유전자를 탐색하기 위해 두 개의 접근방법들이 이용되었다. 후보 유전자들 내에서 단일 뉴클레오티드 다형성(Single nucleotide polymorphisms: SNP)이 관련성(association)에 대해 테스트되었고, 이들은 전반적으로 재현되지 않거나 또는 타입 II 당뇨병의 미약한 위험만을 부여하며- 가장 널리 보고된 것은 퍼옥시좀 증식자 활성화 수용체 감마 유전자(peroxisome proliferator activated receptor gamma gene: PPARG2)(7)에서의 보호성 Pro 12Ala 다형성 및 칼륨 내향성-정정 채널, 서브패밀리 J, 멤버 11 유전자(potassium inwardly-rectifying channel, subfamily J, member 11 gene)(KIR6.2)에서의 위험상태 다형성(at risk prolymorphism)이다(8).
일반적인 유형의 타입 II 당뇨병을 갖는 패밀리에서 게놈-전체의 연관 스캐닝(genome-wide linkage scan)은 여러 개의 유전자 좌를 생성했고, 국제적인 연구 컨소시움의 주요한 관심은 다수의 개체군에서 관찰된 1번, 12번 및 20번 염색체상의 유전자 좌들이었다(6). 이 유전자 좌들의 유전자들은 아직 확인되지 않았다. 그러나, 멕시코계 미국인에서, 칼파인(calpain) 10(CAPN10) 유전자는 염색체 2q 상의 유전자 좌로부터 분리되고; 이는 포지션 클로닝(positional clonging)(9)을 통해 현재까지 확인된 일반적인 유형의 타입 II 당뇨병에 대한 유일한 유전자를 나타낸다. 드문 멘델형(Mendelian form)의 타입 II 당뇨병, 즉, MODY(Maturity-Onset Diabetes of the Young)은 포지션 클로닝에 의해 6개의 유전자를 생성했다(6).
본 발명자들은 이전에 아이슬란드 개체군에서 타입 II 당뇨병에 대해 염색체 5q에 대한 게놈-전반의 유의성 있는 연관을 보고했으며(10); 동일한 연구에서, 본 발명자들은 또한, 10q 및 12q에 대한 연관의 시사적인 증거를 보고했다. 10q 영역에 대한 연관은 또한 멕시코계 미국인들에서도 관찰되었다(11).
전사 인자 7-유사 2 유전자( TCF7L2 )의 타입 II 당뇨병과의 관련성( association )
본 발명은 T-세포 전사 인자 4를 코딩하는 유전자(TCF4- 공식적인 유전자 심볼 TCF7L2) 내에서 타입 II 당뇨병-연관 LD 블럭("TCF7L2의 엑손 4 LD 블럭")의 확인에 관한 것이다. 마이크로새틀라이트(microsatellite) DG10S478 및 SNP 마커 rs7903146 및 rs12255372를 포함한, TCF7L2의 엑손 4 LD 블럭 내의 수개의 마커는 타입 II 당뇨병과 관련된 것으로 발견되었다. 아이슬란드 코호트(cohort)에서 최초로 발견된, DG10S478 (P=1.3x10-9; 상대적 위험(Relative risk)=1.45 ; 개체군 기여 위험(ppulation attributable risk) =22.7%)의 원래의 연관은 뒤이어 덴마크의 타입 II 당뇨병 코호트 및 미국의 코카서스인 코호트에서 재현되었다. DG10S478은 10q25.2 상의 TCF7L2 유전자의 인트론 3 및 인트론 3의 일부, 엑손 4 전체 및 인트론 4의 일부를 캡슐화하는 74.9 kb의 잘 정의된 LD 블럭 내에 위치한다. TCF7L2 유전자 생성물은 APC3/β-카테닌/TCF 경로로도 알려진, Wnt 신호전달 경로에서 역할을 수행하는 HMG(High Mobility Group) 박스-포함 전사 인자이다. TCF7L2는 Wnt 경로 멤버, β-카테닌 및 글리코겐 신타아제 키나아제-3베타를 통해 프로글루카곤(proglucagon) 유전자 발현(글루코오스 항상성(glucose homeostasis)에서 핵심적인 주체)의 세포 유형-특이적 조절을 매개한다(12). 또한, Wnt 신호전달은 지방생성(adipogenic) 전사 인자 CCAAT/인핸서 결합 단백질 알파(C/EBPalpha) 및 퍼옥시좀 증식자-활성화 수용체 감마(PPARgamma)의 억제를 통해 프리아디포사이트(preadipocyte)를 미분화 상태로 유지한다(13). 프리아디포사이트에서 Wnt 신호전달이 우성-음성(dominant-negative) TCF7L2의 과다발현에 의해 방지되는 경우, 이 세포들은 아디포사이트로 분화된다(13). 또한, Wnt/β-카테닌 신호전달 경로는 결장암 세포에서 β-카테닌과 TCF7L2간의 물리적 상호작용을 통해 PPARgamma 활성을 표적으로 하는 것으로 보고되었다(14). 다기능성(multifunctional) β-카테닌 단백질은 카데린(cadhein)으로의 결합을 통해 세포 부착(cell adhesion)을 매개하기 위해 중요하다(15).
이 발견의 결과로, 현재 타입 II 당뇨병에 대한 감수성의 진단, 및 타입 II 당뇨병에 대한 감소된 감수성의 진단 및/또는 타입 II 당뇨병에 대한 보호의 방법이 이용가능하다. 본 발명의 바람직한 구체예에서, 진단 분석법은 마커 DG10S478에서 0 대립형질(타입 II 당뇨병에 대한 감소된 감수성과 연관되고, 타입 II 당뇨병에 대한 보호성인 대립형질); 마커 DG10S478에서 0이 아닌 대립형질(예를 들면, -4, 4, 8, 12, 16 또는 20, 또는 기타 대립형질)(타입 II 당뇨병에 대한 감수성과 연관됨); SNP rs12255372에서 G 대립형질(타입 II 당뇨병에 대한 감소된 감수성과 연관되고, 타입 II 당뇨병에 대한 보호성인 대립형질): SNP rs12255372에서 T 대립형질(타입 II 당뇨병에 대한 감수성과 연관됨); SNP rs7895340에서 G 대립형질(타입 II 당뇨병에 대한 감소된 감수성과 연관되고, 타입 II 당뇨병에 대한 보호성인 대립형질); SNP rs7895340에서 A 대립형질(타입 II 당뇨병에 대한 감수성과 연관됨); SNP rs11196205에서 G 대립형질(타입 II 당뇨병에 대한 감소된 감수성과 연관되고, 타입 II 당뇨병에 대한 보호성인 대립형질); SNP rs11196205에서 C 대립형질(타입 II 당뇨병에 대한 감수성과 연관됨); SNP rs7901695에서 T 대립형질(타입 II 당뇨병에 대한 감소된 감수성과 연관되고, 타입 II 당뇨병에 대한 보호성인 대립형질); SNP rs7901695에서 C 대립형질(타입 II 당뇨병에 대한 감수성과 연관됨); SNP rs7903146에서 C 대립형질(타입 II 당뇨병에 대한 감소된 감수성과 연관되고, 타입 II 당뇨병에 대한 보호성인 대립형질); SNP rs7903146에서 T 대립형질(타입 II 당뇨병에 대한 감수성과 연관됨); SNP rs12243326에서 C 대립형질(타입 II 당뇨병에 대한 감수성과 연관됨); 및 SNP rs4506565에서 T 대립형질 (타입 II 당뇨병에 대한 감수성과 연관됨)을 포함한 특정한 대립형질의 존재를 확인하기 위해 이용된다. 본 발명의 추가적인 구체예에서, 본 명세서에 기재된 방법을 이용하여 확인된, 다른 마커 또는 SNP가 타입 II 당뇨병에 대한 감수성의 진단, 및 또한 타입 II 감수성에 대한 감소된 감수성의 진단 또는 타입 II 당뇨병에 대해 보호성인 대립형질의 확인을 위해 이용될 수 있다. 이하에서 제시된 진단 분석법은 이와 같은 특정한 대립형질의 존재 또는 부재를 확인하기 위해 이용될 수 있다.
진단 분석법
본 명세서에 기재된 바와 같은 핵산, 프로브, 프라이머 및 항체는 타입 II 당뇨병에 대한 감수성을 진단하는 다양한 방법 및 키트(예를 들면, 타입 II 당뇨병에 대한 감수성의 진단에 유용한 키트)에서 사용될 수 있다. 마찬가지로, 본 명세서에 기재된 핵산, 프로브, 프라이머 및 항체는 타입 II 당뇨병에 대한 감소된 감수성의 진단 방법, 및 타입 II 당뇨병에 대한 보호의 진단 방법, 및 또한 키트에서 사용될 수 있다. 일 양태에서, 본 발명의 키트는 목적 마커를 증폭하기 위해 이용될 수 있는 프라이머를 포함한다.
본 발명의 일 양태에서, 타입 II 당뇨병에 대한 감수성의 진단은 본 명세서에 기재된 바와 같은 TCF7L2 핵산에서 다형성(예를 들면, 마커 DG10S478 또는 SNP rs12255372, rs7895340, rs11196205, rs7901695, rs7903146, rs12243326, rs4506565에서의 대립형질)을 검출하는 단계에 의해 수행될 수 있다. 다형성은 프레임 쉬프트(frame shift)를 초래하는, 단일 뉴클레오티드 또는 하나보다 많은 뉴클레오티드의 삽입 또는 결실; 코딩된 아미노산의 변화를 초래하는, 하나 이상의 뉴클레오티드의 변화; 조기 종료 코돈(premature stop codon)의 생성을 초래하는, 하나 이상의 뉴클레오티드의 변화; 뉴클레오티드에 의해 코딩된 하나 이상의 아미노산의 결실을 초래하는 수개의 뉴클레오티드의 결실; 유전자의 코딩 서열의 중단(interruption)을 초래하는 불균등 재조합(unequal recombination) 또는 유전자 전환(gene conversion)과 같은 하나 이상의 뉴클레오티드의 삽입; 유전자의 전체 또는 일부의 중복(duplication); 유전자의 전체 또는 일부의 전위(trasnpostion); 또는 유전자의 전체 또는 일부의 재배열(rearrangement)과 같은 TCF7L2 핵산에서의 변화일 수 있다. 하나 이상의 그와 같은 변화가 단일 유전자에 존재할 수 있다. 그와 같은 서열 변화는 TCF7L2 핵산에 의해 코딩되는 폴리펩티드에서 변화를 유발한다. 예를 들면, 차이가 프레임 쉬프트 변화인 경우, 프레임 쉬프트는 코딩된 아미노산의 변화를 초래할 수 있고, 및/또는 조기 종료 코돈의 생성을 초래하여, 절단된(truncated) 폴리펩티드의 생성을 유발할 수 있다. 대안적으로, TCF7L2와 관련된 질병 또는 증상 또는 TCF7L2와 관련된 질병 또는 증상에 대한 감수성과 관련된 다형성은 하나 이상의 뉴클레오티드의 동의적 변화(synonymous alteration)(즉, TCF7L2 핵산에 의해 코딩된 폴리펩티드에서 변화를 초래하지 않는 변화)일 수 있다. 그와 같은 다형성은 스플라이싱 부위(splicing site)를 변화시키거나, mRNA의 안정성 또는 수송(transport)에 영향을 미치거나, 또는 유전자의 전사 또는 번역에 영향을 미칠 수 있다. 전술된 임의의 변화 또는 전환을 갖는 TCF7L2 핵산은 본 명세서에서 "변화된 핵산(altered nucleic acid)"으로 지칭된다.
타입 II 당뇨병에 대한 감수성을 진단하는 제1 방법에서, 서던 분석(Southern analysis), 노던 분석(Northern analysis), 또는 인 시투 혼성화(in situ hybridization)와 같은 혼성화 방법이 이용될 수 있다(1999년까지의 모든 추록을 포함한, Current Protocols in Molecular Biology, Ausubel, F. et al, eds, John Wiley & Sons 참조). 예를 들면, 테스트 대상(test subject("테스트 개체(test individual)")으로부터의 게놈 DNA, RNA, 또는 cDNA의 생물학적 시료("테스트 시료")가 타입 II 당뇨병을 갖거나, 이에 대해 감수성이 높거나 또는 이에 대한 소인을 갖거나(predisposed), 또는 이에 대한 결함을 갖는 것으로 의심되는 개체와 같은 개체로부터 수득될 수 있다(RNA 및 cDNA만이 엑손 마커(exonic marker)에 대해 이용될 수 있다). 개체는 성인, 어린이, 또는 태아일 수 있다. 테스트 시료는 혈액 시료, 양수 시료, 뇌척수액 시료, 또는 피부, 근육, 구강점막 또는 결막점막, 태반, 위장관 또는 기타 기관으로부터의 조직 시료와 같은, 게놈 DNA를 함유하는 임의의 기원으로부터 유래될 수 있다. 태아 세포 또는 조직으로부터의 DNA의 테스트 시료는 양수천자(amniocentesis) 또는 융모막 융모 샘플링(chorionic villus sampling)과 같은 적합한 방법에 의해 수득될 수 있다. 그 후, TCF7L2 핵산에 다형성이 존재하는지 여부 및/또는 TCF7L2에 의해 코딩되는 스플라이싱 변이체(splicing variant)가 존재하는지 여부를 결정하기 위해 DNA, RNA, 또는 cDNA 시료가 조사된다. 다형성 또는 스플라이싱 변이체의 존재는 게놈 DNA, RNA, 또는 cDNA의 유전자의 핵산 프로브로의 혼성화에 의해 표시될 수 있다. 본 명세서에서 사용된, "핵산 프로브(nucleic acid probe)"는 DNA 프로브 또는 RNA 프로브일 수 있고; 핵산 프로브는 예를 들면, TCF7L2 핵산에 하나 이상의 다형성을 포함할 수 있고 및/또는 TCF7L2 핵산의 특정한 스플라이싱 변이체를 코딩하는 핵산을 포함할 수 있다. 프로브는 임의의 전술된 핵산 분자일 수 있다(예를 들면, 유전자 또는 핵산, 단편, 상기 유전자 또는 핵산을 포함하는 벡터, 프로브 또는 프라이머, 등).
타입 II 당뇨병에 대한 감수성을 진단하기 위해, TCF7L2 핵산을 포함하는 테스트 시료를 하나 이상의 핵산 프로브와 접촉시키는 것에 의해 혼성화 시료가 형성될 수 있다. mRNA 또는 게놈 DNA를 검출하기 위해 바람직한 프로브는 본 명세서에 기재된 mRNA 또는 게놈 DNA로 혼성화될 수 있는 표지된 핵산 프로브이다. 핵산 프로브는 예를 들면, 전장(full-length) 핵산 분자 또는 그의 부분, 예를 들면, 엄격한 조건(stringent condition) 하에서 적합한 mRNA 또는 게놈 DNA에 특이적으로 혼성화되기에 충분한 길이의 15개, 30개, 50개, 100개, 250개, 또는 500개 이상의 뉴클레오티드로 구성된 올리고뉴클레오티드일 수 있다. 본 발명의 진단 분석법에서의 사용에 적합한 프로브는 전술된 바와 같다(예를 들면, "본 발명의 핵산(Nucleic Acids of the Invention)"이라는 표제 하에 검토된 프로브 및 프라이머 참조).
혼성화 시료는 핵산 프로브의 TCF7L2 핵산으로의 특이적 혼성화를 허용하기에 충분한 조건 하에서 유지된다. 본 명세서에서 사용된 "특이적 혼성화(specific hybridizaiton)"는 정확한 혼성화(예를 들면, 불일치(mismatch)를 포함하지 않는 혼성화)를 의미한다. 특이적 혼성화는 예를 들면, 전술된 바와 같이, 높은 엄격성 조건 또는 중간 정도의 엄격성(moderate stringency) 조건 하에서 수행될 수 있다. 특히 바람직한 양태에서, 특이적 혼성화를 위한 혼성화 조건은 높은 엄격성이다.
존재하는 경우, 그 후, 특이적 혼성화는 표준 방법을 이용하여 검출된다. 핵산 프로브와 시료 내의 TCF7L2 핵산 간에 특이적 혼성화가 일어나는 경우, TCF7L2는 핵산 프로브에 존재하는 다형성을 갖거나 또는 스플라이싱 변이체이다. 이 방법에서 하나 이상의 핵산 프로브가 동시에 사용될 수 있다. 임의의 핵산 프로브의 특이적 혼성화는 TCF7L2 핵산에서 다형성을 표시하거나 또는 TCF7L2 핵산을 코딩하는 특정한 스플라이싱 변이체의 존재를 표시하며 타입 II 당뇨병에 대한 감수성 또는 타입 II 당뇨병에 대한 감소된 감수성을 나타낼 수 있다(또는 타입 II 당뇨병에 대한 보호성 대립형질을 표시할 수 있다).
노던 분석에서(Current Protocols in Molecular Biology, Ausubel, F. et at, eds., John Wiley & Sons, supra 참조), 타입 II 당뇨병에 대한 감수성 또는 타입 II 당뇨병에 대한 감소된 감수성과 관련된 다형성 또는 특정한 스플라이싱 변이체의 존재를 확인하기 위해 전술된 혼성화 방법이 이용될 수 있다. 노던 분석의 경우, RNA의 테스트 시료가 적합한 수단에 의해 개체로부터 수득된다. 전술된 바와 같이, 핵산 프로브의 개체로부터의 RNA로의 특이적 혼성화는 TCF7L2 핵산의 다형성, 또는 TCF7L2 핵산에 의해 코딩되는 특정한 스플라이싱 변이체의 존재를 표시하며 따라서, 타입 II 당뇨병에 대한 감수성 또는 타입 II 당뇨병에 대한 감소된 감수성을 진단할 수 있다(또는 타입 II 당뇨병에 대한 보호성 대립형질을 표시할 수 있다).
핵산 프로브의 용도의 대표적인 예를 위해, 예를 들면, 미국특허 제5,288,611호 및 제4,851,330호를 참조한다.
대안적으로, 펩티드 핵산(Peptide Nucleic Acid: PNA)이 전술된 혼성화 방법에서 핵산 프로브 대신 이용될 수 있다. PNA는 메틸렌 카르보닐 링커를 통해 글리신의 질소에 결합된 유기 염기(A, G, C, T 또는 U)를 갖는, N-(2-아미노에틸)글리신 단위들과 같은 펩티드-유사, 무기 백본을 갖는 DNA 모방체(DNA mimic)이다(예를 들면, Nielsen, P.E. et al, Bioconjugate Chemistry 5, American Chemical Society, p. 1 (1994) 참조). PNA 프로브는 TCF7L2 핵산에 특이적으로 혼성화하도록 설계될 수 있다. PNA 프로브의 TCF7L2 핵산으로의 혼성화는 타입 II 당뇨병에 대한 감수성 또는 타입 II 당뇨병에 대한 감소된 감수성을 진단할 수 있다(또는 타입 II 당뇨병에 대한 보호성 대립형질을 표시할 수 있다).
본 발명의 또 다른 방법에서, 유전자의 변화(alteration)(돌연변이) 또는 다형성이 제한효소 작용 부위(restriction site)의 생성 또는 제거를 초래하는 경우, 제한효소 처리(restriction digestion)에 의한 변화 분석이 유전자의 변화를 검출하기 위해 이용될 수 있다. 개체로부터 게놈 DNA를 포함하는 테스트 시료가 수득된다. 테스트 개체로부터의 게놈 DNA의 테스트 시료에서 TCF7L2 핵산(및, 필요한 경우, 그 플랭킹 서열(flanking sequence))을 증폭하기 위해 중합효소 연쇄반응(PCR)이 이용될 수 있다. RFLP 분석은 전술된 바와 같이 수행된다(Current Protocols in Molecular Biology, supra 참조). 상응하는 DNA 단편의 제한효소 처리(digestion) 패턴은 TCF7L2 핵산에서 변화 또는 다형성의 존재 또는 부재를 나타내고, 따라서, 타입 II 당뇨병에 대한 감수성 또는 타입 II 당뇨병에 대한 감소된 감수성을 표시할 수 있다(또는 타입 II 당뇨병에 대한 보호성 대립형질을 표시할 수 있다).
또한, TCF7L2 핵산에서 특정한 다형성을 검출하기 위해 서열 분석이 이용될 수 있다. 테스트 개체로부터 DNA 또는 RNA의 테스트 시료가 수득된다. 유전자 또는 핵산, 및/또는 원하는 경우, 그의 플랭킹 서열을 증폭하기 위해 PCR 또는 다른 적합한 방법이 이용될 수 있다. TCF7L2 핵산, 또는 상기 핵산의 단편, 또는 cDNA 또는 cDNA의 단편, 또는 mRNA 또는 mRNA의 단편의 서열이 표준 방법을 이용하여 결정될 수 있다. 핵산, 핵산 단편, cDNA, cDNA 단편, mRNA, 또는 mRNA 단편의 서열이 적합한 경우, 유전자, cDNA, 또는 mRNA의 공지된 핵산 서열과 비교된다. TCF7L2에서 다형성의 존재는 해당 개체가 타입 II 당뇨병에 대한 감수성 또는 타입 II 당뇨병에 대한 감소된 감수성을 갖는다는 것을 표시한다(또는, 타입 II 당뇨병에 대한 보호성 대립형질을 표시한다).
또한, 증폭된 올리고뉴클레오티드와 대립형질-특이적 올리고뉴클레오티드(Allele-Specific Oligonucleotide: ASO) 프로브 간의 도트-블롯 혼성화(dot-blot hybridization)를 통해, TCF7L2 핵산에서 다형성의 존재를 검출하기 위해 대립형질-특이적 올리고뉴클레오티드가 사용될 수 있다(예를 들면, Saiki, R. et al, Nature 324:163-166 (1986) 참조). "대립형질-특이적 올리고뉴클레오티드(allele-specific oligonucleotide)"(본 명세서에서 "대립형질-특이적 올리고뉴클레오티드 프로브"로도 지칭됨)는 TCF7L2 핵산에 특이적으로 혼성화되고, 타입 II 당뇨병에 대한 감수성과 관련된 다형성 또는 타입 II 당뇨병에 대한 감소된 감수성과 관련된 다형성(또는 타입 II 당뇨병에 대한 보호성 대립형질을 표시하는 다형성)을 포함하는, 약 10-50개의 염기쌍, 바람직하게는 약 15-30개의 염기쌍의 올리고뉴클레오티드이다. TCF7L2 핵산 내의 특정한 다형성에 대해 특이적인 대립형질-특이적 올리고뉴클레오티드 프로브는 표준 방법을 이용하여 제조될 수 있다(Current Protocols in Molecular Biology, supra 참조). 유전자에서 타입 II 당뇨병과 관련된 다형성을 확인하기 위해, DNA의 테스트 시료가 개체로부터 수득된다. TCF7L2 핵산 전체 또는 그의 단편 및 그의 플랭킹 서열을 증폭하기 위해 PCR이 이용될 수 있다. 증폭된 TCF7L2 핵산(또는 그 유전자 또는 핵산의 단편)을 포함하는 DNA가 표준 방법(Current Protocols in Molecular Biology, supra 참조)을 이용하여 도트-블롯되고, 상기 블롯이 올리고뉴클레오티드 프로브와 접촉된다. 이때, 프로브의 증폭된 TCF7L2 으로의 특이적 혼성화의 존재가 검출된다. 대립형질-특이적 올리고뉴클레오티드 프로브의 개체로부터의 DNA로의 혼성화는 TCF7L2 핵산 내 다형성을 표시하고, 따라서, 타입 II 당뇨병에 대한 감수성을 표시하거나 또는 타입 II 당뇨병에 대한 감소된 감수성을 표시한다(또는 타입 II 당뇨병에 대한 보호성 대립형질을 표시한다).
본 발명은 또한, 단일 뉴클레오티드 다형성을 포함하는 유전자 또는 핵산의 기준(reference) 또는 변이체 대립형질 또는 그의 상보체(complement)에 혼성화하는 대립형질-특이적 올리고뉴클레오티드를 제공한다. 이 올리고뉴클레오티드는 프로브 또는 프라이머일 수 있다.
대립형질-특이적 프라이머는 다형성과 중첩된 표적 DNA 상의 부위에 혼성화되어 상기 프라이머가 완전한 상보성(complementarity)을 보이는 대립형질 형태의 증폭을 준비한다(prime). Gibbs, Nucleic Acid Res. 17, 2427-2448 (1989) 참조. 이 프라이머는 말단 부위(distal site)에서 혼성화하는 제2의 프라이머와 함께 사용된다. 증폭은 상기 두 개의 프라이머로부터 진행되어, 검출가능한 생성물을 가져오고, 이는 특정한 대립형질 형태가 존재한다는 것을 나타낸다. 대조구는 통상적으로 하나의 프라이머는 다형성 부위에서 단일 염기 불일치를 보이고 나머지 프라이머는 말단 부위에 대한 완전한 상보성을 보이는 것인 제2의 프라이머 쌍으로 수행된다. 단일-염기 불일치는 증폭을 방해하며 검출가능한 생성물이 형성되지 않는다. 이 방법은 불일치가 다형성과 정렬된 올리고뉴클레오티드의 3'에 가장 가까운 위치(3'-most positon)에 포함되는 경우 가장 효과적으로 수행되며, 이는 이 위치가 프라이머로부터의 신장을 가장 불안정하게 하기 때문이다(예를 들면, WO 93/22456 참조).
LNA(Locked Nucleic Acid)와 같은 유사체(analog)의 첨가로, 프라이머 및 프로브의 크기는 8개의 염기로 구성된 크기까지 감소될 수 있다. LNA는 푸라노오스(furanose) 고리에서 2' 및 4' 위치가 O-메틸렌(옥시-LNA), S-메틸렌(티오-LNA), 또는 아미노 메틸렌(아미노-LNA) 모이어티를 통해 연결된 것인 신규한 종류의 이중고리형(bicyclic) DNA 유사체이다. 이와 같은 LNA 변이체 모두에 공동된 것은 상보적 핵산에 대한 친화성이고, 이는 DNA 유사체에 대해 가장 높은 것으로 보고되었다. 예를 들면, 특정한 모든 옥시-LNA 9합체(nonamer)는 상응하는 DNA 9합체에 대한 DNA 및 RNA에 대한 28EC와 대조적으로, 각각 상보적인 DNA 또는 RNA와 복합체를 형성하는 경우, 64EC 및 74EC의 용융온도(melting temperature)를 갖는 것으로 입증되었다. 용융온도의 실질적인 증가는 또한 LNA 단량체가 표준 DNA 또는 RNA 단량체와 조합되어 사용되는 경우 수득된다. 프라이머 및 프로브의 경우, LNA 단량체가 포함된 위치에 따라(예를 들면, 3' 말단, 5' 말단, 또는 중간부), Tm은 상당히 증가될 수 있다.
또 다른 양태에서, 개체로부터의 표적 핵산 서열 세그먼트에 상보적인 올리고뉴클레오티드 프로브의 어레이가 TCF7L2 핵산에서의 다형성을 확인하기 위해 이용될 수 있다. 예를 들면, 일 양태에서, 올리고뉴클레오티드 어레이가 이용될 수 있다. 올리고뉴클레오티드 어레이는 통상적으로 상이한 공지된 위치에서 기판(substrate)의 표면에 결합된 복수 개의 상이한 올리고뉴클레오티드를 포함한다. "Genechip™"으로도 지칭되는 이 올리고뉴클레오티드 어레이는 본 발명이 속하는 기술분야에서 널리 개시되었으며, 예를 들면, 미국특허 제5,143,854호 및 PCT 특허출원공개 WO 90/15070 및 92/10092에 개시된다. 이 어레이들은 일반적으로 기계적 합성 방법 또는, 포토리소그래피(photolithography) 방법과 고상 올리고뉴클레오티드 합성(solid-phase oligonucleotide synthesis) 방법을 결합한 광-유도 합성(light directed synthesis) 방법을 이용하여 제조된다. 그 전체가 참조에 의해 본 명세서에 포함된, Fodor et al, Science 251:767-777 (1991), Pirrung et al, 미국특허 제5,143,854호(또한, PCT 출원 WO 90/15070 참조) 및 Fodor et al, PCT 특허공개 WO 92/10092 및 미국특허 제5,424,186호를 참조한다. 기계적 합성 방법을 이용한 이 어레이의 합성을 위한 기법은 예를 들면, 그 전체가 참조에 의해 본 명세서에 포함된, 미국특허 제5,384,261호에 기재된다. 또 다른 예에서, 선형 어레이(linear array)가 또한 이용될 수 있다.
일단 올리고뉴클레오티드 어레이가 제조되면, 목적 핵산(nucleic acid of interest)이 상기 어레이와 혼성화되고, 다형성의 존재 여부에 대해 스캐닝된다. 혼성화 및 스캐닝은 일반적으로 본 명세서에 기재된 방법 및 또한 예를 들면, 그 전체의 교시가 참조에 의해 본 명세서에 공개된 PCT 출원 WO 92/10092 및 WO 95/11995, 및 미국특허 제5,424,186호에 개시된다. 요약하면, 하나 이상의 이전에 확인된 다형성 마커를 포함하는 표적 핵산 서열이 예를 들면, PCR과 같은 잘 알려진 증폭 기법에 의해 증폭된다. 통상적으로, 이는 다형성의 상류(upstream) 및 하류(downstream)에 있는 표적 서열의 두 가닥에 상보적인 프라이머 서열의 이용을 포함한다. 비대칭적 PCR 기법이 또한 이용될 수 있다. 일반적으로 표지를 결합한, 증폭된 표적이 적합한 조건 하에서 어레이와 혼성화된다. 혼성화의 완료 및 어레이의 세척 후에, 어레이는 표적 서열이 혼성화된 어레이 상의 위치를 결정하기 위해 스캐닝된다. 스캐닝으로부터 수득된 혼성화 데이터는 통상적으로 어레이 상의 위치의 함수인 형광 강도의 형태이다.
주로 단일 검출 블럭, 예를 들면, 단일 다형성을 검출하기 위한 단일 검출 블럭의 측면에서 기재되나, 어레이는 복수 개의 검출 블럭을 포함할 수 있고, 따라서, 복수 개의 특정한 다형성을 분석할 수 있다. 대안적인 양태에서, 검출 블럭은 단일 어레이 또는 복수 개의 별개의 어레이 내에서 그룹화되어, 표적의 어레이로의 혼성화 동안 다양한, 최적 조건들이 이용될 수 있는 것으로 이해될 것이다. 예를 들면, A-T 풍부 세그먼트(A-T rich segment)에 속하는 다형성과 별개로, 게놈 서열의 G-C 풍부 스트레치(G-C rick stretch)에 속하는 다형성의 검출을 제공하는 것이 종종 바람직할 수 있다. 이는 각 상황에 따른 별개의 혼성화 조건의 최적화를 가능하게 한다.
다형성 검출을 위한 올리고뉴클레오티드 어레이의 추가적인 용도는 예를 들면, 참조에 의해 전체 교시가 본 명세서에 포함된, 미국특허 제5,858,659호 및 제5,837,832호에서 발견된다. 기타 핵산 분석 방법들이 타입 II 당뇨병 유전자 내의 다형성 또는 타입 II 당뇨병 유전자에 의해 코딩되는 변이체를 검출하기 위해 이용될 수 있다. 대표적인 방법은 직접적인 수동 서열결정(direct manual sequencing)(Church and Gilbert, Proc. Natl. Acad. ScL USA 81:1991-1995 (1988); Sanger, F. et al, Proc. Natl. Acad. ScL USA 74:5463-5467 (1977); Beavis et al, U.S. Pat. No. 5,288,644); 자동화된 형광 서열분석(automated fluorescent sequencing); 단일가닥 형상 다형성 분석(single-stranded conformation polymorphism assay: SSCP); CDGE(clamped denaturing gel electrophoresis); DGGE(denaturing gradient gel electrophoresis )(Sheffield, V.C. et al, Proc. Natl Acad. ScL USA 86:232-236 (1989)), 운동성 변화 분석(mobility shift analysis)(Orita, M. et al, Proc. Natl Acad. ScL USA 86:2766-2770 (1989)), 제한 효소 분석(Flavell et al, Cell 15:25 (1978); Geever, et al, Proc. Natl. Acad. ScL USA 78:5081 (1981)); 헤테로듀플렉스(heteroduplex) 분석; CMC(chemical mismatch cleavage)(Cotton et al, Proc. Natl. Acad. ScL USA 85:4397-4401 (1985)); RNase 보호 분석(RNase protection assays)(Myers, R.M. et al, Science 230:1242 (1985)); 대장균 mutS 단백질과 같은, 뉴클레오티드 불일치를 인식하는 폴리펩티드의 이용; 대립형질-특이적 PCR을 포함한다.
본 발명의 일 양태에서, 타입 II 당뇨병에 대한 감수성 또는 타입 II 당뇨병에 대한 감소된 감수성의 진단(또는 타입 II 당뇨병에 대한 보호성 대립형질을 표시하는 감수성의 진단)은 또한 정량적(quantitiative) PCR(동력적 열 사이클링(kinetic thermal cycling))에 의한 발현 분석에 의해 수행될 수 있다. TaqMan® 분석법을 이용한 이 기법은 TCF7L2 핵산에 의해 코딩된 폴리펩티드 또는 TCF7L2 핵산에 의해 코딩된 스플라이싱 변이체의 발현 또는 조성 상의 변화의 존재를 평가할 수 있다. TaqMan® 프로브는 또한, 다형성의 확인 및 환자가 동형접합형(homozygous) 또는 이형접합형(heterozygous)인지 여부를 확인하기 위해 이용될 수 있다. 또한, 변이체의 발현은 물리적으로 또는 기능적으로 상이한 것으로 정량될 수 있다.
본 발명의 또 다른 양태에서, 타입 II 당뇨병에 대한 감수성 또는 타입 II 당뇨병에 대한 감소된 감수성(또는 타입 II 당뇨병에 대한 보호성 대립형질의 표시)의 진단은 ELISA(enzyme linked immunosorbent assay), 웨스턴 블롯, 면역침전법(immunoprecipitation) 및 면역형광법(immunofluorescence)을 포함한 다양한 방법에 의해, TCF7L2 폴리펩티드의 발현 및/또는 조성을 조사하는 것에 의해 수행될 수 있다. 개체로부터의 테스트 시료를 대상으로 TCF7L2 핵산에 의해 코딩된 폴리펩티드의 발현의 변화 및/또는 조성의 변화, 또는 TCF7L2 핵산에 의해 코딩된 특정한 변이체의 존재 여부가 평가된다. TCF7L2 핵산에 의해 코딩된 폴리펩티드의 발현의 변화는 예를 들면, 정량적 폴리펩티드 발현(즉, 생산된 폴리펩티드의 양)의 변화일 수 있고; TCF7L2 핵산에 의해 코딩된 폴리펩티드의 조성의 변화는 정성적 폴리펩티드 발현(즉, 변화된 TCF7L2 폴리펩티드 또는 상이한 스플라이싱 변이체의 발현)의 변화이다. 바람직한 양태에서, 타입 II 당뇨병에 대한 감수성 또는 타입 II 당뇨병에 대한 감소된 감수성의 진단은 TCF7L2에 의해 코딩된 특정한 스플라이싱 변이체 또는 스플라이싱 변이체의 특정한 패턴을 검출하는 것에 의해 수행될 수 있다.
또한, 그와 같은 변화(정량적 및 정성적 변화)가 모두 존재할 수 있다. 본 명세서에서 사용된, 용어 폴리펩티드 발현 또는 조성의 "변화(alteration)"는 대조 시료에서 TCF7L2 핵산에 의한 폴리펩티드의 발현 대비, 테스트 시료에서 발현 또는 조성의 변화를 의미한다. 대조 시료는 테스트 시료에 상응하는 시료(예를 들면, 동일한 유형의 세포로부터 유래)이고, 타입 II 당뇨병에 대한 감수성에 의해 영향받지 않은 개체로부터 유래된다. 대조 시료 대비, 테스트 시료에서 폴리펩티드의 발현 또는 조성의 변화는 타입 II 당뇨병에 대한 감수성을 표시한다. 유사하게, 대조 시료 대비, 테스트 시료에서 하나 이상의 상이한 스플라이싱 변이체의 존재 또는 테스트 시료에서 상이한 스플라이싱 변이체의 유의성 있게 상이한 양의 존재는 타입 II 당뇨병에 대한 감수성을 표시한다. 분광법(spectroscopy), 비색법(colorimetry), 전기영동(electrophoresis), 등전점 전기영동(isoelectric focusing) 및 면역블롯팅(immunoblotting)과 같은 면역분석법(immunoassay)(예를 들면, David et al, 미국특허 제4,376,110호)을 포함한, TCF7L2 핵산에 의해 코딩된 폴리펩티드의 발현 또는 조성을 조사하기 위한 다양한 수단들이 이용될 수 있다(또한, Current Protocols in Molecular Biology, particularly Chapter 10 참조). 예를 들면, 일 양태에서, 폴리펩티드(예를 들면, 전술된 바와 같은 폴리펩티드)를 결합할 수 있는 항체, 바람직하게는 검출가능한 표지를 갖는 항체가 이용될 수 있다. 항체는 다중클론(polyclonal) 항체일 수 있고, 바람직하게는 단일클론(monoclonal) 항체일 수 있다. 완전한 항체(intact antibody), 또는 그의 단편(예를 들면, Fab 또는 F(ab')2)이 이용될 수 있다. 프로브 또는 항체와 관련하여, 용어 "표지된(labeled)"은 검출가능한 물질을 프로브 또는 항체에 결합(coupling)(즉, 물리적으로 연결)시키는 것에 의한 프로브 또는 항체의 직접적인 표지화(labeling) 및, 직접적으로 표지된 또 다른 시약과의 반응성에 의한 프로브 또는 항체의 간접적 표지화를 포괄하도록 의도된다. 간접적 표지화의 예는 형광 표지된 2차 항체를 이용한 일차 항체의 검출 및 형광 표지된 스트렙타비딘에 의해 검출될 수 있게 하는 비오틴에 의한 DNA 프로브의 말단-표지화(end-labeling)를 포함한다.
변화된 TCF7L2 핵산에 의해 코딩된 폴리펩티드에 특이적으로 결합하는 전술된 바와 같은 항체 또는 변화되지 않은(non-altered) 핵산에 의해 코딩된 폴리펩티드에 특이적으로 결합하는 항체, 또는 핵산에 의해 코팅된 특정한 스플라이싱 변이체에 특이적으로 결합하는 항체를 이용한 웨스턴 블롯팅(Western blotting) 분석이 테스트 시료에서 특정한 스플라이싱 변이체의 존재, 또는 다형성 TCF7L2 핵산 또는 변화된 TCF7L2 핵산에 의해 코딩된 폴리펩티드의 존재, 또는 테스트 시료에서 특정한 스플라이싱 변이체의 부재, 또는 비-다형성(non-polymorphic) 핵산 또는 변화되지 않은 핵산에 의해 코딩된 폴리펩티드의 부재를 확인하기 위해 이용될 수 있다. 다형성 또는 변화된 핵산에 의해 코딩된 폴리펩티드의 존재, 또는 비-다형성 또는 변화되지 않은 핵산에 의해 코딩된 폴리펩티드의 부재는 TCF7L2 핵산에 의해 코딩된 특정한 스플라이싱 변이체의 존재(또는 부재)의 경우와 같이, 타입 II 당뇨병에 대한 감수성을 나타낸다.
본 방법의 일 양태에서, 테스트 시료 내의 TCF7L2 핵산에 의해 코딩된 폴리펩티드의 수준 또는 양은 대조 시료 내의 TCF7L2에 의해 코딩된 폴리펩티드의 수준 또는 양과 비교된다. 대조 시료 내의 폴리펩티드의 수준 또는 양보다 통계적으로 유의성 있게 더 높거나 또는 더 낮은, 테스트 시료 내의 폴리펩티드의 수준 또는 양은 TCF7L2 핵산에 의해 코딩된 폴리펩티드의 발현의 변화를 표시하고, 타입 II 당뇨병에 대한 감수성을 나타낸다. 대안적으로, 테스트 시료 내의 TCF7L2 핵산에 의해 코딩된 폴리펩티드의 조성은 대조 시료 내의 TCF7L2 핵산에 의해 코딩된 폴리펩티드의 조성과 비교된다(예를 들면, 상이한 스플라이싱 변이체의 존재). 대조 시료 내의 폴리펩티드의 조성 대비, 테스트 시료 내의 폴리펩티드의 조성의 차이는 타입 II 당뇨병에 대한 감수성을 나타낸다. 또 다른 양태에서, 테스트 시료 및 대조 시료에서 폴리펩티드의 수준 또는 양 및 조성이 평가될 수 있다. 대조 시료 대비, 테스트 시료 내의 폴리펩티드의 양 또는 수준의 차이; 대조 시료 대비, 테스트 시료에서 조성의 차이; 또는 양 또는 수준의 차이, 및 조성의 차이는 타입 II 당뇨병에 대한 감수성을 표시한다.
대조(질병) 시료 대비 차이의 존재를 확인하기 위해 동일한 방법이 반대로 이용될 수 있다. 대조구로부터의 차이는 당뇨병에 대한 감소된 감수성을 표시하고, 및/또는 타입 II 당뇨병에 대한 보호성 대립형질을 표시한다.
마커 및 하플로타입의 평가
유전적 다양성을 보이는 개체의 집단은 동일한 게놈을 갖지 않는다. 오히려, 게놈은 게놈 내의 다수의 위치에서 개체들 간에 서열 변이성(sequence variability)을 보인다; 바꾸어 말하면, 개체군 내에 다수의 다형성 부위들이 있다. 일부 경우에, 기준 대립형질(reference allele)의 선택 없이, 하나의 다형성 부위의 상이한 대립형질들이 언급될 수 있다. 대안적으로, 특정한 다형성 부위에 대해 기준 서열이 언급될 수 있다. 기준 대립형질은 종종 "야생형(wild type)" 대립형질로 지칭되고, 통상적으로 최초의 서열결정된 대립형질 또는 "영향받지 않은(non-affected)" 개체(예를 들면, 질병이나 비정상적인 표현형을 보이지 않는 개체)로부터의 대립형질로 선택된다. 기준과 상이한 대립형질은 "변이체(variant)" 대립형질로 지칭된다.
본 명세서에 기재된, "마커(marker)"는 특정한 변이체 대립형질(즉, 다형성 부위)의 특징적인 게놈 서열을 의미한다. 마커는 SNP, 마이크로새틀라이트(microsatellite), 삽입, 결실, 중복 및 전좌(translocation)를 포함한, 게놈에서 발견되는 임의의 변이체 유형의 대립형질을 포함할 수 있다.
본 명세서에서 보고된 SNP 명명은 NCBI(the National Center for Biotechnological Information)에 의해 각각의 고유한 SNP에 부여된 공식적인 참조 SNP(Reference SNP)(rs) ID 식별 태그를 의미한다.
본 명세서에 기재된 "하플로타입(haplotype)"은 세그먼트를 따라 배열된 유전적 마커("대립형질")의 특정한 조합을 특징으로 하는 게놈 DNA 가닥의 세그먼트를 의미한다. 특정한 구체예에서, 하플로타입은 하나 이상의 대립형질, 두 개 이상의 대립형질, 세 개 이상의 대립형질, 네 개 이상의 대립형질 또는 다섯 개 이상의 대립형질을 포함할 수 있다. 유전적 마커는 TCF7L2의 엑손 4 LD 블럭과 관련된 "다형성 부위(polymorphic site)"에 있는 특정한 "대립형질"이다. 본 명세서에서 사용된 "TCF7L2의 엑손 4 LD 블럭(exon 4 LD block of TCF7L2)"은 타입 II 당뇨병에 대한 변이체와의 관련성이 관찰되는 Chr10q 상에 있는 LD 블럭을 의미한다. 이 LD 블럭의 NCBI Build 34 위치는 114,413,084 - 114,488,013 bp이다. 본 명세서에 기재된 용어, "감수성(susceptibility)"은 증가된 감수성 및 감소된 감수성을 모두 포괄한다. 따라서, 본 발명의 특정한 마커 및/또는 하플로타입은 1보다 큰 상대적 위험(relative risk)에 의해 특정되는 바와 같이, 타입 II 당뇨병의 증가된 감수성을 특징으로 할 수 있다. 타입 II 당뇨병의 증가된 감수성을 부여하는 마커 및/또는 하플로타입은 또한 그들이 질병의 증가된 위험을 부여하기 때문에, "위험한 상태에 있는(at-risk)" 것으로 간주된다. 대안적으로, 본 발명의 마커 및/또는 하플로타입은 1 미만의 상대적 위험에 의해 특정되는 바와 같이, 타입 II 당뇨병의 감소된 감수성을 특징으로 한다.
개체군(자연적 개체군 또는 인위적 개체군, 예를 들면, 합성 분자의 라이브러리) 내에서 하나 보다 많은 서열이 가능한 뉴클레오티드 위치를 본 명세서에서 "다형성 부위"라 지칭한다. 다형성 부위가 단일 뉴클레오티드로 구성된 길이인 경우, 그 부위는 단일 뉴클레오티드 다형성(single nucleotide polymorphism: "SNP")으로 지칭된다. 예를 들면, 특정한 염색체상의 위치에, 개체군 내의 한 구성원은 아데닌을 가지며, 그 개체군 내의 또 다른 구성원은 티민을 갖는 경우, 이 위치는 다형성 부위이고, 보다 구체적으로, 상기 다형성 부위는 SNP이다. 본 명세서에서 지칭되는 SNP 마커에 대한 대립형질은 이용된 SNP 분석법에서 다형성 부위에서 나타나는 염기, A, C, G, 또는 T를 의미한다. 본 발명이 속하는 기술 분야의 당업자는 반대편 가닥을 분석하거나 또는 판독하는 것에 의해, 각 경우에 상보적 대립형질이 측정될 수 있다는 것을 인식할 것이다. 따라서, A/G 다형성을 포함하는 다형성 부위의 경우, 이용된 분석법은 가능한 두 개의 염기, 즉, A 또는 G의 백분율 또는 비율을 측정할 수 있다. 대안적으로, DNA 주형 상의 반대편 가닥을 결정하는 분석법을 설계하여, 상보적인 염기 T/C의 백분율 또는 비율이 측정될 수 있다. 정량적으로(예를 들면, 상대적 위험의 측면에서), 두 개의 DNA 가닥 중 어느 DNA 가닥(+-가닥, 또는 - 가닥)의 측정으로부터도 동일한 결과가 수득될 것이다. 다형성 부위들은 치환, 삽입 또는 결실에 근거한 서열 상의 차이를 가능하게 한다. 예를 들면, 다형성 마이크로새틀라이트는 반복된 길이의 수가 전체 집단에서 다양한 특정 부위에서 복수 개의 짧은 염기의 반복(예를 들면, CA 반복단위)을 갖는다. 다형성 부위에 대한 서열의 각 버전은 본 명세서에서 그 다형성 부위의 "대립형질"로 지칭된다. 따라서, 이전의 예에서, SNP는 아데닌 대립형질 및 티민 대립형질을 모두 허용한다. 타입 II 당뇨병과 관련된 것으로 발견된 TCF7L2의 엑손 4 LD 블럭 내에 위치한 SNP 및 마이크로새틀라이트 마커가 표 2 내지 표7에 기재된다.
통상적으로, 기준 서열은 특정한 서열을 의미한다. 기준과 상이한 대립형질은 "변이체(variant)" 대립형질로 지칭된다. 예를 들면, 10번 염색체 내의 위치를 의미하는, NCBI Build 34의 위치 114413084 내지 114488013의 기준 게놈 DNA 서열(74929 bp, 또는 74.9k에 해당함)은 본 명세서에서 서열번호 1로 기재된다. 본 명세서에서 사용된, 변이체 서열은 서열번호 1과 상이하나, 실질적으로 유사한 서열을 의미한다. TCF7L2의 엑손 4 LD 블럭과 관련된 하플로타입을 구성하는 유전적 마커들이 변이체이다. 추가적인 변이체들은 폴리펩티드, 예를 들면, TCF7L2 유전자에 의해 코딩되는 폴리펩티드에 영향을 미칠 수 있는 변화를 포함할 수 있다. 기준 뉴클레오티드 서열에 비교될 때, 이 서열 차이들은 단일 뉴클레오티드 또는 하나보다 많은 뉴클레오티드의 삽입 또는 결실을 포함할 수 있다. 그와 같은 서열 차이는 프레임 쉬프트를 초래할 수 있다; 하나 이상의 뉴클레오티드의 변화는 코딩되는 아미노산의 변화를 초래할 수 있다; 하나 이상의 뉴클레오티드의 변화는 조기 종료 코돈의 생성을 초래할 수 있다; 여러 개의 뉴클레오티드의 결실은 뉴클레오티드에 의해 코딩되는 하나 이상의 아미노산의 결실을 초래할 수 있다; 본 명세서에 상세하게 기재된 바와 같이, 비균등 재조합(unequal recombination) 또는 유전자 전환(gene conversion)과 같은, 하나 이상의 뉴클레오티드의 삽입은 해독 프레임의 코딩 서열의 중단, 서열 전체 또는 일부의 중복(duplication), 전위(translocation), 또는 뉴클레오티드 서열의 재배열을 초래할 수 있다. 그와 같은 서열 변화는 핵산에 의해 코딩된 폴리펩티드를 변화시킨다. 예를 들면, 핵산 서열의 변화가 프레임 쉬프트를 유발하는 경우, 프레임 쉬프트는 코딩된 아미노산의 변화를 초래할 수 있고, 및/또는 조기 종료 코돈의 생성을 초래하여, 절단된 폴리펩티드의 생성을 유발한다. 대안적으로, 타입 II 당뇨병 또는 타입 II 당뇨병에 대한 감수성과 관련된 다형성은 하나 이상의 뉴클레오티드의 동의형 변화(synonymous change)(즉, 아미노산 서열의 변화를 초래하지 않는 변화)일 수 있다. 그와 같은 다형성은 예를 들면, 스플라이싱 부위를 변화시키거나, mRNA의 안정성 또는 수송에 영향을 미칠 수 있거나, 또는 코딩된 폴리펩티드의 전사 또는 번역에 영향을 미칠 수 있다. 다형성은 또한, DNA를 변화시켜 증폭 또는 결실과 같은 구조적 변화가 종양에서 신체 수준에서 일어날 가능성을 증가시킬 수 있다. 기준 뉴클레오티드 서열에 의해 코딩되는 폴리펩티드는 특정한 기준 아미노산 서열을 갖는 "기준" 폴리펩티드이고, 변이체 대립형질에 의해 코딩된 폴리펩티드는 변이된 아미노산 서열을 갖는 "변이체" 폴리펩티드로 지칭된다.
다형성 마이크로새틀라이트는 특정한 부위에서 길이가 2-8개의 뉴클레오티드인 복수 개의 짧은 반복단위(예를 들면, CA 반복단위)들을 가지며, 전체 개체군에서 반복단위 길이의 수는 변한다. 인델(indel)은 통상적으로 수개의 뉴클레오티드로 구성된 길이의 짧은 삽입 또는 결실을 포함하는 다형성의 일반적인 형태이다.
본 명세서에 기재된 하플로타입은 다형성 부위의 특정한 대립형질들을 갖는다양한 유전적 마커, 예를 들면, SNP 및 마이크로새틀라이트의 조합이다. 하플로타입은 다양한 유전적 마커의 조합을 포함할 수 있으므로, 하플로타입을 검출하는 것은 본 발명이 속하는 기술 분야에서 알려진 다형성 부위에서 서열을 검출하는 방법에 의해 달성될 수 있다. 예를 들면, SNP 및/또는 마이크로새틀라이트 마커의 존재에 대한 유전형분석(genotyping)의 표준 기법들, 예를 들면, 형광-기반 기법(Chen, X. et al, Genome Res. 9(5): 492-98 (1999)), PCR, LCR, 네스티드(nested) PCR 및 핵산 증폭을 위한 기타 기법들이 이용될 수 있다. 이 마커들 및 SNP는 위험상태에 있는(at-risk) 하플로타입에서 확인될 수 있다. 관련된 마커 및 SNP를 확인하는 특정한 방법은 연관 불균형(linkage disequilibrium) 및/또는 LOD 점수의 이용을 포함한다.
본 명세서에 기재된 특정한 방법에서, 타입 II 당뇨병에 의한 위험을 갖는 개체는 위험 상태 마커(at-risk marker) 또는 하플로타입이 확인된 개체이다. 일 양태에서, 위험 상태 마커 또는 하플로타입은 타입 II 당뇨병의 상당한 증가된 위험(또는 감수성)을 부여하는 것이다. 일 구체예에서, 마커 또는 하플로타입과 관련된 유의성(significance)은 상대적 위험에 의해 측정된다. 또 다른 구체예에서, 유의성은 백분율로 측정된다. 일 구체예에서, 유의성있는 증가된 위험은 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8 및 1.9를 포함하나, 이에 한정되지 않는 약 1.2 이상의 상대적 위험으로 측정된다. 또 다른 구체예에서, 1.2 이상의 상대적 위험은 유의성이 있다. 또 다른 구체예에서, 약 1.5 이상의 상대적 위험은 유의성이 있다. 또 다른 구체예에서, 약 1.7 이상의 상대적 위험은 유의성이 있다. 또 다른 구체예에서, 위험의 유의성 있는 증가는 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 및 98%를 포함하나, 이에 한정되지 않는 약 20% 이상이다. 또 다른 구체예에서, 위험의 유의성 있는 증가는 약 50% 이상이다.
본 발명의 다른 구체예에서, 마커 또는 하플로타입은 타입 II 당뇨병의 감소된 위험(감소된 감수성)을 부여한다. 일 구체예에서, 유의성 있는 감소된 위험은 0.9, 0.8, 0.7, 0.6, 0.5, 및 0.4를 포함하나, 이에 한정되지 않는 0.9 이하의 상대적 위험으로서 측정된다. 또 다른 구체예에서, 유의성 있는 상대적 위험은 0.7 미만이다. 또 다른 구체예에서, 위험(또는 감수성)의 감소는 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 및 98%를 포함하나, 이에 한정되지 않는, 약 20% 미만이다. 또 다른 구체예에서, 위험의 유의성 있는 감소는 약 30% 이상이다.
따라서, 용어 "타입 II 당뇨병에 대한 감수성(susceptibility to type II diabetes)"은 특정한 대립형질, 마커, SNP 또는 하플로타입이 존재하는 경우, 유의성있는 양만큼의 타입 II 당뇨병의 증가된 위험 또는 감수성 또는 타입 II 당뇨병의 감소된 위험 또는 감수성을 나타내며; 유의성은 전술된 바와 같이 측정된다. 본 명세서에서 사용된, 용어 "감소된 위험(decreased risk)", "감소된 감수성(decreased susceptibility)" 및 "보호(protection against)"는 특정한 다른 대립형질, 마커, SNP, 및/또는 특정한 다른 하플로타입이 존재하는 경우 상대적 위험이 감소된다는 것을 나타낸다. 그러나, 증가된 또는 감소된 위험이 의학적으로 유의성이 있는지 여부를 확인하는 것은 또한 특정한 질환, 마커, 또는 하플로타입, 및 종종 환경적 인자를 포함하는, 다양한 인자들에 의존적일 수 있는 것으로 이해된다.
TCF7L2 유전자의 일부에 있거나, 이를 포함하는 위험 상태 마커 또는 하플로타입은 건강한 개체(대조구)에서의 그의 존재의 빈도에 비해, 타입 II 당뇨병(영향받은 개체)에 대한 위험상태에 있는 개체에 보다 빈번하게 존재하고, 상기 마커 또는 하플로타입의 존재는 타입 II 당뇨병에 대한 감수성을 표시하는 것인 마커 또는 하플로타입이다. 2 x 2 표 상에서의 Fisher-exact 테스트가 상관관계에 대한 간단한 검정의 예이다. 주어진 염색체의 코호트(cohort)에 대해, 마커 또는 하플로타입을 모두, 마커 또는 하플로타입 중 하나이나, 나머지 마커 또는 하플로타입은 아닌 마커 또는 하플로타입을 포함하는 염색체의 수로부터 2 x 2 표가 구축될 수 있다.
본 발명의 일정한 양태에서, 위험 상태 마커 또는 하플로타입은 타입 II 당뇨병과 유의성있게 상관성을 갖는 TCF7L2 내에 있거나, 이에 근접한 위험 상태 마커 또는 하플로타입이다. 다른 양태에서, 위험 상태 마커 또는 하플로타입은 타입 II 당뇨병의 감수성과 유의성 있게 상관성을 갖는 TCF7L2 내에 있거나, 이에 근접한 위험 상태 마커 또는 하플로타입을 포함한다. 본 발명의 특정한 구체예에서, 마커 또는 하플로타입은 본 명세서에 기재된 바와 같이, TCF7L2의 엑손 4 LD 블럭과 관련된다.
SNP 및/또는 마이크로새틀라이트 마커의 존재에 대한 유전형분석을 위한 표준 기법들, 예를 들면, 형광 기반 기법(Chen, et al, Genome Res. 9, 492 (1999)), PCR, LCR, 네스티드 PCR 및 핵산 증폭을 위한 기타 기법이 이용될 수 있다. 바람직한 양태에서, 본 발명의 방법은 개체에서 TCF7L2 유전자의 부분에, 또는 이를 포함하는 SNP 및/또는 마이크로새틀라이트의 존재 또는 빈도를 평가하고, 건강한 대조 개체에 비해 과량의 또는 보다 높은 빈도의 상기 SNP 및/또는 마이크로새틀라이트는 개체가 타입 II 당뇨병에 감수성을 갖는다는 것을 표시하는 것인 단계를 포함한다. 그와 같은 SNP 및 마커는 스크리닝 툴로서 이용될 수 있는 하플로타입을 형성할 수 있다. 이 마커들 및 SNP는 위험상태 하플로타입에서 확인될 수 있다. 예를 들면, 위험 상태 하플로타입은 마커 DG10S478 및/또는 SNP rs12255372, rs7895340, rs11196205, rs7901695, rs7903146, rs12243326 또는 rs4506565와 같은 마이크로새틀라이트 마커 및/또는 SNP를 포함할 수 있다. 위험 상태 하플로타입의 존재는 타입 II 당뇨병에 대한 증가된 감수성을 표시하고, 따라서, 본 명세서에 기재된 치료방법에 대한 표적 개체군 내에 속하는 개체를 나타낸다.
감수성 변이체의 확인
환자 및 대조군에서 하플로타입의 빈도는 기대-최대화 알고리즘(expectation-maximization algorithm)(Dempster A. et al., J. R. Stat. Soc. B, 39:1-38 (1977))을 이용하여 추정될 수 있다. 결실된 유전형 및 불확실성을 단계(phase)로 다룰 수 있는 이 알고리즘의 실행이 이용될 수 있다. 귀무 가설(null hypothesis) 하에서, 환자군 및 대조군은 동일한 빈도를 갖는 것으로 가정된다. 우도(likelihood) 접근방식을 이용하여, 본 명세서에 기재된 마커를 포함할 수 있는 후보 위험상태 하플로타입(at-risk-haplotype)이 대조군보다 환자에서 더 높은 빈도를 가질 수 있고, 다른 하플로타입의 빈도의 비율이 양 군에서 동일한 것으로 가정되는, 대안적인 가설이 테스트된다. 우도는 양 가설 하에서 모두 별개로 최대화되고, 상응하는 1-df 우도 비율 통계치가 통계적 유의성을 평가하기 위해 이용된다.
연관 영역(linkage region) 내에서 위험상태 및 보호성 마커 및 하플로타입을 찾기 위해, 예를 들면, 마커들이 실질적인 영역(practical region)을 채우는 경우, 유전형이 결정된 마커(genotyped marker)의 모든 가능한 조합이 연구된다. 조합된 환자 및 대조군은 무작위로 원래의 환자 및 대조군과 크기가 동일한, 두 개의 세트로 분리될 수 있다. 이때, 마커 및 하플로타입 분석이 반복되고, 측정된 가장 유의성 있는 p-값이 결정된다. p-값의 경험적(empirical) 분포를 구축하기 위해, 이 랜덤화 체계(scheme)는 예를 들면, 100회 이상 반복될 수 있다. 바람직한 구체예에서, 0.05 미만의 p-값은 유의성 있는 마커 및/또는 하플로타입 관련성을 표시한다. 이하에서, 하플로타입 분석이 검토된다.
하플로타입 분석
하플로타입 분석에 대한 일반적인 접근방식은 NEsted MOdel에 적용된 우도-기반 추정(likelihood-based inference)을 이용하는 단계를 포함한다(Gretarsdottir S., et ah, Nat. Genet. 35:131-38 (2003)). 본 방법은 다수의 다형성 마커, SNP 및 마이크로새틀라이트를 허용하는, 프로그램 NEMO에서 구현된다. 그 방법 및 소프트웨어는 구체적으로 그 목적이 상이한 위험을 부여하는 하플로타입 군을 확인하는 것인 케이스-컨트롤(case-control) 연구를 위해 설계된다. 이는 또한 LD 구조를 연구하기 위한 도구이다. NEMO에서, 최대 우도 추정값, 우도 비율 및 p-값은 EM 알고리즘의 보조로, 직접 계산되고, 관찰된 데이터는 이를 결실된-데이터 문제로 처리한다.
정보 측정
유효한 p-값을 제공하기 위해 단계 및 결실된 유전형의 불확실성 때문에 정보 손실을 포착한, 관찰된 데이터에 대해 직접 계산된 우도에 기반한 우도 비율 검정에 의존할 수 있으나, 정보가 불완전하기 때문에 얼마나 많은 정보가 손실되었는지를 아는 것은 여전히 흥미롭다. 하플로타입 분석을 위한 정도 측정은 연관 분석을 위해 정의된 정보 측정의 자연적인 확장으로 Nicolae 및 Kong (Technical Report 537, Department of Statistics, University of Statistics, University of Chicago; Biometrics, 60(2):368-75 (2004))에 기재되며, NEMO에서 구현된다.
통계적 분석
질병과의 단일 마커 관련성을 위해, 각각의 개별적인 대립형질에 대해 양측 p-값(two-sided p-value)을 계산하기 위해 Fisher exact 검정이 이용될 수 있다. 모든 p-값은 구체적으로 표시되지 않으면, 복수의 비교에 대해 조정되지 않고 제시된다. (마이크로새틀라이트, SNP 및 하플로타입에 대한) 제시된 빈도는 보인자 빈도(carrier frequency)에 대조적인 대립형질 빈도이다. 연관 분석을 위한 패밀리로서 선택된 환자들의 관계성(relatedness)에 따른 편향을 최소화하기 위해, 일촌(first-degree) 및 이촌(second-degree) 친척들은 환자 목록으로부터 제거될 수 있다. 또한, 환자들 간의 남아있는 관계성에 대해 보정하기 위해 Risch, N. & Teng, J. (Genome Res., 8:1273-1288 (1998))에 개시된 분산 조정 절차(variance adjustment procedure)인, 혈연관계(sibship)에 대한 DNA 풀링(ibid)을 확대하여 일반적인 가족 관계에 적용될 수 있게 하고, 비교를 위해 조정된 p-값 및 조정되지 않은 p-값을 제시할 수 있도록 관련성에 대한 검정이 반복될 수 있다. 차이는 일반적으로 예상되는 것보다 매우 작다. 복수 회의 테스트에 대해 보정된 단일-마커 관련성의 유의성을 평가하기 위해, 동일한 유전형 데이터를 이용한 랜덤화 테스트를 수행할 수 있다. 환자 및 대조구의 코호트가 랜덤화될 수 있고 관련성 분석은 복수 회(예를 들면, 500,000회까지) 재수행될 수 있고, p-값은 원래의 환자 코호트 및 대조구 코호트를 이용하여 관찰된 p-값과 동일하거나 p-값보다 낮은, 일부 마커 대립형질에 대한 p-값을 생성하는 재현의 분율(fraction of replications)이다.
단일-마커 및 하플로타입 분석의 경우, 상대적 위험(relative risk: RR) 및 개체군 기여 위험(population attributable risk: PAR)은 승법 모델(multiplicative model)(하플로타입 상대적 위험 모델)(Terwilliger, J.D. & Ott, J., Hum. Hered. 42:337-46 (1992) 및 Falk, CT. & Rubinstein, P, Ann. Hum. Genet. 51 (Pt 5j:227-33 (1987))을 가정하여 계산될 수 있고, 즉, 개인이 갖는 두 개의 대립형질/하플로타입의 위험이 승산될 수 있다. 예를 들면, RR이 a 대비 A의 위험인 경우, 동형접합형인 AA 개체는 이형접합형인 Aa의 위험의 RR배일 것이고, 동형접합형인 aa의 RR2배일 것이다. 승법 모델은 분석과 계산을 단순화하는 우수한 특성을 갖는다- 하플로타입은 독립적이고, Hardy- Weinberg 평형에서, 대조군 내에서 뿐 아니라 질병군(affected population) 내에서 독립적이다. 결과적으로, 질병 개체 및 대조구 개체 각각의 하플로타입 카운트는 대안적인 가설 하에 상이한 하플로타입 빈도를 갖는, 다항 분포(multinomial distribution)를 갖는다. 구체적으로, 두 개의 하플로타입, h i h j 에 대해, 위험(h i )/위험(h j ) = (fi/pi)/(fj/pj)이고, 이때, f p는 각각 질병군 및 대조군에서의 빈도를 표시한다. 진정한 모델이 승법형이 아닌 경우, 일부 검정력 손실(power loss)가 있으나, 그 손실은 극단적인 경우를 제외하고는 낮은(mild) 경향이 있다. 보다 중요하게는, p-값은 귀무 가설에 대해 계산되기 때문에 항상 유효하다.
NEMO를 이용한 연관 불균형
마커의 쌍들 간에 LD는 D'과 R2의 표준 정의를 이용하여 계산될 수 있다(Lewontin, R., Genetics 49:49-67 (1964); Hill, W.G. & Robertson, A. Theor. Appl. Genet. 22:226-231 (1968)). NEMO를 이용하여, 두 개의 마커 대립형질 조합의 빈도는 최대 우도에 의해 추정되고 연관 균형으로부터의 편차는 우도 비율 검정(likelihood ratio test)에 의해 평가된다. D' 및 R2의 정의는 한계 대립형질 확률(marginal allele probability)에 의해 가중된 두 개의 마커의 모든 가능한 대립형질 조합에 대한 값들을 평균하여 마이크로새틀라이트를 포함하도록 확장된다. 특정한 영역에서 LD 구조를 규명하기 위해, 모든 마커 조합을 도시(plot)하는 경우, D'은 좌측 상부 영역에 도시하고 p-값은 우측 하부 영역에 도시한다. LD 플롯에서, 원하는 경우, 그들의 물리적 위치에 따라, 마커는 등거리에 도시된다.
연관 분석을 위한 통계적 방법
다중점, 질병 특이적 대립형질-공유 방법(multipoint, affected-only allele-sharing method)이 연관에 대한 증거를 평가하기 위한 분석에서 이용될 수 있다. LOD-점수 및 비-파라미터 연관(non-parametric linkage)(NPL) 점수인 결과는 프로그램 Allegro (Gudbjartsson et al, Nat. Genet. 25:12-3 (2000))를 이용하여 수득될 수 있다. 본 발명자들의 기준선 연관(baseline linkage) 분석은 Spairs 평점(scoring) 함수(Whittemore, A.S., Halpern, J. Biometrics 50: 118-27 (1994); Kruglyak L. et al, Am. J. Hum. Genet 55:1347-63 (1996)), 지수적 대립형질-공유 모델(exponential allele-sharing model)(Kong, A. and Cox, NJ., Am. J. Hum. Genet. 61:1179-88 (1997)) 및 로그-스케일에서 각각의 질병군 쌍에 가중치를 부여하는 것과 각각의 패밀리에 동일하게 가중치를 부여하는 것 사이의 중간인 가족 가중치 부여 체계(family weighting scheme)를 이용한다. 본 발명자들이 사용한 정보 측정은 Allegro 프로그램 출력의 일부이고 마커 유전자형이 완전히 정보가치가 없으면(uninformative) 정보값(information value)은 0과 동일하고, 유전자형이 질병 친척들 간의 대립형질 공유의 정확한 양을 결정하는 경우, 정보값은 1이다(Gretarsdottir et al., Am. J. Hum. Genet., 70:593-603 (2002)). P-값은 두 개의 상이한 방법으로 계산되었고, 유의성이 더 낮은 결과가 본 명세서에서 보고된다. 제1 P-값은 큰 시료 이론(large sample theory)에 근거하여 계산될 수 있고; Zlr = D(2[loge(10)LOD])의 분포는 무 연관(no linkage)의 귀무 가설 하에서 표준 정상 변수(standard normal variable)의 근사치를 구한다(Kong, A. and Cox, N. J., Am. J. Hum. Genet. 61: 1179-88 (1997)). 제2의 P-값은 관찰된 LOD-점수를 귀무 가설 하에서 그와 완전한 데이터 샘플링 분포와 비교하여 계산될 수 있다(예를 들면, Gudbjartsson et al, Nat. Genet. 25:12-3 (2000)). 데이터가 다수의 가족으로 구성되는 경우, 이 두 개의 P-값은 매우 유사한 경향이 있다.
감수성 유전자 좌의 하플로타입 및 "하플로타입 블럭(Haplotype Block)" 정의
특정한 구체예에서, 마커 및 하플로타입 분석은 "하플로타입 블럭(haplotype block)"("LD 블럭"으로도 지칭됨)에 근거하여 후보 감수성 유전자 좌를 정의하는 단계를 포함한다. 인간 게놈의 부분들은 일부 공통된 하플로타입을 포함하는 일련의 별개의 하플로타입 블럭으로 나뉠 수 있는 것으로 보고되었다; 이 블럭의 경우, 연관 불균형 데이터는 재조합을 나타내는 증거를 거의 제공하지 않았다(예를 들면, Wall, J.D. and Pritchard, J.K., Nature Reviews Genetics 4:587-597 (2003); Daly, M. et al, Nature Genet. 29:229-232 (2001); Gabriel, S.B. et al, Science 296:2225-2229 (2002); Patil, N. et al., Science 294:1719-1723 (2001); Dawson, E. et al, Nature 418:544-548(2002); Phillips, M.S. etal, Nature Genet. 35:382-387 (2003) 참조).
이 하플로타입 블럭을 정의하는 두 가지 주요한 방법이 있다; 블럭은 제한된 하플로타입 다양성을 갖는 DNA의 영역(예를 들면, Daly, M. et al, Nature Genet. 29:229-232 (2001); Patil, N. et al, Science 294:1719-1723 (2001); Dawson, E. et al, Nature 418:544-54% (2002); Zhang, K. et al, Proc. Natl. Acad. Sd. USA 99:7335-7339 (2002) 참조), 또는 연관 불균형을 이용하여 확인된, 확장된 이력의 재조합(extensive historical recombination)을 갖는 전이 지역(transition zone) 들 사이의 영역으로 정의될 수 있다(예를 들면, Gabriel, S.B. et al, Science 296:2225-2229 (2002); Phillips, M.S. et al, Nature Genet. 33:382-387 (2003); Wang, N. et al, Am. J. Hum. Genet. 77:1227-1234 (2002); Stumpf, M.P., 및 Goldstein, D.B., Curr. Biol. 73:1-8 (2003) 참조). 본 명세서에서 사용된 용어, "하플로타입 블럭" 또는 "LD 블럭"은 어느 하나의 특징에 의해 정의된 블럭을 포함한다.
하플로타입 블럭을 확인하는 대표적인 방법은 예를 들면, 미국 공개특허출원 제20030099964호, 제20030170665호, 제20040023237호 및 제20040146870호에 개시된다. 하플로타입 블럭은 표현형 및 하플로타입 상태들 간의 연관성을 맵핑하기 위해 용이하게 이용될 수 있다. 각 하플로타입 블럭에서 주요한 하플로타입이 확인 될 수 있고, 그 후, 일련의 "태깅(tagging)" SNP 또는 마커(하플로타입을 구별하기 위해 필요한 SNP 또는 마커의 가장 작은 세트)가 확인될 수 있다. 이 태깅 SNP 또는 마커는 표현형과 하플로타입 간의 관련성을 확인하기 위해, 개체들의 그룹들로부터의 시료를 평가하기 위해 이용될 수 있다. 원하는 경우, 인접한 하플로타입 블럭들이 동시에 평가될 수 있으며, 이는 하플로타입 블럭들 간에 연관 불균형이 존재할 수 있기 때문이다.
하플로타입 및 진단
본 명세서에 기재된 바와 같이, 그와 같은 마커를 포함하는 특정한 마커 또는 하플로타입은 타입 II 당뇨병에 대한 감수성의 결정을 위해 유용한 것으로 확인되었다- 즉, 그들은 타입 II 당뇨병에 대한 감수성을 진단하기에 유용한 것으로 확인되었다. 특정한 마커 및 하플로타입이 타입 II 당뇨병을 갖지 않는 개체들보다 타입 II 당뇨병을 갖는 개체들에서 보다 빈번하게 발견된다. 따라서, 이 마커들 및 하플로타입은 개체에서 타입 II 당뇨병, 또는 타입 II 당뇨병에 대한 감수성을 검출하기 위한 예측적 가치를 갖는다. 특정한 태깅 마커를 포함하는 하플로타입 블럭(즉, TCF7L2의 엑손 4 LD 블럭)은 타입 II 당뇨병을 갖지 않는 개체들보다 타입 II 당뇨병을 갖는 개체들에서 보다 빈번하게 발견될 수 있다. 따라서, 이와 같은 하플로타입 블럭 내의 "위험상태(at-risk)" 태깅 마커도 개체에서 타입 II 당뇨병, 또는 타입 II 당뇨병에 대한 감수성을 검출하기 위한 예측적 가치를 갖는다. 하플로타입 또는 LD 블럭 내의 "위험상태" 태깅 마커는 또한 하플로타입들을 구별하는 다른 마커들을 포함할 수 있고, 이는 이들이 유사하게 타입 II 당뇨병 또는 타입 II 당뇨병에 대한 감수성을 검출하는 예측적 가치를 갖기 때문이다. 인간 게놈의 하플로타입 블럭 구조의 결과로, 하플로타입 블럭(LD 블럭)과 관련된 그와 같은 마커 또는 변이체를 포함하는 다수의 마커 또는 다른 변이체 및/또는 하플로타입은 특정한 속성(trait) 및/또는 표현형과 관련된 것으로 발견될 수 있다. 따라서, 본 명세서에 정의된 바와 같은 TCF7L2의 엑손 4 LD 블럭 내에 존재하거나 또는 TCF7L2의 엑손 4 LD 블럭과의 강한 LD(0.2보다 큰 r2을 특징으로 함)인 마커 및/또는 하플로타입이 타입 II 당뇨병과 관련되는 것이 가능하다(즉, 그들은 타입 II 당뇨병의 증가된 또는 감소된 감수성을 부여한다). 이는 본 명세서에 기재된 마커를 포함하나(표 6), 또한, 표 6에 열거된 하나 이상의 마커와의 강한 LD(0.2보다 큰 r2을 특징으로 함)인 다른 마커들을 포함할 수 있다. 그와 같은 추가적인 변이체의 확인은 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 방법, 예를 들면, 개체의 특정한 그룹 내에 있는 LD 블럭 A 게놈 영역의 DNA 서열 결정에 의해 달성될 수 있고, 본 발명은 또한 그와 같은 추가적인 변이체를 포괄한다.
본 명세서에 기재된 바와 같이, TCF7L2의 엑손 4 LD 블럭 내의 특정한 마커들은 타입 II 당뇨병을 갖는 개체들에서 감소된 빈도로 관찰되며, 또한 표 13, 20 및 21에 열거된 둘 이상의 마커를 포함하는 하플로타입은 타입 II 당뇨병을 갖는 개체들에서 감소된 빈도로 존재하는 것으로 관찰된다. 따라서, 이 마커들 및 하플로타입은 타입 II 당뇨병에 대해 보호성이고, 즉, 그들은 이 마커들 및/또는 하플로타입을 갖는 개체들의 감소된 타입 II 당뇨병 발병 위험을 부여한다.
본 명세서에 개시된 하플로타입 및 마커는 일부 경우에, 다양한 유전적 마커, 예를 들면, SNP 및 마이크로새틀라이트의 조합이다. 따라서, 하플로타입의 검출은 본 발명이 속하는 기술 분야에서 알려지고 및/또는 본 명세서에 기재된 다형성 부위에서 서열을 검출하는 방법에 의해 달성될 수 있다. 또한, 특정한 하플로타입 또는 일련의 마커 및 질병 표현형 간의 상관관계는 표준 기법을 이용하여 확인될 수 있다. 상관성에 대한 간단한 검정의 대표적인 예는 2 x 2 표에서의 Fisher-exact 검정일 것이다.
특정한 구체예에서, TCF7L2의 엑손 4 LD 블럭과 관련된 마커 또는 하플로타입은 건강한 개체(대조군)에서의 그 존재의 빈도에 비해, 타입 II 당뇨병에 대한 위험을 갖는 개체(질병군)에 보다 빈번하게 존재하고, 상기 마커 또는 하플로타입의 존재는 타입 II 당뇨병 또는 타입 II 당뇨병에 대한 감수성을 표시하는 것인 마커 또는 하플로타입이다. 다른 구체예에서, TCF7L2의 엑손 4 LD 블럭과 관련된 하나 이상의 마커와 연관 불균형인 위험상태 태깅 마커는 건강한 개체(대조군)에서의 그 존재의 빈도에 비해, 타입 II 당뇨병에 대한 위험을 갖는 개체(질병군)에 보다 빈번하게 존재하고, 상기 태깅 마커의 존재는 타입 II 당뇨병에 대한 증가된 감수성을 표시하는 것인 태깅 마커이다. 또 다른 구체예에서, TCF7L2의 엑손 4 LD 블럭과 관련된 하나 이상의 마커와 연관 불균형인 위험상태 마커는 건강한 개체(대조군)에서의 그 존재의 빈도에 비해, 타입 II 당뇨병에 대한 위험을 갖는 개체(질병군)에 보다 빈번하게 존재하고, 상기 마커의 존재는 타입 II 당뇨병에 대한 감수성을 표시하는 것인 마커이다.
본 명세서에 기재된 특정한 방법에서, 타입 II 당뇨병에 대한 위험상태에 있는 개체는 위험상태 마커 또는 하플로타입이 확인된 개체이다. 일 구체예에서, 마커 또는 하플로타입의 관련성의 강도는 상대적 위험(RR)에 의해 측정된다. RR은 마커 또는 하플로타입을 갖지 않는 개체들 중의 상태의 발생률 대비 1 카피의 마커 또는 하플로타입을 갖는 개체들 중의 상태의 발생률의 비이다. 이 비율은 1 카피의 마커 또는 하플로타입을 갖는 개체들 중의 상태의 발생률 대비 2 카피의 마커 또는 하플로타입을 갖는 개체들 중의 상태의 발생률의 비와 동등하다. 일 구체예에서, 마커 또는 하플로타입은 1.2 이상의 상대적 위험을 갖는다. 다른 구체예에서, 마커 또는 하플로타입은 1.3 이상, 1.4 이상, 1.5 이상, 2.0 이상, 2.5 이상, 3.0 이상, 3.5 이상, 4.0 이상, 또는 5.0 이상의 상대적 위험을 갖는다.
본 발명의 다른 방법에서, 타입 II 당뇨병의 감소된 위험(또는 감소된 감수성)을 갖는 개체는 보호성 마커 또는 하플로타입이 확인된 개체이다. 그와 같은 경우에, 상대적 위험(RR)은 1(unity) 미만이다. 일 구체예에서, 마커 또는 하플로타입은 0.9 미만의 상대적 위험을 갖는다. 또 다른 구체예에서, 마커 또는 하플로타입은 0.8 미만, 0.7 미만, 0.6 미만, 0.5 미만 또는 0.4 미만의 상대적 위험을 갖는다.
유전적 테스트(genetic testing)의 유용성
타입 II 당뇨병을 발병할 위험을 부여하는 유전적 변이체에 대한 지식은 타입 II 당뇨병을 발병할 증가된 위험을 갖는 개체들(즉, 위험상태 변이체의 보인자(carrier))과 상기 질병을 발병할 감소된 위험을 갖는 개체들(즉, 보호성 변이체의 보인자)를 구별하기 위해 유전적 테스트를 적용할 가능성을 제공한다. 전술된 양 그룹에 속하는 개체들에 대해, 유전적 테스트의 핵심 가치는 조기 단계에 질병을 진단하고 가장 적합한 치료법을 적용하기 위해 상기 질병의 예후(prognosis)/공격성(aggressiveness)에 관해 의사에게 정보를 제공할 수 있는 가능성이다. 예를 들면, 타입 II 당뇨병에 대한 유전적 테스트의 적용은 보다 조기 단계에 치료 수단의 적용을 가져오고 따라서 타입 II 당뇨병에 의해 초래되는 증상 및 심각한 건강 상의 결과를 최소화할 수 있는, 보다 조기 단계에서의 질병의 검출 가능성을 제공할 수 있다.
치료방법
본 발명의 또 다른 구체예에서, 타입 II 당뇨병의 치료를 위한 방법이 이용될 수 있다. 본 명세서에서 사용된, 용어 "치료(treatment)"는 타입 II 당뇨병과 관련된 증상을 경감시킬 뿐 아니라, 타입 II 당뇨병의 발병을 예방하거나 또는 지연시키고; 타입 II 당뇨병의 증상의 심각도 또는 빈도를 완화시키고; 및/또는 타입 II 당뇨병과 관련된 증상을 경감시키는 다른 약물과의 병행 요법(concomitant therapy)에 대한 필요를 낮추는 것을 의미한다. 일 양태에서, 치료대상인 개체는 타입 II 당뇨병에 대해 감수성을 갖는(증가된 위험을 갖는) 개체(예를 들면, 마커 DG10S478에서 0이 아닌 대립형질의 존재; SNP rs12255372에서 T 대립형질의 존재; SNP rs7895340에서 A 대립형질의 존재; SNP rs11196205에서 C 대립형질의 존재; SNP rs7901695에서 C 대립형질의 존재; SNP rs7903146에서 T 대립형질의 존재; SNP rs12243326에서 C 대립형질의 존재; 또는 SNP rs4506565에서 T 대립형질의 존재를 갖는 개체)이다.
본 발명의 추가적인 구체예에서, TCF7L2와 연관된 다른 질병 또는 상태의 치료를 위한 방법들이 이용될 수 있다. TCF7L2 치료제는 타입 II 당뇨병의 치료방법 및 TCF7L2와 관련된 다른 질병 또는 상태의 치료방법에서 사용될 수 있다.
치료(예방 및/또는 치료적) 방법은 TCF7L2 치료제를 이용한다. "TCF7L2 치료제(TCF7L2 therapeutic agent)"는 TCF7L2의 폴리펩티드 활성 및/또는 핵산의 발현을 직접적으로 또는 간접적으로(예를 들면, Wnt 신호전달 경로 또는 카데린(cadherin) 경로의 단백질(예를 들면, 베타-카테닌)과 같은, TCF7L2와 상호작용하는 단백질의 활성 또는 핵산 발현을 변화시키는 것을 통해) 변화(예를 들면, 증가 또는 억제)시키는 작용제이다. 특정한 구체예에서, TCF7L2 치료제는 TCF7L2의 활성 및/또는 핵산 발현을 변화시킨다.
TCF7L2 치료제는 다양한 수단, 예를 들면, 추가적인 TCF7L2 폴리펩티드를 제공하거나 또는 TCF7L2 핵산의 전사 또는 번역을 상향조절하는 것에 의해; TCF7L2 폴리펩티드의 번역후 가공(posttranslational processing)을 변화시키는 것에 의해; TCF7L2 스플라이싱 변이체의 전사를 변화시키는 것에 의해; 또는 TCF7L2 폴리펩티드 활성을 방해하는 것에 의해(예를 들면, TCF7L2 폴리펩티드에 결합하는 것에 의해), 또는 TCF7L2와 상호작용하는 또 다른 폴리펩티드에 결합하는 것에 의해, TCF7L2 핵산의 발현, 전사 또는 번역을 변화(예를 들면, 하향조절)시키는 것에 의해, 또는 활성을 변화(예를 들면, 촉진 또는 억제)시키는 것에 의해 TCF7L2 폴리펩티드 활성 또는 핵산 발현을 변화시킬 수 있다.
대표적인 TCF7L2 치료제는 하기를 포함한다: 본 명세서에 기재된 바와 같은 핵산, 또는 그의 단편 또는 그의 유도체, 특히 본 명세서에 개시된 폴리펩티드를 코딩하는 뉴클레오티드 및 그와 같은 핵산(예를 들면, TCF7L2 폴리펩티드 또는 그의 활성 단편 또는 유도체를 코딩하는 핵산과 같은, 유전자, cDNA, 및/또는 mRNA 또는 올리고뉴클레오티드; 또는 그의 상보체, 또는 그의 단편 또는 유도체, 및/또는 타입 II 당뇨병 핵산 또는 그의 단편 또는 유도체에 의해 코딩되는 기타 스플라이싱 변이체)을 포함하는 벡터; TCF7L2 핵산 또는 그의 단편 또는 유도체에 의해 코딩되는, 본 명세서에 기재된 폴리펩티드 및/또는 스플라이싱 변이체; 기타 폴리펩티드(예를 들면, TCF7L2 수용체); TCF7L2 결합제; 활성에 영향을 미치는(예를 들면, 증가시키거나 또는 감소시키는) 작용제, 예를 들면, 변화된 TCF7L2 폴리펩티드에 대한 항체, 또는 변화되지 않은 TCF7L2 폴리펩티드에 대한 항체, 또는 전술된 바와 같은 TCF7L2 핵산에 의해 코딩된 특정한 스플라이싱 변이체에 대한 항체와 같은 항체; 펩티드 모방체(peptidomimetiic); 융합 단백질 또는 그의 전구체 약물(prodrug); 리보자임; 기타 소형 분자; 및 TCF7L2 핵산의 발현을 변화(예를 들면, 증가 또는 감소)시키거나, 또는 TCF7L2 스플라이싱 변이체의 전사를 조절하는 기타 작용제(예를 들면, 발현되는 스플라이싱 변이체에 영향을 미치거나, 또는 발현되는 각각의 스플라이싱 변이체의 양에 영향을 미치는 작용제)}. 추가적인 대표적 TCF7L2 치료제는 인슐린 신호전달 및/또는 글루카곤, GLP-1 또는 GIP 신호전달에 영향을 미치는 화합물을 포함한다. 적합한 경우, 하나 이상의 TCF7L2 치료제가 동시에 사용될 수 있다.
바람직한 구체예에서, TCF7L2 치료제는 TCF7L2의 활성을 방해하는 작용제, 예를 들면, TCF7L2의 베타-카테닌(예를 들면, Fasolini, et al, J. Biol. Chem 278(23):21092-06 (2003) 참조) 또는 다른 단백질과의 결합 또는 상호작용을 방해하는 작용제이다. 기타 TCF7L2 치료제는 Wnt 신호전달 경로에 영향을 미치는 작용제 또는 카데린(cadherin) 경로에 영향을 미치는 작용제를 포함한다. 대표적인 작용제는 예를 들면, DKK 단백질과 같은 단백질; APC 또는 Axin의 베타-카테닌 결합 도메인; IDAX, AXAM 및 ICAT와 같은 인자; 비트라벤(Vitravene)의 사용과 같은, 안티센스 올리고뉴클레오티드 또는 RNA 간섭(RNAi); 종양살상형 바이러스 벡터(oncolytic viral vector); 및 기타 화합물(예를 들면, Luu et al, Current Cancer Drug Targets 4:6530671 (2004) 참조); 예를 들면, Lepourcelet et al.(예를 들면, Lepourcelet et al., Cancer Call 5:91-102 (2004) 참조)에 의해 개시된 ZTM00990, PKF118-310, PKF118-744, PKF115-584, PKF222-815, CGPO49090, NPDDG39.024, 및 NPDDGl.024를 포함하는, 소형 분자 안타고니스트; 미국특허 제6,762,185호에 개시된 화합물; 미국특허출원 제20040005313호, 제20040072831호, 제20040247593호, 또는 제20050059628호에 개시된 화합물을 포함한다. 기타 대표적인 TCF7L2 치료제는 예를 들면, 미국특허 제6,057,117호; 제6,153,618호; 제6,417,185호; 제6,465,231호; 제6,489,344호; 제6,512,102호; 제 6,608,063호; 제6,716,624호; 제6,800,632호 및 미국특허출원 공개 제20030008866호; 제20030077798호; 제20030130289호; 제20030207883호; 제2000092535호; 및 제200500851호에 개시된 억제제를 포함한, gsk3 억제제를 포함한다.
추가적인 대표적 TCF7L2 치료제는 작용제 표에 표시된다.
작용제 표
Figure 112008004021661-pct00001
Figure 112008004021661-pct00002
NSD = 구조가 개시되지 않음(Iddb3)
TCF7L2 치료제는 치료적 유효량(therapeutically effective amount)(즉, 전술된 바와 같은, "치료(treatment)"를 위해 충분한 양)으로 투여된다. 특정한 개체의 질환 또는 상태의 치료에서 치료적으로 유효한 양은 그 질병의 증상 및 심각도에 의존적일 것이고, 표준 임상 기법에 의해 결정될 수 있다. 또한, 최적의 투여량 범위를 확인하는 것을 보조하기 위해 비트로(in vitro) 분석 또는 인 비보(in vivo) 분석이 선택적으로 이용될 수 있다. 제제에서 이용될 정확한 투여량은 또한, 투여 경로 및 대상 질환 또는 질병의 심각도에 의존적이며, 의사의 판단과 각 환자의 상황에 따라 결정되어야 한다. 유효 투여량은 인 비트로 또는 동물 모델 테스트 시스템으로부터 유래된 투여량-반응 곡선(dose-response curve)으로부터 외삽될 수 있다.
일 구체예에서, 핵산(예를 들면, TCF7L2 폴리펩티드를 코딩하는 핵산); 또는 TCF7L2 폴리펩티드 또는 그의 스플라이싱 변이체를 코딩하는 또 다른 핵산, 그의 유도체 또는 그의 단편은 단독으로 또는 전술된 바와 같은 약학적 조성물로 사용될 수 있다. 예를 들면, TCF7L2 유전자 또는 핵산 또는 TCF7L2 폴리펩티드를 코딩하는 cDNA는 그 자체로 또는 벡터 내에 포함된 형태로 세포로 (인 비트로 또는 인 비보) 도입되어 상기 세포가 원형의 TCF7L2 폴리펩티드를 생성할 수 있게 된다. 필요한 경우, 상기 유전자 또는 cDNA 또는 유전자, 핵산 또는 cDNA를 포함하는 벡터로 형질전환된 세포들이 질병에 걸린 개체로 도입(또는 재도입)될 수 있다. 따라서, 본래 원형의 TCF7L2 발현 및 활성을 가지지 않거나, 또는 변화된 TCF7L2 발현 및 활성을 갖거나, 또는 질병-관련 TCF7L2 스플라이싱 변이체의 발현을 갖는 세포들이 TCF7L2 폴리펩티드 또는 TCF7L2 폴리펩티드의 활성 단편(또는 TCF7L2 폴리펩티드의 다른 변이체)를 발현하도록 개조(engineer)될 수 있다. 특정한 구체예에서, TCF7L2 폴리펩티드, 또는 그의 활성 단편 또는 그의 유도체를 코딩하는 핵산이 바이러스 벡터와 같은 발현 벡터로 도입되고, 상기 벡터가 동물의 적합한 세포로 도입될 수 있다. 바이러스 전달 시스템(viral transfer system) 및 비-바이러스(nonviral) 전달 시스템을 포함한 기타 유전자 전달 시스템이 이용될 수 있다. 대안적으로, 인산칼슘 공침전(coprecipitation), 기계적 기법(예를 들면, 미세주입); 리포좀을 통한 막 융합-매개 전달; 또는 직접적인 DNA 흡수(uptake)과 같은 비-바이러스 유전자 전달 방법들이 또한 이용될 수 있다.
대안적으로, 본 발명의 또 다른 구체예에서, 본 발명의 핵산; 본 발명의 핵산에 상보적인 핵산; 또는 그와 같은 핵산의 일부(예를 들면, 하기에 기재된 바와 같은 올리고뉴클레오티드)가 타입 II 당뇨병 유전자의 mRNA 및/또는 게놈 DNA에 특이적으로 혼성화하는 핵산(예를 들면, 올리고뉴클레오티드)이 투여되거나 또는 인 시투(in situ)로 생성되는 것인 "안티센스" 치료법에서 이용될 수 있다. mRNA 및/또는 DNA에 특이적으로 혼성화하는 안티센스 핵산은 예를 들면, 번역 및/또는 전사를 억제하여 TCF7L2 폴리펩티드의 발현을 억제한다. 안티센스 핵산의 결합은 통상적인 염기쌍 상보성에 의한 것이거나, 또는 예를 들면, 이중가닥 DNA(DNA duplex)로 결합하는 경우, 이중나선 구조(double helix)의 긴 그루브(major groove)에서의 특이적 상호작용을 통한 것일 수 있다.
본 발명의 안티센스 작제물(antisense construct)은 예를 들면, 전술된 바와 같은 발현 플라스미드로서 전달될 수 있다. 플라스미드가 세포에서 전사되는 경우, 이는 TCF7L2 폴리펩티드를 코딩하는 mRNA 및/또는 DNA의 일부에 상보적인 RNA를 생성한다. 대안적으로, 안티센스 작제물은 생체 외에서(ex vivo) 생성되어 세포로 도입된 올리고뉴클레오티드 프로브일 수 있고; 이는 폴리펩티드를 코딩하는 mRNA 및/또는 게놈 DNA와 혼성화하여 폴리펩티드의 발현을 억제한다. 일 구체예에서, 올리고뉴클레오티드 프로브는 내생적 뉴클레아제(endonuclease), 예를 들면, 엑소뉴클레아제 및/또는 엔도뉴클레아제에 내성을 가져서, 이에 의해 생체 내에서 안정하게 된, 변형된 올리고뉴클레오티드이다. 안티센스 올리고뉴클레오티드로서의 사용을 위한 대표적인 핵산 분자는 DNA의 포스포르아미데이트, 포스포티오에이트 및 메틸포스포네이트 유사체이다(또한, 미국특허 제5,176,996호; 제5,264,564호; 및 제5,256,775호 참조). 추가적으로, 안티센스 치료법에서 유용한 올리고머를 작제하는 일반적인 방법이 예를 들면, Van der Krol 등, (BioTechniques 6:958-976 (1988)); 및 Stein 등, (Cancer Res. 48:2659-2668 (1988))에 의해 기재된다. 안티센스 DNA의 경우, 번역 개시 부위로부터 유래된 올리고데옥시뉴클레오티드가 바람직하다.
안티센스 요법을 수행하기 위해, TCF7L2 유전자를 코딩하는 mRNA에 상보적인 올리고뉴클레오티드(mRNA, cDNA 또는 DNA)가 설계된다. 안티센스 올리고뉴클레오티드는 TCF7L2 mRNA 전사체에 결합하여 번역을 방해한다. 절대적인 상보성이 바람직하나, 요구되는 것은 아니다. 본 명세서에서 지칭된, RNA의 일부에 "상보적인(complementary)" 서열은 서열이 RNA와 혼성화되어, 안정한 이중가닥(duplex)을 형성하기에 충분한 상보성을 갖는다는 것을 의미하고; 이중가닥 안티센스 핵산의 경우, 따라서, 이중가닥 DNA의 단일 가닥이 테스트되거나 또는 삼중가닥(triplex) 형성이 분석될 수 있다. 혼성화하는 능력은 앞서 상술된 바와 같이, 안티센스 핵산의 상보성의 정도 및 길이 모두에 의존적일 것이다. 일반적으로, 혼성화하는 핵산이 길수록, RNA와의 보다 많은 염기 불일치(mismatch)를 포함하면서, 여전히 안정한 이중가닥 구조(또는 경우에 따라, 삼중가닥 구조)를 형성할 수 있다. 본 발명이 속하는 기술 분야의 당업자는 표준 절차의 이용에 의해 용인가능한 정도의 불일치를 확인할 수 있다.
안티센스 치료법에서 사용되는 올리고뉴클레오티드는 단일-가닥 또는 이중-가닥의 DNA, RNA, 또는 이들의 키메라 혼합물(chimeric mixture) 또는 이들의 유도체 또는 변형된 버전일 수 있다. 올리고뉴클레오티드는 염기 모이어티(moiety), 당 모이어티, 또는 포스페이트 백본에서 예를 들면, 분자의 안정성, 혼성화, 등을 개선하기 위해 변형될 수 있다. 올리고뉴클레오티드는 펩티드(예를 들면, 인 비보에서 숙주 세포 수용체를 표적화하기 위한 펩티드), 또는 세포막을 통한 이동을 촉진하는 작용제(예를 들면, Letsinger et ah, Proc. Natl. Acad. ScL USA 86:6553-6556 (1989); Lemaitre et al, Proc. Natl. Acad. ScL USA 84:648-652 (1987); PCT 국제 공개 NO: WO 88/09810 참조) 또는 혈뇌 장벽(blood-brain barrier)을 통한 이동을 촉진하는 작용제(예를 들면, PCT 국제공개 NO: WO 89/10134 참조) 또는 혼성화에 의해 유발되는 분할제(hybridization-triggered cleavage agent)(예를 들면, Krol et al, BioTechniques 6:958-976 (1988) 참조) 또는 삽입제(intercalating agent)(예를 들면, Zon, Pharm. Res. 5:539-549 (1988) 참조)와 같은 다른 부착된 작용기를 포함할 수 있다. 이 목적을 위해, 올리고뉴클레오티드가 또 다른 분자(예를 들면, 펩티드, 혼성화에 의해 유발되는 가교제, 수송제(transport agent), 혼성화에 의해 유발되는 분할제)에 접합(conjugate)될 수 있다.
안티센스 분자는 인 비보로 TCF7L2를 발현하는 세포로 전달된다. 안티센스 DNA 또는 RNA를 세포로 전달하기 위해 다수의 방법들이 이용될 수 있다; 예를 들면, 안티센스 분자가 직접 조직 부위로 주사될 수 있거나, 또는 원하는 세포를 표적하도록 설계된, 변형된 안티센스 분자(예를 들면, 표적 세포 표면 상에서 발현되는 수용체 또는 항원을 특이적으로 결합하는 펩티드 또는 항체에 연결된 안티센스)가 전신으로 투여될 수 있다. 대안적으로, 바람직한 구체예에서, 안티센스 올리고뉴클레오티드가 강력한 프로모터(예를 들면, pol III 또는 pol II)의 제어 하에 배치된 재조합 DNA 작제물이 이용된다. 환자의 표적 세포를 형질감염시키기 위한 그와 같은 작제물의 이용은 내생의 TCF7L2 전사체와 상보적인 염기쌍을 형성하고 이에 의해 TCF7L2 mRNA의 번역을 방해하기에 충분한 양의 단일가닥 RNA의 전사를 초래한다. 예를 들면, 인 비보로 벡터가 도입되고, 세포에 의해 흡수되어 안티센스 RNA의 전사를 주도할 수 있다. 그와 같은 벡터는 원하는 안티센스 RNA를 생성하기 위해 전사될 수 있다면, 에피좀으로 존재하거나 또는 염색체에 삽입될 수 있다. 그와 같은 벡터는 본 발명이 속하는 기술 분야에서 표준이고 전술된 재조합 DNA 기술에 의해 작제될 수 있다. 예를 들면, 조직 부위로 직접 도입될 수 있는 재조합 DNA 작제물을 제조하기 위해 플라스미드, 코스미드, YAC 또는 바이러스 벡터가 이용될 수 있다. 대안적으로, 선택적으로 원하는 조직을 감염시키는 바이러스 벡터가 이용될 수 있으며, 이 경우, 투여는 또 다른 경로에 의해(예를 들면, 전신) 수행될 수 있다.
내생적 TCF7L2 폴리펩티드 발현은 표적화된 상동성 재조합(targeted homologous recombination)(예를 들면, Smithies et al, Nature 317:230-234 (1985); Thomas & Capecchi, Cell 51:503-512 (1987); Thompson et al, Cell 5:313-321 (1989) 참조)을 이용하여 유전자, 핵산 또는 그의 프로모터를 불활성화시키거나 또는 "넉-아웃(knocking out)"시키는 것에 의해 감소될 수 있다. 예를 들면, 인 비보로 유전자 또는 핵산을 발현하는 세포를 형질감염시키기 위해, 내생적 유전자 또는 핵산(핵산의 코딩 영역 또는 조절 영역)에 상동성인 DNA에 의해 둘러싸인(flanked) 변화된, 비-기능성(non-functional) 유전자 또는 핵산(또는 완전히 무관한 DNA 서열)이 선택 마커 및/또는 네가티브 선택 마커와 함께 또는 상기 선택 마커 없이 이용될 수 있다. 표적화된 상동성 재조합을 통한, DNA 작제물의 삽입은 유전자 또는 핵산의 불활성화를 초래한다. 전술된 바와 같이, 적합한 벡터를 이용하여 재조합 DNA 작제물이 인 비보로 원하는 부위로 직접 투여되거나 표적화될 수 있다. 대안적으로, 변화되지 않은 유전자 또는 핵산의 발현이 유사한 방법을 이용하여 증가될 수 있다; 전술된 바와 같이, 변화된 TCF7L2 대신에 변화되지 않은 기능성 유전자 또는 핵산을 포함하는 DNA 작제물을 삽입하기 위해 표적화된 상동성 재조합이 이용될 수 있다. 또 다른 구체예에서, 세포에 존재하는 것과 상이한 타입 II 당뇨병 폴리펩티드를 코딩하는 핵산을 포함하는 DNA 작제물을 삽입하기 위해 표적화된 상동성 재조합이 이용될 수 있다.
대안적으로, 신체 내의 표적 세포에서 TCF7L2 핵산의 전사를 방해하는 삼중 나선 구조를 형성하기 위해 TCF7L2 핵산의 조절 영역(즉, TCF7L2 프로모터 및/또는 인핸서)에 상보적인 데옥시리보뉴클레오티드 서열을 표적화하는 것에 의해 내생의 TCF7L2 핵산 발현이 감소될 수 있다. (일반적으로, Helene, C, Anticancer Drug Des., 6(6):569-84 (1991); Helene, C. et al., Ann. N.Y. Acad. ScL 660:27-36 (1992); 및 Maher, L. J., Bioassays 14(12):807-15 (1992) 참조). 마찬가지로, 본 명세서에 기재된 안티센스 작제물은 TCF7L2 단백질 중 하나의 정상적인 생물학적 활성을 길항(antagonize)시키는 것에 의해, 인 비보 및 엑스 비보(ex vivo) 조직 배양 모두에서, 조직의 조작, 예를 들면, 조직 분화의 조작에서 이용될 수 있다. 또한, 안티센스 기법(예를 들면, 안티센스 분자의 미세주입, 또는 그 전사체가 타입 II 당뇨병 유전자 mRNA 또는 유전자 서열에 대해 안티-센스인 플라스미드에 의한 형질감염)이 발달 단계에서 TCF7L2의 역할 또는 TCF7L2 및 그의 결합제 간의 상호작용, 및 성체 조직에서 TCF7L2의 정상적인 세포 기능 또는 TCF7L2와 그의 결합제 간의 상호작용을 연구하기 위해 이용될 수 있다. 그와 같은 기법들은 세포 배양에서 이용될 수 있으나, 형질전환 동물의 생성에서도 이용될 수 있다.
본 발명의 또 다른 구체예에서, 본 명세서에 기술된 바와 같은 다른 TCF7L2 치료제가 타입 II 당뇨병 유전자의 치료에서 이용될 수 있다. 치료제는 전술된 바와 같은 조성물로, 또는 그 자체로 전달될 수 있다. 그들은 전신으로 투여되거나 또는 특정한 조직으로 표적화될 수 있다. 치료제는 화학적 합성; 재조합 생산; 인 비보 생산(예를 들면, Meade 등에 의한 미국특허 제4,873,316호의 형질전환 동물)을 포함한 다양한 수단에 의해 생산될 수 있고, 본 명세서에 기재된 바와 같은 표준 수단을 이용하여 분리될 수 있다.
임의의 전술된 치료 방법들의 조합(예를 들면, 변화된 TCF7L2의 mRNA를 표적화하는 안티센스 요법과 조합된 변화되지 않은 폴리펩티드의 투여; TCF7L2 핵산에 의해 코딩된 제2의 스플라이싱 변이체를 표적화하는 안티센스 요법과 조합된 TCF7L2 핵산에 의해 코딩된 제1의 스플라이싱 변이체의 투여)이 또한 이용될 수 있다.
TCF7L2 치료제에 대한 반응의 가능성(probability)을 평가하는 방법
본 발명은 추가적으로 개체의 TCF7L2 치료제에 대한 반응의 가능성을 평가하는 방법에 관한 것이다. 본 방법에서, TCF7L2 유전자와 관련된 마커 또는 하플로타입이 타입 II 당뇨병에 대한 개체의 감수성을 평가하는 것과 관련하여 전술된 바와 같이 평가된다. 타입 II 당뇨병에 대한 감수성(증가된 위험)과 관련된 대립형질, 마커, SNP, 또는 하플로타입(예를 들면, 마커 DG10S478에서 0이 아닌 대립형질; SNP rs12255372에서 T 대립형질; SNP rs7895340에서 A 대립형질; SNP rs11196205에서 C 대립형질; SNP rs7901695에서 C 대립형질; SNP rs7903146에서 T 대립형질; SNP rs12243326에서 C 대립형질; SNP rs4506565에서 T 대립형질; TCF7L2의 엑손 4 LD 블럭과 관련된 위험상태 하플로타입과 같은, TCF7L2 의 엑손 4 LD 블럭과 관련된 마커)의 존재는 TCF7L2 치료제에 대한 양성 반응의 가능성을 표시한다. "양성 반응의 가능성(Probability of a positive response)"은 개체가 본 명세서에 기재된 바와 같은 타입 II 당뇨병에 대한 감수성(증가된 위험)과 관련된 대립형질, 마커, SNP 또는 하플로타입을 갖지 않는 개체보다 TCF7L2 치료제에 대한 양성 반응을 가질 가능성이 더 높다는 것을 나타낸다. TCF7L2 치료제에 대한 "양성 반응(positive response)"은 타입 II 당뇨병의 치료를 나타내는 생리학적 반응이다. 전술된 바와 같이, "치료(treatment)"는 타입 II 당뇨병과 관련된 증상을 경감시킬 뿐 아니라, 타입 II 당뇨병의 발생을 예방 또는 지연시키며; 타입 II 당뇨병의 증상의 심각도 또는 빈도를 감소시키고; 및/또는 타입 II 당뇨병과 관련된 증상을 경감시키는 다른 약물과의 병행 치료법(concomitant therapy)에 대한 필요를 감소시키는 것을 의미한다.
약학적 조성물
본 발명은 또한 TCF7L2 활성을 변화시키거나 Wnt 신호전달 경로 또는 카데린(cadherin) 경로에 영향을 미치거나, 또는 TCF7L2 치료제로서 사용될 수 있는 작용제를 포함하는 약학적 조성물에 관한 것이다. 약학적 조성물은 약학적 조성물을 제조하기 위한 생리학적으로 허용가능한 담체 또는 부형제와 함께 제제화될 수 있다. 담체 및 조성물은 무균 상태일 수 있다. 제제는 투여 방식에 적합해야 한다.
적합한 약학적으로 허용가능한 담체는 물, 염 용액(예를 들면, NaCl), 염수, 완충된 염수(buffered saline), 알코올, 글리세롤, 에탄올, 검 아라빅, 식물성 오일, 벤질 알코올, 폴리에틸렌 글리콜, 젤라틴, 락토오스, 아밀로오스 또는 전분과 같은 탄수화물, 덱스트로오스, 마그네슘 스테아레이트, 활석, 규산, 점성 파라핀(viscous paraffin), 석유 오일, 지방산 에스테르, 히드록시메틸셀룰로오스, 폴리비닐 피롤리돈, 등 및 이들의 조합을 포함하나, 이에 한정되지 않는다. 약학적 제제는 바람직한 경우, 보조제(auxiliary agent), 예를 들면, 윤활제, 보존제, 안정제, 습윤제(wetting agent), 유화제, 삼투압에 영향을 미치는 염, 완충액, 착색제, 향미제 및/또는 방향성 물질 및 활성제와 유해하게 반응하지 않는 그 등가물과 혼합될 수 있다.
조성물은 바람직한 경우, 또한 미량의 습윤제 또는 유화제, 또는 pH 완충제를 포함할 수 있다. 조성물은 액체 용액, 현탁액, 유제(emulsion), 정제, 알약, 캡슐, 지연 방출성 제제(sustained release formulation), 또는 분말일 수 있다. 조성물은 트리글리세리드와 같은 전통적인 결합제 및 담체와 함께 좌약으로 제제화될 수 있다. 경구 제제는 약제학적 등급의 만니톨, 락토오스, 전분, 마그네슘 스테아레이트, 폴리비닐 피롤리돈, 소디움 사카린, 셀룰로오스, 탄산마그네슘, 등과 같은 표준 담체를 포함할 수 있다.
이와 같은 조성물을 도입하는 방법은 진피내, 근육내, 복막내, 안내(intraocular), 정맥내, 피하, 국소, 경구 및 비강내를 포함하나, 이에 한정되지 않는다. 다른 적합한 도입 방법은 또한 (하기에서 기술되는) 유전자 요법, 재충전형(rechargeable) 또는 생분해성(biodegradable) 장치, 입자 가속 장치("유전자 총(gene gun)") 및 서방형 폴리머 장치(slow release polymeric device)를 포함할 수 있다. 본 발명의 약학적 조성물은 또한 다른 작용제와의 조합 요법(combinatorial therapy)의 일부로 투여될 수 있다.
조성물은 인간으로의 투여를 위해 개조된 약학적 조성물로서 통상적인 절차에 따라 제제화될 수 있다. 예를 들면, 정맥내 투여용 조성물은 통상적으로 멸균된 등장성 수성 완충액(sterile isotonic aqueous buffer)에 담긴 용액이다. 필요한 경우, 조성물은 또한 가용화제 및 주사 부위에서의 통증을 완화시키기 위한 국소 마취제를 포함할 수 있다. 일반적으로, 성분들은 별개로 제공되거나 또는 단위 투여량 제형으로, 예를 들면, 활성제의 양을 표시하는 앰플 또는 사켓(sachette)과 같은 밀봉된 용기에 담긴 건조된 동결건조 분말 또는 물을 포함하지 않는 농축물(water free concentrate)로 함께 혼합되어 제공된다. 조성물이 주입에 의해 투여되는 경우, 조성물은 멸균된 약제학적 등급의 물, 염수 또는 덱스트로오스/물을 담은 주입용 병으로 분배될 수 있다. 조성물이 주사에 의해 투여되는 경우, 멸균된 주사용수 또는 염수의 앰플이 제공되어 성분들이 투여 전에 혼합될 수 있다.
국부 적용의 경우, 국부 적용과 조화될 수 있는 담체 및 바람직하게는 물보다 큰 동적인 점도를 갖는, 분무불가형(nonsprayable form), 점성형(viscous form) 내지 반-고체 제형 또는 고체 제형이 이용될 수 있다. 적합한 제제는 용액, 현탁액, 유제, 크림, 연고, 분말, 변비약, 로션, 졸(sol), 찰제(liniment), 고약(salve), 에어로졸, 등을 포함하나 이에 한정되지 않으며, 이들은 바람직한 경우, 멸균되거나 또는 보조제, 예를 들면, 보존제, 안정제, 습윤제, 완충액 또는 삼투압에 영향을 미치는 염 등과 혼합된다. 작용제는 미용용 제제에 내포될 수 있다. 국부 투여를 위해, 또한 활성 성분, 바람직하게는 고체 또는 액체의 비활성 담체 물질과 조합된 활성 성분이 스퀴즈 보틀(squeeze bottle)에 담기거나 또는 가압된 휘발성, 일반적으로 기체형 추진제, 예를 들면, 가압된 공기와 혼합된 것인 분무가능한(sprayable) 에이로졸 제제가 적합하다.
본 명세서에 기재된 작용제는 중성 형태 또는 염 형태로 제제화될 수 있다. 약학적으로 허용가능한 염은 염산, 인산, 아세트산, 옥살산, 타르타르산 등과 같은 유리 아미노 기에 의해 형성된 염, 및 소디움, 포타슘, 암모늄, 칼슘, 페릭 히드록시드(ferric hydroxide), 이소프로필아민, 트리에틸아민, 2-에틸아미노 에탄올, 히스티딘, 프로카인, 등과 같은 유리 카르복시 기에 의해 형성된 염을 포함한다.
작용제는 치료적 유효량으로 투여된다. 치료적으로 유효한 작용제의 양은 부분적으로 질환의 속성 및/또는 증상의 정도에 의존적이고, 표준 임상적 기법에 의해 결정될 수 있다. 또한, 인 비트로 분석법 또는 인 비보 분석법이 최적의 투여량 범위를 확인하기 위해 선택적으로 이용될 수 있다. 제제에서 이용될 정확한 투여량은 또한 투여 경로 및 증상의 심각도에 의존적이며, 임상의의 판단 및 각 환자의 상황에 따라 결정되어야 한다. 유효량은 인 비트로 또는 동물 모델 테스트 시스템으로부터 유래된 투여량-반응 곡선으로부터 외삽될 수 있다.
본 발명은 또한 본 발명의 약학적 조성물의 하나 이상의 성분으로 충진된 하나 이상의 용기를 포함하는 약학적 팩(pack) 또는 키트를 제공한다. 선택적으로, 제약 또는 생물학적 제품의 제조, 사용 또는 판매를 규제하는 정부 기관에 의해 규정된 형태의 고지(notice)가 그와 같은 용기(들)에 부착될 수 있고, 상기 고지는 인간 투여용으로의 용도 및 판매에 대한 상기 기관의 허가를 반영한다. 팩 또는 키트는 투여 양식, 약물 투여의 순서(예를 들면, 별개로, 순차적으로 또는 동시에), 등에 대한 정보를 포함할 수 있다. 팩 또는 키트는 환자에게 치료법을 적용할 것을 상기시키는 수단을 포함할 수 있다. 팩 또는 키트는 조합 요법의 단일 단위 투여량일 수 있거나 또는 복수 개의 단위 투여량일 수 있다. 특히, 작용제들은 분리되거나, 임의의 조합으로 혼합되어, 단일 바이알 또는 정제로 존재할 수 있다. 블리스터 팩(blister pack) 또는 다른 분배 수단으로 조립된 작용제들이 바람직하다. 본 발명의 목적을 위해, 단위 투여량은 각 작용제의 개별적인 약동학에 의존적이고 표준 시간 코스로 FDA 허가된 투여량으로 투여되는 투여량을 의미한다.
스크리닝 분석 및 그에 의해 확인된 작용제
본 발명은 또한 TCF7L2의 활성을 변화(예를 들면, 증가 또는 감소)시키고, 그렇지 않으면 TCF7L2 또는 Wnt 신호전달 경로 또는 카데린 경로의 또 다른 구성물(member)(예를 들면, 베타-카테닌)과 상호작용하는 작용제(예를 들면, 융합 단백질, 폴리펩티드, 펩티드 모방체, 전구체 약물, 수용체, 결합제, 항체, 소형 분자 또는 기타 약물, 또는 리보자임)를 확인하는 방법을 제공한다. 예를 들면, 일부 구체예에서, 그와 같은 작용제는 TCFL2에 결합하고; 예를 들면, TCF7L2의 활성에 대해 촉진성 효과 또는 억제성 효과를 가지거나; 또는 Wnt 신호전달 경로의 다른 구성물 또는 카데린 경로의 구성물과 상호작용하는 TCF7L2의 능력을 변화(예를 들면, 강화 또는 억제)시키거나, TCF7L2의 번역후 가공(posttranslational processing)을 변화시키는 작용제일 수 있다. 다른 구체예에서, 그와 같은 작용제는 Wnt 신호전달 경로 또는 카데린 경로의 활성 또는 기능을 변화시키는 작용제일 수 있다.
일 구체예에서, 본 발명은 TCF7L2 단백질(또는 그의 생물학적 활성 부분(들))에 결합하거나 또는 그 활성을 조정하는 후보 작용제 또는 테스트 작용제를 스크리닝하기 위한 분석법, 및 상기 분석법에 의해 확인될 수 있는 작용제을 제공한다. 테스트 작용제는 하기를 포함하는, 본 발명이 속하는 기술 분야에서 알려진 조합 라이브러리(combinational library) 방법에서 다수의 접근방법들 중 하나를 이용하여 수득될 수 있다: 생물학적 라이브러리; 공간 지향성 병렬적 고체 상 또는 용액 상 라이브러리(spatially addressable parallel solid phase or solution phase library); 디컨볼루션(deconvolution)을 필요로 하는 합성 라이브러리; '원-비드 원-컴파운드(one-bead one-compound)' 라이브러리 방법; 및 친화도 크로마토그래피 선택을 이용한 합성 라이브러리. 생물학적 라이브러리 접근방법은 폴리펩티드 라이브러리에 한정되나, 다른 4개의 접근방법은 폴리펩티드, 비-펩티드(non-peptide) 올리고머 또는 화합물의 소형 분자 라이브러리에 적용될 수 있다(Lam, K.S., Anticancer Drug Des. 12:145 (1997)).
일 구체예에서, TCF7L2의 활성을 변화시키는 작용제를 확인하기 위해, TCF7L2, 또는 그의 단편 또는 유도체를 포함하거나 또는 발현하는 세포, 세포 용해물, 또는 용액이 테스트될 작용제와 접촉될 수 있다; 대안적으로, 상기 단백질이 테스트될 작용제와 접촉될 수 있다. TCF7L2 활성의 수준(양)이 평가되고(예를 들면, TCF7L2 활성의 수준(양)이 직접적으로 또는 간접적으로 측정되고), 대조구의 활성의 수준(즉, 테스트될 작용제의 부재시, TCF7L2 단백질 또는 그의 활성 단편 또는 유도체의 활성의 수준)과 비교된다. 작용제의 존재시 활성 수준이 작용제의 부재시 활성 수준과 통계적으로 유의성 있는 양으로 상이한 경우, 상기 작용제는 TCF7L2의 활성을 변화시키는 작용제이다. 대조구 대비 활성 수준의 증가는 상기 작용제가 활성을 강화하는 작용제(또는 활성의 촉진자(agonist))라는 것을 의미한다. 마찬가지로, 대조구 대비 활성 수준의 감소는 상기 작용제가 활성을 억제하는 작용제(활성의 길항제(antagonist))라는 것을 의미한다. 또 다른 구체예에서, 테스트될 작용제의 존재시 TCF7L2 또는 그의 유도체 또는 그의 단편의 활성 수준은, 이전에 확립된 대조구 수준과 비교된다. 대조구 수준과 통계적으로 유의성 있는 양으로 상이한 작용제의 존재시 활성 수준은 작용제가 TCF7L2 활성을 변화시킨다는 것을 의미한다.
본 발명은 또한 TCF7L2 유전자의 발현(예를 들면, 전사 또는 번역)을 변화(예를 들면, 증가 또는 감소)시키거나(예를 들면, 안티센스 핵산, 융합 단백질, 폴리펩티드, 펩티드 모방체, 전구체 약물, 수용체, 결합제, 항체, 소형 분자 또는 기타 약물, 또는 리보자임) 또는 TCF7L2 와 상호작용하는 작용제를 확인하기 위한 분석법 및 상기 분석법에 의해 확인가능한 작용제에 관한 것이다. 예를 들면, TCF7L2를 코딩하는 핵산을 포함하는 용액이 테스트될 작용제와 접촉될 수 있다. 용액은 예를 들면, TCF7L2를 코딩하는 핵산을 포함하는 세포, 또는 그 핵산을 포함하는 세포 용해물을 포함할 수 있고; 대안적으로, 용액은 그 핵산의 전사/번역에 필요한 요소들을 포함하는 또 다른 용액일 수 있다. 적합한 경우, 용액에 현탁되지 않은 세포들도 이용될 수 있다. TCF7L2 발현의 수준 및/또는 패턴(예를 들면, 상이한 스플라이싱 변이체의 수준 및/또는 패턴과 같은, 발현된 mRNA 또는 단백질의 수준 및/또는 패턴)이 평가되고, 대조구의 발현 수준 및/또는 패턴(즉, 테스트될 작용제의 부재시 TCF7L2 발현의 수준 및/또는 패턴)과 비교된다. 작용제의 존재시 수준 및/또는 패턴이, 작용제의 부재시 수준 및/또는 패턴과 통계적으로 유의성 있는 양으로 상이한 경우, 상기 작용제는 타입 II 당뇨병 유전자의 발현을 변화시키는 작용제이다. TCF7L2 발현의 강화는 작용제가 TCF7L2 활성의 촉진자(agonist)라는 것을 의미한다. 마찬가지로, TCF7L2 발현의 억제는 작용제가 TCF7L2 활성의 길항제라는 것을 의미한다. 또 다른 구체예에서, 테스트될 작용제의 존재시 TCF7L2 폴리펩티드(예를 들면, 상이한 스플라이싱 변이체)의 수준 및/또는 패턴이 이전에 확립된 대조구 수준 및/또는 패턴과 비교된다. 작용제의 존재시 수준 및/또는 패턴이 작용제의 부재시 활성 수준과 통계적으로 유의성 있는 양 또는 방식으로 상이한 경우, 상기 작용제는 TCF7L2의 발현을 변화시키는 작용제이다.
본 발명의 또 다른 구체예에서, TCF7L2의 발현을 변화시키거나 TCF7L2 또는 Wnt 신호전달 경로 또는 카데린 경로의 또 다른 구성물과 상호작용하는 작용제는 TCF7L2의 프로모터 영역을 코딩하는 핵산 또는 리포터 유전자와 작동적으로 연결된 핵산을 포함하는 세포, 세포 용해물, 또는 용액을 이용하여 확인될 수 있다. 테스트될 작용제와의 접촉 후에, 리포터 유전의 발현 수준(예를 들면, 발현된 mRNA 또는 단백질의 수준) 평가되고, 대조구에서의 발현 수준(즉, 테스트될 작용제의 부재시 리포터 유전자의 발현 수준)과 비교된다. 작용제의 존재시 수준이 작용제의 부재시 수준과 통계적으로 유의성 있는 양에 의해 상이한 경우, TCF7L2 유전자 프로모터와 작동적으로 연결된 유전자의 발현을 변화시키는 능력에 의해 표시되는 바와 같이, 상기 작용제는 TCF7L2의 발현을 변화시키는 작용제이다. 리포터의 발현의 강화는 작용제가 TCF7L2 활성의 촉진제라는 것을 나타낸다. 마찬가지로, 리포터의 발현의 억제는 작용제가 TCF7L2 활성의 길항제라는 것을 나타낸다. 또 다른 구체예에서, 테스트 대상 작용제의 존재시 리포터의 발현 수준이 이전에 확립된 대조구 수준과 비교된다. 대조구 수준과 통계적으로 유의성 있는 양으로 또는 통계적으로 유의성 있는 방식으로 상이한, 작용제의 존재시 수준은 작용제가 발현을 변화시킨다는 것을 나타낸다.
TCF7L2에 의해 코딩되는 상이한 스플라이싱 변이체의 양을 변화시키는 작용제(예를 들면, 제1 스플라이싱 변이체의 활성을 강화하고, 제2 스플라이싱 변이체의 활성을 억제하는 작용제), 및 제1 스플라이싱 변이체의 활성의 촉진제이고, 제2 스플라이싱 변이체의 활성의 길항제인 작용제가 전술된 방법들을 이용하여 용이하게 확인될 수 있다.
본 발명의 다른 구체예에서, TCF7L2 결합제 대비, 폴리펩티드 활성에 대한 테스트 작용제의 효과를 평가하기 위해 분석법들이 이용될 수 있다. 예를 들면, TCF7L2 폴리펩티드와 상호작용하는 화합물(Wnt 신호전달 경로의 구성물 또는 카데린 경로의 구성물과 같은, TCF7L2 폴리펩티드와 직접적으로 또는 간접적으로 상호작용하는 폴리펩티드 또는 다른 분자일 수 있으며, 본 명세서에서 "TCF7L2 결합제"로도 지칭됨)을 발현하는 세포가 테스트 작용제의 존재 하에 TCF7L2와 접촉되고, 테스트 작용제가 TCF7L2와 TCF7L2 결합제 간의 상호작용을 변화시키는 능력이 결정된다. 대안적으로, TCF7L2 결합제를 함유한 세포 용해물 또는 용액이 사용될 수 있다. TCF7L2 또는 TCF7L2 결합제에 결합하는 작용제는 TCF7L2가 TCF7L2 결합제에 결합하거나, TCF7L2 결합제와 회합(associate)하거나, 또는 TCF7L2 결합제와 상호작용하는 능력을 방해하거나 또는 강화하는 것에 의해 상호작용을 변화시킬 수 있다. 테스트 작용제가 TCF7L2 또는 TCF7L2 결합제에 결합하는 능력의 결정은 예를 들면, 테스트 작용제를 방사성 동위원소 또는 효소 표지에 결합시켜, 테스트 작용제의 폴리펩티드로의 결합이 직접적으로 또는 간접적으로 125I, 35S, 14C 또는 3H에 의한 표지 또는 방사성방출(radioemmission) 또는 신틸레이팅 카운팅(scintillating counting)에 의해 검출되는 방사성 동위원소를 검출하여 결정될 수 있도록 하여 수행될 수 있다. 대안적으로, 테스트 작용제는 효소에 의해, 예를 들면, 호스래디쉬 퍼옥시다아제(horseradish peroxidase), 알칼리 포스파타아제, 또는 루시페라아제로 표지되고, 효소 표지는 적합한 기질의 생성물로의 전환을 결정하는 것에 의해 검출될 수 있다. 또한, 반응물의 표지 없이 테스트 작용제가 폴리펩티드와 상호작용하는 능력을 결정하는 것도 본 발명의 범위 내에 속한다. 예를 들면, 테스트 작용제, TCF7L2, 또는 TCF7L2 작용제의 표지화 없이, 테스트 작용제와 TCF7L2 또는 TCF7L2 작용제 간의 상호작용을 검출하기 위해, 마이크로피지오미터(microphysiometer)가 사용될 수 있다. McConnell, H.M. et al, Science 257: 1906-1912 (1992). 본 명세서에서 사용된, "마이크로피지오미터"(예를 들면, Cytosensor™)는 광지시형 전위차 센서(light-addressable potentiometric sensor: LAPS)를 이용하여 세포가 그의 환경을 산성화시키는 속도를 측정하는 분석 장치이다. 이 산성화 속도의 변화는 리간드와 폴리펩티드 간의 상호작용의 지표로서 사용될 수 있다.
따라서, 이 수용체들은 타입 II 당뇨병에 대한 감수성을 치료 또는 연구하는데 사용할, 촉진제 또는 길항제인 화합물을 스크리닝하기 위해 사용될 수 있다. 약물들은 TCF7L2 활성화를 조절하고 이에 의해 신신호전달 경로 및 하류 유전자들의 전사를 조절하기 위해 이용될 수 있도록 설계될 수 있다.
본 발명의 또 다른 구체예에서, TCF7L2와 상호작용하는 폴리펩티드를 확인하기 위해 분석법들이 이용될 수 있다. 예를 들면, TCF7L2와 상호작용하는 폴리펩티드를 확인하기 위해 Fields 및 Song(Fields, S. and Song, O., Nature 340:245-246 (1989))에 의해 기재된 바와 같은, 효모 2(two)-하이브리드 시스템이 이용될 수 있다. 그와 같은, 효모 2-하이브리드 시스템에서, 두 개의 기능성 도메인(DNA 결합 도메인 및 전사 활성화 도메인)을 갖는 전사 인자의 유연성에 근거하여 벡터가 작제될 수 있다. 두 도메인이 분리되어 있으나 서로 상호작용하는 두 개의 상이한 단백질에 융합되는 경우, 전사적 활성화가 달성될 수 있고, 특정한 마커(예를 들면, His 및 Ade와 같은 영양 마커 또는 lacZ와 같은 색 마커)의 전사가 상호작용 및 전사 활성화의 존재를 확인하기 위해 이용될 수 있다. 예를 들면, 본 발명의 방법에서, DNA 결합 도메인 및 TCF7L2, 그의 스플라이싱 변이체, 또는 그의 단편 또는 유도체를 코딩하는 핵산을 포함하는 제1 벡터 및, 전사 활성화 도메인 및 잠재적으로 TCF7L2와 상호작용할 수 있는 폴리펩티드, 그의 스플라이싱 변이체, 또는 그의 단편 또는 유도체를 코딩하는 핵산을 포함하는 제2 벡터가 이용된다. 적합한 조건 하에(예를 들면, Clontech(Palo Alto, California, USA)로부터의 Matchmaker™ 시스템에서 사용되는 것과 같은 교배(mating) 조건) 제1 벡터 및 제2 벡터를 포함하는 효모의 인큐베이션은 목적 마커(marker of interest)를 발현하는 콜로니의 확인을 가능하게 한다. 이 콜로니들은 TCF7L2 또는 그의 단편 또는 유도체와 상호작용하는 폴리펩티드를 확인하기 위해 조사될 수 있다. 치료 방법과 관련하여 기재된 바와 같이, 그와 같은 폴리펩티드는 TCF7L2의 발현의 활성을 변화시키는 작용제로서 이용될 수 있다.
본 발명의 전술된 분석 방법의 하나 이상의 구체예에서, 단백질 중 하나, 또는 양자 모두의 복합체 형태(complexed form)를 복합체를 형성하지 않은 형태(uncomplexed form)로부터의 분리를 촉진하고, 분석의 자동화를 수용하기 위해, TCF7L2 유전자, TCF7L2 단백질, TCF7L2 결합제(예를 들면, Wnt 신호전달 경로의 또 다른 구성물, 또는 카데린 경로의 구성물), 또는 분석의 다른 성분들을 고체 지지물에 고정화시키는 것이 바람직할 수 있다. 테스트 작용제의 단백질로의 결합, 또는 테스트 작용제의 존재 및 부재시 단백질과 결합제의 상호작용은 반응물들을 수용하기에 적합한 임의의 용기에서 수행될 수 있다. 그와 같은 용기의 예는 마이크로타이터 플레이트(microtiter plate), 시험관, 및 미세원심분리(microcentrifuge)용 튜브를 포함한다. 일 구체예에서, TCF7L2, TCF7L2 단백질, 또는 TCF7L2 결합제가 매트릭스 또는 다른 고체 지지물에 결합될 수 있게 하는 도메인을 첨가하는 융합 단백질(예를 들면, 글루타티온-S-트랜스퍼라아제 융합 단백질)이 제공될 수 있다.
또 다른 구체예에서, 본 발명의 핵산 분자의 발현의 조절은 TCF7L2를 함유한 세포, 세포 용해물, 또는 용액이 작용제와 접촉되고, 상기 세포, 세포 용해물, 또는 용액에서 적합한 mRNA 또는 폴리펩티드(예를 들면, 스플라이싱 변이체)의 발현이 결정되는 것인 방법에서 확인된다. 테스트 작용제의 존재 시 적합한 mRNA 또는 폴리펩티드의 발현 수준이 테스트 작용제의 부재 시 mRNA 또는 폴리펩티드의 발현 수준과 비교된다. 그 후, 테스트 작용제는 이 비교에 근거하여 발현의 조절제로 확인될 수 있다. 예를 들면, mRNA 또는 폴리펩티드의 발현이 테스트 작용제의 존재시 그 부재시보다 더 높은(통계적으로 유의성 있게 더 높은) 경우, 테스트 작용제는 mRNA 또는 폴리펩티드 발현의 촉진제 또는 강화제로 확인된다. 대안적으로, mRNA 또는 폴리펩티드의 발현이 테스트 작용제의 존재 시 그 부재시보다 더 낮은(통계적으로 유의성 있게 더 낮은) 경우, 테스트 작용제는 mRNA 또는 폴리펩티드 발현의 억제제로 확인된다. 세포에서 mRNA 또는 폴리펩티드 발현의 수준은 본 명세서에서 mRNA 또는 폴리펩티드를 검출하기 위해 기재된 방법에 의해 결정될 수 있다.
본 발명은 또한 전술된 스크리닝 분석법에 의해 확인된 신규한 작용제에 관한 것이다. 따라서, 본 명세서에 기개된 치료 방법에서 본 명세서에 기재된 바와 같이 확인된 작용제를 사용하는 것은 본 발명의 범위 내에 속한다. 예를 들면, 본 명세서에서 기재된 바와 같이 확인된 작용제는 TCF7L2 유전자에 의해 코딩되는 단백질의 활성을 변화시키거나 또는 TCF7L2의 발현을 변화시키기 위해 상기 단백질 또는 상기 핵산을 본 명세서에 기재된 바와 같이 확인된 작용제와 접촉시키는 단계(또는 상기 폴리펩티드 또는 상기 핵산을 포함하는 세포를 작용제와 접촉시키는 단계))에 의해 이용될 수 있다.
본 발명의 핵산
TCF7L2 핵산, 그의 일부 및 변이체
본 발명은 또한 인간 TCF7L2를 포함하는 분리된 핵산 분자에 관한 것이다. 본 발명의 TCF7L2 핵산 분자는 RNA, 예를 들면, mRNA, 또는 cDNA 및 게놈 DNA와 같은 DNA일 수 있다. DNA 분자는 이중-가닥이거나 또는 단일-가닥일 수 있고; 단일 가닥 RNA 또는 DNA는 코딩 또는 센스 스트랜드이거나 또는 비-코딩(non-coding) 또는 안티센스 스트랜드일 수 있다. 핵산 분자는 유전자의 코딩 서열의 전부 또는 일부를 포함할 수 있고 인트론 및 비-코딩 3' 서열 및 5' 서열(예를 들면, 조절 서열 포함)과 같은 추가적인 비-코딩 서열을 더 포함할 수 있다.
추가적으로, 본 발명의 핵산 분자는 마커 서열, 예를 들면, 폴리펩티드의 분리 또는 정제를 보조하는 폴리펩티드를 코딩하는 서열에 융합될 수 있다. 그와 같은 서열은 글루타티온-S-트랜스퍼라아제(GST) 융합 단백질을 코딩하는 서열 및 인플루엔자로부터 헤마글루티닌 A(HA)를 코딩하는 서열을 포함하나, 이에 한정되지 않는다.
본 명세서에서 사용된, "분리된(isolated)" 핵산 분자는 일반적으로 (게놈 서열에서와 같이) 유전자 또는 뉴클레오티드 서열을 플랭킹(flank)하는 핵산으로부터 분리되고 및/또는 다른 전사되는 서열(예를 들면, RNA 라이브러리에서와 같이)로부터 완전히 또는 부분적으로 정제된 분자이다. 예를 들면, 본 발명의 분리된 핵산은 그들이 자연적으로 생성되는 복잡한 세포 환경(cellular millieu) 또는 재조합 기법에 의해 제조되는 경우, 배양 배지, 또는 화학적으로 합성되는 경우, 화학적 전구체 또는 다른 화학물질들로부터 실질적으로 분리될 수 있다. 일부 경우에, 분리된 물질은 조성물(예를 들면, 다른 물질들을 포함하는 조 추출물(crude extract)), 완충액 시스템 또는 시약 혼합물(reagent mix)의 일부를 형성할 것이다. 다른 경우에, 분리된 핵산은 예를 들면, PAGE 또는 HPLC와 같은 컬럼 크로마토그래피에 의해 결정되는 바와 같이, 본질적인 균질성까지 정제될 수 있다. 바람직하게는, 분리된 핵산 분자는 존재하는 모든 거대분자 종의 약 50, 80 또는 90% (몰 기준)를 구성한다. 게놈 DNA에 대해, 용어 "분리된"은 또한 게놈 DNA가 원래 결합되어 있는 염색체로부터 분리된 핵산 분자를 지칭한다. 예를 들면, 분리된 핵산 분자는 그 핵산 분자가 유래된 세포의 게놈 DNA에서 그 핵산 분자를 플랭킹하는 뉴클레오티드의 약 5 kb 미만, 그러나, 4 kb, 3 kb, 2 kb, 1 kb, 0.5 kb 또는 0.1 kb에 한정되지 않는 뉴클레오티드를 포함할 수 있다.
핵산 분자는 다른 코딩 또는 조절 서열에 융합될 수 있고 여전히 분리된 것으로 간주될 수 있다. 따라서, 벡터 내에 포함된 재조합 DNA는 본 명세서에서 사용된 "분리된"의 정의에 포함된다. 또한, 분리된 핵산 분자는 이종(heterologous) 숙주 세포 내의 재조합 DNA 분자, 및 용액에 담긴 부분적으로 또는 실질적으로 정제된 DNA 분자를 포함한다. "분리된" 핵산 분자는 또한 본 발명의 DNA 분자의 인 비보 및 인 비트로 RNA 전사물(transcript)을 포괄한다. 분리된 핵산 분자는 화학적으로 합성되거나 또는 재조합 수단에 의해 제조된 핵산 분자 또는 핵산 서열을 포함할 수 있다. 따라서, 벡터 내에 포함된 재조합 DNA는 본 명세서에서 사용된 "분리된"의 정의에 포함된다. 또한, 분리된 핵산 분자는 이종 개체 내의 재조합 DNA 분자뿐 아니라, 용액에 담긴 부분적으로 또는 실질적으로 정제된 DNA를 포함한다. 본 발명의 DNA 분자의 인 비보 및 인 비트로 RNA 전사물도 "분리된" 핵산 서열에 의해 포괄된다. 그와 같은 분리된 핵산 분자는 (예를 들면, 다른 포유동물 종으로부터) 상동성 서열의 분리, (예를 들면, 염색체와의 인 시투 혼성화(in situ hybridizaiton)에 의한) 유전자 맵핑, 또는 노던 블롯 분석 또는 서던 블롯 분석과 같은, 조직(예를 들면, 인간 조직)에서의 유전자의 발현 검출을 위한 프로브로서, 코딩된 폴리펩티드의 제조에서 유용하다.
본 발명은 또한, 반드시 천연적으로 발견되는 것은 아니나 TCF7L2 폴리펩티드, 또는 TCF7L2 폴리펩티드의 또 다른 스플라이싱 변이체, 또는 그의 다형성 변이체를 코딩하는 핵산 분자에 관한 것이다. 따라서, 예를 들면, 본 발명은 천연 뉴클레오티드 서열과는 상이하나, 유전자 코드의 축퇴성(degeneracy) 때문에, 본 발명의 TCF7L2 폴리펩티드를 코딩하는 서열을 포함하는 DNA 분자에 관한 것이다. 본 발명은 또한, TCF7L2 폴리펩티드의 일부(단편)를 코딩하거나, 또는 TCF7L2 폴리펩티드의 유사체 또는 유도체와 같은 변이체 폴리펩티드를 코딩하는 핵산 분자를 포괄한다. 그와 같은 변이체는 대립형질 변형(allelic variation) 또는 단일 뉴클레오티드 다형성의 경우와 같이, 천연적인 것이거나, 또는 다양한 돌연변이원(mutagen) 및 돌연변이 생성 과정에 의해 유도된 것들과 같은, 비-천연적인 것일 수 있다. 의도된 변형은 첨가 및 결실을 포함한, 보존적(conservative) 또는 비-보존적 아미노산 변화를 초래할 수 있는 하나 이상의 뉴클레오티드의 첨가, 결실 및 치환을 포함하나, 이에 한정되지 않는다. 바람직하게는, 뉴클레오티드 (및/또는 결과물인 아미노산) 변화는 침묵형(silent)이거나 보존적이다; 즉, 그들은 TCF7L2 폴리펩티드의 특성 또는 활성을 변화시키지 않는다. 일 양태에서, 핵산 서열은 하나 이상의 다형성 마이크로새틀라이트 마커를 포함하는 단편이다. 또 다른 양태에서, 뉴클레오티드 서열은 TCF7L2 유전자에 하나 이상의 단일 뉴클레오티드 다형성을 포함하는 단편이다.
본 발명의 핵산 분자의 다른 변화들은 예를 들면, 표지화, 메틸화, 무전하 결합(uncharged linkage)(예를 들면, 메틸 포스포네이트, 포스포트리에스테르, 포스포아미데이트, 카르바메이트), 하전된 결합(예를 들면, 포스포로티오에이트, 포스포로디티오에이트), 펜던트 모이어티(pendant moiety)(예를 들면, 폴리펩티드), 삽입제(intercalator)(예를 들면, 아크리딘, 소랄렌(psoralen)), 킬레이트제, 알킬화제(alkylator) 및 변형된 결합(예를 들면, 알파 아노머 핵산)과 같은 뉴클레오티드간 변형(internucleotide modification)을 포함할 수 있다. 또한, 수소 결합 및 다른 화학적 상호작용을 통해 지정된 서열에 결합하는 핵산 분자의 능력을 모방하는 합성 분자들이 포함된다. 그와 같은 분자들은 예를 들면, 분자의 백본에서 펩티드 결합이 포스페이트 결합을 대체하는 분자들을 포함한다.
본 발명은 또한 선택적인 혼성화를 위한 것과 같은 고 엄격성 혼성화 조건(high stringency hybridization condtion) 하에서, 본 명세서에 기재된 뉴클레오티드 서열(예를 들면, 본 명세서에 기재된 폴리펩티드를 코딩하는 뉴클레오티드 서열에 특이적으로 혼성화하고, 선택적으로 그 폴리펩티드의 활성을 갖는 핵산 분자)에 혼성화하는 핵산 분자에 관한 것이다. 일 양태에서, 본 발명은 아미노산 서열 또는 그의 다형성 변이체를 코딩하는 뉴클레오티드 서열에 고 엄격성 혼성화 조건(예를 들면, 선택적인 혼성화를 위한 조건) 하에서 혼성화하는 본 명세서에 기재된 변이체를 포함한다. 또 다른 양태에서, 고 엄격성 혼성화 하에서 혼성화하는 변이체는 TCF7L2 폴리펩티드의 활성을 갖는다.
그와 같은 핵산 분자는 특이적 혼성화(예를 들면, 고 엄격성 조건 하에서의 혼성화)에 의해 검출되고 및/또는 분리될 수 있다. 본 명세서에서 사용된, "특이적 혼성화(specific hybridization)"는 제1 핵산이 제2 핵산이 아닌 다른 핵산에는 혼성화하지 않는 방식으로 제2 핵산에 혼성화하는 능력을 의미한다(예를 들면, 제1 핵산이 혼성화가 수행될 시료 내의 다른 핵산보다 제2 핵산에 대해 보다 높은 유사성을 갖는 경우). 혼성화를 위한 "엄격성 조건(stringency condition)"은 특정한 핵산의 제2 핵산으로의 혼성화를 허용하고, 상기 제1 핵산은 상기 제2 핵산에 완전하게(즉, 100%) 상보적일 수 있거나, 또는 상기 제1 핵산 및 제2 핵산은 완벽하지 않은 어느 정도의(예를 들면, 70%, 75%, 85%, 90%, 95%) 상보성을 공유할 수 있는 것인, 온도 및 완충액 농도 조건과 같은 인큐베이션 및 세척 조건을 의미한다. 예를 들면, 완전하게 상보적인 핵산을 보다 낮은 상보성의 핵산과 구별하는 특정한 고 엄격성 조건이 이용될 수 있다. "고 엄격성 조건", "중간 엄격성 조건(moderate stringent condition)" 및 "저 엄격성 조건", 및 핵산 혼성화 방법이 Current Protocols in Molecular Biology의 2.10.1-2.10.16 및 6.3.1-6.3.6면(Ausubel, F. et ah, "Current Protocols in Molecular Biology", John Wiley & Sons, (1998)), 및 Kraus, M. and Aaronson, S., Methods Enzymol, 200:546- 556 (1991)에 기재된다.
두 개의 뉴클레오티드 서열 또는 아미노산 서열 간의 퍼센트 상동성 또는 동일성은 최적의 비교 목적을 위해 그 서열들을 정렬시키는 것에 의해 결정될 수 있다(예를 들면, 최적의 정렬(optimal alignment)을 위해, 제1 서열의 서열 상에 갭이 도입될 수 있다). 그 후, 상응하는 위치들의 뉴클레오티드 또는 아미노산이 비교되고, 두 서열 간의 퍼센트 동일성은 그 서열들에 의해 공유된 동일한 위치의 수의 함수이다(즉, % 동일성(identity) = 동일한 위치의 갯수/ 전체 위치의 갯수 x 100). 하나의 서열 상의 위치가 다른 서열의 해당하는 위치에 있는 동일한 뉴클레오티드 또는 아미노산 잔기에 의해 차지된 경우, 상기 분자들은 그 위치에서 상동하다. 본 명세서에서 사용된, 핵산 또는 아미노산 "상동성(homology)"은 핵산 또는 아미노산 "동일성(identity)"과 동등하다. 특정한 양태에서, 비교 목적을 위해 정렬된 서열의 길이는, 기준 서열의 길이의 30% 이상, 예를 들면, 40% 이상이고, 일부 양태에서, 60% 이상이며, 다른 양태에서는 70% 이상, 80% 이상, 90% 이상 또는 95% 이상이다. 두 서열의 실제 비교는 공지된 방법, 예를 들면, 수학적 알고리즘을 이용하여 수행될 수 있다. 그와 같은 수학적 알고리즘의 바람직한, 비-한정적인 예가 Karlin et al., Proc. Natl. Acad. ScL USA 90:5873-5877 (1993)에 기재된다. 그와 같은 알고리즘은 Altschul et al, Nucleic Acids Res. 25:389-3402 (1997)에 기재된 바와 같이, NBLAST 및 XBLAST 프로그램(버전 2.0)에 내포된다. BLAST 및 Gapped BLAST 프로그램을 이용하는 경우, 개별적인 프로그램(예를 들면, NBLAST)의 디폴트 파라미터가 이용될 수 있다. 일 양태에서, 서열 비교를 위한 파라미터는 score=100, wordlength=12로 설정되거나, 또는 변화될 수 있다(예를 들면, W=5 또는 W=20).
서열 비교를 위해 이용되는 수학적 알고리즘의 또 다른 바람직한 비-한정적 예는 Myers 및 Miller, CABIOS 4(1):11-17(1988)의 알고리즘이다. 그와 같은 알고리즘은 GCG 서열 정렬 소프트웨어 패키지(Accelrys, Cambridge, UK)의 부분인 ALIGN 프로그램(버전 2.0)에 내포된다. 아미노산 서열 비교를 위해 ALIGN 프로그램을 이용하는 경우, PAM120 가중치 잔기(weight residue) 표, 12의 갭 길이 페널티(gap length penalty), 및 4의 갭 페널티가 이용될 수 있다. 추가적인 서열분석용 알고리즘이 본 발명이 속하는 기술 분야에서 알려져 있으며 Torellis and Robotti, Comput. Appl. Biosci. 10:3-5 (1994)에 기재된 바와 같은 ADVANCE 및 ADAM; 및 Pearson and Lipman, Proc. Natl. Acad. Sci. USA 85:2444-8 (1988)에 기재된 바와 같은 FASTA를 포함한다.
또 다른 양태에서, 두 개의 아미노산 서열 간의 퍼센트 동일성은 BLOSUM63 매트릭스 또는 PAM250 매트릭스, 및 12, 10, 8, 6, 또는 4의 갭 가중치(gap weight) 및 2, 3, 또는 4의 길이 가중치(length weight)를 이용한, GCG 소프트웨어 패키지의 GAP 프로그램을 이용하여 수득될 수 있다. 또 다른 양태에서, 두 개의 핵산 서열 간의 퍼센트 동일성은 50의 갭 가중치 및 3의 길이 가중치를 이용한, GCG 소프트웨어 패키지의 GAP 프로그램을 이용하여 수득될 수 있다.
본 발명은 또한 TCF7L2의 뉴클레오티드 서열, 또는 그와 같은 서열의 상보체(complement)에 고도의 엄격한 조건 하에서 혼성화하는 단편 또는 부분을 포함하는 분리된 핵산 분자를 제공하고, 또한, 아미노산 서열 또는 그의 다형성 변이체를 코딩하는 뉴클레오티드 서열에 고도의 엄격한 조건 하에서 혼성화하는 단편 또는 부분을 포함하는 분리된 핵산 분자를 제공한다. 본 발명의 핵산 단편은 약 15개 이상, 바람직하게는 약 18개 이상, 20개 이상, 23개 이상 또는 25개 이상의 뉴클레오티드의 길이이고, 30개, 40개, 50개, 100개, 200개 또는 그 이상의 뉴클레오티드로 구성된 길이일 수 있다. 보다 긴 단편, 예를 들면, 30개 이상의 뉴클레오티드로 구성되고, 본 명세서에 기재된 항원성 폴리펩티드를 코딩하는 단편, 하기에 기재된 바와 같은 항체의 생성을 위한 것과 같은 단편이 특히 유용하다.
프로브 및 프라이머
관련된 양태에서, 본 발명의 핵산 단편은 본 명세서에 기재된 바와 같은 분석법에서 프라이머 또는 프로브로 이용된다. "프로브(probe)" 또는 "프라이머(primer)"는 핵산 분자의 상보적 가닥에 염기-특이적 방식으로 혼성화하는 올리고뉴클레오티드이다. 그와 같은 프로브 및 프라이머는 Nielsen et al, Science 254:1497-1500 (1991)에 기재된 바와 같은, 폴리펩티드 핵산을 포함한다.
프로브 또는 프라이머는 TCF7L2 또는 그의 다형성 변이체의 연속된 뉴클레오티드 서열을 포함하는 핵산 분자의 약 15개 이상, 예를 들면, 약 20-25개, 및 일부 양태에서, 약 40개, 50개 또는 75개의 순차적인 뉴클레오티드에 혼성화하는 뉴클레오티드 서열의 영역을 포함한다. 다른 양태에서, 100개 이하의 뉴클레오티드, 일부 양태에서는 6개 내지 50개의 뉴클레오티드, 예를 들면, 12개 내지 30개의 뉴클레오티드를 포함한다. 다른 양태에서, 프로브 또는 프라이머는 연속된 뉴클레오티드 서열 또는 그 연속된 뉴클레오티드 서열의 상보체에 70% 이상의 동일성을 갖거나, 예를 들면, 80% 이상 동일성을 갖거나, 일부 양태에서는 90% 이상 동일성을 갖고, 다른 양태에서는 95% 이상 동일성을 갖거나, 또는 심지어 상기 연속된 뉴클레오티드 서열 또는 그 뉴클레오티드 서열의 상보체에 선택적으로 혼성화를 수행할 수 있다. 종종, 프로브 또는 프라이머는 표지, 예를 들면, 방사성 동위원소, 형광 화합물, 효소, 또는 효소 보조-인자를 더 포함한다.
전술된 바와 같은 본 발명의 핵산 분자는 표준 분자 생물학 기법 및 본 명세서에서 제공된 서열 정보를 이용하여 확인되고 분리될 수 있다. 예를 들면, 핵산 분자는 TCF7L2의 서열, 또는 그와 같은 서열의 상보체에 근거하여 설계되거나 또는 본 명세서에서 제공된 하나 이상의 아미노산 서열을 코딩하는 서열에 근거한 뉴클레오티드에 근거하여 설계된 합성 올리고뉴클레오티드 프라이머를 이용한 중합효소 연쇄 반응(PCR)에 의해 증폭되고 분리될 수 있다. 전반적으로 PCR Technology: Principles and Applications for DNA Amplification (ed. H. A. Erlich, Freeman Press, NY, NY, 1992); PCR Protocols: A Guide to Methods and Applications (Eds. Innis et ah, Academic Press, San Diego, CA, 1990); Mattila et at., Nucl. Acids Res. 19: 4967 (1991); Eckert et al, PCR Methods and Applications 1:17 (1991); PCR (eds. McPherson et al, IRL Press, Oxford); 및 미국특허 제4,683,202호를 참조한다. 핵산 분자는 cDNA, mRNA, 또는 게놈 DNA를 주형으로 이용하여 증폭되고, 적합한 벡터 상에 클로닝되며, DNA 서열 분석에 의해 특성이 규명될 수 있다.
다른 적합한 증폭 방법들은 리가아제 연쇄 반응(Ligase Chain Reaction: LCR)(Wu and Wallace, Genomics 4:560 (1989), Landegren et al, Science 241:1077 (1988 참조), 전사 증폭(transcription amplification)(Kwoh et al, Proc. Natl. Acad. Sd. USA 86:1173 (1989)), 및 자립형 서열 복제(self-sustained sequence replication)(Guatelli et al, Proc. Nat. Acad. Sd. USA 87: 1874 (1990)) 및 핵산 기반 서열 증폭(Nucleic Acid Based Sequence Amplification: NASBA)을 포함한다. 마지막 두 개의 증폭 방법은 등온 전사(isothermal transcription)에 기반한 등온 반응들을 포함하고, 증폭 산물로서, 각각 약 30 또는 100 대 1의 비율로 단일 가닥 DNA(ssDNA) 및 이중 가닥 DNA(ds DNA)를 모두 생성한다.
증폭된 DNA는 표지되어, 예를 들면, 방사성 표지되어, 인간 세포로부터 유래된 cDNA 라이브러리, 잽 익스프레스(zap express), ZIPLOX 또는 기타 적합한 벡터의 mRNA를 스크리닝하기 위한 프로브로 이용될 수 있다. 상응하는 클론이 분리되고, 인 비보 절단(excision) 후에DNA가 수득될 수 있고, 클로닝된 삽입물은 적합한 분자량의 폴리펩티드를 코딩하는 올바른 판독 프레임을 확인하기 위해 본 발명이 속하는 기술 분야에서 인정되는 방법에 의해 일 배향(orientation) 또는 양 배향으로 서열결정이 이루어질 수 있다. 예를 들면, 본 발명의 핵산 분자의 뉴클레오티드 서열의 직접적인 분석은 상업적으로 구입가능한 공지된 방법을 이용하여 수행될 수 있다. 예를 들면, Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd Ed., CSHP, New York 1989); Zyskind et al., Recombinant DNA Laboratory Manual, (Acad. Press, 1988))를 참조한다. 추가적으로, 핵산(Chen et al, Genome Res. 9, 492 (1999)) 및 폴리펩티드를 분석하기 위한 형광 방법이 또한 이용될 수 있다. 이 방법들 및 유사한 방법들을 이용하여, 폴리펩티드 및 그 폴리펩티드를 코딩하는 DNA가 분리되고, 서열결정되며, 그 특성이 더 규명될 수 있다.
본 발명의 안티센스 핵산 분자는 TCF7L2 및/또는 그 상보체 또는 그의 부분의 핵산 서열을 이용하여 설계되고, 본 발명이 속하는 기술 분야에서 공지된 절차를 이용하여, 화학적 합성 및 효소에 의한 라이게이션 반응을 이용하여 작제될 수 있다. 예를 들면, 안티센스 핵산 분자(예를 들면, 안티센스 올리고뉴클레오티드)는 천연 뉴클레오티드를 이용하여 화학적으로 합성될 수 있거나, 또는 분자의 생물학적 안정성을 증가시키거나 또는 안티센스 핵산과 센스 핵산 간에 형성된 이중가닥 구조(duplex)의 물리적 안정성을 증가시키도록 설계된 다양하게 변형된 뉴클레오티드, 예를 들면, 포스포로티오에이트 유도체 및 아크리딘 치환 뉴클레오티드가 이용될 수 있다. 대안적으로, 안티센스 핵산 분자는 핵산 분자가 안티센스 배향으로 서브클로닝된 발현 벡터를 이용하여 생물학적으로 제조될 수 있다(즉, 삽입된 핵산 분자로부터 전사된 RNA는 목적의 표적 핵산에 대해 안티센스 배향일 것이다).
핵산 서열은 전술된 바와 같은 하나 이상의 질환을 확인하기 위해 환자의 내생의 DNA 서열과 비교하기 위해 사용될 수 있고, 관련된 DNA 서열을 혼성화하고 발견하기 위해서, 또는 시료로부터 공지된 서열을 빼기 위해, 프로브로 사용될 수 있다. 핵산 서열은 또한, 유전적 지문형성(genetic fingerprinting)을 위한 프라이머를 유도하거나, DNA 면역화(immunization) 기법을 이용하여 항-폴리펩티드 항체를 생성하기 위해서 사용되고, 항-DNA 항체를 생성하거나, 면역 반응을 유도하기 위해 항원으로서 사용될 수 있다. 본 명세서에서 확인된 뉴클레오티드 서열의 부분 또는 단편 (및 상응하는 완전한 유전자 서열)은, 폴리뉴클레오티드 시약과 같은 다수의 방법으로 사용될 수 있다. 예를 들면, 이 서열들은: (i) 염색체 상의 그들의 개별적인 유전자를 맵핑하고; 따라서, 유전적 질환과 연관된 유전자 영역을 파악하며; (ii) 미량의 생물학적 시료로부터 개체를 확인하고(조직 타입핑); 및 (iii) 생물학적 시료의 법의학적 감정(forensic identificaiton)을 보조하기 위해 사용될 수 있다. 추가적으로, 본 발명의 뉴클레오티드 서열은 분석, 특성 규명, 또는 치료적 용도를 위해, 또는 상응하는 폴리펩티드가 조직 분화 동안 구성적으로(constitutionally) 발현되거나 또는 질병 상태에서 발현되는 조직에 대한 마커로서, 재조합 폴리뉴클레오티드를 확인하고 발현하기 위해 사용될 수 있다. 핵산 서열은 추가적으로, 본 명세서에 기재된 스크니링 및/또는 진단적 분석에서 시약으로서 사용될 수 있고, 또한 본 명세서에 기재된 스크리닝 및/또는 진단적 분석에서의 사용을 위한 키트(예를 들면, 시약 키트)의 성분으로서 포함될 수 있다.
진단 방법에서 유용한 키트(예를 들면, 시약 키트)는 예를 들면, 본 명세서에 기재된 바와 같은 혼성화 프로브 또는 프라이머(예를 들면, 표지된 프로브 또는 프라이머), 표지된 분자의 검출을 위한 시약, 제한 효소(예를 들면, RFLP 분석을 위해), 대립형질-특이적 올리고뉴클레오티드, 변화된, 또는 변화되지 않은(원형의) TCF7L2 폴리펩티드에 결합하는 항체, TCF7L2 핵산 또는 TCF7L2 핵산의 일부를 포함하는 핵산의 증폭을 위한 수단, 또는 TCF7L2 핵산의 핵산 서열을 분석하거나 또는 본 명세서에 기재된 바와 같은 TCF7L2 폴리펩티드의 아미노산 서열을 분석하기 위한 수단을 포함한, 본 명세서에 기재된 방법에서 유용한 성분들을 포함한다. 일 양태에서, 타입 II 당뇨병에 대한 감수성을 진단하기 위한 키트는 마커 DG10S478, SNP rs12255372, rs895340, rs1ll96205, rs7901695, rs7903146, rs12243326 및/또는 rs4506565, 또는, 타입 II 당뇨병을 갖는 개체 또는 타입 II 당뇨병에 감수성을 갖는 개체에서 보다 빈번하게 존재하는 위험상태(at-risk) 하플로타입을 포함하는 TCF7L2 핵산의 영역의 핵산 증폭을 위한 프라이머를 포함할 수 있다. 프라이머는 타입 II 당뇨병을 표시하는 SNP를 플랭킹하는 핵산의 부분을 이용하여 설계될 수 있다.
벡터 및 숙주 세포
본 발명의 또 다른 양태는 본 명세서에 기재된 핵산 분자 및 그의 상보체(또는 그의 일부)를 포함하는 핵산 작제물에 관한 것이다. 본 발명의 핵산 작제물은 본 발명의 서열이 센스 또는 안티센스 배향으로 삽입된 벡터(예를 들면, 발현 벡터)를 포함한다. 본 명세서에서 사용된, 용어, "벡터(vector)"는 그에 연결된 또 다른 핵산을 수송할 수 있는 핵산 분자를 의미한다. 일 유형의 벡터는 "플라스미드(plasmid)"이고, 이는, 추가적인 DNA 세그먼트가 라이게이션될 수 있는 환상의 이중가닥 DNA 루프(circular double-stranded DNA loop)를 의미한다. 또 다른 유형의 벡터는 추가적인 DNA 세그먼트가 바이러스 게놈으로 라이게이션될 수 있는 것인 바이러스 벡터이다. 특정한 벡터는 그들이 도입된 숙주 세포 내에서 자발적인 복제(autonomous replication)을 수행할 수 있다(예를 들면, 세균의 복제 원점을 갖는 세균 벡터 및 에피좀 포유동물 벡터(episomal mammalian vector)). 다른 벡터들(예를 들면, 비-에피좀(non-episomal) 포유동물 벡터)는 숙주 세포로 도입되면, 숙주 세포의 게놈으로 삽입되고, 그에 의해, 숙주 게놈과 함께 복제된다. 발현 벡터는 작동가능하게 연결된 유전자들의 발현을 유도할 수 있다. 일반적으로, 재조합 DNA 기법에서 이용되는 발현 벡터는 종종 플라스미드의 형태이다. 그러나, 본 발명은 동등한 기능을 수행하는 바이러스 벡터(예를 들면, 복제 결함(replication defective) 레트로바이러스, 아데노바이러스 및 아데노-관련 바이러스)와 같은, 다른 형태의 발현 벡터를 포함하도록 의도된다.
일부 양태에서, 본 발명의 재조합 발현 벡터는 숙주 세포에서 핵산 분자의 발현을 위해 적합한 형태의 본 발명의 핵산 분자를 포함한다. 이는 재조합 발현 벡터가 발현을 위해 사용될 숙주 세포에 근거하여 선택된, 발현될 핵산 서열에 작동가능하게 연결된 하나 이상의 조절 서열들을 포함한다는 것을 의미한다. 재조합 발현 벡터 내에서, "작동가능하게 연결된(operably linked 또는 operatively linked)"은 (예를 들면, 인 비트로 전사/번역 시스템 또는 벡터가 숙주 세포 내로 도입되는 경우, 숙주 세포에서) 핵산의 발현을 허용하는 방식으로 목적 뉴클레오티드 서열이 조절 서열(들)에 연결된다는 것을 의미하도록 의도된다. 용어 "조절 서열(regulatory sequence)"은 프로모터, 인핸서 및 기타 발현 제어 요소들(예를 들면, 폴리아데닐화 신호)을 포함하도록 의도된다. 그와 같은 조절 서열은 예를 들면, Goeddel, "Gene Expression Technology", Methods in Enzymology 185, Academic Press, San Diego, CA (1990)에 기재된다. 조절 서열은 다양한 유형의 숙주 세포에서 뉴클레오티드 서열의 구성적 발현을 유도하는 서열들 및 특정한 숙주 세포에서만 뉴클레오티드 서열의 발현을 유도하는 서열들(예를 들면, 조직-특이적 조절 서열)을 포함한다. 본 발명이 속하는 기술 분야의 당업자는 발현 벡터의 설계는 형질전환될 숙주 세포의 선택 및 원하는 폴리펩티드의 발현 수준과 같은 인자들에 의존적일 수 있다는 것을 이해할 것이다. 본 발명의 발현 벡터는 숙주 세포가 본 명세서에 기재된 바와 같은 핵산 서열 분자에 의해 코딩된, 융합 폴리펩티드를 포함한, 폴리펩디드를 생산하도록 하기 위해 숙주 세포로 도입될 수 있다.
본 발명의 재조합 발현 벡터는 원핵생물 세포 또는 진핵생물 세포, 예를 들면, 대장균과 같은 세균 세포, (바큘로바이러스(baculovirus) 벡터를 이용한) 곤충 세포, 효모 세포 또는 포유동물 세포에서 본 발명의 폴리펩티드의 발현을 위해 설계될 수 있다. 적합한 숙주 세포가 전술된 바와 같은 Goeddel에서 더 검토된다. 대안적으로, 재조합 발현 벡터는 인 비트로에서, 예를 들면, T7 프로모터 조절 서열 및 T7 폴리머라아제를 이용하여 전사되고 번역될 수 있다.
본 발명의 또 다른 양태는 본 발명의 재조합 발현 벡터가 도입된 숙주 세포에 관한 것이다. 용어 "숙주 세포(host cell)" 및 "재조합 숙주 세포(recombinant host cell)"는 본 명세서에서 호환적으로 사용된다. 그와 같은 용어는 특정한 숙주 세포 및 그와 같은 세포의 자손(progeny) 또는 잠재적인 자손을 의미하는 것으로 이해된다. 돌연변이 또는 환경적 영향 때문에, 후속 세대에서 일부 변형이 일어날 수 있기 때문에, 그와 같은 자손은 실제로 부모 세포와 동일하지 않을 수 있으나, 여전히, 본 명세서에서 사용된 바와 같은 그 용어의 범위 내에 포함된다.
숙주 세포는 원핵생물 세포 또는 진핵생물 세포일 수 있다. 예를 들면, 본 발명의 핵산 분자는 세균 세포(예를 들면, 대장균), 곤충 세포, 효모 또는 포유동물 세포(예를 들면, 중국 햄스터 난소 세포(CHO) 또는 COS 세포)에서 발현될 수 있다. 다른 적합한 숙주 세포가 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다.
벡터 DNA는 통상적인 형질전환 또는 형질감염 기법을 통해 원핵생물 세포 또는 진핵생물 세포로 도입될 수 있다. 본 명세서에서 사용된, 용어 "형질전환(transformation)" 및 "형질감염(transfection)"은 칼슘 포스페이트 또는 칼슘 클로라이드 공-침전(co-precipitation), DEAE-덱스트란-매개 형질감염, 리포펙션(lipofection), 또는 전기천공(electroporation)을 포함한, 외래의 핵산 분자(예를 들면, DNA)를 숙주 세포로 도입하기 위한 다양한 본 발명이 속하는 기술분야에서 인정되는 기법들을 의미하도록 의도된다. 숙주 세포를 형질전환 또는 형질감염시키기 위한 적합한 방법은 Sambrook, et al, (supra), 및 기타 실험실 매뉴얼에서 찾을 수 있다.
포유동물 세포의 안정한 형질감염의 경우, 사용되는 발현 벡터 및 형질감염기법에 따라, 소량의 세포들만이 외래의 DNA를 그들의 게놈으로 삽입시킬 수 있다는 것이 본 발명이 속하는 기술 분야에서 알려져 있다. 이와 같은 삽입체(integrant)들을 확인하고 선택하기 위해, 일반적으로 선택 마커(예를 들면, 항생제 저항성 마커)를 코딩하는 유전자가 목적 유전자와 함께 숙주 세포 내로 도입된다. 바람직한 선택 마커는 G418, 히그로마이신 및 메토트렉세이트와 같은 약물에 대한 저항성을 부여하는 유전자를 포함한다. 선택 마커를 코딩하는 핵산 분자가 본 발명의 핵산 분자와 동일한 벡터로 숙주 세포로 도입되거나, 또는 별개의 벡터로 도입될 수 있다. 도입된 핵산 분자로 안정적으로 형질감염된 세포들은 약물에 의한 선택(drug selection)에 의해 확인될 수 있다(예를 들면, 선택 마커 유전자를 내포하는 세포들은 생존하고, 다른 세포들은 사멸될 것이다).
배양된 원핵생물 숙주 세포 또는 진핵생물 숙주 세포와 같은, 본 발명의 숙주 세포는 목적 폴리펩티드를 생산(즉, 발현)하기 위해 이용될 수 있다. 따라서, 본 발명은 또한, 본 발명의 숙주 세포를 이용하여 폴리펩티드를 생산하는 방법을 제공한다. 일 양태에서, 본 발명의 방법은 폴리펩티드가 생산되도록 적합한 배지에서 본 발명의 숙주 세포(본 발명의 폴리펩티드를 코딩하는 재조합 발현 벡터가 도입된 세포)를 배양하는 단계를 포함한다. 또 다른 양태에서, 본 발명의 방법은 상기 배지 또는 숙주 세포로부터 폴리펩티드를 분리하는 단계를 더 포함한다.
본 발명의 항체
일 형태의 유전자 산물에 특이적으로 결합하나, 다른 형태의 유전자 산물에는 결합하지 않는 다중클론 항체 및/또는 단일클론 항체가 또한 제공된다. 다형성 부위 또는 부위들을 포함하는 변이체 또는 기준(referece) 유전자 산물의 일부에 결합하는 항체가 또한 제공된다. 본 명세서에서 사용된 용어 "항체(antibody)"는 면역글로불린 분자 및 면역글로불린 분자의 면역학적으로 활성인 부분, 즉, 항원을 특이적으로 결합하는 항원-결합 부위를 포함하는 분자를 의미한다. 본 발명의 폴리펩티드에 특이적으로 결합하는 분자는 자연적으로 상기 폴리펩티드를 포함하는 시료, 예를 들면, 생물학적 시료에서 상기 폴리펩티드 또는 그의 단편에 결합하나, 다른 분자에는 결합하지 않는 분자이다. 면역글로불린 분자의 면역학적 활성 부분의 예는 펩신과 같은 효소에 의해 항체를 처리하는 것에 의해 생성될 수 있는 F(ab) 및 F(ab')2 단편을 포함한다. 본 발명은 본 발명의 폴리펩티드에 결합하는 다중클론 항체 및 단일클론 항체를 제공한다. 본 명세서에서 사용된, 용어 "단일클론 항체(monoclonal antibody)" 및 "단일클론 항체 조성물"은 본 발명의 폴리펩티드의 특정한 에피토프와 면역반응할 수 있는, 단 한 종류의 항원 결합 부위만을 포함하는 항체 분자의 개체군을 의미한다. 따라서, 단일클론 항체 조성물은 통상적으로 그와 면역반응하는 본 발명의 특정한 폴리펩티드에 대한 하나의 결합 친화도(single binding affinity)를 보인다.
다중클론 항체는 원하는 면역원(immunogen), 예를 들면, 본 발명의 폴리펩티드 또는 그의 단편으로 적합한 개체를 면역화시키는 것에 의해 전술된 바와 같이 제조될 수 있다. 면역화된 개체에서 항체 역가(antibody titer)는 표준 기법, 예를 들면, 고정화된 폴리펩티드를 이용한 ELISA(enzyme linked immunosorbent assay)에 의해 시간의 경과에 따라 모니터링될 수 있다. 바람직한 경우, 폴리펩티드에 대해 유도된 항체가 포유동물(예를 들면, 혈액)로부터 분리되고, IgG 분획을 수득하기 위해, 단백질 A 크로마토그래피와 같은 공지된 기법에 의해 더 정제될 수 있다. 면역화 후 적합한 시점, 예를 들면, 항체 역가가 최대인 시점에, 항체-생산 세포들이 개체로부터 분리되고, Kohler and Milstein, Nature 256:495-497 (1975)에 최초에 기재된 바와 같은 하이브리도마(hybridoma) 기법, 인간 B 세포 하이브리도마 기법(Kozbor et al, Immunol. Today 4: 72 (1983)), EBV-하이브리도마 기법(Cole et al., Monoclonal Antibodies and Cancer Therapy, Alan R. Liss,1985, Inc., pp. 77-96) 또는 트리오마(trioma) 기법과 같은 표준 기법에 의해 단일클론 항체를 준비하기 위해 이용될 수 있다. 하이브리도마를 생산하는 기술은 잘 알려져 있다(일반적으로, Current Protocols in Immunology (1994) Coligan et al., (eds.) John Wiley & Sons, Inc., New York, NY 참조). 요약하면, 불멸의(immortal) 세포주(통상적으로 골수종)가 전술된 바와 같이 면역원에 의해 면역화된 포유동물로부터의 림프구(통상적으로, 비장세포)와 융합되고, 결과물인 하이브리도마 세포의 배양 상층액을 대상으로 본 발명의 폴리펩티드에 결합하는 단일클론 항체를 생산하는 하이브리도마를 확인하기 위해 스크리닝을 수행한다.
림프구와 불멸화된 세포주(immortalized cell line)를 융합하기 위해 사용되는 다수의 공지된 프로토콜 중 하나가 본 발명의 폴리펩티드에 대한 단일클론 항체를 생성하기 위해 적용될 수 있다(예를 들면, Current Protocols in Immunology, supra; Galfre et al., Nature 266:55052 (1977); R.H. Kenneth, in Monoclonal Antibodies: A New Dimension In Biological Analyses, Plenum Publishing Corp., New York, New York (1980); 및 Lerner, YaIe J. Biol. Med. 54:387-402 (1981) 참조). 또한, 통상적인 당업자는 유용한, 그와 같은 방법들의 다양한 변형들이 있다는 것을 이해할 것이다.
단일클론 항체-분비 하이브리도마를 제조하는 것에 대한 대안으로서, 본 발명의 폴리펩티드에 대한 단일클론 항체가, 재조합 조합형 면역글로불린 라이브러리(예를 들면, 항체 파아지 표시 라이브러리)를 폴리펩티드로 스크리닝하여 그에 의해 상기 폴리펩티드에 결합하는 면역글로불린 라이브러리 구성물을 분리하는 것에 의해 확인되고 분리될 수 있다. 파아지 표지 라이브러리를 생성하고 스크리닝하기 위한 키트는 상업적으로 이용가능하다(예를 들면, Pharmacia Recombinant Phage Antibody System, Catalog No. 27-9400-01; 및 Stratagene SurfLAP™ Phage Display Kit, Catalog No. 240612).
추가적으로, 항체 표시 라이브러리를 생성하고 스크리닝하기 위해 사용하기에 특히 적합한 방법 및 시약의 예는 예를 들면, 미국특허 제5,223,409호; PCT 공개 WO 92/18619; PCT 공개 WO 91/17271; PCT 공개 WO 92/20791; PCT 공개 WO 92/15679; PCT 공개 WO 93/01288; PCT 공개 WO 92/01047; PCT 공개 WO 92/09690; PCT 공개 WO 90/02809; Fuchs et al, Bio/Technology 9: 1370-1372 (1991); Hay et al, Hum. Antibod. Hybridomas 3:81-85 (1992); Huse et al, Science lA[beta]: 1275-1281 (1989); 및 Griffiths et al, EMBO J. 12:725-734 (1993)에서 찾을 수 있다. 추가적으로, 표준 재조합 DNA 기법을 이용하여 제조될 수 있는, 인간 및 비-인간(non-human) 부분을 포함하는, 키메라 단일클론 항체 및 인간화(humanized) 단일클론 항체와 같은 재조합 항체가 본 발명의 범위 내에 속한다. 그와 같은 키메라 단일클론 항체 및 인간화 단일클론 항체는 본 발명이 속하는 기술 분야에서 공지된 재조합 DNA 기법에 의해 생산될 수 있다.
일반적으로, 본 발명의 항체(예를 들면, 단일클론 항체)는 친화도 크로마토그래피 또는 면역침전과 같은, 표준 기법에 의해 본 발명의 폴리펩티드를 분리하기 위해 이용될 수 있다. 폴리펩티드-특이적 항체는 세포로부터 천연 폴리펩티드의 정제 및 숙주 세포에서 발현된 재조합 방법에 의해 생산된 폴리펩티드의 정제를 촉진할 수 있다. 또한, 본 발명의 폴리펩티드에 특이적인 항체가 폴리펩티드의 발현량(abundance) 및 발현 패턴을 평가하기 위해, (예를 들면, 세포 용해물, 세포 상층액, 또는 조직 시료에서) 폴리펩티드를 검출하기 위해 이용될 수 있다. 항체는 임상 테스트 절차의 일부로, 예를 들면, 주어진 치료 요법(treatment regimen)의 효능을 결정하기 위해, 조직에서 단백질 수준을 진단 목적으로 모니터링하기 위해 이용될 수 있다. 항체는 그 검출을 촉진하기 위해 검출가능한 물질과 결합될 수 있다. 검출가능한 물질의 예는 다양한 효소, 보조군(prosthetic group), 형광 물질, 발광 물질, 생물발광 물질, 및 방사성 물질을 포함한다. 적합한 효소의 예는 호스래디쉬 퍼옥시다아제(horseradish peroxidase), 알칼리 포스파타아제, 베타-갈락토시다아제, 또는 아세틸콜린에스테라아제를 포함하고; 적합한 보조군 복합체(prosthetic group complex)의 예는 스트렙타비딘/비오틴 및 아비딘/비오틴을 포함하며; 적합한 형광 물질의 예는 움벨리페론(umbelliferone), 플루오레세인(fluorescein), 플루오레세인 이소티오시아네이트, 로다민, 디클로로트리아지닐아민 플루오레세인, 단실 클로라이드(dansyl chloride), 또는 피코에리트린을 포함하고; 발광 물질의 예는 루미놀을 포함하며; 생물발광 물질의 예는 루시페라아제, 루시페린, 및 애큐오린(aequorin)을 포함하며, 적합한 방사성 물질의 예는 125I, 131I, 35S 또는 3H을 포함한다.
이하에서, 본 발명은 하기의 실시예에 의해 예시되나, 실시예들은 어떤 방식으로도 본 발명을 한정하도록 의도되지 않는다.
도 1은 HapMap project Build 16에서 SNP의 연관 불균형(LD)에 관해, TCF7L2의 목적 영역을 도시한다. 215.9 kb 유전자가 전사의 방향을 표시하는 흑색 화살표로 표시된 바와 같은 7개의 LD 블럭에 걸쳐 분포하며(NCBI RefSeq 기준); 엑손이 표시되며 엑손 4가 강조된다. DG10S478는 인트론 3의 일부, 엑손 4 전체 및 인트론 4의 일부를 포함하는 74.9kb 블럭(본 명세서에서, "TCF7L2의 엑손 4 LD 블럭"으로 지칭됨) 내에 있는, TCF7L2 유전자의 인트론 3에, 염색체 10의 114.46 Mb에 위치한다. SNP 마커들은 그들의 물리적 위치에 따라서가 아니라, 등거리로 표시되었다. 상기 도면은 lD의 두 척도, 즉, D'(도면의 좌측 상단) 및 r2 (우측 하단)을 표시한다.
10q 유전자 좌 내의 밀집된 세트의 마이크로새틀라이트 마커를 이용한 단일-지점 관련성 분석(single-point association analysis)을 통해, 전사 인자 7- 유사 2(Transcription Factor 7-Like 2 : TCF7L2, 이전의 TCF4)의 타입 II 당뇨병의 위험을 부여하는 유전자로서의 확인이 하기에서 기재된다.
방법
아이슬란드 코호트 (Icelandic cohort)
아이슬란드의 데이터 보호국(Data Protection Authority of Iceland) 및 아이슬란드의 국립 생물윤리 위워회(National Bioethics Committee of Iceland)가 본 연구를 허가했다. 본 연구의 모든 참가자들은 고지된 동의(informed consent)를 제출했다. 혈액 시료, 의료 정보, 및 계통학(genealogy)과 관련된 모든 개인 식별자는 먼저, 제3자 암호화 시스템(third-party encryption system)을 이용하여, 데이터 보호국에 의해 암호화되었다(18).
본 연구를 위해, 과거 30년간 아이슬란드 심장 협회(Icelandic Heart Association)에서 수행된 장기적인 역학 연구를 통해, 또는 과거 12년 동안 레이캬비크에 있는 두 개의 주요 종합 병원 중 하나에서 진단된 2400명의 타입 II 당뇨병 환자들을 확인하였다. 이 환자들 중 2/3는 생존했고, 이는 현재 아이슬란드에서 파악된 타입 당뇨병 환자의 개체군의 약 절반에 해당했다. 이 환자들의 대부분을 본 연구를 위해 접촉했고, 협조율은 80%를 초과했다. 본 연구의 모든 참가자들은 아이슬란드 심장 협회를 방문하여 설문지를 작성하고 혈액 시료를 제공하고, 공복 상태의 혈당치 측정(fasting glucose measurement)에 참가했다. 약물 치료 및 진단 시 연령에 관한 질문이 포함되었다. 본 연구에서 타입 II 당뇨병 환자들은 본 발명자들의 이전에 발표된 연관 연구에 기재된 바와 같이 진단되었다(10). 요약하면, 타입 II 당뇨병의 진단은 과거의 의료 기록, 투약 이력, 및/또는 새로운 실험실 측정을 통해 연구를 진행한 의사에 의해 확인되었다. 과거에 진단된 타입 II 당뇨병 환자의 경우, 경구용 혈당 저하제의 사용의 보고가 타입 II 당뇨병을 확인했다. 당시에 인슐린으로 치료 중이었던 개인들은 그들이 경구용 혈당 저하제를 사용하고 있거나 또는 과거에 사용했던 경우, 타입 II 당뇨병을 갖는 것으로 분류되었다. 이 코호트에서, 약물 치료 중인 환자들의 대부분은 경구용 혈당 저하제를 복용했고, 매우 낮은 비율(9%)만이 인슐린을 필요로 했다. 그 당시까지 진단되지 않았던 개인들의 경우, 타입 II 당뇨병 및 공복 혈당 장애(impaired fasting glucose: IFG)의 진단은 미국 당뇨병 협회(American Diabetes Association)에 의해 정의된 기준에 근거하였다(Expert Committee on the Diagnosis and Classification of Diabetes Mellitus 1997). 본 연구에서 타입 II 당뇨병 환자의 평균 연령은 69.7세였다.
재현 코호트( Replication cohort )
덴마크의 연구 그룹은 덴마크에서 PERF(Prospective Epidemiological Risk Factors) 연구로부터 선별되었다(19). 228명의 여성이 이전에 타입 II 당뇨병으로 진단되었고 및/또는 7 mM 이상의 혈당 측정치를 보였다. 대조구로서, 동일한 연구 코호트로부터 539명의 (타입 II 당뇨병에 대해) 영향받지 않은 여성들을 무작위로 선별하였다.
미국의 PENN CATH 연구는 1998년 7월부터 2003년 3월까지 펜실바니아 의과대학 병원(University of Pennsylvania Medical Center)에서 심장 도관술(cardiac catheterization)을 받은 환자들의 순차적 코호트에서 관상동맥 죽상경화증과 생화학적 및 유전적 인자의 관련성에 관한 단면조사 연구이다. 타입 II 당뇨병은 40세를 초과한 연령의 대상자에서, 126 mg/dl 이상의 공복 혈당량, 200 mg/dl 이상의 식후 2시간의 혈당량(2-hour post-prandial glucose), 경구 혈당강하제 또는 인슐린 및 경구 혈당강화제의 사용의 이력으로 정의되었다. 펜실바니아 대학 제도 검토회(University of Pennsylvania Institutional Review Board)가 본 연구의 프로토콜을 허가하고 모든 대상자들은 서면의 고지 동의서를 제출하였다. 인종은 자가-보고를 통해 결정하였다. 361건의 코카서스인 타입 II 당뇨병 케이스가 본 코호트로부터 유래되었다. 530명의 (타입 II 당뇨병 및 심근 경색에 대해) 영향받지 않은 코카서스인 대조구가 동일한 연구로부터 무작위로 선발되었다.
유전자형 분석을 위해 사용된 DNA는 GenomiPhi Amplification 키트 (Amersham)의 사용에 의해 준비된, 덴마크 및 미국의 타입 II 당뇨병 환자 및 대조구의 말초혈액으로부터 분리된 DNA의 전체-게놈 증폭의 생성물이었다.
유전형분석( Genotyping )
Tandem 반복서열 탐색(repeat finder) 소프트웨어(20)를 이용하여 새로운 서열 반복(즉, 디뉴클레오티드, 트리뉴클레오티드, 및 테트라뉴클레오티드 반복 서열)을 확인하고 94명의 대조구에서 다형성(polymorphicity)에 대해 테스트하였다. CEPH 시료 1347-02 (CEPH genomics repository)의 하부(lower) 대립형질의 염기쌍의 크기를 마이크로새틀라이트 증폭물(amplicon)의 크기로부터 삭감하여 기준으로 이용하였다. SNP 유전형분석은 직접적인 DNA 서열결정(Applied BioSystems) 또는 Centaurus 플랫폼(Nanogen)을 이용하여 수행하였다.
관련성 분석( association analysis )을 위한 통계적 방법
타입 II 당뇨병에 대한 단일 마커 관련성의 경우, 본 발명자들은 각 대립형질에 대한 양측 p-값(two-sided p-value)을 계산하기 위해 우도 비 검정(likelihood ratio test)을 이용하였다. 본 발명자들은 이용된 마이크로새틀라이트에 대한 보인자(carrier) 빈도가 아닌, 대립형질 빈도를 제시한다.
본 발명자들은 승법 모델(multiplicative model)을 가정하여, 상대적 위험(RR) 및 개체군 기여 위험(population attributable risk: PAR)을 계산했다(16, 17). CEPH Caucasian HapMap 데이터의 경우, 본 발명자들은 D'(21) 및 R2(22)의 표준 정의를 이용하여 SNP의 쌍들간 LD를 계산하였다. 특정 영역에서 LD 구조를 규명하기 위해 모든 SNP 조합들을 도시하는 경우, 본 발명자들은 좌측 상부 구석에 D'을 도시하고 우측 하부 구석에 p-값을 도시했다. 본 발명자들이 제시한 LD 플롯에서, 마커들은 그들의 물리적 위치에 따라서가 아니라, 등거리로 도시되었다.
결과
유전자 좌-전체에 걸친 관련성 연구( Locus - wide association study )
본 발명자들은 이전에 아이슬란드 인구에서 타입 II 당뇨병에 대해 염색체 5q에 대한 게놈의 유의성 있는 연관(genome-wide significant linkage)을 보고했다(10); 동일한 연구에서, 본 발명자들은 또한 10q 및 12q에 대한 연관의 암시적 증거를 보고했다. 10q 유전자 좌에 대한 후속 연구에서, 본 발명자들은 이 유전자 좌에 해당하는 10.5 Mb 영역(NCBI Build 34: ChrlO:l 14.2 - 124.7 Mb)에서 높은 밀도의 유전형 분석된(genotyped) 마이크로새틀라이트 마커들을 이용한 관련성 방식을 이용하였다. 본 발명자들은 228개의 마이크로새틀라이트 마커들을 확인하고 타입핑하였다 --즉, 46 kb 당 하나의 마커의 평균 빈도(표 1). 모든 마커들은 1185명의 아이슬란드 타입 II 당뇨병 환자 및 931명의 관련되지 않은 개체군 대조구(unrelated population control)에서 타입핑되었다.
표 1: NCBI Build 34의 인간 게놈 조립(human genome assembly)에서 염색체 10 상에 있는 228개의 유전형분석된 마이크로새틀라이트의 위치.
Figure 112008004021661-pct00003
Figure 112008004021661-pct00004
Figure 112008004021661-pct00005
Figure 112008004021661-pct00006
Figure 112008004021661-pct00007
Figure 112008004021661-pct00008
Figure 112008004021661-pct00009
마이크로새틀라이트 마커에 의한 단일 마커 관련성 분석은 DG10S478과의 관련성을 확인했다(표 2 및 도 1).
표 2. 아이슬란드에서 타입 II 당뇨병에 대한 DG10S478의 관련성
Figure 112008004021661-pct00010
6개의 대립형질들이 이 테트라-뉴클레오티드 반복서열을 갖는 것으로 관찰되었고, 대립형질 0. 8 및 12가 대조구에서 염색체의 98%를 차지했다. 대립형질 0은 합쳐진 다른 대립형질 대비 보호적 관련성(protective association)(상대적 위험(RR)= 0.67; P =2.1xlO-9)을 보였다. 이 P-값은 양측값(two-sided)이었고, 일부 환자들은 상호 간에 관련성이 있다는 것을 고려하였다. DG10S478은 10q25.2 상에 있는 전사 인자 7-유사 2(TCF7L2 - 이전의 TCF4) 유전자의 인트론 3에 위치한다. 이 마커는 인트론 3의 일부, 엑손 4의 전체, 및 인트론 4의 일부를 내포하는 (CEPH Caucasian HapMap Phase II 기준) 74.9kb의 명확하게 정의된 LD 블럭 내에 존재한 다(도 1).
DG10S478이 CEPH Caucasian HapMap 패밀리에서 유전형분석된 경우, SNP rs12255372의 대립형질 G가 DG10S478의 대립형질 0과 거의 완전하게 상관되고(r2 = 0.95, P = 5.53xlO-38), rs12255372의 대립형질 T가 DG10S478의 다른 대립형질들과 상관되는 것으로 관찰되는 것이 확인되었다. 또한, DG10S478의 대립형질 8 및 12에 의해 부여되는 위험은 상이하지 않았다(P = 0.3). 따라서, DG10S478의 0이 아닌 모든 대립형질들이 대립형질 X로 지칭될 복합 대립형질(composite allele)로 정리되는 것은 당연하다. 대립형질 X는 대조구 및 환자에서 각각 27.6% 및 36.4%의 빈도를 가졌다. 승법 모델을 가정하면(16, 17), 비-보인자(non-carrier)에 대한 위험 대비, 대립형질 X는 존재하는 카피 당 1.50의 추정된 RR을 갖는다.
타입 II 당뇨병에 대한 DG10S478 관련성의 재현
타입 II 당뇨병에 대한 DG10S478의 관련성을 검증하기 위해, 228명의 환자(case) 및 539명의 대조구의 덴마크 타입 II 당뇨병 코호트에서 마이크로새틀라이트들을 대상으로 유전형분석을 수행하였다. 덴마크 코호트는 덴마크의 PERF(Prospective Epidemiological Risk Factors) 연구로부터 선별하였다(19). 이 여성 타입 II 당뇨병 코호트는 이전에 타입 II 당뇨병으로 진단되었었다. 아이슬란드에서 관찰된 관련성이 재현되었다(표 3).
표 3: 덴마크에서 타입 II 당뇨병에 대한 DG10S478 관련성
Figure 112008004021661-pct00011
복합 위험 대립형질(composite at-risk allele) X는 대조구에서 26.0% 및 타입 II 당뇨병 케이스에서 33.1%의 빈도를 가져서, 1.41의 추정 RR을 산출했다(P = 0.0048).
뒤이어, 마이크로새틀라이트를 PENN CATH 연구로부터의 361건의 케이스 및 530명의 대조구로 구성된 US 코카서스인 타입 II 당뇨병 코호트에 대해 유전형분석을 수행하였다. 이 연구는 펜실바니아 의과대학 병원에서 심장 도관술을 받은 환자들의 순차적 코호트에서 관상동맥 죽상경화증과 생화학적 및 유전적 인자의 관련성에 관한 단면조사 연구이다. 타입 II 당뇨병은 40세를 초과한 연령의 대상자에서, 126 mg/dl 이상의 공복 혈당량, 200 mg/dl 이상의 식후 2시간의 혈당량, 경구 혈당강하제 또는 인슐린 및 경구 혈당강화제의 사용의 이력으로 정의되었다. 아이슬란드에서 관찰된 관련성이 이 개체군에서도 재현되었다(표 4).
표 4: 미국에서 타입 II 당뇨병에 대한 DG10S478 관련성
Figure 112008004021661-pct00012
복합 위험 대립형질 X는 대조구에서 25.3% 및 타입 II 당뇨병 케이스에서 38.5%의 빈도를 가져서, 1.85의 추정 RR을 산출했다(P = 3.3xlO-9). Mantel-Haneszel 모델(NOTE 3)을 이용하여 3개의 코호트로부터의 결과들을 종합하여 4.7x10-18의 전체 양측 P값(overall two- sided P)을 산출하였다.
3개의 개체군에서 타입 II 당뇨병에 대한 복합 위험 대립형질의 관련성은 TCF7L2 유전자의 변이체가 타입 II 당뇨병의 위험에 기여한다는 강력한 증거가 된다.
대립형질 X의 타입 II 당뇨병과의 관련성을 명확하게 확립한 후, 본 발명자들은 유전 양식을 보다 상세하게 조사하였다. 이형접합형 보인자들이 명확하게 비-보인자 대비 증가된 위험을 가졌고(P < 1 x 10-6) 동형접합형 보인자 대비 감소된 위험을 가졌기 때문에(P < 0.0001), 우성 모델(dominant model) 및 열성 모델(recessive model)은 기각될 수 있었다. 승법 모델이 보다 우수한 적합성(fit)을 제공하나, 이형접합형 보인자 대비 동형접합형 보인자의 위험이 비-보인자 대비 이형접합형 보인자의 위험보다 더 크다는 증거가 있다. 표 5는 비-보인자 대비 이형접합형 보인자 및 동형접합형 보인자의 상대적 위험의 모델-배제 추정값(model-free estimate)을 제공한다.
표 5: 상대적 위험의 모델-배제 추정값
Figure 112008004021661-pct00013
세 개의 코호트는 위험상태 대립형질에 대해 유사한 개체군 빈도를 가졌으나, RR 추정값은 상이했다; 가장 강력한 효과는 미국 코호트에서 관찰되고, 가장 약한 효과는 덴마크 코호트에서 관찰되었다. 코호트에서 RR이 일치해야 하는 이유는 없으나, 추정된 상대적 위험의 차이는 통계적 유의성에 도달하지 않는다(P > 0.05)는 점이 주목되었다. 공통된 상대적 위험을 가정하여, 코호트로부터의 결과들을 종합하면, 이형접합형 보인자 및 동형접합형 보인자는 비-보인자 대비 각각 1.45 및 2.41의 상대적 위험을 갖는 것으로 추정되었다(표 5). 위험상태 대립형질에 대해 26%의 개체군 빈도를 가정하는 경우, 이형접합형 보인자 및 동형접합형 보인자는 각각 개체군의 38% 및 7%를 차지한다. 따라서, 이 변이체는 임상적으로 이용하기에 충분한 예측적 가치(predictive value)를 갖는다. 상응하는 개체군 기여 위험은 21%이고, 이는 공중 보건의 관점에서 볼 때 상당한 것이다.
또한, 공복 혈당 장애(IFG)를 갖는 개체들(6.1 내지 6.9 mM의 공복 혈당량)에서 대립형질 X가 과량으로 존재한다는 것에 주목해야 한다. 복합 위험상태 대립형질 X는 1393명의 대조구에서 27.7%의 빈도 및 278명의 IFG에서 37.1%의 빈도를 가져서, 1.54의 추정된 RR을 산출했다(P = 1.36 x 10-5).
TCF7L2 의 엑손 4 LD 블럭 내의 SNP 마커들과 타입 II 당뇨병의 관련성
표 6에서, 본 발명자들은 TCF7L2의 엑손 4 LD 블럭 내에 존재하는 마이크로새틀라이트 및 SNP 마커들을 열거한다. 표 6은 전체 LD 블럭 영역의 서열결정에 의해 발견된 SNP 뿐 아니라, 공개적으로 입수가능한 SNP를 포함한다. 표 6은 또한 상기 블럭 내에 존재하는 다형성 마이크로새틀라이트 마커를 제공한다.
표 6. TCF7L2의 엑손 4 LD 블럭 내에 존재하는 다형성 마커(Build 34 좌표(co-ordinate)상 위치, 마커 rs4074720 및 rs7087006 사이: rs4074720(B34: 114413084) - rs7087006(B34: 114488013) = 74929bp). 서열 확인 기준은 적합한 경우, 서열 목록에 개시된, 다형성을 포함하는 앰플리머(amplimer), 및 전방향 프라이머 및 역방향 프라이머에 대한 서열번호를 참조하여 표시된다.
A. 공개 SNP(모든 HapMap 인종 포함)
Figure 112008004021661-pct00014
Figure 112008004021661-pct00015
Figure 112008004021661-pct00016
B. TCF7L2의 엑손 4 LD 블럭에서 발견되고 뒤이어 검증된 신규한 SNP(하기의 앰플리머(amplimer)):
Figure 112008004021661-pct00017
C. TCF7L2의 엑손 4 LD 블럭 내의 다형성 마이크로새틀라이트(하기의 앰플리머(amplimer)):
Figure 112008004021661-pct00018
표 7. TCF7L2의 엑손 4 LD 블럭 내의 선택된 마커에 대한 앰플리머 및 프라이머
Figure 112008004021661-pct00019
Figure 112008004021661-pct00020
Figure 112008004021661-pct00021
Figure 112008004021661-pct00022
Figure 112008004021661-pct00023
Figure 112008004021661-pct00024
Figure 112008004021661-pct00025
TCF7L2의 엑손 4 LD 블럭 내의 다른 마커 대립형질들이 대립형질 X보다 타입 II 당뇨병과 보다 높은 상관관계를 보일 가능성을 더 조사하기 위해, 본 발명자들은 HapMap CEU 시료에서 생성된 DG10S478 유전형 데이터를 이용하였다. DG10S478과 가장 강력한 상관관계를 갖는, HapMap Phase I로부터의 5개의 SNP는 내림차순으로 rs12255372 (r2 = 0.95), rs7903146 (r2 = 0.78), rs7901695 (r2 = 0.61), rs11196205 (r2 = 0.43), 및 rs7895340 (r2 = 0.42)이었다. 본 발명자들은 3개의 코호트에서 이 5개의 SNP의 유전형을 분석하였고, 5개의 SNP와 DG10S478 간에, 후자를 이대립형질성(biallelic) 마커로 다룬 상관관계는 CEU 시료에서 관찰된 것과 매우 유사했다. 5개의 SNP는 모두 타입 II 당뇨병에 대한 관련성을 보였다. 일부 SNP는 코호트들 중 하나 또는 두 개에서 약간 더 높은 추정 상대적 위험 및 보다 낮은 p-값을 보였으나, Mantel-Haenszel 모델을 이용하여, 3 개의 코호트에 대한 결과를 종합한 경우, 타입 II 당뇨병에 대해, DG10S478보다 더 강한 관련성을 보이는 것은 없었다. 그러나, rs11196205 및 rs7895340은 대립형질 X에 비해, 타입 II 당뇨병에 대해 보다 명백하게 더 약한 관련성을 가지나(RR = 1.56, P = 4.7xlO-18), rs12255372의 대립형질 T(RR = 1.52, P = 2.5xlO-16) 및 rs7903146의 대립형질 T(RR = 1.54, P = 2.1xlO-17)의 경우, 타입 II 당뇨병에 대한 관련성의 강도는 유사했다.
2005년 10월에 HapMap Phase II의 후속 발표 후에, 마이크로새틀라이트 DG10S478에 대한 강한 상관관계를 보이는 두 개의 추가적인 SNP가 확인되었다- rs12243326 (r2=0.961) 및 rs4506565 (r2= 0.716). 타입 II 당뇨병에 대한 감수성과 연관된 대립형질은 rs12243326 (C/T SNP)의 경우 C이고 rs4506565 (A/T SNP)의 경우 T 일 것이다.
rs7903146의 C 대립형질을 갖는 하플로타입들 중에서, rs10885406의 A 대립형질을 갖는 하플로타입들은 rs10885406의 G 대립형질을 갖는 하플로타입들에 비해 1.06의 추정된 상대적 위험을 가지나, 그 차이는 통계적으로 유의성이 없다는 것에 유의해야 한다(P = 0.22).
타입 II 당뇨병과의 이 관련성을 재현하고 정립하기 위한 시도에서, 본 발명자들은 1111명의 케이스 및 2315명의 대조구로 구성된 큰, 추가적인 덴마크 코호트 및 아프리카 미국 당뇨병 연구(Africa America Diabetes Mellitus study)로부터 유래된 618명의 케이스 및 434명의 대조구로 구성된, 유전적으로 보다 다양한 서아프리카 코호트에서, 본 발명자들은 DG10S478, rs12255372 및 rs7903146의 유전형을 분석하였다(23). 아이슬란드에서 이전에 관찰된 바와 같이, 덴마크인들에서, 3개의 변이체는 모두 질병 위험과 강하게 관련되었다. 그러나, rs7903146의 대립형질 T의 관련성(상대적 위험 = 1.53, P = 4.06xl0-14, PAR = 24.4%)은 나머지 두 개의 변이체에 의해 제공되는 것보다 두드러지게 더 강했다. 서아프리카 연구 그룹에서, 관계성(relatedness) 및 인종적 기원에 대한 조정 후에, 본 발명자들은 rs7903146의 대립형질 T의 타입 II 당뇨병에 대한 관련성(상대적 위험 = 1.45, 95% C.I. =1.20-1.76,( P = 0.000146, PAR = 22.2%)을 재현했으나, 다른 두 개의 변이체의 경우에는 재현하지 못했다. 이는 rs7903146의 대립형질 T가 위험 변이체 그 자체이거나 또는 확인되지 않은 위험 변이체의 가장 근접한 공지된 상관체(correlate)라는 것을 시사한다. rs7903146의 대립형질 T가 DG10S478의 대립형질 X 및 rs12255372의 대립형질 T 모두를 갖는 염색체상에서만 거의 배타적으로 나타나는 유럽 기원의 개체군과 달리, 서아프리카인들에서는, rs7903146의 대립형질 T가 DG10S478 및 rs12255372의 두 대립형질과 함께 나타나기 때문에, 서아프리카 그룹에서 마커 DG10S478 및 rs12255372의 위험상태 마커(at-risk marker)로서의 배제가 가능했다. 이는 T가 rs7903146의 원형적 대립형질(ancestral allele)이라는 관찰과 일치하며, DG10S478의 대립형질 X 및 rs12255372의 대립형질 T는 모두 침팬지 기준 서열과 상이하다. 보다 일반적으로, 이 발견은 또한 서아프리카의 개체군과 같은 상대적으로 다양한 개체군은 보다 균질적인 개체군에서 강한 연관 불균형의 영역에서 검출된 관련성 신호를 정립하는 수단을 제공한다는 기대와도 일치한다.
검토
본 연구에서, 본 발명자들은 10q25.2 상에 전사 인자 7-유사 2(TCF7L2 - 이전의 TCF4)를 코딩하는, 이전에 보고된 10q 연관 영역(10) 내에서 타입 II 당뇨병에 대한 신규한 후보 유전자의 확인을 기재한다. 본 발명자들은 상기 유전자가 유사한 빈도 및 상대적 위험으로 아이슬란드, 덴마크 및 미국에서 타입 II 당뇨병의 위험을 부여한다는 것을 보여준다. 변이체는 타입 II 당뇨병의 가족성 클러스터링(familial clustering)의 실질적인 분획을 설명하지 않으나, 20% 이상의 개체군 기여 위험은 공중보건의 관점에서 유의성이 있다. 비-보인자 대비, 위험상태 복합 대립형질의 이형접합형 보인자(개체군의 약 38%) 및 동형접합형 보인자(개체군의 약 7%)의 상대적 위험은 각각 1.45 및 2.41이었다. 따라서, 이 변이체는 임상적으로 이용하기에 충분한 예측적 가치를 갖는다.
본 발명자들은 TCF7L2 유전자의 3번째 인트론 내에 있는 변이체를 타입 II 당뇨병-관련된 마이크로새틀라이트, DG10S478로서 보고한다. TCF7L2 유전자 산물은 Wnt 신호전달 경로에서 역할을 수행하는 HMG(High Mobility Group) 박스-함유 전사 인자이다. 이 경로는 세포의 핵심적인 발달 및 성장 조절 메카니즘의 하나로 간주된다; 이는 Frizzled 패밀리의 구성물과 LDL 수용체 패밀리의 구성물, Lrp5/6으로 구성된, 동종의 수용체 복합체(cognate receptor complex)에 결합시, 표적 세포 내에서 다수의 신호전달 캐스캐이드를 개시하는, Wnt로 알려진, 분비된 당단백질(glycoprotein)에 의해 매개된다(24). Wnt 신호전달은 이 경로에서 중심적인 성분인 β-카테닌을 분해 복합체로부터 분리시키고 이를 핵으로 전위시키며, 핵에서 β-카테닌은 TCF 인자들을 억제자로부터 전사 활성자로 전환시킨다(25). β-카테닌 단백질은 또한 카데린의 결합을 통해 세포 부착(cell adhesion)을 매개하기 위해 중요하다(15).
TCF7L2에 대한 NCBI RefSeq는 14개의 엑손을 포함한다. 그러나, Duval et al.(26)은 TCF7L2는 17개의 엑손을 가지며, 그 중 5개는 대안적이라는 것을 보여주었고; 또한, 3개의 대안적인 스플라이스 수용체 부위(alternative splice acceptor site)가 사용되는 것으로 보고되었다. 본 연구는 또한, TCF7L2 유전자의 3' 말단에 위치한 3개의 연속적인 엑손의 대안적인 사용은 마지막 엑손에서 사용되는 판독 프레임을 변화시켜, 짧거나, 중간 길이이거나, 또는 긴 COOH-말단 단부를 갖는 다수의 TCF7L2 이소폼(isoform)의 합성을 가져온다는 것을 보여주었다.
TCF7L2와 유사하게, 타입 II 당뇨병의 드문 멘델형(Mendelian form), 즉, MODY(Maturity-Onset Disease of the Young)에 대한 6개의 포지션 클로닝된(postionally cloned) 유전자 중 5개는 전사 인자이다(27). PPARγ(Peroxisome Proliferator-Activated Receptor gamma)(7) 및 포크헤드 유전자 패밀리(forkhead gene family)(28, 29)를 포함한, 추가적인 전사 인자들은 타입 II 당뇨병의 발병에 관여되었다. Noble 등은 타입 1 당뇨병에서 관련된 TCF7 유전자의 미스센스 돌연변이(missense mutation)(C883A)을 개시했다(30). 그러나, 당뇨병의 발병에 있어서, TCF7 및 TCF7L2가 동일한 경로에서 작동하는지 여부는 명확하지 않다.
TCF7L2 유전자에서 (A)9 코딩 반복서열(coding repeat)(exon 17)(26, 31-33)에서의 A의 결실 및 직장결장 세포주(26)에서의 다수의 돌연변이를 포함한 돌연변이들이 기재된다. DG10S478은 엑손 4 및 상기 엑손의 5' 및 3' 플랭킹 인트론 서열을 포함하는 명확하게 정의된 74.9kb LD 블럭(CEPH Caucasian HapMap Phase II) 내에 존재한다. DG10S478가 원인적 변이체(causative variant) 그 자체인 것이 가능하고; 또한 DG10S478는 전사, 스플라이싱, 또는 메시지 안정성에 영향을 미치는 근원적인 변이체(underlying variant)에 대한 대용물(surrogate)인 것이 가능하다. 그와 같은 변이체는 DG10S478와 강한 LD인 것으로 보이며, 즉, 상기 변이체는 TCF7L2의 엑손 4 LD 블럭 내에 존재한다.
여러 계통의 증거가 타입 II 당뇨병의 발병에서 이 유전자의 장내분비(enteroendocrine) 역할을 시사한다. 먼저, TCF7L2는 직결장암(35)의 발달에 관여되었으며, 발암성 TCF/β-카테인 단백질 복합체의 소형-분자 길항제가 이미 개시되었다(35). 또한, 탄생 후 24시간 이내에 사망하는 TCF7L2 -/-마우스는 장 상피 줄기-세포 구획이 결핍된다(36). TCF7L2 유전자의 변이체는 장내세포에서의 발현이 TCF7L2에 의해 전사적으로 조절되는 것인 프로글루카곤 유전자에 의해 코딩된 펩티드 중 하나인, 인슐린자극성(insulinotropic) 호르몬 글루카곤-유사 펩티드 1(GLP-1)의 수준을 변화시키는 것에 의해 타입 II 당뇨병에 대한 감수성에 영향을 미칠 수 있다. 인슐린과 협력하여, GLP-1은 혈당량 항상성에 대해 결정적인 효과를 미친다(12). GLP-1 유사체 및 디펩티딜 펩티다아제 IV의 억제제가 현재 임상적 개발 중에 있다.
본 발명은 그의 바람직한 구체예를 참조하여 구체적으로 도시되고 설명되었고, 본 발명이 속하는 기술 분야의 당업자는 형식 및 세부사항의 다양한 변화들이 첨부된 청구항에 의해 포괄되는 본 발명의 범위로부터 벗어나지 않으면서 이루어질 수 있다는 것을 이해할 것이다.
참고문헌
1. A. F. Amos, D. J. McCarty, P. Zimmet, Diabet Med 14 Suppl 5, Sl (1997).
2. P. Zimmet et al., Am J Epidemiol 118, 673 (Nov, 1983).
3. W. C. Knowler, D. J. Pettitt, M. F. Saad, P. H. Bennett, Diabetes Metab Rev 6, 1 (Feb, 1990).
4. B. Newman et al., Diabetologia 30, 763 (Oct, 1987).
5. A. H. Barnett, C. Eff, R.D. Leslie, D. A. Pyke, Diabetologia 20, 87 (Feb, 1981).
6. A. L. Gloyn, Ageing Res Rev 2, 111 (Apr, 2003).
7. D. Altshuler et al., Nat Genet 26, 76 (Sep, 2000).
8. A. L. Gloyn et al., Diabetes 52, 568 (Feb, 2003).
9. Y. Horikawa et al , Nat Genet 26, 163 (Oct, 2000).
10. I. Reynisdottir et al., Am J Hum Genet 73, 323 (Aug, 2003).
11. R. Duggirala et al., ,4m J Ham Genet 64, 1127 (Apr, 1999).
12. F. Yi, P. L. Brubaker, T. Jin, J Biol Chem 280, 1457 (Jan 14, 2005).
13. S. E. Ross et al, Science 289, 950 (Aug 11, 2000).
14. E. A. Jansson et al. , Proc Natl Acad Sd USA 102, 1460 (Feb 1 , 2005).
15. W. J. Nelson, R. Nusse, Science 303, 1483 (Mar 5, 2004).
16. C T. FaIk, P. Rubinstein, Ann Hum Genet 51 (Pt 3), 227 (Jul, 1987).
17. J. D. Terwilliger, J. Ott, Hum Hered 42, 337 (1992).
18. J. R. Gulcher, K. Kristjansson, H. Gudbjartsson, K. Stefansson, Eur J Hum Genet 8, 739 (Oct, 2000).
19. Y. Z. R. Bagger, B. J.; Alexandersen, P.; Tanko, L. B.; Christiansen, C, J Bone Miner Res Suppl 1, 1 (2001).
20. G. Benson, Nucleic Acids Res 27, 573 (Jan 15, 1999).
21. R. C. Lewontin, Genetics 50, 757 (Oct, 1964).
22. W. G. Hill, A. Robertson, Genetics 60, 615 (Nov, 1968).
23. C. N. Rotimi et al., Ann Epidemiol 11, 51 (Jan, 2001).
24. C. Prunier, B. A. Hocevar, P. H. Howe, Growth Factors 22, 141 (Sep, 2004).
25. J. Huelsken, W. Birchmeier, Curr Opin Genet Dev 11, 547 (Oct, 2001).
26. A. Duval et al. , Cancer Res 60, 3872 (JuI 15 , 2000).
27. S. S. Fajans, G. I. Bell, K. S. Polonsky, N Engl J Med 345, 971 (Sep 27, 2001).
28. C. Wolfrum, E. Asilmaz, E. Luca, J. M. Friedman, M. Stoffel, Nature 432, 1027 (Dec 23, 2004).
29. J. Nakae et al. , Nat Genet 32, 245 (Oct, 2002).
30. J. A. Noble et al. , Diabetes 52, 1579 (Jun, 2003).
31. A. Duval et al. , Cancer Res 59, 4213 (Sep 1 , 1999).
32. A. Duval et al, Oncogene 18, 6806 (Nov 18, 1999).
33. H. R. Chang et al. , Cancer Lett (May 16, 2005) .
34. N. A. Wong, M. Pignatelli, Am J Pathol 160, 389 (Feb, 2002).
35. M. Lepourcelet et al, Cancer Cell 5, 91 (Jan, 2004).
36. V. Korinek et al, Nat Genet 19, 379 (Aug, 1998).
SEQUENCE LISTING <110> DECODE GENETICS EHF. GRANT, Struan F. A. <120> GENETIC VARIANTS IN THE TCF7L2 GENE AS DIAGNOSTIC MARKERS FOR RISK OF TYPE 2 DIABETES MELLITUS <130> 2069-PC <150> US 60/692,174 <151> 2005-06-20 <150> US 60/757,155 <151> 2006-01-06 <160> 53 <170> PatentIn version 3.3 <210> 1 <211> 74930 <212> DNA <213> Homo sapiens <400> 1 cttgtgtagg aactcacgct ttgtttattc agcaatcatt cctccagaaa taaccttaat 60 agcaacaaga aaaaagaata ggtgtttttt gagctctatc tgccagtttc tctatatatg 120 gacattatat attgcaacat aacactcaca atgcctttaa acatcatccc cgttatacag 180 ataagaaaac agaatttcaa agaaggtagg ggacttgccc agggatacat agctagcaag 240 tggcagcgct ggattgagtc tgggccttgt ctgaggctcg ggtcctgtca tgctctgcgg 300 ttgctatgtt gacatgcaaa gggagaggca gctgctggga gtctaggtgg gtttctcttt 360 gagaatgcta acgtgaaccc tcaaggtgaa tcagaatcct tttgcaagtg aataatcaga 420 tgtaggttcc tgtgtctccc tgtaaaatga aagcctcttt tttccaaggt ccagtataga 480 cctgaagctg ggttactctg gaatttccct ctctggctgg agtgactgag gccttgcacg 540 tgacattggt gaggactcgc agcctcaggt ctggcttccc ttagcaaccc ccctttcctg 600 tctctgcctc tggagttcac cattaaaaaa aaaaaaagaa aaaaagccaa aacactttat 660 aaagttacat gctgggtttc ttctatgtcc tagaaactgt cttaattcat cttccccttt 720 actcttatat gagcaggaag aaaaaaaaat tgctagtcaa tgctaataat tatggcatgt 780 aatgtaattg gaagtgtttc actgacatgc tcatgagagt ttgcggcttc atcttcaggc 840 tgggatgtag cactagactt gccttgagtg tctgcacaag cctttgatgc aggtagacca 900 tattataaat aggcgcgttg ctatggtgag gatggcagtc cttgcttgct gtgggtaacc 960 ttttctacct tctcggacac tgttttaaaa cacagcagcg tgatagcatt tcatttaatt 1020 tggaccaagg tggggtagat gaaatgttga gatttagatc taaaatgttg ttgtggtgtt 1080 tcagggggtt ctggctcacc tagtactatg gaagattttg cagattgggc ttcctcatga 1140 tttatttaga aatagatttt ctaatagatg gggtgagggg agggtggtgg gcagaaggct 1200 gggctttctt ctcttccccc tcctcctttc attgagcgct tctgcgaatg tgttggcttt 1260 gatgccccag gagctcatac agtgaaatgg aagttcaggt tggcacgttg cagaaatgat 1320 tattcctggt agtacgtttc ccattactgt taataatata aagacaattg cctgcctctc 1380 aggactcctg cacgtggcta cagtcatttc ttcatggaat tagacacata gcagtgggga 1440 ccaggagtgt tttattagtg attgtcctcc tgcaagtttc cagggtatct cagcttagac 1500 acatgaatta ttttttcctg ttgcttggag ggtatacttt taattatatt cattcaataa 1560 cagagcagtt caggtttgta aaatattttt tctcccccaa ccttttcccc agcatacatc 1620 cccgtcccgt aagtttctgg gcagagacaa tctcaggaac ctaaaggttg ctaaaaaatt 1680 agctagttgg ccaggcgcat gactcatgcc agtaatccca gcactttggg aggctgaggt 1740 gggtggatcg cttgagccca gaaattcgag accagcctag acaacatggc aaaaccctgt 1800 ctctacaaac aaaacaaaat ctagctgggc atggtggtgc atgcctgtag tcccagctac 1860 tggggaggct gaggtgggcg ggcgattgag ctcaggaggt ccaggctgca gtgagccgtg 1920 attgtgccac tgcactgcag cctggatgac tgagtgggac cctgtctcaa taataaataa 1980 ataaataaat aaaaaataaa aaaaattagc tagccaagct gcttataggt cttttacatg 2040 gccaagccac tttctcacct ttaaaatggt aataacgttt ccgtactcat ctcaatgggt 2100 tttgagtgcc aagacagacc gtttgatgga agccctctgg ggagaaaaat gctacccaag 2160 acaggctttt caattggaga ctgatccatt ggtgttttgg tcagttggtg ttgaaatccc 2220 tatttttcca gctcaggact gcctctctcc ctggaactct tcccgaggtg agttctgcag 2280 ccttccttgg gaactctcag cctctggatc ccttcttgcc aggtggagtg gacatgccaa 2340 agttgtgggc cagactcgga ctgcctggct tgtctcagca cctttgggga cccacttccc 2400 ctctctggga actggggaag ctaacagaga tcttgctagg ggggtggaat cctgtatcca 2460 tgtgaggttg tacccccagg ctcctgagtg gtttgaaagt ggggaaccct ggccgggcgc 2520 ggtggctcat gcctataatc ccagcacttt gggaggctga ggcgggcgga tcacaaggtc 2580 aggagatcga aaccatcctg gctaacacga tgaaaccccg tctctatgtg cgtggtggct 2640 ggcacctgta gtcccagctg ctcgggagtc tgaggcagga gaatggcgtg aacccgggag 2700 gcggagcttg cagtgagccg agatcgcccc actgcactcc agcctgggcg acagagcgag 2760 actccatctc aaaaaaaaaa agaaagaaaa aaaaagaaag tggggaaccc ctcccccagg 2820 atgagaagag ccatggggtg agtctctgcc accgccaagg ggagtcaggc tcagaggctg 2880 ctacagggac agccagctct ctttagatgg tccccaccat ctagtcaggg cttgttacat 2940 atggagcaga gacagcgcag gctgctgctg ttttcctgga gaaggcccct gtcggtctgt 3000 tcagctgtag ctgacctttc ctccttgtgc tttttgggga gggagccttg gaaggagtag 3060 ggcacgtggg gcactctgct tcccggcccc acactggcga acctatggat tctgcctctg 3120 attcctgagg aaacatcact gtgaaggtgg aatgagccac atacagaggt ggctgttggg 3180 gccggggagg ggtgaaacgc ccccagggtg tacattgcac caaaagccag gctgcatata 3240 gacctcagga tgggctggct tttctattta tttagaagta tttccagagg gtaacctcat 3300 tggctacaaa gcatgtctga acaagagctc cgttgttcat tcccagccct gttaccctgg 3360 caggatgcag actccaggcg gcctgttggt caggccttgg actcagagag cagtgaagcc 3420 tgaggagggg tggggggcag aggcgtgagt ggtctagggc ctcagtccct ccaggacacc 3480 ccttgccaag cgcagagaaa gctctgccca tccgtcccct caggcagtgg gattgggcaa 3540 cctgggaagc agtgaatgtg cgtcggtagc atagattcca ttccgcacgc caccctcgcc 3600 tccgcccccc agccctggga gggatgcatg ccctccggga gacacccaga cccgacagag 3660 aggcctttgt tggagctgga ggtgagaatc tgtgggcgtt gggattcctg ggttcgagtt 3720 ccagctcact gccaattgcc cgagtgctgg gcgaacattt ctggaatcaa aaggagtgca 3780 gcctgcccag cagggcctac gggagccgga ggctgcaggg tgctaagatt gcgttatctt 3840 taccaagtgc ccggagctcc tgggagggaa gagagagtcc taggactcag gataggaggt 3900 ggttggagtt tctcgaggaa gactccatgc tttggttctg gcccctggaa acccctcctg 3960 aggactggac ctccaagcag accccctctg tgactccgga atgcagtgtt actctcttat 4020 atttttcttt cttttttttt ttttgagacg gagtctcact ctgtcaccca ggctggagtg 4080 cagtggcacg atctcggctc actgcaacct ccgccctccg agttcaagcg attctcctgc 4140 ctcagcctcc caagtagctg ggattacagg tgcctgacac cgcgcctggc taattttttg 4200 tatttttagt agagatgggg ttttaccatc ttggccaggc tggtcttgaa ctcctgacct 4260 cataatccac ccgcctcggc ctccgaaagt gctgggatca caggcgtgag ccaccgcacc 4320 cggccactgt cttgtatttc taacgtcccc ctgacttttc tgatcatgta attcttaact 4380 ttctcaaaac tgagatttgt cacgtgtcct ctccccactc cattttgtga atcagagtct 4440 tccaggggca ggacctggag aatgggtctt tattaacaca catgtgaaaa tgcttttgcc 4500 agcaaggcgc ggtggctcat gcatgtaatc ccggcacttt gggaggccga ggcaggcgga 4560 tcacttgagg tcagcctggc caacatggta aaaccctgtc tctactaaaa atacaaaaat 4620 tagctgggtg tggtcgtggg cacctgtagt cccacctact cgagaggctg aggcatgaga 4680 atcactggaa cccaggaggt agaagttgca gtgagccgag atcacaccac tggactccag 4740 cttgggtgat agagtgagac tctgtctcaa aaaaagaaaa aaaaaagaaa atgcttttgc 4800 catgggctgt ctcctgcttc tgctttgcat tgggcctctg tacctaggtt gcaagattcc 4860 tcagggtgca cctgggctta tcgttatctg taagttatcc cagcaagcac ttaaaacaca 4920 gtgttggacg atgaatcccc tctacaagag agggacaggg caaaaacgac acctcttgcc 4980 tcgcaagctg tcttgggcca aacctcaggt ctattctttc ttttttttga aagtagtggc 5040 tgggcacggt ggcttacgcc tgtaatccta gcactttggg aggccaaggc gggcggatct 5100 tgaggtcagg agttcgagac cagcttggcc aacatggtaa aactccatct ctactaaaaa 5160 tacaaaaatt agctgggcgt ggtggcgcat gcctgtagac ccagctactc aggaggctga 5220 ggcaggagaa tcacttgaac ctgagaggca gaggttgcag ttagctgaga ccatgccatt 5280 gcactccagc ctgggcggca gagcgagact ctgtctcaaa aaaaaaaaaa aagaaagtag 5340 cagctctact gagatattta gaaaccataa aatccaccta tttgaggtgt acaattgagt 5400 gattttctgt atagtcacag atctgtgcag tcatccacac cctctaactc caggacattt 5460 tcctcacccc cgaggagaaa cctcccttac ccattagcag tcactcctca tttcctctcc 5520 ccccagcccc tggcaatcac tgtggatttg cctgttcttg acatttcata taaatggtat 5580 cataaaatct atgggctttt gtgtctgtct gctttcactt agcatacggt tctcaaggtt 5640 catccagtat tgtagcatct atcagtatgt cattcctttt tatggccaaa taatatttta 5700 ttgtatggat agacattttg tttattcatt tatctgtttt tggttattat gagtaacact 5760 actatgaaca ttttgcacaa atttttgtat tgacatgttt tcatttctcc tgggtatagt 5820 cctatgagtg gaattgctgg gtcatataat aaataactgt ttaacatttt ggggagctgc 5880 caaactttta aaaccttggg ttctgtgatg taccagttgt gttaggcagc acagcaaaat 5940 gtgacttttg attgccagaa acaatattta aaaagtggtt ataaaaagtg gtttgggagg 6000 ctgaggcagg aggatcactt gagcccagga gtttgagacc agcctgggca acatagtgag 6060 accctgttaa aaaaaaagaa ggccaggcac agtggctcat gcctgtaatc ccagcacttt 6120 gggagactga ggcgagcaga tcacctaagg tcaggagttc cagaccagcc tggccaacat 6180 ggcgaaaccc catctctact aaaaatacaa aaattagcca ggcctggtgg tgggcgcctg 6240 taatcccagc tactcaggag gcttgaggca ggagaatcgc ttgaacctgg gagactgagg 6300 ttgcagtgag cggagatcat gccattgcac tccagcctgg gcaacaagag cgaaactgtg 6360 tctcaaaaca aatgaaaaga aaaggctgtc atgttagatc caccctcctc ctcaggggaa 6420 cccctgggct gctctctggg tagagatggg aacccaggcc tcgggccagt gagtggaagg 6480 aaactttggg atgattgact tgggactggg ctagaggtga agaatctccc agtaggcaaa 6540 gttcggcctt acgttttttt gtttcaagca aaccacatca ttacccacag aggccattgg 6600 tgagatattt gtaagtctcc tgacagtggc tggagttcgt tgcttggttg ttgtttctct 6660 gtctcagccc tggagatggg agtgaccacc tgctctctct ggacagaggc tgtccacgtt 6720 catgcaattc cttggacacc ggtggtgcag cgggaggcgt aactgggagt gggagaccct 6780 gaactgtgcc ggttcttgca gagtatcact gtgacttcag gcgagtcacc ccacatcagg 6840 cagctcagaa caagggattg atctagaagg acctttcacc tgggctattc tgtgactcaa 6900 attatcttct cctaagccca ctactgcctg gtgtgttggt taaattagcc taaaggtcat 6960 tccctcggag aggccctctg ggaaacctcc ctttcctgag agtcactgct tgctggcgcc 7020 tgcccctggg gttccttcag agtcgtgatc atgccctggc ctcttccttt atttggcagt 7080 cccttccctt ccccatccct gatgagggta gggagcatct gtctgcagct tcatcttcat 7140 tgtctagggg ctccagaaat atctgtgagt aaataagtta tttaatcttt gcctcaaatt 7200 tccagtgact gtagggatat agctgtgagc ctctaggagc tgagattttt taaatttccc 7260 acttaaacat ttatttaaaa attttgtgct cagcatggac taaggacttt acattcatta 7320 actcatttac agcttgatcc tatgcggtgg gcattcattt acagaggatc ccattttaca 7380 ggtgaggaag aggccagcta ggggtgcagc ctaggttagt attctagagc tcatcaggct 7440 gtgttgtccc cagtgaaaga ataagcaaag aagtgaatgt tgtgcattga gaaaaatgac 7500 tctcggagga ggatgagcct ctcggatatg gcgaccgaag tgatatgggg cccttgtcaa 7560 gggtctctat tatggcatca agaaaagatg ctgctttcgg tgatgcccga ggagagcctc 7620 aatattttac atgggaaacc taaaaaaggg gccatgttgt ggtctctgca cctaagatac 7680 taaaggaaat attttatgga gagatgcaac atgtcaggcc ttggagggaa accccaggat 7740 ccagatggtt gcactctcaa accagggccc ccctcacctt ggccttcagc atttagtgtt 7800 ggaaccaata gcataagctt tggtcaggac ctttgatgga agccacagtg ctcattagtg 7860 accacggttg actaccttct ctctcctaag ctgacttctg gagggcacct gggatttccg 7920 gccagtgatc agtgctggtg aagcctgaag gccaatgtgt aggtttagct gttcagtcag 7980 aacccaaaag gggccaaaga gatggtttcc ttcaacctcc actgagggaa gtgaaagtca 8040 tggttcgtta aaaggctgag ctgggaccag agtctagggt tctagaggtg ggaatttcta 8100 cagctttggg ggaccttgca agggcatttg ctcttctggg actgcaggga gactgtgctt 8160 ctcagagatg ttagcatttg gcttggggag agagaggaaa ggagaggttc atgctccgcc 8220 atgatggtgg aaagtgatgt tggtgtggtg aggagctgag ctgaattcta agtggttcca 8280 gggaattaac aatgttcctg cccaagtgtc ctgttccccc acaaactaat gaggcagcag 8340 gtgtctgaag agaaacattg cagaatgtct gccaggggtt ttatggttaa ttttcctcca 8400 ttatgagggt tgactcagcc ttgggtatta gatgtctttg agaatccagg gttcaaatac 8460 cacagctggt agaatgtttc tcaacttgga gccaatctcc atctactgaa ggtacgctgg 8520 tttagacaga caacagggac atcagcattt taaaaagcgg tggaaaaagt ttgcttgtct 8580 tgattggagc catgacattt tattttgaaa tttcaaataa catgaaggga ggtttggagc 8640 ggtttttggt ttatccaaag ggcagtggat tgaaggctga gaaacaccag gctgaatggg 8700 agaggggttg gggtccccct gtgagatagt gaaacaatgg tagtgccatc caatgatagg 8760 cacttttctg tcattcagaa gcagaaaggg ggccagaggc ccattggcct tactgggcag 8820 taagctgtag agctgctgcc ttttcgtgaa agggttgaca ccaaccttct cccccaggaa 8880 gagtgaccag ggacctgagg ggcatggtcg agcagatgac agcctttgta aaacatctcc 8940 ctggtctcat cagcgatatt cgtcctgcct tccttctgag taatttccat cttaggactg 9000 gagtcaggtg gagcaagatt ccatgttggt ttctgttggg cctagagtgt cacactgaga 9060 cctaatttca tactttatga attctagtac tgctctcgaa ggtaagagcc gtcctctttg 9120 gctgaaggtt tttgcctgca accttgcatt gtaatccagt gacacctgac gtatctgtaa 9180 atttcttcaa atttctaagt gtattacaac cccgtgtgca aaagatgatt aattaattgc 9240 cttgacagta aaacaaaaaa caaaaaaaag gtgtgggggt atatggtatc cctgatttac 9300 tatagaagat gcagagagtg aagggagatg aggtggggag gaggggccca ggttctggtc 9360 ctactttttt tttttttttt ctaaagagat ggagtcttac catgttggcc agtctaggct 9420 tgaactcctg gcctcaagag gtgctctcac ctcagcctcc caaagtgctg ggattatagg 9480 cgtgagccac cgagtttagc ccaggttctg tttcttgctt agtcactttc tgtttgaaca 9540 aaattggaat ttcctttttg gatctgtttc tttaattgta aattgaatcg gactaaaacc 9600 tttccaattt tttcacatgt gaagacatac acaaaagttt tattggaggg ttgcacatgt 9660 gaaagaaaaa gggagaaagc aggattgagc agggggagcc gtcagatggt aatgcagatg 9720 tgatgagatc tctgccggac caaagagaag attccttttt aaatggtgac aaattcatgg 9780 gctttctctg cctcaaaacc tagcacagct gttatttact gaacaattag agagctaagc 9840 actttttaga tactatataa tttaattgcc gtatgaggca cccttagttt tcagacgaga 9900 aaccacagtt acagggaagg caagtaactt agtcaatgtc agataactag gaaaaggtta 9960 gaggggccct ggacacaggc ctgtgtgact gagaagcttg ggcacttcac tgctacattt 10020 catctcttcg ctataaacat tttagctttt tgtgtttgct gactggcaac aatacatagt 10080 gaaagttcta ataatttgta atgcttttgc atgtctttgt atttttcttg gttatcacat 10140 cacatcaaat taagatactg atcagcagtg tgagaggtta tttttccatg tcctcttcat 10200 tagtgttagc ttgtggatgg atttgaggct ctctgtgctt tccccccagc aaagtgaata 10260 ccagactttc ctattaaaaa aagtatttta tttttcagag acagggtctc attctgtctc 10320 ccaggctgga gtgcagtggc acaatcatag cccactgcag cctccaactc ttgggttcaa 10380 atgatcctcc tgcctcagcc tctcttaagc agtgcctttc cccattctca tgggactttc 10440 caatccatga gatactttgc tgcagggaag ccctgtctgt ccaggcctgt gtaatagacg 10500 acttcacatg gtcctgtgtt gttgtttgcc ttctgtgtgg ctaagtttcc atgacctggt 10560 ggcttggaag ccccatccct gatttgtggg agaggcaggg aggcaccttg tagcgcacta 10620 ggcgttgggc ctgaacaagt ctgtgtgctt ccaatgtctt tgtggggagg tttacgagtc 10680 cttcttatta tataatagta tcttgtctta gcttggtgcc tttcttctca gaagcttgag 10740 gcactctgca gataccatct caatttgctt tctgggagga ggagaggaag ctacccaaaa 10800 gatgaagttc tctgtgaggg gcttgaacac aggttgatag cgttgctggt tagttattct 10860 catggtgtgg atgaaaaatg gaatacgctg aaatttcagt tactcgtcac aaaaataagg 10920 cgtatgtaga aaacatcctg ggctaagggt ttgcatgctt ctagaacttc ctgttactta 10980 atggctgttg agtataaacc tcgggaacag tggggatcct tggagacccc aaataacttg 11040 tatttgtggt tactcctgtc ttgtctatca atacccctgt ctatatcgtg ttagaactag 11100 gacacacaga ctggattcag aagctggcct ggggtttagg agaacatggg acctaatcct 11160 ggccatctcg atttacctcc tggatcttgt tttctcatct gtaaaatgaa ttggggtgtg 11220 gactgtttat ggcctgtagg atgctagccc tgagaatttt ctccagatat tctacggtta 11280 agtaatttta ggggacactg tctaagcagt tgcctcttgg agaatgaaga tgttcattag 11340 gatattgaag gctctgagaa gtcctaaagt taaagaaaat ctgcaatgtt ctttgtggga 11400 ccgaataatg caacctggga aatgagggat tagatgacac ttgagtagcc ttccagatct 11460 gagacgagtc tcactctgtt tgtttactcc atctgtgatg ggtgtaggca ccatcttggg 11520 gagcaagctg tgatagagag ggaacaatac cttgttaatg tttgtctaat tcactaccca 11580 ggtgcatggt agtgaattag acactacttt gtaggttctg gagggaagaa gaaaagacga 11640 gacctgcctg gactggggct tgagaccact gtcaaataca agtacagttg tacaactggt 11700 agggagtggg tcatagtatg gccggtcttt ttaaaggtga ggaattctta ggcccagaaa 11760 ggcaaagtga cagatcctgg atttaaccag cagcccagat ttgaggccta gcacatagca 11820 aagcaccata gctattcaat agctgccaag tgggagtttg gatgatggct ttcctggaca 11880 gcgaaagcag tgatgtttgc ttaggatggc ctttggcagt gctgctgtta tccttaccac 11940 tggcaagcca tctcacgggc ccggagggga gggcaaggaa tcctaattct gtgagaaggc 12000 tctgggtaca tgagtgtgag atatggatac cctaggctct gcccctgaag acagtggcat 12060 cggatttact gcactattcc agtcggacag gcaccttaat ttttctcttt ctgggtgttt 12120 gatatggttg ggtcctattt cttctcctcc aaaccccgct agggccattc ccccaccctt 12180 cacttcccgg ccttccactg cagtctctaa ggattctgct tcatctttat gtgtgaacag 12240 ggttttgaca aacatgatta actgggtatt tttggaaggc tcaggaggaa cgcagagtgc 12300 tccggagggc aggcctggag tcaggaatgc ttcctgcaac ctgttcgtgc agtgagcgtg 12360 tcttcctcgc cctgcccttg gctggggaat gtgctggctt ggagggcagg agagtgacag 12420 gcggtttgag aactccgggc tctcccgtct tcggatggct cctgtgaaag cagggcctga 12480 aacttttatc gtcactgctg caggtgaaag actttcattt ggctgtagtg gtccaacaaa 12540 gagtatttta tttatgtgtt tccaagccct taaaaattct tttagggcac atcagtgggg 12600 agttaataga aactttgaaa taagaaaaat gcctgcaggg taagtagaac cccagccagc 12660 cagctccgag ttctgtgctg ttagctggta ggttggttct cagagaagtg gctggctggc 12720 tgggttacgg agcccacatc tctaatgcct tagtgttcaa tcattaagtg gatttttttt 12780 tttcccttct cttcttttgg tttggaggga ggactactct aaactttact cagggcaggg 12840 tagctcctga aagggctccc taacctttct ggtttatgac acaaagaaag tttggaggta 12900 ctgggataag agatggcttg ggtgaccccc ctatcatgcc ccctaacaca tacacagcaa 12960 accaaaccaa ctcacccttg atcatactcg ttgtttacac gaagggaatt tttattgtct 13020 tgtgagtgtt gagtgatgat taaacagaag agatgtgact ccaagcctgg cttcactaag 13080 atagtcttgt ttgtttcttt tcctccaaag taatttccta aagaattaaa agcccctttg 13140 aaacccagca ctaccttgtc tctgattatc agcataggca ggaagggctt ttaaggtctg 13200 agcccagctg tttagaggct acgagacgtg aggcaaatcc tggtatctct ctttgggcct 13260 cagtttcttc atctgtgaaa tggcacagta ctaccctcca ccaaggatga tgatgagaat 13320 taaatgggat gacaggtttc atccccagct cctgttctta ggaaggaaaa actgtgactt 13380 atgaagcctg taggttgtgt tcaggtttgt atgaggcctc ggacttcata caaaggtatc 13440 aaagtggcaa accctgatcc agatgttttc agttcagtca gctggtcctt gagcctgttg 13500 tgtgccagat atcctgacca aagaagctag atgggagctg ctgtgttgtt ccttggggct 13560 gctggatgca agttgtttag gtcggcggtt ttcaaatgct ggtgattttg ctcaccagag 13620 gacatttggc aatgtctaga gacatttagc atggccagtc attgggaggt actcctggca 13680 tctcgtgggc agaggctaag gatgctattg aacatcctgc aatgcccagg acagccccct 13740 gtgacaggag tcatccagcc caacatgtca ctagtgctgc agtggagaag ccctggctgt 13800 gtgtgggggt gtgtgtgtgt cctcttctac atttgataag gtaactcaca cttgctgccc 13860 ccatgatcgc tgtgggggat gcttatctat gccccagtcc tggtgttggt tgatgggaac 13920 atcaagattc aggcaagatg gaaaatagcc cttagaacta gcaggaaaag aatctccttt 13980 catttgtcta gaggttctgt taaagtgcct ttgcttctat tttgagactt gttcttaaaa 14040 aaaatgcgga tatgaaagaa aataaaaacc acattatccc tccacttttt cttggaggag 14100 gatgtgttga agaagtcaaa gttcaccatc cctttagata gaatcatttt gaacaatttc 14160 atatgtcaat acattttgct catctctaaa tttcatttta gagcctgtgg tgttctgtgc 14220 atggatatgt gtgcgtgtat gcacacaaaa ataaaaggaa atatttattc ttatgaataa 14280 gtatagaaat aaattaattt ttggaatctc aaactatcag agacttatgt aataaccaga 14340 ggcaggcctg attatgtatg ggcaaagcat ttgtgaacaa tgtctccatt gtataacata 14400 caaaacaagc ttttcttcca cattggatat gcaagtcggc cttctccaat aagggcctgt 14460 ctctttccaa ctccccccac ctcccacctt tgagcaaaca ttatttattg tggctgatgt 14520 gtgatcaggt cttgatttgg ggcctctttt tgatgccttc tctttgtggg atctcaccca 14580 cgtgcccctg gagacccttt ggctgccagg gcctttgttt cccagccacc catgtggtgc 14640 cagtagtgtc tgctttgtag cgagctgtcc ccagagcctc agcatggctt ggggatggtc 14700 tctgaggttg ggcttggatc cctcccactt ttgggctcag aaagaatgac tgccctctat 14760 ttccctgtcc ctgccctctc ttatcctgtt tcccagcccg catcatgtta tctttgcttc 14820 ttgtaactta ccaaacgatt tatgggcaag taggggaggt gaagagggaa ctcatctatc 14880 aagataacct actttgtgcc aaccactgag catagcaatt gtcccttctc cagccctctg 14940 aggaccgtgg atgggattct catgaaatga aacaggtgag gaacttttct tttagggaac 15000 ttgcttgagg tcccacaggc agcgagtatc aatcaacgtc aggatctgag ccctgttctg 15060 ttcggctgaa aatatactcc ctgagatggt gtaggccacc atggctttca gcaggctctg 15120 tgcttggtgg aaggaagctg gaagctgtgt acacacccac ggggaacagg gaccatagag 15180 gagcaccttt tgagtgcaga acctggcgaa acatacacct ttagagggat tttaggtacc 15240 cttgaggctg ggagaatcaa gcagagctaa gtttcccatt ggggtgtcac agactgaaga 15300 aacagagccc taggtagcac agggaagttg attgcccagt atcagttagt ttggctttaa 15360 tgactgagaa gagattccac cagttcattg aagagagggc ggacttttta ttggaggaaa 15420 gaagagtgcc tgtaagtaga gaagtctccg gggtgtagtg ctgtttgggg caggaagaac 15480 agtgtgagcc actgtggaga gaaagcccaa agagtcttgg cagggcaggg agtaggatgg 15540 atttgaagcc agaggaagta tggggtctct gtagactcca ggcaagccat gttaatattt 15600 taggaagccg tgatggagct gcagatgggt gtggaagtta aagtttaact gttcattcac 15660 cagtccttcc cctggagaat gtgcagcacg tggacagtgg aactttaagg tccttggctt 15720 gtatttcaca cccaagagat gaataggtcc aggtatgtca tagaccagac taatgaaata 15780 acaaatttct tttcaaaaat tttacttttt gtaggaaagc ttctctgtct ggcatttttc 15840 ttctcccagt tgtgactcaa tcttaaacgt cttcagacaa ttagcataaa atttcccaca 15900 gtgaattgac gtatactttt gagggttcca tttctttttt attttttttt tcttttgaga 15960 tggagtttct cgtcacccag gttggagtgc aatggtgcca tcttggctcg ctgcaacctc 16020 cgcctcccgg gttcaagcga ttctcctgcc tcagcctcct gagtagctgg gatgtcaggc 16080 acccgccacc atgcccggct aattttcgtg tgttttagta gagatggggt tccaccgtgt 16140 tggccaggct ggtcacaaac tcccgacctc aggcaatccg cccgcctcgg cctcccaaag 16200 gctgtgatta caggtgtgag ccactgtgcc cagcctaggg ttccatttct taacccctcc 16260 ttctgatgcc tcagaaagtc ttgctctgta agcctcttgt agctgcctcg gttcagggga 16320 agggggaggc ttttgtttta ggaccgtcca gaccatagac acatttcctg gcacctagca 16380 cgtgttgggt caaacaggaa tgatgaatgc atgcatgaat gaggttctta gcgctgaaga 16440 cggtgtcata ggtggtctac cacgccgcct gatcattcca atggcccatt atgaatgtgt 16500 gtgctgcagg gccctcccac gatcccgtca gcactgtgca tgttgtgggg aggtgctggg 16560 agaaagactg ggtctcagaa gatgggttag aggtgggtcc ttctctgctg ctggctagca 16620 gggtagctgt ggaggggtgc cccatcttgc tggtcttaaa ttttctcact gtaggcaggg 16680 agcatgacct ggctgaattc taagtccttt tctactctga ggttcattgt gggtgtgacc 16740 tgctgggctc agctctggct ttgggagaca ccctctcccc ttgatctcga caacccctta 16800 gcagagccca gtggctccta cagtgccctg agctgcttgc ccgaaggatg cggttgtggt 16860 tatctcaccc cctgccaccc tgtttgcgca agggtttgag attgtgtggc ccctccttgt 16920 acttcggggt gaggcttgct ccagaaaggt ggtctgcaaa ggggttggct gggggggagg 16980 aggaagtcat tctccaagtg tttgtcctca tcgttatccc aaattgcttg cctggaataa 17040 ggaaggaaag aaaaaaaaat actcttgagt ggtttgggcc aggattttag ctgatggatc 17100 tggtagttcc ctctgtcaga tttgttttct ttgaactgtc tgggccggtc acagtgtcat 17160 tgtttaaatg tggaatgtag gtgttctgtg ttctgggaaa taaaaaccaa aactggtcca 17220 ggggatccac agaggtaaga aaagaacatt ccaataggaa tgtttcagaa ccaggagggg 17280 aggagagaaa aacggctctg ttggtctcct agaggaagaa cttgttagat ttggggagag 17340 tcaggataaa tttgacccta agagtctctg attcctttta gagacttttc ttataagaaa 17400 taaaatggaa cttgggagag gcggcaactt gggaaacagc acattctgcc gtaatgaaag 17460 tcgtcccata agaatttctc tatcccttta gccaaatttc tgtttctaaa aggggaaaag 17520 gggctagaga taggcttgtt tgttttctta gttgaatctt actttttgta tttccagccc 17580 attctgcagg gtaagaacaa gcacagcccg agggctcact cagtgtgatg ttctagagcc 17640 tggctctgcc tcaatccctc acgctggagg atcaggcagc aggggccagt gatggatttt 17700 tttttcttcc tttcctcccc tattaatatt tactgaggta taaattacag caaagtgcgc 17760 agacctaggt atctaggact gtgaggtttt cctgtgttac ctgtgtaacc acgacccaga 17820 tcaagataag gaacttttct ggcatctcag aggctcttcc tgctcccttt cagactccgt 17880 ctcccagaag gaactacttc tgattcctat agccatagac tgaattttct tttccaactt 17940 catatgcata ggatcatcat gggtgtttta attttaattt catgtctgct tgccactccc 18000 aaatggaaat gtgttggcat ctctggatgt ttcttcataa gaaacatgcc ctgtggggca 18060 aagcccagga cagggctgtg ctgctgctgg aagtcctgtg cagctggcca gcctctgctc 18120 acccctccgg ccacgctggc actttcagct tctccagcct cctgcccttc ccacttccag 18180 tcctgcacct gctgtcctca ctgatgcacc tgcccttttc cttccgtcct ttatgtggca 18240 cacccttaag ggagacatct tcctgtctgt gttttgcacc ctcttaaaac tacattcctt 18300 tcccttcagc attggcatct ctgtccttgt gtattacctg ggatgactat tcagttaaca 18360 aatgctttct tcctaggctg tgagcccaag tttgttggat gattggatgg gggcacgttg 18420 tgtgagagaa ggatcatggg gtagcatctg gctctcttag aggtgtgtgg gggcgtgtga 18480 tgcctgccaa ggcgctttcg ttctgggggg ttctgtgtgt ttgaagcact tgggttgtgt 18540 gtccctgagg cctccgtcac gggcaacctc attccttctc tagcctccat cccctgcccc 18600 ctgcccaccc caggcctctg gagctggctc cctttcctgc tcactctctt ttggccagga 18660 ttttaacata tatcacaggc tggtaggcta agagcttggg acttcccctc accacactca 18720 aagcctttga tcttttgctt tggaggtaac atcaaaagga aggctgagga agacagccag 18780 gctgtgaagt tcaacgttca agttaatagc ttgactgaag gttgtgctgc gttgtggcag 18840 catcaccgag gctggagtaa acagagtgat tctgccacat tttcctggaa atgcacccca 18900 atattggaag agggcttctt ttacattcgg aatgaattca ggctgtagtc agagctgctt 18960 ttccctttcc ccattttcct tggaagtgtg aaaacttggg ggagaagatg tttgtaggag 19020 ggcatgatga ggggtagagg aagcccaaag agaggatctg gggaggggaa gccccatggg 19080 atgagactct gaagttatcc ttgccccgat tccgggactt gctatctgcc tgccttttgg 19140 cgtggtgtct ctgtgcccct gactgttcct gatttagcga ggtgtttctg aattctgatg 19200 gaattcaaag aagcctgggc aggcaggcag cttgacttgg ggcttgggga agcgtgcagc 19260 ccagacatag cagcgatgag agggcctcag ggctgagggc tgagatgaga atttcatcac 19320 atgcaaaagt gaaagcgacc catcgtcttc tccacttgat ctcttgctga gctttgcaga 19380 cactttggtt gttgtttaat ttaacatttt ctgcaatgct ccttttttca gattttcatc 19440 caaagctctg tatgagaggt tttcaaaccc attttggccc tgattctatt tggcatacga 19500 ttcaactctg gggatggtca tcttccccac acctgcgttg ggtacctttt tggtgtatgc 19560 tcagagcatc cttggacatc ttcctggtca gtgtccagca tcgtgaagct gccctttagc 19620 ctctcagtgc ccccagatac acctgtctct ctgcgtagcg gcactcagcg tcacctttct 19680 gtggggtctt gagaccctga tgatatcagc actatgctgc cagaattccc cttggattct 19740 ttagtgtggc ttctcaagca tcccttatcg ctataacgcc ttcatggttt ttggcataac 19800 tgtatactac ctgtgctatt atttatttga tgcattcaaa catttgattc atttatttaa 19860 actcagtctc actgtaatcc ttaattaaca cctgtgaaat tataggtttg atgtgctact 19920 tatttattta ttttttaata cacattagta taatcccgta acggctaaag taacactttg 19980 tactgcctaa aaccatgctt gggagcgcca cagtttgaga aagtgcttag ccttcctttc 20040 cctcctttag tgacttgtgg tttggggcat ctgttgactc ctagggctcc cttgttcatc 20100 tttctgttcc taagctcagg gattagttgc tcaacccagg tgtggcctca aaattctgct 20160 catggaatag cctcaggctt ctataaatct catctttttt gttttgtttt gtttttgttt 20220 ttgagactga gtcttgctct gttgcccagg ctggagcaca gtggcgcaat ccactgtaac 20280 cattgcgttc tgggttcaag cgatcctccc atctcagact cccaagtagc tgggactgta 20340 ggctggtacc accaggcccg actaattttt aaattttttg aagagatggg gtctcactat 20400 attgcccatg ccggaagtct agttttatag tgatgagaat tcatctgggg tccaaggggc 20460 cctcctgtgt tgcttcctgt gctcccctct aaataaagat actccttcca agttgtcctg 20520 attttcaggt catcaccatt ttttgagctg gatggggaag ttggcctgga gcagccttcc 20580 ctgtctccga gttgcattac ctcctgagag gtctcagcaa atcactgcca tctcttgatc 20640 agagttgctg gcaagagtcc tctgtggttc taggttttca gccctggaga ctctcgcctg 20700 cattcattat acatgtcctt ttggtgcctt gttgaaaggc atctcctgcc accgaagggt 20760 gtgggcttct ggaaattctc agaaaacaca atatgccagc ctccagggat gggtctccaa 20820 agcttcagga acatatcctg gggtgttgag gaaacaccca ccttaaaatg ttcctcaagg 20880 gggaatgtta ctgcttgccc taaccctctt gagctgatgc tcacatgacg tccctgagat 20940 gggcttcttt tttgcccgta cttaaagctg taaagggcca ttgtcaaatt tgtttagctt 21000 ctcaattcat gttccttaga ggatggtaaa ttaaagttag cattcctgga cagagccttt 21060 catacattga agacaacccg gtgagtctca aggggagagg taagggagag atgaaaggtt 21120 ttctccaggc ctgttcggca gcatggactg ttcttttagg taattaaggg agaccataaa 21180 agacaattgt gtgagtccat ttacctttca cttgggggtc ttaagtcttt ggttgggctt 21240 ctttaaccct gtgtgtcacc cacgggctcc tatgggtgct gttttcattg ttccgttatc 21300 tagttggctg gaacacacct ttggggattg gagaatggag ttctgggggc tttgggaact 21360 ttgagttttc ctgcaatgtc ctatagaagc ttgagtctgt gattcctggg cagggccttc 21420 tcctagttga gtgagattgg tggggcaggg cagccagtta gggggtcatg ggagcaggtg 21480 tggaaaaggt tatatgtctt agtaattctt tgtgacaatc accctcattc attgatatct 21540 tcttcctatc atgtattagg gcagtggttc ccccaatgtg ctgcacatta ggttcacctg 21600 gagagctttt ataaaaatgc caatgcccgg ggcccacttt gggaggagcc aggcatcagt 21660 aatttcaaag gtctctaaat gatttacagt ttgggaatca ccgtatgagg atagtaagct 21720 ctgagtccta tgcgttctgt gccgaacacc catgaagcag tcttccaagc attttacctg 21780 catcatctca attctcacac tgttaaggag atagacagta tcatctccat tttgtagaca 21840 agacaactga atctcagaga ggtttaagtc tcaggacacc aaggtcatta ttaatcaggg 21900 ggactgtgat tgctcccttt ataaaatgta ggagatattg tggagtacgg ttgagaaacc 21960 attgcaatag ttttcttact ttgttaagaa attaggctgg gcgtggtggc tcaggcctat 22020 aatcccagca cattgggaat ccgaggtgga cagatctctt gagctcggga gttccagacc 22080 agcttgggca acagggtgaa accccatctc gactaaaaat acaaaaatat tagccgggcc 22140 tggtggtgtg cacctgtagt ctcagctact tgagaggctg aggtgggagg atcacctgag 22200 tccggctgca gtgagctggc attgtgccac tgtactccag cctgggcaat gagagtgaga 22260 tcctgtctca aaaaaaagaa aaaaaaggaa attagtggtg gaaggtgact ttgcatctgg 22320 gcgtatctgc ctgcagagtt ggtgtcctta ccttgaagaa accctgcttt agttggagta 22380 tccttaatgg ttagtggcag gaggggagga gtggttcctg ggagactgga acaaaatatg 22440 gtacctgaat gcttaaggct tggcagatga gcagtcattt tcttacacag agcttaggaa 22500 agggcatcca ggtagaggaa tcagcatgaa caaaagcaca gggccataga gttctcagaa 22560 ggaaagatgg ggttaaccgg agccaagcca gagatctggt ggtagtgggg ggtttccaag 22620 ctagaatggt tgtgtggtat tctgtcctca ggggctttga actctgtgtg ctaatgaggc 22680 ctcaaattct ctggggctct ggttaaaatg tagattctga tatcagttgg cttgggtggg 22740 gccttgcatt tctgtaagcc cttagcagtt gcactgctgc tactaccgtg agtattgctg 22800 ttgagcatta ctaccttgag tattgctgtc aagtgttact accttgagta ttgctgttga 22860 gtattactgt cgaattttac taccttgagt gttgctgttg agtattacta ccttgagtgt 22920 tgctgttgaa tattactact ttgagtatta ctgttgagca taaccacttt gagtattgct 22980 cttgagtatt accaccttga gtattgcttt tgagtgctac tgccttgagt atcgctgttg 23040 agtattgcta ccttgaatat tactgttgag tattaccacc ttgagtattg ctcttgagta 23100 ttaccacctt gagttttgtt cttgagtatt gctaccttga gtattgctgt tgagcattac 23160 taccttgagt attgctgttg agcattacta ccttgagtat tgctgttgag cattactacc 23220 tcaaggattg ctcttgagct ttaccgcctc aagtattgct cttgagcgtt actgcctcga 23280 gtattgccgt tgagtattac tcccttgagt attgccattg agtttagtcc tgtgagtatt 23340 gctgctactg cgccttggca atggttttca aactttgcaa cacatcagaa tcacttggga 23400 aacctttaaa attctaacgc ccaggtcaca tcccattcca actagatcag aacatctggg 23460 gaatgcgagc catgcaccag tagttataaa acctgcccag gtgattccaa agtgtgggaa 23520 cctttgagaa gcactgcttt aggggttgga atagtcctgg ctgaatttta atcagggaag 23580 actgactgct ccgtttatga aacgtaggag agtggagcag ggttgagaaa ccatcgggat 23640 agtgttctta ctttgttacg tgagcaatat ttgttgagtc tctgtggtgg gttctagggg 23700 ttcagaggac agcagtgtgc tgctaggatg gtggtctgaa ctagtggaaa ggcactcaaa 23760 ggaagaaaga cagaattcta agaggagagg aattttagga aggagatacc caggactttt 23820 gaattacagg taatttgatc agaacccaaa actgaaatgt ctctgctctg tgatgaaagg 23880 gtttgctggc attgagtaag gagctgcagg aaggccttta acttgtctcc aggtctctta 23940 acagctttgt catttacata caagcacctg cctggctaaa ccattcattt ctgtagcttc 24000 cttctggatc tgtctaggga atatttgctt tgcatatttt ggggttatct taagtgtttg 24060 aaggaaccaa aatatttttc ttaaaaataa cactcaaatg tagttcacat gattaatttt 24120 gactgatttg tgagaatcag taagtgctga ctgactgagg cgccccacac atccggcttc 24180 cttctgttac tctacgcgtg ttgctgaaac ttaacgaacc catgtggggt cttctcgcct 24240 ggtgcagtcc ggcccagtat tcatactgag gtttgcagtg ggagaaagga aggtatttat 24300 ttgtaggtca ccaagcaggg caaatccagc agctcacgct taagacctga cctctcccat 24360 ggtttataag caagtggttt tttttttttt tttttttttc agactgagtc ttgctctgtc 24420 acccaggctg gagtgcagtg gcgtgatctc agctcactgc aacctccgcc tcccaggttc 24480 aagcgattct cctgcctcag cctcctgaat agctgggact acaggcgtgc gcccccacac 24540 ctggctaagt tttgtctttt tagtagagat ggggtttcac catgttgccc aggctagttt 24600 ccagctcctg acctcaagtg atcctcctgc cttgacctcc cagagtgctg ggattacggg 24660 catgagccac agtgcctggc ctgtaagcaa gtgtttttaa agaaaggggt aaattttagg 24720 gaaacagaag ttctaggcaa aatggtaaat taatacaggg aggtaagaca ttggtttggc 24780 ctaaaaagat gggatatttt gaagtggggg ctcataggtc ataagtggat ttaaagattt 24840 ttttggtttg taattggtta aggaagataa gctttgatta aagatttggg gtcagcagaa 24900 agaaatgtta ggtctggctc gtgggcatgt ctttttctag gcccctcctt ggaaagaact 24960 ttagagcaaa gaaaggcagt tggagcttag tccccacttt ctcctgatct gaggtctacg 25020 gaccactgga tccatttggt ggggtccatc tttctgaaaa acaagtcagg gacatgtatt 25080 gagatgatat tattggtatt tatagggaac caaacaacgc cccatgactc ttttttggct 25140 attgttttaa gccactgttt ttttttgttt attgagttgt taacttattt tttaaagcta 25200 gctagctgcc tggaatttct ttagaaggaa ctgaagtttt taaaaatttt tatgttgggg 25260 ggtattgccc tgcaggcccc taaaaggggt ccctgcgctg tctcaaaact tggatgcaaa 25320 aagaagttga gttaacacag gaggacaggg gtagacgcac caagggcatg tgcctcgagt 25380 gcgtggtcct tattaagaag ggtggttaga cagggaatgg gttagttccc aggtcggcat 25440 tcagctgaaa cagtgatggt taaaattctg aaaaatgtcc acgctctgca ttctcttcct 25500 aacacccagg acccagtaac tataaagccc cctaccctgg ggcatagcag ggggcttcag 25560 ggacccatga gaaggtcatc tgctgctagt tacactcctt ctgggacctg atttagacag 25620 tttggtggta gttttgcgag ggttaatttc agggccaagg atgcttctag aatggaaata 25680 ccttcttgac attgggagct ttattggttg attatgtcaa tgtgagaatt caggaagccc 25740 agtgctaatc ctccatccta aaaggagtag attggctggg cgtggtggcg catgcctgta 25800 atcccagcac tttgggaggc cgagggggcg cggatcacct gaggtcagga gttcaagacc 25860 aacatggcga aaccccgtct ctactaaaaa tacataaatt agccaggtgt ggtggtgggc 25920 gcctgtaatg ccacctactc gggaggctga ggcagggaga attgcttgat cccaggaggc 25980 ggaggctgca gtgagccaag attgtgccac tgccctccag cctgggcgac agagcgagac 26040 ttcatctcac aaaaacaaac aaacaaacaa acaaaaacta aaaggagatt tcctccttct 26100 gtcctttatg ggagacttca accttgggaa agtctggaat ccttggacat tagaaattct 26160 gaagttttgg ctggctgtag tggctcatgc ctataatccc agcacgctgg gaggccgagg 26220 caggtggtca cttaggccag gagtttgaga ccagcctggc caacatggtg aaaccccatc 26280 tctactaaaa atacaaaaat tagctgggcg tggtagcgga cgcctgtaag cccagctact 26340 tgggaggctg aggcaggaga atctccagaa cctatgaggt ggaggttgca gtgagctgag 26400 atcacaccat tgcactccag cctgggcaac agaacaagat tccgtttcaa gaaagcagaa 26460 actctgaaat ttttgcctgt ccaggccaca tcaatcccat tcctctgctg tctctgcagg 26520 attctgtgag gaataattag ttaatgtttg cagagcactt tgaaatcctc agatgaaagg 26580 caccggagaa gcacaaagta ttattattta ttattagctt gccccagaat ggaggcgcat 26640 gaggccctgg cagctccctg cctcgtgcca ggtgtgatcc tcctgctggg cttttcctgc 26700 ctgatgagct tttttttttt tttttttttt gagatcaggt tcagctctgt cgcccaggct 26760 ggagtgcagt ggcatgaaaa cagttcactg cacacagctc actgcactgc agcctcaaac 26820 acctgggctc aagcaatccc cctgcctcag cctcccaggt aactgggact atatactaca 26880 ggcatgcgcc accactcctg gctaattaaa aaaaattttt ttttgtagag atgggggtct 26940 cactatgttg cccaggctgg tctcaaactc ctgggcctca aagatgccaa aggttcacac 27000 cttggcctct caaagtgctg agatgacagg cgtgagccac tgtgcctgtg ctcaattgat 27060 tttctttatt aaagaaacat ggaagaaagt gaaggatgag aatcagtaac gtaacgtgtg 27120 cttcagattg tggacaagtg atgtgaagga aacacattgg tcccactgtg gtgacagagc 27180 aggggtttcc ttacctggca aggttgcggc tgccattcct tggggtctgg ggttaagacc 27240 atctgcctga gggtaacgca gtaataaatc agtactaaag ggcgtactaa agtactgtat 27300 tgctaggcta ggccatgctt ggtgtatttt tttttttttt taattgagac ggagtcttgc 27360 tttgttgccc aggctggagt gcagtggtgt gatctcggct cactacaacc tctgctgccc 27420 agtttcaagt gattctcctg ccttagcctc ctgagtagct gggattacag gcacgtgcta 27480 ccatgcttgg ctagttttaa aatattttta gtagagattg ggttttgccg tgttgtccaa 27540 gctggtctca aactcctgac ctcaagggat cagcccacct cggcctcccg aagtgctggg 27600 attacaggca tgagcctggc tggtgtattt gttttaaatt taaagtttac taaatttaat 27660 gatatctggg gaatcagctt gcttcctggg gatctggatg tacttgaggt gagagggtgg 27720 ggattcagaa ttatcctttc tatcgcagca tgttctggat tgattcatgt aggtctcaag 27780 tgtgtgtaat atttcatttc tttgtgcaat tttggcatgc cgaggcgggc accctgaagc 27840 tccggcagag cctggagaca gagtggggag ctctccgctc tttcccttcc ttcatcccag 27900 ctgacttcga ctggaattga attcatcagc tgctggagag ttgttttatt tgccctgctg 27960 gtggagaggg aggaaaggaa catcatgggg ccaggctttt tttttttaaa ggaaagattt 28020 gatttacttt cccccttagt agcatgatgg gcacctgcac ccgccagcta atcagaagcc 28080 actgtcccct gaatgcctcc gctgcccacc agatcctgac agcatcccac gcgggagcac 28140 tctcgtgtgc ccctggcagc ttctgctgcc tggcagttct ctaaacttgc tggtgtctct 28200 ctgcccggag gctcagaaac ccagaggact gaccacttct tgaggctcat gtccagtttg 28260 caaagagccc ccagcaagca gagaagggga tttttgtacc agcgatatct cttctccact 28320 cctcaacaca ctcctttcca ctctgtctcc tataaacatg gaacagccag gaatactcaa 28380 atcctagcct gtcatgaagc caaaaattga tagagatcta ctgtccagaa tgatttctta 28440 tagtgaccct gtgtttagtt ggtaagactt tcttaaacca tgagggattc tggtcccaca 28500 gggcagtaat atctggggca gagcctgaga cttttctcat tgatttcctc tgtgagccag 28560 gagtgactgc tctgatgcag ggtgctgtgt ggttggtaga agctggcgtt atcccatttt 28620 acccacgagg aaacaaatga ccagtggtgg agcgggagct cagcatccca tgtgcccact 28680 tcctcctcgg gtggactttt cacctgccca tgccgtcttc tttgcaaact ttactgcagt 28740 gacggagaca tctttaaata caaattcttg ggggaaccct gtgttccttg gctggagcct 28800 ggctgggaag gaggagggag cagagggctc tcttgggtgt ggcctattgc agttgagcca 28860 gggaaaggct ggtccactgg agacaccctc tctggtcacc gcagacttcc tgccctccat 28920 ccagtgtcct tctacttgca ggatgtgtgc ccagcagaga gaatctctga agccatgtca 28980 ttattgggat aacattcctg tcccagtcac cttatttctc agaaaaagga caatgggaaa 29040 caagttttta ttgaatccta tgctgggcct attaatgggg tctcttactt ttcatagcag 29100 cactgcaaac agagttacgt ttctattcat tttatggatt agaaagctga gatccagagc 29160 gggcagatgt aaacctgggg tctttaaaat gcatcctttt tgcaaacaaa taaacttagt 29220 gtattaaaag ggctggagag agcagagtaa ggtaacattt gggtggtcag catgtagttc 29280 tgggtcccca cagtggagat ggcacagtgc tgggtgctgg gggaactatg gtcactaaga 29340 gacactgaat aatttaatgc atgcccctga ttccatcact gactgttgag gtaacacata 29400 catttatatt gtcagtggtg gtgatgatta catgagctgc gtaaagcgtt tgaccagtgc 29460 ctgcacataa catagtaggt gctcaataaa gatcacccac tcttaagagg tgggaggagg 29520 tgaagtcatc tttctgggga gtgttgccct gttgttctct gctgcattct ttctgtcctt 29580 tgggctccga gaatgctggg ttgggcagtg tgagtggtct tctcaggcct ctgtgacatg 29640 ttgctttcat gaaaggttcc cctctagcca aagactgagt ggtccttgca ggctttctcc 29700 tgagtccttt tttttttttt tttttttttt ttaaagacag agactctgtt gccagattgg 29760 agtgcagtga cgcggtctcg gctcactgca accgctgcct cccaggttca agcaatctac 29820 aaaatgcatc tataaaatga tgcatcagcc tcctgagtat ttgggatcac aggtgcccac 29880 taccatgcct gggtattttt ttgtattttt agtagagaca gggtttcacc ctgttgacca 29940 gtttggtctc aaactcctga cctcgagtga tccgcctgtc ttgacctccc aaagtgctgg 30000 gattacaggc gtgagccact gcacctggcc tctctcctga gtccttttgt ttgtgcctgc 30060 tttggggatt ccctctggct ggggtggact gccgggatct gtttgtccag tgtacatttc 30120 ctggtcacct agcaccggcc agctgcggtg ctgggaggaa cagggcctgg ctctgggagg 30180 cagctgggag agtcaggaag tgaagaaagt tcttgtgggt gtgatggtgg aaacccaagc 30240 agcgtccaga gggagcacaa gagggaggga caaatcttgg gagggtcccg ggccaatggg 30300 acccagtgta agaaattgca cctgtcctgg cagatagaga aggtggaagc agtgaatggt 30360 agagcatcct cactcttctc tctgccagca agcacctttg gggaagtcct cacggacagg 30420 aatgtcgtgt gtcttggctt gagatgtcaa agaaacatgt tggacacacc atggtgacag 30480 agcaggagtc tcttaacccc ggcgtggttg aggctgccgt tctggtggga tctggggtca 30540 gtcaggggtt aacagtcgct cctgcttgcc tgattgacac agtaataaag gcagtgacac 30600 caaactaggt ctcaggaatg tgtcctcgtt agaaagactc actaatggtt gtgggggggt 30660 ggcccatgag tccttctggg tggtggcgag aagtagggga ccctttgggc tttgcccttt 30720 ttggtcatag gacttcactc cacagacata attgaaccgt tgggtttctg cagccaaatt 30780 caaatgtcac caatcttggt cacccctttc atctcttggg tcctctgtaa gttatagcta 30840 tctgatagtt tactgaaaaa taaactgaaa atatgtttta aattgtactt tcgatttaaa 30900 ataatgttta gagacaaaaa aaaagggtcc aatccacttg gagaaaagca ttgtcaaagg 30960 tggttgattt ttttcttttg ctgttttaaa gtggtaagtg gatgagtgtt ttggatatat 31020 tgatttttca ggtgtgcagg cggtcacatg aacagctgac attttttttt ttttcatgtg 31080 gacttcagcc agtcttgaca cctgcccctt aacgaaaagt aaaccatcgc cttgtttgac 31140 agtttaagtg cagtgatacg gatggaggca ggtttacgtt atgttaaagg cttgacaacc 31200 cagaaccccc ctgttggttt ctttgttgta acctttgagc cggtggcctg ctgaaatgtc 31260 acctttgccc ttctttaaaa gcaggaataa taggtggtga gtgggtggat gcctcttaaa 31320 atactggaaa gtgctgtggc ccgagggtaa gctttttaga agtgagtgtg tgtgttgtgt 31380 tgttttaatt aatgaatctt ctgggcctga agataatgag gtcagtgagg gcagccatgc 31440 tgcctcacag ctcaccttag ggtccttgtt gtccagaacg tgcctgacct actggagggg 31500 cctgggaatg cttctttgat tgacgtgggt aggaagacag atgtggcggc ctccatgctg 31560 atgggaggca gctgggaaga aggtcatggg caccatctca ggagtggcag agccacctcc 31620 ccctctcctc accccgtgtg tctggattct tccagctgtg tggtccttct tcctgcctgg 31680 aaatgagcat cctgcagagc tcggctcctg ttcacaccct cctcctaacc ccctactctc 31740 cctctccctt tcatccaggg ctggaggacc agatgggctt tacctgatgg agtgtgcttt 31800 gctgacatgg tgcaaagagc caattcctgg ttgcaaagag gcagctgggt gcagaggcgg 31860 ggtgcattcc tgtaataata ataacttgtg tttttataat actttacagt ctaagtactt 31920 ttcaaatact tgacctcatt tagttctcac cacagccctc tgaagggata ttactattac 31980 cttcatttta tagatgcgtt aaccagggct tgttttggga ggtagagggg gtgtgagggg 32040 gacagagggg agggaaccag tgttgaatga attctgaggc cctgccaaag cagccagcta 32100 gctaggtgtt gtttaatgga ctctttgcat ctacagaatg agggaggtgg gatgagggga 32160 aattatttca caataactga aggtcggaga gactaactct ctgctcattg tcacacagca 32220 gttgagtgcc agctgggatt tgtcacccag gtcacctgac tcctaagccc tgtgatcgtt 32280 ctcttctgtc tctagtatac ccagcataat gcccggcaaa gtgctggcat caataaatat 32340 ttgtcgaatg ttaaatgagg cttaaagaga accattcatg cttggcacag gggcacagtg 32400 agacaaacat gtttcctgcc ctcgtaacct tcgcttccaa attctgtgac cttgggcggg 32460 ttgcctgagc tcttttccag ctcagtttcc tgaaaactca tccggaaaat gggtaaaata 32520 tcagagtgca ttctgtatgg taagactgca aatgttagat gattctgcta cttattattg 32580 ttttcttttt ctcaccacac accttccctt tttatgtaca cctcctagga agtaagtttc 32640 tgataacata ctgcattgtt ggataacagc aacaaaaagc acttcctgac attattgccc 32700 aaatcaccaa atgaggcaat taccaacttt ggaataagaa tagcaacggt ggtaagagct 32760 gacatttctt gagcgcttgc catatgctgg gtgtactact ataagctgct gcctgcaatt 32820 atgatttggg aacaactctg aaagtagtta cctcccattt tatagaagag taaactgagg 32880 ttcagagagg ttaagtaacc cccccagggt ctctcaggaa gtagttggtg gcctgggatt 32940 caaacaccag aattggtctg acttcccact ctttaaacca cactcaaaac tgaactctcc 33000 acgtgtgtgt gttctgggca ttttcgcatc tcccttggct tgttgacagc gtggactttt 33060 gctttcccat tctcatagaa catggccagt gcaggaggag gaaatccaca ctggtctttg 33120 gactgaacca gaggctggcg atggtcccga aacagggtgc caagtggctg acccttgttt 33180 ttatgccttg cgctggtaag cttggggcac caggagttct ttgaatttct ctttcttgac 33240 tgtccacgcc ttctttaggc aatcttttaa caggctatgt tttaaatctt attgacatct 33300 ctgaagaaag aggaggaaaa aaaaatcaag acatggcctt agagaagtga caggttttct 33360 ttgagatttt gttttctgtt ttccttttta ttttgtgcac attgcaaaac ctctttggga 33420 tgatgatttc gtgtggtttc ttggtagccc ttgggcagct gctgccaggt ttcacccaaa 33480 tgcattgtga ccccctgttt cgtgggacgg ctttgcctcc acatggctga ttgtgctctg 33540 tgtgtccgct gtgggcagag tgtgattgta agaatcagaa ttctgctggg cttgcaagca 33600 tttaaaaaat ctctataagt ttgagaactg gttggaaggg agagatgcag cgacttagaa 33660 cacccggcct gcagctgagc ttccgtgtgc ctgggaggag cccatatgga gaaacaggaa 33720 aattccactt caccagaaag ctggggaaat gagtgggagt aggggccagg ctggttaact 33780 aggaagactt ttggtcactc tgctttactt agcctaaagt gttcatttcc cccttaagcg 33840 gtggttaata cgcgtatctg cagatttact ttttggatga tttaaaatct tgcaacatct 33900 caagggattg tatcctgatg atactgatta tattaataac aagataatag cttataatat 33960 aatagctagc aattaccaag cacttacctt acaccaggta caatgccagg catttgatcc 34020 ttacacgaac tctgagagat ggctgtttgt attcccattt tacagatgag ggaagctgtg 34080 ctgagagagg tgagttcatt tgcccaagct cacccacttt gagatggtct gcttttatat 34140 cctcttagcc caattctttt ggatgtcagc acttggcatg tattaggcac tggataagtg 34200 ttttgttgaa tgaacaaaat gatggaactt ggatttgaac ccaggtctga gctggctttg 34260 agtcttcaga atagtaggtc caattagtgg agtgggggct cagtagtcca aagggaaagg 34320 agcaaggaga cattgtgggg gccgagaaga gggcttctgg ggtgtttcct gggcacattg 34380 gcattaaagg catagtgtga agtgccattc aagaccatgt gctggattag tgtttttcct 34440 ctccacttga ggtgcttgcg attggctttg tgccccggtg tctgcaaagt gagttgggct 34500 gaactcagga agaccttttg gttgggatga ctgtgtattc acctgcacct gagtagggac 34560 tgagtttcac ttgccagttt taccgcagca agacctcgtt aagttggctt cctctcattt 34620 aggcatttgg gaaactttag gcggctggag tttaattctc aaggcaaagc cccttttcaa 34680 gggacatgaa gaaaggcaga gggatatatt taaaatacct gaatgaactg tttctttttc 34740 tttttatttt ttgagatgga gtctccctct gtcacccaag ctggagtgca gtggcacgat 34800 ctcagctcac tgcaaccttc acctcccagg ttcaagcgat tctcctgcct cagcctcccc 34860 agtagctggg actgcaggtg tgcaccacca cacccagcta atttttctat tgttttattt 34920 tattttattt attttttaat tttttttttg agacggagtc tcgctctgtt gcccaggctg 34980 gagtgcaatg gcgtgatctc ggctcactgc aagctccacc tcccgggttc atgccattct 35040 cctgaatcag cctcccaagt agctgggact acaggcacct gccaccacac ccggctcatt 35100 ttttgtattt ttagtagaga tggggtttca ccatgttggc caggtctctt gaccttgtga 35160 tccgcccgcc tcggcctccc aaagtgctgg gattacaggc gtgagccact gcgacttgca 35220 tgtagacagt aatggcaggt cactatcagt gggtctgtta atcaggtgtc caacctggtg 35280 ctgggcttgg tggctcatgc ctgtaatcct agcactctgg gaggccaagg cgagtggatc 35340 atctgaggtc aggagtacaa gaccagcctg gccaacatag taaaacccca tctctactaa 35400 aaatacaaaa attagctagg catggtggga tgcatctgta gtcccagcta ctcaagaaga 35460 tgaggcagga gaatggcttg aacctgggag gcggagattg cagtgagcca agatcatgcc 35520 actgcactcc atccagcctg gacaacaaag cgagactctc acaacaaaac aaaacaaaca 35580 aacaaacaaa caaaaagtca cttgcttctt tttttgcttg cttatggaca taaaccctgt 35640 aaactatctc atacatcatg ggagtgagtt tgcagtgggt agactgctat tcacaaactc 35700 atatacatcc tatgaaggag tacaggttaa ataaccatta tccaaaatgc ttggggctga 35760 aagtgttttg gatttttaat ttttttcaga ttttggaata ttcgcatata cataatgaga 35820 tatcctgggg atgggaccca aatctgaaca ggaaattcat ttatgtttta tataaaccct 35880 tttttttttt tttttttttg agacagagtt tcacgcttgt tccccaggct ggaatgcagt 35940 ggtgtgatct cggctcactg caacctctac ctcccaggtc gaaacgattc tcctgcctca 36000 gcctcctgag tagctgagat tacaggggct tcccaccacg cacagctaat ttttgtattt 36060 ttagtagaga tgaggtttca ccctgttagc caggctggtc tcgaactcct gacctcaagt 36120 gatccacccg ctttggcctc ccaaagtgct gggattacaa tgtgagccac tgtgcatggc 36180 cttatataaa ccttaggtaa ttttatacaa tattttaaat aatttttgtg catgaaacag 36240 agttttgact gcattttgac tgtgactcct cacttgaggt caggtgtaga cttttccact 36300 tgtggtgtca aatttcagat tttgaagctt tatataatga gatagggtct tgctctgttg 36360 cccaggctga agtacggtgg cacaatcaca gctcactgca accatgacct cctgggctca 36420 agtgatcctc ccatctcagc cacctgagta gctgggacta caggcatgca ctgtgactgg 36480 attttttttt tttttttttt ttttgagacg gagtctggaa tctcaagtct cgctctggtg 36540 cccaggctgg agtgcaagtg gcgcgttctt ggctcactgc aatctccgcc tcctgggttc 36600 aagtgattct cctgtctcag cctcctgagt agctgggatt ataggcgtgt gccaccactt 36660 ctggctaatt tttgtagttt tagtagggtc ggagtttcac tgtgttggcc aggttggtct 36720 tgaactcctg aactgaagtg atctgcccac cttggcctcc cagagtgatg ggattatagg 36780 catgagccac cgtgcccagc cttggctaat tttttatatt ttttgtagag acagggtttc 36840 gctatgttgc ccaggttggt cttgaattcc tggactcaag caatctgccc accttggcct 36900 cgcaaagtgc tgggattaca ggtgtgagtc accgctcctg gcctgaagca ttttggattt 36960 ttgggttaga gttgcacagc ctttactgtt attatcctga tgttattatc cacattttac 37020 aggcaaggat ctggaggcgt agagaggtaa aatcattttt tcaaagcccc agaagtacta 37080 agccgcagat tctgaatttg aactcaggca ttctgggtca gaattagtga ggttttaagt 37140 taattttttt ttttttttta gatagagtct tgctctgtta cccagggtgg agtgacagtg 37200 gtgctatctc ggctcactgc aacctctgcc tcccgggttc aagtgattct cctgcctcag 37260 cttctagagt agctgggact acagacatgt gccaccacgc ctggctaatt tttgtatttt 37320 tattagagat ggtgtttcgc cacgttggcc aggctggtct tgaactcctg acctcaggtg 37380 atctaaccac ctcggcctcc agaagtgctg ggattacagg cgtgagccac tgcgcctggc 37440 ctaccccctg tcgcccaggc tggagtgcaa gtggcacagt ctcggctcac tgcaacctct 37500 gcctcccagg ttcaagcgat tctcctgcct cagcctcctg agtagctggg attacagata 37560 cccaccacca tgcctggcta attttttttt tttaagtatt tttagtagag acagagtttc 37620 aacaagttgg tcaggctcct cttgaacttc tgacctcatg atctgcctgc ctcggcctcc 37680 caaagtgctg ggattacagg catgagccac catgcctggc ctaagtttgg tttttaacca 37740 tgctgctttt tctagaccct tctgtcagcc agctccacaa tggtgaatca gggagttagg 37800 tccgtctgta agagagggcc caggagctgg gtcagatagg taaagagaca ttccttagtt 37860 cttatcctct gctaccaagc catttcttgg gatcaagccc tctttggcct gtgtcattcc 37920 acctccatta agttcagcct tctttccttc tttccacatc tttccactgc tgttgaaaac 37980 ttgagacctg aaatcccatc tcctgaattc ctgggagctc tagaagtgga gatggccagg 38040 ttctgtggtc agagctggtt gggattacaa ataaaccaaa gcctgggaaa ctttcttgct 38100 attaatagcg cagacctttt ggggagggaa tacccaaact cgatgctgtt ggaattgatt 38160 ttgcctgtct agatgacata ctaatgagct aagtggttag cttcggatca ttattgctct 38220 ttcccaagcc aagttctttt aaagactaaa accacaaaag cagagaacga gttgggttag 38280 agaggcatag tggctgggtc cagagaaggg agagtggtca gccctggcct taaacatgag 38340 aaaataaagg tggtccttgc tttggaatga gttagtggtg ctgactaatt caactggttt 38400 ttctttttct ttttggaagt ggaatttgat ttggtgtctg gattttgata gggccattta 38460 tatttcttca gcactttttg gttcttgcag aaagttacat tcctagttcc tcaactgctt 38520 atttcttttt ggtttttgaa gcaggaattt gatttggtgt ctgggttttg ataggggtgt 38580 ttatgtttca tcaatgtctt ttggttcttt cagcgtttct ctccttgtct gtcatgtgtc 38640 agagagggtg cctgtcaacg attctctctc tccagggaga aagtctttct taaaacagcc 38700 ctaagatcct tatctcctca aatcacccac tttgatgata atatccattg ttctcttctc 38760 tgcttcttgg catattctag tcagtctatg tatacaatta aaaaaacaaa acagccctct 38820 gtgtccaaag tgcttggaat atcccagtgt ttcacaggag actttggaag tggacaaaac 38880 tgtatttcct tccccaaatg aggttattgt gctcgaaata tctcctggta gtttattaaa 38940 ggaaaccgca ggcaggggta agagaggcag tttctacagc ctgcaaccct attatcttgc 39000 ctcttctttt cgaccctcct tcctccctct cctcttctct ccccccctca ccctattcaa 39060 cccagcccca catgtcatgc cgtccccagg aggtagccct gcagccctgc ttctctggga 39120 tggtctgttc ttgccacccg tcccatggaa cgtgaagaag gaatttgggg tgtggacttc 39180 cttgagtgac taggattaga cccgtcgggt ctgcagtcag acgagaagcg tgtgggcaaa 39240 gggaactatt gtgtgaggct tctctggaca gaaagcctgc cttcatcttt tactgtgcct 39300 aatggacaat tgagacattc agcttatgtc tgaaaggaaa gtgggccggg atggtctagc 39360 agacctccca gatgaaggct tgtaggagga gcaaatagag acaaggatta ccaacagggg 39420 gaacaactgg ggcagagtcc tgggagagaa tgtttatttc cttgctctct aggagggatt 39480 tggaaagagc cataatcctg ggttaggagt aatttgttac agcaagatga tacttgagtg 39540 acaggctgct tctggctgag gcagcaagac ttgcatgcag gggggtcgtg gggcctccag 39600 aaggtcagcc tcccgtaaat cttcaccctg gctttggggt ttgttcctcc ccaagcaaaa 39660 ttaaccagag gcactgctga cctttgggct tcctgggtgt agcgttacga agcatctcca 39720 catgtttgtc acagctagaa tttgacaata aaaatttgga cagggagacc ctgccagagc 39780 cactgacctc tttccaatgt gacaagggga aaaaaaacaa aaggaaaacg cagcacgggg 39840 tgcggtttca gttgaagttg gaggacacgg agcccagcct gtctcgcatt tgctgtctat 39900 gtagactcac taaagcaagt taattcattg ctctttgacc gccaagtctt tcgttgtctt 39960 ttgttgttgt ggaatggggg aaagaaatac agaatgggga ggagaaccta attagaaaaa 40020 tcaagccttg agagctccca gccatggaga aagaaaggga ttttttagaa gttgtgattt 40080 taatatctgc tgcaatctga tgattcatgg atttaaaata acccttccag gtcaccagga 40140 ccctgttact tgctggcttt gtacctctca aaggtcattt gttggcttcg tctcttaaca 40200 atttccatgg tagacctaaa atttctggct gtgaaatccc ctgtgtagtg ggaagaagaa 40260 atagcaaatc ttagctgcct tggacctgat ataattattt gtcttcattt acatggttta 40320 tccttcaagg ttgaataaat gatgtgggag ctagtcaagg ggctttaggt atgtgatttc 40380 atgcctactt ttttttaggt agagaaactg aggtcacagg gtactagaga atggactcta 40440 agattcaggt ttctgaattg cctgtggttt tgttgactca actgctcttc tgttgttttt 40500 tagccacatg ccttgaaaca gtcctctttc ccatgtttct tcatcagcac cattaaccca 40560 aggtatactg tcctctctta tctttcacaa ggtcttggag ttcccatgcc tttgtaagca 40620 tccctccccg agattcagca ccaaccaaaa tcacatttgg aaaaattgct tgtttcccaa 40680 gaagctttgg aggatatgat tttgtataga acgggttcac aggttttctg ttcattcttc 40740 tatggtggag tgtgtgtgta tgtgactctg tcttctctcc attcctcttt tttttttttt 40800 ttttttgaga tggaatttcg cttttgtggc ccaggcttga gtgcaatggc gtgatctcgg 40860 ctcactgcaa cctccacctc ctgggttcaa gcgattctcc tgtctcagcc tcgcaagtag 40920 ctaggattac aggcatgcgc caccacgtcc agctaatttt tgtattttta gtagagatgg 40980 agtttcatca ctttggtcag tctggtcaca caaactcctg acctcaggtg atccaaccgc 41040 ctcggcctcc caaagtgctg ggattacagg tgtgagccac cgcgccaagc ctccccatcc 41100 ccttttatct cttaaatgaa tgtggtcacc atcaaagatg gtgcctgact cttttttgtt 41160 ttcagttcat cttaaattca catataattc acacgtcata aaatgtaccc atttaaggtg 41220 tacagttcag tggtttttta gtctatttag tatatttaca agattgtaca aacataccag 41280 tatcttaata tttttatcat ccccaaaaga aacactgtaa ccctagcagc cagtctctac 41340 ccgccttccc catagctcct ggcaatcact aatttacttc ctgtctctat gaatttgcct 41400 attttggtta tttcatataa aaagaatcat acaccatgaa actttcttca tctgccttga 41460 agttagcata ttttcaaggg ctaccatgtt gtggcatgtg tcagtactcc atttgttttt 41520 attactgaat agtattccat tttatggctg taccgcattt tagttatcca gctatcggtt 41580 gagacttggt gcattcttat cccagaacat accatattca gctcccagtg acacccacat 41640 tcattcctgg gctgctcctt gtcttccagc tattttcctg gtctcctgtt gcctctgcct 41700 acttcagcat gctgtagaga catgggtagt aactaaaaca ttccaattaa ctgcattgta 41760 cttggccttt ttataagaag cagtaattag aaaatatggt ggccacaaga ttgatattaa 41820 agtgaaagat tgtaaatact tttctgcctg aaggtagatg gcctctggcc tgcctcttag 41880 tgggaggttc ttccaggagc ttgcaagcat ccattatttg ttagtcatca gcttagcggc 41940 caaggagcat tagcctgtct tgctctgtct gctgaagact ctgagagaca tgggagggca 42000 agggctgctc cttttgaatt cttccaatgt cttcatgtcc tttaacctcc tggcttaggg 42060 acttgtgtgc tggtggtgga gctgacattt gtttggaatc cacagccctt tgggtgggac 42120 tcaatcttgg ggttgcctga agactttgag atggctaggt ctgggcctct tttggtcact 42180 atggaacaag actgtctcag aggccagagt ctgtctcacc agctccctgt cttgggactg 42240 caccattgca gggtctttgc cctcccctgg agatttctct tcctgcctgg gcacccattg 42300 gccattctgc ccgtaagctc agtagggtgt aggcaaaaga gttctggcct ggaagtacca 42360 aagtcctgcg ttctggtttc agtccctcat aactgtgtat aactaagtca cttagttttc 42420 tgtgcctcac tttcttctgt tttaagatgg atttggagat tattggcttt gaccacctaa 42480 aaaggatgta gtgacaatca atttagaggt ctaaaagagc ctttgaggaa gtaaaatgga 42540 atcttcaaat ggactacatg ctgattattg acactgccct agcactgata gttgatgttg 42600 actgatggtc agaattgctt ggcaagttgg aaaaaagtac gtacagatcc tgggccacta 42660 ccaagtttca tttaacagat ctggagtgca tcaggaaaaa agtccctcta aacaagccag 42720 caaggtttgg atactgtgca accttttttt tttttttttt ttccttttga gatggagtct 42780 ggctctgttg cccaagctgg agtgcagttg cacaatcttg gctcactata acctctgcct 42840 cccaggttca agcaattctc ctgctttagc ctcccgagta gctggcataa caggcgcctg 42900 ccaccacacc cagctaattt ttatattttt tggagagatg gggtctcacc atgttggcca 42960 ggctggtctc gaactactga cctcaaagtg atccgcccac ctctgcctct taaagtgctg 43020 ggattacagg catgagccac tgtgtctggc cctacttacc ttctttgtgt taattcctgc 43080 accattgatt agcttattgt cccattgact gtgtctttag atgacttctc tgggcctcag 43140 aatatctagt ccatagctga cacagagcat ctgtttaatg gtaaatgctg caggaatcca 43200 tgcattggag tagaaagagt tttagatcat gttcctcatt tcttgctaca gacttaggca 43260 aagcgtggag aagaggttgt ccaatgaaga aatgaagtga catgccaggt cagtggcaga 43320 gctaggcctg gaaaataggt ttccagactc ttccctttct accatacttt tcctgggagt 43380 acgcactcgt aatttgaaga gcgacttttg ggagagggtg gaaggaaggc ctgggcctca 43440 gcctaagggg cccattggtt gtgagaggag ggtctggtga aattccatac cgattgtccg 43500 tgtgtgagct gctgtaccat agcctccctg cagaaccact aacctgtcaa atgcagaaat 43560 agttcaggga cagagctgtt aaaggattgg cgggttaaag aaaacagtga atcccaagtt 43620 ttgttaattg gatttttttg tttgttagtt atttgttttg cttcattgtc ttcatcacac 43680 caggggcctc cttaaatctg gtggaaaaat ttccttggaa aacaattcag tgtttgtcca 43740 tagacttggg agggagagat gctagatgct ggaaagtctt gcttattact ttggggacac 43800 tgagatgttc ccttcaccat gtactttgag acacacatcc tggttgagtt caggcaagga 43860 tgcctaacag ttgataagaa aactgggaaa gatagaaggg atttgtaagg taagtcaggg 43920 tgagtgaaaa cacatccggt atgctggaga cctagatgct tgactgccac tcgctcctgt 43980 cacctcagtc aatctgggtc ttgctctgtt ggccttagtt tcctccttgc taacaggtta 44040 gttccacctt tctgcccatt tattttgtag ggttattgtg gatgtcattc tgaactctaa 44100 aataccctct aaatatgaag tgatattagt gctctttaca ttgttatgat taaaaatatt 44160 tatgagaaaa aggttaactg taaggatttc attgaaaatc ttataacaac caactgatag 44220 agatagaaga taaggctatt aaattgttca cacagatgcc ttgatatcct acctttttcc 44280 ccctatattc cttttatgtg agaaatgaga tagtgattta agggaaaaac ttaaaagagt 44340 tccgactatg ttggtttttt ttcccccaag tcaaccttaa tatcttactt aaatcttttt 44400 cttttttatc ttttcttttc tttttttctt ttccctccct ccctcctttc ctcctcctcc 44460 ttcccttcct cctcctcctt ctgctgcttc tctctctctc tctcgtttcc ttttcttttc 44520 tattcttcct ttttcttttg agaccaggtc ttgctctgtt gctcaggctg gagtgcagtg 44580 gcaccttctt ggcttattgc aacctctgcc tcctgggctc aagtgatcct cccacctcag 44640 cctcccaagt agctgggacc acaggcacgc gccaccacac tcagctaatt tttttttttt 44700 ggtagagatg gggtctccta ggctggtctt gaactcctgg actcaagcaa tcttcctgcc 44760 tcagccttcc aaagtactgg gattactggc gtgggccacc atgcctggct tgaaattttt 44820 ctatggcttt attctttctc caagtacaga gtctacccaa ccttctgaga tctttggttt 44880 tcttttccta ggtaactata gtacatactt atttatgtta aacaacagca atcacacatt 44940 tctttttcta tacagtcatg ctttataggc aaataaagcc tccgtcttag gctttctgga 45000 ttttttcaaa agatgcaatt cctggagtat gtttttactt agagcaaagc agcctagtct 45060 cctatacctt ctgcatctgc agaaaagttg gttaaacaga ctttgtaatg atgcccctta 45120 caattctgaa gggacttgtg aaatagtttc acagagtttc agtgttaggt atatttgatc 45180 aatgctaact tttggaaaac tttggtgcct gtatgattca gagggtaggg cagaatatta 45240 aattaatcac aacttcttgt attttaacca ttctgggtaa attgggattc cgtgacgccc 45300 aggcaaaatt atttgtttat agaagatggg ctgaattttc catcgtccat ttctgagaaa 45360 tgaggtaggt ttagaaagag acaatcaggc ctcttcttta acagaaatgt ttgtgtctac 45420 taggtgtgtg tcacaatatg agttcctgaa gaaataagtg tccgctattg ggttgtatac 45480 ttgtacttcc tattttctta ttttgcacat ttttctggta tttccctttc tatggtgagt 45540 ggcttctgat cgtctttcct tttgtaaagt gtaatgatat gagaatcata atcgtggtgc 45600 ggtcttttgt gttgcatatt tgtagggggt cagtatgaat ggcccgtggt gaggctgcac 45660 tgaaagatta ggagcagcca ccttgatgcg gaggaggctt agtgactttg gacatgatgg 45720 gctatggctg gctatactct cagctttggg cgcataagca gagtattgat tttgtatttg 45780 gttaaaacca gaagtacaac tttctggcac cagaggatta ggaaaattta acagcggaaa 45840 gccatcatga ggatagtaac caattaattc gatttttttg gtcagacatg gctcccacct 45900 gtaatcccag cactttggga ggctgaggtg ggagggtcat ctgaggtcag gagtttgaga 45960 ccagcctgac caacatggta aaacccgatc tctactaaaa atacaaaaat tagcctggcg 46020 tggtgatacg cgcctgtaat cccagctact cgggaggctg aggcaggaga atcacttgaa 46080 gctggaaggt agaggttgca gtgagtcgag cttgcgtcac tgcactccag cctaggcaac 46140 agagtaagac tgtatctcaa aaataccata attcgttttg tcttttcttt acttttttct 46200 ttccttttcc ttcccctctc ccctcccctc cttccctttc ctcccctttc cttccctttc 46260 catctctttc cttcctttct tttctctctt tctctctttc tttcaacagg gtctcgctct 46320 gaaccttttc cagtcagaat tgctcaggga tttttagact tccattctgg aaaagagggg 46380 gtagttattt tggtgagatt gtggtcttgt ggttagacct tgtgatgggg gcctcagcca 46440 aagggttcag gatttttttc caagcttttc cctcacaact tgagttaatc cgaaacgttg 46500 ctattaggcc accggacatg cttttctgca tgcctgtgtt gggctgtttg gattgaaggc 46560 ccagcaaggg aaggcaccct cgcccatctg acacaggcag gcctctacaa ttttattccc 46620 taaccagggc atgacaaact atggcccata gaccaaaatt ggcttgccac gtgctttttt 46680 ctggccagtg agttaagaat gactttttat tatcattatt attaatattt tttgagccag 46740 gttctcattt tgtcacccag gctggagtgc agtggtgcaa tcacggctcc tgcagcgtga 46800 aactcctggg ctctagcaat cctcctgcta acttttttta tttttgtaca gtcttgctgt 46860 tgttgcccag gctggtctgg aactcctggc cttaagcaat cttccggcct tggccttcca 46920 aaatgttggg actacaggcc tgagccgctg catccagcac ttttattatt tttaaatggt 46980 tgaaacacat caagagagga ataatatttt ctgacacagg aaaatgatat gaaattcaca 47040 tttcagtatc tgtaaataag cttttattgg agcacagcca tgatacaaga catatactga 47100 ctgcctgtgg ctgctttcga gttacaatgg ctgagtcgag tagttatgac agagattgtg 47160 tgggccgcaa agcctaagat atttgctgtc tggcactttg cagaaaaagt ttgccaaccc 47220 tgccctgaac aaataaaggg acaaattcca cttgccccgt ccatctgtgg agcagagtca 47280 ctgaaaggaa atactggaaa tactggaagc cacttggtgt tttatcaagg atgtgaggtt 47340 tcctggcaac tttgtcgcca tatcatcatc atcatcacca tcatcatcat catcatcatc 47400 atcatcatca tcatcatcat catcatctgc cctttaagtt ttctgcttgt ttagaaaaga 47460 aatttataca gagcccccag tagcagctgt aagggggcag gttcttggag cagcccatcc 47520 tcaacattct tgctgctgat ggaagattct caaggatgaa ggcccctcta tgggagcagg 47580 atcagtctgg ctttagtaga tgccaatttc tgctaagact atttcctaaa ggagcctctc 47640 ctcatttgcc ttttctccct gttttcattg ggggaggtgg aagaggagaa aaataattag 47700 agatgctcac ctttttcttt ttgctggcaa tttaacagtc ttttcagctg ctttgattcc 47760 tttcaggcca ttggtgttgt atatatttca agatttgctc acaggtccaa agcttaactt 47820 aagctccctg agacatatca taaaatatga tttggggaaa aaccctaatg ggccatgatc 47880 agaacattat tattcaacaa aggatgaaat gcttaagcca agatggcctt ctttctttct 47940 ttctttcttt cttttttttt aatgaaagtt gagcagactc ccgtccaaca gttttcaatg 48000 taggaattcc cacagcccca tttgattgca gtttgttgaa aagtttaatg tttttgtagg 48060 caattcataa tttccacatt gaacagcctg agaggaagag agctggagcc cactgttgtt 48120 tttgtagtgg gatggtggga actttttttt tccctccccc aaaaggatat aaaactaagt 48180 cagatggttg ggaaaacgtg gcacagggtt ccagcccttt tgtaaatctg agatgccccc 48240 tcctttaggt cttcctttag gacccaacag aatagaaatt cctgctgctt aatgtctcca 48300 ggaaggaaaa aaattttcct ctaggctgta atagtaccta atttcctttt tcttctcttt 48360 atttatttat tttccctatt aataagcacc aattgtagaa gatgaaggaa gctgggaaac 48420 ccatcacttt tggagaaggt taatagcttc ctttagaaaa tcctgacata atacttattt 48480 ccccaaaagg cacttcatca gcctgaatgc cagttaagat tcaaggaatg ggcttggatt 48540 tgtgtgtacc cagcggttct gtggcatcaa gttgcactgg gaaggagagt ttggggctgt 48600 cactgtggag tccctgcaag tcagcaggac cagggctgtc ttcctgcacc atctggattt 48660 ggttagctct ctctgggcag tggggccgag tctcatttcc tccaacaata atgttatata 48720 ggcaatgatc ctgggctgcc ctaacataat tgaaaattat gtgtattgta ggcttggagt 48780 gctgaaatgt gggctcataa aaatatgtgg tgcaggtagc ctatggagat tggatgtggc 48840 acacaatgaa gcttttatgt aaagtaagaa ttataagtct ccatgttaat attgtattat 48900 gagtatgaca gttcttgggt gggtcctcag ggcaggtctg tcaccttcaa caaagcccga 48960 gtttcctaat tctacagagc tggtatttgg atgtaatcaa atcggttttg caggtggcca 49020 aagatgaaaa cttgtccacc aatccagctc tccccactga gggatagcat gggatgtaga 49080 tgggtttgac tccatttggc atttttgttc acgggttttt atgagatgga gaggtgagtg 49140 ttggtgggtg tccattttgg ttggcctcaa ggaaatgact ctattgagtg gttttgacca 49200 atgcagctca tatagttatg tggtaagtga gaatgggaag aagttgggat gagatggggc 49260 agtttagatt cccagagccc tctggcctgg gttacagatg gagactggaa atatttactt 49320 tagtggttct caacttgaga tgatactgct cccagagaag gtatttggaa gtgatgagat 49380 ggtaaggata accaaggggg ttcctgttgg tatttactgt ctgggggctt ggagtcctac 49440 aagtccttca gtgtttgggg cagactcccc acctaatacc ctgtcgcaga taggacaact 49500 cattcagtac acagatgaaa aaaacagaga tcactgaagc aaggggagtc gatgcagggt 49560 cttgtggcaa gatgcagaca caaccggact aataactagg ttgctcacca cgggaggcct 49620 ctaggtgaaa gctctgaatt tgtagcagac acacccacct cgtatagatc ctagacgtca 49680 tgggaaaatc gactgtgtac tttggcaagt agttcttggg caatgatctt ccagctttag 49740 gtataaccaa atttggtttg aatttgccaa gcagtcgtat cttcgaggaa ctccgtcggc 49800 tggcttgtgg atggctttgg cacttctgtc tctcgtggga tttgtgcaaa cccttctttc 49860 tgtattatcc tttcctgtct tttttctttc tattgaaatt gttctgacca tcaagaccta 49920 actctgtgca gccttcccca gtctattgtc ccagaaattc tgtcatcttt cttggcattt 49980 cctgagtccc tgagtctctg tcacagtgtc accatgttct gtcttgattt acctgtgtct 50040 gtaaggctcc tcatgctggc aaaactcccc gagagcggac atctttgtct ctcctagtgc 50100 ttgtcacagc ctgtacacaa agcaagtagt actcagtgtt cattgagtaa agttttctat 50160 agaattaata ttaaaaccag ccatttattt tgcttgagga ggtctccgaa atgaccaagg 50220 tgtctcctta tatcttatat cccctccaag cattcattaa ctgatggatt agtgagttgg 50280 ccttgagaag cataaaggct cgtctccatg tgcttctaag cattgtgtct aagttctgtt 50340 tggtttcctg agtgaaactg tcttaatgtt accaacagaa gttaaatgcc taagagtttc 50400 ttatacatgg gctgagtacc tctgtgactg ggcaagccac ctcacctcat tttaccttgt 50460 ctgcaaaatg aggaactggg tcaactcatc gttcaaatct cactgaaagc taattgatcg 50520 cttttgacag aagtagctcc cttgggccgt atatttattt cctagcttgg aggaaggtgg 50580 ggacagacag aattgatgta cacctttatt tttatctcta tggtaaacct gtgcatacta 50640 aagcattcct ctggtctttt gagatgagtg tatacattgt gtctggccct gtgcattttt 50700 taccaagaag taagttttgt tgagtaaact tgggttgtat gaagaactgc atgctcaccg 50760 tactcaagta gcttttgcta cctaaaggac agctgctcat atgtacttga cttcctttaa 50820 agtgaaggat gatgacattt gaaaaacgga ggttgaaaag gagcagattt ggaattgatg 50880 gtttcctagg acacttctgg cttgagattt gtgttttact ttcttccttt ggaatagctc 50940 tatattcttt cctctccctc cccacctctc ccactcccct ccagccccca ccaagttaag 51000 gtagtagtaa tgaaatcatt ttttctgaag ctaccctgta ctttgaatgc aaagacaaaa 51060 aatacagttg ctagtaacat taatcttcta tatgtgtact tactgaactt gagctctgag 51120 gaagacccta ttggaattgc atgctttttt atttttttaa tgattatttg catgcttgta 51180 tgtttttcag tttctgaccc atgtcacagt tatttcttgg gctagttgtt ctgcatttac 51240 tttctgaatt cattgttttt catttcactt ttgtttcctc tcgccagtat ctccagatga 51300 aatggccact gcttgatgtc caggcaggga gcctccagag tagacaagcc ctcaaggatg 51360 cccggtcccc atcaccggca cacattgtcg taagtaacct cccagagatg atggcttcct 51420 ttattgaggg ggtgaaaaag aaaatgcttt tttgatgata acaggcctta tttgtcattt 51480 ttttctttct ttaaacacat tttctttgga aatattgttg ggtatagttt atatctataa 51540 ggtattcatt ttctgctatt ggaccttaat gattgtaacc tacctggaaa ttttacaaac 51600 ctttcctcca ctcttttcca tgtatttggt taaaatctag ccttgtgggc tctagtttat 51660 aggacacaat caccatggta tggaggagac tagaggtggt atcaaagcag ttataaaaat 51720 acattcaggg caggtgaagt gaagaagagg gaattagaaa actcaaaagg gggtcctgga 51780 tttgaaactt gcctattatc ctctccccca atttatctta atatttgttg gcaacattct 51840 acactaacat tagaaaaatt tcatctgggc tggctgactt gtaaacctag agtagaaatg 51900 aactttgaaa ggctaaaatg gaatttaatc tatacatcca tggctttgaa agtatgtagg 51960 tttgatagag aaagcatttg tttttagtac taagagacta caagtgtgtg tctacatata 52020 tttttaatgt attttcttag ggttttgtag gctctaagag tggaatttat aaattaacct 52080 cttgagaaga tagctcagcc ttatttgaag attcccttct atgtatttat atcatgagct 52140 ggacttcata cttttgaaat aattaatgga aggcatattt ttataatgaa tccatccatg 52200 acaggtagaa ttatgcaaag catgaatcaa tcatgggttt ttcatttgag tatcacaaaa 52260 tgttaatcat aaatacattt tgcctctata ttgtaatttc taaaaattgc aaaataagtt 52320 tcttaagtag aaaaatctta agatgcattc tgccattttg ggctaactgc ctccttattt 52380 tggagcttgc tgtaattgag catgtgttat ttaatgagtt atacctctgt catatgtgtg 52440 tgtttatatc acaaaataac ttatttttat aaaaccatat tttgagtcat catttgtgac 52500 aatgtcttct tttctctggt ataaatgagg catgtagaaa gaagattgac atttgctaga 52560 agcttcccct ttcctctaac tccacaataa aatggatgct cataattaca tctgctccta 52620 taaggtcaag atttcagggc tggaagtgac cttagatcat ttaggcccaa cttgccctca 52680 ggaaaggaaa ctgaggccca gagatgcctt aagtgaattg cccaatgtca cacgctgagt 52740 cagtggccag agcaaggctt ggatccagtt ctctgctccc tttccagagc cttgtgatgt 52800 cttctctcct acaggaggtg aaaataactg ctgtggctgg ttctgttttg ctgactgtaa 52860 attgggtcat ggtcagggac agtgcatagg tgtaaagaag ttgctggttg ggggttctaa 52920 tgcaggtttc tccaaaagtg aatgccctgt taaaaaaaaa ttcttaacaa atatacagag 52980 attttttttt taaaaaagtg tgacagttct agacacctag agagtaaagt gaagaagcct 53040 gttttcaggt ttcccgcctc cctgaatttc ccagcatggt ccaggctttg aaatttattt 53100 atctgctttt ggcaatggtt gatgggaatt tcccacattt attttttagc tacagagaaa 53160 ggacattatc tttaaaatct cttcgttgtt ctctctcttt gagtgaggag agaagatgtg 53220 aatcctggca gtggttcaga gtggacacag cccctgtgtt tgtggcatag gctctgtggg 53280 ccccatgcca gggagcagta cccccgtgta aaggagtggg ggtttgtcca tttggataga 53340 gcaaagatcc tccacctcaa atcccacaag aacagttgcc acaacctggg ccctaagcat 53400 ctcattttcc tatgtagaaa ttaatgatct ggaggagatg gcaaaacatt ccttccagag 53460 cctgtgtgga ttttggccag gggtgcagca agggggctta ggcacctttt tcctctgctg 53520 tgtcttagca ggcgtgttga ccatagcaac tcccctgggg catacacacc ctcttgtaga 53580 tggagacctt tgtccaaagc agccacagct ggcaactgtc tacaatcttt tgggctttct 53640 gctgtgctca aggggatctg ggaatggcca ttgcctagag gggatgggct ggtggaggaa 53700 ggtgggctct gggagccggg gagaagggaa aagccatgaa tttggacaaa aggacaaatg 53760 tggtttacat ttgtgaaata cttgaatgct tgtcatgaat ggtgactttg gttctatgag 53820 tcagccctgt gatggggtat ttctgcagtc ttcacctgac accaggggtg agaaggagga 53880 tttctgggga ggaggaaaga gttgagggag ataggaaagt agagtggaag aaaggccttg 53940 cgttgttgac ctctatccac ctggtcacct atagtttttg ggattgagga tgcatacacc 54000 ttgagactac aaatttatga ttatattttt gctgaacata aggcaatgtg ccaaccaaaa 54060 ccagctgttc tttggctggt acagtgtgtc tttgtttgta aagggtgcat tctgaatggt 54120 ggctgataca tcatttgggt ctttgtacag ttaaacattg gccagagggt ctggttcgtg 54180 tttagagtcg ccgatgaagg gctaactttt ctccagacac ttggggctct tgttcacact 54240 ttgcttttca ctcttttaag taagacatag tcacatcaca gtgtttcatc agacatgttt 54300 caaaataatt gtctaaggat tgcttcttaa tttccccgaa atttggaatt gttgtaactt 54360 ttgggccaag ctatttcata attatttcta atgtctcgct tgaagaatag ggatgtattc 54420 agtgttgatt attaatcatt cgaaactaca actttacaga ttgctaagaa gaataacttc 54480 ttccagtacc catatggggc agaatcttca cgtgggaatt cagagcattt tgttggacta 54540 ttttaatctg attggattat tttcatgtgg tatgtgggtt accacattag aaacgattga 54600 tgtgtagaat aaatgttctt aacaagtgga ggtcaactta tcaaatgata tttacattaa 54660 gaatagactc cacaaatttt agttcctgta gctgatatag catctcattt gttatataat 54720 ccagtgattc ctaatctgtg ttcagaggag agaggaaatc gattgcaaca gggacgatgc 54780 cttcattggc tggcccaaaa ctgggagttt atacaaggcg tcagtctttg ccttcctcct 54840 ccctgccttc cctcttcctt cttccttccc catactcccc aacaaattca tggacttctt 54900 aacaactcag agacattagc cacaagttcc aagacacccc caccccccag cctccccagt 54960 cctattttcg cattcatata actaaactct ttttctttct tggtggagtt ttgaaattta 55020 tatttttaat tctttgctcc cttttttcct cttacaaaat gagtgccaag cagctaagtt 55080 gtgctgagtg gtagagtttg agtcagtctt ggctggtaag ctgtggggtt aggagccgct 55140 ccctggatac cacctctggt gtctttgcta tacaaagact ttcatttagc ctcctttgta 55200 tccagcaaaa aaagattcag tacccaaaat ggtggtattt tggtatagta tgtatcttac 55260 aaaacggcaa aagacttcaa aagttcctac aattttatct tgggggtttc cttttgaagt 55320 cgatgtagaa ttttaccttg gggtggattt tttgtacttc ttggtctggt gtgttttgtt 55380 gtgtaatgag catggaggtg tgggataaga aagcagactg aatcccgagg aacaaagcct 55440 gccagactgt ggtggtgtac ttttcttgtt gttattgctt aaatgctgca agagagtgga 55500 aaactcttac gaaataatgc acgatgggta gaacttcaga gaaaatctct gccgtctacc 55560 ctgtgcattt tcgaggaagc tcagagggca tgctgaacct ttgctttttg tttctgaaga 55620 gttcagggga acctacccat aattaatttt ttaaaacact acctagagag caccctcttg 55680 gttattaaac acatgcgctg tttcgatggg atgtttgacc tggattgtgg atgcttgctg 55740 ggacgtggca tgtgttggga ggctctgtgc tgcctgctga gcaccagcaa agccacagtg 55800 gcccctacct ctgtgggagg ccctgtgcca ggtgccctca aagagtaggg ggcccatgag 55860 ggtatgacca gggggacctg atttcggctg agaagttggc ggggattaca ggcctgggcg 55920 gctccctgag gaaattgcat taaaaatgag atctgaaggc ttgattgggg ttggcccaat 55980 gaagggatag gagaagggat ggggagtggg cagaaggaaa cacatgtgtg aaggtcctca 56040 agggaaaagt gcttggcttg gacagaggca ggaaatcagg taggaggcta gaggtcgggc 56100 agggctccgg gagagtgact tggggtgcag catatggtga ggatctgaca ctggggagtc 56160 atttgagcag gttggctgtt tctgtaggag cgtgtgttaa gctgctggca gtggggatgg 56220 tgaaaataga gatgtggagg aaacagcagc ggaacttgct gacaggttag atattggcat 56280 tgagggagaa aggagagtca aaggtaggta gatggagatg cttcactgag tggggagtat 56340 tggaggagga gcaggtttgg ggtggaagcg ttgtcctttt agagagattg tatttgccat 56400 tgattgattc attcattgtt tctgcaaata tttagtgtgg gaaaaagcat gctagacacc 56460 aagagagagt ggagtcaatg aagaacgata acagcaacaa agactgtagc gcttcctatg 56520 cgaggcttgt tccagttgct tcagaggctg tgttacccct gttctagaga ggaggaacta 56580 ggcccaggga ggtggggatt tgcccagtcg tgggagtcag gatgtgaaac aaggcaccct 56640 ggctccagag cacaccgtcc tctcaaccac tgcagagaag ctgggaaaga gacaaataag 56700 tgggtgctta gagcacaatg tgtgtggtgt gccaagagca gctgggagcc ctgggacccc 56760 cagggaaccc cagccccacc tgggcatggt gggcatggct ggaggaggcc tgctggcttt 56820 gctggagagt gggacatgca tcaaggtggc cagagactgg gcttctgggt gtcgtgctgt 56880 gactgctgca aagggctcat tgacatatgg tggggagggc cagcgtattt tctgcgggca 56940 ggacatttgg gggatatggg gtgtgaccct gtactatcta aaatctttta cttctggatt 57000 atctccactt tctctactgc atatatactt tgtttttatt tattttattc atttatctat 57060 gactcagcca gactctctaa aagagttgac ttgtgtttcc tagcagccac tgagtcagaa 57120 ctttcccatt tcgcagtcag ggctgtggtc agggtgtctg tgttgtctaa ggatataaag 57180 caagccttcg ggcactacca aaacattatt ttataaggag aactatgagt acctaatagg 57240 aagaaccagg caatcaggtt atcttttggt gaggaagaag tggtagatgg gatcattggt 57300 gctttgaagg gagtgggtgg tgtagactcc aaagtgtaca tggggccatg atagagtcta 57360 tgtcagatgt ccaaagcttc cttctctcct cccagaaact ctgtcctctg gtgaagagtt 57420 ttgaagtttc ctgaggtttg ggttcatggt gtggcaggtg ataccatggc aatagaaaat 57480 atcccatcaa gaaggattgt gtgacctcag ttgtagcccc tgcatgttgg aatcacaaca 57540 atttgcaggg ccttaaaatc aaatgccatt tcaccaactg ccctcccccg tttttttcag 57600 cactgtttgg tagctatctg tttcccctga tattcttgga cacttccaga gatgggggct 57660 ctatctcctg gtggtagact gtttcttttt ggtacaatat gaactcttaa gagagttcta 57720 cctttaggga gctgcagtct ctctcctgga aatgctcaac tccttaattc atgttttgct 57780 gttaaattct gctaatgcct caccttacat gtcttgacaa tttgaaggta gctattgtat 57840 tccccgcaac cccaagtctt ctcttcaaaa tgattattaa ttgtaattca aatcatcagt 57900 gactggtatc ttagactact taaggatggg aattgctaat tttgtattta aaagttgtac 57960 ctctaaagta agtgaaattt atttttaaac gtagctttct tcattcataa agtttatgtt 58020 cattgtaggc agtttggaaa acagcccata atctcaccac tcggagatta cattgtgaat 58080 aatttggtat atttcctttt agaaatatac caaattatcc ttttttcctc tgagtgtatg 58140 aatatttata tttgttttta acatacttga gctcatagtg ctcagtattt ccaacgttct 58200 gtttatttaa gatgaaaatt gctgtagtta ataagcactt ccccatgtca ttaaaatgct 58260 taaggatttt taatgaccac ataacagtcc ataatatgat taaaccccaa tttactgaat 58320 caatgccata ttgttgggtc tttagattgt ctccttttgt ttctgctact gtgaatgatc 58380 ctgtgatgat catctttgtg tgtaaatctt tgtcccctcg ccccctcccc ttttattatt 58440 ttcttgggat agaccccagg acaaaaggta gaaaagaaca aagtgttaaa aaatttcttg 58500 atacatagcc acagattatt ttcctgaaag ttctcaacat ttataactac gagcagtatg 58560 taagagagtt atggttggaa tgattttaat gtctctgggg aatttaacaa caaaaaaact 58620 ttaggcttct ttggagagag acatgccctt aactccaccc cgccctagaa cagagaccca 58680 gcccatccaa gtcagcctcc ccaggtcctc caccttcaaa acaggcaaac gaaatcattt 58740 cttgaataat tggtaggctt caaggtcaga tgtttatttt agataattca cagcataaat 58800 ttatatgttt taggtacctt agcccctgaa tatactcagt tcatttagga ctattttaga 58860 ggtcttgagt ttactcttat aacctcacat ttttttgtga atttttagtt ctattatctt 58920 tgttttcatg gcatattatt gggcaaagat actatttatt cgatgctatg tgtgagctgg 58980 gtcaggatta tgaccctgag ttatgtttct gggaaaatgt acccacttgt caaagatgcc 59040 gttggctcct gtgattaagg tcagcccaca atgaatgtgg ggagggctgg cagcctctca 59100 aatcagctct tgaccatttc tcaagctggg gcctgttgtg cttgggggaa gagtctttgg 59160 cagctcagct cggggctagc gtttcctgac atttgtttcg ctgaatgtta acaaggttac 59220 tggaaaaaag ggttctctcc taaaataggt ttagggaagc actgggatat gcgaagtgaa 59280 tgagtttctt tagggcagga tcttgactct gcagggggct tggaggcctt ccctagagtg 59340 gggcttccta acactgcaga gctcttccca ggacgagggg caagattggg acctactttg 59400 gaaggttgtt tttgtttcgg cacctgctct gtttacgaag cgtgggagcc tgttttaaat 59460 taatgtgcgc ctacttagag ctacactcat ggttttgact atgtttatct ttccagtaaa 59520 taaaacaaaa ttgttcattt ggcacccagc ctgtcctgct tgtcatttct tgtcttgctg 59580 attaactcta tggatggggc atgtttctcc aaccagattg taagtttctt gaagccaagg 59640 agccctgtgg ttgatttctt cacatgtggc tctctctcct cccacaatgg tgcttcgtta 59700 attaagcaga aaacccatct ctggttaggg actggagttg atttcgtttg gaatgagtgt 59760 gacttcatca tgacctgaaa gtgttcagaa ccatcttggt tagcacaagg gcgtggacgt 59820 gtgtctactt tctacctgat gggatagcat gtttaatttg gggttatgac actgaatggt 59880 ttgccagtaa cttgctaatc caaccttata cattccagct cacagtggag cgtgtctaat 59940 tgccacagca gcatttatgt ggaacgtggt tgcacaaaag ctccagaaag tcaggctgag 60000 ggctcctatc tctcctcaat cttggtttac gatgtctgtt tctgaggaat cctgggatgg 60060 ggccactggc tctttaagag agagcccgat ttggaaatct aggacttgat tgttgattat 60120 gggcaataga tacattttaa gaatgatgtt gtaggctgta tgaagtcatt tgatgattgt 60180 tttgttaatg gcttgcaggt cagattttca tctttttaaa ttaattatca tagaaggaga 60240 aaacaactgg atttcagaat tgtcccttga ggtgtactgg aaactaaggc gtgagggact 60300 cataggggtc tggcttggaa agtgtattgc tatgtccagt ttacacataa ggatgtgcaa 60360 atccagcagg ttagctgagc tgcccaggaa tatccaggca agaatgacca tattctgata 60420 attactcagg cctctgcctc atctccgctg cccccccgcc ccctgactct cttctgagtg 60480 ccagattcag cctccatttg aatgccaaat agacaggaaa ttagcatgcc cagaatccac 60540 gtctttagtg cactctctcc ccagctccaa acctgttact gcttgtgttc aacatctcag 60600 taaagctcaa caacatcgac ccattactta ggcctcaaac cttgggtggc atcgtcgatt 60660 gctcttttct ttcatacccc acattcaacc catcagccca tcccacaggc ccaagtgtgt 60720 cctctctacc ttcaaagcgt gtgtggcatc caccgcttat caccacctct gccattacca 60780 ctggagtcca gtgccatcat ctctcacttg gatgtggcca gagtgtcttt gctggtctcc 60840 ttcttgcttc ctacctttgt aacagcctat catctatctc tggtctccat agctcactcc 60900 catactttga gagggccttt gaaagcctta gacagatcat atcacagacc tctatactga 60960 aagtcgggat aaattttatc tctggaaaga gtcccaaagc agcgatgaac agatattttg 61020 tcctgtcact tgatgaagag gtggggcttt gagacccaag agcttagaat ggagagccta 61080 gatgccacta agcccaggca ctggccatgc ttcgagtgga gcttttgtgc tggtggagga 61140 gagatggctg ggggacacct gtaggctgag caagtccccg ttcatcagac cctggctcat 61200 ccagcagggc gtggctgatg ttttcaatgt tgtatcctga gtgggaccca gatgcttccc 61260 aactgtgcca catctgagcc ctgcatgcca tctgtccagt tgcagcctga ctgcaatgtg 61320 aggctgctga agagctctgg atggtgtgaa gcaatctgtt ttctagcccg agcctgcata 61380 gctggtggat cctggaccgt gattaagtgc atcacctagg cttcaatgag atggagtcac 61440 tgtgtgtcca aacagtggga taaaggcttt actctttgtc ttcctgctct gagggcacaa 61500 gctgcttgtt tctctcacaa ggacaccgtc tgtgttgctc aggtgctggg gtgaaaaaaa 61560 cagcaagcat ttgaaaaggc tgaagaagga aagaaagctg agagcggtac agccttgggg 61620 actgagccat cccattgtcc cagaggtggg ggtgttatca agacctgttt ttgagccata 61680 cctctgactc ttcctggaaa gttagaccca actcaagaac acactaagag aagtgtttcc 61740 ccctagccct ttcagattga aaggagacgc caaccttgat gggtggaggt agaaaataaa 61800 gtcccaaaac agtgtcttgt aagcgaaggg gaacatggct gggcagaggg cttctggtga 61860 aacttttggg agtattcagt tggaactcag gaaaaaaaaa ttgttttttt ggaaagaggt 61920 agcagccccc ttcagccaaa gctcataaat gaaggaatgt ctgagactca gaattacagt 61980 gaccaaggca agacattgtc aaaggctgaa taagtgagtt tgactgacag aggccatctc 62040 catttttagt atatggccaa gcatctttcc cacagtcttc cttgagcccc ttcccatccc 62100 acttctgaaa agcactgagt tggccattat tatgcttttt tcttaaatta tgaagttgtt 62160 ttcaggtatt gagaataaca cccaggtgct gaactcccag cataagaaat caaacattca 62220 aaatggagta aggttctgaa gctgacatct gtctctacac attttttttt ttctgataat 62280 ggcatttcct atctccaccc tcactctttt tgttgtggtg aactacactt cccttgttcc 62340 actcggttct gttgcacatg tgattaggca aggggcagat atgtgatatt tattatgagt 62400 cttttccacg cagagaggat ctaaatctgg ctctttgcaa ttgccttcat acatgtgcat 62460 acacaccaca cacacacaca cacacacaca cacacacaca cacacagaca catacatatg 62520 cacacacccc gactcaatgg aggaccctca tttgtagaag ggtaaaatgg gtgaggcgga 62580 aatgcctgta tggcaccatg gagttctgtg tagccagttc taatcctggg ctatttggta 62640 aggaatgaag ttggagatag tcttctgtcc cttacaacca aaggaattct aactaatagt 62700 ttgccaagtt ttatgtttat aataaaaaat gacatgcttt ttcttttgga tttttaatgc 62760 ttttgaatta aaaatgctag aacatgaact gattcttcta tcgctattta gatagagcct 62820 tgcaagagca gagcacgcat gctttcttta agaacaggtt ggtttgtggt cgtctgagga 62880 ctgttttaag gagacttatt atacacaatc atcccccaca aatgatttct aaagagaggc 62940 tggtatgaaa gaaggagttt ccatgattct gtcctgtggt tctggggaat tctgaaaatg 63000 aactttagat atttttgtga aattcttatt ttcatatttt tggtatctca gagttttctt 63060 ttctggcttc tgtttaacat actcttcttt gccctaaatc tctcttattt ttgctccttg 63120 ggacaactga agaatcctta gataattaat agtatgaaat actgcccttt tagttgaaaa 63180 atgtcacaat aatgtaataa gataaataag gaggtgtcgc tttaacctgt atcgtgtagt 63240 ctcctctact tactaacact tacttgtatt actagaagca ttatttttta aatcatggaa 63300 aattggtggc aagctgagca tacagttgtt tatttctgtt tgactgatta ttacaacttc 63360 attatttgat gaaggttctg tacgttttcc tttaagacac atagaaattg tgagaagatc 63420 ctgcagcccc gaaaggctac agtgttgatc caaggactct gagccgagtg cagggtttgt 63480 acttggacct gcaggctggg tggcgtctgt gggagcagtg tgttgagaga gattctgagg 63540 ctgtatgtgt cagggcctcc aggggaagga tgcattgatg gattaatttc tgccaaggct 63600 gaaagaggag agagtaagag gctgtagagg tgtcacagct gtcattgctg ttttaggcag 63660 tcaagctttt gggaaagtgt cagaaattga gccccctact ggatctatcg gagccctgtc 63720 aaatgtccat ttagatgtcc tggtgaacaa aagttctctg actcaccatt taaaaacttg 63780 ttccaaatga aattatggga gaaaggaaca tttttcatcc gaacccagaa tgaggatgta 63840 cccaaggaaa aggacgtagg ctcaggagct ggactgtggc tcagctggcc tgatgtatcc 63900 cactttgttc ctcccatggc tgggatgtct ctttgctctc catgacccat gtatcttgag 63960 gacatgacac atggaccaag cttgaactgc ggattcattt ttatgcattc tacctgtgaa 64020 tgattgcagc ggatctagtc gtatttctga gagttactca aactggactt cagcagtgaa 64080 ctctacagtt ctcttttcct cccacctttc tattagacat tgcatgatac aaaaatcaag 64140 atatttctaa gagggtgata acttcaatgt tatctaaact tttaatttgg aagaagaggg 64200 gttctttgtt ctttttaaaa agatacaaac gaacttcttt atctgattct ttttttggtg 64260 caaacccatg atgccttctt cctgattcat ctgctacact gtgagttcaa gcctggcgtg 64320 ggacacaggc acagctctca tgccaacgat ctcatggtta agttttggaa cataatttga 64380 aaaatgtaac ccattgagag gcagtaagga catacggtga gctagtgcgt gtttggacgt 64440 ctgtgtggaa taagtgagtg ggtagagagg acatttgtca aggagcggga gggcgggcca 64500 ttggcttggg ggaaatgggc tgagactcta ggggtggcca gcaccgcata cggaggccag 64560 cagggttggg cttggctaag tgctgtggtg tctggatgcc tatgtgagtt tcctccagaa 64620 gttttcagtt ggcaaagtag aacctgctgg atatgtagca agggtgtgga ttgtcgggat 64680 cctgctgggc gcaggcgtgt gataccagag gtcagaacag aagctgaggg atgaggcttt 64740 gggagctttt tgtcatgcac tgtcctggag cctcagttac tacaaagtct gcaaatgata 64800 gaccggagct ttggttctgc ctgatgctag ctcccctgtt cctgattttt cttttcaata 64860 ttagacttaa tcccagaatt cacatgttga aagaaaactt agaggtctag tgacataaaa 64920 gcctcatttt gatcgttaca gaactgatgc cttgagaaat ggagagagaa gtacacgatc 64980 atggtaatac tggatgttca ctgagcactc actagctcca ggccttttct aagtaattta 65040 tgaagttgtc aggtttaatc ctcacaacgc ccttatgaat gagctattgt tattatcccg 65100 atttggcaga tgaggaaact gaggcttgag gggaggatga cgtactcaag gtcacacagc 65160 tgggaggcgg caagctggaa gttgaaccca aggagtctca catcggagcc aggactctca 65220 cccttcagtg ttatgctgcc ttaatcaggc acacatacag gcggggagag gcaggtttcc 65280 ggacaccaga ctaggctggt gccggtcagg ctacaccagg gaacctggag gcctgtcatt 65340 cttttgtgat gctgttagtt cctgttgagg aagtgaggct ttgtgggttc ccaggaggaa 65400 aaggtatgaa ctcatggcaa aagaaaggaa ccaaaaaagg gagatttgca tcacaatgag 65460 ccttctattc atcctaaatt atacctcctt ttataccatg tgtgtctgca aacttgtggg 65520 taaatcacaa atctttctgg taagttacaa tggatggaag gtttttgcat ttctctcaaa 65580 tcaccaacca tttaatgcta tgtgtagtca ctccctaatc tatcttttgt ataaatttgg 65640 atctttgagt attggggttt tccatgatgt ttggcagttc cccttagggt gtctatctca 65700 aagtttgtca cactgacaag ctttggggag agaagttaga ggtgggcttc cctgttttta 65760 gtggctgtgt ctgattgttc tgtctgttct ccaggacagg agagattgat tgctttctag 65820 ctttttttaa aattaaaaca acaacaacaa aaaaatacag aaaggtacaa aggataacaa 65880 acacattcat gtacctgcca cctaaaataa caattactaa tcttttcacc ctcctagccc 65940 atgatcttcc ctcccaggct gttattaata tgaaaaccga gttcaggttt ttatactttt 66000 cgacatctat ttatattaac gtatgtatta taaataatct tagtagtttt taactttgac 66060 ataagtggct tcacattcca cataacattc tgcagcatgt tttcttttat ttttattttt 66120 ttctttattt ttaaattttt attttgcagc atgcttttct tattcaacat tacatttgaa 66180 ttttttcaac attgtacatt gaaatttagc tcattctttt taactgctct gtagtattta 66240 ttgtatgcat atactacagc tttctatttc tgtattgatg gttaattagg ttgcttacag 66300 ttttttaaga ttacagattc tgctgtaata accatccttt gggcaagtgt atgtaggtac 66360 ctatatatga gtttctctag gattcatacc aaagtagagg aattggtagg gcattggttt 66420 gctggtttta attttaattc acatgctatt gtcaagctct ccagaacaac tggatgagtt 66480 gattggatca atgagtattt ccatcaccag catataaact ctttcctcat aatcacacca 66540 atgcttgatc ctgttggact taaaattttt gccaatttgc tgggtatgca acggcatctt 66600 acctaatttg cctttatttg atgactcctg aggttgaaca tctggtcata tgtttatttt 66660 ctcctctgtg gcttgcctgg tttaatgcct tcttcatttt aaagaatcag atagttttct 66720 gttattgatt tataggaact ctttatataa gttgaaaact tgattatatg tgttggaaat 66780 actttttcta ggctgtgatg ttttaaaata ttgctttaga tgggttttca tttttacctt 66840 ttattttaga gatggagtct cactgcattg cccaggctgg attgcagtgg ctattcacag 66900 gaaagagcat agtatgttac agcctccacc tcctggtacc aagaggtcct cctgccccag 66960 cctcctgaat aggtgggacc acaggtgcac atcactgtgc ctagctttgg atgggttttg 67020 aaagaaagaa gttttaaatt ttaatgccct caaattcatc tgtattttcc tctgtgcttt 67080 tattttgtac ccactctaag tagctccgaa ttctgcagat agttggtgca ggaattctga 67140 ttttgagtgg acatctgctc tctaacagtc acattgaagg aaattaggtt tttttggtag 67200 gaatctaagc aaggggttga tttgtaaact aggctttaaa tatgatttta agcaactcac 67260 ttagaacaag atacaaaaat tgtggactgg acctatatct ggaaaacttg aaagtgctag 67320 ggcaataaat aattcttggt cacatacagc cgagatcctg ggctcctgac tctgggacag 67380 aagctttcta tattttatct catcagtctt tgcaacaggc tccttgaagc aattttatcc 67440 ccattttaga gataagaaaa ccagagctta aagcagttag ataatttatg aagtaagtgg 67500 cagagccaag attcaaatcc agacctttct gaccacaaag ctcgttgctg aataccgcgc 67560 ctcattgcct tcttgcgaat tacttgggat ttgtttgaat cccaaaatct ttatatgtta 67620 ttttaaattt gaatctaatt ggaagtgggg cagtgagggt agaggacaga aagaagggga 67680 agagcttgag actcaataat agaaacaaaa aacccgtctc caggagggcg gttcaaaagg 67740 aagaattcca tatttcatgt aactgaaacg ttaaaagccc aaataattgc atcatgcaag 67800 tctgatgctg agtaatcacc ctcccccata ttattgggga gagggggcaa gaagtctggg 67860 aagctgtttt tgcctaagga attacattcc aggggactct gaggatttag gtaaccacaa 67920 aagccattta tttcgagtac actgagattt ctaccacttt gatccctaat ccatagcata 67980 attaataaat gaaatgtgct gtagcatggg ttttttacaa agtgtacttt taaaatggct 68040 tttggtctga catgattcat ttgccacttg gaaaagcgtc atcgcctcag atgggcaggc 68100 tgggagaggc tgcctggtgg gtagctgagg gcggtttcct ggggcacagt tcctgccttg 68160 ggcctctaca gagcggtctc atccaaacat ctcccagact ctgcgttttc caggaagcgt 68220 gcagaaatag gaggccagta ctgaaatgct atctgctctg tgtatgtcag aagaccacaa 68280 accacttata acaaatgaag atctttttat ttgttcttat ccctttatgt cacttgagga 68340 aagttgctgt gagtaggtga tgatcattac agtgatcact ggttgcccaa actgagaagc 68400 cagacatttg gcttggtttc tctcccttcc tcttgtctct cctaccctgt aaacacatac 68460 ttggtgatta cccatgggga gacaagacag gctgggaata tatacttctg caacttcagc 68520 ctcctgggtt ccagcgattc tcctgcctca gtctccagaa gagctcggat tacaggtgtg 68580 caccaccagg cccagctaac tttttgtatt tttagtaaag atggggtttc atcatgttgg 68640 ccaggctggt ctcgaactcc tgacctcagg tgatctgccc ttctcggcct cccgaagtgg 68700 tgggattata ggcgtgagtc accgagcctg gccccaggca ataatatacc agtgggcaag 68760 aaaatattct tgctctcatg ggacttctgt tgggggtcag ggtataggga ggaaggcata 68820 gagatgaaaa ccagtaaata agtaacaggg gaaaacattt taaatacatt aataactaat 68880 aaaatagaaa taaatctgtt ggctacttaa caggatgtgc cacattccag atacattacg 68940 ttaatcctta tgatctttgg gggctaagta ttagtattcc attttacgga tgaagagact 69000 gaggctcaga gggaagggag gtggcttttc tcaggtggaa agccagacct tttcagtggt 69060 cattcagttc atagctaagg tcttattttc tgtgctctct gtcggctgaa aatgggcaag 69120 gtaatttcac atagtgacag gagccatgtc agagaaagag caggacagtg ggacagagag 69180 ggaccaggct gggggctgtt tgagatggag ggtcaggaag aaccaaacta agatgtgaac 69240 agtgggaggt gttggagctg tggtgcttgc ctagaaggac cctcatcgag caaatagaag 69300 cttctggcag gaagaagtta atgtcttgcg tgtgccctat gtaggttcat tagggccttt 69360 aaagggggaa gaaggtggtg gctataaatg ttacaatctt acctttggcc cctagggatt 69420 ctgtctttca accttggttc agtaacaact tgtgactgcc caacagggct tcctttcggg 69480 agagaatggc ttgttacatt caaatatgcc atgaaagtat caccatttat ttcagtgtct 69540 gatgccccag cttgggcagc ctgagcaggc tctgaatggg tctgaagagg ccctttagag 69600 tagagatgaa gagggggtgg ggaatcctca attctaaaca aagagtctgc aatgggaaga 69660 tggccaaatg ctgtttttgg agtgggtgag agggaaaaga aaggtataga tggttcgttg 69720 gaaaatgtgg ttttataccg ggttttggtg tcaggtcccc gagggcaaca tggactccac 69780 actgtgatcc tccgggcagc tcatagcccc agccccttcc ttttgcttcc tggtcagttt 69840 gtgagaagga ggggttgtgt ctccaatctg agcaataagg ggtctgaggg gggttggatc 69900 catgtggctt tcctgtgtct tgttccttgt aaaagttcca ggttttgggt cgtgagctgt 69960 gtgtgtgtgt gtgcgtgtgt gtgcgctgta cgttaatatg gagagatggg cttgggccag 70020 tgggaaatag agagacccgc aagcacagag tgacagggtt tgatagtaag cagcaggcca 70080 gcgttgctgc ttttattcct cggtaaatcc ttgcacaatg ccatatgctc ttgcattccg 70140 tagctgctgc atagggtgtg atttagttaa tgcccgctct gcaaacagga aacggtgctc 70200 actgctgtgt atgcttttca tggagataaa gtgtcaggag caagacccca aacctgcgaa 70260 atcactaatg caaccgcccc ccatgcccca aaaggtggga gtgggggata aaaagagtag 70320 gaaagtggtg tggggagggg aagctttagg gccataactc agacaatttg tcaggcagtg 70380 gcatcggttg ggaggaaaat attgatgtac actttttgtt tttgaacctg aagtttgggt 70440 tttttcggat gcattggagg acttttaaat gttttcggag tgccagagtt tggactgtta 70500 ggtcaccgta ggtaccggct tgcatatcat ttcagaggaa tattttcaaa actccataaa 70560 aacatgcggc tttcaaggct ggaccacttg ttcaggtcct cctcccaccc cccacccttt 70620 ttggcaaaac catgcaaaca ttggtattca aaaatatttt gttacttttc ttggcaaagt 70680 gttccaagaa ggaattgcaa cacagtctca gagttaggag gcaactttct ggggaaaagg 70740 cgggggttgg ggaggtttgg agtttgaatc aaaaacagac accgaagctt taataaaata 70800 aatgaagcgg agccctttca gctcacggtg gactgtgttg gtgcgcgggt caggctttaa 70860 cgtgcctagt ggaaattgac agtctgagaa ctgggacata aacaaaaatg tcagtccctg 70920 ggagtcttgt tcactggaca atgtctcaat tgttcctttg gttttcaagg cagcagggag 70980 agtggaatat taactgttta ctgcccaaag ctggctcgga aattgcttgg agaaggggag 71040 aaaaaagaca gaaaatcaca ttttttattt agaaactatt aaacatgtca gtaagagata 71100 ggaaaagagc agattgtttt ctccttaatt atctgccatt cacttccata tttctgcata 71160 ccatttttgg ggtgtgtgtg tgtgaaggaa cagcagggtg tttcttttta aatttgaatg 71220 ttagccttgc atattgtcag tttttaaagc ttgctggcat gtagattatc cgcccccggt 71280 ggatatgaca gtgggcttta ggaaaggaag tgtgatttct gataacattt acatcttagc 71340 tgttcagcgg ataccctgtt agtgtttgtt cttcagaatg ctcagataga acaaaaatca 71400 agtggttgga attttaaaaa acaaaatgta tttggctctc cataaaaatg catttagtga 71460 taaagggggg cagcaagtaa ctatgtctga gagaaggaat tgcaggcaca gaggagatcc 71520 agaattctgt tcacacttga atttacttga ttcgagaaac aaacagcaaa gcctggtgta 71580 ttggccttta tctgggcaaa gttcaaaact caactggtaa ttatgtcctt agaagcctta 71640 aaaggactgt gttgttacaa aagcagtgac tgagcttact tcttcaggac cgaatgcact 71700 cgagttgttt gttagataaa cttgttttaa taaatggggg ggtcagggga gaggtttctg 71760 ttcttggaag attccctgat aagtagcttt cttctcttgg agaacttcag gctttctctc 71820 caagcgaggg gtttgcaggc agctaaagtc agcttcggct tctgcttcct gtcagtcagg 71880 aagtcacttc cttaacccaa attacaagct agagcacaac tccccagcca taccgaaaag 71940 agcaggtttt tcccagaaga ctgtgtttct agatgcggaa gtgtaaattg gtacgctgtg 72000 tgatcatgga atgcccaaaa tacataggga acagtgttgt tggaaagagg cgctgtgtcc 72060 ccaaggagaa gacgccgccc agaatggctg gatcgcctgt tgtggctgag tgcgaggcag 72120 ctgtggctgg ctgctgtgtg acgatgacct agtagccacc catgtggagt cctggctgcc 72180 tcagaaccct atcacatcta ggcaaaatct tgcatttttt atctgggagg cctgaggact 72240 tcagggctgg tggatagtaa gctccttggt tatctcacag atacaagagg tcttgggaat 72300 ccacgatcaa acttgatgtg tgcgtttacc ctcctccctt tgaatctgtt attcaaatat 72360 ttaagcctcc aaccttgtgg cccctacctg caccacccct cacccccccg acaaaaatca 72420 agctcttgac ctcatggctt ctttcagtga cccttggggg acagggtttc ccaaggctgg 72480 ttgccagctg gcatggtccc ccgttggtga agtggagacc tgtgtttttt tggtcatttt 72540 gcaaagagct tatggatgac agcagttctc tgtgcctcgc tgggacagag tgtattctga 72600 ggtccagcgt ctgcatggag atctgcctat ccttcacttg gggtgctcag tagataacgc 72660 ggccactttc ctatacattt ccttaattta agggaacagc gtaaactcag cccaggtgga 72720 ttaatctctc cagtgacttt tgaaacttca atttccaatt tccctcttat gtctaggtgt 72780 gagtgaggat acgtgtagta attgtcgcag gtattagtga gaaagggtgc agatcacaca 72840 aatatttcac acgttattag ttggaccaga ctttggaggc aagggagggc cgtgtcacct 72900 aggaaatttg ctcttccgtg gagatgaaag ggcagtgaat taagtgcctg ctttttctcc 72960 ctttttccct ctgacggtta ttgatcctcc cctggaactg tacagttcac gttctgatct 73020 ttttcttgac aaagggaatt cccagtttgt tcgctggcga acgcactagc aggtgaggag 73080 ttaaaagttg gcaacgcctg ccctctcgag agtgtcagga tttttagtct cttccttgag 73140 agctagaaga tgtttctaaa agaatctctt tggtgactta gaagtggaga gagctttaga 73200 agcatggcac aaataaaagg aaagaggcaa acaccgtcat tctacatctg tttattttgt 73260 tattaacaaa aggcaaggcg attttcatta aagttttgct ggggttgggg ttgagggtgt 73320 agagagcaaa agtgtgagtt gtacaccatg actggaatcg cttggacata ctcttcagca 73380 gacatcgtgt gactgtggaa gaaatgagtt tcatgaagat gactgataga aggaagccac 73440 tgaaccagtc ctctatcacc tcttccaagg ctaaagtttg gagccacttg cagaaggctc 73500 tcctcaaacc cctgtgttct ttgcctaccc ctgctgttgc cacatcatct tggagagctg 73560 gctgcttccc tcctcaacta gaagttccta gtgcctgctt agttcttgtc tcttgcttcc 73620 caagtgctca caaaatacat ccatgttcgc tacgaggaaa tggaccacat aaggtttccg 73680 tgaaaacctt agcccttagg tctaacacag taggaacaga agttaatgtt ttcctgacgt 73740 agaagtttct cttgctgctt ctggtcacat ttctttcttg tgtggttctt ctatggctac 73800 tgcacttttt tttttttctt actgtctccc ccttccccca cacaccacct tttggggata 73860 gggtggcagg tgagaatata aacagataat ggttaagaga tagtttagtc tttctaggcc 73920 agattattta gtttttgcca tctaggtaaa attcggtcca attaagcgtc cattaagtgt 73980 tttaatataa gctggagaag gagttgaacc tggaggtcag ggctctgtgg tctattacag 74040 tccccctggg gtctctagcc caagggagac tccagggtct taataaatga ctgggggttt 74100 cattttgagg cctttactac caaagactga ataatacatt gggcatgatg gttttgtcct 74160 aaacattaac agccacaaaa ggtagagagt gtgtctgttt atagatacac atgtatcatg 74220 aataattagt tggggactgt gcatcaggtc tctcatttta cattcgagga agcaatgcac 74280 ggaatgaatt ctggacctgc gaactctgaa tttcaattct ctgtctccta cttttactgg 74340 agtgcttgca aacagtacag tgtttttgtt gtgaagttat accgtgcctg taatctctct 74400 gcgggtggcc ctcctaagcc ctacttcaag aaatagctct aagctcatga cacccgcccc 74460 acccgatgcc tacatatgtc ttatatcctt ggagtagtgt ttggggttgc aaatttgact 74520 ttagggagac atactctctg atgataggct aatgcttata tttactgata aacttccttt 74580 ttgacggtca tgggcttcgg gggccaccca accaaactgt gtggctgctt ttatgttggg 74640 ccaaaagaca ggctccttgt gtcctcccag tttcttaaac aatgaagtca tggcatttta 74700 cagtgctggt gaatggattg agattgtggt ggccctggaa tgtggcactg ctctggctgg 74760 agggaagatg agagtgaggg atggagagga gaggagagcg ggagatggga acctggtgga 74820 cacaggaggg agtgtgagtt ctgagggcca aaggaaactt gacaccggat gggacattaa 74880 tctgattctg ttatctgagg ctgtcaccag tcctccctgt cctcctggca 74930 <210> 2 <211> 384 <212> DNA <213> Homo sapiens <400> 2 ttcaggccat tggtgttgta tatatttcaa gatttgctca caggtccaaa gcttaactta 60 agctccctga gacatatcat aaaatatgat ttggggaaaa accctaatgg gccatgatca 120 gaacattatt attcaacaaa ggatgaaatg cttaagccaa gatggccttc tttctttctt 180 tctttctttc ttttttttta atgaaagttg agcagactcc cgtccaacag ttttcaatgt 240 aggaattccc acagccccat ttgattgcag tttgttgaaa agtttaatgt ttttgtaggc 300 aattcataat ttccacattg aacagcctga gaggaagaga gctggagccc actgttgttt 360 ttgtagtggg atggtgggaa cttt 384 <210> 3 <211> 20 <212> DNA <213> Homo sapiens <400> 3 ttcaggccat tggtgttgta 20 <210> 4 <211> 20 <212> DNA <213> Homo sapiens <400> 4 aaagttccca ccatcccact 20 <210> 5 <211> 366 <212> DNA <213> Homo sapiens <400> 5 ttgtcccttg aggtgtactg gaaactaagg cgtgagggac tcataggggt ctggcttgga 60 aagtgtattg ctatgtccag tttacacata aggatgtgca aatccagcag gttagctgag 120 ctgcccagga atatccaggc aagaatkacc atattctgat aattactcag gcctctgcct 180 catctccgct gcccccccgc cccctgactc tcttctgagt gccagattca gcctccattt 240 gaatgccaaa tagacaggaa attagcatgc ccagaatcca cgtctttagt gcactctctc 300 cccagctcca aacctgttac tgcttgtgtt caacatctca gtaaagctca acaacatcga 360 cccatt 366 <210> 6 <211> 21 <212> DNA <213> Homo sapiens <400> 6 ttgtcccttg aggtgtactg g 21 <210> 7 <211> 20 <212> DNA <213> Homo sapiens <400> 7 aatgggtcga tgttgttgag 20 <210> 8 <211> 558 <212> DNA <213> Homo sapiens <400> 8 gctgtgaaat cccctgtgta gtgggaagaa gaaatagcaa atcttagctg ccttggacct 60 gatataatta tttgtcttca tttacatggt tyatccttca aggttgaata aatgatgtgg 120 gagctagtca aggggcttta ggtatgtgat ttcatgccta ctttttttta ggtagagaaa 180 ctgaggtcac agggtactag agaatggact ctaagattca ggtttctgaa ttgcctgtgg 240 ttttgttgac tcaactgctc ttctgttgtt ttttagccac atgccttgaa acagtcctct 300 ttcccatgtt tcttcatcag caccattaac ccaaggtata ctgtcctctc ttatctttca 360 caaggtcttg gagttcccat gcctttgtaa gcatccctcc ccgagattca gcaccaacca 420 aaatcacatt tggaaaaatt gcttgtttcc caagaagctt tggaggatat gattttgtat 480 agaacgggtt cacaggtttt ctgttcattc ttctatggtg gagtgtgtgt gtatgtgact 540 ctgtcttctc tccattcc 558 <210> 9 <211> 21 <212> DNA <213> Homo sapiens <400> 9 gctgtgaaat cccctgtgta g 21 <210> 10 <211> 23 <212> DNA <213> Homo sapiens <400> 10 ggaatggaga gaagacagag tca 23 <210> 11 <211> 364 <212> DNA <213> Homo sapiens <400> 11 aagggagaaa gcaggattga gcagggggag ccgtcagatg gtaatgcaga tgtgatgaga 60 tctctgccgg accaaagaga agattccttt ttaaatggtg acaaattcat gggctttctc 120 tgcctcaaaa cctagcacag ctgttattta ctgaacaatt agagagctaa gcacttttta 180 gataytatat aatttaattg ccgtatgagg cacccttagt tttcagacga gaaaccacag 240 ttacagggaa ggcaagtaac ttagtcaatg tcagataact aggaaaaggt tagaggggcc 300 ctggacacag gcctgtgtga ctgagaagct tgggcacttc actgctacat ttcatctctt 360 cgct 364 <210> 12 <211> 20 <212> DNA <213> Homo sapiens <400> 12 aagggagaaa gcaggattga 20 <210> 13 <211> 22 <212> DNA <213> Homo sapiens <400> 13 agcgaagaga tgaaatgtag ca 22 <210> 14 <211> 579 <212> DNA <213> Homo sapiens <400> 14 ctgatgaggg tagggagcat ctgtctgcag cttcatcttc attgtctagg ggctccagaa 60 atatctgtga gtaaataagt tatttaatct ttgcctcaaa tttccagtga ctgtagggat 120 atagctgtga gcctctagga gctgagattt tttaaatttc ccacttaaac atttatttaa 180 aaattttgtg ctcagcatgg actaaggact ttacattcat taactcattt acagcttgat 240 cctatgcggt gggcattcat ttacagagga tcccatttta caggtgagga agaggccagc 300 taggggtgca gcctaggtta gtattctaga gctcatcagg ctgtgttgtc cccagtgaaa 360 gaataagcaa agaagtgaat gttgtgcatt gagaaaaatg actctcggag gaggatgagc 420 ctctcggata tggcgaccga agtgatwtgg ggcccttgtc aagggtctct attatggcat 480 caagaaaaga tgctgctttc ggtgatgccc gaggagagcc tcaatatttt acatgggaaa 540 cctaaaaaag gggccatgtt gtggtctctg cacctaaga 579 <210> 15 <211> 19 <212> DNA <213> Homo sapiens <400> 15 ctgatgaggg tagggagca 19 <210> 16 <211> 22 <212> DNA <213> Homo sapiens <400> 16 tcttaggtgc agagaccaca ac 22 <210> 17 <211> 486 <212> DNA <213> Homo sapiens <400> 17 tatttagaaa ccataaaatc cacctatttg aggtgtacaa ttgagtgatt ttctgtatag 60 tcacagatct gtgcagtcat ccacaccctc taactccagg acattttcct cacccccgag 120 gagaaacctc ccttacccat tagcagtcac tcctcatttc ctctcccccc agcccctggc 180 aatcactgtg gatttgcctg ttcttgacat ttcatataaa tggtatcata aaatctaygg 240 gcttttgtgt ctgtctgctt tcacttagca tacggttctc aaggttcatc cagtattgta 300 gcatctatca gtatgtcatt cctttttatg gccaaataat attttattgt atggatagac 360 attttgttta ttcatttatc tgtttttggt tattatgagt aacactacta tgaacatttt 420 gcacaaattt ttgtattgac atgttttcat ttctcctggg tatagtccta tgagtggaat 480 tgctgg 486 <210> 18 <211> 27 <212> DNA <213> Homo sapiens <400> 18 tatttagaaa ccataaaatc cacctat 27 <210> 19 <211> 22 <212> DNA <213> Homo sapiens <400> 19 ccagcaattc cactcatagg ac 22 <210> 20 <211> 428 <212> DNA <213> Homo sapiens <400> 20 ttgtctcctt ttgtttctgc tactgtgaat gatcctgtga tgatcatctt tgtgtgtaaa 60 tctttgtccc ctcgccccct ccccttttat tattttcttg ggatagaccc caggacaaaa 120 ggtagaaaag aacaaagtgt taaaaaattt cttgatacat agccacagat tattttcctg 180 aaagttctca acatttataa ctacsagcag tatgtaagag agttatggtt ggaatgattt 240 taatgtctct ggggaattta acaacaaaaa aactttaggc ttctttggag agagacatgc 300 ccttaactcc accccgccct agaacagaga cccagcccat ccaagtcagc ctccccaggt 360 cctccacctt caaaacaggc aaacgaaatc atttcttgaa taattggtag gcttcaaggt 420 cagatgtt 428 <210> 21 <211> 23 <212> DNA <213> Homo sapiens <400> 21 ttgtctcctt ttgtttctgc tac 23 <210> 22 <211> 22 <212> DNA <213> Homo sapiens <400> 22 aacatctgac cttgaagcct ac 22 <210> 23 <211> 330 <212> DNA <213> Homo sapiens <400> 23 tcagggacag tgcataggtg taaagaagtt gctggttggg ggttctaatg caggtttctc 60 caaaagtgaa tgccctgtta aaaaaaaatt cttaacaaat atacagagat ttttttttta 120 aaaaagtgtg acagttctag acacctagag agtaaartga agaagcctgt tttcaggttt 180 cccgcctccc tgaatttccc agcatggtcc aggctttgaa atttatttat ctgcttttgg 240 caatggttga tgggaatttc ccacatttat tttttagcta cagagaaagg acattatctt 300 taaaatctct tcgttgttct ctctctttga 330 <210> 24 <211> 20 <212> DNA <213> Homo sapiens <400> 24 tcagggacag tgcataggtg 20 <210> 25 <211> 23 <212> DNA <213> Homo sapiens <400> 25 tcaaagagag agaacaacga aga 23 <210> 26 <211> 574 <212> DNA <213> Homo sapiens <400> 26 tatttagaaa ccataaaatc cacctatttg aggtgtacaa ttgagtgatt ttctgtatag 60 tcacagatct gtgcagtcat ccacaccctc taactccagg acattttcct cacccccgag 120 gagaaacctc ccttacccat tagcagtcac tcctcatttc ctctcccccc agcccctggc 180 aatcactgtg gatttgcctg ttcttgacat ttcatataaa yggtatcata aaatctatgg 240 gcttttgtgt ctgtctgctt tcacttagca tacggttctc aaggttcatc cagtattgta 300 gcatctatca gtatgtcatt cctttttatg gccaaataat attttattgt atggatagac 360 attttgttta ttcatttatc tgtttttggt tattatgagt aacactacta tgaacatttt 420 gcacaaattt ttgtattgac atgttttcat ttctcctggg tatagtccta tgagtggaat 480 tgctgggtca tataataaat aactgtttaa cattttgggg agctgccaaa cttttaaaac 540 cttgggttct gtgatgtacc agttgtgtta ggca 574 <210> 27 <211> 27 <212> DNA <213> Homo sapiens <400> 27 tatttagaaa ccataaaatc cacctat 27 <210> 28 <211> 22 <212> DNA <213> Homo sapiens <400> 28 tgcctaacac aactggtaca tc 22 <210> 29 <211> 571 <212> DNA <213> Homo sapiens <400> 29 tgccaggggt tttatggtta attttcctcc attatgaggg ttgactcagc cttgggtatt 60 agatgtcttt gagaatccag ggttcaaata ccacagctgg tagaatgttt ctcaacttgg 120 agccaatctc catctactga aggtacgctg gtttagacag acaacaggga catcagcatt 180 ttaaaaagcg gtggaaaaag tttgcttgtc ttgattggag ccatgacatt ttattttgaa 240 atttcaaata acatgaaggg aggtttggag cggtttttgg tttatccaaa gggcagtgga 300 ttgaaggctg agaaacacca ggctgaatgg gagaggggtt ggggtccccc tgtgagatag 360 tgaaacaatg gtagtgccat ccaatgatag gcacttttct gtcattcaga agcagaaagg 420 gggccagagg cccattggcc ttactgggma gtaagctgta gagctgctgc cttttcgtga 480 aagggttgac accaaccttc tcccccagga agagtgacca gggacctgag gggcatggtc 540 gagcagatga cagcctttgt aaaacatctc c 571 <210> 30 <211> 20 <212> DNA <213> Homo sapiens <400> 30 tgccaggggt tttatggtta 20 <210> 31 <211> 23 <212> DNA <213> Homo sapiens <400> 31 ggagatgttt tacaaaggct gtc 23 <210> 32 <211> 614 <212> DNA <213> Homo sapiens <400> 32 ttggtagaga tggggtctcc taggctggtc ttgaactcct ggrctcaagc aatcttcctg 60 cctcagcctt ccaaagtact gggattactg gcgtgggcca ccatgcctgg cttgaaattt 120 ttctatggct ttattctttc tccaagtaca gagtctaccc aaccttctga gatctttggt 180 tttcttttcc taggtaacta tagtacatac ttatttatgt taaacaacag caatcacaca 240 tttctttttc tatacagtca tgctttatag gcaaataaag cctccgtctt aggctttctg 300 gattttttca aaagatgcaa ttcctggagt atgtttttac ttagagcaaa gcagcctagt 360 ctcctatacc ttctgcatct gcagaaaagt tggttaaaca gactttgtaa tgatgcccct 420 tacaattctg aagggacttg tgaaatagtt tcacagagtt tcagtgttag gtatatttga 480 tcaatgctaa cttttggaaa actttggtgc ctgtatgatt cagagggtag ggcagaatat 540 taaattaatc acaacttctt gtattttaac cattctgggt aaattgggat tccgtgacgc 600 ccaggcaaaa ttat 614 <210> 33 <211> 20 <212> DNA <213> Homo sapiens <400> 33 ttggtagaga tggggtctcc 20 <210> 34 <211> 20 <212> DNA <213> Homo sapiens <400> 34 ataattttgc ctgggcgtca 20 <210> 35 <211> 633 <212> DNA <213> Homo sapiens <400> 35 tatcttatat cccctccaag cattcattaa ctgatggatt agtgagttgg ccttgagaag 60 cataaaggct cgtctccatg tgcttctaag cattgtgtct aagttctgtt tggtttcctg 120 agtgaaactg tcttaatgtt accaacagaa gttaaatgcc taagagwttc ttatacatgg 180 gctgagtacc tctgtgactg ggcaagccac ctcacctcat tttaccttgt ctgcaaaatg 240 aggaactggg tcaactcatc gttcaaatct cactgaaagc taattgatcg cttttgacag 300 aagtagctcc cttgggccgt atatttattt cctagcttgg aggaaggtgg ggacagacag 360 aattgatgta cacctttatt tttatctcta tggtaaacct gtgcatacta aagcattcct 420 ctggtctttt gagatgagtg tatacattgt gtctggccct gtgcattttt taccaagaag 480 taagttttgt tgagtaaact tgggttgtat gaagaactgc atgctcaccg tactcaagta 540 gcttttgcta cctaaaggac agctgctcat atgtacttga cttcctttaa agtgaaggat 600 gatgacattt gaaaaacgga ggttgaaaag gag 633 <210> 36 <211> 25 <212> DNA <213> Homo sapiens <400> 36 tatcttatat cccctccaag cattc 25 <210> 37 <211> 21 <212> DNA <213> Homo sapiens <400> 37 ctccttttca acctccgttt t 21 <210> 38 <211> 1081 <212> DNA <213> Homo sapiens <400> 38 ttgagcatgt gttatttaat gagttatacc tctgtcatat gtgtgtgttt atatcacaaa 60 ataacttatt tttataaaac catattttga gtcatcattt gtgacaatgt cttcttttct 120 ctggtataaa tgaggcatgt agaaagaaga ttgacatttg ctagaagctt cccctttcct 180 ctaactccac aataaaatgg atgctcataa ttacatctgc tcctataagg tcaagatttc 240 agggctggaa gtgaccttag atcatttagg cccaacttgc cctcaggaaa ggaaactgag 300 gcccagagat gccttaagtg aattgcccaa tgtcacacgc tgagtcagtg gccagagcaa 360 ggcttggatc cagttctctg ctccctttcc agagccttgt gatgtcttct ctcctacagg 420 aggtgaaaat aactgctgtg gctggttctg ttttgctgac tgtaaattgg gtcatggtca 480 gggacagtgc ataggtgtaa agaagttgct ggttgggggt tctaatgcag gtttctccaa 540 aagtgaatgc cctgttaaaa aaaaattctt aacaaatata cagagatttt tttttwaaaa 600 aagtgtgaca gttctagaca cctagagagt aaagtgaaga agcctgtttt caggtttccc 660 gcctccctga atttcccagc atggtccagg ctttgaaatt tatttatctg cttttggcaa 720 tggttgatgg gaatttccca catttatttt ttagctacag agaaaggaca ttatctttaa 780 aatctcttcg ttgttctctc tctttgagtg aggagagaag atgtgaatcc tggcagtggt 840 tcagagtgga cacagcccct gtgtttgtgg cataggctct gtgggcccca tgccagggag 900 cagtaccccc gtgtaaagga gtgggggttt gtccatttgg atagagcaaa gatcctccac 960 ctcaaatccc acaagaacag ttgccacaac ctgggcccta agcatctcat tttcctatgt 1020 agaaattaat gatctggagg agatggcaaa acattccttc cagagcctgt gtggattttg 1080 g 1081 <210> 39 <211> 26 <212> DNA <213> Homo sapiens <400> 39 ttgagcatgt gttatttaat gagtta 26 <210> 40 <211> 20 <212> DNA <213> Homo sapiens <400> 40 ccaaaatcca cacaggctct 20 <210> 41 <211> 599 <212> DNA <213> Homo sapiens <400> 41 tagtgctcag tatttccaac gttctgttta tttaagatga aaattgctgt agttaataag 60 cacttcccca tgtcattaaa atgcttaagg atttttaatg accacataac agtccataat 120 atgattaaac cccaatttac tgaatcaatg ccatattgtt gggtctttag attgtctcct 180 tttgtttctg ctactgtgaa tgatcctgtg atgatcatct ttgtgtgtaa atctttgtcc 240 cctcgccccc tcccctttta ttattttctt gggatagacc ccaggacaaa aggtagaaaa 300 gaacaaagtg ttaaamaatt tcttgataca tagccacaga ttattttcct gaaagttctc 360 aacatttata actacgagca gtatgtaaga gagttatggt tggaatgatt ttaatgtctc 420 tggggaattt aacaacaaaa aaactttagg cttctttgga gagagacatg cccttaactc 480 caccccgccc tagaacagag acccagccca tccaagtcag cctccccagg tcctccacct 540 tcaaaacagg caaacgaaat catttcttga ataattggta ggcttcaagg tcagatgtt 599 <210> 42 <211> 25 <212> DNA <213> Homo sapiens <400> 42 tagtgctcag tatttccaac gttct 25 <210> 43 <211> 23 <212> DNA <213> Homo sapiens <400> 43 aacatctgac cttgaagcct acc 23 <210> 44 <211> 599 <212> DNA <213> Homo sapiens <400> 44 tagtgctcag tatttccaac gttctgttta tttaagatga aaattgctgt agttaataag 60 cacttcccca tgtcattaaa atgcttaagg atttttaatg accacataac agtccataat 120 atgattaaac cccaatttac tgaatcaatg ccatattgtt gggtctttag attgtctcct 180 tttgtttctg ctactgtgaa tgatcctgtg atgatcatct ttgtgtgtaa atctttgtcc 240 cctcgccccc tcccctttta ttattttctt gggatagacc ccaggacaaa aggtagaaaa 300 gaacaaagtg ttaaaaaatt tcttgataca tagccacaga ttattttcct gaaagttcts 360 aacatttata actacgagca gtatgtaaga gagttatggt tggaatgatt ttaatgtctc 420 tggggaattt aacaacaaaa aaactttagg cttctttgga gagagacatg cccttaactc 480 caccccgccc tagaacagag acccagccca tccaagtcag cctccccagg tcctccacct 540 tcaaaacagg caaacgaaat catttcttga ataattggta ggcttcaagg tcagatgtt 599 <210> 45 <211> 641 <212> DNA <213> Homo sapiens <400> 45 tgctatgtcc agtttacaca taaggatgtg caaatccagc aggttagctg agctgcccag 60 gaatatccag gcaagaatga ccatattctg ataattactc aggcctctgc ctcatctccg 120 ctgscccccc gccccctgac tctcttctga gtgccagatt cagcctccat ttgaatgcca 180 aatagacagg aaattagcat gcccagaatc cacgtcttta gtgcactctc tccccagctc 240 caaacctgtt actgcttgtg ttcaacatct cagtaaagct caacaacatc gacccattac 300 ttaggcctca aaccttgggt ggcatcgtcg attgctcttt tctttcatac cccacattca 360 acccatcagc ccatcccaca ggcccaagtg tgtcctctct accttcaaag cgtgtgtggc 420 atccaccgct tatcaccacc tctgccatta ccactggagt ccagtgccat catctctcac 480 ttggatgtgg ccagagtgtc tttgctggtc tccttcttgc ttcctacctt tgtaacagcc 540 tatcatctat ctctggtctc catagctcac tcccatactt tgagagggcc tttgaaagcc 600 ttagacagat catatcacag acctctatac tgaaagtcgg g 641 <210> 46 <211> 25 <212> DNA <213> Homo sapiens <400> 46 tgctatgtcc agtttacaca taagg 25 <210> 47 <211> 24 <212> DNA <213> Homo sapiens <400> 47 cccgactttc agtatagagg tctg 24 <210> 48 <211> 284 <212> DNA <213> Homo sapiens <400> 48 ccatctgtgg agcagagtca ctgaaaggaa atactggaaa tactggaagc cacttggtgt 60 tttatcaagg atgtgaggtt tcctggcaac tttgtcgcca tatcatcatc atcatcacca 120 tcatcatcat catcatcatc atcatcatca tcatcatcat catcatctgc cctttaagtt 180 ttctgcttgt ttagaaaaga aatttataca gagcccccag tagcagctgt aagggggcag 240 gttcttggag cagcccatcc tcaacattct tgctgctgat ggaa 284 <210> 49 <211> 20 <212> DNA <213> Homo sapiens <400> 49 ccatctgtgg agcagagtca 20 <210> 50 <211> 20 <212> DNA <213> Homo sapiens <400> 50 ttccatcagc agcaagaatg 20 <210> 51 <211> 145 <212> DNA <213> Homo sapiens <400> 51 tccacgcaga gaggatctaa atctggctct ttgcaattgc cttcatacat gtgcatacac 60 accacacaca cacacacaca cacacacaca cacacacaca cagacacata catatgcaca 120 caccccgact caatggagga ccctc 145 <210> 52 <211> 21 <212> DNA <213> Homo sapiens <400> 52 tccacgcaga gaggatctaa a 21 <210> 53 <211> 20 <212> DNA <213> Homo sapiens <400> 53 gagggtcctc cattgagtcg 20

Claims (28)

  1. 마커 rs4074720과 rs7087006 사이에 있는, TCF7L2의 엑손 4 LD 블럭 내에 있는 마커에 대해 개체로부터 얻어진 핵산 시료를 분석하는 단계를 포함하는, 개체에서 타입 II 당뇨병의 감수성을 결정하기 위해 데이터를 수집하는 방법으로서, 마커 대립형질의 존재는 타입 II 당뇨병에 대한 감수성을 표시하고, 상기 마커는 DG10S478, rs12255372, rs7895340, rs11196205, rs7901695, rs7903146, rs12243326, 및 rs4506565로 구성된 군으로부터 선택되는 것인 방법.
  2. 삭제
  3. 삭제
  4. 제1항에 있어서, 상기 마커는 마커 rs7903146인 것인 방법.
  5. 제1항에 있어서, 마커 DG10S478에서 0이 아닌(non-0) 대립형질(allel), rs12255372에서 T 대립형질; rs7895340에서 A 대립형질; rs11196205에서 C 대립형질; rs7901695에서 C 대립형질; rs7903146에서 T 대립형질; rs12243326에서 C 대립형질; 또는 rs4506565에서 T 대립형질의 존재는 타입 II 당뇨병에 대한 증가된 감수성을 표시하는 것인 방법.
  6. 제4항에 있어서, 상기 rs7903146에서 T 대립형질의 존재는 타입 II 당뇨병에 대한 증가된 감수성을 표시하는 것인 방법.
  7. 제5항 또는 제6항에 있어서, 상기 증가된 감수성은 1.2 이상의 상대적 위험(relative risk)을 특징으로 하는 것인 방법.
  8. 제1항에 있어서, 마커 DG10S478에서 0 대립형질, SNP rs12255372에서 G 대립형질; rs7895340에서 G 대립형질; rs11196205에서 G 대립형질; rs7901695에서 T 대립형질; rs7903146에서 C 대립형질; rs12243326에서 T 대립형질; 또는 rs4506565에서 A 대립형질의 존재는 타입 II 당뇨병에 대한 감소된 감수성을 표시하는 것인 방법.
  9. 제4항에 있어서, 상기 rs7903146에서 C 대립형질의 존재는 타입 II 당뇨병에 대한 감소된 감수성을 표시하는 것인 방법.
  10. 타입 II 당뇨병에 대한 감수성을 검출하기 위해 개체로부터의 시료를 분석하기 위한 키트로서, 상기 키트는 마커 rs4074720과 rs7087006 사이에 있는, TCF7L2의 엑손 4 LD 블럭 내에 있는 하나 이상의 마커를 검출하기 위한 하나 이상의 시약을 포함하고, 상기 하나 이상의 마커는 DG10S478, rs12255372, rs7895340, rs11196205, rs7901695, rs7903146, rs12243326, 및 rs4506565로 구성된 군으로부터 선택되는 것인 키트.
  11. 삭제
  12. 삭제
  13. 삭제
  14. 제10항에 있어서, 상기 하나 이상의 마커는 마커 rs7903146인 것인 키트.
  15. 제10항에 있어서, 상기 하나 이상의 시약은 상기 하나 이상의 마커를 포함하는 영역에 대해 완전히 상보적인 하나 이상의 연속된 뉴클레오티드 서열을 포함하는 것인 키트.
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
KR1020087001376A 2005-06-20 2006-06-16 타입 2 당뇨병의 위험에 대한 진단 마커인 tcf7l2유전자의 유전적 변이체 KR101374304B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US69217405P 2005-06-20 2005-06-20
US60/692,174 2005-06-20
US75715506P 2006-01-06 2006-01-06
US60/757,155 2006-01-06
PCT/IS2006/000014 WO2006137085A1 (en) 2005-06-20 2006-06-16 Genetic variants in the tcf7l2 gene as diagnostic markers for risk of type 2 diabetes mellitus

Publications (2)

Publication Number Publication Date
KR20080051128A KR20080051128A (ko) 2008-06-10
KR101374304B1 true KR101374304B1 (ko) 2014-03-14

Family

ID=37036993

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087001376A KR101374304B1 (ko) 2005-06-20 2006-06-16 타입 2 당뇨병의 위험에 대한 진단 마커인 tcf7l2유전자의 유전적 변이체

Country Status (15)

Country Link
US (3) US7585630B2 (ko)
EP (1) EP1907569B1 (ko)
JP (1) JP5301987B2 (ko)
KR (1) KR101374304B1 (ko)
CN (1) CN101238222B (ko)
AU (1) AU2006260477B2 (ko)
BR (1) BRPI0612301A2 (ko)
CA (1) CA2612475C (ko)
EA (1) EA016397B1 (ko)
HK (1) HK1117569A1 (ko)
IL (1) IL188147A (ko)
MX (1) MX2007015848A (ko)
NO (1) NO341910B1 (ko)
NZ (1) NZ564285A (ko)
WO (1) WO2006137085A1 (ko)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7407955B2 (en) 2002-08-21 2008-08-05 Boehringer Ingelheim Pharma Gmbh & Co., Kg 8-[3-amino-piperidin-1-yl]-xanthines, the preparation thereof and their use as pharmaceutical compositions
US7501426B2 (en) 2004-02-18 2009-03-10 Boehringer Ingelheim International Gmbh 8-[3-amino-piperidin-1-yl]-xanthines, their preparation and their use as pharmaceutical compositions
DE102004054054A1 (de) 2004-11-05 2006-05-11 Boehringer Ingelheim Pharma Gmbh & Co. Kg Verfahren zur Herstellung chiraler 8-(3-Amino-piperidin-1-yl)-xanthine
BRPI0612301A2 (pt) * 2005-06-20 2009-01-27 Decode Genetics Ehf mÉtodo para diagnosticar uma suscetibilidade para a diabete tipo ii em um indivÍduo, kit, e, mÉtodo para avaliar um indivÍduo quanto a probabilidade de resposta a um agente terapÊutico de tcf7l2
DE102005035891A1 (de) 2005-07-30 2007-02-08 Boehringer Ingelheim Pharma Gmbh & Co. Kg 8-(3-Amino-piperidin-1-yl)-xanthine, deren Herstellung und deren Verwendung als Arzneimittel
KR101541791B1 (ko) 2006-05-04 2015-08-04 베링거 인겔하임 인터내셔날 게엠베하 다형태
PE20080251A1 (es) 2006-05-04 2008-04-25 Boehringer Ingelheim Int Usos de inhibidores de dpp iv
EP1852108A1 (en) 2006-05-04 2007-11-07 Boehringer Ingelheim Pharma GmbH & Co.KG DPP IV inhibitor formulations
SG177148A1 (en) * 2006-11-30 2012-01-30 Decode Genetics Ehf Genetic susceptibility variants of type 2 diabetes mellitus
WO2008109079A2 (en) * 2007-03-01 2008-09-12 Novetide, Ltd. High purity peptides
US20100184839A1 (en) * 2007-04-30 2010-07-22 Avishay Vaknin Allelic polymorphism associated with diabetes
AR071175A1 (es) 2008-04-03 2010-06-02 Boehringer Ingelheim Int Composicion farmaceutica que comprende un inhibidor de la dipeptidil-peptidasa-4 (dpp4) y un farmaco acompanante
UY32030A (es) 2008-08-06 2010-03-26 Boehringer Ingelheim Int "tratamiento para diabetes en pacientes inapropiados para terapia con metformina"
KR20200118243A (ko) 2008-08-06 2020-10-14 베링거 인겔하임 인터내셔날 게엠베하 메트포르민 요법이 부적합한 환자에서의 당뇨병 치료
AU2009290911A1 (en) 2008-09-10 2010-03-18 Boehringer Ingelheim International Gmbh Combination therapy for the treatment of diabetes and related conditions
US20200155558A1 (en) 2018-11-20 2020-05-21 Boehringer Ingelheim International Gmbh Treatment for diabetes in patients with insufficient glycemic control despite therapy with an oral antidiabetic drug
NZ592924A (en) 2008-12-23 2014-05-30 Boehringer Ingelheim Int Salt forms of a xanthine derivative
TW201036975A (en) 2009-01-07 2010-10-16 Boehringer Ingelheim Int Treatment for diabetes in patients with inadequate glycemic control despite metformin therapy
AU2010269841A1 (en) * 2009-07-10 2012-02-23 Decode Genetics Ehf Genetic markers associated with risk of diabetes mellitus
KR20210033559A (ko) 2009-11-27 2021-03-26 베링거 인겔하임 인터내셔날 게엠베하 리나글립틴과 같은 dpp-iv 억제제를 사용한 유전자형 검사된 당뇨병 환자의 치료
US9186392B2 (en) 2010-05-05 2015-11-17 Boehringer Ingelheim International Gmbh Combination therapy
BR112012032579B1 (pt) 2010-06-24 2021-05-11 Boehringer Ingelheim International Gmbh uso de linagliptina e composição farmacêutica compreendendo linagliptina e insulina basal de longa duração
AR083878A1 (es) 2010-11-15 2013-03-27 Boehringer Ingelheim Int Terapia antidiabetica vasoprotectora y cardioprotectora, linagliptina, metodo de tratamiento
EP3517539B1 (en) 2011-07-15 2022-12-14 Boehringer Ingelheim International GmbH Substituted dimeric quinazoline derivative, its preparation and its use in pharmaceutical compositions for the treatment of type i and ii diabetes
US9555001B2 (en) 2012-03-07 2017-01-31 Boehringer Ingelheim International Gmbh Pharmaceutical composition and uses thereof
US20130303462A1 (en) 2012-05-14 2013-11-14 Boehringer Ingelheim International Gmbh Use of a dpp-4 inhibitor in podocytes related disorders and/or nephrotic syndrome
WO2013174767A1 (en) 2012-05-24 2013-11-28 Boehringer Ingelheim International Gmbh A xanthine derivative as dpp -4 inhibitor for use in modifying food intake and regulating food preference
EP2971163A4 (en) * 2013-03-14 2017-03-22 The Children's Hospital of Philadelphia Tcf7l2 variant and methods of use thereof in diagnostic and drug screening assays
RU2521202C1 (ru) * 2013-04-12 2014-06-27 Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Белгородский государственный национальный исследовательский университет" Способ прогнозирования риска развития сахарного диабета второго типа у больных гипертонической болезнью
US9526728B2 (en) 2014-02-28 2016-12-27 Boehringer Ingelheim International Gmbh Medical use of a DPP-4 inhibitor
CN103882127B (zh) * 2014-03-13 2016-03-16 河北联合大学 用于预测患2型糖尿病肾病发生风险的试剂盒
WO2016201438A1 (en) * 2015-06-11 2016-12-15 The Children's Hospital Of Philadelphia New targets modulated by a casual variant of type 2 diabetes (t2d) embedded within the tcf7l2 gene and methods of use thereof for identifying agents having efficacy for the treatment of type 2 diabetes and other metabolic disorders
JP2019517542A (ja) 2016-06-10 2019-06-24 ベーリンガー インゲルハイム インターナショナル ゲゼルシャフト ミット ベシュレンクテル ハフツング リナグリプチンおよびメトホルミンの組合せ
CN109182508A (zh) * 2018-10-22 2019-01-11 北京华夏时代生物工程有限公司 Tcf7l2基因单核苷酸多态性的荧光原位杂交测序方法
TWI702292B (zh) * 2018-12-28 2020-08-21 薩摩亞商康多富國際有限公司 個人化新陳代謝疾病保健食品組合的決定方法及非暫態電腦可讀取儲存媒體

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003024447A1 (en) 2001-09-20 2003-03-27 Smithkline Beecham Corporation Inhibitors of glycogen synthase kinase-3

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4376110A (en) * 1980-08-04 1983-03-08 Hybritech, Incorporated Immunometric assays using monoclonal antibodies
US5288611A (en) * 1983-01-10 1994-02-22 Gen-Probe Incorporated Method for detecting, identifying, and quantitating organisms and viruses
CA1215904A (en) * 1983-01-10 1986-12-30 David E. Kohne Method for detection identification and quantitation of non-viral organisms
US4683202A (en) * 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
DE3534934A1 (de) * 1985-10-01 1987-04-02 Draegerwerk Ag Kolorimetrisches gasdosimeter
US5223409A (en) * 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
US5176996A (en) * 1988-12-20 1993-01-05 Baylor College Of Medicine Method for making synthetic oligonucleotides which bind specifically to target sites on duplex DNA molecules, by forming a colinear triplex, the synthetic oligonucleotides and methods of use
US5256775A (en) * 1989-06-05 1993-10-26 Gilead Sciences, Inc. Exonuclease-resistant oligonucleotides
US5143854A (en) * 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5424186A (en) * 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
US5264564A (en) * 1989-10-24 1993-11-23 Gilead Sciences Oligonucleotide analogs with novel linkages
US5384261A (en) * 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
US5837832A (en) * 1993-06-25 1998-11-17 Affymetrix, Inc. Arrays of nucleic acid probes on biological chips
US5858659A (en) * 1995-11-29 1999-01-12 Affymetrix, Inc. Polymorphism detection
US6057117A (en) * 1996-04-04 2000-05-02 Chiron Corporation Identification and use of selective inhibitors of glycogen synthase kinase 3
AU4920397A (en) * 1996-10-11 1998-05-11 Chiron Corporation Purine inhibitors of glycogen synthase kinase 3 (gsk3)
WO1999065897A1 (en) * 1998-06-19 1999-12-23 Chiron Corporation Inhibitors of glycogen synthase kinase 3
US6512102B1 (en) * 1998-12-31 2003-01-28 Chiron Corporation Compositions and methods of diagnosis and treatment using casein kinase I
JP2003516991A (ja) * 1999-12-17 2003-05-20 カイロン コーポレイション グリコゲンシンターゼキナーゼ3の二環式インヒビター
US6608063B2 (en) * 1999-12-17 2003-08-19 Chiron Corporation Pyrazine based inhibitors of glycogen synthase kinase 3
PT1319064E (pt) * 2000-07-27 2008-02-29 Novartis Vaccines & Diagnostic Polipéptidos de gsk3
AU785425B2 (en) * 2001-03-30 2007-05-17 Genetic Technologies Limited Methods of genomic analysis
JP2004536113A (ja) * 2001-07-03 2004-12-02 カイロン コーポレイション チロシンキナーゼおよびセリン/スレオニンキナーゼのインヒビターとしてのインダゾールベンズイミダゾール化合物
WO2003014143A2 (en) * 2001-08-04 2003-02-20 Whitehead Institute For Biomedical Research Haplotype map of the human genome and uses therefor
US20040072831A1 (en) * 2001-10-12 2004-04-15 Choongwae Pharma Corporation Reverse-turn mimetics and method relating thereto
US20040023237A1 (en) * 2001-11-26 2004-02-05 Perelegen Sciences Inc. Methods for genomic analysis
US6762185B1 (en) * 2002-03-01 2004-07-13 Choongwae Pharma Corporation Compounds useful for treatment of cancer, compositions containing the same, and methods of their use
EP1380644A1 (en) * 2002-07-08 2004-01-14 Kylix B.V. The use of specified TCF target genes to identify drugs for the treatment of cancer, in particular colorectal cancer, in which TCF/beta-catenin/WNT signalling plays a central role
CA2496164C (en) * 2002-08-23 2010-11-09 Chiron Corporation Benzimidazole quinolinones and uses thereof
US20040247593A1 (en) * 2002-10-04 2004-12-09 Regents Of The University Of California, Methods for treating cancer by inhibiting Wnt signaling
JP2006506988A (ja) * 2002-11-01 2006-03-02 デコード ジェネティクス イーエッチエフ. 染色体5q35に位置したヒトII型糖尿病遺伝子−SLIT−3
US20040146870A1 (en) * 2003-01-27 2004-07-29 Guochun Liao Systems and methods for predicting specific genetic loci that affect phenotypic traits
CN1548553A (zh) * 2003-05-21 2004-11-24 中国医学科学院基础医学研究所 用于预测2型糖尿病易感性的试剂盒及引物
US6991110B2 (en) * 2003-07-02 2006-01-31 Inficon, Inc. Package for storing sensor crystals and related method of use
NZ545568A (en) * 2003-08-28 2009-06-26 Choongwae Pharma Corp Use of compounds that modulate beta-catenin/TCF activated transcription for manufacture of a medicamnet to treat cancer
BRPI0612301A2 (pt) * 2005-06-20 2009-01-27 Decode Genetics Ehf mÉtodo para diagnosticar uma suscetibilidade para a diabete tipo ii em um indivÍduo, kit, e, mÉtodo para avaliar um indivÍduo quanto a probabilidade de resposta a um agente terapÊutico de tcf7l2

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003024447A1 (en) 2001-09-20 2003-03-27 Smithkline Beecham Corporation Inhibitors of glycogen synthase kinase-3

Also Published As

Publication number Publication date
HK1117569A1 (en) 2009-01-16
KR20080051128A (ko) 2008-06-10
US20060286588A1 (en) 2006-12-21
EA016397B1 (ru) 2012-04-30
CN101238222A (zh) 2008-08-06
EP1907569A1 (en) 2008-04-09
AU2006260477B2 (en) 2012-02-23
CN101238222B (zh) 2013-04-10
CA2612475C (en) 2015-07-28
MX2007015848A (es) 2008-04-22
NO20080389L (no) 2008-01-21
IL188147A (en) 2013-02-28
BRPI0612301A2 (pt) 2009-01-27
WO2006137085A1 (en) 2006-12-28
NZ564285A (en) 2010-03-26
US20120149016A1 (en) 2012-06-14
EP1907569B1 (en) 2013-04-10
AU2006260477A8 (en) 2006-12-28
EA200800087A1 (ru) 2008-06-30
US20090275043A1 (en) 2009-11-05
IL188147A0 (en) 2008-03-20
JP2008546403A (ja) 2008-12-25
JP5301987B2 (ja) 2013-09-25
US7585630B2 (en) 2009-09-08
CA2612475A1 (en) 2006-12-28
NO341910B1 (no) 2018-02-19
AU2006260477A1 (en) 2006-12-28

Similar Documents

Publication Publication Date Title
KR101374304B1 (ko) 타입 2 당뇨병의 위험에 대한 진단 마커인 tcf7l2유전자의 유전적 변이체
DK2471954T3 (en) Susceptibility genetic variants associated with cardiovascular diseases
CA2566256C (en) Genetic polymorphisms associated with liver fibrosis methods of detection and uses thereof
CN101874120B (zh) 作为用于乳腺癌风险评估、诊断、预后和治疗的标记的chr2和chr16的遗传性变型
CN101641451A (zh) chr8q24.21上的癌症易感性变体
DK2414543T3 (en) Genetic markers for risk management of atrial fibrillation and stroke
KR20110081807A (ko) 갑상선암의 위험도 평가를 위해 유용한 유전적 변이
CN101687050A (zh) 用于鉴别原发起源不明的癌的起源的方法和材料
TW201632629A (zh) 用於癌症診斷與預後的方法
KR20110036608A (ko) 유방암 위험도 평가를 위한 유전적 변이
CA2651376A1 (en) Method for diagnosis and treatment of a mental disease
KR102481305B1 (ko) 유전자에 기반한 염증성 장 질환의 진단
KR20130123357A (ko) 저산소증과 관련된 질환의 진단방법 및 키트
AU2016325030A1 (en) Novel biomarkers and methods of treating cancer
KR20090087486A (ko) 타입 2 당뇨병의 유전적 감수성 변이
WO2006022629A1 (en) Methods of identifying risk of type ii diabetes and treatments thereof
CN101631876A (zh) 2型糖尿病的遗传易感性变体
US20030099958A1 (en) Diagnosis and treatment of vascular disease
CA2497597A1 (en) Methods for identifying subjects at risk of melanoma and treatments
IL179831A (en) In vitro method for detecting the presence or possibility of autism or autism disorder, and in vitro method for selecting compounds with biological activity on autism or autism disorders
WO2006022636A1 (en) Methods for identifying risk of type ii diabetes and treatments thereof
WO2006022634A1 (en) Methods for identifying risk of type ii diabetes and treatments thereof
WO2006022633A1 (en) Methods for identifying a risk of type ii diabetes and treatments thereof
WO2006022638A1 (en) Methods for identifying risk of type ii diabetes and treatments thereof
CA2400954C (en) Methods and composition for diagnosing and treating pseudoxanthoma elasticum and related conditions

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170220

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180223

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190213

Year of fee payment: 6