KR101753884B1 - 가족성 고콜레스테롤혈증과 관련된 신규한 돌연변이 및 그 용도 - Google Patents

가족성 고콜레스테롤혈증과 관련된 신규한 돌연변이 및 그 용도 Download PDF

Info

Publication number
KR101753884B1
KR101753884B1 KR1020140182374A KR20140182374A KR101753884B1 KR 101753884 B1 KR101753884 B1 KR 101753884B1 KR 1020140182374 A KR1020140182374 A KR 1020140182374A KR 20140182374 A KR20140182374 A KR 20140182374A KR 101753884 B1 KR101753884 B1 KR 101753884B1
Authority
KR
South Korea
Prior art keywords
nucleotide
substitution
sequence
seq
gly
Prior art date
Application number
KR1020140182374A
Other languages
English (en)
Other versions
KR20160006580A (ko
Inventor
이상학
이지현
방두희
한수민
장양수
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Publication of KR20160006580A publication Critical patent/KR20160006580A/ko
Application granted granted Critical
Publication of KR101753884B1 publication Critical patent/KR101753884B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/115Aptamers, i.e. nucleic acids binding a target molecule specifically and with high affinity without hybridising therewith ; Nucleic acids binding to non-nucleic acids, e.g. aptamers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/04Endocrine or metabolic disorders
    • G01N2800/044Hyperlipemia or hypolipemia, e.g. dyslipidaemia, obesity

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Pathology (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 이상지질혈증(dyslipidemia), 보다 구체적으로는 가족성 고콜레스테롤혈증(familial hypercholesterolemia)에 대한 신규한 유전자 마커를 이용한 이상지질혈증의 진단용 키트에 관한 것이다.
본 발명은 유전적 요인으로 인한 질환에 있어서 전장 엑솜 시퀀싱을 토대로 돌연변이 발생여부를 판단하고 신규한 병원성 돌연변이를 동정하는 데에 효율적으로 적용될 수 있다. 본 발명은 유전자 또는 단백질 마커를 사용함으로써 가족성 고콜레스테롤혈증을 비롯한 이상지질혈증의 신뢰도 있는 조기진단 또는 발병 위험성 예측에 유용하게 이용될 수 있다.

Description

가족성 고콜레스테롤혈증과 관련된 신규한 돌연변이 및 그 용도{Novel Mutations Implicated in Familial Hypercholesterolemia and Use Thereof}
본 발명은 LDLR PCSK9 유전자 상의 신규한 병인성 돌연변이를 유전적 마커로 하여 가족성 고콜레스테롤증을 비롯한 다양한 이상지질혈증을 진단하는 방법에 관한 것이다.
가족성 고콜레스테롤혈증(FH)은 대개 LDLR 결합에 영향을 미치는 APOB에서의 돌연변이인 LDLR의 기능소실 돌연변이로 인해 유발되며, PCSK9의 기능획득 돌연변이는 보다 빈도가 낮다. 종래의 분자진단 기술에 의할 때, FH 유발 돌연변이는 피시험 환자의 40%에서만 검출되는 것으로 보고되었으며, 지역에 따라 유병률의 차이는 있으나 이들 40% 환자 중에서LDLR, APOBPCSK9 유전자 내 이형접합성 돌연변이가 각각 >90% <5% 및 <1%의 확률로 포함되어 있다(Austin et al. Am J Epidemiol 2004). FH에 대한 임상적 진단은 혈중 콜레스테롤 수준, 신체검사 및 가족력에 근거하여 이루어진다. 몇몇 연구진이 임상적 진단기준 및 가이드라인을 개발하였음에도 아직 논란이 남아있다(World Health Organization. 1999; Marks et al. Atherosclerosis 2003;National Institute for Health and Clinical Excellence. 2008; Minhas et al. Heart 2009). 특히, 돌연변이를 가지지 않는 환자로 인해 진단에 어려움을 겪고 있다(Humphries. Curr Opin Lipidol 2008).
종래의 분자진단 기술을 통해, FH-유발 돌연변이는 검사 환자들의 40%에서만 검출되었다(Taylor et al. Clin Genet 2010). 따라서, 차세대 시퀀싱(next-generation 시퀀싱)을 비롯하여 FH를 유발하는 추가적인 소수 유전자를 발굴하기 위한 연구가 진행되어 왔다. 지난 몇 년간, 차세대 시퀀싱으로 인하여 종래의 유전학 기법으로는 발견되지 못하던 몇몇 질환-관련 소수 변이체들을 발견할 수 있었다(Musunuru et al. NEJM 2010; Yang et al. NEJM 2013). 분석 및 필터링의 한계에도 불구하고, 이 기술은 멘델 유전질환을 비롯한 multiple conditions에 적용되어 왔다. 아울러, 이 기술이 비용-효율성은 꾸준히 증가하고 있다(Futema et al. J Med Genet 2012).
본 발명자들은 우성 FH를 가지는 한국인 FH 환자군에 대한 전장 엑솜 시퀀싱(whole exome sequencing)을 통해 알려진 유전자 내의 돌연변이의 스펙트럼/빈도에 대한 이해를 제공하고, 이전까지 FH 표현형에서 나타나지 않던 LDL-C 관련 유전자에 대한 종합적인 조사를 수행하고자 하였다.
본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명자들은 이상지질혈증, 보다 구체적으로는 가족성 고콜레스테롤증(FH)에 특이적인 돌연변이를 탐색함으로써 상기 질환에 대한 신뢰도 높은 유전자 진단 방법을 확립하기 위하여 예의 연구노력하였다. 그 결과, FH 환자에 대한 전장 엑솜 시퀀싱이 돌연변이 발생여부 및 돌연변이 다발부위를 확인하는 데 뿐 아니라 신규한 FH 유발 유전자 동정에도 효과적이라는 사실을 확인하고, 이를 통해 이제까지 알려지지 않은 LDLR PCSK9 유전자 상의 신규한 병인성 돌연변이를 발견함으로써, 본 발명을 완성하게 되었다.
따라서 본 발명의 목적은 이상지질혈증(dyslipidemia)의 진단용 키트를 제공하는 데 있다.
본 발명의 다른 목적 및 이점은 하기의 발명의 상세한 설명, 청구범위 및 도면에 의해 보다 명확하게 된다.
본 발명의 일 양태에 따르면, 본 발명은 서열목록 제1서열의 뉴클레오타이드에서 321번째부터 333번째까지의 염기의 결실을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제1서열의 뉴클레오타이드에서 2500번째부터 2502번째까지의 염기의 결실 및 2500번째 위치의 C의 삽입을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 및 서열목록 제2서열의 뉴클레오타이드에서 643번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열로 구성된 군으로부터 선택되는 변이형 뉴클레오타이드 서열에 특이적으로 결합하는 프라이머 또는 프로브를 포함하는 이상지질혈증(dyslipidemia)의 진단용 키트를 제공한다.
본 발명자들은 이상지질혈증, 보다 구체적으로는 가족성 고콜레스테롤증(FH)에 특이적인 돌연변이를 탐색함으로써 상기 질환에 대한 신뢰도 높은 유전자 진단 방법을 확립하기 위하여 예의 연구노력하였다. 그 결과, FH 환자에 대한 전장 엑솜 시퀀싱이 돌연변이 발생여부 및 돌연변이 다발부위를 확인하는 데 뿐 아니라 신규한 FH 유발 유전자 동정에도 효과적이라는 사실을 확인하고, 이를 통해 이제까지 알려지지 않은 LDLR PCSK9 유전자 상의 신규한 병인성 돌연변이를 발견하였다.
본 발명에 따르면, 서열목록 제1서열은 LDLR 유전자의 뉴클레오타이드 서열이며, 서열목록 제2서열은 PCSK9 유전자의 뉴클레오타이드 서열이다.
본 명세서에서 사용되는 용어 “이상지방혈증(dyslipidemia)”은 고지혈증을 포함하는 개념으로, 혈액내의 지방수치 증가로 나타나는 고콜레스테롤혈증, 고중성지방혈증, 낮은 HDL-콜레스테롤혈증 외에도 지단백의 대사이상 등의 문제로 나타나는 비정상적 지질상태를 의미한다. 구체적으로는, 본 발명의 진단키트로 진단하고자 하는 이상지질혈증은 고지혈증(hyperlipidemia)이다.
본 명세서에서 용어 “고지혈증”은 중성 지방과 콜레스테롤 등의 지방대사가 제대로 이루어지지 않아 혈액 중에 지방량이 많아 유발되는 질환을 말한다. 보다 구체적으로 고지혈증이란 혈액내의 중성지방, LDL 콜레스테롤, 인지질 및 유리 지방산 등의 지질 성분이 증가된 상태로 발생빈도가 높은 고콜레스테롤혈증 또는 고중성지방혈증을 포함한다.
구체적으로는, 본 발명의 진단키트로 진단하고자 하는 이상지질혈증은 고콜레스테롤혈증(hypercholesterolemia)이고, 보다 구체적으로는 가족성 고콜레스테롤혈증(Familial hypercholesterolemia)이다. 본 명세서에서 용어 “가족성 고콜레스테롤혈증”은 유전적 요인에 의해 혈중 콜레스테롤 농도가 높아지는 질환을 의미한다.
본 명세서에서, 용어“진단”은 특정 질병 또는 질환에 대한 한 객체의 감수성(susceptibility)을 판정하는 것, 한 객체가 특정 질병 또는 질환을 현재 가지고 있는 지 여부를 판정하는 것, 특정 질병 또는 질환에 걸린 한 객체의 예후(prognosis)를 판정하는 것, 또는 테라메트릭스(therametrics)(예컨대, 치료 효능에 대한 정보를 제공하기 위하여 객체의 상태를 모니터링 하는 것)을 포함한다. 본 발명에 따르면, 본 발명의 돌연변이를 마커로 하여 이의 존재가 상술한 방법을 통해 확인되면 지질과산화물 등의 산화 산물 수준이 높아져 산화 스트레스 관련 질환의 발병 위험도가 높은 것으로 판단된다.
본 명세서에서, 용어“뉴클레오타이드”는 단일가닥 또는 이중가닥 형태로 존재하는 디옥시리보뉴클레오타이드 또는 리보뉴클레오타이드이며, 다르게 특별하게 언급되어 있지 않은 한 자연의 뉴클레오타이드의 유사체를 포함한다(Scheit, Nucleotide Analogs, John Wiley, New York(1980); Uhlman 및 Peyman, Chemical Reviews, 90:543-584(1990)).
본 명세서에서 사용되는 용어 “프라이머”는 올리고뉴클레오타이드를 의미하는 것으로, 핵산쇄(주형)에 상보적인 프라이머 연장 산물의 합성이 유도되는 조건, 즉, 뉴클레오타이드와 DNA 중합효소와 같은 중합제의 존재, 그리고 적합한 온도와 pH의 조건에서 합성의 개시점으로 작용할 수 있다. 바람직하게는, 프라이머는 디옥시리보뉴클레오타이드이며 단일쇄이다. 본 발명에서 이용되는 프라이머는 자연(naturally occurring) dNMP(즉, dAMP, dGMP, dCMP 및 dTMP), 변형 뉴클레오타이드 또는 비-자연 뉴클레오타이드를 포함할 수 있다. 또한, 프라이머는 리보뉴클레오타이드도 포함할 수 있다.
본 발명의 프라이머는 타겟 핵산에 어닐링 되어 주형-의존성 핵산 중합효소에 의해 타겟 핵산에 상보적인 서열을 형성하는 연장 프라이머(extension primer)일 수 있으며, 이는 고정화 프로브가 어닐링 되어 있는 위치까지 연장되어 프로브가 어닐링 되어 있는 부위를 차지한다.
본 발명에서 이용되는 연장 프라이머는 타겟 핵산의 제1위치에 상보적인 혼성화 뉴클레오타이드 서열을 포함한다. 용어 “상보적”은 소정의 어닐링 또는 혼성화 조건하에서 프라이머 또는 프로브가 타겟 핵산 서열에 선택적으로 혼성화할 정도로 충분히 상보적인 것을 의미하며, 실질적으로 상보적(substantially complementary) 및 완전히 상보적(perfectly complementary)인 것을 모두 포괄하는 의미를 가지며, 바람직하게는 완전히 상보적인 것을 의미한다. 본 명세서에서, 프라이머 서열과 관련하여 사용되는 용어, “실질적으로 상보적인 서열”은 완전히 일치되는 서열뿐만 아니라, 특정 서열에 어닐링하여 프라이머 역할을 할 수 있는 범위 내에서, 비교 대상의 서열과 부분적으로 불일치되는 서열도 포함되는 의미이다.
프라이머는, 중합제의 존재 하에서 연장 산물의 합성을 프라이밍시킬 수 있을 정도로 충분히 길어야 한다. 프라이머의 적합한 길이는 다수의 요소, 예컨대, 온도, 응용분야 및 프라이머의 소스(source)에 따라 결정되지만 전형적으로 15-30 뉴클레오타이드이다. 짧은 프라이머 분자는 주형과 충분히 안정된 혼성 복합체를 형성하기 위하여 일반적으로 보다 낮은 온도를 요구한다. 용어 “어닐링” 또는 “프라이밍”은 주형 핵산에 올리고디옥시뉴클레오타이드 또는 핵산이 병치(apposition)되는 것을 의미하며, 상기 병치는 중합효소가 뉴클레오타이드를 중합시켜 주형 핵산 또는 그의 일부분에 상보적인 핵산 분자를 형성하게 한다.
프라이머의 서열은 주형의 일부 서열과 완전하게 상보적인 서열을 가질 필요는 없으며, 주형과 혼성화 되어 프라이머 고유의 작용을 할 수 있는 범위 내에서의 충분한 상보성을 가지면 충분하다. 따라서 본 발명에서의 프라이머는 주형인 상술한 뉴클레오티드 서열에 완벽하게 상보적인 서열을 가질 필요는 없으며, 이 유전자 서열에 혼성화되어 프라이머 작용을 할 수 있는 범위 내에서 충분한 상보성을 가지면 충분하다. 이러한 프라이머의 디자인은 상술한 뉴클레오티드 서열을 참조하여 당업자에 의해 용이하게 실시할 수 있으며, 예컨대, 프라이머 디자인용 프로그램(예: PRIMER 3 프로그램)을 이용하여 할 수 있다.
본 명세서에서, 용어 “핵산 분자”는 DNA(gDNA 및 cDNA) 그리고 RNA 분자를 포괄적으로 포함하는 의미를 갖으며, 핵산 분자에서 기본 구성 단위인 뉴클레오타이드는 자연의 뉴클레오타이드뿐만 아니라, 당 또는 염기 부위가 변형된 유사체 (analogue)도 포함한다(Scheit, Nucleotide Analogs, John Wiley, New York(1980); Uhlman 및 Peyman, Chemical Reviews, 90:543-584(1990)).
본 발명의 키트에서 출발물질이 gDNA인 경우, gDNA의 분리는 당업계에 공지된 통상의 방법에 따라 실시될 수 있다(참조: Rogers & Bendich (1994)).
출발물질이 mRNA인 경우에는, 당업계에 공지된 통상의 방법에 총 RNA를 분리하여 실시된다(참조: Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001); Tesniere, C. et al., Plant Mol. Biol. Rep., 9:242(1991); Ausubel, F.M. et al., Current Protocols in Molecular Biology, John Willey & Sons(1987); 및 Chomczynski, P. et al., Anal. Biochem. 162:156(1987)). 분리된 총 RNA는 역전사효소를 이용하여 cDNA로 합성된다. 상기 총 RNA는 인간(예컨대, 비만 또는 당뇨 환자)으로부터 분리된 것이기 때문에, mRNA의 말단에는 폴리-A 테일을 갖고 있으며, 이러한 서열 특성을 이용한 올리고 dT 프라이머 및 역전사 효소를 이용하여 cDNA을 용이하게 합성할 수 있다(참조: PNAS USA, 85:8998(1988); Libert F, et al., Science, 244:569(1989); 및 Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001)).
본 발명의 키트에 있어서, 상기 특정 서열을 규명하는 것은 당업계에 공지된 다양한 방법을 응용하여 실시될 수 있다. 예를 들어, 본 발명에 응용될 수 있는 기술은, 형광 인 시투 혼성화 (FISH), 직접적 DNA 서열결정, PFGE 분석, 서던 블롯 분석, 단일-가닥 컨퍼메이션 분석(SSCA, Orita et al., PNAS, USA 86:2776(1989)), RNase 보호 분석(Finkelstein et al., Genomics, 7:167(1990)), 닷트 블롯 분석, 변성 구배 젤 전기영동(DGGE, Wartell et al., Nucl.Acids Res., 18:2699(1990)), 뉴클레오타이드 미스매치를 인식하는 단백질(예: E. coli의 mutS 단백질)을 이용하는 방법(Modrich, Ann. Rev. Genet., 25:229-253(1991)) 및 대립형-특이 PCR을 포함하나, 이에 한정되는 것은 아니다.
서열변화가 단일-가닥 분자내 염기 결합의 차이를 초래하여, 이동성이 다른 밴드를 출현하게 하는 데, SSCA는 이 밴드를 검출한다. DGGE 분석은 변성 구배 젤을 이용하여, 야생형 서열과 다른 이동성을 나타내는 서열을 검출한다.
다른 기술들은 일반적으로 본 발명의 돌연변이를 포함하는 서열에 상보적인 프로브 또는 프라이머를 이용한다.
예를 들어, RNase 보호 분석에서, 본 발명의 돌연변이를 포함하는 서열에 상보적인 리보프로브가 이용된다. 상기 리보프로브와 인간으로부터 분리한 DNA 또는 mRNA를 혼성화시키고, 이어 미스매치를 검출할 수 있는 RNase A 효소로 절단한다. 만일, 미스매치가 있어 RNase A가 인식을 한 경우에는, 보다 작은 밴드가 관찰된다.
본 발명이 프라이머를 이용한 유전자 증폭 방식으로 실시되는 경우, 당업계에 보고된 다양한 증폭 반응을 통해 실시될 수 있으며, 이는 중합효소 연쇄반응(PCR)(미국 특허 제4,683,195, 4,683,202 및 4,800,159호), 역전사-중합효소 연쇄반응(RT-PCR)(Sambrook 등, Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001)), Miller, H. I.(WO 89/06700) 및 Davey, C. 등(EP 329,822)의 방법, 리가아제 연쇄 반응(ligase chain reaction; LCR)(17, 18), Gap-LCR(WO 90/01069), 복구 연쇄 반응(repair chain reaction; EP 439,182), 전사-중재 증폭(transcription-mediated amplification; TMA)(19) (WO 88/10315), 자가 유지 염기서열 복제(self sustained sequence replication)(20)(WO 90/06995), 타깃 폴리뉴클레오티드 염기서열의 선택적 증폭(selective amplification of target polynucleotide sequences)(미국 특허 제6,410,276호), 컨센서스 서열 프라이밍 중합효소 연쇄 반응(consensus sequence primed polymerase chain reaction; CP-PCR)(미국 특허 제4,437,975호), 임의적 프라이밍 중합효소 연쇄 반응(arbitrarily primed polymerase chain reaction; AP-PCR)(미국 특허 제5,413,909호 및 제5,861,245호), 핵산 염기서열 기반 증폭(nucleic acid sequence based amplification; NASBA)(미국 특허 제5,130,238호, 제5,409,818호, 제5,554,517호 및 제6,063,603호), 가닥 치환 증폭(strand displacement amplification)(21, 22) 및 고리-중재 항온성 증폭(loop-mediated isothermal amplification; LAMP)(23)를 포함하나, 이에 한정되지는 않는다.
PCR은 가장 잘 알려진 핵산 증폭 방법으로, 그의 많은 변형과 응용들이 개발되어 있다. 예를 들어, PCR의 특이성 또는 민감성을 증진시키기 위해 전통적인 PCR 절차를 변형시켜 터치다운(touchdown) PCR, 핫 스타트(hot start) PCR, 네스티드(nested) PCR 및 부스터(booster) PCR이 개발되었다. 또한, 실시간(real-time) PCR, 분별 디스플레이 PCR(differential display PCR: DD-PCR), cDNA 말단의 신속 증폭(rapid amplification of cDNA ends: RACE), 멀티플렉스 PCR, 인버스 중합효소 연쇄반응(inverse polymerase chain reaction: IPCR), 벡토레트(vectorette) PCR 및 TAIL-PCR(thermal asymmetric interlaced PCR)이 특정한 응용을 위해 개발되었다. PCR에 대한 자세한 내용은 McPherson, M.J. 및 Moller, S.G. PCR. BIOS Scientific Publishers, Springer-Verlag New York Berlin Heidelberg, N.Y. (2000)에 기재되어 있다.
본 발명의 방법을 프라이머를 이용하여 실시하는 경우에는, 유전자 증폭 반응을 실시하여 본 발명의 마커 뉴클레오티드 서열을 분석하여 진단한다.
혼성화 시그널을 이용하는 분석에서, 본 발명의 돌연변이를 포함하는 서열에 상보적인 프로브가 이용된다. 이러한 기술에서, 프로브와 타깃 서열의 혼성화 시그널을 검출하여 직접적으로 질환의 위험도를 결정한다.
본 명세서에서, 용어 “프로브”는 특정 뉴클레오타이드 서열에 혼성화될 수 있는 디옥시리보뉴클레오타이드 및 리보뉴클레오타이드를 포함하는 자연 또는 변형되는 모노머 또는 결합을 갖는 선형의 올리고머를 의미한다. 바람직하게는, 프로브는 혼성화에서의 최대 효율을 위하여 단일가닥이다. 프로브는 바람직하게는 디옥시리보뉴클레오타이드이다.
본 발명에 이용되는 프로브로서, 상기 돌연변이를 포함하는 서열에 완전하게(perfectly) 상보적인 서열이 이용될 수 있으나, 특이적 혼성화를 방해하지 않는 범위 내에서 실질적으로(substantially) 상보적인 서열이 이용될 수도 있다. 바람직하게는, 본 발명에 이용되는 프로브는 본 발명의 SNP를 포함하는 10-30개의 연속 뉴클레오타이드 잔기를 포함하는 서열에 혼성화될 수 있는 서열을 포함한다. 보다 바람직하게는, 상기 프로브의 3’-말단 또는 5’-말단은 상기 SNP 염기에 상보적인 염기를 갖는다. 일반적으로, 혼성화에 의해 형성되는 듀플렉스(duplex)의 안정성은 말단의 서열의 일치에 의해 결정되는 경향이 있기 때문에, 3’-말단 또는 5’-말단에 SNP 염기에 상보적인 염기를 갖는 프로브에서 말단 부분이 혼성화되지 않으면, 이러한 듀플렉스는 엄격한 조건에서 해체될 수 있다.
혼성화에 적합한 조건은 Joseph Sambrook, et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001) 및 Haymes, B. D., et al., Nucleic Acid Hybridization, A Practical Approach, IRL Press, Washington, D.C. (1985)에 개시된 사항을 참조하여 결정할 수 있다. 혼성화에 이용되는 엄격한 조건(stringent condition)은 온도, 이온세기(완충액 농도) 및 유기 용매와 같은 화합물의 존재 등을 조절하여 결정될 수 있다. 이러한 엄격한 조건은 혼성화되는 서열에 의존하여 다르게 결정될 수 있다.
본 발명의 또 다른 양태에 따르면, 본 발명은 서열목록 제3서열 내지 제5서열의 아미노산 서열로 구성된 군으로부터 선택되는 변이형 아미노산 서열에 특이적으로 결합하는 항체 또는 앱타머를 포함하는 이상지질혈증(dyslipidemia)의 진단용 키트를 제공한다.
본 발명에 따르면, 서열목록 제3서열 내지 제5서열의 아미노산 서열은 본 발명자들에 의해 발견된 상술한 변이 뉴클레오타이드들이 각각 인코딩하는 변이 단백질의 아미노산 서열이다. 본 발명에 의해 새롭게 발견된 LDLR PCSK9 유전자의 뉴클레오타이드 상의 돌연변이는 야생형(wild-type) LDLR 및 PCSK9 단백질의 아미노산 서열에도 변이를 일으킨다. 따라서, 본 발명의 키트는 본 발명의 돌연변이 뉴클레오타이드가 인코딩하는 변이 단백질을 항원-항체 반응을 이용한 면역분석(immunoassay) 방법에 따라 검출하여 이상지질혈증 관련 질환을 진단하는 데 이용될 수 있다.
이러한 면역분석은 종래에 개발된 다양한 면역분석(immunoassay) 또는 면역염색(immunostaining) 프로토콜에 따라 실시될 수 있다. 예를 들어, 본 발명의 방법이 방사능면역분석 방법에 따라 실시되는 경우, 방사능동위원소(예컨대, C14, I125, P32 및 S35)로 레이블링된 항체가 변이 Lp-PLA2 단백질을 검출하는 데 이용될 수 있다.
본 발명에서 이용되는 변이 단백질에 대한 항체는 폴리클로날 또는 모노클로날 항체이며, 바람직하게는 모노클로날 항체이다.
변이 단백질에 대한 항체는 당업계에서 통상적으로 실시되는 방법들, 예를 들어, 융합 방법(Kohler and Milstein, European Journal of Immunology, 6:511-519(1976)), 재조합 DNA 방법(미국 특허 제4,816,567호) 또는 파아지 항체 라이브러리 방법(Clackson et al, Nature, 352:624-628(1991) 및 Marks et al, J. Mol. Biol., 222:58, 1-597(1991))에 의해 제조될 수 있다. 항체 제조에 대한 일반적인 과정은 Harlow, E. and Lane, D., Using Antibodies: A Laboratory Manual, Cold Spring Harbor Press, New York, 1999; Zola, H., Monoclonal Antibodies: A Manual of Techniques, CRC Press, Inc., Boca Raton, Florida, 1984; 및 Coligan , CURRENT PROTOCOLS IN IMMUNOLOGY, Wiley/Greene, NY, 1991에 상세하게 기재되어 있다. 예를 들어, 단일클론 항체를 생산하는 하이브리도마 세포의 제조는 불사멸화 세포주를 항체-생산 림프구와 융합시켜 이루어지며, 이 과정에 필요한 기술은 당업자에게 잘 알려져 있으며 용이하게 실시할 수 있다. 폴리클로날 항체는 상술한 변이 단백질 항원을 적합한 동물에게 주사하고, 이 동물로부터 항혈청을 수집한 다음, 공지의 친화성(affinity) 기술을 이용하여 항혈청으로부터 항체를 분리하여 얻을 수 있다.
상술한 면역분석 과정에 의한 최종적인 시그널의 세기를 분석함으로써, 산화 스트레스 관련 질환을 진단할 수 있다. 즉, 인간의 시료에서 변이 단백질에 대한 시그널이 정상 시료 보다 강하게 나오는 경우에는 산화 스트레스 관련 질환의 위험도가 높은 것으로 진단된다.
본 발명의 키트는 항체 대신에 변이 상술한 변이 LDLR 및 PCSK9 단백질에 특이적으로 결합하는 앱타머를 이용할 수 있다. 본 명세서에서 용어“앱타머”는 단일 줄기의(single-stranded) 핵산(RNA 또는 DNA) 분자 또는 펩타이드 분자로서 특정 표적물질에 높은 친화력과 특이성으로 결합하여 작용을 나타내는 것을 의미한다. 앱타머의 일반적인 내용은 Bock LC et al., Nature 355(6360):5646(1992); Hoppe-Seyler F, Butz K "Peptide aptamers: powerful new tools for molecular medicine". J Mol Med. 78(8):42630(2000); Cohen BA, Colas P, Brent R . "An artificial cell-cycle inhibitor isolated from a combinatorial library". Proc Natl Acad Sci USA. 95(24):142727(1998)에 상세하게 개시되어 있다.
본 발명의 또 다른 양태에 따르면, 본 발명은 서열목록 제6서열의 뉴클레오타이드에서 1018번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제6서열의 뉴클레오타이드에서 1028번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제6서열의 뉴클레오타이드에서 2608번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제7서열의 뉴클레오타이드에서 71번째 염기의 A에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제7서열의 뉴클레오타이드에서 677번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제8서열의 뉴클레오타이드에서 259번째 염기의 G에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제8서열의 뉴클레오타이드에서 1150번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제9서열의 뉴클레오타이드에서 808번째 염기의 A에서 G로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제10서열의 뉴클레오타이드에서 355번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제11서열의 뉴클레오타이드에서 1276번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제11서열의 뉴클레오타이드에서 2765번째 염기의 C에서 G로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제11서열의 뉴클레오타이드에서 3253번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제12서열의 뉴클레오타이드에서 307번째 염기의 T에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제13서열의 뉴클레오타이드에서 1033번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제13서열의 뉴클레오타이드에서 1133번째 염기의 T에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제14서열의 뉴클레오타이드에서 75번째 염기의 G에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제15서열의 뉴클레오타이드에서 926번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제16서열의 뉴클레오타이드에서 220번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제16서열의 뉴클레오타이드에서 857번째 염기의 A에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제17서열의 뉴클레오타이드에서 1055번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제17서열의 뉴클레오타이드에서 1901번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제18서열의 뉴클레오타이드에서 1933번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제19서열의 뉴클레오타이드에서 1169번째 염기의 G에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제20서열의 뉴클레오타이드에서 1744번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제21서열의 뉴클레오타이드에서 6493번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제22서열의 뉴클레오타이드에서 2371번째 염기의 T에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제23서열의 뉴클레오타이드에서 304번째 염기의 C에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제24서열의 뉴클레오타이드에서 46번째 염기의 C에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제25서열의 뉴클레오타이드에서 1321번째 염기의 A에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제26서열의 뉴클레오타이드에서 3775번째 염기의 G에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제27서열의 뉴클레오타이드에서 607번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제28서열의 뉴클레오타이드에서 328번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 및 서열목록 제29서열의 뉴클레오타이드에서 6170번째 염기의 G에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열로 구성된 군으로부터 선택되는 변이형 뉴클레오타이드 서열에 특이적으로 결합하는 프라이머 또는 프로브를 포함하는 이상지질혈증(dyslipidemia)의 진단용 키트를 제공한다.
본 발명에 따르면, 본 발명자들은 상술한 LDLR PCSK9 유전자 상의 신규한 병인성 돌연변이 외에도, 유전자 크기-조정 결합순위, GWAS, 경로 데이터베이스 및 LDLR의 PPI(protein-protein interaction) 네트워크로부터의 매핑을 통해 FH를 유발하는 다양한 유전자 상의 돌연변이를 탐색해냈다. 하기의 실시예에서 보는 바와 같이, 이들 중 상기에서 나열한 29개 유전자 상의 34개 돌연변이는 Polyphen-2 및 SIFT 예측 모두에서 FH를 유발하는 유해 돌연변이로 판명됨으로써, FH의 유전적 위험을 판단할 수 있는 신뢰도 있는 유전자 마커임이 확인되었다.
본 발명의 구체적인 구현예에 따르면, 본 발명의 진단대상 개체 중 상술한 기 변이형 뉴클레오타이드 또는 변이형 아미노산가 검출된 개체는 증가된 이상지질혈증(dyslipidemia) 위험도를 나타낸다.
본 발명의 구체적인 구현예에 따르면, 본 발명의 키트는 아시아인에게 적용된다.
본 명세서에서 용어“아시아”는 한국, 중국 및 일본 등을 비롯한 몽골계 인종이 거주하는 극동 지역을 의미한다. “아시아인”이란 조상이 아시아인인 개체군을 의미하며, 바람직하게는 적어도 10대 이상의 조상이 아시아인인 개체군을 의미한다. 보다 구체적으로는, 본 발명의 아시아인은 한국인이다.
본 발명의 특징 및 이점을 요약하면 다음과 같다:
(a) 본 발명은 이상지질혈증(dyslipidemia)의 진단용 키트를 제공한다.
(b) 본 발명은 유전적 요인으로 인한 질환에 있어서 전장 엑솜 시퀀싱을 토대로 돌연변이 발생여부를 판단하고 신규한 병원성 돌연변이를 동정하는 데에 효율적으로 적용될 수 있다.
(c) 본 발명은 유전자 또는 단백질 마커를 사용함으로써 가족성 고콜레스테롤증을 비롯한 이상지질혈증의 신뢰도 있는 조기진단 또는 발병 위험성 예측에 유용하게 이용될 수 있다.
도 1은 FH에 대한 엑솜 시퀀싱 과정의 워크 플로우를 나타내는 그림으로, 3개의 유전자 내에 존재하는 FH 유발 변이를 동정하기 위한 과정을 보여준다. 이어서, 수득한 전장 엑솜 시퀀싱 데이터에 대해 유전학적 분석을 수행하여 FH를 유발하는 후보 유전자를 동정한다. a3명 이상의 FH 환자가 생어 시퀀싱으로 스크리닝되어 LDLR 유전자 내에 p.P685L를 가지는 것으로 확인됨. b필터링 및 통계분석의 품질관리 전략은 도 5에 설명.
도 2는 LDLR p.D834Rfs/- 돌연변이를 가지는 환자의 가계도 분석결과를 나타낸 그림이다. 도 2a는 P05 가계의 단순화된 가계도를 보여준다. 오른쪽 상단의 화살표는 프로밴드를 나타내며, 사각형과 원형은 각각 남성 및 여성을 나타낸다. 흰색 도형은 질환을 가지지 않은 개체를, 검은색 도형은 질환을 가진 개체를 의미한다. 별표는 임상 검사 및 분자적 분석을 거친 가족 구성원을 나타낸다. 도 2b는 임상 검사 데이터 및 시퀀싱 크로마토그램을 보여준다. 수직 화살표는 돌연변이 부위를 나타낸다. 도 2c는 p.D834Rfs/-의 IGV(Integrative Genomics Viewer) 스크린샷을 나타내며, cis-부위에서 단일염기 치환(G>C) 및 fs-결실(AT/-)이 발생했음을 알 수 있다.
도 3은 LDLR 유전자에서의 복제수 변이(CNV) 검출결과를 보여주는 그림이다. SVD-ZRPKM 값을 이용하여 CNV를 검출하였으며, SVD-ZRPKM 값은 모든 분석된 엑솜들의 평균 및 표준편차 값에 근거하여 RPKM(Reads per kilobase per million) 값을 표준화된 z-점수(ZRPKM 값)으로 변환함으로써 계산하였다. 도 3a는 LDLR 유전자의 많은 복제수 결실을 가지는 P25 환자의 SVD-ZRPKM 부분 플롯을 보여준다. 도 3b는 유전적 카피수 결실을 가지는 P25 환자 및 그의 가족(P17-F01)들의 SVD-ZRPKM 부분 플롯을 보여준다. 녹색과 파란색은 각각 P17 and P17-F01의 SVD-ZRPKM 값을 나타낸다. 각 값들은 P17에 기반하여 플롯팅하였다. 도 3c는 CNV를 가지는 P17 환자의 가계도를 보여주는 그림이다. 오른쪽 상단의 화살표는 프로밴드를 나타내며, 사각형과 원형은 각각 남성 및 여성을 나타낸다. 흰색 도형은 질환을 가지지 않은 개체를, 검은색 도형은 질환을 가진 개체를 의미한다. 별표는 임상 검사 및 분자적 분석을 거친 가족 구성원을 나타낸다. 도 3d는 P25, P17 및 P17 가족 구성원에 대한 TaqMan복제수 분석결과를 보여주는 그림이다.
도 4는 크기-조정 결합-순위 및 SKAT-O를 이용하여 유의한 유전자들에 대한 사후 순위를 도출한 결과를 보여준다. 도 4a는 69명의 FH 환자들 및 263명의 대조군에 대해 SKAT-O를 이용하여 도출한 P-값의 맨하탄 플롯을 나타낸다. 붉은 선은 본 발명에서 MAF<0.005를 이용하여 도출한 전장 엑솜 유의성 역치(exome-wide significance threshold)(P=2.69 x10-6, 0.05/18,611 변이)를 보여준다. 플롯을 통해 LDLR 유전자가 가장 유의한 유전자임을 알 수 있으며, MAF<0.01인 변이를 이용한 경우 같은 결과가 나타난다. 도 4b는 SKAT-O(MAF<0.005)를 이용하여 유전학적으로 진단받지 않은 47명의 FH 환자 및 263명의 대조군에 대한 P-값의 맨하탄 플롯을 도출한 결과를 보여준다. SKAT-Op < 6x10-5의 유전자들(플롯 상단의 점선 사각형 내에 포함된 유전자) 중에서, 크기-조정 결합-순위가 500 이내인 14개의 유전자를 하기의 표에 나열하였다. 보다 유의한 P-값(MAF 0.01 또는 0.005)은 SKAT-O의 P-값으로 표시하였다.
도 5는 통계적 분석에 대한 필터링 전략 및 품질관리 절차를 보여준다. 필터 (1) 및 (2)는 유전자 크기-조정 결합-순위 및 SKAT-O 검정을 위해 일반적으로 적용된다. 나아가, 유전자 크기-조정 결합-순위에 대한 필터링 단계(파란 화살표) 및 SKAT-O에 대한 필터링 단계(붉은 화살표)를 각각 나타냈다. 돌연변이 양성 환자들을 필터링하기 전에 LDLR 유전자가 가장 유의한 유전자임을 동정함으로써 각각의 통계적 접근이 유효함을 확인하였다.
도 6은 ATP8A1 변이를 가지는 환자의 가계도 분석결과를 나타낸 그림이다. 도 6a는 P52 가계의 단순화된 가계도를 나타낸다. ATP8A1 내의 p.A1061T 변이는 다른 두 가족구성원도 가지고 있었다. 도 6b는 P14 가계의 단순화된 가계도를 나타낸다. ATP8A1 내의 p.A1061T 변이는 다른 가족구성원에는 없었다. 도 6c는 P54 가계의 단순화된 가계도를 나타낸다. ATP8A1 내의 p.T270A 변이는 질환이 없는 다른 가족구성원 한명에서도 나타났다. 오른쪽 상단의 화살표는 프로밴드를 나타내고, 사각형은 남성을, 원형은 여성을 나타낸다. 흰색 도형은 질환을 가지지 않은 개체를, 검은색 도형은 질환을 가진 개체를 의미한다. 별표는 임상 검사 및 분자적 분석을 거친 가족 구성원을 나타내며, WT는 야생형을 의미한다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.
실시예
실험방법
환자의 등록
FH 환자 및 이들의 가족을 한국의 9개 지역에서 모집하였고, 실험절차는 각 지역 센터의 의학연구윤리심의위원회(IRB)의 승인을 받았다. Simon Broome 기준(Marks et al, 2003)에 부합하는 환자를 각 지역에서 등록하였다. “명확한 FH”여부의 판단기준은 총 콜레스테롤(TC)이 290 mg/dL 이상이거나 LDL-C가 190 mg/dL 이상이면서 동시에 환자 또는 친지가 건 황색종(tendon xanthomas)을 가지거나; 또는 LDL, APOB 또는 PCSK9 수용체 돌연변이 또는 apo B-100 유전자의 가족성 결실에 대한 유전자적 증거가 있는 경우로 정의하였다. “잠재적인 FH”의 판단기준은 상술한 콜레스테롤 수준을 가지면서 조기 심근경색(premature myocardial infarction)의 가족력 또는 290 mg/dL 이상의 콜레스테롤 농도를 가지는 경우로 정의하였다.
등록 시에 각 환자들은 병력에 대한 면담을 하고 종합적인 신체검사 및 연구실 검사를 받았다. 모든 대상자 또는 이들의 대표자들에게 동의서를 받았으며, 본 발명을 위한 연구는 연세대학교 의과대학 의학연구윤리심의위원회의 승인 하에 실시되었다.
모든 환자의 TC, 중성지방(TG), HDL-C(high-density lipoprotein- cholesterol) 및 LDL-C를 조사하였다. 환자들에게 혈역채취 최소 12시간 전에는 금식하고 음주 및 흡연을 하지 않도록 지시하였다. 시료는 4시간 이내에 대한의학협회에서 공인하는 지역 연구실에서 분석하였다.
건강한 대조군 데이터 세트의 등록
FH가 없는 390명의 건강한 한국인들을 대조군으로 하였다. 본 발명자들은 국립중앙인체자원은행으로부터 95개의 미가공 엑솜 시퀀싱 데이터를 수집하였으며, 나머지 295개의 엑솜 데이터 세트는 본 발명자들에 의해 수득되었다. 모든 대조군 데이터 세트는 FH 환자 엑솜에 대한 동일한 분석 파이프라인 하에서 프로세싱되었다. 이들 대조군 대상자들은 혈장 지질수준에 영향을 미치는 것으로 알려진 여하한 증상도 가지지 않았다.
전장 엑솜 시퀀싱 및 데이터 분석
엑솜 시퀀싱은 Agilent SureSelect Enrichment System를 이용하여 제조사의 설명서에 따라 수행하였다. 수집 시점의 차이로 인하여, 24명의 환자에 대해서는 SureSelect All Exon 50Mb를, 25명의 환자에 대해서는 SureSelect All Exon V4+UTRs 키트를 각각 사용하였다.
엑솜 시퀀싱 데이터의 요약
 
 
 
중앙값
깊이 (X)
Coverage
중앙값 1X (%) 중앙값 8X (%) 중앙값 20X (%)
FH 환자
(n=69)
SureSelect All Exon 50Mb (n=44) 49.59 95.71 88.36 75.62
SureSelect All Exon V4+UTRs (n=25) 62.96 99.37 96.13 83.46
건강한 대조군
(n=390)
SureSelect All Exon 50Mb (n=145) 60.31 92.16 84.16 74.96
Truseq (n=118) 34.40 66.13 53.44 46.36
SureSelect All Exon V4+UTRs(n=127) 92.68 99.48 97.99 92.15
엑솜 시퀀싱은 각각의 세트에 대한 101-bp 및 150-bp 페어드 엔드(paired end) 시퀀싱을 통해 Illumina HiSeq2000/2500 상에서 실시하였다.
페어드 리드 시퀀싱은 Novoalign(v2.07.18)을 이용하여 기준 유전자인 NCBI Build 37 (hg19)에 대해 매핑하였다. 오배치(misalignment)에 의한 거짓 양성(false positives)을 감소시키기 위하여, Burrows-Wheeler Aligner(BWA, v0.6.2)를 이용한 추가적인 매핑을 시행하였다.
두 개의 독립적인 배치자(aligner)를 통한 보존적 리드 매핑을 이용하여 오배치 경향 사이트의 변이를 필터링하였다. 1차적으로 배치된 리드는 indels(삽입 또는 삭제) 근처로 재배치되어 Genome Analysis Toolkit(v2.3.6)으로 프로세싱하였다. PCR 복제물은 Picard(v1.6.7)를 이용해 제거하였다.
변이 추출(Variant call)은 Unified GATK Genotyper(v2.3.6)를 이용하여 수행하였으며, 8x 범위(coverage) 내에서 추출되었을 경우에만 유지하였다. 단일염기 변이(SNV)에 대한 주석 및 기능에 대한 영향의 예측은 PolyPhen-2(v2.2.2)(Adzhubei et al, 2010, nature method), SIFT(Kumer P et al, 2009, Nat Protoc) 및 ANNOVAR(Wang K et al. 2010. NAR)를 이용하여 수행하였다. 작은 indel은 ANNOVAR를 통해 주석을 달았다. 추가적으로, 종래의 주석 프로그램에 의해 누락도기 쉬운 스플라이싱 사이트 및 프로모터 부위에 대해 전체 변이를 다시 스크리닝하였다.
스플라이싱 사이트 변이에 있어서, 본 발명자들은 UCSC Table Browser로부터 다운로드받은 모든 전사체 이형(isoform)의 엑손의 ±50bp를 스크리닝하였다. 병인성인 것으로 보고된 LDLR, APOB PCSK9 유전자의 프로모터 변이는 공공 데이터베이스(The Human Gene Mutation Database, HGMD:http://www.hgmd.org/)에서 수득하였으며, 알려진 프로모터 변이가 유전학적으로 진단되지 않은 환자에게서 나타나는지 여부를 스크리닝하였다. 마지막으로, SVD(singular value decomposition) 표준화를 이용하는 CoNIFER(Copy Number Inference From Exome Reads) 알고리즘을 통해 시퀀싱된 엑솜 리드로부터 복제수 변화를 추측하였다. 복제수 변이(Copy number variants, CNVs)는 TaqMan Copy Number Assay를 이용하여 확인하였다(표 2).
TaqMan 복제수 분석 정보
유전자 어세이 ID 어세이 위치
(NCBI Build 37)
어세이 사이토밴드 어세이 유전자 위치
LDLR Hs07151140_cn Chr19:11218010 19p13.2b 5번 인트론 내
LDLR Hs07156441_cn Chr19:11226702 19p13.2b 인트론 10 - 엑손 11에 걸쳐 중첩
병인성의 예측 및 돌연변이의 확인
LDLR, APOB PCSK9 유전자의 병인성 돌연변이는 종래 보고된 원인변이를 근거로 분류하였다(LOVD-LDLR:http://www.ucl.ac.uk/ldlr/LOVD v.1.1.0/, LSBD-UMD-LDLR:http://www.umd.be/LDLR/, LOVD2-LDLR: https://grenada.lumc.nl/LOVD2/UCL-Heart/home.php 및 HGMD: http://www.hgmd.org/). LDLR, APOB PCSK9 유전자의 보고되지 않은 변이의 병인성은 1) 아미노산 변화의 유해성, Polyphen-2(Adzhubei et al, 2010, nature method) 및 SIFT (Kumer P et al, 2009, Nat Protoc)에 의해 예측된 진화적 보존성; 2) 263명의 건강한 한국인 대조군 및 공공 데이터베이스(1000 genome, dbSNP135 및 Exome Sequencing Project (ESP)); 및 3) 가족 구성원 내에서 동일한 변이의 공-분리(cosegregation)(가능한 경우)에 기반하여 예측하였다.
마지막으로, 대조군에는 존재하지 않으면서 질환을 가지는 가족 구성원에 존재하는, 알려지지 않은 유해한 기능성 돌연변이는 신규 병인성 돌연변이로 분류하였다. 3개의 유전자에서 알려진 병인성 돌연변이 및 신규 병인성 돌연변이로 분류된 모든 변이는 생어 시퀀싱으로 확인하였다.
초기 순위 및 rho값 측정을 위한 SKAT-O
부하 검사 및 비-부하 검사(SKAT)를 통합하는 SKAT-O(Optimal unified test)를 통해 희소변이의 연관을 조사하였다. 평균 SKAT 및 부하 검사의 비중인 rho(ρ)값은 SKAT-O R-패키지를 이용하여 추정하였다. 추정 ρ가 1일 때, SKAT-O 통계 부하검사 통계에 수렴한다. ρ가 1에 가까울 때, 유전자는 단방향성 효과를 가지는 부하검사에 적합하다. 본 발명자들은 원인 유전자가 동일한 방향에 우세한 효과를 보이는 희소 변이를 가지고 있다고 가정하였기 때문에, post-hoc 순위에서 추정 ρ가 0인 경우 유전자들을 필터링하였다. 이형접합성 콜에 대한 낮은 범위(Low coverage) 필터 및 낮은 AF(allele frequency) 필터를 SKAT-O에 적용하였다(도 5). 알려진 FH 유발 유전자를 69명의 FH 환자 및 390명의 건강한 대조군에서 확인한 뒤, 동일한 필터 및 파라미터를 46명의 유전학적으로 진단되지 않은 환자들의 분석에 적용하였다. 우선 컷오프 유의성은 전장 엑솜 유의성(P=2.69×10-6, 0.05/18,611 변이)이었으나, MAF(minor allele frequency) 1% 또는 0.5%에서 컷오프 유의성을 넘는 유전자(P<0.001)는 유전자-기반 결합 순위에 의한 post-hoc 순위를 위해 남겨두었다.
post-hoc 순위를 위한 유전자 크기-조정 결합순위
SKAT-O에 의해 지시된 유전자의 post-hoc 순위설정을 위하여, 변현된 유전자-기반 결합순위 전략을 사용하였다. 원래의 결합순위 방법은 가중합 통계(weighted-sum statistics) 및 발견적 필터링(heuristic filtering)으로 이루어져있으, 이는 멘델식 형질연구에 있어 성공적인 방법임이 입증되었다(Iuliana Ionita-Laza et al, 2011, AJHG). 그러나, 두 개의 통계결과를 조합하는 결합 순위는 각각의 유전자의 코딩 서열 길이를 고려하지 않아 크기가 큰 유전자가 상위에 잘못 랭크될 수 있다. 코딩 서열 길이가 각 유전자의 돌연변이 빈도값에 미치는 영향을 보정하기 위하여, 본 발명자들은 종래에 보고된 방법대로 희소 기능적 돌연변이의 코딩 엑손 길이에 대한 통계적 유의성을 나타내는 P-값에 의한 추가적인 제3의 순위를 결합하였다. 3가지 서로 다른 방식으로 순위를 결합시키는 방법은“유전자 크기-조정 결합 순위(gene size-adjusted Size Joint-Rank)”로 명명하였다. 오류 양성(false-positive) 변이 콜의 영향을 감소시키기 위하여, 많은 엄격한 필터가 유전적으로 진단되지 않은 환자에게서 검출되는 배타적 변이에 적용되었다(도 5).
유전자 매핑을 위한 관련 유전자 발굴
이전의 분석에 의해 순위가 결정된 유전자들에 대한 체계적인 평가를 위해, LDLR로부터 도출된 GWAS, 경로 데이터베이스(pathway databases) 및 LDLR-유래 단백질-단백질 상호작용 네트워크를 통해 10개의 단백질-단백질 상호작용 네트워크를 통해 11개의 관련 유전자 세트를 수집하였다(표 3-5).
계층 1. 관련 GWAS 신호
유전자 세트 설명(유전자 수) 및 유전자 목록
GWAS 유전자 종래 14개 GWAS에서 보고되고 매핑된 유전자a(111개)
ABCG5', 'ABCG8', 'ABO', 'ACAD11', 'ANGPTL3', 'ANKRD31', 'ANXA9', 'APOA1', 'APOA4', 'APOA5', 'APOB', 'APOC1', 'APOC2', 'APOC3', 'APOC4', 'APOE', 'APOH', 'AR', 'ATXN2', 'B3GALT4', 'BRAP', 'BRCA2', 'BSND', 'BUD13', 'C2orf43', 'CBLN3', 'CELSR2', 'CERS2', 'CETP', 'CILP2', 'CMTM6', 'COL11A2', 'CR1L', 'CSNK1G3', 'CSPG3', 'CYP7A1', 'DHX38', 'DNAH11', 'DOCK7', 'DRA', 'EFCAB13', 'EHBP1', 'FADS1', 'FADS2', 'FADS3', 'FAM84B', 'FN1', 'FRK', 'GCKR', 'GMPR', 'GPAM', 'HAVCR1', 'HERPUD1', 'HFE', 'HIST1H4C', 'HLA-DRA', 'HMGCR', 'HNF1A', 'HNF1A-AS1', 'HP', 'HPR', 'HSPE1P1', 'IDOL', 'INSIG2', 'IRF2BP2', 'KIAA0323', 'KLHL29', 'LCN1P2', 'LDLR', 'LDLRAP1', 'LOC84931', 'LPA', 'MAFB', 'MIR148A', 'MOSC1', 'MRPL42P2', 'MTMR3', 'MYLIP', 'NCAN', 'NPC1L1', 'NYNRIN', 'OSBPL7', 'PBX4', 'PCSK9', 'PLEC', 'PP2672', 'PPP1R3B', 'PSRC1', 'RPL12P33', 'RPL15P15', 'RXRB', 'SF4', 'SLC22A1', 'SMARCA4', 'SNX5', 'SORT1', 'SOX17', 'SPTLC3', 'ST3GAL4', 'SUGP1', 'TIMD4', 'TMEM57', 'TNKS', 'TOMM20', 'TOMM40', 'TOP1', 'TRIB1', 'UBXN2B', 'USP24', 'ZNF101', 'ZNF259'
GWAS 신호부근 유전자 14 GWAS로부터 83개 SNP가 포함된 500kb 내의 유전자b (464개)
ABCG5', 'ABCG8', 'ABO', 'ACAD11', 'ACADS', 'ACKR4', 'ACPP', 'ADAMTS13', 'ADAMTSL2', 'ADCY4', 'AIRN', 'AMIGO1', 'ANKRD31', 'ANXA9', 'APOA1', 'APOA4', 'APOA5', 'APOB', 'APOC1', 'APOC1P1', 'APOC2', 'APOC3', 'APOC4', 'APOC4-APOC2', 'APOE', 'APOH', 'AR', 'ARHGAP31', 'ARMC6', 'ARNT', 'ASCC2', 'ATIC', 'ATP13A1', 'ATXN1', 'ATXN7L2', 'B3GALT4', 'B4GALT4', 'BANF2', 'BCAM', 'BCL3', 'BEST1', 'BNIPL', 'BRCA2', 'BRD2', 'BSND', 'BUD13', 'C12orf43', 'C19orf38', 'C19orf52', 'C19orf80', 'C1orf177', 'C1orf194', 'C1orf56', 'C2orf16', 'C2orf43', 'C3orf30', 'C9orf96', 'CACFD1', 'CARM1', 'CBLC', 'CBLN3', 'CBX3', 'CCDC121', 'CCDC159', 'CCDC93', 'CD34', 'CD46', 'CDC27', 'CDC42SE1', 'CEACAM16', 'CEACAM19', 'CEL', 'CELP', 'CELSR2', 'CEP112', 'CEP120', 'CERS2', 'CHMP4A', 'CIDEB', 'CILP2', 'CLASRP', 'CLPTM1', 'CMA1', 'CMTM6', 'CMTM7', 'CMTM8', 'CNOT10', 'COL11A2', 'COL4A3BP', 'CR1', 'CR1L', 'CR2', 'CSNK1G3', 'CTSG', 'CTSK', c
a14 GWAS를 소개하는 문헌 검색을 통해 최근 연구결과가 추가됨 (표 5 참조)
b83개 SNP 내의 500kb 내 부위를 다중 snp의 46 블록에 통합시켰으며, 이 부위는 500-750kb에 걸쳐있다.
c계속: 'CTSS', 'CUTA', 'CYB561D1', 'CYC1', 'DAGLA', 'DAXX', 'DBIL5P2', 'DCPS', 'DDX18', 'DHCR24', 'DHRS1', 'DKFZP434K028', 'DNAH11', 'DNAJC13', 'DNAJC5G', 'DOCK6', 'DYNC1LI1', 'DYNC2LI1', 'EFCAB13', 'EHBP1', 'EIF2B4', 'EPOR', 'EPPK1', 'EXOSC4', 'FADS1', 'FADS2', 'FADS3', 'FAM118B', 'FAM203A', 'FAM63A', 'FAM71B', 'FAM83H', 'FAM83H-AS1', 'FEN1', 'FN1', 'FNDC4', 'FOXRED1', 'FRY', 'FTH1', 'FTH1P3', 'GABPB2', 'GATAD2A', 'GBGT1', 'GCKR', 'GDF7', 'GEMIN7', 'GLI2', 'GMIP', 'GMPR', 'GMPR2', 'GPAA1', 'GPN1', 'GRINA', 'GTF3C2', 'GTF3C5', 'GZMB', 'GZMH', 'HAPLN4', 'HAVCR1', 'HAVCR2', 'HCG25', 'HFE', 'HIST1H1A', 'HIST1H1C', 'HIST1H1D', 'HIST1H1E', 'HIST1H1T', 'HIST1H2AB', 'HIST1H2AC', 'HIST1H2AD', 'HIST1H2AE', 'HIST1H2BB', 'HIST1H2BC', 'HIST1H2BD', 'HIST1H2BE', 'HIST1H2BF', 'HIST1H2BG', 'HIST1H2BH', 'HIST1H2BI', 'HIST1H3A', 'HIST1H3B', 'HIST1H3C', 'HIST1H3D', 'HIST1H3E', 'HIST1H3F', 'HIST1H3G', 'HIST1H4A', 'HIST1H4B', 'HIST1H4C', 'HIST1H4D', 'HIST1H4E', 'HIST1H4F', 'HIST1H4G', 'HIST1H4H', 'HLA-DMA', 'HLA-DMB', 'HLA-DOA', 'HLA-DPA1', 'HLA-DPB1', 'HLA-DPB2', 'HMGCR', 'HNF1A', 'HNF1A-AS1', 'HNRNPA2B1', 'HORMAD2', 'HS1BP3', 'HS1BP3-IT1', 'HSD17B8', 'IFT172', 'IGF2R', 'IGSF11', 'IGSF23', 'INHBB', 'INSIG2', 'IPO4', 'IRF9', 'ISM1', 'ITGB3', 'ITK', 'KANK2', 'KHNYN', 'KIAA1324', 'KIAA1875', 'KIFC1', 'KIRREL3', 'KRTCAP3', 'LDLR', 'LINC00607', 'LINC00663', 'LINC01101', 'LOC100132215', 'LOC100505515', 'LOC100505624', 'LOC100507634', 'LOC101927045', 'LOC101927117', 'LOC101927495', 'LOC101928001', 'LOC101929486', 'LOC101929664', 'LOC102606466', 'LOC102724508', 'LOC102724849', 'LOC148696', 'LOC157273', 'LOC728819', 'LOC729603', 'LPAR2', 'LPPR2', 'LRPPRC', 'LTB4R', 'LTB4R2', 'LYSMD1', 'MAF1', 'MAFB', 'MAPK15', 'MAS1', 'MAU2', 'MDP1', 'MED22', 'MED7', 'MEF2B', 'MEF2BNB', 'MEF2BNB-MEF2B', 'MGME1', 'MINOS1P1', 'MIR148A', 'MIR1908', 'MIR219A1', 'MIR29B2', 'MIR29C', 'MIR4422', 'MIR4531', 'MIR4639', 'MIR4664', 'MIR4700', 'MIR611', 'MIR661', 'MIR6746', 'MIR6818', 'MIR6834', 'MIR6845', 'MIR6846', 'MIR6847', 'MIR6871', 'MIR6873', 'MIR6877', 'MIR6886', 'MIR8085', 'MIR937', 'MLEC', 'MLLT11', 'MPV17', 'MROH1', 'MRPL45P2', 'MTMR3', 'MYBPHL', 'MYL4', 'MYLIP', 'MYRF', 'N4BP2L1', 'N4BP2L2', 'N4BP2L2-IT2', 'NCAN', 'NDUFA13', 'NEDD8', 'NEDD8-MDP1', 'NFATC4', 'NFE2L3', 'NKPD1', 'NOP9', 'NPEPPS', 'NPHP3', 'NPHP3-ACAD11', 'NR2C2AP', 'NRBP1', 'NRBP2', 'NSMCE2', 'NYNRIN', 'OASL', 'OBP2B', 'OPLAH', 'OTX1', 'OVOL2', 'P2RX7', 'PARP10', 'PBX4', 'PCSK9', 'PDS5B', 'PFDN6', 'PHF1', 'PIP5K1A', 'PLCG1', 'PLEC', 'PLEKHH2', 'POGLUT1', 'POLK', 'PPM1G', 'PPP1R2P3', 'PPP1R37', 'PPP1R3B', 'PRKCA', 'PRUNE', 'PSMA5', 'PSRC1', 'PUF60', 'PVR', 'PVRL2', 'RAB3D', 'RAB3IL1', 'RABGGTA', 'RALGDS', 'REC8', 'RELB', 'REXO4', 'RFXANK', 'RGL2', 'RING1', 'RIPK3', 'RNU6-16P', 'RP1', 'RPL7A', 'RPLP0P2', 'RPS18', 'RPUSD4', 'RRBP1', 'RXRB', 'SARS', 'SCARNA2', 'SCNM1', 'SCRIB', 'SDR39U1', 'SEMA6C', 'SETDB1', 'SGCD', 'SHARPIN', 'SIK3', 'SLC17A2', 'SLC17A3', 'SLC22A1', 'SLC22A2', 'SLC22A3', 'SLC25A42', 'SLC2A6', 'SLC39A7', 'SLC4A1AP', 'SMARCA4', 'SNORD17', 'SNORD24', 'SNORD36A', 'SNORD36B', 'SNORD36C', 'SNX17', 'SNX5', 'SORT1', 'SOX17', 'SP4', 'SPATC1', 'SPC24', 'SPPL3', 'SPTLC3', 'SRPR', 'ST3GAL4', 'ST3GAL4-AS1', 'SUGP1', 'SUPT7L', 'SURF1', 'SURF2', 'SURF4', 'SURF6', 'SWSAP1', 'SYNGAP1', 'SYPL2', 'SYT7', 'TAF13', 'TAPBP', 'TGM1', 'THADA', 'TIMD4', 'TINF2', 'TIRAP', 'TM6SF2', 'TM9SF1', 'TMED1', 'TMEM161A', 'TMEM167B', 'TMEM205', 'TMEM258', 'TMEM39A', 'TMEM61', 'TMEM8C', 'TMOD4', 'TNFAIP8L2', 'TNFAIP8L2-SCNM1', 'TNKS', 'TOMM40', 'TOP1', 'TRAPPC6A', 'TRIB1', 'TRIM38', 'TRIM54', 'TSPAN16', 'TSSK4', 'TSSK6', 'TTC22', 'UBA5', 'UCN', 'UNC119B', 'UPK1B', 'UQCR10', 'USP24', 'VPS52', 'VPS72', 'WDPCP', 'WDR46', 'WDR47', 'YIPF2', 'YJEFN3', 'ZAR1L', 'ZBTB22', 'ZHX3', 'ZMAT5', 'ZNF101', 'ZNF14', 'ZNF296', 'ZNF506', 'ZNF512', 'ZNF513', 'ZPR1'
계층 2. 기능적으로 연관된 경로
유전자 세트 설명(유전자 수) 및 유전자 목록
지질대사 콜레스테롤 및 지질 경로 (25개)
ABCA1', 'ABCA2', 'ACAT1', 'ACAT2', 'APOA1', 'APOB', 'APOE', 'CETP', 'CYP46A1', 'GALNT2', 'GCKR', 'HMGCR', 'LCAT', 'LDLR', 'LIPC', 'LIPG', 'LPL', 'LRP1', 'MLXIPL', 'PCSK9', 'PLTP', 'SCARB1', 'SORT1', 'SREBF1', 'SREBF2'
클라트린-매개 엔도사이토시스 클라트린-매개 엔도사이토시스의 구성요소를 인코딩하는 유전자 (52개)
'AAK1', 'AGFG1', 'AMPH1', 'AP2A1', 'AP2A2', 'AP2B1', 'AP2M1', 'AP2S1', 'ARRB1', 'ARRB2', 'BIN1', 'CLTA', 'CLTB', 'CLTC', 'CTTN', 'DAB2', 'DNAJC6', 'DNM1', 'DNM2', 'DNM3', 'DYRK1A', 'EPN1', 'EPN2', 'EPS15', 'EPS15R', 'FCHO1', 'FCHO2', 'GAK', 'HIP1', 'HIP1R', 'HSPA8', 'INPPL1', 'ITSN1', 'ITSN2', 'LDLRAP1', 'NECAP1', 'NECAP2', 'NUMB', 'OCRL1', 'PICALM', 'SCYL2', 'SGIP1', 'SH3BP4', 'SH3GL1', 'SH3GL2', 'SH3GL3', 'SNAP91', 'SNX9', 'STON1', 'STON2', 'SYNJ1', 'SYNJ2'
엔도사이토시스 시스 경로의 구성요소를 코딩하는 유전자(184개)
'ACAP1', 'ACAP2', 'ACAP3', 'ACVR1B', 'ACVR1C', 'ADRB1', 'ADRB2', 'ADRBK1', 'AGAP1', 'AP2A1', 'AP2B1', 'AP2M1', 'AP2S1', 'ARAP1', 'ARFGAP1', 'ARFGAP2', 'ARRB1', 'ASAP3', 'ADRB3', 'ADRBK2', 'AGAP2', 'AP2A2', 'ARAP2', 'ARF6', 'ASAP2', 'CBLC', 'CCR5', 'CHMP1B', 'CHMP2A', 'CHMP4A', 'CHMP4B', 'CHMP6', 'CLTA', 'CLTC', 'CLTCL1', 'CXCR2', 'CXCR4', 'CBLB', 'CDC42', 'CHMP2B', 'CHMP4C', 'CHMP5', 'CLTB', 'CXCR1', 'DAB2', 'DNAJC6', 'DNM1', 'DNM1L', 'DNM2', 'DNM3', 'EEA1', 'EHD1', 'EPN2', 'EPN3', 'EPS15', 'EGF', 'EHD2', 'EHD4', 'ERBB3', 'ERBB4', 'F2R', 'FGFR2', 'FLT1', 'FAM125B', 'FGFR4', 'GIT1', 'GIT2', 'GRK1', 'GRK4', 'GRK5', 'GRK7', 'HGS', 'HLA-A', 'HLA-B', 'HLA-E', 'HLA-F', 'HLA-G', 'HSPA1A', 'HSPA6', 'HSPA8', 'HSPA1L', 'HSPA2', 'IGF1R', 'IL2RA', 'IQSEC2', 'IQSEC3', 'ITCH', 'IQSEC1', 'KDR', 'KIT', 'LOC652614', 'LDLR', 'MET', 'NEDD4', 'NTRK1', 'NEDD4L', 'PARD6A', 'PARD6G', 'PDCD6IP', 'PIP4K2B', 'PIP5K1A', 'PIP5K1C', 'PLD1', 'PLD2', 'PRKCI', 'PSD3', 'PARD3', 'PARD6B', 'PIKFYVE', 'PIP5K1B', 'PRKCZ', 'PSD2', 'PSD4', 'RAB11B', 'RAB11FIP1', 'RAB11FIP3', 'RAB11FIP5', 'RAB22A', 'RABEP1', 'RET', 'RNF103', 'RAB11A', 'RAB11FIP2', 'RAB11FIP4', 'RNF41', 'SH3GL1', 'SH3GL3', 'SMAP1', 'SMAP2', 'SMURF1', 'SMURF2', 'STAM2', 'STAMBP', 'SH3GLB2', 'SH3KBP1', 'SRC', 'TFRC', 'TRAF6', 'TGFBR2', 'TSG101', 'VPS28', 'VPS36', 'VPS37C', 'VPS37D', 'VPS4B', 'WWP1', 'ZFYVE20', 'ARAP3', 'ARFGAP3', 'ARRB2', 'ASAP1', 'CBL', 'CSF1R', 'EGFR', 'EHD3', 'EPN1', 'FAM125A', 'FGFR3', 'GRK6', 'HRAS', 'IL2RB', 'IL2RG', 'LDLRAP1', 'MDM2', 'PDGFRA', 'PSD', 'RAB31', 'RAB4A', 'RAB5A', 'RAB5B', 'RAB5C', 'RUFY1', 'SH3GL2', 'SH3GLB1', 'SNF8', 'STAM', 'TGFBR1', 'USP8', 'VPS25', 'VPS37A', 'VPS37B', 'VPS45', 'VPS4A', 'VTA1'
SREBP 조절 BioCarta Pathway 데이터베이스에서지질합성의 SREBP 조절에 관여하는 유전자 (8개)
‘HMGCS1', 'LDLR', 'MBTPS1', 'MBTPS2', 'SCAP', 'SREBF1', 'YY2', 'SREBF2'
FXR 및 LXR 조절 콜레스테롤 대사의 FXR 및 LXR 를조절하는 유전자( Biocarta Pathway database) (7개)
‘CYP7A1', 'FABP6', 'HEATR6', 'LDLR, 'NR1H3', 'NR1H4', 'RXRA'
지단백질 대사
지단백질의 대사에 돤여하는 유전자(Reactome database, DB ID: REACT_602)(49개)
‘A2M', 'ABCA1', 'ABCG1', 'ABCG5', 'ABCG8', 'ABHD5', 'ALB', 'AMN', 'APOA1', 'APOA2', 'APOA4', 'APOA5', 'APOB', 'APOC2', 'APOC3', 'APOE', 'BMP1', 'CAV1', 'CEL', 'CETP', 'CLPS', 'CUBN', 'FABP4', 'HSPG2', 'LCAT', 'LDLR', 'LDLRAP1', 'LIPC', 'LIPE', 'LPA', 'LPL', 'MGLL', 'MTTP', 'NPC1L1', 'P4HB', 'PLIN1', 'PLTP', 'PNLIP', 'PNLIPRP1', 'PNLIPRP2', 'PPP1CA', 'PPP1CB', 'PPP1CC', 'PRKACA', 'PRKACB', 'PRKACG', 'SAR1B', 'SCARB1', 'SDC1'
계층 3. PPI - LDLR로부터의 확장
유전자 세트 설명(유전자 수) 및 유전자 목록
직접 상호작용 LDLR 유전자와 직접 상호작용하는 유전자(네트워크 경로 =LDLR로부터 1)(21개)
AP1M2', 'APOB', 'APOE', 'CANX', 'CD36', 'CREBBP', 'DAB1', 'DAB2', 'FLT1', 'HSP90B1', 'HSPA5', 'LDLRAP1', 'LRPAP1', 'MAP4', 'MYLIP', 'PCSK9', 'PDIA3', 'PDIA4', 'PF4', 'SNX17', 'UBC'
간접 상호작용 중간 노드를 통해LDLR 유전자와 간접적으로상호작용하는 유전자 (경로길이= LDLR로부터 2)
(821개)
A2M', 'ABCA1', 'ABCE1', 'ACOT7', 'ACOT9', 'ACTA2', 'ACTB', 'ACTG1', 'ADAM10', 'ADAM17', 'ADRB2', 'ADRBK1', 'ADSS', 'AGER', 'AGRN', 'AHCY', 'AHCYL1', 'AICDA', 'AIMP1', 'AIRE', 'AKT1', 'AKT2', 'ALB', 'ALDH7A1', 'AMFR', 'ANAPC2', 'ANAPC5', 'ANAPC7', 'ANKH', 'AP1G1', 'AP2A1', 'AP2A2', 'AP2B1', 'AP2M1', 'APC', 'APLP1', 'APLP2', 'APOA1', 'APOB', 'APOE', 'APP', 'AR', 'ARFGAP1', 'ARRB1', 'ARRB2', 'ASGR1', 'ASNS', 'ATF1', 'ATF2', 'ATF3', 'ATF4', 'ATG3', 'ATP5A1', 'ATP6V1A', 'ATXN1L', 'ATXN3', 'AURKA', 'AXIN1', 'BACE1', 'BAG3', 'BASP1', 'BCAP31', 'BCAR1', 'BCCIP', 'BCL2L1', 'BCL6', 'BGN', 'BIRC2', 'BLMH', 'BRAF', 'BRCA1', 'BSCL2', 'C14ORF166', 'C19ORF52', 'CALCR', 'CALR', 'CAMK1', 'CAMKMT', 'CAND1', 'CANX', 'CAP1', 'CAPN2', 'CAPNS1', 'CARM1', 'CASP12', 'CASP7', 'CAV1', 'CBL', 'CCNC', 'CCNE1', 'CCNT1', 'CCT2', 'CD1D', 'CD2AP', 'CD3D', 'CD9', 'CDC16', 'CDC20', 'CDC27', 'CDC37', 'CDC37L1', 'CDH1', 'CDH2', 'CDK1', 'CDK2', 'CDK4', 'CDK5', 'CDK8', 'CDK9', 'CDKN1A', 'CEBPB', 'CEBPD', 'CELF2', 'CFTR', 'CHRD', 'CHRNA5', 'CHUK', 'CITED1', 'CITED2', 'CLN5', 'CLNS1A', 'CLTC', 'CLU', 'CNDP2', 'CNPY2', 'CNTN2', 'COG7', 'COL6A1', 'COPS5', 'COPS6', 'CPSF6', 'CPSF7', 'CPT1A', 'CREB1', 'CRK', 'CSE1L', 'CSK', 'CSNK1A1', 'CSNK1E', 'CSNK2A1', 'CSNK2A2', 'CSTF2', 'CTBP1', 'CTNNB1', 'CUL1', 'CUL2', a
a계속: CUL3', 'CUL4A', 'CUL4B', 'CUL5', 'CUX1', 'CXCL12', 'CXCR3', 'CYP2C18', 'CYP2C8', 'DAB2IP', 'DAK', 'DAXX', 'DCBLD1', 'DCPS', 'DCUN1D1', 'DDX17', 'DDX24', 'DDX5', 'DEK', 'DERL1', 'DGCR8', 'DNAJB9', 'DNAJC10', 'DNAJC19', 'DNMT1', 'DPH1', 'DVL1', 'DVL2', 'DVL3', 'DYRK1A', 'DYRK1B', 'DYRK2', 'DYT10', 'E2F1', 'E2F3', 'EBF1', 'EBI3', 'ECSIT', 'EDEM1', 'EEF2K', 'EFEMP1', 'EGFR', 'EGR1', 'EHD2', 'EID1', 'EIF2AK2', 'EIF2AK3', 'EIF2B1', 'EIF2C4', 'EIF2S1', 'EIF4A1', 'EIF4EBP1', 'ELAVL1', 'ENO2', 'EP300', 'EPAS1', 'EPM2A', 'EPN1', 'EPN2', 'EPS15', 'ERBB2', 'ERBB2IP', 'ERBB3', 'ERLEC1', 'ERN1', 'ERO1L', 'ERO1LB', 'ESR1', 'ESR2', 'ETS1', 'ETS2', 'ETV7', 'EWSR1', 'F8', 'FAF2', 'FAM82A2', 'FAM86A', 'FANCA', 'FANCC', 'FARSA', 'FBXL12', 'FBXO25', 'FBXO6', 'FCHO2', 'FCHSD2', 'FGFR1', 'FGR', 'FMNL1', 'FN1', 'FOS', 'FOSB', 'FOSL1', 'FOXG1', 'FOXM1', 'FOXO1', 'FOXO3', 'FOXO4', 'FXYD7', 'FYCO1', 'FYN', 'GADD45G', 'GANAB', 'GARS', 'GATA1', 'GCDH', 'GCM1', 'GLI3', 'GNB2L1', 'GRB2', 'GRIP1', 'GRK5', 'GSK3B', 'GSS', 'GTF2B', 'GYPC', 'H2AFX', 'HAX1', 'HBP1', 'HBXIP', 'HCK', 'HDAC1', 'HDAC10', 'HDAC2', 'HDAC3', 'HDAC5', 'HDAC6', 'HDGF', 'HES6', 'HIF1A', 'HIPK2', 'HIST1H3A', 'HIST1H4A', 'HIST2H2BE', 'HIST3H3', 'HIST4H4', 'HLA-B', 'HLA-C', 'HMGA1', 'HMGB1', 'HMGB2', 'HMGB3', 'HNF1A', 'HNF4A', 'HNRNPA3', 'HNRNPF', 'HNRNPL', 'HNRNPR', 'HNRNPUL1', 'HNRNPUL2', 'HOXA10', 'HOXA9', 'HOXB2', 'HOXB3', 'HOXB4', 'HOXB6', 'HOXB7', 'HOXB9', 'HOXD10', 'HOXD12', 'HOXD13', 'HOXD4', 'HSD11B1', 'HSP90AA1', 'HSP90AB1', 'HSP90B1', 'HSPA1A', 'HSPA1B', 'HSPA1L', 'HSPA4', 'HSPA5', 'HSPA6', 'HSPA8', 'HSPBP1', 'HSPD1', 'HSPH1', 'HTRA1', 'HTT', 'IARS', 'ID2', 'IFIT3', 'IFIT5', 'IFNAR2', 'IKBKB', 'IKBKG', 'IL7R', 'ILF2', 'ILF3', 'ILK', 'ING1', 'INPP5D', 'INPPL1', 'INSIG2', 'IQCB1', 'IQGAP1', 'IQSEC1', 'IRF1', 'IRF3', 'IRF5', 'IRF7', 'IRF9', 'ISG15', 'ISOC1', 'IST1', 'ITGA2', 'ITGA2B', 'ITGA3', 'ITGA6', 'ITGB1', 'ITGB3', 'ITGB5', 'ITSN1', 'JUN', 'JUNB', 'K8', 'KAT2B', 'KAT5', 'KAT6A', 'KCND3', 'KCNH2', 'KCNQ4', 'KDM1A', 'KDM3B', 'KDM4B', 'KHDRBS1', 'KIAA1468', 'KIAA1598', 'KLC1', 'KLF1', 'KLF13', 'KLF4', 'KLF5', 'KLF8', 'KPNA2', 'KPNA6', 'KPNB1', 'KRT14', 'KRT8', 'L1CAM', 'LAMB1', 'LAMB3', 'LAMC1', 'LAMC2', 'LCAT', 'LCT', 'LDHA', 'LDLR', 'LGALS1', 'LIG4', 'LIPC', 'LMAN1', 'LONP1', 'LOXL2', 'LOXL4', 'LPA', 'LPP', 'LRP1', 'LRP2', 'LRP6', 'LRP8', 'LYN', 'MAF', 'MAFK', 'MALT1', 'MAML1', 'MAP1LC3A', 'MAP3K5', 'MAPK10', 'MAPK13', 'MAPK6', 'MAPK7', 'MAPT', 'MARK4', 'MAST1', 'MATK', 'MCM3', 'MDC1', 'MDM2', 'MECOM', 'MED21', 'MED25', 'MEIS1', 'MEPCE', 'METTL18', 'METTL20', 'METTL21A', 'METTL21B', 'METTL21C', 'METTL22', 'METTL23', 'MFI2', 'MGMT', 'MID1IP1', 'MIER1', 'MKNK1', 'MLL', 'MLLT3', 'MSH2', 'MSH6', 'MSN', 'MST4', 'MSX1', 'MTA2', 'MTAP', 'MTDH', 'MTF1', 'MTNR1A', 'MTOR', 'MTPN', 'MTTP', 'MYB', 'MYBL1', 'MYBL2', 'MYC', 'MYH10', 'MYH9', 'MYL12B', 'MYLIP', 'MYO1E', 'MYO6', 'MYOD1', 'Mapk13', 'N4BP2', 'NAA38', 'NAE1', 'NANS', 'NCK1', 'NCOA1', 'NCOA2', 'NCOA3', 'NCOA6', 'NCOR1', 'NCOR2', 'NDRG1', 'NEDD8', 'NEFM', 'NENF', 'NEUROG1', 'NFATC2', 'NFATC4', 'NFE2', 'NFE2L2', 'NFKB2', 'NFYB', 'NHLRC1', 'NKX2-1', 'NKX3-1', 'NLK', 'NOS2', 'NOS3', 'NPAS2', 'NPAT', 'NPEPPS', 'NPM1', 'NR1I3', 'NR3C1', 'NR5A1', 'NRF1', 'NUP155', 'NUP98', 'OGFOD1', 'ONECUT1', 'OPRD1', 'OS9', 'OXSR1', 'P4HB', 'PAFAH1B1', 'PAFAH1B2', 'PAK1', 'PAK2', 'PAN2', 'PAPOLA', 'PARK2', 'PARP1', 'PAWR', 'PBK', 'PBX1', 'PCMT1', 'PCNA', 'PDCD4', 'PDCD6', 'PDIA3', 'PDIA4', 'PDIA6', 'PELP1', 'PF4', 'PGD', 'PGRMC1', 'PHAX', 'PHKG2', 'PHOX2A', 'PIAS3', 'PIGK', 'PIK3C3', 'PIN1', 'PKD2', 'PLAA', 'PLAGL1', 'PLCG1', 'PLEKHA6', 'PLIN2', 'PLOD1', 'PLTP', 'PLXNA1', 'PML', 'POLA2', 'POLR2A', 'POLR2C', 'POLR2E', 'POLR3H', 'POMP', 'POT1', 'POU1F1', 'PPARG', 'PPARGC1A', 'PPIB', 'PPP1CC', 'PPP1R2', 'PPP4R1', 'PRAM1', 'PRCP', 'PRDX1', 'PRDX2', 'PRDX4', 'PRKAA1', 'PRKACA', 'PRKACB', 'PRKCD', 'PRKCSH', 'PRLR', 'PRNP', 'PROC', 'PROSC', 'PSEN1', 'PSMA3', 'PSMC5', 'PSMD1', 'PSME3', 'PTGIR', 'PTMA', 'PTMS', 'PTOV1', 'PVR', 'PWP1', 'PYCR1', 'PYGO2', 'RAB11A', 'RAB14', 'RAB1A', 'RAB3A', 'RAB3D', 'RAB7A', 'RAC3', 'RAD21', 'RAD23A', 'RAE1', 'RAF1', 'RALA', 'RALGDS', 'RANBP2', 'RAP1GDS1', 'RARA', 'RBBP4', 'RBBP7', 'REL', 'RELA', 'RHEB', 'RICTOR', 'RIOK2', 'RLIM', 'RNF146', 'RNF185', 'RNF32', 'RPA2', 'RPL23', 'RPL4', 'RPL8', 'RPLP1', 'RPN1', 'RPN2', 'RPS16', 'RPS20', 'RPS25', 'RPS3', 'RPS6KA1', 'RPS6KA2', 'RPS6KA3', 'RPS6KA5', 'RPSA', 'RPTOR', 'RTN4', 'RUNX1', 'RUNX2', 'RUVBL1', 'RUVBL2', 'RXRB', 'RXRG', 'SART1', 'SCNN1A', 'SCNN1B', 'SCNN1G', 'SEC23B', 'SEC24B', 'SEC61A1', 'SEC61B', 'SELP', 'SELS', 'SERPINA1', 'SERPINF2', 'SERPINH1', 'SERTAD1', 'SET', 'SETD1A', 'SF3B2', 'SFTPC', 'SH3BP4', 'SH3GL1', 'SH3KBP1', 'SHC1', 'SHCBP1', 'SIAH1', 'SIL1', 'SIRT1', 'SIRT3', 'SIRT7', 'SKIL', 'SLC12A3', 'SLC2A1', 'SLC4A1', 'SLC6A4', 'SLC9A3R1', 'SMAD1', 'SMAD2', 'SMAD3', 'SMARCA2', 'SMARCA4', 'SMARCB1', 'SMARCC1', 'SMARCC2', 'SMS', 'SMURF1', 'SMURF2', 'SND1', 'SNIP1', 'SNRNP70', 'SNRPD1', 'SNTA1', 'SNW1', 'SOCS1', 'SOCS3', 'SORL1', 'SORT1', 'SP1', 'SP3', 'SPG20', 'SPTAN1', 'SPTBN1', 'SRC', 'SRCAP', 'SREBF1', 'SREBF2', 'SRF', 'SRRM2', 'SS18L1', 'SSBP1', 'SSR1', 'ST13', 'STAT1', 'STAT2', 'STAT3', 'STAT6', 'STK24', 'STK25', 'STK3', 'STK4', 'STOML2', 'SUMO1', 'SUMO2', 'SUMO4', 'SURF4', 'SVIP', 'SYVN1', 'TACC2', 'TADA2A', 'TAF6L', 'TAP1', 'TAP2', 'TAPBP', 'TARDBP', 'TATDN1', 'TBCB', 'TBP', 'TBX21', 'TCERG1', 'TCF12', 'TCF3', 'TDG', 'TERF1', 'TERF2', 'TF', 'TFAP2A', 'TG', 'TGFBR1', 'TGFBR2', 'TGS1', 'THBD', 'TLR2', 'TMEM132A', 'TMEM67', 'TOPBP1', 'TOR1A', 'TOR1AIP1', 'TP53', 'TP53RK', 'TP63', 'TP73', 'TPM1', 'TRAF3IP1', 'TRAF6', 'TRAP1', 'TRERF1', 'TRIM28', 'TRIO', 'TRIP4', 'TSHR', 'TUBA4A', 'TUBA4B', 'TUBB4A', 'TUFM', 'TWF2', 'TXNDC11', 'TXNRD1', 'TYRO3', 'UBA5', 'UBASH3B', 'UBC', 'UBD', 'UBE2D1', 'UBE2D2', 'UBE2D3', 'UBE2D4', 'UBE2N', 'UBL4A', 'UBQLN4', 'UBXN1', 'UBXN4', 'UBXN6', 'UCHL5', 'USP21', 'USP25', 'VCAN', 'VCL', 'VCP', 'VDR', 'VHL', 'VIM', 'VLDLR', 'VRK1', 'VWF', 'WDHD1', 'WDR5', 'XRCC6', 'YBX1', 'YES1', 'YIPF3', 'YLPM1', 'YWHAB', 'YWHAE', 'YWHAH', 'YY1', 'ZBTB2', 'ZCCHC12', 'ZNF558', 'ZNF639', 'ZNRF4', 'ZSWIM7'
종래 고 LDL-C와 관련이 있다고 보고된 유전자를 Catalog of Published Genome-Wide Association Studies (http://www.genome.gov/26525384)로부터 수집하였다. 14개 GWAS에서 고LDL-C와 유의하게 연관되었음이 보고된 83개 SNP가 포함된 500kb 내의 유전자를 수집함으로써 확장된 유전자 세트를 구축하였다(표 6).
고 LDL-D와 관련된 SNP를 보고한 종래의 GWAS
제1저자 제목 저널 년도
Burkhardt R Common SNPs in HMGCR in micronesians and whites associated with LDL-cholesterol levels affect alternative splicing of exon13. Arterioscler Thromb Vasc Biol 2008
Kathiresan S Common variants at 30 loci contribute to polygenic dyslipidemia. Nat Genet 2008
Sabatti C Genome-wide association analysis of metabolic traits in a birth cohort from a founder population. Nat Genet 2008
Wallace C Genome-wide association study identifies genes for biomarkers of cardiovascular disease: serum urate and dyslipidemia. Am J Hum Genet 2008
Sandhu MS LDL-cholesterol concentrations: a genome-wide association study. Lancet 2008
Aulchenko YS Loci influencing lipid levels and coronary heart disease risk in 16 European population cohorts. Nat Genet 2008
Willer CJ Newly identified loci that influence lipid concentrations and risk of coronary artery disease. Nat Genet 2008
Kathiresan S Six new loci associated with blood low-density lipoprotein cholesterol, high-density lipoprotein cholesterol or triglycerides in humans. Nat Genet 2008
Teslovich TM Biological, clinical and population relevance of 95 loci for blood lipids. Nature 2010
Shen H Familial defective apolipoprotein B-100 and increased low-density lipoprotein cholesterol and coronary artery calcification in the old order amish. Arch Intern Med 2010
Waterworth DM Genetic variants influencing circulating lipid levels and risk of coronary artery disease. Arterioscler Thromb Vasc Biol 2010
Rasmussen-Torvik LJ High density GWAS for LDL cholesterol in African Americans using electronic medical records reveals a strong protective variant in APOE. Clin Transl Sci 2012
Global Lipids Genetics Consortium Discovery and refinement of loci associated with lipid levels. Nat Genet 2013
Coram MA Genome-wide characterization of shared and distinct genetic components that influence blood lipid levels in ethnically diverse human populations. Am J Hum Genet. 2013
콜레스테롤 및 지질 대사경로에 관여한다고 알려진 유전자도 추가되었다(Reynolds CA et al, Hum Mol Genet, 2010). 아울러, 클라트린-매개-엔도사이토시스, 엔도사이토시스, 지질합성의 SREBP 조절, 콜레스테롤 대사에서의 FXR 및 LXR 조절 및 지질과 지단백질 대사에 관여하는 유전자도 관련 유전자로 포함시켰다(KEGG, Kyoto Encyclopedia of Genes and Genomes, Reactome 및 biocarta 데이터베이스). 마지막으로, LDLR 단백질과 상호작용하는 단백질을 코딩하는 유전자를 추가하였다(Genome Network Platform), BioGRID 및 BioGrapgh 데이터베이스). 이 유전자 세트는 코어가 LDLR 단백질인 비방향성 네트워크에서 LDLR 유전자로부터 경로 길이 1인 21개 유전자로 구성되어 있다. 본 발명자들은 추가적으로 LDLR 네트워크를 LDLR로부터의 경로 길이가 2인 유전자로 확장하여 최종적인 유전자 세트를 형성하였다. 세트 점수를 관련 유전자 세트 중 매핑된 세트의 숫자로 정의하였으며, 이를 FH 표현형과의 연관 지표로 사용하였다.
실험결과
대상자들의 임상적 특성
등록된 환자들의 특성은 표 7에 표시하였다. 69명의 환자 중 23명은 LDLR, APOB 또는 PCSK9 유전자 내에 FH와 연관된 병인 돌연변이를 가졌다. 이들은 돌연변이-양성군으로 분류되었으며, 나머지는 돌연변이 음성군으로 분류되었다. 돌연변이-음성 환자와 비교하여, 돌연변이-양성 환자는 남성인 경우가 많았으며 LDL-C 수준이 높았다. 아울러, 돌연변이-양성 환자는 돌연변이 음성 환자에 비하여 연령이 낮은 경향이 있었다. 그러나, 종래의 보고(Futema et al. Atherosclerosis. 2013)와 달리 3가지 FH-유발 돌연변이 검출 비율 및 관상동맥 질환 위험성에는 차이가 없었다.
등록된 환자(n=69)들의 임상적 특성
전체(n=69) 돌연변이 음성
(n=47)
돌연변이 양성
(n=23)
P
나이 54 ± 13 56 ± 12 50 ± 14 0.09
여성 40 (58) 31 (67) 9 (39) 0.03
병력 고혈압 33 (48) 23 (50) 10 (43) 0.61
당뇨 6 (9) 4 (9) 2 (9) 1.00
관상동맥질환 25 (36) 17 (37) 8 (35) 0.86
흡연 15 (22) 10 (22) 5 (22) 1.00
가족력 심근경색 38 (55) 23 (50) 15 (65) 0.23
총 콜레스테롤
>290 mg/dL
43 (61) 26 (57) 16 (70) 0.30
FH의 임상적 분류 확정(Definite) 17 (24) 10 (22) 7 (30) 0.43
잠재(Possible) 52 (75) 36 (78) 16 (70)
신체조건 체질량지수 (kg/m2) 25.0±3.6 25.1±3.5 25.0±3.9 0.96
황색종 17 (25) 12 (26) 5 (22) 0.69
실험실값 총 콜레스테롤 316 ± 48 308 ± 50 330 ± 43 0.08
중성지방 174 ± 85 184 ± 94 155 ± 60 0.19
HDL-콜레스테롤 47.4±11.2 48.5±10.9 45.2±11.8 0.26
LDL-콜레스테롤 230 ± 41 223 ± 39 246 ± 41 0.02
표시값들은 평균 ± 표준편차 또는 n (%)로 나타내었다. FH: familial hypercholesterolemia; HDL: high-density lipoprotein; LDL: low-density lipoprotein; 돌연변이 음성: 3개의 FH 유전자(LDLR, APOB, PCSK9)에 알려지거나 신규한 병원성 돌연변이가 없는 환자; 돌연변이 양성 : 3개의 FH 유전자(LDLR, APOB PCSK9)에 알려지거나 신규한 병원성 돌연변이를 가지는 환자
알려진 돌연변이의 검출 및 3개의 FH 유전자에서의 확인
전장 엑솜 시퀀싱 분석에 의해, 총 23명의 환자(FH 환자 70명의 37%)가 3개의 FH 유전자에서 병인 돌연변이를 가지는 것으로 밝혀졌다. 종래 보고된 병인 돌연변이에 해당하는 환자는 18명이었다(표 8). 이들 중, 총 15명의 환자가 LDLR 유전자에 병인성 돌연변이를 가지고 있었다. 특히, p.P685L 돌연변이는 2명, p.E228X 또는 p.E228K 돌연변이는 4명이 가지고 있어, 한국 FH 환자에 돌연변이 다발 부위가 존재함을 말해준다. 한명의 환자가 p.R257W 및 p.D589N 돌연변이를 동형접합성 돌연변이로서 보유하고 있었지만, 하나의 이형접합성 돌연변이를 가지는 환자에 비하여 LDL-C 수준은 증가하지 않았다. 두 명의 환자는 APOB 유전자 내에 가장 흔한 원인 변이로 알려진 p.R3527Q 돌연변이를 가졌다(Rader et al. J Clin Invest 2003). 아울러, 환자 1명은 PCSK9 유전자 내에 p.E32K 돌연변이를 가졌다.
알려진 병원성 돌연변이의 검출 (n=69)
유전자 유전자 좌표 뉴클레오타이드 변화 a 돌연변이 형태 아미노산 변화 해당 환자수 (73명환자 내에서의 빈도) 기준
LDLR chr19:11213417 c.268G>A 미스센스 p.D90N 1 (0.014) 1
LDLR chr19:11216000 c.418G>A 미스센스 p.E140K 1 (0.014) 2
LDLR chr19:11216101 c.519C>G 미스센스 p.C173W 1 (0.014) 3
LDLR chr19:11216243 c.661G>A 미스센스 p.D221N 1 (0.014) 4
LDLR chr19:11216264 c.682G>T 넌센스 p.E228X 3 (0.041) 2
LDLR chr19:11216264 c.682G>A 미스센스 p.E228K 1 (0.014) 5
LDLR chr19:11217315 c.769C>T 미스센스 p.R257W 1b (0.014) 6
LDLR chr19:11227594 c.1765G>A 미스센스 p.D589N 9
LDLR chr19:11224013 c.1246C>T 미스센스 p.R416W 1 (0.014) 1
LDLR chr19:11226885 c.1702C>G 미스센스 p.L568V 1 (0.014) 7
LDLR chr19:11231112 c.2054C>T 미스센스 p.P685L 2c (0.028) 8
LDLR chr19:11221326 c.941-2A>G 스플라이싱, 수용체 사이트(exon6-2nt) 프레임쉬프트 1 (0.014) 10
LDLR chr19:11222188 c.1061-2A>G 스플라이싱, 수용체 사이트(exon7-2nt) 프레임쉬프트 1 (0.014) 11
APOB chr2:21229160 c.10580C>T 미스센스 p.R3527Q 2 (0.027) 12
PCSK9 chr1:55505604 c.94G>A 미스센스 p.E32K 1 (0.014) 13
a뉴클레오타이드 위치 번호는 LDLR(NM_000527), APOB(NM_000384) 및 PCSK9 (NM_174936) mRNA 서열에 따라 정해졌다. bR257W(homozygote) 및 D589N(homozygote)를 가지는 환자(P49).
cP685L를 가지는 세명의 환자가 스크리닝되었다. 모든 변이는 생어 시퀀싱에 의해 확인되었다.
신규 돌연변이의 발견 및 3개의 FH 유전자에서의 확인
알려진 돌연변이에 더하여, 신규한 기능저해 돌연변이를 3명의 FH 환자에게서 검출하였다. 2개의 새로운 돌연변이가 결실에 희한 프레임 쉬프팅에 의해 LDLR 유전자 기능을 저해하는 것으로 예측되었다(표 9). 두 가지 돌연변이 모두 대조군의 엑솜 데이터 또는 일반적인 데이터베이스에서 나타나지 않았다. 13-nt 결실 돌연변이(c.321_333delGACGTGCTCCCAG)는 미성숙 종결코던을 야기하는 프레임쉬프트 붕괴로 인해 병원성을 가지는 것으로 생각되었다. p.D834Rfs 돌연변이는 cis-위치에서 연속적으로 나타나는 c.2500_2502delGAT 및 c.2500insC 돌연변이가 동시에 발생하였으며, IGV(Integrative Genomics Viewer)를 통해 D834Rfs/- 이형접합성 돌연변이임을 확인하였다(도 2c). LDLR 유전자 내 860개 코딩 부위 중에서 비교적 뒷부분에 존재함에도, p.D834Rfs가 상응하는 가족(P05) 내에서 함께 분리된 원인 변이임을 확인할 수 있었다(도 2a 및 2b). p.R215C 돌연변이는 PCSK9 유전자의 촉매 도메인 루프 부분 내의 진화적으로 보존적인 부위에서 동정되었다(Cunningham D, et al, Nat Struct Mol Biol. 2007). 기능획득 돌연변이가 상기 루프 내에서 확인되었으므로, p.R215C가 기능획득 돌연변이임을 알 수 있었다(PCSK9 mutation ref, Cunningham D, et al, Nat Struct Mol Biol. 2007).
복제수 분석 및 확인
CNV 분석에서, 2명의 환자에게서 새로운 복제수 결실이 검출되었다. CoNIFER 알고리즘을 통해 한명의 환자(P25)에게서 LDLR 유전자의 1번-12번 엑손에 걸친 절편이 소실된 것으로 예상되었다(도 3a). 인트론 5를 검출하는 Taqman 복제수 분석을 통해 대조군의 절반임이 확인되었다(도 3d). LDLR 유전자의 8-12번 엑손에 이르는 또 다른 복제수 결실을 검출하였으며, 이를 Taqman 분석으로 확인하였다(도 3b 및 3d). 흥미롭게도, 복제수의 결실은 다른 질환을 가지는 가족 구성원에서도 함께 분리되었으며, 이를 통해 상기 결실이 해당 가족(P17)의 FH에 대한 원인 변이임을 알 수 있었다(도 3c 및 3d).
FH 유전자에서의 3개의 신규 병원성 돌연변이의 검출(n=69)
유전자 LDLR LDLR PCSK9
좌표 chr19:
11215902-11215914
chr19:11240299 chr1:55518070
뉴클레오타이드 변화a c.321_333del
-GACGTGCTCCCAG
c.2500_2502
delGATinsCd
c.643C>T
돌연변이 형태 프레임쉬프트-결실 프레임쉬프트-결실/삽입 미스센스
아미노산 변화 p.C109Sfsb p.D834Rfs p.R215C
해당 환자수
(73명환자 내에서의 빈도)
1 (0.014) 1 (0.014) 1 (0.014)
병원
Polyphen-2 예측
(pph2_probability)
N/Ac N/A probably
damaging (1)
SIFT 예측
(점수)
N/A N/A damaging
(0.008)
MAF in
CTL276
0 0 0
공공 데이터베이스
(1000 genome dbSNP135)
신규 신규 신규e
ESP 빈도 신규 신규 신규
a뉴클레오타이드 위치 번호는 LDLR(NM_000527), APOB(NM_000384) 및 PCSK9 (NM_174936) mRNA 서열에 따라 정해졌다.
b 프레임쉬프트는 4nt 뒤의 결실이 108번째 트레오닌까지의 프레임 쉬프트를 보상하여 코딩 아미노산을 109번째 시스테인부터 변화시켰다.
c Polyphen-2 및 SIFT 알고리즘으로부터 종결 돌연변이 예측을 할 수 없었다
d 2500-2502 뉴클레오타이드(GAT)가 cis-위치의 (C)로 치환되었다.
ePCSK9 유전자(REF) 내 p..R215H (c.644G>A)가 기능획득 돌연변이로 보고되어, p.R215C도 역시 병원성 돌연변이임을 알 수 있다.
모든 변이는 생어 시퀀싱에 의해 확인되었다.
통계 및 순위설정 방법의 검증
부하검사는 일반적인 변이를 가지는 유전자에 대해 유용한 방법이나 비-부하 검사는 복합적인 영향 또는 아무 영향이 없는 변이를 가지는 유전자에게 맞는 방법이다. 따라서, 부하검사로 LDLR가 검출될 것이며 APOB PCSK9가 검출될 것이다. 신규 FH 유전자 내의 변이가 어떤 작용을 할지가 알려지지 않았기 때문에, 본 발명자들은 모든 FH 환자들에 대하여 SKAT-O를 적용하였다. LDLR 유전자는 분석에 있어서 가장 유의한 유전자로 나타났다(MAF=1%에서 p=4.97×10-11, 컷오프 0.5%,ρ=1)(도 4a). 유전자-크기조정 결합순위에 의할 때에도 LDLR는 1위로 랭크되어(표 10), FH에 대한 멘델식 형질연구에서 이러한 방법이 유효함을 보여주었다. 한편, APOB PCSK9는 상대적으로 낮게 랭크되었다. 이는 낮은 변이빈도 및 변이의 복합적인 영향일 수 있다. SKAT-O에 의하여, PCSK9 APOB는 통계적으로 유의성이 없었으며(각각 MAF=0.5%에서 P=0.019 및 0. 540, ρ=0.2 및 0), 이를 통해 낮은 순위의 유전자는 명백한 기능 및 생화학적 타당성 또는 통계적 유의성이 있는 경우 원인 유전자로 간주될 필요성이 있음을 알 수 있다.
본 발명자들은 유전자 세트를 체계적으로 발굴하고 유전자들이 어떤식으로 10개 유전자 세트의 3 계층으로 나누어지는지를 시험하였다. LDL 콜레스테롤과 가장 관련이 깊은 유전자들을 유전자 세트에 모았기 때문에, 유전자 세트 매핑 분석에서의 LDLR 유전자와 같이 APOB PCSK9 유전자는 3개 계층으로 매핑되었다.
Figure 112014122704612-pat00001
돌연변이 음성 FH 환자들에 대한 FH-연관 유전자 후보의 순위설정 및 매핑
유전적으로 진단되지 않은 FH 환자들을 대상으로 동일한 통계적 검사 및 순위설정을 수행하여 보고되지 않은 FH-연관 유전자를 동정하고자 하였다. SKAT-O로 변이를 우선 검사하고 유전자-기반 결합순위로 추가 순위설정을 하였다(도 5). 일반적인 집단에서는 희소하면서 돌연변이-음성 FH 환자에서만 검출되는 변이를 사용하였다. SKAT-O에서 ρ>0으로 추정되는 유전자를 순위설정 대상으로 하였다. 이는 SKAT-O에 의한 유의성의 일부가 부하검사 통계로부터 도출됨을 보여준다. 따라서, 동일한 방향에서 효과의 희소 변이를 가지는 유전자는 잔류하였다. 17개 유전자가 50위 이상의 순위를 보였다(표 11). 랭크 순위(일부)는 표 12에 나열하였다.
SKAT-O 및 유전자 크기-조정 결합순위에 의한 Post-hoc순위
유전자 SKAT-O 유전자 크기-조정 결합순위 필터링 후 post-hoc 순위를 위한
배타적 변이
P * 추정 ρ
MCTP2 2.16×10-7 0.2 1 p.R46H(1); p.R340C(1); p.R343Q(1); p.P870S(2)
COL21A1 6.30×10-6 0.1 2 p.C820fs(1); p.D24V(1); p.R226H(2); p.W298L(1)
SERINC2 2.73×10-10 0.2 6 p.D87Y(1); p.L211F(1); p.S323N(1); p.V384I(1)
ATP8A1 9.96×10-5 0.1 10 p.T270A(1); p.S975L(1); p.A1061T(2)
DUSP22 8.55×10-5 0.2 12 p.R80H(2); p.R119C(1)
CSRP1 3.40×10-5 0.1 14 p.M38T(2); p.S87L(1)
SORCS1 1.93×10-4 0.1 16 p.A426T(1); p.S916R(1); p.T922S(1); p.H1085Y(1)
ZNF511 3.85×10-4 0.1 16 p.E153Q(2); p.A191V(1)
TRHR 4.37×10-6 0.2 18 p.A21T(1); p.Y103H(2)
TRAF3IP3 3.40×10-5 0.1 22 p.V325M(1); p.I358T(2)
NELFB 3.58×10-6 0.2 25 p.S357R(1); p.A522V(2)
KCNA5 6.69×10-5 0.1 29 p.P92R(1); p.V259I(2)
ZNF804B 2.96×10-8 0.2 30 p.R25S(1); p.S448G(1); p.S686R(1); p.G733D(1)
MTMR6 2.41×10-4 0.3 36 p.I264V(1); p.R309H(1); p.R583L(1)
DPEP1 7.85×10-4 0.2 40 p.G74S(1); p.D211N(1); p.H286P(1)
LMF1 1.10×10-5 0.1 42 p.I286T(1); p.D474N(2)
NPAS4 6.43×10-6 1.0 46 p.I123V(1); p.S352F(1); p.R634H(1)
*SKAT-O에서 더 작은 p값(MAF=1% 또는 0.5%)을 표시. 배타적 변이가 유전학적으로 진단되지 않은 환자들로부터 검출됨.거짓 양성(false positive) 및 공통 변이를 감소시키기 위한 필터를 적용함.
Figure 112014122704612-pat00002
상위 랭크된 유전자에는 돌연변이-음성 환자에 특이적인 희소 변이가 많았으며, 몇몇 유전자가 환자간 공유되었다. 인 실리코 예측 및 AF의 구체적인 정보는 공공 데이터베이스에 개시되어있다(표 13).
표 11에 나열된 유전자들의 구체적인 정보
유전자 그룹 빈도* 아미노산 변화 유전자형 Polyphen-2 예측 (점수) SIFT 예측(점수) 유전자 좌표 NT
변화
MCTP2 M- 1/46 p.R46H Het 양성(0.167) 내성(0.102) chr15:94841631 G/A
MCTP2 M- 1/46 p.R340C Het 유해가능성 높음(1) 유해(0.001) chr15:94899378 C/T
MCTP2 M- 1/46 p.R343Q Het 유해가능성 높음(0.997) 유해(0.006) chr15:94899388 G/A
MCTP2 M- 2/46 p.P870S Het 유해가능성 있음(0.928) 유해(0.008) chr15:95022234 C/T
COL21A1 M- 1/46 p.D24V Het 유해가능성 높음(0.998) 유해(0.003) chr6:56047346 T/A
COL21A1 M- 2/46 p.R226H Het 유해가능성 높음(1) 유해(0.005) chr6:56035890 C/T
COL21A1 M- 1/46 p.W298L Het 유해가능성 높음(0.997) 내성(0.093) chr6:56035580 C/A
COL21A1 M- 1/46 p.C820fs Het NA NA chr6:55924965 A/-
SERINC2 M- 1/46 p.D87Y Het 유해가능성 높음(0.988) 유해(0.001) chr1:31897587 G/T
SERINC2 M- 1/46 p.L211F Het 유해가능성 있음(0.494) 내성(0.181) chr1:31899521 C/T
SERINC2 M- 1/46 p.S323N Het 양성(0.03) 내성(0.612) chr1:31902340 G/A
SERINC2 M- 1/46 p.V384I Het 유해가능성 높음(0.989) 유해(0.017) chr1:31905950 G/A
ATP8A1 M+ 1/23 p.Q43H Het 유해가능성 있음(0.904) 내성(0.104) chr4:42629047 C/A
ATP8A1 M- 1/46 p.T270A Het 유해가능성 높음(0.976) 유해(0.017) chr4:42583664 T/C
ATP8A1 M- 1/46 p.S975L Het 양성(0.318) 유해(0.033) chr4:42448634 G/A
ATP8A1 M- 2/46 p.A1061T Het 양성(0) 내성(0.136) chr4:42425665 C/T
DUSP22 M- 2/46 p.R80H Het 양성(0.001) 내성(0.170) chr6:345904 G/A
DUSP22 M- 1/46 p.R119C Het 유해가능성 높음(1) 유해(0.002) chr6:348194 C/T
CSRP1 M- 2/46 p.M38T Het 양성(0.013) 내성(0.603) chr1:201459472 A/G
CSRP1 M- 1/46 p.S87L Het 양성(0.016) 내성(0.083) chr1:201459325 G/A
CSRP1 M+ 1/23 p.S155X Het NA NA chr1:201454452 G/C
SORCS1 M- 1/46 p.A426T Het 유해가능성 높음(1) 유해(0.002) chr10:108459109 C/T
SORCS1 M- 1/46 p.S916R Het 유해가능성 높음(0.995) 내성(0.121) chr10:108380234 G/T
SORCS1 M- 1/46 p.T922S Het 유해가능성 있음(0.938) 유해(0.018) chr10:108380217 G/C
SORCS1 M- 1/46 p.H1085Y Het 유해가능성 있음(0.956) 유해(0.007) chr10:108357121 G/A
ZNF511 M- 2/46 p.E153Q Het 유해가능성 있음(0.824) 내성(0.497) chr10:135123695 G/C
ZNF511 M- 1/46 p.A191V Het 양성(0.001) 내성(0.285) chr10:135125237 C/T
TRHR M- 1/46 p.A21T Het 양성(0.001) 내성(0.265) chr8:110099802 G/A
TRHR M- 2/46 p.Y103H Het 유해가능성 높음(0.995) 유해(0.000) chr8:110100048 T/C
TRAF3IP3 M- 1/46 p.V325M Het 유해가능성 높음(0.981) 유해(0.018) chr1:209949061 G/A
TRAF3IP3 M- 2/46 p.I358T Het 유해가능성 있음(0.949) 유해(0.014) chr1:209950776 T/C
NELFB M- 1/46 p.S357R Het 유해가능성 높음(1) 내성(0.115) chr9:140160854 C/A
NELFB M- 2/46 p.A522V Het 양성(0.375) 내성(0.135) chr9:140167036 C/T
KCNA5 M- 1/46 p.P92R Het 양성(0.047) 유해(0.022) chr12:5153588 C/G
KCNA5 M- 2/46 p.V259I Het 양성(0.191) 유해(0.050) chr12:5154088 G/A
ZNF804B M- 1/46 p.R25S Het 유해가능성 높음(0.997) 유해(0.007) chr7:88389365 G/T
ZNF804B M- 1/46 p.S448G Het 양성(0.125) 유해(0.003) chr7:88963638 A/G
ZNF804B M- 1/46 p.S686R Het 양성(0) 내성(0.285) chr7:88964354 C/A
ZNF804B M- 1/46 p.G733D Het 양성(0.006) 내성(0.063) chr7:88964494 G/A
MTMR6 M- 1/46 p.I264V Het 양성(0.326) 내성(0.085) chr13:25832767 T/C
MTMR6 M- 1/46 p.R309H Het 유해가능성 있음(0.891) 유해(0.002) chr13:25831917 C/T
MTMR6 M- 1/46 p.R583L Het 유해가능성 있음(0.845) 내성(0.140) chr13:25823488 C/A
DPEP1 M- 1/46 p.G74S Het 유해가능성 높음(1) 유해(0.000) chr16:89702431 G/A
DPEP1 M- 1/46 p.D211N Het NA 유해(0.000) chr16:89703651 G/A
DPEP1 M- 1/46 p.H286P Het 유해가능성 높음(1) 유해(0.000) chr16:89704043 A/C
LMF1 M- 1/46 p.I286T Het 양성(0.002) 내성(0.228) chr16:929598 A/G
LMF1 M- 2/46 p.D474N Het 양성(0.002) 내성(0.128) chr16:919041 C/T
NPAS4 M- 1/46 p.I123V Het 양성(0.392) 내성(0.129) chr11:66189961 A/G
NPAS4 M- 1/46 p.S352F Het 유해가능성 높음(0.989) 유해(0.002) chr11:66191416 C/T
NPAS4 M- 1/46 p.R634H Het 유해가능성 높음(0.998) 유해(0.020) chr11:66192262 G/A
*46명의 돌연변이-음성 환자 또는 23명의 돌연변이-양성 환자도들의 빈도를 표시.
약어: M+, 돌연변이 양성 그룹; M-, 돌연변이 음성 그룹; Het, 이형접합체; Hom, 동형접합체; N/A, Not Available
대부분의 유전자와 LDL-C 간의 관계는 알려진 바가 거의 없다. MCTP2(multiple C2 domains with transmembrane 2), SERINC2(serine incorporator 2) 및 ZNF804B(zinc finger protein 804B) 유전자는 SKAT-O에서 전장 엑솜 유의성 p<2.68×10-6에 도달하여 상위에 랭크되었다(각각 nth=1, nth=6 및 nth=30). SKAT-O에서의 p 값과 무관하게, COL21A1(collagen typeXXI alpha1) 및 ATP8A1(adenosine triphosphate 8A1) 유전자는 상위에 랭크되었다. ATP8A1의 변이는 p.A1060T 및 p.T270A가 다른 질환을 가진 가족 구성원에 의해 공유되었다(도 6a-6c). 4개의 변이를 가지면서 16위에 랭크된 SORCS1(Sortilin-related VPS10 domain containing receptor 1)은 소르틸린(sortilin) 및 PCSK9 활성을 조절한다. LMF1(lipase maturation factor 1)은 42위에 랭크되었으며 이의 넌센스 돌연변이는 고혈당의 원인으로 보고된 바 있다. 본 연구에서는 미스센스 돌연변이만이 관찰되었다(표 12).
돌연변이-음성 환자에 특이적인 희소변이를 가지는 유전자들은 낮은 순위에도 불구하고 조사대상에 포함시켰다. 28개 유전자를 2개 이상의 유전자 계층으로 매핑하였으며(표 14), 인 실리코 예측 및 AF의 구체적인 정보는 공공 데이터베이스에 개시되어있다(표 15).
GWAS, 경로 데이터베이스 및 LDLR의 PPI(protein-protein interaction) 네트워크로부터 매핑된 관련 유전자
유전자 필터링 후 post-hoc 순위를 위한 배타적 변이 유전자 크기-조정 결합순위 계층 1. 관련 GWAS 신호 계층 2.기능적으로 관련된 경로 계층 3.PPI- LDLR로부터의 확장 *
LPA p.T1734A(2); p.N1778S(1) 504 GWAS 유전자 지단백질 대사 간접 상호작용 (CANX)
MTMR3 p.Q360H(1); p.R645W(1) 567 GWAS 유전자    
INPPL1 p.R390L(1); p.F921L(1) 592   클라트린-매개 엔도사이토시스 간접 상호작용 (UBC,HSPA5)
PLCG1 p.E758K(1); p.A975V(1) 601 GWAS 신호-인접 유전자 (rs6029526, TOP1)   간접 상호작용 (FLT1,UBC)
NPC1L1 p.V360A(1); p.Y893C(1) 661 GWAS genes 지단백질 대사  
LRP1 p.R2218H(1); p.R3927C(1) 991   지질 대사 간접 상호작용 (SNX17,LRPAP1,CANX,DAB1,UBC,DAB2,APOE)
APOH p.V95I(1) 1365 GWAS 유전자    
CSNK1G3 p.S22X(1) 1699 GWAS 유전자    
IQSEC1 p.S791P(1); p.S1081L(1) 1811   엔도사이토시스 간접 상호작용 (APOE)
CARM1 p.L102M(1) 2208 GWAS 신호-인접 유전자 (rs11668477,rs17249141,rs6511720,rs2228671,rs2738459, LDLR)   간접 상호작용(UBC,CREBBP)
GCKR p.R301X(1) 2261 GWAS 유전자 지질 대사  
ABCG5 p.I609V(1) 2312 GWAS 유전자 지단백질 대사  
DAXX p.I120T(1) 2584 GWAS 신호-인접 유전자(rs2254287,B3GALT4)   간접 상호작용(UBC,CREBBP)
SORT1 p.G820D(1) 2749 GWAS 유전자 지질 대사 간접 상호작용 (LRPAP1,UBC)
PIP5K1A p.R715Q(1) 2802 GWAS 신호-인접 유전자 (rs267733,ANXA9-CERS2) 엔도사이토시스  
HMGCR p.H16N(1) 2875 GWAS genes 지질 대사  
AP2B1 p.Q479K(1) 2944   클라트린-매개 엔도사이토시스 간접 상호작용 (AP1M2,UBC,DAB2,LDLRAP1)
MYLIP p.N441Y(1) 3067 GWAS 유전자   직접 상호작용
CBLC p.V39M(1) 3150 GWAS 신호-인접 유전자 (:rs10402271,rs157580,rs2075650,rs1160985rs429358;rs7412,rs4420638,APOE/C1/C4) 엔도사이토시스  
FLT1 p.N516K(1) 3370   엔도사이토시스 직접 상호작용
ERBB3 p.D1259H(1) 3382   엔도사이토시스 간접 상호작용 (DAB1,UBC)
PLTP p.V203M(1) 3404   지질 대사, 지단백질 대사 Indirect interaction (APOE)
ABCG8 p.G110R(1) 3526 GWAS 유전자 지단백질 대사  
ABCA1 p.V481L(1) 3641   지질 대사, 지단백질 대사 간접 상호작용 (UBC,CREBBP)
FN1 p.T1063A(1); p.V2303A(1) 3670 GWAS 유전자   간접 상호작용 (MAP4,UBC,HSPA5,DAB2)
BRCA2 p.K862R(1) 3716 GWAS 유전자    
FCHO2 p.T473A(1) 3872   클라트린-매개 엔도사이토시스 간접 상호작용 (UBC,DAB2)
AP2A2 p.V534L(1) 3985   클라트린-매개 엔도사이토시스, 엔도사이토시스 간접 상호작용 (UBC,DAB2)
*직접 상호작용은 LDLR로부터의 단일 네트워크 경로를 의미하고, 간접 상호작용은 두가지 형태의 LDLR의 네트워크 경로를 의미함. 유전자 세트는 표 3-5에 기재함.
표 15에 나열된 유전자 내의 돌연변이에 대한 구체적인 정보
유전자 그룹 빈도* 아미노산 변화 유전자형 Polyphen-2 예측 (점수) SIFT 예측(점수) 유전자 좌표 NT
변화
LPA M- 2/46 p.T1734A Het 유해가능성 높음(0.98) 내성(0.086) chr6:160968925 T/C
LPA M- 1/46 p.N1778S Het 유해가능성 있음(0.581) 내성(0.403) chr6:160966537 T/C
MTMR3 M- 1/46 p.Q360H Het 양성(0.034) 내성(0.353) chr22:30405077 G/T
MTMR3 M- 1/46 p.R645W Het 유해가능성 높음(0.994) 유해(0.001) chr22:30415581 C/T
INPPL1 M- 1/46 p.R390L Het 유해가능성 있음(0.799) 유해(0.004) chr11:71941484 G/T
INPPL1 M- 1/46 p.F921L Het 양성(0.001) 내성(0.646) chr11:71946912 T/C
PLCG1 M- 1/46 p.E758K Het 유해가능성 있음(0.841) 내성(0.136) chr20:39795470 G/A
PLCG1 M- 1/46 p.A975V Het 유해가능성 높음(0.971) 내성(0.501) chr20:39801079 C/T
NPC1L1 M- 1/46 p.V360A Het 양성(0.001) 유해(0.008) chr7:44578917 A/G
NPC1L1 M+ 1/23 p.G582R Het 유해가능성 있음(0.924) 유해(0.032) chr7:44575965 C/T
NPC1L1 M- 1/46 p.Y893C Het 유해가능성 높음(1) 유해(0.000) chr7:44561801 T/C
LRP1 M+ 1/23 p.G2165R Het 유해가능성 높음(1) 유해(0.002) chr12:57579343 G/A
LRP1 M- 1/46 p.R2218H Het 양성(0.131) 내성(0.111) chr12:57579503 G/A
LRP1 M+ 1/23 p.V2325I Het 유해가능성 높음(0.999) 내성(0.161) chr12:57581181 G/A
LRP1 M- 1/46 p.R3927C Het 양성(0.003) 내성(0.174) chr12:57600444 C/T
APOH M- 1/46 p.V95I Het 유해가능성 있음(0.875) 내성(0.388) chr17:64222201 C/T
CSNK1G3 M- 1/46 p.S22X Het NA NA chr5:122881422 C/A
IQSEC1 M- 1/46 p.S791P Het 유해가능성 높음(0.995) 유해(0.002) chr3:12953174 A/G
IQSEC1 M- 1/46 p.S1081L Het 양성(0.043) 유해(0.000) chr3:12942585 G/A
CARM1 M- 1/46 p.L102M Het 유해가능성 높음(0.993) 유해(0.011) chr19:11015710 C/A
GCKR M- 1/46 p.R301X Het NA NA chr2:27729379 C/T
ABCG5 M- 1/46 p.I609V Het 유해가능성 높음(0.994) 내성(0.209) chr2:44040386 T/C
DAXX M- 1/46 p.I120T Het 양성(0.032) 내성(0.269) chr6:33289229 A/G
SORT1 M- 1/46 p.G820D Het 양성(0.002) 내성(0.180) chr1:109856905 C/T
PIP5K1A M- 1/46 p.R715Q Het 유해가능성 있음(0.932) NA chr10:95719010 C/T
HMGCR M- 1/46 p.H16N Het 유해가능성 높음(1) 유해(0.002) chr5:74638476 C/A
AP2B1 M- 1/46 p.Q479K Het 양성(0.071) 내성(0.053) chr17:33966777 C/A
MYLIP M- 1/46 p.N441Y Het 유해가능성 높음(0.994) 유해(0.014) chr6:16146965 A/T
CBLC M- 1/46 p.V39M Het 양성(0.001) 내성(0.082) chr19:45281303 G/A
FLT1 M- 1/46 p.N516K Het 유해가능성 있음(0.716) 내성(0.072) chr13:28979920 A/C
ERBB3 M- 1/46 p.D1259H Het 유해가능성 있음(0.718) 유해(0.009) chr12:56495585 G/C
PLTP M- 1/46 p.V203M Het 유해가능성 높음(0.968) 유해(0.016) chr20:44536337 C/T
ABCG8 M- 1/46 p.G110R Het 유해가능성 높음(1) 유해(0.000) chr2:44078728 G/A
ABCA1 M- 1/46 p.V481L Het 양성(0) 내성(0.488) chr9:107594923 C/A
FN1 M- 1/46 p.V2303A Het 양성(0.014) 내성(1.000) chr2:216232696 A/G
FN1 M- 1/46 p.T1063A Het 양성(0) 내성(0.058) chr2:216269178 T/C
FN1 M+ 1/23 p.G2057V Het 유해가능성 있음(0.907) 유해(0.001) chr2:216238122 C/A
BRCA2 M- 1/46 p.K862R Het 양성(0.024) 내성(0.225) chr13:32911077 A/G
FCHO2 M- 1/46 p.T473A Het 양성(0) 내성(0.702) chr5:72359739 A/G
AP2A2 M- 1/46 p.V534L Het 양성(0.002) 내성(0.240) chr11:993803 G/C
*46명의 돌연변이-음성 환자 또는 23명의 돌연변이-양성 환자도들의 빈도를 표시.
약어: M+, 돌연변이 양성 그룹; M-, 돌연변이 음성 그룹; Het, 이형접합체; Hom, 동형접합체; N/A, Not Available
MYLIP SORT1와 같은 알려진 FH-관련 유전자에서 희소 변이가 나타났다. 두 개의 이형접합 stop-gain(p.R301X 및 p.S22X) 변이가 종래의 고 LDL-C와 관련된 GWAS에서 예측된 GCKR CSNK1G3에서 발견되었다. (FLT1)(fms-related tyrosinekinase 1)은 LDLR과의 관련성이 알려지지 않았음에도 LDLR와 물리적으로 상호작용을 하여 하나의 희소 변이(p.N516K)와 함께 매핑되었다. FLT1 및 LDLR은 클라트린과 독립적으로 LDL의 자극효과에 의하여 함께 세포질섭취될 수 있다(Sachais BS et al., Blood. 99:3613-22 (2002)). 하나의 계층의 유전자 세트로 매핑된 다른 유전자 및 변이 프로파일을 표 16에 나열하였다.
Figure 112014122704612-pat00003
마지막으로, 상기 표 13 및 표 15에 나열된 돌연변이 중 Polyphen-2 예측 및 SIFT 예측 모두에서 FH와 관련된 유해 돌연변이로 판명된 돌연변이들을 하기 표 17에 정리하였다.
FH와 관련된 유해 돌연변이
서열목록 유전자 아미노산 변화 NT 변화 진뱅크 접근번호a
6 MCTP2 p.R340C c.1018C>T NM_018349
6 MCTP2 p.R343Q c.1028G>A NM_018349
6 MCTP2 p.P870S c.2608C>T NM_018349
7 COL21A1 p.D24V c.71A>T NM_030820
7 COL21A1 p.R226H c.677G>A NM_030820
8 SERINC2 p.D87Y c.259G>T NM_178865
8 SERINC2 p.V384I c.1150G>A NM_178865
9 ATP8A1 p.T270A c.808A>G NM_006095
10 DUSP22 p.R119C c.355C>T NM_020185
11 SORCS1 p.A426T c.1276G>A NM_052918
11 SORCS1 p.T922S c.2765C>G NM_052918
11 SORCS1 p.H1085Y c.3253C>T NM_052918
12 TRHR p.Y103H c.307T>C NM_003301
13 TRAF3IP3 p.V325M c.1033G>A NM_025228
13 TRAF3IP3 p.I358T c.1133T>C NM_025228
14 ZNF804B p.R25S c.75G>T NM_181646
15 MTMR6 p.R309H c.926G>A NM_004685
16 DPEP1 p.G74S c.220G>A NM_004413
16 DPEP1 p.H286P c.857A>C NM_004413
17 NPAS4 p.S352F c.1055C>T NM_178864
17 NPAS4 p.R634H c.1901G>A NM_178864
18 MTMR3 p.R645W c.1933C>T NM_021090
19 INPPL1 p.R390L c.1169G>T NM_001567
20 NPC1L1 p.G582R c.1744G>A NM_013389
21 LRP1 p.G2165R c.6493G>A NM_002332
22 IQSEC1 p.S791P c.2371T>C NM_001134382
23 CARM1 p.L102M c.304C>A NM_199141
24 HMGCR p.H16N c.46C>A NM_000859
25 MYLIP p.N441Y c.1321A>T NM_013262
26 ERBB3 p.D1259H c.3775G>C NM_001982
27 PLTP p.V203M c.607G>A NM_006227
28 ABCG8 p.G110R c.328G>A NM_022437
29 FN1 p.G2057V c.6170G>T NM_212482
a진뱅크 접근번호(Genbank Accession No.)는 해당 돌연변이를 가진 유전자의 야생형 뉴클레오타이드 서열에 대한 접근번호이다.
이상으로 본 발명의 특정한 부분을 상세히 기술하였는 바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.
<110> Industry-Academic Cooperation Foundation Yonsei University <120> Novel Mutations Implicated in Familial Hypercholesterolemia and Use Thereof <130> PN140236 <160> 29 <170> KopatentIn 2.0 <210> 1 <211> 2583 <212> DNA <213> homo sapiens <400> 1 atggggccct ggggctggaa attgcgctgg accgtcgcct tgctcctcgc cgcggcgggg 60 actgcagtgg gcgacagatg cgaaagaaac gagttccagt gccaagacgg gaaatgcatc 120 tcctacaagt gggtctgcga tggcagcgct gagtgccagg atggctctga tgagtcccag 180 gagacgtgct tgtctgtcac ctgcaaatcc ggggacttca gctgtggggg ccgtgtcaac 240 cgctgcattc ctcagttctg gaggtgcgat ggccaagtgg actgcgacaa cggctcagac 300 gagcaaggct gtccccccaa gacgtgctcc caggacgagt ttcgctgcca cgatgggaag 360 tgcatctctc ggcagttcgt ctgtgactca gaccgggact gcttggacgg ctcagacgag 420 gcctcctgcc cggtgctcac ctgtggtccc gccagcttcc agtgcaacag ctccacctgc 480 atcccccagc tgtgggcctg cgacaacgac cccgactgcg aagatggctc ggatgagtgg 540 ccgcagcgct gtaggggtct ttacgtgttc caaggggaca gtagcccctg ctcggccttc 600 gagttccact gcctaagtgg cgagtgcatc cactccagct ggcgctgtga tggtggcccc 660 gactgcaagg acaaatctga cgaggaaaac tgcgctgtgg ccacctgtcg ccctgacgaa 720 ttccagtgct ctgatggaaa ctgcatccat ggcagccggc agtgtgaccg ggaatatgac 780 tgcaaggaca tgagcgatga agttggctgc gttaatgtga cactctgcga gggacccaac 840 aagttcaagt gtcacagcgg cgaatgcatc accctggaca aagtctgcaa catggctaga 900 gactgccggg actggtcaga tgaacccatc aaagagtgcg ggaccaacga atgcttggac 960 aacaacggcg gctgttccca cgtctgcaat gaccttaaga tcggctacga gtgcctgtgc 1020 cccgacggct tccagctggt ggcccagcga agatgcgaag atatcgatga gtgtcaggat 1080 cccgacacct gcagccagct ctgcgtgaac ctggagggtg gctacaagtg ccagtgtgag 1140 gaaggcttcc agctggaccc ccacacgaag gcctgcaagg ctgtgggctc catcgcctac 1200 ctcttcttca ccaaccggca cgaggtcagg aagatgacgc tggaccggag cgagtacacc 1260 agcctcatcc ccaacctgag gaacgtggtc gctctggaca cggaggtggc cagcaataga 1320 atctactggt ctgacctgtc ccagagaatg atctgcagca cccagcttga cagagcccac 1380 ggcgtctctt cctatgacac cgtcatcagc agagacatcc aggcccccga cgggctggct 1440 gtggactgga tccacagcaa catctactgg accgactctg tcctgggcac tgtctctgtt 1500 gcggatacca agggcgtgaa gaggaaaacg ttattcaggg agaacggctc caagccaagg 1560 gccatcgtgg tggatcctgt tcatggcttc atgtactgga ctgactgggg aactcccgcc 1620 aagatcaaga aagggggcct gaatggtgtg gacatctact cgctggtgac tgaaaacatt 1680 cagtggccca atggcatcac cctagatctc ctcagtggcc gcctctactg ggttgactcc 1740 aaacttcact ccatctcaag catcgatgtc aacgggggca accggaagac catcttggag 1800 gatgaaaaga ggctggccca ccccttctcc ttggccgtct ttgaggacaa agtattttgg 1860 acagatatca tcaacgaagc cattttcagt gccaaccgcc tcacaggttc cgatgtcaac 1920 ttgttggctg aaaacctact gtccccagag gatatggttc tcttccacaa cctcacccag 1980 ccaagaggag tgaactggtg tgagaggacc accctgagca atggcggctg ccagtatctg 2040 tgcctccctg ccccgcagat caacccccac tcgcccaagt ttacctgcgc ctgcccggac 2100 ggcatgctgc tggccaggga catgaggagc tgcctcacag aggctgaggc tgcagtggcc 2160 acccaggaga catccaccgt caggctaaag gtcagctcca cagccgtaag gacacagcac 2220 acaaccaccc gacctgttcc cgacacctcc cggctgcctg gggccacccc tgggctcacc 2280 acggtggaga tagtgacaat gtctcaccaa gctctgggcg acgttgctgg cagaggaaat 2340 gagaagaagc ccagtagcgt gagggctctg tccattgtcc tccccatcgt gctcctcgtc 2400 ttcctttgcc tgggggtctt ccttctatgg aagaactggc ggcttaagaa catcaacagc 2460 atcaactttg acaaccccgt ctatcagaag accacagagg atgaggtcca catttgccac 2520 aaccaggacg gctacagcta cccctcgaga cagatggtca gtctggagga tgacgtggcg 2580 tga 2583 <210> 2 <211> 2078 <212> DNA <213> homo sapiens <400> 2 atgggcaccg tcagctccag gcggtcctgg tggccgctgc cactgctgct gctgctgctg 60 ctgctcctgg gtcccgcggg cgcccgtgcg caggaggacg aggacggcga ctacgaggag 120 ctggtgctag ccttgcgttc cgaggaggac ggcctggccg aagcacccga gcacggaacc 180 acagccacct tccaccgctg cgccaaggat ccgtggaggt tgcctggcac ctacgtggtg 240 gtgctgaagg aggagaccca cctctcgcag tcagagcgca ctgcccgccg cctgcaggcc 300 caggctgccc gccggggata cctcaccaag atcctgcatg tcttccatgg ccttcttcct 360 ggcttcctgg tgaagatgag tggcgacctg ctggagctgg ccttgaagtt gccccatgtc 420 gactacatcg aggaggactc ctctgtcttt gcccagagca tcccgtggaa cctggagcgg 480 attacccctc cacggtaccg ggcggatgaa taccagcccc ccgacggagg cagcctggtg 540 gaggtgtatc tcctagacac cagcatacag agtgaccacc gggaaatcga gggcagggtc 600 atggtcaccg acttcgagaa tgtgcccgag gaggacggga cccgcttcca cagacaggcc 660 agcaagtgtg acagtcatgg cacccacctg gcaggggtgg tcagcggccg ggatgccggc 720 gtggccaagg gtgccagcat gcgcagcctg cgcgtgctca actgccaagg gaagggcacg 780 gttagcggca ccctcatagg cctggagttt attcggaaaa gccagctggt ccagcctgtg 840 gggccactgg tggtgctgct gcccctggcg ggtgggtaca gccgcgtcct caacgccgcc 900 tgccagcgcc tggcgagggc tggggtcgtg ctggtcaccg ctgccggcaa cttccgggac 960 gatgcctgcc tctactcccc agcctcagct cccgaggtca tcacagttgg ggccaccaat 1020 gcccaagacc agccggtgac cctggggact ttggggacca actttggccg ctgtgtggac 1080 ctctttgccc caggggagga catcattggt gcctccagcg actgcagcac ctgctttgtg 1140 tcacagagtg ggacatcaca ggctgctgcc cacgtggctg gcattgcagc catgatgctg 1200 tctgccgagc cggagctcac cctggccgag ttgaggcaga gactgatcca cttctctgcc 1260 aaagatgtca tcaatgaggc ctggttccct gaggaccagc gggtactgac ccccaacctg 1320 gtggccgccc tgccccccag cacccatggg gcaggttggc agctgttttg caggactgta 1380 tggtcagcac actcggggcc tacacggatg gccacagccg tcgcccgctg cgccccagat 1440 gaggagctgc tgagctgctc cagtttctcc aggagtggga agcggcgggg cgagcgcatg 1500 gaggcccaag ggggcaagct ggtctgccgg gcccacaacg cttttggggg tgagggtgtc 1560 tacgccattg ccaggtgctg cctgctaccc caggccaact gcagcgtcca cacagctcca 1620 ccagctgagg ccagcatggg gacccgtgtc cactgccacc aacagggcca cgtcctcaca 1680 ggctgcagct cccactggga ggtggaggac cttggcaccc acaagccgcc tgtgctgagg 1740 ccacgaggtc agcccaacca gtgcgtgggc cacagggagg ccagcatcca cgcttcctgc 1800 tgccatgccc caggtctgga atgcaaagtc aaggagcatg gaatcccggc ccctcaggag 1860 caggtgaccg tggcctgcga ggagggctgg accctgactg gctgcagtgc cctccctggg 1920 acctcccacg tcctgggggc ctacgccgta gacaacacgt gtgtagtcag gagccgggac 1980 gtcagcacta caggcagcac cagcgaaggg gccgtgacag ccgttgccat ctgctgccgg 2040 agccggcacc tggcgcaggc ctcccaggag ctccagtg 2078 <210> 3 <211> 200 <212> PRT <213> homo sapiens <400> 3 Met Gly Pro Trp Gly Trp Lys Leu Arg Trp Thr Val Ala Leu Leu Leu 1 5 10 15 Ala Ala Ala Gly Thr Ala Val Gly Asp Arg Cys Glu Arg Asn Glu Phe 20 25 30 Gln Cys Gln Asp Gly Lys Cys Ile Ser Tyr Lys Trp Val Cys Asp Gly 35 40 45 Ser Ala Glu Cys Gln Asp Gly Ser Asp Glu Ser Gln Glu Thr Cys Leu 50 55 60 Ser Val Thr Cys Lys Ser Gly Asp Phe Ser Cys Gly Gly Arg Val Asn 65 70 75 80 Arg Cys Ile Pro Gln Phe Trp Arg Cys Asp Gly Gln Val Asp Cys Asp 85 90 95 Asn Gly Ser Asp Glu Gln Gly Cys Pro Pro Lys Thr Ser Phe Ala Ala 100 105 110 Thr Met Gly Ser Ala Ser Leu Gly Ser Ser Ser Val Thr Gln Thr Gly 115 120 125 Thr Ala Trp Thr Ala Gln Thr Arg Pro Pro Ala Arg Cys Ser Pro Val 130 135 140 Val Pro Pro Ala Ser Ser Ala Thr Ala Pro Pro Ala Ser Pro Ser Cys 145 150 155 160 Gly Pro Ala Thr Thr Thr Pro Thr Ala Lys Met Ala Arg Met Ser Gly 165 170 175 Arg Ser Ala Val Gly Val Phe Thr Cys Ser Lys Gly Thr Val Ala Pro 180 185 190 Ala Arg Pro Ser Ser Ser Thr Ala 195 200 <210> 4 <211> 856 <212> PRT <213> homo sapiens <400> 4 Met Gly Pro Trp Gly Trp Lys Leu Arg Trp Thr Val Ala Leu Leu Leu 1 5 10 15 Ala Ala Ala Gly Thr Ala Val Gly Asp Arg Cys Glu Arg Asn Glu Phe 20 25 30 Gln Cys Gln Asp Gly Lys Cys Ile Ser Tyr Lys Trp Val Cys Asp Gly 35 40 45 Ser Ala Glu Cys Gln Asp Gly Ser Asp Glu Ser Gln Glu Thr Cys Leu 50 55 60 Ser Val Thr Cys Lys Ser Gly Asp Phe Ser Cys Gly Gly Arg Val Asn 65 70 75 80 Arg Cys Ile Pro Gln Phe Trp Arg Cys Asp Gly Gln Val Asp Cys Asp 85 90 95 Asn Gly Ser Asp Glu Gln Gly Cys Pro Pro Lys Thr Cys Ser Gln Asp 100 105 110 Glu Phe Arg Cys His Asp Gly Lys Cys Ile Ser Arg Gln Phe Val Cys 115 120 125 Asp Ser Asp Arg Asp Cys Leu Asp Gly Ser Asp Glu Ala Ser Cys Pro 130 135 140 Val Leu Thr Cys Gly Pro Ala Ser Phe Gln Cys Asn Ser Ser Thr Cys 145 150 155 160 Ile Pro Gln Leu Trp Ala Cys Asp Asn Asp Pro Asp Cys Glu Asp Gly 165 170 175 Ser Asp Glu Trp Pro Gln Arg Cys Arg Gly Leu Tyr Val Phe Gln Gly 180 185 190 Asp Ser Ser Pro Cys Ser Ala Phe Glu Phe His Cys Leu Ser Gly Glu 195 200 205 Cys Ile His Ser Ser Trp Arg Cys Asp Gly Gly Pro Asp Cys Lys Asp 210 215 220 Lys Ser Asp Glu Glu Asn Cys Ala Val Ala Thr Cys Arg Pro Asp Glu 225 230 235 240 Phe Gln Cys Ser Asp Gly Asn Cys Ile His Gly Ser Arg Gln Cys Asp 245 250 255 Arg Glu Tyr Asp Cys Lys Asp Met Ser Asp Glu Val Gly Cys Val Asn 260 265 270 Val Thr Leu Cys Glu Gly Pro Asn Lys Phe Lys Cys His Ser Gly Glu 275 280 285 Cys Ile Thr Leu Asp Lys Val Cys Asn Met Ala Arg Asp Cys Arg Asp 290 295 300 Trp Ser Asp Glu Pro Ile Lys Glu Cys Gly Thr Asn Glu Cys Leu Asp 305 310 315 320 Asn Asn Gly Gly Cys Ser His Val Cys Asn Asp Leu Lys Ile Gly Tyr 325 330 335 Glu Cys Leu Cys Pro Asp Gly Phe Gln Leu Val Ala Gln Arg Arg Cys 340 345 350 Glu Asp Ile Asp Glu Cys Gln Asp Pro Asp Thr Cys Ser Gln Leu Cys 355 360 365 Val Asn Leu Glu Gly Gly Tyr Lys Cys Gln Cys Glu Glu Gly Phe Gln 370 375 380 Leu Asp Pro His Thr Lys Ala Cys Lys Ala Val Gly Ser Ile Ala Tyr 385 390 395 400 Leu Phe Phe Thr Asn Arg His Glu Val Arg Lys Met Thr Leu Asp Arg 405 410 415 Ser Glu Tyr Thr Ser Leu Ile Pro Asn Leu Arg Asn Val Val Ala Leu 420 425 430 Asp Thr Glu Val Ala Ser Asn Arg Ile Tyr Trp Ser Asp Leu Ser Gln 435 440 445 Arg Met Ile Cys Ser Thr Gln Leu Asp Arg Ala His Gly Val Ser Ser 450 455 460 Tyr Asp Thr Val Ile Ser Arg Asp Ile Gln Ala Pro Asp Gly Leu Ala 465 470 475 480 Val Asp Trp Ile His Ser Asn Ile Tyr Trp Thr Asp Ser Val Leu Gly 485 490 495 Thr Val Ser Val Ala Asp Thr Lys Gly Val Lys Arg Lys Thr Leu Phe 500 505 510 Arg Glu Asn Gly Ser Lys Pro Arg Ala Ile Val Val Asp Pro Val His 515 520 525 Gly Phe Met Tyr Trp Thr Asp Trp Gly Thr Pro Ala Lys Ile Lys Lys 530 535 540 Gly Gly Leu Asn Gly Val Asp Ile Tyr Ser Leu Val Thr Glu Asn Ile 545 550 555 560 Gln Trp Pro Asn Gly Ile Thr Leu Asp Leu Leu Ser Gly Arg Leu Tyr 565 570 575 Trp Val Asp Ser Lys Leu His Ser Ile Ser Ser Ile Asp Val Asn Gly 580 585 590 Gly Asn Arg Lys Thr Ile Leu Glu Asp Glu Lys Arg Leu Ala His Pro 595 600 605 Phe Ser Leu Ala Val Phe Glu Asp Lys Val Phe Trp Thr Asp Ile Ile 610 615 620 Asn Glu Ala Ile Phe Ser Ala Asn Arg Leu Thr Gly Ser Asp Val Asn 625 630 635 640 Leu Leu Ala Glu Asn Leu Leu Ser Pro Glu Asp Met Val Leu Phe His 645 650 655 Asn Leu Thr Gln Pro Arg Gly Val Asn Trp Cys Glu Arg Thr Thr Leu 660 665 670 Ser Asn Gly Gly Cys Gln Tyr Leu Cys Leu Pro Ala Pro Gln Ile Asn 675 680 685 Pro His Ser Pro Lys Phe Thr Cys Ala Cys Pro Asp Gly Met Leu Leu 690 695 700 Ala Arg Asp Met Arg Ser Cys Leu Thr Glu Ala Glu Ala Ala Val Ala 705 710 715 720 Thr Gln Glu Thr Ser Thr Val Arg Leu Lys Val Ser Ser Thr Ala Val 725 730 735 Arg Thr Gln His Thr Thr Thr Arg Pro Val Pro Asp Thr Ser Arg Leu 740 745 750 Pro Gly Ala Thr Pro Gly Leu Thr Thr Val Glu Ile Val Thr Met Ser 755 760 765 His Gln Ala Leu Gly Asp Val Ala Gly Arg Gly Asn Glu Lys Lys Pro 770 775 780 Ser Ser Val Arg Ala Leu Ser Ile Val Leu Pro Ile Val Leu Leu Val 785 790 795 800 Phe Leu Cys Leu Gly Val Phe Leu Leu Trp Lys Asn Trp Arg Leu Lys 805 810 815 Asn Ile Asn Ser Ile Asn Phe Asp Asn Pro Val Tyr Gln Lys Thr Thr 820 825 830 Glu Arg Gly Pro His Leu Pro Gln Pro Gly Arg Leu Gln Leu Pro Leu 835 840 845 Glu Thr Asp Gly Gln Ser Gly Gly 850 855 <210> 5 <211> 692 <212> PRT <213> homo sapiens <400> 5 Met Gly Thr Val Ser Ser Arg Arg Ser Trp Trp Pro Leu Pro Leu Leu 1 5 10 15 Leu Leu Leu Leu Leu Leu Leu Gly Pro Ala Gly Ala Arg Ala Gln Glu 20 25 30 Asp Glu Asp Gly Asp Tyr Glu Glu Leu Val Leu Ala Leu Arg Ser Glu 35 40 45 Glu Asp Gly Leu Ala Glu Ala Pro Glu His Gly Thr Thr Ala Thr Phe 50 55 60 His Arg Cys Ala Lys Asp Pro Trp Arg Leu Pro Gly Thr Tyr Val Val 65 70 75 80 Val Leu Lys Glu Glu Thr His Leu Ser Gln Ser Glu Arg Thr Ala Arg 85 90 95 Arg Leu Gln Ala Gln Ala Ala Arg Arg Gly Tyr Leu Thr Lys Ile Leu 100 105 110 His Val Phe His Gly Leu Leu Pro Gly Phe Leu Val Lys Met Ser Gly 115 120 125 Asp Leu Leu Glu Leu Ala Leu Lys Leu Pro His Val Asp Tyr Ile Glu 130 135 140 Glu Asp Ser Ser Val Phe Ala Gln Ser Ile Pro Trp Asn Leu Glu Arg 145 150 155 160 Ile Thr Pro Pro Arg Tyr Arg Ala Asp Glu Tyr Gln Pro Pro Asp Gly 165 170 175 Gly Ser Leu Val Glu Val Tyr Leu Leu Asp Thr Ser Ile Gln Ser Asp 180 185 190 His Arg Glu Ile Glu Gly Arg Val Met Val Thr Asp Phe Glu Asn Val 195 200 205 Pro Glu Glu Asp Gly Thr Cys Phe His Arg Gln Ala Ser Lys Cys Asp 210 215 220 Ser His Gly Thr His Leu Ala Gly Val Val Ser Gly Arg Asp Ala Gly 225 230 235 240 Val Ala Lys Gly Ala Ser Met Arg Ser Leu Arg Val Leu Asn Cys Gln 245 250 255 Gly Lys Gly Thr Val Ser Gly Thr Leu Ile Gly Leu Glu Phe Ile Arg 260 265 270 Lys Ser Gln Leu Val Gln Pro Val Gly Pro Leu Val Val Leu Leu Pro 275 280 285 Leu Ala Gly Gly Tyr Ser Arg Val Leu Asn Ala Ala Cys Gln Arg Leu 290 295 300 Ala Arg Ala Gly Val Val Leu Val Thr Ala Ala Gly Asn Phe Arg Asp 305 310 315 320 Asp Ala Cys Leu Tyr Ser Pro Ala Ser Ala Pro Glu Val Ile Thr Val 325 330 335 Gly Ala Thr Asn Ala Gln Asp Gln Pro Val Thr Leu Gly Thr Leu Gly 340 345 350 Thr Asn Phe Gly Arg Cys Val Asp Leu Phe Ala Pro Gly Glu Asp Ile 355 360 365 Ile Gly Ala Ser Ser Asp Cys Ser Thr Cys Phe Val Ser Gln Ser Gly 370 375 380 Thr Ser Gln Ala Ala Ala His Val Ala Gly Ile Ala Ala Met Met Leu 385 390 395 400 Ser Ala Glu Pro Glu Leu Thr Leu Ala Glu Leu Arg Gln Arg Leu Ile 405 410 415 His Phe Ser Ala Lys Asp Val Ile Asn Glu Ala Trp Phe Pro Glu Asp 420 425 430 Gln Arg Val Leu Thr Pro Asn Leu Val Ala Ala Leu Pro Pro Ser Thr 435 440 445 His Gly Ala Gly Trp Gln Leu Phe Cys Arg Thr Val Trp Ser Ala His 450 455 460 Ser Gly Pro Thr Arg Met Ala Thr Ala Val Ala Arg Cys Ala Pro Asp 465 470 475 480 Glu Glu Leu Leu Ser Cys Ser Ser Phe Ser Arg Ser Gly Lys Arg Arg 485 490 495 Gly Glu Arg Met Glu Ala Gln Gly Gly Lys Leu Val Cys Arg Ala His 500 505 510 Asn Ala Phe Gly Gly Glu Gly Val Tyr Ala Ile Ala Arg Cys Cys Leu 515 520 525 Leu Pro Gln Ala Asn Cys Ser Val His Thr Ala Pro Pro Ala Glu Ala 530 535 540 Ser Met Gly Thr Arg Val His Cys His Gln Gln Gly His Val Leu Thr 545 550 555 560 Gly Cys Ser Ser His Trp Glu Val Glu Asp Leu Gly Thr His Lys Pro 565 570 575 Pro Val Leu Arg Pro Arg Gly Gln Pro Asn Gln Cys Val Gly His Arg 580 585 590 Glu Ala Ser Ile His Ala Ser Cys Cys His Ala Pro Gly Leu Glu Cys 595 600 605 Lys Val Lys Glu His Gly Ile Pro Ala Pro Gln Glu Gln Val Thr Val 610 615 620 Ala Cys Glu Glu Gly Trp Thr Leu Thr Gly Cys Ser Ala Leu Pro Gly 625 630 635 640 Thr Ser His Val Leu Gly Ala Tyr Ala Val Asp Asn Thr Cys Val Val 645 650 655 Arg Ser Arg Asp Val Ser Thr Thr Gly Ser Thr Ser Glu Gly Ala Val 660 665 670 Thr Ala Val Ala Ile Cys Cys Arg Ser Arg His Leu Ala Gln Ala Ser 675 680 685 Gln Glu Leu Gln 690 <210> 6 <211> 2637 <212> DNA <213> homo sapiens <400> 6 atggatctgg ataaaccatc tgtttggggc tcattaaaac agcggaccag gccattgttg 60 atcaacttga gcaagaagaa ggtgaaaaag aacccaagta agcccccaga tctacgggca 120 aggcatcact tggaccgccg tctcagcctc tctgtgcctg atctcctgga ggctgaggcc 180 ttggccccag agggccggcc ttactccggg ccacagtctt cctacacctc ggtgcccagc 240 agtctgtcca ctgcagggat ctttcccaag agcagcagta gctccttgaa acagtctgaa 300 gaagaattgg attggagcca ggaagaagcc agtcacctcc atgtggtgga aacagactca 360 gaggaggcct atgcctctcc tgctgagcgg agacgggtgt ccagcaacgg catctttgat 420 cttcagaaaa cttcccttgg aggggatgca ccagaagagc cagagaagct atgtggaagc 480 agtgacctga atgcttctat gacatctcaa cattttgaag aacaatctgt accgggggaa 540 gccagtgatg gcttgagtaa cctccccagc ccttttgcgt acctcctcac catacacctg 600 aaggaaggcc ggaacctggt tgtccgagat cgctgtggca caagtgatcc ttatgtgaaa 660 tttaagctga atgggaagac gctgtacaaa agtaaagtca tatataagaa cttgaaccca 720 gtatgggatg agatagttgt attgccaatc caaagccttg atcaaaagct acgtgtgaag 780 gtatatgatc gagatttaac cacatctgat ttcatgggtt ctgcatttgt cattctcagt 840 gatcttgagc ttaacagaac aactgaacat attttaaaac tggaagatcc aaacagttta 900 gaagatgaca tgggagtgat cgtgttaaat ttgaacctag tggtaaaaca gggtgatttc 960 aagagacacc gttggtcaaa tcggaagcga ttaagtgcca gcaagtcctc tttgatacgc 1020 aacctacggc tctctgagtc cttgaaaaag aaccaactct ggaacgggat tataagtata 1080 actttgttgg aagggaagaa tgtctcagga ggaagcatga cagagatgtt tgtccagtta 1140 aaactgggag atcagaggta taaaagtaag acactgtgta agagtgcaaa tccgcagtgg 1200 caggaacagt ttgactttca ctacttctct gacaggatgg gcattttgga cattgaagtg 1260 tggggaaagg acaacaaaaa gcatgaggaa cgtctgggca cgtgtaaagt ggatatctcg 1320 gcactccctc tgaagcaagc caactgcctg gagctgccac tggacagctg tctgggggct 1380 ctccttatgt tggtcacact tacaccctgt gcgggggtct ccgtctctga tctgtgtgtc 1440 tgccccttag cagacctcag cgaaagaaag cagattaccc agcgatattg cttacagaac 1500 tccctgaaag atgtgaaaga cgtcggcatt ctacaagtga aggttttaaa ggcagcagat 1560 ctcttagcgg cagatttctc agggaagagt gacccatttt gcttgttgga gttaggcaat 1620 gaccgacttc agacgcatac cgtctacaaa aacctcaacc ctgaatggaa caaagttttt 1680 acatttccca ttaaagatat ccatgatgtt ttggaagtga cagtgtttga tgaagatgga 1740 gataaacccc cagattttct tggaaaagtt gccattccct tgctgtccat tagagatgga 1800 caaccgaatt gttatgtact aaagaataaa gatttagaac aagcttttaa aggagttatt 1860 tacttagaga tggaccttat atataatccg gtgaaagcaa gtattaggac ttttactccc 1920 cgggaaaagc gctttgttga agacagccgc aagctgtcca aaaagatctt atcaagagat 1980 gtggaccgtg tgaaaagaat cactatggca atatggaata caatgcagtt ccttaaaagc 2040 tgcttccagt gggaatccac attaagaagt acaatagcat tcgcggtatt tttgatcact 2100 gtctggaatt ttgaactata tatgatcccc ttggcattgt tgctgatctt tgtctacaat 2160 ttcatcagac ctgtgaaagg caaggtcagc agcatccagg acagccagga gagcacagac 2220 atagatgacg aggaggatga agatgacaag gaatctgaga aaaaggggtt gattgaaaga 2280 atctatatgg tacaggatat tgtttcaact gttcaaaacg tcttggagga aatagcttct 2340 tttggagaaa ggattaagaa cacatttaac tggacggtcc ccttcctttc atctctggcc 2400 tgtttgattc tggcagcagc caccatcatt ttgtatttca ttccactgcg gtacatcatt 2460 ttaatctggg gcataaataa atttactaag aagcttcgaa atccctattc catcgacaat 2520 aatgagctac tagacttcct ctctagggta ccgtctgatg ttcaaaaggt gcagtatgca 2580 gaattgaaac tctgcagcag ccacagcccc ctgcggaaga agcgcagcgc tctctag 2637 <210> 7 <211> 2874 <212> DNA <213> homo sapiens <400> 7 atggctcact atattacatt tctctgcatg gttttggtgc tgcttcttca gaattctgtg 60 ttagctgaag atggggaagt aagatcaagt tgtcgtactg ctccgacaga tttagttttc 120 atcttagatg gctcttatag tgttggccca gaaaactttg aaatagtgaa aaagtggctt 180 gtcaatatca caaaaaactt tgacataggg ccgaagttta ttcaagttgg agtggttcaa 240 tatagtgact accctgtgct ggagattcct ctcggaagct atgattcagg agaacatttg 300 acggcagcag tggaatccat actctactta ggaggaaaca caaagacagg gaaggccatc 360 cagtttgcgc tcgattacct ttttgccaag tcctcacgat ttctgactaa gatagcagtg 420 gtacttacgg atggcaaatc ccaagatgac gtcaaggatg cagctcaagc agcaagagat 480 agtaagataa cattatttgc tattggtgtt ggttcagaaa cagaagatgc cgaacttaga 540 gctattgcca acaagccttc gtctacttat gtgttttatg tggaagacta tattgcaata 600 tccaaaataa gggaagtgat gaagcagaaa ctttgtgaag aatctgtctg tccaacacga 660 attccagtgg cagctcgtga tgaaagggga tttgatattc ttttaggttt agatgtaaat 720 aaaaaggtta agaaaagaat acagctttca ccaaaaaaga taaaaggata tgaagtaaca 780 tcaaaagttg atttatcaga actcacaagc aatgttttcc cagaaggtct tcctccatca 840 tatgtatttg tgtctactca aagatttaaa gtcaagaaaa tttgggattt atggagaata 900 ttaactattg atggaaggcc acaaatagca gttaccttaa atggtgtgga caaaatctta 960 ttatttacaa caaccagcgt aattaatggc tcacaagtgg ttacctttgc taaccctcaa 1020 gttaagacgt tgtttgatga aggctggcac caaattcgtc tcttagtaac agaacaagat 1080 gtgactttgt atattgatga ccaacaaatt gaaaacaagc ccttacatcc agttttaggg 1140 atcttgatca atgggcaaac ccaaattgga aaatattctg gaaaagaaga aactgttcag 1200 tttgatgtcc aaaagttgcg aatctactgt gacccagaac agaacaaccg ggagacagca 1260 tgtgagattc ctggatttaa tggagagtgc cttaatggtc ccagtgatgt aggttcaact 1320 ccagctccct gtatttgtcc tccgggaaaa ccaggacttc aaggccccaa aggtgaccct 1380 ggactgcctg ggaaccctgg ctaccctgga caacctggtc aagatggtaa gcctggatat 1440 cagggaattg cagggacacc aggtgttcca ggatctccag gaatacaagg agctcgagga 1500 ctaccaggtt acaaaggaga accagggcga gatggtgaca agggtgatcg tggacttcct 1560 ggttttcctg ggcttcatgg catgccagga tcaaagggtg aaatgggtgc caaaggagac 1620 aaaggatcac ctggatttta tggcaaaaag ggtgcaaaag gtgaaaaggg gaatgctggc 1680 ttccctggcc tccctggacc tgctggagaa ccaggaagac atggaaagga tggattaatg 1740 ggtagtcccg gtttcaaggg agaagcagga tcccctggtg ctccggggca ggatggaaca 1800 cggggagagc ctggaatccc aggatttcct ggaaaccgag gattaatggg ccaaaaggga 1860 gaaattgggc ctccaggaca gcaaggaaaa aaaggagccc cagggatgcc tggtttaatg 1920 ggaagcaatg gctcaccagg ccagcctgga acaccgggat ctaagggaag caaaggtgaa 1980 cctggaattc aagggatgcc tggggcttct gggctcaagg gagaaccagg agcaacgggt 2040 tccccaggag aaccaggata catgggttta cccgggattc aaggaaaaaa gggggacaaa 2100 ggaaatcaag gtgaaaaagg tattcagggt caaaagggag aaaatggaag acagggaatt 2160 ccagggcaac agggaattca aggccatcat ggtgcaaaag gagagagagg tgaaaaggga 2220 gaacctggtg tccgaggtgc cattggatca aaaggagaat ctggggtgga tggcttgatg 2280 gggcccgcag gtcctaaggg gcaacctggg gatccaggtc ctcagggacc cccaggtttg 2340 gatgggaagc ccggaagaga gttttcagaa caatttattc gacaagtttg cacagatgta 2400 ataagagccc agctaccagt cttacttcag agtggaagaa ttagaaattg tgatcattgc 2460 ctgtcccaac atggctcccc gggtattcct gggccacctg gtccgatagg cccagagggt 2520 cccagaggat tacctggttt gccaggaaga gatggtgttc ctggattagt gggtgtccct 2580 ggacgtccag gtgtcagagg attaaaaggc ctaccaggaa gaaatgggga aaaagggagc 2640 caagggtttg ggtatcctgg agaacaaggt cctcctggtc ccccaggtcc agagggccct 2700 cctggaataa gcaaagaagg tcctccagga gacccaggtc tccctggcaa agatggagac 2760 catggaaaac ctggaatcca agggcaacca ggccccccag gcatctgcga cccatcacta 2820 tgttttagtg taattgccag aagagatccg ttcagaaaag gaccaaacta ttag 2874 <210> 8 <211> 1368 <212> DNA <213> homo sapiens <400> 8 atgggggcct gcctgggagc ctgctccctg ctcagctgcg cgtcctgcct ctgcggctct 60 gccccctgca tcctgtgcag ctgctgcccc gccagccgca actccaccgt gagccgcctc 120 atcttcacgt tcttcctctt cctgggggtg ctggtgtcca tcattatgct gagcccgggc 180 gtggagagtc agctctacaa gctgccctgg gtgtgtgagg agggggccgg gatccccacc 240 gtcctgcagg gccacatcga ctgtggctcc ctgcttggct accgcgctgt ctaccgcatg 300 tgcttcgcca cggcggcctt cttcttcttt ttcaccctgc tcatgctctg cgtgagcagc 360 agccgggacc cccgggctgc catccagaat gggttttggt tctttaagtt cctgatcctg 420 gtgggcctca ccgtgggtgc cttctacatt cctgacggct ccttcaccaa catctggttc 480 tacttcggcg tcgtgggctc cttcctcttc atcctcatcc agctggtgct gctcatcgac 540 tttgcgcact cctggaacca gcggtggctg ggcaaggccg aggagtgcga ttcccgtgcc 600 tggtacgcag gcctcttctt cttcactctc ctcttctact tgctgtcgat cgcggccgtg 660 gcgctgatgt tcatgtacta cactgagccc agcggctgcc acgagggcaa ggtcttcatc 720 agcctcaacc tcaccttctg tgtctgcgtg tccatcgctg ctgtcctgcc caaggtccag 780 gacgcccagc ccaactcggg tctgctgcag gcctcggtca tcaccctcta caccatgttt 840 gtcacctggt cagccctatc cagtatccct gaacagaaat gcaaccccca tttgccaacc 900 cagctgggca acgagacagt tgtggcaggc cccgagggct atgagaccca gtggtgggat 960 gccccgagca ttgtgggcct catcatcttc ctcctgtgca ccctcttcat cagtctgcgc 1020 tcctcagacc accggcaggt gaacagcctg atgcagaccg aggagtgccc acctatgcta 1080 gacgccacac agcagcagca gcaggtggca gcctgtgagg gccgggcctt tgacaacgag 1140 caggacggcg tcacctacag ctactccttc ttccacttct gcctggtgct ggcctcactg 1200 cacgtcatga tgacgctcac caactggtac aagcccggtg agacccggaa gatgatcagc 1260 acgtggaccg ccgtgtgggt gaagatctgt gccagctggg cagggctgct cctctacctg 1320 tggaccctgg tagccccact cctcctgcgc aaccgcgact tcagctga 1368 <210> 9 <211> 3495 <212> DNA <213> homo sapiens <400> 9 atgcccacca tgcggaggac cgtgtcggag atccgctcgc gcgccgaagg ttatgagaag 60 acagatgatg tttcagagaa gacctcactg gctgaccagg aggaagtaag gactattttc 120 atcaaccagc cccagctgac aaaattctgc aataaccatg tcagcactgc aaaatacaac 180 ataatcacat tccttccaag atttctctac tctcagttca gaagagctgc taattcattt 240 tttctcttta ttgcactgct gcagcaaata cctgatgtgt caccaacagg tcgttataca 300 acactggttc ctctcttatt tattttagct gtggcagcta tcaaagagat aatagaagat 360 attaaacgac ataaagctga taatgcagtg aacaagaaac aaacgcaagt tttgagaaat 420 ggtgcttggg aaattgtcca ctgggaaaag gtggcagtag gggagatagt gaaagtgacc 480 aatggggaac atctcccagc agatctcatc agtctgtcct caagtgagcc ccaagccatg 540 tgctacattg aaacatccaa cttagatggt gaaacaaact tgaaaattag acagggctta 600 ccagcaacat cagatatcaa agacgttgac agtttgatga ggatttctgg cagaattgag 660 tgtgaaagtc caaacagaca tctctacgat tttgttggaa acataaggct tgatggacat 720 ggcaccgttc cactgggagc agatcagatt cttcttcgag gagctcagtt gagaaataca 780 cagtgggttc atggaatagt tgtctacact ggacatgaca ccaagctgat gcagaattca 840 acaagtccac cacttaagct ctcaaatgtg gaacggatta caaatgtaca aattttgatt 900 ttattttgta tcttaattgc catgtctctt gtctgttctg tgggctcagc catttggaat 960 cgaaggcatt ctggaaaaga ctggtatctc aatctaaact atggtggcgc tagtaatttt 1020 ggactgaatt tcttgacctt catcatcctt ttcaacaatc tcattcctat cagcttattg 1080 gttacattag aagttgtgaa atttacccag gcatacttca taaattggga tcttgacatg 1140 cactatgaac ccacagacac tgctgctatg gctcgaacat ctaatctgaa tgaggaactt 1200 ggccaggtta aatacatatt ttctgacaaa actggtactc tgacatgcaa tgtaatgcag 1260 tttaagaagt gcaccatagc gggagttgct tatggccatg tccctgaacc tgaggattat 1320 ggctgctctc ctgatgaatg gcagaactca cagtttggag atgaaaaaac atttagtgat 1380 tcatcattgc tggaaaatct ccaaaataat catccaactg cacctataat atgtgaattt 1440 cttacaatga tggcagtctg tcacacagca gtgccagagc gagaaggtga caagattatt 1500 tatcaagcag catctccaga tgagggagca ttggtcagag cagccaagca attgaatttt 1560 gttttcactg gaagaacacc cgactcggtg attatagatt cactggggca ggaagaaaga 1620 tatgaattgc tcaatgtctt ggagtttacc agtgctagga aaagaatgtc agtgattgtt 1680 cgcactccat ctggaaagtt acgactctac tgcaaaggag ctgacactgt aatttatgat 1740 cgactggcag agacgtcaaa atacaaagaa attaccctaa aacatttaga gcagtttgct 1800 acagaagggt taagaacttt atgttttgct gtggctgaga tttcagagag cgactttcag 1860 gagtggcgag cagtctatca gcgagcatct acatctgtgc agaacaggct actcaaactc 1920 gaagagagtt atgagttgat tgaaaagaat cttcagctac ttggagcaac agccattgag 1980 gataaattac aagatcaagt gcctgaaacc atagaaacgc taatgaaagc agacatcaaa 2040 atctggatcc ttacagggga caagcaagaa actgccatta acatcggaca ctcctgcaaa 2100 ctgttgaaga agaacatggg aatgattgtt ataaatgaag gctctcttga tggaacaagg 2160 gaaactctca gtcgtcactg tactaccctt ggtgatgctc tccggaaaga gaatgatttt 2220 gctcttataa ttgatgggaa aaccctcaaa tatgccttaa cctttggagt acgacagtat 2280 ttcctggact tagctttgtc atgcaaagct gtcatttgct gtcgggtttc tcctcttcaa 2340 aaatctgaag ttgttgagat ggttaagaaa caagtcaaag tcgtaacgct tgcaatcggt 2400 gatggagcaa atgatgtcag catgatacag acagcgcacg ttggtgttgg tatcagtggc 2460 aatgaaggcc tgcaggcagc taattcctct gactactcca tagctcagtt caaatatttg 2520 aagaatttac tgatgattca tggtgcctgg aactataaca gagtctccaa gtgcatctta 2580 tactgcttct acaagaatat agtgctctat attatcgaga tctggtttgc ctttgttaat 2640 ggcttttctg gacagatcct ctttgaaaga tggtgtatag gtctctataa cgtgatgttt 2700 acagcaatgc ctcctttaac tcttggaata tttgagagat catgcagaaa agagaacatg 2760 ttgaagtacc ctgaattata caaaacatct cagaatgccc tggacttcaa caccaaggtt 2820 ttctgggttc attgtttaaa tggcctcttc cactcagtta ttctgttttg gtttccacta 2880 aaagcccttc agtatggtac tgcatttgga aatgggaaaa cctcggatta tctgctactg 2940 ggaaactttg tgtacacttt tgtggtgata actgtgtgtt tgaaagctgg attggagaca 3000 tcatattgga catggttcag ccacatagcg atatggggga gcatcgcact ctgggtggtg 3060 ttttttggaa tctactcatc tctgtggcct gccattccga tggcccctga tatgtcagga 3120 gaggcagcca tgttgttcag ttctggagtc ttttggatgg gcttgttatt catccctgtg 3180 gcatctctgc tccttgatgt ggtgtacaag gttatcaaga ggactgcttt taaaacattg 3240 gtcgatgaag ttcaggagct ggaggcaaaa tctcaagacc caggagcagt tgtacttgga 3300 aaaagcctga ccgagagggc gcaactgctc aagaacgtct ttaagaagaa ccacgtgaac 3360 ttgtaccgct ctgaatcctt gcaacaaaat ctgctccatg ggtatgcgtt ctctcaagat 3420 gaaaatggaa tcgtttcaca gtctgaagtg ataagagcat atgataccac gaaacagagg 3480 cccgacgaat ggtga 3495 <210> 10 <211> 555 <212> DNA <213> homo sapiens <400> 10 atggggaatg ggatgaacaa gatcctgccc ggcctgtaca tcggcaactt caaagatgcc 60 agagacgcgg aacaattgag caagaacaag gtgacacata ttctgtctgt ccacgatagt 120 gccaggccta tgttggaggg agttaaatac ctgtgcatcc cagcagcgga ttcaccatct 180 caaaacctga caagacattt caaagaaagt attaaattca ttcacgagtg ccggctccgc 240 ggtgagagct gccttgtaca ctgcctggcc ggggtctcca ggagcgtgac actggtgatc 300 gcatacatca tgaccgtcac tgactttggc tgggaggatg ccctgcacac cgtgcgtgct 360 gggagatcct gtgccaaccc caacgtgggc ttccagagac agctccagga gtttgagaag 420 catgaggtcc atcagtatcg gcagtggctg aaggaagaat atggagagag ccctttgcag 480 gatgcagaag aagccaaaaa cattctggcc gctccgggaa ttctgaagtt ctgggccttt 540 ctcagaagac tgtaa 555 <210> 11 <211> 3507 <212> DNA <213> homo sapiens <400> 11 atgggaaaag ttggcgccgg cggcggctcc caagcccggc tgagcgcgct cctcgccggc 60 gcggggctct tgatcctctg cgccccgggc gtctgcggcg gcggctcctg ctgcccctcg 120 ccgcacccca gctccgctcc acgctcggcc tcgaccccta ggggcttttc ccaccagggg 180 cggccaggca gggctcctgc cacgcccctg cccctcgtag tgcgtcccct gttctcagtg 240 gcccccgggg accgagcgct atccctggag cgggctcggg gcactggggc atccatggcg 300 gttgctgcac gctccggccg gaggagacgg agcggagcgg atcaggagaa ggcagaacgg 360 ggagagggcg cgagtcggag cccccgggga gtgctaagag atggagggca gcaggagcct 420 gggactcggg agcgggaccc ggacaaagcc acccgcttcc ggatggagga gctgagactg 480 accagcacca cgtttgcgct gacgggagac tcagcacaca accaagccat ggtccactgg 540 tctggccaca acagcagcgt gattctcatt ttgacaaagc tctatgacta taacctgggg 600 agcatcacag agagctcgct ttggaggtca accgattatg gaacaaccta tgagaagctg 660 aatgataaag ttggtttgaa aaccattttg agctatctct atgtgtgtcc taccaacaag 720 cgtaagataa tgttactcac agacccggag attgagagca gtttattgat cagctcagat 780 gaaggggcaa cttatcaaaa gtaccggctg aacttctaca ttcaaagctt gctttttcac 840 cccaaacaag aagactggat tctggcatac agtcaagacc aaaagttata cagctctgct 900 gaatttggga gaagatggca gcttatccaa gaaggggttg taccaaacag gttctactgg 960 tctgtgatgg ggtcaaataa agaaccagac cttgtgcatc ttgaggccag aactgtggat 1020 ggtcattcac attatctaac ttgccgaatg cagaactgta cagaggccaa caggaatcag 1080 ccttttccag gctacattga cccagactct ttgattgttc aggatcatta tgtgtttgtt 1140 cagctgacat caggagggcg gccacattac tacgtgtcct accgaaggaa tgcatttgcc 1200 caaatgaagc ttccgaaata tgctttgccc aaggacatgc atgttatcag caccgatgag 1260 aatcaggtgt tcgcagcggt ccaagaatgg aaccagaatg acacgtacaa cctctacatc 1320 tcagacacac gtggtgtcta cttcaccctg gccttggaga atgtccagag cagcagaggc 1380 cctgagggca acatcatgat cgacctctat gaggtagcag ggataaaggg aatgttcttg 1440 gctaacaaga agattgacaa ccaagtgaag actttcatca catataacaa aggcagagac 1500 tggcgtttgc tgcaggcgcc ggacacggat ctaagggggg accccgtgca ctgcttgctg 1560 ccctattgct cactacacct tcacctgaag gtctctgaga atccctacac atcagggatc 1620 attgccagca aagacacagc tccaagcatc atagtggcat caggtaatat aggttctgaa 1680 ttgtcagaca ctgacatcag catgtttgtc tcttcagatg cagggaacac ctggagacag 1740 atctttgaag aagagcacag tgttttgtac ctggatcaag gtggagtcct ggttgctatg 1800 aaacacacat ctctcccaat tcgacatctt tggttgagtt ttgatgaagg gagatcttgg 1860 agcaaataca gtttcacatc tattccactt tttgtggatg gggttctggg tgagcctgga 1920 gaagagactc tcatcatgac agtgtttgga cacttcagcc accgctctga atggcagctg 1980 gtcaaagtag attacaagtc catttttgat agacggtgtg ccgaagagga ctacagacct 2040 tggcagctgc acagccaggg ggaagcatgt atcatgggag caaaaaggat atataagaag 2100 cgaaaatcag agcggaagtg tatgcaagga aaatatgcag gagctatgga atctgaaccc 2160 tgtgtctgca ctgaggctga ttttgattgc gactatggtt atgagcgaca cagcaatggc 2220 cagtgcctgc cggcattttg gttcaatcca tcctctctgt caaaggattg cagcttggga 2280 cagagttacc tcaatagtac tgggtacagg aaggtggttt ccaataattg cactgatggc 2340 gtaagggaac agtacactgc caaaccgcag aagtgcccag ggaaagcccc gcgggggctg 2400 cggatagtca cggctgatgg aaagctgaca gcggaacaag gacacaacgt cactctcatg 2460 gtgcaattag aagagggtga tgttcagcgg acactcatcc aagtggactt tggcgatggt 2520 atcgcggtgt cttacgtcaa tctcagctcc atggaagatg ggatcaaaca cgtctatcag 2580 aacgtgggca ttttccgtgt gaccgtgcag gtggacaaca gtctgggttc tgacagcgcc 2640 gtcctgtact tacatgtaac ttgtcccttg gagcacgtgc acctgtctct tccctttgtc 2700 accacaaaga acaaagaggt caatgcgacg gcagtgctgt ggcccagcca agtgggcacc 2760 ctcacttacg tgtggtggta cggaaacaac acggagcctt tgatcacctt ggagggaagc 2820 atatccttca gatttacttc agaaggaatg aataccatca cagtgcaggt ctcagctggg 2880 aatgccatcc tacaagacac aaagaccatc gcagtatatg aggaattccg gtctcttcgc 2940 ttgtcctttt ctccaaacct ggatgactac aacccggaca tccctgagtg gaggagggac 3000 atcggtcgag tcatcaaaaa atccctggtg gaagccacag gggttccagg ccagcacatc 3060 ctggtggcgg tgctccctgg cttacccacc actgctgaac tctttgtcct accctatcag 3120 gatccagctg gagaaaacaa aaggtcaact gatgacctgg agcagatatc agaattgctg 3180 atccacacgc tcaaccaaaa ctcagtacac ttcgagctga agccaggagt ccgagtcctt 3240 gtccatgctg ctcacttaac agcggccccc ctggtggacc tcactccaac ccacagtgga 3300 tctgccatgc tgatgctgct ctcagtggtg tttgtggggc tggcagtgtt cgtcatctac 3360 aagtttaaaa ggagagtagc tttaccctcc cctccctccc cttctactca acctggtgac 3420 tcatctctcc gattgcaaag agcaagacac gccactccgc cttcaacgcc aaagcgggga 3480 tctgctgggg cacagtatgc aatttaa 3507 <210> 12 <211> 1197 <212> DNA <213> homo sapiens <400> 12 atggaaaacg agacagtcag tgaactgaac caaacacagc ttcagccacg agcagtggtg 60 gccttagaat accaggtggt caccatctta cttgtactca ttatttgtgg cctgggcatt 120 gtaggcaaca tcatggtagt cctggttgtc atgagaacca agcacatgag gacccccaca 180 aactgctacc tggtgagcct ggcagtagct gatctcatgg tcttggtggc cgcaggcctc 240 cccaacataa cagacagtat ctacggttcc tgggtctatg gctatgttgg atgcctctgc 300 attacttacc tccagtattt gggaattaat gcatcctctt gttcaataac agcctttacc 360 attgagaggt acatagcaat ctgtcacccc atcaaagccc agtttctctg cacattttcc 420 agagccaaaa agattatcat ctttgtctgg gctttcacat ctctttactg tatgctctgg 480 ttcttcttgc tggatctcaa tattagcacc tacaaagatg ctattgtgat atcctgtggc 540 tacaagatct ccaggaatta ctactcacct atttacctaa tggactttgg tgtcttttat 600 gttgtgccaa tgatcctggc taccgtcctc tatggattca tagctagaat ccttttctta 660 aatcccattc cttcagatcc taaagaaaac tctaagacat ggaaaaatga ttcaacccat 720 cagaacacaa atctgaatgt aaatacctct aatagatgtt tcaacagcac agtatcttca 780 aggaagcagg tcaccaagat gctggcagtg gttgtaattc tgtttgccct tttatggatg 840 ccctacagga ctctagtggt tgtcaactca tttctctcca gtcctttcca agaaaattgg 900 tttttgctct tttgcagaat ttgcatttat ctcaacagtg ccatcaaccc ggtgatttac 960 aatctcatgt cccagaaatt ccgtgcagcc ttcagaaagc tctgcaactg caagcagaag 1020 ccaacagaga aacctgctaa ctacagtgtg gccctaaatt acagcgtcat caaggagtca 1080 gaccatttca gcacagagct tgatgatatc actgtcactg acacttacct gtctgccaca 1140 aaagtgtctt ttgatgacac ctgcttggct tctgaggtat cctttagcca aagttga 1197 <210> 13 <211> 1656 <212> DNA <213> homo sapiens <400> 13 atgatcagcc cagaccccag gccctcccct ggcttggccc ggtgggctga gagctatgag 60 gccaagtgtg agcgcaggca agagatccgt gaaagccgcc gctgccgtcc caatgtgacc 120 acttgccgcc aggtggggaa gacgctgagg atccaacaga gagagcagct ccagagagct 180 cgactgcagc agttcttcag gaggaggaac ctggagctag aggagaaggg caaagcgcag 240 catccccagg ccagggagca agggccctcc aggcggccag gacaggtgac tgtcctcaag 300 gaacccttgt cttgtgccag aaggatttct tctcccagag agcaggtgac aggcaccagc 360 tctgaagtct ttccagccca gcatcctcct ccctcaggca tctgcaggga tctgtctgac 420 cacctctcct cacaggctgg gggccttcct ccacaggaca ctcccatcaa gaagccaccc 480 aaacaccacc gtggtactca gacaaaggca gaaggaccaa caattaagaa cgatgccagt 540 cagcaaacca attacggagt tgcagttctg gataaggaaa tcatccagct ttctgattac 600 ctcaaagagg ccctacaaag ggagctggtc ctaaaacaga aaatggtgat tctccaagac 660 ctactgtcca ctctgattca ggcctctgac agctcttgga agggacagct taatgaagac 720 aaactgaagg ggaaactgag atccttagaa aaccagctat acacctgtac ccagaaatac 780 tccccttggg gaatgaaaaa agtactactg gagatggaag accagaaaaa cagctatgag 840 cagaaggcca aggagtcact gcagaaagtg ctggaggaga aaatgaatgc agagcagcaa 900 ctacagagca cacagcgatc cctggccctg gcagagcaga agtgtgaaga gtggaggagc 960 cagtatgagg ctctgaagga ggactggagg acccttggga cccagcacag ggagctggag 1020 agccaactcc acgtgcttca gtccaaactg cagggagcag atagcaggga cttacagatg 1080 aaccaggccc tgcgattttt ggaaaatgag caccagcaac tgcaggccaa gattgaatgc 1140 ctgcaagggg acagagacct gtgcagcttg gatacccagg acctacaaga tcaactaaaa 1200 aggtcagagg cagagaaact caccctggtg accagagtac agcagttgca gggtttgctt 1260 caaaatcaat ccttacagct tcaagaacag gagaaactct taacaaagaa agatcaggct 1320 ttgcccgtgt ggagtccaaa gtccttccct aacgaagtgg agcctgaggg tacagggaag 1380 gagaaagact gggatctcag agaccagctg caaaagaaga ctttgcagct ccaggccaag 1440 gaaaaggagt gcagagaact gcattcagaa ttagacaacc tcagtgacga gtatctctcc 1500 tgcctgcgta agctgcagca ctgtcgagaa gagctgaacc agagccagca gctgcctccc 1560 agaaggcaat gtgggcgatg gctcccagtg ctgatggtgg tgattgctgc agcactggca 1620 gtgttcctgg ccaataaaga caacctgatg atctga 1656 <210> 14 <211> 4050 <212> DNA <213> homo sapiens <400> 14 atggcttgtt acctggtcat cagttcgaga catctcagca atgggcacta ccggggcatt 60 aaaggagtct tcaggggacc cctgtgcaag aacggatctc cctctccgga ttttgcagaa 120 aagaagtcca cagcaaaggc cctggaagat gtaaaggcaa acttttactg tgaattatgt 180 gacaagcagt atcacaaaca ccaggagttt gacaatcata ttaattctta tgaccatgct 240 cataagcaga gactgaaaga attaaagcaa cgggaatttg ctcgaaatgt agcttctaag 300 tcatggaaag atgagaaaaa acaagaaaaa gcacttaaac gacttcatca gctggctgag 360 ttaaggcagc aatctgaatg tgtttctgga aatggaccag catacaaagc ccccagggta 420 gccatagaaa agcaactcca gcaaggaatt ttccccatta agaatggcag aaaggtatca 480 tgcatgaaga gtgctcttct ccttaaagga aaaaatctcc ccagaatcat atccgataaa 540 cagcggtcca ccatgccaaa tcgacaccaa ttacaatcag acaggcgttg tttgtttgga 600 aatcaggtac tgcaaacatc ttcagatctc agcaatgcaa atcacagaac aggagtatca 660 tttacttttt ccaaaaaagt gcacctaaaa ttagaatctt cagcatcagt tttcagtgag 720 aacacagaag aaacccatga ttgtaacaag tcacccattt ataaaacaaa acaaactgca 780 gataagtgca agtgctgcag gtttgcaaat aaagatacac accttaccaa ggaaaaagag 840 gtaaatatct caccaagcca tctggaaagt gttttacaca ataccatctc cataaactct 900 aaaattttgc aagacaaaca cgactctatt gatgagacac tagaagattc aattggcatt 960 catgcttcat tctctaaatc taacattcat ctttcagatg tagattttac tcctaccagc 1020 agagaaaaag aaactagaaa tacattgaag aacactttag aaaattgtgt taatcaccca 1080 tgccaagcaa atgcttcctt cagcccacca aacatttaca accatagtga tgccaggata 1140 tctgaatgcc tggatgagtt ttcatcactg gagccaagtg aacaaaagag tacagtgcat 1200 ctgaatccaa attccagaat agagaacaga gaaaaatctt tagataaaac agaaagagtt 1260 agcaaaaatg ttcaaagact tgtaaaagaa gcatgtaccc ataatgtggc atctaaacca 1320 ctaccttttc tccacgttca aagcaaggat ggccacacca ctcttcaatg gcctacggaa 1380 cttctgctct ttacaaaaac agaaccctgt atctcttatg gctgcaaccc actgtatttt 1440 gattttaagc tttctcggaa cacaaaggaa gaccacaatc tagaggactt aaaaacagaa 1500 ttgggtaaga agcccttgga attgaagact aaaagagaga gccaagtctc aggtttaact 1560 gaagaccaac aaaaattgat ccaagaagat tatcaatatc cgaaaccaaa gacgatgata 1620 gctaatccgg attgggaaaa attccagagg aaatataatt tggactacag tgattctgag 1680 ccaaataaga gtgaatatac tttcagtgca aatgatttgg aaatgaaaaa tcctaaagtg 1740 cctctttacc tcaacacatc tctaaaggat tgtgctggaa agaataatag tagtgagaac 1800 aaacttaagg aagcttcaag ggcccattgg caaggctgca gaaaggcagt tctaaatgat 1860 atagatgagg acctatcttt tccttcctac atctctaggt ttaaaaagca taaattgatt 1920 ccctgcagtc ctcatttgga atttgaagat gaaagacaat tcaactgcaa gtccagtcct 1980 tgtacagtag ggggtcacag tgaccatggg aaagacttca gtgtaatttt gaagagtaac 2040 cacatcagca tgaccagcaa ggtttccgga tgtggaaacc aaagatacaa gagatactct 2100 ccacagtcat gtttgagtag atattcttcc tctttggaca catcccctag cagcatgtct 2160 agcttgagaa gtacttgttc aagtcataga ttcaatggta atagcagagg taatttgctc 2220 tgcttccata aaagagaaca ccactcagtt gaaaggcaca aacggaaatg tctaaagcac 2280 aactgcttct acttgtctga tgatataaca aagagcagcc aaatgcagtc tgaaccacag 2340 aaagagagga actgcaaatt gtgggaatca tttaaaaatg aaaaatactc aaaacgtaga 2400 tattgtcact gcagagaaag acaaaaactg ggcaaaaatc aacaacaatt ttcagggcta 2460 aaatctacga gaatcatcta ttgtgattct aactcacaga tttcctgtac tggaagcagt 2520 aaaaaaccac ctaattgcca gggaactcag cacgacagat tggactctta ctcaatagag 2580 aaaatgtatt acttgaataa aagcaagaga aatcaagagt ctttgggcag ccctcacatt 2640 tgtgatctgg gaaaagtcag gcccatgaag tgtaactccg ggaatatcag ctgccttcta 2700 aagaactgtt ccagtggccc ttcagaaacc acagaatcaa acactgcaga aggagagagg 2760 acccctctaa cagcaaaaat ccttttagaa agagtacaag ccaagaaatg tcaagaacaa 2820 tcaagtaatg ttgagatctc ttcaaacagt tgtaaaagtg aattagaggc tccttcgcaa 2880 gtcccatgca caattcaact tgcaccatca ggctgtaaca gacaagcatt gcctttgtct 2940 gaaaaaatac agtatgcaag tgagagcaga aatgatcaag acagtgcaat tccaaggact 3000 acggagaaag acaaaagcaa aagttcacac acaaataatt ttacaatttt agcagacact 3060 gattgtgata accatctttc taaaggtata attcacctag taacagagtc tcagtcacta 3120 aacataaaaa gggatgcaac aacaaaagaa caatcaaaac ctttaattag tgaaatccaa 3180 ccttttattc aaagctgtga cccagtacca aatgaattcc ctggtgcttt tccgtctaat 3240 aaatatactg gtgtgactga ttcaacagag acccaagaag accaaataaa tctagactta 3300 caggatgtaa gcatgcatat aaatcatgta gagggaaata taaactctta ctatgacaga 3360 actatgcaga aacctgacaa agtcgaagac ggattagaaa tgtgtcataa atctatctct 3420 ccccctttaa ttcaacagcc cataacattt tctcctgacg aaatagataa atataagatc 3480 ctacagctac aagcccagca gcatatgcag aagcaactcc tatcaaagca tcttcgagtt 3540 ttgcctgctg cagggcctac tgccttctct ccggcctcaa ccgtacagac agttccagtt 3600 caccagcaca cttctatcac caccatccac cacacgttcc tgcagcattt tgctgtttct 3660 gcttccttaa gttctcatag cagtcacctc cctattgctc atctacatcc tctttcacag 3720 gcacatttca gtcctatttc attttcgact ctgactccaa ccattatccc tgcacacccc 3780 actttcttag caggtcatcc cctgcattta gtagctgcta cccccttcca cccatctcac 3840 ataacacttc agcctctgcc ccctacagca tttattccta cattgtttgg tcctcactta 3900 aatccagcca caacttctat catccacttg aatcctttaa tccaaccagt attccaaggt 3960 caagattttt gccatcattc ttgctctagc cagatgcaac agctaaatga agtgaaagag 4020 gccttaaatg tgtccacaca cttgaactaa 4050 <210> 15 <211> 1866 <212> DNA <213> homo sapiens <400> 15 atggagcata tccggacgac caaggtcgaa caagtaaaat tacttgaccg attcagtacc 60 agcaacaagt cattaacagg aacactgtat cttacggcta cacatctatt atttatcgac 120 tctcatcaaa aagaaacctg gatattacac caccatattg cctcagtaga gaaacttgct 180 ttgactactt ctggatgccc ccttgtgata cagtgcaaga acttcagaac tgtgcatttc 240 attgttccca gagaaagaga ttgccatgat atttacaact ctttgctaca actgtcaaaa 300 caagcaaaat atgaagatct ctatgcattt tcttataatc ccaaacaaaa tgattcagaa 360 cgactacaag gctggcagct cattgatctc gctgaggaat ataagaggat gggagtgcca 420 aactcacact ggcagttgtc tgatgccaac cgggactaca agatttgtga aacttacccc 480 agagaacttt atgttccccg gatagcaagc aaaccaataa ttgttggtag ttccaagttc 540 cggagcaagg gaagattccc agttctttcc tactatcatc aagataagga ggctgccatt 600 tgtcgatgta gtcagccact ctctggattc agtgccaggt gcctggagga tgaacatttg 660 cttcaagcca ttagtaaagc caatccagtc aatcgctata tgtacgtcat ggataccagg 720 ccaaaactga atgcaatggc caacagagca gctggaaaag gttatgaaaa tgaagacaac 780 tattccaata ttagatttca gtttgttgga attgaaaata ttcatgtcat gaggtccagc 840 cttcagaaat tattggaagt caatggcact aaagggcttt ctgtcaatga tttctactcc 900 ggtttggaga gctcgggatg gcttcgccat atcaaagctg ttatggatgc tgcaatcttc 960 ttggccaaag caataacagt tgaaaatgca agtgtgttgg tgcattgttc cgatggttgg 1020 gataggactt cccaggtttg ttccctgggt tctcttttat tggattccta ctacaggaca 1080 atcaaaggat tcatggtttt aatagaaaag gattggatct cttttggaca taaattttca 1140 gagaggtgtg gccagttgga tggtgaccca aaggaagtct caccagtgtt tactcagttc 1200 ttggaatgtg tgtggcattt gaccgaacag tttccacaag cctttgaatt cagtgaagca 1260 tttcttcttc agatccatga gcatattcat tcatgccagt ttggaaactt ccttggaaat 1320 tgtcagaagg aaagagaaga gctcaagttg aaggagaaga cttattccct gtggccattt 1380 cttttggaag accaaaagaa gtacttaaat cctctctaca gttccgaatc tcacagattt 1440 acagttttgg agccaaatac agtatctttc aattttaagt tttggaggaa catgtaccat 1500 caatttgatc gaacactgca tcctaggcag tctgtattta atataattat gaatatgaat 1560 gagcaaaata aacaattaga gaaagatatt aaagacctag aatctaaaat taaacaacgc 1620 aaaaataagc aaacagatgg catcctcacc aaggaattgt tacattcagt tcatcctgaa 1680 tcacctaacc tcaaaacttc cctgtgtttt aaagagcaga ctctgctacc cgtaaatgat 1740 gctcttcgaa ctatagaggg cagcagcccg gcagataatc gttatagtga atatgcagaa 1800 gagttttcta aatcagaacc tgctgtggtc agcttagagt atggtgtggc aagaatgact 1860 tgttag 1866 <210> 16 <211> 1236 <212> DNA <213> homo sapiens <400> 16 atgtggagcg gatggtggct gtggcccctt gtggccgtct gcactgcaga cttctttcgg 60 gacgaggcag agaggatcat gagggactcc cctgtcattg atgggcacaa tgacctcccc 120 tggcagctgc tggatatgtt caacaaccgg ctgcaggacg agagggccaa cctgaccacc 180 ttggccggca cacacaccaa catccccaag ctgagggccg gctttgtggg aggccagttc 240 tggtccgtgt acacgccctg cgacacccag aacaaagacg ccgtgcggag gacgctggag 300 cagatggacg tggtccaccg catgtgccgg atgtacccgg agaccttcct gtatgtcacc 360 agcagtgcag gcattcggca ggccttccgg gaagggaagg tggccagcct gatcggcgtg 420 gagggcggcc actccattga cagcagtttg ggcgtcctgc gggcactcta tcagctgggc 480 atgcggtacc tgaccctcac ccacagctgc aacacgccct gggctgacaa ctggctggtg 540 gacacgggag acagcgagcc ccagagccaa ggcttgtcac cctttgggca gcgtgtggtg 600 aaggagctga accgtctggg ggtcctcatc gacttggctc acgtgtctgt ggccaccatg 660 aaggccaccc tgcagctgtc cagagccccg gtcatcttca gccactcctc ggcctacagc 720 gtgtgcgcaa gccggcgcaa cgtgcctgac gacgtcctga ggctggtgaa acagacagac 780 agcctggtga tggtgaactt ctacaacaat tacatttcct gcaccaacaa ggccaacctg 840 tcccaagtgg ccgaccatct ggatcacatc aaggaggtgg caggagccag agccgtgggt 900 tttggtgggg actttgatgg tgttccaagg gtccctgagg ggctggagga cgtctccaag 960 tatccagacc tgatcgctga gctgctcagg aggaactgga cggaggcgga ggtcaagggc 1020 gcactggctg acaacctgct gagggtcttc gaggctgtgg aacaggccag caacctcaca 1080 caggctcccg aggaggagcc catcccgctg gaccagctgg gtggctcctg caggacccat 1140 tacggctact cctctggggc ttccagcctc catcgccact gggggctcct gctggcctcc 1200 ctcgctcccc tggtcctctg tctgtctctc ctgtga 1236 <210> 17 <211> 2409 <212> DNA <213> homo sapiens <400> 17 atgtaccgct ccaccaaggg cgcctccaag gcgcgccggg accagatcaa cgccgagatc 60 cggaacctca aggagctgct gccgctggcc gaagcggaca aggtccggct gtcctacctg 120 cacatcatga gcctcgcctg catctacact cgcaagggcg tcttcttcgc tggtggcact 180 cctctggcgg gccccacggg gcttctctca gctcaagagc ttgaggacat cgtagcggca 240 ctacccggct ttctgcttgt gttcacagcc gaggggaaat tgctctacct gtctgagagt 300 gtgagcgagc atctgggcca ctccatggtg gacctggttg cccagggtga cagcatctac 360 gacatcattg acccagctga ccacctcact gtgcgccagc aactcaccct gccctctgcc 420 ctggacactg atcgcctctt ccgctgccgc ttcaacacct ccaagtccct caggcgccag 480 agtgcaggca acaaactcgt gcttattcga ggccgattcc atgctcaccc acctggagcc 540 tactgggcag gaaatcccgt gttcacagct ttctgtgccc ctctggagcc gagaccccgc 600 ccaggtcctg gccctggccc tggccctgcc tcgctcttcc tggccatgtt ccagagccgc 660 catgctaaag acctggctct actggacatc tccgagagtg tcctaatcta cctgggcttt 720 gagcgcagtg aactgctttg taaatcatgg tatggactgc tgcaccccga ggacctggcc 780 cacgcttctg ctcaacacta ccgcctgttg gctgagagtg gagatattca ggcagagatg 840 gtggtgaggc tacaggccaa gactggaggc tgggcatgga tttactgcct gttatactca 900 gaaggtccag agggacccat tactgccaat aactacccaa tcagtgacat ggaagcctgg 960 agcctccgcc agcagttgaa ctctgaagac acccaggcag cttatgtcct gggcactccg 1020 accatgctgc cctcattccc tgaaaacatt ctttcccagg aagagtgctc cagcactaac 1080 ccactcttca ccgcagcact gggggctccc agaagcacca gcttccccag tgctcctgaa 1140 ctgagtgttg tctctgcatc agaagagctt ccccgaccct ccaaagaact ggacttcagt 1200 tacctgacat tcccttctgg gcctgagcct tctctccaag cagaactaag caaggatctt 1260 gtgtgcactc caccttacac gccccatcag ccaggaggct gtgccttcct cttcagcctc 1320 catgagccct tccagaccca tttgcccacc ccatccagca ctcttcaaga acagctgact 1380 ccaagcactg cgaccttctc tgatcagttg acgcccagca gtgcaacctt cccagatcca 1440 ctaactagcc cactgcaagg ccagttgact gaaacctcgg tcagaagcta tgaagaccag 1500 ttgactccct gcacctccac cttcccagac cagctgcttc ccagcacagc caccttccca 1560 gagcctctgg gcagccctgc ccatgaacag ctgactcctc ccagcacagc attccaagca 1620 cacctggaca gccccagcca aaccttccca gagcaactga gccccaaccc taccaagact 1680 tactttgccc aggagggatg cagttttctc tatgagaagt tgcccccaag tcctagcagc 1740 cctggtaatg gggactgcac gctcttggcc ctagcccagc tccggggccc cctctctgtg 1800 gatgtccccc tggtgcccga aggcctgctc acacctgagg cctctccagt caagcagagt 1860 ttcttccact actctgaaaa ggagcagaat gagatagacc gtctcatcca gcagattagc 1920 caattggctc agggcatgga cagacccttc tcagctgagg ctggcactgg cggactagag 1980 ccacttggag gactggagcc cctggactcc aacctgtccc tgtcaggggc aggcccccct 2040 gtgctcagcc tggacctgaa accctggaaa tgccaggagc tggacttcct ggctgaccct 2100 gataacatgt tcctggaaga gacgcccgtg gaagacatct tcatggatct ctctacccca 2160 gatcccagtg aggaatgggg ctcaggggat cctgaggcag agggcccagg aggggcccca 2220 tcgccttgca acaacctgtc cccagaagac cacagcttcc tggaggacct ggccacatat 2280 gaaaccgcct ttgagacagg tgtctcagca ttcccctatg atgggtttac tgatgagttg 2340 catcaactcc agagccaagt tcaagacagc ttccatgaag atggaagtgg aggggaacca 2400 acgttttga 2409 <210> 18 <211> 3597 <212> DNA <213> homo sapiens <400> 18 atggatgaag agactcggca cagccttgag tgcatccagg ccaatcagat ctttcccagg 60 aagcagctga tccgggagga tgagaatctt caggttcctt tccttgaact tcatggagag 120 agcacagagt ttgtgggccg tgccgaggat gccatcattg ccctttccaa ttacagactt 180 cacatcaagt tcaaggagtc tcttgttaat gttccattac agcttataga aagtgttgaa 240 tgccgagata tatttcagct tcatttgact tgcaaagact gcaaagttat caggtgtcag 300 ttttcaacct ttgagcagtg tcaagagtgg ctgaagagac tgaacaacgc aatccgacca 360 cctgctaaaa tagaagatct cttctcattt gcataccatg cttggtgcat ggaggtctat 420 gccagtgaaa aagagcaaca tggagacctg tgcagaccag gggagcatgt aacttcaagg 480 tttaaaaacg aggtggagag gatgggtttt gatatgaaca acgcctggag gatttccaac 540 atcaatgaga agtacaaatt atgtggtagc tatcctcaag agctcatagt gcctgcctgg 600 atcactgaca aagaactgga aagtgtatca agtttcaggt cctggaagcg catccctgcc 660 gtcatctaca ggcaccagag caatggagct gtcattgccc gctgtggaca gccagaggtt 720 agctggtggg gctggcgaaa tgcagatgat gagcatctgg tacagtcagt agccaaagct 780 tgtgcctctg actcccgatc gagtggcagc aagctgtcaa ctaggaacac ttctcgagac 840 tttcccaatg ggggagacct ttctgacgtg gagttcgatt cttctctgtc aaatgcttca 900 ggagcagaga gtttagccat ccaaccgcag aagcttttga tcttggatgc acgctcctat 960 gcagctgctg tggcaaaccg agccaaagga ggaggctgcg aatgcccaga gtattaccca 1020 aactgtgaag ttgtgtttat ggggatggca aacattcatt ctattcggag gagttttcag 1080 tctctgcggt tgctgtgcac tcagatgcca gatccgggaa attggctatc agctcttgaa 1140 agcacaaaat ggctccatca cttgtctgtg cttctgaaat cagcgcttct ggtagtgcat 1200 gctgtggatc aggatcagcg gccggtgcta gtacactgct cagatggctg ggaccgcacc 1260 ccccagattg tggcattggc taagctcttg ctggaccctt attaccgaac catagagggt 1320 ttccaggtcc tcgtggaaat ggagtggctg gattttggcc ataaatttgc tgaccggtgt 1380 ggtcatgggg agaactcgga tgatctgaat gaacgttgcc cagtgtttct gcagtggctt 1440 gactgtgttc atcagcttca gaggcaattt ccttgctctt ttgagttcaa tgaagcattc 1500 cttgtgaaac tggtgcagca tacctattcc tgcctgtttg gaacattcct gtgcaacaac 1560 gccaaggaga gaggggaaaa gcatactcag gaacggacat gttccgtgtg gtcacttctt 1620 cgggcaggca acaaggcttt caaaaaccta ctgtattcct ctcagtcaga agccgtgctg 1680 taccctgtgt gccatgtgcg taacctgatg ctgtggagtg cagtgtacct gccctgccca 1740 tccccaacca cccctgtgga cgacagctgt gcaccatacc cagccccagg caccagccct 1800 gatgatcccc ccctgagccg gctaccaaag actagatcat acgacaatct gaccacagcc 1860 tgtgacaaca cagtgcctct ggccagccgg cgctgcagcg accccagcct gaacgagaag 1920 tggcaggagc accggcgctc actagagctg agcagcctgg ctggccctgg agaggatccc 1980 ctttctgccg acagcctagg gaagcccacc agagtgccgg ggggtgccga gctttctgtt 2040 gcagccggag tagctgaggg gcagatggag aacatcttgc aggaggccac caaagaggag 2100 agtggagtag aggaacctgc ccacagggca ggcattgaga tacaggaggg taaagaggac 2160 cctctcttag aaaaggagag caggaggaag acacctgagg cctcagccat tggacttcac 2220 caagacccag aactgggtga tgctgctctg aggagccatc tggatatgag ctggcctctg 2280 ttctcacagg gcatttctga acagcagagt gggctcagtg ttctcctcag ttctctccag 2340 gtccccccca ggggagagga ttccctggag gtccctgtgg agcagtttcg aatagaagag 2400 attgcagagg gtagggagga agcagttctt ccaatcccag tagatgcaaa agttggctat 2460 ggtacctcac agtcatgttc tctgctacct tcccaagtcc cttttgagac cagaggacca 2520 aacgtggaca gttctacaga catgttagtg gaagataagg tgaagtcagt aagtgggccc 2580 caaggtcatc atagatcttg ccttgtaaat agtggcaagg acaggcttcc tcagaccatg 2640 gaacccagcc cttcagagac aagcctggtc gagaggcccc aagtggggtc tgtggtgcat 2700 aggacttccc ttggcagcac tctcagcctg acacgttccc cttgtgcctt gcctttagcc 2760 gaatgtaaag aggggcttgt gtgcaatggt gccccagaga ctgaaaacag ggcctcagag 2820 cagcccccag gtcttagcac cctccagatg taccccacac ccaatgggca ttgcgccaat 2880 ggggaggctg gtaggagcaa ggactcactg agccgtcagc tgtctgctat gagctgcagc 2940 tctgcccact tacactcaag gaacttgcac cacaagtggc tgcatagcca ctcaggaagg 3000 ccatctgcaa ccagcagccc cgaccagcct tcccgcagcc acctggacga tgatggcatg 3060 tcagtgtaca cagacacgat ccaacagcgc ctgcgtcaga ttgagtcagg ccaccagcag 3120 gaagtagaaa ctttgaagaa acaagtccag gagctgaaga gtcgcctgga gagccagtac 3180 ctgaccagct ccctacactt taatggagac tttggggatg aggtgacttc aatccccgac 3240 tcggaaagca atctggatca gaactgtttg tctcgctgca gcacagagat tttctctgaa 3300 gccagctggg agcaggtgga taaacaggac acagagatga cccgttggct tcctgaccac 3360 ctggccgccc actgctatgc gtgcgacagt gccttctggc ttgccagcag gaagcaccac 3420 tgcaggaatt gtgggaacgt attctgctcc agttgttgta accagaaggt tccagttccc 3480 agccagcagc tctttgaacc cagtcgagta tgcaagtctt gctatagcag cctacatccc 3540 acaagctcca gcattgacct tgaactggat aagcccattg ctgccacttc caactga 3597 <210> 19 <211> 3777 <212> DNA <213> homo sapiens <400> 19 atggcctcgg cctgcggggc gccgggcccg gggggcgccc tgggcagcca ggccccctcc 60 tggtaccacc gcgacctgag ccgggcggcc gcggaggagc tgctggcccg ggcgggccgc 120 gatggcagct tcctggtccg agacagcgag agcgtggcgg gggccttcgc gctctgcgtc 180 ctgtatcaga agcatgtgca cacgtatcgc attctgcctg atggagaaga tttcttggct 240 gtgcagacct cgcagggtgt gcctgtgcgc cgcttccaga ccctgggtga gctcatcggc 300 ctgtacgccc agcccaacca gggccttgtg tgcgccctgc ttcttcctgt agagggtgag 360 cgagagccgg acccaccgga tgaccgggat gcctcagatg gggaggatga gaagcccccg 420 ctgcccccgc gctctggctc caccagcatt tctgccccca ctgggcccag cagtcccctg 480 ccagctcctg agactcccac agctccagct gctgagagtg ctcccaatgg gctgagcacc 540 gtctcgcacg actacctgaa aggcagctat gggctggacc tggaagctgt gaggggtgga 600 gccagccacc tgccccacct cacccgtacc ctcgctacct catgccggag gctgcacagt 660 gaggtggaca aggtcctgtc aggcctggag atcctgtcca aggtgtttga ccagcagagc 720 tcgcccatgg tgacccgcct tttgcagcag cagaacctgc cacagacagg ggagcaggaa 780 ctagagagcc tggtgctgaa gctgtcagtg ctaaaggact tcctgtcagg catccagaag 840 aaggccctga aggccctaca ggacatgagc tccacagcac ccccagctcc gcagccatcc 900 acacgtaagg ccaagaccat ccccgtgcag gcctttgagg tgaagctaga tgtgaccctg 960 ggtgacctga ccaagattgg gaagtcacag aagttcacgc tgagcgtgga tgtggagggt 1020 gggcggctgg tgctgctgcg gagacagcgg gactcccagg aggactggac caccttcacg 1080 cacgaccgca tccgccagct cattaagtcc cagcgtgtcc agaacaagct gggtgttgtg 1140 tttgagaagg agaaggaccg gactcagcgc aaggacttca tctttgtcag tgcccggaag 1200 cgggaggcct tctgccagct gttgcagctc atgaagaaca agcactccaa gcaggacgag 1260 cccgacatga tctcagtctt cataggcacc tggaacatgg gaagtgtacc acctccaaaa 1320 aacgtgacat cctggttcac atcgaagggt ctggggaaga ccctggacga ggtcacagtg 1380 accatacccc atgacatcta tgtctttggg acccaggaga actcagtggg cgaccgcgag 1440 tggctggacc tactgcgcgg gggcctcaag gagcttacgg atctggatta ccgcccgatt 1500 gccatgcaat cactgtggaa tatcaaggtg gcagtgctgg tcaagccaga gcacgagaac 1560 cgtatcagcc atgtcagtac gtccagtgtg aagactggca tcgccaacac cctggggaac 1620 aagggggctg tgggcgtctc cttcatgttt aatggcacct catttggctt tgtgaattgt 1680 cacctcacct cgggaaatga gaagacggct cggaggaacc aaaactactt ggacatcctg 1740 cggctgctct cgctgggcga ccggcagctc aatgcctttg acatctctct gcgtttcaca 1800 cacctcttct ggtttgggga cctcaactac cgcctggaca tggatatcca ggagatcctg 1860 aactacatca gcaggaaaga gtttgagccc ctcctcaggg tggaccagct caacctggag 1920 cgggagaagc acaaggtctt ccttcgattc agtgaggagg agatctcctt cccacccacc 1980 taccgctatg agcggggttc ccgggacaca tatgcctggc acaagcagaa gccaactggg 2040 gtccggacca atgtgccctc atggtgtgac cggattctgt ggaaatccta ccctgaaact 2100 cacatcatct gcaattctta tggttgcact gatgacatcg tcaccagcga ccattccccc 2160 gtgtttggga catttgaggt tggagttacc tcccagttca tctccaagaa agggctctca 2220 aagacttcag accaggccta cattgagttt gagagcatcg aggccattgt gaagacagcc 2280 agccgcacca agttcttcat cgagttctac tctacctgcc tggaggaata caagaagagc 2340 tttgagaatg atgcccagag cagtgacaac atcaacttcc tcaaagtgca gtggtcttca 2400 cgccagctgc ccacgctcaa accaattctg gctgatatcg agtacctgca ggaccagcac 2460 ctcctgctca cagtcaagtc catggatggc tatgaatcct atggggagtg tgtggttgca 2520 ctcaaatcca tgatcggcag cacggcccaa cagttcctga ccttcctatc ccaccgtggc 2580 gaggagacag gcaatatcag aggctccatg aaggtgcggg tgcccacgga gcgcctgggc 2640 acccgtgagc ggctctacga gtggatcagc attgataagg atgaggcagg agcaaagagc 2700 aaagccccct ctgtgtcccg agggagccag gagcccaggt cagggagccg caagccagcc 2760 ttcacagagg cctcctgccc gctctccagg ttatttgaag aaccagagaa accgccacca 2820 acggggaggc ccccagcccc accccgagca gctccccggg aggagccctt gacccccagg 2880 ttgaagccag agggagctcc tgaaccagaa ggggtggcgg cccccccacc caagaacagc 2940 ttcaataacc ctgcctacta cgtccttgaa ggggtcccgc accagctgct gcccccggag 3000 ccaccctcgc ctgccagggc ccctgtccca tctgccacca agaacaaagt ggccattaca 3060 gtgcctgctc cacagcttgg gcaccaccgg caccctcgtg tgggagaggg gagttcttca 3120 gatgaggagt ctggaggcac actgccccct ccagactttc cacctccacc actgccggac 3180 tcagccatct tcctgccccc cagcctggat cctttaccag ggccagtggt ccggggccgt 3240 ggtggggctg aggcccgtgg cccaccacct cccaaggccc atccaaggcc tccactgccc 3300 ccaggcccct caccagccag cactttcctg ggggaagtgg ccagtgggga tgaccggtcc 3360 tgctcggtgc tgcagatggc caagacgctg agcgaggtgg actatgcccc tgctgggcct 3420 gcacgctcag cgctcctccc aggccccctg gagctgcagc ccccccgggg actgccctcg 3480 gactatggcc ggcccctcag cttccctcca ccccgcatcc gggagagcat ccaggaagac 3540 ctggcagagg aggctccgtg cctgcagggc gggcgggcca gcgggctggg cgaggcaggc 3600 atgagtgcct ggctgcgggc catcggcttg gagcgctatg aggagggcct ggtgcataat 3660 ggctgggacg acctggagtt tctcagtgac atcaccgagg aggacttgga ggaggctggg 3720 gtgcaggacc cggctcacaa gcgcctcctt ctggacaccc tgcagctcag caagtga 3777 <210> 20 <211> 4080 <212> DNA <213> homo sapiens <400> 20 atggcggagg ccggcctgag gggctggctg ctgtgggccc tgctcctgcg cttggcccag 60 agtgagcctt acacaaccat ccaccagcct ggctactgcg ccttctatga cgaatgtggg 120 aagaacccag agctgtctgg aagcctcatg acactctcca acgtgtcctg cctgtccaac 180 acgccggccc gcaagatcac aggtgatcac ctgatcctat tacagaagat ctgcccccgc 240 ctctacaccg gccccaacac ccaagcctgc tgctccgcca agcagctggt atcactggaa 300 gcgagtctgt cgatcaccaa ggccctcctc acccgctgcc cagcctgctc tgacaatttt 360 gtgaacctgc actgccacaa cacgtgcagc cccaatcaga gcctcttcat caatgtgacc 420 cgcgtggccc agctaggggc tggacaactc ccagctgtgg tggcctatga ggccttctac 480 cagcatagct ttgccgagca gagctatgac tcctgcagcc gtgtgcgcgt ccctgcagct 540 gccacgctgg ctgtgggcac catgtgtggc gtgtatggct ctgccctttg caatgcccag 600 cgctggctca acttccaggg agacacaggc aatggtctgg ccccactgga catcaccttc 660 cacctcttgg agcctggcca ggccgtgggg agtgggattc agcctctgaa tgagggggtt 720 gcacgttgca atgagtccca aggtgacgac gtggcgacct gctcctgcca agactgtgct 780 gcatcctgtc ctgccatagc ccgcccccag gccctcgact ccaccttcta cctgggccag 840 atgccgggca gtctggtcct catcatcatc ctctgctctg tcttcgctgt ggtcaccatc 900 ctgcttgtgg gattccgtgt ggcccccgcc agggacaaaa gcaagatggt ggaccccaag 960 aagggcacca gcctctctga caagctcagc ttctccaccc acaccctcct tggccagttc 1020 ttccagggct ggggcacgtg ggtggcttcg tggcctctga ccatcttggt gctatctgtc 1080 atcccggtgg tggccttggc agcgggcctg gtctttacag aactcactac ggaccccgtg 1140 gagctgtggt cggcccccaa cagccaagcc cggagtgaga aagctttcca tgaccagcat 1200 ttcggcccct tcttccgaac caaccaggtg atcctgacgg ctcctaaccg gtccagctac 1260 aggtatgact ctctgctgct ggggcccaag aacttcagcg gaatcctgga cctggacttg 1320 ctgctggagc tgctagagct gcaggagagg ctgcggcacc tccaggtatg gtcgcccgaa 1380 gcacagcgca acatctccct gcaggacatc tgctacgccc ccctcaatcc ggacaatacc 1440 agtctctacg actgctgcat caacagcctc ctgcagtatt tccagaacaa ccgcacgctc 1500 ctgctgctca cagccaacca gacactgatg gggcagacct cccaagtcga ctggaaggac 1560 cattttctgt actgtgccaa tgccccgctc accttcaagg atggcacagc cctggccctg 1620 agctgcatgg ctgactacgg ggcccctgtc ttccccttcc ttgccattgg ggggtacaaa 1680 ggaaaggact attctgaggc agaggccctg atcatgacgt tctccctcaa caattaccct 1740 gccggggacc cccgtctggc ccaggccaag ctgtgggagg aggccttctt agaggaaatg 1800 cgagccttcc agcgtcggat ggctggcatg ttccaggtca cgttcatggc tgagcgctct 1860 ctggaagacg agatcaatcg caccacagct gaagacctgc ccatctttgc caccagctac 1920 attgtcatat tcctgtacat ctctctggcc ctgggcagct attccagctg gagccgagtg 1980 atggtggact ccaaggccac gctgggcctc ggcggggtgg ccgtggtcct gggagcagtc 2040 atggctgcca tgggcttctt ctcctacttg ggtatccgct cctccctggt catcctgcaa 2100 gtggttcctt tcctggtgct gtccgtgggg gctgataaca tcttcatctt tgttctcgag 2160 taccagaggc tgccccggag gcctggggag ccacgagagg tccacattgg gcgagcccta 2220 ggcagggtgg ctcccagcat gctgttgtgc agcctctctg aggccatctg cttcttccta 2280 ggggccctga cccccatgcc agctgtgcgg acctttgccc tgacctctgg ccttgcagtg 2340 atccttgact tcctcctgca gatgtcagcc tttgtggccc tgctctccct ggacagcaag 2400 aggcaggagg cctcccggtt ggacgtctgc tgctgtgtca agccccagga gctgcccccg 2460 cctggccagg gagaggggct cctgcttggc ttcttccaaa aggcttatgc ccccttcctg 2520 ctgcactgga tcactcgagg tgttgtgctg ctgctgtttc tcgccctgtt cggagtgagc 2580 ctctactcca tgtgccacat cagcgtggga ctggaccagg agctggccct gcccaaggac 2640 tcgtacctgc ttgactattt cctctttctg aaccgctact tcgaggtggg ggccccggtg 2700 tactttgtta ccaccttggg ctacaacttc tccagcgagg ctgggatgaa tgccatctgc 2760 tccagtgcag gctgcaacaa cttctccttc acccagaaga tccagtatgc cacagagttc 2820 cctgagcagt cttacctggc catccctgcc tcctcctggg tggatgactt cattgactgg 2880 ctgaccccgt cctcctgctg ccgcctttat atatctggcc ccaataagga caagttctgc 2940 ccctcgaccg tcaactctct gaactgccta aagaactgca tgagcatcac gatgggctct 3000 gtgaggccct cggtggagca gttccataag tatcttccct ggttcctgaa cgaccggccc 3060 aacatcaaat gtcccaaagg cggcctggca gcatacagca cctctgtgaa cttgacttca 3120 gatggccagg ttttagacac agttgccatt ctgtcaccca ggctggagta cagtggcaca 3180 atctcggctc actgcaacct ctacctcctg gattcaacct ccaggttcat ggcctatcac 3240 aagcccctga aaaactcaca ggattacaca gaagctctgc gggcagctcg agagctggca 3300 gccaacatca ctgctgacct gcggaaagtg cctggaacag acccggcttt tgaggtcttc 3360 ccctacacga tcaccaatgt gttttatgag cagtacctga ccatcctccc tgaggggctc 3420 ttcatgctca gcctctgcct tgtgcccacc ttcgctgtct cctgcctcct gctgggcctg 3480 gacctgcgct ccggcctcct caacctgctc tccattgtca tgatcctcgt ggacactgtc 3540 ggcttcatgg ccctgtgggg catcagttac aatgctgtgt ccctcatcaa cctggtctcg 3600 gcggtgggca tgtctgtgga gtttgtgtcc cacattaccc gctcctttgc catcagcacc 3660 aagcccacct ggctggagag ggccaaagag gccaccatct ctatgggaag tgcggtgttt 3720 gcaggtgtgg ccatgaccaa cctgcctggc atccttgtcc tgggcctcgc caaggcccag 3780 ctcattcaga tcttcttctt ccgcctcaac ctcctgatca ctctgctggg cctgctgcat 3840 ggcttggtct tcctgcccgt catcctcagc tacgtggggc ctgacgttaa cccggctctg 3900 gcactggagc agaagcgggc tgaggaggcg gtggcagcag tcatggtggc ctcttgccca 3960 aatcacccct cccgagtctc cacagctgac aacatctatg tcaaccacag ctttgaaggt 4020 tctatcaaag gtgctggtgc catcagcaac ttcttgccca acaatgggcg gcagttctga 4080 4080 <210> 21 <211> 13635 <212> DNA <213> homo sapiens <400> 21 atgctgaccc cgccgttgct cctgctgctg cccctgctct cagctctggt cgcggcggct 60 atcgacgccc ctaagacttg cagccccaag cagtttgcct gcagagatca aataacctgt 120 atctcaaagg gctggcggtg cgacggtgag agggactgcc cagacggatc tgacgaggcc 180 cctgagattt gtccacagag taaggcccag cgatgccagc caaacgagca taactgcctg 240 ggtactgagc tgtgtgttcc catgtcccgc ctctgcaatg gggtccagga ctgcatggac 300 ggctcagatg aggggcccca ctgccgagag ctccaaggca actgctctcg cctgggctgc 360 cagcaccatt gtgtccccac actcgatggg cccacctgct actgcaacag cagctttcag 420 cttcaggcag atggcaagac ctgcaaagat tttgatgagt gctcagtgta cggcacctgc 480 agccagctat gcaccaacac agacggctcc ttcatatgtg gctgtgttga aggatacctc 540 ctgcagccgg ataaccgctc ctgcaaggcc aagaacgagc cagtagaccg gccccctgtg 600 ctgttgatag ccaactccca gaacatcttg gccacgtacc tgagtggggc ccaggtgtct 660 accatcacac ctacgagcac gcggcagacc acagccatgg acttcagcta tgccaacgag 720 accgtatgct gggtgcatgt tggggacagt gctgctcaga cgcagctcaa gtgtgcccgc 780 atgcctggcc taaagggctt cgtggatgag cacaccatca acatctccct cagtctgcac 840 cacgtggaac agatggccat cgactggctg acaggcaact tctactttgt ggatgacatc 900 gatgatagga tctttgtctg caacagaaat ggggacacat gtgtcacatt gctagacctg 960 gaactctaca accccaaggg cattgccctg gaccctgcca tggggaaggt gtttttcact 1020 gactatgggc agatcccaaa ggtggaacgc tgtgacatgg atgggcagaa ccgcaccaag 1080 ctcgtcgaca gcaagattgt gtttcctcat ggcatcacgc tggacctggt cagccgcctt 1140 gtctactggg cagatgccta tctggactat attgaagtgg tggactatga gggcaagggc 1200 cgccagacca tcatccaggg catcctgatt gagcacctgt acggcctgac tgtgtttgag 1260 aattatctct atgccaccaa ctcggacaat gccaatgccc agcagaagac gagtgtgatc 1320 cgtgtgaacc gctttaacag caccgagtac caggttgtca cccgggtgga caagggtggt 1380 gccctccaca tctaccacca gaggcgtcag ccccgagtga ggagccatgc ctgtgaaaac 1440 gaccagtatg ggaagccggg tggctgctct gacatctgcc tgctggccaa cagccacaag 1500 gcgcggacct gccgctgccg ttccggcttc agcctgggca gtgacgggaa gtcatgcaag 1560 aagccggagc atgagctgtt cctcgtgtat ggcaagggcc ggccaggcat catccggggc 1620 atggatatgg gggccaaggt cccggatgag cacatgatcc ccattgaaaa cctcatgaac 1680 ccccgagccc tggacttcca cgctgagacc ggcttcatct actttgccga caccaccagc 1740 tacctcattg gccgccagaa gattgatggc actgagcggg agaccatcct gaaggacggc 1800 atccacaatg tggagggtgt ggccgtggac tggatgggag acaatctgta ctggacggac 1860 gatgggccca aaaagacaat cagcgtggcc aggctggaga aagctgctca gacccgcaag 1920 actttaatcg agggcaaaat gacacacccc agggctattg tggtggatcc actcaatggg 1980 tggatgtact ggacagactg ggaggaggac cccaaggaca gtcggcgtgg gcggctggag 2040 agggcgtgga tggatggctc acaccgagac atctttgtca cctccaagac agtgctttgg 2100 cccaatgggc taagcctgga catcccggct gggcgcctct actgggtgga tgccttctac 2160 gaccgcatcg agacgatact gctcaatggc acagaccgga agattgtgta tgaaggtcct 2220 gagctgaacc acgcctttgg cctgtgtcac catggcaact acctcttctg gactgagtat 2280 cggagtggca gtgtctaccg cttggaacgg ggtgtaggag gcgcaccccc cactgtgacc 2340 cttctgcgca gtgagcggcc ccccatcttt gagatccgaa tgtatgatgc ccagcagcag 2400 caagttggca ccaacaaatg ccgggtgaac aatggcggct gcagcagcct gtgcttggcc 2460 acccctggga gccgccagtg cgcctgtgct gaggaccagg tgttggacgc agacggcgtc 2520 acttgcttgg cgaacccatc ctacgtgcct ccaccccagt gccagccagg cgagtttgcc 2580 tgtgccaaca gccgctgcat ccaggagcgc tggaagtgtg acggagacaa cgattgcctg 2640 gacaacagtg atgaggcccc agccctctgc catcagcaca cctgcccctc ggaccgattc 2700 aagtgcgaga acaaccggtg catccccaac cgctggctct gcgacgggga caatgactgt 2760 gggaacagtg aagatgagtc caatgccact tgttcagccc gcacctgccc ccccaaccag 2820 ttctcctgtg ccagtggccg ctgcatcccc atctcctgga cgtgtgatct ggatgacgac 2880 tgtggggacc gctctgatga gtctgcttcg tgtgcctatc ccacctgctt ccccctgact 2940 cagtttacct gcaacaatgg cagatgtatc aacatcaact ggagatgcga caatgacaat 3000 gactgtgggg acaacagtga cgaagccggc tgcagccact cctgttctag cacccagttc 3060 aagtgcaaca gcgggcgttg catccccgag cactggacct gcgatgggga caatgactgc 3120 ggagactaca gtgatgagac acacgccaac tgcaccaacc aggccacgag gccccctggt 3180 ggctgccaca ctgatgagtt ccagtgccgg ctggatggac tatgcatccc cctgcggtgg 3240 cgctgcgatg gggacactga ctgcatggac tccagcgatg agaagagctg tgagggagtg 3300 acccacgtct gcgatcccag tgtcaagttt ggctgcaagg actcagctcg gtgcatcagc 3360 aaagcgtggg tgtgtgatgg cgacaatgac tgtgaggata actcggacga ggagaactgc 3420 gagtccctgg cctgcaggcc accctcgcac ccttgtgcca acaacacctc agtctgcctg 3480 ccccctgaca agctgtgtga tggcaacgac gactgtggcg acggctcaga tgagggcgag 3540 ctctgcgacc agtgctctct gaataacggt ggctgcagcc acaactgctc agtggcacct 3600 ggcgaaggca ttgtgtgttc ctgccctctg ggcatggagc tggggcccga caaccacacc 3660 tgccagatcc agagctactg tgccaagcat ctcaaatgca gccaaaagtg cgaccagaac 3720 aagttcagcg tgaagtgctc ctgctacgag ggctgggtcc tggaacctga cggcgagagc 3780 tgccgcagcc tggacccctt caagccgttc atcattttct ccaaccgcca tgaaatccgg 3840 cgcatcgatc ttcacaaagg agactacagc gtcctggtgc ccggcctgcg caacaccatc 3900 gccctggact tccacctcag ccagagcgcc ctctactgga ccgacgtggt ggaggacaag 3960 atctaccgcg ggaagctgct ggacaacgga gccctgacta gtttcgaggt ggtgattcag 4020 tatggcctgg ccacacccga gggcctggct gtagactgga ttgcaggcaa catctactgg 4080 gtggagagta acctggatca gatcgaggtg gccaagctgg atgggaccct ccggaccacc 4140 ctgctggccg gtgacattga gcacccaagg gcaatcgcac tggatccccg ggatgggatc 4200 ctgttttgga cagactggga tgccagcctg ccccgcattg aggcagcctc catgagtggg 4260 gctgggcgcc gcaccgtgca ccgggagacc ggctctgggg gctggcccaa cgggctcacc 4320 gtggactacc tggagaagcg catcctttgg attgacgcca ggtcagatgc catttactca 4380 gcccgttacg acggctctgg ccacatggag gtgcttcggg gacacgagtt cctgtcgcac 4440 ccgtttgcag tgacgctgta cgggggggag gtctactgga ctgactggcg aacaaacaca 4500 ctggctaagg ccaacaagtg gaccggccac aatgtcaccg tggtacagag gaccaacacc 4560 cagccctttg acctgcaggt gtaccacccc tcccgccagc ccatggctcc caatccctgt 4620 gaggccaatg ggggccaggg cccctgctcc cacctgtgtc tcatcaacta caaccggacc 4680 gtgtcctgcg cctgccccca cctcatgaag ctccacaagg acaacaccac ctgctatgag 4740 tttaagaagt tcctgctgta cgcacgtcag atggagatcc gaggtgtgga cctggatgct 4800 ccctactaca actacatcat ctccttcacg gtgcccgaca tcgacaacgt cacagtgcta 4860 gactacgatg cccgcgagca gcgtgtgtac tggtctgacg tgcggacaca ggccatcaag 4920 cgggccttca tcaacggcac aggcgtggag acagtcgtct ctgcagactt gccaaatgcc 4980 cacgggctgg ctgtggactg ggtctcccga aacctgttct ggacaagcta tgacaccaat 5040 aagaagcaga tcaatgtggc ccggctggat ggctccttca agaacgcagt ggtgcagggc 5100 ctggagcagc cccatggcct tgtcgtccac cctctgcgtg ggaagctcta ctggaccgat 5160 ggtgacaaca tcagcatggc caacatggat ggcagcaatc gcaccctgct cttcagtggc 5220 cagaagggcc ccgtgggcct ggctattgac ttccctgaaa gcaaactcta ctggatcagc 5280 tccgggaacc ataccatcaa ccgctgcaac ctggatggga gtgggctgga ggtcatcgat 5340 gccatgcgga gccagctggg caaggccacc gccctggcca tcatggggga caagctgtgg 5400 tgggctgatc aggtgtcgga aaagatgggc acatgcagca aggctgacgg ctcgggctcc 5460 gtggtccttc ggaacagcac caccctggtg atgcacatga aggtctatga cgagagcatc 5520 cagctggacc ataagggcac caacccctgc agtgtcaaca acggtgactg ctcccagctc 5580 tgcctgccca cgtcagagac gacccgctcc tgcatgtgca cagccggcta tagcctccgg 5640 agtggccagc aggcctgcga gggcgtaggt tcctttctcc tgtactctgt gcatgaggga 5700 atcaggggaa ttcccctgga tcccaatgac aagtcagatg ccctggtccc agtgtccggg 5760 acctcgctgg ctgtcggcat cgacttccac gctgaaaatg acaccatcta ctgggtggac 5820 atgggcctga gcacgatcag ccgggccaag cgggaccaga cgtggcgtga agacgtggtg 5880 accaatggca ttggccgtgt ggagggcatt gcagtggact ggatcgcagg caacatctac 5940 tggacagacc agggctttga tgtcatcgag gtcgcccggc tcaatggctc cttccgctac 6000 gtggtgatct cccagggtct agacaagccc cgggccatca ccgtccaccc ggagaaaggg 6060 tacttgttct ggactgagtg gggtcagtat ccgcgtattg agcggtctcg gctagatggc 6120 acggagcgtg tggtgctggt caacgtcagc atcagctggc ccaacggcat ctcagtggac 6180 taccaggatg ggaagctgta ctggtgcgat gcacggacag acaagattga acggatcgac 6240 ctggagacag gtgagaaccg cgaggtggtt ctgtccagca acaacatgga catgttttca 6300 gtgtctgtgt ttgaggattt catctactgg agtgacagga ctcatgccaa cggctctatc 6360 aagcgcggga gcaaagacaa tgccacagac tccgtgcccc tgcgaaccgg catcggcgtc 6420 cagcttaaag acatcaaagt cttcaaccgg gaccggcaga aaggcaccaa cgtgtgcgcg 6480 gtggccaatg gcgggtgcca gcagctgtgc ctgtaccggg gccgtgggca gcgggcctgc 6540 gcctgtgccc acgggatgct ggctgaagac ggagcatcgt gccgcgagta tgccggctac 6600 ctgctctact cagagcgcac cattctcaag agtatccacc tgtcggatga gcgcaacctc 6660 aatgcgcccg tgcagccctt cgaggaccct gagcacatga agaacgtcat cgccctggcc 6720 tttgactacc gggcaggcac ctctccgggc acccccaatc gcatcttctt cagcgacatc 6780 cactttggga acatccaaca gatcaacgac gatggctcca ggaggatcac cattgtggaa 6840 aacgtgggct ccgtggaagg cctggcctat caccgtggct gggacactct ctattggaca 6900 agctacacga catccaccat cacgcgccac acagtggacc agacccgccc aggggccttc 6960 gagcgtgaga ccgtcatcac tatgtctgga gatgaccacc cacgggcctt cgttttggac 7020 gagtgccaga acctcatgtt ctggaccaac tggaatgagc agcatcccag catcatgcgg 7080 gcggcgctct cgggagccaa tgtcctgacc cttatcgaga aggacatccg tacccccaat 7140 ggcctggcca tcgaccaccg tgccgagaag ctctacttct ctgacgccac cctggacaag 7200 atcgagcggt gcgagtatga cggctcccac cgctatgtga tcctaaagtc agagcctgtc 7260 caccccttcg ggctggccgt gtatggggag cacattttct ggactgactg ggtgcggcgg 7320 gcagtgcagc gggccaacaa gcacgtgggc agcaacatga agctgctgcg cgtggacatc 7380 ccccagcagc ccatgggcat catcgccgtg gccaacgaca ccaacagctg tgaactctct 7440 ccatgccgaa tcaacaacgg tggctgccag gacctgtgtc tgctcactca ccagggccat 7500 gtcaactgct catgccgagg gggccgaatc ctccaggatg acctcacctg ccgagcggtg 7560 aattcctctt gccgagcaca agatgagttt gagtgtgcca atggcgagtg catcaacttc 7620 agcctgacct gcgacggcgt cccccactgc aaggacaagt ccgatgagaa gccatcctac 7680 tgcaactccc gccgctgcaa gaagactttc cggcagtgca gcaatgggcg ctgtgtgtcc 7740 aacatgctgt ggtgcaacgg ggccgacgac tgtggggatg gctctgacga gatcccttgc 7800 aacaagacag cctgtggtgt gggcgagttc cgctgccggg acgggacctg catcgggaac 7860 tccagccgct gcaaccagtt tgtggattgt gaggacgcct cagatgagat gaactgcagt 7920 gccaccgact gcagcagcta cttccgcctg ggcgtgaagg gcgtgctctt ccagccctgc 7980 gagcggacct cactctgcta cgcacccagc tgggtgtgtg atggcgccaa tgactgtggg 8040 gactacagtg atgagcgcga ctgcccaggt gtgaaacgcc ccagatgccc tctgaattac 8100 ttcgcctgcc ctagtgggcg ctgcatcccc atgagctgga cgtgtgacaa agaggatgac 8160 tgtgaacatg gcgaggacga gacccactgc aacaagttct gctcagaggc ccagtttgag 8220 tgccagaacc atcgctgcat ctccaagcag tggctgtgtg acggcagcga tgactgtggg 8280 gatggctcag acgaggctgc tcactgtgaa ggcaagacgt gcggcccctc ctccttctcc 8340 tgccctggca cccacgtgtg cgtccccgag cgctggctct gtgacggtga caaagactgt 8400 gctgatggtg cagacgagag catcgcagct ggttgcttgt acaacagcac ttgtgacgac 8460 cgtgagttca tgtgccagaa ccgccagtgc atccccaagc acttcgtgtg tgaccacgac 8520 cgtgactgtg cagatggctc tgatgagtcc cccgagtgtg agtacccgac ctgcggcccc 8580 agtgagttcc gctgtgccaa tgggcgctgt ctgagctccc gccagtggga gtgtgatggc 8640 gagaatgact gccacgacca gagtgacgag gctcccaaga acccacactg caccagccaa 8700 gagcacaagt gcaatgcctc gtcacagttc ctgtgcagca gtgggcgctg tgtggctgag 8760 gcactgctct gcaacggcca ggatgactgt ggcgacagct cggacgagcg tggctgccac 8820 atcaatgagt gtctcagccg caagctcagt ggctgcagcc aggactgtga ggacctcaag 8880 atcggcttca agtgccgctg tcgccctggc ttccggctga aggacgacgg ccggacgtgt 8940 gctgatgtgg acgagtgcag caccaccttc ccctgcagcc agcgctgcat caacactcat 9000 ggcagctata agtgtctgtg tgtggagggc tatgcacccc gcggcggcga cccccacagc 9060 tgcaaggctg tgactgacga ggaaccgttt ctgatcttcg ccaaccggta ctacctgcgc 9120 aagctcaacc tggacgggtc caactacacg ttacttaagc agggcctgaa caacgccgtt 9180 gccttggatt ttgactaccg agagcagatg atctactgga cagatgtgac cacccagggc 9240 agcatgatcc gaaggatgca ccttaacggg agcaatgtgc aggtcctaca ccgtacaggc 9300 ctcagcaacc ccgatgggct ggctgtggac tgggtgggtg gcaacctgta ctggtgcgac 9360 aaaggccggg acaccatcga ggtgtccaag ctcaatgggg cctatcggac ggtgctggtc 9420 agctctggcc tccgtgagcc cagggctctg gtggtggatg tgcagaatgg gtacctgtac 9480 tggacagact ggggtgacca ttcactgatc ggccgcatcg gcatggatgg gtccagccgc 9540 agcgtcatcg tggacaccaa gatcacatgg cccaatggcc tgacgctgga ctatgtcact 9600 gagcgcatct actgggccga cgcccgcgag gactacattg aatttgccag cctggatggc 9660 tccaatcgcc acgttgtgct gagccaggac atcccgcaca tctttgcact gaccctgttt 9720 gaggactacg tctactggac cgactgggaa acaaagtcca ttaaccgagc ccacaagacc 9780 acgggcacca acaaaacgct cctcatcagc acgctgcacc ggcccatgga cctgcatgtc 9840 ttccatgccc tgcgccagcc agacgtgccc aatcacccct gcaaggtcaa caatggtggc 9900 tgcagcaacc tgtgcctgct gtcccccggg ggagggcaca aatgtgcctg ccccaccaac 9960 ttctacctgg gcagcgatgg gcgcacctgt gtgtccaact gcacggctag ccagtttgta 10020 tgcaagaacg acaagtgcat ccccttctgg tggaagtgtg acaccgagga cgactgcggg 10080 gaccactcag acgagccccc ggactgccct gagttcaagt gccggcccgg acagttccag 10140 tgctccacag gtatctgcac aaaccctgcc ttcatctgcg atggcgacaa tgactgccag 10200 gacaacagtg acgaggccaa ctgtgacatc cacgtctgct tgcccagtca gttcaaatgc 10260 accaacacca accgctgtat tcccggcatc ttccgctgca atgggcagga caactgcgga 10320 gatggggagg atgagaggga ctgccccgag gtgacctgcg cccccaacca gttccagtgc 10380 tccattacca aacggtgcat cccccgggtc tgggtctgcg accgggacaa tgactgtgtg 10440 gatggcagtg atgagcccgc caactgcacc cagatgacct gtggtgtgga cgagttccgc 10500 tgcaaggatt cgggccgctg catcccagcg cgttggaagt gtgacggaga ggatgactgt 10560 ggggatggct cggatgagcc caaggaagag tgtgatgaac gcacctgtga gccataccag 10620 ttccgctgca agaacaaccg ctgcgtgccc ggccgctggc agtgcgacta cgacaacgat 10680 tgcggtgaca actccgatga agagagctgc acccctcggc cctgctccga gagtgagttc 10740 tcctgtgcca acggccgctg catcgcgggg cgctggaaat gcgatggaga ccacgactgc 10800 gcggacggct cggacgagaa agactgcacc ccccgctgtg acatggacca gttccagtgc 10860 aagagcggcc actgcatccc cctgcgctgg cgctgtgacg cagacgccga ctgcatggac 10920 ggcagcgacg aggaggcctg cggcactggc gtgcggacct gccccctgga cgagttccag 10980 tgcaacaaca ccttgtgcaa gccgctggcc tggaagtgcg atggcgagga tgactgtggg 11040 gacaactcag atgagaaccc cgaggagtgt gcccggttcg tgtgccctcc caaccggccc 11100 ttccgttgca agaatgaccg cgtctgtctg tggatcgggc gccaatgcga tggcacggac 11160 aactgtgggg atgggactga tgaagaggac tgtgagcccc ccacagccca caccacccac 11220 tgcaaagaca agaaggagtt tctgtgccgg aaccagcgct gcctctcctc ctccctgcgc 11280 tgcaacatgt tcgatgactg cggggacggc tctgacgagg aggactgcag catcgacccc 11340 aagctgacca gctgcgccac caatgccagc atctgtgggg acgaggcacg ctgcgtgcgc 11400 accgagaaag cggcctactg tgcctgccgc tcgggcttcc acaccgtgcc cggccagccc 11460 ggatgccaag acatcaacga gtgcctgcgc ttcggcacct gctcccagct ctgcaacaac 11520 accaagggcg gccacctctg cagctgcgct cggaacttca tgaagacgca caacacctgc 11580 aaggccgaag gctctgagta ccaggtcctg tacatcgctg atgacaatga gatccgcagc 11640 ctgttccccg gccaccccca ttcggcttac gagcaggcat tccagggtga cgagagtgtc 11700 cgcattgatg ctatggatgt ccatgtcaag gctggccgtg tctattggac caactggcac 11760 acgggcacca tctcctaccg cagcctgcca cctgctgcgc ctcctaccac ttccaaccgc 11820 caccggcgac agattgaccg gggtgtcacc cacctcaaca tttcagggct gaagatgccc 11880 agaggcatcg ccatcgactg ggtggccgga aacgtgtact ggaccgactc gggccgagat 11940 gtgattgagg tggcgcagat gaagggcgag aaccgcaaga cgctcatctc gggcatgatt 12000 gacgagcccc acgccattgt ggtggaccca ctgaggggga ccatgtactg gtcagactgg 12060 ggcaaccacc ccaagattga gacggcagcg atggatggga cgcttcggga gacactggtg 12120 caggacaaca ttcagtggcc cacaggcctg gccgtggatt atcacaatga gcggctgtac 12180 tgggcagacg ccaagctttc agtcatcggc agcatccggc tcaatggcac ggaccccatt 12240 gtggctgctg acagcaaacg aggcctaagt caccccttca gcatcgacgt ctttgaggat 12300 tacatctatg gtgtcaccta catcaataat cgtgtcttca agatccataa gtttggccac 12360 agccccttgg tcaacctgac agggggcctg agccacgcct ctgacgtggt cctttaccat 12420 cagcacaagc agcccgaagt gaccaaccca tgtgaccgca agaaatgcga gtggctctgc 12480 ctgctgagcc ccagtgggcc tgtctgcacc tgtcccaatg ggaagcggct ggacaacggc 12540 acatgcgtgc ctgtgccctc tccaacgccc cccccagatg ctccccggcc tggaacctgt 12600 aacctgcagt gcttcaacgg tggcagctgt ttcctcaatg cacggaggca gcccaagtgc 12660 cgctgccaac cccgctacac gggtgacaag tgtgaactgg accagtgctg ggagcactgt 12720 cgcaatgggg gcacctgtgc tgcctccccc tctggcatgc ccacgtgccg gtgccccacg 12780 ggcttcacgg gccccaaatg cacccagcag gtgtgtgcgg gctactgtgc caacaacagc 12840 acctgcactg tcaaccaggg caaccagccc cagtgccgat gcctacccgg cttcctgggc 12900 gaccgctgcc agtaccggca gtgctctggc tactgtgaga actttggcac atgccagatg 12960 gctgctgatg gctcccgaca atgccgctgc actgcctact ttgagggatc gaggtgtgag 13020 gtgaacaagt gcagccgctg tctcgaaggg gcctgtgtgg tcaacaagca gagtggggat 13080 gtcacctgca actgcacgga tggccgggtg gcccccagct gtctgacctg cgtcggccac 13140 tgcagcaatg gcggctcctg taccatgaac agcaaaatga tgcctgagtg ccagtgccca 13200 ccccacatga cagggccccg gtgtgaggag cacgtcttca gccagcagca gccaggacat 13260 atagcctcca tcctaatccc tctgctgttg ctgctgctgc tggttctggt ggccggagtg 13320 gtattctggt ataagcggcg agtccaaggg gctaagggct tccagcacca acggatgacc 13380 aacggggcca tgaacgtgga gattggaaac cccacctaca agatgtacga aggcggagag 13440 cctgatgatg tgggaggcct actggacgct gactttgccc tggaccctga caagcccacc 13500 aacttcacca accccgtgta tgccacactc tacatggggg gccatggcag tcgccactcc 13560 ctggccagca cggacgagaa gcgagaactc ctgggccggg gccctgagga cgagataggg 13620 gaccccttgg catag 13635 <210> 22 <211> 3345 <212> DNA <213> homo sapiens <400> 22 atggcttgca gaagacgcta tttcgtcgag ggcgaggccc ccagcagtga gactggcaca 60 tccctggaca gcccctcagc ctacccccag ggccccttgg tgcccggttc cagcctgagc 120 ccggatcact acgagcacac gtcagtggga gcctatgggc tgtactcggg gccgccgggg 180 caacagcagc gcacgcggag gcccaagctg cagcactcga cctccatcct gcgcaagcag 240 gctgaggagg aggccatcaa gcgctcacgc tcactctccg agagctatga gctctcctcg 300 gacctgcagg acaagcaggt ggagatgcta gaacgaaagt atggggggcg cctggtaacc 360 cgccatgcgg cccgcaccat ccagacggcg tttcgccagt accagatgaa caagaacttc 420 gagcgcttgc gcagctccat gtcagagaac cgcatgtcac gccggattgt gctgtccaac 480 atgaggatgc agttctcctt tgaggggcct gagaaagtgc acagctccta cttcgagggg 540 aagcaggtct cagtgactaa cgacggctcc cagctgggag ccctggtgtc ccctgagtgt 600 ggtgacctca gcgagcccac caccctcaag tctccggccc cctccagtga ctttgcggac 660 gccatcaccg agctggagga cgccttctct aggcaagtga aatcactggc cgagtccatc 720 gacgatgccc tcaactgccg cagcctgcac actgaggagg caccggccct ggatgcggcg 780 cgggcccggg acaccgaacc ccagacagcc ctgcacggca tggaccaccg caaactggac 840 gagatgacgg cctcgtacag tgatgtcacc ctgtacatcg atgaggagga gctgtcgccc 900 cctctgcccc tctcgcaggc aggggaccgg ccgtccagca ccgagtcgga cctgcggcta 960 cgggctgggg gcgcagcccc agactactgg gccctggccc acaaagagga caaggctgac 1020 acggacacga gctgccggag cacgccgtcg ctggagcggc aggagcagcg gctgcgggtg 1080 gagcatctgc cgctgctcac catcgagcca cccagcgaca gctctgtgga ccttagtgac 1140 cgctcggagc gggggtcact caagaggcag agtgcttacg agcgcagcct tggcgggcag 1200 cagggcagtc ccaagcatgg tccccacagc ggcgccccca agagcctccc ccgggaggag 1260 cctgagttgc ggccccggcc ccccaggccc ctggacagcc acttggccat caatggctca 1320 gccaaccggc agagcaagtc tgagtcggac tactcagacg gtgacaatga cagcatcaac 1380 agcacgtcca actccaacga taccatcaac tgcagctccg agtcatcgtc ccgtgacagc 1440 ctgcgggagc agacgctcag caagcagacc taccacaagg aggcccgcaa cagctgggac 1500 tcgcctgcct ttagcaacga tgtcatccgc aagaggcact accgcatcgg cctgaacctc 1560 ttcaacaaga agcctgagaa gggagtccag tacctcatcg agcgtggctt tgtgcccgac 1620 acgcccgtcg gggtggccca cttcctgctg cagcgcaagg gcctcagccg gcagatgatc 1680 ggcgagttcc tgggcaaccg gcagaagcag ttcaaccgtg acgtgctcga ctgcgtcgtg 1740 gacgagatgg acttctctac catggagctg gatgaggccc tcaggaaatt ccaggcgcac 1800 atccgtgtcc aaggggaggc tcagaaagtg gagcggctca tagaggcgtt cagccagcgc 1860 tactgcatct gcaaccctgg ggtggtgcgg caattccgga acccagacac cattttcatc 1920 ctggccttcg ccatcatcct gctgaacacc gacatgtaca gccccaatgt caagcccgag 1980 cggaaaatga agctagagga cttcatcaag aacctccgag gtgtggacga tggtgaggac 2040 attccccgtg agatgctgat ggggatctat gaacggatcc gtaagcgaga gctaaagacc 2100 aatgaggacc atgtgtccca ggtgcagaag gtggagaagc tcattgtggg gaaaaagccg 2160 atcggatccc tgcatcccgg gctcggctgt gtgctctctc tgccccaccg tcggttggtc 2220 tgctactgcc ggctctttga ggttccagac ccaaacaagc cccagaaact cggactacac 2280 cagcgagaaa tcttcctgtt caacgacctc ctggtggtca ccaagatctt ccagaagaag 2340 aagaactcgg tgacgtacag cttccgacag tccttctcct tgtacggcat gcaggtcctg 2400 ctcttcgaga accagtacta ccccaatggc atccggctca cctcgtctgt ccccggagca 2460 gatatcaaag tgttaataaa cttcaacgcc cccaaccctc aagaccggaa gaaattcacc 2520 gatgacctgc gggagtccat tgcggaagtc caagagatgg agaagcacag gatagagtcg 2580 gagctcgaga agcagaaagg cgtcgtgcgg cccagcatgt cccagtgctc tagcctcaaa 2640 aaggagtcgg gcaacggaac actgagccgg gcctgcctgg acgacagcta tgccagcggt 2700 gagggcctca agcgcagcgc cctcagcagc tccctgcggg acctctcgga agccgggaag 2760 cgagggcgtc gcagcagtgc gggatcgcta gagagcaatg tggaagggtc catcattagc 2820 agtcctcaca tgcgccggag agctacatca acacgagagt gtccatctcg cccacaccag 2880 actatgccca actcatcttc cctcctgggc tccttattcg ggagcaagag agggaagccc 2940 cctccccagg cccacctgcc ctcagcccca gccctgccac ccccccaccc accggtggtc 3000 ctgcctcact tgcagcactc tgtggctggc caccacctgg ggcccccaga ggggctgccg 3060 caggccgcca tgcacgggca tcacacccag tactgccaca tgcagaaccc tcccccgtac 3120 caccatcacc accaccacca cccaccccag cacatccagc acgcacacca gtaccaccac 3180 ggcccccatg ggggccaccc agcctacggg gcccatgccc acggccaccc gccgctgccc 3240 tcggcccacg tggggcacac agtgcaccac catgggcagc cccctgcccc gccgcccccc 3300 accagcagca aggccaaacc cagcggcatc agcacaattg tgtag 3345 <210> 23 <211> 1827 <212> DNA <213> homo sapiens <400> 23 atggcagcgg cggcggcggc ggtggggccg ggcgcgggcg gcgcggggtc ggcggtcccg 60 ggcggcgcgg ggccctgcgc taccgtgtcg gtgttccccg gcgcccgcct cctcaccatc 120 ggcgacgcga acggcgagat ccagcggcac gcggagcagc aggcgctgcg cctcgaggtg 180 cgcgccggcc cggactcggc gggcatcgcc ctctacagcc atgaagatgt gtgtgtcttt 240 aagtgctcag tgtcccgaga gacagagtgc agccgtgtgg gcaagcagtc cttcatcatc 300 accctgggct gcaacagcgt cctcatccag ttcgccacac ccaacgattt ctgttccttc 360 tacaacatcc tgaaaacctg ccggggccac accctggagc ggtctgtgtt cagcgagcgg 420 acggaggagt cttctgccgt gcagtacttc cagttttatg gctacctgtc ccagcagcag 480 aacatgatgc aggactacgt gcggacaggc acctaccagc gcgccatcct gcaaaaccac 540 accgacttca aggacaagat cgttcttgat gttggctgtg gctctgggat cctgtcgttt 600 tttgccgccc aagctggagc acggaaaatc tacgcggtgg aggccagcac catggcccag 660 cacgctgagg tcttggtgaa gagtaacaac ctgacggacc gcatcgtggt catcccgggc 720 aaggtggagg aggtgtcact ccccgagcag gtggacatca tcatctcgga gcccatgggc 780 tacatgctct tcaacgagcg catgctggag agctacctcc acgccaagaa gtacctgaag 840 cccagcggaa acatgtttcc taccattggt gacgtccacc ttgcaccctt cacggatgaa 900 cagctctaca tggagcagtt caccaaggcc aacttctggt accagccatc tttccatgga 960 gtggacctgt cggccctccg aggtgccgcg gtggatgagt atttccggca gcctgtggtg 1020 gacacatttg acatccggat cctgatggcc aagtctgtca agtacacggt gaacttctta 1080 gaagccaaag aaggagattt gcacaggata gaaatcccat tcaaattcca catgctgcat 1140 tcagggctgg tccacggcct ggctttctgg tttgacgttg ctttcatcgg ctccataatg 1200 accgtgtggc tgtccacagc cccgacagag cccctgaccc actggtacca ggtgcggtgc 1260 ctgttccagt caccactgtt cgccaaggca ggggacacgc tctcagggac atgtctgctt 1320 attgccaaca aaagacagag ctacgacatc agtattgtgg cccaggtgga ccagaccggc 1380 tccaagtcca gtaacctcct ggatctgaaa aaccccttct ttagatacac gggcacaacg 1440 ccctcacccc cacccggctc ccactacaca tctccctcgg aaaacatgtg gaacacgggc 1500 agcacctaca acctcagcag cgggatggcc gtggcaggga tgccgaccgc ctatgacttg 1560 agcagtgtta ttgccagtgg ctccagcgtg ggccacaaca acctgattcc tttagccaac 1620 acggggattg tcaatcacac ccactcccgg atgggctcca taatgagcac ggggattgtc 1680 caagggtcct ccggcgccca gggcagtggt ggtggcagca cgagtgccca ctatgcagtc 1740 aacagccagt tcaccatggg cggccccgcc atctccatgg cgtcgcccat gtccatcccg 1800 accaacacca tgcactacgg gagctag 1827 <210> 24 <211> 2667 <212> DNA <213> homo sapiens <400> 24 atgttgtcaa gactttttcg aatgcatggc ctctttgtgg cctcccatcc ctgggaagtc 60 atagtgggga cagtgacact gaccatctgc atgatgtcca tgaacatgtt tactggtaac 120 aataagatct gtggttggaa ttatgaatgt ccaaagtttg aagaggatgt tttgagcagt 180 gacattataa ttctgacaat aacacgatgc atagccatcc tgtatattta cttccagttc 240 cagaatttac gtcaacttgg atcaaaatat attttgggta ttgctggcct tttcacaatt 300 ttctcaagtt ttgtattcag tacagttgtc attcacttct tagacaaaga attgacaggc 360 ttgaatgaag ctttgccctt tttcctactt ttgattgacc tttccagagc aagcacatta 420 gcaaagtttg ccctcagttc caactcacag gatgaagtaa gggaaaatat tgctcgtgga 480 atggcaattt taggtcctac gtttaccctc gatgctcttg ttgaatgtct tgtgattgga 540 gttggtacca tgtcaggggt acgtcagctt gaaattatgt gctgctttgg ctgcatgtca 600 gttcttgcca actacttcgt gttcatgact ttcttcccag cttgtgtgtc cttggtatta 660 gagctttctc gggaaagccg cgagggtcgt ccaatttggc agctcagcca ttttgcccga 720 gttttagaag aagaagaaaa taagccgaat cctgtaactc agagggtcaa gatgattatg 780 tctctaggct tggttcttgt tcatgctcac agtcgctgga tagctgatcc ttctcctcaa 840 aacagtacag cagatacttc taaggtttca ttaggactgg atgaaaatgt gtccaagaga 900 attgaaccaa gtgtttccct ctggcagttt tatctctcta aaatgatcag catggatatt 960 gaacaagtta ttaccctaag tttagctctc cttctggctg tcaagtacat cttctttgaa 1020 caaacagaga cagaatctac actctcatta aaaaacccta tcacatctcc tgtagtgaca 1080 caaaagaaag tcccagacaa ttgttgtaga cgtgaaccta tgctggtcag aaataaccag 1140 aaatgtgatt cagtagagga agagacaggg ataaaccgag aaagaaaagt tgaggttata 1200 aaacccttag tggctgaaac agatacccca aacagagcta catttgtggt tggtaactcc 1260 tccttactcg atacttcatc agtactggtg acacaggaac ctgaaattga acttcccagg 1320 gaacctcggc ctaatgaaga atgtctacag atacttggga atgcagagaa aggtgcaaaa 1380 ttccttagtg atgctgagat catccagtta gtcaatgcta agcatatccc agcctacaag 1440 ttggaaactc tgatggaaac tcatgagcgt ggtgtatcta ttcgccgaca gttactttcc 1500 aagaagcttt cagaaccttc ttctctccag tacctacctt acagggatta taattactcc 1560 ttggtgatgg gagcttgttg tgagaatgtt attggatata tgcccatccc tgttggagtg 1620 gcaggacccc tttgcttaga tgaaaaagaa tttcaggttc caatggcaac aacagaaggt 1680 tgtcttgtgg ccagcaccaa tagaggctgc agagcaatag gtcttggtgg aggtgccagc 1740 agccgagtcc ttgcagatgg gatgactcgt ggcccagttg tgcgtcttcc acgtgcttgt 1800 gactctgcag aagtgaaagc ctggctcgaa acatctgaag ggttcgcagt gataaaggag 1860 gcatttgaca gcactagcag atttgcacgt ctacagaaac ttcatacaag tatagctgga 1920 cgcaaccttt atatccgttt ccagtccagg tcaggggatg ccatggggat gaacatgatt 1980 tcaaagggta cagagaaagc actttcaaaa cttcacgagt atttccctga aatgcagatt 2040 ctagccgtta gtggtaacta ttgtactgac aagaaacctg ctgctataaa ttggatagag 2100 ggaagaggaa aatctgttgt ttgtgaagct gtcattccag ccaaggttgt cagagaagta 2160 ttaaagacta ccacagaggc tatgattgag gtcaacatta acaagaattt agtgggctct 2220 gccatggctg ggagcatagg aggctacaac gcccatgcag caaacattgt caccgccatc 2280 tacattgcct gtggacagga tgcagcacag aatgttggta gttcaaactg tattacttta 2340 atggaagcaa gtggtcccac aaatgaagat ttatatatca gctgcaccat gccatctata 2400 gagataggaa cggtgggtgg tgggaccaac ctactacctc agcaagcctg tttgcagatg 2460 ctaggtgttc aaggagcatg caaagataat cctggggaaa atgcccggca gcttgcccga 2520 attgtgtgtg ggaccgtaat ggctggggaa ttgtcactta tggcagcatt ggcagcagga 2580 catcttgtca aaagtcacat gattcacaac aggtcgaaga tcaatttaca agacctccaa 2640 ggagcttgca ccaagaagac agcctga 2667 <210> 25 <211> 1338 <212> DNA <213> homo sapiens <400> 25 atgctgtgtt atgtgacgag gccggacgcg gtgctgatgg aggtggaggt ggaggcgaaa 60 gccaacggcg aggactgcct caaccaggtg tgcaggcgac tgggaatcat agaagttgac 120 tattttggac tgcagtttac gggtagcaaa ggtgaaagtt tatggctaaa cctgagaaac 180 cggatctccc agcagatgga tgggctagcc ccttacaggc ttaaacttag agtcaagttc 240 ttcgtggagc ctcatctcat cttacaggag cagactaggc atatcttttt cttgcacatc 300 aaggaggccc tcttggcagg ccacctcttg tgttccccag agcaggcagt ggaactcagt 360 gccctcctgg cccagaccaa gtttggagac tacaaccaga acactgccaa gtataactat 420 gaggagctct gtgccaagga gctctcctct gccaccttga acagcattgt tgcaaaacat 480 aaggagttgg aggggaccag ccaggcttca gctgaatacc aagttttgca gattgtgtcg 540 gcaatggaaa actatggcat agaatggcat tctgtgcggg atagcgaagg gcagaaactg 600 ctcattgggg ttggacctga aggaatctca atttgtaaag atgactttag cccaattaat 660 aggatagctt atcctgtggt gcagatggcc acccagtcag gaaagaatgt atatttgacg 720 gtcaccaagg aatctgggaa cagcatcgtg ctcttgttta aaatgatcag caccagggcg 780 gccagcgggc tctaccgagc gataacagag acgcacgcat tctacaggtg tgacacagtg 840 accagcgccg tgatgatgca gtatagccgt gacttgaagg gccacttggc atctctgttt 900 ctgaatgaaa acattaacct tggcaagaaa tatgtctttg atattaaaag aacatcaaag 960 gaggtgtatg accatgccag gagggctctg tacaatgctg gcgttgtgga cctcgtttca 1020 agaaacaacc agagcccttc acactcgcct ctgaagtcct cagaaagcag catgaactgc 1080 agcagctgcg agggcctcag ctgccagcag acccgggtgc tgcaggagaa gctacgcaag 1140 ctgaaggaag ccatgctgtg catggtgtgc tgcgaggagg agatcaactc caccttctgt 1200 ccctgtggcc acactgtgtg ctgtgagagc tgcgccgccc agctacagtc atgtcccgtc 1260 tgcaggtcgc gtgtggagca tgtccagcac gtctatctgc caacgcacac cagtcttctc 1320 aatctgactg taatctaa 1338 <210> 26 <211> 4029 <212> DNA <213> homo sapiens <400> 26 atgagggcga acgacgctct gcaggtgctg ggcttgcttt tcagcctggc ccggggctcc 60 gaggtgggca actctcaggc agtgtgtcct gggactctga atggcctgag tgtgaccggc 120 gatgctgaga accaatacca gacactgtac aagctctacg agaggtgtga ggtggtgatg 180 gggaaccttg agattgtgct cacgggacac aatgccgacc tctccttcct gcagtggatt 240 cgagaagtga caggctatgt cctcgtggcc atgaatgaat tctctactct accattgccc 300 aacctccgcg tggtgcgagg gacccaggtc tacgatggga agtttgccat cttcgtcatg 360 ttgaactata acaccaactc cagccacgct ctgcgccagc tccgcttgac tcagctcacc 420 gagattctgt cagggggtgt ttatattgag aagaacgata agctttgtca catggacaca 480 attgactgga gggacatcgt gagggaccga gatgctgaga tagtggtgaa ggacaatggc 540 agaagctgtc ccccctgtca tgaggtttgc aaggggcgat gctggggtcc tggatcagaa 600 gactgccaga cattgaccaa gaccatctgt gctcctcagt gtaatggtca ctgctttggg 660 cccaacccca accagtgctg ccatgatgag tgtgccgggg gctgctcagg ccctcaggac 720 acagactgct ttgcctgccg gcacttcaat gacagtggag cctgtgtacc tcgctgtcca 780 cagcctcttg tctacaacaa gctaactttc cagctggaac ccaatcccca caccaagtat 840 cagtatggag gagtttgtgt agccagctgt ccccataact ttgtggtgga tcaaacatcc 900 tgtgtcaggg cctgtcctcc tgacaagatg gaagtagata aaaatgggct caagatgtgt 960 gagccttgtg ggggactatg tcccaaagcc tgtgagggaa caggctctgg gagccgcttc 1020 cagactgtgg actcgagcaa cattgatgga tttgtgaact gcaccaagat cctgggcaac 1080 ctggactttc tgatcaccgg cctcaatgga gacccctggc acaagatccc tgccctggac 1140 ccagagaagc tcaatgtctt ccggacagta cgggagatca caggttacct gaacatccag 1200 tcctggccgc cccacatgca caacttcagt gttttttcca atttgacaac cattggaggc 1260 agaagcctct acaaccgggg cttctcattg ttgatcatga agaacttgaa tgtcacatct 1320 ctgggcttcc gatccctgaa ggaaattagt gctgggcgta tctatataag tgccaatagg 1380 cagctctgct accaccactc tttgaactgg accaaggtgc ttcgggggcc tacggaagag 1440 cgactagaca tcaagcataa tcggccgcgc agagactgcg tggcagaggg caaagtgtgt 1500 gacccactgt gctcctctgg gggatgctgg ggcccaggcc ctggtcagtg cttgtcctgt 1560 cgaaattata gccgaggagg tgtctgtgtg acccactgca actttctgaa tggggagcct 1620 cgagaatttg cccatgaggc cgaatgcttc tcctgccacc cggaatgcca acccatggag 1680 ggcactgcca catgcaatgg ctcgggctct gatacttgtg ctcaatgtgc ccattttcga 1740 gatgggcccc actgtgtgag cagctgcccc catggagtcc taggtgccaa gggcccaatc 1800 tacaagtacc cagatgttca gaatgaatgt cggccctgcc atgagaactg cacccagggg 1860 tgtaaaggac cagagcttca agactgttta ggacaaacac tggtgctgat cggcaaaacc 1920 catctgacaa tggctttgac agtgatagca ggattggtag tgattttcat gatgctgggc 1980 ggcacttttc tctactggcg tgggcgccgg attcagaata aaagggctat gaggcgatac 2040 ttggaacggg gtgagagcat agagcctctg gaccccagtg agaaggctaa caaagtcttg 2100 gccagaatct tcaaagagac agagctaagg aagcttaaag tgcttggctc gggtgtcttt 2160 ggaactgtgc acaaaggagt gtggatccct gagggtgaat caatcaagat tccagtctgc 2220 attaaagtca ttgaggacaa gagtggacgg cagagttttc aagctgtgac agatcatatg 2280 ctggccattg gcagcctgga ccatgcccac attgtaaggc tgctgggact atgcccaggg 2340 tcatctctgc agcttgtcac tcaatatttg cctctgggtt ctctgctgga tcatgtgaga 2400 caacaccggg gggcactggg gccacagctg ctgctcaact ggggagtaca aattgccaag 2460 ggaatgtact accttgagga acatggtatg gtgcatagaa acctggctgc ccgaaacgtg 2520 ctactcaagt cacccagtca ggttcaggtg gcagattttg gtgtggctga cctgctgcct 2580 cctgatgata agcagctgct atacagtgag gccaagactc caattaagtg gatggccctt 2640 gagagtatcc actttgggaa atacacacac cagagtgatg tctggagcta tggtgtgaca 2700 gtttgggagt tgatgacctt cggggcagag ccctatgcag ggctacgatt ggctgaagta 2760 ccagacctgc tagagaaggg ggagcggttg gcacagcccc agatctgcac aattgatgtc 2820 tacatggtga tggtcaagtg ttggatgatt gatgagaaca ttcgcccaac ctttaaagaa 2880 ctagccaatg agttcaccag gatggcccga gacccaccac ggtatctggt cataaagaga 2940 gagagtgggc ctggaatagc ccctgggcca gagccccatg gtctgacaaa caagaagcta 3000 gaggaagtag agctggagcc agaactagac ctagacctag acttggaagc agaggaggac 3060 aacctggcaa ccaccacact gggctccgcc ctcagcctac cagttggaac acttaatcgg 3120 ccacgtggga gccagagcct tttaagtcca tcatctggat acatgcccat gaaccagggt 3180 aatcttgggg agtcttgcca ggagtctgca gtttctggga gcagtgaacg gtgcccccgt 3240 ccagtctctc tacacccaat gccacgggga tgcctggcat cagagtcatc agaggggcat 3300 gtaacaggct ctgaggctga gctccaggag aaagtgtcaa tgtgtaggag ccggagcagg 3360 agccggagcc cacggccacg cggagatagc gcctaccatt cccagcgcca cagtctgctg 3420 actcctgtta ccccactctc cccacccggg ttagaggaag aggatgtcaa cggttatgtc 3480 atgccagata cacacctcaa aggtactccc tcctcccggg aaggcaccct ttcttcagtg 3540 ggtctcagtt ctgtcctggg tactgaagaa gaagatgaag atgaggagta tgaatacatg 3600 aaccggagga gaaggcacag tccacctcat ccccctaggc caagttccct tgaggagctg 3660 ggttatgagt acatggatgt ggggtcagac ctcagtgcct ctctgggcag cacacagagt 3720 tgcccactcc accctgtacc catcatgccc actgcaggca caactccaga tgaagactat 3780 gaatatatga atcggcaacg agatggaggt ggtcctgggg gtgattatgc agccatgggg 3840 gcctgcccag catctgagca agggtatgaa gagatgagag cttttcaggg gcctggacat 3900 caggcccccc atgtccatta tgcccgccta aaaactctac gtagcttaga ggctacagac 3960 tctgcctttg ataaccctga ttactggcat agcaggcttt tccccaaggc taatgcccag 4020 agaacgtaa 4029 <210> 27 <211> 1482 <212> DNA <213> homo sapiens <400> 27 atggccctct tcggggccct cttcctagcg ctgctggcag gcgcacatgc agagttccca 60 ggctgcaaga tccgcgtcac ctccaaggcg ctggagctgg tgaagcagga ggggctgcgc 120 tttctggagc aagagctgga gactatcacc attccggacc tgcggggcaa agaaggccac 180 ttctactaca acatctctga ggtgaaggtc acagagctgc aactgacatc ttccgagctc 240 gatttccagc cacagcagga gctgatgctt caaatcacca atgcctcctt ggggctgcgc 300 ttccggagac agctgctcta ctggttcttc tatgatgggg gctacatcaa cgcctcagct 360 gagggtgtgt ccatccgcac tggtctggag ctctcccggg atcccgctgg acggatgaaa 420 gtgtccaatg tctcctgcca ggcctctgtc tccagaatgc acgcggcctt cgggggaacc 480 ttcaagaagg tgtatgattt tctctccacg ttcatcacct cagggatgcg cttcctcctc 540 aaccagcaga tctgccctgt cctctaccac gcagggacgg tcctgctcaa ctccctcctg 600 gacaccgtgc ctgtgcgcag ttctgtggac gagcttgttg gcattgacta ttccctcatg 660 aaggatcctg tggcttccac cagcaacctg gacatggact tccggggggc cttcttcccc 720 ctgactgaga ggaactggag cctccccaac cgggcagtgg agccccagct gcaggaggaa 780 gagcggatgg tgtatgtggc cttctctgag ttcttcttcg actctgccat ggagagctac 840 ttccgggcgg gggccctgca gctgttgctg gtgggggaca aggtgcccca cgacctggac 900 atgctgctga gggccaccta ctttgggagc attgtcctgc tgagcccagc agtgattgac 960 tccccattga agctggagct gcgggtcctg gccccaccgc gctgcaccat caagccctct 1020 ggcaccacca tctctgtcac tgctagcgtc accattgccc tggtcccacc agaccagcct 1080 gaggtccagc tgtccagcat gactatggac gcccgtctca gcgccaagat ggctctccgg 1140 gggaaggccc tgcgcacgca gctggacctg cgcaggttcc gaatctattc caaccattct 1200 gcactggagt cgctggctct gatcccatta caggcccctc tgaagaccat gctgcagatt 1260 ggggtgatgc ccatgctcaa tgagcggacc tggcgtgggg tgcagatccc actacctgag 1320 ggcatcaact ttgtgcatga ggtggtgacg aaccatgcgg gattcctcac catcggggct 1380 gatctccact ttgccaaagg gctgcgagag gtgattgaga agaaccggcc tgctgatgtc 1440 agggcgtcca ctgcccccac accgtccaca gcagctgtct ga 1482 <210> 28 <211> 2022 <212> DNA <213> homo sapiens <400> 28 atggccggga aggcggcaga ggagagaggg ctgccgaaag gggccactcc ccaggatacc 60 tcgggcctcc aggatagatt gttctcctct gaaagtgaca acagcctgta cttcacctac 120 agtggccagc ccaacaccct ggaggtcaga gacctcaact accaggtgga cctggcctct 180 caggtccctt ggtttgagca gctggctcag ttcaagatgc cctggacatc tcccagctgc 240 cagaattctt gtgagctggg catccagaac ctaagcttca aagtgagaag tgggcagatg 300 ctggccatca tagggagctc aggttgtggg agagcctcct tgctagatgt gatcactggc 360 cgaggtcacg gcggcaagat caagtcaggc cagatctgga tcaatgggca gcccagctcg 420 cctcagctgg tgaggaagtg tgtggcccac gtgcgccagc acaaccagct gctccccaac 480 ttgactgtgc gagagacctt ggccttcatt gcccagatgc ggctgcccag aaccttctcc 540 caggcccagc gtgacaaaag ggtggaggac gtgatcgcgg agctgcggct taggcagtgc 600 gctgacaccc gcgtgggcaa catgtacgtg cgggggttgt cggggggtga gcgcaggaga 660 gtcagcattg gggtgcagct cctgtggaac ccaggaatcc ttattctcga cgaacccacc 720 tctgggctcg acagcttcac agcccacaac ctggtgaaga ccttgtccag gctggccaaa 780 ggcaaccggc tggtgctcat ctccctccac cagcctcgct ctgacatctt caggctgttt 840 gatctggtcc tcctgatgac gtctggcacc cccatctact taggggcggc ccagcacatg 900 gtccagtatt tcacagccat cggctacccc tgtcctcgct acagcaatcc tgctgacttc 960 tatgtggacc tgaccagcat tgacaggcgc agcagagagc aggaattggc caccagggag 1020 aaggctcagt cactcgcagc cctgtttcta gaaaaagtgc gtgacttaga tgactttcta 1080 tggaaagcag agacgaagga tcttgacgag gacacctgtg tggaaagcag cgtgacccca 1140 ctagacacca actgcctccc gagtcctacg aagatgcctg gggcggtgca gcagtttacg 1200 acgctgatcc gtcgtcagat ttccaacgac ttccgagacc tgcccaccct cctcatccat 1260 ggggcggagg cctgtctgat gtcaatgacc atcggcttcc tctattttgg ccatgggagc 1320 atccagctct ccttcatgga tacagccgcc ctcttgttca tgatcggtgc tctcatccct 1380 ttcaacgtca ttctggatgt catctccaaa tgttactcag agagggcaat gctttactat 1440 gaactggaag acgggctgta caccactggt ccatatttct ttgccaagat cctcggggag 1500 cttccggagc actgtgccta catcatcatc tacgggatgc ccacctactg gctggccaac 1560 ctgaggccag gcctccagcc cttcctgctg cacttcctgc tggtgtggct ggtggtcttc 1620 tgttgcagga ttatggccct ggccgccgcg gccctgctcc ccaccttcca catggcctcc 1680 ttcttcagca atgccctcta caactccttc tacctcgccg ggggcttcat gataaacttg 1740 agcagcctgt ggacagtgcc cgcgtggatt tccaaagtgt ccttcctgcg gtggtgtttt 1800 gaagggctga tgaagattca gttcagcaga agaacttata aaatgcctct cgggaacctc 1860 accatcgcgg tctcaggaga taaaatcctc agtgtcatgg agctggactc gtaccctctc 1920 tacgccatct acctcatcgt cattggcctc agcggtggct tcatggtcct gtactacgtg 1980 tccttaaggt tcatcaaaca gaaaccaagt caagactggt ga 2022 <210> 29 <211> 7434 <212> DNA <213> homo sapiens <400> 29 atgcttaggg gtccggggcc cgggctgctg ctgctggccg tccagtgcct ggggacagcg 60 gtgccctcca cgggagcctc gaagagcaag aggcaggctc agcaaatggt tcagccccag 120 tccccggtgg ctgtcagtca aagcaagccc ggttgttatg acaatggaaa acactatcag 180 ataaatcaac agtgggagcg gacctaccta ggcaatgcgt tggtttgtac ttgttatgga 240 ggaagccgag gttttaactg cgagagtaaa cctgaagctg aagagacttg ctttgacaag 300 tacactggga acacttaccg agtgggtgac acttatgagc gtcctaaaga ctccatgatc 360 tgggactgta cctgcatcgg ggctgggcga gggagaataa gctgtaccat cgcaaaccgc 420 tgccatgaag ggggtcagtc ctacaagatt ggtgacacct ggaggagacc acatgagact 480 ggtggttaca tgttagagtg tgtgtgtctt ggtaatggaa aaggagaatg gacctgcaag 540 cccatagctg agaagtgttt tgatcatgct gctgggactt cctatgtggt cggagaaacg 600 tgggagaagc cctaccaagg ctggatgatg gtagattgta cttgcctggg agaaggcagc 660 ggacgcatca cttgcacttc tagaaataga tgcaacgatc aggacacaag gacatcctat 720 agaattggag acacctggag caagaaggat aatcgaggaa acctgctcca gtgcatctgc 780 acaggcaacg gccgaggaga gtggaagtgt gagaggcaca cctctgtgca gaccacatcg 840 agcggatctg gccccttcac cgatgttcgt gcagctgttt accaaccgca gcctcacccc 900 cagcctcctc cctatggcca ctgtgtcaca gacagtggtg tggtctactc tgtggggatg 960 cagtggctga agacacaagg aaataagcaa atgctttgca cgtgcctggg caacggagtc 1020 agctgccaag agacagctgt aacccagact tacggtggca actcaaatgg agagccatgt 1080 gtcttaccat tcacctacaa tggcaggacg ttctactcct gcaccacaga agggcgacag 1140 gacggacatc tttggtgcag cacaacttcg aattatgagc aggaccagaa atactctttc 1200 tgcacagacc acactgtttt ggttcagact cgaggaggaa attccaatgg tgccttgtgc 1260 cacttcccct tcctatacaa caaccacaat tacactgatt gcacttctga gggcagaaga 1320 gacaacatga agtggtgtgg gaccacacag aactatgatg ccgaccagaa gtttgggttc 1380 tgccccatgg ctgcccacga ggaaatctgc acaaccaatg aaggggtcat gtaccgcatt 1440 ggagatcagt gggataagca gcatgacatg ggtcacatga tgaggtgcac gtgtgttggg 1500 aatggtcgtg gggaatggac atgcattgcc tactcgcagc ttcgagatca gtgcattgtt 1560 gatgacatca cttacaatgt gaacgacaca ttccacaagc gtcatgaaga ggggcacatg 1620 ctgaactgta catgcttcgg tcagggtcgg ggcaggtgga agtgtgatcc cgtcgaccaa 1680 tgccaggatt cagagactgg gacgttttat caaattggag attcatggga gaagtatgtg 1740 catggtgtca gataccagtg ctactgctat ggccgtggca ttggggagtg gcattgccaa 1800 cctttacaga cctatccaag ctcaagtggt cctgtcgaag tatttatcac tgagactccg 1860 agtcagccca actcccaccc catccagtgg aatgcaccac agccatctca catttccaag 1920 tacattctca ggtggagacc taaaaattct gtaggccgtt ggaaggaagc taccatacca 1980 ggccacttaa actcctacac catcaaaggc ctgaagcctg gtgtggtata cgagggccag 2040 ctcatcagca tccagcagta cggccaccaa gaagtgactc gctttgactt caccaccacc 2100 agcaccagca cacctgtgac cagcaacacc gtgacaggag agacgactcc cttttctcct 2160 cttgtggcca cttctgaatc tgtgaccgaa atcacagcca gtagctttgt ggtctcctgg 2220 gtctcagctt ccgacaccgt gtcgggattc cgggtggaat atgagctgag tgaggaggga 2280 gatgagccac agtacctgga tcttccaagc acagccactt ctgtgaacat ccctgacctg 2340 cttcctggcc gaaaatacat tgtaaatgtc tatcagatat ctgaggatgg ggagcagagt 2400 ttgatcctgt ctacttcaca aacaacagcg cctgatgccc ctcctgaccc gactgtggac 2460 caagttgatg acacctcaat tgttgttcgc tggagcagac cccaggctcc catcacaggg 2520 tacagaatag tctattcgcc atcagtagaa ggtagcagca cagaactcaa ccttcctgaa 2580 actgcaaact ccgtcaccct cagtgacttg caacctggtg ttcagtataa catcactatc 2640 tatgctgtgg aagaaaatca agaaagtaca cctgttgtca ttcaacaaga aaccactggc 2700 accccacgct cagatacagt gccctctccc agggacctgc agtttgtgga agtgacagac 2760 gtgaaggtca ccatcatgtg gacaccgcct gagagtgcag tgaccggcta ccgtgtggat 2820 gtgatccccg tcaacctgcc tggcgagcac gggcagaggc tgcccatcag caggaacacc 2880 tttgcagaag tcaccgggct gtcccctggg gtcacctatt acttcaaagt ctttgcagtg 2940 agccatggga gggagagcaa gcctctgact gctcaacaga caaccaaact ggatgctccc 3000 actaacctcc agtttgtcaa tgaaactgat tctactgtcc tggtgagatg gactccacct 3060 cgggcccaga taacaggata ccgactgacc gtgggcctta cccgaagagg acagcccagg 3120 cagtacaatg tgggtccctc tgtctccaag tacccactga ggaatctgca gcctgcatct 3180 gagtacaccg tatccctcgt ggccataaag ggcaaccaag agagccccaa agccactgga 3240 gtctttacca cactgcagcc tgggagctct attccacctt acaacaccga ggtgactgag 3300 accaccattg tgatcacatg gacgcctgct ccaagaattg gttttaagct gggtgtacga 3360 ccaagccagg gaggagaggc accacgagaa gtgacttcag actcaggaag catcgttgtg 3420 tccggcttga ctccaggagt agaatacgtc tacaccatcc aagtcctgag agatggacag 3480 gaaagagatg cgccaattgt aaacaaagtg gtgacaccat tgtctccacc aacaaacttg 3540 catctggagg caaaccctga cactggagtg ctcacagtct cctgggagag gagcaccacc 3600 ccagacatta ctggttatag aattaccaca acccctacaa acggccagca gggaaattct 3660 ttggaagaag tggtccatgc tgatcagagc tcctgcactt ttgataacct gagtcccggc 3720 ctggagtaca atgtcagtgt ttacactgtc aaggatgaca aggaaagtgt ccctatctct 3780 gataccatca tcccagaggt gccccaactc actgacctaa gctttgttga tataaccgat 3840 tcaagcatcg gcctgaggtg gaccccgcta aactcttcca ccattattgg gtaccgcatc 3900 acagtagttg cggcaggaga aggtatccct atttttgaag attttgtgga ctcctcagta 3960 ggatactaca cagtcacagg gctggagccg ggcattgact atgatatcag cgttatcact 4020 ctcattaatg gcggcgagag tgcccctact acactgacac aacaaacggc tgttcctcct 4080 cccactgacc tgcgattcac caacattggt ccagacacca tgcgtgtcac ctgggctcca 4140 cccccatcca ttgatttaac caacttcctg gtgcgttact cacctgtgaa aaatgaggaa 4200 gatgttgcag agttgtcaat ttctccttca gacaatgcag tggtcttaac aaatctcctg 4260 cctggtacag aatatgtagt gagtgtctcc agtgtctacg aacaacatga gagcacacct 4320 cttagaggaa gacagaaaac aggtcttgat tccccaactg gcattgactt ttctgatatt 4380 actgccaact cttttactgt gcactggatt gctcctcgag ccaccatcac tggctacagg 4440 atccgccatc atcccgagca cttcagtggg agacctcgag aagatcgggt gccccactct 4500 cggaattcca tcaccctcac caacctcact ccaggcacag agtatgtggt cagcatcgtt 4560 gctcttaatg gcagagagga aagtccctta ttgattggcc aacaatcaac agtttctgat 4620 gttccgaggg acctggaagt tgttgctgcg acccccacca gcctactgat cagctgggat 4680 gctcctgctg tcacagtgag atattacagg atcacttacg gagagacagg aggaaatagc 4740 cctgtccagg agttcactgt gcctgggagc aagtctacag ctaccatcag cggccttaaa 4800 cctggagttg attataccat cactgtgtat gctgtcactg gccgtggaga cagccccgca 4860 agcagcaagc caatttccat taattaccga acagaaattg acaaaccatc ccagatgcaa 4920 gtgaccgatg ttcaggacaa cagcattagt gtcaagtggc tgccttcaag ttcccctgtt 4980 actggttaca gagtaaccac cactcccaaa aatggaccag gaccaacaaa aactaaaact 5040 gcaggtccag atcaaacaga aatgactatt gaaggcttgc agcccacagt ggagtatgtg 5100 gttagtgtct atgctcagaa tccaagcgga gagagtcagc ctctggttca gactgcagta 5160 accaacattg atcgccctaa aggactggca ttcactgatg tggatgtcga ttccatcaaa 5220 attgcttggg aaagcccaca ggggcaagtt tccaggtaca gggtgaccta ctcgagccct 5280 gaggatggaa tccatgagct attccctgca cctgatggtg aagaagacac tgcagagctg 5340 caaggcctca gaccgggttc tgagtacaca gtcagtgtgg ttgccttgca cgatgatatg 5400 gagagccagc ccctgattgg aacccagtcc acagctattc ctgcaccaac tgacctgaag 5460 ttcactcagg tcacacccac aagcctgagc gcccagtgga caccacccaa tgttcagctc 5520 actggatatc gagtgcgggt gacccccaag gagaagaccg gaccaatgaa agaaatcaac 5580 cttgctcctg acagctcatc cgtggttgta tcaggactta tggtggccac caaatatgaa 5640 gtgagtgtct atgctcttaa ggacactttg acaagcagac cagctcaggg agttgtcacc 5700 actctggaga atgtcagccc accaagaagg gctcgtgtga cagatgctac tgagaccacc 5760 atcaccatta gctggagaac caagactgag acgatcactg gcttccaagt tgatgccgtt 5820 ccagccaatg gccagactcc aatccagaga accatcaagc cagatgtcag aagctacacc 5880 atcacaggtt tacaaccagg cactgactac aagatctacc tgtacacctt gaatgacaat 5940 gctcggagct cccctgtggt catcgacgcc tccactgcca ttgatgcacc atccaacctg 6000 cgtttcctgg ccaccacacc caattccttg ctggtatcat ggcagccgcc acgtgccagg 6060 attaccggct acatcatcaa gtatgagaag cctgggtctc ctcccagaga agtggtccct 6120 cggccccgcc ctggtgtcac agaggctact attactggcc tggaaccggg aaccgaatat 6180 acaatttatg tcattgccct gaagaataat cagaagagcg agcccctgat tggaaggaaa 6240 aagacagacg agcttcccca actggtaacc cttccacacc ccaatcttca tggaccagag 6300 atcttggatg ttccttccac agttcaaaag acccctttcg tcacccaccc tgggtatgac 6360 actggaaatg gtattcagct tcctggcact tctggtcagc aacccagtgt tgggcaacaa 6420 atgatctttg aggaacatgg ttttaggcgg accacaccgc ccacaacggc cacccccata 6480 aggcataggc caagaccata cccgccgaat gtaggtgagg aaatccaaat tggtcacatc 6540 cccagggaag atgtagacta tcacctgtac ccacacggtc cgggactcaa tccaaatgcc 6600 tctacaggac aagaagctct ctctcagaca accatctcat gggccccatt ccaggacact 6660 tctgagtaca tcatttcatg tcatcctgtt ggcactgatg aagaaccctt acagttcagg 6720 gttcctggaa cttctaccag tgccactctg acaggcctca ccagaggtgc cacctacaac 6780 atcatagtgg aggcactgaa agaccagcag aggcataagg ttcgggaaga ggttgttacc 6840 gtgggcaact ctgtcaacga aggcttgaac caacctacgg atgactcgtg ctttgacccc 6900 tacacagttt cccattatgc cgttggagat gagtgggaac gaatgtctga atcaggcttt 6960 aaactgttgt gccagtgctt aggctttgga agtggtcatt tcagatgtga ttcatctaga 7020 tggtgccatg acaatggtgt gaactacaag attggagaga agtgggaccg tcagggagaa 7080 aatggccaga tgatgagctg cacatgtctt gggaacggaa aaggagaatt caagtgtgac 7140 cctcatgagg caacgtgtta tgatgatggg aagacatacc acgtaggaga acagtggcag 7200 aaggaatatc tcggtgccat ttgctcctgc acatgctttg gaggccagcg gggctggcgc 7260 tgtgacaact gccgcagacc tgggggtgaa cccagtcccg aaggcactac tggccagtcc 7320 tacaaccagt attctcagag ataccatcag agaacaaaca ctaatgttaa ttgcccaatt 7380 gagtgcttca tgcctttaga tgtacaggct gacagagaag attcccgaga gtaa 7434

Claims (9)

  1. 서열목록 제1서열의 뉴클레오타이드에서 321번째부터 333번째까지의 염기의 결실을 포함하는 15-100개의 연속 뉴클레오타이드 서열로 구성되는 변이형 뉴클레오타이드 서열에 특이적으로 결합하는 프라이머 또는 프로브를 포함하는 이상지질혈증(dyslipidemia)의 진단용 키트.
  2. 삭제
  3. 제 1 항에 있어서, 상기 키트는 서열목록 제1서열의 뉴클레오타이드에서 2500번째부터 2502번째까지의 염기의 결실 및 2500번째 위치의 C의 삽입을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제2서열의 뉴클레오타이드에서 643번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제6서열의 뉴클레오타이드에서 1018번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제6서열의 뉴클레오타이드에서 1028번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제6서열의 뉴클레오타이드에서 2608번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제7서열의 뉴클레오타이드에서 71번째 염기의 A에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제7서열의 뉴클레오타이드에서 677번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제8서열의 뉴클레오타이드에서 259번째 염기의 G에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제8서열의 뉴클레오타이드에서 1150번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제9서열의 뉴클레오타이드에서 808번째 염기의 A에서 G로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제10서열의 뉴클레오타이드에서 355번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제11서열의 뉴클레오타이드에서 1276번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제11서열의 뉴클레오타이드에서 2765번째 염기의 C에서 G로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제11서열의 뉴클레오타이드에서 3253번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제12서열의 뉴클레오타이드에서 307번째 염기의 T에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제13서열의 뉴클레오타이드에서 1033번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제13서열의 뉴클레오타이드에서 1133번째 염기의 T에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제14서열의 뉴클레오타이드에서 75번째 염기의 G에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제15서열의 뉴클레오타이드에서 926번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제16서열의 뉴클레오타이드에서 220번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제16서열의 뉴클레오타이드에서 857번째 염기의 A에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제17서열의 뉴클레오타이드에서 1055번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제17서열의 뉴클레오타이드에서 1901번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제18서열의 뉴클레오타이드에서 1933번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제19서열의 뉴클레오타이드에서 1169번째 염기의 G에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제20서열의 뉴클레오타이드에서 1744번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제21서열의 뉴클레오타이드에서 6493번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제22서열의 뉴클레오타이드에서 2371번째 염기의 T에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제23서열의 뉴클레오타이드에서 304번째 염기의 C에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제24서열의 뉴클레오타이드에서 46번째 염기의 C에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제25서열의 뉴클레오타이드에서 1321번째 염기의 A에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제26서열의 뉴클레오타이드에서 3775번째 염기의 G에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제27서열의 뉴클레오타이드에서 607번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제28서열의 뉴클레오타이드에서 328번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 및 서열목록 제29서열의 뉴클레오타이드에서 6170번째 염기의 G에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열로 구성된 군으로부터 선택되는 변이형 뉴클레오타이드 서열에 특이적으로 결합하는 프라이머 또는 프로브를 추가적으로 포함하는 이상지질혈증(dyslipidemia)의 진단용 키트.
  4. 제 1 항 또는 제 3 항에 있어서, 상기 변이형 뉴클레오타이드가 검출된 개체는 증가된 이상지질혈증(dyslipidemia) 위험도를 나타내는 것을 특징으로 하는 진단용 키트.
  5. 삭제
  6. 제 1 항 또는 제 3 항에 있어서, 상기 이상지질혈증(dyslipidemia)은 고지혈증(hyperlipidemia)인 것을 특징으로 하는 진단용 키트.
  7. 제 1 항 또는 제 3 항에 있어서, 상기 이상지질혈증(dyslipidemia)은 고콜레스테롤혈증(hypercholesterolemia)인 것을 특징으로 하는 진단용 키트.
  8. 제 7 항에 있어서, 상기 고콜레스테롤혈증은 가족성 고콜레스테롤혈증(Familial hypercholesterolemia)인 것을 특징으로 하는 진단용 키트.
  9. 제 1 항 또는 제 3 항에 있어서, 상기 키트는 아시아인에게 적용되는 것을 특징으로 하는 진단용 키트.
KR1020140182374A 2014-07-08 2014-12-17 가족성 고콜레스테롤혈증과 관련된 신규한 돌연변이 및 그 용도 KR101753884B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020140085109 2014-07-08
KR20140085109 2014-07-08

Publications (2)

Publication Number Publication Date
KR20160006580A KR20160006580A (ko) 2016-01-19
KR101753884B1 true KR101753884B1 (ko) 2017-07-06

Family

ID=55306139

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140182374A KR101753884B1 (ko) 2014-07-08 2014-12-17 가족성 고콜레스테롤혈증과 관련된 신규한 돌연변이 및 그 용도

Country Status (1)

Country Link
KR (1) KR101753884B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080050358A1 (en) 2004-02-17 2008-02-28 Leena Peltonen-Palotie Identification of Snps Associated with Hyperlipidemia, Dyslipidemia and Defective Carbohydrate Metabolism
US20130029330A1 (en) 2009-12-22 2013-01-31 Arabian Gulf University Mutant ldl receptor gene

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080050358A1 (en) 2004-02-17 2008-02-28 Leena Peltonen-Palotie Identification of Snps Associated with Hyperlipidemia, Dyslipidemia and Defective Carbohydrate Metabolism
US20130029330A1 (en) 2009-12-22 2013-01-31 Arabian Gulf University Mutant ldl receptor gene

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Angiology. 2013 May;64(4):287-92
Bull Exp Biol Med. 2013 Jul;155(3):380-3
Clin Chim Acta. 2012 Dec 24;414:146-51
Eur J Intern Med. 2011 Oct;22(5):e55-9

Also Published As

Publication number Publication date
KR20160006580A (ko) 2016-01-19

Similar Documents

Publication Publication Date Title
KR102114412B1 (ko) 위장관췌장 신경내분비 신생물 (GEP-NENs)의 예측 방법
KR101582321B1 (ko) 심장성 부정맥의 위험 관리를 위한 유전적 마커
DK2471954T3 (en) Susceptibility genetic variants associated with cardiovascular diseases
AU2022203184A1 (en) Sequencing controls
US20230203485A1 (en) Methods for modulating mhc-i expression and immunotherapy uses thereof
US20220389519A1 (en) Biomarkers predictive of anti-immune checkpoint response
KR20150090246A (ko) 암을 위한 분자 진단 테스트
KR20110057188A (ko) 바이오마커 프로파일 측정 시스템 및 방법
KR20140044341A (ko) 암에 대한 분자적 진단 검사
US20230105008A1 (en) Methods and compositions for identifying castration resistant neuroendocrine prostate cancer
KR20100017865A (ko) 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 5p12 및 염색체 10q26 상의 유전적 변이
KR20110015409A (ko) 염증성 장 질환에 대한 유전자 발현 마커
KR20160117606A (ko) 항-혈관형성 약물에 대한 반응 및 암의 예후를 예측하기 위한 분자적 진단 시험
KR20140140069A (ko) 전반적 발달장애의 진단 및 치료용 조성물 및 그 진단 및 치료 방법
US20170175193A1 (en) Improved Therapeutic Regimen for Hypertension
CN101103124A (zh) 用于检测原发性动脉高压风险的方法和试剂盒
KR20200081380A (ko) 유전적 조절
KR20170041955A (ko) 근위축성측삭경화증에 대한 진단 마커로서의 돌연변이 유전자 및 이를 이용한 진단방법
WO2001065259A1 (fr) Methode d&#39;examen de maladies allergiques
KR101753884B1 (ko) 가족성 고콜레스테롤혈증과 관련된 신규한 돌연변이 및 그 용도
JPWO2002050269A1 (ja) アレルギー性疾患の検査方法
KR102480128B1 (ko) 면역력 강화 소 African Humped Cattle (AFH) 품종 특이적 단일염기다형성 및 그의 용도
KR102480124B1 (ko) 생식능 강화 소 African Humped Cattle (AFH) 품종 특이적 단일염기다형성 및 그의 용도
CN101622361A (zh) 用于心律不齐的风险管理的遗传标记物
WO2023215913A2 (en) Compositions and methods for the diagnosis and treatment of severe covid 19 and other inflammatory autoimmune disorders

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right