KR101753884B1 - 가족성 고콜레스테롤혈증과 관련된 신규한 돌연변이 및 그 용도 - Google Patents
가족성 고콜레스테롤혈증과 관련된 신규한 돌연변이 및 그 용도 Download PDFInfo
- Publication number
- KR101753884B1 KR101753884B1 KR1020140182374A KR20140182374A KR101753884B1 KR 101753884 B1 KR101753884 B1 KR 101753884B1 KR 1020140182374 A KR1020140182374 A KR 1020140182374A KR 20140182374 A KR20140182374 A KR 20140182374A KR 101753884 B1 KR101753884 B1 KR 101753884B1
- Authority
- KR
- South Korea
- Prior art keywords
- nucleotide
- substitution
- sequence
- seq
- gly
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/115—Aptamers, i.e. nucleic acids binding a target molecule specifically and with high affinity without hybridising therewith ; Nucleic acids binding to non-nucleic acids, e.g. aptamers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/112—Disease subtyping, staging or classification
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/04—Endocrine or metabolic disorders
- G01N2800/044—Hyperlipemia or hypolipemia, e.g. dyslipidaemia, obesity
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Pathology (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 이상지질혈증(dyslipidemia), 보다 구체적으로는 가족성 고콜레스테롤혈증(familial hypercholesterolemia)에 대한 신규한 유전자 마커를 이용한 이상지질혈증의 진단용 키트에 관한 것이다.
본 발명은 유전적 요인으로 인한 질환에 있어서 전장 엑솜 시퀀싱을 토대로 돌연변이 발생여부를 판단하고 신규한 병원성 돌연변이를 동정하는 데에 효율적으로 적용될 수 있다. 본 발명은 유전자 또는 단백질 마커를 사용함으로써 가족성 고콜레스테롤혈증을 비롯한 이상지질혈증의 신뢰도 있는 조기진단 또는 발병 위험성 예측에 유용하게 이용될 수 있다.
본 발명은 유전적 요인으로 인한 질환에 있어서 전장 엑솜 시퀀싱을 토대로 돌연변이 발생여부를 판단하고 신규한 병원성 돌연변이를 동정하는 데에 효율적으로 적용될 수 있다. 본 발명은 유전자 또는 단백질 마커를 사용함으로써 가족성 고콜레스테롤혈증을 비롯한 이상지질혈증의 신뢰도 있는 조기진단 또는 발병 위험성 예측에 유용하게 이용될 수 있다.
Description
본 발명은 LDLR 및 PCSK9 유전자 상의 신규한 병인성 돌연변이를 유전적 마커로 하여 가족성 고콜레스테롤증을 비롯한 다양한 이상지질혈증을 진단하는 방법에 관한 것이다.
가족성 고콜레스테롤혈증(FH)은 대개 LDLR 결합에 영향을 미치는 APOB에서의 돌연변이인 LDLR의 기능소실 돌연변이로 인해 유발되며, PCSK9의 기능획득 돌연변이는 보다 빈도가 낮다. 종래의 분자진단 기술에 의할 때, FH 유발 돌연변이는 피시험 환자의 40%에서만 검출되는 것으로 보고되었으며, 지역에 따라 유병률의 차이는 있으나 이들 40% 환자 중에서LDLR, APOB 및 PCSK9 유전자 내 이형접합성 돌연변이가 각각 >90% <5% 및 <1%의 확률로 포함되어 있다(Austin et al. Am J Epidemiol 2004). FH에 대한 임상적 진단은 혈중 콜레스테롤 수준, 신체검사 및 가족력에 근거하여 이루어진다. 몇몇 연구진이 임상적 진단기준 및 가이드라인을 개발하였음에도 아직 논란이 남아있다(World Health Organization. 1999; Marks et al. Atherosclerosis 2003;National Institute for Health and Clinical Excellence. 2008; Minhas et al. Heart 2009). 특히, 돌연변이를 가지지 않는 환자로 인해 진단에 어려움을 겪고 있다(Humphries. Curr Opin Lipidol 2008).
종래의 분자진단 기술을 통해, FH-유발 돌연변이는 검사 환자들의 40%에서만 검출되었다(Taylor et al. Clin Genet 2010). 따라서, 차세대 시퀀싱(next-generation 시퀀싱)을 비롯하여 FH를 유발하는 추가적인 소수 유전자를 발굴하기 위한 연구가 진행되어 왔다. 지난 몇 년간, 차세대 시퀀싱으로 인하여 종래의 유전학 기법으로는 발견되지 못하던 몇몇 질환-관련 소수 변이체들을 발견할 수 있었다(Musunuru et al. NEJM 2010; Yang et al. NEJM 2013). 분석 및 필터링의 한계에도 불구하고, 이 기술은 멘델 유전질환을 비롯한 multiple conditions에 적용되어 왔다. 아울러, 이 기술이 비용-효율성은 꾸준히 증가하고 있다(Futema et al. J Med Genet 2012).
본 발명자들은 우성 FH를 가지는 한국인 FH 환자군에 대한 전장 엑솜 시퀀싱(whole exome sequencing)을 통해 알려진 유전자 내의 돌연변이의 스펙트럼/빈도에 대한 이해를 제공하고, 이전까지 FH 표현형에서 나타나지 않던 LDL-C 관련 유전자에 대한 종합적인 조사를 수행하고자 하였다.
본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명자들은 이상지질혈증, 보다 구체적으로는 가족성 고콜레스테롤증(FH)에 특이적인 돌연변이를 탐색함으로써 상기 질환에 대한 신뢰도 높은 유전자 진단 방법을 확립하기 위하여 예의 연구노력하였다. 그 결과, FH 환자에 대한 전장 엑솜 시퀀싱이 돌연변이 발생여부 및 돌연변이 다발부위를 확인하는 데 뿐 아니라 신규한 FH 유발 유전자 동정에도 효과적이라는 사실을 확인하고, 이를 통해 이제까지 알려지지 않은 LDLR 및 PCSK9 유전자 상의 신규한 병인성 돌연변이를 발견함으로써, 본 발명을 완성하게 되었다.
따라서 본 발명의 목적은 이상지질혈증(dyslipidemia)의 진단용 키트를 제공하는 데 있다.
본 발명의 다른 목적 및 이점은 하기의 발명의 상세한 설명, 청구범위 및 도면에 의해 보다 명확하게 된다.
본 발명의 일 양태에 따르면, 본 발명은 서열목록 제1서열의 뉴클레오타이드에서 321번째부터 333번째까지의 염기의 결실을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제1서열의 뉴클레오타이드에서 2500번째부터 2502번째까지의 염기의 결실 및 2500번째 위치의 C의 삽입을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 및 서열목록 제2서열의 뉴클레오타이드에서 643번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열로 구성된 군으로부터 선택되는 변이형 뉴클레오타이드 서열에 특이적으로 결합하는 프라이머 또는 프로브를 포함하는 이상지질혈증(dyslipidemia)의 진단용 키트를 제공한다.
본 발명자들은 이상지질혈증, 보다 구체적으로는 가족성 고콜레스테롤증(FH)에 특이적인 돌연변이를 탐색함으로써 상기 질환에 대한 신뢰도 높은 유전자 진단 방법을 확립하기 위하여 예의 연구노력하였다. 그 결과, FH 환자에 대한 전장 엑솜 시퀀싱이 돌연변이 발생여부 및 돌연변이 다발부위를 확인하는 데 뿐 아니라 신규한 FH 유발 유전자 동정에도 효과적이라는 사실을 확인하고, 이를 통해 이제까지 알려지지 않은 LDLR 및 PCSK9 유전자 상의 신규한 병인성 돌연변이를 발견하였다.
본 발명에 따르면, 서열목록 제1서열은 LDLR 유전자의 뉴클레오타이드 서열이며, 서열목록 제2서열은 PCSK9 유전자의 뉴클레오타이드 서열이다.
본 명세서에서 사용되는 용어 “이상지방혈증(dyslipidemia)”은 고지혈증을 포함하는 개념으로, 혈액내의 지방수치 증가로 나타나는 고콜레스테롤혈증, 고중성지방혈증, 낮은 HDL-콜레스테롤혈증 외에도 지단백의 대사이상 등의 문제로 나타나는 비정상적 지질상태를 의미한다. 구체적으로는, 본 발명의 진단키트로 진단하고자 하는 이상지질혈증은 고지혈증(hyperlipidemia)이다.
본 명세서에서 용어 “고지혈증”은 중성 지방과 콜레스테롤 등의 지방대사가 제대로 이루어지지 않아 혈액 중에 지방량이 많아 유발되는 질환을 말한다. 보다 구체적으로 고지혈증이란 혈액내의 중성지방, LDL 콜레스테롤, 인지질 및 유리 지방산 등의 지질 성분이 증가된 상태로 발생빈도가 높은 고콜레스테롤혈증 또는 고중성지방혈증을 포함한다.
구체적으로는, 본 발명의 진단키트로 진단하고자 하는 이상지질혈증은 고콜레스테롤혈증(hypercholesterolemia)이고, 보다 구체적으로는 가족성 고콜레스테롤혈증(Familial hypercholesterolemia)이다. 본 명세서에서 용어 “가족성 고콜레스테롤혈증”은 유전적 요인에 의해 혈중 콜레스테롤 농도가 높아지는 질환을 의미한다.
본 명세서에서, 용어“진단”은 특정 질병 또는 질환에 대한 한 객체의 감수성(susceptibility)을 판정하는 것, 한 객체가 특정 질병 또는 질환을 현재 가지고 있는 지 여부를 판정하는 것, 특정 질병 또는 질환에 걸린 한 객체의 예후(prognosis)를 판정하는 것, 또는 테라메트릭스(therametrics)(예컨대, 치료 효능에 대한 정보를 제공하기 위하여 객체의 상태를 모니터링 하는 것)을 포함한다. 본 발명에 따르면, 본 발명의 돌연변이를 마커로 하여 이의 존재가 상술한 방법을 통해 확인되면 지질과산화물 등의 산화 산물 수준이 높아져 산화 스트레스 관련 질환의 발병 위험도가 높은 것으로 판단된다.
본 명세서에서, 용어“뉴클레오타이드”는 단일가닥 또는 이중가닥 형태로 존재하는 디옥시리보뉴클레오타이드 또는 리보뉴클레오타이드이며, 다르게 특별하게 언급되어 있지 않은 한 자연의 뉴클레오타이드의 유사체를 포함한다(Scheit, Nucleotide Analogs, John Wiley, New York(1980); Uhlman 및 Peyman, Chemical Reviews, 90:543-584(1990)).
본 명세서에서 사용되는 용어 “프라이머”는 올리고뉴클레오타이드를 의미하는 것으로, 핵산쇄(주형)에 상보적인 프라이머 연장 산물의 합성이 유도되는 조건, 즉, 뉴클레오타이드와 DNA 중합효소와 같은 중합제의 존재, 그리고 적합한 온도와 pH의 조건에서 합성의 개시점으로 작용할 수 있다. 바람직하게는, 프라이머는 디옥시리보뉴클레오타이드이며 단일쇄이다. 본 발명에서 이용되는 프라이머는 자연(naturally occurring) dNMP(즉, dAMP, dGMP, dCMP 및 dTMP), 변형 뉴클레오타이드 또는 비-자연 뉴클레오타이드를 포함할 수 있다. 또한, 프라이머는 리보뉴클레오타이드도 포함할 수 있다.
본 발명의 프라이머는 타겟 핵산에 어닐링 되어 주형-의존성 핵산 중합효소에 의해 타겟 핵산에 상보적인 서열을 형성하는 연장 프라이머(extension primer)일 수 있으며, 이는 고정화 프로브가 어닐링 되어 있는 위치까지 연장되어 프로브가 어닐링 되어 있는 부위를 차지한다.
본 발명에서 이용되는 연장 프라이머는 타겟 핵산의 제1위치에 상보적인 혼성화 뉴클레오타이드 서열을 포함한다. 용어 “상보적”은 소정의 어닐링 또는 혼성화 조건하에서 프라이머 또는 프로브가 타겟 핵산 서열에 선택적으로 혼성화할 정도로 충분히 상보적인 것을 의미하며, 실질적으로 상보적(substantially complementary) 및 완전히 상보적(perfectly complementary)인 것을 모두 포괄하는 의미를 가지며, 바람직하게는 완전히 상보적인 것을 의미한다. 본 명세서에서, 프라이머 서열과 관련하여 사용되는 용어, “실질적으로 상보적인 서열”은 완전히 일치되는 서열뿐만 아니라, 특정 서열에 어닐링하여 프라이머 역할을 할 수 있는 범위 내에서, 비교 대상의 서열과 부분적으로 불일치되는 서열도 포함되는 의미이다.
프라이머는, 중합제의 존재 하에서 연장 산물의 합성을 프라이밍시킬 수 있을 정도로 충분히 길어야 한다. 프라이머의 적합한 길이는 다수의 요소, 예컨대, 온도, 응용분야 및 프라이머의 소스(source)에 따라 결정되지만 전형적으로 15-30 뉴클레오타이드이다. 짧은 프라이머 분자는 주형과 충분히 안정된 혼성 복합체를 형성하기 위하여 일반적으로 보다 낮은 온도를 요구한다. 용어 “어닐링” 또는 “프라이밍”은 주형 핵산에 올리고디옥시뉴클레오타이드 또는 핵산이 병치(apposition)되는 것을 의미하며, 상기 병치는 중합효소가 뉴클레오타이드를 중합시켜 주형 핵산 또는 그의 일부분에 상보적인 핵산 분자를 형성하게 한다.
프라이머의 서열은 주형의 일부 서열과 완전하게 상보적인 서열을 가질 필요는 없으며, 주형과 혼성화 되어 프라이머 고유의 작용을 할 수 있는 범위 내에서의 충분한 상보성을 가지면 충분하다. 따라서 본 발명에서의 프라이머는 주형인 상술한 뉴클레오티드 서열에 완벽하게 상보적인 서열을 가질 필요는 없으며, 이 유전자 서열에 혼성화되어 프라이머 작용을 할 수 있는 범위 내에서 충분한 상보성을 가지면 충분하다. 이러한 프라이머의 디자인은 상술한 뉴클레오티드 서열을 참조하여 당업자에 의해 용이하게 실시할 수 있으며, 예컨대, 프라이머 디자인용 프로그램(예: PRIMER 3 프로그램)을 이용하여 할 수 있다.
본 명세서에서, 용어 “핵산 분자”는 DNA(gDNA 및 cDNA) 그리고 RNA 분자를 포괄적으로 포함하는 의미를 갖으며, 핵산 분자에서 기본 구성 단위인 뉴클레오타이드는 자연의 뉴클레오타이드뿐만 아니라, 당 또는 염기 부위가 변형된 유사체 (analogue)도 포함한다(Scheit, Nucleotide Analogs, John Wiley, New York(1980); Uhlman 및 Peyman, Chemical Reviews, 90:543-584(1990)).
본 발명의 키트에서 출발물질이 gDNA인 경우, gDNA의 분리는 당업계에 공지된 통상의 방법에 따라 실시될 수 있다(참조: Rogers & Bendich (1994)).
출발물질이 mRNA인 경우에는, 당업계에 공지된 통상의 방법에 총 RNA를 분리하여 실시된다(참조: Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001); Tesniere, C. et al., Plant Mol. Biol. Rep., 9:242(1991); Ausubel, F.M. et al., Current Protocols in Molecular Biology, John Willey & Sons(1987); 및 Chomczynski, P. et al., Anal. Biochem. 162:156(1987)). 분리된 총 RNA는 역전사효소를 이용하여 cDNA로 합성된다. 상기 총 RNA는 인간(예컨대, 비만 또는 당뇨 환자)으로부터 분리된 것이기 때문에, mRNA의 말단에는 폴리-A 테일을 갖고 있으며, 이러한 서열 특성을 이용한 올리고 dT 프라이머 및 역전사 효소를 이용하여 cDNA을 용이하게 합성할 수 있다(참조: PNAS USA, 85:8998(1988); Libert F, et al., Science, 244:569(1989); 및 Sambrook, J. et al., Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001)).
본 발명의 키트에 있어서, 상기 특정 서열을 규명하는 것은 당업계에 공지된 다양한 방법을 응용하여 실시될 수 있다. 예를 들어, 본 발명에 응용될 수 있는 기술은, 형광 인 시투 혼성화 (FISH), 직접적 DNA 서열결정, PFGE 분석, 서던 블롯 분석, 단일-가닥 컨퍼메이션 분석(SSCA, Orita et al., PNAS, USA 86:2776(1989)), RNase 보호 분석(Finkelstein et al., Genomics, 7:167(1990)), 닷트 블롯 분석, 변성 구배 젤 전기영동(DGGE, Wartell et al., Nucl.Acids Res., 18:2699(1990)), 뉴클레오타이드 미스매치를 인식하는 단백질(예: E. coli의 mutS 단백질)을 이용하는 방법(Modrich, Ann. Rev. Genet., 25:229-253(1991)) 및 대립형-특이 PCR을 포함하나, 이에 한정되는 것은 아니다.
서열변화가 단일-가닥 분자내 염기 결합의 차이를 초래하여, 이동성이 다른 밴드를 출현하게 하는 데, SSCA는 이 밴드를 검출한다. DGGE 분석은 변성 구배 젤을 이용하여, 야생형 서열과 다른 이동성을 나타내는 서열을 검출한다.
다른 기술들은 일반적으로 본 발명의 돌연변이를 포함하는 서열에 상보적인 프로브 또는 프라이머를 이용한다.
예를 들어, RNase 보호 분석에서, 본 발명의 돌연변이를 포함하는 서열에 상보적인 리보프로브가 이용된다. 상기 리보프로브와 인간으로부터 분리한 DNA 또는 mRNA를 혼성화시키고, 이어 미스매치를 검출할 수 있는 RNase A 효소로 절단한다. 만일, 미스매치가 있어 RNase A가 인식을 한 경우에는, 보다 작은 밴드가 관찰된다.
본 발명이 프라이머를 이용한 유전자 증폭 방식으로 실시되는 경우, 당업계에 보고된 다양한 증폭 반응을 통해 실시될 수 있으며, 이는 중합효소 연쇄반응(PCR)(미국 특허 제4,683,195, 4,683,202 및 4,800,159호), 역전사-중합효소 연쇄반응(RT-PCR)(Sambrook 등, Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001)), Miller, H. I.(WO 89/06700) 및 Davey, C. 등(EP 329,822)의 방법, 리가아제 연쇄 반응(ligase chain reaction; LCR)(17, 18), Gap-LCR(WO 90/01069), 복구 연쇄 반응(repair chain reaction; EP 439,182), 전사-중재 증폭(transcription-mediated amplification; TMA)(19) (WO 88/10315), 자가 유지 염기서열 복제(self sustained sequence replication)(20)(WO 90/06995), 타깃 폴리뉴클레오티드 염기서열의 선택적 증폭(selective amplification of target polynucleotide sequences)(미국 특허 제6,410,276호), 컨센서스 서열 프라이밍 중합효소 연쇄 반응(consensus sequence primed polymerase chain reaction; CP-PCR)(미국 특허 제4,437,975호), 임의적 프라이밍 중합효소 연쇄 반응(arbitrarily primed polymerase chain reaction; AP-PCR)(미국 특허 제5,413,909호 및 제5,861,245호), 핵산 염기서열 기반 증폭(nucleic acid sequence based amplification; NASBA)(미국 특허 제5,130,238호, 제5,409,818호, 제5,554,517호 및 제6,063,603호), 가닥 치환 증폭(strand displacement amplification)(21, 22) 및 고리-중재 항온성 증폭(loop-mediated isothermal amplification; LAMP)(23)를 포함하나, 이에 한정되지는 않는다.
PCR은 가장 잘 알려진 핵산 증폭 방법으로, 그의 많은 변형과 응용들이 개발되어 있다. 예를 들어, PCR의 특이성 또는 민감성을 증진시키기 위해 전통적인 PCR 절차를 변형시켜 터치다운(touchdown) PCR, 핫 스타트(hot start) PCR, 네스티드(nested) PCR 및 부스터(booster) PCR이 개발되었다. 또한, 실시간(real-time) PCR, 분별 디스플레이 PCR(differential display PCR: DD-PCR), cDNA 말단의 신속 증폭(rapid amplification of cDNA ends: RACE), 멀티플렉스 PCR, 인버스 중합효소 연쇄반응(inverse polymerase chain reaction: IPCR), 벡토레트(vectorette) PCR 및 TAIL-PCR(thermal asymmetric interlaced PCR)이 특정한 응용을 위해 개발되었다. PCR에 대한 자세한 내용은 McPherson, M.J. 및 Moller, S.G. PCR. BIOS Scientific Publishers, Springer-Verlag New York Berlin Heidelberg, N.Y. (2000)에 기재되어 있다.
본 발명의 방법을 프라이머를 이용하여 실시하는 경우에는, 유전자 증폭 반응을 실시하여 본 발명의 마커 뉴클레오티드 서열을 분석하여 진단한다.
혼성화 시그널을 이용하는 분석에서, 본 발명의 돌연변이를 포함하는 서열에 상보적인 프로브가 이용된다. 이러한 기술에서, 프로브와 타깃 서열의 혼성화 시그널을 검출하여 직접적으로 질환의 위험도를 결정한다.
본 명세서에서, 용어 “프로브”는 특정 뉴클레오타이드 서열에 혼성화될 수 있는 디옥시리보뉴클레오타이드 및 리보뉴클레오타이드를 포함하는 자연 또는 변형되는 모노머 또는 결합을 갖는 선형의 올리고머를 의미한다. 바람직하게는, 프로브는 혼성화에서의 최대 효율을 위하여 단일가닥이다. 프로브는 바람직하게는 디옥시리보뉴클레오타이드이다.
본 발명에 이용되는 프로브로서, 상기 돌연변이를 포함하는 서열에 완전하게(perfectly) 상보적인 서열이 이용될 수 있으나, 특이적 혼성화를 방해하지 않는 범위 내에서 실질적으로(substantially) 상보적인 서열이 이용될 수도 있다. 바람직하게는, 본 발명에 이용되는 프로브는 본 발명의 SNP를 포함하는 10-30개의 연속 뉴클레오타이드 잔기를 포함하는 서열에 혼성화될 수 있는 서열을 포함한다. 보다 바람직하게는, 상기 프로브의 3’-말단 또는 5’-말단은 상기 SNP 염기에 상보적인 염기를 갖는다. 일반적으로, 혼성화에 의해 형성되는 듀플렉스(duplex)의 안정성은 말단의 서열의 일치에 의해 결정되는 경향이 있기 때문에, 3’-말단 또는 5’-말단에 SNP 염기에 상보적인 염기를 갖는 프로브에서 말단 부분이 혼성화되지 않으면, 이러한 듀플렉스는 엄격한 조건에서 해체될 수 있다.
혼성화에 적합한 조건은 Joseph Sambrook, et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001) 및 Haymes, B. D., et al., Nucleic Acid Hybridization, A Practical Approach, IRL Press, Washington, D.C. (1985)에 개시된 사항을 참조하여 결정할 수 있다. 혼성화에 이용되는 엄격한 조건(stringent condition)은 온도, 이온세기(완충액 농도) 및 유기 용매와 같은 화합물의 존재 등을 조절하여 결정될 수 있다. 이러한 엄격한 조건은 혼성화되는 서열에 의존하여 다르게 결정될 수 있다.
본 발명의 또 다른 양태에 따르면, 본 발명은 서열목록 제3서열 내지 제5서열의 아미노산 서열로 구성된 군으로부터 선택되는 변이형 아미노산 서열에 특이적으로 결합하는 항체 또는 앱타머를 포함하는 이상지질혈증(dyslipidemia)의 진단용 키트를 제공한다.
본 발명에 따르면, 서열목록 제3서열 내지 제5서열의 아미노산 서열은 본 발명자들에 의해 발견된 상술한 변이 뉴클레오타이드들이 각각 인코딩하는 변이 단백질의 아미노산 서열이다. 본 발명에 의해 새롭게 발견된 LDLR 및 PCSK9 유전자의 뉴클레오타이드 상의 돌연변이는 야생형(wild-type) LDLR 및 PCSK9 단백질의 아미노산 서열에도 변이를 일으킨다. 따라서, 본 발명의 키트는 본 발명의 돌연변이 뉴클레오타이드가 인코딩하는 변이 단백질을 항원-항체 반응을 이용한 면역분석(immunoassay) 방법에 따라 검출하여 이상지질혈증 관련 질환을 진단하는 데 이용될 수 있다.
이러한 면역분석은 종래에 개발된 다양한 면역분석(immunoassay) 또는 면역염색(immunostaining) 프로토콜에 따라 실시될 수 있다. 예를 들어, 본 발명의 방법이 방사능면역분석 방법에 따라 실시되는 경우, 방사능동위원소(예컨대, C14, I125, P32 및 S35)로 레이블링된 항체가 변이 Lp-PLA2 단백질을 검출하는 데 이용될 수 있다.
본 발명에서 이용되는 변이 단백질에 대한 항체는 폴리클로날 또는 모노클로날 항체이며, 바람직하게는 모노클로날 항체이다.
변이 단백질에 대한 항체는 당업계에서 통상적으로 실시되는 방법들, 예를 들어, 융합 방법(Kohler and Milstein, European Journal of Immunology, 6:511-519(1976)), 재조합 DNA 방법(미국 특허 제4,816,567호) 또는 파아지 항체 라이브러리 방법(Clackson et al, Nature, 352:624-628(1991) 및 Marks et al, J. Mol. Biol., 222:58, 1-597(1991))에 의해 제조될 수 있다. 항체 제조에 대한 일반적인 과정은 Harlow, E. and Lane, D., Using Antibodies: A Laboratory Manual, Cold Spring Harbor Press, New York, 1999; Zola, H., Monoclonal Antibodies: A Manual of Techniques, CRC Press, Inc., Boca Raton, Florida, 1984; 및 Coligan , CURRENT PROTOCOLS IN IMMUNOLOGY, Wiley/Greene, NY, 1991에 상세하게 기재되어 있다. 예를 들어, 단일클론 항체를 생산하는 하이브리도마 세포의 제조는 불사멸화 세포주를 항체-생산 림프구와 융합시켜 이루어지며, 이 과정에 필요한 기술은 당업자에게 잘 알려져 있으며 용이하게 실시할 수 있다. 폴리클로날 항체는 상술한 변이 단백질 항원을 적합한 동물에게 주사하고, 이 동물로부터 항혈청을 수집한 다음, 공지의 친화성(affinity) 기술을 이용하여 항혈청으로부터 항체를 분리하여 얻을 수 있다.
상술한 면역분석 과정에 의한 최종적인 시그널의 세기를 분석함으로써, 산화 스트레스 관련 질환을 진단할 수 있다. 즉, 인간의 시료에서 변이 단백질에 대한 시그널이 정상 시료 보다 강하게 나오는 경우에는 산화 스트레스 관련 질환의 위험도가 높은 것으로 진단된다.
본 발명의 키트는 항체 대신에 변이 상술한 변이 LDLR 및 PCSK9 단백질에 특이적으로 결합하는 앱타머를 이용할 수 있다. 본 명세서에서 용어“앱타머”는 단일 줄기의(single-stranded) 핵산(RNA 또는 DNA) 분자 또는 펩타이드 분자로서 특정 표적물질에 높은 친화력과 특이성으로 결합하여 작용을 나타내는 것을 의미한다. 앱타머의 일반적인 내용은 Bock LC et al., Nature 355(6360):5646(1992); Hoppe-Seyler F, Butz K "Peptide aptamers: powerful new tools for molecular medicine". J Mol Med. 78(8):42630(2000); Cohen BA, Colas P, Brent R . "An artificial cell-cycle inhibitor isolated from a combinatorial library". Proc Natl Acad Sci USA. 95(24):142727(1998)에 상세하게 개시되어 있다.
본 발명의 또 다른 양태에 따르면, 본 발명은 서열목록 제6서열의 뉴클레오타이드에서 1018번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제6서열의 뉴클레오타이드에서 1028번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제6서열의 뉴클레오타이드에서 2608번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제7서열의 뉴클레오타이드에서 71번째 염기의 A에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제7서열의 뉴클레오타이드에서 677번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제8서열의 뉴클레오타이드에서 259번째 염기의 G에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제8서열의 뉴클레오타이드에서 1150번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제9서열의 뉴클레오타이드에서 808번째 염기의 A에서 G로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제10서열의 뉴클레오타이드에서 355번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제11서열의 뉴클레오타이드에서 1276번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제11서열의 뉴클레오타이드에서 2765번째 염기의 C에서 G로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제11서열의 뉴클레오타이드에서 3253번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제12서열의 뉴클레오타이드에서 307번째 염기의 T에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제13서열의 뉴클레오타이드에서 1033번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제13서열의 뉴클레오타이드에서 1133번째 염기의 T에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제14서열의 뉴클레오타이드에서 75번째 염기의 G에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제15서열의 뉴클레오타이드에서 926번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제16서열의 뉴클레오타이드에서 220번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제16서열의 뉴클레오타이드에서 857번째 염기의 A에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제17서열의 뉴클레오타이드에서 1055번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제17서열의 뉴클레오타이드에서 1901번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제18서열의 뉴클레오타이드에서 1933번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제19서열의 뉴클레오타이드에서 1169번째 염기의 G에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제20서열의 뉴클레오타이드에서 1744번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제21서열의 뉴클레오타이드에서 6493번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제22서열의 뉴클레오타이드에서 2371번째 염기의 T에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제23서열의 뉴클레오타이드에서 304번째 염기의 C에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제24서열의 뉴클레오타이드에서 46번째 염기의 C에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제25서열의 뉴클레오타이드에서 1321번째 염기의 A에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제26서열의 뉴클레오타이드에서 3775번째 염기의 G에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제27서열의 뉴클레오타이드에서 607번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제28서열의 뉴클레오타이드에서 328번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 및 서열목록 제29서열의 뉴클레오타이드에서 6170번째 염기의 G에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열로 구성된 군으로부터 선택되는 변이형 뉴클레오타이드 서열에 특이적으로 결합하는 프라이머 또는 프로브를 포함하는 이상지질혈증(dyslipidemia)의 진단용 키트를 제공한다.
본 발명에 따르면, 본 발명자들은 상술한 LDLR 및 PCSK9 유전자 상의 신규한 병인성 돌연변이 외에도, 유전자 크기-조정 결합순위, GWAS, 경로 데이터베이스 및 LDLR의 PPI(protein-protein interaction) 네트워크로부터의 매핑을 통해 FH를 유발하는 다양한 유전자 상의 돌연변이를 탐색해냈다. 하기의 실시예에서 보는 바와 같이, 이들 중 상기에서 나열한 29개 유전자 상의 34개 돌연변이는 Polyphen-2 및 SIFT 예측 모두에서 FH를 유발하는 유해 돌연변이로 판명됨으로써, FH의 유전적 위험을 판단할 수 있는 신뢰도 있는 유전자 마커임이 확인되었다.
본 발명의 구체적인 구현예에 따르면, 본 발명의 진단대상 개체 중 상술한 기 변이형 뉴클레오타이드 또는 변이형 아미노산가 검출된 개체는 증가된 이상지질혈증(dyslipidemia) 위험도를 나타낸다.
본 발명의 구체적인 구현예에 따르면, 본 발명의 키트는 아시아인에게 적용된다.
본 명세서에서 용어“아시아”는 한국, 중국 및 일본 등을 비롯한 몽골계 인종이 거주하는 극동 지역을 의미한다. “아시아인”이란 조상이 아시아인인 개체군을 의미하며, 바람직하게는 적어도 10대 이상의 조상이 아시아인인 개체군을 의미한다. 보다 구체적으로는, 본 발명의 아시아인은 한국인이다.
본 발명의 특징 및 이점을 요약하면 다음과 같다:
(a) 본 발명은 이상지질혈증(dyslipidemia)의 진단용 키트를 제공한다.
(b) 본 발명은 유전적 요인으로 인한 질환에 있어서 전장 엑솜 시퀀싱을 토대로 돌연변이 발생여부를 판단하고 신규한 병원성 돌연변이를 동정하는 데에 효율적으로 적용될 수 있다.
(c) 본 발명은 유전자 또는 단백질 마커를 사용함으로써 가족성 고콜레스테롤증을 비롯한 이상지질혈증의 신뢰도 있는 조기진단 또는 발병 위험성 예측에 유용하게 이용될 수 있다.
도 1은 FH에 대한 엑솜 시퀀싱 과정의 워크 플로우를 나타내는 그림으로, 3개의 유전자 내에 존재하는 FH 유발 변이를 동정하기 위한 과정을 보여준다. 이어서, 수득한 전장 엑솜 시퀀싱 데이터에 대해 유전학적 분석을 수행하여 FH를 유발하는 후보 유전자를 동정한다. a3명 이상의 FH 환자가 생어 시퀀싱으로 스크리닝되어 LDLR 유전자 내에 p.P685L를 가지는 것으로 확인됨. b필터링 및 통계분석의 품질관리 전략은 도 5에 설명.
도 2는 LDLR p.D834Rfs/- 돌연변이를 가지는 환자의 가계도 분석결과를 나타낸 그림이다. 도 2a는 P05 가계의 단순화된 가계도를 보여준다. 오른쪽 상단의 화살표는 프로밴드를 나타내며, 사각형과 원형은 각각 남성 및 여성을 나타낸다. 흰색 도형은 질환을 가지지 않은 개체를, 검은색 도형은 질환을 가진 개체를 의미한다. 별표는 임상 검사 및 분자적 분석을 거친 가족 구성원을 나타낸다. 도 2b는 임상 검사 데이터 및 시퀀싱 크로마토그램을 보여준다. 수직 화살표는 돌연변이 부위를 나타낸다. 도 2c는 p.D834Rfs/-의 IGV(Integrative Genomics Viewer) 스크린샷을 나타내며, cis-부위에서 단일염기 치환(G>C) 및 fs-결실(AT/-)이 발생했음을 알 수 있다.
도 3은 LDLR 유전자에서의 복제수 변이(CNV) 검출결과를 보여주는 그림이다. SVD-ZRPKM 값을 이용하여 CNV를 검출하였으며, SVD-ZRPKM 값은 모든 분석된 엑솜들의 평균 및 표준편차 값에 근거하여 RPKM(Reads per kilobase per million) 값을 표준화된 z-점수(ZRPKM 값)으로 변환함으로써 계산하였다. 도 3a는 LDLR 유전자의 많은 복제수 결실을 가지는 P25 환자의 SVD-ZRPKM 부분 플롯을 보여준다. 도 3b는 유전적 카피수 결실을 가지는 P25 환자 및 그의 가족(P17-F01)들의 SVD-ZRPKM 부분 플롯을 보여준다. 녹색과 파란색은 각각 P17 and P17-F01의 SVD-ZRPKM 값을 나타낸다. 각 값들은 P17에 기반하여 플롯팅하였다. 도 3c는 CNV를 가지는 P17 환자의 가계도를 보여주는 그림이다. 오른쪽 상단의 화살표는 프로밴드를 나타내며, 사각형과 원형은 각각 남성 및 여성을 나타낸다. 흰색 도형은 질환을 가지지 않은 개체를, 검은색 도형은 질환을 가진 개체를 의미한다. 별표는 임상 검사 및 분자적 분석을 거친 가족 구성원을 나타낸다. 도 3d는 P25, P17 및 P17 가족 구성원에 대한 TaqMan복제수 분석결과를 보여주는 그림이다.
도 4는 크기-조정 결합-순위 및 SKAT-O를 이용하여 유의한 유전자들에 대한 사후 순위를 도출한 결과를 보여준다. 도 4a는 69명의 FH 환자들 및 263명의 대조군에 대해 SKAT-O를 이용하여 도출한 P-값의 맨하탄 플롯을 나타낸다. 붉은 선은 본 발명에서 MAF<0.005를 이용하여 도출한 전장 엑솜 유의성 역치(exome-wide significance threshold)(P=2.69 x10-6, 0.05/18,611 변이)를 보여준다. 플롯을 통해 LDLR 유전자가 가장 유의한 유전자임을 알 수 있으며, MAF<0.01인 변이를 이용한 경우 같은 결과가 나타난다. 도 4b는 SKAT-O(MAF<0.005)를 이용하여 유전학적으로 진단받지 않은 47명의 FH 환자 및 263명의 대조군에 대한 P-값의 맨하탄 플롯을 도출한 결과를 보여준다. SKAT-Op < 6x10-5의 유전자들(플롯 상단의 점선 사각형 내에 포함된 유전자) 중에서, 크기-조정 결합-순위가 500 이내인 14개의 유전자를 하기의 표에 나열하였다. 보다 유의한 P-값(MAF 0.01 또는 0.005)은 SKAT-O의 P-값으로 표시하였다.
도 5는 통계적 분석에 대한 필터링 전략 및 품질관리 절차를 보여준다. 필터 (1) 및 (2)는 유전자 크기-조정 결합-순위 및 SKAT-O 검정을 위해 일반적으로 적용된다. 나아가, 유전자 크기-조정 결합-순위에 대한 필터링 단계(파란 화살표) 및 SKAT-O에 대한 필터링 단계(붉은 화살표)를 각각 나타냈다. 돌연변이 양성 환자들을 필터링하기 전에 LDLR 유전자가 가장 유의한 유전자임을 동정함으로써 각각의 통계적 접근이 유효함을 확인하였다.
도 6은 ATP8A1 변이를 가지는 환자의 가계도 분석결과를 나타낸 그림이다. 도 6a는 P52 가계의 단순화된 가계도를 나타낸다. ATP8A1 내의 p.A1061T 변이는 다른 두 가족구성원도 가지고 있었다. 도 6b는 P14 가계의 단순화된 가계도를 나타낸다. ATP8A1 내의 p.A1061T 변이는 다른 가족구성원에는 없었다. 도 6c는 P54 가계의 단순화된 가계도를 나타낸다. ATP8A1 내의 p.T270A 변이는 질환이 없는 다른 가족구성원 한명에서도 나타났다. 오른쪽 상단의 화살표는 프로밴드를 나타내고, 사각형은 남성을, 원형은 여성을 나타낸다. 흰색 도형은 질환을 가지지 않은 개체를, 검은색 도형은 질환을 가진 개체를 의미한다. 별표는 임상 검사 및 분자적 분석을 거친 가족 구성원을 나타내며, WT는 야생형을 의미한다.
도 2는 LDLR p.D834Rfs/- 돌연변이를 가지는 환자의 가계도 분석결과를 나타낸 그림이다. 도 2a는 P05 가계의 단순화된 가계도를 보여준다. 오른쪽 상단의 화살표는 프로밴드를 나타내며, 사각형과 원형은 각각 남성 및 여성을 나타낸다. 흰색 도형은 질환을 가지지 않은 개체를, 검은색 도형은 질환을 가진 개체를 의미한다. 별표는 임상 검사 및 분자적 분석을 거친 가족 구성원을 나타낸다. 도 2b는 임상 검사 데이터 및 시퀀싱 크로마토그램을 보여준다. 수직 화살표는 돌연변이 부위를 나타낸다. 도 2c는 p.D834Rfs/-의 IGV(Integrative Genomics Viewer) 스크린샷을 나타내며, cis-부위에서 단일염기 치환(G>C) 및 fs-결실(AT/-)이 발생했음을 알 수 있다.
도 3은 LDLR 유전자에서의 복제수 변이(CNV) 검출결과를 보여주는 그림이다. SVD-ZRPKM 값을 이용하여 CNV를 검출하였으며, SVD-ZRPKM 값은 모든 분석된 엑솜들의 평균 및 표준편차 값에 근거하여 RPKM(Reads per kilobase per million) 값을 표준화된 z-점수(ZRPKM 값)으로 변환함으로써 계산하였다. 도 3a는 LDLR 유전자의 많은 복제수 결실을 가지는 P25 환자의 SVD-ZRPKM 부분 플롯을 보여준다. 도 3b는 유전적 카피수 결실을 가지는 P25 환자 및 그의 가족(P17-F01)들의 SVD-ZRPKM 부분 플롯을 보여준다. 녹색과 파란색은 각각 P17 and P17-F01의 SVD-ZRPKM 값을 나타낸다. 각 값들은 P17에 기반하여 플롯팅하였다. 도 3c는 CNV를 가지는 P17 환자의 가계도를 보여주는 그림이다. 오른쪽 상단의 화살표는 프로밴드를 나타내며, 사각형과 원형은 각각 남성 및 여성을 나타낸다. 흰색 도형은 질환을 가지지 않은 개체를, 검은색 도형은 질환을 가진 개체를 의미한다. 별표는 임상 검사 및 분자적 분석을 거친 가족 구성원을 나타낸다. 도 3d는 P25, P17 및 P17 가족 구성원에 대한 TaqMan복제수 분석결과를 보여주는 그림이다.
도 4는 크기-조정 결합-순위 및 SKAT-O를 이용하여 유의한 유전자들에 대한 사후 순위를 도출한 결과를 보여준다. 도 4a는 69명의 FH 환자들 및 263명의 대조군에 대해 SKAT-O를 이용하여 도출한 P-값의 맨하탄 플롯을 나타낸다. 붉은 선은 본 발명에서 MAF<0.005를 이용하여 도출한 전장 엑솜 유의성 역치(exome-wide significance threshold)(P=2.69 x10-6, 0.05/18,611 변이)를 보여준다. 플롯을 통해 LDLR 유전자가 가장 유의한 유전자임을 알 수 있으며, MAF<0.01인 변이를 이용한 경우 같은 결과가 나타난다. 도 4b는 SKAT-O(MAF<0.005)를 이용하여 유전학적으로 진단받지 않은 47명의 FH 환자 및 263명의 대조군에 대한 P-값의 맨하탄 플롯을 도출한 결과를 보여준다. SKAT-Op < 6x10-5의 유전자들(플롯 상단의 점선 사각형 내에 포함된 유전자) 중에서, 크기-조정 결합-순위가 500 이내인 14개의 유전자를 하기의 표에 나열하였다. 보다 유의한 P-값(MAF 0.01 또는 0.005)은 SKAT-O의 P-값으로 표시하였다.
도 5는 통계적 분석에 대한 필터링 전략 및 품질관리 절차를 보여준다. 필터 (1) 및 (2)는 유전자 크기-조정 결합-순위 및 SKAT-O 검정을 위해 일반적으로 적용된다. 나아가, 유전자 크기-조정 결합-순위에 대한 필터링 단계(파란 화살표) 및 SKAT-O에 대한 필터링 단계(붉은 화살표)를 각각 나타냈다. 돌연변이 양성 환자들을 필터링하기 전에 LDLR 유전자가 가장 유의한 유전자임을 동정함으로써 각각의 통계적 접근이 유효함을 확인하였다.
도 6은 ATP8A1 변이를 가지는 환자의 가계도 분석결과를 나타낸 그림이다. 도 6a는 P52 가계의 단순화된 가계도를 나타낸다. ATP8A1 내의 p.A1061T 변이는 다른 두 가족구성원도 가지고 있었다. 도 6b는 P14 가계의 단순화된 가계도를 나타낸다. ATP8A1 내의 p.A1061T 변이는 다른 가족구성원에는 없었다. 도 6c는 P54 가계의 단순화된 가계도를 나타낸다. ATP8A1 내의 p.T270A 변이는 질환이 없는 다른 가족구성원 한명에서도 나타났다. 오른쪽 상단의 화살표는 프로밴드를 나타내고, 사각형은 남성을, 원형은 여성을 나타낸다. 흰색 도형은 질환을 가지지 않은 개체를, 검은색 도형은 질환을 가진 개체를 의미한다. 별표는 임상 검사 및 분자적 분석을 거친 가족 구성원을 나타내며, WT는 야생형을 의미한다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.
실시예
실험방법
환자의 등록
FH 환자 및 이들의 가족을 한국의 9개 지역에서 모집하였고, 실험절차는 각 지역 센터의 의학연구윤리심의위원회(IRB)의 승인을 받았다. Simon Broome 기준(Marks et al, 2003)에 부합하는 환자를 각 지역에서 등록하였다. “명확한 FH”여부의 판단기준은 총 콜레스테롤(TC)이 290 mg/dL 이상이거나 LDL-C가 190 mg/dL 이상이면서 동시에 환자 또는 친지가 건 황색종(tendon xanthomas)을 가지거나; 또는 LDL, APOB 또는 PCSK9 수용체 돌연변이 또는 apo B-100 유전자의 가족성 결실에 대한 유전자적 증거가 있는 경우로 정의하였다. “잠재적인 FH”의 판단기준은 상술한 콜레스테롤 수준을 가지면서 조기 심근경색(premature myocardial infarction)의 가족력 또는 290 mg/dL 이상의 콜레스테롤 농도를 가지는 경우로 정의하였다.
등록 시에 각 환자들은 병력에 대한 면담을 하고 종합적인 신체검사 및 연구실 검사를 받았다. 모든 대상자 또는 이들의 대표자들에게 동의서를 받았으며, 본 발명을 위한 연구는 연세대학교 의과대학 의학연구윤리심의위원회의 승인 하에 실시되었다.
모든 환자의 TC, 중성지방(TG), HDL-C(high-density lipoprotein- cholesterol) 및 LDL-C를 조사하였다. 환자들에게 혈역채취 최소 12시간 전에는 금식하고 음주 및 흡연을 하지 않도록 지시하였다. 시료는 4시간 이내에 대한의학협회에서 공인하는 지역 연구실에서 분석하였다.
건강한 대조군 데이터 세트의 등록
FH가 없는 390명의 건강한 한국인들을 대조군으로 하였다. 본 발명자들은 국립중앙인체자원은행으로부터 95개의 미가공 엑솜 시퀀싱 데이터를 수집하였으며, 나머지 295개의 엑솜 데이터 세트는 본 발명자들에 의해 수득되었다. 모든 대조군 데이터 세트는 FH 환자 엑솜에 대한 동일한 분석 파이프라인 하에서 프로세싱되었다. 이들 대조군 대상자들은 혈장 지질수준에 영향을 미치는 것으로 알려진 여하한 증상도 가지지 않았다.
전장 엑솜 시퀀싱 및 데이터 분석
엑솜 시퀀싱은 Agilent SureSelect Enrichment System를 이용하여 제조사의 설명서에 따라 수행하였다. 수집 시점의 차이로 인하여, 24명의 환자에 대해서는 SureSelect All Exon 50Mb를, 25명의 환자에 대해서는 SureSelect All Exon V4+UTRs 키트를 각각 사용하였다.
|
중앙값 깊이 (X) |
Coverage | |||
중앙값 1X (%) | 중앙값 8X (%) | 중앙값 20X (%) | |||
FH 환자 (n=69) |
SureSelect All Exon 50Mb (n=44) | 49.59 | 95.71 | 88.36 | 75.62 |
SureSelect All Exon V4+UTRs (n=25) | 62.96 | 99.37 | 96.13 | 83.46 | |
건강한 대조군 (n=390) |
SureSelect All Exon 50Mb (n=145) | 60.31 | 92.16 | 84.16 | 74.96 |
Truseq (n=118) | 34.40 | 66.13 | 53.44 | 46.36 | |
SureSelect All Exon V4+UTRs(n=127) | 92.68 | 99.48 | 97.99 | 92.15 |
엑솜 시퀀싱은 각각의 세트에 대한 101-bp 및 150-bp 페어드 엔드(paired end) 시퀀싱을 통해 Illumina HiSeq2000/2500 상에서 실시하였다.
페어드 리드 시퀀싱은 Novoalign(v2.07.18)을 이용하여 기준 유전자인 NCBI Build 37 (hg19)에 대해 매핑하였다. 오배치(misalignment)에 의한 거짓 양성(false positives)을 감소시키기 위하여, Burrows-Wheeler Aligner(BWA, v0.6.2)를 이용한 추가적인 매핑을 시행하였다.
두 개의 독립적인 배치자(aligner)를 통한 보존적 리드 매핑을 이용하여 오배치 경향 사이트의 변이를 필터링하였다. 1차적으로 배치된 리드는 indels(삽입 또는 삭제) 근처로 재배치되어 Genome Analysis Toolkit(v2.3.6)으로 프로세싱하였다. PCR 복제물은 Picard(v1.6.7)를 이용해 제거하였다.
변이 추출(Variant call)은 Unified GATK Genotyper(v2.3.6)를 이용하여 수행하였으며, 8x 범위(coverage) 내에서 추출되었을 경우에만 유지하였다. 단일염기 변이(SNV)에 대한 주석 및 기능에 대한 영향의 예측은 PolyPhen-2(v2.2.2)(Adzhubei et al, 2010, nature method), SIFT(Kumer P et al, 2009, Nat Protoc) 및 ANNOVAR(Wang K et al. 2010. NAR)를 이용하여 수행하였다. 작은 indel은 ANNOVAR를 통해 주석을 달았다. 추가적으로, 종래의 주석 프로그램에 의해 누락도기 쉬운 스플라이싱 사이트 및 프로모터 부위에 대해 전체 변이를 다시 스크리닝하였다.
스플라이싱 사이트 변이에 있어서, 본 발명자들은 UCSC Table Browser로부터 다운로드받은 모든 전사체 이형(isoform)의 엑손의 ±50bp를 스크리닝하였다. 병인성인 것으로 보고된 LDLR, APOB 및 PCSK9 유전자의 프로모터 변이는 공공 데이터베이스(The Human Gene Mutation Database, HGMD:http://www.hgmd.org/)에서 수득하였으며, 알려진 프로모터 변이가 유전학적으로 진단되지 않은 환자에게서 나타나는지 여부를 스크리닝하였다. 마지막으로, SVD(singular value decomposition) 표준화를 이용하는 CoNIFER(Copy Number Inference From Exome Reads) 알고리즘을 통해 시퀀싱된 엑솜 리드로부터 복제수 변화를 추측하였다. 복제수 변이(Copy number variants, CNVs)는 TaqMan Copy Number Assay를 이용하여 확인하였다(표 2).
유전자 | 어세이 ID | 어세이 위치 (NCBI Build 37) |
어세이 사이토밴드 | 어세이 유전자 위치 |
LDLR | Hs07151140_cn | Chr19:11218010 | 19p13.2b | 5번 인트론 내 |
LDLR | Hs07156441_cn | Chr19:11226702 | 19p13.2b | 인트론 10 - 엑손 11에 걸쳐 중첩 |
병인성의 예측 및 돌연변이의 확인
LDLR, APOB 및 PCSK9 유전자의 병인성 돌연변이는 종래 보고된 원인변이를 근거로 분류하였다(LOVD-LDLR:http://www.ucl.ac.uk/ldlr/LOVD v.1.1.0/, LSBD-UMD-LDLR:http://www.umd.be/LDLR/, LOVD2-LDLR: https://grenada.lumc.nl/LOVD2/UCL-Heart/home.php 및 HGMD: http://www.hgmd.org/). LDLR, APOB 및 PCSK9 유전자의 보고되지 않은 변이의 병인성은 1) 아미노산 변화의 유해성, Polyphen-2(Adzhubei et al, 2010, nature method) 및 SIFT (Kumer P et al, 2009, Nat Protoc)에 의해 예측된 진화적 보존성; 2) 263명의 건강한 한국인 대조군 및 공공 데이터베이스(1000 genome, dbSNP135 및 Exome Sequencing Project (ESP)); 및 3) 가족 구성원 내에서 동일한 변이의 공-분리(cosegregation)(가능한 경우)에 기반하여 예측하였다.
마지막으로, 대조군에는 존재하지 않으면서 질환을 가지는 가족 구성원에 존재하는, 알려지지 않은 유해한 기능성 돌연변이는 신규 병인성 돌연변이로 분류하였다. 3개의 유전자에서 알려진 병인성 돌연변이 및 신규 병인성 돌연변이로 분류된 모든 변이는 생어 시퀀싱으로 확인하였다.
초기 순위 및 rho값 측정을 위한 SKAT-O
부하 검사 및 비-부하 검사(SKAT)를 통합하는 SKAT-O(Optimal unified test)를 통해 희소변이의 연관을 조사하였다. 평균 SKAT 및 부하 검사의 비중인 rho(ρ)값은 SKAT-O R-패키지를 이용하여 추정하였다. 추정 ρ가 1일 때, SKAT-O 통계 부하검사 통계에 수렴한다. ρ가 1에 가까울 때, 유전자는 단방향성 효과를 가지는 부하검사에 적합하다. 본 발명자들은 원인 유전자가 동일한 방향에 우세한 효과를 보이는 희소 변이를 가지고 있다고 가정하였기 때문에, post-hoc 순위에서 추정 ρ가 0인 경우 유전자들을 필터링하였다. 이형접합성 콜에 대한 낮은 범위(Low coverage) 필터 및 낮은 AF(allele frequency) 필터를 SKAT-O에 적용하였다(도 5). 알려진 FH 유발 유전자를 69명의 FH 환자 및 390명의 건강한 대조군에서 확인한 뒤, 동일한 필터 및 파라미터를 46명의 유전학적으로 진단되지 않은 환자들의 분석에 적용하였다. 우선 컷오프 유의성은 전장 엑솜 유의성(P=2.69×10-6, 0.05/18,611 변이)이었으나, MAF(minor allele frequency) 1% 또는 0.5%에서 컷오프 유의성을 넘는 유전자(P<0.001)는 유전자-기반 결합 순위에 의한 post-hoc 순위를 위해 남겨두었다.
post-hoc 순위를 위한 유전자 크기-조정 결합순위
SKAT-O에 의해 지시된 유전자의 post-hoc 순위설정을 위하여, 변현된 유전자-기반 결합순위 전략을 사용하였다. 원래의 결합순위 방법은 가중합 통계(weighted-sum statistics) 및 발견적 필터링(heuristic filtering)으로 이루어져있으, 이는 멘델식 형질연구에 있어 성공적인 방법임이 입증되었다(Iuliana Ionita-Laza et al, 2011, AJHG). 그러나, 두 개의 통계결과를 조합하는 결합 순위는 각각의 유전자의 코딩 서열 길이를 고려하지 않아 크기가 큰 유전자가 상위에 잘못 랭크될 수 있다. 코딩 서열 길이가 각 유전자의 돌연변이 빈도값에 미치는 영향을 보정하기 위하여, 본 발명자들은 종래에 보고된 방법대로 희소 기능적 돌연변이의 코딩 엑손 길이에 대한 통계적 유의성을 나타내는 P-값에 의한 추가적인 제3의 순위를 결합하였다. 3가지 서로 다른 방식으로 순위를 결합시키는 방법은“유전자 크기-조정 결합 순위(gene size-adjusted Size Joint-Rank)”로 명명하였다. 오류 양성(false-positive) 변이 콜의 영향을 감소시키기 위하여, 많은 엄격한 필터가 유전적으로 진단되지 않은 환자에게서 검출되는 배타적 변이에 적용되었다(도 5).
유전자 매핑을 위한 관련 유전자 발굴
이전의 분석에 의해 순위가 결정된 유전자들에 대한 체계적인 평가를 위해, LDLR로부터 도출된 GWAS, 경로 데이터베이스(pathway databases) 및 LDLR-유래 단백질-단백질 상호작용 네트워크를 통해 10개의 단백질-단백질 상호작용 네트워크를 통해 11개의 관련 유전자 세트를 수집하였다(표 3-5).
유전자 세트 | 설명(유전자 수) 및 유전자 목록 |
GWAS 유전자 | 종래 14개 GWAS에서 보고되고 매핑된 유전자a(111개) |
ABCG5', 'ABCG8', 'ABO', 'ACAD11', 'ANGPTL3', 'ANKRD31', 'ANXA9', 'APOA1', 'APOA4', 'APOA5', 'APOB', 'APOC1', 'APOC2', 'APOC3', 'APOC4', 'APOE', 'APOH', 'AR', 'ATXN2', 'B3GALT4', 'BRAP', 'BRCA2', 'BSND', 'BUD13', 'C2orf43', 'CBLN3', 'CELSR2', 'CERS2', 'CETP', 'CILP2', 'CMTM6', 'COL11A2', 'CR1L', 'CSNK1G3', 'CSPG3', 'CYP7A1', 'DHX38', 'DNAH11', 'DOCK7', 'DRA', 'EFCAB13', 'EHBP1', 'FADS1', 'FADS2', 'FADS3', 'FAM84B', 'FN1', 'FRK', 'GCKR', 'GMPR', 'GPAM', 'HAVCR1', 'HERPUD1', 'HFE', 'HIST1H4C', 'HLA-DRA', 'HMGCR', 'HNF1A', 'HNF1A-AS1', 'HP', 'HPR', 'HSPE1P1', 'IDOL', 'INSIG2', 'IRF2BP2', 'KIAA0323', 'KLHL29', 'LCN1P2', 'LDLR', 'LDLRAP1', 'LOC84931', 'LPA', 'MAFB', 'MIR148A', 'MOSC1', 'MRPL42P2', 'MTMR3', 'MYLIP', 'NCAN', 'NPC1L1', 'NYNRIN', 'OSBPL7', 'PBX4', 'PCSK9', 'PLEC', 'PP2672', 'PPP1R3B', 'PSRC1', 'RPL12P33', 'RPL15P15', 'RXRB', 'SF4', 'SLC22A1', 'SMARCA4', 'SNX5', 'SORT1', 'SOX17', 'SPTLC3', 'ST3GAL4', 'SUGP1', 'TIMD4', 'TMEM57', 'TNKS', 'TOMM20', 'TOMM40', 'TOP1', 'TRIB1', 'UBXN2B', 'USP24', 'ZNF101', 'ZNF259' | |
GWAS 신호부근 유전자 | 14 GWAS로부터 83개 SNP가 포함된 500kb 내의 유전자b (464개) |
ABCG5', 'ABCG8', 'ABO', 'ACAD11', 'ACADS', 'ACKR4', 'ACPP', 'ADAMTS13', 'ADAMTSL2', 'ADCY4', 'AIRN', 'AMIGO1', 'ANKRD31', 'ANXA9', 'APOA1', 'APOA4', 'APOA5', 'APOB', 'APOC1', 'APOC1P1', 'APOC2', 'APOC3', 'APOC4', 'APOC4-APOC2', 'APOE', 'APOH', 'AR', 'ARHGAP31', 'ARMC6', 'ARNT', 'ASCC2', 'ATIC', 'ATP13A1', 'ATXN1', 'ATXN7L2', 'B3GALT4', 'B4GALT4', 'BANF2', 'BCAM', 'BCL3', 'BEST1', 'BNIPL', 'BRCA2', 'BRD2', 'BSND', 'BUD13', 'C12orf43', 'C19orf38', 'C19orf52', 'C19orf80', 'C1orf177', 'C1orf194', 'C1orf56', 'C2orf16', 'C2orf43', 'C3orf30', 'C9orf96', 'CACFD1', 'CARM1', 'CBLC', 'CBLN3', 'CBX3', 'CCDC121', 'CCDC159', 'CCDC93', 'CD34', 'CD46', 'CDC27', 'CDC42SE1', 'CEACAM16', 'CEACAM19', 'CEL', 'CELP', 'CELSR2', 'CEP112', 'CEP120', 'CERS2', 'CHMP4A', 'CIDEB', 'CILP2', 'CLASRP', 'CLPTM1', 'CMA1', 'CMTM6', 'CMTM7', 'CMTM8', 'CNOT10', 'COL11A2', 'COL4A3BP', 'CR1', 'CR1L', 'CR2', 'CSNK1G3', 'CTSG', 'CTSK', c |
a14 GWAS를 소개하는 문헌 검색을 통해 최근 연구결과가 추가됨 (표 5 참조)
b83개 SNP 내의 500kb 내 부위를 다중 snp의 46 블록에 통합시켰으며, 이 부위는 500-750kb에 걸쳐있다.
c계속: 'CTSS', 'CUTA', 'CYB561D1', 'CYC1', 'DAGLA', 'DAXX', 'DBIL5P2', 'DCPS', 'DDX18', 'DHCR24', 'DHRS1', 'DKFZP434K028', 'DNAH11', 'DNAJC13', 'DNAJC5G', 'DOCK6', 'DYNC1LI1', 'DYNC2LI1', 'EFCAB13', 'EHBP1', 'EIF2B4', 'EPOR', 'EPPK1', 'EXOSC4', 'FADS1', 'FADS2', 'FADS3', 'FAM118B', 'FAM203A', 'FAM63A', 'FAM71B', 'FAM83H', 'FAM83H-AS1', 'FEN1', 'FN1', 'FNDC4', 'FOXRED1', 'FRY', 'FTH1', 'FTH1P3', 'GABPB2', 'GATAD2A', 'GBGT1', 'GCKR', 'GDF7', 'GEMIN7', 'GLI2', 'GMIP', 'GMPR', 'GMPR2', 'GPAA1', 'GPN1', 'GRINA', 'GTF3C2', 'GTF3C5', 'GZMB', 'GZMH', 'HAPLN4', 'HAVCR1', 'HAVCR2', 'HCG25', 'HFE', 'HIST1H1A', 'HIST1H1C', 'HIST1H1D', 'HIST1H1E', 'HIST1H1T', 'HIST1H2AB', 'HIST1H2AC', 'HIST1H2AD', 'HIST1H2AE', 'HIST1H2BB', 'HIST1H2BC', 'HIST1H2BD', 'HIST1H2BE', 'HIST1H2BF', 'HIST1H2BG', 'HIST1H2BH', 'HIST1H2BI', 'HIST1H3A', 'HIST1H3B', 'HIST1H3C', 'HIST1H3D', 'HIST1H3E', 'HIST1H3F', 'HIST1H3G', 'HIST1H4A', 'HIST1H4B', 'HIST1H4C', 'HIST1H4D', 'HIST1H4E', 'HIST1H4F', 'HIST1H4G', 'HIST1H4H', 'HLA-DMA', 'HLA-DMB', 'HLA-DOA', 'HLA-DPA1', 'HLA-DPB1', 'HLA-DPB2', 'HMGCR', 'HNF1A', 'HNF1A-AS1', 'HNRNPA2B1', 'HORMAD2', 'HS1BP3', 'HS1BP3-IT1', 'HSD17B8', 'IFT172', 'IGF2R', 'IGSF11', 'IGSF23', 'INHBB', 'INSIG2', 'IPO4', 'IRF9', 'ISM1', 'ITGB3', 'ITK', 'KANK2', 'KHNYN', 'KIAA1324', 'KIAA1875', 'KIFC1', 'KIRREL3', 'KRTCAP3', 'LDLR', 'LINC00607', 'LINC00663', 'LINC01101', 'LOC100132215', 'LOC100505515', 'LOC100505624', 'LOC100507634', 'LOC101927045', 'LOC101927117', 'LOC101927495', 'LOC101928001', 'LOC101929486', 'LOC101929664', 'LOC102606466', 'LOC102724508', 'LOC102724849', 'LOC148696', 'LOC157273', 'LOC728819', 'LOC729603', 'LPAR2', 'LPPR2', 'LRPPRC', 'LTB4R', 'LTB4R2', 'LYSMD1', 'MAF1', 'MAFB', 'MAPK15', 'MAS1', 'MAU2', 'MDP1', 'MED22', 'MED7', 'MEF2B', 'MEF2BNB', 'MEF2BNB-MEF2B', 'MGME1', 'MINOS1P1', 'MIR148A', 'MIR1908', 'MIR219A1', 'MIR29B2', 'MIR29C', 'MIR4422', 'MIR4531', 'MIR4639', 'MIR4664', 'MIR4700', 'MIR611', 'MIR661', 'MIR6746', 'MIR6818', 'MIR6834', 'MIR6845', 'MIR6846', 'MIR6847', 'MIR6871', 'MIR6873', 'MIR6877', 'MIR6886', 'MIR8085', 'MIR937', 'MLEC', 'MLLT11', 'MPV17', 'MROH1', 'MRPL45P2', 'MTMR3', 'MYBPHL', 'MYL4', 'MYLIP', 'MYRF', 'N4BP2L1', 'N4BP2L2', 'N4BP2L2-IT2', 'NCAN', 'NDUFA13', 'NEDD8', 'NEDD8-MDP1', 'NFATC4', 'NFE2L3', 'NKPD1', 'NOP9', 'NPEPPS', 'NPHP3', 'NPHP3-ACAD11', 'NR2C2AP', 'NRBP1', 'NRBP2', 'NSMCE2', 'NYNRIN', 'OASL', 'OBP2B', 'OPLAH', 'OTX1', 'OVOL2', 'P2RX7', 'PARP10', 'PBX4', 'PCSK9', 'PDS5B', 'PFDN6', 'PHF1', 'PIP5K1A', 'PLCG1', 'PLEC', 'PLEKHH2', 'POGLUT1', 'POLK', 'PPM1G', 'PPP1R2P3', 'PPP1R37', 'PPP1R3B', 'PRKCA', 'PRUNE', 'PSMA5', 'PSRC1', 'PUF60', 'PVR', 'PVRL2', 'RAB3D', 'RAB3IL1', 'RABGGTA', 'RALGDS', 'REC8', 'RELB', 'REXO4', 'RFXANK', 'RGL2', 'RING1', 'RIPK3', 'RNU6-16P', 'RP1', 'RPL7A', 'RPLP0P2', 'RPS18', 'RPUSD4', 'RRBP1', 'RXRB', 'SARS', 'SCARNA2', 'SCNM1', 'SCRIB', 'SDR39U1', 'SEMA6C', 'SETDB1', 'SGCD', 'SHARPIN', 'SIK3', 'SLC17A2', 'SLC17A3', 'SLC22A1', 'SLC22A2', 'SLC22A3', 'SLC25A42', 'SLC2A6', 'SLC39A7', 'SLC4A1AP', 'SMARCA4', 'SNORD17', 'SNORD24', 'SNORD36A', 'SNORD36B', 'SNORD36C', 'SNX17', 'SNX5', 'SORT1', 'SOX17', 'SP4', 'SPATC1', 'SPC24', 'SPPL3', 'SPTLC3', 'SRPR', 'ST3GAL4', 'ST3GAL4-AS1', 'SUGP1', 'SUPT7L', 'SURF1', 'SURF2', 'SURF4', 'SURF6', 'SWSAP1', 'SYNGAP1', 'SYPL2', 'SYT7', 'TAF13', 'TAPBP', 'TGM1', 'THADA', 'TIMD4', 'TINF2', 'TIRAP', 'TM6SF2', 'TM9SF1', 'TMED1', 'TMEM161A', 'TMEM167B', 'TMEM205', 'TMEM258', 'TMEM39A', 'TMEM61', 'TMEM8C', 'TMOD4', 'TNFAIP8L2', 'TNFAIP8L2-SCNM1', 'TNKS', 'TOMM40', 'TOP1', 'TRAPPC6A', 'TRIB1', 'TRIM38', 'TRIM54', 'TSPAN16', 'TSSK4', 'TSSK6', 'TTC22', 'UBA5', 'UCN', 'UNC119B', 'UPK1B', 'UQCR10', 'USP24', 'VPS52', 'VPS72', 'WDPCP', 'WDR46', 'WDR47', 'YIPF2', 'YJEFN3', 'ZAR1L', 'ZBTB22', 'ZHX3', 'ZMAT5', 'ZNF101', 'ZNF14', 'ZNF296', 'ZNF506', 'ZNF512', 'ZNF513', 'ZPR1'
유전자 세트 | 설명(유전자 수) 및 유전자 목록 |
지질대사 | 콜레스테롤 및 지질 경로 (25개) |
ABCA1', 'ABCA2', 'ACAT1', 'ACAT2', 'APOA1', 'APOB', 'APOE', 'CETP', 'CYP46A1', 'GALNT2', 'GCKR', 'HMGCR', 'LCAT', 'LDLR', 'LIPC', 'LIPG', 'LPL', 'LRP1', 'MLXIPL', 'PCSK9', 'PLTP', 'SCARB1', 'SORT1', 'SREBF1', 'SREBF2' | |
클라트린-매개 엔도사이토시스 | 클라트린-매개 엔도사이토시스의 구성요소를 인코딩하는 유전자 (52개) |
'AAK1', 'AGFG1', 'AMPH1', 'AP2A1', 'AP2A2', 'AP2B1', 'AP2M1', 'AP2S1', 'ARRB1', 'ARRB2', 'BIN1', 'CLTA', 'CLTB', 'CLTC', 'CTTN', 'DAB2', 'DNAJC6', 'DNM1', 'DNM2', 'DNM3', 'DYRK1A', 'EPN1', 'EPN2', 'EPS15', 'EPS15R', 'FCHO1', 'FCHO2', 'GAK', 'HIP1', 'HIP1R', 'HSPA8', 'INPPL1', 'ITSN1', 'ITSN2', 'LDLRAP1', 'NECAP1', 'NECAP2', 'NUMB', 'OCRL1', 'PICALM', 'SCYL2', 'SGIP1', 'SH3BP4', 'SH3GL1', 'SH3GL2', 'SH3GL3', 'SNAP91', 'SNX9', 'STON1', 'STON2', 'SYNJ1', 'SYNJ2' | |
엔도사이토시스 | 시스 경로의 구성요소를 코딩하는 유전자(184개) |
'ACAP1', 'ACAP2', 'ACAP3', 'ACVR1B', 'ACVR1C', 'ADRB1', 'ADRB2', 'ADRBK1', 'AGAP1', 'AP2A1', 'AP2B1', 'AP2M1', 'AP2S1', 'ARAP1', 'ARFGAP1', 'ARFGAP2', 'ARRB1', 'ASAP3', 'ADRB3', 'ADRBK2', 'AGAP2', 'AP2A2', 'ARAP2', 'ARF6', 'ASAP2', 'CBLC', 'CCR5', 'CHMP1B', 'CHMP2A', 'CHMP4A', 'CHMP4B', 'CHMP6', 'CLTA', 'CLTC', 'CLTCL1', 'CXCR2', 'CXCR4', 'CBLB', 'CDC42', 'CHMP2B', 'CHMP4C', 'CHMP5', 'CLTB', 'CXCR1', 'DAB2', 'DNAJC6', 'DNM1', 'DNM1L', 'DNM2', 'DNM3', 'EEA1', 'EHD1', 'EPN2', 'EPN3', 'EPS15', 'EGF', 'EHD2', 'EHD4', 'ERBB3', 'ERBB4', 'F2R', 'FGFR2', 'FLT1', 'FAM125B', 'FGFR4', 'GIT1', 'GIT2', 'GRK1', 'GRK4', 'GRK5', 'GRK7', 'HGS', 'HLA-A', 'HLA-B', 'HLA-E', 'HLA-F', 'HLA-G', 'HSPA1A', 'HSPA6', 'HSPA8', 'HSPA1L', 'HSPA2', 'IGF1R', 'IL2RA', 'IQSEC2', 'IQSEC3', 'ITCH', 'IQSEC1', 'KDR', 'KIT', 'LOC652614', 'LDLR', 'MET', 'NEDD4', 'NTRK1', 'NEDD4L', 'PARD6A', 'PARD6G', 'PDCD6IP', 'PIP4K2B', 'PIP5K1A', 'PIP5K1C', 'PLD1', 'PLD2', 'PRKCI', 'PSD3', 'PARD3', 'PARD6B', 'PIKFYVE', 'PIP5K1B', 'PRKCZ', 'PSD2', 'PSD4', 'RAB11B', 'RAB11FIP1', 'RAB11FIP3', 'RAB11FIP5', 'RAB22A', 'RABEP1', 'RET', 'RNF103', 'RAB11A', 'RAB11FIP2', 'RAB11FIP4', 'RNF41', 'SH3GL1', 'SH3GL3', 'SMAP1', 'SMAP2', 'SMURF1', 'SMURF2', 'STAM2', 'STAMBP', 'SH3GLB2', 'SH3KBP1', 'SRC', 'TFRC', 'TRAF6', 'TGFBR2', 'TSG101', 'VPS28', 'VPS36', 'VPS37C', 'VPS37D', 'VPS4B', 'WWP1', 'ZFYVE20', 'ARAP3', 'ARFGAP3', 'ARRB2', 'ASAP1', 'CBL', 'CSF1R', 'EGFR', 'EHD3', 'EPN1', 'FAM125A', 'FGFR3', 'GRK6', 'HRAS', 'IL2RB', 'IL2RG', 'LDLRAP1', 'MDM2', 'PDGFRA', 'PSD', 'RAB31', 'RAB4A', 'RAB5A', 'RAB5B', 'RAB5C', 'RUFY1', 'SH3GL2', 'SH3GLB1', 'SNF8', 'STAM', 'TGFBR1', 'USP8', 'VPS25', 'VPS37A', 'VPS37B', 'VPS45', 'VPS4A', 'VTA1' | |
SREBP 조절 | BioCarta Pathway 데이터베이스에서지질합성의 SREBP 조절에 관여하는 유전자 (8개) |
‘HMGCS1', 'LDLR', 'MBTPS1', 'MBTPS2', 'SCAP', 'SREBF1', 'YY2', 'SREBF2' | |
FXR 및 LXR 조절 | 콜레스테롤 대사의 FXR 및 LXR 를조절하는 유전자( Biocarta Pathway database) (7개) |
‘CYP7A1', 'FABP6', 'HEATR6', 'LDLR, 'NR1H3', 'NR1H4', 'RXRA' | |
지단백질 대사 |
‘지단백질의 대사에 돤여하는 유전자(Reactome database, DB ID: REACT_602)(49개) |
‘A2M', 'ABCA1', 'ABCG1', 'ABCG5', 'ABCG8', 'ABHD5', 'ALB', 'AMN', 'APOA1', 'APOA2', 'APOA4', 'APOA5', 'APOB', 'APOC2', 'APOC3', 'APOE', 'BMP1', 'CAV1', 'CEL', 'CETP', 'CLPS', 'CUBN', 'FABP4', 'HSPG2', 'LCAT', 'LDLR', 'LDLRAP1', 'LIPC', 'LIPE', 'LPA', 'LPL', 'MGLL', 'MTTP', 'NPC1L1', 'P4HB', 'PLIN1', 'PLTP', 'PNLIP', 'PNLIPRP1', 'PNLIPRP2', 'PPP1CA', 'PPP1CB', 'PPP1CC', 'PRKACA', 'PRKACB', 'PRKACG', 'SAR1B', 'SCARB1', 'SDC1' |
유전자 세트 | 설명(유전자 수) 및 유전자 목록 |
직접 상호작용 | LDLR 유전자와 직접 상호작용하는 유전자(네트워크 경로 =LDLR로부터 1)(21개) |
AP1M2', 'APOB', 'APOE', 'CANX', 'CD36', 'CREBBP', 'DAB1', 'DAB2', 'FLT1', 'HSP90B1', 'HSPA5', 'LDLRAP1', 'LRPAP1', 'MAP4', 'MYLIP', 'PCSK9', 'PDIA3', 'PDIA4', 'PF4', 'SNX17', 'UBC' | |
간접 상호작용 | 중간 노드를 통해LDLR 유전자와 간접적으로상호작용하는 유전자 (경로길이= LDLR로부터 2) (821개) |
A2M', 'ABCA1', 'ABCE1', 'ACOT7', 'ACOT9', 'ACTA2', 'ACTB', 'ACTG1', 'ADAM10', 'ADAM17', 'ADRB2', 'ADRBK1', 'ADSS', 'AGER', 'AGRN', 'AHCY', 'AHCYL1', 'AICDA', 'AIMP1', 'AIRE', 'AKT1', 'AKT2', 'ALB', 'ALDH7A1', 'AMFR', 'ANAPC2', 'ANAPC5', 'ANAPC7', 'ANKH', 'AP1G1', 'AP2A1', 'AP2A2', 'AP2B1', 'AP2M1', 'APC', 'APLP1', 'APLP2', 'APOA1', 'APOB', 'APOE', 'APP', 'AR', 'ARFGAP1', 'ARRB1', 'ARRB2', 'ASGR1', 'ASNS', 'ATF1', 'ATF2', 'ATF3', 'ATF4', 'ATG3', 'ATP5A1', 'ATP6V1A', 'ATXN1L', 'ATXN3', 'AURKA', 'AXIN1', 'BACE1', 'BAG3', 'BASP1', 'BCAP31', 'BCAR1', 'BCCIP', 'BCL2L1', 'BCL6', 'BGN', 'BIRC2', 'BLMH', 'BRAF', 'BRCA1', 'BSCL2', 'C14ORF166', 'C19ORF52', 'CALCR', 'CALR', 'CAMK1', 'CAMKMT', 'CAND1', 'CANX', 'CAP1', 'CAPN2', 'CAPNS1', 'CARM1', 'CASP12', 'CASP7', 'CAV1', 'CBL', 'CCNC', 'CCNE1', 'CCNT1', 'CCT2', 'CD1D', 'CD2AP', 'CD3D', 'CD9', 'CDC16', 'CDC20', 'CDC27', 'CDC37', 'CDC37L1', 'CDH1', 'CDH2', 'CDK1', 'CDK2', 'CDK4', 'CDK5', 'CDK8', 'CDK9', 'CDKN1A', 'CEBPB', 'CEBPD', 'CELF2', 'CFTR', 'CHRD', 'CHRNA5', 'CHUK', 'CITED1', 'CITED2', 'CLN5', 'CLNS1A', 'CLTC', 'CLU', 'CNDP2', 'CNPY2', 'CNTN2', 'COG7', 'COL6A1', 'COPS5', 'COPS6', 'CPSF6', 'CPSF7', 'CPT1A', 'CREB1', 'CRK', 'CSE1L', 'CSK', 'CSNK1A1', 'CSNK1E', 'CSNK2A1', 'CSNK2A2', 'CSTF2', 'CTBP1', 'CTNNB1', 'CUL1', 'CUL2', a |
a계속: CUL3', 'CUL4A', 'CUL4B', 'CUL5', 'CUX1', 'CXCL12', 'CXCR3', 'CYP2C18', 'CYP2C8', 'DAB2IP', 'DAK', 'DAXX', 'DCBLD1', 'DCPS', 'DCUN1D1', 'DDX17', 'DDX24', 'DDX5', 'DEK', 'DERL1', 'DGCR8', 'DNAJB9', 'DNAJC10', 'DNAJC19', 'DNMT1', 'DPH1', 'DVL1', 'DVL2', 'DVL3', 'DYRK1A', 'DYRK1B', 'DYRK2', 'DYT10', 'E2F1', 'E2F3', 'EBF1', 'EBI3', 'ECSIT', 'EDEM1', 'EEF2K', 'EFEMP1', 'EGFR', 'EGR1', 'EHD2', 'EID1', 'EIF2AK2', 'EIF2AK3', 'EIF2B1', 'EIF2C4', 'EIF2S1', 'EIF4A1', 'EIF4EBP1', 'ELAVL1', 'ENO2', 'EP300', 'EPAS1', 'EPM2A', 'EPN1', 'EPN2', 'EPS15', 'ERBB2', 'ERBB2IP', 'ERBB3', 'ERLEC1', 'ERN1', 'ERO1L', 'ERO1LB', 'ESR1', 'ESR2', 'ETS1', 'ETS2', 'ETV7', 'EWSR1', 'F8', 'FAF2', 'FAM82A2', 'FAM86A', 'FANCA', 'FANCC', 'FARSA', 'FBXL12', 'FBXO25', 'FBXO6', 'FCHO2', 'FCHSD2', 'FGFR1', 'FGR', 'FMNL1', 'FN1', 'FOS', 'FOSB', 'FOSL1', 'FOXG1', 'FOXM1', 'FOXO1', 'FOXO3', 'FOXO4', 'FXYD7', 'FYCO1', 'FYN', 'GADD45G', 'GANAB', 'GARS', 'GATA1', 'GCDH', 'GCM1', 'GLI3', 'GNB2L1', 'GRB2', 'GRIP1', 'GRK5', 'GSK3B', 'GSS', 'GTF2B', 'GYPC', 'H2AFX', 'HAX1', 'HBP1', 'HBXIP', 'HCK', 'HDAC1', 'HDAC10', 'HDAC2', 'HDAC3', 'HDAC5', 'HDAC6', 'HDGF', 'HES6', 'HIF1A', 'HIPK2', 'HIST1H3A', 'HIST1H4A', 'HIST2H2BE', 'HIST3H3', 'HIST4H4', 'HLA-B', 'HLA-C', 'HMGA1', 'HMGB1', 'HMGB2', 'HMGB3', 'HNF1A', 'HNF4A', 'HNRNPA3', 'HNRNPF', 'HNRNPL', 'HNRNPR', 'HNRNPUL1', 'HNRNPUL2', 'HOXA10', 'HOXA9', 'HOXB2', 'HOXB3', 'HOXB4', 'HOXB6', 'HOXB7', 'HOXB9', 'HOXD10', 'HOXD12', 'HOXD13', 'HOXD4', 'HSD11B1', 'HSP90AA1', 'HSP90AB1', 'HSP90B1', 'HSPA1A', 'HSPA1B', 'HSPA1L', 'HSPA4', 'HSPA5', 'HSPA6', 'HSPA8', 'HSPBP1', 'HSPD1', 'HSPH1', 'HTRA1', 'HTT', 'IARS', 'ID2', 'IFIT3', 'IFIT5', 'IFNAR2', 'IKBKB', 'IKBKG', 'IL7R', 'ILF2', 'ILF3', 'ILK', 'ING1', 'INPP5D', 'INPPL1', 'INSIG2', 'IQCB1', 'IQGAP1', 'IQSEC1', 'IRF1', 'IRF3', 'IRF5', 'IRF7', 'IRF9', 'ISG15', 'ISOC1', 'IST1', 'ITGA2', 'ITGA2B', 'ITGA3', 'ITGA6', 'ITGB1', 'ITGB3', 'ITGB5', 'ITSN1', 'JUN', 'JUNB', 'K8', 'KAT2B', 'KAT5', 'KAT6A', 'KCND3', 'KCNH2', 'KCNQ4', 'KDM1A', 'KDM3B', 'KDM4B', 'KHDRBS1', 'KIAA1468', 'KIAA1598', 'KLC1', 'KLF1', 'KLF13', 'KLF4', 'KLF5', 'KLF8', 'KPNA2', 'KPNA6', 'KPNB1', 'KRT14', 'KRT8', 'L1CAM', 'LAMB1', 'LAMB3', 'LAMC1', 'LAMC2', 'LCAT', 'LCT', 'LDHA', 'LDLR', 'LGALS1', 'LIG4', 'LIPC', 'LMAN1', 'LONP1', 'LOXL2', 'LOXL4', 'LPA', 'LPP', 'LRP1', 'LRP2', 'LRP6', 'LRP8', 'LYN', 'MAF', 'MAFK', 'MALT1', 'MAML1', 'MAP1LC3A', 'MAP3K5', 'MAPK10', 'MAPK13', 'MAPK6', 'MAPK7', 'MAPT', 'MARK4', 'MAST1', 'MATK', 'MCM3', 'MDC1', 'MDM2', 'MECOM', 'MED21', 'MED25', 'MEIS1', 'MEPCE', 'METTL18', 'METTL20', 'METTL21A', 'METTL21B', 'METTL21C', 'METTL22', 'METTL23', 'MFI2', 'MGMT', 'MID1IP1', 'MIER1', 'MKNK1', 'MLL', 'MLLT3', 'MSH2', 'MSH6', 'MSN', 'MST4', 'MSX1', 'MTA2', 'MTAP', 'MTDH', 'MTF1', 'MTNR1A', 'MTOR', 'MTPN', 'MTTP', 'MYB', 'MYBL1', 'MYBL2', 'MYC', 'MYH10', 'MYH9', 'MYL12B', 'MYLIP', 'MYO1E', 'MYO6', 'MYOD1', 'Mapk13', 'N4BP2', 'NAA38', 'NAE1', 'NANS', 'NCK1', 'NCOA1', 'NCOA2', 'NCOA3', 'NCOA6', 'NCOR1', 'NCOR2', 'NDRG1', 'NEDD8', 'NEFM', 'NENF', 'NEUROG1', 'NFATC2', 'NFATC4', 'NFE2', 'NFE2L2', 'NFKB2', 'NFYB', 'NHLRC1', 'NKX2-1', 'NKX3-1', 'NLK', 'NOS2', 'NOS3', 'NPAS2', 'NPAT', 'NPEPPS', 'NPM1', 'NR1I3', 'NR3C1', 'NR5A1', 'NRF1', 'NUP155', 'NUP98', 'OGFOD1', 'ONECUT1', 'OPRD1', 'OS9', 'OXSR1', 'P4HB', 'PAFAH1B1', 'PAFAH1B2', 'PAK1', 'PAK2', 'PAN2', 'PAPOLA', 'PARK2', 'PARP1', 'PAWR', 'PBK', 'PBX1', 'PCMT1', 'PCNA', 'PDCD4', 'PDCD6', 'PDIA3', 'PDIA4', 'PDIA6', 'PELP1', 'PF4', 'PGD', 'PGRMC1', 'PHAX', 'PHKG2', 'PHOX2A', 'PIAS3', 'PIGK', 'PIK3C3', 'PIN1', 'PKD2', 'PLAA', 'PLAGL1', 'PLCG1', 'PLEKHA6', 'PLIN2', 'PLOD1', 'PLTP', 'PLXNA1', 'PML', 'POLA2', 'POLR2A', 'POLR2C', 'POLR2E', 'POLR3H', 'POMP', 'POT1', 'POU1F1', 'PPARG', 'PPARGC1A', 'PPIB', 'PPP1CC', 'PPP1R2', 'PPP4R1', 'PRAM1', 'PRCP', 'PRDX1', 'PRDX2', 'PRDX4', 'PRKAA1', 'PRKACA', 'PRKACB', 'PRKCD', 'PRKCSH', 'PRLR', 'PRNP', 'PROC', 'PROSC', 'PSEN1', 'PSMA3', 'PSMC5', 'PSMD1', 'PSME3', 'PTGIR', 'PTMA', 'PTMS', 'PTOV1', 'PVR', 'PWP1', 'PYCR1', 'PYGO2', 'RAB11A', 'RAB14', 'RAB1A', 'RAB3A', 'RAB3D', 'RAB7A', 'RAC3', 'RAD21', 'RAD23A', 'RAE1', 'RAF1', 'RALA', 'RALGDS', 'RANBP2', 'RAP1GDS1', 'RARA', 'RBBP4', 'RBBP7', 'REL', 'RELA', 'RHEB', 'RICTOR', 'RIOK2', 'RLIM', 'RNF146', 'RNF185', 'RNF32', 'RPA2', 'RPL23', 'RPL4', 'RPL8', 'RPLP1', 'RPN1', 'RPN2', 'RPS16', 'RPS20', 'RPS25', 'RPS3', 'RPS6KA1', 'RPS6KA2', 'RPS6KA3', 'RPS6KA5', 'RPSA', 'RPTOR', 'RTN4', 'RUNX1', 'RUNX2', 'RUVBL1', 'RUVBL2', 'RXRB', 'RXRG', 'SART1', 'SCNN1A', 'SCNN1B', 'SCNN1G', 'SEC23B', 'SEC24B', 'SEC61A1', 'SEC61B', 'SELP', 'SELS', 'SERPINA1', 'SERPINF2', 'SERPINH1', 'SERTAD1', 'SET', 'SETD1A', 'SF3B2', 'SFTPC', 'SH3BP4', 'SH3GL1', 'SH3KBP1', 'SHC1', 'SHCBP1', 'SIAH1', 'SIL1', 'SIRT1', 'SIRT3', 'SIRT7', 'SKIL', 'SLC12A3', 'SLC2A1', 'SLC4A1', 'SLC6A4', 'SLC9A3R1', 'SMAD1', 'SMAD2', 'SMAD3', 'SMARCA2', 'SMARCA4', 'SMARCB1', 'SMARCC1', 'SMARCC2', 'SMS', 'SMURF1', 'SMURF2', 'SND1', 'SNIP1', 'SNRNP70', 'SNRPD1', 'SNTA1', 'SNW1', 'SOCS1', 'SOCS3', 'SORL1', 'SORT1', 'SP1', 'SP3', 'SPG20', 'SPTAN1', 'SPTBN1', 'SRC', 'SRCAP', 'SREBF1', 'SREBF2', 'SRF', 'SRRM2', 'SS18L1', 'SSBP1', 'SSR1', 'ST13', 'STAT1', 'STAT2', 'STAT3', 'STAT6', 'STK24', 'STK25', 'STK3', 'STK4', 'STOML2', 'SUMO1', 'SUMO2', 'SUMO4', 'SURF4', 'SVIP', 'SYVN1', 'TACC2', 'TADA2A', 'TAF6L', 'TAP1', 'TAP2', 'TAPBP', 'TARDBP', 'TATDN1', 'TBCB', 'TBP', 'TBX21', 'TCERG1', 'TCF12', 'TCF3', 'TDG', 'TERF1', 'TERF2', 'TF', 'TFAP2A', 'TG', 'TGFBR1', 'TGFBR2', 'TGS1', 'THBD', 'TLR2', 'TMEM132A', 'TMEM67', 'TOPBP1', 'TOR1A', 'TOR1AIP1', 'TP53', 'TP53RK', 'TP63', 'TP73', 'TPM1', 'TRAF3IP1', 'TRAF6', 'TRAP1', 'TRERF1', 'TRIM28', 'TRIO', 'TRIP4', 'TSHR', 'TUBA4A', 'TUBA4B', 'TUBB4A', 'TUFM', 'TWF2', 'TXNDC11', 'TXNRD1', 'TYRO3', 'UBA5', 'UBASH3B', 'UBC', 'UBD', 'UBE2D1', 'UBE2D2', 'UBE2D3', 'UBE2D4', 'UBE2N', 'UBL4A', 'UBQLN4', 'UBXN1', 'UBXN4', 'UBXN6', 'UCHL5', 'USP21', 'USP25', 'VCAN', 'VCL', 'VCP', 'VDR', 'VHL', 'VIM', 'VLDLR', 'VRK1', 'VWF', 'WDHD1', 'WDR5', 'XRCC6', 'YBX1', 'YES1', 'YIPF3', 'YLPM1', 'YWHAB', 'YWHAE', 'YWHAH', 'YY1', 'ZBTB2', 'ZCCHC12', 'ZNF558', 'ZNF639', 'ZNRF4', 'ZSWIM7'
종래 고 LDL-C와 관련이 있다고 보고된 유전자를 Catalog of Published Genome-Wide Association Studies (http://www.genome.gov/26525384)로부터 수집하였다. 14개 GWAS에서 고LDL-C와 유의하게 연관되었음이 보고된 83개 SNP가 포함된 500kb 내의 유전자를 수집함으로써 확장된 유전자 세트를 구축하였다(표 6).
제1저자 | 제목 | 저널 | 년도 |
Burkhardt R | Common SNPs in HMGCR in micronesians and whites associated with LDL-cholesterol levels affect alternative splicing of exon13. | Arterioscler Thromb Vasc Biol | 2008 |
Kathiresan S | Common variants at 30 loci contribute to polygenic dyslipidemia. | Nat Genet | 2008 |
Sabatti C | Genome-wide association analysis of metabolic traits in a birth cohort from a founder population. | Nat Genet | 2008 |
Wallace C | Genome-wide association study identifies genes for biomarkers of cardiovascular disease: serum urate and dyslipidemia. | Am J Hum Genet | 2008 |
Sandhu MS | LDL-cholesterol concentrations: a genome-wide association study. | Lancet | 2008 |
Aulchenko YS | Loci influencing lipid levels and coronary heart disease risk in 16 European population cohorts. | Nat Genet | 2008 |
Willer CJ | Newly identified loci that influence lipid concentrations and risk of coronary artery disease. | Nat Genet | 2008 |
Kathiresan S | Six new loci associated with blood low-density lipoprotein cholesterol, high-density lipoprotein cholesterol or triglycerides in humans. | Nat Genet | 2008 |
Teslovich TM | Biological, clinical and population relevance of 95 loci for blood lipids. | Nature | 2010 |
Shen H | Familial defective apolipoprotein B-100 and increased low-density lipoprotein cholesterol and coronary artery calcification in the old order amish. | Arch Intern Med | 2010 |
Waterworth DM | Genetic variants influencing circulating lipid levels and risk of coronary artery disease. | Arterioscler Thromb Vasc Biol | 2010 |
Rasmussen-Torvik LJ | High density GWAS for LDL cholesterol in African Americans using electronic medical records reveals a strong protective variant in APOE. | Clin Transl Sci | 2012 |
Global Lipids Genetics Consortium | Discovery and refinement of loci associated with lipid levels. | Nat Genet | 2013 |
Coram MA | Genome-wide characterization of shared and distinct genetic components that influence blood lipid levels in ethnically diverse human populations. | Am J Hum Genet. | 2013 |
콜레스테롤 및 지질 대사경로에 관여한다고 알려진 유전자도 추가되었다(Reynolds CA et al, Hum Mol Genet, 2010). 아울러, 클라트린-매개-엔도사이토시스, 엔도사이토시스, 지질합성의 SREBP 조절, 콜레스테롤 대사에서의 FXR 및 LXR 조절 및 지질과 지단백질 대사에 관여하는 유전자도 관련 유전자로 포함시켰다(KEGG, Kyoto Encyclopedia of Genes and Genomes, Reactome 및 biocarta 데이터베이스). 마지막으로, LDLR 단백질과 상호작용하는 단백질을 코딩하는 유전자를 추가하였다(Genome Network Platform), BioGRID 및 BioGrapgh 데이터베이스). 이 유전자 세트는 코어가 LDLR 단백질인 비방향성 네트워크에서 LDLR 유전자로부터 경로 길이 1인 21개 유전자로 구성되어 있다. 본 발명자들은 추가적으로 LDLR 네트워크를 LDLR로부터의 경로 길이가 2인 유전자로 확장하여 최종적인 유전자 세트를 형성하였다. 세트 점수를 관련 유전자 세트 중 매핑된 세트의 숫자로 정의하였으며, 이를 FH 표현형과의 연관 지표로 사용하였다.
실험결과
대상자들의 임상적 특성
등록된 환자들의 특성은 표 7에 표시하였다. 69명의 환자 중 23명은 LDLR, APOB 또는 PCSK9 유전자 내에 FH와 연관된 병인 돌연변이를 가졌다. 이들은 돌연변이-양성군으로 분류되었으며, 나머지는 돌연변이 음성군으로 분류되었다. 돌연변이-음성 환자와 비교하여, 돌연변이-양성 환자는 남성인 경우가 많았으며 LDL-C 수준이 높았다. 아울러, 돌연변이-양성 환자는 돌연변이 음성 환자에 비하여 연령이 낮은 경향이 있었다. 그러나, 종래의 보고(Futema et al. Atherosclerosis. 2013)와 달리 3가지 FH-유발 돌연변이 검출 비율 및 관상동맥 질환 위험성에는 차이가 없었다.
전체(n=69) | 돌연변이 음성 (n=47) |
돌연변이 양성 (n=23) |
P | ||
나이 | 54 ± 13 | 56 ± 12 | 50 ± 14 | 0.09 | |
여성 | 40 (58) | 31 (67) | 9 (39) | 0.03 | |
병력 | 고혈압 | 33 (48) | 23 (50) | 10 (43) | 0.61 |
당뇨 | 6 (9) | 4 (9) | 2 (9) | 1.00 | |
관상동맥질환 | 25 (36) | 17 (37) | 8 (35) | 0.86 | |
흡연 | 15 (22) | 10 (22) | 5 (22) | 1.00 | |
가족력 | 심근경색 | 38 (55) | 23 (50) | 15 (65) | 0.23 |
총 콜레스테롤 >290 mg/dL |
43 (61) | 26 (57) | 16 (70) | 0.30 | |
FH의 임상적 분류 | 확정(Definite) | 17 (24) | 10 (22) | 7 (30) | 0.43 |
잠재(Possible) | 52 (75) | 36 (78) | 16 (70) | ||
신체조건 | 체질량지수 (kg/m2) | 25.0±3.6 | 25.1±3.5 | 25.0±3.9 | 0.96 |
황색종 | 17 (25) | 12 (26) | 5 (22) | 0.69 | |
실험실값 | 총 콜레스테롤 | 316 ± 48 | 308 ± 50 | 330 ± 43 | 0.08 |
중성지방 | 174 ± 85 | 184 ± 94 | 155 ± 60 | 0.19 | |
HDL-콜레스테롤 | 47.4±11.2 | 48.5±10.9 | 45.2±11.8 | 0.26 | |
LDL-콜레스테롤 | 230 ± 41 | 223 ± 39 | 246 ± 41 | 0.02 |
표시값들은 평균 ± 표준편차 또는 n (%)로 나타내었다. FH: familial hypercholesterolemia; HDL: high-density lipoprotein; LDL: low-density lipoprotein; 돌연변이 음성: 3개의 FH 유전자(LDLR, APOB, PCSK9)에 알려지거나 신규한 병원성 돌연변이가 없는 환자; 돌연변이 양성 : 3개의 FH 유전자(LDLR, APOB 및 PCSK9)에 알려지거나 신규한 병원성 돌연변이를 가지는 환자
알려진 돌연변이의 검출 및 3개의 FH 유전자에서의 확인
전장 엑솜 시퀀싱 분석에 의해, 총 23명의 환자(FH 환자 70명의 37%)가 3개의 FH 유전자에서 병인 돌연변이를 가지는 것으로 밝혀졌다. 종래 보고된 병인 돌연변이에 해당하는 환자는 18명이었다(표 8). 이들 중, 총 15명의 환자가 LDLR 유전자에 병인성 돌연변이를 가지고 있었다. 특히, p.P685L 돌연변이는 2명, p.E228X 또는 p.E228K 돌연변이는 4명이 가지고 있어, 한국 FH 환자에 돌연변이 다발 부위가 존재함을 말해준다. 한명의 환자가 p.R257W 및 p.D589N 돌연변이를 동형접합성 돌연변이로서 보유하고 있었지만, 하나의 이형접합성 돌연변이를 가지는 환자에 비하여 LDL-C 수준은 증가하지 않았다. 두 명의 환자는 APOB 유전자 내에 가장 흔한 원인 변이로 알려진 p.R3527Q 돌연변이를 가졌다(Rader et al. J Clin Invest 2003). 아울러, 환자 1명은 PCSK9 유전자 내에 p.E32K 돌연변이를 가졌다.
유전자 | 유전자 좌표 | 뉴클레오타이드 변화 a | 돌연변이 형태 | 아미노산 변화 | 해당 환자수 (73명환자 내에서의 빈도) | 기준 |
LDLR | chr19:11213417 | c.268G>A | 미스센스 | p.D90N | 1 (0.014) | 1 |
LDLR | chr19:11216000 | c.418G>A | 미스센스 | p.E140K | 1 (0.014) | 2 |
LDLR | chr19:11216101 | c.519C>G | 미스센스 | p.C173W | 1 (0.014) | 3 |
LDLR | chr19:11216243 | c.661G>A | 미스센스 | p.D221N | 1 (0.014) | 4 |
LDLR | chr19:11216264 | c.682G>T | 넌센스 | p.E228X | 3 (0.041) | 2 |
LDLR | chr19:11216264 | c.682G>A | 미스센스 | p.E228K | 1 (0.014) | 5 |
LDLR | chr19:11217315 | c.769C>T | 미스센스 | p.R257W | 1b (0.014) | 6 |
LDLR | chr19:11227594 | c.1765G>A | 미스센스 | p.D589N | 9 | |
LDLR | chr19:11224013 | c.1246C>T | 미스센스 | p.R416W | 1 (0.014) | 1 |
LDLR | chr19:11226885 | c.1702C>G | 미스센스 | p.L568V | 1 (0.014) | 7 |
LDLR | chr19:11231112 | c.2054C>T | 미스센스 | p.P685L | 2c (0.028) | 8 |
LDLR | chr19:11221326 | c.941-2A>G | 스플라이싱, 수용체 사이트(exon6-2nt) | 프레임쉬프트 | 1 (0.014) | 10 |
LDLR | chr19:11222188 | c.1061-2A>G | 스플라이싱, 수용체 사이트(exon7-2nt) | 프레임쉬프트 | 1 (0.014) | 11 |
APOB | chr2:21229160 | c.10580C>T | 미스센스 | p.R3527Q | 2 (0.027) | 12 |
PCSK9 | chr1:55505604 | c.94G>A | 미스센스 | p.E32K | 1 (0.014) | 13 |
a뉴클레오타이드 위치 번호는 LDLR(NM_000527), APOB(NM_000384) 및 PCSK9 (NM_174936) mRNA 서열에 따라 정해졌다. bR257W(homozygote) 및 D589N(homozygote)를 가지는 환자(P49).
cP685L를 가지는 세명의 환자가 스크리닝되었다. 모든 변이는 생어 시퀀싱에 의해 확인되었다.
신규 돌연변이의 발견 및 3개의 FH 유전자에서의 확인
알려진 돌연변이에 더하여, 신규한 기능저해 돌연변이를 3명의 FH 환자에게서 검출하였다. 2개의 새로운 돌연변이가 결실에 희한 프레임 쉬프팅에 의해 LDLR 유전자 기능을 저해하는 것으로 예측되었다(표 9). 두 가지 돌연변이 모두 대조군의 엑솜 데이터 또는 일반적인 데이터베이스에서 나타나지 않았다. 13-nt 결실 돌연변이(c.321_333delGACGTGCTCCCAG)는 미성숙 종결코던을 야기하는 프레임쉬프트 붕괴로 인해 병원성을 가지는 것으로 생각되었다. p.D834Rfs 돌연변이는 cis-위치에서 연속적으로 나타나는 c.2500_2502delGAT 및 c.2500insC 돌연변이가 동시에 발생하였으며, IGV(Integrative Genomics Viewer)를 통해 D834Rfs/- 이형접합성 돌연변이임을 확인하였다(도 2c). LDLR 유전자 내 860개 코딩 부위 중에서 비교적 뒷부분에 존재함에도, p.D834Rfs가 상응하는 가족(P05) 내에서 함께 분리된 원인 변이임을 확인할 수 있었다(도 2a 및 2b). p.R215C 돌연변이는 PCSK9 유전자의 촉매 도메인 루프 부분 내의 진화적으로 보존적인 부위에서 동정되었다(Cunningham D, et al, Nat Struct Mol Biol. 2007). 기능획득 돌연변이가 상기 루프 내에서 확인되었으므로, p.R215C가 기능획득 돌연변이임을 알 수 있었다(PCSK9 mutation ref, Cunningham D, et al, Nat Struct Mol Biol. 2007).
복제수 분석 및 확인
CNV 분석에서, 2명의 환자에게서 새로운 복제수 결실이 검출되었다. CoNIFER 알고리즘을 통해 한명의 환자(P25)에게서 LDLR 유전자의 1번-12번 엑손에 걸친 절편이 소실된 것으로 예상되었다(도 3a). 인트론 5를 검출하는 Taqman 복제수 분석을 통해 대조군의 절반임이 확인되었다(도 3d). LDLR 유전자의 8-12번 엑손에 이르는 또 다른 복제수 결실을 검출하였으며, 이를 Taqman 분석으로 확인하였다(도 3b 및 3d). 흥미롭게도, 복제수의 결실은 다른 질환을 가지는 가족 구성원에서도 함께 분리되었으며, 이를 통해 상기 결실이 해당 가족(P17)의 FH에 대한 원인 변이임을 알 수 있었다(도 3c 및 3d).
유전자 | LDLR | LDLR | PCSK9 | |
좌표 | chr19: 11215902-11215914 |
chr19:11240299 | chr1:55518070 | |
뉴클레오타이드 변화a | c.321_333del -GACGTGCTCCCAG |
c.2500_2502 delGATinsCd |
c.643C>T | |
돌연변이 형태 | 프레임쉬프트-결실 | 프레임쉬프트-결실/삽입 | 미스센스 | |
아미노산 변화 | p.C109Sfsb | p.D834Rfs | p.R215C | |
해당 환자수 (73명환자 내에서의 빈도) |
1 (0.014) | 1 (0.014) | 1 (0.014) | |
병원 성 |
Polyphen-2 예측 (pph2_probability) |
N/Ac | N/A | probably damaging (1) |
SIFT 예측 (점수) |
N/A | N/A | damaging (0.008) |
|
MAF in CTL276 |
0 | 0 | 0 | |
공공 데이터베이스 (1000 genome dbSNP135) |
신규 | 신규 | 신규e | |
ESP 빈도 | 신규 | 신규 | 신규 |
a뉴클레오타이드 위치 번호는 LDLR(NM_000527), APOB(NM_000384) 및 PCSK9 (NM_174936) mRNA 서열에 따라 정해졌다.
b 프레임쉬프트는 4nt 뒤의 결실이 108번째 트레오닌까지의 프레임 쉬프트를 보상하여 코딩 아미노산을 109번째 시스테인부터 변화시켰다.
c Polyphen-2 및 SIFT 알고리즘으로부터 종결 돌연변이 예측을 할 수 없었다
d 2500-2502 뉴클레오타이드(GAT)가 cis-위치의 (C)로 치환되었다.
ePCSK9 유전자(REF) 내 p..R215H (c.644G>A)가 기능획득 돌연변이로 보고되어, p.R215C도 역시 병원성 돌연변이임을 알 수 있다.
모든 변이는 생어 시퀀싱에 의해 확인되었다.
통계 및 순위설정 방법의 검증
부하검사는 일반적인 변이를 가지는 유전자에 대해 유용한 방법이나 비-부하 검사는 복합적인 영향 또는 아무 영향이 없는 변이를 가지는 유전자에게 맞는 방법이다. 따라서, 부하검사로 LDLR가 검출될 것이며 APOB 및 PCSK9가 검출될 것이다. 신규 FH 유전자 내의 변이가 어떤 작용을 할지가 알려지지 않았기 때문에, 본 발명자들은 모든 FH 환자들에 대하여 SKAT-O를 적용하였다. LDLR 유전자는 분석에 있어서 가장 유의한 유전자로 나타났다(MAF=1%에서 p=4.97×10-11, 컷오프 0.5%,ρ=1)(도 4a). 유전자-크기조정 결합순위에 의할 때에도 LDLR는 1위로 랭크되어(표 10), FH에 대한 멘델식 형질연구에서 이러한 방법이 유효함을 보여주었다. 한편, APOB 및 PCSK9는 상대적으로 낮게 랭크되었다. 이는 낮은 변이빈도 및 변이의 복합적인 영향일 수 있다. SKAT-O에 의하여, PCSK9 및 APOB는 통계적으로 유의성이 없었으며(각각 MAF=0.5%에서 P=0.019 및 0. 540, ρ=0.2 및 0), 이를 통해 낮은 순위의 유전자는 명백한 기능 및 생화학적 타당성 또는 통계적 유의성이 있는 경우 원인 유전자로 간주될 필요성이 있음을 알 수 있다.
본 발명자들은 유전자 세트를 체계적으로 발굴하고 유전자들이 어떤식으로 10개 유전자 세트의 3 계층으로 나누어지는지를 시험하였다. LDL 콜레스테롤과 가장 관련이 깊은 유전자들을 유전자 세트에 모았기 때문에, 유전자 세트 매핑 분석에서의 LDLR 유전자와 같이 APOB 및 PCSK9 유전자는 3개 계층으로 매핑되었다.
돌연변이 음성 FH 환자들에 대한 FH-연관 유전자 후보의 순위설정 및 매핑
유전적으로 진단되지 않은 FH 환자들을 대상으로 동일한 통계적 검사 및 순위설정을 수행하여 보고되지 않은 FH-연관 유전자를 동정하고자 하였다. SKAT-O로 변이를 우선 검사하고 유전자-기반 결합순위로 추가 순위설정을 하였다(도 5). 일반적인 집단에서는 희소하면서 돌연변이-음성 FH 환자에서만 검출되는 변이를 사용하였다. SKAT-O에서 ρ>0으로 추정되는 유전자를 순위설정 대상으로 하였다. 이는 SKAT-O에 의한 유의성의 일부가 부하검사 통계로부터 도출됨을 보여준다. 따라서, 동일한 방향에서 효과의 희소 변이를 가지는 유전자는 잔류하였다. 17개 유전자가 50위 이상의 순위를 보였다(표 11). 랭크 순위(일부)는 표 12에 나열하였다.
유전자 | SKAT-O | 유전자 크기-조정 결합순위 | 필터링‡ 후 post-hoc 순위를 위한 배타적 변이† |
|
P * | 추정 ρ | |||
MCTP2 | 2.16×10-7 | 0.2 | 1 | p.R46H(1); p.R340C(1); p.R343Q(1); p.P870S(2) |
COL21A1 | 6.30×10-6 | 0.1 | 2 | p.C820fs(1); p.D24V(1); p.R226H(2); p.W298L(1) |
SERINC2 | 2.73×10-10 | 0.2 | 6 | p.D87Y(1); p.L211F(1); p.S323N(1); p.V384I(1) |
ATP8A1 | 9.96×10-5 | 0.1 | 10 | p.T270A(1); p.S975L(1); p.A1061T(2) |
DUSP22 | 8.55×10-5 | 0.2 | 12 | p.R80H(2); p.R119C(1) |
CSRP1 | 3.40×10-5 | 0.1 | 14 | p.M38T(2); p.S87L(1) |
SORCS1 | 1.93×10-4 | 0.1 | 16 | p.A426T(1); p.S916R(1); p.T922S(1); p.H1085Y(1) |
ZNF511 | 3.85×10-4 | 0.1 | 16 | p.E153Q(2); p.A191V(1) |
TRHR | 4.37×10-6 | 0.2 | 18 | p.A21T(1); p.Y103H(2) |
TRAF3IP3 | 3.40×10-5 | 0.1 | 22 | p.V325M(1); p.I358T(2) |
NELFB | 3.58×10-6 | 0.2 | 25 | p.S357R(1); p.A522V(2) |
KCNA5 | 6.69×10-5 | 0.1 | 29 | p.P92R(1); p.V259I(2) |
ZNF804B | 2.96×10-8 | 0.2 | 30 | p.R25S(1); p.S448G(1); p.S686R(1); p.G733D(1) |
MTMR6 | 2.41×10-4 | 0.3 | 36 | p.I264V(1); p.R309H(1); p.R583L(1) |
DPEP1 | 7.85×10-4 | 0.2 | 40 | p.G74S(1); p.D211N(1); p.H286P(1) |
LMF1 | 1.10×10-5 | 0.1 | 42 | p.I286T(1); p.D474N(2) |
NPAS4 | 6.43×10-6 | 1.0 | 46 | p.I123V(1); p.S352F(1); p.R634H(1) |
*SKAT-O에서 더 작은 p값(MAF=1% 또는 0.5%)을 표시. †배타적 변이가 유전학적으로 진단되지 않은 환자들로부터 검출됨. ‡거짓 양성(false positive) 및 공통 변이를 감소시키기 위한 필터를 적용함.
상위 랭크된 유전자에는 돌연변이-음성 환자에 특이적인 희소 변이가 많았으며, 몇몇 유전자가 환자간 공유되었다. 인 실리코 예측 및 AF의 구체적인 정보는 공공 데이터베이스에 개시되어있다(표 13).
유전자 | 그룹 | 빈도* | 아미노산 변화 | 유전자형 | Polyphen-2 예측 (점수) | SIFT 예측(점수) | 유전자 좌표 | NT 변화 |
MCTP2 | M- | 1/46 | p.R46H | Het | 양성(0.167) | 내성(0.102) | chr15:94841631 | G/A |
MCTP2 | M- | 1/46 | p.R340C | Het | 유해가능성 높음(1) | 유해(0.001) | chr15:94899378 | C/T |
MCTP2 | M- | 1/46 | p.R343Q | Het | 유해가능성 높음(0.997) | 유해(0.006) | chr15:94899388 | G/A |
MCTP2 | M- | 2/46 | p.P870S | Het | 유해가능성 있음(0.928) | 유해(0.008) | chr15:95022234 | C/T |
COL21A1 | M- | 1/46 | p.D24V | Het | 유해가능성 높음(0.998) | 유해(0.003) | chr6:56047346 | T/A |
COL21A1 | M- | 2/46 | p.R226H | Het | 유해가능성 높음(1) | 유해(0.005) | chr6:56035890 | C/T |
COL21A1 | M- | 1/46 | p.W298L | Het | 유해가능성 높음(0.997) | 내성(0.093) | chr6:56035580 | C/A |
COL21A1 | M- | 1/46 | p.C820fs | Het | NA | NA | chr6:55924965 | A/- |
SERINC2 | M- | 1/46 | p.D87Y | Het | 유해가능성 높음(0.988) | 유해(0.001) | chr1:31897587 | G/T |
SERINC2 | M- | 1/46 | p.L211F | Het | 유해가능성 있음(0.494) | 내성(0.181) | chr1:31899521 | C/T |
SERINC2 | M- | 1/46 | p.S323N | Het | 양성(0.03) | 내성(0.612) | chr1:31902340 | G/A |
SERINC2 | M- | 1/46 | p.V384I | Het | 유해가능성 높음(0.989) | 유해(0.017) | chr1:31905950 | G/A |
ATP8A1 | M+ | 1/23 | p.Q43H | Het | 유해가능성 있음(0.904) | 내성(0.104) | chr4:42629047 | C/A |
ATP8A1 | M- | 1/46 | p.T270A | Het | 유해가능성 높음(0.976) | 유해(0.017) | chr4:42583664 | T/C |
ATP8A1 | M- | 1/46 | p.S975L | Het | 양성(0.318) | 유해(0.033) | chr4:42448634 | G/A |
ATP8A1 | M- | 2/46 | p.A1061T | Het | 양성(0) | 내성(0.136) | chr4:42425665 | C/T |
DUSP22 | M- | 2/46 | p.R80H | Het | 양성(0.001) | 내성(0.170) | chr6:345904 | G/A |
DUSP22 | M- | 1/46 | p.R119C | Het | 유해가능성 높음(1) | 유해(0.002) | chr6:348194 | C/T |
CSRP1 | M- | 2/46 | p.M38T | Het | 양성(0.013) | 내성(0.603) | chr1:201459472 | A/G |
CSRP1 | M- | 1/46 | p.S87L | Het | 양성(0.016) | 내성(0.083) | chr1:201459325 | G/A |
CSRP1 | M+ | 1/23 | p.S155X | Het | NA | NA | chr1:201454452 | G/C |
SORCS1 | M- | 1/46 | p.A426T | Het | 유해가능성 높음(1) | 유해(0.002) | chr10:108459109 | C/T |
SORCS1 | M- | 1/46 | p.S916R | Het | 유해가능성 높음(0.995) | 내성(0.121) | chr10:108380234 | G/T |
SORCS1 | M- | 1/46 | p.T922S | Het | 유해가능성 있음(0.938) | 유해(0.018) | chr10:108380217 | G/C |
SORCS1 | M- | 1/46 | p.H1085Y | Het | 유해가능성 있음(0.956) | 유해(0.007) | chr10:108357121 | G/A |
ZNF511 | M- | 2/46 | p.E153Q | Het | 유해가능성 있음(0.824) | 내성(0.497) | chr10:135123695 | G/C |
ZNF511 | M- | 1/46 | p.A191V | Het | 양성(0.001) | 내성(0.285) | chr10:135125237 | C/T |
TRHR | M- | 1/46 | p.A21T | Het | 양성(0.001) | 내성(0.265) | chr8:110099802 | G/A |
TRHR | M- | 2/46 | p.Y103H | Het | 유해가능성 높음(0.995) | 유해(0.000) | chr8:110100048 | T/C |
TRAF3IP3 | M- | 1/46 | p.V325M | Het | 유해가능성 높음(0.981) | 유해(0.018) | chr1:209949061 | G/A |
TRAF3IP3 | M- | 2/46 | p.I358T | Het | 유해가능성 있음(0.949) | 유해(0.014) | chr1:209950776 | T/C |
NELFB | M- | 1/46 | p.S357R | Het | 유해가능성 높음(1) | 내성(0.115) | chr9:140160854 | C/A |
NELFB | M- | 2/46 | p.A522V | Het | 양성(0.375) | 내성(0.135) | chr9:140167036 | C/T |
KCNA5 | M- | 1/46 | p.P92R | Het | 양성(0.047) | 유해(0.022) | chr12:5153588 | C/G |
KCNA5 | M- | 2/46 | p.V259I | Het | 양성(0.191) | 유해(0.050) | chr12:5154088 | G/A |
ZNF804B | M- | 1/46 | p.R25S | Het | 유해가능성 높음(0.997) | 유해(0.007) | chr7:88389365 | G/T |
ZNF804B | M- | 1/46 | p.S448G | Het | 양성(0.125) | 유해(0.003) | chr7:88963638 | A/G |
ZNF804B | M- | 1/46 | p.S686R | Het | 양성(0) | 내성(0.285) | chr7:88964354 | C/A |
ZNF804B | M- | 1/46 | p.G733D | Het | 양성(0.006) | 내성(0.063) | chr7:88964494 | G/A |
MTMR6 | M- | 1/46 | p.I264V | Het | 양성(0.326) | 내성(0.085) | chr13:25832767 | T/C |
MTMR6 | M- | 1/46 | p.R309H | Het | 유해가능성 있음(0.891) | 유해(0.002) | chr13:25831917 | C/T |
MTMR6 | M- | 1/46 | p.R583L | Het | 유해가능성 있음(0.845) | 내성(0.140) | chr13:25823488 | C/A |
DPEP1 | M- | 1/46 | p.G74S | Het | 유해가능성 높음(1) | 유해(0.000) | chr16:89702431 | G/A |
DPEP1 | M- | 1/46 | p.D211N | Het | NA | 유해(0.000) | chr16:89703651 | G/A |
DPEP1 | M- | 1/46 | p.H286P | Het | 유해가능성 높음(1) | 유해(0.000) | chr16:89704043 | A/C |
LMF1 | M- | 1/46 | p.I286T | Het | 양성(0.002) | 내성(0.228) | chr16:929598 | A/G |
LMF1 | M- | 2/46 | p.D474N | Het | 양성(0.002) | 내성(0.128) | chr16:919041 | C/T |
NPAS4 | M- | 1/46 | p.I123V | Het | 양성(0.392) | 내성(0.129) | chr11:66189961 | A/G |
NPAS4 | M- | 1/46 | p.S352F | Het | 유해가능성 높음(0.989) | 유해(0.002) | chr11:66191416 | C/T |
NPAS4 | M- | 1/46 | p.R634H | Het | 유해가능성 높음(0.998) | 유해(0.020) | chr11:66192262 | G/A |
*46명의 돌연변이-음성 환자 또는 23명의 돌연변이-양성 환자도들의 빈도를 표시.
약어: M+, 돌연변이 양성 그룹; M-, 돌연변이 음성 그룹; Het, 이형접합체; Hom, 동형접합체; N/A, Not Available
대부분의 유전자와 LDL-C 간의 관계는 알려진 바가 거의 없다. MCTP2(multiple C2 domains with transmembrane 2), SERINC2(serine incorporator 2) 및 ZNF804B(zinc finger protein 804B) 유전자는 SKAT-O에서 전장 엑솜 유의성 p<2.68×10-6에 도달하여 상위에 랭크되었다(각각 nth=1, nth=6 및 nth=30). SKAT-O에서의 p 값과 무관하게, COL21A1(collagen typeXXI alpha1) 및 ATP8A1(adenosine triphosphate 8A1) 유전자는 상위에 랭크되었다. ATP8A1의 변이는 p.A1060T 및 p.T270A가 다른 질환을 가진 가족 구성원에 의해 공유되었다(도 6a-6c). 4개의 변이를 가지면서 16위에 랭크된 SORCS1(Sortilin-related VPS10 domain containing receptor 1)은 소르틸린(sortilin) 및 PCSK9 활성을 조절한다. LMF1(lipase maturation factor 1)은 42위에 랭크되었으며 이의 넌센스 돌연변이는 고혈당의 원인으로 보고된 바 있다. 본 연구에서는 미스센스 돌연변이만이 관찰되었다(표 12).
돌연변이-음성 환자에 특이적인 희소변이를 가지는 유전자들은 낮은 순위에도 불구하고 조사대상에 포함시켰다. 28개 유전자를 2개 이상의 유전자 계층으로 매핑하였으며(표 14), 인 실리코 예측 및 AF의 구체적인 정보는 공공 데이터베이스에 개시되어있다(표 15).
유전자 | 필터링 후 post-hoc 순위를 위한 배타적 변이 | 유전자 크기-조정 결합순위 | 계층 1. 관련 GWAS 신호 | 계층 2.기능적으로 관련된 경로 | 계층 3.PPI- LDLR로부터의 확장 * |
LPA | p.T1734A(2); p.N1778S(1) | 504 | GWAS 유전자 | 지단백질 대사 | 간접 상호작용 (CANX) |
MTMR3 | p.Q360H(1); p.R645W(1) | 567 | GWAS 유전자 | ||
INPPL1 | p.R390L(1); p.F921L(1) | 592 | 클라트린-매개 엔도사이토시스 | 간접 상호작용 (UBC,HSPA5) | |
PLCG1 | p.E758K(1); p.A975V(1) | 601 | GWAS 신호-인접 유전자 (rs6029526, TOP1) | 간접 상호작용 (FLT1,UBC) | |
NPC1L1 | p.V360A(1); p.Y893C(1) | 661 | GWAS genes | 지단백질 대사 | |
LRP1 | p.R2218H(1); p.R3927C(1) | 991 | 지질 대사 | 간접 상호작용 (SNX17,LRPAP1,CANX,DAB1,UBC,DAB2,APOE) | |
APOH | p.V95I(1) | 1365 | GWAS 유전자 | ||
CSNK1G3 | p.S22X(1) | 1699 | GWAS 유전자 | ||
IQSEC1 | p.S791P(1); p.S1081L(1) | 1811 | 엔도사이토시스 | 간접 상호작용 (APOE) | |
CARM1 | p.L102M(1) | 2208 | GWAS 신호-인접 유전자 (rs11668477,rs17249141,rs6511720,rs2228671,rs2738459, LDLR) | 간접 상호작용(UBC,CREBBP) | |
GCKR | p.R301X(1) | 2261 | GWAS 유전자 | 지질 대사 | |
ABCG5 | p.I609V(1) | 2312 | GWAS 유전자 | 지단백질 대사 | |
DAXX | p.I120T(1) | 2584 | GWAS 신호-인접 유전자(rs2254287,B3GALT4) | 간접 상호작용(UBC,CREBBP) | |
SORT1 | p.G820D(1) | 2749 | GWAS 유전자 | 지질 대사 | 간접 상호작용 (LRPAP1,UBC) |
PIP5K1A | p.R715Q(1) | 2802 | GWAS 신호-인접 유전자 (rs267733,ANXA9-CERS2) | 엔도사이토시스 | |
HMGCR | p.H16N(1) | 2875 | GWAS genes | 지질 대사 | |
AP2B1 | p.Q479K(1) | 2944 | 클라트린-매개 엔도사이토시스 | 간접 상호작용 (AP1M2,UBC,DAB2,LDLRAP1) | |
MYLIP | p.N441Y(1) | 3067 | GWAS 유전자 | 직접 상호작용 | |
CBLC | p.V39M(1) | 3150 | GWAS 신호-인접 유전자 (:rs10402271,rs157580,rs2075650,rs1160985rs429358;rs7412,rs4420638,APOE/C1/C4) | 엔도사이토시스 | |
FLT1 | p.N516K(1) | 3370 | 엔도사이토시스 | 직접 상호작용 | |
ERBB3 | p.D1259H(1) | 3382 | 엔도사이토시스 | 간접 상호작용 (DAB1,UBC) | |
PLTP | p.V203M(1) | 3404 | 지질 대사, 지단백질 대사 | Indirect interaction (APOE) | |
ABCG8 | p.G110R(1) | 3526 | GWAS 유전자 | 지단백질 대사 | |
ABCA1 | p.V481L(1) | 3641 | 지질 대사, 지단백질 대사 | 간접 상호작용 (UBC,CREBBP) | |
FN1 | p.T1063A(1); p.V2303A(1) | 3670 | GWAS 유전자 | 간접 상호작용 (MAP4,UBC,HSPA5,DAB2) | |
BRCA2 | p.K862R(1) | 3716 | GWAS 유전자 | ||
FCHO2 | p.T473A(1) | 3872 | 클라트린-매개 엔도사이토시스 | 간접 상호작용 (UBC,DAB2) | |
AP2A2 | p.V534L(1) | 3985 | 클라트린-매개 엔도사이토시스, 엔도사이토시스 | 간접 상호작용 (UBC,DAB2) |
*직접 상호작용은 LDLR로부터의 단일 네트워크 경로를 의미하고, 간접 상호작용은 두가지 형태의 LDLR의 네트워크 경로를 의미함. 유전자 세트는 표 3-5에 기재함.
유전자 | 그룹 | 빈도* | 아미노산 변화 | 유전자형 | Polyphen-2 예측 (점수) | SIFT 예측(점수) | 유전자 좌표 | NT 변화 |
LPA | M- | 2/46 | p.T1734A | Het | 유해가능성 높음(0.98) | 내성(0.086) | chr6:160968925 | T/C |
LPA | M- | 1/46 | p.N1778S | Het | 유해가능성 있음(0.581) | 내성(0.403) | chr6:160966537 | T/C |
MTMR3 | M- | 1/46 | p.Q360H | Het | 양성(0.034) | 내성(0.353) | chr22:30405077 | G/T |
MTMR3 | M- | 1/46 | p.R645W | Het | 유해가능성 높음(0.994) | 유해(0.001) | chr22:30415581 | C/T |
INPPL1 | M- | 1/46 | p.R390L | Het | 유해가능성 있음(0.799) | 유해(0.004) | chr11:71941484 | G/T |
INPPL1 | M- | 1/46 | p.F921L | Het | 양성(0.001) | 내성(0.646) | chr11:71946912 | T/C |
PLCG1 | M- | 1/46 | p.E758K | Het | 유해가능성 있음(0.841) | 내성(0.136) | chr20:39795470 | G/A |
PLCG1 | M- | 1/46 | p.A975V | Het | 유해가능성 높음(0.971) | 내성(0.501) | chr20:39801079 | C/T |
NPC1L1 | M- | 1/46 | p.V360A | Het | 양성(0.001) | 유해(0.008) | chr7:44578917 | A/G |
NPC1L1 | M+ | 1/23 | p.G582R | Het | 유해가능성 있음(0.924) | 유해(0.032) | chr7:44575965 | C/T |
NPC1L1 | M- | 1/46 | p.Y893C | Het | 유해가능성 높음(1) | 유해(0.000) | chr7:44561801 | T/C |
LRP1 | M+ | 1/23 | p.G2165R | Het | 유해가능성 높음(1) | 유해(0.002) | chr12:57579343 | G/A |
LRP1 | M- | 1/46 | p.R2218H | Het | 양성(0.131) | 내성(0.111) | chr12:57579503 | G/A |
LRP1 | M+ | 1/23 | p.V2325I | Het | 유해가능성 높음(0.999) | 내성(0.161) | chr12:57581181 | G/A |
LRP1 | M- | 1/46 | p.R3927C | Het | 양성(0.003) | 내성(0.174) | chr12:57600444 | C/T |
APOH | M- | 1/46 | p.V95I | Het | 유해가능성 있음(0.875) | 내성(0.388) | chr17:64222201 | C/T |
CSNK1G3 | M- | 1/46 | p.S22X | Het | NA | NA | chr5:122881422 | C/A |
IQSEC1 | M- | 1/46 | p.S791P | Het | 유해가능성 높음(0.995) | 유해(0.002) | chr3:12953174 | A/G |
IQSEC1 | M- | 1/46 | p.S1081L | Het | 양성(0.043) | 유해(0.000) | chr3:12942585 | G/A |
CARM1 | M- | 1/46 | p.L102M | Het | 유해가능성 높음(0.993) | 유해(0.011) | chr19:11015710 | C/A |
GCKR | M- | 1/46 | p.R301X | Het | NA | NA | chr2:27729379 | C/T |
ABCG5 | M- | 1/46 | p.I609V | Het | 유해가능성 높음(0.994) | 내성(0.209) | chr2:44040386 | T/C |
DAXX | M- | 1/46 | p.I120T | Het | 양성(0.032) | 내성(0.269) | chr6:33289229 | A/G |
SORT1 | M- | 1/46 | p.G820D | Het | 양성(0.002) | 내성(0.180) | chr1:109856905 | C/T |
PIP5K1A | M- | 1/46 | p.R715Q | Het | 유해가능성 있음(0.932) | NA | chr10:95719010 | C/T |
HMGCR | M- | 1/46 | p.H16N | Het | 유해가능성 높음(1) | 유해(0.002) | chr5:74638476 | C/A |
AP2B1 | M- | 1/46 | p.Q479K | Het | 양성(0.071) | 내성(0.053) | chr17:33966777 | C/A |
MYLIP | M- | 1/46 | p.N441Y | Het | 유해가능성 높음(0.994) | 유해(0.014) | chr6:16146965 | A/T |
CBLC | M- | 1/46 | p.V39M | Het | 양성(0.001) | 내성(0.082) | chr19:45281303 | G/A |
FLT1 | M- | 1/46 | p.N516K | Het | 유해가능성 있음(0.716) | 내성(0.072) | chr13:28979920 | A/C |
ERBB3 | M- | 1/46 | p.D1259H | Het | 유해가능성 있음(0.718) | 유해(0.009) | chr12:56495585 | G/C |
PLTP | M- | 1/46 | p.V203M | Het | 유해가능성 높음(0.968) | 유해(0.016) | chr20:44536337 | C/T |
ABCG8 | M- | 1/46 | p.G110R | Het | 유해가능성 높음(1) | 유해(0.000) | chr2:44078728 | G/A |
ABCA1 | M- | 1/46 | p.V481L | Het | 양성(0) | 내성(0.488) | chr9:107594923 | C/A |
FN1 | M- | 1/46 | p.V2303A | Het | 양성(0.014) | 내성(1.000) | chr2:216232696 | A/G |
FN1 | M- | 1/46 | p.T1063A | Het | 양성(0) | 내성(0.058) | chr2:216269178 | T/C |
FN1 | M+ | 1/23 | p.G2057V | Het | 유해가능성 있음(0.907) | 유해(0.001) | chr2:216238122 | C/A |
BRCA2 | M- | 1/46 | p.K862R | Het | 양성(0.024) | 내성(0.225) | chr13:32911077 | A/G |
FCHO2 | M- | 1/46 | p.T473A | Het | 양성(0) | 내성(0.702) | chr5:72359739 | A/G |
AP2A2 | M- | 1/46 | p.V534L | Het | 양성(0.002) | 내성(0.240) | chr11:993803 | G/C |
*46명의 돌연변이-음성 환자 또는 23명의 돌연변이-양성 환자도들의 빈도를 표시.
약어: M+, 돌연변이 양성 그룹; M-, 돌연변이 음성 그룹; Het, 이형접합체; Hom, 동형접합체; N/A, Not Available
MYLIP 및 SORT1와 같은 알려진 FH-관련 유전자에서 희소 변이가 나타났다. 두 개의 이형접합 stop-gain(p.R301X 및 p.S22X) 변이가 종래의 고 LDL-C와 관련된 GWAS에서 예측된 GCKR 및 CSNK1G3에서 발견되었다. (FLT1)(fms-related tyrosinekinase 1)은 LDLR과의 관련성이 알려지지 않았음에도 LDLR와 물리적으로 상호작용을 하여 하나의 희소 변이(p.N516K)와 함께 매핑되었다. FLT1 및 LDLR은 클라트린과 독립적으로 LDL의 자극효과에 의하여 함께 세포질섭취될 수 있다(Sachais BS et al., Blood. 99:3613-22 (2002)). 하나의 계층의 유전자 세트로 매핑된 다른 유전자 및 변이 프로파일을 표 16에 나열하였다.
마지막으로, 상기 표 13 및 표 15에 나열된 돌연변이 중 Polyphen-2 예측 및 SIFT 예측 모두에서 FH와 관련된 유해 돌연변이로 판명된 돌연변이들을 하기 표 17에 정리하였다.
서열목록 | 유전자 | 아미노산 변화 | NT 변화 | 진뱅크 접근번호a |
6 | MCTP2 | p.R340C | c.1018C>T | NM_018349 |
6 | MCTP2 | p.R343Q | c.1028G>A | NM_018349 |
6 | MCTP2 | p.P870S | c.2608C>T | NM_018349 |
7 | COL21A1 | p.D24V | c.71A>T | NM_030820 |
7 | COL21A1 | p.R226H | c.677G>A | NM_030820 |
8 | SERINC2 | p.D87Y | c.259G>T | NM_178865 |
8 | SERINC2 | p.V384I | c.1150G>A | NM_178865 |
9 | ATP8A1 | p.T270A | c.808A>G | NM_006095 |
10 | DUSP22 | p.R119C | c.355C>T | NM_020185 |
11 | SORCS1 | p.A426T | c.1276G>A | NM_052918 |
11 | SORCS1 | p.T922S | c.2765C>G | NM_052918 |
11 | SORCS1 | p.H1085Y | c.3253C>T | NM_052918 |
12 | TRHR | p.Y103H | c.307T>C | NM_003301 |
13 | TRAF3IP3 | p.V325M | c.1033G>A | NM_025228 |
13 | TRAF3IP3 | p.I358T | c.1133T>C | NM_025228 |
14 | ZNF804B | p.R25S | c.75G>T | NM_181646 |
15 | MTMR6 | p.R309H | c.926G>A | NM_004685 |
16 | DPEP1 | p.G74S | c.220G>A | NM_004413 |
16 | DPEP1 | p.H286P | c.857A>C | NM_004413 |
17 | NPAS4 | p.S352F | c.1055C>T | NM_178864 |
17 | NPAS4 | p.R634H | c.1901G>A | NM_178864 |
18 | MTMR3 | p.R645W | c.1933C>T | NM_021090 |
19 | INPPL1 | p.R390L | c.1169G>T | NM_001567 |
20 | NPC1L1 | p.G582R | c.1744G>A | NM_013389 |
21 | LRP1 | p.G2165R | c.6493G>A | NM_002332 |
22 | IQSEC1 | p.S791P | c.2371T>C | NM_001134382 |
23 | CARM1 | p.L102M | c.304C>A | NM_199141 |
24 | HMGCR | p.H16N | c.46C>A | NM_000859 |
25 | MYLIP | p.N441Y | c.1321A>T | NM_013262 |
26 | ERBB3 | p.D1259H | c.3775G>C | NM_001982 |
27 | PLTP | p.V203M | c.607G>A | NM_006227 |
28 | ABCG8 | p.G110R | c.328G>A | NM_022437 |
29 | FN1 | p.G2057V | c.6170G>T | NM_212482 |
a진뱅크 접근번호(Genbank Accession No.)는 해당 돌연변이를 가진 유전자의 야생형 뉴클레오타이드 서열에 대한 접근번호이다.
이상으로 본 발명의 특정한 부분을 상세히 기술하였는 바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서, 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.
<110> Industry-Academic Cooperation Foundation Yonsei University
<120> Novel Mutations Implicated in Familial Hypercholesterolemia and
Use Thereof
<130> PN140236
<160> 29
<170> KopatentIn 2.0
<210> 1
<211> 2583
<212> DNA
<213> homo sapiens
<400> 1
atggggccct ggggctggaa attgcgctgg accgtcgcct tgctcctcgc cgcggcgggg 60
actgcagtgg gcgacagatg cgaaagaaac gagttccagt gccaagacgg gaaatgcatc 120
tcctacaagt gggtctgcga tggcagcgct gagtgccagg atggctctga tgagtcccag 180
gagacgtgct tgtctgtcac ctgcaaatcc ggggacttca gctgtggggg ccgtgtcaac 240
cgctgcattc ctcagttctg gaggtgcgat ggccaagtgg actgcgacaa cggctcagac 300
gagcaaggct gtccccccaa gacgtgctcc caggacgagt ttcgctgcca cgatgggaag 360
tgcatctctc ggcagttcgt ctgtgactca gaccgggact gcttggacgg ctcagacgag 420
gcctcctgcc cggtgctcac ctgtggtccc gccagcttcc agtgcaacag ctccacctgc 480
atcccccagc tgtgggcctg cgacaacgac cccgactgcg aagatggctc ggatgagtgg 540
ccgcagcgct gtaggggtct ttacgtgttc caaggggaca gtagcccctg ctcggccttc 600
gagttccact gcctaagtgg cgagtgcatc cactccagct ggcgctgtga tggtggcccc 660
gactgcaagg acaaatctga cgaggaaaac tgcgctgtgg ccacctgtcg ccctgacgaa 720
ttccagtgct ctgatggaaa ctgcatccat ggcagccggc agtgtgaccg ggaatatgac 780
tgcaaggaca tgagcgatga agttggctgc gttaatgtga cactctgcga gggacccaac 840
aagttcaagt gtcacagcgg cgaatgcatc accctggaca aagtctgcaa catggctaga 900
gactgccggg actggtcaga tgaacccatc aaagagtgcg ggaccaacga atgcttggac 960
aacaacggcg gctgttccca cgtctgcaat gaccttaaga tcggctacga gtgcctgtgc 1020
cccgacggct tccagctggt ggcccagcga agatgcgaag atatcgatga gtgtcaggat 1080
cccgacacct gcagccagct ctgcgtgaac ctggagggtg gctacaagtg ccagtgtgag 1140
gaaggcttcc agctggaccc ccacacgaag gcctgcaagg ctgtgggctc catcgcctac 1200
ctcttcttca ccaaccggca cgaggtcagg aagatgacgc tggaccggag cgagtacacc 1260
agcctcatcc ccaacctgag gaacgtggtc gctctggaca cggaggtggc cagcaataga 1320
atctactggt ctgacctgtc ccagagaatg atctgcagca cccagcttga cagagcccac 1380
ggcgtctctt cctatgacac cgtcatcagc agagacatcc aggcccccga cgggctggct 1440
gtggactgga tccacagcaa catctactgg accgactctg tcctgggcac tgtctctgtt 1500
gcggatacca agggcgtgaa gaggaaaacg ttattcaggg agaacggctc caagccaagg 1560
gccatcgtgg tggatcctgt tcatggcttc atgtactgga ctgactgggg aactcccgcc 1620
aagatcaaga aagggggcct gaatggtgtg gacatctact cgctggtgac tgaaaacatt 1680
cagtggccca atggcatcac cctagatctc ctcagtggcc gcctctactg ggttgactcc 1740
aaacttcact ccatctcaag catcgatgtc aacgggggca accggaagac catcttggag 1800
gatgaaaaga ggctggccca ccccttctcc ttggccgtct ttgaggacaa agtattttgg 1860
acagatatca tcaacgaagc cattttcagt gccaaccgcc tcacaggttc cgatgtcaac 1920
ttgttggctg aaaacctact gtccccagag gatatggttc tcttccacaa cctcacccag 1980
ccaagaggag tgaactggtg tgagaggacc accctgagca atggcggctg ccagtatctg 2040
tgcctccctg ccccgcagat caacccccac tcgcccaagt ttacctgcgc ctgcccggac 2100
ggcatgctgc tggccaggga catgaggagc tgcctcacag aggctgaggc tgcagtggcc 2160
acccaggaga catccaccgt caggctaaag gtcagctcca cagccgtaag gacacagcac 2220
acaaccaccc gacctgttcc cgacacctcc cggctgcctg gggccacccc tgggctcacc 2280
acggtggaga tagtgacaat gtctcaccaa gctctgggcg acgttgctgg cagaggaaat 2340
gagaagaagc ccagtagcgt gagggctctg tccattgtcc tccccatcgt gctcctcgtc 2400
ttcctttgcc tgggggtctt ccttctatgg aagaactggc ggcttaagaa catcaacagc 2460
atcaactttg acaaccccgt ctatcagaag accacagagg atgaggtcca catttgccac 2520
aaccaggacg gctacagcta cccctcgaga cagatggtca gtctggagga tgacgtggcg 2580
tga 2583
<210> 2
<211> 2078
<212> DNA
<213> homo sapiens
<400> 2
atgggcaccg tcagctccag gcggtcctgg tggccgctgc cactgctgct gctgctgctg 60
ctgctcctgg gtcccgcggg cgcccgtgcg caggaggacg aggacggcga ctacgaggag 120
ctggtgctag ccttgcgttc cgaggaggac ggcctggccg aagcacccga gcacggaacc 180
acagccacct tccaccgctg cgccaaggat ccgtggaggt tgcctggcac ctacgtggtg 240
gtgctgaagg aggagaccca cctctcgcag tcagagcgca ctgcccgccg cctgcaggcc 300
caggctgccc gccggggata cctcaccaag atcctgcatg tcttccatgg ccttcttcct 360
ggcttcctgg tgaagatgag tggcgacctg ctggagctgg ccttgaagtt gccccatgtc 420
gactacatcg aggaggactc ctctgtcttt gcccagagca tcccgtggaa cctggagcgg 480
attacccctc cacggtaccg ggcggatgaa taccagcccc ccgacggagg cagcctggtg 540
gaggtgtatc tcctagacac cagcatacag agtgaccacc gggaaatcga gggcagggtc 600
atggtcaccg acttcgagaa tgtgcccgag gaggacggga cccgcttcca cagacaggcc 660
agcaagtgtg acagtcatgg cacccacctg gcaggggtgg tcagcggccg ggatgccggc 720
gtggccaagg gtgccagcat gcgcagcctg cgcgtgctca actgccaagg gaagggcacg 780
gttagcggca ccctcatagg cctggagttt attcggaaaa gccagctggt ccagcctgtg 840
gggccactgg tggtgctgct gcccctggcg ggtgggtaca gccgcgtcct caacgccgcc 900
tgccagcgcc tggcgagggc tggggtcgtg ctggtcaccg ctgccggcaa cttccgggac 960
gatgcctgcc tctactcccc agcctcagct cccgaggtca tcacagttgg ggccaccaat 1020
gcccaagacc agccggtgac cctggggact ttggggacca actttggccg ctgtgtggac 1080
ctctttgccc caggggagga catcattggt gcctccagcg actgcagcac ctgctttgtg 1140
tcacagagtg ggacatcaca ggctgctgcc cacgtggctg gcattgcagc catgatgctg 1200
tctgccgagc cggagctcac cctggccgag ttgaggcaga gactgatcca cttctctgcc 1260
aaagatgtca tcaatgaggc ctggttccct gaggaccagc gggtactgac ccccaacctg 1320
gtggccgccc tgccccccag cacccatggg gcaggttggc agctgttttg caggactgta 1380
tggtcagcac actcggggcc tacacggatg gccacagccg tcgcccgctg cgccccagat 1440
gaggagctgc tgagctgctc cagtttctcc aggagtggga agcggcgggg cgagcgcatg 1500
gaggcccaag ggggcaagct ggtctgccgg gcccacaacg cttttggggg tgagggtgtc 1560
tacgccattg ccaggtgctg cctgctaccc caggccaact gcagcgtcca cacagctcca 1620
ccagctgagg ccagcatggg gacccgtgtc cactgccacc aacagggcca cgtcctcaca 1680
ggctgcagct cccactggga ggtggaggac cttggcaccc acaagccgcc tgtgctgagg 1740
ccacgaggtc agcccaacca gtgcgtgggc cacagggagg ccagcatcca cgcttcctgc 1800
tgccatgccc caggtctgga atgcaaagtc aaggagcatg gaatcccggc ccctcaggag 1860
caggtgaccg tggcctgcga ggagggctgg accctgactg gctgcagtgc cctccctggg 1920
acctcccacg tcctgggggc ctacgccgta gacaacacgt gtgtagtcag gagccgggac 1980
gtcagcacta caggcagcac cagcgaaggg gccgtgacag ccgttgccat ctgctgccgg 2040
agccggcacc tggcgcaggc ctcccaggag ctccagtg 2078
<210> 3
<211> 200
<212> PRT
<213> homo sapiens
<400> 3
Met Gly Pro Trp Gly Trp Lys Leu Arg Trp Thr Val Ala Leu Leu Leu
1 5 10 15
Ala Ala Ala Gly Thr Ala Val Gly Asp Arg Cys Glu Arg Asn Glu Phe
20 25 30
Gln Cys Gln Asp Gly Lys Cys Ile Ser Tyr Lys Trp Val Cys Asp Gly
35 40 45
Ser Ala Glu Cys Gln Asp Gly Ser Asp Glu Ser Gln Glu Thr Cys Leu
50 55 60
Ser Val Thr Cys Lys Ser Gly Asp Phe Ser Cys Gly Gly Arg Val Asn
65 70 75 80
Arg Cys Ile Pro Gln Phe Trp Arg Cys Asp Gly Gln Val Asp Cys Asp
85 90 95
Asn Gly Ser Asp Glu Gln Gly Cys Pro Pro Lys Thr Ser Phe Ala Ala
100 105 110
Thr Met Gly Ser Ala Ser Leu Gly Ser Ser Ser Val Thr Gln Thr Gly
115 120 125
Thr Ala Trp Thr Ala Gln Thr Arg Pro Pro Ala Arg Cys Ser Pro Val
130 135 140
Val Pro Pro Ala Ser Ser Ala Thr Ala Pro Pro Ala Ser Pro Ser Cys
145 150 155 160
Gly Pro Ala Thr Thr Thr Pro Thr Ala Lys Met Ala Arg Met Ser Gly
165 170 175
Arg Ser Ala Val Gly Val Phe Thr Cys Ser Lys Gly Thr Val Ala Pro
180 185 190
Ala Arg Pro Ser Ser Ser Thr Ala
195 200
<210> 4
<211> 856
<212> PRT
<213> homo sapiens
<400> 4
Met Gly Pro Trp Gly Trp Lys Leu Arg Trp Thr Val Ala Leu Leu Leu
1 5 10 15
Ala Ala Ala Gly Thr Ala Val Gly Asp Arg Cys Glu Arg Asn Glu Phe
20 25 30
Gln Cys Gln Asp Gly Lys Cys Ile Ser Tyr Lys Trp Val Cys Asp Gly
35 40 45
Ser Ala Glu Cys Gln Asp Gly Ser Asp Glu Ser Gln Glu Thr Cys Leu
50 55 60
Ser Val Thr Cys Lys Ser Gly Asp Phe Ser Cys Gly Gly Arg Val Asn
65 70 75 80
Arg Cys Ile Pro Gln Phe Trp Arg Cys Asp Gly Gln Val Asp Cys Asp
85 90 95
Asn Gly Ser Asp Glu Gln Gly Cys Pro Pro Lys Thr Cys Ser Gln Asp
100 105 110
Glu Phe Arg Cys His Asp Gly Lys Cys Ile Ser Arg Gln Phe Val Cys
115 120 125
Asp Ser Asp Arg Asp Cys Leu Asp Gly Ser Asp Glu Ala Ser Cys Pro
130 135 140
Val Leu Thr Cys Gly Pro Ala Ser Phe Gln Cys Asn Ser Ser Thr Cys
145 150 155 160
Ile Pro Gln Leu Trp Ala Cys Asp Asn Asp Pro Asp Cys Glu Asp Gly
165 170 175
Ser Asp Glu Trp Pro Gln Arg Cys Arg Gly Leu Tyr Val Phe Gln Gly
180 185 190
Asp Ser Ser Pro Cys Ser Ala Phe Glu Phe His Cys Leu Ser Gly Glu
195 200 205
Cys Ile His Ser Ser Trp Arg Cys Asp Gly Gly Pro Asp Cys Lys Asp
210 215 220
Lys Ser Asp Glu Glu Asn Cys Ala Val Ala Thr Cys Arg Pro Asp Glu
225 230 235 240
Phe Gln Cys Ser Asp Gly Asn Cys Ile His Gly Ser Arg Gln Cys Asp
245 250 255
Arg Glu Tyr Asp Cys Lys Asp Met Ser Asp Glu Val Gly Cys Val Asn
260 265 270
Val Thr Leu Cys Glu Gly Pro Asn Lys Phe Lys Cys His Ser Gly Glu
275 280 285
Cys Ile Thr Leu Asp Lys Val Cys Asn Met Ala Arg Asp Cys Arg Asp
290 295 300
Trp Ser Asp Glu Pro Ile Lys Glu Cys Gly Thr Asn Glu Cys Leu Asp
305 310 315 320
Asn Asn Gly Gly Cys Ser His Val Cys Asn Asp Leu Lys Ile Gly Tyr
325 330 335
Glu Cys Leu Cys Pro Asp Gly Phe Gln Leu Val Ala Gln Arg Arg Cys
340 345 350
Glu Asp Ile Asp Glu Cys Gln Asp Pro Asp Thr Cys Ser Gln Leu Cys
355 360 365
Val Asn Leu Glu Gly Gly Tyr Lys Cys Gln Cys Glu Glu Gly Phe Gln
370 375 380
Leu Asp Pro His Thr Lys Ala Cys Lys Ala Val Gly Ser Ile Ala Tyr
385 390 395 400
Leu Phe Phe Thr Asn Arg His Glu Val Arg Lys Met Thr Leu Asp Arg
405 410 415
Ser Glu Tyr Thr Ser Leu Ile Pro Asn Leu Arg Asn Val Val Ala Leu
420 425 430
Asp Thr Glu Val Ala Ser Asn Arg Ile Tyr Trp Ser Asp Leu Ser Gln
435 440 445
Arg Met Ile Cys Ser Thr Gln Leu Asp Arg Ala His Gly Val Ser Ser
450 455 460
Tyr Asp Thr Val Ile Ser Arg Asp Ile Gln Ala Pro Asp Gly Leu Ala
465 470 475 480
Val Asp Trp Ile His Ser Asn Ile Tyr Trp Thr Asp Ser Val Leu Gly
485 490 495
Thr Val Ser Val Ala Asp Thr Lys Gly Val Lys Arg Lys Thr Leu Phe
500 505 510
Arg Glu Asn Gly Ser Lys Pro Arg Ala Ile Val Val Asp Pro Val His
515 520 525
Gly Phe Met Tyr Trp Thr Asp Trp Gly Thr Pro Ala Lys Ile Lys Lys
530 535 540
Gly Gly Leu Asn Gly Val Asp Ile Tyr Ser Leu Val Thr Glu Asn Ile
545 550 555 560
Gln Trp Pro Asn Gly Ile Thr Leu Asp Leu Leu Ser Gly Arg Leu Tyr
565 570 575
Trp Val Asp Ser Lys Leu His Ser Ile Ser Ser Ile Asp Val Asn Gly
580 585 590
Gly Asn Arg Lys Thr Ile Leu Glu Asp Glu Lys Arg Leu Ala His Pro
595 600 605
Phe Ser Leu Ala Val Phe Glu Asp Lys Val Phe Trp Thr Asp Ile Ile
610 615 620
Asn Glu Ala Ile Phe Ser Ala Asn Arg Leu Thr Gly Ser Asp Val Asn
625 630 635 640
Leu Leu Ala Glu Asn Leu Leu Ser Pro Glu Asp Met Val Leu Phe His
645 650 655
Asn Leu Thr Gln Pro Arg Gly Val Asn Trp Cys Glu Arg Thr Thr Leu
660 665 670
Ser Asn Gly Gly Cys Gln Tyr Leu Cys Leu Pro Ala Pro Gln Ile Asn
675 680 685
Pro His Ser Pro Lys Phe Thr Cys Ala Cys Pro Asp Gly Met Leu Leu
690 695 700
Ala Arg Asp Met Arg Ser Cys Leu Thr Glu Ala Glu Ala Ala Val Ala
705 710 715 720
Thr Gln Glu Thr Ser Thr Val Arg Leu Lys Val Ser Ser Thr Ala Val
725 730 735
Arg Thr Gln His Thr Thr Thr Arg Pro Val Pro Asp Thr Ser Arg Leu
740 745 750
Pro Gly Ala Thr Pro Gly Leu Thr Thr Val Glu Ile Val Thr Met Ser
755 760 765
His Gln Ala Leu Gly Asp Val Ala Gly Arg Gly Asn Glu Lys Lys Pro
770 775 780
Ser Ser Val Arg Ala Leu Ser Ile Val Leu Pro Ile Val Leu Leu Val
785 790 795 800
Phe Leu Cys Leu Gly Val Phe Leu Leu Trp Lys Asn Trp Arg Leu Lys
805 810 815
Asn Ile Asn Ser Ile Asn Phe Asp Asn Pro Val Tyr Gln Lys Thr Thr
820 825 830
Glu Arg Gly Pro His Leu Pro Gln Pro Gly Arg Leu Gln Leu Pro Leu
835 840 845
Glu Thr Asp Gly Gln Ser Gly Gly
850 855
<210> 5
<211> 692
<212> PRT
<213> homo sapiens
<400> 5
Met Gly Thr Val Ser Ser Arg Arg Ser Trp Trp Pro Leu Pro Leu Leu
1 5 10 15
Leu Leu Leu Leu Leu Leu Leu Gly Pro Ala Gly Ala Arg Ala Gln Glu
20 25 30
Asp Glu Asp Gly Asp Tyr Glu Glu Leu Val Leu Ala Leu Arg Ser Glu
35 40 45
Glu Asp Gly Leu Ala Glu Ala Pro Glu His Gly Thr Thr Ala Thr Phe
50 55 60
His Arg Cys Ala Lys Asp Pro Trp Arg Leu Pro Gly Thr Tyr Val Val
65 70 75 80
Val Leu Lys Glu Glu Thr His Leu Ser Gln Ser Glu Arg Thr Ala Arg
85 90 95
Arg Leu Gln Ala Gln Ala Ala Arg Arg Gly Tyr Leu Thr Lys Ile Leu
100 105 110
His Val Phe His Gly Leu Leu Pro Gly Phe Leu Val Lys Met Ser Gly
115 120 125
Asp Leu Leu Glu Leu Ala Leu Lys Leu Pro His Val Asp Tyr Ile Glu
130 135 140
Glu Asp Ser Ser Val Phe Ala Gln Ser Ile Pro Trp Asn Leu Glu Arg
145 150 155 160
Ile Thr Pro Pro Arg Tyr Arg Ala Asp Glu Tyr Gln Pro Pro Asp Gly
165 170 175
Gly Ser Leu Val Glu Val Tyr Leu Leu Asp Thr Ser Ile Gln Ser Asp
180 185 190
His Arg Glu Ile Glu Gly Arg Val Met Val Thr Asp Phe Glu Asn Val
195 200 205
Pro Glu Glu Asp Gly Thr Cys Phe His Arg Gln Ala Ser Lys Cys Asp
210 215 220
Ser His Gly Thr His Leu Ala Gly Val Val Ser Gly Arg Asp Ala Gly
225 230 235 240
Val Ala Lys Gly Ala Ser Met Arg Ser Leu Arg Val Leu Asn Cys Gln
245 250 255
Gly Lys Gly Thr Val Ser Gly Thr Leu Ile Gly Leu Glu Phe Ile Arg
260 265 270
Lys Ser Gln Leu Val Gln Pro Val Gly Pro Leu Val Val Leu Leu Pro
275 280 285
Leu Ala Gly Gly Tyr Ser Arg Val Leu Asn Ala Ala Cys Gln Arg Leu
290 295 300
Ala Arg Ala Gly Val Val Leu Val Thr Ala Ala Gly Asn Phe Arg Asp
305 310 315 320
Asp Ala Cys Leu Tyr Ser Pro Ala Ser Ala Pro Glu Val Ile Thr Val
325 330 335
Gly Ala Thr Asn Ala Gln Asp Gln Pro Val Thr Leu Gly Thr Leu Gly
340 345 350
Thr Asn Phe Gly Arg Cys Val Asp Leu Phe Ala Pro Gly Glu Asp Ile
355 360 365
Ile Gly Ala Ser Ser Asp Cys Ser Thr Cys Phe Val Ser Gln Ser Gly
370 375 380
Thr Ser Gln Ala Ala Ala His Val Ala Gly Ile Ala Ala Met Met Leu
385 390 395 400
Ser Ala Glu Pro Glu Leu Thr Leu Ala Glu Leu Arg Gln Arg Leu Ile
405 410 415
His Phe Ser Ala Lys Asp Val Ile Asn Glu Ala Trp Phe Pro Glu Asp
420 425 430
Gln Arg Val Leu Thr Pro Asn Leu Val Ala Ala Leu Pro Pro Ser Thr
435 440 445
His Gly Ala Gly Trp Gln Leu Phe Cys Arg Thr Val Trp Ser Ala His
450 455 460
Ser Gly Pro Thr Arg Met Ala Thr Ala Val Ala Arg Cys Ala Pro Asp
465 470 475 480
Glu Glu Leu Leu Ser Cys Ser Ser Phe Ser Arg Ser Gly Lys Arg Arg
485 490 495
Gly Glu Arg Met Glu Ala Gln Gly Gly Lys Leu Val Cys Arg Ala His
500 505 510
Asn Ala Phe Gly Gly Glu Gly Val Tyr Ala Ile Ala Arg Cys Cys Leu
515 520 525
Leu Pro Gln Ala Asn Cys Ser Val His Thr Ala Pro Pro Ala Glu Ala
530 535 540
Ser Met Gly Thr Arg Val His Cys His Gln Gln Gly His Val Leu Thr
545 550 555 560
Gly Cys Ser Ser His Trp Glu Val Glu Asp Leu Gly Thr His Lys Pro
565 570 575
Pro Val Leu Arg Pro Arg Gly Gln Pro Asn Gln Cys Val Gly His Arg
580 585 590
Glu Ala Ser Ile His Ala Ser Cys Cys His Ala Pro Gly Leu Glu Cys
595 600 605
Lys Val Lys Glu His Gly Ile Pro Ala Pro Gln Glu Gln Val Thr Val
610 615 620
Ala Cys Glu Glu Gly Trp Thr Leu Thr Gly Cys Ser Ala Leu Pro Gly
625 630 635 640
Thr Ser His Val Leu Gly Ala Tyr Ala Val Asp Asn Thr Cys Val Val
645 650 655
Arg Ser Arg Asp Val Ser Thr Thr Gly Ser Thr Ser Glu Gly Ala Val
660 665 670
Thr Ala Val Ala Ile Cys Cys Arg Ser Arg His Leu Ala Gln Ala Ser
675 680 685
Gln Glu Leu Gln
690
<210> 6
<211> 2637
<212> DNA
<213> homo sapiens
<400> 6
atggatctgg ataaaccatc tgtttggggc tcattaaaac agcggaccag gccattgttg 60
atcaacttga gcaagaagaa ggtgaaaaag aacccaagta agcccccaga tctacgggca 120
aggcatcact tggaccgccg tctcagcctc tctgtgcctg atctcctgga ggctgaggcc 180
ttggccccag agggccggcc ttactccggg ccacagtctt cctacacctc ggtgcccagc 240
agtctgtcca ctgcagggat ctttcccaag agcagcagta gctccttgaa acagtctgaa 300
gaagaattgg attggagcca ggaagaagcc agtcacctcc atgtggtgga aacagactca 360
gaggaggcct atgcctctcc tgctgagcgg agacgggtgt ccagcaacgg catctttgat 420
cttcagaaaa cttcccttgg aggggatgca ccagaagagc cagagaagct atgtggaagc 480
agtgacctga atgcttctat gacatctcaa cattttgaag aacaatctgt accgggggaa 540
gccagtgatg gcttgagtaa cctccccagc ccttttgcgt acctcctcac catacacctg 600
aaggaaggcc ggaacctggt tgtccgagat cgctgtggca caagtgatcc ttatgtgaaa 660
tttaagctga atgggaagac gctgtacaaa agtaaagtca tatataagaa cttgaaccca 720
gtatgggatg agatagttgt attgccaatc caaagccttg atcaaaagct acgtgtgaag 780
gtatatgatc gagatttaac cacatctgat ttcatgggtt ctgcatttgt cattctcagt 840
gatcttgagc ttaacagaac aactgaacat attttaaaac tggaagatcc aaacagttta 900
gaagatgaca tgggagtgat cgtgttaaat ttgaacctag tggtaaaaca gggtgatttc 960
aagagacacc gttggtcaaa tcggaagcga ttaagtgcca gcaagtcctc tttgatacgc 1020
aacctacggc tctctgagtc cttgaaaaag aaccaactct ggaacgggat tataagtata 1080
actttgttgg aagggaagaa tgtctcagga ggaagcatga cagagatgtt tgtccagtta 1140
aaactgggag atcagaggta taaaagtaag acactgtgta agagtgcaaa tccgcagtgg 1200
caggaacagt ttgactttca ctacttctct gacaggatgg gcattttgga cattgaagtg 1260
tggggaaagg acaacaaaaa gcatgaggaa cgtctgggca cgtgtaaagt ggatatctcg 1320
gcactccctc tgaagcaagc caactgcctg gagctgccac tggacagctg tctgggggct 1380
ctccttatgt tggtcacact tacaccctgt gcgggggtct ccgtctctga tctgtgtgtc 1440
tgccccttag cagacctcag cgaaagaaag cagattaccc agcgatattg cttacagaac 1500
tccctgaaag atgtgaaaga cgtcggcatt ctacaagtga aggttttaaa ggcagcagat 1560
ctcttagcgg cagatttctc agggaagagt gacccatttt gcttgttgga gttaggcaat 1620
gaccgacttc agacgcatac cgtctacaaa aacctcaacc ctgaatggaa caaagttttt 1680
acatttccca ttaaagatat ccatgatgtt ttggaagtga cagtgtttga tgaagatgga 1740
gataaacccc cagattttct tggaaaagtt gccattccct tgctgtccat tagagatgga 1800
caaccgaatt gttatgtact aaagaataaa gatttagaac aagcttttaa aggagttatt 1860
tacttagaga tggaccttat atataatccg gtgaaagcaa gtattaggac ttttactccc 1920
cgggaaaagc gctttgttga agacagccgc aagctgtcca aaaagatctt atcaagagat 1980
gtggaccgtg tgaaaagaat cactatggca atatggaata caatgcagtt ccttaaaagc 2040
tgcttccagt gggaatccac attaagaagt acaatagcat tcgcggtatt tttgatcact 2100
gtctggaatt ttgaactata tatgatcccc ttggcattgt tgctgatctt tgtctacaat 2160
ttcatcagac ctgtgaaagg caaggtcagc agcatccagg acagccagga gagcacagac 2220
atagatgacg aggaggatga agatgacaag gaatctgaga aaaaggggtt gattgaaaga 2280
atctatatgg tacaggatat tgtttcaact gttcaaaacg tcttggagga aatagcttct 2340
tttggagaaa ggattaagaa cacatttaac tggacggtcc ccttcctttc atctctggcc 2400
tgtttgattc tggcagcagc caccatcatt ttgtatttca ttccactgcg gtacatcatt 2460
ttaatctggg gcataaataa atttactaag aagcttcgaa atccctattc catcgacaat 2520
aatgagctac tagacttcct ctctagggta ccgtctgatg ttcaaaaggt gcagtatgca 2580
gaattgaaac tctgcagcag ccacagcccc ctgcggaaga agcgcagcgc tctctag 2637
<210> 7
<211> 2874
<212> DNA
<213> homo sapiens
<400> 7
atggctcact atattacatt tctctgcatg gttttggtgc tgcttcttca gaattctgtg 60
ttagctgaag atggggaagt aagatcaagt tgtcgtactg ctccgacaga tttagttttc 120
atcttagatg gctcttatag tgttggccca gaaaactttg aaatagtgaa aaagtggctt 180
gtcaatatca caaaaaactt tgacataggg ccgaagttta ttcaagttgg agtggttcaa 240
tatagtgact accctgtgct ggagattcct ctcggaagct atgattcagg agaacatttg 300
acggcagcag tggaatccat actctactta ggaggaaaca caaagacagg gaaggccatc 360
cagtttgcgc tcgattacct ttttgccaag tcctcacgat ttctgactaa gatagcagtg 420
gtacttacgg atggcaaatc ccaagatgac gtcaaggatg cagctcaagc agcaagagat 480
agtaagataa cattatttgc tattggtgtt ggttcagaaa cagaagatgc cgaacttaga 540
gctattgcca acaagccttc gtctacttat gtgttttatg tggaagacta tattgcaata 600
tccaaaataa gggaagtgat gaagcagaaa ctttgtgaag aatctgtctg tccaacacga 660
attccagtgg cagctcgtga tgaaagggga tttgatattc ttttaggttt agatgtaaat 720
aaaaaggtta agaaaagaat acagctttca ccaaaaaaga taaaaggata tgaagtaaca 780
tcaaaagttg atttatcaga actcacaagc aatgttttcc cagaaggtct tcctccatca 840
tatgtatttg tgtctactca aagatttaaa gtcaagaaaa tttgggattt atggagaata 900
ttaactattg atggaaggcc acaaatagca gttaccttaa atggtgtgga caaaatctta 960
ttatttacaa caaccagcgt aattaatggc tcacaagtgg ttacctttgc taaccctcaa 1020
gttaagacgt tgtttgatga aggctggcac caaattcgtc tcttagtaac agaacaagat 1080
gtgactttgt atattgatga ccaacaaatt gaaaacaagc ccttacatcc agttttaggg 1140
atcttgatca atgggcaaac ccaaattgga aaatattctg gaaaagaaga aactgttcag 1200
tttgatgtcc aaaagttgcg aatctactgt gacccagaac agaacaaccg ggagacagca 1260
tgtgagattc ctggatttaa tggagagtgc cttaatggtc ccagtgatgt aggttcaact 1320
ccagctccct gtatttgtcc tccgggaaaa ccaggacttc aaggccccaa aggtgaccct 1380
ggactgcctg ggaaccctgg ctaccctgga caacctggtc aagatggtaa gcctggatat 1440
cagggaattg cagggacacc aggtgttcca ggatctccag gaatacaagg agctcgagga 1500
ctaccaggtt acaaaggaga accagggcga gatggtgaca agggtgatcg tggacttcct 1560
ggttttcctg ggcttcatgg catgccagga tcaaagggtg aaatgggtgc caaaggagac 1620
aaaggatcac ctggatttta tggcaaaaag ggtgcaaaag gtgaaaaggg gaatgctggc 1680
ttccctggcc tccctggacc tgctggagaa ccaggaagac atggaaagga tggattaatg 1740
ggtagtcccg gtttcaaggg agaagcagga tcccctggtg ctccggggca ggatggaaca 1800
cggggagagc ctggaatccc aggatttcct ggaaaccgag gattaatggg ccaaaaggga 1860
gaaattgggc ctccaggaca gcaaggaaaa aaaggagccc cagggatgcc tggtttaatg 1920
ggaagcaatg gctcaccagg ccagcctgga acaccgggat ctaagggaag caaaggtgaa 1980
cctggaattc aagggatgcc tggggcttct gggctcaagg gagaaccagg agcaacgggt 2040
tccccaggag aaccaggata catgggttta cccgggattc aaggaaaaaa gggggacaaa 2100
ggaaatcaag gtgaaaaagg tattcagggt caaaagggag aaaatggaag acagggaatt 2160
ccagggcaac agggaattca aggccatcat ggtgcaaaag gagagagagg tgaaaaggga 2220
gaacctggtg tccgaggtgc cattggatca aaaggagaat ctggggtgga tggcttgatg 2280
gggcccgcag gtcctaaggg gcaacctggg gatccaggtc ctcagggacc cccaggtttg 2340
gatgggaagc ccggaagaga gttttcagaa caatttattc gacaagtttg cacagatgta 2400
ataagagccc agctaccagt cttacttcag agtggaagaa ttagaaattg tgatcattgc 2460
ctgtcccaac atggctcccc gggtattcct gggccacctg gtccgatagg cccagagggt 2520
cccagaggat tacctggttt gccaggaaga gatggtgttc ctggattagt gggtgtccct 2580
ggacgtccag gtgtcagagg attaaaaggc ctaccaggaa gaaatgggga aaaagggagc 2640
caagggtttg ggtatcctgg agaacaaggt cctcctggtc ccccaggtcc agagggccct 2700
cctggaataa gcaaagaagg tcctccagga gacccaggtc tccctggcaa agatggagac 2760
catggaaaac ctggaatcca agggcaacca ggccccccag gcatctgcga cccatcacta 2820
tgttttagtg taattgccag aagagatccg ttcagaaaag gaccaaacta ttag 2874
<210> 8
<211> 1368
<212> DNA
<213> homo sapiens
<400> 8
atgggggcct gcctgggagc ctgctccctg ctcagctgcg cgtcctgcct ctgcggctct 60
gccccctgca tcctgtgcag ctgctgcccc gccagccgca actccaccgt gagccgcctc 120
atcttcacgt tcttcctctt cctgggggtg ctggtgtcca tcattatgct gagcccgggc 180
gtggagagtc agctctacaa gctgccctgg gtgtgtgagg agggggccgg gatccccacc 240
gtcctgcagg gccacatcga ctgtggctcc ctgcttggct accgcgctgt ctaccgcatg 300
tgcttcgcca cggcggcctt cttcttcttt ttcaccctgc tcatgctctg cgtgagcagc 360
agccgggacc cccgggctgc catccagaat gggttttggt tctttaagtt cctgatcctg 420
gtgggcctca ccgtgggtgc cttctacatt cctgacggct ccttcaccaa catctggttc 480
tacttcggcg tcgtgggctc cttcctcttc atcctcatcc agctggtgct gctcatcgac 540
tttgcgcact cctggaacca gcggtggctg ggcaaggccg aggagtgcga ttcccgtgcc 600
tggtacgcag gcctcttctt cttcactctc ctcttctact tgctgtcgat cgcggccgtg 660
gcgctgatgt tcatgtacta cactgagccc agcggctgcc acgagggcaa ggtcttcatc 720
agcctcaacc tcaccttctg tgtctgcgtg tccatcgctg ctgtcctgcc caaggtccag 780
gacgcccagc ccaactcggg tctgctgcag gcctcggtca tcaccctcta caccatgttt 840
gtcacctggt cagccctatc cagtatccct gaacagaaat gcaaccccca tttgccaacc 900
cagctgggca acgagacagt tgtggcaggc cccgagggct atgagaccca gtggtgggat 960
gccccgagca ttgtgggcct catcatcttc ctcctgtgca ccctcttcat cagtctgcgc 1020
tcctcagacc accggcaggt gaacagcctg atgcagaccg aggagtgccc acctatgcta 1080
gacgccacac agcagcagca gcaggtggca gcctgtgagg gccgggcctt tgacaacgag 1140
caggacggcg tcacctacag ctactccttc ttccacttct gcctggtgct ggcctcactg 1200
cacgtcatga tgacgctcac caactggtac aagcccggtg agacccggaa gatgatcagc 1260
acgtggaccg ccgtgtgggt gaagatctgt gccagctggg cagggctgct cctctacctg 1320
tggaccctgg tagccccact cctcctgcgc aaccgcgact tcagctga 1368
<210> 9
<211> 3495
<212> DNA
<213> homo sapiens
<400> 9
atgcccacca tgcggaggac cgtgtcggag atccgctcgc gcgccgaagg ttatgagaag 60
acagatgatg tttcagagaa gacctcactg gctgaccagg aggaagtaag gactattttc 120
atcaaccagc cccagctgac aaaattctgc aataaccatg tcagcactgc aaaatacaac 180
ataatcacat tccttccaag atttctctac tctcagttca gaagagctgc taattcattt 240
tttctcttta ttgcactgct gcagcaaata cctgatgtgt caccaacagg tcgttataca 300
acactggttc ctctcttatt tattttagct gtggcagcta tcaaagagat aatagaagat 360
attaaacgac ataaagctga taatgcagtg aacaagaaac aaacgcaagt tttgagaaat 420
ggtgcttggg aaattgtcca ctgggaaaag gtggcagtag gggagatagt gaaagtgacc 480
aatggggaac atctcccagc agatctcatc agtctgtcct caagtgagcc ccaagccatg 540
tgctacattg aaacatccaa cttagatggt gaaacaaact tgaaaattag acagggctta 600
ccagcaacat cagatatcaa agacgttgac agtttgatga ggatttctgg cagaattgag 660
tgtgaaagtc caaacagaca tctctacgat tttgttggaa acataaggct tgatggacat 720
ggcaccgttc cactgggagc agatcagatt cttcttcgag gagctcagtt gagaaataca 780
cagtgggttc atggaatagt tgtctacact ggacatgaca ccaagctgat gcagaattca 840
acaagtccac cacttaagct ctcaaatgtg gaacggatta caaatgtaca aattttgatt 900
ttattttgta tcttaattgc catgtctctt gtctgttctg tgggctcagc catttggaat 960
cgaaggcatt ctggaaaaga ctggtatctc aatctaaact atggtggcgc tagtaatttt 1020
ggactgaatt tcttgacctt catcatcctt ttcaacaatc tcattcctat cagcttattg 1080
gttacattag aagttgtgaa atttacccag gcatacttca taaattggga tcttgacatg 1140
cactatgaac ccacagacac tgctgctatg gctcgaacat ctaatctgaa tgaggaactt 1200
ggccaggtta aatacatatt ttctgacaaa actggtactc tgacatgcaa tgtaatgcag 1260
tttaagaagt gcaccatagc gggagttgct tatggccatg tccctgaacc tgaggattat 1320
ggctgctctc ctgatgaatg gcagaactca cagtttggag atgaaaaaac atttagtgat 1380
tcatcattgc tggaaaatct ccaaaataat catccaactg cacctataat atgtgaattt 1440
cttacaatga tggcagtctg tcacacagca gtgccagagc gagaaggtga caagattatt 1500
tatcaagcag catctccaga tgagggagca ttggtcagag cagccaagca attgaatttt 1560
gttttcactg gaagaacacc cgactcggtg attatagatt cactggggca ggaagaaaga 1620
tatgaattgc tcaatgtctt ggagtttacc agtgctagga aaagaatgtc agtgattgtt 1680
cgcactccat ctggaaagtt acgactctac tgcaaaggag ctgacactgt aatttatgat 1740
cgactggcag agacgtcaaa atacaaagaa attaccctaa aacatttaga gcagtttgct 1800
acagaagggt taagaacttt atgttttgct gtggctgaga tttcagagag cgactttcag 1860
gagtggcgag cagtctatca gcgagcatct acatctgtgc agaacaggct actcaaactc 1920
gaagagagtt atgagttgat tgaaaagaat cttcagctac ttggagcaac agccattgag 1980
gataaattac aagatcaagt gcctgaaacc atagaaacgc taatgaaagc agacatcaaa 2040
atctggatcc ttacagggga caagcaagaa actgccatta acatcggaca ctcctgcaaa 2100
ctgttgaaga agaacatggg aatgattgtt ataaatgaag gctctcttga tggaacaagg 2160
gaaactctca gtcgtcactg tactaccctt ggtgatgctc tccggaaaga gaatgatttt 2220
gctcttataa ttgatgggaa aaccctcaaa tatgccttaa cctttggagt acgacagtat 2280
ttcctggact tagctttgtc atgcaaagct gtcatttgct gtcgggtttc tcctcttcaa 2340
aaatctgaag ttgttgagat ggttaagaaa caagtcaaag tcgtaacgct tgcaatcggt 2400
gatggagcaa atgatgtcag catgatacag acagcgcacg ttggtgttgg tatcagtggc 2460
aatgaaggcc tgcaggcagc taattcctct gactactcca tagctcagtt caaatatttg 2520
aagaatttac tgatgattca tggtgcctgg aactataaca gagtctccaa gtgcatctta 2580
tactgcttct acaagaatat agtgctctat attatcgaga tctggtttgc ctttgttaat 2640
ggcttttctg gacagatcct ctttgaaaga tggtgtatag gtctctataa cgtgatgttt 2700
acagcaatgc ctcctttaac tcttggaata tttgagagat catgcagaaa agagaacatg 2760
ttgaagtacc ctgaattata caaaacatct cagaatgccc tggacttcaa caccaaggtt 2820
ttctgggttc attgtttaaa tggcctcttc cactcagtta ttctgttttg gtttccacta 2880
aaagcccttc agtatggtac tgcatttgga aatgggaaaa cctcggatta tctgctactg 2940
ggaaactttg tgtacacttt tgtggtgata actgtgtgtt tgaaagctgg attggagaca 3000
tcatattgga catggttcag ccacatagcg atatggggga gcatcgcact ctgggtggtg 3060
ttttttggaa tctactcatc tctgtggcct gccattccga tggcccctga tatgtcagga 3120
gaggcagcca tgttgttcag ttctggagtc ttttggatgg gcttgttatt catccctgtg 3180
gcatctctgc tccttgatgt ggtgtacaag gttatcaaga ggactgcttt taaaacattg 3240
gtcgatgaag ttcaggagct ggaggcaaaa tctcaagacc caggagcagt tgtacttgga 3300
aaaagcctga ccgagagggc gcaactgctc aagaacgtct ttaagaagaa ccacgtgaac 3360
ttgtaccgct ctgaatcctt gcaacaaaat ctgctccatg ggtatgcgtt ctctcaagat 3420
gaaaatggaa tcgtttcaca gtctgaagtg ataagagcat atgataccac gaaacagagg 3480
cccgacgaat ggtga 3495
<210> 10
<211> 555
<212> DNA
<213> homo sapiens
<400> 10
atggggaatg ggatgaacaa gatcctgccc ggcctgtaca tcggcaactt caaagatgcc 60
agagacgcgg aacaattgag caagaacaag gtgacacata ttctgtctgt ccacgatagt 120
gccaggccta tgttggaggg agttaaatac ctgtgcatcc cagcagcgga ttcaccatct 180
caaaacctga caagacattt caaagaaagt attaaattca ttcacgagtg ccggctccgc 240
ggtgagagct gccttgtaca ctgcctggcc ggggtctcca ggagcgtgac actggtgatc 300
gcatacatca tgaccgtcac tgactttggc tgggaggatg ccctgcacac cgtgcgtgct 360
gggagatcct gtgccaaccc caacgtgggc ttccagagac agctccagga gtttgagaag 420
catgaggtcc atcagtatcg gcagtggctg aaggaagaat atggagagag ccctttgcag 480
gatgcagaag aagccaaaaa cattctggcc gctccgggaa ttctgaagtt ctgggccttt 540
ctcagaagac tgtaa 555
<210> 11
<211> 3507
<212> DNA
<213> homo sapiens
<400> 11
atgggaaaag ttggcgccgg cggcggctcc caagcccggc tgagcgcgct cctcgccggc 60
gcggggctct tgatcctctg cgccccgggc gtctgcggcg gcggctcctg ctgcccctcg 120
ccgcacccca gctccgctcc acgctcggcc tcgaccccta ggggcttttc ccaccagggg 180
cggccaggca gggctcctgc cacgcccctg cccctcgtag tgcgtcccct gttctcagtg 240
gcccccgggg accgagcgct atccctggag cgggctcggg gcactggggc atccatggcg 300
gttgctgcac gctccggccg gaggagacgg agcggagcgg atcaggagaa ggcagaacgg 360
ggagagggcg cgagtcggag cccccgggga gtgctaagag atggagggca gcaggagcct 420
gggactcggg agcgggaccc ggacaaagcc acccgcttcc ggatggagga gctgagactg 480
accagcacca cgtttgcgct gacgggagac tcagcacaca accaagccat ggtccactgg 540
tctggccaca acagcagcgt gattctcatt ttgacaaagc tctatgacta taacctgggg 600
agcatcacag agagctcgct ttggaggtca accgattatg gaacaaccta tgagaagctg 660
aatgataaag ttggtttgaa aaccattttg agctatctct atgtgtgtcc taccaacaag 720
cgtaagataa tgttactcac agacccggag attgagagca gtttattgat cagctcagat 780
gaaggggcaa cttatcaaaa gtaccggctg aacttctaca ttcaaagctt gctttttcac 840
cccaaacaag aagactggat tctggcatac agtcaagacc aaaagttata cagctctgct 900
gaatttggga gaagatggca gcttatccaa gaaggggttg taccaaacag gttctactgg 960
tctgtgatgg ggtcaaataa agaaccagac cttgtgcatc ttgaggccag aactgtggat 1020
ggtcattcac attatctaac ttgccgaatg cagaactgta cagaggccaa caggaatcag 1080
ccttttccag gctacattga cccagactct ttgattgttc aggatcatta tgtgtttgtt 1140
cagctgacat caggagggcg gccacattac tacgtgtcct accgaaggaa tgcatttgcc 1200
caaatgaagc ttccgaaata tgctttgccc aaggacatgc atgttatcag caccgatgag 1260
aatcaggtgt tcgcagcggt ccaagaatgg aaccagaatg acacgtacaa cctctacatc 1320
tcagacacac gtggtgtcta cttcaccctg gccttggaga atgtccagag cagcagaggc 1380
cctgagggca acatcatgat cgacctctat gaggtagcag ggataaaggg aatgttcttg 1440
gctaacaaga agattgacaa ccaagtgaag actttcatca catataacaa aggcagagac 1500
tggcgtttgc tgcaggcgcc ggacacggat ctaagggggg accccgtgca ctgcttgctg 1560
ccctattgct cactacacct tcacctgaag gtctctgaga atccctacac atcagggatc 1620
attgccagca aagacacagc tccaagcatc atagtggcat caggtaatat aggttctgaa 1680
ttgtcagaca ctgacatcag catgtttgtc tcttcagatg cagggaacac ctggagacag 1740
atctttgaag aagagcacag tgttttgtac ctggatcaag gtggagtcct ggttgctatg 1800
aaacacacat ctctcccaat tcgacatctt tggttgagtt ttgatgaagg gagatcttgg 1860
agcaaataca gtttcacatc tattccactt tttgtggatg gggttctggg tgagcctgga 1920
gaagagactc tcatcatgac agtgtttgga cacttcagcc accgctctga atggcagctg 1980
gtcaaagtag attacaagtc catttttgat agacggtgtg ccgaagagga ctacagacct 2040
tggcagctgc acagccaggg ggaagcatgt atcatgggag caaaaaggat atataagaag 2100
cgaaaatcag agcggaagtg tatgcaagga aaatatgcag gagctatgga atctgaaccc 2160
tgtgtctgca ctgaggctga ttttgattgc gactatggtt atgagcgaca cagcaatggc 2220
cagtgcctgc cggcattttg gttcaatcca tcctctctgt caaaggattg cagcttggga 2280
cagagttacc tcaatagtac tgggtacagg aaggtggttt ccaataattg cactgatggc 2340
gtaagggaac agtacactgc caaaccgcag aagtgcccag ggaaagcccc gcgggggctg 2400
cggatagtca cggctgatgg aaagctgaca gcggaacaag gacacaacgt cactctcatg 2460
gtgcaattag aagagggtga tgttcagcgg acactcatcc aagtggactt tggcgatggt 2520
atcgcggtgt cttacgtcaa tctcagctcc atggaagatg ggatcaaaca cgtctatcag 2580
aacgtgggca ttttccgtgt gaccgtgcag gtggacaaca gtctgggttc tgacagcgcc 2640
gtcctgtact tacatgtaac ttgtcccttg gagcacgtgc acctgtctct tccctttgtc 2700
accacaaaga acaaagaggt caatgcgacg gcagtgctgt ggcccagcca agtgggcacc 2760
ctcacttacg tgtggtggta cggaaacaac acggagcctt tgatcacctt ggagggaagc 2820
atatccttca gatttacttc agaaggaatg aataccatca cagtgcaggt ctcagctggg 2880
aatgccatcc tacaagacac aaagaccatc gcagtatatg aggaattccg gtctcttcgc 2940
ttgtcctttt ctccaaacct ggatgactac aacccggaca tccctgagtg gaggagggac 3000
atcggtcgag tcatcaaaaa atccctggtg gaagccacag gggttccagg ccagcacatc 3060
ctggtggcgg tgctccctgg cttacccacc actgctgaac tctttgtcct accctatcag 3120
gatccagctg gagaaaacaa aaggtcaact gatgacctgg agcagatatc agaattgctg 3180
atccacacgc tcaaccaaaa ctcagtacac ttcgagctga agccaggagt ccgagtcctt 3240
gtccatgctg ctcacttaac agcggccccc ctggtggacc tcactccaac ccacagtgga 3300
tctgccatgc tgatgctgct ctcagtggtg tttgtggggc tggcagtgtt cgtcatctac 3360
aagtttaaaa ggagagtagc tttaccctcc cctccctccc cttctactca acctggtgac 3420
tcatctctcc gattgcaaag agcaagacac gccactccgc cttcaacgcc aaagcgggga 3480
tctgctgggg cacagtatgc aatttaa 3507
<210> 12
<211> 1197
<212> DNA
<213> homo sapiens
<400> 12
atggaaaacg agacagtcag tgaactgaac caaacacagc ttcagccacg agcagtggtg 60
gccttagaat accaggtggt caccatctta cttgtactca ttatttgtgg cctgggcatt 120
gtaggcaaca tcatggtagt cctggttgtc atgagaacca agcacatgag gacccccaca 180
aactgctacc tggtgagcct ggcagtagct gatctcatgg tcttggtggc cgcaggcctc 240
cccaacataa cagacagtat ctacggttcc tgggtctatg gctatgttgg atgcctctgc 300
attacttacc tccagtattt gggaattaat gcatcctctt gttcaataac agcctttacc 360
attgagaggt acatagcaat ctgtcacccc atcaaagccc agtttctctg cacattttcc 420
agagccaaaa agattatcat ctttgtctgg gctttcacat ctctttactg tatgctctgg 480
ttcttcttgc tggatctcaa tattagcacc tacaaagatg ctattgtgat atcctgtggc 540
tacaagatct ccaggaatta ctactcacct atttacctaa tggactttgg tgtcttttat 600
gttgtgccaa tgatcctggc taccgtcctc tatggattca tagctagaat ccttttctta 660
aatcccattc cttcagatcc taaagaaaac tctaagacat ggaaaaatga ttcaacccat 720
cagaacacaa atctgaatgt aaatacctct aatagatgtt tcaacagcac agtatcttca 780
aggaagcagg tcaccaagat gctggcagtg gttgtaattc tgtttgccct tttatggatg 840
ccctacagga ctctagtggt tgtcaactca tttctctcca gtcctttcca agaaaattgg 900
tttttgctct tttgcagaat ttgcatttat ctcaacagtg ccatcaaccc ggtgatttac 960
aatctcatgt cccagaaatt ccgtgcagcc ttcagaaagc tctgcaactg caagcagaag 1020
ccaacagaga aacctgctaa ctacagtgtg gccctaaatt acagcgtcat caaggagtca 1080
gaccatttca gcacagagct tgatgatatc actgtcactg acacttacct gtctgccaca 1140
aaagtgtctt ttgatgacac ctgcttggct tctgaggtat cctttagcca aagttga 1197
<210> 13
<211> 1656
<212> DNA
<213> homo sapiens
<400> 13
atgatcagcc cagaccccag gccctcccct ggcttggccc ggtgggctga gagctatgag 60
gccaagtgtg agcgcaggca agagatccgt gaaagccgcc gctgccgtcc caatgtgacc 120
acttgccgcc aggtggggaa gacgctgagg atccaacaga gagagcagct ccagagagct 180
cgactgcagc agttcttcag gaggaggaac ctggagctag aggagaaggg caaagcgcag 240
catccccagg ccagggagca agggccctcc aggcggccag gacaggtgac tgtcctcaag 300
gaacccttgt cttgtgccag aaggatttct tctcccagag agcaggtgac aggcaccagc 360
tctgaagtct ttccagccca gcatcctcct ccctcaggca tctgcaggga tctgtctgac 420
cacctctcct cacaggctgg gggccttcct ccacaggaca ctcccatcaa gaagccaccc 480
aaacaccacc gtggtactca gacaaaggca gaaggaccaa caattaagaa cgatgccagt 540
cagcaaacca attacggagt tgcagttctg gataaggaaa tcatccagct ttctgattac 600
ctcaaagagg ccctacaaag ggagctggtc ctaaaacaga aaatggtgat tctccaagac 660
ctactgtcca ctctgattca ggcctctgac agctcttgga agggacagct taatgaagac 720
aaactgaagg ggaaactgag atccttagaa aaccagctat acacctgtac ccagaaatac 780
tccccttggg gaatgaaaaa agtactactg gagatggaag accagaaaaa cagctatgag 840
cagaaggcca aggagtcact gcagaaagtg ctggaggaga aaatgaatgc agagcagcaa 900
ctacagagca cacagcgatc cctggccctg gcagagcaga agtgtgaaga gtggaggagc 960
cagtatgagg ctctgaagga ggactggagg acccttggga cccagcacag ggagctggag 1020
agccaactcc acgtgcttca gtccaaactg cagggagcag atagcaggga cttacagatg 1080
aaccaggccc tgcgattttt ggaaaatgag caccagcaac tgcaggccaa gattgaatgc 1140
ctgcaagggg acagagacct gtgcagcttg gatacccagg acctacaaga tcaactaaaa 1200
aggtcagagg cagagaaact caccctggtg accagagtac agcagttgca gggtttgctt 1260
caaaatcaat ccttacagct tcaagaacag gagaaactct taacaaagaa agatcaggct 1320
ttgcccgtgt ggagtccaaa gtccttccct aacgaagtgg agcctgaggg tacagggaag 1380
gagaaagact gggatctcag agaccagctg caaaagaaga ctttgcagct ccaggccaag 1440
gaaaaggagt gcagagaact gcattcagaa ttagacaacc tcagtgacga gtatctctcc 1500
tgcctgcgta agctgcagca ctgtcgagaa gagctgaacc agagccagca gctgcctccc 1560
agaaggcaat gtgggcgatg gctcccagtg ctgatggtgg tgattgctgc agcactggca 1620
gtgttcctgg ccaataaaga caacctgatg atctga 1656
<210> 14
<211> 4050
<212> DNA
<213> homo sapiens
<400> 14
atggcttgtt acctggtcat cagttcgaga catctcagca atgggcacta ccggggcatt 60
aaaggagtct tcaggggacc cctgtgcaag aacggatctc cctctccgga ttttgcagaa 120
aagaagtcca cagcaaaggc cctggaagat gtaaaggcaa acttttactg tgaattatgt 180
gacaagcagt atcacaaaca ccaggagttt gacaatcata ttaattctta tgaccatgct 240
cataagcaga gactgaaaga attaaagcaa cgggaatttg ctcgaaatgt agcttctaag 300
tcatggaaag atgagaaaaa acaagaaaaa gcacttaaac gacttcatca gctggctgag 360
ttaaggcagc aatctgaatg tgtttctgga aatggaccag catacaaagc ccccagggta 420
gccatagaaa agcaactcca gcaaggaatt ttccccatta agaatggcag aaaggtatca 480
tgcatgaaga gtgctcttct ccttaaagga aaaaatctcc ccagaatcat atccgataaa 540
cagcggtcca ccatgccaaa tcgacaccaa ttacaatcag acaggcgttg tttgtttgga 600
aatcaggtac tgcaaacatc ttcagatctc agcaatgcaa atcacagaac aggagtatca 660
tttacttttt ccaaaaaagt gcacctaaaa ttagaatctt cagcatcagt tttcagtgag 720
aacacagaag aaacccatga ttgtaacaag tcacccattt ataaaacaaa acaaactgca 780
gataagtgca agtgctgcag gtttgcaaat aaagatacac accttaccaa ggaaaaagag 840
gtaaatatct caccaagcca tctggaaagt gttttacaca ataccatctc cataaactct 900
aaaattttgc aagacaaaca cgactctatt gatgagacac tagaagattc aattggcatt 960
catgcttcat tctctaaatc taacattcat ctttcagatg tagattttac tcctaccagc 1020
agagaaaaag aaactagaaa tacattgaag aacactttag aaaattgtgt taatcaccca 1080
tgccaagcaa atgcttcctt cagcccacca aacatttaca accatagtga tgccaggata 1140
tctgaatgcc tggatgagtt ttcatcactg gagccaagtg aacaaaagag tacagtgcat 1200
ctgaatccaa attccagaat agagaacaga gaaaaatctt tagataaaac agaaagagtt 1260
agcaaaaatg ttcaaagact tgtaaaagaa gcatgtaccc ataatgtggc atctaaacca 1320
ctaccttttc tccacgttca aagcaaggat ggccacacca ctcttcaatg gcctacggaa 1380
cttctgctct ttacaaaaac agaaccctgt atctcttatg gctgcaaccc actgtatttt 1440
gattttaagc tttctcggaa cacaaaggaa gaccacaatc tagaggactt aaaaacagaa 1500
ttgggtaaga agcccttgga attgaagact aaaagagaga gccaagtctc aggtttaact 1560
gaagaccaac aaaaattgat ccaagaagat tatcaatatc cgaaaccaaa gacgatgata 1620
gctaatccgg attgggaaaa attccagagg aaatataatt tggactacag tgattctgag 1680
ccaaataaga gtgaatatac tttcagtgca aatgatttgg aaatgaaaaa tcctaaagtg 1740
cctctttacc tcaacacatc tctaaaggat tgtgctggaa agaataatag tagtgagaac 1800
aaacttaagg aagcttcaag ggcccattgg caaggctgca gaaaggcagt tctaaatgat 1860
atagatgagg acctatcttt tccttcctac atctctaggt ttaaaaagca taaattgatt 1920
ccctgcagtc ctcatttgga atttgaagat gaaagacaat tcaactgcaa gtccagtcct 1980
tgtacagtag ggggtcacag tgaccatggg aaagacttca gtgtaatttt gaagagtaac 2040
cacatcagca tgaccagcaa ggtttccgga tgtggaaacc aaagatacaa gagatactct 2100
ccacagtcat gtttgagtag atattcttcc tctttggaca catcccctag cagcatgtct 2160
agcttgagaa gtacttgttc aagtcataga ttcaatggta atagcagagg taatttgctc 2220
tgcttccata aaagagaaca ccactcagtt gaaaggcaca aacggaaatg tctaaagcac 2280
aactgcttct acttgtctga tgatataaca aagagcagcc aaatgcagtc tgaaccacag 2340
aaagagagga actgcaaatt gtgggaatca tttaaaaatg aaaaatactc aaaacgtaga 2400
tattgtcact gcagagaaag acaaaaactg ggcaaaaatc aacaacaatt ttcagggcta 2460
aaatctacga gaatcatcta ttgtgattct aactcacaga tttcctgtac tggaagcagt 2520
aaaaaaccac ctaattgcca gggaactcag cacgacagat tggactctta ctcaatagag 2580
aaaatgtatt acttgaataa aagcaagaga aatcaagagt ctttgggcag ccctcacatt 2640
tgtgatctgg gaaaagtcag gcccatgaag tgtaactccg ggaatatcag ctgccttcta 2700
aagaactgtt ccagtggccc ttcagaaacc acagaatcaa acactgcaga aggagagagg 2760
acccctctaa cagcaaaaat ccttttagaa agagtacaag ccaagaaatg tcaagaacaa 2820
tcaagtaatg ttgagatctc ttcaaacagt tgtaaaagtg aattagaggc tccttcgcaa 2880
gtcccatgca caattcaact tgcaccatca ggctgtaaca gacaagcatt gcctttgtct 2940
gaaaaaatac agtatgcaag tgagagcaga aatgatcaag acagtgcaat tccaaggact 3000
acggagaaag acaaaagcaa aagttcacac acaaataatt ttacaatttt agcagacact 3060
gattgtgata accatctttc taaaggtata attcacctag taacagagtc tcagtcacta 3120
aacataaaaa gggatgcaac aacaaaagaa caatcaaaac ctttaattag tgaaatccaa 3180
ccttttattc aaagctgtga cccagtacca aatgaattcc ctggtgcttt tccgtctaat 3240
aaatatactg gtgtgactga ttcaacagag acccaagaag accaaataaa tctagactta 3300
caggatgtaa gcatgcatat aaatcatgta gagggaaata taaactctta ctatgacaga 3360
actatgcaga aacctgacaa agtcgaagac ggattagaaa tgtgtcataa atctatctct 3420
ccccctttaa ttcaacagcc cataacattt tctcctgacg aaatagataa atataagatc 3480
ctacagctac aagcccagca gcatatgcag aagcaactcc tatcaaagca tcttcgagtt 3540
ttgcctgctg cagggcctac tgccttctct ccggcctcaa ccgtacagac agttccagtt 3600
caccagcaca cttctatcac caccatccac cacacgttcc tgcagcattt tgctgtttct 3660
gcttccttaa gttctcatag cagtcacctc cctattgctc atctacatcc tctttcacag 3720
gcacatttca gtcctatttc attttcgact ctgactccaa ccattatccc tgcacacccc 3780
actttcttag caggtcatcc cctgcattta gtagctgcta cccccttcca cccatctcac 3840
ataacacttc agcctctgcc ccctacagca tttattccta cattgtttgg tcctcactta 3900
aatccagcca caacttctat catccacttg aatcctttaa tccaaccagt attccaaggt 3960
caagattttt gccatcattc ttgctctagc cagatgcaac agctaaatga agtgaaagag 4020
gccttaaatg tgtccacaca cttgaactaa 4050
<210> 15
<211> 1866
<212> DNA
<213> homo sapiens
<400> 15
atggagcata tccggacgac caaggtcgaa caagtaaaat tacttgaccg attcagtacc 60
agcaacaagt cattaacagg aacactgtat cttacggcta cacatctatt atttatcgac 120
tctcatcaaa aagaaacctg gatattacac caccatattg cctcagtaga gaaacttgct 180
ttgactactt ctggatgccc ccttgtgata cagtgcaaga acttcagaac tgtgcatttc 240
attgttccca gagaaagaga ttgccatgat atttacaact ctttgctaca actgtcaaaa 300
caagcaaaat atgaagatct ctatgcattt tcttataatc ccaaacaaaa tgattcagaa 360
cgactacaag gctggcagct cattgatctc gctgaggaat ataagaggat gggagtgcca 420
aactcacact ggcagttgtc tgatgccaac cgggactaca agatttgtga aacttacccc 480
agagaacttt atgttccccg gatagcaagc aaaccaataa ttgttggtag ttccaagttc 540
cggagcaagg gaagattccc agttctttcc tactatcatc aagataagga ggctgccatt 600
tgtcgatgta gtcagccact ctctggattc agtgccaggt gcctggagga tgaacatttg 660
cttcaagcca ttagtaaagc caatccagtc aatcgctata tgtacgtcat ggataccagg 720
ccaaaactga atgcaatggc caacagagca gctggaaaag gttatgaaaa tgaagacaac 780
tattccaata ttagatttca gtttgttgga attgaaaata ttcatgtcat gaggtccagc 840
cttcagaaat tattggaagt caatggcact aaagggcttt ctgtcaatga tttctactcc 900
ggtttggaga gctcgggatg gcttcgccat atcaaagctg ttatggatgc tgcaatcttc 960
ttggccaaag caataacagt tgaaaatgca agtgtgttgg tgcattgttc cgatggttgg 1020
gataggactt cccaggtttg ttccctgggt tctcttttat tggattccta ctacaggaca 1080
atcaaaggat tcatggtttt aatagaaaag gattggatct cttttggaca taaattttca 1140
gagaggtgtg gccagttgga tggtgaccca aaggaagtct caccagtgtt tactcagttc 1200
ttggaatgtg tgtggcattt gaccgaacag tttccacaag cctttgaatt cagtgaagca 1260
tttcttcttc agatccatga gcatattcat tcatgccagt ttggaaactt ccttggaaat 1320
tgtcagaagg aaagagaaga gctcaagttg aaggagaaga cttattccct gtggccattt 1380
cttttggaag accaaaagaa gtacttaaat cctctctaca gttccgaatc tcacagattt 1440
acagttttgg agccaaatac agtatctttc aattttaagt tttggaggaa catgtaccat 1500
caatttgatc gaacactgca tcctaggcag tctgtattta atataattat gaatatgaat 1560
gagcaaaata aacaattaga gaaagatatt aaagacctag aatctaaaat taaacaacgc 1620
aaaaataagc aaacagatgg catcctcacc aaggaattgt tacattcagt tcatcctgaa 1680
tcacctaacc tcaaaacttc cctgtgtttt aaagagcaga ctctgctacc cgtaaatgat 1740
gctcttcgaa ctatagaggg cagcagcccg gcagataatc gttatagtga atatgcagaa 1800
gagttttcta aatcagaacc tgctgtggtc agcttagagt atggtgtggc aagaatgact 1860
tgttag 1866
<210> 16
<211> 1236
<212> DNA
<213> homo sapiens
<400> 16
atgtggagcg gatggtggct gtggcccctt gtggccgtct gcactgcaga cttctttcgg 60
gacgaggcag agaggatcat gagggactcc cctgtcattg atgggcacaa tgacctcccc 120
tggcagctgc tggatatgtt caacaaccgg ctgcaggacg agagggccaa cctgaccacc 180
ttggccggca cacacaccaa catccccaag ctgagggccg gctttgtggg aggccagttc 240
tggtccgtgt acacgccctg cgacacccag aacaaagacg ccgtgcggag gacgctggag 300
cagatggacg tggtccaccg catgtgccgg atgtacccgg agaccttcct gtatgtcacc 360
agcagtgcag gcattcggca ggccttccgg gaagggaagg tggccagcct gatcggcgtg 420
gagggcggcc actccattga cagcagtttg ggcgtcctgc gggcactcta tcagctgggc 480
atgcggtacc tgaccctcac ccacagctgc aacacgccct gggctgacaa ctggctggtg 540
gacacgggag acagcgagcc ccagagccaa ggcttgtcac cctttgggca gcgtgtggtg 600
aaggagctga accgtctggg ggtcctcatc gacttggctc acgtgtctgt ggccaccatg 660
aaggccaccc tgcagctgtc cagagccccg gtcatcttca gccactcctc ggcctacagc 720
gtgtgcgcaa gccggcgcaa cgtgcctgac gacgtcctga ggctggtgaa acagacagac 780
agcctggtga tggtgaactt ctacaacaat tacatttcct gcaccaacaa ggccaacctg 840
tcccaagtgg ccgaccatct ggatcacatc aaggaggtgg caggagccag agccgtgggt 900
tttggtgggg actttgatgg tgttccaagg gtccctgagg ggctggagga cgtctccaag 960
tatccagacc tgatcgctga gctgctcagg aggaactgga cggaggcgga ggtcaagggc 1020
gcactggctg acaacctgct gagggtcttc gaggctgtgg aacaggccag caacctcaca 1080
caggctcccg aggaggagcc catcccgctg gaccagctgg gtggctcctg caggacccat 1140
tacggctact cctctggggc ttccagcctc catcgccact gggggctcct gctggcctcc 1200
ctcgctcccc tggtcctctg tctgtctctc ctgtga 1236
<210> 17
<211> 2409
<212> DNA
<213> homo sapiens
<400> 17
atgtaccgct ccaccaaggg cgcctccaag gcgcgccggg accagatcaa cgccgagatc 60
cggaacctca aggagctgct gccgctggcc gaagcggaca aggtccggct gtcctacctg 120
cacatcatga gcctcgcctg catctacact cgcaagggcg tcttcttcgc tggtggcact 180
cctctggcgg gccccacggg gcttctctca gctcaagagc ttgaggacat cgtagcggca 240
ctacccggct ttctgcttgt gttcacagcc gaggggaaat tgctctacct gtctgagagt 300
gtgagcgagc atctgggcca ctccatggtg gacctggttg cccagggtga cagcatctac 360
gacatcattg acccagctga ccacctcact gtgcgccagc aactcaccct gccctctgcc 420
ctggacactg atcgcctctt ccgctgccgc ttcaacacct ccaagtccct caggcgccag 480
agtgcaggca acaaactcgt gcttattcga ggccgattcc atgctcaccc acctggagcc 540
tactgggcag gaaatcccgt gttcacagct ttctgtgccc ctctggagcc gagaccccgc 600
ccaggtcctg gccctggccc tggccctgcc tcgctcttcc tggccatgtt ccagagccgc 660
catgctaaag acctggctct actggacatc tccgagagtg tcctaatcta cctgggcttt 720
gagcgcagtg aactgctttg taaatcatgg tatggactgc tgcaccccga ggacctggcc 780
cacgcttctg ctcaacacta ccgcctgttg gctgagagtg gagatattca ggcagagatg 840
gtggtgaggc tacaggccaa gactggaggc tgggcatgga tttactgcct gttatactca 900
gaaggtccag agggacccat tactgccaat aactacccaa tcagtgacat ggaagcctgg 960
agcctccgcc agcagttgaa ctctgaagac acccaggcag cttatgtcct gggcactccg 1020
accatgctgc cctcattccc tgaaaacatt ctttcccagg aagagtgctc cagcactaac 1080
ccactcttca ccgcagcact gggggctccc agaagcacca gcttccccag tgctcctgaa 1140
ctgagtgttg tctctgcatc agaagagctt ccccgaccct ccaaagaact ggacttcagt 1200
tacctgacat tcccttctgg gcctgagcct tctctccaag cagaactaag caaggatctt 1260
gtgtgcactc caccttacac gccccatcag ccaggaggct gtgccttcct cttcagcctc 1320
catgagccct tccagaccca tttgcccacc ccatccagca ctcttcaaga acagctgact 1380
ccaagcactg cgaccttctc tgatcagttg acgcccagca gtgcaacctt cccagatcca 1440
ctaactagcc cactgcaagg ccagttgact gaaacctcgg tcagaagcta tgaagaccag 1500
ttgactccct gcacctccac cttcccagac cagctgcttc ccagcacagc caccttccca 1560
gagcctctgg gcagccctgc ccatgaacag ctgactcctc ccagcacagc attccaagca 1620
cacctggaca gccccagcca aaccttccca gagcaactga gccccaaccc taccaagact 1680
tactttgccc aggagggatg cagttttctc tatgagaagt tgcccccaag tcctagcagc 1740
cctggtaatg gggactgcac gctcttggcc ctagcccagc tccggggccc cctctctgtg 1800
gatgtccccc tggtgcccga aggcctgctc acacctgagg cctctccagt caagcagagt 1860
ttcttccact actctgaaaa ggagcagaat gagatagacc gtctcatcca gcagattagc 1920
caattggctc agggcatgga cagacccttc tcagctgagg ctggcactgg cggactagag 1980
ccacttggag gactggagcc cctggactcc aacctgtccc tgtcaggggc aggcccccct 2040
gtgctcagcc tggacctgaa accctggaaa tgccaggagc tggacttcct ggctgaccct 2100
gataacatgt tcctggaaga gacgcccgtg gaagacatct tcatggatct ctctacccca 2160
gatcccagtg aggaatgggg ctcaggggat cctgaggcag agggcccagg aggggcccca 2220
tcgccttgca acaacctgtc cccagaagac cacagcttcc tggaggacct ggccacatat 2280
gaaaccgcct ttgagacagg tgtctcagca ttcccctatg atgggtttac tgatgagttg 2340
catcaactcc agagccaagt tcaagacagc ttccatgaag atggaagtgg aggggaacca 2400
acgttttga 2409
<210> 18
<211> 3597
<212> DNA
<213> homo sapiens
<400> 18
atggatgaag agactcggca cagccttgag tgcatccagg ccaatcagat ctttcccagg 60
aagcagctga tccgggagga tgagaatctt caggttcctt tccttgaact tcatggagag 120
agcacagagt ttgtgggccg tgccgaggat gccatcattg ccctttccaa ttacagactt 180
cacatcaagt tcaaggagtc tcttgttaat gttccattac agcttataga aagtgttgaa 240
tgccgagata tatttcagct tcatttgact tgcaaagact gcaaagttat caggtgtcag 300
ttttcaacct ttgagcagtg tcaagagtgg ctgaagagac tgaacaacgc aatccgacca 360
cctgctaaaa tagaagatct cttctcattt gcataccatg cttggtgcat ggaggtctat 420
gccagtgaaa aagagcaaca tggagacctg tgcagaccag gggagcatgt aacttcaagg 480
tttaaaaacg aggtggagag gatgggtttt gatatgaaca acgcctggag gatttccaac 540
atcaatgaga agtacaaatt atgtggtagc tatcctcaag agctcatagt gcctgcctgg 600
atcactgaca aagaactgga aagtgtatca agtttcaggt cctggaagcg catccctgcc 660
gtcatctaca ggcaccagag caatggagct gtcattgccc gctgtggaca gccagaggtt 720
agctggtggg gctggcgaaa tgcagatgat gagcatctgg tacagtcagt agccaaagct 780
tgtgcctctg actcccgatc gagtggcagc aagctgtcaa ctaggaacac ttctcgagac 840
tttcccaatg ggggagacct ttctgacgtg gagttcgatt cttctctgtc aaatgcttca 900
ggagcagaga gtttagccat ccaaccgcag aagcttttga tcttggatgc acgctcctat 960
gcagctgctg tggcaaaccg agccaaagga ggaggctgcg aatgcccaga gtattaccca 1020
aactgtgaag ttgtgtttat ggggatggca aacattcatt ctattcggag gagttttcag 1080
tctctgcggt tgctgtgcac tcagatgcca gatccgggaa attggctatc agctcttgaa 1140
agcacaaaat ggctccatca cttgtctgtg cttctgaaat cagcgcttct ggtagtgcat 1200
gctgtggatc aggatcagcg gccggtgcta gtacactgct cagatggctg ggaccgcacc 1260
ccccagattg tggcattggc taagctcttg ctggaccctt attaccgaac catagagggt 1320
ttccaggtcc tcgtggaaat ggagtggctg gattttggcc ataaatttgc tgaccggtgt 1380
ggtcatgggg agaactcgga tgatctgaat gaacgttgcc cagtgtttct gcagtggctt 1440
gactgtgttc atcagcttca gaggcaattt ccttgctctt ttgagttcaa tgaagcattc 1500
cttgtgaaac tggtgcagca tacctattcc tgcctgtttg gaacattcct gtgcaacaac 1560
gccaaggaga gaggggaaaa gcatactcag gaacggacat gttccgtgtg gtcacttctt 1620
cgggcaggca acaaggcttt caaaaaccta ctgtattcct ctcagtcaga agccgtgctg 1680
taccctgtgt gccatgtgcg taacctgatg ctgtggagtg cagtgtacct gccctgccca 1740
tccccaacca cccctgtgga cgacagctgt gcaccatacc cagccccagg caccagccct 1800
gatgatcccc ccctgagccg gctaccaaag actagatcat acgacaatct gaccacagcc 1860
tgtgacaaca cagtgcctct ggccagccgg cgctgcagcg accccagcct gaacgagaag 1920
tggcaggagc accggcgctc actagagctg agcagcctgg ctggccctgg agaggatccc 1980
ctttctgccg acagcctagg gaagcccacc agagtgccgg ggggtgccga gctttctgtt 2040
gcagccggag tagctgaggg gcagatggag aacatcttgc aggaggccac caaagaggag 2100
agtggagtag aggaacctgc ccacagggca ggcattgaga tacaggaggg taaagaggac 2160
cctctcttag aaaaggagag caggaggaag acacctgagg cctcagccat tggacttcac 2220
caagacccag aactgggtga tgctgctctg aggagccatc tggatatgag ctggcctctg 2280
ttctcacagg gcatttctga acagcagagt gggctcagtg ttctcctcag ttctctccag 2340
gtccccccca ggggagagga ttccctggag gtccctgtgg agcagtttcg aatagaagag 2400
attgcagagg gtagggagga agcagttctt ccaatcccag tagatgcaaa agttggctat 2460
ggtacctcac agtcatgttc tctgctacct tcccaagtcc cttttgagac cagaggacca 2520
aacgtggaca gttctacaga catgttagtg gaagataagg tgaagtcagt aagtgggccc 2580
caaggtcatc atagatcttg ccttgtaaat agtggcaagg acaggcttcc tcagaccatg 2640
gaacccagcc cttcagagac aagcctggtc gagaggcccc aagtggggtc tgtggtgcat 2700
aggacttccc ttggcagcac tctcagcctg acacgttccc cttgtgcctt gcctttagcc 2760
gaatgtaaag aggggcttgt gtgcaatggt gccccagaga ctgaaaacag ggcctcagag 2820
cagcccccag gtcttagcac cctccagatg taccccacac ccaatgggca ttgcgccaat 2880
ggggaggctg gtaggagcaa ggactcactg agccgtcagc tgtctgctat gagctgcagc 2940
tctgcccact tacactcaag gaacttgcac cacaagtggc tgcatagcca ctcaggaagg 3000
ccatctgcaa ccagcagccc cgaccagcct tcccgcagcc acctggacga tgatggcatg 3060
tcagtgtaca cagacacgat ccaacagcgc ctgcgtcaga ttgagtcagg ccaccagcag 3120
gaagtagaaa ctttgaagaa acaagtccag gagctgaaga gtcgcctgga gagccagtac 3180
ctgaccagct ccctacactt taatggagac tttggggatg aggtgacttc aatccccgac 3240
tcggaaagca atctggatca gaactgtttg tctcgctgca gcacagagat tttctctgaa 3300
gccagctggg agcaggtgga taaacaggac acagagatga cccgttggct tcctgaccac 3360
ctggccgccc actgctatgc gtgcgacagt gccttctggc ttgccagcag gaagcaccac 3420
tgcaggaatt gtgggaacgt attctgctcc agttgttgta accagaaggt tccagttccc 3480
agccagcagc tctttgaacc cagtcgagta tgcaagtctt gctatagcag cctacatccc 3540
acaagctcca gcattgacct tgaactggat aagcccattg ctgccacttc caactga 3597
<210> 19
<211> 3777
<212> DNA
<213> homo sapiens
<400> 19
atggcctcgg cctgcggggc gccgggcccg gggggcgccc tgggcagcca ggccccctcc 60
tggtaccacc gcgacctgag ccgggcggcc gcggaggagc tgctggcccg ggcgggccgc 120
gatggcagct tcctggtccg agacagcgag agcgtggcgg gggccttcgc gctctgcgtc 180
ctgtatcaga agcatgtgca cacgtatcgc attctgcctg atggagaaga tttcttggct 240
gtgcagacct cgcagggtgt gcctgtgcgc cgcttccaga ccctgggtga gctcatcggc 300
ctgtacgccc agcccaacca gggccttgtg tgcgccctgc ttcttcctgt agagggtgag 360
cgagagccgg acccaccgga tgaccgggat gcctcagatg gggaggatga gaagcccccg 420
ctgcccccgc gctctggctc caccagcatt tctgccccca ctgggcccag cagtcccctg 480
ccagctcctg agactcccac agctccagct gctgagagtg ctcccaatgg gctgagcacc 540
gtctcgcacg actacctgaa aggcagctat gggctggacc tggaagctgt gaggggtgga 600
gccagccacc tgccccacct cacccgtacc ctcgctacct catgccggag gctgcacagt 660
gaggtggaca aggtcctgtc aggcctggag atcctgtcca aggtgtttga ccagcagagc 720
tcgcccatgg tgacccgcct tttgcagcag cagaacctgc cacagacagg ggagcaggaa 780
ctagagagcc tggtgctgaa gctgtcagtg ctaaaggact tcctgtcagg catccagaag 840
aaggccctga aggccctaca ggacatgagc tccacagcac ccccagctcc gcagccatcc 900
acacgtaagg ccaagaccat ccccgtgcag gcctttgagg tgaagctaga tgtgaccctg 960
ggtgacctga ccaagattgg gaagtcacag aagttcacgc tgagcgtgga tgtggagggt 1020
gggcggctgg tgctgctgcg gagacagcgg gactcccagg aggactggac caccttcacg 1080
cacgaccgca tccgccagct cattaagtcc cagcgtgtcc agaacaagct gggtgttgtg 1140
tttgagaagg agaaggaccg gactcagcgc aaggacttca tctttgtcag tgcccggaag 1200
cgggaggcct tctgccagct gttgcagctc atgaagaaca agcactccaa gcaggacgag 1260
cccgacatga tctcagtctt cataggcacc tggaacatgg gaagtgtacc acctccaaaa 1320
aacgtgacat cctggttcac atcgaagggt ctggggaaga ccctggacga ggtcacagtg 1380
accatacccc atgacatcta tgtctttggg acccaggaga actcagtggg cgaccgcgag 1440
tggctggacc tactgcgcgg gggcctcaag gagcttacgg atctggatta ccgcccgatt 1500
gccatgcaat cactgtggaa tatcaaggtg gcagtgctgg tcaagccaga gcacgagaac 1560
cgtatcagcc atgtcagtac gtccagtgtg aagactggca tcgccaacac cctggggaac 1620
aagggggctg tgggcgtctc cttcatgttt aatggcacct catttggctt tgtgaattgt 1680
cacctcacct cgggaaatga gaagacggct cggaggaacc aaaactactt ggacatcctg 1740
cggctgctct cgctgggcga ccggcagctc aatgcctttg acatctctct gcgtttcaca 1800
cacctcttct ggtttgggga cctcaactac cgcctggaca tggatatcca ggagatcctg 1860
aactacatca gcaggaaaga gtttgagccc ctcctcaggg tggaccagct caacctggag 1920
cgggagaagc acaaggtctt ccttcgattc agtgaggagg agatctcctt cccacccacc 1980
taccgctatg agcggggttc ccgggacaca tatgcctggc acaagcagaa gccaactggg 2040
gtccggacca atgtgccctc atggtgtgac cggattctgt ggaaatccta ccctgaaact 2100
cacatcatct gcaattctta tggttgcact gatgacatcg tcaccagcga ccattccccc 2160
gtgtttggga catttgaggt tggagttacc tcccagttca tctccaagaa agggctctca 2220
aagacttcag accaggccta cattgagttt gagagcatcg aggccattgt gaagacagcc 2280
agccgcacca agttcttcat cgagttctac tctacctgcc tggaggaata caagaagagc 2340
tttgagaatg atgcccagag cagtgacaac atcaacttcc tcaaagtgca gtggtcttca 2400
cgccagctgc ccacgctcaa accaattctg gctgatatcg agtacctgca ggaccagcac 2460
ctcctgctca cagtcaagtc catggatggc tatgaatcct atggggagtg tgtggttgca 2520
ctcaaatcca tgatcggcag cacggcccaa cagttcctga ccttcctatc ccaccgtggc 2580
gaggagacag gcaatatcag aggctccatg aaggtgcggg tgcccacgga gcgcctgggc 2640
acccgtgagc ggctctacga gtggatcagc attgataagg atgaggcagg agcaaagagc 2700
aaagccccct ctgtgtcccg agggagccag gagcccaggt cagggagccg caagccagcc 2760
ttcacagagg cctcctgccc gctctccagg ttatttgaag aaccagagaa accgccacca 2820
acggggaggc ccccagcccc accccgagca gctccccggg aggagccctt gacccccagg 2880
ttgaagccag agggagctcc tgaaccagaa ggggtggcgg cccccccacc caagaacagc 2940
ttcaataacc ctgcctacta cgtccttgaa ggggtcccgc accagctgct gcccccggag 3000
ccaccctcgc ctgccagggc ccctgtccca tctgccacca agaacaaagt ggccattaca 3060
gtgcctgctc cacagcttgg gcaccaccgg caccctcgtg tgggagaggg gagttcttca 3120
gatgaggagt ctggaggcac actgccccct ccagactttc cacctccacc actgccggac 3180
tcagccatct tcctgccccc cagcctggat cctttaccag ggccagtggt ccggggccgt 3240
ggtggggctg aggcccgtgg cccaccacct cccaaggccc atccaaggcc tccactgccc 3300
ccaggcccct caccagccag cactttcctg ggggaagtgg ccagtgggga tgaccggtcc 3360
tgctcggtgc tgcagatggc caagacgctg agcgaggtgg actatgcccc tgctgggcct 3420
gcacgctcag cgctcctccc aggccccctg gagctgcagc ccccccgggg actgccctcg 3480
gactatggcc ggcccctcag cttccctcca ccccgcatcc gggagagcat ccaggaagac 3540
ctggcagagg aggctccgtg cctgcagggc gggcgggcca gcgggctggg cgaggcaggc 3600
atgagtgcct ggctgcgggc catcggcttg gagcgctatg aggagggcct ggtgcataat 3660
ggctgggacg acctggagtt tctcagtgac atcaccgagg aggacttgga ggaggctggg 3720
gtgcaggacc cggctcacaa gcgcctcctt ctggacaccc tgcagctcag caagtga 3777
<210> 20
<211> 4080
<212> DNA
<213> homo sapiens
<400> 20
atggcggagg ccggcctgag gggctggctg ctgtgggccc tgctcctgcg cttggcccag 60
agtgagcctt acacaaccat ccaccagcct ggctactgcg ccttctatga cgaatgtggg 120
aagaacccag agctgtctgg aagcctcatg acactctcca acgtgtcctg cctgtccaac 180
acgccggccc gcaagatcac aggtgatcac ctgatcctat tacagaagat ctgcccccgc 240
ctctacaccg gccccaacac ccaagcctgc tgctccgcca agcagctggt atcactggaa 300
gcgagtctgt cgatcaccaa ggccctcctc acccgctgcc cagcctgctc tgacaatttt 360
gtgaacctgc actgccacaa cacgtgcagc cccaatcaga gcctcttcat caatgtgacc 420
cgcgtggccc agctaggggc tggacaactc ccagctgtgg tggcctatga ggccttctac 480
cagcatagct ttgccgagca gagctatgac tcctgcagcc gtgtgcgcgt ccctgcagct 540
gccacgctgg ctgtgggcac catgtgtggc gtgtatggct ctgccctttg caatgcccag 600
cgctggctca acttccaggg agacacaggc aatggtctgg ccccactgga catcaccttc 660
cacctcttgg agcctggcca ggccgtgggg agtgggattc agcctctgaa tgagggggtt 720
gcacgttgca atgagtccca aggtgacgac gtggcgacct gctcctgcca agactgtgct 780
gcatcctgtc ctgccatagc ccgcccccag gccctcgact ccaccttcta cctgggccag 840
atgccgggca gtctggtcct catcatcatc ctctgctctg tcttcgctgt ggtcaccatc 900
ctgcttgtgg gattccgtgt ggcccccgcc agggacaaaa gcaagatggt ggaccccaag 960
aagggcacca gcctctctga caagctcagc ttctccaccc acaccctcct tggccagttc 1020
ttccagggct ggggcacgtg ggtggcttcg tggcctctga ccatcttggt gctatctgtc 1080
atcccggtgg tggccttggc agcgggcctg gtctttacag aactcactac ggaccccgtg 1140
gagctgtggt cggcccccaa cagccaagcc cggagtgaga aagctttcca tgaccagcat 1200
ttcggcccct tcttccgaac caaccaggtg atcctgacgg ctcctaaccg gtccagctac 1260
aggtatgact ctctgctgct ggggcccaag aacttcagcg gaatcctgga cctggacttg 1320
ctgctggagc tgctagagct gcaggagagg ctgcggcacc tccaggtatg gtcgcccgaa 1380
gcacagcgca acatctccct gcaggacatc tgctacgccc ccctcaatcc ggacaatacc 1440
agtctctacg actgctgcat caacagcctc ctgcagtatt tccagaacaa ccgcacgctc 1500
ctgctgctca cagccaacca gacactgatg gggcagacct cccaagtcga ctggaaggac 1560
cattttctgt actgtgccaa tgccccgctc accttcaagg atggcacagc cctggccctg 1620
agctgcatgg ctgactacgg ggcccctgtc ttccccttcc ttgccattgg ggggtacaaa 1680
ggaaaggact attctgaggc agaggccctg atcatgacgt tctccctcaa caattaccct 1740
gccggggacc cccgtctggc ccaggccaag ctgtgggagg aggccttctt agaggaaatg 1800
cgagccttcc agcgtcggat ggctggcatg ttccaggtca cgttcatggc tgagcgctct 1860
ctggaagacg agatcaatcg caccacagct gaagacctgc ccatctttgc caccagctac 1920
attgtcatat tcctgtacat ctctctggcc ctgggcagct attccagctg gagccgagtg 1980
atggtggact ccaaggccac gctgggcctc ggcggggtgg ccgtggtcct gggagcagtc 2040
atggctgcca tgggcttctt ctcctacttg ggtatccgct cctccctggt catcctgcaa 2100
gtggttcctt tcctggtgct gtccgtgggg gctgataaca tcttcatctt tgttctcgag 2160
taccagaggc tgccccggag gcctggggag ccacgagagg tccacattgg gcgagcccta 2220
ggcagggtgg ctcccagcat gctgttgtgc agcctctctg aggccatctg cttcttccta 2280
ggggccctga cccccatgcc agctgtgcgg acctttgccc tgacctctgg ccttgcagtg 2340
atccttgact tcctcctgca gatgtcagcc tttgtggccc tgctctccct ggacagcaag 2400
aggcaggagg cctcccggtt ggacgtctgc tgctgtgtca agccccagga gctgcccccg 2460
cctggccagg gagaggggct cctgcttggc ttcttccaaa aggcttatgc ccccttcctg 2520
ctgcactgga tcactcgagg tgttgtgctg ctgctgtttc tcgccctgtt cggagtgagc 2580
ctctactcca tgtgccacat cagcgtggga ctggaccagg agctggccct gcccaaggac 2640
tcgtacctgc ttgactattt cctctttctg aaccgctact tcgaggtggg ggccccggtg 2700
tactttgtta ccaccttggg ctacaacttc tccagcgagg ctgggatgaa tgccatctgc 2760
tccagtgcag gctgcaacaa cttctccttc acccagaaga tccagtatgc cacagagttc 2820
cctgagcagt cttacctggc catccctgcc tcctcctggg tggatgactt cattgactgg 2880
ctgaccccgt cctcctgctg ccgcctttat atatctggcc ccaataagga caagttctgc 2940
ccctcgaccg tcaactctct gaactgccta aagaactgca tgagcatcac gatgggctct 3000
gtgaggccct cggtggagca gttccataag tatcttccct ggttcctgaa cgaccggccc 3060
aacatcaaat gtcccaaagg cggcctggca gcatacagca cctctgtgaa cttgacttca 3120
gatggccagg ttttagacac agttgccatt ctgtcaccca ggctggagta cagtggcaca 3180
atctcggctc actgcaacct ctacctcctg gattcaacct ccaggttcat ggcctatcac 3240
aagcccctga aaaactcaca ggattacaca gaagctctgc gggcagctcg agagctggca 3300
gccaacatca ctgctgacct gcggaaagtg cctggaacag acccggcttt tgaggtcttc 3360
ccctacacga tcaccaatgt gttttatgag cagtacctga ccatcctccc tgaggggctc 3420
ttcatgctca gcctctgcct tgtgcccacc ttcgctgtct cctgcctcct gctgggcctg 3480
gacctgcgct ccggcctcct caacctgctc tccattgtca tgatcctcgt ggacactgtc 3540
ggcttcatgg ccctgtgggg catcagttac aatgctgtgt ccctcatcaa cctggtctcg 3600
gcggtgggca tgtctgtgga gtttgtgtcc cacattaccc gctcctttgc catcagcacc 3660
aagcccacct ggctggagag ggccaaagag gccaccatct ctatgggaag tgcggtgttt 3720
gcaggtgtgg ccatgaccaa cctgcctggc atccttgtcc tgggcctcgc caaggcccag 3780
ctcattcaga tcttcttctt ccgcctcaac ctcctgatca ctctgctggg cctgctgcat 3840
ggcttggtct tcctgcccgt catcctcagc tacgtggggc ctgacgttaa cccggctctg 3900
gcactggagc agaagcgggc tgaggaggcg gtggcagcag tcatggtggc ctcttgccca 3960
aatcacccct cccgagtctc cacagctgac aacatctatg tcaaccacag ctttgaaggt 4020
tctatcaaag gtgctggtgc catcagcaac ttcttgccca acaatgggcg gcagttctga 4080
4080
<210> 21
<211> 13635
<212> DNA
<213> homo sapiens
<400> 21
atgctgaccc cgccgttgct cctgctgctg cccctgctct cagctctggt cgcggcggct 60
atcgacgccc ctaagacttg cagccccaag cagtttgcct gcagagatca aataacctgt 120
atctcaaagg gctggcggtg cgacggtgag agggactgcc cagacggatc tgacgaggcc 180
cctgagattt gtccacagag taaggcccag cgatgccagc caaacgagca taactgcctg 240
ggtactgagc tgtgtgttcc catgtcccgc ctctgcaatg gggtccagga ctgcatggac 300
ggctcagatg aggggcccca ctgccgagag ctccaaggca actgctctcg cctgggctgc 360
cagcaccatt gtgtccccac actcgatggg cccacctgct actgcaacag cagctttcag 420
cttcaggcag atggcaagac ctgcaaagat tttgatgagt gctcagtgta cggcacctgc 480
agccagctat gcaccaacac agacggctcc ttcatatgtg gctgtgttga aggatacctc 540
ctgcagccgg ataaccgctc ctgcaaggcc aagaacgagc cagtagaccg gccccctgtg 600
ctgttgatag ccaactccca gaacatcttg gccacgtacc tgagtggggc ccaggtgtct 660
accatcacac ctacgagcac gcggcagacc acagccatgg acttcagcta tgccaacgag 720
accgtatgct gggtgcatgt tggggacagt gctgctcaga cgcagctcaa gtgtgcccgc 780
atgcctggcc taaagggctt cgtggatgag cacaccatca acatctccct cagtctgcac 840
cacgtggaac agatggccat cgactggctg acaggcaact tctactttgt ggatgacatc 900
gatgatagga tctttgtctg caacagaaat ggggacacat gtgtcacatt gctagacctg 960
gaactctaca accccaaggg cattgccctg gaccctgcca tggggaaggt gtttttcact 1020
gactatgggc agatcccaaa ggtggaacgc tgtgacatgg atgggcagaa ccgcaccaag 1080
ctcgtcgaca gcaagattgt gtttcctcat ggcatcacgc tggacctggt cagccgcctt 1140
gtctactggg cagatgccta tctggactat attgaagtgg tggactatga gggcaagggc 1200
cgccagacca tcatccaggg catcctgatt gagcacctgt acggcctgac tgtgtttgag 1260
aattatctct atgccaccaa ctcggacaat gccaatgccc agcagaagac gagtgtgatc 1320
cgtgtgaacc gctttaacag caccgagtac caggttgtca cccgggtgga caagggtggt 1380
gccctccaca tctaccacca gaggcgtcag ccccgagtga ggagccatgc ctgtgaaaac 1440
gaccagtatg ggaagccggg tggctgctct gacatctgcc tgctggccaa cagccacaag 1500
gcgcggacct gccgctgccg ttccggcttc agcctgggca gtgacgggaa gtcatgcaag 1560
aagccggagc atgagctgtt cctcgtgtat ggcaagggcc ggccaggcat catccggggc 1620
atggatatgg gggccaaggt cccggatgag cacatgatcc ccattgaaaa cctcatgaac 1680
ccccgagccc tggacttcca cgctgagacc ggcttcatct actttgccga caccaccagc 1740
tacctcattg gccgccagaa gattgatggc actgagcggg agaccatcct gaaggacggc 1800
atccacaatg tggagggtgt ggccgtggac tggatgggag acaatctgta ctggacggac 1860
gatgggccca aaaagacaat cagcgtggcc aggctggaga aagctgctca gacccgcaag 1920
actttaatcg agggcaaaat gacacacccc agggctattg tggtggatcc actcaatggg 1980
tggatgtact ggacagactg ggaggaggac cccaaggaca gtcggcgtgg gcggctggag 2040
agggcgtgga tggatggctc acaccgagac atctttgtca cctccaagac agtgctttgg 2100
cccaatgggc taagcctgga catcccggct gggcgcctct actgggtgga tgccttctac 2160
gaccgcatcg agacgatact gctcaatggc acagaccgga agattgtgta tgaaggtcct 2220
gagctgaacc acgcctttgg cctgtgtcac catggcaact acctcttctg gactgagtat 2280
cggagtggca gtgtctaccg cttggaacgg ggtgtaggag gcgcaccccc cactgtgacc 2340
cttctgcgca gtgagcggcc ccccatcttt gagatccgaa tgtatgatgc ccagcagcag 2400
caagttggca ccaacaaatg ccgggtgaac aatggcggct gcagcagcct gtgcttggcc 2460
acccctggga gccgccagtg cgcctgtgct gaggaccagg tgttggacgc agacggcgtc 2520
acttgcttgg cgaacccatc ctacgtgcct ccaccccagt gccagccagg cgagtttgcc 2580
tgtgccaaca gccgctgcat ccaggagcgc tggaagtgtg acggagacaa cgattgcctg 2640
gacaacagtg atgaggcccc agccctctgc catcagcaca cctgcccctc ggaccgattc 2700
aagtgcgaga acaaccggtg catccccaac cgctggctct gcgacgggga caatgactgt 2760
gggaacagtg aagatgagtc caatgccact tgttcagccc gcacctgccc ccccaaccag 2820
ttctcctgtg ccagtggccg ctgcatcccc atctcctgga cgtgtgatct ggatgacgac 2880
tgtggggacc gctctgatga gtctgcttcg tgtgcctatc ccacctgctt ccccctgact 2940
cagtttacct gcaacaatgg cagatgtatc aacatcaact ggagatgcga caatgacaat 3000
gactgtgggg acaacagtga cgaagccggc tgcagccact cctgttctag cacccagttc 3060
aagtgcaaca gcgggcgttg catccccgag cactggacct gcgatgggga caatgactgc 3120
ggagactaca gtgatgagac acacgccaac tgcaccaacc aggccacgag gccccctggt 3180
ggctgccaca ctgatgagtt ccagtgccgg ctggatggac tatgcatccc cctgcggtgg 3240
cgctgcgatg gggacactga ctgcatggac tccagcgatg agaagagctg tgagggagtg 3300
acccacgtct gcgatcccag tgtcaagttt ggctgcaagg actcagctcg gtgcatcagc 3360
aaagcgtggg tgtgtgatgg cgacaatgac tgtgaggata actcggacga ggagaactgc 3420
gagtccctgg cctgcaggcc accctcgcac ccttgtgcca acaacacctc agtctgcctg 3480
ccccctgaca agctgtgtga tggcaacgac gactgtggcg acggctcaga tgagggcgag 3540
ctctgcgacc agtgctctct gaataacggt ggctgcagcc acaactgctc agtggcacct 3600
ggcgaaggca ttgtgtgttc ctgccctctg ggcatggagc tggggcccga caaccacacc 3660
tgccagatcc agagctactg tgccaagcat ctcaaatgca gccaaaagtg cgaccagaac 3720
aagttcagcg tgaagtgctc ctgctacgag ggctgggtcc tggaacctga cggcgagagc 3780
tgccgcagcc tggacccctt caagccgttc atcattttct ccaaccgcca tgaaatccgg 3840
cgcatcgatc ttcacaaagg agactacagc gtcctggtgc ccggcctgcg caacaccatc 3900
gccctggact tccacctcag ccagagcgcc ctctactgga ccgacgtggt ggaggacaag 3960
atctaccgcg ggaagctgct ggacaacgga gccctgacta gtttcgaggt ggtgattcag 4020
tatggcctgg ccacacccga gggcctggct gtagactgga ttgcaggcaa catctactgg 4080
gtggagagta acctggatca gatcgaggtg gccaagctgg atgggaccct ccggaccacc 4140
ctgctggccg gtgacattga gcacccaagg gcaatcgcac tggatccccg ggatgggatc 4200
ctgttttgga cagactggga tgccagcctg ccccgcattg aggcagcctc catgagtggg 4260
gctgggcgcc gcaccgtgca ccgggagacc ggctctgggg gctggcccaa cgggctcacc 4320
gtggactacc tggagaagcg catcctttgg attgacgcca ggtcagatgc catttactca 4380
gcccgttacg acggctctgg ccacatggag gtgcttcggg gacacgagtt cctgtcgcac 4440
ccgtttgcag tgacgctgta cgggggggag gtctactgga ctgactggcg aacaaacaca 4500
ctggctaagg ccaacaagtg gaccggccac aatgtcaccg tggtacagag gaccaacacc 4560
cagccctttg acctgcaggt gtaccacccc tcccgccagc ccatggctcc caatccctgt 4620
gaggccaatg ggggccaggg cccctgctcc cacctgtgtc tcatcaacta caaccggacc 4680
gtgtcctgcg cctgccccca cctcatgaag ctccacaagg acaacaccac ctgctatgag 4740
tttaagaagt tcctgctgta cgcacgtcag atggagatcc gaggtgtgga cctggatgct 4800
ccctactaca actacatcat ctccttcacg gtgcccgaca tcgacaacgt cacagtgcta 4860
gactacgatg cccgcgagca gcgtgtgtac tggtctgacg tgcggacaca ggccatcaag 4920
cgggccttca tcaacggcac aggcgtggag acagtcgtct ctgcagactt gccaaatgcc 4980
cacgggctgg ctgtggactg ggtctcccga aacctgttct ggacaagcta tgacaccaat 5040
aagaagcaga tcaatgtggc ccggctggat ggctccttca agaacgcagt ggtgcagggc 5100
ctggagcagc cccatggcct tgtcgtccac cctctgcgtg ggaagctcta ctggaccgat 5160
ggtgacaaca tcagcatggc caacatggat ggcagcaatc gcaccctgct cttcagtggc 5220
cagaagggcc ccgtgggcct ggctattgac ttccctgaaa gcaaactcta ctggatcagc 5280
tccgggaacc ataccatcaa ccgctgcaac ctggatggga gtgggctgga ggtcatcgat 5340
gccatgcgga gccagctggg caaggccacc gccctggcca tcatggggga caagctgtgg 5400
tgggctgatc aggtgtcgga aaagatgggc acatgcagca aggctgacgg ctcgggctcc 5460
gtggtccttc ggaacagcac caccctggtg atgcacatga aggtctatga cgagagcatc 5520
cagctggacc ataagggcac caacccctgc agtgtcaaca acggtgactg ctcccagctc 5580
tgcctgccca cgtcagagac gacccgctcc tgcatgtgca cagccggcta tagcctccgg 5640
agtggccagc aggcctgcga gggcgtaggt tcctttctcc tgtactctgt gcatgaggga 5700
atcaggggaa ttcccctgga tcccaatgac aagtcagatg ccctggtccc agtgtccggg 5760
acctcgctgg ctgtcggcat cgacttccac gctgaaaatg acaccatcta ctgggtggac 5820
atgggcctga gcacgatcag ccgggccaag cgggaccaga cgtggcgtga agacgtggtg 5880
accaatggca ttggccgtgt ggagggcatt gcagtggact ggatcgcagg caacatctac 5940
tggacagacc agggctttga tgtcatcgag gtcgcccggc tcaatggctc cttccgctac 6000
gtggtgatct cccagggtct agacaagccc cgggccatca ccgtccaccc ggagaaaggg 6060
tacttgttct ggactgagtg gggtcagtat ccgcgtattg agcggtctcg gctagatggc 6120
acggagcgtg tggtgctggt caacgtcagc atcagctggc ccaacggcat ctcagtggac 6180
taccaggatg ggaagctgta ctggtgcgat gcacggacag acaagattga acggatcgac 6240
ctggagacag gtgagaaccg cgaggtggtt ctgtccagca acaacatgga catgttttca 6300
gtgtctgtgt ttgaggattt catctactgg agtgacagga ctcatgccaa cggctctatc 6360
aagcgcggga gcaaagacaa tgccacagac tccgtgcccc tgcgaaccgg catcggcgtc 6420
cagcttaaag acatcaaagt cttcaaccgg gaccggcaga aaggcaccaa cgtgtgcgcg 6480
gtggccaatg gcgggtgcca gcagctgtgc ctgtaccggg gccgtgggca gcgggcctgc 6540
gcctgtgccc acgggatgct ggctgaagac ggagcatcgt gccgcgagta tgccggctac 6600
ctgctctact cagagcgcac cattctcaag agtatccacc tgtcggatga gcgcaacctc 6660
aatgcgcccg tgcagccctt cgaggaccct gagcacatga agaacgtcat cgccctggcc 6720
tttgactacc gggcaggcac ctctccgggc acccccaatc gcatcttctt cagcgacatc 6780
cactttggga acatccaaca gatcaacgac gatggctcca ggaggatcac cattgtggaa 6840
aacgtgggct ccgtggaagg cctggcctat caccgtggct gggacactct ctattggaca 6900
agctacacga catccaccat cacgcgccac acagtggacc agacccgccc aggggccttc 6960
gagcgtgaga ccgtcatcac tatgtctgga gatgaccacc cacgggcctt cgttttggac 7020
gagtgccaga acctcatgtt ctggaccaac tggaatgagc agcatcccag catcatgcgg 7080
gcggcgctct cgggagccaa tgtcctgacc cttatcgaga aggacatccg tacccccaat 7140
ggcctggcca tcgaccaccg tgccgagaag ctctacttct ctgacgccac cctggacaag 7200
atcgagcggt gcgagtatga cggctcccac cgctatgtga tcctaaagtc agagcctgtc 7260
caccccttcg ggctggccgt gtatggggag cacattttct ggactgactg ggtgcggcgg 7320
gcagtgcagc gggccaacaa gcacgtgggc agcaacatga agctgctgcg cgtggacatc 7380
ccccagcagc ccatgggcat catcgccgtg gccaacgaca ccaacagctg tgaactctct 7440
ccatgccgaa tcaacaacgg tggctgccag gacctgtgtc tgctcactca ccagggccat 7500
gtcaactgct catgccgagg gggccgaatc ctccaggatg acctcacctg ccgagcggtg 7560
aattcctctt gccgagcaca agatgagttt gagtgtgcca atggcgagtg catcaacttc 7620
agcctgacct gcgacggcgt cccccactgc aaggacaagt ccgatgagaa gccatcctac 7680
tgcaactccc gccgctgcaa gaagactttc cggcagtgca gcaatgggcg ctgtgtgtcc 7740
aacatgctgt ggtgcaacgg ggccgacgac tgtggggatg gctctgacga gatcccttgc 7800
aacaagacag cctgtggtgt gggcgagttc cgctgccggg acgggacctg catcgggaac 7860
tccagccgct gcaaccagtt tgtggattgt gaggacgcct cagatgagat gaactgcagt 7920
gccaccgact gcagcagcta cttccgcctg ggcgtgaagg gcgtgctctt ccagccctgc 7980
gagcggacct cactctgcta cgcacccagc tgggtgtgtg atggcgccaa tgactgtggg 8040
gactacagtg atgagcgcga ctgcccaggt gtgaaacgcc ccagatgccc tctgaattac 8100
ttcgcctgcc ctagtgggcg ctgcatcccc atgagctgga cgtgtgacaa agaggatgac 8160
tgtgaacatg gcgaggacga gacccactgc aacaagttct gctcagaggc ccagtttgag 8220
tgccagaacc atcgctgcat ctccaagcag tggctgtgtg acggcagcga tgactgtggg 8280
gatggctcag acgaggctgc tcactgtgaa ggcaagacgt gcggcccctc ctccttctcc 8340
tgccctggca cccacgtgtg cgtccccgag cgctggctct gtgacggtga caaagactgt 8400
gctgatggtg cagacgagag catcgcagct ggttgcttgt acaacagcac ttgtgacgac 8460
cgtgagttca tgtgccagaa ccgccagtgc atccccaagc acttcgtgtg tgaccacgac 8520
cgtgactgtg cagatggctc tgatgagtcc cccgagtgtg agtacccgac ctgcggcccc 8580
agtgagttcc gctgtgccaa tgggcgctgt ctgagctccc gccagtggga gtgtgatggc 8640
gagaatgact gccacgacca gagtgacgag gctcccaaga acccacactg caccagccaa 8700
gagcacaagt gcaatgcctc gtcacagttc ctgtgcagca gtgggcgctg tgtggctgag 8760
gcactgctct gcaacggcca ggatgactgt ggcgacagct cggacgagcg tggctgccac 8820
atcaatgagt gtctcagccg caagctcagt ggctgcagcc aggactgtga ggacctcaag 8880
atcggcttca agtgccgctg tcgccctggc ttccggctga aggacgacgg ccggacgtgt 8940
gctgatgtgg acgagtgcag caccaccttc ccctgcagcc agcgctgcat caacactcat 9000
ggcagctata agtgtctgtg tgtggagggc tatgcacccc gcggcggcga cccccacagc 9060
tgcaaggctg tgactgacga ggaaccgttt ctgatcttcg ccaaccggta ctacctgcgc 9120
aagctcaacc tggacgggtc caactacacg ttacttaagc agggcctgaa caacgccgtt 9180
gccttggatt ttgactaccg agagcagatg atctactgga cagatgtgac cacccagggc 9240
agcatgatcc gaaggatgca ccttaacggg agcaatgtgc aggtcctaca ccgtacaggc 9300
ctcagcaacc ccgatgggct ggctgtggac tgggtgggtg gcaacctgta ctggtgcgac 9360
aaaggccggg acaccatcga ggtgtccaag ctcaatgggg cctatcggac ggtgctggtc 9420
agctctggcc tccgtgagcc cagggctctg gtggtggatg tgcagaatgg gtacctgtac 9480
tggacagact ggggtgacca ttcactgatc ggccgcatcg gcatggatgg gtccagccgc 9540
agcgtcatcg tggacaccaa gatcacatgg cccaatggcc tgacgctgga ctatgtcact 9600
gagcgcatct actgggccga cgcccgcgag gactacattg aatttgccag cctggatggc 9660
tccaatcgcc acgttgtgct gagccaggac atcccgcaca tctttgcact gaccctgttt 9720
gaggactacg tctactggac cgactgggaa acaaagtcca ttaaccgagc ccacaagacc 9780
acgggcacca acaaaacgct cctcatcagc acgctgcacc ggcccatgga cctgcatgtc 9840
ttccatgccc tgcgccagcc agacgtgccc aatcacccct gcaaggtcaa caatggtggc 9900
tgcagcaacc tgtgcctgct gtcccccggg ggagggcaca aatgtgcctg ccccaccaac 9960
ttctacctgg gcagcgatgg gcgcacctgt gtgtccaact gcacggctag ccagtttgta 10020
tgcaagaacg acaagtgcat ccccttctgg tggaagtgtg acaccgagga cgactgcggg 10080
gaccactcag acgagccccc ggactgccct gagttcaagt gccggcccgg acagttccag 10140
tgctccacag gtatctgcac aaaccctgcc ttcatctgcg atggcgacaa tgactgccag 10200
gacaacagtg acgaggccaa ctgtgacatc cacgtctgct tgcccagtca gttcaaatgc 10260
accaacacca accgctgtat tcccggcatc ttccgctgca atgggcagga caactgcgga 10320
gatggggagg atgagaggga ctgccccgag gtgacctgcg cccccaacca gttccagtgc 10380
tccattacca aacggtgcat cccccgggtc tgggtctgcg accgggacaa tgactgtgtg 10440
gatggcagtg atgagcccgc caactgcacc cagatgacct gtggtgtgga cgagttccgc 10500
tgcaaggatt cgggccgctg catcccagcg cgttggaagt gtgacggaga ggatgactgt 10560
ggggatggct cggatgagcc caaggaagag tgtgatgaac gcacctgtga gccataccag 10620
ttccgctgca agaacaaccg ctgcgtgccc ggccgctggc agtgcgacta cgacaacgat 10680
tgcggtgaca actccgatga agagagctgc acccctcggc cctgctccga gagtgagttc 10740
tcctgtgcca acggccgctg catcgcgggg cgctggaaat gcgatggaga ccacgactgc 10800
gcggacggct cggacgagaa agactgcacc ccccgctgtg acatggacca gttccagtgc 10860
aagagcggcc actgcatccc cctgcgctgg cgctgtgacg cagacgccga ctgcatggac 10920
ggcagcgacg aggaggcctg cggcactggc gtgcggacct gccccctgga cgagttccag 10980
tgcaacaaca ccttgtgcaa gccgctggcc tggaagtgcg atggcgagga tgactgtggg 11040
gacaactcag atgagaaccc cgaggagtgt gcccggttcg tgtgccctcc caaccggccc 11100
ttccgttgca agaatgaccg cgtctgtctg tggatcgggc gccaatgcga tggcacggac 11160
aactgtgggg atgggactga tgaagaggac tgtgagcccc ccacagccca caccacccac 11220
tgcaaagaca agaaggagtt tctgtgccgg aaccagcgct gcctctcctc ctccctgcgc 11280
tgcaacatgt tcgatgactg cggggacggc tctgacgagg aggactgcag catcgacccc 11340
aagctgacca gctgcgccac caatgccagc atctgtgggg acgaggcacg ctgcgtgcgc 11400
accgagaaag cggcctactg tgcctgccgc tcgggcttcc acaccgtgcc cggccagccc 11460
ggatgccaag acatcaacga gtgcctgcgc ttcggcacct gctcccagct ctgcaacaac 11520
accaagggcg gccacctctg cagctgcgct cggaacttca tgaagacgca caacacctgc 11580
aaggccgaag gctctgagta ccaggtcctg tacatcgctg atgacaatga gatccgcagc 11640
ctgttccccg gccaccccca ttcggcttac gagcaggcat tccagggtga cgagagtgtc 11700
cgcattgatg ctatggatgt ccatgtcaag gctggccgtg tctattggac caactggcac 11760
acgggcacca tctcctaccg cagcctgcca cctgctgcgc ctcctaccac ttccaaccgc 11820
caccggcgac agattgaccg gggtgtcacc cacctcaaca tttcagggct gaagatgccc 11880
agaggcatcg ccatcgactg ggtggccgga aacgtgtact ggaccgactc gggccgagat 11940
gtgattgagg tggcgcagat gaagggcgag aaccgcaaga cgctcatctc gggcatgatt 12000
gacgagcccc acgccattgt ggtggaccca ctgaggggga ccatgtactg gtcagactgg 12060
ggcaaccacc ccaagattga gacggcagcg atggatggga cgcttcggga gacactggtg 12120
caggacaaca ttcagtggcc cacaggcctg gccgtggatt atcacaatga gcggctgtac 12180
tgggcagacg ccaagctttc agtcatcggc agcatccggc tcaatggcac ggaccccatt 12240
gtggctgctg acagcaaacg aggcctaagt caccccttca gcatcgacgt ctttgaggat 12300
tacatctatg gtgtcaccta catcaataat cgtgtcttca agatccataa gtttggccac 12360
agccccttgg tcaacctgac agggggcctg agccacgcct ctgacgtggt cctttaccat 12420
cagcacaagc agcccgaagt gaccaaccca tgtgaccgca agaaatgcga gtggctctgc 12480
ctgctgagcc ccagtgggcc tgtctgcacc tgtcccaatg ggaagcggct ggacaacggc 12540
acatgcgtgc ctgtgccctc tccaacgccc cccccagatg ctccccggcc tggaacctgt 12600
aacctgcagt gcttcaacgg tggcagctgt ttcctcaatg cacggaggca gcccaagtgc 12660
cgctgccaac cccgctacac gggtgacaag tgtgaactgg accagtgctg ggagcactgt 12720
cgcaatgggg gcacctgtgc tgcctccccc tctggcatgc ccacgtgccg gtgccccacg 12780
ggcttcacgg gccccaaatg cacccagcag gtgtgtgcgg gctactgtgc caacaacagc 12840
acctgcactg tcaaccaggg caaccagccc cagtgccgat gcctacccgg cttcctgggc 12900
gaccgctgcc agtaccggca gtgctctggc tactgtgaga actttggcac atgccagatg 12960
gctgctgatg gctcccgaca atgccgctgc actgcctact ttgagggatc gaggtgtgag 13020
gtgaacaagt gcagccgctg tctcgaaggg gcctgtgtgg tcaacaagca gagtggggat 13080
gtcacctgca actgcacgga tggccgggtg gcccccagct gtctgacctg cgtcggccac 13140
tgcagcaatg gcggctcctg taccatgaac agcaaaatga tgcctgagtg ccagtgccca 13200
ccccacatga cagggccccg gtgtgaggag cacgtcttca gccagcagca gccaggacat 13260
atagcctcca tcctaatccc tctgctgttg ctgctgctgc tggttctggt ggccggagtg 13320
gtattctggt ataagcggcg agtccaaggg gctaagggct tccagcacca acggatgacc 13380
aacggggcca tgaacgtgga gattggaaac cccacctaca agatgtacga aggcggagag 13440
cctgatgatg tgggaggcct actggacgct gactttgccc tggaccctga caagcccacc 13500
aacttcacca accccgtgta tgccacactc tacatggggg gccatggcag tcgccactcc 13560
ctggccagca cggacgagaa gcgagaactc ctgggccggg gccctgagga cgagataggg 13620
gaccccttgg catag 13635
<210> 22
<211> 3345
<212> DNA
<213> homo sapiens
<400> 22
atggcttgca gaagacgcta tttcgtcgag ggcgaggccc ccagcagtga gactggcaca 60
tccctggaca gcccctcagc ctacccccag ggccccttgg tgcccggttc cagcctgagc 120
ccggatcact acgagcacac gtcagtggga gcctatgggc tgtactcggg gccgccgggg 180
caacagcagc gcacgcggag gcccaagctg cagcactcga cctccatcct gcgcaagcag 240
gctgaggagg aggccatcaa gcgctcacgc tcactctccg agagctatga gctctcctcg 300
gacctgcagg acaagcaggt ggagatgcta gaacgaaagt atggggggcg cctggtaacc 360
cgccatgcgg cccgcaccat ccagacggcg tttcgccagt accagatgaa caagaacttc 420
gagcgcttgc gcagctccat gtcagagaac cgcatgtcac gccggattgt gctgtccaac 480
atgaggatgc agttctcctt tgaggggcct gagaaagtgc acagctccta cttcgagggg 540
aagcaggtct cagtgactaa cgacggctcc cagctgggag ccctggtgtc ccctgagtgt 600
ggtgacctca gcgagcccac caccctcaag tctccggccc cctccagtga ctttgcggac 660
gccatcaccg agctggagga cgccttctct aggcaagtga aatcactggc cgagtccatc 720
gacgatgccc tcaactgccg cagcctgcac actgaggagg caccggccct ggatgcggcg 780
cgggcccggg acaccgaacc ccagacagcc ctgcacggca tggaccaccg caaactggac 840
gagatgacgg cctcgtacag tgatgtcacc ctgtacatcg atgaggagga gctgtcgccc 900
cctctgcccc tctcgcaggc aggggaccgg ccgtccagca ccgagtcgga cctgcggcta 960
cgggctgggg gcgcagcccc agactactgg gccctggccc acaaagagga caaggctgac 1020
acggacacga gctgccggag cacgccgtcg ctggagcggc aggagcagcg gctgcgggtg 1080
gagcatctgc cgctgctcac catcgagcca cccagcgaca gctctgtgga ccttagtgac 1140
cgctcggagc gggggtcact caagaggcag agtgcttacg agcgcagcct tggcgggcag 1200
cagggcagtc ccaagcatgg tccccacagc ggcgccccca agagcctccc ccgggaggag 1260
cctgagttgc ggccccggcc ccccaggccc ctggacagcc acttggccat caatggctca 1320
gccaaccggc agagcaagtc tgagtcggac tactcagacg gtgacaatga cagcatcaac 1380
agcacgtcca actccaacga taccatcaac tgcagctccg agtcatcgtc ccgtgacagc 1440
ctgcgggagc agacgctcag caagcagacc taccacaagg aggcccgcaa cagctgggac 1500
tcgcctgcct ttagcaacga tgtcatccgc aagaggcact accgcatcgg cctgaacctc 1560
ttcaacaaga agcctgagaa gggagtccag tacctcatcg agcgtggctt tgtgcccgac 1620
acgcccgtcg gggtggccca cttcctgctg cagcgcaagg gcctcagccg gcagatgatc 1680
ggcgagttcc tgggcaaccg gcagaagcag ttcaaccgtg acgtgctcga ctgcgtcgtg 1740
gacgagatgg acttctctac catggagctg gatgaggccc tcaggaaatt ccaggcgcac 1800
atccgtgtcc aaggggaggc tcagaaagtg gagcggctca tagaggcgtt cagccagcgc 1860
tactgcatct gcaaccctgg ggtggtgcgg caattccgga acccagacac cattttcatc 1920
ctggccttcg ccatcatcct gctgaacacc gacatgtaca gccccaatgt caagcccgag 1980
cggaaaatga agctagagga cttcatcaag aacctccgag gtgtggacga tggtgaggac 2040
attccccgtg agatgctgat ggggatctat gaacggatcc gtaagcgaga gctaaagacc 2100
aatgaggacc atgtgtccca ggtgcagaag gtggagaagc tcattgtggg gaaaaagccg 2160
atcggatccc tgcatcccgg gctcggctgt gtgctctctc tgccccaccg tcggttggtc 2220
tgctactgcc ggctctttga ggttccagac ccaaacaagc cccagaaact cggactacac 2280
cagcgagaaa tcttcctgtt caacgacctc ctggtggtca ccaagatctt ccagaagaag 2340
aagaactcgg tgacgtacag cttccgacag tccttctcct tgtacggcat gcaggtcctg 2400
ctcttcgaga accagtacta ccccaatggc atccggctca cctcgtctgt ccccggagca 2460
gatatcaaag tgttaataaa cttcaacgcc cccaaccctc aagaccggaa gaaattcacc 2520
gatgacctgc gggagtccat tgcggaagtc caagagatgg agaagcacag gatagagtcg 2580
gagctcgaga agcagaaagg cgtcgtgcgg cccagcatgt cccagtgctc tagcctcaaa 2640
aaggagtcgg gcaacggaac actgagccgg gcctgcctgg acgacagcta tgccagcggt 2700
gagggcctca agcgcagcgc cctcagcagc tccctgcggg acctctcgga agccgggaag 2760
cgagggcgtc gcagcagtgc gggatcgcta gagagcaatg tggaagggtc catcattagc 2820
agtcctcaca tgcgccggag agctacatca acacgagagt gtccatctcg cccacaccag 2880
actatgccca actcatcttc cctcctgggc tccttattcg ggagcaagag agggaagccc 2940
cctccccagg cccacctgcc ctcagcccca gccctgccac ccccccaccc accggtggtc 3000
ctgcctcact tgcagcactc tgtggctggc caccacctgg ggcccccaga ggggctgccg 3060
caggccgcca tgcacgggca tcacacccag tactgccaca tgcagaaccc tcccccgtac 3120
caccatcacc accaccacca cccaccccag cacatccagc acgcacacca gtaccaccac 3180
ggcccccatg ggggccaccc agcctacggg gcccatgccc acggccaccc gccgctgccc 3240
tcggcccacg tggggcacac agtgcaccac catgggcagc cccctgcccc gccgcccccc 3300
accagcagca aggccaaacc cagcggcatc agcacaattg tgtag 3345
<210> 23
<211> 1827
<212> DNA
<213> homo sapiens
<400> 23
atggcagcgg cggcggcggc ggtggggccg ggcgcgggcg gcgcggggtc ggcggtcccg 60
ggcggcgcgg ggccctgcgc taccgtgtcg gtgttccccg gcgcccgcct cctcaccatc 120
ggcgacgcga acggcgagat ccagcggcac gcggagcagc aggcgctgcg cctcgaggtg 180
cgcgccggcc cggactcggc gggcatcgcc ctctacagcc atgaagatgt gtgtgtcttt 240
aagtgctcag tgtcccgaga gacagagtgc agccgtgtgg gcaagcagtc cttcatcatc 300
accctgggct gcaacagcgt cctcatccag ttcgccacac ccaacgattt ctgttccttc 360
tacaacatcc tgaaaacctg ccggggccac accctggagc ggtctgtgtt cagcgagcgg 420
acggaggagt cttctgccgt gcagtacttc cagttttatg gctacctgtc ccagcagcag 480
aacatgatgc aggactacgt gcggacaggc acctaccagc gcgccatcct gcaaaaccac 540
accgacttca aggacaagat cgttcttgat gttggctgtg gctctgggat cctgtcgttt 600
tttgccgccc aagctggagc acggaaaatc tacgcggtgg aggccagcac catggcccag 660
cacgctgagg tcttggtgaa gagtaacaac ctgacggacc gcatcgtggt catcccgggc 720
aaggtggagg aggtgtcact ccccgagcag gtggacatca tcatctcgga gcccatgggc 780
tacatgctct tcaacgagcg catgctggag agctacctcc acgccaagaa gtacctgaag 840
cccagcggaa acatgtttcc taccattggt gacgtccacc ttgcaccctt cacggatgaa 900
cagctctaca tggagcagtt caccaaggcc aacttctggt accagccatc tttccatgga 960
gtggacctgt cggccctccg aggtgccgcg gtggatgagt atttccggca gcctgtggtg 1020
gacacatttg acatccggat cctgatggcc aagtctgtca agtacacggt gaacttctta 1080
gaagccaaag aaggagattt gcacaggata gaaatcccat tcaaattcca catgctgcat 1140
tcagggctgg tccacggcct ggctttctgg tttgacgttg ctttcatcgg ctccataatg 1200
accgtgtggc tgtccacagc cccgacagag cccctgaccc actggtacca ggtgcggtgc 1260
ctgttccagt caccactgtt cgccaaggca ggggacacgc tctcagggac atgtctgctt 1320
attgccaaca aaagacagag ctacgacatc agtattgtgg cccaggtgga ccagaccggc 1380
tccaagtcca gtaacctcct ggatctgaaa aaccccttct ttagatacac gggcacaacg 1440
ccctcacccc cacccggctc ccactacaca tctccctcgg aaaacatgtg gaacacgggc 1500
agcacctaca acctcagcag cgggatggcc gtggcaggga tgccgaccgc ctatgacttg 1560
agcagtgtta ttgccagtgg ctccagcgtg ggccacaaca acctgattcc tttagccaac 1620
acggggattg tcaatcacac ccactcccgg atgggctcca taatgagcac ggggattgtc 1680
caagggtcct ccggcgccca gggcagtggt ggtggcagca cgagtgccca ctatgcagtc 1740
aacagccagt tcaccatggg cggccccgcc atctccatgg cgtcgcccat gtccatcccg 1800
accaacacca tgcactacgg gagctag 1827
<210> 24
<211> 2667
<212> DNA
<213> homo sapiens
<400> 24
atgttgtcaa gactttttcg aatgcatggc ctctttgtgg cctcccatcc ctgggaagtc 60
atagtgggga cagtgacact gaccatctgc atgatgtcca tgaacatgtt tactggtaac 120
aataagatct gtggttggaa ttatgaatgt ccaaagtttg aagaggatgt tttgagcagt 180
gacattataa ttctgacaat aacacgatgc atagccatcc tgtatattta cttccagttc 240
cagaatttac gtcaacttgg atcaaaatat attttgggta ttgctggcct tttcacaatt 300
ttctcaagtt ttgtattcag tacagttgtc attcacttct tagacaaaga attgacaggc 360
ttgaatgaag ctttgccctt tttcctactt ttgattgacc tttccagagc aagcacatta 420
gcaaagtttg ccctcagttc caactcacag gatgaagtaa gggaaaatat tgctcgtgga 480
atggcaattt taggtcctac gtttaccctc gatgctcttg ttgaatgtct tgtgattgga 540
gttggtacca tgtcaggggt acgtcagctt gaaattatgt gctgctttgg ctgcatgtca 600
gttcttgcca actacttcgt gttcatgact ttcttcccag cttgtgtgtc cttggtatta 660
gagctttctc gggaaagccg cgagggtcgt ccaatttggc agctcagcca ttttgcccga 720
gttttagaag aagaagaaaa taagccgaat cctgtaactc agagggtcaa gatgattatg 780
tctctaggct tggttcttgt tcatgctcac agtcgctgga tagctgatcc ttctcctcaa 840
aacagtacag cagatacttc taaggtttca ttaggactgg atgaaaatgt gtccaagaga 900
attgaaccaa gtgtttccct ctggcagttt tatctctcta aaatgatcag catggatatt 960
gaacaagtta ttaccctaag tttagctctc cttctggctg tcaagtacat cttctttgaa 1020
caaacagaga cagaatctac actctcatta aaaaacccta tcacatctcc tgtagtgaca 1080
caaaagaaag tcccagacaa ttgttgtaga cgtgaaccta tgctggtcag aaataaccag 1140
aaatgtgatt cagtagagga agagacaggg ataaaccgag aaagaaaagt tgaggttata 1200
aaacccttag tggctgaaac agatacccca aacagagcta catttgtggt tggtaactcc 1260
tccttactcg atacttcatc agtactggtg acacaggaac ctgaaattga acttcccagg 1320
gaacctcggc ctaatgaaga atgtctacag atacttggga atgcagagaa aggtgcaaaa 1380
ttccttagtg atgctgagat catccagtta gtcaatgcta agcatatccc agcctacaag 1440
ttggaaactc tgatggaaac tcatgagcgt ggtgtatcta ttcgccgaca gttactttcc 1500
aagaagcttt cagaaccttc ttctctccag tacctacctt acagggatta taattactcc 1560
ttggtgatgg gagcttgttg tgagaatgtt attggatata tgcccatccc tgttggagtg 1620
gcaggacccc tttgcttaga tgaaaaagaa tttcaggttc caatggcaac aacagaaggt 1680
tgtcttgtgg ccagcaccaa tagaggctgc agagcaatag gtcttggtgg aggtgccagc 1740
agccgagtcc ttgcagatgg gatgactcgt ggcccagttg tgcgtcttcc acgtgcttgt 1800
gactctgcag aagtgaaagc ctggctcgaa acatctgaag ggttcgcagt gataaaggag 1860
gcatttgaca gcactagcag atttgcacgt ctacagaaac ttcatacaag tatagctgga 1920
cgcaaccttt atatccgttt ccagtccagg tcaggggatg ccatggggat gaacatgatt 1980
tcaaagggta cagagaaagc actttcaaaa cttcacgagt atttccctga aatgcagatt 2040
ctagccgtta gtggtaacta ttgtactgac aagaaacctg ctgctataaa ttggatagag 2100
ggaagaggaa aatctgttgt ttgtgaagct gtcattccag ccaaggttgt cagagaagta 2160
ttaaagacta ccacagaggc tatgattgag gtcaacatta acaagaattt agtgggctct 2220
gccatggctg ggagcatagg aggctacaac gcccatgcag caaacattgt caccgccatc 2280
tacattgcct gtggacagga tgcagcacag aatgttggta gttcaaactg tattacttta 2340
atggaagcaa gtggtcccac aaatgaagat ttatatatca gctgcaccat gccatctata 2400
gagataggaa cggtgggtgg tgggaccaac ctactacctc agcaagcctg tttgcagatg 2460
ctaggtgttc aaggagcatg caaagataat cctggggaaa atgcccggca gcttgcccga 2520
attgtgtgtg ggaccgtaat ggctggggaa ttgtcactta tggcagcatt ggcagcagga 2580
catcttgtca aaagtcacat gattcacaac aggtcgaaga tcaatttaca agacctccaa 2640
ggagcttgca ccaagaagac agcctga 2667
<210> 25
<211> 1338
<212> DNA
<213> homo sapiens
<400> 25
atgctgtgtt atgtgacgag gccggacgcg gtgctgatgg aggtggaggt ggaggcgaaa 60
gccaacggcg aggactgcct caaccaggtg tgcaggcgac tgggaatcat agaagttgac 120
tattttggac tgcagtttac gggtagcaaa ggtgaaagtt tatggctaaa cctgagaaac 180
cggatctccc agcagatgga tgggctagcc ccttacaggc ttaaacttag agtcaagttc 240
ttcgtggagc ctcatctcat cttacaggag cagactaggc atatcttttt cttgcacatc 300
aaggaggccc tcttggcagg ccacctcttg tgttccccag agcaggcagt ggaactcagt 360
gccctcctgg cccagaccaa gtttggagac tacaaccaga acactgccaa gtataactat 420
gaggagctct gtgccaagga gctctcctct gccaccttga acagcattgt tgcaaaacat 480
aaggagttgg aggggaccag ccaggcttca gctgaatacc aagttttgca gattgtgtcg 540
gcaatggaaa actatggcat agaatggcat tctgtgcggg atagcgaagg gcagaaactg 600
ctcattgggg ttggacctga aggaatctca atttgtaaag atgactttag cccaattaat 660
aggatagctt atcctgtggt gcagatggcc acccagtcag gaaagaatgt atatttgacg 720
gtcaccaagg aatctgggaa cagcatcgtg ctcttgttta aaatgatcag caccagggcg 780
gccagcgggc tctaccgagc gataacagag acgcacgcat tctacaggtg tgacacagtg 840
accagcgccg tgatgatgca gtatagccgt gacttgaagg gccacttggc atctctgttt 900
ctgaatgaaa acattaacct tggcaagaaa tatgtctttg atattaaaag aacatcaaag 960
gaggtgtatg accatgccag gagggctctg tacaatgctg gcgttgtgga cctcgtttca 1020
agaaacaacc agagcccttc acactcgcct ctgaagtcct cagaaagcag catgaactgc 1080
agcagctgcg agggcctcag ctgccagcag acccgggtgc tgcaggagaa gctacgcaag 1140
ctgaaggaag ccatgctgtg catggtgtgc tgcgaggagg agatcaactc caccttctgt 1200
ccctgtggcc acactgtgtg ctgtgagagc tgcgccgccc agctacagtc atgtcccgtc 1260
tgcaggtcgc gtgtggagca tgtccagcac gtctatctgc caacgcacac cagtcttctc 1320
aatctgactg taatctaa 1338
<210> 26
<211> 4029
<212> DNA
<213> homo sapiens
<400> 26
atgagggcga acgacgctct gcaggtgctg ggcttgcttt tcagcctggc ccggggctcc 60
gaggtgggca actctcaggc agtgtgtcct gggactctga atggcctgag tgtgaccggc 120
gatgctgaga accaatacca gacactgtac aagctctacg agaggtgtga ggtggtgatg 180
gggaaccttg agattgtgct cacgggacac aatgccgacc tctccttcct gcagtggatt 240
cgagaagtga caggctatgt cctcgtggcc atgaatgaat tctctactct accattgccc 300
aacctccgcg tggtgcgagg gacccaggtc tacgatggga agtttgccat cttcgtcatg 360
ttgaactata acaccaactc cagccacgct ctgcgccagc tccgcttgac tcagctcacc 420
gagattctgt cagggggtgt ttatattgag aagaacgata agctttgtca catggacaca 480
attgactgga gggacatcgt gagggaccga gatgctgaga tagtggtgaa ggacaatggc 540
agaagctgtc ccccctgtca tgaggtttgc aaggggcgat gctggggtcc tggatcagaa 600
gactgccaga cattgaccaa gaccatctgt gctcctcagt gtaatggtca ctgctttggg 660
cccaacccca accagtgctg ccatgatgag tgtgccgggg gctgctcagg ccctcaggac 720
acagactgct ttgcctgccg gcacttcaat gacagtggag cctgtgtacc tcgctgtcca 780
cagcctcttg tctacaacaa gctaactttc cagctggaac ccaatcccca caccaagtat 840
cagtatggag gagtttgtgt agccagctgt ccccataact ttgtggtgga tcaaacatcc 900
tgtgtcaggg cctgtcctcc tgacaagatg gaagtagata aaaatgggct caagatgtgt 960
gagccttgtg ggggactatg tcccaaagcc tgtgagggaa caggctctgg gagccgcttc 1020
cagactgtgg actcgagcaa cattgatgga tttgtgaact gcaccaagat cctgggcaac 1080
ctggactttc tgatcaccgg cctcaatgga gacccctggc acaagatccc tgccctggac 1140
ccagagaagc tcaatgtctt ccggacagta cgggagatca caggttacct gaacatccag 1200
tcctggccgc cccacatgca caacttcagt gttttttcca atttgacaac cattggaggc 1260
agaagcctct acaaccgggg cttctcattg ttgatcatga agaacttgaa tgtcacatct 1320
ctgggcttcc gatccctgaa ggaaattagt gctgggcgta tctatataag tgccaatagg 1380
cagctctgct accaccactc tttgaactgg accaaggtgc ttcgggggcc tacggaagag 1440
cgactagaca tcaagcataa tcggccgcgc agagactgcg tggcagaggg caaagtgtgt 1500
gacccactgt gctcctctgg gggatgctgg ggcccaggcc ctggtcagtg cttgtcctgt 1560
cgaaattata gccgaggagg tgtctgtgtg acccactgca actttctgaa tggggagcct 1620
cgagaatttg cccatgaggc cgaatgcttc tcctgccacc cggaatgcca acccatggag 1680
ggcactgcca catgcaatgg ctcgggctct gatacttgtg ctcaatgtgc ccattttcga 1740
gatgggcccc actgtgtgag cagctgcccc catggagtcc taggtgccaa gggcccaatc 1800
tacaagtacc cagatgttca gaatgaatgt cggccctgcc atgagaactg cacccagggg 1860
tgtaaaggac cagagcttca agactgttta ggacaaacac tggtgctgat cggcaaaacc 1920
catctgacaa tggctttgac agtgatagca ggattggtag tgattttcat gatgctgggc 1980
ggcacttttc tctactggcg tgggcgccgg attcagaata aaagggctat gaggcgatac 2040
ttggaacggg gtgagagcat agagcctctg gaccccagtg agaaggctaa caaagtcttg 2100
gccagaatct tcaaagagac agagctaagg aagcttaaag tgcttggctc gggtgtcttt 2160
ggaactgtgc acaaaggagt gtggatccct gagggtgaat caatcaagat tccagtctgc 2220
attaaagtca ttgaggacaa gagtggacgg cagagttttc aagctgtgac agatcatatg 2280
ctggccattg gcagcctgga ccatgcccac attgtaaggc tgctgggact atgcccaggg 2340
tcatctctgc agcttgtcac tcaatatttg cctctgggtt ctctgctgga tcatgtgaga 2400
caacaccggg gggcactggg gccacagctg ctgctcaact ggggagtaca aattgccaag 2460
ggaatgtact accttgagga acatggtatg gtgcatagaa acctggctgc ccgaaacgtg 2520
ctactcaagt cacccagtca ggttcaggtg gcagattttg gtgtggctga cctgctgcct 2580
cctgatgata agcagctgct atacagtgag gccaagactc caattaagtg gatggccctt 2640
gagagtatcc actttgggaa atacacacac cagagtgatg tctggagcta tggtgtgaca 2700
gtttgggagt tgatgacctt cggggcagag ccctatgcag ggctacgatt ggctgaagta 2760
ccagacctgc tagagaaggg ggagcggttg gcacagcccc agatctgcac aattgatgtc 2820
tacatggtga tggtcaagtg ttggatgatt gatgagaaca ttcgcccaac ctttaaagaa 2880
ctagccaatg agttcaccag gatggcccga gacccaccac ggtatctggt cataaagaga 2940
gagagtgggc ctggaatagc ccctgggcca gagccccatg gtctgacaaa caagaagcta 3000
gaggaagtag agctggagcc agaactagac ctagacctag acttggaagc agaggaggac 3060
aacctggcaa ccaccacact gggctccgcc ctcagcctac cagttggaac acttaatcgg 3120
ccacgtggga gccagagcct tttaagtcca tcatctggat acatgcccat gaaccagggt 3180
aatcttgggg agtcttgcca ggagtctgca gtttctggga gcagtgaacg gtgcccccgt 3240
ccagtctctc tacacccaat gccacgggga tgcctggcat cagagtcatc agaggggcat 3300
gtaacaggct ctgaggctga gctccaggag aaagtgtcaa tgtgtaggag ccggagcagg 3360
agccggagcc cacggccacg cggagatagc gcctaccatt cccagcgcca cagtctgctg 3420
actcctgtta ccccactctc cccacccggg ttagaggaag aggatgtcaa cggttatgtc 3480
atgccagata cacacctcaa aggtactccc tcctcccggg aaggcaccct ttcttcagtg 3540
ggtctcagtt ctgtcctggg tactgaagaa gaagatgaag atgaggagta tgaatacatg 3600
aaccggagga gaaggcacag tccacctcat ccccctaggc caagttccct tgaggagctg 3660
ggttatgagt acatggatgt ggggtcagac ctcagtgcct ctctgggcag cacacagagt 3720
tgcccactcc accctgtacc catcatgccc actgcaggca caactccaga tgaagactat 3780
gaatatatga atcggcaacg agatggaggt ggtcctgggg gtgattatgc agccatgggg 3840
gcctgcccag catctgagca agggtatgaa gagatgagag cttttcaggg gcctggacat 3900
caggcccccc atgtccatta tgcccgccta aaaactctac gtagcttaga ggctacagac 3960
tctgcctttg ataaccctga ttactggcat agcaggcttt tccccaaggc taatgcccag 4020
agaacgtaa 4029
<210> 27
<211> 1482
<212> DNA
<213> homo sapiens
<400> 27
atggccctct tcggggccct cttcctagcg ctgctggcag gcgcacatgc agagttccca 60
ggctgcaaga tccgcgtcac ctccaaggcg ctggagctgg tgaagcagga ggggctgcgc 120
tttctggagc aagagctgga gactatcacc attccggacc tgcggggcaa agaaggccac 180
ttctactaca acatctctga ggtgaaggtc acagagctgc aactgacatc ttccgagctc 240
gatttccagc cacagcagga gctgatgctt caaatcacca atgcctcctt ggggctgcgc 300
ttccggagac agctgctcta ctggttcttc tatgatgggg gctacatcaa cgcctcagct 360
gagggtgtgt ccatccgcac tggtctggag ctctcccggg atcccgctgg acggatgaaa 420
gtgtccaatg tctcctgcca ggcctctgtc tccagaatgc acgcggcctt cgggggaacc 480
ttcaagaagg tgtatgattt tctctccacg ttcatcacct cagggatgcg cttcctcctc 540
aaccagcaga tctgccctgt cctctaccac gcagggacgg tcctgctcaa ctccctcctg 600
gacaccgtgc ctgtgcgcag ttctgtggac gagcttgttg gcattgacta ttccctcatg 660
aaggatcctg tggcttccac cagcaacctg gacatggact tccggggggc cttcttcccc 720
ctgactgaga ggaactggag cctccccaac cgggcagtgg agccccagct gcaggaggaa 780
gagcggatgg tgtatgtggc cttctctgag ttcttcttcg actctgccat ggagagctac 840
ttccgggcgg gggccctgca gctgttgctg gtgggggaca aggtgcccca cgacctggac 900
atgctgctga gggccaccta ctttgggagc attgtcctgc tgagcccagc agtgattgac 960
tccccattga agctggagct gcgggtcctg gccccaccgc gctgcaccat caagccctct 1020
ggcaccacca tctctgtcac tgctagcgtc accattgccc tggtcccacc agaccagcct 1080
gaggtccagc tgtccagcat gactatggac gcccgtctca gcgccaagat ggctctccgg 1140
gggaaggccc tgcgcacgca gctggacctg cgcaggttcc gaatctattc caaccattct 1200
gcactggagt cgctggctct gatcccatta caggcccctc tgaagaccat gctgcagatt 1260
ggggtgatgc ccatgctcaa tgagcggacc tggcgtgggg tgcagatccc actacctgag 1320
ggcatcaact ttgtgcatga ggtggtgacg aaccatgcgg gattcctcac catcggggct 1380
gatctccact ttgccaaagg gctgcgagag gtgattgaga agaaccggcc tgctgatgtc 1440
agggcgtcca ctgcccccac accgtccaca gcagctgtct ga 1482
<210> 28
<211> 2022
<212> DNA
<213> homo sapiens
<400> 28
atggccggga aggcggcaga ggagagaggg ctgccgaaag gggccactcc ccaggatacc 60
tcgggcctcc aggatagatt gttctcctct gaaagtgaca acagcctgta cttcacctac 120
agtggccagc ccaacaccct ggaggtcaga gacctcaact accaggtgga cctggcctct 180
caggtccctt ggtttgagca gctggctcag ttcaagatgc cctggacatc tcccagctgc 240
cagaattctt gtgagctggg catccagaac ctaagcttca aagtgagaag tgggcagatg 300
ctggccatca tagggagctc aggttgtggg agagcctcct tgctagatgt gatcactggc 360
cgaggtcacg gcggcaagat caagtcaggc cagatctgga tcaatgggca gcccagctcg 420
cctcagctgg tgaggaagtg tgtggcccac gtgcgccagc acaaccagct gctccccaac 480
ttgactgtgc gagagacctt ggccttcatt gcccagatgc ggctgcccag aaccttctcc 540
caggcccagc gtgacaaaag ggtggaggac gtgatcgcgg agctgcggct taggcagtgc 600
gctgacaccc gcgtgggcaa catgtacgtg cgggggttgt cggggggtga gcgcaggaga 660
gtcagcattg gggtgcagct cctgtggaac ccaggaatcc ttattctcga cgaacccacc 720
tctgggctcg acagcttcac agcccacaac ctggtgaaga ccttgtccag gctggccaaa 780
ggcaaccggc tggtgctcat ctccctccac cagcctcgct ctgacatctt caggctgttt 840
gatctggtcc tcctgatgac gtctggcacc cccatctact taggggcggc ccagcacatg 900
gtccagtatt tcacagccat cggctacccc tgtcctcgct acagcaatcc tgctgacttc 960
tatgtggacc tgaccagcat tgacaggcgc agcagagagc aggaattggc caccagggag 1020
aaggctcagt cactcgcagc cctgtttcta gaaaaagtgc gtgacttaga tgactttcta 1080
tggaaagcag agacgaagga tcttgacgag gacacctgtg tggaaagcag cgtgacccca 1140
ctagacacca actgcctccc gagtcctacg aagatgcctg gggcggtgca gcagtttacg 1200
acgctgatcc gtcgtcagat ttccaacgac ttccgagacc tgcccaccct cctcatccat 1260
ggggcggagg cctgtctgat gtcaatgacc atcggcttcc tctattttgg ccatgggagc 1320
atccagctct ccttcatgga tacagccgcc ctcttgttca tgatcggtgc tctcatccct 1380
ttcaacgtca ttctggatgt catctccaaa tgttactcag agagggcaat gctttactat 1440
gaactggaag acgggctgta caccactggt ccatatttct ttgccaagat cctcggggag 1500
cttccggagc actgtgccta catcatcatc tacgggatgc ccacctactg gctggccaac 1560
ctgaggccag gcctccagcc cttcctgctg cacttcctgc tggtgtggct ggtggtcttc 1620
tgttgcagga ttatggccct ggccgccgcg gccctgctcc ccaccttcca catggcctcc 1680
ttcttcagca atgccctcta caactccttc tacctcgccg ggggcttcat gataaacttg 1740
agcagcctgt ggacagtgcc cgcgtggatt tccaaagtgt ccttcctgcg gtggtgtttt 1800
gaagggctga tgaagattca gttcagcaga agaacttata aaatgcctct cgggaacctc 1860
accatcgcgg tctcaggaga taaaatcctc agtgtcatgg agctggactc gtaccctctc 1920
tacgccatct acctcatcgt cattggcctc agcggtggct tcatggtcct gtactacgtg 1980
tccttaaggt tcatcaaaca gaaaccaagt caagactggt ga 2022
<210> 29
<211> 7434
<212> DNA
<213> homo sapiens
<400> 29
atgcttaggg gtccggggcc cgggctgctg ctgctggccg tccagtgcct ggggacagcg 60
gtgccctcca cgggagcctc gaagagcaag aggcaggctc agcaaatggt tcagccccag 120
tccccggtgg ctgtcagtca aagcaagccc ggttgttatg acaatggaaa acactatcag 180
ataaatcaac agtgggagcg gacctaccta ggcaatgcgt tggtttgtac ttgttatgga 240
ggaagccgag gttttaactg cgagagtaaa cctgaagctg aagagacttg ctttgacaag 300
tacactggga acacttaccg agtgggtgac acttatgagc gtcctaaaga ctccatgatc 360
tgggactgta cctgcatcgg ggctgggcga gggagaataa gctgtaccat cgcaaaccgc 420
tgccatgaag ggggtcagtc ctacaagatt ggtgacacct ggaggagacc acatgagact 480
ggtggttaca tgttagagtg tgtgtgtctt ggtaatggaa aaggagaatg gacctgcaag 540
cccatagctg agaagtgttt tgatcatgct gctgggactt cctatgtggt cggagaaacg 600
tgggagaagc cctaccaagg ctggatgatg gtagattgta cttgcctggg agaaggcagc 660
ggacgcatca cttgcacttc tagaaataga tgcaacgatc aggacacaag gacatcctat 720
agaattggag acacctggag caagaaggat aatcgaggaa acctgctcca gtgcatctgc 780
acaggcaacg gccgaggaga gtggaagtgt gagaggcaca cctctgtgca gaccacatcg 840
agcggatctg gccccttcac cgatgttcgt gcagctgttt accaaccgca gcctcacccc 900
cagcctcctc cctatggcca ctgtgtcaca gacagtggtg tggtctactc tgtggggatg 960
cagtggctga agacacaagg aaataagcaa atgctttgca cgtgcctggg caacggagtc 1020
agctgccaag agacagctgt aacccagact tacggtggca actcaaatgg agagccatgt 1080
gtcttaccat tcacctacaa tggcaggacg ttctactcct gcaccacaga agggcgacag 1140
gacggacatc tttggtgcag cacaacttcg aattatgagc aggaccagaa atactctttc 1200
tgcacagacc acactgtttt ggttcagact cgaggaggaa attccaatgg tgccttgtgc 1260
cacttcccct tcctatacaa caaccacaat tacactgatt gcacttctga gggcagaaga 1320
gacaacatga agtggtgtgg gaccacacag aactatgatg ccgaccagaa gtttgggttc 1380
tgccccatgg ctgcccacga ggaaatctgc acaaccaatg aaggggtcat gtaccgcatt 1440
ggagatcagt gggataagca gcatgacatg ggtcacatga tgaggtgcac gtgtgttggg 1500
aatggtcgtg gggaatggac atgcattgcc tactcgcagc ttcgagatca gtgcattgtt 1560
gatgacatca cttacaatgt gaacgacaca ttccacaagc gtcatgaaga ggggcacatg 1620
ctgaactgta catgcttcgg tcagggtcgg ggcaggtgga agtgtgatcc cgtcgaccaa 1680
tgccaggatt cagagactgg gacgttttat caaattggag attcatggga gaagtatgtg 1740
catggtgtca gataccagtg ctactgctat ggccgtggca ttggggagtg gcattgccaa 1800
cctttacaga cctatccaag ctcaagtggt cctgtcgaag tatttatcac tgagactccg 1860
agtcagccca actcccaccc catccagtgg aatgcaccac agccatctca catttccaag 1920
tacattctca ggtggagacc taaaaattct gtaggccgtt ggaaggaagc taccatacca 1980
ggccacttaa actcctacac catcaaaggc ctgaagcctg gtgtggtata cgagggccag 2040
ctcatcagca tccagcagta cggccaccaa gaagtgactc gctttgactt caccaccacc 2100
agcaccagca cacctgtgac cagcaacacc gtgacaggag agacgactcc cttttctcct 2160
cttgtggcca cttctgaatc tgtgaccgaa atcacagcca gtagctttgt ggtctcctgg 2220
gtctcagctt ccgacaccgt gtcgggattc cgggtggaat atgagctgag tgaggaggga 2280
gatgagccac agtacctgga tcttccaagc acagccactt ctgtgaacat ccctgacctg 2340
cttcctggcc gaaaatacat tgtaaatgtc tatcagatat ctgaggatgg ggagcagagt 2400
ttgatcctgt ctacttcaca aacaacagcg cctgatgccc ctcctgaccc gactgtggac 2460
caagttgatg acacctcaat tgttgttcgc tggagcagac cccaggctcc catcacaggg 2520
tacagaatag tctattcgcc atcagtagaa ggtagcagca cagaactcaa ccttcctgaa 2580
actgcaaact ccgtcaccct cagtgacttg caacctggtg ttcagtataa catcactatc 2640
tatgctgtgg aagaaaatca agaaagtaca cctgttgtca ttcaacaaga aaccactggc 2700
accccacgct cagatacagt gccctctccc agggacctgc agtttgtgga agtgacagac 2760
gtgaaggtca ccatcatgtg gacaccgcct gagagtgcag tgaccggcta ccgtgtggat 2820
gtgatccccg tcaacctgcc tggcgagcac gggcagaggc tgcccatcag caggaacacc 2880
tttgcagaag tcaccgggct gtcccctggg gtcacctatt acttcaaagt ctttgcagtg 2940
agccatggga gggagagcaa gcctctgact gctcaacaga caaccaaact ggatgctccc 3000
actaacctcc agtttgtcaa tgaaactgat tctactgtcc tggtgagatg gactccacct 3060
cgggcccaga taacaggata ccgactgacc gtgggcctta cccgaagagg acagcccagg 3120
cagtacaatg tgggtccctc tgtctccaag tacccactga ggaatctgca gcctgcatct 3180
gagtacaccg tatccctcgt ggccataaag ggcaaccaag agagccccaa agccactgga 3240
gtctttacca cactgcagcc tgggagctct attccacctt acaacaccga ggtgactgag 3300
accaccattg tgatcacatg gacgcctgct ccaagaattg gttttaagct gggtgtacga 3360
ccaagccagg gaggagaggc accacgagaa gtgacttcag actcaggaag catcgttgtg 3420
tccggcttga ctccaggagt agaatacgtc tacaccatcc aagtcctgag agatggacag 3480
gaaagagatg cgccaattgt aaacaaagtg gtgacaccat tgtctccacc aacaaacttg 3540
catctggagg caaaccctga cactggagtg ctcacagtct cctgggagag gagcaccacc 3600
ccagacatta ctggttatag aattaccaca acccctacaa acggccagca gggaaattct 3660
ttggaagaag tggtccatgc tgatcagagc tcctgcactt ttgataacct gagtcccggc 3720
ctggagtaca atgtcagtgt ttacactgtc aaggatgaca aggaaagtgt ccctatctct 3780
gataccatca tcccagaggt gccccaactc actgacctaa gctttgttga tataaccgat 3840
tcaagcatcg gcctgaggtg gaccccgcta aactcttcca ccattattgg gtaccgcatc 3900
acagtagttg cggcaggaga aggtatccct atttttgaag attttgtgga ctcctcagta 3960
ggatactaca cagtcacagg gctggagccg ggcattgact atgatatcag cgttatcact 4020
ctcattaatg gcggcgagag tgcccctact acactgacac aacaaacggc tgttcctcct 4080
cccactgacc tgcgattcac caacattggt ccagacacca tgcgtgtcac ctgggctcca 4140
cccccatcca ttgatttaac caacttcctg gtgcgttact cacctgtgaa aaatgaggaa 4200
gatgttgcag agttgtcaat ttctccttca gacaatgcag tggtcttaac aaatctcctg 4260
cctggtacag aatatgtagt gagtgtctcc agtgtctacg aacaacatga gagcacacct 4320
cttagaggaa gacagaaaac aggtcttgat tccccaactg gcattgactt ttctgatatt 4380
actgccaact cttttactgt gcactggatt gctcctcgag ccaccatcac tggctacagg 4440
atccgccatc atcccgagca cttcagtggg agacctcgag aagatcgggt gccccactct 4500
cggaattcca tcaccctcac caacctcact ccaggcacag agtatgtggt cagcatcgtt 4560
gctcttaatg gcagagagga aagtccctta ttgattggcc aacaatcaac agtttctgat 4620
gttccgaggg acctggaagt tgttgctgcg acccccacca gcctactgat cagctgggat 4680
gctcctgctg tcacagtgag atattacagg atcacttacg gagagacagg aggaaatagc 4740
cctgtccagg agttcactgt gcctgggagc aagtctacag ctaccatcag cggccttaaa 4800
cctggagttg attataccat cactgtgtat gctgtcactg gccgtggaga cagccccgca 4860
agcagcaagc caatttccat taattaccga acagaaattg acaaaccatc ccagatgcaa 4920
gtgaccgatg ttcaggacaa cagcattagt gtcaagtggc tgccttcaag ttcccctgtt 4980
actggttaca gagtaaccac cactcccaaa aatggaccag gaccaacaaa aactaaaact 5040
gcaggtccag atcaaacaga aatgactatt gaaggcttgc agcccacagt ggagtatgtg 5100
gttagtgtct atgctcagaa tccaagcgga gagagtcagc ctctggttca gactgcagta 5160
accaacattg atcgccctaa aggactggca ttcactgatg tggatgtcga ttccatcaaa 5220
attgcttggg aaagcccaca ggggcaagtt tccaggtaca gggtgaccta ctcgagccct 5280
gaggatggaa tccatgagct attccctgca cctgatggtg aagaagacac tgcagagctg 5340
caaggcctca gaccgggttc tgagtacaca gtcagtgtgg ttgccttgca cgatgatatg 5400
gagagccagc ccctgattgg aacccagtcc acagctattc ctgcaccaac tgacctgaag 5460
ttcactcagg tcacacccac aagcctgagc gcccagtgga caccacccaa tgttcagctc 5520
actggatatc gagtgcgggt gacccccaag gagaagaccg gaccaatgaa agaaatcaac 5580
cttgctcctg acagctcatc cgtggttgta tcaggactta tggtggccac caaatatgaa 5640
gtgagtgtct atgctcttaa ggacactttg acaagcagac cagctcaggg agttgtcacc 5700
actctggaga atgtcagccc accaagaagg gctcgtgtga cagatgctac tgagaccacc 5760
atcaccatta gctggagaac caagactgag acgatcactg gcttccaagt tgatgccgtt 5820
ccagccaatg gccagactcc aatccagaga accatcaagc cagatgtcag aagctacacc 5880
atcacaggtt tacaaccagg cactgactac aagatctacc tgtacacctt gaatgacaat 5940
gctcggagct cccctgtggt catcgacgcc tccactgcca ttgatgcacc atccaacctg 6000
cgtttcctgg ccaccacacc caattccttg ctggtatcat ggcagccgcc acgtgccagg 6060
attaccggct acatcatcaa gtatgagaag cctgggtctc ctcccagaga agtggtccct 6120
cggccccgcc ctggtgtcac agaggctact attactggcc tggaaccggg aaccgaatat 6180
acaatttatg tcattgccct gaagaataat cagaagagcg agcccctgat tggaaggaaa 6240
aagacagacg agcttcccca actggtaacc cttccacacc ccaatcttca tggaccagag 6300
atcttggatg ttccttccac agttcaaaag acccctttcg tcacccaccc tgggtatgac 6360
actggaaatg gtattcagct tcctggcact tctggtcagc aacccagtgt tgggcaacaa 6420
atgatctttg aggaacatgg ttttaggcgg accacaccgc ccacaacggc cacccccata 6480
aggcataggc caagaccata cccgccgaat gtaggtgagg aaatccaaat tggtcacatc 6540
cccagggaag atgtagacta tcacctgtac ccacacggtc cgggactcaa tccaaatgcc 6600
tctacaggac aagaagctct ctctcagaca accatctcat gggccccatt ccaggacact 6660
tctgagtaca tcatttcatg tcatcctgtt ggcactgatg aagaaccctt acagttcagg 6720
gttcctggaa cttctaccag tgccactctg acaggcctca ccagaggtgc cacctacaac 6780
atcatagtgg aggcactgaa agaccagcag aggcataagg ttcgggaaga ggttgttacc 6840
gtgggcaact ctgtcaacga aggcttgaac caacctacgg atgactcgtg ctttgacccc 6900
tacacagttt cccattatgc cgttggagat gagtgggaac gaatgtctga atcaggcttt 6960
aaactgttgt gccagtgctt aggctttgga agtggtcatt tcagatgtga ttcatctaga 7020
tggtgccatg acaatggtgt gaactacaag attggagaga agtgggaccg tcagggagaa 7080
aatggccaga tgatgagctg cacatgtctt gggaacggaa aaggagaatt caagtgtgac 7140
cctcatgagg caacgtgtta tgatgatggg aagacatacc acgtaggaga acagtggcag 7200
aaggaatatc tcggtgccat ttgctcctgc acatgctttg gaggccagcg gggctggcgc 7260
tgtgacaact gccgcagacc tgggggtgaa cccagtcccg aaggcactac tggccagtcc 7320
tacaaccagt attctcagag ataccatcag agaacaaaca ctaatgttaa ttgcccaatt 7380
gagtgcttca tgcctttaga tgtacaggct gacagagaag attcccgaga gtaa 7434
Claims (9)
- 서열목록 제1서열의 뉴클레오타이드에서 321번째부터 333번째까지의 염기의 결실을 포함하는 15-100개의 연속 뉴클레오타이드 서열로 구성되는 변이형 뉴클레오타이드 서열에 특이적으로 결합하는 프라이머 또는 프로브를 포함하는 이상지질혈증(dyslipidemia)의 진단용 키트.
- 삭제
- 제 1 항에 있어서, 상기 키트는 서열목록 제1서열의 뉴클레오타이드에서 2500번째부터 2502번째까지의 염기의 결실 및 2500번째 위치의 C의 삽입을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제2서열의 뉴클레오타이드에서 643번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제6서열의 뉴클레오타이드에서 1018번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제6서열의 뉴클레오타이드에서 1028번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제6서열의 뉴클레오타이드에서 2608번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제7서열의 뉴클레오타이드에서 71번째 염기의 A에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제7서열의 뉴클레오타이드에서 677번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제8서열의 뉴클레오타이드에서 259번째 염기의 G에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제8서열의 뉴클레오타이드에서 1150번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제9서열의 뉴클레오타이드에서 808번째 염기의 A에서 G로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제10서열의 뉴클레오타이드에서 355번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제11서열의 뉴클레오타이드에서 1276번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제11서열의 뉴클레오타이드에서 2765번째 염기의 C에서 G로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제11서열의 뉴클레오타이드에서 3253번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제12서열의 뉴클레오타이드에서 307번째 염기의 T에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제13서열의 뉴클레오타이드에서 1033번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제13서열의 뉴클레오타이드에서 1133번째 염기의 T에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제14서열의 뉴클레오타이드에서 75번째 염기의 G에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제15서열의 뉴클레오타이드에서 926번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제16서열의 뉴클레오타이드에서 220번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제16서열의 뉴클레오타이드에서 857번째 염기의 A에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제17서열의 뉴클레오타이드에서 1055번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제17서열의 뉴클레오타이드에서 1901번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제18서열의 뉴클레오타이드에서 1933번째 염기의 C에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제19서열의 뉴클레오타이드에서 1169번째 염기의 G에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제20서열의 뉴클레오타이드에서 1744번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제21서열의 뉴클레오타이드에서 6493번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제22서열의 뉴클레오타이드에서 2371번째 염기의 T에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제23서열의 뉴클레오타이드에서 304번째 염기의 C에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제24서열의 뉴클레오타이드에서 46번째 염기의 C에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제25서열의 뉴클레오타이드에서 1321번째 염기의 A에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제26서열의 뉴클레오타이드에서 3775번째 염기의 G에서 C로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제27서열의 뉴클레오타이드에서 607번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 서열목록 제28서열의 뉴클레오타이드에서 328번째 염기의 G에서 A로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열; 및 서열목록 제29서열의 뉴클레오타이드에서 6170번째 염기의 G에서 T로의 치환을 포함하는 15-100개의 연속 뉴클레오타이드 서열로 구성된 군으로부터 선택되는 변이형 뉴클레오타이드 서열에 특이적으로 결합하는 프라이머 또는 프로브를 추가적으로 포함하는 이상지질혈증(dyslipidemia)의 진단용 키트.
- 제 1 항 또는 제 3 항에 있어서, 상기 변이형 뉴클레오타이드가 검출된 개체는 증가된 이상지질혈증(dyslipidemia) 위험도를 나타내는 것을 특징으로 하는 진단용 키트.
- 삭제
- 제 1 항 또는 제 3 항에 있어서, 상기 이상지질혈증(dyslipidemia)은 고지혈증(hyperlipidemia)인 것을 특징으로 하는 진단용 키트.
- 제 1 항 또는 제 3 항에 있어서, 상기 이상지질혈증(dyslipidemia)은 고콜레스테롤혈증(hypercholesterolemia)인 것을 특징으로 하는 진단용 키트.
- 제 7 항에 있어서, 상기 고콜레스테롤혈증은 가족성 고콜레스테롤혈증(Familial hypercholesterolemia)인 것을 특징으로 하는 진단용 키트.
- 제 1 항 또는 제 3 항에 있어서, 상기 키트는 아시아인에게 적용되는 것을 특징으로 하는 진단용 키트.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140085109 | 2014-07-08 | ||
KR20140085109 | 2014-07-08 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160006580A KR20160006580A (ko) | 2016-01-19 |
KR101753884B1 true KR101753884B1 (ko) | 2017-07-06 |
Family
ID=55306139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020140182374A KR101753884B1 (ko) | 2014-07-08 | 2014-12-17 | 가족성 고콜레스테롤혈증과 관련된 신규한 돌연변이 및 그 용도 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101753884B1 (ko) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080050358A1 (en) | 2004-02-17 | 2008-02-28 | Leena Peltonen-Palotie | Identification of Snps Associated with Hyperlipidemia, Dyslipidemia and Defective Carbohydrate Metabolism |
US20130029330A1 (en) | 2009-12-22 | 2013-01-31 | Arabian Gulf University | Mutant ldl receptor gene |
-
2014
- 2014-12-17 KR KR1020140182374A patent/KR101753884B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080050358A1 (en) | 2004-02-17 | 2008-02-28 | Leena Peltonen-Palotie | Identification of Snps Associated with Hyperlipidemia, Dyslipidemia and Defective Carbohydrate Metabolism |
US20130029330A1 (en) | 2009-12-22 | 2013-01-31 | Arabian Gulf University | Mutant ldl receptor gene |
Non-Patent Citations (4)
Title |
---|
Angiology. 2013 May;64(4):287-92 |
Bull Exp Biol Med. 2013 Jul;155(3):380-3 |
Clin Chim Acta. 2012 Dec 24;414:146-51 |
Eur J Intern Med. 2011 Oct;22(5):e55-9 |
Also Published As
Publication number | Publication date |
---|---|
KR20160006580A (ko) | 2016-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102114412B1 (ko) | 위장관췌장 신경내분비 신생물 (GEP-NENs)의 예측 방법 | |
KR101582321B1 (ko) | 심장성 부정맥의 위험 관리를 위한 유전적 마커 | |
DK2471954T3 (en) | Susceptibility genetic variants associated with cardiovascular diseases | |
AU2022203184A1 (en) | Sequencing controls | |
US20230203485A1 (en) | Methods for modulating mhc-i expression and immunotherapy uses thereof | |
US20220389519A1 (en) | Biomarkers predictive of anti-immune checkpoint response | |
KR20150090246A (ko) | 암을 위한 분자 진단 테스트 | |
KR20110057188A (ko) | 바이오마커 프로파일 측정 시스템 및 방법 | |
KR20140044341A (ko) | 암에 대한 분자적 진단 검사 | |
US20230105008A1 (en) | Methods and compositions for identifying castration resistant neuroendocrine prostate cancer | |
KR20100017865A (ko) | 유방암의 위험도 평가, 진단, 예후 및 치료용 마커인 염색체 5p12 및 염색체 10q26 상의 유전적 변이 | |
KR20110015409A (ko) | 염증성 장 질환에 대한 유전자 발현 마커 | |
KR20160117606A (ko) | 항-혈관형성 약물에 대한 반응 및 암의 예후를 예측하기 위한 분자적 진단 시험 | |
KR20140140069A (ko) | 전반적 발달장애의 진단 및 치료용 조성물 및 그 진단 및 치료 방법 | |
US20170175193A1 (en) | Improved Therapeutic Regimen for Hypertension | |
CN101103124A (zh) | 用于检测原发性动脉高压风险的方法和试剂盒 | |
KR20200081380A (ko) | 유전적 조절 | |
KR20170041955A (ko) | 근위축성측삭경화증에 대한 진단 마커로서의 돌연변이 유전자 및 이를 이용한 진단방법 | |
WO2001065259A1 (fr) | Methode d'examen de maladies allergiques | |
KR101753884B1 (ko) | 가족성 고콜레스테롤혈증과 관련된 신규한 돌연변이 및 그 용도 | |
JPWO2002050269A1 (ja) | アレルギー性疾患の検査方法 | |
KR102480128B1 (ko) | 면역력 강화 소 African Humped Cattle (AFH) 품종 특이적 단일염기다형성 및 그의 용도 | |
KR102480124B1 (ko) | 생식능 강화 소 African Humped Cattle (AFH) 품종 특이적 단일염기다형성 및 그의 용도 | |
CN101622361A (zh) | 用于心律不齐的风险管理的遗传标记物 | |
WO2023215913A2 (en) | Compositions and methods for the diagnosis and treatment of severe covid 19 and other inflammatory autoimmune disorders |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right |