CN1780910A - 对与家族性高胆固醇血症有关的分离的低密度脂蛋白受体(ldl-r)的基因序列中的突变进行检测的方法和装置 - Google Patents
对与家族性高胆固醇血症有关的分离的低密度脂蛋白受体(ldl-r)的基因序列中的突变进行检测的方法和装置 Download PDFInfo
- Publication number
- CN1780910A CN1780910A CN 200480008635 CN200480008635A CN1780910A CN 1780910 A CN1780910 A CN 1780910A CN 200480008635 CN200480008635 CN 200480008635 CN 200480008635 A CN200480008635 A CN 200480008635A CN 1780910 A CN1780910 A CN 1780910A
- Authority
- CN
- China
- Prior art keywords
- seq
- sudden change
- oligonucleotide
- ldl
- familial hypercholesterolemia
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明涉及分析导致家族性高胆固醇血症的突变的存在或缺乏的体外方法。本发明方法描述这样的途径,其中可以使用来自个体的DNA样品检测所述突变,并且该方法包括下列:使用与低密度脂蛋白受体基因互补的引物进行聚合酶链式反应;通过测序分析扩增的产物;限制性酶切分析;单链构象多态性技术;可以用于检测前述DNA中的突变的异源双链分析以及在生物芯片玻璃支持体上的装置的分析,在所述生物芯片玻璃支持体上排列有寡核苷酸探针。
Description
发明领域
本发明涉及对“离体”生物样品部分进行体外诊断以确定个体的称为家族性胆固醇血症的疾病的诱因的技术。
发明背景
按照WHO的定义,动脉粥样硬化是由脂质和络合物的病灶性累积所导致的动脉血管内膜中变化的组合,伴随纤维状组织形成、钙化作用并且依次与介质中的变化关联。
可以将动脉粥样硬化认为是在动脉壁中具有病原性显著脂质沉积物的动脉硬化的特殊形式。动脉硬化的大多数形式包括脉管壁的脂肪退化,可以将术语“动脉硬化”和“动脉粥样硬化”同义使用(Assmann G.在“LipidMetabolism and Atherosclerosis”Schattauer Verlag GMbH,Stuttgart 1982:1中)。
脂质在水溶液中是不可溶的。脂蛋白是能够在血液中运输脂质的颗粒。取决于通过超速离心能够分离它们的方式,按照它们的密度将脂蛋白分成各种类别(Havel RJ等,J Clin Invest 1955,34:1345)。低密度脂蛋白(LDL)(d=1.019-1.063g/ml)在血液中运输大量胆固醇。它们由大约75%的脂质(主要是胆固醇、胆固醇脂和磷脂)组成,血液中大约70%的总胆固醇是通过LDL颗粒进行运输的。
将高胆固醇血症用于反应特殊群体的高于正常水平的血浆胆固醇的升高,并且其是动脉粥样硬化的发作和进展的一个关键因素。在西方社会,超过半数的死亡与动脉粥样硬化心血管疾病有关(Murray CJL和LopezAD.Lancet 1997;349:1269-1276)。
家族性高胆固醇血症(FH)是一类在LDL受体基因(LDL-r)中产生的常染色体显性遗传疾病,该基因编码容许LDL的胞内吸收和降解的蛋白质(Goldstein JL,Brown MS AnnRev Cell Biol 1985;1:1-39)。
FH的几乎100%的外显率意味着受疾病侵袭的父母的后代的半数从出生开始具有严重提高的血浆胆固醇水平,男性和女性同样地受影响(Goldstein JL,Brown MS.The metabolic basis of inherited disease.Scriver CR,Beaudet AL,Sly WS,Valle D编辑。McGraw Hill New York第六版,1989;1215-1250)。
受FH侵袭的个体显示脂性角膜弓、腱黄瘤和早发性症状的冠心病(Scientific Steering Committee on behalf of the Simon Broome register Group.Atherosclerosis 1999;142:105-115)。FH是最常见的遗传疾病之一,并且估计杂合子患者和纯合子患者的频率分别为1/500和1/1,000,000。
由于建立者效应,某些群体,诸如小量突变占优势,并且因此杂合的FH的频率更高,这些群体包括法国的法裔加拿大人(LeitersdorfE等J ClinInvest 1990;85:1014-1023),信奉基督教的黎巴嫩人(Lehrman MA等JBiol Chem 1987;262:401-410)德鲁兹(Landsberger D等Am J Hum Genet1992;50:427-433)芬兰人(Koivisto UM等J Clin Invest 1992;90:219-228)南非的欧洲血统的南非人(Afrikaner)(Kotze MJ等Ann Hum Genet 1991;55:115-121),以及立陶宛血统的德系犹太人(Meiner V等Am J Hum Genet1991;49:443-449),他们具有这样的特性,即作为建立者效应的结果,他们仅有几个突变是造成FH的原因,并且因此在那些群体中杂合的FH的频率要高于在其它群体中所估计的。
FH杂合的患者显示非常高的血浆胆固醇浓度,通过高于95th百分点的值。在患有FH的患者中,年龄-标准化和性别-标准化的致死率要四倍-五倍高于在一般群体中的致死率(Scientific Steering Committee on behalf of theSimon Broome Register Group.Atherosclerosis 1999;142:105-115)。将已经在LDL-r基因座上遗传了两个突变的患者称为“FH纯和子”或“FH双重杂合子”,在该情形中它们实际上不是导致在血浆中的LDL-c水平超出正常水平6-8倍提高的功能性受体。在大多数这些患者中,冠心病典型地发生在20岁之前(Goldstein JL等N Engl J Med 1983;309:288-296)。如果能够在他们发展有症状的疾病之前诊断出具有杂合或纯合的FH的个体,可以对他们进行预防性地治疗以实质地减少他们心肌梗塞的风险。
所述LDL-r是普遍存在的839个氨基酸的跨膜糖蛋白,其通过胞吞作用调节LDL向细胞中的运输(Goldstein J和Brown M J Biol Chem 1974;249:5153-5162)(图1)。
LDL-r基因位于染色体19p13.1-13.3的短臂上(Yamamoto T等Cell1984;39:27-38),跨度为45,000碱基对(bp)。其包括18个外显子和17个内含子,它们编码成熟蛋白质的如下6个功能域:信号肽、配体结合域、类表皮生长因子(EGF)前体、O-连接的糖、跨膜和胞质结构域(Sundhof T等Science 1985;228:893-895)(图2)。
LDL-r的合成由复杂的反馈机制所调节,所述反馈机制响应胞内甾醇浓度的变化和细胞对胆固醇的需要而控制LDL-r基因的转录(Sudhof TC等J Biol Chem 1987;262:10773-10779)。LDL-r基因的转录调节所需的DNA基序位于177bp的近侧启动子中(Sudhof TC等J Biol Chem 1987;262:10773-10779)。该区域包含基础表达和甾醇调节的所有顺式-作用元件,并且包括三个每个为16bp的不完全的同向重复序列。重复序列1和3包含转录因子Sp1的结合部位并且是产生所述基因的基础表达所必须的,但是对于完全表达,需要重复序列2的参与(Dawson PA等J Biol Chem 1988;263;3372-3379)。重复序列2包含10bp的调节元件,SRE-1,(Smith JR等J BiolChem 1990;265:2306-2310),当胞内甾醇浓度减少时,其容许称作SREBP-1的转录因子的结合。到目前为止,已经绘制了LDL基因受体的转录调节元件的一些天然存在的突变的图谱(Hobbs HH,等Hum Mutat 1992;1:445-466;Koivisto UM,等ProcNatl Acad Sci USA,1994;91:10526-10530),Mozas P,等J Lipid Res 2002;43:13-18,http.//www.ucl.ac.uk/fh;http.//www.umd.necker.fr)。
外显子1编码具有21个氨基酸序列的信号肽,其在转运到内质网的过程中从蛋白质上裂解下来。已经描述了一些在该外显子中的移码、错义突变和无义突变(http.//www.ucl.ac.uk/fh;http.//www.umd.necker.fr)。
外显子2-6编码配体结合域,所述配体结合域由7个每个为40个氨基酸的串连重复组成。已经部分阐明了配体结构域的结构(Jeon H等NatureStruc Biol 2001;8:499-5049)。其中有一个带负电荷氨基酸的聚簇,即在每个重复中的Asp-X-Ser-Asp-Glu和形成三个二硫键的6个半胱氨酸残基。
外显子7-14编码人LDL-r的由400个氨基酸序列组成的第二个结构域。该序列显示了与表皮生长因子前体(EGFP)33%的同源性。如配体结合域一样,该区域也包含富含半胱氨酸的40个氨基酸序列的3个重复。称作A和B的前两个重复序列,是连续的并且通过一个280个氨基酸的氨基酸区域与第三个重复序列分离,所述氨基酸区域包含5个拷贝的YWTD(Tyr-Trp-Thr-Asp)序列。类EGFP结构域是LDL颗粒从LDL-r和披有网格蛋白的小窝的酸依赖型解离的基础,所述酸依赖型解离是在受体再循环过程中在内体中发生的。在目前为止所述的所有突变中,大约55%位于EGFP一同源区域内并且35%位于YWTD重复中(http://www.ucl.ac.uk/fh)。
LDL-r的第三个结构域由外显子15编码,其是一个富含苏氨酸和丝氨酸残基的区域。尚不知道该区域的功能,但是已知在该区域中碳水化合物链被锚定。在所分析的6个物种中,该区域显示最小的序列保守性,并且认为该区域在受体的稳定中具有作用(Goldstein等In The Metabolic andMolecular Basis of Inherited Disease.Sciver CR,Beaudet AL,Sly WS,Valle D.第7版.McGraw Hill,1995:1981-2030)。
跨膜结构域包括由外显子16和外显子17的5′末端编码的22个疏水性氨基酸。该结构域对于将LDL-r锚定到细胞膜上是必需的。
LDL-r的胞质结构域由50个氨基酸残基的序列形成,所述氨基酸序列由外显子17的3′区域和外显子18的5′末端编码。该结构域包含将蛋白质靶向到细胞表面和使受体定位在有被小窝中的两个信号序列(Yokode M,等J Cell Biol 1992;117:39-46)。该区域是最保守(conservedm)的结构域之一,在所分析的6个物种中具有86%的保守氨基酸。
已经将在FH患者中发现的LDL-r突变分成5个类别:无效等位基因、转运缺陷等位基因、结合缺陷等位基因、内化-缺陷等位基因和再循环缺陷等位基因。按照常规,每个类别与定位在编码蛋白质的一个特定结构域的基因的区域中的突变相关(Hobbs,HH,等Hum Mutat 1992;1:445-466)。
涉及血浆LDL-c水平和冠心病的在FH患者中的异质性是部分由于突变性质的差异(Sun XM等Arterioscler Thromb Vas Biol 1993;13:1680-1688,Kotze MJ等Arterioscler Thromb Vas Biol 1993;13:1460-1468;Gudnason V等Arterioscler Thromb Vas Biol 1997;17:3092-3101)。另一方面,用羟基-甲基戊二酰基辅酶A(HMGCoA)还原酶抑制剂处理后,在FH杂合子患者中,LDL-c响应的减少部分地取决于在LDL-r基因中的突变的性质(Leisterdorf E等Circulation 1993;87:35-44;Jeenah M等Atherosclerosis 1993;98:51-58,Sijbrands EJG等Atherosclerosis 1998;136:247-254)。
受体的初级配体是LDL,其包含称作载脂蛋白B-100(ApoB-100)的蛋白质的单拷贝(Goldstein J和Brown M J Biol Chem 1974;249:5153-5162)。所述载脂蛋白具有一个富含碱性氨基酸和作为受体结合部位的区域(BorénJ等J Clin Inves 1998;101:1084-1093)。已经发现定位在载脂蛋白B基因中的一些突变改变了所述蛋白质的功能活性并且减少了其移去LDL颗粒的能力,导致了在血浆中LDL胆固醇的累积。到目前为止,已经鉴定了在apoB-100基因中的4个突变:R3480W,R3500Q,R3500W和R3531C,它们导致了称为家族性缺陷的(BDF)载脂蛋白的高胆固醇血症,并且都定位于apoB-100蛋白质的LDL-r结合结构域(残基3130-3630)中(Soria L等Proc NatlAcad Sci USA 1989;86:587-591;Pullinger CR,等J Clin Invest 1995;95:1225-1234;Gaffney D,等Arterioscler Thromb Vasc Biol 1995;15:1025-1029;Boren J,等J Biol Chem 2001;276;9214-9218)。在氨基酸3500的密码子上的CGG-CAG的突变所导致的谷氨酰胺对精氨酸的置换(R3500Q)是引起家族性缺陷的载脂蛋白B-100(FDB)最常见的改变。ApoB-3500突变的杂合的患者通常具有高胆固醇血症,虽然血清胆固醇浓度可以从在FH中发现的那些变化到仅有适度提高(Tybjaerg-Hansen A,等Atherosclerosis 1990;80:235-242;Hansen PS,等Arterioscl Throm Vasc Biol1997;17:741-747)。由于在那些患者中的临床和生化特性非常相似,因此仅可能通过遗传分子鉴别来进行对具有FDB或FH的患者之间的差异诊断。
FH的临床诊断是基于血浆中脂质和脂蛋白的分析数据、临床symtomatology(黄瘤)和家族以及个人冠状疾病史进行的。WHO,通过其MedPed计划,推荐了一系列标准以随后执行FH的临床诊断。这些标准基于一种评分系统,所述评分系统依赖于高胆固醇血症、患者的临床和分析特性的个人和家族史。当患者达到的标点等于或高于8分时,将FH诊断的临床标准定为“确定”,将介于5和8分之间的定为“很可能的”并且将介于3和5分之间的定为“有可能”(Familial Hypercholesterolemia.Report of asecond WHO consultation.The International MedPed FH Organization,Geneva 1998)。但是,一些患者不符合FH标准,因为家族史不完整或对其不了解,或因为在分析的时候,他们仅表现出中等浓度的细胞质的胆固醇并且缺乏组织胆固醇沉积的指征,如腱黄瘤、角膜弓或黄斑瘤。
在已知r-LDL基因突变的家族中,已经证实了诊断的最佳“截止”点是c-LDL浓度的90个百分点的应用(Umans-Eckenhausen MAW等Lancet2001;357:165-168)。但是18%的突变的FH患者载体具有低于该百分比值的总胆固醇浓度而且假阳性的比例是18%。因此,如果仅使用胞质胆固醇的数字,将会有高比率的错误诊断。已经公布了因为没有被正确诊断为患有FH的患者,超过50%的患者没有接受降脂治疗和饮食劝告(Williams RR等,AmJ Cardiol.1993;72:18D-24D)。
对FH的分子基础的阐明已经在许多情况中,使在DNA水平上的诊断成为可能。对在LDL-r基因中的潜在缺陷的证明事实上构成了对诊断的确认(Familial hypercholesterolemia.Report of a second WHO consultation.TheIntemational MedPed FH Organization,Geneva 1998)。虽然通过分子方法精确诊断FH是可能的,但是因为LDL-r基因的突变异质性,目前它们在异源群体中的应用是有限的。
在申请PCT WO-88/03175(Biotechnology Research Partners,Ltd.)中,要求了诊断动脉粥样硬化的方法,其基于对在载脂蛋白AO-CIII-AIV的基因区域中,或在基因apoB、apoCI、apoAII中,以及在LDL受体基因中的各种多态性的存在或缺乏进行检测。具体地,对于该基因,多态性Cfr131和BstEII的使用是存在的。
另一个感兴趣的文献是日本专利JP-10099099,虽然没有具体提到家族性高胆固醇血症,其指出将氨基酸109的编码三联体中的突变,具体地C的插入用于诊断在LDL受体基因中的异常。
最终,都是Texas大学的美国专利US-4.745.060和US-4.966.837,提出在LDL受体基因中突变的基础上进行家族性高胆固醇血症的诊断的方法。但是,在它们之中首先要求的是相应于“正常”基因的序列,其表示了一个通过XbaI的限制酶图谱变化来详细说明的具体的突变实例。在第二个专利中,就其而言,要求了各种限制性内切酶(Eco RI,Asp 718,Taq I,Bam HI,Xba I,Inf.I,Bgl II,Cla I,Eco RV,Kpn I,Pvu II,Sph I,Sst I,Sst II,Stu I,XhoI,Nde I和Nsi I)在确定LDL-r基因中突变的方法中的应用,其基于与相应于正常基因的模型比较,对用这些酶的限制性图谱的改变进行的观察。
最接近本发明的专利文献是WO02/06467,其中描述了一种基于LDL-r基因的一系列突变和多态性,检测脂代谢异常的方法。但是,在所述专利中所描述的突变或多态性中,没有与本申请所要求的那些是一致的。
发明详述
将突变和多态性的命名在
-Antoranakis S.E.和the Nomenclature Working Group,Recommendationsfor Nomenclature Systems for Human Gene Mutations.Human Mutation11:1-3;1998
-Dunnen JT,Antoranakis S.E.Mutation Nomenclature Extensions andSuggestions to describe Complex Mutations:A Discussion.HumanMutation 15:7-12,2000中详细说明。
相似地,将多态性的概念在
-Harris H.The Principles of Human Biochemical Genetics 第三版.Amsterdam.North-Holland 1980
-Beauder AL,Scriver CL,Sly WS,Valle D.Genetics,Biochemistry andMolecular Basis of Variant Human Phenotypes,in The Metabolic andMolecular Bases of Inherited Disease.Editores Beaudet AL,ScriVer CR,SlyWS,Valle D第7版.53页,MacGraw Hill.New York 1995中详细说明。
已经检测、分离并表征了整个系列的如下详述的新的突变。相似地,将已经描述的整个系列的突变和多态性与它们结合来分析个体发展家族性高胆固醇血症的可能性。在相应于低密度脂蛋白受体基因(LDL-r)的基因序列SEQ ID NO:1中产生了在本发明中与家族性高胆固醇血症的发展相关的所有突变和多态性。那就是说,使用相同的体外技术,将在相同基因上产生的所有突变用在相同的测试装置上,以在体外确定发展相同疾病的可能性,这支持了本发明的单一性。
在表I中,按照在上述出版物中按科学方法认可和详述的命名法,详述了检测的所有新突变。同样地,用α-数字编码提供它们。
在表II中,详述已经描述和已知的突变,将其与表I中的突变结合用在测试装置中以体外诊断家族性高胆固醇血症是本发明实施方案的新的和发明性的优选形式之一。相似地,以与所提及的已知突变类似的方式,在表III中,详述多态性。
将氨基酸突变以单字母密码表示,所述单字母密码按照表IV具有它们的等价性。
表I
突变 | ID |
(-23)A>C1054 del 11108delC1197del 91207delT1432del G191-2del Ains CT2184delG231delC2399del5/ins4313+lins T338del16509insC675del15684dup12941-39C>TC195RC255GC319Y | M002M006M008M009M010M012M016M020M022M024M027M029M030M032M034M041M046M0100M050 |
D157GD630NE291XH635NN59KT41MW515XY379XY421XT433N818del81423delGC/insA1204insT451del3G516X2389+4A>G1815del 111186+5G>AT740MI771TR279GT446IH562QC74YD686YG(-2)RE579DS205CD200VV766E | M059M063M068M096M074M097M098M092M093M105M110M111M112M115M117M120M121M129M131M135M138M141M142M145M147M149M150M151M153M154 |
L(-6)P2544insCC42Y2389+3A>C[1587-5del5;1587del31] | M155M156M157M160M161 |
表II
突变 | ID | 突变 | ID |
2393del 9(-42)C>G(-49)C>T1045delC1061-8T>CA378TC358R1358+1G>A1706-10G>A1845+1G>C2085del 19211del G2140+5G>A2207ins T2390-1G>C313+1G>C313+1G>A313+2ins T518del G | M001M003M004M005M007M0102M0104M011M014M015M017M018M019M021M023M025M026M028M031 | C646YC677YC68WC74GC95RD151ND200GD200YD280GE10XE246AE256KF634LG322SG352DG571EN543HN804KQ12X | M053M054M055M056M057M058M060M061M062M064M066M067M069M070M071M072M073M075M076 |
7del C872del C884del T920ins4A519TC113WC127RC255XC281YC297FC347YC371XW(-18)XW541XD679E1359-1G>A681 ins21C122XV408MG528DD412HN619NE80KL534PL621SC356YR329XG248DC201Y313+5G>A | M035M036M038M039M042M043M045M047M048M049M051M052M090M091M094M099M033M044M088M106M107M108M109M113M114M116M119M122M125M126 | Q133XQ357PQ427XQ71ER395QR574WR612CS156LS205PT413KT705IV502M | M077M078M079M080M081M082M083M084M085M086M087M089 |
C358YC331RD157NV776MP664LW462XQ328XL584PR395WG314VW469XP678LR612HR236W | M127M128M130M134M136M137M139M140M143M144M146M148M152M159 |
表III
多态性 | ID |
81T>C Bst UI外显子21060+10G>C SmaI外显子71171G>A StuI外显子81413G>A DdeI外显子101617C>T BstNI外显子111725C>T SSCP外显子121771C>T HincII外显子121959T>C AvaII外显子132232G>A MspI外显子15 | P1P2P3P4P5P6P7P8P9 |
表IV
氨基酸命名法
丙氨酸天冬氨酸谷氨酸甘氨酸苯丙氨酸亮氨酸丝氨酸酪氨酸半胱氨酸色氨酸亮氨酸脯氨酸组氨酸谷氨酰胺精氨酸异亮氨酸甲硫氨酸苏氨酸天冬酰胺赖氨酸丝氨酸精氨酸缬氨酸终止密码子 | AlaAspGluGlyPheLeuSerTyrCysTrpLeuProHisGlnArgIleMetThrAsnLysSerArgValTer | ADEGFLSYCWLPHQRIMTNKSRVX |
在本发明中开发的诊断鉴定“生物芯片”是一个在其表面上具有显示于序列表中的大量探针的载玻片。这些寡核苷酸探针能够与包括在表I-表III中的突变序列杂交。与每个突变有关的方法是:
玻璃载玻片的印迹
·使用DMSO作为印迹缓冲液将能够检测突变的寡核苷酸印迹到氨基硅烷化的玻璃载玻片上。
·使用“点样器(spotter)”或其中控制温度和湿度的寡核苷酸印迹器(printer)进行印迹。
玻璃载玻片的处理
印迹后,将载玻片用UV照射处理。
目标DNA的制备
·通过使用过滤方法从大约300μl的血液样品中抽取患者的基因组DNA。
·进行多重聚合酶链式反应来扩增每个患者的LDL受体基因的启动子和所有的18个外显子。
·在PCR过程中,将生物素化的核苷酸掺入。作为间接标记方法,在杂交后,需要使用荧光团-链霉抗生物素蛋白偶联物染色的最终步骤。
·将PCR产物进行电泳并且在琼脂糖凝胶中显影。
·断裂目标DNA。
·将杂交缓冲液加入断裂的PCR产物中。
·变性步骤在95℃发生15分钟。
杂交
·在由Amersham Biosciences专为此目的设计的操作台中自动进行杂交。
·将玻璃载玻片进行预杂交。
·用Hanilton移液管注射杂交溶液。
·杂交时间是1小时。
·将玻璃载玻片洗涤3次并且干燥。
·操作台dres玻璃载玻片。
玻璃载玻片的扫描
·将玻璃载玻片插入扫描器中。
·用激光刺激后,扫描由标准标记物发射的信号。
图象的定量
·扫描器软件使我们在获得的图象中,对在杂交发生的点的信号进行定量。
·从在检测正常等位基因和突变等位基因的寡核苷酸中获得的信号,我们确定了患者中突变的存在或缺乏。
在玻璃载玻片中,对于每个突变的检测,4个寡核苷酸重复10次。其中两个检测正常等位基因而另外两个检测突变的等位基因。发现从始至终,询问碱基(interrogated base)处于中间位置。
在正常患者的情况中(图3A),他不具有突变的等位基因。因此,在从玻璃载玻片中获得的图象中,检测所述等位基因的寡核苷酸不显示杂交信号或显示比检测正常等位基因的寡核苷酸更少的信号。
正相反,突变的杂合的个体(图3B)具有正常的等位基因和突变的等位基因。因此,检测正常和突变等位基因的寡核苷酸具有等同的杂交信号。
从待分析的个体的DNA中产生的,用标记的PCRs杂交DNA-芯片的结果,证实了在图3A中表示的个体不具有引起E256K氨基酸变化的LDL-r基因中的特殊突变,并且图3B的个体对于这种突变是杂合的。
以这种方法,将杂合的个体经遗传诊断为家族性高胆固醇血症。
通过分析实施例的方式,接下来详述并用本发明的分析装置检测一些突变。
实施例1:位于LDLr基因的外显子1中的突变的鉴定。
利用引物Ex1F(SEQ ID NO:2)及Ex1R(SEQ ID NO:3)通过聚合酶链式反应(PCR)扩增LDLr基因外显子1中215bp的片段。
在包含20mM Tris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)的50μL反应混合物中扩增DNA(500ng)。扩增循环为:于96℃变性10分钟,后接35个于94℃变性1分钟,于59℃退火1分钟,于74℃延伸2分钟的循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物。使用自动CEQ 2000XLDNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP图谱的那些片段进行测序。随后通过限制性酶切分析和通过使用所述装置“生物芯片”来确定鉴定的突变的存在。
(-23)A>C突变分析
这种突变产生一种新的AvaII识别位点。按照生产商(NEB,Beverly,MA,USA)所述方法,在30μL的总体积中用15单位的AvaII对5微升的外显子1扩增材料进行水解。获得的片段对于正常等位基因具有148和67bp的长度而对于突变等位基因具有93,67和55bp的长度。通过在8%的聚丙烯酰胺凝胶中电泳分离这些片段并通过用溴化乙锭染色进行显影。或者,能够以在载玻片上使用寡核苷酸:SEQ ID NO:36,SEQ ID NO:37,SEQ ID NO:38和SEQ ID NO:39的所述装置(“生物芯片”)来分析这种突变。
在一位患有角膜弓和黄斑瘤的60岁妇女中检测到(-23)A>C突变,所述妇女已被诊断为具有家族性高胆固醇血症,其具有符合MedPed的8分的诊断性评分(Familial Hypercholesterolemia.Report of a second WHOconsultation.The International MedPed FH Organization Geneva 1998)。在她的家族近亲中没有检测到早发性心血管事件的证据。在药物治疗之前脂质的血浆浓度为:总胆固醇(TC)352mg/dL,LDL-c 271mg/dL,以及甘油三酯(TG)和高密度脂蛋白的胆固醇(HDL-c)在正常范围之内。用辛伐他汀(20mg/天)进行Hypolypemiant治疗将她的TC和LDL-c水平分别降低到251和171mg/dL。
L(-6)P突变分析
在分析这种临床诊断为FH的片段时,通过相应于LDL-r基因的外显子1的215bp片段的自动测序来对这种突变(47T>C,CTC>CCC,Leu(-6)Pro)进行表征。使用的试剂盒CET 2000 Dye Terminator Cycle Sequencing withBeckman’s Quick Start(Beckman Coulter,Palo Alto,CA,USA)的试剂和引物Ex1F(SEQ ID NO:2)和Ex1R(SEQ ID NO:3)在PE Gene Amp System 9700热循环仪中进行测序反应。在自动测序仪CEQ 2000XL DNA Beckman分析系统中分析由测序反应产生的片段。通过对相同样品的第二PCR产物的自动测序来确认观察到的T>C变化。或者,能够以在载玻片上使用寡核苷酸SEQ ID NO:240,SEQ ID NO:241,SEQ ID NO:242和SEQ ID NO:243的所述装置(“生物芯片”)来分析这种突变。
在一位患有角膜弓的47岁妇女中检测到L(-6)P突变,她的父亲患有TC为350mg/dL的高胆固醇血症,两个患有高胆固醇血症的父系叔叔已经分别在24岁和33岁的年龄死于心肌发作。按照MedPed标准,高胆固醇血症的临床诊断达到9分的评分。在药物治疗之前血浆中脂质的浓度为:TC420mg/dL,LDL-c 320mg/dL,TG 155mg/dL和HDL-c 49mg/dL。用阿托伐他汀(15mg/天)进行的治疗分别将她的TC和LDL-c水平降低到289和233mg/dL。
G(-2)R突变分析
在分析临床诊断为FH的患者中的这种片段时,通过来自LDL-r基因外显子1的215bp片段的自动测序来对这种突变((58G>A,GGG>AGG,Gly(-2)Arg)进行表征。按照生产商所述方法,使用扩增引物Ex1F(SEQ IDNO:2)和Ex1R(SEQ ID NO:3)和试剂盒CEQ 2000 Dye Terminator CycleSequencing with Quick Start(Beckman Coulter,Palo Alto,CA,USA)在两个方向上对来自DNA样品的纯化PCR产物进行直接测序。使用CEQ 8000Genetic分析系统(Beckman Coulter,Inc.Fullerton)检测序列,并用CEQ 8000软件进行分析。通过对第二PCR产物进行测序来确认58G>A变化。或者,能够以在载玻片上使用寡核苷酸SEQ ID NO:220,SEQ ID NO:221,SEQ IDNO:222和SEQ ID NO:223的微阵列(“生物芯片”)来分析这种突变。
在一位患有角膜弓的34岁妇女中检测到G(-2)R突变,她的母亲患有TC为400mg/dL的高胆固醇血症。按照MedPed标准,她的FH临床诊断评分为10分。治疗之前她的血浆脂质水平为:TC 354mg/dL,LDL-c 264mg/dL,正常的TG和64mg/dL的HDL-c。
实施例2:位于LDLr基因的外显子2中的突变的鉴定.
使用下列脱氧核苷酸Ex2F(SEQ ID NO:4)和Ex2R(SEQ ID NO:5)通过聚合酶链式反应(PCR)扩增外显子2的183bp的片段。
在20mM Tris HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种脱氧寡核苷酸和1.5单位的Taq DNA聚合酶(GibcoBRL,Carlsbad,CA,USA)的混合物中的用500ngDNA在50μL最终体积中进行扩增反应。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于59℃杂交1分钟,于72℃延伸2分钟的35个循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物并且利用自动CEQ2000XL DNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP图谱的那些片段进行测序。随后通过限制性酶切分析和利用所述装置“生物芯片”来分析通过测序鉴定的突变的存在。
108delC突变分析
这种突变产生一种新的Mnl I消化位点。按照生产商(Fermentas Inc.,Hanover,MD,USA)介绍的方法,在30μL的总体积中用15单位的Mnl I对15微升的外显子1扩增材料进行水解。获得的片段在正常等位基因中具有150和33bp的长度,在突变等位基因中具有118,33和32bp的长度。通过在8%的聚丙烯酰胺凝胶中电泳来分离这些片段,并通过用溴化乙锭染色进行显影。或者,能够以在载玻片上使用寡核苷酸:SEQ ID NO:40,SEQ ID NO:41,SEQ ID NO:42和SEQ ID NO:43的所述装置(“生物芯片”)来分析这种突变。
在一位50岁的妇女中检测到108delC突变,她的高胆固醇血症没有任何临床皮肤表现。她在临床上被诊断为患有MedPed评分为9分的FH。在一位第一程度近亲中检测到了早发性心血管病。结束降脂药物治疗时的空腹血浆脂质水平为:TC(381mg/dL),TG(142mg/dL),LDLc(321)mg/dL)和HDLc(32mg/dL)。
T41M突变分析
这种突变(185C>T,ACG>ATG,Thr41Met)破坏了酶Tai I的切割限制性酶切位点。按照生产商(NEB,Beverly,MA,USA)介绍的方法,在30μL的总体积中用15单位的Tai I对15微升的外显子1扩增材料进行水解。获得的片段对于正常等位基因具有154和29bp的长度,而对于突变等位基因具有183bp的长度。通过在8%的聚丙烯酰胺凝胶中电泳分离这些片段,并通过用溴化乙锭染色进行显影。或者,能够以在载玻片上使用寡核苷酸:SEQID NO:140,SEQ ID NO:141,SEQ ID NO:142和SEQ ID NO:143的所述装置(“生物芯片”)来分析这种突变。
在一位69岁的男子中检测到T41M突变,他在55岁的年龄上患心肌梗塞并被诊断为患有家族性高胆固醇血症,按照MedPed标准诊断将其评分为6分。在亲属中发现早发性心血管事件的证据。在没有对他应用降脂药物的情况下,其空腹血清分析为:TC(274mg/dL)和LDL-c(217mg/dL),正常的TG和HDLc水平。
C42Y突变分析
在筛选临床诊断为FH的受试者的LDL-r基因中突变的过程中,通过相应于外显子2的183bp片段的测序来对这种突变(C42Y(188G>A,TGC>TAG,Cys42Tyr)进行表征。按照生产商介绍的方法使用扩增引物Ex2F(SEQID NO:4)和Ex2R(SEQ ID NO:5)与试剂盒CEQ 2000 Dye Terminator CycleSequencing with Quick Start(Beckman Coulter,Palo Alto,CA,USA)在两个方向上对来自DNA样品的纯化PCR产物直接进行测序。利用CEQ 8000Genetic Analysis System(Beckman Coulter,Inc.Fullerton)检测序列,并用CEQ 8000软件进行分析。通过对第二独立PCR产物进行测序来确认G>A变化。或者,能够以在载玻片上使用寡核苷酸SEQ ID NO:248,SEQ ID NO:249,SEQ ID NO:250和SEQ ID NO:251的微阵列(“生物芯片”)来分析这种突变。
在一位17岁的患有脂性角膜弓的男子中检测到C42Y突变,他已被诊断为患有按照MedPed标准诊断评分为10分的家族性高胆固醇血症。他的母亲患有严重的高胆固醇血症。在没有对他应用降脂药物情况下,他的空腹血清分析为:TC(350mg/dL),正常的TG和HDLc水平。用辛伐他汀(20mg/天)进行的hypolypemiant治疗将他的TC和LDL-c水平分别降低到274和214mg/dL。
C74V突变分析
在筛选临床诊断为FH的受试者的LDL-r基因中突变的过程中,通过对来自外显子3的196bp片段的DNA测序来对这种突变C74Y(284G>A,TGC>TAC,Cys74Tyr)进行鉴定。按照生产商所述方法,使用扩增引物Ex3F(SEQ ID NO:6)及Ex3R(SEQ ID NO:7)与试剂盒CEQ 2000 DyeTerminator Cycle Sequencing with Quick Start(Beckman Coulter,Palo Alto,CA,USA)在两个方向上对来自DNA样品的纯化PCR产物直接进行测序。使用CEQ 8000 Genetic Analysis System(Beckman Coulter,Inc.Fullerton)检测序列,并用CEQ 8000软件进行分析。通过对第二独立PCR产物进行测序来确认G>A变化。或者,能够通过将寡核苷酸:SEQ ID NO:212,SEQ ID NO:213,SEQ ID NO:214和SEQ ID NO:215点样在载玻片上而用微阵列(“生物芯片”)来分析这种突变。
在一位具有角膜弓、腱黄瘤和高胆固醇血症家族史的52岁男子中检测到C74Y突变。他已被诊断为患有按照MedPed标准诊断评分为17分的家族性高胆固醇血症。在使用降脂药物之前分析他的空腹血清为:TC(420mg/dL),TG(96mg/dL)和HDLc(69mg/dL)。用一种HMGCoA还原酶抑制剂(10mg/天)进行治疗将他的LDL-c水平降低22%。
实施例3:位于LDLr基因外显子3中的突变的鉴定。
使用下列引物Ex3F(SEQ ID NO:6)及Ex3R(SEQ ID NO:7)通过聚合酶链式反应(PCR)扩增LDLr基因外显子3的196bp的片段。
在包含20mM Tris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(GibcoBRL,Carlsbad,CA,USA)的50μL反应混合物中扩增DNA(500ng)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于59℃退火1分钟,于72℃延伸1分钟的35个循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物并且使用自动CEQ2000XL DNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP图谱的那些片段进行测序。随后通过限制性酶切分析和通过前述装置“生物芯片”测定鉴定的突变的存在。
191-2delAinsCT突变分析
由于这种突变不改变限制性酶切图谱,我们设计了一对诱变引物以便在正常等位基因存在而非突变等位基因存在时引入Bfa I的识别位点。
使用如下引物:Ex3R(SEQ ID NO:7)及Mut191-2F(SEQ ID NO:8)通过聚合酶链式反应(PCR)扩增LDLr基因外显子3的184bp的片段。
在包含20mM Tris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)的50μL反应混合物中扩增DNA(500ng)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于59℃退火1分钟,于72℃延伸2分钟的35个循环,最后72℃延伸10分钟。
按照生产商(NEB,Beverly,MA,USA)所述的方法,在30μL的总体积中用15单位的Bfa I对15微升的PCR样品进行水解。获得的片段对于正常等位基因具有23和161bp的长度而对于突变等位基因具有185bp的长度。通过在8%的聚丙烯酰胺凝胶中电泳分离这些片段,并通过用溴化乙锭染色进行显影。
或者,能够以在载玻片上使用寡核苷酸:SEQ ID NO:44,SEQ ID NO:45,SEQ ID NO:46和SEQ ID NO:47的微阵列(“生物芯片”)来分析这种突变。
在两个不相关的患有常染色体显性高胆固醇血症的家族中检测到191-2delAinsCT突变。这些家族中之一的先证者,是一位58岁的妇女,其具有腱黄瘤,黄斑瘤,心绞痛,冠心病和高胆固醇血症家族史。她已经被诊断为患有MedPed诊断评分为15分的家族性高胆固醇血症。她的血浆脂质水平为:TC(559mg/dL)和LDLc(467mg/dL),TG(175mg/dL)和HDLc(57mg/dL)。用辛伐他汀(40mg/天)进行的Hypolypemiant治疗将她的TC和LDL-c水平分别降低到302和228mg/dL。
N59K突变分析
这种突变(240C>A,AAC>AAA,Asn59Lys)破坏了酶Hinc II的剪切核酸内切酶位点。按照生产商(Amersham Pharmacia Biotech Inc.,Piscataway,NJ,USA)所述的方法,在30μL的总体积中用15单位的Hinc II消化15μL的PCR样品。获得的片段具有111和85bp(正常等位基因)或196bp(突变等位基因)的长度。通过在8%的聚丙烯酰胺(PAA)凝胶中电泳分离这些片段并通过用溴化乙锭染色进行显影。
或者,能够以在载玻片上使用寡核苷酸:SEQ ID NO:48,SEQ ID NO:49,SEQ ID NO:50及SEQ ID NO:51的微阵列(“生物芯片”)来分析这种突变。
在一位临床上诊断为患有FH的43岁男子中检测到N59K突变,所述FH具有12分的MedPed诊断性评分。在没有进行降脂治疗的情况下,他的血浆脂质水平为:TC(465mg/dL),LDLc(397mg/dL),TG(100mg/dL)和HDLc(48mg/dL)。用辛伐他汀(40mg/天)进行的Hypolypemiant治疗将他的TC和LDL-c水平分别降低到350和282mg/dL。另一方面,他的母亲在58岁时曾患过心绞痛(angine pectoris)并且他有一个8岁的儿子,其患有高胆固醇血症TC(325mg/dL)和LDLc(241mg/dL)。
231delC突变分析
这种突变破坏了核酸内切酶HaeIII消化位点。按照生产商(Gibco BRL,Carlsbad,CA,USA)介绍的方法,在30μL的总体积中用15单位的HaeI消化15微升的PCR样品。获得的片段对于正常等位基因具有76、51、42和25bp的长度而对于突变等位基因具有117、51和27bp的长度。通过在8%的聚丙烯酰胺凝胶(PAA)中电泳分离这些片段并通过用溴化乙锭染色进行显影。
或者,能够以在载玻片上使用寡核苷酸:SEQ ID NO:52,SEQ ID NO:53,SEQ ID NO:54和SEQ ID NO:55的所述装置(“生物芯片”)来分析这种突变。
在一位患有角膜弓的37岁妇女中检测到所述突变。她被临床诊断为患有FH,所述FH按照WHO MedPed标准具有16分的评分。在没有进行降脂治疗的情况下,血浆脂质水平为:TC(543mg/dL),LDLc(456mg/dL),TG(178mg/dL)和HDL-c(51mg/dL)。用阿托伐他汀(40mg/天)和考来替泊(20g/天)进行的Hypolypemiant治疗将她的TC和LDL-c水平分别降低到260和190mg/dL。她的兄弟在38岁时患心肌梗塞并且她的12岁的儿子患有TC浓度为305mg/dL的高胆固醇血症。
313+linsT突变分析
这种突变产生限制性核酸内切酶Tru1 I的新的切割位点。按照生产商(Fermentas Inc.,Hanover,MD,USA)所述的方法,在30μL的总体积中用15单位的Tru1 I水解15微升外显子3扩增材料。获得的片段对于正常等位基因具有196bp的长度而对于突变等位基因具有162和34bp的长度。通过在3%NuSieve琼脂糖凝胶中电泳分离这些片段,并通过用溴化乙锭染色进行显影。
或者,能够以在载玻片上使用寡核苷酸:SEQ ID NO:56,SEQ ID NO:57,SEQ ID NO:58和SEQ ID NO:59的所述装置(“生物芯片”)来分析这种突变。
在一位患有黄瘤和角膜弓的53岁妇女中检测到313+linsT突变。在她的可知的家族成员中没有检测到早发性心血管事件。她被临床诊断为患有MedPed评分为19分的FH,在没有对其应用降脂药物的情况下,她的空腹血清脂质水平分析为:TC(574mg/dL)和LDLc(505mg/dL),正常的TG和HDL-c水平。在用辛伐他汀(80mg/天)和考来替泊(20g/天)进行降脂性Hypolypemiant治疗之后,他们的TC和LDL-c水平分别降至282mg/dL和225mg/dL。
实施例4:位于LDLr基因外显子4中的突变的鉴定.
利用下列引物Ex4AF(SEQ ID NO:9)及Ex4AR(SEQ ID NO:10)通过聚合酶链式反应(PCR)扩增来自外显子4(外显子4A)的5’区域的LDLr基因的242bp的片段。
在包含20mM Tris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,O.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)的50μL反应混合物中扩增DNA(500ng)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于63℃退火1分钟,于72℃延伸2分钟的35个循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物。利用自动CEQ 2000XLDNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP图谱的那些片段进行测序。随后通过限制性酶切分析和前述装置“生物芯片”测定鉴定的突变的存在。
338del16突变分析
这种突变产生限制性核酸内切酶Van91 I的新切割位点。按照生产商(Amersham Pharmacia Biotech Inc.,Piscataway,NJ,USA)所述的方法,在30μL的总体积中用15单位的Van91 I水解15微升外显子4扩增材料。获得的片段对于正常等位基因具有242bp的长度而对于突变等位基因具有174和52bp的长度。通过在2%琼脂糖凝胶中电泳分离这些片段并通过用溴化乙锭染色进行显影。
或者,能够以在载玻片上使用寡核苷酸:SEQ ID NO:144,SEQ ID NO:145,SEQ ID NO:146和SEQ ID NO:147的所述装置(“生物芯片”)来分析这种突变。
在三个不相关的患有常染色体显性高胆固醇血症的家族中检测到338del 16突变。这些家族的一位先证者,是一位40岁的男子,其患有黄瘤和角膜弓,TC 542mg/dL和LDLc 441mg/dL以及正常的TG和HDLc水平。他被诊断为患有MedPed评分为19分的FH。没有在他的可知家族成员中发现心血管事件。用阿托伐他汀(10mg/天)进行的Hyp olypemiant治疗将他的血浆TC和LDL-c水平分别降低到293和218mg/dL。
5090 insC突变分析
由于这种突变没有改变限制性酶切图谱,我们设计了一对诱变引物以在突变等位基因存在而非正常等位基因存在时引入一个限制性内切核酸酶Mnl I的识别位点。
使用下列引物:Ex4AF(SEQ ID NO:9)和Mut509insCR(SEQ ID NO:11)通过聚合酶链式反应(PCR)来扩增外显子4A的一个244bp的片段。
在包含20mM Tris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)的50μL反应混合物中扩增DNA(500ng)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于65℃退火1分钟,于72℃延伸1分钟的35个循环,最后72℃延伸10分钟。
按照生产商(Fermentas Inc.,Hanover,MD,USA)所述的方法,在30μL的总体积中用15单位的Mnl I消化15微升PCR样品。获得的片段对于正常等位基因具有141、99和4bp的长度而对于突变等位基因具有141、88、12和4bp的长度。通过在8%聚丙烯酰胺凝胶中电泳分离这些片段并通过用溴化乙锭染色进行显影。
或者,能够以在载玻片上使用寡核苷酸:SEQ ID NO:60,SEQ ID NO:61,SEQ ID NO:62和SEQ ID NO:63的所述装置(“生物芯片”)来分析这种突变。
在一位44岁的妇女中检测到509insC突变,其具有高胆固醇血症TC(477mg/dL)和LDLc(394mg/dL),正常而没有早发性冠心病的个人和家族历史。按照MedPed标准,他们的诊断评分是9。她有两个患有c-LDL浓度超过95的高胆固醇血症的兄弟。
451del3突变分析
在筛选临床诊断为患有FH的受试者的LDL-r基因中突变的过程中,通过对来自外显子4(4A)的242bp片段的DNA测序来表征这种突变(451del3)。按照生产商所述的方法,使用扩增引物Ex4AF(SEQ ID NO:9)和Ex4AR(SEQ ID NO:10)和试剂盒CEQ 2000 Dye Terminator Cycle Sequencing withOuick Start(Beckman Coulter,Palo Alto,CA,USA)在两个方向上对来自DNA样品的纯化PCR产物直接进行测序。使用CEQ 8000 Genetic AnalysisSystem(Beckman Coulter,Inc.Fullerton)检测序列,并用CEQ 8000软件进行分析。通过对第二PCR产物进行测序证实了3个碱基对的缺失。或者,可以通过在载玻片中使用寡核苷酸:ID NO:172,SEQ ID NO:173,SEQ ID NO:174和SEQ ID NO:175以微阵列(“生物芯片”)来分析这种突变。
在一位患有脂性角膜弓并且以前在34岁时患有心肌梗塞的36岁男子中检测到了451del3突变。他有两个2岁和8岁的孩子,他们分别具有320和275mg/dl的TC。他被临床诊断为患有评分为17分的FH。没有使用降脂药物的情况下,他的空腹血清脂质分析为:TC 449mg/dL,LDL-c 367mg/dL,TG 218mg/dL和c-HDL-c 38mg/dL。用辛伐他汀(40mg/天)的治疗将他的LDL-c水平降到270mg/dL。
实施例5:位于LDLr基因的外显子4B中的突变的鉴定
使用下列引物:Ex4BF(SEQ ID NO:12)和Ex4BR(SEQ ID NO:13)通过聚合酶链式反应(PCR)来扩增LDLr基因的3′外显子4(外显子4B)的一个237bp的片段。
在包含20mM Tris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)的50μL反应混合物中扩增DNA(500ng)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于72℃退火和延伸2分钟的35个循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物。使用自动CEQ 2000XLDNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP图谱的那些片段进行测序。随后通过限制性酶切分析和通过微阵列(“生物芯片”)确定鉴定的突变的存在。
D157G突变分析
这种突变(533A>G,GAT>GGT,Asp195Gly)产生核酸内切酶Hph I的新的切割位点。按照生产商(NEB,Beverly,MA,USA)所述的方法,在30μL的总体积中用15单位的Hph I水解15微升外显子4B扩增材料。获得的片段对于正常等位基因具有237bp的长度而对于突变等位基因具有175和62bp的长度。通过在3% NuSieve琼脂糖凝胶中电泳分离这些片段并通过用溴化乙锭染色进行显影。或者,能够以在载玻片上使用寡核苷酸:SEQ ID NO:64,SEQ ID NO:65,SEQ ID NO:66和SEQ ID NO:67的所述装置(“生物芯片”)来分析这种突变。
在一位患有高胆固醇血症的32岁妇女中检测到D157G突变。在她的家族中,没有发现心血管事件。她被临床诊断为患有MedPed评分为6的可能的FH。使用降脂疗法之前,对她的空腹血清脂质的分析为:TC(358mg/dL)和LDL-c(296mg/dL),正常的TG和HDLc水平。用阿托伐他汀(10mg/天)的治疗将她的血浆TC和LDL-c水平分别降到212和140mg/dL。她的父亲也具有血浆胆固醇TC 364mg/dL的升高水平,以及她的祖母具有341mg/dL的升高水平。
C195R突变分析
这种突变(646T>C,TGT>CGT,Cys195Arg)产生BshNI的消化位点。按照生产商(Fermentas Inc.,Hanover,MD,USA)所述的方法,在30μL的总体积中用15单位的BshNI水解15微升的外显子4B扩增材料。相应于没有水解的扩增材料,获得的片段对于正常等位基因具有237bp的长度而对于突变等位基因具有159和78bp的长度。通过在8%聚丙烯酰胺(PAA)凝胶中电泳分离这些片段并通过用溴化乙锭染色进行显影。或者,能够以在载玻片上使用寡核苷酸:SEQ ID NO:68,SEQ ID NO:69,SEQ ID NO:70和SEQ IDNO:71的所述装置(“生物芯片”)来分析这种突变。
在一位患有高胆固醇血症和角膜弓的64岁妇女中检测到C195R突变。发现她的母亲患有早发性心血管疾病。她被临床诊断为患有MedPed评分为11分的FH。在没有采用降脂疗法的情况下,血浆脂质水平是:TC(560mg/dL)和LDLc(468mg/dL),正常的TG和HDLc水平。
67del15突变分析
通过异源双链分析来鉴定这种突变;将外显子4B的扩增材料PCR在8%聚丙烯酰胺凝胶上进行电泳,通过溴化乙锭进行的染色显影显示了异源双链条带而不是相应的正常和突变同源双链的存在。获得的片段在正常等位基因中具有237bp的长度,在突变等位基因中具有222bp的长度。因为在不相匹配(michtmached)的序列间形成的气泡,异源双链条带迁移得更慢。或者,可以通过将寡核苷酸SEQ ID NO:72,SEQ ID NO:73,SEQ ID NO:74及SEQ ID NO:75点样到载玻片上以微阵列(“生物芯片”)分析这种突变。
在一位63岁的妇女中检测到了675del15突变,她被临床诊断为患有MedPed评分为8分的FH。在她的家族中,没有发现心血管事件。未经治疗的脂质测定给了我们下列结果:TC(450mg/dL)和LDLc(379mg/dL),正常的TG和HDLc水平。没有找到家族成员来完成遗传研究。
684dup12突变分析
用MnlI核酸内切酶限制位点通过外显子4B扩增片段的消化来分析这种突变。通过突变产生了12bp的增加物,其容许通过在8%聚丙烯酰胺凝胶中电泳和用溴化乙锭对凝胶进行染色显影来检测在外显子4B扩增材料中的突变的存在。此外,按照生产商(Fermentas Inc.,Hanover,MD,USA)所述的方法,在30μL的总体积中用15单位的MnlI水解15微升外显子4B扩增材料。获得的片段对于正常等位基因具有192bp和45bp的长度而对于突变等位基因具有204和45bp的长度。通过在8%聚丙烯酰胺凝胶中电泳分离这些片段并通过用溴化乙锭染色进行显影。或者,可以通过将寡核苷酸SEQ ID NO:76,SEQ ID NO:77,SEQ ID NO:78和SEQ ID NO:79点样到载玻片上以所述装置(“生物芯片”)分析这种突变。
在2个不相关的患有常染色体显性高胆固醇血症的家族中检测到684dup12突变。这些家族之一的先证者是一位63岁的男子,其患有黄瘤和角膜弓。他在55岁时曾患有心肌梗塞,并且被临床诊断为患有MedPed评分为17分的FH。在他的家族中,没有发现心血管事件。没有经过降脂疗法的血浆脂质水平是:TC(469mg/dL),LDLc(408mg/dL),TG(100mg/dL)和HDLc 41mg/dL。
T200V突变分析
在筛选临床诊断为患有FH的受试者的LDL-r基因中突变的过程中,通过对来自外显子4(4B)的237bp片段的DNA测序来对这种突变(D200V(662A>T,GAC>GTC,Asp200Val))进行鉴定。按照生产商所述的方法使用扩增引物Ex4BF(SEQ ID NO:12)和Ex4BR(SEQ ID NO:13)与试剂盒CEQ2000 Dye Terminator Cycle Sequencing with Quick Start(Beckman Coulter,Palo Alto,CA,USA)在两个方向上对来自DNA样品的纯化PCR产物直接进行测序。使用CEQ 8000 Genetic Analysis System(Beckman Coulter,Inc.Fullerton)检测序列,并用CEQ 8000软件进行分析。通过对第二PCR产物进行测定来证实了662A>T的变化。或者,可以通过在载玻片中使用寡核苷酸:SEQ ID NO:232,SEQ ID NO:233,SEQ ID NO:234和SEQ ID NO:235的所述装置(“生物芯片”)来分析这种突变。
在患有常染色体显性高胆固醇血症的家族中检测到了D200V突变。所述受试者是一个43岁的妇女,她具有在婴儿期的高胆固醇血症的家族历史,并且她的母亲和兄弟表现出高于95个百分点的LDL-c水平。她被临床诊断为患有按照MedPed标准评分为8分的家族性高胆固醇血症。使用降脂药物普伐他汀(40mg/天),分析她的空腹血清脂质是TC 329mg/dL,LDL-c 273mg/dL,TG 73mg/dL和HDL-c 41mg/dL。
S205C突变分析
在筛选临床诊断为患有FH的受试者的LDL-r基因中突变的过程中,通过对来自外显子4(4B)的237bp片段的DNA测序来对这种突变S205C(677C>G,TCT>TGT,Ser205Cys)进行特征鉴定。使用扩增引物Ex4BF(SEQID NO:12)和Ex4BR(SEQ ID NO:13)与试剂盒CEQ 2000 Dye TerminatorCycle Sequencing with Quick Start(Beckman Coulter,Palo Alto,CA,USA)在两个方向上对来自DNA样品的纯化PCR产物直接进行测序。在自动测序仪CEQ 2000XL DNA Beckman Analysis System中分析通过测序反应产生的片段。通过自动测序相同样品的第二PCR产物证实所观察到的C>G变化。或者,可以通过将寡核苷酸:SEQ ID NO:228,SEQ ID NO:229,SEQ ID NO:230和SEQ ID NO:231点样到载玻片上,以所述装置(“生物芯片”)来分析这种突变。
在一位39岁的妇女中检测到了S205C突变,所述妇女具有高胆固醇血症家族史(母亲和兄弟的TC分别是450mg/dL和500mg/dL)并且她的两个孩子的TC超过95个百分点。她在20岁时被临床诊断为患有MedPed评分为8分的家族性高胆固醇血症。在药物治疗之前,血浆脂质浓度为:TC 390mg/dl,LDL-c 325mg/dL和HDL-c 35mg/dL。用辛伐他汀治疗(10mg/天)将她的血浆LDL-c水平降到270mg/dL。
实施例6:位于LDLr基因的外显子6中的突变的鉴定
使用下列引物:Ex6F(SEQ ID NO:14)及Ex6R(SEQ ID NO:15)通过聚合酶链式反应(PCR)来扩增LDLr基因的外显子6的一个179bp的片段。
在包含20mM Tris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)的50μL反应混合物中扩增DNA(500ng)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于56℃退火1分钟和于72℃延伸1分钟的35个循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物。使用自动CEQ 2000XLDNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP图谱的那些片段进行测序。随后通过限制性酶切分析和以前所述的装置(“生物芯片”)来确定鉴定的突变的存在。
C255G突变分析
因为这种突变C255G(826T>G,TGC>GGC,Cys255Gly)没有改变限制酶图谱,设计并且用非邻接的碱基合成了脱氧寡核苷酸以在存在突变等位基因时引入Bst UI限制性内切核酸酶的识别位点,其在正常等位基因存在时消失。
使用下列引物:Ex6R(SEQ ID NO:15)和MutC255GF(SEQ ID NO:16)通过聚合酶链式反应(PCR)来扩增LDLr基因的外显子6的一个163bp的片段。
在包含20mM Tris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)的50μL反应混合物中扩增DNA(500ng)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于63℃退火1分钟和于72℃延伸2分钟的35个循环,最后72℃延伸10分钟。
按照生产商(NEB,Beverly,MA,USA)所述的方法,在30μL的总体积中用15单位的BstUI消化15微升PCR样品。获得的片段对于正常等位基因具有163bp的长度而对于突变等位基因具有141和22bp的长度。在8%聚丙烯酰胺凝胶中电泳这些片段并用溴化乙锭染色进行显影。或者,可以通过将寡核苷酸SEQ ID NO:80,SEQ ID NO:81,SEQ ID NO:82和SEQ ID NO:83点样到载玻片上,以所述的装置(“生物芯片”)来分析这种突变。
在一个63岁的妇女中检测到了C255G的突变,她具有高胆固醇血症的家族历史。在治疗情况下,测定脂质为:TC(439mg/dL)和LDLc(355mg/dL),TG和HDLc水平正常。她被临床诊断为患有MedPed评分为8分的家族性高胆固醇血症。
E291X突变分析
因为这种突bbbb变E291X(934G>T,GAG>TAG,Asp291Stop)没有改变限制酶图谱,设计并且用非邻接的碱基合成了脱氧寡核苷酸以在存在突变等位基因时引入Ssp I限制性内切核酸酶的识别位点,其在正常等位基因存在时消失。
使用下列引物:Ex6F(SEQ ID NO:13)和MutE291XR(SEQ ID NO:17)通过聚合酶链式反应(PCR)来扩增LDLr基因的外显子6的一个164bp的片段。
在包含20mM Tris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)的50μL反应混合物中扩增DNA(500ng)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于59℃退火1分钟和于72℃延伸1分钟的35个循环,最后72℃延伸10分钟。
按照生产商(Amersham Pharmacia Biotech Inc.,Piscataway,NJ,USA)所述的方法,在30μL的总体积中用15单位的SspI消化15微升的PCR样品。获得的片段对于正常等位基因具有164bp的长度(非消化的片段)而对于突变等位基因具有144和20bp的长度。在3%NuSieve琼脂糖凝胶中电泳这些片段并用溴化乙锭染色进行显影。
或者,可以通过将寡核苷酸SEQ ID NO:84,SEQ ID NO:85,SEQ IDNO:86和SEQ ID NO:87点样到载玻片上以所述的装置(“生物芯片”)来分析这种突变。
在一个具有家族性常染色体显性高胆固醇血症的家族中检测到了E291X的突变。所述受试者是一个具有角膜弓的44岁男子,并且浓度如下:TC(381mg/dL),HDLc(45mg/dL),TG(111mg/dL)和LDLc(314mg/dL)。按照MedPed标准,他的家族性(familiar)高胆固醇血症的临床诊断达到12分。与辛伐他汀(40mg/天)和考来烯胺(colestiramin)(12g/天)结合的降脂治疗将他的血浆TC和LDL-c水平降到253mg/dL和188mg/dL。
818del8突变分析
通过异源双链分析来鉴定这种突变;外显子6的扩增产物在8%聚丙烯酰胺(PAA)凝胶中的电泳通过溴化乙锭进行染色显影,显示了在用溴化乙锭染色后,在凝胶中容易区别出异源双链条带取代相应的179和171bp的正常和突变同源双链的存在。因为在不相匹配的序列间形成的气泡,两个异源双链条带迁移得更慢。
此外,可以通过外显子6的PCR扩增和限制性酶切分析来证实这种突变,818del 8突变产生了新的Mae III核酸内切酶限制性酶切位点。按照生产商(Roche Diagnostics,Manheim,Germany)所述的方法,在30μL的总体积中用15单位的MaeIII消化15微升的PCR样品。获得的片段对于正常等位基因具有118,34和27bp的长度而对于突变等位基因具有118和53bp的长度。通过在8%聚丙烯酰胺凝胶中电泳分离这些片段并通过用溴化乙锭染色进行显影。或者,能够通过将寡核苷酸:SEQ ID NO:160,SEQ ID NO:161,SEQ ID NO:162和SEQ ID NO:163点样到载玻片上,以所述装置(“生物芯片”)来分析这种突变。
在一个69岁的妇女中检测到了818del8突变,所述妇女被临床诊断为患有MedPed评分为10分的FH。她的两个儿子具有血浆TC水平分别为382和304mg/dL的高胆固醇血症。按照MedPed标准,家族性高胆固醇血症的临床诊断达到了10分。在药物治疗之前的血浆脂质浓度为:TC(530mg/dL)和LDLc(439mg/dL)TG(170mg/dL和HDLc 57mg/dL。用西立伐他汀(0.4mg/天)进行的降脂治疗将她的LDL-c降到了363gmg/dL。
R279G突变分析
在筛选临床诊断为患有FH的受试者的LDL-r基因中突变的过程中,通过来自外显子6的179bp的片段的自动测序来对这种突变R279G(898A>G,AGA>GGA,Arg279Gly)进行鉴定。使用扩增引物Ex6F(SEQ ID NO:14)和Ex6R(SEQ ID NO:15)与试剂盒CEQ 2000 Dye Terminator Cycle Sequencingwith Quick Start(Beckman Coulter,Palo Alto,CA,USA)在两个方向上对来自DNA样品的纯化PCR产物直接进行测序。在自动测序仪CEQ 2000XL DNABeckman分析系统中分析通过序列反应产生的片段。通过对相同样品的第二PCR产物进行测序证实了所观察到的A>G变化。
或者,可以通过将寡核苷酸:SEQ ID NO:200,SEQ ID NO:201 SEQ IDNO:202和SEQ ID NO:203点样在载玻片中以所述装置(“生物芯片”)来分析这种突变。
在一个59岁的妇女中鉴定了R279G的突变,她的父亲和两个兄弟具有xantelasmas和高胆固醇血症的家族历史。FH的临床诊断评分是10分。在治疗前的血浆脂质水平是:TC 384mg/dL,LDL-c 314mg/dL和TG以及HDL-c水平正常。用辛伐他汀(80mg/天)进行的降脂治疗将她的LDL-c水平降到167mg/dL。
实施例7:位于LDLr基因的外显子7中的突变的鉴定
使用下列引物:Ex7F(SEQ ID NO:18)及Ex7R(SEQ ID NO:19)通过聚合酶链式反应(PCR)来扩增LDLr基因中的外显子7的一个234bp的片段。
在包含20mM Tris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM的每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)的50μL反应混合物中扩增DNA(500ng)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于57℃退火1分钟,于72℃延伸1分钟的35个循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物。使用自动CEQ 2000XLDNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP图谱的那些片段进行测序。随后通过限制性酶切分析和用先前所述的装置(“生物芯片”)分析通过测序鉴定的突变的存在。
941-39C>T突变分析
这种突变破坏了Apa I的消化位点。按照生产商(Fermentas Inc.,Hanover,MD,USA)所述的方法,在30μL的总体积中用15单位的Apa I对15微升的外显子7的PCR样品进行消化。获得的片段对于正常等位基因具有186,26和22bp的长度而对于突变等位基因具有208和26bp的长度。在8%的聚丙烯酰胺(PAA)凝胶中电泳这些片段,并通过用溴化乙锭染色进行显影。或者,能够通过将寡核苷酸:SEQ ID NO:88,SEQ ID NO:89,SEQ ID NO:90及SEQID NO:91点样在载玻片上以所述装置(“生物芯片”)来分析这种突变。
在四个不相关的家族中检测到了941-39C>T的突变,他们具有常染色体显性家族性高胆固醇血症的常见特性。这些家族其中一个的先证者是一个61岁的妇女,其已经患有心肌发作并且具有早发性心血管疾病的家族史。她被临床诊断为患有FH,并且MedPed的评分为7分。治疗前血浆脂质水平是:TC(340mg/dL)和LDLc(248mg/dL),以及TG 136mg/dL和HDL-c65mg/dL。用阿托伐他汀(20mg/天)进行降脂治疗后,TC和LDL-c的水平分别减到了233mg/dL和144mg/dL,而TG和HDL-c水平没有显著变化。
C319Y突变分析
该突变C319Y(1019G>A,TGC>TAC,Cys319Tyr)产生新的RsaI核酸内切酶消化位点。按照生产商(Gibco BRL,Carlsbad,CA,USA)所述的方法,在30μL的总体积中用15单位的Rsa I对15微升的PCR样品进行消化。获得的片段对于正常等位基因具有234bp的长度(没有消化的片段)而对于突变等位基因具有136和98bp的长度。在8%的聚丙烯酰胺(PAA)凝胶中电泳分离这些片段,并通过用溴化乙锭染色进行显影。或者,能够通过将寡核苷酸:SEQ ID NO:92,SEQ ID NO:93,SEQ ID NO:94和SEQ ID NO:95点样在载玻片上而用所述装置(“生物芯片”)来分析这种突变。
在具有常染色体显性家族性高胆固醇血症的家族中检测C319Y突变。所述受试者是43岁的男子,他具有角膜弓并且在跟腱(Achiles tendon)和手背上以及角膜弓上具有黄瘤,他17岁的儿子具有384mg/dL的总血浆胆固醇。他的父亲在45岁时遭遇猝死。他被临床诊断为患有MedPed评分为22分的FH。在治疗前的血浆脂质水平是:TC(428mg/dL)和LDLc(372mg/dL),TG水平正常。
1054del11突变分析
这种突变破坏了HphI酶的核酸内切酶限制性酶切位点。按照生产商(Gibco BRRL,Carlsbad,CA,USA)所述的方法,在30μL的总体积中用15单位的HphI对15微升的外显子7扩增材料进行消化。获得的片段在正常等位基因中具有189和45bp的长度而在突变等位基因中具有223bp的长度。在8%的聚丙烯酰胺凝胶中电泳分离这些片段,并通过用溴化乙锭染色进行显影。或者,能够通过将寡核苷酸:SEQ ID NO:96,SEQ ID NO:97,SEQ ID NO:98和SEQ ID NO:99点样在载玻片上以所述装置(“生物芯片”)来分析这种突变。
在具有常染色体显性家族性高胆固醇的家族中检测到了1054del 11的突变。所述受试者是一个43岁的男子,他在跟腱(Achiles tendon)上具有黄瘤并且具有早发性心血管疾病,其第一程度的亲属患有早发性心肌梗塞。他被临床诊断为患有MedPed评分为16分的FH。治疗前的血浆脂质水平为:TC(480mg/dL),LDLc(416mg/dL),TG(95mg/dL和HDLc 36mg/dL。
实施例8:位于LDLr基因的外显子8中的突变的鉴定
使用下列引物Ex8F(SEQ ID NO:148)和Ex8R(SEQ ID NO:149)通过聚合酶链式反应(PCR)对LDLr基因的外显子8的一个220bp的片段进行扩增。
在包含20mM Tris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)的50μL反应混合物中扩增DNA(500ng)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于64℃退火1分钟,于72℃延伸2分钟的35个循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物。利用自动CEQ 2000XLDNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP图谱的那些片段进行测序。随后通过限制性酶切分析和利用以前所述的装置“生物芯片”确定所鉴定的突变的存在。
1186±5 G>A突变分析
在筛选临床诊断为患有FH的受试者的LDL-r基因中突变的过程中,通过对来自外显子8的220bp的片段的自动测序来对这种突变(1186±5 G>A)进行表征。使用试剂盒CEQ 2000 Dye Terminator Cycle Sequencing withBeckman Quick Start(Beckman Coulter,Palo Alto,CA,USA)的试剂及引物Ex8BF(SEQ ID NO:148)和Ex8BR(SEQ ID NO:149)在PE Gene Amp System9700热循环仪进行测序反应。
在自动测序仪CEQ 2000XL DNA Beckman分析系统中分析通过测序反应产生的片段。通过对相同样品的第二PCR产物进行测序来证实G>A的变化。或者可以通过将寡核苷酸SEQ ID NO:188,SEQ ID NO:189,SEQ IDNO:190和SEQ ID NO:191点样到载玻片上使用所述的装置(“生物芯片”)来分析这种突变。
在两个具有常染色体显性高胆固醇血症的不相关的家族中鉴定这种突变。这些家族其中一个的先证者是34岁的妇女,她患有xantelasmas、角膜弓、腱黄瘤和高胆固醇血症的家族史。她被临床诊断为患有MedPed评分为21分的FH。治疗前的血浆脂质水平是:TC 411mg/dL,LDL-c 346mg/dL和正常的TG以及HDL-c水平。使用西立伐他汀(0.2mg/天)进行的降脂治疗将她的LDL-c减到222mg/dL。
实施例9:位于LDLr基因的外显子9中的突变的鉴定
使用下列引物:Ex9F(SEQ ID NO:20)和Ex9R(SEQ ID NO:21)通过聚合酶链式反应(PCR)来扩增LDLr基因中的外显子9的一个224bp的片段。
在包含20mM Tris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)的50μL反应混合物中扩增DNA(500ng)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于63℃退火1分钟,于72℃延伸2分钟的35个循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物。使用自动CEQ 2000XLDNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP图谱的那些片段进行测序。随后通过限制性酶切分析和用先前所述的装置(“生物芯片”)确定鉴定的突变的存在。
1197del9突变分析
通过异源双链分析来分析这种突变;PCR产物在8%聚丙烯酰胺凝胶上的电泳通过溴化乙锭进行染色显影显示了异源双链条带取代相应的正常和突变同源双链的存在。获得的片段对于正常等位基因中具有224bp的长度,对于突变等位基因中具有215bp的长度。因为在不相匹配的序列间形成的气泡,异源双链条带迁移得较慢。或者可以通过将寡核苷酸SEQ ID NO:100,SEQ ID NO:101,SEQ ID NO:102及SEQ ID NO:103点样到载玻片上以所述装置(“生物芯片”)分析这种突变。
在8个共有特性为具有常染色体显性家族性高胆固醇血症的不相关的家族中,检测到了1197del 9突变。在这些家族其中之一的先证者是一个患有黄瘤的45岁的妇女,她在41岁时患有心绞痛。她的父亲在36岁时患有心肌梗塞。她被临床诊断患有MedPed评分为18分的FH。治疗前血浆的脂质水平是:TC(525mg/dL),LDLc(443mg/dL),TG(163mg/dL)和HDLc(49mg/dL)。用阿托伐他汀(20mg/天)进行的降脂治疗将她的LDL-c减到323mg/dL。
Y379X突变分析
这种突变Y379X(1200C>A,TAC>TAA,Tyr379Stop)破坏了限制性核酸内切酶Mnl I酶的切割位点。按照生产商(Gibco BRL,Carlsbad,CA,USA)所述的方法,在30μL的总体积中用15单位的Mnl I对15微升的PCR样品进行消化。获得的片段对于正常等位基因中具有87、56、34、22、18、4和3bp的长度而对于突变等位基因中具有87、56、38、22、18和3bp的长度。这些片段在16%聚丙烯酰胺(PAA)凝胶中电泳,并且以这种方式,通过用溴化乙锭染色区分区别两种等位基因的34bp和38bp的条带是可能的。或者,能够通过将寡核苷酸:SEQ ID NO:104,SEQ ID NO:105,SEQ ID NO:106及SEQ ID NO:107点样在载玻片上而用所述装置(“生物芯片”)来分析这种突变。
在具有常染色体显性高胆固醇血症的家族中检测到了Y379X突变。来自这种家族的受试者是一个69岁的男子。他父亲在50岁时死于心肌梗塞,并且他的两个孩子具有超过95个百分点的总血浆胆固醇。他被临床诊断为患有MedPed评分为7分的FH。未经治疗的脂质测定给了我们下列结果:TC(381mg/dL)和LDLc(306mg/dL),正常TG和HDLc水平。用阿托他伐汀(20mg/天)进行的降脂治疗将他的LDL-c减到259mg/dL。
1207delT突变分析
这种突变破坏了限制性核酸内切酶MboII的切割位点。按照生产商(Amersham Pharmacia Biotech Inc.,Piscataway,NJ,USA)所述的方法,在30μL的总体积中用15单位的MboII对15微升的外显子9的扩增材料进行消化。获得的片段对于正常等位基因具有140、46、35和3bp的长度而对于突变等位基因具有140、48和35bp的长度。在16%的聚丙烯酰胺凝胶中电泳这些片段,并且通过用溴化乙锭染色,可以区分区别两种等位基因的46bp和48bp的条带。或者,能够通过将寡核苷酸:SEQ ID NO:108,SEQ ID NO:109,SEQID NO:110及SEQ ID NO:111点样在载玻片上而用所述装置(“生物芯片”)来分析这种突变。
在具有常染色体显性高胆固醇血症的家族成员中检测到了1207del T突变。所述受试者是35岁的妇女。FH临床诊断的MedPed评分是9分。未经降脂治疗的血浆脂质水平是:TC(429mg/dL),LDLc(345mg/dL),TG(188mg/dL)和HDLc(46mg/dL)。结合辛伐他汀(40mg/天)和考来替泊(5g/天)进行的降脂治疗将她的TC和LDL-c减到220mg/dL和137mg/dL,而在她的TG和HDL-c水平中没有显著变化。
Y421X突变分析
该突变Y421X(1326C>G,TAC>TAG,Tyr421Stop)产生新的核酸内切酶Bfa I的切割位点。按照生产商(NEB,Beverly,MA,USA)所述的方法,在30μL的总体积中用15单位的Bfa I对15微升的PCR样品进行消化。获得的片段对于正常等位基因具有224bp的长度(没有消化的片段)而对于突变等位基因具有164和60bp的长度。在8%的聚丙烯酰胺凝胶中电泳这些片段,并通过用溴化乙锭染色进行显影。或者,能够通过将寡核苷酸:SEQ ID NO:112,SEQ ID NO:113,SEQ ID NO:114及SEQ ID NO:115点样在载玻片上而用所述装置(“生物芯片”)来分析这种突变。
在共有常染色体显性家族性高胆固醇血症的三个不相关的家族中检测到了Y421X突变。这些家族其中一个的先证者是一个71岁的妇女,她患有角膜弓、腱黄瘤和xantelasmas。她的父亲在51岁时患有心肌梗塞并且她的儿子患有显著的高胆固醇血症(TC 367mg/dL)。她被临床诊断为患有MedPed评分为16分的FH。在没有使用降脂药物的情况下,脂质的血浆浓度为:TC(615mg/dL)和LDLc(550mg/dL),TG和HDLc水平正常。
1204insT突变分析
这种突变破坏了核酸内切酶MboII的切割位点。按照生产商(AmershamPharmacia,NJ,USA)所述的方法,在30μL的总体积中用15单位的MboII对15微升的外显子9的PCR样品进行消化。获得的片段在正常等位基因中具有141,45,35和3bp的长度而在突变等位基因中具有141、45和39bp的长度。在8%的聚丙烯酰胺凝胶中电泳这些片段,并通过用溴化乙锭染色进行显影。或者,能够通过将寡核苷酸:SEQ ID NO:168,SEQ ID NO:169,SEQ IDNO:170及SEQ ID NO:171点样在载玻片上而用所述装置(“生物芯片”)来分析这种突变。
在一个12岁的女孩中检测到了这种突变。她的父亲和7岁的兄弟患有高胆固醇血症,其TC水平分别为412和321mg/dL。FH临床诊断的MedPed评分为9分。在没有应用降脂药物的情况下,对她的空腹血清脂质水平分析是:TC 332mg/dL,LDL-c 267mg/dL,TG和HDL-c水平正常。用树脂(15g/天)进行的降脂治疗将LDL-c水平减到248mg/dL。
实施例10:位于LDLr基因的外显子10中的突变的鉴定
使用下列引物:Ex10F(SEQ ID NO:22)和Ex10R(SEQ ID NO:23)通过聚合酶链式反应(PCR)来扩增LDLr基因中的外显子10的一个278bp的片段。
在包含20mM Tris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)的50μL反应混合物中扩增DNA(500ng)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于58℃退火1分钟,于74℃延长1分钟的35个循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物。使用自动CEQ 2000XLDNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP图谱的那些片段进行测序。随后通过限制性酶切分析和用先前所述的装置(“生物芯片”)确定所鉴定的突变的存在。
1432delG突变分析
因为这种突变没有改变限制酶图谱,设计并且合成了错配的脱氧寡核苷酸以在存在突变等位基因时引入NaeI限制性内切核酸酶的识别位点,其在正常等位基因存在时消失。
使用下列引物:Ex10R(SEQ ID NO:23)和Mut1432GF(SEQ ID NO:24)通过聚合酶链式反应(PCR)来扩增LDLr基因的外显子10的一个200bp的片段。
在包含20mM Tris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)的50μL反应混合物中扩增DNA(500ng)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于58℃退火1分钟和于72℃延伸2分钟的35个循环,最后72℃延伸10分钟。
按照生产商(Amersham Pharmacia Biotech Inc.,Piscataway,NJ,USA)所述的方法,在30μL的总体积中用15单位的Nae I消化15微升的PCR样品。获得的片段对于正常等位基因具有200bp的长度(未消化的片段)而对于突变等位基因具有179和20bp的长度。在8%的聚丙烯酰胺凝胶中电泳这些片段并用溴化乙锭染色进行显影。或者可以通过将寡核苷酸SEQ ID NO:116,SEQ ID NO:117,SEQ ID NO:118和SEQ ID NO:119点样到载玻片上来使用所述的装置(“生物芯片”)来分析这种突变。
在一个具有常染色体显性高胆固醇血症的家族中检测到了1432del G突变。所述受试者是一个患有腱黄瘤的53岁的妇女,她已经患有心肌梗塞,而且具有早发性心血管疾病的家族史。她被临床诊断为患有MedPed评分为15分的FH。没有使用降脂疗法的脂质分析给了我们下列结果:TC(548mg/dL)和LDLc(470mg/dL),TG和HDLc水平正常。
T433N突变分析
在分析临床诊断为患有FH的受试者中的这种片段时,通过对LDL-r基因的外显子10的278bp片段的自动测序来对这种突变T433N(1361C>A,ACC>AAC,Tyr433Asn)进行表征。使用试剂盒CET 2000 Dye TerminatorCycle with Beckman Quick Start(Beckman Coulter,Palo Alto,CA,USA)的试剂和引物Ex10F(SEQ ID NO:22)和Ex10R(SEQ ID NO:23)在PE GeneAmp System 9700热循环仪中进行测序反应。在自动测序仪CEQ 2000XLDNA Beckman分析系统中分析由测序反应产生的片段。通过对相同样品的第二PCR产物的测序来确认C>A变化。或者,能够通过将寡核苷酸SEQ IDNO:156,SEQ ID NO:157,SEQ ID NO:158和SEQ ID NO:159点样在载玻片上以所述装置(“生物芯片”)来分析这种突变。
在一位具有角膜弓和常染色体显性高胆固醇血症家族史的50岁男子中检测到T433N突变,他的21岁的女儿的TC水平为310mg/dL。FH临床诊断的MedPed评分为6分。在开始药物治疗之前分析他的血浆脂质浓度为:TC318mg/dl,LDL-c 249mg/dL,TG和HDL-c正常。用洛伐他汀(20mg/天)进行的降脂治疗将他的LDL-c减到199mg/dL。
突变T446I的分析
通过对临床诊断患有FH的受试者中LDL-r基因的外显子10的278bp片段的自动测序来对这种突变T446I(1400C>T,ACC>ATC,Tyr446Ile)进行表征。使用试剂盒CEQ 2000 Dye Terminator Cycle with Quick Start(BeckmanCoulter,Palo Alto,CA,USA)的试剂和引物Ex10F(SEQ ID NO:22)和Ex10R(SEQ ID NO:23)在PE Gene Amp System 9700热循环仪进行测序反应。在自动测序仪CEQ 2000XL DNA Beckman分析系统中分析由测序反应产生的片段。通过对来自相同样品的第二PCR产物的测序来确认C>T变化。或者,能够通过将寡核苷酸SEQ ID NO:204,SEQ ID NO:205,SEQ ID NO:206和SEQ ID NO:207点样到载玻片上以所述装置(“生物芯片”)来分析这种突变。
在一位具有早发性心血管疾病背景(在62岁时发生绞痛)的64岁妇女中检测到T446I突变,她的两个兄弟患有高胆固醇血症,且分别在40和46岁时遭受心肌梗塞。她被临床诊断为患有MedPed评分为9分的FH。在用普伐他汀进行药物治疗期间,脂质的血浆浓度为:TC(352mg/dL)和LDLc(281mg/dL),TG和HDLc水平正常。用20mg/天的辛伐他汀进行降脂治疗后将LDL-c水平减到150mg/dL。
突变1423del GC/insA的分析 (
Análisis de la mutación 1423delGC/insA)
这种突变1423del GC/insA破坏了核酸内切酶MvaI的切割位点。按照生产商(Fermentas Inc.,Henover,MD,USA)所述方法,在30μL的总体积中用15单位的MvaI对15μL的外显子10的PCR产物进行消化。获得的片段对于正常等位基因具有150和128bp的长度而对于突变等位基因具有128,87和63bp的长度。在8%的聚丙烯酰胺凝胶中电泳这些片段并且通过用溴化乙锭染色显影。或者可以通过将寡核苷酸SEQ ID NO:164,SEQ ID NO:165,SEQID NO:166及SEQ ID NO:167点样到载玻片上以所述装置(“生物芯片”)来分析这种突变。
在一位34岁的男子中检测到这种突变,他的父母具有患高胆固醇血症的历史。FH临床诊断的MedPed评分是9分。药物治疗之前的血浆脂质浓度是:在没有使用降脂药物治疗情况下,他的空腹血清脂质水平是:总TC554mg/dL,LDL-c 422mg/dL,TG和HDL-c水平正常。用阿托伐他汀(10g/天)进行的降脂治疗将他的LDL-c水平降到406mg/dL。
实施例11:位于LDLr基因的外显子11中的突变的鉴定
使用下列引物Ex11F(SEQ ID NO:25)及Ex11R(SEQ ID NO:26)通过聚合酶链式反应(PCR)扩增LDLr基因的外显子11的一个194bp的片段。
在50μL的反应混合物中扩增DNA(500ng),所述反应混合物包含20mM Tris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于65℃退火1分钟,于72℃延伸2分钟的35个循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物。使用自动CEQ 2000XLDNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP图谱的那些片段进行测序。随后通过限制性酶切分析和通过前面所述装置“生物芯片”分析通过测序鉴定的突变的存在。
W515X突变分析
这种突变W515X(1607G>A,TGG>TAG,Trp515Stop)产生新的BfaI消化位点。按照生产商(NEB,Beverly,MA,USA)所述方法,在30μL的总体积中使用15单位的BfaI对15μL的PCR样品进行消化。获得的片段对于正常等位基因具有164和30bp的长度,而对于突变等位基因具有97、67和30bp的长度。这些片段在3%NuSieve琼脂糖凝胶中进行电泳并且通过溴化乙锭染色进行显影。或者,可以通过将寡核苷酸:SEQ ID NO:120,SEQ ID NO:121,SEQ ID NO:122和SEQ ID NO:123点样到载玻片上用所述装置(“生物芯片”)来分析这种突变。
在一位患有角膜弓的39岁男子中检测到W515x突变,他的父亲在50岁时遭遇心肌梗塞。他已被临床诊断为患有MedPed评分为13分的家族性高胆固醇血症。未经药物治疗的血浆脂质浓度为:TC(364mg/dL)和LDLc(308mg/dL),TG和HDLc水平正常。所述受试者的父亲,两个兄弟和儿子的胆固醇水平超过95个百分点。
[1587-5del5;1587del31]的突变分析
分析在临床诊断为患有FH的受试者中的这种片段时,通过对来自LDL-r基因的外显子11的194bp片段的自动测序来对这种突变[1587-5del5;1587del31]进行鉴定。使用试剂盒CEQ 2000 Dye Terminator CycleSequencing with Quick Start(Beckman Coulter,Palo Alto,CA,USA)和引物Ex11RF(SEQ ID NO:25)和Ex11R(SEQ ID NO:26)在热循环仪PE GeneAmp System 9700中进行测序反应。
在自动测序仪CEQ 2000XL DNA Beckman分析系统中分析通过测序反应产生的片段。通过在2%琼脂糖凝胶中进行电泳,随后可以观察到分别相应于正常等位基因和突变等位基因的194bp和258bp的条带来确定这种缺失。或者,可以通过将寡核苷酸SEQ ID NO:256,SEQ ID NO:257,SEQ IDNO:258和SEQ ID NO:259点样到载玻片上用所述装置(“生物芯片”)来分析这种突变。
在一位患有角膜弓的43岁男子中检测到[1587-5del5;1587del31]突变,他具有常染色体显性高胆固醇血症家族史(父亲和儿子患有高胆固醇血症)和家族中成员患有心血管疾病的证据(他的父亲在50岁时患有心肌梗塞)。他被临床诊断患有MedPed评分为9分的FH。药物治疗前的血浆脂质浓度为:TC(345mg/dL)和TG(160mg/dL)和HDLc(34mg/dL)。结合40mg/天的辛伐他汀和10g/天的考来替泊进行的降脂治疗将LDL-c水平减到208mg/dL。
g516x突变的分析
G516X突变分析
这种突变(1609G>T,GGA>TGA,Gly516Stop)产生一种新的HphI消化位点。按照生产商(NEB,Beverly,MA,USA)所述方法,在30μL的总体积中,用15单位的HphI消化15μL的外显子11的扩增材料。获得的片段对于正常等位基因具有139,43,和12bp的长度,对于突变等位基因具有81,58,43和12bp的长度。将这些片段在8%聚丙烯酰胺凝胶中进行电泳,并且通过溴化乙锭染色进行显影。或者,可以通过将寡核苷酸:SEQ ID NO:176,SEQ IDNO:177,SEQ ID NO:178和SEQ ID NO:179点样到载玻片上,用所述装置(“生物芯片”)来分析这种突变。
在一个患有腱黄瘤和具有高胆固醇血症家族史(母亲和两个处于青春期的兄弟的LDL-c水平超过95个百分点)的20岁女子中检测到G516X突变。她已经被诊断为患有MedPed诊断评分为17分的家族性高胆固醇血症。药物治疗前血浆脂质浓度为:TC 476mg/dL,LDL-c 403mg/dl以及TG和HDL-c水平正常。用HMGCoA还原酶抑制剂进行降脂治疗后,LDL-c水平减到202mg/dL。
H562Q突变分析
在对临床诊断患有FH的患者中的这种片段进行分析时,通过对来自LDL-r基因的外显子11的194bp的片段的自动测序来鉴定这种突变(1749C>A,CAC>CAA,His562Gln)。使用试剂盒CEQ 2000 Dye TerminatorCycle Sequencing with Quick Start(Beckman Coulter,Palo Alto,CA,USA)和引物Ex11F(SEQ ID NO:25)及Ex11R(SEQ ID NO:26)在热循环仪PEGene Amp System 9700上进行测序反应。在自动测序仪CEQ 2000XL DNABeckman分析系统上来分析通过测序反应产生的片段。通过对相同样品的第二PCR产物的自动测序来确认观察到的C>A变化。或者可以通过将寡核苷酸:SEQ ID NO:208,SEQ ID NO:209,SEQ ID NO:210和SEQ ID NO:211点样到载玻片上以所述装置(“生物芯片”)来分析这种突变。
在一位具有常染色体显性高胆固醇血症家族史的37岁妇女中检测到H562Q突变,(父亲患有高胆固醇血症并且在48岁时遭遇心肌梗塞,她的13岁的儿子具有500mg/dL的TC水平)。她被临床诊断为患有MedPed评分为9分的FH。药物治疗前血浆脂质浓度为:TC(350mg/dL),TG和HDLc水平正常。使用20mg/天的阿托伐他汀进行降脂治疗后,将TC水平降到333mg/dL。
实施例12:位于LDLr基因的外显子12中的突变的鉴定
使用下列引物Ex12F(SEQ ID NO:150)和Ex12R(SEQ ID NO:151)通过聚合酶链式反应(PCR)扩增了外显子12的236bp的片段。
在50μL反应混合物中扩增DNA(500ng),所述反应混合物包含20mMTris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于58℃退火1分钟,于72℃延长2分钟的35个循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物。使用自动CEQ 2000XLDNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP图谱的那些片段进行测序。随后通过限制性酶切分析和用先前所述的装置(“生物芯片”)确定所鉴定的突变的存在。
E579D突变分析
在对临床诊断为患有FH的患者中的这种片段进行分析时,通过对来自LDL-r基因的外显子12的236bp的片段进行自动测序来鉴定这种突变E579D(1800G>C,GAG>GAC,Glu579Asp))。使用试剂盒CEQ 2000 Dye TerminatorCycle Sequencing with Quick Start(Beckman Coulter,Palo Alto,CA,USA)和引物Ex12F(SEQ ID NO:150)和Ex12R(SEQ ID NO:151)在热循环仪PEGene Amp System 9700中进行测序反应。在自动测序仪CEQ 2000XL DNABeckman分析系统中分析通过测序反应产生的片段。通过对相同样品的第二PCR产物的自动测序来确证所观察的G>C变化。或者,能够通过将寡核苷酸:SEQ ID NO:224,SEQ ID NO:225,SEQ ID NO:226和SEQ ID NO:227点样在载玻片上而用所述装置(“生物芯片”)来分析这种突变。
在一个具有常染色体显性高胆固醇血症家族史(具有TC 450mg/dL的ather以及他的兄弟和两个处于青春期的孩子的LDL-c水平为95个百分点)。他被临床诊断为患有MedPed评分为8分的FH。在药物治疗之前,分析他的血浆脂质浓度为:TC(320mg/dL),LDL-c(250mg/dL),TG和HDL-c水平正常。用阿托伐他汀(10mg/天)进行降脂治疗后,LDL-c水平降到187mg/dL。
1815del11突变分析
通过异源双链分析可以鉴定这种突变。当突变存在时,外显子12的PCR扩增材料在8%聚丙烯酰胺(PAA)凝胶中进行的电泳显示分子量比两个236和225bp的同源双链条带的明显大得多的异源双链条带的存在,通过溴化乙锭染色后容易在凝胶中区分它们。异源双链的两个条带以较慢的速度迁移,因为在错配的序列之间形成气泡。或者,可以通过将寡核苷酸:SEQ IDNO:184,SEQ ID NO:185,SEQ ID NO:186及SEQ ID NO:187点样到载玻片上来以所述的装置(“生物芯片”)分析这种突变。
在具有常染色体显性家族性高胆固醇血症的四个不相关的家族中鉴定了1815del11突变。这些家族的其中一个的先证者是一个69岁的妇女,她患有角膜弓,具有早发性冠状动脉疾病的迹象(56岁时绞痛),以及在她一些家族成员中具有高胆固醇血症(两个兄弟分别具有700和435mg/dL的TC)的历史。她被临床诊断为患有MedPed评分为13分的FH。在用辛伐他汀(40mg/dL)进行降脂治疗的情况下,血浆脂质水平为:TC444mg/dL,LDL-c368mg/dL和正常的TG以及HDL-c水平。用阿托伐他汀(30mg/天)进行的降脂治疗将她的LDL-c减到225mg/dL。
实施例13:位于LDLr基因的外显子13中的突变的鉴定
使用下列引物Ex13F(SEQ ID NO:27)及Ex13R(SEQ ID NO:289)通过聚合酶链式反应(PCR)对LDLr基因的外显子13的一个215bp的片段进行扩增。
在50μL的反应混合物中扩增DNA(500ng),所述混合物包含20mMTris-HCl,pH 8.4,50mM KCl,1mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于59℃退火1分钟,于74℃延伸3分钟的35个循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物。使用自动CEQ 2000 XLDNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP图谱的那些片段进行测序。随后通过限制性酶切分析和利用以前描述的装置“生物芯片”确定所鉴定的突变的存在。
D630N突变分析
这种突变D630N(1951G>A,GAT>AAT,Asp630Asn)破坏MnlI消化位点。按照生产商(Fermentas Inc.,Hanover,MD,USA)所述的方法,在30μL的总体积中用15单位的Mnl I消化15微升的PCR样品。获得的片段在正常等位基因中具有89,48,39,14+14,12和11bp的长度而在突变等位基因中具有89,59,39,14+14和12bp的长度。这些片段在8%聚丙烯酰胺凝胶中进行电泳,并通过用溴化乙锭染色进行显影。或者,能够通过将寡核苷酸:SEQ IDNO:124,SEQ ID NO:125,SEQ ID NO:126和SEQ ID NO:127点样在载玻片上,以所述装置(“生物芯片”)来分析这种突变。
在具有常染色体显性遗传的两个不相关的家族中检测到D630N突变。这种家族之一的先证者是一个36岁的妇女,她的父母在62和64岁时死于心肌梗塞。FH临床诊断的MedPed得分为7分。未经药物治疗的血浆脂质浓度为:TC(332mg/dL)和LDLc(268mg/dL),TG(81mg/dL)和HDLc(48mg/dL)。
H635N突变分析
因为这种突变H635N(1966C>A,CAC>AAC,His635Asn)不改变限制性酶切图谱,设计了并合成了有两个错配的脱氧寡核苷酸以在正常等位基因存在时引入Cai I的识别位点,其在存在突变等位基因时消失。
使用脱氧寡核苷酸Ex13F(SEQ ID NO:27)和具有两个错配MutH635NR的脱氧寡核苷酸(SEQ ID NO:29)通过PCR技术扩增外显子13的一个169bp的片段。
在50μL反应混合物中扩增DNA(500ng),所述反应混合物包含20mMTris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于56℃退火1分钟,于72℃延长1分钟的35个循环,最后72℃延伸10分钟。
按照生产商(Fermentas Inc.,Hanover,MD,USA)所述的方法,在30μL的总体积中用15单位的Cai I消化15微升的PCR样品。获得的片段在正常等位基因中具有151和18bp的长度而在突变等位基因中具有169bp的长度。通过在8%PAA凝胶中电泳这些片段并通过用溴化乙锭染色进行显影。或者,通过将寡核苷酸:SEQ ID NO:128,SEQ ID NO:129,SEQ ID NO:130及SEQ ID NO:131点样到载玻片上以所述装置(“生物芯片”)分析这种突变。
在常染色体显性高胆固醇血症家族的一个成员中检测到H635N突变。所述受试者是一个43岁的男子,他患有角膜弓,并且没有早发性心血管疾病家族历史。他的母亲和三个同胞的胆固醇浓度超过95个百分点。他被临床诊断为患有MedPed评分为13分的FH。他的没有经过药物治疗的血浆脂质浓度为:TC(448mg/dL)和LDLc(384mg/dL),具有正常的TG和HDLc水平。
实施例14:位于LDLr基因外显子14中的突变的鉴定
使用脱氧寡核苷酸Ex14F(SEQ ID NO:30)和Ex14R(SEQ ID NO:31)通过聚合酶链式反应(PCR)对LDLr基因的外显子14的一个288bp的片段进行扩增。
在50μL反应混合物中扩增DNA(250ng),所述反应混合物包含20mMTris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,20μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于59℃退火1分钟,于72℃延伸2分钟的35个循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物。利用自动CEQ 2000XLDNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP图谱的那些片段进行测序。随后通过限制性分析和前述装置“生物芯片”测定所鉴定的突变的存在。
D686Y突变分析
在分析临床诊断患有FH的受试者中的这种片段时,通过对来自LDL-r基因的外显子14的288bp的片段的自动测序(automatic)来鉴定这种突变D686Y(2119G>T,GAC>TAC,Asp686Tyr)。使用试剂盒CEQ 2000 DyeTerrminator Cycle Sequencing with Quick Start(Beckman Coulter,Palo Alto,CA,USA)以及引物Ex14F(SEQ ID NO:30)和Ex14R(SEQ ID NO:31)在热循环仪PE Gene Amp System 9700进行测序反应。
在自动测序仪CEQ 2000XL DNA Beckman分析系统中分析通过测序反应产生的片段。通过对相同样品的第二PCR产物进行自动测序来证实观察到的G>T的变化。或者可以通过将寡核苷酸SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218和SEQ ID NO:219点样到载玻片上使用所述的装置(“生物芯片”)来分析这种突变。
在一位31岁的男子中检测到D686Y突变,他患有黄瘤(xantomas)、角膜弓,具有早发性冠状动脉疾病的迹象(绞痛)和高胆固醇血症的家族史。他被临床诊断为患有MedPed评分为21分的FH。在药物治疗前,他的血浆脂质浓度为:TC(430mg/dL),具有正常的TG和HDLc水平。结合40mg/天的阿托伐他汀和考来替泊(5g/天)进行降脂治疗后,TC水平降到205mg/dL。
实施例15:位于LDLr基因的外显子15中的突变的鉴定
使用脱氧寡核苷酸Ex15F(SEQ ID NO:32)和Ex15R(SEQ ID NO:33)通过聚合酶链式反应(PCR)来扩增LDLr基因中的外显子15的一个243bp的片段。
在50μL反应混合物中扩增DNA(500ng),所述反应混合物包含20mMTris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,20μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于55℃退火30秒,于72℃延伸1.5分钟的35个循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物。使用自动CEQ 2000 XLDNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP模式的那些片段进行测序。随后通过限制性分析和用先前所述的装置(“生物芯片”)确定鉴定的突变的存在。
2184delG突变分析
这种突变产生新的限制性酶AluI的切割位点。按照生产商(Gibco BRL,Carlsbad,CA,15USA)所述的方法,在30μL的总体积中用15单位的AluI对15微升的PCR样品进行消化。获得的片段对于正常等位基因具有166和78bp的长度而对于突变等位基因具有166、67和11bp的长度。在8%的聚丙烯酰胺凝胶中电泳这些片段,并通过用溴化乙锭染色进行显影。或者,能够将寡核苷酸:SEQ ID NO:132,SEQ ID NO:133,SEQ ID NO:134及SEQ IDNO:135点样在载玻片上,以所述装置(“生物芯片”)来分析这种突变。
在一个常染色体显性高胆固醇血症家族中检测到2184del C突变。所述受试者是一个32岁的妇女,她具有早发性心血管疾病的家族史。FH临床诊断的MedPed评分为6分。未经药物治疗的血浆脂质浓度是:TC(330mg/dL)和LDLc(270mg/dL)以及正常的TG和HDLc水平。
T740M突变的分析
这种突变T740M(2282C>T,ACG>ATG,Tyr740Met)产生新的Nla III消化位点。按照生产商(NEB,Beverly,MA,USA)所述的方法,在30μL的总体积中用15单位的Nla III对15微升的PCR样品进行消化。获得的片段对于正常等位基因具有247bp的长度而对于突变等位基因具有274,194和53bp的长度。这些片段在8%的聚丙烯酰胺凝胶中进行电泳,并通过用溴化乙锭染色进行显影。或者,能够将寡核苷酸:SEQ ID NO:192,SEQ ID NO:193,SEQID NO:194和SEQ ID NO:195点样在载玻片上,以所述装置(“生物芯片”)来分析这种突变。
在一位60岁的妇女中检测到T740M突变,她患有角膜弓,具有高胆固醇血症的家族史和早发性心血管疾病的家族史。她的父亲在34岁时死于脑血管疾病。她已经被诊断为患有MedPed评分为10分的家族性高胆固醇血症。药物治疗前的血浆脂质的浓度是:TC 492mg/dL和正常的TG以及HDL-c水平。用阿托伐他汀进行降脂治疗后,TC水平降到251mg/dL。
实施例16:位于LDLr基因的外显子16中的突变的鉴定
使用下列引物:Ex16F(SEQ ID NO:152)和Ex16R(SEQ ID NO:153)通过聚合酶链式反应(PCR)来扩增外显子16的一个273bp的片段。
在50μL反应混合物中扩增DNA(500ng),所述反应混合物包含20mMTris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,20μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于63℃退火1分钟,于72℃延伸2分钟的35个循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物。使用自动的CEQ 2000 XLDNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP图谱的那些片段进行测序。随后通过限制性酶切分析和用先前所述的装置(“生物芯片”)确定所鉴定的突变的存在。
V766E突变分析
在对临床诊断患有FH的患者中的这种片段进行分析时,通过对来自LDL-r基因的外显子16的273bp的片段的自动测序来鉴定这种突变V766E(2360T>A,GTG>GAG,Val766Glu)。使用试剂盒CEQ 2000 Dye TerminatorCycle Sequencing with Beckman Quick Start(Beckman Coulter,Palo Alto,CA,USA)和引物Ex16F(SEQ ID NO:152)和Ex16R(SEQ ID NO:153)在热循环仪PE Gene Amp System 9700上进行测序反应。在自动测序仪CEQ 2000XLDNA Beckman分析系统上来分析通过测序反应产生的片段。通过对第二PCR产物的测序来确认观察到的T>A变化。或者可以通过将寡核苷酸:SEQ ID NO:236,SEQ ID NO:237,SEQ ID NO:238和SEQ ID NO:239点样到载玻片上以所述装置(“生物芯片”)来分析这种突变。
在一个58岁的妇女中检测到D686Y突变,她患有肘部的腱黄瘤(tendonxantomas)、角膜弓、xantelasmas并且具有高胆固醇血症的家族史。她被临床诊断为患有MedPed评分为12分的FH。药物治疗之前的血浆脂质浓度为:TC(420mg/dL)、LDL-c(324mg/dL),TG和HDLc水平正常。
I771T突变分析
因为这种突变I771T(2375T>C,ATT>CACT,Ile771Thr)不改变限制性酶切图谱,设计并且合成了错配的脱氧寡核苷酸以在存在突变等位基因时引入HincII的识别位点,其在正常等位基因存在时消失。
使用脱氧寡核苷酸Ex16R(SEQ ID NO:153)和错配的脱氧寡核苷酸MutI771TF(SEQ ID NO:154)通过PCR技术来扩增LDLr基因的外显子16的一个142bp的片段。
在50μL反应混合物中扩增DNA(500ng),所述反应混合物包含20mMTris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于61℃退火1分钟,于72℃延伸2分钟的35个循环,最后72℃延伸10分钟。
按照生产商(Amersharn Pharmacia Biotech Inc.,Piscataway,NJ,USA)所述的方法,在30μL的总体积中用15单位的Hinc II对15微升的PCR样品进行消化。获得的片段在正常等位基因中具有142bp的长度而在突变等位基因中具有121和21bp的长度。这些片段在8%的聚丙烯酰胺凝胶中进行电泳,并通过用溴化乙锭染色进行显影。或者,能够将寡核苷酸:SEQ ID NO:196,SEQ ID NO:197,SEQ ID NO:198及SEQ ID NO:199点样在载玻片上以所述装置(“生物芯片”)来分析这种突变。
在一个60岁的妇女中检测到I771T突变,她的家族中具有早发性冠状疾病的迹象并且具有高胆固醇血症家族史。她已经被诊断患有MedPed诊断评分为21分的家族性高胆固醇血症。她的血浆脂质水平为:TC(422mg/dL)和LDLc(368mg/dL),以及正常的TG和HDLc水平。
2389+3A>C突变分析
通过对来自临床诊断为患有FH的受试者的LDL-r基因的外显子16的一个273bp片段的DNA测序鉴定了这种突变2389+3C>T。使用试剂盒CEQ2000 Dye Terminator Cycle Sequencing with Quick Start(Beckman Coulter,Palo Alto,CA,USA)以及引物Ex16F(SEQ ID NO:152)和Ex16R(SEQ ID NO:153)在热循环仪PE Gene Amp System 9700中进行测序反应。在自动测序仪CEQ 2000 XL DNA Beckman分析系统中分析通过测序反应产生的片段。通过对相同样品的第二PCR产物的自动测序证实了所观察到的C>T变化。
或者,能够通过将寡核苷酸:SEQ ID NO:252,SEQ ID NO:253,SEQ IDNO:254和SEQ ID NO:255点样在载玻片上,以所述装置(“生物芯片”)来分析这种突变。
在一个36岁的男子中检测到2389+3C>T突变,他患有aquiles heel腱黄瘤(xantomas)和手肿胀(hand extenders),并且在家族中具有高胆固醇血症的历史(母亲,兄弟和一个儿子具有超过95个百分点的LDL-c水平)。他被临床诊断为患有MedPed评分为18分的FH。药物治疗前的血浆脂质浓度为:TC(450mg/dL),TG和HDLc水平正常。用阿托伐他汀(20mg/dL)进行的降脂治疗将他的LDL-c减到259mg/dL。
2389±4 A>G突变分析
因为这种突变(2389+4 A>G)不改变限制性酶切图,设计并且合成了错配的脱氧核苷酸(deoxyinucleotide)来在存在突变等位基因时引入BshNI的识别位点,但是其在存在正常等位基因时消失。
使用下列引物:Ex16F(SEQ ID NO:152)和错配的脱氧寡核苷酸Mut2389+4 A>GR(SEQ ID NO:155)通过聚合酶链式反应(PCR)扩增一个194bp的片段。
在50μL反应混合物中扩增DNA(500ng),所述反应混合物包含20mMTris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于61℃退火1分钟,于72℃延伸2分钟的35个循环,最后72℃延伸10分钟。
按照生产商(Fermentas Inc.,Hanover,MD,USA)所述的方法,在30μL的总体积中用15单位的Bsh NI对15微升的PCR样品进行消化。获得的片段对于正常等位基因中具有194bp的长度而对于突变等位基因中具有175和19bp的长度。这些片段在8%的聚丙烯酰胺凝胶中进行电泳,并通过用溴化乙锭染色进行显影。或者,可以通过将寡核苷酸:SEQ ID NO:180,SEQ IDNO:181,SEQ ID NO:182及SEQ ID NO:183点样在载玻片上以所述装置(“生物芯片”)来分析这种突变。
在11个不相关的高胆固醇血症家族中检测到2389+A>G突变。这种家族之一的先证者是一个22岁的妇女,她患有腱黄瘤并且具有早发性心血管疾病的家族史(父亲患有高胆固醇血症并且在29岁时有心肌梗塞)。她已经被诊断为患有MedPed评分为17分的家族性高胆固醇血症。她的没有经过降脂治疗的血浆脂质水平是:TC(356mg/dL)和LDLc(293mg/dL),以及正常的TG和LDLc水平。结合阿托伐他汀(40mg/天)和考来替泊(5g/天)进行的降脂治疗将她的HLD-c水平降到227mg/dL。
实施例17:位于LDLr基因的外显子17中的突变的鉴定
使用下列引物:Ex17F(SEQ ID NO:34)和Ex17R(SEQ ID NO:35)通过聚合酶链式反应(PCR)来扩增外显子17的一个242bp的片段。
在50μL反应混合物中扩增DNA(300ng),所述反应混合物包含20mMTris-HCl,pH 8.4,50mM KCl,1.5mM MgCl2,200μM每种dNTP,0.2μM每种引物和1.5单位的Taq DNA聚合酶(Gibco BRL,Carlsbad,CA,USA)的。扩增循环为:于96℃变性10分钟,后接于94℃变性1分钟,于58℃退火1分钟,于72℃延伸1分钟的35个循环,最后72℃延伸10分钟。
通过单链构象多态性(SSCP)分析PCR产物。使用自动CEQ 2000 XLDNA分析系统(Beckman Coulter,Palo Alto,CA,USA)对显示异常SSCP图谱的那些片段进行测序。随后通过限制性酶切分析和用先前所述的装置(“生物芯片”)确定所鉴定的突变的存在。
2399del5ins4突变分析
这种突变删除序列TCTTC并且将序列GGGT引入2399位置,产生了新的Ava I消化位点。按照生产商(Amersham Pharmacia Biotech Inc.,Piscataway,S NJ,USA)所述的方法,在30μL的总体积中用15单位的Ava I对15微升的PCR样品进行消化。获得的片段对于正常等位基因中具有230和12bp的长度而对于突变等位基因中具有183、46和12bp的长度。将这些片段在8%聚丙烯酰胺凝胶中进行电泳,并且通过用溴化乙锭染色显影。或者,能够通过将寡核苷酸:SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138和SEQ IDNO:139点样在载玻片上而用所述装置(“生物芯片”)来分析这种突变
在三个具有常染色体显性遗传的不相关的高胆固醇血症家族中检测到了2399del5ins4突变。这些家族之一的先证者是一个患有腱黄瘤的49岁的妇女,她的父亲在51岁时死于心肌梗塞。FH临床诊断的MedPed评分是16分。降脂治疗前,她的血浆脂质水平是:TC(510mg/dL),LDLc(424mg/dL).),HDLc(58mg/dL)和TG(140mg/dL)。结合20mg/天的辛伐他汀和20g/天的考来替泊进行的治疗将她的TC降到280mg/dL。而且,她的两个22岁和20岁的孩子,分别具有330和386mg/dL的胆固醇水平。
2544insC突变分析
在对临床诊断患有FH的受试者中的这种片段进行分析时,通过对LDL-r基因的外显子17的242bp的片段的自动测序来鉴定这种突变。使用试剂盒CEQ 2000 Dye Terminator Cycle Sequencing with Quick Start(BeckmanCoulter,Palo Alto,CA,USA)以及引物Ex17F(SEQ 1ID NO:34)和Ex17R(SEQ ID NO:35)在热循环仪PE Gene Amp System 9700上进行测序反应,在自动测序仪CEQ 2000 DNA Beckman分析系统上进行随后的电泳。通过对相同样品的第二PCR产物进行自动测序来证实这种缺失。
或者,可以通过将寡核苷酸SEQ ID NO:244,SEQ ID NO:245,SEQ IDNO:246和SEQ ID NO:247点样到载玻片上,以所述装置(“生物芯片”)来分析这种突变。
在一个37岁的男子中检测到2544insC突变,他已经遭遇心肌梗塞,并且患有腱黄瘤、角膜弓,具有高胆固醇血症的家族史(他的父亲过早地死于心肌梗塞)。他被临床诊断为患有MedPed评分为21分的FH。在药物治疗前的血浆脂质浓度为:TC(444mg/dL),LDL-c(379mg/dL),TG和HDLc水平正常。用阿托伐他汀(40mg/dL)进行的降脂治疗将他的LDL-c降到282mg/dL。
附图简述
图1 是表示LDL-r在人细胞中的路线的示意图。LDL-r作为表观分子量为120Kd的前体在内质网中被合成,并且被转运到高尔基体中。一旦被转运到细胞的表面,受体识别LDL的载脂蛋白B-100组分。通过受体介导的胞吞作用,结合过程导致了细胞的吸收以及溶酶体的降解。这种吸收过程满足了细胞对胆固醇的需求,并且因此使内源的胆固醇合成受到抑制。
图2是一个示意图,其表示人LDL受体蛋白结构的5个结构域以及它们与基因外显子的对应。
图3是用4个引物(两个正常和两个突变)对突变E256K在10个杯中重复次的图像进行定量的玻璃载玻片。(A)正常个体(B)具有家族性高胆固醇血症的个体。对于每种突变,点样两对寡核苷酸。每个探针对由特异于野生型等位基因的一个探针和特异于突变等位基因的第二个探针组成。
序列表
<110>拉塞有限公司
<120>检测与家族性高胆固醇血症有关的低密度脂蛋白受体基因突变的方法和装置
<130>PCT-154
<160>259
<150>ES200300206
<151>28.01.03
<150>ES200302671
<151>17.11.03
<210>SEQ ID NO.:1
<211>60.000
<212>多核苷酸
<213>人
<220>
<221>基因
<223>rLDL
<400>
aaaagatggt gtatccattc aatggaacat tatttggcct ttaaaaggaa ggaaattctc 60
actgagcata gtggtttatg cctgtaatcc cagcactttg ggaggctgag gcagggggga 120
gggggcggtt cacctgaggt caggagttca agaccagcct ggccaacatg gtgaaatccc 180
gtctctacta aaaatacaaa aaaattagcc gagtgtggtg gcacacacct gtaagccagg 240
ctacacggga gactgaggca ggagaatcgc tggaacccgg.gaggcagagg ctgcagagag 300
ccgagattgc gtcactgcac tccagcctgg gtgacagagc gagactcttg tcttaaaaaa 360
aaaaagaagg aaggaaggaa ggaaggaagg aagttctgac acaggctcca acacagatgt 420
tatgctcagt gaaataagcc agacatgaaa ggacaaatac tgcctgatct cattcataag 480
aggtccctag aattgtagaa tggtgtgtgc cacgggctgg gagggggtgt ggccagagtt 540
tcagtttggg aagttgagaa tgttctggag atggatggcg gtagtggtgg ttgcacaact 600
gtgtgaatgc gcttaatgcc tctgaattgt gcagttacaa gtggttcgga tgggccgggc 660
gcggtggctc atgcctgtaa tcccagcact ttgggaggcc gaggcaggtg gatcatgaga 720
tcaggagatc gagaccatcc tggctaacac ggtgaaaccc catctctact aaaaaataca 780
aaaaattagc caggcatggt ggtgggcacc tgtagtccca gctacttggg aggcggaggc 840
aggagaatgg cgtgaacacg ggaggcagaa cttgcagtga gccgagatca cgccactgca 900
ctccagcctg ggcgacagag tgagactccg tctaaaaaaa aaaaagtggt taagatgggc 960
cgggcatggg ggatcacgct tgcaatccca acactttggg aggctgaggt gggtgattac 1020
gaggtcagga gttcgagacc agcctgacca ccatggtgaa accccgtctc tactaaaagt 1080
acaaaattag ccgggtgtcg tggcacacgt ctgtaatccc agctactggg gaggctgagt 1140
tgggaggatc acctgagccc agggaggtcc aggctgcagc aagccatgat tgcaccactg 1200
cactccagcc tgggtgagag agtgagaccc tgtctccaaa caaacacaca tgaaaaacag 1260
attttttttg ccaggtgcag tggctcacac ctgtaatccc agcactttgg gaggccaagg 1320
cgggtggatc acgaggtcag gtgactgaga gcatcctggc taacacggtg aaaccctggc 1380
tctactaaaa atacaaaaat ttagccgagc atggtggtgg gcacctgtag tcccagctac 1440
tcgggaggct gaggcaggag aatggcatga acctgggagg cggagcttgc agtgagctga 1500
gatcacgcca ctgcactcta gcctggggga cacagcaaaa ctgtctcaaa aaaaaaaaaa 1560
aaggtttttt taatttaaaa aggaaagaaa aggagagtgc tcgtgtggca ggcacctagc 1620
cctgtccagc gcaccctgag acagggatga tgtctcctcc ttgacctaag accacaagtt 1680
ctaaccaatt caaccgagga cagagcccca attccaggca gggcaatggg gtcgccttgt 1740
gaactaagat gcagatggag aagagcagac acagacacag gtcttggggc ccctgcaggg 1800
gtttctcact ggctttttcc ccctggattc ctatgggttc tggggaacag agttaggtcg 1860
gctggcaaga cagatgcatg aggctgtggc gcccttgaca ttgagccgga gggccagagt 1920
tcgtcattgc tgacgcagag aagctgggag ccaaggttag ccagatggtt tggaggagtt 1980
ttaaacaatc ttttcttttc tttctctttc catctgtctg tccttctttc ctcccttcct 2040
gccccctttc ttttctcctt tctttccttc ctctctcctt cctccctttt tttctttttt 2100
tttggttttc tttttgtatt agtattatta ttttttagac agggtcttgc tctgttgccc 2160
aggctggagg gcagtggcac gatcacagct cagtacaccc tcaaccttct gggttcaagc 2220
aatcctcctg ccttggcctc ccaggtagct gggactacag gcgtgtgcca ccacacctgg 2280
ttaatttttt ttttttttga gacggagtct tgctctgtca cccaggctgc agtgcagtgg 2340
cgtgatctcg gctcactgca acctccacct cccgggttca agcgatcctc ctgcctcagc 2400
ctcccgagta gctgggatta cacgcgcccg ccaccaagcc cggctaattt ttttattttt 2460
agtagagaca gagtttcacc acgttggcca ggctcgtctc aaactcctga cttagtgatc 2520
tacccacctt ggcctctcaa agtgctggga ttagaggcgt gagccaccat gcgcagccaa 2580
tttttgtatt tttagtagag atggggtttc accatgttgg tcagtctggt ctcgaactcc 2640
tgacctcaag tgatccacct gcctcagcct cccaaagtgc tggaattaca ggcatgagcc 2700
accgcgccca gccctcttaa ccatttttaa gtgcacagtt cagcagcatt aagcacattc 2760
acattgttgt gcaaccatca gcccccgtcc atctccagct ttctcttttt ttttgtttgt 2820
tttgagacag ggtcttactc tctcgcccag tatagagtgc agtggtgcgg tcttggctcg 2880
ctgcaacctc tgccttccag gttcaagcta ttctcctgcc tcagtctccc cagtagctgg 2940
gattacagac acacatcacc acgccctgct aattattttg catttttagt agagatggtg 3000
tttcaccata ttggccaggc tgatcttgaa ctcctggcct caagtggtct gctccaaact 3060
gctgagatta cagccgtgag ccactgctcc cagccatctg cacctttctc atcttcccaa 3120
atgtaactat gtccccgtga aacactcact ccccattcca cctccccagc ccctggcacc 3180
ccccatttta ttctggtgct aggggaattt caaaccaggc aagtctcaac acatgctcga 3240
gtgtaagaac cagcccacag cctcgttccc taatcacggt caaaccagaa ttctactcca 3300
ggttctactc tgtgaatctg ctttctgtga atctgttact ctggggaccg cctataagtt 3360
gaatcctaca gtgtctccac ttcagtgact ggcttatttc acttttctcc tctttattta 3420
tgagacaaaa tttcgctctt gttgctcagg ctggaatgca atggcgtgat ctcggctaat 3480
ttttttgtat ttttagtaga ggcggggttt caccatgttg gccaggctgg tctcgaactc 3540
ctgacctcag acgatccact ttggccttcc aaagtgctgg gattacaggc gcggcccacc 3600
tttctcctct taatcacaca ggtaatccat acatacgaca ttcttttttt tttttgacac 3660
ggagtcttac tctgtcacct aggctggagt gcagtggcgc aatcttggct cactgcaacc 3720
tctgcctccc aggatcaagc aattctcctg cctcagcctc ctgagtagct gggattacag 3780
gtaaccatca ccacacctgg ctaaattttg tatttttagt agagacgggg tttcaccacg 3840
ttggccacgc tggtattgaa ctcctggctt caagtgatct tcctgtctcg gtctcccgaa 3900
gtgctgggat tacaggaatg agccactgtg cccggccaat acgacatctg tgcaatgaag 3960
tgcaacatat aagacaccct tcccccaccc actgccccca ccaccgcccc cacgccccca 4020
cccccatctc cagatcagaa cctggggctg tgcaatttta aacgttgtag ccacttgcta 4080
cttgggtagt tgaagttcag tctcagccag gttggagtcc tggactctgg cccctctttt 4140
atttttattt tttatttttt tttgagacag agtctcgctc tgtcgcccag actggagcgc 4200
agtggtgcga tctcggctca ctgcaagctc tgcctcctga gttcacgcca ttcccccgcc 4260
tcagcctccc gagcagctgg gactacaggc gcccgccacc acacccggct aatttcttgt 4320
attttttagt agagatgggg tttcaccctg ttagccagga tggtctagat ttcctgacct 4380
tatgatccgc ctgcctcggg cctcccaaag tgctgggatg acaggagtga gccaccgcgc 4440
ccggcctctt tttttttttt tagacagtct ctgtcaccca ggctagagtg cgatggtgcg 4500
atctcggctc actgcaacct ccaccttccg ggttcaagcg attctcctgc ctcagcctcc 4560
tgagtatctg ggattacagg tgcctgtgac cacgcccggc tgatttttgt atttttagta 4620
gagacggggt ttcaccacat tggtcaggct agcctcaaac tcctgacccc gtgatccttc 4680
cgcctcagcc tcccaaagtg ctgggattac aggactctgg cccatcttgg ctgctgccaa 4740
tgtccttcct tctatcttgg tttttccaca gttacgcaca tgccagataa cggcgagtct 4800
gttccccagc aactgcaacg gatctgccca ccactgggaa atggaagacc ttgcagccca 4860
ggtctttgta gaccaagatt agattgtggt caacaaacac ctgaccttgg cctttggaac 4920
catcagccat gtcagctaaa ataaaagcag aatctggctg ggcgcagtgg ctcacgcctg 4980
taatcccagc actttggggg gctgaggtgg gcagaccacc tgaggtccgg cgttctagac 5040
cagcctgacc aatatgatga aaccccgtct ctactaaaca tacaaaaatt agctgggcat 5100
ggtggcgggc acctgtaatc ccagctactc gggaggctga ggaaggagaa ttgcttgaac 5160
cctggaggca gaggttgcag tgagccgaga ttgcgccact gcactccaac ctggactgca 5220
gaacaagact ctgtcccaaa agcagataaa taaaaataaa taaaaataaa aatatggccg 5280
ggcatggtgg ctcacacctg taatcccaac actgggaaga tgaggcgggc agatcacgag 5340
gtcagggatt cgagaccagc ctggccaaca tggtgaaacc ccgtctctac taaaaataca 5400
aaaattagcc gggcatgatg ctgcatgcct gtaatcccag ctactctgga ggctgaggca 5460
ggagaatcgc ttcatcccgg gaggtggagc ttgcagtgag ctgagatcgc gccactgcac 5520
tctagcctgg gcaaaagagt gagactccat cgcaagaaaa aaaaaaaaaa aagctgcaag 5580
ctctgtctcc cgggttcaag tgattctcct gcctcagcct tccaagtagc taggattata 5640
cgcgcccgcc accatgcctg gctaattttt gtatttttag tagagatgcg gtttcaccat 5700
gttggccagg ctggtctcaa actcctgacc tcacgtgatc cacctgcctc ggcctcccag 5760
agtgctggga ttacaggtgt gaacccctgc gcctggccaa gaaaagttgc ttgaatgaag 5820
agtaaataga agacccagaa agaaatgatt cgtccgagga aggtcacaga agcaacgtaa 5880
tcaagatgga aatctgactc ttcctaattt tggccagact tcccatccct ccaaagcttt 5940
ccagactctt ccagatcatt ctagatattt ccagaaatca ttcgtgaaat ctaactagga 6000
gtagtctgta aacaatgtgt ttcacacaga tacaattcat aaacgatgag aagacaagga 6060
cacttcatga atgaaatttt tacggccggg tatgttggct cacgcctata atcccaggac 6120
tttggaagac ccaggcagga ggattgcttg agtccaggag ttcaagacca gtctgggcca 6180
catagtgaga ccctgtcgct acaaaaaatt taaaaattag gtagatatgg tggtgtatgc 6240
ctctagtttt agcttttttg gaggctgaag caggaggatc tcttgagccc aggaggttga 6300
gctgcaatga gctacgattg aactactaca ctccagtctg ggtgacagag aaagaggctg 6360
cctcaaaaaa ataaaaataa aaaaataagg ccggacgcgg tggctcacgc ctgtaatccc 6420
agcactttgg gaggctgggg tgggcagacc acgaggtcag gagatcgagg ccatcctggc 6480
caacatgatg aaaccctgtc tctactgaaa acacaaaaat tagctgggcg tggtggcgta 6540
tacctgtaat cccagctact cgggaggctg aggcaggaga atcacttgaa ccagggagtc 6600
agaggttgca gcgagaggag attgtgccac tgcattccag cctggcaaca gagcaagact 6660
ccgtctcaaa aaagaaacaa caacagcaac aacaacaaaa aaaacataaa aaagttcggg 6720
cacggtggct cacacctgta atcccagcac tttgggaggc caaggtgggt agatctcttg 6780
aggtcaggag ttcaagacca gcctggccaa caaacatggt gaaaccccgt ctctactaaa 6840
aatacaaaaa gtagccgggt gtagtcccag ctactcggaa ggctgaggca ggagaatcgc 6900
ttcaacctgg gagatggaag ttgcagtgaa ctgagattgc gccactgggt gacagagtaa 6960
gactcttgtc tcaaaaaaaa aaaaagaaag aaagtttaat ttaatgattc aaataatgac 7020
ctgctcgaga gataaatata aagtctaacg taagaggtgt atactttttc ctctgtcctg 7080
ctgtcctcgc cccacctcac cccaagtccc aacctgattg atcagtctcc tttccctctg 7140
gtagccccac tcccatgacc gaaccgagaa gtcatgcacc cgcataagaa ctctaatttt 7200
ttttttcaaa gtcttctcac tgccccaaaa atagtttctt tcattcccag gggatgtgaa 7260
agtgtctctc ccaattttat ttcaacctcc cagcgttcca cacatatgcc ttgcctcagc 7320
cagctttcac tgatctgcca tttccacctc ggcgctgctc ctacctgcgg aaatcctgtc 7380
catccatagt ctgatttctg ttgttccaga acattctttt ttttttcccc tggaacattc 7440
tttaagatac ctcaataaat gaaaccagag ggtatagagc agtatgaatg ggtactacaa 7500
tgtacagggg gaaatggagg ggaatatgat atactctcct ccttgtatat gcttagaatg 7560
ttctagaagg atatgcttaa aaggttagca gtcctggcca ggcgtggtgg ctcacgcctg 7620
taatctcagc actttgggat gccaacgcgg acggatcaca aggtcaggag ttctagatca 7680
gcctgaccaa tatagtgaaa cctcatcttt actaaaaata caaaaattag ccgggtacgg 7740
tggcatgtgc ctgtagtccc agctactttg gaacctgagg caggagaatc gcttgaactc 7800
gggaggcaga ggttgcagtg agccgagact gtgccattgc actgcagcct gggtgacaga 7860
acaggactcc gtctcaaaaa aaaacaaaaa aggtcagcag tcttaattgt cagagggcag 7920
gggacctgca tgggatggag gtttttccat gtgtccacct tttgagccct tttgcttttt 7980
ttttttaaat ctttttattg tagcaaaata gatataaaat ttaccctttt tttttttgag 8040
acagggtctc actctgttgc ccaggttgga gtgcagtggc atgatcttgg ctcactgcag 8100
cctctgcctc ctgggttcaa gcgattttcc tgcctcagcc tcccgagtag ctgggattac 8160
aggtgcttgc caccataccc ggctaatttt gtatttttag tagagacggg gttacgccaa 8820
gttggccaag ctggtcgcaa actcctgacc tcaagtgatc cgcccccctc ggcctcccaa 8280
agtgctggga ttacaggcag gagccaccac gctcagccct aaaatttacc atattaacca 8340
ttttcaagtt cagaggcatt aaagtatact cacattgttg ttcaactgtc accactactc 8400
acctgcagaa gtttttcatc ttgcaaagtg aaaaccccat acccaatttc ccgttcttcc 8460
tctcagcccc tggtaatcac tattctactt tttgtctact ttttgtatga atttgcctat 8520
tctaggacct aatagaagtg gagtcaaacc tgtttgtcct tttgtggctg gcttatttca 8580
cccggcctta tatcctcaag gtttatccat gttggaggat gcctgaattt ccttgttttt 8640
aaggctaaat tttattctat tatattaata tgtcatattt tgtttatcct gatggacact 8700
tgggttgatt ccacctttgg ccattttgaa gaagcttcta tgtacatggt atacacatat.8760
atctttgggt.ctctgctttc aatgcttttg.gggatatttc.agatgtggaa.tttctggatt.8820
ataaggcaat.tttttttttt.gagacagact.ctcgctcttg.tcgcccaggc tagaatgtgg 8880
tggtgtgatc tatttttttt ttttttttga gatggagtct cgctctgtcg cccaggctgg 8940
agtgcagtgt cacgatctca gctcactgca agctccgcct cccaggttcg tgccattctt 9000
atgcctcagc ctcccaagta gctgggacca cagccgccca ccacctcacc cggctaattt 9060
ttgtattttt agtagagaca gggtttcact atgttggcca ggatggtctc gatctcctga 9120
cctcgtgatc cgcctgcctc ggcctcccaa agtgctggga ttacaggcgt gagccactgc 9180
acccggctgg tgtgatcttg gctcgctgca acctctgcct cccaggttca agcgattctt 9240
gtgcctcagc ctctccgcag ctgggactac aggtgtgcgc cactgtgccc agctactttt 9300
taaaaatata tgtgtattta ttatactttt aagttctggg atacatgtac agaacgtgca 9360
ggtttgttac ataggtatac atgtgccatg gtggtttgct gcacccatca accggtcatc 9420
tacattaggt atttctccta atgctatccc ttccctagcc ctccactctc ccggtttttt 9480
gttttgtttt gttttgttgt tttgttttta gtagagacag ggtctcacca tgttgcccag 9540
gctagtcttg aactcctgac ctcaagtgat ccgcccacct cagcctccca aagtgctggg 9600
attacaggtg tgacccacta cactcggcct tattttcact tatttatgca attttcacta 9660
ttgctatatt ctaggaggca ctgtggaatt gcactgtgga attttagtat tgctgtattt 9720
cagcaagcca tgaggtctgt cagcacacgg ctttgggcat tttgtgaaga taactgatgc 9780
cagctgagcc aaggcaggtt cctgattcca cccactggca ggcaccgagg tctctgctgt 9840
tactgatggt ttctctgtgg attgatgggc ttaaggccag accacagctg caatggctca 9900
cctctgccaa aggccaggct cgttggggca gagacctatt ccggactgag cctcctggtg 9960
aattagagag gtagaaaatg ggaggacggg ggcaggtggg ctattacagc gaggaaaatg 10020
cccaccctga gttgtattag ataactttgg gagttcagga actttccaat aaagtgggtt 10080
ccacagcagg attacttact gactccctaa tagaaagaag gcaggcacag gccgggcgtg 10140
ttggctcatg tctgtaatcc cagcacgttg ggaggctgag gcgggtggat cacaaggtca 10200
ggagatccag accatcctgg ctaacaaagt gaaaccccgt ctctactaaa aatacaaaaa 10260
attaggctgg gcgtggtggc tcgtgcctgt aatcccagca ctttgggagg ctgaggcggg 10320
cggatcacga ggtcaggaga tcgagaccgt cctggctaac acggtaaaac cccatctcta 10380
ctaaacatac aaaaaaaaat tagccaggtg tggtggcggg cgcctgtagt cccagctact 10440
caggaggctg aggcaggaga gtggtgtgaa ctcgggaggc gcagcttgca gtgagccgag 10500
actgcgccac tgcactccag cctgggcaac agacagagac tccgtctcaa aaaaaaaaaa 10560
aaaaaataca aaaaattagc caggcgtggt ggcacgtgca cgtgactgta gtcccagcta 10620
cttgggaggc tgaggcagga gaattgtttg aacccgggag acggaggttg cagtgagccg 10680
agatcgcgcc actgcactcc agcctgggtg acagagctag actccgtcaa aaaacaaaaa 10740
acaaaaaaca aaaaaacaaa aaaaaaaaaa cagcaggaac tggcaggtct tccctgaaga 10800
gataaaaaaa aaaaaatgca gttgcaacac aaaagcagcc acagagaaaa gcaaacccat 10860
atatggtatt tattatgcac cgagtgtggc tctaatcact tttttttttt taattgagag 10920
acagcctggc tctgttgatt gggctggagt gcagtggcgc gaccgtagct cattgcagcc 10980
tcaacctcct tggctcaagc aatcctccta cctcagcctc ctgagtagct gggaccacag 11040
gtgtgagcca ccacgcctgg ctaattgttt tttttttttt tgtagagaca gggtctcact 11100
atgtggccca ggctggtttc caactcctgg gctcaagtga tcctcccacc tctgcctccc 11160
aaagtgctgg ggattacagg catgagccac ctcgcctggc ctctagtcgc tttatatatt 11220
ttaacttaat ccttacaaga gccctgtgag ctagttacag gagcacaaat ggaaaccaag 11280
aaacagaaaa atttatcagc atgactcagt cctcagagcc atgtatggcc gtgtccgtgc 11340
atggcaggca ggtcaggggc ctggggaacg ctgttctgga aaccttggcc aggccttggc 11400
acccgaggaa tgtgcttttc agagtttttg tggctctttt ccagacctgc cctgacctct 11460
agctctggga actatgtaag ccaagtgcct tccgggaagg gagtccctct cctggtaact 11520
ctttctgggt aaccagatgt ggactcatga cacacactga gcctacgtct tataattttt 11580
tgtttttgtt tttgagacag tttcggtctt cttgcccagg ctggagtgca atggtgcgat 11640
ctcggctcac tgcaacctct gcctcccagg ttcaagcgat tctcctgcct cagcctccct 11700
agtagctgga attgcaggca tgcgccacca cgcctggcta attttttgta tttttttttt 11760
tttagtagaa acggggtttc accttgttag ccaggctggt caccaactcc tgacctcagg 11820
tgatccgccc acctctgcct cccaaagtgc tgggattaca ggtgtgagac agctgtgagc 11880
caccacgccc ggcgcatttt ttttttcttt tttttcagag ggagtgtccc tctgtcaccc 11940
aggctgaagt gtagtggcgt gatctcggcc cactgtaacc tctatctccc aggttcaagt 12000
gattctcctg actcagcctc ccaagtagct gggactacag gcgcctgcta ccatgcctgg 12060
ctaatttttg tagttttagt agaaaccggg ttttgccatg ttggccaggc tggtctcaaa 12120
ctcttgactt caggtgatcc acctgccttg gccttctgaa gtgctgggat tatagggcat 12180
gagccactgt gactggccat cttaaatttt tttttttttt tttttttttt ttgagacagg 12240
gtttcactct gtcgcccagg ctggagtgca aaggcgcgat cttggttcac tgcaagctcc 12300
gcctcctggg ttcatgccat tctcctgcct ctgcctcatg agtaactgag actacaggcg 12360
cccaccacca cgcccggcta atttttttgt atttttttag tagagatggg gtttcacctt 12420
gttagccagg atggtctcga tctcctgacc tcgtgatcca cccgtctcgg cctcccaaaa 12480
tgctggcatt acaggcgtga gccaccgcac ccagccttaa attttttttt aagggaaatc 12540
aaacccagtg atattgggcc agtacagtgg ctcacacctg taattccacc actttgggag 12600
gctgaggcag gtgaatcacc tgaggtcagg agttcgagac cagcccggca aacatggcga 12660
aaccccgtct ctactaaaaa taagaaaatt agccgggcgt agtggcatgc acctgtaatc 12720
tcagctactc gggaagctga ggcatgagaa tcgcttgaac ctgggagcag gacgttgcag 12780
tgaaccgata tcacaccact gcactccagc ctgggtgaca gagcaagact ctgtctcaaa 12840
aaaaaaaaga aaaaaaaatc cagtgatact tactttttaa atttttattt acttattttt 12900
tgctttaagt tgaatcttta aacttatctt tatttttgag acacagtctc actctgtcgc 12960
ccaggctgga gtgcagtggt acaaccacag ctcagtgcag cgttgacctc ctgggctcaa 13020
gccatcctcc cgcctcagcc tcccgagtag ctgggactac aggcgcacac aaccatgtcc 13080
agcttatttt tgtatttttt gtagagacag ggtcccactg tgttgccctg gcttgttctg 13140
aactcctagg ctcaagtgat ccccccgcct caccctccca aagtgctggg attacaggca 13200
tgagccacca catccagact tcactttttt gtttaatgtc gcaaatggca taaggaatgg 13260
gattcaatgg ggacacattt ataaacgttg cagcagctcc tagaacttgc ctatccttgt 13320
aaacttctct aggtgattgc taattacttc tttttttttt tttttttttg agacggagtc 13380
tcactctgtc gcccaggctg gagtacagtg gcgcaatctc gtctcactgc aaactccacc 13440
tcccgggttc acgccattct cctgcctcag cctcccgagt agctgggact acaggcaccc 13500
gccaccacgc ccggctaatt ttttgtattt ttttttagta gaggtggggt ttcactgtgt 13560
tatccaggat ggtcttgatc tcctgacctc gtgatccacc tgcctcagcc tcccaaagtg 13620
ctgggattac aggcgtgagc caccatgccc agcccgctaa ttatttcaat ttgaccttga 13680
cactgagcct gccaagtagg ttcaagcatt ttgatggccc ctttacaggt tgggaaagct 13740
aatttatctg tccaaggccg aattctgaaa ctgagtctta actgccaaaa attcttatca 13800
tcaatttctt cttctgggtt gggcacagtg gctcatgcct gtaaagccag caatttgaga 13860
ggcatcatga tgcaagagga agaggattga gtgaagctag gagtttggga ccagcctggg 13920
caacatagtg agaccccatc tataaaaaaa aattaaaaat tagttgggca tggtggtgca 13980
ctcctgtggt cctagctatt caggaggctg aggtgggagg attccttgag cccagggttg 14040
acgctgcaga gagctgtgat cacgccactg cagtccagcc tgagtgacag ctggaaataa 14100
tgataaataa ataataaata attatttaaa aaattataat aaaaataatt aaaaaattat 14160
tttccctgat taatcttttt ttttgtcctt ctgagagttc aatttgtccc ttttctgcct 14220
ggtctcctag gtttccctaa aatcctgctg agaggttagc actgcctgcc aaagtcagtt 14280
tgcaaaatcc cagagaaatc cagcttattc ctgggggaac cgccaagact gcccagccct 14340
gtgtggggtt caggcaagtt tctcacatgt gcctttttgg caagaggcct ctggcaaccc 14400
catgagtccc caaagagact caattctaaa agttggtctc caccagctct ctgtggctta 14460
ggggttcaag ttcaactgtg aaagccctgt tttgttttga ttttgctttg agggagagga 14520
aaccgccctt ctgtttgttc aactccttct cctaagggga gaaatcaata tttacgtcca 14580
gactccaggt atccgtacaa ttgatttttc agatgtttat actcagccaa aggcgggatc 14640
ccacaaaaca aaaaatattt ttttggctgt acttttgtga agattttatt taaattcctg 14700
attgatcagt gtctattagg tgatttggaa taacaatgta aaaacaatat acaacgaaag 14760
gaagctaaaa atctatacac aattcctaga aaggaaaagg caaatataga aagtggcgga 14820
agttcccaac atttttagtg ttttcctttt gaggcagaga ggacaatggc attaggctat 14880
tggaggatct tgaaaggctg ttgttatcct tctgtggaca acaacagcaa aatgttaaca 14940
gttaaacatc gagaaatttc aggaggatct ttcagaagat gcgtttccaa ttttgagggg 15000
gcgtcagctc ttcaccggag acccaaatac aacaaatcaa gtcgcctgcc ctggcgacac 15060
tttcgaagga ctggagtggg aatcagagct tcacgggtta aaaagccgat gtcacatcgg 15120
ccgttcgaaa ctcctcctct tgcagtgagg tgaagacatt tgaaaatcac cccactgcaa 15180
actcctcccc ctgctagaaa cctcacattg aaatgctgta aatgacgtgg gccccgagtg 15240
caatcgcggg aagccagggt ttccagctag gacacagcag gtcgtgatcc gggtcgggac 15300
actgcctggc agaggctgcg agc atg ggg ccc tgg ggc tgg aaa ttg cgc 15350
met gly pro trp gly trp lys leu arg
-21-20 -15
tgg acc gtc gcc ttg ctc ctc gcc gcg gcg ggg act gca g gtaaggcttg 15400
trp thr val ala leu leu leu ala ala ala gly thr ala v
-10 -5 -1 1
ctccaggcgc cagaataggt tgagagggag cccccggggg gcccttggga atttattttt 15460
ttgggtacaa ataatcactc catccctggg agacttgtgg ggtaatggca cggggtcctt 15520
cccaaacggc tggagggggc gctggagggg ggcgctgagg ggagcgcgag ggtcgggagg 15580
agtctgaggg atttaaggga aacggggcac cgctgtcccc caagtctcca cagggtgagg 15640
gaccgcatct tctttgagac ggagtctagc tctgtcgccc aggatggagt gcagtggcac 15700
gatctcagct cactgcaacc tccgcctccc gggtttaagc gagtctcctc tctcagcctc 15760
ccgaatagct gggattacag gcgcccaacc accacgcccg cctaattttt gtatttttag 15820
tagagacggg ttttcaccat tttggccagg ctggtctcga accccgacct caggtgatct 15880
gcccaaaagt gctgggatta caggcgtcag ccaccgcgcc cggccgggac cctctcttct 15940
aactcggagc tgggtgtggg gacctccagt cctaaaacaa gggatcactc ccacccccgc 16000
cttaagtcct tctgggggcg agggcgactg gagacccgga tgtccagcct ggaggtcacc 16060
gcgggctcag gggtcccgat ccgctttgcg cgaccccagg gcgccactgc catcctgagt 16120
tgggtgcagt cccgggattc cgccgcgtgc tccgggacgg gggccacccc ctcccgcccc 16180
tgcccccgcc cctttggccc gccccccgaa ttccattggg tgtagtccaa caggccaccc 16240
tcgagccact ccccttgtcc aatgtgaggc ggtggaggcg gaggcgggcg tcgggaggac 16300
ggggcttgtg tacgagcggg gcggggctgg cgcggaagtc tgagcctcac cttgtccggg 16360
gcgaggcgga tgcaggggag gcctggcgtt cctccgcggt tcctgtcaca aaggcgacga 16420
caagtcccgg gtccccggag ccgcctccgc gacatacacg agtcgccctc cgttatcctg 16480
ggccctcctg gcgaagtccc cggtttccgc tgtgctctgt ggcgacacct ccgtccccac 16540
cttgtcctgg ggggcgccct cgccccacca gccccgatca agttcacaga ggggcccccg 16600
gccaccctca aggcctcggt tccttacgag gttgaaacgt tgcctcagaa tctccccgcc 16660
cctccttggt ctgcagccga gatcttcagc cacggtgggg cagctatccc ccgggaccga 16720
ccccctgggg tggcctcgct tcttcagagg ctgtgaatgg cttcggttca gctgtccaag 16780
cggcgatttt tcctctgggt gaaatggatt agattttaga tttccacaag aggctggtta 16840
gtgcatgatc ctgagttaga gctttttagg tggctttaaa ttagttgcag agagacagcc 16900
tcgccctaga caacagctac atggcccttt ccctcctgag aaccagccta gcctagaaaa 16960
ggattgggat tgcctgatga acacaaggat tgcaggaaac ttttttttta attggcaagg 17020
gggttggctt tgactggatg gagagctttg aactgccttg aaattcacgc tgtaactaac 17080
acaccagttt cctctgggag gccagagagg gagggagggt gtaatgaaat acggatgatt 17140
gttcttttat ttttatttac ttatttattt tttaactttt tgtagagatg aggtctcgct 17200
tggttgctca ggctggtctt gaactcctgg cctcaagcga tcctcctacc tcagcctccc 17260
aaagtgttgg gattacagga gtgagccacc gcgccccacc ggggatgatg atgattgcaa 17320
acattctgcc actcagtttt acaaaagaaa gagaggcact ggattaatgt gtatctcact 17380
caccaatcaa cctcttcctt aagagaaaat gttaaggaag tcttaggcaa ggccttgttt 17440
gttcatcact ttagtttctc tctcccggga tggctgagaa tgtgatgttt cctctgttgt 17500
caaggagact acacccctga tgttttcctc cagacttctg agagctggtg tgtgtttcta 17560
gcactttcta gctgcaccac ctcacgctgt agctggcttc aaggcatatc caggggggag 17620
tttcttgtcc atttccttta caaagggaag ttgttggaat ctgaaccgca agccttcact 17680
tagaccaaaa tcaggcaaca gcggtgagcg cagctccaaa cgtgtcaatg actcacccaa 17740
atttgagtaa gggagttggc tgctttaacg agccgcaggg tgattccctt gtcatttccg 17800
gaaataccta tcttccaggg aacactggga aaaaacaggg agacctttgt tgagacagaa 17860
aacctgtagg ggaattctgt tcctcattcc tgctcttatc tgtagacttc ctccctgata 17920
agatccaatt ctagatgggt cggttgctcc ttgctttgat gggtgctttg atgggcttta 17980
ttattattat tattattatt attattattt tgatgggctt tttgatgtcc cttttccttc 18040
cacactctgt cccaactgtc aagcaaatag ccttttgttg ctaagagact gcagatgtaa 18100
ccgaccagca gcaaacagtg agtcaggctc tctcttccgg aagcaaaatc aattgctgag 18160
atcactctgg ggaaaatacc caccttattt ggaaagaagc actgatcaat tgatgtctat 18220
tttttttttt tttgagttgg agtctcgccc tgtcacccag gctggagtgc aatggcataa 18280
tctcgcctca ctgcaatccc cgcctcccgg gttccagcaa ttctcctgcc tcagcctcct 18340
gagtagctgg aattataggc gcctgccaca acacccggct aatttttgta tttgtagtag 18400
agatggggtt tcaccacgtt ggccaggctg gtctcgaact cctgacctcg tgatccaccc 18460
gcctcagcct cccaaagtcc aaggattgca ggcgtgaccc actgtgccag ccaatcaatt 18520
gatttctcat tcattttcag ctggctctgt tcccttaagc caggggattt tcgtttgttt 18580
gtttcccctt caaggaaatg attctagcta cagttttgat ttccttgtac aactgttttc 18640
agtagcacag ggaaagaaaa catcgaaagc attcaccacc tcatttgtgt gctgggggaa 18700
aaagcagaaa tgtgtattct ctttttttgt ttcgatgacc ttgttcctga cttgttactc 18760
gtgacttgag agatcagagg gctagaggac tagaatttat agaggtgttt tttttgtttg 18820
tttatttttg ttcgagttgc ccaggctgga gtgcagtggc gcaatctcgg ctcactgcaa 18880
cctctgcctc ccaggttcaa gcgattcttc ggcctcagcc tcctgagtag ctggaactac 18940
aggcgcccgc caccacaccc agctaatttt tgtatttttc agtagagatg ggatttcacc 19000
atattggtca agctggcctc gaactcctga cctcgtgatc cacccgcctc agtttcccaa 19060
agtgctggga gtacaggcgt gagccgccgt gcccggcctt tttgtgtttt tgtgtttttg 19120
agaggagctc attgcttttt aggcttccct agcgtgagaa aatctgggga tccatgctct 19180
agtttacttc cttttttttt ttttttttga gatggagtct cgcttagatt gcctaatctc 19240
agctcattgc aacttctgcc tccggggttc aagggattct cgtgtctcag cctcctgggt 19300
agata cgggcacccg ctaccatgcc tggctaattt tgtactttta gtagagacag 19360
ggtttcgcca cgttggccag gctggtctcg aactcctgac ctcaggtgag ccgcctgcct 19420
tggcctccca aagtgctgag attacaggcg tgagccaccg cgcttggcct aatttgcttt 19480
tcctgaaatt caaatggtct aatatgaaaa acgccaacct tgcttgaaag aataagaaag 19540
aggtgcggtt tcgttgggcc gttgatgttt ggaacaggac tggttttgtc cccttgctcg 19600
gaaagggcag caactgtgag gacagctccc tgacgtgctc tcactcagca ctgttccgtt 19660
cctgagcact gtccccacta gctaggccaa gggagctcat ttggcaggca actgctgtct 19720
ggctgcgcct gtggcagtaa aatctgcctt tattttttgg aggcagggtc ttgccctgtc 19780
gctcaggctg aagtgtgcag ttatagctca ctgcagcctc cagcttctgt actcaactga 18940
tcctcctctc tcagcctcct gagtagctgg gactatacgc acgtgttacc actcccacct 19900
cagtttgttt gtttatttat ttatttattt atttattgag atggagtttt gctcttgctg 19960
cccaggctgg agtgcaatgg cgcgatctcg gctcaccgca acctccacct cctggttcaa 20020
gcgattctcc tgcctcagcc tcctgagtag ctgggattac aggcatgcac caccacgccc 20080
ggctaatttt gtatttttcg tagagatggg gtttctccac attggttcag gctgttctcg 20140
aactcccaac ctcaggtgat ccacccgcct cagcctccca aagtgctggg attataggcg 20190
tgagcccccg aacccggcca ctcccagcta agtttaaatt ttttgtttgt ttgttcgttt 20260
gtttttattt tttgagacag agtctcccgc ccaggctgga gcgcagatca ctgcatcctt 20320
gacctcccag gcttaagcca tcctccccac tcagcctccc aagtagctgg gattacaggt 20380
gtgtgccact atgcttggct aagttgtgta ttttttgtag agatggggtt caagggattc 20440
tcgctttgtt gcctcggttg gtctcaaact cctgggctca agcagtcctc cctcctcagc 20500
ctcccaaggt gctggggaaa tccacttttg aaacattgtc tggagagttg cccaggtggt 20560
agatcacaga aataggtcat cgtggggtcc ttcccatggg tgcagtcttg agccacctgt 20620
ggccagcaaa tatttggaga ataatagtca ggggagagct tgaggtccag ggaaaggttt 20680
tgtttttctt cagggaaagg tttttattgt tctttatccc tccttaaagg accttcaggt 20740
gttactgaca ttcccggtct acccagtggc acatttagtt tgtaagctgg gccctcgtac 20800
agaggtaggg aggtgagagc attggattag tggtcaccaa agctgcggtc acctagtggg 20860
gtgatcagag gctcctccct taagatcttg attgccaacg cctctggccc aactttcctt 20920
tttatttatc gcaagcctcc tggaatctca attgcttttt gcccacccgg tgtgtcagca 20980
caagaaatga gtcatttcct cctttaagca cagttgaaat tgagctgtga gtcagtgagg 21040
tgtgtacgat attgtcaaag cggggtgtgt acagtattga cagatctgta gttgggcaag 21100
agaattatca gagtttgtga ccacagcaga ttccaaagct cgactcattt tcttctctct 21160
tccttccctt ttttcttttc tttttttttt tttttttgac agagtctcgc tctgttgccc 21220
aggctggagt gcagtggcac aatctgggct cactgcagcc cctgcctcct gggttcaaat 21280
gattctcatg tttcagcctc ccgagtagct gcaattacag gcattcgggt tcaagtgatt 21340
ctcctgcctc agccacctga gcagctggga ttacaggcgc ccgccaccac gcccggctaa 21400
tttttgtatt tttagtagag acggggtttc accatgttgg ccaggctggt ctcgaactcc 21460
tgaactcagg tgatccgccc acttcggcct cccaaagtgc tgagattaca gacgtgagtc 21520
accgcgccca gcctgttctg ttctttaatt ctcaaaacac cctctaggaa gtagagactg 21580
ccattctccc ccattttaca gatcaggaaa ctgagtccca gaaggattta gtcagttacc 21640
caagttgttc tagttaaatg gcctggaaag ccagtgaagc ccaggattgt ctatctaacc 21700
cccttactac tctaactttc agggaatcca catgaatgtg ctgggtcaac catcaaagtt 21760
gaaatggata aagggggctg gatgcggtgg ctgatgcctg taatcctagc actttgggag 21820
gccgagatgg gtgggtggat tgcttgagcc caagagtttg agaccagcct gggcaacata 21880
gtgagacacc tgtctctgca aaaaataaat aaaaagttag ctgagtgtga tggtgcaccc 21940
ctctagtcac agctgttgag ttaggcttag gcaggaggat cgcatgaacc tgggaggtgg 22000
aggcggccgt gagcctcagt catgccactg cactccaacc tgggcaacag agtgaaagcc 22060
ggtgtccgaa agagaaagaa aaaaagacat agatacatct tttaaagtta ggttgtatgt 22120
taattaccta caactcagtt tcaactgtgc ttaaaggagg aaatgactca tttcttgcta 22180
catatcaaat tagcccaaaa tgtagtggct taaaacaaca catttatgat ttctcagttt 22240
ttgcgtgtca ggaatttgga agcagcacag ctagacggtt ccagctcagg gtctctcatg 22300
aagttgcaat caaaatattg gcaggagaga aaaacatatt ttcagaagct gcaggcatag 22360
gaagacttgg ctggggttga aggatccact tccaagatgg cgcactcagt ggctcttggc 22420
tggaggcctc agttccctgc tgcgtggagc tctccctcca gctgcttgag tggactcatg 22480
acatgcagct ggcctcccct ggagcagtcg atccaacaat gagcatggcc atgaactagg 22540
ctcagaagcc actccctgtc gtctctacat tttcctatca gaagcaagtc attaaaagtc 22600
cagtgccact ccaggggaga cgaattaggc tctgccttct gaaaggatta tcacagaaga 22660
tgcggtccta tattcttttt ttaaaattat tctttttttt attttgtaga gatggggtct 22700
tggtatgttg cctaggccag tctggaattc ctgggctcaa acaatcctgt ctctgcctcc 22780
caaagtgttg ggattacagg catgagccac tgcacctggt catgtggtca tattttcttt 22840
ttcttttttt tttttttttg agacagagtc tctgtcgccc aggctggagt atggtggcgt 22900
gatctcagtt cactgcagcc tccgcctccc gggttcaagc gattctcctg cctcagcctc 22960
ctgagtagct gggattacag gcgcccgcca acatgcccag ctaatttttt tagtagagat 23020
ggggtttcac catgttagcc aggatggtct cgatctcctg atttggtgat ccgcccacct 23080
tggcctccca aagtttcaac catcgatcag aacttattga tgtacttatg tagctaggca 23140
cggtggcgcg tgcctgtaat cccagctact tggaagggtt aaggcaggag aatcgcttga 23200
acctgggagg cagaggttac agtgagtcaa gatcatacca ttgcactcca gtctgggcaa 23260
cagaatgaga ctctgtctca aaaacaaaaa acaaaccctt gtatgtgatt ttcctggata 23320
gcatctgtta catcttcaca aagataaaaa gtcagacttg gctgggcatg gtggctcaca 23380
cctgtaatcc cagcactgag aggctgaggc aggcagatca cttgaggtca ggaatttgag 23440
accaggctgg gcagcatggt gaaaccccgt ctctacaaaa aatacaaaaa ttagccgggt 23500
gtggtgtcac gcacctgtat tcccaagcta ctcaggaagc taaggcagga gaatcacttg 23560
aacccagagg tggaggtttg cagtgagttg agattgtgcc attgcactcc agcctgggcg 23620
acagagtgag actctgtgtc aaaaataaaa taaaataaaa ttttaaaaaa ggcagatttt 23680
tttttcttct tggtattgtt accttattat agtaataata agtgcatagt gcatgctgag 23740
ataagcaatc ataatttgtt attgcggccg ggcatggtgg ctccagccta taatcccagc 23800
actttggtca ggagttcaag gccagcctgg ccaatatagt gaaactccat ctctactaaa 23860
atacaagaaa ttacctgggc atggtggcag ttgctggtga tccccagcta cttgggaggc 23920
tgaggcagga gaatcgcttg aacctgggaa gcagaggttg cagtgagcca agattgcacc 23980
actgcactcc agcctgggtg acagagtgag actctgtctg aaaataataa taataataat 24040
ttgttattgc ttttattgcc ttagtttaca tagggaatca aagtttatac tttgatttat 24100
aaaagttgct ttgattctag ttcacagaac cagaatcttt catataaagg tattagaggg 24160
cccagtgtgg tggctcatgc ctgtaatccc agcatattgg gaggctgagg agggaggatc 24220
actttaggag tttgaggcca gcctaggcaa catagtgaga ccttgtctct acaaaaaatt 24280
ccaacattag ctgggcatgg tggcatgtgc ctgtagtccc atttatttgg ggggctgagg 24340
caggaggatc acttgagccc acgaggttca atccaggttg cagtaagcca tgatcctgcc 24400
actgcactcc agtttgggta acagagcgaa gctatgtctc aaaaaaagaa aaaaaaagta 24460
ttctaaatcc aaatttaata tataaaacta aatgcaggcc aagtgtggtg gcatatacct 24520
ataatcacaa cactttggga ggctgaggtg ggaggattgc ttgagcccaa gagttcaaga 24580
ccagcctagg taacacagta agaccccatc tctacaaaaa gtagaaaaat tagcctggca 24640
tggtggtgag tgcttttaat cccaactact tagggggctg agatgggaag attgcttgag 24700
cctcagagtt tgaggctgca gtgggccgtg atcgctccac tgatcgctct aaagtgagac 24760
cctgtctcaa aaaaaaagaa aatagaagaa aactaaatac attcaataag actttgatct 24820
cttttccaag gtgtaaatat attttgggaa attttccagt tactttgttc tcattttaat 24880
gtaataatct aagtcttggt tttctaagga aaagttttct cttattatat cttttgttaa 24940
tgtttctctc ccatttcttt tgatctgatc ttcagataca tgattatctt cactgctaaa 25000
tttgtgttct ctggcctcta catttataat ttctcataat tctttatcta agtatttctt 25060
ccctacctac tgaagaaaac tcaagttttc ttccacctta atgattatgc tgtgtctgtg 25120
agttttcttc atgactcttt acagtacaag ttttttgttt ttgttttttt aatggtcaga 25180
tggatagaac aacacaggtt ttgtttgttt tgttttaact tttaaaaaaa ttataataga 25240
taaagggtct cactacgttg tccaggctga tctcatactc ctgggctcaa gcaatccacc 25300
cacctctgcc tcccaaagtg ctgggattac agtcatgagc caacatgcct gggcagtaca 25360
ggtttttttt gagacggagt tttgttcttg ttgccgaggc tggagtgcaa tggcacaatc 25420
ttggctcacc acaaagtctg cctcccaggt tcaagtgatt ctcctgcctc agcctcctga 25480
gtagctggga ttacaggcat gtgccaccac gcccagctaa ttttgtattt ttagtagaga 25540
cggggtttca ccatgttggc caggctggtt tcgaactgct gacctcaggt gatctgccca 25600
cctcggcctc ccaaagtgct gggattacag gcatgagcca ccatgcccag ctgtagtaca 25660
ggttttaata tgctaaatac tcttcctttc tttattaatg tgcatggaag ttctaatatt 25720
tttttcccat accccagaga gtccatattt tggaatcaac aacactagcc tttgttgaca 25780
agtgtctctc ttgggttcct tctttgtgtc ctccactgaa ttttggggtt cataaaattt 25840
catttgttgt gcttgcttaa ttccctggga atcagactgt tcctgatcgg atgacatttc 25900
tggttaattc tttagttggc aggaaataga cacaggaaac gtggtcagtt tctgattctg 25960
gcgttgagag accctttctc cttttcctct ctctcag tg ggc gac aga tgc gaa 26014
al gly asp arg cys glu
5
aga aac gag ttc cag tgc caa gac ggg aaa tgc atc tcc tac aag tgg 26062
arg asn glu phe gln cys gln asp gly lys cys ile ser tyr lys trp
10 15 20
gtc tgc gat ggc agc gct gag tgc cag gat ggc tct gat gag tcc cag 26110
val cys asp gly ser ala glu cys gln asp gly ser asp glu ser gln
25 30 35
gag acg tgc t gtgagtcccc tttgggcatg atatgcattt atttttgtaa 26160
glu thr cys l
40
tagagacagg gtctcgccat gttggccagg ctggtcttga atttctggtc tcaagtgatc 26220
cgctggcctc ggcctcccaa agtgctggga ttacaggcac cacgcctggc ctgtgacacg 26280
attcttaacc cctttttgat gatggcggct ggaaaagtgg ccagtggatt ttgatgtatt 26340
caatcatgaa ttaggaggtg gggagagaat gaattattgg agctttcctt aaagccatta 26400
aatggctcta ttgttttttc aattgatgtg aatttcacat aacatgaaat taaccagctc 26460
agtggcatta atacatctgc aatgctgtgt ggccaccacc tctatcttgt tccaaaactt 26520
tgcataacct aatgtctttt tttttttttt tttttgagac ggagtctcgt tccatcaccc 26580
aggctggagt gcagtggtgt gatctcagct cactgcaacc tccgcctccc aggttcacgc 26640
catcctcctg cctcagcctc ccgagtagct gggactacag gcaccctcca ccacatccgg 26700
ctaatttttt gtatctttag tagagatggg gtttcaccat gttagccggg atggtctcga 26760
tctcctgacc tcgtgatcca cctgcctccg cctcccaaag tgctggcatt acaggcgtga 26820
gccaccatgc ccggcctatt ttttttttta agagatggag tctaattctg ttgcccaggc 26880
tggagtccag tggtaccatc atacttcact gcagccttga cctcttgggc tcaagtgatt 26940
ctcttgcctc gaactcccaa agtattggga ttacaggtgt gagccaccgc actcagccta 27000
atgtccagtt tttaacaagc tccatttaaa tgccctccgt tttgacccat aaaggggtag 27060
gcttggccgg gcacaatggc ttgtgtctgt agtcccagct acttgggagg ctgaggcaga 27120
aaggcagaaa gattgcttta taaagcccag gagtttgagg gccacctggg tggcatagct 27180
agacctcatc tctaaaaaat aagtaataaa taaatatttg tttttgtttt tttctttttc 27240
ttttcttttt tttttttttt tgagacggag tcttgctctg ttgcccaggc tggagtgcag 27300
tggcgcgatc tcagctcact gcaagctgtg cctcctgggt tcatgccatt ctcctgcctc 27360
agcctcccga gtagctggga ctacaggcgc ccactaccac gcccagctaa ttttttgtat 27420
ttttagtaga gatggggttt caccacgtta gccaggatgg tctcaatctc ctgacctcgt 27480
gatccgccag ctttggcctc ccaaagtgtt gggattacag gcgtgagcca ctgagcccgc 27540
cccatatgta tgtatatata tattttttta aaatgggaga ccaggcatgg tggctcatgc 27600
ctagaatccc agcactttgg gaagctgagg taggcggatc acttgaggcc atgagtttga 27660
gaccagcctg ctcaacatga tgaaacttct atctctacta aaaaaaaaag tgggattagg 27720
tcaggcacgg tggctcacac ctgtaatccc agcactttca gaggccgagg caggaggatc 27780
atgaggtcag gagatcgaga ccatcctggc taacacggtg aaaccccgtc tctactaaaa 27840
aaatacaaaa aattagccag gcgtggtggc gggtgcctgt agtcccagct actcaggagg 27900
ctgaggcagg agaatggcgt gaacccggga ggcggagctt gcagtgagcc aagatcgtgc 27960
cactgtactc cagcctgggc gacagagcaa gactctgtct caaaaaaaaa aaaaaaagtg 28020
ggattgacat tctcttcaaa gttctggggt tttcctttgc aaagacagga ttggcaaggc 28080
cagtgggtct tttttgtgtg tgtgtgtgtg acggagtctc actctgccac ccaggctgga 28140
gtgcaatggc aggatctcgg ctcaccgcaa cctcctcctc ccaggttaaa gtgattctcc 28200
tgcctcagcc tcccgagtag ctgggactac aggtgcccgc caccacaccc aactaatttt 28210
tgtattttta gtagagacag ggtttcacta tattggccag gctggtcttg aacccctgac 28320
ctcacgtgat ccacccgcct tggcctccca aagtgctggg attacaggcg tgagccactg 28380
tgctcggcct cagtgggtct ttcctttgag tgacagttca atcctgtctc ttctgtag tg 28440
eu
tct gtc acc tgc aaa tcc ggg gac ttc agc tgt ggg ggc cgt gtc aac 28488
ser val thr cys lys ser gly asp phe ser cys gly gly arg val asn
45 50 55
cgc tgc att cct cag ttc tgg agg tgc gat ggc caa gtg gac tgc gac 28536
arg cys ile pro gln phe trp arg cys asp gly gln val asp cys asp
60 65 70 75
aac ggc tca gac gag caa ggc tgt c gtaagtgtgg ccctgccttt 28581
asn gly ser asp glu gln gly cys p
80
gctattgagc ctatctgagt cctggggagt ggtctgactt tgtctctacg gggtcctgct 28641
cgagctgcaa ggcagctgcc ccgaactggg ctccatctct tgggggctca taccaagcct 28701
cttccgccct tcaaatcccc ccttgaccag gaggcattac aaagtgggga tggtgctacc 28761
tcttcgggtt tgtcacgcac agtcagggag gctgtccctg ccgagggcta gccacctggc 28821
acacacactg gcaagccgct gtgattcccg ctggtcgtga tccccgtgat cctgtgatcc 28881
ccgccccgtg aggctgaaca catagtgacg cttgctagcc aagcctcaat gacccacgta 28941
acatgaaggg ggaaaagcca gaaagttctg ccaaggagca aggccaagaa tcccgaaggg 29001
aaatggactt tgaagctggg cgtcttcttg gctgtcttaa tacaagtggc acatccaaat 29061
ccaaaacccc gaaattcaaa gtcttgagca cccgaaattc tgaaacgtct tgagcactga 29121
cctttagaag gaaatgctta ttggagcatt ttggatttcg gatttttacc actgagtgtg 29181
gagtcctaat taggaaaaaa accaggctga ccgaaccaaa ggaaagcaat aaaagaaggc 29241
agatagggtc aggcacggtg gctcacccct gtaatcccag ccttttgaga ggctgaggcg 29301
ggtggatcac ttgaggtcag gagttcgaga gcagcctggc caacacggtg aaaccccatc 29361
tctactgaaa atacaaaaac tagccaggta tggtggcgtc tgcctgtaat cccagctact 29421
cgggaggctg agacaggaga atcacttgaa cctgggaggc agaggttgca gtgagccaat 29481
atcacgccat tgcactccag cctgggggac aagagcgaaa ttctgtctca aaaaaaaaga 29541
agaagaaggc cgacaaacta tgtaactctg cctttctcca tggtccagaa cacacagccc 29601
tcctgcgtaa ataactcctt atcttcctgc tcccagctat catcagacac ctcggctgat 29661
agaaaattgc aagttagctc actgcaacct cggcattata agtactgcac aaagccctct 29721
tcagcgcaca gcacaagcac cattctataa aatctccagc aagcggccag gtgcagtggc 29781
tcatacctgt aatcccagca ttttgggaga ctgaggcggg cggatcacct gaggtcagga 29841
gtttgagacc agcctggcca acatggtgaa accccgtctc tattaaaaat acaaaaaaat 29901
tagccaggcg tggtggcagg tgcctgtaat cccagctact tggaaggctg aggcaggaga 29961
atcgcttgaa cccgggaggt ggaagttgca gtgagccgag atcttgccat cgcactccag 30021
cctgggggac aagagtgaga cttcgtctca aaaaaaaaaa aaaaaattcc cagcaagcct 30081
ttgtcttctg gcagtcagct cctctcttgc tgacctgctc attgctttct tgcaaggtat 30141
tttcctacct actttctgga ataaatctgt ctttctgtac ttacaactac cttttttaaa 30201
atttctttct tttttgagat ggagtctcac tctgtttgcc caggctggag ttcagtggtg 30261
caatctcagc tcactgcaac ctctacctac tgggttcaag cgattctcct gcctcagctt 30321
cccgagtagc tgggattaca ggcgtgcacc agcacgcagg ctaatttttg tatttttagt 30381
agagacgggg tttcaccatg ttggccaagg tggtcttgaa ctcctgacct caagtgatcc 30441
tcccacctca gcctcccaaa gcgctaggat tacggccatg agccactgag gccggctgca 30501
cctacaactg tcttgataaa ttcttacccc cacaccactg gtccagatag tcagtgctca 30561
cccacaacat taaggatatt ccaaatttga aacattccaa aatcagaaaa atattccaac 30621
tctgaaaata ttccaaaatc caaaaaaatt caaaatccaa aacacttctg gtcccaagca 30681
ttttagagaa gggatactca acccaaaata aggacagcaa ttctataaat tgtgctacca 30741
tcttgcaggt ctcagtttaa cagctttaca cctattagcg caccagtgct catagcagtg 30801
ctgggaaatg tgtacagatg aggaaactga ggcaccgaga gggcagtggt tcagagtcca 39861
tggcccctga ctgctcccca gcccgccttt ccaggggcct ggcctcactg cggcagcgtc 30921
cccggctata gaatgggctg gtgttgggag acttcacacg gtgatggtgg tctcggccca 30981
tccatccctg cag cc ccc aag acg tgc tcc cag gac gag ttt cgc tgc 31029
ro pro lys thr cys ser gln asp glu phe arg cys
85 90 95
cac gat ggg aag tgc atc tct cgg cag ttc gtc tgt gac tca gac cgg 31077
his asp gly lys cys ile ser arg gln phe val cys asp ser asp arg
100 105 110
gac tgc ttg gac ggc tca gac gag gcc tcc tgc ccg gtg ctc acc tgt 31125
asp cys leu asp gly ser asp glu ala ser cys pro val leu thr cys
115 120 125
ggt ccc gcc agc ttc cag tgc aac agc tcc acc tgc atc ccc cag ctg 31173
gly pro ala ser phe gln cys asn ser ser thr cys ile pro gln leu
130 135 140
tgg gcc tgc gac aac gac ccc gac tgc gaa gat ggc tcg gat gag tgg 31221
trp ala cys asp asn asp pro asp cys glu asp gly ser asp glu trp
145 150 155
ccg cag cgc tgt agg ggt ctt tac gtg ttc caa ggg gac agt agc ccc 31269
pro gln arg cys arg gly leu tyr val phe gln gly asp ser ser pro
160 165 170 175
tgc tcg gcc ttc gag itc cac tgc cta agt ggc gag tgc atc cac tcc 31317
cys ser ala phe glu phe his cys leu ser gly glu cys ile his ser
180 185 190
agc tgg cgc tgt gat ggt ggc ccc gac tgc aag gac aaa tct gac gag 31365
ser trp arg cys asp gly gly pro asp cys lys asp lys ser asp glu
195 200 205
gaa aac tgc g gtatgggcgg ggccagggtg ggggcggggc gtcctatcac 31415
glu asn cys a
210
ctgtccctgg gctcccccag gtgtgggaca tgcagtgatt taggtgccga agtggatttc 31475
caacaacatg ccaagaaagt attcccattt catgtttgtt tctttttttt cttttctttc 31535
tttattttgt ttttgagatg gagtctcact ctgtgatttt tttcatctct aaatttccta 31595
catccatatg gccaccatga ggccccaggc tggccgatgg ttgctgttag cttattggga 31655
aatcactgtt tggaaggtgc tggttgtttt ttgttgtttg ttgtttttgt ttttgttttt 31715
gttttgagac ggagtctcgc tctgtcgcca gggtggagtg cagtggcgcg atcagctcac 31775
tgcaacctcc gcttcctggg ttcaagccat tctcctgcct cagcctccca agtagcgcgg 31835
attacaggca tgtgccacca cctccggcta tttttttttc tatttagtag agatggggtt 31895
tcaccatgtt agtcaggctg gtcatgaact cttgacctca ggtgatccac ccgcctcggc 31955
ctcccaaagt gctgggatta caggcgtgca ctgctgcacc cagccttttt ttgttttttt 32015
gagacagggt cttgctgtca cccaggttga agtaaggtgg cacgattatg gctcactgcg 32075
gccttgatct ccttggctca agcgatcctc tcacttcagc ctctcaagca gttggaacca 32135
caggctgtac caccaagcct ggccaatttt tttgtacaga cacaggctgg tcttgaactc 32195
ctgggctcaa gcaatcctcc tgccttggcc tcccaaagtg ctgggattcc aggcatgagc 32255
cgctgcaccc ggcaaaaggc cctgcttctt tttctctggt tgtctcttct tgagaaaatc 32315
aacacactct gtcctgtttt ccag ct gtg gcc acc tgt cgc cct gac gaa 32365
la val ala thr cys arg pro asp glu
215
ttc cag tgc tct gat gga aac tgc atc cat ggc agc cgg cag tgt gac 32413
phe gln cys ser asp gly asn cys ile his gly ser arg gln cys asp
220 225 230 235
cgg gaa tat gac tgc aag gac atg agc gat gaa gtt ggc tgc gtt aat 32461
arg glu tyr asp cys lys asp met ser asp glu val gly cys val asn
240 245 250
g gtgagcgctg gccatctggt tttccatccc ccattctctg tgccttgctg 32512
v
cttgcaaatg atttgtgaag ccagagggcg cttccctggt cagctctgca ccagctgtgc 32572
gtctgtgggc aagtgacttg acttctcaga gcctcacttc cttttgtttt gagacggagt 32632
ctcgctctga cacccaggct ggagtgctgt ggcacaatca cagctcacgg cagcctctgc 32692
ctctgatgtc cagtgattct cctgcctcag cctcccgagt agctgagatt aaaggcgtat 32752
accaccacgc ccggctaatt ttttgtattt ttattagaga cagggtttct ccatgttggc 32812
caggctggtc ttgaactcct ggtctcaggt gatccacccg cctcggcctc ccaaagtgct 32872
aggattacag gtgtgagcca ctgcgccagg cctaattttt ttgtattttt agtagagatg 32932
cggttttgcc atattgccca ggctggtctc gaactcctgg gctcaagcga tctgcctgcc 32992
ttggcctccc aaagtgctgg gattacaggc acaaaccacc gtgcccgacg cgttttctta 33052
atgaatccat ttgcatgcgt tcttatgtga ataaactatt atatgaatga gtgccaagca 33112
aactgaggct cagacacacctgaccttcct ccttcctctc tctggctctc acag tg aca 33271
al thr
ctc tgc gag gga ccc aac aag ttc aag tgt cac agc ggc gaa tgc atc 33219
leu cys glu gly pro asn lys phe lys cys his ser gly glu cys ile
255 260 265
acc ctg gac aaa gtc tgc aac atg gct aga gac tgc cgg gac tgg tca 33267
thr leu asp lys val cys asn met ala arg asp cys arg asp trp ser
270 275 280 285
gat gaa ccc atc aaa gag tgc g gtgagtctcg gtgcaggcgg cttgcagagt 33319
asp glu pro ile lys glu cys g
290
ttgtggggag ccaggaaagg gactgagaca tgagtgctgt agggttttgg gaactccact 33379
ctgcccaccc tgtgcaaagg gctccttttt tcattttgag acagtctcgc acggtcgccc 33439
aggctggagc gcaatggcgc gatcttggct caccacaacc tccggctccc aggttcaagc 33499
gattcttctg cctcagcctc ctgagtagct gggattacag ctgaatgcca ccttgctggg 33559
ctaatttttg tatttttagt agagatgggg tttcaccatg ttggccaggc tggcctcgaa 33619
ctcctgacct cgagtgatct gcccgcctcc tgaagtgctg ggattacagg cgtgagccac 33679
ctcgtcctgg tgagggtttt tttttttccc caaccctctg tggtggatac tgaaagacca 33739
tattaggata actgtacagt atagagaagg cagtggcaag ttttctctgt catataccag 33799
agtgggcttg ggcatggtgg catactcctg tagtctcagc taatcaggag gctgaggaag 33859
gaggatcgct tgggcccagg agttggagac tgtagtgagc tgtgatcaca ccaccacact 33919
tcaatctggg caacagagca agagacccta tctctaaaaa aaagtaagta tttcggacac 33979
tgtgggccat acggtctctg gtgcagtttc tcaacatggc tgttgggtga acacaaccac 34039
gcacagaacg caaaccaata cacgtggctg tgggcccaga aaatgttatt tatggacaca 34099
aaaattggaa tttcatataa ctgttttgtg tcatgaaaat gatttccctt tttattttta 34159
tttttcttct caagtattta aatatgtaaa agccattttt aggcctggca ggatggttca 34219
cagctgtaat cccagcactt tgggaggtcg aggcgggagg atcacgaggt caggagatcg 34279
agaccatcct ggccaacaca gtgaaacccc gtctctacta aaaatacaaa aaattaacca 34339
ggcttggtgg cgcgcgtctg tagtcccagc tgctcaggag gctgaggcag gagaatcgct 34399
tgaatgcagg aggcggaggt tgtagtgagc cgaggttgca ccactgcact ccagcctgag 34459
cgacagagtg agagtccgcc tcaaacaaaa aaatgtttgc ccatgctggt cttgaactcc 34519
tgggctcaag ctatctgcct gccttggtct cccaaagttc tgggattaca ggcatgagct 34579
acagcgcccg gacttttgtt gttttatatc tatatatcta tatataactt gttttatgta 34639
tatatataac ttgttttata tatatacata aactgcagta aaaaacatgt aacataaaat 34699
ttaccttctc aaaccttatt aagtgcacag ttctgtgcca ttagcaaatt cacactgttg 34759
tacaacatca caaccaccat ctccagaact tttttttttt tttttattct ttttgagaca 34819
gagtctcact cgtcgcacgg gctggagtgc agtggtgcga tctcggttca ctgcaacctc 34879
cacctaccag gttcaagcaa ttctcctgcc tcagccccct cagtagctgg gattacaggt 34939
gcccgtccta ccacgcccag ctaatttttg tattttcagt agagactgac tgggtttcac 34999
catgttggcc aggctggtct cgaactcctg acctcaagtg atcctcccac ctcagcctcc 35059
caaagtgctg ggaatacagg catgagccac tgcgcccggc cccagaactc ttttatcttc 35119
ccaaactgaa gctctgtccc catgaaacac tcactctcca tcccctcccc aactcctggc 35179
acccaccatt ctactttctg tccctatgaa tgtgatggct ctagggacct cctctgagtg 35239
gaatcagaca gcattttcct tttttgactg gcttatttca ctgagccaag tgcggtggca 35299
cacgcctgta atcccaaaac tttgggagac cgaggcgggc gcatcaccag aggacaggag 35359
nncgagacca gcccggccaa cagggggaaa ccccatcact agggagcctg cagaaagaaa 35419
gccaccacat ggcctgctgg agccacacaa tcccagcaaa acagggacgc taaacgtagg 35479
agaaacacac aaccccagga ggcggaggtc gcagtgagcc gagatcgtgc cattacactc 35539
cagcctgggc aacaagagtg aaactccgtc tctcctaaaa atacaaaaaa attagctggg 35599
catggtggca catgcctgta gtcccagcta cttgggaggc tgaggcagga gaatcacttg 35659
aacccgggag gtggaggttg taatgagcca aggttggcgg cgaagggatg ggtaggggcc 35719
cgagagtgac cagtctgcat cccctggccc tgcgcag gg acc aac gaa tgc ttg 35773
ly thr asn glu cys leu
295
gac aac aac ggc ggc tgt tcc cac gtc tgc aat gac ctt aag atc ggc 35821
asp asn asn gly gly cys ser his val cys asn asp leu lys ile gly
300 305 310
tac gag tgc ctg tgc ccc gac ggc ttc cag ctg gtg gcc cag cga aga 35869
tyr glu cys leu cys pro asp gly phe gln leu val ala gln arg arg
315 320 325 330
tgc gaa g gtgatttccg ggtgggactg agccctgggc cccctctgcg cttcctgaca 35926
cys glu a
tggcaaccaa acccctcatg cctcagtttc cccatctgtt aagtgtgctt gaaagcagtt 35986
aggagggttt catgagattc cacctgcatg gaaaactatc attggctggc cagagtttct 36046
tgcctctggg gattagtaat taagaaattt caggccgggt gcgtaatccc tgtaatccca 36106
acaccttggg acgccgaggc gggcagatca cctgaggtcg ggagttccag accagcctga 36166
ccaacatgga gaaaccccgt ctctactaaa aatacaaaat tagccgggct tggtggtgca 36226
tgcctataat cccagctact caggaggctg aggcaggaga atcacttgaa cctgggaggt 36286
ggaggttgtg gtgagccaag atcgtgccat tgcactccag cctgggcaac aagagtgaaa 36346
ctccatccaa aaaaaaaaga aaagaaaaga aaaaaaagaa aagaaatttc agctgacaca 36406
gcttcacact cttggttggg ttcccgtggt gaatgatgag gtcaggtgat gactggggat 36466
gacacctggc tgtttccttg attacatctc ccgagaggct gggctgtctc ctggctgcct 36526
tcgaaggtgt gggttttggc ctgggcccca tcgctccgtc tctagccatt ggggaagagc 36586
ctccccacca agcctctttc tctctcttcc ag at atc gat gag tgt cag gat 36638
sp ile asp glu cys gln asp
335
ccc gac acc tgc agc cag ctc tgc gtg aac ctg gag ggt ggc tac aag 36686
pro asp thr cys ser gln leu cys val asn leu glu gly gly tyr lys
340 345 350 355
tgc cag tgt gag gaa ggc ttc cag ctg gac ccc cac acg aag gcc tgc 36734
cys gln cys glu glu gly phe gln leu asp pro his thr lys ala cys
360 365 370
aag gct gtg g gtgagcacgg gaaggcggcg ggtgggggcg gcctcacccc 36784
lys ala val g
375
ttgcaggcag cagtggtggg ggagtttcat cctctgaact ttgcacagac tcatatcccc 36844
tgaccgggag gctgtttgct cctgagggct ctggcagggg agtctgccgc cctgttagga 36904
cttgggcttg ccagggggat gcctgcatat gtcctagttt ttgggaatat ccagttaacg 36964
gaaccctcag ccctactggt ggaacaggaa ccggctttcc tttcagggac aacctgggga 37024
gtgacttcaa ggggttaaag aaaaaaaatt agctgggcat ggtgccacac acctgtggtc 37084
ccagctactc agaaggctga ggcgggagga ttgcttgagg gcaggaggat tggttgatcc 37144
tcccacctca gcctccggag tagctgggac ctcaggtgca tgccactatg cctggctaat 37204
tttctttttt cttttttttt ttttttcgag acggagtctc gctctgttgc ccaggctgga 37264
gtgcagtggc aggatctcgg ctcactgcaa gctccgcctc ccgggttcac gccattctcc 37324
tgcctcagcc tccccagtag ctgggactac aggagcccgc cactgcacca ggccaatttt 37384
tttgtatttt tagtagagac ggggtttcac tgtgttagcc aggatggtct cgatctcctg 37444
acttcgtgat ccgcccacct cggccttcca aagtgctcgg attacaggcg tgagccactg 37504
cgcccagccg ctaattttca tatttttagt aaaaacaggg tttcaccatg ttggccaggc 37564
tagtcttgaa ctcctgaacc caagtgatcc tcctgccttg gcctcccaaa gtgctgggat 37624
tacagacacc acacctggct attattattt tttagagaca gggtgctgct ctatcttcca 37684
gcctgtagtg cagtgcagcc tccatcatag ctcgctgcag ccttgacctc ctgggttcac 37744
gtgatcgtcc cgcctaagcc tctggaggag ctgggagtac tggcatgtgc caccatgcct 37804
ggttaatttt tttttttttt tttttgagac agagtctcat tctgtcaccc aggctggagt 37864
gcggtggtgc gatcttggct tactgaaacc tccacctccc aggttccagc aattctcctg 37924
cctcaccct ctgagtagct gggattacag gttccggcta ccaaacctgg ctagtttttg 37984
tatgtttagt agagacaggg tttcaccatg ttggtgaggc tggtctcgat tctcccgcct 38044
cagcctccca aagtgctggg attacaggct tgagccaccg tgcctggctt tttttttttt 38104
tttttttttt gtggcaataa ggtctcattg tcttgcccag gctagcctta tgctcctagc 38164
ctcaagtgat cctcctccct cagcctccca aagtgctggg attacaggtg ggcgccactg 38224
tgcctgttcc cgttgggagg tcttttccac cctctttttc tgggtgcctc ctctggctca 38284
gccgcaccct gcaggatgac acaaggggat ggggaggcac tcttggttcc atcgacgggt 38344
cccctctgac cccctgacct cgctccccgg acccccag gc tcc atc gcc tac ctc 38399
ly ser ile ala tyr leu
375 380
ttc ttc acc aac cgg cac gag gtc agg aag atg acg ctg gac cgg agc 38447
phe phe thr asn arg his glu val arg lys met thr leu asp arg ser
385 390 395
gag tac acc agc ctc atc ccc aac ctg agg aac gtg gtc gct ctg gac 38495
glu tyr thr ser leu ile pro asn leu arg asn val val ala leu asp
400 405 410
acg gag gtg gcc agc aat aga atc tac tgg tct gac ctg tcc cag aga 38543
thr glu val ala ser asn arg ile tyr trp ser asp leu ser gln arg
415 420 425
atg atc tgc ag gtgagcgtcg cccctgcctg cagccttggc ccgcaggtga 38594
met ile cys se
430
gatgagggct cctggcgctg atgcccttct ctcctcctgc ctcag c acc cag ctt 38649
r thr gln leu
435
gac aga gcc cac ggc gtc tct tcc tat gac acc gtc atc agc aga gac 38697
asp arg ala his gly val ser ser tyr asp thr val ile ser arg asp
440 445 450
atc cag gcc ccc gac ggg ctg gct gtg gac tgg atc cac agc aac atc 38745
ile gln ala pro asp gly leu ala val asp trp ile his ser asn ile
455 460 465
tac tgg acc gac tct gtc ctg ggc act gtc tct gtt gcg gat acc aag 38793
tyr trp thr asp ser val leu gly thr val ser val ala asp thr lys
470 475 480
ggc gtg aag agg aaa acg tta ttc agg gag aac ggc tcc aag cca agg 38841
gly val lys arg lys thr leu phe arg glu asn gly ser lys pro arg
485 490 495
gcc atc gtg gtg gat cct gtt cat gg gtgcgtatcc acgacgctga 38887
ala ile val val asp pro val his gl
500 505
gggctgcaga gggaatggag ggagcaggaa ggagcttcag gaactggtta gtgggctggg 38947
catggtggct caaagcacct gtaatcccag cactttggga ggccaaggtg ggtggatcat 39007
caagaccagc ctgaccaaca tggtgaaacc tcgtctctac taaaaataca aaaattagcc 39067
gggtgtggtg gtgggcacct gtaatcccag ctgctcggga ggctgaggca ggagaatcac 39127
ttgaacctgg gagatggagg ttgcagtgag ccaagacagc cccactgcac tccagcctgg 39187
gtgacagagt gagactccgt ctcaaaaaaa aaaaaaaaaa ctaaacaaaa aactggttag 39247
tggctagaca acaggatggt atcttccaag cccatggctg actcagcagc tcctgggtca 39307
agacactgtg acctgtgtcc cctggcagga agcatcgccc ctgccacctg cccggtgtac 39367
tctgtacctg tcaggtgaca tctgctacct aagcacgtga gaggtggcat ttcacagttt 39427
cagtgtggtg ctgacaaccc gggacgcaca ctgtccttgc agctacaatc aggaggtgaa 39487
tgttgggttt ccagcagaga acactggaga aggcacactt ggtgtctgga agggaaaagc 39547
agggaagaga gcatcatcag atgcctgcgg gtgaaggtgg gcccgctatg gccagcgtcc 39607
ctttttattt ttatttattt atttatttga gatggaatct cgctctgtcg cccagactgt 39667
agtgcagtgg tgcgatcacg gctcactgca agctccgcct cacaggttca cgccattctc 39727
ctgcctcagc ctcccgagta gctgggacta caggcacccg ccaccacgcc cggttaattt 39787
tttgcatttt tattagagac ggggtttcac cgcgttagcc aggatggtct aaatctcctg 39847
accctgtgat ccacccgcct cggcctccct aagtgcttgg attacaagcg tgagccacca 39907
cgcccggccc cctttttatt ttttattttt tgagacggag tctcgctctg tcgcccaggc 39967
tagattgcag tggcgtgatc tcggctcact gcagcctccg cctcccaggt tcaagtgatt 40027
ctcctgcctc aacctcccaa ctaattagga ttacaagcat gtaccaccat gcctgactaa 40087
ttttttgtat ttttagtaga gactgggttt caccatgttg gctaggctgg tctcgaaccc 40147
ttagcctcaa gtaatctgcc tgcctcagcc tcccaaacag cggggattac aggcatgagc 40207
cactgtgccc aacccaaccc tggatctctt ttaaacaaga caatgctcgc tgttgccaca 40267
gaacaatggg tggggtacat gtggcccagt gtgtttggcc acataactgc caggccagag 40327
ggaaagagac tctcagactg tctccactca gatacaaatg tgtgtgttgt gtgcgtgtgt 40387
tctggtctca tatttgtttg ttttgagaca gggtgtcgct ctgtcactga gtctggagtg 40447
cagtggcgca atcagagttc actgcagcct caaactcttg ggctcagttg attctcccac 40507
ttcagcctcc caagtagctg gaactacagg tgaacaccac tgtgcccagc taatttattt 40567
tatttttagt agagatgagg tctcactatg ttgcccaggc tggtcttgac ctcctagcct 40627
caagcaatcc tcctgccttg gtctcccaaa gtgctgggat tacacgtgcg agccattgcg 40687
catggcttgt gttcttgtgt ttcttccttt ttctttcgag atggcgtctc agtctgccac 40747
ccaggctgga gtgcagtggt gtgatcatag ctcactgtag cctcaacttc ctgggctcaa 40807
gcaatcctct tgatttcagc ctcccgggcc tggccagcat ggtgaaaccc cgtctctact 40867
aaaaatacaa aaatgtagcc aggcgtggtg gtgggcgcct gtaatcccag ctacaccaga 40927
ggctgaggca ggagaatcgc ttgagcctgg aaggtggagg ttgcagcaag ccaagatcgt 40987
gccactgcac tccagcctgg gcaacagaga cagactctgt ctcaaaaaaa aaaaaaaaaa 41047
acccaaacaa gccacatttg gagtttgggg ttcccagcag gactatttcc caagcctgag 41107
cctggctgtt tcttccagaa ttcgttgcac gcattggctg ggatcctccc ccgccctcca 41167
gcctcacagc tattctctgt cctcccacca g c ttc atg tac tgg act gac tgg 41220
y phe met tyr trp thr asp trp
510 515
gga act ccc gcc aag atc aag aaa ggg ggc ctg aat ggt gtg gac atc 41268
gly thr pro ala lys ile lys lys gly gly leu asn gly val asp ile
520 525 530
tac tcg ctg gtg act gaa aac att cag tgg ccc aat ggc atc acc cta 41316
tyr ser leu val thr glu asn ile gln trp pro asn gly ile thr leu
535 540 545
g gtatgttcgc aggacagccg tcccagccag ggccgggcac aggctggagg 41367
a
acagacgggg gttgccaggt ggctctggga caagcccaag ctgctccctg aaggtttccc 41427
tctttctttt ctttgttttt tctttttttg agatgaggtc ttggtctgtc acccaggctg 41487
gagtgcactg gcgcaatcgt agctcactgc agcctccacc tcccaggctc aagtgatcct 41547
cctgcctcac cctcctgagt agctgagatt acagacacgt gccaccacgg cagactaatt 41607
ttattttatt tttgggaaga gacaaagtct tgttatgttg gcctggctgg tctcaaactc 41667
agggtgcaag cgatcctccc gcctcagcct tccaaactgc tgggattaca ggcgtgggcc 41727
accgtaccca gcctccttga agtttttctg acctgcaact cccctacctg cccattggag 41787
agggcgtcac aggggagggg ttcaggctca catgtggttg gagctgcctc tccaggtgct 41847
tttctgctag gtccctggca gggggtcttc ctgcccggag cagcgtggcc aggccctcag 41907
gaccctctgg gactggcatc agcacgtgac ctctccttat ccacttgtgt gtctag 41963
at ctc ctc agt ggc cgc ctc tac tgg gtt gac tcc aaa ctt cac tcc 42010
sp leu leu ser gly arg leu tyr trp val asp ser lys leu his ser
550 555 560
atc tca agc atc gat gtc aac ggg ggc aac cgg aag acc atc ttg gag 42058
ile ser ser ile asp val asn gly gly asn arg lys thr ile leu glu
565 570 575
gat gaa aag agg ctg gcc cac ccc ttc tcc ttg gcc gtc ttt gag 42103
asp glu lys arg leu ala his pro phe ser leu ala val phe glu
580 585 590
gtgtggctta cgtacgagat gcaagcactt aggtggcgga tagacacaga ctatagatca 42163
ctcaagccaa gatgaacgca gaaaactggt tgtgactagg aggaggtctt agacctgagt 42223
tatttctatt ttcttctttc tttttttttt tttttttgag acagagtttt gctctcgttt 42283
cccaggctgg agggcaatgg catgatctcg gctcaccgca acctccacct cccaggttca 42343
agtgattctc ctgtctcagg ctccccagta gctgggatta caggcatgca ccaccaccat 42403
gcccggctaa ttttgtattt ttagtagaga cggagtttct ccatgttggt caggctggtc 42463
tcgaactccc gacctcaggt gatctgcctg cctcggcctc ccaaagtgct gggattacag 42523
acttgagcca ccgcgcccag ctatttctgt tttctttctt tcttcttctt cttttttttt 42583
ttctaagaga caggatctca ctctgtcccc aggcaggagt gcagtgctgt gatcatagct 42643
cactgcagcc ttaacctcct gggctcaagt gatcttccca cctcagcctc ccaagtagct 42703
ggaactacag gtgcacacca ccatgcccag ctcatttttg tatttttttt ttttttgaga 42763
cagtctcgtt ctgtcacccc ggctggagtg cagtggtaca atcttggctc actgcaacct 42823
ctgcctccca ggttcaagcg attctcctgc ctcagcctcc tgagtagttg agattacagg 42883
catgtgtgcc atcatacctg gctgattttt gtattttttt ttagagatgg ggtctcagta 42943
tgttgaccag gcttgtctta aactcccggc ctcaagtgat cctcccactt cagtctccca 43003
aagtgctggg attacaggca tgagccactg cggccggttt gttttctttt ttttttcgtt 43063
ttttggagac ggaatttcac ctttgttgcc caggatggag tgcaatggca cgatatcgcc 43123
tcaccacaac ctctgcctcc tgggttcaaa ccattttcct gcctcagcct tcttagtagc 43183
tgggattaca agcatgtgcc accacgcccg gctgattttg tatttttagt agagatgggg 43243
tttctccatg ttggccaggc tggtctcgaa ctcctgacct caggtcattc gcccacctct 43303
gcctcccaaa gtgctgggat tacaggcgtg agccaccgtg cccggtggtt tgtattcttt 43363
ttactgagag tcgtgaaagg cagtgatcct ctgtcacatg tgatcttggc tctcagggga 43423
catttggcaa tttctagaga ttttttggtt gtcacaagtc aatggggaag actgttggca 43483
tttagtgggt agaggctggt gacgctgctg aacacccaga acagggaagt agcaggccct 43543
agatagagcc atcgtgggga aaccctgctc taaggaaatg gcgctatttt ataaccccac 43603
gttcctggca tgattaccaa cagccaaaag tggagtcccc ccaagtgtgt tcgtccattt 43663
gcattgcagt aaaggaatag ctgaggccgg gtaatttata aagaaaagag atttaaactg 43723
ggtatggcag tttatgccta taatcccaga actttgggag gctgaggcag gaggatcgct 43783
tgagtccagg agtgtgagac cgagaccagc ctggccaaca tgacgaaact ctgtctctac 43843
aaaaaataca aaaagtaggc caggcacggt ggttcacgcc tgtaatccca gcactttggg 43903
aggccgaggc gggcggatca cgaggtcagg agatcgagac catcctggct aacacggtga 43963
aaccccgtct ctactaaaaa tacaaaaaca aaattagccg ggtgtggtgg caggcgcctg 44023
tagtcccagc tactcgggag gctgaggcgg gagaatggcg tgaacccggg aggcggagct 44083
tgcagtgagc caagatcgcg ccactgcact ccagcctggg tgaccgagtt gagactccgt 44143
ctcaaaaaaa aaaaaaaaaa aaaaaataca aaaagtagcc aggtgtggtg gcaggcacct 44203
gtaatcctgg gttctcgaga ccgaggcatg agaattgcct gaccccagga ggtggaggct 44263
gcagtgagcc aagatcatgc cactgcactc cagcctgggc gacagagtgg gactctgtct 44323
caaaaaacaa caaaaaaaaa gttctggaaa tggatggtgg tgatggtgat acttccacaa 44383
cagcgtgaat ctgcttaagg ccaccgaact gtgcactcac aaatagtcga gatggtacat 44443
tttatgttat gtgtatttca ccacaattaa aaactagttg tgggccaggt gtggtggttc 44503
atgcctgtaa tcccagcact ttgggaggtc agagggaggt ggatcatgag gtcagcagtt 44563
cgagaccagc caggccaaca tggtgaaacc ccatctctac taaaaataca aaaattagcc 44623
aggcgtggtg gcacatgcct gtagtcccag ctacttgaga ggctgaagca ggagaatcgc 44683
ttgaacctgg gaggctaaga ttgcagtgag ccgagatcgt gccactgcac tccagcctgg 44743
acgacagagt gagacttcgt ctcaaaaaaa aaaccaaaaa aaaaattagc tgtgggtcag 44803
gcactgtggc tcacgcctgt aatcccagca ctttgggaga ccgaggtagg tggatggcct 44863
gaggtcagga gttcgaatcc agcctggcca acatggtgaa agcccgtctc tactaaaaat 44923
acaaaaaatt agtcaggtat gttggcacac ctgtaatccc agctactcgg gaggctgaag 44983
caagagaatc gtttgaaccc aggaggtgga cgttgcagtg agccgagatt gggccactgt 45043
actccagcct gggcaacaaa agtgaaactc tgtctgaaac aaacaaacaa acaaacaaac 45103
agacaaacaa aaaaactagt tgtggagaga gggtggcctg tgtctcatcc cagtgtttaa 45163
cgggatttgt catcttcctt gctgcctgtt tag gac aaa gta ttt tgg aca gat 45217
asp lys val phe trp thr asp
595 600
atc atc aac gaa gcc att ttc agt gcc aac cgc ctc aca ggt tcc gat 45265
ile ile asn glu ala ile phe ser ala asn arg leu thr gly ser asp
605 610 615
gtc aac ttg ttg gct gaa aac cta ctg tcc cca gag gat atg gtt ctc 45313
val asn leu leu ala glu asn leu leu ser pro glu asp met val leu
620 625 630
ttc cac aac ctc acc cag cca aga g gtaagggtgg gtcagcccca 45358
phe his asn leu thr gln pro arg g
635 640
cccccccaac cttgaaacct ccttgtggaa actctggaat gttctggaaa tttctggaat 45418
cttctggtat agctgatgat ctcgttcctg ccctgactcc gcttcttctg ccccag 45474
ga gtg aac tgg tgt gag agg acc acc ctg agc aat ggc ggc tgc cag 45521
ly val asn trp cys glu arg thr thr leu ser asn gly gly cys gln
645 650 655
tat ctg tgc ctc cct gcc ccg cag atc aac ccc cac tcg ccc aag ttt 45569
tyr leu cys leu pro ala pro gln ile asn pro his ser pro lys phe
660 665 670
acc tgc gcc tgc ccg gac ggc atg ctg ctg gcc agg gac atg agg agc 45617
thr cys ala cys pro asp gly met leu leu ala arg asp met arg ser
675 680 685
tgc ctc aca g gtgtggcaca cgccttgttt ctgcgtcctg tgtcctccaa 45667
cys leu thr g
690
ctgccccctc ctgagcctct ctctgctcat ctgtcaaatg ggtacctcaa ggtcgttgta 45727
aggactcatg agtcgggata accatacttt tcttggatgg acacatcagc accgggcttg 45787
acatttaccc agttcccctt tgatgcctgg tttcctcttt cccggccccc tgaagaggtg 45847
atctgatttc tgacaggagc cctgagggag gaaatggtcc cctttgttga cttttctttt 45907
tctttatttt tttcttttga gatttgctgt cacccagcct ggaatgcagt ggtgccatct 45967
tggctcactg ctacctctcc cactgggttc aagcaattct cctgcctcag cctcccaagt 46027
agctgggatt acaagcatgc gccaccatgc ctggctaagt tttgtatttt tagtacagac 46087
agggtttctc catggtggcc aggctggtct tgaactcctg acctcaggtg atcctcccac 46147
ctctgcctcc cgaagtgcta cgattacagg catgagccac cgcgcccatc cccctttgtt 46207
gacttttctc atcctctgag aaagtctcag ttgaggccag cacctccctc aagtgaattg 46267
aatctccctt ttgaacaaca acaaataaca atatgaccca gacgtggtgg ctcacacctg 46327
tggtcccagc tactcgggag gctgaggtgt gaggattgct tgagcccagg aggtcaaggc 46387
tacagagagc tataatcaca ccacttcact ccagcctggg ggacaaagtg aaaccctgtc 46447
tgaaaaaaac aaaaaaagaa aaaggaaaaa gaaacaatac gatcacaaag tagatattca 46507
tagtgtttat tttcagtact cttttttttt tttttttttt tttttgagac ggagtcttgc 46567
tctgttgccc aggctggagt gcagtggcac gatcttggct cactgcagcc tctgcctccc 46627
aggttcaagc gcttggctca ctgcaacctc cgcctcctgg gttcaagcgc ttcttctgcc 46687
tcagcctccc cagtagctgg gactataggc acgtcccact acgcccagct aattttttgt 46747
attttttagt agagatgggg tttcactatg ttagccagga tggtctcgat ctcctgacct 46807
cgtgatctgc ctgccttggg ctcccaaagt gttgggatta tgggcatgag ccactgcacc 46867
tggccttttt tttttttttt tttgagatgg agtttcgctc ttgttgccca ggctggagtg 46927
caatggtgtg atctcggctc actgcaacct ctgcctcctg ggttcaagca attctcctgc 46987
ctcagcctcc cgagtagctg ggattacagg cacctgccac cacgcctggc taatttttgt 47047
acttttagta gagacggggt ttctccatgt tggtcaggct ggtctcaaac tcctgacctc 47107
aggtgatcca cccacctcgg cctcccaaag ttctgggatt acagacatga gccaccgcgc 47167
ctggccgtgt ctggcctttt ttagttattt cttttttttt tttttttttt tttgagacag 47227
agtcttactc cgtcgcccag gctggagtgc agcggtgcga tgtctgcgca ctgcaagctc 47287
cgccccctgg gttcatgcca ttctcctgcc tcagccttct gagtagctgg gactgcaggc 47347
gcctgccact acgcccggct acttttttgt atatttagta gagatggagt ttcactgtgt 47407
tagccaggat ggtctcgatc tcctgacttt gtgatccgcc cgcctcggcc tcccaaagtg 47467
ctgggattac aggcgtgagc caccatgcca ggcttttttt tttttttttt tttttgagac 47527
ggagtcttgc tctgtcgccc aggctggagt gcagtgccat gatctcagct cactgcaagc 47587
tccacttccc aggctcacgc cattctccag cctcagcctc ccaagtagct gagactacag 47647
gggcccgcca ccacactcgg ctaatttttt tgtattttta gtagagacgg ggtttcacca 47707
tgttagccag gctggtcttg aactcctaac ctcaggcgat tcacctgcct cggcctccca 47767
aagtgctggg attaaaggta tgagccacct cgcctggtgt gagccacctc gcccagcctg 47827
agccacctca cccagcctaa gccactgtgc ctggcctgat tttggacttt ttaaaaattt 47887
tattaataat tatttttggg tttctttttt ttgagacagg gtcttactct gtcatccagg 47947
ccatcctgtc tgtctgtcat cccagtgatg ggatcatacc ttgctgcagc ctctacctcc 48007
tgggctcaag cgatcctccc ccctcagcct cctgagtagc tgggagtaca ggtgtgcacc 48067
accacacctg gctaattttt tttttttttt ttgtatatag agatggtatt ttgccatgtt 48127
gaccaggcta gtcttaaact cctggactca ctcaagagat cctcctgcct tggcctccca 48187
aggtcatttg agactttcgt cattaggcgc acacctatga gaagggcctg caggcacgtg 48247
gcactcagaa gacgtttatt tattctttca g ag gct gag gct gca gtg gcc acc 48301
lu ala glu ala ala val ala thr
695 700
cag gag aca tcc acc gtc agg cta aag gtc agc tcc aca gcc gta agg 48349
gln glu thr ser thr val arg leu lys val ser ser thr ala val arg
705 710 715
aca cag cac aca acc acc cga cct gtt ccc gac acc tcc cgg ctg cct 48397
thr gln his thr thr thr arg pro val pro asp thr ser arg leu pro
720 725 730
ggg gcc acc cct ggg ctc acc acg gtg gag ara gtg aca atg tct cac 48445
gly ala thr pro gly leu thr thr val glu ile val thr met ser his
735 740 745
caa g gtaaagactg ggccctccct aggcccctct tcacccagag acgggtccct 48499
gln a
750
tcagtggcca cgaacatttt ggtcacgaga tggagtccag gtgtcgtcct cactcccttg 48559
ctgaccttct ctcacttggg ccgtgtgtct ctgggccctc agtttcccta tctgtaaagt 48619
gggtctaata acagttcttg ccctctttgc aaggattaaa tgggccaaat catatgaggg 48679
gccaggtcct tcaggctcct ggttcccaaa gtcagccacg caccgtgtgg gtcccaaaat 48739
tttatcaagg cacattcgtt gcctcagctt caggcatctg cccaaaaagg ccaggactaa 48799
ggcaaggaga gggagggatt cctcagtact cagcttttca cagaggctcc aaaaggctaa 48859
ggaatccagt aacgttttaa cacaatttta caattttttt ttttgagacg gagttttgct 48919
cttgttgccc aggctggagt gcagtggcac gatctcggct cactgcaacc tctggctccc 48979
gggttcaagc gattctcctg cctcagtctc ccgagtagct gggattacag gcatgcgcca 49039
ccacgctcgg ctaattttgt atttttagta cagaaggggc ttctctgttg gtcaggctgg 49099
tcgtgaactc tcaacctcag gtgagccacc cgcctgagcc tcccaaagtg ctgggattac 49159
aggtgtgagc caccacgcct ggcctttttt ttgagacaga gtctcgctct cgcccatgct 49219
gtactgcagt gacgcagtct gggctcactg taacctccgc ttcccaggtt caagtgattc 49279
ttctgccgca gcctcccatg tagagtagct gggattacag gcacccgcca ccatgcctgg 49339
ctaattcttg catttttagt agagatgggg tttcacagtg ttggccaggc tggtctcaaa 49399
cttctgacct caagtcatct gcctgccttg gccctgccaa agtgctggga ttatagatgt 49459
gagccaccgc gcctggccta cagtttattc tttggtggct cacacctgta atctcagcac 49519
tttgggaggc caaggtggga gaatggcttg agcccaggag ttcaagtcca gcctgggcaa 49579
catagcaaga ccctatctct actacaaaat aaataataaa taaactaatt ttttttcttt 49639
taaaacccaa ctattcaaca tggcaatgca atatattaaa aaaatttttt ttttctttga 49699
aacggagtct ctcactgtca cccgggctgg agtgcagtgt cgccatcttg gctcactgca 49759
acctccgcct cccaggtcca agtgattctc ctgcttcagc ctcccgagta gctgggatta 49819
caggcaccca ccaccatacc cagctaatat ttttgtattt ttagtagaga tggggtttca 49879
ctatgttggg caggctggtc tggaactcct gacctcgtga tctgcccgag gatcggcggc 49939
ctcccaaagt gctggggatt gcaggcatga gccaccgtgc ccagccaaaa cttttttatt 49999
tttatttttt tgggacacgg tctcactgtg taccccagac tggagtgata gagtgctgtc 50059
atggctcact gcagcctcaa cctccctggg ctcaggtgat cttcctgctt cagtctccca 50119
ggtagctggg actacaggca tgagccacca cacccagcta atttttgaat ttttttgtag 50179
agacagggtt tcaccttgtg gcccagactt gtctctaact ccagggctca agcgatctgc 50239
ccaccttggc ctcccaaagt gctgagatta atgcaattta aaaaattttt tggccaggcc 50299
tggtggctca tgcctgtatt cacaacacct tgggaggcaa aggtgggcag atcacttgag 50359
gtcaggagtt cgagactagc ctggccaaca tggtgaaacc ccctgtctac taaaaaaata 50419
caaaaattac ctgggcacag tggtgggtgc ctgtaatccc agctacttgg gatgctgagg 50479
gtggagaatt gcttgaacct gggaggcaga agttgcagta agccaagatc atgccactgg 50539
actccagcct cagtgacaga gcaaaactct gtctccaaaa aaattgtttt tttttttttt 50599
ttttcaaatc atcacactac agccaaggcc tggccactta cttttgtaaa taaagtttta 50659
ttggagccag tggaccagtg aggccgaatc ttgcaggtgt aagatcacag tctatccttg 50719
aaaattttga tattttgttc attgggtggt ttttcattaa tttaaatttt aaaaaataac 50779
atattaaagg ctggtgtgga ggtgcacgcc tgcagtccta gctactccca gaggctgagg 50839
cgggagactt gcttgagccc aagagttgaa gtccagcctg ggcaacatag cgagaccccc 50899
atctctaaaa ataaaaataa tgcattagaa tattattgga ttcctgggca gggcacagtg 50959
gctcacacct gtaatcccag cactttggga ggctgaggtg ggtggatcac ctgaggtcag 51019
gagtttgaga ccagcctggc caacatggtg aaaccccgtc tctactaaaa atacaaaaat 51079
tagccaggcg tggtggcagg tgcctgtaat cccagctact cgggaggctg aagcacgaga 51139
atcgcttgaa tccaggaggc ggaggttgca gtgagctgag attgcgccat tgcactccag 51199
cctggaggac aagagtgaaa ctccattccc ctctgcaaag aaaaggaata ttatcagatt 51259
cctaagcttt ttggctcccc ctttagtttg ggggctgggg tggtgagtgt ctgacctggc 51319
ctcactgtcc tccctggatg tgatgagacc caggtgtggg tcaggatgtc attcgtttgt 51379
ccaccagagg gcgcccaaac tgctttgagc tgctgggaaa tggtgctcct agacttttag 51439
caaacaaaca aaaaaaaatg gcacatcggc aaatttcaga ccattctttt tttttttttt 51499
tttggttcca gagtagctga aatctttgtt cagttacaag caggataaaa tggaaactgc 51559
ctgggagagg ctgagaaacc ttcttgcttg ggggaggtgg ggcactgcta gaattaatcg 51619
cttcacagac cagcccatcc aggactcctc aaatttggca aaaaagccat tcattcattc 51579
attcatttat gtagagacga gggggatctg gctatattgc ctagattggt ctcaaattcc 51739
tggcctcaag tgatcctcct gccttggtct actaatgtgc tgcgattaca ggcatgagcc 51799
accgtgccta gctctagtgg acttgaaatg ttgccttgcc cagggccctt atgttgaatg 51859
gcccaggtcc acttgtatgg ttctgtacca aggttaaccc catcccataa tgcctgggac 51919
agttgatgca ggacaatcag cttctgtgcc attcaacctc aggactgagc atgctgggca 51979
ttgtggggtc cgaaggtggc tcccctgtcc ccttcaaaat accctctttt tcttttcttc 52039
tttttttttt tttttttttt ttgagacgaa gtcttgctct gttgccccag ctagagtgca 52099
gtggtgcgat ctcagctccc cgcaacctct gcttcccggg ttcaggcgat tctcctgcct 52159
cagcctcctg agtagctggg attacaggtg cccaccgcca cagctggcta atttttgtat 52219
ttttagtaga gacagggttt caccgtgttg gccaggctgg tcttgaactc ctgacctcag 52279
gcaacctgcc cacctcagcc tcccaaagtg ctgggattac aggtttgagc cactgggcct 52339
ggcctttttt tttttttttt gagagggagt ctcactctgt tgcccaggct ggagtgcaat 52399
ggcgcgatct tgactcactg caactccatt tcccgggttc aagtgattct cctccctcag 52459
cctcccaagt agctgggatt acaggtgcat gccaccacgg ccagctaatt ttgtattttt 52519
agtagagaca gggtttcact atgttgatca tgctggtctc aaactcctga ccttaggtga 52579
tctgcccgcc ttagcctccc aaagtgttgg gattacaggt gtgagccacc gcgcccagac 52639
caaaatatgc tcattttaat aaaatgcaca agtaggttga caagaatttc acctgcaacc 52699
ttgtcaacca cctagaataa aagcctctgc agccctcccc taaagactca tcaatgtgag 52759
gctcaagaac cttcttaggc tgggctcggt ggctcatttc tgtaatccct gcactttgga 52819
aggctgaggc aggaggatct cttgaggcca ggagttcaag acaagcctgg gcaacatagc 52879
cagacctctg tttctatccc ccacaaaaag aaccttctta aaccggaatt gagtcctaca 52939
acctcgataa ctcacaaata agcccgtgtg gcctctcaca gacttgggaa gttctccaag 52999
tgtccaggga gatgtgccag gcgctttcct gccgtgacca ccgtcctctg cctgctccat 53059
ttcttggtgg ccttccttta gacctgggcc tcactcttgc ttctctcctg cag ct ctg 53117
la leu
750
ggc gac gtt gct ggc aga gga aat gag aag aag ccc agt agc gtg agg 53165
gly asp val ala gly arg gly asn glu lys lys pro ser ser val arg
755 760 765
gct ctg tcc att gtc ctc ccc atc g gtaagcgcgg gccggtcccc 53210
ala leu set ile val leu pro ile v
770 775
cagcgtcccc caggtcacag cctcccgcta tgtgacctcg tgcctggctg gttgggcctg 53270
ttcacttttt ctcctggaca gggaacagcc ccactggtgt cctttatcac ccccacggcc 53330
tctcctggct tggggctgac agtgacaaga tcagacagct aaggggtcag atggaggatg 53390
tggagctggg tcccgtgctg tggaatagcc tcaccgagat ttgagtgcct tctggggaac 53450
tggttccctt gcagggggct gtgtggagag gcgcgctctc cctgcctcac ccatgctcat 53510
cctaactcgg ttaccatcac atctcttttt tctttttttc ttaaatttta agaaaaaaga 53570
aatttaattt ttttgagaga cagagtcttg ctctgtcacc caggctggag tgcagtggca 53630
ccatcatgcc tcgctgcagc ctcaatgtct gggctcaagc gatcctccca cctcagcctc 53690
ctgagtagct ggtgcaagcc actatacccc acttcctatt tcttaaaaag tcacagccct 53750
gtgtgtggct aatcctggac agaaatctag aagaagtcag ctacttctgg ggcgtggctc 53810
acccagtggg cttcaggtta gatatttctt atacttatga ggctgggtgt ggtggcttat 53870
gcctgtaatc ccagcacttt gggaggctga agtgggtgga ttgcttgggc tcaggagttc 53930
gagaccaacc tgggcaacat ggcgaaaccc tgtttctaga aaaggtacaa aaattagctg 53990
ggcaggtggc acgtgcctgt ggtaccagct acttgagggc ctgaggcagg aggatcgctt 54050
gaacctggga ggtcgaggtt gcagtgaact gagatcatgt cactgcactc cagcctggtg 54110
acagagcaag accccgtctc aaaaaaaaaa aaagaaagaa aaaaattctt atgcatagat 54170
ttgcctcttt tctgtttgtt tgttttgaga tggagtctcg ctctgtcgcc caggctggag 54230
tacagtggct caacctcggc tcactgcaac ctctgcctcc cgggttcaag caattctcct 54290
gcctcagcct cctgagtagc tgggactaca gcgcccgcca ccatgcccag ctaatttttg 54350
tatttttagt agagactgac tgggtttcat catgttggcc aggctggtct cgaactcttg 54410
acctcatgat ccgcccgcct cagcctccca aaatgctggg attacaggcg tgagccacca 54470
ggcccaggcc gcaaggcgat ctctaaacaa acataaaaga ccaggagtca aggttatggt 54530
acgatgcccg tgttttcact ccagccacgg agctgggtct ctggtctcgg gggcagctgt 54590
gtgacagagc gtgcctctcc ctacag tg ctc ctc gtc ttc ctt tgc ctg ggg 54642
al leu leu val phe leu cys leu gly
780
gtc ttc ctt cta tgg aag aac tgg cgg ctt aag aac atc aac agc atc 54690
val phe leu leu trp lys asn trp arg leu lys asn ile asn set ile
785 790 795 800
aac ttt gac aac ccc gtc tat cag aag acc aca gag gat gag gtc cac 54738
asn phe asp asn pro val tyr gln lys thr thr glu asp glu val his
805 810 815
att tgc cac aac cag gac ggc tac agc tac ccc tcg gtgagtgacc 54784
ile cys his asn gln asp gly tyr ser tyr pro ser
820 825
ctctctagaa agccagagcc catggcggcc ccctcccagc tggaggcata tgatcctcaa 54844
gggaccaggc cgaggcttcc ccagccctcc agatcgagga cagcattagg tgaatgcttc 54904
tgtgcgctca ttcagaatgt cagcggacaa tggccttggt ggtgtagagg aatgttggat 54964
aagcaaatag agagctccat cagatggtga cagggcaaag aaagtcaaaa ggagttcaga 55024
ggccgggcgc ggtggctcat gcctgtaatc ccaggacttt gggaggccga ggctggcgga 55084
tcacctgaag tcaggagttt gagaccagct tggccatcat gacaaaaccc cgtctctatt 55144
aaaaatacaa aaaattagcc aggcgtggga gtgggcgcct gtaatcccag ctactcggga 55204
ggccgaggta gaaaaatcgc ttgaacctag gaggcagagg ttgcagtgag ccgagatcgc 55264
gccactgcat tccagcccgg gaggcaagag caaaactcca tctcaaaaaa aaaaaaaaaa 55324
ggagttcaga ggcccggcat ggtggttcac acatgtgatc ccagaacttg gggaggttga 55384
ggcaggagaa tcacctgagc tcagagttca agaccagcct gggcagcaca gcaagacccc 55444
atctctgcaa aaaataaaaa tttagcccag tgtggtgatg agcgcctagt tccagctact 55504
agggaggcta aggcaggagg attgcttgag gctaaggtag gagattgaga ctgcagtgac 55564
ttgtgattgc gtcactgcgc tccagcctgg gtgacagagc aagcccttgt ctcttaaaaa 55624
aaaaaaaaaa ttcaaagaag ggtttccaga gggccaggag ggaggaaggg agaggaggtg 55684
ttttattttt ttgcttttat tttttatttt gagacagagt ctctctctgt cacccaggtt 55744
ggagtgcagt gctgtgatct tggctcactg caacttctgc ctcctgggtt caagcaattc 55804
ttatgcctca gcctcagcct cctgagtagc tgggattaca acactatgcc cgggtaattt 55864
ttgtattttt agtagagacg aggtttcgcc atgttgccca gactggtctc gaactcctga 55924
cctcaagtga tccacccgcc ttggcctccc cacgtgctgg gattgcaggc gtgagccact 55984
gcgcccgcct tgatctttac acaaggggtt tagggtaggt agccttctct gaaccaggag 56044
aacagcctgt gcgaaggccc tgaggctgga ccgtgcctgt tgggtttgag gccgttgtag 56104
ctggagcaaa cagagagagg ggtaaaaagg caggaggcta ccaggcaggt tgtgcagagc 56164
cttgtgggcc actggggagg actttggctt ttgccctgag agcggtggga agtgactgaa 56224
tccggtactc accgtctccc tctggcggct cctgggggaa catgcttggg gatcaggctg 56284
ggggaggctg ccaggcccag gaggtgagaa gtaggtggcc tccagccgtg tttcctgaat 56344
gctggactga tagtttccgc tgtttaccat ttgttggcag aga cag atg gtc agt 56399
arg gln met val ser
830
ctg gag gat gac gtg gcg tgaacatctg cctggagtcc cgtccctgcc 56447
leu glu asp asp val ala
835 839
cagaaccctt cctgagacct cgccggcctt gttttattca aagacagaga agaccaaagc 56507
attgcctgcc agagctttgt tttatatatt tattcatctg ggaggcagaa caggcttcgg 56567
acagtgccca tgcaatggct tgggttggga ttttggtttc ttcctttcct cgtgaaggat 56627
aagagaaaca ggcccggggg gaccaggatg acacctccat ttctctccag gaagttttga 56687
gtttctctcc accgtgacac aatcctcaaa catggaagat gaaaggggag gggatgtcag 56747
gcccagagaa gcaagtggct ttcaacacac aacagcagat ggcaccaacg ggaccccctg 56807
gccctgcctc atccaccaat ctctaagcca aacccctaaa ctcaggagtc aacgtgttta 56867
cctcttctat gcaagccttg ctagacagcc aggttagcct ttgccctgtc acccccgaat 56927
catgacccac ccagtgtctt tcgaggtggg tttgtacctt ccttaagcca ggaaagggat 56987
tcatggcgtc ggaaatgatc tggctgaatc cgtggtggca ccgagaccaa actcattcac 57047
caaatgatgc cacttcccag aggcagagcc tgagtcactg gtcaccctta atatttatta 57107
agtgcctgag acacccggtt accttggccg tgaggacacg tggcctgcac ccaggtgtgg 57167
ctgtcaggac accagcctgg tgcccatcct cccgacccct acccacttcc attcccgtgg 57227
tctccttgca ctttctcagt tcagagttgt acactgtgta catttggcat ttgtgttatt 57287
attttgcact gttttctgtc gtgtgtgttg ggatgggatc ccaggccagg gaaagcccgt 57347
gtcaatgaat gccggggaca gagaggggca ggttgaccgg gacttcaaag ccgtgatcgt 57404
gaatatcgag aactgccatt gtcgtcttta tgtccgccca cctagtgctt ccacttctat 57467
gcaaatgcct ccaagccatt cacttcccca atcttgtcgt tgatgggtat gtgtttaaaa 57527
catgcacggt gaggccgggc gcagtggctc acgcctgtaa tcccagcact ttgggaggcc 57587
gaggcgggtg gatcatgagg tcaggagatc gagaccatcc tggctaacac gtgaaacccc 57647
gtctctacta aaaatacaaa aaattagccg ggcgtggtgg cgggcacctg tagtcccagc 57707
tactcgggag gctgaggcag gagaatggtg tgaacccggg aagcggagct tgcagtgagc 57767
cgagattgcg ccactgcagt ccgcagtctg gcctgggcga cagagcgaga ctccgtctca 57827
aaaaaaaaaa acaaaaaaaa accatgcatg gtgcatcagc agcccatggc ctctggccag 57887
gcatggcgag gctgaggtgg gaggatggtt tgagctcagg catttgaggc tgtcgtgagc 57947
tatgattatg ccactgcttt ccagcctggg caacatagta agaccccatc tcttaaaaaa 58007
tgaatttggc cagacacagg tgcctcacgc ctgtaatccc agcactttgg gaggctgagc 58067
tggatcactt gagttcagga gttggagacc aggcctgagc aacaaagcga gatcccatct 58127
ctacaaaaac caaaaagtta aaaatcagct gggtacggtg gcacgtgcct gtgatcccag 58187
ctacttggga ggctgaggca ggaggatcgc ctgagcccag gaggtggagg ttgcagtgag 58247
ccatgatcga gccactgcac tccagcctgg gcaacagatg aagaccctat ttcagaaata 58307
caactataaa aaaataaata aatcctccag tctggatcgt ttgacgggac ttcaggttct 58367
ttctgaaatc gccgtgttac tgttgcactg atgtccggag agacagtgac agcctccgtc 58427
agactcccgc gtgaagatgt cacaagggat tggcaattgt ccccagggac aaaacactgt 58487
gtccccccca gtgcagggaa ccgtgataag cctttctggt ttcggagcac gtaaatgcgt 58547
ccctgtacag atagtgggga ttttttgtta tgtttgcact ttgtatattg gttgaaactg 58607
ttatcactta tatatatata tatacacaca tatatataaa atctatttat ttttgcaaac 58667
cctggttgct gtatttgttc agtgactatt ctcggggccc tgtgtagggg gttattgcct 58727
ctgaaatgcc tcttctttat gtacaaagat tatttgcacg aactggactg tgtgcaacgc 58787
tttttgggag aatgatgtcc ccgttgtatg tatgagtggc ttctgggaga tgggtgtcac 58847
tttttaaacc actgtataga aggtttttgt agcctgaatg tcttactgtg atcaattaaa 58907
tttcttaaat gaaccaattt gtctaaactc gatgcacgtt cttctgttcg cgcgcttctt 58967
tttgtttttt tttttttcct gagatggagc ctggctctgt cacccctggc tggagtgcag 59027
tggcatgatc tcggcttact gcaagctccg cctcccaggt tcaagcaatt ctcctgcctc 59087
agcctcccta gtagctagga ttacaggtga gtgccaccac gcctggccaa tttttttttt 59147
tttttttttt ttgagacaga gtctcgctct gtcacccagg ctggagtgca gtggtgtgat 59207
ctcggctcac tgcaagctct gcctcccagg ttaatgccat tctcctgtct cagcctcctg 59267
agtagctggg gccacaggcg cctgccacca cgcccggcta attttttttt gtacttcttt 59327
tagtacagac ggggtttcac catgttagcc aggatggtct cgatctcctg accttgtgat 59387
ccacctgctt cggcctccca aagtgctgag attacaggcg tgagccaccg cgggtggcca 59447
acgctaattt ttttgttttt ttagatggag tcttgctctg tcgcccaggc tggagtgcag 59507
tggcgtgatc tctgcctact gcaagctccg cctcccgggt tcatgccatt ctcctgcctc 59567
agcctcctga gtaactggga ctacaggcac ccgccaccac gcccggctaa ttttttgtat 59627
ttttagtaga gacagggttt caccgtgtta gccaggatgg tcttgatctc ctgaccttgt 59687
gatccacccg tctcggcctc ccaaagtgct gggattagag gtgtgagcca ccacacctgg 59747
cctagcctgg ctaatttttg tatttttggt agagacgggg tttcaccatg ttggtcaggc 59807
tggtcttgaa cttctgacct caggtaatct gcctgcctca gtctcccaaa gtgctgggat 59867
tacaggtgtg agccaccgcg cctggcctca cttccttctg tcatctgttt gtggattgga 59927
ctccccagga gaaggaccca gaaggggaag actcccagaa ctccgggcaa gatgcaatct 59987
ccgtgggctg cca 60000
<210>SEQ ID NO.:2
<211>24
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex1F
<400>
cacattgaaa tgctgtaaat gacg
<210>SEQ ID NO.:3
<211>24
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex1R
<400>
ctattctggc gcctggagca agcc
<210>SEQ ID NO.:4
<211>24
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex2F
<400>
ttgagagacc ctttctcctt ttcc
<210>SEQ ID NO.:5
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex2R
<400>
gcatatcatg cccaaagggg
<210>SEQ ID NO.:6
<211>24
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex3F
<400>
ttcctttgag tgacagttca atcc
<210>SEQ ID NO.:7
<211>24
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex3R
<400>
gataggctca atagcaaagg cagg
<210>SEQ ID NO.:8
<211>24
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Mut191-2F
<400>
acagttcaat cctgtctctt ctct
<210>SEQ ID NO.:9
<211>10
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex4AF
<400>
gtggtctcgg ccatccatcc
<210>SEQ ID NO.:10
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex4ARF
<400>
agccatcttc gcagtcgggg
<210>SEQ ID NO.:11
<211>12
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Mut 509insCR
<400>
cgagccatct tcgcagtcgg ag
<210>SEQ ID NO.:12
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex4BF
<400>
cccccagctg tgggcctgcg
<210>SEQ ID NO.:13
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex4BR
<400>
cgcccccacc ctgccccgcc
<210>SEQ ID NO.:14
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex6F
<400>
tcctccttcc tctctctggc
<210>SEQ ID NO.:15
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex6R
<400>
tctgcaagcc gcctgcaccg
<210>SEQ ID NO.:16
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>MutC255GF
<400>
ctctggctctc acagtgacac gc
<210>SEQ ID NO.:17
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Mut E291XR
<400>
gcaccgagac tcaccgcaat
<210>SEQ ID NO.:18
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex7F
<400>
ggcgaaggga tgggtagggg
<210>SEQ ID NO.:19
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex7R
<400>
gttgccatgt caggaagcgc
<210>SEQ ID NO.:20
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex9F
<400>
cccctgacct cgctccccgg
<210>SEQ ID NO.:21
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex9R
<400>
gctgcaggca ggggcgacgc
<210>SEQ ID NO.:22
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex10F
<400>
atgcccttct ctcctcctgc
<210>SEQ ID NO.:23
<211>24
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex10R
<400>
agccctcagc gtcgtggata
<210>SEQ ID NO.:24
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Mut1432delGF
<400>
gggacatcca ggcccccgcc
<210>SEQ ID NO.:25
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex11F
<400>
tcctcccccg ccctccagcc
<210>SEQ ID NO.:26
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex11R
<400>
gctgggacgg ctgtcctgcg
<210>SEQ ID NO.:27
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex13F
<400>
gtcatcttcc ttgct gcctg
<210>SEQ ID NO.:28
<211>30
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex13R
<400>
ttccacaagg aggtttcaag gttggggggg
<210>SEQ ID NO.:29
<211>13
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>MutH635NR
<400>
acctcttggc tgggtcaggt tct
<210>SEQ ID NO.:30
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex14F
<400>
aaatttctgg aatcttctgg
<210>SEQ ID NO.:31
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex14R
<400>
gcagagagag gctcaggagg
<210>SEQ ID NO.:32
<211>22
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex15F
<400>
gaagggcctg cagcacgtgg ca
<210>SEQ ID NO.:33
<211>19
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex15R
<400>
tagggagggc ccagtcttt
<210>SEQ ID NO.:34
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex17F
<400>
gggtctctgg tctcgggggc
<210>SEQ ID NO.:35
<211>22
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<223>Ex17R
<400>
ggctctggct ttctagagag gg
<210>SEQ ID NO.:36
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cgggtcggga cactgcctgg cag
<210>SEQ ID NO.:37
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cgggtcggga ccctgcctgg cag
<210>SEQ ID NO.:38
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctgccaggca gtgtcccgac ccg
<210>SEQ ID NO.:39
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctgccaggca gggtcccgac ccg
<210>SEQ ID NO.:40
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
atgcatttcc cgtcttggca ctg
<210>SEQ ID NO.:41
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gatgcatttc cctcttggca ctg
<210>SEQ ID NO.:42
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gatgcatttc ccgtcttggc actgg
<210>SEQ ID NO.:43
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
agatgcattt ccctcttggc actgg
<210>SEQ ID NO.:44
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgtctcttct gtagtgtctg tcacc
<210>SEQ ID NO.:45
<211>25
<12>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gtctcttctg tctgtgtctg tcacc
<210>SEQ ID NO.:46
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctgtctcttc tgtagtgtct gtcacct
<210>SEQ ID NO.:47
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgtctcttct gtctgtgtct gtcacct
<210>SEQ ID NO.:48
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ggccgtgtca accgctgcat tcc
<210>SEQ ID NO.:49
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gccgtgtcaa ccgctgcatt c
<210>SEQ ID NO.:50
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
aggaatgcag cgtttgacac ggccc
<210>SEQ ID NO.:51
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gaggaatgca gcgtttgaca cggcccc
<210>SEQ ID NO.:52
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
agctgtgggg gccgtgtcaa ccg
<210>SEQ ID NO.:53
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
agctgtgggg gcgtgtcaac cgc
<210>SEQ ID NO.:54
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cggttgacac ggcccccaca gct
<210>SEQ ID NO.:55
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gcggttgaca cgcccccaca gct
<210>SEQ ID NO.:56
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
caaggctgtc gtaagtgtgg c
<210>SEQ ID NO.:57
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gcaaggctgt cgtaagtgtg gcc
<210>SEQ ID NO.:58
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
caaggctgtc gttaagtgtg gcc
<210>SEQ ID NO.:59
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
aaggctgtcg ttaagtgtgg c
<210>SEQ ID NO.:60
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gacaacgacc ccgactgcga agatg
<210>SEQ ID NO.:61
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gacaacgacc cccgactgcg aagat
<210>SEQ ID NO.:62
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
acaacgaccc cgactgcgaa gat
<210>SEQ ID NO.:63
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
acaacgaccc ccgactgcga aga
<210>SEQ ID NO.:64
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gcggccactc atccgagcca tct
<210>SEQ ID NO.:65
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gcggccactc acccgagcca tct
<210>SEQ ID NO.:66
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgcggccact catccgagcc atctt
<210>SEQ ID NO.:67
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgcggccact cacccgagcc atctt
<210>SEQ ID NO.:68
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ccagctggcg ctgtgatggt ggc
<210>SEQ ID NO.:69
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ccagctggcg ccgtgatggt ggc
<210>SEQ ID NO.:70
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tccagctggc gctgtgatgg tggcc
<210>SEQ ID NO.:71
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tccagctggc gccgtgatgg tggcc
<210>SEQ ID NO.:72
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctgcaaggac aaatctgacg aggaa
<210>SEQ ID NO.:73
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctgcaaggac aactgcggta tgggc
<210>SEQ ID NO.:74
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
actgcaagga caaatctgac gaggaaa
<210>SEQ ID NO.:75
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
actgcaagga caactgcggt atgggcg
<210>SEQ ID NO.:76
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
caaatctgac gaggaaaact gcggt
<210>SEQ ID NO.:77
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
caaatctgac gacaaatctg acgag
<210>SEQ ID NO.:78
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
acaaatctga cgaggaaaac tgcggta
<210>SEQ ID NO.:79
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
acaaatctga cgacaaatct gacgagg
<210>SEQ ID NO.:80
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gggtccctcg cagagtgtca ctg
<210>SEQ ID NO.:81
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gggtccctcg ccgagtgtca ctg
<210>SEQ ID NO.:82
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgggtccctc gcagagtgtc actgt
<210>SEQ ID NO.:83
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgggtccctc gccgagtgtc actgt
<210>SEQ ID NO.:84
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
aacccatcaa agagtgcggt gag
<210>SEQ ID NO.:85
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
aacccatcaa atagtgcggt gag
<210>SEQ ID NO.:86
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gaacccatca aagagtgcgg tgagt
<210>SEQ ID NO.:87
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gaacccatcaaatagtgcgg tgagt
<210>SEQ ID NO.:88
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tcactctcgg gcccctacca
<210>SEQ ID NO.:89
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tcactctcgg acccctaccc a
<210>SEQ ID NO.:90
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cactctcggg cccctaccc
<210>SEQ ID NO.:91
<211>19
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cactctcgga cccctaccc
<210>SEQ ID NO.:92
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
acgagtgcct gtgcgccgac ggctt
<210>SEQ ID NO.:93
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
acgagtgcct gtacgccgac ggctt
<210>SEQ ID NO.:94
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cgagtgcctg tgcgccgacg gct
<210>SEQ ID NO.:95
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cgagtgcctg tacgccgacg gct
<210>SEQ ID NO.:96
<211>24
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gcgaagatgc gaaggtgatt ccgg
<210>SEQ ID NO.:97
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ggcccagcga agatttccgg gtggg
<210>SEQ ID NO.:98
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
agcgaagatg cgaaggtgat ttccggg
<210>SEQ ID NO.:99
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tggcccagcg aagatttccg ggtggga
<210>SEQ ID NO.:100
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgaagaagag gtaggcgatg g
<210>SEQ ID NO.:101
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cggttggtga agacgatgga g
<210>SEQ ID NO.:102
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gtgaagaaga ggtaggcgat gga
<210>SEQ ID NO.:103
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ccggttggtg aagacgatgg agc
<210>SEQ ID NO.:104
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctccatcgcc tacctcttct tcacc
<210>SEQ ID NO.:105
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctccatcgcc taactcttct tcacc
<210>SEQ ID NO.:106
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gctccatcgc ctacctcttc ttcacca
<210>SEQ ID NO.:107
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gctccatcgc ctaactcttc ttcacca
<210>SEQ ID NO.:108
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgccggttgg tgaagaagag gtagg
<210>SEQ ID NO.:109
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gtgccggttg gtgagaagag gtagg
<210>SEQ ID NO.:110
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gtgccggttg gtgaagaaga ggtaggc
<210>SEQ ID NO.:111
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cgtgccggtt ggtgagaaga ggtaggc
<210>SEQ ID NO.:112
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
caatagaatc tactggtctg acctg
<210>SEQ ID NO.:113
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
caatagaatc tagtggtctg acctg
<210>SEQ ID NO.:114
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gcaatagaat ctactggtct gacctgt
<210>SEQ ID NO.:115
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gcaatagaat ctagtggtct gacctgt
<210>SEQ ID NO.:116
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ggcccccgac gggctggctg tggac
<210>SEQ IDNO.:117
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ggcccccgac ggctggctgt ggact
<210>SEQ ID NO.:118
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gtccacagcc agcccgtcgg gggcc
<210>SEQ ID NO.:119
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
agtccacagc cagccgtcgg gggcc
<210>SEQ ID NO.:120
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gcgggagttc cccagtcagt ccagt
<210>SEQ ID NO.:121
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gcgggagttc cctagtcagt ccagt
<210>SEQ ID NO.:122
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cgggagttcc ccagt cagtc cag
<210>SEQ ID NO.:123
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cgggagttcc ctagtcagtc cag
<210>SEQ ID NO.:124
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctgtccccag aggatatggt tctct
<210>SEQ ID NO.:125
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctgtccccag agaatatggt tctct
<210>SEQ ID NO.:126
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgtccccaga ggatatggtt ctc
<210>SEQ ID NO.:127
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgtccccaga gaatatggtt ctc
<210>SEQ ID NO.:128
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tggttctctt ccacaacctc acc
<210>SEQ ID NO.:129
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tggttctctt caacaacctc acc
<210>SEQ ID NO.:130
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
atggttctct tccacaacct caccc
<210>SEQ ID NO.:131
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
atggttctct tcaacaacct caccc
<210>SEQ ID NO.:132
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gctgaccttt agcctgacgg tggat
<210>SEQ ID NO.:133
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
agctgacctt tagctgacgg tggat
<210>SEQ ID NO.:134
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
agctgacctt tagcctgacg gtggatg
<210>SEQ ID NO.:135
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gagctgacct ttagctgacg gtggatg
<210>SEQ ID NO.:136
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgctcct cgt ctt cctttgc ctg
<210>SEQ ID NO.:137
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgctcctcgg ggtctttgcc tgg
<210>SEQ ID NO.:138
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gtgctcctcg tcttcctttg cctgg
<210>SEQ ID NO.:139
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gtgctcct cg gggtctttgc ctggg
<210>SEQ ID NO.:140
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gactcacagc acgtctcctg ggact
<210>SEQ ID NO.:141
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gactcacagc acatctcctg ggact
<210>SEQ ID NO.:142
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
actcacagca cgtctcctgg gac
<210>SEQ ID NO.:143
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
actcacagca catctcctgg gac
<210>SEQ ID NO.:144
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ccatcgtggc agcgaaactc gtc
<210>SEQ ID NO.:145
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
atgcacttcc cacgtcctgg gag
<210>SEQ ID NO.:146
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
catcgtggca gcgaaactcg t
<210>SEQ ID NO.:147
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgcacttccc acgtcctggg a
<210>SEQ ID NO.:148
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸Ex8F
<400>
cattggggaa gagcctcccc
<210>SEQ ID NO.:149
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸Ex8R
<400>
gcctgcaagg ggtgaggccg
<210>SEQ ID NO.:150
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸Ex12F
<400>
actggcatca gcacgtgacc
<210>SEQ ID NO.:151
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸Ex12R
<400>
cgtgtgtcta tccggccacc
<210>SEQ ID NO.:152
<211>20
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸Ex16F
<400>
gcgctttcct gccgtgacca
<210>SEQ ID NO.:153
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸Ex16R
<400>
cctgtccagg agaaaaagtg aac
<210>SEQ ID NO.:154
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸Mutl771TF
<400>
cagtagcgtg agggctctgt caa
<210>SEQ ID NO.:155
<211>19
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸Mut2389+4A>GR
<400>
ctgggggacc ggccggcgc
<210>SEQ ID NO.:156
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgtcaagctg ggtgctgagg cag
<210>SEQ ID NO.:157
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgtcaagctg gttgctgagg cag
<210>SEQ ID NO.:158
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gtcaagctgg gtgctgaggc a
<210>SEQ ID NO.:159
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gtcaagctgg ttgctgaggc a
<210>SEQ ID NO.:160
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ggtccctcgc agagtgtcac tgt
<210>SEQ ID NO.:161
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ggtccctcgc actgtgagag cca
<210>SEQ ID NO.:162
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gtccctcgca gagtgtcact g
<210>SEQ ID NO.:163
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gtccctcgca ctgtgagagc c
<210>SEQ ID NO.:164
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ccgtcggggg cctggatgtc t
<210>SEQ ID NO.:165
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cccgtcgggg tctggatgtc t
<210>SEQ ID NO.:166
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cccgtcgggg gcctggatgt ctc
<210>SEQ ID NO.:167
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gcccgtcggg gtctggatgt ctc
<210>SEQ ID NO.:168
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ccggttggtg aagaagaggt aggcg
<210>SEQ ID NO.:169
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cggtt ggtga agaaagaggt aggcg
<210>SEQ ID NO.:170
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gccggttggt gaagaagagg taggcga
<210>SEQIDNO.:171
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ccggttggtg aagaaagagg taggcga
<210>SEQ ID NO.:172
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
actggaagct ggcgggacca cag
<210>SEQ ID NO.:173
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gcactggaag ctgggaccac agg
<210>SEQ ID NO.:174
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctgtggtccc gccagcttcc agt
<210>SEQ ID NO.:175
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cctgtggtcc cagcttccag tgc
<210>SEQ ID NO.:176
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gcgggagttc cccagtcagt c
<210>SEQ ID NO.:177
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gcgggagttc accagtcagt c
<210>SEQ ID NO.:178
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ggcgggagtt ccccagtcag tcc
<210>SEQ ID NO.:179
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ggcgggagtt caccagtcag tcc
<210>SEQ ID NO.:180
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ccccat cggt aagcgcgggc cgg
<210>SEQ ID NO.:181
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ccccatcggt aggcgcgggc cgg
<210>SEQ ID NO.:182
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ccggcccgcg cttaccgatg ggg
<210>SEQ ID NO.:183
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ccggcccgcg cctaccgatg ggg
<210>SEQ ID NO.:184
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gaaaagaggc tggcccaccc ctt
<210>SEQ ID NO.:185
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gaaaagaggc ttctccttgg ccg
<210>SEQ ID NO.:186
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
aaaagaggct ggcccacccc t
<210>SEQ IDNO.:187
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
aaaagaggct tctccttggc c
<210>SEQ ID NO.:188
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cgccttcccg tgctcaccca cagcc
<210>SEQ ID NO.:189
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cgccttcccg tgttcaccca cagcc
<210>SEQ ID NO.:190
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ggctgtgggt gagcacggga aggcg
<210>SEQ ID NO.:191
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ggctgtgggt gaccacggga aggcg
<210>SEQ ID NO.:192
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
actatctcca ccgtggtgag cccag
<210>SEQ ID NO.:193
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
actatct cca ccatggtgag cccag
<210>SEQ ID NO.:194
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctgggctcac cacggtggag atagt
<210>SEQ ID NO.:195
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctgggctcac catggtggag atagt
<210>SEQ ID NO.:196
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gggctctgtc cattgtcctc cccat
<210>SEQ ID NO.:197
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gggctctgtc cactgtcctc cccat
<210>SEQ ID NO.:198
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
atggggagga caatggacag agccc
<210>SEQ ID NO.:199
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
atggggagga cagtggacag agccc
<210>SEQ ID NO.:200
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgcaacatgg ctagagactg ccggg
<210>SEQ ID NO.:201
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgcaacatgg ctggagactg ccggg
<210>SEQ ID NO.:202
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gcaacatggc tagagactgc cgg
<210>SEQ ID NO.:203
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gcaacatggc tggagactgc cgg
<210>SEQ ID NO.:204
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgctgatgac ggtgtcatag gaa
<210>SEQ ID NO.:205
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgctgatgac gatgtcatag gaa
<210>SEQ ID NO.:206
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gctgatgacg gtgtcatagg a
<210>SEQ ID NO.:207
<211>21
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gctgatgacg atgtcatagg a
<210>SEQ ID NO.:208
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tccaaacttc actccatctc aag
<210>SEQ ID NO.:209
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tccaaacttc agtccatctc aag
<210>SEQ ID NO.:210
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cttgagatgg agtgaagttt gga
<210>SEQ ID NO.:211
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cttgagatgg actgaagttt gga
<210>SEQ ID NO.:212
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gccaagtgga ctgcgacaac ggctc
<210>SEQ ID NO.:213
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gccaagtgga ctacgacaac ggctc
<210>SEQ ID NO.:214
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gagccgttgt cgcagtccac ttggc
<210>SEQ ID NO.:215
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gagccgttgt cgtagtccac ttggc
<210>SEQ ID NO.:216
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctgctggcca gggacatgag gagct
<210>SEQ ID NO.:217
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctgctggcca ggtacatgag gagct
<210>SEQ ID NO.:218
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
agctcctcat gtccctggcc agcag
<210>SEQ ID NO.:219
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
agctcctcat gtacctggcc agcag
<210>SEQ ID NO.:220
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctcgccgcgg cggggactgc aggta
<210>SEQ ID NO.:221
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctcgccgcgg cgaggactgc aggta
<210>SEQ ID NO.:222
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tacctgcagt ccccgccgcg gcgag
<210>SEQ ID NO.:223
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tacctgcagt cctcgccgcg gcgag
<210>SEQ ID NO.:224
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gaccatcttg gaggatgaaa agagg
<210>SEQ ID NO.:225
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gaccatcttg gacgatgaaa agagg
<210>SEQ ID NO.:226
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cctcttttca tcctccaaga tggtc
<210>SEQ ID NO.:227
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cctcttttca tcgtccaaga tggtc
<210>SEQ ID NO.:228
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gttttcctcg tcagatttgt ccttgca
<210>SEQ ID NO.:229
<211>27
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gttttcctcg tcacatttgt ccttgca
<210>SEQ ID NO.:230
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ttttcctcgt cagatttgtc cttgc
<210>SEQ ID NO.:231
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ttttcctcgt cacatttgtc cttgc
<210>SEQ ID NO.:232
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ttgtccttgc agtcggggcc acta
<210>SEQ ID NO.:233
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ttgtccttgc agacggggcc accat
<210>SEQ ID NO.:234
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgtccttgca gtcggggcca cca
<210>SEQ ID NO.:235
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tgtccttgca gacggggcca cca
<210>SEQ ID NO.:236
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
agcccagtag cgtgagggct ctgtc
<210>SEQ ID NO.:237
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
agcccagtag cgagagggct ctgtc
<210>SEQ ID NO.:238
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gacagagccc tcacgctact gggct
<210>8EQ ID NO.:239
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
gacagagccc tctcgctact gggct
<210>SEQ ID NO.:240
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tcgccttgct cctcgccgcg gcggg
<210>SEQ ID NO.:241
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tcgccttgct ccccgccgcg gcggg
<210>SEQ ID NO.:242
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cccgccgcgg cgaggagcaa ggcga
<210>SEQ ID NO.:243
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cccgccgcgg cggggagcaa ggcga
<210>SEQ ID NO.:244
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
acggctacag ctacccctcg gtgag
<210>SEQ ID NO.:245
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cggctacagc taccccctcg gtgag
<210>SEQ ID NO.:246
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctcaccgagg ggtagctgta gccgt
<210>SEQ ID NO.:247
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctcaccgagg gggtagctgt agccg
<210>SEQ ID NO.:248
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cccaggagac gtgctgtgag tcccc
<210>SEQ ID NO.:249
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cccaggagac gtactgtgag tcccc
<210>SEQ ID NO.:250
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ggggactcac agcacgtctc ctggg
<210>SEQ ID NO.:251
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ggggactcac agtacgtctc ctggg
<210>SEQ ID NO.:252
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctccccatcg gtaagcgcgg gccgg
<210>SEQ ID NO.:253
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ctccccatcg gtcagcgcgg gccgg
<210>SEQ ID NO.:254
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ccggcccgcg cttaccgatg gggag
<210>SEQ ID NO.:255
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ccggcccgcg ctgaccgatg gggag
<210>SEQ ID NO.:256
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
ccagtacatg aagctggtgg gaga
<210>SEQ ID NO.:257
<211>25
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
tcttgatctt ggcctgggga cagag
<210>SEQ ID NO.:258
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cagtacatga agctggtggg agg
<210>SEQ ID NO.:259
<211>23
<212>多核苷酸
<213>人工序列
<220>
<221>寡核苷酸
<400>
cttgatcttg gcctggggac aga
Claims (16)
1.应用于家族性高胆固醇血症的体外诊断方法的相应于SEQ ID NO:1的遗传序列,所述遗传序列包括下列突变的至少一个:(-23)A>C,1054del11,108delC,1197del9,1207delT,1432del G,191-2del AinsCT,2184delG,231delC,2399del5ins4,313+linsT,338del16,509insC,675del15,684dup12,941-39>T,C195R,C255G,C319Y,D157G,D630N,E291X,H635N,N59K,T41M,W515X,Y379X,Y421X,T433N,818del8,1423delGC/insA,1204insT,451del3,G516X,2389+4A>G,1815del11,1186+5G>A,T740M,I771T,R279G,T446I,H562Q,C74Y,D686Y,G(-2)R,E579D,S205C,D200V,V766E,L(-6)P,2544insC,C42Y,2389+3A>C,[1587-5del5;1587del31]。
2.应用于家族性高胆固醇血症的体外诊断方法的按照权利要求1的遗传序列,所述遗传序列还包括任何下列突变:2393del9,(-42)C>G,(-49)C>T,1045delC,1061-8T>C,A378T,C358R,1358+1G>A,1706-10G>A,1845+1G>C,2085del19,211delG,2140+5G>A,2207insT,2390-1G>C,313+1G>C,313+1G>A,518delG,7delC,872delC,884delT,920ins4,A519T,C 113W,C255X,C281Y,C297F,C347Y,C371X,C646Y,C677Y,C68W,C74G,C95R,D151N,D200G,D200Y,D280G,E10X,E246A,E256K,F634L,G322S,G352D,G571E,N543H,N804K,Q12X,Q133X,Q357P,Q427X,Q71E,R395Q,R574W,R612C,S156L,S205P,T413K,T7051,V502M,W(-18)X,W541X,D679E,1359-1G>A,C127R,681ins21,C122X,V408M,G528D,D412H,N619N,E80K,L534P,L621S,C356Y,R329X,G248D,C201Y,313+5G>A,C358Y,C331R,D157N,V776M,P664L,W462X,Q328X,L584P,R395W,G314V,W469X,P678L,R612H,R236W。
3.应用于家族性高胆固醇血症的体外诊断方法的按照权利要求1或2的基因序列,所述基因序列还包括任何下列多态性:81T>C BstUI外显子2,1060+10G>C SmaI外显子7,1171G>A StuI外显子8,1413G>A Ddel外显子10,1617C>T BstNI外显子11,1725C>T SSCP外显子12,1771C>T HincII外显子12,1959T>C AvaII外显子13,2232G>A MspI外显子15。
4.权利要求1的基因序列在设计和制备寡核苷酸中的应用,所述寡核苷酸能够与任何下列突变杂交:(-23)A>C,1054del11,108delC,1197del19,1207delT,1432delG,191-2delAinsCT,2184delG,231delC,2399del5/ins4,313+linsT,338del16,509insC,675del15,684dup12,941-39C>T,C195R,C255G,C319Y,D157G,D630N,E291X,H635N,N59K,T41M,W515X,Y379X,Y421X,T433N,818del8,1423delGC/insA,1204insT,451del3,G516X,2389+4A>G,1815del11,1186+5G>A,T740M,I771T,R279G,T446I,H562Q,C74Y,D686Y,G(-2)R,E579D,S205C,D200V,V766E,L(-6)P,2544insC,C42Y,2389+3A>C,[1587-5del5;1587del31]。
5.能够与包括在权利要求1的基因序列中的任何突变杂交的寡核苷酸探针。
6.按照权利要求5的寡核苷酸探针,其选自下列SEQ ID NO:8,SEQ IDNO:11,SEQ ID NO:16,SEQ ID NO:17,SEQ ID NO:24,SEQ ID NO:29中的至少一个,或选自介于从SEQ ID NO:37到SEQ ID NO:147中的至少一个或选自介于从SEQ ID NO:154到SEQ ID NO:259中的至少一个。
7.权利要求5的寡核苷酸探针在诊断家族性高胆固醇血症的体外检测LDL-r基因突变的体外方法中的应用。
8.权利要求6的探针在诊断家族性高胆固醇血症的体外检测LDL-r基因突变的体外方法中的应用。
9.应用于诊断家族性高胆固醇血症中的检验试剂盒,其包括权利要求5的任何寡核苷酸探针偶联的支持体。
10.应用于诊断家族性高胆固醇血症中的检验试剂盒,其包括权利要求6的任何寡核苷酸探针偶联的支持体。
11.选自下组中的任何寡核苷酸探针在诊断家族性高胆固醇血症的体外检测LDL-r基因突变的体外方法中的应用:SEQ ID NO:2,SEQ ID NO:3,SEQID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:9,SEQID NO:10,SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14,SEQ ID NO:15,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQ ID NO:21,SEQ IDNO:22,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQID NO:28,SEQ ID NO:30,SEQ ID NO:31,SEQ ID NO:32,SEQ ID NO:33,SEQ ID NO:34,SEQ ID NO:35,SEQ ID NO:148,SEQ ID NO:149,SEQ IDNO:150,SEQ ID NO:151,SEQ ID NO:153。
12.应用于诊断家族性高胆固醇血症的按照权利要求9或10的检验试剂盒,其包括与任何选自如下的任何寡核苷酸探针偶联的支持体:SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:13,SEQ IDNO:14,SEQ ID NO:15,SEQ ID NO:18,SEQ ID NO:19,SEQ ID NO:20,SEQID NO:21,SEQ ID NO:22,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:26,SEQ ID NO:27,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:31,SEQ IDNO:32,SEQ ID NO:33,SEQ IDNO:34,SEQ ID NO:35,SEQ ID NO:148,SEQ ID NO:149,SEQ ID NO:150,SEQ ID NO:151,SEQ ID NO:152,SEQID NO:153。
13.体外诊断家族性高胆固醇血症的体外方法,其特征在于在个体生物样品中,检测了一些权利要求1所述的SEQ ID NO:1突变。
14.体外诊断家族性高胆固醇血症的体外方法,其特征在于在个体生物样品中,检测与权利要求2描述的所述SEQ ID NO:1的一些突变结合的权利要求1所述的SEQ ID NO:1的一些突变。
15.体外诊断家族性高胆固醇血症的体外方法,其特征在于在个体生物样品中,检测与权利要求3描述的所述SEQ ID NO:1的一些多态性结合的权利要求1所述的SEQ ID NO:1的一些突变。
16.按照权利要求13-15的诊断方法,其包括使用选自介于SEQ ID NO:2和SEQ ID NO 259之间的任何寡核苷酸或它们的组合,通过聚合酶链式反应(PCR)技术来扩增DNA片段,所述DNA片段单独包含权利要求1的突变,或包含与权利要求2的突变和/或权利要求3的多态性结合的权利要求1的突变,通过单链构象多态性技术(SSCP)来分析PCR产物,对那些通过SSCP显示异常图谱的片段进行测序从而检测突变,所述突变将在随后通过限制性酶切分析或通过权利要求9,10或12的检验试剂盒的方式进行鉴定。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
ES200300206 | 2003-01-28 | ||
ESP200300206 | 2003-01-28 | ||
ESP200302671 | 2003-11-17 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1780910A true CN1780910A (zh) | 2006-05-31 |
Family
ID=36770639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200480008635 Pending CN1780910A (zh) | 2003-01-28 | 2004-01-21 | 对与家族性高胆固醇血症有关的分离的低密度脂蛋白受体(ldl-r)的基因序列中的突变进行检测的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1780910A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105586394A (zh) * | 2014-11-17 | 2016-05-18 | 武汉白原科技有限公司 | 一种评估基因对人体低密度脂蛋白影响的检测试剂盒和方法 |
CN105980401A (zh) * | 2013-10-03 | 2016-09-28 | 现代治疗公司 | 编码低密度脂蛋白受体的多核苷酸 |
CN110358820A (zh) * | 2019-07-16 | 2019-10-22 | 南昌艾迪康医学检验实验室有限公司 | 检测ldlr基因突变的方法、引物和试剂盒 |
CN113106103A (zh) * | 2021-04-05 | 2021-07-13 | 华中科技大学同济医学院附属协和医院 | Ldlr基因突变体及其应用 |
-
2004
- 2004-01-21 CN CN 200480008635 patent/CN1780910A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105980401A (zh) * | 2013-10-03 | 2016-09-28 | 现代治疗公司 | 编码低密度脂蛋白受体的多核苷酸 |
CN105586394A (zh) * | 2014-11-17 | 2016-05-18 | 武汉白原科技有限公司 | 一种评估基因对人体低密度脂蛋白影响的检测试剂盒和方法 |
CN110358820A (zh) * | 2019-07-16 | 2019-10-22 | 南昌艾迪康医学检验实验室有限公司 | 检测ldlr基因突变的方法、引物和试剂盒 |
CN113106103A (zh) * | 2021-04-05 | 2021-07-13 | 华中科技大学同济医学院附属协和医院 | Ldlr基因突变体及其应用 |
CN113106103B (zh) * | 2021-04-05 | 2022-07-22 | 华中科技大学同济医学院附属协和医院 | Ldlr基因突变体及其应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101178463B1 (ko) | 와파린의 감도를 예측하는 유전적 변이체 | |
AU2021200783B2 (en) | Mitigating tissue damage and fibrosis via latent transforming growth factor beta binding protein (LTBP4) | |
RU2768285C1 (ru) | Олигонуклеотиды для модуляции экспрессии тау-белка | |
TW200808976A (en) | Warfarin dosage prediction | |
AU2023202878A1 (en) | Methods for targeted insertion of DNA in genes | |
KR20220112290A (ko) | 안지오포이에틴 유사 4(angptl4) 관련 질환의 치료를 위한 올리고뉴클레오타이드 | |
US20030235847A1 (en) | Association of polymorphisms in the SOST gene region with bone mineral density | |
CN1997756A (zh) | 单倍型标记和利用其确定对于治疗的反应的方法 | |
US6399349B1 (en) | Human aminopeptidase P gene | |
KR102102051B1 (ko) | 아토피 피부염 진단을 위한 마커 조성물 및 이를 이용한 아토피 피부염 예측또는 진단 방법 | |
CN1780910A (zh) | 对与家族性高胆固醇血症有关的分离的低密度脂蛋白受体(ldl-r)的基因序列中的突变进行检测的方法和装置 | |
CN1865440A (zh) | 肥厚型心肌病致病基因的新突变及其用途 | |
CN117795076A (zh) | 用丝裂原活化蛋白激酶激酶激酶15(map3k15)抑制剂治疗代谢病症的方法 | |
TWI358456B (en) | Method of determining susceptibility of high myopi | |
CN1548557A (zh) | 用于预测2型糖尿病易感性的试剂盒及引物 | |
CN1871361A (zh) | 使用半乳凝集素-2基因内单碱基多态性进行的炎症性疾病的判定方法 | |
CN1548553A (zh) | 用于预测2型糖尿病易感性的试剂盒及引物 | |
JP2004000115A (ja) | 糖尿病の発症危険性判定方法 | |
TW201217537A (en) | Method for estimating a risk of developing kidney stone in a subject, method for estimating a risk of recurring kidney stone in a subject suffering from or being used to suffer from kidney stone and use of SNP rs12313273 (C/T) as a biomarker for developm | |
CN1875275A (zh) | 用于预测药物诱导的腹泻的生物标志 | |
US20040138441A1 (en) | Novel gene functionally related to dyslexia | |
CN116606920A (zh) | 一种定性分析和定量分析基因rilpl1的试剂盒 | |
CN1222616C (zh) | 具有抑癌功能的新的人蛋白及其编码序列 | |
CN113825839A (zh) | 用固醇调节元件结合蛋白切割激活蛋白(scap)抑制剂治疗脂质水平升高 | |
CN1837235A (zh) | 一种p53负调控分子及其编码基因 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |