CN101037690A - 具有新的单核苷酸多态性的brca1基因变体和其编码的蛋白质变体 - Google Patents

具有新的单核苷酸多态性的brca1基因变体和其编码的蛋白质变体 Download PDF

Info

Publication number
CN101037690A
CN101037690A CN 200610058546 CN200610058546A CN101037690A CN 101037690 A CN101037690 A CN 101037690A CN 200610058546 CN200610058546 CN 200610058546 CN 200610058546 A CN200610058546 A CN 200610058546A CN 101037690 A CN101037690 A CN 101037690A
Authority
CN
China
Prior art keywords
ser
glu
leu
lys
asn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200610058546
Other languages
English (en)
Other versions
CN101037690B (zh
Inventor
马旭
汪朝晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NATIONAL POPULATION AND FAMILY PLANNING COMMISSION OF CHINA
Original Assignee
NATIONAL POPULATION AND FAMILY PLANNING COMMISSION OF CHINA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NATIONAL POPULATION AND FAMILY PLANNING COMMISSION OF CHINA filed Critical NATIONAL POPULATION AND FAMILY PLANNING COMMISSION OF CHINA
Priority to CN2006100585468A priority Critical patent/CN101037690B/zh
Publication of CN101037690A publication Critical patent/CN101037690A/zh
Application granted granted Critical
Publication of CN101037690B publication Critical patent/CN101037690B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了含有新的单核苷酸多态性位点的核酸片段和相应的蛋白或片段,所述的多态性位点位于BRCA1基因全长CDS的位置3627。也提供了用于检测所述多态性位点的相关基因型的等位基因特异性寡核苷酸,以及用于检测所述多态性位点的相关基因型的等位基因特异性寡核苷酸的方法和试剂盒。

Description

具有新的单核苷酸多态性的BRCA1基因变体和其编码的蛋白质变体
技术领域
本发明涉及新的单核苷酸多态性。更具体地,本发明涉及BRCA1基因全长CDS的3627位的多态性位点,和含有所述的多态性位点的核酸片段,以及含有所述的多态性位点的蛋白或片段。也提供了用于鉴定所述多态性位点基因型的特异性寡核苷酸和方法。本发明的新的多态性位点与乳腺癌疾病的发生有关。
背景技术
传统上,分析基因变异的各种方法已经广泛应用于医药卫生领域,用来预防和诊断疾病的发生和/或倾向。已有的基本方法包括:利用核酸扩增的方法如聚合酶链式反应(PCR)和利用核苷酸测序,利用变性高压液相色谱(DHPLC),单链构相多态性分析(SSCP)等。在实际应用中,有时需要将这些方法结合起来运用。
随着基因组研究的迅速、深入的发展,单核苷酸多态性(SNP)作为遗传分子标记亦日益受到研究人员的重视。越来越多的基因多态性与疾病的关系被揭示,如血管紧张素(angiotensin,AGT)、血管紧张素转换酶(ACE)两个基因的多态性与心血管疾病之间的关系已经得到研究界的公认。Pyrosequencing AB(Uppsala,SE)和Genomics Collaborative,Inc.(GCI)合作研究心血管疾病和药物反应,发现和确认了一些心血管疾病相关基因的多态性位点,并发明了评估心血管情况(包括心肌梗塞和中风)的方法,其发明涉及与心血管疾病相关的基因的SNPs,以及利用SNPs预测人体对抗高血压药物,如ACE抑制剂和血管紧张素受体激动剂等的反应(参见美国专利6,197,505)。
而且,目前,已有商品化诊断用基因多态性分析产品面世,如Affymetrix公司推出的p53基因突变诊断芯片、艾滋病病毒基因突变诊断芯片和细胞色素P450基因突变诊断芯片等。
BRCA基因,即乳腺癌易感基因,已知与乳腺癌(breast cancer)有关。BRCA基因为一种抑癌基因,可分为BRCA1和BRCA2。BRCA1基因位于人类第17号染色体上,BRCA2位于人类第13号染色体上。
遗传性乳腺癌患者中,90%会发生BRCA1或BRCA2突变,从而令女性患上乳腺癌的机会大大增加。此外,BRCA1和BRCA2的突变也和卵巢癌有关。不管是否有家族史也不论发病年龄,所有卵巢癌中2-6%有BRCA1的突变,3-4%有BRCA2的突变。
因此,筛选BRCA基因的突变的需求正在增加。
发明内容
本发明提供了含有新的单核苷酸多态性位点的、至少10个连续(contiguous)核苷酸的核酸片断和其互补序列。
本发明也提供了与含有新的单核苷酸多态性位点的基因片断或其互补序列全部或部分杂交的等位基因特异性寡核苷酸。
本发明提供了分析核酸的方法,包括分析含有新的多态性位点的核酸的核苷酸序列。
而且,本发明提供了人BRCA1多肽的变体或片断,其具有的氨基酸序列由10个或更多个氨基酸组成,其中包含对应于新的核酸突变的氨基酸突变。
本发明提供了分析蛋白质的方法,包括分析含有与新的核酸多态性位点相对应的氨基酸位点的蛋白的氨基酸序列。
本发明的核酸片段可以为诊断乳腺癌提供新的手段,例如,本发明的核酸片段可以被有效地用做乳腺癌诊断的探针或引物。
本发明的等位基因特异寡核苷酸可以被有效用做乳腺癌诊断的探针或引物。
本发明的人BRCA1多肽的变体或片段可以为诊断乳腺癌提供新的手段。
本发明的蛋白分析方法可以有效地用于乳腺癌的诊断。
附图说明
图1显示了具有包含本发明中的BRCA1突变核苷酸的部分,即,包含在3627位有胸腺嘧啶(T)的多态性位点的基因组测序图谱。
图2显示了检测本发明的SNP位点的基因型的一种实施方案,该实施方案利用了GAP-LCR方法,并且使用Luminex系统来进行检测。该图示意性地显示了相关的核苷酸序列。其中,长条形框表示目标核酸序列,例如BRCA1的一种等位基因的片段,并且其中示出了多态性位点。红色条状物分别表示与多态性位点上下游的序列互补的寡核苷酸序列。下游的互补寡核苷酸序列与多态性位点相距3个碱基,并且与之融合有下游通用序列。上游的互补寡核苷酸序列的3’末端对应于多态性位点,并且与之融合有报导标签序列和上游通用序列。特别地,如果上游的互补寡核苷酸序列3’端的核苷酸与多态性位点处的核苷酸相匹配,那么在GAP-LCR反应中,上下游的序列便可连接起来。接着,在Luminex系统中,连接的产物通过磁珠被分离,并且,利用通用序列而被扩增,扩增的序列中的报导标签序列可以用于与不同的荧光标记探针结合。因此,通过上述方法,可以实现核苷酸多态性位点的高通量和高灵敏性检测。
本发明的详细描述
本发明提供了核酸片断。在一个方面,本发明的核酸片段包含如在位置3627为胸腺嘧啶(T)的SEQ ID NO:1中所示的多态性位点,并且包含在SEQ ID NO:1或其互补序列中显示的至少大约10个连续核苷酸,例如,大约10至大约100个连续核苷酸、大约100至大约200个连续核苷酸、大约200至大约300个核苷酸、大约300至大约400个核苷酸、大约400至大约500个核苷酸、大约500至大约1000个核苷酸、大约1000至大约2000个核苷酸、大约2000至大约3000个核苷酸、大约3000至大约4000个核苷酸或大约4000至大约5000个核酸或者更长,甚至为SEQ ID NO:1中所示核酸序列的全长。在一种优选的实施方案中,本发明的核酸片断优选包含在SEQ ID NO:1或其互补序列中的大约10到大约100个连续核苷酸,更优选地大约10到大约50个连续核苷酸,以及最优选地大约10到大约20个连续核苷酸。在另一种实施方案中,本发明的核酸片断可以包含BRCA1基因本身。
进一步地,根据本发明的新的多态性位点可以位于核酸片断的任何部分,例如,位于靠近核酸片断的任一末端的位置,或者位于核酸片断的大约中间位置。
本发明的“核酸片断”可以是DNA或RNA,或者可以是PNA,或者天然的或合成的任何类似DNA的或类似RNA的物质。本发明的核酸片段可以是单链的或双链的,可以是代表正义链或反义链的,可以是基因组的或合成的。
本发明的核酸片段也可以包含天然核苷酸的已知类似物,例如包含碱基类似物,所述的碱基类似物例如但不限于:4-乙酰胞嘧啶、3-甲基胞嘧啶、5-甲基胞嘧啶、2-硫代胞嘧啶、5-甲氧基尿嘧啶、5-(羧基羟基甲基)尿嘧啶、5-甲氧基氨基-甲基-2-硫代尿嘧啶、5-甲基氨基甲基尿嘧啶、5′-甲氧基羰基-甲基尿嘧啶、5-羧基甲基氨基甲基-2-硫代尿嘧啶、5-羧基-甲基氨基甲基尿嘧啶、5-氟尿嘧啶、5-溴尿嘧啶、二氢尿嘧啶、假尿嘧啶、1-甲基假尿嘧啶、5-甲基-2-硫代尿嘧啶、2-硫代尿嘧啶、4-硫代尿嘧啶、5-甲基尿嘧啶、N6-异-戊烯基腺嘌呤、2-甲基硫代-N6-异戊烯基腺嘌呤、1-甲基腺嘌呤、2-甲基腺嘌呤、N6-甲基腺嘌呤、1-甲基鸟嘌呤、2,2-二甲基-鸟嘌呤、2-甲基鸟嘌呤、7-甲基鸟嘌呤、Q核苷、β-D-甘露糖Q核苷、尿嘧啶-5-氧乙酸甲基酯、尿嘧啶-5-氧乙酸、N-尿嘧啶-5-氧乙酸甲基酯、尿嘧啶-5-氧乙酸和2,6-二氨基嘌呤以及类似物。
本发明的核酸片段也可以包括具有合成的骨架的核酸类似物。例如,本发明的核酸片段的骨架键可以不是磷酯键,例如是硫酯键,硫代磷酸键,类似肽键的键或者本领域技术人员已知的能够连接核苷生成合成的多聚物的其它任何化学键(参见,比如,Tam等,Nucl.Acids Res.22:977-986,1994;Ecker和Crooke,BioTechnology 13:351-360,1995)
在本发明中,术语“多态性”是指在被遗传检测的组中存在两种或更多种的可选择的基因组序列或等位基因。“多态性标记或位点”是变异发生的位置。优选地,在被选择的组中,标记含有至少两种等位基因,其发生频率为大于1%。多态性位点可以是单碱基对。本文在描述本发明的多态性位点时,是参照其在SEQ ID NO:1所示的序列中的位置来描述的,即,对应于SEQ ID NO:1的位置3627。在一些实施方案中,位于该多态性位点的等位基因核苷酸型为A。在另外的实施方案中,位于该多态性位点的等位基因核苷酸型为T。
此外,本发明提供了等位基因特异性寡核苷酸,所述寡核苷酸包含如位置3627为T核苷酸的SEQ ID NO:1所示的多态性位点,并且能够特异性地鉴别不同的等位基因型,例如能够与SEQ ID NO:1的核苷酸序列或其互补序列特异地杂交。
在本发明中,术语“等位基因特异性”是指特异地与各等位基因杂交。例如,进行杂交使得特异地鉴定在位置3627为T核苷酸的SEQ ID NO:1的SNP。杂交是在严谨条件下进行的,例如1M或更低的盐浓度和25℃或更高的温度的条件。例如,5×SSPE(750mM NaCl,50mM磷酸钠(Na phosphate),5mM EDTA,pH7.4)和25℃~30℃的温度条件适用于等位基因特异性寡核苷酸的杂交。
关于杂交技术,科学文献中已有过很多的详细描述。例如参见,Sambrook,MOLECULAR CLONING:A LABORATORY MANUAL(2ND ED.),vol.1-3,ColdSpring Harbor Laboratory,(1989);CURRENT PROTOCOLS IN MOLECULARBIOLOGY,Ausubel,ed.John Wiley & Sons,Inc.,New York(1997);LABORATORYTECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY:HYBRIDIZATION WITH NUCLEIC ACID PROBES,Part I.Theory and Nucleic AcidPreparation,Tijssen,ed.Elsevier,N.Y(1993)。以上所有文献在此通过引用方式整体并入本文。因此,考虑到本发明的公开内容,本领域普通技术人员能够容易地确定具体的杂交条件。
特别地,本发明的等位基因特异性寡核苷酸可以用作探针。这里使用的术语“探针”意指杂交探针,它是能与核酸互补链序列特异性结合的寡核苷酸。这种探针包括Nielsen等在Science 254,1497-1500(1991)中描述的肽核酸。本文的探针是等位基因特异性探针,其在一定条件下,与来自于一种组分(例如,一个等位基因)的DNA片断杂交,但不与来自不同组分的DNA片断杂交,这正是因为来自相同物种的两种组分的核酸片断具有多态性位点。在这种情形下,这些等位基因的杂交条件的杂交严谨性是明显不同的。这样,杂交条件应该严谨到足以允许仅与一个等位基因杂交。本发明的探针优选被设计成这样,即:使得其中心位点或大约中心位点——即15个核苷酸长的探针时在位点7,或16个核苷酸长的探针时在位点8或9——可以与序列的多态性位点匹配(align),从而使得等位基因的杂交明显不同。这样的探针的示范性实例被描述于实施例3中。本发明的探针能够被用于检测等位基因的诊断方法中。诊断方法包括基于核酸杂交的检测方法,例如,southern印迹杂交,当DNA芯片用于检测特定核酸时,探针可以以固定在DNA芯片底物上的形式被提供。
如以上所述,本发明的等位基因特异性探针可以是任意长度,例如,本发明的探针包含至少10个连续核苷酸。可以选择地,本发明的探针可以是本发明的核酸序列的大约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、60、70、80、90或100个连续核苷酸。然而,本领域技术人员明显知道的是,探针的序列不必一定与靶序列完全互补,而是只要它能与靶序列特异性杂交即可。同样地,所述的多态性位点可以出现在探针序列的任意位置,只要获得的探针能够特异性地鉴别等位基因。
本发明的探针可以用于分析各种样品,例如,特别地,来自被怀疑患有乳腺癌或被认为具有患有乳腺癌的风险的个体或者来自健康个体的样品。本发明的探针可以被用来鉴定特定的靶序列(例如,等位基因),例如,用来确定BRCA1基因的多态性位点的状态。在一种实施方案中,获得生物样品,并从其中分离出核酸,然后将这些核酸在允许探针与样品中可能存在的特异性靶序列杂交的条件下与探针接触。如果样品中含有所述的靶序列,那么探针的特异性杂交被检测到。可被检测的杂交可以通过使用由可检测的试剂标记过的探针来实现,例如,用放射性同位素、荧光染料或能催化形成可检测产物的酶来标记探针。使用标记探针来检测样品中特定核酸的存在的许多方法对本技术领域的普通技术人员是熟知的。因此,本发明的等位基因特异性核苷酸可以用作检测试剂。相应地,在另一种实施方案中,本发明也提供了包含本发明的等位基因特异性核苷酸作为探针的检测试剂或诊断试剂盒。
此外,在本发明中,等位基因特异性寡核苷酸可以是引物。这里使用的术语“引物”是指能在适当的条件(例如,在含有4种不同的核苷三磷酸和聚合酶如DNA或RNA聚合酶或逆转录酶以及合适的缓冲液的条件下)和适当的温度下作为模板指导的DNA合成的起始点的单链寡核苷酸。引物的适当长度可以根据使用目的而改变,通常15到30个核苷酸,例如15、16、17、18、19、20、21、22、23、24、25、30个核苷酸,但也可以是少于15个核苷酸,例如大约10、11、12、13、14个核苷酸,或者是多于30个核苷酸。一般地,短的引物分子需要较低的温度来与模板形成稳定的杂交。引物序列与模板不需要完全互补,但应该是足以与模板杂交的互补。优选地,设计引物,使得其3’末端安排有多态性位点,例如在位置3627为T核苷酸的SEQ ID NO:1的多态性位点。这样的引物的示范性实例被描述于实施例2中。引物与含有多态性位点的靶DNA杂交,并且起始等位基因的扩增。所述引物可以成对使用,其中的另一条引物杂交于相对的位点。扩增反应后,扩增产物从两个引物获得,这就意味着具有特定的等位基因形式。进一步地,特异性的扩增产物可以通过多种手段被检测。例如,通过在反应产物上进行凝胶电泳并用嵌入剂如溴化乙啶染色凝胶来检测。或者,可以用同位素标记一种或多种探针,放射性扩增产物的存在在凝胶电泳后通过放射自显影术来检测。作为选择,为了使由引物延伸而得到的产物易于检测,引物还可以与其它有助于检测的序列相融合,这样的融合的引物序列也被描述于例如实施例2中。这些以及其它的用于检测核酸产物的技术是本领域技术人员熟知的。因此,本发明的等位基因特异性核苷酸可以用作检测试剂。相应地,在另一种实施方案中,本发明也提供了包含本发明的等位基因特异性核苷酸作为引物的检测试剂或诊断试剂盒。
根据本发明的另一方面,提供了分析核酸的方法,包括测定在SEQ ID NO:1的位置3627处的多态性位点的核苷酸序列。该方法可以包括将核酸,例如基因组DNA或RNA从样品中分离,测定分离出的核酸的序列并且测定在SEQ ID NO:1的位置3627处的多态性位点的核苷酸序列。如果分析结果显示出在SEQ ID NO:1的位置3627处的多态性位点的核苷酸序列是不同于腺嘌呤(A)的核苷酸,这就确定有乳腺癌(breast cancer)增加的危险。这里,核苷酸序列可以通过普通的测序方法被测定,例如,双脱氧法或利用自动化设备,也可以使用本领域已知的任何其它测定序列的方法,例如利用等位基因特异性探针杂交和/或等位基因特异性引物延伸,例如本文中实施例所描述的GAP-LCR方法和DASH方法。
根据本发明的人BRCA1多肽的变体或片段含有多态性位点,该位点上,SEQID NO:2的1170位氨基酸是一个不同于异亮氨酸(Ile)的氨基酸,优选的是苯丙氨酸(Phe),而且所述变体或片段含有源自SEQ ID NO:2氨基酸序列的至少10个连续氨基酸。
本发明也提供了蛋白质的分析方法,包括测定SEQ ID NO:2的位置1170处的氨基酸序列。该氨基酸序列是用通常的方法测定,例如,N-或C-末端鉴定,或使用诸如MS/MS或MALTI-TOF的设备。进一步地,在一种实施方案中,如果对应于所述位置1170的氨基酸是苯丙氨酸,可确定患有乳腺癌的危险增加。
现在本发明将通过参考下面提到的实施例更详细地描述。但是,这些实施例仅被提供用于说明,并且本发明不局限于那些实施例。
实施例
实施例1:人BRCA1基因中新的多态性位点的鉴定
在本实施例中,从76例有乳腺癌或卵巢癌家族史、临床确诊为乳腺癌的女性患者,以及常规检查正常的105个女性的血液样品中分离基因组DNA,用PCR的方法对BRCA1基因的外显子部分进行扩增,通过变性高压液相色谱(DHPLC)对家族性乳腺癌患者的BRCA1基因突变进行筛选,经过碱基测序,BRCA1基因的新的突变位点被测定。
(1)人BRCA1基因外显子部分DNA的扩增
从76个患者和105个正常人收集血液,基因组DNA用蛋白酶K裂解和酚-氯仿抽提法分离。BRCA1基因中外显子部分用PCR反应溶液扩增。
PCR扩增总体系为25μl,含0.2-0.4μg模板DNA、0.4μmol/L上下游引物、200μmol/L dNTPs、1.0U Taq DNA聚合酶和相应的缓冲液。
扩增的条件是5分钟(94℃)用于最初的变性,35个循环为30秒(94℃)用于变性,根据表1选择各自引物优化的退火温度30秒用于退火以及30秒(72℃)用于延伸,10分钟(72℃)用于最后的延伸。
PCR扩增中用的引物列表列于表1中。
    表1  BRCA1基因引物序列及靶片段在全长基因上的分布
 5’序列引物  3’序列引物
 BRCA1基因外显子2  SEQ ID NO:3  SEQ ID NO:4
 BRCA1基因外显子5  SEQ ID NO:5  SEQ ID NO:6
 BRCA1基因外显子8  SEQ ID NO:7  SEQ ID NO:8
 BRCA1基因外显子9  SEQ ID NO:9  SEQ ID NO:10
 BRCA1基因外显子11片断(A)  SEQ ID NO:11  SEQ ID NO:12
 BRCA1基因外显子11片断(B)  SEQ ID NO:13  SEQ ID NO:14
 BRCA1基因外显子11片断(D)  SEQ ID NO:15  SEQ ID NO:16
 BRCA1基因外显子11片断(E)  SEQ ID NO:17  SEQ ID NO:18
 BRCA1基因外显子11片断(F)  SEQ ID NO:19  SEQ ID NO:20
 BRCA1基因外显子11片断(G)  SEQ ID NO:21  SEQ ID NO:22
 BRCA1基因外显子11片断(H)  SEQ ID NO:23  SEQ ID NO:24
 BRCA1基因外显子11片断(I)  SEQ ID NO:25  SEQ ID NO:26
 BRCA1基因外显子11片断(K)  SEQ ID NO:27  SEQ ID NO:28
 BRCA1基因外显子11片断(L)  SEQ ID NO:29  SEQ ID NO:30
 BRCA1基因外显子12  SEQ ID NO:31  SEQ ID NO:32
 BRCA1基因外显子13  SEQ ID NO:33  SEQ ID NO:34
 BRCA1基因外显子15  SEQ ID NO:35  SEQ ID NO:36
 BRCA1基因外显子16  SEQ ID NO:37  SEQ ID NO:38
 BRCA1基因外显子17  SEQ ID NO:39  SEQ ID NO:40
 BRCA1基因外显子18  SEQ ID NO:41  SEQ ID NO:42
 BRCA1基因外显子20  SEQ ID NO:43  SEQ ID NO:44
扩增产物用凝胶回收试剂盒回收。然后将回收产物和野生型正常对照等比例混合后,使用梯度PCR仪进行缓慢复性。
复性条件是:3分钟(95℃)变性,然后每秒降低0.01℃,直到65℃,自然冷却到室温。纯化产物用作变性高压液相色谱(DHPLC)序列分析的模板。
(2)PCR产物的鉴定
在不变性的温度条件下(50℃)下进行PCR产物,包括DNA片段大小,PCR产量及纯度的鉴定。
(3)变性高压液相色谱(DHPLC)分析
设定DHPLC柱温在接近DNA融解温度(Tm)上下2℃范围,启动变性高效液相色谱仪开始检测,用DHPLC自带软件计算的洗脱条件进行常规洗脱。
恒温自动取样器将5μl PCR产物注入WAVE DNA片段分析系统,PCR产物被流动相A液(0.1M TEAA,0.025%乙腈)和B液(0.1M TEAA,25%乙腈)带至分离柱洗脱分离。流动相流速为0.9ml/min。
将待分析样本的DHPLC谱型与野生型与当组实验已知的多态性对照进行比较,初步判定突变类型和多态性位点。
(4)DHPLC中峰形可疑样品的扩增
对所有DHPLC峰形可疑的样本,选用高保真Pyrobest DNA Polymerase(宝生物生物工程公司)进行PCR扩增。另外每对引物选取3个DHPLC峰型正常的样本,用高保真Pyrobest DNA Polymerase扩增。
(5)BRCA1基因的核苷酸序列分析
核苷酸测序PCR是通过ABI PRISM BigDye终止子循环测序预备反应试剂盒(Applied Biosystem,U.S.A)方法,用每种纯化的引物对样品核苷酸来进行的,并且用乙醇沉淀产物,接着产物在甲酰胺中悬浮,95℃煮沸5分钟,立即浸入4℃的冰中。最后,序列分析用ABI PRISM 3700测序仪(Applied Biosystem,U.S.A)来进行。
(6)分析确定BRCA1基因突变
从序列分析得到的DNA序列利用DNAMAN软件与NCBI数据库原始数据进行比对和分析。
同时对照测序图(图1)最终确认突变类型和多态性位点。
经病理确诊为乳腺癌的76个患者的DNA样品和常规检查正常的105个女性的DNA样品经PCR,DHPLC和测序而被分析。
结果显示,一个新的突变在两个患者中被发现。也就是,发现两名患者的BRCA1基因全长CDS的3627位的A变成了T,该突变位于BRCA1基因第11号外显子上。此外,这可能提示BRCA1基因编码的氨基酸序列中1170位的导致异亮氨酸(Ile)变成了苯丙氨酸(Phe)。
实施例2:特异性地鉴定多态性位点的基因型:基于Gap-LCR和Luminex系统的方法
在本实施例中,提供了用于特异性地鉴定在新的多态性位点处的核苷酸序列的方法和试剂,尤其是等位基因特异性寡核苷酸。其中,如下面所详细描述的,本发明的等位基因特异性寡核苷酸被用作连接酶链式反应(LCR)的引物。在此描述的方法和寡核苷酸仅是用于示范的目的,而不是用于限制本发明。本领域技术人员可以理解,本技术领域中还有可以用于检测SNP位点的其它方法,它们也适用于本发明。
(1)包含3627位的多态性位点的人BRCA1 DNA片断的扩增
从经测序确认,BRCA1基因全长CDS的3627位的A变成了T的病理确诊为乳腺癌的患者,和BRCA1基因全长CDS的3627位为A的正常人提取血液。按照实施例1(1)中的方法,对人BRCA1基因外显子包含3627位的部分(BRCA1基因外显子11片断K)进行扩增。使用的引物序列为:SEQ ID NO:27和SEQ IDNO:28。
(2)等位基因特异性寡核苷酸序列的设计
依据SEQ ID NO:1核酸片段的3627位5’侧的序列设计一段长度为20bp的寡核苷酸序列SEQ ID NO:45,该序列与本发明描述的3627位的单核苷酸多态性位点相距3bp,并且与SEQ ID NO:1互补,具体地说,与SEQ ID NO:1的3604-3623位的序列互补。
依据SEQ ID NO:1核酸片段的3627位3’侧的序列设计长度均为15bp的两种寡核苷酸序列SEQ ID NO:46和SEQ ID NO:47。上述寡核苷酸序列的3’末端为本发明描述的3627位的单核苷酸多态性位点。SEQ ID NO:46和SEQ ID NO:47核酸片段仅仅在本发明描述的单核苷酸多态性位点处存在一个碱基的差别,分别与不同的多态性位点核苷酸配对;而两种寡核苷酸的其余序列则均与SEQ ID NO:1互补。SEQ ID NO:46用于检测3627位为腺嘌呤(A)的野生型样本,SEQ ID NO:47用于检测3627位为胸腺嘧啶(T)的突变型样本。
同样地,依据SEQ ID NO:1核酸片段的3627位3’侧的序列设计长度均为20bp的两种寡核苷酸序列SEQ ID NO:48和SEQ ID NO:49。上述寡核苷酸序列的3’末端为本发明描述的3627位的单核苷酸多态性位点。SEQ ID NO:48和SEQ ID NO:49核酸片段仅仅在本发明描述的单核苷酸多态性位点处存在一个碱基的差别,分别与不同的多态性位点核苷酸配对;而两种寡核苷酸的其余序列则均与SEQ ID NO:1互补。SEQ ID NO:48用于检测3627位为腺嘌呤(A)的野生型样本,SEQ ID NO:49用于检测3627位为胸腺嘧啶(T)的突变型样本。
同样地,依据SEQ ID NO:1核酸片段的3627位3’侧的序列设计长度为30bp的两种寡核苷酸序列SEQ ID NO:50和SEQ ID NO:51。上述寡核苷酸序列的3’末端为本发明描述的3627位的单核苷酸多态性位点。SEQ ID NO:50和SEQ ID NO:51核酸片段仅仅在本发明描述的单核苷酸多态性位点处存在一个碱基的差别,分别与不同的多态性位点核苷酸配对;而两种寡核苷酸的其余序列则均与SEQ ID NO:1互补。SEQ ID NO:50用于检测3627位为腺嘌呤(A)的野生型样本,SEQ ID NO:51用于检测3627位为胸腺嘧啶(T)的突变型样本。
利用上面所述设计出的寡核苷酸,便能够在Gap-LCR中获得特异性的连接产物。也就是说,在Gap-LCR方法中,当模板核酸片段来自野生型样本时,下游的寡核苷酸SEQ ID NO:45与上游的寡核苷酸SEQ ID NO:46、48、50中的任何一个都能够在连接酶作用下,连接形成更长的特异性产物。当模板核酸片段来自突变型样本时,下游的寡核苷酸SEQ ID NO:45与上游的寡核苷酸SEQ ID NO:47、49、51中的任何一个都能够在连接酶作用下,连接形成更长的特异性产物。
进一步地,为了开发出具有大规模检测应用前景的分析手段,将Gap-LCR方法与Luminex公司的荧光微球体技术组合起来。因此,利用设计出的下游寡核苷酸序列和另外设计出的通用序列(在本文中称为下游通用序列),获得融合的等位基因特异性寡核苷酸序列。同时,利用上面设计出的每一种上游寡核苷酸序列和Luminex公司提供的报导标签序列以及另外设计出的通用序列(在本文中称为上游通用序列),分别获得融合的等位基因特异性寡核苷酸序列。其中,对于用于检测3627位为腺嘌呤(A)的寡核苷酸,与之融合的报导标签序列为SEQ ID NO:59;对于用于检测3627位为胸腺嘧啶(T)的寡核苷酸,与之融合的报导标签序列为SEQ ID NO:60。报导标签序列可以用于与不同的荧光标记探针结合。下游通用序列为SEQ ID NO:61,上游通用序列为SEQ ID NO:62,用来扩增由Gap-LCR方法连接得到的序列。
上述各种序列的设计被总结于表2中。
                         表2  等位基因特异性寡核苷酸序列设计
SNP位点基因型* 寡核苷酸序列 报导标签序列  融合的等位基因特异性寡核苷酸序列**
下游的序列  SEQ ID NO:45  SEQ ID NO:52
上游的序列(第1组) A  SEQ ID NO:46  SEQ ID NO:59  SEQ ID NO:53
T  SEQ ID NO:47  SEQ ID NO:60  SEQ ID NO:54
上游的序列(第2组) A  SEQ ID NO:48  SEQ ID NO:59  SEQ ID NO:55
T  SEQ ID NO:49  SEQ ID NO:60  SEQ ID NO:56
上游的序列(第3组) A  SEQ ID NO:50  SEQ ID NO:59  SEQ ID NO:57
T  SEQ ID NO:51  SEQ ID NO:60  SEQ ID NO:58
*所述的SNP位点基因型是指通过示出的上游序列而特异性鉴别的多态性位点处的核苷酸序列(即,A或者T);
**所述的融合的等位基因特异性寡核苷酸序列顺次包含下游寡核苷酸序列和下游通用序列(对于下游);或者上游通用序列、报导标签序列和上游寡核苷酸序列(对于下游)。这样的融合的等位基因特异性寡核苷酸将在下面的方法中被应用。
(3)Gap-LCR连接反应
这里,利用单碱基变化造成的碱基互补性对延伸反应的影响,来实现针对SNP的特异性的连接。
利用如上所述的融合的等位基因特异性寡核苷酸,通过在本领域内惯例地使用的Gap-LCR方法(参见Abravaya,K.,Carrino,J.J.,Muldoon,S.,and Lee,H.H.1995.Detection of point mutations with a modified ligase chain reaction(Gap-LCR).NucleicAcids Res.23:675-682,该文献通过引用方式整体并入本文)进行延伸连接,产生100bp左右的产物。
Gap-LCR连接总体系为30μl,含1μmol/L模板DNA、0.2μmol/L上下游各自融合的等位基因特异性寡核苷酸、100μmol/L dNTPs、1.0U DNA连接酶和相应的缓冲液。
Gap-LCR的条件是5分钟(95℃)用于最初的变性,然后,30秒(95℃)用于变性,30秒(53℃)用于退火以及30秒(60℃)用于连接,以上进行10个循环,5分钟(60℃)用于最后的连接。
(4)SNP位点的基因型的Luminex检测
相应的SNP位点的基因型的检测通过使用本领域技术人员已知的Luminex技术(参见,Fei Ye,May-Sung Li,J.David Taylor,Quan Nguyen,Heidi M.Colton,Warren M.Casey,Michael Wagner,Michael P.Weiner,and Jingwen Chen.FluorescentMicrosphere-Based Readout Technology for Multiplexed Human Single NucleotidePolymorphism Analysis and Bacterial Identification,Human Mutation 17:305-316,2001;和Marie A.Iannone,J.David Taylor,Jingwen Chen,May-Sung Li,Philip Rivers,Kimberly A.Slentz-Kesler,and Michael P.Weiner,Multiplexed Single NucleotidePolymorphism Genotyping by Oligonucleotide Ligation and Flow Cytometry,Cytometry,39:131-140,2000,以上文献通过引用方式整体并入本文),在对上面程序(3)中的反应产物进行扩增之后通过Luminex 100多功能液相芯片分析平台来进行。
结果显示,对于代表不同基因型的两种样品,当如上所述地使用设计出来的寡核苷酸片段进行Gap-LCR连接、扩增和检测时,所获得的检测结果与测序结果相一致。这表明,本发明的等位基因特异性寡核苷酸能够特异地检测出本发明所述的多态性位点的基因型。
实施例3:特异性地鉴定多态性位点的基因型:基于动态等位基因特异性杂交(dynamic allele specific hybridization,DASH)的方法
本实施例提供了用于分析和检测本发明的新的多态性位点的基因型的另外的方法以及相关的特异性寡核苷酸。本实施例是基于DASH方法来进行的,DASH方法是本领域已知的,参见例如Jonathan A.Prince,Lars Feuk,W.Mathias Howell,Magnus Jobs,Tesfai Emahazion,Kaj Blennow,and Anthony J.Brookesl,Robust andAccurate Single Nucleotide Polymorphism Genotyping by Dynamic Allele-SpecificHybridization(DASH):Design Criteria and Assay Validation,Genome Research.Vol.11,Issue 1,152-162,2001,此文献通过引用方式整体并入本文。
简单地说,用生物素标记的一条引物进行DNA样品的扩增,所得到的PCR产物被结合于链亲和素包被的微孔板上,用碱对板进行洗涤以除去未带有生物素标记的链。加入本发明设计的探针和荧光染料SYBR Green I(该荧光染料可以特异性地插入DNA双链中,并在激发光的作用下发出荧光,而在单链DNA中则不能),探针和PCR产物单链杂交后,在DASH仪中将微孔板持续地缓慢升温,同时实时地检测孔中荧光强度,温度以及对应的荧光强度被记录到计算机中。SNP基因型与探针完全匹配的样品(即,目标链中SNP位点的核苷酸与探针中对应位置的核苷酸互补)在较高温度才解链,因此在较高温度才出现荧光强度的陡变,表现为d(荧光)/dt峰,而与探针不匹配的样品则在较低温度时就出现d(荧光)/dt峰,杂合子则得到两个峰。
依据SEQ ID NO:1核酸片段3627位附近的序列设计长度均为17bp的两种探针SEQ ID NO:63和SEQ ID NO:64。这两个序列与BRCA1基因的核酸片段互补,其第9位和本发明描述的3627位的单核苷酸多态性位点对齐。SEQ ID NO:63和SEQ ID NO:64核酸片段仅仅在本发明描述的单核苷酸多态性位点处存在一个碱基的差别,它们分别与不同的多态性位点基因型结合。其中,SEQ ID NO:63用于检测3627位为腺嘌呤(A)的野生型样本,SEQ ID NO:64用于检测3627位为胸腺嘧啶(T)的突变型样本。
相应的SNP位点的基因型的检测使用动态等位基因特异性杂交法来进行。在实施例2中使用的核酸样品被用于本方法,实验按照Jonathan A.Prince etc.,supra等所述的方法进行。用设计出来的探针片段检测,可以较好地区分不同的多态性位点基因型。
虽然本发明参照示范性的实施方案来特别说明或描述,那些本领域的普通技术人员将明白其中形式和细节上的可作的不同变化而不脱离像权利要求定义的本发明的精神和范围。
                        序列表
<110>国家人口计生委科学技术研究所
<120>具有新的单核苷酸多态性的BRCA1基因变体和其编码的蛋白质变体
<130>
<160>64
<170>PatentIn version 3.3
<210>1
<211>5711
<212>DNA
<213>人(Homo sapiens)
<220>
<221>CDS
<222>(120)..(5711)
<223>BRCA1变体序列
<400>1
agctcgctga gacttcctgg accccgcacc aggctgtggg gtttctcaga taactgggcc   60
cctgcgctca ggaggccttc accctctgct ctgggtaaag ttcattggaa cagaaagaa   119
atg gat tta tct gct ctt cgc gtt gaa gaa gta caa aat gtc att aat    167
Met Asp Leu Ser Ala Leu Arg Val Glu Glu Val Gln Asn Val Ile Asn
1               5                   10                  15
gct atg cag aaa atc tta gag tgt ccc atc tgt ctg gag ttg atc aag    215
Ala Met Gln Lys Ile Leu Glu Cys Pro Ile Cys Leu Glu Leu Ile Lys
            20                  25                  30
gaa cct gtc tcc aca aag tgt gac cac ata ttt tgc aaa ttt tgc atg    263
Glu Pro Val Ser Thr Lys Cys Asp His Ile Phe Cys Lys Phe Cys Met
        35                  40                  45
ctg aaa ctt ctc aac cag aag aaa ggg cct tca cag tgt cct tta tgt    311
Leu Lys Leu Leu Asn Gln Lys Lys Gly Pro Ser Gln Cys Pro Leu Cys
    50                  55                  60
aag aat gat ata acc aaa agg agc cta caa gaa agt acg aga ttt agt    359
Lys Asn Asp Ile Thr Lys Arg Ser Leu Gln Glu Ser Thr Arg Phe Ser
65                  70                  75                  80
caa ctt gtt gaa gag cta ttg aaa atc att tgt gct ttt cag ctt gac    407
Gln Leu Val Glu Glu Leu Leu Lys Ile Ile Cys Ala Phe Gln Leu Asp
                85                  90                  95
aca ggt ttg gag tat gca aac agc tat aat ttt gca aaa aag gaa aat    455
Thr Gly Leu Glu Tyr Ala Asn Ser Tyr Asn Phe Ala Lys Lys Glu Asn
            100                 105                 110
aac tct cct gaa cat cta aaa gat gaa gtt tct atc atc caa agt atg    503
Asn Ser Pro Glu His Leu Lys Asp Glu Val Ser Ile Ile Gln Ser Met
        115                 120                 125
ggc tac aga aac cgt gcc aaa aga ctt cta cag agt gaa ccc gaa aat    551
Gly Tyr Arg Asn Arg Ala Lys Arg Leu Leu Gln Ser Glu Pro Glu Asn
    130                 135                 140
cct tcc ttg cag gaa acc agt ctc agt gtc caa ctc tct aac ctt gga    599
Pro Ser Leu Gln Glu Thr Ser Leu Ser Val Gln Leu Ser Asn Leu Gly
145                 150                 155                 160
act gtg aga act ctg agg aca aag cag cgg ata caa cct caa aag acg    647
Thr Val Arg Thr Leu Arg Thr Lys Gln Arg Ile Gln Pro Gln Lys Thr
                165                 170                 175
tct gtc tac att gaa ttg gga tct gat tct tct gaa gat acc gtt aat    695
Ser Val Tyr Ile Glu Leu Gly Ser Asp Ser Ser Glu Asp Thr Val Asn
            180                 185                 190
aag gca act tat tgc agt gtg gga gat caa gaa ttg tta caa atc acc    743
Lys Ala Thr Tyr Cys Ser Val Gly Asp Gln Glu Leu Leu Gln Ile Thr
        195                 200                 205
cct caa gga acc agg gat gaa atc agt ttg gat tct gca aaa aag gct    791
Pro Gln Gly Thr Arg Asp Glu Ile Ser Leu Asp Ser Ala Lys Lys Ala
    210                 215                 220
gct tgt gaa ttt tct gag acg gat gta aca aat act gaa cat cat caa    839
Ala Cys Glu Phe Ser Glu Thr Asp Val Thr Asn Thr Glu His His Gln
225                 230                 235                 240
ccc agt aat aat gat ttg aac acc act gag aag cgt gca gct gag agg    887
Pro Ser Asn Asn Asp Leu Asn Thr Thr Glu Lys Arg Ala Ala Glu Arg
                245                 250                 255
cat cca gaa aag tat cag ggt agt tct gtt tca aac ttg cat gtg gag    935
His Pro Glu Lys Tyr Gln Gly Ser Ser Val Ser Asn Leu His Val Glu
            260                 265                 270
cca tgt ggc aca aat act cat gcc agc tca tta cag cat gag aac agc    983
Pro Cys Gly Thr Asn Thr His Ala Ser Ser Leu Gln His Glu Asn Ser
        275                 280                 285
agt tta tta ctc act aaa gac aga atg aat gta gaa aag gct gaa ttc   1031
Ser Leu Leu Leu Thr Lys Asp Arg Met Asn Val Glu Lys Ala Glu Phe
    290                 295                 300
tgt aat aaa agc aaa cag cct ggc tta gca agg agc caa cat aac aga   1079
Cys Asn Lys Ser Lys Gln Pro Gly Leu Ala Arg Ser Gln His Asn Arg
305                 310                 315                 320
tgg gct gga agt aag gaa aca tgt aat gat agg cgg act ccc agc aca   1127
Trp Ala Gly Ser Lys Glu Thr Cys Asn Asp Arg Arg Thr Pro Ser Thr
                325                 330                 335
gaa aaa aag gta gat ctg aat gct gat ccc ctg tgt gag aga aaa gaa   1175
Glu Lys Lys Val Asp Leu Asn Ala Asp Pro Leu Cys Glu Arg Lys Glu
            340                 345                 350
tgg aat aag cag aaa ctg cca tgc tca gag aat cct aga gat act gaa   1223
Trp Asn Lys Gln Lys Leu Pro Cys Ser Glu Asn Pro Arg Asp Thr Glu
        355                 360                 365
gat gtt cct tgg ata aca cta aat agc agc att cag aaa gtt aat gag   1271
Asp Val Pro Trp Ile Thr Leu Asn Ser Ser Ile Gln Lys Val Asn Glu
    370                 375                 380
tgg ttt tcc aga agt gat gaa ctg tta ggt tct gat gac tca cat gat   1319
Trp Phe Ser Arg Ser Asp Glu Leu Leu Gly Ser Asp Asp Ser His Asp
385                 390                 395                 400
ggg gag tct gaa tca aat gcc aaa gta gct gat gta ttg gac gtt cta   1367
Gly Glu Ser Glu Ser Asn Ala Lys Val Ala Asp Val Leu Asp Val Leu
                405                 410                 415
aat gag gta gat gaa tat tct ggt tct tca gag aaa ata gac tta ctg   1415
Asn Glu Val Asp Glu Tyr Ser Gly Ser Ser Glu Lys Ile Asp Leu Leu
            420                 425                 430
gcc agt gat cct cat gag gct tta ata tgt aaa agt gaa aga gtt cac   1463
Ala Ser Asp Pro His Glu Ala Leu Ile Cys Lys Ser Glu Arg Val His
        435                 440                 445
tcc aaa tca gta gag agt aat att gaa gac aaa ata ttt ggg aaa acc   1511
Ser Lys Ser Val Glu Ser Asn Ile Glu Asp Lys Ile Phe Gly Lys Thr
    450                 455                 460
tat cgg aag aag gca agc ctc ccc aac tta agc cat gta act gaa aat   1559
Tyr Arg Lys Lys Ala Ser Leu Pro Asn Leu Ser His Val Thr Glu Asn
465                 470                 475                 480
cta att ata gga gca ttt gtt act gag cca cag ata ata caa gag cgt   1607
Leu Ile Ile Gly Ala Phe Val Thr Glu Pro Gln Ile Ile Gln Glu Arg
                485                 490                 495
ccc ctc aca aat aaa tta aag cgt aaa agg aga cct aca tca ggc ctt   1655
Pro Leu Thr Asn Lys Leu Lys Arg Lys Arg Arg Pro Thr Ser Gly Leu
            500                 505                 510
cat cct gag gat ttt atc aag aaa gca gat ttg gca gtt caa aag act    1703
His Pro Glu Asp Phe Ile Lys Lys Ala Asp Leu Ala Val Gln Lys Thr
        515                 520                 525
cct gaa atg ata aat cag gga act aac caa acg gag cag aat ggt caa    1751
Pro Glu Met Ile Asn Gln Gly Thr Asn Gln Thr Glu Gln Asn Gly Gln
    530                 535                 540
gtg atg aat att act aat agt ggt cat gag aat aaa aca aaa ggt gat    1799
Val Met Asn Ile Thr Asn Ser Gly His Glu Asn Lys Thr Lys Gly Asp
545                 550                 555                 560
tct att cag aat gag aaa aat cct aac cca ata gaa tca ctc gaa aaa    1847
Ser Ile Gln Asn Glu Lys Asn Pro Asn Pro Ile Glu Ser Leu Glu Lys
                565                 570                 575
gaa tct gct ttc aaa acg aaa gct gaa cct ata agc agc agt ata agc    1895
Glu Ser Ala Phe Lys Thr Lys Ala Glu Pro Ile Ser Ser Ser Ile Ser
            580                 585                 590
aat atg gaa ctc gaa tta aat atc cac aat tca aaa gca cct aaa aag    1943
Asn Met Glu Leu Glu Leu Asn Ile His Asn Ser Lys Ala Pro Lys Lys
        595                 600                 605
aat agg ctg agg agg aag tct tct acc agg cat att cat gcg ctt gaa    1991
Asn Arg Leu Arg Arg Lys Ser Ser Thr Arg His Ile His Ala Leu Glu
    610                 615                 620
cta gta gtc agt aga aat cta agc cca cct aat tgt act gaa ttg caa    2039
Leu Val Val Ser Arg Asn Leu Ser Pro Pro Asn Cys Thr Glu Leu Gln
625                 630                 635                 640
att gat agt tgt tct agc agt gaa gag ata aag aaa aaa aag tac aac    2087
Ile Asp Ser Cys Ser Ser Ser Glu Glu Ile Lys Lys Lys Lys Tyr Asn
                645                 650                 655
caa atg cca gtc agg cac agc aga aac cta caa ctc atg gaa ggt aaa    2135
Gln Met Pro Val Arg His Ser Arg Asn Leu Gln Leu Met Glu Gly Lys
            660                 665                 670
gaa cct gca act gga gcc aag aag agt aac aag cca aat gaa cag aca    2183
Glu Pro Ala Thr Gly Ala Lys Lys Ser Asn Lys Pro Asn Glu Gln Thr
        675                 680                 685
agt aaa aga cat gac agc gat act ttc cca gag ctg aag tta aca aat    2231
Ser Lys Arg His Asp Ser Asp Thr Phe Pro Glu Leu Lys Leu Thr Asn
    690                 695                 700
gca cct ggt tct ttt act aag tgt tca aat acc agt gaa ctt aaa gaa    2279
Ala Pro Gly Ser Phe Thr Lys Cys Ser Asn Thr Ser Glu Leu Lys Glu
705                 710                 715                 720
ttt gtc aat cct agc ctt cca aga gaa gaa aaa gaa gag aaa cta gaa    2327
Phe Val Asn Pro Ser Leu Pro Arg Glu Glu Lys Glu Glu Lys Leu Glu
                725                 730                 735
aca gtt aaa gtg tct aat aat gct gaa gac ccc aaa gat ctc atg tta    2375
Thr Val Lys Val Ser Asn Asn Ala Glu Asp Pro Lys Asp Leu Met Leu
            740                 745                 750
agt gga gaa agg gtt ttg caa act gaa aga tct gta gag agt agc agt    2423
Ser Gly Glu Arg Val Leu Gln Thr Glu Arg Ser Val Glu Ser Ser Ser
        755                 760                 765
att tca ttg gta cct ggt act gat tat ggc act cag gaa agt atc tcg    2471
Ile Ser Leu Val Pro Gly Thr Asp Tyr Gly Thr Gln Glu Ser Ile Ser
    770                 775                 780
tta ctg gaa gtt agc act cta ggg aag gca aaa aca gaa cca aat aaa    2519
Leu Leu Glu Val Ser Thr Leu Gly Lys Ala Lys Thr Glu Pro Asn Lys
785                 790                 795                 800
tgt gtg agt cag tgt gca gca ttt gaa aac ccc aag gga cta att cat    2567
Cys Val Ser Gln Cys Ala Ala Phe Glu Asn Pro Lys Gly Leu Ile His
                805                 810                 815
ggt tgt tcc aaa gat aat aga aat gac aca gaa ggc ttt aag tat cca    2615
Gly Cys Ser Lys Asp Asn Arg Asn Asp Thr Glu Gly Phe Lys Tyr Pro
            820                 825                 830
ttg gga cat gaa gtt aac cac agt cgg gaa aca agc ata gaa atg gaa    2663
Leu Gly His Glu Val Asn His Ser Arg Glu Thr Ser Ile Glu Met Glu
        835                 840                 845
gaa agt gaa ctt gat gct cag tat ttg cag aat aca ttc aag gtt tca    2711
Glu Ser Glu Leu Asp Ala Gln Tyr Leu Gln Asn Thr Phe Lys Val Ser
    850                 855                 860
aag cgc cag tca ttt gct ccg ttt tca aat cca gga aat gca gaa gag    2759
Lys Arg Gln Ser Phe Ala Pro Phe Ser Asn Pro Gly Asn Ala Glu Glu
865                 870                 875                 880
gaa tgt gca aca ttc tct gcc cac tct ggg tcc tta aag aaa caa agt    2807
Glu Cys Ala Thr Phe Ser Ala His Ser Gly Ser Leu Lys Lys Gln Ser
                885                 890                 895
cca aaa gtc act ttt gaa tgt gaa caa aag gaa gaa aat caa gga aag    2855
Pro Lys Val Thr Phe Glu Cys Glu Gln Lys Glu Glu Asn Gln Gly Lys
            900                 905                 910
aat gag tct aat atc aag cct gta cag aca gtt aat atc act gca ggc    2903
Asn Glu Ser Asn Ile Lys Pro Val Gln Thr Val Asn Ile Thr Ala Gly
        915                 920                 925
ttt cct gtg gtt ggt cag aaa gat aag cca gtt gat aat gcc aaa tgt    2951
Phe Pro Val Val Gly Gln Lys Asp Lys Pro Val Asp Asn Ala Lys Cys
    930                 935                 940
agt atc aaa gga ggc tct agg ttt tgt cta tca tct cag ttc aga ggc    2999
Ser Ile Lys Gly Gly Ser Arg Phe Cys Leu Ser Ser Gln Phe Arg Gly
945                 950                 955                 960
aac gaa act gga ctc att act cca aat aaa cat gga ctt tta caa aac    3047
Asn Glu Thr Gly Leu Ile Thr Pro Asn Lys His Gly Leu Leu Gln Asn
                965                 970                 975
cca tat cgt ata cca cca ctt ttt ccc atc aag tca ttt gtt aaa act    3095
Pro Tyr Arg Ile Pro Pro Leu Phe Pro Ile Lys Ser Phe Val Lys Thr
            980                 985                 990
aaa tgt aag aaa aat ctg cta gag gaa aac ttt gag gaa cat tca atg    3143
Lys Cys Lys Lys Asn Leu Leu Glu Glu Asn Phe Glu Glu His Ser Met
        995                 1000                1005
tca cct gaa aga gaa atg gga aat gag aac att cca agt aca gtg        3188
Ser Pro Glu Arg Glu Met Gly Asn Glu Asn Ile Pro Ser Thr Val
    1010                1015                1020
agc aca att agc cgt aat aac att aga gaa aat gtt ttt aaa gaa        3233
Ser Thr Ile Ser Arg Asn Asn Ile Arg Glu Asn Val Phe Lys Glu
    1025                1030                1035
gcc agc tca agc aat att aat gaa gta ggt tcc agt act aat gaa        3278
Ala Ser Ser Ser Asn Ile Asn Glu Val Gly Ser Ser Thr Asn Glu
    1040                1045                1050
gtg ggc tcc agt att aat gaa ata ggt tcc agt gat gaa aac att        3323
Val Gly Ser Ser Ile Asn Glu Ile Gly Ser Ser Asp Glu Asn Ile
    1055                1060                1065
caa gca gaa cta ggt aga aac aga ggg cca aaa ttg aat gct atg        3368
Gln Ala Glu Leu Gly Arg Asn Arg Gly Pro Lys Leu Asn Ala Met
    1070                1075                1080
ctt aga tta ggg gtt ttg caa cct gag gtc tat aaa caa agt ctt        3413
Leu Arg Leu Gly Val Leu Gln Pro Glu Val Tyr Lys Gln Ser Leu
    1085                1090                1095
cct gga agt aat tgt aag cat cct gaa ata aaa aag caa gaa tat        3458
Pro Gly Ser Asn Cys Lys His Pro Glu Ile Lys Lys Gln Glu Tyr
    1100                1105                1110
gaa gaa gta gtt cag act gtt aat aca gat ttc tct cca tat ctg    3503
Glu Glu Val Val Gln Thr Val Asn Thr Asp Phe Ser Pro Tyr Leu
    1115                1120                1125
att tca gat aac tta gaa cag cct atg gga agt agt cat gca tct    3548
Ile Ser Asp Asn Leu Glu Gln Pro Met Gly Ser Ser His Ala Ser
    1130                1135                1140
cag gtt tgt tct gag aca cct gat gac ctg tta gat gat ggt gaa    3593
Gln Val Cys Ser Glu Thr Pro Asp Asp Leu Leu Asp Asp Gly Glu
    1145                1150                1155
ata aag gaa gat act agt ttt gct gaa aat gac ttt aag gaa agt    3638
Ile Lys Glu Asp Thr Ser Phe Ala Glu Asn Asp Phe Lys Glu Ser
    1160                1165                1170
tct gct gtt ttt agc aaa agc gtc cag aaa gga gag ctt agc agg    3683
Ser Ala Val Phe Ser Lys Ser Val Gln Lys Gly Glu Leu Ser Arg
    1175                1180                1185
agt cct agc cct ttc acc cat aca cat ttg gct cag ggt tac cga    3728
Ser Pro Ser Pro Phe Thr His Thr His Leu Ala Gln Gly Tyr Arg
    1190                1195                1200
aga ggg gcc aag aaa tta gag tcc tca gaa gag aac tta tct agt    3773
Arg Gly Ala Lys Lys Leu Glu Ser Ser Glu Glu Asn Leu Ser Ser
    1205                1210                1215
gag gat gaa gag ctt ccc tgc ttc caa cac ttg tta ttt ggt aaa    3818
Glu Asp Glu Glu Leu Pro Cys Phe Gln His Leu Leu Phe Gly Lys
    1220                1225                1230
gta aac aat ata cct tct cag tct act agg cat agc acc gtt gct    3863
Val Asn Asn Ile Pro Ser Gln Ser Thr Arg His Ser Thr Val Ala
    1235                1240                1245
acc gag tgt ctg tct aag aac aca gag gag aat tta tta tca ttg    3908
Thr Glu Cys Leu Ser Lys Asn Thr Glu Glu Asn Leu Leu Ser Leu
    1250                1255                1260
aag aat agc tta aat gac tgc agt aac cag gta ata ttg gca aag    3953
Lys Asn Ser Leu Asn Asp Cys Ser Asn Gln Val Ile Leu Ala Lys
    1265                1270                1275
gca tct cag gaa cat cac ctt agt gag gaa aca aaa tgt tct gct    3998
Ala Ser Gln Glu His His Leu Ser Glu Glu Thr Lys Cys Ser Ala
    1280                1285                1290
agc ttg ttt tct tca cag tgc agt gaa ttg gaa gac ttg act gca    4043
Ser Leu Phe Ser Ser Gln Cys Ser Glu Leu Glu Asp Leu Thr Ala
    1295                1300                1305
aat aca aac acc cag gat cct ttc ttg att ggt tct tcc aaa caa    4088
Asn Thr Asn Thr Gln Asp Pro Phe Leu Ile Gly Ser Ser Lys Gln
    1310                1315                1320
atg agg cat cag tct gaa agc cag gga gtt ggt ctg agt gac aag    4133
Met Arg His Gln Ser Glu Ser Gln Gly Val Gly Leu Ser Asp Lys
    1325                1330                1335
gaa ttg gtt tca gat gat gaa gaa aga gga acg ggc ttg gaa gaa    4178
Glu Leu Val Ser Asp Asp Glu Glu Arg Gly Thr Gly Leu Glu Glu
    1340                1345                1350
aat aat caa gaa gag caa agc atg gat tca aac tta ggt gaa gca    4223
Asn Asn Gln Glu Glu Gln Ser Met Asp Ser Asn Leu Gly Glu Ala
    1355                1360                1365
gca tct ggg tgt gag agt gaa aca agc gtc tct gaa gac tgc tca    4268
Ala Ser Gly Cys Glu Ser Glu Thr Ser Val Ser Glu Asp Cys Ser
    1370                1375                1380
ggg cta tcc tct cag agt gac att tta acc act cag cag agg gat    4313
Gly Leu Ser Ser Gln Ser Asp Ile Leu Thr Thr Gln Gln Arg Asp
    1385                1390                1395
acc atg caa cat aac ctg ata aag ctc cag cag gaa atg gct gaa    4358
Thr Met Gln His Asn Leu Ile Lys Leu Gln Gln Glu Met Ala Glu
    1400                1405                1410
cta gaa gct gtg tta gaa cag cat ggg agc cag cct tct aac agc    4403
Leu Glu Ala Val Leu Glu Gln His Gly Ser Gln Pro Ser Asn Ser
    1415                1420                1425
tac cct tcc atc ata agt gac tct tct gcc ctt gag gac ctg cga    4448
Tyr Pro Ser Ile Ile Ser Asp Ser Ser Ala Leu Glu Asp Leu Arg
    1430                1435                1440
aat cca gaa caa agc aca tca gaa aaa gca gta tta act tca cag    4493
Asn Pro Glu Gln Ser Thr Ser Glu Lys Ala Val Leu Thr Ser Gln
    1445                1450                1455
aaa agt agt gaa tac cct ata agc cag aat cca gaa ggc ctt tct    4538
Lys Ser Ser Glu Tyr Pro Ile Ser Gln Asn Pro Glu Gly Leu Ser
    1460                1465                1470
gct gac aag ttt gag gtg tct gca gat agt tct acc agt aaa aat    4583
Ala Asp Lys Phe Glu Val Ser Ala Asp Ser Ser Thr Ser Lys Asn
    1475                1480                1485
aaa gaa cca gga gtg gaa agg tca tcc cct tct aaa tgc cca tca    4628
Lys Glu Pro Gly Val Glu Arg Ser Ser Pro Ser Lys Cys Pro Ser
    1490                1495                1500
tta gat gat agg tgg tac atg cac agt tgc tct ggg agt ctt cag    4673
Leu Asp Asp Arg Trp Tyr Met His Ser Cys Ser Gly Ser Leu Gln
    1505                1510                1515
aat aga aac tac cca tct caa gag gag ctc att aag gtt gtt gat    4718
Asn Arg Asn Tyr Pro Ser Gln Glu Glu Leu Ile Lys Val Val Asp
    1520                1525                1530
gtg gag gag caa cag ctg gaa gag tct ggg cca cac gat ttg acg    4763
Val Glu Glu Gln Gln Leu Glu Glu Ser Gly Pro His Asp Leu Thr
    1535                1540                1545
gaa aca tct tac ttg cca agg caa gat cta gag gga acc cct tac    4808
Glu Thr Ser Tyr Leu Pro Arg Gln Asp Leu Glu Gly Thr Pro Tyr
    1550                1555                1560
ctg gaa tct gga atc agc ctc ttc tct gat gac cct gaa tct gat    4853
Leu Glu Ser Gly Ile Ser Leu Phe Ser Asp Asp Pro Glu Ser Asp
    1565                1570                1575
cct tct gaa gac aga gcc cca gag tca gct cgt gtt ggc aac ata    4898
Pro Ser Glu Asp Arg Ala Pro Glu Ser Ala Arg Val Gly Asn Ile
    1580                1585                1590
cca tct tca acc tct gca ttg aaa gtt ccc caa ttg aaa gtt gca    4943
Pro Ser Ser Thr Ser Ala Leu Lys Val Pro Gln Leu Lys Val Ala
    1595                1600                1605
gaa tct gcc cag agt cca gct gct gct cat act act gat act gct    4988
Glu Ser Ala Gln Ser Pro Ala Ala Ala His Thr Thr Asp Thr Ala
    1610                1615                1620
ggg tat aat gca atg gaa gaa agt gtg agc agg gag aag cca gaa    5033
Gly Tyr Asn Ala Met Glu Glu Ser Val Ser Arg Glu Lys Pro Glu
    1625                1630                1635
ttg aca gct tca aca gaa agg gtc aac aaa aga atg tcc atg gtg    5078
Leu Thr Ala Ser Thr Glu Arg Val Asn Lys Arg Met Ser Met Val
    1640                1645                1650
gtg tct ggc ctg acc cca gaa gaa ttt atg ctc gtg tac aag ttt    5123
Val Ser Gly Leu Thr Pro Glu Glu Phe Met Leu Val Tyr Lys Phe
    1655                1660                1665
gcc aga aaa cac cac atc act tta act aat cta att act gaa gag    5168
Ala Arg Lys His His Ile Thr Leu Thr Asn Leu Ile Thr Glu Glu
    1670                1675                1680
act act cat gtt gtt atg aaa aca gat gct gag ttt gtg tgt gaa    5213
Thr Thr His Val Val Met Lys Thr Asp Ala Glu Phe Val Cys Glu
    1685                1690                1695
cgg aca ctg aaa tat ttt cta gga att gcg gga gga aaa tgg gta    5258
Arg Thr Leu Lys Tyr Phe Leu Gly Ile Ala Gly Gly Lys Trp Val
    1700                1705                1710
gtt agc tat ttc tgg gtg acc cag tct att aaa gaa aga aaa atg    5303
Val Ser Tyr Phe Trp Val Thr Gln Ser Ile Lys Glu Arg Lys Met
    1715                1720                1725
ctg aat gag cat gat ttt gaa gtc aga gga gat gtg gtc aat gga    5348
Leu ASn Glu His Asp Phe Glu Val Arg Gly Asp Val Val Asn Gly
    1730                1735                1740
aga aac cae caa ggt cca aag cga gca aga gaa tcc cag gac aga    5393
Arg Asn His Gln Gly Pro Lys Arg Ala Arg Glu Ser Gln Asp Arg
    1745                1750                1755
aag atc tte agg ggg cta gaa ate tgt tgc tat ggg ccc ttc acc    5438
Lys Ile Phe Arg Gly Leu Glu Ile Cys Cys Tyr Gly Pro Phe Thr
    1760                1765                1770
aac atg ccc aca gat caa ctg gaa tgg atg gta cag ctg tgt ggt    5483
Asn Met Pro Thr Asp Gln Leu Glu Trp Met Val Gln Leu Cys Gly
    1775                1780                1785
gct tct gtg gtg aag gag ctt tca tca ttc acc ctt ggc aca ggt    5528
Ala Ser Val Val Lys Glu Leu Ser Ser Phe Thr Leu Gly Thr Gly
    1790                1795                1800
gtc cac cca att gtg gtt gtg cag cca gat gcc tgg aca gag gac    5573
Val His Pro Ile Val Val Val Gln Pro Asp Ala Trp Thr Glu Asp
    1805                1810                1815
aat ggc ttc cat gca att ggg cag atg tgt gag gca cct gtg gtg    5618
Asn Gly Phe His Ala Ile Gly Gln Met Cys Glu Ala Pro Val Val
    1820                1825                1830
acc cga gag tgg gtg ttg gac agt gta gca ctc tac cag tgc cag    5663
Thr Arg Glu Trp Val Leu Asp Ser Val Ala Leu Tyr Gln Cys Gln
    1835                1840                1845
gag ctg gac acc tac ctg ata ccc cag atc ccc cac agc cac tac    5708
Glu Leu Asp Thr Tyr Leu Ile Pro Gln Ile Pro His Ser His Tyr
    1850                1855                1860
tga                                                            5711
<210>2
<211>1863
<212>PRT
<213>人(Homo sapiens)
<400>2
Met Asp Leu Ser Ala Leu Arg Val Glu Glu Val Gln Asn Val Ile Asn
1               5                   10                  15
Ala Met Gln Lys Ile Leu Glu Cys Pro Ile Cys Leu Glu Leu Ile Lys
            20                  25                  30
Glu Pro Val Ser Thr Lys Cys Asp His Ile Phe Cys Lys Phe Cys Met
        35                  40                  45
Leu Lys Leu Leu Asn Gln Lys Lys Gly Pro Ser Gln Cys Pro Leu Cys
    50                  55                  60
Lys Asn Asp Ile Thr Lys Arg Ser Leu Gln Glu Ser Thr Arg Phe Ser
65                  70                  75                  80
Gln Leu Val Glu Glu Leu Leu Lys Ile Ile Cys Ala Phe Gln Leu Asp
                85                  90                  95
Thr Gly Leu Glu Tyr Ala Asn Ser Tyr Asn Phe Ala Lys Lys Glu Asn
            100                 105                 110
Asn Ser Pro Glu His Leu Lys Asp Glu Val Ser Ile Ile Gln Ser Met
        115                 120                 125
Gly Tyr Arg Asn Arg Ala Lys Arg Leu Leu Gln Ser Glu Pro Glu Asn
    130                 135                 140
Pro Ser Leu Gln Glu Thr Ser Leu Ser Val Gln Leu Ser Asn Leu Gly
145                 150                 155                 160
Thr Val Arg Thr Leu Arg Thr Lys Gln Arg Ile Gln Pro Gln Lys Thr
                165                 170                 175
Ser Val Tyr Ile Glu Leu Gly Ser Asp Ser Ser Glu Asp Thr Val Asn
            180                 185                 190
Lys Ala Thr Tyr Cys Ser Val Gly Asp Gln Glu Leu Leu Gln Ile Thr
        195                 200                 205
Pro Gln Gly Thr Arg Asp Glu Ile Ser Leu Asp Ser Ala Lys Lys Ala
    210                 215                 220
Ala Cys Glu Phe Ser Glu Thr Asp Val Thr Asn Thr Glu His His Gln
225                 230                 235                 240
Pro Ser Asn Asn Asp Leu Asn Thr Thr Glu Lys Arg Ala Ala Glu Arg
                245                 250                 255
His Pro Glu Lys Tyr Gln Gly Ser Ser Val Ser Asn Leu His Val Glu
            260                 265                 270
Pro Cys Gly Thr Asn Thr His Ala Ser Ser Leu Gln His Glu Asn Ser
        275                 280                 285
Ser Leu Leu Leu Thr Lys Asp Arg Met Asn Val Glu Lys Ala Glu Phe
    290                 295                 300
Cys Asn Lys Ser Lys Gln Pro Gly Leu Ala Arg Ser Gln His Asn Arg
305                 310                 315                 320
Trp Ala Gly Ser Lys Glu Thr Cys Asn Asp Arg Arg Thr Pro Ser Thr
                325                 330                 335
Glu Lys Lys Val Asp Leu Asn Ala Asp Pro Leu Cys Glu Arg Lys Glu
            340                 345                 350
Trp Asn Lys Gln Lys Leu Pro Cys Ser Glu Asn Pro Arg Asp Thr Glu
        355                 360                 365
Asp Val Pro Trp Ile Thr Leu Asn Ser Ser Ile Gln Lys Val Asn Glu
    370                 375                 380
Trp Phe Ser Arg Ser Asp Glu Leu Leu Gly Ser Asp Asp Ser His Asp
385                 390                 395                 400
Gly Glu Ser Glu Ser Asn Ala Lys Val Ala Asp Val Leu Asp Val Leu
                405                 410                 415
Asn Glu Val Asp Glu Tyr Ser Gly Ser Ser Glu Lys Ile Asp Leu Leu
            420                 425                 430
Ala Ser Asp Pro His Glu Ala Leu Ile Cys Lys Ser Glu Arg Val His
        435                 440                 445
Ser Lys Ser Val Glu Ser Asn Ile Glu Asp Lys Ile Phe Gly Lys Thr
    450                 455                 460
Tyr Arg Lys Lys Ala Ser Leu Pro Asn Leu Ser His Val Thr Glu Asn
465                 470                 475                 480
Leu Ile Ile Gly Ala Phe Val Thr Glu Pro Gln Ile Ile Gln Glu Arg
                485                 490                 495
Pro Leu Thr Asn Lys Leu Lys Arg Lys Arg Arg Pro Thr Ser Gly Leu
            500                 505                 510
His Pro Glu Asp Phe Ile Lys Lys Ala Asp Leu Ala Val Gln Lys Thr
        515                 520                 525
Pro Glu Met Ile Asn Gln Gly Thr Asn Gln Thr Glu Gln Asn Gly Gln
    530                 535                 540
Val Met Asn Ile Thr Asn Ser Gly His Glu Asn Lys Thr Lys Gly Asp
545                 550                 555                 560
Ser Ile Gln Asn Glu Lys Asn Pro Asn Pro Ile Glu Ser Leu Glu Lys
                565                 570                 575
Glu Ser Ala Phe Lys Thr Lys Ala Glu Pro Ile Ser Ser Ser Ile Ser
            580                 585                 590
Asn Met Glu Leu Glu Leu Asn Ile His Asn Ser Lys Ala Pro Lys Lys
        595                 600                 605
Asn Arg Leu Arg Arg Lys Ser Ser Thr Arg His Ile His Ala Leu Glu
    610                 615                 620
Leu Val Val Ser Arg Asn Leu Ser Pro Pro Asn Cys Thr Glu Leu Gln
625                 630                 635                 640
Ile Asp Ser Cys Ser Ser Ser Glu Glu Ile Lys Lys Lys Lys Tyr Asn
                645                 650                 655
Gln Met Pro Val Arg His Ser Arg Asn Leu Gln Leu Met Glu Gly Lys
            660                 665                 670
Glu Pro Ala Thr Gly Ala Lys Lys Ser Asn Lys Pro Asn Glu Gln Thr
        675                 680                 685
Ser Lys Arg His Asp Ser Asp Thr Phe Pro Glu Leu Lys Leu Thr Asn
    690                 695                 700
Ala Pro Gly Ser Phe Thr Lys Cys Ser Asn Thr Ser Glu Leu Lys Glu
705                 710                 715                 720
Phe Val Asn Pro Ser Leu Pro Arg Glu Glu Lys Glu Glu Lys Leu Glu
                725                 730                 735
Thr Val Lys Val Ser Asn Asn Ala Glu Asp Pro Lys Asp Leu Met Leu
            740                 745                 750
Ser Gly Glu Arg Val Leu Gln Thr Glu Arg Ser Val Glu Ser Ser Ser
        755                 760                 765
Ile Ser Leu Val Pro Gly Thr Asp Tyr Gly Thr Gln Glu Ser Ile Ser
    770                 775                 780
Leu Leu Glu Val Ser Thr Leu Gly Lys Ala Lys Thr Glu Pro Asn Lys
785                 790                 795                 800
Cys Val Ser Gln Cys Ala Ala Phe Glu Asn Pro Lys Gly Leu Ile His
                805                 810                 815
Gly Cys Ser Lys Asp Asn Arg Asn Asp Thr Glu Gly Phe Lys Tyr Pro
            820                 825                 830
Leu Gly His Glu Val Asn His Ser Arg Glu Thr Ser Ile Glu Met Glu
        835                 840                 845
Glu Ser Glu Leu Asp Ala Gln Tyr Leu Gln Asn Thr Phe Lys Val Ser
    850                 855                 860
Lys Arg Gln Ser Phe Ala Pro Phe Ser Asn Pro Gly Asn Ala Glu Glu
865                 870                 875                 880
Glu Cys Ala Thr Phe Ser Ala His Ser Gly Ser Leu Lys Lys Gln Ser
                885                 890                 895
Pro Lys Val Thr Phe Glu Cys Glu Gln Lys Glu Glu Asn Gln Gly Lys
            900                 905                 910
Asn Glu Ser Asn Ile Lys Pro Val Gln Thr Val Asn Ile Thr Ala Gly
        915                 920                 925
Phe Pro Val Val Gly Gln Lys Asp Lys Pro Val Asp Asn Ala Lys Cys
    930                 935                 940
Ser Ile Lys Gly Gly Ser Arg Phe Cys Leu Ser Ser Gln Phe Arg Gly
945                 950                 955                 960
Asn Glu Thr Gly Leu Ile Thr Pro Asn Lys His Gly Leu Leu Gln Asn
                965                 970                 975
Pro Tyr Arg Ile Pro Pro Leu Phe Pro Ile Lys Ser Phe Val Lys Thr
            980                 985                 990
Lys Cys Lys Lys Asn Leu Leu Glu Glu Asn Phe Glu Glu His Ser Met
        995                 1000                1005
Ser Pro Glu Arg Glu Met Gly Asn Glu Asn Ile Pro Ser Thr Val
    1010                1015                1020
Ser Thr Ile Ser Arg Asn Asn Ile Arg Glu Asn Val Phe Lys Glu
    1025                1030                1035
Ala Ser Ser Ser Asn Ile Asn Glu Val Gly Ser Ser Thr Asn Glu
    1040                1045                1050
Val Gly Ser Ser Ile Asn Glu Ile Gly Ser Ser Asp Glu Asn Ile
    1055                1060                1065
Gln Ala Glu Leu Gly Arg Asn Arg Gly Pro Lys Leu Asn Ala Met
    1070                1075                1080
Leu Arg Leu Gly Val Leu Gln Pro Glu Val Tyr Lys Gln Ser Leu
    1085                1090                1095
Pro Gly Ser Asn Cys Lys His Pro Glu Ile Lys Lys Gln Glu Tyr
    1100                1105                1110
Glu Glu Val Val Gln Thr Val Asn Thr Asp Phe Ser Pro Tyr Leu
    1115                1120                1125
Ile Ser Asp Asn Leu Glu Gln Pro Met Gly Ser Ser His Ala Ser
    1130                1135                1140
Gln Val Cys Ser Glu Thr Pro Asp Asp Leu Leu Asp Asp Gly Glu
    1145                1150                1155
Ile Lys Glu Asp Thr Ser Phe Ala Glu Asn Asp Phe Lys Glu Ser
    1160                1165                1170
Ser Ala Val Phe Ser Lys Ser Val Gln Lys Gly Glu Leu Ser Arg
    1175                1180                1185
Ser Pro Ser Pro Phe Thr His Thr His Leu Ala Gln Gly Tyr Arg
    1190                1195                1200
Arg Gly Ala Lys Lys Leu Glu Ser Ser Glu Glu Asn Leu Ser Ser
    1205                1210                1215
Glu Asp Glu Glu Leu Pro Cys Phe Gln His Leu Leu Phe Gly Lys
    1220                1225                1230
Val Asn Asn Ile Pro Ser Gln Ser Thr Arg His Ser Thr Val Ala
    1235                1240                1245
Thr Glu Cys Leu Ser Lys Asn Thr Glu Glu Asn Leu Leu Ser Leu
    1250                1255                1260
Lys Asn Ser Leu Asn Asp Cys Ser Asn Gln Val Ile Leu Ala Lys
    1265                1270                1275
Ala Ser Gln Glu His His Leu Ser Glu Glu Thr Lys Cys Ser Ala
    1280                1285                1290
Ser Leu Phe Ser Ser Gln Cys Ser Glu Leu Glu Asp Leu Thr Ala
    1295                1300                1305
Asn Thr Asn Thr Gln Asp Pro Phe Leu Ile Gly Ser Ser Lys Gln
    1310                1315                1320
Met Arg His Gln Ser Glu Ser Gln Gly Val Gly Leu Ser Asp Lys
    1325                1330                1335
Glu Leu Val Ser Asp Asp Glu Glu Arg Gly Thr Gly Leu Glu Glu
    1340                1345                1350
Asn Asn Gln Glu Glu Gln Ser Met Asp Ser Asn Leu Gly Glu Ala
    1355                1360                1365
Ala Ser Gly Cys Glu Ser Glu Thr Ser Val Ser Glu Asp Cys Ser
    1370                1375                1380
Gly Leu Ser Ser Gln Ser Asp Ile Leu Thr Thr Gln Gln Arg Asp
    1385                1390                1395
Thr Met Gln His Asn Leu Ile Lys Leu Gln Gln Glu Met Ala Glu
    1400                1405                1410
Leu Glu Ala Val Leu Glu Gln His Gly Ser Gln Pro Ser Asn Ser
    1415                1420                1425
Tyr Pro Ser Ile Ile Ser Asp Ser Ser Ala Leu Glu Asp Leu Arg
    1430                1435                1440
Asn Pro Glu Gln Ser Thr Ser Glu Lys Ala Val Leu Thr Ser Gln
    1445                1450                1455
Lys Ser Ser Glu Tyr Pro Ile Ser Gln Asn Pro Glu Gly Leu Ser
    1460                1465                1470
Ala Asp Lys Phe Glu Val Ser Ala Asp Ser Ser Thr Ser Lys Asn
    1475                1480                1485
Lys Glu Pro Gly yal Glu Arg Ser Ser Pro Ser Lys Cys Pro Ser
    1490                1495                1500
Leu Asp Asp Arg Trp Tyr Met His Ser Cys Ser Gly Ser Leu Gln
    1505                1510                1515
Asn Arg Asn Tyr Pro Ser Gln Glu Glu Leu Ile Lys Val Val Asp
    1520                1525                1530
Val Glu Glu Gln Gln Leu Glu Glu Ser Gly Pro His Asp Leu Thr
    1535                1540                1545
Glu Thr Ser Tyr Leu Pro Arg Gln Asp Leu Glu Gly Thr Pro Tyr
    1550                1555                1560
Leu Glu Ser Gly Ile Ser Leu Phe Ser Asp Asp Pro Glu Ser Asp
    1565                1570                1575
Pro Ser Glu Asp Arg Ala Pro Glu Ser Ala Arg Val Gly Asn Ile
    1580                1585                1590
Pro Ser Ser Thr Ser Ala Leu Lys Val Pro Gln Leu Lys Val Ala
    1595                1600                1605
Glu Ser Ala Gln Ser Pro Ala Ala Ala His Thr Thr Asp Thr Ala
    1610                1615                1620
Gly Tyr Asn Ala Met Glu Glu Ser Val Ser Arg Glu Lys Pro Glu
    1625                1630                1635
Leu Thr Ala Ser Thr Glu Arg Val Asn Lys Arg Met Ser Met Val
    1640                1645                1650
Val Ser Gly Leu Thr Pro Glu Glu Phe Met Leu Val Tyr Lys Phe
    1655                1660                1665
Ala Arg Lys His His Ile Thr Leu Thr Asn Leu Ile Thr Glu Glu
    1670                1675                1680
Thr Thr His Val Val Met Lys Thr Asp Ala Glu Phe Val Cys Glu
    1685                1690                1695
Arg Thr Leu Lys Tyr Phe Leu Gly Ile Ala Gly Gly Lys Trp Val
    1700                1705                1710
Val Ser Tyr Phe Trp Val Thr Gln Ser Ile Lys Glu Arg Lys Met
    1715                1720                1725
Leu Asn Glu His Asp Phe Glu Val Arg Gly Asp Val Val Asn Gly
    1730                1735                1740
Arg Asn His Gln Gly Pro Lys Arg Ala Arg Glu Ser Gln Asp Arg
    1745                1750                1755
Lys Ile Phe Arg Gly Leu Glu Ile Cys Cys Tyr Gly Pro Phe Thr
    1760                1765                1770
Asn Met Pro Thr Asp Gln Leu Glu Trp Met Val Gln Leu Cys Gly
    1775                1780                1785
Ala Ser Val Val Lys Glu Leu Ser Ser Phe Thr Leu Gly Thr Gly
    1790                1795                1800
Val His Pro Ile Val Val Val Gln Pro Asp Ala Trp Thr Glu Asp
    1805                1810                1815
Asn Gly Phe His Ala Ile Gly Gln Met Cys Glu Ala Pro Val Val
    1820                1825                1830
Thr Arg Glu Trp Val Leu Asp Ser Val Ala Leu Tyr Gln Cys Gln
    1835                1840                1845
Glu Leu Asp Thr Tyr Leu Ile Pro Gln Ile Pro His Ser His Tyr
    1850                1855                1860
<210>3
<211>23
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>3
aggacgttgt cattagttct ttg                                                23
<210>4
<211>22
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>4
aaggtcaatt ctgttcattt gc                                                 22
<210>5
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>5
gcttgtaatt cacctgccat                                                    20
<210>6
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>6
ttcctactgt ggttgcttcc                                                    20
<210>7
<211>21
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>7
agctgactga tgatrggtca a                                                  21
<210>8
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
aaattcactt cccaaagctg                                                   20
<210>9
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>9
tgccacagta gatgctcagt                                                   20
<210>10
<211>22
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>10
cacatacatc cctgaaccta aa                                                22
<210>11
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>11
tagccagttg gttgatttcc                                                   20
<210>12
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>12
cccatctgtt atgttggctc                                                   20
<210>13
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>13
ccatgtggca caaatactca                                                   20
<210>14
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>14
tgattcagac tccccatcat                                                    20
<210>15
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>15
tccccaactt aagccatgta                                                    20
<210>16
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>16
agaagacttc ctcctcagcc                                                    20
<210>17
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>17
ttcaaaacga aagctgaacc                                                    20
<210>18
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>18
ttggaaggct aggattgaca                                                    20
<210>19
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>19
ggtaaagaac ctgcaactgg                                                    20
<210>20
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>20
tcaaatgctg cacactgact                                                    20
<210>21
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>21
gaaagggttt tgcaaactga                                                    20
<210>22
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>22
ttcctcttct gcatttcctg                                                    20
<210>23
<211>23
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>23
tgaacttgat gctcagtatt tgc                                                23
<210>24
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>24
agtccagttt cgttgcctct                                                    20
<210>25
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>25
taagccagtt gataatgcca                                                   20
<210>26
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>26
ttttggccct ctgtttctac                                                   20
<210>27
<211>22
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>27
ttcctggaag taattgtaag ca                                                22
<210>28
<211>22
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>28
taaccctgag ccaaatgtgt at                                                22
<210>29
<211>22
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>29
gacattaagg aaagttctgc tg                                                22
<210>30
<211>22
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>30
tttgccaata ttacctggtt ac                                                 22
<210>31
<211>21
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>31
gtcccaaagc aagtgaattt a                                                  21
<210>32
<211>21
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>32
tcaaagagat gatgtcagca a                                                  21
<210>33
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>33
ggtgatttca attcctgtgc                                                    20
<210>34
<211>23
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>34
aaatgttgga gctaggtcct tac                                                23
<210>35
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>35
ttgccagtca tttctgatct                                                    20
<210>36
<211>22
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>36
aaaccttgat taacacttga gc                                                    22
<210>37
<211>22
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>37
cactgtattc atgtacccat tt                                                    22
<210>38
<211>21
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>38
caaaagtgct gcgattacag g                                                     21
<210>39
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>39
tgtagaacgt gcaggattgc                                                       20
<210>40
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>40
caaagtgctg cgattacagg                                                       20
<210>41
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>41
agtggtgttt tcagcctctg                                                      20
<210>42
<211>20
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>42
ctcagactca gcatcagcaa                                                      20
<210>43
<211>21
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>43
tgctaggatt acaggggtga g                                                    21
<210>44
<211>21
<212>DNA
<213>人工序列
<220>
<223>扩增引物
<400>44
tttatgtggt tgggatggaa g                                                    21
<210>45
<211>20
<212>DNA
<213>人工序列
<220>
<223>下游杂交寡核苷酸
<400>45
attttcagca aaactagtat                                                      20
<210>46
<211>15
<212>DNA
<213>人工序列
<220>
<223>上游杂交寡核苷酸
<400>46
agaactttcc ttaat                                                           15
<210>47
<211>15
<212>DNA
<213>人工序列
<220>
<223>上游杂交寡核苷酸
<400>47
agaactttcc ttaaa                                                        15
<210>48
<211>20
<212>DNA
<213>人工序列
<220>
<223>上游杂交寡核苷酸
<400>48
acagcagaac tttccttaat                                                   20
<210>49
<211>20
<212>DNA
<213>人工序列
<220>
<223>上游杂交寡核苷酸
<400>49
acagcagaac tttccttaaa                                                   20
<210>50
<211>30
<212>DNA
<213>人工序列
<220>
<223>上游杂交寡核苷酸
<400>50
tttgctaaaa acagcagaac tttccttaat                                        30
<210>51
<211>30
<212>DNA
<213>人工序列
<220>
<223>上游杂交寡核苷酸
<400>51
tttgctaaaa acagcagaac tttccttaaa                                        30
<210>52
<211>40
<212>DNA
<213>人工序列
<220>
<223>融合的寡核苷酸
<400>52
attttcagca aaactagtat cttacgtcga tccgtaccgt                              40
<210>53
<211>55
<212>DNA
<213>人工序列
<220>
<223>融合的寡核苷酸
<400>53
tcgatttgcg attcctatcc tctatcgtcg cgccgtggca agaactttcc ttaat             55
<210>54
<211>55
<212>DNA
<213>人工序列
<220>
<223>融合的寡核苷酸
<400>54
tcgatttgcg attcctatcc tacagtcggt cgcgtgcctc agaactttcc ttaaa             55
<210>55
<211>60
<212>DNA
<213>人工序列
<220>
<223>融合的寡核苷酸
<400>55
tcgatttgcg attcctatcc tctatcgtcg cgccgtggca acagcagaac tttccttaat        60
<210>56
<211>60
<212>DNA
<213>人工序列
<220>
<223>融合的寡核苷酸
<400>56
tcgatttgcg attcctatcc tacagtcggt cgcgtgcctc acagcagaac tttccttaaa        60
<210>57
<211>70
<212>DNA
<213>人工序列
<220>
<223>融合的寡核苷酸
<400>57
tcgatttgcg attcctatcc tctatcgtcg cgccgtggca tttgctaaaa acagcagaac        60
tttccttaat                                                               70
<210>58
<211>70
<213>人工序列
<220>
<223>融合的寡核苷酸
<400>58
tcgatttgcg attcctatcc tacagtcggt cgcgtgcctc tttgctaaaa acagcagaac    60
tttccttaaa                                                           70
<210>59
<211>20
<212>DNA
<213>人工序列
<220>
<223>检测A的标签序列
<400>59
tctatcgtcg cgccgtggca                                                20
<210>60
<211>20
<212>DNA
<213>人工序列
<220>
<223>检测T的标签序列
<400>60
tacagtcggt cgcgtgcctc                                                20
<210>61
<211>20
<212>DNA
<213>人工序列
<220>
<223>下游通用序列
<400>61
cttacgtcga tccgtaccgt                                                20
<210>62
<211>20
<212>DNA
<213>人工序列
<220>
<223>上游通用序列
<400>62
tcgatttgcg attcctatcc                                                20
<210>63
<211>17
<212>DNA
<213>人工序列
<220>
<223>检测A的DASH探针
<400>63
ttccttaatg tcatttt                                                       17
<210>64
<211>17
<212>DNA
<213>人工序列
<220>
<223>检测T的DASH探针
<400>64
ttccttaaag tcatttt                                                       17

Claims (15)

1.核酸片段,其包含对应于SEQ ID NO:1的位置3627的多态性位点,并且包含SEQ ID NO:1所示的核苷酸序列的至少10个连续核苷酸或其互补序列。
2.权利要求1的核酸片段,其长度为10到150个连续的核苷酸。
3.权利要求2的核酸片段,其长度为10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、60、70、80、90、100、110、120、130、140或150个核苷酸。
4.等位基因特异性寡核苷酸,其与包含对应于SEQ ID NO:1的位置3627的多态性位点的等位基因片段特异性杂交。
5.权利要求3的等位基因特异性寡核苷酸,其中所述寡核苷酸是探针或引物。
6.权利要求4的等位基因特异性寡核苷酸,其中所述的引物的3’末端安排有核酸片段多态性位点。
7.权利要求4-6中任何一项所述的等位基因特异性寡核苷酸,其长度为10到150个核苷酸。
8.权利要求3的等位基因特异性寡核苷酸,其包含SEQ ID NO:46、47、48、49、50、51、53、54、55、56、57、58、63或64中所述的序列。
9.用于鉴定单核苷酸多态性位点的基因型的的试剂盒,其中包括权利要求1-3中任何一项所述的核酸片段,或权利要求4-8中任何一项所述的等位基因特异性寡核苷酸。
10.分析核酸的方法,包括确定对应于SEQ ID NO:1的位置3627的多态性位点的核苷酸。
11.权利要求10的方法,其中所述的核苷酸通过选自下列的方法来确定:核酸测序、等位基因特异性探针杂交和等位基因特异性引物延伸。
12.权利要求10或11的方法,其中当所述的多态性位点的核苷酸序列是A时,可确定患有乳腺癌的危险增加。
13.人BRCA1多肽的变体或其片断,其含有对应于SEQ ID NO:2的位置1170的氨基酸多态性位点,并且含有SEQ ID NO:2的氨基酸序列的至少10个连续氨基酸。
14.分析蛋白质的方法,包括确定对应于SEQ ID NO:2的位置1170的位点处的氨基酸。
15.权利要求11的分析蛋白质的方法,其中当对应于位置1170的氨基酸是苯丙氨酸时,可确定患有乳腺癌的危险增加。
CN2006100585468A 2006-03-16 2006-03-16 具有新的单核苷酸多态性的brca1基因变体和其编码的蛋白质变体 Expired - Fee Related CN101037690B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2006100585468A CN101037690B (zh) 2006-03-16 2006-03-16 具有新的单核苷酸多态性的brca1基因变体和其编码的蛋白质变体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2006100585468A CN101037690B (zh) 2006-03-16 2006-03-16 具有新的单核苷酸多态性的brca1基因变体和其编码的蛋白质变体

Publications (2)

Publication Number Publication Date
CN101037690A true CN101037690A (zh) 2007-09-19
CN101037690B CN101037690B (zh) 2011-07-20

Family

ID=38888863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006100585468A Expired - Fee Related CN101037690B (zh) 2006-03-16 2006-03-16 具有新的单核苷酸多态性的brca1基因变体和其编码的蛋白质变体

Country Status (1)

Country Link
CN (1) CN101037690B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102144036A (zh) * 2008-07-07 2011-08-03 解码遗传学私营有限责任公司 用于乳腺癌风险评估的遗传变型
CN103103283A (zh) * 2013-02-05 2013-05-15 中国科学院成都生物研究所 一种检测单核苷酸多态性的方法
CN107849612A (zh) * 2015-03-26 2018-03-27 奎斯特诊断投资股份有限公司 比对和变体测序分析管线

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU691331B2 (en) * 1994-08-12 1998-05-14 Myriad Genetics, Inc. Method for diagnosing a predisposition for breast and ovarian cancer
US5692863A (en) * 1996-01-25 1997-12-02 Fairchild Fasteners-U.S. Self-locking preload controlling nut

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102144036A (zh) * 2008-07-07 2011-08-03 解码遗传学私营有限责任公司 用于乳腺癌风险评估的遗传变型
CN102144036B (zh) * 2008-07-07 2014-07-16 解码遗传学私营有限责任公司 用于乳腺癌风险评估的遗传变型
CN103103283A (zh) * 2013-02-05 2013-05-15 中国科学院成都生物研究所 一种检测单核苷酸多态性的方法
CN107849612A (zh) * 2015-03-26 2018-03-27 奎斯特诊断投资股份有限公司 比对和变体测序分析管线

Also Published As

Publication number Publication date
CN101037690B (zh) 2011-07-20

Similar Documents

Publication Publication Date Title
CN1034673C (zh) 检测核苷酸顺序的方法
CN1198943C (zh) 通过裂解脱碱基位点的核酸产生可延伸的上游dna片段而鉴定核酸分子的方法
CN1578841A (zh) 退火控制引物及该退火控制引物的使用
CN1219972A (zh) 短串联重复基因座的多重扩增
CN100351393C (zh) 核苷酸多态性的检测方法
CN1286985C (zh) 与疾病相关的核酸
CN1505685A (zh) 快速检测和鉴定生物物体的方法
CN101074450A (zh) 诊断探针检测系统
CN1687454A (zh) 基于环介导的等温扩增技术的血液病毒核酸筛查方法
CN1497049A (zh) 雄激素受体复合物-相关蛋白
CN1890368A (zh) 扩增核酸的方法
CN1646705A (zh) 检测和分型人乳头瘤病毒的扩增-杂交方法
CN1675373A (zh) 用于鉴别水稻品种的方法
CN1748028A (zh) 用于变异基因检测的信号扩增方法
CN101067149A (zh) Cyp3a检测芯片及其应用
CN1912139A (zh) 细胞色素p450基因遗传变异的检测芯片及其应用
CN1222615C (zh) 根据人呼吸道胰蛋白酶基因多态性分析体质
CN101037690A (zh) 具有新的单核苷酸多态性的brca1基因变体和其编码的蛋白质变体
CN1616676A (zh) 稳定的杂交体
CN101048504A (zh) 对干扰素治疗肾细胞癌反应的鉴定标记
CN1671841A (zh) 基因多态性分型方法
CN1496402A (zh) 表达基因鉴定用cDNA标记物的制备方法和基因表达分析方法
CN1635142A (zh) 用于预测偏执型精神分裂症易感性的试剂盒及所用引物
CN1276094C (zh) 用于诊断地中海贫血的dna芯片
CN1969044A (zh) Dna阵列与单核苷酸多态性的检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110720

Termination date: 20170316

CF01 Termination of patent right due to non-payment of annual fee