CN1894581B

CN1894581B - 检测蛋白-蛋白相互作用的方法

Info

Publication number: CN1894581B
Application number: CN2004800248641A
Authority: CN
Inventors: K·J·李; R·阿谢尔; W·斯特拉波斯; G·巴尔内亚
Original assignee: Columbia University in the City of New York; Life Technologies Inc
Current assignee: Sentikin Holdings Ltd; Columbia University in the City of New York; Life Technologies Corp
Priority date: 2003-07-09
Filing date: 2004-07-09
Publication date: 2012-02-01
Anticipated expiration: 2024-07-09
Also published as: AU2004257228B8; WO2005007822A3; CN1894581A; AU2004257228A1; US7049076B2; EP1644734B1; EP2336768A9; CA2531698A1; US20060147975A1; EP1644734A4; IL173023A0; EP1644734A2; ATE534900T1; AU2004257228B2; JP2007528713A; WO2005007822A2; US20120077706A1; EP2336768A1; US8017398B2; US20050100934A1

Abstract

本发明涉及一种用于确定是否一种检测化合物或化合物的混合物调节感兴趣的两种蛋白的之间相互作用的检测方法。确定过程可以通过利用两种重组分子，一个包含第一蛋白和用于蛋白水解分子的剪切位点，以及基因的激活剂。第二重组分子包括第二蛋白和蛋白水解分子。如果检测化合物结合至第一检测蛋白，启动反应而由此激活剂被剪切，并且激活报道基因。

Description

检测蛋白-蛋白相互作用的方法

技术领域

本发明涉及用于确定目标分子之间相互作用的方法。更具体的，其涉及确定一种被称为检测化合物的特定物质能否调节两种或更多特异的目标蛋白的相互作用，其是通过确定一种在细胞中的报道基因的活性是否受调节或其缺失而导致活化或失活。利用转化的或转染的细胞进行确定，如同转化或转染他们所用的试剂一样其也是本发明的特征之一。

发明背景

蛋白/蛋白相互作用的研究是很热门的领域，例如通过鉴别用于受体的配体。甚至当给定受体的一种配体或配体是已知的时候，仍有必要研究更有效或更具选择性的配体。GPCRs在这里将作为非穷举的被这样研究的蛋白的例子而进行讨论。

G-蛋白偶联受体，或者下文中的＂GPCRs＂，是已知的人类细胞表面受体最大的种类。在被GPCRs识别的配体之中有激素，神经递质，多肽，糖蛋白，脂质，核苷酸和离子。他们也作为光线，气味，外激素，和味道的受体。在这些各种各样的角色中，也许不会惊奇它们可以是紧张度研究的主体，以试图在鉴别各种条件下有用的药物。成功率是显著的。事实上，Howard等在Trends Pharmacol.Sci.，22：132-140(2001)评价说有超过50％的商品化药物是这样的受体。这里所用的＂GPCRs＂，指的是任何GPCR受体超家族成员，其特征在于七个跨膜结构域(7TM)的构建子。这些受体的例子包括但不限于，种类A或者＂视紫红质样＂受体；种类B或者＂分泌激素样＂受体；种类C或者＂代谢型谷氨酸样＂受体；卷曲的和平滑的相关受体；粘附受体家族或者EGF-7TM/LNB-7TM受体；脂联素受体以及相关受体；和化学感觉受体包括味觉，嗅觉，鼻骨的和外激素受体。例如，在人类中

GPCR超家族包括但不限于那些由Vassilatis，等，在Proc.Natl.Acad.Sci.USA，100：4903-4908(2003)公开的受体分子；Takeda，等，FEBS Letters，520：97-101(2002)；Fredricksson等，Mol.Pharmacol.，63：1256-1272(2003)；Glusman等，Genome Res.，11：685-702(2001)；以及Zozulya等，GenomeBiol.，2：0018.1-0018.12(2001)，所有这些在此引入作为参考。

GPCRs功能的作用机制已经在某种程度上得以阐明。简言之，当一种GPCR结合一种配体时，构型改变的结果，刺激一种级联反应导致细胞生理学的变化。据认为GPCRs通过调节细胞内，杂三聚体的鸟嘌呤核苷酸结合蛋白，或者＂G蛋白＂的活性来转换信号。配体和受体复合物刺激鸟嘌呤核苷酸变化并且将G蛋白杂三聚体分离成a和βγ亚基。

GTP结合的a亚基和βγ二聚体都能调节各种细胞的效应蛋白，包括腺苷酰环化酶和磷脂酶C(PLC)。在传统的细胞基础上的

GPCRs检测中，受体活性通过测量一种G-蛋白调节效应通路的输出而被监控，例如由腺苷酰环化酶产生的cAMP的积累，或者由PLC活性刺激的细胞内钙的释放。

传统的G-蛋白基础上的信号传导检测受两个主要因素的影响很难向某些目标发展。

第一，不同的GPCRs与不同的G蛋白调控的信号传导通路相偶联，而且G-蛋白基础上的检测取决于认识目标受体的特异性G-蛋白，或要求细胞系统的操纵，以迫使目标受体偶联至特异的效应或通路。第二，所有的细胞表达大量的内源GPCRs，以及其他信号因子。结果，被检测的效应子通路可能是被除目标GPCR之外的其他内部分子所调节，可能导致假的结果。

[00081G-蛋白活性的调节并不是配体/GPCR结合的唯一结果。Luttrell等，J.Cell Sci.，115：455-465(2002)，以及Ferguson，Pharmacol.Rev.，53：1-24(2001)，这两者都引入作为参考，综述了其他导致GPCR信号终止的活动。这些终止过程防止细胞的过度刺激，并且实现细胞外的信号和相应细胞内通路的暂时连锁。

在拮抗剂结合到GPCR的情况下，GPCR分子C末端丝氨酸和苏氨酸残基被磷酸化。这种磷酸化是由GPCR激酶或者＂GRK＂家族引起的。拮抗剂复合的C末端磷酸化GPCRs与抑制蛋白家族成员相互作用，其“捕获”受体信号。这种结合抑制受体与G蛋白的偶联，因而将受体定为内在化目标，伴随着降解和/或回收。因此，配体与GPCR的结合可以被说成是＂调节＂GPCR和抑制蛋白之间的相互作用，因为配体与GPCR的结合导致抑制蛋白与GPCR的结合，从而调节它的活性。至此以后，无论采用“调节＂或任何形式，其仅仅指的是本发明的两种蛋白的相互作用在检测化合物存在时与该化合物不存在时这两种蛋白相或作用比较而得出的变化。例如，检测化合物的存在可能加强或提高两种蛋白的相互作用，能检测在某种方面，方式或形式减弱它，抑制它或减少它。

这种背景信息导致检测GPCRs活化和抑制的方法的改变。这些方法涉及监控与抑制蛋白的相互作用。该方法的主要优势在于不需要了解G-蛋白通路。

Oakley，等，Assay Drug Dev.Technol.，1：21-30(2002)和U.S.专利Nos.5,891,646和6,110,693，在此引入作为参考，公开了检测方法，其检测细胞质中激活细胞表面受体的荧光标记的抑制蛋白分子的再分布。这些方法为了检测抑制蛋白的再定位和受体活性而对细胞图像分析的依赖程度很高。对本领域人员而言，这是一个涉及复杂过程的复合物。

涉及这些问题的各种其他的U.S.专利及专利申请已被登记。例如Bohn等人的U.S.专利No.6,528,271涉及用于筛选疼痛控制药物的筛选，其中检测了β-抑制蛋白的抑制剂。出版的U.S.专利申请，例如2004/0002119，2003/0157553，2003/0143626，和2002/0132327，全都公开了不同的涉及GPCRs的检测形式。出版的申请2002/0106379公开了一种随后例子中所用的构型；然而，它并没有教导或建议这里公开的本发明。

本发明的目的之一是研发一种更为简单的检测，其监控和/或确定特异蛋白/蛋白相互作用的调节，其中蛋白包括但不限于，膜结合蛋白，例如受体，尤其是GPCRs。这是如何实现的将在随后的例子中得以体现。

发明内容

因此，根据本发明，提供了一种用于确定是否检测化合物调节特异目标蛋白/蛋白相互作用的方法，其包括使所述化合物与已经用以下物质转化或转染的细胞接触：(a)核酸分子其包含，(i)编码所述第一检测蛋白的核苷酸序列，(ii)编码蛋白酶或蛋白酶片段的剪切位点的核苷酸序列，以及(iii)编码在所述细胞中激活报道基因的蛋白的核苷酸序列，和(b)核酸分子其包含，(i)编码在要被检测的所述检测化合物存在的情况下与所述第一检测蛋白相互作用的第二检测蛋白的核苷酸序列，以及(ii)编码对于所述剪切位点特异的蛋白酶或蛋白酶片段的核苷酸序列，并且确定所述报道基因的活性以确定是否所述化合物调节所述蛋白/蛋白的相互作用。

第一检测蛋白可以是膜结合蛋白，例如跨膜受体，特别是GPCR。具体的跨膜受体包括β2-肾上腺素受体(ADRB2)，精氨酸血管加压素受体2(AVPR2)，血清素受体1a(HTR1A)，m2毒蕈碱性乙酰胆碱受体(CHRM2)，趋化因子(C-C模序)受体5(CCR5)，多巴胺D2受体(DRD2)，卡巴阿片样物质受体(OPRK)，或者ala-肾上腺素受体(ADRA1A)，但是要理解的是在所有情况下本发明并不限于这些特异的实施例。例如，例诸胰岛素生长因子-1受体(IGF-1R)，其为酪氨酸激酶，以及不是一般的膜结合的蛋白比如雌激素受体1(ESR1)和雌激素受体2(ESR2)的分子。蛋白酶或者蛋白酶片段可以是核内包涵体A蛋白酶的烟草蚀纹病毒。激活所述报道基因的蛋白可以是转录因子，例如tTA或GAL4。第二蛋白可以是抑制性蛋白，例如抑制蛋白。细胞可以是真核或原核的。报道基因可以是外源基因，例如β-半乳糖苷酶或荧光素酶.

编码所述第一检测蛋白的核苷酸序列可以被修饰以增强与第二检测蛋白的相互作用。这样的修饰包括但不限于采用编码相比原始序列与所述第二检测蛋白具有更高亲和性的氨基酸序列的核苷酸序列替换所述第一检测蛋白的C—末端区域的全部或部分核苷酸序列。例如，C-末端区域可以被编码AVPR2，AGTRLI，GRPR，F2RL1，CXCR2/IL-8b，CCR4或GRPR的C-末端区域的核苷酸序列替换。

该方法可以包含使多于一个的检测化合物与多个细胞样本接触，每个所述样本与一个或更多所述检测化合物相接触，其中每个所述细胞样本已经用前述核酸分子转化或转染，并且在所述多个所述样本中确定报道基因的活性从而确定是否任何所述的检测化合物调节特异的蛋白/蛋白相互作用。该方法可以包含使每种所述样本与一种检测化合物接触，每一种都与其他的不一样，或者包含使所述检测化合物的混合物与每种所述样本接触。

在另一实施方案中，提供了一种用于确定是否检测化合物调节一种或更多感兴趣的多种蛋白相互作用的方法，其包含使所述检测化合物与多个细胞样本接触，这些细胞中的每种已经采用如下物质转化或转染：(a)第一核酸分子，其包含，(i)编码所述第一检测蛋白的核苷酸序列，编码蛋白酶剪切位点的核苷酸序列，(ii)编码激活在所述细胞中激活报道基因的蛋白的核苷酸序列，和(b)第二核酸分子，其包含，(i)编码在感兴趣的将被检测的所述检测化合物存在的情况下与所述第一检测蛋白相互作用的第二检测蛋白的核苷酸序列，(ii)编码对于所述剪切位点特异的蛋白酶或蛋白酶的核苷酸序列，其中所述第一检测蛋白与在所述多个样本的每个中的其他第一检测蛋白不同，并且在一个或更多所述多个样本中确定所述报道基因的活性作为调节感兴趣的一个或更多蛋白相互作用的调节测定(结果)。

第二检测蛋白在每种样本中可以相同也可以不同。所有所述的样本可以放置于(combine)普通的容器中，并且每种样本包含不同的第一和第二检测蛋白。或者是，每种样本可以在不同的容器中检测。在给定的样本中的报道基因可以与其它样本中的报道基因不同。检测化合物的混合物可以包含或存在于生物样本中，例如脑髓液，尿液，血液，血清，脓液，腹水，滑液，组织提取物，或分泌物。

在另一实施方案中，提供了采用核酸分子转化或转染的重组细胞，该核酸分子包含，(a)核酸分子，其包含(i)编码所述第一检测蛋白的核苷酸序列，(ii)编码蛋白酶或蛋白酶片段所识别的剪切位点的核苷酸序列，以及(iii)编码在所述细胞中活化报道基因的蛋白的核苷酸序列，以及(b)核酸分子，其包含，(i)编码在要检测的所述检测化合物存在的情况下与第一所述检测蛋白相互作用的第二检测蛋白的核苷酸序列，以及(ii)编码对于所述剪切位点特异性的蛋白酶或蛋白酶片段的核苷酸序列。

所述核酸分子中的一个或两者能够稳定整合到所述细胞的基因组中。细胞也可以已经被所述报道基因转化或转染。第一检测蛋白可以是膜结合蛋白，例如跨膜受体，特别是GPCR。特别是跨膜受体包括ADRB2，AVPR2，HTR1A，CHRM2，CCR5，DRD2，OPRK，或ADRA1A。

蛋白酶或蛋白酶片段可以是烟草蚀纹病毒核内包涵体A蛋白酶。激活所述报道基因的蛋白可以是转录因子，例如tTA或GAL4。第二蛋白可以是抑制蛋白。细胞可以是真核或原核。报道基因可以是外源基因，例如β-半乳糖苷酶或荧光素酶。编码所述第一检测蛋白核苷酸序列可以被修饰以增强与所述第二检测蛋白的相互作用，例如通过采用编码相比于原始序列与所述第二检测蛋白具有更高亲和性的氨基酸序列的核苷酸序列替换所述第一检测蛋白C-末端区域的全部或部分核苷酸序列。C-末端区域可以被编码AVPR2，AGTRLI，GRPR，F2RL1，CXCR2/IL-8B，CCR4或GRPR的C-末端区域的核苷酸序列替换。

在另一实施方案中，提供了分离的核酸分子，其包含，(i)编码检测蛋白的核苷酸序列，(ii)编码用于蛋白酶或蛋白酶片段的剪切位点的核苷酸序列，以及(iii)编码在所述细胞中激活报道基因的蛋白的核苷酸序列。检测蛋白可以是膜结合蛋白，例如跨膜受体。跨膜蛋白的一个具体例子是GPCR。具体的跨膜受体包括ADRB2，AVPR2，HTR1A，CHRM2，CCR5，DRD2，OPRK，或ADRA1A。

蛋白酶或蛋白酶片段可以是烟草蚀纹病毒核内包涵体A蛋白酶。激活所述报道基因的蛋白可以是转录因子，例如tTA或GAL4。如上所述，本发明不能被视为仅仅限于这些具体的实施方案。

在另一实施方案中，提供了包含分离的核酸分子的表达载体，其包含，(i)编码检测蛋白的核苷酸序列，(ii)编码用于蛋白酶或蛋白酶片段的剪切位点的核苷酸序列，以及(iii)编码在所述细胞中激活报道基因的蛋白的核苷酸序列，并且其进而可被连接至一个启动子上。

在另一实施方案中，提供了分离的核酸分子，其包含，(i)编码在要被检测的检测化合物存在的情况下与另一种检测蛋白相互作用的检测蛋白的核苷酸序列，以及(ii)编码对于所述剪切位点特异性的蛋白酶或蛋白酶片段的核苷酸序列。检测蛋白可以是抑制蛋白，例如抑制蛋白。

还提供了包含分离的核酸分子的表达载体，其包含，(i)编码在要被检测的检测化合物存在的情况下与另一种检测蛋白相互作用的检测蛋白的核苷酸序列，以及(ii)编码对于所述剪切位点特异性的蛋白酶或蛋白酶片段的核苷酸序列，所述核酸进而可被连接至一个启动子。

另一实施方案包括由以下核酸分子表达的融合蛋白：

分离的核酸分子，其包含，(i)编码检测蛋白的核苷酸序列，(ii)编码用于蛋白酶或蛋白酶片段的剪切位点的核苷酸序列，以及(iii)编码在所述细胞中激活报道基因的蛋白的核苷酸序列，并且其进而可被连接至一个启动子；

或[0029]分离的核酸分子，其包含，(i)编码在要被检测的检测化合物存在的情况下与另一种检测蛋白相互作用的检测蛋白的核苷酸序列，以及(ii)编码对于所述剪切位点特异性的蛋白酶或蛋白酶片段的核苷酸序列。

在另一实施方案中，提供了用于测定是否检测化合物调节感兴趣的蛋白/蛋白相互作用的试剂盒，其包含分离的各部分：a)核酸分子，其包含编码所述第一检测蛋白的核苷酸序列，(i)编码用于蛋白酶或蛋白酶片段的剪切位点的核苷酸序列，(ii)编码在所述细胞中激活报道基因的蛋白的核苷酸序列，以及(b)核酸分子，其包含，(i)编码在要被检测的检测化合物存在的情况下与另一种检测蛋白相互作用的检测蛋白的核苷酸序列，以及(ii)编码对于所述剪切位点特异性的蛋白酶或蛋白酶片段的核苷酸序列，以及用于分别容纳每种(a)和(b)的容器装置。

第一检测蛋白可以是膜结合蛋白，例如跨膜受体。跨膜受体的具体类型可以是GPCR。具体的跨膜蛋白是GPCR。具体的跨膜受体包括ADRB2，AVPR2，HTR1A，CHRM2，CCR5，DRD2，OPRK，或ADRA1A。蛋白酶或蛋白酶的片段可以是烟草蚀纹病毒核内包涵体A蛋白酶。激活所述报道基因的蛋白可以是转录因子，例如tTA或GAL4。第二蛋白可以是抑制蛋白，例如抑制蛋白。试剂盒可进一步包含分离的编码报道基因的核酸分子的独立的部分。报道基因可以编码β-半乳糖苷酶或荧光素酶。编码所述第一检测蛋白的核苷酸序列可以被修饰以增强与所述第二检测蛋白的相互作用，例如通过采用编码相比于原始序列与所述第二检测蛋白具有更高亲和性的氨基酸序列的核苷酸序列替换所述第一检测蛋白C-末端区域的全部或部分核苷酸序列。所述C-末端区域核苷酸序列可以被编码AVPR2，AGTRLI，GRPR，F2RL1，CXCR2/IL-8B，CCR4，或GRPR的C-末端区域的核苷酸序列替换。

要考虑到这里所描述的任何方法或组合物可以被这里所描述的任何其它方法或组合物实现。单词“a”在权利要求或说明书中与术语“包含”连用时意味着“一个”，但是它也意味着“一个或更多”，“至少一个”以及“一个或多于一种”。

本发明的这些和其他实施方案结合下文中的说明书和相应的附图将被更好的领会。应该被理解的是，以下的说明书揭示了各种本发明的实施方案和大量具体的细节，其是通过说明而并非限制的方式给出。许多取代，修饰，添加和/或重排可以在不脱离本发明精神的情况下在本发明的范围内作出，因此本发明包括所有这样的替代，修饰，添加和/或重排。

附图说明

以下的附图形成了本说明书的一部分并且被包括以进一步展示本发明的特定方面。通过这些附图中的一个或更多与具体实施方案的详细说明相结合可以更好的理解本发明。

图I以图画的形式显示了本发明的概念基础，采用配体-受体结合作为一个例子。

图2a和2b显示了在根据本发明的检测中目标对激活剂和拮抗剂剂量依赖的应答。

图3显示了不同的目标和不同激活剂的剂量应答曲线。

图4描述了根据本发明采用D2多巴胺受体获得的结果。

图5a和5b示例了检测结果，该检测显示可以同时研究两种分子。

图6表明另一“多个”检测的结果，即，在其中有两种分子被同时研究。

[00411图7代表从检测EGFR活性的检测中获得的数据。

图8代表从根据本发明的检测中获得的数据，被设计成检测人I型干扰素受体的活性。

图9详细说明图7中的结果，显示被用于产生图7的细胞中的IFN-a剂量应答曲线。

图10显示补充试验的结果，其中采用不同的转录因子和不同的细胞系。

具体实施方式

本发明涉及方法，其用于确定是否感兴趣的物质调节第一检测蛋白，例如膜结合蛋白，象受体，例如跨膜受体，与第二检测蛋白，象抑制蛋白家族的成员之间的相互作用。该方法涉及用两个构建子共转化或共转染真核或原核细胞。第一构建子包括，一段序列，其编码(i)第一检测蛋白，例如跨膜受体，(ii)蛋白酶识别的剪切位点，以及(iii)编码激活报道基因的蛋白的序列。第二构建子包括，(i)编码与第一检测蛋白相互作用的被检测和/或被确定的第二检测蛋白的一段序列，以及(ii)编码充分作用于是第一构建子一部分的剪切位点的蛋白酶或蛋白酶片段的核苷酸序列。在特别优选的实施方案中，这些构建子被稳定整合入细胞中。

在图1中以图表示了本发明实施方案的特点。简言之，首先，采用标准技术将编码转录因子的DNA融合到编码第一检测蛋白的DNA中，例如要研究的跨膜受体分子。这种融合的实现包括在实验中采用不能被宿主细胞内源表达的蛋白酶识别和裂解位点。

编码这种第一融合蛋白的DNA被导入并且在依赖于被融合到第一检测蛋白(例如受体)的转录因子的启动子元件的控制下，被还包含报道基因序列的细胞表达。如果外源蛋白酶不存在，转录因子仍然维系在第一检测蛋白上并且不能进入核以刺激报道基因的表达。

重组技术也可以被用于生产第二融合。在所述的实施方案中，编码抑制蛋白家族成员的DNA被融合到编码外源蛋白酶的DNA分子上，结果在第二融合蛋白中包含第二检测蛋白，即抑制蛋白家族成员。

然后进行检测，其中第二融合蛋白与第一融合蛋白一起被表达，并且检测化合物与细胞接触，优选特异的时间长度。如果检测化合物调节两种检测蛋白的相互作用，例如通过刺激，提高或增强第一和第二检测蛋白的联系，这会导致转录因子的释放，其转而移动到核中，并且诱导报道基因的表达。报道基因的活性被检测。

在可替代的系统中，两种检测蛋白可以在缺乏检测化合物的情况下相互作用，并且检测化合物可以导致两种检测蛋白解离，减弱或抑制其相互作用。在这样的情况下，在检测化合物存在时自由的有功能的活性转录因子的水平会降低，导致蛋白水解的下降，并且可检测到报道基因活性的降低。

在所述的实施方案中，为第二检测蛋白的抑制蛋白，在激活剂存在的情况下结合至受体；然而，要理解的是由于受体仅是类型的蛋白，检测不依赖于受体分子的使用，也不取决于仅仅结合能被涉及的相互作用结合的激活剂。虽然明显感兴趣的跨膜蛋白，但是任何蛋白都将是可行的。而且，结合到受体的激活剂不是能被检测的结合的唯一类型。人们可以确定激活剂，以及确定根据本发明的不同拮抗剂和/或激活剂的相对强度。

本发明的其他细节包括制造和使用其中主要物质的具体方法和技术，将在下文中描述。

I.表达构建子和转化

术语＂载体＂被用来指载体核酸分子，在其中能够插入核苷酸序列以便将其导入能被复制的细胞。核苷酸序列可以是“外源”的，即意味着其对于载体被导入的细胞来说是外来的或与细胞中的序列同源的但是在宿主细胞核酸的位置通常并没有发现该序列。载体包括质粒，粘粒，病毒(噬菌体，动物病毒和植物病毒)，以及人工染色体(例如YACs)。本领域技术人员完全能够通过标准的重组技术构建载体(例如，参见Maniatis等，Molecular Cloning，A Laboratory Manual(ColdSpring Harbor，1990)以及Ausubel，等，1994，Current Protocols InMolecular Biology(John Wiley & Sons，1996)，两者都引入作为参考)。

术语＂表达载体＂指的是任何类型的遗传构建子，其包含编码能够翻译的RNA的核酸。在某些情况下，RNA分子随后被翻译成蛋白，多肽或肽。在其他情况下，这些序列不被翻译，例如，反义分子或核酶的产物。表达载体可以包含多个“控制序列”，其指的是在特定的宿主细胞中可操作的连接编码序列转录和可能的翻译所必需的核酸序列。除了管理转录和翻译的控制序列之外，载体和表达载体可以包含行使其它功能的核酸序列并在下文中描述。

在特定实施方案中，质粒载体被设计用于克隆和基因传递。一般地，包含取自能与宿主细胞相容物种中的复制子和控制序列的质粒载体被用于与这些宿主结合。载体通常携带了一个复制位点，以及能够在转化细胞中提供表型选择的标记序列。在一个非限制性的例子中，E.Coli经常采用pBR322的衍生物转化，其为源自E.coli物种的质粒。pBR322含氨苄青霉素和四环素抗性的基因并且因而提供了识别转化细胞的简易方法。pBR质粒，或其他微生物质粒或噬菌体必须还要包含，或被修饰以包含，例如，能被微生物有机体利用以表达其自身蛋白的启动子。

此外，包含能与宿主微生物相容的复制子和控制序列的噬菌体载体可被用作转化载体与这些宿主结合。例如，噬菌体λGEM^TM-11可用于制造重组噬菌体载体，其能被用于转化宿主细胞，例如，E.coli LE392。

细菌宿主细胞，例如，包含表达载体的E.coli，生长在任何合适的培养基，例如，LB。在特定载体中的重组蛋白的表达可以通过使宿主细胞与特定启动子特异的试剂相接触，例如通过转换到培养基中添加IPTG或通过在更高温度中间断而被诱导，这是本领域人员可以理解的。在培养菌株更长一段时间后，一般为2至24小时，通过离心收集细胞并清洗以去除残余的培养基。

[0058许多原核载体也可被用于转化真核宿主细胞。然而，理想的是选择已经被修饰从而在真核宿主细胞中表达特异性目标蛋白的载体。已经被设计用于在这样的细胞中调节和/或更高水平表达的表达系统。例如，昆虫细胞/杆状病毒系统可以产生高水平的异源核酸片段的蛋白表达，这些见于U.S.专利5,871,986和4,879,236，两者在此引入作为参考，其可以如下商品名买到，例如，来自的2.0和来自的BACPACK^TM BACULOVIRUS表达系统。

表达系统的其他例子包括的COMPLETECONTROL^TM可诱导的哺乳动物表达系统，其包含合成蜕皮激素-可诱导的受体，或者它的pET表达系统，E.coli表达系统。另一种可诱导的表达系统的例子是来自其携带T-REX^TM(四环素调节的表达)系统，采用全长CMV启动子的可诱导哺乳动物表达系统。

还提供酵母表达系统名称为Pichia methanolica表达系统，其被设计成在嗜甲醇酵母Pichia methanolica中高表达生产重组蛋白。本领域技术人员知道如何表达载体，例如表达构建子，以生产核酸序列或其同源的多肽，蛋白，或肽。

调节信号

构建子可以包含附加的5′和/或3′元件，例如启动子，polyA序列等等。元件可以源自宿主细胞，即与宿主同源，或者它们可以源自不同的来源即异源的。

＂启动子＂是一段核酸序列的控制序列，其控制转录起始和速度。它可包含调节蛋白的分子可以结合的遗传元件，例如RNA聚合酶和其它转录因子，以起始核酸序列的特异转录。术语“可操作地位于”，“可操作地连接”，“控制下”和“转录控制下”意味着启动子相对于核酸序列是处于正确的功能位置和/或方向，从而控制该序列的转录起始和/或表达。

启动子一般包含位于RNA合成起始位点的序列。这种情况的最佳例子是TATA盒，但是在某些缺乏TATA盒的启动子中，例如，哺乳动物末端脱氧核苷酸转移酶基因的启动子和SV40后期基因的启动子，覆盖起始位点分离元件，以帮助固定起始位置。附加的启动子元件调节转录起始的频率。典型地，这些元件位于起始位点上游的30-110碱基区域，虽然许多启动子已被显示包含位于起始位点下游的功能元件。为了携带在启动子“控制下”的编码序列，将转录阅读框架的转录起始位点的5‘端定位于所选择启动子的“下游”(即3’端)。“上游”启动子刺激DNA的转录和所编码RNA的表达。[0063]启动子元件之间的间隔通常是可变的，因此当元件被颠倒或彼此移动时启动子的功能被保持。在tk启动子中，启动子元件之间的间隔在活性开始下降之前可以提高到50碱基。取决于启动子，表现出单个元件能够协同或单独激活转录。启动子可以或不可以与“增强子”结合，增强子指的是涉及核酸序列转录活性的顺式作用调节序列。

一个启动子可以是一个天然与核酸分子结合的，也可以是通过分离位于编码片段和/或外显子上游的5’非编码序列。这样的一个启动子可以被称为“内源”的。相似地，一个增强子可以是一个天然与核酸分子结合的，位于该序列的上游或下游。可替换地，通过将编码核酸片段定位在重组或异源启动子的控制之下可获得一定的优势，其指的启动子是指在其正常的天然环境中没有与核酸结合。重组或异源的增强子也指的是正常的在其天然环境中没有与核酸结合的增强子。这样的启动子或增强子可以包括其它基因的启动子或增强子，以及从其他病毒，原核或真核细胞分离的启动子或增强子，和非“天然产生的”启动子或增强子，即包含不同转录调节区域和/或改变表达的突变的不同元件。例如，最常用于重组DNA构建子中的启动子包括β-内酰胺酶(青霉素酶)，乳糖和色氨酸(trp)启动子系统。除了产生合成的启动子和增强子核酸序列之外，序列可以采用重组克隆和/或核酸扩增技术产生，包括PCR^TM，结合这里公开的组合物(参见U.S.专利Nos.4,683,202和5,928,906，在此引入作为参考)。而且，设计成在非核细胞器官例如线粒体，叶绿体，及其类似物中直接转录和/或表达序列的控制序列也可以被采用。

天然地，采用一个能在选择用于表达的细胞器官，细胞类型，组织，器官，或有机体中有效直接表达DNA片段的启动子和/或增强子将是重要的。分子生物学领域的技术人员一般都知道采用启动子，增强子，和重组细胞类型用于蛋白表达，(参见，例如Sambrook，等，1989，在此引入作为参考)。所采用的启动子可以是组成性的，组织特异的，可诱导的，和/或在适宜条件下能够高表达被导入的DNA片段，这样在重组蛋白和/或肽的大规模生产中有优势。启动子可以是异源的或内源的。

此外，任何启动子/增强子组合(根据，例如，真核启动子数据基础库EPDB，www.epd.isb-sib.ch/)也可用于操纵表达。利用T3，T7或SP6细胞质表达系统是另一种可行的实施方案。如果提供了合适的细菌聚合酶，真核细胞可以支持从特定细菌启动子所进行细胞质的转录，作为释放复合物的一部分或作为附加的遗传表达构建子。

对于编码序列有效地翻译也可以要求一个特异的起始信号。这些信号包括ATG启动密码子或邻近序列。包括外源翻译控制信号ATG启动密码子，可能需要被提供。本领域的人员将很容易确定这一点并提供必需的信号。公知的是启动密码子必须“在框架内”处于预定的编码序列的框架中以确保整个插入子的翻译。外源翻译控制信号和启动密码子既可以是天然的也可以是合成的。表达的效率可以通过包含合适的转录增强子元件而被增强。

在本发明的特定实施方案中，内源核糖体进入位点(IRES)元件被用于产生多基因或多顺反子的信息。IRES元件能够绕过5′甲基化帽子依赖翻译的核糖体扫描模型并在内部位点开始翻译(Pelletier和Sonenberg，Nature，334：320-325(1988))。来自细小核糖核酸病毒家族的两个成员的IRES元件(脊髓灰质炎病毒和脑心肌炎病毒)已经被公开(上述的Pelletier和Sonenberg)，以及来自哺乳动物信息的IRES(Macejak和Sarnow，Nature，353：90-94(1991))1991)。IRES元件可以被连接至异源的开放阅读框架。多个开放阅读框架可以被一起转录，每个由一个IRES分离开，产生多顺反子信息。通过IRES元件的特性，每个开放阅读框架能靠近核糖体以便有效翻译。采用单个启动子/增强子转录单个信息就可以有效表达多个基因(参见U.S.专利Nos.5,925,565和5,935,819，每个在此引入作为参考)。

其它载体序列元件

载体可以包括多个克隆位点(MCS)，其为包含多个限制性酶位点的核酸区，其任何一个能被用于与标准的重组技术结合以消化载体(参见，例如，Carbonelli，等，FEMS Microbiol.Lett.，172(1)：75-82(1999)，Levenson，等，Hum.Gene Ther.9(8)：1233-1236(1998)，以及Cocea，Biotechniques，23(5)：814-816(1997))，在此引入作为参考)“限制性酶消化”指的是用一种仅仅作用于核酸分子中特异位置的酶来催化核酸分子的剪切。许多这样的限制性酶可以从商品中获得。本领域技术人员普遍理解这样酶的利用。通常，一个载体采用限制性酶在MCS内剪切从而线性化或片断化以使外源序列被连接到载体。＂连接＂指的是在两个可以是或不是连续的核酸片段之间形成磷酸二酯键的过程。涉及限制性酶和连接反应的技术对于重组领域技术人员来说是公知的。

大多数转录的真核RNA分子要进行RNA剪接以从原始转录本中去除内含子。含有基因组真核序列的载体可能需要供体和/或受体剪接位点以确保用于蛋白表达的转录本的正确过程(参见，例如，Chandler等，1997，在此引入作为参考)。

本发明的载体或构建子一般包含至少一个终止信号。一个＂终止信号＂或＂终止子＂包含参与通过RNA聚合酶的RNA转录本特异终止的DNA序列。这样，在特定实施方案中设计了结束RNA转录本生产的终止信号。在体内一个终止子可能是必需的以达到理想的信号水平。

在真核系统中，终止子区域还可以包含允许新转录本位点特异剪切的特异DNA序列以便于暴露聚腺苷酸化位点。其指示一个特异的内源聚合酶一段大约200腺苷残基(polyA)的序列加至转录本的3′端。采用这种聚A尾巴修饰的RNA分子更加稳定并且被更有效地翻译。因此，在涉及真核的其他实施方案中，优选的是终止子包含一个用于RNA剪切的信号，更优选的是终止子信号提高了聚腺苷酸化的信息。终止子和/或聚腺苷酸化位点元件可服务于增强信息水平并使从阅读框通读而进入其它序列最小化。

设计用于本发明的终止子包括任何这里描述的或本领域已知的转录本的终止子，包括但不限于，例如，基因的终止序列，例如牛生长激素终止子，病毒终止序列，例如SV40终止子。在特定实施方案中，终止信号可以是可转录的或可翻译序列的缺失，例如一个由于基因截断导致的不可转录或不可翻译的序列。

在表达中，特别是真核表达，其典型地包括一个聚腺苷酸化信号以有效促进转录本的正确聚腺苷酸化。聚腺苷酸化信号的特性不被认为是本发明成功操作的关键并可使用任何这样的序列。优选的实施方案包括SV40聚腺苷酸化信号或牛生长激素聚腺苷酸化信号，两者都是方便的，容易得到的，并且已知在各种目标细胞中都具有良好功能。聚腺苷酸化可以提高转录本的稳定性或促进细胞质运输。

为了在宿主细胞中增殖载体，可包括一个或更多复制位点(经常被称为＂ori＂)，其为复制被起始的特异核苷酸序列。可替代地，如果宿主细胞是酵母可采用一个自主复制序列(ARS)。

转化方法

用于本发明的合适的核酸递送方法被认为包括事实上任何这里所描述的或本领域公知的可将核酸分子(例如DNA)导入细胞中的方法。这样的方法包括，但不限于，直接分送DNA例如通过来自体内(ex vivo)的转染(Wilson等，Science，244：1344-1346(1989)，(Nabel等，Science，244：1342-1344(1989)，并通过注射(U.S.专利Nos.5,994,624，5,981,274，5,945,100，5,780,448，5,736,524，5,702,932，5,656,610，5,589,466和5,580,859每个都在此引入作为参考)，包括微注射(Harlan和Weintraub，J.Cell Biol.，101(3)：1094-1099(1985)；U.S.专利No.5,789,215，在此引入作为参考)；通过电穿孔(U.S.专利No.5,384,253，在此引入作为参考；Tur-Kaspa等，Mol.Cell Biol.，6：716-718(1986)；Potter等，Proc.Natl.Acad.Sci.USA，81：7161-7165(1984)；通过磷酸钙沉淀(Graham和Van Der Eb，Virology，52：456-467(1973)；Chen和Okayama，Mol.CellBiol.，7(8)：2745-2752(1987)；Rippe等，Mol.CellBiol.，10：689-695(1990)；通过采用DEAE-葡聚糖随后采用聚乙二醇(Gopal，Mol.Cell Biol.，5：1188-190(1985)；通过直接声波装载(Fechheimer，等，Proc.Natl.Acad.Sci.USA，89(17)：8463-8467(1987)；通过脂质体介导的转染(Nicolau和Sene，Biochem.&Biophys.Acta.，721：185-190(1982)；Fraley等，Proc.Natl.Acad.Sci.USA，76：3348-3352(1979)；Nicolau，等，Meth.Enzym.，149：157-176(1987)；Wong，等，基因，10：879-894(1980)；Kaneda等，Science，243：375-378(1989)；Kato等，J.Biol.Chem.，266：3361-3364(1991)和受体介导的转染(Wu和Wu，J.Biol.Chem.，262：4429-4432(1987)；Wu和Wu，1988)；通过PEG-介导的原生质体转化(Omirulleh，等，PlantMol.Biol.，21(3)：415-428(1987)；U.S.专利Nos.4,684,611和4,952,500，在此引入作为参考)；通过干燥/抑制介导的DNA摄取(Potrykus等，Mol.Gen.Genet.，199(2)：169-177(1985)，以及任何这样方法的结合。

II.检测系统的组成

对于这里所描述的方法，作为本发明特征的产品具有优选的实施方案。例如，在“三部分构建子”中，即包含编码检测蛋白，剪切位点，和活化剂蛋白的序列，检测蛋白优选膜结合蛋白，例如跨膜受体，例如，GPCR家族的成员。这些序列可以被修饰以便它们编码的蛋白的C末端具有与第二蛋白更好和更强的相互作用。修饰可以包括，例如，用编码AVPR2，AGTRLI，GRPR，F2PLI，CCR4，CXCR2/IL-8，CCR4，或GRPR的C末端编码区域置换例如GPCR检测蛋白编码序列的C-末端，，所有这些如前定义。

激活报道基因的蛋白可以是在核内作用的蛋白，就像转录因子(例如tTA，GAL4等)，或者它可以是产生级联反应的分子，导致通过另蛋白的细胞核内反应。本领域人员很熟悉这样的级联反应。

第二构建子，如上所述，包括编码与第一蛋白相互作用的蛋白的区域，导致一些可检测的现象。该蛋白可以是活化剂，抑制剂或，更多，通常地，第一蛋白的“调节剂”。抑制蛋白家族成员是优选的，特别是在第一蛋白是GPCR时，但是也可以采用其他蛋白编码序列，特别是在第一蛋白不是GPCR时。这些两部分构建子的第二部分编码蛋白酶，或蛋白酶的片段，其用于从由第一构建子编码的融合蛋白中去除活化分子。

然而，这些优选的实施方案如随后要讨论的补充实施方案一样并不是限制本发明。

宿主细胞

这里所用的术语“细胞”，“细胞系”和“细胞培养物”可以相互变化使用。所有这些术语也包括它们的后代，任何以及所有随后的传代。要理解的是后代可能因为计划或偶然的突变而不相同。宿主细胞一般已经被工程化以表达可筛选的或可选择的标记，其被随着第一检测蛋白，作为融合蛋白一部分的转录因子激活。

在表达异源的核酸序列的内容中，＂宿主细胞＂指的是能够复制载体和/或表达由载体所编码的异源基因的原核或真核细胞。当宿主细胞用核酸分子＂转染＂或＂转化＂时，它们被称为＂重组＂细胞或宿主细胞，例如，一种被外源核酸序列，例如载体所引入的细胞。因此，重组细胞是可以与不包含被引入重组核酸的天然发生细胞相区别的。

大量的细胞系和培养物可被用作宿主细胞，作为它们可以从American Type Culture Collection(ATCC)中获得，其为获得活培养物和遗传材料的机构(www.atcc.org)。本领域人员可以根据载体的主链和预期的结果来确定合适的宿主。例如质粒或粘粒，可以被引入原核宿主细胞用于复制许多载体。可得到用于载体复制和/或表达的细胞类型包括但不限于，细菌，例如E.coli(例如，E.coli菌株RR1，E.coli LE392，E.colB，E.coli X1776(ATCC No.31537)以及E.coliW3110(F-，lambda-，prototrophic，ATCC No.273325)，DH5α，JM109，和KC8，杆菌例如枯草芽孢杆菌；以及其它肠杆菌例如鼠伤寒沙门氏菌，粘质沙雷菌(Serratia rnarcescens)，各种假单胞杆菌属种类，以及各种商业可获得的细菌宿主例如 Competent细胞和SOLOPACK^TMGold细胞(STRATAGENE

Figure S04824864120060314D00019113411QIETU

La Jolla)。在特定实施方案中，细菌细胞例如E.coli LE392被特别设计作为噬菌体病毒的宿主细胞。

用于复制和/或表达载体的真核宿主细胞的例子包括，但不限于，HeLa，NIH3T3，Jurkat，293，COS，CHO，Saos，和PC12。来自各种细胞类型和有机体的宿主细胞是可获得的并且对本领域人员是已知的。相似的，病毒载体可被用于与真核或原核宿主细胞相结合，尤其是能够用于载体的复制或表达的细胞。

检测蛋白

本发明考虑任何两种相互作用是已知的或猜测的蛋白。蛋白将作为融合蛋白存在，第一检测蛋白融合到一个转录因子，而第二检测蛋白融合到识别位于第一检测蛋白的剪切位点的蛋白酶上，该位点的剪切导致转录因子释放。对于检测蛋白/融合子的唯一要求是(a)第一检测蛋白在剪切前不能定位于核，并且(b)在与第二检测蛋白融合以及第一检测蛋白与第二检测蛋白结合之后该蛋白酶都要维持活性。

对应于第一构建子，第一检测蛋白可以是，例如，天然膜结合蛋白，或者是通过标准的技术被工程化后成为膜结合的。第一检测蛋白可以是，例如，跨膜受体，例如任何的GPCRs，或感兴趣的任何跨膜受体，包括，但不限于，酪氨酸激酶受体，丝氨酸苏氨酸激酶受体，细胞因子受体等等。而且，公知的是蛋白片段，将以与第一检测蛋白全长同样的方式起作用，第一检测蛋白这样的活性片段通过这里定义的蛋白来囊括。

对于本领域技术人员来说显然的是，本发明可以用于检测任何蛋白的相互作用，并且不限于检测膜结合受体，比如GPCRs。例如，其它种类跨膜受体的活性，包括但不限于：受体酪氨酸激酶(RTKs)，例如IGF11R，例如表皮生长因子受体(EGFR)，ErbB2/HER2/Neu或相关RTKs；丝氨酸/苏氨酸激酶受体，例如转化生长因子-beta(TGFβ)，活化素，或骨形态发生蛋白(BMP)受体；细胞因子受体，例如干扰素家族受体，白细胞介素、促红细胞生成素、G-CSF、GM-CSF、肿瘤坏死因子(TNF)和瘦素leptin受体；以及其它受体，其不一定必须是膜结合的，例如雌激素受体1(ESR1)，和雌激素受体2(ESR2)。在每种情况中，该方法涉及用调控包含感兴趣的受体的嵌合蛋白表达的经修饰了的受体构建子转染细胞，该构建子添加了蛋白酶剪切位点以及编码转录因子的核酸分子。调控由感兴趣的蛋白融合至识别和裂解上面所述位点的蛋白酶组成的嵌合蛋白的表达的第二构建子对细胞进行共转染，。在RTKs的情况下，例如EGFR，这种相互作用的蛋白可以由班汉蛋白或其片段的SH2组成(Src同源结构域2)，例如磷脂酶C(PLC)或包含转化蛋白1(SHC1)的Src同源结构域2。在丝氨酸/苏氨酸激酶受体的情况下，例如TGFβ，活化素，BMP受体，这种相互作用蛋白可以是Smad蛋白或其片段。在细胞因子受体的情况下，例如干扰素-α/β或干扰素-γgamma受体，这种相互作用蛋白可以是信号转导子和转录活化子(STAT)蛋白，例如，但不限于，Statl，Stat2；Janus激酶(JAK)蛋白Jak1，Jak2或Tyk2或其片段。在每种情况中，转染细胞包含一个被融合至受体的转录因子所调节的报道基因。然后，检测通过用检测化合物处理转染细胞一定的时间并且在检测时期结束时检测报道基因的活性而得以进行。如果检测化合物激活感兴趣的受体，感兴趣的受体和相互作用蛋白之间的相互作用被刺激，导致蛋白酶位点的剪切和融合的转录因子的释放，其作为报道基因活性的提高转而可得到检测。

其它可能的蛋白对包括抗体-配体，酶-底物二聚蛋白，信号级联转导的成员，以及本领域公知的其他蛋白对。

报道基因

激活报道基因的蛋白可以是对基因具有影响的任何蛋白，其表达或缺乏会导致可检测的信号。典型的蛋白报道基因包括酶，例如氯霉素乙酰转移酶(CAT)，β-葡糖醛酸酶(GUS)或β-半乳糖苷酶。也考虑荧光素和化学发光蛋白例如绿色荧光蛋白，红色荧光蛋白，蓝绿色荧光蛋白，荧光素酶，β内酰胺酶，以及碱性磷酸酶。

转录因子和阻抑蛋白

根据本发明，转录因子被用于激活在工程化宿主细胞中的报道基因的表达。转录因子典型的根据它们的DNA结合区域来分类，一般为(a)锌指，(b)螺旋-拐弯-螺旋，(c)亮氨酸拉链，(d)螺旋-圈-螺旋，或(e)高度可变基团。转录因子的活化结构域与转录装置的元件(RNA聚合酶)以及其它调节蛋白相互作用，因此影响DNA结合的效率。

Rel/核因子κB(NF-κB)和激活因子-1(AP-1)是最常被研究的转录因子家族。它们被鉴定为信号转导通路重要的成员，会导致病理结果，例如炎症和肿瘤发生。其它转录因子家族包括热休克/E2F家族，POU家族和ATF家族。具体的转录因子，例如tTA和GAL4，被考虑用在本发明中。

虽然转录因子是一类可以利用的分子，检测也可以被修饰以接受采用转录抑制分子，其中可检测信号是信号发生器的下调节，或甚至是细胞死亡。

蛋白酶和剪切位点

蛋白酶是特征为在特定位点剪切其他蛋白的酶。Ser/Thr蛋白酶家族，在丝氨酸和苏氨酸残基剪切。其它蛋白酶包括半胱氨酸或巯基蛋白酶，天冬氨酸蛋白酶，金属蛋白酶，氨基肽酶，双&三肽酶，羧基肽酶，以及肽基肽酶。这些物质的选择留给本领域技术人员并且特定的需要并不局限于在这里描述的这些分子。公知的是酶具有催化区域并且这些可以被用来替代全长的蛋白酶。这些也包括在本发明中。一个具体实施方案是烟草蚀纹病毒核内包涵体A蛋白酶，或其活性片段。也可以采用其他用于蛋白酶的特异剪切位点，这对于本领域人员是显而易见的。

检测蛋白的修饰

在此检测中，第一检测蛋白可以被修饰以增强与相互作用蛋白的结合。例如，已知的是特定的GPCRs在配体的刺激下能更稳定或更具亲和性地结合抑制蛋白并且这种增强的相互作用被独立的介导，例如，C-末端的丝氨酸和苏氨酸残基簇(Oakley等，J.Biol.Chem.，274：32248-32257，1999和Oakley，等，J.Biol.Chem.，276：19452-19460，2001)。采用这作为例子，清楚的是受体编码序列本身可以被修饰，以便提高膜结合蛋白的亲和性，例如受体与其结合的蛋白。这样修饰的例子是对膜结合蛋白C-末端区域的修饰，例如，受体，例如如上所描述的那些，其包括用相应的与结合蛋白具有更高亲和性但是不影响受体功能的另一种受体的区域替换其一部分。在前的例子16和20，显示了本发明这种特征的实施方案。

此外，第二检测蛋白可以被修饰以增强其与第一检测蛋白的相互作用。例如，检测可以掺入点突变的、截断的或其它变体的第二检测蛋白，例如，已知的与激活剂-偶联的GPCRs结合更稳定的或在磷酸化非依赖方式中的抑制蛋白(Kovoor，等，J.Biol.Chem.，274：6831-6834，1999)。

III.检测方式

如上所述，本发明在一个实施方案中提供了一个直接的方法去检测当表达在一个相同的细胞中时两种蛋白的相互作用。一个第一构建子，如上所述，包含编码第一蛋白的序列，其连接至一个编码用于蛋白酶或蛋白酶片段的剪切位点的序列，该序列本身连接在编码报道基因激活子的序列。采用＂连接着＂指的是所描述的序列被融合以产生单一的，完整的开放阅读框架，其可以被翻译成包含所有元件的单一多肽的序列。这些可以是，但不必须是，被可以编码或不编码附加蛋白或肽的附加核苷酸序列分离开。插入重组细胞中的第二构建子也在上文中被描述了，即它既包含编码第二蛋白的序列也包含编码蛋白酶或蛋白酶片段的序列。总而言之，这些元件在与能够影响所寻找的目标蛋白相互作用的待选试剂结合时构成了基本的检测方式。

然而，本发明也用于检测多于膜结合蛋白，例如受体，同时采用不同的报道基因，每被一个蛋白激活，例如这里所描述的蛋白种类。例如，这可以通过采用不同的受体构建子和不同的报道基因转染细胞的混合而实现，或者通过将不同的转录因子融合至每个检测受体，并且采用检测化合物检测每个报道基因的活性。例如，它可以是确定是否感兴趣的分子激活第一受体并还可以确定作为与第二受体相互作用的结果的副效应是否是预期的。在这样的情况中，例如，采用编码第一受体和第一报道子的第一细胞系，例如lacZ，以及编码第二受体和第二报道子的第二细胞系，例如GFP。这样系统的优选实施方案见于实施例17和18。人们可以混合这两种细胞系，加入感兴趣的化合物，并寻找对一个具有正效应而对另一个没有效应的物质。

要知道的是本发明既涉及检查的是相互作用检测蛋白的单一对的方法，但是更为优选的是，其也可以指的是这里的采用“多个”检测的方法。这样的检测可以各种方法进行，但是在所有的情况下，多于一对的检测蛋白被同时检测。这可以被实现，例如，通过提供多于一个细胞样本，每种都已经被转化或转染，以检测每种的蛋白相互作用对。不同的转化细胞可以在一个容器中结合并被同时检测，或者将每种不同类型的转化置于不同的孔中，然后检测。

这里所描述的用于多个检测的细胞可以是，但不必须是相同的。类似地，在每种样本中所采用的报道子系统可以是，但不必须是相同的。在样本或多个样本被置入容器中后，例如微量检测板的孔中，抗(against)容器中所产生的多个蛋白相互作用一种或多种化合物可以被筛选。

构建子所表达的融合蛋白也是本发明的一个特征。对于本领域人员来说本发明的其它特征很清楚包括，能鉴别融合蛋白以及用于确定蛋白存在的检测基础上的各种蛋白的抗体，以及杂交检测，例如基于PCR(确定基因的表达)的检测。

III.试剂盒

这里所描述的任何组合物都将包含在试剂盒中。这样，试剂盒将包含处于合适包装方式的本发明的载体或细胞，以及根据本发明所采用的任何附加试剂。

试剂盒可以包含合适的整数倍的本发明的组合物。试剂盒的成分可以为液体的或冻干的形式包装起来。试剂盒的包装中一般包括至少一个玻璃瓶，试管，培养瓶，瓶子，注射器或其他容器方式，在其中可放置成分，并且优选地，合适的整数倍。在试剂盒中有多于一种成分时，试剂盒也一般会包含第二，第三或其他附加容器，使得附加成分可以单独放置。然而，各种成分的结合物可以放置在一个瓶子中。本发明的试剂盒还典型的包含用于容纳试剂容器的装置，以便用于商品销售。这样的容器可以包括注射或吹模塑料容器以便放置预定的瓶子。

当试剂盒的成分是以一种和/或更多液体溶液提供时，液体溶液是一种水溶液，特别优选无菌水溶液。然而，试剂盒的成分可以以干的粉末提供。当试剂和/或成分以干的粉末提供时，粉末可以通过合适的溶剂而重构成。预想的是溶剂可以以另一种包装方式提供。

IV.实施例

描述本发明的特异实施方案将见于以下实施例中，但本发明不限于此。

实施例1

一个融合构建子采用编码人β2肾上腺素受体的DNA而产生，编码人β2肾上腺素受体的DNA根据标准术语在这里及以后被称为＂ADRB2＂。它的核苷酸序列可以在GenBank中找到，其登记号为NM_000024(SEQ ID NO：1)。四环素控制的反式激活蛋白(transactivator)tTA，由Gossen等公开，Proc.Natl.Acad.Sci.USA，87：5547-5551(1992)，引入作为参考及使用。一个编码烟草蚀纹病毒核内包涵体A蛋白酶识别和剪切位点的序列(由Parks等公开，Anal.Biochem.，216：413-417(1994)，引入作为参考)，被插入在融合编码基因中的这些序列之间。CMV启动子区域被置于ADRB2编码区域的上游，而一个poly A序列被置于tTA区域的下游。

融合构建子通过缺乏内源BamHI和BglII限制位点的ADRB2的第一产生形式而被制备。而且，内部终止密码子被唯一的BamHI位点替换。

采用重叠PCR做到这一点。详细来说，编码区域的5′部分采用如下序列扩增：

gattgaagatctgccttcttgctggc(SEQ ID NO：2)，以及

gcagaacttggaagacctgc ggagtcc(SEQ ID NO：3)，

而编码区域的3′部分采用如下序列扩增：

ggactccgca ggtcttccaa gttctgc(SEQ ID NO：4)，以及

ttcggatcct agcagtgagt catttgt(SEQ ID NO：5)。

[001081PCR结果的产品具有27个核苷酸的重叠序列并且通过标准的琼脂糖凝胶电泳纯化。这些混合在一起，并采用SEQ ID NO：2，和SEQ ID NO：5扩增。

PCR也可以用于修饰tTA的编码区域以便内源开始密码子被置换为TEV NIa-Pro剪切位点。该剪切位点，由七个氨基酸序列ENLYFQS(SEQ ID NO：6)限定，是由Parks等教导的，Anal.Biochem.，216：413-417(1994)，引入作为参考。第七个氨基酸已知是作为PI′位置，并且将它与其它氨基酸已知减小TEV NIa-Pro剪切效率的。见于Kapust等，Biochem.Biophys.Res.Commun..294：949-955(2002)。

产生了第七氨基酸变成Tyr和Leu的变体。这些导致与天然的高效率位点相比，中等的和低效率的剪切位点。

在两个步骤中将编码天然高效率位点的DNA序列加入tTA编码区域。简言之，通过以下序列进行PCR而使BamHI和XbaI限制位点被加入到tTA编码区域5′端而Xhol限制位点被加入到tTA区域3′端，：

ccggatcctc tagattagat aaaagtaaag tg(SEQ ID NO：7)，以及

gactcgagct agcagtatcctcgcgccccc taccc(SEQ ID NO：8)，

通过将具有如下序列：gagaacctgt acttccag(SEQ ID NO：9)的寡核苷酸连接在5′端，而在BamHI和XbaI位点之间加入TEV NIa-Pro剪切位点。

进行修饰以编码中等的和低效率剪切位点的DNA序列的PCR采用如下序列：

ggatccgaga acctgtacttccagtacaga tta(SEQ ID NO：10)，以及

ctcgagagatcctcgcgccc cctacccacc(SEQ ID NO：11)，而

用于ENLYFQY(SEQID NO：12)，以及

ggatccgagaacctgtactt ccagctaaga tta(SEQ ID NO：13)，以及

ctcgagagatcctcgcgccc cctacccacc(SEQ ID NO：11)而用于ENLYFQL(SEQ ID NO：14)。

这些PCR步骤还包括将一个BamHI限制位点引入编码每个剪切位点的序列中5′端，以及一个XhoI限制位点至tTA终止密码子的3′端。

这样修饰的ADRB2编码区域采用在编码区域中的核苷酸位置260使用Pst I以及BamHI消化。这个3′片段与具有TEV NIa-Pro剪切位点修饰的tTA的三个变体连接，其已被BamHI和Xhol消化，并且最终复合物被克隆进BlueScriptII，其已被PstI和Xhol消化。

再次通过PCR将NotI限制位点引至ADRB2编码区域的开始密码子中的5′端，其采用

gcggccgcca ccatgaacggtaccgaaggc cca(SEQ ID NO：15)，以及

ctggtgggtggcccggtacc a(SEQ ID NO：16)。

通过NotI和PstI消化分离修饰的ADRB2编码区域5′片段并且连接至在之前已经被消化的ADRB2-TEV-NIa-Pro-剪切位点tTA融合蛋白的3′片段的每个构建子之中，以产生三个编码融合蛋白的全长构建子。

每个被NotI和XhoI消化的构建子，随后被插入到用NotI和Xhol消化的商业可得的表达载体pcDNA3中。

实施例2

第二构建子也可以被制造，通过将这里及以后被称为＂β抑制蛋白2或ARRB2＂(GenBank，NM_004313)(SEQ ID NO：17)的编码序列，被连接至TEV蛋白中的TEV NIa蛋白酶的催化结构域(即成熟NIa蛋白酶的氨基酸189—424，残基2040-2279)。为了做到这一点，编码ARRB2的DNA序列被修饰，以便在其5′端加入一个BamHI限制位点。而且，该序列被修饰以一个BamHI位点替换内源终止密码子。寡核苷酸

caggatcctctggaatgggggagaaacccg ggacc(SEQ ID NO：18)，以及

ggatccgcagagttgatcat catagtcgtc(SEQID NO：19)被采用。PCR结果的产品被克隆进商业可得的载体pGEM-T EASY(Promega)。pGEM-TEASY载体的多克隆位点包括一个在ARRB2开始密码子5′的EcoRI位点。

TEV NIa-Pro编码区域随后被修饰以用BglII位点替换内源开始密码子，并且在3′端插入编码流行性感冒血凝素(hemagluttinin)表位YPYDVPDYA(SEQ ID NO：20)的序列，根据Kolodziej等，Meth.Enzvmol.，194：508-519(1991)，之后为一个终止密码子和NotI限制位点。这通过PCR实现，采用：

agatctagct tgtttaaggg accacgtg(SEQ ID NO：21)，以及

gcggccgctc aagcgtaatc tggaacatca tatgggtacg agtacaccaattcattcatg ag(SEQID NO：22).

结果，修饰了的ARRB2编码区域被EcoRI和BamHI消化，而修饰了的TEV编码区域被BglII和NotI剪切。两个片段被连接至商业可得的采用EcoRI和NotI消化的pcDNA3表达载体。

实施例3

将编码ADRB2-TEV-NIa-Pro剪切位点-tTA和ARRB2-TEV-NIa蛋白酶融合蛋白的质粒转染到HEK-293T细胞，并且进入为HEK-293T衍生物的＂克隆41＂，其具有稳定整合的在tTA依赖的启动子控制之下的β-半乳糖苷酶基因。大约5x10⁴细胞被放置在24孔板的每个孔中，用带有10％胎牛血清的，2mM L-谷氨酰胺，100units/ml青霉素，100μg/ml G4I8，和5μg/ml purimycin的DMEM培养基中培养。第二天细胞达到50％融合度，然后采用0.4μg质粒DNA，和2μlFμgene(一种合适的包含脂质体和其他材料转染试剂)转染。混合物在100μl DMEM培养基中混合，并且在加入细胞之前在室温下孵育15分钟。转染细胞在通过加入已知的受体拮抗剂进行检测之前孵育8-20小时，然后在药物加入后孵育16-24小时。

实施例4

细胞中β-半乳糖苷酶活性水平首先通过用产色的底物染色细胞而检测，即：“X-gal”，由MacGregor等，Somat.Cell Mol.Genet.，13：253-265(1987)教导，引入作为参考。培养后，细胞采用带有钙和镁的D-PBS清洗两次，在4％多聚甲醛中固定5分钟，随后再用D-PBS(含钙和镁)清洗两次，每次10分钟。固定了的细胞用含有钙和镁、5mM铁氰化钾，5mM亚铁氰化钾，2mM MgCl₂，由储存在二甲基甲酰胺中的4％X-Gal中1:40稀释而制备的0.1％X-Gal的D-PBS孵育。

室温下反应在黑暗中被孵育3-4小时至过夜。去除底物溶液，采用mowiol封固介质(mounting medium)(10％mowiol，0.1％1.4-二氮杂双环[2.2.2]辛烷，24％甘油)将细胞封固在玻璃盖玻片下。

结果显示无论是单独采用ADRB2-TEV-NIa-Pro剪切位点-tTA质粒还是ARRB2-TEV-NIa蛋白酶质粒转染的细胞都不表达β-半乳糖苷酶。采用两种质粒转染的小部分细胞则表达β-半乳糖苷酶，可能是由于未刺激的ADRB2和ARRB2之间存在基底水平的相互作用。在采用10uM异丙基肾上腺素，或10uM肾上腺素(这两者均为ADRB2激活剂)处理细胞后，大约3-5倍更多的细胞表达报道基因。

当细胞采用ADRB2拮抗剂阿普洛尔(alprenolol)(10uM)预处理5分钟时，激活剂所引起的细胞中β-半乳糖苷酶表达的提高被阻断，而单独采用阿普洛尔处理不会引起明显的效果。

这些结果使人们可以将激活剂结合与GPCR刺激报道基因的转录活性相联系。

实施例5

为了更加精确的定量报道基因在细胞中的活性水平和使检测信号对背景最大化而进行了一系列的试验。这通过采用商业可得的针对β-半乳糖苷酶的化学发光检测进行报道基因诱导水平的检测而实现。克隆41细胞用前述的包含高，中或低效应的剪切位点的ADRB2-tTA融合构建子以及ARRB2-TEV-NIa蛋白酶表达质粒转染。转染之后20小时采用或不采用1uM异丙基肾上腺素处理细胞，并且在药物加入后的24小时后进行发光检测。简言之，细胞培养后，去除培养基，将50μl裂解缓冲液(100mM磷酸钾，pH7.8，0.2％TritonX-100)加入到每孔中。通过在室温下轻微搅拌5分钟而裂解细胞。收集裂解物并且通过商业可得的产品进行分析。

在所有情况下，采用激活剂处理会提高β-半乳糖苷酶活性水平。然而，在带有低效应剪切位点的未处理的细胞中报道基因活性的背景水平相对于中间和高的效应位点来说是最低的。而且，激活剂处理后，带有低效应剪切位点的细胞中报道基因的活性为4.8倍而相比于含有中等效应剪切位点的2.8倍的活性和含有高效应剪切位点的细胞的1.2倍的活性。这样，通过采用低效应蛋白酶剪切位点就获得了最高的信噪比。

实施例6

这些试验被设计以确定。激活剂刺激引起的报道基因表达的提高是依赖于被激活剂结合和激活的受体。

为了做到这一点，采用前述方式产生了ADRB2-tTA融合构建子的变体，其中不包括每个中在位置113从D到S的单个氨基酸变化的突变，其导致对激活剂异丙基肾上腺素亲和性的大量降低，参见Strader等，J.Biol.Chem.，266：5-8(1991)。形成了带有不同剪切位点的三种受体-tTA融合构建子突变体。

在采用包含前述的D113S点突变的ADRB2-tTA融合构建子和ARRB2-TEV-NIa蛋白酶表达质粒共转染的克隆41细胞中检测β-半乳糖苷酶活性的水平。活性检测如前述进行。结果显示激活剂异丙基肾上腺素不刺激报道基因在表达突变的ADRB2-tTA融合构建子的细胞中的表达。

实施例7

这些试验被设计以检查是否激活剂刺激的报道基因表达的提高是依赖于TEV NIa-Pro与ARRB2的融合。

为了做到这一点，检测在采用带有低效应剪切位点的ADRB2-tTA融合构建子和前述的ARRB2TEV-NIa蛋白酶表达质粒，或者和一个融合至磷脂酶C的SH2结构域的TEV-NIa蛋白酶对照共转染的克隆41细胞中检测β-半乳糖苷酶活性水平。活性检测如前述进行。结果表明激活剂刺激报道基因表达的提高仅仅在TEV蛋白酶被融合至ARRB2上被检测到而在融合至不相关的多肽时不能检测到。

实施例8

这些试验被设计以确定是否基因表达是由目标受体的激活剂选择性诱导的，或者其能被其他分子刺激。

ATP是G蛋白偶联受体P2Y1和P2Y2的激活剂，其被HEK-293T细胞内源表达。

采用前述的带有低效应剪切位点的ADRB2-tTA融合构建子和抑制蛋白TEV-NIa蛋白酶融合共转染的，并用异丙基肾上腺素、ATP或未处理的克隆41细胞进行试验。检测如前述进行。

结果显示报道基因活性的诱导是目标受体激活所特异的。另一种GPCR通路的刺激是不相关的。

实施例9

采用前述的带有低效应剪切位点的ADRB2-tTA融合构建子和ARRB2TEV-NIa蛋白酶融合共转染的克隆41细胞进行一系列试验，其采用数量变化的肾上腺受体激活剂之一的异丙基肾上腺素和肾上腺素处理。检测如前所述进行。图2a中所代表的结果显示报道基因表达对这两种配体刺激的剂量应答曲线。每个点代表从三个试验中获得的平均值。

一系列的试验如前述进行，在其中共转染的克隆41细胞采用各种浓度的肾上腺素受体拮抗剂阿普洛尔预处理15分钟，然后用1uM肾上腺素处理。在图2b中显示的结果说明这种拮抗剂的剂量抑制曲线。

实施例10

制造类似的系列构建子以建立对于偶联的G蛋白的精氨酸血管加压素受体2(AVPR2)检测。AVPR2编码区域(Genbank登记号：NM_000054)(SEQ ID NO：23)被修饰为在5’端放置EcoRI位点并且用BamHI位点替换终止密码子，采用如下引物进行PCR：

gaattcatgc tcatggcgtc caccac(SEQ ID NO：24)以及

ggatcccgat gaagtgtcct tggccag(SEQ ID NO：25)。

修饰的AVPR2编码区域被连接至前述的已经被EcoRI和BamHI剪切的三种ADRB2-tTA构建子。这用AVPR2的编码序列替换了ADRB2的整个编码序列。

克隆41细胞被前述的包含低效应剪切位点的AVPR2-tTA融合构建子和ARRB2-TEV-NIa蛋白酶融合蛋白共转染，并且采用各种浓度(1pM到2uM)的[Arg8]血管加压素(AVPR2激活剂)进行检测。在图3中代表的数据显示对这种激活剂的剂量应答曲线，采用3.3nM的EC50，与以前公开的数据一致(Oakley，R.等，Assay and DrμgDevelopment Technologies，1：21-30，(2002))。最大应答结果是诱导的报道基因表达大约是背景水平的40倍。

实施例11

一系列相似的构建子被制造以建立G蛋白偶联的血清素受体1a(HTR1A)的检测。HTR1A编码区域(Genbank登记号：NM_000524)(SEQ ID NO：26)被修饰为在5’端放置一个EcoRI位点而用一个BamHI位点替换终止密码子，采用如下引物进行PCR：gaattcatggatgtgctcagccctgg(SEQ ID NO：27)，以及

ggatccctgg cggcagaact tacac(SEQ ID NO：28).

修饰的HTR1A编码区被连接至前述的已被EcoRI和BamHI剪切的AVPR2-tTA构建子。这采用HTR1A的编码序列替换了整个AVPR2编码序列。最终构建子在这里即以后被称为“HTR1A-tTA”。

克隆41细胞被前述的包含低效应剪切位点的HTR1A-tTA融合构建子和ARRB2-TEV-NIa蛋白酶融合构建子共转染，并采用10μM8-氢氧基-DPAT HBr(OH-DPAT)，HTR1A激活剂，以及10uM血清素，HTR1A天然激活剂进行检测。检测如前述进行。对OH-DPAT最大应答结果是诱导的报道基因表达大约是背景水平的6.3倍，而血清素最大应答结果是诱导的报道基因表达大约是背景水平的4.6倍。

实施例12

相似的构建子被制造以建立G蛋白偶联的m2毒蕈碱性乙酰胆碱受体(CHRM2)的检测。CHRM2编码区域(Genbank登记号：NM_000739)(SEQ ID NO：29)被修饰为在5’端放置一个EcoRI位点并且采用一个BglII位点替换终止密码子，采用如下引物进行PCR：

gaattcatga ataactcaac aaactcc(SEQ ID NO：30)以及

agatctccttgtagcgccta tgttc(SEQ ID NO：31)。

修饰的CHRM2编码区域被连接至前述AVPR2-tTA构建子，其已被EcoRI和BamHI剪切。这用CHRM2的编码序列替换了整个AVPR2编码序列。

克隆41细胞被前述的包含高效应剪切位点的CHRM2-tTA融合构建子和ARRB2-TEV-NIa蛋白酶融合构建子共转染，其中ARRB2-蛋白酶融合构建子在单纯疱疹病毒胸腺嘧啶核苷激酶(HSV-TK)启动子的控制下表达，并采用10uM氨甲酰基胆碱Cl(卡巴胆碱carbochol)，CHRM2激活剂，如前述进行检测。卡巴胆碱最大应答结果是诱导的报道基因表达大约是背景水平的7.2倍。

实施例13

构建子也可被制造以建立G蛋白偶联趋化因子(C-C模序)受体5(CCR5)的检测。CCR5编码区域(Genbank登记号：NM_000579)(SEQID NO：32)被修饰以在5’端放置一个Not I位点并采用一个BamHI位点替换终止密码子，采用如下引物进行PCR：

gcggccgcatggattatcaa gtgtcaagtc c(SEQ ID NO：33)以及

ggatccctggcggcagaact tacac(SEQ ID NO：34)。

CCR5编码区域也被修饰以在5’端放置一个BsaI位点，其在被剪切时，留下与EcoRI剪切DNA相容的核苷酸突出端，采用如下引物：

ggtctccaattcatggatta tcaagtgtca agt(SEQ ID NO：35)，以及

gacgacagcc aggtacctat c(SEQ ID NO：36)。

第一修饰的编码区域被ClaI和BamHI剪切而第二被Bsal和Clal剪切。这两个片段被连接至前述AVPR2-tTA构建子，其已被EcoRI和BamHI剪切。这用CCR5的编码序列替换了整个AVPR2编码序列。

含有低效应剪切位点的CCR5-tTA融合构建子被转染至＂克隆34＂细胞，其为前述HEK细胞系＂克隆41＂的衍生物，但是其包含一个在CMV启动子控制之下的稳定整合了的ARRB2-TEV-NIa蛋白酶融合基因。采用1μg/ml“调节正常T—细胞表达和分泌活性”(RANTES)的已知CCR5激活剂进行检测。对RANTES的最大应答如前述检测的结果为诱导大约40倍于背景的报道基因的表达。

实施例14

其次，一系列构建子被制造以建立G蛋白偶联的多巴胺2受体(DRD2)的检测。DRD2编码区域(Genbank登记号：NM_000795)(SEQ ID NO：37)被修饰以在5’端放置一个EcoRI位点并且用一个BglII位点替换整个终止密码子，采用如下引物进行PCR：

gaattcatgg atccactgaa tctgtcc(SEQ ID NO：38)，以及

agatctgcag tggaggatct tcagg(SEQ ID NO：39).

修饰的DRD2编码区域被连接至前述用EcoRI和BamHI剪切的AVPR2-tTA构建子。这用DRD2的编码序列替换了整个AVPR2编码序列。

克隆41细胞被前述的包含中等效应剪切位点的DRD2-tTA融合构建子和ARRB2-TEV-NIa蛋白酶融合构建子共转染，并且采用10uM多巴胺HCl(多巴胺)，一种DRD2激活剂进行检测。结果在前述的检测中被检测。对多巴胺的最大应答为诱导的报道基因表达是背景的2.7倍。

实施例15

这些试验被设计来证明采用结合激活剂-偶联的GPCRs的抑制蛋白变体的增强作用更稳定。首先，构建TEVNIa蛋白酶至(β-抑制蛋白-1(ARRB1)的融合构建子。ARRB1的编码区域(Genbank登记号：NM_004041)(SEQ ID NO：40)被修饰以在5’端放置一个Asp718位点并用一个BamHI位点替换终止密码子，采用如下引物进行PCR：

ggtaccatgg gcgacaaagggacgcgagtg(SEQ ID NO：41)，以及

ggatcctctg ttgttgagctgtggagagcc tgtaccatcc tcctcttc(SEQ ID NO：42)。

结果，修饰的ARRB1编码区域被Asp718和EcoRI以及EcoRI和BamHI剪切，而前述的修饰的TEV NIa-Pro编码区域被BglII和NotI剪切。所有这三个片段被连接至商业可得的pcDNA3表达载体，其已经被Asp718和NotI消化。

克隆41细胞被包含中等效应剪切位点的DRD2-tTA融合构建子和ARRB1-TEV-NIa蛋白酶融合构建子共转染，并且检测采用如前述的10μM多巴胺HCI(多巴胺)，一种D2受体的激活剂进行。对多巴胺的最大应答为诱导的报道基因表达是背景的2.1倍。

在氨基酸382后截断ARRB1已被报道会导致不依赖GRK-介导的磷酸化对激活剂结合的GPCRs亲和性增加，(Kovoor A.等，J.Biol.Chem.，274(11)：6831-6834(1999))。为了在目前的检测中使用这样的“组成性活性的”抑制蛋白，β-抑制蛋白-1的编码区域被修饰以在5’端放置一个Asp718位点并在氨基酸382之后放置一个BamHI位点，采用如下序列以及前述的SEQID NO：41进行PCR：

ggatccatttgtgtcaagtt ctatgag(SEQ ID NO：43)。

结果产生比全长的编码区域短36个氨基酸的ARRb1编码区域于。称为＂ARRB1(Δ383)＂的获得的修饰的ARRB1编码区域采用Asp718和EcoRI以及采用EcoRI和BamHI剪切，而前述的修饰的TEV NIa-Pro编码区域采用BglII和Notl剪切。所有这三种片段被连接至商业可得的采用Asp718和NotI消化pcDNA3表达载体。

克隆41细胞被包含中等效应剪切位点的DRD2-tTA融合构建子和ARRB1(Δ383)-TEV-NIa蛋白酶融合构建子共转染，并且采用10μM多巴胺HCl(多巴胺)，一种前述的DRD2受体激活剂进行检测。对多巴胺的最大应答是诱导的报道基因表达是背景的8.3倍。。

为了检查ARRB2编码区域类似的截断，ARRB2的编码区域被修饰以在5’端放置一个Asp718位点并且用一个BamHI位点替换3’端的81核苷酸，采用如下引物进行PCR：

ggtaccatgggggagaaacc cgggacc(SEQ ID NO：44)，以及

ggatcctgtg gcatagttgg tatc(SEQID NO：45)。

结果产生短于全长的编码区域27个氨基酸的ARRB2编码区。最终修饰的ARRB2编码区域采用Asp718和BamHI剪切，而前述修饰的TEV NIa-Pro编码区域采用BglII和Notl剪切。这两种片段被连接至商业可得的采用Asp718和NotI消化pcDNA3表达载体，。

克隆41细胞被包含中等效应剪切位点的DRD2-tTA融合构建子和ARRB2(Δ383)-TEV-NIa蛋白酶融合构建子共转染，并且采用10μM多巴胺HCl(多巴胺)，如前述的一种DRD2受体拮抗剂进行检测。对多巴胺的最大应答是诱导的报道基因为背景的2.1倍。

这些结果如图4所代表，证明DRD2多巴胺受体检测显示采用抑制蛋白变体ARRB1(Δ383)获得最高信噪比。

实施例16

进行一系列的试验已证明采用被设计成提高蛋白相互作用的受体修饰增强了检测。在这个实施例中，检测受体的C-末端区域被用来自AVPR2的相应尾巴区域替换，其为一种已知的具有高亲和性结合抑制蛋白的物质。在这些实施例中，在第七跨膜螺旋末端保存的NPXXY模序之后15—18个氨基酸融合连接，其典型的相对应于紧挨着受体C末端的公认的棕榈酰化位点之后。

首先，PCR被用来生产一个编码AVPR2C-末端29个氨基酸DNA片段，之后为低效应TEV剪切位点和tTA转录因子。该片段还被设计成前两个氨基酸(Ala，A和Arg，R)被BssHII限制位点GCGCGC编码。这通过扩增具用前述低效应剪切位点的AVPR2-tTA构建子而实现，引物如下：

tgtgcgcgcg gacgcacccc acccagcctg ggt(SEQ ID NO：46)，以及

ctcgagagat cctcgcgccc cctacccacc(SEQ ID NO：11).

其次，DRD2的编码区域被修饰以在5’端放置一个EcoRI位点并将一个BssHII位点插入到编码区域中的最后氨基酸之后(Cys-443)。这采用如下引物进行PCR：

gaattcatgg atccactgaatctgtcc(SEQ ID NO：47)，以及

tgtgcgcgcg cagtggagga tcttcaggaa ggc(SEQ ID NO：48)。

获得的修饰的D2编码区域采用EcoRI和BssHII剪切并且获得的AVPR2C-末端低效应剪切位点-tTA片段采用BssHII和BamHI剪切。这两个片段被连接至前述的用EcoRI和BamHI剪切的AVPR2-低效应剪切位点-tTA构建子。

克隆41细胞被包含低效应TEV剪切位点的DRD2-AVPR2尾巴-tTA融合构建子和前述的ARRB2-TEV-NIa蛋白酶融合构建子共转染，并且采用如前述的10μM多巴胺HCl(多巴胺)，一种DRD2受体激活剂，进行检测。对多巴胺的最大应答是诱导的报道基因为背景的60倍。

制造了一种构建子，其中通过在5’端插入一个Asp718位点和在Cys-341之后放置一个BssHII位点而修饰ADRB2受体。通过如下引物进行PCR：

gcggccgcca ccatgaacgg taccgaaggc cca(SEQ ID NO：49)，以及

tgtgcgcgcgcacagaagct cctggaaggc(SEQ ID NO：50)。

修饰的ADRB2受体编码区域采用EcoRI和BssHII剪切而AVPR2C-末端尾巴低效应剪切位点-tTA片段采用BssHII和BamHI剪切。这两个片段被连接至前述的采用EcoRI和BamHI剪切的AVPR2-低效应剪切位点-tTA构建子，。获得构建子是＂ADRB2-AVPR2尾巴-tTA.＂(也参见出版的上述专利U.S.2002/0106379，特别是SEQ IDNO：3)

克隆41细胞被包含低效应剪切位点的DRB2-AVPR2尾巴-tTA融合构建子和前述的ARRB2-TEV-NIa蛋白酶融合构建子共转染，并且采用如前述的10μM异丙肾上腺素，一种ADRB2受体激活剂进行检测。对异丙肾上腺素的最大应答是诱导的报道基因为背景的10倍。

制造了一种构建子，其中通过在Cys-345之后放置一个BssHII位点而修饰卡巴阿片样物质受体(OPRK；Genbank登记号：NM_000912)(SEQIDNO：51)编码区域。通过如下引物进行PCR：

ggtctacttg atgaattcct ggcc(SEQ ID NO：52)，以及

gcgcgcacag aagtcccgga aacaccg(SEQ ID NO：53)

修饰的OPRK受体编码区域采用EcoRI和BssHII剪切而AVPR2C-末端尾巴低效应剪切位点-tTA片段采用BssHII和Xhol剪切。这两个片段被连接至包含克隆进入在Asp718(5′)和XhoI(3′)的pcDNA3.1+的修饰的OPRK受体序列的质粒中，其被EcoRI和Xhol剪切。

克隆41细胞被包含低效应剪切位点的OPRK-AVPR2尾巴-tTA融合构建子和前述的ARRB2-TEV-NIa蛋白酶融合构建子共转染，并且采用10μMU-69593，一种OPRK受体激活剂进行检测。对U-69593的最大应答是诱导的报道基因为背景的12倍。

实施例17

该试验被设计已证明利用该检测方法采用一种多重方式同时检测两种待测受体的活性。

克隆41细胞和＂克隆1H10＂细胞，其为包含受tTA依赖的启动子控制的荧光素酶基因稳定整合的HEK-293T细胞系，每个被置于24孔培养盘中并且分别用前述嵌合的ADRB2-AVPR2尾巴-tTA或DRD2-AVPR2尾巴-tTA融合构建子瞬时转染。采用每孔100μμl培养基，0.4μg DNA和2μl Fμgene试剂实现瞬时转染。孵育24小时之后，表达ADRB2-AVPR2尾巴-tTA的克隆41细胞和表达DRD2-AVPR2尾巴-tTA的克隆H10细胞被胰酶消化，等量混合，重置于96孔板的12孔中。三个孔不加药进行孵育或立刻用1μM异丙基肾上腺素，1μM多巴胺，或1μM两者的混合物处理。在配体加入之后的24小时对细胞报道基因的活性检测。培养基被废弃，细胞在40μμl裂解缓冲液中[100mM磷酸钾，pH7.8，0.2％Triton X-100]中裂解而细胞裂解物采用商业可获得的发光检测试剂检测β-半乳糖苷酶和荧光素酶活性。

图5A和5B代表了结果。用异丙基肾上腺素处理的结果是β-半乳糖苷酶报道基因活性大约诱导了7倍，而荧光素酶活性维持不变。用多巴胺处理的结果是荧光素酶活性大约诱导了3.5倍，而β-半乳糖苷酶活性维持不变。用异丙基肾上腺素和多巴胺同时处理的结果是分别诱导了7倍的β半乳糖苷酶和3倍的荧光素酶活性。

实施例18

这个试验被设计证明采用一个多重方式利用该检测方法同时检测两种待测受体。

＂克隆34.9＂细胞，其为克隆41细胞的衍生物并且包含一个稳定整合的ARRB2-TEVNIa蛋白酶融合蛋白基因，采用前述的嵌合的OPRK-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA融合构建子瞬时转染。平行地，＂克隆HTL5B8.1＂细胞，其为包含在tTA依赖的启动子控制下的荧光素酶基因稳定整合子的HEK-293T细胞系，采用前述的ADRB-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA融合构建子瞬时转染。在每种情况下，5x10⁵细胞被置入6孔盘的每个孔中，并且在添加有10％胎牛血清，2mM L-谷氨酰胺，100units/ml青霉素，500μg/ml G418和3μμg/ml嘌呤霉素的DMEM培养基中培养24小时。细胞用100μl的DMEM，0.5μg的OPRK-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA DNA和2.5μlFμgene(＂克隆34.9细胞＂)或100μμl的DMEM，0.5μμlg的ADRB2-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTADNA，0.5μgμl的ARRB2-TEV NIa蛋白酶DNA和5μlFμgene(＂克隆HTL5B8.1细胞＂)瞬时转染。瞬时转染细胞被培养24小时，然后用胰酶消化，等量混合并重置于96孔板中。在采用10μM U-69593，10μM异丙基肾上腺素或10μM这两者的混合物处理之前细胞孵育24小时。每种试验条件检测16个孔。24小时之后，细胞被裂解并且采用前述的方法检测β-半乳糖苷酶和荧光素酶报道基因活性。结果见于图6。采用U-69593处理结果诱导了大约15倍的β-半乳糖苷酶报道基因活性，而荧光素酶活性维持不变。采用异丙基肾上腺素处理结果诱导了145倍的荧光素酶活性，而β-半乳糖苷酶活性维持不变。采用U-69593和异丙基肾上腺素结果分别诱导了9倍的β-半乳糖苷酶和136倍的荧光素酶活性。

实施例19

实施该试验以证明在本发明的检测中不同转录因子和启动子的使用。

制造一种融合构建子，包含编码AVPR2的DNA，融合进入编码包括前述的TEV Nla-Pro低效应剪切位点的氨基酸连接子GSENLYFQLR(SEQ ID NO：54)的DNA序列的框架中，融合进入编码酵母GAL4蛋白(GenBank登记号P04386)(SEQ ID NO：55)氨基酸2-147的DNA序列中，其后为一个连接子，即序列PELGSASAELTMVF(SEQ ID NO：56)，其后为鼠核因子卡巴-B链p65蛋白(GenBank登记号A37932)(SEQ ID NO：57)的氨基酸368-549。CMV启动子被放置于AVPR2编码区域的上游而一个polyA序列被放置于GAL4-NFkB区域的下游。这种构建子是重新设计的AVPR2-TEV-NIa-Pro剪切(Leu)-GAL4。

HμL5C1.1是HEK-293T细胞的一种衍生物，其包含在一个商业可得的pFR-LUC的GAL4上游激活序列(UAS)控制之下稳定整合的荧光素酶报道基因。

这个AVPR2-TEV-NIa-Pro剪切(Leu)-GAL4质粒和前述的β-抑制蛋白2-TEV Nla蛋白酶共转染入HμL5C1.1细胞。大约2.5x10⁴细胞被放置在96孔板的每孔中，在10％胎牛血清，2mM L-谷氨酰胺，100units/ml青霉素，500μμg/ml G418以及3μμg/ml嘌呤霉素的DMEM培养基中培养。第二天细胞生长至50％融合度融合度并且采用10μμl每孔的包含85μμl的DMEM，0.1μμg的AVPR2-TEV-Nia-Pro剪切(Leu)-GAL4DNA，0.1μμg的ARRB2-TEVNla蛋白酶DNA，以及1μμl的Fμgene的混合物进行转染，这些物质在加入细胞之前在室温孵育15分钟。在采用10μM血管加压素处理之前培养细胞大约16小时。6小时之后，裂解细胞并且如前述进行荧光素酶活性检测。在这些条件下，血管加压素处理导致报道基因活性提高180倍。

实施例20

进行这一系列的试验以证明采用进一步的受体修饰可增强检测，该受体修饰被设计成提高与相互作用蛋白的亲和性。在这个实施例中，检测受体的C末端尾巴区域采用如下受体相应的尾巴区域替换：apelin J受体-AGTRL1(登记号：NM_005161)(SEQ ID NO：58)，胃泌激素释放肽受体-GRPR(登记号：NM_005314)(SEQ ID NO：59)，蛋白酶活化受体2-F2RL1(登记号：NM_005242)(SEQ ID NO：60)，CCR4(登记号：NM_005508)(SEQ ID NO：61)，趋化因子(C-X-C模序)受体4-CXCR4(登记号：NM_003467)(SEQ ID NO：62)，以及白细胞介素8受体，β-CXCR2/IL8b(登记号：NM_001557)(SEQ ID NO：63)。

用第一PCR产生编码上述受体C-末端尾巴的DNA片段。这些片段是这样设计的，即前两个氨基酸(Ala，A和Arg，R)通过BssHII限制位点编码。

AGTRL1C-末端片段采用如下引物扩增：

tgtgcgcgcggccagagcag gtgcgca(SEQID NO：64)，以及

gaggatccgt caaccacaagggtctc(SEQ ID NO：65)。

GRPR C-末端片段采用如下引物扩增：

tgtgcgcgcg gcctgatcatccggtct(SEQ ID NO：66)，以及

gaggatccgacataccgctc gtgaca(SEQ ID NO：67)。

F2RL1C-末端片段采用如下引物扩增：

tgtgcgcgcagtgtccgcactgtaaagc(SEQ ID NO：68)以及

gaggatccataggaggtcttaacagt(SEQ ID NO：69).

CCR4C-末端片段采用如下引物扩增：

tgtgcgcgcggcctttttgtgctctgc(SEQIN ：70)，以及

gaggatccca gagcatcatg aagatc(SEQ ID NO：71)。

CXCR2/IL8b C-末端片段采用如下引物扩增：

tgtgcgcgcggcttgatcagcaagggac(SEQ ID NO：72)，以及

gaggatccga gagtagtgga agtgtg(SEQ ID NO：73)。

CXCR4C-末端片段采用如下引物扩增：

tgtgcgcgcgggtccagcct caagatc(SEQ ID NO：74)，以及

gaggatccgc tggagtgaaaacttga(SEQ ID NO：75)。

获得的编码这些受体C-末端修饰的DNA片段采用BssHII和BamHI剪切并且片段被连接至OPRK受体编码区域框架，在前述的OPRK-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA表达构建子中替换AVPR2-C-末端片段。

前述的HTL5B8.1细胞采用上面修饰的每个OPRK编码区域-TEV-NIa-Pro剪切(Leu)-tTA构建子和前述的β-抑制蛋白2-TEVNIa蛋白酶融合构建子进行共转染。放置每孔大约2.5x10⁴细胞在96孔板中，用10％胎牛血清，2mM L-谷氨酰胺，100units/ml青霉素，500μg/ml G418，和3μμg/ml嘌呤霉素的DMEM培养基培养。第二天细胞生长至50％融合度融合度并且采用每孔10μl的如下混合物进行转染：85μl的DMEM，0.25μμg的AVPR2-TEV-NIa-Pro剪切(Leu)-GAL4DNA，0.25μμg的ARRB2-TEV NIa蛋白酶DNA，以及2.5μμl的Fμgene(一种合适的包含脂质体和其他材料的转染试剂)，在加入细胞之前在室温下孵育15分钟。转染细胞在用10μM U-69593处理前孵育大约16小时。6小时之后，裂解细胞并如前述检测荧光素酶活性。在这些条件下，采用U-69593处理，结果导致对于每种修饰的OPRK受体下述的报道基因活性的提高：OPRK-AGTRLI C-末端尾巴-30倍；OPRK-GRPRC-末端尾巴-312倍；OPRK-F2RL1C-末端尾巴-69.5倍；OPRK-CCR4C-末端尾巴-3.5倍；OPRK-CXCR4C-末端尾巴-9.3倍；OPAK-IL8b C-末端尾巴-113倍。

实施例21

这个实验被设计以生产前述的稳定表达ARRB2-TEV

NIa蛋白酶融合蛋白的细胞系。

制造了一种在EF1α启动子控制之下表达ARRB2-TEV

NIa蛋白酶融合蛋白并且还在胸腺嘧啶核苷激酶(TK)启动子控制之下表达潮霉素抗性基因的质粒。

该质粒被转染进HTL5B8.1，并且通过在100μμg/ml潮霉素存在下进行培养而选择出质粒稳定整合在基因组的克隆。抗性克隆被分离的和扩展并且通过前述的ADRB2-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA质粒转染而进行筛选。采用这一程序进行选择的三个细胞系，分别称为＂HTLA4C2.10＂，＂HTLA2C11.6＂和＂HTLA5D4＂。大约每孔2.5x10⁴细胞被植入到96孔板上，在带有10％胎牛血清，2mM L-谷氨酰胺，100units/ml青霉素，500μμg/ml G418，3μμg/ml嘌呤霉素，和100μg/ml潮霉素的DMEM培养基中培养。第二天细胞生长至50％融合度融合度并且被每孔10μl的如下混合物转染：85μμl的DMEM，0.25μμg的ADRB2-AVPR2-TEV-NIa-Pro剪切(Leu)-GALADNA和0.5μμl的Fμgene，其在加入细胞之前在室温孵育15分钟。在用10μM异丙基肾上腺素处理之前培养转染细胞大约16小时。6小时之后，细胞被裂解并如前述检测荧光素酶活性。在这些条件下，用异丙基肾上腺素处理导致这三个细胞系中分别有如下报道基因活性的提高：112-倍(＂HTLA4C2.10＂)，56-倍(＂HTLA2C11.6＂)和180-倍(＂HTLA5D4＂)。

实施例22

该实验被设计以生产稳定表达前述的ARRB2-TEV NIa蛋白酶和ADRB2-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA融合蛋白的细胞系。

包含潮霉素抗性基因的ARRB2-TEV NIa蛋白酶质粒与前述的ADRB2-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA融合蛋白质粒一起转染进HTL5B8.1细胞并且通过在100μμg/ml潮霉素的存在下培养而选择包含质粒稳定整合到基因组的克隆。抗性克隆被分离并扩展，并通过采用10μM异丙基肾上腺素处理而被筛选并检测如前述诱导的报道基因活性。采用该程序选择的三个细胞系被称为＂HTLAR

1E4＂，＂HTLAR1C10＂和＂HTLAR2G2＂。用异丙基肾上腺素处理6小时结果导致分别在三种细胞系中如下报道基因活性的提高：208-倍(＂HTLAR1E4＂)，197-倍(＂HTLAR1C10＂)和390-倍(＂HTLAR2G2＂)。

实施例23

该实验被设计以证明利用该检测方法检测受体酪氨酸激酶表皮生长因子受体(EGFR)的活性。

制造第一融合构建子，包含编码人EGFR的DNA，其可以在GenBank登记号NM_005228(SEQ ID NO：76)中找到，融合进入编码前述四环素控制的反式激活蛋白(transactivator)tTA的氨基酸3-335的DNA序列的框架中。插入在这些序列之间的是一个编码包括前述TEV NIa-Pro，ENLYFQL(SEQ ID NO：14)低效应剪切位点的氨基酸序列GGSGSENLYFQL(SEQID NO：77)的DNA序列。CMV启动子被放置在表皮生长因子受体编码区域的上游，而polyA序列被放置在tTA区域的下游。这一构建子被称为EGFR-TEV-NIa-Pro剪切(Leu)-tTA。

制造第二融合构建子，其包含编码两个人磷脂酶CGamma1相应于氨基酸538-759(基因Bank登记号NP_002651.2)(SEQ ID NO：78)的SH2结构域的DNA，其被融合进入一个编码前述成熟TEV NIa蛋白酶对应于氨基酸2040-2279(基因Bank登记号AAA47910)(SEQ ID NO：79)的催化结构域的DNA序列的框架中。在这些序列之间插入的一个编码氨基酸NSSGGNSGS(SEQ ID NO：80)的连接子DNA序列。CMV启动子被放置在PLC-Gamma SH2结构域编码序列的上游并且polyA序列被放置在TEV NIa蛋白酶序列的下游。这个构建子被称为PL CGammal-TEV。

EGFR-TEV-NIa-Pro剪切(Leu)-tTA和PLC Gammal-TEV融合构建子被转染进入前述克隆HTL5B8.1细胞。大约2.5x10⁴细胞被放置于96孔板的每孔中，在带有10％胎牛血清，2mM L-谷氨酰胺，100units/ml青霉素，500μg/ml G418，和3μμg/ml嘌呤霉素的DMEM培养基培养。第二天细胞生长至50％融合度融合度并采用每孔15μl如下混合物进行转染：100μμl的DMEM，0.4μμg的pcDNA3DNA(＂携带子＂载体DNA)，0.04μμg的EGFR-TEV-NIa-Pro剪切(Leu)-tTA DNA，0.04μμg的PLC Gammal-TEVDNA，以及2μμlFμgene(一种合适的包含脂质体和其他材料的转染试剂)，在加入细胞之前在室温下孵育15分钟。在采用特异的受体激活剂和抑制剂处理之前转染细胞被培养大约16小时。6小时之后，裂解细胞并如前述方法检测荧光素酶活性。结果见图7。

加入2.5ng/ml人表皮生长因子(对应于该配体的EC80)结果导致荧光素酶报道基因活性增加12.3倍，而加入100ng/ml人转化生长因子-Alpha结果导致增加18.3倍。在加入人表皮生长因子之前采用酪氨酸激酶抑制子(70μM AG-494；0.3μM AG-1478；2mMRG-130022)预处理阻断了报道基因活性的诱导。

实施例24

该实验被设计以证明采用该检测方法检测人I型干扰素受体的活性。

制造一种融合构建子，其包含编码人干扰素受体I(IFNAR1)(557氨基酸)的NA，可以在Genbank登记号NM_000629(SEQ ID NO：81)中找到，被融合进入编码前述四环素控制的反式激活蛋白tTA的氨基酸3-335的DNA序列框架中。在这些序列之间插入的是一个编码包括前述TEV NIa-Pro，ENLYFQL(SEQ ID NO：14)的低效应剪切位点的氨基酸序列GSENLYFQL(SEQ ID NO：82)的DNA序列。CMV启动子被放置于人干扰素受体I(IFNAR1)编码区域的上游，而一个poly A序列被放置于tTA区域的下游。这个构建子被称为IFNAR1-TEV-NIa-Pro剪切(L)-tTA。

制造一个第二融合构建子，采用编码人干扰素受体2的DNA，即剪接变体2(IFNAR2.2)(515个氨基酸)，其可以在Genbank登记号L41942(SEQ ID NO：83)中找到，被融合进入一个编码前述对应于氨基酸2040-2279(GenBank登记号AAA47910)(SEQ ID NO：84)的TEVNIa蛋白酶的催化结构域的DNA序列的框架中。在这些序列之间插入的是一个编码氨基酸序列RS(Arg-Ser)的DNA序列。CMV启动子区域被放置于人干扰素受体2(IFNAR2.2)编码区域的上游，而一个poly A序列被放置于TEV区域的下游。该构建子被称为IFNAR2.2-TEV。

构建了Genbank登记号为NM_007315(SEQ ID NO：85)的人信号传导和转录激活因子1(STAT1)的基因和人转录本2(STAT2)信号转换和活化子见于Genbank登记号为NM_005419(SEQID NO：86)的人信号传导和转录激活因子2(STAT2)的基因的表达构建子，其表达受CMV启动子区域控制。这些构建子分别被称为CMV-STAT1和CMV-STAT2。

IFNAR1-TEV-NIa-Pro剪切(L)-tTA和IFNAR2.2-TEV融合构建子与CMV-STAT1和CMV-STAT2一起被瞬时转染进入前述HTL5B8.1细胞。大约2.5x10⁴细胞被种植在96孔板的每孔中并在带有10％胎牛血清，2mM L-谷氨酰胺，100units/ml青霉素，100μμg/mlG418，和5μμg/ml嘌呤霉素的DMEM培养基中培养。孵育24小时之后，细胞采用每种15ng的IFNAR1-TEV-NIa-Pro剪切(L)-tTA，IFNAR2.2-TEV，CMV-STAT1和CMV-STAT2DNA，或者采用60ng对照pcDNA质粒，与0.3μlFμgene每孔进行转染。转染细胞在采用5000U/ml人干扰素α或5000U/ml人干扰素β处理之前孵育8—20小时。在加入干扰素时，吸出培养基并采用带有2mM L-谷氨酰胺，100units/ml青霉素，3μμg/ml嘌呤霉素和500μμg/ml的G418的293SFM II培养基替换。在进行前述的荧光素酶报道基因活性检测之前干扰素-处理的细胞被培养18—20小时。结果见图8。采用5000U/ml IFNα处理结果导致报道基因活性提高15倍，而采用5000U/ml IFNβ处理导致10倍的提高。用干扰素处理采用对照质粒pcDNA3转染的HTL5B8.1细胞对报道基因活性没有影响。图9显示在采用前述的IFNAR1(ENLYFQ(L)-tTa，IFNAR2.2-TEV，STAT1和STAT2表达构建子转染的HTL5B8.1细胞中对于IFNa所产生的剂量应答曲线。

实施例25

该实验证明该检测方法采用不同的转录因子和不同的细胞系检测人I型干扰素受体的活性。

制造融合构建子，采用编码人干扰素受体I(IFNAR1)的DNA，融合进入一个编码前述GAL4-NF-KB融合子的DNA序列。在这些序列之间插入的是一个编码包括前述的TEV NIa-Pro，ENLYFQL(SEQ ID NO：14)的低效应剪切位点的氨基酸序列GSENLYFQL(SEQID NO：87)的DNA序列。CMV启动子被放置在人干扰素受体I(IFNAR1)编码区域的上游，而一个poly A序列被放置在GAL4-NE-κB区域的下游。该构建子被称为IFNAR1-TEV-NIa-Pro剪切(L)-GAL4-NF-κB。

CHO-K1细胞随后被采用如下5种质粒的混合物瞬时转染：IFNAR1-TEV-NIa-Pro剪切(L)-GAL4-NF-κB，IFNAR2.2-TEV，CMV-STAT1，CMV-STAT2和GAL4依赖的启动子控制下的荧光素酶报道基因质粒pFR-Luc。在转染前大约每孔1.0x10⁴细胞被种植在96孔板中，采用带有如下成分的DMEM培养基培养：10％胎牛血清，2mM L-谷氨酰胺，100units/ml青霉素。细胞在第二天被转染，采用10ng报道基因质粒(pFR-Luc)，加上20ng前述的每种表达构建子，或者采用10ng报道基因质粒加上80ng对照pcDNA3质粒，以及每孔0.3μl Fμgene。在采用5000U/ml人干扰素-α处理之前培养转染细胞8—20小时。在加入干扰素之前，吸出培养基，用带有2mM L-谷氨酰胺，100units/ml青霉素的DMEM培养基替换。干扰素α处理的细胞在进行前述的荧光素酶报道基因活性检测之前培养6小时。结果见图10。采用报道基因，IFNAR和STAT构建子CHO-K1转染的细胞经IFNα处理结果导致报道基因活性提高3倍，而采用报道基因和对照质粒转染的转染细胞经干扰素处理对报道基因活性没有影响。

实施例26

设计本系列的试验以证明采用设计好的提高检测受体与相互作用蛋白之间亲和性的修饰增强检测。在这些例子中，在检测受体和GRPR(Genbank登记号：NM_005314)(SEQ ID NO：59)C-末端尾巴区域之间的融合连接在第七跨膜螺旋末端保存的NPXXY模序之后形成17-23个氨基酸。

首先，PCR被用来产生一个编码在假定的棕榈酰化位点之后的从GRPR开始2个氨基酸的C-末端42氨基酸的DNA片段(自此以后被称为GRPR42aa)。该片段被设计魏C-末端尾巴的第一氨基酸之前为由XbaI限制位点TCTAGA所编码的两个氨基酸(Ser，S andArg，R)，而终止密码子被由BamHI限制位点GGATCC所编码的两个氨基酸(Gly，G and Ser，S)替换。这通过扩增包含GRPR编码区域的质粒而完成，采用的引物是：

tctagaggcctgatcatccggtctcac(SEQ ID NO：88)，以及

gaggatccgacataccgctcgtgaca(SEQ ID NO：67)

接下来OPRK(Genbank登记号：NM_000912)(SEQ ID

NO：51)的编码区域被修饰以在Pro-347之后插入Xbal位点。采用如下引物进行PCR：

ggtctacttgatgaattcctggcc(SEQ ID NO：52)，以及

tctagatggaaaacagaagtcccggaaac(SEQ ID NO：89)

此外，ADRA1A(Genbank登记号：Nom_000680)(SEQIDNO：90)的编码区域被修饰以在Lys-349之后插入Xbal位点。采用如下引物进行PCR：

ctcggatatctaaacagctgcatcaa(SEQ ID NO：91)，以及tctagactttctgcagagacactggattc(SEQ ID NO：92)

此外，DRD2(Genbank登记号：NM_000795)(SEQ IDNO：37)的编码区域被修饰以在Cys-343之后插入两个氨基酸(Leu和Arg)以及XbaI位点。这采用如下引物进行PCR：

gaattcatggatccactgaatctgtcc(SEQ ID NO：38)，以及

tctagatcgaaggcagtggaggatcttcagg(SEQ ID NO：93)

修饰的OPRK受体编码区域采用EcoRI和XbaI剪切而GRPR42aa C-末端尾巴片段采用XbaI和BamHI剪切。两个片段被连接至包含具有前述的AVPR2C-末端尾巴-低效应剪切位点-tTA的OPRK受体的质粒中，其采用EcoRI和BamHI消化。

修饰的ADRA1A受体编码区域采用EcoRV和Xbal剪切而包含低效应剪切位点的OPRK-GRPR42aa尾巴-tTA融合构建子采用XbaI和XhoI剪切。两个片段被连接至包含ADRA1A受体的质粒中，其被EcoRV和XhoI消化。

修饰的DRD2受体编码区域采用EcoRI和Xbal剪切而包含低效应剪切位点的OPRK-GRPR42aa尾巴-tTA融合构建子采用XbaI和Xhol剪切。两个片段被连接至pcDNA6质粒，其被EcoRI和XhoI消化。

如前述的HTLA2C11.6细胞，被包含低效应剪切位点的OPRK-GRPR42aa尾巴-tTA融合构建子转染并且检测采用10μMU-69593，一种OPRK激活剂而进行。对U-69593的最大应答为报道基因活性提高大约200倍。

HTLA2C11.6细胞采用包含低效应剪切位点的ADRA1A-GRPR42aa尾巴-tTA融合构建子转染并且检测采用10μM肾上腺素，一种ADRAIA激活剂而进行。对肾上腺素最大应答为报道基因活性提高大约14倍。

HTLA2C11.6细胞采用包含低效应剪切位点的DRD2-GRPR42aa尾巴-tTA融合构建子转染并且检测采用10μM多巴胺，一种DRD2激活剂而进行。对多巴胺最大应答为报道基因活性提高大约30倍。

实施例27

本系列的试验本设计以证明采用设计好的提高检测受体与相互作用蛋白之间亲和性的修饰的不同检测受体进一步增强检测。在这些实施例中，检测受体的C-末端区域被GRPR内源的C-末端尾巴结构域的一个片断替换。

首先，PCR被用于生产一个编码截断的GRPR尾巴的DNA片段，特别是编码从Gly-343至Asn-365的23氨基酸的序列。片段被设计为C-末端尾巴的第一氨基酸之前为由XbaI限制位点TCTAGA所编码的两个氨基酸(Ser，S和Arg，R)，而Ser-366被由BamHI限制位点GGATCC所编码的两个氨基酸(Gly，G和Ser，S)替换。这通过扩增一个包含GRPR编码区域的质粒而完成，所用引物如下：tctagaggcctgatcatccggtctcac(SEQ ID NO：94)以及

cggatccgttggtactcttgagg(SEQID NO：95)。

接下来，截断的GRPR片段(自此以后被称为GRPR

23aa尾巴)采用Xbal和BamHI剪切并插入到包含这里所述的低效应检测位点的OPRK-GRPR42aa尾巴-tTA融合构建子中，其采用Xbal和BamHI消化。

同样地，GRPR23aa尾巴片段采用Xbal和BamHI消化并且被插入到这里所述的包含低效应剪切位点的ARRA1A-GRPR42aa尾巴-tTA融合构建子中，其采用Xbal和BamHI消化。

HTLA2C11.6细胞采用包含低效应剪切位点的OPRK-GRPR23aa尾巴-tTA融合构建子转染并且检测采用10μMU-69593，一种OPRK激活剂而进行。对U-69593的最大应答为报道基因表达比背景提高了大约115倍。

HTLA2C11.6细胞采用包含低效应剪切位点的ADRA1A-GRPR23aa尾巴-tTA融合构建子转染并且检测采用10μM肾上腺素，一种ADRA1A激活剂而进行。对肾上腺素的最大应答为报道基因的表达比背景提高了大约102倍。

实施例28

该实验被设计以证明利用该检测方法能检测受体酪氨酸激酶胰岛素样生长因子1受体(IGF1R)的活性，特别是通过监控配体诱导细胞内信号蛋白SHCI(包含Src同源2结构域转化蛋白1)的募集而检测。

制造第一融合构建子被，包含编码人IGF-1R的DNA，其可在GenBank登记号NM_000875(SEQ ID NO：96)下找到，其被融合进入一个编码前述的四环素控制的反式激活蛋白tTA的氨基酸3-335的DNA序列中。在这些序列中插入的是一个编码包括前述的TEVNIa-Pro，ENLYFQL(SEQ ID NO：14)低效应剪切位点的氨基酸序列GSENLYFQL(SEQID NO：82)的DNA序列。CMV启动子被放置在IGF1R编码区域的上游，并且polyA序列被放置在tTA区域的下游。该构建子被称为IGF1R-TEV-NIa-Pro剪切(Leu)-tTA。

制造第二融合构建子，包含编码人SHC1，对应于氨基酸1-238(基因Bank登记号BC014158)(SEQ ID NO：97)的PTB区域的DNA被融合进入一个编码前述的成熟TEV NIa蛋白酶，对应于氨基酸2040-2279(基因Bank登记号AAA47910)(SEQ ID NO：79)的催化结构域的DNA序列中。在这些序列中插入的是一个连接子DNA序列，其编码氨基酸NSGS(SEQ ID NO：98)。CMV启动子被放置在SHC1PTB结构域编码序列的上游而一个polyA序列被放置在TEV NIa蛋白酶序列的下游。该构建子被称为SHC1-TEV。

IGF1R-TEV-NIa-Pro剪切(Leu)-tTA和SHC1-TEV融合构建子被转染进入前述的克隆HTL5B8.1细胞中。大约2.5x10⁴细胞放置于96孔板的每孔中，采用带有10％胎牛血清，2mM L-谷氨酰胺，100units/ml青霉素，500μμg/ml G418，和3μg/ml嘌呤霉素的DMEM培养基培养。第二天细胞生长至50％融合度融合度并且采用每孔15μl如下混合物进行转染：100μμgl DMEM，0.2μμg IGF1R-TEV-NIa-Pro剪切(Leu)-tTA DNA，0.2μμg SHC1-TEV DNA，以及2μμl Fμgene(一种合适的包含脂质体和其他材料的转染试剂)，在加入细胞之前在室温下孵育15分钟。在采用特异受体激活剂处理之前，转染细胞被培养大约16小时。24小时之后，裂解细胞并如前述检测荧光素酶活性。

加入1μM人胰岛素样生长因子1导致荧光素酶报道基因活性提高90倍。

实施例29

该试验本设计以证明采用该检测方法能检测不是正常膜结合蛋白的两种检测蛋白之间的相互作用。在这个实施例中，该检测方法被用来检测配体诱导的核类固醇激素受体，ESR1(雌激素受体1或ERα)和ESR2(雌激素受体2或ERβ)二聚化。在这个实施例中，ESR1被融合至转录因子tTA，其中TEV NIa-Pro蛋白酶剪切位点在ESRI和tTA序列之间插入。该ESRI-tTA通过融合细胞内跨膜蛋白CD8的C末端而系在膜上。CD8基本功能为一个插入支架，而使ESR1连系在细胞膜的细胞质侧。这样融合的转录因子不能进入核直到与ESR2和蛋白酶相互作用。可采用任何跨膜蛋白。这种CD8-ESR1-TEV NIa Pro剪切-tTA融合蛋白与一个包含ESR2和TEV NIa-Pro蛋白酶的第二融合蛋白一起在包含一个tTA依赖的报道基因的细胞系中表达。雌激素诱导的ESR1和ESR2二聚化因而触发了tTA转录因子从膜结合的融合蛋白中释放，其可以通过随后诱导的报道基因活性而得以检测。

制造融合构建子，其包含编码人CD8基因(235氨基酸)的DNA序列，其可在Genbank登记号NM_001768(SEQ ID NO：99)下发现，被融合进入编码人ESR1(596氨基酸s)的DNA序列中，其可在Genbank登记号NM_000125(SEQ ID NO：100)下发现。在这些序列中插入的是一个编码氨基酸序列GRA(Gly-Arg-Ala)的DNA序列。最终构建子随后被融合至编码前述的四环素控制的反式激活蛋白tTA的氨基酸3-335的DNA编码序列框中。在这些序列中插入的是一个编码包含前述的TEV NIa-Pro，ENLYFQL(SEQ ID NO：14)的低效应剪切位点的氨基酸序列GSENLYFQL(SEQID NO：82)的DNA序列。CMV启动子被放置在人CD8编码区域的上游，而polyA序列被放置在tTA区域的下游。该构建子被称为CD8-ESR1-TEV-NIa-Pro剪切(L)-tTA。

制造第二融合构建子，采用编码人雌激素受体β(ESR2)(530个氨基酸)的DNA，其可在Genbank登记号NM_001437(SEQIDNO：101)下被找到，其被融合进入一个编码前述的TEVNIa蛋白酶催化结构域，对应于氨基酸2040-2279(GenBank登记号AAA47910)(SEQ ID NO：84)的DNA序列中。在这些序列中插入的是一个编码氨基酸序列RS(Arg-Ser)的DNA序列。CMV启动子区域被放置在人雌激素受体β(ESR2)编码区域的上游，而poly A序列被放置在TEV区域的下游。该构建子被称为ESR2-TEV。

CD8-ESR1-TEV-NIa-Pro剪切(L)-tTA和ESR2-TEV融合构建子，与pCDNA3一起被瞬时转染入前述的HTL5B8.1细胞中。大约2.0x10⁴细胞被种植在96孔板的每孔中并且在带有10％胎牛血清，2mM L-谷氨酰胺，100units/ml青霉素，100μμg/ml G418和5μμg/ml嘌呤霉素的不含酚的DMEM培养基中培养。在孵育24小时后，细胞每孔采用5ng的ESR1-TEV-NIa-Pro剪切(L)-tTA，15ngESR2-TEV和40ng pCDNA3以及0.3μμl Fμgene的混合物一起进行转染。转染6小时之后，细胞用PBS清洗并在采用50nM17-β雌二醇处理之前用100μμl不含酚和血清的DMEM中孵育24小时。配体处理的细胞在如前述检测荧光素酶报道基因活性之前再培养18—20小时。用50nM17-β雌二醇处理使得报道基因活性增加16倍。

本发明的其它特征对于本领域技术人员是清楚的并且不需要在此再介绍。

序列表

<110>K·J·李

R·阿谢尔

W·斯特拉波斯

G·巴尔内亚

<120>检测蛋白-蛋白相互作用的方法

<130>SENTI203.3PCT

<140>PCT/US2004/021887

<141>2004-07-09

<150>60/566,113

<151>2004-04-27

<150>60/511,918

<151>2003-10-15

<150>60/485,968

<151>2003-07-09

<160>101

<210>1

<211>2015

<212>DNA

<213>人

<400>1

actgcgaagc ggcttcttca gagcacgggc tggaactggc aggcaccgcg agcccctagc 60

acccgacaag ctgagtgtgc aggacgagtc cccaccacac ccacaccaca gccgctgaat 120

gaggcttcca ggcgtccgct cgcggcccgc agagccccgc cgtgggtccg cccgctgagg 180

cgcccccagc cagtgcgctt acctgccaga ctgcgcgcca tggggcaacc cgggaacggc 240

agcgccttct tgctggcacc caatagaagc catgcgccgg accacgacgt cacgcagcaa 300

agggacgagg tgtgggtggt gggcatgggc atcgtcatgt ctctcatcgt cctggccatc 360

gtgtttggca atgtgctggt catcacagcc attgccaagt tcgagcgtct gcagacggtc 420

accaactact tcatcacttc actggcctgt gctgatctgg tcatgggcct ggcagtggtg 480

ccctttgggg ccgcccatat tcttatgaaa atgtggactt ttggcaactt ctggtgcgag 540

ttttggactt ccattgatgt gctgtgcgtc acggccagca ttgagaccct gtgcgtgatc 600

gcagtggatc gctactttgc cattacttca cctttcaagt accagagcct gctgaccaag 660

aataaggccc gggtgatcat tctgatggtg tggattgtgt caggccttac ctccttcttg 720

cccattcaga tgcactggta ccgggccacc caccaggaag ccatcaactg ctatgccaat 780

gagacctgct gtgacttctt cacgaaccaa gcctatgcca ttgcctcttc catcgtgtcc 840

ttctacgttc ccctggtgat catggtcttc gtctactcca gggtctttca ggaggccaaa 900

aggcagctcc agaagattga caaatctgag ggccgcttcc atgtccagaa ccttagccag 960

gtggagcagg atgggcggac ggggcatgga ctccgcagat cttccaagtt ctgcttgaag 1020

gagcacaaag ccctcaagac gttaggcatc atcatgggca ctttcaccct ctgctggctg 1080

cccttcttca tcgttaacat tgtgcatgtg atccaggata acctcatccg taaggaagtt 1140

tacatcctcc taaattggat aggctatgtc aattctggtt tcaatcccct tatctactgc 1200

cggagcccag atttcaggat tgccttccag gagcttctgt gcctgcgcag gtcttctttg 1260

aaggcctatg ggaatggcta ctccagcaac ggcaacacag gggagcagag tggatatcac 1320

gtggaacagg agaaagaaaa taaactgctg tgtgaagacc tcccaggcac ggaagacttt 1380

gtgggccatc aaggtactgt gcctagcgat aacattgatt cacaagggag gaattgtagt 1440

acaaatgact cactgctgta aagcagtttt tctactttta aagacccccc cccccccaac 1500

agaacactaa acagactatt taacttgagg gtaataaact tagaataaaa ttgtaaaaat 1560

tgtatagaga tatgcagaag gaagggcatc cttctgcctt ttttattttt ttaagctgta 1620

aaaagagaga aaacttattt gagtgattat ttgttatttg tacagttcag ttcctctttg 1680

catggaattt gtaagtttat gtctaaagag ctttagtcct agaggacctg agtctgctat 1740

attttcatga cttttccatg tatctacctc actattcaag tattaggggt aatatattgc 1800

tgctggtaat ttgtatctga aggagatttt ccttcctaca cccttggact tgaggatttt 1860

gagtatctcg gacctttcag ctgtgaacat ggactcttcc cccactcctc ttatttgctc 1920

acacggggta ttttaggcag ggatttgagg agcagcttca gttgttttcc cgagcaaagg 1980

tctaaagttt acagtaaata aaatgtttga ccatg 2015

<210>2

<211>26

<212>DNA

<213>人

<400>2

gattgaagat ctgccttctt gctggc 26

<210>3

<211>27

<212>DNA

<213>人

<400>3

gcagaacttg gaagacctgc ggagtcc 27

<210>4

<211>27

<212>DNA

<213>人

<400>4

ggactccgca ggtcttccaa gttctgc 27

<210>5

<211>27

<212>DNA

<213>人

<400>5

ttcggatcct agcagtgagt catttgt 27

<210>6

<211>7

<212>PRT

<213>人

<400>6

Glu Asn Leu Tyr Phe Gln Ser

5

<210>7

<211>32

<212>DNA

<213>人

<400>7

ccggatcctc tagattagat aaaagtaaag tg 32

<210>8

<211>35

<212>DNA

<213>人

<400>8

gactcgagct agcagtatcc tcgcgccccc taccc 35

<210>9

<211>18

<212>DNA

<213>人

<400>9

gagaacctgt acttccag 18

<210>10

<211>33

<212>DNA

<213>人

<400>10

ggatccgaga acctgtactt ccagtacaga tta 33

<210>11

<211>30

<212>DNA

<213>人

<400>11

ctcgagagat cctcgcgccc cctacccacc 30

<210>12

<211>7

<212>PRT

<213>人

<400>12

Glu Asn Leu Tyr Phe Gln Tyr

5

<210>13

<211>33

<212>DNA

<213>人

<400>13

ggatccgaga acctgtactt ccagctaaga tta 33

<210>14

<211>7

<212>PRT

<213>人

<400>14

Glu Asn Leu Tyr Phe Gln Leu

5

<210>15

<211>33

<212>DNA

<213>人

<400>15

gcggccgcca ccat gaacgg taccgaaggc cca 33

<210>16

<211>21

<212>DNA

<213>人

<400>16

ctggtgggtg gcccggtacc a 21

<210>17

<211>1936

<212>DNA

<213>人

<400>17

ccccgcgtgt ctgctaggag agggcgggca gcgccgcggc gcgcgcgatc cggctgacgc 60

atctggcccc ggttccccaa gaccagagcg gggccgggag ggagggggaa gaggcgagag 120

cgcggagggc gcgcgtgcgc attggcgcgg ggaggagcag ggatcttggc agcgggcgag 180

gaggctgcga gcgagccgcg aaccgagcgg gcggcgggcg cgcgcaccat gggggagaaa 240

cccgggacca gggtcttcaa gaagtcgagc cctaactgca agctcaccgt gtacttgggc 300

aagcgggact tcgtagatca cctggacaaa gtggaccctg tagatggcgt ggtgcttgtg 360

gaccctgact acctgaagga ccgcaaagtg tttgtgaccc tcacctgcgc cttccgctat 420

ggccgtgaag acctggatgt gctgggcttg tccttccgca aagacctgtt catcgccacc 480

taccaggcct tccccccggt gcccaaccca ccccggcccc ccacccgcct gcaggaccgg 540

ctgctgagga agctgggcca gcatgcccac cccttcttct tcaccatacc ccagaatctt 600

ccatgctccg tcacactgca gccaggccca gaggatacag gaaaggcctg cggcgtagac 660

tttgagattc gagccttctg tgctaaatca ctagaagaga aaagccacaa aaggaactct 720

gtgcggctgg tgatccgaaa ggtgcagttc gccccggaga aacccggccc ccagccttca 780

gccgaaacca cacgccactt cctcatgtct gaccggtccc tgcacctcga ggcttccctg 840

gacaaggagc tgtactacca tggggagccc ctcaatgtaa atgtccacgt caccaacaac 900

tccaccaaga ccgtcaagaa gatcaaagtc tctgtgagac agtacgccga catctgcctc 960

ttcagcaccg cccagtacaa gtgtcctgtg gctcaactcg aacaagatga ccaggtatct 1020

cccagctcca cattctgtaa ggtgtacacc ataaccccac tgctcagcga caaccgggag 1080

aagcggggtc tcgccctgga tgggaaactc aagcacgagg acaccaacct ggcttccagc 1140

accatcgtga aggagggtgc caacaaggag gtgctgggaa tcctggtgtc ctacagggtc 1200

aaggtgaagc tggtggtgtc tcgaggcggg gatgtctctg tggagctgcc ttttgttctt 1260

atgcacccca agccccacga ccacatcccc ctccccagac cccagtcagc cgctccggag 1320

acagatgtcc ctgtggacac caacctcatt gaatttgata ccaactatgc cacagatgat 1380

gacattgtgt ttgaggactt tgcccggctt cggctgaagg ggatgaagga tgacgactat 1440

gatgatcaac tctgctagga agcggggtgg gaagaaggga ggggatgggg ttgggagagg 1500

tgagggcagg attaagatcc ccactgtcaa tgggggattg tcccagcccc tcttcccttc 1560

ccctcacctg gaagcttctt caaccaatcc cttcacactc tctcccccat ccccccaaga 1620

tacacactgg accctctctt gctgaatgtg ggcattaatt ttttgactgc agctctgctt 1680

ctccagcccc gccgtgggtg gcaagctgtg ttcataccta aattttctgg aaggggacag 1740

tgaaaagagg agtgacagga gggaaagggg gagacaaaac tcctactctc aacctcacac 1800

caacacctcc cattatcact ctctctgccc ccattccttc aagaggagac cctttgggga 1860

caaggccgtt tctttgtttc tgagcataaa gaagaaaata aatcttttac taagcatgaa 1920

aaaaaaaaaa aaaaaa 1936

<210>18

<211>35

<212>DNA

<213>人

<400>18

caggatcctc tggaatgggg gagaaacccg ggacc 35

<210>19

<211>30

<212>DNA

<213>人

<400>19

ggatccgcag agttgatcat catagtcgtc 30

<210>20

<211>9

<212>PRT

<213>人

<400>20

Tyr Pro Tyr Asp Val Pro Asp Tyr Ala

5

<210>21

<211>28

<212>DNA

<213>人

<400>21

agatctagct tgtttaaggg accacgtg 28

<210>22

<211>62

<212>DNA

<213>人

<400>22

gcggccgctc aagcgtaatc tggaacatca tatgggtacg agtacaccaa ttcattcatg 60

ag 62

<210>23

<211>1809

<212>DNA

<213>人

<400>23

agaagatcct gggttctgtg catccgtctg tctgaccatc cctctcaatc ttccctgccc 60

aggactggcc atactgccac cgcacacgtg cacacacgcc aacaggcatc tgccatgctg 120

gcatctctat aagggctcca gtccagagac cctgggccat tgaacttgct cctcaggcag 180

aggctgagtc cgcacatcac ctccaggccc tcagaacacc tgccccagcc ccaccatgct 240

catggcgtcc accacttccg ctgtgcctgg gcatccctct ctgcccagcc tgcccagcaa 300

cagcagccag gagaggccac tggacacccg ggacccgctg ctagcccggg cggagctggc 360

gctgctctcc atagtctttg tggctgtggc cctgagcaat ggcctggtgc tggcggccct 420

agctcggcgg ggccggcggg gccactgggc acccatacac gtcttcattg gccacttgtg 480

cctggccgac ctggccgtgg ctctgttcca agtgctgccc cagctggcct ggaaggccac 540

cgaccgcttc cgtgggccag atgccctgtg tcgggccgtg aagtatctgc agatggtggg 600

catgtatgcc tcctcctaca tgatcctggc catgacgctg gaccgccacc gtgccatctg 660

ccgtcccatg ctggcgtacc gccatggaag tggggctcac tggaaccggc cggtgctagt 720

ggcttgggcc ttctcgctcc ttctcagcct gccccagctc ttcatcttcg cccagcgcaa 780

cgtggaaggt ggcagcgggg tcactgactg ctgggcctgc tttgcggagc cctggggccg 840

tcgcacctat gtcacctgga ttgccctgat ggtgttcgtg gcacctaccc tgggtatcgc 900

cgcctgccag gtgctcatct tccgggagat tcatgccagt ctggtgccag ggccatcaga 960

gaggcctggg gggcgccgca ggggacgccg gacaggcagc cccggtgagg gagcccacgt 1020

gtcagcagct gtggccaaga ctgtgaggat gacgctagtg attgtggtcg tctatgtgct 1080

gtgctgggca cccttcttcc tggtgcagct gtgggccgcg tgggacccgg aggcacctct 1140

ggaaggggcg ccctttgtgc tactcatgtt gctggccagc ctcaacagct gcaccaaccc 1200

ctggatctat gcatctttca gcagcagcgt gtcctcagag ctgcgaagct tgctctgctg 1260

tgcccgggga cgcaccccac ccagcctggg tccccaagat gagtcctgca ccaccgccag 1320

ctcctccctg gccaaggaca cttcatcgtg aggagctgtt gggtgtcttg cctctagagg 1380

ctttgagaag ctcagctgcc ttcctggggc tggtcctggg agccactggg agggggaccc 1440

gtggagaatt ggccagagcc tgtggccccg aggctgggac actgtgtggc cctggacaag 1500

ccacagcccc tgcctgggtc tccacatccc cagctgtatg aggagagctt caggccccag 1560

gactgtgggg gcccctcagg tcagctcact gagctgggtg taggaggggc tgcagcagag 1620

gcctgaggag tggcaggaaa gagggagcag gtgcccccag gtgagacagc ggtcccaggg 1680

gcctgaaaag gaaggaccag gctggggcca ggggaccttc ctgtctccgc ctttctaatc 1740

cctccctcct cattctctcc ctaataaaaa ttggagctct tttccacatg gcaaggggtc 1800

tccttggaa 1809

<210>24

<211>26

<212>DNA

<213>人

<400>24

gaattcatgc tcatggcgtc caccac 26

<210>25

<211>27

<212>DNA

<213>人

<400>25

ggatcccgat gaagtgtcct tggccag 27

<210>26

<211>1266

<212>DNA

<213>人

<400>26

atggatgtgc tcagccctgg tcagggcaac aacaccacat caccaccggc tccctttgag 60

accggcggca acactactgg tatctccgac gtgaccgtca gctaccaagt gatcacctct 120

ctgctgctgg gcacgctcat cttctgcgcg gtgctgggca atgcgtgcgt ggtggctgcc 180

atcgccttgg agcgctccct gcagaacgtg gccaattatc ttattggctc tttggcggtc 240

accgacctca tggtgtcggt gttggtgctg cccatggccg cgctgtatca ggtgctcaac 300

aagtggacac tgggccaggt aacctgcgac ctgttcatcg ccctcgacgt gctgtgctgc 360

acctcatcca tcttgcacct gtgcgccatc gcgctggaca ggtactgggc catcacggac 420

cccatcgact acgtgaacaa gaggacgccc cggccgcgtg cgctcatctc gctcacttgg 480

cttattggct tcctcatctc tatcccgccc atcctgggct ggcgcacccc ggaagaccgc 540

tcggaccccg acgcatgcac cattagcaag gatcatggct acactatcta ttccaccttt 600

ggagctttct acatcccgct gctgctcatg ctggttctct atgggcgcat attccgagct 660

gcgcgcttcc gcatccgcaa gacggtcaaa aaggtggaga agaccggagc ggacacccgc 720

catggagcat ctcccgcccc gcagcccaag aagagtgtga atggagagtc ggggagcagg 780

aactggaggc tgggcgtgga gagcaaggct gggggtgctc tgtgcgccaa tggcgcggtg 840

aggcaaggtg acgatggcgc cgccctggag gtgatcgagg tgcaccgagt gggcaactcc 900

aaagagcact tgcctctgcc cagcgaggct ggtcctaccc cttgtgcccc cgcctctttc 960

gagaggaaaa atgagcgcaa cgccgaggcg aagcgcaaga tggccctggc ccgagagagg 1020

aagacagtga agacgctggg catcatcatg ggcaccttca tcctctgctg gctgcccttc 1080

ttcatcgtgg ctcttgttct gcccttctgc gagagcagct gccacatgcc caccctgttg 1140

ggcgccataa tcaattggct gggctactcc aactctctgc ttaaccccgt catttacgca 1200

tacttcaaca aggactttca aaacgcgttt aagaagatca ttaagtgtaa cttctgccgc 1260

cagtga 1266

<210>27

<211>26

<212>DNA

<213>人

<400>27

gaattcatgg atgtgctcag ccctgg 26

<210>28

<211>25

<212>DNA

<213>人

<400>28

ggatccctgg cggcagaact tacac 25

<210>29

<211>1401

<212>DNA

<213>人

<400>29

atgaataact caacaaactc ctctaacaat agcctggctc ttacaagtcc ttataagaca 60

tttgaagtgg tgtttattgt cctggtggct ggatccctca gtttggtgac cattatcggg 120

aacatcctag tcatggtttc cattaaagtc aaccgccacc tccagaccgt caacaattac 180

tttttattca gcttggcctg tgctgacctt atcataggtg ttttctccat gaacttgtac 240

accctctaca ctgtgattgg ttactggcct ttgggacctg tggtgtgtga cctttggcta 300

gccctggact atgtggtcag caatgcctca gttatgaatc tgctcatcat cagctttgac 360

aggtacttct gtgtcacaaa acctctgacc tacccagtca agcggaccac aaaaatggca 420

ggtatgatga ttgcagctgc ctgggtcctc tctttcatcc tctgggctcc agccattctc 480

ttctggcagt tcattgtagg ggtgagaact gtggaggatg gggagtgcta cattcagttt 540

ttttccaatg ctgctgtcac ctttggtacg gctattgcag ccttctattt gccagtgatc 600

atcatgactg tgctatattg gcacatatcc cgagccagca agagcaggat aaagaaggac 660

aagaaggagc ctgttgccaa ccaagacccc gtttctccaa gtctggtaca aggaaggata 720

gtgaagccaa acaataacaa catgcccagc agtgacgatg gcctggagca caacaaaatc 780

cagaatggca aagcccccag ggatcctgtg actgaaaact gtgttcaggg agaggagaag 840

gagagctcca atgactccac ctcagtcagt gctgttgcct ctaatatgag agatgatgaa 900

ataacccagg atgaaaacac agtttccact tccctgggcc attccaaaga tgagaactct 960

aagcaaacat gcatcagaat tggcaccaag accccaaaaa gtgactcatg taccccaact 1020

aataccaccg tggaggtagt ggggtcttca ggtcagaatg gagatgaaaa gcagaatatt 1080

gtagcccgca agattgtgaa gatgactaag cagcctgcaa aaaagaagcc tcctccttcc 1140

cgggaaaaga aagtcaccag gacaatcttg gctattctgt tggctttcat catcacttgg 1200

gccccataca atgtcatggt gctcattaac accttttgtg caccttgcat ccccaacact 1260

gtgtggacaa ttggttactg gctttgttac atcaacagca ctatcaaccc tgcctgctat 1320

gcactttgca atgccacctt caagaagacc tttaaacacc ttctcatgtg tcattataag 1380

aacataggcg ctacaaggta a 1401

<210>30

<211>27

<212>DNA

<213>人

<400>30

gaattcatga ataactcaac aaactcc 27

<210>31

<211>25

<212>DNA

<213>人

<400>31

agatctcctt gtagcgccta tgttc 25

<210>32

<211>3655

<212>DNA

<213>人

<400>32

cttcagatag attatatctg gagtgaagga tcctgccacc tacgtatctg gcatagtatt 60

ctgtgtagtg ggatgagcag agaacaaaaa caaaataatc cagtgagaaa agcccgtaaa 120

taaaccttca gaccagagat ctattctcca gcttatttta agctcaactt aaaaagaaga 180

actgttctct gattcttttc gccttcaata cacttaatga tttaactcca ccctccttca 240

aaagaaacag catttcctac ttttatactg tctatatgat tgatttgcac agctcatctg 300

gccagaagag ctgagacatc cgttccccta caagaaactc tccccgggtg gaacaagatg 360

gattatcaag tgtcaagtcc aatctatgac atcaattatt atacatcgga gccctgccaa 420

aaaatcaatg tgaagcaaat cgcagcccgc ctcctgcctc cgctctactc actggtgttc 480

atctttggtt ttgtgggcaa catgctggtc atcctcatcc tgataaactg caaaaggctg 540

aagagcatga ctgacatcta cctgctcaac ctggccatct ctgacctgtt tttccttctt 600

actgtcccct tctgggctca ctatgctgcc gcccagtggg actttggaaa tacaatgtgt 660

caactcttga cagggctcta ttttataggc ttcttctctg gaatcttctt catcatcctc 720

ctgacaatcg ataggtacct ggctgtcgtc catgctgtgt ttgctttaaa agccaggacg 780

gtcacctttg gggtggtgac aagtgtgatc acttgggtgg tggctgtgtt tgcgtctctc 840

ccaggaatca tctttaccag atctcaaaaa gaaggtcttc attacacctg cagctctcat 900

tttccataca gtcagtatca attctggaag aatttccaga cattaaagat agtcatcttg 960

gggctggtcc tgccgctgct tgtcatggtc atctgctact cgggaatcct aaaaactctg 1020

cttcggtgtc gaaatgagaa gaagaggcac agggctgtga ggcttatctt caccatcatg 1080

attgtttatt ttctcttctg ggctccctac aacattgtcc ttctcctgaa caccttccag 1140

gaattctttg gcctgaataa ttgcagtagc tctaacaggt tggaccaagc tatgcaggtg 1200

acagagactc ttgggatgac gcactgctgc atcaacccca tcatctatgc ctttgtcggg 1260

gagaagttca gaaactacct cttagtcttc ttccaaaagc acattgccaa acgcttctgc 1320

aaatgctgtt ctattttcca gcaagaggct cccgagcgag caagctcagt ttacacccga 1380

tccactgggg agcaggaaat atctgtgggc ttgtgacacg gactcaagtg ggctggtgac 1440

ccagtcagag ttgtgcacat ggcttagttt tcatacacag cctgggctgg gggtggggtg 1500

ggagaggtct tttttaaaag gaagttactg ttatagaggg tctaagattc atccatttat 1560

ttggcatctg tttaaagtag attagatctt ttaagcccat caattataga aagccaaatc 1620

aaaatatgtt gatgaaaaat agcaaccttt ttatctcccc ttcacatgca tcaagttatt 1680

gacaaactct cccttcactc cgaaagttcc ttatgtatat ttaaaagaaa gcctcagaga 1740

attgctgatt cttgagttta gtgatctgaa cagaaatacc aaaattattt cagaaatgta 1800

caacttttta cctagtacaa ggcaacatat aggttgtaaa tgtgtttaaa acaggtcttt 1860

gtcttgctat ggggagaaaa gacatgaata tgattagtaa agaaatgaca cttttcatgt 1920

gtgatttccc ctccaaggta tggttaataa gtttcactga cttagaacca ggcgagagac 1980

ttgtggcctg ggagagctgg ggaagcttct taaatgagaa ggaatttgag ttggatcatc 2040

tattgctggc aaagacagaa gcctcactgc aagcactgca tgggcaagct tggctgtaga 2100

aggagacaga gctggttggg aagacatggg gaggaaggac aaggctagat catgaagaac 2160

cttgacggca ttgctccgtc taagtcatga gctgagcagg gagatcctgg ttggtgttgc 2220

agaaggttta ctctgtggcc aaaggagggt caggaaggat gagcatttag ggcaaggaga 2280

ccaccaacag ccctcaggtc agggtgagga tggcctctgc taagctcaag gcgtgaggat 2340

gggaaggagg gaggtattcg taaggatggg aaggagggag gtattcgtgc agcatatgag 2400

gatgcagagt cagcagaact ggggtggatt tggtttggaa gtgagggtca gagaggagtc 2460

agagagaatc cctagtcttc aagcagattg gagaaaccct tgaaaagaca tcaagcacag 2520

aaggaggagg aggaggttta ggtcaagaag aagatggatt ggtgtaaaag gatgggtctg 2580

gtttgcagag cttgaacaca gtctcaccca gactccaggc tgtctttcac tgaatgcttc 2640

tgacttcata gatttccttc ccatcccagc tgaaatactg aggggtctcc aggaggagac 2700

tagatttatg aatacacgag gtatgaggtc taggaacata cttcagctca cacatgagat 2760

ctaggtgagg attgattacc tagtagtcat ttcatgggtt gttgggagga ttctatgagg 2820

caaccacagg cagcatttag cacatactac acattcaata agcatcaaac tcttagttac 2880

tcattcaggg atagcactga gcaaagcatt gagcaaaggg gtcccatata ggtgagggaa 2940

gcctgaaaaa ctaagatgct gcctgcccag tgcacacaag tgtaggtatc attttctgca 3000

tttaaccgtc aataggcaaa ggggggaagg gacatattca tttggaaata agctgccttg 3060

agccttaaaa cccacaaaag tacaatttac cagcctccgt atttcagact gaatgggggt 3120

ggggggggcg ccttaggtac ttattccaga tgccttctcc agacaaacca gaagcaacag 3180

aaaaaatcgt ctctccctcc ctttgaaatg aatatacccc ttagtgtttg ggtatattca 3240

tttcaaaggg agagagagag gtttttttct gttctttctc atatgattgt gcacatactt 3300

gagactgttt tgaatttggg ggatggctaa aaccatcata gtacaggtaa ggtgagggaa 3360

tagtaagtgg tgagaactac tcagggaatg aaggtgtcag aataataaga ggtgctactg 3420

actttctcag cctctgaata tgaacggtga gcattgtggc tgtcagcagg aagcaacgaa 3480

gggaaatgtc tttccttttg ctcttaagtt gtggagagtg caacagtagc ataggaccct 3540

accctctggg ccaagtcaaa gacattctga catcttagta tttgcatatt cttatgtatg 3600

tgaaagttac aaattgcttg aaagaaaata tgcatctaat aaaaaacacc ttcta 3655

<210>33

<211>31

<212>DNA

<213>人

<400>33

gcggccgcat ggattatcaa gtgtcaagtc c 31

<210>34

<211>25

<212>DNA

<213>人

<400>34

ggatccctgg cggcagaact tacac 25

<210>35

<211>33

<212>DNA

<213>人

<400>35

ggtctccaat tcatggatta tcaagtgtca agt 33

<210>36

<211>21

<212>DNA

<213>人

<400>36

gacgacagcc aggtacctat c 21

<210>37

<211>2643

<212>DNA

<213>人

<400>37

ggcagccgtc cggggccgcc actctcctcg gccggtccct ggctcccgga ggcggccgcg 60

cgtggatgcg gcgggagctg gaagcctcaa gcagccggcg ccgtctctgc cccggggcgc 120

cctatggctt gaagagcctg gccacccagt ggctccaccg ccctgatgga tccactgaat 180

ctgtcctggt atgatgatga tctggagagg cagaactgga gccggccctt caacgggtca 240

gacgggaagg cggacagacc ccactacaac tactatgcca cactgctcac cctgctcatc 300

gctgtcatcg tcttcggcaa cgtgctggtg tgcatggctg tgtcccgcga gaaggcgctg 360

cagaccacca ccaactacct gatcgtcagc ctcgcagtgg ccgacctcct cgtcgccaca 420

ctggtcatgc cctgggttgt ctacctggag gtggtaggtg agtggaaatt cagcaggatt 480

cactgtgaca tcttcgtcac tctggacgtc atgatgtgca cggcgagcat cctgaacttg 540

tgtgccatca gcatcgacag gtacacagct gtggccatgc ccatgctgta caatacgcgc 600

tacagctcca agcgccgggt caccgtcatg atctccatcg tctgggtcct gtccttcacc 660

atctcctgcc cactcctctt cggactcaat aacgcagacc agaacgagtg catcattgcc 720

aacccggcct tcgtggtcta ctcctccatc gtctccttct acgtgccctt cattgtcacc 780

ctgctggtct acatcaagat ctacattgtc ctccgcagac gccgcaagcg agtcaacacc 840

aaacgcagca gccgagcttt cagggcccac ctgagggctc cactaaaggg caactgtact 900

caccccgagg acatgaaact ctgcaccgtt atcatgaagt ctaatgggag tttcccagtg 960

aacaggcgga gagtggaggc tgcccggcga gcccaggagc tggagatgga gatgctctcc 1020

agcaccagcc cacccgagag gacccggtac agccccatcc cacccagcca ccaccagctg 1080

actctccccg acccgtccca ccatggtctc cacagcactc ccgacagccc cgccaaacca 1140

gagaagaatg ggcatgccaa agaccacccc aagattgcca agatctttga gatccagacc 1200

atgcccaatg gcaaaacccg gacctccctc aagaccatga gccgtaggaa gctctcccag 1260

cagaaggaga agaaagccac tcagatgctc gccattgttc tcggcgtgtt catcatctgc 1320

tggctgccct tcttcatcac acacatcctg aacatacact gtgactgcaa catcccgcct 1380

gtcctgtaca gcgccttcac gtggctgggc tatgtcaaca gcgccgtgaa ccccatcatc 1440

tacaccacct tcaacattga gttccgcaag gccttcctga agatcctcca ctgctgactc 1500

tgctgcctgc ccgcacagca gcctgcttcc cacctccctg cccaggccgg ccagcctcac 1560

ccttgcgaac cgtgagcagg aaggcctggg tggatcggcc tcctcttcac cccggcaggc 1620

cctgcagtgt tcgcttggct ccatgctcct cactgcccgc acaccctcac tctgccaggg 1680

cagtgctagt gagctgggca tggtaccagc cctggggctg ggccccccag ctcaggggca 1740

gctcatagag tcccccctcc cacctccagt ccccctatcc ttggcaccaa agatgcagcc 1800

gccttccttg accttcctct ggggctctag ggttgctgga gcctgagtca gggcccagag 1860

gctgagtttt ctctttgtgg ggcttggcgt ggagcaggcg gtggggagag atggacagtt 1920

cacaccctgc aaggcccaca ggaggcaagc aagctctctt gccgaggagc caggcaactt 1980

cagtcctggg agacccatgt aaataccaga ctgcaggttg gaccccagag attcccaagc 2040

caaaaacctt agctccctcc cgcaccccga tgtggacctc tactttccag gctagtccgg 2100

acccacctca ccccgttaca gctccccaag tggtttccac atgctctgag aagaggagcc 2160

ctcatcttga agggcccagg agggtctatg gggagaggaa ctccttggcc tagcccaccc 2220

tgctgccttc tgacggccct gcaatgtatc ccttctcaca gcacatgctg gccagcctgg 2280

ggcctggcag ggaggtcagg ccctggaact ctatctgggc ctgggctagg ggacatcaga 2340

ggttctttga gggactgcct ctgccacact ctgacgcaaa accactttcc ttttctattc 2400

cttctggcct ttcctctctc ctgtttccct tcccttccac tgcctctgcc ttagaggagc 2460

ccacggctaa gaggctgctg aaaaccatct ggcctggcct ggccctgccc tgaggaagga 2520

ggggaagctg cagcttggga gagcccctgg ggcctagact ctgtaacatc actatccatg 2580

caccaaacta ataaaacttt gacgagtcac cttccaggac ccctgggtaa aaaaaaaaaa 2640

aaa 2643

<210>38

<211>27

<212>DNA

<213>人

<400>38

gaattcatgg atccactgaa tctgtcc 27

<210>39

<211>25

<212>DNA

<213>人

<400>39

agatctgcag tggaggatct tcagg 25

<210>40

<211>1301

<212>DNA

<213>人

<400>40

atgggcgaca aagggacgcg agtgttcaag aaggccagtc caaatggaaa gctcaccgtc 60

tacctgggaa agcgggactt tgtggaccac atcgacctcg tggaccctgt ggatggtgtg 120

gtcctggtgg atcctgagta tctcaaagag cggagagtct atgtgacgct gacctgcgcc 180

ttccgctatg gccgggagga cctggatgtc ctgggcctga cctttcgcaa ggacctgttt 240

gtggccaacg tacagtcgtt cccaccggcc cccgaggaca agaagcccct gacgcggctg 300

caggaacgcc tcatcaagaa gctgggcgag cacgcttacc ctttcacctt tgagatccct 360

ccaaaccttc catgttctgt gacactgcag ccggggcccg aagacacggg gaaggcttgc 420

ggtgtggact atgaagtcaa agccttctgc gcggagaatt tggaggagaa gatccacaag 480

cggaattctg tgcgtctggt catccggaag gttcagtatg ccccagagag gcctggcccc 540

cagcccacag ccgagaccac caggcagttc ctcatgtcgg acaagccctt gcacctagaa 600

gcctctctgg ataaggagat ctattaccat ggagaaccca tcagcgtcaa cgtccacgtc 660

accaacaaca ccaacaagac ggtgaagaag atcaagatct cagtgcgcca gtatgcagac 720

atctgccttt tcaacacagc tcagtacaag tgccctgttg ccatggaaga ggctgatgac 780

actgtggcac ccagctcgac gttctgcaag gtctacacac tgaccccctt cctagccaat 840

aaccgagaga agcggggcct cgccttggac gggaagctca agcacgaaga cacgaacttg 900

gcctctagca ccctgttgag ggaaggtgcc aaccgtgaga tcctggggat cattgtttcc 960

tacaaagtga aagtgaagct ggtggtgtct cggggcggcc tgttgggaga tcttgcatcc 1020

agcgacgtgg ccgtggaact gcccttcacc ctaatgcacc ccaagcccaa agaggaaccc 1080

ccgcatcggg aagttccaga gaacgagacg ccagtagata ccaatctcat agaacttgac 1140

acaaatgatg acgacattgt atttgaggac tttgctcgcc agagactgaa aggcatgaag 1200

gatgacaagg aggaagagga ggatggtacc ggctctccac agctcaacaa cagatagacg 1260

ggccggccct gcctccacgt ggctccggct ccactctcgt g 1301

<210>41

<211>30

<212>DNA

<213>人

<400>41

ggtaccatgg gcgacaaagg gacgcgagtg 30

<210>42

<211>48

<212>DNA

<213>人

<400>42

ggatcctctg ttgttgagct gtggagagcc tgtaccatcc tcctcttc 48

<210>43

<211>27

<212>DNA

<213>人

<400>43

ggatccattt gtgtcaagtt ctatgag 27

<210>44

<211>27

<212>DNA

<213>人

<400>44

ggtaccatgg gggagaaacc cgggacc 27

<210>45

<211>24

<212>DNA

<213>人

<400>45

ggatcctgtg gcatagttgg tatc 24

<210>46

<211>33

<212>DNA

<213>人

<400>46

tgtgcgcgcg gacgcacccc acccagcctg ggt 33

<210>47

<211>27

<212>DNA

<213>人

<400>47

gaattcatgg atccactgaa tctgtcc 27

<210>48

<211>33

<212>DNA

<213>人

<400>48

tgtgcgcgcg cagtggagga tcttcaggaa ggc 33

<210>49

<211>33

<212>DNA

<213>人

<400>49

gcggccgcca ccatgaacgg taccgaaggc cca 33

<210>50

<211>30

<212>DNA

<213>人

<400>50

tgtgcgcgcg cacagaagct cctggaaggc 30

<210>51

<211>1602

<212>DNA

<213>人

<400>51

gagctccgtg ctgggaggtg ggaagggggc ttgaccctgg ggactcaggc agtctgggga 60

cagttccacc aggggccggt gcctagaatt ggtgagggag gcacctcagg ggctggggga 120

gaaggaacga gcgctcttcg cccctctctg gcacccagcg gcgcgcctgc tggccggaaa 180

ggcagcgaga agtccgttct ccctgtcctg cccccggcga cttgcggccc gggtgggagt 240

ccgcaggctc cgggtcccca gcgccgctgg ccagggcgcg ggcaaagttt gcctctccgc 300

gtccagccgg ttctttcgct cccgcagcgc cgcaggtgcc gcctgtcctc gccttcctgc 360

tgcaatcgcc ccaccatgga ctccccgatc cagatcttcc gcggggagcc gggccctacc 420

tgcgccccga gcgcctgcct gccccccaac agcagcgcct ggtttcccgg ctgggccgag 480

cccgacagca acggcagcgc cggctcggag gacgcgcagc tggagcccgc gcacatctcc 540

ccggccatcc cggtcatcat cacggcggtc tactccgtag tgttcgtcgt gggcttggtg 600

ggcaactcgc tggtcatgtt cgtgatcatc cgatacacaa agatgaagac agcaaccaac 660

atttacatat ttaacctggc tttggcagat gctttagtta ctacaaccat gccctttcag 720

agtacggtct acttgatgaa ttcctggcct tttggggatg tgctgtgcaa gatagtaatt 780

tccattgatt actacaacat gttcaccagc atcttcacct tgaccatgat gagcgtggac 840

cgctacattg ccgtgtgcca ccccgtgaag gctttggact tccgcacacc cttgaaggca 900

aagatcatca atatctgcat ctggctgctg tcgtcatctg ttggcatctc tgcaatagtc 960

cttggaggca ccaaagtcag ggaagacgtc gatgtcattg agtgctcctt gcagttccca 1020

gatgatgact actcctggtg ggacctcttc atgaagatct gcgtcttcat ctttgccttc 1080

gtgatccctg tcctcatcat catcgtctgc tacaccctga tgatcctgcg tctcaagagc 1140

gtccggctcc tttctggctc ccgagagaaa gatcgcaacc tgcgtaggat caccagactg 1200

gtcctggtgg tggtggcagt cttcgtcgtc tgctggactc ccattcacat attcatcctg 1260

gtggaggctc tggggagcac ctcccacagc acagctgctc tctccagcta ttacttctgc 1320

atcgccttag gctataccaa cagtagcctg aatcccattc tctacgcctt tcttgatgaa 1380

aacttcaagc ggtgtttccg ggacttctgc tttccactga agatgaggat ggagcggcag 1440

agcactagca gagtccgaaa tacagttcag gatcctgctt acctgaggga catcgatggg 1500

atgaataaac cagtatgact agtcgtggag atgtcttcgt acagttcttc gggaagagag 1560

gagttcaatg atctaggttt aactcagatc actactgcag tc 1602

<210>52

<211>24

<212>DNA

<213>人

<400>52

ggtctacttg atgaattcct ggcc 24

<210>53

<211>27

<212>DNA

<213>人

<400>53

gcgcgcacag aagtcccgga aacaccg 27

<210>54

<211>10

<212>PRT

<213>人

<400>54

Gly Ser Glu Asn Leu Tyr Phe Gln Leu Arg

5 10

<210>55

<211>881

<212>PRT

<213>人

<400>55

Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu

5 10 15

Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu

20 25 30

Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro

35 40 45

Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu

50 55 60

Glu Gln Leu Phe Leu Leu Ile Phe Pro Arg Glu Asp Leu Asp Met Ile

65 70 75 80

Leu Lys Met Asp Ser Leu Gln Asp Ile Lys Ala Leu Leu Thr Gly Leu

85 90 95

Phe Val Gln Asp Asn Val Asn Lys Asp Ala Val Thr Asp Arg Leu Ala

100 105 110

Ser Val Glu Thr Asp Met Pro Leu Thr Leu Arg Gln His Arg Ile Ser

115 120 125

Ala Thr Ser Ser Ser Glu Glu Ser Ser Asn Lys Gly Gln Arg Gln Leu

130 135 140

Thr Val Ser Ile Asp Ser Ala Ala His His Asp Asn Ser Thr Ile Pro

145 150 155 160

Leu Asp Phe Met Pro Arg Asp Ala Leu His Gly Phe Asp Trp Ser Glu

165 170 175

Glu Asp Asp Met Ser Asp Gly Leu Pro Phe Leu Lys Thr Asp Pro Asn

180 185 190

Asn Asn Gly Phe Phe Gly Asp Gly Ser Leu Leu Cys Ile Leu Arg Ser

195 200 205

Ile Gly Phe Lys Pro Glu Asn Tyr Thr Asn Ser Asn Val Asn Arg Leu

210 215 220

Pro Thr Met Ile Thr Asp Arg Tyr Thr Leu Ala Ser Arg Ser Thr Thr

225 230 235 240

Ser Arg Leu Leu Gln Ser Tyr Leu Asn Asn Phe His Pro Tyr Cys Pro

245 250 255

Ile Val His Ser Pro Thr Leu Met Met Leu Tyr Asn Asn Gln Ile Glu

260 265 270

Ile Ala Ser Lys Asp Gln Trp Gln Ile Leu Phe Asn Cys Ile Leu Ala

275 280 285

Ile Gly Ala Trp Cys Ile Glu Gly Glu Ser Thr Asp Ile Asp Val Phe

290 295 300

Tyr Tyr Gln Asn Ala Lys Ser His Leu Thr Ser Lys Val Phe Glu Ser

305 310 315 320

Gly Ser Ile Ile Leu Val Thr Ala Leu His Leu Leu Ser Arg Tyr Thr

325 330 335

Gln Trp Arg Gln Lys Thr Asn Thr Ser Tyr Asn Phe His Ser Phe Ser

340 345 350

Ile Arg Met Ala Ile Ser Leu Gly Leu Asn Arg Asp Leu Pro Ser Ser

355 360 365

Phe Ser Asp Ser Ser Ile Leu Glu Gln Arg Arg Arg Ile Trp Trp Ser

370 375 380

Val Tyr Ser Trp Glu Ile Gln Leu Ser Leu Leu Tyr Gly Arg Ser Ile

385 390 395 400

Gln Leu Ser Gln Asn Thr Ile Ser Phe Pro Ser Ser Val Asp Asp Val

405 410 415

Gln Arg Thr Thr Thr Gly Pro Thr Ile Tyr His Gly Ile Ile Glu Thr

420 425 430

Ala Arg Leu Leu Gln Val Phe Thr Lys Ile Tyr Glu Leu Asp Lys Thr

435 440 445

Val Thr Ala Glu Lys Ser Pro Ile Cys Ala Lys Lys Cys Leu Met Ile

450 455 460

Cys Asn Glu Ile Glu Glu Val Ser Arg Gln Ala Pro Lys Phe Leu Gln

465 470 475 480

Met Asp Ile Ser Thr Thr Ala Leu Thr Asn Leu Leu Lys Glu His Pro

485 490 495

Trp Leu Ser Phe Thr Arg Phe Glu Leu Lys Trp Lys Gln Leu Ser Leu

500 505 510

Ile Ile Tyr Val Leu Arg Asp Phe Phe Thr Asn Phe Thr Gln Lys Lys

515 520 525

Ser Gln Leu Glu Gln Asp Gln Asn Asp His Gln Ser Tyr Glu Val Lys

530 535 540

Arg Cys Ser Ile Met Leu Ser Asp Ala Ala Gln Arg Thr Val Met Ser

545 550 555 560

Val Ser Ser Tyr Met Asp Asn His Asn Val Thr Pro Tyr Phe Ala Trp

565 570 575

Asn Cys Ser Tyr Tyr Leu Phe Asn Ala Val Leu Val Pro Ile Lys Thr

580 585 590

Leu Leu Ser Asn Ser Lys Ser Asn Ala Glu Asn Asn Glu Thr Ala Gln

595 600 605

Leu Leu Gln Gln Ile Asn Thr Val Leu Met Leu Leu Lys Lys Leu Ala

610 615 620

Thr Phe Lys Ile Gln Thr Cys Glu Lys Tyr Ile Gln Val Leu Glu Glu

625 630 635 640

Val Cys Ala Pro Phe Leu Leu Ser Gln Cys Ala Ile Pro Leu Pro His

645 650 655

Ile Ser Tyr Asn Asn Ser Asn Gly Ser Ala Ile Lys Asn Ile Val Gly

660 665 670

Ser Ala Thr Ile Ala Gln Tyr Pro Thr Leu Pro Glu Glu Asn Val Asn

675 680 685

Asn Ile Ser Val Lys Tyr Val Ser Pro Gly Ser Val Gly Pro Ser Pro

690 695 700

Val Pro Leu Lys Ser Gly Ala Ser Phe Ser Asp Leu Val Lys Leu Leu

705 710 715 720

Ser Asn Arg Pro Pro Ser Arg Asn Ser Pro Val ThrIle Pro Arg Ser

725 730 735

Thr Pro Ser His Arg Ser Val Thr Pro Phe Leu Gly Gln Gln Gln Gln

740 745 750

Leu Gln Ser Leu Val Pro Leu Thr Pro Ser Ala Leu Phe Gly Gly Ala

755 760 765

Asn Phe Asn Gln Ser Gly Asn Ile Ala Asp Ser Ser Leu Ser Phe Thr

770 775 780

Phe Thr Asn Ser Ser Asn Gly Pro Asn Leu Ile Thr Thr Gln Thr Asn

785 790 795 800

Ser Gln Ala Leu Ser Gln Pro Ile Ala Ser Ser Asn Val His Asp Asn

805 810 815

Phe Met Asn Asn Glu Ile Thr Ala Ser Lys Ile Asp Asp Gly Asn Asn

820 825 830

Ser Lys Pro Leu Ser Pro Gly Trp Thr Asp Gln Thr Ala Tyr Asn Ala

835 840 845

Phe Gly Ile Thr Thr Gly Met Phe Asn Thr Thr Thr Met Asp Asp Val

850 855 860

Tyr Asn Tyr Leu Phe Asp Asp Glu Asp Thr Pro Pro Asn Pro Lys Lys

865 870 875 880

Glu

<210>56

<211>13

<212>PRT

<213>人

<400>56

Pro Gln Lys Gly Ser Ala Ser Glu Lys Thr Met Val Phe

5 10

<210>57

<211>549

<212>PRT

<213>人

<400>57

Met Asp Asp Leu Phe Pro Leu Ile Phe Pro Ser Glu Pro Ala Gln Ala

5 10 15

Ser Gly Pro Tyr Val Glu Ile Ile Glu Gln Pro Lys Gln Arg Gly Met

20 25 30

Arg Phe Arg Tyr Lys Cys Glu Gly Arg Ser Ala Gly Ser Ile Pro Gly

35 40 45

Glu Arg Ser Thr Asp Thr Thr Lys Thr His Pro Thr Ile Lys Ile Asn

50 55 60

Gly Tyr Thr Gly Pro Gly Thr Val Arg Ile Ser Leu Val Thr Lys Asp

65 70 75 80

Pro Pro His Arg Pro His Pro His Glu Leu Val Gly Lys Asp Cys Arg

85 90 95

Asp Gly Tyr Tyr Glu Ala Asp Leu Cys Pro Asp Arg Ser Ile His Ser

100 105 110

Phe Gln Asn Leu Gly Ile Gln Cys Val Lys Lys Arg Asp Leu Glu Gln

115 120 125

Ala Ile Ser Gln Arg Ile Gln Thr Asn Asn Asn Pro Phe His Val Pro

130 135 140

Ile Glu Glu Gln Arg Gly Asp Tyr Asp Leu Asn Ala Val Arg Leu Cys

145 150 155 160

Phe Gln Val Thr Val Arg Asp Pro Ala Gly Arg Pro Leu Leu Leu Thr

165 170 175

Pro Val Leu Ser His Pro Ile Phe Asp Asn Arg Ala Pro Asn Thr Ala

180 185 190

Glu Leu Lys Ile Cys Arg Val Asn Arg Asn Ser Gly Ser Cys Leu Gly

195 200 205

Gly Asp Glu Ile Phe Leu Leu Cys Asp Lys Val Gln Lys Glu Asp Ile

210 215 220

Glu Val Tyr Phe Thr Gly Pro Gly Trp Glu Ala Arg Gly Ser Phe Ser

225 230 235 240

Gln Ala Asp Val His Arg Gln Val Ala Ile Val Phe Arg Thr Pro Pro

245 250 255

Tyr Ala Asp Pro Ser Leu Gln Ala Pro Val Arg Val Ser Met Gln Leu

260 265 270

Arg Arg Pro Ser Asp Arg Glu Leu Ser Glu Pro Met Glu Phe Gln Tyr

275 280 285

Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg

290 295 300

Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Asn Gly

305 310 315 320

Pro Thr Glu Pro Arg Pro Pro Thr Arg Arg Ile Ala Val Pro Thr Arg

325 330 335

Asn Ser Thr Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Thr Phe Pro

340 345 350

Ala Ser Leu Ser Thr Ile Asn Phe Asp Glu Phe Ser Pro Met Leu Leu

355 360 365

Pro Ser Gly Gln Ile Ser Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser

370 375 380

Ala Pro Val Leu Ala Gln Thr Met Val Pro Ser Ser Ala Met Val Pro

385 390 395 400

Leu Ala Gln Pro Pro Ala Pro Ala Pro Val Leu Thr Pro Gly Pro Pro

405 410 415

Gln Ser Leu Ser Ala Pro Val Pro Lys Ser Thr Gln Ala Gly Glu Gly

420 425 430

Thr Leu Ser Glu Ala Leu Leu His Leu Gln Phe Asp Ala Asp Glu Asp

435 440 445

Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Gly Val Phe Thr Asp

450 455 460

Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly

465 470 475 480

Val Ser Met Ser His Ser Thr Ala Glu Pro Met Leu Met Glu Tyr Pro

485 490 495

Glu Ala Ile Thr Arg Leu Val Thr Gly Ser Gln Arg Pro Pro Asp Pro

500 505 510

Ala Pro Thr Pro Leu Gly Thr Ser Gly Leu Pro Asn Gly Leu Ser Gly

515 520 525

Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu

530 535 540

Ser Gln Ile Ser Ser

545

<210>58

<211>1833

<212>DNA

<213>人

<400>58

ggaggtggga ggagggagtg acgagtcaag gaggagacag ggacgcagga gggtgcaagg 60

aagtgtctta actgagacgg gggtaaggca agagagggtg gaggaaattc tgcaggagac 120

aggcttcctc cagggtctgg agaacccaga ggcagctcct cctgagtgct gggaaggact 180

ctgggcatct tcagcccttc ttactctctg aggctcaagc cagaaattca ggctgcttgc 240

agagtgggtg acagagccac ggagctggtg tccctgggac cctctgcccg tcttctctcc 300

actccccagc atggaggaag gtggtgattt tgacaactac tatggggcag acaaccagtc 360

tgagtgtgag tacacagact ggaaatcctc gggggccctc atccctgcca tctacatgtt 420

ggtcttcctc ctgggcacca cgggcaacgg tctggtgctc tggaccgtgt ttcggagcag 480

ccgggagaag aggcgctcag ctgatatctt cattgctagc ctggcggtgg ctgacctgac 540

cttcgtggtg acgctgcccc tgtgggctac ctacacgtac cgggactatg actggccctt 600

tgggaccttc ttctgcaagc tcagcagcta cctcatcttc gtcaacatgt acgccagcgt 660

cttctgcctc accggcctca gcttcgaccg ctacctggcc atcgtgaggc cagtggccaa 720

tgctcggctg aggctgcggg tcagcggggc cgtggccacg gcagttcttt gggtgctggc 780

cgccctcctg gccatgcctg tcatggtgtt acgcaccacc ggggacttgg agaacaccac 840

taaggtgcag tgctacatgg actactccat ggtggccact gtgagctcag agtgggcctg 900

ggaggtgggc cttggggtct cgtccaccac cgtgggcttt gtggtgccct tcaccatcat 960

gctgacctgt tacttcttca tcgcccaaac catcgctggc cacttccgca aggaacgcat 1020

cgagggcctg cggaagcggc gccggctgct cagcatcatc gtggtgctgg tggtgacctt 1080

tgccctgtgc tggatgccct accacctggt gaagacgctg tacatgctgg gcagcctgct 1140

gcactggccc tgtgactttg acctcttcct catgaacatc ttcccctact gcacctgcat 1200

cagctacgtc aacagctgcc tcaacccctt cctctatgcc tttttcgacc cccgcttccg 1260

ccaggcctgc acctccatgc tctgctgtgg ccagagcagg tgcgcaggca cctcccacag 1320

cagcagtggg gagaagtcag ccagctactc ttcggggcac agccaggggc ccggccccaa 1380

catgggcaag ggtggagaac agatgcacga gaaatccatc ccctacagcc aggagaccct 1440

tgtggttgac tagggctggg agcagagaga agcctggcgc cctcggccct ccccggcctt 1500

tgcccttgct ttctgaaaat cagagtcacc tcctctgccc agagctgtcc tcaaagcatc 1560

cagtgaacac tggaagaggc ttctagaagg gaagaaattg tccctctgag gccgccgtgg 1620

gtgacctgca gagacttcct gcctggaact catctgtgaa ctgggacaga agcagaggag 1680

gctgcctgct gtgatacccc cttacctccc ccagtgcctt cttcagaata tctgcactgt 1740

cttctgatcc tgttagtcac tgtggttcat caaataaaac tgtttgtgca actgttgtgt 1800

ccaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 1833

<210>59

<211>1666

<212>DNA

<213>人

<400>59

aactgcagcc agggagactc agactagaat ggaggtagaa agaactgatg cagagtgggt 60

ttaattctaa gcctttttgt ggctaagttt tgttgttgtt aacttattga atttagagtt 120

gtattgcact ggtcatgtga aagccagagc agcaccagtg tcaaaatagt gacagagagt 180

tttgaatacc atagttagta tatatgtact cagagtattt ttattaaaga aggcaaagag 240

cccggcatag atcttatctt catcttcact cggttgcaaa atcaatagtt aagaaatagc 300

atctaaggga acttttaggt gggaaaaaaa atctagagat ggctctaaat gactgtttcc 360

ttctgaactt ggaggtggac catttcatgc actgcaacat ctccagtcac agtgcggatc 420

tccccgtgaa cgatgactgg tcccacccgg ggatcctcta tgtcatccct gcagtttatg 480

gggttatcat tctgataggc ctcattggca acatcacttt gatcaagatc ttctgtacag 540

tcaagtccat gcgaaacgtt ccaaacctgt tcatttccag tctggctttg ggagacctgc 600

tcctcctaat aacgtgtgct ccagtggatg ccagcaggta cctggctgac agatggctat 660

ttggcaggat tggctgcaaa ctgatcccct ttatacagct tacctctgtt ggggtgtctg 720

tcttcacact cacggcgctc tcggcagaca gatacaaagc cattgtccgg ccaatggata 780

tccaggcctc ccatgccctg atgaagatct gcctcaaagc cgcctttatc tggatcatct 840

ccatgctgct ggccattcca gaggccgtgt tttctgacct ccatcccttc catgaggaaa 900

gcaccaacca gaccttcatt agctgtgccc catacccaca ctctaatgag cttcacccca 960

aaatccattc tatggcttcc tttctggtct tctacgtcat cccactgtcg atcatctctg 1020

tttactacta cttcattgct aaaaatctga tccagagtgc ttacaatctt cccgtggaag 1080

ggaatataca tgtcaagaag cagattgaat cccggaagcg acttgccaag acagtgctgg 1140

tgtttgtggg cctgttcgcc ttctgctggc tccccaatca tgtcatctac ctgtaccgct 1200

cctaccacta ctctgaggtg gacacctcca tgctccactt tgtcaccagc atctgtgccc 1260

gcctcctggc cttcaccaac tcctgcgtga acccctttgc cctctacctg ctgagcaaga 1320

gtttcaggaa acagttcaac actcagctgc tctgttgcca gcctggcctg atcatccggt 1380

ctcacagcac tggaaggagt acaacctgca tgacctccct caagagtacc aacccctccg 1440

tggccacctt tagcctcatc aatggaaaca tctgtcacga gcggtatgtc tagattgacc 1500

cttgattttg ccccctgagg gacggttttg ctttatggct agacaggaac ccttgcatcc 1560

attgttgtgt ctgtgccctc caaagagcct tcagaatgct cctgagtggt gtaggtgggg 1620

gtggggaggc ccaaatgatg gatcaccatt atattttgaa agaagc 1666

<210>60

<211>2876

<212>DNA

<213>人

<400>60

tgaaacctaa cccgccctgg ggaggcgcgc agcagaggct ccgattcggg gcaggtgaga 60

ggctgacttt ctctcggtgc gtccagtgga gctctgagtt tcgaatcggc ggcggcggat 120

tccccgcgcg cccggcgtcg gggcttccag gaggatgcgg agccccagcg cggcgtggct 180

gctgggggcc gccatcctgc tagcagcctc tctctcctgc agtggcacca tccaaggaac 240

caatagatcc tctaaaggaa gaagccttat tggtaaggtt gatggcacat cccacgtcac 300

tggaaaagga gttacagttg aaacagtctt ttctgtggat gagttttctg catctgtcct 360

cactggaaaa ctgaccactg tcttccttcc aattgtctac acaattgtgt ttgtggtggg 420

tttgccaagt aacggcatgg ccctgtgggt ctttcttttc cgaactaaga agaagcaccc 480

tgctgtgatt tacatggcca atctggcctt ggctgacctc ctctctgtca tctggttccc 540

cttgaagatt gcctatcaca tacatggcaa caactggatt tatggggaag ctctttgtaa 600

tgtgcttatt ggctttttct atggcaacat gtactgttcc attctcttca tgacctgcct 660

cagtgtgcag aggtattggg tcatcgtgaa ccccatgggg cactccagga agaaggcaaa 720

cattgccatt ggcatctccc tggcaatatg gctgctgatt ctgctggtca ccatcccttt 780

gtatgtcgtg aagcagacca tcttcattcc tgccctgaac atcacgacct gtcatgatgt 840

tttgcctgag cagctcttgg tgggagacat gttcaattac ttcctctctc tggccattgg 900

ggtctttctg ttcccagcct tcctcacagc ctctgcctat gtgctgatga tcagaatgct 960

gcgatcttct gccatggatg aaaactcaga gaagaaaagg aagagggcca tcaaactcat 1020

tgtcactgtc ctggccatgt acctgatctg cttcactcct agtaaccttc tgcttgtggt 1080

gcattatttt ctgattaaga gccagggcca gagccatgtc tatgccctgt acattgtagc 1140

cctctgcctc tctaccctta acagctgcat cgaccccttt gtctattact ttgtttcaca 1200

tgatttcagg gatcatgcaa agaacgctct cctttgccga agtgtccgca ctgtaaagca 1260

gatgcaagta tccctcacct caaagaaaca ctccaggaaa tccagctctt actcttcaag 1320

ttcaaccact gttaagacct cctattgagt tttccaggtc ctcagatggg aattgcacag 1380

taggatgtgg aacctgttta atgttatgag gacgtgtctg ttatttccta atcaaaaagg 1440

tctcaccaca taccatgtgg atgcagcacc tctcaggatt gctaggagct cccctgtttg 1500

catgagaaaa gtagtccccc aaattaacat cagtgtctgt ttcagaatct ctctactcag 1560

atgaccccag aaactgaacc aacagaagca gacttttcag aagatggtga agacagaaac 1620

ccagtaactt gcaaaaagta gacttggtgt gaagactcac ttctcagctg aaattatata 1680

tatacacata tatatatttt acatctggga tcatgataga cttgttaggg cttcaaggcc 1740

ctcagagatg atcagtccaa ctgaacgacc ttacaaatga ggaaaccaag ataaatgagc 1800

tgccagaatc aggtttccaa tcaacagcag tgagttggga ttggacagta gaatttcaat 1860

gtccagtgag tgaggttctt gtaccacttc atcaaaatca tggatcttgg ctgggtgcgg 1920

tgcctcatgc ctgtaatcct agcactttgg gaggctgagg caggcaatca cttgaggtca 1980

ggagttcgag accagcctgg ccatcatggc gaaacctcat ctctactaaa aatacaaaag 2040

ttaaccaggt gtgtggtgca cgtttgtaat cccagttact caggaggctg aggcacaaga 2100

attgagtatc actttaactc aggaggcaga ggttgcagtg agccgagatt gcaccactgc 2160

actccagctt gggtgataaa ataaaataaa atagtcgtga atcttgttca aaatgcagat 2220

tcctcagatt caataatgag agctcagact gggaacaggg cccaggaatc tgtgtggtac 2280

aaacctgcat ggtgtttatg cacacagaga tttgagaacc attgttctga atgctgcttc 2340

catttgacaa agtgccgtga taatttttga aaagagaagc aaacaatggt gtctctttta 2400

tgttcagctt ataatgaaat ctgtttgttg acttattagg actttgaatt atttctttat 2460

taaccctctg agtttttgta tgtattatta ttaaagaaaa atgcaatcag gattttaa ac 2520

atgtaaatac aaattttgta taacttttga tgacttcagt gaaattttca ggtagtctga 2580

gtaatagatt gttttgccac ttagaatagc atttgccact tagtatttta aaaaataatt 2640

gttggagtat ttattgtcag ttttgttcac ttgttatcta atacaaaatt ataaagcctt 2700

cagagggttt ggaccacatc tctttggaaa atagtttgca acatatttaa gagatacttg 2760

atgccaaaat gactttatac aacgattgta tttgtgactt ttaaaaataa ttattttatt 2820

gtgtaattga tttataaata acaaaatttt ttttacaact taaaaaaaaa aaaaaa 2876

<210>61

<211>1668

<212>DNA

<213>人

<400>61

gggagataac tcgtgctcac aggaagccac gcacccttga aaggcaccgg gtccttctta 60

gcatcgtgct tcctgagcaa gcctggcatt gcctcacaga ccttcctcag agccgctttc 120

agaaaagcaa gctgcttctg gttgggccca gacctgcctt gaggagcctg tagagttaaa 180

aaatgaaccc cacggatata gcagacacca ccctcgatga aagcatatac agcaattact 240

atctgtatga aagtatcccc aagccttgca ccaaagaagg catcaaggca tttggggagc 300

tcttcctgcc cccactgtat tccttggttt ttgtatttgg tctgcttgga aattctgtgg 360

tggttctggt cctgttcaaa tacaagcggc tcaggtccat gactgatgtg tacctgctca 420

accttgccat ctcggatctg ctcttcgtgt tttccctccc tttttggggc tactatgcag 480

cagaccagtg ggtttttggg ctaggtctgt gcaagatgat ttcctggatg tacttggtgg 540

gcttttacag tggcatattc tttgtcatgc tcatgagcat tgatagatac ctggcaattg 600

tgcacgcggt gttttccttg agggcaagga ccttgactta tggggtcatc accagtttgg 660

ctacatggtc agtggctgtg ttcgcctccc ttcctggctt tctgttcagc acttgttata 720

ctgagcgcaa ccatacctac tgcaaaacca agtactctct caactccacg acgtggaagg 780

ttctcagctc cctggaaatc aacattctcg gattggtgat ccccttaggg atcatgctgt 840

tttgctactc catgatcatc aggaccttgc agcattgtaa aaatgagaag aagaacaagg 900

cggtgaagat gatctttgcc gtggtggtcc tcttccttgg gttctggaca ccttacaaca 960

tagtgctctt cctagagacc ctggtggagc tagaagtcct tcaggactgc acctttgaaa 1020

gatacttgga ctatgccatc caggccacag aaactctggc ttttgttcac tgctgcctta 1080

atcccatcat ctactttttt ctgggggaga aatttcgcaa gtacatccta cagctcttca 1140

aaacctgcag gggccttttt gtgctctgcc aatactgtgg gctcctccaa atttactctg 1200

ctgacacccc cagctcatct tacacgcagt ccaccatgga tcatgatctt catgatgctc 1260

tgtagaaaaa tgaaatggtg aaatgcagag tcaatgaact ttccacattc agagcttact 1320

taaaattgta ttttggtaag agatccctga gccagtgtca ggaggaaggc ttacacccac 1380

agtggaaaga cagcttctca tcctgcaggc agctttttct ctcccactag acaagtccag 1440

cctggcaagg gttcacctgg gctgaggcat ccttcctcac accaggcttg cctgcaggca 1500

tgagtcagtc tgatgagaac tctgagcagt gcttgaatga agttgtaggt aatattgcaa 1560

ggcaaagact attcccttct aacctgaact gatgggtttc tccagaggga attgcagagt 1620

actggctgat ggagtaaatc gctacctttt gctgtggcaa atgggccc 1668

<210>62

<211>1679

<212>DNA

<213>人

<400>62

gtttgttggc tgcggcagca ggtagcaaag tgacgccgag ggcctgagtg ctccagtagc 60

caccgcatct ggagaaccag cggttaccat ggaggggatc agtatataca cttcagataa 120

ctacaccgag gaaatgggct caggggacta tgactccatg aaggaaccct gtttccgtga 180

agaaaatgct aatttcaata aaatcttcct gcccaccatc tactccatca tcttcttaac 240

tggcattgtg ggcaatggat tggtcatcct ggtcatgggt taccagaaga aactgagaag 300

catgacggac aagtacaggc tgcacctgtc agtggccgac ctcctctttg tcatcacgct 360

tcccttctgg gcagttgatg ccgtggcaaa ctggtacttt gggaacttcc tatgcaaggc 420

agtccatgtc atctacacag tcaacctcta cagcagtgtc ctcatcctgg ccttcatcag 480

tctggaccgc tacctggcca tcgtccacgc caccaacagt cagaggccaa ggaagctgtt 540

ggctgaaaag gtggtctatg ttggcgtctg gatccctgcc ctcctgctga ctattcccga 600

cttcatcttt gccaacgtca gtgaggcaga tgacagatat atctgtgacc gcttctaccc 660

caatgacttg tgggtggttg tgttccagtt tcagcacatc atggttggcc ttatcctgcc 720

tggtattgtc atcctgtcct gctattgcat tatcatctcc aagctgtcac actccaaggg 780

ccaccagaag cgcaaggccc tcaagaccac agtcatcctc atcctggctt tcttcgcctg 840

ttggctgcct tactacattg ggatcagcat cgactccttc atcctcctgg aaatcatcaa 900

gcaagggtgt gagtttgaga acactgtgca caagtggatt tccatcaccg aggccctagc 960

tttcttccac tgttgtctga accccatcct ctatgctttc cttggagcca aatttaaaac 1020

ctctgcccag cacgcactca cctctgtgag cagagggtcc agcctcaaga tcctctccaa 1080

aggaaagcga ggtggacatt catctgtttc cactgagtct gagtcttcaa gttttcactc 1140

cagctaacac agatgtaaaa gacttttttt tatacgataa ataacttttt tttaagttac 1200

acatttttca gatataaaag actgaccaat attgtacagt ttttattgct tgttggattt 1260

ttgtcttgtg tttctttagt ttttgtgaag tttaattgac ttatttatat aaattttttt 1320

tgtttcatat tgatgtgtgt ctaggcagga cctgtggcca agttcttagt tgctgtatgt 1380

ctcgtggtag gactgtagaa aagggaactg aacattccag agcgtgtagt gaatcacgta 1440

aagctagaaa tgatccccag ctgtttatgc atagataatc tctccattcc cgtggaacgt 1500

ttttcctgtt cttaagacgt gattttgctg tagaagatgg cacttataac caaagcccaa 1560

agtggtatag aaatgctggt ttttcagttt tcaggagtgg gttgatttca gcacctacag 1620

tgtacagtct tgtattaagt tgttaataaa agtacatgtt aaacttactt agtgttatg 1679

<210>63

<211>2859

<212>DNA

<213>人

<400>63

cattcagaga cagaaggtgg atagacaaat ctccaccttc agactggtag gctcctccag 60

aagccatcag acaggaagat gtgaaaatcc ccagcactca tcccagaatc actaagtggc 120

acctgtcctg ggccaaagtc ccaggacaga cctcattgtt cctctgtggg aatacctccc 180

caggagggca tcctggattt cccccttgca acccaggtca gaagtttcat cgtcaaggtt 240

gtttcatctt ttttttcctg tctaacagct ctgactacca cccaaccttg aggcacagtg 300

aagacatcgg tggccactcc aataacagca ggtcacagct gctcttctgg aggtgtccta 360

caggtgaaaa gcccagcgac ccagtcagga tttaagttta cctcaaaaat ggaagatttt 420

aacatggaga gtgacagctt tgaagatttc tggaaaggtg aagatcttag taattacagt 480

tacagctcta ccctgccccc ttttctacta gatgccgccc catgtgaacc agaatccctg 540

gaaatcaaca agtattttgt ggtcattatc tatgccctgg tattcctgct gagcctgctg 600

ggaaactccc tcgtgatgct ggtcatctta tacagcaggg tcggccgctc cgtcactgat 660

gtctacctgc tgaacctagc cttggccgac ctactctttg ccctgacctt gcccatctgg 720

gccgcctcca aggtgaatgg ctggattttt ggcacattcc tgtgcaaggt ggtctcactc 780

ctgaaggaag tcaacttcta tagtggcatc ctgctactgg cctgcatcag tgtggaccgt 840

tacctggcca ttgtccatgc cacacgcaca ctgacccaga agcgctactt ggtcaaattc 900

atatgtctca gcatctgggg tctgtccttg ctcctggccc tgcctgtctt acttttccga 960

aggaccgtct actcatccaa tgttagccca gcctgctatg aggacatggg caacaataca 1020

gcaaactggc ggatgctgtt acggatcctg ccccagtcct ttggcttcat cgtgccactg 1080

ctgatcatgc tgttctgcta cggattcacc ctgcgtacgc tgtttaaggc ccacatgggg 1140

cagaagcacc gggccatgcg ggtcatcttt gctgtcgtcc tcatcttcct gctctgctgg 1200

ctgccctaca acctggtcct gctggcagac accctcatga ggacccaggt gatccaggag 1260

acctgtgagc gccgcaatca catcgaccgg gctctggatg ccaccgagat tctgggcatc 1320

cttcacagct gcctcaaccc cctcatctac gccttcattg gccagaagtt tcgccatgga 1380

ctcctcaaga ttctagctat acatggcttg atcagcaagg actccctgcc caaagacagc 1440

aggccttcct ttgttggctc ttcttcaggg cacacttcca ctactctcta agacctcctg 1500

cctaagtgca gccccgtggg gttcctccct tctcttcaca gtcacattcc aagcctcatg 1560

tccactggtt cttcttggtc tcagtgtcaa tgcagccccc attgtggtca caggaagtag 1620

aggaggccac gttcttacta gtttcccttg catggtttag aaagcttgcc ctggtgcctc 1680

accccttgcc ataattacta tgtcatttgc tggagctctg cccatcctgc ccctgagccc 1740

atggcactct atgttctaag aagtgaaaat ctacactcca gtgagacagc tctgcatact 1800

cattaggatg gctagtatca aaagaaagaa aatcaggctg gccaacgggg tgaaaccctg 1860

tctctactaa aaatacaaaa aaaaaaaaaa attagccggg cgtggtggtg agtgcctgta 1920

atcacagcta cttgggaggc tgagatggga gaatcacttg aacccgggag gcagaggttg 1980

cagtgagccg agattgtgcc cctgcactcc agcctgagcg acagtgagac tctgtctcag 2040

tccatgaaga tgtagaggag aaactggaac tctcgagcgt tgctgggggg gattgtaaaa 2100

tggtgtgacc actgcagaag acagtatggc agctttcctc aaaacttcag acatagaatt 2160

aacacatgat cctgcaattc cacttatagg aattgaccca caagaaatga aagcagggac 2220

ttgaacccat atttgtacac caatattcat agcagcttat tcacaagacc caaaaggcag 2280

aagcaaccca aatgttcatc aatgaatgaa tgaatggcta agcaaaatgt gatatgtacc 2340

taacgaagta tccttcagcc tgaaagagga atgaagtact catacatgtt acaacacgga 2400

cgaaccttga aaactttatg ctaagtgaaa taagccagac atcaacagat aaatagttta 2460

tgattccacc tacatgaggt actgagagtg aacaaattta cagagacaga aagcagaaca 2520

gtgattacca gggactgagg ggaggggagc atgggaagtg acggtttaat gggcacaggg 2580

tttatgttta ggatgttgaa aaagttctgc agataaacag tagtgatagt tgtaccgcaa 2640

tgtgacttaa tgccactaaa ttgacactta aaaatggttt aaatggtcaa ttttgttatg 2700

tatattttat atcaatttaa aaaaaaacct gagccccaaa aggtatttta atcaccaagg 2760

ctgattaaac caaggctaga accacctgcc tatatttttt gttaaatgat ttcattcaat 2820

atcttttttt taataaacca tttttacttg ggtgtttat 2859

<210>64

<211>27

<212>DNA

<213>人

<400>64

tgtgcgcgcg gccagagcag gtgcgca 27

<210>65

<211>26

<212>DNA

<213>人

<400>65

gaggatccgt caaccacaag ggtctc 26

<210>66

<211>27

<212>DNA

<213>人

<400>66

tgtgcgcgcg gcctgatcat ccggtct 27

<210>67

<211>26

<212>DNA

<213>人

<400>67

gaggatccga cataccgctc gtgaca 26

<210>68

<211>28

<212>DNA

<213>人

<400>68

tgtgcgcgca gtgtccgcac tgtaaagc 28

<210>69

<211>26

<212>DNA

<213>人

<400>69

gaggatccat aggaggtctt aacagt 26

<210>70

<211>27

<212>DNA

<213>人

<400>70

tgtgcgcgcg gcctttttgt gctctgc 27

<210>71

<211>26

<212>DNA

<213>人

<400>71

gaggatccca gagcatcatg aagatc 26

<210>72

<211>28

<212>DNA

<213>人

<400>72

tgtgcgcgcg gcttgatcag caagggac 28

<210>73

<211>26

<212>DNA

<213>人

<400>73

gaggatccga gagtagtgga agtgtg 26

<210>74

<211>27

<212>DNA

<213>人

<400>74

tgtgcgcgcg ggtccagcct caagatc 27

<210>75

<211>26

<212>DNA

<213>人

<400>75

gaggatccgc tggagtgaaa acttga 26

<210>76

<211>5616

<212>DNA

<213>人

<400>76

ccccggcgca gcgcggccgc agcagcctcc gccccccgca cggtgtgagc gcccgacgcg 60

gccgaggcgg ccggagtccc gagctagccc cggcggccgc cgccgcccag accggacgac 120

aggccacctc gtcggcgtcc gcccgagtcc ccgcctcgcc gccaacgcca caaccaccgc 180

gcacggcccc ctgactccgt ccagtattga tcgggagagc cggagcgagc tcttcgggga 240

gcagcgatgc gaccctccgg gacggccggg gcagcgctcc tggcgctgct ggctgcgctc 300

tgcccggcga gtcgggctct ggaggaaaag aaagtttgcc aaggcacgag taacaagctc 360

acgcagttgg gcacttttga agatcatttt ctcagcctcc agaggatgtt caataactgt 420

gaggtggtcc ttgggaattt ggaaattacc tatgtgcaga ggaattatga tctttccttc 480

ttaaagacca tccaggaggt ggctggttat gtcctcattg ccctcaacac agtggagcga 540

attcctttgg aaaacctgca gatcatcaga ggaaatatgt actacgaaaa ttcctatgcc 600

ttagcagtct tatctaacta tgatgcaaat aaaaccggac tgaaggagct gcccatgaga 660

aatttacagg aaatcctgca tggcgccgtg cggttcagca acaaccctgc cctgtgcaac 720

gtggagagca tccagtggcg ggacatagtc agcagtgact ttctcagcaa catgtcgatg 780

gacttccaga accacctggg cagctgccaa aagtgtgatc caagctgtcc caatgggagc 840

tgctggggtg caggagagga gaactgccag aaactgacca aaatcatctg tgcccagcag 900

tgctccgggc gctgccgtgg caagtccccc agtgactgct gccacaacca gtgtgctgca 960

ggctgcacag gcccccggga gagcgactgc ctggtctgcc gcaaattccg agacgaagcc 1020

acgtgcaagg acacctgccc cccactcatg ctctacaacc ccaccacgta ccagatggat 1080

gtgaaccccg agggcaaata cagctttggt gccacctgcg tgaagaagtg tccccgtaat 1140

tatgtggtga cagatcacgg ctcgtgcgtc cgagcctgtg gggccgacag ctatgagatg 1200

gaggaagacg gcgtccgcaa gtgtaagaag tgcgaagggc cttgccgcaa agtgtgtaac 1260

ggaataggta ttggtgaatt taaagactca ctctccataa atgctacgaa tattaaacac 1320

ttcaaaaact gcacctccat cagtggcgat ctccacatcc tgccggtggc atttaggggt 1380

gactccttca cacatactcc tcctctggat ccacaggaac tggatattct gaaaaccgta 1440

aaggaaatca cagggttttt gctgattcag gcttggcctg aaaacaggac ggacctccat 1500

gcctttgaga acctagaaat catacgcggc aggaccaagc aacatggtca gttttctctt 1560

gcagtcgtca gcctgaacat aacatccttg ggattacgct ccctcaagga gataagtgat 1620

ggagatgtga taatttcagg aaacaaaaat ttgtgctatg caaatacaat aaactggaaa 1680

aaactgtttg ggacctccgg tcagaaaacc aaaattataa gcaacagagg tgaaaacagc 1740

tgcaaggcca caggccaggt ctgccatgcc ttgtgctccc ccgagggctg ctggggcccg 1800

gagcccaggg actgcgtctc ttgccggaat gtcagccgag gcagggaatg cgtggacaag 1860

tgcaaccttc tggagggtga gccaagggag tttgtggaga actctgagtg catacagtgc 1920

cacccagagt gcctgcctca ggccatgaac atcacctgca caggacgggg accagacaac 1980

tgtatccagt gtgcccacta cattgacggc ccccactgcg tcaagacctg cccggcagga 2040

gtcatgggag aaaacaacac cctggtctgg aagtacgcag acgccggcca tgtgtgccac 2100

ctgtgccatc caaactgcac ctacggatgc actgggccag gtcttgaagg ctgtccaacg 2160

aatgggccta agatcccgtc catcgccact gggatggtgg gggccctcct cttgctgctg 2220

gtggtggccc tggggatcgg cctcttcatg cgaaggcgcc acatcgttcg gaagcgcacg 2280

ctgcggaggc tgctgcagga gagggagctt gtggagcctc ttacacccag tggagaagct 2340

cccaaccaag ctctcttgag gatcttgaag gaaactgaat tcaaaaagat caaagtgctg 2400

ggctccggtg cgttcggcac ggtgtataag ggactctgga tcccagaagg tgagaaagtt 2460

aaaattcccg tcgctatcaa ggaattaaga gaagcaacat ctccgaaagc caacaaggaa 2520

atcctcgatg aagcctacgt gatggccagc gtggacaacc cccacgtgtg ccgcctgctg 2580

ggcatctgcc tcacctccac cgtgcagctc atcacgcagc tcatgccctt cggctgcctc 2640

ctggactatg tccgggaaca caaagacaat attggctccc agtacctgct caactggtgt 2700

gtgcagatcg caaagggcat gaactacttg gaggaccgtc gcttggtgca ccgcgacctg 2760

gcagccagga acgtactggt gaaaacaccg cagcatgtca agatcacaga ttttgggctg 2820

gccaaactgc tgggtgcgga agagaaagaa taccatgcag aaggaggcaa agtgcctatc 2880

aagtggatgg cattggaatc aattttacac agaatctata cccaccagag tgatgtctgg 2940

agctacgggg tgaccgtttg ggagttgatg acctttggat ccaagccata tgacggaatc 3000

cctgccagcg agatctcctc catcctggag aaaggagaac gcctccctca gccacccata 3060

tgtaccatcg atgtctacat gatcatggtc aagtgctgga tgatagacgc agatagtcgc 3120

ccaaagttcc gtgagttgat catcgaattc tccaaaatgg cccgagaccc ccagcgctac 3180

cttgtcattc agggggatga aagaatgcat ttgccaagtc ctacagactc caacttctac 3240

cgtgccctga tggatgaaga agacatggac gacgtggtgg atgccgacga gtacctcatc 3300

ccacagcagg gcttcttcag cagcccctcc acgtcacgga ctcccctcct gagctctctg 3360

agtgcaacca gcaacaattc caccgtggct tgcattgata gaaatgggct gcaaagctgt 3420

cccatcaagg aagacagctt cttgcagcga tacagctcag accccacagg cgccttgact 3480

gaggacagca tagacgacac cttcctccca gtgcctgaat acataaacca gtccgttccc 3540

aaaaggcccg ctggctctgt gcagaatcct gtctatcaca atcagcctct gaaccccgcg 3600

cccagcagag acccacacta ccaggacccc cacagcactg cagtgggcaa ccccgagtat 3660

ctcaacactg tccagcccac ctgtgtcaac agcacattcg acagccctgc ccactgggcc 3720

cagaaaggca gccaccaaat tagcctggac aaccctgact accagcagga cttctttccc 3780

aaggaagcca agccaaatgg catctttaag ggctccacag ctgaaaatgc agaataccta 3840

agggtcgcgc cacaaagcag tgaatttatt ggagcatgac cacggaggat agtatgagcc 3900

ctaaaaatcc agactctttc gatacccagg accaagccac agcaggtcct ccatcccaac 3960

agccatgccc gcattagctc ttagacccac agactggttt tgcaacgttt acaccgacta 4020

gccaggaagt acttccacct cgggcacatt ttgggaagtt gcattccttt gtcttcaaac 4080

tgtgaagcat ttacagaaac gcatccagca agaatattgt ccctttgagc agaaatttat 4140

ctttcaaaga ggtatatttg aaaaaaaaaa aaagtatatg tgaggatttt tattgattgg 4200

ggatcttgga gtttttcatt gtcgctattg atttttactt caatgggctc ttccaacaag 4260

gaagaagctt gctggtagca cttgctaccc tgagttcatc caggcccaac tgtgagcaag 4320

gagcacaagc cacaagtctt ccagaggatg cttgattcca gtggttctgc ttcaaggctt 4380

ccactgcaaa acactaaaga tccaagaagg ccttcatggc cccagcaggc cggatcggta 4440

ctgtatcaag tcatggcagg tacagtagga taagccactc tgtcccttcc tgggcaaaga 4500

agaaacggag gggatggaat tcttccttag acttactttt gtaaaaatgt ccccacggta 4560

cttactcccc actgatggac cagtggtttc cagtcatgag cgttagactg acttgtttgt 4620

cttccattcc attgttttga aactcagtat gctgcccctg tcttgctgtc atgaaatcag 4680

caagagagga tgacacatca aataataact cggattccag cccacattgg attcatcagc 4740

atttggacca atagcccaca gctgagaatg tggaatacct aaggatagca ccgcttttgt 4800

tctcgcaaaa acgtatctcc taatttgagg ctcagatgaa atgcatcagg tcctttgggg 4860

catagatcag aagactacaa aaatgaagct gctctgaaat ctcctttagc catcacccca 4920

accccccaaa attagtttgt gttacttatg gaagatagtt ttctcctttt acttcacttc 4980

aaaagctttt tactcaaaga gtatatgttc cctccaggtc agctgccccc aaaccccctc 5040

cttacgcttt gtcacacaaa aagtgtctct gccttgagtc atctattcaa gcacttacag 5100

ctctggccac aacagggcat tttacaggtg cgaatgacag tagcattatg agtagtgtgg 5160

aattcaggta gtaaatatga aactagggtt tgaaattgat aatgctttca caacatttgc 5220

agatgtttta gaaggaaaaa agttccttcc taaaataatt tctctacaat tggaagattg 5280

gaagattcag ctagttagga gcccaccttt tttcctaatc tgtgtgtgcc ctgtaacctg 5340

actggttaac agcagtcctt tgtaaacagt gttttaaact ctcctagtca atatccaccc 5400

catccaattt atcaaggaag aaatggttca gaaaatattt tcagcctaca gttatgttca 5460

gtcacacaca catacaaaat gttccttttg cttttaaagt aatttttgac tcccagatca 5520

gtcagagccc ctacagcatt gttaagaaag tatttgattt ttgtctcaat gaaaataaaa 5580

ctatattcat ttccactcta aaaaaaaaaa aaaaaa 5616

<210>77

<211>12

<212>PRT

<213>人

<400>77

Gly Gly Ser Gly Ser Glu Asn Leu Tyr Phe Gln Leu

5 10

<210>78

<211>1291

<212>PRT

<213>人

<400>78

Met Ala Gly Ala Ala Ser Pro Cys Ala Asn Gly Cys Gly Pro Gly Ala

5 10 15

Pro Ser Asp Ala Glu Val Leu His Leu Cys Arg Ser Leu Glu Val Gly

20 25 30

Thr Val Met Thr Leu Phe Tyr Ser Lys Lys Ser Gln Arg Pro Glu Arg

35 40 45

Lys Thr Phe Gln Val Lys Leu Glu Thr Arg Gln Ile Thr Trp Ser Arg

50 55 60

Gly Ala Asp Lys Ile Glu Gly Ala Ile Asp Ile Arg Glu Ile Lys Glu

65 70 75 80

Ile Arg Pro Gly Lys Thr Ser Arg Asp Phe Asp Arg Tyr Gln Glu Asp

85 90 95

Pro Ala Phe Arg Pro Asp Gln Ser His Cys Phe Val Ile Leu Tyr Gly

100 105 110

Met Glu Phe Arg Leu Lys Thr Leu Ser Leu Gln Ala Thr Ser Glu Asp

115 120 125

Glu Val Asn Met Trp Ile Lys Gly Leu Thr Trp Leu Met Glu Asp Thr

130 135 140

Leu Gln Ala Pro Thr Pro Leu Gln Ile Glu Arg Trp Leu Arg Lys Gln

145 150 155 160

Phe Tyr Ser Val Asp Arg Asn Arg Glu Asp Arg Ile Ser Ala Lys Asp

165 170 175

Leu Lys Asn Met Leu Ser Gln Val Asn Tyr Arg Val Pro Asn Met Arg

180 185 190

Phe Leu Arg Glu Arg Leu Thr Asp Leu Glu Gln Arg Ser Gly Asp Ile

195 200 205

Thr Tyr Gly Gln Phe Ala Gln Leu Tyr Arg Ser Leu Met Tyr Ser Ala

210 215 220

Gln Lys Thr Met Asp Leu Pro Phe Leu Glu Ala Ser Thr Leu Arg Ala

225 230 235 240

Gly Glu Arg Pro Glu Leu Cys Arg Val Ser Leu Pro Glu Phe Gln Gln

245 250 255

Phe Leu Leu Asp Tyr Gln Gly Glu Leu Trp Ala Val Asp Arg Leu Gln

260 265 270

Val Gln Glu Phe Met Leu Ser Phe Leu Arg Asp Pro Leu Arg Glu Ile

275 280 285

Glu Glu Pro Tyr Phe Phe Leu Asp Glu Phe Val Thr Phe Leu Phe Ser

290 295 300

Lys Glu Asn Ser Val Trp Asn Ser Gln Leu Asp Ala Val Cys Pro Asp

305 310 315 320

Thr Met Asn Asn Pro Leu Ser His Tyr Trp Ile Ser Ser Ser His Asn

325 330 335

Thr Tyr Leu Thr Gly Asp Gln Phe Ser Ser Glu Ser Ser Leu Glu Ala

340 345 350

Tyr Ala Arg Cys Leu Arg Met Gly Cys Arg Cys Ile Glu Leu Asp Cys

355 360 365

Trp Asp Gly Pro Asp Gly Met Pro Val Ile Tyr His Gly His Thr Leu

370 375 380

Thr Thr Lys Ile Lys Phe Ser Asp Val Leu His Thr Ile Lys Glu His

385 390 395 400

Ala Phe Val Ala Ser Glu Tyr Pro Val Ile Leu Ser Ile Glu Asp His

405 410 415

Cys Ser Ile Ala Gln Gln Arg Asn Met Ala Gln Tyr Phe Lys Lys Val

420 425 430

Leu Gly Asp Thr Leu Leu Thr Lys Pro Val Glu Ile Ser Ala Asp Gly

435 440 445

Leu Pro Ser Pro Asn Gln Leu Lys Arg Lys Ile Leu Ile Lys His Lys

450 455 460

Lys Leu Ala Glu Gly Ser Ala Tyr Glu Glu Val Pro Thr Ser Met Met

465 470 475 480

Tyr Ser Glu Asn Asp Ile Ser Asn Ser Ile Lys Asn Gly Ile Leu Tyr

485 490 495

Leu Glu Asp Pro Val Asn His Glu Trp Tyr Pro His Tyr Phe Val Leu

500 505 510

Thr Ser Ser Lys Ile Tyr Tyr Ser Glu Glu Thr Ser Ser Asp Gln Gly

515 520 525

Asn Glu Asp Glu Glu Glu Pro Lys Glu Val Ser Ser Ser Thr Glu Leu

530 535 540

His Ser Asn Glu Lys Trp Phe His Gly Lys Leu Gly Ala Gly Arg Asp

545 550 555 560

Gly Arg His Ile Ala Glu Arg Leu Leu Thr Glu Tyr Cys Ile Glu Thr

565 570 575

Gly Ala Pro Asp Gly Ser Phe Leu Val Arg Glu Ser Glu Thr Phe Val

580 585 590

Gly Asp Tyr Thr Leu Ser Phe Trp Arg Asn Gly Lys Val Gln His Cys

595 600 605

Arg Ile His Ser Arg Gln Asp Ala Gly Thr Pro Lys Phe Phe Leu Thr

610 615 620

Asp Asn Leu Val Phe Asp Ser Leu Tyr Asp Leu Ile Thr His Tyr Gln

625 630 635 640

Gln Val Pro Leu Arg Cys Asn Glu Phe Glu Met Arg Leu Ser Glu Pro

645 650 655

Val Pro Gln Thr Asn Ala His Glu Ser Lys Glu Trp Tyr His Ala Ser

660 665 670

Leu Thr Arg Ala Gln Ala Glu His Met Leu Met Arg Val Pro Arg Asp

675 680 685

Gly Ala Phe Leu Val Arg Lys Arg Asn Glu Pro Asn Ser Tyr Ala Ile

690 695 700

Ser Phe Arg Ala Glu Gly Lys Ile Lys His Cys Arg Val Gln Gln Glu

705 710 715 720

Gly Gln Thr Val Met Leu Gly Asn Ser Glu Phe Asp Ser Leu Val Asp

725 730 735

Leu Ile Ser Tyr Tyr Glu Lys His Pro Leu Tyr Arg Lys Met Lys Leu

740 745 750

Arg Tyr Pro Ile Asn Glu Glu Ala Leu Glu Lys Ile Gly Thr Ala Glu

755 760 765

Pro Asp Tyr Gly Ala Leu Tyr Glu Gly Arg Asn Pro Gly Phe Tyr Val

770 775 780

Glu Ala Asn Pro Met Pro Thr Phe Lys Cys Ala Val Lys Ala Leu Phe

785 790 795 800

Asp Tyr Lys Ala Gln Arg Glu Asp Glu Leu Thr Phe Ile Lys Ser Ala

805 810 815

Ile Ile Gln Asn Val Glu Lys Gln Glu Gly Gly Trp Trp Arg Gly Asp

820 825 830

Tyr Gly Gly Lys Lys Gln Leu Trp Phe Pro Ser Asn Tyr Val Glu Glu

835 840 845

Met Val Asn Pro Val Ala Leu Glu Pro Glu Arg Glu His Leu Asp Glu

850 855 860

Asn Ser Pro Leu Gly Asp Leu Leu Arg Gly Val Leu Asp Val Pro Ala

865 870 875 880

Cys Gln Ile Ala Ile Arg Pro Glu Gly Lys Asn Asn Arg Leu Phe Val

885 890 895

Phe Ser Ile Ser Met Ala Ser Val Ala His Trp Ser Leu Asp Val Ala

900 905 910

Ala Asp Ser Gln Glu Glu Leu Gln Asp Trp Val Lys Lys Ile Arg Glu

915 920 925

Val Ala Gln Thr Ala Asp Ala Arg Leu Thr Glu Gly Lys Ile Met Glu

930 935 940

Arg Arg Lys Lys Ile Ala Leu Glu Leu Ser Glu Leu Val Val Tyr Cys

945 950 955 960

Arg Pro Val Pro Phe Asp Glu Glu Lys Ile Gly Thr Glu Arg Ala Cys

965 970 975

Tyr Arg Asp Met Ser Ser Phe Pro Glu Thr Lys Ala Glu Lys Tyr Val

980 985 990

Asn Lys Ala Lys Gly Lys Lys Phe Leu Gln Tyr Asn Arg Leu Gln Leu

995 1000 1005

Ser Arg Ile Tyr Pro Lys Gly Gln Arg Leu Asp Ser Ser Asn Tyr Asp

1010 1015 1020

Pro Leu Pro Met Trp Ile Cys Gly Ser Gln Leu Val Ala Leu Asn Phe

1025 1030 1035 1040

Gln Thr Pro Asp Lys Pro Met Gln Met Asn Gln Ala Leu Phe Met Thr

1045 1050 1055

Gly Arg His Cys Gly Tyr Val Leu Gln Pro Ser Thr Met Arg Asp Glu

1060 1065 1070

Ala Phe Asp Pro Phe Asp Lys Ser Ser Leu Arg Gly Leu Glu Pro Cys

1075 1080 1085

Ala Ile Ser Ile Glu Val Leu Gly Ala Arg His Leu Pro Lys Asn Gly

1090 1095 1100

Arg Gly Ile Val Cys Pro Phe Val Glu Ile Glu Val Ala Gly Ala Glu

1105 1110 1115 1120

Tyr Asp Ser Thr Lys Gln Lys Thr Glu Phe Val Val Asp Asn Gly Leu

1125 1130 1135

Asn Pro Val Trp Pro Ala Lys Pro Phe His Phe Gln Ile Ser Asn Pro

1140 1145 1150

Glu Phe Ala Phe Leu Arg Phe Val Val Tyr Glu Glu Asp Met Phe Ser

1155 1160 1165

Asp Gln Asn Phe Leu Ala Gln Ala Thr Phe Pro Val Lys Gly Leu Lys

1170 1175 1180

Thr Gly Tyr Arg Ala Val Pro Leu Lys Asn Asn Tyr Ser Glu Asp Leu

1185 1190 1195 1200

Glu Leu Ala Ser Leu Leu Ile Lys Ile Asp Ile Phe Pro Ala Lys Gln

1205 1210 1215

Glu Asn Gly Asp Leu Ser Pro Phe Ser Gly Thr Ser Leu Arg Glu Arg

1220 1225 1230

Gly Ser Asp Ala Ser Gly Gln Leu Phe His Gly Arg Ala Arg Glu Gly

1235 1240 1245

Ser Phe Glu Ser Arg Tyr Gln Gln Pro Phe Glu Asp Phe Arg Ile Ser

1250 1255 1260

Gln Glu His Leu Ala Asp His Phe Asp Ser Arg Glu Arg Arg Ala Pro

1265 1270 1275 1280

Arg Arg Thr Arg Val Asn Gly Asp Asn Arg Leu

1285 1290

<210>79

<211>3054

<212>PRT

<213>人

<400>79

Met Ala Leu Ile Phe Gly Thr Val Asn Ala Asn Ile Leu Lys Glu Val

5 10 15

Phe Gly Gly Ala Arg Met Ala Cys Val Thr Ser Ala His Met Ala Gly

20 25 30

Ala Asn Gly Ser Ile Leu Lys Lys Ala Glu Glu Thr Ser Arg Ala Ile

35 40 45

Met His Lys Pro Val Ile Phe Gly Glu Asp Tyr Ile Thr Glu Ala Asp

50 55 60

Leu Pro Tyr Thr Pro Leu His Leu Glu Val Asp Ala Glu Met Glu Arg

65 70 75 80

Met Tyr Tyr Leu Gly Arg Arg Ala Leu Thr His Gly Lys Arg Arg Lys

85 90 95

Val Ser Val Asn Asn Lys Arg Asn Arg Arg Arg Lys Val Ala Lys Thr

100 105 110

Tyr Val Gly Arg Asp Ser Ile Val Glu Lys Ile Val Val Pro His Thr

115 120 125

Glu Arg Lys Val Asp Thr Thr Ala Ala Val Glu Asp Ile Cys Asn Glu

130 135 140

Ala Thr Thr Gln Leu Val His Asn Ser Met Pro Lys Arg Lys Lys Gln

145 150 155 160

Lys Asn Phe Leu Pro Ala Thr Ser Leu Ser Asn Val Tyr Ala Gln Thr

165 170 175

Trp Ser Ile Val Arg Lys Arg His Met Gln Val Glu Ile Ile Ser Lys

180 185 190

Lys Ser Val Arg Ala Arg Val Lys Arg Phe Glu Gly Ser Val Gln Leu

19 5200 205

Phe Ala Ser Val Arg His Met Tyr Gly Glu Arg Lys Arg Val Asp Leu

210 215 220

Arg Ile Asp Asn Trp Gln Gln Glu Thr Leu Leu Asp Leu Ala Lys Arg

225 230 235 240

Phe Lys Asn Glu Arg Val Asp Gln Ser Lys Leu Thr Phe Gly Ser Ser

245 250 255

Gly Leu Val Leu Arg Gln Gly Ser Tyr Gly Pro Ala His Trp Tyr Arg

260 265 270

His Gly Met Phe Ile Val Arg Gly Arg Ser Asp Gly Met Leu Val Asp

275 280 285

Ala Arg Ala Lys Val Thr Phe Ala Val Cys His Ser Met Thr His Tyr

290 295 300

Ser Asp Lys Ser Ile Ser Glu Ala Phe Phe Ile Pro Tyr Ser Lys Lys

305 310 315 320

Phe Leu Glu Leu Arg Pro Asp Gly Ile Ser His Glu Cys Thr Arg Gly

325 330 335

Val Ser Val Glu Arg Cys Gly Glu Val Ala Ala Ile Leu Thr Gln Ala

340 345 350

Leu Ser Pro Cys Gly Lys Ile Thr Cys Lys Arg Cys Met Val Glu Thr

355 360 365

Pro Asp Ile Val Glu Gly Glu Ser Gly Glu Ser Val Thr Asn Gln Gly

370 375 380

Lys Leu Leu Ala Met Leu Lys Glu Gln Tyr Pro Asp Phe Pro Met Ala

385 390 395 400

Glu Lys Leu Leu Thr Arg Phe Leu Gln Gln Lys Ser Leu Val Asn Thr

405 410 415

Asn Leu Thr Ala Cys Val Ser Val Lys Gln Leu Ile Gly Asp Arg Lys

420 425 430

Gln Ala Pro Phe Thr His Val Leu Ala Val Ser GluIle Leu Phe Lys

435 440 445

Gly Asn Lys Leu Thr Gly Ala Asp Leu Glu Glu Ala Ser Thr His Met

450 455 460

Leu Glu Ile Ala Arg Phe Leu Asn Asn Arg Thr Glu Asn Met Arg Ile

465 470 475 480

Gly His Leu Gly Ser Phe Arg Asn Lys Ile Ser Ser Lys Ala His Val

485 490 495

Asn Asn Ala Leu Met Cys Asp Asn Gln Leu Asp Gln Asn Gly Asn Phe

500 505 510

Ile Trp Gly Leu Arg Gly Ala His Ala Lys Arg Phe Leu Lys Gly Phe

515 520 525

Phe Thr Glu Ile Asp Pro Asn Glu Gly Tyr Asp Lys Tyr Val Ile Arg

530 535 540

Lys His Ile Arg Gly Ser Arg Lys Leu Ala Ile Gly Asn Leu Ile Met

545 550 555 560

Ser Thr Asp Phe Gln Thr Leu Arg Gln Gln Ile Gln Gly Glu Thr Ile

565 570 575

Glu Arg Lys Glu Ile Gly Asn His Cys Ile Ser Met Arg Asn Gly Asn

580 585 590

Tyr Val Tyr Pro Cys Cys Cys Val Thr Leu Glu Asp Gly Lys Ala Gln

595 600 605

Tyr Ser Asp Leu Lys His Pro Thr Lys Arg His Leu Val Ile Gly Asn

610 615 620

Ser Gly Asp Ser Lys Tyr Leu Asp Leu Pro Val Leu Asn Glu Glu Lys

625 630 635 640

Met Tyr Ile Ala Asn Glu Gly Tyr Cys Tyr Met Asn Ile Phe Phe Ala

645 650 655

Leu Leu Val Asn Val Lys Glu Glu Asp Ala Lys Asp Phe Thr Lys Phe

660 665 670

Ile Arg Asp Thr Ile Val Pro Lys Leu Gly Ala Trp Pro Thr Met Gln

675 680 685

Asp Val Ala Thr Ala Cys Tyr Leu Leu Ser Ile Leu Tyr Pro Asp Val

690 695 700

Leu Arg Ala Glu Leu Pro Arg Ile Leu Val Asp His Asp Asn Lys Thr

705 710 715 720

Met His Val Leu Asp Ser Tyr Gly Ser Arg Thr Thr Gly Tyr His Met

725 730 735

Leu Lys Met Asn Thr Thr Ser Gln Leu Ile Glu Phe Val His Ser Gly

740 745 750

Leu Glu Ser Glu Met Lys Thr Tyr Asn Val Gly Gly Met Asn Arg Asp

755 760 765

Val Val Thr Gln Gly Ala Ile Glu Met Leu Ile Lys Ser Ile Tyr Lys

770 775 780

Pro His Leu Met Lys Gln Leu Leu Glu Glu Glu Pro Tyr Ile Ile Val

785 790 795 800

Leu Ala Ile Val Ser Pro Ser Ile Leu Ile Ala Met Tyr Asn Ser Gly

805 810 815

Thr Phe Glu Gln Ala Leu Gln Met Trp Leu Pro Asn Thr Met Arg Leu

820 825 830

Ala Asn Leu Ala Ala Ile Leu Ser Ala Leu Ala Gln Lys Leu Thr Leu

835 840 845

Ala Asp Leu Phe Val Gln Gln Arg Asn Leu Ile Asn Glu Tyr Ala Gln

850 855 860

Val Ile Leu Asp Asn Leu Ile Asp Gly Val Arg Val Asn His Ser Leu

865 870 875880

Ser Leu Ala Met Glu Ile Val Thr Ile Lys Leu Ala Thr Gln Glu Met

885 890 895

Asp Met Ala Leu Arg Glu Gly Gly Tyr Ala Val Thr Ser Glu Lys Val

900 905 910

His Glu Met Leu Glu Lys Asn Tyr Val Lys Ala Leu Lys Asp Ala Trp

915 920 925

Asp Glu Leu Thr Trp Leu Glu Lys Phe Ser Ala Ile Arg His Ser Arg

930 935 940

Lys Leu Leu Lys Phe Gly Arg Lys Pro Leu Ile Met Lys Asn Thr Val

945 950 955 960

Asp Cys Gly Gly His Ile Asp Leu Ser Val Lys Ser Leu Phe Lys Phe

965 970 975

His Leu Glu Leu Leu Lys Gly Thr Ile Ser Arg Ala Val Asn Gly Gly

980 985 990

Ala Arg Lys Val Arg Val Ala Lys Asn Ala Met Thr Lys Gly Val Phe

995 1000 1005

Leu Lys Ile Tyr Ser Met Leu Pro Asp Val Tyr Lys Phe Ile Thr Val

1010 1015 1020

Ser Ser Val Leu Ser Leu Leu Leu Thr Phe Leu Phe Gln Ile Asp Cys

1025 1030 1035 1040

Met Ile Arg Ala His Arg Glu Ala Lys Val Ala Ala Gln Leu Gln Lys

1045 1050 1055

Glu Ser Glu Trp Asp AsnIle Ile Asn Arg Thr Phe Gln Tyr Ser Lys

1060 1065 1070

Leu Glu Asn Pro Ile Gly Tyr Arg Ser Thr Ala Glu Glu Arg Leu Gln

1075 1080 1085

Ser Glu His Pro Glu Ala Phe Glu Tyr Tyr Lys Phe Cys Ile Gly Lys

1090 1095 1100

Glu Asp Leu Val Glu Gln Ala Lys Gln Pro Glu Ile Ala Tyr Phe Glu

1105 1110 1115 1120

Lys Ile Ile Ala Phe Ile Thr Leu Val Leu Met Ala Phe Asp Ala Glu

1125 1130 1135

Arg Ser Asp Gly Val Phe LysIle Leu Asn Lys Phe Lys Gly Ile Leu

1140 1145 1150

Ser Ser Thr Glu Arg Glu Ile Ile Tyr Thr Gln Ser Leu Asp Asp Tyr

1155 1160 1165

Val Thr Thr Phe Asp Asp Asn Met Thr Ile Asn Leu Glu Leu Asn Met

1170 1175 1180

Asp Glu Leu His Lys Thr Ser Leu Pro Gly Val Thr Phe Lys Gln Trp

1185 1190 1195 1200

Trp Asn Asn Gln Ile Ser Arg Gly Asn Val Lys Pro His Tyr Arg Thr

1205 1210 1215

Glu Gly His Phe Met Glu Phe Thr Arg Asp Thr Ala Ala Ser Val Ala

1220 1225 1230

Ser Glu Ile Ser His Ser Pro Ala Arg Asp Phe Leu Val Arg Gly Ala

1235 1240 1245

Val Gly Ser Gly Lys Ser Thr Gly Leu Pro Tyr His Leu Ser Lys Arg

1250 1255 1260

Gly Arg Val Leu Met Leu Glu Pro Thr Arg Pro Leu Thr Asp Asn Met

1265 1270 1275 1280

His Lys Gln Leu Arg Ser Glu Pro Phe Asn Cys Phe Pro Thr Leu Arg

1285 1290 1295

Met Arg Gly Lys Ser Thr Phe Gly Ser Ser Pro Ile Thr Val Met Thr

1300 1305 1310

Ser Gly Phe Ala Leu His His Phe Ala Ar gAsn Ile Ala Glu Val Lys

1315 1320 1325

Thr Tyr Asp Phe Val Ile Ile Asp Glu Cys His Val Asn Asp Ala Ser

1330 1335 1340

Ala Ile Ala Phe Arg Asn Leu Leu Phe Glu His Glu Phe Glu Gly Lys

1345 1350 1355 1360

Val Leu Lys Val Ser Ala Thr Pro Pro Gly Arg Glu Val Glu Phe Thr

1365 1370 1375

Thr Gln Phe Pro Val Lys Leu Lys Ile Glu Glu Ala Leu Ser Phe Gln

1380 1385 1390

Glu Phe Val Ser Leu Gln Gly Thr Gly Ala Asn Ala Asp Val Ile Ser

1395 1400 1405

Cys Gly Asp Asn Ile Leu Val Tyr Val Ala Ser Tyr Asn Asp Val Asp

1410 1415 1420

Ser Leu Gly Lys Leu Leu Val Gln Lys Gly Tyr Lys Val Ser Lys Ile

1425 1430 1435 1440

Asp Gly Arg Thr Met Lys Ser Gly Gly Thr Glu Ile Ile Thr Glu Gly

1445 1450 1455

Thr Ser Val Lys Lys His Phe Ile Val Ala Thr Asn Ile Ile Glu Asn

1460 1465 1470

Gly Val Thr Ile Asp Ile Asp Val Val Val Asp Phe Gly Thr Lys Val

1475 1480 1485

Val Pro Val Leu Asp Val Asp Asn Arg Ala Val Gln Tyr Asn Lys Thr

1490 1495 1500

Val Val Ser Tyr Gly Glu Arg Ile Gln Lys Leu Gly Arg Val Gly Arg

1505 1510 1515 1520

His Lys Glu Gly Val Ala Leu Arg Ile Gly Gln Thr Asn Lys Thr Leu

1525 1530 1535

Val Glu Ile Pro Glu Met Val Ala Thr Glu Ala Ala Phe Leu Cys Phe

1540 1545 1550

Met Tyr Asn Leu Pro Val Thr Thr Gln Ser Val Ser Thr Thr Leu Leu

1555 1560 1565

Glu Asn Ala Thr Leu Leu Gln Ala Arg Thr Met Ala Gln Phe Glu Leu

1570 1575 1580

Ser Tyr Phe Tyr Thr Ile Asn Phe Val Arg Phe Asp Gly Ser Met His

1585 1590 1595 1600

Pro Val Ile His Asp Lys Leu Lys Arg Phe Lys Leu His Thr Cys Glu

1605 1610 1615

Thr Phe Leu Asn Lys Leu Ala Ile Pro Asn Lys Gly Leu Ser Ser Trp

1620 1625 1630

Leu Thr Ser Gly Glu Tyr Lys Arg Leu Gly Tyr Ile Ala Glu Asp Ala

1635 1640 1645

Gly Ile Arg Ile Pro Phe Val Cys Lys Glu Ile Pro Asp Ser Leu His

1650 1655 1660

Glu Glu Ile Trp His Ile Val Val Ala His Lys Gly Asp Ser Gly Ile

1665 1670 1675 1680

Gly Arg Leu Thr Ser Val Gln Ala Ala Lys Val Val Tyr Thr Leu Gln

1685 1690 1695

Thr Asp Val His Ser Ile Ala Arg Thr Leu Ala Cys Ile Asn Arg Arg

1700 1705 1710

Ile Ala Asp Glu Gln Met Lys Gln Ser His Phe Glu Ala Ala Thr Gly

1715 1720 1725

Arg Ala Phe Ser Phe Thr Asn Tyr Ser Ile Gln Ser Ile Phe Asp Thr

1730 1735 1740

Leu Lys Ala Asn Tyr Ala Thr Lys His Thr Lys Glu Asn Ile Ala Val

1745 1750 1755 1760

Leu Gln Gln Ala Lys Asp Gln Leu Leu Glu Phe Ser Asn Leu Ala Lys

1765 1770 1775

Asp Gln Asp Val Thr Gly Ile Ile Gln Asp Phe Asn His Leu Glu Thr

1780 1785 1790

Ile Tyr Leu Gln Ser Asp Ser Glu Val Ala Lys His Leu Lys Leu Lys

1795 1800 1805

Ser His Trp Asn Lys Ser Gln Ile Thr Arg Asp Ile Ile Ile Ala Leu

1810 1815 1820

Ser Val Leu Ile Gly Gly Gly Trp Met Leu Ala Thr Tyr Phe Lys Asp

1825 1830 1835 1840

Lys Phe Asn Glu Pro Val Tyr Phe Gln Gly Lys Lys Asn Gln Lys His

1845 1850 1855

Lys Leu Lys Met Arg Glu Ala Arg Gly Ala Arg Gly Gln Tyr Glu Val

1860 1865 1870

Ala Ala Glu Pro Glu Ala Leu Glu His Tyr Phe Gly Ser Ala Tyr Asn

1875 1880 1885

Asn Lys Gly Lys Arg Lys Gly Thr Thr Arg Gly Met Gly Ala Lys Ser

1890 1895 1900

Arg Lys Phe Ile Asn Met Tyr Gly Phe Asp Pro Thr Asp Phe Ser Tyr

1905 1910 1915 1920

Ile Arg Phe Val Asp Pro Leu Thr Gly His Thr Ile Asp Glu Ser Thr

1925 1930 1935

Asn Ala Pro Ile Asp Leu Val Gln His Glu Phe Gly Lys Val Arg Thr

1940 1945 1950

Arg Met Leu Ile Asp Asp Glu Ile Glu Pro Gln Ser Leu Ser Thr His

1955 1960 1965

Thr Thr Ile His Ala Tyr Leu Val Asn Ser Gly Thr Lys Lys Val Leu

1970 1975 1980

Lys Val Asp Leu Thr Pro His Ser Ser Leu Arg Ala Ser Glu Lys Ser

1985 1990 1995 2000

Thr Ala Ile Met Gly Phe Pro Glu Arg Glu Asn Glu Leu Arg Gln Thr

2005 2010 2015

Gly Met Ala Val Pro Val Ala Tyr Asp Gln Leu Pro Pro Lys Asn Glu

2020 2025 2030

Asp Leu Thr Phe Glu Gly Glu Ser Leu Phe Lys Gly Pro Arg Asp Tyr

2035 2040 2045

Asn Pro Ile Ser Ser Thr Ile Cys His Leu Thr Asn Glu Ser Asp Gly

2050 2055 2060

His Thr Thr Ser Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr

2065 2070 2075 2080

Asn Lys His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser

2085 2090 2095

Leu His Gly Val Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His

2100 2105 2110

Leu Ile Asp Gly Arg Asp Met Ile Ile Ile Arg Met Pro Lys Asp Phe

2115 2120 2125

Pro Pro Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu

2130 2135 2140

Arg Ile Cys Leu Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser Ser

2145 2150 2155 2160

Met Val Ser Asp Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile Phe

2165 2170 2175

Trp Lys His Trp Ile Gln Thr Lys Asp Gly Gln Cys Gly Ser Pro Leu

2180 2185 2190

Val Ser Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser Asn

2195 2200 2205

Phe Thr Asn Thr Asn Asn Tyr Phe Thr Ser Val Pro Lys Asn Phe Met

2210 2215 2220

Glu Leu Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp Arg

2225 2230 2235 2240

Leu Asn Ala Asp Ser Val Leu Trp Gly Gly His Lys Val Phe Met Ser

2245 2250 2255

Lys Pro Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met

2260 2265 2270

Asn Glu Leu Val Tyr Ser Gln Gly Glu Lys Arg Lys Trp Val Val Glu

2275 2280 2285

Ala Leu Ser Gly Asn Leu Arg Pro Val Ala Glu Cys Pro Ser Gln Leu

2290 2295 2300

Val Thr Lys His Val Val Lys Gly Lys Cys Pro Leu Phe Glu Leu Tyr

2305 2310 2315 2320

Leu Gln Leu Asn Pro Glu Lys Glu Ala Tyr Phe Lys Pro Met Met Gly

2325 2330 2335

Ala Tyr Lys Pro Ser Arg Leu Asn Arg Glu Ala Phe Leu Lys Asp Ile

2340 2345 2350

Leu Lys Tyr Ala Ser Glu Ile Glu Ile Gly Asn Val Asp Cys Asp Leu

2355 2360 2365

Leu Glu Leu AlaIle Ser Met Leu Val Thr Lys Leu Lys Ala Leu Gly

2370 2375 2380

Phe Pro Thr Val Asn Tyr Ile Thr Asp Pro Glu Glu Ile Phe Ser Ala

2385 2390 2395 2400

Leu Asn Met Lys Ala Ala Met Gly Ala Leu Tyr Lys Gly Lys Lys Lys

2405 2410 2415

Glu Ala Leu Ser Glu Leu Thr Leu Asp Glu Gln Glu Ala Met Leu Lys

2420 2425 2430

Ala Ser Cys Leu Arg Leu Tyr Thr Gly Lys Leu Gly Ile Trp Asn Gly

2435 2440 2445

Ser Leu Lys Ala Glu Leu Arg Pro Ile Glu Lys Val Glu Asn Asn Lys

2450 2455 2460

Thr Arg Thr Phe Thr Ala Ala Pro Ile Asp Thr Leu Leu Ala Gly Lys

2465 2470 2475 2480

Val Cys Val Asp Asp Phe Asn Asn Gln Phe Tyr Asp Leu Asn Ile Lys

2485 2490 2495

Ala Pro Trp Thr Val Gly Met Thr Lys Phe Tyr Gln Gly Trp Asn Glu

2500 2505 2510

Leu Met Glu Ala Leu Pro Ser Gly Trp Val Tyr Cys Asp Ala Asp Gly

2515 2520 2525

Ser Gln Phe Asp Ser Ser Leu Thr Pro Phe Leu Ile Asn Ala Val Leu

2530 2535 2540

Lys Val Arg Leu Ala Phe Met Glu Glu Trp Asp Ile Gly Glu Gln Met

2545 2550 2555 2560

Leu Arg Asn Leu Tyr Thr Glu Ile Val Tyr Thr Pro Ile Leu Thr Pro

2565 2570 2575

Asp Gly Thr Ile Ile Lys Lys His Lys Gly Asn Asn Ser Gly Gln Pro

2580 2585 2590

Ser Thr Val Val Asp Asn Thr Leu Met Val Ile Ile Ala Met Leu Tyr

2595 2600 2605

Thr Cys Glu Lys Cys Gly Ile Asn Lys Glu Glu Ile Val Tyr Tyr Val

2610 2615 2620

Asn Gly Asp Asp Leu Leu Ile Ala Ile His Pro Asp Lys Ala Glu Arg

2625 2630 2635 2640

Leu Ser Arg Phe Lys Glu Ser Phe Gly Glu Leu Gly Leu Lys Tyr Glu

2645 2650 2655

Phe Asp Cys Thr Thr Arg Asp Lys Thr Gln Leu Trp Phe Met Ser His

2660 2665 2670

Arg Ala Leu Glu Arg Asp Gly Met Tyr Ile Pro Lys Leu Glu Glu Glu

2675 2680 2685

Arg Ile Val Ser Ile Leu Glu Trp Asp Arg Ser Lys Glu Pro Ser His

2690 2695 2700

Arg Leu Glu Ala Ile Cys Ala Ser Met Ile Glu Ala Trp Gly Tyr Asp

2705 2710 2715 2720

Lys Leu Val Glu Glu Ile Arg Asn Phe Tyr Ala Trp Val Leu Glu Gln

2725 2730 2735

Ala Pro Tyr Ser Gln Leu Ala Glu Glu Gly Lys Ala Pro Tyr Leu Ala

2740 2745 2750

Glu Thr Ala Leu Lys Phe Leu Tyr Thr Ser Gln His Gly Thr Asn Ser

2755 2760 2765

Glu Ile Glu Glu Tyr Leu Lys Val Leu Tyr Asp Tyr Asp Ile Pro Thr

2770 2775 2780

Thr Glu Asn Leu Tyr Phe Gln Ser Gly Thr Val Asp Ala Gly Ala Asp

2785 2790 2795 2800

Ala Gly Lys Lys Lys Asp Gln Lys Asp Asp Lys Val Ala Glu Gln Ala

2805 2810 2815

Ser Lys Asp Arg Asp Val Asn Ala Gly Thr Ser Gly Thr Phe Ser Val

2820 2825 2830

Pro Arg Ile Asn Ala Met Ala Thr Lys Leu Gln Tyr Pro Arg Met Arg

2835 2840 2845

Gly Glu Val Val Val Asn Leu Asn His Leu Leu Gly Tyr Lys Pro Gln

2850 2855 2860

Gln Ile Asp Leu Ser Asn Ala Arg Ala Thr His Glu Gln Phe Ala Ala

2865 2870 2875 2880

Trp His Gln Ala Val Met Thr Ala Tyr Gly Val Asn Glu Glu Gln Met

2885 2890 2895

Lys Ile Leu Leu Asn Gly Phe Met Val Trp Cys Ile Glu Asn Gly Thr

2900 2905 2910

Ser Pro Asn Leu Asn Gly Thr Trp Val Met Met Asp Gly Glu Asp Gln

2915 2920 2925

Val Ser Tyr Pro Leu Lys Pro Met Val Glu Asn Ala Gln Pro Thr Leu

2930 2935 2940

Arg Gln Ile Met Thr His Phe Ser Asp Leu Ala Glu Ala Tyr Ile Glu

2945 2950 2955 2960

Met Arg Asn Arg Glu Arg Pro Tyr Met Pro Arg Tyr Gly Leu Gln Arg

2965 2970 2975

Asn Ile Thr Asp Met Ser Leu Ser Arg Tyr Ala Phe Asp Phe Tyr Glu

2980 2985 2990

Leu Thr Ser Lys Thr Pro Val Arg Ala Arg Glu Ala His Met Gln Met

2995 3000 3005

Lys Ala Ala Ala Val Arg Asn Ser Gly Thr Arg Leu Phe Gly Leu Asp

3010 3015 3020

Gly Asn Val Gly Thr Ala Glu Glu Asp Thr Glu Arg His Thr Ala His

3025 3030 3035 3040

Asp Val Asn Arg Asn Met His Thr Leu Leu Gly Val Arg Gln

3045 3050

<210>80

<211>9

<212>PRT

<213>人

<400>80

Asn Ser Ser Gly Gly Asn Ser Gly Ser

5

<210>81

<211>2755

<212>DNA

<213>人

<400>81

ttaggacggg gcgatggcgg ctgagaggag ctgcgcgtgc gcgaacatgt aactggtggg 60

atctgcggcg gctcccagat gatggtcgtc ctcctgggcg cgacgaccct agtgctcgtc 120

gccgtgggcc catgggtgtt gtccgcagcc gcaggtggaa aaaatctaaa atctcctcaa 180

aaagtagagg tcgacatcat agatgacaac tttatcctga ggtggaacag gagcgatgag 240

tctgtcggga atgtgacttt ttcattcgat tatcaaaaaa ctgggatgga taattggata 300

aaattgtctg ggtgtcagaa tattactagt accaaatgca acttttcttc actcaagctg 360

aatgtttatg aagaaattaa attgcgtata agagcagaaa aagaaaacac ttcttcatgg 420

tatgaggttg actcatttac accatttcgc aaagctcaga ttggtcctcc agaagtacat 480

ttagaagctg aagataaggc aatagtgata cacatctctc ctggaacaaa agatagtgtt 540

atgtgggctt tggatggttt aagctttaca tatagcttac ttatctggaa aaactcttca 600

ggtgtagaag aaaggattga aaatatttat tccagacata aaatttataa actctcacca 660

gagactactt attgtctaaa agttaaagca gcactactta cgtcatggaa aattggtgtc 720

tatagtccag tacattgtat aaagaccaca gttgaaaatg aactacctcc accagaaaat 780

atagaagtca gtgtccaaaa tcagaactat gttcttaaat gggattatac atatgcaaac 840

atgacctttc aagttcagtg gctccacgcc tttttaaaaa ggaatcctgg aaaccatttg 900

tataaatgga aacaaatacc tgactgtgaa aatgtcaaaa ctacccagtg tgtctttcct 960

caaaacgttt tccaaaaagg aatttacctt ctccgcgtac aagcatctga tggaaataac 1020

acatcttttt ggtctgaaga gataaagttt gatactgaaa tacaagcttt cctacttcct 1080

ccagtcttta acattagatc ccttagtgat tcattccata tctatatcgg tgctccaaaa 1140

cagtctggaa acacgcctgt gatccaggat tatccactga tttatgaaat tattttttgg 1200

gaaaacactt caaatgctga gagaaaaatt atcgagaaaa aaactgatgt tacagttcct 1260

aatttgaaac cactgactgt atattgtgtg aaagccagag cacacaccat ggatgaaaag 1320

ctgaataaaa gcagtgtttt tagtgacgct gtatgtgaga aaacaaaacc aggaaatacc 1380

tctaaaattt ggcttatagt tggaatttgt attgcattat ttgctctccc gtttgtcatt 1440

tatgctgcga aagtcttctt gagatgcatc aattatgtct tctttccatc acttaaacct 1500

tcttccagta tagatgagta tttctctgaa cagccattga agaatcttct gctttcaact 1560

tctgaggaac aaatcgaaaa atgtttcata attgaaaata taagcacaat tgctacagta 1620

gaagaaacta atcaaactga tgaagatcat aaaaaataca gttcccaaac tagccaagat 1680

tcaggaaatt attctaatga agatgaaagc gaaagtaaaa caagtgaaga actacagcag 1740

gactttgtat gaccagaaat gaactgtgtc aagtataagg tttttcagca ggagttacac 1800

tgggagcctg aggtcctcac cttcctctca gtaactacag agaggacgtt tcctgtttag 1860

ggaaagaaaa aacatcttca gatcataggt cctaaaaata cgggcaagct cttaactatt 1920

taaaaatgaa attacaggcc cgggcacggt ggctcacacc tgtaatccca gcactttggg 1980

aggctgaggc aggcagatca tgaggtcaag agatcgagac cagcctggcc aacgtggtga 2040

aaccccatct ctactaaaaa tacaaaaatt agccgggtag taggtaggcg cgcgcctgtt 2100

gtcttagcta ctcaggaggc tgaggcagga gaatcgcttg aaaacaggag gtggaggttg 2160

cagtgagccg agatcacgcc actgcactcc agcctggtga cagcgtgaga ctctttaaaa 2220

aaagaaatta aaagagttga gacaaacgtt tcctacattc ttttccatgt gtaaaatcat 2280

gaaaaagcct gtcaccggac ttgcattgga tgagatgagt cagaccaaaa cagtggccac 2340

ccgtcttcct cctgtgagcc taagtgcagc cgtgctagct gcgcaccgtg gctaaggatg 2400

acgtctgtgt tcctgtccat cactgatgct gctggctact gcatgtgcca cacctgtctg 2460

ttcgccattc ctaacattct gtttcattct tcctcgggag atatttcaaa catttggtct 2520

tttcttttaa cactgagggt aggcccttag gaaatttatt taggaaagtc tgaacacgtt 2580

atcacttggt tttctggaaa gtagcttacc ctagaaaaca gctgcaaatg ccagaaagat 2640

gatccctaaa aatgttgagg gacttctgtt cattcatccc gagaacattg gcttccacat 2700

cacagtatct acccttacat ggtttaggat taaagccagg caatctttta ctatg 2755

<210>82

<211>9

<212>PRT

<213>人

<400>82

Gly Ser Glu Asn Leu Tyr Phe Gln Leu

5

<210>83

<211>2897

<212>DNA

<213>人

<400>83

cccgcactaa agacgcttct tcccggcggg taggaatccc gccggcgagc cgaacagttc 60

cccgagcgca gcccgcggac caccacccgg ccgcacgggc cgcttttgtc ccccgcccgc 120

cgcttctgtc cgagaggccg cccgcgaggc gcatcctgac cgcgagcgtc gggtcccaga 180

gccgggcgcg gctggggccc gaggctagca tctctcggga gccgcaaggc gagagctgca 240

aagtttaatt agacacttca gaattttgat cacctaatgt tgatttcaga tgtaaaagtc 300

aagagaagac tctaaaaata gcaaagatgc ttttgagcca gaatgccttc atcttcagat 360

cacttaattt ggttctcatg gtgtatatca gcctcgtgtt tggtatttca tatgattcgc 420

ctgattacac agatgaatct tgcactttca agatatcatt gcgaaatttc cggtccatct 480

tatcatggga attaaaaaac cactccattg taccaactca ctatacattg ctgtatacaa 540

tcatgagtaa accagaagat ttgaaggtgg ttaagaactg tgcaaatacc acaagatcat 600

tttgtgacct cacagatgag tggagaagca cacacgaggc ctatgtcacc gtcctagaag 660

gattcagcgg gaacacaacg ttgttcagtt gctcacacaa tttctggctg gccatagaca 720

tgtcttttga accaccagag tttgagattg ttggttttac caaccacatt aatgtgatgg 780

tgaaatttcc atctattgtt gaggaagaat tacagtttga tttatctctc gtcattgaag 840

aacagtcaga gggaattgtt aagaagcata aacccgaaat aaaaggaaac atgagtggaa 900

atttcaccta tatcattgac aagttaattc caaacacgaa ctactgtgta tctgtttatt 960

tagagcacag tgatgagcaa gcagtaataa agtctccctt aaaatgcacc ctccttccac 1020

ctggccagga atcagaatca gcagaatctg ccaaaatagg aggaataatt actgtgtttt 1080

tgatagcatt ggtcttgaca agcaccatag tgacactgaa atggattggt tatatatgct 1140

taagaaatag cctccccaaa gtcttgaatt ttcataactt tttagcctgg ccatttccta 1200

acctgccacc gttggaagcc atggatatgg tggaggtcat ttacatcaac agaaagaaga 1260

aagtgtggga ttataattat gatgatgaaa gtgatagcga tactgaggca gcgcccagga 1320

caagtggcgg tggctatacc atgcatggac tgactgtcag gcctctgggt caggcctctg 1380

ccacctctac agaatcccag ttgatagacc cggagtccga ggaggagcct gacctgcctg 1440

aggttgatgt ggagctcccc acgatgccaa aggacagccc tcagcagttg gaactcttga 1500

gtgggccctg tgagaggaga aagagtccac tccaggaccc ttttcccgaa gaggactaca 1560

gctccacgga ggggtctggg ggcagaatta ccttcaatgt ggacttaaac tctgtgtttt 1620

tgagagttct tgatgacgag gacagtgacg acttagaagc ccctctgatg ctatcgtctc 1680

atctggaaga gatggttgac ccagaggatc ctgataatgt gcaatcaaac catttgctgg 1740

ccagcgggga agggacacag ccaacctttc ccagcccctc ttcagagggc ctgtggtccg 1800

aagatgctcc atctgatcaa agtgacactt ctgagtcaga tgttgacctt ggggatggtt 1860

atataatgag atgactccaa aactattgaa tgaacttgga cagacaagca cctacagggt 1920

tctttgtctc tgcatcctaa cttgctgcct tatcgtctgc aagtgttctc caagggaagg 1980

aggaggaaac tgtggtgttc ctttcttcca ggtgacatca cctatgcaca ttcccagtat 2040

ggggaccata gtatcattca gtgcattgtt tacatattca aagtggtgca ctttgaagga 2100

agcacatgtg cacctttcct ttacactaat gcacttagga tgtttctgca tcatgtctac 2160

cagggagcag ggttccccac agtttcagag gtggtccagg accctatgat atttctcttc 2220

tttcgttctt tttttttttt ttttgagaca gagtctcgtt ctgtcgccca agctggagcg 2280

caatggtgtg atcttggctc actgcaacat ccgcctcccg ggttcaggtg attctcctgc 2340

ctcagcctcc ctcgcaagta gctgggatta caggcgcctg ccaccatgcc tagcaaattt 2400

ttgtattttt agtggagaca ggattttacc atgttggcca ggctggtctc gaactcctga 2460

cctcaagtga tctgccctcc tcagcctcgt aaagtgctgg gattacaggg gtgagccgct 2520

gtgcctggct ggccctgtga tatttctgtg aaataaattg ggccagggtg ggagcaggga 2580

aagaaaagga aaatagtagc aagagctgca aagcaggcag gaagggagga ggagagccag 2640

gtgagcagtg gagagaaggg gggccctgca caaggaaaca gggaagagcc atcgaagttt 2700

cagtcggtga gccttgggca cctcacccat gtcacatcct gtctcctgca attggaattc 2760

caccttgtcc agccctcccc agttaaagtg gggaagacag actttaggat cacgtgtgtg 2820

actaatacag aaaggaaaca tggcgtcggg gagagggata aaacctgaat gccatatttt 2880

aagttaaaaa aaaaaaa 2897

<210>84

<211>3054

<212>PRT

<213>人

<400>84

Met Ala Leu Ile Phe Gly Thr Val Asn Ala Asn Ile Leu Lys Glu Val

1 5 10 15

Phe Gly Gly Ala Arg Met Ala Cys Val Thr Ser Ala His Met Ala Gly

20 25 30

Ala Asn Gly Ser Ile Leu Lys Lys Ala Glu Glu Thr Ser Arg Ala Ile

35 40 45

Met His Lys Pro Val Ile Phe Gly Glu Asp Tyr Ile Thr Glu Ala Asp

50 55 60

Leu Pro Tyr Thr Pro Leu His Leu Glu Val Asp Ala Glu Met Glu Arg

65 70 75 80

Met Tyr Tyr Leu Gly Arg Arg Ala Leu Thr His Gly Lys Arg Arg Lys

85 90 95

Val Ser Val Asn Asn Lys Arg Asn Arg Arg Arg Lys Val Ala Lys Thr

100 105 110

Tyr Val Gly Arg Asp Ser Ile Val Glu Lys Ile Val Val Pro His Thr

115 120 125

Glu Arg Lys Val Asp Thr Thr Ala Ala Val Glu Asp Ile Cys Asn Glu

130 1351 40

Ala Thr Thr Gln Leu Val His Asn Ser Met Pro Lys Arg Lys Lys Gln

145 150 155 160

Lys Asn Phe Leu Pro Ala Thr Ser Leu Ser Asn Val Tyr Ala Gln Thr

165 170 175

Trp Ser Ile Val Arg Lys Arg His Met Gln Val Glu Ile Ile Ser Lys

180 185 190

Lys Ser Val Arg Ala Arg Val Lys Arg Phe Glu Gly Ser Val Gln Leu

195 200 205

Phe Ala Ser Val Arg His Met Tyr Gly Glu Arg Lys Arg Val Asp Leu

210 215 220

Arg Ile Asp Asn Trp Gln Gln Glu Thr Leu Leu Asp Leu Ala Lys Arg

225 230 235 240

Phe Lys Asn Glu Arg Val Asp Gln Ser Lys Leu Thr Phe Gly Ser Ser

245 250 255

Gly Leu Val Leu Arg Gln Gly Ser Tyr Gly Pro Ala His Trp Tyr Arg

260 265 270

His Gly Met Phe Ile Val Arg Gly Arg Ser Asp Gly Met Leu Val Asp

275 280 285

Ala Arg Ala Lys Val Thr Phe Ala Val Cys His Ser Met Thr His Tyr

290 295 300

Ser Asp Lys Ser Ile Ser Glu Ala Phe Phe Ile Pro Tyr Ser Lys Lys

305 310 315 320

Phe Leu Glu Leu Arg Pro Asp Gly Ile Ser His Glu Cys Thr Arg Gly

325 330 335

Val Ser Val Glu Arg Cys Gly Glu Val Ala Ala Ile Leu Thr Gln Ala

340 345 350

Leu Ser Pro Cys Gly Lys Ile Thr Cys Lys Arg Cys Met Val Glu Thr

355 360 365

Pro Asp Ile Val Glu Gly Glu Ser Gly Glu Ser Val Thr Asn Gln Gly

370 375 380

Lys Leu Leu Ala Met Leu Lys Glu Gln Tyr Pro Asp Phe Pro Met Ala

385 390 395 400

Glu Lys Leu Leu Thr Arg Phe Leu Gln Gln Lys Ser Leu Val Asn Thr

405 410 415

Asn Leu Thr Ala Cys Val Ser Val Lys Gln Leu Ile Gly Asp Arg Lys

420 425 430

Gln Ala Pro Phe Thr His Val Leu Ala Val Ser Glu Ile Leu Phe Lys

435 440 445

Gly Asn LysLeu Thr Gly Ala Asp Leu Glu Glu Ala Ser Thr His Met

450 455 460

Leu Glu Ile Ala Arg Phe Leu Asn Asn Arg Thr Glu Asn Met Arg Ile

465 470 475 480

Gly His Leu Gly Ser Phe Arg Asn Lys Ile Ser Ser Lys Ala His Val

485 490 495

Asn Asn Ala Leu Met Cys Asp Asn Gln Leu Asp Gln Asn Gly Asn Phe

500 505 510

Ile Trp Gly Leu Arg Gly Ala His Ala Lys Arg Phe Leu Lys Gly Phe

515 520 525

Phe Thr Glu Ile Asp Pro Asn Glu Gly Tyr Asp Lys Tyr Val Ile Arg

530 535 540

Lys His Ile Arg Gly Ser Arg Lys Leu Ala Ile Gly Asn Leu Ile Met

545 550 555 560

Ser Thr Asp Phe Gln Thr Leu Arg Gln Gln Ile Gln Gly Glu Thr Ile

565 570 575

Glu Arg Lys Glu Ile Gly Asn His Cys Ile Ser Met Arg Asn Gly Asn

580 585 590

Tyr Val Tyr Pro Cys Cys Cys Val Thr Leu Glu Asp Gly Lys Ala Gln

595 600 605

Tyr Ser Asp Leu Lys His Pro Thr Lys Arg His Leu Val Ile Gly Asn

610 615 620

Ser Gly Asp Ser Lys Tyr Leu Asp Leu Pro Val Leu Asn Glu Glu Lys

625 630 635 640

Met Tyr Ile Ala Asn Glu Gly Tyr Cys Tyr Met Asn Ile Phe Phe Ala

645 650 655

Leu Leu Val Asn Val Lys Glu Glu Asp Ala Lys Asp Phe Thr Lys Phe

660 665 670

Ile Arg Asp Thr Ile Val Pro Lys Leu Gly Ala Trp Pro Thr Met Gln

675 680 685

Asp Val Ala Thr Ala Cys Tyr Leu Leu Ser Ile Leu Tyr Pro Asp Val

690 695 700

Leu Arg Ala Glu Leu Pro Arg Ile Leu Val Asp His Asp Asn Lys Thr

705 710 715 720

Met His Val Leu Asp Ser Tyr Gly Ser Arg Thr Thr Gly Tyr His Met

725 730 735

Leu Lys Met Asn Thr Thr Ser Gln Leu Ile Glu Phe Val His Ser Gly

740 745 750

Leu Glu Ser Glu Met Lys Thr Tyr Asn Val Gly Gly Met Asn Arg Asp

755 760 765

Val Val Thr Gln Gly Ala Ile Glu Met Leu Ile Lys Ser Ile Tyr Lys

770 775 780

Pro His Leu Met Lys Gln Leu Leu Glu Glu Glu Pro Tyr Ile Ile Val

785 790 795 800

Leu Ala Ile Val Ser Pro Ser Ile Leu Ile Ala Met Tyr Asn Ser Gly

805 810 815

Thr Phe Glu Gln Ala Leu Gln Met Trp Leu Pro Asn Thr Met Arg Leu

820 825 830

Ala Asn Leu Ala Ala Ile Leu Ser Ala Leu Ala Gln Lys Leu Thr Leu

835 840 845

Ala Asp Leu Phe Val Gln Gln Arg Asn Leu Ile Asn Glu Tyr Ala Gln

850 855 860

Val Ile Leu Asp Asn Leu Ile Asp Gly Val Arg Val Asn His Ser Leu

865 870 875 880

Ser Leu Ala Met Glu Ile Val Thr Ile Lys Leu Ala Thr Gln Glu Met

885 890 895

Asp Met Ala Leu Arg Glu Gly Gly Tyr Ala Val Thr Ser Glu Lys Val

900 905 910

His Glu Met Leu Glu Lys Asn Tyr Val Lys Ala Leu Lys Asp Ala Trp

915 920 925

Asp Glu Leu Thr Trp Leu Glu Lys Phe Ser Ala Ile Arg His Ser Arg

930 935 940

Lys Leu Leu Lys Phe Gly Arg Lys Pro Leu Ile Met Lys Asn Thr Val

945 950 955 960

Asp Cys Gly Gly His Ile Asp Leu Ser Val Lys Ser Leu Phe Lys Phe

965 970 975

His Leu Glu Leu Leu Lys Gly Thr Ile Ser Arg Ala Val Asn Gly Gly

980 985 990

Ala Arg Lys Val Arg Val Ala Lys Asn Ala Met Thr Lys Gly Val Phe

995 1000 1005

Leu Lys Ile Tyr Ser Met Leu Pro Asp Val Tyr Lys Phe Ile Thr

1010 1015 1020

Val Ser Ser Val Leu Ser Leu Leu Leu Thr Phe Leu Phe Gln Ile

1025 1030 1035

Asp Cys Met Ile Arg Ala His Arg Glu Ala Lys Val Ala Ala Gln

1040 1045 1050

Leu Gln Lys Glu Ser Glu Trp Asp Asn Ile Ile Asn Arg Thr Phe

1055 1060 1065

Gln Tyr Ser Lys Leu Glu Asn Pro Ile Gly Tyr Arg Ser Thr Ala

1070 1075 1080

Glu Glu Arg Leu Gln Ser Glu His Pro Glu Ala Phe Glu Tyr Tyr

1085 1090 1095

Lys Phe Cys Ile Gly Lys Glu Asp Leu Val Glu Gln Ala Lys Gln

1100 1105 1110

Pro Glu Ile Ala Tyr Phe Glu Lys Ile Ile Ala Phe Ile Thr Leu

1115 1120 1125

Val Leu Met Ala Phe Asp Ala Glu Arg Ser Asp Gly Val Phe Lys

1130 1135 1140

Ile Leu Asn Lys Phe Lys Gly Ile Leu Ser Ser Thr Glu Arg Glu

1145 1150 1155

Ile Ile Tyr Thr Gln Ser Leu Asp Asp Tyr Val Thr Thr Phe Asp

1160 1165 1170

Asp Asn Met Thr Ile Asn Leu Glu Leu Asn Met Asp Glu Leu His

1175 1180 1185

Lys Thr Ser Leu Pro Gly Val Thr Phe Lys Gln Trp Trp Asn Asn

1190 1195 1200

Gln Ile Ser Arg Gly Asn Val Lys Pro His Tyr Arg Thr Glu Gly

1205 1210 1215

His Phe Met Glu Phe Thr Arg Asp Thr Ala Ala Ser Val Ala Ser

1220 1225 1230

Glu Ile Ser His Ser Pro Ala Arg Asp Phe Leu Val Arg Gly Ala

1235 1240 1245

Val Gly Ser Gly Lys Ser Thr Gly Leu Pro Tyr His Leu Ser Lys

1250 1255 1260

Arg Gly Arg Val Leu Met Leu Glu Pro Thr Arg Pro Leu Thr Asp

1265 1270 1275

Asn Met His Lys Gln Leu Arg Ser Glu Pro Phe Asn Cys Phe Pro

1280 1285 1290

Thr Leu Arg Met Arg Gly Lys Ser Thr Phe Gly Ser Ser Pro Ile

1295 1300 1305

Thr Val Met Thr Ser Gly Phe Ala Leu His His Phe Ala Arg Asn

1310 1315 1320

Ile Ala Glu Val Lys Thr Tyr Asp Phe Val Ile Ile Asp Glu Cys

1325 1330 1335

His Val Asn Asp Ala Ser Ala Ile Ala Phe Arg Asn Leu Leu Phe

1340 1345 1350

Glu His Glu Phe Glu Gly Lys Val Leu Lys Val Ser Ala Thr Pro

1355 1360 1365

Pro Gly Arg Glu Val Glu Phe Thr Thr Gln Phe Pro Val Lys Leu

1370 1375 1380

Lys Ile Glu Glu Ala Leu Ser Phe Gln Glu Phe Val Ser Leu Gln

1385 1390 1395

Gly Thr Gly Ala Asn Ala Asp Val Ile Ser Cys Gly Asp Asn Ile

1400 1405 1410

Leu Val Tyr Val Ala Ser Tyr Asn Asp Val Asp Ser Leu Gly Lys

1415 1420 1425

Leu Leu Val Gln Lys Gly Tyr Lys Val Ser Lys Ile Asp Gly Arg

1430 1435 1440

Thr Met Lys Ser Gly Gly Thr Glu Ile Ile Thr Glu Gly Thr Ser

1445 1450 1455

Val Lys Lys His Phe Ile Val Ala Thr Asn Ile Ile Glu Asn Gly

1460 1465 1470

Val Thr Ile Asp Ile Asp Val Val Val Asp Phe Gly Thr Lys Val

1475 1480 1485

Val Pro Val Leu Asp Val Asp Asn Arg Ala Val Gln Tyr Asn Lys

1490 1495 1500

Thr Val Val Ser Tyr Gly Glu Arg Ile Gln Lys Leu Gly Arg Val

1505 1510 1515

Gly Arg His Lys Glu Gly Val Ala Leu Arg Ile Gly Gln Thr Asn

1520 1525 1530

Lys Thr Leu Val Glu Ile Pro Glu Met Val Ala Thr Glu Ala Ala

1535 1540 1545

Phe Leu Cys Phe Met Tyr Asn Leu Pro Val Thr Thr Gln Ser Val

1550 1555 1560

Ser Thr Thr Leu Leu Glu Asn Ala Thr Leu Leu Gln Ala Arg Thr

1565 1570 1575

Met Ala Gln Phe Glu Leu Ser Tyr Phe Tyr Thr Ile Asn Phe Val

1580 1585 1590

Arg Phe Asp Gly Ser Met His Pro Val Ile His Asp Lys Leu Lys

1595 1600 1605

Arg Phe Lys Leu His Thr Cys Glu Thr Phe Leu Asn Lys Leu Ala

1610 1615 1620

Ile Pro Asn Lys Gly Leu Ser Ser Trp Leu Thr Ser Gly Glu Tyr

1625 1630 1635

Lys Arg Leu Gly Tyr Ile Ala Glu Asp Ala Gly Ile Arg Ile Pro

1640 1645 1650

Phe Val Cys Lys Glu Ile Pro Asp Ser Leu His Glu Glu Ile Trp

1655 1660 1665

His Ile Val Val Ala His Lys Gly Asp Ser Gly Ile Gly Arg Leu

1670 1675 1680

Thr Ser Val Gln Ala Ala Lys Val Val Tyr Thr Leu Gln Thr Asp

1685 1690 1695

Val His Ser Ile Ala Arg Thr Leu Ala Cys Ile Asn Arg Arg Ile

1700 1705 1710

Ala Asp Glu Gln Met Lys Gln Ser His Phe Glu Ala Ala Thr Gly

1715 1720 1725

Arg Ala Phe Ser Phe Thr Asn Tyr Ser Ile Gln Ser Ile Phe Asp

1730 1735 1740

Thr Leu Lys Ala Asn Tyr Ala Thr Lys His Thr Lys Glu Asn Ile

1745 1750 1755

Ala Val Leu Gln Gln Ala Lys Asp Gln Leu Leu Glu Phe Ser Asn

1760 1765 1770

Leu Ala Lys Asp Gln Asp Val Thr Gly Ile Ile Gln Asp Phe Asn

1775 1780 1785

His Leu Glu Thr Ile Tyr Leu Gln Ser Asp Ser Glu Val Ala Lys

1790 1795 1800

His Leu Lys Leu Lys Ser His Trp Asn Lys Ser Gln Ile Thr Arg

1805 1810 1815

Asp Ile Ile Ile Ala Leu Ser Val Leu Ile Gly Gly Gly Trp Met

1820 1825 1830

Leu Ala Thr Tyr Phe Lys Asp Lys Phe Asn Glu Pro Val Tyr Phe

1835 1840 1845

Gln Gly Lys Lys Asn Gln Lys His Lys Leu Lys Met Arg Glu Ala

1850 1855 1860

Arg Gly Ala Arg Gly Gln Tyr Glu Val Ala Ala Glu Pro Glu Ala

1865 1870 1875

Leu Glu His Tyr Phe Gly Ser Ala Tyr Asn Asn Lys Gly Lys Arg

1880 1885 1890

Lys Gly Thr Thr Arg Gly Met Gly Ala Lys Ser Arg Lys Phe Ile

1895 1900 1905

Asn Met Tyr Gly Phe Asp Pro Thr Asp Phe Ser Tyr Ile Arg Phe

1910 1915 1920

Val Asp Pro Leu Thr Gly His Thr Ile Asp Glu Ser Thr Asn Ala

1925 1930 1935

Pro Ile Asp Leu Val Gln His Glu Phe Gly Lys Val Arg Thr Arg

1940 1945 1950

Met Leu Ile Asp Asp Glu Ile Glu Pro Gln Ser Leu Ser Thr His

1955 1960 1965

Thr Thr Ile His Ala Tyr Leu Val Asn Ser Gly Thr Lys Lys Val

1970 1975 1980

Leu Lys Val Asp Leu Thr Pro His Ser Ser Leu Arg Ala Ser Glu

1985 1990 1995

Lys Ser Thr Ala Ile Met Gly Phe Pro Glu Arg Glu Asn Glu Leu

2000 2005 2010

Arg Gln Thr Gly Met Ala Val Pro Val Ala Tyr Asp Gln Leu Pro

2015 2020 2025

Pro Lys Asn Glu Asp Leu Thr Phe Glu Gly Glu Ser Leu Phe Lys

2030 2035 2040

Gly Pro Arg Asp Tyr Asn Pro Ile Ser Ser Thr Ile Cys His Leu

2045 2050 2055

Thr Asn Glu Ser Asp Gly His Thr Thr Ser Leu Tyr Gly Ile Gly

2060 2065 2070

Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu Phe Arg Arg Asn

2075 2080 2085

Asn Gly Thr Leu Leu Val Gln Ser Leu His Gly Val Phe Lys Val

2090 2095 2100

Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly Arg Asp

2105 2110 2115

Met Ile Ile Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro Gln

2120 2125 2130

Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu

2135 2140 2145

Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser Ser Met Val Ser

2150 2155 2160

Asp Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile Phe Trp Lys

2165 2170 2175

His Trp Ile Gln Thr Lys Asp Gly Gln Cys Gly Ser Pro Leu Val

2180 2185 2190

Ser Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser Asn

2195 2200 2205

Phe Thr Asn Thr Asn Asn Tyr Phe Thr Ser Val Pro Lys Asn Phe

2210 2215 2220

Met Glu Leu Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Gly

2225 2230 2235

Trp Arg Leu Asn Ala Asp Ser Val Leu Trp Gly Gly His Lys Val

2240 2245 2250

Phe Met Ser Lys Pro Glu Glu Pro Phe Gln Pro Val Lys Glu Ala

2255 2260 2265

Thr Gln Leu Met Asn Glu Leu Val Tyr Ser Gln Gly Glu Lys Arg

2270 2275 2280

Lys Trp Val Val Glu Ala Leu Ser Gly Asn Leu Arg Pro Val Ala

2285 2290 2295

Glu Cys Pro Ser Gln Leu Val Thr Lys His Val Val Lys Gly Lys

2300 2305 2310

Cys Pro Leu Phe Glu Leu Tyr Leu Gln Leu Asn Pro Glu Lys Glu

2315 2320 2325

Ala Tyr Phe Lys Pro Met Met Gly Ala Tyr Lys Pro Ser Arg Leu

2330 2335 2340

Asn Arg Glu Ala Phe Leu Lys Asp Ile Leu Lys Tyr Ala Ser Glu

2345 2350 2355

Ile Glu Ile Gly Asn Val Asp Cys Asp Leu Leu Glu Leu Ala Ile

2360 2365 2370

Ser Met Leu Val Thr Lys Leu Lys Ala Leu Gly Phe Pro Thr Val

2375 2380 2385

Asn Tyr Ile Thr Asp Pro Glu Glu Ile Phe Ser Ala Leu Asn Met

2390 2395 2400

Lys Ala Ala Met Gly Ala Leu Tyr Lys Gly Lys Lys Lys Glu Ala

2405 2410 2415

Leu Ser Glu Leu Thr Leu Asp Glu Gln Glu Ala Met Leu Lys Ala

2420 2425 2430

Ser Cys Leu Arg Leu Tyr Thr Gly Lys Leu Gly Ile Trp Asn Gly

2435 2440 2445

Ser Leu Lys Ala Glu Leu Arg Pro Ile Glu Lys Val Glu Asn Asn

2450 2455 2460

Lys Thr Arg Thr Phe Thr Ala Ala Pro Ile Asp Thr Leu Leu Ala

2465 2470 2475

Gly Lys Val Cys Val Asp Asp Phe Asn Asn Gln Phe Tyr Asp Leu

2480 2485 2490

Asn Ile Lys Ala Pro Trp Thr Val Gly Met Thr Lys Phe Tyr Gln

2495 2500 2505

Gly Trp Asn Glu Leu Met Glu Ala Leu Pro Ser Gly Trp Val Tyr

2510 2515 2520

Cys Asp Ala Asp Gly Ser Gln Phe Asp Ser Ser Leu Thr Pro Phe

2525 2530 2535

Leu Ile Asn Ala Val Leu Lys Val Arg Leu Ala Phe Met Glu Glu

2540 2545 2550

Trp Asp Ile Gly Glu Gln Met Leu Arg Asn Leu Tyr Thr Glu Ile

2555 2560 2565

Val Tyr Thr Pro Ile Leu Thr Pro Asp Gly Thr Ile Ile Lys Lys

2570 2575 2580

His Lys Gly Asn Asn Ser Gly Gln Pro Ser Thr Val Val Asp Asn

2585 2590 2595

Thr Leu Met Val Ile Ile Ala Met Leu Tyr Thr Cys Glu Lys Cys

2600 2605 2610

Gly Ile Asn Lys Glu Glu Ile Val Tyr Tyr Val Asn Gly Asp Asp

2615 2620 2625

Leu Leu Ile Ala Ile His Pro Asp Lys Ala Glu Arg Leu Ser Arg

2630 2635 2640

Phe Lys Glu Ser Phe Gly Glu Leu Gly Leu Lys Tyr Glu Phe Asp

2645 2650 2655

Cys Thr Thr Arg Asp Lys Thr Gln Leu Trp Phe Met Ser His Arg

2660 2665 2670

Ala Leu Glu Arg Asp Gly Met Tyr Ile Pro Lys Leu Glu Glu Glu

2675 2680 2685

Arg Ile Val Ser Ile Leu Glu Trp Asp Arg Ser Lys Glu Pro Ser

2690 2695 2700

His Arg Leu Glu Ala Ile Cys Ala Ser Met Ile Glu Ala Trp Gly

2705 2710 2715

Tyr Asp Lys Leu Val Glu Glu Ile Arg Asn Phe Tyr Ala Trp Val

2720 2725 2730

Leu Glu Gln Ala Pro Tyr Ser Gln Leu Ala Glu Glu Gly Lys Ala

2735 2740 2745

Pro Tyr Leu Ala Glu Thr Ala Leu Lys Phe Leu Tyr Thr Ser Gln

2750 2755 2760

His Gly Thr Asn Ser Glu Ile Glu Glu Tyr Leu Lys Val Leu Tyr

2765 2770 2775

Asp Tyr Asp Ile Pro Thr Thr Glu Asn Leu Tyr Phe Gln Ser Gly

2780 2785 2790

Thr Val Asp Ala Gly Ala Asp Ala Gly Lys Lys Lys Asp Gln Lys

2795 2800 2805

Asp Asp Lys Val Ala Glu Gln Ala Ser Lys Asp Arg Asp Val Asn

2810 2815 2820

Ala Gly Thr Ser Gly Thr Phe Ser Val Pro Arg Ile Asn Ala Met

2825 2830 2835

Ala Thr Lys Leu Gln Tyr Pro Arg Met Arg Gly Glu Val Val Val

2840 2845 2850

Asn Leu Asn His Leu Leu Gly Tyr Lys Pro Gln Gln Ile Asp Leu

2855 2860 2865

Ser Asn Ala Ar gAla Thr His Glu Gln Phe Ala Ala Trp His Gln

2870 2875 2880

Ala Val Met Thr Ala Tyr Gly Val Asn Glu Glu Gln Met Lys Ile

2885 2890 2895

Leu Leu Asn Gly Phe Met Val Trp Cys Ile Glu Asn Gly Thr Ser

2900 2905 2910

Pro Asn Leu Asn Gly Thr Trp Val Met Met Asp Gly Glu Asp Gln

2915 2920 2925

Val Ser Tyr Pro Leu Lys Pro Met Val Glu Asn Ala Gln Pro Thr

2930 2935 2940

Leu Arg Gln Ile Met Thr His Phe Ser Asp Leu Ala Glu Ala Tyr

2945 2950 2955

Ile Glu Met Arg Asn Arg Glu Arg Pro Tyr Met Pro Arg Tyr Gly

2960 2965 2970

Leu Gln Arg Asn Ile Thr Asp Met Ser Leu Ser Arg Tyr Ala Phe

2975 2980 2985

Asp Phe Tyr Glu Leu Thr Ser Lys Thr Pro Val Arg Ala Arg Glu

2990 2995 3000

Ala His Met Gln Met Lys Ala Ala Ala Val Arg Asn Ser Gly Thr

3005 3010 3015

Arg Leu Phe Gly Leu Asp Gly Asn Val Gly Thr Ala Glu Glu Asp

3020 3025 3030

Thr Glu Arg His Thr Ala His Asp Val Asn Arg Asn Met His Thr

3035 3040 3045

Leu Leu Gly Val Arg Gln

3050

<210>85

<211>4157

<212>DNA

<213>人

<400>85

agcggggcgg ggcgccagcg ctgccttttc tcctgccggg tagtttcgct ttcctgcgca 60

gagtctgcgg aggggctcgg ctgcaccggg gggatcgcgc ctggcagacc ccagaccgag 120

cagaggcgac ccagcgcgct cgggagaggc tgcaccgccg cgcccccgcc tagcccttcc 180

ggatcctgcg cgcagaaaag tttcatttgc tgtatgccat cctcgagagc tgtctaggtt 240

aacgttcgca ctctgtgtat ataacctcga cagtcttggc acctaacgtg ctgtgcgtag 300

ctgctccttt ggttgaatcc ccaggccctt gttggggcac aaggtggcag gatgtctcag 360

tggtacgaac ttcagcagct tgactcaaaa ttcctggagc aggttcacca gctttatgat 420

gacagttttc ccatggaaat cagacagtac ctggcacagt ggttagaaaa gcaagactgg 480

gagcacgctg ccaatgatgt ttcatttgcc accatccgtt ttcatgacct cctgtcacag 540

ctggatgatc aatatagtcg cttttctttg gagaataact tcttgctaca gcataacata 600

aggaaaagca agcgtaatct tcaggataat tttcaggaag acccaatcca gatgtctatg 660

atcatttaca gctgtctgaa ggaagaaagg aaaattctgg aaaacgccca gagatttaat 720

caggctcagt cggggaatat tcagagcaca gtgatgttag acaaacagaa agagcttgac 780

agtaaagtca gaaatgtgaa ggacaaggtt atgtgtatag agcatgaaat caagagcctg 840

gaagatttac aagatgaata tgacttcaaa tgcaaaacct tgcagaacag agaacacgag 900

accaatggtg tggcaaagag tgatcagaaa caagaacagc tgttactcaa gaagatgtat 960

ttaatgcttg acaataagag aaaggaagta gttcacaaaa taatagagtt gctgaatgtc 1020

actgaactta cccagaatgc cctgattaat gatgaactag tggagtggaa gcggagacag 1080

cagagcgcct gtattggggg gccgcccaat gcttgcttgg atcagctgca gaactggttc 1140

actatagttg cggagagtct gcagcaagtt cggcagcagc ttaaaaagtt ggaggaattg 1200

gaacagaaat acacctacga acatgaccct atcacaaaaa acaaacaagt gttatgggac 1260

cgcaccttca gtcttttcca gcagctcatt cagagctcgt ttgtggtgga aagacagccc 1320

tgcatgccaa cgcaccctca gaggccgctg gtcttgaaga caggggtcca gttcactgtg 1380

aagttgagac tgttggtgaa attgcaagag ctgaattata atttgaaagt caaagtctta 1440

tttgataaag atgtgaatga gagaaataca gtaaaaggat ttaggaagtt caacattttg 1500

ggcacgcaca caaaagtgat gaacatggag gagtccacca atggcagtct ggcggctgaa 1560

tttcggcacc tgcaattgaa agaacagaaa aatgctggca ccagaacgaa tgagggtcct 1620

ctcatcgtta ctgaagagct tcactccctt agttttgaaa cccaattgtg ccagcctggt 1680

ttggtaattg acctcgagac gacctctctg cccgttgtgg tgatctccaa cgtcagccag 1740

ctcccgagcg gttgggcctc catcctttgg tacaacatgc tggtggcgga acccaggaat 1800

ctgtccttct tcctgactcc accatgtgca cgatgggctc agctttcaga agtgctgagt 1860

tggcagtttt cttctgtcac caaaagaggt ctcaatgtgg accagctgaa catgttggga 1920

gagaagcttc ttggtcctaa cgccagcccc gatggtctca ttccgtggac gaggttttgt 1980

aaggaaaata taaatgataa aaattttccc ttctggcttt ggattgaaag catcctagaa 2040

ctcattaaaa aacacctgct ccctctctgg aatgatgggt gcatcatggg cttcatcagc 2100

aaggagcgag agcgtgccct gttgaaggac cagcagccgg ggaccttcct gctgcggttc 2160

agtgagagct cccgggaagg ggccatcaca ttcacatggg tggagcggtc ccagaacgga 2220

ggcgaacctg acttccatgc ggttgaaccc tacacgaaga aagaactttc tgctgttact 2280

ttccctgaca tcattcgcaa ttacaaagtc atggctgctg agaatattcc tgagaatccc 2340

ctgaagtatc tgtatccaaa tattgacaaa gaccatgcct ttggaaagta ttactccagg 2400

ccaaaggaag caccagagcc aatggaactt gatggcccta aaggaactgg atatatcaag 2460

actgagttga tttctgtgtc tgaagttcac ccttctagac ttcagaccac agacaacctg 2520

ctccccatgt ctcctgagga gtttgacgag gtgtctcgga tagtgggctc tgtagaattc 2580

gacagtatga tgaacacagt atagagcatg aatttttttc atcttctctg gcgacagttt 2640

tccttctcat ctgtgattcc ctcctgctac tctgttcctt cacatcctgt gtttctaggg 2700

aaatgaaaga aaggccagca aattcgctgc aacctgttga tagcaagtga atttttctct 2760

aactcagaaa catcagttac tctgaagggc atcatgcatc ttactgaagg taaaattgaa 2820

aggcattctc tgaagagtgg gtttcacaag tgaaaaacat ccagatacac ccaaagtatc 2880

aggacgagaa tgagggtcct ttgggaaagg agaagttaag caacatctag caaatgttat 2940

gcataaagtc agtgcccaac tgttataggt tgttggataa atcagtggtt atttagggaa 3000

ctgcttgacg taggaacggt aaatttctgt gggagaattc ttacatgttt tctttgcttt 3060

aagtgtaact ggcagttttc cattggttta cctgtgaaat agttcaaagc caagtttata 3120

tacaattata tcagtcctct ttcaaaggta gccatcatgg atctggtagg gggaaaatgt 3180

gtattttatt acatctttca cattggctat ttaaagacaa agacaaattc tgtttcttga 3240

gaagagaata ttagctttac tgtttgttat ggcttaatga cactagctaa tatcaataga 3300

aggatgtaca tttccaaatt cacaagttgt gtttgatatc caaagctgaa tacattctgc 3360

tttcatcttg gtcacataca attattttta cagttctccc aagggagtta ggctattcac 3420

aaccactcat tcaaaagttg aaattaacca tagatgtaga taaactcaga aatttaattc 3480

atgtttctta aatgggctac tttgtccttt ttgttattag ggtggtattt agtctattag 3540

ccacaaaatt gggaaaggag tagaaaaagc agtaactgac aacttgaata atacaccaga 3600

gataatatga gaatcagatc atttcaaaac tcatttccta tgtaactgca ttgagaactg 3660

catatgtttc gctgatatat gtgtttttca catttgcgaa tggttccatt ctctctcctg 3720

tactttttcc agacactttt ttgagtggat gatgtttcgt gaagtatact gtatttttac 3780

ctttttcctt ccttatcact gacacaaaaa gtagattaag agatgggttt gacaaggttc 3840

ttccctttta catactgctg tctatgtggc tgtatcttgt ttttccacta ctgctaccac 3900

aactatatta tcatgcaaat gctgtattct tctttggtgg agataaagat ttcttgagtt 3960

ttgttttaaa attaaagcta aagtatctgt attgcattaa atataatatg cacacagtgc 4020

tttccgtggc actgcataca atctgaggcc tcctctctca gtttttatat agatggcgag 4080

aacctaagtt tcagttgatt ttacaattga aatgactaaa aaacaaagaa gacaacatta 4140

aaacaatatt gtttcta 4157

<210>86

<211>4451

<212>DNA

<213>人

<400>86

gctcatacta gggacgggaa gtcgcgacca gagccattgg agggcgcggg gactgcaacc 60

ctaatcagca gagcccaaat ggcgcagtgg gaaatgctgc agaatcttga cagccccttt 120

caggatcagc tgcaccagct ttactcgcac agcctcctgc ctgtggacat tcgacagtac 180

ttggctgtct ggattgaaga ccagaactgg caggaagctg cacttgggag tgatgattcc 240

aaggctacca tgctattctt ccacttcttg gatcagctga actatgagtg tggccgttgc 300

agccaggacc cagagtcctt gttgctgcag cacaatttgc ggaaattctg ccgggacatt 360

cagccctttt cccaggatcc tacccagttg gctgagatga tctttaacct ccttctggaa 420

gaaaaaagaa ttttgatcca ggctcagagg gcccaattgg aacaaggaga gccagttctc 480

gaaacacctg tggagagcca gcaacatgag attgaatccc ggatcctgga tttaagggct 540

atgatggaga agctggtaaa atccatcagc caactgaaag accagcagga tgtcttctgc 600

ttccgatata agatccaggc caaagggaag acaccctctc tggaccccca tcagaccaaa 660

gagcagaaga ttctgcagga aactctcaat gaactggaca aaaggagaaa ggaggtgctg 720

gatgcctcca aagcactgct aggccgatta actaccctaa tcgagctact gctgccaaag 780

ttggaggagt ggaaggccca gcagcaaaaa gcctgcatca gagctcccat tgaccacggg 840

ttggaacagc tggagacatg gttcacagct ggagcaaagc tgttgtttca cctgaggcag 900

ctgctgaagg agctgaaggg actgagttgc ctggttagct atcaggatga ccctctgacc 960

aaaggggtgg acctacgcaa cgcccaggtc acagagttgc tacagcgtct gctccacaga 1020

gcctttgtgg tagaaaccca gccctgcatg ccccaaactc cccatcgacc cctcatcctc 1080

aagactggca gcaagttcac cgtccgaaca aggctgctgg tgagactcca ggaaggcaat 1140

gagtcactga ctgtggaagt ctccattgac aggaatcctc ctcaattaca aggcttccgg 1200

aagttcaaca ttctgacttc aaaccagaaa actttgaccc ccgagaaggg gcagagtcag 1260

ggtttgattt gggactttgg ttacctgact ctggtggagc aacgttcagg tggttcagga 1320

aagggcagca ataaggggcc actaggtgtg acagaggaac tgcacatcat cagcttcacg 1380

gtcaaatata cctaccaggg tctgaagcag gagctgaaaa cggacaccct ccctgtggtg 1440

attatttcca acatgaacca gctctcaatt gcctgggctt cagttctctg gttcaatttg 1500

ctcagcccaa accttcagaa ccagcagttc ttctccaacc cccccaaggc cccctggagc 1560

ttgctgggcc ctgctctcag ttggcagttc tcctcctatg ttggccgagg cctcaactca 1620

gaccagctga gcatgctgag aaacaagctg ttcgggcaga actgtaggac tgaggatcca 1680

ttattgtcct gggctgactt cactaagcga gagagccctc ctggcaagtt accattctgg 1740

acatggctgg acaaaattct ggagttggta catgaccacc tgaaggatct ctggaatgat 1800

ggacgcatca tgggctttgt gagtcggagc caggagcgcc ggctgctgaa gaagaccatg 1860

tctggcacct ttctactgcg cttcagtgaa tcgtcagaag ggggcattac ctgctcctgg 1920

gtggagcacc aggatgatga caaggtgctc atctactctg tgcaaccgta cacgaaggag 1980

gtgctgcagt cactcccgct gactgaaatc atccgccatt accagttgct cactgaggag 2040

aatatacctg aaaacccact gcgcttcctc tatccccgaa tcccccggga tgaagctttt 2100

gggtgctact accaggagaa agttaatctc caggaacgga ggaaatacct gaaacacagg 2160

ctcattgtgg tctctaatag acaggtggat gaactgcaac aaccgctgga gcttaagcca 2220

gagccagagc tggagtcatt agagctggaa ctagggctgg tgccagagcc agagctcagc 2280

ctggacttag agccactgct gaaggcaggg ctggatctgg ggccagagct agagtctgtg 2340

ctggagtcca ctctggagcc tgtgatagag cccacactat gcatggtatc acaaacagtg 2400

ccagagccag accaaggacc tgtatcacag ccagtgccag agccagattt gccctgtgat 2460

ctgagacatt tgaacactga gccaatggaa atcttcagaa actgtgtaaa gattgaagaa 2520

atcatgccga atggtgaccc actgttggct ggccagaaca ccgtggatga ggtttacgtc 2580

tcccgcccca gccacttcta cactgatgga cccttgatgc cttctgactt ctaggaacca 2640

catttcctct gttcttttca tatctcttgc ccttcctact cctcatagca tgatattgtt 2700

ctccaaggat gggaatcagg catgtgtccc ttccaagctg tgttaactgt tcaaactcag 2760

gcctgtgtga ctccattggg gtgagaggtg aaagcataac atgggtacag aggggacaac 2820

aatgaatcag aacagatgct gagccatagg tctaaatagg atcctggagg ctgcctgctg 2880

tgctgggagg tataggggtc ctgggggcag gccagggcag ttgacaggta cttggagggc 2940

tcagggcagt ggcttctttc cagtatggaa ggatttcaac attttaatag ttggttaggc 3000

taaactggtg catactggca ttggcccttg gtggggagca cagacacagg ataggactcc 3060

atttctttct tccattcctt catgtctagg ataacttgct ttcttctttc ctttactcct 3120

ggctcaagcc ctgaatttct tcttttcctg caggggttga gagctttctg ccttagccta 3180

ccatgtgaaa ctctaccctg aagaaaggga tggataggaa gtagacctct ttttcttacc 3240

agtctcctcc cctactctgc ccctaagctg gctgtacctg ttcctccccc ataaaatgat 3300

cctgccaatc taatgtgagt gtgaagcttt gcacactagt ttatgctacc tagtctccac 3360

tttctcaatg cttaggagac agatcactcc tggaggctgg ggatggtagg attgctgggg 3420

attttttttt ttttaaacag ggtctcactc tgttgcccag gctagagtgc aatggtgcaa 3480

tcacagctca ctgcagcctc aacctcctgg gttcaagcaa tcctcctacc tcagcctcct 3540

gggtagctag caccatggca tgcgccacca tgccctattt ttttttttta aagacagggt 3600

cttgctatat tgcccaggct ggtcttgaac tgggctcaag tgatcctcac gccttggcct 3660

cccaaagtgc tgggattata ggcatgagcc actgtgcttg gccaggattt tttttttttt 3720

ttttttgaga tggagtttct ctcttgttgt ccaggctgga gtgcaatggt gtgatctcgg 3780

ctcactgcaa cctccgcctt ccgggttcaa gtgactctcc tgcctcagcc tccccagtag 3840

ctgggattac agatctgcac caccatgccc agctaatttt gtatttttag tagagacggg 3900

gtttctccat gttggtcagg ctggtctcga actcctgacc tcaagtgatc tgtccacctc 3960

ggcctcccag agtgctggga ttacaggcgt gagccactgt tcccagcagg aatttctttt 4020

ttatagtatt ggataaagtt tggtgttttt acagaggaga agcaatgggt cttagctctt 4080

tctctattat gttatcatcc tccctttttt gtacaatatg ttgtttacct gaaaggaagg 4140

tttctattcg ttggttgtgg acctggacaa agtccaagtc tgtggaactt aaaaccttga 4200

aggtctgtca taggactctg gacaatctca caccttagct attcccaggg aaccccaggg 4260

ggcaactgac attgctccaa gatgttctcc tgatgtagct tgagatataa aggaaaggcc 4320

ctgcacaggt ggctgtttct tgtctgttat gtcagaggaa cagtcctgtt cagaaagggg 4380

ctcttctgag cagaaatggc taataaactt tgtgctgatc tggaaaaaaa aaaaaaaaaa 4440

aaaaaaaaaa a 4451

<210>87

<211>9

<212>PRT

<213>人

<400>87

Gly Ser Glu Asn Leu Tyr Phe Gln Leu

5

<210>88

<211>27

<212>DNA

<213>人

<400>88

tctagaggcc tgatcatccg gtctcac 27

<210>89

<211>29

<212>DNA

<213>人

<400>89

tctagatgga aaacagaagt cccggaaac 29

<210>90

<211>2290

<212>DNA

<213>人

<400>90

gaattccgaa tcatgtgcag aatgctgaat cttcccccag ccaggacgaa taagacagcg 60

cggaaaagca gattctcgta attctggaat tgcatgttgc aaggagtctc ctggatcttc 120

gcacccagct tcgggtaggg agggagtccg ggtcccgggc taggccagcc cggcaggtgg 180

agagggtccc cggcagcccc gcgcgcccct ggccatgtct ttaatgccct gccccttcat 240

gtggccttct gagggttccc agggctggcc agggttgttt cccacccgcg cgcgcgctct 300

cacccccagc caaacccacc tggcagggct ccctccagcc gagacctttt gattcccggc 360

tcccgcgctc ccgcctccgc gccagcccgg gaggtggccc tggacagccg gacctcgccc 420

ggccccggct gggaccatgg tgtttctctc gggaaatgct tccgacagct ccaactgcac 480

ccaaccgccg gcaccggtga acatttccaa ggccattctg ctcggggtga tcttgggggg 540

cctcattctt ttcggggtgc tgggtaacat cctagtgatc ctctccgtag cctgtcaccg 600

acacctgcac tcagtcacgc actactacat cgtcaacctg gcggtggccg acctcctgct 660

cacctccacg gtgctgccct tctccgccat cttcgaggtc ctaggctact gggccttcgg 720

cagggtcttc tgcaacatct gggcggcagt ggatgtgctg tgctgcaccg cgtccatcat 780

gggcctctgc atcatctcca tcgaccgcta catcggcgtg agctacccgc tgcgctaccc 840

aaccatcgtc acccagagga ggggtctcat ggctctgctc tgcgtctggg cactctccct 900

ggtcatatcc attggacccc tgttcggctg gaggcagccg gcccccgagg acgagaccat 960

ctgccagatc aacgaggagc cgggctacgt gctcttctca gcgctgggct ccttctacct 1020

gcctctggcc atcatcctgg tcatgtactg ccgcgtctac gtggtggcca agagggagag 1080

ccggggcctc aagtctggcc tcaagaccga caagtcggac tcggagcaag tgacgctccg 1140

catccatcgg aaaaacgccc cggcaggagg cagcgggatg gccagcgcca agaccaagac 1200

gcacttctca gtgaggctcc tcaagttctc ccgggagaag aaagcggcca aaacgctggg 1260

catcgtggtc ggctgcttcg tcctctgctg gctgcctttt ttcttagtca tgcccattgg 1320

gtctttcttc cctgatttca agccctctga aacagttttt aaaatagtat tttggctcgg 1380

atatctaaac agctgcatca accccatcat atacccatgc tccagccaag agttcaaaaa 1440

ggcctttcag aatgtcttga gaatccagtg tctccgcaga aagcagtctt ccaaacatgc 1500

cctgggctac accctgcacc cgcccagcca ggccgtggaa gggcaacaca aggacatggt 1560

gcgcatcccc gtgggatcaa gagagacctt ctacaggatc tccaagacgg atggcgtttg 1620

tgaatggaaa tttttctctt ccatgccccg tggatctgcc aggattacag tgtccaaaga 1680

ccaatcctcc tgtaccacag cccgggtgag aagtaaaagc tttttggagg tctgctgctg 1740

tgtagggccc tcaaccccca gccttgacaa gaaccatcaa gttccaacca ttaaggtcca 1800

caccatctcc ctcagtgaga acggggagga agtctaggac aggaaagatg cagaggaaag 1860

gggaataatc ttaggtaccc accccacttc cttctcggaa ggccagctct tcttggagga 1920

caagacagga ccaatcaaag aggggacctg ctgggaatgg ggtgggtggt agacccaact 1980

catcaggcag cgggtagggc acagggaaga gggagggtgt ctcacaacca accagttcag 2040

aatgatacgg aacagcattt ccctgcagct aatgctttct tggtcactct gtgcccactt 2100

caacgaaaac caccatggga aacagaattt catgcacaat ccaaaagact ataaatatag 2160

gattatgatt tcatcatgaa tattttgagc acacactcta agtttggagc tatttcttga 2220

tggaagtgag gggattttat tttcaggctc aacctactga cagccacatt tgacatttat 2280

gccggaattc 2290

<210>91

<211>26

<212>DNA

<213>人

<400>91

ctcggatatc taaacagctg catcaa 26

<210>92

<211>29

<212>DNA

<213>人

<400>92

tctagacttt ctgcagagac actggattc 29

<210>93

<211>31

<212>DNA

<213>人

<400>93

tctagatcga aggcagtgga ggatcttcag g 31

<210>94

<211>27

<212>DNA

<213>人

<400>94

tctagaggcc tgatcatccg gtctcac 27

<210>95

<211>23

<212>DNA

<213>人

<400>95

cggatccgtt ggtactcttg agg 23

<210>96

<211>4989

<212>DNA

<213>人

<400>96

tttttttttt ttttgagaaa gggaatttca tcccaaataa aaggaatgaa gtctggctcc 60

ggaggagggt ccccgacctc gctgtggggg ctcctgtttc tctccgccgc gctctcgctc 120

tggccgacga gtggagaaat ctgcgggcca ggcatcgaca tccgcaacga ctatcagcag 180

ctgaagcgcc tggagaactg cacggtgatc gagggctacc tccacatcct gctcatctcc 240

aaggccgagg actaccgcag ctaccgcttc cccaagctca cggtcattac cgagtacttg 300

ctgctgttcc gagtggctgg cctcgagagc ctcggagacc tcttccccaa cctcacggtc 360

atccgcggct ggaaactctt ctacaactac gccctggtca tcttcgagat gaccaatctc 420

aaggatattg ggctttacaa cctgaggaac attactcggg gggccatcag gattgagaaa 480

aatgctgacc tctgttacct ctccactgtg gactggtccc tgatcctgga tgcggtgtcc 540

aataactaca ttgtggggaa taagccccca aaggaatgtg gggacctgtg tccagggacc 600

atggaggaga agccgatgtg tgagaagacc accatcaaca atgagtacaa ctaccgctgc 660

tggaccacaa accgctgcca gaaaatgtgc ccaagcacgt gtgggaagcg ggcgtgcacc 720

gagaacaatg agtgctgcca ccccgagtgc ctgggcagct gcagcgcgcc tgacaacgac 780

acggcctgtg tagcttgccg ccactactac tatgccggtg tctgtgtgcc tgcctgcccg 840

cccaacacct acaggtttga gggctggcgc tgtgtggacc gtgacttctg cgccaacatc 900

ctcagcgccg agagcagcga ctccgagggg tttgtgatcc acgacggcga gtgcatgcag 960

gagtgcccct cgggcttcat ccgcaacggc agccagagca tgtactgcat cccttgtgaa 1020

ggtccttgcc cgaaggtctg tgaggaagaa aagaaaacaa agaccattga ttctgttact 1080

tctgctcaga tgctccaagg atgcaccatc ttcaagggca atttgctcat taacatccga 1140

cgggggaata acattgcttc agagctggag aacttcatgg ggctcatcga ggtggtgacg 1200

ggctacgtga agatccgcca ttctcatgcc ttggtctcct tgtccttcct aaaaaacctt 1260

cgcctcatcc taggagagga gcagctagaa gggaattact ccttctacgt cctcgacaac 1320

cagaacttgc agcaactgtg ggactgggac caccgcaacc tgaccatcaa agcagggaaa 1380

atgtactttg ctttcaatcc caaattatgt gtttccgaaa tttaccgcat ggaggaagtg 1440

acggggacta aagggcgcca aagcaaaggg gacataaaca ccaggaacaa cggggagaga 1500

gcctcctgtg aaagtgacgt cctgcatttc acctccacca ccacgtcgaa gaatcgcatc 1560

atcataacct ggcaccggta ccggccccct gactacaggg atctcatcag cttcaccgtt 1620

tactacaagg aagcaccctt taagaatgtc acagagtatg atgggcagga tgcctgcggc 1680

tccaacagct ggaacatggt ggacgtggac ctcccgccca acaaggacgt ggagcccggc 1740

atcttactac atgggctgaa gccctggact cagtacgccg tttacgtcaa ggctgtgacc 1800

ctcaccatgg tggagaacga ccatatccgt ggggccaaga gtgagatctt gtacattcgc 1860

accaatgctt cagttccttc cattcccttg gacgttcttt cagcatcgaa ctcctcttct 1920

cagttaatcg tgaagtggaa ccctccctct ctgcccaacg gcaacctgag ttactacatt 1980

gtgcgctggc agcggcagcc tcaggacggc tacctttacc ggcacaatta ctgctccaaa 2040

gacaaaatcc ccatcaggaa gtatgccgac ggcaccatcg acattgagga ggtcacagag 2100

aaccccaaga ctgaggtgtg tggtggggag aaagggcctt gctgcgcctg ccccaaaact 2160

gaagccgaga agcaggccga gaaggaggag gctgaatacc gcaaagtctt tgagaatttc 2220

ctgcacaact ccatcttcgt gcccagacct gaaaggaagc ggagagatgt catgcaagtg 2280

gccaacacca ccatgtccag ccgaagcagg aacaccacgg ccgcagacac ctacaacatc 2340

accgacccgg aagagctgga gacagagtac cctttctttg agagcagagt ggataacaag 2400

gagagaactg tcatttctaa ccttcggcct ttcacattgt accgcatcga tatccacagc 2460

tgcaaccacg aggctgagaa gctgggctgc agcgcctcca acttcgtctt tgcaaggact 2520

atgcccgcag aaggagcaga tgacattcct gggccagtga cctgggagcc aaggcctgaa 2580

aactccatct ttttaaagtg gccggaacct gagaatccca atggattgat tctaatgtat 2640

gaaataaaat acggatcaca agttgaggat cagcgagaat gtgtgtccag acaggaatac 2700

aggaagtatg gaggggccaa gctaaaccgg ctaaacccgg ggaactacac agcccggatt 2760

caggccacat ctctctctgg gaatgggtcg tggacagatc ctgtgttctt ctatgtccag 2820

gccaaaacag gatatgaaaa cttcatccat ctgatcatcg ctctgcccgt cgctgtcctg 2880

ttgatcgtgg gagggttggt gattatgctg tacgtcttcc atagaaagag aaataacagc 2940

aggctgggga atggagtgct gtatgcctct gtgaacccgg agtacttcag cgctgctgat 3000

gtgtacgttc ctgatgagtg ggaggtggct cgggagaaga tcaccatgag ccgggaactt 3060

gggcaggggt cgtttgggat ggtctatgaa ggagttgcca agggtgtggt gaaagatgaa 3120

cctgaaacca gagtggccat taaaacagtg aacgaggccg caagcatgcg tgagaggatt 3180

gagtttctca acgaagcttc tgtgatgaag gagttcaatt gtcaccatgt ggtgcgattg 3240

ctgggtgtgg tgtcccaagg ccagccaaca ctggtcatca tggaactgat gacacggggc 3300

gatctcaaaa gttatctccg gtctctgagg ccagaaatgg agaataatcc agtcctagca 3360

cctccaagcc tgagcaagat gattcagatg gccggagaga ttgcagacgg catggcatac 3420

ctcaacgcca ataagttcgt ccacagagac cttgctgccc ggaattgcat ggtagccgaa 3480

gatttcacag tcaaaatcgg agattttggt atgacgcgag atatctatga gacagactat 3540

taccggaaag gaggcaaagg gctgctgccc gtgcgctgga tgtctcctga gtccctcaag 3600

gatggagtct tcaccactta ctcggacgtc tggtccttcg gggtcgtcct ctgggagatc 3660

gccacactgg ccgagcagcc ctaccagggc ttgtccaacg agcaagtcct tcgcttcgtc 3720

atggagggcg gccttctgga caagccagac aactgtcctg acatgctgtt tgaactgatg 3780

cgcatgtgct ggcagtataa ccccaagatg aggccttcct tcctggagat catcagcagc 3840

atcaaagagg agatggagcc tggcttccgg gaggtctcct tctactacag cgaggagaac 3900

aagctgcccg agccggagga gctggacctg gagccagaga acatggagag cgtccccctg 3960

gacccctcgg cctcctcgtc ctccctgcca ctgcccgaca gacactcagg acacaaggcc 4020

gagaacggcc ccggccctgg ggtgctggtc ctccgcgcca gcttcgacga gagacagcct 4080

tacgcccaca tgaacggggg ccgcaagaac gagcgggcct tgccgctgcc ccagtcttcg 4140

acctgctgat ccttggatcc tgaatctgtg caaacagtaa cgtgtgcgca cgcgcagcgg 4200

ggtggggggg gagagagagt tttaacaatc cattcacaag cctcctgtac ctcagtggat 4260

cttcagttct gcccttgctg cccgcgggag acagcttctc tgcagtaaaa cacatttggg 4320

atgttccttt tttcaatatg caagcagctt tttattccct gcccaaaccc ttaactgaca 4380

tgggccttta agaaccttaa tgacaacact taatagcaac agagcacttg agaaccagtc 4440

tcctcactct gtccctgtcc ttccctgttc tccctttctc tctcctctct gcttcataac 4500

ggaaaaataa ttgccacaag tccagctggg aagccctttt tatcagtttg aggaagtggc 4560

tgtccctgtg gccccatcca accactgtac acacccgcct gacaccgtgg gtcattacaa 4620

aaaaacacgt ggagatggaa atttttacct ttatctttca cctttctagg gacatgaaat 4680

ttacaaaggg ccatcgttca tccaaggctg ttaccatttt aacgctgcct aattttgcca 4740

aaatcctgaa ctttctccct catcggcccg gcgctgattc ctcgtgtccg gaggcatggg 4800

tgagcatggc agctggttgc tccatttgag agacacgctg gcgacacact ccgtccatcc 4860

gactgcccct gctgtgctgc tcaaggccac aggcacacag gtctcattgc ttctgactag 4920

attattattt gggggaactg gacacaatag gtctttctct cagtgaaggt ggggagaagc 4980

tgaaccggc 4989

<210>97

<211>3076

<212>DNA

<213>人

<400>97

gtttctccag ggaggcaggg cccggggaga aagttggagc ggtaacctaa gctggcagtg 60

gcgtgatccg gcaccaaatc ggcccgcggt gcggtgcgga gactccatga ggccctggac 120

atgaacaagc tgagtggagg cggcgggcgc aggactcggg tggaaggggg ccagcttggg 180

ggcgaggagt ggacccgcca cgggagcttt gtcaataagc ccacgcgggg ctggctgcat 240

cccaacgaca aagtcatggg acccggggtt tcctacttgg ttcggtacat gggttgtgtg 300

gaggtcctcc agtcaatgcg tgccctggac ttcaacaccc ggactcaggt caccagggag 360

gccatcagtc tggtgtgtga ggctgtgccg ggtgctaagg gggcgacaag gaggagaaag 420

ccctgtagcc gcccgctcag ctctatcctg gggaggagta acctgaaatt tgctggaatg 480

ccaatcactc tcaccgtctc caccagcagc ctcaacctca tggccgcaga ctgcaaacag 540

atcatcgcca accaccacat gcaatctatc tcatttgcat ccggcgggga tccggacaca 600

gccgagtatg tcgcctatgt tgccaaagac cctgtgaatc agagagcctg ccacattctg 660

gagtgtcccg aagggcttgc ccaggatgtc atcagcacca ttggccaggc cttcgagttg 720

cgcttcaaac aatacctcag gaacccaccc aaactggtca cccctcatga caggatggct 780

ggctttgatg gctcagcatg ggatgaggag gaggaagagc cacctgacca tcagtactat 840

aatgacttcc cggggaagga accccccttg gggggggtgg tagacatgag gcttcgggaa 900

ggagccgctc caggggctgc tcgacccact gcacccaatg cccagacccc cagccacttg 960

ggagctacat tgcctgtagg acagcctgtt gggggagatc cagaagtccg caaacagatg 1020

ccacctccac caccctgtcc agcaggcaga gagctttttg atgatccctc ctatgtcaac 1080

gtccagaacc tagacaaggc ccggcaagca gtgggtggtg ctgggccccc caatcctgct 1140

atcaatggca gtgcaccccg ggacctgttt gacatgaagc ccttcgaaga tgctcttcgc 1200

gtgcctccac ctccccagtc ggtgtccatg gctgagcagc tccgagggga gccctggttc 1260

catgggaagc tgagccggcg ggaggctgag gcactgctgc agctcaatgg ggacttcctg 1320

gtacgggaga gcacgaccac acctggccag tatgtgctca ctggcttgca gagtgggcag 1380

cctaagcatt tgctactggt ggaccctgag ggtgtggttc ggactaagga tcaccgcttt 1440

gaaagtgtca gtcaccttat cagctaccac atggacaatc acttgcccat catctctgcg 1500

ggcagcgaac tgtgtctaca gcaacctgtg gagcggaaac tgtgatctgc cctagcgctc 1560

tcttccagaa gatgccctcc aatcctttcc accctattcc ctaactctcg ggacctcgtt 1620

tgggagtgtt ctgtgggctt ggccttgtgt cagagctggg agtagcatgg actctgggtt 1680

tcatatccag ctgagtgaga gggtttgagt caaaagcctg ggtgagaatc ctgcctctcc 1740

ccaaacatta atcaccaaag tattaatgta cagagtggcc cctcacctgg gcctttcctg 1800

tgccaacctg atgccccttc cccaagaagg tgagtgcttg tcatggaaaa tgtcctgtgg 1860

tgacaggccc agtggaacag tcacccttct gggcaagggg gaacaaatca cacctctggg 1920

cttcagggta tcccagaccc ctctcaacac ccgccccccc catgtttaaa ctttgtgcct 1980

ttgaccatct cttaggtcta atgatatttt atgcaaacag ttcttggacc cctgaattca 2040

atgacaggga tgccaacacc ttcttggctt ctgggacctg tgttcttgct gagcaccctc 2100

tccggtttgg gttgggataa cagaggcagg agtggcagct gtcccctctc cctggggata 2160

tgcaaccctt agagattgcc ccagagcccc actcccggcc aggcgggaga tggacccctc 2220

ccttgctcag tgcctcctgg ccggggcccc tcaccccaag gggtctgtat atacatttca 2280

taaggcctgc cctcccatgt tgcatgccta tgtactctac gccaaagtgc agcccttcct 2340

cctgaagcct ctgccctgcc tccctttctg ggagggcggg gtgggggtga ctgaatttgg 2400

gcctcttgta cagttaactc tcccaggtgg attttgtgga ggtgagaaaa ggggcattga 2460

gactataaag cagtagacaa tccccacata ccatctgtag agttggaact gcattctttt 2520

aaagttttat atgcatatat tttagggctg tagacttact ttcctatttt cttttccatt 2580

gcttattctt gagcacaaaa tgataatcaa ttattacatt tatacatcac ctttttgact 2640

tttccaagcc cttttacagc tcttggcatt ttcctcgcct aggcctgtga ggtaactggg 2700

atcgcacctt ttataccaga gacctgaggc agatgaaatt tatttccatc taggactaga 2760

aaaacttggg tctcttaccg cgagactgag aggcagaagt cagcccgaat gcctgtcagt 2820

ttcatggagg ggaaacgcaa aacctgcagt tcctgagtac cttctacagg cccggcccag 2880

cctaggcccg gggtggccac accacagcaa gccggccccc cctcttttgg ccttgtggat 2940

aagggagagt tgaccgtttt catcctggcc tccttttgct gtttggatgt ttccacgggt 3000

ctcacttata ccaaagggaa aactcttcat taaagtccgt atttcttcta aaaaaaaaaa 3060

aaaaaaaaaa aaaaaa 3076

<210>98

<211>4

<212>PRT

<213>人

<400>98

Asn Ser Gly Ser

1

<210>99

<211>2261

<212>DNA

<213>人

<400>99

gaaatcaggc tccgggccgg ccgaagggcg caactttccc ccctcggcgc cccaccggct 60

cccgcgcgcc tcccctcgcg cccgagcttc gagccaagca gcgtcctggg gagcgcgtca 120

tggccttacc agtgaccgcc ttgctcctgc cgctggcctt gctgctccac gccgccaggc 180

cgagccagtt ccgggtgtcg ccgctggatc ggacctggaa cctgggcgag acagtggagc 240

tgaagtgcca ggtgctgctg tccaacccga cgtcgggctg ctcgtggctc ttccagccgc 300

gcggcgccgc cgccagtccc accttcctcc tatacctctc ccaaaacaag cccaaggcgg 360

ccgaggggct ggacacccag cggttctcgg gcaagaggtt gggggacacc ttcgtcctca 420

ccctgagcga cttccgccga gagaacgagg gctactattt ctgctcggcc ctgagcaact 480

ccatcatgta cttcagccac ttcgtgccgg tcttcctgcc agcgaagccc accacgacgc 540

cagcgccgcg accaccaaca ccggcgccca ccatcgcgtc gcagcccctg tccctgcgcc 600

cagaggcgtg ccggccagcg gcggggggcg cagtgcacac gagggggctg gacttcgcct 660

gtgatatcta catctgggcg cccttggccg ggacttgtgg ggtccttctc ctgtcactgg 720

ttatcaccct ttactgcaac cacaggaacc gaagacgtgt ttgcaaatgt ccccggcctg 780

tggtcaaatc gggagacaag cccagccttt cggcgagata cgtctaaccc tgtgcaacag 840

ccactacatt acttcaaact gagatccttc cttttgaggg agcaagtcct tccctttcat 900

tttttccagt cttcctccct gtgtattcat tctcatgatt attattttag tgggggcggg 960

gtgggaaaga ttactttttc tttatgtgtt tgacgggaaa caaaactagg taaaatctac 1020

agtacaccac aagggtcaca atactgttgt gcgcacatcg cggtagggcg tggaaagggg 1080

caggccagag ctacccgcag agttctcaga atcatgctga gagagctgga ggcacccatg 1140

ccatctcaac ctcttccccg cccgttttac aaagggggag gctaaagccc agagacagct 1200

tgatcaaagg cacacagcaa gtcagggttg gagcagtagc tggagggacc ttgtctccca 1260

gctcagggct ctttcctcca caccattcag gtctttcttt ccgaggcccc tgtctcaggg 1320

tgaggtgctt gagtctccaa cggcaaggga acaagtactt cttgatacct gggatactgt 1380

gcccagagcc tcgaggaggt aatgaattaa agaagagaac tgcctttggc agagttctat 1440

aatgtaaaca atatcagact tttttttttt ataatcaagc ctaaaattgt atagacctaa 1500

aataaaatga agtggtgagc ttaaccctgg aaaatgaatc cctctatctc taaagaaaat 1560

ctctgtgaaa cccctatgtg gaggcggaat tgctctccca gcccttgcat tgcagagggg 1620

cccatgaaag aggacaggct acccctttac aaatagaatt tgagcatcag tgaggttaaa 1680

ctaaggccct cttgaatctc tgaatttgag atacaaacat gttcctggga tcactgatga 1740

ctttttatac tttgtaaaga caattgttgg agagcccctc acacagccct ggcctctgct 1800

caactagcag atacagggat gaggcagacc tgactctctt aaggaggctg agagcccaaa 1860

ctgctgtccc aaacatgcac ttccttgctt aaggtatggt acaagcaatg cctgcccatt 1920

ggagagaaaa aacttaagta gataaggaaa taagaaccac tcataattct tcaccttagg 1980

aataatctcc tgttaatatg gtgtacattc ttcctgatta ttttctacac atacatgtaa 2040

aatatgtctt tcttttttaa atagggttgt actatgctgt tatgagtggc tttaatgaat 2100

aaacatttgt agcatcctct ttaatgggta aacagcaaaa aaaaaaaaaa aaaaaaaaaa 2160

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 2261

<210>100

<211>6450

<212>DNA

<213>人

<400>100

gagttgtgcc tggagtgatg tttaagccaa tgtcagggca aggcaacagt ccctggccgt 60

cctccagcac ctttgtaatg catatgagct cgggagacca gtacttaaag ttggaggccc 120

gggagcccag gagctggcgg agggcgttcg tcctgggagc tgcacttgct ccgtcgggtc 180

gccggcttca ccggaccgca ggctcccggg gcagggccgg ggccagagct cgcgtgtcgg 240

cgggacatgc gctgcgtcgc ctctaacctc gggctgtgct ctttttccag gtggcccgcc 300

ggtttctgag ccttctgccc tgcggggaca cggtctgcac cctgcccgcg gccacggacc 360

atgaccatga ccctccacac caaagcatct gggatggccc tactgcatca gatccaaggg 420

aacgagctgg agcccctgaa ccgtccgcag ctcaagatcc ccctggagcg gcccctgggc 480

gaggtgtacc tggacagcag caagcccgcc gtgtacaact accccgaggg cgccgcctac 540

gagttcaacg ccgcggccgc cgccaacgcg caggtctacg gtcagaccgg cctcccctac 600

ggccccgggt ctgaggctgc ggcgttcggc tccaacggcc tggggggttt ccccccactc 660

aacagcgtgt ctccgagccc gctgatgcta ctgcacccgc cgccgcagct gtcgcctttc 720

ctgcagcccc acggccagca ggtgccctac tacctggaga acgagcccag cggctacacg 780

gtgcgcgagg ccggcccgcc ggcattctac aggccaaatt cagataatcg acgccagggt 840

ggcagagaaa gattggccag taccaatgac aagggaagta tggctatgga atctgccaag 900

gagactcgct actgtgcagt gtgcaatgac tatgcttcag gctaccatta tggagtctgg 960

tcctgtgagg gctgcaaggc cttcttcaag agaagtattc aaggacataa cgactatatg 1020

tgtccagcca ccaaccagtg caccattgat aaaaacagga ggaagagctg ccaggcctgc 1080

cggctccgca aatgctacga agtgggaatg atgaaaggtg ggatacgaaa agaccgaaga 1140

ggagggagaa tgttgaaaca caagcgccag agagatgatg gggagggcag gggtgaagtg 1200

gggtctgctg gagacatgag agctgccaac ctttggccaa gcccgctcat gatcaaacgc 1260

tctaagaaga acagcctggc cttgtccctg acggccgacc agatggtcag tgccttgttg 1320

gatgctgagc cccccatact ctattccgag tatgatccta ccagaccctt cagtgaagct 1380

tcgatgatgg gcttactgac caacctggca gacagggagc tggttcacat gatcaactgg 1440

gcgaagaggg tgccaggctt tgtggatttg accctccatg atcaggtcca ccttctagaa 1500

tgtgcctggc tagagatcct gatgattggt ctcgtctggc gctccatgga gcacccagtg 1560

aagctactgt ttgctcctaa cttgctcttg gacaggaacc agggaaaatg tgtagagggc 1620

atggtggaga tcttcgacat gctgctggct acatcatctc ggttccgcat gatgaatctg 1680

cagggagagg agtttgtgtg cctcaaatct attattttgc ttaattctgg agtgtacaca 1740

tttctgtcca gcaccctgaa gtctctggaa gagaaggacc atatccaccg agtcctggac 1800

aagatcacag acactttgat ccacctgatg gccaaggcag gcctgaccct gcagcagcag 1860

caccagcggc tggcccagct cctcctcatc ctctcccaca tcaggcacat gagtaacaaa 1920

ggcatggagc atctgtacag catgaagtgc aagaacgtgg tgcccctcta tgacctgctg 1980

ctggagatgc tggacgccca ccgcctacat gcgcccacta gccgtggagg ggcatccgtg 2040

gaggagacgg accaaagcca cttggccact gcgggctcta cttcatcgca ttccttgcaa 2100

aagtattaca tcacggggga ggcagagggt ttccctgcca cagtctgaga gctccctggc 2160

tcccacacgg ttcagataat ccctgctgca ttttaccctc atcatgcacc actttagcca 2220

aattctgtct cctgcataca ctccggcatg catccaacac caatggcttt ctagatgagt 2280

ggccattcat ttgcttgctc agttcttagt ggcacatctt ctgtcttctg ttgggaacag 2340

ccaaagggat tccaaggcta aatctttgta acagctctct ttcccccttg ctatgttact 2400

aagcgtgagg attcccgtag ctcttcacag ctgaactcag tctatgggtt ggggctcaga 2460

taactctgtg catttaagct acttgtagag acccaggcct ggagagtaga cattttgcct 2520

ctgataagca ctttttaaat ggctctaaga ataagccaca gcaaagaatt taaagtggct 2580

cctttaattg gtgacttgga gaaagctagg tcaagggttt attatagcac cctcttgtat 2640

tcctatggca atgcatcctt ttatgaaagt ggtacacctt aaagctttta tatgactgta 2700

gcagagtatc tggtgattgt caattcactt ccccctatag gaatacaagg ggccacacag 2760

ggaaggcaga tcccctagtt ggccaagact tattttaact tgatacactg cagattcaga 2820

gtgtcctgaa gctctgcctc tggctttccg gtcatgggtt ccagttaatt catgcctccc 2880

atggacctat ggagagcaac aagttgatct tagttaagtc tccctatatg agggataagt 2940

tcctgatttt tgtttttatt tttgtgttac aaaagaaagc cctccctccc tgaacttgca 3000

gtaaggtcag cttcaggacc tgttccagtg ggcactgtac ttggatcttc ccggcgtgtg 3060

tgtgccttac acaggggtga actgttcact gtggtgatgc atgatgaggg taaatggtag 3120

ttgaaaggag caggggccct ggtgttgcat ttagccctgg ggcatggagc tgaacagtac 3180

ttgtgcagga ttgttgtggc tactagagaa caagagggaa agtagggcag aaactggata 3240

cagttctgag cacagccaga cttgctcagg tggccctgca caggctgcag ctacctagga 3300

acattccttg cagaccccgc attgcctttg ggggtgccct gggatccctg gggtagtcca 3360

gctcttattc atttcccagc gtggccctgg ttggaagaag cagctgtcaa gttgtagaca 3420

gctgtgttcc tacaattggc ccagcaccct ggggcacggg agaagggtgg ggaccgttgc 3480

tgtcactact caggctgact ggggcctggt cagattacgt atgcccttgg tggtttagag 3540

ataatccaaa atcagggttt ggtttgggga agaaaatcct cccccttcct cccccgcccc 3600

gttccctacc gcctccactc ctgccagctc atttccttca atttcctttg acctataggc 3660

taaaaaagaa aggctcattc cagccacagg gcagccttcc ctgggccttt gcttctctag 3720

cacaattatg ggttacttcc tttttcttaa caaaaaagaa tgtttgattt cctctgggtg 3780

accttattgt ctgtaattga aaccctattg agaggtgatg tctgtgttag ccaatgaccc 3840

aggtagctgc tcgggcttct cttggtatgt cttgtttgga aaagtggatt tcattcattt 3900

ctgattgtcc agttaagtga tcaccaaagg actgagaatc tgggagggca aaaaaaaaaa 3960

aaaaagtttt tatgtgcact taaatttggg gacaatttta tgtatctgtg ttaaggatat 4020

gcttaagaac ataattcttt tgttgctgtt tgtttaagaa gcaccttagt ttgtttaaga 4080

agcaccttat atagtataat atatattttt ttgaaattac attgcttgtt tatcagacaa 4140

ttgaatgtag taattctgtt ctggatttaa tttgactggg ttaacatgca aaaaccaagg 4200

aaaaatattt agtttttttt tttttttttg tatacttttc aagctacctt gtcatgtata 4260

cagtcattta tgcctaaagc ctggtgatta ttcatttaaa tgaagatcac atttcatatc 4320

aacttttgta tccacagtag acaaaatagc actaatccag atgcctattg ttggatattg 4380

aatgacagac aatcttatgt agcaaagatt atgcctgaaa aggaaaatta ttcagggcag 4440

ctaattttgc ttttaccaaa atatcagtag taatattttt ggacagtagc taatgggtca 4500

gtgggttctt tttaatgttt atacttagat tttcttttaa aaaaattaaa ataaaacaaa 4560

aaaaatttct aggactagac gatgtaatac cagctaaagc caaacaatta tacagtggaa 4620

ggttttacat tattcatcca atgtgtttct attcatgtta agatactact acatttgaag 4680

tgggcagaga acatcagatg attgaaatgt tcgcccaggg gtctccagca actttggaaa 4740

tctctttgta tttttacttg aagtgccact aatggacagc agatattttc tggctgatgt 4800

tggtattggg tgtaggaaca tgatttaaaa aaaaaactct tgcctctgct ttcccccact 4860

ctgaggcaag ttaaaatgta aaagatgtga tttatctggg gggctcaggt atggtgggga 4920

agtggattca ggaatctggg gaatggcaaa tatattaaga agagtattga aagtatttgg 4980

aggaaaatgg ttaattctgg gtgtgcacca aggttcagta gagtccactt ctgccctgga 5040

gaccacaaat caactagctc catttacagc catttctaaa atggcagctt cagttctaga 5100

gaagaaagaa caacatcagc agtaaagtcc atggaatagc tagtggtctg tgtttctttt 5160

cgccattgcc tagcttgccg taatgattct ataatgccat catgcagcaa ttatgagagg 5220

ctaggtcatc caaagagaag accctatcaa tgtaggttgc aaaatctaac ccctaaggaa 5280

gtgcagtctt tgatttgatt tccctagtaa ccttgcagat atgtttaacc aagccatagc 5340

ccatgccttt tgagggctga acaaataagg gacttactga taatttactt ttgatcacat 5400

taaggtgttc tcaccttgaa atcttataca ctgaaatggc cattgattta ggccactggc 5460

ttagagtact ccttcccctg catgacactg attacaaata ctttcctatt catactttcc 5520

aattatgaga tggactgtgg gtactgggag tgatcactaa caccatagta atgtctaata 5580

ttcacaggca gatctgcttg gggaagctag ttatgtgaaa ggcaaataaa gtcatacagt 5640

agctcaaaag gcaaccataa ttctctttgg tgcaagtctt gggagcgtga tctagattac 5700

actgcaccat tcccaagtta atcccctgaa aacttactct caactggagc aaatgaactt 5760

tggtcccaaa tatccatctt ttcagtagcg ttaattatgc tctgtttcca actgcatttc 5820

ctttccaatt gaattaaagt gtggcctcgt ttttagtcat ttaaaattgt tttctaagta 5880

attgctgcct ctattatggc acttcaattt tgcactgtct tttgagattc aagaaaaatt 5940

tctattcatt tttttgcatc caattgtgcc tgaactttta aaatatgtaa atgctgccat 6000

gttccaaacc catcgtcagt gtgtgtgttt agagctgtgc accctagaaa caacatactt 6060

gtcccatgag caggtgcctg agacacagac ccctttgcat tcacagagag gtcattggtt 6120

atagagactt gaattaataa gtgacattat gccagtttct gttctctcac aggtgataaa 6180

caatgctttt tgtgcactac atactcttca gtgtagagct cttgttttat gggaaaaggc 6240

tcaaatgcca aattgtgttt gatggattaa tatgcccttt tgccgatgca tactattact 6300

gatgtgactc ggttttgtcg cagctttgct ttgtttaatg aaacacactt gtaaacctct 6360

tttgcacttt gaaaaagaat ccagcgggat gctcgagcac ctgtaaacaa ttttctcaac 6420

ctatttgatg ttcaaataaa gaattaaact 6450

<210>101

<211>2011

<212>DNA

<213>人

<400>101

tttcagtttc tccagctgct ggctttttgg acacccactc ccccgccagg aggcagttgc 60

aagcgcggag gctgcgagaa ataactgcct cttgaaactt gcagggcgaa gagcaggcgg 120

cgagcgctgg gccggggagg gaccacccga gctgcgacgg gctctggggc tgcggggcag 180

ggctggcgcc cggagcctga gctgcaggag gtgcgctcgc tttcctcaac aggtggcggc 240

ggggcgcgcg ccgggagacc ccccctaatg cgggaaaagc acgtgtccgc attttagaga 300

aggcaaggcc ggtgtgttta tctgcaagcc attatacttg cccacgaatc tttgagaaca 360

ttataatgac ctttgtgcct cttcttgcaa ggtgttttct cagctgttat ctcaagacat 420

ggatataaaa aactcaccat ctagccttaa ttctccttcc tcctacaact gcagtcaatc 480

catcttaccc ctggagcacg gctccatata cataccttcc tcctatgtag acagccacca 540

tgaatatcca gccatgacat tctatagccc tgctgtgatg aattacagca ttcccagcaa 600

tgtcactaac ttggaaggtg ggcctggtcg gcagaccaca agcccaaatg tgttgtggcc 660

aacacctggg cacctttctc ctttagtggt ccatcgccag ttatcacatc tgtatgcgga 720

acctcaaaag agtccctggt gtgaagcaag atcgctagaa cacaccttac ctgtaaacag 780

agagacactg aaaaggaagg ttagtgggaa ccgttgcgcc agccctgtta ctggtccagg 840

ttcaaagagg gatgctcact tctgcgctgt ctgcagcgat tacgcatcgg gatatcacta 900

tggagtctgg tcgtgtgaag gatgtaaggc cttttttaaa agaagcattc aaggacataa 960

tgattatatt tgtccagcta caaatcagtg tacaatcgat aaaaaccggc gcaagagctg 1020

ccaggcctgc cgacttcgga agtgttacga agtgggaatg gtgaagtgtg gctcccggag 1080

agagagatgt gggtaccgcc ttgtgcggag acagagaagt gccgacgagc agctgcactg 1140

tgccggcaag gccaagagaa gtggcggcca cgcgccccga gtgcgggagc tgctgctgga 1200

cgccctgagc cccgagcagc tagtgctcac cctcctggag gctgagccgc cccatgtgct 1260

gatcagccgc cccagtgcgc ccttcaccga ggcctccatg atgatgtccc tgaccaagtt 1320

ggccgacaag gagttggtac acatgatcag ctgggccaag aagattcccg gctttgtgga 1380

gctcagcctg ttcgaccaag tgcggctctt ggagagctgt tggatggagg tgttaatgat 1440

ggggctgatg tggcgctcaa ttgaccaccc cggcaagctc atctttgctc cagatcttgt 1500

tctggacagg gatgagggga aatgcgtaga aggaattctg gaaatctttg acatgctcct 1560

ggcaactact tcaaggtttc gagagttaaa actccaacac aaagaatatc tctgtgtcaa 1620

ggccatgatc ctgctcaatt ccagtatgta ccctctggtc acagcgaccc aggatgctga 1680

cagcagccgg aagctggctc acttgctgaa cgccgtgacc gatgctttgg tttgggtgat 1740

tgccaagagc ggcatctcct cccagcagca atccatgcgc ctggctaacc tcctgatgct 1800

cctgtcccac gtcaggcatg cgagtaacaa gggcatggaa catctgctca acatgaagtg 1860

caaaaatgtg gtcccagtgt atgacctgct gctggagatg ctgaatgccc acgtgcttcg 1920

cgggtgcaag tcctccatca cggggtccga gtgcagcccg gcagaggaca gtaaaagcaa 1980

agagggctcc cagaacccac agtctcagtg a 2011

Claims

1.一种用于确定是否一种检测化合物调节第一检测蛋白和第二检测蛋白间相互作用的方法，其包含使所述检测化合物与采用如下物质转染或转化的细胞接触：

(a)包括下述物质的核酸分子：

(i)编码所述第一检测蛋白的核苷酸序列，其中所述第一检测蛋白是跨膜受体，

(ii)编码细胞并不内源表达的蛋白酶或蛋白酶片段识别的剪切位点的核苷酸序列，

(iii)编码在所述细胞中激活报道基因的蛋白的核苷酸序列，和

(b)包括下述物质的核酸分子：

(i)编码在要检测的所述检测化合物存在下与所述第一检测蛋白相互作用的所述第二检测蛋白的核苷酸序列，

(ii)编码对于所述剪切位点特异的所述蛋白酶或所述蛋白酶片段的核苷酸序列，

并确定所述报道基因的活性从而确定是否所述检测化合物调节所述蛋白/蛋白相互作用。

2.根据权利要求1的方法，其中所述跨膜受体是胰岛素样生长因子受体IGFR、表皮生长因子受体EGFR或干扰素受体。

3.根据权利要求1的方法，其中所述跨膜受体包括雌激素受体1ESR1或雌激素受体2ESR2。

4.根据权利要求1的方法，其中所述跨膜受体是GPCR。

5.根据权利要求1的方法，其中所述蛋白酶或蛋白酶片段是烟草蚀纹病毒核内包涵体A蛋白酶。

6.根据权利要求1的方法，其中激活所述报道基因的所述蛋白是转录因子。

7.根据权利要求6的方法，其中所述转录因子是tTA或GAL4。

8.根据权利要求1的方法，其中所述第二蛋白是抑制性蛋白。

9.根据权利要求8的方法，其中所述抑制性蛋白是抑制蛋白。

10.根据权利要求1的方法，其中所述细胞是真核细胞。

11.根据权利要求1的方法，其中所述报道基因是外源基因。

12.根据权利要求11的方法，其中所述外源基因编码β-半乳糖苷酶或荧光素酶。

13.根据权利要求1的方法，其中编码所述第一检测蛋白的核苷酸序列被修饰以提高与所述第二检测蛋白的相互作用。

14.根据权利要求13的方法，其中所述修饰包含采用编码相比于原始序列与所述第二检测蛋白具有更高亲和性的氨基酸序列的核苷酸序列替换所述第一检测蛋白C-末端区域的全部或部分核苷酸序列。

15.根据权利要求14的方法，其中所述C-末端区域的核苷酸序列被编码AVPR2，AGTRLI，GRPR，F2PL1，CXCR2/IL-8B，CCR4或GRPR的C-末端区域的全部或部分的核苷酸序列所替换。

16.根据权利要求1的方法，包含使多于一种化合物与多个细胞样本接触，所述样本中的每个与一个或更多所述化合物接触，其中所述细胞样本中的每个采用(a)和(b)进行转染或转化，并且在所述多个所述样本中确定报道基因的活性，从而确定是否任何所述化合物调节所述第一检测蛋白和所述第二检测蛋白间的所述相互作用。

17.根据权利要求4的方法，其中所述跨膜蛋白是β2-肾上腺素受体ADRB2，精氨酸血管加压素受体2AVPR2，血清素受体la HTR1A，m2毒蕈碱性乙酰胆碱受体CHRM2，趋化因子(C-C模序)受体5CCR5，多巴胺D2受体DRD2，卡巴阿片样物质受体OPRK或ala-肾上腺素受体ADRA1A。

18.根据权利要求16的方法，包含使所述样本的每个与一种化合物接触，其中的每种与其他不相同。

19.根据权利要求16的方法，包含使所述样本的每个与所述化合物的混合物接触。

20.一种用于确定是否一种检测化合物调节感兴趣的多个蛋白的一个或多个的相互作用的方法，包含使所述检测化合物与多个细胞样本接触，每种细胞样本已经被如下物质转染或转化：

(a)第一核酸分子，包含：

(i)编码第一检测蛋白的核苷酸序列，其中所述第一检测蛋白是跨膜受体，

(b)第二核酸分子，包含：

(i)编码在要检测的所述检测化合物存在下与所述第一检测蛋白相互作用的第二检测蛋白的核苷酸序列，

(ii)编码对所述剪切位点特异的所述蛋白酶或所述蛋白酶片段的核苷酸序列，

其中在所述多个样本的每个中，所述第一检测蛋白不同于其他的第一检测蛋白，

并且在一个或多个所述多个样本中确定所述报道基因的活性从而确定感兴趣的一个或多个蛋白相互作用的调节。

21.根据权利要求20的方法，其中所述第二检测蛋白在每个样本中是不同的。

22.根据权利要求20的方法，其中所述第二检测蛋白在每个样本中是相同的。

23.根据权利要求20的方法，其中所有的所述样本放置于一个普通容器中，每个样本包含一个不同的第一和第二检测蛋白对。

24.根据权利要求20的方法，其中每个样本在不同的容器中进行检测。

25.根据权利要求20的方法，其中在给定样本中的报道基因不同于其他样本中的报道基因。

26.根据权利要求19的方法，其中所述化合物的混合物包含生物学样本。

27.根据权利要求26的方法，其中所述生物学样本为脑脊液，尿液，血液，血清，脓液，腹水，滑液，组织提取物或分泌物。

28.包含报道基因和下述物质的重组细胞：

(a)第一核酸分子，其编码第一融合蛋白，所述第一核酸分子包含：

(ii)编码所述细胞并不内源表达的蛋白酶或蛋白酶片段识别的蛋白剪切位点的核苷酸序列，

(iii)编码在所述细胞中能激活所述报道基因的蛋白的核苷酸序列，和

(b)第二核酸分子，其编码第二融合蛋白，所述第二核酸分子包含：

(i)编码在要检测的检测化合物存在下与所述第一检测蛋白相互作用的第二检测蛋白的核苷酸序列，

(ii)编码能特异性蛋白水解剪切所述剪切位点的所述蛋白酶或所述蛋白酶片段的核苷酸序列。

29.根据权利要求28中的重组细胞，其中所述核酸分子中的一个或两个被稳定整合到所述细胞的基因组中。

30.根据权利要求28中的重组细胞，其中所述细胞被所述报道基因转染或转化。

31.根据权利要求28中的重组细胞，其中所述跨膜受体是胰岛素样生长因子受体IGFR、表皮生长因子受体EGFR或干扰素受体。

32.根据权利要求28中的重组细胞，其中所述跨膜受体包括雌激素受体1ESR1或雌激素受体2ESR2。

33.根据权利要求28中的重组细胞，其中所述跨膜受体是GPCR。

34.根据权利要求28中的重组细胞，其中所述蛋白酶或蛋白酶片段是烟草蚀纹病毒核内包涵体A蛋白酶。

35.根据权利要求28中的重组细胞，其中所述激活所述报道基因的蛋白是转录因子。

36.根据权利要求33中的重组细胞，其中所述跨膜受体是ADBR2，AVPR2，HTR1A，CHRM2，CCR5，DRD2，OPRK或ADRA1A。

37.根据权利要求28中的重组细胞，其中所述转录因子是tTA或GAL4。

38.根据权利要求28中的重组细胞，其中所述第二蛋白是抑制性蛋白。

39.根据权利要求38中的重组细胞，其中所述抑制性蛋白是抑制蛋白。

40.根据权利要求28中的重组细胞，其中所述细胞是真核细胞。

41.根据权利要求28中的重组细胞，其中所述细胞是原核细胞。

42.根据权利要求28中的重组细胞，其中所述报道基因是外源基因。

43.根据权利要求42中的重组细胞，其中所述外源基因编码β-半乳糖苷酶或荧光素酶.

44.根据权利要求28中的重组细胞，其中编码所述第一检测蛋白的核苷酸序列被修饰以提高与所述第二检测蛋白的相互作用。

45.根据权利要求44中的重组细胞，其中所述修饰包含采用一种编码相比于原始序列与所述第二检测蛋白具有更高亲和性的氨基酸序列的核苷酸序列替换所述第一检测蛋白C-末端区域的全部或部分核苷酸序列。

46.根据权利要求44中的重组细胞，其中所述C-末端区域的核苷酸序列被编码AVPR2，AGTRLI，GRPR，F2PL1，CXCR2/IL-8B或CCR4的C-末端区域的核苷酸序列所替换。

47.一种分离的核酸分子，其编码融合蛋白，所述核酸分子包含，从5′至3′顺序，

(i)编码在要检测的检测化合物存在下与另一种检测蛋白相互作用的检测蛋白的核苷酸序列，其中所述检测蛋白是跨膜受体，

(ii)编码蛋白酶或蛋白酶片段识别的剪切位点的核苷酸序列，

(iii)编码激活报道基因的蛋白的核苷酸序列。

48.根据权利要求47的分离的核酸分子，其中所述跨膜受体是胰岛素样生长因子受体IGFR、表皮生长因子受体EGFR或干扰素受体。

49.根据权利要求47的分离的核酸分子，其中所述跨膜受体包括雌激素受体1ESR1或雌激素受体2ESR2。

50.根据权利要求47的分离的核酸分子，其中所述跨膜受体是GPCR。

51.根据权利要求47的分离的核酸分子，其中所述蛋白酶或蛋白酶片段是烟草蚀纹病毒核内包涵体A蛋白酶。

52.根据权利要求47的分离的核酸分子，其中所述激活所述报道基因的蛋白是转录因子。

53.根据权利要求52的分离的核酸分子，其中所述转录因子是tTA或GAL4。

54.根据权利要求48的分离的核酸分子，其中所述跨膜受体是ADBR2，AVPR2，HTR1A，CHRM2，CCR5，DRD2，OPRK或ADRA1A。

55.包含权利要求47的分离的核酸分子的表达载体，可操作的连接到启动子。

56.一种分离的核酸分子，其编码融合蛋白，所述核酸分子包含：

(i)编码在要检测的检测化合物存在下与第二检测蛋白相互作用的第一检测蛋白的核苷酸序列，其中所述第二检测蛋白包括跨膜受体，

(ii)编码对包含在所述第二检测蛋白中的剪切位点特异的蛋白酶或蛋白酶片段的核苷酸序列。

57.根据权利要求56的分离的核酸分子，其中所述第一检测蛋白是抑制性蛋白。

58.根据权利要求57的分离的核酸分子，其中所述抑制性蛋白是抑制蛋白.

59.包含权利要求56的分离的核酸分子的表达载体，可操作的连接到启动子。

60.由权利要求47的分离的核酸分子的表达所产生的融合蛋白。

61.由权利要求56的分离的核酸分子的表达所产生的融合蛋白。

62.一种用于确定是否检测化合物调节第一检测蛋白和第二检测蛋白间相互作用的检测试剂盒，包括每种独立的部分：

(i)编码所述第一检测蛋白的核苷酸序列，其中所述检测蛋白是跨膜受体，

(ii)编码蛋白酶或蛋白酶片段识别的剪切位点的核苷酸序列，

(iii)编码激活报道基因的蛋白的核苷酸序列，

(i)编码在要检测的检测化合物存在下与所述第一检测蛋白相互作用的所述第二检测蛋白的核苷酸序列，

(c)分别独立容纳每种(a)和(b)的包装方式。

63.根据权利要求62的检测试剂盒，其中所述跨膜受体是胰岛素样生长因子受体IGFR、表皮生长因子受体EGFR或干扰素受体。

64.根据权利要求62的检测试剂盒，其中所述跨膜受体包括雌激素受体1ESR1或雌激素受体2ESR2。

65.根据权利要求62的检测试剂盒，其中所述跨膜受体是GPCR。

66.根据权利要求62的检测试剂盒，其中所述蛋白酶或蛋白酶片段是烟草蚀纹病毒核内包涵体A蛋白酶。

67.根据权利要求62的检测试剂盒，其中所述激活所述报道基因的蛋白是转录因子。

68.根据权利要求67的检测试剂盒，其中所述转录因子是tTA或GAL4。

69.根据权利要求62的检测试剂盒，其中所述第二蛋白是抑制性蛋白。

70.根据权利要求69的检测试剂盒，其中所述抑制性蛋白是抑制蛋白。

71.根据权利要求61的检测试剂盒，进一步包含编码报道基因的分离的核酸分子的独立部分。

72.根据权利要求71的检测试剂盒，其中所述报道基因编码β-半乳糖苷酶或荧光素酶.

73.根据权利要求62的检测试剂盒，其中编码所述第一检测蛋白的核苷酸序列被修饰以提高与所述第二检测蛋白的相互作用。

74.根据权利要求73的检测试剂盒，其中所述修饰包含采用编码相比于原始序列与所述第二检测蛋白具有更高亲和性的氨基酸序列的核苷酸序列替换所述第一检测蛋白C-末端区域的全部或部分核苷酸序列。

75.根据权利要求74的检测试剂盒，其中所述C-末端区域的核苷酸序列被编码AVPR2，AGTRLI，GRPR，F2PL1，CXCR2/IL-8B或CCR4的C-末端区域的全部或部分的核苷酸序列所替换。

76.根据权利要求65的检测试剂盒，其中所述跨膜受体是ADRB2AVPR2，HTR1A，CHRM2，CCR5，DRD2，OPRK或ADRA1A。