CN1894581B - 检测蛋白-蛋白相互作用的方法 - Google Patents

检测蛋白-蛋白相互作用的方法 Download PDF

Info

Publication number
CN1894581B
CN1894581B CN2004800248641A CN200480024864A CN1894581B CN 1894581 B CN1894581 B CN 1894581B CN 2004800248641 A CN2004800248641 A CN 2004800248641A CN 200480024864 A CN200480024864 A CN 200480024864A CN 1894581 B CN1894581 B CN 1894581B
Authority
CN
China
Prior art keywords
leu
ser
glu
albumen
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2004800248641A
Other languages
English (en)
Other versions
CN1894581A (zh
Inventor
K·J·李
R·阿谢尔
W·斯特拉波斯
G·巴尔内亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sentikin Holdings Ltd
Columbia University in the City of New York
Life Technologies Corp
Original Assignee
Columbia University in the City of New York
Life Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Columbia University in the City of New York, Life Technologies Inc filed Critical Columbia University in the City of New York
Publication of CN1894581A publication Critical patent/CN1894581A/zh
Application granted granted Critical
Publication of CN1894581B publication Critical patent/CN1894581B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6845Methods of identifying protein-protein interactions in protein mixtures
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1055Protein x Protein interaction, e.g. two hybrid selection
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/94Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving narcotics or drugs or pharmaceuticals, neurotransmitters or associated receptors
    • G01N33/9406Neurotransmitters
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/72Assays involving receptors, cell surface antigens or cell surface determinants for hormones
    • G01N2333/726G protein coupled receptor, e.g. TSHR-thyrotropin-receptor, LH/hCG receptor, FSH
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/10Screening for compounds of potential therapeutic value involving cells

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Urology & Nephrology (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Wood Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及一种用于确定是否一种检测化合物或化合物的混合物调节感兴趣的两种蛋白的之间相互作用的检测方法。确定过程可以通过利用两种重组分子,一个包含第一蛋白和用于蛋白水解分子的剪切位点,以及基因的激活剂。第二重组分子包括第二蛋白和蛋白水解分子。如果检测化合物结合至第一检测蛋白,启动反应而由此激活剂被剪切,并且激活报道基因。

Description

检测蛋白-蛋白相互作用的方法
技术领域
本发明涉及用于确定目标分子之间相互作用的方法。更具体的,其涉及确定一种被称为检测化合物的特定物质能否调节两种或更多特异的目标蛋白的相互作用,其是通过确定一种在细胞中的报道基因的活性是否受调节或其缺失而导致活化或失活。利用转化的或转染的细胞进行确定,如同转化或转染他们所用的试剂一样其也是本发明的特征之一。
发明背景
蛋白/蛋白相互作用的研究是很热门的领域,例如通过鉴别用于受体的配体。甚至当给定受体的一种配体或配体是已知的时候,仍有必要研究更有效或更具选择性的配体。GPCRs在这里将作为非穷举的被这样研究的蛋白的例子而进行讨论。
G-蛋白偶联受体,或者下文中的"GPCRs",是已知的人类细胞表面受体最大的种类。在被GPCRs识别的配体之中有激素,神经递质,多肽,糖蛋白,脂质,核苷酸和离子。他们也作为光线,气味,外激素,和味道的受体。在这些各种各样的角色中,也许不会惊奇它们可以是紧张度研究的主体,以试图在鉴别各种条件下有用的药物。成功率是显著的。事实上,Howard等在Trends Pharmacol.Sci.,22:132-140(2001)评价说有超过50%的商品化药物是这样的受体。这里所用的"GPCRs",指的是任何GPCR受体超家族成员,其特征在于七个跨膜结构域(7TM)的构建子。这些受体的例子包括但不限于,种类A或者"视紫红质样"受体;种类B或者"分泌激素样"受体;种类C或者"代谢型谷氨酸样"受体;卷曲的和平滑的相关受体;粘附受体家族或者EGF-7TM/LNB-7TM受体;脂联素受体以及相关受体;和化学感觉受体包括味觉,嗅觉,鼻骨的和外激素受体。例如,在人类中
GPCR超家族包括但不限于那些由Vassilatis,等,在Proc.Natl.Acad.Sci.USA,100:4903-4908(2003)公开的受体分子;Takeda,等,FEBS Letters,520:97-101(2002);Fredricksson等,Mol.Pharmacol.,63:1256-1272(2003);Glusman等,Genome Res.,11:685-702(2001);以及Zozulya等,GenomeBiol.,2:0018.1-0018.12(2001),所有这些在此引入作为参考。
GPCRs功能的作用机制已经在某种程度上得以阐明。简言之,当一种GPCR结合一种配体时,构型改变的结果,刺激一种级联反应导致细胞生理学的变化。据认为GPCRs通过调节细胞内,杂三聚体的鸟嘌呤核苷酸结合蛋白,或者"G蛋白"的活性来转换信号。配体和受体复合物刺激鸟嘌呤核苷酸变化并且将G蛋白杂三聚体分离成a和βγ亚基。
GTP结合的a亚基和βγ二聚体都能调节各种细胞的效应蛋白,包括腺苷酰环化酶和磷脂酶C(PLC)。在传统的细胞基础上的
GPCRs检测中,受体活性通过测量一种G-蛋白调节效应通路的输出而被监控,例如由腺苷酰环化酶产生的cAMP的积累,或者由PLC活性刺激的细胞内钙的释放。
传统的G-蛋白基础上的信号传导检测受两个主要因素的影响很难向某些目标发展。
第一,不同的GPCRs与不同的G蛋白调控的信号传导通路相偶联,而且G-蛋白基础上的检测取决于认识目标受体的特异性G-蛋白,或要求细胞系统的操纵,以迫使目标受体偶联至特异的效应或通路。第二,所有的细胞表达大量的内源GPCRs,以及其他信号因子。结果,被检测的效应子通路可能是被除目标GPCR之外的其他内部分子所调节,可能导致假的结果。
[00081G-蛋白活性的调节并不是配体/GPCR结合的唯一结果。Luttrell等,J.Cell Sci.,115:455-465(2002),以及Ferguson,Pharmacol.Rev.,53:1-24(2001),这两者都引入作为参考,综述了其他导致GPCR信号终止的活动。这些终止过程防止细胞的过度刺激,并且实现细胞外的信号和相应细胞内通路的暂时连锁。
在拮抗剂结合到GPCR的情况下,GPCR分子C末端丝氨酸和苏氨酸残基被磷酸化。这种磷酸化是由GPCR激酶或者"GRK"家族引起的。拮抗剂复合的C末端磷酸化GPCRs与抑制蛋白家族成员相互作用,其“捕获”受体信号。这种结合抑制受体与G蛋白的偶联,因而将受体定为内在化目标,伴随着降解和/或回收。因此,配体与GPCR的结合可以被说成是"调节"GPCR和抑制蛋白之间的相互作用,因为配体与GPCR的结合导致抑制蛋白与GPCR的结合,从而调节它的活性。至此以后,无论采用“调节"或任何形式,其仅仅指的是本发明的两种蛋白的相互作用在检测化合物存在时与该化合物不存在时这两种蛋白相或作用比较而得出的变化。例如,检测化合物的存在可能加强或提高两种蛋白的相互作用,能检测在某种方面,方式或形式减弱它,抑制它或减少它。
这种背景信息导致检测GPCRs活化和抑制的方法的改变。这些方法涉及监控与抑制蛋白的相互作用。该方法的主要优势在于不需要了解G-蛋白通路。
Oakley,等,Assay Drug Dev.Technol.,1:21-30(2002)和U.S.专利Nos.5,891,646和6,110,693,在此引入作为参考,公开了检测方法,其检测细胞质中激活细胞表面受体的荧光标记的抑制蛋白分子的再分布。这些方法为了检测抑制蛋白的再定位和受体活性而对细胞图像分析的依赖程度很高。对本领域人员而言,这是一个涉及复杂过程的复合物。
涉及这些问题的各种其他的U.S.专利及专利申请已被登记。例如Bohn等人的U.S.专利No.6,528,271涉及用于筛选疼痛控制药物的筛选,其中检测了β-抑制蛋白的抑制剂。出版的U.S.专利申请,例如2004/0002119,2003/0157553,2003/0143626,和2002/0132327,全都公开了不同的涉及GPCRs的检测形式。出版的申请2002/0106379公开了一种随后例子中所用的构型;然而,它并没有教导或建议这里公开的本发明。
本发明的目的之一是研发一种更为简单的检测,其监控和/或确定特异蛋白/蛋白相互作用的调节,其中蛋白包括但不限于,膜结合蛋白,例如受体,尤其是GPCRs。这是如何实现的将在随后的例子中得以体现。
发明内容
因此,根据本发明,提供了一种用于确定是否检测化合物调节特异目标蛋白/蛋白相互作用的方法,其包括使所述化合物与已经用以下物质转化或转染的细胞接触:(a)核酸分子其包含,(i)编码所述第一检测蛋白的核苷酸序列,(ii)编码蛋白酶或蛋白酶片段的剪切位点的核苷酸序列,以及(iii)编码在所述细胞中激活报道基因的蛋白的核苷酸序列,和(b)核酸分子其包含,(i)编码在要被检测的所述检测化合物存在的情况下与所述第一检测蛋白相互作用的第二检测蛋白的核苷酸序列,以及(ii)编码对于所述剪切位点特异的蛋白酶或蛋白酶片段的核苷酸序列,并且确定所述报道基因的活性以确定是否所述化合物调节所述蛋白/蛋白的相互作用。
第一检测蛋白可以是膜结合蛋白,例如跨膜受体,特别是GPCR。具体的跨膜受体包括β2-肾上腺素受体(ADRB2),精氨酸血管加压素受体2(AVPR2),血清素受体1a(HTR1A),m2毒蕈碱性乙酰胆碱受体(CHRM2),趋化因子(C-C模序)受体5(CCR5),多巴胺D2受体(DRD2),卡巴阿片样物质受体(OPRK),或者ala-肾上腺素受体(ADRA1A),但是要理解的是在所有情况下本发明并不限于这些特异的实施例。例如,例诸胰岛素生长因子-1受体(IGF-1R),其为酪氨酸激酶,以及不是一般的膜结合的蛋白比如雌激素受体1(ESR1)和雌激素受体2(ESR2)的分子。蛋白酶或者蛋白酶片段可以是核内包涵体A蛋白酶的烟草蚀纹病毒。激活所述报道基因的蛋白可以是转录因子,例如tTA或GAL4。第二蛋白可以是抑制性蛋白,例如抑制蛋白。细胞可以是真核或原核的。报道基因可以是外源基因,例如β-半乳糖苷酶或荧光素酶.
编码所述第一检测蛋白的核苷酸序列可以被修饰以增强与第二检测蛋白的相互作用。这样的修饰包括但不限于采用编码相比原始序列与所述第二检测蛋白具有更高亲和性的氨基酸序列的核苷酸序列替换所述第一检测蛋白的C—末端区域的全部或部分核苷酸序列。例如,C-末端区域可以被编码AVPR2,AGTRLI,GRPR,F2RL1,CXCR2/IL-8b,CCR4或GRPR的C-末端区域的核苷酸序列替换。
该方法可以包含使多于一个的检测化合物与多个细胞样本接触,每个所述样本与一个或更多所述检测化合物相接触,其中每个所述细胞样本已经用前述核酸分子转化或转染,并且在所述多个所述样本中确定报道基因的活性从而确定是否任何所述的检测化合物调节特异的蛋白/蛋白相互作用。该方法可以包含使每种所述样本与一种检测化合物接触,每一种都与其他的不一样,或者包含使所述检测化合物的混合物与每种所述样本接触。
在另一实施方案中,提供了一种用于确定是否检测化合物调节一种或更多感兴趣的多种蛋白相互作用的方法,其包含使所述检测化合物与多个细胞样本接触,这些细胞中的每种已经采用如下物质转化或转染:(a)第一核酸分子,其包含,(i)编码所述第一检测蛋白的核苷酸序列,编码蛋白酶剪切位点的核苷酸序列,(ii)编码激活在所述细胞中激活报道基因的蛋白的核苷酸序列,和(b)第二核酸分子,其包含,(i)编码在感兴趣的将被检测的所述检测化合物存在的情况下与所述第一检测蛋白相互作用的第二检测蛋白的核苷酸序列,(ii)编码对于所述剪切位点特异的蛋白酶或蛋白酶的核苷酸序列,其中所述第一检测蛋白与在所述多个样本的每个中的其他第一检测蛋白不同,并且在一个或更多所述多个样本中确定所述报道基因的活性作为调节感兴趣的一个或更多蛋白相互作用的调节测定(结果)。
第二检测蛋白在每种样本中可以相同也可以不同。所有所述的样本可以放置于(combine)普通的容器中,并且每种样本包含不同的第一和第二检测蛋白。或者是,每种样本可以在不同的容器中检测。在给定的样本中的报道基因可以与其它样本中的报道基因不同。检测化合物的混合物可以包含或存在于生物样本中,例如脑髓液,尿液,血液,血清,脓液,腹水,滑液,组织提取物,或分泌物。
在另一实施方案中,提供了采用核酸分子转化或转染的重组细胞,该核酸分子包含,(a)核酸分子,其包含(i)编码所述第一检测蛋白的核苷酸序列,(ii)编码蛋白酶或蛋白酶片段所识别的剪切位点的核苷酸序列,以及(iii)编码在所述细胞中活化报道基因的蛋白的核苷酸序列,以及(b)核酸分子,其包含,(i)编码在要检测的所述检测化合物存在的情况下与第一所述检测蛋白相互作用的第二检测蛋白的核苷酸序列,以及(ii)编码对于所述剪切位点特异性的蛋白酶或蛋白酶片段的核苷酸序列。
所述核酸分子中的一个或两者能够稳定整合到所述细胞的基因组中。细胞也可以已经被所述报道基因转化或转染。第一检测蛋白可以是膜结合蛋白,例如跨膜受体,特别是GPCR。特别是跨膜受体包括ADRB2,AVPR2,HTR1A,CHRM2,CCR5,DRD2,OPRK,或ADRA1A。
蛋白酶或蛋白酶片段可以是烟草蚀纹病毒核内包涵体A蛋白酶。激活所述报道基因的蛋白可以是转录因子,例如tTA或GAL4。第二蛋白可以是抑制蛋白。细胞可以是真核或原核。报道基因可以是外源基因,例如β-半乳糖苷酶或荧光素酶。编码所述第一检测蛋白核苷酸序列可以被修饰以增强与所述第二检测蛋白的相互作用,例如通过采用编码相比于原始序列与所述第二检测蛋白具有更高亲和性的氨基酸序列的核苷酸序列替换所述第一检测蛋白C-末端区域的全部或部分核苷酸序列。C-末端区域可以被编码AVPR2,AGTRLI,GRPR,F2RL1,CXCR2/IL-8B,CCR4或GRPR的C-末端区域的核苷酸序列替换。
在另一实施方案中,提供了分离的核酸分子,其包含,(i)编码检测蛋白的核苷酸序列,(ii)编码用于蛋白酶或蛋白酶片段的剪切位点的核苷酸序列,以及(iii)编码在所述细胞中激活报道基因的蛋白的核苷酸序列。检测蛋白可以是膜结合蛋白,例如跨膜受体。跨膜蛋白的一个具体例子是GPCR。具体的跨膜受体包括ADRB2,AVPR2,HTR1A,CHRM2,CCR5,DRD2,OPRK,或ADRA1A。
蛋白酶或蛋白酶片段可以是烟草蚀纹病毒核内包涵体A蛋白酶。激活所述报道基因的蛋白可以是转录因子,例如tTA或GAL4。如上所述,本发明不能被视为仅仅限于这些具体的实施方案。
在另一实施方案中,提供了包含分离的核酸分子的表达载体,其包含,(i)编码检测蛋白的核苷酸序列,(ii)编码用于蛋白酶或蛋白酶片段的剪切位点的核苷酸序列,以及(iii)编码在所述细胞中激活报道基因的蛋白的核苷酸序列,并且其进而可被连接至一个启动子上。
在另一实施方案中,提供了分离的核酸分子,其包含,(i)编码在要被检测的检测化合物存在的情况下与另一种检测蛋白相互作用的检测蛋白的核苷酸序列,以及(ii)编码对于所述剪切位点特异性的蛋白酶或蛋白酶片段的核苷酸序列。检测蛋白可以是抑制蛋白,例如抑制蛋白。
还提供了包含分离的核酸分子的表达载体,其包含,(i)编码在要被检测的检测化合物存在的情况下与另一种检测蛋白相互作用的检测蛋白的核苷酸序列,以及(ii)编码对于所述剪切位点特异性的蛋白酶或蛋白酶片段的核苷酸序列,所述核酸进而可被连接至一个启动子。
另一实施方案包括由以下核酸分子表达的融合蛋白:
分离的核酸分子,其包含,(i)编码检测蛋白的核苷酸序列,(ii)编码用于蛋白酶或蛋白酶片段的剪切位点的核苷酸序列,以及(iii)编码在所述细胞中激活报道基因的蛋白的核苷酸序列,并且其进而可被连接至一个启动子;
或[0029]分离的核酸分子,其包含,(i)编码在要被检测的检测化合物存在的情况下与另一种检测蛋白相互作用的检测蛋白的核苷酸序列,以及(ii)编码对于所述剪切位点特异性的蛋白酶或蛋白酶片段的核苷酸序列。
在另一实施方案中,提供了用于测定是否检测化合物调节感兴趣的蛋白/蛋白相互作用的试剂盒,其包含分离的各部分:a)核酸分子,其包含编码所述第一检测蛋白的核苷酸序列,(i)编码用于蛋白酶或蛋白酶片段的剪切位点的核苷酸序列,(ii)编码在所述细胞中激活报道基因的蛋白的核苷酸序列,以及(b)核酸分子,其包含,(i)编码在要被检测的检测化合物存在的情况下与另一种检测蛋白相互作用的检测蛋白的核苷酸序列,以及(ii)编码对于所述剪切位点特异性的蛋白酶或蛋白酶片段的核苷酸序列,以及用于分别容纳每种(a)和(b)的容器装置。
第一检测蛋白可以是膜结合蛋白,例如跨膜受体。跨膜受体的具体类型可以是GPCR。具体的跨膜蛋白是GPCR。具体的跨膜受体包括ADRB2,AVPR2,HTR1A,CHRM2,CCR5,DRD2,OPRK,或ADRA1A。蛋白酶或蛋白酶的片段可以是烟草蚀纹病毒核内包涵体A蛋白酶。激活所述报道基因的蛋白可以是转录因子,例如tTA或GAL4。第二蛋白可以是抑制蛋白,例如抑制蛋白。试剂盒可进一步包含分离的编码报道基因的核酸分子的独立的部分。报道基因可以编码β-半乳糖苷酶或荧光素酶。编码所述第一检测蛋白的核苷酸序列可以被修饰以增强与所述第二检测蛋白的相互作用,例如通过采用编码相比于原始序列与所述第二检测蛋白具有更高亲和性的氨基酸序列的核苷酸序列替换所述第一检测蛋白C-末端区域的全部或部分核苷酸序列。所述C-末端区域核苷酸序列可以被编码AVPR2,AGTRLI,GRPR,F2RL1,CXCR2/IL-8B,CCR4,或GRPR的C-末端区域的核苷酸序列替换。
要考虑到这里所描述的任何方法或组合物可以被这里所描述的任何其它方法或组合物实现。单词“a”在权利要求或说明书中与术语“包含”连用时意味着“一个”,但是它也意味着“一个或更多”,“至少一个”以及“一个或多于一种”。
本发明的这些和其他实施方案结合下文中的说明书和相应的附图将被更好的领会。应该被理解的是,以下的说明书揭示了各种本发明的实施方案和大量具体的细节,其是通过说明而并非限制的方式给出。许多取代,修饰,添加和/或重排可以在不脱离本发明精神的情况下在本发明的范围内作出,因此本发明包括所有这样的替代,修饰,添加和/或重排。
附图说明
以下的附图形成了本说明书的一部分并且被包括以进一步展示本发明的特定方面。通过这些附图中的一个或更多与具体实施方案的详细说明相结合可以更好的理解本发明。
图I以图画的形式显示了本发明的概念基础,采用配体-受体结合作为一个例子。
图2a和2b显示了在根据本发明的检测中目标对激活剂和拮抗剂剂量依赖的应答。
图3显示了不同的目标和不同激活剂的剂量应答曲线。
图4描述了根据本发明采用D2多巴胺受体获得的结果。
图5a和5b示例了检测结果,该检测显示可以同时研究两种分子。
图6表明另一“多个”检测的结果,即,在其中有两种分子被同时研究。
[00411图7代表从检测EGFR活性的检测中获得的数据。
图8代表从根据本发明的检测中获得的数据,被设计成检测人I型干扰素受体的活性。
图9详细说明图7中的结果,显示被用于产生图7的细胞中的IFN-a剂量应答曲线。
图10显示补充试验的结果,其中采用不同的转录因子和不同的细胞系。
具体实施方式
本发明涉及方法,其用于确定是否感兴趣的物质调节第一检测蛋白,例如膜结合蛋白,象受体,例如跨膜受体,与第二检测蛋白,象抑制蛋白家族的成员之间的相互作用。该方法涉及用两个构建子共转化或共转染真核或原核细胞。第一构建子包括,一段序列,其编码(i)第一检测蛋白,例如跨膜受体,(ii)蛋白酶识别的剪切位点,以及(iii)编码激活报道基因的蛋白的序列。第二构建子包括,(i)编码与第一检测蛋白相互作用的被检测和/或被确定的第二检测蛋白的一段序列,以及(ii)编码充分作用于是第一构建子一部分的剪切位点的蛋白酶或蛋白酶片段的核苷酸序列。在特别优选的实施方案中,这些构建子被稳定整合入细胞中。
在图1中以图表示了本发明实施方案的特点。简言之,首先,采用标准技术将编码转录因子的DNA融合到编码第一检测蛋白的DNA中,例如要研究的跨膜受体分子。这种融合的实现包括在实验中采用不能被宿主细胞内源表达的蛋白酶识别和裂解位点。
编码这种第一融合蛋白的DNA被导入并且在依赖于被融合到第一检测蛋白(例如受体)的转录因子的启动子元件的控制下,被还包含报道基因序列的细胞表达。如果外源蛋白酶不存在,转录因子仍然维系在第一检测蛋白上并且不能进入核以刺激报道基因的表达。
重组技术也可以被用于生产第二融合。在所述的实施方案中,编码抑制蛋白家族成员的DNA被融合到编码外源蛋白酶的DNA分子上,结果在第二融合蛋白中包含第二检测蛋白,即抑制蛋白家族成员。
然后进行检测,其中第二融合蛋白与第一融合蛋白一起被表达,并且检测化合物与细胞接触,优选特异的时间长度。如果检测化合物调节两种检测蛋白的相互作用,例如通过刺激,提高或增强第一和第二检测蛋白的联系,这会导致转录因子的释放,其转而移动到核中,并且诱导报道基因的表达。报道基因的活性被检测。
在可替代的系统中,两种检测蛋白可以在缺乏检测化合物的情况下相互作用,并且检测化合物可以导致两种检测蛋白解离,减弱或抑制其相互作用。在这样的情况下,在检测化合物存在时自由的有功能的活性转录因子的水平会降低,导致蛋白水解的下降,并且可检测到报道基因活性的降低。
在所述的实施方案中,为第二检测蛋白的抑制蛋白,在激活剂存在的情况下结合至受体;然而,要理解的是由于受体仅是类型的蛋白,检测不依赖于受体分子的使用,也不取决于仅仅结合能被涉及的相互作用结合的激活剂。虽然明显感兴趣的跨膜蛋白,但是任何蛋白都将是可行的。而且,结合到受体的激活剂不是能被检测的结合的唯一类型。人们可以确定激活剂,以及确定根据本发明的不同拮抗剂和/或激活剂的相对强度。
本发明的其他细节包括制造和使用其中主要物质的具体方法和技术,将在下文中描述。
I.表达构建子和转化
术语"载体"被用来指载体核酸分子,在其中能够插入核苷酸序列以便将其导入能被复制的细胞。核苷酸序列可以是“外源”的,即意味着其对于载体被导入的细胞来说是外来的或与细胞中的序列同源的但是在宿主细胞核酸的位置通常并没有发现该序列。载体包括质粒,粘粒,病毒(噬菌体,动物病毒和植物病毒),以及人工染色体(例如YACs)。本领域技术人员完全能够通过标准的重组技术构建载体(例如,参见Maniatis等,Molecular Cloning,A Laboratory Manual(ColdSpring Harbor,1990)以及Ausubel,等,1994,Current Protocols InMolecular Biology(John Wiley & Sons,1996),两者都引入作为参考)。
术语"表达载体"指的是任何类型的遗传构建子,其包含编码能够翻译的RNA的核酸。在某些情况下,RNA分子随后被翻译成蛋白,多肽或肽。在其他情况下,这些序列不被翻译,例如,反义分子或核酶的产物。表达载体可以包含多个“控制序列”,其指的是在特定的宿主细胞中可操作的连接编码序列转录和可能的翻译所必需的核酸序列。除了管理转录和翻译的控制序列之外,载体和表达载体可以包含行使其它功能的核酸序列并在下文中描述。
在特定实施方案中,质粒载体被设计用于克隆和基因传递。一般地,包含取自能与宿主细胞相容物种中的复制子和控制序列的质粒载体被用于与这些宿主结合。载体通常携带了一个复制位点,以及能够在转化细胞中提供表型选择的标记序列。在一个非限制性的例子中,E.Coli经常采用pBR322的衍生物转化,其为源自E.coli物种的质粒。pBR322含氨苄青霉素和四环素抗性的基因并且因而提供了识别转化细胞的简易方法。pBR质粒,或其他微生物质粒或噬菌体必须还要包含,或被修饰以包含,例如,能被微生物有机体利用以表达其自身蛋白的启动子。
此外,包含能与宿主微生物相容的复制子和控制序列的噬菌体载体可被用作转化载体与这些宿主结合。例如,噬菌体λGEMTM-11可用于制造重组噬菌体载体,其能被用于转化宿主细胞,例如,E.coli LE392。
细菌宿主细胞,例如,包含表达载体的E.coli,生长在任何合适的培养基,例如,LB。在特定载体中的重组蛋白的表达可以通过使宿主细胞与特定启动子特异的试剂相接触,例如通过转换到培养基中添加IPTG或通过在更高温度中间断而被诱导,这是本领域人员可以理解的。在培养菌株更长一段时间后,一般为2至24小时,通过离心收集细胞并清洗以去除残余的培养基。
[0058许多原核载体也可被用于转化真核宿主细胞。然而,理想的是选择已经被修饰从而在真核宿主细胞中表达特异性目标蛋白的载体。已经被设计用于在这样的细胞中调节和/或更高水平表达的表达系统。例如,昆虫细胞/杆状病毒系统可以产生高水平的异源核酸片段的蛋白表达,这些见于U.S.专利5,871,986和4,879,236,两者在此引入作为参考,其可以如下商品名买到,例如,来自2.0和来自的BACPACKTM BACULOVIRUS表达系统。
表达系统的其他例子包括的COMPLETECONTROLTM可诱导的哺乳动物表达系统,其包含合成蜕皮激素-可诱导的受体,或者它的pET表达系统,E.coli表达系统。另一种可诱导的表达系统的例子是来自其携带T-REXTM(四环素调节的表达)系统,采用全长CMV启动子的可诱导哺乳动物表达系统。
Figure S04824864120060314D000126
还提供酵母表达系统名称为Pichia methanolica表达系统,其被设计成在嗜甲醇酵母Pichia methanolica中高表达生产重组蛋白。本领域技术人员知道如何表达载体,例如表达构建子,以生产核酸序列或其同源的多肽,蛋白,或肽。
调节信号
构建子可以包含附加的5′和/或3′元件,例如启动子,polyA序列等等。元件可以源自宿主细胞,即与宿主同源,或者它们可以源自不同的来源即异源的。
"启动子"是一段核酸序列的控制序列,其控制转录起始和速度。它可包含调节蛋白的分子可以结合的遗传元件,例如RNA聚合酶和其它转录因子,以起始核酸序列的特异转录。术语“可操作地位于”,“可操作地连接”,“控制下”和“转录控制下”意味着启动子相对于核酸序列是处于正确的功能位置和/或方向,从而控制该序列的转录起始和/或表达。
启动子一般包含位于RNA合成起始位点的序列。这种情况的最佳例子是TATA盒,但是在某些缺乏TATA盒的启动子中,例如,哺乳动物末端脱氧核苷酸转移酶基因的启动子和SV40后期基因的启动子,覆盖起始位点分离元件,以帮助固定起始位置。附加的启动子元件调节转录起始的频率。典型地,这些元件位于起始位点上游的30-110碱基区域,虽然许多启动子已被显示包含位于起始位点下游的功能元件。为了携带在启动子“控制下”的编码序列,将转录阅读框架的转录起始位点的5‘端定位于所选择启动子的“下游”(即3’端)。“上游”启动子刺激DNA的转录和所编码RNA的表达。[0063]启动子元件之间的间隔通常是可变的,因此当元件被颠倒或彼此移动时启动子的功能被保持。在tk启动子中,启动子元件之间的间隔在活性开始下降之前可以提高到50碱基。取决于启动子,表现出单个元件能够协同或单独激活转录。启动子可以或不可以与“增强子”结合,增强子指的是涉及核酸序列转录活性的顺式作用调节序列。
一个启动子可以是一个天然与核酸分子结合的,也可以是通过分离位于编码片段和/或外显子上游的5’非编码序列。这样的一个启动子可以被称为“内源”的。相似地,一个增强子可以是一个天然与核酸分子结合的,位于该序列的上游或下游。可替换地,通过将编码核酸片段定位在重组或异源启动子的控制之下可获得一定的优势,其指的启动子是指在其正常的天然环境中没有与核酸结合。重组或异源的增强子也指的是正常的在其天然环境中没有与核酸结合的增强子。这样的启动子或增强子可以包括其它基因的启动子或增强子,以及从其他病毒,原核或真核细胞分离的启动子或增强子,和非“天然产生的”启动子或增强子,即包含不同转录调节区域和/或改变表达的突变的不同元件。例如,最常用于重组DNA构建子中的启动子包括β-内酰胺酶(青霉素酶),乳糖和色氨酸(trp)启动子系统。除了产生合成的启动子和增强子核酸序列之外,序列可以采用重组克隆和/或核酸扩增技术产生,包括PCRTM,结合这里公开的组合物(参见U.S.专利Nos.4,683,202和5,928,906,在此引入作为参考)。而且,设计成在非核细胞器官例如线粒体,叶绿体,及其类似物中直接转录和/或表达序列的控制序列也可以被采用。
天然地,采用一个能在选择用于表达的细胞器官,细胞类型,组织,器官,或有机体中有效直接表达DNA片段的启动子和/或增强子将是重要的。分子生物学领域的技术人员一般都知道采用启动子,增强子,和重组细胞类型用于蛋白表达,(参见,例如Sambrook,等,1989,在此引入作为参考)。所采用的启动子可以是组成性的,组织特异的,可诱导的,和/或在适宜条件下能够高表达被导入的DNA片段,这样在重组蛋白和/或肽的大规模生产中有优势。启动子可以是异源的或内源的。
此外,任何启动子/增强子组合(根据,例如,真核启动子数据基础库EPDB,www.epd.isb-sib.ch/)也可用于操纵表达。利用T3,T7或SP6细胞质表达系统是另一种可行的实施方案。如果提供了合适的细菌聚合酶,真核细胞可以支持从特定细菌启动子所进行细胞质的转录,作为释放复合物的一部分或作为附加的遗传表达构建子。
对于编码序列有效地翻译也可以要求一个特异的起始信号。这些信号包括ATG启动密码子或邻近序列。包括外源翻译控制信号ATG启动密码子,可能需要被提供。本领域的人员将很容易确定这一点并提供必需的信号。公知的是启动密码子必须“在框架内”处于预定的编码序列的框架中以确保整个插入子的翻译。外源翻译控制信号和启动密码子既可以是天然的也可以是合成的。表达的效率可以通过包含合适的转录增强子元件而被增强。
在本发明的特定实施方案中,内源核糖体进入位点(IRES)元件被用于产生多基因或多顺反子的信息。IRES元件能够绕过5′甲基化帽子依赖翻译的核糖体扫描模型并在内部位点开始翻译(Pelletier和Sonenberg,Nature,334:320-325(1988))。来自细小核糖核酸病毒家族的两个成员的IRES元件(脊髓灰质炎病毒和脑心肌炎病毒)已经被公开(上述的Pelletier和Sonenberg),以及来自哺乳动物信息的IRES(Macejak和Sarnow,Nature,353:90-94(1991))1991)。IRES元件可以被连接至异源的开放阅读框架。多个开放阅读框架可以被一起转录,每个由一个IRES分离开,产生多顺反子信息。通过IRES元件的特性,每个开放阅读框架能靠近核糖体以便有效翻译。采用单个启动子/增强子转录单个信息就可以有效表达多个基因(参见U.S.专利Nos.5,925,565和5,935,819,每个在此引入作为参考)。
其它载体序列元件
载体可以包括多个克隆位点(MCS),其为包含多个限制性酶位点的核酸区,其任何一个能被用于与标准的重组技术结合以消化载体(参见,例如,Carbonelli,等,FEMS Microbiol.Lett.,172(1):75-82(1999),Levenson,等,Hum.Gene Ther.9(8):1233-1236(1998),以及Cocea,Biotechniques,23(5):814-816(1997)),在此引入作为参考)“限制性酶消化”指的是用一种仅仅作用于核酸分子中特异位置的酶来催化核酸分子的剪切。许多这样的限制性酶可以从商品中获得。本领域技术人员普遍理解这样酶的利用。通常,一个载体采用限制性酶在MCS内剪切从而线性化或片断化以使外源序列被连接到载体。"连接"指的是在两个可以是或不是连续的核酸片段之间形成磷酸二酯键的过程。涉及限制性酶和连接反应的技术对于重组领域技术人员来说是公知的。
大多数转录的真核RNA分子要进行RNA剪接以从原始转录本中去除内含子。含有基因组真核序列的载体可能需要供体和/或受体剪接位点以确保用于蛋白表达的转录本的正确过程(参见,例如,Chandler等,1997,在此引入作为参考)。
本发明的载体或构建子一般包含至少一个终止信号。一个"终止信号"或"终止子"包含参与通过RNA聚合酶的RNA转录本特异终止的DNA序列。这样,在特定实施方案中设计了结束RNA转录本生产的终止信号。在体内一个终止子可能是必需的以达到理想的信号水平。
在真核系统中,终止子区域还可以包含允许新转录本位点特异剪切的特异DNA序列以便于暴露聚腺苷酸化位点。其指示一个特异的内源聚合酶一段大约200腺苷残基(polyA)的序列加至转录本的3′端。采用这种聚A尾巴修饰的RNA分子更加稳定并且被更有效地翻译。因此,在涉及真核的其他实施方案中,优选的是终止子包含一个用于RNA剪切的信号,更优选的是终止子信号提高了聚腺苷酸化的信息。终止子和/或聚腺苷酸化位点元件可服务于增强信息水平并使从阅读框通读而进入其它序列最小化。
设计用于本发明的终止子包括任何这里描述的或本领域已知的转录本的终止子,包括但不限于,例如,基因的终止序列,例如牛生长激素终止子,病毒终止序列,例如SV40终止子。在特定实施方案中,终止信号可以是可转录的或可翻译序列的缺失,例如一个由于基因截断导致的不可转录或不可翻译的序列。
在表达中,特别是真核表达,其典型地包括一个聚腺苷酸化信号以有效促进转录本的正确聚腺苷酸化。聚腺苷酸化信号的特性不被认为是本发明成功操作的关键并可使用任何这样的序列。优选的实施方案包括SV40聚腺苷酸化信号或牛生长激素聚腺苷酸化信号,两者都是方便的,容易得到的,并且已知在各种目标细胞中都具有良好功能。聚腺苷酸化可以提高转录本的稳定性或促进细胞质运输。
为了在宿主细胞中增殖载体,可包括一个或更多复制位点(经常被称为"ori"),其为复制被起始的特异核苷酸序列。可替代地,如果宿主细胞是酵母可采用一个自主复制序列(ARS)。
转化方法
用于本发明的合适的核酸递送方法被认为包括事实上任何这里所描述的或本领域公知的可将核酸分子(例如DNA)导入细胞中的方法。这样的方法包括,但不限于,直接分送DNA例如通过来自体内(ex vivo)的转染(Wilson等,Science,244:1344-1346(1989),(Nabel等,Science,244:1342-1344(1989),并通过注射(U.S.专利Nos.5,994,624,5,981,274,5,945,100,5,780,448,5,736,524,5,702,932,5,656,610,5,589,466和5,580,859每个都在此引入作为参考),包括微注射(Harlan和Weintraub,J.Cell Biol.,101(3):1094-1099(1985);U.S.专利No.5,789,215,在此引入作为参考);通过电穿孔(U.S.专利No.5,384,253,在此引入作为参考;Tur-Kaspa等,Mol.Cell Biol.,6:716-718(1986);Potter等,Proc.Natl.Acad.Sci.USA,81:7161-7165(1984);通过磷酸钙沉淀(Graham和Van Der Eb,Virology,52:456-467(1973);Chen和Okayama,Mol.CellBiol.,7(8):2745-2752(1987);Rippe等,Mol.CellBiol.,10:689-695(1990);通过采用DEAE-葡聚糖随后采用聚乙二醇(Gopal,Mol.Cell Biol.,5:1188-190(1985);通过直接声波装载(Fechheimer,等,Proc.Natl.Acad.Sci.USA,89(17):8463-8467(1987);通过脂质体介导的转染(Nicolau和Sene,Biochem.&Biophys.Acta.,721:185-190(1982);Fraley等,Proc.Natl.Acad.Sci.USA,76:3348-3352(1979);Nicolau,等,Meth.Enzym.,149:157-176(1987);Wong,等,基因,10:879-894(1980);Kaneda等,Science,243:375-378(1989);Kato等,J.Biol.Chem.,266:3361-3364(1991)和受体介导的转染(Wu和Wu,J.Biol.Chem.,262:4429-4432(1987);Wu和Wu,1988);通过PEG-介导的原生质体转化(Omirulleh,等,PlantMol.Biol.,21(3):415-428(1987);U.S.专利Nos.4,684,611和4,952,500,在此引入作为参考);通过干燥/抑制介导的DNA摄取(Potrykus等,Mol.Gen.Genet.,199(2):169-177(1985),以及任何这样方法的结合。
II.检测系统的组成
对于这里所描述的方法,作为本发明特征的产品具有优选的实施方案。例如,在“三部分构建子”中,即包含编码检测蛋白,剪切位点,和活化剂蛋白的序列,检测蛋白优选膜结合蛋白,例如跨膜受体,例如,GPCR家族的成员。这些序列可以被修饰以便它们编码的蛋白的C末端具有与第二蛋白更好和更强的相互作用。修饰可以包括,例如,用编码AVPR2,AGTRLI,GRPR,F2PLI,CCR4,CXCR2/IL-8,CCR4,或GRPR的C末端编码区域置换例如GPCR检测蛋白编码序列的C-末端,,所有这些如前定义。
激活报道基因的蛋白可以是在核内作用的蛋白,就像转录因子(例如tTA,GAL4等),或者它可以是产生级联反应的分子,导致通过另蛋白的细胞核内反应。本领域人员很熟悉这样的级联反应。
第二构建子,如上所述,包括编码与第一蛋白相互作用的蛋白的区域,导致一些可检测的现象。该蛋白可以是活化剂,抑制剂或,更多,通常地,第一蛋白的“调节剂”。抑制蛋白家族成员是优选的,特别是在第一蛋白是GPCR时,但是也可以采用其他蛋白编码序列,特别是在第一蛋白不是GPCR时。这些两部分构建子的第二部分编码蛋白酶,或蛋白酶的片段,其用于从由第一构建子编码的融合蛋白中去除活化分子。
然而,这些优选的实施方案如随后要讨论的补充实施方案一样并不是限制本发明。
宿主细胞
这里所用的术语“细胞”,“细胞系”和“细胞培养物”可以相互变化使用。所有这些术语也包括它们的后代,任何以及所有随后的传代。要理解的是后代可能因为计划或偶然的突变而不相同。宿主细胞一般已经被工程化以表达可筛选的或可选择的标记,其被随着第一检测蛋白,作为融合蛋白一部分的转录因子激活。
在表达异源的核酸序列的内容中,"宿主细胞"指的是能够复制载体和/或表达由载体所编码的异源基因的原核或真核细胞。当宿主细胞用核酸分子"转染"或"转化"时,它们被称为"重组"细胞或宿主细胞,例如,一种被外源核酸序列,例如载体所引入的细胞。因此,重组细胞是可以与不包含被引入重组核酸的天然发生细胞相区别的。
大量的细胞系和培养物可被用作宿主细胞,作为它们可以从American Type Culture Collection(ATCC)中获得,其为获得活培养物和遗传材料的机构(www.atcc.org)。本领域人员可以根据载体的主链和预期的结果来确定合适的宿主。例如质粒或粘粒,可以被引入原核宿主细胞用于复制许多载体。可得到用于载体复制和/或表达的细胞类型包括但不限于,细菌,例如E.coli(例如,E.coli菌株RR1,E.coli LE392,E.colB,E.coli X1776(ATCC No.31537)以及E.coliW3110(F-,lambda-,prototrophic,ATCC No.273325),DH5α,JM109,和KC8,杆菌例如枯草芽孢杆菌;以及其它肠杆菌例如鼠伤寒沙门氏菌,粘质沙雷菌(Serratia rnarcescens),各种假单胞杆菌属种类,以及各种商业可获得的细菌宿主例如 Competent细胞和SOLOPACKTMGold细胞(STRATAGENE
Figure S04824864120060314D00019113411QIETU
 La Jolla)。在特定实施方案中,细菌细胞例如E.coli LE392被特别设计作为噬菌体病毒的宿主细胞。
用于复制和/或表达载体的真核宿主细胞的例子包括,但不限于,HeLa,NIH3T3,Jurkat,293,COS,CHO,Saos,和PC12。来自各种细胞类型和有机体的宿主细胞是可获得的并且对本领域人员是已知的。相似的,病毒载体可被用于与真核或原核宿主细胞相结合,尤其是能够用于载体的复制或表达的细胞。
检测蛋白
本发明考虑任何两种相互作用是已知的或猜测的蛋白。蛋白将作为融合蛋白存在,第一检测蛋白融合到一个转录因子,而第二检测蛋白融合到识别位于第一检测蛋白的剪切位点的蛋白酶上,该位点的剪切导致转录因子释放。对于检测蛋白/融合子的唯一要求是(a)第一检测蛋白在剪切前不能定位于核,并且(b)在与第二检测蛋白融合以及第一检测蛋白与第二检测蛋白结合之后该蛋白酶都要维持活性。
对应于第一构建子,第一检测蛋白可以是,例如,天然膜结合蛋白,或者是通过标准的技术被工程化后成为膜结合的。第一检测蛋白可以是,例如,跨膜受体,例如任何的GPCRs,或感兴趣的任何跨膜受体,包括,但不限于,酪氨酸激酶受体,丝氨酸苏氨酸激酶受体,细胞因子受体等等。而且,公知的是蛋白片段,将以与第一检测蛋白全长同样的方式起作用,第一检测蛋白这样的活性片段通过这里定义的蛋白来囊括。
对于本领域技术人员来说显然的是,本发明可以用于检测任何蛋白的相互作用,并且不限于检测膜结合受体,比如GPCRs。例如,其它种类跨膜受体的活性,包括但不限于:受体酪氨酸激酶(RTKs),例如IGF11R,例如表皮生长因子受体(EGFR),ErbB2/HER2/Neu或相关RTKs;丝氨酸/苏氨酸激酶受体,例如转化生长因子-beta(TGFβ),活化素,或骨形态发生蛋白(BMP)受体;细胞因子受体,例如干扰素家族受体,白细胞介素、促红细胞生成素、G-CSF、GM-CSF、肿瘤坏死因子(TNF)和瘦素leptin受体;以及其它受体,其不一定必须是膜结合的,例如雌激素受体1(ESR1),和雌激素受体2(ESR2)。在每种情况中,该方法涉及用调控包含感兴趣的受体的嵌合蛋白表达的经修饰了的受体构建子转染细胞,该构建子添加了蛋白酶剪切位点以及编码转录因子的核酸分子。调控由感兴趣的蛋白融合至识别和裂解上面所述位点的蛋白酶组成的嵌合蛋白的表达的第二构建子对细胞进行共转染,。在RTKs的情况下,例如EGFR,这种相互作用的蛋白可以由班汉蛋白或其片段的SH2组成(Src同源结构域2),例如磷脂酶C(PLC)或包含转化蛋白1(SHC1)的Src同源结构域2。在丝氨酸/苏氨酸激酶受体的情况下,例如TGFβ,活化素,BMP受体,这种相互作用蛋白可以是Smad蛋白或其片段。在细胞因子受体的情况下,例如干扰素-α/β或干扰素-γgamma受体,这种相互作用蛋白可以是信号转导子和转录活化子(STAT)蛋白,例如,但不限于,Statl,Stat2;Janus激酶(JAK)蛋白Jak1,Jak2或Tyk2或其片段。在每种情况中,转染细胞包含一个被融合至受体的转录因子所调节的报道基因。然后,检测通过用检测化合物处理转染细胞一定的时间并且在检测时期结束时检测报道基因的活性而得以进行。如果检测化合物激活感兴趣的受体,感兴趣的受体和相互作用蛋白之间的相互作用被刺激,导致蛋白酶位点的剪切和融合的转录因子的释放,其作为报道基因活性的提高转而可得到检测。
其它可能的蛋白对包括抗体-配体,酶-底物二聚蛋白,信号级联转导的成员,以及本领域公知的其他蛋白对。
报道基因
激活报道基因的蛋白可以是对基因具有影响的任何蛋白,其表达或缺乏会导致可检测的信号。典型的蛋白报道基因包括酶,例如氯霉素乙酰转移酶(CAT),β-葡糖醛酸酶(GUS)或β-半乳糖苷酶。也考虑荧光素和化学发光蛋白例如绿色荧光蛋白,红色荧光蛋白,蓝绿色荧光蛋白,荧光素酶,β内酰胺酶,以及碱性磷酸酶。
转录因子和阻抑蛋白
根据本发明,转录因子被用于激活在工程化宿主细胞中的报道基因的表达。转录因子典型的根据它们的DNA结合区域来分类,一般为(a)锌指,(b)螺旋-拐弯-螺旋,(c)亮氨酸拉链,(d)螺旋-圈-螺旋,或(e)高度可变基团。转录因子的活化结构域与转录装置的元件(RNA聚合酶)以及其它调节蛋白相互作用,因此影响DNA结合的效率。
Rel/核因子κB(NF-κB)和激活因子-1(AP-1)是最常被研究的转录因子家族。它们被鉴定为信号转导通路重要的成员,会导致病理结果,例如炎症和肿瘤发生。其它转录因子家族包括热休克/E2F家族,POU家族和ATF家族。具体的转录因子,例如tTA和GAL4,被考虑用在本发明中。
虽然转录因子是一类可以利用的分子,检测也可以被修饰以接受采用转录抑制分子,其中可检测信号是信号发生器的下调节,或甚至是细胞死亡。
蛋白酶和剪切位点
蛋白酶是特征为在特定位点剪切其他蛋白的酶。Ser/Thr蛋白酶家族,在丝氨酸和苏氨酸残基剪切。其它蛋白酶包括半胱氨酸或巯基蛋白酶,天冬氨酸蛋白酶,金属蛋白酶,氨基肽酶,双&三肽酶,羧基肽酶,以及肽基肽酶。这些物质的选择留给本领域技术人员并且特定的需要并不局限于在这里描述的这些分子。公知的是酶具有催化区域并且这些可以被用来替代全长的蛋白酶。这些也包括在本发明中。一个具体实施方案是烟草蚀纹病毒核内包涵体A蛋白酶,或其活性片段。也可以采用其他用于蛋白酶的特异剪切位点,这对于本领域人员是显而易见的。
检测蛋白的修饰
在此检测中,第一检测蛋白可以被修饰以增强与相互作用蛋白的结合。例如,已知的是特定的GPCRs在配体的刺激下能更稳定或更具亲和性地结合抑制蛋白并且这种增强的相互作用被独立的介导,例如,C-末端的丝氨酸和苏氨酸残基簇(Oakley等,J.Biol.Chem.,274:32248-32257,1999和Oakley,等,J.Biol.Chem.,276:19452-19460,2001)。采用这作为例子,清楚的是受体编码序列本身可以被修饰,以便提高膜结合蛋白的亲和性,例如受体与其结合的蛋白。这样修饰的例子是对膜结合蛋白C-末端区域的修饰,例如,受体,例如如上所描述的那些,其包括用相应的与结合蛋白具有更高亲和性但是不影响受体功能的另一种受体的区域替换其一部分。在前的例子16和20,显示了本发明这种特征的实施方案。
此外,第二检测蛋白可以被修饰以增强其与第一检测蛋白的相互作用。例如,检测可以掺入点突变的、截断的或其它变体的第二检测蛋白,例如,已知的与激活剂-偶联的GPCRs结合更稳定的或在磷酸化非依赖方式中的抑制蛋白(Kovoor,等,J.Biol.Chem.,274:6831-6834,1999)。
III.检测方式
如上所述,本发明在一个实施方案中提供了一个直接的方法去检测当表达在一个相同的细胞中时两种蛋白的相互作用。一个第一构建子,如上所述,包含编码第一蛋白的序列,其连接至一个编码用于蛋白酶或蛋白酶片段的剪切位点的序列,该序列本身连接在编码报道基因激活子的序列。采用"连接着"指的是所描述的序列被融合以产生单一的,完整的开放阅读框架,其可以被翻译成包含所有元件的单一多肽的序列。这些可以是,但不必须是,被可以编码或不编码附加蛋白或肽的附加核苷酸序列分离开。插入重组细胞中的第二构建子也在上文中被描述了,即它既包含编码第二蛋白的序列也包含编码蛋白酶或蛋白酶片段的序列。总而言之,这些元件在与能够影响所寻找的目标蛋白相互作用的待选试剂结合时构成了基本的检测方式。
然而,本发明也用于检测多于膜结合蛋白,例如受体,同时采用不同的报道基因,每被一个蛋白激活,例如这里所描述的蛋白种类。例如,这可以通过采用不同的受体构建子和不同的报道基因转染细胞的混合而实现,或者通过将不同的转录因子融合至每个检测受体,并且采用检测化合物检测每个报道基因的活性。例如,它可以是确定是否感兴趣的分子激活第一受体并还可以确定作为与第二受体相互作用的结果的副效应是否是预期的。在这样的情况中,例如,采用编码第一受体和第一报道子的第一细胞系,例如lacZ,以及编码第二受体和第二报道子的第二细胞系,例如GFP。这样系统的优选实施方案见于实施例17和18。人们可以混合这两种细胞系,加入感兴趣的化合物,并寻找对一个具有正效应而对另一个没有效应的物质。
要知道的是本发明既涉及检查的是相互作用检测蛋白的单一对的方法,但是更为优选的是,其也可以指的是这里的采用“多个”检测的方法。这样的检测可以各种方法进行,但是在所有的情况下,多于一对的检测蛋白被同时检测。这可以被实现,例如,通过提供多于一个细胞样本,每种都已经被转化或转染,以检测每种的蛋白相互作用对。不同的转化细胞可以在一个容器中结合并被同时检测,或者将每种不同类型的转化置于不同的孔中,然后检测。
这里所描述的用于多个检测的细胞可以是,但不必须是相同的。类似地,在每种样本中所采用的报道子系统可以是,但不必须是相同的。在样本或多个样本被置入容器中后,例如微量检测板的孔中,抗(against)容器中所产生的多个蛋白相互作用一种或多种化合物可以被筛选。
构建子所表达的融合蛋白也是本发明的一个特征。对于本领域人员来说本发明的其它特征很清楚包括,能鉴别融合蛋白以及用于确定蛋白存在的检测基础上的各种蛋白的抗体,以及杂交检测,例如基于PCR(确定基因的表达)的检测。
III.试剂盒
这里所描述的任何组合物都将包含在试剂盒中。这样,试剂盒将包含处于合适包装方式的本发明的载体或细胞,以及根据本发明所采用的任何附加试剂。
试剂盒可以包含合适的整数倍的本发明的组合物。试剂盒的成分可以为液体的或冻干的形式包装起来。试剂盒的包装中一般包括至少一个玻璃瓶,试管,培养瓶,瓶子,注射器或其他容器方式,在其中可放置成分,并且优选地,合适的整数倍。在试剂盒中有多于一种成分时,试剂盒也一般会包含第二,第三或其他附加容器,使得附加成分可以单独放置。然而,各种成分的结合物可以放置在一个瓶子中。本发明的试剂盒还典型的包含用于容纳试剂容器的装置,以便用于商品销售。这样的容器可以包括注射或吹模塑料容器以便放置预定的瓶子。
当试剂盒的成分是以一种和/或更多液体溶液提供时,液体溶液是一种水溶液,特别优选无菌水溶液。然而,试剂盒的成分可以以干的粉末提供。当试剂和/或成分以干的粉末提供时,粉末可以通过合适的溶剂而重构成。预想的是溶剂可以以另一种包装方式提供。
IV.实施例
描述本发明的特异实施方案将见于以下实施例中,但本发明不限于此。
实施例1
一个融合构建子采用编码人β2肾上腺素受体的DNA而产生,编码人β2肾上腺素受体的DNA根据标准术语在这里及以后被称为"ADRB2"。它的核苷酸序列可以在GenBank中找到,其登记号为NM_000024(SEQ ID NO:1)。四环素控制的反式激活蛋白(transactivator)tTA,由Gossen等公开,Proc.Natl.Acad.Sci.USA,87:5547-5551(1992),引入作为参考及使用。一个编码烟草蚀纹病毒核内包涵体A蛋白酶识别和剪切位点的序列(由Parks等公开,Anal.Biochem.,216:413-417(1994),引入作为参考),被插入在融合编码基因中的这些序列之间。CMV启动子区域被置于ADRB2编码区域的上游,而一个poly A序列被置于tTA区域的下游。
融合构建子通过缺乏内源BamHI和BglII限制位点的ADRB2的第一产生形式而被制备。而且,内部终止密码子被唯一的BamHI位点替换。
采用重叠PCR做到这一点。详细来说,编码区域的5′部分采用如下序列扩增:
gattgaagatctgccttcttgctggc(SEQ ID NO:2),以及
gcagaacttggaagacctgc ggagtcc(SEQ ID NO:3),
而编码区域的3′部分采用如下序列扩增:
ggactccgca ggtcttccaa gttctgc(SEQ ID NO:4),以及
ttcggatcct agcagtgagt catttgt(SEQ ID NO:5)。
[001081PCR结果的产品具有27个核苷酸的重叠序列并且通过标准的琼脂糖凝胶电泳纯化。这些混合在一起,并采用SEQ ID NO:2,和SEQ ID NO:5扩增。
PCR也可以用于修饰tTA的编码区域以便内源开始密码子被置换为TEV NIa-Pro剪切位点。该剪切位点,由七个氨基酸序列ENLYFQS(SEQ ID NO:6)限定,是由Parks等教导的,Anal.Biochem.,216:413-417(1994),引入作为参考。第七个氨基酸已知是作为PI′位置,并且将它与其它氨基酸已知减小TEV NIa-Pro剪切效率的。见于Kapust等,Biochem.Biophys.Res.Commun..294:949-955(2002)。
产生了第七氨基酸变成Tyr和Leu的变体。这些导致与天然的高效率位点相比,中等的和低效率的剪切位点。
在两个步骤中将编码天然高效率位点的DNA序列加入tTA编码区域。简言之,通过以下序列进行PCR而使BamHI和XbaI限制位点被加入到tTA编码区域5′端而Xhol限制位点被加入到tTA区域3′端,:
ccggatcctc tagattagat aaaagtaaag tg(SEQ ID NO:7),以及
gactcgagct agcagtatcctcgcgccccc taccc(SEQ ID NO:8),
通过将具有如下序列:gagaacctgt acttccag(SEQ ID NO:9)的寡核苷酸连接在5′端,而在BamHI和XbaI位点之间加入TEV NIa-Pro剪切位点。
进行修饰以编码中等的和低效率剪切位点的DNA序列的PCR采用如下序列:
ggatccgaga acctgtacttccagtacaga tta(SEQ ID NO:10),以及
ctcgagagatcctcgcgccc cctacccacc(SEQ ID NO:11),而
用于ENLYFQY(SEQID NO:12),以及
ggatccgagaacctgtactt ccagctaaga tta(SEQ ID NO:13),以及
ctcgagagatcctcgcgccc cctacccacc(SEQ ID NO:11)而用于ENLYFQL(SEQ ID NO:14)。
这些PCR步骤还包括将一个BamHI限制位点引入编码每个剪切位点的序列中5′端,以及一个XhoI限制位点至tTA终止密码子的3′端。
这样修饰的ADRB2编码区域采用在编码区域中的核苷酸位置260使用Pst I以及BamHI消化。这个3′片段与具有TEV NIa-Pro剪切位点修饰的tTA的三个变体连接,其已被BamHI和Xhol消化,并且最终复合物被克隆进BlueScriptII,其已被PstI和Xhol消化。
再次通过PCR将NotI限制位点引至ADRB2编码区域的开始密码子中的5′端,其采用
gcggccgcca ccatgaacggtaccgaaggc cca(SEQ ID NO:15),以及
ctggtgggtggcccggtacc a(SEQ ID NO:16)。
通过NotI和PstI消化分离修饰的ADRB2编码区域5′片段并且连接至在之前已经被消化的ADRB2-TEV-NIa-Pro-剪切位点tTA融合蛋白的3′片段的每个构建子之中,以产生三个编码融合蛋白的全长构建子。
每个被NotI和XhoI消化的构建子,随后被插入到用NotI和Xhol消化的商业可得的表达载体pcDNA3中。
实施例2
第二构建子也可以被制造,通过将这里及以后被称为"β抑制蛋白2或ARRB2"(GenBank,NM_004313)(SEQ ID NO:17)的编码序列,被连接至TEV蛋白中的TEV NIa蛋白酶的催化结构域(即成熟NIa蛋白酶的氨基酸189—424,残基2040-2279)。为了做到这一点,编码ARRB2的DNA序列被修饰,以便在其5′端加入一个BamHI限制位点。而且,该序列被修饰以一个BamHI位点替换内源终止密码子。寡核苷酸
caggatcctctggaatgggggagaaacccg ggacc(SEQ ID NO:18),以及
ggatccgcagagttgatcat catagtcgtc(SEQID NO:19)被采用。PCR结果的产品被克隆进商业可得的载体pGEM-T EASY(Promega)。pGEM-TEASY载体的多克隆位点包括一个在ARRB2开始密码子5′的EcoRI位点。
TEV NIa-Pro编码区域随后被修饰以用BglII位点替换内源开始密码子,并且在3′端插入编码流行性感冒血凝素(hemagluttinin)表位YPYDVPDYA(SEQ ID NO:20)的序列,根据Kolodziej等,Meth.Enzvmol.,194:508-519(1991),之后为一个终止密码子和NotI限制位点。这通过PCR实现,采用:
agatctagct tgtttaaggg accacgtg(SEQ ID NO:21),以及
gcggccgctc aagcgtaatc tggaacatca tatgggtacg agtacaccaattcattcatg ag(SEQID NO:22).
结果,修饰了的ARRB2编码区域被EcoRI和BamHI消化,而修饰了的TEV编码区域被BglII和NotI剪切。两个片段被连接至商业可得的采用EcoRI和NotI消化的pcDNA3表达载体。
实施例3
将编码ADRB2-TEV-NIa-Pro剪切位点-tTA和ARRB2-TEV-NIa蛋白酶融合蛋白的质粒转染到HEK-293T细胞,并且进入为HEK-293T衍生物的"克隆41",其具有稳定整合的在tTA依赖的启动子控制之下的β-半乳糖苷酶基因。大约5x104细胞被放置在24孔板的每个孔中,用带有10%胎牛血清的,2mM L-谷氨酰胺,100units/ml青霉素,100μg/ml G4I8,和5μg/ml purimycin的DMEM培养基中培养。第二天细胞达到50%融合度,然后采用0.4μg质粒DNA,和2μlFμgene(一种合适的包含脂质体和其他材料转染试剂)转染。混合物在100μl DMEM培养基中混合,并且在加入细胞之前在室温下孵育15分钟。转染细胞在通过加入已知的受体拮抗剂进行检测之前孵育8-20小时,然后在药物加入后孵育16-24小时。
实施例4
细胞中β-半乳糖苷酶活性水平首先通过用产色的底物染色细胞而检测,即:“X-gal”,由MacGregor等,Somat.Cell Mol.Genet.,13:253-265(1987)教导,引入作为参考。培养后,细胞采用带有钙和镁的D-PBS清洗两次,在4%多聚甲醛中固定5分钟,随后再用D-PBS(含钙和镁)清洗两次,每次10分钟。固定了的细胞用含有钙和镁、5mM铁氰化钾,5mM亚铁氰化钾,2mM MgCl2,由储存在二甲基甲酰胺中的4%X-Gal中1:40稀释而制备的0.1%X-Gal的D-PBS孵育。
室温下反应在黑暗中被孵育3-4小时至过夜。去除底物溶液,采用mowiol封固介质(mounting medium)(10%mowiol,0.1%1.4-二氮杂双环[2.2.2]辛烷,24%甘油)将细胞封固在玻璃盖玻片下。
结果显示无论是单独采用ADRB2-TEV-NIa-Pro剪切位点-tTA质粒还是ARRB2-TEV-NIa蛋白酶质粒转染的细胞都不表达β-半乳糖苷酶。采用两种质粒转染的小部分细胞则表达β-半乳糖苷酶,可能是由于未刺激的ADRB2和ARRB2之间存在基底水平的相互作用。在采用10uM异丙基肾上腺素,或10uM肾上腺素(这两者均为ADRB2激活剂)处理细胞后,大约3-5倍更多的细胞表达报道基因。
当细胞采用ADRB2拮抗剂阿普洛尔(alprenolol)(10uM)预处理5分钟时,激活剂所引起的细胞中β-半乳糖苷酶表达的提高被阻断,而单独采用阿普洛尔处理不会引起明显的效果。
这些结果使人们可以将激活剂结合与GPCR刺激报道基因的转录活性相联系。
实施例5
为了更加精确的定量报道基因在细胞中的活性水平和使检测信号对背景最大化而进行了一系列的试验。这通过采用商业可得的针对β-半乳糖苷酶的化学发光检测进行报道基因诱导水平的检测而实现。克隆41细胞用前述的包含高,中或低效应的剪切位点的ADRB2-tTA融合构建子以及ARRB2-TEV-NIa蛋白酶表达质粒转染。转染之后20小时采用或不采用1uM异丙基肾上腺素处理细胞,并且在药物加入后的24小时后进行发光检测。简言之,细胞培养后,去除培养基,将50μl裂解缓冲液(100mM磷酸钾,pH7.8,0.2%TritonX-100)加入到每孔中。通过在室温下轻微搅拌5分钟而裂解细胞。收集裂解物并且通过商业可得的产品进行分析。
在所有情况下,采用激活剂处理会提高β-半乳糖苷酶活性水平。然而,在带有低效应剪切位点的未处理的细胞中报道基因活性的背景水平相对于中间和高的效应位点来说是最低的。而且,激活剂处理后,带有低效应剪切位点的细胞中报道基因的活性为4.8倍而相比于含有中等效应剪切位点的2.8倍的活性和含有高效应剪切位点的细胞的1.2倍的活性。这样,通过采用低效应蛋白酶剪切位点就获得了最高的信噪比。
实施例6
这些试验被设计以确定。激活剂刺激引起的报道基因表达的提高是依赖于被激活剂结合和激活的受体。
为了做到这一点,采用前述方式产生了ADRB2-tTA融合构建子的变体,其中不包括每个中在位置113从D到S的单个氨基酸变化的突变,其导致对激活剂异丙基肾上腺素亲和性的大量降低,参见Strader等,J.Biol.Chem.,266:5-8(1991)。形成了带有不同剪切位点的三种受体-tTA融合构建子突变体。
在采用包含前述的D113S点突变的ADRB2-tTA融合构建子和ARRB2-TEV-NIa蛋白酶表达质粒共转染的克隆41细胞中检测β-半乳糖苷酶活性的水平。活性检测如前述进行。结果显示激活剂异丙基肾上腺素不刺激报道基因在表达突变的ADRB2-tTA融合构建子的细胞中的表达。
实施例7
这些试验被设计以检查是否激活剂刺激的报道基因表达的提高是依赖于TEV NIa-Pro与ARRB2的融合。
为了做到这一点,检测在采用带有低效应剪切位点的ADRB2-tTA融合构建子和前述的ARRB2TEV-NIa蛋白酶表达质粒,或者和一个融合至磷脂酶C的SH2结构域的TEV-NIa蛋白酶对照共转染的克隆41细胞中检测β-半乳糖苷酶活性水平。活性检测如前述进行。结果表明激活剂刺激报道基因表达的提高仅仅在TEV蛋白酶被融合至ARRB2上被检测到而在融合至不相关的多肽时不能检测到。
实施例8
这些试验被设计以确定是否基因表达是由目标受体的激活剂选择性诱导的,或者其能被其他分子刺激。
ATP是G蛋白偶联受体P2Y1和P2Y2的激活剂,其被HEK-293T细胞内源表达。
采用前述的带有低效应剪切位点的ADRB2-tTA融合构建子和抑制蛋白TEV-NIa蛋白酶融合共转染的,并用异丙基肾上腺素、ATP或未处理的克隆41细胞进行试验。检测如前述进行。
结果显示报道基因活性的诱导是目标受体激活所特异的。另一种GPCR通路的刺激是不相关的。
实施例9
采用前述的带有低效应剪切位点的ADRB2-tTA融合构建子和ARRB2TEV-NIa蛋白酶融合共转染的克隆41细胞进行一系列试验,其采用数量变化的肾上腺受体激活剂之一的异丙基肾上腺素和肾上腺素处理。检测如前所述进行。图2a中所代表的结果显示报道基因表达对这两种配体刺激的剂量应答曲线。每个点代表从三个试验中获得的平均值。
一系列的试验如前述进行,在其中共转染的克隆41细胞采用各种浓度的肾上腺素受体拮抗剂阿普洛尔预处理15分钟,然后用1uM肾上腺素处理。在图2b中显示的结果说明这种拮抗剂的剂量抑制曲线。
实施例10
制造类似的系列构建子以建立对于偶联的G蛋白的精氨酸血管加压素受体2(AVPR2)检测。AVPR2编码区域(Genbank登记号:NM_000054)(SEQ ID NO:23)被修饰为在5’端放置EcoRI位点并且用BamHI位点替换终止密码子,采用如下引物进行PCR:
gaattcatgc tcatggcgtc caccac(SEQ ID NO:24)以及
ggatcccgat gaagtgtcct tggccag(SEQ ID NO:25)。
修饰的AVPR2编码区域被连接至前述的已经被EcoRI和BamHI剪切的三种ADRB2-tTA构建子。这用AVPR2的编码序列替换了ADRB2的整个编码序列。
克隆41细胞被前述的包含低效应剪切位点的AVPR2-tTA融合构建子和ARRB2-TEV-NIa蛋白酶融合蛋白共转染,并且采用各种浓度(1pM到2uM)的[Arg8]血管加压素(AVPR2激活剂)进行检测。在图3中代表的数据显示对这种激活剂的剂量应答曲线,采用3.3nM的EC50,与以前公开的数据一致(Oakley,R.等,Assay and DrμgDevelopment Technologies,1:21-30,(2002))。最大应答结果是诱导的报道基因表达大约是背景水平的40倍。
实施例11
一系列相似的构建子被制造以建立G蛋白偶联的血清素受体1a(HTR1A)的检测。HTR1A编码区域(Genbank登记号:NM_000524)(SEQ ID NO:26)被修饰为在5’端放置一个EcoRI位点而用一个BamHI位点替换终止密码子,采用如下引物进行PCR:gaattcatggatgtgctcagccctgg(SEQ ID NO:27),以及
ggatccctgg cggcagaact tacac(SEQ ID NO:28).
修饰的HTR1A编码区被连接至前述的已被EcoRI和BamHI剪切的AVPR2-tTA构建子。这采用HTR1A的编码序列替换了整个AVPR2编码序列。最终构建子在这里即以后被称为“HTR1A-tTA”。
克隆41细胞被前述的包含低效应剪切位点的HTR1A-tTA融合构建子和ARRB2-TEV-NIa蛋白酶融合构建子共转染,并采用10μM8-氢氧基-DPAT HBr(OH-DPAT),HTR1A激活剂,以及10uM血清素,HTR1A天然激活剂进行检测。检测如前述进行。对OH-DPAT最大应答结果是诱导的报道基因表达大约是背景水平的6.3倍,而血清素最大应答结果是诱导的报道基因表达大约是背景水平的4.6倍。
实施例12
相似的构建子被制造以建立G蛋白偶联的m2毒蕈碱性乙酰胆碱受体(CHRM2)的检测。CHRM2编码区域(Genbank登记号:NM_000739)(SEQ ID NO:29)被修饰为在5’端放置一个EcoRI位点并且采用一个BglII位点替换终止密码子,采用如下引物进行PCR:
gaattcatga ataactcaac aaactcc(SEQ ID NO:30)以及
agatctccttgtagcgccta tgttc(SEQ ID NO:31)。
修饰的CHRM2编码区域被连接至前述AVPR2-tTA构建子,其已被EcoRI和BamHI剪切。这用CHRM2的编码序列替换了整个AVPR2编码序列。
克隆41细胞被前述的包含高效应剪切位点的CHRM2-tTA融合构建子和ARRB2-TEV-NIa蛋白酶融合构建子共转染,其中ARRB2-蛋白酶融合构建子在单纯疱疹病毒胸腺嘧啶核苷激酶(HSV-TK)启动子的控制下表达,并采用10uM氨甲酰基胆碱Cl(卡巴胆碱carbochol),CHRM2激活剂,如前述进行检测。卡巴胆碱最大应答结果是诱导的报道基因表达大约是背景水平的7.2倍。
实施例13
构建子也可被制造以建立G蛋白偶联趋化因子(C-C模序)受体5(CCR5)的检测。CCR5编码区域(Genbank登记号:NM_000579)(SEQID NO:32)被修饰以在5’端放置一个Not I位点并采用一个BamHI位点替换终止密码子,采用如下引物进行PCR:
gcggccgcatggattatcaa gtgtcaagtc c(SEQ ID NO:33)以及
ggatccctggcggcagaact tacac(SEQ ID NO:34)。
CCR5编码区域也被修饰以在5’端放置一个BsaI位点,其在被剪切时,留下与EcoRI剪切DNA相容的核苷酸突出端,采用如下引物:
ggtctccaattcatggatta tcaagtgtca agt(SEQ ID NO:35),以及
gacgacagcc aggtacctat c(SEQ ID NO:36)。
第一修饰的编码区域被ClaI和BamHI剪切而第二被Bsal和Clal剪切。这两个片段被连接至前述AVPR2-tTA构建子,其已被EcoRI和BamHI剪切。这用CCR5的编码序列替换了整个AVPR2编码序列。
含有低效应剪切位点的CCR5-tTA融合构建子被转染至"克隆34"细胞,其为前述HEK细胞系"克隆41"的衍生物,但是其包含一个在CMV启动子控制之下的稳定整合了的ARRB2-TEV-NIa蛋白酶融合基因。采用1μg/ml“调节正常T—细胞表达和分泌活性”(RANTES)的已知CCR5激活剂进行检测。对RANTES的最大应答如前述检测的结果为诱导大约40倍于背景的报道基因的表达。
实施例14
其次,一系列构建子被制造以建立G蛋白偶联的多巴胺2受体(DRD2)的检测。DRD2编码区域(Genbank登记号:NM_000795)(SEQ ID NO:37)被修饰以在5’端放置一个EcoRI位点并且用一个BglII位点替换整个终止密码子,采用如下引物进行PCR:
gaattcatgg atccactgaa tctgtcc(SEQ ID NO:38),以及
agatctgcag tggaggatct tcagg(SEQ ID NO:39).
修饰的DRD2编码区域被连接至前述用EcoRI和BamHI剪切的AVPR2-tTA构建子。这用DRD2的编码序列替换了整个AVPR2编码序列。
克隆41细胞被前述的包含中等效应剪切位点的DRD2-tTA融合构建子和ARRB2-TEV-NIa蛋白酶融合构建子共转染,并且采用10uM多巴胺HCl(多巴胺),一种DRD2激活剂进行检测。结果在前述的检测中被检测。对多巴胺的最大应答为诱导的报道基因表达是背景的2.7倍。
实施例15
这些试验被设计来证明采用结合激活剂-偶联的GPCRs的抑制蛋白变体的增强作用更稳定。首先,构建TEVNIa蛋白酶至(β-抑制蛋白-1(ARRB1)的融合构建子。ARRB1的编码区域(Genbank登记号:NM_004041)(SEQ ID NO:40)被修饰以在5’端放置一个Asp718位点并用一个BamHI位点替换终止密码子,采用如下引物进行PCR:
ggtaccatgg gcgacaaagggacgcgagtg(SEQ ID NO:41),以及
ggatcctctg ttgttgagctgtggagagcc tgtaccatcc tcctcttc(SEQ ID NO:42)。
结果,修饰的ARRB1编码区域被Asp718和EcoRI以及EcoRI和BamHI剪切,而前述的修饰的TEV NIa-Pro编码区域被BglII和NotI剪切。所有这三个片段被连接至商业可得的pcDNA3表达载体,其已经被Asp718和NotI消化。
克隆41细胞被包含中等效应剪切位点的DRD2-tTA融合构建子和ARRB1-TEV-NIa蛋白酶融合构建子共转染,并且检测采用如前述的10μM多巴胺HCI(多巴胺),一种D2受体的激活剂进行。对多巴胺的最大应答为诱导的报道基因表达是背景的2.1倍。
在氨基酸382后截断ARRB1已被报道会导致不依赖GRK-介导的磷酸化对激活剂结合的GPCRs亲和性增加,(Kovoor A.等,J.Biol.Chem.,274(11):6831-6834(1999))。为了在目前的检测中使用这样的“组成性活性的”抑制蛋白,β-抑制蛋白-1的编码区域被修饰以在5’端放置一个Asp718位点并在氨基酸382之后放置一个BamHI位点,采用如下序列以及前述的SEQID NO:41进行PCR:
ggatccatttgtgtcaagtt ctatgag(SEQ ID NO:43)。
结果产生比全长的编码区域短36个氨基酸的ARRb1编码区域于。称为"ARRB1(Δ383)"的获得的修饰的ARRB1编码区域采用Asp718和EcoRI以及采用EcoRI和BamHI剪切,而前述的修饰的TEV NIa-Pro编码区域采用BglII和Notl剪切。所有这三种片段被连接至商业可得的采用Asp718和NotI消化pcDNA3表达载体。
克隆41细胞被包含中等效应剪切位点的DRD2-tTA融合构建子和ARRB1(Δ383)-TEV-NIa蛋白酶融合构建子共转染,并且采用10μM多巴胺HCl(多巴胺),一种前述的DRD2受体激活剂进行检测。对多巴胺的最大应答是诱导的报道基因表达是背景的8.3倍。。
为了检查ARRB2编码区域类似的截断,ARRB2的编码区域被修饰以在5’端放置一个Asp718位点并且用一个BamHI位点替换3’端的81核苷酸,采用如下引物进行PCR:
ggtaccatgggggagaaacc cgggacc(SEQ ID NO:44),以及
ggatcctgtg gcatagttgg tatc(SEQID NO:45)。
结果产生短于全长的编码区域27个氨基酸的ARRB2编码区。最终修饰的ARRB2编码区域采用Asp718和BamHI剪切,而前述修饰的TEV NIa-Pro编码区域采用BglII和Notl剪切。这两种片段被连接至商业可得的采用Asp718和NotI消化pcDNA3表达载体,。
克隆41细胞被包含中等效应剪切位点的DRD2-tTA融合构建子和ARRB2(Δ383)-TEV-NIa蛋白酶融合构建子共转染,并且采用10μM多巴胺HCl(多巴胺),如前述的一种DRD2受体拮抗剂进行检测。对多巴胺的最大应答是诱导的报道基因为背景的2.1倍。
这些结果如图4所代表,证明DRD2多巴胺受体检测显示采用抑制蛋白变体ARRB1(Δ383)获得最高信噪比。
实施例16
进行一系列的试验已证明采用被设计成提高蛋白相互作用的受体修饰增强了检测。在这个实施例中,检测受体的C-末端区域被用来自AVPR2的相应尾巴区域替换,其为一种已知的具有高亲和性结合抑制蛋白的物质。在这些实施例中,在第七跨膜螺旋末端保存的NPXXY模序之后15—18个氨基酸融合连接,其典型的相对应于紧挨着受体C末端的公认的棕榈酰化位点之后。
首先,PCR被用来生产一个编码AVPR2C-末端29个氨基酸DNA片段,之后为低效应TEV剪切位点和tTA转录因子。该片段还被设计成前两个氨基酸(Ala,A和Arg,R)被BssHII限制位点GCGCGC编码。这通过扩增具用前述低效应剪切位点的AVPR2-tTA构建子而实现,引物如下:
tgtgcgcgcg gacgcacccc acccagcctg ggt(SEQ ID NO:46),以及
ctcgagagat cctcgcgccc cctacccacc(SEQ ID NO:11).
其次,DRD2的编码区域被修饰以在5’端放置一个EcoRI位点并将一个BssHII位点插入到编码区域中的最后氨基酸之后(Cys-443)。这采用如下引物进行PCR:
gaattcatgg atccactgaatctgtcc(SEQ ID NO:47),以及
tgtgcgcgcg cagtggagga tcttcaggaa ggc(SEQ ID NO:48)。
获得的修饰的D2编码区域采用EcoRI和BssHII剪切并且获得的AVPR2C-末端低效应剪切位点-tTA片段采用BssHII和BamHI剪切。这两个片段被连接至前述的用EcoRI和BamHI剪切的AVPR2-低效应剪切位点-tTA构建子。
克隆41细胞被包含低效应TEV剪切位点的DRD2-AVPR2尾巴-tTA融合构建子和前述的ARRB2-TEV-NIa蛋白酶融合构建子共转染,并且采用如前述的10μM多巴胺HCl(多巴胺),一种DRD2受体激活剂,进行检测。对多巴胺的最大应答是诱导的报道基因为背景的60倍。
制造了一种构建子,其中通过在5’端插入一个Asp718位点和在Cys-341之后放置一个BssHII位点而修饰ADRB2受体。通过如下引物进行PCR:
gcggccgcca ccatgaacgg taccgaaggc cca(SEQ ID NO:49),以及
tgtgcgcgcgcacagaagct cctggaaggc(SEQ ID NO:50)。
修饰的ADRB2受体编码区域采用EcoRI和BssHII剪切而AVPR2C-末端尾巴低效应剪切位点-tTA片段采用BssHII和BamHI剪切。这两个片段被连接至前述的采用EcoRI和BamHI剪切的AVPR2-低效应剪切位点-tTA构建子,。获得构建子是"ADRB2-AVPR2尾巴-tTA."(也参见出版的上述专利U.S.2002/0106379,特别是SEQ IDNO:3)
克隆41细胞被包含低效应剪切位点的DRB2-AVPR2尾巴-tTA融合构建子和前述的ARRB2-TEV-NIa蛋白酶融合构建子共转染,并且采用如前述的10μM异丙肾上腺素,一种ADRB2受体激活剂进行检测。对异丙肾上腺素的最大应答是诱导的报道基因为背景的10倍。
制造了一种构建子,其中通过在Cys-345之后放置一个BssHII位点而修饰卡巴阿片样物质受体(OPRK;Genbank登记号:NM_000912)(SEQIDNO:51)编码区域。通过如下引物进行PCR:
ggtctacttg atgaattcct ggcc(SEQ ID NO:52),以及
gcgcgcacag aagtcccgga aacaccg(SEQ ID NO:53)
修饰的OPRK受体编码区域采用EcoRI和BssHII剪切而AVPR2C-末端尾巴低效应剪切位点-tTA片段采用BssHII和Xhol剪切。这两个片段被连接至包含克隆进入在Asp718(5′)和XhoI(3′)的pcDNA3.1+的修饰的OPRK受体序列的质粒中,其被EcoRI和Xhol剪切。
克隆41细胞被包含低效应剪切位点的OPRK-AVPR2尾巴-tTA融合构建子和前述的ARRB2-TEV-NIa蛋白酶融合构建子共转染,并且采用10μMU-69593,一种OPRK受体激活剂进行检测。对U-69593的最大应答是诱导的报道基因为背景的12倍。
实施例17
该试验被设计已证明利用该检测方法采用一种多重方式同时检测两种待测受体的活性。
克隆41细胞和"克隆1H10"细胞,其为包含受tTA依赖的启动子控制的荧光素酶基因稳定整合的HEK-293T细胞系,每个被置于24孔培养盘中并且分别用前述嵌合的ADRB2-AVPR2尾巴-tTA或DRD2-AVPR2尾巴-tTA融合构建子瞬时转染。采用每孔100μμl培养基,0.4μg DNA和2μl Fμgene试剂实现瞬时转染。孵育24小时之后,表达ADRB2-AVPR2尾巴-tTA的克隆41细胞和表达DRD2-AVPR2尾巴-tTA的克隆H10细胞被胰酶消化,等量混合,重置于96孔板的12孔中。三个孔不加药进行孵育或立刻用1μM异丙基肾上腺素,1μM多巴胺,或1μM两者的混合物处理。在配体加入之后的24小时对细胞报道基因的活性检测。培养基被废弃,细胞在40μμl裂解缓冲液中[100mM磷酸钾,pH7.8,0.2%Triton X-100]中裂解而细胞裂解物采用商业可获得的发光检测试剂检测β-半乳糖苷酶和荧光素酶活性。
图5A和5B代表了结果。用异丙基肾上腺素处理的结果是β-半乳糖苷酶报道基因活性大约诱导了7倍,而荧光素酶活性维持不变。用多巴胺处理的结果是荧光素酶活性大约诱导了3.5倍,而β-半乳糖苷酶活性维持不变。用异丙基肾上腺素和多巴胺同时处理的结果是分别诱导了7倍的β半乳糖苷酶和3倍的荧光素酶活性。
实施例18
这个试验被设计证明采用一个多重方式利用该检测方法同时检测两种待测受体。
"克隆34.9"细胞,其为克隆41细胞的衍生物并且包含一个稳定整合的ARRB2-TEVNIa蛋白酶融合蛋白基因,采用前述的嵌合的OPRK-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA融合构建子瞬时转染。平行地,"克隆HTL5B8.1"细胞,其为包含在tTA依赖的启动子控制下的荧光素酶基因稳定整合子的HEK-293T细胞系,采用前述的ADRB-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA融合构建子瞬时转染。在每种情况下,5x105细胞被置入6孔盘的每个孔中,并且在添加有10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素,500μg/ml G418和3μμg/ml嘌呤霉素的DMEM培养基中培养24小时。细胞用100μl的DMEM,0.5μg的OPRK-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA DNA和2.5μlFμgene("克隆34.9细胞")或100μμl的DMEM,0.5μμlg的ADRB2-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTADNA,0.5μgμl的ARRB2-TEV NIa蛋白酶DNA和5μlFμgene("克隆HTL5B8.1细胞")瞬时转染。瞬时转染细胞被培养24小时,然后用胰酶消化,等量混合并重置于96孔板中。在采用10μM U-69593,10μM异丙基肾上腺素或10μM这两者的混合物处理之前细胞孵育24小时。每种试验条件检测16个孔。24小时之后,细胞被裂解并且采用前述的方法检测β-半乳糖苷酶和荧光素酶报道基因活性。结果见于图6。采用U-69593处理结果诱导了大约15倍的β-半乳糖苷酶报道基因活性,而荧光素酶活性维持不变。采用异丙基肾上腺素处理结果诱导了145倍的荧光素酶活性,而β-半乳糖苷酶活性维持不变。采用U-69593和异丙基肾上腺素结果分别诱导了9倍的β-半乳糖苷酶和136倍的荧光素酶活性。
实施例19
实施该试验以证明在本发明的检测中不同转录因子和启动子的使用。
制造一种融合构建子,包含编码AVPR2的DNA,融合进入编码包括前述的TEV Nla-Pro低效应剪切位点的氨基酸连接子GSENLYFQLR(SEQ ID NO:54)的DNA序列的框架中,融合进入编码酵母GAL4蛋白(GenBank登记号P04386)(SEQ ID NO:55)氨基酸2-147的DNA序列中,其后为一个连接子,即序列PELGSASAELTMVF(SEQ ID NO:56),其后为鼠核因子卡巴-B链p65蛋白(GenBank登记号A37932)(SEQ ID NO:57)的氨基酸368-549。CMV启动子被放置于AVPR2编码区域的上游而一个polyA序列被放置于GAL4-NFkB区域的下游。这种构建子是重新设计的AVPR2-TEV-NIa-Pro剪切(Leu)-GAL4。
HμL5C1.1是HEK-293T细胞的一种衍生物,其包含在一个商业可得的pFR-LUC的GAL4上游激活序列(UAS)控制之下稳定整合的荧光素酶报道基因。
这个AVPR2-TEV-NIa-Pro剪切(Leu)-GAL4质粒和前述的β-抑制蛋白2-TEV Nla蛋白酶共转染入HμL5C1.1细胞。大约2.5x104细胞被放置在96孔板的每孔中,在10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素,500μμg/ml G418以及3μμg/ml嘌呤霉素的DMEM培养基中培养。第二天细胞生长至50%融合度融合度并且采用10μμl每孔的包含85μμl的DMEM,0.1μμg的AVPR2-TEV-Nia-Pro剪切(Leu)-GAL4DNA,0.1μμg的ARRB2-TEVNla蛋白酶DNA,以及1μμl的Fμgene的混合物进行转染,这些物质在加入细胞之前在室温孵育15分钟。在采用10μM血管加压素处理之前培养细胞大约16小时。6小时之后,裂解细胞并且如前述进行荧光素酶活性检测。在这些条件下,血管加压素处理导致报道基因活性提高180倍。
实施例20
进行这一系列的试验以证明采用进一步的受体修饰可增强检测,该受体修饰被设计成提高与相互作用蛋白的亲和性。在这个实施例中,检测受体的C末端尾巴区域采用如下受体相应的尾巴区域替换:apelin J受体-AGTRL1(登记号:NM_005161)(SEQ ID NO:58),胃泌激素释放肽受体-GRPR(登记号:NM_005314)(SEQ ID NO:59),蛋白酶活化受体2-F2RL1(登记号:NM_005242)(SEQ ID NO:60),CCR4(登记号:NM_005508)(SEQ ID NO:61),趋化因子(C-X-C模序)受体4-CXCR4(登记号:NM_003467)(SEQ ID NO:62),以及白细胞介素8受体,β-CXCR2/IL8b(登记号:NM_001557)(SEQ ID NO:63)。
用第一PCR产生编码上述受体C-末端尾巴的DNA片段。这些片段是这样设计的,即前两个氨基酸(Ala,A和Arg,R)通过BssHII限制位点编码。
AGTRL1C-末端片段采用如下引物扩增:
tgtgcgcgcggccagagcag gtgcgca(SEQID NO:64),以及
gaggatccgt caaccacaagggtctc(SEQ ID NO:65)。
GRPR C-末端片段采用如下引物扩增:
tgtgcgcgcg gcctgatcatccggtct(SEQ ID NO:66),以及
gaggatccgacataccgctc gtgaca(SEQ ID NO:67)。
F2RL1C-末端片段采用如下引物扩增:
tgtgcgcgcagtgtccgcactgtaaagc(SEQ ID NO:68)以及
gaggatccataggaggtcttaacagt(SEQ ID NO:69).
CCR4C-末端片段采用如下引物扩增:
tgtgcgcgcggcctttttgtgctctgc(SEQIN :70),以及
gaggatccca gagcatcatg aagatc(SEQ ID NO:71)。
CXCR2/IL8b C-末端片段采用如下引物扩增:
tgtgcgcgcggcttgatcagcaagggac(SEQ ID NO:72),以及
gaggatccga gagtagtgga agtgtg(SEQ ID NO:73)。
CXCR4C-末端片段采用如下引物扩增:
tgtgcgcgcgggtccagcct caagatc(SEQ ID NO:74),以及
gaggatccgc tggagtgaaaacttga(SEQ ID NO:75)。
获得的编码这些受体C-末端修饰的DNA片段采用BssHII和BamHI剪切并且片段被连接至OPRK受体编码区域框架,在前述的OPRK-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA表达构建子中替换AVPR2-C-末端片段。
前述的HTL5B8.1细胞采用上面修饰的每个OPRK编码区域-TEV-NIa-Pro剪切(Leu)-tTA构建子和前述的β-抑制蛋白2-TEVNIa蛋白酶融合构建子进行共转染。放置每孔大约2.5x104细胞在96孔板中,用10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素,500μg/ml G418,和3μμg/ml嘌呤霉素的DMEM培养基培养。第二天细胞生长至50%融合度融合度并且采用每孔10μl的如下混合物进行转染:85μl的DMEM,0.25μμg的AVPR2-TEV-NIa-Pro剪切(Leu)-GAL4DNA,0.25μμg的ARRB2-TEV NIa蛋白酶DNA,以及2.5μμl的Fμgene(一种合适的包含脂质体和其他材料的转染试剂),在加入细胞之前在室温下孵育15分钟。转染细胞在用10μM U-69593处理前孵育大约16小时。6小时之后,裂解细胞并如前述检测荧光素酶活性。在这些条件下,采用U-69593处理,结果导致对于每种修饰的OPRK受体下述的报道基因活性的提高:OPRK-AGTRLI C-末端尾巴-30倍;OPRK-GRPRC-末端尾巴-312倍;OPRK-F2RL1C-末端尾巴-69.5倍;OPRK-CCR4C-末端尾巴-3.5倍;OPRK-CXCR4C-末端尾巴-9.3倍;OPAK-IL8b C-末端尾巴-113倍。
实施例21
这个实验被设计以生产前述的稳定表达ARRB2-TEV
NIa蛋白酶融合蛋白的细胞系。
制造了一种在EF1α启动子控制之下表达ARRB2-TEV
NIa蛋白酶融合蛋白并且还在胸腺嘧啶核苷激酶(TK)启动子控制之下表达潮霉素抗性基因的质粒。
该质粒被转染进HTL5B8.1,并且通过在100μμg/ml潮霉素存在下进行培养而选择出质粒稳定整合在基因组的克隆。抗性克隆被分离的和扩展并且通过前述的ADRB2-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA质粒转染而进行筛选。采用这一程序进行选择的三个细胞系,分别称为"HTLA4C2.10","HTLA2C11.6"和"HTLA5D4"。大约每孔2.5x104细胞被植入到96孔板上,在带有10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素,500μμg/ml G418,3μμg/ml嘌呤霉素,和100μg/ml潮霉素的DMEM培养基中培养。第二天细胞生长至50%融合度融合度并且被每孔10μl的如下混合物转染:85μμl的DMEM,0.25μμg的ADRB2-AVPR2-TEV-NIa-Pro剪切(Leu)-GALADNA和0.5μμl的Fμgene,其在加入细胞之前在室温孵育15分钟。在用10μM异丙基肾上腺素处理之前培养转染细胞大约16小时。6小时之后,细胞被裂解并如前述检测荧光素酶活性。在这些条件下,用异丙基肾上腺素处理导致这三个细胞系中分别有如下报道基因活性的提高:112-倍("HTLA4C2.10"),56-倍("HTLA2C11.6")和180-倍("HTLA5D4")。
实施例22
该实验被设计以生产稳定表达前述的ARRB2-TEV NIa蛋白酶和ADRB2-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA融合蛋白的细胞系。
包含潮霉素抗性基因的ARRB2-TEV NIa蛋白酶质粒与前述的ADRB2-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA融合蛋白质粒一起转染进HTL5B8.1细胞并且通过在100μμg/ml潮霉素的存在下培养而选择包含质粒稳定整合到基因组的克隆。抗性克隆被分离并扩展,并通过采用10μM异丙基肾上腺素处理而被筛选并检测如前述诱导的报道基因活性。采用该程序选择的三个细胞系被称为"HTLAR
1E4","HTLAR1C10"和"HTLAR2G2"。用异丙基肾上腺素处理6小时结果导致分别在三种细胞系中如下报道基因活性的提高:208-倍("HTLAR1E4"),197-倍("HTLAR1C10")和390-倍("HTLAR2G2")。
实施例23
该实验被设计以证明利用该检测方法检测受体酪氨酸激酶表皮生长因子受体(EGFR)的活性。
制造第一融合构建子,包含编码人EGFR的DNA,其可以在GenBank登记号NM_005228(SEQ ID NO:76)中找到,融合进入编码前述四环素控制的反式激活蛋白(transactivator)tTA的氨基酸3-335的DNA序列的框架中。插入在这些序列之间的是一个编码包括前述TEV NIa-Pro,ENLYFQL(SEQ ID NO:14)低效应剪切位点的氨基酸序列GGSGSENLYFQL(SEQID NO:77)的DNA序列。CMV启动子被放置在表皮生长因子受体编码区域的上游,而polyA序列被放置在tTA区域的下游。这一构建子被称为EGFR-TEV-NIa-Pro剪切(Leu)-tTA。
制造第二融合构建子,其包含编码两个人磷脂酶CGamma1相应于氨基酸538-759(基因Bank登记号NP_002651.2)(SEQ ID NO:78)的SH2结构域的DNA,其被融合进入一个编码前述成熟TEV NIa蛋白酶对应于氨基酸2040-2279(基因Bank登记号AAA47910)(SEQ ID NO:79)的催化结构域的DNA序列的框架中。在这些序列之间插入的一个编码氨基酸NSSGGNSGS(SEQ ID NO:80)的连接子DNA序列。CMV启动子被放置在PLC-Gamma SH2结构域编码序列的上游并且polyA序列被放置在TEV NIa蛋白酶序列的下游。这个构建子被称为PL CGammal-TEV。
EGFR-TEV-NIa-Pro剪切(Leu)-tTA和PLC Gammal-TEV融合构建子被转染进入前述克隆HTL5B8.1细胞。大约2.5x104细胞被放置于96孔板的每孔中,在带有10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素,500μg/ml G418,和3μμg/ml嘌呤霉素的DMEM培养基培养。第二天细胞生长至50%融合度融合度并采用每孔15μl如下混合物进行转染:100μμl的DMEM,0.4μμg的pcDNA3DNA("携带子"载体DNA),0.04μμg的EGFR-TEV-NIa-Pro剪切(Leu)-tTA DNA,0.04μμg的PLC Gammal-TEVDNA,以及2μμlFμgene(一种合适的包含脂质体和其他材料的转染试剂),在加入细胞之前在室温下孵育15分钟。在采用特异的受体激活剂和抑制剂处理之前转染细胞被培养大约16小时。6小时之后,裂解细胞并如前述方法检测荧光素酶活性。结果见图7。
加入2.5ng/ml人表皮生长因子(对应于该配体的EC80)结果导致荧光素酶报道基因活性增加12.3倍,而加入100ng/ml人转化生长因子-Alpha结果导致增加18.3倍。在加入人表皮生长因子之前采用酪氨酸激酶抑制子(70μM AG-494;0.3μM AG-1478;2mMRG-130022)预处理阻断了报道基因活性的诱导。
实施例24
该实验被设计以证明采用该检测方法检测人I型干扰素受体的活性。
制造一种融合构建子,其包含编码人干扰素受体I(IFNAR1)(557氨基酸)的NA,可以在Genbank登记号NM_000629(SEQ ID NO:81)中找到,被融合进入编码前述四环素控制的反式激活蛋白tTA的氨基酸3-335的DNA序列框架中。在这些序列之间插入的是一个编码包括前述TEV NIa-Pro,ENLYFQL(SEQ ID NO:14)的低效应剪切位点的氨基酸序列GSENLYFQL(SEQ ID NO:82)的DNA序列。CMV启动子被放置于人干扰素受体I(IFNAR1)编码区域的上游,而一个poly A序列被放置于tTA区域的下游。这个构建子被称为IFNAR1-TEV-NIa-Pro剪切(L)-tTA。
制造一个第二融合构建子,采用编码人干扰素受体2的DNA,即剪接变体2(IFNAR2.2)(515个氨基酸),其可以在Genbank登记号L41942(SEQ ID NO:83)中找到,被融合进入一个编码前述对应于氨基酸2040-2279(GenBank登记号AAA47910)(SEQ ID NO:84)的TEVNIa蛋白酶的催化结构域的DNA序列的框架中。在这些序列之间插入的是一个编码氨基酸序列RS(Arg-Ser)的DNA序列。CMV启动子区域被放置于人干扰素受体2(IFNAR2.2)编码区域的上游,而一个poly A序列被放置于TEV区域的下游。该构建子被称为IFNAR2.2-TEV。
构建了Genbank登记号为NM_007315(SEQ ID NO:85)的人信号传导和转录激活因子1(STAT1)的基因和人转录本2(STAT2)信号转换和活化子见于Genbank登记号为NM_005419(SEQID NO:86)的人信号传导和转录激活因子2(STAT2)的基因的表达构建子,其表达受CMV启动子区域控制。这些构建子分别被称为CMV-STAT1和CMV-STAT2。
IFNAR1-TEV-NIa-Pro剪切(L)-tTA和IFNAR2.2-TEV融合构建子与CMV-STAT1和CMV-STAT2一起被瞬时转染进入前述HTL5B8.1细胞。大约2.5x104细胞被种植在96孔板的每孔中并在带有10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素,100μμg/mlG418,和5μμg/ml嘌呤霉素的DMEM培养基中培养。孵育24小时之后,细胞采用每种15ng的IFNAR1-TEV-NIa-Pro剪切(L)-tTA,IFNAR2.2-TEV,CMV-STAT1和CMV-STAT2DNA,或者采用60ng对照pcDNA质粒,与0.3μlFμgene每孔进行转染。转染细胞在采用5000U/ml人干扰素α或5000U/ml人干扰素β处理之前孵育8—20小时。在加入干扰素时,吸出培养基并采用带有2mM L-谷氨酰胺,100units/ml青霉素,3μμg/ml嘌呤霉素和500μμg/ml的G418的293SFM II培养基替换。在进行前述的荧光素酶报道基因活性检测之前干扰素-处理的细胞被培养18—20小时。结果见图8。采用5000U/ml IFNα处理结果导致报道基因活性提高15倍,而采用5000U/ml IFNβ处理导致10倍的提高。用干扰素处理采用对照质粒pcDNA3转染的HTL5B8.1细胞对报道基因活性没有影响。图9显示在采用前述的IFNAR1(ENLYFQ(L)-tTa,IFNAR2.2-TEV,STAT1和STAT2表达构建子转染的HTL5B8.1细胞中对于IFNa所产生的剂量应答曲线。
实施例25
该实验证明该检测方法采用不同的转录因子和不同的细胞系检测人I型干扰素受体的活性。
制造融合构建子,采用编码人干扰素受体I(IFNAR1)的DNA,融合进入一个编码前述GAL4-NF-KB融合子的DNA序列。在这些序列之间插入的是一个编码包括前述的TEV NIa-Pro,ENLYFQL(SEQ ID NO:14)的低效应剪切位点的氨基酸序列GSENLYFQL(SEQID NO:87)的DNA序列。CMV启动子被放置在人干扰素受体I(IFNAR1)编码区域的上游,而一个poly A序列被放置在GAL4-NE-κB区域的下游。该构建子被称为IFNAR1-TEV-NIa-Pro剪切(L)-GAL4-NF-κB。
CHO-K1细胞随后被采用如下5种质粒的混合物瞬时转染:IFNAR1-TEV-NIa-Pro剪切(L)-GAL4-NF-κB,IFNAR2.2-TEV,CMV-STAT1,CMV-STAT2和GAL4依赖的启动子控制下的荧光素酶报道基因质粒pFR-Luc。在转染前大约每孔1.0x104细胞被种植在96孔板中,采用带有如下成分的DMEM培养基培养:10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素。细胞在第二天被转染,采用10ng报道基因质粒(pFR-Luc),加上20ng前述的每种表达构建子,或者采用10ng报道基因质粒加上80ng对照pcDNA3质粒,以及每孔0.3μl Fμgene。在采用5000U/ml人干扰素-α处理之前培养转染细胞8—20小时。在加入干扰素之前,吸出培养基,用带有2mM L-谷氨酰胺,100units/ml青霉素的DMEM培养基替换。干扰素α处理的细胞在进行前述的荧光素酶报道基因活性检测之前培养6小时。结果见图10。采用报道基因,IFNAR和STAT构建子CHO-K1转染的细胞经IFNα处理结果导致报道基因活性提高3倍,而采用报道基因和对照质粒转染的转染细胞经干扰素处理对报道基因活性没有影响。
实施例26
设计本系列的试验以证明采用设计好的提高检测受体与相互作用蛋白之间亲和性的修饰增强检测。在这些例子中,在检测受体和GRPR(Genbank登记号:NM_005314)(SEQ ID NO:59)C-末端尾巴区域之间的融合连接在第七跨膜螺旋末端保存的NPXXY模序之后形成17-23个氨基酸。
首先,PCR被用来产生一个编码在假定的棕榈酰化位点之后的从GRPR开始2个氨基酸的C-末端42氨基酸的DNA片段(自此以后被称为GRPR42aa)。该片段被设计魏C-末端尾巴的第一氨基酸之前为由XbaI限制位点TCTAGA所编码的两个氨基酸(Ser,S andArg,R),而终止密码子被由BamHI限制位点GGATCC所编码的两个氨基酸(Gly,G and Ser,S)替换。这通过扩增包含GRPR编码区域的质粒而完成,采用的引物是:
tctagaggcctgatcatccggtctcac(SEQ ID NO:88),以及
gaggatccgacataccgctcgtgaca(SEQ ID NO:67)
接下来OPRK(Genbank登记号:NM_000912)(SEQ ID
NO:51)的编码区域被修饰以在Pro-347之后插入Xbal位点。采用如下引物进行PCR:
ggtctacttgatgaattcctggcc(SEQ ID NO:52),以及
tctagatggaaaacagaagtcccggaaac(SEQ ID NO:89)
此外,ADRA1A(Genbank登记号:Nom_000680)(SEQIDNO:90)的编码区域被修饰以在Lys-349之后插入Xbal位点。采用如下引物进行PCR:
ctcggatatctaaacagctgcatcaa(SEQ ID NO:91),以及tctagactttctgcagagacactggattc(SEQ ID NO:92)
此外,DRD2(Genbank登记号:NM_000795)(SEQ IDNO:37)的编码区域被修饰以在Cys-343之后插入两个氨基酸(Leu和Arg)以及XbaI位点。这采用如下引物进行PCR:
gaattcatggatccactgaatctgtcc(SEQ ID NO:38),以及
tctagatcgaaggcagtggaggatcttcagg(SEQ ID NO:93)
修饰的OPRK受体编码区域采用EcoRI和XbaI剪切而GRPR42aa C-末端尾巴片段采用XbaI和BamHI剪切。两个片段被连接至包含具有前述的AVPR2C-末端尾巴-低效应剪切位点-tTA的OPRK受体的质粒中,其采用EcoRI和BamHI消化。
修饰的ADRA1A受体编码区域采用EcoRV和Xbal剪切而包含低效应剪切位点的OPRK-GRPR42aa尾巴-tTA融合构建子采用XbaI和XhoI剪切。两个片段被连接至包含ADRA1A受体的质粒中,其被EcoRV和XhoI消化。
修饰的DRD2受体编码区域采用EcoRI和Xbal剪切而包含低效应剪切位点的OPRK-GRPR42aa尾巴-tTA融合构建子采用XbaI和Xhol剪切。两个片段被连接至pcDNA6质粒,其被EcoRI和XhoI消化。
如前述的HTLA2C11.6细胞,被包含低效应剪切位点的OPRK-GRPR42aa尾巴-tTA融合构建子转染并且检测采用10μMU-69593,一种OPRK激活剂而进行。对U-69593的最大应答为报道基因活性提高大约200倍。
HTLA2C11.6细胞采用包含低效应剪切位点的ADRA1A-GRPR42aa尾巴-tTA融合构建子转染并且检测采用10μM肾上腺素,一种ADRAIA激活剂而进行。对肾上腺素最大应答为报道基因活性提高大约14倍。
HTLA2C11.6细胞采用包含低效应剪切位点的DRD2-GRPR42aa尾巴-tTA融合构建子转染并且检测采用10μM多巴胺,一种DRD2激活剂而进行。对多巴胺最大应答为报道基因活性提高大约30倍。
实施例27
本系列的试验本设计以证明采用设计好的提高检测受体与相互作用蛋白之间亲和性的修饰的不同检测受体进一步增强检测。在这些实施例中,检测受体的C-末端区域被GRPR内源的C-末端尾巴结构域的一个片断替换。
首先,PCR被用于生产一个编码截断的GRPR尾巴的DNA片段,特别是编码从Gly-343至Asn-365的23氨基酸的序列。片段被设计为C-末端尾巴的第一氨基酸之前为由XbaI限制位点TCTAGA所编码的两个氨基酸(Ser,S和Arg,R),而Ser-366被由BamHI限制位点GGATCC所编码的两个氨基酸(Gly,G和Ser,S)替换。这通过扩增一个包含GRPR编码区域的质粒而完成,所用引物如下:tctagaggcctgatcatccggtctcac(SEQ ID NO:94)以及
cggatccgttggtactcttgagg(SEQID NO:95)。
接下来,截断的GRPR片段(自此以后被称为GRPR
23aa尾巴)采用Xbal和BamHI剪切并插入到包含这里所述的低效应检测位点的OPRK-GRPR42aa尾巴-tTA融合构建子中,其采用Xbal和BamHI消化。
同样地,GRPR23aa尾巴片段采用Xbal和BamHI消化并且被插入到这里所述的包含低效应剪切位点的ARRA1A-GRPR42aa尾巴-tTA融合构建子中,其采用Xbal和BamHI消化。
HTLA2C11.6细胞采用包含低效应剪切位点的OPRK-GRPR23aa尾巴-tTA融合构建子转染并且检测采用10μMU-69593,一种OPRK激活剂而进行。对U-69593的最大应答为报道基因表达比背景提高了大约115倍。
HTLA2C11.6细胞采用包含低效应剪切位点的ADRA1A-GRPR23aa尾巴-tTA融合构建子转染并且检测采用10μM肾上腺素,一种ADRA1A激活剂而进行。对肾上腺素的最大应答为报道基因的表达比背景提高了大约102倍。
实施例28
该实验被设计以证明利用该检测方法能检测受体酪氨酸激酶胰岛素样生长因子1受体(IGF1R)的活性,特别是通过监控配体诱导细胞内信号蛋白SHCI(包含Src同源2结构域转化蛋白1)的募集而检测。
制造第一融合构建子被,包含编码人IGF-1R的DNA,其可在GenBank登记号NM_000875(SEQ ID NO:96)下找到,其被融合进入一个编码前述的四环素控制的反式激活蛋白tTA的氨基酸3-335的DNA序列中。在这些序列中插入的是一个编码包括前述的TEVNIa-Pro,ENLYFQL(SEQ ID NO:14)低效应剪切位点的氨基酸序列GSENLYFQL(SEQID NO:82)的DNA序列。CMV启动子被放置在IGF1R编码区域的上游,并且polyA序列被放置在tTA区域的下游。该构建子被称为IGF1R-TEV-NIa-Pro剪切(Leu)-tTA。
制造第二融合构建子,包含编码人SHC1,对应于氨基酸1-238(基因Bank登记号BC014158)(SEQ ID NO:97)的PTB区域的DNA被融合进入一个编码前述的成熟TEV NIa蛋白酶,对应于氨基酸2040-2279(基因Bank登记号AAA47910)(SEQ ID NO:79)的催化结构域的DNA序列中。在这些序列中插入的是一个连接子DNA序列,其编码氨基酸NSGS(SEQ ID NO:98)。CMV启动子被放置在SHC1PTB结构域编码序列的上游而一个polyA序列被放置在TEV NIa蛋白酶序列的下游。该构建子被称为SHC1-TEV。
IGF1R-TEV-NIa-Pro剪切(Leu)-tTA和SHC1-TEV融合构建子被转染进入前述的克隆HTL5B8.1细胞中。大约2.5x104细胞放置于96孔板的每孔中,采用带有10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素,500μμg/ml G418,和3μg/ml嘌呤霉素的DMEM培养基培养。第二天细胞生长至50%融合度融合度并且采用每孔15μl如下混合物进行转染:100μμgl DMEM,0.2μμg IGF1R-TEV-NIa-Pro剪切(Leu)-tTA DNA,0.2μμg SHC1-TEV DNA,以及2μμl Fμgene(一种合适的包含脂质体和其他材料的转染试剂),在加入细胞之前在室温下孵育15分钟。在采用特异受体激活剂处理之前,转染细胞被培养大约16小时。24小时之后,裂解细胞并如前述检测荧光素酶活性。
加入1μM人胰岛素样生长因子1导致荧光素酶报道基因活性提高90倍。
实施例29
该试验本设计以证明采用该检测方法能检测不是正常膜结合蛋白的两种检测蛋白之间的相互作用。在这个实施例中,该检测方法被用来检测配体诱导的核类固醇激素受体,ESR1(雌激素受体1或ERα)和ESR2(雌激素受体2或ERβ)二聚化。在这个实施例中,ESR1被融合至转录因子tTA,其中TEV NIa-Pro蛋白酶剪切位点在ESRI和tTA序列之间插入。该ESRI-tTA通过融合细胞内跨膜蛋白CD8的C末端而系在膜上。CD8基本功能为一个插入支架,而使ESR1连系在细胞膜的细胞质侧。这样融合的转录因子不能进入核直到与ESR2和蛋白酶相互作用。可采用任何跨膜蛋白。这种CD8-ESR1-TEV NIa Pro剪切-tTA融合蛋白与一个包含ESR2和TEV NIa-Pro蛋白酶的第二融合蛋白一起在包含一个tTA依赖的报道基因的细胞系中表达。雌激素诱导的ESR1和ESR2二聚化因而触发了tTA转录因子从膜结合的融合蛋白中释放,其可以通过随后诱导的报道基因活性而得以检测。
制造融合构建子,其包含编码人CD8基因(235氨基酸)的DNA序列,其可在Genbank登记号NM_001768(SEQ ID NO:99)下发现,被融合进入编码人ESR1(596氨基酸s)的DNA序列中,其可在Genbank登记号NM_000125(SEQ ID NO:100)下发现。在这些序列中插入的是一个编码氨基酸序列GRA(Gly-Arg-Ala)的DNA序列。最终构建子随后被融合至编码前述的四环素控制的反式激活蛋白tTA的氨基酸3-335的DNA编码序列框中。在这些序列中插入的是一个编码包含前述的TEV NIa-Pro,ENLYFQL(SEQ ID NO:14)的低效应剪切位点的氨基酸序列GSENLYFQL(SEQID NO:82)的DNA序列。CMV启动子被放置在人CD8编码区域的上游,而polyA序列被放置在tTA区域的下游。该构建子被称为CD8-ESR1-TEV-NIa-Pro剪切(L)-tTA。
制造第二融合构建子,采用编码人雌激素受体β(ESR2)(530个氨基酸)的DNA,其可在Genbank登记号NM_001437(SEQIDNO:101)下被找到,其被融合进入一个编码前述的TEVNIa蛋白酶催化结构域,对应于氨基酸2040-2279(GenBank登记号AAA47910)(SEQ ID NO:84)的DNA序列中。在这些序列中插入的是一个编码氨基酸序列RS(Arg-Ser)的DNA序列。CMV启动子区域被放置在人雌激素受体β(ESR2)编码区域的上游,而poly A序列被放置在TEV区域的下游。该构建子被称为ESR2-TEV。
CD8-ESR1-TEV-NIa-Pro剪切(L)-tTA和ESR2-TEV融合构建子,与pCDNA3一起被瞬时转染入前述的HTL5B8.1细胞中。大约2.0x104细胞被种植在96孔板的每孔中并且在带有10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素,100μμg/ml G418和5μμg/ml嘌呤霉素的不含酚的DMEM培养基中培养。在孵育24小时后,细胞每孔采用5ng的ESR1-TEV-NIa-Pro剪切(L)-tTA,15ngESR2-TEV和40ng pCDNA3以及0.3μμl Fμgene的混合物一起进行转染。转染6小时之后,细胞用PBS清洗并在采用50nM17-β雌二醇处理之前用100μμl不含酚和血清的DMEM中孵育24小时。配体处理的细胞在如前述检测荧光素酶报道基因活性之前再培养18—20小时。用50nM17-β雌二醇处理使得报道基因活性增加16倍。
本发明的其它特征对于本领域技术人员是清楚的并且不需要在此再介绍。
序列表
<110>K·J·李
R·阿谢尔
W·斯特拉波斯
G·巴尔内亚
<120>检测蛋白-蛋白相互作用的方法
<130>SENTI203.3PCT
<140>PCT/US2004/021887
<141>2004-07-09
<150>60/566,113
<151>2004-04-27
<150>60/511,918
<151>2003-10-15
<150>60/485,968
<151>2003-07-09
<160>101
<210>1
<211>2015
<212>DNA
<213>人
<400>1
actgcgaagc ggcttcttca gagcacgggc tggaactggc aggcaccgcg agcccctagc    60
acccgacaag ctgagtgtgc aggacgagtc cccaccacac ccacaccaca gccgctgaat    120
gaggcttcca ggcgtccgct cgcggcccgc agagccccgc cgtgggtccg cccgctgagg    180
cgcccccagc cagtgcgctt acctgccaga ctgcgcgcca tggggcaacc cgggaacggc    240
agcgccttct tgctggcacc caatagaagc catgcgccgg accacgacgt cacgcagcaa    300
agggacgagg tgtgggtggt gggcatgggc atcgtcatgt ctctcatcgt cctggccatc    360
gtgtttggca atgtgctggt catcacagcc attgccaagt tcgagcgtct gcagacggtc    420
accaactact tcatcacttc actggcctgt gctgatctgg tcatgggcct ggcagtggtg    480
ccctttgggg ccgcccatat tcttatgaaa atgtggactt ttggcaactt ctggtgcgag    540
ttttggactt ccattgatgt gctgtgcgtc acggccagca ttgagaccct gtgcgtgatc    600
gcagtggatc gctactttgc cattacttca cctttcaagt accagagcct gctgaccaag    660
aataaggccc gggtgatcat tctgatggtg tggattgtgt caggccttac ctccttcttg    720
cccattcaga tgcactggta ccgggccacc caccaggaag ccatcaactg ctatgccaat    780
gagacctgct gtgacttctt cacgaaccaa gcctatgcca ttgcctcttc catcgtgtcc    840
ttctacgttc ccctggtgat catggtcttc gtctactcca gggtctttca ggaggccaaa    900
aggcagctcc agaagattga caaatctgag ggccgcttcc atgtccagaa ccttagccag    960
gtggagcagg atgggcggac ggggcatgga ctccgcagat cttccaagtt ctgcttgaag    1020
gagcacaaag ccctcaagac gttaggcatc atcatgggca ctttcaccct ctgctggctg    1080
cccttcttca tcgttaacat tgtgcatgtg atccaggata acctcatccg taaggaagtt    1140
tacatcctcc taaattggat aggctatgtc aattctggtt tcaatcccct tatctactgc    1200
cggagcccag atttcaggat tgccttccag gagcttctgt gcctgcgcag gtcttctttg    1260
aaggcctatg ggaatggcta ctccagcaac ggcaacacag gggagcagag tggatatcac    1320
gtggaacagg agaaagaaaa taaactgctg tgtgaagacc tcccaggcac ggaagacttt    1380
gtgggccatc aaggtactgt gcctagcgat aacattgatt cacaagggag gaattgtagt    1440
acaaatgact cactgctgta aagcagtttt tctactttta aagacccccc cccccccaac    1500
agaacactaa acagactatt taacttgagg gtaataaact tagaataaaa ttgtaaaaat    1560
tgtatagaga tatgcagaag gaagggcatc cttctgcctt ttttattttt ttaagctgta    1620
aaaagagaga aaacttattt gagtgattat ttgttatttg tacagttcag ttcctctttg    1680
catggaattt gtaagtttat gtctaaagag ctttagtcct agaggacctg agtctgctat    1740
attttcatga cttttccatg tatctacctc actattcaag tattaggggt aatatattgc    1800
tgctggtaat ttgtatctga aggagatttt ccttcctaca cccttggact tgaggatttt    1860
gagtatctcg gacctttcag ctgtgaacat ggactcttcc cccactcctc ttatttgctc    1920
acacggggta ttttaggcag ggatttgagg agcagcttca gttgttttcc cgagcaaagg    1980
tctaaagttt acagtaaata aaatgtttga ccatg                               2015
<210>2
<211>26
<212>DNA
<213>人
<400>2
gattgaagat ctgccttctt gctggc                                         26
<210>3
<211>27
<212>DNA
<213>人
<400>3
gcagaacttg gaagacctgc ggagtcc                                        27
<210>4
<211>27
<212>DNA
<213>人
<400>4
ggactccgca ggtcttccaa gttctgc                                        27
<210>5
<211>27
<212>DNA
<213>人
<400>5
ttcggatcct agcagtgagt catttgt                                        27
<210>6
<211>7
<212>PRT
<213>人
<400>6
Glu Asn Leu Tyr Phe Gln Ser
                5
<210>7
<211>32
<212>DNA
<213>人
<400>7
ccggatcctc tagattagat aaaagtaaag tg                                 32
<210>8
<211>35
<212>DNA
<213>人
<400>8
gactcgagct agcagtatcc tcgcgccccc taccc    35
<210>9
<211>18
<212>DNA
<213>人
<400>9
gagaacctgt acttccag                       18
<210>10
<211>33
<212>DNA
<213>人
<400>10
ggatccgaga acctgtactt ccagtacaga tta      33
<210>11
<211>30
<212>DNA
<213>人
<400>11
ctcgagagat cctcgcgccc cctacccacc          30
<210>12
<211>7
<212>PRT
<213>人
<400>12
Glu Asn Leu Tyr Phe Gln Tyr
                5
<210>13
<211>33
<212>DNA
<213>人
<400>13
ggatccgaga acctgtactt ccagctaaga tta     33
<210>14
<211>7
<212>PRT
<213>人
<400>14
Glu Asn Leu Tyr Phe Gln Leu
                5
<210>15
<211>33
<212>DNA
<213>人
<400>15
gcggccgcca ccat gaacgg taccgaaggc cca    33
<210>16
<211>21
<212>DNA
<213>人
<400>16
ctggtgggtg gcccggtacc a                  21
<210>17
<211>1936
<212>DNA
<213>人
<400>17
ccccgcgtgt ctgctaggag agggcgggca gcgccgcggc gcgcgcgatc cggctgacgc    60
atctggcccc ggttccccaa gaccagagcg gggccgggag ggagggggaa gaggcgagag    120
cgcggagggc gcgcgtgcgc attggcgcgg ggaggagcag ggatcttggc agcgggcgag    180
gaggctgcga gcgagccgcg aaccgagcgg gcggcgggcg cgcgcaccat gggggagaaa    240
cccgggacca gggtcttcaa gaagtcgagc cctaactgca agctcaccgt gtacttgggc    300
aagcgggact tcgtagatca cctggacaaa gtggaccctg tagatggcgt ggtgcttgtg    360
gaccctgact acctgaagga ccgcaaagtg tttgtgaccc tcacctgcgc cttccgctat    420
ggccgtgaag acctggatgt gctgggcttg tccttccgca aagacctgtt catcgccacc    480
taccaggcct tccccccggt gcccaaccca ccccggcccc ccacccgcct gcaggaccgg    540
ctgctgagga agctgggcca gcatgcccac cccttcttct tcaccatacc ccagaatctt    600
ccatgctccg tcacactgca gccaggccca gaggatacag gaaaggcctg cggcgtagac    660
tttgagattc gagccttctg tgctaaatca ctagaagaga aaagccacaa aaggaactct    720
gtgcggctgg tgatccgaaa ggtgcagttc gccccggaga aacccggccc ccagccttca    780
gccgaaacca cacgccactt cctcatgtct gaccggtccc tgcacctcga ggcttccctg    840
gacaaggagc tgtactacca tggggagccc ctcaatgtaa atgtccacgt caccaacaac    900
tccaccaaga ccgtcaagaa gatcaaagtc tctgtgagac agtacgccga catctgcctc    960
ttcagcaccg cccagtacaa gtgtcctgtg gctcaactcg aacaagatga ccaggtatct    1020
cccagctcca cattctgtaa ggtgtacacc ataaccccac tgctcagcga caaccgggag    1080
aagcggggtc tcgccctgga tgggaaactc aagcacgagg acaccaacct ggcttccagc    1140
accatcgtga aggagggtgc caacaaggag gtgctgggaa tcctggtgtc ctacagggtc    1200
aaggtgaagc tggtggtgtc tcgaggcggg gatgtctctg tggagctgcc ttttgttctt    1260
atgcacccca agccccacga ccacatcccc ctccccagac cccagtcagc cgctccggag    1320
acagatgtcc ctgtggacac caacctcatt gaatttgata ccaactatgc cacagatgat    1380
gacattgtgt ttgaggactt tgcccggctt cggctgaagg ggatgaagga tgacgactat    1440
gatgatcaac tctgctagga agcggggtgg gaagaaggga ggggatgggg ttgggagagg    1500
tgagggcagg attaagatcc ccactgtcaa tgggggattg tcccagcccc tcttcccttc    1560
ccctcacctg gaagcttctt caaccaatcc cttcacactc tctcccccat ccccccaaga    1620
tacacactgg accctctctt gctgaatgtg ggcattaatt ttttgactgc agctctgctt    1680
ctccagcccc gccgtgggtg gcaagctgtg ttcataccta aattttctgg aaggggacag    1740
tgaaaagagg agtgacagga gggaaagggg gagacaaaac tcctactctc aacctcacac    1800
caacacctcc cattatcact ctctctgccc ccattccttc aagaggagac cctttgggga    1860
caaggccgtt tctttgtttc tgagcataaa gaagaaaata aatcttttac taagcatgaa    1920
aaaaaaaaaa aaaaaa                                                    1936
<210>18
<211>35
<212>DNA
<213>人
<400>18
caggatcctc tggaatgggg gagaaacccg ggacc                               35
<210>19
<211>30
<212>DNA
<213>人
<400>19
ggatccgcag agttgatcat catagtcgtc                                     30
<210>20
<211>9
<212>PRT
<213>人
<400>20
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
                5
<210>21
<211>28
<212>DNA
<213>人
<400>21
agatctagct tgtttaaggg accacgtg                                       28
<210>22
<211>62
<212>DNA
<213>人
<400>22
gcggccgctc aagcgtaatc tggaacatca tatgggtacg agtacaccaa ttcattcatg    60
ag                                                                   62
<210>23
<211>1809
<212>DNA
<213>人
<400>23
agaagatcct gggttctgtg catccgtctg tctgaccatc cctctcaatc ttccctgccc    60
aggactggcc atactgccac cgcacacgtg cacacacgcc aacaggcatc tgccatgctg    120
gcatctctat aagggctcca gtccagagac cctgggccat tgaacttgct cctcaggcag    180
aggctgagtc cgcacatcac ctccaggccc tcagaacacc tgccccagcc ccaccatgct    240
catggcgtcc accacttccg ctgtgcctgg gcatccctct ctgcccagcc tgcccagcaa    300
cagcagccag gagaggccac tggacacccg ggacccgctg ctagcccggg cggagctggc    360
gctgctctcc atagtctttg tggctgtggc cctgagcaat ggcctggtgc tggcggccct    420
agctcggcgg ggccggcggg gccactgggc acccatacac gtcttcattg gccacttgtg    480
cctggccgac ctggccgtgg ctctgttcca agtgctgccc cagctggcct ggaaggccac    540
cgaccgcttc cgtgggccag atgccctgtg tcgggccgtg aagtatctgc agatggtggg    600
catgtatgcc tcctcctaca tgatcctggc catgacgctg gaccgccacc gtgccatctg    660
ccgtcccatg ctggcgtacc gccatggaag tggggctcac tggaaccggc cggtgctagt    720
ggcttgggcc ttctcgctcc ttctcagcct gccccagctc ttcatcttcg cccagcgcaa    780
cgtggaaggt ggcagcgggg tcactgactg ctgggcctgc tttgcggagc cctggggccg    840
tcgcacctat gtcacctgga ttgccctgat ggtgttcgtg gcacctaccc tgggtatcgc    900
cgcctgccag gtgctcatct tccgggagat tcatgccagt ctggtgccag ggccatcaga    960
gaggcctggg gggcgccgca ggggacgccg gacaggcagc cccggtgagg gagcccacgt    1020
gtcagcagct gtggccaaga ctgtgaggat gacgctagtg attgtggtcg tctatgtgct    1080
gtgctgggca cccttcttcc tggtgcagct gtgggccgcg tgggacccgg aggcacctct    1140
ggaaggggcg ccctttgtgc tactcatgtt gctggccagc ctcaacagct gcaccaaccc    1200
ctggatctat gcatctttca gcagcagcgt gtcctcagag ctgcgaagct tgctctgctg    1260
tgcccgggga cgcaccccac ccagcctggg tccccaagat gagtcctgca ccaccgccag    1320
ctcctccctg gccaaggaca cttcatcgtg aggagctgtt gggtgtcttg cctctagagg    1380
ctttgagaag ctcagctgcc ttcctggggc tggtcctggg agccactggg agggggaccc    1440
gtggagaatt ggccagagcc tgtggccccg aggctgggac actgtgtggc cctggacaag    1500
ccacagcccc tgcctgggtc tccacatccc cagctgtatg aggagagctt caggccccag    1560
gactgtgggg gcccctcagg tcagctcact gagctgggtg taggaggggc tgcagcagag    1620
gcctgaggag tggcaggaaa gagggagcag gtgcccccag gtgagacagc ggtcccaggg    1680
gcctgaaaag gaaggaccag gctggggcca ggggaccttc ctgtctccgc ctttctaatc    1740
cctccctcct cattctctcc ctaataaaaa ttggagctct tttccacatg gcaaggggtc    1800
tccttggaa                                                            1809
<210>24
<211>26
<212>DNA
<213>人
<400>24
gaattcatgc tcatggcgtc caccac                                          26
<210>25
<211>27
<212>DNA
<213>人
<400>25
ggatcccgat gaagtgtcct tggccag                                        27
<210>26
<211>1266
<212>DNA
<213>人
<400>26
atggatgtgc tcagccctgg tcagggcaac aacaccacat caccaccggc tccctttgag    60
accggcggca acactactgg tatctccgac gtgaccgtca gctaccaagt gatcacctct    120
ctgctgctgg gcacgctcat cttctgcgcg gtgctgggca atgcgtgcgt ggtggctgcc    180
atcgccttgg agcgctccct gcagaacgtg gccaattatc ttattggctc tttggcggtc    240
accgacctca tggtgtcggt gttggtgctg cccatggccg cgctgtatca ggtgctcaac    300
aagtggacac tgggccaggt aacctgcgac ctgttcatcg ccctcgacgt gctgtgctgc    360
acctcatcca tcttgcacct gtgcgccatc gcgctggaca ggtactgggc catcacggac    420
cccatcgact acgtgaacaa gaggacgccc cggccgcgtg cgctcatctc gctcacttgg    480
cttattggct tcctcatctc tatcccgccc atcctgggct ggcgcacccc ggaagaccgc    540
tcggaccccg acgcatgcac cattagcaag gatcatggct acactatcta ttccaccttt    600
ggagctttct acatcccgct gctgctcatg ctggttctct atgggcgcat attccgagct    660
gcgcgcttcc gcatccgcaa gacggtcaaa aaggtggaga agaccggagc ggacacccgc    720
catggagcat ctcccgcccc gcagcccaag aagagtgtga atggagagtc ggggagcagg    780
aactggaggc tgggcgtgga gagcaaggct gggggtgctc tgtgcgccaa tggcgcggtg    840
aggcaaggtg acgatggcgc cgccctggag gtgatcgagg tgcaccgagt gggcaactcc    900
aaagagcact tgcctctgcc cagcgaggct ggtcctaccc cttgtgcccc cgcctctttc    960
gagaggaaaa atgagcgcaa cgccgaggcg aagcgcaaga tggccctggc ccgagagagg    1020
aagacagtga agacgctggg catcatcatg ggcaccttca tcctctgctg gctgcccttc    1080
ttcatcgtgg ctcttgttct gcccttctgc gagagcagct gccacatgcc caccctgttg    1140
ggcgccataa tcaattggct gggctactcc aactctctgc ttaaccccgt catttacgca    1200
tacttcaaca aggactttca aaacgcgttt aagaagatca ttaagtgtaa cttctgccgc    1260
cagtga                                                               1266
<210>27
<211>26
<212>DNA
<213>人
<400>27
gaattcatgg atgtgctcag ccctgg                                         26
<210>28
<211>25
<212>DNA
<213>人
<400>28
ggatccctgg cggcagaact tacac                                          25
<210>29
<211>1401
<212>DNA
<213>人
<400>29
atgaataact caacaaactc ctctaacaat agcctggctc ttacaagtcc ttataagaca    60
tttgaagtgg tgtttattgt cctggtggct ggatccctca gtttggtgac cattatcggg    120
aacatcctag tcatggtttc cattaaagtc aaccgccacc tccagaccgt caacaattac    180
tttttattca gcttggcctg tgctgacctt atcataggtg ttttctccat gaacttgtac    240
accctctaca ctgtgattgg ttactggcct ttgggacctg tggtgtgtga cctttggcta    300
gccctggact atgtggtcag caatgcctca gttatgaatc tgctcatcat cagctttgac    360
aggtacttct gtgtcacaaa acctctgacc tacccagtca agcggaccac aaaaatggca    420
ggtatgatga ttgcagctgc ctgggtcctc tctttcatcc tctgggctcc agccattctc    480
ttctggcagt tcattgtagg ggtgagaact gtggaggatg gggagtgcta cattcagttt    540
ttttccaatg ctgctgtcac ctttggtacg gctattgcag ccttctattt gccagtgatc    600
atcatgactg tgctatattg gcacatatcc cgagccagca agagcaggat aaagaaggac    660
aagaaggagc ctgttgccaa ccaagacccc gtttctccaa gtctggtaca aggaaggata    720
gtgaagccaa acaataacaa catgcccagc agtgacgatg gcctggagca caacaaaatc    780
cagaatggca aagcccccag ggatcctgtg actgaaaact gtgttcaggg agaggagaag    840
gagagctcca atgactccac ctcagtcagt gctgttgcct ctaatatgag agatgatgaa    900
ataacccagg atgaaaacac agtttccact tccctgggcc attccaaaga tgagaactct    960
aagcaaacat gcatcagaat tggcaccaag accccaaaaa gtgactcatg taccccaact    1020
aataccaccg tggaggtagt ggggtcttca ggtcagaatg gagatgaaaa gcagaatatt    1080
gtagcccgca agattgtgaa gatgactaag cagcctgcaa aaaagaagcc tcctccttcc    1140
cgggaaaaga aagtcaccag gacaatcttg gctattctgt tggctttcat catcacttgg    1200
gccccataca atgtcatggt gctcattaac accttttgtg caccttgcat ccccaacact    1260
gtgtggacaa ttggttactg gctttgttac atcaacagca ctatcaaccc tgcctgctat    1320
gcactttgca atgccacctt caagaagacc tttaaacacc ttctcatgtg tcattataag    1380
aacataggcg ctacaaggta a                                              1401
<210>30
<211>27
<212>DNA
<213>人
<400>30
gaattcatga ataactcaac aaactcc                                        27
<210>31
<211>25
<212>DNA
<213>人
<400>31
agatctcctt gtagcgccta tgttc                                          25
<210>32
<211>3655
<212>DNA
<213>人
<400>32
cttcagatag attatatctg gagtgaagga tcctgccacc tacgtatctg gcatagtatt    60
ctgtgtagtg ggatgagcag agaacaaaaa caaaataatc cagtgagaaa agcccgtaaa    120
taaaccttca gaccagagat ctattctcca gcttatttta agctcaactt aaaaagaaga    180
actgttctct gattcttttc gccttcaata cacttaatga tttaactcca ccctccttca    240
aaagaaacag catttcctac ttttatactg tctatatgat tgatttgcac agctcatctg    300
gccagaagag ctgagacatc cgttccccta caagaaactc tccccgggtg gaacaagatg    360
gattatcaag tgtcaagtcc aatctatgac atcaattatt atacatcgga gccctgccaa    420
aaaatcaatg tgaagcaaat cgcagcccgc ctcctgcctc cgctctactc actggtgttc    480
atctttggtt ttgtgggcaa catgctggtc atcctcatcc tgataaactg caaaaggctg    540
aagagcatga ctgacatcta cctgctcaac ctggccatct ctgacctgtt tttccttctt    600
actgtcccct tctgggctca ctatgctgcc gcccagtggg actttggaaa tacaatgtgt    660
caactcttga cagggctcta ttttataggc ttcttctctg gaatcttctt catcatcctc    720
ctgacaatcg ataggtacct ggctgtcgtc catgctgtgt ttgctttaaa agccaggacg    780
gtcacctttg gggtggtgac aagtgtgatc acttgggtgg tggctgtgtt tgcgtctctc    840
ccaggaatca tctttaccag atctcaaaaa gaaggtcttc attacacctg cagctctcat    900
tttccataca gtcagtatca attctggaag aatttccaga cattaaagat agtcatcttg    960
gggctggtcc tgccgctgct tgtcatggtc atctgctact cgggaatcct aaaaactctg    1020
cttcggtgtc gaaatgagaa gaagaggcac agggctgtga ggcttatctt caccatcatg    1080
attgtttatt ttctcttctg ggctccctac aacattgtcc ttctcctgaa caccttccag    1140
gaattctttg gcctgaataa ttgcagtagc tctaacaggt tggaccaagc tatgcaggtg    1200
acagagactc ttgggatgac gcactgctgc atcaacccca tcatctatgc ctttgtcggg    1260
gagaagttca gaaactacct cttagtcttc ttccaaaagc acattgccaa acgcttctgc    1320
aaatgctgtt ctattttcca gcaagaggct cccgagcgag caagctcagt ttacacccga    1380
tccactgggg agcaggaaat atctgtgggc ttgtgacacg gactcaagtg ggctggtgac    1440
ccagtcagag ttgtgcacat ggcttagttt tcatacacag cctgggctgg gggtggggtg    1500
ggagaggtct tttttaaaag gaagttactg ttatagaggg tctaagattc atccatttat    1560
ttggcatctg tttaaagtag attagatctt ttaagcccat caattataga aagccaaatc    1620
aaaatatgtt gatgaaaaat agcaaccttt ttatctcccc ttcacatgca tcaagttatt    1680
gacaaactct cccttcactc cgaaagttcc ttatgtatat ttaaaagaaa gcctcagaga    1740
attgctgatt cttgagttta gtgatctgaa cagaaatacc aaaattattt cagaaatgta    1800
caacttttta cctagtacaa ggcaacatat aggttgtaaa tgtgtttaaa acaggtcttt    1860
gtcttgctat ggggagaaaa gacatgaata tgattagtaa agaaatgaca cttttcatgt    1920
gtgatttccc ctccaaggta tggttaataa gtttcactga cttagaacca ggcgagagac    1980
ttgtggcctg ggagagctgg ggaagcttct taaatgagaa ggaatttgag ttggatcatc    2040
tattgctggc aaagacagaa gcctcactgc aagcactgca tgggcaagct tggctgtaga    2100
aggagacaga gctggttggg aagacatggg gaggaaggac aaggctagat catgaagaac    2160
cttgacggca ttgctccgtc taagtcatga gctgagcagg gagatcctgg ttggtgttgc    2220
agaaggttta ctctgtggcc aaaggagggt caggaaggat gagcatttag ggcaaggaga    2280
ccaccaacag ccctcaggtc agggtgagga tggcctctgc taagctcaag gcgtgaggat    2340
gggaaggagg gaggtattcg taaggatggg aaggagggag gtattcgtgc agcatatgag    2400
gatgcagagt cagcagaact ggggtggatt tggtttggaa gtgagggtca gagaggagtc    2460
agagagaatc cctagtcttc aagcagattg gagaaaccct tgaaaagaca tcaagcacag    2520
aaggaggagg aggaggttta ggtcaagaag aagatggatt ggtgtaaaag gatgggtctg    2580
gtttgcagag cttgaacaca gtctcaccca gactccaggc tgtctttcac tgaatgcttc    2640
tgacttcata gatttccttc ccatcccagc tgaaatactg aggggtctcc aggaggagac    2700
tagatttatg aatacacgag gtatgaggtc taggaacata cttcagctca cacatgagat    2760
ctaggtgagg attgattacc tagtagtcat ttcatgggtt gttgggagga ttctatgagg    2820
caaccacagg cagcatttag cacatactac acattcaata agcatcaaac tcttagttac    2880
tcattcaggg atagcactga gcaaagcatt gagcaaaggg gtcccatata ggtgagggaa    2940
gcctgaaaaa ctaagatgct gcctgcccag tgcacacaag tgtaggtatc attttctgca    3000
tttaaccgtc aataggcaaa ggggggaagg gacatattca tttggaaata agctgccttg    3060
agccttaaaa cccacaaaag tacaatttac cagcctccgt atttcagact gaatgggggt    3120
ggggggggcg ccttaggtac ttattccaga tgccttctcc agacaaacca gaagcaacag    3180
aaaaaatcgt ctctccctcc ctttgaaatg aatatacccc ttagtgtttg ggtatattca    3240
tttcaaaggg agagagagag gtttttttct gttctttctc atatgattgt gcacatactt    3300
gagactgttt tgaatttggg ggatggctaa aaccatcata gtacaggtaa ggtgagggaa    3360
tagtaagtgg tgagaactac tcagggaatg aaggtgtcag aataataaga ggtgctactg    3420
actttctcag cctctgaata tgaacggtga gcattgtggc tgtcagcagg aagcaacgaa    3480
gggaaatgtc tttccttttg ctcttaagtt gtggagagtg caacagtagc ataggaccct    3540
accctctggg ccaagtcaaa gacattctga catcttagta tttgcatatt cttatgtatg    3600
tgaaagttac aaattgcttg aaagaaaata tgcatctaat aaaaaacacc ttcta         3655
<210>33
<211>31
<212>DNA
<213>人
<400>33
gcggccgcat ggattatcaa gtgtcaagtc c                                   31
<210>34
<211>25
<212>DNA
<213>人
<400>34
ggatccctgg cggcagaact tacac                                          25
<210>35
<211>33
<212>DNA
<213>人
<400>35
ggtctccaat tcatggatta tcaagtgtca agt                                  33
<210>36
<211>21
<212>DNA
<213>人
<400>36
gacgacagcc aggtacctat c                                               21
<210>37
<211>2643
<212>DNA
<213>人
<400>37
ggcagccgtc cggggccgcc actctcctcg gccggtccct ggctcccgga ggcggccgcg    60
cgtggatgcg gcgggagctg gaagcctcaa gcagccggcg ccgtctctgc cccggggcgc    120
cctatggctt gaagagcctg gccacccagt ggctccaccg ccctgatgga tccactgaat    180
ctgtcctggt atgatgatga tctggagagg cagaactgga gccggccctt caacgggtca    240
gacgggaagg cggacagacc ccactacaac tactatgcca cactgctcac cctgctcatc    300
gctgtcatcg tcttcggcaa cgtgctggtg tgcatggctg tgtcccgcga gaaggcgctg    360
cagaccacca ccaactacct gatcgtcagc ctcgcagtgg ccgacctcct cgtcgccaca    420
ctggtcatgc cctgggttgt ctacctggag gtggtaggtg agtggaaatt cagcaggatt    480
cactgtgaca tcttcgtcac tctggacgtc atgatgtgca cggcgagcat cctgaacttg    540
tgtgccatca gcatcgacag gtacacagct gtggccatgc ccatgctgta caatacgcgc    600
tacagctcca agcgccgggt caccgtcatg atctccatcg tctgggtcct gtccttcacc    660
atctcctgcc cactcctctt cggactcaat aacgcagacc agaacgagtg catcattgcc    720
aacccggcct tcgtggtcta ctcctccatc gtctccttct acgtgccctt cattgtcacc    780
ctgctggtct acatcaagat ctacattgtc ctccgcagac gccgcaagcg agtcaacacc    840
aaacgcagca gccgagcttt cagggcccac ctgagggctc cactaaaggg caactgtact    900
caccccgagg acatgaaact ctgcaccgtt atcatgaagt ctaatgggag tttcccagtg    960
aacaggcgga gagtggaggc tgcccggcga gcccaggagc tggagatgga gatgctctcc    1020
agcaccagcc cacccgagag gacccggtac agccccatcc cacccagcca ccaccagctg    1080
actctccccg acccgtccca ccatggtctc cacagcactc ccgacagccc cgccaaacca    1140
gagaagaatg ggcatgccaa agaccacccc aagattgcca agatctttga gatccagacc    1200
atgcccaatg gcaaaacccg gacctccctc aagaccatga gccgtaggaa gctctcccag    1260
cagaaggaga agaaagccac tcagatgctc gccattgttc tcggcgtgtt catcatctgc    1320
tggctgccct tcttcatcac acacatcctg aacatacact gtgactgcaa catcccgcct    1380
gtcctgtaca gcgccttcac gtggctgggc tatgtcaaca gcgccgtgaa ccccatcatc    1440
tacaccacct tcaacattga gttccgcaag gccttcctga agatcctcca ctgctgactc    1500
tgctgcctgc ccgcacagca gcctgcttcc cacctccctg cccaggccgg ccagcctcac    1560
ccttgcgaac cgtgagcagg aaggcctggg tggatcggcc tcctcttcac cccggcaggc    1620
cctgcagtgt tcgcttggct ccatgctcct cactgcccgc acaccctcac tctgccaggg    1680
cagtgctagt gagctgggca tggtaccagc cctggggctg ggccccccag ctcaggggca    1740
gctcatagag tcccccctcc cacctccagt ccccctatcc ttggcaccaa agatgcagcc    1800
gccttccttg accttcctct ggggctctag ggttgctgga gcctgagtca gggcccagag    1860
gctgagtttt ctctttgtgg ggcttggcgt ggagcaggcg gtggggagag atggacagtt    1920
cacaccctgc aaggcccaca ggaggcaagc aagctctctt gccgaggagc caggcaactt    1980
cagtcctggg agacccatgt aaataccaga ctgcaggttg gaccccagag attcccaagc    2040
caaaaacctt agctccctcc cgcaccccga tgtggacctc tactttccag gctagtccgg    2100
acccacctca ccccgttaca gctccccaag tggtttccac atgctctgag aagaggagcc    2160
ctcatcttga agggcccagg agggtctatg gggagaggaa ctccttggcc tagcccaccc    2220
tgctgccttc tgacggccct gcaatgtatc ccttctcaca gcacatgctg gccagcctgg    2280
ggcctggcag ggaggtcagg ccctggaact ctatctgggc ctgggctagg ggacatcaga    2340
ggttctttga gggactgcct ctgccacact ctgacgcaaa accactttcc ttttctattc    2400
cttctggcct ttcctctctc ctgtttccct tcccttccac tgcctctgcc ttagaggagc    2460
ccacggctaa gaggctgctg aaaaccatct ggcctggcct ggccctgccc tgaggaagga    2520
ggggaagctg cagcttggga gagcccctgg ggcctagact ctgtaacatc actatccatg    2580
caccaaacta ataaaacttt gacgagtcac cttccaggac ccctgggtaa aaaaaaaaaa    2640
aaa                                                                  2643
<210>38
<211>27
<212>DNA
<213>人
<400>38
gaattcatgg atccactgaa tctgtcc                                         27
<210>39
<211>25
<212>DNA
<213>人
<400>39
agatctgcag tggaggatct tcagg                                           25
<210>40
<211>1301
<212>DNA
<213>人
<400>40
atgggcgaca aagggacgcg agtgttcaag aaggccagtc caaatggaaa gctcaccgtc    60
tacctgggaa agcgggactt tgtggaccac atcgacctcg tggaccctgt ggatggtgtg    120
gtcctggtgg atcctgagta tctcaaagag cggagagtct atgtgacgct gacctgcgcc    180
ttccgctatg gccgggagga cctggatgtc ctgggcctga cctttcgcaa ggacctgttt    240
gtggccaacg tacagtcgtt cccaccggcc cccgaggaca agaagcccct gacgcggctg    300
caggaacgcc tcatcaagaa gctgggcgag cacgcttacc ctttcacctt tgagatccct    360
ccaaaccttc catgttctgt gacactgcag ccggggcccg aagacacggg gaaggcttgc    420
ggtgtggact atgaagtcaa agccttctgc gcggagaatt tggaggagaa gatccacaag    480
cggaattctg tgcgtctggt catccggaag gttcagtatg ccccagagag gcctggcccc    540
cagcccacag ccgagaccac caggcagttc ctcatgtcgg acaagccctt gcacctagaa    600
gcctctctgg ataaggagat ctattaccat ggagaaccca tcagcgtcaa cgtccacgtc    660
accaacaaca ccaacaagac ggtgaagaag atcaagatct cagtgcgcca gtatgcagac    720
atctgccttt tcaacacagc tcagtacaag tgccctgttg ccatggaaga ggctgatgac    780
actgtggcac ccagctcgac gttctgcaag gtctacacac tgaccccctt cctagccaat    840
aaccgagaga agcggggcct cgccttggac gggaagctca agcacgaaga cacgaacttg    900
gcctctagca ccctgttgag ggaaggtgcc aaccgtgaga tcctggggat cattgtttcc    960
tacaaagtga aagtgaagct ggtggtgtct cggggcggcc tgttgggaga tcttgcatcc    1020
agcgacgtgg ccgtggaact gcccttcacc ctaatgcacc ccaagcccaa agaggaaccc    1080
ccgcatcggg aagttccaga gaacgagacg ccagtagata ccaatctcat agaacttgac    1140
acaaatgatg acgacattgt atttgaggac tttgctcgcc agagactgaa aggcatgaag    1200
gatgacaagg aggaagagga ggatggtacc ggctctccac agctcaacaa cagatagacg    1260
ggccggccct gcctccacgt ggctccggct ccactctcgt g                        1301
<210>41
<211>30
<212>DNA
<213>人
<400>41
ggtaccatgg gcgacaaagg gacgcgagtg                        30
<210>42
<211>48
<212>DNA
<213>人
<400>42
ggatcctctg ttgttgagct gtggagagcc tgtaccatcc tcctcttc    48
<210>43
<211>27
<212>DNA
<213>人
<400>43
ggatccattt gtgtcaagtt ctatgag                            27
<210>44
<211>27
<212>DNA
<213>人
<400>44
ggtaccatgg gggagaaacc cgggacc                             27
<210>45
<211>24
<212>DNA
<213>人
<400>45
ggatcctgtg gcatagttgg tatc                                24
<210>46
<211>33
<212>DNA
<213>人
<400>46
tgtgcgcgcg gacgcacccc acccagcctg ggt                     33
<210>47
<211>27
<212>DNA
<213>人
<400>47
gaattcatgg atccactgaa tctgtcc                            27
<210>48
<211>33
<212>DNA
<213>人
<400>48
tgtgcgcgcg cagtggagga tcttcaggaa ggc    33
<210>49
<211>33
<212>DNA
<213>人
<400>49
gcggccgcca ccatgaacgg taccgaaggc cca    33
<210>50
<211>30
<212>DNA
<213>人
<400>50
tgtgcgcgcg cacagaagct cctggaaggc        30
<210>51
<211>1602
<212>DNA
<213>人
<400>51
gagctccgtg ctgggaggtg ggaagggggc ttgaccctgg ggactcaggc agtctgggga    60
cagttccacc aggggccggt gcctagaatt ggtgagggag gcacctcagg ggctggggga    120
gaaggaacga gcgctcttcg cccctctctg gcacccagcg gcgcgcctgc tggccggaaa    180
ggcagcgaga agtccgttct ccctgtcctg cccccggcga cttgcggccc gggtgggagt    240
ccgcaggctc cgggtcccca gcgccgctgg ccagggcgcg ggcaaagttt gcctctccgc    300
gtccagccgg ttctttcgct cccgcagcgc cgcaggtgcc gcctgtcctc gccttcctgc    360
tgcaatcgcc ccaccatgga ctccccgatc cagatcttcc gcggggagcc gggccctacc    420
tgcgccccga gcgcctgcct gccccccaac agcagcgcct ggtttcccgg ctgggccgag    480
cccgacagca acggcagcgc cggctcggag gacgcgcagc tggagcccgc gcacatctcc    540
ccggccatcc cggtcatcat cacggcggtc tactccgtag tgttcgtcgt gggcttggtg    600
ggcaactcgc tggtcatgtt cgtgatcatc cgatacacaa agatgaagac agcaaccaac    660
atttacatat ttaacctggc tttggcagat gctttagtta ctacaaccat gccctttcag    720
agtacggtct acttgatgaa ttcctggcct tttggggatg tgctgtgcaa gatagtaatt    780
tccattgatt actacaacat gttcaccagc atcttcacct tgaccatgat gagcgtggac    840
cgctacattg ccgtgtgcca ccccgtgaag gctttggact tccgcacacc cttgaaggca    900
aagatcatca atatctgcat ctggctgctg tcgtcatctg ttggcatctc tgcaatagtc    960
cttggaggca ccaaagtcag ggaagacgtc gatgtcattg agtgctcctt gcagttccca    1020
gatgatgact actcctggtg ggacctcttc atgaagatct gcgtcttcat ctttgccttc    1080
gtgatccctg tcctcatcat catcgtctgc tacaccctga tgatcctgcg tctcaagagc    1140
gtccggctcc tttctggctc ccgagagaaa gatcgcaacc tgcgtaggat caccagactg    1200
gtcctggtgg tggtggcagt cttcgtcgtc tgctggactc ccattcacat attcatcctg    1260
gtggaggctc tggggagcac ctcccacagc acagctgctc tctccagcta ttacttctgc    1320
atcgccttag gctataccaa cagtagcctg aatcccattc tctacgcctt tcttgatgaa    1380
aacttcaagc ggtgtttccg ggacttctgc tttccactga agatgaggat ggagcggcag    1440
agcactagca gagtccgaaa tacagttcag gatcctgctt acctgaggga catcgatggg    1500
atgaataaac cagtatgact agtcgtggag atgtcttcgt acagttcttc gggaagagag    1560
gagttcaatg atctaggttt aactcagatc actactgcag tc                       1602
<210>52
<211>24
<212>DNA
<213>人
<400>52
ggtctacttg atgaattcct ggcc       24
<210>53
<211>27
<212>DNA
<213>人
<400>53
gcgcgcacag aagtcccgga aacaccg    27
<210>54
<211>10
<212>PRT
<213>人
<400>54
Gly Ser Glu Asn Leu Tyr Phe Gln Leu Arg
                5                   10
<210>55
<211>881
<212>PRT
<213>人
<400>55
Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu
                5                   10                  15
Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu
            20                  25                  30
Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro
        35                  40                  45
Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu
    50                  55                  60
Glu Gln Leu Phe Leu Leu Ile Phe Pro Arg Glu Asp Leu Asp Met Ile
65                  70                  75                  80
Leu Lys Met Asp Ser Leu Gln Asp Ile Lys Ala Leu Leu Thr Gly Leu
                85                  90                  95
Phe Val Gln Asp Asn Val Asn Lys Asp Ala Val Thr Asp Arg Leu Ala
            100                 105                 110
Ser Val Glu Thr Asp Met Pro Leu Thr Leu Arg Gln His Arg Ile Ser
        115                 120                 125
Ala Thr Ser Ser Ser Glu Glu Ser Ser Asn Lys Gly Gln Arg Gln Leu
    130                 135                 140
Thr Val Ser Ile Asp Ser Ala Ala His His Asp Asn Ser Thr Ile Pro
145                 150                 155                 160
Leu Asp Phe Met Pro Arg Asp Ala Leu His Gly Phe Asp Trp Ser Glu
                165                 170                 175
Glu Asp Asp Met Ser Asp Gly Leu Pro Phe Leu Lys Thr Asp Pro Asn
            180                 185                 190
Asn Asn Gly Phe Phe Gly Asp Gly Ser Leu Leu Cys Ile Leu Arg Ser
        195                 200                 205
Ile Gly Phe Lys Pro Glu Asn Tyr Thr Asn Ser Asn Val Asn Arg Leu
    210                 215                 220
Pro Thr Met Ile Thr Asp Arg Tyr Thr Leu Ala Ser Arg Ser Thr Thr
225                 230                 235                 240
Ser Arg Leu Leu Gln Ser Tyr Leu Asn Asn Phe His Pro Tyr Cys Pro
                245                 250                 255
Ile Val His Ser Pro Thr Leu Met Met Leu Tyr Asn Asn Gln Ile Glu
            260                 265                 270
Ile Ala Ser Lys Asp Gln Trp Gln Ile Leu Phe Asn Cys Ile Leu Ala
        275                 280                 285
Ile Gly Ala Trp Cys Ile Glu Gly Glu Ser Thr Asp Ile Asp Val Phe
    290                 295                 300
Tyr Tyr Gln Asn Ala Lys Ser His Leu Thr Ser Lys Val Phe Glu Ser
305                 310                 315                 320
Gly Ser Ile Ile Leu Val Thr Ala Leu His Leu Leu Ser Arg Tyr Thr
                325                 330                 335
Gln Trp Arg Gln Lys Thr Asn Thr Ser Tyr Asn Phe His Ser Phe Ser
            340                 345                 350
Ile Arg Met Ala Ile Ser Leu Gly Leu Asn Arg Asp Leu Pro Ser Ser
        355                 360                 365
Phe Ser Asp Ser Ser Ile Leu Glu Gln Arg Arg Arg Ile Trp Trp Ser
    370                 375                 380
Val Tyr Ser Trp Glu Ile Gln Leu Ser Leu Leu Tyr Gly Arg Ser Ile
385                 390                 395                 400
Gln Leu Ser Gln Asn Thr Ile Ser Phe Pro Ser Ser Val Asp Asp Val
                405                 410                 415
Gln Arg Thr Thr Thr Gly Pro Thr Ile Tyr His Gly Ile Ile Glu Thr
            420                 425                 430
Ala Arg Leu Leu Gln Val Phe Thr Lys Ile Tyr Glu Leu Asp Lys Thr
        435                 440                 445
Val Thr Ala Glu Lys Ser Pro Ile Cys Ala Lys Lys Cys Leu Met Ile
    450                 455                 460
Cys Asn Glu Ile Glu Glu Val Ser Arg Gln Ala Pro Lys Phe Leu Gln
465                 470                 475                 480
Met Asp Ile Ser Thr Thr Ala Leu Thr Asn Leu Leu Lys Glu His Pro
                485                 490                 495
Trp Leu Ser Phe Thr Arg Phe Glu Leu Lys Trp Lys Gln Leu Ser Leu
            500                 505                 510
Ile Ile Tyr Val Leu Arg Asp Phe Phe Thr Asn Phe Thr Gln Lys Lys
        515                 520                 525
Ser Gln Leu Glu Gln Asp Gln Asn Asp His Gln Ser Tyr Glu Val Lys
    530                 535                 540
Arg Cys Ser Ile Met Leu Ser Asp Ala Ala Gln Arg Thr Val Met Ser
545                 550                 555                 560
Val Ser Ser Tyr Met Asp Asn His Asn Val Thr Pro Tyr Phe Ala Trp
                565                 570                 575
Asn Cys Ser Tyr Tyr Leu Phe Asn Ala Val Leu Val Pro Ile Lys Thr
            580                 585                 590
Leu Leu Ser Asn Ser Lys Ser Asn Ala Glu Asn Asn Glu Thr Ala Gln
        595                 600                 605
Leu Leu Gln Gln Ile Asn Thr Val Leu Met Leu Leu Lys Lys Leu Ala
    610                 615                 620
Thr Phe Lys Ile Gln Thr Cys Glu Lys Tyr Ile Gln Val Leu Glu Glu
625                 630                 635                 640
Val Cys Ala Pro Phe Leu Leu Ser Gln Cys Ala Ile Pro Leu Pro His
                645                 650                 655
Ile Ser Tyr Asn Asn Ser Asn Gly Ser Ala Ile Lys Asn Ile Val Gly
            660                 665                 670
Ser Ala Thr Ile Ala Gln Tyr Pro Thr Leu Pro Glu Glu Asn Val Asn
        675                 680                 685
Asn Ile Ser Val Lys Tyr Val Ser Pro Gly Ser Val Gly Pro Ser Pro
    690                 695                 700
Val Pro Leu Lys Ser Gly Ala Ser Phe Ser Asp Leu Val Lys Leu Leu
705                 710                 715                 720
Ser Asn Arg Pro Pro Ser Arg Asn Ser Pro Val  ThrIle Pro Arg Ser
                725                 730                 735
Thr Pro Ser His Arg Ser Val Thr Pro Phe Leu Gly Gln Gln Gln Gln
            740                 745                 750
Leu Gln Ser Leu Val Pro Leu Thr Pro Ser Ala Leu Phe Gly Gly Ala
        755                 760                 765
Asn Phe Asn Gln Ser Gly Asn Ile Ala Asp Ser Ser Leu Ser Phe Thr
    770                 775                 780
Phe Thr Asn Ser Ser Asn Gly Pro Asn Leu Ile Thr Thr Gln Thr Asn
785                 790                 795                 800
Ser Gln Ala Leu Ser Gln Pro Ile Ala Ser Ser Asn Val His Asp Asn
                805                 810                 815
Phe Met Asn Asn Glu Ile Thr Ala Ser Lys Ile Asp Asp Gly Asn Asn
            820                 825                 830
Ser Lys Pro Leu Ser Pro Gly Trp Thr Asp Gln Thr Ala Tyr Asn Ala
        835                 840                 845
Phe Gly Ile Thr Thr Gly Met Phe Asn Thr Thr Thr Met Asp Asp Val
    850                 855                 860
Tyr Asn Tyr Leu Phe Asp Asp Glu Asp Thr Pro Pro Asn Pro Lys Lys
865                 870                 875                 880
Glu
<210>56
<211>13
<212>PRT
<213>人
<400>56
Pro Gln Lys Gly Ser Ala Ser Glu Lys Thr Met Val  Phe
                5                   10
<210>57
<211>549
<212>PRT
<213>人
<400>57
Met Asp Asp Leu Phe Pro Leu Ile Phe Pro Ser Glu Pro Ala Gln Ala
                5                   10                  15
Ser Gly Pro Tyr Val Glu Ile Ile Glu Gln Pro Lys Gln Arg Gly Met
            20                  25                  30
Arg Phe Arg Tyr Lys Cys Glu Gly Arg Ser Ala Gly Ser Ile Pro Gly
        35                  40                  45
Glu Arg Ser Thr Asp Thr Thr Lys Thr His Pro Thr Ile Lys Ile Asn
    50                  55                  60
Gly Tyr Thr Gly Pro Gly Thr Val Arg Ile Ser Leu Val Thr Lys Asp
65                  70                  75                  80
Pro Pro His Arg Pro His Pro His Glu Leu Val Gly Lys Asp Cys Arg
                85                  90                  95
Asp Gly Tyr Tyr Glu Ala Asp Leu Cys Pro Asp Arg Ser Ile His Ser
            100                 105                 110
Phe Gln Asn Leu Gly Ile Gln Cys Val Lys Lys Arg Asp Leu Glu Gln
        115                 120                 125
Ala Ile Ser Gln Arg Ile Gln Thr Asn Asn Asn Pro Phe His Val Pro
    130                 135                 140
Ile Glu Glu Gln Arg Gly Asp Tyr Asp Leu Asn Ala Val Arg Leu Cys
145                 150                 155                 160
Phe Gln Val Thr Val Arg Asp Pro Ala Gly Arg Pro Leu Leu Leu Thr
                165                 170                 175
Pro Val Leu Ser His  Pro Ile Phe Asp Asn Arg Ala Pro Asn Thr Ala
            180                 185                 190
Glu Leu Lys Ile Cys Arg Val Asn Arg Asn Ser Gly Ser Cys Leu Gly
        195                 200                 205
Gly Asp Glu Ile Phe Leu Leu Cys Asp Lys Val Gln Lys Glu Asp Ile
    210                 215                 220
Glu Val Tyr Phe Thr Gly Pro Gly Trp Glu Ala Arg Gly Ser Phe Ser
225                 230                 235                 240
Gln Ala Asp Val His Arg Gln Val Ala Ile Val Phe Arg Thr Pro Pro
                245                250                255
Tyr Ala Asp Pro Ser Leu Gln Ala Pro Val Arg Val Ser Met Gln Leu
            260                 265                 270
Arg Arg Pro Ser Asp Arg Glu Leu Ser Glu Pro Met Glu Phe Gln Tyr
        275                 280                 285
Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg
    290                 295                 300
Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Asn Gly
305                 310                 315                 320
Pro Thr Glu Pro Arg Pro Pro Thr Arg Arg Ile Ala Val Pro Thr Arg
               325                 330                 335
Asn Ser Thr Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Thr Phe Pro
             340                 345                 350
Ala Ser Leu Ser Thr Ile Asn Phe Asp Glu Phe Ser Pro Met Leu Leu
        355                 360                 365
Pro Ser Gly Gln Ile Ser Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser
    370                 375                 380
Ala Pro Val Leu Ala Gln Thr Met Val Pro Ser Ser Ala Met Val Pro
385                 390                 395                 400
Leu Ala Gln Pro Pro Ala Pro Ala Pro Val Leu Thr Pro Gly Pro Pro
                405                 410                 415
Gln Ser Leu Ser Ala Pro Val Pro Lys Ser Thr Gln Ala Gly Glu Gly
            420                 425                 430
Thr Leu Ser Glu Ala Leu Leu His Leu Gln Phe Asp Ala Asp Glu Asp
        435                 440                 445
Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Gly Val Phe Thr Asp
    450                 455                 460
Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly
465                 470                 475                480
Val Ser Met Ser His Ser Thr Ala Glu Pro Met Leu Met Glu Tyr Pro
                485                 490                 495
Glu Ala Ile Thr Arg Leu Val Thr Gly Ser Gln Arg Pro Pro Asp Pro
            500                 505                 510
Ala Pro Thr Pro Leu Gly Thr Ser Gly Leu Pro Asn Gly Leu Ser Gly
        515                 520                 525
Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu
    530                 535                 540
Ser Gln Ile Ser Ser
545
<210>58
<211>1833
<212>DNA
<213>人
<400>58
ggaggtggga ggagggagtg acgagtcaag gaggagacag ggacgcagga gggtgcaagg    60
aagtgtctta actgagacgg gggtaaggca agagagggtg gaggaaattc tgcaggagac    120
aggcttcctc cagggtctgg agaacccaga ggcagctcct cctgagtgct gggaaggact    180
ctgggcatct tcagcccttc ttactctctg aggctcaagc cagaaattca ggctgcttgc    240
agagtgggtg acagagccac ggagctggtg tccctgggac cctctgcccg tcttctctcc    300
actccccagc atggaggaag gtggtgattt tgacaactac tatggggcag acaaccagtc    360
tgagtgtgag tacacagact ggaaatcctc gggggccctc atccctgcca tctacatgtt    420
ggtcttcctc ctgggcacca cgggcaacgg tctggtgctc tggaccgtgt ttcggagcag    480
ccgggagaag aggcgctcag ctgatatctt cattgctagc ctggcggtgg ctgacctgac    540
cttcgtggtg acgctgcccc tgtgggctac ctacacgtac cgggactatg actggccctt    600
tgggaccttc ttctgcaagc tcagcagcta cctcatcttc gtcaacatgt acgccagcgt    660
cttctgcctc accggcctca gcttcgaccg ctacctggcc atcgtgaggc cagtggccaa    720
tgctcggctg aggctgcggg tcagcggggc cgtggccacg gcagttcttt gggtgctggc    780
cgccctcctg gccatgcctg tcatggtgtt acgcaccacc ggggacttgg agaacaccac    840
taaggtgcag tgctacatgg actactccat ggtggccact gtgagctcag agtgggcctg    900
ggaggtgggc cttggggtct cgtccaccac cgtgggcttt gtggtgccct tcaccatcat    960
gctgacctgt tacttcttca tcgcccaaac catcgctggc cacttccgca aggaacgcat    1020
cgagggcctg cggaagcggc gccggctgct cagcatcatc gtggtgctgg tggtgacctt    1080
tgccctgtgc tggatgccct accacctggt gaagacgctg tacatgctgg gcagcctgct    1140
gcactggccc tgtgactttg acctcttcct catgaacatc ttcccctact gcacctgcat    1200
cagctacgtc aacagctgcc tcaacccctt cctctatgcc tttttcgacc cccgcttccg    1260
ccaggcctgc acctccatgc tctgctgtgg ccagagcagg tgcgcaggca cctcccacag    1320
cagcagtggg gagaagtcag ccagctactc ttcggggcac agccaggggc ccggccccaa    1380
catgggcaag ggtggagaac agatgcacga gaaatccatc ccctacagcc aggagaccct    1440
tgtggttgac tagggctggg agcagagaga agcctggcgc cctcggccct ccccggcctt    1500
tgcccttgct ttctgaaaat cagagtcacc tcctctgccc agagctgtcc tcaaagcatc    1560
cagtgaacac tggaagaggc ttctagaagg gaagaaattg tccctctgag gccgccgtgg    1620
gtgacctgca gagacttcct gcctggaact catctgtgaa ctgggacaga agcagaggag    1680
gctgcctgct gtgatacccc cttacctccc ccagtgcctt cttcagaata tctgcactgt    1740
cttctgatcc tgttagtcac tgtggttcat caaataaaac tgtttgtgca actgttgtgt    1800
ccaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa                                 1833
<210>59
<211>1666
<212>DNA
<213>人
<400>59
aactgcagcc agggagactc agactagaat ggaggtagaa agaactgatg cagagtgggt    60
ttaattctaa gcctttttgt ggctaagttt tgttgttgtt aacttattga atttagagtt    120
gtattgcact ggtcatgtga aagccagagc agcaccagtg tcaaaatagt gacagagagt    180
tttgaatacc atagttagta tatatgtact cagagtattt ttattaaaga aggcaaagag    240
cccggcatag atcttatctt catcttcact cggttgcaaa atcaatagtt aagaaatagc    300
atctaaggga acttttaggt gggaaaaaaa atctagagat ggctctaaat gactgtttcc    360
ttctgaactt ggaggtggac catttcatgc actgcaacat ctccagtcac agtgcggatc    420
tccccgtgaa cgatgactgg tcccacccgg ggatcctcta tgtcatccct gcagtttatg    480
gggttatcat tctgataggc ctcattggca acatcacttt gatcaagatc ttctgtacag    540
tcaagtccat gcgaaacgtt ccaaacctgt tcatttccag tctggctttg ggagacctgc    600
tcctcctaat aacgtgtgct ccagtggatg ccagcaggta cctggctgac agatggctat    660
ttggcaggat tggctgcaaa ctgatcccct ttatacagct tacctctgtt ggggtgtctg    720
tcttcacact cacggcgctc tcggcagaca gatacaaagc cattgtccgg ccaatggata    780
tccaggcctc ccatgccctg atgaagatct gcctcaaagc cgcctttatc tggatcatct    840
ccatgctgct ggccattcca gaggccgtgt tttctgacct ccatcccttc catgaggaaa    900
gcaccaacca gaccttcatt agctgtgccc catacccaca ctctaatgag cttcacccca    960
aaatccattc tatggcttcc tttctggtct tctacgtcat cccactgtcg atcatctctg    1020
tttactacta cttcattgct aaaaatctga tccagagtgc ttacaatctt cccgtggaag    1080
ggaatataca tgtcaagaag cagattgaat cccggaagcg acttgccaag acagtgctgg    1140
tgtttgtggg cctgttcgcc ttctgctggc tccccaatca tgtcatctac ctgtaccgct    1200
cctaccacta ctctgaggtg gacacctcca tgctccactt tgtcaccagc atctgtgccc    1260
gcctcctggc cttcaccaac tcctgcgtga acccctttgc cctctacctg ctgagcaaga    1320
gtttcaggaa acagttcaac actcagctgc tctgttgcca gcctggcctg atcatccggt    1380
ctcacagcac tggaaggagt acaacctgca tgacctccct caagagtacc aacccctccg    1440
tggccacctt tagcctcatc aatggaaaca tctgtcacga gcggtatgtc tagattgacc    1500
cttgattttg ccccctgagg gacggttttg ctttatggct agacaggaac ccttgcatcc    1560
attgttgtgt ctgtgccctc caaagagcct tcagaatgct cctgagtggt gtaggtgggg    1620
gtggggaggc ccaaatgatg gatcaccatt atattttgaa agaagc                   1666
<210>60
<211>2876
<212>DNA
<213>人
<400>60
tgaaacctaa cccgccctgg ggaggcgcgc agcagaggct ccgattcggg gcaggtgaga    60
ggctgacttt ctctcggtgc gtccagtgga gctctgagtt tcgaatcggc ggcggcggat    120
tccccgcgcg cccggcgtcg gggcttccag gaggatgcgg agccccagcg cggcgtggct    180
gctgggggcc gccatcctgc tagcagcctc tctctcctgc agtggcacca tccaaggaac    240
caatagatcc tctaaaggaa gaagccttat tggtaaggtt gatggcacat cccacgtcac    300
tggaaaagga gttacagttg aaacagtctt ttctgtggat gagttttctg catctgtcct    360
cactggaaaa ctgaccactg tcttccttcc aattgtctac acaattgtgt ttgtggtggg    420
tttgccaagt aacggcatgg ccctgtgggt ctttcttttc cgaactaaga agaagcaccc    480
tgctgtgatt tacatggcca atctggcctt ggctgacctc ctctctgtca tctggttccc    540
cttgaagatt gcctatcaca tacatggcaa caactggatt tatggggaag ctctttgtaa    600
tgtgcttatt ggctttttct atggcaacat gtactgttcc attctcttca tgacctgcct    660
cagtgtgcag aggtattggg tcatcgtgaa ccccatgggg cactccagga agaaggcaaa    720
cattgccatt ggcatctccc tggcaatatg gctgctgatt ctgctggtca ccatcccttt    780
gtatgtcgtg aagcagacca tcttcattcc tgccctgaac atcacgacct gtcatgatgt    840
tttgcctgag cagctcttgg tgggagacat gttcaattac ttcctctctc tggccattgg    900
ggtctttctg ttcccagcct tcctcacagc ctctgcctat gtgctgatga tcagaatgct    960
gcgatcttct gccatggatg aaaactcaga gaagaaaagg aagagggcca tcaaactcat    1020
tgtcactgtc ctggccatgt acctgatctg cttcactcct agtaaccttc tgcttgtggt    1080
gcattatttt ctgattaaga gccagggcca gagccatgtc tatgccctgt acattgtagc    1140
cctctgcctc tctaccctta acagctgcat cgaccccttt gtctattact ttgtttcaca    1200
tgatttcagg gatcatgcaa agaacgctct cctttgccga agtgtccgca ctgtaaagca    1260
gatgcaagta tccctcacct caaagaaaca ctccaggaaa tccagctctt actcttcaag    1320
ttcaaccact gttaagacct cctattgagt tttccaggtc ctcagatggg aattgcacag    1380
taggatgtgg aacctgttta atgttatgag gacgtgtctg ttatttccta atcaaaaagg    1440
tctcaccaca taccatgtgg atgcagcacc tctcaggatt gctaggagct cccctgtttg    1500
catgagaaaa gtagtccccc aaattaacat cagtgtctgt ttcagaatct ctctactcag    1560
atgaccccag aaactgaacc aacagaagca gacttttcag aagatggtga agacagaaac    1620
ccagtaactt gcaaaaagta gacttggtgt gaagactcac ttctcagctg aaattatata    1680
tatacacata tatatatttt acatctggga tcatgataga cttgttaggg cttcaaggcc    1740
ctcagagatg atcagtccaa ctgaacgacc ttacaaatga ggaaaccaag ataaatgagc    1800
tgccagaatc aggtttccaa tcaacagcag tgagttggga ttggacagta gaatttcaat    1860
gtccagtgag tgaggttctt gtaccacttc atcaaaatca tggatcttgg ctgggtgcgg    1920
tgcctcatgc ctgtaatcct agcactttgg gaggctgagg caggcaatca cttgaggtca    1980
ggagttcgag accagcctgg ccatcatggc gaaacctcat ctctactaaa aatacaaaag    2040
ttaaccaggt gtgtggtgca cgtttgtaat cccagttact caggaggctg aggcacaaga    2100
attgagtatc actttaactc aggaggcaga ggttgcagtg agccgagatt gcaccactgc    2160
actccagctt gggtgataaa ataaaataaa atagtcgtga atcttgttca aaatgcagat    2220
tcctcagatt caataatgag agctcagact gggaacaggg cccaggaatc tgtgtggtac    2280
aaacctgcat ggtgtttatg cacacagaga tttgagaacc attgttctga atgctgcttc    2340
catttgacaa agtgccgtga taatttttga aaagagaagc aaacaatggt gtctctttta    2400
tgttcagctt ataatgaaat ctgtttgttg acttattagg actttgaatt atttctttat    2460
taaccctctg agtttttgta tgtattatta ttaaagaaaa atgcaatcag gattttaa ac    2520
atgtaaatac aaattttgta taacttttga tgacttcagt gaaattttca ggtagtctga    2580
gtaatagatt gttttgccac ttagaatagc atttgccact tagtatttta aaaaataatt    2640
gttggagtat ttattgtcag ttttgttcac ttgttatcta atacaaaatt ataaagcctt    2700
cagagggttt ggaccacatc tctttggaaa atagtttgca acatatttaa gagatacttg    2760
atgccaaaat gactttatac aacgattgta tttgtgactt ttaaaaataa ttattttatt    2820
gtgtaattga tttataaata acaaaatttt ttttacaact taaaaaaaaa aaaaaa        2876
<210>61
<211>1668
<212>DNA
<213>人
<400>61
gggagataac tcgtgctcac aggaagccac gcacccttga aaggcaccgg gtccttctta    60
gcatcgtgct tcctgagcaa gcctggcatt gcctcacaga ccttcctcag agccgctttc    120
agaaaagcaa gctgcttctg gttgggccca gacctgcctt gaggagcctg tagagttaaa    180
aaatgaaccc cacggatata gcagacacca ccctcgatga aagcatatac agcaattact    240
atctgtatga aagtatcccc aagccttgca ccaaagaagg catcaaggca tttggggagc    300
tcttcctgcc cccactgtat tccttggttt ttgtatttgg tctgcttgga aattctgtgg    360
tggttctggt cctgttcaaa tacaagcggc tcaggtccat gactgatgtg tacctgctca    420
accttgccat ctcggatctg ctcttcgtgt tttccctccc tttttggggc tactatgcag    480
cagaccagtg ggtttttggg ctaggtctgt gcaagatgat ttcctggatg tacttggtgg    540
gcttttacag tggcatattc tttgtcatgc tcatgagcat tgatagatac ctggcaattg    600
tgcacgcggt gttttccttg agggcaagga ccttgactta tggggtcatc accagtttgg    660
ctacatggtc agtggctgtg ttcgcctccc ttcctggctt tctgttcagc acttgttata    720
ctgagcgcaa ccatacctac tgcaaaacca agtactctct caactccacg acgtggaagg    780
ttctcagctc cctggaaatc aacattctcg gattggtgat ccccttaggg atcatgctgt    840
tttgctactc catgatcatc aggaccttgc agcattgtaa aaatgagaag aagaacaagg    900
cggtgaagat gatctttgcc gtggtggtcc tcttccttgg gttctggaca ccttacaaca    960
tagtgctctt cctagagacc ctggtggagc tagaagtcct tcaggactgc acctttgaaa    1020
gatacttgga ctatgccatc caggccacag aaactctggc ttttgttcac tgctgcctta    1080
atcccatcat ctactttttt ctgggggaga aatttcgcaa gtacatccta cagctcttca    1140
aaacctgcag gggccttttt gtgctctgcc aatactgtgg gctcctccaa atttactctg    1200
ctgacacccc cagctcatct tacacgcagt ccaccatgga tcatgatctt catgatgctc    1260
tgtagaaaaa tgaaatggtg aaatgcagag tcaatgaact ttccacattc agagcttact    1320
taaaattgta ttttggtaag agatccctga gccagtgtca ggaggaaggc ttacacccac    1380
agtggaaaga cagcttctca tcctgcaggc agctttttct ctcccactag acaagtccag    1440
cctggcaagg gttcacctgg gctgaggcat ccttcctcac accaggcttg cctgcaggca    1500
tgagtcagtc tgatgagaac tctgagcagt gcttgaatga agttgtaggt aatattgcaa    1560
ggcaaagact attcccttct aacctgaact gatgggtttc tccagaggga attgcagagt    1620
actggctgat ggagtaaatc gctacctttt gctgtggcaa atgggccc                 1668
<210>62
<211>1679
<212>DNA
<213>人
<400>62
gtttgttggc tgcggcagca ggtagcaaag tgacgccgag ggcctgagtg ctccagtagc    60
caccgcatct ggagaaccag cggttaccat ggaggggatc agtatataca cttcagataa    120
ctacaccgag gaaatgggct caggggacta tgactccatg aaggaaccct gtttccgtga    180
agaaaatgct aatttcaata aaatcttcct gcccaccatc tactccatca tcttcttaac    240
tggcattgtg ggcaatggat tggtcatcct ggtcatgggt taccagaaga aactgagaag    300
catgacggac aagtacaggc tgcacctgtc agtggccgac ctcctctttg tcatcacgct    360
tcccttctgg gcagttgatg ccgtggcaaa ctggtacttt gggaacttcc tatgcaaggc    420
agtccatgtc atctacacag tcaacctcta cagcagtgtc ctcatcctgg ccttcatcag    480
tctggaccgc tacctggcca tcgtccacgc caccaacagt cagaggccaa ggaagctgtt    540
ggctgaaaag gtggtctatg ttggcgtctg gatccctgcc ctcctgctga ctattcccga    600
cttcatcttt gccaacgtca gtgaggcaga tgacagatat atctgtgacc gcttctaccc    660
caatgacttg tgggtggttg tgttccagtt tcagcacatc atggttggcc ttatcctgcc    720
tggtattgtc atcctgtcct gctattgcat tatcatctcc aagctgtcac actccaaggg    780
ccaccagaag cgcaaggccc tcaagaccac agtcatcctc atcctggctt tcttcgcctg    840
ttggctgcct tactacattg ggatcagcat cgactccttc atcctcctgg aaatcatcaa    900
gcaagggtgt gagtttgaga acactgtgca caagtggatt tccatcaccg aggccctagc    960
tttcttccac tgttgtctga accccatcct ctatgctttc cttggagcca aatttaaaac    1020
ctctgcccag cacgcactca cctctgtgag cagagggtcc agcctcaaga tcctctccaa    1080
aggaaagcga ggtggacatt catctgtttc cactgagtct gagtcttcaa gttttcactc    1140
cagctaacac agatgtaaaa gacttttttt tatacgataa ataacttttt tttaagttac    1200
acatttttca gatataaaag actgaccaat attgtacagt ttttattgct tgttggattt    1260
ttgtcttgtg tttctttagt ttttgtgaag tttaattgac ttatttatat aaattttttt    1320
tgtttcatat tgatgtgtgt ctaggcagga cctgtggcca agttcttagt tgctgtatgt    1380
ctcgtggtag gactgtagaa aagggaactg aacattccag agcgtgtagt gaatcacgta    1440
aagctagaaa tgatccccag ctgtttatgc atagataatc tctccattcc cgtggaacgt    1500
ttttcctgtt cttaagacgt gattttgctg tagaagatgg cacttataac caaagcccaa    1560
agtggtatag aaatgctggt ttttcagttt tcaggagtgg gttgatttca gcacctacag    1620
tgtacagtct tgtattaagt tgttaataaa agtacatgtt aaacttactt agtgttatg     1679
<210>63
<211>2859
<212>DNA
<213>人
<400>63
cattcagaga cagaaggtgg atagacaaat ctccaccttc agactggtag gctcctccag    60
aagccatcag acaggaagat gtgaaaatcc ccagcactca tcccagaatc actaagtggc    120
acctgtcctg ggccaaagtc ccaggacaga cctcattgtt cctctgtggg aatacctccc    180
caggagggca tcctggattt cccccttgca acccaggtca gaagtttcat cgtcaaggtt    240
gtttcatctt ttttttcctg tctaacagct ctgactacca cccaaccttg aggcacagtg    300
aagacatcgg tggccactcc aataacagca ggtcacagct gctcttctgg aggtgtccta    360
caggtgaaaa gcccagcgac ccagtcagga tttaagttta cctcaaaaat ggaagatttt    420
aacatggaga gtgacagctt tgaagatttc tggaaaggtg aagatcttag taattacagt    480
tacagctcta ccctgccccc ttttctacta gatgccgccc catgtgaacc agaatccctg    540
gaaatcaaca agtattttgt ggtcattatc tatgccctgg tattcctgct gagcctgctg    600
ggaaactccc tcgtgatgct ggtcatctta tacagcaggg tcggccgctc cgtcactgat    660
gtctacctgc tgaacctagc cttggccgac ctactctttg ccctgacctt gcccatctgg    720
gccgcctcca aggtgaatgg ctggattttt ggcacattcc tgtgcaaggt ggtctcactc    780
ctgaaggaag tcaacttcta tagtggcatc ctgctactgg cctgcatcag tgtggaccgt    840
tacctggcca ttgtccatgc cacacgcaca ctgacccaga agcgctactt ggtcaaattc    900
atatgtctca gcatctgggg tctgtccttg ctcctggccc tgcctgtctt acttttccga    960
aggaccgtct actcatccaa tgttagccca gcctgctatg aggacatggg caacaataca    1020
gcaaactggc ggatgctgtt acggatcctg ccccagtcct ttggcttcat cgtgccactg    1080
ctgatcatgc tgttctgcta cggattcacc ctgcgtacgc tgtttaaggc ccacatgggg    1140
cagaagcacc gggccatgcg ggtcatcttt gctgtcgtcc tcatcttcct gctctgctgg    1200
ctgccctaca acctggtcct gctggcagac accctcatga ggacccaggt gatccaggag    1260
acctgtgagc gccgcaatca catcgaccgg gctctggatg ccaccgagat tctgggcatc    1320
cttcacagct gcctcaaccc cctcatctac gccttcattg gccagaagtt tcgccatgga    1380
ctcctcaaga ttctagctat acatggcttg atcagcaagg actccctgcc caaagacagc    1440
aggccttcct ttgttggctc ttcttcaggg cacacttcca ctactctcta agacctcctg    1500
cctaagtgca gccccgtggg gttcctccct tctcttcaca gtcacattcc aagcctcatg    1560
tccactggtt cttcttggtc tcagtgtcaa tgcagccccc attgtggtca caggaagtag    1620
aggaggccac gttcttacta gtttcccttg catggtttag aaagcttgcc ctggtgcctc    1680
accccttgcc ataattacta tgtcatttgc tggagctctg cccatcctgc ccctgagccc    1740
atggcactct atgttctaag aagtgaaaat ctacactcca gtgagacagc tctgcatact    1800
cattaggatg gctagtatca aaagaaagaa aatcaggctg gccaacgggg tgaaaccctg    1860
tctctactaa aaatacaaaa aaaaaaaaaa attagccggg cgtggtggtg agtgcctgta    1920
atcacagcta cttgggaggc tgagatggga gaatcacttg aacccgggag gcagaggttg    1980
cagtgagccg agattgtgcc cctgcactcc agcctgagcg acagtgagac tctgtctcag    2040
tccatgaaga tgtagaggag aaactggaac tctcgagcgt tgctgggggg gattgtaaaa    2100
tggtgtgacc actgcagaag acagtatggc agctttcctc aaaacttcag acatagaatt    2160
aacacatgat cctgcaattc cacttatagg aattgaccca caagaaatga aagcagggac    2220
ttgaacccat atttgtacac caatattcat agcagcttat tcacaagacc caaaaggcag    2280
aagcaaccca aatgttcatc aatgaatgaa tgaatggcta agcaaaatgt gatatgtacc    2340
taacgaagta tccttcagcc tgaaagagga atgaagtact catacatgtt acaacacgga    2400
cgaaccttga aaactttatg ctaagtgaaa taagccagac atcaacagat aaatagttta    2460
tgattccacc tacatgaggt actgagagtg aacaaattta cagagacaga aagcagaaca    2520
gtgattacca gggactgagg ggaggggagc atgggaagtg acggtttaat gggcacaggg    2580
tttatgttta ggatgttgaa aaagttctgc agataaacag tagtgatagt tgtaccgcaa    2640
tgtgacttaa tgccactaaa ttgacactta aaaatggttt aaatggtcaa ttttgttatg    2700
tatattttat atcaatttaa aaaaaaacct gagccccaaa aggtatttta atcaccaagg    2760
ctgattaaac caaggctaga accacctgcc tatatttttt gttaaatgat ttcattcaat    2820
atcttttttt taataaacca tttttacttg ggtgtttat                           2859
<210>64
<211>27
<212>DNA
<213>人
<400>64
tgtgcgcgcg gccagagcag gtgcgca    27
<210>65
<211>26
<212>DNA
<213>人
<400>65
gaggatccgt caaccacaag ggtctc     26
<210>66
<211>27
<212>DNA
<213>人
<400>66
tgtgcgcgcg gcctgatcat ccggtct    27
<210>67
<211>26
<212>DNA
<213>人
<400>67
gaggatccga cataccgctc gtgaca    26
<210>68
<211>28
<212>DNA
<213>人
<400>68
tgtgcgcgca gtgtccgcac tgtaaagc   28
<210>69
<211>26
<212>DNA
<213>人
<400>69
gaggatccat aggaggtctt aacagt     26
<210>70
<211>27
<212>DNA
<213>人
<400>70
tgtgcgcgcg gcctttttgt gctctgc    27
<210>71
<211>26
<212>DNA
<213>人
<400>71
gaggatccca gagcatcatg aagatc     26
<210>72
<211>28
<212>DNA
<213>人
<400>72
tgtgcgcgcg gcttgatcag caagggac   28
<210>73
<211>26
<212>DNA
<213>人
<400>73
gaggatccga gagtagtgga agtgtg     26
<210>74
<211>27
<212>DNA
<213>人
<400>74
tgtgcgcgcg ggtccagcct caagatc                                       27
<210>75
<211>26
<212>DNA
<213>人
<400>75
gaggatccgc tggagtgaaa acttga                                         26
<210>76
<211>5616
<212>DNA
<213>人
<400>76
ccccggcgca gcgcggccgc agcagcctcc gccccccgca cggtgtgagc gcccgacgcg    60
gccgaggcgg ccggagtccc gagctagccc cggcggccgc cgccgcccag accggacgac    120
aggccacctc gtcggcgtcc gcccgagtcc ccgcctcgcc gccaacgcca caaccaccgc    180
gcacggcccc ctgactccgt ccagtattga tcgggagagc cggagcgagc tcttcgggga    240
gcagcgatgc gaccctccgg gacggccggg gcagcgctcc tggcgctgct ggctgcgctc    300
tgcccggcga gtcgggctct ggaggaaaag aaagtttgcc aaggcacgag taacaagctc    360
acgcagttgg gcacttttga agatcatttt ctcagcctcc agaggatgtt caataactgt    420
gaggtggtcc ttgggaattt ggaaattacc tatgtgcaga ggaattatga tctttccttc    480
ttaaagacca tccaggaggt ggctggttat gtcctcattg ccctcaacac agtggagcga    540
attcctttgg aaaacctgca gatcatcaga ggaaatatgt actacgaaaa ttcctatgcc    600
ttagcagtct tatctaacta tgatgcaaat aaaaccggac tgaaggagct gcccatgaga    660
aatttacagg aaatcctgca tggcgccgtg cggttcagca acaaccctgc cctgtgcaac    720
gtggagagca tccagtggcg ggacatagtc agcagtgact ttctcagcaa catgtcgatg    780
gacttccaga accacctggg cagctgccaa aagtgtgatc caagctgtcc caatgggagc    840
tgctggggtg caggagagga gaactgccag aaactgacca aaatcatctg tgcccagcag    900
tgctccgggc gctgccgtgg caagtccccc agtgactgct gccacaacca gtgtgctgca    960
ggctgcacag gcccccggga gagcgactgc ctggtctgcc gcaaattccg agacgaagcc    1020
acgtgcaagg acacctgccc cccactcatg ctctacaacc ccaccacgta ccagatggat    1080
gtgaaccccg agggcaaata cagctttggt gccacctgcg tgaagaagtg tccccgtaat    1140
tatgtggtga cagatcacgg ctcgtgcgtc cgagcctgtg gggccgacag ctatgagatg    1200
gaggaagacg gcgtccgcaa gtgtaagaag tgcgaagggc cttgccgcaa agtgtgtaac    1260
ggaataggta ttggtgaatt taaagactca ctctccataa atgctacgaa tattaaacac    1320
ttcaaaaact gcacctccat cagtggcgat ctccacatcc tgccggtggc atttaggggt    1380
gactccttca cacatactcc tcctctggat ccacaggaac tggatattct gaaaaccgta    1440
aaggaaatca cagggttttt gctgattcag gcttggcctg aaaacaggac ggacctccat    1500
gcctttgaga acctagaaat catacgcggc aggaccaagc aacatggtca gttttctctt    1560
gcagtcgtca gcctgaacat aacatccttg ggattacgct ccctcaagga gataagtgat    1620
ggagatgtga taatttcagg aaacaaaaat ttgtgctatg caaatacaat aaactggaaa    1680
aaactgtttg ggacctccgg tcagaaaacc aaaattataa gcaacagagg tgaaaacagc    1740
tgcaaggcca caggccaggt ctgccatgcc ttgtgctccc ccgagggctg ctggggcccg    1800
gagcccaggg actgcgtctc ttgccggaat gtcagccgag gcagggaatg cgtggacaag    1860
tgcaaccttc tggagggtga gccaagggag tttgtggaga actctgagtg catacagtgc    1920
cacccagagt gcctgcctca ggccatgaac atcacctgca caggacgggg accagacaac    1980
tgtatccagt gtgcccacta cattgacggc ccccactgcg tcaagacctg cccggcagga    2040
gtcatgggag aaaacaacac cctggtctgg aagtacgcag acgccggcca tgtgtgccac    2100
ctgtgccatc caaactgcac ctacggatgc actgggccag gtcttgaagg ctgtccaacg    2160
aatgggccta agatcccgtc catcgccact gggatggtgg gggccctcct cttgctgctg    2220
gtggtggccc tggggatcgg cctcttcatg cgaaggcgcc acatcgttcg gaagcgcacg    2280
ctgcggaggc tgctgcagga gagggagctt gtggagcctc ttacacccag tggagaagct    2340
cccaaccaag ctctcttgag gatcttgaag gaaactgaat tcaaaaagat caaagtgctg    2400
ggctccggtg cgttcggcac ggtgtataag ggactctgga tcccagaagg tgagaaagtt    2460
aaaattcccg tcgctatcaa ggaattaaga gaagcaacat ctccgaaagc caacaaggaa    2520
atcctcgatg aagcctacgt gatggccagc gtggacaacc cccacgtgtg ccgcctgctg    2580
ggcatctgcc tcacctccac cgtgcagctc atcacgcagc tcatgccctt cggctgcctc    2640
ctggactatg tccgggaaca caaagacaat attggctccc agtacctgct caactggtgt    2700
gtgcagatcg caaagggcat gaactacttg gaggaccgtc gcttggtgca ccgcgacctg    2760
gcagccagga acgtactggt gaaaacaccg cagcatgtca agatcacaga ttttgggctg    2820
gccaaactgc tgggtgcgga agagaaagaa taccatgcag aaggaggcaa agtgcctatc    2880
aagtggatgg cattggaatc aattttacac agaatctata cccaccagag tgatgtctgg    2940
agctacgggg tgaccgtttg ggagttgatg acctttggat ccaagccata tgacggaatc    3000
cctgccagcg agatctcctc catcctggag aaaggagaac gcctccctca gccacccata    3060
tgtaccatcg atgtctacat gatcatggtc aagtgctgga tgatagacgc agatagtcgc    3120
ccaaagttcc gtgagttgat catcgaattc tccaaaatgg cccgagaccc ccagcgctac    3180
cttgtcattc agggggatga aagaatgcat ttgccaagtc ctacagactc caacttctac    3240
cgtgccctga tggatgaaga agacatggac gacgtggtgg atgccgacga gtacctcatc    3300
ccacagcagg gcttcttcag cagcccctcc acgtcacgga ctcccctcct gagctctctg    3360
agtgcaacca gcaacaattc caccgtggct tgcattgata gaaatgggct gcaaagctgt    3420
cccatcaagg aagacagctt cttgcagcga tacagctcag accccacagg cgccttgact    3480
gaggacagca tagacgacac cttcctccca gtgcctgaat acataaacca gtccgttccc    3540
aaaaggcccg ctggctctgt gcagaatcct gtctatcaca atcagcctct gaaccccgcg    3600
cccagcagag acccacacta ccaggacccc cacagcactg cagtgggcaa ccccgagtat    3660
ctcaacactg tccagcccac ctgtgtcaac agcacattcg acagccctgc ccactgggcc    3720
cagaaaggca gccaccaaat tagcctggac aaccctgact accagcagga cttctttccc    3780
aaggaagcca agccaaatgg catctttaag ggctccacag ctgaaaatgc agaataccta    3840
agggtcgcgc cacaaagcag tgaatttatt ggagcatgac cacggaggat agtatgagcc    3900
ctaaaaatcc agactctttc gatacccagg accaagccac agcaggtcct ccatcccaac    3960
agccatgccc gcattagctc ttagacccac agactggttt tgcaacgttt acaccgacta    4020
gccaggaagt acttccacct cgggcacatt ttgggaagtt gcattccttt gtcttcaaac    4080
tgtgaagcat ttacagaaac gcatccagca agaatattgt ccctttgagc agaaatttat    4140
ctttcaaaga ggtatatttg aaaaaaaaaa aaagtatatg tgaggatttt tattgattgg    4200
ggatcttgga gtttttcatt gtcgctattg atttttactt caatgggctc ttccaacaag    4260
gaagaagctt gctggtagca cttgctaccc tgagttcatc caggcccaac tgtgagcaag    4320
gagcacaagc cacaagtctt ccagaggatg cttgattcca gtggttctgc ttcaaggctt    4380
ccactgcaaa acactaaaga tccaagaagg ccttcatggc cccagcaggc cggatcggta    4440
ctgtatcaag tcatggcagg tacagtagga taagccactc tgtcccttcc tgggcaaaga    4500
agaaacggag gggatggaat tcttccttag acttactttt gtaaaaatgt ccccacggta    4560
cttactcccc actgatggac cagtggtttc cagtcatgag cgttagactg acttgtttgt    4620
cttccattcc attgttttga aactcagtat gctgcccctg tcttgctgtc atgaaatcag    4680
caagagagga tgacacatca aataataact cggattccag cccacattgg attcatcagc    4740
atttggacca atagcccaca gctgagaatg tggaatacct aaggatagca ccgcttttgt    4800
tctcgcaaaa acgtatctcc taatttgagg ctcagatgaa atgcatcagg tcctttgggg    4860
catagatcag aagactacaa aaatgaagct gctctgaaat ctcctttagc catcacccca    4920
accccccaaa attagtttgt gttacttatg gaagatagtt ttctcctttt acttcacttc    4980
aaaagctttt tactcaaaga gtatatgttc cctccaggtc agctgccccc aaaccccctc    5040
cttacgcttt gtcacacaaa aagtgtctct gccttgagtc atctattcaa gcacttacag    5100
ctctggccac aacagggcat tttacaggtg cgaatgacag tagcattatg agtagtgtgg    5160
aattcaggta gtaaatatga aactagggtt tgaaattgat aatgctttca caacatttgc    5220
agatgtttta gaaggaaaaa agttccttcc taaaataatt tctctacaat tggaagattg    5280
gaagattcag ctagttagga gcccaccttt tttcctaatc tgtgtgtgcc ctgtaacctg    5340
actggttaac agcagtcctt tgtaaacagt gttttaaact ctcctagtca atatccaccc    5400
catccaattt atcaaggaag aaatggttca gaaaatattt tcagcctaca gttatgttca    5460
gtcacacaca catacaaaat gttccttttg cttttaaagt aatttttgac tcccagatca    5520
gtcagagccc ctacagcatt gttaagaaag tatttgattt ttgtctcaat gaaaataaaa    5580
ctatattcat ttccactcta aaaaaaaaaa aaaaaa                              5616
<210>77
<211>12
<212>PRT
<213>人
<400>77
Gly Gly Ser Gly Ser Glu Asn Leu Tyr Phe Gln Leu
                5                   10
<210>78
<211>1291
<212>PRT
<213>人
<400>78
Met Ala Gly Ala Ala Ser Pro Cys Ala Asn Gly Cys Gly Pro Gly Ala
                5                   10                  15
Pro Ser Asp Ala Glu Val Leu His Leu Cys Arg Ser Leu Glu Val Gly
            20                  25                  30
Thr Val Met Thr Leu Phe Tyr Ser Lys Lys Ser Gln Arg Pro Glu Arg
        35                  40                  45
Lys Thr Phe Gln Val Lys Leu Glu Thr Arg Gln Ile Thr Trp Ser Arg
    50                  55                  60
Gly Ala Asp Lys Ile Glu Gly Ala Ile Asp Ile Arg Glu Ile Lys Glu
65                  70                  75                  80
Ile Arg Pro Gly Lys Thr Ser Arg Asp Phe Asp Arg Tyr Gln Glu Asp
                85                  90                  95
Pro Ala Phe Arg Pro Asp Gln Ser His Cys Phe Val Ile Leu Tyr Gly
            100                 105                 110
Met Glu Phe Arg Leu Lys Thr Leu Ser Leu Gln Ala Thr Ser Glu Asp
        115                 120                 125
Glu Val Asn Met Trp Ile Lys Gly Leu Thr Trp Leu Met Glu Asp Thr
    130                 135                 140
Leu Gln Ala Pro Thr Pro Leu Gln Ile Glu Arg Trp Leu Arg Lys Gln
145                 150                 155                 160
Phe Tyr Ser Val Asp Arg Asn Arg Glu Asp Arg Ile Ser Ala Lys Asp
                165                 170                 175
Leu Lys Asn Met Leu Ser Gln Val Asn Tyr Arg Val Pro Asn Met Arg
            180                 185                 190
Phe Leu Arg Glu Arg Leu Thr Asp Leu Glu Gln Arg Ser Gly Asp Ile
        195                 200                 205
Thr Tyr Gly Gln Phe Ala Gln Leu Tyr Arg Ser Leu Met Tyr Ser Ala
    210                 215                 220
Gln Lys Thr Met Asp Leu Pro Phe Leu Glu Ala Ser Thr Leu Arg Ala
225                 230                 235                 240
Gly Glu Arg Pro Glu Leu Cys Arg Val Ser Leu Pro Glu Phe Gln Gln
                245                 250                 255
Phe Leu Leu Asp Tyr Gln Gly Glu Leu Trp Ala Val Asp Arg Leu Gln
            260                 265                 270
Val Gln Glu Phe Met Leu Ser Phe Leu Arg Asp Pro Leu Arg Glu Ile
        275                 280                 285
Glu Glu Pro Tyr Phe Phe Leu Asp Glu Phe Val Thr Phe Leu Phe Ser
    290                 295                 300
Lys Glu Asn Ser Val Trp Asn Ser Gln Leu Asp Ala Val Cys Pro Asp
305                 310                 315                 320
Thr Met Asn Asn Pro Leu Ser His Tyr Trp Ile Ser Ser Ser His Asn
                325                 330                 335
Thr Tyr Leu Thr Gly Asp Gln Phe Ser Ser Glu Ser Ser Leu Glu Ala
            340                 345                 350
Tyr Ala Arg Cys Leu Arg Met Gly Cys Arg Cys Ile Glu Leu Asp Cys
        355                 360                 365
Trp Asp Gly Pro Asp Gly Met Pro Val Ile Tyr His Gly His Thr Leu
    370                 375                 380
Thr Thr Lys Ile Lys Phe Ser Asp Val Leu His Thr Ile Lys Glu His
385                 390                 395                 400
Ala Phe Val Ala Ser Glu Tyr Pro Val Ile Leu Ser Ile Glu Asp His
                405                 410                 415
Cys Ser Ile Ala Gln Gln Arg Asn Met Ala Gln Tyr Phe Lys Lys Val
            420                 425                 430
Leu Gly Asp Thr Leu Leu Thr Lys Pro Val Glu Ile Ser Ala Asp Gly
        435                 440                 445
Leu Pro Ser Pro Asn Gln Leu Lys Arg Lys Ile Leu Ile Lys His Lys
    450                 455                 460
Lys Leu Ala Glu Gly Ser Ala Tyr Glu Glu Val Pro Thr Ser Met Met
465                 470                 475                 480
Tyr Ser Glu Asn Asp Ile Ser Asn Ser Ile Lys Asn Gly Ile Leu Tyr
                485                 490                 495
Leu Glu Asp Pro Val Asn His Glu Trp Tyr Pro His Tyr Phe Val Leu
            500                 505                 510
Thr Ser Ser Lys Ile Tyr Tyr Ser Glu Glu Thr Ser Ser Asp Gln Gly
        515                 520                 525
Asn Glu Asp Glu Glu Glu Pro Lys Glu Val Ser Ser Ser Thr Glu Leu
    530                 535                 540
His Ser Asn Glu Lys Trp Phe His Gly Lys Leu Gly Ala Gly Arg Asp
545                 550                 555                 560
Gly Arg His Ile Ala Glu Arg Leu Leu Thr Glu Tyr Cys Ile Glu Thr
                565                 570                 575
Gly Ala Pro Asp Gly Ser Phe Leu Val Arg Glu Ser Glu Thr Phe Val
            580                 585                 590
Gly Asp Tyr Thr Leu Ser Phe Trp Arg Asn Gly Lys Val Gln His Cys
        595                 600                 605
Arg Ile His Ser Arg Gln Asp Ala Gly Thr Pro Lys Phe Phe Leu Thr
    610                 615                 620
Asp Asn Leu Val Phe Asp Ser Leu Tyr Asp Leu Ile Thr His Tyr Gln
625                 630                 635                 640
Gln Val Pro Leu Arg Cys Asn Glu Phe Glu Met Arg Leu Ser Glu Pro
                645                 650                 655
Val Pro Gln Thr Asn Ala His Glu Ser Lys Glu Trp Tyr His Ala Ser
            660                 665                 670
Leu Thr Arg Ala Gln Ala Glu His Met Leu Met Arg Val Pro Arg Asp
        675                 680                 685
Gly Ala Phe Leu Val Arg Lys Arg Asn Glu Pro Asn Ser Tyr Ala Ile
    690                 695                 700
Ser Phe Arg Ala Glu Gly Lys Ile Lys His Cys Arg Val Gln Gln Glu
705                 710                 715                 720
Gly Gln Thr Val Met Leu Gly Asn Ser Glu Phe Asp Ser Leu Val Asp
                725                 730                 735
Leu Ile Ser Tyr Tyr Glu Lys His Pro Leu Tyr Arg Lys Met Lys Leu
            740                 745                 750
Arg Tyr Pro Ile Asn Glu Glu Ala Leu Glu Lys Ile Gly Thr Ala Glu
        755                 760                 765
Pro Asp Tyr Gly Ala Leu Tyr Glu Gly Arg Asn Pro Gly Phe Tyr Val
    770                 775                 780
Glu Ala Asn Pro Met Pro Thr Phe Lys Cys Ala Val Lys Ala Leu Phe
785                 790                 795                 800
Asp Tyr Lys Ala Gln Arg Glu Asp Glu Leu Thr Phe Ile Lys Ser Ala
                805                 810                 815
Ile Ile Gln Asn Val Glu Lys Gln Glu Gly Gly Trp Trp Arg Gly Asp
            820                 825                 830
Tyr Gly Gly Lys Lys Gln Leu Trp Phe Pro Ser Asn Tyr Val Glu Glu
        835                 840                 845
Met Val Asn Pro Val Ala Leu Glu Pro Glu Arg Glu His Leu Asp Glu
    850                 855                 860
Asn Ser Pro Leu Gly Asp Leu Leu Arg Gly Val Leu Asp Val Pro Ala
865                 870                 875                 880
Cys Gln Ile Ala Ile Arg Pro Glu Gly Lys Asn Asn Arg Leu Phe Val
                885                 890                 895
Phe Ser Ile Ser Met Ala Ser Val Ala His Trp Ser Leu Asp Val Ala
            900                 905                 910
Ala Asp Ser Gln Glu Glu Leu Gln Asp Trp Val Lys Lys Ile Arg Glu
        915                 920                 925
Val Ala Gln Thr Ala Asp Ala Arg Leu Thr Glu Gly Lys Ile Met Glu
    930                 935                 940
Arg Arg Lys Lys Ile Ala Leu Glu Leu Ser Glu Leu Val Val Tyr Cys
945                 950                 955                 960
Arg Pro Val Pro Phe Asp Glu Glu Lys Ile Gly Thr Glu Arg Ala Cys
                965                 970                 975
Tyr Arg Asp Met Ser Ser Phe Pro Glu Thr Lys Ala Glu Lys Tyr Val
            980                 985                 990
Asn Lys Ala Lys Gly Lys Lys Phe  Leu Gln Tyr Asn Arg  Leu Gln Leu
        995                 1000                 1005
Ser Arg  Ile Tyr Pro Lys Gly  Gln Arg Leu Asp Ser    Ser Asn Tyr Asp
    1010                 1015                 1020
Pro  Leu Pro Met Trp Ile  Cys Gly Ser Gln Leu  Val Ala Leu Asn Phe
1025                 1030                 1035                 1040
Gln Thr Pro Asp Lys  Pro Met Gln Met Asn  Gln Ala Leu Phe Met  Thr
                1045                 1050                 1055
Gly Arg His Cys  Gly Tyr Val Leu Gln  Pro Ser Thr Met Arg  Asp Glu
            1060                 1065                 1070
Ala Phe Asp  Pro Phe Asp Lys Ser  Ser Leu Arg Gly Leu  Glu Pro Cys
        1075                 1080                 1085
Ala Ile  Ser Ile Glu Val Leu  Gly Ala Arg His Leu  Pro Lys Asn Gly
    1090                 1095                 1100
Arg  Gly Ile Val Cys Pro  Phe Val Glu Ile Glu  Val Ala Gly Ala Glu
1105                1110                 1115                 1120
Tyr Asp Ser Thr Lys  Gln Lys Thr Glu Phe  Val Val Asp Asn Gly  Leu
                1125                 1130                 1135
Asn Pro Val Trp  Pro Ala Lys Pro Phe  His Phe Gln Ile Ser  Asn Pro
            1140                 1145                 1150
Glu Phe Ala  Phe Leu Arg Phe Val  Val Tyr Glu Glu Asp  Met Phe Ser
        1155                 1160                 1165
Asp Gln  Asn Phe Leu Ala Gln  Ala Thr Phe Pro Val  Lys Gly Leu Lys
    1170                 1175                 1180
Thr  Gly Tyr Arg Ala Val  Pro Leu Lys Asn Asn  Tyr Ser Glu Asp Leu
1185                 1190                 1195                 1200
Glu Leu Ala Ser Leu  Leu Ile Lys Ile Asp  Ile Phe Pro Ala Lys  Gln
                1205                 1210                 1215
Glu Asn Gly Asp  Leu Ser Pro Phe Ser  Gly Thr Ser Leu Arg  Glu Arg
            1220                 1225                 1230
Gly Ser Asp  Ala Ser Gly Gln Leu  Phe His Gly Arg Ala  Arg Glu Gly
        1235                 1240                 1245
Ser Phe  Glu Ser Arg Tyr Gln  Gln Pro Phe Glu Asp  Phe Arg Ile Ser
     1250                1255                 1260
Gln  Glu His Leu Ala Asp  His Phe Asp Ser Arg  Glu Arg Arg Ala Pro
1265                 1270                 1275                 1280
Arg Arg Thr Arg Val  Asn Gly Asp Asn Arg  Leu
                1285                 1290
<210>79
<211>3054
<212>PRT
<213>人
<400>79
Met Ala Leu Ile Phe Gly Thr Val Asn Ala Asn Ile Leu Lys Glu Val
                5                   10                  15
Phe Gly Gly Ala Arg Met Ala Cys Val Thr Ser Ala His Met Ala Gly
20                  25                  30
Ala Asn Gly Ser Ile Leu Lys Lys Ala Glu Glu Thr Ser Arg Ala Ile
                35                  40                  45
Met His Lys Pro Val Ile Phe Gly Glu Asp Tyr Ile Thr Glu Ala Asp
            50                  55                  60
Leu Pro Tyr Thr Pro Leu His Leu Glu Val Asp Ala Glu Met Glu Arg
65                  70                  75                  80
Met Tyr Tyr Leu Gly Arg Arg Ala Leu Thr His Gly Lys Arg Arg Lys
                85                  90                  95
Val Ser Val Asn Asn Lys Arg Asn Arg Arg Arg Lys Val Ala Lys Thr
            100                 105                 110
Tyr Val Gly Arg Asp Ser Ile Val Glu Lys Ile Val Val Pro His Thr
        115                 120                 125
Glu Arg Lys Val Asp Thr Thr Ala Ala Val Glu Asp Ile Cys Asn Glu
    130                 135                 140
Ala Thr Thr Gln Leu Val His Asn Ser Met Pro Lys Arg Lys Lys Gln
145                 150                 155                 160
Lys Asn Phe Leu Pro Ala Thr Ser Leu Ser Asn Val Tyr Ala Gln Thr
                165                 170                 175
Trp Ser Ile Val Arg Lys Arg His Met Gln Val Glu Ile Ile Ser Lys
            180                 185                 190
Lys Ser Val Arg Ala Arg Val Lys Arg Phe Glu Gly Ser Val Gln Leu
        19                 5200                 205
Phe Ala Ser Val Arg His Met Tyr Gly Glu Arg Lys Arg Val Asp Leu
    210                 215                 220
Arg Ile Asp Asn Trp Gln Gln Glu Thr Leu Leu Asp Leu Ala Lys Arg
225                 230                 235                 240
Phe Lys Asn Glu Arg Val Asp Gln Ser Lys Leu Thr Phe Gly Ser Ser
                245                 250                 255
Gly Leu Val Leu Arg Gln Gly Ser Tyr Gly Pro Ala His Trp Tyr Arg
            260                 265                 270
His Gly Met Phe Ile Val Arg Gly Arg Ser Asp Gly Met Leu Val Asp
        275                 280                 285
Ala Arg Ala Lys Val Thr Phe Ala Val Cys His Ser Met Thr His Tyr
    290                 295                 300
Ser Asp Lys Ser Ile Ser Glu Ala Phe Phe Ile Pro Tyr Ser Lys Lys
305                 310                 315                 320
Phe Leu Glu Leu Arg Pro Asp Gly Ile Ser His Glu Cys Thr Arg Gly
                325                 330                 335
Val Ser Val Glu Arg Cys Gly Glu Val Ala Ala Ile Leu Thr Gln Ala
            340                 345                 350
Leu Ser Pro Cys Gly Lys Ile Thr Cys Lys Arg Cys Met Val Glu Thr
        355                 360                 365
Pro Asp Ile Val Glu Gly Glu Ser Gly Glu Ser Val Thr Asn Gln Gly
    370                 375                 380
Lys Leu Leu Ala Met Leu Lys Glu Gln Tyr Pro Asp Phe Pro Met Ala
385                 390                 395                 400
Glu Lys Leu Leu Thr Arg Phe Leu Gln Gln Lys Ser Leu Val Asn Thr
                405                 410                 415
Asn Leu Thr Ala Cys Val Ser Val Lys Gln Leu Ile Gly Asp Arg Lys
            420                 425                 430
Gln Ala Pro Phe Thr His Val Leu Ala Val  Ser GluIle Leu Phe Lys
        435                 440                 445
Gly Asn Lys Leu Thr Gly Ala Asp Leu Glu Glu Ala Ser Thr His Met
    450                 455                 460
Leu Glu Ile Ala Arg Phe Leu Asn Asn Arg Thr Glu Asn Met Arg Ile
465                 470                 475                 480
Gly His Leu Gly Ser Phe Arg Asn Lys Ile Ser Ser Lys Ala His Val
                485                 490                 495
Asn Asn Ala Leu Met Cys Asp Asn Gln Leu Asp Gln Asn Gly Asn Phe
            500                 505                 510
Ile Trp Gly Leu Arg Gly Ala His Ala Lys Arg Phe Leu Lys Gly Phe
        515                 520                 525
Phe Thr Glu Ile Asp Pro Asn Glu Gly Tyr Asp Lys Tyr Val Ile Arg
    530                 535                 540
Lys His Ile Arg Gly Ser Arg Lys Leu Ala Ile Gly Asn Leu Ile Met
545                 550                 555                 560
Ser Thr Asp Phe Gln Thr Leu Arg Gln Gln Ile Gln Gly Glu Thr Ile
                565                 570                 575
Glu Arg Lys Glu Ile Gly Asn His Cys Ile Ser Met Arg Asn Gly Asn
            580                 585                 590
Tyr Val Tyr Pro Cys Cys Cys Val Thr Leu Glu Asp Gly Lys Ala Gln
        595                 600                 605
Tyr Ser Asp Leu Lys His Pro Thr Lys Arg His Leu Val Ile Gly Asn
    610                 615                 620
Ser Gly Asp Ser Lys Tyr Leu Asp Leu Pro Val Leu Asn Glu Glu Lys
625                 630                 635                 640
Met Tyr Ile Ala Asn Glu Gly Tyr Cys Tyr Met Asn Ile Phe Phe Ala
                645                 650                 655
Leu Leu Val Asn Val Lys Glu Glu Asp Ala Lys Asp Phe Thr Lys Phe
            660                 665                 670
Ile Arg Asp Thr Ile Val Pro Lys Leu Gly Ala Trp Pro Thr Met Gln
        675                 680                 685
Asp Val Ala Thr Ala Cys Tyr Leu Leu Ser Ile Leu Tyr Pro Asp Val
    690                 695                 700
Leu Arg Ala Glu Leu Pro Arg Ile Leu Val Asp His Asp Asn Lys Thr
705                 710                 715                 720
Met His Val Leu Asp Ser Tyr Gly Ser Arg Thr Thr Gly Tyr His Met
                725                 730                 735
Leu Lys Met Asn Thr Thr Ser Gln Leu Ile Glu Phe Val His Ser Gly
            740                 745                 750
Leu Glu Ser Glu Met Lys Thr Tyr Asn Val Gly Gly Met Asn Arg Asp
        755                 760                 765
Val Val Thr Gln Gly Ala Ile Glu Met Leu Ile Lys Ser Ile Tyr Lys
    770                 775                 780
Pro His Leu Met Lys Gln Leu Leu Glu Glu Glu Pro Tyr Ile Ile Val
785                 790                 795                 800
Leu Ala Ile Val Ser Pro Ser Ile Leu Ile Ala Met Tyr Asn Ser Gly
                805                 810                 815
Thr Phe Glu Gln Ala Leu Gln Met Trp Leu Pro Asn Thr Met Arg Leu
            820                 825                 830
Ala Asn Leu Ala Ala Ile Leu Ser Ala Leu Ala Gln Lys Leu Thr Leu
        835                 840                 845
Ala Asp Leu Phe Val Gln Gln Arg Asn Leu Ile Asn Glu Tyr Ala Gln
    850                 855                 860
Val Ile Leu Asp Asn Leu Ile Asp Gly Val Arg Val Asn His Ser Leu
865                 870                 875880
Ser Leu Ala Met Glu Ile Val Thr Ile Lys Leu Ala Thr Gln Glu Met
                885                 890                 895
Asp Met Ala Leu Arg Glu Gly Gly Tyr Ala Val Thr Ser Glu Lys Val
            900                 905                 910
His Glu Met Leu Glu Lys Asn Tyr Val Lys Ala Leu Lys Asp Ala Trp
        915                 920                 925
Asp Glu Leu Thr Trp Leu Glu Lys Phe Ser Ala Ile Arg His Ser Arg
    930                 935                 940
Lys Leu Leu Lys Phe Gly Arg Lys Pro Leu Ile Met Lys Asn Thr Val
945                 950                 955                 960
Asp Cys Gly Gly His Ile Asp Leu Ser Val Lys Ser Leu Phe Lys Phe
                965                 970                 975
His Leu Glu Leu Leu Lys Gly Thr Ile  Ser Arg Ala Val Asn Gly Gly
            980                 985                  990
Ala Arg Lys  Val Arg Val Ala Lys  Asn Ala Met Thr Lys  Gly Val Phe
        995                 1000                 1005
Leu Lys  Ile Tyr Ser Met Leu  Pro Asp Val Tyr Lys  Phe Ile Thr Val
    1010                 1015                 1020
Ser  Ser Val Leu Ser Leu  Leu Leu Thr Phe Leu  Phe Gln Ile Asp Cys
1025                 1030                 1035                 1040
Met Ile Arg Ala His   Arg Glu Ala Lys Val  Ala Ala Gln Leu Gln Lys
                1045                 1050                 1055
Glu Ser Glu Trp  Asp AsnIle  Ile Asn  Arg Thr Phe Gln Tyr  Ser Lys
            1060                 1065                 1070
Leu Glu Asn  Pro Ile Gly Tyr Arg  Ser Thr Ala Glu Glu  Arg Leu Gln
        1075                 1080                 1085
Ser Glu  His Pro Glu Ala Phe  Glu Tyr Tyr Lys  Phe Cys Ile Gly Lys
    1090                 1095                 1100
Glu  Asp Leu Val Glu Gln  Ala Lys Gln Pro Glu  Ile Ala Tyr Phe Glu
1105                 1110                 1115                 1120
Lys Ile Ile Ala Phe  Ile Thr Leu Val Leu  Met Ala Phe Asp Ala  Glu
                1125                 1130                 1135
Arg Ser Asp Gly  Val Phe LysIle Leu  Asn Lys  Phe Lys Gly  Ile Leu
            1140                 1145                 1150
Ser Ser Thr  Glu Arg Glu Ile Ile  Tyr Thr Gln Ser Leu  Asp Asp Tyr
        1155                 1160                 1165
Val Thr  Thr Phe Asp Asp Asn  Met Thr Ile Asn Leu  Glu Leu Asn Met
    1170                 1175                 1180
Asp  Glu Leu His Lys Thr  Ser Leu Pro Gly Val  Thr Phe Lys Gln Trp
1185                 1190                 1195                 1200
Trp Asn Asn Gln Ile  Ser Arg Gly Asn Val   Lys Pro His Tyr Arg Thr
                1205                 1210                 1215
Glu Gly His Phe  Met Glu Phe Thr Arg  Asp Thr Ala Ala Ser  Val Ala
            1220                 1225                 1230
Ser Glu Ile  Ser His Ser Pro Ala  Arg Asp Phe Leu Val  Arg Gly Ala
        1235                 1240                 1245
Val Gly  Ser Gly Lys Ser Thr  Gly Leu Pro Tyr His  Leu Ser Lys Arg
     1250                 1255                 1260
Gly  Arg Val Leu Met Leu  Glu Pro Thr Arg Pro  Leu Thr Asp Asn Met
1265                 1270                 1275                 1280
His Lys Gln Leu Arg  Ser Glu Pro Phe Asn  Cys Phe Pro Thr Leu  Arg
                1285                 1290                 1295
Met Arg Gly Lys  Ser Thr Phe Gly Ser  Ser Pro Ile Thr Val  Met Thr
            1300                 1305                 1310
Ser Gly Phe  Ala Leu His His Phe  Ala Ar gAsn Ile Ala Glu Val Lys
        1315                 1320                 1325
Thr Tyr  Asp Phe Val Ile Ile  Asp Glu Cys His Val  Asn Asp Ala Ser
    1330                 1335                 1340
Ala  Ile Ala Phe Arg Asn  Leu Leu Phe Glu His  Glu Phe Glu Gly Lys
1345                 1350                 1355                 1360
Val Leu Lys Val Ser  Ala Thr Pro Pro Gly  Arg Glu Val Glu Phe Thr
                1365                 1370                 1375
Thr Gln Phe Pro  Val Lys Leu Lys Ile  Glu Glu Ala Leu Ser Phe Gln
            1380                 1385                 1390
Glu Phe Val  Ser Leu Gln Gly Thr  Gly Ala Asn Ala Asp  Val Ile Ser
        1395                 1400                 1405
Cys Gly  Asp Asn Ile Leu Val  Tyr Val Ala Ser Tyr  Asn Asp Val Asp
    1410                 1415                 1420
Ser  Leu Gly Lys Leu Leu  Val Gln Lys Gly Tyr  Lys Val Ser Lys Ile
1425                 1430                 1435                 1440
Asp Gly Arg Thr Met  Lys Ser Gly Gly Thr  Glu Ile Ile Thr Glu  Gly
                1445                 1450                 1455
Thr Ser Val Lys  Lys His Phe Ile Val  Ala Thr Asn Ile Ile  Glu Asn
            1460                 1465                 1470
Gly Val Thr  Ile Asp Ile Asp Val  Val Val Asp Phe Gly  Thr Lys Val
        1475                 1480                 1485
Val Pro  Val Leu Asp Val Asp  Asn Arg Ala Val Gln  Tyr Asn Lys Thr
    1490                 1495                 1500
Val  Val Ser Tyr Gly Glu  Arg Ile Gln Lys Leu  Gly Arg Val Gly Arg
1505                 1510                 1515                 1520
His Lys Glu Gly Val  Ala Leu Arg Ile Gly  Gln Thr Asn Lys Thr  Leu
                1525                 1530                 1535
Val Glu Ile Pro  Glu Met Val Ala Thr  Glu Ala Ala Phe Leu  Cys Phe
            1540                 1545                 1550
Met Tyr Asn  Leu Pro Val Thr Thr  Gln Ser Val Ser Thr  Thr Leu Leu
        1555                 1560                 1565
Glu Asn  Ala Thr Leu Leu Gln  Ala Arg Thr Met Ala  Gln Phe Glu Leu
    1570                 1575                 1580
Ser  Tyr Phe Tyr Thr Ile  Asn Phe Val Arg Phe  Asp Gly Ser Met His
1585                 1590                 1595                 1600
Pro Val Ile His Asp  Lys Leu Lys Arg Phe  Lys Leu His Thr Cys  Glu
                1605                 1610                 1615
Thr Phe Leu Asn  Lys Leu Ala Ile Pro  Asn Lys Gly Leu Ser  Ser Trp
            1620                 1625                 1630
Leu Thr Ser  Gly Glu Tyr Lys Arg  Leu Gly Tyr Ile Ala  Glu Asp Ala
        1635                 1640                 1645
Gly Ile  Arg Ile Pro Phe Val  Cys Lys Glu Ile  Pro Asp Ser Leu His
    1650                 1655                 1660
Glu  Glu Ile Trp His Ile  Val Val Ala His Lys  Gly Asp Ser Gly Ile
1665                 1670                 1675                 1680
Gly Arg Leu Thr Ser  Val Gln Ala Ala Lys  Val Val Tyr Thr Leu  Gln
                1685                 1690                 1695
Thr Asp Val His  Ser Ile Ala Arg Thr  Leu Ala Cys Ile Asn  Arg Arg
            1700                 1705                 1710
Ile Ala Asp  Glu Gln Met Lys Gln  Ser His Phe Glu Ala  Ala Thr Gly
        1715                 1720                 1725
Arg Ala  Phe Ser Phe Thr Asn  Tyr Ser Ile Gln Ser  Ile Phe Asp Thr
    1730                 1735                 1740
Leu  Lys Ala Asn Tyr Ala  Thr Lys His Thr Lys  Glu Asn Ile Ala Val
1745                 1750                 1755                 1760
Leu Gln Gln Ala Lys  Asp Gln Leu Leu Glu  Phe Ser Asn Leu Ala  Lys
                1765                 1770                 1775
Asp Gln Asp Val  Thr Gly Ile Ile Gln  Asp Phe Asn His Leu  Glu Thr
            1780                 1785                 1790
Ile Tyr Leu  Gln Ser Asp Ser Glu  Val Ala Lys His Leu  Lys Leu Lys
        1795                 1800                 1805
Ser His  Trp Asn Lys Ser Gln  Ile Thr Arg Asp Ile  Ile Ile Ala Leu
    1810                 1815                 1820
Ser  Val Leu Ile Gly Gly  Gly Trp Met Leu Ala  Thr Tyr Phe Lys Asp
1825                 1830                 1835                 1840
Lys  Phe Asn Glu Pro  Val Tyr Phe Gln Gly  Lys Lys Asn Gln Lys  His
                 1845                 1850                 1855
Lys Leu Lys Met Arg  Glu Ala Arg Gly  Ala Arg Gly Gln Tyr  Glu Val
                1860                 1865                 1870
Ala Ala Glu  Pro Glu Ala Leu Glu  His Tyr Phe Gly Ser  Ala Tyr Asn
        1875                 1880                 1885
Asn Lys  Gly Lys Arg Lys Gly  Thr Thr Arg Gly Met  Gly Ala Lys Ser
    1890                 1895                 1900
Arg  Lys Phe Ile Asn Met  Tyr Gly Phe Asp Pro  Thr Asp Phe Ser Tyr
1905                 1910                 1915                 1920
Ile Arg Phe Val Asp  Pro Leu Thr Gly His  Thr Ile Asp Glu Ser  Thr
                1925                 1930                 1935
Asn Ala Pro Ile  Asp Leu Val Gln His  Glu Phe Gly Lys Val  Arg Thr
            1940                 1945                 1950
Arg Met Leu  Ile Asp Asp Glu Ile  Glu Pro Gln Ser  Leu Ser Thr His
        1955                 1960                 1965
Thr Thr  Ile His Ala Tyr Leu  Val Asn Ser Gly Thr  Lys Lys Val Leu
    1970                 1975                 1980
Lys  Val Asp Leu Thr Pro  His Ser Ser Leu Arg  Ala Ser Glu Lys Ser
1985                 1990                 1995                 2000
Thr Ala Ile Met Gly  Phe Pro Glu Arg Glu  Asn Glu Leu Arg Gln  Thr
                2005                 2010                 2015
Gly Met Ala Val  Pro Val Ala Tyr Asp  Gln Leu Pro Pro Lys  Asn Glu
            2020                 2025                 2030
Asp Leu Thr  Phe Glu Gly Glu Ser  Leu Phe Lys Gly Pro  Arg Asp Tyr
        2035                 2040                 2045
Asn Pro  Ile Ser Ser Thr Ile  Cys His Leu Thr Asn  Glu Ser Asp Gly
    2050                 2055                 2060
His  Thr Thr Ser Leu Tyr  Gly Ile Gly Phe Gly  Pro Phe Ile Ile Thr
2065                 2070                 2075                 2080
Asn Lys His Leu Phe  Arg Arg Asn Asn Gly  Thr Leu Leu Val Gln  Ser
                2085                 2090                 2095
Leu His Gly Val  Phe Lys Val Lys Asn  Thr Thr Thr Leu Gln  Gln His
            2100                 2105                 2110
Leu Ile Asp  Gly Arg Asp Met Ile  Ile Ile Arg Met Pro  Lys Asp Phe
        2115                 2120                 2125
Pro Pro  Phe Pro Gln Lys Leu  Lys Phe Arg Glu Pro  Gln Arg Glu Glu
    2130                 2135                 2140
Arg  Ile Cys Leu Val Thr  Thr Asn Phe Gln Thr  Lys Ser Met Ser Ser
2145                 2150                 2155                 2160
Met Val Ser Asp Thr  Ser Cys Thr Phe Pro  Ser  Ser Asp Gly Ile  Phe
                2165                 2170                 2175
Trp Lys His Trp  Ile Gln Thr Lys Asp  Gly Gln Cys Gly Ser  Pro Leu
            2180                 2185                 2190
Val Ser Thr  Arg Asp Gly Phe Ile  Val Gly Ile His Ser  Ala Ser Asn
        2195                 2200                 2205
Phe Thr  Asn Thr Asn Asn Tyr  Phe Thr Ser Val Pro  Lys Asn Phe Met
    2210                 2215                 2220
Glu  Leu Leu Thr Asn Gln  Glu Ala Gln Gln Trp  Val Ser Gly Trp Arg
2225                 2230                 2235                 2240
Leu Asn Ala Asp Ser  Val Leu Trp Gly Gly  His Lys Val Phe Met  Ser
                2245                 2250                 2255
Lys Pro Glu Glu  Pro Phe Gln Pro Val  Lys Glu Ala Thr Gln  Leu Met
            2260                 2265                 2270
Asn Glu Leu  Val Tyr Ser Gln Gly  Glu Lys Arg Lys Trp  Val Val Glu
        2275                 2280                 2285
Ala Leu  Ser Gly Asn Leu Arg  Pro Val Ala Glu Cys  Pro Ser Gln Leu
    2290                 2295                 2300
Val  Thr Lys His Val Val  Lys Gly Lys Cys Pro  Leu Phe Glu Leu Tyr
2305                 2310                 2315                 2320
Leu Gln Leu Asn Pro  Glu Lys Glu Ala Tyr  Phe Lys Pro Met Met  Gly
                2325                 2330                 2335
Ala Tyr Lys Pro  Ser Arg Leu Asn Arg  Glu Ala Phe Leu Lys  Asp Ile
            2340                 2345                 2350
Leu Lys Tyr  Ala Ser Glu Ile Glu  Ile Gly Asn Val Asp  Cys Asp Leu
        2355                 2360                 2365
Leu Glu  Leu AlaIle  Ser Met  Leu Val Thr Lys Leu  Lys Ala Leu Gly
    2370                 2375                 2380
Phe  Pro Thr Val Asn Tyr  Ile Thr Asp Pro Glu  Glu Ile Phe Ser Ala
2385                 2390                 2395                 2400
Leu Asn Met Lys Ala  Ala Met Gly Ala Leu  Tyr Lys Gly Lys Lys  Lys
                2405                 2410                 2415
Glu Ala Leu Ser  Glu Leu Thr Leu Asp  Glu Gln Glu Ala Met  Leu Lys
            2420                 2425                 2430
Ala Ser Cys  Leu Arg Leu Tyr Thr  Gly Lys Leu Gly Ile  Trp Asn Gly
        2435                 2440                 2445
Ser Leu  Lys Ala Glu Leu Arg  Pro Ile Glu Lys Val  Glu Asn Asn Lys
    2450                 2455                 2460
Thr  Arg Thr Phe Thr Ala  Ala Pro Ile Asp Thr  Leu Leu Ala Gly Lys
2465                 2470                 2475                 2480
Val Cys Val Asp Asp  Phe Asn Asn Gln Phe  Tyr Asp Leu Asn Ile  Lys
                2485                 2490                 2495
Ala Pro Trp Thr  Val Gly Met Thr Lys  Phe Tyr Gln Gly Trp  Asn Glu
            2500                 2505                 2510
Leu Met Glu  Ala Leu Pro Ser Gly  Trp Val Tyr Cys Asp  Ala Asp Gly
        2515                 2520                 2525
Ser Gln  Phe Asp Ser Ser Leu  Thr Pro Phe Leu Ile  Asn Ala Val Leu
    2530                 2535                 2540
Lys  Val Arg Leu Ala Phe  Met Glu Glu Trp Asp  Ile Gly Glu Gln Met
2545                 2550                 2555                 2560
Leu Arg Asn Leu Tyr  Thr Glu Ile Val Tyr  Thr Pro Ile Leu Thr  Pro
                2565                 2570                 2575
Asp Gly Thr Ile  Ile Lys Lys His Lys  Gly Asn Asn Ser Gly  Gln Pro
            2580                 2585                 2590
Ser Thr Val  Val Asp Asn Thr Leu  Met Val Ile Ile Ala  Met Leu Tyr
        2595                 2600                 2605
Thr Cys  Glu Lys Cys Gly Ile  Asn Lys Glu Glu Ile  Val Tyr Tyr Val
    2610                 2615                 2620
Asn  Gly Asp Asp Leu Leu  Ile Ala Ile His Pro  Asp Lys Ala Glu Arg
2625                 2630                 2635                 2640
Leu Ser Arg Phe Lys  Glu Ser Phe Gly Glu  Leu Gly Leu Lys Tyr  Glu
                2645                 2650                 2655
Phe Asp Cys Thr  Thr Arg Asp Lys Thr  Gln Leu Trp Phe Met  Ser His
            2660                 2665                 2670
Arg Ala Leu  Glu Arg Asp Gly Met  Tyr Ile Pro Lys Leu  Glu Glu Glu
        2675                 2680                 2685
Arg Ile  Val Ser Ile Leu Glu  Trp Asp Arg Ser Lys  Glu Pro Ser His
    2690                 2695                 2700
Arg  Leu Glu Ala Ile Cys  Ala Ser Met Ile Glu  Ala Trp Gly Tyr Asp
2705                 2710                 2715                 2720
Lys Leu Val Glu Glu  Ile Arg Asn Phe Tyr  Ala Trp Val Leu Glu  Gln
                2725                 2730                 2735
Ala Pro Tyr Ser  Gln Leu Ala Glu Glu  Gly Lys Ala Pro Tyr  Leu Ala
            2740                 2745                 2750
Glu Thr Ala  Leu Lys Phe Leu Tyr  Thr Ser Gln His Gly  Thr Asn Ser
        2755                 2760                 2765
Glu Ile  Glu Glu Tyr Leu Lys  Val Leu Tyr Asp Tyr  Asp Ile Pro Thr
    2770                 2775                 2780
Thr  Glu Asn Leu Tyr Phe  Gln Ser Gly Thr Val  Asp Ala Gly Ala Asp
2785                 2790                 2795                 2800
Ala Gly Lys Lys Lys  Asp Gln Lys Asp Asp  Lys Val Ala Glu Gln  Ala
                2805                 2810                 2815
Ser Lys Asp Arg  Asp Val Asn Ala Gly  Thr Ser Gly Thr Phe  Ser Val
            2820                 2825                 2830
Pro Arg Ile  Asn Ala Met Ala Thr  Lys Leu Gln Tyr Pro  Arg Met Arg
        2835                 2840                 2845
Gly Glu  Val Val Val Asn Leu  Asn His Leu Leu Gly  Tyr Lys Pro Gln
    2850                 2855                 2860
Gln  Ile Asp Leu Ser Asn  Ala Arg Ala Thr His  Glu Gln Phe Ala Ala
2865                 2870                 2875                 2880
Trp His Gln Ala Val  Met Thr Ala Tyr Gly  Val Asn Glu Glu Gln  Met
                2885                 2890                 2895
Lys Ile Leu Leu  Asn Gly Phe Met Val  Trp Cys Ile Glu Asn  Gly Thr
            2900                 2905                 2910
Ser Pro Asn  Leu Asn Gly Thr Trp  Val Met Met Asp Gly  Glu Asp Gln
        2915                 2920                 2925
Val Ser  Tyr Pro Leu Lys Pro  Met Val Glu Asn Ala  Gln Pro Thr Leu
    2930                 2935                 2940
Arg  Gln Ile Met Thr His  Phe Ser Asp Leu Ala  Glu Ala Tyr Ile Glu
2945                 2950                 2955                 2960
Met Arg Asn Arg Glu  Arg Pro Tyr Met Pro  Arg Tyr Gly Leu Gln  Arg
                2965                 2970                 2975
Asn Ile Thr Asp  Met Ser Leu Ser Arg  Tyr Ala Phe Asp Phe  Tyr Glu
            2980                 2985                 2990
Leu Thr Ser  Lys Thr Pro Val Arg  Ala Arg Glu Ala His  Met Gln Met
        2995                 3000                 3005
Lys Ala  Ala Ala Val Arg Asn  Ser Gly Thr Arg Leu  Phe Gly Leu Asp
    3010                 3015                 3020
Gly  Asn Val Gly Thr Ala  Glu Glu Asp Thr Glu  Arg His Thr Ala His
3025                 3030                 3035                 3040
Asp Val Asn Arg Asn  Met His Thr Leu Leu Gly Val Arg Gln
                3045                 3050
<210>80
<211>9
<212>PRT
<213>人
<400>80
Asn Ser Ser Gly Gly Asn Ser Gly Ser
                5
<210>81
<211>2755
<212>DNA
<213>人
<400>81
ttaggacggg gcgatggcgg ctgagaggag ctgcgcgtgc gcgaacatgt aactggtggg    60
atctgcggcg gctcccagat gatggtcgtc ctcctgggcg cgacgaccct agtgctcgtc    120
gccgtgggcc catgggtgtt gtccgcagcc gcaggtggaa aaaatctaaa atctcctcaa    180
aaagtagagg tcgacatcat agatgacaac tttatcctga ggtggaacag gagcgatgag    240
tctgtcggga atgtgacttt ttcattcgat tatcaaaaaa ctgggatgga taattggata    300
aaattgtctg ggtgtcagaa tattactagt accaaatgca acttttcttc actcaagctg    360
aatgtttatg aagaaattaa attgcgtata agagcagaaa aagaaaacac ttcttcatgg    420
tatgaggttg actcatttac accatttcgc aaagctcaga ttggtcctcc agaagtacat    480
ttagaagctg aagataaggc aatagtgata cacatctctc ctggaacaaa agatagtgtt    540
atgtgggctt tggatggttt aagctttaca tatagcttac ttatctggaa aaactcttca    600
ggtgtagaag aaaggattga aaatatttat tccagacata aaatttataa actctcacca    660
gagactactt attgtctaaa agttaaagca gcactactta cgtcatggaa aattggtgtc    720
tatagtccag tacattgtat aaagaccaca gttgaaaatg aactacctcc accagaaaat    780
atagaagtca gtgtccaaaa tcagaactat gttcttaaat gggattatac atatgcaaac    840
atgacctttc aagttcagtg gctccacgcc tttttaaaaa ggaatcctgg aaaccatttg    900
tataaatgga aacaaatacc tgactgtgaa aatgtcaaaa ctacccagtg tgtctttcct    960
caaaacgttt tccaaaaagg aatttacctt ctccgcgtac aagcatctga tggaaataac    1020
acatcttttt ggtctgaaga gataaagttt gatactgaaa tacaagcttt cctacttcct    1080
ccagtcttta acattagatc ccttagtgat tcattccata tctatatcgg tgctccaaaa    1140
cagtctggaa acacgcctgt gatccaggat tatccactga tttatgaaat tattttttgg    1200
gaaaacactt caaatgctga gagaaaaatt atcgagaaaa aaactgatgt tacagttcct    1260
aatttgaaac cactgactgt atattgtgtg aaagccagag cacacaccat ggatgaaaag    1320
ctgaataaaa gcagtgtttt tagtgacgct gtatgtgaga aaacaaaacc aggaaatacc    1380
tctaaaattt ggcttatagt tggaatttgt attgcattat ttgctctccc gtttgtcatt    1440
tatgctgcga aagtcttctt gagatgcatc aattatgtct tctttccatc acttaaacct    1500
tcttccagta tagatgagta tttctctgaa cagccattga agaatcttct gctttcaact    1560
tctgaggaac aaatcgaaaa atgtttcata attgaaaata taagcacaat tgctacagta    1620
gaagaaacta atcaaactga tgaagatcat aaaaaataca gttcccaaac tagccaagat    1680
tcaggaaatt attctaatga agatgaaagc gaaagtaaaa caagtgaaga actacagcag    1740
gactttgtat gaccagaaat gaactgtgtc aagtataagg tttttcagca ggagttacac    1800
tgggagcctg aggtcctcac cttcctctca gtaactacag agaggacgtt tcctgtttag    1860
ggaaagaaaa aacatcttca gatcataggt cctaaaaata cgggcaagct cttaactatt    1920
taaaaatgaa attacaggcc cgggcacggt ggctcacacc tgtaatccca gcactttggg    1980
aggctgaggc aggcagatca tgaggtcaag agatcgagac cagcctggcc aacgtggtga    2040
aaccccatct ctactaaaaa tacaaaaatt agccgggtag taggtaggcg cgcgcctgtt    2100
gtcttagcta ctcaggaggc tgaggcagga gaatcgcttg aaaacaggag gtggaggttg    2160
cagtgagccg agatcacgcc actgcactcc agcctggtga cagcgtgaga ctctttaaaa    2220
aaagaaatta aaagagttga gacaaacgtt tcctacattc ttttccatgt gtaaaatcat    2280
gaaaaagcct gtcaccggac ttgcattgga tgagatgagt cagaccaaaa cagtggccac    2340
ccgtcttcct cctgtgagcc taagtgcagc cgtgctagct gcgcaccgtg gctaaggatg    2400
acgtctgtgt tcctgtccat cactgatgct gctggctact gcatgtgcca cacctgtctg    2460
ttcgccattc ctaacattct gtttcattct tcctcgggag atatttcaaa catttggtct    2520
tttcttttaa cactgagggt aggcccttag gaaatttatt taggaaagtc tgaacacgtt    2580
atcacttggt tttctggaaa gtagcttacc ctagaaaaca gctgcaaatg ccagaaagat    2640
gatccctaaa aatgttgagg gacttctgtt cattcatccc gagaacattg gcttccacat    2700
cacagtatct acccttacat ggtttaggat taaagccagg caatctttta ctatg         2755
<210>82
<211>9
<212>PRT
<213>人
<400>82
Gly Ser Glu Asn Leu Tyr Phe Gln Leu
                5
<210>83
<211>2897
<212>DNA
<213>人
<400>83
cccgcactaa agacgcttct tcccggcggg taggaatccc gccggcgagc cgaacagttc    60
cccgagcgca gcccgcggac caccacccgg ccgcacgggc cgcttttgtc ccccgcccgc    120
cgcttctgtc cgagaggccg cccgcgaggc gcatcctgac cgcgagcgtc gggtcccaga    180
gccgggcgcg gctggggccc gaggctagca tctctcggga gccgcaaggc gagagctgca    240
aagtttaatt agacacttca gaattttgat cacctaatgt tgatttcaga tgtaaaagtc    300
aagagaagac tctaaaaata gcaaagatgc ttttgagcca gaatgccttc atcttcagat    360
cacttaattt ggttctcatg gtgtatatca gcctcgtgtt tggtatttca tatgattcgc    420
ctgattacac agatgaatct tgcactttca agatatcatt gcgaaatttc cggtccatct    480
tatcatggga attaaaaaac cactccattg taccaactca ctatacattg ctgtatacaa    540
tcatgagtaa accagaagat ttgaaggtgg ttaagaactg tgcaaatacc acaagatcat    600
tttgtgacct cacagatgag tggagaagca cacacgaggc ctatgtcacc gtcctagaag    660
gattcagcgg gaacacaacg ttgttcagtt gctcacacaa tttctggctg gccatagaca    720
tgtcttttga accaccagag tttgagattg ttggttttac caaccacatt aatgtgatgg    780
tgaaatttcc atctattgtt gaggaagaat tacagtttga tttatctctc gtcattgaag    840
aacagtcaga gggaattgtt aagaagcata aacccgaaat aaaaggaaac atgagtggaa    900
atttcaccta tatcattgac aagttaattc caaacacgaa ctactgtgta tctgtttatt    960
tagagcacag tgatgagcaa gcagtaataa agtctccctt aaaatgcacc ctccttccac    1020
ctggccagga atcagaatca gcagaatctg ccaaaatagg aggaataatt actgtgtttt    1080
tgatagcatt ggtcttgaca agcaccatag tgacactgaa atggattggt tatatatgct    1140
taagaaatag cctccccaaa gtcttgaatt ttcataactt tttagcctgg ccatttccta    1200
acctgccacc gttggaagcc atggatatgg tggaggtcat ttacatcaac agaaagaaga    1260
aagtgtggga ttataattat gatgatgaaa gtgatagcga tactgaggca gcgcccagga    1320
caagtggcgg tggctatacc atgcatggac tgactgtcag gcctctgggt caggcctctg    1380
ccacctctac agaatcccag ttgatagacc cggagtccga ggaggagcct gacctgcctg    1440
aggttgatgt ggagctcccc acgatgccaa aggacagccc tcagcagttg gaactcttga    1500
gtgggccctg tgagaggaga aagagtccac tccaggaccc ttttcccgaa gaggactaca    1560
gctccacgga ggggtctggg ggcagaatta ccttcaatgt ggacttaaac tctgtgtttt    1620
tgagagttct tgatgacgag gacagtgacg acttagaagc ccctctgatg ctatcgtctc    1680
atctggaaga gatggttgac ccagaggatc ctgataatgt gcaatcaaac catttgctgg    1740
ccagcgggga agggacacag ccaacctttc ccagcccctc ttcagagggc ctgtggtccg    1800
aagatgctcc atctgatcaa agtgacactt ctgagtcaga tgttgacctt ggggatggtt    1860
atataatgag atgactccaa aactattgaa tgaacttgga cagacaagca cctacagggt    1920
tctttgtctc tgcatcctaa cttgctgcct tatcgtctgc aagtgttctc caagggaagg    1980
aggaggaaac tgtggtgttc ctttcttcca ggtgacatca cctatgcaca ttcccagtat    2040
ggggaccata gtatcattca gtgcattgtt tacatattca aagtggtgca ctttgaagga    2100
agcacatgtg cacctttcct ttacactaat gcacttagga tgtttctgca tcatgtctac    2160
cagggagcag ggttccccac agtttcagag gtggtccagg accctatgat atttctcttc    2220
tttcgttctt tttttttttt ttttgagaca gagtctcgtt ctgtcgccca agctggagcg    2280
caatggtgtg atcttggctc actgcaacat ccgcctcccg ggttcaggtg attctcctgc    2340
ctcagcctcc ctcgcaagta gctgggatta caggcgcctg ccaccatgcc tagcaaattt    2400
ttgtattttt agtggagaca ggattttacc atgttggcca ggctggtctc gaactcctga    2460
cctcaagtga tctgccctcc tcagcctcgt aaagtgctgg gattacaggg gtgagccgct    2520
gtgcctggct ggccctgtga tatttctgtg aaataaattg ggccagggtg ggagcaggga    2580
aagaaaagga aaatagtagc aagagctgca aagcaggcag gaagggagga ggagagccag    2640
gtgagcagtg gagagaaggg gggccctgca caaggaaaca gggaagagcc atcgaagttt    2700
cagtcggtga gccttgggca cctcacccat gtcacatcct gtctcctgca attggaattc    2760
caccttgtcc agccctcccc agttaaagtg gggaagacag actttaggat cacgtgtgtg    2820
actaatacag aaaggaaaca tggcgtcggg gagagggata aaacctgaat gccatatttt    2880
aagttaaaaa aaaaaaa                                                   2897
<210>84
<211>3054
<212>PRT
<213>人
<400>84
Met Ala Leu Ile Phe Gly Thr Val Asn Ala Asn Ile Leu Lys Glu Val
1               5                   10                  15
Phe Gly Gly Ala Arg Met Ala Cys Val Thr Ser Ala His Met Ala Gly
            20                  25                  30
Ala Asn Gly Ser Ile Leu Lys Lys Ala Glu Glu Thr Ser Arg Ala Ile
        35                  40                  45
Met His Lys Pro Val Ile Phe Gly Glu Asp Tyr Ile Thr Glu Ala Asp
    50                  55                  60
Leu Pro Tyr Thr Pro Leu His Leu Glu Val Asp Ala Glu Met Glu Arg
65                  70                  75                  80
Met Tyr Tyr Leu Gly Arg Arg Ala Leu Thr His Gly Lys Arg Arg Lys
                85                  90                  95
Val Ser Val Asn Asn Lys Arg Asn Arg Arg Arg Lys Val Ala Lys Thr
            100                 105                 110
Tyr Val Gly Arg Asp Ser Ile Val Glu Lys Ile Val Val Pro His Thr
        115                 120                 125
Glu Arg Lys Val Asp Thr Thr Ala Ala Val Glu Asp Ile Cys Asn Glu
    130                 1351                 40
Ala Thr Thr Gln Leu Val His Asn Ser Met Pro Lys Arg Lys Lys Gln
145                 150                 155                 160
Lys Asn Phe Leu Pro Ala Thr Ser Leu Ser Asn Val Tyr Ala Gln Thr
                165                 170                 175
Trp Ser Ile Val Arg Lys Arg His Met Gln Val Glu Ile Ile Ser Lys
            180                 185                 190
Lys Ser Val Arg Ala Arg Val Lys Arg Phe Glu Gly Ser Val Gln Leu
        195                 200                 205
Phe Ala Ser Val Arg His Met Tyr Gly Glu Arg Lys Arg Val Asp Leu
    210                 215                 220
Arg Ile Asp Asn Trp Gln Gln Glu Thr Leu Leu Asp Leu Ala Lys Arg
225                 230                 235                 240
Phe Lys Asn Glu Arg Val Asp Gln Ser Lys Leu Thr Phe Gly Ser Ser
                245                 250                 255
Gly Leu Val Leu Arg Gln Gly Ser Tyr Gly Pro Ala His Trp Tyr Arg
            260                 265                 270
His Gly Met Phe Ile Val Arg Gly Arg Ser Asp Gly Met Leu Val Asp
        275                 280                 285
Ala Arg Ala Lys Val Thr Phe Ala Val Cys His Ser Met Thr His Tyr
    290                 295                 300
Ser Asp Lys Ser Ile Ser Glu Ala Phe Phe Ile Pro Tyr Ser Lys Lys
305                 310                 315                 320
Phe Leu Glu Leu Arg Pro Asp Gly Ile Ser His Glu Cys Thr Arg Gly
                325                 330                 335
Val Ser Val Glu Arg Cys Gly Glu Val Ala Ala Ile Leu Thr Gln Ala
             340                 345                 350
Leu Ser Pro Cys Gly Lys Ile Thr Cys Lys Arg Cys Met Val Glu Thr
        355                 360                 365
Pro Asp Ile Val Glu Gly Glu Ser Gly Glu Ser Val Thr Asn Gln Gly
    370                 375                 380
Lys  Leu Leu Ala Met Leu Lys Glu Gln Tyr Pro Asp Phe Pro Met Ala
385                 390                 395                 400
Glu Lys Leu Leu Thr Arg Phe Leu Gln Gln Lys Ser Leu Val Asn Thr
              405                 410                 415
Asn Leu Thr Ala Cys Val Ser Val Lys Gln Leu Ile Gly Asp Arg Lys
            420                 425                 430
Gln Ala Pro Phe Thr His Val Leu Ala Val Ser Glu Ile Leu Phe Lys
        435                 440                 445
Gly Asn LysLeu Thr Gly Ala Asp Leu Glu Glu Ala Ser Thr His Met
    450                 455                 460
Leu Glu Ile Ala Arg Phe Leu Asn Asn Arg Thr Glu Asn Met Arg Ile
465                 470                 475                 480
Gly His Leu Gly Ser Phe Arg Asn Lys Ile Ser Ser Lys Ala His Val
                485                 490                 495
Asn Asn Ala Leu Met Cys Asp Asn Gln Leu Asp Gln Asn Gly Asn Phe
            500                 505                 510
Ile Trp Gly Leu Arg Gly Ala His Ala Lys Arg Phe Leu Lys Gly Phe
        515                 520                 525
Phe Thr Glu Ile Asp Pro Asn Glu Gly Tyr Asp Lys Tyr Val Ile Arg
    530                535                 540
Lys His Ile Arg Gly Ser Arg Lys Leu Ala Ile Gly Asn Leu Ile Met
545                 550                 555                 560
Ser Thr Asp Phe Gln Thr Leu Arg Gln Gln Ile Gln Gly Glu Thr Ile
                565                 570                 575
Glu Arg Lys Glu Ile Gly Asn His Cys Ile Ser Met Arg Asn Gly Asn
            580                 585                 590
Tyr Val Tyr Pro Cys Cys Cys Val Thr Leu Glu Asp Gly Lys Ala Gln
        595                 600                 605
Tyr Ser Asp Leu Lys His Pro Thr Lys Arg His Leu Val Ile Gly Asn
    610                 615                 620
Ser Gly Asp Ser Lys Tyr Leu Asp Leu Pro Val Leu Asn Glu Glu Lys
625                 630                 635                 640
Met Tyr Ile Ala Asn Glu Gly Tyr Cys Tyr Met Asn Ile Phe Phe Ala
                645                 650                 655
Leu Leu Val Asn Val Lys Glu Glu Asp Ala Lys Asp Phe Thr Lys Phe
            660                 665                 670
Ile Arg Asp Thr Ile Val Pro Lys Leu Gly Ala Trp Pro Thr Met Gln
        675                 680                 685
Asp Val Ala Thr Ala Cys Tyr Leu Leu Ser Ile Leu Tyr Pro Asp Val
    690                 695                 700
Leu Arg Ala Glu Leu Pro Arg Ile Leu Val Asp His Asp Asn Lys Thr
705                 710                 715                 720
Met His Val Leu Asp Ser Tyr Gly Ser Arg Thr Thr Gly Tyr His Met
                725                 730                 735
Leu Lys Met Asn Thr Thr Ser Gln Leu Ile Glu Phe Val His Ser Gly
            740                 745                 750
Leu Glu Ser Glu Met Lys Thr Tyr Asn Val Gly Gly Met Asn Arg Asp
        755                 760                 765
Val Val Thr Gln Gly Ala Ile Glu Met Leu Ile Lys Ser Ile Tyr Lys
    770                 775                 780
Pro His Leu Met Lys Gln Leu Leu Glu Glu Glu Pro Tyr Ile Ile Val
785                 790                 795                 800
Leu Ala Ile Val Ser Pro Ser Ile Leu Ile Ala Met Tyr Asn Ser Gly
                805                 810                 815
Thr Phe Glu Gln Ala Leu Gln Met Trp Leu Pro Asn Thr Met Arg Leu
            820                 825                 830
Ala Asn Leu Ala Ala Ile Leu Ser Ala Leu Ala Gln Lys Leu Thr Leu
        835                 840                 845
Ala Asp Leu Phe Val Gln Gln Arg Asn Leu Ile Asn Glu Tyr Ala Gln
    850                 855                 860
Val Ile Leu Asp Asn Leu Ile Asp Gly Val Arg Val Asn His Ser Leu
865                 870                 875                 880
Ser Leu Ala Met Glu Ile Val Thr Ile Lys Leu Ala Thr Gln Glu Met
                885                 890                 895
Asp Met Ala Leu Arg Glu Gly Gly Tyr Ala Val Thr Ser Glu Lys Val
            900                 905                 910
His Glu Met Leu Glu Lys Asn Tyr Val Lys Ala Leu Lys Asp Ala Trp
        915                 920                 925
Asp Glu Leu Thr Trp Leu Glu Lys Phe Ser Ala Ile Arg His Ser Arg
    930                 935                 940
Lys Leu Leu Lys Phe Gly Arg Lys Pro Leu Ile Met Lys Asn Thr Val
945                 950                 955                 960
Asp Cys Gly Gly His Ile Asp Leu Ser Val  Lys Ser Leu Phe Lys Phe
               965                 970                 975
His Leu Glu Leu Leu Lys Gly Thr Ile Ser Arg Ala Val Asn Gly Gly
            980                 985                 990
Ala Arg Lys Val Arg Val Ala Lys  Asn Ala Met Thr Lys  Gly Val Phe
        995                 1000                 1005
Leu Lys  Ile Tyr Ser Met Leu  Pro Asp Val Tyr Lys  Phe Ile Thr
    1010                 1015                 1020
Val Ser  Ser Val Leu Ser Leu  Leu Leu Thr Phe Leu  Phe Gln Ile
    1025                 1030                 1035
Asp Cys  Met Ile Arg Ala His  Arg Glu Ala Lys Val  Ala Ala Gln
    1040                 1045                 1050
Leu Gln  Lys Glu Ser Glu Trp  Asp Asn Ile Ile Asn  Arg Thr Phe
    1055                 1060                 1065
Gln Tyr  Ser Lys Leu Glu Asn  Pro Ile Gly Tyr Arg  Ser Thr Ala
    1070                 1075                 1080
Glu Glu  Arg Leu Gln Ser Glu  His Pro Glu Ala Phe  Glu Tyr Tyr
    1085                 1090                 1095
Lys Phe  Cys Ile Gly Lys Glu  Asp Leu Val Glu Gln  Ala Lys Gln
    1100                 1105                 1110
Pro Glu  Ile Ala Tyr Phe Glu  Lys Ile Ile Ala Phe  Ile Thr Leu
    1115                 1120                 1125
Val Leu  Met Ala Phe Asp Ala  Glu Arg Ser Asp Gly  Val Phe Lys
    1130                 1135                 1140
Ile Leu  Asn Lys Phe Lys Gly  Ile Leu Ser Ser Thr  Glu Arg Glu
    1145                 1150                 1155
Ile Ile  Tyr Thr Gln Ser Leu  Asp Asp Tyr Val Thr  Thr Phe Asp
    1160                 1165                 1170
Asp Asn  Met Thr Ile Asn Leu  Glu Leu Asn Met Asp  Glu Leu His
    1175                 1180                 1185
Lys Thr  Ser Leu Pro Gly Val  Thr Phe Lys Gln Trp  Trp Asn Asn
    1190                 1195                 1200
Gln Ile  Ser Arg Gly Asn Val  Lys Pro His Tyr Arg  Thr Glu Gly
    1205                 1210                 1215
His Phe  Met Glu Phe Thr Arg  Asp Thr Ala Ala Ser  Val Ala Ser
    1220                 1225                 1230
Glu Ile  Ser His Ser Pro Ala  Arg Asp Phe Leu Val  Arg Gly Ala
    1235                 1240                 1245
Val Gly  Ser Gly Lys Ser Thr  Gly Leu Pro Tyr His  Leu Ser Lys
    1250                 1255                 1260
Arg Gly  Arg Val Leu Met Leu  Glu Pro Thr Arg Pro  Leu Thr Asp
    1265                 1270                 1275
Asn Met  His Lys Gln Leu Arg  Ser Glu Pro Phe Asn  Cys Phe Pro
    1280                 1285                 1290
Thr Leu  Arg Met Arg Gly Lys  Ser Thr Phe Gly Ser  Ser Pro Ile
    1295                 1300                 1305
Thr Val  Met Thr Ser Gly Phe  Ala Leu His His Phe  Ala Arg Asn
    1310                 1315                 1320
Ile Ala  Glu Val Lys Thr Tyr  Asp Phe Val Ile Ile  Asp Glu Cys
    1325                 1330                 1335
His Val  Asn Asp Ala Ser Ala  Ile Ala Phe Arg Asn  Leu Leu Phe
    1340                 1345                 1350
Glu His  Glu Phe Glu Gly Lys  Val Leu Lys Val Ser  Ala Thr Pro
    1355                 1360                 1365
Pro Gly  Arg Glu Val Glu Phe  Thr Thr Gln Phe Pro  Val Lys Leu
    1370                 1375                 1380
Lys Ile  Glu Glu Ala Leu Ser  Phe Gln Glu Phe Val  Ser Leu Gln
    1385                 1390                 1395
Gly Thr  Gly Ala Asn Ala Asp  Val Ile Ser Cys Gly  Asp Asn Ile
    1400                 1405                 1410
Leu Val  Tyr Val Ala Ser Tyr  Asn Asp Val Asp Ser  Leu Gly Lys
    1415                 1420                 1425
Leu Leu  Val Gln Lys Gly Tyr  Lys Val Ser Lys Ile  Asp Gly Arg
    1430                 1435                 1440
Thr Met  Lys Ser Gly Gly Thr  Glu Ile Ile Thr Glu  Gly Thr Ser
    1445                 1450                 1455
Val Lys  Lys His Phe Ile Val  Ala Thr Asn Ile Ile  Glu Asn Gly
    1460                 1465                 1470
Val Thr  Ile Asp Ile Asp Val  Val Val Asp Phe Gly  Thr Lys Val
    1475                 1480                 1485
Val Pro  Val Leu Asp Val Asp  Asn Arg Ala Val Gln  Tyr Asn Lys
    1490                 1495                 1500
Thr Val  Val Ser Tyr Gly Glu  Arg Ile Gln Lys Leu  Gly Arg Val
    1505                 1510                 1515
Gly Arg  His Lys Glu Gly Val  Ala Leu Arg Ile Gly  Gln Thr Asn
    1520                 1525                 1530
Lys Thr  Leu Val Glu Ile Pro  Glu Met Val Ala Thr  Glu Ala Ala
    1535                 1540                 1545
Phe Leu  Cys Phe Met Tyr Asn  Leu Pro Val Thr Thr  Gln Ser Val
    1550                 1555                 1560
Ser Thr  Thr Leu Leu Glu Asn  Ala Thr Leu Leu Gln  Ala Arg Thr
    1565                 1570                 1575
Met Ala  Gln Phe Glu Leu Ser  Tyr Phe Tyr Thr Ile  Asn Phe Val
    1580                 1585                 1590
Arg Phe  Asp Gly Ser Met His  Pro Val Ile His Asp  Lys Leu Lys
    1595                 1600                 1605
Arg Phe  Lys Leu His Thr Cys  Glu Thr Phe Leu Asn  Lys Leu Ala
    1610                 1615                 1620
Ile Pro  Asn Lys Gly Leu Ser  Ser Trp Leu Thr Ser  Gly Glu Tyr
    1625                 1630                 1635
Lys Arg  Leu Gly Tyr Ile Ala  Glu Asp Ala Gly Ile  Arg Ile Pro
    1640                 1645                 1650
Phe Val  Cys Lys Glu Ile Pro  Asp Ser Leu His Glu  Glu Ile Trp
    1655                 1660                 1665
His Ile  Val Val Ala His Lys  Gly Asp Ser Gly Ile  Gly Arg Leu
    1670                 1675                 1680
Thr Ser  Val Gln Ala Ala Lys  Val Val Tyr Thr Leu  Gln Thr Asp
    1685                 1690                 1695
Val His  Ser Ile Ala Arg Thr  Leu Ala Cys Ile Asn  Arg Arg Ile
    1700                 1705                 1710
Ala Asp  Glu Gln Met Lys Gln  Ser His Phe Glu Ala  Ala Thr Gly
    1715                 1720                 1725
Arg Ala  Phe Ser Phe Thr Asn  Tyr Ser Ile Gln Ser  Ile Phe Asp
    1730                 1735                 1740
Thr Leu  Lys Ala Asn Tyr Ala  Thr Lys His Thr Lys  Glu Asn Ile
    1745                 1750                 1755
Ala Val  Leu Gln Gln Ala Lys  Asp Gln Leu Leu Glu  Phe Ser Asn
    1760                 1765                 1770
Leu Ala  Lys Asp Gln Asp Val  Thr Gly Ile Ile Gln  Asp Phe Asn
    1775                 1780                 1785
His Leu  Glu Thr Ile Tyr Leu  Gln Ser Asp Ser Glu  Val Ala Lys
    1790                 1795                 1800
His Leu  Lys Leu Lys Ser His  Trp Asn Lys Ser Gln  Ile Thr Arg
     1805                 1810                 1815
Asp Ile  Ile Ile Ala Leu Ser  Val Leu Ile Gly Gly  Gly Trp Met
    1820                 1825                 1830
Leu Ala  Thr Tyr Phe Lys Asp  Lys Phe Asn Glu Pro  Val Tyr Phe
    1835                 1840                 1845
Gln Gly  Lys Lys Asn Gln Lys  His Lys Leu Lys Met  Arg Glu Ala
    1850                 1855                 1860
Arg Gly  Ala Arg Gly Gln Tyr  Glu Val Ala Ala Glu  Pro Glu Ala
    1865                 1870                 1875
Leu Glu  His Tyr Phe Gly Ser  Ala Tyr Asn Asn Lys  Gly Lys Arg
    1880                 1885                 1890
Lys Gly  Thr Thr Arg Gly Met  Gly Ala Lys Ser Arg  Lys Phe Ile
    1895                 1900                 1905
Asn Met  Tyr Gly Phe Asp Pro  Thr Asp Phe Ser Tyr  Ile Arg Phe
    1910                 1915                 1920
Val Asp  Pro Leu Thr Gly His  Thr Ile Asp Glu Ser  Thr Asn Ala
    1925                 1930                 1935
Pro Ile  Asp Leu Val Gln His  Glu Phe Gly Lys Val  Arg Thr Arg
    1940                 1945                 1950
Met Leu  Ile Asp Asp Glu Ile  Glu Pro Gln Ser Leu  Ser Thr His
    1955                 1960                 1965
Thr Thr  Ile His Ala Tyr Leu  Val Asn Ser Gly Thr  Lys Lys Val
    1970                 1975                 1980
Leu Lys  Val Asp Leu Thr Pro  His Ser Ser Leu Arg  Ala Ser Glu
    1985                 1990                 1995
Lys Ser  Thr Ala Ile Met Gly  Phe Pro Glu Arg Glu  Asn Glu Leu
    2000                 2005                 2010
Arg Gln  Thr Gly Met Ala Val  Pro Val Ala Tyr Asp  Gln Leu Pro
    2015                 2020                 2025
Pro Lys  Asn Glu Asp Leu Thr  Phe Glu Gly Glu Ser  Leu Phe Lys
    2030                 2035                 2040
Gly Pro  Arg Asp Tyr Asn Pro  Ile Ser Ser Thr Ile  Cys His Leu
    2045                 2050                 2055
Thr Asn  Glu Ser Asp Gly His  Thr Thr Ser Leu Tyr  Gly Ile Gly
    2060                 2065                 2070
Phe Gly  Pro Phe Ile Ile Thr  Asn Lys His Leu Phe  Arg Arg Asn
    2075                 2080                 2085
Asn Gly  Thr Leu Leu Val Gln  Ser Leu His Gly Val  Phe Lys Val
    2090                 2095                 2100
Lys Asn  Thr Thr Thr Leu Gln  Gln His Leu Ile Asp  Gly Arg Asp
    2105                 2110                 2115
Met Ile  Ile Ile Arg Met Pro  Lys Asp Phe Pro Pro  Phe Pro Gln
    2120                 2125                 2130
Lys Leu  Lys Phe Arg Glu Pro  Gln Arg Glu Glu Arg  Ile Cys Leu
    2135                 2140                 2145
Val Thr  Thr Asn Phe Gln Thr  Lys Ser Met Ser Ser  Met Val Ser
    2150                 2155                 2160
Asp Thr  Ser Cys Thr Phe Pro  Ser Ser Asp Gly Ile  Phe Trp Lys
    2165                 2170                 2175
His Trp  Ile Gln Thr Lys Asp  Gly Gln Cys Gly Ser  Pro Leu Val
    2180                 2185                 2190
Ser Thr  Arg Asp Gly Phe Ile  Val Gly Ile His Ser  Ala Ser Asn
    2195                 2200                 2205
Phe Thr  Asn Thr Asn Asn Tyr  Phe Thr Ser Val Pro  Lys Asn Phe
    2210                 2215                 2220
Met Glu  Leu Leu Thr Asn Gln  Glu Ala Gln Gln Trp  Val Ser Gly
    2225                 2230                 2235
Trp Arg  Leu Asn Ala Asp Ser  Val Leu Trp Gly Gly  His Lys Val
    2240                 2245                 2250
Phe Met  Ser Lys Pro Glu Glu  Pro Phe Gln Pro Val  Lys Glu Ala
    2255                 2260                 2265
Thr Gln  Leu Met Asn Glu Leu  Val Tyr Ser Gln Gly  Glu Lys Arg
    2270                 2275                 2280
Lys Trp  Val Val Glu Ala Leu  Ser Gly Asn Leu Arg  Pro Val Ala
    2285                 2290                 2295
Glu Cys  Pro Ser Gln Leu Val  Thr Lys His Val Val  Lys Gly Lys
    2300                 2305                 2310
Cys Pro  Leu Phe Glu Leu Tyr  Leu Gln Leu Asn Pro  Glu Lys Glu
    2315                 2320                 2325
Ala Tyr  Phe Lys Pro Met Met  Gly Ala Tyr Lys Pro  Ser Arg Leu
    2330                 2335                 2340
Asn Arg  Glu Ala Phe Leu Lys  Asp Ile Leu Lys Tyr  Ala Ser Glu
    2345                 2350                 2355
Ile Glu  Ile Gly Asn Val Asp  Cys Asp Leu Leu Glu  Leu Ala Ile
    2360                 2365                 2370
Ser Met  Leu Val Thr Lys Leu  Lys Ala Leu Gly Phe  Pro Thr Val
    2375                 2380                 2385
Asn Tyr  Ile Thr Asp Pro Glu  Glu Ile Phe Ser Ala  Leu Asn Met
    2390                 2395                 2400
Lys Ala  Ala Met Gly Ala Leu  Tyr Lys Gly Lys Lys  Lys Glu Ala
    2405                 2410                 2415
Leu Ser  Glu Leu Thr Leu Asp  Glu Gln Glu Ala Met  Leu Lys Ala
    2420                 2425                 2430
Ser Cys  Leu Arg Leu Tyr Thr  Gly Lys Leu Gly Ile  Trp Asn Gly
    2435                 2440                 2445
Ser Leu  Lys Ala Glu Leu Arg  Pro Ile Glu Lys Val  Glu Asn Asn
    2450                 2455                 2460
Lys Thr  Arg Thr Phe Thr Ala  Ala Pro Ile Asp Thr  Leu Leu Ala
    2465                 2470                 2475
Gly Lys  Val Cys Val Asp Asp  Phe Asn Asn Gln Phe  Tyr Asp Leu
    2480                 2485                 2490
Asn Ile  Lys Ala Pro Trp Thr  Val Gly Met Thr Lys  Phe Tyr Gln
    2495                 2500                 2505
Gly Trp  Asn Glu Leu Met Glu  Ala Leu Pro Ser Gly  Trp Val Tyr
    2510                 2515                 2520
Cys Asp  Ala Asp Gly Ser Gln  Phe Asp Ser Ser Leu  Thr Pro Phe
    2525                 2530                 2535
Leu Ile  Asn Ala Val Leu Lys  Val Arg Leu Ala Phe  Met Glu Glu
    2540                 2545                 2550
Trp Asp  Ile Gly Glu Gln Met  Leu Arg Asn Leu Tyr  Thr Glu Ile
    2555                 2560                 2565
Val Tyr  Thr Pro Ile Leu Thr  Pro Asp Gly Thr Ile  Ile Lys Lys
    2570                 2575                 2580
His Lys  Gly Asn Asn Ser Gly  Gln Pro Ser Thr Val  Val Asp Asn
    2585                 2590                 2595
Thr Leu  Met Val Ile Ile Ala  Met Leu Tyr Thr Cys  Glu Lys Cys
    2600                 2605                 2610
Gly Ile  Asn Lys Glu Glu Ile  Val Tyr Tyr Val Asn  Gly Asp Asp
    2615                 2620                 2625
Leu Leu  Ile Ala Ile His Pro  Asp Lys Ala Glu Arg  Leu Ser Arg
    2630                 2635                 2640
Phe Lys  Glu Ser Phe Gly Glu  Leu Gly Leu Lys Tyr  Glu Phe Asp
    2645                 2650                 2655
Cys Thr  Thr Arg Asp Lys Thr  Gln Leu Trp Phe Met  Ser His Arg
    2660                 2665                 2670
Ala Leu  Glu Arg Asp Gly Met  Tyr Ile Pro Lys Leu  Glu Glu Glu
    2675                 2680                 2685
Arg Ile  Val Ser Ile Leu Glu  Trp Asp Arg Ser Lys  Glu Pro Ser
    2690                 2695                 2700
His Arg  Leu Glu Ala Ile Cys  Ala Ser Met Ile Glu  Ala Trp Gly
    2705                 2710                 2715
Tyr Asp  Lys Leu Val Glu Glu  Ile Arg Asn Phe Tyr  Ala Trp Val
    2720                 2725                 2730
Leu Glu  Gln Ala Pro Tyr Ser  Gln Leu Ala Glu Glu  Gly Lys Ala
    2735                 2740                 2745
Pro Tyr  Leu Ala Glu Thr Ala  Leu Lys Phe Leu Tyr  Thr Ser Gln
    2750                 2755                 2760
His Gly  Thr Asn Ser Glu Ile  Glu Glu Tyr Leu Lys  Val Leu Tyr
    2765                 2770                 2775
Asp Tyr  Asp Ile Pro Thr Thr  Glu Asn Leu Tyr Phe  Gln Ser Gly
    2780                 2785                 2790
Thr Val  Asp Ala Gly Ala Asp  Ala Gly Lys Lys Lys  Asp Gln Lys
    2795                 2800                 2805
Asp Asp  Lys Val Ala Glu Gln  Ala Ser Lys Asp Arg  Asp Val Asn
    2810                 2815                 2820
Ala Gly  Thr Ser Gly Thr Phe  Ser Val Pro Arg Ile  Asn Ala Met
    2825                 2830                 2835
Ala Thr  Lys Leu Gln Tyr Pro  Arg Met Arg Gly Glu  Val Val Val
    2840                 2845                 2850
Asn Leu  Asn His Leu Leu Gly  Tyr Lys Pro Gln Gln  Ile Asp Leu
    2855                 2860                 2865
Ser Asn  Ala Ar gAla Thr His  Glu Gln Phe Ala Ala  Trp His Gln
    2870                 2875                 2880
Ala Val  Met Thr Ala Tyr Gly  Val Asn Glu Glu Gln  Met Lys Ile
    2885                 2890                 2895
Leu Leu  Asn Gly Phe Met Val  Trp Cys Ile Glu Asn  Gly Thr Ser
    2900                 2905                 2910
Pro Asn  Leu Asn Gly Thr Trp  Val Met Met Asp Gly  Glu Asp Gln
    2915                 2920                 2925
Val Ser  Tyr Pro Leu Lys Pro  Met Val Glu Asn Ala  Gln Pro Thr
    2930                 2935                 2940
Leu Arg  Gln Ile Met Thr His  Phe Ser Asp Leu Ala  Glu Ala Tyr
    2945                 2950                 2955
Ile Glu  Met Arg Asn Arg Glu  Arg Pro Tyr Met Pro  Arg Tyr Gly
    2960                 2965                 2970
Leu Gln  Arg Asn Ile Thr Asp  Met Ser Leu Ser Arg  Tyr Ala Phe
    2975                 2980                 2985
Asp Phe  Tyr Glu Leu Thr Ser  Lys Thr Pro Val Arg  Ala Arg Glu
    2990                 2995                 3000
Ala His  Met Gln Met Lys Ala  Ala Ala Val Arg Asn  Ser Gly Thr
    3005                 3010                 3015
Arg Leu  Phe Gly Leu Asp Gly  Asn Val Gly Thr Ala  Glu Glu Asp
    3020                 3025                 3030
Thr Glu  Arg His Thr Ala His  Asp Val Asn Arg Asn  Met His Thr
    3035                 3040                 3045
Leu Leu  Gly Val Arg Gln
    3050
<210>85
<211>4157
<212>DNA
<213>人
<400>85
agcggggcgg ggcgccagcg ctgccttttc tcctgccggg tagtttcgct ttcctgcgca    60
gagtctgcgg aggggctcgg ctgcaccggg gggatcgcgc ctggcagacc ccagaccgag    120
cagaggcgac ccagcgcgct cgggagaggc tgcaccgccg cgcccccgcc tagcccttcc    180
ggatcctgcg cgcagaaaag tttcatttgc tgtatgccat cctcgagagc tgtctaggtt    240
aacgttcgca ctctgtgtat ataacctcga cagtcttggc acctaacgtg ctgtgcgtag    300
ctgctccttt ggttgaatcc ccaggccctt gttggggcac aaggtggcag gatgtctcag    360
tggtacgaac ttcagcagct tgactcaaaa ttcctggagc aggttcacca gctttatgat    420
gacagttttc ccatggaaat cagacagtac ctggcacagt ggttagaaaa gcaagactgg    480
gagcacgctg ccaatgatgt ttcatttgcc accatccgtt ttcatgacct cctgtcacag    540
ctggatgatc aatatagtcg cttttctttg gagaataact tcttgctaca gcataacata    600
aggaaaagca agcgtaatct tcaggataat tttcaggaag acccaatcca gatgtctatg    660
atcatttaca gctgtctgaa ggaagaaagg aaaattctgg aaaacgccca gagatttaat    720
caggctcagt cggggaatat tcagagcaca gtgatgttag acaaacagaa agagcttgac    780
agtaaagtca gaaatgtgaa ggacaaggtt atgtgtatag agcatgaaat caagagcctg    840
gaagatttac aagatgaata tgacttcaaa tgcaaaacct tgcagaacag agaacacgag    900
accaatggtg tggcaaagag tgatcagaaa caagaacagc tgttactcaa gaagatgtat    960
ttaatgcttg acaataagag aaaggaagta gttcacaaaa taatagagtt gctgaatgtc    1020
actgaactta cccagaatgc cctgattaat gatgaactag tggagtggaa gcggagacag    1080
cagagcgcct gtattggggg gccgcccaat gcttgcttgg atcagctgca gaactggttc    1140
actatagttg cggagagtct gcagcaagtt cggcagcagc ttaaaaagtt ggaggaattg    1200
gaacagaaat acacctacga acatgaccct atcacaaaaa acaaacaagt gttatgggac    1260
cgcaccttca gtcttttcca gcagctcatt cagagctcgt ttgtggtgga aagacagccc    1320
tgcatgccaa cgcaccctca gaggccgctg gtcttgaaga caggggtcca gttcactgtg    1380
aagttgagac tgttggtgaa attgcaagag ctgaattata atttgaaagt caaagtctta    1440
tttgataaag atgtgaatga gagaaataca gtaaaaggat ttaggaagtt caacattttg    1500
ggcacgcaca caaaagtgat gaacatggag gagtccacca atggcagtct ggcggctgaa    1560
tttcggcacc tgcaattgaa agaacagaaa aatgctggca ccagaacgaa tgagggtcct    1620
ctcatcgtta ctgaagagct tcactccctt agttttgaaa cccaattgtg ccagcctggt    1680
ttggtaattg acctcgagac gacctctctg cccgttgtgg tgatctccaa cgtcagccag    1740
ctcccgagcg gttgggcctc catcctttgg tacaacatgc tggtggcgga acccaggaat    1800
ctgtccttct tcctgactcc accatgtgca cgatgggctc agctttcaga agtgctgagt    1860
tggcagtttt cttctgtcac caaaagaggt ctcaatgtgg accagctgaa catgttggga    1920
gagaagcttc ttggtcctaa cgccagcccc gatggtctca ttccgtggac gaggttttgt    1980
aaggaaaata taaatgataa aaattttccc ttctggcttt ggattgaaag catcctagaa    2040
ctcattaaaa aacacctgct ccctctctgg aatgatgggt gcatcatggg cttcatcagc    2100
aaggagcgag agcgtgccct gttgaaggac cagcagccgg ggaccttcct gctgcggttc    2160
agtgagagct cccgggaagg ggccatcaca ttcacatggg tggagcggtc ccagaacgga    2220
ggcgaacctg acttccatgc ggttgaaccc tacacgaaga aagaactttc tgctgttact    2280
ttccctgaca tcattcgcaa ttacaaagtc atggctgctg agaatattcc tgagaatccc    2340
ctgaagtatc tgtatccaaa tattgacaaa gaccatgcct ttggaaagta ttactccagg    2400
ccaaaggaag caccagagcc aatggaactt gatggcccta aaggaactgg atatatcaag    2460
actgagttga tttctgtgtc tgaagttcac ccttctagac ttcagaccac agacaacctg    2520
ctccccatgt ctcctgagga gtttgacgag gtgtctcgga tagtgggctc tgtagaattc    2580
gacagtatga tgaacacagt atagagcatg aatttttttc atcttctctg gcgacagttt    2640
tccttctcat ctgtgattcc ctcctgctac tctgttcctt cacatcctgt gtttctaggg    2700
aaatgaaaga aaggccagca aattcgctgc aacctgttga tagcaagtga atttttctct    2760
aactcagaaa catcagttac tctgaagggc atcatgcatc ttactgaagg taaaattgaa    2820
aggcattctc tgaagagtgg gtttcacaag tgaaaaacat ccagatacac ccaaagtatc    2880
aggacgagaa tgagggtcct ttgggaaagg agaagttaag caacatctag caaatgttat    2940
gcataaagtc agtgcccaac tgttataggt tgttggataa atcagtggtt atttagggaa    3000
ctgcttgacg taggaacggt aaatttctgt gggagaattc ttacatgttt tctttgcttt    3060
aagtgtaact ggcagttttc cattggttta cctgtgaaat agttcaaagc caagtttata    3120
tacaattata tcagtcctct ttcaaaggta gccatcatgg atctggtagg gggaaaatgt    3180
gtattttatt acatctttca cattggctat ttaaagacaa agacaaattc tgtttcttga    3240
gaagagaata ttagctttac tgtttgttat ggcttaatga cactagctaa tatcaataga    3300
aggatgtaca tttccaaatt cacaagttgt gtttgatatc caaagctgaa tacattctgc    3360
tttcatcttg gtcacataca attattttta cagttctccc aagggagtta ggctattcac    3420
aaccactcat tcaaaagttg aaattaacca tagatgtaga taaactcaga aatttaattc    3480
atgtttctta aatgggctac tttgtccttt ttgttattag ggtggtattt agtctattag    3540
ccacaaaatt gggaaaggag tagaaaaagc agtaactgac aacttgaata atacaccaga    3600
gataatatga gaatcagatc atttcaaaac tcatttccta tgtaactgca ttgagaactg    3660
catatgtttc gctgatatat gtgtttttca catttgcgaa tggttccatt ctctctcctg    3720
tactttttcc agacactttt ttgagtggat gatgtttcgt gaagtatact gtatttttac    3780
ctttttcctt ccttatcact gacacaaaaa gtagattaag agatgggttt gacaaggttc    3840
ttccctttta catactgctg tctatgtggc tgtatcttgt ttttccacta ctgctaccac    3900
aactatatta tcatgcaaat gctgtattct tctttggtgg agataaagat ttcttgagtt    3960
ttgttttaaa attaaagcta aagtatctgt attgcattaa atataatatg cacacagtgc    4020
tttccgtggc actgcataca atctgaggcc tcctctctca gtttttatat agatggcgag    4080
aacctaagtt tcagttgatt ttacaattga aatgactaaa aaacaaagaa gacaacatta    4140
aaacaatatt gtttcta                                                   4157
<210>86
<211>4451
<212>DNA
<213>人
<400>86
gctcatacta gggacgggaa gtcgcgacca gagccattgg agggcgcggg gactgcaacc    60
ctaatcagca gagcccaaat ggcgcagtgg gaaatgctgc agaatcttga cagccccttt    120
caggatcagc tgcaccagct ttactcgcac agcctcctgc ctgtggacat tcgacagtac    180
ttggctgtct ggattgaaga ccagaactgg caggaagctg cacttgggag tgatgattcc    240
aaggctacca tgctattctt ccacttcttg gatcagctga actatgagtg tggccgttgc    300
agccaggacc cagagtcctt gttgctgcag cacaatttgc ggaaattctg ccgggacatt    360
cagccctttt cccaggatcc tacccagttg gctgagatga tctttaacct ccttctggaa    420
gaaaaaagaa ttttgatcca ggctcagagg gcccaattgg aacaaggaga gccagttctc    480
gaaacacctg tggagagcca gcaacatgag attgaatccc ggatcctgga tttaagggct    540
atgatggaga agctggtaaa atccatcagc caactgaaag accagcagga tgtcttctgc    600
ttccgatata agatccaggc caaagggaag acaccctctc tggaccccca tcagaccaaa    660
gagcagaaga ttctgcagga aactctcaat gaactggaca aaaggagaaa ggaggtgctg    720
gatgcctcca aagcactgct aggccgatta actaccctaa tcgagctact gctgccaaag    780
ttggaggagt ggaaggccca gcagcaaaaa gcctgcatca gagctcccat tgaccacggg    840
ttggaacagc tggagacatg gttcacagct ggagcaaagc tgttgtttca cctgaggcag    900
ctgctgaagg agctgaaggg actgagttgc ctggttagct atcaggatga ccctctgacc    960
aaaggggtgg acctacgcaa cgcccaggtc acagagttgc tacagcgtct gctccacaga    1020
gcctttgtgg tagaaaccca gccctgcatg ccccaaactc cccatcgacc cctcatcctc    1080
aagactggca gcaagttcac cgtccgaaca aggctgctgg tgagactcca ggaaggcaat    1140
gagtcactga ctgtggaagt ctccattgac aggaatcctc ctcaattaca aggcttccgg    1200
aagttcaaca ttctgacttc aaaccagaaa actttgaccc ccgagaaggg gcagagtcag    1260
ggtttgattt gggactttgg ttacctgact ctggtggagc aacgttcagg tggttcagga    1320
aagggcagca ataaggggcc actaggtgtg acagaggaac tgcacatcat cagcttcacg    1380
gtcaaatata cctaccaggg tctgaagcag gagctgaaaa cggacaccct ccctgtggtg    1440
attatttcca acatgaacca gctctcaatt gcctgggctt cagttctctg gttcaatttg    1500
ctcagcccaa accttcagaa ccagcagttc ttctccaacc cccccaaggc cccctggagc    1560
ttgctgggcc ctgctctcag ttggcagttc tcctcctatg ttggccgagg cctcaactca    1620
gaccagctga gcatgctgag aaacaagctg ttcgggcaga actgtaggac tgaggatcca    1680
ttattgtcct gggctgactt cactaagcga gagagccctc ctggcaagtt accattctgg    1740
acatggctgg acaaaattct ggagttggta catgaccacc tgaaggatct ctggaatgat    1800
ggacgcatca tgggctttgt gagtcggagc caggagcgcc ggctgctgaa gaagaccatg    1860
tctggcacct ttctactgcg cttcagtgaa tcgtcagaag ggggcattac ctgctcctgg    1920
gtggagcacc aggatgatga caaggtgctc atctactctg tgcaaccgta cacgaaggag    1980
gtgctgcagt cactcccgct gactgaaatc atccgccatt accagttgct cactgaggag    2040
aatatacctg aaaacccact gcgcttcctc tatccccgaa tcccccggga tgaagctttt    2100
gggtgctact accaggagaa agttaatctc caggaacgga ggaaatacct gaaacacagg    2160
ctcattgtgg tctctaatag acaggtggat gaactgcaac aaccgctgga gcttaagcca    2220
gagccagagc tggagtcatt agagctggaa ctagggctgg tgccagagcc agagctcagc    2280
ctggacttag agccactgct gaaggcaggg ctggatctgg ggccagagct agagtctgtg    2340
ctggagtcca ctctggagcc tgtgatagag cccacactat gcatggtatc acaaacagtg    2400
ccagagccag accaaggacc tgtatcacag ccagtgccag agccagattt gccctgtgat    2460
ctgagacatt tgaacactga gccaatggaa atcttcagaa actgtgtaaa gattgaagaa    2520
atcatgccga atggtgaccc actgttggct ggccagaaca ccgtggatga ggtttacgtc    2580
tcccgcccca gccacttcta cactgatgga cccttgatgc cttctgactt ctaggaacca    2640
catttcctct gttcttttca tatctcttgc ccttcctact cctcatagca tgatattgtt    2700
ctccaaggat gggaatcagg catgtgtccc ttccaagctg tgttaactgt tcaaactcag    2760
gcctgtgtga ctccattggg gtgagaggtg aaagcataac atgggtacag aggggacaac    2820
aatgaatcag aacagatgct gagccatagg tctaaatagg atcctggagg ctgcctgctg    2880
tgctgggagg tataggggtc ctgggggcag gccagggcag ttgacaggta cttggagggc    2940
tcagggcagt ggcttctttc cagtatggaa ggatttcaac attttaatag ttggttaggc    3000
taaactggtg catactggca ttggcccttg gtggggagca cagacacagg ataggactcc    3060
atttctttct tccattcctt catgtctagg ataacttgct ttcttctttc ctttactcct    3120
ggctcaagcc ctgaatttct tcttttcctg caggggttga gagctttctg ccttagccta    3180
ccatgtgaaa ctctaccctg aagaaaggga tggataggaa gtagacctct ttttcttacc    3240
agtctcctcc cctactctgc ccctaagctg gctgtacctg ttcctccccc ataaaatgat    3300
cctgccaatc taatgtgagt gtgaagcttt gcacactagt ttatgctacc tagtctccac    3360
tttctcaatg cttaggagac agatcactcc tggaggctgg ggatggtagg attgctgggg    3420
attttttttt ttttaaacag ggtctcactc tgttgcccag gctagagtgc aatggtgcaa    3480
tcacagctca ctgcagcctc aacctcctgg gttcaagcaa tcctcctacc tcagcctcct    3540
gggtagctag caccatggca tgcgccacca tgccctattt ttttttttta aagacagggt    3600
cttgctatat tgcccaggct ggtcttgaac tgggctcaag tgatcctcac gccttggcct    3660
cccaaagtgc tgggattata ggcatgagcc actgtgcttg gccaggattt tttttttttt    3720
ttttttgaga tggagtttct ctcttgttgt ccaggctgga gtgcaatggt gtgatctcgg    3780
ctcactgcaa cctccgcctt ccgggttcaa gtgactctcc tgcctcagcc tccccagtag    3840
ctgggattac agatctgcac caccatgccc agctaatttt gtatttttag tagagacggg    3900
gtttctccat gttggtcagg ctggtctcga actcctgacc tcaagtgatc tgtccacctc    3960
ggcctcccag agtgctggga ttacaggcgt gagccactgt tcccagcagg aatttctttt    4020
ttatagtatt ggataaagtt tggtgttttt acagaggaga agcaatgggt cttagctctt    4080
tctctattat gttatcatcc tccctttttt gtacaatatg ttgtttacct gaaaggaagg    4140
tttctattcg ttggttgtgg acctggacaa agtccaagtc tgtggaactt aaaaccttga    4200
aggtctgtca taggactctg gacaatctca caccttagct attcccaggg aaccccaggg    4260
ggcaactgac attgctccaa gatgttctcc tgatgtagct tgagatataa aggaaaggcc    4320
ctgcacaggt ggctgtttct tgtctgttat gtcagaggaa cagtcctgtt cagaaagggg    4380
ctcttctgag cagaaatggc taataaactt tgtgctgatc tggaaaaaaa aaaaaaaaaa    4440
aaaaaaaaaa a                                                         4451
<210>87
<211>9
<212>PRT
<213>人
<400>87
Gly Ser Glu Asn Leu Tyr Phe Gln Leu
                5
<210>88
<211>27
<212>DNA
<213>人
<400>88
tctagaggcc tgatcatccg gtctcac                                        27
<210>89
<211>29
<212>DNA
<213>人
<400>89
tctagatgga aaacagaagt cccggaaac                                      29
<210>90
<211>2290
<212>DNA
<213>人
<400>90
gaattccgaa tcatgtgcag aatgctgaat cttcccccag ccaggacgaa taagacagcg    60
cggaaaagca gattctcgta attctggaat tgcatgttgc aaggagtctc ctggatcttc    120
gcacccagct tcgggtaggg agggagtccg ggtcccgggc taggccagcc cggcaggtgg    180
agagggtccc cggcagcccc gcgcgcccct ggccatgtct ttaatgccct gccccttcat    240
gtggccttct gagggttccc agggctggcc agggttgttt cccacccgcg cgcgcgctct    300
cacccccagc caaacccacc tggcagggct ccctccagcc gagacctttt gattcccggc    360
tcccgcgctc ccgcctccgc gccagcccgg gaggtggccc tggacagccg gacctcgccc    420
ggccccggct gggaccatgg tgtttctctc gggaaatgct tccgacagct ccaactgcac    480
ccaaccgccg gcaccggtga acatttccaa ggccattctg ctcggggtga tcttgggggg    540
cctcattctt ttcggggtgc tgggtaacat cctagtgatc ctctccgtag cctgtcaccg    600
acacctgcac tcagtcacgc actactacat cgtcaacctg gcggtggccg acctcctgct    660
cacctccacg gtgctgccct tctccgccat cttcgaggtc ctaggctact gggccttcgg    720
cagggtcttc tgcaacatct gggcggcagt ggatgtgctg tgctgcaccg cgtccatcat    780
gggcctctgc atcatctcca tcgaccgcta catcggcgtg agctacccgc tgcgctaccc    840
aaccatcgtc acccagagga ggggtctcat ggctctgctc tgcgtctggg cactctccct    900
ggtcatatcc attggacccc tgttcggctg gaggcagccg gcccccgagg acgagaccat    960
ctgccagatc aacgaggagc cgggctacgt gctcttctca gcgctgggct ccttctacct    1020
gcctctggcc atcatcctgg tcatgtactg ccgcgtctac gtggtggcca agagggagag    1080
ccggggcctc aagtctggcc tcaagaccga caagtcggac tcggagcaag tgacgctccg    1140
catccatcgg aaaaacgccc cggcaggagg cagcgggatg gccagcgcca agaccaagac    1200
gcacttctca gtgaggctcc tcaagttctc ccgggagaag aaagcggcca aaacgctggg    1260
catcgtggtc ggctgcttcg tcctctgctg gctgcctttt ttcttagtca tgcccattgg    1320
gtctttcttc cctgatttca agccctctga aacagttttt aaaatagtat tttggctcgg    1380
atatctaaac agctgcatca accccatcat atacccatgc tccagccaag agttcaaaaa    1440
ggcctttcag aatgtcttga gaatccagtg tctccgcaga aagcagtctt ccaaacatgc    1500
cctgggctac accctgcacc cgcccagcca ggccgtggaa gggcaacaca aggacatggt    1560
gcgcatcccc gtgggatcaa gagagacctt ctacaggatc tccaagacgg atggcgtttg    1620
tgaatggaaa tttttctctt ccatgccccg tggatctgcc aggattacag tgtccaaaga    1680
ccaatcctcc tgtaccacag cccgggtgag aagtaaaagc tttttggagg tctgctgctg    1740
tgtagggccc tcaaccccca gccttgacaa gaaccatcaa gttccaacca ttaaggtcca    1800
caccatctcc ctcagtgaga acggggagga agtctaggac aggaaagatg cagaggaaag    1860
gggaataatc ttaggtaccc accccacttc cttctcggaa ggccagctct tcttggagga    1920
caagacagga ccaatcaaag aggggacctg ctgggaatgg ggtgggtggt agacccaact    1980
catcaggcag cgggtagggc acagggaaga gggagggtgt ctcacaacca accagttcag    2040
aatgatacgg aacagcattt ccctgcagct aatgctttct tggtcactct gtgcccactt    2100
caacgaaaac caccatggga aacagaattt catgcacaat ccaaaagact ataaatatag    2160
gattatgatt tcatcatgaa tattttgagc acacactcta agtttggagc tatttcttga    2220
tggaagtgag gggattttat tttcaggctc aacctactga cagccacatt tgacatttat    2280
gccggaattc                                                           2290
<210>91
<211>26
<212>DNA
<213>人
<400>91
ctcggatatc taaacagctg catcaa                                        26
<210>92
<211>29
<212>DNA
<213>人
<400>92
tctagacttt ctgcagagac actggattc                                     29
<210>93
<211>31
<212>DNA
<213>人
<400>93
tctagatcga aggcagtgga ggatcttcag g                                  31
<210>94
<211>27
<212>DNA
<213>人
<400>94
tctagaggcc tgatcatccg gtctcac                                       27
<210>95
<211>23
<212>DNA
<213>人
<400>95
cggatccgtt ggtactcttg agg                                            23
<210>96
<211>4989
<212>DNA
<213>人
<400>96
tttttttttt ttttgagaaa gggaatttca tcccaaataa aaggaatgaa gtctggctcc    60
ggaggagggt ccccgacctc gctgtggggg ctcctgtttc tctccgccgc gctctcgctc    120
tggccgacga gtggagaaat ctgcgggcca ggcatcgaca tccgcaacga ctatcagcag    180
ctgaagcgcc tggagaactg cacggtgatc gagggctacc tccacatcct gctcatctcc    240
aaggccgagg actaccgcag ctaccgcttc cccaagctca cggtcattac cgagtacttg    300
ctgctgttcc gagtggctgg cctcgagagc ctcggagacc tcttccccaa cctcacggtc    360
atccgcggct ggaaactctt ctacaactac gccctggtca tcttcgagat gaccaatctc    420
aaggatattg ggctttacaa cctgaggaac attactcggg gggccatcag gattgagaaa    480
aatgctgacc tctgttacct ctccactgtg gactggtccc tgatcctgga tgcggtgtcc    540
aataactaca ttgtggggaa taagccccca aaggaatgtg gggacctgtg tccagggacc    600
atggaggaga agccgatgtg tgagaagacc accatcaaca atgagtacaa ctaccgctgc    660
tggaccacaa accgctgcca gaaaatgtgc ccaagcacgt gtgggaagcg ggcgtgcacc    720
gagaacaatg agtgctgcca ccccgagtgc ctgggcagct gcagcgcgcc tgacaacgac    780
acggcctgtg tagcttgccg ccactactac tatgccggtg tctgtgtgcc tgcctgcccg    840
cccaacacct acaggtttga gggctggcgc tgtgtggacc gtgacttctg cgccaacatc    900
ctcagcgccg agagcagcga ctccgagggg tttgtgatcc acgacggcga gtgcatgcag    960
gagtgcccct cgggcttcat ccgcaacggc agccagagca tgtactgcat cccttgtgaa    1020
ggtccttgcc cgaaggtctg tgaggaagaa aagaaaacaa agaccattga ttctgttact    1080
tctgctcaga tgctccaagg atgcaccatc ttcaagggca atttgctcat taacatccga    1140
cgggggaata acattgcttc agagctggag aacttcatgg ggctcatcga ggtggtgacg    1200
ggctacgtga agatccgcca ttctcatgcc ttggtctcct tgtccttcct aaaaaacctt    1260
cgcctcatcc taggagagga gcagctagaa gggaattact ccttctacgt cctcgacaac    1320
cagaacttgc agcaactgtg ggactgggac caccgcaacc tgaccatcaa agcagggaaa    1380
atgtactttg ctttcaatcc caaattatgt gtttccgaaa tttaccgcat ggaggaagtg    1440
acggggacta aagggcgcca aagcaaaggg gacataaaca ccaggaacaa cggggagaga    1500
gcctcctgtg aaagtgacgt cctgcatttc acctccacca ccacgtcgaa gaatcgcatc    1560
atcataacct ggcaccggta ccggccccct gactacaggg atctcatcag cttcaccgtt    1620
tactacaagg aagcaccctt taagaatgtc acagagtatg atgggcagga tgcctgcggc    1680
tccaacagct ggaacatggt ggacgtggac ctcccgccca acaaggacgt ggagcccggc    1740
atcttactac atgggctgaa gccctggact cagtacgccg tttacgtcaa ggctgtgacc    1800
ctcaccatgg tggagaacga ccatatccgt ggggccaaga gtgagatctt gtacattcgc    1860
accaatgctt cagttccttc cattcccttg gacgttcttt cagcatcgaa ctcctcttct    1920
cagttaatcg tgaagtggaa ccctccctct ctgcccaacg gcaacctgag ttactacatt    1980
gtgcgctggc agcggcagcc tcaggacggc tacctttacc ggcacaatta ctgctccaaa    2040
gacaaaatcc ccatcaggaa gtatgccgac ggcaccatcg acattgagga ggtcacagag    2100
aaccccaaga ctgaggtgtg tggtggggag aaagggcctt gctgcgcctg ccccaaaact    2160
gaagccgaga agcaggccga gaaggaggag gctgaatacc gcaaagtctt tgagaatttc    2220
ctgcacaact ccatcttcgt gcccagacct gaaaggaagc ggagagatgt catgcaagtg    2280
gccaacacca ccatgtccag ccgaagcagg aacaccacgg ccgcagacac ctacaacatc    2340
accgacccgg aagagctgga gacagagtac cctttctttg agagcagagt ggataacaag    2400
gagagaactg tcatttctaa ccttcggcct ttcacattgt accgcatcga tatccacagc    2460
tgcaaccacg aggctgagaa gctgggctgc agcgcctcca acttcgtctt tgcaaggact    2520
atgcccgcag aaggagcaga tgacattcct gggccagtga cctgggagcc aaggcctgaa    2580
aactccatct ttttaaagtg gccggaacct gagaatccca atggattgat tctaatgtat    2640
gaaataaaat acggatcaca agttgaggat cagcgagaat gtgtgtccag acaggaatac    2700
aggaagtatg gaggggccaa gctaaaccgg ctaaacccgg ggaactacac agcccggatt    2760
caggccacat ctctctctgg gaatgggtcg tggacagatc ctgtgttctt ctatgtccag    2820
gccaaaacag gatatgaaaa cttcatccat ctgatcatcg ctctgcccgt cgctgtcctg    2880
ttgatcgtgg gagggttggt gattatgctg tacgtcttcc atagaaagag aaataacagc    2940
aggctgggga atggagtgct gtatgcctct gtgaacccgg agtacttcag cgctgctgat    3000
gtgtacgttc ctgatgagtg ggaggtggct cgggagaaga tcaccatgag ccgggaactt    3060
gggcaggggt cgtttgggat ggtctatgaa ggagttgcca agggtgtggt gaaagatgaa    3120
cctgaaacca gagtggccat taaaacagtg aacgaggccg caagcatgcg tgagaggatt    3180
gagtttctca acgaagcttc tgtgatgaag gagttcaatt gtcaccatgt ggtgcgattg    3240
ctgggtgtgg tgtcccaagg ccagccaaca ctggtcatca tggaactgat gacacggggc    3300
gatctcaaaa gttatctccg gtctctgagg ccagaaatgg agaataatcc agtcctagca    3360
cctccaagcc tgagcaagat gattcagatg gccggagaga ttgcagacgg catggcatac    3420
ctcaacgcca ataagttcgt ccacagagac cttgctgccc ggaattgcat ggtagccgaa    3480
gatttcacag tcaaaatcgg agattttggt atgacgcgag atatctatga gacagactat    3540
taccggaaag gaggcaaagg gctgctgccc gtgcgctgga tgtctcctga gtccctcaag    3600
gatggagtct tcaccactta ctcggacgtc tggtccttcg gggtcgtcct ctgggagatc    3660
gccacactgg ccgagcagcc ctaccagggc ttgtccaacg agcaagtcct tcgcttcgtc    3720
atggagggcg gccttctgga caagccagac aactgtcctg acatgctgtt tgaactgatg    3780
cgcatgtgct ggcagtataa ccccaagatg aggccttcct tcctggagat catcagcagc    3840
atcaaagagg agatggagcc tggcttccgg gaggtctcct tctactacag cgaggagaac    3900
aagctgcccg agccggagga gctggacctg gagccagaga acatggagag cgtccccctg    3960
gacccctcgg cctcctcgtc ctccctgcca ctgcccgaca gacactcagg acacaaggcc    4020
gagaacggcc ccggccctgg ggtgctggtc ctccgcgcca gcttcgacga gagacagcct    4080
tacgcccaca tgaacggggg ccgcaagaac gagcgggcct tgccgctgcc ccagtcttcg    4140
acctgctgat ccttggatcc tgaatctgtg caaacagtaa cgtgtgcgca cgcgcagcgg    4200
ggtggggggg gagagagagt tttaacaatc cattcacaag cctcctgtac ctcagtggat    4260
cttcagttct gcccttgctg cccgcgggag acagcttctc tgcagtaaaa cacatttggg    4320
atgttccttt tttcaatatg caagcagctt tttattccct gcccaaaccc ttaactgaca    4380
tgggccttta agaaccttaa tgacaacact taatagcaac agagcacttg agaaccagtc    4440
tcctcactct gtccctgtcc ttccctgttc tccctttctc tctcctctct gcttcataac    4500
ggaaaaataa ttgccacaag tccagctggg aagccctttt tatcagtttg aggaagtggc    4560
tgtccctgtg gccccatcca accactgtac acacccgcct gacaccgtgg gtcattacaa    4620
aaaaacacgt ggagatggaa atttttacct ttatctttca cctttctagg gacatgaaat    4680
ttacaaaggg ccatcgttca tccaaggctg ttaccatttt aacgctgcct aattttgcca    4740
aaatcctgaa ctttctccct catcggcccg gcgctgattc ctcgtgtccg gaggcatggg    4800
tgagcatggc agctggttgc tccatttgag agacacgctg gcgacacact ccgtccatcc    4860
gactgcccct gctgtgctgc tcaaggccac aggcacacag gtctcattgc ttctgactag    4920
attattattt gggggaactg gacacaatag gtctttctct cagtgaaggt ggggagaagc    4980
tgaaccggc                                                            4989
<210>97
<211>3076
<212>DNA
<213>人
<400>97
gtttctccag ggaggcaggg cccggggaga aagttggagc ggtaacctaa gctggcagtg    60
gcgtgatccg gcaccaaatc ggcccgcggt gcggtgcgga gactccatga ggccctggac    120
atgaacaagc tgagtggagg cggcgggcgc aggactcggg tggaaggggg ccagcttggg    180
ggcgaggagt ggacccgcca cgggagcttt gtcaataagc ccacgcgggg ctggctgcat    240
cccaacgaca aagtcatggg acccggggtt tcctacttgg ttcggtacat gggttgtgtg    300
gaggtcctcc agtcaatgcg tgccctggac ttcaacaccc ggactcaggt caccagggag    360
gccatcagtc tggtgtgtga ggctgtgccg ggtgctaagg gggcgacaag gaggagaaag    420
ccctgtagcc gcccgctcag ctctatcctg gggaggagta acctgaaatt tgctggaatg    480
ccaatcactc tcaccgtctc caccagcagc ctcaacctca tggccgcaga ctgcaaacag    540
atcatcgcca accaccacat gcaatctatc tcatttgcat ccggcgggga tccggacaca    600
gccgagtatg tcgcctatgt tgccaaagac cctgtgaatc agagagcctg ccacattctg    660
gagtgtcccg aagggcttgc ccaggatgtc atcagcacca ttggccaggc cttcgagttg    720
cgcttcaaac aatacctcag gaacccaccc aaactggtca cccctcatga caggatggct    780
ggctttgatg gctcagcatg ggatgaggag gaggaagagc cacctgacca tcagtactat    840
aatgacttcc cggggaagga accccccttg gggggggtgg tagacatgag gcttcgggaa    900
ggagccgctc caggggctgc tcgacccact gcacccaatg cccagacccc cagccacttg    960
ggagctacat tgcctgtagg acagcctgtt gggggagatc cagaagtccg caaacagatg    1020
ccacctccac caccctgtcc agcaggcaga gagctttttg atgatccctc ctatgtcaac    1080
gtccagaacc tagacaaggc ccggcaagca gtgggtggtg ctgggccccc caatcctgct    1140
atcaatggca gtgcaccccg ggacctgttt gacatgaagc ccttcgaaga tgctcttcgc    1200
gtgcctccac ctccccagtc ggtgtccatg gctgagcagc tccgagggga gccctggttc    1260
catgggaagc tgagccggcg ggaggctgag gcactgctgc agctcaatgg ggacttcctg    1320
gtacgggaga gcacgaccac acctggccag tatgtgctca ctggcttgca gagtgggcag    1380
cctaagcatt tgctactggt ggaccctgag ggtgtggttc ggactaagga tcaccgcttt    1440
gaaagtgtca gtcaccttat cagctaccac atggacaatc acttgcccat catctctgcg    1500
ggcagcgaac tgtgtctaca gcaacctgtg gagcggaaac tgtgatctgc cctagcgctc    1560
tcttccagaa gatgccctcc aatcctttcc accctattcc ctaactctcg ggacctcgtt    1620
tgggagtgtt ctgtgggctt ggccttgtgt cagagctggg agtagcatgg actctgggtt    1680
tcatatccag ctgagtgaga gggtttgagt caaaagcctg ggtgagaatc ctgcctctcc    1740
ccaaacatta atcaccaaag tattaatgta cagagtggcc cctcacctgg gcctttcctg    1800
tgccaacctg atgccccttc cccaagaagg tgagtgcttg tcatggaaaa tgtcctgtgg    1860
tgacaggccc agtggaacag tcacccttct gggcaagggg gaacaaatca cacctctggg    1920
cttcagggta tcccagaccc ctctcaacac ccgccccccc catgtttaaa ctttgtgcct    1980
ttgaccatct cttaggtcta atgatatttt atgcaaacag ttcttggacc cctgaattca    2040
atgacaggga tgccaacacc ttcttggctt ctgggacctg tgttcttgct gagcaccctc    2100
tccggtttgg gttgggataa cagaggcagg agtggcagct gtcccctctc cctggggata    2160
tgcaaccctt agagattgcc ccagagcccc actcccggcc aggcgggaga tggacccctc    2220
ccttgctcag tgcctcctgg ccggggcccc tcaccccaag gggtctgtat atacatttca    2280
taaggcctgc cctcccatgt tgcatgccta tgtactctac gccaaagtgc agcccttcct    2340
cctgaagcct ctgccctgcc tccctttctg ggagggcggg gtgggggtga ctgaatttgg    2400
gcctcttgta cagttaactc tcccaggtgg attttgtgga ggtgagaaaa ggggcattga    2460
gactataaag cagtagacaa tccccacata ccatctgtag agttggaact gcattctttt    2520
aaagttttat atgcatatat tttagggctg tagacttact ttcctatttt cttttccatt    2580
gcttattctt gagcacaaaa tgataatcaa ttattacatt tatacatcac ctttttgact    2640
tttccaagcc cttttacagc tcttggcatt ttcctcgcct aggcctgtga ggtaactggg    2700
atcgcacctt ttataccaga gacctgaggc agatgaaatt tatttccatc taggactaga    2760
aaaacttggg tctcttaccg cgagactgag aggcagaagt cagcccgaat gcctgtcagt    2820
ttcatggagg ggaaacgcaa aacctgcagt tcctgagtac cttctacagg cccggcccag    2880
cctaggcccg gggtggccac accacagcaa gccggccccc cctcttttgg ccttgtggat    2940
aagggagagt tgaccgtttt catcctggcc tccttttgct gtttggatgt ttccacgggt    3000
ctcacttata ccaaagggaa aactcttcat taaagtccgt atttcttcta aaaaaaaaaa    3060
aaaaaaaaaa aaaaaa                                                    3076
<210>98
<211>4
<212>PRT
<213>人
<400>98
Asn Ser Gly Ser
1
<210>99
<211>2261
<212>DNA
<213>人
<400>99
gaaatcaggc tccgggccgg ccgaagggcg caactttccc ccctcggcgc  cccaccggct    60
cccgcgcgcc tcccctcgcg cccgagcttc gagccaagca gcgtcctggg gagcgcgtca    120
tggccttacc agtgaccgcc ttgctcctgc cgctggcctt gctgctccac gccgccaggc    180
cgagccagtt ccgggtgtcg ccgctggatc ggacctggaa cctgggcgag acagtggagc    240
tgaagtgcca ggtgctgctg tccaacccga cgtcgggctg ctcgtggctc ttccagccgc    300
gcggcgccgc cgccagtccc accttcctcc tatacctctc ccaaaacaag cccaaggcgg    360
ccgaggggct ggacacccag cggttctcgg gcaagaggtt gggggacacc ttcgtcctca    420
ccctgagcga cttccgccga gagaacgagg gctactattt ctgctcggcc ctgagcaact    480
ccatcatgta cttcagccac ttcgtgccgg tcttcctgcc agcgaagccc accacgacgc    540
cagcgccgcg accaccaaca ccggcgccca ccatcgcgtc gcagcccctg tccctgcgcc    600
cagaggcgtg ccggccagcg gcggggggcg cagtgcacac gagggggctg gacttcgcct    660
gtgatatcta catctgggcg cccttggccg ggacttgtgg ggtccttctc ctgtcactgg    720
ttatcaccct ttactgcaac cacaggaacc gaagacgtgt ttgcaaatgt ccccggcctg    780
tggtcaaatc gggagacaag cccagccttt cggcgagata cgtctaaccc tgtgcaacag    840
ccactacatt acttcaaact gagatccttc cttttgaggg agcaagtcct tccctttcat    900
tttttccagt cttcctccct gtgtattcat tctcatgatt attattttag tgggggcggg    960
gtgggaaaga ttactttttc tttatgtgtt tgacgggaaa caaaactagg taaaatctac    1020
agtacaccac aagggtcaca atactgttgt gcgcacatcg cggtagggcg tggaaagggg    1080
caggccagag ctacccgcag agttctcaga atcatgctga gagagctgga ggcacccatg    1140
ccatctcaac ctcttccccg cccgttttac aaagggggag gctaaagccc agagacagct    1200
tgatcaaagg cacacagcaa gtcagggttg gagcagtagc tggagggacc ttgtctccca    1260
gctcagggct ctttcctcca caccattcag gtctttcttt ccgaggcccc tgtctcaggg    1320
tgaggtgctt gagtctccaa cggcaaggga acaagtactt cttgatacct gggatactgt    1380
gcccagagcc tcgaggaggt aatgaattaa agaagagaac tgcctttggc agagttctat    1440
aatgtaaaca atatcagact tttttttttt ataatcaagc ctaaaattgt atagacctaa    1500
aataaaatga agtggtgagc ttaaccctgg aaaatgaatc cctctatctc taaagaaaat    1560
ctctgtgaaa cccctatgtg gaggcggaat tgctctccca gcccttgcat tgcagagggg    1620
cccatgaaag aggacaggct acccctttac aaatagaatt tgagcatcag tgaggttaaa    1680
ctaaggccct cttgaatctc tgaatttgag atacaaacat gttcctggga tcactgatga    1740
ctttttatac tttgtaaaga caattgttgg agagcccctc acacagccct ggcctctgct    1800
caactagcag atacagggat gaggcagacc tgactctctt aaggaggctg agagcccaaa    1860
ctgctgtccc aaacatgcac ttccttgctt aaggtatggt acaagcaatg cctgcccatt    1920
ggagagaaaa aacttaagta gataaggaaa taagaaccac tcataattct tcaccttagg    1980
aataatctcc tgttaatatg gtgtacattc ttcctgatta ttttctacac atacatgtaa    2040
aatatgtctt tcttttttaa atagggttgt actatgctgt tatgagtggc tttaatgaat    2100
aaacatttgt agcatcctct ttaatgggta aacagcaaaa aaaaaaaaaa aaaaaaaaaa    2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa    2220
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a                        2261
<210>100
<211>6450
<212>DNA
<213>人
<400>100
gagttgtgcc tggagtgatg tttaagccaa tgtcagggca aggcaacagt ccctggccgt    60
cctccagcac ctttgtaatg catatgagct cgggagacca gtacttaaag ttggaggccc    120
gggagcccag gagctggcgg agggcgttcg tcctgggagc tgcacttgct ccgtcgggtc    180
gccggcttca ccggaccgca ggctcccggg gcagggccgg ggccagagct cgcgtgtcgg    240
cgggacatgc gctgcgtcgc ctctaacctc gggctgtgct ctttttccag gtggcccgcc    300
ggtttctgag ccttctgccc tgcggggaca cggtctgcac cctgcccgcg gccacggacc    360
atgaccatga ccctccacac caaagcatct gggatggccc tactgcatca gatccaaggg    420
aacgagctgg agcccctgaa ccgtccgcag ctcaagatcc ccctggagcg gcccctgggc    480
gaggtgtacc tggacagcag caagcccgcc gtgtacaact accccgaggg cgccgcctac    540
gagttcaacg ccgcggccgc cgccaacgcg caggtctacg gtcagaccgg cctcccctac    600
ggccccgggt ctgaggctgc ggcgttcggc tccaacggcc tggggggttt ccccccactc    660
aacagcgtgt ctccgagccc gctgatgcta ctgcacccgc cgccgcagct gtcgcctttc    720
ctgcagcccc acggccagca ggtgccctac tacctggaga acgagcccag cggctacacg    780
gtgcgcgagg ccggcccgcc ggcattctac aggccaaatt cagataatcg acgccagggt    840
ggcagagaaa gattggccag taccaatgac aagggaagta tggctatgga atctgccaag    900
gagactcgct actgtgcagt gtgcaatgac tatgcttcag gctaccatta tggagtctgg    960
tcctgtgagg gctgcaaggc cttcttcaag agaagtattc aaggacataa cgactatatg    1020
tgtccagcca ccaaccagtg caccattgat aaaaacagga ggaagagctg ccaggcctgc    1080
cggctccgca aatgctacga agtgggaatg atgaaaggtg ggatacgaaa agaccgaaga    1140
ggagggagaa tgttgaaaca caagcgccag agagatgatg gggagggcag gggtgaagtg    1200
gggtctgctg gagacatgag agctgccaac ctttggccaa gcccgctcat gatcaaacgc    1260
tctaagaaga acagcctggc cttgtccctg acggccgacc agatggtcag tgccttgttg    1320
gatgctgagc cccccatact ctattccgag tatgatccta ccagaccctt cagtgaagct    1380
tcgatgatgg gcttactgac caacctggca gacagggagc tggttcacat gatcaactgg    1440
gcgaagaggg tgccaggctt tgtggatttg accctccatg atcaggtcca ccttctagaa    1500
tgtgcctggc tagagatcct gatgattggt ctcgtctggc gctccatgga gcacccagtg    1560
aagctactgt ttgctcctaa cttgctcttg gacaggaacc agggaaaatg tgtagagggc    1620
atggtggaga tcttcgacat gctgctggct acatcatctc ggttccgcat gatgaatctg    1680
cagggagagg agtttgtgtg cctcaaatct attattttgc ttaattctgg agtgtacaca    1740
tttctgtcca gcaccctgaa gtctctggaa gagaaggacc atatccaccg agtcctggac    1800
aagatcacag acactttgat ccacctgatg gccaaggcag gcctgaccct gcagcagcag    1860
caccagcggc tggcccagct cctcctcatc ctctcccaca tcaggcacat gagtaacaaa    1920
ggcatggagc atctgtacag catgaagtgc aagaacgtgg tgcccctcta tgacctgctg    1980
ctggagatgc tggacgccca ccgcctacat gcgcccacta gccgtggagg ggcatccgtg    2040
gaggagacgg accaaagcca cttggccact gcgggctcta cttcatcgca ttccttgcaa    2100
aagtattaca tcacggggga ggcagagggt ttccctgcca cagtctgaga gctccctggc    2160
tcccacacgg ttcagataat ccctgctgca ttttaccctc atcatgcacc actttagcca    2220
aattctgtct cctgcataca ctccggcatg catccaacac caatggcttt ctagatgagt    2280
ggccattcat ttgcttgctc agttcttagt ggcacatctt ctgtcttctg ttgggaacag    2340
ccaaagggat tccaaggcta aatctttgta acagctctct ttcccccttg ctatgttact    2400
aagcgtgagg attcccgtag ctcttcacag ctgaactcag tctatgggtt ggggctcaga    2460
taactctgtg catttaagct acttgtagag acccaggcct ggagagtaga cattttgcct    2520
ctgataagca ctttttaaat ggctctaaga ataagccaca gcaaagaatt taaagtggct    2580
cctttaattg gtgacttgga gaaagctagg tcaagggttt attatagcac cctcttgtat    2640
tcctatggca atgcatcctt ttatgaaagt ggtacacctt aaagctttta tatgactgta    2700
gcagagtatc tggtgattgt caattcactt ccccctatag gaatacaagg ggccacacag    2760
ggaaggcaga tcccctagtt ggccaagact tattttaact tgatacactg cagattcaga    2820
gtgtcctgaa gctctgcctc tggctttccg gtcatgggtt ccagttaatt catgcctccc    2880
atggacctat ggagagcaac aagttgatct tagttaagtc tccctatatg agggataagt    2940
tcctgatttt tgtttttatt tttgtgttac aaaagaaagc cctccctccc tgaacttgca    3000
gtaaggtcag cttcaggacc tgttccagtg ggcactgtac ttggatcttc ccggcgtgtg    3060
tgtgccttac acaggggtga actgttcact gtggtgatgc atgatgaggg taaatggtag    3120
ttgaaaggag caggggccct ggtgttgcat ttagccctgg ggcatggagc tgaacagtac    3180
ttgtgcagga ttgttgtggc tactagagaa caagagggaa agtagggcag aaactggata    3240
cagttctgag cacagccaga cttgctcagg tggccctgca caggctgcag ctacctagga    3300
acattccttg cagaccccgc attgcctttg ggggtgccct gggatccctg gggtagtcca    3360
gctcttattc atttcccagc gtggccctgg ttggaagaag cagctgtcaa gttgtagaca    3420
gctgtgttcc tacaattggc ccagcaccct ggggcacggg agaagggtgg ggaccgttgc    3480
tgtcactact caggctgact ggggcctggt cagattacgt atgcccttgg tggtttagag    3540
ataatccaaa atcagggttt ggtttgggga agaaaatcct cccccttcct cccccgcccc    3600
gttccctacc gcctccactc ctgccagctc atttccttca atttcctttg acctataggc    3660
taaaaaagaa aggctcattc cagccacagg gcagccttcc ctgggccttt gcttctctag    3720
cacaattatg ggttacttcc tttttcttaa caaaaaagaa tgtttgattt cctctgggtg    3780
accttattgt ctgtaattga aaccctattg agaggtgatg tctgtgttag ccaatgaccc    3840
aggtagctgc tcgggcttct cttggtatgt cttgtttgga aaagtggatt tcattcattt    3900
ctgattgtcc agttaagtga tcaccaaagg actgagaatc tgggagggca aaaaaaaaaa    3960
aaaaagtttt tatgtgcact taaatttggg gacaatttta tgtatctgtg ttaaggatat    4020
gcttaagaac ataattcttt tgttgctgtt tgtttaagaa gcaccttagt ttgtttaaga    4080
agcaccttat atagtataat atatattttt ttgaaattac attgcttgtt tatcagacaa    4140
ttgaatgtag taattctgtt ctggatttaa tttgactggg ttaacatgca aaaaccaagg    4200
aaaaatattt agtttttttt tttttttttg tatacttttc aagctacctt gtcatgtata    4260
cagtcattta tgcctaaagc ctggtgatta ttcatttaaa tgaagatcac atttcatatc    4320
aacttttgta tccacagtag acaaaatagc actaatccag atgcctattg ttggatattg    4380
aatgacagac aatcttatgt agcaaagatt atgcctgaaa aggaaaatta ttcagggcag    4440
ctaattttgc ttttaccaaa atatcagtag taatattttt ggacagtagc taatgggtca    4500
gtgggttctt tttaatgttt atacttagat tttcttttaa aaaaattaaa ataaaacaaa    4560
aaaaatttct aggactagac gatgtaatac cagctaaagc caaacaatta tacagtggaa    4620
ggttttacat tattcatcca atgtgtttct attcatgtta agatactact acatttgaag    4680
tgggcagaga acatcagatg attgaaatgt tcgcccaggg gtctccagca actttggaaa    4740
tctctttgta tttttacttg aagtgccact aatggacagc agatattttc tggctgatgt    4800
tggtattggg tgtaggaaca tgatttaaaa aaaaaactct tgcctctgct ttcccccact    4860
ctgaggcaag ttaaaatgta aaagatgtga tttatctggg gggctcaggt atggtgggga    4920
agtggattca ggaatctggg gaatggcaaa tatattaaga agagtattga aagtatttgg    4980
aggaaaatgg ttaattctgg gtgtgcacca aggttcagta gagtccactt ctgccctgga    5040
gaccacaaat caactagctc catttacagc catttctaaa atggcagctt cagttctaga    5100
gaagaaagaa caacatcagc agtaaagtcc atggaatagc tagtggtctg tgtttctttt    5160
cgccattgcc tagcttgccg taatgattct ataatgccat catgcagcaa ttatgagagg    5220
ctaggtcatc caaagagaag accctatcaa tgtaggttgc aaaatctaac ccctaaggaa    5280
gtgcagtctt tgatttgatt tccctagtaa ccttgcagat atgtttaacc aagccatagc    5340
ccatgccttt tgagggctga acaaataagg gacttactga taatttactt ttgatcacat    5400
taaggtgttc tcaccttgaa atcttataca ctgaaatggc cattgattta ggccactggc    5460
ttagagtact ccttcccctg catgacactg attacaaata ctttcctatt catactttcc    5520
aattatgaga tggactgtgg gtactgggag tgatcactaa caccatagta atgtctaata    5580
ttcacaggca gatctgcttg gggaagctag ttatgtgaaa ggcaaataaa gtcatacagt    5640
agctcaaaag gcaaccataa ttctctttgg tgcaagtctt gggagcgtga tctagattac    5700
actgcaccat tcccaagtta atcccctgaa aacttactct caactggagc aaatgaactt    5760
tggtcccaaa tatccatctt ttcagtagcg ttaattatgc tctgtttcca actgcatttc    5820
ctttccaatt gaattaaagt gtggcctcgt ttttagtcat ttaaaattgt tttctaagta    5880
attgctgcct ctattatggc acttcaattt tgcactgtct tttgagattc aagaaaaatt    5940
tctattcatt tttttgcatc caattgtgcc tgaactttta aaatatgtaa atgctgccat    6000
gttccaaacc catcgtcagt gtgtgtgttt agagctgtgc accctagaaa caacatactt    6060
gtcccatgag caggtgcctg agacacagac ccctttgcat tcacagagag gtcattggtt    6120
atagagactt gaattaataa gtgacattat gccagtttct gttctctcac aggtgataaa    6180
caatgctttt tgtgcactac atactcttca gtgtagagct cttgttttat gggaaaaggc    6240
tcaaatgcca aattgtgttt gatggattaa tatgcccttt tgccgatgca tactattact    6300
gatgtgactc ggttttgtcg cagctttgct ttgtttaatg aaacacactt gtaaacctct    6360
tttgcacttt gaaaaagaat ccagcgggat gctcgagcac ctgtaaacaa ttttctcaac    6420
ctatttgatg ttcaaataaa gaattaaact                                     6450
<210>101
<211>2011
<212>DNA
<213>人
<400>101
tttcagtttc tccagctgct ggctttttgg acacccactc ccccgccagg aggcagttgc    60
aagcgcggag gctgcgagaa ataactgcct cttgaaactt gcagggcgaa gagcaggcgg    120
cgagcgctgg gccggggagg gaccacccga gctgcgacgg gctctggggc tgcggggcag    180
ggctggcgcc cggagcctga gctgcaggag gtgcgctcgc tttcctcaac aggtggcggc    240
ggggcgcgcg ccgggagacc ccccctaatg cgggaaaagc acgtgtccgc attttagaga    300
aggcaaggcc ggtgtgttta tctgcaagcc attatacttg cccacgaatc tttgagaaca    360
ttataatgac ctttgtgcct cttcttgcaa ggtgttttct cagctgttat ctcaagacat    420
ggatataaaa aactcaccat ctagccttaa ttctccttcc tcctacaact gcagtcaatc    480
catcttaccc ctggagcacg gctccatata cataccttcc tcctatgtag acagccacca    540
tgaatatcca gccatgacat tctatagccc tgctgtgatg aattacagca ttcccagcaa    600
tgtcactaac ttggaaggtg ggcctggtcg gcagaccaca agcccaaatg tgttgtggcc    660
aacacctggg cacctttctc ctttagtggt ccatcgccag ttatcacatc tgtatgcgga    720
acctcaaaag agtccctggt gtgaagcaag atcgctagaa cacaccttac ctgtaaacag    780
agagacactg aaaaggaagg ttagtgggaa ccgttgcgcc agccctgtta ctggtccagg    840
ttcaaagagg gatgctcact tctgcgctgt ctgcagcgat tacgcatcgg gatatcacta    900
tggagtctgg tcgtgtgaag gatgtaaggc cttttttaaa agaagcattc aaggacataa    960
tgattatatt tgtccagcta caaatcagtg tacaatcgat aaaaaccggc gcaagagctg    1020
ccaggcctgc cgacttcgga agtgttacga agtgggaatg gtgaagtgtg gctcccggag    1080
agagagatgt gggtaccgcc ttgtgcggag acagagaagt gccgacgagc agctgcactg    1140
tgccggcaag gccaagagaa gtggcggcca cgcgccccga gtgcgggagc tgctgctgga    1200
cgccctgagc cccgagcagc tagtgctcac cctcctggag gctgagccgc cccatgtgct    1260
gatcagccgc cccagtgcgc ccttcaccga ggcctccatg atgatgtccc tgaccaagtt    1320
ggccgacaag gagttggtac acatgatcag ctgggccaag aagattcccg gctttgtgga    1380
gctcagcctg ttcgaccaag tgcggctctt ggagagctgt tggatggagg tgttaatgat    1440
ggggctgatg tggcgctcaa ttgaccaccc cggcaagctc atctttgctc cagatcttgt    1500
tctggacagg gatgagggga aatgcgtaga aggaattctg gaaatctttg acatgctcct    1560
ggcaactact tcaaggtttc gagagttaaa actccaacac aaagaatatc tctgtgtcaa    1620
ggccatgatc ctgctcaatt ccagtatgta ccctctggtc acagcgaccc aggatgctga    1680
cagcagccgg aagctggctc acttgctgaa cgccgtgacc gatgctttgg tttgggtgat    1740
tgccaagagc ggcatctcct cccagcagca atccatgcgc ctggctaacc tcctgatgct    1800
cctgtcccac gtcaggcatg cgagtaacaa gggcatggaa catctgctca acatgaagtg    1860
caaaaatgtg gtcccagtgt atgacctgct gctggagatg ctgaatgccc acgtgcttcg    1920
cgggtgcaag tcctccatca cggggtccga gtgcagcccg gcagaggaca gtaaaagcaa    1980
agagggctcc cagaacccac agtctcagtg a                                   2011

Claims (76)

1.一种用于确定是否一种检测化合物调节第一检测蛋白和第二检测蛋白间相互作用的方法,其包含使所述检测化合物与采用如下物质转染或转化的细胞接触:
(a)包括下述物质的核酸分子:
(i)编码所述第一检测蛋白的核苷酸序列,其中所述第一检测蛋白是跨膜受体,
(ii)编码细胞并不内源表达的蛋白酶或蛋白酶片段识别的剪切位点的核苷酸序列,
(iii)编码在所述细胞中激活报道基因的蛋白的核苷酸序列,和
(b)包括下述物质的核酸分子:
(i)编码在要检测的所述检测化合物存在下与所述第一检测蛋白相互作用的所述第二检测蛋白的核苷酸序列,
(ii)编码对于所述剪切位点特异的所述蛋白酶或所述蛋白酶片段的核苷酸序列,
并确定所述报道基因的活性从而确定是否所述检测化合物调节所述蛋白/蛋白相互作用。
2.根据权利要求1的方法,其中所述跨膜受体是胰岛素样生长因子受体IGFR、表皮生长因子受体EGFR或干扰素受体。
3.根据权利要求1的方法,其中所述跨膜受体包括雌激素受体1ESR1或雌激素受体2ESR2。
4.根据权利要求1的方法,其中所述跨膜受体是GPCR。
5.根据权利要求1的方法,其中所述蛋白酶或蛋白酶片段是烟草蚀纹病毒核内包涵体A蛋白酶。
6.根据权利要求1的方法,其中激活所述报道基因的所述蛋白是转录因子。
7.根据权利要求6的方法,其中所述转录因子是tTA或GAL4。
8.根据权利要求1的方法,其中所述第二蛋白是抑制性蛋白。
9.根据权利要求8的方法,其中所述抑制性蛋白是抑制蛋白。
10.根据权利要求1的方法,其中所述细胞是真核细胞。
11.根据权利要求1的方法,其中所述报道基因是外源基因。
12.根据权利要求11的方法,其中所述外源基因编码β-半乳糖苷酶或荧光素酶。
13.根据权利要求1的方法,其中编码所述第一检测蛋白的核苷酸序列被修饰以提高与所述第二检测蛋白的相互作用。
14.根据权利要求13的方法,其中所述修饰包含采用编码相比于原始序列与所述第二检测蛋白具有更高亲和性的氨基酸序列的核苷酸序列替换所述第一检测蛋白C-末端区域的全部或部分核苷酸序列。
15.根据权利要求14的方法,其中所述C-末端区域的核苷酸序列被编码AVPR2,AGTRLI,GRPR,F2PL1,CXCR2/IL-8B,CCR4或GRPR的C-末端区域的全部或部分的核苷酸序列所替换。
16.根据权利要求1的方法,包含使多于一种化合物与多个细胞样本接触,所述样本中的每个与一个或更多所述化合物接触,其中所述细胞样本中的每个采用(a)和(b)进行转染或转化,并且在所述多个所述样本中确定报道基因的活性,从而确定是否任何所述化合物调节所述第一检测蛋白和所述第二检测蛋白间的所述相互作用。
17.根据权利要求4的方法,其中所述跨膜蛋白是β2-肾上腺素受体ADRB2,精氨酸血管加压素受体2AVPR2,血清素受体la HTR1A,m2毒蕈碱性乙酰胆碱受体CHRM2,趋化因子(C-C模序)受体5CCR5,多巴胺D2受体DRD2,卡巴阿片样物质受体OPRK或ala-肾上腺素受体ADRA1A。
18.根据权利要求16的方法,包含使所述样本的每个与一种化合物接触,其中的每种与其他不相同。
19.根据权利要求16的方法,包含使所述样本的每个与所述化合物的混合物接触。
20.一种用于确定是否一种检测化合物调节感兴趣的多个蛋白的一个或多个的相互作用的方法,包含使所述检测化合物与多个细胞样本接触,每种细胞样本已经被如下物质转染或转化:
(a)第一核酸分子,包含:
(i)编码第一检测蛋白的核苷酸序列,其中所述第一检测蛋白是跨膜受体,
(ii)编码细胞并不内源表达的蛋白酶或蛋白酶片段识别的剪切位点的核苷酸序列,
(iii)编码在所述细胞中激活报道基因的蛋白的核苷酸序列,和
(b)第二核酸分子,包含:
(i)编码在要检测的所述检测化合物存在下与所述第一检测蛋白相互作用的第二检测蛋白的核苷酸序列,
(ii)编码对所述剪切位点特异的所述蛋白酶或所述蛋白酶片段的核苷酸序列,
其中在所述多个样本的每个中,所述第一检测蛋白不同于其他的第一检测蛋白,
并且在一个或多个所述多个样本中确定所述报道基因的活性从而确定感兴趣的一个或多个蛋白相互作用的调节。
21.根据权利要求20的方法,其中所述第二检测蛋白在每个样本中是不同的。
22.根据权利要求20的方法,其中所述第二检测蛋白在每个样本中是相同的。
23.根据权利要求20的方法,其中所有的所述样本放置于一个普通容器中,每个样本包含一个不同的第一和第二检测蛋白对。
24.根据权利要求20的方法,其中每个样本在不同的容器中进行检测。
25.根据权利要求20的方法,其中在给定样本中的报道基因不同于其他样本中的报道基因。
26.根据权利要求19的方法,其中所述化合物的混合物包含生物学样本。
27.根据权利要求26的方法,其中所述生物学样本为脑脊液,尿液,血液,血清,脓液,腹水,滑液,组织提取物或分泌物。
28.包含报道基因和下述物质的重组细胞:
(a)第一核酸分子,其编码第一融合蛋白,所述第一核酸分子包含:
(i)编码第一检测蛋白的核苷酸序列,其中所述第一检测蛋白是跨膜受体,
(ii)编码所述细胞并不内源表达的蛋白酶或蛋白酶片段识别的蛋白剪切位点的核苷酸序列,
(iii)编码在所述细胞中能激活所述报道基因的蛋白的核苷酸序列,和
(b)第二核酸分子,其编码第二融合蛋白,所述第二核酸分子包含:
(i)编码在要检测的检测化合物存在下与所述第一检测蛋白相互作用的第二检测蛋白的核苷酸序列,
(ii)编码能特异性蛋白水解剪切所述剪切位点的所述蛋白酶或所述蛋白酶片段的核苷酸序列。
29.根据权利要求28中的重组细胞,其中所述核酸分子中的一个或两个被稳定整合到所述细胞的基因组中。
30.根据权利要求28中的重组细胞,其中所述细胞被所述报道基因转染或转化。
31.根据权利要求28中的重组细胞,其中所述跨膜受体是胰岛素样生长因子受体IGFR、表皮生长因子受体EGFR或干扰素受体。
32.根据权利要求28中的重组细胞,其中所述跨膜受体包括雌激素受体1ESR1或雌激素受体2ESR2。
33.根据权利要求28中的重组细胞,其中所述跨膜受体是GPCR。
34.根据权利要求28中的重组细胞,其中所述蛋白酶或蛋白酶片段是烟草蚀纹病毒核内包涵体A蛋白酶。
35.根据权利要求28中的重组细胞,其中所述激活所述报道基因的蛋白是转录因子。
36.根据权利要求33中的重组细胞,其中所述跨膜受体是ADBR2,AVPR2,HTR1A,CHRM2,CCR5,DRD2,OPRK或ADRA1A。
37.根据权利要求28中的重组细胞,其中所述转录因子是tTA或GAL4。
38.根据权利要求28中的重组细胞,其中所述第二蛋白是抑制性蛋白。
39.根据权利要求38中的重组细胞,其中所述抑制性蛋白是抑制蛋白。
40.根据权利要求28中的重组细胞,其中所述细胞是真核细胞。
41.根据权利要求28中的重组细胞,其中所述细胞是原核细胞。
42.根据权利要求28中的重组细胞,其中所述报道基因是外源基因。
43.根据权利要求42中的重组细胞,其中所述外源基因编码β-半乳糖苷酶或荧光素酶.
44.根据权利要求28中的重组细胞,其中编码所述第一检测蛋白的核苷酸序列被修饰以提高与所述第二检测蛋白的相互作用。
45.根据权利要求44中的重组细胞,其中所述修饰包含采用一种编码相比于原始序列与所述第二检测蛋白具有更高亲和性的氨基酸序列的核苷酸序列替换所述第一检测蛋白C-末端区域的全部或部分核苷酸序列。
46.根据权利要求44中的重组细胞,其中所述C-末端区域的核苷酸序列被编码AVPR2,AGTRLI,GRPR,F2PL1,CXCR2/IL-8B或CCR4的C-末端区域的核苷酸序列所替换。
47.一种分离的核酸分子,其编码融合蛋白,所述核酸分子包含,从5′至3′顺序,
(i)编码在要检测的检测化合物存在下与另一种检测蛋白相互作用的检测蛋白的核苷酸序列,其中所述检测蛋白是跨膜受体,
(ii)编码蛋白酶或蛋白酶片段识别的剪切位点的核苷酸序列,
(iii)编码激活报道基因的蛋白的核苷酸序列。
48.根据权利要求47的分离的核酸分子,其中所述跨膜受体是胰岛素样生长因子受体IGFR、表皮生长因子受体EGFR或干扰素受体。
49.根据权利要求47的分离的核酸分子,其中所述跨膜受体包括雌激素受体1ESR1或雌激素受体2ESR2。
50.根据权利要求47的分离的核酸分子,其中所述跨膜受体是GPCR。
51.根据权利要求47的分离的核酸分子,其中所述蛋白酶或蛋白酶片段是烟草蚀纹病毒核内包涵体A蛋白酶。
52.根据权利要求47的分离的核酸分子,其中所述激活所述报道基因的蛋白是转录因子。
53.根据权利要求52的分离的核酸分子,其中所述转录因子是tTA或GAL4。
54.根据权利要求48的分离的核酸分子,其中所述跨膜受体是ADBR2,AVPR2,HTR1A,CHRM2,CCR5,DRD2,OPRK或ADRA1A。
55.包含权利要求47的分离的核酸分子的表达载体,可操作的连接到启动子。
56.一种分离的核酸分子,其编码融合蛋白,所述核酸分子包含:
(i)编码在要检测的检测化合物存在下与第二检测蛋白相互作用的第一检测蛋白的核苷酸序列,其中所述第二检测蛋白包括跨膜受体,
(ii)编码对包含在所述第二检测蛋白中的剪切位点特异的蛋白酶或蛋白酶片段的核苷酸序列。
57.根据权利要求56的分离的核酸分子,其中所述第一检测蛋白是抑制性蛋白。
58.根据权利要求57的分离的核酸分子,其中所述抑制性蛋白是抑制蛋白.
59.包含权利要求56的分离的核酸分子的表达载体,可操作的连接到启动子。
60.由权利要求47的分离的核酸分子的表达所产生的融合蛋白。
61.由权利要求56的分离的核酸分子的表达所产生的融合蛋白。
62.一种用于确定是否检测化合物调节第一检测蛋白和第二检测蛋白间相互作用的检测试剂盒,包括每种独立的部分:
(a)第一核酸分子,其编码第一融合蛋白,所述第一核酸分子包含:
(i)编码所述第一检测蛋白的核苷酸序列,其中所述检测蛋白是跨膜受体,
(ii)编码蛋白酶或蛋白酶片段识别的剪切位点的核苷酸序列,
(iii)编码激活报道基因的蛋白的核苷酸序列,
(b)第二核酸分子,其编码第二融合蛋白,所述第二核酸分子包含:
(i)编码在要检测的检测化合物存在下与所述第一检测蛋白相互作用的所述第二检测蛋白的核苷酸序列,
(ii)编码对所述剪切位点特异的所述蛋白酶或所述蛋白酶片段的核苷酸序列,
(c)分别独立容纳每种(a)和(b)的包装方式。
63.根据权利要求62的检测试剂盒,其中所述跨膜受体是胰岛素样生长因子受体IGFR、表皮生长因子受体EGFR或干扰素受体。
64.根据权利要求62的检测试剂盒,其中所述跨膜受体包括雌激素受体1ESR1或雌激素受体2ESR2。
65.根据权利要求62的检测试剂盒,其中所述跨膜受体是GPCR。
66.根据权利要求62的检测试剂盒,其中所述蛋白酶或蛋白酶片段是烟草蚀纹病毒核内包涵体A蛋白酶。
67.根据权利要求62的检测试剂盒,其中所述激活所述报道基因的蛋白是转录因子。
68.根据权利要求67的检测试剂盒,其中所述转录因子是tTA或GAL4。
69.根据权利要求62的检测试剂盒,其中所述第二蛋白是抑制性蛋白。
70.根据权利要求69的检测试剂盒,其中所述抑制性蛋白是抑制蛋白。
71.根据权利要求61的检测试剂盒,进一步包含编码报道基因的分离的核酸分子的独立部分。
72.根据权利要求71的检测试剂盒,其中所述报道基因编码β-半乳糖苷酶或荧光素酶.
73.根据权利要求62的检测试剂盒,其中编码所述第一检测蛋白的核苷酸序列被修饰以提高与所述第二检测蛋白的相互作用。
74.根据权利要求73的检测试剂盒,其中所述修饰包含采用编码相比于原始序列与所述第二检测蛋白具有更高亲和性的氨基酸序列的核苷酸序列替换所述第一检测蛋白C-末端区域的全部或部分核苷酸序列。
75.根据权利要求74的检测试剂盒,其中所述C-末端区域的核苷酸序列被编码AVPR2,AGTRLI,GRPR,F2PL1,CXCR2/IL-8B或CCR4的C-末端区域的全部或部分的核苷酸序列所替换。
76.根据权利要求65的检测试剂盒,其中所述跨膜受体是ADRB2AVPR2,HTR1A,CHRM2,CCR5,DRD2,OPRK或ADRA1A。
CN2004800248641A 2003-07-09 2004-07-09 检测蛋白-蛋白相互作用的方法 Active CN1894581B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US48596803P 2003-07-09 2003-07-09
US60/485,968 2003-07-09
US51191803P 2003-10-15 2003-10-15
US60/511,918 2003-10-15
US56611304P 2004-04-27 2004-04-27
US60/566,113 2004-04-27
PCT/US2004/021887 WO2005007822A2 (en) 2003-07-09 2004-07-09 Method for assaying protein-protein interaction

Publications (2)

Publication Number Publication Date
CN1894581A CN1894581A (zh) 2007-01-10
CN1894581B true CN1894581B (zh) 2012-02-01

Family

ID=34084516

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2004800248641A Active CN1894581B (zh) 2003-07-09 2004-07-09 检测蛋白-蛋白相互作用的方法

Country Status (9)

Country Link
US (3) US7049076B2 (zh)
EP (2) EP2336768A1 (zh)
JP (1) JP4734498B2 (zh)
CN (1) CN1894581B (zh)
AT (1) ATE534900T1 (zh)
AU (1) AU2004257228B8 (zh)
CA (1) CA2531698A1 (zh)
IL (1) IL173023A0 (zh)
WO (1) WO2005007822A2 (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070224615A1 (en) * 2003-07-09 2007-09-27 Invitrogen Corporation Methods for assaying protein-protein interactions
CN1894581B (zh) * 2003-07-09 2012-02-01 生命技术公司 检测蛋白-蛋白相互作用的方法
US20080274913A1 (en) * 2005-05-27 2008-11-06 Invitrogen Corporation Multiplex Array Useful for Assaying Protein-Protein Interaction
US20090305898A1 (en) * 2005-07-21 2009-12-10 Ilan Morad Methods and Compositions for Identifying a Peptide Having an Intermolecular Interaction With a Target of Interest
US20070218456A1 (en) * 2006-02-08 2007-09-20 Invitrogen Corporation Cellular assays for signaling receptors
EP2535426A3 (en) * 2006-03-02 2013-07-24 The Uab Research Foundation Mycobacterial disease detection, treatment, and drug discovery
EP2002021B1 (en) * 2006-03-16 2011-10-12 Life Technologies Corporation Methods for assaying protein-protein interaction
WO2007149807A1 (en) * 2006-06-20 2007-12-27 Invitrogen Corporation Methods for identifying modifiers of gpr1 activity
KR20090083925A (ko) 2006-11-10 2009-08-04 디메릭스 바이오사이언스 피티와이 엘티디 탐지시스템 및 그 이용
US9026409B2 (en) 2007-08-06 2015-05-05 Design Ready Controls, Inc. Systems, methods, and software for automated design and manufacturing of HVAC control panels
MY155343A (en) * 2007-09-04 2015-10-15 Sanofi Aventis Identifying molecules that modulate protein-protein interactions using protease activated reporters
FR2934684B1 (fr) 2008-07-31 2012-11-16 Cis Bio Int Methode de detection de l'internalisation de proteines membranaires.
WO2010034773A1 (en) * 2008-09-25 2010-04-01 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Combinatorial synthesis and use of libraries of short expressed nucleic acid sequences for the analysis of cellular events
JP5586285B2 (ja) * 2009-03-18 2014-09-10 オリンパス株式会社 受容体相互作用検出方法およびサイクリックampセンサータンパク質
CN103476410B (zh) 2011-01-11 2020-02-21 戴麦里克斯生物科学有限公司 联合疗法
GB201103453D0 (en) * 2011-03-01 2011-04-13 Vib Vzw Kinase substrate sensor
TW201302779A (zh) 2011-04-13 2013-01-16 Glaxosmithkline Biolog Sa 融合蛋白質及組合疫苗
US9804160B2 (en) 2011-09-28 2017-10-31 H. Lee Moffitt Cancer Center And Research Institute, Inc. Protein-protein interaction as biomarkers
WO2014153044A1 (en) * 2013-03-14 2014-09-25 Temple University Of The Commonwealth System Of Higher Education Treatment of patients with hyponatremia and cardiac disease
CA2898130A1 (en) 2013-03-15 2014-09-18 The Trustees Of The University Of Pennsylvania Vaccines with biomolecular adjuvants
GB201310008D0 (en) 2013-06-05 2013-07-17 Glaxosmithkline Biolog Sa Immunogenic composition for use in therapy
CN106164344B (zh) * 2014-02-07 2018-12-18 韩国生命工学研究院 使用流式细胞仪测定蛋白纳米颗粒分子间相互作用的方法
US10619155B2 (en) * 2015-03-17 2020-04-14 Brown University Methods for labeling and manipulating a cellular circuit
CN104991072B (zh) * 2015-06-16 2017-03-29 西北农林科技大学 一种昆虫体外蛋白质相互作用检测系统的制备方法及应用
SG10202112024PA (en) 2016-01-11 2021-12-30 Univ Leland Stanford Junior Chimeric proteins and methods of immunotherapy
IL260532B2 (en) * 2016-01-11 2023-12-01 Univ Leland Stanford Junior Systems containing chaperone proteins and their uses for controlling gene expression
GB201609604D0 (en) * 2016-06-01 2016-07-13 Ucl Business Plc Cell
CN107976411B (zh) * 2016-10-25 2020-10-23 中国科学院微生物研究所 包含别构转录因子调控系统的生物传感器、试剂盒及其在小分子检测中的用途
WO2019062744A1 (zh) * 2017-09-27 2019-04-04 北京大学 融合多肽
CN108191979B (zh) * 2017-12-08 2021-01-01 上海晶诺生物科技有限公司 一种荧光互补检测人趋化因子生物学活性的方法
JP7367974B2 (ja) * 2018-07-31 2023-10-24 国立大学法人 東京大学 膜タンパク質活性測定法
CN110853712B (zh) * 2018-08-01 2022-06-07 清华大学 鉴定多对生物分子间相互作用调控因子的方法
WO2020080891A1 (ko) * 2018-10-19 2020-04-23 주식회사 프로티나 유방암 재발 예측 방법
CA3119530A1 (en) * 2018-12-10 2020-06-18 Yale University Microbiota metabolites that shape host physiology
US20220404337A1 (en) * 2021-06-21 2022-12-22 Massachusetts Institute Of Technology Real-time g-protein coupled receptor (gpcr) linked bioluminescent sensing of biological targets and processes

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1285846A (zh) * 1997-11-10 2001-02-28 综合医院公司 记录蛋白质相互作用及功能关系的检测系统

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3737901A (en) 1971-05-03 1973-06-05 Sierra Research Corp Redundant aircraft clock synchronization
JPS57139012A (en) * 1981-02-23 1982-08-27 Sankyo Co Ltd Anthelmintic composition
NL8200523A (nl) 1982-02-11 1983-09-01 Univ Leiden Werkwijze voor het in vitro transformeren van planteprotoplasten met plasmide-dna.
US4879236A (en) 1984-05-16 1989-11-07 The Texas A&M University System Method for producing a recombinant baculovirus expression vector
US5168062A (en) * 1985-01-30 1992-12-01 University Of Iowa Research Foundation Transfer vectors and microorganisms containing human cytomegalovirus immediate-early promoter-regulatory DNA sequence
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US5168061A (en) * 1986-05-15 1992-12-01 Board Of Regents, The University Of Texas System Human chorionic peptidase-1
US4952500A (en) 1988-02-01 1990-08-28 University Of Georgia Research Foundation, Inc. Cloning systems for Rhodococcus and related bacteria
US5703055A (en) 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
US5283173A (en) * 1990-01-24 1994-02-01 The Research Foundation Of State University Of New York System to detect protein-protein interactions
US5284746A (en) * 1990-02-08 1994-02-08 Zymogenetics, Inc. Methods of producing hybrid G protein-coupled receptors
US5384253A (en) 1990-12-28 1995-01-24 Dekalb Genetics Corporation Genetic transformation of maize cells by electroporation of cells pretreated with pectin degrading enzymes
WO1993004169A1 (en) 1991-08-20 1993-03-04 Genpharm International, Inc. Gene targeting in animal cells using isogenic dna constructs
US5439924A (en) * 1991-12-23 1995-08-08 Virbac, Inc. Systemic control of parasites
US5702932A (en) 1992-07-20 1997-12-30 University Of Florida Microinjection methods to transform arthropods with exogenous DNA
DE4228457A1 (de) 1992-08-27 1994-04-28 Beiersdorf Ag Herstellung von heterodimerem PDGF-AB mit Hilfe eines bicistronischen Vektorsystems in Säugerzellen
US5464758A (en) * 1993-06-14 1995-11-07 Gossen; Manfred Tight control of gene expression in eucaryotic cells by tetracycline-responsive promoters
US5814618A (en) * 1993-06-14 1998-09-29 Basf Aktiengesellschaft Methods for regulating gene expression
US5491084A (en) * 1993-09-10 1996-02-13 The Trustees Of Columbia University In The City Of New York Uses of green-fluorescent protein
US5656610A (en) 1994-06-21 1997-08-12 University Of Southern California Producing a protein in a mammal by injection of a DNA-sequence into the tongue
FR2722208B1 (fr) 1994-07-05 1996-10-04 Inst Nat Sante Rech Med Nouveau site interne d'entree des ribosomes, vecteur le contenant et utilisation therapeutique
US5871986A (en) 1994-09-23 1999-02-16 The General Hospital Corporation Use of a baculovirus to express and exogenous gene in a mammalian cell
US5736524A (en) 1994-11-14 1998-04-07 Merck & Co.,. Inc. Polynucleotide tuberculosis vaccine
NZ272574A (en) * 1995-07-14 1999-02-25 Lilly Eli & Co Nz Ltd Aqueous base suspension concentrate containing at least one ionophore antibiotic and wetting agent and/or a surfactant and xanthan gum optionally with a suspension agent, an antifreeze agent and an antifoaming agent; drench for veterinary treatment
US5780448A (en) 1995-11-07 1998-07-14 Ottawa Civic Hospital Loeb Research DNA-based vaccination of fish
CA2239951A1 (en) * 1995-12-08 1997-06-12 The Government Of The United States, Represented By The Secretary, Depar Tment Of Health And Human Services Method and compositions for monitoring dna binding molecules in living cells
US5773422A (en) * 1996-01-29 1998-06-30 Komer; Gene Avermectin formulation
US5928906A (en) 1996-05-09 1999-07-27 Sequenom, Inc. Process for direct sequencing during template amplification
AU707949C (en) * 1996-07-30 2006-01-19 Merial, Inc. Anthelmintic formulations
US5945100A (en) 1996-07-31 1999-08-31 Fbp Corporation Tumor delivery vehicles
US5981274A (en) 1996-09-18 1999-11-09 Tyrrell; D. Lorne J. Recombinant hepatitis virus vectors
FR2753377B1 (fr) * 1996-09-19 1999-09-24 Rhone Merieux Nouvelle association parasiticide a base de 1-n-phenylpyra- zoles et de lactones macrocycliques endectocides
DE19654079A1 (de) * 1996-12-23 1998-06-25 Bayer Ag Endo-ekto-parasitizide Mittel
US5891646A (en) 1997-06-05 1999-04-06 Duke University Methods of assaying receptor activity and constructs useful in such methods
US6528271B1 (en) 1997-06-05 2003-03-04 Duke University Inhibition of βarrestin mediated effects prolongs and potentiates opioid receptor-mediated analgesia
US7128915B2 (en) 1997-09-18 2006-10-31 Research Development Foundation Membrane virus host range mutations and their uses as vaccine substrates
US5994624A (en) 1997-10-20 1999-11-30 Cotton Incorporated In planta method for the production of transgenic plants
US6884870B2 (en) * 1998-03-20 2005-04-26 California Institute Of Technology Fusion proteins for identifying proteases, protease target sites and regulators of protease activity in living cells
US6117639A (en) * 1998-08-31 2000-09-12 Vertex Pharmaceuticals Incorporated Fusion proteins, DNA molecules, vectors, and host cells useful for measuring protease activity
US6893827B1 (en) * 2000-02-07 2005-05-17 Applera Corporation Receptor function assay for G-protein coupled receptors and orphan receptors by reporter enzyme mutant complementation
US20030157553A1 (en) 2000-03-03 2003-08-21 Gabriel Berstein Methods of assaying for G protein-coupled receptor ligands and modulators
US6333167B1 (en) * 2000-03-10 2001-12-25 American Home Products Corp. Methods and reagents for identifying inhibitors of proteolysis of membrane-associated proteins
US7018812B2 (en) * 2000-11-03 2006-03-28 Duke University Modified G-protein coupled receptors
EP1205191A1 (en) 2000-11-13 2002-05-15 Centre National De La Recherche Scientifique Targeted modification of intracellular compounds
WO2002064834A1 (en) * 2001-01-04 2002-08-22 Myriad Genetics, Inc. Novel two-hybrid system and use thereof
US20030013137A1 (en) * 2001-03-13 2003-01-16 Barak Larry S. Automated methods of detecting receptor activity
US20030049712A1 (en) * 2001-07-31 2003-03-13 Michael Haugwitz Method of detecting protease activity in a cell
DE10211063A1 (de) * 2002-03-13 2003-10-09 Axaron Bioscience Ag Neue Verfahren zur Detektion und Analyse von Protein-Interaktionen in vivo
US7192737B2 (en) * 2002-03-29 2007-03-20 Xoma Technology Ltd. Methods and materials for increasing expression of recombinant polypeptides
EP1353182A3 (en) 2002-04-12 2004-02-04 Smithkline Beecham Corporation Method of predicting cell-based assay results using binding profiles
US7297503B2 (en) * 2002-10-25 2007-11-20 Molecular Devices Corporation Methods of identifying reduced internalization transmembrane receptor agonists
US7001889B2 (en) * 2002-06-21 2006-02-21 Merial Limited Anthelmintic oral homogeneous veterinary pastes
KR100890579B1 (ko) * 2002-08-19 2009-04-27 프로테온 주식회사 Rna 결합 단백질의 유전자를 융합파트너로 이용한재조합 단백질의 제조방법
CN1894581B (zh) * 2003-07-09 2012-02-01 生命技术公司 检测蛋白-蛋白相互作用的方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1285846A (zh) * 1997-11-10 2001-02-28 综合医院公司 记录蛋白质相互作用及功能关系的检测系统

Also Published As

Publication number Publication date
AU2004257228B8 (en) 2009-01-08
WO2005007822A3 (en) 2005-03-31
CN1894581A (zh) 2007-01-10
AU2004257228A1 (en) 2005-01-27
US7049076B2 (en) 2006-05-23
EP1644734B1 (en) 2011-11-23
EP2336768A9 (en) 2011-08-10
CA2531698A1 (en) 2005-01-27
US20060147975A1 (en) 2006-07-06
EP1644734A4 (en) 2007-04-25
IL173023A0 (en) 2006-06-11
EP1644734A2 (en) 2006-04-12
ATE534900T1 (de) 2011-12-15
AU2004257228B2 (en) 2008-12-18
JP2007528713A (ja) 2007-10-18
WO2005007822A2 (en) 2005-01-27
US20120077706A1 (en) 2012-03-29
EP2336768A1 (en) 2011-06-22
US8017398B2 (en) 2011-09-13
US20050100934A1 (en) 2005-05-12
JP4734498B2 (ja) 2011-07-27

Similar Documents

Publication Publication Date Title
CN1894581B (zh) 检测蛋白-蛋白相互作用的方法
CN102187225B (zh) 使用蛋白酶活化的受体鉴别调节蛋白质-蛋白质相互作用的分子
Bean et al. Functional expression of opioid receptors and other human GPCRs in yeast engineered to produce human sterols
CN113621646A (zh) 一种新型冠状病毒侵染细胞的筛选系统及其应用
Li et al. Development of a membrane-anchored ligand and receptor yeast two-hybrid system for ligand-receptor interaction identification
US20070224615A1 (en) Methods for assaying protein-protein interactions
EP2002021B1 (en) Methods for assaying protein-protein interaction
JP2004514444A (ja) 二重lox組換えに基づく真核生物発現ライブラリーおよび使用方法
JP6093946B2 (ja) Gタンパク質共役型受容体のシグナル伝達の検出方法
EP1893627A1 (en) Multiplex array useful for assaying protein-protein interaction
US20080280303A1 (en) G-protein coupled receptors high-throughput functional assay
Lerner et al. Scintillation proximity assay for human DNA topoisomerase I using recombinant biotinyl-fusion protein produced in baculovirus-infected insect cells
WO2012082069A1 (en) Protein aptamers based on unstructured scaffold proteins
US20210340526A1 (en) Novel method for transducing protein-protein interactions
JP3643288B2 (ja) G蛋白質共役型受容体リガンドのスクリーニング法並びにg蛋白質共役型受容体のエクスプレッションクローニング法
WO2003058197A2 (en) Detection of molecular interactions by beta-lactamase reporter fragment complementation
Jain G protein-coupled receptor expression and signaling in yeast: Design and optimization of Host/Protein platform for therapeutic development
AU778648B2 (en) Cells and assays
WO2023220392A1 (en) Synthetic modular extracellular sensors that employ natural receptor ligand-binding domains
WO2000061745A1 (fr) Procede de criblage de ligand de proteine gr et procede d&#39;expression du clonage de la proteine gr
JP2005118050A (ja) G蛋白質共役型受容体リガンドのスクリーニング法並びにg蛋白質共役型受容体のエクスプレッションクローニング法
JP2001521619A (ja) レポーターサブユニット相補による分子相互作用の検出
JP2004533441A (ja) 受容体の信号対雑音比の最適化を誘導する変異

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: LIFE TECHNOLOGIES, INC.

Free format text: FORMER OWNER: SENDIJIN HOLDINGS CO., LTD.

Effective date: 20110425

Owner name: SENDIJIN HOLDINGS CO., LTD.

Free format text: FORMER OWNER: SENTIGEN BIOSCIENCES INC.

Effective date: 20110425

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: NEW YORK, THE USA TO: CALIFORNIA, THE USA

TA01 Transfer of patent application right

Effective date of registration: 20110425

Address after: California, USA

Applicant after: LIFE TECHNOLOGIES Corp.

Co-applicant after: THE TRUSTEES OF COLUMBIA University IN THE CITY OF NEW YORK

Address before: California, USA

Applicant before: Sentikin Holdings Ltd.

Co-applicant before: THE TRUSTEES OF COLUMBIA University IN THE CITY OF NEW YORK

Effective date of registration: 20110425

Address after: California, USA

Applicant after: Sentikin Holdings Ltd.

Co-applicant after: THE TRUSTEES OF COLUMBIA University IN THE CITY OF NEW YORK

Address before: American New York

Applicant before: Sentigen Biosciences Inc.

Co-applicant before: THE TRUSTEES OF COLUMBIA University IN THE CITY OF NEW YORK

C14 Grant of patent or utility model
GR01 Patent grant