CN1723284A

CN1723284A - 调节性锌指蛋白

Info

Publication number: CN1723284A
Application number: CNA2003801054757A
Authority: CN
Inventors: 金晋秀; 申铉哲; 权兴善
Original assignee: Toolgen Inc
Current assignee: Toolgen Inc
Priority date: 2002-12-09
Filing date: 2003-12-09
Publication date: 2006-01-18
Anticipated expiration: 2023-12-09
Also published as: CN100398652C; KR100766952B1; CA2508631A1; EP1570058A1; US20050032186A1; WO2004053130A1; JP2006508675A; AU2003302752A1; US20060251643A1; KR20050085448A

Abstract

本发明公开了一种能够调节内源性基因的嵌合型锌指蛋白。此类蛋白的实例包括能够调节VEGF－A表达的蛋白。所述蛋白及其编码核酸可用于调节血管发生。

Description

调节性锌指蛋白

关申请的交叉引用

本申请要求申请日为2002年12月9日、申请号为No.60/431,892的美国专利申请的优先权，该申请的内容并入本文作为参考。

技术领域

本发明涉及DNA结合蛋白，例如转录因子。

背景技术

大多数基因在转录水平受到多肽转录因子的调节，转录因子特异性结合这些基因内部的DNA位点，典型地是启动子或增强子区域内的DNA位点。这些蛋白在启动子处激活或阻抑RNA聚合酶的转录起始作用，由此调节靶基因的表达。许多转录因子，无论是激活子还是阻抑子，都具有模块化结构。这些模块可折叠成具有不同结构的结构域，并具有特异性功能，例如DNA结合、二聚化或与转录结构相互作用。当效应结构域例如激活结构域或阻抑结构域被转移至异源性转录因子的DNA结合结构域时可保留其功能。Brent和Ptashne(1985)Cell 43：729-36；Dawson等(1995)Mol.Cell Biol.15：6923-31。已经通过NMR和X射线结晶学研究确定了许多DNA结合结构域的三维结构，包括锌指结构域、同源结构域和螺旋-转角-螺旋结构域。

锌指结构域是具有模块功能的一类结构域。锌指蛋白(ZFP)可用于调节转录。例如，Kim和Pabo证实，当Zif268蛋白结合于靶基因的转录起始位点附近时，Zif268蛋白有效地抑制了VP16激活的靶基因转录。Kim和Pabo(1997)J Biol Chem 272：29795-29800。Liu等描述了使用通过位点特异性诱变而构建的遗传工程化的锌指蛋白上调VEGF-A。Liu等(2001).J.Biol.Chem.276，11323-11334。

发明内容

在一方面，本发明公开了一种多肽，其包括DNA结合结构域并能在细胞中调节基因的表达，例如在真核细胞中。在一个实施方案中，所述多肽结合基因中的靶DNA位点。所述DNA结合结构域典型地包括至少三个锌指结构域。

在一个实施方案中，所述锌指结构域中的至少一个、两个或三个是天然存在的锌指结构域。例如，这些结构域可与各种天然存在的蛋白质中的锌指结构域相同，或与来自天然存在的蛋白质的非邻近锌指结构域相同。所有这些锌指结构域均可以是天然存在的。

在另一个实施方案中，所述锌指结构域中的至少一个、两个或三个是天然存在的锌指结构域的变体，例如具有一到四个氨基酸残基或二到五个氨基酸残基的差异的结构域。多肽可包括天然存在的锌指结构域与变体结构域的组合。

多肽可调节任何基因。调节可以是直接的，例如多肽与靶基因的靶位点相互作用。例如，惊异可以是细胞的内源性基因(例如存在于天然基因组中的基因)、异源性基因(例如转基因)或病毒基因。在一个实施方案中，所述内源性基因编码一种分泌多肽或编码一种参与或调节一种分泌因子(例如一种分泌多肽)的产生的多肽。在一个实施方案中，所述内源性基因调节细胞增殖、细胞迁移或组织形态发生(例如血管发生)。

在一个实施方案中，所述内源性基因编码一种多肽，其调节激素合成、一种激素或生长因子。典型的生长因子包括VEGF家族的生长因子。

VEGF-A是该家族的一个成员。在一个实施方案中，所述多肽识别VEGF-A基因的调节区域中的靶位点，例如位于VEGF-A基因的-950和+450之间的一个位点。例如，所述多肽可识别的位点位于人VEGF-A启动子的大约第-680、-677、-671、-668、-665、-633R、-632R、-631、-630、-606、-603、-554、-536、-495、-475、-468、-465、-462、-455、-395R、-394R、-393R、-392、-391R、-385R、-382R、-358R、-314R、-282、-206、-206、-203、-184、-181、-137、-124、-90R、-85、-30、77、244R、283R、342、357、366、434、435或474R位，或位于这些位点的60、50、20、10、5或3个核苷酸范围内。这些核苷酸位置代表启动子上链中从转录起始位点起最5′的核苷酸位点，但当出现字母R时，则那些位置的编号(以R标明)代表下(反向)链中最5′的核苷酸。例如，F435(-90R)靶序列是反向链的5′：-90至3′：-98(上链中从转录起始位点起5′：-98至3′：-90位置)。在一个实施方案中，所述多肽与具有在此描述的序列的多肽竞争结合VEGF-A基因的靶位点。

在一个实施方案中，所述靶位点是内源性基因的调节区域，其与DNase高敏位点重叠，或与内源性转录因子的结合位点重叠。在另一个实施方案中，所述靶位点位于该位点或区域的700、500、300、200、50、20、10、5或3个碱基对范围内。在一个实施方案中，所述多肽结合靶位点的解离常数不超过20、7、5、3、2、1、0.5或0.05nM。

在一个实施方案中，当所述多肽在细胞内时，其能够使内源性基因的转录改变(例如抑制或激活)至少1.25、1.5、1.7、1.9、2.0、2.5、5、10、20、50或100倍。所述多肽在生物体的细胞内可具有相似的效应。

在一个实施方案中，所述DNA结合结构域包括在表1、表2、表3、表4或表5的单排中列出的至少两个锌指结构域，或包括至少两个具有与表1、表2、表3、表4或表5的单排中列出的两个锌指结构域相同的DNA接触残基的锌指结构域。

所述多肽可进一步包括转录激活或阻抑结构域。所述多肽可进一步包括细胞转导结构域，例如HIV tat转导结构域。

在一个实施方案中，所述多肽在哺乳动物细胞中抑制由缺氧诱导的VEGF-A的产生。这种抑制可以例如使得VEGF-A水平降低至在不含该多肽但其他方面均相同的细胞中由缺氧诱导的该蛋白的水平的80％、70％、60％、50％、40％、30％、20％、10％、5％、3％、2％、1％或0.1％以下。

本发明还提供了一种核酸，其包括编码在此描述的多肽的序列，以及一种包括所述核酸的细胞(例如原核或真核细胞，例如哺乳动物细胞)。所述细胞可表达该核酸并产生所述多肽。在一个实施方案中，所述细胞在体外进行培养。所述细胞可以是免疫隔离的或包囊化的。本发明还提供了一种生物体，所述生物体包括一或多种这样的细胞，即所述细胞中产生所述多肽且内源性基因受到所述多肽的调节。

在另一方面，本发明公开了一种调节内源性基因的方法，该方法包括：提供一种细胞，其包括编码一种包括至少三个锌指结构域的人工多肽的编码核酸，其中所述多肽结合内源性基因中的靶DNA位点；并在所述人工多肽可产生、结合靶DNA位点并调节所述内源性基因的条件下，在所述细胞中表达该编码核酸。在一个实施方案中，所述锌指结构域的至少两个是天然存在的锌指结构域。例如，这两个锌指结构域可以与各种天然存在的蛋白质的锌指结构域相同，或者可以是来自同一天然存在的蛋白质的非邻近锌指结构域。在一个实施方案中，所述人工多肽包括转录激活或阻抑结构域。所述内源性基因可以被抑制或激活。在一个实施方案中，可通过将细胞与核酸输送工具相接触而提供所述细胞，所述核酸输送工具例如是脂质体、病毒或病毒颗粒。在一个实施方案中，所述细胞是生物体内的一种细胞，例如哺乳动物生物体的一种细胞。所述方法可进一步包括，在进行表达之前，将细胞导入对象生物体，或将细胞进行包囊化并将包囊化的细胞导入对象生物体。

典型的多肽可包括至少两个或更多的锌指结构域，例如下表中特定一排的两个、三个或四个锌指结构域：

表1：典型的VEGF-A结合蛋白(A)

名称基序(第2栏) 特异结构域(第3栏)

F475 mQSHR-mRDHT-mRSNR QSHR2-RDHT-RSNR

F121 mQSHT-mRSHR-mRDHT QSHT-RSHR-RDHT

F435 mQSHR-mRDHT-mRSHR QSHR2-RDHT-RSHR

F547 mRSHR-mRDHT-mVSNV RSHR-RDHT-VSNV

F2825 mQSHV-mRDHR-mRDHT QSHV-RDHR1-RDHT

表2：典型的VEGF-A结合蛋白(B)

名称基序(第2栏) 特异结构域(第3栏)

F480 mRSHR-mRDHT-mRSHR RSHR-RDHT-RSHR

F2828 mCSNR-mWSNR-mRDHR CSNR1-WSNR-RDHR1

F625 mCSNR-mWSNR-mRSHR CSNR1-WSNR-RSHR

F2830 mDSNR-mWSNR-mRDHR DSNRa-WSNR-RDHR1

F2838 mDSNR-mWSNR-mRSHR DSNRa-WSNR-RSHR

表3：典型的VEGF-A结合蛋白(C)

名称基序(第2栏) 特异结构域(第3栏)

F109 mRDER-mQSSR-mQSHT-mRSNR RDER1-QSSR1-QSHT-RSNR

F2604 mDSAR-mRSNR-mRDHT-mVSSR DSAR2-RSNR-RDHT-VSSR

F2605 mQSHT-mDSAR-mRSNR-mRDHT QSHT-DSAR2-RSNR-RDHT

F2607 mRDHT-mVSNV-mQSHT-mDSAR RDHT-VSNV-QSHT-DSAR2

F2615 mRSHR-mDSCR-mQSHT-mDSCR RSHR-DSCR-QSHT-DSCR

F2633 mQSNR-mQSHR-mRDHT-mRSNR QSNR3-QSHR2-RDHT-RSNR

F2634 mCSNR-mRDHT-mRSNR-mRSHR CSNR1-RDHT-RSNR-RSHR

F2636 mRSHR-mQSHT-mRSHR-mRDER RSHR-QSHT-RSHR-RDER1

F2644 mQSNR-mRSHR-mQSSR-mRSHR QSNR3-RSHR-QSSR1-RSHR

F2646 mQSHT-mDSCR-mRDHT-mCSNR QSHT-DSCR-RDHT-CSNR1

F2650 mQSHT-mWSNR-mRSHR-mWSNR QSHT-WSNR-RSHR-WSNR

F2679 mVSNV-mRSHR-mRDER-mQSNV VSNV-RSHR-RDER1-QSNV2

表4：典型的VEGF-A结合蛋白(D)

名称基序(第2栏) 特异结构域(第3栏)

F2610 mRSNR-mRSHR-mRDHT-mRSHR RSNR-RSHR-RDHT-RSHR

F2612 mRSHR-mRDHT-mRSHR-mRDHT RSHR-RDHT-RSHR-RDHT

F2638 mRSNR-mQSHR-mRDHT-mRSHR RSNR-QSHR2-RDHT-RSHR

表5：典型的VEGF-A结合蛋白(E)

名称基序(第2栏) 特异结构域(第3栏)

F2608 mRSHR-mRDHT-mVSNV-mQSHT RSHR-RDHT-VSNV-QSHT

F2611 mRSHR-mRSHR-mWSNR-mRSHR RSHR-RSHR-WSNR-RSHR

F2617 mRDER-mRSHR-mDSCR-mQSHT RDER1-RSHR-DSCR-QSHT

F2619 mRSHR-mVSTR-mQSNR-mRDHT RSHR-VSTR-QSNR3-RDHT

F2623 mQSHT-mRSNR-mWSNR-mRDER QSHT-RSNR-WSNR-RDER1

F2625 mQSHT-mWSNR-mRDHT-mRDER QSHT-WSNR-RDHT-RDER1

F2628 mVSSR-mWSNR-mRSNR-mVSSR VSSR-WSNR-RSNR-VSSR

F2629 mQSHR-mVSSR-mWSNR-mRSNR QSHR2-VSSR-WSNR-RSNR

F2630 mRDER-mQSHR-mVSSR-mWSNR RDER1-QSHR2-VSSR-WSNR

F2635 mQSHR-mRSNR-mQSHR-mRDHT QSHR2-RSNR-QSHR2-RDHT

F2637 mRDHT-mRSNR-mRSHR-mWSNR RDHT-RSNR-RSHR-WSNR

F2642 mRDHT-mRSHR-mCSNR-mRDHT RDHT-RSHR-CSNR1-RDHT

F2643 mRSHR-mCSNR-mRDHT-mCSNR RSHR-CSNR1-RDHT-CSNR1

F2648 mQSSR-mQSHR-mRSNR-mRSNR QSSR1-QSHR2-RSNR-RSNR

F2651 mVSTR-mQSHT-mWSNR-mRSHR VSTR-QSHT-WSNR-RSHR

F2653 mVSTR-mQSNR-mRSHR-mQSNR VSTR-QSNR3-RSHR-QSNR3

F2654 mQSNR-mRSHR-mQSNR-mVSNV QSNR3-RSHR-QSNR3-VSNV

F2662 mDSCR-mRDHT-mVSTR-mRDER DSCR-RDHT-VSTR-RDER1

F2667 mRSHR-mDSCR-mRDHT-mRSHR RSHR-DSCR-RDHT-RSHR

F2668 mRSHR-mRSHR-mQSNV-mQSNV RSHR-RSHR-QSNV2-QSNV2

F2673 mRDHT-mVSSR-mRDER-mQSSR RDHT-VSSR-RDER1-QSSR1

F2682 mRSNR-mQSSR-mQSNR-mRSHR RSNR-QSSR1-QSNR3-RSHR

F2689 mRSNR-mDSAR-mQSNR-mQSHT RSNR-DSAR2-QSNR3-QSHT

F2697 mRSHR-mCSNR-mQSHT-mRSNR RSHR-CSNR1-QSHT-RSNR

F2699 mRSNR-mQSHT-mDSAR-mRSHR RSNR-QSHT-DSAR2-RSHR

F2703 mQSHR-mRSHR-mRDER-mRSHR QSHR2-RSHR-RDER1-RSHR

F2702 mRSHR-mQSHR-mRSHR-mQSNV RSHR-QSHR2-RSHR-QSNV2

在一方面，本发明公开了一种包括DNA结合结构域的多肽。所述DNA结合结构域具有多个锌指结构域。所述多肽可改变细胞中VEGF-A的表达或产生。例如，所述多肽可改变细胞对可能升高或降低VEGF-A的产生或表达的信号的正常应答。在一个实施方案中，所述多肽在那些诱导VEGF-A产生或表达的条件下可抑制细胞内诱导产生或表达VEGF-A。例如，这种抑制的幅度可以使得VEGF-A蛋白或mRNA水平降低至在不含该多肽但其他方面均相同的细胞中由那些条件所诱导的水平的80％、70％、60％、50％、40％、30％、20％、10％、5％、3％、2％、1％或0.5％以下。在一个实施方案中，所述条件包括缺氧。

可在人胚肾293F细胞中对这些条件进行精确测定，例如随后在实施例中所述。

所述多肽可具有广泛的用途，例如用于培养的人类细胞或生物体中，例如人或非人哺乳动物生物体。

在一个实施方案中，所述多肽结合人VEGF-A基因中的位点。在另一个实施方案中，所述多肽间接起作用，例如其结合另一个基因的位点。

在一个实施方案中，所述多肽包括阻抑结构域。所述多肽可包括在此所述的其他特征。本发明还公开了一种组合物，例如包括所述多肽或编码所述多肽的核酸的药物组合物。

所述组合物可施用于对象，例如以降低所述对象的血管发生的有效量施用，例如施用于所述对象的病变部位(例如肿瘤(neoplasm))的附近或施用于对象全身。在一个实施方案中，所述对象是患有或疑似患有转移癌的人。

就所公开的任何多肽来说，所述多肽可进一步包括一种异源性序列，例如核定位信号、小分子结合结构域(例如类固醇结合结构域)、表位标签或纯化标签、催化结构域(例如核酸修饰结构域、核酸裂解结构域、DNA修复催化结构域)、转录功能结构域(例如激活结构域、阻抑结构域等等)、蛋白转导结构域(例如来自HIV tat)、和/或调节位点(例如磷酸化位点、泛素化位点或蛋白酶裂解位点)。

所述多肽可例如与一或多种额外成分配制成药物组合物。所述组合物或多肽可纳入一种试剂盒，该试剂盒还可包括另一种药物或使用说明，例如治疗用途说明。

所述多肽可(共价或非共价)连接于一种固相支持物，例如珠、基质或平面阵列。所述多肽也可连接于一种标记物，如放射性化合物、荧光化合物、另一种可检测物、或检测系统的成分(例如化学发光剂)。

本发明还包括一种分离的核酸，所述核酸包括编码一种上述多肽的序列。所述核酸可进一步包括一种可操纵连接的调节序列，例如启动子、转录增强子、5′非翻译区、3′非翻译区、病毒包装序列、和/或选择标记。可将所述核酸包装入病毒中，例如可感染哺乳动物细胞的病毒，例如慢病毒、逆转录病毒、痘病毒、或腺病毒。

本发明进一步提供了一种细胞，其含有所述多肽或包括编码所述多肽的序列的核酸。所述细胞可存在于对象生物体的组织中或培养物中。所述细胞可以是动物(例如哺乳动物细胞，例如人或非人细胞)细胞、植物细胞或微生物(例如真菌或细菌)细胞。可通过将所述多肽导入细胞或亲代细胞或通过将所述核酸导入细胞或亲代细胞而制备所述细胞。所述核酸可用于在细胞中产生所述多肽。

本发明还包括非人转基因哺乳动物，例如小鼠、大鼠、猪、兔、牛、山羊或绵羊。转基因哺乳动物的遗传互补体(genetic complement)包括编码上述以及本文中其他部分所述的嵌合型锌指多肽的核酸序列。本发明还包括产生所述多肽的方法，例如通过表达所述核酸，或包括使用所述多肽的方法，例如用于调节细胞内的内源性基因或病毒基因。

对于本发明的调节VEGF-A的任一种多肽，所述多肽可用于一种调节细胞内VEGF-A表达的方法中。所述方法包括将所述多肽或一种包括编码所述多肽的序列的核酸导入细胞。例如，可使用脂质体或通过与蛋白转导结构域进行融合而导入所述多肽。可例如通过转染或病毒输送而导入核酸。

本发明还公开了一种组合物，所述药物组合物例如包括一种例如在此所述的调节VEGF-A的多肽，或包括编码所述多肽的核酸。在一个实施方案中，所述多肽可抑制VEGF-A的表达，且所述组合物可施用于对象，例如以降低所述对象的血管发生的有效量施用，例如施用于所述对象的病变部位(例如肿瘤)的附近或施用于对象全身。在一个实施方案中，所述对象是患有或疑似患有转移癌的人。

在另一个实施方案中，所述多肽增强VEGF-A的表达，且所述组合物可以增强对象的血管发生的有效量施用于对象。例如，需要增强血管发生的情况例如为血管形成、胚胎发育、肌体生长、神经系统分化、妊娠、伤口愈合等等。血管内皮细胞生长因子(VEGF-A)是一种内皮细胞特异性生长因子，其是调节内皮细胞生长和分化的关键因子。

VEGF或其VEGF₁₆₄和VEGF₁₈₈异构体的水平不足导致出生后血管发生和缺血性心脏病。VEGF-A的激活可用于治疗或预防外周动脉疾病和冠状动脉疾病。例如，对象可以是患有或疑似患有创伤(内部或外部)、妊娠、神经系统疾病、胚胎发育问题、心血管疾病(例如缺血性心脏病、外周动脉疾病或冠状动脉疾病)。

不同的剪切变体产生了至少5种VEGF-A蛋白的异构体。这些异构体对血管发生具有不同的影响。通过锌指蛋白，例如在此所述的一种蛋白，激活VEGF-A可在一些实践中上调对产生所需临床结果来说具有重要意义的所有或个别的剪切变体。例如，锌指蛋白可调节所有剪切变体的表达，或者可调节剪切变体的一个亚组的表达，例如至少一种剪切变体。

在另一方面，本发明公开了一种包囊化的组合物，其包括由生物相容性材料组成的包囊层以及重组的哺乳动物细胞，其中所述细胞含有一种核酸，其包含编码调节一种因子的产生的嵌合型锌指蛋白的序列，所述因子例如为分泌因子或非分泌蛋白，例如细胞质蛋白质。在一个实施方案中，所述生物相容性材料至少可透过分子量为10、20、30或40kDa的蛋白质。所述生物相容性材料可保留大于例如50、100、120或200kDa的蛋白质。

本发明还提供了一种快速和规模化的用于鉴别和构建嵌合型蛋白质例如转录因子的基于细胞的方法。此类转录因子可用于生物医药和生物工程用途例如改变内源性基因的表达。可通过体内测试和在培养的细胞中测试转录因子，例如在培养物中的完好的活细胞中进行。

在另一方面，本发明公开了一种用于表征嵌合型锌指蛋白例如在此所述的锌指蛋白的方法。所述方法包括：将编码该蛋白的核酸导入细胞；表达该核酸；并评估靶基因的表达。例如，评估可包括确定细胞的内源性基因的表达谱。该表达谱包括多个数值，其中每个数值相应于一种不同基因、剪切变体或基因的等位基因变体的表达水平(即mRNA水平)或翻译产物的丰度(即蛋白水平)。所述数值可以是所述基因的表达水平或所述基因的翻译产物水平的定性或定量评估值，即1)对转录自该基因的mRNA或2)对由该基因编码的所述多肽的丰度的评估值。

在另一方面，本发明公开了一种用于鉴别可结合于特定靶位点的嵌合型锌指蛋白的方法。该方法包括：提供数据记录值，每一个记录值与一种天然存在的锌指结构域(例如一种人的锌指结构域)的标识(identifier)和由该标识指代的锌指结构域所识别的至少一个3或4个碱基对的亚位点相关；将靶位点解析为至少两个3或4个碱基对的亚位点；对于每个亚位点，自数据记录值中重新获得一组标识，所述的组包含识别亚位点的锌指结构域的标识；并设计一种包含针对各个亚位点的锌指结构域的多肽，所述锌指结构域由来自所述组的对应于相应亚位点的标识指代。

数据记录值可包括鉴别感兴趣的锌指结构域的记录值，所述方法可进一步包括在体外合成编码所述多肽的核酸和/或合成所述多肽的步骤。所述方法还可包括评估所述多肽与靶位点的结合的步骤，例如采用体外结合测定或体内测定法，例如测定靶基因的表达。合成的多肽可进一步包括一个激活或阻抑结构域。

在一个实施方案中，所述方法进一步包括评估所述多肽改变一或多个内源性基因的表达的能力。评估可包括分析多种内源性基因的表达谱，例如采用核酸微阵列，或分析一种或有限数量的基因的表达谱。所述方法还可进一步包括将所述多肽与包括靶位点的DNA相接触，例如在体外进行。

在另一个实施方案中，所述方法进一步包括自寻定的(addressed)核酸文库重新获得编码所述多肽的核酸，该文库中的每种核酸包括一种编码第一和第二锌指结构域的序列。

在另一方面，本发明公开了特定的多肽和分离核酸。本发明的多肽可包括例如1、2、3或4个锌指结构域并可与在此提供的具有一种特定氨基酸序列的参照多肽相关。例如，所述多肽在1、2、3、4或更多个锌指结构域中可具有与所述参照多肽的相应锌指结构域相同的DNA接触残基。在另一个实例中，在所述多肽的3个锌指结构域中，至少9、10或11个DNA接触残基(3x4)与所述参照多肽的相应锌指结构域的DNA接触残基相同。在另一个实例中，在所述多肽的4个锌指结构域中，至少12、13、14或15个DNA接触残基(4x4)与所述参照多肽的相应锌指结构域的DNA接触残基相同。所述多肽能够与所述参照多肽结合同一个位点，并调节同一种内源性基因，例如以所述参照多肽的活性的0.1至10倍或0.5至1.5倍。

在一个实施方案中，一或多种(例如所有)锌指结构域的氨基酸序列是天然存在的序列。在一个实施方案中，所述多肽能够调节靶基因，例如细胞的内源性基因，例如与所述参照多肽的基因相同的基因，例如VEGF-A。

此外，本发明的纯化的多肽的氨基酸序列可与在此所述的锌指结构域具有至少50％、60％、70％、80％、90％、93％、95％、96％、98％、99％、或100％的相同性。在相应于多肽的DNA接触残基的氨基酸位置上，所述多肽可与在此所述的锌指结构域相同。或者，所述多肽在相应于多肽的DNA接触残基的残基中至少有一个与在此所述的锌指结构域不同。例如，所述多肽的一或多个锌指结构域包括在一个DNA接触残基处具有保守取代。

所述多肽还可具有至少1、2或3个残基的差异，例如为那些DNA接触残基以外的残基。例如，在一个给定的锌指结构域内部，所述多肽可与以上参照的氨基酸序列具有单个氨基酸的差异，或与以上参照的序列具有2、3或4个氨基酸的差异。这种差异的原因可以是在此所述的保守取代。在一个实施方案中，与以上参照的序列的氨基酸差异位于第二锌配位半胱氨酸与-1DNA接触位置之间(参照如下描述的DNA接触位置的编号系统)。

可采用数学算法进行序列比较并确定两个序列之间的百分比相同性。具体而言，采用Needleman和Wunsch((1970)J.Mol.Biol.48：444-453)算法确定两个氨基酸序列之间的百分比相同性，该算法已经并入GCG软件包的GAP程序，采用了Blossum 62评分矩阵，空位罚分为12，空位扩展罚分为4，且移码空位罚分为5。

纯化的多肽还可包括如下各项中的一或多种：异源性DNA结合结构域、核定位信号、小分子结合结构域(例如类固醇结合结构域)、表位标签或纯化标签、催化结构域(例如核酸修饰结构域、核酸裂解结构域或DNA修复催化结构域)和/或转录功能结构域(例如激活结构域、阻抑结构域等等)。在一个实施方案中，所述多肽进一步包括一个第二锌指结构域，例如一个具有在此所述的序列的结构域。例如，所述多肽可包括一列锌指，包括两个或多个锌指结构域。在一个实施方案中，一或多个结构域(例如每个结构域)可具有与在此所述的基序相一致的序列，例如mCSNR、mDSAR、mDSCR、mISNR、mQFNR、mQSHV、mQSNI、mQSNK、mQSNR、mQSNV、mQSSR、mQTHQ、mQTHR、mRDER、mRDHT、mRDKR、mRSHR、mRSNR、mVSNV、mVSSR、mVSTR、mWSNR、mDGNV、mDSNR和mRDNQ。此外，每个结构域均可具有在此提供的序列。如下所述，小写字母m前缀表示列出的4个氨基酸代表DNA接触残基的基序。

本发明的核酸包括编码上述多肽的核酸。本发明的核酸可以被一种异源性核酸序列可操纵地调节，例如被诱导型启动子(例如类固醇激素调节的启动子、小分子调节的启动子或遗传工程化诱导型系统，如四环素Tet-On和Tet-Off系统)调节。在一个实施方案中，启动子在哺乳动物细胞中可诱导。

如在此所述，所述多肽可在细胞中产生并可通过结合一种靶位点而调节细胞内的基因，例如一种内源性基因，靶位点例如是一种包括被相应的锌指结构域所识别的亚位点的位点。细胞可以是哺乳动物细胞。

本发明还包括一种表达融合于一种异源性核酸结合结构域的在此所述的多肽的方法，所述方法包括将编码上述融合蛋白的核酸导入细胞。

在另一方面，本发明公开了一种包囊化的组合物。所述组合物包括由生物相容性材料组成的包囊层以及重组的哺乳动物细胞。所述细胞含有一种核酸，所述核酸包括编码一种嵌合型锌指蛋白的序列，所述嵌合型锌指蛋白调节细胞内的另一种核酸的产生，另一种核酸例如是异源性核酸或内源性核酸。例如，所述细胞可调节一种基因，该基因编码一种分泌多肽或调节或参与一种分泌因子的产生，例如分泌多肽。在一个实施方案中，分泌多肽是胰岛素、胰岛素样生长因子、VEGF-A、HGF、干扰素、白介素或成纤维细胞生长因子。

包囊层典型地至少可透过分子量为10kDa的蛋白质，例如分子量大约为10、20、30、40、50或70kDa的蛋白质。包囊层可以是非通透性的，例如大于上述分子量的蛋白质，例如大约100kDa的蛋白质。可存在额外的包囊层。嵌合型锌指蛋白可包括在此所述的一或多种特征。

术语“锌指蛋白”指的是任何包括锌指结构域的蛋白质。蛋白质可包括一或多个多肽链。典型的锌指蛋白包括2、3、4、5、6或更多个锌指结构域。典型地，所述蛋白质是单链。不过，在一些实施方式中，蛋白质可包括多个多肽链，例如，蛋白质可以是一种异源二聚体或同源二聚体蛋白质。

术语“碱基接触位置”、“DNA接触位置”或“核酸接触位置”指的是锌指结构域中在结构上相应于ZIF268的精氨酸73、天冬氨酸75、谷氨酸76和精氨酸79的氨基酸位置的4个氨基酸位置。

Glu Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser

1 5 10 15

Arg Ser Asp Glu Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys

20 25 30

Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His

35 40 45

Leu Thr Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys

50 55 60

Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His

65 70 75 80

Thr Lys Ile His Leu Arg Gln Lys Asp(SEQ ID NO：129)

85

这些位置也分别被称为第-1位、第2位、第3位和第6位。为了鉴别一种查询序列中相应于所述碱基接触位置的位置，可将查询序列与感兴趣的锌指结构域进行比对，以使得该查询序列的半胱氨酸和组氨酸残基Zif268的指3的那些残基对齐。European Bioinformatics Institute的ClustalW WWW Service(Thompson等(1994)Nucleic Acids Res.22：4673-4680)提供了一种简便的序列比对方法。

保守性氨基酸取代指的是具有相似侧链的残基之间的可交换性。例如，一组具有脂肪族侧链的氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸；一组具有脂肪族羟基侧链的氨基酸是丝氨酸和苏氨酸；一组具有含酰胺侧链的氨基酸是天冬酰胺和谷氨酰胺；一组具有芳基侧链的氨基酸是苯丙氨酸、酪氨酸和色氨酸；一组具有碱性侧链的氨基酸是赖氨酸、精氨酸和组氨酸；一组具有酸性侧链的氨基酸是天冬氨酸和谷氨酸；以及一组具有含硫侧链的氨基酸是半胱氨酸和甲硫氨酸。根据情况，同一组内的氨基酸可以相互交换。一些其他的保守性氨基酸取代组是：缬氨酸-亮氨酸-异亮氨酸；苯丙氨酸-酪氨酸；赖氨酸-精氨酸；丙氨酸-缬氨酸；天冬氨酸-谷氨酸；以及天冬酰胺-谷氨酰胺。

术语“异源性多肽”指的是具有非天然存在的序列的多肽(例如杂合多肽)或者是具有与天然存在的多肽相同的序列的多肽，但其所处的环境不是其天然存在的环境。例如，在自然界不融合在一起的两种天然存在的多肽发生融合产生了异源性多肽，其中一种多肽对于另一种来说是异源性的。

术语“杂合体”指的是一种非天然存在的多肽，其包含一种氨基酸序列，所述序列衍生自(i)至少两种不同的天然存在的序列；(ii)至少一种人工序列(即一种非天然存在的序列)和至少一种天然存在的序列；或(iii)至少两种人工序列(相同的或不同的)。人工序列的实例包括天然存在的序列的突变体和重新设计的序列。

在此，术语“严格条件下杂交”指的是杂交的条件是：6X氯化钠/柠檬酸钠(SSC)，45℃，随后在0.2X SSC，0.1％SDS洗涤2次，65℃。本发明还公开了在严格条件下与在此所述的核酸杂交或与编码在此所述的多肽的核酸杂交的核酸。

术语“结合偏向性(binding preference)”指的是一种多肽在选择一个核酸结合位点时相对于另一个位点的区别特性。例如，在本文中所述的体内或体外测试中，如果所述多肽的量对于两种不同的核酸结合位点来说是有限的，那么相对于另一位点来说，更多的所述多肽会与优选位点结合。

在本文中，“解离常数”指的是一种蛋白质(例如锌指蛋白)结合一种感兴趣的靶位点的平衡解离常数。对于识别位于9和18个碱基对之间的靶位点的锌指蛋白，通过一种28个碱基对的双链DNA对结合进行评估。通过凝胶迁移分析测定解离常数，使用的是纯化蛋白，该蛋白结合于20mM Tris pH7.7，120mM NaCl，5mM MgCl2，20μM ZnSO4，10％甘油，0.1％Nonidet P-40，5mM DTT，和0.10mg/mL BSA(牛血清白蛋白)，室温。实施例1以及Rebar和Pabo((1994)Science 263：671-673)提供了其他的细节。解离常数可低于10^-6、10^-7、10^-8或10^-9M。

可将一种多肽(“竞争性多肽”)称为与另一种多肽(感兴趣的多肽)“竞争”一个结合位点，条件是，在使用具有所述靶位点的探针分子的体外测试中，所述竞争性多肽的浓度不超过所述感兴趣的多肽的浓度的10倍以上，由所述感兴趣的多肽所结合的探针分子的数量降低至少25％。以大约50倍于所述感兴趣的多肽对该探针分子的Kd值进行这些实验。

可将一种给定的锌指结构域称为“特异性结合”一种给定的3个碱基对的DNA位点，条件是，一种包括Zif268的指1和指2以及该给定的锌指结构域的嵌合型蛋白质对一种靶位点的亲和力至少为5nM，所述靶位点既包括该给定的3个碱基对DNA位点又包括由Zif268的指1和指2所识别的5-bp序列5′-GGGCG-3′。术语“识别”和“特异性结合”可互换使用，指的是在上述Zif268融合测试中，锌指结构域对结合位点的区别力。

在此，“简并寡核苷酸”既指(a)一组不同的寡核苷酸，其各自编码一种特定的氨基酸序列，也指(b)单一一种寡核苷酸，其可与一种以上的序列退火，例如一种具有非天然核苷酸如次黄嘌呤核苷的寡核苷酸。

“分离的组分”指的是一种组分，其与可获得该分离的组合物的细胞样品或反应混合物中的至少一种成分的至少90％分离。人工产生或天然产生的组分可以是至少一定程度纯化的组分，条件是感兴趣的物质或物质群以重量-重量计算其纯度至少是5％、10％、25％、50％、75％、80％、90％、92％、95％、98或99％。在此所述的任何蛋白或核酸组分均可以分离的形式而提供。

使用锌指结构域是特别有利的。首先，锌指结构结构能够识别极其多样的DNA序列，但任一特定的锌指对一种特定的序列可具有高度的特异性。其次，天然存在的锌指蛋白的结构是模块化的。例如，锌指蛋白Zif268，也称为“Egr-1”，由串联排列的3个锌指结构域组成。Pavletich和Pabo描述了锌指蛋白Zif268的一种片段的X射线结晶学结构。Pavletich和Pabo(1991)Science 252：809-817。在这种结构模型中，3个Zif268指与DNA形成复合体。每个指独立地与DNA识别位点的3-4个碱基对接触。通过在同一个多肽链中具有多个锌指模块的共同作用而达到高亲和性结合。

本发明可利用人类基因组或任何其他基因组中的所有锌指结构域。对通过锌指结构域在结构上的折叠而占据的序列空间进行这种多样化取样可具有经世世代代自然选择所固有的额外优势。此外，通过使用来自宿主物种的结构域，由在此所述的方法经遗传工程化产生的用于基因治疗的锌指蛋白降低了其被宿主免疫应答视为外来物的可能性。也可使用非天然存在的锌指结构域，例如人类或哺乳动物锌指结构域的变体或全部人工化的锌指结构域。

由于能够选择识别特定序列的DNA结合结构域，因此得以设计出特异性调节靶基因如内源性细胞基因的新的蛋白质。在许多实施方式中，这些蛋白质具有治疗性用途或工业用途。也可有其他用途。

本申请也公开了多个实施例，其运用特定的实施方案，证实了锌指蛋白可广泛用作一种治疗癌症的治疗剂。这些实施例说明，锌指蛋白可作为VEGF-A表达的强效抑制剂。由于VEGF-A促成肿瘤组织内的血管发生，因此调节(例如抑制)VEGF-A的锌指蛋白可用于例如降低肿瘤内部或周围的血管发生。

在此引用的全部专利、专利申请和参考文献均以其全部内容并入本文作为参考。以下专利申请：WO01/60970(Kim等)；美国专利申请公开文本2002-0061512、2003-165997和2003-194727以及美国申请10/669,861、60/431,892和60/477,459，特别以其全部内容并入作为参考用于所有目的。下面结合附图和以下说明来阐述本发明的一或多种实施方案。根据说明书、附图和权利要求书，本发明的其他特征、目的和优势将是显而易见的。

附图说明

图1A、1B和1C列出了人VEGF-A基因的一个典型区域的核酸序列(SEQ ID NO：120)。该区域包括启动子。该序列来自GENBANK登记号AF095785.1。转录起始位点大约为2363位核苷酸。起始密码子大约为3401位核苷酸。

图2A、2B、2C、2D、2E和2F列出了人转化蛋白(FGF4)基因的一个典型区域的核酸序列(SEQ ID NO：121)。该区域包括启动子。该序列来自GENBANK登记号J02986.1和AP006345.2(智人基因组DNA，染色体11克隆：RP11-186D19，完整序列)。转录起始位点大约为3731位核苷酸。起始密码子大约为3959位核苷酸。

图3A、3B、3C、3D和3E列出了人肝细胞生长因子(HGF)基因的一个典型区域的核酸序列(SEQ ID NO：122)。该区域包括启动子。该序列来自GENBANK登记号AC004960.1，来自7q11.23-q21的智人PAC克隆RP5-1098B1。转录起始位点大约为4389位核苷酸。起始密码子大约为4454位核苷酸。

图4是VEGF-A启动子的示意图。

图5A提供了用于表达具有KRAB结构域的锌指蛋白的典型的核酸构建体的示意图。

图5B提供了典型的含有VEGF-A启动子的萤光素酶报道分子构建体的示意图。

具体实施方式

包括至少一个锌指结构域的嵌合型锌指蛋白可用于调节细胞内基因的表达。锌指蛋白可包括两个或更多个天然存在的锌指结构域。在一组实例中，嵌合型锌指蛋白被用于调节哺乳动物细胞中的VEGF-A基因。

可通过多种方法获得嵌合型锌指蛋白。

在一个实施方案中，这些蛋白被设计为用于识别靶DNA位点。有用的靶位点包括靶基因调节区域内的位点或在距靶基因调节区域1kb或500bp范围内的位点。例如，靶位点可以在距基因的TATA盒或转录起始位点1kb或500bp范围内。用于设计锌指蛋白的一种方法包括，将靶位点解析为可被一种单独的锌指结构域识别的3或4个碱基对的序列。然后构建包括编码编码一种蛋白质的核酸，所述蛋白质具有相应于所述被解析的元件的连续的锌指结构域。构建编码候选蛋白质的多种不同的核酸并在宿主细胞中进行表达。评估靶基因的表达以鉴别能够调节所述靶基因的表达的一或多种候选蛋白。

在另一个实施方案中，根据其在细胞内的表型效应自锌指结构域文库选择嵌合型锌指蛋白。例如，将编码锌指结构域的随机嵌合体的核酸文库转化入哺乳动物培养细胞中。在细胞内表达文库的核酸。评价细胞的感兴趣的表型，分离那些相对于对照而言表型发生改变的细胞。回收此类细胞中的文库核酸，然后可进一步对由此类回收的核酸编码的锌指蛋白进行表征、运用和修饰。

锌指结构域

锌指结构域是大约30个氨基酸残基的小多肽结构域，其中有4个具有适当间隔的残基，这4个残基是半胱氨酸或组氨酸，它们可与锌离子进行配位(综述见例如Klug和Rhodes，(1987)Trends Biochem.Sci.12：464-469(1987)；Evans和Hollenberg，(1988)Cell 52：1-3；Payre和Vincent，(1988)FEBS Lett.234：245-250；Miller等(1985)EMBO J.4：1609-1614；Berg，(1988)Proc.Natl.Acad.Sci.U.S.A.85：99-102；Rosenfeld和Margalit，(1993)J.Biomol.Struct.Dyn.11：557-570)。因此，可根据与锌离子进行配位的残基的特性对锌指结构域进行分类，例如Cys₂-His₂型、Cys₂-Cys₂型、Cys₂-CysHis型、等等。Cys₂-His₂锌指的锌配位残基的典型的间隔如下所示：

C-X_2-5-C-X₃-X_a-X₅-ψ-X₂-H-X_3-5-H，(SEQ ID NO：123)

其中ψ(psi)是一种疏水性残基(Wolfe等(1999)Avenu.Rev.Biophys.Biomol.Struct.3：183-212)，“X”代表任何氨基酸，下标的数字代表氨基酸的数目，下标的以连字符连接的两个数字代表掺入氨基酸的通常的范围。在许多锌指结构域中，最初的半胱氨酸前面的是苯丙氨酸或酪氨酸，然后是一个非半胱氨酸氨基酸。通常，插入的氨基酸折叠形成对着一α-螺旋堆积的一反向平行β-片层，不过，所述反向平行β-片层可以是短的、不理想的、或非现存的。这种折叠将锌配位侧链定位，使得它们形成一个适合与锌离子配位的四面体构象。碱基接触残基位于一对金属螯合残基之间的环区域内。

为简便起见，根据以下实例，将锌指结构域的主要DNA接触残基编号为：-1、2、3和6：

-1 1 2 3 4 5 6

C-X_2-5-C-X₃-X_a-X-R-X-D-E-X_b-X-R-H-X_3-5-H(SEQ ID NO：124)，

如上例所示，DNA接触残基是Arg(R)、Asp(D)、Glu(E)和Arg(R)。以上基序可缩写为RDER。在此，该缩写是一种简略表达方式，指的是自位于第一位半胱氨酸(上面SEQ ID NO：124的起始残基)之前的第二个残基至最末的金属螯合组氨酸(SEQ ID NO：124的最末的残基)的一个特定多肽序列。在上述基序以及其他的基序中，X_a常为芳香族氨基酸，而X_b常为疏水性氨基酸。在两种不同的序列具有同一种基序的情况中，可使用数字表示各个序列(例如RDER1或RDER2)。

在明确说明的某些情况中，4字母缩写指的是一般而言的基序。换句话说，该基序具体指出了第-1、2、3和6位的氨基酸，而其他位置可以是任何氨基酸，典型地但不一定是，一种非半胱氨酸氨基酸。可用基序前面的小写字母“m”来明确表示该缩写指的是一种基序。例如，mRDER指的是一种基序，其中R出现在位置-1，D在位置2，E在位置3，而R在位置6。

锌指DNA结合蛋白可由串联排列的3个或更多个锌指结构域组成。

锌指结构域(或“ZFD”)是一种最常见真核生物DNA结合基序，存在于自酵母到高等植物以及到人类的物种中。根据一种估计，单在人类基因组中就有至少数千种锌指结构域，可能至少4,500种。可自锌指蛋白中鉴定或分离锌指结构域。锌指蛋白的非限制性实例包括CF2-II；Kruppel；WT1；Basonuclin BCL-6/LAZ-3；红系Kruppel样转录因子；转录因子Sp1、Sp2、Sp3、和Sp4；转录阻抑子YY1；EGRI/Krox24；EGR2/Krox20；EGR3/Pilot；EGR4/AT133；Evi-1；GLI1；GLI2；GLI3；HIV-EP1/ZNF40；HIV-EP2；KR1；ZfX；ZfY；和ZNF7。

人工转录因子可包括现有锌指结构域的嵌合体。在一个实施方案中，锌指结构域的一或多种是天然存在的。US 2002-0061512、US 2003-165997和U.S.S.N.60/431,892公开了许多典型的人类锌指结构域。请同时参见下面的表6。各种结构域的结合特异性可用于设计具有特定特异性的转录因子。

表6：典型的锌指结构域

ZFD 氨基酸序列 SEQ ID NO：

CSNR1 YKCKQCGKAFGCPSNLRRHGRTH 1

DSAR2 YSCGICGKSFSDSSAKRRHCILH 2

DSCR YTCSDCGKAFRDKSCLNRHRRTH 3

QSHR2 YKCGQCGKFYSQVSHLTRHQKIH 4

QSHT YKCEECGKAFRQSSHLTTHKIIH 5

QSNR3 YECEKCGKAFNQSSNLTRHKKSH 6

QSNV2 YVCSKCGKAFTQSSNLTVHQKIH 7

QSSR1 YKCPDCGKSFSQSSSLIRHQRTH 8

RDER1 YVCDVEGCTWKFARSDELNRHKKRH 9

RDHT FQCKTCQRKFSRSDHLKTHTRTH 10

RSHR YKCMECGKAFNRRSHLTRHQRIH 11

RSNR YICRKCGRGFSRKSNLIRHQRTH 12

VSNV YECDHCGKAFSVSSNLNVHRRIH 13

VSSR YTCKQCGKAFSVSSSLRRHETTH 14

VSTR YECNYCGKTFSVSSTLIRHQRIH 15

WSNR YRCEECGKAFRWPSNLTRHKRIH 16

QSHV YECDHCGKSFSQSSHLNVHKRTH 17

RDHR1 FLCQYCAQRFGRKDHLTRHMKKS 18

DSNRa^# YRCKYCDRSFSDSSNLQRHVRNIH 19

^#表示该结构域不是天然存在的人结构域。

其他典型的锌指结构域包括具有如下基序的结构域：mCSNR、mDSAR、mDSCR、mISNR、mQFNR、mQSHV、mQSNI、mQSNK、mQSNR、mQSNV、mQSSR、mQTHQ、mQTHR、mRDER、mRDHT、mRDKR、mRSHR、mRSNR、mVSNV、mVSSR、mVSTR、mWSNR、mDGNV、mDSNR、和mRDNQ。

也可使用其他类型的DNA结合结构域，例如至少一种不同于锌指结构域的结构域。本发明使用具有不同结合特异性的核酸结合结构域的集合。已知多种蛋白结构可以高亲和力和特异性与核酸相互作用。有关识别双链DNA的结构基序的综述可参见，例如Pabo和Sauer(1992)Annu.Rev.Biochem.61：1053-95；Patikoglou和Burley(1997)Annu.Rev.Biophys.Biomol.Struct.26：289-325；Nelson(1995)Curr Opis Genet Dev.5：180-9。锌指结构域以外的核酸结合结构域的少数非限制性实例包括：同源结构域、螺旋-转角-螺旋结构域、翼状螺旋结构域和螺旋-环-螺旋结构域。

转录因子特征

除DNA结合结构域以外，转录因子还可任选地包括调节结构域、核定位信号、或其他在此所述的特征。

激活结构域。可用于本发明的转录激活结构域包括但不限于来自酵母的Gal4激活结构域和来自单纯疱疹病毒的VP16结构域。可通过将一种结构域融合于一种已知的DNA结合结构域，然后再确定与由所述已知的DNA结合结构域所识别的位点可操纵地连接的报道分子是否被所述融合蛋白激活，可由此验证该结构域激活转录的能力。

一种典型的激活结构域是来自p65的如下结构域：YLPDTDDRHRIEEKRKRTYETFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPAPQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQ(SEQ ID NO：73)

一种典型的Gal4激活结构域的序列如下：NFNQSGNIADSSLSFTFTNSSNGPNLITTQTNSQALSQPIASSNVHDNFMNNEITASKIDDGNNSKPLSPGWTDQTAYNAFGITTGMFNTTTMDDVYNYLFDDEDTPPNPKKEISMAYPYDVPDYAS(SEQ ID NO：74)

在细菌中，采用加入野生型RNA聚合酶α亚基C端结构域或α亚基C端结构域的变体的一种结构域，例如融合于一种蛋白相互作用结构域的C端结构域，可模拟激活结构域功能。

阻抑结构域。如果需要，可将阻抑结构域而不是激活结构域融合于DNA结合结构域。真核生物的阻抑结构域的实例包括来自Kid、UME6、ORANGE、Groucho和WRPW的阻抑结构域(见例如Dawson等(1995)Mol.Cell Biol.15：6923-31)。可通过将一种结构域融合于一种已知的DNA结合结构域，然后再确定与由所述已知的DNA结合结构域所识别的位点可操纵地连接的报道分子是否被所述融合蛋白阻抑，可由此验证该结构域阻抑转录的能力。

第一种典型的阻抑结构域是来自Kid蛋白的“KRAB”结构域(Witzgall R.等(1994)Proc.Natl.Acad.Sci.U.S.A.，91(10)：4514-8)：VSVTFEDVAVLFTRDEWKKLDLSQRSLYREVMLENYSNLASMAGFLFTKPKVISLLQQG EDPW(SEQ ID NO：75)

第二种典型的阻抑结构域是KOX阻抑结构域。该结构域包括来自人类Kox1蛋白的“KRAB”结构域(锌指蛋白10；NCBI蛋白质数据库AAH24182；GI：18848329)，即Kox1的2-97位氨基酸：

DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVI LRLEKGEEPWLVEREIHQETHPDSETAFEIKSSV(SEQ IDNO：72)

第三种典型的阻抑结构域是来自UME6蛋白的以下结构域：NSASSSTKLDDDLGTAAAVLSNMRSSPYRTHDKPISNVNDMNNTNALGVPASRPHSSSFPSK GVLRPILLRIHNSEQQPIFESNNSTACI(SEQ ID NO：119)

WRPW结构域是阻抑结构域的另一种实例。

其他的嵌合型转录因子包括激活结构域或阻抑结构域。当然，此类转录因子可通过替代一种结合的内源性转录因子(例如激活子或阻抑子)或者与之竞争而改变转录。

其他功能性结构域。其他功能性结构域的实例包括组蛋白修饰酶(例如组蛋白乙酰化酶或去乙酰化酶、DNA修饰酶(例如甲基化酶)，等等。

可将蛋白转导结构域融合于锌指蛋白。蛋白转导结构域使得转导结构域和所连接的多肽被摄取到细胞内。“蛋白转导结构域”或“PTD”是一种氨基酸序列，其能够穿过生物膜，特别是细胞膜。当连接了一种异源性多肽时，PTD能够增强该异源性多肽的跨生物膜转运。PTD通常共价(例如通过肽键)连接于该异源性DNA结合结构域。例如，PTD和异源性DNA结合结构域可由同一种单独的核酸分子编码，例如在同一个可读框内或在同一个基因的一或多个外显子内。典型的PTD可包括10-30个氨基酸并可形成一种两性螺旋。许多PTD是碱性的，例如包括至少4、5、6或8个碱性残基(例如精氨酸或赖氨酸)。PTD能够增强多肽转运进入缺乏细胞壁的细胞或来自特定物种的细胞，例如真核细胞，例如脊椎动物细胞，例如哺乳动物细胞，例如人类、猿、鼠、牛、马、猫或羊的细胞。

通常，通过将一种锌指蛋白的DNA结合结构域与PTD作为一个单一的多肽链而产生，由此将PTD连接于所述锌指蛋白，但也可采用其他方法与PTD发生物理学上的结合。例如，可通过非共价相互作用与PTD结合(例如使用生物素-抗生物素蛋白、螺旋-卷曲，等等)。更加典型地，可将PTD例如采用柔性接头连接于锌指蛋白。柔性接头可包括一或多个甘氨酸残基以便自由旋转。例如，可通过至少10、20或50个氨基酸将PTD与转录因子的DNA结合结构域分隔开。PTD可位于DNA结合结构域的N端或C端。

锌指蛋白也可包括多个PTD，例如多个不同的PTD或一种PTD的至少2个拷贝。

典型的PTD包括来自触角足(antennapedia)蛋白、单纯疱疹病毒VP22蛋白和HIV TAT蛋白的以下片段。

Tat。当外源性加入时，来自人免疫缺陷病毒I型(HIV-1)的Tat蛋白具有显著的进入细胞的能力(Frankel A.D.和Pabo C.O.(1988)Cell 55：1189-1193，Mann D.A和Frankel A.D.(1991)EMBOJ.10：1733-1739，Fawell等(1994)Proc.Natl.Acad.Sci.USA 91：664-668)。最小的Tat PTD包括人免疫缺陷病毒Tat蛋白的第47-57位残基。在此将这种肽序列称为“TAT”。

触角足(antennapedia)。触角足同源结构域也包括一种是PTD的肽。Derossi等(1994)J.Bio.Chem.269：10444-10450。该肽也被称为“Penetratin”。

VP22。HSV VP22蛋白也包括一种PTD。该PTD位于VP22的C端的34个氨基酸残基处。见例如Elliott和O′Hare(1997)Cell 88：223-234和U.S.6,184,038。

另一种典型的PTD是聚精氨酸序列，例如一种包括至少4、5、6或8个精氨酸残基的序列，例如5到10个精氨酸残基。

细胞特异性PTD。一些PTD对特定细胞类型或状态具有特异性。一种典型的细胞特异性PTD是美国专利申请公开文本2002-0102265描述的Hn1合成肽。Hn1被人类头颈部鳞癌细胞进行内在化，并可用于将一种人工转录因子或密切相关的序列导向癌症，例如头颈部癌症。美国专利申请公开文本2002-0102265还描述了一种通用方法，其可用于进行噬菌体展示以鉴别可作为细胞特异性PTD的其他的肽和蛋白质。有关PTD的其他信息还可参见U.S.2003-0082561；U.S.2002-0102265；U.S.2003-0040038；Schwarze等(1999)Science 285：1569-1572；Derossi等(1996)J.Biol.Chem.271：18188；Hancock等(1991)EMBOJ 10：4033-4039；Buss等(1988)Mol.Cell.Biol.8：3960-3963；Derossi等(1998)Trends in Cell Biology 8：84-87；Lindgren等(2000)Trends inPharmacological Sciences 21：99-103；Kilic等(2003)Stroke 34：1304-10；Asoh等(2002)Proc Natl Aead Sci USA 99(26)：17107-12；和Tanaka等(2003)Immunol.170(3)：1291-8。

设计新的DNA结合蛋白

在一个实施方案中，通过混合并匹配(mixing and matching)表征的锌指结构域合理地设计出锌指蛋白，以使得每一个结构域识别靶位点的一个片段。可采用例如US 2002-0061512和2003-165997所述的方法分离并表征锌指结构域。锌指结构域的模块结构有利于对其进行重排以构建新的DNA结合蛋白。天然存在的Zif268蛋白中的锌指结构域处于延DNA双链串联的位置。每个结构域独立地识别一个不同的3-4个碱基对的DNA片段。

锌指结构域数据库。可使用上述的单杂交选择系统(one-hybridselection system)为每一种可能的3或4个碱基对的结合位点或一个有代表性数量的此类位点鉴别出一或多种锌指结构域。可将这种方法得到的结果累积起来作为锌指结构域与其一或多种3或4个碱基对的结合位点之间的一系列相关性。US 2002-0061512和2003-165997提供了此类相关性的实例。

可将结果以数据库的形式储存于电脑中，例如关系数据库、电子数据表或文本文件。这样的数据库的每一个记录值与一个代表性锌指结构域相关而一个串列(string)表示所述结构域的一或多个优选的结合位点的序列。数据库记录值可包括结合各个位点的锌指结构域的相对亲和力的指标。在一些实施方案中，数据库记录值还可包括表示编码特定锌指结构域的核酸的物理位置的信息。这样的物理位置可以是，例如，存放于冰箱中的微滴定板的一个具体的孔。

数据可设置为能够被查询或筛选，例如使用SQL操作环境、脚本语言(例如PERL或MICROSOFT EXCELS宏)或一种程序语言。这样的数据库能够使得使用者鉴别出一或多个识别特定的3或4个碱基对结合位点的锌指结构域。数据库和其他信息例如可被储存于数据库服务器中，也可被设置为使用可被装置编译的指令和其他信号进行相互通信。该系统的基于计算机的方面可以数字电路运行，或以计算机硬件、软硬件结合、软件或其组合而运行。本发明的设备，例如数据库服务器，可以计算机程序产品运行，该产品可具体存入计算机可读形式存储设备中，该设备可通过可编程的处理器运行；可通过一种执行指令程序的可编程的处理器进行方法操作，以通过对输入数据进行处理并产生输出数据而进行本发明的功能。一种执行环境的非限制性实例包括运行WINDOWSXP或WINDOWS NT 4.0(Microsoft，Redmond WA)、LINUX^TM或其他操作系统的计算机。

也可在多种不同的融合蛋白中测试锌指结构域以验证其特异性。此外，仅存在少数结构域的特定结合位点可成为额外筛选的靶位。可通过对结合一种类似而又不同的位点的锌指结构域进行诱变而制备用于此类筛选的文库。用于各种可能结合位点的全部锌指结构域的矩阵是不必要的，因为结构域相对于靶结合位点可以是交错排列的，以便最佳利用现有的结构域。既可通过将结合位点解析为最有用的3或4个碱基对结合位点，也可通过改变锌指结构域之间的接头的长度，来实现这种交错排列。为了使得设计的多肽具有选择性和高亲和力，可在对所需位点具有高特异性的锌指结构域两侧放置具有高亲和力但特异性较低的其他结构域。可用US 2002-0061512和2003-165997所述的体内筛选方法测试人工装配的锌指蛋白及其衍生物在体内的功能、亲和力和特异性。类似地，这些方法可用于优化这些装配的蛋白，例如通过创建各种各样的接头组合、各种各样的锌指结构域模块、各种各样的锌指结构域组合等等的文库。

分析靶位点。将9-bp或更长的靶DNA序列解析为3-或4-bp片段。鉴别识别各种被解析为3-或4-bp片段的锌指结构域(例如自上述数据库中)。更长的靶序列，例如20bp至500bp的序列，也是适合的靶位，因为可在这些序列中鉴别9bp、12bp和15bp的亚序列。具体而言，可被解析为数据库中具有良好代表性的位点的亚序列可用作初始设计靶位。

可使用一种平分体系来估计一种特定的嵌合型锌指蛋白识别细胞内的靶位点的概率。得分可以是各个组成指对其优选亚位点的亲和力、其特异性及其在以前设计的蛋白质中获得的成功的函数。

计算机程序。可使用计算机系统和软件来访问上述计算机可读形式数据库、解析靶位点以及输出一或多种嵌合型锌指蛋白的设计。

这种技术可通过运行于可编程计算机例如移动电脑或固定电脑中的程序而实现，也可通过其他类似的具有处理器、处理器可读性存储介质以及一或多种输出装置的装置而实现。可用高水平程序性或目标定向性程序语言运行各种程序以便与计算机系统通信。一些例证性的计算机语言的实例包括C、C++、JAVA、Fortran和VISUAL BASIC。

可将各个此类程序存储于一种存储介质或设备中，例如只读存储器光(CD-ROM)、硬盘、磁盘或类似介质或设备，其是普通的或用于特殊目的的可编程计算机可读的，以便当计算机读取该存储介质或设备以进行本文中所述的程序时对计算机进行设置和运行。所述系统也可作为以一种程序进行设置的、计算机可读存储介质而运行，其中所述存储介质被设置为引起计算机以特殊的重新定义的方式运行。

计算机系统可连接于内部或外部网络。例如，计算机系统可接收来自远程客户系统的请求，例如使用HTTP、HTTPS或XML规程。请求可以是一种已知的靶基因的标识或一种代表靶核酸的序列的串列。对于前一种情况，计算机系统可访问序列数据库例如GENBANK以重新获得靶基因的调节区域的核酸序列。然后将该调节区域的序列或直接收到的靶核酸序列解析为亚位点，例如如上所述设计嵌合型锌指蛋白。

系统可将结果传给远程客户。或者，系统可控制机器人以物理性重新获得编码嵌合型锌指蛋白的核酸。在这种实施方案中，构建并存储编码嵌合型锌指蛋白的核酸文库，其形式例如为冷冻的纯化DNA或冷冻的携带所述核酸的菌株。机器人通过访问指明的文库的地址而应答来自计算机系统的信号。然后可对重新获得的核酸进行处理、包装并输送给客户。或者，可将重新获得的核酸导入细胞并分析。然后计算机系统可将分析结果通过网络传给客户。

自选定的模块构建蛋白质。一旦设计出含有多个锌指结构域的嵌合型多肽序列，即可合成编码所设计的多肽序列的核酸序列。构建合成基因的方法是本领域的常规技术。此类方法包括来自定制合成的寡核苷酸、PCR介导的克隆以及Mega-primer PCR的基因构建。在一个实例中，连续连接编码选定的锌指结构域的核酸以形成一种编码嵌合型多肽的核酸。可将其他的序列连接于编码所设计的多肽序列的序列。所述其他序列自身可提供调节功能或能够编码一种具有所需功能的氨基酸序列。

分析嵌合型锌指蛋白的调节特性

可表征嵌合型锌指蛋白以确定其调节细胞内例如哺乳动物细胞内的一或多种内源性基因的能力。首先将编码嵌合型锌指蛋白的核酸融合于一种阻抑或激活结构域，然后将其导入感兴趣的细胞中。适当孵育并诱导所述编码核酸表达后，自细胞收集mRNA，并以核酸微阵列进行分析。

可通过多种方法核酸微阵列，例如光刻法(见例如美国专利No.5,510,270)、机械方法(例如美国专利No.5,384,261所述的方法)和基于针的方法(例如美国专利No.5,288,514所述)。通过在各个位置使用独特的捕获探针而合成阵列，各个捕获探针适合用于检测特定表达基因的核酸。

可通过常规方法分离mRNA，例如包括DNase处理以去除基因组DNA以及与偶联于固相基质的寡dT杂交(例如见Current Protocols inMolecular Biology，John Wiley & Sons，N.Y)。洗涤基质并洗脱mRNA。任何对分离的mRNA进行逆转录并任选地进行扩增，例如通过rtPCR，例如见美国专利No.4,683,202所述。可在扩增或逆转录过程中对核酸进行标记，例如通过掺入标记的核苷酸。优选的标记物的实例包括荧光标记物，例如红色荧光染料Cy5(Amersham)或绿色荧光染料Cy3(Amersham)。或者，可用生物素标记核酸，并在杂交后用标记的链霉抗生物素蛋白检测，例如链霉抗生物素蛋白-藻红蛋白(Molecular Probes)。

然后将标记的核酸与阵列接触。此外，可将对照核酸或参比核酸与同一阵列接触。可用不同于样品核酸的标记物对所述对照核酸或参比核酸进行标记，例如一种最大发射值不同的标记物。将标记的核酸与阵列在杂交条件下接触。洗涤阵列，然后成像以检测阵列的各个位置的荧光。

用于产生并评估模式(profiles)的通用方案包括检测阵列的各个位置的杂交。在某个位置的杂交程度以数值代表并储存于，例如向量、一维矩阵或一维阵列。向量x对阵列的各个位置具有一个值。例如，将代表特定位置的杂交程度的数值储存为变量X_a。可对数值进行调整，例如根据局部的背景水平、样品量和其他变量。自对照样品制备核酸并与同一或不同的阵列进行杂交。向量y的构建方法与向量x相同。可将样品表达模式与对照模式进行比较，例如使用作为这两个向量的函数的数学方程式。可将比较评估为一种分级数值，例如一种代表两个模式之间的相似性的评分。可通过矩阵对两种向量之一或两者进行转化，以便给由阵列检测的不同基因加权。

表达数据可存储于数据库中，例如一种关联数据库如SQL(例如Oracle或Sybase数据库环境)。数据库可具有多个表格。例如，原始表达数据可存储于一个表格中，其中各列对应于一种被分析的基因，例如位置或阵列，而各行对应于样品。独立的表格可存储标识和样品信息，例如所使用的阵列的批号、日期以及其他质控信息。

可通过对表达数据聚类来鉴别以相似方式受到调节的基因，以鉴别受到共调节的基因。这种聚类可代表被嵌合型锌指蛋白协调调节的一组基因。对基因聚类的方法可使用登记聚类(见例如Sokal和Michener(1958)Univ.Kans.Sci.Bull.38：1409)、Bayesian聚类、k-平均值聚类以及自组织图谱(self-organizing maps)(见Tamayo等(1999)Proc.Natl.Acad.Sci.USA 96：2907)。

可确定样品表达模式与对照表达模式(例如一种对照细胞)之间的相似性，例如通过将样品表达水平的对数值与预测值或对照表达值的对数值进行比较，并通过对模式中所有基因的预测值的因子进行加权而对比较进行调整。

设计出的转录因子的其他特征

肽接头。DNA结合结构域可通过各种接头进行连接。接头的使用和设计是本领域已知的。一种特别有用的接头是由核酸编码的肽接头。因此可以构建一种合成基因，其编码一种第一DNA结合结构域、肽接头以及一种第二DNA结合结构域。可重复进行这种设计以便构建大的、合成的、多结构域的DNA结合蛋白。PCT WO 99/45132和Kim和Pabo((1998)Proc.Natl.Acad.Sci.USA 95：2812-7)描述了如何设计适合用于连接锌指结构域的肽接头。

还有形成随机卷曲、α-螺旋或β-折叠三级结构的肽接头。本领域已知形成合适的柔性接头的多肽(见例如Robinson和Sauer(1998)Proc NatlAcad Sci USA.95：5929-34)。柔性接头典型地包括甘氨酸，因为这种氨基酸缺乏侧链，具有自由旋转的特性。可在接头中添加丝氨酸或苏氨酸以增加亲水性。此外，可使用能够与DNA的磷酸主链相互作用的氨基酸以增加亲和力。合理使用此类氨基酸能够使得在增加亲和力与降低向量特异性之间达到平衡。如果需要接头具有刚性伸展性，可使用α-螺旋接头，如螺旋接头，见Pantoliano等(1991)Biochem.30：10117-10125。也可通过计算机建模而设计接头(见例如美国专利No.4,946,778)。用于分子建模的软件是商品化的(例如来自Molecular Simulations，Inc.，San Diego，CA)。接头任选地是优化的，以便例如降低抗原性和/或增加稳定性，这可采用蛋白质工程领域常规使用的标准诱变技术和适当的生物物理学测试以及本申请提及的能够分析。

在使用锌指结构域的实施方式中，可使用天然存在于锌指之间的肽作为接头将指连接在一起。一个典型的这种天然存在的接头是：Thr-Gly-(Glu或Gln)-(Lys或Arg)-Pro-(Tyr或Phe)(SEQ ID NO：125)。

二聚化结构域。另一种连接DNA结合结构域的方法是使用二聚化结构域，特别是异二聚化结构域(见例如Pomerantz等(1998)Biochemistry37：965-970)。在这种实施方案中，DNA结合结构域存在于不同的多肽链中。例如，一种第一多肽编码DNA结合结构域A、接头和结构域B，而一种第二多肽编码结构域C、接头和结构域D。本领域人员能够自多种充分表征的二聚化结构域中选择二聚化结构域。如果不需要同源二聚体，可使用趋向于异二聚化的结构域。一种特别具有适应能力的二聚化结构域是卷曲螺旋基序，例如二聚体平行或反向平行卷曲螺旋。也存在优先形成异二聚体的卷曲螺旋序列(Lumb和Kim，(1995)Biochemistry 34：8642-8648)。另一种是其中二聚化可被小分子或被信号事件触发的二聚化结构域。例如，二聚体形式的FK506可用于使两个FK506结合蛋白(FKBP)结构域发生二聚化。此类二聚化结构域可用于提供额外的调节水平。

功能分析和用途

可使用无细胞分析和细胞内分析来评估锌指蛋白。无细胞分析的实例包括那些评估至少部分纯化的蛋白质的生物化学特性的分析，例如在体外评估DNA结合。体外分析的有用的实例包括电泳迁移率改变分析(EMSA)、DNA足迹分析、DNA甲基化保护分析、表面等离子体共振(surface plasmon resonance)、荧光偏振和荧光共振能量转移(FRET)。可使用细胞内分析或在体内(例如在生物体内)分析结合以及其他功能特性。

例如，可选择结构域以结合靶位点，例如一种调节细胞增殖的基因的启动子位点。通过模块装配，设计出的蛋白质可包括(1)选择分别结合跨越靶启动子位点的亚位点的结构域，和(2)转录调节结构域，例如激活结构域或阻抑结构域。在一个实例中，所述蛋白质调节一种调节细胞增殖的基因，且所述蛋白质预期对抗细胞增殖，在该实例中，可根据以下情况选择适当的转录调节结构域，即该基因是增强细胞增殖(例如选择阻抑结构域)还是降低细胞增殖(例如选择激活结构域)。在另一个实例中，筛选编码随机组合的锌指结构域的文库以鉴别改变一种表型的嵌合型锌指蛋白。

可将编码嵌合型锌指蛋白的核酸序列克隆入一种表达载体中，例如诱导型表达载体，见Kang和Kim，(2000)J Biol Chem 275：8742。诱导型表达载体可包括诱导型启动子或调节序列。诱导型启动子的非限制性实例包括类固醇激素应答启动子(例如蜕皮激素应答启动子、雌激素应答启动子和糖皮质激素应答启动子)、四环素“Tet-On”和“Tet-Off”系统和金属应答启动子。可将构建体转染入组织培养细胞或胚胎干细胞中产生转基因生物体作为模型对象。可通过在组织培养细胞诱导表达所述蛋白质并分析细胞增殖情况或在转基因动物模型中分析发育改变和/或肿瘤的生长而确定所述嵌合型锌指蛋白的功效。此外，可通过常规方法检测mRNA而分析靶基因的表达水平，例如RT-PCR或Northern印迹。更加完整的诊断包括自表达和不表达所述嵌合型锌指蛋白的细胞中纯化mRNA，将这两个mRNA库用于含有针对大量基因集合的探针的微阵列进行探查，所述基因集合例如是与感兴趣的情况(例如癌症)有关的基因的集合或者是在所述生物体基因组中鉴别出的基因的集合。该分析对于确定所述嵌合型锌指蛋白的特异性特别有价值。如果蛋白质具有高亲和力但特异性极低，其可能会通过影响除预期基因以外的其他基因的表达而引起多效性效应和非所欲的效应。可通过对转录产物进行全面分析而发现此类效应。

此外，可在对象细胞内或对象生物体内产生所述嵌合型锌指蛋白以便调节内源性基因。如上所述，嵌合型锌指蛋白被构建为可结合内源性基因的一个区域并提供转录激活或阻抑功能。如Kang和Kim(见上)所述，编码所述嵌合型锌指蛋白的核酸的表达可以可操纵地连接于一种可调节启动子(例如诱导型或抑制型启动子)。通过调节一种能够调节所述启动子的药剂的浓度，例如所述启动子的一种诱导物，可以浓度依赖性方式调节该内源性基因的表达。

可通过生化分析来验证锌指蛋白对结合位点的偏向性，例如通过EMSA、DNase足迹分析、表面等离子体共振、SELEX或柱结合。用于结合的底物可以是，例如涵盖靶位点或限制性片段的合成的寡核苷酸。该分析还可包括将非特异性DNA作为竞争剂或将特异性DNA序列作为竞争剂。特异性竞争剂DNA可包括用于结合DNA的具有1个、2个或3个核苷酸突变的识别位点。因此，生化分析不仅可用于测量一种结构域与一个特定位点的亲和力，也可用于测量相对于其他位点而言其与该位点的亲和力。Rebar和Pabo，(1994)Science 263：671-673描述了一种用于自EMSA获得锌指结构域的表观Kd常数的方法。典型的锌指蛋白对一个特定的识别位点所具有的偏向性，相对于具有1个、2个或3个核苷酸突变的有关位点来说，至少达到2、5、10、50、100或500倍。

也可在例如体外或体内评估在此所述的蛋白质或核酸的生物学活性，例如调节内皮细胞或调节血管发生的能力。

内皮细胞增殖。可使用生物学活性分析来测试蛋白质或核酸的内皮细胞增殖抑制活性，例如使用牛毛细血管内皮细胞增殖分析、鸡CAM分析、小鼠角膜分析，也可评估所测试的蛋白质或核酸对移植的肿瘤的作用。鸡CAM分析见例如O′Reilly等在“Angiogenic Regulation of MetastaticGrowth”Cell，vol.79(2)，Oct.21，1994，pp.315-328中所述。简言之，自卵中分离具有完整卵黄的3天大的鸡胚并置于培养皿中。孵育3天后，将含有待测蛋白质的甲基纤维素盘加于各个胚胎的CAM。孵育48小时后，观察胚胎和CAM以确定内皮细胞生长是否被抑制。小鼠角膜分析涉及在小鼠角膜植入含生长因子的小球以及另一种含有疑似内皮细胞生长抑制剂的小球，并观察角膜上的复杂毛细血管的模式。

血管发生。可例如使用各种人类内皮细胞系统分析血管发生，例如使用脐静脉、冠状动脉或真皮细胞。合适的分析包括基于Alamar Blue的分析(来自Biosource International)来测定增殖；使用荧光分子的迁移分析，例如使用Becton Dickinson Falcon HTS FluoroBlock细胞培养物插入物以测量在存在或不存在血管发生增强剂或抑制剂的情况下细胞的跨膜迁移；以及基于内皮细胞在Matrigel^TM(Becton Dickinson)上形成管状结构的小管形成分析。

细胞粘附。细胞粘附分析测量的是在存在或不存在待测蛋白质或核酸的情况下，细胞与纯化的粘附蛋白之间的粘附或细胞彼此之间的粘附。细胞-蛋白质粘附分析测量的是药剂调节细胞与纯化蛋白质的粘附的能力。例如，产生重组蛋白质，在PBS中稀释至2.5g/mL，并用于包被微滴定板的孔。用于阴性对照的孔没有包被。然后洗涤包被的孔，以1％BSA封闭，再次洗涤。将化合物稀释至终末测试浓度的2倍，并加至封闭的并洗涤过的孔中。然后将细胞加至这些孔中，并洗去未结合的细胞。通过加入膜透过性荧光染料在培养皿上对剩下的细胞进行标记，例如Calcein-AM，并使用荧光微滴定板阅读器进行定量。

细胞-细胞粘附分析可用于测量待测蛋白质或核酸的调节细胞彼此结合的能力。这些分析可使用天然表达或重组表达所选的粘附蛋白的细胞。在一个典型的分析中，将表达细胞粘附蛋白的细胞连同其他细胞(更低的同一种细胞类型或所述细胞与之粘附所另一种细胞类型)接种于多孔板中。以膜透过性荧光染料例如BCECF标记能够粘附的细胞，并在存在待测蛋白质或核酸的情况下使得细胞能够与单层发生粘附。洗去未结合的细胞，并使用荧光板阅读器来检测结合的细胞。高通量细胞粘附分析也已经被公开，例如见Falsey JR等Bioconjug Chem.May-June 2001；12(3)：346-53。

小管形成(Tubulogenesis)。小管形成分析可用于监测培养细胞，通常是内皮细胞，在一般性模拟细胞外基质环境的基质底物上形成管状结构的能力。典型的基质底物包括Matrigel^TM(Becton Dickinson)，其是基底膜蛋白的一种提取物，含有层粘连蛋白、IV型胶原和肝素硫酸蛋白多糖，在4℃时为液体，在37℃时形成固态凝胶。其他合适的基质包括细胞外成分例如胶原蛋白、粘连蛋白和/或纤维蛋白。以促血管发生刺激物刺激细胞，并通过成像测定其形成小管的能力。通常在与刺激物孵育过夜后可检测到小管，但也可使用更长或更短的时间。管形成分析的方法时本领域已知的(例如Jones MK等，1999，Nature Medicine 5：1418-1423)。这些分析常规涉及以血清或以生长因子FGF或VEGF进行刺激。在一个实施方案中，以培养于无血清培养基中的细胞进行分析。在一个实施方案中，在存在一或多种促血管发生药剂的情况下进行分析，例如存在炎性血管发生因子如TNF-α或FGF、VEGF、乙酸肉豆蔻佛波醇(PMA)、TNF-α、ephrin、等等。

细胞迁移。内皮细胞迁移的典型分析是人微血管内皮细胞(HMVEC)迁移分析。见例如Tolsma等(1993)J.Cell Biol 122，497-511。迁移分析方法是本领域已知的(例如Paik JH等2001，J Biol Chem 276：11830-11837)。在一个实例中，将培养的内皮细胞接种于基质包被的多孔薄层上，其孔径通常小于一般细胞的大小。薄层通常是一种膜，例如Transwell聚碳酸酯膜(Corning Costar Corporation，Cambridge，Mass.)，并且通常是上层小室的一部分，上层小室与含有促血管发生刺激物的下层小室之间通过液体相接触。通常在与刺激物孵育过夜后对迁移进行分析，但也可以使用更长或更短的时间。可以穿过薄层的细胞的数量来评估迁移，可通过以苏木精溶液(VWR Scientific.)染色细胞或通过任何测定细胞数的其他方法而检测。在另一个典型的方法中，将细胞进行荧光标记并通过荧光读数测定迁移，例如使用Falcon HTS FluoroBlok(BectonDickinson)。尽管在缺乏刺激物时可观察到一定程度的迁移，但促血管发生因子显著增强迁移。这种分析方法可用于测试待测蛋白质或核酸对内皮细胞迁移的影响。

芽生分析(Sprouting assay)。典型的芽生分析是一种三维体外血管发生分析，其使用了包埋于基于胶原蛋白凝胶的基质中的细胞数限定的球状聚集的内皮细胞(“球状体(spheroid)”)。球状体可作为一种起始点，毛细血管样结构通过侵入细胞外基质而芽生(称为“细胞芽生”)，随后形成复杂的网状吻合(Korff和Augustin，1999，J Cell Sci 112：3249-58)。在一个典型的实验模型中，通过将400个人类脐静脉内皮细胞移入非粘附性96孔板的各个孔中，使之过夜形成球状聚集而制备球状体(Korff和Augustin：J Cell Biol 143：1341-52，1998)。收集球状体并接种于900μl的甲基纤维素-胶原蛋白溶液中，并移入24孔板的各个孔中以发生胶原蛋白凝胶聚合作用。30分钟后加入测试药剂，具体为将100μl的10倍浓度的测试物质的工作液加至凝胶上。将培养板在37℃孵育24小室。在实验孵育阶段的最后加入多聚甲醛以固定培养板。可通过自动化影像分析系统定量内皮细胞的芽生密度以确定每个球状体的累积芽生长度。

其他典型的的分析包括：Ferrara和Henzel(1989)Nature 380：439-443；Gospodarowicz等(1989)Proc.Natl.Acad.Sci.USA，86：7311-7315；和Claffey等(1995)Biochim.Biophys.Acta.1246：1-9.；Leung等(1989)Science 246：1306-1309；Rastinejad等(1989)Cell 56：345-355；和US 5,840,693。可例如采用大鼠后肢缺血模型(见例如Takeshita，S.等Circulation(1998)98：1261-63来评估一种组合物调节缺血的能力。

基因调节的靶位

靶基因可以是任何基因。例如染色体基因或异源性基因(例如转基因)。靶基因可以是选定的，例如如果调节(例如增强或减弱)靶基因的活性是有益的。例如，可阻抑病原体所需的基因，可阻抑癌细胞生长所需的基因，可激活或过表达那些弱表达的基因或编码不稳定蛋白的基因，可激活赋予应激抗性的基因，等等。

特异性靶基因的实例包括编码如下产物的基因：细胞表面蛋白(例如糖基化的表面蛋白)、癌相关性蛋白、细胞因子、趋化因子、肽类激素、神经递质、细胞表面受体(例如细胞表面受体激酶、七重跨膜受体、病毒受体和共受体、细胞外基质结合蛋白、细胞结合蛋白、病原体抗原(例如细菌抗原、疟原虫抗原，等等)。其他的蛋白靶位包括酶，例如烯醇酶、细胞色素P450、酰基转移酶、甲基化酶、TIM桶酶(TIM barrel enzymes)、异构酶、酰基转移酶、等等。

更多的实例包括：整联蛋白、细胞粘附分子或“CAM”(如钙粘附蛋白(cadherins)、选择素、N-CAM、E-CAM、U-CAM、I-CAM等等)；蛋白酶(例如枯草杆菌蛋白酶、胰蛋白酶、糜蛋白酶；纤溶酶原激活物如尿激酶或人类组织型纤溶酶原激活物)；蛙皮素(bombesin)；因子IX、凝血酶；CD-4；血小板衍生的生长因子；胰岛素样生长因子-I和-II；神经生长因子；成纤维细胞生长因子(如aFGF和bFGF)；表皮生长因子(EGF)；VEGF(例如VEGF-A)；转化生长因子(TGF例如TGF-α和TGF-β)；胰岛素样生长因子结合蛋白；促红素；血小板生成素；粘液素；人血清白蛋白；生长激素(例如人生长激素)；胰岛素原、胰岛素A链、胰岛素B链；甲状旁腺素；促甲状腺激素；甲状腺素；卵泡刺激素；降钙素；心钠肽A、B或C；促黄体生成激素；胰高血糖素；因子VIII；造血生长因子；肿瘤坏死因子(如TNF-α和TNF-β)；脑啡肽酶；Mullerian抑制物；促性腺激素相关肽；组织因子蛋白；抑制素；Activin；血管内皮细胞生长因子；激素或生长因子受体；类风湿因子；骨诱导因子；干扰素如干扰素-α、β、γ；集落刺激因子(CSF)，例如M-CSF、GM-CSF和G-CSF；白介素(IL)，例如IL-1，IL-2，IL-3，IL-4，等等；衰变加速因子；和免疫球蛋白。在一些实施方案中，靶基因编码一种与疾病有关的蛋白或其他因子(例如RNA)，所述疾病例如为癌症、感染性疾病、炎症或心血管疾病。

在一个实施方案中，建议是人类疾病基因。例如，基因包括编码缺陷型或弱化的酶的突变，或者基因在调节序列(例如转录、翻译或剪切调节序列)中可具有缺陷。可获得增强所述基因表达的锌指蛋白。

例如，锌指蛋白可设计为与FGF基因相互作用，例如与图2A-F所示序列中的结合位点相互作用，或与肝细胞生长因子(HGF)基因相互作用，例如与图3A-E所示序列中的结合位点相互作用。例如，所述蛋白可与这些基因的启动子区域相互作用。

调节任何基因的嵌合型锌指蛋白均可设计为与一或多个靶位点相互作用。例如，靶位点可位于基因的编码或非编码区域。在一个实施方案中，靶位点位于调节区域，例如转录调节区域，例如启动子。在一个实施方案中，靶位点位于转录起始位点、DNase高敏位点或转录因子结合位点的700、500、300、200、50、20、10、5或3个碱基对的范围内。在靶基因是VEGF-A的实施方案中，结合位点可不同于WO 02/46412表2或3中的位点(例如不与之重叠)。在另一个实施方案中，结合位点不与该位点重叠。

基于基因和细胞的治疗

可将编码嵌合型锌指蛋白的DNA插入用于基因治疗的各种DNA构建体和载体中。在此，“载体”是一种能够转运与之共价连接的另一种核酸分子的核酸分子。载体包括质粒、粘粒、人工染色体、病毒元件和RNA载体(例如基于RNA病毒基因组)。载体能够在宿主细胞中复制或整合入宿主DNA。病毒载体包括，例如复制缺陷型逆转录病毒、腺病毒和腺伴随病毒。

基因治疗载体是一种设计用于施用于对象的载体，例如哺乳动物，如此使得该对象的细胞能够表达该载体所含的治疗性基因。基因治疗载体可含有调节元件，例如5′调节元件、增强子、启动子、5′非翻译区、信号序列、3′非翻译区、聚腺苷酸化位点和3′调节区域。例如，5′调节元件、增强子或启动子可调节编码治疗性多肽的DNA的转录。调节可以是组织特异性的。例如，调节可将所需基因的转录限制于脑细胞，例如皮质神经元或神经胶质细胞；造血细胞；或内皮细胞。或者，可引入应答于外来药物的调节元件，所述药物例如为类固醇、四环素等等。因此，可控制治疗性锌指蛋白(例如调节VEGF的多肽)的表达水平和时序。

用于输送的基因治疗载体可被制备为裸核酸、病毒成分或灭活的病毒或脂质体成分或其他输送运载工具的形式。见例如US 2003-0143266和2002-0150626。在一个实施方案中，核酸被制成脂质-蛋白质-糖的基质以形成微颗粒，例如其直径在50nm至10微米之间。可使用任何已知的脂质(例如二棕榈酰卵磷脂，DPPC)、蛋白质(例如白蛋白)或糖(例如乳糖)来制备所述颗粒。

可通过病毒相同输送基因治疗载体。典型的病毒载体包括来自逆转录病毒的载体，例如Moloney逆转录病毒、腺病毒、腺伴随病毒和慢病毒，例如单纯疱疹病毒(HSV)。例如HSV可潜在用于感染神经系统细胞。见例如US2003-0147854，2002-0090716，2003-0039636，2002-0068362，和2003-0104626。可自产生建议输送系统的重组细胞制备基因输送剂例如病毒载体。

基因治疗载体可施用于对象，例如，通过静脉注射、局部施用(见美国专利5,328,470)或立体定向注射(stereotactic injection)(见例如Chen等(1994)Proc.Natl.Acad.Sci.USA 91：3054-3057)。基因治疗剂可进一步配制为，例如，通过缓释基质的方式用于减慢或延迟药剂的释放。提供重组锌指蛋白的一种方法是通过将基因治疗载体导入收集自对象的骨髓细胞中。例如以逆转录基因治疗载体感染这些细胞并培养于培养基中。同时，对对象进行照射以清除对象的骨髓细胞。然后给对象的骨髓补充感染的培养细胞。监测对象的恢复情况以及治疗性多肽的产生。

基于细胞的治疗方法包括将编码可操纵地连接于一种启动子的所述嵌合型锌指蛋白的核酸导入培养的细胞中。可选择嵌合型锌指蛋白以调节培养细胞的内源性基因或在培养细胞中产生所需的表型。进一步地，还可采用核酸重组技术修饰细胞，例如干细胞，例如插入转基因，例如编码调节内源性基因的嵌合型锌指蛋白的转基因。可将修饰的干细胞施用于对象。体外培养干细胞的方法见例如美国专利申请2002-0081724。在一些实例中，可诱导对象的干细胞进行分化并表达所述转基因。例如，干细胞可分化为肝细胞、脂肪细胞或骨骼肌细胞。干细胞可衍生自产生所需组织类型的细胞系列，例如肝细胞、脂肪细胞或骨骼肌细胞。

在另一个实施方案中，表达或能够表达例如在此所述的嵌合型锌指蛋白的重组细胞可用于在对象中进行替代治疗。例如，将编码可操纵地连接于启动子(例如诱导型启动子，例如类固醇激素受体调节启动子)的嵌合型锌指蛋白的核酸导入人的或非人类的，例如非人类哺乳动物例如猪的重组细胞。培养该细胞并将其包囊化于生物相容性材料中，例如聚赖氨酸藻酸盐，随后植入对象。见例如Lanza(1996)Nat.Biotechnol.14：1107；Joki等(2001)Nat.Biotechnol.19：35；和U.S.5,876,742。用于包囊化细胞的其他的生物相容性聚合物的实例包括，藻酸钠、藻酸钡或纤维素硫酸钠。有益的聚合物能够使得蛋白质(例如小于70、20或10kDa的蛋白质)扩散通过。超纯材料可提高包囊化的细胞的活力并减少免疫反应。包囊化的细胞，例如包括人工转录因子并能产生扩散因子的细胞，可用于对对象进行治疗以便为对象提供所述扩散因子。

一种用于包囊化细胞和组织的典型的方法涉及采用由非纤维形成型藻酸盐形成的涂覆层，该物质是一种来自某些海藻的凝胶状物质。例如，将细胞悬浮于粘稠的液态藻酸盐中，然后将其以任何方式自动制成小滴，其大小适合对细胞进行包囊化。一旦小滴与凝胶化溶液如氯化钙或氯化钡接触，即可在细胞周围形成单层的藻酸盐涂覆层。

采用静电涂覆法产生单层藻酸盐涂覆层的方法的实例见US4,789,550、US 4,956,128、US 5,429,821、US 5,639,467、US 5,656,468和US 5,693,514。采用气刀法产生单层藻酸盐涂覆层的实例见US 5,521,079。小滴加压涂覆法见US 5,260,002和US 5,462,866。采用纺锤盘设备产生单层藻酸盐涂覆层的实例见US 5,643,594和US 6,001,387。采用压电喷嘴产生单层藻酸盐涂覆层的实例见US 5,286,496、US 5,648,099和US6,033,888。US 5,470,731和US 5,531,997描述了组织双层涂覆层，其包括由可凝胶化有机聚合物和阳离子聚合物组成的第一层以及化学结合于该第一层的水溶性、半透层的第二层。US 6,020,200描述了一种双层涂覆层，其具有由交联的聚合物基质形成的稳定的外层。US 5,227,298(Weber等)描述了双层的藻酸盐涂覆层。

可通过手术(例如腹腔镜手术或常规手术方法)或注射植入包囊化的细胞。可将细胞导入任何适当的肌体部位，包括肝脏、脾脏、胸腺、睾丸、脑、胰腺、肺、肾脏、腹腔、皮下组织、脂肪垫和其他部位。见例如J.Rozga等Intraabdominal Organ Transplantation 2000；R.G.LandesCo.，USA，1994：129。

对于调节编码分泌蛋白的内源性基因的嵌合型锌指蛋白，可通过给对象施用一种药剂(例如类固醇激素)来调节分泌多肽的产生。在另一个实施方案中，锌指蛋白的产生可置于内源性信号的控制下，例如代表分泌蛋白水平低下的信号。因此，可使用人工反馈环。例如，信号可受到分泌蛋白本身的水平调节的转录因子介导。

包囊化细胞的其他方法见例如：U.S.4,391,909；US 2002-0022016；Lohr等(2002)Cancer Chemother Pharmacol，49：S21-S24；Hobbs等(2001)Journal of Investigative Medicine，vol.49，no.6，49(6)：572-5；Zimmermann等(2001)Ann NY Acad Sci.2001；Moashebi等；Tissue Engineering，2001，vol.7，5，525-534)；Orive等(2002)Trends in Biotechnology，vol.20，382-7；Lim和Sun(1980)Science 210：908-910；Reed等2001.Nature Biotech.19：29-34；Dornish等(2001)″Standards and guidelines for Biopolymers inTissue-Engineered Medical Products：ASTM Alginate and Chitosan StandardGuides.″AnnN YAcad Sci.2001；944：388-97。

在另一个实施方案中，在体外培养表达或能够表达嵌合型锌指蛋白的重组细胞。可自细胞或自细胞周围的培养基中收集由重组细胞产生的蛋白(例如纯化的蛋白)。在另一个实施方案中，重组细胞用作饲养细胞。

药物组合物

在另一方面，本发明提供了组合物，例如药物学可接受的组合物，其包括锌指蛋白或其编码核酸，例如在此所述的分子，并与药物学可接受的载体配制在一起。

在此，“药物学可接受的载体”包括任何和所有的生理学可接受的溶剂、分散介质、涂覆层、抗细菌和抗真菌药剂、等张剂和延迟吸收剂，等等。优选地，所述载体适合静脉、肌肉内、皮下、肠外、鞘内或表皮施用(例如通过注射或输注)。根据施用途径，活性化合物可包被于一种材料中以保护该化合物免于受到酸和其他可灭活该化合物的天然条件的灭活。

“药物学可接受的盐”指的是保持了母体化合物的生物学活性且没有增加任何非所欲的毒性作用的盐(见例如Berge，S.M.，等(1977)J.Pharm.Sci.66：1-19)。此类盐的实例包括酸加成的盐和碱加成的盐。酸加成的盐包括那些衍生自非毒性无机酸的盐，例如盐酸盐、硝酸盐、磷酸盐、硫酸盐、硼酸盐、碘酸盐、亚磷酸盐等等，以及衍生自那些非毒性有机酸的盐，例如单羧基和二羧基脂肪酸盐、苯基取代的烷链酸盐、羟基烷链酸盐、芳香族酸盐、脂肪族和芳香族磺酸盐，等等。碱加成的盐包括那些衍生自碱土金属的盐，例如钠盐、钾盐、镁盐、钙盐，等等，以及那些衍生自非毒性有机胺的盐，例如衍生自N，N′-联苄基乙二胺(N，N′-dibenzylethylenediamine)、N-葡甲胺、氯普鲁卡因、胆碱、二乙醇胺、乙二胺和普鲁卡因的盐，等等。

本发明的组合物可以是各种形式。这包括，例如，液体、半固体和固体剂型，例如液体溶液(例如注射和输注溶液)、分散体或混悬液、片剂、丸剂、粉剂、脂质体和栓剂。优选的形式取决于拟采用的施用形式和治疗用途。典型的组合物的形式为可注射或可输注溶液。一种施用形式是肠外(例如静脉、皮下、腹腔内、肌肉内)。在一个实施方案中，通过静脉输注或注射施用包括锌指蛋白或其编码核酸的组合物。在另一个实施方案中，通过肌肉或皮下注射施用包括锌指蛋白或其编码核酸的组合物。

“肠外施用”和“以肠外途径施用”在此是指除胃肠和局部施用以外的其他施用方式，通常是通过注射，且包括但不限于，静脉内、肌肉内、动脉内、鞘内、囊内、框内、心内、真皮内、腹腔内、气管内、皮下、表皮下、关节内、囊下、蛛网膜下腔、软膜内、硬膜外和胸骨内注射和输注。

药物组合物通常必须是无菌的，且在生产和存储条件下是稳定的。可采用鲎阿米巴样细胞裂解试验(Limulus amebocyte lysate assay)(试剂盒例如使用Bio Whittaker lot#7L3790，敏感性0.125EU/mL)，根据USP24/NF 19的方法，测试制剂中的内毒素水平。可使用巯基醋酸盐培养基(thioglycollate medium)，根据USP24/NF 19方法，测定药物组合物的无菌性。例如，将制剂接种于巯基醋酸盐培养基并在35℃孵育14或更多天。定期观察培养基以检测微生物的生长情况。

组合物可配制为溶液、微乳剂、分散体、脂质体或其他适合高药物浓度的有序结构。可通过将所需量的活性化合物(即所述锌指蛋白或其编码核酸)根据需要掺入到具有上述成分之一或其组合的适当的溶剂中，随后过滤除菌，由此制备无菌注射液。通常，通过将活性化合物掺入含有基本分散介质和其他上述成分的无菌载体中制备分散体。对于用于制备无菌注射溶液的无菌粉剂，优选的制备方法是真空干燥和冷冻干燥，这可得到活性成分的粉剂，再加上来自之前已经无菌过滤的溶液中的其他任何所需成分。可通过例如使用涂覆层，例如卵磷脂，通过维持分散体的所需颗粒大小，并通过使用表面活性剂，来保持溶液的适当的流动性。可通过在组合物中加入延迟吸收的药剂，例如，单硬脂酸盐和凝胶，以延长注射的组合物的吸收。

可通过本领域已知的各种方法施用包括锌指蛋白或其编码核酸的组合物。对多数用途来说，施用途径/方式是静脉注射或输注。例如，对于治疗用途，可通过静脉输注施用包括锌指蛋白或其编码核酸的组合物，输注速度为低于30、20、10、5或1mg/分钟，以使得剂量达到大约1至100mg/m²或7至25mg/m²。施用途径和/或方式依所需的结果而不同。在某些实施方案中，活性化合物可与一种保护该化合物免于快速释放的载体一同制备，例如作为控释制剂，包括植入体和微包囊化的输送系统。可使用生物可降解的、生物相容性聚合物，乙烯-醋酸乙烯脂、聚酐、聚羟基乙酸、胶原蛋白、聚原酸酯(polyorthoesters)和聚乙醇酸。多种制备此类制剂的方法是已经授予专利权的或熟知的。见例如Sustained andControlled Release Drug Delivery Systems，J.R.Robinson，ed.，MarcelDekker，Inc.，New York，1978。

在某些实施方案中，组合物可口服施用，例如与惰性稀释剂或可吸收的食用载体一同施用。也可将化合物(和其他成分，如果需要)纳入硬壳或软壳凝胶胶囊、压制成片剂或直接掺入对象的饮食中。对于口服治疗施用，可将化合物掺入赋形剂，并以可食用的片剂、含片、锭剂、胶囊、酏剂、混悬液、糖浆、干胶片等等形式使用。为了通过其他胃肠外途径施用在此所述的化合物，需要以防止其失活的材料包被该化合物或与之共同施用。

可采用本领域已知的医疗装置施用药物组合物。例如，在优选的实施方案中，所述药物组合物可以一种无针头皮下注射器进行施用，所述装置例如见美国专利No.5,399,163、5,383,851、5,312,335、5,064,413、4,941,880、4,790,824，或4,596,556。可用于本发明的熟知的植入体和模块的实例包括：美国专利No.4,487,603，公开了一种植入式微输液泵，可以受控的速度给药；美国专利No.4,486,194，公开了一种治疗装置，可经皮给药；美国专利No.4,447,233，公开了一种药物输液泵，用于以精确的输液速度给药；美国专利No.4,447,224，公开了一种可变流速植入式输液装置，用于连续输送药物；美国专利No.4,439,196，公开了一种渗透式药物输送系统，具有多腔隔室；和美国专利No.4,475,196，公开了一种渗透式药物输送系统。当然，许多其他此类植入体、输送系统和模块也是已知的。

在某些实施方案中，所述化合物的配制可保证其在体内的适当分布。例如，许多高度亲水性化合物无法透过血脑屏障(BBB)。为保证治疗剂可透过BBB(如果需要)，可将其例如配制在脂质体中。生产脂质体的方法见例如U.S.4,522,811；5,374,548；和5,399,331。脂质体可包括一或多种基团，其可选择性转运入特定的细胞或器官内，由此增强靶向性药物输送(见例如V.V.Ranade(1989)J.Clin.Pharnlacol.29：685)。

调整剂量方案以产生最佳的所需反应(例如治疗反应)。例如，可施用单剂、随时间施用若干个分开的剂量、或随着治疗情况的需要将剂量成比例降低或增加。特别优选的是将胃肠外组合物配制成单位剂量的形式，以便于施用和统一剂量。单位剂量形式在此指的是物理学分开的单位，其适合作为给予治疗对象的单位剂量；每个单位含有一个预先确定量的、计算为用于产生所需治疗效应的活性化合物，以及所需的药物学载体。对单位剂量形式的说明可听从于并直接取决于(a)所述活性化合物的独特特性和要达到的具体治疗效应，以及(b)该活性化合物的复合在个体中的治疗敏感性方面的固有局限性。

所述组合物的治疗或预防有效量的典型的、非限制性范围是0.1-20mg/kg，更优选地为1-10mg/kg。可通过静脉输注施用所述组合物，速度低于30、20、10、5或1mg/分钟，以使得剂量达到大约1至100mg/m²或大约5至30mg/m²。也应该注意，剂量可随待治疗的情况的类型和严重程度而改变。还要理解，对于任何具体的对象，可根据个体的需要以及施用组合物或监测组合物的施用情况的人员的专业判断，随时调整具体的剂量方案，且在此所给出的剂量范围仅仅是典型的而不是限制性的。

药物组合物可包括“治疗有效量”或“预防有效量”的锌指蛋白或其编码核酸，例如在此所述的蛋白质或核酸。“治疗有效量”指的是，以必要的剂量和经过必要时间，有效达到所需治疗结果的量。组合物的治疗有效量可根据多种因素而不同，例如疾病状态、个体的年龄、性别和体重、以及该蛋白质在该个体中引发所需应答的能力。治疗有效量还是这样的一个量，即组合物的治疗有益作用胜于组合物的毒性或有害作用。“治疗有效剂量”是指，与未治疗的对象相比，其对一种可测量的参数(例如炎症或肿瘤生长速度)的抑制优选地达到至少大约20％，更优选地达到至少大约40％，甚至更优选地达到至少大约60％，还更加优选地达到至少大约80％。可在能够用于推测在人类肿瘤中的功效的动物模型系统中评估化合物抑制可测量参数例如癌症的能力。或者，可采用本领域人员已知的体外分析方法，通过测定所述化合物的抑制能力，来评估组合物在这方面的特性。

“预防有效量”指的是，以必要的剂量和经过必要时间，有效达到所需预防结果的量。典型地，由于预防剂量是在疾病之前或疾病早期用于对象，因此预防有效量应该低于治疗有效量。

本发明还包括试剂盒，其包括所述锌指蛋白或其编码核酸以及使用说明，例如治疗用、预防用或诊断用。在所述锌指蛋白调节VEGF-A基因的实施方案中，对治疗用途的说明包括在患有癌症或瘤形成(neoplasia)疾病或血管发生相关性疾病(例如某些炎症性疾病)的患者中的推荐剂量和/或施用方式。试剂盒还可含有至少一种额外的试剂，例如诊断剂或治疗剂，例如在此所述的诊断剂或治疗剂，和/或在一或多种分开的药物组合物中的、适当配制的一或多种额外的锌指蛋白或核酸。

治疗

可调节内源性基因的锌指蛋白，特别是可调节VEGF-A基因的蛋白，具有治疗和预防用途。例如，可将这些蛋白质或其编码核酸施用于培养的细胞，例如在体外或离体(ex vivo)，或施用于对象，例如在体内，以治疗、预防和/或诊断各种疾病，例如癌症，特别是转移癌；炎症性疾病；以及其他与血管发生增强有关的疾病。

在此，术语“治疗”被定义为，将一种能够使得锌指蛋白进入细胞并调节基因表达的药剂应用于或施用于对象，例如患者，或将该药剂应用于或施用于来自对象的分离的组织或细胞，例如细胞系，所述对象例如为患者，其患有一种疾病(例如在此所述的疾病)、一种疾病的症状或一种疾病的易患倾向，目的为治愈、医治、减轻、缓解、改变、纠正、改善、使好转或影响该疾病、该疾病的症状或该疾病的易患倾向。

在一个实施方案中，“治疗细胞”或“治疗组织”指的是降低细胞的至少一种活性，例如VEGF-A产生、血管发生刺激、增殖或细胞的其他活性，所述细胞例如为高度增殖性细胞或组织如肿瘤内部或附近的细胞。此类降低可包括细胞或组织(例如转移癌)的活性或细胞的数量或组织的大小、组织血供的量或程度的降低，例如具有统计学显著意义的降低。活性降低的实例是细胞迁移(例如迁移通过细胞外基质)的降低、血管形成的减少、或细胞分化的降低。另一个实例是直接或间接降低炎症或炎症标志物的活性。

在此，有效治疗疾病的锌指蛋白或其编码核酸的量或“治疗有效量”指的是，经单剂或多剂施用于对象，可有效地治疗细胞的所述蛋白质或核酸的量。

在此，有效预防疾病的锌指蛋白或其编码核酸的量或所述蛋白质或核酸的“预防有效量”指的是所述锌指蛋白或其编码核酸的量，经单剂或多剂施用于对象，其可有效地预防或延迟疾病的出现或复发，所述疾病例如为癌症、基于血管发生的疾病、或炎症性疾病。

在此，术语“对象”意欲包括人类和非人类动物。典型的对象包括患有以细胞增殖或细胞分化异常为特征的疾病的人。术语“非人类动物”包括所有非人类脊椎动物，例如非哺乳动物(例如鸡、两栖类、爬行类动物)和哺乳动物，例如非人类灵长类、绵羊、狗、牛、猪，等等。

在一个实施方案中，所述对象是人类对象。在一个实施方案中，可将锌指蛋白或其编码核酸的组合物施用于非人类哺乳动物(例如灵长类动物、猪或小鼠)，用于兽医学目的或作为人类疾病的动物模型。对于后者，此类动物模型可用于评估组合物的治疗功效(例如测试剂量和施用的时间过程)。

在一个实施方案中，本发明提供了治疗瘤形成疾病的方法。该方法的步骤可包括，将对象的细胞与如下量的例如在此所述的锌指蛋白或其编码核酸相接触，例如调节VEGF-A的锌指蛋白或其编码核酸，所述的量足以治疗或预防该瘤形成疾病。例如，该疾病可由癌细胞、肿瘤细胞或转移癌细胞引起。本方法可用于培养的细胞，例如在体外或离体。例如，癌细胞或转移癌细胞(例如肾脏、泌尿道上皮、结肠、直肠、肺、乳腺、子宫内膜、卵巢、前列腺或干燥的癌细胞或转移癌细胞)可体外培养于培养基中，并可通过向该培养基中添加所述锌指蛋白或其编码核酸而实现该接触步骤。该方法可在对象(例如人类对象)的细胞上进行(例如癌细胞或转移癌细胞)，作为体内(例如治疗性或预防性)方案的一部分。对于体内实施方案，可在对象内实现接触步骤，并包括将所述锌指蛋白或其编码核酸在有效允许其对所述对象的细胞中的VEGF-A基因发生调节的情况下施用于对象。

该方法可用于治疗癌症。在此，术语“癌症”、“过度增殖性”、“恶性”和“肿瘤性”可相互替代使用，指的是那些细胞的一种异常状态或状况，其特征为快速增殖或肿瘤。上述术语包括所有类型的癌性生长或致瘤过程、转移癌组织或恶性转化的细胞、组织或器官，无论其组织病理学类型或进展阶段。“病理性过度增殖”细胞出现于特征为恶性肿瘤生长的疾病状态。

术语“瘤形成(neoplasia)”的通用医学含意指的是“新细胞生长”，其引起失去对正常生长调控的反应性，例如引起肿瘤性细胞生长。“过度增生”指的是细胞经历异常快速的生长。不过，在此，术语瘤形成和过度增生可相互替代使用，如其上下文所示，其一般性地指细胞有异常的细胞生长速度。瘤形成和过度增生包括“肿瘤”，其可以是良性的、恶性前期的或恶性的。

癌性疾病的实例包括，但不限于，实体瘤、软组织肿瘤和转移性病变。实体瘤的实例包括恶性肿瘤，例如各种器官系统的肉瘤、腺癌和癌，例如累及肺、乳腺、淋巴、胃肠道(例如结肠)、以及泌尿生殖道(例如肾、膀胱上皮细胞)、咽喉、前列腺、卵巢，以及腺癌，其包括恶性肿瘤，例如大多数结肠癌、直肠癌、肾细胞癌、肝癌、非小细胞肺癌、小肠癌等等。上述癌症的转移性病变也可使用所述的方法或组合物治疗或预防。

本方法可用于治疗各种器官系统的恶性肿瘤，例如累及肺、乳腺、淋巴、胃肠道(例如结肠)、以及泌尿生殖道、前列腺、卵巢、咽喉，以及腺癌，其包括恶性肿瘤，例如大多数结肠癌、肾细胞癌、前列腺和/或睾丸肿瘤、非小细胞肺癌、小肠癌和食道癌。术语“癌症”是本领域人员所公知的，其指的是上皮或内分泌组织的恶性肿瘤，包括呼吸系统癌症、胃肠道系统癌症、泌尿生殖系统癌症、睾丸癌、乳腺癌、前列腺癌、内分泌系统癌症以及黑色素瘤。典型的癌症包括绒癌和那些自宫颈、肺、前列腺、乳腺、子宫内膜、头颈部、结肠和卵巢等组织形成的癌。该术语也包括肉瘤，例如由癌性和肉瘤样组织组成的恶性肿瘤。“腺癌”指的是来源于腺组织的癌症或其中肿瘤细胞形成可辨认的腺样结构的癌症。术语“肉瘤”是本领域人员所公知的，其指的是间叶细胞来源的恶性肿瘤。

本方法叶可用于抑制表达VEGF-A的造血细胞来源的增生性/肿瘤性细胞的增殖。

施用锌指蛋白或核酸的方法见“药物组合物”部分所述。施用的分子的合适剂量取决于对象的年龄和体重以及所用的具体药物。

锌指蛋白或其编码核酸可偶联于标记物，例如用于在输送至对象后进行成像。合适的标记物包括MRI可检测的标记物或放射性标记物。

在此所述的锌指蛋白或其编码核酸可单独施用或与一或多种现有的治疗癌症的方案组合施用，包括但不限于：手术、放疗和化疗。

锌指蛋白或其编码核酸，特别是能够调节VEGF-A基因(例如降低其表达)的锌指蛋白或其编码核酸，可单独施用或与一或多种现有的治疗炎症性疾病或病症的方案组合施用。典型的炎症性疾病或病症包括：急、慢性免疫和自身免疫病理，例如但不限于，类风湿性关节炎(RA)、青少年慢性关节炎(JCA)、银屑病、移植物抗宿主病(GVHD)、硬皮病、糖尿病、过敏；哮喘、同种异基因移植相关性急性或慢性免疫病理，例如但不限于，肾移植、心脏移植、骨髓移植、肝移植、胰腺移植、小肠移植、肺移植和皮肤移植；慢性炎症性病理，例如但不限于，结节病、慢性炎症性肠病、溃疡性结肠炎和克隆氏病；血管炎性病理，例如但不限于，播散性血管内凝血、动脉硬化、川崎病和血管炎综合征，例如但不限于，结节性多动脉炎、Wegener肉芽肿、Henoch-Schonlein紫癜、巨细胞关节炎和肾脏的显微镜下血管炎；慢性活动性肝炎；干燥综合征；牛皮癣关节炎；肠病性关节炎；反应性关节炎以及炎性肠病相关性关节炎；和葡萄膜炎。

炎性肠病(IBD)大体上包括慢性、复发性肠炎。IBD指的是两种不同的疾病克隆氏病和溃疡性结肠炎(UC)。IBD的临床症状包括间歇性便血、痉挛性腹痛、体重下降和腹泻。临床指标也可用于监测IBD，例如Clinical Activity Index for Ulcerative Colitis。参见例如Walmsley等Gut.1998 Jul；43(1)：29-32和Jowett等(2003)Scand J Gastroenterol.38(2)：164-71。

锌指蛋白或其编码核酸也可用于治疗或预防前述疾病或病症中的一种。例如，可(局部或全身)施用其量可有效减轻相应疾病或病症的至少一种症状的蛋白质。所述蛋白质可减轻炎症，例如一种炎症表现，例如局部温度、肿胀(例如根据测量)、发红、局部或全身白细胞计数、存在或不存在中性粒细胞、细胞因子水平，等等。可在例如施用所述蛋白质之前、过程中或之后，评估患者的一或多种炎症表现，例如上述表现。

锌指蛋白或其编码核酸，特别是能够调节VEGF-A基因(例如增强其表达)的锌指蛋白或其编码核酸，可单独施用或与一或多种现有的治疗创伤的方案组合施用，例如用于促进伤口愈合。例如，通常，VEGF-A的激活可使得新血管和毛细血管的形成增加。所述蛋白质或核酸还可用于减轻手术、烧伤、外伤、溃疡、骨折以及其他需要增强血管发生的疾病。

锌指蛋白或其编码核酸，特别是能够调节VEGF-A基因(例如增强其表达)的锌指蛋白或其编码核酸，可单独施用或与一或多种现有的治疗心血管疾病的方案组合施用，例如缺血性心脏病、外周动脉疾病或冠状动脉疾病。

下面将通过以下实施例对本发明作出更加具体的描述。不过，应该理解的是，这些实施例并非意在限制本发明的范围。

实施例1：凝胶迁移分析

本实施例提供了一种用于体外评估锌指蛋白的DNA结合特性的方法。在大肠杆菌中表达锌指蛋白，纯化后用于凝胶迁移分析。将编码锌指蛋白的DNA片段插入pGEX-4T2(Pharmacia Biotech)。在大肠杆菌菌株BL21中表达这些菌株以产生融合蛋白，其包括连接于GST(谷胱甘肽-S-转移酶)的锌指蛋白。使用谷胱甘肽亲和层析(Pharmacia Biotech，Piscataway，NJ)纯化融合蛋白，然后以凝血酶消化。凝血酶在GST部分和锌指蛋白之间裂解接头序列。

将不同量的锌指蛋白与放射性标记的探针DNA在室温下在20mMTris pH 7.7，120mM NaCl，5mM MgCl₂，20μM ZnSO₄，10％甘油，0.1％Nonidet P-40，5mM DTT，和0.10mg/mL BSA(牛血清白蛋白)中孵育1小时，然后将反应混合物进行凝胶电泳。通过PHOSPHORIMAGE^TM分析(Molecular Dynamics)对探针在凝胶中的分布进行定量。测定解离常数(Kd)(参见Rebar和Pabo(1994)Science 263：671-673)。

我们先前已经发现，在体内酵母分析中起作用的锌指蛋白也具有生化活性。一般来说，当锌指蛋白，例如具有3个锌指结构域的锌指蛋白，以低于1nM的解离常数结合于DNA序列时，其使得细胞能够在如US2002-0061512所述的酵母单杂交分析中生长，而当锌指蛋白以高于1nM的解离常数结合于DNA序列时，其不能使得细胞在该分析中生长。也可使用以高于1nM但低于50nM的解离常数结合的锌指蛋白。例如，可将其他的指添加到这些锌指中以产生更加紧密的或更加特异性的结合蛋白。

也可采用体外分析来评估一种单独的锌指结构域与一种特定的3或4个碱基对位点的结合。在一种实施方式中，在Zif268的指1和指2以及一种靶位点的情况中评估单独的锌指结构域，该靶位点包括(i)被指1和指2识别的碱基对和(ii)所述的特定的3个或4个碱基对位点。

实施例2：构建单独的3指蛋白

本实施例提供了一种用于构建编码嵌合型3指蛋白的核酸的方法。使用载体P3(Toolgen，Inc.)在哺乳动物细胞中表达嵌合型锌指蛋白。通过对pcDNA3载体(Invitrogen，San Diego CA)进行修饰而构建P3。将具有相容性突出端的合成的寡核苷酸双链体连接至经过HindIII和XhoI消化的pcDNA3载体中。该双链体含有编码血凝素(HA)标记的核酸和核定位信号。该双链体还包括BamHI、EcoRI和NotI以及BglII限制性位点和终止密码子。此外，通过使用XmaI进行消化破坏所得载体的SV40来源的XmaI位点，补平消化的限制性位点的突出末端，然后连接末端。

以下是一种典型的用于构建编码具有多个锌指结构域的嵌合型锌指蛋白的质粒的方法。首先，将编码一个单一锌指结构域的插入体插入一种携带编码一种单一锌指结构域的序列的载体(P3载体)。通过这种克隆得到编码具有两个锌指结构域的锌指蛋白的质粒。通过上述方法制备由两个锌指结构域组成的锌指结构域插入体，并将其克隆入具有1个或2个锌指结构域的AgeI/NotI线性化载体P3，以便得到含有由3个或4个锌指结构域组成的锌指蛋白基因的质粒。

然后将编码嵌合型锌指蛋白的基因克隆入预先处理的编码功能性结构域的质粒，例如p65转录激活结构域、Kid转录阻抑结构域、或KOX转录阻抑结构域。以EcoRI/NotI消化包括编码嵌合型锌指蛋白的基因的质粒，并将其连接至经同样的酶线性化的质粒。受体质粒(pLFD-p65、pLFD-KRAB、pLFD-KOX)中的克隆位点将编码锌指结构域的序列置于这样一种位置，使得由此产生的DNA结合区域位于功能性结构域的N端。所得的构建体编码一种蛋白质，其自N端至C端包括：HA-标记、核定位信号、锌指蛋白和功能性结构域。

实施例3：具有人类锌指结构域的3指蛋白的体外分析

采用一种体内表达分析来确定新的3指蛋白在体内是否具有功能。见例如，Kim和Pabo((1997)J Biol Chem 212：29795-29800)。该分析使用了一种萤光素酶报道分子构建体，其中靶位点位于与Kim和Pabo(见上)的构建体的Zif268位点的位置相当的位置处。

萤光素酶报道质粒构建自pΔS-modi，后者是一种改良型pGL3-TATA/Inr(Kim和Pabo，见上)。这些报道分子以萤火虫萤光素酶作为报道蛋白。自pΔS-modi中造成TATA盒上游的Sad位点的缺失。在转录起始位点之后插入新的Sad位点。为每一种不同的锌指蛋白制备不同的报道质粒。为了构建各种质粒，将含有推定为与特定的锌指蛋白相互作用的给定的9个碱基对结合位点的寡聚物插入质粒。以Sad和HindIII消化质粒pΔS-modi，并插入寡聚物。这一操作在自转录起始位点下游12个碱基对的位置替换了14个碱基对。将得到的报道质粒命名为p1G-ZFPID，其中ID是相应的锌指蛋白的名称。

对于一种特定的3指蛋白的体内活性分析是如下进行的。以如下4种质粒转染HEK 293细胞：14ng的表达所述特定的3指蛋白的质粒；14ng的上述报道质粒；70ng的表达GAL4-VP16的质粒；和1.4ng的表达Renilla萤光素酶的质粒。在不存在特定的3指蛋白的阻抑情况下，GAL4-VP16激活报道质粒中最小合成启动子的转录。将各种锌指蛋白的能力与其他3指蛋白进行比较。以表达Renilla萤光素酶的质粒作为转染效率的对照。

使用LIPOFECTAMINE^TM(Gibco-BRL)进行转染。当细胞在96孔板的孔中达到30-50％汇合时对细胞进行转染。将细胞孵育2天，然后收集用于进行萤光素酶分析。然后使用DUAL-萤光素酶报道分子分析系统(Promega)测定萤光素酶活性。采用观察到的Renilla萤光素酶的水平对观察到的萤火虫萤光素酶活性进行标准化。通过将在不存在锌指蛋白情况下的标准化的报道分子表达的值除以在存在锌指蛋白的情况下的标准化的报道分子表达的值来计算阻抑的程度或“阻抑倍数”。

如果在转染分析中锌指蛋白对转录造成至少2倍的阻抑，则此类锌指蛋白被分类为满足高严格性截断值，或者，如果在转染分析中锌指蛋白对转录造成1.5到2倍之间的阻抑，则此类锌指蛋白被分类为满足低严格性截断值。

实施例4：ZFP与其特异性报道分子的结合分析结果

运用凝胶迁移分析在体内分析中观察到的活性与结合亲和力之间建立关联。运用凝胶迁移分析和实施例3所述的转染分析来评估Zif268与各种靶序列的结合。在由凝胶迁移分析测定的解离常数与上述转染分析中的转录阻抑水平之间观察到了良好的关联。一般来说，以凝胶迁移分析测定，那些在转染分析中达到2倍以上的阻抑(即50％的阻抑)的锌指蛋白的解离常数低于1nM。

实施例5：表征3指蛋白

构建两种类型的“3指”嵌合型锌指蛋白。一类包括那些仅由野生型人类锌指结构域组成的嵌合型蛋白质，即与天然存在的人类锌指结构域相同的结构域。另一类包括那些包括与天然存在的锌指结构域不同的锌指结构域的嵌合型蛋白质。后一类锌指结构域通常通过对天然存在的锌指结构域进行体外诱变随后进行噬菌体展示筛选而鉴定。此类突变的结构域避免了自然进化的检验。

总共使用了36种锌指结构域、18种人类锌指结构域和18种突变的锌指结构域，组装了一组测试3指蛋白。关于突变的锌指结构域的报导见Choo和Klug(1994)Proc.Natl.Acad.Sci.USA 91：11168-11172；Desjarlais和Berg(1994)Proc.Natl.Acad.Sci.USA.91：11099-11103；Dreier等(2001)J Biol Chem.276：29466-29478；Dreier等(2000)J MolBiol.303：489-502；Fairall等(1993)Nature 366：483-487；Greisman和Pabo(1997)Science.275：657-661；Kim和Pabo(1997)J.Biol.Client.272：29795-29800；和Segal等(1999)Proc.Natl.Acad.Sci.USA 96：2758-2763。也见于US 2003-165997的表9。将编码36种结构域的核酸分别亚克隆入以EcoRI和NotI消化的P3载体，然后将得到的质粒用作构建嵌合型锌指蛋白的起始材料。

以两种不同的方法制备编码嵌合型3指蛋白的核酸。在第一种方法中，将编码所有锌指结构域的核酸随机混合，并随机选取3指构建体做进一步分析。对各个构建体进行测序以确定其编码的所述多肽的锌指结构域组成。随后，为各个随机分配的3指蛋白合成靶DNA序列。靶DNA序列基于推定的优选靶位点。将所述靶位克隆入上述萤光素酶报道分子载体。这一方法称为“锌指蛋白优先”法。

在第二种方法中，基于给定的靶DNA序列组装编码嵌合型3指蛋白的核酸。使用一种计算机运算法在锌指结构域的识别位点与靶DNA序列进行匹配。将已知基因的启动子序列用作输入靶DNA序列。筛选启动子序列以鉴别那些长度为9个核苷酸并且是可接受的靶位点的片段，以便由具有锌指结构域的集合的嵌合型3指蛋白进行识别。一旦识别，即可构建编码所述嵌合型3指蛋白的核酸。这一方法称为“靶位点优先”法。

在分析那些在碱基接触残基的第2位为天冬氨酸残基的锌指结构域时要特别考虑。此类锌指结构域包括RDER1、RDHT、RDNR、RDKR、RDTN、TDKR和NDTR。结合于DNA的Zif268的X射线共晶体结构显示，第2位的天冬氨酸可与锌指所识别的3-碱基对亚位点以外的一个碱基形成氢键。其结果是，在第2位含有天冬氨酸残基的RDER指更偏好4-碱基对位点：5′-GCG(G/T)-3′。计算机运算法解释了这一额外的特异性。随机组装的在第2位含有天冬氨酸且违反了这一4-bp位点原则的3指蛋白被排除在在此所述的其他分析以外。

总共以“锌指蛋白优先”和“靶位点优先”法构建了153种3指蛋白。采用实施例3所述的瞬时共转染分析对这些蛋白质进行测试。

153种嵌合型锌指蛋白中的31种表现出高于2倍的阻抑，高严格性标准(RF≥2；RF＝阻抑倍数)。在完全由天然存在的人类锌指结构域构建的蛋白质中，28.1％(27/96)超过了高严格性标准，而59.4％超过了低严格性标准(RF≥1.5)。在由两种天然存在的锌指结构域和一种突变的结构域构建的蛋白质中，33.3％超过了高严格性标准，而仅有20％超过了低严格性标准。

相反，在由一种人类结构域和两种突变的结构域构建的17种蛋白质中，仅有一种蛋白质(5.9％)超过了高严格性标准，且仅有两种蛋白质(11.8％)超过了低严格性标准。引人注意的是，专门由突变结构域组成的锌指蛋白无一满足阻抑分析中的高严格性标准。仅有一种此类蛋白质(4％)满足低严格性标准。这些结果说明，与突变的结构域相比，天然存在的人类锌指结构域通常是构建新的DNA结合蛋白的更好的模块。

实施例6：设计出的结合VEGF-A基因的嵌合型锌指蛋白

在本实施例中，我们设计了结合人类血管内皮细胞生长因子A(VEGF-A)基因中的DNA元件的嵌合型锌指蛋白。扫描了VEGF-A启动子的-950至+450区域以鉴别那些适合于被3指构型的锌指结构域的现有组合所识别的具有9个核苷酸的位点。

我们构建了数个编码包括被设计为用于识别此类9个核苷酸位点的结构域的锌指蛋白的DNA构建体。在大肠杆菌中表达这些蛋白质并纯化。我们采用SELEX(Systematic Evolution of Ligands by EXponentialenrichment)实验评估了其DNA结合特异性。多种被设计用于导向VEGF-A启动子的锌指蛋白表现出具有预期的DNA结合特异性。几乎所有自SELEX分析得到的共有序列均与VEGF-A基因中的预期靶序列相同。一种典型的锌指蛋白，称为F121，其具有的共有序列与预期的靶序列在相应的锌指显示出碱基识别的简并性的位置具有一个碱基的差异。

通过将编码3种锌指结构域的核酸与编码p65或VP16激活结构域的核酸进行融合，产生包括具有这些人工锌指的DNA结合结构域的转录因子。将所得核酸插入表达质粒。

图4显示了VEGF-A启动子中由这些嵌合型锌指蛋白所识别的DNA结合位点的位置。人VEGF-A启动子含有至少两个DNase I高敏区域。遗传工程化的锌指蛋白转录因子与这些位点结合可激活VEGF-A基因的表达。F480被设计为识别位于大约-633R的位点(R代表反向链)。F475被设计为识别位于大约-455的位点。F435被设计为识别位于大约-391R的位点和位于大约-90R的位点。F83被设计为识别位于大约+359的位点。F121被设计为识别位于大约+434的位点。

我们发现，无论这些结合位点的位置如何，我们所测试的4种锌指蛋白(F480、F475、F121和F435)不仅激活了置于VEGF-A启动子控制下的萤光素酶报道分子基，同时也激活了内源性VEGF-A基因本身。对得自瞬时转染的细胞的培养基进行ELISA发现，这些嵌合型锌指蛋白还将VEGF-A蛋白的产生上调了13到21倍。

当将嵌合型锌指蛋白，F435和F121，分别融合于KRAB阻抑结构域时，它们分别积极地阻抑了HEK 293细胞中VEGF-A的表达。以亲代表达载体(其不含有锌指蛋白编码序列)转染的对照细胞的VEGF-A的mRNA或蛋白水平没有出现任何增强或减弱。

在这些实验中，蛋白质F83对VEGF-A mRNA或蛋白的水平没有显示出任何影响。这可能是由于其他蛋白质与靶位点或与局部染色质结构发生结合，这可能导致锌指蛋白难以到达靶DNA。在这些锌指蛋白引起的VEGF-A表达水平与其DNA结合亲和力或其在细胞中的表达水平之间没有绝对的相关性。

为了研究锌指蛋白在整个基因组范围的特异性，我们以293细胞系进行DNA微阵列实验，所述293细胞系已经稳定转染了编码以下3种锌指转录因子之一的DNA构建体：F121-p65、F435-p65和F475-VP16。在7458种基因中，51种基因受到所有3种锌指转录激活子蛋白的调节。49种的上调超过2倍，2种的下调超过2倍。所有这些受到共调节的基因看来均与VEGF-A功能密切相关。其中许多受VEGF-A调节，与血管发生或组织缺氧有关，或表达于血管内皮细胞。因此，这些基因很可能是VEGF-A表达的下游靶基因。此外，众多其他基因受到所述锌指蛋白激活子中的一或两种的调节，但并非受到所有3种测试蛋白质的调节。由于这些锌指蛋白识别9个碱基对位点，因此，这些锌指蛋白可能直接调节VEGF-A以外的基因，例如通过结合于其他基因中的相同的或相关的靶位点。构建4、5或6指蛋白质可提高特异性。总之，这些数据说明，通过对天然存在的锌指结构域进行重新组合而组装的所述锌指蛋白在细胞中可起到特定内源性基因的转录调节子的作用。

例如，在此所述的蛋白质可调节以下基因中的一或多种：jun B原癌基因(N94468)、EphA2(H84481)、EphB4(AI261660)、成纤维细胞生长因子受体3(软骨发育不全，致死性侏儒症)(AA419620)、FK506结合蛋白8(38kD)(N95418)、蛋白激酶C，zeta(AA458993)、v-erb-b2鸟类红白血病病毒癌基因同源物3(AA664212)、凝集素、半乳糖苷结合，可溶性，1(半乳糖凝集素1(galectin 1))(AI927284)、蛋白磷酸酶2、调节亚单位B(B56)、α异构体(R59165)、胰岛素样生长因子2(生长调节素A)(N54596)、网蛋白1、中等纤维结合蛋白，500kD(AA448400)、Periplakin(AI703487)、胆碱激酶(H09959)、胶原蛋白，VI型，α1(H99676)、连接相关性蛋白复合体1(adaptor-related protein complex 1)、σ1亚基(W44558)、抑制蛋白，β2(AW009594)、GATA-结合蛋白2(H00625)、细胞周期蛋白依赖性激酶抑制剂1A(p21，Cip1)(AI952615)、有丝分裂原激活的蛋白激酶激酶激酶11(R80779)、乙酰胆碱酯酶(YT血型)(AI360141)、脑特异性Na依赖性无机磷酸共转运蛋白(AA702627)、细胞维甲酸结合蛋白1(AA454702)、胞维甲酸结合蛋白2(AA598508)、钙粘附蛋白13、H-钙粘附蛋白(心脏)(R41787)、钙通道，电压依赖型，β3亚基(R36947)、碳酸酐酶XI(N52089)、肌钙蛋白T1，骨骼肌，慢(AA868929)、γ氨基丁酸(GABA)B受体，1(N70841)、腺苷酸环化酶激活多肽1(垂体)受体I型(H09078)、溶质转运家族4，阴离子交换，成员2(红细胞膜蛋白带3样1)(W45518)、磷脂酰肌醇蛋白聚糖1(AA455896)、蛋白C抑制剂(纤溶酶原激活剂抑制剂III)(W86431)、细胞周期蛋白依赖性激酶抑制剂1C(p57，Kip2)(AI828088)、锌指蛋白43(HTF6)(AA773894)、与小鼠Zfp-36同源锌指蛋白(R38383)、Meis(小鼠)同源物3(AA703449)、SWI/SNF相关性，基质相关性，肌动蛋白依赖性染色质调节子，亚家族d，成员3(AA053810)、()、未知(R11526)、未知(AA045731)、未知(T51849)、未知(T50498)、推定的基因产物(H09111)、B/K蛋白(H23265)、损害特异性DNA结合蛋白2(48kD)(AA410404)、二氢嘧啶酶样4(AA757754)、N-甲基嘌呤-DNA糖基化酶(N26769)、蛋白酪氨酸磷酸酶，受体类型，N(R45941)、成束和延长蛋白ζ1(fasciculation and elongationprotein zeta 1)(zygin I)(H20759)、羊毛甾醇合酶(2，3-氧化鲨烯羊毛甾醇环化酶)(AA437389)、()、()、亚精胺/精胺N1-乙酰转移酶(AA011215)、和具有血小板反应蛋白1型基序的解离素样和金属蛋白酶(Reprolysintype)，1(T41173)。这些蛋白或其编码基因的表达可被调节至少0.5、1.0、2、5、10或50倍，例如，2倍和80倍之间。

VEGF启动子中的典型位点和识别这些位点的蛋白质包括：

表7：VEGF-A启动子位点(A)

蛋白质位点序列

F475 -455 GAG CGG GGA

F121 +434 TGG GGG TGA

F435 -90R GGG CGG GGA

F547 -665 AAT AGG GGG

F2825 +434 TGG GGG TGA

表8：VEGF-A启动子位点(B)

蛋白质位点序列

F480 -633R GGG TGG GGG

F435 -391R GGG TGG GGA

F2828 +435 GGG GGT GAC

F625 +435 GGG GGT GAC

F2830 +435 GGG GGT GAC

F2838 +435 GGG GGT GAC

表9：VEGF-A启动子位点(C)

蛋白质位点序列 SEQ ID NO：

F2604 -680 GTT TGG GAG GTC 76

F2605 -677 TGG GAG GTC AGA 77

F2607 -671 GTC AGA AAT AGG 78

F2615 -606 GCC AGA GCC GGG 79

F2633 -455 GAG CGG GGA GAA 80

F2634 -395R GGG GAG AGG GAC 81

F2636 -393R GTG GGG AGA GGG 82

F2644 -358R GGG GCA GGG GAA 83

F2646 -314R GAC AGG GCC TGA 84

F2650 -206 GGT GGG GGT CGA 85

F2679 +244R CAA GTG GGGAAT 86

表10：VEGF-A启动子位点(D)

蛋白质位点序列 SEQ ID NO：

F2610 -633R GGG TGG GGG GAG 87

F2612 -630R AGG GGG TGG GGG 88

F2638 -391R GGG TGG GGA GAG 89

表11：VEGF-A启动子位点(E)

蛋白质位点序列 SEQ ID NO：

F109 536B GAG CGA GCA GCG 90

F2608 -668 AGA AAT AGG GGG 91

F2611 -631R GGG GGT GGG GGG 92

F2617 -603 AGA GCC GGG GTG 93

F2619 -554 AGG GAA GCT GGG 94

F2623 -495 GTG GGT GAG TGA 95

F2625 -475 GTG TGG GGT TGA 96

F2628 -468 GTT GAG GGT GTT 97

F2629 -465 GAG GGT GTT GGA 98

F2630 -462 GGT GTT GGA GCG 99

F2634 -395R GGG GAG AGG GAC 100

F2635 -394R TGG GGA GAG GGA 101

F2637 -392R GGT GGG GAG AGG 102

F2642 -385R AGG GAC GGG TGG 103

F2643 -382R GAC AGG GAC GGG 104

F2648 -282R GAG GAG GGA GCA 105

F2651 -203 GGG GGT CGA GCT 106

F2653 -184R GAA GGG GAA GCT 107

F2654 -181R AAT GAA GGG GAA 108

F2662 -124R GCG GCT CGG GCC 109

F2667 -85 GGG CGG GCC GGG 110

F2668 -30R AAA AAA GGG GGG 111

F2673 +77 GCA GCG GTT AGG 112

F2682 +283R GGG GAA GTA GAG 113

F2689 +342 AGA GAA GTC GAG 114

F2697 +357 GAG AGA GAC GGG 115

F2699 +366 GGG GTC AGA GAG 116

F2703 -632R GGG GTG GGG GGA 117

F2702 +474R CAA GGG GGA GGG 118

构建锌指文库的酵母表达质粒

我们通过修饰pPC86(Chevray和Nathans(1992)Proc.Natl.Acad.Sci.USA 89：5789-5793)构建了编码锌指转录因子的表达质粒。将编码Zif268锌指蛋白的基因插入pPC86的SalI和EcoRI位点之间，以产生pPCFM-Zif，其中Gal4激活结构域融合于Zif268结构域。将pPCFM-Zif用作构建锌指文库的载体。为构建人的锌指文库，自人类基因组DNA扩增编码锌指的DNA片段，采用了聚合酶链反应(PCR)(Promega，Madison，WI)和具有His-Thr-Gly-Glu/Gln-Lys/Arg-Pro-Tyr/Phe序列的简并PCR引物混合物，该序列常见于天然存在的锌指蛋白的锌指连接部。SacII和AvaI消化编码锌指的100-bp PCR产物，并插入pPCFM-Zif，其编码杂合转录因子，该杂合转录因子由Zif268的指1和指2和来自人类基因组的锌指结构域组成(共同形成3指蛋白)。自总共1.2×10⁶个大肠杆菌转化体制备质粒文库。

通过将64对含有3个拷贝的9-bp靶序列的互补的寡核苷酸之一插入pRS315(His)和pLacZi(Clontech，Palo Alto，CA)而制备了报道质粒。

缺口修复克隆选自人类基因组的人类锌指结构域

按照文献所述进行编码单个锌指结构域的DNA序列的缺口修复克隆(Hudson等(1997)Genome Res.7：1169-1173)。为克隆编码锌指的DNA片段，合成了两种重叠的寡核苷酸。每种寡核苷酸在其3′端包括一种用于第二轮PCR的21-bp的通用尾部，并包括一种可与编码所述单个锌指结构域的核酸序列退火的特异性序列。以等摩尔混合物的两种相应的寡核苷酸，自人类基因组DNA扩增编码锌指的DNA序列。

将第一轮PCR的扩增产物在第二轮PCR中用作模板。第二轮PCR的引物具有两个区域，其一与pPCFM-Zif的片段相同，而另一个与所述21-bp通用尾部相同。将第二轮PCR产物与经过MscI和EcoRI消化的线性化的pPCFM-Zif的混合物转化入yW1(MATαΔgal4 Δgal80 lys2801his3-Δ200 trp1-Δ63 leu2 ade2-101CYH2)酵母菌株。以这种方法克隆了总共823个人类锌指。其中许多均被用于在此所述的我们的体内筛选系统中。

锌指结构域的体内筛选

使用酵母杂交以便鉴别结合各个3碱基对靶位点的锌指。将锌指文库导入yW1(MATα)菌株，产生大约1.47×10⁶个独立的转化酵母菌落。将测定用量的这些转化细胞与单倍体酵母菌株yW1a(MATa)在30℃杂交5小时，其在两组的每一组中均含有64种报道质粒(每种报道基因一种菌株)。报道质粒含有与LacZ或HIS3基因的编码区域邻近的3个拷贝的靶DNA序列。将得到的二倍体接种于选择培养基中，所述选择培养基含有X-gal(40μg/ml)和3-氨基三唑(3-AT)(1mM)，但不含有组氨酸。对分离自蓝色(阳性)菌落的质粒进行再次转化以确认结果，并测序以鉴别其编码锌指结构域。在酵母中使用EMSA确定融合于Zif268的指1和指2的各个锌指的结合亲和力和特异性。方法如下所述。

将选定的锌指用作模块元件构建3指蛋白

使用修饰的pcDNA3(Invitrogen，Carlsbad，CA)载体(P3)作为用于在哺乳动物细胞中表达锌指蛋白的亲代载体。P3含有HA标记和核定位信号，两种均插入到起始密码子的3′。将编码各种锌指结构域的DNA片段亚克隆入P3载体的EcoRI和NotI位点之间，所得到的质粒用作构建嵌合型锌指蛋白的原料。通过两种不同的方法制备3指蛋白。在第一种方法中，混合所有的锌指并随机选择组装的3指构建体做进一步的分析。在第二种方法中，新的3指蛋白被设计为导向特异性DNA序列。为此，我们使用了一种简单的计算机运算法，其可发现锌指识别位点和靶DNA序列之间的匹配。我们使用已知基因的启动子序列作为输入DNA序列，并鉴别了3指蛋白，其应该结合于输入序列内部的9碱基对DNA元件。

以这种方法构建导向VEGF-A基因的锌指蛋白。测试构建的锌指蛋白在哺乳动物细胞中的DNA结合能力和亲和力，方法如文献所述。Kim和Pabo(1997)J.Biol.Chem.272，29795-29800；Kim和Pabo(1998)Proc.Natl.Acad.Sci.USA 95，2812-2817；和Kang和Kim(2000)J.Biol.Chem.275：8742-8748。使用携带萤火虫萤光素酶基因作为报道基因的pGL3-TATA/Inr构建用于分析的报道质粒。

为了将功能性结构域连接于锌指蛋白，使用特异性寡聚物对，通过PCR扩增p65(氨基酸288-548)和VP16(氨基酸413-490)的转录激活结构域，且将p65和VP16的PCR产物分别克隆入P3，以分别产生pLFD-p65和pLFD-VP16。将编码导向VEGF-A启动子的锌指蛋白的核酸插入pLFD-p65或VP16以表达锌指蛋白激活结构域(AD)融合蛋白(ZFP-AD)。进行实时PCR、ELISA和微阵列分析以确定这些ZFP-AD是否激活VEGF-A基因。此外，进行SELEX以测试这些蛋白是否识别适当的靶DNA序列。如下述。

人类锌指结构域的结合亲和力和特异性

自蓝色酵母菌落分离的质粒(见标题为“锌指结构域的体内筛选”一节)单独转化入yW1细胞。对于各个分离的质粒，将再次转化的yW1细胞与yW1a细胞杂交，yW1a细胞含有64种LacZ报道质粒中的每一种。然后将得到的细胞接种于含有X-gal和组氨酸但缺乏色氨酸和尿嘧啶的最基本培养基中。我们使用GEL-DOC^TM系统(Bio-Rad，Hercules，CA)测量了各个菌落的蓝色的强度，以确定融合于Zif268的指1和指2的各种锌指结构域的DNA结合亲和力和特异性。以Zif268蛋白进行的对照实验表明，锌指结构域与LacZ报道基因的启动子的靶结合位点之间的阳性相互作用产生深蓝色至浅蓝色的菌落(兰色的强度与结合亲和力成正比)，而阴性相互作用产生白色菌落。

电泳迁移率改变分析(EMSA)

通过以SalI和NotI进行消化而分离编码锌指蛋白的DNA片段，并插入pGEX-4T2(Amersham Pharmacia，Uppsala，Sweden)。将锌指蛋白作为连接于谷胱甘肽-S-转移酶(GST)的融合蛋白在大肠杆菌菌株BL21(DE3)中进行表达。以谷胱甘肽亲和层析(Amersham Pharmacia)纯化融合蛋白，然后以凝血酶消化。这一裂解切断GST部分和锌指蛋白之间的连接。在这种情况下，纯化的锌指蛋白含有融合于位置3上的选定的锌指的C端的Zif268的指1和指2。合成探针DNA，退火，使用T4多核苷酸激酶以³²p标记，如文献所述进行EMSA。Kim和Pabo(1997)J.BiolChem.272，29795-29800和Kim和Pabo(1998)Proc.Natl.Acad.Sci.USA95，2812-2817。可使用相同的过程测试其他锌指蛋白。

内源性VEGF的转录调节

人胚肾293细胞培养于Dulbecco′s modified Eagle medium(DMEM)，培养基添加了100单位/ml青霉素，100μg/ml链霉素，和10％胎牛血清(FBS)。对于萤光素酶分析，将细胞以10⁴细胞/孔在96孔板中进行预培养。使用LIPOFECTAMINE^TM转染试剂盒(Lif Technologies，Rockville，MD)，以25ng的报道质粒和25ng的编码锌指蛋白的质粒转染293细胞，在所述报道质粒中，天然的VEGF-A启动子融合于pGL3-basic(Promega)中的萤光素酶基因。孵育48小时后，以DUAL LUCIFERASE^TM试剂盒(Promega)，使用TD-20/20光度计(Turner Designs Inc.，Sunnyvale，CA)测量萤光素酶活性。

为进行逆转录酶-PCR(RT-PCR)分析和ELISA，在12孔板中，将细胞以10⁵细胞/孔在1ml的培养基(添加了10％FBS但不含抗生素)中、在含有5％CO₂的湿润空气中、在37℃预培养24小时。然后使用LIPOFECTAMINE^TM转染试剂盒(Lif Technologies)以DNA转染细胞。简言之，在总体积50μl的DMEM中，将1μg编码锌指蛋白的质粒添加到5μl Plus试剂，然后将该溶液与50μl的另一种含有2μlLIPOFECTAMINE^TM试剂的DMEM混合。孵育15分钟后，将全部100μl的混合物添加到培养板中的细胞内，然后将细胞再培养48小时。收集细胞和培养物上清液用于RT-PCR分析和ELISA。

定量RT-PCR

根据生产商(Life Technologies)的说明，自TRIZOL^TM裂解液提取细胞总RNA。以4μg总RNA进行逆转录反应，以寡dT作为针对mRNA的第一链合成引物，并使用了SUPERSCRIPT^TM第一链合成系统(LifeTechnologies)提供的MMLV逆转录酶。为定量mRNA，以VEGF-A-特异性引物扩增1μl自RT反应产生的第一链cDNA。通过使用甘油醛-3-磷酸脱氢酶(glyceraldehydes-3-phosphatedehydrogenase(GAPDH))特异性引物的特异性扩增而计算出的GAPDH mRNA浓度对RNA的最初量进行标准化。以QUANTITECT SYBR^TM试剂盒(QIAGEN，Valencia，CA)和ROTORGENE^TM 2000实时循环仪(Corbett，Sydney，Australia)对VEGF-A和GAPDH特异性cDNA的扩增进行实时监测并分析，并使用反应中所包括的标准系列稀释物随其进行定量。

ELISA

将肾293细胞培养物上清液简单离心5分钟以去除细胞和细胞碎片。使用三明治ELISA(酶联免疫吸附试验)来分析培养基(各100μl)中积聚的VEGF蛋白和重组人VEGF-A蛋白标准的稀释液，其中与所述培养物上清液发生反应的是抗人VEGF抗体(R&D systems；AF-293-NA)、生物素酰化的抗人VEGF抗体(R&D systems；BAF293)、链霉抗生物素蛋白碱性磷酸酶。抗原抗体复合物与溶解于pNPP缓冲液(Chemicon；ES011)中的pNPP(对硝基苯磷酸酯)反应。通过以POWERWAVE^TMX340(Bio-TEK Instrument Inc.，Winooski VT)所测量的405mn处的吸光度确定样品中的VEGF-A浓度。

对稳定表达锌指蛋白的FIpTRex-293细胞系DNA微阵列分析

将编码被设计为导向VEGF-A启动子的ZFP的质粒稳定转染入FlpTRex-293细胞系(Invitrogen)，基本上按照生产商的方案。简言之，来自pLFD-p65载体或pLFD-VP16载体的含有编码锌指蛋白的DNA片段的HindIII-XhoI片段被克隆入pCDNA5/FRT/TO(Invitrogen)。将所得质粒与pOG44(Invitrogen)共转染入FlpTRex-293细胞，并筛选稳定整合体。得到的细胞系经强力霉素诱导后表达ZFP-p65或ZFP-VP16。

含有7458种人表达序列标记(EST)克隆的DNA微阵列由GenomicTree，Inc.(Taejon，Korea)提供。稳定表达ZFP-p65或ZFP-VP16的FlpTRex-293细胞在含有(+Dox)或不含有(-Dox)1μg/ml强力霉素的情况下孵育48小时。自各个样品制备总RNA。将来自一种-Dox样品的RNA用作参照(Cy3)。按照生产商的方案进行微阵列实验。

装配的锌指蛋白的SELEX分析

设计一种模板寡核苷酸，其含有一种随机的20个核苷酸区域，该区域的两侧为固定序列。此外，设计两种与所述模板寡核苷酸的固定区域互补的引物，用于PCR扩增。通过Klenow片段自引物之一进行延伸，将所述模板寡核苷酸转变为双链DNA。为了富集由锌指蛋白结合的靶序列，将100μg GST-融合蛋白与10pmol双链模板DNA在100μl的结合缓冲液(25mM Hepes pH7.9，40mM KCl，3mM MgCl₂，1mM DTT)中在室温混合1小时。然后将GST-树脂(10μl)添加到混合物中。室温孵育30分钟后，以含有2.5％脱脂乳的结合缓冲液洗涤该树脂3次。

通过将树脂与100μl的1M KCl在室温孵育10分钟而使得结合的双链模板寡聚物发生解离。对收集的双链模板寡聚物进行PCR扩增后，重复进行新一轮的SELEX。这一过程被重复8次。以XhaI和BamHI消化终PCR产物，并插入至经过同样的酶消化的pBLUESCRIPT^TMKS中。确定每种锌指蛋白的至少8种单独的插入体的DNA序列。

实施例7：典型的蛋白质的序列

以下是可调节VEGF-A的典型蛋白质的DNA结合区域的氨基酸序列：

表12：典型蛋白质的DNA结合结构域的氨基酸序列

名称氨基酸序列 SEQ ID

NO：

F475 YKCGQCGKFY SQVSHLTRHQ KIHTGEKPFQ CKTCQRKFSR 20

SDHLKTHTRT HTGEKPYICR KCGRGFSRKS NLIRHQRTHT GEK

F121 YKCEECGKAF RQSSHLTTHK IIHTGEKPYK CMECGKAFNR 21

RSHLTRHQRI HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT GEK

F435 YKCGQCGKFY SQVSHLTRHQ KIHTGEKPFQ CKTCQRKFSR 22

SDHLKTHTRT HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT GEK

F547 YKCMECGKAF NRRSHLTRHQ RIHTGEKPFQ CKTCQRKFSR 23

SDHLKTHTRT HTGEKPYECD HCGKAFSVSS NLNVHRRIHT GEK

F2825 YECDHCGKSF SQSSHLNVHK RTHTGEKPFL CQYCAQRFGR 24

KDHLTRHMKK SHTGEKPFQC KTCQRKFSRS DHLKTHTRTH TGEK

F480 YKCMECGKAF NRRSHLTRHQ RIHTGEKPFQ CKTCQRKFSR 25

SDHLKTHTRT HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT GEK

F2828 YKCKQCGKAF GCPSNLRRHG RTHTGEKPYR CEECGKAFRW 26

PSNLTRHKRI HTGEKPFLCQ YCAQRFGRKD HLTRHMKKSH TGEK

F625 YKCKQCGKAF GCPSNLRRHG RTHTGEKPYR CEECGKAFRW 27

PSNLTRHKRI HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT GEK

F2830 YRCKYCDRSF SDSSNLQRHV RNIHTGEKPY RCEECGKAFR 28

WPSNLTRHKR IHTGEKPFLC QYCAQRFGRK DHLTRHMKKS

HTGEK

F2838 YRCKYCDRSF SDSSNLQRHV RNIHTGEKPY RCEECGKAFR 29

WPSNLTRHKR IHTGEKPYKC MECGKAFNRR SHLTRHQRIH TGEK

F2604 YSCGICGKSF SDSSAKRRHC ILHTGEKPYI CRKCGRGFSR 30

KSNLIRHQRT HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT

GEKPYTCKQC GKAFSVSSSL RRHETTHTGE K

F2605 YKCEECGKAF RQSSHLTTHK IIHTGEKPYS CGICGKSFSD 31

SSAKRRHCIL HTGEKPYICR KCGRGFSRKS NLIRHQRTHT

GEKPFQCKTC QRKFSRSDHL KTHTRTHTGE K

F2607 FQCKTCQRKF SRSDHLKTHT RTHTGEKPYE CDHCGKAFSV 32

SSNLNVHRRI HTGEKPYKCE ECGKAFRQSS HLTTHKIIHT

GEKPYSCGIC GKSFSDSSAK RRHCILHTGE K

F2615 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYT CSDCGKAFRD 33

KSCLNRHRRT HTGEKPYKCE ECGKAFRQSS HLTTHKIIHT

GEKPYTCSDC GKAFRDKSCL NRHRRTHTGE K

F2633 YECEKCGKAF NQSSNLTRHK KSHTGEKPYK CGQCGKFYSQ 34

VSHLTRHQKI HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT

GEKPYICRKC GRGFSRKSNL IRHQRTHTGE K

F2634 YKCKQCGKAF GCPSNLRRHG RTHTGEKPFQ CKTCQRKFSR 35

SDHLKTHTRT HTGEKPYICR KCGRGFSRKS NLIRHQRTHT

GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K

F2636 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYK CEECGKAFRQ 36

SSHLTTHKII HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT

GEKPYVCDVE GCTWKFARSD ELNRHKKRHT GEK

F2644 YECEKCGKAF NQSSNLTRHK KSHTGEKPYK CMECGKAFNR 37

RSHLTRHQRI HTGEKPYKCP DCGKSFSQSS SLIRHQRTHT

GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K

F2646 YKCEECGKAF RQSSHLTTHK IIHTGEKPYT CSDCGKAFRD 38

KSCLNRHRRT HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT

GEKPYKCKQC GKAFGCPSNL RRHGRTHTGE K

F2650 YKCEECGKAF RQSSHLTTHK IIHTGEKPYR CEECGKAFRW 39

PSNLTRHKRI HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT

GEKPYRCEEC GKAFRWPSNL TRHKRIHTGE K

F2679 YECDHCGKAF SVSSNLNVHR RIHTGEKPYK CMECGKAFNR 40

RSHLTRHQRI HTGEKPYVCD VEGCTWKFAR SDELNRHKKR

HTGEKPYVCS KCGKAFTQSS NLTVHQKIHT GEK

F2610 YICRKCGRGF SRKSNLIRHQ RTHTGEKPYK CMECGKAFNR 41

RSHLTRHQRI HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT

GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K

F2612 YKCMECGKAF NRRSHLTRHQ RIHTGEKPFQ CKTCQRKFSR 42

SDHLKTHTRT HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT

GEKPFQCKTC QRKFSRSDHL KTHTRTHTGE K

F2638 YICRKCGRGF SRKSNLIRHQ RTHTGEKPYK CGQCGKFYSQ 43

VSHLTRHQKI HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT

GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K

F109 YVCDVEGCTW KFARSDELNR HKKRHTGEKP YKCPDCGKSF 44

SQSSSLIRHQ RTHTGEKPYK CEECGKAFRQ SSHLTTHKII

HTGEKPYICR KCGRGFSRKS NLIRHQRTHT GEK

F2608 YKCMECGKAF NRRSHLTRHQ RIHTGEKPFQ CKTCQRKFSR 45

SDHLKTHTRT HTGEKPYECD HCGKAFSVSS NLNVHRRIHT

GEKPYKCEEC GKAFRQSSHL TTHKI IHTGE K

F2611 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYK CMECGKAFNR 46

RSHLTRHQRI HTGEKPYRCE ECGKAFRWPS NLTRHKRIHT

GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K

F2617 YVCDVEGCTW KFARSDELNR HKKRHTGEKP YKCMECGKAF 47

NRRSHLTRHQ RIHTGEKPYT CSDCGKAFRD KSCLNRHRRT

HTGEKPYKCE ECGKAFRQSS HLTTHKIIHT GEK

F2619 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYE CNYCGKT FSV 48

SSTLIRHQRI HTGEKPYECE KCGKAFNQSS NLTRHKKSHT

GEKPFQCKTC QRKFSRSDHL KTHTRTHTGE K

F2623 YKCEECGKAF RQSSHLTTHK IIHTGEKPYI CRKCGRGFSR 49

KSNLIRHQRT HTGEKPYRCE ECGKAFRWPS NLTRHKRIHT

GEKPYVCDVE GCTWKFARSD ELNRHKKRHT GEK

F2625 YKCEECGKAF RQSSHLTTHK IIHTGEKPYR CEECGKAFRW 50

PSNLTRHKRI HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT

GEKPYVCDVE GCTWKFARSD ELNRHKKRHT GEK

F2628 YTCKQCGKAF SVSSSLRRHE TTHTGEKPYR CEECGKAFRW 51

PSNLTRHKRI HTGEKPYICR KCGRGFSRKS NLIRHQRTHT

GEKPYTCKQC GKAFSVSSSL RRHETTHTGE K

F2629 YKCGQCGKFY SQVSHLTRHQ KIHTGEKPYT CKQCGKAFSV 52

SSSLRRHETT HTGEKPYRCE ECGKAFRWPS NLTRHKRIHT

GEKPYICRKC GRGFSRKSNL IRHQRTHTGE K

F2630 YVCDVEGCTW KFARSDELNR HKKRHTGEKP YKCGQCGKFY 53

SQVSHLTRHQ KIHTGEKPYT CKQCGKAFSV SSSLRRHETT

HTGEKPYRCE ECGKAFRWPS NLTRHKRIHT GEK

F2635 YKCGQCGKFY SQVSHLTRHQ KIHTGEKPYI CRKCGRGFSR 55

KSNLIRHQRT HTGEKPYKCG QCGKFYSQVS HLTRHQKIHT

GEKPFQCKTC QRKFSRSDHL KTHTRTHTGE K

F2637 FQCKTCQRKF SRSDHLKTHT RTHTGEKPYI CRKCGRGFSR 56

KSNLIRHQRT HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT

GEKPYRCEEC GKAFRWPSNL TRHKRIHTGE K

F2642 FQCKTCQRKF SRSDHLKTHT RTHTGEKPYK CMECGKAFNR 57

RSHLTRHQRI HTGEKPYKCK QCGKAFGCPS NLRRHGRTHT

GEKPFQCKTC QRKFSRSDHL KTHTRTHTGE K

F2643 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYK CKQCGKAFGC 58

PSNLRRHGRT HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT

GEKPYKCKQC GKAFGCPSNL RRHGRTHTGE K

F2648 YKCPDCGKSF SQSSSLIRHQ RTHTGEKPYK CGQCGKFYSQ 59

VSHLTRHQKI HTGEKPYICR KCGRGFSRKS NLIRHQRTHT

GEKPYICRKC GRGFSRKSNL IRHQRTHTGE K

F2651 YECNYCGKTF SVSSTLIRHQ RIHTGEKPYK CEECGKAFRQ 60

SSHLTTHKII HTGEKPYRCE ECGKAFRWPS NLTRHKRIHT

GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K

F2653 YECNYCGKTF SVSSTLIRHQ RIHTGEKPYE CEKCGKAFNQ 61

SSNLTRHKKS HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT

GEKPYECEKC GKAFNQSSNL TRHKKSHTGE K

F2654 YECEKCGKAF NQSSNLTRHK KSHTGEKPYK CMECGKAFNR 62

RSHLTRHQRI HTGEKPYECE KCGKAFNQSS NLTRHKKSHT

GEKPYECDHC GKAFSVSSNL NVHRRIHTGE K

F2662 YTCSDCGKAF RDKSCLNRHR RTHTGEKPFQ CKTCQRKFSR 63

SDHLKTHTRT HTGEKPYECN YCGKTFSVSS TLIRHQRIHT

GEKPYVCDVE GCTWKFARSD ELNRHKKRHT GEK

F2667 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYT CSDCGKAFRD 64

KSCLNRHRRT HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT

GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K

F2668 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYK CMECGKAFNR 65

RSHLTRHQRI HTGEKPYVCS KCGKAFTQSS NLTVHQKIHT

GEKPYVCSKC GKAFTQSSNL TVHQKIHTGE K

F2673 FQCKTCQRKF SRSDHLKTHT RTHTGEKPYT CKQCGKAFSV 66

SSSLRRHETT HTGEKPYVCD VEGCTWKFAR SDELNRHKKR

HTGEKPYKCP DCGKSFSQSS SLIRHQRTHT GEK

F2682 YICRKCGRGF SRKSNLIRHQ RTHTGEKPYK CPDCGKSFSQ 67

SSSLIRHQRT HTGEKPYECE KCGKAFNQSS NLTRHKKSHT

GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K

F2689 YICRKCGRGF SRKSNLIRHQ RTHTGEKPYS CGICGKSFSD 68

SSAKRRHCIL HTGEKPYECE KCGKAFNQSS NLTRHKKSHT

GEKPYKCEEC GKAFRQSSHL TTHKIIHTGE K

F2697 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYK CKQCGKAFGC 69

PSNLRRHGRT HTGEKPYKCE ECGKAFRQSS HLTTHKIIHT

GEKPYICRKC GRGFSRKSNL IRHQRTHTGE K

F2699 YICRKCGRGF SRKSNLIRHQ RTHTGEKPYK CEECGKAFRQ 70

SSHLTTHKII HTGEKPYSCG ICGKSFSDSS AKRRHCILHT

GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K

F2703 YKCGQCGKFY SQVSHLTRHQ KIHTGEKPYK CMECGKAFNR 71

RSHLTRHQRI HTGEKPYVCD VEGCTWKFAR SDELNRHKKR

HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT GEK

F2702 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYK CGQCGKFYSQ 54

VSHLTRHQKI HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT

GEKPYVCSKC GKAFTQSSNL TVHQKIHTGE K

多肽，例如包括上述序列的多肽，也包括标记(例如所述HA标记)、NLS、接头和调节结构域(例如激活或阻抑结构域)。这些元件可自N端至C端以任何顺序排列。在一个实例中，所述多肽被排列为：HA标记-NLS-PGEKP-DNA结合结构域(例如一种上述序列)-AAA-p65。或更具体为：

MVYPYDVPDYAELPPKKKRKVGIRIPGEKP-DNA_BINDING_DOMAIN-AAA-p65；(其中位于DNA结合结构域N端的前导区是SEQ ID NO：126)

·YPYDVPDYA(SEQ ID NO：126的3-12)是一种典型的标记(在此为HA-标记)

·PPKKKRKV(SEQ ID NO：126的15-21)是一种典型的NLS(核定位信号)

·“ZFP”是锌指结构域的一种排列

在另一个实例中，所述多肽包括DNA结合结构域和阻抑结构域，例如KRAB或KOX结构域。

可选择使用任何密码子来产生编码本实施例所述的多肽的核酸，例如可(例如优化)用于原核细胞表达的密码子，例如可(例如优化)用于真核细胞表达的密码子，或编码相应的天然存在的结构域的密码子。

结果说明，许多锌指可激活VEGF-A的产生。

表13：VEGF-A激活

ZFP ID	激活倍数	ZFP ID	激活倍数	ZFP ID	激活倍数
ZFP ID	激活倍数	ZFP ID	激活倍数	ZFP ID	激活倍数	F109F121F435F475F480F625F2604F2605F2607F2608F2610F2612F2615F2617F2619F2623无关ZFP	3.54.412.511.19.29.04.910.95.42.17.46.38.12.32.32.31.1	F2625F2628F2629F2630F2633F2634F2635F2636F2638F2642F2643F2644F2646F2648F2650F2651亲代载体P3	2.11.83.82.011.96.52.813.35.73.63.610.710.22.312.64.91.0	F2653F2654F2668F2673F2679F2682F2689F2697F2699F2702F2703F2825F2828F2830F2838	2.62.32.13.14.53.42.11.91.93.14.52.88.86.85.8

实施例8：通过包囊化的细胞产生VEGF-A

将编码可操纵地连接于强力霉素诱导型启动子的F435-p65锌指蛋白的编码区域的核酸构建体稳定转染入Flp-T-Rex293细胞。

如下产生稳定表达ZFP-TF的人胚肾(HEK)细胞系：将编码ZFP-TF的质粒稳定转染入FlpTRex-293细胞系(Invitrogen)，基本上按照生产商的方案。简言之，将来自pLFD-p65载体的HindIII ShoI片段，其含有编码ZFP-TF的DNA片段，亚克隆入pcDNA5/FRT/TO(Invitrogen)。将得到的质粒与pOG44(Invitrogen)共转染入Flp-In^TMTRex^TM-293细胞，以诱导位点特异性整合事件。然后筛选稳定的整合体。得到的细胞当在培养基中加入强力霉素(1μg/ml)时有条件地表达锌指蛋白。为固定稳定表达F435-p65的细胞，将藻酸钠(Sigma)溶解于PBS达到终浓度为1％(wt/v)，并与细胞轻柔地混合，使最终密度达到10⁶(细胞/ml)。将细胞的混悬液逐滴加至CaCl₂(100mM)，其中将细胞胶囊凝固15分钟，然后在PBS中洗涤。将包囊化的细胞加至培养基中。以1μg/ml的强力霉素诱导表达并测量由包囊化的细胞产生的VEGF-A的量。在以F435-p65进行一个实验中，在存在强力霉素的情况下，培养2天的细胞(细胞系#151)产生至少600pg/mL的VEGF-A，培养3天产生至少4000pg/mL，在第4天为大约5000pg/mL，且在第5天为至少5300pg/mL。与不包括F435-p65锌指蛋白的对照或与未在存在强力霉素的情况下进行培养的细胞相比，VEGF-A的产生升高了至少5、10、50或100倍。

实施例9：基于细胞分析人的VEGF-A表达

以100ng各种pLFD-4F-p65质粒在以聚-L-赖氨酸(Biocoat)预先包被的96孔培养板中转染3×10⁴ HEK293T细胞。在转染后48小时收集培养物上清液并立即储存于-80℃直至使用。在以100ng的1acZ转染的各个板的一个孔中，通过X-gal染色估计转染效率。在各个实验中，计算出的转染效率在70-80％范围内。

通过三明治ELISA测定分泌的VEGF-A蛋白对VEGF-A的产生进行分析。捕获抗体(AF-293-NA，来自R & D Systems)和生物素酰化的检测抗体(BAF293，来自R & D Systems)均购自R & D systems，链霉抗生物素蛋白-AP(SA110)和底物缓冲液(ES011)来自Chemicon，底物pNPP(N-9389)来自Sigma Aldrich。ELISA的过程在自动化工作站上进行(GENESIS RSP 150^TM，TECAN)。测定(POWERWAVE^TM X340，BioTekInstrument Inc.)405nm的光密度(OD)，并根据系列稀释的重组人类VEGF-A蛋白(R & D systems)的OD值获得的标准曲线计算出VEGF-A的量。通过将那些自以pLFD-4F-p65单独转染的培养物所获得的VEGF-A浓度与以亲代载体p3转染的培养物所获得的VEGF-A浓度进行标准化而计算出相对VEGF-A产生。

实施例10：基于细胞分析人类VEGF-A表达

锌指蛋白F121由3个人类锌指结构域组成，所述锌指结构域被设计为在相对于人VEGF-A基因的转录起始位点为大约+434位核苷酸处结合人VEGF启动子的9bp序列；F109由4个人类锌指结构域组成，所述锌指结构域被设计为在相对于人VEGF-A基因的转录起始位点为大约-536位核苷酸处结合人VEGF启动子的12bp序列；而F435由3个人类锌指结构域组成，所述锌指结构域被设计为在人VEGF-A基因的-90R和-391R(其中R代表反向链)位核苷酸处结合9bp序列。

构建含有人类VEGF启动子的萤光素酶报道质粒

使用序列特异性引物自人类基因组DNA通过PCR扩增天然的人类VEGF启动子DNA(位置-950至+450，相对于图1A、B、C所示的转录起始序列的编号)，并克隆入质粒pGL3(Promega，E1751)的KpnI/XhoI限制性位点，得到的质粒被命名为pGL3-VEGFprom(图5B)。

锌指蛋白阻抑含有天然的人类VEGF启动子的萤光素酶报道分子

以含有天然的人类VEGF启动子(自转录起始位点起-950至+450)的萤光素酶报道质粒pGL3-VEGFprom和30ng的pLFD-F121-KRAB或pLFD-F109-KRAB转染293细胞。如上所述测定萤光素酶活性。通过将萤火虫萤光素酶活性与Renilla萤光素酶活性进行标准化而计算出阻抑倍数值，并将结果与对照组进行比较，对照组中的293细胞转染了对照载体pLFD和报道质粒。

编码F121-KRAB(30ng)和F109-KRAB(30ng)的质粒分别将报道分子活性降低了8.7倍和6.1倍。

ZFP-KRAB阻抑内源性VEGF-A mRNA的表达

将ZFP表达质粒转染入人胚肾293F细胞(Gibco Life Technologies)。293F细胞允许进行高转染效力。

将293F细胞以10⁵细胞/孔在24孔培养板的孔中在含有5％CO₂的湿润环境中在37℃预培养24小时，每孔1ml的DMEM，添加了10％FBS。使用LIPOFECTAMINE PLUS^TM(Life Technologies)，以0、200或400ng的编码感兴趣的嵌合型锌指蛋白的质粒转染细胞。如果使用的锌指蛋白表达载体低于400ng，则通过添加作为对照的亲代载体将DNA的总量调整为400ng。将细胞进一步孵育48小时。以TRIAZOL试剂(GibcoLife Technologies)自细胞提取总RNA。

通过以下实时RT-PCR进行VEGF mRNA的定量

使用4μg的总RNA，以寡dT作为针对mRNA的第一链合成引物、dNTP和第一链合成体系(Gibco Life Technologies)提供的MMLV逆转录酶，进行逆转录反应，得到第一链cDNA。为定量mRNA，将得到的1μl第一链cDNA通过实时PCR进行扩增，使用的是VEGF-A cDNA特异性引物(正向引物5′-CGGGGTACCCCCTCCCAGTCACTGACTAAC-3′；SEQ IDNO：127和反向引物5′-CCGCTCGAGTCCGGCGGTCACCCCCAAAAG-3′：SEQID NO：128)。由于该方法对最初的RNA量敏感，因此通过使用GAPDH特异性引物进行特异性扩增计算出的GAPDH mRNA量对最初的RNA量进行标准化。使用QUANTITECT SYBR^TM试剂盒(QIAGEN，Valencia，CA)和ROTORGENE^TM 2000实时循环仪(Corbett，Sydney，Australia)对VEGF特异性cDNA和GAPDH特异性cDNA的扩增进行实时监测和分析，并通过反应中的系列稀释的标准定量cDNA。

锌指蛋白对VEGF-AmRNA合成的阻抑

相对于未处理的对照细胞，内源性VEGF-A mRNA的表达降低了2.2倍(54.5％阻抑，200ng pLFD-F435-KRAB)和4.1倍(75.6％阻抑，400ngpLFD-F435-KRAB)。这些结果显示出剂量依赖效应。

ZFP(F435-KRAB)对VEGF-A蛋白产生的阻抑

为了确定对VEGF-A mRNA表达的阻抑是否导致VEGF-A蛋白分泌的降低，以0到200ng的ZFP表达质粒(pLFD-F435-KRAB)转染293F细胞(10⁴/96孔板)，并培养72小时。使用三明治ELISA对积聚在培养基(各100μl)中的VEGF蛋白和重组人VEGF-A蛋白标准的稀释液进行分析，其中所述培养物上清液与抗人VEGF抗体(R & D systems；AF-293-NA)、生物素酰化的抗人VEGF抗体(R & D systems；BAF293)、链霉抗生物素蛋白碱性磷酸酶反应。抗原抗体复合物与溶解于pNPP缓冲液(Chemicon；ES011)中的pNPP(对硝基苯磷酸酯)反应。根据405nm处的吸光度确定样品中的VEGF-A浓度，以POWERWAVE^TM X340(Bio-TEK Instrument Inc.，Winooski VT)测量吸光度。

F435-KRAB以剂量依赖性方式降低了VEGF-A的产生。与转染了200ng对照质粒pLFD-F435-KRAB的对照细胞相比，当使用200ng的所述质粒时，VEGF-A蛋白的浓度被阻抑了3.9倍(138pg/ml)。见表14。

表14：F435-KRAB的滴度

F435-KRAB质粒浓度(ng)	25	50	100	200	对照(200ng)
F435-KRAB质粒浓度(ng)	25	50	100	200	对照(200ng)	VEGF-A(pg/ml)	420±98	345±50	172±13	138±14	536±14
阻抑倍数	1.3	1.6	3.1	3.9	1.0	VEGF-A(pg/ml)	420±98	345±50	172±13	138±14	536±14

阻抑缺氧条件对VEGF-A基因的诱导

已知VEGF-A基因是诱导血管发生的关键因子。VEGF-A活性对于多种肿瘤的产生和生长是至关重要的。已经发现癌症组织中的缺氧条件会刺激VEGF-A活性。在肿瘤细胞中通常观察到VEGF-A高水平表达。

当以100至800μM的CoCl₂处理用于培养293F细胞的培养基大约7小时，可诱导缺氧条件，且细胞中VEGF的产生快速升高。进行以下实验以便测定锌指蛋白是否能够抑制缺氧条件下的VEFG表达。

以50ng pLFD-F435-KRAB转染293F细胞(10⁴细胞/孔，96孔板)，并孵育48小时。为了诱导缺氧，在培养的最后7小时阶段，在培养基中加入800μM CoCl₂。通过ELISA测定培养基中的分泌型VEGF-A的量。

自缺氧性CoCl₂处理的假转染细胞培养物产生的VEGF升高至大约1,039pg/ml，而未处理的对照细胞为大约273pg/ml。这一结果证实缺氧强烈诱导VEGF-A产生。但转染了pLFD-F435-KRAB的细胞在缺氧条件下没有诱导VEGF-A产生。这些细胞仅产生大约272pg/ml的VEGF-A，该浓度与非缺氧对照组的浓度相似。这一结果证实，F435-KRAB的表达抑制了缺氧条件下的VEGF-A的产生。由于转染率仅为大约85-90％，因此有可能残余水平的VEGF-A是由培养物中的未转染细胞产生。我们的结论是，F435-KRAB和相似的功能性嵌合型锌指蛋白是VEGF-A表达的有效阻抑子。

所选定的锌指蛋白或那些包括具有相同基序的结构域的有关蛋白质可用作例如治疗剂。此类药剂能够例如阻抑VEGF-A表达，并由此减慢肿瘤细胞的生长。

在此已经描述了本发明的许多实施方式。不过，应该理解，可在不脱离本发明的精神和范围的情况下对本发明进行各种修改。因此，其他的实施方式也属于所附权利要求书的范围之内。

序列表

<110>图尔金株式会社

<120>调节性锌指蛋白

<130>PCA31172/TGI

<150>US60/431,892

<151>2002-12-09

<160>129

<170>PatentIn version 3.2

<210>1

<211>23

<212>PRT

<213>Homo sapiens

<400>1

Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu

1 5 10 15

Arg Arg His Gly Arg Thr His

20

<210>2

<211>23

<212>PRT

<213>Homo sapiens

<400>2

Tyr Ser Cys Gly Ile Cys Gly Lys Ser Phe Ser Asp Ser Ser Ala Lys

1 5 10 15

Arg Arg His Cys Ile Leu His

20

<210>3

<211>23

<212>PRT

<213>Homo sapiens

<400>3

Tyr Thr Cys Ser Asp Cys Gly Lys Ala Phe Arg Asp Lys Ser Cys Leu

1 5 10 15

Asn Arg His Arg Arg Thr His

20

<210>4

<211>23

<212>PRT

<213>Homo sapiens

<400>4

Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu

1 5 10 15

Thr Arg His Gln Lys Ile His

20

<210>5

<211>23

<212>PRT

<213>Homo sapiens

<400>5

Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu

1 5 10 15

Thr Thr His Lys Ile Ile His

20

<210>6

<211>23

<212>PRT

<213>Homo sapiens

<400>6

Tyr Glu Cys Glu Lys Cys Gly Lys Ala Phe Asn Gln Ser Ser Asn Leu

1 5 10 15

Thr Arg His Lys Lys Ser His

20

<210>7

<211>23

<212>PRT

<213>Homo sapiens

<400>7

Tyr Val Cys Ser Lys Cys Gly Lys Ala Phe Thr Gln Ser Ser Asn Leu

1 5 10 15

Thr Val His Gln Lys Ile His

20

<210>8

<211>23

<212>PRT

<213>Homo sapiens

<400>8

Tyr Lys Cys Pro Asp Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu

1 5 10 15

Ile Arg His Gln Arg Thr His

20

<210>9

<211>25

<212>PRT

<213>Homo sapiens

<400>9

Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe Ala Arg Ser Asp

1 5 10 15

Glu Leu Asn Arg His Lys Lys Arg His

20 25

<210>10

<211>23

<212>PRT

<213>Homo sapiens

<400>10

Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu

1 5 10 15

Lys Thr His Thr Arg Thr His

20

<210>11

<211>23

<212>PRT

<213>Homo sapiens

<400>11

Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu

1 5 10 15

Thr Arg His Gln Arg Ile His

20

<210>12

<211>23

<212>PRT

<213>Homo sapiens

<400>12

Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu

1 5 10 15

Ile Arg His Gln Arg Thr His

20

<210>13

<211>23

<212>PRT

<213>Homo sapiens

<400>13

Tyr Glu Cys Asp His Cys Gly Lys Ala Phe Ser Val Ser Ser Asn Leu

1 5 10 15

Asn Val His Arg Arg Ile His

20

<210>14

<211>23

<212>PRT

<213>Homo sapiens

<400>14

Tyr Thr Cys Lys Gln Cys Gly Lys Ala Phe Ser Val Ser Ser Ser Leu

1 5 10 15

Arg Arg His Glu Thr Thr His

20

<210>15

<211>23

<212>PRT

<213>Homo sapiens

<400>15

Tyr Glu Cys Asn Tyr Cys Gly Lys Thr Phe Ser Val Ser Ser Thr Leu

1 5 10 15

Ile Arg His Gln Arg Ile His

20

<210>16

<211>23

<212>PRT

<213>Homo sapiens

<400>16

Tyr Arg Cys Glu Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu

1 5 10 15

Thr Arg His Lys Arg Ile His

20

<210>17

<211>23

<212>PRT

<213>Homo sapiens

<400>17

Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu

1 5 10 15

Asn Val His Lys Arg Thr His

20

<210>18

<211>23

<212>PRT

<213>Homo sapiens

<400>18

Phe Leu Cys Gln Tyr Cys Ala Gln Arg Phe Gly Arg Lys Asp His Leu

1 5 10 15

Thr Arg His Met Lys Lys Ser

20

<210>19

<211>24

<212>PRT

<213>Artificial

<220>

<223>Artificial zinc finger domain

<400>19

Tyr Arg Cys Lys Tyr Cys Asp Arg Ser Phe Ser Asp Ser Ser Asn Leu

1 5 10 15

Gln Arg His Val Arg Asn Ile His

20

<210>20

<211>83

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>20

Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu

1 5 10 15

Thr Arg His Gln Lys Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys

20 25 30

Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg

50 55 60

Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr

65 70 75 80

Gly Glu Lys

<210>21

<211>83

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>21

Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu

1 5 10 15

Thr Thr His Lys Ile Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met

20 25 30

Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln

35 40 45

Arg Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg

50 55 60

Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr

65 70 75 80

Gly Glu Lys

<210>22

<211>83

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>22

Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu

1 5 10 15

Thr Arg His Gln Lys Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys

20 25 30

Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys

50 55 60

Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr

65 70 75 80

Gly Glu Lys

<210>23

<211>83

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>23

Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu

1 5 10 15

Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys

20 25 30

Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Asp His Cys Gly Lys

50 55 60

Ala Phe Ser Val Ser Ser Asn Leu Asn Val His Arg Arg Ile His Thr

65 70 75 80

Gly Glu Lys

<210>24

<211>84

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>24

Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu

1 5 10 15

Asn Val His Lys Arg Thr His Thr Gly Glu Lys Pro Phe Leu Cys Gln

20 25 30

Tyr Cys Ala Gln Arg Phe Gly Arg Lys Asp His Leu Thr Arg His Met

35 40 45

Lys Lys Ser His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln

50 55 60

Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His

65 70 75 80

Thr Gly Glu Lys

<210>25

<211>83

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>25

Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu

1 5 10 15

Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys

20 25 30

Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys

50 55 60

Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr

65 70 75 80

Gly Glu Lys

<210>26

<211>84

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>26

Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu

1 5 10 15

Arg Arg His Gly Arg Thr His Thr Gly Glu Lys Pro Tyr Arg Cys Glu

20 25 30

Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys

35 40 45

Arg Ile His Thr Gly Glu Lys Pro Phe Leu Cys Gln Tyr Cys Ala Gln

50 55 60

Arg Phe Gly Arg Lys Asp His Leu Thr Arg His Met Lys Lys Ser His

65 70 75 80

Thr Gly Glu Lys

<210>27

<211>83

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>27

Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu

1 5 10 15

Arg Arg His Gly Arg Thr His Thr Gly Glu Lys Pro Tyr Arg Cys Glu

20 25 30

Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys

35 40 45

Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys

50 55 60

Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr

65 70 75 80

Gly Glu Lys

<210>28

<211>85

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>28

Tyr Arg Cys Lys Tyr Cys Asp Arg Ser Phe Ser Asp Ser Ser Asn Leu

1 5 10 15

Gln Arg His Val Arg Asn Ile His Thr Gly Glu Lys Pro Tyr Arg Cys

20 25 30

Glu Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His

35 40 45

Lys Arg Ile His Thr Gly Glu Lys Pro Phe Leu Cys Gln Tyr Cys Ala

50 55 60

Gln Arg Phe Gly Arg Lys Asp His Leu Thr Arg His Met Lys Lys Ser

65 70 75 80

His Thr Gly Glu Lys

85

<210>29

<211>84

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>29

Tyr Arg Cys Lys Tyr Cys Asp Arg Ser Phe Ser Asp Ser Ser Asn Leu

1 5 10 15

Gln Arg His Val Arg Asn Ile His Thr Gly Glu Lys Pro Tyr Arg Cys

20 25 30

Glu Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His

35 40 45

Lys Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly

50 55 60

Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His

65 70 75 80

Thr Gly Glu Lys

<210>30

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>30

Tyr Ser Cys Gly Ile Cys Gly Lys Ser Phe Ser Asp Ser Ser Ala Lys

1 5 10 15

Arg Arg His Cys Ile Leu His Thr Gly Glu Lys Pro Tyr Ile Cys Arg

20 25 30

Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg

50 55 60

Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Thr Cys Lys Gln Cys Gly Lys Ala Phe Ser Val

85 90 95

Ser Ser Ser Leu Arg Arg His Glu Thr Thr His Thr Gly Glu Lys

100 105 110

<210>31

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>31

Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu

1 5 10 15

Thr Thr His Lys Ile Ile His Thr Gly Glu Lys Pro Tyr Ser Cys Gly

20 25 30

Ile Cys Gly Lys Ser Phe Ser Asp Ser Ser Ala Lys Arg Arg His Cys

35 40 45

Ile Leu His Thr Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg

50 55 60

Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr

65 70 75 80

Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg

85 90 95

Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr Gly Glu Lys

100 105 110

<210>32

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>32

Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu

1 5 10 15

Lys Thr His Thr Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Asp

20 25 30

His Cys Gly Lys Ala Phe Ser Val Ser Ser Asn Leu Asn Val His Arg

35 40 45

Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys Gly Lys

50 55 60

Ala Phe Arg Gln Ser Ser His Leu Thr Thr His Lys Ile Ile His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Ser Cys Gly Ile Cys Gly Lys Ser Phe Ser Asp

85 90 95

Ser Ser Ala Lys Arg Arg His Cys Ile Leu His Thr Gly Glu Lys

100 105 110

<210>33

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>33

Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu

1 5 10 15

Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Thr Cys Ser

20 25 30

Asp Cys Gly Lys Ala Phe Arg Asp Lys Ser Cys Leu Asn Arg His Arg

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys Gly Lys

50 55 60

Ala Phe Arg Gln Ser Ser His Leu Thr Thr His Lys Ile Ile His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Thr Cys Ser Asp Cys Gly Lys Ala Phe Arg Asp

85 90 95

Lys Ser Cys Leu Asn Arg His Arg Arg Thr His Thr Gly Glu Lys

100 105 110

<210>34

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>34

Tyr Glu Cys Glu Lys Cys Gly Lys Ala Phe Asn Gln Ser Ser Asn Leu

1 5 10 15

Thr Arg His Lys Lys Ser His Thr Gly Glu Lys Pro Tyr Lys Cys Gly

20 25 30

Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu Thr Arg His Gln

35 40 45

Lys Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg

50 55 60

Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg

85 90 95

Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys

100 105 110

<210>35

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>35

Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu

1 5 10 15

Arg Arg His Gly Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Lys

20 25 30

Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg

50 55 60

Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg

85 90 95

Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys

100 105 110

<210>36

<211>113

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>36

Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu

1 5 10 15

Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Glu

20 25 30

Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu Thr Thr His Lys

35 40 45

Ile Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys

50 55 60

Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe

85 90 95

Ala Arg Ser Asp Glu Leu Asn Arg His Lys Lys Arg His Thr Gly Glu

100 105 110

Lys

<210>37

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>37

Tyr Glu Cys Glu Lys Cys Gly Lys Ala Phe Asn Gln Ser Ser Asn Leu

1 5 10 15

Thr Arg His Lys Lys Ser His Thr Gly Glu Lys Pro Tyr Lys Cys Met

20 25 30

Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln

35 40 45

Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Asp Cys Gly Lys

50 55 60

Ser Phe Ser Gln Ser Ser Ser Leu Ile Arg His Gln Arg Thr His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg

85 90 95

Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys

100 105 110

<210>38

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>38

Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu

1 5 10 15

Thr Thr His Lys Ile Ile His Thr Gly Glu Lys Pro Tyr Thr Cys Ser

20 25 30

Asp Cys Gly Lys Ala Phe Arg Asp Lys Ser Cys Leu Asn Arg His Arg

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg

50 55 60

Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys

85 90 95

Pro Ser Asn Leu Arg Arg His Gly Arg Thr His Thr Gly Glu Lys

100 105 110

<210>39

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>39

Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu

1 5 10 15

Thr Thr His Lys Ile Ile His Thr Gly Glu Lys Pro Tyr Arg Cys Glu

20 25 30

Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys

35 40 45

Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys

50 55 60

Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Arg Cys Glu Glu Cys Gly Lys Ala Phe Arg Trp

85 90 95

Pro Ser Asn Leu Thr Arg His Lys Arg Ile His Thr Gly Glu Lys

100 105 110

<210>40

<211>113

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>40

Tyr Glu Cys Asp His Cys Gly Lys Ala Phe Ser Val Ser Ser Asn Leu

1 5 10 15

Asn Val His Arg Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met

20 25 30

Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln

35 40 45

Arg Ile His Thr Gly Glu Lys Pro Tyr Val Cys Asp Val Glu Gly Cys

50 55 60

Thr Trp Lys Phe Ala Arg Ser Asp Glu Leu Asn Arg His Lys Lys Arg

65 70 75 80

His Thr Gly Glu Lys Pro Tyr Val Cys Ser Lys Cys Gly Lys Ala Phe

85 90 95

Thr Gln Ser Ser Asn Leu Thr Val His Gln Lys Ile His Thr Gly Glu

100 105 110

Lys

<210>41

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>41

Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu

1 5 10 15

Ile Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Met

20 25 30

Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln

35 40 45

Arg Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg

50 55 60

Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg

85 90 95

Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys

100 105 110

<210>42

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>42

Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu

1 5 10 15

Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys

20 25 30

Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys

50 55 60

Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr

65 70 75 80

Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg

85 90 95

Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr Gly Glu Lys

100 105 110

<210>43

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>43

Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu

1 5 10 15

Ile Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Gly

20 25 30

Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu Thr Arg His Gln

35 40 45

Lys Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg

50 55 60

Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg

85 90 95

Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys

100 105 110

<210>44

<211>113

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>44

Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe Ala Arg Ser Asp

1 5 10 15

Glu Leu Asn Arg His Lys Lys Arg His Thr Gly Glu Lys Pro Tyr Lys

20 25 30

Cys Pro Asp Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu Ile Arg

35 40 45

His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys

50 55 60

Gly Lys Ala Phe Arg Gln Ser Ser His Leu Thr Thr His Lys Ile Ile

65 70 75 80

His Thr Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe

85 90 95

Ser Arg Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr Gly Glu

100 105 110

Lys

<210>45

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>45

Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu

1 5 10 15

Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys

20 25 30

Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Asp His Cys Gly Lys

50 55 60

Ala Phe Ser Val Ser Ser Asn Leu Asn Val His Arg Arg Ile His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln

85 90 95

Ser Ser His Leu Thr Thr His Lys Ile Ile His Thr Gly Glu Lys

100 105 110

<210>46

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>46

Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu

1 5 10 15

Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met

20 25 30

Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln

35 40 45

Arg Ile His Thr Gly Glu Lys Pro Tyr Arg Cys Glu Glu Cys Gly Lys

50 55 60

Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys Arg Ile His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg

85 90 95

Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys

100 105 110

<210>47

<211>113

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>47

Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe Ala Arg Ser Asp

1 5 10 15

Glu Leu Asn Arg His Lys Lys Arg His Thr Gly Glu Lys Pro Tyr Lys

20 25 30

Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg

35 40 45

His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Thr Cys Ser Asp Cys

50 55 60

Gly Lys Ala Phe Arg Asp Lys Ser Cys Leu Asn Arg His Arg Arg Thr

65 70 75 80

His Thr Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe

85 90 95

Arg Gln Ser Ser His Leu Thr Thr His Lys Ile Ile His Thr Gly Glu

100 105 110

Lys

<210>48

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>48

Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu

1 5 10 15

Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Glu Cys Asn

20 25 30

Tyr Cys Gly Lys Thr Phe Ser Val Ser Ser Thr Leu Ile Arg His Gln

35 40 45

Arg Ile His Thr Gly Glu Lys Pro Tyr Glu Cys Glu Lys Cys Gly Lys

50 55 60

Ala Phe Asn Gln Ser Ser Asn Leu Thr Arg His Lys Lys Ser His Thr

65 70 75 80

Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg

85 90 95

Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr Gly Glu Lys

100 105 110

<210>49

<211>113

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>49

Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu

1 5 10 15

Thr Thr His Lys Ile Ile His Thr Gly Glu Lys Pro Tyr Ile Cys Arg

20 25 30

Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Tyr Arg Cys Glu Glu Cys Gly Lys

50 55 60

Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys Arg Ile His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe

85 90 95

Ala Arg Ser Asp Glu Leu Asn Arg His Lys Lys Arg His Thr Gly Glu

100 105 110

Lys

<210>50

<211>113

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>50

Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu

1 5 10 15

Thr Thr His Lys Ile Ile His Thr Gly Glu Lys Pro Tyr Arg Cys Glu

20 25 30

Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys

35 40 45

Arg Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg

50 55 60

Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe

85 90 95

Ala Arg Ser Asp Glu Leu Asn Arg His Lys Lys Arg His Thr Gly Glu

100 105 110

Lys

<210>51

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>51

Tyr Thr Cys Lys Gln Cys Gly Lys Ala Phe Ser Val Ser Ser Ser Leu

1 5 10 15

Arg Arg His Glu Thr Thr His Thr Gly Glu Lys Pro Tyr Arg Cys Glu

20 25 30

Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys

35 40 45

Arg Ile His Thr Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg

50 55 60

Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Thr Cys Lys Gln Cys Gly Lys Ala Phe Ser Val

85 90 95

Ser Ser Ser Leu Arg Arg His Glu Thr Thr His Thr Gly Glu Lys

100 105 110

<210>52

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>52

Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu

1 5 10 15

Thr Arg His Gln Lys Ile His Thr Gly Glu Lys Pro Tyr Thr Cys Lys

20 25 30

Gln Cys Gly Lys Ala Phe Ser Val Ser Ser Ser Leu Arg Arg His Glu

35 40 45

Thr Thr His Thr Gly Glu Lys Pro Tyr Arg Cys Glu Glu Cys Gly Lys

50 55 60

Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys Arg Ile His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg

85 90 95

Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys

100 105 110

<210>53

<211>113

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>53

Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe Ala Arg Ser Asp

1 5 10 15

Glu Leu Asn Arg His Lys Lys Arg His Thr Gly Glu Lys Pro Tyr Lys

20 25 30

Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu Thr Arg

35 40 45

His Gln Lys Ile His Thr Gly Glu Lys Pro Tyr Thr Cys Lys Gln Cys

50 55 60

Gly Lys Ala Phe Ser Val Ser Ser Ser Leu Arg Arg His Glu Thr Thr

65 70 75 80

His Thr Gly Glu Lys Pro Tyr Arg Cys Glu Glu Cys Gly Lys Ala Phe

85 90 95

Arg Trp Pro Ser Asn Leu Thr Arg His Lys Arg Ile His Thr Gly Glu

100 105 110

Lys

<210>54

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>54

Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu

1 5 10 15

Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Gly

20 25 30

Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu Thr Arg His Gln

35 40 45

Lys Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys

50 55 60

Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Val Cys Ser Lys Cys Gly Lys Ala Phe Thr Gln

85 90 95

Ser Ser Asn Leu Thr Val His Gln Lys Ile His Thr Gly Glu Lys

100 105 110

<210>55

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>55

Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu

1 5 10 15

Thr Arg His Gln Lys Ile His Thr Gly Glu Lys Pro Tyr Ile Cys Arg

20 25 30

Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Gly Gln Cys Gly Lys

50 55 60

Phe Tyr Ser Gln Val Ser His Leu Thr Arg His Gln Lys Ile His Thr

65 70 75 80

Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg

85 90 95

Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr Gly Glu Lys

100 105 110

<210>56

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>56

Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu

1 5 10 15

Lys Thr His Thr Arg Thr His Thr Gly Glu Lys Pro Tyr Ile Cys Arg

20 25 30

Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys

50 55 60

Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Arg Cys Glu Glu Cys Gly Lys Ala Phe Arg Trp

85 90 95

Pro Ser Asn Leu Thr Arg His Lys Arg Ile His Thr Gly Glu Lys

100 105 110

<210>57

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>57

Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu

1 5 10 15

Lys Thr His Thr Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Met

20 25 30

Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln

35 40 45

Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Lys Gln Cys Gly Lys

50 55 60

Ala Phe Gly Cys Pro Ser Asn Leu Arg Arg His Gly Arg Thr His Thr

65 70 75 80

Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg

85 90 95

Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr Gly Glu Lys

100 105 110

<210>58

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>58

Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu

1 5 10 15

Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Lys

20 25 30

Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu Arg Arg His Gly

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg

50 55 60

Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys

85 90 95

Pro Ser Asn Leu Arg Arg His Gly Arg Thr His Thr Gly Glu Lys

100 105 110

<210>59

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>59

Tyr Lys Cys Pro Asp Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu

1 5 10 15

Ile Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Gly

20 25 30

Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu Thr Arg His Gln

35 40 45

Lys Ile His Thr Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg

50 55 60

Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg

85 90 95

Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys

100 105 110

<210>60

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>60

Tyr Glu Cys Asn Tyr Cys Gly Lys Thr Phe Ser Val Ser Ser Thr Leu

1 5 10 15

Ile Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Glu

20 25 30

Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu Thr Thr His Lys

35 40 45

Ile Ile His Thr Gly Glu Lys Pro Tyr Arg Cys Glu Glu Cys Gly Lys

50 55 60

Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys Arg Ile His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg

85 90 95

Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys

100 105 110

<210>61

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>61

Tyr Glu Cys Asn Tyr Cys Gly Lys Thr Phe Ser Val Ser Ser Thr Leu

1 5 10 15

Ile Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Glu Cys Glu

20 25 30

Lys Cys Gly Lys Ala Phe Asn Gln Ser Ser Asn Leu Thr Arg His Lys

35 40 45

Lys Ser His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys

50 55 60

Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Glu Cys Glu Lys Cys Gly Lys Ala Phe Asn Gln

85 90 95

Ser Ser Asn Leu Thr Arg His Lys Lys Ser His Thr Gly Glu Lys

100 105 110

<210>62

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>62

Tyr Glu Cys Glu Lys Cys Gly Lys Ala Phe Asn Gln Ser Ser Asn Leu

1 5 10 15

Thr Arg His Lys Lys Ser His Thr Gly Glu Lys Pro Tyr Lys Cys Met

20 25 30

Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln

35 40 45

Arg Ile His Thr Gly Glu Lys Pro Tyr Glu Cys Glu Lys Cys Gly Lys

50 55 60

Ala Phe Asn Gln Ser Ser Asn Leu Thr Arg His Lys Lys Ser His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Glu Cys Asp His Cys Gly Lys Ala Phe Ser Val

85 90 95

Ser Ser Asn Leu Asn Val His Arg Arg Ile His Thr Gly Glu Lys

100 105 110

<210>63

<211>113

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>63

Tyr Thr Cys Ser Asp Cys Gly Lys Ala Phe Arg Asp Lys Ser Cys Leu

1 5 10 15

Asn Arg His Arg Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Lys

20 25 30

Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Asn Tyr Cys Gly Lys

50 55 60

Thr Phe Ser Val Ser Ser Thr Leu Ile Arg His Gln Arg Ile His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe

85 90 95

Ala Arg Ser Asp Glu Leu Asn Arg His Lys Lys Arg His Thr Gly Glu

100 105 110

Lys

<210>64

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>64

Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu

1 5 10 15

Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Thr Cys Ser

20 25 30

Asp Cys Gly Lys Ala Phe Arg Asp Lys Ser Cys Leu Asn Arg His Arg

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg

50 55 60

Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg

85 90 95

Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys

100 105 110

<210>65

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>65

Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu

1 5 10 15

Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met

20 25 30

Glu Cys Gly Lys Ala phe Asn Arg Arg Ser His Leu Thr Arg His Gln

35 40 45

Arg Ile His Thr Gly Glu Lys Pro Tyr Val Cys Ser Lys Cys Gly Lys

50 55 60

Ala Phe Thr Gln Ser Ser Asn Leu Thr Val His Gln Lys Ile His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Val Cys Ser Lys Cys Gly Lys Ala Phe Thr Gln

85 90 95

Ser Ser Asn Leu Thr Val His Gln Lys Ile His Thr Gly Glu Lys

100 105 110

<210>66

<211>113

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>66

Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu

1 5 10 15

Lys Thr His Thr Arg Thr His Thr Gly Glu Lys Pro Tyr Thr Cys Lys

20 25 30

Gln Cys Gly Lys Ala Phe Ser Val Ser Ser Ser Leu Arg Arg His Glu

35 40 45

Thr Thr His Thr Gly Glu Lys Pro Tyr Val Cys Asp Val Glu Gly Cys

50 55 60

Thr Trp Lys Phe Ala Arg Ser Asp Glu Leu Asn Arg His Lys Lys Arg

65 70 75 80

His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Asp Cys Gly Lys Ser Phe

85 90 95

Ser Gln Ser Ser Ser Leu Ile Arg His Gln Arg Thr His Thr Gly Glu

100 105 110

Lys

<210>67

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>67

Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu

1 5 10 15

Ile Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro

20 25 30

Asp Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu Ile Arg His Gln

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Glu Lys Cys Gly Lys

50 55 60

Ala Phe Asn Gln Ser Ser Asn Leu Thr Arg His Lys Lys Ser His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg

85 90 95

Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys

100 105 110

<210>68

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>68

Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu

1 5 10 15

Ile Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Ser Cys Gly

20 25 30

Ile Cys Gly Lys Ser Phe Ser Asp Ser Ser Ala Lys Arg Arg His Cys

35 40 45

Ile Leu His Thr Gly Glu Lys Pro Tyr Glu Cys Glu Lys Cys Gly Lys

50 55 60

Ala Phe Asn Gln Ser Ser Asn Leu Thr Arg His Lys Lys Ser His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln

85 90 95

Ser Ser His Leu Thr Thr His Lys Ile Ile His Thr Gly Glu Lys

100 105 110

<210>69

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>69

Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu

1 5 10 15

Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Lys

20 25 30

Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu Arg Arg His Gly

35 40 45

Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys Gly Lys

50 55 60

Ala Phe Arg Gln Ser Ser His Leu Thr Thr His Lys Ile Ile His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg

85 90 95

Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys

100 105 110

<210>70

<211>111

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>70

Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu

1 5 10 15

Ile Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Glu

20 25 30

Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu Thr Thr His Lys

35 40 45

Ile Ile His Thr Gly Glu Lys Pro Tyr Ser Cys Gly Ile Cys Gly Lys

50 55 60

Ser Phe Ser Asp Ser Ser Ala Lys Arg Arg His Cys Ile Leu His Thr

65 70 75 80

Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg

85 90 95

Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys

100 105 110

<210>71

<211>113

<212>PRT

<213>Artificial

<220>

<223>artificial zinc finger protein

<400>71

Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu

1 5 10 15

Thr Arg His Gln Lys Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met

20 25 30

Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln

35 40 45

Arg Ile His Thr Gly Glu Lys Pro Tyr Val Cys Asp Val Glu Gly Cys

50 55 60

Thr Trp Lys Phe Ala Arg Ser Asp Glu Leu Asn Arg His Lys Lys Arg

65 70 75 80

His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe

85 90 95

Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu

100 105 110

Lys

<210>72

<211>96

<212>PRT

<213>Homo sapiens

<400>72

Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys

1 5 10 15

Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr

20 25 30

Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn

35 40 45

Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg

50 55 60

Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln

65 70 75 80

Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val

85 90 95

<210>73

<211>260

<212>PRT

<213>Homo sapiens

<400>73

Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys

1 5 10 15

Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Ser

20 25 30

Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser

35 40 45

Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe

50 55 60

Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val

65 70 75 80

Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro

85 90 95

Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met

100 105 110

Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro

115 120 125

Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala

130 135 140

Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp

145 150 155 160

Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe

165 170 175

Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn

180 185 190

Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu

195 200 205

Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Ala Gln Arg Pro Pro Asp

210 215 220

Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu

225 230 235 240

Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala

245 250 255

Leu Leu Ser Gln

260

<210>74

<211>127

<212>PRT

<213>Sacharromyces cerevisiae

<400>74

Asn Phe Asn Gln Ser Gly Asn Ile Ala Asp Ser Ser Leu Ser Phe Thr

1 5 10 15

Phe Thr Asn Ser Ser Asn Gly Pro Asn Leu Ile Thr Thr Gln Thr Asn

20 25 30

Ser Gln Ala Leu Ser Gln Pro Ile Ala Ser Ser Asn Val His Asp Asn

35 40 45

Phe Met Asn Asn Glu Ile Thr Ala Ser Lys Ile Asp Asp Gly Asn Asn

50 55 60

Ser Lys Pro Leu Ser Pro Gly Trp Thr Asp Gln Thr Ala Tyr Asn Ala

65 70 75 80

Phe Gly Ile Thr Thr Gly Met Phe Asn Thr Thr Thr Met Asp Asp Val

85 90 95

Tyr Asn Tyr Leu Phe Asp Asp Glu Asp Thr Pro Pro Asn Pro Lys Lys

100 105 110

Glu Ile Ser Met Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser

115 120 125

<210>75

<211>63

<212>PRT

<213>Homo sapiens

<400>75

Val Ser Val Thr Phe Glu Asp Val Ala Val Leu Phe Thr Arg Asp Glu

1 5 10 15

Trp Lys Lys Leu Asp Leu Ser Gln Arg Ser Leu Tyr Arg Glu Val Met

20 25 30

Leu Glu Asn Tyr Ser Asn Leu Ala Ser Met Ala Gly Phe Leu Phe Thr

35 40 45

Lys Pro Lys Val Ile Ser Leu Leu Gln Gln Gly Glu Asp Pro Trp

50 55 60

<210>76

<211>12

<212>DNA

<213>Homo sapiens

<400>76

gtttgggagg tc 12

<210>77

<211>12

<212>DNA

<213>Homo sapiens

<400>77

tgggaggtca ga 12

<210>78

<211>12

<212>DNA

<213>Homo sapiens

<400>78

gtcagaaata gg 12

<210>79

<211>12

<212>DNA

<213>Homo sapiens

<400>79

gccagagccg gg 12

<210>80

<211>12

<212>DNA

<213>Homo sapiens

<400>80

gagcggggag aa 12

<210>81

<211>12

<212>DNA

<213>Homo sapiens

<400>81

ggggagaggg ac 12

<210>82

<211>12

<212>DNA

<213>Homo sapiens

<400>82

gtggggagag gg 12

<210>83

<211>12

<212>DNA

<213>Homo sapiens

<400>83

ggggcagggg aa 12

<210>84

<211>12

<212>DNA

<213>Homo sapiens

<400>84

gacagggcct ga 12

<210>85

<211>12

<212>DNA

<213>Homo sapiens

<400>85

ggtgggggtc ga 12

<210>86

<211>12

<212>DNA

<213>Homo sapiens

<400>86

caagtgggga at 12

<210>87

<211>12

<212>DNA

<213>Homo sapiens

<400>87

gggtgggggg ag 12

<210>88

<211>12

<212>DNA

<213>Homo sapiens

<400>88

agggggtggg gg 12

<210>89

<211>12

<212>DNA

<213>Homo sapiens

<400>89

gggtggggag ag 12

<210>90

<211>12

<212>DNA

<213>Homo sapiens

<400>90

gagcgagcag cg 12

<210>91

<211>12

<212>DNA

<213>Homo sapiens

<400>91

agaaataggg gg 12

<210>92

<211>12

<212>DNA

<213>Homo sapiens

<400>92

gggggtgggg gg 12

<210>93

<211>12

<212>DNA

<213>Homo sapiens

<400>93

agagccgggg tg 12

<210>94

<211>12

<212>DNA

<213>Homo sapiens

<400>94

agggaagctg gg 12

<210>95

<211>12

<212>DNA

<213>Homo sapiens

<400>95

gtgggtgagt ga 12

<210>96

<211>12

<212>DNA

<213>Homo sapiens

<400>96

gtgtggggtt ga 12

<210>97

<211>12

<212>DNA

<213>Homo sapiens

<400>97

gttgagggtg tt 12

<210>98

<211>12

<212>DNA

<213>Homo sapiens

<400>98

gagggtgttg ga 12

<210>99

<211>12

<212>DNA

<213>Homo sapiens

<400>99

ggtgttggag cg 12

<210>100

<211>12

<212>DNA

<213>Homo sapiens

<400>100

ggggagaggg ac 12

<210>101

<211>12

<212>DNA

<213>Homo sapiens

<400>101

tggggagagg ga 12

<210>102

<211>12

<212>DNA

<213>Homo sapiens

<400>102

ggtggggaga gg 12

<210>103

<211>12

<212>DNA

<213>Homo sapiens

<400>103

agggacgggt gg 12

<210>104

<211>12

<212>DNA

<213>Homo sapiens

<400>104

gacagggacg gg 12

<210>105

<211>12

<212>DNA

<213>Homo sapiens

<400>105

gaggagggag ca 12

<210>106

<211>12

<212>DNA

<213>Homo sapiens

<400>106

gggggtcgag ct 12

<210>107

<211>12

<212>DNA

<213>Homo sapiens

<400>107

gaaggggaag ct 12

<210>108

<211>12

<212>DNA

<213>Homo sapiens

<400>108

aatgaagggg aa 12

<210>109

<211>12

<212>DNA

<213>Homo sapiens

<400>109

gcggctcggg cc 12

<210>110

<211>12

<212>DNA

<213>Homo sapiens

<400>110

gggcgggccg gg 12

<210>111

<211>12

<212>DNA

<213>Homo sapiens

<400>111

aaaaaagggg gg 12

<210>112

<211>12

<212>DNA

<213>Homo sapiens

<400>112

gcagcggtta gg 12

<210>113

<211>12

<212>DNA

<213>Homo sapiens

<400>113

ggggaagtag ag 12

<210>114

<211>12

<212>DNA

<213>Homo sapiens

<400>114

agagaagtcg ag 12

<210>115

<211>12

<212>DNA

<213>Homo sapiens

<400>115

gagagagacg gg 12

<210>116

<211>12

<212>DNA

<213>Homo sapiens

<400>116

ggggtcagag ag 12

<210>117

<211>12

<212>DNA

<213>Homo sapiens

<400>117

ggggtggggg ga 12

<210>118

<211>12

<212>DNA

<213>Homo sapiens

<400>118

caagggggag gg 12

<210>119

<211>90

<212>PRT

<213>Saccharomyces cerevisiae

<400>119

Asn Ser Ala Ser Ser Ser Thr Lys Leu Asp Asp Asp Leu Gly Thr Ala

1 5 10 15

Ala Ala Val Leu Ser Asn Met Arg Ser Ser Pro Tyr Arg Thr His Asp

20 25 30

Lys Pro Ile Ser Asn Val Asn Asp Met Asn Asn Thr Asn Ala Leu Gly

35 40 45

Val Pro Ala Ser Arg Pro His Ser Ser Ser Phe Pro Ser Lys Gly Val

50 55 60

Leu Arg Pro Ile Leu Leu Arg Ile His Asn Ser Glu Gln Gln Pro Ile

65 70 75 80

Phe Glu Ser Asn Asn Ser Thr Ala Cys Ile

85 90

<210>120

<211>3480

<212>DNA

<213>Homo sapiens

<220>

<221>misc_RNA

<222>(2363)..(2363)

<223>mRNA start site

<220>

<221>misc_signal

<222>(3401)..(3403)

<223>translation start site

<400>120

gaattctgtg ccctcactcc cctggatccc tgggcaaagc cccagaggga aacacaaaca 60

ggttgttgta acacaccttg ctgggtacca ccatggagga cagttggctt atgggggtgg 120

ggggtgcctg gggccacgga gtgactggtg atggctatcc ctccttggaa cccctccagc 180

ctcctcttag cttcagattt gtttatttgt tttttactaa gacctgctct ttcaggtctg 240

ttggctcttt taggggctga agaaggccga gttgagaagg gatgcaaggg agggggccag 300

aatgagccct tagggctcag agcctccatc ctgccccaag atgtctacag cttgtgctcc 360

tggggtgcta gaggcgcaca aggaggaaag ttagtggctt cccttccata tcccgttcat 420

cagcctagag catggagccc aggtgaggag gcctgcctgg gagggggccc tgagccagga 480

aataaacatt tactaactgt acaaagacct tgtccctgct gctggggagc ctgccaagtg 540

gtggagacag gactagtgca cgaatgatgg aaagggaggg ttggggtggg tgggagccag 600

cccttttcct cataagggcc ttaggacacc ataccgatgg aactgggggt actggggagg 660

taacctagca cctccaccaa accacagcaa catgtgctga ggatggggct gactaggtaa 720

gctccctgga gcgttttggt taaattgagg gaaattgctg cattcccatt ctcagtccat 780

gcctccacag aggctatgcc agctgtaggc cagaccctgg caagatctgg gtggataatc 840

agactgactg gcctcagagc cccaactttg ttccctgggg cagcctggaa atagccaggt 900

cagaaaccag ccaggaattt ttccaagctg cttcctatat gcaagaatgg gatgggggcc 960

tttgggagca cttagggaag atgtggagag ttggaggaaa agggggcttg gaggtaaggg 1020

aggggactgg gggaaggata ggggagaagc tgtgagcctg gagaagtagc caagggatcc 1080

tgagggaatg ggggagctga gacgaaaccc ccatttctat tcagaagatg agctatgagt 1140

ctgggcttgg gctgatagaa gccttggccc ctggcctggt gggagctctg ggcagctggc 1200

ctacagacgt tccttagtgc tggcgggtag gtttgaatca tcacgcaggc cctggcctcc 1260

acccgccccc accagccccc tggcctcagt tccctggcaa catctggggt tgggggggca 1320

gcaggaacaa gggcctctgt ctgcccagct gcctccccct ttgggttttg ccagactcca 1380

cagtgcatac gtgggctcca acaggtcctc ttccctccca gtcactgact aaccccggaa 1440

ccacacagct tcccgttctc agctccacaa acttggtgcc aaattcttct cccctgggaa 1500

gcatccctgg acacttccca aaggacccca gtcactccag cctgttggct gccgctcact 1560

ttgatgtctg caggccagat gagggctcca gatggcacat tgtcagaggg acacactgtg 1620

gcccctgtgc ccagccctgg gctctctgta catgaagcaa ctccagtccc aaatatgtag 1680

ctgtttggga ggtcagaaat agggggtcca ggagcaaact ccccccaccc cctttccaaa 1740

gcccattccc tctttagcca gagccggggt gtgcagacgg cagtcactag ggggcgctcg 1800

gccaccacag ggaagctggg tgaatggagc gagcagcgtc ttcgagagtg aggacgtgtg 1860

tgtctgtgtg ggtgagtgag tgtgtgcgtg tggggttgag ggtgttggag cggggagaag 1920

gccaggggtc actccaggat tccaacagat ctgtgtgtcc ctctccccac ccgtccctgt 1980

ccggctctcc gccttcccct gcccccttca atattcctag caaagaggga acggctctca 2040

ggccctgtcc gcacgtaacc tcactttcct gctccctcct cgccaatgcc ccgcgggcgc 2100

gtgtctctgg acagagtttc cgggggcgga tgggtaattt tcaggctgtg aaccttggtg 2160

ggggtcgagc ttccccttca ttgcggcggg ctgcgggcca ggcttcactg ggcgtccgca 2220

gagcccgggc ccgagccgcg tgtggagggg ctgaggctcg cctgtccccg ccccccgggg 2280

cgggccgggg gcggggtccc ggcggggcgg agccatgcgc cccccccttt tttttttaaa 2340

agtcggctgg tagcggggag gatcgcggag gcttggggca gccgggtagc tcggaggtcg 2400

tggcgctggg ggctagcacc agcgctctgt cgggaggcgc agcggttagg tggaccggtc 2460

agcggactca ccggccaggg cgctcggtgc tggaatttga tattcattga tccgggtttt 2520

atccctcttc ttttttctta aacatttttt tttaaaactg tattgtttct cgttttaatt 2580

tatttttgct tgccattccc cacttgaatc gggccgacgg cttggggaga ttgctctact 2640

tccccaaatc actgtggatt ttggaaacca gcagaaagag gaaagaggta gcaagagctc 2700

cagagagaag tcgaggaaga gagagacggg gtcagagaga gcgcgcgggc gtgcgagcag 2760

cgaaagcgac aggggcaaag tgagtgacct gcttttgggg gtgaccgccg gagcgcggcg 2820

tgagccctcc cccttgggat cccgcagctg accagtcgcg ctgacggaca gacagacaga 2880

caccgccccc agccccagct accacctcct ccccggccgg cggcggacag tggacgcggc 2940

ggcgagccgc gggcaggggc cggagcccgc gcccggaggc ggggtggagg gggtcggggc 3000

tcgcggcgtc gcactgaaac ttttcgtcca acttctgggc tgttctcgct tcggaggagc 3060

cgtggtccgc gcgggggaag ccgagccgag cggagccgcg agaagtgcta gctcgggccg 3120

ggaggagccg cagccggagg agggggagga ggaagaagag aaggaagagg agagggggcc 3180

gcagtggcga ctcggcgctc ggaagccggg ctcatggacg ggtgaggcgg cggtgtgcgc 3240

agacagtgct ccagccgcgc gcgctcccca ggccctggcc cgggcctcgg gccggggagg 3300

aagagtagct cgccgaggcg ccgaggagag cgggccgccc cacagcccga gccggagagg 3360

gagcgcgagc cgcgccggcc ccggtcgggc ctccgaaacc atgaactttc tgctgtcttg 3420

ggtgcattgg agccttgcct tgctgctcta cctccaccat gccaaggtaa gcggtcgtgc 3480

<210>121

<211>8024

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<222>(3731)..(3731)

<223>mRNA start site

<220>

<221>misc_feature

<222>(3959)..(3961)

<223>ATG

<400>121

ccgggctgag ctcagtcatt ttgccctgag gactataagt ggactattat gcagcacttt 60

cttttttatt attattacta ttaagccaag taagttctta acagctaaca cctgagctgg 120

tggctctgag aagcctcttc actccttcac gggagacggg accattcaca tgaagatcct 180

acattgttgt tttttttttt ttggaggtcg aaaaaggtca ctgttaggag gctttctggg 240

cctttgctcc tctccctcaa tttattaccc ctccagtggc tgatgacgta cagggagact 300

tccacccgat aatgacatgg ctttgtttat ttcacaaatt cccagcattt actgttaatc 360

agacccagtt tgaaccaccc ccaaggggct tgcagtctaa acagctcact ttgctcagcc 420

tcttcctgag gtcaggcact gtcttgctaa ggccgacatc agctcatgcc cattttacag 480

atggggaaac tgagaatgct aagaagtgaa atagcgtaag gttatacaac taacagggag 540

acagcctaaa cttgaaccca accggaagcc caacatggcc ccaagccttc ctcgaacccc 600

aggacttggc aaagcgggcg tcctggggta aagcatggca gaagggcttt gggtccaagc 660

taagtgaggg tcctgtttct agatcacctg gccaggtgca gtggctcatg cctgtaatcc 720

cagcactttg ggaggctgag gcgggaggat tgcttgagct caaaagtttg agtccagccc 780

gggcaataca gcgagacctc gtctctacta aaaaagaaaa caaaaaatta gctgagtgtg 840

tagtcccagc tactcaggag actgaggctg gaggattgct taagcctgga agtttgaggc 900

tgtagagcta tgatagagcc actgcacttt agcctgggca atggagcaag atactatctc 960

aaaaaaaaaa aaatatatat ataggtcccc ttgtccctct gctgagaagt aaccagatct 1020

ggaaaagatt tagtcacctt ggtccaacta tttctttcac ataaagaaaa aaaaaggcaa 1080

tgcagacctt cccatggggg cagctctgcc tgaggccttt gcaggtacct ctgtttgtct 1140

gccccggggc acagtggcag attgggcagg gcagcttgca gtgaggattg ctgatggatg 1200

agctcctagt gtacctagcc agccatttac tcacaaacag ctattgagca cctactatgt 1260

gcccagcact ggaggtacaa ctggcaacaa cacaaatccg ggcttgctcc atggaggtga 1320

caatctaaat gcggtggagg gtcagctaac aagtgcagaa ggttctctta agagctcaaa 1380

gaagctccaa ccagaaggac tgggcagggg atccagaagg catccccgag tggctactcc 1440

aatggagtgg cttctccatt caggcaaacc tgaatgggat aagtcattgg caggaagatc 1500

tggggccggg ggtcatccag tgggaagggg agagatgacg cggtcagcat ggcgggaaca 1560

caggagcaga aaggaagcag gtgggaagcc aggtcaaggg ccaggggcac ggaaaggggt 1620

cagatgcaga taagtgagtg cttcctggtg catccttcat ccgcaattca tccttacctg 1680

tgcttttgtt gcctccattg cacagctgag gaggccaggg cctgcggagg ttgagagtgt 1740

gctcagggag cccccggagc aaagtggaag ccagattcca gatcagttct gctgggaatt 1800

cccagctccc aaaagccctg ctggctgtca gtccccagtc accacaagca cctatcctgt 1860

gtgggtgggc ctgcagttct gggagatata tcagctgcct gcagcgtcct ttgctgaact 1920

cacagcaaat aggagagaca gggaggggtc cttgggaagc cctaaattga gcttgctgtg 1980

ggagtcctgg gaagaaagga gcctcatcct atcaaaagcc ggggggaaga catcagagtc 2040

cctctgctca ggtcagctgg cacaggtggg tctccaggcc tgggtctcac ttccccagag 2100

ggtgtgttcg ggtggcccca ggctgaggga ggaaagccca cctcccatgt cattttgcaa 2160

atggggagtc agggacctag agatggaaag acaacacagc aagtgaggga tgggttctag 2220

gtcccctgca ccctgcaccc tgcaccctgg ccaacgatgt ctatttggca ccagatctgc 2280

aggctcatct gggggacccc aggacccaga ggcagccggg ttgcatctcg aagctgtgag 2340

ctgcagccca ggaaggtcca ggtctgggtg gcgctgccca agcaggctgc aggcccaagg 2400

aggaacaaag atcctctcaa ggggtgcgga gctgaggttc cggtcctgcc aaagccactt 2460

gatgaccccc aagtgccccc ctttctgcac ctcagagaag agccctcaag cctcccaggt 2520

cccctccagg ggcacgaata agccccagca gggttctgaa ggggtcccag gaatctccct 2580

gtggggatgc ggtggaggtg gaggaggctg cggtggcctg gggacatctc tggtcacagg 2640

tgctggtggt atgagagatg gggtaggcac caagccccct gcagctgtgg ctaggcgggc 2700

ctgcaggaag ggccaggcag gctcctcagg gaccacaaag aacaggggtt ttcacaccta 2760

ggtgggcctg catctagcta ggccagtccc catcaggcca taatgggcac agtgggaggt 2820

agaaccatga gtgagagagg ggaggcttcc agaggcctgg cctgggtccc tgctagattg 2880

agggctctgg ctatggtaca tggatatttc tgctgtggaa tcaaaggagc aggggatgct 2940

gaatatcccc tctggcccta tgccctgcta cctgtccttt cacggaaggg tgtgtgtgta 3000

gggggtgcag gaccaggcct ccctgggtgc atctctgcca ccttgccctt tggctcaggt 3060

ggacctccac caggtattca gaactccagc ccagaaacgc gccaagcctg tggggccaag 3120

acctaggggg tgggggtggc ctccctcccg cctgtagcca aagggtcctc ccttgcccag 3180

ccaggccccg gtgtcgctta ctgctcttat ccacccctcc ttcccaggcc ggtcctcaag 3240

gccccagcaa aggaaccaag ttcccgtgag cctccgaaag gcgaagggca ggcagcagcc 3300

gctggcttct gcgcccacta ggagcttcgg atgcccgagt tagggctgcg ccaaggcggc 3360

cggagcagag agggagacgg ggacggggac aggcagggac aaagtgcaag aggcaaaact 3420

ggctgaaaag cagaagtgta ggagccgcca aggggcggga cgaacaggtc cgtgggccgg 3480

gcggagccaa gggtgggggc cggggtccct ccaggtggca ctcgcggcgc tagtccccag 3540

cctcctccct tcccccggcc ctgattggca ggcggcctgc gaccagccgc gaacgccaca 3600

gcgccccggg cgcccaggag aacgcgaacg gccccccgcg ggagcgggcg agtaggaggg 3660

ggcgccgggc tatatatata gcggctcggc ctcgggcggg cctggcgctc agggaggcgc 3720

gcactgctcc tcagagtccc agctccagcc gcgcgctttc cgcccggctc gccgctccat 3780

gcagccgggg tagagcccgg cgcccggggg ccccgtcgct tgcctcccgc acctcctcgg 3840

ttgcgcactc ccgcccgagg tcggccgtgc gctcccgcgg gccgccacag gcgcagctct 3900

gccccccagc ttcccgggcg cactgaccgc ctgaccgacg cacggccctc gggccgggat 3960

gtcggggccc gggacggccg cggtagcgct gctcccggcg gtcctgctgg ccttgctggc 4020

gccctgggcg ggccgagggg gcgccgccgc acccactgca cccaacggca cgctggaggc 4080

cgagctggag cgccgctggg agagcctggt ggcgctctcg ttggcgcgcc tgccggtggc 4140

agcgcagccc aaggaggcgg ccgtccagag cggcgccggc gactacctgc tgggcatcaa 4200

gcggctgcgg cggctctact gcaacgtggg catcggcttc cacctccagg cgctccccga 4260

cggccgcatc ggcggcgcgc acgcggacac ccgcgacagt gagtggcgcg gccaggcgcg 4320

aaggggcggg ggcggggggc aacggccgcc gggccaaccc gctcagtcac actctgagac 4380

cctcggcggg cacctgctcg ggggccccgg gaaccggggc ggactcgggc tccggtccct 4440

tctgacgcgg ggctggggac gcagacactc ttggctccgg cagcccagcg caacccctga 4500

ggtcgggcgc cgcctcccgc cttcagaaac tcgggctccg agcgccgaat tccagcgcct 4560

tcgcccgtgg gcacagggcg cgcggtgcag ccacaggggg cccgagacac gcgccccggc 4620

ctggcccagg ctggggaacc gctggggtcg ggctcgcgtc tgaaggtccg ggactgggtg 4680

cggccgccgg gggtccccta cacaggcaag ctaatctgag ctagcgcagg cttgggctcc 4740

ggaggcccta gagggcagct tgggctctgg aggcccttgg gggcggctgc gccgggaacc 4800

ctggcccttt atccccaacc ccaccccaga aatagggtcc ccggaggcga acaagccgag 4860

gggcggagtg ggccagggat cacctgcccc gcaatgacct gcgccccgcc cccaggcctg 4920

ctggagctct cgcccgtgga gcggggcgtg gtgagcatct tcggcgtggc cagccggttc 4980

ttcgtggcca tgagcagcaa gggcaagctc tatggctcgg tgagtaccgc aggggtctgg 5040

ctaggcacct agttgggaac agcggacatg gctagcaggc tcgtggcttc tccagcccca 5100

cctgtgcctg ggtcttggag gggtggcagg gtcaccaggt cacgggaccg gcaggcctcc 5160

ccagacaaag gaagcagccc caaggcagga acaatgaggt tcctgccatc cctgagtggg 5220

cccctcccag accgaggaaa gggcgctatt gagagccctt cccttctcta gtccagaggg 5280

gtaggtctca gtgttggaac tgcgggcttg aggctggaca cgcagggaat gaattctctg 5340

gctgctaggt gcagggcagg tggtgagagc accagctgtt gtgggctggc catgtcccct 5400

tctcaccctg tgtgggtctt gacaccttaa ctgctcagca gagacatctc agcccagggt 5460

ggggggtggg acagaagggg gttctgaccc ctggcttcag gctgggtacc ttgcccaaga 5520

ggtgccccag ccctgacact gccctgcttt gctgcagccc ttcttcaccg atgagtgcac 5580

gttcaaggag attctccttc ccaacaacta caacgcctac gagtcctaca agtaccccgg 5640

catgttcatc gccctgagca agaatgggaa gaccaagaag gggaaccgag tgtcgcccac 5700

catgaaggtc acccacttcc tccccaggct gtgaccctcc agaggaccct tgcctcagcc 5760

tcgggaagcc cctgggaggg cagtgccgag ggtcaccttg gtgcactttc ttcggatgaa 5820

gagtttaatg caagagtagg tgtaagatat ttaaattaat tatttaaatg tgtatatatt 5880

gccaccaaat tatttatagt tctgcgggtg tgttttttaa ttttctgggg ggaaaaaaag 5940

acaaaacaaa aaaccaactc tgacttttct ggtgcaacag tggagaatct taccattgga 6000

tttctttaac ttgtcaaaag ttgtcacgag tgtgctgcta ttctgtgttt taaaaaaagg 6060

tgacattgga ttccgatgtc atcccctgta gtatggcgtg gagcatctct gtctggaaag 6120

gcccgcctga ggcttgggca gccagttcag ggagctccca ggcttggctc tcggctagca 6180

tcctcagagg cccactccct ttgtgccctg ttgctattaa tcgggacata tcggtttact 6240

tcgggtacag aaagtgcggt gttgaagtcc tcgctgccac tctgttttta gatctgccaa 6300

gactgacctt tgaactttcc tgtagtcaat cttcctcgat ctaccagatg ggagagaccc 6360

ttggacaact ttataaactc ctgtttgcct tttttggatc agcgacagcc cccatcgctg 6420

tgactattgg ggaaaagacg aagctctttc ataaattcca tggagaggaa tcaatatccc 6480

actggaaggc tagaaatgga caagatagtg tatttgcaat cacaaacaaa accctagtga 6540

tgaaaaataa tttgtgatgg cagatgcttc tgatggtgtg atagaatatg tttttgaaaa 6600

caaaccatcg aaccccccgc cccaccccca aaacgggctt ccctgtgttt agggagcttt 6660

gggctagaac tagctacgat ttttaggtga aatgtccttg taattgtaca aagcacttgg 6720

tgcagtgttt gcgtggagca gcctgctgct ttctgatgca ttccctgttt aagtgcgttt 6780

aacatctacc tcacaagccc tgaaacccca ggcaaaaccc acagaaagct catacccggt 6840

gcaggagttt gccatcccaa gtggcttttt ttccatatgt agccaaaaag gattgcagat 6900

agcgtcggtg cgtcccattc gaaccttgtc acgtttgagc tatctttacc ctgtgattta 6960

cttttagtaa gggtgatcat ggtgaaaata tttgcagaca gctgttacag tacactatat 7020

ggtcaccaag taaccttata tttttcttta tatattttac aaatgtaacc cctgtcattg 7080

aagcaaccgt ggaagaggca gggtcggtga tgtttaaaaa aagttccgag gtgatggcaa 7140

acatttaatt ttaatgaatg actttttaga gtttatacaa aatgacctta gcttgctacc 7200

agaaatgctc cgaatgtttc gtcaagactt taatactctc ctaggatgtt tctgaactgt 7260

ctcccgaatt aactttatgg gagtctacag acagcaagac tggaaaatct gattggagtt 7320

tttgtctttc acattccttt tgaaaactct ttgttcgaat gcaaatcatc gacttaaaat 7380

actattctta accaaggcct ggaagaaaga agacacttgc aaagccgcta agacaggacc 7440

acacatctta aactgctgtt cctaccatgc actaaactgt ttttaagttt taaaccacac 7500

cctaggctcc aggagtgttc aggaaagatg gtgtttgtag gtctccatgc tgtttggcgt 7560

tggggggtgt ggagggatca tccgtcgact ttctgaattt taatgtattc acttagtaac 7620

aaaccatgat tgtcttaaat gccttaaatt attatgagat ttcttgtctc agagcccaat 7680

cagattgtca ggaattaaca tgtgttaggt ttgatcaccc ttgaccactt cttatagata 7740

tttcttcaac aaatcatgtg tgatgcctgt aggaacacaa ctgtaccttt aaaatattgt 7800

tttcatattg ctgtgatggg gattcgaggt tcctgtatgt gccactgttt tcagaatctg 7860

tagttttata caggtgccga ccctcgttgt gatgtatgtg ctgtgcacat tgacatgctg 7920

accgacaatg ataagcgttt atcgtgtata aaaagacacc actggactgg atgtacacaa 7980

ctgggaaagg aattaaaagc tattaaaatt gtgccttgaa atgc 8024

<210>122

<211>7000

<212>DNA

<213>Homo sapiens

<220>

<221>misc_feature

<222>(4389)..(4389)

<223>mRNA start site

<220>

<221>misc_feature

<222>(4454)..(4456)

<223>ATG

<400>122

aatggtatta tagggtaatg agtatccatc tagtatttaa gtatttacat aaattgcagt 60

acttaaagta atctctttac aagttatttt atcaaaaact tttcagacac aattttttgg 120

ggatttattc aaactgttta acacttaaga agtactggct taccttggag atactgctcg 180

tttggtttca gaccactgtg atcaagcaaa aatcgcaata aagcaagtta catgaatttt 240

tttttcgttt cccagtgcat ataaaagtta cacagcagac tattaagtgt gcaacagcat 300

tatgtttaaa aatgtccata ccttaactta aaaatacttt attgttaaaa aatgctaacg 360

atcatataag ccttcagcga gtgataatct ttttgctgat ggagggtctt gcttgatgtt 420

cagagccttg ctgtggcttt ggcttaaggc ttaagggaat attgcagctg gtttgatctt 480

ctatctagac tgctcaaatt ttctgcatat cagcaataag gctgctctgc tctcttatca 540

tttgtgtgtt cactggagta gcacttctaa cttgcttcaa gaacttttct tttgcatttg 600

caactcggat aactggtgca agaggactgg cttttgacct aactcatctt tgggcatgcc 660

tttccccaaa agcttaattt atttctagct tttgatttca aggaagagac gcgcaactct 720

tcctttcact tgagtactta gaggtcattg cagggctatc aattggccta atttcaataa 780

tgttgtgttt taggaaatag agaagcctga ggggagggag agagacgggt gaacagctcg 840

tcagtggagt agtcagaata cacacatgaa tggattaagt ttgggttgtg gtttgtggtg 900

cccaaaacaa ttatggcagt aacatcaaag atcactgatc acagatcatc atgtaaaata 960

ataaggaaat atttgaaata ttgcaagaat taccaaaatg tgacacggag acacaaagtg 1020

agcacatgct gtgggaaaaa cggcaccaac agacttgctc aattcgagga caccacaaaa 1080

cttaatttgt aaaaacacat tatctgtgaa gtacaataaa gtgaagggca ataaaatgat 1140

gtatgcctat gtaaggcaat cagtagatga tgggaaaaaa acattgcatg atttagaaaa 1200

aacaaagaga atatgttatc aaaatgacta aactaatagc ataattagaa tttcatttga 1260

gtatttcttt atagttttga gagatttaaa attatgtatt attttataaa ttattatgga 1320

ggatctccta tatacccagt ctcagactta ttttggtgat tatactctgg aacatgtgat 1380

tcttctcctc gtggggttaa aaaaatttat accatcctat ggggtatgac taatctgaat 1440

ctcacacttg aatattactt tgggatctta ggcaagttat ttaagaataa aaataactta 1500

ctatgtttcc tcaactataa aatgagaatt ttaataatct taaacttact gtaaggatga 1560

aataattttc aatagtatgt aatatgatgc ttagcataca ttaagatctc agtgtatatt 1620

agcaacaatt tcagtaaaga aagaccaaat aatttttgtc aagaaatatg aatatataaa 1680

ttatataggt tttaagttgt atttaccata tttaatgtga cagtaaaaaa agtcacgaaa 1740

atgtgtgacc taataagttt attcagtttt ctaatgtcct gaacccctta tctcagatgg 1800

attttgctcc aaacttataa caataattta caaccctgac tctagttttt ttttctgaga 1860

gaaaaaaata aatagaaaca ctgttctttt tctttcctta cctacaggaa tttacttaca 1920

gaaaaatcta acttctttta aaaacagcct taatcccttg ttgggccaag ggaaaacttt 1980

tccattgttc tctgaaggtt tgctaaaaaa aaaattactg tcaagaggca gatcaataga 2040

agaaaaggca tacacattta tttgatcata attttacaca acccgagagc ctttagaaca 2100

aagacccaaa gttacaaaag aaattgtcca tttttatgct taggttcaac aaagtgtggg 2160

caggtgtgga gaaatacaac tggacaaaag gaatatgatc tcatgctaac agactgagtg 2220

gggacgcctg gcaaggtgag attcttcctg gtatctctgt gcagtactca ttccttctgg 2280

gtatggggca ggaccttctt tggaatgggg tcttatgagc tacgatcaaa caaggtaggt 2340

cagataatgt ctttatggcc agatttcaca cagaaagttg aggtgttaga gtgatatgct 2400

taggttttat ggctggtttg ggaaaaaggg ttctggtttc taggagccac cttgggaaag 2460

agggattcta gtttctatgc ctcgccttgg gggagaatga agggccggag actggagagc 2520

aggagaaggt cagagagagc tgattctgag gtcttcattt ggggtatcat ttttctgagc 2580

ccctacaccc taataaagca caagagatgc agtggagcaa ttcagggtca cggtcaggct 2640

atgcattgaa ctgagatttc ccaaaaagtc tactgaacag taaaaagaaa gtaaaatgga 2700

tcctggggac accagacaga ggctgacaaa tgatttttaa gtaaggagaa aatgataaaa 2760

gagaaggatt agcaatagaa acgggtcata taaaatagat ccctcaaaag gaattctctt 2820

aatccctagc ttctctagat atcccacaac ctcagggact tatcaggcag gttgtttttc 2880

cctgaaagtg ggggtaaggg agctggagga caaatgaagg tggtatgtgg agggaaggct 2940

gttctgtgga tgagtttaat tcagccccac aatcacttct gtacagctac ccaccgctct 3000

agtcattccc acatttggcc tgctttcttt tcctctgtgg acaggggcac tgttctctac 3060

taatatccat ctcagagaga tacaggggca agtatccctc agcatccatt agaaataaag 3120

caggctcttg cttaaagtta ccagagcatc cacctctggg tgcaaagaca aattctctga 3180

atcaagtgag gggtctgggc aatgatctca caaggatttg atacctagga gtccccccat 3240

gcccatacaa gctcctcatc tttccactta cactttggga agctggctgt cgtgtacagg 3300

cagatgaagc tggaaaagag aggcatattc agtactcacg aattcaaaca gcttgaggga 3360

tttccggtga aagtcagtcc taaccagtgt atacgtacat acacaccaac atgtgtgaat 3420

gtgttgtgtg cacgtgtgtg cctgtacaag tccacatggc atatttacct gtcagggaca 3480

ggctatggac aatgactgtt tcttggactt tctcttaaaa agtcagatca gacaagttta 3540

ttttgtatac tttgggtaaa tgtgtggtat ttcgtgagtt tggcagtttg tgaaaaaaaa 3600

aaaaaaaaaa aaaaaaaaaa aaagctgcct gctctgagcc catggggcag gggcaatttt 3660

ttcatctgac aatctgcgtg cttttgtttt gcttgcttat tttggcccca caataccaca 3720

cccttttctt aactaacctc tttctacctg ggctggacgt gcctgggctc tcctccctgg 3780

ccccgctccc acctctccca ggtctctaaa cccctagaga acctgtgtca gtgttttgaa 3840

tccctcagtt gctctagcag gaaaactaga cagattagga gctggggcac atttggctga 3900

aagacagctc ttcgctttct tcttatgctg cttccccttc ctcttttccc aaatagatat 3960

ataaacacat gtattttcct gtttaaattg agcgaattgg tcccctgcct gtgccttgat 4020

ttagccattg ggctcagcct tgctcctccc ttccttactc ggataggagc cactgggatc 4080

tggagctcca gcttccaaat tgaagctggc ctcaggccag gtgacctttt ctttgtaagt 4140

ttctttccta agcgtggggt tggggggagg cggggaatgg ggggggttgc agggatctgt 4200

ttggtgctgt tgaagggggg gcgagtgagg aaaggagggg gctggaagag agtaaagggc 4260

tgttgttaaa cagtttctta ccgtaagagg gagttcagac ctagatcttt ccagttaatc 4320

acacaacaaa cttagctcat cgcaataaaa agcagctcag agccgactgg ctcttttagg 4380

cactgactcc gaacaggatt ctttcaccca ggcatctcct ccagagggat ccgccagccc 4440

gtccagcagc accatgtggg tgaccaaact cctgccagcc ctgctgctgc agcatgtcct 4500

cctgcatctc ctcctgctcc ccatcgccat cccctatgca ggttagttcc cttcttcttc 4560

ttcattatta gtattagtat ttaactctcc tgctaacctt ccctattcct tttaacaccc 4620

tctttttacc ctattcccag catcctttct gaactcagta tgtagtatag gtttctaaaa 4680

gctctcatta tgcttttttt gacattcttt tttgttgttg tttgaatagc atttaaaatg 4740

ataattaact ttccctcaac tcccctccac ctccaaccca agccccgtcc cacttagcct 4800

aatagttgtg gattatgaga tagggaggaa gtgctaatac tggctgaact tggctgcttt 4860

ggacaagttt aaagctaaag agagggtctg gtctgaagag gcaagagtga tggtcagtcc 4920

ggcaggaagt catccttttc cagagaacaa tttttcatga taatgcacta ctccacatca 4980

cctagtcaac atttggagcc aaattacgac tttgtacagg ttttcatttt gaggaggcag 5040

aataaactct gagtatttgc atatcataaa aatgaaagag aaagcctctt tttaaagatc 5100

ttattctttc tgggtacgga tgcctgccct ttgaaactgc agtgcacgga gactttgatt 5160

aaagctgcag aactgcccat ctctgtctcc cactttctcc cttggatttg ccgtttgggg 5220

aggagttgct tgaaagttca tattgcttgg agatttagag arctcgtttg ctgctctggg 5280

aagtttctct tgttatcagg gcaagaggaa acatctgtat tttgttgtat cattgtagag 5340

gctgaggtgc caacgggaga aggcagtgaa tatcaagggt aggcgcaggg gaataaaaga 5400

gtgggaacaa atgcccagat ggagacatgg cctttttaca atataaaaaa gagaactggc 5460

tgtatctttt gagatggtaa atatgacatt tatcagacct ttgatctagt ttttgatatg 5520

gtacaagggt taaaaaactc aagaattttc taaatgcaaa ggaaaatcat tcaacccacc 5580

tggttttctt ttattttgtg aagtggcccg tttggaaaat gacactgttt ggaaagggtc 5640

actctgaaag catttaggta agatttctga agaagtgaaa aagcagtgag ttcaaatcaa 5700

gcaggttatc atgcttgaca tgtgtcatgt taaaatcgct tcacagggtc gggtgcggtg 5760

gctcacgcct gtaatcccag cactttggga ggccgaggcg ggcagatcac gaggtcagga 5820

gattgagacc atcctagcta acaaggtgaa accctgtctc tactaaaaat acaaaaaatt 5880

agccaggcgt ggtggcaggc acctgtagtc ccacctactt gggaggctga ggcaggagac 5940

tctcttgaac ctgggaggtg ggggttgcag tgagccgaga ttgtgtcacc gcacttcagc 6000

ctggggaacg gagcaagact ccatctcaag aagaagaaga aaaaaatgct tcacagatga 6060

ctgctggttt aggggatttt gagcttaaat tgaaataatg gctaatattt tgagggtttt 6120

catttttaaa gattaaaatg tcactgttct taagtagaat ctggttacct gaattcatct 6180

gtgctaacgc aaggggaacg cagtgtggaa aacccaaaca gtagatcaac cgtaggcagt 6240

gtctatttgt tttcggcatg cattatgaac ttttggcagg agacatacat ttgtaattat 6300

atttcacttt gcctaatgta gaaatgactg tgtttcctga gtacaggcag aatgcagccc 6360

aagagtgctg gcaggcaagg agagtccagt tgggaattac aaatatgctg tgaataattc 6420

ctgaagtgga taattctaaa attgtcatca aaggagggtg cgcctttgtt tagatggcca 6480

gtttgatagt tttttttaat aacctttaaa ataaaaaata tgggtagcct cttagaacac 6540

acaaagtttg ttctttttta aatgacattt aatattgact atttagaggt ttcttttgtt 6600

gttactagct ttgattataa ttatttattc tatgaattta tatttgtatg tattgtaaaa 6660

taacacattg ttaggaaaga agtatatact gtaagttgac aaccagttat caacagaata 6720

cactatggag atactttttt aaaagcttaa gaaatattca atataatggg cccccgccat 6780

ctttgtagga gttagcctat atagaattac cctctattca ctcccaccta catgggaaac 6840

aaatatccaa tcctctgtaa taaaagaagc attaaatgag cacctaatat tcaagagtat 6900

gtgggggatg taaagatgaa caaataagaa aggaacttaa atttgttgag caactgatat 6960

gaaccaagta gtaaagtaca tctcacttaa ttctaataag 7000

<210>123

<211>21

<212>PRT

<213>Artificial

<220>

<223>zinc finger consensus

<220>

<221>MISC_FEATURE

<222>(2)..(2)

<223>any amino acid

<220>

<221>MISC_FEATURE

<222>(3)..(3)

<223>between 1 and 4 amino acids of any amino acid

<220>

<221>MISC_FEATURE

<222>(5)..(5)

<223>any amino acid

<220>

<221>MISC_FEATURE

<222>(6)..(6)

<223>any amino acid

<220>

<221>MISC_FEATURE

<222>(7)..(7)

<223>any amino acid

<220>

<221>MISC_FEATURE

<222>(8)..(8)

<223>any amino acid，often aromatic

<220>

<221>MISC_FEATURE

<222>(9)..(9)

<223>any amino acid

<220>

<221>MISC_FEATURE

<222>(10)..(10)

<223>any amino acid

<220>

<221>MISC_FEATURE

<222>(11)..(11)

<223>any amino acid

<220>

<221>MISC_FEATURE

<222>(12)..(12)

<223>any amino acid

<220>

<221>MISC_FEATURE

<222>(13)..(13)

<223>any amino acid

<220>

<221>MISC_FEATURE

<222>(14)..(14)

<223>any amino acid，often hydrophobic

<220>

<221>MISC_FEATURE

<222>(15)..(15)

<223>any amino acid

<220>

<221>MISC_FEATURE

<222>(16)..(16)

<223>any amino acid

<220>

<221>MISC_FEATURE

<222>(18)..(18)

<223>any amino acid

<220>

<221>MISC_FEATURE

<222>(19)..(19)

<223>any amino acid

<220>

<221>MISC_FEATURE

<222>(20)..(20)

<223>between one and three residues of any amino acid

<400>123

Cys Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

1 5 10 15

His Xaa Xaa Xaa His

20

<210>124

<211>21

<212>PRT

<213>Artificial

<220>

<223>RDER Motif for a zinc finger domain

<220>

<221>misc_feature

<222>(2)..(2)

<223>any amino acid

<220>

<221>misc_feature

<222>(3)..(3)

<223>between 1 to 4 residues of any amino acid

<220>

<221>misc_feature

<222>(5)..(7)

<223>any amino acid

<220>

<221>misc_feature

<222>(8)..(8)

<223>any amino acid，frequently aromatic

<220>

<221>misc_feature

<222>(9)..(9)

<223>any amino acid

<220>

<221>misc_feature

<222>(11)..(11)

<223>any amino acid

<220>

<221>misc_feature

<222>(14)..(14)

<223>any amino acid，typically hydrophobic

<220>

<221>misc_feature

<222>(15)..(15)

<223>any amino acid

<220>

<221>misc_feature

<222>(18)..(18)

<223>any amino acid

<220>

<221>misc_feature

<222>(19)..(19)

<223>any amino acid

<220>

<221>misc_feature

<222>(20)..(20)

<223>between 1 and 3 residues of any amino acid

<400>124

Cys Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Arg Xaa Asp Glu Xaa Xaa Arg

1 5 10 15

His Xaa Xaa Xaa His

20

<210>125

<211>6

<212>PRT

<213>Artificial

<220>

<223>exemplary linker consensus

<220>

<221>misc_feature

<222>(3)..(3)

<223>Glu or Gln

<220>

<221>misc_feature

<222>(4)..(4)

<223>Arg or Lys

<220>

<221>misc_feature

<222>(6)..(6)

<223>Tyr or Phe

<400>125

Thr Gly Xaa Xaa Pro Xaa

1 5

<210>126

<211>30

<212>PRT

<213>Artificial

<220>

<223>Exemplary N-terminal sequences

<400>126

Met Val Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Glu Leu Pro Pro Lys

1 5 10 15

Lys Lys Arg Lys Val Gly Ile Arg Ile Pro Gly Glu Lys Pro

20 25 30

<210>127

<211>30

<212>DNA

<213>Artificial

<220>

<223>primer sequence

<400>127

cggggtaccc cctcccagtc actgactaac 30

<210>128

<211>30

<212>DNA

<213>Artificial

<220>

<223>primer sequence

<400>128

ccgctcgagt ccggcggtca cccccaaaag 30

<210>129

<211>89

<212>PRT

<213>Homo sapiens

<400>129

Glu Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser

1 5 10 15

Arg Ser Asp Glu Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys

20 25 30

Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His

35 40 45

Leu Thr Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys

50 55 60

Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His

65 70 75 80

Thr Lys Ile His Leu Arg Gln Lys Asp

85

Claims

1、一种包含DNA结合结构域的多肽，所述DNA结合结构域包括多个锌指结构域，其中

所述DNA结合结构域可结合VEGF基因中的位点，且

所述锌指结构域中的至少两个各自包括表1、表2、表3、表4或表5的第2栏中列出的相应的锌指结构域基序。

2、权利要求1的多肽，其中所述锌指结构域各自包括表1或表3的第2栏中列出的相应的锌指结构域基序。

3、权利要求2的多肽，其中所述锌指结构域选自表1或表3的第3栏中列出的锌指结构域。

4、权利要求3的多肽，其中所述DNA结合结构域包括，按照从N端到C端的顺序，第一、第二和第三锌指结构域，其中

(1)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSHR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RDHT、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSX₁R，其中X₁是H或N；

(2)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSHX₂、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RX₃HR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RDHT，其中X₂是T或V，且X₃是S或D；

(3)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RDHT、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是VSNV；

(4)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是RDER、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是QSSR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是QSHT；

(5)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSSR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是QSHT、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSNR；

(6)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSNR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是QSHR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RDHT；

(7)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSHR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RDHT、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSNR；

(8)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是QSHT、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSHR；

(9)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSHT、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RDER；

(10)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSNR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是QSSR；

(11)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是QSSR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSHR；

(12)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSHT、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是WSNR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSHR；或

(13)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是WSNR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是WSNR。

5、权利要求2的多肽，其中所述锌指结构域选自表2、表4或表5的第3栏中列出的锌指结构域。

6、权利要求1的多肽，其中所述VEGF基因是人VEGF-A基因。

7、权利要求1的多肽，其调节VEGF基因表达。

8、权利要求1的多肽，其中所述多肽进一步包含转录激活结构域、转录阻抑结构域或蛋白转导结构域。

9、权利要求8的多肽，其中所述转录激活结构域包含p65或VP16激活结构域。

10、权利要求8的多肽，其中所述转录阻抑结构域包含Kid或KOX阻抑结构域。

11、权利要求8的多肽，其中所述蛋白转导结构域是TAT蛋白、VP22蛋白或触角足同源结构域的一部分。

12、一种核酸，其包含编码权利要求1的多肽的序列。

13、权利要求12的核酸，其包含编码权利要求8的多肽的序列。

14、一种修饰的哺乳动物细胞，其含有权利要求1的多肽。

15、权利要求14的细胞，其中所述多肽由所述细胞中的权利要求14的核酸产生。

16、一种用于预防或治疗瘤形成疾病、炎症性疾病或基于血管发生的疾病的药物组合物，其包含权利要求1的多肽、权利要求12的核酸或权利要求14的修饰的哺乳动物细胞以及药物学可接受的载体。

17、权利要求16的药物组合物，其中所述瘤形成疾病是癌症。

18、权利要求16的药物组合物，其中所述多肽中包括的锌指结构域选自表1或表3的第3栏中列出的锌指结构域。

19、权利要求18的药物组合物，其中所述多肽包含DNA结合结构域，所述DNA结合结构域包括，按照从N端到C端的顺序，第一、第二和第三锌指结构域，其中

20、一种包囊化的组合物，其包含

由生物相容性材料组成的包囊层，其能透过分子量为至少10kDa的蛋白质，和

重组的哺乳动物细胞，其中所述细胞含有一种核酸，所述核酸包含编码一种调节分泌因子产生的嵌合型锌指蛋白的序列。

21、权利要求20的包囊化的组合物，其中所述分泌因子是胰岛素、胰岛素样生长因子、VEGF、HGF、干扰素、白介素或成纤维细胞生长因子。

22、一种调节VEGF基因表达的方法，其包含

将权利要求1的多肽或权利要求12的核酸导入细胞。

23、权利要求22的方法，其中所述多肽包含转录激活结构域，且VEGF基因表达在所述细胞中是增强的。

24、权利要求22的方法，其中所述多肽包含转录阻抑结构域，且VEGF基因表达在所述细胞中是降低的。

25、权利要求22的方法，其中所述VEGF基因是人VEGF-A基因。

26、权利要求22的方法，其中所述细胞是哺乳动物细胞。

27、权利要求26的方法，其中所述细胞是人的细胞。

28、一种在对象中调节血管发生的方法，其包含

给所述对象施用权利要求16的组合物，所述组合物的量有效降低所述对象的血管发生。

29、权利要求28的方法，其中所述对象是患有癌症或疑似患有癌症的人。