CN103732752A

CN103732752A - 用于在真核生物中调控基因表达或检测和控制dna座位的构建体和方法

Info

Publication number: CN103732752A
Application number: CN201280025347.0A
Authority: CN
Inventors: 克斯廷·拜斯特里奇; 弗兰克·加拉多; 大卫·莱恩; 耐莉·杜巴里
Original assignee: Centre National de la Recherche Scientifique CNRS
Current assignee: Centre National de la Recherche Scientifique CNRS
Priority date: 2011-03-24
Filing date: 2012-03-23
Publication date: 2014-04-16
Also published as: EP2689018A1; CA2830805A1; US9611486B2; FR2973039A1; FR2973039B1; JP2014513933A; US20140045262A1; WO2012127047A1; EP2689018B1

Abstract

本发明涉及基于来源于细菌质粒和染色体DNA的分离系统的序列的构建体，如真核表达载体、融合蛋白和编码该蛋白的多聚核苷酸；本发明还涉及用所述构建体转化或表达所述构建体的真核细胞。本发明还涉及其在调控基因表达，和/或在检测和控制真核细胞中感兴趣的基因组DNA座位的动态学、定位或代谢中的应用。

Description

用于在真核生物中调控基因表达或检测和控制DNA座位的构建体和方法

技术领域

本发明总体上涉及生物技术领域，且尤其涉及在生物技术中有用的仪器的领域。

更具体地，本发明提出了来源于细菌质粒和染色体DNA的分离系统（partitioning system）序列用于在真核细胞、尤其在活的真核细胞中调控基因表达，和/或在所述细胞中检测和控制感兴趣的基因组DNA座位的应用。

因此，本发明涉及在这些调控、检测和控制方法中使用的构建体（诸如真核表达载体、融合蛋白和编码该相同蛋白的寡核苷酸），及转化有所述构建体或表达所述构建体的真核细胞。

本发明还涉及一种用于在真核细胞中调控基因表达的方法，及一种用于在真核细胞中检测和控制感兴趣的基因组DNA座位的方法。

背景技术

典型地，使用双组分系统获得体内基因组DNA座位的可视化，该双组分系统包含被一蛋白（被称为抑制因子（repressor））识别且被该蛋白特异性结合的DNA靶序列（被称为操纵因子（operator））（Belmont,2001;Belmont&Straight,1998;Straight等,1996）。被称作FROS（荧光的抑制因子-操纵因子系统）的该系统已经被常规用于在细菌的活细胞以及哺乳动物的细胞中检测DNA区域的位置。

目前，仅有操纵因子/抑制因子类型的两种系统（即LacO/LacI和TetO/TetR系统）可用于在真核生物中进行体内成像（Bystricky等,2005;Michaelis等,1997;Therizols等,2010）。

这些系统的不足之一在于操纵序列的大小和重复性。这种类型的操纵因子有效地由多于200个重复的细菌操纵序列组成。由于这个原因，在它现在的版本中，LacO操纵因子包含超过10kb的DNA。

即使该技术已经能够进行体内DNA区域的可视化，这些庞大的序列的插入可能修饰染色质纤维的性能。此外，该大小的染色体区域的延伸和压缩可能扭曲动态研究（诸如随时间跟踪荧光颗粒）的进行。

由于这个原因，在活细胞中对染色体的构造和动态学的研究大大受到操纵序列自身大小的限制。还没有开发出用于真核生物的包含短的没有重复的DNA序列的检测技术。

因此，确实需要允许在真核细胞、特别是在活的真核细胞中研究染色体构造和动态学的系统和构建体。本发明人已经为自己制定了确定这样的系统和这样的构件的目标。

在细菌中有丝分裂的过程中染色体的分离或隔离经由包括以下三种单元（element）的系统出现：短的序列（被称为ParS），与ParS结合的ParB蛋白，以及具有调动ParB-ParS复合体的ATPase活性的第二蛋白ParA（Lin&Grossman,1998）。在染色体上，ParS典型地以在复制起始区域内分布的少量拷贝的形式存在（Livny等,2007）。ParB特异地结合在ParS序列中存在的结合序列处。一旦结合，则ParB能够通过它的N-端结构域招募自身的其它拷贝。此外，ParB以双向方式散布在结合位点附近的DNA上（Murray等,2006;Lynch&Wang,1995）。大部分细菌种类包含单一的染色体及具有相同或几乎相同的序列的ParS位点。

相反，细菌洋葱伯克氏细菌（Burkholderia cenocepacia，Bcc）包含三个染色体及具有低量拷贝的质粒，该质粒被称为Par-c1（染色体1的分离系统）、Par-c2（染色体2的分离系统）、Par-c3（染色体3的分离系统）和Par-p1（质粒的分离系统）的特定分离系统独立地分离。这四个复制子中的每一个均携带在大约1kb上分布的具有少量拷贝的特定序列parS（Dubarry等,2006）。在本文章中，通过诸如来源于pDAG203的质粒制备不同的质粒构建体，在该质粒构建体中已经插入了来源于Bcc的染色体或质粒parS序列。所述质粒被用于转化细菌大肠杆菌（Escherichia coli，E.coli）。但是，这些质粒不形成诸如下面限定的真核载体。

在细菌中，且特别在基于着丝粒ParS及与其结合的蛋白ParB的系统中，质粒和染色体DNA的分离系统仅被用在细菌中。更特别地，至今已知的工作已经集中在E.coli的P1质粒的ParB蛋白上。但是，该蛋白具有如下的缺点：仅在被称为IHF（整合宿主因子）的宿主因子存在的情况下与ParS序列上存在的结合位点结合（Li&Austin,2002）。该对IHF的依赖性已经大大限制了对该系统兴趣。由Li&Austin(2002)描述的工作使用对应于全部或部分的E.coli的P1质粒的ParB蛋白与绿色荧光蛋白（GFP）的C末端融合的融合蛋白。使用被修饰为包括编码这些融合蛋白的核苷酸序列且插入细菌菌株（诸如W3110和N100）中的pDSW209质粒产生这些融合蛋白。

类似地，在Surtees&Funnell(1999)的文章中，使用了E.coli的P1质粒的ParB蛋白通过双杂交技术检测和研究ParB的组分之间的相互作用，且尤其是它们的二聚化。在形成的构建体中，全部或部分的E.coli的P1质粒的ParB蛋白与真核生物的转录因子Gal4融合。正是这个事实，促使ParB接近报告基因，其中该报告基因通过与Gal4融合的ParB蛋白与要被描述特征的伴侣（partner）相互作用的方式允许其表达可视化。总之，与诸如在Surtees&Funnell(1999)中描述的融合蛋白的DNA相关联应归功于Gal4，而不是E.coli的P1质粒的ParB，因为后者单独不能有这样的关联。

发明内容

根据本发明，可以解决诸如之前限定的技术问题，且可以达到本发明人设定的目标。

本发明人实施的工作已经允许开发出一种通用的方法通过应用Bcc分离系统以使体内染色质座位的动态学可视化且研究体内染色质座位的动态学在真核细胞中的用途。

该方法的优点之一在于与使用的其他系统（>10kb）相比大大减小基因组插入的大小（1kb），且在于结合序列（在本文也被称为识别序列）的少量重复。由于这个原因，使操纵因子序列的大小保持为本领域的状态所使用的所有方法在本发明的系统和方法中均变为过时的。

以显著的方式，这些构建体不仅可用于检测和控制感兴趣的基因座位且使DNA代谢中的未知步骤（诸如双链断裂过程中的降解）可视化，还可以调控和控制真核生物中的基因表达。

最后，本发明人使用Bcc细菌DNA分离系统的单元的工作的教导可以被概括为任何细菌的任何DNA分离系统的单元，前提是在该细菌中属于DNA分离系统的DNA结合蛋白能够在识别位点处结合DNA，且不需要另一因子（诸如有机因子）且特别是蛋白因子，且有利地还能够招募自身的其它拷贝。

本发明首先涉及真核表达载体，该真核表达载体包括编码特定融合蛋白的核苷酸序列。

“真核表达载体”指适用于在真核细胞中表达由该载体中所包含的核苷酸序列编码的至少一个多肽的载体。所述载体特别用于转化宿主真核生物体，且用于在其中表达如下限定的融合蛋白。

除了编码融合蛋白的核苷酸序列之外，本发明的真核表达载体还包括一个或多个单元，该单元允许该核苷酸序列的表达，即允许该核苷酸序列的转录和翻译。

本发明的真核表达载体有利地选自质粒、粘粒、噬菌体和病毒（诸如杆状病毒）。本发明的载体尤其是自主复制载体，该自主复制载体包括允许该载体在宿主有机体中维持和复制的单元，诸如复制的起始点（origin）。此外，所述载体可包括允许该载体在宿主有机体中的选择的单元。这些单元还被称为“可选择的标记物（selectable marker）”。所述表达载体对于本领域技术人员是公知的，且在文献中有广泛描述。

真核表达载体与原核生物的表达载体的不同在于：在真核载体上，至少存在一个选自真核类型的复制起始点、真核类型的可选择的标记物、真核类型的启动子、放大器（还被称为增强子）、3’UTR信号（非翻译区）、IRES信号（内部核糖体进入位点）和包括剪切位点（cleavage site）和/或polyA信号（多聚腺苷酸信号）的真核生物转录终止信号中的单元。本发明的真核表达载体可包括2、3、4、5、6或7个上面列出的单元，且典型地包括所有这些单元。

“真核类型的可选择的标记物”指如下的标记物：选自要与营养缺陷型宿主有机体一起使用的代谢基因，即补充在宿主有机体的基因组上缺失的各基因的选择基因。所述基因可以是：要与缺失磷酸核糖邻氨基苯甲酸异构酶的真核有机体（诸如trp-酵母）一起使用的trp-1基因；要与缺失乳清酸核苷5-磷酸脱羧酶的真核有机体（诸如ura-酵母）一起使用的URA3基因；要与缺失胸苷激酶的真核有机体一起使用的tk基因；要与缺失腺苷脱氨酶的真核有机体一起使用的ada基因；要与缺失腺嘌呤磷酸核糖转移酶的真核有机体一起使用的Apt基因；要与缺失次黄嘌呤鸟嘌呤磷酸核糖基转移酶的真核有机体一起使用的Hprt基因。应指出的是本发明的真核表达载体还可包含可以在原核生物或真核生物中使用的可选择的标记物，诸如具有对抗生素（诸如氨苄青霉素、新霉素、潮霉素、遗传霉素、萎锈灵、诺尔丝菌素（nourseothricin）或G418）的抗性的细菌基因。

在本发明中，“真核类型的启动子”指适用于任何真核细胞的组成型或诱导型的启动子，及对特定组织具有特异性的组成型或诱导型的启动子。可以在本发明中使用的适用于任何真核细胞的启动子尤其选自CMV启动子（巨细胞病毒），且特别是该启动子的内含子A；CYC1-TetO-7启动子（更多细节参见实验部分）；早期SV40启动子（猿猴病毒40），HSV启动子（单纯疱疹病毒）及TEV启动子（烟草蚀纹病毒）。可以在本发明中使用的对特定组织具有特异性的一种启动子典型地选自对肝细胞具有特异性的PEPCK启动子（磷酸烯醇丙酮酸羧激酶），对上皮细胞（特别是肺细胞）具有特异性的SPA启动子（表面活化蛋白A），对成肌细胞具有特异性的MLC1:3启动子（肌球蛋白轻链），对肿瘤细胞具有特异性的CEA启动子（癌胚抗原），和对骨骼肌细胞具有特异性的MCK启动子（肌肉肌酸激酶）。此外，可在本发明中使用的酵母的诱导型启动子可以是由半乳糖诱导的GAL1启动子，由甲醇诱导的AOX1启动子，由葡萄糖缺乏诱导的ADH-2启动子，由甲硫氨酸缺乏诱导的MET15启动子，或由铜离子诱导的CUP1启动子。在本发明的真核表达载体主体（subject）中，启动子可与一个或多个转录调控序列（即增强子）相关联。

有利地，本发明的真核表达载体包括（可选地连接在一起的）真核类型的启动子、编码融合蛋白的核苷酸序列和包括剪切位点和/或polyA信号的真核转录终止信号。在本发明中，“可选地连接在一起”指各单元连接在一起，从而通过一个单元发挥功能而影响另一个单元发挥功能。例如，启动子当它能够影响其表达时可选地连接至编码序列。调控在载体中可包含的肽的转录、翻译和成熟的单元对于本领域技术人员来说是公知的，本领域技术人员能够从与要在其中进行表达或克隆的真核宿主有机体相关的这些单元中进行选择。

“融合蛋白”指包括至少两个多肽的蛋白，所述两个多肽来自同一来源或来自不同来源且功能性地彼此连接，从而使融合蛋白中的每个多肽均维持自身的功能或活性。

融合蛋白的两个多肽可以经由肽键彼此直接连接，或经由分离这两个多肽的间隔臂（spacer arm）（或连接臂或接合剂）间接连接。第二多肽可直接或间接地与第一多肽的C-末端或N-末端结合。如果该结合是直接结合，则编码每个多肽的核苷酸序列以5’-3’的方向彼此连接，从而破坏被编码的多肽的翻译框。

在本发明的真核表达载体中，核苷酸序列编码包括第一多肽的融合蛋白，所述第一多肽对应于属于细菌DNA分离系统的DNA结合蛋白或其衍生物或片段。因此，本发明涉及一种真核表达载体，所述真核表达载体包括编码融合蛋白的核苷酸序列，所述融合蛋白包括第一多肽，所述第一多肽对应于属于细菌DNA分离系统的DNA结合蛋白或其衍生物或片段。更具体地，本发明涉及真核表达载体，所述真核表达载体包括编码融合蛋白的核苷酸序列，所述融合蛋白包括第一多肽，所述第一多肽对应于属于细菌DNA分离系统的DNA结合蛋白或其衍生物或片段，且该结合不需要任何其它因子。“该结合不需要任何其它因子”指与DNA的结合仅依赖于所使用的属于细菌DNA分离系统的DNA结合蛋白，及DNA上的识别位点，而在特定有机因子中没有其它因子和更多特定的蛋白因子参与该结合。

“细菌DNA的分离系统”指在细菌中有丝分裂的过程中参与染色体且可选地参与质粒的分离（或隔离）的系统。该系统在文献中被称为“par系统”。

如之前所解释的，细菌中的DNA分离系统是3-单元系统，包括:（i）在文献中被称为ParS或着丝粒序列的DNA序列；（ii）与该DNA序列特异性结合的在文献中被称为ParB的蛋白；以及（iii）具有ATPase活性、在文献中被称为ParA的蛋白。因此，“DNA结合蛋白且属于细菌DNA的分离系统”指ParB蛋白。但是，应注意属于细菌DNA的分离系统的DNA结合蛋白还被称作“结合着丝粒类型的序列的蛋白”（即起到着丝粒作用的序列）或被称作其它名称，诸如对于枯草杆菌该蛋白被称作Spo0J。

任何属于细菌DNA分离系统的DNA结合蛋白可潜在地用于本发明中，只要该结合不依赖于另一因子（诸如IHF蛋白）或转录因子（诸如Gal4）。这样，在本发明中使用的融合蛋白中，与DNA的结合仅仅依赖于与属于细菌DNA分离系统的DNA结合蛋白或其衍生物或片段对应的第一多肽。有利地，一旦与DNA结合，属于细菌DNA分离系统的DNA结合蛋白能够招募自身的其它拷贝，且能够涵盖该DNA。本领域的技术人员能够使用常规途径证实属于细菌DNA分离系统的DNA结合蛋白能否用于本发明中。为了该目的，所述技术人员可以使用几种测试，例如包括荧光焦点的形成或凝胶迁移（EMSA）。EMSA是如下的测试：在该测试中，在重组蛋白存在或不存在的情况下进行被属于细菌DNA分离系统的DNA结合蛋白识别的DNA序列的凝胶电泳。如果，存在该蛋白，则与不存在该蛋白的情况相比DNA迁移较短的距离，该蛋白能够单独结合DNA，且因此被包括在本发明的范围内。可以通过将具有识别位点的DNA序列与几种属于细菌DNA分离系统的DNA结合蛋白相接触，且特别通过荧光来使DNA结合蛋白其它拷贝的招募可视化。通过DNA上的荧光焦点使招募实体化。

属于细菌DNA分离系统的DNA结合蛋白，它们的氨基酸序列和/或编码氨基酸序列的核苷酸序列可以在氨基酸或核苷酸序列的数据库中获得，诸如Genbank或对这些细菌的NCBI基因组测序计划（已经对这些细菌的基因组进行全部或部分地测序）。如果需要，本领域的技术人员可使用已经描述的ParB蛋白序列以在细菌中的发现ParB的类似物，其中该细菌的基因组还没有被全部测序或还不知道该细菌中属于细菌DNA的分离系统的DNA结合蛋白。

有利地，属于细菌DNA的分离系统的DNA结合蛋白是来源于洋葱伯克氏细菌的ParB蛋白。该蛋白更特别地选自：

由Bcc的染色体1编码的被定名为ParB-c1的ParB蛋白，诸如可以在NCBI基因组测序计划中N°YP-002229191下获取的Bcc菌株J2315的蛋白；

由Bcc的染色体2编码的被定名为ParB-c2且对应于所附序列表中的SEQID NO:2的蛋白的ParB蛋白，诸如可以在NCBI基因组测序计划中N°YP-002232636下获取的Bcc菌株J2315的蛋白；

由Bcc的染色体3编码的被定名为ParB-c3且对应于所附序列表中的SEQID NO:4的蛋白的ParB蛋白，诸如可以在NCBI基因组测序计划中N°YP-002153395下获取的Bcc菌株J2315的蛋白；

由Bcc的质粒编码的被定名为ParB-p1的ParB蛋白，诸如可以在NCBI基因组测序计划中N°YP-002235439下获取的Bcc菌株J2315的pBCJ2315质粒的蛋白；

及上述蛋白的衍生物或片段。

“属于细菌DNA的分离系统的DNA结合蛋白的衍生物”指如下的肽：分别与属于细菌DNA的分离系统的DNA结合蛋白的序列，特别是与上面给出的序列具有至少30%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%和/或至少99%的一致性。因此，该衍生物的定义涵盖属于细菌DNA的分离系统的DNA结合蛋白的同源物，且特别是涵盖Bcc的ParB蛋白的同源物，且尤其涵盖菌株J2315的ParB-c1、ParB-c2、ParB-c3和ParB-p1的同源物。“Bcc的ParB蛋白的同源物”指从不同于洋葱伯克氏细菌的菌株或菌种（species）中分离的菌株J2315的Bcc的ParB蛋白的不同或相当的形式。

本发明中在两个氨基酸序列之间（或在下面设想的两个核苷酸序列之间）的“百分比一致性”指在两个对比序列之间相同的氨基酸（或核苷酸）残基的比例，在两个序列之间进行最佳比对（优化比对）之后获得该比例。本领域技术人员知道不同的技术（通过该技术可获得产生同源算法的百分比一致性）或计算机程序（诸如BLAST）。

百分比一致性是统计的，且在两个序列之间的差异是沿这些序列分布的。两个序列之间的差异可由序列不同类型的修饰组成：氨基酸（或核苷酸）残基的缺失、取代或添加。

此外，当序列的百分比一致性用于蛋白的表述时，已知不同的残基常常是通过保守氨基酸的取代而不同，其中氨基酸被其它具有相似化学特性（诸如电荷、亲水性或疏水性）的其它氨基酸所取代，因此这些氨基酸的取代不会改变分子的功能特性。当序列因保守的取代而不同时，序列的百分比一致性可以被上调以把取代的保守性质考虑进去。因这样的保守取代而不同的序列被称为具有“序列相似性”或“相似性”。用于获得这样的调控手段对于本领域技术人员来说是公知的。典型地，由将保守取代当作部分错配而不是全部错配组成，从而增加序列的百分比一致性。

从功能的角度列出类似的氨基酸的保守取代的表在现有技术中是公知的。例如，以下8个组均包含对另一个是保守取代的氨基酸：（1）丙氨酸（A），甘氨酸（G）；（2）天冬氨酸（D），谷氨酸（E）；（3）天冬酰胺（N），谷氨酰胺（Q）；（4）精氨酸（R），赖氨酸（K）；（5）异亮氨酸（I），亮氨酸（L），甲硫氨酸（M），缬氨酸（V）；（6）苯丙氨酸（F），酪氨酸（Y），色氨酸（W）；（7）丝氨酸（S），苏氨酸（T）；及（8）半胱氨酸（C），甲硫氨酸（M）。

在本发明中，属于细菌DNA的分离系统的DNA结合蛋白的衍生物是在氨基酸序列上与属于细菌DNA的分离系统的DNA结合蛋白具有至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的相似性的多肽。

因此，在属于细菌DNA的分离系统的DNA结合蛋白及其衍生物之间的修饰，且尤其是在Bcc的ParB蛋白及其衍生物之间的修饰可以由氨基酸的取代、添加或缺失组成。不考虑所应用的修饰的类型，这些修饰不会破坏属于细菌DNA的分离系统的DNA结合蛋白的衍生物、尤其是Bcc的ParB蛋白的衍生物与DNA特异性结合的能力，且所述结合不需要任何其它因子。所设想的取代可以是相当的氨基酸（即具有结构同源性的氨基酸或基本没有改变属于细菌DNA的分离系统的DNA结合蛋白的性质的氨基酸）之间的取代。作为变体，所设想的取代可以是通过非相当的氨基酸（即不具有结构同源性的氨基酸）的取代。但是，这些修饰不会破坏属于细菌DNA的分离系统的DNA结合蛋白的衍生物、尤其是Bcc的ParB蛋白与DNA特异性结合的能力。

属于细菌DNA的分离系统的DNA结合蛋白的衍生物、特别是Bcc的ParB蛋白的衍生物还可与属于细菌DNA的分离系统的DNA结合蛋白的序列进行对比，特别与上面已经给出的Bcc的ParB蛋白进行对比，具有至少一个额外的C-末端和/或N-末端的氨基酸、翻译后修饰和/或化学修饰，特别是糖基化、酰胺化、酰化、乙酰化、乙基化和防止其降解的保护基团。有利地，与属于细菌DNA的分离系统的DNA结合蛋白的序列进行对比，特别与Bcc的ParB蛋白进行对比的所述衍生物，且更特别是与上面已经给出的Bcc的ParB蛋白进行对比的衍生物可具有1、2、3、4、5、6、7、8、9或10个额外的C-末端氨基酸和/或1、2、3、4、5、6、7、8、9或10个额外的N-末端氨基酸。

属于细菌DNA的分离系统的DNA结合蛋白的衍生蛋白、特别是Bcc的ParB蛋白的衍生物还可以是如下的蛋白，该蛋白的一个（或更多个）氨基酸选自由如下氨基酸所组成的组中：自由旋光对映体，非对映异构体，D-构象的天然氨基酸，β-氨基酸，取代的α-氨基酸，稀有氨基酸，特别是羟基脯氨酸、羟基赖氨酸、别羟基赖氨酸、6-N-甲基赖氨酸、N-乙基甘氨酸、N-甲基甘氨酸、N-乙基天冬氨酸、别异亮氨酸、N-甲基异亮氨酸、N-甲基缬氨酸、焦谷氨酸、氨基丁酸，及合成的氨基酸，特别是鸟氨酸、正亮氨酸、正缬氨酸、环己基丙氨酸和Ω氨基酸。属于细菌DNA的分离系统的DNA结合蛋白的衍生物、特别是根据本发明的Bcc的ParB蛋白的衍生物还包括反转-肽（retro-peptide）和反转-变型肽（retro-inverso peptide），及其侧链的一个或多个氨基酸被不会改变衍生物特异性结合DNA的能力的基团所取代的肽。

因此，不考虑所设想的衍生物的类型，属于细菌DNA的分离系统的DNA结合蛋白的衍生物、特别是Bcc的ParB蛋白的衍生物保持其与DNA特异性结合的能力，所述结合不依赖于任何因子，特别是不依赖于任何有机因子，且更特别是不依赖于任何蛋白因子。

在本发明中，“属于细菌DNA的分离系统的DNA结合蛋白的片段”指属于细菌DNA的分离系统的DNA结合蛋白、特别是Bcc的ParB蛋白的每一部分或每一段，该每一部分或每一段保持其与DNA特异性结合的能力，所述结合不依赖于任何因子，特别是不依赖于任何有机因子，且更特别是不依赖于任何蛋白因子。属于细菌DNA的分离系统的DNA结合蛋白的片段、特别是Bcc的ParB蛋白的片段与其序列已在上文描述的属于细菌DNA的分离系统的DNA结合蛋白相比，特别是与Bcc的ParB蛋白相比，且更特别地与Bcc的ParB蛋白相比，在C-末端和/或N-末端少至少一个氨基酸。

有利地，属于细菌DNA的分离系统的DNA结合蛋白的片段、特别是Bcc的ParB蛋白的片段包含至少参与DNA结合的基序。所述基序对应于具有诸如在Dubarry等,2006中描述的螺旋-转角-螺旋的结构（HTH）的基序。HTH基序显著地对应于位于所附序列表中的序列SEQ ID NO:2的氨基酸第202位和225位之间的序列。但是，应注意不是每一个属于细菌DNA的分离系统的DNA结合蛋白均必需具有HTH结构的DNA结合基序。例如，在细菌TP228中的ParB蛋白的同源物在C-末端具有带-螺旋-螺旋结构（Golovanov等,2003）。

显然，包括第一多肽的融合蛋白不包括细菌分离系统的蛋白或其本身的一种同源物，所述第一多肽对应于属于细菌DNA的分离系统的DNA结合蛋白、且特别是Bcc的ParB蛋白或其一种衍生物或片段。

在本发明的真核表达载体中，核苷酸序列编码包括第二多肽的融合蛋白，所述第二多肽是可容易检测到的多肽或参与基因表达调控的多肽。

在本发明中，“可容易检测到的多肽”指通过应用适当的检测技术可以检测到的多肽，其中所述适当的检测技术有利地是非侵入性的，诸如显微观察、闪烁扫描术和荧光。包括所述可容易检测到的多肽的融合蛋白特别能够确定和定位属于细菌DNA的分离系统的DNA结合蛋白、特别是Bcc的ParB蛋白能够结合的DNA位点，该蛋白对应于融合蛋白的其他多肽。

在第一实施方式中，可容易检测到的多肽可以是能够在特定条件下（诸如当存在适用的底物时），产生可检测且可选地产生可定量的信号的酶。如例示的但非限制性的实例，可以提及碱性磷酸酶、过氧化物酶、乙酰胆碱酯酶（AChE）、葡萄糖淀粉酶和溶菌酶。

在第二实施方式中，可容易检测到的多肽可以是生物性发光的荧光多肽，诸如水母发光蛋白；螅蛋白（obeline）；荧光素酶和荧光蛋白，诸如绿色荧光蛋白（GFP）、e-GFP蛋白（增强的GFP）、增强的青色荧光蛋白（eCFP）、增强的黄色荧光蛋白（eYFP）、增强的蓝色荧光蛋白（eBFP）、红色荧光蛋白DsRed和Keima，及其变异体，诸如在405nm处被光激活的GFP蛋白（PA-GFP）、pH-敏感的GFP蛋白（PHluorin）、天蓝色蛋白、石青蛋白、山羊角膜缘干细胞荧光蛋白（Venus protein）、mCherry蛋白和Citrin蛋白。

在本发明中，“参与基因表达调控的多肽”指如下多肽，与至少一个基因在相同操作条件下但不存在该多肽的表达相比，该多肽使该至少一个基因的表达出现增加或降低。

本领域的技术人员知道可以影响一个（或多个）基因表达的不同类型的多肽。有利地，这样的多肽可以选自正转录因子或负转录因子、常规转录因子、启动子的表达调控因子、染色质重构因子和修改相邻基因的位置的因子，及其衍生物或片段。

例如，参与基因表达调控的多肽可以对转录复合体的招募，或染色质的状态，或其表达要受调控的基因的位置起到正向或负向、直接或间接的作用。作用于染色质状态的多肽可以对DNA去紧密（decompaction）、DNA展开、胞嘧啶的甲基化或组蛋白的乙酰化起作用。作用于其表达要受调控的基因的位置的多肽可以是在特定的细胞器或特定的细胞区召唤（address）或招募邻近基因的因子。作为非限制性实例，特定的细胞器或特定的细胞区可以是细胞膜或核周（nuclear periphery）。该召唤可包含对特定的细胞器或特定的细胞区具有特异性的蛋白，或抗所述蛋白的单克隆抗体或多克隆抗体，或其衍生物或片段。

如上文所限定的因子或调控因子的“衍生物”指与上文所限定的因子或调控因子具有至少40%相似性和/或至少30%一致性，并且是已知的且能够负向或正向地影响基因表达的多肽。如上面所限定的因子或调控因子的“片段”指如上文所限定的因子或调控因子的已保持其影响基因表达能力的任何部分或任何段。此外，优选实施方式描述了属于细菌DNA的分离系统的DNA结合蛋白的衍生物和片段以作必要的修正地应用于如上所限定的因子或调控因子的衍生物和片段。

更具体地，参与基因表达调控的多肽选自下面非穷举的实例列表：

转录因子TFIIA、TFIIB、TFIID、TRIIE、TFIIF、TFIIH、NF-κB、SP1、热休克因子；

核纤层蛋白、膜蛋白、抗膜蛋白的抗体或抗体片段；

细胞核受体，诸如雌激素受体,视黄酸受体,糖皮质激素受体,雄激素受体、3-酮甾类的受体或甲状腺激素类受体；

乙酰基转移酶、脱乙酰基酶、甲基转移酶、聚ADP核糖基转移酶、泛素连接酶、磷酸酶、激酶或淀粉酶（sumoylase）。

在本发明的真核表达载体中，核苷酸序列编码包括如上文所限定的第一多肽和第二多肽的融合蛋白，所述核苷酸序列进一步能够编码细胞内定位信号。

但是，由于本发明中所使用的融合蛋白可以是小尺寸的，这特别要归功于包含在其中的第一多肽的大小，因此细胞内定位信号的存在不是强制性的，而融合蛋白能够在细胞内和细胞核的容积内自由扩散。

当融合蛋白包括可选地连接至如之前所限定的第一多肽和第二多肽的细胞内定位信号时，该信号可以是细胞核定位信号。所述附在融合蛋白的两个多肽中一个多肽的末端、但不会影响这些多肽的一个或另一个的功能的信号促进融合蛋白在细胞核内的转运。本领域的技术人员具有不同细胞内定位信号的知识，且特别是可以在本发明中使用的不同的细胞核定位信号的知识。

本发明还涉及由如之前所限定的真核表达载体的核苷酸序列编码的特定的融合蛋白。

因此，在第一实施方式中，本发明的融合蛋白包括：

第一多肽，对应于属于细菌DNA分离系统的DNA结合蛋白或它的衍生物或片段，且所述结合不需要任何其它因子，特别是如之前所限定的；以及

参与基因表达调控的第二多肽，特别是如之前所限定的。

在第二实施方式中，本发明的融合蛋白包括：

对应于来源于洋葱伯克氏细菌的ParB蛋白、特别是如之前所限定的它的衍生物或片段的第一多肽；以及

特别是如之前所限定的容易检测到的第二多肽。

在不考虑实施方式的情况下，本发明的融合蛋白可选地包括特别是如之前所限定的细胞内定位信号。

本发明还涉及编码如之前所限定的融合蛋白的核苷酸。

因此，本发明还涉及选自下面不同的核苷酸的分离的多聚核苷酸：

i）编码如之前所限定的本发明的融合蛋白的多聚核苷酸；

ii）与在第i）条中所限定的所述多聚核苷酸互补的多聚核苷酸；

iii）具有至少14个核苷酸且特别是具有至少18个核苷酸的多聚核苷酸，该多聚核苷酸能够在高严格性条件下与所述在第i）条和第ii）条中所限定的多聚核苷酸杂交。

在本发明中，“多聚核苷酸”指核酸、核序列（nucleic sequence）、核酸序列、寡核苷酸、多聚核苷酸序列、核苷酸序列、单链DNA、双链DNA或RNA。本发明的多聚核苷酸包括天然的核苷酸，且可选地包括非天然的核苷酸。

本发明的多聚核苷酸不对应于处于其天然状态下（即在它的天然染色体环境下）的核苷酸。多聚核苷酸不对应于编码多肽（诸如本发明的第一多肽和第二多肽）的天然多聚核苷酸。相反，分离且可选地纯化本发明的多聚核苷酸，且该多聚核苷酸的环境随之被修改。本发明的多聚核苷酸还可通过基因重组或化学合成来获得。

高严格性的条件对应于允许保持两条互补核苷酸序列之间的杂交的温度和离子强度的条件。本领域技术人员应知道如何根据核苷酸序列的大小且参考Sambrook等（分子克隆（Molecular cloning）,1989,Noland C.编辑,纽约：冷泉港实验室出版社（New York:Cold Spring Harbor Laboratory Press））来确定最适用的高严格条件。作为非限制性的例示实例，在进行杂交步骤时为了限定上面描述的第（iii）条的多聚核苷酸，高严格条件有利地为：以如下两步骤进行特别是DNA-DNA或DNA-RNA类型的杂交：（1）预杂交：在包括含0.75M NaCl、0.075M柠檬酸钠、50%甲酰胺、7%十二烷基磺酸钠（SDS）、10x Denhardt's、5%去硫酸葡聚糖和1%鲑鱼精DNA的溶液的磷酸缓冲液（20mM，pH7.5）中在42℃保持3h；（2）被适当地称为杂交：进行两次在包含0.3M NaCl、0.03M柠檬酸钠和2%SDS的溶液中在20℃清洗20min的步骤，进行一次在包含0.015MNaCl、1.5mM柠檬酸钠和0.1%SDS的溶液中在20℃清洗20min的步骤，之后在依赖于探针大小的温度（例如对于大小为＞100nt的探针在42℃）下保持20h。对于大小为＞100nt的探针，在包含0.015M NaCl、1.5mM柠檬酸钠和0.1%SDS的溶液中在60℃保持30min来进行最后的清洗。

第iii）条的多聚核苷酸（即能够在高严格性条件下与如在第i）条和第ii）条中限定的多聚核苷酸进行杂交的多聚核苷酸）包括至少20、至少50、至少100、至少150、至少200、至少250或至少300个核苷酸。

本发明的多聚核苷酸包括至少一条与编码如之前所限定的属于细菌DNA的分离系统的DNA结合蛋白中的一条核苷酸序列具有至少30%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%和/或至少99%的一致性的核苷酸序列，属于细菌DNA的分离系统的DNA结合蛋白特别是来源于洋葱伯克氏细菌的ParB蛋白，且更特别是由Bcc的染色体1携带的被定名为ParB-c1的ParB蛋白、由Bcc的染色体2携带的被定名为ParB-c2的ParB蛋白、由Bcc的染色体3携带的被定名为ParB-c3的ParB蛋白和由Bcc的质粒携带的被定名为ParB-p1的ParB蛋白。

例如，本发明的多聚核苷酸包括至少一条与所附序列表中的序列SEQ IDNO:1（即由Bcc的染色体2携带的被定名为ParB-c2的序列编码ParB蛋白）或与所附序列表中的序列SEQ ID NO:3（即由Bcc的染色体3携带的被定名为ParB-c2的序列编码ParB蛋白）具有至少30%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%和/或至少99%的一致性的核苷酸序列。

本发明的多聚核苷酸还明显地包括之前设想的属于细菌DNA的分离系统的DNA结合蛋白的序列编码片段，该序列与编码这些片段的序列以及与所述序列互补的序列具有至少30%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%和/或至少99%的一致性。从编码属于细菌DNA的分离系统的DNA结合蛋白的所设想的片段序列和核苷酸序列，本领域技术人员容易确定编码特定片段的核苷酸序列。

本发明的多聚核苷酸还明显地包括编码之前设想的属于细菌DNA的分离系统的DNA结合蛋白的衍生物的序列，该序列与编码这些衍生物的序列和与所述序列互补的序列具有至少30%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%和/或至少99%的一致性。从编码属于细菌DNA的分离系统的DNA结合蛋白的所设想的衍生物的序列和核苷酸序列，本领域技术人员容易确定编码特定衍生物的核苷酸序列。

此外，本发明的多聚核苷酸包括编码如之前所设想的可容易检测到的多肽或参与基因表达调控的多肽的至少一条其它的核苷酸序列，该序列与编码这些多肽的序列以及与所述序列互补的序列具有至少30%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%和/或至少99%的一致性。

当对比（核糖）核酸时，还可确定他们的相似性。在这种情况下，在密码子水平评价相似性。如果是两个不同的密码子编码相同的氨基酸或两个不同的密码子编码两个相似的氨基酸，则这两个密码子是相似的。

本发明的多聚核苷酸包括至少一条与如之前所限定的编码属于细菌DNA的分离系统的DNA结合蛋白的核苷酸序列中的一条具有至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%和/或至少99%的相似性的核苷酸序列，属于细菌DNA的分离系统的DNA结合蛋白特别是来源于洋葱伯克氏细菌的ParB蛋白，且更特别是由Bcc的染色体1携带的被定名为ParB-c1的ParB蛋白、由Bcc的染色体2携带的被定名为ParB-c2的ParB蛋白、由Bcc的染色体3携带的被定名为ParB-c3的ParB蛋白和由Bcc的质粒携带的被定名为ParB-p1的ParB蛋白。

因此，本发明的多聚核苷酸包括至少一条与所附序列表中的序列SEQ IDNO:1（即由Bcc的染色体2携带的被定名为ParB-c2的编码ParB蛋白的序列）或与所附序列表中的序列SEQ ID NO:3（即由Bcc的染色体3携带的被定名为ParB-c3的编码ParB蛋白的序列）具有至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%和/或至少99%的相似性的核苷酸序列。

本发明的多聚核苷酸还明显地包括编码之前设想的属于细菌DNA的分离系统的DNA结合蛋白的片段的序列，该序列与编码这些片段的序列或与所述序列互补的序列具有至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%和/或至少99%的相似性。从设想的片段的序列和编码属于细菌DNA的分离系统的DNA结合蛋白的核苷酸序列，本领域技术人员容易确定编码特定片段的核苷酸序列。

本发明的多聚和肝素还明显地包括编码之前设想的属于细菌DNA的分离系统的DNA结合蛋白的衍生物的序列，该序列与编码这些衍生物的序列以及与所述序列互补的序列具有至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%和/或至少99%的相似性。从设想的衍生物的序列和编码属于细菌DNA的分离系统的DNA结合蛋白的核苷酸序列，本领域技术人员容易确定编码特定衍生物的核苷酸序列。

此外，本领域的多聚核苷酸包括至少一条其它的编码可容易检测到的多肽或如之前设想的参与基因表达调控的多肽的核苷酸序列，该序列与编码这些多肽的序列以及与所述序列互补的序列具有至少30%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%和/或至少99%的相似性。

最后，本发明的多聚核苷酸可包括至少一条其它的编码细胞内定位序列、特别如之前所限定的细胞内定位序列的核苷酸序列。

本发明还涉及一种真核载体，所述真核载体包括具有至少一个被属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点的核苷酸序列。所述真核载体进一步包括如之前所限定的真核类型的可选择的标记物，具有至少一个被属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点。本发明的真核载体通常为质粒形式。

有利地，真核载体是整合型真核载体。“整合型真核载体”指如下的载体：该载体的全部或部分核苷酸序列能够被整合在有机体的基因组中，其中所述载体被插入所述有机体中。此外，进入宿主有机体基因组的整合可以发生在特定的预定的基因组位点处或随机发生。靶定的整合使用同源重组。在这种情况下，携带通过PCR产生的所述序列的整合型真核载体或片段在具有至少一个被属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点的核苷酸序列的两侧具有适当的序列，以允许该同源重组。

在本发明中，可以使用属于原核生物的质粒或染色体DNA的分离系统的蛋白结合的任何识别位点。Dubarry等（2006）的文献描述了被属于细菌DNA的分离系统的不同DNA结合蛋白识别的不同的识别位点。所有这些识别位点均在本发明的范围内。本发明中使用的识别位点优选是双链的。

有利地，被属于细菌DNA的分离系统的DNA结合蛋白识别的，且在本发明中使用的识别位点是核苷酸序列（I）或与核苷酸序列（I）互补的序列的识别序列：

N₁N₂TN₃N₄N₅N₆CGN₇N₈N₉N₁₀AN₁₁N₁₂（I）（所附序列表中的SEQ ID NO:5），其中，核苷酸N₁和N₁₂相同或不同，或选自A、G、C或T；且核苷酸对(N₆,N₇)、(N₅,N₈)、(N₄,N₉)、(N₃，N₁₀)和(N₂,N₁₁)彼此独立地选自由(A,T)、(T,A)、(C,G)和(G,C)所组成的组中；核苷酸N₁和N₁₂可能可选地是缺失的。

有利地，在上述序列（I）中，N₁是缺失的或代表G、C或T；核苷酸对(N₆,N₇)代表(A,T)、(T,A)或(G,C)；核苷酸对(N₅,N₈)代表(C,G)或(T,A)；核苷酸对(N₄,N₉)代表(A,T)、(T,A)、(C,G)或(G,C)；核苷酸对(N₃,N₁₀)代表(G,C)或(T,A)；核苷酸对(N₂,N₁₁)代表(T,A)或(G,C)；且N₁₂是缺失的或代表A或C。

在识别位点处，对称性（N₂～N₆与N₇～N₁₁）对于识别是最重要的。因此，具有相同对称结构的序列能够具有相同的特性，且不需要具有核苷酸一致性。

在本发明中使用的被属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点特别是核苷酸序列（II）或与核苷酸序列（II）互补的序列:

N₁₃TTN₁₄N₁₅N₁₆N₁₇CGN₁₈N₁₉N₂₀N₂₁AAC（II）（所附序列表中的SEQ ID NO:6），其中：

N₁₃代表G,C or T；

核苷酸对(N₁₄,N₂₁)代表(T,A)或(G,C)；

核苷酸对(N₁₅,N₂₀)代表(A,T)或(T,A)；

核苷酸对(N₁₆,N₁₉)代表(T,A)或(C,G)；

核苷酸对(N₁₇,N₁₈)代表(G,C)或(A,T)。

有利地，被属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点具有选自下面的核苷酸序列的核苷酸序列：

GTTTATGCGCATAAAC（Sc2；所附序列表中的SEQ ID NO:7）；

CTTTATGCGCATAAAC（Sc2；所附序列表中的SEQ ID NO:8）；

GTTGTCACGTGACAAC（Sc3；所附序列表中的SEQ ID NO:9）；

TTTGTCACGTGACAAC（Sc3；所附序列表中的SEQ ID NO:10）；

CTTGTCACGTGACAAC（Sc3；所附序列表中的SEQ ID NO:11）；

及与这些序列中的任一序列互补的序列。

本发明的可选的整合型真核载体的核苷酸序列包括至少2个、至少3个或至少4个被如之前所限定的属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点。如果本发明的多聚核苷酸包括至少2个识别位点，在两个连续的识别位点可以是彼此相同或不同的。如果本发明的多聚核苷酸包括至少2个识别位点，则两个连续的识别位点可以被至少1个核苷酸、特别是至少10个核苷酸、更特别地至少50个核苷酸且尤其是至少100个核苷酸间隔开。

根据本发明，可选的整合型真核载体的核苷酸序列可以是天然的、合成的或通过天然序列的突变而获得的。

根据本发明，可选的整合型真核载体的核苷酸序列有利地包括参与细菌分离系统的着丝粒序列。该着丝粒序列特别地可以是来源于枯草杆菌（Bacillussubtilis）、柄杆菌（Caulobacter crescentus）等的序列。

在一具体实施方式中，根据本发明的可选的整合型真核载体的核苷酸序列有利地包括参与洋葱伯克氏细菌（Bcc）的分离系统的着丝粒序列，已知名称为ParS的序列。进一步地，该核苷酸序列特别对应于选自以下序列的序列：

由Bcc的染色体1携带的被定名为ParS-c1的ParS序列，所述被定名为ParS-c1的ParS序列可以从在Genbank中的N°AM747720下可获取的Bcc菌株J2315的染色体1的核苷酸序列中获得，在该序列中包含的两个识别位点分别位于核苷酸26477～26492和28403～28418；

由Bcc的染色体2携带的被定名为ParS-c2的ParS序列，所述被定名为ParS-c2的ParS序列可以从在Genbank中的N°AM747721下可获取的Bcc菌株J2315的染色体2的核苷酸序列中获得，且对应于所附序列表中的SEQ ID NO：12的蛋白；

由Bcc的染色体3携带的被定名为ParS-c3的ParS序列，所述被定名为ParS-c3的ParS序列可以从在Genbank中的N°AM747722下可获取的Bcc菌株J2315的染色体3的核苷酸序列中获得，且对应于所附序列表中的SEQ ID NO：13的蛋白；

由Bcc的质粒携带的被定名为ParS-p1的ParS序列，所述被定名为ParS-p1的ParS序列可以从在Genbank中的N°AM747723下可获取的Bcc菌株J2315的质粒pBCJ2315的质粒的核苷酸序列中获得，在该序列中包含的三个识别位点分别位于核苷酸92285～92300、92385～92400和92438～92453；或

与这些序列中任一个序列互补的序列。

本发明还涉及被如之前所限定的真核表达载体或可选地如之前所限定的整合型真核载体转化或包含如之前所限定的真核表达载体或可选地如之前所限定的整合型真核载体的真核宿主有机体。

“真核宿主有机体”指任何真核有机体（单细胞或多细胞、低级或高级），在该真核有机体中插入如之前所限定的真核表达载体或如之前所限定的整合型真核载体。

因此，根据本发明的真核宿主有机体可以是微生物，如酵母或真菌。

作为变体，根据本发明的真核宿主有机体可以是动物细胞，如昆虫细胞或哺乳动物细胞，且特别是：人类细胞、仓鼠细胞、猴细胞、兔细胞、小鼠细胞、大鼠细胞等；植物细胞；植物；或，除了人类之外的动物。事实上，上述宿主有机体可以是转基因植物或除了人类之外的转基因动物。

在本发明中，可以以悬浮液中的培养物、培养皿上的培养物、组织培养物或器官培养物的形式提供细胞类型的宿主有机体。

本领域技术人员知道用于如之前所限定的真核表达载体或如之前所限定的整合型真核载体的有效插入的不同的转化或转染方法。根据本发明的表达载体的插入导致如之前所限定的融合蛋白的产生。

作为实例且以非穷尽的方式，该方法可以是：电穿孔法；脂质体法；微注射；粒子（或基因枪（biolistic））轰击；使用根癌农杆菌（Agrobacteriumtumefasciens）的植物转化；经由通过温度升高的化学渗透的转化，热休克，使用去垢剂的处理或使用聚乙二醇的处理；使用DEAE-葡聚糖方法的转化，或经由病毒、病毒粒子或病毒颗粒的插入。

有利地，本发明的宿主有机体被如之前所限定的真核表达载体或如之前所限定的可选的整合型真核载体转化或包含如之前所限定的真核表达载体或如之前所限定的可选的整合型真核载体。

本发明的宿主有机体特别是在其基因组或在该宿主有机体作为质粒或转座子包含的外源性DNA中具有整合的核苷酸，该整合的核苷酸具有至少一个被如之前所限定的属于细菌DNA的分离系统的DNA结合蛋白（即存在于本发明的整合型真核载体上的核苷酸序列）识别的识别位点，且表达如之前所限定的融合蛋白（即由存在于本发明的真核表达载体上的核苷酸序列编码的融合蛋白）。

更特别地，本发明的宿主有机体瞬时表达如之前所限定的融合蛋白。作为变体，本发明的宿主有机体组成性地表达如之前所限定的融合蛋白。

如之前所解释地，可以使用同源重组将具有至少一个被如之前所限定的属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点的核苷酸序列插入宿主有机体的特定的预定位点处。有利地，在这种情况下，该宿主有机体是酵母。在这种情况下，与具有至少一个被属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点的核苷酸序列的插入位点邻近的基因是已知的。

作为变体，可以随机进行宿主有机体基因组的插入。在这种情况下，技术人员能够使用常规的分子生物技术确定该插入的位置。因具有该位置的知识，本领域技术人员可以选择宿主有机体，插入在该宿主有机体中发生在感兴趣的位点。因此，所选择的宿主有机可以产生稳定的细胞系，如稳定的哺乳动物的细胞系。

无论以定向或随机的方式进行插入，均可能获得如下的宿主有机体：在该宿主有机体中，在一个或多个感兴趣的位点（如接近致癌基因的位点、接近肿瘤抑制因子的位点、接近参与遗传疾病的基因的位点等）发生插入。

在这种情况下，如果由宿主有机体表达的融合蛋白包括参与基因表达调控的多肽，特别如之前限定的，所述融合蛋白可以正向或负向控制如下基因的表达：该基因邻近具有至少一个被属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点的核苷酸序列的插入位点。

类似地，可以检测能够控制该表达的分子。“能够控制该表达的分子”指天然或合成的分子，特别是可以影响基因表达的生物分子或生物活性分子。有利地，该分子选自：抗原决定簇；抗原；肽；寡肽；蛋白，如酶；抗体和抗体的片段；细胞受体或膜受体；多糖；及，核酸分子，如单链或双链DNA、RNA、iRNA、miRNA、适配体、PNA（肽核酸）或LNA（锁核酸）。所述分子可以在治疗领域具有应用。

本发明提出了一种用于检测能够正向或负向控制感兴趣的基因表达的分子的方法。该方法包括：

使所述分子与本发明的宿主有机体相接触，在所述宿主有机体中表达融合蛋白，所述融合蛋白包括根据本发明的参与基因表达调控的多肽；且在所述宿主有机体中已经在接近感兴趣的基因处插入具有至少一个被属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点的核苷酸序列；

检测该感兴趣的基因的表达，且与不存在所述分子时所获得的表达相对比。

如果无论测试分子存在与否，表达均相同，则该分子对所述表达没有影响。相反，如果在这两种表达中存在差异，则测试分子对该表达具有直接或间接的、正向或负向的影响。

作为变体，如果由宿主有机体表达的融合蛋白包括可容易检测到的多肽，则可以体内检测在宿主有机体中包含的基因组DNA或外源性DNA（如质粒或转座子）的感兴趣位点的位置，及其在正常条件下或在能够影响该位置的分子存在下的动态学。

“能够影响该位置的分子”指可以修改基因的位置的天然或合成的分子，特别是生物或生物活性的分子。有利地，该分子选自：抗原决定簇；抗原；肽；寡肽；蛋白，如酶；抗体和抗体的片段；细胞受体或膜受体；多糖；及，核酸分子，如单链或双链DNA、RNA、iRNA、miRNA、适配体、PNA或LNA。

本发明提出了一种用于检测能够影响感兴趣的基因或位点的位置的分子的方法。该方法包括：

使所述分子与本发明的宿主有机体相接触，在所述宿主有机体中表达包括根据本发明的可容易检测到的多肽的融合蛋白；且在所述宿主有机体中已经在接近感兴趣的基因或位点处插入具有至少一个被属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点的核苷酸序列；

检测所述可容易检测到的多肽，从而检测被属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点的位置，从而检测感兴趣的基因或位点的位置，且与不存在所述分子的情况下获得的感兴趣的基因或位点的位置进行对比。

如果无论被测试的分子是否存在，位置均相同，则该分子对该表达没有作用。相反，如果在两种位置之间确实存在差异，则该测试分子对该位置具有直接或间接的影响。

在一具体实施方式中，感兴趣的位点对应于DNA双链断裂（break）。在这种情况下，追踪该感兴趣的位点的位置能够研究在该双链断裂的修复过程中的DNA的切除（通过可容易检测到的多肽释放出的可检测信号的消失），且检测参与该降解的分子或对该过程具有影响的分子。作为另一变体，本发明的方法允许监控双链断裂的两端中的至少一端，从而检测参与保持DNA端位于切口位点两侧的分子。在该具体实施方式中被确定的分子可以是治疗上感兴趣的，特别是在癌症研究领域中及应答抗癌、遗传毒性治疗等中感兴趣的分子。

作为一变体，本发明涉及一种用于研究感兴趣的位点或基因在宿主有机体所包含的基因组或外源性DNA中的动态学的方法。该方法包括：

提供根据本发明的宿主有机体，在该宿主有机体中表达本发明的包括可容易检测到的多肽的融合蛋白，且在该宿主有机体中已经在接近感兴趣的基因或位点处插入具有至少一个被属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点的核苷酸序列；

在至少两个不同的时间（被命名为T₁和T₂，且T₂＞T₁），检测该可容易检测到的多肽，从而检测被属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点的位置，从而还检测感兴趣的基因或位点的位置，且将在时间T₁处和在时间T₂处获得的感兴趣的基因或位点的位置进行对比。

在实施方式的该具体形式中，可以持续进行检测，或在命名为T_n的不同的时间点进行保持时间为1ms至10h之间的检测；其中n表示1至10000之间的整数，每一时间T_x与时间T_x+1相隔开，且x表示1至9999之间的整数，该分隔的时间可能是固定的或可变的。

因此，本发明涉及一种本发明的单元，所述单元选自：如之前所限定的真核表达载体，如之前所限定的融合蛋白，如之前所限定的多聚核苷酸，如之前所限定的核苷酸序列，如之前所限定的可选的整合型真核载体，及如之前所限定的宿主有机体；所述单元用于控制真核生物体内基因的表达，或检测真核生物体内DNA座位的位置、动态学和降解（或代谢），或真核生物体内DNA序列的重组或互换。

本发明还涉及选自以下物质中的至少一种的单元用于检测能够控制真核生物体内基因表达的分子，或能够影响真核生物体内DNA座位的位置、动态学和降解（代谢），或能够影响真核生物体内DNA序列的重组或互换的分子的应用：如之前所限定的真核表达载体，如之前所限定的融合蛋白，如之前所限定的多聚核苷酸，如之前所限定的核苷酸序列，如之前所限定的可选的整合型真核载体，及如之前所限定的宿主有机体。

在本发明的系统主题的这些应用中，DNA座位和序列可以是内源的或外源的，且特别是在质粒或转座子上。

通过阅读下面给出的作为非限制性例示的实例且参考附图，本发明的其它特征和优点将对本领域技术人员来说变得更明显。

附图说明

图1给出了pMLBADcat-ParB-c2::mCherry质粒（Fig.1A）、pMLBADcat-ParB-c2::eGFP质粒（Fig.1B）、pDAG512质粒（Fig.1C）和pDAG514质粒（Fig.1D）的环形示图。

图2是包含ParB融合蛋白的用于在酵母中表达的载体的示意图。

图3是着丝粒序列ParS-c2和ParS-c3的示意图。

图4是哺乳动物细胞中的ParB融合蛋白的表达载体的示意图。

图5是用于整合如哺乳动物细胞中的ParS-c2和ParS-c3着丝粒序列的示意图。

图6给出了表达构建体pCM189ParB-c2-mCherry的酵母细胞，及ParS-c2构建体是插入基因组（ParS-c2）或没有插入基因组（WT）中的照片。

图7给出了瞬时表达构建体peGFP-c2ParB-c3-GFP或peGFP-c2ParB-c2-mCherry，且与水（模拟实验）或与含序列ParS-c2或ParS-c3（ParS）共转染的人类HeLa细胞的照片。横线为15μm。

图8给出了具有稳定整合单个ParS-c2构建体和瞬时表达来自质粒pFG9的ParB-mCherry的人类HeLa细胞的照片。

图9给出了使用ParS-c2/ParB-c2-mCherry定位系统得到的HML座位在一段时间中的移动的实例。

图10例示了以时间函数监控在HML处的荧光标记的位置。图10A示出HML在采集过程中的路径。图10B示出使用均方位移（Mean-Squaredisplacement，MSD）分析得到的HML移动的特征。

图11示出当经由HO核酸内切酶诱导单个双链断裂时，插入MAT座位中的ParS-c2序列的降解。通过ParB-c2-mCherry（ParB-c2-mCherry）监控ParS-c2序列，且MAT座位是被监控的（Mat-YFP）。横线为2μm。

图12例示了在图11中示出的细胞的荧光信号的量化。

具体实施方式

1.所使用的技术

1.1ParB表达载体的构建

通过使用以下的引物E和F的PCR分别从质粒pMLBADcat-ParB-c2::mCherry（图1A）和pMLBADcat-ParB-c2::eGFP（图1B）中扩增ParB-c2-mCherry和ParB-c3-GFP：

E:5’-ATTAGCGGATCCTACCTGACGCTTTTTA-3’（所附序列表中的SEQID No:14）；以及

F:5’-GGAATTGCGGCCGCTTACTTGTACAGCTCGTCCA-3’（所附序列表中的SEQ ID NO:15）。

对于ParB-c2-mCherry，将PCR产物经BamH1/Not1酶切，然后插入pCM189酵母的表达载体中，对于ParB-c3-GFP，将经BamH1/Not1酶切的PCR产物插入pCM184酵母的表达载体中，以得到pFG7和pFG8。

对于哺乳动物细胞，

（GenBank登记号#:U57606）的peGFP-c2质粒经Nhe1/HindIII酶切以去除GFP编码序列。然后将pMLBADcat-ParB-c2::mCherry和pMLBADcat-ParB-c2::eGFP质粒的包含ParB-c2-mCherry或ParB-c3-GFP的Nhe1/HindIII片段插入经peGFP-c2酶切的质粒，以产生pFG9和pFG10。

1.2包含ParS序列的质粒的构建

预先克隆包含细菌序列ParS-c2和ParS-c3的质粒（Dubarry等,2006）。使用BglII/Spe1对酵母穿梭质粒pDAG512（ParS-c2，Fig.1C）和pDAG514（ParS-c3，Fig.1D）进行酶切，以切除URA3标记物。

然后，线型载体分别与包含质粒pAG25和pAG32的NAT标记物或Hygro标记物的BglII/Spe1片段相关联，以得到质粒pFG2和pFG4。

对于哺乳动物细胞的载体，将包含ParS-c2或ParS-c3的BamH1/BglII片段连接在经BamH1酶切的pMSCV-Hygro载体（

货号634401）中，以得到pFG5和pFG6。

1.3用于整合的ParS序列的扩增

为了整合至HML或MAT座位中，使用寡核苷酸G和H进行以pFG2为模板的PCR：

G:5’-CTTCAAAGAAATATTTAAACTCATTTATGGCTTTTAGAGCATATTACTCAGTGACACTATAGAACGCGGCCGCCA-3’（所附序列表中的SEQID NO:16）；及

H:5’-TCAGCGAGCAGAGAAGACAAGACATTTTGTTTTACACCGGAGCCAAACTGTATAGGGAGACCGGCAGATCCGCGG-3’（所附序列表中的SEQ ID NO:17）。

使用Taq和Phusion（2/1U）DNA聚合酶的混合物在100μl缓冲液（1x GoTaq,2%DMSO,200μM dNTP,每一引物均为1μM）中进行ParS-NAT序列的扩增。

按如下程序进行PCR反应：98℃2min，98℃30sec、54℃30sec、72℃2.5min进行35个循环，然后在72℃保持10min。然后，使用PCR的Quiagen纯化试剂盒纯化扩增的产物。使用5μg转化W303遗传背景的野生型酵母菌株。

1.4ParS-NAT序列的整合

按照Gietz等（Gietz&Schiestl,1991）描述的方案转化酵母细胞。转化后，将细胞铺在YPD平板上，保持18h，以允许NAT标记物表达。细胞在含诺尔丝菌素（终浓度为200μg/ml）的YPD平板上复制。

在两个NAT选择步骤之后，选择抗性克隆用于进行基因组DNA的提取，且通过PCR证实ParS序列的整合。然后，用pFG7转化具有适当整合的克隆，且将转化的克隆放入基本培养基中培养，以对活细胞进行显微观察。

对于进入MAT的整合，使用在MAT上游197kb处包含操纵因子/YFP-抑制因子的YIL11菌株在与HO核酸内切酶的剪切位点相距100nt处整合ParS-c2序列。然后，使用携带可诱导型HO核酸内切酶的质粒及pCM189ParB-c2-mCherry转化细胞。

1.5HeLa细胞的转染

将第五代的HeLa细胞（ATCC）以400000个细胞/孔的浓度接种在六孔板中的2ml的DMEM培养基、10%胎牛血清（FCS）、1×丙酮酸钠中。

在37℃、5%的CO₂处保持24h使细胞增殖。当细胞覆盖70%时，进行转染。简单来讲，包含1.5μg每种质粒和10μl FuGene HD（Roche公司）转染试剂的100μl Opti-MEM混合在一起。且在室温进行脂质体的产生，保持20min。然后将转染混合物逐滴加入细胞中。

在使用的实验条件下，转染后孵育20h的时间段足以获得良好的荧光信号。

1.6HeLa细胞的转染

将第8代的HeLa细胞以2.5×10⁶个细胞/孔的浓度接种在100mm的平皿中的10ml的DMEM培养基、10%FCS、1×丙酮酸钠中。包含15μg每种待整合的PCR产物的500μl Opti-MEM和包含33.3μl FuGene HD（Roche公司）转染试剂的500μl Opti-MEM混合在一起，且在室温进行脂质体的产生，保持20min。然后，将转染混合物逐滴加入细胞中。

转染后5h，以0.1μM的浓度加入硫酸博莱霉素，保持20h。加入博莱霉素后20h，在PBS中清洗细胞两次，然后加入10ml包含200μg/ml潮霉素的培养基。细胞被培养几天，其中每3天换一次培养基，直至反向选择出全部的非转染的对照细胞。

然后，通过在35mm、60mm、100mm和140mm的平皿上连续传代，汇集抗性克隆，然后冷冻起来。将稳定的克隆以400000个细胞/孔的浓度接种在六孔板中的2ml的DMEM培养基、10%FCS、1×丙酮酸钠中。细胞在37℃、5%的CO₂处生长24h。当细胞覆盖70%时，进行转染。简单来讲，包含1.5μg的每种质粒的100μl Opti-MEM和包含10μl FuGene HD（Roche公司）转染试剂的100μl Opti-MEM混合在一起，且在室温进行脂质体的产生，保持20min。然后将转染混合物逐滴加入细胞中。转染后24h，进行ParB焦点的成像。

1.7图像采集

对于酵母，将细胞放入培养基中，直至它们在选择性YNBD培养基中达到中度指数（mid-exponential）生长期。

使用配备有CoolSnapHQ照相机（普林斯顿仪器（Princeton Instrument））和100X PL APO NA1.4镜头的奥林帕斯（Olympus）IX-81倒置荧光显微镜采集图像。对ParB-c2-mCherry的曝光时间为1000ms。通过实时连续采集（一张图像/每秒，保持50sec）进行对细胞的采集。

在装备有40X PL APO NA0.95镜头和滨松（Hamamatsu）照相机的尼康T5100倒置荧光显微镜上采集人类细胞的图像。采集时间在400ms至1000ms之间。

1.8颗粒动态学的测量

将一堆图像输入Image J软件（http://rsbweb.nih.gov/ij/）中，且使用具有以下参数设置的颗粒检测器和追踪器（Particle detector and tracker）插件以时间函数自动确定颗粒的位置：半径（Radius）=4，截止值（CutOff）=0，百分位数（percentile）0.1，连接（link）=2，位移（displacement）=8。

可视化地监测产生的轨迹以证实颗粒追踪的精确度。使用以下的公式数学地计算均方位移（MSD）和速率：

MSD = \underset{0 - i}{Σ} {[\sqrt{{(x_{i} - x_{0})}^{2} + {(y_{i} - y_{0})}^{2}} - \sqrt{{(x_{i - 1} - x_{0})}^{2} + {(y_{i - 1} - y_{0})}^{2}}]}^{2} .

2.结果

2.1产生的构建体

A.先前的标记物

使用的DNA序列对应于分别存在于Bcc的染色体2和染色体3中的ParS-c2和ParS-c3。每个ParS序列均包含ParB蛋白的4个结合位点（即识别位点）。

可用于这些序列整合的可选择的标记物在酵母细胞中是对诺尔丝菌素和潮霉素有抗性的基因，在哺乳动物细胞中是对潮霉素有抗性的基因。

通过PCR容易地产生ParS整合序列。该扩增允许靶定整合入酵母细胞中，及随机整合入哺乳动物细胞中。

还提供了编码融合蛋白的核酸。该构建体包含编码ParB-c2或ParB-c3的序列，ParB-c2或ParB-c3融合至荧光报告基因或GFP或其变异的mCherry。

将这些核酸克隆至对酵母或哺乳动物具有特异性的表达载体中。

对于酵母，载体是质粒pCM184和pCM189的衍生物，这些质粒包含Tet OFF启动子，该Tet OFF启动子经由添加多西环素（doxycyclin）允许调控插入下游的序列的表达（Belli等,1998;Gari等,1997）。当没有多西环素时，构建体的表达是最大化的。

对于哺乳动物细胞，载体来源于

（GenBank登记号#:U57606）的peGFP-c2质粒。该质粒包含CMV启动子，该CMV启动子以时间依赖的方式导致融合蛋白的强表达。ParB融合不包含任何细胞内的定位信号，但由于它们的小尺寸（＜70kDa），因此它们在细胞和细胞核的容积内自由扩散。

B.在酵母中的应用

在酵母中使用的两种构建体ParB-c2-mCherry和ParB-c3-GFP处于CYC1-TetO-7启动子的控制下（图2）。该启动子包含7个TeT-操纵因子，其中TeT-操纵因子被在同一质粒上编码的转录反式激活因子（tTA）特异性结合。多西环素的加入以剂量依赖的方式诱导构建体表达的抑制。

经由使用以下引物对A和B的PCR扩增将ParS序列（图3）插入基因组DNA中：

A:5’-GTGACACTATAGAACGCGGCCGCCA-3’（所附序列表中的SEQ IDNO:18）；及

B:5’-TATAGGGAGACCGGCAGATCCGCGG-3’（所附序列表中的SEQ IDNO:19）。

这些引物可包含与接近靶定座位的序列具有同源性的序列。该同源性允许使用酵母中的同源重组进行ParS序列的位点特异性的整合。

包含Lox位点（位于包含可选择的标记物的区域的侧面）的载体可用于恢复对可选择标记物的营养缺陷型，从而将插入大小降低至最小。

ParB-c2-mCherry、ParB-c3-GFP、ParS-c2和ParS-c3分别与标记物URA3、TRP1、NAT和HYGRO相关联。这四种构建体可同时使用。

C.哺乳动物细胞中的应用

对于哺乳动物细胞，两种构建体ParB-c2-mCherry和ParB-c3-GFP处于CMV启动子的控制下，CMV启动子存在于peGFP-c2质粒的主链中（图4）。由于这个原因，ParB的表达是时间依赖性的。在双重标签的情况中，必须瞬时转染peGFP-c2ParB-c2-mCherry和ParB-c3-GFP。

通过使用以下引物对C和D的PCR扩增用于整合的ParS序列：

C:5’-TCCAGCCCTCACTCCTTCTCTAGGCGCCGGAA-3’（所附序列表中的SEQ ID NO:20）；及

D:5’-GTTCTCCAACTTCAAGAAACTGTTACCCAT-3’（所附序列表中的SEQ ID NO:21）。

然后，将PCR产物转染入细胞中，且选择对潮霉素具有抗性的克隆（图5）。然后，使用已公布的技术（Ozawa等,2004）确定插入位点。

2.2在酵母和人类细胞中体内检测ParS序列

A.在酵母细胞中（图6）

在未标记的野生型细胞（WT）中，扩散的荧光信号在除了空泡之外的整个细胞中均可看到。

当ParS-c2构建体插入基因组（这里是HML座位）中时，可以看到由于ParB结合在ParS上所诱导的明亮的荧光点（箭头）。横线：2μm。

B.在具有质粒ParS的哺乳动物细胞中（图7）

使用包含ParS-c2或ParS-c3（ParS）序列的质粒对瞬时表达peGFP-c2ParB-c3-GFP构建体或peGFP-c2ParB-c2-mCherry的人类HeLa细胞进行共转染。在这种情况下，可以看到多个荧光焦点，伴随在转染的过程中大量的质粒DNA分子进入细胞中的事实（Batard等,2001）。

在瞬时表达与水（模拟）共转染的peGFP-c2ParB-c3-GFP构建体或peGFP-c2ParB-c2-mCherry构建体的人类HeLa细胞中看不到荧光焦点。横线：15μm。

C.在具有稳定整合的ParS的哺乳动物细胞中（图8）

在具有稳定整合的单个ParS-c2构建体且瞬时表达peGFP-c2ParB-c2-GFP构建体的HeLa细胞系中，可以观察到荧光焦点（箭头）。

2.3HML座位的动态学的分析

使用ParS-c2/ParB-c2-mCherry定位系统进行该分析。将ParS-c2序列整合在HML座位中，且这些细胞表达pCM189ParB-c2-mCherry构建体。

因此，mCherry焦点的位置对应于体内HML座位的位置。以1sec的间隔获取图像，保持50sec（图9）。

将来源于采集的一堆图像输入Image J软件（http://rsbweb.nih.gov/ij/）中，且随时间自动监控HML焦点的位置。

图10A中给出了在采集过程中的HML的路径（浅色的）。图10B示出了通过均方位移（MSD）得出的HML移动的特征。HML进行缓慢扩散的移动。平均速率和计算的扩散系数与之前公布的值（Bystricky等,2005;Bystricky等,2009）是同一数量级的。

2.4当诱导单个双链断裂时ParS序列的降解

在MAT座位处具有整合的ParS-c2构建体的细胞表达pCM189ParB-c2-mCherry构建体，其中整合的ParS-c2构建体位于与对应于HO核酸内切酶所引起的单个双链断裂的剪切位点相隔大约100个核苷酸处。

将上述细胞放入包含棉子糖的选择性培养基中培养，且通过加入半乳糖（pGal-Ho）诱导HO核酸内切酶。在配备有YOKOGAWA CSU22头部和AndoriXonEM+DU888照相机的ANDOR旋转（Revolution）快速共聚焦显微镜下的对细胞进行多色成像。使用Olympus PlanSApo100x1.40镜头获取图像。同时监控携带位于4kb距离处（与染色体3的左端粒相隔197kb）的lacO标记的MAT座位的位置（图11）。

ParS焦点的消失对应于在HO剪切位点附近的MAT座位的序列的降解。

将图像输入Image J软件中，且以三维形式例示了被转变为任意单位的荧光（图12）。黑色箭头指示YFP和mCherry焦点的位置。

30min后可看到mCherry焦点的消失。由于mCherry的总荧光水平在采集期间（特别是在芽体中）基本相同，因此焦点的丢失是特异性的。

参考文献

Batard P,Jordan M,Wurm F(2001)Transfer of high copy number plasmid intomammalian cells by calcium phosphate transfection.Gene270(1-2):61-68

Belli G,Gari E,Piedrafita L,Aldea M,Herrero E(1998)An activator/repressor dualsystem allows tight tetracycline-regulated gene expression in budding yeast.NucleicAcids Res26(4):942-947

Belmont AS(2001)Visualizing chromosome dynamics with GFP.Trends Cell Biol11(6):250-257

Belmont AS,Straight AF(1998)In vivo visualization of chromosomes using lacoperator-repressor binding.Trends Cell Biol8(3):121-124

Bystricky K,Laroche T,van Houwe G,Blaszczyk M,Gasser SM(2005)Chromosome looping in yeast:telomere pairing and coordinated movement reflectanchoring efficiency and territorial organization.J Cell Biol168(3):375-387

Bystricky K,Van Attikum H,Montiel MD,Dion V,Gehlen L,Gasser SM(2009)Regulation of nuclear positioning and dynamics of the silent mating type loci by theyeast Ku70/Ku80complex.Mol Cell Biol29(3):835-848

Dubarry N,Pasta F,Lane D(2006)ParABS systems of the four replicons ofBurkholderia cenocepacia:new chromosome centromeres confer partition specificity.J Bacteriol188(4):1489-1496

Gari E,Piedrafita L,Aldea M,Herrero E(1997)A set of vectors with atetracycline-regulatable promoter system for modulated gene expression inSaccharomyces cerevisiae.Yeast13(9):837-848

Gietz RD,Schiestl RH(1991)Applications of high efficiency lithium acetatetransformation of intact yeast cells using single-stranded nucleic acids as carrier.Yeast7(3):253-263

Golovanov AP,Barilla D,Golovanova M,Hayes F,Lian LY(2003)ParG,a proteinrequired for active partition of bacterial plasmids,has a dimeric ribbon-helix-helixstructure.Mol.Microbiol.50:1141-1153.

Li Y,Austin S(2002)The P1plasmid is segregated to daughter cells by a'captureand ejection'mechanism coordinated with Escherichia coli cell division.MolMicrobiol46(1):63-74

Lin DC,Grossman AD(1998)Identification and characterization of a bacterialchromosome partitioning site.Cell92(5):675-685

Livny J,Yamaichi Y,Waldor MK(2007)Distribution of centromere-like parS sitesin bacteria:insights from comparative genomics.J Bacteriol189(23):8693-8703

Lynch AS,Wang JC(1995)sopB protein-mediated silencing of genes linked to thespoC locus of Escherichia coli F plasmid,Proc Natl Acad Sci U S A92(6):1896-1900

Michaelis C,Ciosk R,Nasmyth K(1997)Cohesins:chromosomal proteins thatprevent premature separation of sister chromatids.Cell91(1):35-45

Murray H,Ferreira H,Errington J(2006)The bacterial chromosome segregationprotein Spo0J spreads along DNA from parS nucleation sites.Mol Microbiol61(5):1352-1361

Ozawa T,Itoyama T,Sadamori N,Yamada Y,Hata T,Tomonaga M,Isobe M(2004)Rapid isolation of viral integration site reveals frequent integration of HTLV-1intoexpressed loci.J Hum Genet49(3):154-165

Straight AF,Belmont AS,Robinett CC,Murray AW(1996)GFP tagging of buddingyeast chromosomes reveals that protein-protein interactions can mediate sisterchromatid cohesion.Curr Biol6(12):1599-1608

Surtees JA,Funnell BE(1999)P1ParB domain structure includes two independentmultimerization domains.J.Bacteriol181(19):5898-5908

Therizols P,Duong T,Dujon B,Zimmer C,Fabre E Chromosome arm length andnuclear constraints determine the dynamic relationship of yeast subtelomeres.ProcNatl Acad Sci U S A107(5):2025-2030

Claims

1.一种真核表达载体，包括编码融合蛋白的核苷酸序列，所述融合蛋白包括对应于属于细菌DNA分离系统的DNA结合蛋白或其衍生物或片段的第一多肽，且该结合不需要任何其它因子。

2.根据权利要求1所述的载体，其特征在于，所述属于细菌DNA分离系统的DNA结合蛋白是来源于洋葱伯克氏细菌的ParB蛋白。

3.根据权利要求1或2所述的载体，其特征在于，所述属于细菌DNA分离系统的DNA结合蛋白选自：

由Bcc的染色体1编码的被定名为ParB-c1的ParB蛋白，诸如在NCBI基因组测序计划中的N YP-002229191下获取的Bcc菌株J2315的蛋白；

由Bcc的染色体2编码的被定名为ParB-c2且对应于所附序列表中的SEQID NO:2蛋白的ParB蛋白，诸如在NCBI基因组测序计划中的N YP-002232636下获取的Bcc菌株J2315的蛋白；

由Bcc的染色体3编码的被定名为ParB-c3且对应于所附序列表中的SEQID NO:4蛋白的ParB蛋白，诸如在NCBI基因组测序计划中的N YP-002153395下获取的Bcc菌株J2315的蛋白；

由Bcc的质粒编码的被定名为ParB-p1的ParB蛋白，诸如在NCBI基因组测序计划中的N YP-002235439下获取的Bcc菌株J2315的pBCJ2315质粒的蛋白；

及它们的衍生物或片段。

4.根据权利要求1～3中任一项所述的载体，其特征在于，所述融合蛋白包括第二多肽，所述第二多肽是容易检测到的多肽或参与基因表达调控的多肽。

5.根据权利要求4所述的载体，其特征在于，所述容易检测到的多肽是：

在特定条件下，诸如当适合的底物存在下被放置时，能够产生可检测到的、可选可计量的信号的酶；或者

生物发光或荧光的多肽。

6.根据权利要求4所述的载体，其特征在于，所述参与基因表达调控的多肽选自：正转录因子或负转录因子、常规转录因子、启动子的表达调控因子、染色质重构因子和修饰相邻基因的位置的因子，及它们的衍生物或片段。

7.根据前述权利要求中任一项所述的载体，其特征在于，所述载体包括操作性连接的：真核类型的启动子、编码融合蛋白的核苷酸序列及包括剪切位点和/或polyA信号的真核生物转录终止信号。

8.一种融合蛋白，包括：

对应于属于细菌DNA分离系统的DNA结合蛋白或其衍生物或片段的第一多肽，且该结合不需要任何其它因子；以及

参与基因表达调控的第二多肽。

9.一种融合蛋白，包括：

对应于来源于洋葱伯克氏细菌的ParB蛋白或其衍生物或片段的第一多肽；以及

容易检测到的第二多肽。

10.一种分离的多聚核苷酸，选自以下不同的多聚核苷酸：

i）编码如权利要求8或9中限定的融合蛋白的多聚核苷酸；

ii）与在第i）条中限定的所述多聚核苷酸互补的多聚核苷酸；

iii）具有能够在高严格性条件下与在第i）条和第ii）条中限定的多聚核苷酸杂交的至少14个核苷酸且特别是具有至少18个核苷酸的多聚核苷酸。

11.一种真核载体，包括核苷酸序列及真核类型的可选择的标记物，该核苷酸序列具有至少一个被属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点。

12.根据权利要求11所述的载体，所述载体是整合型的。

13.根据权利要求11或12所述的载体，其特征在于，被属于细菌DNA的分离系统的DNA结合蛋白识别的所述识别位点是核苷酸序列（I）或是与核苷酸序列（I）互补的序列：

N₁N₂TN₃N₄N₅N₆CGN₇N₈N₉N₁₀AN₁₁N₁₂（I）（所附序列表中的SEQ ID NO:5），其中，核苷酸N₁和N₁₂相同或不同，或选自A、G、C或T；且核苷酸对(N₆,N₇)、(N₅,N₈)、(N₄,N₉)、(N₃,N₁₀)和(N₂,N₁₁)彼此独立地选自由(A,T)、(T,A)、(C,G)和(G,C)所组成的组中；核苷酸N₁和N₁₂能可选地是缺失的。

14.根据权利要求11～13中任一项所述的载体，其特征在于，被属于细菌DNA的分离系统的DNA结合蛋白识别的所述识别位点具有选自以下核苷酸序列的核苷酸序列：

GTTTATGCGCATAAAC（所附序列表中的SEQ ID NO:7）；

CTTTATGCGCATAAAC（所附序列表中的SEQ ID NO:8）；

GTTGTCACGTGACAAC（所附序列表中的SEQ ID NO:9）；

TTTGTCACGTGACAAC（所附序列表中的SEQ ID NO:10）；

CTTGTCACGTGACAAC（所附序列表中的SEQ ID NO:11）；以及

与这些序列中的任一个序列互补的序列。

15.根据权利要求11～14中任一项所述的载体，其特征在于，所述核苷酸序列包括至少2个、至少3个或至少4个被属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点。

16.根据权利要求11～15中任一项所述的载体，其特征在于，所述核苷酸序列对应于选自以下序列中的序列：

由Bcc的染色体1携带的被定名为ParS-c1的ParS序列，所述被定名为ParS-c1的ParS序列能够从在Genbank中的N AM747720下获取的Bcc菌株J2315的染色体1的核苷酸序列中获得，在该序列中包含的两个识别位点分别位于核苷酸26477～26492和28403～28418；

由Bcc的染色体2携带的被定名为ParS-c2的ParS序列，所述被定名为ParS-c2的ParS序列能够从在Genbank中的N AM747721下获取的Bcc菌株J2315的染色体2的核苷酸序列中获得，且对应于所附序列表中的SEQ ID NO：12的蛋白；

由Bcc的染色体3携带的被定名为ParS-c3的ParS序列，所述被定名为ParS-c3的ParS序列能够从在Genbank中的N AM747722下获取的Bcc菌株J2315的染色体3的核苷酸序列中获得，且对应于所附序列表中的SEQ ID NO：13的蛋白；

由Bcc的质粒携带的被定名为ParS-p1的ParS序列，所述被定名为ParS-p1的ParS序列能够从在Genbank中的N AM747723下获取的Bcc菌株J2315的质粒pBCJ2315的质粒的核苷酸序列中获得，在该序列中包含的三个识别位点分别位于核苷酸92285～92300、92385～92400和92438～92453；或

与这些序列中任一个序列互补的序列。

17.一种真核宿主有机体，所述真核宿主有机体被如在权利要求1～7中任一项中限定的真核表达载体或如在权利要求11～16中任一项中限定的真核载体转化，或包含如在权利要求1～7中任一项中限定的真核表达载体或如在权利要求11～16中任一项中限定的真核载体，

所述真核宿主有机体不是人类。

18.根据权利要求17所述的真核宿主有机体，其特征在于，所述有机体是：微生物，诸如酵母或真菌；动物细胞，诸如昆虫细胞或哺乳动物的细胞，且特别是人类细胞、仓鼠细胞、猴细胞、兔细胞、小鼠细胞、大鼠细胞；植物细胞；植物；或，除了人类之外的动物。

19.根据权利要求17或18所述的真核宿主有机体，其特征在于，所述有机体具有整合在它的基因组中的核苷酸序列，该核苷酸序列具有至少一个被属于细菌DNA的分离系统的DNA结合蛋白识别的识别位点，且所述有机体表达如在权利要求1～7中任一项中限定的融合蛋白。

20.一种单元，选自：

根据权利要求1～7中任一项所述的真核表达载体；

诸如之前在权利要求1～7中任一项中限定的，或根据权利要求8或9所述的融合蛋白；

根据权利要求10所述的多聚核苷酸；诸如在权利要求1～7中任一项中限定的核苷酸序列；

诸如在权利要求1～7、11或13～16中任一项中限定的核苷酸序列；

诸如在权利要求11～16中任一项中限定的真核载体；

诸如在权利要求17～19中任一项中限定的宿主有机体；

所述单元用于控制真核生物体内的基因表达，或检测DNA座位的位置、动态学和降解，或真核生物体内DNA序列的重组或互换。

21.选自以下物质中的至少一种单元的应用，用于检测能够控制真核生物体内的基因表达的分子，或能够影响真核生物体内DNA座位的位置、动态学和降解，或影响真核生物体内DNA序列的重组或互换的分子：

根据权利要求1～7中任一项所述的真核表达载体；

根据权利要求10所述的多聚核苷酸；诸如权利要求1～7中任一项中限定的核苷酸序列；

诸如在权利要求11～16中任一项中限定的真核载体；

诸如在权利要求17～19中任一项中限定的宿主有机体。