CN101849020A

CN101849020A - 核糖开关及使用核糖开关的方法和组合物

Info

Publication number: CN101849020A
Application number: CN200880100930A
Authority: CN
Inventors: R·R·布雷克; Z·威恩伯格; N·苏达珊; 王欣; M·M·梅耶; A·罗斯; E·E·瑞格尔斯基
Original assignee: Yale University
Current assignee: Yale University
Priority date: 2007-05-29
Filing date: 2008-05-29
Publication date: 2010-09-29
Also published as: CA2688575A1; US20100286082A1; MX2009012773A; WO2008156987A3; EP2426218A1; EP2426219A1; AU2008266684A1; WO2008156987A9; SG174103A1; SG174104A1; JP2010528617A; AU2008266684A2; WO2008156987A2; EP2164996A4; KR20100017905A; EP2164996A2

Abstract

核糖开关是抗生素和其他小分子治疗的靶。核糖开关及其部分可用于调节RNA分子及其他元件和分子的表达或功能。核糖开关及其部分可用于多种其他方法中，例如以鉴定或检测化合物。化合物可用于刺激、激活、抑制和/或灭活所述核糖开关。核糖开关及其部分——单独以及与其他核酸结合——可用于多种构建体和RNA分子中，并且可由核酸编码。

Description

核糖开关及使用核糖开关的方法和组合物

相关申请的引用

本申请要求2007年5月29日提交的美国临时申请No.60/932,112的优先权。2007年5月29日提交的美国临时申请No.60/932,112以引用的方式全文纳入本文。

关于联邦资助研究的声明

本发明是在以下政府支持下完成的：NIH授予的基金GM068819、RR19895-02和R33DK07027；NHLBI授予的基金HV28186；美国国立综合医学研究所授予的基金T32GM007223；以及NSF授予的基金EIA-0323510。政府享有本发明的某些权利。

技术领域

本文公开的发明主要涉及基因表达领域，具体涉及基因表达调节的领域。

背景技术

精确遗传控制是活体系统的一个基本特征，因为细胞必须通过改变基因表达模式来对多种生化信号和环境信号作出应答。大多数已知的遗传控制机制涉及到蛋白因子的使用，所述蛋白因子会感受到化学或物理刺激，然后通过与相关DNA或信使RNA序列选择性相互作用来调节基因表达。蛋白可采用复杂形状并行使使活体系统可准确地感受到它们的化学和物理环境的多种功能。对代谢物有应答的蛋白因子通常通过结合DNA调节转录起始(如lac阻遏蛋白；Matthews，K.S.，and Nichols，J.C.，1998，Prog.Nucleic Acids Res.Mol.Biol.58，127-164)或通过结合RNA控制转录终止(如PyrR蛋白；Switzer，R.L.，et al.，1999，Prog.NucleicAcids Res.Mol.Biol.62，329-367)或翻译(如TRAP蛋白；Babitzke，P.，and Gollnick，P.，2001，J.Bacteriol.183，5795-5802)来发挥作用。蛋白因子通过多种机制如变构调节或翻译后修饰来应答于环境刺激，并擅长利用这些机制来作为高反应性遗传开关(如参见Ptashne，M.，and Gann，A.(2002).Genes and Signals.Cold Spring Harbor Laboratory Press，ColdSpring Harbor，NY)。

除了蛋白质因子广泛参与基因控制之外，还已知RNA也可在基因调节中有活跃的作用。最近的研究逐渐揭示出小的非编码RNA在选择性靶向破坏mRNA从而导致基因表达的下调方面的重要作用(参见例如Hannon，GJ.2002，Nature 418，244-251和该文章的参考文献)。这种RNA干扰过程利用了短RNA通过Watson-Crick碱基互补而选择性识别目标mRNA靶标的能力，在该过程之后被结合的mRNA通过蛋白质的作用而被破坏。在这一系统中RNA为分子识别的理想媒介物，因为通过进化过程产生新的靶标特异性RNA因子要比产生具有新的高特异性RNA结合位点的蛋白质因子容易得多。

虽然蛋白质可以满足生物学对于酶、受体和结构功能的大部分需求，但是RNA也具有这些能力。例如，RNA具有足够的结构塑性，能形成多种具有很高的酶活力和精确的分子识别能力的核酶结构域(Cech&Golden，Building a catalytic active site using only RNA.In：The RNAWorld R.F.Gesteland，T.R.Cech，J.F.Atkins，eds.，pp.321-350(1998)；Breaker，In vitro selection of catalytic polynucleotides.Chem.Rev.97，371-390(1997))和受体结构域(Osborne&Ellington，Nucleic acidselection and the challenge of combinatorial chemistry.Chem.Rev.97，349-370(1997)；Hermann&Patel，Adaptive recognition by nucleic acidadapters.Science 287，820-825(2000))。此外，上述能力还可以组合产生可被效应物分子选择性调节的变构核酶(Soukup&Breaker，Engineeringprecision RNA molecular switches.Proc.Natl.Acad.Sci.USA 96，3584-3589(1999)；Seetharaman et al.，Immobilized riboswitches for theanalysis of complex chemical and biological mixtures.Nature Biotechnol.19，336-341(2001))。

细菌核糖开关RNA是主要位于特定mRNA的主编码区的5′非翻译区(5′-UTR)内的遗传控制元件。结构探测研究(后文进一步讨论)揭示了核糖开关元件通常由两个结构域构成：一个用做配体结合结构域的天然适体(T.Hermann，D.J.Patel，Science 2000，287，820；L.Gold，et al.，Annual Review of Biochemistry 1995，64，763)，以及一个与参与基因表达的RNA元件接合(interface)的“表达平台”(如Shine-Dalgarno(SD)元件；转录终止子茎)。

发明内容

本文公开了一种包含编码这样的一个RNA的核酸分子的可调节基因表达构建体，即该RNA包含一个可操作连接于一个编码区的核糖开关，其中所述核糖开关调节所述RNA的表达，其中所述核糖开关和编码区是异源的。所述核糖开关可以是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。所述核糖开关可包含一个适体结构域和一个表达平台结构域，其中所述适体结构域和所述表达平台结构域是异源的。所述核糖开关还可包含两个或多个适体结构域和一个表达平台结构域，其中至少一个所述适体结构域和所述表达平台结构域是异源的。至少两个所述适体结构域可呈现出协同性结合。

还公开了一种核糖开关，其中所述核糖开关是一种天然存在的核糖开关的非天然衍生物。所述核糖开关可以是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。所述核糖开关可包含一个适体结构域和一个表达平台结构域，其中所述适体结构域和所述表达平台结构域是异源的。所述核糖开关还可包含一个或多个其他适体结构域。至少两个所述适体结构域可呈现出协同性结合。所述核糖开关可被一触发分子激活，其中所述核糖开关被所述触发分子激活时产生一个信号。

还公开了一种检测目的化合物的方法，所述方法包括：将一个样品与一种核糖开关进行接触，其中所述核糖开关可被所述目的化合物激活，其中所述核糖开关被所述目的化合物激活时产生一个信号，其中当所述样品包含所述目的化合物时所述核糖开关产生一个信号，其中所述核糖开关包括一种核糖开关或一种核糖开关的衍生物。所述核糖开关可以是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。当所述目的化合物激活所述核糖开关时，所述核糖开关可改变构象，其中所述构象变化通过构象依赖标记产生一个信号。当所述目的化合物激活核糖开关时，所述核糖开关还可改变构象，其中所述构象变化会引起连接所述核糖开关的RNA表达的变化，其中所述表达变化产生一个信号。所述信号可由连接至所述核糖开关的RNA表达的报告蛋白产生。

还公开了一种方法，包括：(a)测试一种抑制编码含有核糖开关的RNA的基因的基因表达的化合物，其中所述抑制通过所述核糖开关实现，其中所述核糖开关包括一种核糖开关或一种核糖开关的衍生物；(b)通过使一种细胞和步骤(a)中抑制基因表达的一种化合物相接触来抑制基因表达，其中所述细胞含有编码含有核糖开关的RNA的基因，其中所述化合物通过结合到所述核糖开关抑制所述基因的表达。所述核糖开关可以是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。

还公开了一种方法，包括：(a)测试一种脱抑制编码含有核糖开关的RNA的基因的基因表达的化合物，其中所述脱抑制通过所述核糖开关实现，其中所述核糖开关包括一种核糖开关或一种核糖开关的衍生物；(b)通过使一种细胞和步骤(a)中脱抑制基因表达的一种化合物相接触来脱抑制基因表达，其中所述细胞含有编码含有核糖开关的RNA的基因，其中所述化合物通过结合到所述核糖开关脱抑制所述基因的表达。所述核糖开关可以是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。

公开了一种识别核糖开关的方法，所述方法包括在存在和不存在触发分子的条件下评估RNA分子的直读探测的自发切割(in-linespontaneous cleavage)，其中所述RNA分子由被所述触发分子调节的基因所编码，其中RNA分子的直读探测的自发切割模式的改变表明一种核糖开关对所述触发分子有应答。所述触发分子可以是环二GMP、S-腺苷高半胱氨酸、preQ₁、Moco或SAM。

还公开了一种改变基因表达的方法，所述方法包括使一种化合物和一个细胞相接触，其中所述化合物为环二GMP、pGpG、GpG或GpGpG。所述化合物还可以为可激活一种环二GMP应答性核糖开关的环二GMP、pGpG、GpG或GpGpG的衍生物。还公开了一种改变基因表达的方法，所述方法包括使一种化合物和一个细胞相接触，其中所述化合物为S-腺苷高半胱氨酸。所述化合物还可以为可激活一种S-腺苷高半胱氨酸应答性核糖开关的S-腺苷高半胱氨酸衍生物。例如，所述化合物可以为S-腺苷-L-半胱氨酸(SAC)。还公开了一种改变基因表达的方法，所述方法包括使一种化合物和一个细胞相接触，其中所述化合物为preQ₁。所述化合物还可以是能够激活一种preQ₁应答性核糖开关的preQ₁衍生物。还公开了一种改变基因表达的方法，所述方法包括使一种化合物和一个细胞相接触，其中所述化合物为Moco。所述化合物还可以是能够激活一种Moco应答性核糖开关的Moco衍生物。还公开了一种改变基因表达的方法，所述方法包括使一种化合物和一个细胞相接触，其中所述化合物为SAM。所述化合物还可以是能够激活一种SAM应答性核糖开关的SAM衍生物。用于激活一种SAM-IV核糖开关的化合物还可以为MeAzaAdoMet。

对于preQ₁应答性核糖开关(及衍生自preQ₁应答性核糖开关的核糖开关)有用的化合物包括preQ₁的衍生物，其中第1位的N可以被取代为C、O或S，其中第2位的氨基可被取代为氢键供体，其中第6位的氧可被取代为氢键受体，其中第7位的氨基可被取代为氢键受体，并且所述氮可被取代为或者衍生为氢键供体。

氢键供体和受体的实例包括NH、NH₂ ⁺、NH₃ ⁺、O、OH、S、SH、C-R₅、CH-R₅、N-R₅、NH-R₅、O-R₅或S-R₅，其中R₅为NH₂ ⁺、NH₃ ⁺、CO₂H、B(OH)₂、CH(NH₂)₂、C(NH₂)₂ ⁺、CNH₂NH₃ ⁺、C(NH₃ ⁺)₃、羟甲基、1-羟乙基、2-羟乙基、1，2-二羟乙基、2-羟-1-甲基乙基、1-羟丙基、2-羟丙基、3-羟丙基、1，3-二羟丙基、2，3-二羟丙基、1-羟丁基、2-羟丁基、3-羟丁基、4-羟丁基、1，4-二羟丁基、2，4-二羟丁基、1-羟-2-甲基丙基、2-羟-2-甲基丙基、3-羟-2-甲基丙基、1-羟甲基-1-甲基乙基、三羟甲基甲基、硫醇甲基、1-硫醇乙基、2-硫醇乙基、1，2-二硫醇乙基、2-硫醇-1-甲基乙基，1-硫醇丙基、2-硫醇丙基、3-硫醇丙基、1，3-二硫醇丙基、2，3-二硫醇丙基、1-硫醇丁基、2-硫醇丁基、3-硫醇丁基、4-硫醇丁基、1，4-二硫醇丁基、2，4-二硫醇丁基、1-硫醇-2-甲基丙基、2-硫醇-2-甲基丙基、3-硫醇-2-甲基丙基、1-硫醇甲基-1-甲基乙基、三硫醇甲基甲基、氨基甲基、1-氨基乙基、2-氨基乙基、1，2-二氨基乙基、2-氨基-1-甲基乙基、1-氨基丙基、2-氨基丙基、3-氨基丙基、1，3-二氨基丙基、2，3-二氨基丙基、1-氨基丁基、2-氨基丁基、3-氨基丁基、4-氨基丁基、1，4-二氨基丁基、2，4-二氨基丁基、1-氨基-2-甲基丙基、2-氨基-2-甲基丙基、3-氨基-2-甲基丙基、1-氨基甲基-1-甲基乙基和三氨基甲基甲基。

所述细胞可以被鉴定为需要改变的基因表达。所述细胞可以是一种细菌细胞。所述化合物可杀灭所述细菌细胞或抑制所述细菌细胞的生长。可以通过将所述化合物给予一名受试者以使所述化合物和所述细胞相接触。所述细胞是所述受试者体内的细菌细胞，其中所述化合物杀灭所述细菌细胞或抑制所述细菌细胞的生长。所述受试者可具有细菌感染。所述细胞可包含一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。所述化合物与另一种抗微生物化合物联合给药。所述化合物可抑制细菌在生物膜中的生长。

还公开了一种改变细胞生理状态的方法，所述方法包括使一种化合物和一个细胞相接触，其中所述化合物为环二GMP、pGpG、GpG或GpGpG。所述化合物还可以为可激活一种环二GMP应答性核糖开关的环二GMP、pGpG、GpG或GpGpG的衍生物。

还公开了一种产生触发分子的方法，所述方法包括：培养能够产生所述触发分子的突变细菌细胞，其中所述突变细菌细胞在一种对所述触发分子应答的核糖开关中包含一种突变，相对于不具有所述突变的细胞，所述突变增加了由突变细菌细胞产生的触发分子；以及从所述细胞培养物分离触发分子，从而产生所述触发分子。所述触发分子可为例如环二GMP、S-腺苷高半胱氨酸、preQ₁、Moco或SAM。该方法与培养在所述核糖开关中不包含突变的细菌细胞相比可获得至少提高10％的所述触发分子产生量。该方法与培养其中在所述核糖开关中不包含突变的细菌细胞相比所述触发分子的产生量可至少提高15％。该方法与培养在所述核糖开关中不包含突变的细菌细胞相比可获得至少提高25％的所述触发分子产生量。所述核糖开关可包含一种敲除突变。还公开一种在核糖开关中包含突变的细菌细胞，与不具有所述突变的细胞相比，所述突变将所述细胞产生的所述核糖开关触发分子提高至可测量的程度。

本文公开了一种抑制细菌细胞生长的方法，该方法包括：使一个细胞和一种可结合核糖开关的化合物相接触，其中所述细胞包含编码包含对所述化合物应答的核糖开关的RNA基因，其中所述化合物通过结合于所述核糖开关而抑制细菌细胞生长，从而改变所述基因的表达。所述核糖开关可以是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。与未接触所述化合物的细胞相比，该方法可使细菌细胞生长至少降低10％。可通过将所述化合物给予受试者而使所述化合物和所述细胞相接触。所述细胞可以为所述受试者体内的细菌细胞，其中所述化合物杀灭所述细菌细胞或抑制所述细菌细胞生长。所述受试者可具有细菌感染。所述化合物可与另一种抗微生物化合物联合给药。

公开了一种在样品中检测一化合物的方法，包括：使对所述化合物应答的核糖开关与所述样品相接触；以及检测化合物和所述核糖开关之间的相互作用，其中化合物和所述核糖开关之间的相互作用指示存在所述化合物。所述核糖开关可以是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。所述核糖开关可以是被标记的。

还公开了一种方法，包括通过以下方式抑制一个编码包含核糖开关的RNA的基因的基因表达：使一个细胞与这样的一种化合物相接触，即通过测验该化合物对所述基因的基因表达的抑制情况，该化合物被鉴定为一种抑制所述基因的基因表达的化合物，其中所述抑制经由所述核糖开关实现。所述核糖开关可以是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关、一种SAM应答性核糖开关，或这些核糖开关的衍生物。

还公开了一种方法，包括通过以下方式脱抑制一个编码包含核糖开关的RNA的基因的基因表达：使一个细胞与这样的一种化合物相接触，即通过测验该化合物对所述基因的基因表达的脱抑制情况，该化合物被鉴定为一种脱抑制所述基因的基因表达的化合物，其中所述脱抑制经由所述核糖开关实现。所述核糖开关可以是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关、一种SAM应答性核糖开关，或这些核糖开关的衍生物。

所公开的方法和组合物的其他优点一部分将在下文的描述中阐明，一部分可以从说明书中获知，或者可通过实施公开的方法和组合物而得知。所公开的方法和组合物的优点将通过所附权利要求书中具体指明的要素和组合实现和获得。应当理解的是，上文的一般性描述和下文的具体描述都仅仅是示例性和解释性的，并不是对本发明要求保护范围的限制。

附图说明

附图包含于本说明书中并作为本说明书的一部分，附图阐述了所公开方法和组合物的一些实施方案，它与文字描述一起作为对所公开方法和组合物的原理的解释。

图1所示描述了所鉴定的22个基序中的7个的共有序列和结构。对核苷酸同一性的保守性的计算/相关变异的存在和证据在实施例1中描述。具有超过5％非标准的(non-canonical)或缺失核苷酸的提议核苷酸对不被归为相关变异类别。应注意，核苷酸保守的水平受对所述基序的生物化学约束的影响以及受系统发生多样性的影响。有限范围的基序(例如preQ₁-II基序或COG4708基序)将呈现出更加保守，长度可变的茎中的某些相关变异位置未示出。

图2显示了GEMM基序的共同特征。选择两个GEMM实例以说明共同特征，但这两个实例不代表全部322种GEMM。(A)该推定的RNA包含一标准的GNRA四元环和受体(灰色区)。几乎50％的GEMM实例包含一个可能的四元环受体。下游操纵子中仅第一基因被显示。(B)一些GEMM RNA缺少四元环受体，但有两个特别凸出的A残基(灰色阴影)，它们出现于差不多半数缺乏受体的序列中。灰色上划线的核苷酸可折叠形成一个不依赖于ρ的转录终止子茎(接着是3′端尾U)。该终止子似乎与P2茎(最右侧的发夹)的3′部分竞争。322个GEMM实例中的78个具有与P2重叠的预测转录终止子。

图3显示了环二GMP适体。(A)第二信使环二GMP的化学结构。(B)1型及2型GEMM RNA的共有序列和结构。(C)来自霍乱弧菌(V.cholerae)2号染色体的Vc2 RNA的序列和结构，及其邻近VC1722ORF的部分。所示的核苷酸对应于110 Vc2 RNA构建体。黑体数字标识出如出现于D中的配体介导的结构调变(structure modulation)区。括号标识出所述最小5′或3′末端(当110 Vc2 RNA的对立末端被保留时)，所述末端在被以10nM环二GMP测试时呈现出结构调变。核苷酸13-20的序列为CGCACAGG。(D)由5′³²P-标记的110 Vc2 RNA直读探测(in-line probing)生成的RNA产物的PAGE分离。NR(无反应)；T1(以RNase T1部分消化)；^-OH(以碱部分消化)。将RNA在不存在(-)或存在(+)100μM环二GMP的情况下孵育。

图4显示了环二GMP的Vc2适体的亲和性和特异性。(A)切割的110 Vc2适体的标准化分数相对于环二GMP浓度的曲线图。结构调变位点如图3中所示。(B)环二GMP的110 Vc2适体和多种类似物所呈现的K_D值的比较。G(鸟苷)；pG、pGpG、pGpA(5′端磷酸化的单核苷酸及二核苷酸)；GpGpG(三核苷酸)、AMP和GMP(分别为腺苷单磷酸和鸟苷单磷酸)。(C)在直读探测条件下，保持完整的环二GMP的分数的自然对数相对于孵育时间的曲线图。线的负斜率可反映第二信使切割的非催化速率常数(k_uncat)。

图5显示了代表性环二GMP适体为基因控制元件的组件。(A)报告融合物构建体携带来自霍乱弧菌(Vc2)的野生型(WT)或突变型(M1至M3)核糖开关，或者携带来自蜡状芽孢杆菌(B.cereus)(Bc1和Bc2)或艰难梭菌(C.difficile)(Cd1)的同等WT和M3核糖开关。(B)当A中描述的构建体被转化至大肠杆菌(E.coli)中时，对这些构建体的β-半乳糖苷酶报告基因测定。对这4个代表物测定的最大Miller单位分别是436、47、5和51。(C)携带下游融合WT或M3 Cd1核糖开关的β-半乳糖苷酶报告基因(lacZ)并且被培养于含X-gal琼脂上的枯草芽孢杆菌(B.subtilis)细胞。

图6显示了表达一种环二GMP磷酸二酯酶可改变所述Cd1核糖开关调节的报告基因。(A)如下这样的枯草芽孢杆菌细胞，即该细胞携带与野生型(WT)Cd1核糖开关融合的β-半乳糖苷酶报告物构建体，并且被以缺乏(-)或携带(+)编码EAL磷酸二酯酶(PDE)的正常或突变(E170A)霍乱弧菌vieA基因的质粒转化。(B)如下这样的枯草芽孢杆菌细胞的β-半乳糖苷酶报告物测定，即该细胞携带与如指定的WT或M3核糖开关融合的报告基因，并被以A中描述的质粒转化。Cd1的标准化基因表达值1代表102个Miller单位。

图7显示了代表性生物的环二GMP核糖开关或适体的基因组定位。示出了紧接位于代表物下游的基因，如果是多个基因则表示预测的操纵子。无基因表示所述环二GMP适体不存在于任何ORF5′近端。COG3070连接于一个pfam04994结构域，这是一种类似于TfoX的蛋白排布(93，94)。染色体以阴影线表示；ori(复制起点)。

图8显示了真核生物中的典型SAM代谢循环。来自大肠杆菌(菌株K-12)或丁香假单孢杆菌(Pseudomonas syringae)的基因名在每种酶后的括号中给出。阴影框标识紧接SAH元件下游的ORF，而空白框标识在存在SAH元件时有时位于SAH水解酶基因ahcY下游(并且有可能与该基因在相同操纵子中)的ORF。THF为四氢叶酸。

图9显示了SAH元件是存在于许多革兰氏阳性菌和革兰氏阴性菌中的高度保守RNA基序。(A)位于SAH再循环基因5′UTR的保守RNA元件的共有核苷酸序列和二级结构模型。所述共有序列和结构模型的确定是通过检查68个代表性基序完成，所述基序不包括从几乎相同基因组DNA中所鉴定的重复。P1至P4标识了预测的碱基对区，并且携带或不包括任选P3茎的非重复的代表物数目被标示出。(B)由生物信息搜索所鉴定并由基因组前后序列所确认的SAH元件的系统发生分布，包括在紧密相关的细菌株中重复命中的相同序列。“其他”类是指在环境序列中出现的命中。

图10显示了来自芳香脱氯单胞菌(Dechloromonas aromatica)metH5′-UTR的SAH元件在选择性结合SAH时发生结构变化。(A)68metHRNA的序列和二级结构模型，它包含保守的SAH适体。从B中给出的数据鉴定了在5′³²P-标记的RNA的直读探测过程中的自发RNA切割位点。将在天然RNA不存在的两个鸟苷残基添加至所述构建体的5′端，以利于T7 RNA聚合酶的体外转录。区1至8及63至68中的核苷酸无法在B中所示的凝胶上观察到，因此不对这些残基的链切割定量。(B)在不存在(-)和存在浓度100pM-300μM的SAH的条件下，由68metHRNA直读探测产生的自发切割模式。泳道NR、T1和^-OH分别标识未处理的、以RNase T1部分消化的或在升高的pH下部分消化的前体RNA。一些通过RNase T1消化生成(在G残基后切割)的带被标识(箭头)，Pre标识了未切割的前体RNA带。自发RNA切割的调变区以竖条标识，并且被定量以估计结合亲和性的位点被标号为1至3。星号表示对应于G11后切割的产物带，但其中所述2′，3′-环磷酸中间体已经被水解得到在PAGE中呈现略微更大迁移率的2′-和3′-磷酸盐产物的混合物。(C)的曲线描绘了68 metH RNA在B中指定位点的自发切割对SAH和化合物3浓度(c)的依赖。通过使用对所收集数据的最佳拟合曲线并推定一个2态结合模型，可估计每种化合物的表观K_D值。诱导半最大结构调变所需的配体浓度可反映所述表观K_D。

图11显示了68 metH RNA与SAM相差数个数量级。(A)通过脱甲基化使放射性[³H]SAM衰竭会产生非放射性SAH。(B)将平衡透析用于比较已知的SAM适体(156 metA)的(Corbino et al.，2005)和68 metHRNA的SAM结合亲和性。每个平衡透析系统的槽a和b均由5000道尔顿截留分子量(MWCO)的透性膜分开。将标示的[³H]SAM(100nM)或RNA分别添加至槽a和b。所述SAM-II适体156 metA对SAM的表观K_D为约1μM(Corbino et al.，2005)，因此在所使用的条件下氚向槽b的转移将是最大的。由于68 metH RNA是过量存在的，非放射性SAH(来自[³H]SAM的自发脱甲基化)对所述槽之间的氚分布的影响将可以忽略。所示数据代表数次重复。(C)对SAH与68 metH RNA结合和用于平衡透析的68 metH RNA浓度的预测曲线的比较。当RNA以25μM存在时68 metH RNA不会最大转移[³H]SAM，该结果表明对SAM的表观K_D弱或差约1,000倍。M6携带的两个突变(G12U和A13U)与图13A中描绘的构建体M6在位置和核苷酸同一性方面是相当的。

图12显示了68 metH SAH适体的分子识别特征。(A)其配体结合亲和性被以68 metH RNA的直读探测确立的化合物的化学结构和表观K_D值。表观K_D值的估计如图10C中对SAH所述的。(B)总结了68 metHRNA对SAH的已知分子识别特征。

图13显示了一种控制报告基因表达的SAH核糖开关。(A)丁香假单孢杆菌ahcY 5′-UTR的序列和二级结构模型及被导入以进行基因表达研究的多种突变。(B)的曲线比较了融合到如A中定义的野生型(WT)和突变ahcY前导序列下游的β-半乳糖苷酶报告基因(lacZ)的表达水平。pRA301表示的报告株被lacZ之前没有任何插入的原始质粒pRA301转化。所使用的差异生长培养基在实验步骤中定义。值是3次独立实验的平均值，误差棒代表标准差。

图14显示了SAH水平的升高可增加核糖开关-报告物融合物的表达。(A)以曲线显示了在无补充物(-)或补充有25μM的Ado-2′，3′-dial或250μM其他所列化合物的Vogel-Bonner培养基中培养的野生型(WT)和突变(M6)报告株(图13A)的β-半乳糖苷酶表达水平。化合物缩写：Ado-2′，3′-dial(腺苷-2′，3′-二醛)；Ado(腺苷)；Hcy(高半胱氨酸)；L-met(L-甲硫氨酸)。(B)如A中所述以所示Ado-2′，3′-dial浓度将WT、M1和M7构建体用于报告物测定。值是3次独立实验的平均值，误差棒代表标准差。

图15显示了COG4708 RNA基序序列的比对。出现在超过97％和75％的代表物中的核苷酸分别表示为大写字母和小写字母(R＝A、G；Y＝C、U)。由括号标记的彩色区标明二级结构元件P1(蓝色)、P2(绿色)、P3(橙色)和P4(紫色)。描绘的所有序列都是唯一的。然而，一些序列仅在N_X代表的环区不同，因此此处显示是相同的。生物缩写：(Smu)变形链球菌(Streptococcus mutants)、(Spn-1)肺炎链球菌(S.pneumoniae)R6、(Spn-2)肺炎链球菌SP18-BS74、(Spn-3)肺炎链球菌SP19-BS75、(Spn-4)肺炎链球菌SP6-BS73、(Spy)化脓性链球菌(S.pyogenes)、(Sag-1)无乳链球菌(S.agalactiae)2630V/R、(Sag-2)无乳链球菌COH1、(Ssa)血链球菌(S.sanguinis)、(Ssu)猪链球菌(S.suis)、(Lla-1)乳酸乳球菌乳酸亚种(Lactococcus lactis subsp.lactis)、(Lla-2)乳酸乳球菌乳脂亚种(L.lactis subsp.cremoris)SK11、(Lca)干酪乳杆菌(Lactobacillus casei)。有另外12个Spy序列的实例，都是在不同的化脓性链球菌株中。有另外7个Spn-1实例，都是在不同的肺炎链球菌株中。有另外6个Sag-1实例，都是在不同的无乳链球菌株中。有另外1个Ssu实例，出现在一个不同的猪链球菌株中，并且有另外1个Lla-1实例，出现在一个不同的乳酸乳球菌株中。

图16显示了preQ₁对COG4708 RNA的结构调变。(A)COG4708RNA基序的共有序列和二级结构模型。非保守核苷酸由黑实线或空心圆表示，保守的配对元件P1-P4被标示出。箭头标识出存在于保持适体功能的截短构建体中的核苷酸(见图17)。阴影核苷酸包含一条Shine-Dalgarno(SD)序列。(B)通过变性PAGE分离的肺炎链球菌R6 preQ₁-II适体代表物(1-103 RNA)的自发切割产物。NR、T1、^-OH和(-)分别代表未反应、RNase T1的部分消化物、碱的部分消化物及无配体。选择的RNase T切割产物(切割3′的G残基)被识别在左边。右边编号的星号表示对preQ₁应答中结构调变的定位。(C)对应于预测的二级结构上的所述1-103 RNA的自发切割模式。小写字母g符号表示为提高转录添加的鸟苷，编号的星号表示B中所描绘的编号的区域。

图17显示了野生型和突变17-90 RNA的配体结合亲和性。(A)在17-90 RNA的数个核苷酸间键合处进行直读探测过程中自发RNA切割的调变相对于preQ₁摩尔浓度的对数的曲线图。(B)以从左(0.5nM)至右(10μM)的preQ₁浓度孵育的17-90 RNA的直读探测凝胶。右边的箭头指出用于生成A中结合曲线的带。其他符号如图16B的附图说明中所述。(C)具有识别出的破坏性和补偿性突变M1至M6的17-90 RNA的序列和结构。(D)由17-90 RNA、33-90 RNA和如C中所示突变17-90RNA M1至M6给出的preQ₁的K_D值。空心圆表示真实K_D值高于100μM。

图18显示了使用平衡透析对所述17-90 RNA适体结合的代谢物的分析。(A)³H-preQ₁和RNA在平衡透析装置的上样。槽a和b被一个5,000MOCO膜分开。(B)槽b的平衡透析的结果缺乏RNA(-)——17-90 RNA(1-81)和17-90 RNA的截短的且无活性的衍生物。对于竞争实验，将过量的未标记preQ₁和鸟嘌呤添加至包含17-90 RNA和³H-preQ₁的预平衡装置。误差棒代表3次独立实验的标准差。(C)平衡透析测定未转移的³H-标记材料能否被RNA结合的方法。对于第1次平衡，将H³-preQ₁以17-90 RNA(左)或在无RNA的情况下(右)平衡。从所述装置的每一侧取等分部分，评估氚的分布。对于第2次平衡，将来自缺乏RNA的槽(包含未转移的H³-标记物的槽a)的缓冲物转移至一个新装置并以包含17-90 RNA的槽b再次平衡。再次取等分部分，评估氚的分布。(D)C中所描述平衡透析实验的结果。误差棒代表3次独立实验的标准差。

图19显示了对所述17-90 preQ₁-II适体的分子识别分析。(A)17-90RNA(圆形)和preQ₁-I核糖开关(方块)对于preQ₁和配体类似物的分子识别特征的比较。preQ₁-I核糖开关的K_D值之前已被发表(Roth etal.2007)。化学结构上加阴影表示类似物和preQ₁之间的差异。中空符号表示在直读探测测定中配体的最高浓度，指示所述K_D值高于该浓度。(B)总结了从A中数据推断的分子识别接触。

图20显示了一个突变型17-90适体对配体辨别的改变。曲线描绘了多种浓度的(A)preQ₁和(B)DAP下，野生型(C41)和突变(U41)17-90 RNA直读探测所得的RNA结构的调变。点代表多条调变带的平均标准切割分数，误差棒代表该平均值的标准差。(C)与所述分子识别模型以及对来自肺炎链球菌R6的preQ₁-II适体的突变分析数据相一致的可能的适体-配体相互作用。

图21显示了携带COG4708蛋白的基因的物种分类树。包含两个拷贝的所述基因的物种以星号标记。编码COG4708的基因之前有preQ₁-I核糖开关的物种以I明示，所述基因之前有一preQ₁-II基序的物种以II明示。

图22显示了源自176种代表物的最通用形式的Moco RNA基序的共有序列和二级结构模型。R代表A或G，Y代表C或U。加框核苷酸表示的RBS被预测是某些Moco RNA代表物中邻近ORF的核糖体结合位点。

图23显示了(a)大肠杆菌moaABCDE操纵子的结构示意图。通过将第一转录起始位点(S1)定义为+1并将第二转录起始位点(S2)定义为-87，对moaA ORF上游基因组区确立核苷酸编号。Fnr和ModE结合位点的大致位置以填充的框明示，被指定为Moco RNA基序的区域以P1的末端核苷酸开始和终止(图22)。编号系统和多种特征的定位以前已被报道(Anderson et al.，2000)。(b)真细菌中钼辅因子生物合成通路(Schearz，2005)。除了ABC型钼酸盐转运体ModABC外，以缩写命名的蛋白都是该通路中的酶。结构研究(Sanihvili et al.，2004；Bader et al.，2004)表明，ModABC类似于MogA，因此可能参与至钼喋呤生物合成中。问号指示该转换的生物合成酶是未知的。列出的其他蛋白为使用Moco衍生物作为辅酶的酶。以黑色阴影突出显示编码区在至少一种生物中位于Moco RNA基序下游附近的蛋白。

图24显示了Moco RNA的直读探测测定。(a)描绘了与从比较序列分析数据预测的二级结构模型(图22a)相符的大肠杆菌138 moaARNA的序列。灰色阴影的核苷酸的自发3’磷酸二酯断裂发生率更高(从b中描绘的数据)，与在稳定的二级或三级结构中存在的核苷酸间键合相比，这通常表明提高的结构柔性水平。棒标识被预测作为核糖体结合位点的嘌呤核苷酸，moaA的翻译起始密码子在框中。(b)在来自大肠杆菌的138 moaA RNA直读探测测定过程中生成产物的凝胶图像。1-3道包含上样至凝胶的未孵育(未反应，NR)、以T1 RNase部分消化(T1)或进行部分的碱消化(^-OH)的5′³²P-标记的前体RNA(Pre)。4道上样有在不存在(-)可能的配体化合物的直读探测条件下孵育后的标记的前体RNA。标识的凝胶区域包含在被预测碱基配对的核苷酸后的切割的放射标记RNA片段。

图25显示了大肠杆菌Moco RNA需要Moco生物合成用于基因遏制。(a)描绘了其相应DNA模板融合至β-半乳糖苷酶报告基因的大肠杆菌149 moaA RNA的P3区。M1和M2携带如所示的相对于野生型(WT)RNA的核苷酸变化。(b)在不同Moco浓度下，与WT和突变Moco RNA融合的β-半乳糖苷酶报告mRNA的表达。培养基中存在或不存在阿拉伯糖时Moco浓度分别被提高或降低，这是因为存在受阿拉伯糖诱导型启动子控制的转基因moa操纵子。(c)上文描述的报告基因的表达对细胞内可获得的钼酸盐或钨酸盐的依赖。示出了在用于分析的大肠杆菌株存在(modC)或不存在(ΔmodC)功能性钼酸盐转运体蛋白的情形。细胞被培养于包含0.2％阿拉伯糖的LB中。报告基因表达测定重复进行3次并将它们的平均值作图，误差棒代表这些重复值的标准差。

图26显示了敲除大肠杆菌Moco生物合成通路多个基因对融合于WT 149 moaA RNA的DNA模板的β-半乳糖苷酶报告基因表达的影响。每个转基因株携带有在阿拉伯糖诱导型启动子控制之下的编码大肠杆菌moaABCDE的质粒。

图27显示了Moco RNA的大小和结构类似于来自大肠杆菌的其他核糖开关适体。(a)比较了大肠杆菌moaA Moco适体的长度与来自大肠杆菌已知被蛋白结合或者发挥核糖开关适体的功能的调节RNA元件的长度。核糖体蛋白的RNA靶不包括在该分析中。(b)a中描绘的RNA的二级结构模型。未显示的RNA没有经确认的二级结构。

图28显示了基序SAM-I和SAM-IV的比较情况。茎为标记的P1-P5。SAM-IV中的P5经常缺失，但其参与假结体的5′端一直存在。加粗显示了配体中已公开的

内的SAM-I 3-D结构(Montange and Batey 2006)中的核苷酸位置，这是它们在SAM-IV中相应的推定位置。被认为直接接触所述配体(例如A45)的6个位置依照它们的SAM-I编号(Montangeand Batey 2006)在两个基序中都被标记。对保守特征(核苷酸同一性、凸起和茎)加阴影，以指示它们是两个基序共有的(黄色)、SAM-I特有的(粉红)或SAM-IV特有的(蓝色)。

图29显示了SAM-IV RNA选择性结合SAM。(A)132 Sc RNA的序列和推断的二级结构。(B)直读探测凝胶。NR＝未反应(仅RNA)，T1＝RNase T1的部分消化(切割3′至鸟苷残基)，^-OH＝碱的部分消化(切断所有核苷酸间的键，(-)＝反应中未添加化合物。如所示地添加SAM、SAH、Ade(腺苷)和Met(甲硫氨酸)。G21-G117：对应于G残基后被切割的所选带的鉴定。R1-R5：发生配体介导的调变的区域。(C )从具有多个SAM浓度的凝胶(未显示)定量调变区(R1-R5)，并标准化至区间0(无SAM)至1(饱和SAM浓度)。表观K_D为其理论二态结合曲线与所示数据最佳拟合。显示了K_D＝150nM的理论曲线。

图30显示了SAM-IV是一种基因调节元件。(A)在所述适体二级结构中显示了测试的突变(M1、M2、M3)，但将整个基因间区用于报告物测定中(见材料和方法部分)。(B)将XylE报告物活性定量表示为每克总蛋白每分钟(测量20分钟以上)的A₃₇₅变化。细胞株为：“WT”＝野生型IGR，“M1”-“M3”＝突变IGR，“无载体”＝缺乏包含xylE报告基因的载体的细胞。(C)对选自B的3个典型实验进行吸光度相对于时间的作图。

具体实施方式

通过参考对下文中包括的实施例和具体实施方案的具体描述，以及参考附图及其上下文的描述，可以更容易地理解所公开的方法和组合物。

信使RNA通常被认为是遗传信息的被动载体，它可在翻译过程中被蛋白调节因子或小RNA调节因子和核糖体作用。已发现某些mRNA带有天然适体结构域，并且特异性代谢物与这些RNA结构域的结合可导致基因表达的调节。天然核糖开关具有天然RNA通常所不具有的两种功能。其一，mRNA元件可变为不同的结构状态，其中一种结构可作为其靶标代谢物的精确的结合袋。其二，由代谢物诱导的在结构状态之间的变构互变可导致通过几种不同机制之一的基因表达水平的改变。核糖开关通常可被划分为两个独立的结构域：一个选择性地结合靶标(适体结构域)，另一个影响基因控制(表达平台)。这两个结构域之间的动态相互作用导致对基因表达的依赖于代谢物的变构控制。

已识别了不同类别的核糖开关，这些不同类别的核糖开关表现出选择性地识别激活化合物(在本文中被称为触发分子)。例如，辅酶B₁₂、甘氨酸、硫胺素焦磷酸(TPP)和黄素单核苷酸(FMN)激活存在于如下的基因中的核糖开关，所述基因编码这些化合物的代谢或转运途径中关键的酶。每一类核糖开关的适体结构域与高度保守的共有序列和结构相一致。因此，可使用序列同源性检索来识别相关的核糖开关结构域。已在细菌、古细菌(archaea)和真核生物等多种生物中发现了核糖开关结构域。

A.核糖开关RNA的一般性结构

细菌核糖开关RNA是主要位于特定mRNA主编码区域的5’非翻译区(5’-UTR)的基因控制元件。结构性探查研究(下文将详述)发现核糖开关元件通常包括两个结构域：作为配体结合结构域的天然适体(T.Hermann，D.J.Patel，Science 2000，287，820；L.Gold，et al.，Annual Review of Biochemistry 1995，64，763)和与参与基因表达的RNA元件(例如Shine-Dalgarno(SD)元件；转录终止茎)相接的“表达平台”。上述结论是基于下述观察结果：体外合成的适体结构域在不存在表达平台的条件下与合适的配体相结合(见美国专利申请公布文本No.2005-0053951的实施例2、3和6)。此外，结构性探查研究表明，在独立检测的时候大多数核糖开关的适体结构域采用一种特定的二级和三级结构折叠，这基本上与存在完整的5’前导RNA时检测到的适体结构相同。这表明在许多情况下，适体结构域是独立于表达平台折叠的一个模块单元(见美国专利申请公布文本No.2005-0053951的实施例2、3和6)。

适体结构域的配体结合状态或未结合状态最终通过表达平台来反映，表达平台可以对基因表达产生影响。核糖开关作为一个模块元件的观点被以下事实进一步支持：适体结构域在多种生物之间是高度保守的(TPP核糖开关甚至在不同生物界之间都是保守的)(N.Sudarsan，et al.，RNA 2003，9，644)，而表达平台在序列、结构和控制附带开放阅读框表达的机制方面都有所变化。例如，配体结合到枯草芽孢杆菌的tenA mRNA的TPP核糖开关上可导致转录终止(A.S.Mironov，et al.，cell 2002，111，747)。这种表达平台与大肠杆菌thiMmRNA的TPP核糖开关的表达平台在序列和结构上均不同，大肠杆菌thiM mRNA的TPP核糖开关与TPP结合时会通过SD阻断机制导致对翻译的抑制(见美国专利申请公布文本No.2005-0053951的实施例2)。这两种转录单位的TPP适体结构域很容易被识别，并且具有几乎相同的功能特征，但是基因控制机制和实现该机制的表达平台则大不相同。

核糖开关RNA的适体结构域通常长度为约70至170个核苷酸(美国专利申请公布文本No.2005-0053951的附图11)。这一结果有些出人意料，因为体外进化实验识别了多种结合小分子的适体，它们的长度相当短，并且结构复杂(T.Hermann，D.J.Patel，Science 2000，287，820；L.Gold，et al.，Annual Review of Biochemistry 1995，64，763；M.Famulok，Current Opinion in Structural Biology 1999，9，324)。虽然天然适体序列相对于人工适体在复杂性和信息含量上的显著增加的原因还需要进一步的确证，但是相信这种复杂性是形成具有高亲和力和高选择性功能的RNA受体所需要的。配体-核糖开关复合物的表观K_D值从低纳摩尔量至低微摩尔量不等。还值得注意的是，当一些适体结构域与附带的表达平台相分离时，表现出比完整核糖开关更高的(约10至100倍)对靶配体的亲和力(见美国专利申请公布文本No.2005-0053951的实施例2)。可以推测，对由完整的核糖开关RNA所需的多种不同的RNA构象进行的采样中有消耗能量，这一点通过配体亲和力的损失而反映出来。由于适体结构域必须作为分子开关，这可能提高了天然适体的功能性要求，这一点可能也有助于解释它们为什么有更复杂的结构。

B.环二GMP核糖开关(GEMM基序)

包含GEMM基序的环二GMP应答性核糖开关(它还可被称作环二GMP核糖开关或GEMM核糖开关)包含两个被命名为P1和P2的相邻发夹(配对区)(图1和3)。P1的序列和结构是高度保守的，并且由一个被3核苷酸的内部环分隔并被一个末端环加帽的2碱基对茎和6碱基对茎组成。所述内部环是高度保守的，所述末端环几乎总是GNRA四元环(Hendrix 1997)。该P1茎在多个位置呈现了相关变异的重要证据，并且在大范围的细菌中是结构高度保守的。该事实以及P2的更适度的相关变异和长度可变的茎提供了GEMM作为一种结构化RNA发挥功能的有力证据。实施例2证明GEMM基序发挥核糖开关的功能。连接P1和P2的序列基本上总是AAA，在322个实例中仅有2个例外。

所述P2发夹显示了比P1更适度的保守性。如果P1四元环为GAAA，那么在P2中通常出现一个GNRA四元环受体。该受体经常为公知的11-nt基序，该基序可能是GAAA环偏爱的，但一些序列可以是新的四元环受体。如果P1具有一个GYRA四元环，那么所述受体样序列几乎不存在，但是有时会出现一个距所述P2碱基更近的凸起(图2)。

GEMM RNA与被称为1型和2型的两种相似结构(图3B)中的一种相符。两种类型都携带两个碱基配对区(P1和P2)，所述碱基配对区在鉴定的503个代表物中呈现广泛相关变异(Weinberg 2007)。1型RNA(303个实例)在P1上具有一个在第二位上为嘌呤(R)的GNRA四元环(Heus 1991)。GRRA序列的存在与在P2远端存在一个四元环受体相关，已知所述四元环受体可容纳该四元环类型(Costa 1995)。相反，2型RNA(171个实例)在所述四元环的第二位置具有一个嘧啶(Y)，并且在一些例中P2上包括一个有利于容纳GYRA四元环的结构(Costa 1995)。另外有29个未分类的代表物，其中24个携带一个以非配对核苷酸为侧翼的GNRA四元环，5个缺乏四元环序列。

GNRA四元环和它们的受体一般出现在结构化RNA中，并且在以前在核糖开关适体中被发现(Regulski 2008)。然而，Pl和P2发夹顶端的序列和结构变异性表明，环二GMP的任何结合位点可能位于携带最保守特征的中央部分或底部分。

许多GEMM实例包含一个不依赖ρ的转录终止子发夹。终止子茎的5′侧经常与所述P2茎的3′侧重叠(并被推测与之竞争)(图2B)。如果GEMM是一种核糖开关，那么配体的结合可稳定提出的P1和P2结构，从而阻止所述竞争性转录终止子形成。在该模型中，较高配体浓度可增加基因表达。δ-变形细菌中三分之一的GEMM代表物及其他分类单位中的某些是“串联”排列的，其中一例出现在3′端并邻近于相同UTR中的另一个。这样的调节性RNA排列涉及比简单的调节性RNA构型所允许的更复杂的基因表达控制(Sudarsan 2006；Welz 2007；Mandal2006)。

GEMM广泛存在于细菌中并明显具有高度保守的序列和结构，这暗示了一种对推定RNA进行重要的生物化学限制的功能。在革兰氏阳性菌和革兰氏阴性菌中发现了322种GEMM序列。它在δ-变形细菌中是共有的，特别在地杆菌及相关属中。在γ-变形细菌中，它在交替单胞菌目(Alteromonadales)和弧菌目(Vibrionales)中是普遍存在的。它在厚壁菌门和浮霉菌门(Plantomycetes)的某些目中也是共有的。具有GEMM的主要病原体包括霍乱和炭疽的致病原。

在序列数据包括基因注释的309个GEMM实例中，297例的GEMM位于一个基因的5′端调节构型中，暗示一种顺式调节功能。推测受GEMM调节的基因显示了大范围的功能，但大多数基因与细胞外环境或者与膜有关，且许多与运动性有关。

对GEMM生物功能的理解可有助于揭示它似乎进行调节的多种类的微生物过程。实际上，GEMM在物种霍乱弧菌(Vibrio cholerae)和硫还原地杆菌(Geobacter sulfurreducens)中涉及已是多项研究目标的两个系统。霍乱弧菌可导致人霍乱，但其生命周期的大部分时间是在水中，它在水中可粘附于多种甲壳类的含几丁质的外骨骼上。几丁质为GlcNAc(N-乙酰葡糖胺)的聚合物，已被表明可影响多种霍乱弧菌基因的表达(Meibom 2004)。GEMM似乎调节这些几丁质诱导型基因中的2个的表达。第1个是gbpA，它不但对于小鼠的感染(Kirn 2005)是重要的，而且对粘附于几丁质珠(Meibom 2004)和人上皮细胞(Kirn 2005)是重要的。

第二几丁质诱导型基因是tfoX^VC。值得注意地，几丁质可诱导霍乱弧菌的天然感受态(Meibom 2005)，并且tfoX^VC表达对这种感受态是重要的。霍乱弧菌具有匹配CDD模型COG3070和pfam04994的两个基因，所述两个模型对应于分离的tfoX结构域。两个结构域都产生优于10^-25的RPSBLAST(Schaffer 2001)E-值。它们中之一是tfoX^VC(座位VC1153)。GEMM似乎可调节另一个，所述另一个被称作tfoX^GEMM(VC1722)。因此，在霍乱弧菌及相关细菌中，GEMM可能参与几丁质诱导的感受态，或甚至在不包含提高的几丁质浓度的环境中调节感受态。

硫还原地杆菌及相关δ-变形细菌可使用金属离子例如Fe(III)作为电子受体，通过氧化有机化合物生成ATP(Methé2003)。GEMM在地杆菌属种中与菌毛组装基因相关。硫还原地杆菌的菌毛已被显示可导电(Reguera 2005)，因此是还原金属离子过程的一部分。

而且，GEMM在硫还原地杆菌中似乎调节7个细胞色素c基因。虽然该细菌有111个可能的细胞色素c基因，但7个GEMM相关基因中的5个已经在以前的研究中被鉴定，并且可能具有特殊的功能。OmcS(外膜细胞色素S)是在硫还原地杆菌外膜上高丰度的两种蛋白的一种，并且是还原不溶Fe(III)氧化物所需的，但非可溶的Fe(III)柠檬酸盐所需(Mehta 2005)。OmcG和OmcH对于产生OmcB是必需的，OmcB在很多情况下是一种必需的细胞色素c(Kimm 2006)。OmcA和OmcT与OmcG、OmcH或OmcS相关联。在硫还原地杆菌中仅剩下4种其他Omc注释与GEMM无直接关联：OmcB、OmcC、OmcE和OmcF。

与已知核糖开关不同，GEMM与大量不同的基因功能相关联(实施例1中表2)。该结果表明，GEMM核糖开关不作为控制代谢途径的典型的反馈传感器。相反，GEMM可感知一种参与信号转导或可能参与细胞-细胞通讯的第二信使分子(Bassler 2006)。实施例2证明了GEMM基序的第二信使触发分子为环二GMP。在该方式中，不同细菌使用GEMM及其信号分子来控制不同过程。许多GEMM相关基因编码信号转导结构域，这个事实表明了许多信号转导蛋白的调节机制。实施例2证明了GEMM RNA的确作为一类新发现的核糖开关的适体组件。

C.S-腺苷高半胱氨酸核糖开关

包含SAH基序的S-腺苷高半胱氨酸应答性核糖开关(它还被称作SAH核糖开关)包括一个分支的茎结构(图1和9A)。SAH基序的序列和结构是高度保守的(图1和9A)，显示了预测的茎区(包括模块和长度变化茎)内的相关变异。SAH核糖开关在实施例1和3中描述。主要在β-变形细菌和一些γ-变形细菌及特别在假单胞菌属中，SAH基序出现在与SAH(S-腺苷高半胱氨酸)代谢相关的基因5′端调节构型中。SAH是S-腺苷甲硫氨酸(SAM)代谢循环的一部分，该代谢循环的主要组件包括氨基酸甲硫氨酸及其衍生物高半胱氨酸。SAH是使用SAM作为甲基化反应的辅因子的酶的副产物。SAH一般被水解成高半胱氨酸和腺苷。然后，高半胱氨酸被用于合成甲硫氨酸及最终的SAM。

高水平的SAH对细胞是有毒的，这是因为SAH可抑制许多SAM依赖的甲基转移酶(Ueland 1982)。因此，在SAH达到毒性水平之前，细胞可能需要感知其升高的浓度并除去该化合物。SAH基序相关的基因为S-腺苷高半胱氨酸水解酶(ahcY)、钴胺素依赖的甲硫氨酸合酶(metH)及可合成一个用于甲硫氨酸合成中的甲基供体的亚甲基四氢叶酸还原酶(metF)。SAH基序的这种基因排列及其高水平的保守与在感知SAH及激活如下这样的基因表达中的作用是一致的，即该基因的产物是SAH破坏所需的。实际上，生物化学和遗传证据表明了该基序为SAH感知核糖开关。

D.PreQ₁核糖开关(preQ₁-II或COG4708基序)

包含preQ₁-II(它还可被称为COG4708基序)的PreQ₁应答性核糖开关(这种核糖开关还可被称为preQ₁核糖开关、preQ₁-II核糖开关或COG4708核糖开关)出现于链球菌属的一些种和乳酸乳球菌中的COG4708基因的上游，但链球菌属中的COG4708基因家族的一些实例缺乏推定的RNA基序。COG4708基因被预测可编码膜蛋白。preQ₁-II核糖开关在实施例1和4中描述。

虽然COG4708基序在系统发生方面被高度约束并只有6条独特序列，但它却显示了相关变异、模块茎和长度可变的茎(图1、15和16A)。该基序具有一个与COG4708基因Shine-Dalgarno序列重叠的假结，这表明所述基序编码这些基因的顺式调节子。

最近表征了一种可感知修饰的核碱基preQ₁的核糖开关(Roth2007)。由于该核糖开关与COG4708相关联，COG4708被提出为与preQ₁相关的代谢物的转运体。因此，COG4708基序被认为还是一种preQ₁感知核糖开关。这一点已获得了实验的支持。COG4708基序与以前表征的preQ₁感知核糖开关无序列和结构的相似性(Roth 2007)。

E.细菌中转录终止的核糖开关调控

细菌主要利用两种方法终止转录。某些基因包含依赖Rho蛋白的终止信号(J.P.Richardson，Biochimica et Biophvsica Acta 2002，1577，251)。而其他基因利用不依赖Rho的终止子(内部终止子)来破坏转录延伸复合体(I.Gusarov，E.Nudler，Molecular Cell 1999，3，495；E.Nudler，M.E.Gottesman，Genes to Cells 2002，7，755)。后一RNA元件由富含GC的茎环和后面的6-9个尿苷酰残基段组成。内部终止子在整个细菌基因组中广泛分布(F.Lillo，et al.，2002，18，971)，并通常位于基因或操纵子的3′-末端。有趣的是，观察到的位于5′-UTR的内部终止子的实例的数目在增加。

在细菌采用的多种基因调控策略中，RNA聚合酶以被调控方式应答5′-UTR的终止信号的一类实例在增加(T.M.Henkin，CurrentOpinion in Microbiology 2000，3，149)。在某些条件下，所述RNA聚合酶复合体受到外部信号指导以感知或忽视终止信号。尽管转录起始可能不被调控地出现，但是mRNA合成(和基因表达)最终通过内部终止子的调控而被控制。据推测，两种互斥的mRNA构象中至少有一种会形成或破坏传递转录终止信号的RNA结构。反式作用因子--在某些情况下是RNA(F.J.Grundy，et al.，Proceedings of theNational Academy of Sciences of the United States of America 2002，99，11121；T.M.Henkin，C.Yanofsky，Bioessays 2002，24，700)而在另外一些情况下是蛋白(J.Stulke，Archives of Microbiology 2002，177，433)--对于接受特定细胞内信号和随后稳定一种RNA构象通常是必需的。核糖开关在RNA结构调节和被基因调控机制解读的代谢物信号之间建立了直接的联系。

大多数临床抗细菌的化合物都可靶向仅有的4种细胞过程的一种(Wolfson 2006)。由于细菌具有进化良好的抗性机制来保护这些过程(D′Costa 2006)，开发对药物干涉脆弱的新靶是有用的。一种类型的脆弱过程是核糖开关对基因表达的调节(Winkler 2005)。一般出现在某些细菌mRNA的5′-UTR，每个已知核糖开关类的成员可形成这样一种结构化受体(或“适体”)(Mandal 2004)，即其已演化为可结合具体的基本代谢物。在大多数情形下，配体结合可调节参与所结合代谢物合成或转运的基因或基因组的表达。因为被核糖开关调节的生物化学途径经常是细菌存活必须的，所以对经由核糖开关靶向作用的这些通路的遏制可能是致死的。

数种抗细菌的代谢物类似物通过靶向核糖开关发挥功能(Sudarsan2003；Sudarsan 2005；Woolley 1943)。例如，抗细菌的硫胺类似物吡啶硫胺(Woolley 1943)最有可能通过靶向硫胺素焦磷酸结合的核糖开关发挥功能(Sudarsan 2005)。类似地，抗细菌的赖氨酸类似物L-氨乙基半胱氨酸(Shiota 1958)(AEC，图1b)可结合于来自枯草芽孢杆菌的lysC核糖开关，并抑制lysC调节的报告基因的表达(Sudarsan 2006)。而且，lysC核糖开关在抗AEC的枯草芽孢杆菌株(Lu 1991)和大肠杆菌株(Patte 1998)中是突变的。

应理解，如不另外说明，公开的方法和组合物不限于特定合成方法、特定分析技术或具体试剂，因此可有所改变。还应理解本文所用的术语只是为了描述具体实施方案，而不意欲作出限制。

材料

本文公开了可用于所公开的方法和组合物、可与之联合使用、可用于其制备或作为其产品的材料、组合物和组分。本文公开了这些和其他材料，应理解当公开这些材料的组合、子集、相互作用、分组等时，虽然可能没有明确公开具体的这些化合物的各个体的和总体的组合以及排列的每一种，但每种都在本文中明确地考虑和描述。例如，如果公开和讨论了核糖开关或适体结构域并且讨论了对包括所述核糖开关或适体结构域的若干分子作出的若干修饰，那么除非特别作出相反的说明，否则每种核糖开关或适体结构域的组合和排列以及可能的修饰都会被具体考虑。因此，如果公开了一类分子A、B和C以及一类分子D、E和F，还公开了一个组合分子的实例A-D，那么即使没有单独提到每种组合，每种组合也都被独立和综合地考虑了。因此，在此实例中，根据A、B和C；D、E和F；以及实例组合A-D的公开内容，A-E、A-F、B-D、B-E、B-F、C-D、C-E和C-F组合的每一个都被具体地考虑并应认为被公开。类似地，它们的任何子集或组合也被特别考虑和公开。因此，例如，根据A、B和C；D、E和F；以及实例组合A-D的公开内容，子集A-E、B-F和C-E被具体地考虑并应认为被公开。此概念适用于本申请所有方面，包括但不限于制备和使用所公开组合物的方法的步骤。因此，如果有多个可实施的其他步骤，应理解每个其他步骤都可与所公开方法的任何具体实施方案或实施方案组合一起实施，并且每个这种组合都被具体地考虑且应认为被公开。

A.核糖开关

核糖开关为表达控制元件，它是待表达的RNA分子的一部分，并且在与触发分子结合时改变状态。核糖开关通常可被划分为两个独立的结构域：一个选择性地结合靶标(适体结构域)，另一个影响基因控制(表达平台结构域)。这两个结构域之间的动力学相互作用导致了对基因表达的依赖代谢物的变构控制。公开了分离的和重组的核糖开关；含有这类核糖开关的重组构建体；与这类核糖开关可操作地连接的异源序列；以及含有这类核糖开关、核糖开关重组构建体和与异源序列可操作地连接的核糖开关的细胞和转基因生物。异源序列可以是：例如编码目的蛋白或肽包括报告蛋白或肽的序列。优选的核糖开关为天然存在的核糖开关或由天然存在的核糖开关产生，所述天然存在的核糖开关例如天然存在的环二GMP核糖开关。所述核糖开关可以包括人工适体或者任选地排除人工适体。例如，人工适体包括经体外演化和/或体外选择设计或选择的适体。所述核糖开关可包含天然存在核糖开关的共有序列，例如环二GMP核糖开关、SAH核糖开关、preQ₁核糖开关、Moco核糖开关和SAM-IV核糖开关的共有序列。环二GMP核糖开关的共有序列显示在图1和图3B中。环二GMP核糖开关的实例显示于图2和3C中。SAH核糖开关的共有序列显示于图1和9A中。preQ₁-II(基序preQ₁-II或COG4708)核糖开关的共有序列显示于图1、15(序列)和16A(结构)中。

公开了一种核糖开关，其中所述核糖开关为一种天然存在的核糖开关的非天然衍生物。所述核糖开关可以是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。所公开的核糖开关，包括它们的衍生物和重组形式，通常可以来自任何来源，包括天然存在的核糖开关和从头设计的核糖开关。任何这类的核糖开关都可被用于公开的方法或与公开的方法一起使用。然而，可能识别出不同类型的核糖开关，某些这样的亚类可能适用于特定的方法或与特定的方法一起使用(通常如本文中其他部分所述)。核糖开关的类型包括例如：天然存在的核糖开关、天然存在的核糖开关的衍生物和经修饰的形式、共有核糖开关、嵌合核糖开关和重组核糖开关。天然存在的核糖开关是这样一种核糖开关，它具有自然界中存在的核糖开关的序列。这类天然存在的核糖开关可以是自然界中存在的天然存在的核糖开关的分离形式或重组形式。也就是说，该核糖开关还具有相同的一级结构，但是已在新的基因背景或核酸背景中被分离或被基因工程改造。共有核糖开关具有天然存在核糖开关的共有结构的序列和特征。嵌合核糖开关可由例如下列的部分构成：任意或特定类别或类型的核糖开关的一部分和相同或任意不同类别或类型的核糖开关中的不同核糖开关的一部分；任意或特定类别或类型的核糖开关的一部分和非核糖开关序列或元件。重组核糖开关是在新的基因背景或核酸背景中被分离或被基因工程改造的核糖开关。

核糖开关可有一个或多个适体结构域。具有多个适体结构域的核糖开关中的各适体结构域可以表现出对触发分子的协同性结合，或可以不表现出对触发分子的协同性结合(也就是说适体不必要表现出协同性结合)。在后一种情况中，适体结构域可被称为独立结合物。含有多个适体的核糖开关可含有一个或多个表达平台结构域。例如，含有两个协同性结合其触发分子的适体结构域的核糖开关可以与被两个适体结构域调节的一个表达平台结构域相连接。含有多个适体的核糖开关可含有一个或多个以接头相连的适体。当这些适体对触发分子表现出协同性结合时，接头可为协同式接头。

对于进行协同性结合分析的适体结构域而言，如果适体结构域的数目(或者适体结构域上的结合位点的数目)为x，而它们的希尔系数n在x和x-1之间，那么就称这些适体结构域有协同性结合。因此，例如，如果具有两个适体结构域的核糖开关的希尔系数在2和1之间，则称它具有协同性结合。应当理解的是，所用的x值取决于参与协同性结合分析的适体结构域的数目，而不一定是核糖开关中存在的适体结构域的数目。这一点是有一定意义的，因为一个核糖开关可能含有多个适体结构域，但只有其中几个具有协同性结合性质。

还公开了含有异源的适体结构域和表达平台结构域的嵌合核糖开关。也就是说，嵌合核糖开关有来自一种来源的适体结构域和来自另一种来源的表达平台结构域。异源来源可来自例如不同的具体核糖开关、不同类型的核糖开关或不同类别的核糖开关。异源适体也可来自非核糖开关适体。异源表达平台结构域也可来自非核糖开关来源。

可以使用体外的筛选和进化技术产生经修饰的或衍生的核糖开关。通常，应用于核糖开关的体外进化技术包括产生一系列的变异体核糖开关，其中所述核糖开关序列的一个或多个部分有所改变而核糖开关的其他部分保持不变。然后可评估这一系列变异体核糖开关的激活、灭活或阻断(或其他的功能性或结构性标准)，符合所用标准的那些变异体核糖开关就被选择出来备用或用于下一轮进化。可用于产生变异体的基础核糖开关是本文公开的那些特定的和共有的核糖开关。可使用共有核糖开关来获知核糖开关的哪些部分在体外筛选和进化中有所变化。

还公开了调节作用发生改变的经修饰的核糖开关。可以通过将一个适体结构域和核糖开关的表达平台结构域可操作地连接(这就是嵌合核糖开关)，来改变该核糖开关的调节作用。适体结构域可以通过例如适体结构城的触发分子的作用来介导核糖开关的调节作用。可用任何合适的方式来将适体结构域和核糖开关的表达平台结构域可操作地连接，所述方式包括，例如用新的适体结构域代替核糖开关的正常的或天然的适体结构域。通常，可以激活、灭活或阻断适体结构域所来源的核糖开关的任何化合物或条件都可以用来激活、灭活或阻断嵌合核糖开关。

还公开了灭活的核糖开关。核糖开关可通过共价改变核糖开关的方式来灭活(通过例如使核糖开关的某部分交联或将化合物偶联至核糖开关)。可通过以下方法导致核糖开关的这种方式的灭活：例如，阻止触发分子与核糖开关结合的改变，阻止核糖开关与触发分子结合后状态变化的改变，或在核糖开关与触发分子结合后阻止其表达平台结构域影响表达的改变。

还公开了生物传感器核糖开关。生物传感器核糖开关是经过基因工程改造的核糖开关，它们在存在它们的同种触发分子时产生可检出的信号。可用的生物传感器核糖开关可以在触发分子达到或超过阈值水平时被触发。生物传感器核糖开关可被设计为体内应用或体外应用。例如，报告RNA编码作为信号的蛋白质或参与产生信号的蛋白质，与该报告RNA可操作地连接的生物传感器核糖开关可在体内被用于通过基因工程改造细胞或生物，使其含有编码核糖开关/报告RNA的核酸构建体。用于体外的生物传感器核糖开关的一个实例是包括构象依赖性标签的核糖开关，由该标签产生的信号随核糖开关的激活状态而变化。优选地，这种生物传感器核糖开关使用天然存在的核糖开关的适体结构域或由天然存在的核糖开关衍生的适体结构域。生物传感器核糖开关可用于各种环境和平台中。例如，生物传感器核糖开关与例如平板、芯片、条带和孔的固体载体一起使用。

还公开了识别新的触发分子的经修饰的或衍生的核糖开关。识别新的触发分子的新核糖开关和/或新适体可以从已知核糖开关中选择、从已知核糖开关开始设计或来源于已知核糖开关。这可通过下述步骤实现：例如，产生核糖开关中的一系列适体变异体；在存在目的化合物的条件下评估变异体核糖开关的激活；筛选被激活的变异体核糖开关(或者例如筛选激活度最高或激活选择性最强的核糖开关)和重复上述步骤，直至得到具有所需活性、特异性、活性和特异性的结合或其他性质的结合的变异体核糖开关。

通常，通过设计或调整表达平台结构域中的调节链，使其与适体结构域中的控制链互补，可以使任何适体结构域适用于任何表达平台结构域。或者，可以调整适体结构域中的适体和控制链的序列，使得控制链与表达平台中有功能意义的序列互补。例如，可调整控制链使其与RNA中的Shine-Dalgarno序列互补，以使得在控制链和SD序列之间形成茎结构后核糖体难以接近SD序列，由此减弱或阻止翻译的启动。注意适体链在序列上也应有相应的改变，以使得可以在适体结构域中形成P1茎。对于含有表现出协同性结合的多个适体的核糖开关的情况，只需要设计激活的适体(与表达平台结构域相互作用的适体)中的P1茎，使其与SD序列形成茎结构。

作为另一个实例，可以在RNA分子上加上一个转录终止子(最方便的是在RNA的非翻译区加入)，使得转录终止子序列的部分与适体结构域的控制链互补(该序列可为调节链)。这可使得适体结构域的控制序列与适体链和调节链形成可互变的茎结构，由此可在核糖开关激活或灭活后形成或破坏转录终止子。通过对互变茎结构的类似设计方法可以将任意其他表达元件置于核糖开关的控制之下。

对于由核糖开关控制的转录终止子而言，转录的速度以及核糖开关和表达平台元件的间隔对于合适的控制会十分重要。转录速度可通过下述方式调整：例如包含聚合酶暂停元件(例如一系列尿苷残基)以暂停转录并使得核糖开关形成和感受触发分子。

公开了可调节的基因表达构建体，包括编码RNA的核酸分子，所述RNA包括与编码区可操作地连接的核糖开关，其中所述核糖开关调节RNA的表达，其中所述核糖开关和编码区域为异源的。所述核糖开关可以是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关、一种SAM应答性核糖开关或这些核糖开关的衍生物。所述核糖开关可包含一个适体结构域和一个表达平台结构域，其中所述适体结构域和所述表达平台结构域是异源的。核糖开关可包括两个或两个以上的适体结构域和一个表达平台结构域，其中至少一个适体结构域和所述表达平台结构域为异源的。至少两个所述适体结构域可呈现出协同性结合。

公开了包含异源核糖开关和编码区的RNA分子。即，这种RNA分子由来自一个来源的核糖开关和来自另一个来源的编码区构成。所述异源的源可来自例如，不同RNA分子、不同转录物、来自不同基因的RNA或转录物、来自不同细胞的RNA或转录物、来自不同生物体的RNA或转录物、来自不同物种的RNA或转录物、天然序列及人工或工程改造的序列、特定的核糖开关、不同类型的核糖开关或者不同类别的核糖开关。

本文公开的术语“编码区”是指编码氨基酸的核酸的任何区域。这可以包括包含密码子或密码子模板的核酸链，以及这种核酸链在双链的核酸分子情况下的互补序列。不是编码区的核酸区域可被称作非编码区。转录的信使RNA分子一般在5′端和3′端都包括非编码区。真核mRNA分子还可以包括内部非编码区，例如内含子。一些类型的RNA分子可不包括功能性编码区，例如tRNA和rRNA分子。不包括功能性编码区的RNA分子(也可以被称作非编码RNA分子)的表达也可以被所公开的核糖开关调节或影响。因此，所公开的核糖开关可以本文对核糖开关与编码区可操作连接所公开的任意方式可操作地连接于非编码RNA分子。所述核糖开关可调节这样的RNA的表达，如本文公开对包含核糖开关可操作连接于编码区的RNA的调节一样。任何核酸分子的功能也可被所公开的核糖开关调节或影响。实例包括但不限于：RNA、DNA和人工核酸，包括肽核酸(PNA)、吗啉基及锁核酸(LNA)，以及二醇核酸(GNA)和苏糖核酸(TNA)。在所公开的方法中，所述核糖开关可调节例如所述编码区的表达、所编码的蛋白的表达、所述非编码RNA分子的表达、所述RNA的或所述编码区的转录或者所编码的蛋白的翻译。

1.适体结构域

适体是可与特定化合物和特定类别的化合物选择性结合的核酸区段和结构。核糖开关具有在与触发分子结合时可导致该核糖开关的状态或结构发生改变的适体结构域。在功能性核糖开关中，当触发分子与适体结构域结合时，连接至所述适体结构域的表达平台结构域的状态或结构会发生改变。核糖开关的适体结构域可从任何来源获得，包括例如核糖开关的天然适体结构域，人工适体，经工程改造、选择、演化或衍生得到的适体或适体结构域。核糖开关中的适体的至少一部分通常可与相连的表达平台结构域的一部分例如通过形成茎结构发生相互作用。与触发分子结合时可形成或破坏这种茎结构。

多种天然核糖开关的共有适体结构域显示于美国申请公开文本No.2005-0053951的图11和本文他处。环二GMP核糖开关的共有序列和结构可见于图1和图3。SAH核糖开关的共有序列可见于图1和9A。preQ₁-II(基序preQ₁-II或COG4708基序)核糖开关的共有序列可见于图1、15(序列)和16A(结构)。这些适体结构域(包括其中包含的所有直接变种)可用于核糖开关。共有序列和结构可明示序列和结构中的变异情况。明示的变异范围内的适体结构域在本文中称为直接变种。这些适体结构域可被修改以产生被修改的适体结构域或变种适体结构域。保守性修改包括使得碱基对中的核苷酸仍保持互补的碱基配对的核苷酸的任何改变。中度修改包括茎或环(其长度或长度范围被明示)的长度改变小于或等于明示长度范围的20％。在共有结构显示出特定长度的茎或环，或列出或示出长度范围的情况下，环和茎被认为是“明示的”。中度修改包括茎或环(其长度或长度范围未被明示)的长度改变小于或等于明示长度范围的40％。中度修改还包括适体结构域未明示部分的功能性变种。

公开的核糖开关的适体结构域也可作为适体用于任何其他目的和任何其他环境。例如，在结构变化会影响RNA的功能的情况下，适体可被用于控制核酶、其他分子开关和任何RNA分子。

2.表达平台结构域

表达平台结构域是核糖开关的一部分，其影响含有所述核糖开关的RNA分子的表达。表达平台结构域通常有至少一部分可与相连的适体结构域的一部分相互作用，如通过形成茎结构。与触发分子结合时可形成或破坏这种茎结构。通常情况下，所述茎结构要么就是表达调控结构，要么防止形成表达调控结构。表达调控结构是可允许、阻止、加强或抑制含有该结构的RNA分子的表达的结构。实例包括Shine-Dalgarno序列、起始密码子、转录终止子，以及稳定信号和加工信号，例如RNA剪接点和控制元件。

B.触发分子

触发分子是可激活核糖开关的分子和化合物。这包括核糖开关的天然或正常的触发分子和其他可激活核糖开关的化合物。天然或正常触发分子是给定的天然核糖开关本来就有的触发分子，或者对于某些非天然核糖开关而言是这样的触发分子：该核糖开关针对该触发分子被设计或该核糖开关通过该触发分子被选择(正如在例如体外选择或体外进化技术中那样)。

C.化合物

还公开了可激活、灭活或阻断核糖开关的化合物和含有这些化合物的组合物。核糖开关通过结合或去除触发分子来起到控制基因表达的作用。化合物可用于激活、灭活或阻断核糖开关。核糖开关的触发分子(以及其他激活化合物)可用于激活核糖开关。触发分子以外的化合物通常可用于灭活或阻断核糖开关。核糖开关也可通过例如从所述核糖开关所在处除去触发分子而灭活。核糖开关可通过例如与不激活该核糖开关的触发分子类似物结合而被阻断。

还公开了用于改变RNA分子或编码RNA分子的基因的表达的化合物，其中所述RNA分子包含核糖开关。这可通过使化合物与所述RNA分子接触来实现。核糖开关通过结合或去除触发分子来起到控制基因表达的作用。因此，将包含核糖开关的目的RNA分子置于激活、灭活或阻断所述核糖开关的条件下，可用于改变所述RNA的表达。表达可因例如转录被终止或核糖体与所述RNA的结合受到阻断而改变。与触发分子的结合可减少或阻止所述RNA分子的表达，或者可促进或增加所述RNA分子的表达，这取决于核糖开关的性质。

还公开了用于调节RNA分子或编码RNA分子的基因的表达的化合物。还公开了通过激活、灭活或阻断核糖开关来调节含有所述核糖开关的天然存在的基因或RNA的表达的化合物。如果所述基因对含有它的细胞或生物体的存活是必需的，那么激活、灭活或阻断所述核糖开关可导致所述细胞或生物体的死亡、瘀滞或虚弱。

还公开了通过激活、灭活或阻断核糖开关来调节经分离、工程改造或重组得到的含有所述核糖开关的基因或RNA的表达的化合物。如果基因编码一种所需的表达产物，则激活或灭活该核糖开关可被用于诱导该基因的表达，并由此导致表达产物的产生。如果该基因编码基因表达或另一细胞过程的一种诱导物或抑制物，则激活、灭活或阻断该核糖开关可导致其他被调节基因或细胞过程的诱导、抑制或脱抑制。已知多种这样的次级调节效应，它们也可适用于核糖开关。核糖开关作为这类调节的初级控制的一个优势是核糖开关的触发分子可为非抗原性小分子。

还公开了识别可激活、灭活或阻断核糖开关的化合物的方法。例如，激活核糖开关的化合物可通过使测试化合物与核糖开关相接触并评估所述核糖开关的激活情况来识别。如果所述核糖开关被激活，那么所述测试化合物就被识别为可激活所述核糖开关的化合物。可用任何合适的方式评估核糖开关的激活情况。例如，核糖开关可被连接至一个报告RNA，然后在存在和不存在所述测试化合物的情况下测量所述报告RNA的表达、表达水平或表达水平的变化。作为另一个实例，所述核糖开关可包括一个构象依赖标签，其信号根据所述核糖开关的激活状态而改变。这种核糖开关优选地使用取自或衍生自天然存在的核糖开关的适体结构域。可以看出，对核糖开关的激活情况进行评估使用或不使用对照测定或测量均可。识别灭活核糖开关的化合物的方法可按类似方式进行。

对阻断核糖开关的化合物的识别可通过任何合适的方法来完成。例如，可在已知可激活或灭活核糖开关的化合物存在的情况下和在测试化合物存在的情况下进行评估所述核糖开关的激活或灭活的测定。如果未观察到在所述测试化合物不存在的情况下可观察到的激活或灭活，那么所述测试化合物被识别为阻断所述核糖开关被激活或灭活的化合物。

本文还公开了可与所述环二GMP、SAH、preQ₁、Moco和SAM-IV核糖开关相互作用的化合物。可以通过与RNA结构中其他官能团产生新的接触的方式，使得经过进一步修饰的上述化合物具有改善的与所述核糖开关的结合力。此外，通过在骨架的这两个区域加以修饰，可以对生物活性、毒性和合成难度(以及其他特征)进行调节，因为核糖开关的结构模型显示可能在这些位点有多种修饰。

高通量筛选还可用于发现也可与核糖开关RNA结合的全新的化学骨架，所述结合可以通过标准的或非标准的分子识别模式进行。有多种手段都可用于检测结合代谢物的RNA，包括使用基于凝胶和基于芯片检测方法的变构核酶测定和直读探测测定。还公开了由识别可激活、灭活或阻断核糖开关的化合物和对识别出的化合物进行制备而获得的化合物。这可以通过例如将本文其他部分公开的化合物识别方法与制备识别出的化合物的方法相结合使用而实现。例如，可通过下述方法获得化合物：使待测化合物和核糖开关相接触，评估核糖开关的激活，以及如果核糖开关被待测化合物激活，则制备该激活核糖开关的待测化合物作为所述化合物。

还公开了由核实某种化合物对核糖开关的激活、灭活或阻断作用和对经核实的化合物进行制备而获得的化合物。这可以通过例如将本文其他部分公开的化合物激活、灭活或阻断评估方法与对经核实的化合物的制备方法结合使用而实现。例如，可通过下述方法获得化复合物：使待测化合物和核糖开关相接触，评估核糖开关的激活，以及如果核糖开关被待测化合物激活，则制备该激活核糖开关待测化合物作为所述化合物。核实化合物激活、灭活或阻断核糖开关的能力指的是对以前并不知道可否激活、灭活或阻断核糖开关的化合物鉴定，以及对已知可激活、灭活或阻断核糖开关的化合物激活、灭活或阻断核糖开关的能力评估。

本文中使用的术语“取代的”意在包括有机化合物的所有允许的取代基。广义上讲，允许的取代基包括有机化合物的非环状的和环状的、分支的和未分支的、碳环的和杂环的以及芳香族的和非芳香族的取代基。示例性的取代基包括例如下述的那些基团。对于合适的有机化合物，可有一个或多个相同或不同的允许的取代基。出于本发明公开的目的，例如氮原子的杂原子可以具有氢取代基和/或满足杂原子的价位的任何本文所述的允许取代基。有机化合物的允许取代基并不意在以任何方式限制本发明的公开内容。此外，术语“取代”或“用......取代”包括下述隐含条件：这类取代应符合取代原子和取代基的价位，并且这类取代产生的是稳定的化合物，例如不会自发地进行例如重排、环化、消去等转化反应的化合物。

本文中使用的“A¹”、“A²”、“A³”和“A⁴”是一般性标记，表示各种的具体取代基。这些标记可以是任何取代基，并不限于本文公开的那些取代基，在一种情况中它们指代某种取代基，也可能在另一种情况中它们就指代别的取代基。

本文中使用术语“烷基”指的是1至24个碳原子的分支或不分支的饱和烃基，例如甲基、乙基、正丙基、异丙基、正丁基、异丁基、叔丁基、戊基、己基、庚基、辛基、壬基、癸基、十二烷基、十四烷基、十六烷基、二十烷基、二十四烷基等等。烷基可为取代的或未取代的。烷基可以被一个或多个下述基团取代，所述基团包括但不限于下文所述的烷基、卤化烷基、烷氧基、烯基、炔基、芳基、杂芳基、醛、氨基、羧酸、酯、醚、卤化物、羟基、酮、硫代-氧代(sulfo-oxo)、磺酰基、砜、亚砜或巯基。术语“低级烷基”是具有6个或6个以下碳原子的烷基，例如甲基、乙基、正丙基、异丙基、丁基、仲丁基、异丁基、叔丁基、戊基、己基等等。

在本说明书通篇中，一般用“烷基”指代未取代的烷基和取代的烷基；然而取代的烷基在本文中也以指出烷基上具体的取代基的方式被特别提及。例如，术语“卤化烷基”特别指被一个或多个例如氟、氯、溴或碘的卤化物取代的烷基。术语“烷氧基烷基”特别指如下所述被一个或多个烷氧基取代的烷基。术语“烷基氨基”特别指如下所述被一个或多个氨基取代的烷基等等。当在一种情况中使用“烷基”而在另一种情况中使用例如“卤化烷基”的具体术语时，并非意在暗示术语“烷基”就不包括例如“卤化烷基”等的具体术语。

这一习惯也适用于本文所述的其他基团。也就是说，例如术语“环烷基”指的是未取代和取代的环烷基部分，而取代的部分可在本文中另外具体地指明；例如，具体的取代的环烷基可被称为例如“烷基环烷基”。类似地，一种取代的烷氧基可被具体地称为例如：“卤化烷氧基”，一种具体的取代烯基可被地称为例如：“烯基醇”等等。此外，使用例如“环烷基”的一般性术语和例如“烷基环烷基”的具体术语，并非意在暗示一般性术语不包括具体术语。

本文中所使用的术语“烷氧基”是指通过一个末端醚键键合的烷基；也就是说“烷氧基”可被定义为-OA¹，其中A²为上文定义的烷基。

本文中使用的术语“烯基”为有2至24个碳原子的烃基，它们的结构式中含有至少一个碳-碳双键。例如(A¹A²)C＝C(A³A⁴)的这种不对称结构意在包括E型和Z型异构体。在存在不对称烯的本文结构式中可假定上述结构，或者由键符号C＝C明确地表示出来。烯基可被一个或多个下述基团所取代，所述基团包括但不限于下文所述的烷基、卤化烷基、烷氧基、烯基、炔基、芳基、杂芳基、醛、氨基、羧酸、酯、醚、卤化物、羟基、酮、硫代-氧代、磺酰基、砜、亚砜或巯基。

本文中使用的术语“炔基”为有2至24个碳原子的烃基，它们的结构式中含有至少一个碳-碳叁键。炔基可被一个或多个下述基团所取代，所述基团包括但不限于下文所述的烷基、卤化烷基、烷氧基、烯基、炔基、芳基、杂芳基、醛、氨基、羧酸、酯、醚、卤化物、羟基、酮、硫代-氧代、磺酰基、砜、亚砜或巯基。

本文中使用的术语“芳基”为含有任何以碳为基础的芳香族基团的基团，包括但不限于苯、萘、苯基、联苯基、苯氧基苯等。术语“芳基”还包括“杂芳基”，“杂芳基”指的是含有的芳基基团的环上至少掺入一个杂原子的基团，杂原子的实例包括但不限于氮、氧、硫和磷。类似地，术语“非杂芳基”也包括在术语“芳基”之内，指的是包括不含杂原子的芳基的基团。芳基可为取代的或未取代的。芳基可被一个或多个下述基团所取代，所述基团包括但不限于本文所述的烷基、卤化烷基、烷氧基、烯基、炔基、芳基、杂芳基、醛、氨基、羧酸、酯、醚、卤化物、羟基、酮、硫代-氧代、磺酰基、砜、亚砜或巯基。术语“联芳基”是芳基基团的一种具体形式，也包括在芳基的定义之内。联芳基指的是如萘那样通过稠环结构键合在一起或者如联苯那样通过一个或多个碳碳键连接的两个芳基，。

本文中使用的术语“环烷基”为由至少三个碳原子组成的非芳香性的以碳为基础的环。环烷基基团的实例包括但不限于环丙烷基、环丁烷基、环戊烷基、环己烷基等等。术语“杂环烷基”为前面定义的环烷基的一种，但是它的环上至少有一个碳原子被杂原子取代，所述杂原子例如但不限于氮、氧、硫或磷。环烷基和杂环烷基可为取代的或未取代的。环烷基和杂环烷基可被一个或多个下述基团所取代，所述基团包括但不限于本文所述的烷基、烷氧基、烯基、炔基、芳基、杂芳基、醛、氨基、羧酸、酯、醚、卤化物、羟基、酮、硫代-氧代、磺酰基、砜、亚砜或巯基。

本文中使用的术语“环烯基”为由至少三个碳原子组成的非芳香性的以碳为基础且在环上含有至少一个双键即C＝C的环。环烯基基团的实例包括但不限于环丙烯基、环丁烯基、环戊烯基、环戊二烯基、环己烯基、环己二烯基等等。术语“杂环烯基”为前面定义的环烷基的一类并且包括在术语“环烯基”的含义之内，但是它的环上至少有一个碳原子被杂原子取代，所述杂原子例如但不限于氮、氧、硫或磷。环烯基和杂环烯基可为取代的或未取代的。环烯基和杂环烯基可被一个或多个下述基团所取代，所述基团包括但不限于本文所述的烷基、烷氧基、烯基、炔基、芳基、杂芳基、醛、氨基、羧酸、酯、醚、卤化物、羟基、酮、硫代-氧代、磺酰基、砜、亚砜或巯基。

本文中使用的术语“环状基团”指的是芳基基团、非芳基基团(即环烷基、杂环烷基、环烯基和杂环烯基)或二者皆有。环状基团具有一个或多个可被取代或未取代的环系统。环状基团可包括一个或多个芳基基团、一个或多个非芳基基团，或者一个或多个芳基基团、一个或多个非芳基基团。

本文中所使用的术语“醛”用通式-C(O)H表示。在本说明书通篇中“C(O)”都是C＝O的简写形式。

本文中使用的术语“胺”或“氨基”用通式NA¹A²A³表示，其中A¹、A²和A³可以独立地为上文所述的氢、烷基、卤化烷基、烯基、炔基、芳基、杂芳基、环烷基、环烯基、杂环烷基或杂环烯基。

本文中所使用的术语“羧酸”用通式-C(O)OH表示。本文中所使用的“羧酸根”用通式-C(O)O^-表示。

本文中所使用的术语“酯”用通式-OC(O)A¹或-C(O)OA¹表示，其中A¹可以为上文所述的烷基、卤化烷基、烯基、炔基、芳基、杂芳基、环烷基、环烯基、杂环烷基或杂环烯基。

本文中所使用的术语“醚”用通式A¹OA²表示，其中A¹和A²可以独立地为上文所述的烷基、卤化烷基、烯基、炔基、芳基、杂芳基、环烷基、环烯基、杂环烷基或杂环烯基。

本文中所使用的术语“酮”用通式A¹C(O)A²表示，其中A¹和A²可以独立地为上文所述的烷基、卤化烷基、烯基、炔基、芳基、杂芳基、环烷基、环烯基、杂环烷基或杂环烯基。

本文中所使用的术语“卤化物”指的是卤素氟、氯、溴和碘。

本文中所使用的术语“羟基”用通式-OH表示。

本文中所使用的术语“硫代-氧代”用下列通式表示：-S(O)A¹(即“磺酰基”)、A¹S(O)A²(即“亚砜”)、-S(O)₂A¹、A¹SO₂A²(即“砜”)、-OS(O)₂A¹或-OS(O)₂OA¹，其中A¹和A²可以为上文所述的氢、烷基、卤化烷基、烯基、炔基、芳基、杂芳基、环烷基、环烯基、杂环烷基或杂环烯基。在本说明书通篇中“S(O)”都是S＝O的简写形式。

本文中所使用的术语“磺酰氨基”或“磺酰胺”用通式-S(O)₂NH-表示。

本文中所使用的术语“巯基”用通式-SH表示。

本文所使用的“Rⁿ”(其中n为整数)可以独立地具有一个或多个上述的基团。根据所选择的基团，第一基团可能掺入第二基团中，或者第一基团可能连接于第二基团(即附着于第二基团上)。例如，使用短语“包括氨基的烷基”时，氨基可能掺入于烷基的主链上。或者氨基可能是附着在烷基主链上。所选择的基团的性质将决定第一基团是嵌入第二基团中还是附着在第二基团上。

如果没有明确指出，化学键只以实线表示而未用楔形线或虚线表示的化学式考虑了每种可能的异构体，例如每种对映异构体和非对映异构体，以及异构体的混合物，例如外消旋混合物或非外消旋(scalemic)的混合物。

本文公开的某些物质、化合物、组合物和组分可以由商购得到，或是使用本领域技术人员公知的技术容易地合成得到。例如，在制备所公开的化合物和组合物中使用的起始物质和试剂可以从下述的供应商处商购：例如Aldrich Chemical Co.，(Milwaukee，Wis.)、AcrosOrganics(Morris Plains，NJ.)、Fisher Scientific(Pittsburgh，Pa.)或Sigma(St.Louis，Mo.)；或者使用本领域技术人员已知的方法按照下述文献中所述的工艺来制备：例如，Fieser and Fieser’s Reagents forOrganic Synthesis，Volumes 1-17(John Wiley和Sons，1991)；Rodd′sChemistry of Carbon compounds，Volumes 1-5 and Supplementals(Elsevier Science Publishers，1989)；Organic Reactions，Volumes 1-40(John Wiley and Sons，1991)；March′s Advanced Organic Chemistry，(John Wiley and Sons，4th Edition)和Larock′s ComprehensiveOrganic Transformations(VCH Publishers Inc.，1989)。

用于激活所公开的核糖开关的化合物包括：环二GMP、pGpG、GpG或GpGpG、可激活一种环二GMP应答性核糖开关的环二GMP、pGpG、GpG或GpGpG的衍生物；S-腺苷高半胱氨酸、可激活一种S-腺苷高半胱氨酸应答性核糖开关的S-腺苷高半胱氨酸的衍生物；preQ₁、可激活一种preQ₁应答性核糖开关的preQ₁的衍生物；Moco、可激活一种Moco应答性核糖开关的Moco的衍生物；SAM、可激活一种SAM应答性核糖开关的SAM的衍生物。用于激活一种SAM-IV核糖开关的化合物还可以为MeAzaAdoMet。

为了激活一种S-腺苷高半胱氨酸应答性核糖开关，所述化合物可以为S-腺苷高半胱氨酸。所述化合物还可以是能激活S-腺苷高半胱氨酸应答性核糖开关的S-腺苷高半胱氨酸的衍生物。例如，所述化合物可以为S-腺苷-L-半胱氨酸(SAC)。图12B显示了对于可激活一种S-腺苷高半胱氨酸应答性核糖开关的化合物很重要的结构元件。

为了激活preQ₁应答性核糖开关(及衍生自preQ₁应答性核糖开关的核糖开关)，所述化合物可以是这样的preQ₁衍生物，即其中第1位的N可以被C、O或S取代，其中第2位的氨基可被氢键供体取代，其中第6位的氧可被氢键受体取代，其中第7位的氨基可被氢键受体取代，并且所述氮可被氢键供体取代或者衍生化。

应当理解的是，当某一具体部分或基团可被称为氢键供体或氢键受体时，使用这一术语仅仅是为了便于参照而将各种取代基进行分类。这一用语并不应被理解为某一具体部分真正参与了与核糖开关或其他化合物形成氢键的过程。也有这种可能，例如，在本文中被称为氢键受体(或氢键供体)的某一部分可能是唯一地或另外地参与了与核糖开关或其他化合物形成疏水相互作用、离子键、范德华力或其他类型相互作用。

还应理解的是，本文公开的某些基团在本文中既可以被称为氢键受体，也可以被称为氢键供体。例如，-OH可以通过贡献一个氢原子而成为氢键供体；-OH也可以通过氧原子上的一个或多个非键合电子对而成为氢键受体。因此，在本说明书通篇中，各个部分可为氢键供体和氢键受体，并且可照这样称谓。

上面定义中的每种化合物在本文中意欲并应该被认为被具体地公开。而且，可在上面定义内指出的每一亚类在本文中意欲并应该被认为被具体地公开。因此，特别考了，任何化合物或化合物亚类或者特别被纳入使用或被排除使用，或者被包含于一化合物列表中或被排除在外。作为一个实例，考虑了其中每种化合物都如上所定义并能够激活一种环二GMP应答性核糖开关的一组化合物。

应理解，本文所述的与核糖开关相互作用的化合物的具体接触和相互作用(如氢键供应或接受)对于化合物与核糖开关的相互作用是优选但非必需的。例如，化合物可以以比发生所公开的接触和相互作用的化合物小的亲和力和/或特异性与核糖开关相互作用。而且，所述化合物上不同的或其他的官能团可引入与核糖开关的新的、不同的和/或补偿性接触。这种官能团与所述核糖开关的其他部分可发生接触和相互作用和可被设计以发生接触和相互作用。这种接触和相互作用可补偿触发分子与核心结构的接触和相互作用。

D.构建体、载体和表达系统

所公开的核糖开关可在任何合适的表达系统中使用。重组表达可以使用例如质粒等载体来有效实现。载体可包括与核糖开关编码序列可操作地连接的启动子和待表达的RNA(例如，编码蛋白的RNA)。载体还可包括转录和翻译所需的其他元件。本文所述的载体指的是包含外源DNA的任何载体。因此，载体是可将外源核酸不降解地转移至细胞中的媒介，它包括可在其转入的细胞中表达所述核酸的启动子。载体包括但不限于：质粒、病毒核酸、病毒、噬菌体核酸、噬菌体、粘粒和人工染色体。可以生产多种适于携带核糖开关调节的构建体的原核和真核的表达载体。这类表达载体包括例如：pET、pET3d、pCR2.1、pBAD、pUC和酵母载体。载体可在例如各种体内和体外环境中使用。

病毒载体包括腺病毒、腺伴随病毒、疱疹病毒、牛痘病毒、脊髓灰质炎病毒、AIDS病毒、神经营养病毒(neuronal trophic virus)、辛德毕斯病毒(Sindbis)和其他RNA病毒，包括具有HIV骨架的那些病毒。还可使用与上述病毒具有共同的使其适于用作载体的性质的任何病毒家族。由Verma(1985)描述的逆转录病毒载体包括鼠类马罗尼白血病病毒MMLV和表现MMLV作为载体的理想性质的逆转录病毒。通常，病毒载体包括非结构性早期基因、结构性晚期基因、RNA聚合酶III转录物、复制和壳体化必需的反向末端重复序列以及控制病毒基因组的转录和复制的启动子。当被基因工程改造用作载体时，通常要移除病毒的一个或多个早期基因，并将一个基因或基因/启动子盒插入到病毒基因组中代替被移除的病毒DNA。

“启动子”通常为位于与转录起始位点相对固定的位置发挥功能的一个或多个DNA序列。“启动子”包括与RNA聚合酶发生基本相互作用所需的核心元件以及转录因子，还可包括上游元件和应答元件。

“增强子”通常指的是位于与转录起始位点相对不固定的位置发挥功能的DNA序列，它可以在转录单位的5’(Laimins，1981)或3’(Lusky et al.，1983)。此外，增强子除了可以在编码序列本身之中(Osborne et al.，1984)，也可以在内含子中(Banerji et al.，1983)。它们的长度通常为10bp至300bp之间，并且以顺式方式发挥作用。增强子的功能是增加邻近的启动子的转录。增强子与启动子类似，也经常含有介导转录的调节的应答元件。增强子经常对表达的调节有决定性作用。

用于真核宿主细胞(酵母、真菌、昆虫、植物、动物、人类或有核细胞)中的表达载体还可包括可以影响mRNA表达的转录终止所必需的序列。这些区域在编码组织因子蛋白的mRNA的非翻译部分中以多腺苷酸化区段的形式被转录。3’非翻译区还包括转录终止位点。优选地，转录单位也包括多腺苷酸化区域。这一区域的一个优点是它增加了被转录的单位像mRNA一样被加工和转运的可能性。多腺苷酸化信号在表达构建体中的鉴定和用途已经广为人知。优选地，在转基因构建体中使用同源的多腺苷酸化信号。

载体可包括编码标记物产物的核酸序列。使用这种标记物产物来确定基因是否被送递至细胞以及在送递后是否被表达。优选的标记物基因为编码β-半乳糖苷酶的大肠杆菌lacZ基因和绿色荧光蛋白。

在一些实施方案中，标记物可为筛选标记物。当这类筛选标记物被成功地转移至宿主细胞中时，如果将宿主细胞置于筛选压力下，则被转化的宿主细胞可以存活。目前广泛使用的有两类不同的筛选策略。第一类是基于细胞代谢，使用离开添加培养基就不能生长的突变细胞系。第二类为显性筛选，它指的是在任何细胞类型中都可使用而不必使用突变细胞系的筛选方案。这些方案通常使用抑制宿主细胞生长的药物。含有新基因的那些细胞可以表达使细胞具有药物抗性的蛋白质，从而可以在筛选中存活。这类显性筛选的实例中使用的药物有新霉素(Southern and Berg，1982)、霉酚酸(Mulligan and Berg，1980)或潮霉素(Sugden et al.，1985)。

可以使用遗传物质的直接转移来获得基因转移，所述遗传物质包括在质粒、病毒载体、病毒核酸、噬菌体核酸、噬菌体、粘粒和人工染色体中，但不限于此，或者通过细胞或载体例如阳离子脂质体中的遗传物质的转移来获得基因转移。这类方法为本领域所熟知，并且可以很容易的使之适用于本文所述的方法。转移载体可为任何可将基因送递至细胞内的核苷酸构建体(例如质粒)，或者作为送递基因的总体策略的一部分，例如作为重组逆转录病毒或重组腺病毒的一部分(Ram et al.Cancer Res.53：83-88，(1993))。用于转染的合适手段包括病毒载体、化学转染子或物理-机械方法例如电穿孔和DNA的直接扩散，这些手段描述于例如，Wolff，J.A.，et al.，Science，247，1465-1468，(1990)；和Wolff，J.A.Nature，352，815-818，(1991)。

1.病毒载体

优选的病毒载体为腺病毒、腺伴随病毒、疱疹病毒、牛痘病毒、脊髓灰质炎病毒、AIDS病毒、神经营养病毒、辛德毕斯病毒和其他RNA病毒，包括具有HIV骨架的那些病毒。还优选的是与上述病毒具有共同的使其适于用作载体的性质的任何病毒家族。优选的逆转录病毒包括鼠类马罗尼白血病病毒MMLV和表现MMLV作为载体的理想性质的逆转录病毒。逆转录病毒载体可以比其他载体病毒携带更大的基因载量，即携带转基因或标记物基因，因此是常用的载体。但是它们不能用于非增殖细胞。腺病毒载体相对稳定并易于操作、具有高滴度、可在气溶胶制剂中送递并可以转染非分裂细胞。Pox病毒载体较大并具有多个可插入基因的位点，它们对热稳定，可在室温下储存。优选的实施方案为经过基因工程改造的病毒载体，这样可以抑制宿主生物由病毒抗原引起的免疫反应。优选的这种类型的载体应携带白细胞介素8或10的编码区域。

病毒载体与大多数将基因导入细胞的化学或物理方法相比，具有更高的处理能力(导入基因的能力)。通常，病毒载体包括非结构性早期基因、结构性晚期基因、RNA聚合酶III转录物、复制和壳体化必需的反向末端重复序列以及控制病毒基因组的转录和复制的启动子。当被基因工程改造用作载体时，通常要移除病毒的一个或多个早期基因，并将一个基因或基因/启动子盒插入到病毒基因组中代替被移除的病毒DNA。这种类型的构建体可以携带最多达约8kb的外源遗传物质。被移除的早期基因的必需功能通常由经过基因工程改造而反式表达早期基因的基因产物的细胞系提供。

i.逆转录病毒载体

逆转录病毒为属于逆转录病毒科的动物病毒，包括任何类型、亚科、属或向性。Verma，I.M.，Retroviral vectors for gene transfer.InMicrobiology-1985，American Society for Microbiology，pp.229-232，Washington，(1985)总体描述了逆转录病毒载体，上述文献以援引的方式纳入本文。将逆转录病毒载体用于基因疗法的方法的实例描述于美国专利No.4,868,116和4,980,286；PCT申请WO 90/02806和WO89/07136；以及Mulligan，(Science 260：926-932(1993))等文献中，以上文献中的教导以援引的方式纳入本文。

逆转录病毒本质上是一个包装，它将核酸负载包裹在内。核酸负载携带有包装信号，这使得复制出的子代分子可以被有效地包装在包衣中。除了包装信号以外，还有许多复制和复制病毒的包装所需要的顺式作用分子。通常逆转录病毒基因组包括参与蛋白质衣壳形成的gag、pol和env基因。通常使用待转入靶细胞的外源DNA来替代gag、pol和env基因。逆转录病毒载体通常包括：用于掺入至包装包衣的包装信号，发出起动gag转录单位信号的序列，逆转录必需的元件(包括结合逆转录的tRNA引物的引物结合位点)，在DNA合成过程中引导RNA链转换的末端重复序列，作为DNA合成中第二链合成起始位点的富含嘌呤的序列5’至3’LTR，以及可使DNA状态的逆转录病毒插入到宿主基因组中的LTR末端附近的特异性序列。gag、pol和env基因的移除可以使得约8kb的外源序列被插入到病毒基因组中、被反转录以及在复制后被包装到新的逆转录病毒颗粒中。根据每种转录物的大小，上述核酸量足够送递一至多个基因。优选地，在插入物中与其他基因一起含有阳性或阴性的筛选标记物。

由于在大多数逆转录病毒载体中，复制机制和包装蛋白(gag、pol和env)已经被移除，通常通过将载体置于包装细胞系中来生产载体。包装细胞系为已被含有复制和包装机制但不含任何包装信号的逆转录病毒转染或转化的细胞系。当携带所选DNA的载体被转染到这些细胞系中时，包含目的基因的载体通过辅助细胞提供的顺式机制而被复制并包装到新的逆转录病毒颗粒中。而具有该机制的基因组因为没有必需的信号而不被包装。

ii.腺病毒载体

对于复制缺陷型腺病毒的构建，前人已有所描述(Berkner et al.，J.Virology 61：1213-1220(1987)；Massie et al.，mol.Cell.Biol.6：2872-2883(1986)；Haj-Ahmad et al.，J.Virology 51：261-21A(1986)；Davidson et al.，J.Virology 61：1226-1239(1987)；Zhang″Generationand identification of recombinant adenovirus by liposome-mediatedtransfection and PCR analysis″BioTechniques 15：868-872(1993))。使用这些病毒作为载体的优点是它们散播至其他细胞类型的程度是有限的，因为它们可以在初始感染的细胞中复制，但是它们不能形成新的感染性病毒颗粒。重组腺病毒直接在体内送递至下列组织时已表现出可获得很高的基因转移效率：气道上皮、肝细胞、血管内皮、CNS实质以及多种其他组织位点(Morsy，J.Clin.Invest.92：1580-1586(1993)；Kirshenbaum，J.Clin.Invest.92：381-387(1993)；Roessler，J.Clin.Invest.92：1085-1092(1993)；Moullier，Nature Genetics4：154-159(1993)；La Salle，Science 259：988-990(1993)；Gomez-Foix，J.Biol.Chem.267：25129-25134(1992)；Rich，Human Gene Therapy4：461-476(1993)；Zabner，Nature Genetics 6：75-83(1994)；Guzman，Circulation Research 73：1201-1207(1993)；Bout，Human GeneTherapy 5：3-10(1994)；Zabner，Cell 75：207-216(1993)；Caillaud，Eur.J.Neuroscience 5：1287-1291(1993)；和Ragot，J.Gen.Virology74：501-507(1993))。重组腺病毒与野生型或复制缺陷型腺病毒一样，通过结合特异性细胞表面受体而完成基因转导，然后病毒通过受体介导的胞吞作用而内化(Chardonnet and Dales，Virology 40：462-477(1970)；Brown and Burlingham，J.Virology 12：386-396(1973)；Svensson and Persson，J.Virology 55：442-449(1985)；Seth，et al.，J.Virol.51：650-655(1984)；Seth，et al.，mol.Cell.Biol.4：1528-1533(1984)；Varga et al.，J.Virology 65：6061-6070(1991)；Wickham et al.，Cell 73：309-319(1993))。

一种优选的病毒载体为基于移除了E1基因的腺病毒的载体，这些病毒在例如人类293细胞的细胞系中产生。在另一个优选的实施方案中，E1和E3基因都被从腺病毒基因组中移除。

另一类病毒载体是基于腺伴随病毒(AAV)。这种缺陷型细小病毒是一种优选的载体，因为它可以感染许多种细胞类型，并且对人类没有致病性。AAV型载体可以转运4至5kb的基因，并且已知野生型AAV可以稳定地插入到第19号染色体上。具有这种位点特异性整合性质的载体为优选的。这种载体的一种特别优选的实施方案是由Avigen，San Francisco，CA生产的P4.1C载体，它可包含单纯疱疹病毒胸苷激酶基因、HSV-tk和/或标记物基因，例如编码绿色荧光蛋白GFP的基因。

在病毒和逆转录病毒中插入的基因经常含有启动子和/或增强子以辅助对所需基因产物的表达的控制。启动子通常为位于与转录起始位点相对固定的位置时可以发挥功能的一个或多个DNA序列。“启动子”包含与RNA聚合酶发生基本相互作用所需的核心元件和转录因子，还可包含上游元件和应答元件。

2.病毒启动子和增强子

控制哺乳动物宿主细胞中的载体转录的优选启动子可由各种来源获得，例如，诸如下列病毒的基因组：多瘤病毒、猿猴病毒40(SV40)、腺病毒、逆转录病毒、乙型肝炎病毒，最优选巨细胞病毒；或者来源于异源哺乳动物启动子例如β肌动蛋白启动子。SV40病毒的早期和晚期启动子可以方便地以同样包括SV40病毒复制起始位点的SV40限制性片段的形式获得(Fiers et al.，Nature，273：113(1978))。人类巨细胞病毒的即时早期启动子可以方便地以HindIII E限制性片段的形式获得(Greenway，PJ.et al.，Gene 18：355-360(1982))。当然，来自宿主细胞或相关物种的启动子也在此有用。

“增强子”通常指的是为位于与转录起始位点相对不固定的位置发挥功能的DNA序列，它可以在转录单位的5’(Laimins，L.et al.，Proc.Natl.Acad.Sci.78：993(1981))或3’(Lusky，M.L.，et al.，Mol.Cell bio.3：1108(1983))。此外，增强子除了可以在编码序列本身之中(Osborne，T.F.，et al.，mol.Cell bio.4：1293(1984))，也可以在内含子中(Banerji，J.L.et al.，Cell 33：729(1983))。它们的长度通常为10bp至300bp之间，并且以顺式方式发挥作用。增强子的功能是增加邻近的启动子的转录。增强子还经常含有介导转录的调节的应答元件。启动子也可含有介导转录的调节的应答元件。增强子经常对基因表达的调节有决定性作用。虽然目前许多来自哺乳动物基因的增强子的序列是已知的(珠蛋白、弹性蛋白酶、清蛋白、甲胎蛋白和胰岛素)，但是通常还是使用来自真核细胞病毒的增强子。优选的实例为：在复制起点下游(late side)的SV40增强子(bp 100-270)、巨细胞病毒早期启动子增强子、在复制起点下游的多瘤病毒增强子和腺病毒增强子。

启动子和/或增强子可以被能触发它们功能的光或特异性化学事件特异性地激活。可以用例如四环素和地塞米松等试剂来调节系统。也有一些方法通过暴露于例如γ辐照的辐照方法或烷基化化疗药物来增强病毒载体的基因表达。

优选地，启动子和/或增强子区域在所有真核细胞类型中都是有活性的。这种类型的一种优选的启动子为CMV启动子(650个碱基)。其他优选的启动子为SV40启动子、巨细胞病毒(全长启动子)和逆转录病毒载体LTF。

已显示所有的特异性调节元件都可被克隆和用于构建在特定细胞类型例如黑素瘤细胞中选择性表达的表达载体。神经胶质纤维酸性蛋白(GFAP)启动子已被用于在神经胶质来源的细胞中选择性表达基因。

用于真核宿主细胞(酵母、真菌、昆虫、植物、动物、人类或有核细胞)中的表达载体还可包含可以影响mRNA表达的转录终止所必需的序列。这些区域在编码组织因子蛋白的mRNA的非翻译部分中以多腺苷酸化区段的形式被转录。3’非翻译区还包括转录终止位点。优选地，转录单位也包括多腺苷酸化区域。这一区域的一个优点是它增加了被转录的单位像mRNA一样被加工和转运的可能性。多腺苷酸化信号在表达构建体中的鉴定和用途已经广为人知。优选地，在转基因构建体中使用同源的多腺苷酸化信号。在转录单位的一个优选实施方案中，多腺苷酸化区域来自SV40早期多腺苷酸化信号，由大约400个碱基组成。还优选地，转录单位单独包括其他标准序列或包括其他标准序列和上述序列，改进构建体的表达或稳定性。

3.标记物

在一些实施方案中，标记物可为筛选标记物。用于哺乳动物细胞的合适筛选标记物的实例为二氢叶酸还原酶(DHFR)、胸苷激酶、新霉素、新霉素类似物G418、潮霉素和嘌呤霉素。当这类筛选标记物被成功地转移至哺乳动物宿主细胞中时，如果将宿主细胞置于筛选压力下，则被转化的哺乳动物宿主细胞可以存活。目前广泛使用的有两类不同的筛选策略。第一类是基于细胞代谢，使用离开添加培养基就不能生长的突变细胞系。两个实例为：CHO DHFR^-细胞和小鼠LTK^-细胞。这些细胞在不添加如胸苷或次黄嘌呤营养物的情况下就不能生长。由于这些细胞缺乏完整的核苷酸合成途径中必需的某些基因，因此除非在添加培养基中提供那种没有的核苷酸，否则细胞就不能存活。另一种补充培养基的方式是将完整的DHFR或TK基因导入缺乏相应基因的细胞中，由此改变它们的生长需求。未被DHFR或TK基因转化的个体细胞将不能在非添加培养基上生长。

第二类为显性筛选，它指的是在任何细胞类型中都可使用而不必使用突变细胞系的筛选方案。这些方案通常使用抑制宿主细胞生长的药物。那些细胞可以表达使细胞具有药物抗性的蛋白质，从而可以在筛选中存活。这类显性筛选的实例中使用的药物有新霉素(Southern P.and Berg，P.，J.Molec.Appl.Genet.1：327(1982))、霉酚酸(Mulligan，R.C.and Berg，P.Science 209：1422(1980))或潮霉素(Sugden，B.et al.，mol.Cell.Biol.5：410-413(1985))。这三个实例使用了真核控制下的细菌基因来分别赋予细胞对于合适的药物G418或新霉素(遗传霉素)、xgpt(霉酚酸)或潮霉素的抗性。其他的还有新霉素类似物G418和嘌呤霉素。

E.生物传感器核糖开关

还公开了生物传感器核糖开关。生物传感器核糖开关是经过基因工程改造的核糖开关，它们在存在它们的同种触发分子时产生可检出的信号。可用的生物传感器核糖开关可以在触发分子达到或超过阈值水平时被触发。生物传感器核糖开关可被设计为体内应用或体外应用。例如，与编码作为信号的蛋白质或参与产生信号的蛋白质的报告RNA可操作地连接的环二GMP生物传感器核糖开关可通过基因工程改造细胞或生物，使其含有编码该环二GMP核糖开关/报告物RNA的核酸构建体从而在体内应用。用于体外的生物传感器核糖开关的一个实例是包括构象依赖性标签的核糖开关，由该标签产生的信号随核糖开关的激活状态而变化。优选地，这种生物传感器核糖开关使用天然存在的核糖开关的适体结构域或由天然存在的核糖开关衍生的适体结构域，例如环二GMP。

F.报告蛋白和报告肽

为评估核糖开关或生物传感器核糖开关的激活，可以使用报告蛋白或报告肽。报告蛋白或报告肽可以由通过核糖开关调节其表达的RNA编码。实施例中描述了一些特异性报告蛋白的使用。报告蛋白和报告肽的使用已为人所熟知，并可以容易地适于与核糖开关一起使用。报告蛋白可为任意可检出的或产生可检出信号的蛋白质或肽。优选地，该蛋白质或肽的存在可以用标准技术(例如放射免疫测定、放射性标记、免疫测定、酶活性测定、吸附、荧光、发光和蛋白质印迹)检测。更优选地，即使在报告蛋白的水平比较低的情况下，仍然可以使用标准技术对其水平定量。可用的报告蛋白包括萤光素酶、绿色荧光蛋白以及它们的衍生物，例如北美萤火虫(Photinus pyralis)的萤火虫萤光素酶(FL)和海参(Renilla reniformis)的海参萤光素酶(RL)。

G.构象依赖性标签

构象依赖性标签指的是具有下述性质的所有标签：在标签所连接的分子或化合物(例如核糖开关)的形式或构象发生改变的基础上，该标签可以产生荧光强度或波长的变化。在使用探针和引物的情况下，使用的构象依赖性标签的实例包括：分子信标(molecularbeacon)、Amplifluors、FRET探针、可切割的FRET探针、TaqMan探针、蝎形引物(scorpion primer)、荧光三聚体寡聚物(fluorescenttriplex oligos)包括但不限于三聚体分子信标或三聚体FRET探针、荧光水溶性缀合聚合物、PNA探针和QPNA探针。这类标签——具体而言它们的功能原理——可适于与核糖开关一起使用。一些类型的构象依赖性标签综述于Schweitzer and Kingsmore，Curr.Opin.Biotech.12：21-27(2001)中。

茎淬灭标签是构象依赖性标签的一种形式，它是位于核酸上的荧光标签，这样当茎结构形成时淬灭部分会接近荧光标签以使得标签发出的荧光被淬灭。当茎结构被破坏时(例如当含有标签的核糖开关被激活时)，淬灭部分就不再接近荧光标签，荧光就会增强。这种效应的实例可见于分子信标、荧光三聚体寡聚物、三聚体分子信标、三聚体FRET探针和QPNA探针中，它们的操作原理也可适于与核糖开关一起使用。

茎激活标签是构象依赖性标签的一种形式，它是通过茎结构的形成可以增强或改变荧光的标签或标签对。茎激活标签可包括受体荧光标签和供体部分，当受体和供体相互接近时(当包括标签的核酸链形成茎结构时)，荧光共振能量由供体向受体的转移会使受体发荧光。茎激活标签通常为位于核酸分子(例如核糖开关)上的标签对，这样当核酸分子中形成茎结构时受体和供体就会相互接近。如果茎激活标签的供体部分本身就是荧光标签，那么当它不与受体接近时(也就是未形成茎结构时)它就会以荧光的形式释放能量(通常这种荧光的波长与受体荧光的波长不同)。当茎结构形成时，总体的效果是供体荧光减少和受体荧光增加。FRET探针为使用茎激活标签的一个实例，它的操作原理也可适于与核糖开关一起使用。

H.检测标签

为帮助对核糖开关的激活、灭活或阻断进行检测和量化，或对核糖开关的激活、灭活或阻断后产生的核酸或蛋白质的表达进行检测和量化，可以在检测探针或者检测分子中导入检测标签，或者在表达的核酸或蛋白质中直接导入检测标签。本文中所述的检测标签为可以与核酸或蛋白质直接或间接地相连接、并由此直接或间接地产生可以测量的可检测信号的任何分子。许多这种标签均为本领域技术人员所已知。可用于所公开方法的合适的检测标签的实例为放射性同位素、荧光分子、磷光分子、酶、抗体和配体。

合适的荧光标签的实例包括异硫氰酸荧光素(FITC)、5，6-羧甲基荧光素、德克萨斯红(Texas red)、硝基苯-2-氧杂-1，3-二唑-4-基(NBD)、香豆素、丹酰氯、罗丹明、氨基甲基香豆素(AMCA)、曙红、藻红、

Cascade

Oregon芘、丽丝胺(lissamine)、加氧杂蒽(xanthenes)、吖啶、噁嗪、藻红蛋白、镧系金属离子的大环螯合物例如量子染料^TM、荧光能量转移染料例如噻唑橙乙啡啶异源二聚体、以及花青染料Cy3、Cy3.5、Cy5、Cy5.5和Cy7。其他特异性荧光标签的实例包括3-羟基芘5，8，10-三磺酸、5-羟色胺(5-HT)、酸性品红、茜素络合酮、茜素红、别藻蓝蛋白、氨基香豆素、蒽基硬脂酸、阿斯屈拉崇(Astrazon)亮红4G、阿斯屈拉崇橙R、阿斯屈拉崇红6B、阿斯屈拉崇黄7GLL、阿的平(Atabrine)、金胺(Auramine)、Aurophosphine、Aurophosphine G、BAO 9(双氨基苯基噁二唑)、BCECF、硫酸小檗碱、双苯酰胺、布兰科福尔(Blancophor)FFG溶液、布兰科福尔SV、Bodipy Fl、亮磺基黄素FF(Brilliant Sulphoflavin FF)、钙黄绿素蓝(Calcien Blue)、钙绿(Calcium Green)、卡尔科弗卢尔(Calcofluor)RW溶液、卡尔科弗卢尔白(Calcofluor White)、尔科弗卢尔白ABT溶液、尔科弗卢尔白标准溶液、Carbostyryl、Cascade Yellow、儿茶酚胺、奎纳克林(Chinacrine)、科里膦O、香豆素-鬼笔环肽、CY3.18、CY5.18、CY7、Dans(1-二甲基氨基-萘-5-磺酸)、Dansa(二氨基萘磺酸)、丹酰NH-CH3，二氨基苯基噁二唑(DAO)、二甲基氨基-5-磺酸、二吡咯亚甲基二氟化硼、联苯亮黄素7GFF、多巴胺、藻红ITC、吖啶橙(Euchrysin)、FIF(甲醛诱导荧光)、Flazo Orange、Fluo 3、荧光胺、Fura-2、Genacryl亮红B、Genacryl亮黄10GF、Genacryl粉红3G、Genacryl黄5GF、Gloxalic Acid、粒状蓝(Granular Blue)、血卟啉(Haematoporphyrin)、Indo-1、Intrawhite Cf液体、雷可福(Leucophor)PAF、雷可福SF、雷可福WS、丽丝胺罗丹明B200(RD200)、萤黄CH(Lucifer Yellow CH)、萤黄VS、苏丹红(MagdalaRed)、Marina Blue、麦西隆(Maxilon)亮黄素10GFF、麦西隆亮黄素8GFF、MPS(Methyl Green Pyronine Stilbene，甲基绿焦宁均二苯乙烯)、光神霉素、NBD胺、硝基苯并噁二唑(Nitrobenzoxadidole)、去甲肾上腺素、核坚牢红(Nuclear Fast Red)、核黄(Nuclear Yellow)、尼龙山(Nylosan)亮黄素E8G、噁二唑、Pacific蓝、碱性副品红(Feulgen)、Phorwite AR溶液、Phorwite BKL、Phorwite Rev、Phorwite RPA、膦3R、酞菁(Phthalocyanine)、藻红蛋白R、Polyazaindacene Pontochrome Blue Black、卟啉、Primuline、普施安黄(Procion Yellow)、焦宁(Pyronine)、焦宁B、Pyrozal亮黄素7GF、芥奎吖因(Quinacrine Mustard)、罗丹明123、罗丹明5GLD、罗丹明6G、罗丹明B、罗丹明B 200、罗丹明B Extra、罗丹明BB、罗丹明BG、罗丹明WT、5-羟色胺、塞夫隆(Sevron)亮红2B、塞夫隆亮红4G、塞夫隆亮红B、塞夫隆橙、塞夫隆黄L、SITS(Primuline)、SITS(均二苯乙烯异硫磺酸，StilbeneIsothiosulphonic acid)、均二苯乙烯、Snarf 1、磺基罗丹明B Can C、磺基罗丹明G Extra、四环素、噻嗪红R、硫黄素S、硫黄素TCN、硫黄素5、Thiolyte、Thiozol Orange、Tinopol CBS、纯蓝(True Blue)、Ultralite、荧光素钠(Uranine)B、优微添(Uvitex)SFC、二甲苯橙(Xylene Orange)和XRITC。

可用的荧光标签为荧光素(5-羧基荧光素-N-羟基琥珀酰亚胺酯)、罗丹明(5，6-四甲基罗丹明)和花青染料Cy3、Cy3.5、Cy5、Cy5.5和Cy7。这些荧光染料的最大吸收和发射波长分别为：FITC(490nm；520nm)、Cy3(554nm；568nm)、Cy3.5(581nm；588nm)、Cy5(652nm；672nm)、Cy5.5(682nm；703nm)、Cy7(755nm；778nm)，这使得它们可以同时被检测。荧光素染料的其他实例包括：6-羧基荧光素(6-FAM)、2’，4’，1，4，-四氯荧光素(TET)、2’，4’，5’，7’，l，4-六氯荧光素(HEX)、2’，7’-二甲氧基-4’，5’-二氯-6-羧基罗丹明(JOE)、2’-氯-5’-氟-7’，8’-稠苯-l，4-二氯-6-羧基荧光素(NED)和2’-氯-7’-苯基-l，4-二氯-6-羧基荧光素(VIC)。荧光标签可由各种来源商购获得，包括Amersham Pharmacia Biotech，Piscataway，NJ；MolecularProbes，Eugene，OR；和Research Organics，Cleveland，Ohio。

所关注的其他标签包括那些仅当它们所连接的探针与靶分子特异性结合时产生信号的标签，其中这类标签包括Tyagi&Kramer，Nature Biotechnology(1996)14：303和EP 0 070 685 B1中所述的“分子信标”。所关注的其他标签包括美国专利No.5,563,037、国际申请WO 97/17471和WO 97/17076中所述的那些标签。

被标记的核苷酸是检测标签的一种可用形式，可以在合成过程中直接导入被表达的核酸中。可以直接导入核酸中的检测标签的实例包括核苷酸类似物例如BrdUrd(5-溴脱氧尿苷，Hoy and Schimke，Mutation Research 290：217-230(1993))、氨基烯丙基脱氧尿苷(Henegariu et al：，Nature Biotechnology 18：345-348(2000))、5-甲基胞嘧啶(Sano et al.，Biochim.Biophys.Acta 951：157-165(1988))、溴尿核苷(Wansick et al，J.Cell Biology 122：283-293(1993))和经生物素修饰的核苷酸(Langer et al，Proc.Natl.Acad.Sci.USA 78：6633(1981))或经过例如地高辛抗原(digoxygenin)的合适的半抗原修饰的核苷酸(Kerkhof，Anal.Biochem.205：359-364(1992))。合适的荧光标记的核苷酸有：异硫氰酸荧光素-dUTP、花青-3-dUTP和花青-5-dUTP(Yu etal，Nucleic Acids Res.，22：3226-3232(1994))。对于DNA而言优选的核苷酸类似物检测标签为BrdUrd(溴脱氧尿苷、BrdUrd、BrdU、BUdR，Sigma-Aldrich Co)。其他用于将检测标签导入DNA的可用的核苷酸类似物为AA-dUTP(氨基烯丙基脱氧尿苷三磷酸，Sigma-Aldrich Co.)和5-甲基-dCTP(Roche Molecular Biochemicals)。一种用于将检测标签导入RNA的可用的核苷酸类似物为生物素-16-UTP(生物素-16-尿苷-5’-三磷酸，Roche Molecular Biochemicals)。可将荧光素Cy3和Cy5连接至dUTP上用于直接标记。Cy3.5和Cy7可以以抗生物素蛋白或抗地高辛抗原缀合物的形式用于带有生物素或地高辛抗原标签的探针的二级检测。

被导入核酸的例如生物素的检测标签，随后可以使用本领域公知的灵敏方法进行检测。例如，使用链亲和素-碱性磷酸酶缀合物(Tropix，Inc.)可以检测生物素，这种缀合物可以与生物素结合并随后通过适当底物的化学发光进行检测(例如，化学发光底物CSPD：3-(4-甲氧基螺-[l，2，-二环氧丙烷-3-2’-(5’-氯)三环[3.3.l.l^3，7]癸烷]-4-基)苯基磷酸二钠(disodium，3-(4-methoxyspiro-[l，2，-dioxetane-3-2’-(5’-chloro)tricyclo[3.3.l.l^3，7]decane]-4-yl)phenyl phosphate)；Tropix，Inc.)。标签也可以是可检测的酶，例如碱性磷酸酶、大豆过氧化物酶、辣根过氧化物酶和聚合酶，检测例如使用化学信号放大法或使用能发光的酶的底物(例如化学发光的1，2-二环氧丙烷底物)或能产生荧光信号的酶的底物。

结合了两个或多个上述检测标签的分子也可被认为是检测标签。任何已知的检测标签都可与本发明公开的探针、标签、分子和方法一起使用，以便标记和检测本发明公开方法所产生的激活的或灭活的核糖开关或核酸或蛋白质。用于检测和测量检测标签产生的信号的方法也是本领域技术人员已知的。例如，可以通过闪烁计数或直接显示法来检测放射性同位素；可用荧光分光光度计来检测荧光分子；可用分光光度计或直接照相显示的方法检测磷光分子；可通过检测或可视化酶促反应的产物来检测酶。可通过检测与抗体偶联的二级检测标签来检测抗体。本文所使用的检测分子为偶联了一个或多个检测标签的与待测化合物或组合物相互作用的分子。

I.序列相似性

应当理解的是，本文所使用的术语同源性和同一性的含义是相同的，都是指相似性。因此，例如，如果在两个序列(例如非天然序列)之间使用同源性这一词语，应当理解这并不一定是指着两个序列之间的进化关系，而是着眼于它们的核酸序列之间的相似性或关联性。为了测量序列的相似性，确定两个进化上相关的分子之间相似性的很多方法都可以常规地应用于两个或多个核酸或蛋白质，而无需考虑它们在进化上是否相关。

总体而言，应当理解的是，为了定义本文所公开的核糖开关、适体、表达平台、基因和蛋白质的任何已知变体和衍生物或可能出现的种类，一种方法是通过定义变体和衍生物与特定已知序列的同源性。本文公开的具体序列的这种同一性在本文其他部分也有所讨论。总体而言，本文所公开的核糖开关、适体、表达平台、基因和蛋白质的变体与指定序列或天然序列通常有至少约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的同源性。本领域技术人员很容易明白如何测定两种蛋白质或核酸(例如基因)之间的同源性。例如，可以在两序列比对并使同源性达到最高水平后计算同源性。

计算同源性的另一种方法可以通过公开的算法进行。可使用下列算法进行用于比较的序列优化比对：Smith and Waterman Adv.Appl.Math.2：482(1981)中所述的局部同源性算法；Needleman andWunsch，J.MoL Biol.48：443(1970)中所述的同源性比对算法；Pearson and Lipman，Proc.Natl.Acad.Sci.U.S.A.85：2444(1988)中所述的相似性检索方法；或者这些算法的计算机实现形式(WisconsinGenetics软件包中的GAP、BESTFIT、FASTA和TFASTA，GeneticsComputer Group，575 Science Dr.，Madison，WI)；或者通过审查的方式进行。

通过例如Zuker，M.Science 244：48-52，1989；Jaeger et al.Proc.Natl.Acad.Sci.USA 86：7706-7710，1989；Jaeger et al.MethodsEnzymol.183：281-306，1989中公开的算法，可以获得核酸的相同类型的同源性，上述文献中至少与核酸比对有关的素材以援引的方式纳入本文。应当理解的是，通常可以使用任何方法，而在某些情况下这些不同的方法所得到的结果可能不同，但是本领域技术人员能够理解，如果使用上述方法中的至少一种发现了同一性，则该序列可被称为具有指定的同一性。

例如，如本文所使用的，所述的具有与另一序列相比的特定百分比同源性的序列，是指具有由上述任意一种或多种计算方法所计算出的所述同源性的序列。例如，如果使用Zuker计算方法，第一序列被计算为与第二序列具有80％的同源性，即使按照其他任何计算方法都计算出该第一序列与第二序列不具有80％的同源性，那么，如本文所定义的，第一序列与第二序列仍具有80％的同源性。另一个实例，如果使用Zuker计算方法和Pearson和Lipman计算方法，第一序列被计算为与第二序列具有80％的同源性，即使通过Smith和Waterman计算方法、Needleman和Wunsch计算方法、Jaeger计算方法或任意其他计算方法计算，第一序列与第二序列不具有80％的同源性，那么，如本文所定义的，第一序列与第二序列仍具有80％的同源性。再一个实例，如果使用每一种计算方法，第一序列都被计算为与第二序列具有80％的同源性(尽管实际上不同的计算方法常得到不同的计算的同源性百分比)，那么如本文所定义的，第一序列与第二序列具有80％的同源性。

J.杂交和选择性杂交

术语杂交通常意为至少两种核酸分子例如引物或探针与核糖开关或基因间的序列驱动的相互作用。序列驱动的相互作用意为：以核苷酸特异性的方式发生于两个核苷酸或核苷酸类似物或核苷酸衍生物间的相互作用。例如G与C相互作用或者A与T相互作用即为序列驱动的相互作用。通常序列驱动的相互作用发生于核苷酸的沃森-克里克面或Hoogsteen面。两种核酸的杂交受到本领域技术人员所知的许多条件和参数的影响。例如盐浓度、pH和反应温度均会影响两种核酸分子是否会杂交。

两种核酸分子间的选择性杂交的参数为本领域技术人员所熟知。例如，在一些实施方案中选择性杂交条件可被定义为严格杂交的条件。例如，杂交的严格性是通过杂交和/或洗涤步骤的温度和盐浓度共同控制的。例如实现选择性杂交的杂交条件可包括在比Tm(解链温度，在该温度下一半的分子与其杂交配对的另一部分解离)低大约12-25℃的温度下，在高离子强度溶液(6×SSC或6×SSPE)中杂交，然后在所选的温度和盐浓度的组合的条件下洗涤，此时洗涤温度为比Tm低大约5℃至20℃。在预实验中，可根据经验容易地确定温度和盐浓度条件，在该实验中使固定在滤膜上的参照DNA的样品与带标记的目的核酸杂交，然后在不同严格度的条件下洗涤。对于DNA-RNA杂交和RNA-RNA杂交而言杂交温度通常较高一些。可使用如上所述的或本领域已知的(Sambrook et al.，Molecular Cloning：ALaboratory Manual，2nd Ed.，Cold Spring Harbor Laboratory，ColdSpring Harbor，New York，1989；Kunkel et al.Methods Enzymol.1987：154：367，1987，上述文献中至少与核酸杂交相关的素材通过援引的方式纳入本文)条件以达到严格度。优选的DNA:DNA杂交的严格条件可以是在约68℃(水溶液中)，在6×SSC或6×SSPE中杂交，之后在68℃洗涤。如果需要，当所需的互补程度降低时，杂交和洗涤的严格性可作相应减小，并且还根据寻找可变性的任何区域中的G-C或A-T的丰富程度而定。同样，如果需要，当所需的同源性增大时，杂交和洗涤的严格性可作相应增加，并且还根据需要高同源性的任何区域中的G-C或A-T的丰富程度而定，所有这些均为本领域已知。

另一种定义选择性杂交的方法是通过着眼于一种核酸与另一核酸结合的量(百分比)。例如，在一些实施方案中选择性杂交的条件可以为至少约60％、65％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％的限量核酸与非限量核酸结合时的条件。通常非限量核酸要过量例如10或100或1000倍。这类测定可在限量核酸和非限量核酸均比它们的k_d低例如10倍或100倍或1000倍时的条件下进行，或者只是一种核酸分子为比它的k_d低例如10倍或100倍或1000倍时的条件下进行，或两种核酸分子之一或两者均在k_d之上时的条件下进行。

另一种定义选择性杂交的方法是通过着眼于这样一种核酸的百分比，所述核酸是在需要杂交以促进所需的酶操作的条件下得到酶操作的核酸。例如，在一些实施方案中选择性杂交条件可以是至少约60％、65％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％的核酸在促进酶操作的条件下进行酶操作时的条件，例如，如果酶操作是DNA延伸，那么选择性杂交条件可以是至少约60％、65％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、100％的核酸分子被延伸时的条件。优选的条件还包括厂商所建议的或本领域所指出的适于酶进行操作的条件。

正如同源性一样，应当理解本文公开的用于确定两种核酸分子间的杂交水平的方法有许多种。应当理解这些方法和条件可提供两种核酸分子间的不同杂交百分比，但是除非另外指明，否则满足任何方法的参数都是足够的。例如，如果需要80％杂交并且只要在这些方法的任意一种中所要求的参数内发生杂交，就认为它在本文得到了公开。

应当理解，本领域技术人员知道，如果组合物或方法满足用于单独或联合确定杂交的这些标准的任意一条，那么它就是本文所公开的组合物或方法。

K.核酸

本文公开了基于核酸的多种分子，包括例如核糖开关、适体以及编码核糖开关和适体的核酸。所公开的核酸由例如核苷酸、核苷酸类似物或核苷酸替代物构成。本文讨论了这些分子及其他分子的非穷尽性实例。应当理解，例如当载体在细胞中表达时，表达的mRNA通常由A、C、G和U组成。同样，应当理解，如果核酸分子通过例如外源性送递被导入细胞或细胞环境中，那么核酸分子由核苷酸类似物构成是有利的，这样可减少核酸分子在细胞环境中的降解。

只要保留了它们相关的功能，核糖开关、适体、表达平台以及任何其他寡核苷酸和核酸都可以由经修饰的核苷酸(核苷酸类似物)构成或含有经修饰的核苷酸(核苷酸类似物)。很多经修饰的核苷酸是已知的，并可被用于寡核苷酸和核酸之中。核苷酸类似物是含有对碱基、糖或磷酸部分的一些类型的修饰的核苷酸。对碱基部分的修饰可以包括对A、C、G和T/U的天然性或合成性修饰，以及使用不同的嘌呤或嘧啶碱，例如尿嘧啶-5-基、次黄嘌呤-9-基(I)和2-氨基腺嘌呤-9-基。经修饰的碱基包括但不限于：5-甲基胞嘧啶(5-me-C)；5-羟甲基胞嘧啶；黄嘌呤；次黄嘌呤；2-氨基腺嘌呤；腺嘌呤和鸟嘌呤的6-甲基或其他烷基衍生物；腺嘌呤和鸟嘌呤的2-丙基或其他烷基衍生物；2-硫尿嘧啶；2-硫胸腺嘧啶和2-硫胞嘧啶；5-卤素尿嘧啶和5-卤素胞嘧啶；5-丙炔基尿嘧啶和5-丙炔基胞嘧啶；6-偶氮基尿嘧啶、6-偶氮基胞嘧啶和6-偶氮基胸腺嘧啶；5-尿嘧啶(假尿嘧啶)；4-硫尿嘧啶；腺嘌呤和鸟嘌呤的8-卤素、8-氨基、8-硫代、8-硫代烷基、8-羟基以及其他8-取代物；尿嘧啶和胞嘧啶的5-卤素特别是5-溴、5-三氟甲基和其他的5-取代物；7-甲基鸟嘌呤和7-甲基腺嘌呤；8-氮杂鸟嘌呤和8-氮杂腺嘌呤；7-脱氮鸟嘌呤(7-deazaguanine)和7-脱氮腺嘌呤和3-脱氮鸟嘌呤和3-脱氮腺嘌呤。其他的碱基修饰物可见于例如美国专利No.3,687,808、Englisch et al.，Angewandte Chemie，International Edition，1991，30，613、Sanghvi，Y.S.，Chapter 15，Antisense Research and Applications，第289-302页、Crooke，S.T.and Lebleu，B.ed.，CRC Press，1993。某些核苷酸类似物例如：5-取代的嘧啶、6-氮杂嘧啶和N-2、N-6和O-6取代的嘌呤，包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。5-甲基胞嘧啶可以增加双链体形成的稳定性。其他经修饰的碱基是那些有通用碱基功能的碱基。通用碱基包括3-硝基吡咯和5-硝基吲哚。通用碱基可取代正常的碱基，但在碱基配对上没有偏好性。也就是说通用碱基可以与其他任何碱基进行碱基配对。碱基修饰经常可与例如糖修饰结合使用，例如2’-O-甲氧基乙基，以获得独特的属性例如提高的双链体稳定性。有多个美国专利具体描述了很多碱基修饰，例如4,845,205、5,130,302、5,134,066、5,175,273、5,367,066、5,432,272、5,457,187、5,459,255、5,484,908、5,502,177、5,525,711、5,552,540、5,587,469、5,594,121、5,596,091、5,614,617和5,681,941。以上各专利文献的每一篇的全部内容都以援引的方式纳入本文，并且特别是这些文献中关于碱基修饰及其合成、使用和将其导入寡核苷酸和核酸的描述也以援引的方式纳入本文。

核苷酸类似物还可包括糖部分的修饰。对糖部分的修饰可包括核糖和脱氧核糖的天然性修饰及合成性修饰。糖修饰包括但不限于在2’位置的下列修饰：OH；F；O-烷基、S-烷基或N-烷基；O-烯基、S-烯基或N-烯基；O-炔基、S-炔基或N-炔基；或O-烷基-O-烷基，其中所述烷基、烯基和炔基可以是取代或未取代的C1至C10烷基或C2至C10烯基和炔基。2’糖修饰还包括但不限于-O[(CH₂)_nO]_mCH₃、-O(CH₂)_nOCH₃、-O(CH₂)_nNH₂、-O(CH₂)_nCH₃、-O(CH₂)_n-ONH₂和-O(CH₂)_nON[(CH₂)_nCH₃)]₂，其中n和m在1至大约10之间。

在2’位置的其他修饰包括但不限于：C1至C10低级烷基、取代的低级烷基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH₃、OCN、Cl、Br、CN、CF₃、OCF₃、SOCH₃、SO₂CH₃、ONO₂、NO₂、N₃、NH₂、杂环烷基、杂环烷芳基、氨基烷基氨基、聚烷基氨基、取代的甲硅烷基、RNA切割基团、报告基团、插入剂、可提高寡核苷酸药物动力学性质的基团或可提高寡核苷酸药效学性质的基团和其他具有类似性质的基团。还可以在糖的其他位置进行类似的修饰，特别是在3’端核苷酸上或2’-5’连接的寡核苷酸中的糖的3’位置，和在5’端核苷酸的5’位置。经修饰的糖可含有那些在环氧桥位置用例如CH₂和S进行的修饰。核苷酸糖类似物还可具有糖模拟物，例如用环丁基部分代替五碳呋喃糖。有许多美国专利都教导了这类经修饰的糖结构的制备，例如4,981,957、5,118,800、5,319,080、5,359,044、5,393,878、5,446,137、5,466,786、5,514,785、5,519,134、5,567,811、5,576,427、5,591,722、5,597,909、5,610,300、5,627,053、5,639,873、5,646,265、5,658,873、5,670,633和5,700,920，以上各专利文献的每一篇的全部内容都以援引的方式纳入本文，并且特别是这些文献中关于经修饰的糖结构及其合成、使用和将其导入核苷酸、寡核苷酸和核酸的描述也以援引的方式纳入本文。

核苷酸类似物可以在磷酸部分加以修饰。经修饰的磷酸部分包括但不限于可经过修饰而使得在两个核苷酸之间的连接部分含有下列结构的磷酸部分，所述结构包括：硫代磷酸酯；手性硫代磷酸酯；二硫代磷酸酯；磷酸三酯；氨烷基磷酸三酯；磷酸甲酯和其他磷酸烷基酯，包括磷酸3’-烯基酯和手性磷酸酯；次膦酸酯(phosphinate)；氨基磷酸酯，包括3’-氨基氨基磷酸酯(3’-amino phosphoramidate)和氨烷基氨基磷酸酯(aminoalkylphosphoramidate)、硫代氨基磷酸酯(thionophosphoramidates)、硫代烷基磷酸酯(thionoalkylphosphonates)、硫代烷基磷酸三酯(thionoalkylphosphotriesters)和硼烷磷酸酯(boranophosphates)。应当理解的是，在两个核苷酸之间的这些磷酸连接或经修饰的磷酸连接可以通过3’-5’连接或2’-5’连接，连接可以包括极性的倒转，例如3’-5’至5’-3’或者2’-5’至5’-2’。还包括各种盐形式、混合盐形式和游离酸形式。许多美国专利教导了如何制备和使用含有经修饰磷酸的核苷酸，包括但不限于：3,687,808、4,469,863、4,476,301、5,023,243、5,177,196、5,188,897、5,264,423、5,276,019、5,278,302、5,286,717、5,321,131、5,399,676、5,405,939、5,453,496、5,455,233、5,466,677、5,476,925、5,519,126、5,536,821、5,541,306、5,550,111、5,563,253、5,571,799、5,587,361和5,625,050，以上各专利文献的每一篇的全部内容都以援引的方式纳入本文，并且特别是这些文献中关于经修饰的磷酸及其合成、使用和将其导入核苷酸、寡核苷酸和核酸的描述也以援引的方式纳入本文。

应当理解的是，核苷酸类似物仅需要包括一种修饰，但是也可以在一个部分或几个不同部分中包括多种修饰。

核苷酸替代物为与核苷酸具有类似功能特性但不含有磷酸部分的分子，例如肽核酸(PNA)。核苷酸替代物分子可以以Watson-Crick方式或Hoogsteen方式识别互补性核酸并与互补性核酸杂交(碱基配对)，但是它们通过非磷酸的部分连接起来。核苷酸替代物在与合适的靶核酸相互作用时能够形成双螺旋型结构。

核苷酸替代物为磷酸部分和/或糖部分被替换的核苷酸或核苷酸类似物。核苷酸替代物不包括标准的磷原子。磷酸的替代物可为例如：短链烷基或环烷基核苷间连接物、混合杂原子和烷基或环烷基核苷间连接物、或一个或多个短链杂原子或杂环核苷间连接物。这些连接物可包括具有下列结构的连接物：吗啉代连接物(形成核苷的糖部分的一部分)；硅氧烷骨架；硫化物、亚砜和砜骨架；甲酰基(formacetyl)和硫甲酰基(thioformacetyl)骨架；亚甲基甲酰基和硫甲酰基骨架；含烯烃骨架；氨基磺酸盐骨架；亚甲基亚氨基和亚甲基肼基骨架；磺酸和磺胺骨架；酰胺骨架；以及其他带有混合的N、O、S和CH2组成部分的连接物。许多美国专利公开了如何制备和使用这些种类的磷酸替换物，包括但不限于：5,034,506、5,166,315、5,185,444、5,214,134、5,216,141、5,235,033、5,264,562、5,264,564、5,405,938、5,434,257、5,466,677、5,470,967、5,489,677、5,541,307、5,561,225、5,596,086、5,602,240、5,610,289、5,602,240、5,608,046、5,610,289、5,618,704、5,623,070、5,663,312、5,633,360、5,677,437和5,677,439，以上各专利文献的每一篇的全部内容都以援引的方式纳入本文，并且特别是这些文献中关于磷酸替换物及其合成、使用和将其导入核苷酸、寡核苷酸和核酸的描述也以援引的方式纳入本文。

应当理解的是，在核苷酸替代物中核苷酸的糖部分和磷酸部分都可以被例如酰胺型连接物(氨基乙基甘氨酸)(PNA)所替换。美国专利5,539,082、5,714,331和5,719,262教导了如何制备和使用PNA分子，上述文献的每一篇都以援引的方式纳入本文。(还可参见Nielsen et al.，Science 254：1497-1500(1991))。

寡核苷酸和核酸可以由核苷酸构成，并可以由不同类型或相同类型的核苷酸构成。例如，在寡核苷酸中，一个或多个核苷酸可以是核糖核苷酸、2’-O-甲基核糖核苷酸或核糖核苷酸和2’-O-甲基核糖核苷酸的混合物；大约10％至约50％的核苷酸可以是核糖核苷酸、2’-O-甲基核糖核苷酸或核糖核苷酸和2’-O-甲基核糖核苷酸的混合物；大约50％或50％以上的核苷酸可以是核糖核苷酸、2’-O-甲基核糖核苷酸或核糖核苷酸和2’-O-甲基核糖核苷酸的混合物；或者全部核苷酸是核糖核苷酸、2’-O-甲基核糖核苷酸或核糖核苷酸和2’-O-甲基核糖核苷酸的混合物。这类寡核苷酸和核酸可被称为嵌合寡核苷酸和嵌合核酸。

L.固体支持物

固体支持物为可连接分子(例如触发分子)和核糖开关(或其他由所公开的方法产生的或在所公开的方法中使用的组件)的固态基质或支持物。核糖开关和其他分子可以直接或间接地与固体支持物相连接。例如，分析物(例如触发分子，待测化合物)可以结合到固体支持物表面或与固定在固体支持物上的捕获试剂(例如结合分析物的化合物或分子)相连接。作为另一个实例，核糖开关可以结合到固体支持物表面或与固定在固体支持物上的探针相连接。多个核糖开关、探针或其他分子以阵列、网格或其他组织形式连接到固体支持物上构成阵列。

可用于固体支持物的固态基质可以包括可以与组件直接或间接连接的任何固体材料。这包括下述材料，例如丙烯酰胺、琼脂糖、纤维素、硝酸纤维素、玻璃、金、聚苯乙烯、聚乙烯乙酸乙烯、聚丙烯、聚甲基丙烯酸酯、聚乙烯、聚氧乙烯、聚硅酸盐、聚碳酸酯、特氟隆(聚四氟乙烯树脂)，碳氟化合物、尼龙、硅橡胶、聚酐、聚乙醇酸、聚乳酸、聚原酸酯、官能化硅烷、聚丙基延胡索酸盐(polypropylfumerate)、胶原、糖胺聚糖和聚氨基酸。固态基质可为任何可用的形式，包括薄膜、膜、瓶、盘、纤维、编织纤维、成型聚合物、颗粒、珠粒、微颗粒或它们的组合。固态基质和固体支持物可为有孔的和无孔的。芯片是一小片长方形或正方形的材料。优选的固态基质的形式为薄膜、珠粒或芯片。一种可用于固态基质的形式是微量滴定板。在一些实施方案中，可以使用多孔载玻片。

阵列可包括多个固定于固体支持物的确定位置或预定位置的核糖开关、触发分子、其他分子、化合物或探针。固体支持物上的每个预定位置通常具有一种类型的组件(即在该位置的所有组件都是相同的)。或者，在固体支持物上的同一预定位置可以固定化多种类型的组件。每一位置可以具有给定组件的多个拷贝。在固体支持物上的不同组件的空间隔离使得可以进行分别的检测和识别。

固体支持物为一个单独的单位或结构虽然是有用的，但不是必需的。一系列的核糖开关、触发分子、其他分子、化合物和/或探针可以分布于任意数目的固体支持物上。例如，一种极端的情况是每一个组件可被固定于分离的反应管或容器中，或在分离的珠粒或微颗粒上。

将寡核苷酸固定化于固态基质的方法已很成熟。可使用已知的偶联方法将包括定位探针(address probe)和检测探针的寡核苷酸偶联至基质上。例如，合适的附着方法描述于Pease et al，Proc.Natl.Acad.Sci.USA 91(11)：5022-5026(1994)和Khrapko et al.，Mol Biol(Mosk)(USSR)25：718-730(1991)。一种将3’-胺寡核苷酸固定于酪蛋白包被的载玻片上的方法描述于Stimpson et al，Proc.Natl.Acad.Sci.USA92：6379-6383(1995)。一种将寡核苷酸附着于固态基质上的可用的方法描述于Guo et al，Nucleic Acids Res.22：5456-5465(1994)。

固定于固体支持物上的每一组件(例如，核糖开关、触发分子或其他分子)可以位于固体支持物的不同预定区域。不同的位置可以是不同的反应室。每一不同的预定区域可以与其他不同的预定区域在物理上彼此分离。固体支持物上的不同预定区域之间的距离可以是固定的，也可以是可变的。例如，在阵列中每一组件可以彼此之间以固定距离排列，而与珠粒相连接的组件就不会有固定的空间关系。特别地，多个固体支持物单位(例如多个珠粒)的使用方式会导致不同的距离。

组件可以以任何密度连接于或固定于固体支持物上。组件固定于固体支持物上的密度可以超过每立方厘米400个不同组件。组件的阵列可以有任何数目的组件。例如，阵列可以具有至少1,000个固定于固体支持物的不同组件、至少10,000个固定于固体支持物的不同组件、至少100,000个固定于固体支持物的不同组件或至少1,000,000个固定于固体支持物的不同组件.

M.试剂盒

上文所述的材料和其他材料可以以任意合适的组合被包装在一起，作为用于进行或辅助进行所公开方法的试剂盒。如果给定试剂盒中的试剂盒组件被设计和调整为在所公开的方法中一起使用则是有用的。例如公开了用于检测化合物的试剂盒，该试剂盒包括一种或多种生物传感器核糖开关。该试剂盒还可包括检测核糖开关的激活的试剂和标签。

N.混合物

公开了通过实施或准备实施所公开方法而形成的混合物。例如，公开了包括核糖开关和触发分子的混合物。

不论何时，只要方法包括使组合物或组件或试剂混合或相接触，实行该方法就会产生多种不同的混合物。例如，如果方法包括3个混合步骤，如果各步骤分别进行，则在上述步骤的每一步之后都会形成一种特有的混合物。此外，不论各步骤如何进行，在所有步骤完成之后也会形成一种混合物。本发明的公开内容考虑了由实施所公开方法所获得的这些混合物，以及含有任何公开(例如本文所公开)的试剂、组合物或组件的混合物。

O.系统

公开了用于实施或辅助实施所公开方法的系统。系统通常包括制造的物品的组合例如结构、机械、装置等，以及组合物、化合物、材料等。这些组合为已公开的或从公开的内容可以显而易见，这些组合均被考虑。例如，公开了和考虑了包括生物传感器核糖开关、固体支持物和信号读取装置的系统。

P.数据结构和计算机控制

公开了所公开方法中使用的、由所公开方法产生的或从所公开方法中产生的数据结构。数据结构通常为在组合物或介质中采集、编组、储存和/或体现的任何形式的数据、信息和/或对象。以例如RAM或存储磁盘的电子形式储存的核糖开关的结构和激活测量结果就是一种类型的数据结构。

所公开的方法或其任意部分或由该方法制备的制品，都可以通过计算机控制来进行控制、管理或辅助。这类计算机控制可以通过计算机控制过程或方法来实现，可以使用和/或产生数据结构，并可以使用计算机程序。这类计算机控制、计算机控制的过程、数据结构和计算机程序都被考虑到并应理解为在本文中被公开。

方法

公开了用于激活、灭活或阻断核糖开关的方法。这类方法可包括例如使核糖开关和可激活、灭活或阻断该核糖开关的化合物或触发分子相接触。核糖开关通过触发分子的结合或移除来发挥控制基因表达的功能。化合物可用于激活、灭活或阻断核糖开关。核糖开关的触发分子(以及其他的激活化合物)可被用于激活核糖开关。通常可使用触发分子以外的化合物来灭活或阻断核糖开关。还可以通过例如从核糖开关所在处移除触发分子来灭活核糖开关。因此，所公开的灭活核糖开关的方法可以包括例如从核糖开关所在的位置或与核糖开关接触的位置移除触发分子(或其他激活化合物)。可以通过不会激活核糖开关的触发分子类似物的结合来阻断核糖开关。

还公开了通过使化合物与RNA分子相接触，从而改变RNA分子表达或改变编码RNA分子的基因表达的方法，其中所述RNA分子包括核糖开关。核糖开关通过结合或移除触发分子而实现控制基因表达的功能。因此，将包括核糖开关的目的RNA分子置于可激活、灭活或阻断核糖开关的条件下就可用来改变RNA的表达。例如转录终止或核糖体与RNA的结合被阻断可以导致表达被改变。根据核糖开关的性质，与触发分子的结合可以减少或阻止RNA分子的表达或者促进或增加RNA分子的表达。

还公开了通过激活、灭活或阻断核糖开关，来调节含有核糖开关的天然存在的基因或RNA的表达的方法。如果该基因对含有该基因的细胞或生物的存活而言十分重要，那么激活、灭活或阻断该核糖开关可导致细胞或生物的死亡、停滞或虚弱。例如(如果该核糖开关的激活关闭或抑制表达)，激活某个对微生物的存活而言十分重要的天然存在的基因中的天然存在的核糖开关，可能导致该微生物的死亡。这是所公开的化合物和方法用于抗微生物和抗生素作用的一个理论基础。具有这些抗微生物作用的化合物被认为是抑菌的或杀菌的。

还公开了选择和识别可激活、灭活或阻断调节剪接的核糖开关的化合物的方法。核糖开关的激活是指核糖开关结合触发分子时其状态的变化。核糖开关可由除触发分子以外的化合物并以不同于与触发分子结合的方式被激活。术语触发分子在本文中用来指可激活核糖开关的分子和化合物。这包括核糖开关的天然或正常的触发分子以及其他可以激活核糖开关的化合物。天然或正常的触发分子是给定的天然核糖开关本来就有的触发分子，或者对于某些非天然核糖开关而言是这样的触发分子：该核糖开关针对该触发分子被设计或该核糖开关通过该触发分子被选择(正如在例如体外选择或体外进化技术中那样)。不是天然的触发分子可被称为非天然触发分子。

还公开了杀灭或抑制细菌的方法，包括将所述细菌与本文公开的或通过本文公开的方法识别的化合物相接触。

还公开了识别激活、灭活或阻断核糖开关的化合物的方法。例如，激活核糖开关的化合物可通过将一待测试化合物和核糖开关相接触并评估所述核糖开关的激活情况来识别。如果所述核糖开关被激活，则该测试化合物被识别为激活核糖开关的化合物。核糖开关的激活可以任何合适的方式被评估。例如，核糖开关可被连接到一报告RNA上，并在存在或不存在所述测试化合物的情况下测量所述报告RNA的表达、表达水平或表达水平的变化。再如，核糖开关可包含一个构象依赖标记，来自该构象依赖标记的信号随该核糖开关的激活状态而改变。这种核糖开关优选使用来自或者源自天然存在的核糖开关的适体结构域。可以看出，对核糖开关的激活情况进行评估使用或不使用对照试验或者测量均可。识别灭活核糖开关的化合物的方法可用类似方式执行。

除了本文别处公开的方法，对阻断核糖开关的化合物的识别可以任何合适的方法完成。例如，在已知可激活或者灭活核糖开关的化合物存在时或者在测试化合物存在时可进行评估核糖开关的激活或灭活的测定。如果未观察到在所述测试化合物不存在时可观察到的激活或灭活，那么所述测试化合物被确定为阻断所述核糖开关被激活或者灭活的化合物。

还公开了使用生物传感器核糖开关检测化合物的方法。该方法可包括使待测样品和生物传感器核糖开关相接触，并评估生物传感器核糖开关的激活。生物传感器核糖开关的激活表明在待测样品中存在该生物传感器核糖开关的触发分子。生物传感器核糖开关是经过基因工程改造的核糖开关，它们在存在它们的同种触发分子时产生可检出的信号。可用的生物传感器核糖开关可以在触发分子达到或超过阈值水平时被触发。生物传感器核糖开关可被设计为体内应用或体外应用。例如，报告RNA编码作为信号的蛋白质或参与产生信号的蛋白质，与该报告RNA可操作地连接的环二GMP生物传感器核糖开关可在体内被用于通过基因工程改造细胞或生物，使其含有编码核糖开关/报告RNA的核酸构建体。用于体外的生物传感器核糖开关的一个实例是包括构象依赖性标签的环二GMP核糖开关，由该标签产生的信号依赖于核糖开关的激活状态。优选地，这种生物传感器核糖开关使用天然存在的环二GMP核糖开关的适体结构域或由天然存在的环二GMP核糖开关衍生的适体结构域。

还公开了通过识别激活、灭活或阻断核糖开关的化合物以及生产所述被识别化合物制成的化合物。这可通过例如将如文中别处所公开的化合物识别方法与生产被识别化合物的方法相结合来完成。例如，化合物可通过如下步骤制备：使一测试化合物和一核糖开关相接触，评估所述核糖开关的激活情况，以及，如果所述核糖开关被所述测试化合物激活，则将所述激活核糖开关的测试化合物作为所述化合物来制备。

还公开了通过检查一化合物对一核糖开关的激活、灭活或阻断并生产所述被检的化合物所制备的化合物。这可以通过例如结合本文他处所公开的化合物激活、灭活或阻断的评估方法与生产被检出化合物的方法来完成。例如，制备化合物可通过如下步骤：使一测试化合物和一核糖开关接触，评估所述核糖开关的激活情况，且如果所述核糖开关被所述测试化合物激活，则将所述激活核糖开关的测试化合物作为所述化合物制备。检查化合物激活、灭活或阻断核糖开关的能力既指识别之前未知可激活、灭活或阻断核糖开关的化合物，也指在已知某种化合物可激活、灭活或阻断核糖开关时，评估所述化合物激活、灭活或者阻断核糖开关的能力。还公开了检测目的化合物的方法，该方法包括：使一样品和核糖开关接触，其中所述核糖开关由所述目的化合物激活，其中当所述目的化合物激活所述核糖开关时，所述核糖开关会产生一信号，其中当所述样品含有所述目的化合物时所述核糖开关产生一信号。所述核糖开关可以是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。当目的化合物激活所述核糖开关时，所述核糖开关可改变构象，其中所述构象变化通过构象依赖标记产生信号。当目的化合物激活核糖开关时，所述核糖开关可改变构象，其中所述构象变化会引起连接所述核糖开关的RNA表达的变化，其中所述表达变化产生一信号。信号可由连接所述核糖开关的RNA表达的报告蛋白产生。

还公开了检测目的化合物的方法，该方法包括：使一样品和核糖开关接触，其中所述核糖开关由所述目的化合物激活，其中当所述目的化合物激活所述核糖开关时，所述核糖开关会产生一信号，其中当所述样品含有所述目的化合物时所述核糖开关产生一信号，其中所述核糖开关包括一种核糖开关或一种核糖开关的衍生物。所述核糖开关可以是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。当目的化合物激活所述核糖开关时，所述核糖开关可改变构象，其中所述构象变化通过构象依赖标记产生信号。当目的化合物激活核糖开关时，所述核糖开关可改变构象，其中所述构象变化会引起连接所述核糖开关的RNA表达的变化，其中所述表达变化产生一信号。信号可由连接所述核糖开关的RNA表达的报告蛋白产生。

具体地，公开了一种检测样品中环二GMP的方法，包括：将一种环二GMP应答性核糖开关与所述样品相接触；以及检测环二GMP和所述环二GMP应答性核糖开关之间的相互作用，其中环二GMP和所述环二GMP应答性核糖开关所述相互作用可表明环二GMP的存在。所述环二GMP应答性核糖开关可以是被标记的。

还公开了一种方法，包括：(a)测试抑制编码含有核糖开关的RNA的基因的基因表达的化合物，其中所述抑制通过所述核糖开关，其中所述核糖开关包括一种核糖开关或一种核糖开关的衍生物；(b)通过使一细胞和步骤(a)中抑制基因表达的一种化合物相接触来抑制基因表达，其中所述细胞含有编码含有核糖开关的RNA的基因，其中所述化合物通过结合到所述核糖开关抑制所述基因的表达。所述核糖开关可以是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。

还公开了一种方法，包括：(a)测试脱抑制编码含有核糖开关的RNA的基因的基因表达的化合物，其中所述脱抑制通过所述核糖开关实现，其中所述核糖开关包括一种核糖开关或一种核糖开关的衍生物；(b)通过使一细胞和步骤(a)中脱抑制基因表达的一种化合物相接触来脱抑制基因表达，其中所述细胞含有编码含有核糖开关的RNA的基因，其中所述化合物通过结合到所述核糖开关脱抑制所述基因的表达。所述核糖开关可以是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。

还公开了一种改变基因表达的方法，所述方法包括使一种化合物和一个细胞相接触，其中所述化合物为环二GMP、pGpG、GpG或GpGpG。所述化合物还可以为可激活一种环二GMP应答性核糖开关的环二GMP、pGpG、GpG或GpGpG的衍生物。还公开了一种改变基因表达的方法，所述方法包括使一种化合物和一个细胞相接触，其中所述化合物为S-腺苷高半胱氨酸。所述化合物还可以为可激活一种S-腺苷高半胱氨酸应答性核糖开关的S-腺苷高半胱氨酸衍生物。还公开了一种改变基因表达的方法，所述方法包括使一种化合物和一个细胞相接触，其中所述化合物为preQ₁。所述化合物还可以是能够激活一种preQ₁应答性核糖开关的preQ₁衍生物。还公开了一种改变基因表达的方法，所述方法包括使一种化合物和一个细胞相接触，其中所述化合物为Moco。所述化合物还可以是能够激活一种Moco应答性核糖开关的Moco衍生物。还公开了一种改变基因表达的方法，所述方法包括使一种化合物和一个细胞相接触，其中所述化合物为SAM。所述化合物还可以是能够激活一种SAM应答性核糖开关的SAM衍生物。用于激活一种SAM-IV核糖开关的化合物还可以为MeAzaAdoMet。

为了激活一种S-腺苷高半胱氨酸应答性核糖开关，所述化合物可以为S-腺苷高半胱氨酸。所述化合物还可以是能激活S-腺苷高半胱氨酸应答性核糖开关的S-腺苷高半胱氨酸的衍生物。例如，所述化合物可以为S-腺苷-L-半胱氨酸(SAC)。图12B显示了对于可激活一种S-腺苷高半胱氨酸应答性核糖开关的化合物重要的结构元件。

所述细胞可以被鉴定为需要改变的基因表达。所述细胞可以是一种细菌细胞。所述化合物可杀灭所述细菌细胞或抑制所述细菌细胞的生长。可以通过将所述化合物给予一个受试者，使所述化合物和所述细胞相接触。所述细胞是所述受试者中的细菌细胞，其中所述化合物杀灭所述细菌细胞或抑制所述细菌细胞的生长。所述受试者可具有细菌感染。所述细胞可包含一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。所述化合物可与另一种抗微生物化合物联合给药。所述化合物可抑制细菌在生物膜中的生长。还公开了一种改变细胞生理状态的方法，所述方法包括使一种化合物和一个细胞相接触，其中所述化合物为环二GMP、pGpG、GpG或GpGpG。所述化合物还可以为可激活一种环二GMP应答性核糖开关的环二GMP、pGpG、GpG或GpGpG的衍生物。

公开了一种鉴定核糖开关的方法，所述方法包括在存在和不存在触发分子的条件下评估RNA分子的直读探测的自发切割，其中所述RNA分子由被所述触发分子调节的基因所编码，其中RNA分子的直读探测的自发切割模式的改变表明了存在一种对所述触发分子有应答的核糖开关。所述触发分子可以是环二GMP、S-腺苷高半胱氨酸、preQ₁、Moco或SAM。

还公开了一种方法，包括：(a)测试抑制编码含有核糖开关的RNA的基因的基因表达的化合物，其中所述抑制通过所述核糖开关实现，其中所述核糖开关包括一种环二GMP应答性核糖开关或一种环二GMP应答性核糖开关的衍生物；(b)通过使一细胞和步骤(a)中抑制基因表达的一种化合物相接触来抑制基因表达，其中所述细胞含有编码含有核糖开关的RNA的基因，其中所述化合物通过结合到所述核糖开关抑制所述基因的表达。

还公开了一种方法，包括通过以下方式抑制一个编码包含核糖开关的RNA的基因的基因表达：使一个细胞与这样的一种化合物相接触，即通过测验该化合物对所述基因的基因表达的抑制情况，该化合物被鉴定为一种抑制所述基因的基因表达的化合物，其中所述抑制经由所述核糖开关实现，其中所述核糖开关包括一种环二GMP应答性核糖开关或一种环二GMP应答性核糖开关的衍生物。

A.鉴定抗微生物化合物

核糖开关是一类新的已为用于结合小的有机分子而进化的结构明确的RNA。核糖开关的天然结合袋可用代谢物类似物打靶或用模拟天然代谢产物的样态空间的化合物打靶。核糖开关的小分子配体提供了有用的衍生位点从而产生候选药物。一些核糖开关的分布如美国专利申请公开文本No.2005-0053951的表1所示。一旦一类核糖开关被鉴定且其作为药物靶标的潜力被评估，如环二GMP核糖开关，则候选分子可被鉴定。

药物抗性菌株的出现加强了对鉴定新类别抗生素的需求。抗核糖开关药物代表了因下列原因而被相当关注的一种抗菌作用形式。核糖开关控制对于基本代谢过程非常重要的基因的表达。因此用药物操纵这些基因控制元件会生产新的抗生素。这些抗微生物试剂可被认为是抑菌剂或者杀菌剂。核糖开关也携带已经进化成选择性结合代谢产物的RNA结构，因此这些RNA受体正如蛋白酶和受体一样是好的药物标靶。

如果存在某一化合物时的核糖开关分析与不存在该化合物时同样的核糖开关试验相比(即与对照分析相比)，信号增加至少1倍、2倍、3倍、4倍、5倍、50％、75％、100％、125％、150％、175％、200％、250％、300％、400％或500％，则该化合物可鉴定为可激活核糖开关或确定具有核糖开关激活活性。该核糖开关试验可使用任何合适的核糖开关构建体进行。对于核糖开关激活试验特别有用的核糖开关构建体在本文其他地方描述。鉴定一化合物能激活核糖开关或具有核糖开关激活活性可依据一个或多个特殊核糖开关、核糖开关构建体或者核糖开关类别进行。为方便起见，鉴定为能激活一类核糖开关或对于一类核糖开关具有核糖开关激活活性的化合物可依此针对具体的核糖开关如存在于具体物种中的核糖开关类别而被鉴定。例如，被鉴定为激活环二GMP核糖开关或对环二GMP核糖开关的核糖开关具有激活活性的化合物可照这样针对具体环二GMP核糖开关例如出现在例如霍乱弧菌或木葡糖酸醋杆菌(Gluconacetobacter xylinus)中的激活环二GMP核糖开关而被鉴定。

B.使用抗微生物化合物的方法

本文公开了体内和体外抗菌方法。“抗菌”意味着抑制或阻止细菌生长，杀灭细菌或者减少细菌数。因此，公开了抑制或阻止细菌生长的方法，包括用有效量的本文公开的一个或多个化合物接触细菌。被公开的化合物的其他结构在本文被提供。

公开了一种抑制细菌细胞生长的方法，该方法包括：使一个细胞和可结合核糖开关的化合物相接触，其中所述细胞包含编码包含对所述化合物应答的核糖开关的RNA基因，其中所述化合物通过结合于所述核糖开关而抑制细菌细胞生长，从而改变所述基因的表达。所述核糖开关可以是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。该方法可使细菌细胞生长与未接触所述化合物的细胞相比至少降低10％。所述化合物和所述细胞可通过将所述化合物给予受试者而相接触。所述细胞可以为所述受试者中的细菌细胞，其中所述化合物杀灭或抑制所述细菌细胞生长。所述受试者可具有细菌感染。所述化合物可与另一种抗微生物化合物联合给药。

所述细菌可以是任何细菌，例如来自如下的属的细菌：芽孢杆菌属(Bacillus)、不动杆菌属(Acinetobacter)、放线杆菌属(Actinobacillus)、伯克霍尔德氏菌属(Burkholderia)，弯曲杆菌属(Campylobacter)、梭菌属(Clostridium)、脱亚硫酸菌属(Desulfitobacterium)、肠球菌属(Enterococcus)、欧文氏菌属(Erwinia)、埃希氏杆菌属(Escherichia)、微小杆菌属(Exiguobacterium)、梭菌属(Fusobacterium)、地芽孢杆菌属(Geobacillus)、地杆菌属(Geobacter)、葡糖酸醋酸杆菌(Gluconacetobacter)、嗜血杆菌属(Haemophilus)、螺杆菌属(Heliobacter)、克雷伯氏菌属(Klebsiella)、Idiomarina、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、明串珠菌属(Leuconostoc)、李斯特菌属(Listeria)、穆尔氏菌属(Moorella)、分枝杆菌属(Mycobacterium)、Oceanobacillus、酒球菌属(Oenococcus)、巴斯德氏菌属(Pasteurella)、片球菌属(Pediococcus)、假单胞菌属、希瓦氏菌属(Shewanella)、志贺氏菌属(Shigella)、Solibacter、葡萄球菌属(Staphylococcus)、链球菌属、热厌氧杆菌属(Thermoanaerobacter)、热袍菌属(Thermotoga)和弧菌属(Vibrio)。所述细菌可以是例如胸膜肺炎放线杆菌(Actinobacillus pleuropneumoniae)、炭疽杆菌(Bacillusanthracis)、蜡样芽胞杆菌(Bacillus cereus)、克劳氏芽孢杆菌(Bacillusclausii)、耐盐芽孢杆菌(Bacillus halodurans)、地衣芽孢杆菌(Bacilluslicheniformis)、枯草芽孢杆菌(Bacillus subtilis)、苏云金芽孢杆菌(Bacillus thuringiensis)、丙酮丁醇梭菌(Clostridium acetobutylicum)、艰难梭菌(Clostridium dificile)、产气荚膜梭菌(Clostridium perfringens)、破伤风梭菌(Clostridium tetani)、热纤梭菌(Clostridium thermocellum)、Desulfitobacterium hafniense、粪肠球菌(Enterococcus faecalis)、软腐欧文氏菌(Erwinia carotovora)、大肠杆菌、微小杆菌属种、具核梭杆菌(Fusobacterium nucleatum)、嗜热地芽胞杆菌(Geobacilluskaustophilus)、硫还原地杆菌、木葡糖酸醋杆菌(Gluconacetobacterxylinus)、杜克雷嗜血杆菌(Haemophilus ducreyi)、流感嗜血菌(Haemophilus influenzae)、睡眠嗜血杆菌(Haemophilus somnus)、Idiomarina loihiensis、嗜酸乳杆菌(Lactobacillus acidophilus)、干酪乳杆菌、德氏乳杆菌(Lactobacillus delbrueckii)、加氏乳杆菌(Lactobacillusgasseri)、约氏乳杆菌(Lactobacillus johnsonii)、植物乳杆菌(Lactobacillusplantarum)、乳酸乳球菌、肠膜明串珠菌(Leuconostoc mesenteroides)、无害李斯特菌(Listeria innocua)、单核细胞增生李斯特菌(Listeriamonocytogenes)、热醋穆尔氏菌(Moorella thermoacetica)、Oceanobacillusiheyensis、酒酒球菌(Oenococcus oeni)、多杀性巴斯德氏菌属(Pasteurellamultocida)、戊糖片球菌(Pediococcus pentosaceus)、绿脓假单胞菌(Pseudomonas aeruginosa)、希瓦氏菌(Shewanella oneidensis)、福氏志贺氏菌(Shigella flexneri)、Solibacter usitatus、金黄色葡萄球菌(Staphylococcus aureus)、表皮葡萄球菌(Staphylococcus epidermidis)、腾冲嗜热厌氧菌(Thermoanaerobacter tengcongensis)、海栖热袍菌(Thermotoga maritima)、霍乱弧菌、费氏弧菌(Vibrio fischeri)、副溶血性弧菌(Vibrio parahaemolyticus)或创伤弧菌(Vibrio vulnificus)。细菌存在的任何环境中的细菌生长也可被抑制。例如，在液体、生物膜中和表面上的细菌生长可被抑制。本文公开的化合物可与任何其他化合物或组合物联合给药或使用。例如，本文公开的化合物可与另一种抗微生物化合物联合给药或使用。

“抑制细菌生长”被定义为减少单个细菌分裂成子细胞的能力，或减少细菌群形成子细胞的能力。细菌繁殖的能力可减少约10％、约20％、约30％、约40％、约50％、约60％、约70％、约80％、约90％或100％或更高。

还提供了一种抑制细菌或细菌群生长及/或杀灭细菌或细菌群的方法，包括将所述细菌与本文所公开和描述的一种或多种化合物接触。

“杀灭细菌”被定义为使单个细菌死亡或减少多个细菌如集落中的细菌的数量。当以复数形式提及细菌时，“杀灭细菌”被定义为既定菌群的细胞死亡率为10％菌群、20％菌群、30％菌群、40％菌群、50％菌群、60％菌群、70％菌群、80％菌群、90％菌群或低于等于100％菌群。

本文公开的化合物和组合物具有体内或体外抗菌活性，且可与其他化合物和组合物结合使用，所述其他化合物和组合物也可以是杀菌剂。

术语“治疗有效量”的本文所提供的化合物是指无毒的、但足以将一个或多个症状根据需要减轻的量。如将在下文指出，所需化合物的确切量因受试者而异，这取决于受试者的物种、年龄和一般情况、所治疗疾病的严重程度，使用的具体化合物，其给药方式等等。因此，不可能指定一个确切的“有效量”。但是，适当的有效量可由本领域的普通技术人员只使用常规实验确定。

本文公开的化合物和组合物可以可药用载体形式体内给药。“可药用的”是指物质不是生物学方面或者其他方面不合乎需要的，即该物质可在不引起任何不良生物反应的情况下或在不会以有害方式与药物组合物所含有的任何其他组分相互作用的情况下被给予受试者。载体自然会被选择以使活性成分的任何降解最小并使在受试者中的有害副作用最小，正如本领域技术人员所熟知的那样。

本文公开的组合物或者化合物可以口服给药、胃肠外给药(如静脉内给药)、肌内注射给药、腹膜内注射给药、经皮给药、体外给药(extracorporeally)、局部给药等等，包括局部鼻内给药或者通过吸入器给药。本文所用“局部鼻内给药”表示通过一个或者两个鼻孔将组合物送递到鼻和鼻道(nasal passage)，并可包括通过喷雾装置或者滴化装置送递，或通过雾化核酸或载体送递。组合物通过吸入器给药可通过鼻或嘴经由喷雾或滴化装置送递。也可通过插管直接送递到呼吸系统的任何区域(如肺部)。所需要的组合物的确切量因受试者而异，这取决于受试者的物种、年龄、体重和一般情况、所治疗变态反应异常的严重程度，使用的具体核酸或者载体，其给药方式等等。因此，不可能为每一种组合物指定一个确切量。但是，适当的量可由本领域普通技术人员在参考本文的教导下只使用常规实验确定。

如果使用胃肠外给予组合物或者化合物，一般通过注射给药。注射剂被制备为常规形式，或者为液体溶液或者悬浮液、注射之前适合溶于或悬浮于液体中的固体形式，或者为乳剂。最近改进的胃肠外给药方法包括使用一个缓慢释放或持续释放系统，从而使得恒定剂量得以维持。见如美国专利No.3,610,795，其以引用的方式被纳入本文中。

本文公开的化合物和组合物可与可药用的载体联合用于治疗中。合适的载体及其制剂描述于Remington：The Science and Practice ofPharmacy(19th ed.)ed.A.R.Gennaro，Mack Publishing Company，Easton，PA 1995。通常情况下，合适量的可药用的盐用于制剂中从而使该制剂等张。可药用的载体的实例包括但不限于盐溶液、Ringer氏液和右旋葡萄糖溶液。溶液的pH值优选为约5到约8，且更优选为约7至约7.5。其他载体包括缓释制剂如含有抗体的固体疏水性聚合物的半透基质，该基质是特型制品形式，例如薄膜、脂质体或微粒。对于本领域技术人员而言显而易见的是，某些载体更优选，这取决于例如给药组合物的给药途径和浓度。

本领域技术人员知道药学载体。这些药学载体最常用的是用于将药物给予人的标准载体，包括溶液如无菌水、盐水以及在生理pH的缓冲液。组合物可通过肌内或皮下方式给药。其他化合物根据本领域技术人员使用的标准程序给药。

除了所选分子外，药物组合物还可包含载体、增稠剂、稀释剂、缓冲剂、防腐剂、表面活性剂等等。药物组合物可还包括一种或多种如抗微生物剂、抗炎剂、麻醉药等等的活性成分。

药物组合物可以多种方式给药，这取决于是需要局部治疗还是全身治疗，以及治疗区域。给药可通过局部(包括眼、阴道、直肠、鼻内)、口服、吸入或胃肠外例如通过静脉滴注、皮下注射、腹膜内注射或肌内注射进行。本公开的抗体可静脉内给药、腹膜内给药、肌内给药、皮下给药、腔内给药或经皮给药。

胃肠外给药制剂包括无菌水或非水溶液、悬浮液和乳剂。非水溶剂的实例是丙二醇、聚乙二醇、植物油如橄榄油，以及可注射有机酯类如油酸乙酯。水性载体包括水、醇/水溶液、乳液或悬浮液，包括盐水和缓冲介质。胃肠外载体包括氯化钠溶液、Ringer氏右旋葡萄糖、右旋葡萄糖和氯化钠、乳酸Ringer氏液或不挥发油。静脉内载体包括液体和营养补充剂、电解质补充剂(如那些基于Ringer氏右旋葡萄糖的电解质补充液)等。防腐剂和其他添加剂也存在，如抗微生物剂、抗氧化剂、螯合剂以及惰性气体等。

局部给药制剂包括膏剂、洗剂、霜剂、凝胶、滴剂、栓剂、喷雾剂、液体和粉剂。常规药学载体(以水、粉末或油为基础)、增稠剂等是必要的或可取的。

口服给药的组合物包括粉末或颗粒、水或非水介质中的悬浮液或溶液、胶囊、囊剂或片剂。增稠剂、调味剂、稀释剂、乳化剂、分散助剂或粘合剂是可取的。

有些组合物可能作为可药用的酸或碱加成的盐形式给药，所述酸加成盐是与无机酸如盐酸、氢溴酸、高氯酸、硝酸、硫氰酸、硫酸和磷酸，和有机酸如甲酸、乙酸、丙酸、乙醇酸、乳酸、丙酮酸、草酸、丙二酸、琥珀酸、马来酸和富马酸反应所形成，所述碱加成盐是与无机碱如氢氧化钠、氢氧化铵、氢氧化钾，和有机碱如单烷基胺、双烷基胺、三烷基胺和芳胺和取代乙醇胺反应所形成。

本文所公开的治疗性组合物也可通过使用单克隆抗体作为与化合物分子偶联的各载体给药。本公开的治疗性组合物还可与作为可打靶的药物载体的水溶性聚合物偶联。这种聚合物可包括但不限于聚乙烯吡咯烷酮、吡喃共聚物、聚羟丙基甲基丙烯酸-氨基苯酚、聚羟乙基天冬氨酸苯酚或由棕榈酰残基取代的聚乙基-环氧乙烷聚赖氨酸。此外，本公开的治疗性组合物还可与一类用于实现控制药物释放的可生物降解聚合物例如聚乳酸、聚ε己内酯、聚羟基丁酸、聚原酸酯、聚缩醛、聚二氢-吡喃、聚氰基丙烯酸酯和交联或两亲的水凝胶嵌段共聚物偶联。

优选由于化合物的给药至少约3％，更优选约10％、更优选约20％、更优选约30％、更优选约50％、更优选约75％甚至更优选约100％的细菌感染被降低。感染降低是由诸如白细胞计数减少、烧热下降、炎症减轻、细菌数减小或其他细菌感染指标下降的参数决定。为了增加细菌感染降低的百分比，可将剂量增加到对受试者保持无毒的最有效水平。

如在整个说明书中所用的，“受试者”是指某一个体。优选地，该受试者是哺乳动物如除人外的哺乳动物或灵长类，且更优选为人。“受试者”可包括家养动物(如猫、狗等)、牲畜(如牛、马、猪、绵羊、山羊等)、实验动物(如小鼠、兔、大鼠、豚鼠等)和鱼类。

“细菌感染”被定义为受试者或者样品内存在细菌。这种细菌感染可以是天然存在的细菌在受试者或者样品内或上的生长所致，或由于外来生物入侵所致。

本文公开的化合物可以与抗生素同样的方式使用。抗生素的使用在本领域已被接受。抗生素使用的一个例子包括对动物的治疗。在必要时，所公开的化合物可通过注射或经饲料或水给予动物，通常在兽医或者营养师的专业指导下进行。视情况如疾病严重程度和动物物种，将化合物给予单个动物或动物群体。如果所有的动物都处于类似的免疫状态且所有动物都暴露于引起相同疾病的微生物中，那么对整个群体的治疗和护理可能是必要的。

另一个使用化合物的实例包括减少水生动物的微生物感染，包括如下步骤：选择微生物感染的水生动物，提供含有如本公开的化合物、螯合剂如EDTA、TRIENE的抗微生物溶液，将pH缓冲剂加入该溶液中并调整其pH值至约7.0-约9.0之间，将该水生动物浸泡在该溶液中并保持动物在溶液中达有效减少该动物的微生物负载的一段时间，将该水生动物从该溶液中取出并放回不含该溶液的水中。水生动物可重复浸泡在含EDTA、本公开的化合物、TRIENE和pH缓冲剂的溶液中，直到该动物负载的微生物被清除(美国专利6,518,252)。

本文公开的化合物的其他用途包括但不限于牙科治疗和水净化(这可包括如城市供水、污水处理系统、饮用水和非饮用水的供应以及孵化场)。

C.产生触发分子的方法

本文公开了一种产生触发分子的方法，所述方法包括：培养能够产生所述触发分子的突变细菌细胞，其中所述突变细菌细胞在一种对所述触发分子应答的核糖开关中包含一突变，相对于不具有所述突变的细胞，所述突变可增加由突变细菌细胞产生的触发分子；以及从所述细胞培养物分离触发分子，从而产生所述触发分子。所述触发分子可为环二GMP、S-腺苷高半胱氨酸、preQ_l、Moco或SAM。

所述突变细菌细胞可以为一种敲除突变体，其中所述细胞不能产生对所述触发分子应答的核糖开关。可将所述细胞编码所述核糖开关的区域被完全去除。所述触发分子的产生量可提高10、20、30、40、50、60、70、80、90％或更高。这一点可通过将触发分子的总量与具有完整核糖开关的细胞产生的总量进行比较来测量。

还公开一种在对一种触发分子应答的核糖开关中包含一突变的细菌细胞，所述突变将所述细胞产生的所述触发分子与不具有所述突变的细胞相比提高至可测量的程度。“可测量的提高”是指所述触发分子的产量提高10、20、30、40、50、60、70、80、90％或更多。

实施例

A.实施例1：使用CMfinder比较基因组流程(pipeline)在细菌中鉴定22个候选的结构化RNA

将一种基于比较基因组学的计算流程用于细菌，鉴定了22个候选的RNA基序。6个被认为是核糖开关，它们是可在结合一种具体的代谢物时调节基因表达的mRNA元件。在各独立的研究中，已确认它们中的2个为新的核糖开关。3个另外的核糖开关候选物为乳杆菌目中推定的转运体基因、伯克氏菌目中的柠檬酸循环基因和数个门中的钼辅因子生物合成基因之一的上游区。剩下的核糖开关候选物——广泛分布的GEMM(环境、膜及运动性基因)基序与对霍乱弧菌中天然感受态及硫还原地杆菌中金属离子用作电子受体很重要的基因有关。在其他基序中，一个具有类似于以前发表的候选核糖开关ykkC/yxkD的基因分布，但具有不同的结构。已在5个门中鉴定了可能的非编码RNA，并且另外多种顺式调节RNA被鉴定，包括ε-变形细菌中的1种(purD上游，参与嘌呤生物合成)，蓝细菌中的1种(在ATP合酶操纵子内)。这些候选RNA增加了不断增加的参与多细胞过程的RNA基序的名录，并表明许多另外的RNA有待于被发现。

最近新的结构化RNA的发现(He 2006；Storz 2005；Kima 2006；Claverie 2005)表明这样的RNA在细胞中是常见的。为了有助于发现另外的结构化RNA，已经开发了一种能够鉴定细菌中的保守RNA的自动化流程(Yao 2007)。该流程集合了同源基因mRNA的可能的5′UTR(非翻译区)，并使用CMfinder(Yao 2006)程序来预测每组UTR内的保守RNA结构，或“基序”。然后应用自动同源性搜索来发现这些基序的另外的实例，CMfinder利用该结果来提高每种基序的二级结构模型和序列比对。输出是一组具有预测的RNA二级结构的比对结果，随后对这些比对结果进行人工分析，以改良模型并评估哪些基序值得进一步研究。

虽然已经对RNA进行了其他自动搜索(Barrick 2004；Corbino 2005；Axmann 2005；Seliverstov 2005；McCutcheon 2003；Coventry 2004；Washietl 2005；Pedersen 2006；Torarinsson 2006)，但该流程(Yao 2007)与这些搜索有3个区别特征。第一，该流程使用了CMfinder，CMfinder甚至在如下情况仍能发现基序：一些输入序列不包含所述基序或包含携带无关序列结构域的基序代表物时。CMfinder还甚至可以以低的序列保守性产生有用比对结果，但该比对结果将采用任何存在的序列相似性。第二，该流程整合了同源性搜索，以对每个基序自动提炼比对结果和结构模型。第三，由于该流程比对了同源基因的UTR，它很适合于发现顺式调节RNA，并且它对序列保守的依赖被进一步降低。

实际上，使用厚壁菌门细菌作为一试验例，以前已证明该流程可用于预测几乎所有已知的顺式调节RNA(Yao 2007)。该流程还发现了这样的基序，即当这些基序出现在同源基因上游时可能为反式编码RNA或“非编码RNA”(ncRNA)。

该流程可用于在基因组已被测序的所有细菌中发现结构化RNA。描述了22种可能为保守的结构化RNA的基序。该研究主要关注核糖开关(Winkler 2005；Batey 2006)，核糖开关是一种通常出现在直接感知具体小分子及调节基因表达的mRNA中的结构化RNA类型。后来的实验已确认，这些基序中的2种为新的核糖开关。第一种结合SAH(S-腺苷高半胱氨酸)(图1)，第二种为天蓝色链霉菌(Streptomyces coelicolor)及相关物种中的SAM(S-腺苷甲硫氨酸)结合核糖开关。另一个核糖开关候选物的实验证据表明它可感知钼辅因子或“Moco”。

一个特别受关注的候选物为GEMM(环境、膜及运动性基因)基序，该基序为典型核糖开关。例如，GEMM是一种广泛分布且高度保守的基因元件，其在309例中的297例中的定位使得它很可能存在于邻近开放阅读框(ORF)的5′UTR中。这些被推定受GEMM调节的基因一般与感知或应答于细胞外条件相关联，这说明GEMM可感知一种信号转导或细胞-细胞通讯产生的代谢物。

1.材料和方法

i.对候选RNA基序的鉴定

将分类在保守结构域数据库(Marchler-Bauer 2005)版本2.08中的基因的可能5′UTR作为计算流程(Yao 2007)的输入。从RefSeq(Pruitt2005)版本14获取完整的基因组序列和基因位置，但删除含有的基因与其他基因组高度类似的基因组。UTR提取算法(Neph 2006)解释这样的事实，即UTR由于操纵子结构可能不总是紧接在基因的上游。

对于每个保守结构域，将收集的可能的UTR序列作为输入给予CMfinder版本0.2，CMfinder产生所述UTR组内结构保守基序的局部多序列比对。然后，除了将基因间区域在两端延长50个核苷酸以解释注释缺失的ORF之外，将这些比对用于搜索注释的基因间区域内的其他同源物。其同源性搜索以具有ML启发式过滤件(Weinberg 2006)、Infernal(Eddy 2005)版本0.7执行的全局模式协方差模型(Eddy 1994)和截止值为10的E-值(Klein 2003)的RAVENNA程序版本0.2f(Weinberg 2004；Weinberg 2004ii；Weinberg 2006)进行。CMfinder然后使用这些新同源物改进其初始比对。基于Rfam数据库(Griffiths-Jones 2005)版本7.0检测已知RNA。基于短序列的系统发生保守性、物种的多样性和结构的判据对预测打分。该流程算法更具体地描述于别处(Yao 2007)。

将细菌基因组序列数据分成组，进行UTR提取，分别对每组进行基序预测和同源性搜索。这受到这样的事实的启发，即不同门中UTR经常不包含相同的基序。然而，将测序的成员较少的门根据分类学进行合并，以尝试汇集足够的序列数据来预测基序。忽略仅具有一个或两个测序的成员的门(例如绿弯菌门(Chloroflexi))。使用了如下8个组：(1)厚壁菌、(2)放线菌(Actinobacteria)、(3)α-变形细菌、(4)β-变形细菌、(5)γ-变形细菌、(6)δ-和ε-变形细菌、(7)蓝细菌及(8)拟杆菌(Bacteroidetes)、绿菌(Chlorobi)、衣原体(Chlamydiae)、疣微菌(Verrucomicrobia)和螺旋体(Spirochaetes)。

ii.对候选基序的分析以及同源性搜索策略

然后选择有希望的基序，之后通过进行另外的同源性搜索进一步分析它们，并以RALEE(Griffiths-Jones 2005)编辑它们的比对结果。使用NCBI BLAST(Altschul 1997)、Mfold(Zuker 2003)、Rnall(Wan2004)(以鉴定依赖ρ的转录终止子)、CMfinder和RAVENNA辅助这些分析。与基序相关的代谢通路的信息提取自KEGG(Kanehisa 2006)。为了扩展通过鉴定另外的结构化元件的比对，将比对在它们的5′和3′端延长50-100个核苷酸，如有需要，使用CMfinder或通过人工审查再次比对。

对同源物的另外的搜索以多种方式使用了RAVENNA。全局模式和局部模式(Eddy 2005)协方差模型搜索给出了互补的结果。在人工指导的搜索中使用的序列数据库为RefSeq版本19(Pruitt 2005)的“微生物”子集以及来自酸矿井排水(Tyson 2004)(GenBank登录号AADL01000000)和马尾藻海(Venter，2004)(AACY01000000)的环境鸟枪序列。

在合适时，搜索4种类型的这些序列的子集。第一，不总是使用环境序列数据。第二，仅搜索所述基序最初源自的细菌组的基因组(如β-变形细菌)。第三，仅搜索基因间序列(如前文延伸50个核苷酸)。第四，将BLAST程序tblastn用于搜索与所述基序相关基因同源的基因。然后在匹配序列上游2Kb(预测包含5′UTR)和下游200个核苷酸进行RAVENNA搜索(这是因为明显的编码同源性可能在真正ORF的上游延伸，导致BLAST错误鉴定起始密码子)。使用基序的细菌组作为BLAST数据库以利于发现高度变化的同源物。例如，ε-变形细菌purD基因的上游搜索显示为具有一截短茎的purD基序(见下文)的同源物。另外，以这样的小数据库，在RAVENNA之前进行ML启发式过滤。如果将全序列组用作BLAST数据库，则有助于发现其他门中的同源物。

iii.基序的排除

如果基序不显示结构化RNA的特征，将它们从进一步的研究中排除。为了帮助排除具有假的结构预测的基序，通过去除所述预测的结构中所有碱基对，仅使用序列信息进行同源性搜索。结构不保守的基于序列的匹配结果表明预测的结构是不正确的。然而，这样的同源物可被协方差模型丢失，协方差模型呈现的结构是保守的。当序列同源物显示所提出的结构实际上很不保守时，使用该策略排除多种基序。

iv.确定共有图(consensus diagram)的保守和变异的程度

为了确立共有图(例如在图1中)中反映的保守程度，序列被加权以不再看重高度相似的同源物。使用通过Infernal(Eddy 2005)执行的GSC算法(Gerstein 1994)进行加权，然后在所述多序列比对中的每个位置计算加权的核苷酸频率。为按照相关变异将碱基对分类，计算Watson-Crick对或G-U对的加权频率。但将如下这样的比对序列丢弃，即在这些序列中两个核苷酸都缺失，或者两核苷酸之一的类别不定(例如为“N”，表示4种碱基的任一种)。如果两条序列具有在携带所述基序的序列中的两个位置都不同的Watson-Crick对或G-U对，那么被归为一种相关变异位置。如果仅一个位置不同，那么该现象被归为一种相容突变。然而，如果非Watson-Crick对或G-U对的频率不超过5％，那么不将这些位置注释为相关变异或相容突变。

2.结果

i.新的RNA基序的评价和分析

人工检查通过CMfinder流程预测的有希望的结构化RNA基序，以改进所述共有序列和结构模型(见“材料和方法”)及提供关于可能的功能的信息。每种候选物的关键结果总结于表1中。对于所鉴定的22种基序，7种描绘于图1中。

表1.推定的结构化RNA基序的概述。“RNA”＝以RNA发挥功能(这与dsDNA相对)，“Cis”＝顺式调节，“开关”＝核糖开关。评价：“Y”＝确定是，“y”＝可能是，“？”＝可能，“n”＝可能为否，“N”＝确定为否。在实验检查前进行这些评价。剩下的列为“门/纲”(包含基序的门，或者变形细菌的纲)，“M，V”(“M”＝具有模块茎，这种茎仅有时出现，“V”＝长度可变的茎)，“Cov.”＝相关变异配对位置的数目(见“方法”；注意不建议仅通过该数目进行基序排序，而应从整体上评价比对结果)，“#”＝代表物的数目，“非顺式”＝X/Y其中X为不位于基因5′调节构型中的代表物数目且Y为具有已注释基因的序列(某些RefSeq序列缺乏注释)中的代表物数目。Moco和SAM-IV核糖开关数据将在后面的记录中给出。Gamma-150和coccus-1仅出现在补充材料中。

选择候选RNA基序用于进一步研究的决策是基于对序列和结构的保守性、相关变异以及基因前后序列(例如基序是否一致地位于具体基因家族的上游)的定性评价。保守序列是重要的，这是因为结构化RNA通常在形成复合物三级结构或在其他限制之下的区域具有许多保守核苷酸。结构化RNA有时具有长度可变的茎或“模块茎”(存在于一些但非全部代表物中的茎)。一个茎的两侧要么同时出现要么都不出现，该事实类似于相关变异并且是结构保守的证据。

顺式调节RNA例如核糖开关是调节mRNA基因的mRNA区域。在细菌中，大多数顺式调节RNA出现于受调节mRNA的5′UTR。虽然不可能可靠地预测转录起始点，但是当一种基序可能位于mRNA的5′UTR时(如果该元件位于转录起始位点5′端)，该元件的代表物被称为位于基因的“5′端调节构型”中。如果一种基序的大多数或所有代表物都在一个基因的5′端调节构型中，那么这是该基序具有顺式调节功能的证据。

顺式调节RNA经常具有2个显著的结构特征中的一个：依赖ρ的转录终止子或重叠SD序列(细菌的核糖体结合位点)(Winkler 2005)的茎。依赖ρ的转录终止子由一个强发夹及之后的4个或更多个U残基组成(Henkin 2002)。调节RNA结构域可通过有条件地形成终止子茎控制基因表达。类似地，有条件形成的茎可与SD序列重叠，从而在翻译水平调节基因(Winkler 2005)。

该研究中鉴定的一些基序由单个的或串联的发夹组成。有可能它们中的一些是这样的蛋白结合基序，即其中一种同源二聚体蛋白可结合于相对链中的基于DNA的既定元件。为了方便起见，纵使这样的基序可能不形成结构化RNA或者在mRNA水平发挥功能，它们也被描述为具有一种5′端调节构型。

ii.GEMM基序

GEMM广泛存在于细菌中并似乎具有高度保守的序列和结构，暗示了一种可对推定的RNA进行重要的生物化学限制的功能。在革兰氏阳性菌和革兰氏阴性菌中发现了322种GEMM序列。它在δ-变形细菌中是共有的，特别在地杆菌及相关属中。在γ-变形细菌中，它在交替单胞菌目和弧菌目中是普遍存在的。它在厚壁菌门和浮霉菌门的某些目中也是共有的。具有GEMM的主要病原体包括霍乱和炭疽的致病原。

GEMM由两个被命名为P1和P2的相邻发夹(配对区)组成(图1和3)。P1的序列和结构是高度保守的，并且由一个3核苷酸的内部环分隔的并被一个末端环加帽的2碱基对茎和6碱基对茎组成。所述内部环是高度保守的，所述末端环几乎总是GNRA四元环(Hendrix 1997)。该P1茎在多个位置呈现了相关变异的重要证据，并且在大范围的细菌中是结构高度保守的。该事实以及P2的更适度的相关变异和长度可变的茎提供了GEMM作为一种结构化RNA发挥功能的有力证据。实施例2证明GEMM基序在核糖开关中发挥功能。连接P1和P2的序列基本上总是AAA，在322个实例中仅有2个例外。

所述P2发夹显示了比P1更适度的保守型。如果P1四元环为GAAA，那么在P2种通常出现一个GNRA四元环受体。该受体经常为公知的11nt基序，该基序可能是GAAA环偏爱的，但一些序列可以是新的四元环受体。如果P1具有一个GYRA四元环，那么所述受体样序列几乎不存在，但是有时会出现一个距所述P2碱基更近的凸起(图2)。

许多GEMM实例包含一个依赖ρ的转录终止子发夹。终止子茎的5′侧经常与所述P2茎的3′侧重叠(并被推测与之竞争)(图2B)。如果GEMM是一种核糖开关，那么配体的结合可稳定提出的P1和P2结构，从而阻止所述竞争性转录终止子形成。在该模型中，较高配体浓度可增加基因表达。δ-变形细菌中三分之一的GEMM代表物及其他分类单位中的某些是“串联”排列的，其中一例出现在3′端并邻近于相同UTR中的另一个。这样的调节RNA的排列涉及比简单调节RNA构型所允许的更复杂的基因表达控制(Sudarsan 2006；Welz 2007；Mandal 2006)。

对GEMM生物功能的理解可有助于揭示它似乎进行调节的多种类的微生物过程。实际上，GEMM在物种霍乱弧菌和硫还原地杆菌中涉及已是多项研究目标的两个系统。霍乱弧菌可导致人霍乱，但其生命周期大部分时间在水中，它在水中可粘附于多种甲壳类的含几丁质的外骨骼上。几丁质为GlcNAc(N-乙酰葡糖胺)的聚合物，已被表明可影响多种霍乱弧菌基因的表达(Meibom 2004)。GEMM似乎调节这些几丁质诱导型基因中的2个的表达。第1个是gbpA，它不但对于小鼠的感染(Kirn2005)是重要的，而且对粘附于几丁质珠(Meibom 2004)和人上皮细胞(Kirn 2005)是重要的。

第二个几丁质诱导型基因是tfoX^VC。值得注意地，几丁质可诱导霍乱弧菌的天然感受态(Meibom 2005)，并且tfoX^VC表达对这种感受态是重要的。霍乱弧菌具有匹配CDD模型COG3070和pfam04994的两个基因，所述两个模型对应于分离的tfoX结构域。两个结构域都产生优于10^-25的RPSBLAST(Schaffer 2001)E-值。它们中之一是tfoX^VC(座位VC1153)。GEMM似乎可调节另一个，所述另一个被称作tfoX^GEMM(VC1722)。因此，在霍乱弧菌及相关细菌中，GEMM可能参与几丁质诱导的感受态，或甚至在不包含提高的几丁质浓度的环境中调节感受态。

硫还原地杆菌及相关δ-变形细菌可使用金属离子例如Fe(III)作为电子受体，通过氧化有机化合物生成ATP(Methé2003)。GEMM在地杆菌属种中与菌毛组装基因相关。硫还原地杆菌的菌毛已被显示可导电(Reguera 2005)，并因此是还原金属离子过程的一部分。

而且，GEMM在硫还原地杆菌中似乎调节7个细胞色素c基因。虽然该细菌有111个推定的细胞色素c基因，但7个GEMM相关基因中的5个已经在以前的研究中被鉴定，并且可能具有特殊的功能。OmcS(外膜细胞色素S)是在硫还原地杆菌外膜上高丰度的两种蛋白的一种，并且是还原不溶Fe(III)氧化物所需的，但非可溶的Fe(III)柠檬酸盐所需的(Mehta 2005)。OmcG和OmcH对于产生OmcB是必需的，OmcB在很多情况下是一种必需的细胞色素c(Kimm 2006)。OmcA和OmcT与OmcG、OmcH或OmcS相关联。在硫还原地杆菌中仅剩下4种其他Omc注释与GEMM无直接关联：OmcB、OmcC、OmcE和OmcF。

与已知核糖开关不同，GEMM与大量不同的基因功能相关联(表2)。该结果表明，GEMM核糖开关不作为用于代谢途径控制的典型的反馈传感器。相反，GEMM可感知一种参与信号转导或可能细胞-细胞通讯的第二信使分子(Bassler 2006)。实施例2证明了GEMM基序的第二信使触发分子为环二GMP。在该方式中，不同细菌使用GEMM及其信号传导分子来控制不同过程。许多GEMM相关基因编码信号转导结构域，这个事实表明了许多信号转导蛋白的调节机制。实施例2证明了GEMMRNA的确作为一类新发现的核糖开关的适体组件。

表2.在多个实例中显示出被GEMM调节的基因家族

iii.SAH基序

SAH基序的序列和结构是高度保守的(图1)，显示了预测的茎区(包括模块茎和长度变化茎)内的相关变异。主要在β-变形细菌和一些γ-变形细菌，特别是在假单胞菌属中，SAH基序出现在与SAH(S-腺苷高半胱氨酸)代谢相关的基因5′端调节构型中。SAH是S-腺苷甲硫氨酸(SAM)代谢循环的一部分，该代谢循环的主要组件包括氨基酸甲硫氨酸及其衍生物高半胱氨酸。SAH是使用SAM作为甲基化反应的辅因子的酶的副产物。SAH一般被水解成高半胱氨酸和腺苷。然后，高半胱氨酸被用于合成甲硫氨酸及最终的SAM。

高水平的SAH对细胞是有毒的，这是因为SAH可抑制许多SAM依赖的甲基转移酶(Ueland 1982)。因此，在SAH达到毒性水平之前，细胞可能需要感知其升高的浓度并除去该化合物。SAH基序相关的基因为S-腺苷高半胱氨酸水解酶(ahcY)、钴胺素依赖的甲硫氨酸合酶(metH)及可合成一个用于甲硫氨酸合成中的甲基供体的亚甲基四氢叶酸还原酶(metF)。SAH基序的这种基因排列及其高水平的保守与在感知SAH及激活基因产物为SAH破坏所需的基因的表达方面的作用是一致的。实际上，生物化学和遗传证据可支持该基序为SAH感知核糖开关的假设。

iv.COG4708基序

该基序出现于链球菌属的某些种及乳酸乳球菌的COG4708基因的上游，但是在链球菌属COG4708基因家族的某些实例中缺少该推定的RNA基序。COG4708基因被预测编码膜蛋白。

虽然COG4708基序(还可以将它称为prcQ₁-II基序)在系统发生方面被高度约束并仅具有6个独特的序列，但它却显示了相关变异、模块茎和长度可变的茎(图1)。该基序具有一个与COG4708基因Shine-Dalgarno序列重叠的假结，这表明所述基序编码这些基因的顺式调节子。

v.sucA基序

sucA基序仅出现于sucA基因的5′端调节构型中，它们可能与相关的下游基因sucB/aceF和lpd共转录。这3个基因的产物在柠檬酸循环中从2-酮戊二酸合成琥珀酰-CoA。所有检测的sucA基序的实例在β-变形细菌的伯克氏菌目中。虽然sucA基序中的许多核苷酸是严格保守的，但它们不显示相关变异并且包含很少的非标准碱基配对(图1)。该基序具有与推定Shine-Dalgarno序列重叠的茎，所以sucA基序可对应于一种顺式调节RNA。sucA基序相对复杂的结构表明它可以是一种核糖开关。

vi.23S-甲基基序

该基序总是在可作用于23S rRNA并被注释为rRNA甲基转移酶的基因的上游。一个例外是，23S-甲基RNA距离23S rRNA甲基转移酶ORF大约3Kb，在间插序列的相对链上有其他基因。23S-甲基基序局限于乳杆菌目，该目属于厚壁菌门。

23S-甲基基序由两个大的发夹组成。第二发夹以一串U结束，并可为一个依赖ρ的转录终止子。两个茎都具有显著的相关变异，这有力证明了它们为功能性RNA的一部分。虽然该结构模型表明许多配对的位置有时具有非标准的碱基配对，但是每个基序实例均主要由有利于能量的配对组成。推定的转录终止子的存在表明它是顺式调节RNA。由于23SrRNA甲基转移酶可与RNA底物相互作用，它可以类似于核糖体蛋白基因自身调节的方式使用该23S-甲基基序自动调节其表达(Zengel 1994)。

vii.hemB/反hemB基序

该基序出现于多种β-变形细菌尤其伯克霍尔德氏菌中。对于它可能从哪条DNA链转录是不清楚的，这是因为它的结构在两个方向都呈现相当的相关变异和保守。在一个方向上，它经常在hemB基因上游。它在该方向上可能是顺式调节RNA，但有两个互相不同源的基因紧接hemB基序代表物的下游，它们位于错误的链上而无法被以顺式调节RNA的通常方式控制。在另一个方向(反hemB)上，该基序通常地不在基因的5′UTR中。该反hemB基序以一个转录终止子发夹结束。反hemB实例下游的许多基因位于相对链上，因此表明反hemB可能编码一种非编码RNA。

viii.MAEB(伯克霍尔德氏菌中代谢相关元件)

该基序由具有数个保守位置的单个发夹组成(图1)。它广泛存在于β-变形细菌的伯克霍尔德氏菌属中。它一般通过保守连接子序列连接以多次连续出现(2-6个拷贝)，但在2例中达到12个拷贝之多。在141个单MAEB基序或重复MAEB基序的事件中，132个在基因的5′端调节构型中。实际上，这些基因的许多直接参与初级代谢(例如参与小分子生物合成、代谢或转运的基因)，而非诸如DNA修复、复制、信号传递或运动性的基因。在多于1例的MAEB下游的46个保守结构域(除去假设的基因)中，至少42例被注释为参与初级代谢。有许多细菌基因参与初级代谢，因此这些数据表明了一种与代谢基因控制的功能关联。

MAEB和细胞对丰富甘氨酸应答之间可存在关联。MAEB经常与gcvP和gcvT相关联，gcvP和gcvT为甘氨酸切割系统的一部分，其中过量甘氨酸被注入至柠檬酸循环中。MAEB还与数个柠檬酸循环基因相关联。然而，MAEB与一些与甘氨酸或柠檬酸循环相关性更弱的其他基因相关联。可存在一种与甘氨酸切割系统的相关性，这是因为最大的MAEB重复数目与该系统中的gcv基因相关。而且，存在至少一个可结合甘氨酸的核糖开关类，但是该类在具有MAEB的生物的每个基因组仅存在1个拷贝，这可使MAEB有甘氨酸调节的功能。

虽然MAEB基序的代表物呈现了保持碱基配对的相关变异，但其他成员携带破坏配对的突变。这个事实表明，事实上它可以是这样的一条DNA序列，即该DNA序列结合蛋白二聚体，使得每个蛋白单元结合相对链。在所述茎的两侧，对称位置的一对核苷酸都保守地为嘌呤(A或G)。由于嘌呤不能是Watson-Crick对，它们不可能同时出现在相对链上。虽然可预测DNA结合基序的实例可不同，但对称嘌呤暗示所述基序本身(并不仅这些实例)在相对链上具有不同模式。

ix.小ykkC基序

小ykkC基序由两个串联发夹组成，所述发夹的茎显示了显著的相关变异并且它们的环具有特征性的ACGR基序(图1)。小ykkC广泛存在于α-、β-和γ-变形细菌，另外的实例在其他类中。该基序被命名为小ykkC，这是因为它似乎是与以前描述的ykkC/yxkD基序(Barrick 2004)(下文称为“ykkC”)的基因类似的一组基因的顺式调节子。ykkC和小ykkC共有的所有8个保守结构域在下文列出。ykkC和小ykkC的结构显示不相关。

ykkC基序是一种能够高度结构化的且广泛保守的基序。然而，小ykkC的简单结构是大多数其他核糖开关没有的特征，但其广泛的系统发生表明了一种需要广泛保守的功能。小ykkC似乎为一种顺式调节元件，这是因为它与一组相对窄的基因功能相关联，并且它在这些基因的编码序列附近(90％在Shine-Dalgarno序列的33个核苷酸内)。小ykkC可起到与所述ykkC基序相同的功能，但用于控制基因表达的机制可以不同。可注意到有仅具有一个发夹的小ykkC的情况。

x.purD基序

purD基序出现在完全测序的ε-变形细菌(例如弯曲菌属和螺杆菌属(Helicobacter))所有purD基因中。purD基因编码GAR(磷酸核糖甘氨酰胺)合成酶，该合成酶参与嘌呤生物合成。purD基序显示了相关变异和模块茎，但它还呈现了一些破坏碱基配对的突变(图1)。

xi.6C基序

该基序广泛存在于放线菌门中，由两个发夹组成，其中每个发夹的环包含至少6个C的串。6C基序在其茎中呈现显著的相关变异。6C基序一般适度地靠近(200-300个核苷酸)被预测与染色体分配和菌毛组装相关的基因。

xii.转座子和切除酶相关基序

还发现了在α-变形细菌中的一种转座酶相关基序及在放线菌门中与Xis切除酶相关的另一基序。两种基序都主要由一个具有10至15个碱基对的茎的单个发夹组成。两种基序也都呈现了显著的相关变异，这表明它们可形成功能性的结构化RNA。所述切除酶基序在所述切割酶基因的5′端调节构型中。

xiii.ATPC基序

ATPC基序出现在某些蓝细菌的ATP合酶操纵子中位于编码A和C亚基的基因之间。ATPC基序例出现在所有测序的海洋原绿球藻(Prochlorococcus marinus)株中及一些聚球菌属(Synechococcus)种中。该基序主要由一个三茎交叉点组成。以前的研究已提出在蓝细菌ATP合酶操纵子中的发夹样结构，但非更复杂的形状，并位于距ATPC基序的不同位置(Curtis 1988)。

xiv.cyano-30S基序

该基序出现在某些蓝细菌中并在编码30S核糖体蛋白S1的基因的5′端调节构型中。它由两个互不相似的发夹和一个假结组成，所述假结中P1环中的5个核苷酸与紧接P2的3′端外的核苷酸进行碱基配对。虽然有破坏P1和P2中配对的数个突变，但在这些茎中还有许多补偿性突变。而且，所述假结中的配对有相关变异并存在于所有代表物中。

考虑到基因的前后序列，该基序可模拟下游核糖体蛋白基因的配体(Zengel 1994)，从而该基因的产物可调控它自己的表达。该cyano-30S基序的识别支持了这样的观点，即这样的RNA存在于在很多不同的门中。

xv.乳杆菌基序

lacto-1基序和lacto-2基序只限于乳杆菌目中。lacto-1基序具有一些相关变异，但一些突变会破坏碱基配对。一些实例与主发夹和Shine-Dalgarno序列之间的S(MK)(或SAM-III)(Fuchs 2006)核糖开关的可变区相交。lacto-2基序由具有许多内环的大发夹组成，其中的一些环具有高度保守的序列。虽然一些突变会破坏配对，但这是一种大量的相关变异，这表明lacto-2基序例是结构化RNA。

xvi.TD(齿垢密螺旋体)基序

两种预测基序在齿垢密螺旋体(Treponema denticola)中有数例，但没有在任何其他测序的细菌中发现。这些基序(TD-1和TD-2)分别有28和36个代表物。7个TD-1基序代表物与TD-2例的反向互补序列重叠，并共享两个5′-末端发夹。

两种基序都显示相关变异，以及长度变化的或模块的茎。TD-1基序通常在基因5′端调节构型中。TD-2基序不共享5′端调节构型，因此它可能对应于一种非编码RNA。

3.讨论

使用该基于CMfinder的比较基因组流程，发现了22种新的推定RNA基序。两种已被通过实验确证为核糖开关。对于其他的数种，相关变异和其他特征表明它们是功能性的结构化RNA，并已对许多这些基序提出了可能的功能。因此，该流程对于发现新RNA似乎是有用的。

这些结果表明基于CMfinder的流程能够发现这样的RNA，即这些RNA是广泛存在的，具有高度保守及广泛的二级结构，长度大约60个核苷酸或更长，并且与同源基因相关联。3种候选核糖开关具有这些特征(GEMM、Moco和SAH)。剩下的3种候选物——SAM-IV、COG4708基序和sucA基序——的分布比大多数已知核糖开关窄，这是因为在分类水平的单个的目以外均未发现这些基序。

B.实施例2：真细菌中的核糖开关类感知第二信使环二GMP

环二GMP是一种环形RNA二核苷酸，它作为第二信使发挥功能以在多个细菌的种中触发大范围的生理变化。控制的过程包括细胞分化、运动生活方式和生物膜生活方式之间的转换及毒性基因表达。然而，从20多年前发现环二GMP以来，该化合物用来调节基因表达的机制仍是未知的。数据表明，许多细菌种中的环二GMP被这样的一类核糖开关感知，即该核糖开关类可控制参与多个基本细胞过程的基因的表达。发现了许多种的环二GMP调节子，包括一些与毒性基因表达、菌毛形成和鞭毛细胞器生物合成的核糖开关。另外，与环二GMP核糖开关共有序列匹配的序列存在于噬菌体基因组中。

第二信使环二GMP(图3A)被发现可作为来自细菌木葡糖酸醋杆菌(Gluconacetobacter xylinus)的纤维素合酶的激活剂(Ross 1985；Ross1987)。后续的研究揭示了环二GMP在细菌中几乎是普遍存在的，其中它对细胞生理具有广泛的效应(Jenal 2006；Ryan 2006；Tamayo2007)。环二GMP是一种环形的RNA二核苷酸，它通过具有GGDEF氨基酸结构域特征的二鸟苷酸环化酶(DGC)由鸟苷-5′-三磷酸分子形成。一旦形成后，该化合物被包含EAL或HD-GYP氨基酸结构域的磷酸二酯酶(PDE)选择性地降解(Jenal 2006；Ryan 2006；Tamayo 2007；Simm2004及本文的参考文献)。包括病原体霍乱弧菌的许多细菌的种具有许多种不同的DGC和PDE蛋白(Galperin 2001；Ulrich 2005；

2005)。这些蛋白的活性被特定的刺激激发，以调节细胞环二GMP浓度(

2005)，并且该第二信使在霍乱弧菌中的浓度变化已知可控制粗糙性、生物膜形成和毒力(Lim 2006c；Beyhan 2007；Tischler 2005；Waters 2008)。

环二GMP用来在细菌中引起多种生理变化的机制长期以来一直是不清楚的。除了被切割环二GMP的PDE靶向之外，该第二信使可被一些DGC蛋白结合以变构地抑制其自身的合成(Chan 2004；Wassman2007)。唯一已知的其他蛋白靶是木葡糖酸醋杆菌纤维素合酶(Ross 1985；Ross 1987)，绿脓假单胞菌PelD蛋白(Lee 2007)和PilZ结构域蛋白(Ryjenkov 2006)。然而，环二GMP与这些蛋白的结合没有完全地解释这种全局性细胞效应(Tamayo 2007；Wolfe 2008)。因此，仍然需要发现环二GMP的关键调节靶。

环二GMP的核糖开关.已经假设(Tamayo 2007)环二GMP核糖开关的存在可能用来解释该第二信使怎样控制许多基因的转录和翻译。最近报道了对某些生物中紧接DGC和PDE蛋白开放阅读框(ORF)上游被称为GEMM的高度保守的RNA结构域的识别(Weinberg，2007)。该RNA结构域还经常与很可能受环二GMP控制的基因相关联。GEMMRNA的高度保守和基因组分布是这样的代谢物感知核糖开关的特征，即该核糖开关可控制对它们的靶配体浓度改变进行应答的基因表达(Winkler 2005；Breaker 2008(Science))。

GEMM RNA符合被称为1型和2型的两种相似结构(图3B)中的一种。两种类型都携带两个碱基配对区(P1和P2)，所述碱基配对区在识别的503个代表物中呈现广泛相关变异(Weinberg，2007)。1型RNA(303个实例)在P1上具有一个在第二位上为嘌呤(R)的GNRA四元环(Heus 1991)。GRRA序列的存在与在P2远端存在一个四元环受体相关，已知所述四元环受体可容纳该四元环类型(Costa 1995)。相反，2型RNA(171个实例)在所述四元环的第二位置具有一个嘧啶(Y)，并且在一些例中P2上包括一个有利于容纳GYRA四元环的结构(Costa 1995)。另外有29个未分类的代表物，其中24个携带一个以非配对核苷酸为侧翼的GNRA四元环，5个缺乏四元环序列。

GNRA四元环和它们的受体一般出现在结构化RNA中，并且在以前在核糖开关适体中被发现(Regulski 2008)。然而，P1和P2发夹顶端的序列和结构变异性表明，环二GMP的任何结合位点可能位于携带最保守特征的中央部分或底部分。

GEMM RNA可选择性地结合环二GMP.病原菌霍乱弧菌的基因组在不同染色体上携带两个GEMM RNA序列。在I号染色体上，1型GEMM RNA(被命名为Vc1)位于霍乱弧菌gbpA基因的上游，gbpA基因编码结合几丁质或其基本单体单元N-乙酰-D-葡糖胺的蛋白因子。GbpA已被发现参与人的霍乱感染(Kirn，2005)。在II号染色体上，另一个1型RNA(被命名为Vc2)位于一个与tfoX同源的基因(VC1722)的上游(Mandal 2003；Meibom 2005)。tfoX基因(在一些生物中被命名为sxy；Cameron 2008)编码一个负责调节这样的基因的因子，即这些基因在霍乱弧菌暴露于几丁质时可提高感应性。考虑到这种序列相似性，VC1722蛋白还可能作为一转录因子发挥功能。

以两个GEMM RNA进行生物化学分析和遗传分析，以确定它们是否作为环二GMP的适体发挥功能。在不存在或存在100μM环二GMP的情况下对110-核苷酸Vc2 RNA构建体(图3D)进行直读探测(Soukup1999)(110 Vc2；图3C)。在茎P1和P2的基部的自发切割模式变化表明，在发生结构调变的区域(标记为1至3)附近保守核苷酸对于第二信使结合是重要的。从涵盖Vc1 RNA的结构体及从来自蜡样芽胞杆菌和艰难梭菌(Clostridium difficile)的代表性环二GMP适体得到了类似的结果。

通过以多种环二GMP浓度对110 Vc2 RNA进行的直读探测，确立了一个大约1nM的表观解离常数(K_D)。所形成曲线(图4A)与在RNA适体及其配体之间的1比1饱和相互作用是一致的(Welz 2007)。虽然所述适体可结合多种已报道的多聚环二GMP复合体(Egli 1990；Zhang 2006)中的一个，但这些分子间环二GMP复合体的形成出现在远高于测量K_D值的浓度下。而且，当直读探测反应中的K⁺被Na⁺代替时没有出现K_D的变化，纵使这些单价金属可影响形成的该类环二GMP复合体。

在110 Vc2适体和环二GMP之间形成的复合体比对大肠杆菌PilZ蛋白结构域(K_D＝840nM；Ryjenkov 2006)结合环二GMP所测量的亲和性高3个数量级。而且，Vc2适体对所述第二信使的多种类似物的作用显著不同(图4B)。通过所试验的类似物可知，所述第二信使的环形结构及其鸟嘌呤核碱基似乎对于配体识别有重要作用。例如，环二GMP通过EAL PDE的线性分解产物(被命名为pGpG)被所述适体结合的强度几乎低3个数量级。类似地，甚至在比环二GMP的K_D高5个数量级的浓度下，HD-GYP PDE的pG(5′GMP)产物都未被所述适体结合。因此，该适体类的生物相关配体似乎是环二GMP，而不是该第二信使的分解产物。

环二GMP是一种包括两个结构受限的3′，5′-磷酸二酯键的RNA二核苷酸(图3A)。在一些情况下，具有受限几何形状的核苷酸间键合可呈现出加速的RNA链切割(Soukup 1999)。为了评估环二GMP在直读探测条件下是否稳定，测定了它自发降解的速率常数。在直读探测条件下，环二GMP以3.2×10^-6分钟^-1的速率常数被切割(图4C)，这相当于约150天的半衰期。该速率常数类似于对存在于自由线性多核苷酸中的RNA键在孵育于类似条件下时预测的速率常数(Li 1999)。因此，所述第二信使可能在直读探测测定中是稳定的，并且甚至细胞中都更为稳定，除非有PDE酶的作用。

环二GMP核糖开关的基因控制.细菌的核糖开关一般携带一个紧挨一个不很保守的表达平台上游的保守适体。细菌中大多数的表达平台可形成控制转录终止或翻译起始的结构(Barrick 2007)。类似的构架与许多GEMM RNA代表物相关，表明环二GMP适体很可能是核糖开关的组件。

选择来自霍乱弧菌、蜡状芽孢杆菌和艰难梭菌的4个5′UTR来评估环二GMP适体是否在体内作为核糖开关的感知结构域发挥功能。对于Vc2，将包含预测的固有启动子、适体或其变体的DNA(图5A)和邻接的表达平台用于制备与大肠杆菌lacZ报告基因的翻译融合物。将携带适体-报告物融合构建体的转基因大肠杆菌细胞在液体培养基中培养，并测定β-半乳糖苷酶活性。

携带所述野生型(WT)Vc2适体的报告物构建体呈现了高水平的基因表达(图5B)。相反，携带破坏P1的突变或改变P2凸起中严格保守核苷酸的突变的构建体M1和M3以低于WT的10％的水平表达所述报告基因。此外，携带可恢复P1结构的4个突变的适体(M2)呈现出接近WT的基因表达。这些结果表明，整合Vc2适体的核糖开关作为一个“开启”开关通过激活邻接ORF的翻译发挥功能。类似地，对来自蜡状芽孢杆菌(Bc1和Bc2)和艰难梭菌(Cd1)的环二GMP核糖开关制备转录融合物。WT和M3变体的表达模式与Bc1的“开启”开关功能及Bc2和Cd1的“关闭”开关功能是一致的(图5B)。

变化的环二GMP浓度可调变核糖开关介导的基因表达.环二GMP核糖开关对基因表达的调变通过如下方式确立：检查Cd1 RNA的“关闭”开关作用，同时操作所述第二信使的细胞浓度。环二GMP浓度受表达霍乱弧菌vieA基因产物的调变。VieA是一种EAL磷酸二酯酶(PDE)，该酶被预测通过促进所述第二信使水解成其线性pGpG形式来降低环二GMP的细胞浓度(Li 1999)。预测如下这样的细胞可保持对在所述条件下培养的细胞来说正常的环二GMP浓度，即这种细胞携带空白载体或表达具有消除PDE活性的突变E170A的VieA蛋白(Tamayo 2005)。

在与空质粒载体或者编码无活性E170A VieA突变体的载体共转化时，携带WT Cd1核糖开关与lacZ的转录融合物并在具有X-gal的琼脂板上培养的转基因枯草芽孢杆菌细胞呈现出低的β-半乳糖苷酶活性(图6A)。相反，在以所述报告物构建体和编码VieA PDE的载体共转化的细胞中出现了强β-半乳糖苷酶活性。当从液体培养物中测定这些转基因细胞时观察到类似的趋势，而在所述Cd1适体中携带M3突变的报告物构建体很大程度上保持不受vieA表达影响(图6B)。这些结果再次与所述Cd1核糖开关的“关闭”开关功能一致，其中所述PDE的作用是通过降低细胞中环二GMP浓度减轻遏制作用。

环二GMP核糖开关在多种细菌中的作用.虽然霍乱弧菌仅具有两个环二GMP核糖开关代表物(图7)，这些RNA的生理作用是显著的。与Vc1核糖开关相关的gbpA基因产物是一种糖结合蛋白，该蛋白被报道是使该细菌在哺乳动物肠定殖、导致霍乱疾病的关键性决定物(Kirn，2005)。已表明，霍乱弧菌在定殖于哺乳动物宿主肠时可降低其环二GMP水平(Tamayo 2005)。在本研究中用于证明对环二GMP水平变化应答的Cd1核糖开关(图6A)的霍乱弧菌vieA基因已知是细菌感染必需的。因此由VieA的作用带来的环二GMP水平降低可能被Vc1核糖开关感知，以有利于GbpA的表达及霍乱弧菌感染。

与所述Vc2核糖开关相关的VC1722基因编码类似于已知对感受态重要的转录因子的蛋白(Meibom 2005)。前人已经表明，产生粗糙表型的霍乱弧菌突变体具有升高的环二GMP水平，并呈现较高的VC1722mRNA表达(Lim 2006c；Beyhan 2007)。这与如下这样的数据是一致的，即该数据表明了与VC1722 mRNA相关的Vc2核糖开关是当环二GMP浓度升高时产生较高基因表达的基因“开启”开关(图5B)。

一些生物具有显著高数目的环二GMP核糖开关代表物(图7)。具有30个已识别的代表物的铀还原地杆菌(Geobacter uraniumreducens)在已被基因组测序的细菌种中具有最大数目的环二GMP适体RNA。它们分布在25种不同转录单元的上游，具有5种携带串联环二GMP适体的RNA。已发现，一些协同性地结合两个氨基酸的甘氨酸适体有类似的串联排列(Mandal 2004c)。然而，更常见的串联排列涉及对相同配体应答的完整核糖开关(Welz 2007；Sudarsan 2006)。两种串联构架排列都使核糖开关对更小的配体浓度变化更敏感地发生反应(Welz 2007)，并作为更数字化的基因开关发挥功能。

虽然与许多环二GMP核糖开关相关的基因功能是未知的，但是艰难梭菌中的数个代表物的位置是值得注意的(图7)。Cd1核糖开关是一种位于这样的大操纵子5′UTR中的基因“关闭”开关(图5和6)，所述大操纵子即该大操纵子编码构建该物种的整个鞭毛装置所需的蛋白。这种排列表明，一些细菌使用核糖开关来感知环二GMP浓度的变化并调节细胞器生物合成，以控制运动与固定生活方式转换。

还引人注意的是对存在于整合至艰难梭菌基因组内的PhiCD119噬菌体DNA中的环二GMP核糖开关代表物的识别。位于所述噬菌体基因组溶菌模块中的所述核糖开关序列还明显出现在被包装于噬菌体颗粒的DNA中(Govind 2006)。虽然已经报道了超过20个代谢物感知核糖开关类别，并且已经鉴定了这些类的数千个代表物，但环二GMP RNACd2、Cd12及来自噬菌体的相关RNA是噬菌体相关核糖开关仅有的已知实例。病毒也许很少需要感知基本的代谢产物，但有可能通过监测第二信使环二GMP浓度改变带来的细菌细胞的生理转换而获得进化优势。

1.材料和方法

i.生物信息学

通过使用已经确立的多序列比对(Weinberg 2007)进行额外的同源性搜索来扩大已知的环二GMP核糖开关的组。这些搜索是使用RAVENNA(Weinberg 2006)对RefSeq版本25(Pruitt 2005)的微生物序列以及如下来源的环境序列进行的：矿井排水(Tyson 2004)、土壤及鲸沉积物(Tringe 2005)、人消化道(Gill 2006)、小鼠消化道(Turnbaugh 2006)、无肠海虫(Woyke 2006)、污泥群落(Garcia Martin2006)和全球海洋勘查(global ocean survey)(Venter 2004；Rusch 2007)。使用以前确立的方法(Weinberg 2007)计算反映在共有序列图(图3)中的保守统计。使用来自RefSeq和DOE联合基因组研究所(JointGenome Institute)或全球海洋勘查的基因注释生成图7。基于保守结构域数据库(Marchler-Bauer 2005)版本2.08进行基因分类。

ii.寡核苷酸、化学物、质粒和细菌株

DNA寡核苷酸购自Sigma-Genosys或耶鲁大学的W.M.Keck基金生物技术资源实验室(Foundation Biotechnology Resource Laboratory)。环二GMP、pGpG和3′，5′-环GMP购自BioLog生命科学研究所(LifeScience Institute)(Germany)，3′-鸟苷单磷酸购自MP Biomedicals。ApG、GpG、GpA、pGpA和GpGpG购自Oligos Etc。所有其他化学品购自Sigma-Aldrich。

pDG1661和pDG148获自杆菌品种中心(Bacillus Genetic StockCenter)(BGSC；俄亥俄州立大学(The Ohio State University))。pRS414由Dr.R.Simons(UCLA)馈赠。霍乱弧菌O1生物变型eltor株N16961基因组DNA由Dr.B.Bassler(Princeton U.)提供。枯草芽孢杆菌株1A1、蜡状芽孢杆菌株6A5(ATCC 14579)和蜡状芽孢杆菌株6A15(ATCC10987)也获自BGSC。ATCC菌株9689的艰难梭菌基因组DNA来自ATCC。感受态DH5-α大肠杆菌购自New England Biolabs。

iii.环二GMP降解的动力学

在存在直读探测缓冲物(50mM Tris-HCl[pH 8.3，23℃]，100mMKCl，20mM MgCl₂)的情况下将500μM环二GMP溶液孵育多个时长。通过添加环二GMP起始反应，并且当将10μL的整分试样注入至一个装配有Agilent Zorbax Oligo柱(5μM，6.2mm×80mm)的AgilentTechnologies 1200系列HPLC上时淬灭反应。使用由95％0.1MNaHPO₄[pH 6.0，23℃]和5％的乙腈至100％的1M NaCl组成的梯度流动相洗脱所述化合物。在254nm下监测吸光度。通过将剩余未切割的环二GMP部分的自然对数相对于时间作图确立环二GMP的速率常数，其中所形成线的负斜率可反映所述速率常数。

iv.环二GMP类似物的纯度分析和完整性

使用Agilent Technologies 1200系列HPLC监测洗脱化合物在254nm下的吸光度，检查环二GMP的二核苷酸类似物和三核苷酸类似物的纯度。通过使用95％水、5％乙腈和0.1％三氟乙酸至100％乙腈和0.1％的三氟乙酸的梯度流动相的Agilent Extend C18柱(3.5μM，4.6mm×150mm)分离所述化合物。HPLC跟踪表明，50％-95％的UV吸收物质对应于所需的类似物。

对每个类似物进行高分辨率质谱分析，以确认它们的准确质量。对C₂₀H₂₅N₁₀O₁₁P(GpA)计算的HRMS(ES)及建立的(M-H)^-：612.1442、611.1375；C₂₀H₂₅N₁₀O₁₁P(ApG)：612.1442、611.13723；C₂₀H₂₅N₁₀O₁₂P(GpG)：628.1391、627.13207；C₂₀H₂₆N₁₀O₁₄P₂(pGpA)：692.1105、691.10410；C₃₀H₃₇N₁₅O₁₉P₂(GpGpG)：973.1865、972.1825及(M-2H)^-2485.58597。

v.RNA的制备

DNA模板的制备是通过PCR扩增进行，使用了野生型或突变pRS414质粒DNA与这样的引物，即这些引物在转录起始位点添加T7RNA聚合酶(T7 RNAP)的启动子序列和两个鸟嘌呤残基以提高RNA产率。RNA分子的制备是通过体外转录进行，在20mM Tris-HCl(23℃下，pH 8.0)、20mM NaCl、14mM MgCl₂和100μM EDTA中使用了合适的DNA模板和T7 RNAP。在变性(8M脲)10％聚丙烯酰胺凝胶上纯化RNA，并在10mM Tris-HCl(23℃下，pH 7.5)、200mM NaCl和1mM EDTA(pH 8.0)中从所述凝胶洗脱RNA。将RNA以乙醇沉淀，使用碱性磷酸酶(Roche Diagnostics)脱磷酸化，并使用[γ-³²P]ATP和T4多核苷酸激酶(New England Biolabs)依照制造商的方案标记5′端。如上所述对标记的RNA进行凝胶纯化。

vi.直读探测

使用类似于以前描述的方法(Soukup 1999)进行直读探测测定。简而言之，在20mM MgCl₂、100mM KCl和50mM Tris(23℃下，pH 8.3)中将5′³²P标记的RNA(环二GMP K_D测定约50pM，所有其他测定约5nM)与指定化合物在23℃下孵育大约40小时。将RNA切割产物通过变性10％PAGE分离，使用Phosphorimager(Molecular Dynamics)显示，并且使用SAFA v1.1软件(Das 2005)或ImageQuant(MolecularDynamics)分析。将SAFA软件用于标准化，以修正每一泳道上加样的RNA量的差异，并且确定每条带的强度。将强度表现出显著变化的带鉴定为发生结构调变。

为了确定110 Vc2对环二GMP的K_D，以多种浓度的环二GMP进行上述的直读探测。由于使用了浓度格外低的放射标记110 Vc2 RNA，所以在所上样的样品中补充已经被单独地经过直读探测的另外的未标记RNA。这降低了非特异地结合于凝胶基质的放射标记RNA的量并在成像过程中提高带分辨率。使用ImageQuant软件(Molecular Dynamics)确定离解常数(K_D)以比较结构调变位点的个体带强度，假定在没有配体时无调变并且在最高试验配体浓度时具有完全调变。离解常数的确定是通过将调变的部分(F)相对于在标明的调变位点的配体浓度的对数[L]作图，并使用SigmaPlot 9(Systat Software)将数据拟合于方程F＝[L]/([L]+K_D)。

vii.质粒和细菌株的制备

将Vc2——COG3070(Tfox样基因)的5′UTR——从霍乱弧菌基因组DNA扩增为EcoRI-BamHI片段，克隆至翻译报告载体pRS414中，并使用类似于以前描述的方法(Nahvi 2002)确立其在大肠杆菌中的基因控制功能。具体地，将相对于该ORF起始的-348nt至+21nt区域克隆为lacZ报告载体中的翻译融合物，其中COG3070 ORF的第7密码子与lacZ报告基因的第9密码子在阅读框内融合。使用QuikChange定向诱变试剂盒(Stratagene)依照制造商的说明从该质粒生成调节区中的突变。

通过PCR将蜡状芽孢杆菌和艰难梭菌中推定的ORF上游的5′UTR区扩增为EcoRI-BamHI片段，克隆至载体pDG1661中以得到和无启动子lacZ基因的转录融合物。所扩增的片段包含UTR上游的预测启动子元件及与相应基因上游核糖开关相关的转录终止子。将所形成的构建体整合入以前描述的枯草芽孢杆菌的amyE座位(Sudarsan 2003)中。使用上述的定向诱变生成突变构建体。

通过PCR从基因组DNA扩增霍乱弧菌环二GMP特异性磷酸二酯酶基因(vieA)。使用以前描述的不依赖于连接作用的克隆过程(Joseph2001)，将vieA基因克隆至位于改良pDGl48载体中Pspac启动子下游的stuI位点中。该载体中的lacI基因已被突变，使得所述vieA基因被预测进行组成型表达。使用如上述的定向诱变形成vieA敲除突变体E170A。

viii.β-半乳糖苷酶测定

将野生型和突变Vc2-pRS414构建体转化至感受态NEB 5-α(NewEngland Biolabs)大肠杆菌细胞中。将各个集落在含50μg/mL羧苄青霉素的Luria-Bertani肉汤中于37℃下摇晃培养过夜。将培养物稀释至OD₆₀₀为约0.1并培养至OD₆₀₀为约0.6，然后依照标准步骤进行β-半乳糖苷酶测定(Miller 1992)。将以含Bc1、Bc2和Cd1的pDG1661转化的枯草芽孢杆菌株的过夜培养物传代培养至OD₆₀₀约0.2并接着培养大约3小时至OD₆₀₀为约1，然后进行如上述的β-半乳糖苷酶测定。

通过在37℃下培养划线细胞至少16小时，使用上述的转基因枯草芽孢杆菌细胞在固体琼脂平板上进行基因表达测定。根据需要，琼脂(TBAB)含有400μg mL^-1 X-gal以及5μg mL^-1的氯霉素和/或卡那霉素。

C.实施例3：感知S-腺苷高半胱氨酸及激活参与辅酶循环的基因的核糖开关

在许多革兰氏阳性菌和革兰氏阴性菌的细菌种中已经鉴定了出现在参与S-腺苷-L-甲硫氨酸(SAM)循环的基因上游的高度保守RNA基序。该基序代表物的系统发生分布和保守的结构特征可指示核糖开关功能。核糖开关是广泛存在的代谢物感知基因控制元件，通常出现在细菌mRNA的5′端非翻译区(UTR)。该RNA基序的实例被鉴定出可在无蛋白的体外测定中特异地识别S-腺苷高半胱氨酸(SAH)，并且已经确认这些RNA明显区分出SAM及其他紧密相关的类似物。已经发现，一个代表性的SAH基序当结合代谢物时可在体内激活下游基因的表达。这些结果确认了SAH基序RNA不同于如下这样的核糖开关类别的配体结合适体，即该类核糖开关可选择性地结合SAH及控制对于循环所消耗的SAM辅酶必要的基因。

RNA适体是高度结构化的多核苷酸，可形成对具体配体的选择性结合袋(Gold et al.，1995；Osborne and Ellington，1997)。工程化的适体可被制备成对它们靶呈现高亲和性和选择性，并且具有相当大可能性可被应用于基础研究、生物技术和治疗中(Breaker，2004；Bunka and Stockley，2006)。RNA适体还天然出现在许多细菌信使RNA的5′UTR中，它们在此作为被称作核糖开关的基因控制元件的感受器结构域(Mandal andBreaker，2004a；Soukup and Soukup，2004；Winkler and Breaker，2005)。与其工程化对应物类似，天然适体可以高亲和性和特异性结合它们的靶，这是细胞使用的RNA适体精确地调节关键代谢基因的表达所需的。然而，天然适体一般远远大于(在34和200个核苷酸之间变化)工程化的适体(Breaker，2006)，这可能使得天然适体呈现与由蛋白构成的基因控制因子竞争所需的高水平的性能。

每个核糖开关通常均通过适体结构域控制代谢物结合，以带来邻接的表达平台中的结构变化。这些结构变化可确立来自所述开放阅读框(ORF)或位于下游的多个ORF的蛋白生产水平。然而，代谢物结合不是总能带来折叠变化。例如，一个核糖开关类可将所述靶代谢物用作其作用是抑制下游ORF表达的自切割核酶的辅酶(Winkler et al.，2004；Cochrane et al.，2007)。不管所使用的机制如何，核糖开关经常可控制如下这样的基因，即这些基因的蛋白产物参与至其细胞浓度被所述适体结构域感知的代谢物或代谢物前体的合成、降解或转运中。

除非涉及修饰的碱基或支持蛋白因子，否则核糖开关适体必须使用仅4个常规核苷酸形成它们的靶代谢物的精确结合口袋。这对每种适体施加了很大的选择压力，以在整个进化中保持某些结构特征，但一些配体例如SAM(Corbino et al.，2005；Fuchs et al.，2006)和preQ₁(Weinberget al.，2007)可被具有完全不同适体结构的多核糖开关类检测。从甚至远亲缘生物鉴定出的核糖开关适体类的代表物可呈现相当保守的序列和二级结构。这种保守性以及被所述适体结合的配体具体种类形成了将核糖开关组织成不同类的基础。

核糖开关适体的保守特征已被计算机辅助搜索算法利用，以扩大已知核糖开关类的代表物的数目(例如Rodionov et al.，2002；Rodionov etal.，2003a；Nahvi et al.，2004；Rodionov et al.，2004)，以及以发现以前未知的核糖开关类(例如Rodionov et al.，2003b；Barrick et al.，2004；Corbino et al.，2005；Weinberg et al.，2007)。相反，表达平台的序列和结构变化很大，甚至在相同核糖开关类中也是这样。例如，TPP核糖开关可整合具有不同表达平台构架的共有适体，以在细菌中控制转录终止和翻译起始(Winkler et al.，2002；Mironov et al.，2002；Rentmeister et al.，2007)，及在真核生物中控制RNA剪接(Sudarsan et al.，2003a；Kuboderaet al.，2003；Bocobza et al.，2007；Cheah et al.，2007；Wachter et al.，2007)。

如上文指出的，具有来自不同结构类的适体的核糖开关可识别相同靶代谢物。已经发现了特异性识别辅酶SAM(或AdoMet)的4个核糖开关类，它们被命名为SAM-I(Epshtein et al.，2003；McDaniel et al.，2003；Winkler et al.，2003)、SAM-II(Corbino et al.，2005，Lim et al.，2006b)、SAM-III或S_MK(Fuchs et al.，2006)以及SAM-IV(Weinberg et al.，2007；未发表数据)。在这些类中，SAM-I核糖开关具有最广泛存在的已知系统发生分布，在许多细菌组中都有其实例(Rodionov et al.，2004)。SAM-II核糖开关大量出现在革兰氏阴性的变形细菌和拟杆菌中(Corbino et al.，2005)，而SAM-III核糖开关仅被报道在革兰氏阳性菌乳酸菌中(Fuchs et al.，2006)。所有所述4类适体对SAM结合都优先于SAH(或AdoHcy)，SAH是SAM依赖的甲基转移的副产物(Takusagawa et al.，1998)。例如，SAM-I和SAM-II适体的代表物对SAH的结合力分别低约80倍和超过1000倍(Lim et al.，2006b)。考虑到所述化合物仅相差一个单甲基，这种差异水平是显著的。

此处描述了对如下这样的细菌RNA元件的发现，即该RNA元件具有高度保守的一级序列和二级结构，并总是出现在负责将SAH转换成L-甲硫氨酸的基因的上游。所述RNA元件代表一个不同的适体类，该适体类可选择性地结合SAH并且与SAM相差至少1000倍，这完全不同于所述4种已知SAM适体的分子识别特征。在细菌丁香假单孢杆菌的ahcY mRNA中，由代谢物结合SAH适体带来的结构变化可在体内激活下游基因的表达，这证明了所述SAH适体可形成SAH应答性核糖开关独特类的感知组件。

1.结果

i.与SAH循环相关的保守RNA基序的鉴定

在鉴定另外的核糖开关类和其他结构化调节RNA基序的尝试中，使用CMfinder比较基因组流程(Yao et al.，2007)在多种细菌类中进行了基因家族的基因间区(IGR)的系统搜索(Weinberg et al.，2007)。使用该搜索策略在细菌中鉴定了多种RNA基序，并且数个具有预测的作为代谢物感知核糖开关起作用的RNA的特征。

一种候选核糖开关被命名为SAH基序，这是因为大多数通常与该RNA的代表物相关的基因为S-腺苷高半胱氨酸水解酶(ahc Y，COG0499)、钴胺素依赖的甲硫氨酸合酶(metH，COG1410)和亚甲基四氢叶酸还原酶(metF，COG0685)(图8)。SAH基序代表物的基因组前后序列及它们高度的保守情况与以下的作用是一致的：感知SAH并激活其产物是SAH循环以再合成SAM所需的基因的表达。SAM依赖的甲基化反应(Takusagawa et al.，1998)的SAH副产物可以类似于SAM甚或比SAM更大的亲和力结合于多种SAM依赖的甲基转移酶，因此作为这些酶的一种强抑制剂发挥功能(Ueland，1982)。在甲基转移酶高活性的时间过程中，除非SAH被转变成较低毒性的产物，否则细胞可能会积聚毒性水平的SAH。因此，快速感知SAH及激活再循环SAH以更新SAM的基因很重要。

在真细菌中有两种主要的SAH分解代谢途径，它们都将SAH转换成高半胱氨酸(图8)。在许多细菌的种中，SAH核苷酶(EC 3.2.2.9)可催化SAH的N-糖苷键断裂，以产生腺嘌呤和S-核糖基高半胱氨酸(Della Ragione et al.，1985)。后一种化合物随后可被luxS的基因产物水解，以形成高半胱氨酸(Schauder et al.，2001)。另一种途径涉及通常与SAH基序代表物相关的ahcY基因。SAH水解酶——ahcY基因的产物——可催化SAH的硫醚键断裂以产生腺苷和高半胱氨酸(Shimizuet al.，1984)。随后使用5-甲基四氢叶酸(5-甲基THF)作为甲基供体，metH的基因产物将高半胱氨酸甲基化成L-甲硫氨酸(Old et al.，1988)，5-甲基THF由metF的基因产物从5，10-甲基THF生成(Sheppard，1999)。由metK基因编码的SAM合酶从甲硫氨酸和ATP再生成SAM，以完成该循环(Tabor and Tabor，1984)。有趣地注意到，所述metK基因在β-变形细菌和γ-变形细菌的一些种中位于SAH RNA基序的邻近上游，并且可以在相同操纵子中。在发现所述保守RNA元件的基因组中没有鉴定出luxS基因产物(COG1854)的同源物，因此SAH在这些生物中的分解代谢可仅仅通过涉及SAH水解酶的途径进行。

总体来说，出现了95个与修改的结构模型相符的SAH RNA基序，并且这些匹配中的68个是非双份重复的。除了从环境序列或者从与该RNA基序相邻的基因身份未知的未完全测序的基因组鉴定的那些之外，所有被鉴定的SAH RNA基序实例都与SAH循环基因邻接。在大多数情况下，SAH RNA代表物位于似乎是这样的操纵子的上游，即这些操纵子几乎无例外地编码SAH水解酶(ahcY)、亚甲基四氢叶酸还原酶(metF)及有时编码甲硫氨酸合酶(metH)。在伯克霍尔德氏菌、脱氯单胞菌和雷尔氏菌(Ralstonia)的一些种中，所述操纵子包括一种未知功能的预测膜蛋白(COGl950)。其他很少出现在SAH RNA相关操纵子中的基因包括那些编码rRNA甲基化酶(COG1189)、感受态特异性基因的调节物(tfoX，COG3070)和涉及鸟苷多磷酸代谢的酶(spoT，COG0317)的基因。

基于比对中的68个非双重复序列构建了RNA基序的共有序列和结构模型(图9A)。该共有RNA基序由一个以被命名为P1和P2的碱基配对区域为侧翼的高度保守核苷酸中心构成，其中P2的帽端是一个序列可变的环(L2)。该RNA还在所述中心和该RNA的3′末端高度保守核苷酸之间形成一个假结(P4)。在某些代表物的P1茎和P4茎之间出现一个发夹(P3和L3)。所述二级结构元件都得到相关变异的支持。

除了β-变形细菌和γ-变形细菌之外，匹配该共有序列和结构的RNA实例还出现在δ-变形细菌的一个种及在一些革兰氏阳性放线菌门中(图9B)。该RNA元件在大多数生物中都出现一次，例外的是嗜酸菌属种(Acidovorax sp.)、芳香脱氯单胞菌、固氮弧菌属种(Azoarcus sp.)、Polaromonas naphthalenivorans、极地单胞菌属种(Polaromonas sp.)、铁还原红育菌(Rhodoferax ferrireducens)和胶状红长命菌(Rubrivivaxgelatinosus)，它们中在位于不同的基因组区域的预测ahcY和metH编码序列两者的前面鉴定到2次。

ii.所述68 metH RNA对SAH的选择性结合

SAH RNA的结构特征和基因组排列表明，它们可作为感知SAH的核糖开关的适体。寻找了这样的RNA基序实例，即这些实例可在无蛋白的体外系统中特异性地识别代谢物及发挥基因控制元件的功能，这些是核糖开关的两个定义特征。选择了一个包含在芳香脱氯单胞菌metH基因上游被鉴定的SAH RNA的68核苷酸RNA(命名为68 metH，图10A)。芳香脱氯单胞菌68 metH RNA差不多是几乎对应于该基序的共有序列和结构的最短序列。它长度的缩短部分地是由于不存在任选的P3茎(图9A)。

将直读探测测定(Soukup and Breaker，1999)用于确认预测的二级结构(图10A)，及用于确定68 metH RNA与SAH直接结合。该测定利用了这样的事实，即RNA的自发切割在未结构化的核苷酸间键合处出现得更快，从而可显示RNA的结构特征及它们在结合配体时发生的变化。将5′端³²P标记的68 metH RNA孵育在包含浓度逐渐升高的SAH的反应中，通过聚丙烯酰胺凝胶电泳分离所形成的自发切割产物(图10B)。在不存在任何配体的情况下，在被预测形成L2的RNA、分隔P1和P2的内部环和所述RNA的3′末端部分这些区域观察了较高的带强度。这些结果表明可形成P1和P2，但在所述RNA核心及在3′端尾的绝大多数高度保守的核苷酸(包括P4假结的核苷酸)在不存在配体时结构化较少。

在存在升高浓度的SAH时，在整个RNA的数个位置出现了带强度的渐进变化，这确认了SAH可导致RNA折叠的变化，这如假设所述RNA作为该代谢物的适体的情况时所预测的。而且，所述结构变化主要出现在系统发生保守的区域(图9A、图10A)，这一般出现于许多其他核糖开关适体。对SAH结合响应的最显著变化是假结P4的稳定化及所述核心其他保守核苷酸的柔性降低。这表明高度保守的核苷酸在形成SAH的结合袋中起作用。

通过在一个SAH浓度范围定量测定数个核苷酸位置的自发切割程度，估计68 metH RNA对SAH的表观离解常数K_D为约20nM(图10B和10C)。该表观K_D值是核糖开关适体的典型值，所述典型值被发现在约200μM(Winkler et al.，2004)至约200pM(Welz and Breaker，2007；Sudarsan et al.，2006)的范围内。以来自丁香假单孢杆菌ahcY基因的122核苷酸SAH适体构建体获得了直读探测测定显示的类似的SAH介导的形状变化。虽然122 ahcY RNA携带任选的P3茎，但是在配体结合时该RNA在适体核心会发生关键的结构变化，并且表观K_D值类似于对68metH RNA的测量值。

对于发挥SAH应答性核糖开关感受器的功能的SAH适体，必须能够区分结构类似于SAH的生物学相关化合物。也许最重要地，所述适体必须区分SAM，SAM与SAH差别仅仅是硫中心的单甲基基团及相关正电荷。使用直读探测及市售的SAM，发现了68 metH RNA及其他的SAH适体呈现的表观K_D值比针对SAH确立的表观K_D值高不超过10倍。然而，SAM自发地降解会产生很高水平的SAH污染，甚至新制备的市售SAM样品也包含约10％的SAH(Sigma-Aldrich Technical Service)。因此，68 metH RNA对SAM的更高水平的区分可被SAM样品中SAH的存在弱化。

为了得到SAH适体区分SAM的能力的更准确估计值，进行了使用如下这样的SAH砜类似物的直读探测，即该SAH砜类似物在以前已经被表明可近似模拟SAM与一个SAM-I类核糖开关适体的结合性质(Limet al.，2006b)。具体地，该SAH砜类似物缺少在SAM中存在的硫上的甲基基团，但携带两个从硫吸取电子密度以增加该原子的类似于天然辅酶的相对正电荷的电负性氧原子。直读探测结果(图10C)可显示，68metH RNA对砜类似物的结合的表观K_D比对SAH低大约3个数量级。

还使用平衡透析评估了68 metH适体对SAM的K_D值，以比较SAH适体与以前报道的名称为156 metA的SAM-II适体(Corbino et al.，2005)的功能。将68 metH RNA或156 metA RNA(10μM)加入平衡透析装置的一个槽中，并将100nM的[³H]SAM(图11A)加入另一个槽中。所述槽被截留分子量为5000道尔顿的透性膜隔开。由于在[³H]SAM的硫中心的甲基基团是被放射标记的，污染的SAH是无放射性的，因此不影响放射性在两个槽之间的平衡分布。

与68 metH RNA存在时相同测定条件下的无转移相比，156 metARNA将[³H]SAM的分布向包含SAM-II适体的槽促进转移约1.5倍(图11B)。如通过直读探测(Corbino et al.，2005)测定的，156 metA RNA对SAM具有约1μM的表观K_D。因此，68 metH对SAM的K_D值大于1μM。再者，无放射性转移等同于针对SAM-II核糖开关使用25μM 68metH RNA时的观测情况，这表明它对SAM的K_D可能几乎不超过25μM。这表明68 metH RNA对SAH识别的亲和性可能优于对SAM的超过1000倍(图11C)。即使在所述核糖开关被暴露于与SAH相当甚或轻度过量的SAM浓度时，SAH和SAM之间的这种区别将足以精确地控制SAH循环基因在应答变化的SAH水平时的表达。

通过确立68 metH RNA对15种SAH类似物的表观K_D值，更详细地评估了SAH适体的分子识别特征(图12A)。氨基酸的羧基和氨基、糖环和核碱基上多个位置以及硫酯键被改变。除S-腺苷半胱氨酸(SAC)之外的所有类似物都呈现了亲和性降低至少3个数量级。值得关注的是，SAC的较短氨基酸侧链仅导致亲和性的轻度降低，这不同于对SAM感知核糖开关的观测结果(Lim et al.，2006b)。

SAH的砜衍生物(化合物3)和氮杂衍生物(化合物4)中硫原子处的改变也会将亲和性降低3个数量级，这表明该位置对于配体识别的重要性。化合物4在用于直读探测条件下大致不带电荷(Lim et al.，2006b)。因此，它与所述RNA的弱相互作用可能来自于甲基基团的存在造成的立体干扰。化合物3在硫原子处更高的正电荷密度(Lim et al.，2006b)可能促成了该化合物与化合物4相比相对稍弱的结合。另外，SAH中硫中心的两组孤对电子在所述RNA的配体识别中可能起到一个关键作用。可以想象SAH(及SAC)的硫原子可能经电荷转移或范德华相互作用与所述适体形成多相互作用。最后，腺苷可较弱地与所述SAH适体相互作用(K_d约100μM)，但高半胱氨酸或甲硫氨酸在高至1mM的浓度均不导致RNA结构的任何调变。

这些结果已经被用于形成68 metH RNA对SAH分子识别的一个模型(图12B)。该模型表明，所述配体上的基本上每个功能基团均作为关键的分子识别决定因素，这一点在数个其他核糖开关适体类中已被观测到(例如Mandal et al.，2003；Sudarsan et al.，2003b；Mandal et al.，2004c；Lim et al.，2006a；Lim et al.，2006b)。

iii.SAH结合可激活报告基因的表达

丁香假单孢杆菌的SAH元件和ahcY mRNA的起始密码子之间的序列被预测可形成一个额外的茎环结构，其中在P4茎3′末端的两个核苷酸之一可能与核糖体结合位点或Shine-Dalgarno(SD)序列发生碱基配对(图13A)。后一种相互作用将所述额外的茎环结构延长两个碱基对，因此可能作为一个SD收纳茎(sequestering stem)发挥功能。因此，可能通过暴露SD序列以有利于核糖体与mRNA相互作用，该RNA作为一个激活配体结合时的基因表达的SAH应答性核糖开关发挥功能。虽然对来自芳香脱氯单胞菌metH基因的SAH适体可预测一种类似的SAH介导的重排，但是与该RNA结合的配体似乎可控制一个转录终止子茎的形成。

进行了一个体内基因控制测定，其中包含丁香假单孢杆菌ahcY基因5′UTR的IGR被融合至lacZ编码序列的邻接上游。该构建体保留了ahcY基因的起始密码子，它在阅读框内融合于所述报告基因ORF。将所形成的翻译融合载体转化至丁香假单孢杆菌中，以产生野生型(WT)报告株。类似地，构建被预计可破坏或恢复适体功能的一系列突变体报告株(图13A)。随后将转化的丁香假单孢杆菌株培养于金氏培养基B(King’s medium B)(丰富)或Vogel-Bonner培养基(基本)中，并将突变构建体的报告物表达水平与来自WT报告物构建体的结果比较(图13B)。

在丰富培养基中，预测SAH浓度较高，这是因为细胞应利用需要将SAM作为一种辅因子使用的代谢途径。如预测的，与携带破坏茎P1和P2或J1-2之间连接部位中两个保守核苷酸的突变(图13A)的构建体M1(图13B，上图)相比，WT构建体的β-半乳糖苷酶活性被提高。该发现与这样的观点一致，即SAH结合可激活基因表达，破坏配体结合的突变可造成所述核糖开关默认为关闭状态。不幸地是，尽管由M2携带的突变对P2茎的脱稳定化被预计可破坏核糖开关功能，但是M2和M3都表现为WT样基因表达。然而，直读探测(有或无SAH存在)表明所述M2构建体是严重错折叠的，这可导致所述报告物构建体默认为高基因表达。检查了P2中可产生无过多错误折叠的构建体的其他突变。如预测的，突变体M4(P2破坏)和M5(P2恢复)分别表现出了基因表达的消失和随后基因表达的恢复。这些结果再次表明，该适体的破坏可导致所述核糖开关默认为基因表达的关闭状态，并表明M2突变确在其错误折叠和基因表达的结果方面是异常的。

类似地，由构建体M6、M7和M8携带的突变的效应与涉及SD收纳的基因控制机制是一致的。这些构建体每个均携带两个降低P4稳定性的突变，并通过使用直读探测观测这些构建体失去SAH结合亲和性的情况。此外，具有破坏的SAH结合的构建体还可以产生较低的β-半乳糖苷酶报告物活性。对于M6和M8确实观测到了该结果，但M7产生近乎WT的表达(图13A)。虽然M7突变会破坏P4形成，但是它们还可以破坏与SD序列重叠的收纳茎。因此，所述M7核糖开关将不再能够默认成关闭状态，并且所述核糖开关-报告物融合构建体的基因表达可如观察到的一样高。以在基本培养基(Vogel-Bonner培养基)中培养的细胞进行了一组类似的报告基因测定。虽然以在基本培养基中培养的多种构建体观察到了相同的趋势(图13B，下图)，但是报告物表达的绝对值在丰富培养基中更高。报告物在基本培养基中总体表达的这种减少可以归因于总体代谢活性和蛋白合成的降低。

将直读探测用于确定是否可观察到P4茎和SD收纳茎形成之间的竞争。使用基于151 ahcY RNA的较长构建体(类似于图13A中描绘的)的直读探测显示，当存在SAH时WT构建体中的SD收纳茎确被破坏。相反，不管是否存在SAH，该构建体的M6版本可形成SD收纳茎，而M7变体不能形成该茎。因此，全长P4茎和全长SD收纳茎的相互排斥形成可能是来自丁香假单孢杆菌ahcY基因的SAH核糖开关的表达平台的一个关键组件。

为了进一步证实SAH在体内作为代谢物效应物，对培养在添加有已知可提高细胞SAH水平的效应物的基本培养基中的WT株测量报告物的表达(图14)。腺苷-2′，3′-二醛(SAH水解酶的抑制剂)和腺苷外加高半胱氨酸以前都被报道可显著地提高细胞SAH水平(Hermes et al.，2004)。以SAH水解酶抑制剂或腺苷/高半胱氨酸混合物添加的培养基可将WT核糖开关-报告物融合构建体的表达提高约10至20倍(图14A)，提高腺苷-2′，3′-二醛浓度可导致WT但非缺陷突变体M1和M7的基因表达的升高(图14B)。向培养基中添加甲硫氨酸可导致类似的核糖开关介导的表达的提高。生长培养基中过量甲硫氨酸可引起较高的细胞SAM浓度(Winkler et al.，2003)，细胞SAH浓度也会被升高。

相反，向培养基中添加250μM SAH仅稍微地提高报告物的表达。完整分子的SAH不能通过细胞膜(Ueland，1982)，这可解释添加该化合物对报告物表达水平几乎没有效应的原因。报告物表达的上调似乎是核糖开关依赖性的，这是因为以携带破坏P4形成并改变所述适体核心共有序列的突变的M6核糖开关-报告物融合构建体几乎没有出现基因表达(图13A)。

2.讨论

SAH不但作为SAM依赖的甲基转移反应的产物普遍存在于活体系统中，而且在高浓度存在时还作为这些反应的抑制剂发挥作用(Ueland，1982)。因此，许多细胞需求选择性感知SAH及除去过量SAH。在一些生物中，SAH被一种调节硫代谢中涉及基因的蛋白遗传因子感知(Reyet al.，2005)。这些结果显示，RNA分子可发挥类似的功能以感知SAH及控制其分解代谢所需的关键基因。

对SAH元件的鉴定提供了选择性结合SAH的高度保守及广泛分布的细菌RNA的第一个实例。该RNA可作为这样的一种核糖开关类的适体结构域，即该核糖开关类总是位于那些预测蛋白产物参与SAH分解代谢的ORF的邻接上游。这表明绝大多数的SAH核糖开关对配体结合的反应可能是开启基因表达。事实上，RNA元件的直接配体结合可稳定某些二级或三级结构，这些结构可使邻接ORF可接近SD序列，以允许核糖体的结合及随后的翻译。

虽然有数个不同类的已知显著区分SAH结合的SAM感知核糖开关(Lim et al.，2006b；Fuchs，2006)，但是SAH核糖开关是第一类所鉴定出的将该区分逆转向有利于SAH结合及排斥SAM的RNA。在用其他核糖开关类时，配体结合的高度选择性可能是需要的，以防止其他密切相关的化合物对基因表达的调节。SAH适体的有效分子区分可能会防止其他化合物例如SAM不必要地激活SAH分解代谢基因表达，所述SAH分解代谢基因表达仅当SAH积聚至高水平时才是需要的。SAH适体的该区分力是特别重要的，这是因为SAH的代谢前体SAM在正常条件下具有比SAH更大的细胞积蓄(cellular pool)(Ueland，1982)。SAH核糖开关的基因前后序列及它们对SAM区分的约3个数量级的能力都表明，SAH在体内是被RNA元件感知的代谢物。因此，SAH核糖开关提供了具有一类如下这样的感知器和基因控制元件的细胞，即该感知器和基因控制元件仅当SAH浓度有利于适当基因的表达时才允许细胞消耗资源用于SAH降解。

如天然SAM适体一样，在本研究中最详细检查的SAH适体基本上将配体上的每个官能团用于分子识别。一个显著的例外是观察到SAH适体可允许从配体的氨基酸部分除去一个亚甲基基团，而基本不损失亲和性。S-腺苷半胱氨酸(SAC；图12A，化合物2)携带与存在于SAH中相同的官能团阵列，但这些基团的一些必须在适体的结合袋中移动一埃或多埃。对于允许所述更短SAC类似物的一个可能的解释是，所述RNA适体可能形成两个分开的结合袋，其中每个袋与配体的一侧相互作用。这可允许某一水平的适应性，所述适应性使得结合位点可识别不同长度的配体。在该类型的核糖开关适体之前，已经报道了TPP结合核糖开关的这样的功能，即TPP结合核糖开关可结合不断变短的硫胺素单磷酸酯和硫胺化合物，尽管表观K_D值不断变小(Winkler et al.，2002)。TPP核糖开关适体的原子分辨模型(Edwards and Ferré-D’Amaré，2006；Serganov et al.，2006；Thore et al.，2006)显示一个两部分的配体结合袋，所述结合袋可调整它们的位置从而以相对高的亲和性结合所述更短的硫胺素单磷酸酯配体。

SAH适体中最高度保守的核苷酸主要位于P4中及桥接P1、P2和P4结合部位中(图9A)。这些核苷酸可参与针对SAH的结合袋的形成，这一点被通过直读探测观察到的这些残基的大量结构调变证实(图10A和10B)。这些核苷酸可形成一个可结合在硫中心缺乏电荷的配体的袋，因此它们可形成一个以不同于SAM-I适体的方式与该原子中心相互作用的结构。SAH适体排斥在本研究中试验的携带硫中心修饰的两个化合物(图12A，化合物3和4)。对化合物4的区分特别引人注意，这是因为代替SAH的硫的氮中心同样不荷电。因此，SAH核糖开关似乎可通过诸如SAM、3和4等在与SAH的硫等效的原子上携带其他化学部分的化合物的立体排斥进行区分。

除了扩大核糖开关类的列表之外，对SAH适体的鉴定会引起作为高选择性SAH感受器应用。例如，SAH为一种高半胱氨酸源，而高半胱氨酸可被用作心血管疾病的标记物(

et al.，1999)。在被测序的细菌基因组中鉴定的与SAH元件共有序列一致的最短实例的长度略微超过50个核苷酸(出现在芳香脱氯单胞菌ORF Daro_0186上游)。将对SAH的纳摩尔的亲和性、对紧密相关类似物例如SAM的数个数量级的区分以及易于获得的表达平台联系在一起，SAH元件拥有所需的体外及体内应用的性质。

3.实验步骤

i.寡核苷酸、化学品和细菌

合成的DNA寡核苷酸购自耶鲁大学的W.M.Keck基金生物技术资源实验室或Sigma-Genosys，除非另外声明否则不进一步处理即使用。[³H]SAM或S-(5′-腺苷)-L-甲硫氨酸-(甲基-³H)购自Sigma-Aldrich，[γ-³²P]ATP购自Amersham Biosciences。化合物4由The University ofSheffield的G.Michael Blackburn教授馈赠。所有其他化学品购自Sigma-Aldrich，例外是SAH类似物3、5、6和9-16，它们的制备记载于他处(Lim et al.，2006b)。丁香假单孢杆菌番茄变种株DC3000由康奈尔大学的Gregory B.Martin教授馈赠。

ii.RNA的制备

68 metH和122 ahcY RNA的制备是通过使用T7 RNA聚合酶和相应DNA模板的体外转录进行。使用SuperScript II逆转录酶(Invitrogen)依照制造商的说明书，通过延伸杂交至合成的模板DNA的携带T7启动子序列的引物生成68 metH的DNA模板。在延伸之前通过使用变性(8M脲)聚丙烯酰胺凝胶电泳(PAGE)纯化合成的模板DNA。使用如下文所述的适当质粒从PCR扩增产生野生型和突变122 ahcY RNA的DNA模板。将所述RNA转录物通过变性PAGE纯化，并使用包含10mMTris-HCl(23℃下，pH 7.5)、200mM NaCl和1mM EDTA的溶液从凝胶片段上洗脱。将RNA以乙醇沉淀浓缩，使用碱性磷酸酶(RocheDiagnostics)脱磷酸化，并使用[γ-³²P]ATP和T4多核苷酸激酶(NewEngland Biolabs)依照制造商的说明书标记5′端。如上述将放射标记的RNA通过变性PAGE纯化并分离。

如上述制备并纯化用于平衡透析的野生型和突变68 metH RNA，但不进行脱磷酸化及放射标记。使用根癌农杆菌(Agrobacteriumtumefaciens)株GV2260的全细胞PCR生成的DNA模板，如上述制备了用于平衡透析的156 metA RNA(Corbino et al.，2005)。

iii.直读探测分析

基本如以前的描述(Soukup and Breaker，1999)进行直读探测测定。在包含50mM Tris-HCl(25℃下，pH 8.3)、20mM MgCl₂、100mM KCl的10μl体积中将5′³²P-标记的RNA在室温下孵育大约40个小时，并包含指定浓度的试验化合物。将自发切割产物通过变性10％PAGE分离，使用PhosphorImager(Molecular Dynamics)显示，并且使用SAFA v1.1软件(Das et al.，2005)定量。在每个核苷酸位置处切割的RNA的量从SAFA分析得到，SAFA分析自动地测定具有水平不变的自发切割的参考核苷酸位置，以对每个泳道中不同的上样量进行校正。对每个调变位点的各个带强度求和并标准化，以得到结构上被调变的RNA部分的值，这假定没有配体存在时无调变且配体浓度最高时有调变最大。使用SigmaPlot 9软件(Systat Software，Inc.)将所有3个标识的调变位点处的所述调变部分(F)相对于所述配体浓度[L]的曲线与等式F＝[L]/([L]+K_D)拟合，确定表观离解常数(K_D)的值。

iv.平衡透析

通过将20μl样品送递至Dispo-Equilibrium生物透析仪(The NestGroup，Inc.，Southboro，MA，USA)的每侧进行平衡透析，其中通过一个截留分子量5000道尔顿的透析膜保持槽之间的分隔状态。一个槽包含100mM Tris-HCl(pH 8.3，24℃)、20mM MgCl₂、100mM KCl和100nM[³H]SAM的缓冲溶液。相对槽包含相同的缓冲溶液加指定浓度的156metA或68 metH RNA。在25℃下孵育11.5小时之后，从两个槽都取出5μl的整分试样并通过液体闪烁计数器测量放射性。

v.体内报告基因表达测定

通过丁香假单孢杆菌番茄变种株DC3000的全细胞PCR将相对于预测ahcY翻译起始位点(GenBank登记号：NC_004578.1；核苷酸5,771,072至5,771,444)-367至+6的核苷酸扩增为BamHI-HindIII片段。将该PCR产物克隆至lacZ报告基因的邻接上游的翻译融合载体pRA301(Akakuraand Winans，2002)中。该报告物载体稳定地维持于假单胞菌中，这是因为它带有源自绿脓假单胞菌载体pVS1(Itoh et al.，1984)的复制起点rep和稳定区域sta。使用所产生的作为模板的质粒、合适的诱变引物和QuikChange定向诱变试剂盒(Stratagene)依照制造商的说明书，生成突变体M1-M8。通过测序确认所有重组质粒的完整性。通过电穿孔依照标准步骤(Ausubel et al.，1992)完成pRA301变体向丁香假单孢杆菌的转化。通过选择大观霉素(75μg ml^-1)和利福平(50μg ml^-1)抗性鉴定正确的转化。

为了测量lacZ基因在野生型(WT)和突变丁香假单孢杆菌报告物株中的表达水平，在28℃下将细胞在金氏培养基B(King et al.，1954)(20g l^-1示蛋白胨3号、10g l^-1甘油、1.5g l^-1 K₂HPO₄、1.5g l^-1MgSO₄·7H₂O，pH 7.2)、50μg ml^-1利福平和75μg ml^-1大观霉素中或者在Vogel-Bonner基本培养基(0.2g l^-1 MgSO₄·7H₂O、2g l^-1一水合柠檬酸、10g l^-1 K₂HPO₄、3.5g l^-1 NH₄NaHPO₄·4H₂O，pH 7.0)、0.5％w/v葡萄糖、50μg ml^-1利福平和75μg ml^-1大观霉素中摇晃培养过夜。向用相同培养基将该过夜培养物稀释成A₆₀₀＝0.1至0.2，并补充另外指定的化合物。将培养物另外孵育4.5小时(金氏培养基B)或6小时(Vogel-Bonner培养基)，然后依照标准步骤(Miller，1992)进行β-半乳糖苷酶测定。报告物的Miller单位是3次重复实验的平均值。

D.实施例4：在链球菌中确认第二天然preQ₁适体类

对真细菌基因组的生物信息学搜索已经产生了许多核糖开关候选物，其中在检查相关基因后并不直接就知道了配体的具体种类。这些基序的一个只出现在链球菌科编码被分类为COG4708或DUF988的假定膜蛋白的基因的5′非翻译区(UTR)中。在链球菌之外的细菌——许多厚壁菌(Firmicute)物种的同源基因的5′UTR中鉴定了结合Q核苷(queuosine)生物合成中间体Q核苷前体₁(preQ₁)的核糖开关。本文中已表明，来自肺炎链球菌(Streptococcus pneumoniae)R6的COG4708RNA基序代表物也可结合preQ₁。而且，该RNA代表物具有不同于以前记载的preQ₁核糖开关类的结构和分子识别特征。PreQ₁存在两种或多种不同的天然适体类的第二代谢物，表明天然适体利用不同结构来结合相同代谢物可能是通常现象。另外，结合RNA的preQ₁与大多数编码被分类为COG4708的蛋白的基因的关联可表明，这些蛋白作为preQ₁或另一种Q核苷生物合成中间体的转运体发挥功能。

核糖开关是结合小分子代谢物以调节基因表达的结构化RNA(Mandal and Breaker 2004a；Soukup and Soukup 2004；Tucker andBreaker 2005；Winkler and Breaker 2005)。它们一般由一个配体结合适体和一个将配体结合翻译成基因调节的表达平台组成。由于配体结合位点所施加的限制，每个核糖开关类的适体通常是很保守的。这种适体序列和适体结构的保守性使得基因组序列的生物学分析成为一种鉴定新核糖开关候选物的有效工具(例如Rodionov et al.2002；Rodionov et al.2003；Barrick et al.2004；Abreu-Goodger and Merino 2005；Corbino et al.2005；Weinberg et al.2007)。相反，表达平台可相当大程度地变化及利用不同的基因调节机制例如转录终止和翻译抑制(Mandal and Breaker2004a)。虽然通常可以通过检查单个核糖开关的序列分辨表达平台，但是它们相对缺乏序列和结构保守性妨碍了它们被用作生物信息学发现新核糖开关类的靶。

生物信息学搜索已被用于发现许多的核糖开关和核糖开关候选物(例如Barriek et al.2004；Corbino et al.2005)。最近，使用在搜索数百个细菌基因组(Weinberg et al.2007)中应用的CMfinder流程(Yao et al.2006)的22个RNA基序的发现结果被使用。22个基序中的6个呈现了顺式调节RNA例如核糖开关共有的特征。例如，这些基序一贯地位于一个基因或不同组基因的正上游。另外，这些基序的代表物可具有两个特征的一个：依赖ρ的转录终止子或者与位于正下游的基因的核糖体结合位点或Shine-Dalgarno序列(SD)重叠的茎。对于所述的数种基序，从RNA基因组前后序列推断出配体种类(Weinberg et al.2007；Wang et al.2008；Regulski et al.，已投稿)。对于其他基序，基因组前后序列之前未提供或几乎未提供关于配体种类的信息。一种这样的RNA基序被发现仅与在厚壁菌门中发现被分类为COG4708或DUF988的保守假定膜蛋白的基因相关。

已经描述了对应于Q核苷(Q)生物合成前体preQ₁(Roth et al.2007)的核糖开关。Q是在大多数细菌Tyr、Asn、Asp和His的tRNA的GUN反密码子摆动位置出现的超修饰碱基(Harada and Nishimura 1972)。Q修饰已知对于翻译忠实性是重要的(Meier et al.1985；Bienz and Kubli1981；et al.2001)。Q生物合成起始于GTP，并在一系列酶促步骤中前进经过中间体preQ₀(7-氰基-7-脱氮鸟嘌呤)和preQ₁(7-氨甲基-7-脱氮鸟嘌呤)(Kuchino et al.1976；Okada et al.1978；Iwata-Reuyl 2003；Gaur and Varshney 2005；Van Lanen et al.2005)。PreQ₁优先调换特定的鸟嘌呤tRNA，剩下的生物合成步骤在原位发生(Okada et al.1979；Slany et al.1993)。因此，preQ₁是在插入至tRNA之前以游离形式存在的最后一种Q前体。

已知preQ₁核糖开关类(Roth et al.2007)的代表物经常位于Q生物合成操纵子上游(Reader et al.2004)，但一些也被鉴定为编码另外与Q无关的蛋白的其他基因上游，这些基因类型的一种被分类为COG4708。因此，可以推测COG4708蛋白可能参与Q生物合成前体的转运。

在本研究中已确定，与编码COG4708蛋白的基因相关的RNA可紧紧地及选择性地结合preQ₁，并显示与基因“关闭”开关一致的特征。因此提出了，该RNA基序的代表物的确可作为第二类的preQ₁核糖开关，下文称作preQ₁-II。preQ₁-II核糖开关适体具有与现在称为preQ₁-I的以前描述的preQ₁核糖开关(Roth et al.2007)基本不同的结构和分子识别谱。因此，preQ₁可联合S-腺苷甲硫氨酸(SAM)(Corbino et al.2005)作为被至少两类天然RNA适体识别的代谢物的第二实例。而且，通过在其同源物被已知核糖开关控制的mRNA的非编码区中进行搜索可帮助发现新核糖开关类。

1.结果和讨论

i.COG4708 RNA基序的生物信息学

最初描述的COG4708 RNA基序包括来自链球菌科的22条序列，其中6条是唯一的(Weinberg et al.2007)。为了鉴定另外的COG4708 RNA基序实例，使用升级的序列数据发布版本(RefSeq25)进行了同源性搜索。鉴定了匹配该基序的另外18条序列，使得序列总数目变成40条，唯一序列数目为13条(图15)。

大多数的新代表物在例如肺炎链球菌、化脓性链球菌或乳酸乳球菌的生物中被鉴定，它们的代表株在以前已被测序。因此，所述另外COG4708 RNA中的一些与已被描述的那些很类似或相同。该基序在猪链球菌、血链球菌和干酪乳杆菌中的序列匹配也被鉴定。该基序的所有代表物都出现在编码被注释为COG4708或DUF988的蛋白的基因5′-UTR。以前描述的该基序的保守特征(Weinberg et al.2007)包括适体内的假结、环序列和SD序列都出现在所有的新代表物中(图16A)。这类的结构化RNA与以前已经确定的相比在更大范围的细菌中是保守的。另外，所述RNA的共有序列模式和二级结构模型与出现于preQ₁-I适体类(Roth et al.2007)的那些相比基本上更复杂。

ii.COG4708RNA基序代表物很可能作为preQ₁感知核糖开关发挥功能

基于编码COG4708蛋白的基因与以前描述的preQ₁-I核糖开关(Roth et al.2007)的关联，假设了与COG4708基因相关的第二保守RNA基序还可感知preQ₁。为了确定COG4708 RNA在对preQ₁结合的响应中是否发生结构改变，在存在和不存在preQ₁的情况下对该基序的代表物进行了直读探测测定(Soukup and Breaker 1999；Winkler et al.2002)。直读探测测定利用了由内部磷酸酯转移引起的自发RNA切割的不同速率。RNA链不受限区域一般具有比受限区域更快的切割速率，使得代谢物结合时RNA结构的变化通常可导致RNA片段化模式的变化(Soukup and Breaker 1999；Li and Breaker 1999)。

将与包含来自肺炎链球菌R6的COG4708 RNA基序的103核苷酸构建体(下文中被称为1-103 RNA)对应的5′³²P-标记的RNA与不同浓度的preQ₁孵育，并通过变性聚丙烯酰胺凝胶电泳(PAGE)分离自发切割产物。所述1-103 RNA的片段化模式呈现了浓度依赖的变化，因此显示会出现preQ₁依赖的RNA结构变化(图16B)。这些结果还确认了COG4708 RNA为本发明人命名为preQ₁-II的不同类的preQ₁适体。全长1-103 RNA构建体的切割模式与基于系统发生分析预测的二级结构(Weinberg et al.2007)一致。环和连接区显示了切割的迹象，而预测的碱基配对区大多保持免于被切割(图16C)。呈现切割速率降低的大多数核苷酸对应于最大保守的核苷酸(图16C)。包含P3的SD序列和反SD在不存在preQ₁的情况下显示一些切割。该切割在配体结合时减少，表明SD和反SD在存在被预测可收纳SD及阻止翻译起始的preQ₁的情况下是稳定的。相反，出现在第16号及以下核苷酸的高水平自发切割表明，1-103 RNA构建体的5′区大多保持未被结构化。该结果与保守核苷酸在preQ₁-II适体代表物中相对零星的分布一块表明了该区域不参与所述适体结构的关键部分的形成。

基于生物信息学和结构探测数据已经表明，来自肺炎链球菌的preQ₁-II RNA基序可作为基因关闭的开关发挥功能，其中配体结合可稳定P3二级结构以掩蔽SD序列及阻止基因表达。这种基因控制机制以前已经对多种其他核糖开关发现(Rodionov et al.2002；Mandal andBreaker 2004a；Fuchs et al.2006；Wang et al.2008)。类似地，preQ₁-I核糖开关的代表物被预测可下调同源的COG4708基因对preQ₁响应中的表达(Roth et al.2007)。

iii.最小preQ₁-II二级结构被生物信息学正确地预测

构建了一系列5′和3′截短的RNA及用于确定截短构建体是否保持preQ₁结合活性的直读探测。包含成对元件P1至P4(核苷酸17-90)的RNA具有大约100nM的对preQ₁的表观K_D(图17A、B)。这种亲和性位于对其他核糖开关适体观测的范围内，因此证明了在直读探测中5′末端保持相对未结构化的核苷酸对于高亲和性代谢物结合是非必需的(图16C)。缺失P1的甚至更短的RNA构建体(核苷酸33-90)具有与17-90 RNA构建体大约相同的K_D，表明了虽然相关变异出现在多个位置(Weinberg et al.2007)，但保守的P1元件也不可能参与preQ₁配体的分子识别。P1有可能在RNA折叠中起作用或者在体内发挥未被本发明人的体外直读探测测定捕获的功能。

为了进一步检查所提出的二级结构模型，形成了在17-90 RNA的每个配对元件中携带破坏突变和补偿突变的构建体(图17C)，并通过使用直读探测评估这些构建体的配体结合活性(图17D)。如预测的，P2中的破坏突变(M1)会将配体结合亲和性降低约100倍(K_D约10μM)，并且补偿突变(M2)可部分地恢复配体结合亲和性(K_D约250nM)。自发切割产物的模式与其中P2在M1中未配对且在M2中配对的结构是一致的。

破坏突变M3和M5分别位于P3和P4，两者都破坏了preQ₁结合(图17D)。然而，补偿突变M6(在P4中)如预测完全恢复了配体结合，携带补偿变化以恢复P3碱基配对的M4突变不会产生preQ₁结合的恢复。该补偿突变的失败可能是由于多种原因所致。M3和M4在直读探测中都呈现自发切割的模式，不同于在不存在配体的情况下的野生型RNA的模式，这表明这些突变可导致相当多的错误折叠。另外，突变的P3核苷酸由于存在SD和反SD序列而是严格保守的，该区域在配体结合时会调变(图16B、C)。这些特征表明，改变P3中的碱基类型可导致广泛的错误折叠，以及对preQ₁结合(直接或间接)重要的分子接触在M4构建体中可能是缺乏的。

iv.平衡透析确认preQ₁结合

使用不同的方法以³H-preQ₁和17-90 RNA构建体进行平衡透析实验，以确认配体结合及分子识别的特异性。对于平衡透析，将³H-preQ₁添加至平衡透析装置的槽a中，并将过量的RNA添加至槽b中。两个槽被一个5,000道尔顿分子量截留的透析膜分隔(图18A)。使溶液平衡，随后通过液体闪烁计数测量每个槽中的氚部分。在以17-90 RNA平衡³H-preQ₁以得到两个槽(b/a)约1.75的放射性信号比时(图18B)，出现了氚向RNA的转移，表明RNA结合于³H-preQ₁并将其收纳至槽b。当无RNA或以缺乏形成P3茎能力的RNA(1-81 RNA)平衡³H-preQ₁(1μM)时，³H标记物平均地分布(b/a约1)。在以³H-preQ₁使17-90RNA平衡并确立放射性的非对称分布时，向槽a添加过量未标记的preQ₁可再次导致³H标记物再分布。然而，添加过量未标记的鸟嘌呤对³H的分布没有影响，表明试验浓度的鸟嘌呤不能与³H-preQ₁竞争17-90 RNA中的配体结合位点。

虽然在平衡透析过程中观察到的趋势与通过直读探测观察到的preQ₁-II适体的结合功能是一致的，但是³H标记物转移的程度不及预测的大。所使用的RNA浓度应提供过量的³H-preQ₁结合位点，并且鉴于测量的适体对其配体的K_D，应已足够以RNA饱和所有preQ₁分子。因此，当平衡发生在不存在未标记的preQ₁竞争剂的情况下时，b/a比率应已是较大。

为了进一步检查该差异，进行实验，将在以17-90 RNA平衡后包含剩余未转移³H-标记材料的槽a内含物转移至一个新装置的相对槽是新制备的17-90 RNA样品的槽a中，使两个槽再平衡(图18C)。如预测的，³H-标记的材料在两个槽之间均匀分布(图18D)，表明³H未转移部分的分子源不被所述RNA结合，它们不太可能是preQ₁。从该分析估计仅大约25％的³H-标记材料为preQ₁。与该结论一致的是对用于平衡透析的³H-标记preQ₁样品的纯度分析结果。大约82％的³H标记物源自溶剂，并且无其他UV吸收化合物存在于所述混合物中。总之，平衡透析实验还表明了携带COG4708 RNA基序核心的RNA构建体可作为preQ₁的选择性适体发挥功能。

v.17-90 RNA对preQ₁的选择性识别

通过测量17-90 RNA对一系列preQ₁类似物的结合亲和力，确定了来自肺炎链球菌的preQ₁-II适体的分子识别决定物。为了评估对氨甲基基团的识别，本发明人试验了preQ₀(7-氰基-7-脱氮鸟嘌呤)、7-(N，N′-二甲基氨甲基)-7-脱氮鸟嘌呤和7-羧酰胺-7-脱氮鸟嘌呤。二甲基氨甲基类似物和preQ₀都呈现约500nM的K_D值，表明基本上没有立体阻碍出现在烷基胺基团的末端，及该基团不可能作为氢键供体发挥功能(图19A)。相反，对氨乙基基团的多相互作用可能涉及氨基作为一个氢键受体。虽然不多见，但氨基的氮原子可(Luisi et al.1998)在一些其他核酸结构中作为氢键受体。

如通过使用平衡透析观察到的(图18B)，17-90 RNA可显著区分鸟嘌呤(K_D约10μM)。鸟嘌呤类似物7-脱氮鸟嘌呤仅被以稍高的亲和性结合，表明对preQ₁几乎没有选择性是源于在第7位缺乏氮原子。在浓度高达1mM时缺乏7-甲基鸟嘌呤结合可能是由于在第9位缺乏氢键供体，而不是由于在第7位任何分子识别接触的破坏。

根据剩下的试验嘌呤化合物，显然，第2位的胺对配体结合是至关重要的(图19A)。2，6-二氨嘌呤(DAP)是仅有的这样的化合物，即这种化合物缺乏鸟嘌呤样Watson-Crick碱基配对边缘，但保持被试验浓度的RNA可测量地结合的能力。值得注意的是，在嘌呤环的第6位携带酮氧(keto oxygen)(鸟嘌呤)或胺(DAP)的化合物可得到几乎相同的K_D值。然而，对于在第6位缺乏外环功能基团而与鸟嘌呤和DAP不同的2-氨嘌呤没有检测到结合。因此，在第6位处鸟嘌呤的酮基和DAP的氨基似乎可等同地促进分子识别。虽然有更复杂的可能性，但对该结果的最简单解释是在第6位处preQ₁的酮基和DAP胺的氮原子都作为氢键受体。

对17-90 RNA及其preQ₁配体产生的推定分子识别接触的总结(图19B)显示了与针对preQ₁-I适体鉴定的分子识别接触(Roth et al.2007)相比的差异。对第7位的氨甲基部分的识别基本上是不同的，这是因为7-二甲基氨甲基和7-羧甲基类似物对于两个适体类的相对特异性是相反的。另外，preQ₁-I核糖开关可与鸟嘌呤形成更紧的相互作用，使得其对preQ₁的特异性比鸟嘌呤明显低。与preQ₁-I核糖开关类似，在第2位的胺似乎对于17-90 RNA的配体结合是至关重要的。然而，类似物结合数据表明，preQ₁-II适体不会形成与嘌呤环的N1位置的接触。这不同于被提出在配体和preQ₁-I适体之间形成的Watson-Crick碱基对(Roth et al.2007)。根据现有数据，很清楚，preQ₁-II适体的特有的序列和结构元件可折叠形成一个结合袋，它不同于由preQ₁-I适体形成的结合袋。

vi.Watson-Crick碱基配对不大可能是配体识别的原因

已经发现结合鸟嘌呤和腺嘌呤的核糖开关使用经典的Watson-Crick碱基对用于选择性配体结合(Gilbert et al.2006；Mandal and Breaker2004b；Batey et al.2004；Serganov et al.2004；Noeske et al.2005)。嘌呤核糖开关适体的单个点突变足以在鸟嘌呤和腺嘌呤之间变换适体特异性(Mandal and Breaker 2004b)。类似地，核糖开关结合2′-脱氧鸟苷的特异性可被相似突变改变(Kim et al.2007)。可以将一种类似机制用于preQ₁-I核糖开关适体中，此处保守的胞苷向尿苷的突变会将配体特异性从preQ₁变成DAP(Roth et al.2007)。

为了评估17-90 RNA是否使用一种相似的机制来促进配体特异性，将唯一的普遍保守的非配对胞苷(C33)(图15、图16A)突变成尿苷。虽然在preQ₁-II适体中存在另外的严格保守胞苷残基(C32和C51)，但是它们位于预测的碱基配对元件中，因此不可能与配体形成经典的碱基对。然而已发现，在第33位携带U的突变RNA的表现与野生型RNA很类似，并表现出对preQ₁约250nM的K_D。因此，该残基不可能与配体形成经典的碱基对。考虑到该RNA区在配体结合时不发生调变(图16B、C)及P1不是配体结合必需的，该结果并不在意料之外。

核苷酸C41也被发现可作为与preQ₁形成碱基对的候选物。该核苷酸在所述适体保守核心的近端，并在在配体结合时发生调变(图16)。在40个已知COG4708 RNA中仅发现一个代表物其中C41突变成U残基(图15)。在该位置携带C至U的改变的17-90 RNA构建体呈现出对preQ₁亲和性损失两个数量级(图20A)，表明该残基对于配体结合的确是重要的。然而，该突变体构建体不发生特异性的改变，以有利于具有腺嘌呤碱基配对面的类似物。这些结果表明，C41也可能不与配体形成经典的碱基对。

虽然U41突变体对preQ₁的结合比野生型17-90 RNA更弱，但是该突变体可与野生型基本相同的亲和性结合DAP(图20B)。相反，用U41突变体将不再能检测到鸟嘌呤结合。这些结果表明，在第41位的核苷酸以与preQ₁-II适体的分子识别模型一致的方式与配体形成接触(图19B)。C41的外环氨基可向preQ₁的酮基贡献一个氢，但在U41中代替该胺的所述酮基不能形成一个等效的氢键(图20C)。因此，如观察到的，所述突变体RNA应比野生型RNA更弱地结合preQ₁(图20A)。相反，C41的外环氨基可向DAP第6位置处的外环胺的氮原子贡献一个氢，以形成一个氢键。同样，U41的相应酮基可作为一个氢键受体，并使得可与DAP第6位置处的相同外环胺形成一个等价氢键(图20C)。该排列可解释为什么出现了C41和U41 RNA对DAP结合呈几乎相同的K_D值(图20B)。

2.结论

PreQ₁是被多于一类天然适体识别的代谢物的第二实例。迄今为止已鉴定了4个不同的识别S-腺苷甲硫氨酸(AdoMet或SAM)的适体类。SAM-I或S-box(Epshtein et al.2003；McDaniel et al.2003；Winkler et al.2003)、SAM-II(Corbino et al.2006)、SAM-III或SMK-盒(Fuchs etal.2006)以及SAM-IV(Weinberg et al.2007)经常调节不同生物中的相同基因(例如SAM合酶、高丝氨酸O-琥珀酰转移酶)。第二天然preQ₁适体类的发现表明，SAM不是一个特例，并且另外的代谢物可被多种不同RNA结构结合以在不同生物中控制相似组的基因。

两个preQ₁结合的RNA与被分类为COG4708或DUF988的膜蛋白的关联表明，该蛋白是Q核苷生物合成中间体的转运体。随后已证明其基因与TPP核糖开关相关的功能未知的膜蛋白参与TPP和硫胺转运(Rodionov et al.2002；Winkler et al.2002；Schyns et al.2005)，显示了通过对RNA基因控制元件的表征可如何获得对蛋白功能的描述。同样，由mRNA编码的蛋白的功能信息可有助于确立相关核糖开关的配体种类。

有意思的是，在许多细菌中有多个基因同源于那些与preQ₁生物合成或转运相关的基因，但这些基因还没有确定的控制机制。因此猜测这些基因的mRNA可能携带其他的preQ₁核糖开关类。为了评估发现新preQ₁适体的可能性，在缺乏preQ₁-I和preQ₁-II适体且其基因组已经被测序的生物中观测了数个COG4708基因上游的基因间区。

COG4708基因很窄地分布于细菌中，全部3个实例出现在芽孢杆菌纲和梭菌纲中(图21)。一个实例COG4708在γ-变形细菌(Rubrobacterxylanophilus)中，两个实例出现在古生菌(依赖热丝菌(Thermophilumpendens)和海生葡萄状嗜热菌(Staphylothermus marinus))中。在46种情形的30种中，与COG4708蛋白对应的基因与preQ₁适体相关(图21)。数种生物包含两个拷贝的该基因，核糖开关一般仅与这些拷贝中的一个关联，但在Alkaliphilus metalliredigens中该基因的两个拷贝都在一个preQ₁-I核糖开关之后。在COG4708基因不与已知的preQ₁感知RNA相关的许多生物中，该ORF的邻接上游的基因间区大于50个碱基对。该空间足够一个RNA适体位于该mRNA的5′UTR中。然而，这些区域一般显示与任何其他序列很少至无可检测的同源性，表明他们缺乏结构化RNA或者它们不携带一个在许多其他细菌中具有同源性的适体。

将直读探测测定用于检查热醋穆尔氏菌、艰难梭菌、酒酒球菌、嗜热地芽胞杆菌中编码COG4708蛋白的ORF上游的基因间区，以及嗜热链球菌(Streptococcus thermophilus)中两个COG4708拷贝上游基因间区。所试验RNA在存在preQ₁的情况下没有一个显示结构的调变，表明它们不包含preQ₁结合核糖开关。然而，不但包括体内条件和体外条件之间的差异而且包括由外源5′或3′序列干涉引起的RNA错误折叠的数个不同因素可使直读探测测定变得复杂。

与大多数其他鉴定的核糖开关不同，preQ₁-II适体的分布很窄，主要出现在链球菌科的细菌中。这种窄分布是有先例的，如SAM-III也似乎局限在同组细菌中(Fuchs et al.2006)。

3.材料和方法

i.化学品和DNA寡核苷酸

preQ₁、preQ₀、7-(N，N′-二甲基氨甲基)-7-脱氮鸟嘌呤、7-羧酰胺-7-脱氮鸟嘌呤和7-氨甲基-7-脱氮腺嘌呤的化学合成在以前被描述(Roth etal.2007)。除非另外指出，否则其余嘌呤化合物和其他化学品购自Sigma-Aldrich。³H-preQ₁的获得如前所述(Hurt et al.2007)。合成的DNA由Sigma-Genosys制备。

ii.RNA制备

从肺炎链球菌R6将对应于preQ₁-II(Cog4708 RNA)基序的编码COG4708的基因5′UTR部分PCR扩增，使用的是以下引物：5′-GGAATTCAACAAGTCTAACAGAAAAGTAGAAAGGCGGGC-3′(SEQ ID NO：1)和5′-TTTTGTCATTTTTTCTCCTTTAACGTCTGGATAACTCTCAAAAGC-3′(SEQ ID NO：2)。随后使用TOPO TA克隆试剂盒(Invitrogen)将所形成的双链DNA克隆至pCR2.1中。将质粒插入物测序(耶鲁大学的W.M.Keck基金生物技术资源中心)，并用作这样的DNA片段的PCR扩增的模板，即该DNA片段编码之前有T7启动子序列的所需RNA并包括两个鸟苷残基以提高转录效率。使用PCR的突变体引物将破坏突变及补偿突变引入至PCR产物中。使用T7 RNA聚合酶在体外转录PCR产物，并使用类似于别处描述的方法(Seetharaman et al.2001)通过变性6％PAGE纯化所形成的RNA。

基于基因组序列从合成寡核苷酸的组通过PCR(Dillon and Rosen1990)构建了对应于从嗜热链球菌描述的构建体的DNA片段。使用各自的基因组DNA及在合适位置包含T7启动子序列的引物，通过PCR扩增了对应于来自热醋穆尔氏菌、酒酒球菌(PSU-1)、艰难梭菌、嗜热地芽胞杆菌中编码COG4708蛋白的基因上游基因间区的DNA片段。酒酒球菌和艰难梭菌基因组DNA样品获自ATCC。通过如上述的体外转录制备RNA分子。

iii.直读探测测定

将通过体外转录制备的RNA分子使用碱性磷酸酶(RocheDiagnostics)脱磷酸化，并使用[γ-³²P]ATP(GE Biosciences)和T4多核苷酸激酶(New England Biolabs)依照制造商的说明书放射性标记。如上述通过PAGE纯化5′³²P-标记的RNA。在有和无如以前描述的配体(Soukup and Breaker，1999)时，安排包含约1nM的5′³²P-标记的RNA的直读探测反应。在25℃下将包含50mM Tris-HCl(23℃下，pH 8.3)、20mM MgCl₂和100mM KCl的反应混合物孵育大约40小时。对于源自热醋穆尔氏菌和嗜热地芽胞杆菌的RNA，还分别将孵育在58℃下进行30分钟和在60℃下进行15分钟。通过变性10％PAGE分离样品，并使用Molecular Dynamics PhosphorImager和ImageQuaNT软件进行成像和定量。

使用一系列配体浓度通过进行直读探测测定确定K_D值。在每个配体浓度下对每个分析计算在指定的位点切割的RNA的标准化分数，并对这些点拟合标准结合曲线。所检查的多数化合物的浓度在1nM和1mM之间变化，例外的有preQ₁、鸟嘌呤、7-羧酰胺-7-脱氮鸟嘌呤、7-氨甲基-7-脱氮腺嘌呤，它们的试验的最高浓度分别是100μM、100μM、10μM和30μM。

iv.平衡透析

将包含50mM Tris-HCl(23℃下，pH 8.3)、20mM MgCl₂、100mMKCl和1μM的³H-标记preQ₁的30μl混合物置于DispoEquilibrium透析仪(ED-1，Harvard Bioscience)的一个槽中，并将包含相同组分减³H-标记preQ₁的相同体积添加至对侧中。注意，后一种溶液还包含5μM17-90 RNA或5μM 1-81 RNA。在平衡14小时后，从该装置的每一侧取出5μl的整分试样，以通过液体闪烁计数确定³H标记物在两个槽中的分布。对于竞争结合实验，将上述包含1mM未标记化合物的3μL缓冲混合物添加至无RNA的槽中，并将相同体积的缓冲物添加至含RNA的槽中。使这些槽再平衡8小时，然后如上述再次评估³H标记物的分布。

³H-标记preQ₁的HPLC显示了与preQ₁一致的单UV活动峰。为了评估这里³H标记物未整合至最初的preQ₁中，将40μL整分试样的³H-preQ₁溶液(约2mM)与8mg的脱色碳和200μL水混合。随后通过离心分离所述浆体，将上清液取出并过滤(0.22微米)。上清液的HPLC分析显示在水部分中不存在preQ₁，表明碳已完全吸收杂环。通过液体闪烁计数测量存在于上清液部分中的氚和残碳值。

v.生物信息学

在RefSeq25(Pruitt et al.2007)上进行同源性搜索，并如以前的描述(Weinberg et al.2007)确定COG4708 RNA基序共有序列。通过PFAM数据库(发布版本22.0)(Finn et al.2006)鉴定了COG4708(DUF988)基因的实例。对来自数个生物的COG4708蛋白序列相对于NCBI基因组数据库的BLAST搜索没有得到任何另外的序列。实例限于完全测序的基因组，并确定了preQ₁-I或preQ₁-II核糖开关是否存在于编码COG4708蛋白的ORF上游的基因间区。将相同物种的高度相似株或分离株从列表除去，以减少冗余度。

E.实施例5：一种广泛存在的可控制参与钼辅因子和钨辅因子代谢的细菌基因的核糖开关的候选物

已经鉴定了一种高度保守的RNA基序，该RNA基序位于编码钼酸盐转运体、钼辅因子(Moco)生物合成酶和利用Moco作为辅酶的蛋白的基因的上游。生物信息学搜索已经在γ-变形细菌、δ-变形细菌、梭菌、放线菌门、恐球菌-栖热菌(Deinococcus-Thermus)种和来自环境样品的DNA中鉴定了176个代表物。使用基因测定已证明，在大肠杆菌中与Moco生物合成操纵子有关的Moco RNA在对Moco生成产生应答时可控制基因表达。另外，已经提供了证据表明该保守RNA可区分Moco的紧密相关类似物。这些结果与广泛的系统发生保守性和接近一些实例的典型基因控制结构一块表明了，该结构化RNA的代表物可代表一个可感知Moco的核糖开关的新类。此外，已经鉴定了可能会被相关钨辅因子(Tuco)触发的这种RNA的变体，它携带钨代替钼作为金属组分。

核糖开关是可选择性结合代谢物或金属离子并且作为基因控制元件发挥功能的结构化RNA结构域(Mandal and Breaker，2004；Soukup andSoukup，2004；Winkler and Breaker，2005；Winkler，2005)。核糖开关通常出现于真细菌mRNA非翻译区，一般通过调节转录延长或翻译起始对基因表达实施控制(Breaker and Barrick，2007)。除几个例外(Winkleret al.，2004；Barick et al.，2004)之外，核糖开关由两个模块区——一个适体结构域和一个表达平台组成。所述适体可形成靶代谢物的选择性结合袋，并且该结合事件可变构地调节邻接表达平台的折叠，以控制基因表达。甚至在从远亲缘生物鉴定的代表物(Breaker and Barrick，2007)中，每个核糖开关类的代谢物结合袋在序列和结构上仍是高度保守的。

核糖开关为使用生物信息学搜索进行发现研究的优良靶。例如，CMfinder比较基因组流程(Yao et al.，2007；Weinberg et al.，2007)代表了一种用于鉴定新的功能性RNA元件的生物信息学方法。它可鉴定同源基因的推定5′非翻译区(5′UTR)，随后检查这些区域在来自不同生物的UTR中序列和二级结构保守的证据。将序列和结构保守的模式用于鉴定另外的同源性，对初始预测的基序进行精拣。CMfinder流程已鉴定了大量有希望的核糖开关候选物，所述候选物最近已经被证实(Wang et al.，2008)或者有待于被验证。一种被报道的新基序是一种大且复杂的RNA结构域，通常出现在编码参与钼辅因子(Moco)代谢的蛋白的开放阅读框(ORF)上游(Weinberg et al.，2007)。

Moco是一种与一个钼(Mo)原子配位的三环吡喃蝶呤(Schwartz，2005；Baugh et al.，1998)，钼是一种在元素周期表中位于与铬和钨同一列的过渡金属。在生物合成后，Moeo被插入至Mo依赖的酶的活性位点，该酶利用Mo的氧化还原活性以在碳、氮和硫代谢循环中催化关键反应(Baugh et al.，1998)。已经在包括γ-变形细菌、δ-变形细菌、梭菌、放线菌门和恐球菌-栖热菌广大真细菌种中以及在环境序列中鉴定了该基序的176个实例(Weinberg et al.，2007)。该基序显示了典型的代谢物感知核糖开关的特征，包括广泛的序列保守、预测的碱基配对元件中的核苷酸相关变异的迹象和混有保守非配对核苷酸的碱基配对元件的精细集合。

本文提供的证据是，来自大肠杆菌的代表性Moco RNA可选择性地感知Moco，并对该辅酶水平改变有响应而控制相邻基因的表达。此外，已经表明Moco RNA涉及Moco和紧密相关类似物Tuco之间的调节性区分，因此提供了进一步的证据，即Moco可被由Moco RNA形成的适体特异地识别。这些实验结果与某些RNA变体和辅酶代谢特征之间的相关性一块表明，该结构化RNA类可包括特殊的Moco感知核糖开关和Tuco感知核糖开关。

1.结果和讨论

i.Moco基序广泛存在且高度保守

当将比较基因组流程(Yao et al.，2007)用于检查γ-变形细菌中编码钼辅因子生物合成蛋白A的基因的UTR时，鉴定了一种呈现相关变异和暗示结构化RNA的其他特征的基序(Weinberg et al.，2007)。这些搜索致使在γ-变形细菌、δ-变形细菌、梭菌、放线菌门、恐球菌-栖热菌种和环境DNA序列中鉴定了该基序(被称为“Moco RNA”)的176个实例。以推定的共有结构为指导，使用RALEE(Griffiths-Jones，2005)通过人工比对比较了这些序列。该比对显示在该基序的中心多茎连接部位附近的序列保守性最高(图22)，所述基序携带的大多数核苷酸呈现75％至100％的序列保守性。

多至5种碱基配对元件(标记为P1至P5)可形成Moco RNA的二级结构构架。在该保守二级结构中的是分别出现在P4远端和P2凸出物中心的一个GNRA四元环(Heus and Pardi，1991)和一个四元环受体(Costa and Michel，1995)。所述四元环序列在全部5种Moco RNA中都是GAAA。然而，全部四种携带GCAA四元环的Moco RNA缺乏受体，而仅两种具有GAAA四元环的Moco RNA缺乏受体。对于另一种称作GEMM基序的新发现的RNA基序的代表物，以前观察到了一种类似的关联(Weinberg et al.，2007)。

根据是否存在P3茎可将Moco基序的代表物分类成两组。对所有已知代表物的比对揭示了一个高度保守的表观适体区，其后的序列似乎可形成不同类型的表达平台，所述表达平台是典型的已知代谢物感知核糖开关。例如，moaABCDE操纵子上游的大肠杆菌Moco RNA的可能的表达平台(图23a)似乎在形成P1茎的核苷酸中包含下游开放阅读框(ORF)的核糖体结合位点。该排列可表明，适体结构域的配体结合可抑制基因表达。还存在这样的实例，即其中所述推定适体结构域出现在与细菌内转录终止子的预测序列和结构一致的茎环结构的上游(Gusarovand Nudler，1999；Yarnell and Roberts，1999)。而且，一些生物携带超过一个Moco RNA代表物，并且两种类型的表达平台出现在同一生物中。

虽然大多数生物每个基因组携带一个Moco RNA代表物，但是其基因组被完全测序的一些生物具有多至4例或5例该基序。携带最大数目的Moco RNA代表物的是Desulfitobacterium hafniense(有8种形式)和沃而夫氏互营单胞菌(Syntrophomonas wolfei)(至少有15种形式)。有趣地是，串联排列的Moco RNA基序存在于沃而夫氏互营单胞菌和金属还原地杆菌(Geobacter metallireducens)中。虽然不多见，但是串联排列的核糖开关或它们的子结构域已在其他的代谢物感知核糖开关类中被鉴定(Mandal and Breaker，2004；Famulok，2004；Sudarsan et al.，2006；Stoddard and Batey，2006)。这些更复杂的构架可被核糖开关用来实现更复杂的功能例如对多信号传递输入响应的能力(Sudarsan et al.，2006)，或者对更小的配体浓度变化更敏感(Mandal and Breaker，2004；Welz and Breaker，2007)。沃而夫氏互营单胞菌中的一个操纵子携带了连续的3个Moco RNA。

ii.Moco基序与Moco生物合成基因关联

大多数已知的核糖开关顺式地发挥功能，以对它们的同源配体的结合响应从而调节近端基因的表达。被所述核糖开关适体感知的配体一般是由受控mRNA编码的一种或多种酶催化的途径的终产物。或者，小分子配体有时被需要作为其表达受核糖开关控制的基因产物的辅因子或底物。因为核糖开关通常应用顺式调节机制，所以由位于核糖开关下游的基因编码的蛋白的功能可提供许多有关配体种类的信息。

在确立Moco RNA的功能的尝试中，考虑了携带该保守RNA代表物的邻接基因组位置的基因的功能。在γ-变形细菌(包括大肠杆菌)中，该基序出现在moaABCDE操纵子上游(图23a)，moaABCDE操纵子编码负责钼喋呤(MPT)生物合成的蛋白(Schwarz，2005)。在一些细菌中，代表物还位于modABC上游，modABC编码高亲和性钼酸盐转运体复合体(Grunden and Shanmugam，1997)。有γ-变形细菌的3个种(睡眠嗜血杆菌、杜克雷嗜血杆菌和胸膜肺炎放线杆菌血清变种1)，其Moco基序同时位于钼喋呤生物合成操纵子上游和预测编码钼喋呤氧化还原酶的基因上游。Moco基序还出现于不同排列的Moco生物合成酶基因、高亲和性钼酸盐转运体基因及使用Moco来催化反应的酶基因的上游。一般而言，这些基因组前后序列将Moco或该辅因子的生物合成中间体指向为该核糖开关候选物的可能的配体。数个已知的核糖开关类感知并响应其他共同的辅酶，因此Moco被看作是该核糖开关候选物的最有可能的配体。

钼辅因子生物合成是一种复杂且古老的通路，它从真细菌至人保守。仅有的不需要钼或Moco的生物利用钨和类似辅酶Tuco来替代(Schwarz，2005)。在大肠杆菌中，有5个已知操纵子参与Moco代谢：moa、mob、mod、moe和mog(Shanmugam et al.，1999)，它们编码共15种蛋白。Moco生物合成的最初两个步骤由moa操纵子编码的基因催化(图23b)。具体地，在由S-腺苷甲硫氨酸依赖的酶MoaA和未表征的同源六聚体MoaC催化的反应中，鸟苷-5’-三磷酸(GTP)被转化成环吡喃蝶呤单磷酸(cPMP)(Wuebbens and Rajagopalan，1995)。cPMP有不到1小时的半衰期，它是最稳定的Moco生物合成中间体(Santamaria-Araugoet al.，2004)。然后，由MoaD和MoaE形成的异源四聚体MPT合酶复合体可催化向cPMP转移两个硫原子，形成MPT二硫醇盐(Pitterle et al.，1993)。

随后通过mogA和moeA的产物从MPT合成Moco，这经过涉及MPT腺苷化及Mo插入以形成钼辅因子的一系列独立步骤(Nichols andRajagopalan，2002)。在大肠杆菌中，Moco可被MobA进一步修饰成二钼喋呤鸟嘌呤二核苷酸辅因子(二MGD)(Lake et al.，2000)。二MGD然后被插入至包含钼的酶中。在其他真细菌中，可修饰Moco以得到也可用作辅酶的其他衍生物(Schwarz，2005)。所有以上提及的Moco生物合成基因，以及编码将Moco或其衍生物用作辅酶的酶的数个基因，都至少在一些细菌中与Moco RNA基序有关联(图23b)。

iii.Moco RNA的结构特征的生物化学分析

考虑到Moco及其生物合成中间体的化学不稳定性，在体外测试这些化合物的直接结合相互作用是不现实的。因此，进行了一系列生物化学实验和遗传实验，以确定来自大肠杆菌的Moco RNA是否具有与核糖开关功能一致的特征。为了评估对该Moco RNA代表物提出的结构模型，138核苷酸的RNA构建体(被称为138 moaA，Fig.24a)包含Moco基序，从碱基配对P1元件5′起始的上游9个核苷酸伸出至P1的3′端之外10个核苷酸。138 moaA包含一个P3茎(它在一些代表物中不存在)、预测的核糖体结合位点和moaA ORF的AUG翻译起始密码子。该RNA在5′末端还携带2个另外的G残基，以有利于通过体外转录的产生。用痕量的5′³²P-标记的138 moaA RNA进行直读探测分析(Soukup andBreaker，1999)，这利用了由RNA结构差异造成的不同核苷酸间键的自发切割频率的差异，以鉴定结构刚性和柔性的区域。

在通过聚丙烯酰胺凝胶电泳(PAGE)分离时，在直读探测过程中生成的RNA切割产物所形成的模式(图24b)与基于比较序列分析预测的大多数主要二级结构特征(图22)是一致的。具体地，呈现高水平自发磷酸酯转移的大多数位点局限于茎P3和P5的环，还聚簇于在预测的碱基配对茎之间进行桥联的连接部位。然而，自发切割的模式与对P2茎大部提出的二级结构是不一致的。虽然该茎可具有两个可能呈现结构柔性的内凸起，但是所观测的一些RNA片段是在可被碱基配对的核苷酸处进行切割的结果。

这些直读探测结果表明，P2茎和携带数个高度保守核苷酸的连接部位可能发生一个构象变化，以形成一个配体结合袋。这与其他已知的核糖开关适体的表现是一致的，通过直读探测测定发现这些其他核糖开关适体的一些在加入靶代谢物时会发生实质的结构变化(Nahvi et al.，2002；Winkler et al.，2002；Mandal et al.，2003)。

iv.Moeo RNA作为基因控制元件发挥功能

在大肠杆菌中，已知有两个启动子位点和伴随蛋白因子结合位点调节moa操纵子的转录(图23a)。S2启动子位点依赖于厌氧的蛋白转录因子Fnr(Anderson et al.，2000；Spiro and Guest，1990)。该操纵子对厌氧条件响应的转录上调可使得Moco的生物合成增加，参与厌氧呼吸的某些蛋白需要Moco用作辅酶。moa操纵子的S1启动子位点可被钼酸盐结合的ModE(Anderson et al.，2000)激活，钼酸盐结合的ModE是一种在细胞中结合钼酸盐的转录因子，并可上调modABCD操纵子的转录(Gruden et al.，1999)。这确保了在细胞内可获得足够的钼酸盐以合成Moco。另外，虽然有moa操纵子中的一些基因受铜应答性因子CueR控制的证据(Yamamoto and Ishihama，2005)，但是对CueR预测的结合位点出现在Moco元件的下游。

除了该多层次转录控制网络之外，还已知的是，在S1启动子和moaA起始密码子之间131-nt的伸出物促成了一个第三调节体系(Anderson etal.，2000)。具体地，该区域的存在使得细胞中存在Moco时moa操纵子被抑制(Anderson et al.，2000；Baker and Boxer，1991)。Fnr和ModE转录因子在大肠杆菌中对moa操纵子表达的作用仅出现在当该5′非翻译区(UTR)部分被缺失之时。引人注意的是，该131-nt区明确地包含Moco RNA基序。再者，没有鉴定到作用于该DNA部分或相应RNA转录物的蛋白调节因子，保留了该mRNA部分可能作为Moco的直接感受器的可能性。

Moco RNA的构架特征与大肠杆菌moa操纵子的已知基因控制特征一块表明了Moco RNA代表物是代谢物感知核糖开关。为了确认MocoRNA作为一种基因控制元件发挥功能，用PCR扩增对应于野生型moaA5′UTR的大肠杆菌基因组部分。该基因组段编码一个这样的149核苷酸RNA(被称为149 moaA)，即该RNA从P1的5′起始处上游9-nt开始且在P1的3′端之外延伸21-nt至moaA编码区。同时，生成了表达149moaA RNA的两个突变体DNA，在P3茎中具有破坏(M1)碱基配对及之后恢复(M2)碱基配对的突变(图25a)。

将这些序列克隆至翻译融合质粒中，在β-半乳糖苷酶报告基因上游并与它在相同阅读框内。将该融合物置于组成活性的lacUV5启动子控制下，以消除天然限制moaA操纵子表达的厌氧及钼酸盐依赖的上游启动子调节的作用。将这些质粒系列置于其中所述moaA基因被缺失的大肠杆菌株中。将所形成转化体以包含受控于阿拉伯糖诱导型及葡萄糖抑制型启动子的moaABCDE操纵子的质粒转化(Guzman et al.，1995)。这些双转化株使得本发明人能够在Moco浓度高或低时确定149 moaARNA对报告基因表达的作用。

当在存在阿拉伯糖的情况下培养时，携带野生型149 moaA构建体(WT)的细胞呈现了较低的β-半乳糖苷酶基因表达(预测Moco浓度升高)(图25b)。相反，当在存在葡萄糖的情况下培养时，具有WT构建体的细胞的报告基因的表达呈现超过3倍的升高(预测Moco浓度降低)。该结果表明Moco RNA元件可抑制基因表达最可能通过对Moco生物合成通路中的小分子产物的响应实现。该Moco RNA作为基因“关闭”开关的功能与通过生物信息学预测的机制是一致的。

通过在P3茎中引入突变(M1)破坏Moco RNA的保守二级结构可造成基因表达的脱抑制。相反，使用恢复碱基配对的另外的突变(M2)改变P3序列也可对阿拉伯糖诱导的Moco生物合成恢复基因表达。这些变体呈现的基因控制的破坏及恢复成野生型报告基因表达水平表明了Moco RNA是一种活性需要其保守二级结构的基因控制元件。

v.钼转运会影响Moco RNA的基因控制功能

钼酸盐经mod操纵子编码的高亲和性蛋白依赖的ABC转运体转运至大肠杆菌细胞(Grunden and Shanmugam，1997；Maupin-Furlow et al.，1995)。在未补充钼酸盐的培养基中，估计野生型大肠杆菌的细胞内钼酸盐浓度为1.0μM，而在钼酸盐转运体缺陷株中的细胞内钼酸盐浓度据估计为0.2μM(Scott and Amy，1989)。然而，这种钼酸盐不足及其引起的不利效应可通过向培养基中添加钼酸钠克服。在细胞外高钼酸钠浓度下，硫酸盐转运体系能够输入钼酸盐，使野生型和钼酸盐转运体缺陷株的细胞内钼酸盐浓度达至大约5μM(Scott and Amy，1989；Rosentel etal.，1995)。

为了确定钼酸盐对于149 moaA RNA的基因调节是否是至关重要的，制备了大肠杆菌的modC敲除株以消除高亲和性钼酸盐转运体的功能。然后将该株以moaABCDE诱导型表达质粒以及野生型和突变149moaA报告物融合质粒转化。当在包含痕量钼酸盐的Luria-Bertani(LB)培养基(Sambrook and Russell，2001)上培养时，modC的缺失可造成WT 149 moaA报告物融合物呈现高水平的基因表达(图25c)。相反，当相同的株培养于补充10mM钼酸钠的LB中时，表达被抑制至类似于携带功能性ModC的转化体的水平。这表明，除非在细胞中可获得适当量的钼酸盐，否则存在的经Moco RNA触发基因遏制所需的分子浓度是不足的。

有意思的是，当细胞在补充10mM钨酸钠的LB中培养时，携带modC缺失的转化体中的野生型149 moaA报告物融合构建体变成被脱抑制。如上文指出的，钨可进入细胞并代替钼作为所述辅因子的金属离子组件。然而，如果149 moaA RNA作为代谢物感知核糖开关发挥功能(例如Moco)，它有能力在与钼配位的化合物及与钨配位的类似化合物之间进行区分。在所有情况中，携带破坏(M1)突变和补偿(M2)突变的报告物融合构建物产生了预测的基因表达谱。

vi.生物合成基因中的突变表明Moco是调节配体

基于以上的结果，Moco被推测是可被Moco RNA直接感知的调节因子。为了进一步提供Moco生物合成通路中的具体化合物负责基因表达控制的证据，对该通路中的多种基因进行了敲出突变。除了先前检查过moaA敲除之外(图25b)，制备了mogA、modC或moeA被敲除的株(Δ)，并以moaABCDE诱导型表达质粒和野生型149 moaA报告物融合质粒转化。不论是否有moaABCDE表达质粒的诱导，ΔmogA、ΔmodC和ΔmoeA敲除株都呈现出脱抑制(图26)。这些结果表明，这3种蛋白对于小分子信号的产生是必要的，并且moa操纵子的诱导不能补偿这些蛋白的缺失。

ΔmodC株的基因表达特征类似于以前观测的特征(图25c)，这证明了钼酸盐转运是形成信号传递化合物所需的。然而，ΔmoeA株的特征表明仅钼酸盐不可能为所述信号传递化合物。MoeA催化钼插入至钼喋呤(Moco生物合成通路的最后步骤)，并且该活性是149 moaA RNA调节基因表达所需的。

对于大量的核糖开关类，核糖开关适体感知的配体是被调节的生物合成通路中最后的辅酶或代谢产物(Winkler and Breaker，2005)。Moco是一种在生命所有结构域中广泛存在的化合物，而一些细菌生成可插入至Mo依赖酶的活性位点中的Moco衍生物。Moco是该核糖开关类的最合逻辑的配体。

在大肠杆菌中，在Moco可以插入至一个蛋白之前，它必须被MobA进一步修饰(Iobbi-Nivol et al.，1995；Johnson et al.，1991)。然后，所产生的二MGD形式的Moco(图23b)可插入至钼蛋白(molybdoprotein)中。为了确定Moco的衍生物是否可能为核糖开关配体，如上所述构建ΔmobA株并评估它对报告基因表达的作用。当在含葡萄糖的LB中培养的时候，会出现如在所有其他转化体中的同样的脱抑制(图26)。然而，当细胞被培养在补充有阿拉伯糖的LB中时，对所述报告物融合构建体的抑制会恢复。甚至在无MobA的情况下，细胞能够产生对于抑制受moaA 149 RNA控制的基因表达所需的小分子。这些结果与Moco是负责Moco RNA依赖的基因调节的小分子是一致的。

vii.Moco RNA可区分Moco和Tuco的证据

核糖开关由于其分辨生物合成通路中密切有关的中间体的能力而为人所知。梭菌的种及数个嗜热古细菌种将钨而非钼整合至钼喋呤中，致使密切相关的化合物Tuco形成(Johnson et al.，1993)。Mo和W的原子半径和离子半径基本相同，它们的电子亲和力也基本相同(Kletzin andAdams，1996)。对本研究重要的是，已经证明(Buc et al.，1999)大肠杆菌能够将W整合至最终的W-二MGD辅因子中，然后将该辅因子插入至三甲胺N-氧化物还原酶中。

在以前的研究(Anderson et al.，2000)中，131-nt上游区对moaABCDE操纵子的明显抑制出现在存在Moco的情况下，但它在存在Tuco的情况下脱抑制。该以前的结果与这些数据是一致的(图25c)，这证明了携带Moco RNA-报告物融合构建体的细胞不受在培养基中添加钨酸盐的影响。因此，Moco RNA可区分这两种几乎相同的辅因子。

在检查Moco RNA代表物的系统发生分布和序列比对后，逐渐清楚的是，有两个主要的基序类型。在Moco RNA基序的176个实例中，58个缺乏P3茎。然而，该分组不是严格地沿系统发生的分类分开，这与识别相同配体的核糖开关适体的结构变体繁多(propagation)是一致的。

值得注意的是，两个结构类型的Moco RNA在细菌(表3)中呈现几乎完全相当的Moco和Tuco的利用，表明2个RNA类型使得可选择性识别Moco或Tuco。通过编码被预测使用或转运与这些辅因子相关的化合物的蛋白基因的存在情况，可试验性地鉴定使用Moco或Tuco的生物。包含P3茎的Moco RNA仅与编码合成钼喋呤或Moco的蛋白的基因相关联，并且还仅与编码已知或预测使用Moco作为辅酶的酶的基因相关联。相反，携带缺乏P3茎的Moco RNA代表物的19个生物中的17个还携带预示Tuco代谢的基因。再者，缺乏P3的RNA几乎只与编码与钼喋呤生物合成(钼喋呤是Tuco和Moco生物合成的前体)的酶的基因，或者与编码已知或预测使用Tuco作为辅酶的酶的基因相关联。

Pelobacter carbinolicus显然是按照Moco和Tuco代谢来加以分离的各Moco RNA类型的一个明显例外，Pelobacter carbinolicus具有与预测钼酸盐转运体相关的缺乏P3的RNA(表3，注解a)。然而，该转运体类的成员不能区分钨酸盐，因此该生物中的该转运体对于Tuco生物合成实际上可能是重要的。甚至在携带Moco RNA的两种结构变异的生物中，基本上保持了包含P3及缺乏P3的RNA分别针对Moco和Tuco代谢过程的分离。

两个类型的Moco RNA的显著分离可解释为存在两个差异为存在或不存在P3茎的Moco RNA类型，它们选择性地分别感知Moco或Tuco。然而，已经使大肠杆菌Moco RNA缺失P3茎，但该变化在所有试验的生长条件下都完全地破坏了基因调节。可推测地，仅该缺失不足以将Moco RNA的专一性从Moco转换成Tuco。

如上文指出的，RNA元件的三重排列存在于沃而夫氏互营单胞菌的一个表观7基因操纵子中。该操纵子中的基因被预测编码参与钼喋呤合成、钼酸盐或钨酸盐转运的蛋白，及其他功能未知的基因。该系列中的所有3个RNA都缺乏P3茎。另外，推定的内在转录终止子出现在前两个RNA基序以及在第3基序和所述操纵子的第一ORF之间的长间隔之后。如果每个核糖开关实际上经独立的表达平台发挥功能，并且如果不存在P3茎指示了Tuco结合，那么三重排列可使细胞对较小的Tuco浓度变化格外敏感，与以前描述的串联核糖开关(Welz and Breaker，2007)相比具有更“数字化的”基因控制特征。

2.结论

在大肠杆菌中，ModE和FNR都可上调moaABCDE操纵子的转录。然而，该操纵子的翻译在存在Moco RNA和Moco时被阻止。ModE和FNR调节确保了，moaABCDE转录物仅在细胞中存在需要(被FNR感知的厌氧培养条件)和允许(足以被ModE感知的钼酸盐水平)Moco产生的条件时生成。如果Moco RNA的确为核糖开关，那么它可增加另一层面的调节。Moeo感知核糖开关将确保，如果已存在有足够水平的Moco——这通过游离Moco结合至moaABCDE转录物指示，那么就不会制造Moco生物合成蛋白。该体系使得能快速而有效地对细胞内需求Moco的变化进行响应。

本文给出的实验数据和生物信息学数据表明，与Moco RNA基序一致的RNA可作为Moco感知核糖开关适体或Tuco感知核糖开关适体。该RNA具有与核糖开关功能一致的基因组分布，且149 moaA RNA呈现了依赖于其二级结构的基因控制功能。然而，Moco及其代谢中间体的不稳定性使本发明人不能以通常使用的技术例如直读探测、平衡透析或基于荧光的测定证明这些辅酶对RNA的直接结合。这些后述的实验一般被用于证明配体结合出现在完全无蛋白因子的情况下。

数组证据表明蛋白因子不参与代谢物感知及所述RNA作为一个直接感受器。以前的研究已经鉴定了在大肠杆菌中调节Moco生物合成基因的应答于氧和钼酸盐的蛋白因子(Anderson et al.，2000；Spiro andGuest，1990；Gruden et al.，1999)。然而，在该生物中对于位于moaA基因邻接上游的的调节区没有鉴定到因子。而且，Moco RNA代表物可被分类成两个不同的构架(有和无P3)，并且这些基序类型的分布与生物使用Moco和/或Tuco相关(表3)。如果RNA作为Moco和Tuco的直接感受器，那么这些结构不同的RNA的这种分类可被预测。

Moco RNA还与其他核糖开关代表物共有数种重要的特征。例如，在大肠杆菌中已知存在有另外4类的核糖开关适体对辅酶B₁₂(Nahvi etal.，2004)、硫胺素焦磷酸(Winkler et al.，2002a)、黄素单核苷酸(Winkleret al.，2002b)和赖氨酸(Sudarsan et al.，2003)产生应答。如用Moco RNA(Weinberg et al.，2007)一样，这些核糖开关与RNA组成的非核糖开关基因控制元件(图27)相比都较大，并且它们都具有高水平的核苷酸序列和结构保守性(Barrick and Breaker，2007)。Moco RNA和来自大肠杆菌的已知核糖开关适体的大小都超过100个核苷酸，并携带这样的4至6个茎，即这些茎呈现甚至在来自远亲缘生物的代表物中保持碱基配对事件的核苷酸相关变异的迹象。

来自大肠杆菌结合RNA的已知代谢调节蛋白例如CspA(Phadtareand Inouye，1999)、BglG(Houman et al.，1990)和其他(Liu et al.，1997；Torres-Larios et al.，2002；Vecerek et al.，2005；Richardson andRichardson，1996；Tang and Guest，1999)可识别小得多的RNA伸展区。如果在这些蛋白结合序列中存在任何的二级结构，那么该二级结构通常由单发夹组成。该趋势的一个例外是ThrRS RNA元件(Torres-Larios etal.，2002)，ThrRS RNA元件已形成一个有利于正常结合较大结构化tRNA的氨酰基tRNA合成酶结合的结构。与大多数结合蛋白的RNA基序不同，来自大肠杆菌moaA RNA的Moco RNA跨138个核苷酸并形成至少5个保守的茎环元件。因此，与被蛋白因子结合的大多数RNA基因调节元件相比，Moco RNA的广泛保守的大结构更具有来自大肠杆菌的已知核糖开关RNA的特征。这些特征表明Moco RNA是新发现的代谢物感知核糖开关类的成员。

3.实验步骤

i.寡核苷酸和化学品

合成DNA由耶鲁大学的Howard Hughes Medical Institute Keck基金生物技术资源中心合成。如下化学品购自Sigma-Aldrich：羧苄青霉素、氯霉素、卡那霉素、L-阿拉伯糖、D-葡萄糖、甘油、钼酸钠和钨酸钠。

ii.细菌株和培养基

大肠杆菌株DJ480(MG1655 ΔlacX74)(Cabrera and Jin，2001)获自D.J.Jin(National Institutes of Health)，NEB5α细胞获自NewEngland Biolabs。对应于Wanner基因破坏组的质粒(pKD46、pKD13和pCP20)(Datsenko and Wanner，2000)获自耶鲁大学的大肠杆菌遗传原种中心。如指出的，对每个实验的添加培养基补充物：羧苄青霉素，50μg mL^-1；氯霉素，5μg mL^-1；卡那霉素，50μg mL^-1；L-阿拉伯糖，0.2％(w/v)；D-葡萄糖，0.2％(w/v)。在添加阿拉伯糖的时候将0.2％甘油(w/v)添加至培养基(Guzman et al.，1995)。

iii.Moco RNA的制备

使用通过连续PCR扩增反应产生的模板通过体外转录制备用于直读探测的138 moaA RNA构建体。通过PCR从大肠杆菌K12基因组DNA扩增moaA上游的基因间区，使用的引物为5′-GAATTCCCTGGAGTCAGATTATCCGC(SEQ ID NO：4)和5′-CTGGATCCAGTTGTGAAGCCATGTACAC(SEQ ID NO：5)。在经EcoRI和BamHI消化后，将PCR产物克隆至pRS414中，并通过DNA测序确认所形成质粒的完整性。将该质粒用作模板对编码138 moaA构建体(包括对应于RNA转录物的5′末端的GG插入)的DNA构建体进行PCR扩增，其中用于非模板链的引物包括T7 RNA聚合酶的启动子序列。如以前的描述(Roth et al.，2006)，使用T7 RNA聚合酶通过体外转录制备RNA分子，并使用变性PAGE纯化所制备的RNA分子。

iv.138 moaA RNA的直读探测分析

将通过体外转录制备的40皮摩尔RNA以碱性磷酸酶(RocheDiagnostics)脱磷酸化，并将20皮摩尔使用T4多核苷酸激酶(NewEngland Biolabs)依照制造商提供的步骤以γ-³²P[ATP]放射标记。如以前的描述(Mandal et al.，2003)安排使用通过PAGE纯化的放射性标记RNA的直读探测反应，并在25℃下于包含50mM Tris-HCl(23℃下pH 8.3)、100mM KCl、20mM MgCl₂和约5nM前体RNA的10μL体积中孵育40小时。将所产生的RNA通过使用10％变性PAGE分离，并使用Molecular Dynamics PhosphorImager成像及使用ImageQuaNT软件定量。

v.moaA、mogA、modC、moeA和mobA敲除的生成

如别处的描述(Datsenko and Wanner，2000)使用λ-red重组方法和适当的PCR产物生成具有具体基因缺失的E.coli DJ480株。简而言之，使用质粒pKD13和如下引物通过PCR扩增制备突变体：

moaA，5′-AGGAAGAAATGACTTCGCCTCCCGTATCTGGAAAGGTGTACATGGCTATTCCGGGGATCCGTCGACC(SEQ ID NO：6)和

5′-ACCTGACTCATCTGATCTCTCCTTTTGACGTTTTAGCCGCCAATGTACGATGTAGGCTGGAGCTGCTTCG；mogA(SEQID NO：7)，

5′-TGTATCATTCTGTTTAACGAGACTGTTTAAACGGAAAAATCTTGATGAATATTCCGGGGATCCGTCGACC(SEQ ID NO：8)和

5′-TTGAGATCCCCCCGCTCGGGGGGATTTTTTTATTCGCTAACGTCGCGTCTTGTAGGCTGGAGCTGCTTCG；moeA(SEQ IDNO：9)，

5′-GACATAATAGGCAAATTCGATTTTGCCTCCGCAGGAGTGTTTTCATGGAAATTCCGGGGATCCGTCGACC(SEQ ID NO：10)和

5′-CAGCATCTCCTGATCGCTGAGTTCCGCCATTACAGGCCTCCGAACAACGCTGTAGGCTGGAGCTGCTTCG(SEQ ID NO：11)；

modC，5′-GAATGGCTGGCCAGAATCAGCCGTGAACGGGCGGGGCGCTAATCATGCTGATTCCGGGGATCCGTCGACC(SEQ ID NO：12)和

5′-TTGCCCAGTTCATTTATAGCCACCTGATTAATCAGGCGGTTATCGACACTGTAGGCTGGAGCTGCTTCG(SEQ ID NO：13)；

mobA，5′-GACACGTTAGCAGGGTCAATCCCACAATAAAAGAGGCGATATCGGTGAATATTCCGGGGATCCGTCGACC(SEQ ID NO：14)和

5′-ACTCCACGCGGCAAAGGCGAGTAACGGTATCATCGTTTTTCCTGCCATCGTGTAGGCTGGAGCTGCTTCG(SEQ IDNO：15)。

将所产生约1.4kb长的PCR产物纯化并进行DpnI消化，该PCR产物包含一个卡那霉素抗性盒，该盒侧翼为FLP识别靶位点和与相邻染色体序列相同的50-核苷酸序列种类。将DJ480细胞以Red辅助质粒pKD46转化，该质粒编码来自噬菌体λ的促进同源重组的Red重组酶。对重组体筛选氨苄西林(ampicillin)抗性。将以L-阿拉伯糖培养的DJ480/pKD46细胞以该基因特异的/pKD13 PCR产物转化。通过选择卡那霉素抗性转化体确定PCR产物在DJ480染色体中的重组。通过以对卡那霉素盒均特异的两个内部引物的PCR验证所有产生的缺失突变体：

(k15′-CAGTCATAGCCGAATAGCCT，SEQ ID NO：16和k25′-CGGTGCCCTGAATGAACTGC，SEQ ID NO：17)和侧翼基因特异性引物(moaA 5′-CGCTAGTATCGGCATAACCAC，SEQ ID NO：18和5′-GAATCGCGCAGATAGTGACCG，SEQ ID NO：19，mogA5′-GCTACCTCTTCTGAAGCCTGTCTGT，SEQ ID NO：20和5′-ATGGGTGAAGTACTGAACGAGCAGT，SEQ ID NO：21，moeA5′-GATGGATATGGCATGTAAAGGCAGG，SEQ ID NO：22和5′-AGCACGCGAGAATCTTTCAGCGCCT，SEQ ID NO：23，modC5′-GAGCGGCGAGACTGTGCATTA SEQ ID NO：24和5′-GCAACGCCGATGACGCGGTA SEQ ID NO：25，以及mobA5′-CTTCATTCAGACGTTTACATTTCATAG SEQ ID NO：26和5′-CATCCATATCATGGTGCGTATGCTTA，SEQ ID NO：27)。

然后通过使用FLP质粒pCP20，通过位点特异性重组除去卡那霉素盒。通过以与验证pre-FLP相同的引物的PCR验证所产生的卡那霉素敏感性转化体。

vi.β-半乳糖苷酶翻译融合物和突变体的构建

由缺乏操纵基因结合位点的组成活性的lacUV5启动子驱动的MocoRNA-报告物融合构建体的制备按如下进行。通过PCR从大肠杆菌株K12扩增相对于大肠杆菌moaABCDE操纵子S1转录起始位点第1至145位的核苷酸序列(图23a)，使用包含56 nt lacUV5启动子序列(下划线)(Dickson et al.，1975)的引物5′GAATTCCTCATTAGGCACCCCAGGCTTTACACTTTATGCT TCCGGCTCGTATAATGTGTGGAACCACTAAACACTCTAGCCTC(SEQ ID NO：28)和引物5′-CTGGATCCAGTTGTGAAGCCATGTACAC(SEQ ID NO：29)。在以EcoRI和BamHI消化后，将扩增产物克隆至包含lacZ的无启动子拷贝的pRS414质粒(Simons et al.，1987)中，从而在lacZ的第9密码子和moaA的第5密码子之间的阅读框内融合。将NEB-5α细胞以所产生的质粒转化。对转化体筛选氨苄西林抗性，并通过DNA测序确认lacUV5-Moco基序-lacZ翻译融合物的完整性。使用QuikChange定向诱变试剂盒(Stratagene)和合适的诱变DNA引物，将所有定向诱变引入至Moco核糖开关中。通过DNA测序确认所有突变。

vii.MoaABCDE pBAD33过表达质粒的构建

将moaABCDE操纵子克隆至pBAD33质粒(Guzman et al.，1995)中，以使得可在细胞内对Moco水平进行阿拉伯糖诱导型控制。通过PCR从大肠杆菌K12扩增2.7kb KpnI-HindIII moaABCDE片段，使用的是引物5′-CTAGGTACCTCTGGAAAGGTGTACATGGCTTCACAAC(SEQID NO：30)和5′-TAGAAGCTTAACTACCAGCGTTTTGCCGCCTGCTG(SEQ IDNO：31)。将PCR产物通过琼脂糖凝胶电泳纯化并进行KpnI和HindIII消化，如pBAD33一样。然后将消化的片段连接至阿拉伯糖诱导型启动子下游的pBAD33中，并转化至NEB-5α细胞中。对筛选转化体的氯霉素抗性，并通过DNA测序确认融合体。

viii.突变体株的生成

将moaA、mogA、modC、moeA和mobA敲除DJ480株同时以包含野生型或突变体149 moaA-报告物融合体的lacUV5-Moco基序-lacZ融合pRS414质粒以及moaABCDE pBAD33过表达质粒转化。对转化体筛选氨苄西林抗性和氯霉素抗性。

ix.大肠杆菌149 moaA RNA的基因控制的体内分析

为了测量来自大肠杆菌的野生型和突变报告物株中lacZ的基因表达，将细胞在14mL培养瓶中在37℃下于3mL含所述补充物的LB中摇晃培养过夜。然后在96孔板中将细胞稀释为150μL的LB中时OD₆₀₀为0.05，并在37℃下摇晃培养至A₆₀₀达到0.5和0.7之间，然后收获用于基因表达实验。使用别处描述的96孔微量培养板方案(Blount et al.，2007)测定β-半乳糖苷酶活性。

x.Moco和Tuco代谢的生物信息学分析

通过序列同源分析对多种生物进行Moco和Tuco代谢归属以及对参与3个过程(钼喋呤生物合成、Moco生物合成或利用以及Tuco生物合成或利用；表3)的基因进行Moco RNA基序类型归属。为了鉴定使用但未被实验证明使用Tuco的生物，将BLAST用于搜索与tupA和tupB同源的基因。在嗜氨基酸真杆菌(Eubacterium acidaminophilum)中已表明这些基因编码对钨酸盐特异的转运体(Makdessi et al.，2001)。Pelobacter carbinolicus和Desulfotalea psychrophilia中的Tuco代谢基于存在wtpA同源物而被指定归属，所述wtpA同源物已被表明是钨酸盐的特殊但选择性的转运体(Bevers et al.，2006)。通过检查邻接基因的蛋白产物的注释功能或者如果没有注释则通过使用序列同源性进行功能归属，对以上列出的三个过程进行Moco RNA基序归属。

表3存在或不存在P3与存在Moco相关基因或Tuco相关基因之间的关联。通过在每种生物的基因组中搜索与已知Moco依赖性蛋白及参与钼酸盐转运的蛋白同源的基因，鉴定了携带Moco相关基因的生物。如上针对Moco的描述以及如别处公开的(Bevers et al.，2006；Iyer et al.，2006)，鉴定了携带Tuco相关基因的生物。由于对钼喋呤(moly)的生物合成重要的基因可能参与Moco或Tuco产生，这些基因的存在在不同列中被示出。没有星号不表示该生物缺乏与所指定化合物相关的基因，而是表示本发明人在文献中或基因组数据库搜索中没有发现存在这些基因的证据。对基因的基因组搜索是基于来自NCBI Entrez GenomeProject数据库(http://www.ncbi.nlm.nih.gov/genomes/lproks.cgi)的基因组。

注：阴影框a至c标识出似乎违背RNA类型和Moco或Tuco基因控制之间关联性的仅有实例。然而，a指示了这样的情况，即缺乏P3的RNA与modA关联，所述modA的蛋白产物为一种不能区分钼酸盐和钨酸盐的转运体(Chan et al.，1995)。对于b，缺乏P3的RNA与携带Tuco关联基因COG2414(编码一种钨依赖的醛铁氧还蛋白还原酶)(Harborne et al.，1992)和nirB(编码一种硝酸盐还原酶，并且通常需要Moco)(Clarke et al.，2000)的2基因操纵子相关联。在c中，缺乏P3的RNA与编码推定的利用Moco的亚硫酸盐氧化酶的两个基因相关联。因此，a和b不违背该关联性，同时需要借用其他可能性来解释c中的结果(见正文)。还是在沃而夫氏互营单胞菌中，一个包含P3的RNA与troA相关联，troA被预测编码一种金属转运复合体的组件。一种类似的排列存在于Desulfitobacterium hafniense DCB-2中。然而，TroA和一种固氮酶MoFe蛋白(它是一种包含Moco的蛋白)的结构组织是类似的(Chan et al.，1995)。因此，包含P3的RNA似乎与MoFe固氮酶的一个基因相关联。

表3

注：YES：是；NO：否。

F.实施例6：SAM-IV核糖开关的适体核心可模拟SAM-I核糖开关的配体结合位点

被称为“SAM-IV”的新核糖开关家族是第4组不同的mRNA元件，其被报道经直接感知S-腺苷甲硫氨酸(SAM或AdoMet)调节基因表达。尽管具有以家族特异性核苷酸类型重新排列结构和核苷酸位置，SAM-IV核糖开关与以前描述的SAM-I核糖开关共享保守核苷酸位置。序列分析和分子识别实验表明，SAM-I和SAM-IV核糖开关共享相似的配体结合位点，但具有不同的支架(scaffolds)。这些结果表明RNA具有相当的结构多样性，并显示核糖开关利用该潜力来扩展RNA在基因调节中的范围。

核糖开关为特异性结合一种具体代谢物的mRNA元件，并对响应于代谢物浓度改变的基因表达进行调节(Mandal and Breaker 2004；Winkler and Breaker 2005；Batey 2006；Coppins et al.2007)。许多甲基化酶的辅因子的S-腺苷甲硫氨酸可被3种已公开的核糖开关类识别：SAM-I(Winkler et al.2003；McDaniel et al.2003；Epshtein et al.2003)、SAM-II(Corbino et al.2005)和SAM-III(或S_MK)(Fuchs et al.2006)核糖开关。虽然所有3个核糖开关家族都特异性地识别SAM，但是它们没有明显的序列或结构的相似性。

像例如发现多种自切割核酶一样，多种不同SAM结合核糖开关的发现支持了这样的观点，即RNA具有足够的结构复杂程度来以多种方式解决相同的生物化学难题。此外，两类大核酶——I型内含子和RNase PRNA——的结构研究和序列分析表明在这些RNA中的不同支架可支持核苷酸在催化核心中的同样定位(Michel and Westhof 1990；Krasilnikovet al.2004；Torres-Larios et al.2006；Vicens and Cech 2006)。

在使用生物信息学(Yao et al.2007；Weinberg et al.2007)搜索细菌中新核糖开关时，鉴定了一种被归类为一组新的结合SAM的核糖开关的保守的结构化RNA基序。这些“SAM-IV”核糖开关主要出现在放线菌目例如结核分枝杆菌(Mycobacterium tuberculosis)(结核病的病因)中。SAM-IV核糖开关与SAM-I核糖开关的配体结合核心具有相似性，但别处的构架和核苷酸类型有许多不同。因此，SAM-I和SAM-IV核糖开关具有不同支架，但具有高度相似的配体结合核心。SAM-IV核糖开关的结果表明结构模拟并不局限于大的核酶，这又表明它广泛存在于多种类型的结构化RNA中。

1.结果和讨论

i.SAM-IV基序的鉴定

使用CMfinder比较基因组流程(Weinberg et al.2007；Yao et al.2007)发现了SAM-IV基序。大多数SAM-IV实例位于参与硫代谢的基因上游并推测在其5′UTR中，这表明SAM-IV与结合SAM的核糖开关相符。几乎所有已知的SAM-IV RNA都出现在放线菌目中。

ii.SAM-IV基序核心与SAM-I的核心相似

比较了SAM-IV的高度保守区与SAM-I、SAM-II和SAM-III核糖开关的高度保守区。SAM-IV共享SAM-I结合核心的关键序列和结构特征，但别处出现核苷酸类型的显著差异，并且总体构架有大量偏差(图28)。SAM-I 3-D结构(Montange and Batey 2006)中所有核苷酸具有一个在配体原子

范围内(图28，黑体字母)的原子的核心被鉴定，并基于保守的结构特征的表观相似性将SAM-I位置对映至类似的SAM-IV位置。当周围保守的核苷酸类型或其他特征表明共有类型不可能偶然出现时，将核苷酸类型分类为两基序共有(图28，阴影)。

两基序都具有多茎连接部分，及P3茎中广泛的核苷酸类型的相似性(图28)。P1和P2的结合部分也具有相似性，并且两基序似乎可在P2的末端环和P3 3′的结合部分之间可形成一个假结。为了容纳该假结，SAM-I中的P2具有一个标准的扭结反转(kink-turn)(Lescoute et al.2005；Montange and Batey 2006)。值得注意的是，SAM-IV中P2的内部环可起到类似于所述扭结反转的作用，使得这些RNA采用一种假结结构。

然而，这两种基序具有不同的构架元件及在许多位置(图28，浅阴影)不同的核苷酸保守模式。在SAM-IV中缺少SAM-I核心中的P4发夹，但在SAM-IV的P1之外出现了一种不同的P4发夹。这些P4发夹具有不相似的保守核苷酸类型。除了在该核心外的附加P4之外，SAM-IV可形成SAM-I缺乏的另外的假结。同时，SAM-IV具有与SAM-I很大差异的P2，这是因为它的环和茎长不同于SAM-I，并且序列的相似性似乎很小。实际上，P2中的扭结反转在SAM-I核糖开关中是高度保守的(Barrick and Breaker 2007)，但没有SAM-IV核糖开关序列具有该结构的基序。SAM-I和SAM-IV之间的保守核苷酸类型中的其他差异在P3尖端、P1底部和P33′结合部分中。

因为这些差异，至少在3项以前的研究中基于SAM-I的同源性搜索已经漏检了SAM-IV核糖开关。在第一项研究中，使用PAT程序(Seliverstov et al.2005)对放线菌门基因组搜索了包含SAM-I适体的调节RNA。第二，使用RNA-PATTERN程序(Rodionov et al.2004)对革兰氏阳性菌搜索了SAM-I适体和硫代谢中的其他基因控制元件。第三，使用SequenceSniffer和RAVENNA(Weinberg and Ruzzo 2006)在所有细菌中搜索了已知核糖开关的同源物，这里采用了统计谱技术以对保守的序列和二级结构建立概率模型。所有工作都没有检测到SAM-IV核糖开关，但许多放线菌在不同的基因组同等位处携带SAM-I和SAM-IV两种核糖开关。

SAM-I和SAM-IV相似性主要局限于它们的核心，因此SAM-I和SAM-IV核糖开关可共享相似的结合位点和分子识别特征。这一点得到了SAM-I原子分辨率模型(Montange and Batey 2006)的支持，在该模型中6个核苷酸被提出直接与配体相互作用(图28)。这6个位置的核苷酸类型在除一个之外的所有SAM-I代表物中是严格保守的。在SAM-IV中被提出对应于这些接触配体的位置的6个位置中，5个在所有已知SAM-IV代表物中是保守的，具有与SAM-I核糖开关中相同的核苷酸类型。第6个——U88——在SAM-IV中一般为胞嘧啶，但所有4种核碱基都可出现在该位置。

iii.SAM-IV RNA的分子识别特征

为了评估SAM-IV RNA的分子识别，将直读探测测定(Soukup andBreaker 1999)应用于一种包含在天蓝色链霉菌中发现的SAM-IV的132核苷酸RNA(被称为132 Sc RNA)。在这些测定中，132 Sc RNA可以以约150nM的表观离解常数(K_D)结合于SAM，不同于对S-腺苷高半胱氨酸(SAH)的20μM。腺苷和甲硫氨酸具有弱于1mM的K_D值(图29)。这些值证明132 Sc RNA适体可以以与其他类SAM核糖开关适体相似的亲和性和特异性结合于SAM。

SAM-IV核糖开关的对应于SAM-I中U88的核苷酸不保守(图28)。因为在SAM-I核糖开关中该位置的O2羧基氧被预测可感知SAM配体中硫处的正电荷(Montange and Batey 2006)，所以比较了SAM-I和SAM-IV核糖开关对硫位置处有差异的化合物的亲和性：SAM、SAH、SAH砜(Borchardt and Wu 1974)以及两种氮杂衍生物——AzaAdoMet和MeAzaAdoMet(Thompson et al.1999)。132 Sc RNA以胞嘧啶代替尿嘧啶，作为与U88类似的位置的核碱基。虽然胞嘧啶保留了O2羧基，但是由Watson-Crick G-C对形成的另外的氢键可能会破坏与配体正电荷的相互作用，这可解释U88在SAM-I核糖开关中的完全保守。

将132 Sc RNA的分子识别与以前研究的被称为124 yitJ的SAM-I核糖开关的分子识别(Winkler et al.2003)比较。为了测量核糖开关对配体中修饰的区分，将修饰的配体的K_D除以SAM的K_D的比值。测量了结合SAM及SAM衍生物以产生相似K_D比值的SAM-I和SAM-IV核糖开关(表4)。这些数据表明，虽然SAM-IV中U88保守较弱，但是SAM-IV分子识别类似于SAM-I。

iv.SAM-IV是一种基因调节元件

为了确定SAM-IV是否在体内调节基因表达，将包含SAM-IV的天蓝色链霉菌座位SCO2146上游基因间区克隆为一个xylE报告基因的翻译融合物。因为不能容易地在SAM-IV基因间区鉴定到启动子，所以将该区域至于甘油诱导型启动子(Kieser et al.2000)控制下。

大多数已知SAM核糖开关在结合SAM时降低基因表达，从而降低在高水平SAM时无需其蛋白产物的基因的表达。为了试验SAM-IV是否为一种基因调节元件，进行了预测会破坏或恢复SAM-IV核糖开关功能的突变。第一突变(M1)改变了预测可直接接触SAM的位置，这一点的进行是通过推测这些核苷酸类似于SAM-I适体中的那些核苷酸。第二突变(M2)可破坏保守二级结构中的碱基配对。第三突变(M3)经可恢复野生型活性的补偿突变恢复了M2中失去的碱基配对。

在复杂培养基中生长后，在携带4种核糖开关-报告物融合体的每一种的天蓝色链霉菌细胞中测量了XylE活性，其中SAM的细胞浓度被预测是充足的。如预测的，具有M1和M2核糖开关的株显示了比具有野生型或M3核糖开关的株更高的报告基因表达(图30)。这些结果表明，来自天蓝色链霉菌的SAM-IV RNA是一种基因控制元件，分子识别实验表明SAM-IV RNA应对SAM应答。在细胞SAM浓度逐渐耗尽的条件下测量了报告基因表达，但由于所使用构建物的报告基因表达水平非常低而使这些结果是不确定的。

硫代谢的基因调节在链霉菌中是特别受到关注，这是因为SAM水平可影响这些物种中的抗生素产生和孢子形成(Kim et al.2003；Okamotoet al.2003)。一些明显被SAM-IV调节的基因(如SCO2146)被预测为硒代半胱氨酸(selenocysteine)裂合酶。例如，它们可在硫代谢中起作用。

v.SAM-IV的进化历史

本文给出了一种可解释趋异进化的模型。在该模型中，一种SAM-I样祖先失去其P4茎，之后由失去P4造成的任何负面效应都通过将不同的P4茎3′增加至P1茎被补偿，最终形成SAM-IV样RNA。3个事实与该模型相符。第一，SAM-IV几乎局限于放线菌目，而SAM-I存在于该分类群和许多其他分类群中，这表明如果它们共有一个祖先，那么它将可能与SAM-I相似。第二，P4被发现仅参与形成支架(Montange andBatey 2006)，因此它更容易被替换。第三，一些SAM-I核糖开关完全缺乏P4茎和环，因此P4缺失是可允许的。

vi.SAM-IV核糖开关的分类和重要性

通过多种标准将蛋白分类成家族和超家族(Orengo and Thornton2005)。最初的标准仅仅是基于序列同源性(Dayhoff et al.1976)。其他小组继承了该先例(例如Barker et al.1996)，但一些小组还考虑结构或功能相似性(Murzin et al.1995)。一般而言，按家族分类的蛋白具有明显的同源性，而按超家族分组的蛋白似乎亲缘更远并且同源性仅被认为是“可能的”(Murzin et al.1995；Dayhoff et al.1976)。考虑到SAM-I和SAM-IV核糖开关之间不相容的保守和重排列结构的模式，并且由于它们的相似性避开了现有技术的序列分析方法，本发明人提出它们构成不同的家族。然而，它们的核心的相似性足以暗示可将它们分类为单个的超家族。对SAM-IV核糖开关的3-D结构研究可能有助于细化它们的分类。核糖开关已形成“类(class)”和“类型(type)”。类定义一组共享结构和功能特征的核糖开关，而类型被用于对属于同一类但携带不同亚结构的RNA分组。为了将该术语与对同源蛋白分组的术语关联，“类”对应于“家族”，“类型”对应于“亚家族”。

其他的核糖开关家族显示出了结构多样性，但可能是与SAM-I和SAM-IV核糖开关之间相关性不同的性质。例如，可基于环序列将preQ₁-I核糖开关分至各亚家族(Roth et al.2007)。同时，以前报道的腺苷钴胺素结合的核糖开关(Nahvi et al.2004)缺乏正常的保守结构域，而其3′侧翼序列对于配体识别是必需的。该变体对嘌呤基钴胺素呈现了比典型腺苷钴胺素核糖开关更优的亲和性，因此该变体的结合核心是可改变的。

这些结果证明了核糖开关RNA可使用多种构架来将关键核苷酸定位至同一结合位点上。考虑到对I型内含子和RNase P RNA的类似结果，本文得出大范围的RNA会呈现这种现象的结论。RNA的结构集合的这种稳定的天然用途支持了这样的结论，即RNA是分子感知和基因控制的有效且多能的聚合物。

2.材料和方法

i.生物信息学

使用CMfinder比较基因组流程鉴定了SAM-IV基序，并使用以前确立的策略(Weinberg et al.2007；Yao et al.2007)推断其比对，但使用了版本21的RefSeq(Pruitt et al.2005)。SAM-I比对数据公布于别处(Barrick and Breaker 2007)。如以前的报道(Weinberg et al.2007)计算了图28中呈现的保守性统计值。

ii.微生物遗传和质粒

为了试验核糖开关对基因表达的控制，本发明人克隆了编码邻苯二酚2，3-双加氧酶的xylE报告基因(Kieser et al.2000)上游包含SAM-IV的天蓝色链霉菌基因间序列。邻苯二酚2，3-双加氧酶将邻苯二酚转变成2-羟粘康酸半醛，其在375nm下的吸光度使得可进行比色测定。本发明人使用了pMT3226(Kieser et al.2000)，这是一种在大肠杆菌中复制并包括阿泊拉霉素(apramycin)抗性基因和甘油诱导型启动子下游的xylE报告基因的整合性链霉菌质粒。为了构建xylE基因的翻译融合体，以引物5′-GAAGAGGTGACGTCATGGATCCGAACAAAGGTGTA ATGC(SEQ ID NO：32)及其反向互补序列通过QuikChange(Stratagene)将第二BamHI位点添加至pMT3226。通过PCR从基因组DNA扩增了包含SAM-IV的天蓝色链霉菌基因间区，使用的引物是5′-CTAGGATCCGCCACGCGTAGCGGCCCTGGTGTGT(SEQ ID NO：33)和5′-GTAGGATCCACAGCGGTGGGTACGGACATGGCG(下划线为BamHI位点，SEQ ID NO：34)。为了帮助高G+C DNA产物的扩增，PCR反应包含1.3M甜菜碱(Sigma-Aldrich)和5％DMSO(Frackman et al.1998)。为了组装“pEZ35”，以BamHI切割pMT3226和PCR产物，通过琼脂糖凝胶纯化从pMT3226除去小片段并连接DNA分子，通过测序验证正确的序列和方向。通过QuikChange制备了包含突变体核糖开关(M1、M2、M3)的载体。通过结合(Kieser et al.2000)将质粒导入至天蓝色链霉菌M145中。从在28℃下培养于MS琼脂(Kieser et al.2000)上的细胞收获接合后体的孢子原种，并在-20℃下保存于15％的甘油中。将硫酸阿泊拉霉素(Sigma-Aldrich)以100μg/mL用于大肠杆菌，或以50μg/mL用于天蓝色链霉菌。

为了开始遗传实验，将孢子原种在冰上解冻，用1mL的曲通X-100(triton X-100)缓冲物(Hodgson 1982)洗涤，并再悬浮于1mL dH₂O中。将该混合物接种至25mL培养物中至相对于H₂O测得A₄₅₀(Hodgson1982)为约0.03。培养基为无右旋糖的24g/L胰酶大豆肉汤(TSB)(Becton Dickinson)、4％甘油、20μg/mL硫酸阿泊拉霉素(除缺乏载体的细胞之外)和12.5μg/mL萘啶酸钠(Sigma-Aldrich)，以降低污染的风险。将培养物在28℃下于250mL烧瓶中摇晃培养50.5小时。然后测量无细胞的提取物中的XylE活性(Kieser et al.2000)。由于粗提取物中剩余的细胞碎片会增加XylE酶曲线的噪音，将上清液在离心两次后提取，然后通过0.2μm孔膜(Whatman)过滤，之后离心20分钟。反应包括1mL无邻苯二酚的测定缓冲物、100μL无细胞提取物、10μL20mM邻苯二酚，并且在Varian 50 Bio分光光度计上每6秒测量375nm下的吸光度持续20分钟。尽管进行了过滤，但有时仍存在吸收可见光全波长的剩余碎片，包括375nm。当在480nm(不被XylE反应产物显著吸收的波长)下经20分钟的变化超过0.0004并且大小与375nm的变化量相当时，本发明人丢弃该结果并制备新的反应。使用A₃₇₅下经完整20分钟的变化估计XylE活性，如以前报道的(Kieser et al.2000)，这比仅使用线性区间的可重复性强。

iii.直读探测测定

以引物5′-TAATACGACTCACTATAGGTTTTTCGACAGGTCATGAGTGACAGTC(下划线为T7 RNA聚合酶启动子序列，SEQ ID NO：35)和5′-AGGGGTCCGCGCTTGCCGTGGACCTTGCTG(SEQ ID NO：36)，通过PCR扩增对应于pEZ35质粒(上文)中适体的DNA。通过体外转录、脱磷酸化以及使用以前描述的方案(Roth et al.2007)以[γ-³²P]ATP放射标记，从PCR产物制备5′³²P-标记的RNA分子。制备了直读探测反应，将5′³²P-标记片段通过变性PAGE进行分辨并如以前的描述(Rothet al.2007)进行成像。

表4.SAM-I和SAM-IV的分子识别。列出了SAM衍生物的K_D值，为给定化合物与SAM的K_D比值。在以前计算了SAM-I K_D值(Limet al.2006)。在以前描绘了化合物结构(Lim et al.2006)，使用了如下的编号方案：SAM(化合物1)、SAH(2)、SAH砜(4)、AzaAdoMet(5)和MeAzaAdoMet(6)。

表4

应理解，所公开的方法和组合物不限于所述的具体方法、方案和试剂，因而它们可有所变化。还应理解，本文所用的术语只是为了描述具体实施方案而不意欲限制本发明的范围，本发明的范围只被所附的权利要求书所限制。

必须注意的是，除非上下文中另外明确指出，在本说明书和所附权利要求书中使用的单数形式的“一”、“一种”和“该”包括复数指代对象。因此，例如，提及“一种核糖开关”时包括多个这样的核糖开关，提及“该核糖开关”时是指本领域技术人员已知的一个或多个核糖开关及其等价物，等等。

“任选的”或“任选地”是指后面描述的事件、情况或材料可能发生或存在，也可能不发生或不存在，且该描述包括所述事件、情况或材料发生或存在以及不发生或不存在的情形。

范围在本文中可被表示为从“大约”一个具体值，和/或到“大约”另一个具体值。当表示为这样一个范围时，除非上下文另外特别指出，否则也具体地考虑和认为公开了从所述的一个具体值和/或到所述的另一个具体值的范围。类似地，当通过在前面使用“大约”将数值表示为近似值时，除非上下文另外特别指出，否则应理解成该具体数值可形成另一个应认为被公开的具体考虑的实施方案。还应理解，除非上下文另外特别指出，每个范围的端点在与另一个端点相关或独立于另一个端点时都是有意义的。最后，应该理解的是，除非文中另外特别说明，否则在明确公开的范围中所包括的所有单个的数值和子范围也被特别考虑和认为被公开。不论在具体的情况下这些实施方案的全部或部分是否被明确地公开，上述的原则都适用。

除非另外定义，否则本文所用的所有技术术语和科学术语都具有与所公开方法和组合物所属领域的技术人员通常理解的相同含义。尽管与本文所述方法和材料类似或相当的任何方法和材料都可用于本发明方法和组合物的实施或检测，但是本文仍然描述了特别有用的方法、设备和材料。本文引用的出版物和引用它们时的目的内容在此特别地以援引的方式纳入本文。本文不应被解释为承认本发明不能先于在先发明的这些公开内容。且并非承认任何参考文献都构成现有技术。参考文献的讨论说明了它们的作者的论断，但是本申请人保留怀疑所引用文献的正确性和相关性的权利。可以清楚地理解，虽然本文中提及了许多出版物，但是这些参考文献并不表示承认任何这些文件都构成本领域的公知常识的一部分。

在通篇本申请的说明书和权利要求中，词语“包含”和该词的变化形式如“包括”和“含有”意指“包括但不限于”，而不意欲排除例如其他添加剂、组件、整数或步骤。

本领域的技术人员仅使用常规的实验即可认识到或能够确定本文所述方法和组合物的具体实施方案的许多等价方案。这种等价方案意欲被随附的权利要求书所涵盖。

参考文献

Abreu-Goodger，C.，and Merino，E.2005.RibEx：a web server for locatingriboswitches and other conserved bacterial regulatory elements.Nucleic Acids Res.33：W690-692.

Akakura，R.，and Winans，S.C.(2002).Mutations in the occQ operator thatdecrease OccR-induced DNA bending do not cause constitutive promoter activity.Journal Of Biological Chemistry 277，15773-15780.

Akimoto，H.et al.Queuine analogues.Their synthesis and inhibition of growth ofmouse L5178Y cells in vitro.J.Med.Chem.29，1749-1753(1986).

Akimoto，H.，Imamiya，E.，Hitaka，T.，Nomura，H.&Nishimura，S.Synthesis ofqueuine，the base of naturally occurring hypermodified nucleoside(queuosine)，and itsanalogues.J.Chem.Soc.Perkin Trans.1，1637-1644(1988).

Altschul，S.F.，Madden，T.L.，Schaffer，A.A.，Zhang，J.，Zhang，Z.，Miller，W.andLipman，D.J.(1997)Gapped BLAST and PSI-BLAST：a new generation of proteindatabase search programs.Nucleic Acids Research，25，3389-3402.

Anderson，L.A.，McNairn，E.，Lubke，T.，Pau，R.N.&Boxer，D.H.ModE-dependent molybdate regulation of the molybdenum cofactor operon moa in Escherichiacoli.J.Bacteriol.182，7035-7043(2000).

Arsène-Ploetze，F.，Nicoloff，H.，and Bringel F.2005.Lactobacillus plantarum cclgene is non-essential，arginine-repressed and codes for a conserved protein in Firmicutes.Arc.Microbiol. 183：307-316.

Ausubel，F.M.，Brent，R.，Kingston，R.E.，Moore，D.D.，Seidman，J.G.，Smith，J.A.，and Struhl，K.(1992).Short Protocols in Molecular Biology：A Compendium ofMethods from Current Protocols in Molecular Biology(New York：John Wiley&Sons，Inc.).

Axmann，I.M.，Kensche，P.，Vogel，J.，Kohl，S.，Herzel，H.and Hess，W.R.(2005)Identification of cyanobacterial non-coding RNAs by comparative genome analysis.Genome Biology，6，R73.

Bader，G.，Gomez-Ortiz，M.，Haussmann，C.，Bacher，A.，Huber，R.&Fischer，M.Structure of the molybdenum-cofactor biosynthesis protein MoaB of Escherichia coli.Acta Cryst.D60，1068-1075(2004).

Baker，K.P.&Boxer，D.H.Regulation of the chlA locus of Escherichia coli K12：involvement of molybdenum cofactor.Mol Microbiol.5，901-907(1991).

Barker，W.C.，Pfeiffer，F.，and George，D.G.1996.Superfamily classification inPIR-International Protein Sequence Database.Methods Enzymol.266：59-71.

Barrick，J.E.，Corbino，K.A.，Winkler，W.C.，Nahvi，A.，Mandal，M.，Collins，J.，Lee，M.，Roth，A.，Sudarsan，N.，et al.2004.New RNA motifa suggest an expanded scopefor riboswitches in bacterial gene control.Proc.Natl.Acad.Sci.USA 101：6421-6426.

Barrick，J.E.&Breaker，R.R.The distributions，mechanisms，and structures ofmetabolite-binding riboswitches.Genome Biol.8，R239(2007).

Bassler，B.L.and Losick，R.(2006)Bacterially Speaking.Cell，125，237-246.

Batey，R.T.，Gilbert，S.D.，and Montagne，R.K.2004.Structure of a naturalguanine-responsive riboswitch complexed with the metabolite hypoxanthine.Nature 432：411-415.

Batey，R.T.(2006)Structures of regulatory elements in mRNAs.Curr Opin StructBiol，16，299-306.

Baugh，P.E.，Collison，D.，Garner，C.D.&Joule，J.A.Molybdenummetalloenzymes.In：Comprehensive Biological Catalysis，M.Sinnott，Ed.，AcademicPress，Vol.III，pp.377-400(1998).

Bevers，L.E.，Hagedoorn，P.L.，Krijger，G.C.&Hagen，W.R.Tungsten transportprotein A(WtpA)in Pyrococcus furiosus：the first member of a new class of tungstateand molybdate transporters.J.Bacteriol.188，6498-6505(2006).

Beyhan，F.H.Yildiz，Mol.Microbiol.63，995(2007).

Bienz，M.and Kubli，E.2001.Wild-type tRNA TyrG reads the TMV RNA stopcodon，but Q base-modified tRNA TyrQ does not.Nature 294：188-190.

Blaise，M.et al.A minimalist glutamyl-tRNA synthetase dedicated toaminoacylation of the tRNAAsp QUC anticodon.Nucleic Acids Res.32，2768-2775(2004).

Blount，K.F.，Wang，J.X.，Lim，J.，Sudarsan，N.&Breaker，R.R.Antibacteriallysine analogs that target lysine riboswitches.Nat.Chem.Biol.3，44-49(2007).

Bocobza，S.，Adato，A.，Mandel，T.，Shapira，M.，Nudler，E.，and Aharoni，A.(2007).Riboswitch-dependent gene regulation and its evolution in the plant kingdom.Genes Dev.21，2874-2879.

Borchardt，R.T.and Wu，Y.S.1974.Potential inhibitors of S-adenosylmethionine-dependent methyltransferases.1.Modification of the amino acid portion of S-adenosylhomocysteine.J.Med.Chem.17：862-868.

Breaker，R.R.(2004).Natural and engineered nucleic acids as tools to explorebiology.Nature 432，838-845.

Breaker，R.R.(2006).Riboswitches and the RNA World.In：The RNA World.Gesteland，R.F.，Cech，T.R.，Atkins，J.F.eds.Cold Spring Harbor Laboratory Press，ColdSpring Harbor Laboratory，NY.，pp.89-107.

Breaker，Science 319，1795(2008).

Buc，J.et al.Enzymatic and physiological properties of the tungsten-substitutedmolybdenum TMAO reductase from Escherichia coli.Mol.Microbiol 32，159-168(1999).

Bunka，D.H.，and Stockley，P.G.(2006).Aptamers come of age-at last.Nat.Rev.Microbiol.4，588-596.

Cabrera，J.E.&Jin，D.J.Growth phase and growth rate regulation of the rapAgene，encoding the RNA polymerase-associated protein Rap A in Escherichia coli.J.Bacteriol.183，6126-6134(2001).

Cameron，M.Volar，L.A.Bannister，R.J.Redfield，Nucleic Acids Res.36，10(2008).

Chan et al.，Proc.Natl.Acad.Sci.USA 101，17084(2004).

Chan，M.K.，Mukund，S.，Kletzin，A.，Adams，M.W.&Rees，D.C.Structure of ahyperthermophilic tungstopterin enzyme，aldehyde ferredoxin oxidoreductase.Science267，1463-1469(1995).

Cheah，M.T.，Wachter，A.，Sudarsan，N.，and Breaker，R.R.(2007).Control ofalternative RNA splicing and gene expression by eukaryotic riboswitches.Nature 447，497-U497.

Clarke，T.E.，Ku，S.-K.，Dougan，D.R.，Vogel，H.J.&Tari，L.W.The structure ofthe ferric siderophore binding protein FhuD complexed with gallichrome.Nat.Struct.Biol.7，287-291(2000).

Claverie，J.M.(2005)Fewer genes，more noncoding RNA.Science，309，1529-1530.

Cochrane，J.C.，Lipchock，S.V.，and Strobel，S.A.(2007).Structural investigationof the GlmS ribozyme bound to its catalytic cofactor.Chem.Biol.14，97-105.

Coppins，R.L.，Hall，K.B.，and Groisman，E.A.2007.The intricate world ofriboswitches.Curr.Opin.Microbiol.10：176-181.

Corbino，K.A.，Barrick，J.E.，Lim，J.L.，Welz，R.，Tucker，B.，Puskarz，I.，Mandal，M.，Rudnick，N.D.，and Breaker，R.R.2005.Evidence for a second class of S-adenosylmethiothine riboswitches and other regulatory RNA motifs in alpha-proteobacteria.Genome Biol.6：R70.

Costa，F.Michel，EMBO J.14，1276(1995).

Costa，M.&Michel，F.Frequent use of the same tertiary motifby self-foldingRNAs.EMBO J.14，1276-1285(1995).

Costa，M.and Michel，F.(1997)Rules for RNA recognition of GNRA tetraloopsdeduced by in vitro selection：comparison with in vivo evolution.EMBO J，16，3289-3302.

Coventry，A.，Kleitman，D.J.and Berger，B.(2004)MSARI：Multiple sequencealignments for statistical detection of RNA secondary structure.Proceedings of theNational Academy of Sciences of the Unites States of America，101，12102-12107.

Curtis，S.E.(1988)Structure，organization and expression of cyanobacterial ATPsynthase genes.Photosynthesis Research，18，223-244.

Das，R.，Laederach，A.，Pearlman，S.M.，Herschlag，D.，and Altman，R.B.(2005).SAFA：Semi-automated footprinting analysis software for high-throughput quantificationof nucleic acid footprinting experiments.RNA-a Publication of the RNA Society 11，344-354.

Datsenko，K.A.&Wanner，B.L.One-step inactivation of chromosomal genes inEscherichia coli K-12 using PCR products.Proc.Natl.Acad Sci.USA 97，6640-6645(2000).

Dayhoff，M.O.，Barker，W.C.，and Hunt，L.T.1976.Protein superfamilies.InAtlas of Protein Sequence and Structure，vol.5，suppl.2(ed.M.O.Dayhoff).NationalBiomedical Research Foundation，Washington，DC.

Della Ragione，F.，Porcelli，M.，Carteni-Farina，M.，Zappia，V.，and Pegg，A.E.(1985).Escherichia coli S-adenosylhomocysteine/5′-methylthioadenosine nucleosidase.Purification，substrate specificity and mechanism of action.Biochem.J.232，335-341.

Dewey，V.&Kidder，G.W.Partial purification and properties of a nucleosidehydrolase from Crithidia.Arch.Biochem.Biophys.157，380-387(1973).

Dickson，R.C.，Abelson，J.，Barnes，W.M.&Reznikoff，W.S.Genetic regulation：the Lac control region.Science 187，27-35(1975).

Dillon，P.J.and Rosen，C.A.1990.A rapid method for the construction ofsynthetic genes using the polymerase chain-reaction.Biotechniques 9：298-300.

Durand，J.M.et al.vacC，a virulence-associated chromosomal locus of Shigellaflexneri，is homologous to tgt，a gene encoding tRNA-guanine transglycosylase(T gt)ofEscherichia coli K-12.J.Bacteriol.176，4627-4634(1994).

Eddy，S.R.&Durbin，R.RNA sequence analysis using covariance models.Nucleic Acids Res.22，2079-2088(1994).

Eddy，S.R.INFERNAL.Version 0.55.Distributed by the author.Dept.ofGenetics，Washington University School of Medicine.St.Louis，Missouri.(2003).

Eddy，S.R.(2005)Infernal User′s Guide.

Edwards，T.E.，and Ferré-D’Amaré，A.R.(2006).Crystal structures of the thi-boxriboswitch bound to thiamine pyrophosphate analogs reveal adaptive RNA-smallmolecule recognition.Structure 14，1459-1468.

Egli et al.，Proc.Natl.Acad.Sci.USA 87，3235(1990).

Epshtein，V.，Mironov，A.S.，and Nudler，E.2003.The riboswitch-mediatedcontrol of sulfur metabolism in bacteria.Proc.Natl.Acad.Sci.USA 100：5052-5056.

Famulok，M.RNAs turn on in tandem.Science 306，233-234(2004).

Finn，R.D.，Mistry，J.，Schuster-

B.，Griffiths-Jones，S.，Hollieh，V.，Lassmann，T.，Moxon，S.，Marshall，M.，Khanna，A.，Durbin，R.，Eddy，S.et al.2006.Pfam：clans，webtools and services.Nucleic Acids Res.24：D247-251.

Frackman，S.，Kobs，G.，Simpson，D.，and Storts，D.1998.Betaine and DMSO：enhancing agents for PCR.Promega Notes 65：27.

Frey，B.，Janel，G.，Michelsen，U.&Kersten，H.Mutations in the Escherichia colifnr and tgt genes：control of molybdate reductase activity and the cytochrome d complexby fnr.J.Bacteriol.171，1524-1530(1989).

Frey，B.，McCloskey，J.，Kersten，W.&Kersten，H.New function of vitamin B12：cobamide-dependent reduction of epoxyqueuosine to queuosine in tRNAs of Escherichiacoli and Salmonella typhimuriurn.J.Bacteriol.170，2078-2082(1988).

Fuchs，R.T.，Grundy，F.J.，and Henkin，T.M.2006.The SMK box is a newSAM-binding RNA for translational regulation of SAM synthesis.Nat.Struct.Mol.Biol.13：226-233.

Galperin，A.N.Nikolskaya，E.V.Koonin，FEMS Microbiol.Lett.203，11(2001).

Garcia Martin，N.Ivanova，V.Kunin，F.Warnecke，K.W.Barry，A.C.McHardy，C.Yeates，S.He，A.A.Salamov，E.Szeto，et al.，Nat.Biotechnol.24，1263(2006).

Gaur，R.and Varshney，U.2005.Genetic analysis identifies a function for thequeC(ybaX)gene product at an initial step in the queuosine biosynthetic pathway inEscherichia coli.J.Bacteriol.187：6893-6901.

Gebhardt，K.，Shokraei，A.，Babaie，E.，and Lindqvist，B.H.(2000).RNAaptamers to S-adenosylhomocysteine：kinetic properties，divalent cation dependency，andcomparison with anti-S-adenosylhomocysteine antibody.Biochemistry 39，7255-7265.

Gerstein，M.，Sonnhammer，E.L.L.and Chothia，C.(1994)Volume changes inprotein evolution.Journal of Molecular Biology，236，1067-1078.

Gilbert，S.D.，Stoddard，C.D.，Wise，S.J.&Batey，R.T.Thermodynamic andkinetic characterization of ligand binding to the purine riboswitch aptamer domain.J.Mol.Biol.359，754-768(2006).

Gilbert，S.D.，Stoddard，C.D.，Wise，S.J.，and Batey，R.T.(2006)Thermodynamicand kinetic charaeterization of ligand binding to the purine riboswitch aptamer domain.J.Mol.Biol.359，754-768.

Gill，M.Pop，，R.T.Deboy，P.B.Eckburg，P.J.Turnbaugh，B.S.Samuel，J.I.Gordon，D.A.Relman，C.M.Fraser-Liggett，K.E.Nelson，Science 312，1355(2006).

Gold L.，Polisky，B.，Uhlenbeck，O.，and Yarus，M.(1995)Diversity ofoligonucleotide functions.Annu.Rev.Biochem.64，763-797.

Gottfried，P.，Kolot，M.and Yagil，E.(2001)The effect of mutations in the Xis-binding sites on site-specific recombination in coliphage HK022.Mol Genet Genomics，266，584-590.

Govind，J.A.Fralick，R.D.Rolfe，J.Bacteriol.188，2568(2006).

Great Britain patent number 981458(1965).

Griffiths-Jones，S.RALEE-RNA ALignment Editor in Emacs.Bioinformatics 21，257-259(2005).

Griffiths-Jones，S.，Moxon，S.，Marshall，M.，Khanna，A.，Eddy，S.R.andBateman，A.(2005)Rfam：annotating non-coding RNAs in complete genomes.NucleicAcids Research，33，12l-124.

Gruden，A.M.，Self，W.T.，Villain，M.，Blalock，J.E.&Shanmugan，K.T.Ananalysis of the binding of repressor protein ModE to modABCD(molybdate transport)operator/promoter DNA of Escherichia coli.J.Biol.Chem.274，24308-24315(1999).

Grunden，A.M.&Shanmugam，K.T.Molybdate transport and regulation inbacteria.Arch.Microbiol.168，345-354(1997).

Guérout-Fleury，A.M.，Frandsen，N.&Stragier，P.Plasmids for ectopicintegration in Bacillus subtilis.Gene 180，57-61(1996).

Gündüz，U.&Katze，J.R.Queuine salvage in mammalian cells.Evidence thatqueuine is generated from queuosine 5′-phosphate.J.Biol.Chem.259，1110-1113(1984).

Gündüz，U.&Katze，J.R.Salvage of the nucleic acid base queuine from queuine-containing tRNA by animal cells.Biochem.Biophys.Res.Commun.109，159-167(1982).

Gusarov，I.&Nudler，E.The mechanism of intrinsic transcription termination.Mol.Cell 3，495-504(1999).

Guzman，L.M.，Belin，D.，Carson，M.J.&Beckwith，J.Tight regulation，modulation，and high-level expression by vectors containing the arabinose P_BADpromoter.J.Bacteriol.177，4121-4130(1995).

Harada F.and Nishimura，S.1972.Possible anticodon sequences of tRNA^His，tRNA^Asn，and tRNA^Asp from Escherichia coli B.Universal presence of nucleoside Q inthe first position of the anticodons of these transfer ribonucleic acids.Biochemistry 11：301-308.

Harborne，N.R.，Griffiths，L.，Busby，S.J.&Cole，J.A.Transcriptional control，translation and function of the products of the five open reading frames of theEscherichia coli nir operon.Mol.Microbiol.6，2805-2813(1992).

He，L.and Hannon，G.J.(2004)microRNAs：small RNAs with a big role in generegulation.Nature Reviews.Genetics，5，522-531.

Hendrix，D.K.，Brenner，S.E.and Holbrook，S.R.(2005)RNA structural motifs：building blocks of a modular biomolecule.Q Rev Biophys，38，221-243.

Henkin，T.M.and Yanofsky，C.(2002)Regulation by transcription attenuation inbacteria：how RNA provides instructions for transcription termination/antiterminationdecisions.Bioessays，24，700-707.

Hermes，M.，Osswald，H.，Mattar，J.，and Kloor，D.(2004).Influence of an alteredmethylation potential on mRNA methylation and gene expression in HepG2 cells.Experimental Cell Research 294，325-334.

Heus，H.A.&Pardi，A.Structural features that give rise to the unusual stability ofRNA hairpins containing GNRA loops.Science 253，191-194(1991).

Hodgson，D.A.1982.Glucose repression of carbon source uptake in Streptomycescoelicolor A3(2)and its perturbation in mutants resistant to 2-deoxyglucose.J.Gen.Microbiol.128：2417-2430.

Houman，F.，Diaz-Torres，M.R.&Wright，A.Transcriptional antitermination inthe bgl operon of E.coli is modulated by a specific RNA binding protein.Cell 62，1153-1163(1990).

Hurt，J.K.，Olgen，S.，and Garcia，G.A.2007.Site-specific modification ofShigella flexneri virF mRNA by tRNA-guanine transglycosylase in vitro.Nucleic AcidsRes.35：4905-4913.

Iobbi-Nivol，C.，Palmer，T.，Whitty，P.W.，McNairn，E.&Boxer，D.H.The moblocus of Escherichia coli K12 required for molybdenum cofactor biosynthesis isexpressed at very low levels.Microbiology 141，1663-1671(1995).

Itoh，Y.，Watson，J.M.，Haas，D.，and Leisinger，T.(1984)Genetic and molecularcharacterization of the Pseudomonas plasmid pVS1.Plasmid 11，206-220.

Iwata-Reuyl，D.Biosynthesis of the 7-deazaguanosine hypermodified nucleosidesof transfer RNA.Bioorg.Chem.3l，24-43(2003).

Iyer，L.M.，Burroughs，A.M.&Aravind，L.The prokaryotic antecedents of theubiquitin-signaling system and the early evolution of ubiquitin-like β-grasp domains.Genome Biol.7，R60(2006).

Jenal，J.Malone，Annu.Rev.Genet.40，385(2006).

Johnson，J.L.，Indermaur，L.W.&Rajagopalan，K.V.Molybdenum cofactorbiosynthesis in Escherichia coli.Requirement of the chlB gene product for the formationof molybdopterin guanine dinucleotide.J.Biol.Chem.266，12140-12145(1991).

Johnson，J.L.，Rajagopalan，K.V.，Mukund，S.&Adams，M.W.Identification ofmolybdopterin as the organic component of the tungsten cofactor in four enzymes fromhyperthermophilic Archaea.J.Biol.Chem.268，4848-4852(1993).

Joseph，J.R.Fantino，M.L.Herbaud，F.Denizot，FEMS Microbiol.Lett.205，91(2001).

Kanehisa，M.，Goto，S.，Hattori，M.，Aoki-Kinoshita，K.F.，Itoh，M.，Kawashima，S.，Katayama，T.，Araki，M.and Hirakawa，M.(2006)From genomics to chemicalgenomics：new developments in KEGG.Nucleic Acids Res，34，D354-357.

Kieser，T.，Bibb，M.J.，Buttner，M.J.，Chater，K.F.，and Hopwood，D.A.2000.Practical Streptomyces Genetics.The John Innes Foundation，Norwich，UK.

Kim，B.-C.，Qian，X.，Leang，C.，Coppi，M.V.and Lovley，D.R.(2006)TwoPutative c-Type Multiheme Cytochromes Required for the Expression of OmcB，an OuterMembrane Protein Essential for Optimal Fe(III)Reduction in Geobacter sulfurreducens.JBact，188，3138-3142.

Kim，D.J.，Huh，J.H.，Yang，Y.Y.，Kang，C.M.，Lee，I.H.，Hyun，C.G.，Hong，S.K.，and Suh，J.W.2003.Accumulation of S-adenosyl-L-methionine enhances production ofactinorhodin but inhibits sporulation in Streptomyces lividans TK23.J.Bact.185：592-600.

Kim，J.N.，Roth，A.，and Breaker，R.R.2007.Guanine riboswitch varients fromMesoplasma florum selectively recognize 2′-deoxyguanosine.Proc.Natl.Acad.Sci.USA104：16092-16097.

Kima，V.N.and Nam，J.-W.(2006)Genomics of microRNA.Trends Genet，22，165-173.

King，E.O.，Ward，M.K.，and Raney，D.E.(1954)Two simple media for thedemonstration of pyocyanin and fluorescin.J.Lab.Clin.Med.44，301-307

Kim，T.J.，Jude，B.A.and Taylor，R.K.(2005)A colonization factor links Vibriocholerae environmental survival and human infection.Nature，438，863-866.

Klein，R.J.and Eddy，S.R.(2003)RSEARCH：finding homologs of singlestructured RNA sequences.BMC Bioinformatics，4，44.

Kletzin，A.&Adams，M.W.Tungsten in biological systems.FEMS Microbiol.Rev.18，5-63(1996).

Krasilnikov，A.S.，Xiao，Y.，Pan，T.，and Mondragon，A.2004.Basis for structuraldiversity in homologous RNAs.Science 306：104-107.

Kubodera，T.，Watanabe，M.，Yoshiuchi，K.，Yamashita，N.，Nishimura，A.，Nakai，S.，Gomi，K.，and Hanamoto，H.(2003)Thiamine-regulated gene expression ofAspergillus oryzae thiA requires splicing of the intron containing a riboswitch-likedomain in the 5′-UTR.FEBS Lett.555，516-520.

Kuchino，Y.，Kasai，H.，Nihei，K.，and Nishimura，S.1976.Biosynthesis of themodified nucleoside Q in transfer RNA.Nucleic Acid Res.3：393-398.

Lake，M.W.，Temple，C.A.，Rajagopalan，K.V.，&Schindelin，H.The crystalstructure of the Escherichia coli MobA protein provides insight into molybdopteringuanine dinucleotide biosynthesis.J.Biol.Chem.275，40211-40217(2000).

Lee，J.M.Matewish，J.L.Kessler，M.Hyodo，Y.Jayakawa，S.Lory，Mol.Microbiol.65，1474(2007).

Lemay，J.F.，Penedo，J.C.，Tremblay，R.，Lilley，D.M.&Lafontaine，D.A.Folding of the adenine riboswitch.Chem.Biol.13，857-868(2006).

Lescoute，A.，Leontis，N.B.，Massire，C.，and Westhof，E.2005.Recurrentstructural RNA motifs，isostericity matrices and sequence alignments.Nucleic Acids Res.33：2395-2409.

Li，Y.and Breaker，R.R.1999.Kinetics of RNA degradation by specific basecatalysis of transesterification involving the 2′-hydroxyl group.J.Am.Chem.Soc.121：5364-5372.

Lim，J.，Grove，B.C.，Roth，A.，and Breaker，R.R.(2006a).Characteristics ofligand recognition by a glmS self-cleaving ribozyme.Angew.Chem.Int.Ed.Engl.45，6689-6693.

Lim，J.，Winkler，W.C.，Nakamura，S.，Scott，V.，and Breaker，R.R.(2006b).Molecular-recognition characteristics of SAM-binding riboswitches.AngewandteChemie-International Edition 45，964-968.

Lim，S.Beyhan，J.Meir，F.H.Yildiz，Mol.Microbiol.60，331(2006c).

Liu，M.Y.et al.The RNA molecule CsrB binds to the global regulatory proteinCsrA and antagonizes its activity in Escherichia coli.J.Biol.Chem.272，17502-17510(1997).

Luisi，B.，Orozco，M.，Sponer，J.，Luque，F.J.，and Shakked，Z.1998.On thepotential role of the amino nitrogen atom as a hydrogen bond acceptor inmacromolecules.J.Mol.Biol.279：1123-1136.

Makdessi，K.，Andreesen，J.R.and Pich，A.(2001)Tungstate uptake by a highlyspecific ABC transporter in Eubacterium acidaminophilum.J.Biol.Chem.276，24557-24564.

Mandal，M.and Breaker，R.R.2004a.Gene regulation by riboswitches.NatureRev.Mol.Cell.Biol.5：451-463.

Mandal，M.and Breaker，R.R.2004b.Adenine riboswitches and gene activationby disruption of a transcription terminator.Nat.Struct.Mol.Biol.11：29-35.

Mandal，M.，Boese，B.，Barrick，J.E.，Winkler，W.C.&Breaker，R.R.Riboswitches control fundamental biochemical pathways in Bacillus subtilis and otherbacteria.Cell 113，577-586(2003).

Mandal，M.，Lee，M.，Barrick，J.E.，Weinberg，Z.，Emilsson，G.M.，Ruzzo，W.L.&Breaker，R.R.A glycine-dependent riboswitch that uses cooperative binding to controlgene expression.Science 306，275-279(2004c).

Marchler-Bauer，A.，Anderson，J.B.，Cherukuri，P.F.，DeWeese-Scott，C.，Geer，L.Y.，Gwadz，M.，He，S.，Hurwitz，D.I.，Jackson，J.D.，Ke，Z.et al.(2005)CDD：aConserved Domain Database for protein classification.Nucleic Acids Research，33，192-196.

Maupin-Furlow，J.A.et al.Genetic analysis of the modABCD(molybdatetransport)operon of Escherichia coli.J.Bacteriol.177，4851-4856(1995).

McCutcheon，J.P.and Eddy，S.R.(2003)Computational identification of non-coding RNAs in Saccharomyces cerevisiae by comparative genomics.Nucleic AcidsResearch，31，4119-4128.

McDaniel，B.A.，Grundy，F.J.，Artsimovitch，I.，and Henkin，T.M.2003.Transcription termination control of the S box system：direct measurement of S-adenosylmethionine by the leader RNA.Proc.Natl.Acad.Sci.USA 100：3083-3088.

Mehta，T.，Coppi，M.V.，Childers，S.E.and Lovley，D.R.(2005)Outer membranec-type cytochromes required for Fe(III)and Mn(TV)oxide reduction in Geobactersulfurreducens.Appl Environ Microbiol，71，8634-8641.

Meibom，K.L.，Blokesch，M.，Dolganov，N.A.，Wu，C.-Y.and Schoolnik，G.K.(2005)Chitin Induces Natural Competence in Vibrio cholerae.Science，310，1824-1827.

Meibom，K.L.，Li，X.B.，Nielsen，A.T.，Wu，C.-Y.，Roseman，S.and Schoolnik，G.K.(2004)The Vibrio cholerae chitin utilization program.PNAS，101，2524-2529.

Meier，F.，Suter，B.，Grosjean，H.，Keith，G.，and Kubli，E.1985.Queuosinemodification of the wobble base in tRNA HIS influences‘in vivo’decoding properties.EMBO J.4：823-827.

Methé，B.A.，Nelson，K.E.，Eisen，J.A.，Paulsen，I.T.，Nelson，W.，Heidelberg，J.F.，Wu，D.，Wu，M.，Ward，N.，Beanan，M.J.et al.(2003)Genome of Geobactersulfurreducens：Metal Reduction in Subsurface Environments.Science，302，1967-1969.

Michel，F.and Westhof，E.1990.Modelling of the three-dimensional architectureof group I catalytic introns based on comparative sequence analysis.J.Mol.Biol.216：585-610.

Migawa，M.T.，Hinkley，J.M.，Hoops，G.C.&Townsend，L.B.A two stepsynthesis of the nucleoside Q precursor 2-amino-5-cyanopyrrolo[2，3-d]pyrimidine-4-one(preQ0).Synth.Commun.26，3317-3322(1996).

Miller，J.H.(1992).A Short Course in Bacterial Genetics 72(New York：ColdSpring Harbor Laboratory Press).

Miller，R.L.，Sabourin，C.L.，Krenitsky，T.A.，Berens，R.L.&Marr，J.J.Nucleoside hydrolases from Trypanosoma cruzi.J.Biol.Chem.259，5073-5077(1984).

Mironov，A.S.，Gusarov，L.，Rafikov，R.，Lopez，L.E.，Shatalin，K.，Kreneva，R.A.，Perumov，D.A.，and Nudler，E.(2002)Sensing small molecules by nascent RNA：amechanism to control transcription in bacteria.Cell 111，747-756.

Montange，R.K.and Batey，R.T.2006.Structure of the S-adenosylmethionineriboswitch regulatory mRNA element.Nature 441：1172-1175.

Murzin，A.G.，Brenner，S.E.，Hubbard，T.，and Chothia，C.1995.SCOP：astructural classification of proteins database for the investigation of sequences andstructures.J.Mol.Biol.247：536-540.

Nahvi，A.，Barrick，J.E.&Breaker，R.R.Coenzyme B₁₂ riboswitches arewidespread genetic control elements in prokaryotes.Nucleic Acids Res.32，143-150(2004).

Nahvi，A.，Sudarsan，N.，Ebert，M.S.，Zou，X.，Brown，K.L.&Breaker，R.R.Genetic control by a metabolite bidning mRNA.Chem.Biol.9，1043-1049(2002).

Nahvi，N.Sudarsan，M.S.Ebert，X.Zou，K.L.Brown，R.R.Breaker，Chem.Biol.9，1043(2002).

Neph，S.and Tompa，M.(2006)MicroFootPrinter：a Tool for PhylogeneticFootprinting in Prokaryotie Genomes.Nucleic Acids Research，34.

Nichols，J.&Rajagopalan，K.V.Escherichia coli MoeA and MogA.Funetion inmetal incorporation step of molybdenum cofactor biosynthesis.J.Biol.Chem.277，24995-52000(2002).

Nissen，P.，Ippolito，J.A.，Ban，N.，Moore，P.B.&Steitz，T.A.RNA tertiaryinteractions in the large ribosomal subunit：the A-minor motif.Proc.Natl.Acad.Sci.USA 98，4899-4903(2001).

Noeske，J.et al.An intermolecular base triple as the basis of ligand specificity andaffinity in the guanine-and adenine-sensing riboswitch RNAs.Proc.Natl.Acad.Sci.USA 102，1372-1377(2005).

Noeske，J.，Richter，C.，Grundle，M.A.，Nasiri，H.R.，Schwalbe，H.，and W ohnert，J.2005.An intermolecular base triple as the basis of ligand specificity and affinity in theguanine-and adenine-sensing riboswitch RNAs.Proc.Natl.Acad.Sci.USA 104：1372-1377.

Noguchi，S.，Nishimura，Y.，Hirota，Y.，and Nishumura，S.1982.Isolation andcharacterization of an Escherichia coli mutant lacking tRNA-guanine transglycoslyase.J.Biol.Chem.257：6544-6550.

O.，Vollset，S.E.，Refsum，H.，

L.，and Ueland，P.M.(1999)Total homocysteine and cardiovascular disease.J.Intern.Med.246，425-454.

Okada，N.，Noguchi，S.，Kasai，H.，Shindo-Okada，N.，Ohgi，T.，Goto，T.，andNishimura，S.1979.Novel mechanism of post-transcriptional modification of tRNA.J.Biol.Chem.254：3067-3073.

Okada，N.，Noguchi，S.，Nishimura，S.，Ohgi，T.，Goto，T.，Crain，P.F.，andMcCloskey，J.A.1978.Structure of a nucleoside Q precursor isolated from E.coli tRNA：7-(aminomethyl)-7-deazaguanine.Nucleic Acids Res.5：2289-2296.

Okamoto，S.，Lezhava，A.，Hosaka，T.，Okamoto-Hosoya，Y.，and Ochi，K.2003.Enhanced expression of S-adenosylmethionine synthetase causes overproduction ofactinorhodin in Streptomyces coelicolor A3(2).J.Bact.185：601-609.

Old，I.G.，Hunter，M.G.，Wilson，D.T.R.，Knight，S.M.，Weatherston，C.A.，andGlass，R.E.(1988).Cloning and characterization of the genes for the two homocysteinetransmethylases of Escherichia coli.Mol.Gen.Genet.211，78-87.

Orengo，C.A.and Thornton，J.M.2005.Protein families and their evolution-astructural perspective.Annu.Rev.Bioehem.74：867-900.

Osborne，S.E.，and Ellington，A.D.(1997).Nucleic acid selection and thechallenge of combinatorial chemistry.Chem.Rev.97，349-370.

Pedersen，J.S.，Bejerano，G.，Siepel，A.，Rosenbloom，K.，Lindblad-Toh，K.，Lander，E.S.，Kent，J.，Miller，W.and Haussler，D.(2006)，PLoS Computational Biology.

Phadtare，S.&Inouye，M.Sequence-selective interactions with RNA by CspB，CspC and CspE，members of the CspA family of Escherichia coli.Mol.Microbiol.33，1004-1014(1999).

Pitterle，D.M.，Johnson，J.L.&Rajagopalan，K.V.In vitro synthesis ofmolybdopterin from precursor Z using purified converting factor.Role of protein-boundsulfur in formation of the dithiolene.J.Biol.Chem.268，13506-13509(1993).

Posey，J.E.，Pytlos，M.J.，Sinden，R.R.and Roth，D.B.(2006)Target DNAStructure Plays a Critical Role in RAG Transposition.PLoS Biology，4，350.

Potamana，V.N.，Shlyakhtenkob，L.S.，Oussatchevaa，E.A.，Lyubchenkob，Y.L.and Soldatenkov，V.A.(2005)Specific Binding of Poly(ADP-ribose)Polymerase-1 toCruciform Hairpins.J Mol Biol，348，609-615.

Pruitt，K.D.，Tatusova，T.，and Maglott，D.R.2007.NCBI Reference Sequence(RefSeq)：a curated non-redundant sequence database of genomes，transcripts andproteins.Nucleic Acids Res.35：D61-65.

Pruitt，K.，Tatusova，T.and Maglott，D.(2005)NCBI Reference Sequence(RefSeq)：a curated non-redundant sequence database of genomes，transcripts andproteins.Nucleic Acids Research，33，501-504.

Ptashne，M.&Gann，A.Genes and Signals(Cold Spring Harbor LaboratoryPress，Cold Spring Harbor，New York，2002).

Reader，J.S.，Metzgar，D.，Schimmel P.，and de Crécy-Lagard，V.2004.Identification of four genes necessary for biosynthesis of the modified nucleosidequeuosine.J.Biol.Chem.279：6280-6285.

Reguera，G.，McCarthy，K.D.，Mehta，T.，Nicoll，J.S.，Tuominen，M.T.andLovley，D.R.(2005)Extracellular electron transfer via microbial nanowires.Nature，435，1098-1101.

Regulski et al.，Mol.Microbiol.68，918(2008).

Rentmeister，A.，Mayer，G.，Kuhn，N.，and Famulok，M.(2007)Conformationalchanges in the expression domain of the Escherichia coli thiM riboswitch.Nucleic AcidsRes.(in press).

Reuter，K.，Slany，R.，Ullrich，F.&Kersten，H.Structure and organization ofEscherichia coli genes involved in biosynthesis of the deazaguanine derivative queuine，anutrient factor for eukaryotes.J.Bacteriol.173，2256-2264(1991).

Rey，D.A.，Nentwich，S.S.，Koch，D.J.，Ruckerr，C.，Puhler，A.，Tauch，A.，andKalinowski，J.(2005)The McbR repressor modulated by the effector substance S-adenosylhomocysteine controls directly the transcription of a regulon involved in sulphurmetabolism of Corynebacterium glutamicum ATCC 13032.Mol.Microbiol.56，871-887

Richardson，L.V.&Richardson，J.P.Rho-dependent termination of transcriptionis governed primarily by the upstream Rho utilization(rut)sequences of a terminator.J.Biol.Chem.271，21597-21603(1996).

Rodionov，D.A.，Vitreschak，A.G.，Mironov，A.A.，and Gelfand，M.S.2002Comparative genomics of thiamin biosynthesis in prokaryotes.J.Biol.Chem.277：48949-48959.

Rodionov，D.A.，Vitreschak，A.G.，Mironov，A.A.，and Gelfand，M.S.2003a.Comparative genomics of the vitamin B₁₂ metabolism and regulation in prokaryotes.J.Biol.Chem.278：41148-41159.

Rodionov，D.A.，Vitreschak，A.G.，Mironov，A.A.，and Gelfand，M.S.(2003b).Regulation of lysine biosynthesis and transport genes in bacteria：yet another riboswitch？Nucleic Acids Res.31，6748-6757.

Rodionov，D.A.，Vitreschak，A.G.，Mironov，A.A.，and Gelfand，M.S.(2004).Comparative genomics of the methionine metabolism in Gram-positive bacteria：a varietyof regulatory systems.Nucleic Acids Res.32，3340-3353.

M.Gomelsky，M.Y.Galperin，Mol.Microbiol.57，629(2005).

Rosentel，J.K.，Healy，F.，Maupin-Furlow，J.A.，Lee，J.H.&Shanmugam，K.T.Molybdate and regulation of mod(molybdate transport)，fdhF，and hyc(formatehydrogenlyase)operons in Escherichia coli.J.Bacteriol.177，4857-4864(1995).

Ross et al.，FEBS Lett.186，191(1985).

Ross et al.，Nature 325，279(1987).

Roth，A.，Nahvi，A.，Lee，M.，Jona，I.&Breaker，R.R.Characteristics of the glmSribozyme suggest only structural roles for divalent metal ions.RNA 12，607-619(2006).

Roth，A.，Winkler，W.C.，Regulski，E.E.，Lee B.W.K.，Lim，J.，Jona，I.，Barrick，J.E.，Ritwik，A.，Kim，J.N.，Welz，R.et al.2007.A riboswitch selective for thequeuosine precursor preQ₁ contains an unusually small aptamer domain Nature Struct.Mol.Biol.14：308-317.

Rusch，A.L.Halpern，G.Sutton，K.B.Heidelberg，S.Williamson，S.Yooseph，D.Wu，J.A.Eisen，J.M.Hoffman，K.Remington，et al.，PLoS Biol.5，e77(2007).

Ryan，Y.Fouhy，J.F.Lucey，J.Maxwell Dow，J.Bacteriol.188，8327(2006).

Ryjenkov，R.Simm，U.M.Gomelsky，J.Biol.Chem.281，30310(2006).

Salazar，J.C.，Ambrogelly，A.，Crain，P.F.，McCloskey，J.A.&Soll，D.Atruncated aminoacyl-tRNA synthetase modifies RNA.Proc.Natl.Acad.Sci.USA 101，7536-7541(2004).

Sambrook，J.&Russell，D.W.In：Molecular Cloning：A Laboratory Manual.3^rded.，Cold Spring Harbor Laboratory Press，Cold Spring Harbor，NY(2001).

Sanishvili，R.，Beasley，S.，Skarina，T.，Glesue，D.，Joachimiak，A.，Edwards，A.&Savchenko，A.The crystal structure of Escherichia coli MoaB suggests a probable role inmolybdenum cofactor synthesis.J.Biol.Chem.279，42139-42146(2004).

Santamaria-Araujo，J.A.et al.The tetrahydropyranopterin structure of the sulfur-free and metal-free molybdenum cofactor precursor.J.Biol.Chem.279，15994-159949(2004).

Saran，D.，Frank，J.，and Burke，D.H.(2003)The tyranny of adenosine recognitionamong RNA aptamers to coenzyme A.BCM Evol.Biol.3，26.

Schaffer，A.A.，Aravind，L.，Madden，T.L.，Shavirin，S.，Spouge，J.L.，Wolf，Y.I.，Koonin，E.V.and Altschul，S.F.(2001)Improving the accuracy of PSI-BLAST proteindatabase searches with composition-based statistics and other refinements.Nucleic AcidsRes，29，2994-3005.

Schauder，S.，Shokat，K.，Surette，M.G.，and Bassler，B.L.(2001).The LuxSfamily of bacterial autoinducers：biosynthesis of a novel quorum-sensing signal molecule.Molec.Microbiol.41，463-476.

Schwarz，G.Molybdenum cofactor biosynthesis and deficiency.Cell Mol.LifeSci.62，2792-2810(2005).

Schyns，G.，Potot，S.，Geng，Y.，Barbosa，T.M.，Henriques，A.，and Perkins，J.B.2005.Isolation and characterization of new thiamine-deregulated mutants of Bacillussubtilis.J.Bacteriol 187：8l 27-8136.

Scott，D.&Amy，N.K.Molybdenum accumulation in chlD mutants ofEscherichia coli.J.Bacteriol.171，1284-1287(1989).

Seetharaman，S.，Zivarts，M.，Sudarsan，N.，and Breaker，R.R.2001.ImmobilizedRNA switches for the analysis of complex chemical and biological mixtures.Nat.Biotechnol.19：336-341.

Seliverstov，A.V.，Putzer，H.，Gelfand，M.S.and Lyubetsky，V.A.(2005)Comparative analysis of RNA regulatory elements of amino acid metabolism genes inActinobacteria.BMC Microbiol，5，54.

Serganov，A.，Polonskaia，A.，Phan，A.T.，Breaker，R.R.，and Patel，D.J.(2006).Structural basis for gene regulation by a thiamine pyrophosphate-sensing riboswitch.Nature 441，1167-1171.

Serganov，A.，Yuan，Y.R.，Pikovskaya，O.，Polonskaia，A.，Malinina，L.，Phan，A.T.，Hobartner，C.，Micura，R.，Breaker，R.R.，and Patel，D.J.2004.Structural basis fordiscriminative regulation of gene expression by adenine-and guanine-sensing mRNAs.Chem.Biol.11：1729-1741.

Shanmugam，K.T.et al.Proposed nomenclature for the genes involved inmolybdenum metabolism in Escherichia coli and Salmonella typhimurium.Mol.Microbiol.6，3452-3454(1992).

Sheppard，C.A.，Trimmer，E.E.，and Matthews，R.G.(1999).Purification andproperties of NADH-dependent 5，10-methylenetetrahydrofolate reductase(MetF)fromEscherichia coli.J.Bact.181，718-725.

Shimizu，S.，Shiozaki，S.，Ohshiro，T.，and Yamada，H.(1984).Occurrence of S-adenosylhomocysteine hydrolase in prokaryote cells-characterization of the enzymefrom Alcaligenes faecalis and role of the enzyme in the activated methyl cycle.Eur.J.Biochem.141，385-392.

Simm，M.Morr，A.Kader，M.Nimtz，U.Mol.Microbiol.53，1123(2004).

Simons，R.W.，Houman，F.&Kleckner，N.Improved single and multicopy lac-based cloning vectors for protein and operon fusions.Gene 53，85-96(1987).

Slany，R.K.，Bosl，M.&Kersten，H.Transfer and isomerization of the ribosemoiety of AdoMet during the biosynthesis of queuosine tRNAs，a new unique reactioncatalyzed by the QueA protein from Escherichia coli.Biochimie 76，389-393(1994).

Slany，R.，Bosl，M.，Crain，R.F.，and Kersten，H.1993.A new function of S-adenosylmethionine：The ribosyl moiety of AdoMet is the precursor of thecyclopentenediol moiety of the tRNA wobble base queuine.Biochemistry 32：7811-7817.

Soukup，G.A.and Breaker，R.R.1999.Relationship between internucleotidelinkage geometry and the stability of RNA.RNA 5：1308-1325.

Soukup，J.K.and Soukup，G.A.2004.Riboswitches exerr genetic control throughmetabolite-induced conformational change.Curr.Opin.Struct.Biol.14：344-349.

Spiro，S.&Guest，J.R.FNR and its role in oxygen-related gene expression inEscherichia coli.FEMS Microbiol.Rev.6，399-428(1990).

Stoddard，C.D.&Batey，R.T.Mix-and-match riboswitches.ACS Chem.Biol.1，751-754(2006).

Storz，G.，Altuvia，S.and Wassarman，K.M.(2005)An abundance of RNAregulators.Annu Rev Biochem，74，199-217.

Sudarsan，J.K.Wickiser，S.Nakamura，M.S.Ebert，R.R.Breaker，Genes Dev.17，2688(2003).

Sudarsan，N.，Barrick，J.E.，and Breaker，R.R.(2003a).Metabolite-binding RNAdomains are present in the genes of eukaryotes.RNA 9，644-647.

Sudarsan，N.，Hammond，M.C.，Block，K.F.，Welz，R.，Barrick，J.E.，Roth，A.&Breaker，R.R.Tandem riboswitch architectures exhibit complex gene control functions.Science 314，300-304(2006).

Sudarsan，N.，Wickiser，J.K.，Nakamura，S.，Ebert，M.S.，and Breaker，R.R.(2003b).An mRNA structure in bacteria that controls gene expression by binding lysine.Genes Dev.17，2688-2697.

Tabor，C.W.，and Tabor，H.(1984).Methionine adenosyltransferase(S-adenosylmethionine synthetase)and S-adenosylmethionine decarboxylase.AdvancesEnzymol.Related Areas Mol.Biol.55，251-282.

Takusagawa，F.，Fujioka，M.，Spies，A.，and Schowen，R.L.(1998).S-adenosylmethionine(AdoMet)-dependent methyltransferases.In：ComprehensiveBiological Catalysis，M.Sinnott，ed.，Academic Press，San Diego，CA，pp 1-30.

Tamayo，A.D.Tischler，A.Camilli，J.Biol.Chem.280，33324(2005).

Tamayo，J.T.Pratt，A.Camilli，Annu.Rev.Microbiol.61，131(2007).

Tang，Y.&Guest，J.R.Direct evidence for mRNA binding and post-transcriptional regulation by Escherichia coli aconitases.Microbiology 145，3069-3079(1999).

Tatusov，R.L.et al.The COG database：an updated version includes eukaryotes.BMC Bioinformatics 4，41(2003).

Tatusov，R.L.et al.The COG database：new developments in phylogeneticclassification of proteins from complete genomes.Nucleic Acids Res.29，22-28(2001).

Thompson，M.J.，Mekhalfia，A.，D.P.，H.，and Blackburn，G.M.1999.Synthesis oftwo stable nitrogen analogues of S-adenosyl-L-methionine.J.Org.Chem.64：7467-7473.

Thore，S.，Leibundgut，M.，and Ban，N.N.(2006).Structure of the eukaryoticthiamine pyrophosphate riboswitch with its regulatory ligand.Science 312，1208-1211.

Tischler，A.Camilli，Infect.Immun.73，5873(2005).

Torarinsson，E.，Sawera，M.，Havgaard，J.H.，Fredholm，M.and Gorodkin，J.(2006)Thousands of corresponding human and mouse genomic regions unalignable inprimary sequence contain common RNA structure.Genome Res，16，885-889.

Torres-Larios，A.et al.Structural basis of translational control by Escherichia colithreonyl tRNA synthetase.Nat.Struct.Biol.9，343-347(2002).

Torres-Larios，A.，Swinger，K.K.，Pan，T.，and Mondragon，A.2006.Structure ofribonuclease P-a universal ribozyme.Curr.Opin.Struct.Biol.16：327-335.

Tringe，C.von Mering，A.Kobayashi，A.A.Salamov，K.Chen，H.W.Chang，M.Podar，J.M.Short，E.J.Mathur，J.C.Detter，et al.，Science 308，554(2005).

Tucker，B.J.and Breaker，R.R.2005.Riboswitches as versatile gene controlelements.Curr.Opin.Struct.Biol.15：342-348.

Turnbaugh，R.E.Ley，M.A.Mahowald，V.Magrini，E.R.Mardis，J.I.Gordon，Nature 444，1027(2006).

Tyson，G.W.，Chapman，J.，Hugenholtz，P.，Allen，E.E.，Ram，R.J.，Richardson，P.M.，Solovyev，V.V.，Rubin，E.M.，Rokhsar，D.S.and Banfield，J.F.(2004)Communitystructure and metabolism through reconstruction of microbial genomes from theenvironment.Nature，428，37-43.

Ueland，P.M.(1982).Pharmacological and biochemical aspects of S-adenosylhomocysteine and S-adenosylhomocysteine hydrolase.Pharmacological Reviews34，223-285.

Ulrich，E.V.Koonin，I.B.Zhulin，Trends Microbiol.13，52(2005).

J.，Qian，Q.，Durand J.M.B.，Hagervall，T.G.，and Bjork，G.R.2001.Improvement of reading frame maintenance is a common function for severalrRNA modification.EMBO J.20：4863-4873.

J.，Qian，Q.，Durand，J.M.，Hagervall，T.G.&

G.R.Improvement of reading frame maintenance is a common function for several tRNAmodifications.EMBO J.20，4863-4873(2001).

Van Lanen，S.G.，Reader，J.S.，Swairjo，M.A.，de Crécy-Lagard，V.，Lee，B.，andIwata-Reuyl，D.2005.From cyclohydrolase to oxidoreductase：Discovery of nitrilereductase activity in a common fold.Proc.Natl.Acad.Sci.USA 102：4264-4269.

Vecerek，B.，Moll，I.&Blasi，U.Translational autocontrol of the Escherichia colihfq RNA chaperone gene.RNA 11，976-984(2005).

Venter，J.C.，Remaington，K.，Heidelberg，J.F.，Halpern，A.L.，Rusch，D.，Eisen，J.A.，Wu，D.，Paulsen，I.，Nelson，K.E.，Nelson，W.et al.(2004)Environmental GenomeShotgun Sequencing of the Sargasso Sea.Science，304，66-74.

Vicens，Q.and Cech，T.R.2006.Atomic level architecture of group I intronsrevealed.Trends Biochem.Sci.31：41-51.

Wachter，A.，Tunc-Ozdemir，M.，Grove，B.C.，Green，P.J.，Shintani，D.K.，andBreaker，R.R.(2007)Riboswitch control of gene expression in plants by alternative 3′end processing of mRNAs.The Plant Cell(in press).

Wan，X.-F.and Xu，D.(2004)Intrinsic Terminator Prediction and Its Applicationin Synechococcus sp.WH8102.J Comp Sci&Tech，20，465-482.

Wang，J.X.，Lee，E.R.，Rivera，D.，Lim，J.，and Breaker，R.R.Riboswitches thatsense S-adenosylhomocysteine and activate genes involved in coenzyme recycling.2008.Mol.Cell(in press).

Washietl，S.，Hofacker，I.L.，Lukasser，M.，Huttenhofer，A.and Stadler，P.F.(2005)Mapping of conserved RNA secondary structures predicts thousands of functionalnoncoding RNAs in the human genome.Nature Biotechnology，23，1383-1390.

Wassman et al.，Structure 15，915(2007).

Waters，W.Lu，J.D.Rabinowitz，B.L.Bassler，J.Bacteriol.190，2527(2008).

Weinberg，J.E.Barrick，Z.Yao，A.Roth，J.N.Kim，J.Gore，J.X.Wang，E.R.Lee，K.F.Block，N.Sudarsan，et al.，Nucleic Acids Res.35，4809(2007).

Weinberg，Z.and Ruzzo，W.L.(2004)Exploiting conserved structure for fasterannotation of non-coding RNAs without loss of accuracy.Bioinformatics，20，i334-i341.

Weinberg，Z.and Ruzzo，W.L.(2004)，RECOMB04：Proceedings of the EighthAnnual International Conference on Computational Molecular Biology，San Diego，CA，pp.243-251.

Weinberg，Z.and Ruzzo，W.L.(2006)Sequence-based heuristics for fasterannotation of non-coding RNA families.Bioinformatics，22，35-39.

Weinberg，Z.，Barrick，J.E.，Yao，Z.，Roth，A.，Kim，J.N.，Gore，J.，Wang，J.X.，Lee，E.R.，Block，K.F.，Sudarsan N.，et al.2007.Identification of 22 candidate structuredRNAs in bacteria using the CMfinder comparative genomics pipeline.Nucleic Acids Res.35：4809-4819.

Weinberg，Z.，Barrick，J.E.，Yao，Z.，Roth，A.，Kim，J.N.，Gore，J.，Wang，J.X.，Lee，E.R.，Block，K.F.，Sudarsan，N.，et al.(2007).Identification of 22 candidatestructured RNAs in bacteria using the CMfinder comparative genomics pipeline.NucleicAcids Res.(doi：10.1093).

Welz，R.&Breaker，R.R.Ligand binding and gene control characteristics oftandem riboswitches in Bacillus anthracis.RNA 13，573-582(2007).

West，R.A.4-Hydroxypyrrolo[2，3-d]pyrimidine：Mannich reaction.J.Org.Chem.26，4959-4961(1961).

Wickiser，J.K.，Cheah，M.T.，Breaker，R.R.&Crothers，D.M.The kinetics ofligand binding by an adenine-sensing riboswitch.Biochemistry 44，13404-13414(2005).

Wickiser，J.K.，Winkler，W.C.，Breaker，R.R.&Crothers，D.M.The speed ofRNA transcription and metabolite binding kinetics operate an FMN riboswitch.Mol.Cell18，49-60(2005).

Wickiser，J.K.，Cheah，M.T.，Breaker，R.R.，and Crothers，D.M.(2005b)Thekinetics of ligand binding by an adenine-sensing riboswitch.Biochemistry 44，13404-13414.

Wickiser，J.K.，Winkler，W.C.，Breaker，R.R.，and Crothers，D.M.(2005a)Thespeed of RNA transcription and metabolite binding kinetics operate an FMN riboswitch.Mol.Cell 18，49-60.

Winkler，W.C.and Breaker，R.R.2005.Regulation of bacterial gene expressionby riboswitches.Annu.Rev.Microbiol.59：487-517.

Winkler，W.C.Nahvi，A.，and Breaker，R.R.2002a.Thiamine derivatives bindmessenger RNAs directly to regulate bacterial gene expression.Nature 419：952-956.

Winkler，W.C.Riboswitches and the role of noncoding RNAs in bacterialmetabolic control.Curr.Opin.Chem.Biol.9，594-602(2005).

Winkler，W.C.，Nahvi，A.，Sudarsan，N.，Barrick，J.E.，and Breaker，R.R.2003.An mRNA structure that controls gene expression by binding S-adenosylmethionine.Nat.Struct.Biol.10：701-707.

Winkler，W.C.，Cohen-Chalamish，S.&Breaker，R.R.An mRNA structure thatcontrols gene expression by binding FMN.Proc.Natl.Acad.Sci.USA 99，15908-15913(2002b).

Winkler，W.C.，Nahvi，A.，Roth，A.，Collins，J.A.&Breaker，R.R.Control of geneexpression by a natural metabolite-responsive ribozyme.Nature 428，281-286(2004).

Wolfe，K.L.Visick，J.Bacteriol.190，463(2008).

Woyke，H.Teeling，N.N.Ivanova，M.Huntemann，M.Richter，F.O.Gloeckner，D.Boffelli，I.J.Anderson，K.W.Barry，H.J.Shapiro，et al.，Nature 443，950(2006).

Wuebbens，M.M.&Rajagopalan，K.V.Investigation of the early steps ofmolybdopterin biosynthesis in Escherichia coli through the use o in vivo labeling studies.J.Biol.Chem.270，1082-1087(1995).

Yamamoto，K.&Ishihama，A.Transcriptional response of Escherichia coli toexternal copper.Mol.Microbiol.56，215-227(2005).

Yao，Z.，Barrick，J.E.，Weinberg，Z.，Neph，S.，Breaker，R.R.，Tompa，M.，andRuzzo，W.L.(2007).A computational pipeline for high throughput discovery of cis-regulatory noncoding RNA in prokaryotes.PLoS Comput.Biol.3，e126.

Yao，Z.，Weinberg，Z.and Ruzzo，W.L.(2006)CMfinder-a covariance modelbased RNA motif finding algorithm.Bioinformatics，22，445-452.

Yarnell，W.S.&Roberts，J.W.Mechanism of intrinsic transcription terminationand antitermination.Science 284，611-615(1999).

Zengel，J.M.and Lindahl，L.(1994)Diverse mechanisms for regulating ribosomalprotein synthesis in Escherichia coli.Prog Nucleic Acid Res Mol Biol，47，331-370.

Zhang，S.Kim，B.L.Gaffney，R.A.Jones，J.Am.Chem.Soc.128，7015(2006).

Zuker，M.(2003)Mfold web server for nucleic acid folding and hybridizationprediction.Nucleic Acids Res，31，3406-3415.

Claims

1.一种可调节的基因表达构建体，包含

编码包含一个核糖开关的一个RNA的核酸分子，所述核糖开关可操作连接于一个编码区，其中所述核糖开关调节所述RNA的表达，其中所述核糖开关和编码区是异源的，其中所述核糖开关是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。

2.权利要求1的构建体，其中所述核糖开关包含一个适体结构域和一个表达平台结构域，其中所述适体结构域和所述表达平台结构域是异源的。

3.权利要求1的构建体，其中所述核糖开关包含两个或多个适体结构域和一个表达平台结构域，其中至少一个所述适体结构域和所述表达平台结构域是异源的。

4.权利要求3的构建体，其中至少两个所述适体结构域呈现出协同性结合。

5.一种核糖开关，其中所述核糖开关是一种天然存在的核糖开关的非天然衍生物，其中所述核糖开关是一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关。

6.权利要求5的核糖开关，其中所述核糖开关包含一个适体结构域和一个表达平台结构域，其中所述适体结构域和所述表达平台结构域是异源的。

7.权利要求6的核糖开关，其中所述核糖开关包含一个GEMM基序、一个SAH基序、一个preQ₁-II基序、一个Moco基序或一个SAM-IV基序。

8.权利要求5的核糖开关，其中所述核糖开关被一触发分子激活，其中所述核糖开关当被所述触发分子激活时产生一个信号。

9.权利要求1的构建体，其中所述核糖开关具有图1或图3的共有结构中的一种。

10.权利要求1的构建体，其中所述核糖开关包含一个适体结构域和一个表达平台结构域，其中所述适体结构域源自一种天然存在的环二GMP应答性核糖开关、S-腺苷高半胱氨酸应答性核糖开关、preQ₁应答性核糖开关、一种Moco应答性核糖开关或一种SAM应答性核糖开关。

11.权利要求10的构建体，其中所述适体结构域为一种天然存在的环二GMP应答性核糖开关、S-腺苷高半胱氨酸应答性核糖开关、preQ₁应答性核糖开关、Moco应答性核糖开关或SAM应答性核糖开关的适体结构域。

12.权利要求10的构建体，其中所述适体结构域具有所述天然存在的核糖开关的一个适体结构域的共有结构。

13.权利要求10的构建体，其中所述适体结构域仅由所述天然存在的核糖开关的碱基对保守改变组成。

14.一种检测目的化合物的方法，所述方法包括

将一个样品与一种核糖开关进行接触，其中所述核糖开关可被所述目的化合物激活，其中所述核糖开关被所述目的化合物激活时产生一个信号，其中当所述样品包含所述目的化合物时所述核糖开关产生一个信号，其中所述核糖开关为一种环二GMP应答性核糖开关或一种环二GMP应答性核糖开关的衍生物、一种S-腺苷高半胱氨酸应答性核糖开关或一种S-腺苷高半胱氨酸应答性核糖开关的衍生物、一种preQ₁应答性核糖开关或一种preQ₁应答性核糖开关的衍生物、一种Moco应答性核糖开关或一种Moco应答性核糖开关的衍生物或者一种SAM应答性核糖开关或一种SAM应答性核糖开关的衍生物。

15.权利要求14的方法，其中所述目的化合物激活所述核糖开关时，所述核糖开关改变构象，其中所述构象变化通过构象依赖标记产生一个信号。

16.权利要求14的方法，其中所述目的化合物激活所述核糖开关时，所述核糖开关改变构象，其中所述构象变化引起连接至所述核糖开关的RNA表达的变化，其中所述表达变化产生一信号。

17.权利要求16的方法，其中所述信号可由连接至所述核糖开关的RNA所表达的报告蛋白产生。

18.一种方法，包括：

(a)测试一种用于改变编码含有核糖开关的RNA的基因的基因表达的化合物，其中所述改变通过所述核糖开关实现，其中所述核糖开关为一种环二GMP应答性核糖开关或一种环二GMP应答性核糖开关的衍生物、一种S-腺苷高半胱氨酸应答性核糖开关或一种S-腺苷高半胱氨酸应答性核糖开关的衍生物、一种preQ₁应答性核糖开关或一种preQ₁应答性核糖开关的衍生物、一种Moco应答性核糖开关或一种Moco应答性核糖开关的衍生物或者一种SAM应答性核糖开关或一种SAM应答性核糖开关的衍生物；

(b)通过使一种细胞和步骤(a)中改变基因表达的一种化合物相接触来改变基因表达，

其中所述细胞含有编码含有核糖开关的RNA的基因，其中所述化合物通过结合到所述核糖开关上抑制所述基因的表达。

19.一种鉴定核糖开关的方法，所述方法包括

在存在和不存在一种化合物的条件下评估RNA分子的直读探测(in-line)的自发切割，其中所述RNA分子由被所述化合物调节的基因编码，

其中所述RNA分子的直读探测的自发切割模式的改变表明一种核糖开关，其中(a)所述RNA包含一种环二GMP应答性核糖开关或一种环二GMP应答性核糖开关的衍生物并且所述化合物为环二GMP，(b)所述RNA包含一种S-腺苷高半胱氨酸应答性核糖开关或一种S-腺苷高半胱氨酸应答性核糖开关的衍生物并且所述化合物为S-腺苷高半胱氨酸，(c)所述RNA包含一种preQ₁应答性核糖开关或一种preQ₁应答性核糖开关的衍生物并且所述化合物为preQ₁，或者(d)所述RNA包含一种Moco应答性核糖开关或一种Moco应答性核糖开关的衍生物或者一种SAM应答性核糖开关或一种SAM应答性核糖开关的衍生物。

20.一种改变基因表达的方法，所述方法包括

使一种化合物和一种细胞相接触，其中所述细胞包含一个编码包括以下核糖开关的RNA的基因，所述核糖开关为一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关，其中所述化合物通过结合于所述一种环二GMP应答性核糖开关、一种S-腺苷高半胱氨酸应答性核糖开关、一种preQ₁应答性核糖开关、一种Moco应答性核糖开关或者一种SAM应答性核糖开关而改变所述基因的表达。

21.权利要求20的任一项方法，其中所述细胞已经被鉴定为需要改变的基因表达，

22.权利要求20的方法，其中所述细胞为细菌细胞。

23.权利要求22的方法，其中所述化合物杀灭细菌细胞或抑制细菌细胞的生长。

24.权利要求20的方法，其中通过将所述化合物给予一个受试者使所述化合物和所述细胞相接触。

25.权利要求24的方法，其中所述细胞为所述受试者体内的细菌细胞，其中所述化合物杀灭所述细菌细胞或抑制所述细菌细胞的生长。

26.权利要求25的方法，其中所述受试者具有细菌感染。

27.权利要求20的方法，其中所述化合物与另一种抗微生物化合物联合给药。

28.权利要求20的方法，其中所述化合物抑制生物膜中的细菌生长。