CN112930190A

CN112930190A - 金属结合蛋白及其用途

Info

Publication number: CN112930190A
Application number: CN201980070280.4A
Authority: CN
Inventors: 约瑟夫·A·科特鲁沃; 约瑟夫·A·马托克斯
Original assignee: Penn State Research Foundation
Current assignee: Penn State Research Foundation
Priority date: 2018-09-05
Filing date: 2019-09-05
Publication date: 2021-06-08
Also published as: BR112021004123A2; WO2020051274A3; US20210189521A1; WO2020051274A2; AU2019334898A1

Abstract

公开了对某些三价阳离子和/或四价阳离子具有高选择性亲和力的金属结合蛋白，所述三价阳离子和/或四价阳离子衍生自例如稀土元素或其离子(例如镧系元素)和锕系元素或其离子，以及衍生自铪和锆元素或其化合物，以及包含所述金属结合蛋白的传感器，和用于使用所述金属结合蛋白捕获和分离这样的三价阳离子和/或四价阳离子的方法。

Description

金属结合蛋白及其用途

相关申请的交叉引用

本申请要求于2018年9月5日提交的美国临时申请62/727,114的权益，其全部公开内容通过引用合并于此。

技术领域

本公开内容涉及金属结合蛋白，并且特别是对稀土元素具有选择性亲和力的蛋白质。

背景

稀土元素(REE)包括镧系元素(Ln)、钇和钪。这些元素(特别是Ln)作为诸如永磁体、电动和混合动力汽车电池、激光器、荧光粉和智能手机等技术中的关键组件是非常需要的。然而，这些元素的应用范围却与存在相对少的经济上可行的可采矿床以及从矿石和其它原料中提取Ln的难度形成鲜明对比。REE盐的不溶性及其化学性质的相似性要求使用苛刻、对环境有害且费力的方法来获取、回收和分离它们。

REE的技术重要性以及与其获取相关的挑战已经激发了用于更加简便和环境友好的REE分离的生物工程方法。尽管早已知道一些植物和微生物会积累这些金属，但直到最近才确定Ln在某些吡咯并喹啉醌(PQQ)依赖性醇脱氢酶，尤其是甲醇脱氢酶(MDH)的催化活性中起重要的生物学作用。这些观察结果提供了从生物学学习设计用于REE感测、捕获和分离的有效新方法的可能性。

因此，可以选择性结合镧系元素的蛋白质的鉴定和表征可以使其能够用于这些能力。

发明内容

本公开内容的优点包括相对于非三价和非四价阳离子，对某些三价和/或四价阳离子具有高选择性亲和力的金属结合蛋白。在一些方面中，相对于非三价和/或非四价阳离子，例如来自例如第II族元素化合物或其盐的二价阳离子，金属结合蛋白对来自例如稀土元素、其化合物或盐、或锕系元素、其化合物或盐的三价阳离子和/或四价阳离子具有高选择性亲和力(例如，至少1000倍，例如至少10⁴、10⁵、10⁶或更高)。这样的二价阳离子包括例如钙阳离子。在一个实施方案中，相对于金属结合蛋白对二价离子(例如钙离子)的亲和力，金属结合蛋白对镧系离子的亲和力为至少1000倍，例如至少10⁴、10⁵、10⁶或10⁷倍。在一个实施方案中，相对于金属结合蛋白对二价离子(例如钙离子)的亲和力，金属结合蛋白对锕系离子的亲和力为至少1000倍，例如至少10⁴、10⁵、10⁶或10⁷倍。在一个实施方案中，金属结合蛋白不是天然存在的。在一个实施方案中，金属结合蛋白包含非天然标签，例如His₆标签。有利地，本公开内容的金属结合蛋白可以被纯化为至少70％，例如至少75％、80％、85％、90％、95％的纯形式。

本公开内容的实施方案包括，例如，单独地或组合地，其中金属结合蛋白包含与SEQ ID NO:1的序列具有至少80％同一性，例如至少85％、90％、92％、95％、97％、98％、99％或100％同一性的序列。在另一些实施方案中，金属结合蛋白不是天然的和/或包含非天然标签，例如His₆标签。

本公开内容的另一方面包括分离的金属结合蛋白，包含至少2个包含SEQ ID NO:3的序列的EF手基序，其中相邻的EF手基序被10-15个氨基酸分隔。本公开内容的实施方案包括，例如，单独地或组合地，其中相邻的EF手基序被11、12或13个氨基酸分隔。在一些实施方案中，分离的金属结合蛋白可包含2、3或4个EF手基序，所述EF手基序中的至少一个包含至少3个羧酸残基，并且至少2个相邻的EF手基序被10-15个氨基酸残基分隔，例如被12-13个氨基酸残基分隔。在另一些实施方案中，金属结合蛋白不是天然的和/或包含非天然标签，例如His₆标签。

本公开内容的另一方面包括分离的金属结合蛋白，由包含与SEQ ID NO:2的序列具有至少80％同一性的序列的核苷酸编码。本公开内容的实施方案包括，例如，单独地或组合地，其中核苷酸包含与SEQ ID NO:2的序列具有至少85％、90％、93％、95％、97％、98％、99％或100％同一性的序列。在另一些实施方案中，金属结合蛋白不是天然的和/或包含非天然标签，例如His₆标签。

本公开内容的另一方面包括传感器，用于相对于非三价和非四价阳离子来感测某些三价和/或四价阳离子的存在，例如来自例如稀土元素、其化合物或盐、或锕系元素、其化合物或盐、例如镧系离子的一种或多种三价阳离子。传感器包含金属结合蛋白，相对于非三价和非四价阳离子，例如来自例如第II族元素(例如钙化合物或其盐)的二价阳离子，所述金属结合蛋白对来自例如稀土元素、其化合物或盐、或锕系元素、其化合物或盐的三价和/或四价阳离子具有高选择性亲和力。在一个实施方案中，传感器还包含第一荧光蛋白和第二荧光蛋白，第二荧光蛋白的激发波长与第一荧光蛋白的发射波长基本相同。

本公开内容的另一方面包括从介质(例如溶液、混悬液或胶体)中相对于非三价阳离子或非四价阳离子来分离三价阳离子或四价阳离子的方法。所述方法包括使包含三价或四价阳离子的介质与金属结合蛋白接触以结合所述三价或四价阳离子。在一些实施方案中，所述三价或四价阳离子选自由以下组成的组：来自一种或多种稀土元素、其化合物或盐(例如镧系元素或其盐)或来自一种或多种锕系元素、其化合物、或其盐或来自稀土和锕系元素的组合的三价或四价阳离子。相对于非三价阳离子，金属结合蛋白可对三价阳离子具有高选择性亲和力。另外或作为替代，相对于非四价阳离子，金属结合蛋白可对四价阳离子具有高选择性亲和力。所述方法还可以包括从介质中分离结合有三价阳离子和/或四价阳离子(例如，镧系元素(3+)离子)的金属结合蛋白；以及任选地使三价和/或四价阳离子与金属结合蛋白分离。

通过下面的详细描述，本发明的其它优点对于本领域技术人员将变得明显，其中仅以说明预期实施本发明的最佳模式的方式示出和描述了本发明的优选实施方案。将会认识到，本发明能够具有其它和不同的实施方案，并且其若干细节能够在多个明显的方面进行修改，而所有这些都不脱离本发明。因此，附图和描述本质上应被认为是说明性的，而不是限制性的。

附图说明

参考附图，其中具有相同附图标记的元件在全文中表示相似的元件，并且其中：

图1A显示了XoxF纯化和共纯化条带(镧调蛋白(lanmodulin))的SDS-PAGE分析。

图1B显示了LanM和人CaM(作为代表性的典型含EF手的蛋白质)的EF手的序列。

图1C显示了扭脱甲基杆菌(M.extorquens)AM1 LanM(SEQ ID NO:1)和智人(H.sapiens)钙调蛋白的氨基酸序列的比较。

图2A显示了SP FF色谱后XoxF的Superdex S75色谱的部分洗脱曲线(67-83.5mL，级分40-50，1.5mL/级分)。

图2B显示了来自扭脱甲基杆菌的XoxF的纯化物的SDS-PAGE分析，说明了LanM的共纯化和分离。

图2C显示了级分44(B中的泳道10)的线性MALDI-TOF质谱，11759.574Da处的峰对应于LanM。

图3A显示了Superose 75色谱后纯化的LanM-TEV-His的线性MALDI-TOF质谱。

图3B显示了具有C末端TEV可切割的His₆标签(GENLYFQHHHHHH)(SEQ ID NO:8)的全长LanM的预测氨基酸序列，以及当在大肠杆菌中表达时观察到的切割位点。

图4A显示了纯化的His-LanM和LanM-His的SDS-PAGE分析。

图4B显示了通过CD光谱监测的wt LanM、LanM-His和His-LanM(每种蛋白质15μM)与Sm^III的配合物的K_d的确定。

图5A显示了在0-8当量La^III存在下LanM(20μM)的CD光谱。

图5B显示了用0-8当量的Ln^III离子(La^III-Lu^III和Y^III)和用Ca^II对LanM(20μM)进行CD滴定的摩尔椭圆率变化的量级。

图5C显示了在二甲酚橙(7μM)存在下通过LanM(5μM)的竞争性滴定监测的Ln^III与LanM结合的化学计量。

图6A显示了在多种浓度的La^III存在下LanM的UV-可见光谱(相对于消光系数归一化)。

图6B显示了来自滴定的差异光谱，显示了在280和287nm处的两个尖锐的吸收特征。

图6C表明，滴定的A₂₈₀ nm和A₂₈₇ nm图证明了在4当量La^III/LanM处的终点。

图7A和7B显示了(A)用Ca^II(0-160μM和0-5mM)对wt LanM(20μM)和(B)用0-5mMCa^II对20μM LanM-His进行滴定的完整远UV CD光谱。

图8显示了在存在和不存在6μM LanM的情况下用Ln^III(在这种情况下为Sm^III)对二甲酚橙的代表性滴定。

图9显示了相对于有效离子半径绘制的多种Ln^III-LanM配合物(Ln＝La、Nd、Sm、Gd、Tb、Ho、Y)的K_d,app值。

图10A、10B、10C和10D显示了用La^III和Ca^II对LanM和LanM(4P-4A)进行CD滴定，以用于表观K_d确定。将点拟合(红线)于具有一组或两组(在La^III与wt蛋白结合的情况下)位点的协同结合模型(希尔方程(Hill equation))，参数在表3中给出。

图11显示了本公开内容的一个方面中的传感器(例如，LaMP1)的设计。

图12A、12B、12C提供了数据，显示了相对于所选的常见单价、二价和三价金属离子，LaMP1对Ln^III的选择性。

图13显示了在荧光板读取器测量中LaMP1的检测极限的确定。

图14显示了使用La^III和Ca^II对LaMP1(4P→4A)进行K_d,app确定。

图15显示了在不存在添加的金属离子(基线)和存在5μM Ln^III、10μM Sc^III、Y^III和Fe^III；1mM Al^III、Mn^II和Ca^II；或100μM Cu^II的情况下，LaMP1(4P→4A)的FRET变化倍数。

图16显示了基于LanM的FRET传感器LaMP1的荧光响应、表观K_d值和金属选择性的表征。

图17A、17B和17C显示了与Y(III)结合的LanM的结构。

发明详述

本公开内容涉及相对于非三价和非四价阳离子，对某些三价和/或四价阳离子具有高选择性亲和力的金属结合蛋白。特别地，相对于非三价阳离子，本公开内容的金属结合蛋白可对三价阳离子具有高选择性亲和力。另外或作为替代，相对于非四价阳离子，金属结合蛋白可对四价阳离子具有高选择性亲和力。本文公开的金属结合蛋白对来自例如稀土元素、其化合物或盐、或锕系元素、其化合物或盐的三价和/或四价阳离子具有亲和力，即为对于非三价阳离子和/或非四价阳离子，例如来自例如第II族元素(例如钙)、其化合物或盐的二价阳离子的至少1000倍高。本文公开的金属结合蛋白还可以对来自铪和锆元素、其化合物和盐的四价阳离子具有高亲和力。在一个实施方案中，相对于钙离子、化合物或盐，这样的金属结合蛋白可对镧系离子或锕系离子具有至少10³、10⁴、10⁵、10⁶、10⁷或更高的亲和力。在一个实施方案中，金属结合蛋白不是天然存在的。在一个实施方案中，金属结合蛋白包含非天然标签，例如His₆标签。有利地，这样的金属结合蛋白可以被包含作为对稀土或锕系元素具有高选择性的传感器，以用于检测稀土或锕系元素的存在。

在表征来自扭脱甲基杆菌(Methylorubrum extorquens)AM1的Ln依赖性甲醇脱氢酶(Ln-MDH)XoxF的工作中，鉴定了与Ln-MDH共纯化的Ln^III结合蛋白。这种镧系调节蛋白的蛋白质被称为镧调蛋白(LanM)，包含传统上与纳摩尔至毫摩尔亲和力Ca^II结合相关的金属配位基序(EF手)。然而，LanM以相对于Ca^II高至1亿倍的构象选择性(甚至更高)响应于Ln^III和稀土。除其它事项外，本公开内容描述了LanM的鉴定、纯化和分离，其稀土元素结合特征，以及其相对于其它金属离子(例如Ca^II)而对稀土元素的结合和构象选择性的分子基础。图1C显示了LanM和人(智人(H.sapiens))钙调蛋白(CaM)的氨基酸序列。有利地，分离的金属结合蛋白包含与SEQ ID NO:1(LanM)至少80％相同，例如与SEQ ID NO:1至少82％、85％、87％、90％、92％、95％、99％或100％相同的序列。例如，在一个实施方案中，分离的金属结合蛋白具有去除了SEQ ID NO:1的前21个氨基酸残基的序列。另外或作为替代，分离的金属结合蛋白包含某些基序并且在基序对之间具有一定的间隔，其可以表现出与LanM相似的性质，如本文其它地方更详细地描述的。例如，在EF手的第9位包含羧酸残基并且在每个预测的EF环之间包含与LanM中相似数目的氨基酸的分离的金属结合蛋白将具有与LanM相似的特性。在一个实施方案中，这样的金属结合蛋白不是天然存在的。在另一个实施方案中，金属结合蛋白包含非天然标签，例如His₆标签。有利地，本公开内容的金属结合蛋白可以被纯化为至少70％，例如至少75％、80％、85％、90％、95％的纯形式。

具有与参考氨基酸序列(例如SEQ ID NO:1等)至少例如约95％“相同”的氨基酸序列的多肽应理解为意指多肽的氨基酸序列与参考序列相同，只是氨基酸序列可包含对于参考氨基酸序列的每100个氨基酸至多约5个修饰。换句话说，为了获得具有与参考氨基酸序列至少约95％相同的氨基酸序列的肽，可以将参考序列的至多约5％的氨基酸残基缺失或替换成另一氨基酸，或者可以在参考序列中插入占参考序列中总氨基酸的至多约5％的数目的氨基酸。参考序列的这些修饰可发生在参考氨基酸序列的N末端或C末端位置或这些末端位置之间的任何位置，单独地散布于参考序列中的氨基酸之间，或散布在参考序列中的一个或多个连续基团中。

如本文所用，“同一性”是对与参考核苷酸或氨基酸序列相比核苷酸序列或氨基酸序列的同一性的量度。通常，对序列进行比对，以获得最高级别匹配。“同一性”本身具有本领域公认的含义，并且可以使用公知的技术来计算。尽管有多种方法来测量两个多核苷酸或多肽序列之间的同一性，但术语“同一性”是技术人员公知的(Carillo(1988)J.AppliedMath.48,1073)。用于确定两个序列之间的同一性和相似性的计算机程序方法的实例包括但不限于GCG程序包(Devereux(1984)Nucleic Acids Research 12,387)、BLASTP、ExPASy、BLASTN、FASTA(Atschul(1990)J.Mol.Biol.215,403)和FASTDB。确定同一性和相似性的方法的实例在Michaels(2011)Current Protocols in Protein Science,第1卷,JohnWiley&Sons中有所讨论。

在本发明的一个实施方案中，用于确定两个或更多个多肽之间的同一性的算法是BLASTP。在本发明的另一个实施方案中，用于确定两个或更多个多肽之间的同一性的算法是FASTDB，其基于Brutlag(1990)Comp.App.Biosci.6,237-245)的算法。在FASTDB序列比对中，查询序列和参考序列是氨基酸序列。序列比对的结果是同一性百分比。在一个实施方案中，可用于进行氨基酸序列的FASTDB比对以计算同一性百分比的参数包括但不限于：矩阵＝PAM，k元组＝2，错配罚分＝1，连接罚分＝20，随机化分组长度＝0，截止评分＝1，空位罚分＝5，空位大小罚分0.05，窗口大小＝500或主题氨基酸序列的长度(以较短者为准)。

如果由于N末端或C末端的添加或缺失(而不是由于内部的添加或缺失)而使得参考序列比查询序列短或长，则可以进行手动校正，因为FASTDB程序在计算同一性百分比时不考虑参考序列的N末端和C末端的截短或添加。对于相对于参考序列在N末端或C末端截短的查询序列，通过将查询序列中与参考序列的N末端或C末端不匹配/比对的残基数计算为查询序列总碱基的百分比，来校正同一性百分比。FASTDB序列比对的结果确定了匹配/比对。然后从使用指定参数通过上述FASTDB程序计算的同一性百分比中减去比对百分比，以得到最终的同一性百分比评分。该校正的评分可以用于确定比对如何彼此“对应”以及同一性百分比。出于手动调整同一性百分比评分的目的，可以考虑参考序列的延伸超过查询序列的N或C末端的残基。即，当手动调整同一性百分比评分或比对编号时，可以对与比较序列的N或C末端不匹配/不比对的残基进行计数。

例如，将90个氨基酸残基的查询序列与100个残基的参考序列进行比对以确定同一性百分比。缺失发生在查询序列的N末端，因此FASTDB比对不显示N末端的前10个残基的匹配/比对，10个未配对的残基占参考序列的10％(N和C末端不匹配的残基数/参考序列中的残基总数)，因此从通过FASTDB程序计算的同一性百分比评分中减去10％。如果剩余的90个残基完全匹配(100％比对)，则最终的同一性百分比将为90％(100％比对-10％未匹配突出端)。在另一个实例中，将90个残基的查询序列与100的个参考序列进行比较，只是缺失为内部缺失。在这种情况下，通过FASTDB计算的同一性百分比不进行手动校正，因为在主题序列的N或C末端不存在与查询不匹配/比对的残基。在另一个实例中，将110个氨基酸的查询序列与100个残基的参考序列进行比对以确定同一性百分比。查询中的添加发生在查询序列的N末端，因此FASTDB比对不显示N末端的前10个残基的匹配/比对。如果查询序列的剩余100个氨基酸残基与参考序列的全长具有95％的同一性，则查询的N末端添加将被忽略，并且查询与参考序列的同一性百分比将为95％。

另一方面，本公开内容提供了缺失变体，其中金属结合蛋白中的一个或多个氨基酸残基被移除。缺失可在经修饰的金属结合蛋白的一个或两个末端，或通过移除经修饰的金属结合蛋白的一个或多个非末端氨基酸残基来进行。因此，缺失变体包括经修饰的金属结合蛋白的所有片段。

在公开的同一性百分比的范围内，本发明还涉及本发明公开的多肽的替换变体。替换变体包括其中截短的金属结合蛋白的一个或多个氨基酸残基被去除并被替代残基替换的那些多肽。一方面，替换在性质上是保守的；然而，本发明还涵盖了非保守的替换。为此目的的保守替换可以定义为如下表所示。氨基酸可以根据物理性质以及对二级和三级蛋白质结构的贡献进行分类。保守替换在本领域中被认为是一个氨基酸被具有相似特性的另一氨基酸替换。示例性保守替换在以下给出。

表18：保守替换

侧链特征	氨基酸
		<u>脂肪族</u>
非极性	Gly、Ala、Pro、Iso、Leu、Val
		极性不带电荷	Cys、Ser、Thr、Met、Asn、Gln
极性带电荷	Asp、Glu、Lys、Arg
		<u>芳香族</u>	His、Phe、Trp、Tyr
<u>其它</u>	Asn、Gln、Asp、Glu

或者，保守氨基酸可以如Lehninger(1975)Biochemistry,第二版；WorthPublishers,第71-77页中所述进行分组，如下所述。

表19：保守替换

侧链特征	氨基酸
		<u>非极性(疏水)</u>
脂肪族：	Ala、Leu、Iso、Val、Pro
		芳香族：	Phe、Trp
含硫：	Met
		类别模糊(Borderline)：	Gly
<u>不带电荷-极性</u>
		羟基：	Ser、Thr、Tyr
酰胺基：	Asn、Gln
		巯基(sulfhydryl)：	Cys
类别模糊：	Gly
		<u>正电荷(碱性)：</u>	Lys、Arg、His
<u>负电荷(酸性)：</u>	Asp、Glu

又或者，示例性的保守性替换如下所述。

表20：保守替换

在甲基营养细菌中发现的甲醇脱氢酶(MDH)是可溶性的周质酶，其催化甲醇氧化成甲醛，这是使甲醇能够作为用于生长的唯一碳源的关键代谢步骤，因此在全球碳循环中发挥关键作用。最广泛表征的MDH需要Ca^II离子来发挥活性，但是最近的研究表明数种生物体中特定的Ln^III依赖性MDH(Ln-MDH，XoxF)的存在，其中来自模型甲基营养菌的扭脱甲基杆菌(Methylorubrum extorquens)和Methylacidiphilum fumariolicum SolV的酶被最佳表征。在存在编码两种系统的基因的情况下，例如扭脱甲基杆菌，Ca-MDH的表达在Ln^III的存在下被抑制，并且严格需要前面(early)Ln^III(La-Nd，并且在较小程度需要Sm)。考虑到Ca^II与生物学相关的前面Ln^III的相似离子半径，两类MDH中几乎相同的金属配位环境，以及Ca比Ln显著更高的环境丰度，将Ln^III(而不是Ca^II)具体引入Ln-MDH活性位点从化学的角度来看引起了极大的兴趣。

先前未表征的LanM(SEQ ID NO:1)已被鉴定为在从扭脱甲基杆菌细胞分离时与XoxF部分地共纯化的蛋白质。像XoxF一样，LanM是周质蛋白，并且在许多甲基营养菌基因组中是保守的。其对皮摩尔浓度的所有稀土金属(例如La^III和Lu^III和Y^III)表现出很强的构象响应，而只有在近毫摩尔浓度下才对Ca^II具有响应。该蛋白质还对其它稀土金属Sc^III(K_d未确定，但<μM)具有响应。这个结果是令人惊讶的，因为LanM包含传统上与高亲和力(纳摩尔至微摩尔)Ca^II结合相关的金属配位基序(EF手)。本文的分析表明，对Ln^III的这种相对于Ca^II的10⁸倍的选择性有一些归因于在LanM的每个EF手中发现的Pro残基。蛋白质的其它方面，例如每个EF手的第9位的羧酸残基的存在以及相邻EF手的融合也有助于EF手基序和因此的同源蛋白质对镧系元素或锕系元素三价阳离子的识别。例如，用Ala替换Pro残基会使对Ca^II的构象响应增加至少100倍。

未表征的蛋白质LanM与XoxF共纯化。从在1μM LaCl₃和作为唯一碳源的甲醇的存在下生长的扭脱甲基杆菌AM1细胞纯化出XoxF。将该蛋白质通过硫酸铵沉淀、阳离子交换色谱和尺寸排阻色谱(SEC)纯化至高纯度(图1A)，并且在23℃的比活度为22μmol/min/mg(表7)。在阳离子交换步骤之后，我们被以前从未注意到的数个共洗脱的低分子量条带的突出显现所震惊。将这些条带通过凝胶内胰蛋白酶消化、液相色谱和质谱进行分析；它们中在12kDa处的一种(图1A)对应于假设的蛋白质MexAM1_META1p1786(LanM)(基于代表蛋白质序列的75％的9种独特肽)(表1)。LanM与XoxF在两次独立的纯化中共纯化。LanM和XoxF凝胶条带的光密度分析表明在对蛋白质分子量进行归一化之后～1:1的LanM:XoxF(单体)。在最终的尺寸排阻色谱(SEC)步骤(图2)中使LanM与XoxF分离后，对完整蛋白质进行的MALDI-MS分析得出分子量为11759.574Da，与预期的信号肽的切割得到Ala22作为N末端残基(预期质量：11757.0Da)相一致。此结果表明LanM位于扭脱甲基杆菌周质中，其中XoxF和乙醇脱氢酶ExaF(先前在扭脱甲基杆菌中表征的唯一含Ln的蛋白质)二者也位于此处。

图1显示了镧调蛋白(LanM)的纯化和序列分析，表明其为新的含EF手的蛋白质。A)XoxF纯化和共纯化条带的SDS-PAGE分析。泳道1：分子量标准参照物。泳道2：扭脱甲基杆菌粗提物。泳道3：阳离子交换色谱后的XoxF(切下突出显现的条带并通过质谱进行分析，揭示为LanM)。泳道4：纯化的XoxF。泳道5：异源表达和纯化的LanM。B)LanM的EF手的序列(SEQ IDNO:1)和人CaM(作为代表性的典型含EF手的蛋白质)的EF手的序列。在CaM中，提供侧链Ca^II连接的残基显示为红色，并且参与金属配位的水分子的氢合键网络的残基显示为绿色；在LanM中，对齐的残基显示为蓝色，而独特的Pro残基为紫色加粗。C)扭脱甲基杆菌AM1 LanM与智人钙调蛋白的氨基酸序列的比较。在这两个序列中，EF手金属配位基序以红色显示。在LanM中，信号肽为蓝色。请注意，与钙调蛋白(EF1/2之间24个残基并且EF2/3之间和EF3/4之间25个残基)相比，LanM的预测的EF手环在每个EF手之间具有更短的序列(EF1/2之间和EF3/4之间12个残基，并且EF2/3之间13个残基)。在钙调蛋白中(以及一般的典型EF手)中，每个EF手包含具有9个残基的进入螺旋、9个残基的环和11个残基的离开螺旋的螺旋-环-螺旋基序。对于在每个EF手配位基序之间仅有12-13个残基，典型的EF手螺旋-环-螺旋结构可能仅可能与进入和离开螺旋融合，这表明LanM具有新的折叠，如通过与Y(III)结合的LanM的NMR分辨率结构(NMR solution structure)所示。

表1

上表1提供了肽的位置和数据。在SP快速流色谱(SP Fast Flow chromatography)之后，通过与XoxF共纯化的～12-kDa蛋白质条带的凝胶内消化和nanoLC-MS²分析鉴定出LanM肽。通过PEAKS DB搜索算法鉴定了代表全长蛋白质序列的75％(100/133个残基)的9种独特肽，其置信度得分-10logP≥30.1(蛋白质置信度得分-10lgP≥20)，对应于0.9％的错误发现率(false discovery rate，FDR)。

图2显示了SP FF色谱之后XoxF的Superdex S75色谱的部分洗脱谱(67-83.5mL，级分40-50，1.5mL/级分)。LanM在该区域洗脱。级分44-46包含对应于LanM的最强烈条带；73-77.5mL的保留时间与同一柱子上纯化的La^III-LanM-His的保留时间相关，表明LanM以La^III结合形式从扭脱甲基杆菌分离。B)来自扭脱甲基杆菌的XoxF的纯化物的SDS-PAGE分析，显示了LanM的共纯化和分离。泳道1：分子量标准参照物。泳道2-4：SPox FF柱后和S75柱后的XoxF(纯化#1)可溶性裂解物。泳道5-6：SP FF柱和S75后的XoxF(纯化#2)。泳道7：LanM(使用TEV蛋白酶切割的His₆标签)，4μg。泳道8-15：来自纯化#2，S75级分42-49(各5μL)。图2C显示了级分44(B中的泳道10)的线性MALDI-TOF质谱，11759.574Da处的峰对应于LanM。考虑到这些级分的UV-可见特征，7952.316和3974.678的峰似乎是未知血红素蛋白(但不是XoxG或细胞色素c_H)的m/z＝+1和+2峰。

LanM的氨基酸序列引起了人们的兴趣，因为其具有四个富含羧酸的EF手基序(图1B)。尽管在文献中已经表征了许多类别的Ca^II结合的含EF手的蛋白质，但是就整体序列或功能而言，还没有表征的LanM同源物。因此，在这里，我们一般地在EF手蛋白的背景下讨论LanM的显著特征。在此将普遍存在的真核Ca^II结合蛋白钙调蛋白(CaM)称为该多样化蛋白家族的代表性实例，这是因为这两种蛋白质具有某些共同的特性，以及对CaM中的Ca^II和Ln^III结合和金属离子连接的构象变化的广泛表征。然而，应注意，CaM和LanM在结构和功能上也存在明显差异。

EF手是由侧翼是两个α螺旋的金属结合环组成的结构基序，并且其经常成对出现，从而赋予金属离子结合的协同性。例如，CaM包含两对EF手，它们协同结合4个Ca^II离子，诱导构象变化以促进与靶蛋白的结合。在大多数EF手中，Ca^II离子是7-配位：基序的第1、第3、第5和第12位提供侧链氧配体，第7位提供主链羰基氧，并且第9位直接与Ca^II配位，或更通常地与配位的溶剂分子氢键键合(图1B)。EF手也结合Ln^III，通常比Ca^II稍微更紧密(例如，Tb^III-CaM为～1nM，对比于Ca^II-CaM为～1μM)，尽管Ln^III结合对于这些蛋白质来说不是生理相关的。

相对于典型EF手，LanM的EF手具有数个独特的特性。首先，LanM保留了典型EF手中存在的所有与金属结合的Asp和Asn残基，但在其每个EF手的第9位还具有Asp残基，而大约三分之一的EF手序列在此位置具有Asp。在模型EF手中显示，第9位的Asp残基贡献了相对于Ca^II而言对Ln^III约2个数量级的选择性。其次，在功能性EF手中在第1位几乎从未观察到Asn，就像在LanM的EF手4(EF4)中一样。第三，LanM的所有EF手在第2位还具有Pro残基，这在一般EF手中是非常不常见的特征，仅在预测的CaM和CaM样蛋白的<0.5％的EF手中遇到。最后，LanM在每个EF手环之间具有不寻常的短序列(12-13个残基)，而不是典型EF手中存在的24-25个残基(图1C)。这些不寻常的EF手的特征中的每一个都反映在如下表征的LanM的金属结合特性中，并提出了高度选择性稀土元素识别的原理。

LanM的纯化和表征。将LanM在大肠杆菌(E.coli)中表达以用于生物化学表征。我们最初在大肠杆菌中异源表达了包含天然信号肽的全长LanM蛋白(残基1-133)，其具有C末端烟草蚀纹病毒(TEV)蛋白酶切割序列，接着是His₆标签。尽管成功地对该蛋白质进行了周质提取和亲和纯化(图3)，证实了LanM的周质定位，但产量很低(<1mg/L培养物)。由于LanM在其序列中不含Cys残基，因此不太可能需要定位在周质中以进行适当折叠，因此我们试图通过细胞溶质表达来获得更高的蛋白质产量。我们去除了信号肽的密码子，并表达了残基22-133(这是扭脱甲基杆菌中的天然形式)，然后是蛋白酶可切割的His₆标签(wt-LanM)。该构建体使得能够纯化显著更高量的LanM(15mg/L培养物)。在进行生物化学测定之前去除了N末端His₆纯化标签，产生了wt蛋白。LanM还作为具有N末端或C末端His₆标签但没有可切割接头的细胞溶质构建体(分别为His-LanM和LanM-His)纯化。wt-LanM、His-LanM和LanM-His的生物物理特性相似(图4)，并且将LanM-His用于大多数实验。

图3显示了通过MALDI-MS对LanM-TEV-His的表征。A)来自Superose S75色谱的级分9和10(合并)的线性MALDI-TOF质谱。在L14、Y20和A22之前切割的蛋白质的预期质量分别为14245.70、13723.07和13488.81Da，如通过ExPASy ProtParam工具(https://web.expasy.org/protparam/)计算的。后者质量是通过SignalP4.0预测的。B)具有C末端TEV可切割的His₆标签(GENLYFQHHHHHH)(SEQ ID NO:8)的全长LanM的预测氨基酸序列，其用于该分析。基于MS分析观察的信号肽切割位点用虚线表示。

图4显示了His-LanM、LanM-His和wt LanM的比较。图4A：纯化的His-LanM和LanM-His的凝胶。泳道1：分子量标准参照物；泳道2：His-LanM(2μg)；泳道3：LanM-His(2μg)。凝胶上小的较低分子量条带可能是由于偶然的金属结合而导致的LanM的不同构象，因为LanM通过Superdex 75色谱作为单个峰洗脱，并且通过质谱仅观察到少的杂质。图4B：通过CD光谱监测的wt LanM、LanM-His和His-LanM(每种蛋白质为15μM)与Sm^III的配合物的K_d的确定。如方法中所述，使用EDDS对Sm^III浓度进行缓冲。将数据拟合到具有单组位点的希尔方程中，得出K_d为1.9pM(wt LanM)、4.3pM(LanM-His)和2.1pM(His-LanM)，所有希尔斜率(Hillslope)为～3。

在纯化期间，我们注意到apo-LanM在SEC柱上以异常表观分子量(46kDa)迁移，其在与La^III孵育后移至预期的～15kDa(表2)。尽管此结果可能表明脱辅蛋白质(apoprotein)的低聚化，但进一步表征却表明脱辅蛋白质表现出很少限定的结构：apo-LanM的远紫外圆二色(CD)谱(在203nm处具有明显的条带)与具有很少螺旋特征的不规则结构一致(图5A)。apo-LanM的低螺旋含量对于含EF手的蛋白质来说是令人惊讶和罕见的，因为每个EF手的两个a螺旋通常以apo和金属化(metallated)状态二者存在。值得注意的是，所有Ln^III离子(La-Lu，除Pm外；和Y)，导致222nm处的摩尔椭圆率[θ]_222nm的～200％的增加，达到～4Ln^III/LanM(图5B)，特征为具有增加的α螺旋度并伴随着与无规卷曲(random coil)相关的光谱特征的减少。基于4个EF手的存在，预期化学计量为4Ln^III/LanM。基于完全α-螺旋蛋白的平均残基椭圆率为–30000deg cm² dmol^-1，LanM与金属结合的平均残基椭圆率为–16000，表明该状态下～50％的螺旋特征。全蛋白质(holoprotein)(而不是脱辅蛋白质)的这种螺旋度与通过无序和二级结构预测算法(例如，Pondr和Jpred)计算出的一致，表明螺旋结构在apo状态下被抑制。添加多至8当量(160μM)Ca^II仅导致螺旋特性的微小增加(图7A)。因此，LanM以高度Ln^III选择性的方式显示出从主要无序状态到有序状态的构象变化。

下表2提供了以下证据：wt LanM和LanM(4P→4A)在金属结合后发生了巨大的构象变化，以及apo状态下wt与突变体结构的差异。使用100μL环将LanM或LanM(4P→4A)(100μL～1.7mM蛋白质，apo或与4当量LaCl₃预孵育)加载到HiLoad 16/600Superdex S75柱(120mL体积)上。对该柱子进行预平衡，并以0.75mL/min的流速在20mM MOPS、20mM KCl、5mM乙酸盐(pH 7.0)(对于脱辅蛋白质实验添加1mM EDTA)中运行。通过A_280nm检测蛋白质。LanM或LanM(4P→4A)峰的洗脱时间报告如下。使用GE Gel Filtration Calibration Kit LMW校准柱子，由此计算出表观分子量。

表2.

蛋白质	洗脱体积(mL)	表观分子量(kDA)
			LANM,APO	59.8±0.4	46.1
LANM,4当量LA<sup>III</sup>	76.3±0.2	15.1
			LANM(4P→4A),APO	62.1±0.7	39.4
LANM(4P→4A),4当量LA<sup>III</sup>	76.0±0.3	15.4

图5显示LanM在Ln^III存在下选择性地经历构象变化。图5A：在0-8当量La^III存在下LanM(20μM)的CD光谱。图5B：用0-8当量的Ln^III离子(La^III-Lu^III，除Pm^III外，以及Y^III)和用Ca^II对LanM(20μM)进行CD滴定的摩尔椭圆率变化的量级。图5C显示了在二甲酚橙(7μM)存在下通过LanM(5μM)的竞争性滴定监测的Ln^III与LanM结合的化学计量。

图7显示了用(A)用0-160μM Ca^II对20μM wt-LanM和(B)用0-5mM Ca^II对20μMLanM-His进行滴定的完整远UV CD光谱。在向比色皿中添加Ca^II时，已针对体积变化对光谱进行了校正。注意在两种滴定中，222nm处的螺旋特征直到已经添加了>100μM(5当量)Ca^II才开始显现。(B)中的数据代表图10B中所示的滴定曲线。

确定了纯化的LanM在275nm处的消光系数为1400M^-1cm^-1。在早期的实验中，我们注意到该消光系数表现出对Ln存在的依赖性。用La^III对LanM进行滴定导致其UV-可见光吸收光谱移动，在280和287nm处出现尖锐的峰(图6A、6B)。需要四当量La^III来产生最大的吸光度变化。基于其它蛋白质中的类似吸收条带分配给涉及Tyr残基的羟基的氢键，我们表明这些条带反映了LanM的唯一Tyr残基(紧随EF3的Y96)的相似转变。Y96的UV-vis吸收光谱对Ln的敏感性以及一级序列中Y96与EF3的接近性表明，我们也许能够通过Tyr荧光测量来监测LanM中的金属结合和/或构象变化。实际上，通过添加～4当量Ln^III(例如，图6C中的La^III和Gd^III)，Y96的荧光发射(λ_ex＝278nm)被淬灭了～70％。使用缓冲的金属溶液，确定了La^III的K_d,app。与CD滴定数据(见下文)不同，荧光滴定数据可以很好地拟合到单阶段，K_d,app＝14±3pM且n＝3.2±0.2。该K_d,app值与CD滴定中可见的次要的和亲和力稍低的结合事件非常相似，表明Tyr荧光可能特异性报告了LanM中两个金属诱导的构象变化中的第二个。

图6表明，在用La^III进行滴定时，LanM的UV-vis吸收光谱改变。将螯合的20mMMOPS、100mM KCl、10mM乙酸盐(pH 7.0)中的ApoLanM-His(15μM)用相同缓冲液中5mM LaCl₃的溶液进行滴定。图6A：光谱，相对于消光系数归一化。对于holo-LanM计算的消光系数为ε_280nm＝2000M^-1cm^-1。图6B：来自滴定的差异光谱，显示了在280和287nm处的两个尖锐的吸收特征。这些差异光谱与以下中的差异光谱几乎完全相同：天然胰岛素对比于释放含有Tyr26的肽的胰蛋白酶消化物，pH 6.94对比于pH 1.91的核糖核酸酶，以及大肠杆菌L-天冬酰胺酶的解折叠。在前两种情况下，实验表明与Tyr羟基的氢键合的差异导致了观察到的条带。图6C：滴定的A_280nm和A_287nm图，表明4当量La^III/LanM处的终点。

为了探测LanM中这四个位点的近似金属亲和力，使用比色探针二甲酚橙(XO)进行竞争性测定。当在用Ln^III对XO进行滴定中包含LanM时，与Ln^III-XO配合物的形成相关的～575nm处的吸光度增加被完全抑制，直到添加了2.9±0.3当量的Ln^III(图5C，图8；所有Ln^III的平均值)。提议可以通过注意到EF4中第1位的Asn(Asn108)而使该化学计量与在我们的CD滴定中观察到的4个位点和LanM中的4个EF手相符。Asp是功能性EF手中共有序列第1个残基，并且预期替换为Asn将使EF手结构不稳定并且损害金属结合，表明EF4是用于Ln^III结合的最低亲和力位点(类似于XO对Ln^III离子的K_d，～1-10μM)，并且因此未在XO滴定中未观察到。该提议也得到了Y^III结合的LanM的NMR分辨率结构的支持(图17A)。

图8显示了在存在和不存在LanM的情况下用Ln^III(在这种情况下为SmCl₃)对二甲酚橙进行的代表性滴定。实验中LanM的浓度为6.0μM。当A_575nm增加了观察到的总增加量的10％时认为是终点(这里，19.4μM Sm^III或3.2当量金属)，表明LanM上的紧密结合位点饱和。例如，Y^III-LanM的NMR分辨率结构表明EF4的金属配位作用较弱。

图17显示了Y^III-LanM(PDB代码6MI5)的NMR分辨率结构。图17A显示了整体结构。Y^III离子为青色，并且EF环显示为灰色。在NMR时标的中间交换表明EF4的金属配位作用较弱。图17B：LanM(EF3)中Y^III配位的细节，显示了配位残基和涉及Pro的N_i+1–H…N_i氢键。图17C：EF2/3对的氢键合连接性说明了协同作用在稀土识别中的重要性。

LanM对Ln^III表现出相对于Ca^II的1亿倍的选择性。为了研究Ln^III与3个紧密结合位点的结合，我们使用了金属螯合剂乙二醇-双(β-氨基乙基醚)--N,N,N',N'-四乙酸(EGTA)和乙二胺N,N'-二琥珀酸(EDDS)来将Ln^III浓度缓冲在低皮摩尔范围内，并且通过CD光谱监测金属依赖性的构象变化(表3)。发现EDDS是除La^III外的所有Ln^III的合适的螯合剂，对于La^III使用EGTA。在这些缓冲滴定中也观察到在化学计量滴定中观察到的[θ]_222nm的完全增加(图5B)，表明在皮摩尔游离金属浓度下监测的结合事件是LanM完全构象变化的原因。将[θ]_222nm数据拟合到最小结合模型希尔方程，以提供关于近似表观K_d(K_d,app)值和协同性的基本信息(表3)。在所有情况下，滴定产生在低皮摩尔范围内的K_d,app，希尔系数(n)为3.2±1.3(所有测试的Ln的平均值)，表明金属诱导的构象变化中的协同性。我们在所有Ln^III的滴定曲线中观察到轻微的不对称性(图10A)，表明存在两组位点(也得到了通过监测LanM的唯一Tyr残基Y96的固有荧光的滴定支持)。然而，只有在La^III的情况下，两组位点才能得到充分分辨，以提供可接受的拟合误差；因此，对于除La^III以外的所有Ln^III，我们的报告符合具有一组位点的结合模型。有趣的是，在最低浓度下诱导LanM的构象变化的Ln^III，即La^III-Sm^III(图9)，也是仅有的在体内诱导来自xoxF1启动子的表达并激活扭脱甲基杆菌XoxF的Ln，这也许表明LanM可能涉及细胞中前面Ln和后面Ln的辨别。

表3.来自用Ln^III和Ca^II对LanM和LanM(4P→4A)进行的拟合CD滴定的表观K_d、希尔系数(n)和222nm处摩尔椭圆率的变化(Δ[θ])。通过组合来自至少3次独立滴定[2次用于Nd^III-LanM(4P-4A)]的标准偏差和如所述计算的误差来确定不确定度。在元素周期表中Er^III的右侧，在确定Ln^III-EDDS CD滴定终点中的不确定性太大而无法可靠地确定K_d。La^III的数据适合于两阶段，但是对于其它金属离子来说第二阶段不能很好地分辨。

图9示出了相对于有效离子半径绘图的Ln^III-LanM配合物(Ln＝La、Nd、Sm、Gd、Tb、Ho、Y)的K_d,app值。

图10表明LanM对前面Ln^III表现出相对于Ca^II的10⁸倍的选择性，而这通过替换LanM的EF手Pro残基而改变。使用CD光谱在多种螯合剂缓冲的游离金属离子浓度下监测[θ]_222nm，并将数据拟合到希尔方程中以确定K_d,app(表3)。图15A：La^III-LanM。图15B：Ca^II-LanM(未缓冲的Ca^II)。图15C：La^III-LanM(4P→4A)。图15D：Ca^II-LanM(4P→4A)。

与Ln^III相反，LanM对Ca^II的响应非常弱，因此用未缓冲的Ca^II进行Ca^II滴定。Ca^II诱导了CD光谱中与Ln^III相似的变化，但是幅度稍小并且K_d,app为710±30μM且n＝3.0±0.2(图10B，表3)。因此，相对于Ca^II，LanM在对Ln^III的构象响应中表现出显著的～10⁸倍选择性。这种选择性显著大于其它表征的含EF手的蛋白质；例如，相对于Ca^II，CaM对Tb^III仅表现出～10³倍的选择性，并且wt大肠杆菌半乳糖结合蛋白的EF手(第9位Gln)表现出相对于Ln^III的<10倍选择性，并且在第9位进行Asp或Glu替换时仅表现出100至200倍的选择性。

LanM的保守Pro残基的突变恢复了较低浓度下的Ca^II响应。由于我们的CD来源的K_d,app值反映了构象变化，但不一定是用于金属结合的固有K_d，所以我们通过等温滴定量热法(ITC)评估了Ca^II结合(表4)。结合变化和构象变化二者可能有助于ITC等温线，但实验是在40μM LanM下进行的，远低于Ca^II的K_d,app，以使来自构象变化的影响最小化。使用具有K_d＝2.5μM和2.8±0.4位点的吸热阶段和具有K_d＝40μM和7.2±0.9位点的放热阶段的2组非相互作用位点的模型，获得了与我们数据的最佳拟合。虽然需要进一步的分析来建立完整的模型，但我们对这些结果的解释是Ca^II最初与3个EF手(也许是EF1-3)结合而不诱导构象变化，随后多个进一步的结合事件触发构象响应。因此，最初的Ca^II结合似乎与野生型(wt)LanM中的结构转变脱钩。为了测试这种脱钩(据我们所知在其它含EF手的蛋白质中未观察到)是否可能与LanM的EF手第2位的不寻常的保守Pro(“Pro2”)相关，我们将所有四个Pro2残基突变为Ala，这是典型EF手中此位置的常见残基。这种“4P→4A”变体的SEC表明，Pro→Ala突变显著改变了apo状态(但不是holo状态)下的蛋白质构象(表3)。LanM(4P→4A)保留了wt LanM对Ln^III和Ca^II的全部摩尔椭圆率变化，但是其表现出改变的金属结合特性。在CD滴定中，虽然LanM(4P→4A)相对于wt LanM的5至10倍低的浓度响应La^III和Nd^III(图10C，表3)，但是突变体以300倍低的浓度响应Ca^II响应，K_d,app＝2.6±0.3μM(图10D，表3)。有趣的是，该值类似于通过ITC对Ca^II与wt LanM结合的第一阶段测得的K_d。不幸的是，我们通过ITC获得Ca^II-LanM(4P→4A)的固有K_d的尝试由于复杂的结合等温线和构象变化的贡献而尚未成功，因此必须采用专门的方法，例如流动透析(flow dialysis)。然而，LanM的EF手中Pro残基的替换显然使该蛋白质在构象上对Ca^II显著更加敏感。

表4.通过ITC评估的Ca^II与wt LanM结合的热力学参数。条件：细胞中40μM wtLanM，注射器中4.0mM Ca^II，缓冲液B，25℃。将数据拟合到具有两组非相互作用位点的结合模型。

从这些K_a计算出的K_d范围：1.6-5.7μM(位点1)，28-60μM(位点2)。

	K<sub>a</sub>(M<sup>-1</sup>)	n	ΔH(kJ mol<sup>-1</sup>)	ΔG(kJ mol<sup>-1</sup>)	ΔS(J K<sup>-1</sup>mol<sup>-1</sup>)
						位点1	(4.1±2.3)×10<sup>5</sup>	2.8±0.4	1.4±0.5	–31.7±11.4	111±5
位点2	(2.6±0.9)×10<sup>4</sup>	7.2±0.9	–11.0±3.2	–25.0±10.4	47±14

LanM，高选择性的Ln结合蛋白。我们对LanM的表征揭示，自然界已经改编了EF手的普遍存在的Ca^II结合框架，以便以比Ca^II高的亲和力和选择性与Ln^III结合。尽管金属离子特性(例如离子半径和电荷)可能有所贡献，但是我们的数据表明，LanM不会那么多地抑制Ca^II结合(与专用的含Ca^II结合EF手的蛋白质的亲和力相比)，因为其确实抑制了由该结合引起的构象响应。目前尚不清楚Ln^III与LanM的结合是否也是如此，但是因为仅需要皮摩尔的Ln^III来触发构象变化，所以这个问题对细胞的重要性可能比Ca^II响应性是否最小化要低(考虑到后者离子的丰度)。LanM的保守Pro残基及其不寻常的EF手的其它特性实现此壮举的详细机制将在本文其它地方进一步讨论。

除了LanM的Pro2残基在蛋白质对Ln^III(相对于Ca^II)的构象响应的高选择性中的重要性以外，两个其它潜在的贡献因素是离子半径和电荷。LanM表现出与较小的后面Ln^III相比稍微优先于较大的前面Ln^III(图9)，表观K_d的范围从对于La^III(对于配位数6，有效离子半径为

表6)的5pM到对于Ho^III

的25pM，后者是详细研究了的最小Ln^III。Ca^II的有效离子半径正好在该范围内

类似于Pr^III的。因此，尽管离子半径可能解释了对一种Ln比对另一种的优先响应，但其似乎对于LanM对Ln^III(相对于Ca^II)的选择性贡献很少。

类似地，对Ln^III(相对于Ca^II)的构象选择性为10⁸(并且在亲和力方面的选择性为至少10⁶)，比CaM(～10³)或某些工程EF手肽(～50)的大得多，表明Ln^III比Ca^II更高的电荷也不足以解释LanM的Ln选择性。Falke及其同事的研究表明，含有单个EF手的大肠杆菌蛋白质的EF手第9位Asp或Glu残基的存在(如在LanM的所有EF手中发生的)相对于该位置的其它氨基酸将Tb^III结合亲和力提高了10至100倍。类似地，可能LanM中Ln^III配位的最接近的先例是镧系元素结合标签(LBT)，即经工程化以便以更高的选择性与发光Ln^III配位的Ca^II结合EF手，其在与Ln^III离子配位的EF手的第9位也具有Glu残基。然而，LanM对于Ln^III的K_d,app值比LBT(或据我们所知使用生物配体的Ln的任何其它配位基序)的K_d紧密～10³-10⁶倍，这取决于Ln^III离子。总之，这些文献先例表明，LanM的第9位的Asp可能有助于该蛋白对Ln^III的高度亲和力。对4D9N-LaMP1变体(见下文)的表征支持该观点，与wt相比，所述变体表现出更低的对Ca^II的表观K_d，但是更高的对La^III的表观K_d。最后，相邻EF手融合以允许在金属与EF手结合时大量疏水性堆积的LanM的不寻常的结构(图17)可能也有助于蛋白质对稀土的高亲和力。如本文其它地方所讨论的，从我们的结果中得出的这些原理已用于设计对不同镧系元素或锕系元素具有增加或降低的选择性的LanM变体，并且其也可用于通过适当地突变合适的氨基酸来产生用于结合锕系元素离子(例如铀)的其它变体。换句话说，可以对LanM的同源物进行定制，以在不同镧系元素或锕系元素之间提供选择性。

表5.用于克隆和测序的引物

LanM在甲基营养菌中的保守性和LanM的生理作用。迄今为止，仅在几种甲基营养菌和恶臭假单胞菌(Pseudomonas putida)中表征了含Ln的酶。对恶臭假单胞菌KT2440基因组的BLAST分析未发现LanM同源物，但在预测的混合传感器组氨酸激酶/响应调节物(基因座WP_010954492)中鉴定出具有Pro2残基的假定EF手(DPDEDGFTICGD)；这些观察结果促使人们探索具有Pro2残基的EF手是否更普遍地构成生物学中的Ln选择性配位基序，这可能有助于鉴定可利用Ln进行生长的新生物。然而，更重要的是，使用LanM序列作为查询的BLAST分析表明，具有至少一个含有Pro2标记的EF手的LanM样基因广泛分布在甲基杆菌属(Methylobacterium)和慢生根瘤菌属(Bradyrhizobium)基因组中。这些基因之一，来自水产甲基杆菌(Methylobacterium aquaticum)菌株22A的c02050，与LanM具有59％的序列同一性并且在其四个EF手中包含两个Pro2基序，其最近被证明诱导对La^III的5倍响应(与鉴定LanM的生长条件一致)。未表征编码的蛋白质，并且没有证据表明其以这种相对于Ca和其它金属的选择性结合Ln。

在扭脱甲基杆菌基因组中，lanM与METAlp1785相邻，编码假定的TonB依赖性转运蛋白。TonB依赖性系统通常在金属获取(例如，Fe^III-柠檬酸盐和Fe^III-铁载体(Fe^III-siderophore)摄取)中发挥作用，并且包含外膜转运蛋白和接收来自转运蛋白的货物的周质结合蛋白。确实，LanM来源传感器LaMP1已被用于表明，这些细菌分泌Ln结合分子(lanthanophore)以促进对前面Ln(La-Nd，和较小程度上Sm)的选择性摄取。此外，需要进一步的工作来确定LanM的生理功能，尽管其高度Ln^III选择性的无序向有序转变指向一种功能：其中其对于仅在Ln^III的存在下才会发生“活性”结构形成的细胞是关键的。

表6.对于配位数(CN)＝6-12，Ln(III)、Ca(II)和Y(III)的有效离子半径(结晶半径，

)

元素	CN＝6	CN＝7	CN＝8	CN＝9	CN＝10	CN＝12
							Ca(II)	1.14	1.20	1.26	1.32	1.37	1.48
Y(III)	1.040	1.10	1.159	1.215
							La(III)	1.172	1.24	1.300	1.356	1.41	1.50
Ce(III)	1.15	1.21	1.283	1.336	1.39	1.48
							Pr(III)	1.13		1.266	1.319
Nd(III)	1.123		1.249	1.303		1.41
							Sm(III)	1.098	1.16	1.219	1.272		1.38
Eu(III)	1.087	1.15	1.206	1.260
							Gd(III)	1.078	1.14	1.193	1.247
Tb(III)	1.063	1.12	1.18	1.235
							Dy(III)	1.052	1.11	1.167	1.223
Ho(III)	1.041		1.155	1.212	1.26
							Er(III)	1.030	1.085	1.144	1.202
Tm(III)	1.020		1.134	1.192
							Yb(III)	1.008	1.065	1.125	1.182
Lu(III)	1.001		1.117	1.172

LanM的高度Ln选择性构象响应强烈表明，该蛋白质是甲基营养菌中新兴的“lanthanome”的成员，lanthanome由某些细菌和可能的其它生物体中参与Ln调节、摄取、运输、储存和利用的蛋白质和小分子组成。该网络的表征不仅丰富了我们对Ln离子的基本配位化学的理解；还将启发模型配合物以探测生物学上重要的Ln催化反应的化学过程，使得能够进行这些酶的电催化应用，以及为改造甲基营养菌或由其产生的蛋白质/小分子(例如LanM自身)的工作提供信息，以实现除了医学应用(例如，Gd结合的LanM或衍生物作为MRI造影剂，或者放射性Lu结合的LanM或衍生物作为放射性药物)之外那些相对难以获得但是在技术上越来越有用的元素的更可持续的提取和分离。

以下实施例旨在进一步说明本发明的某些优选实施方案，而本质上并非限制性的。本领域技术人员将认识或仅使用不超过常规实验就能够确定本文所述的特定物质和程序的许多等同物。

以下公开内容描述了为表征和测量LanM的多种性质而进行的实验。在这些实验中，镧系元素盐(氯化物或乙酸盐)的最低纯度为99.9％稀土金属含量。SmCl₃获自AlfaAesar，TmCl₃获自Strem，YCl₃获自Acros，并且所有其它Ln^III均获自Sigma-Aldrich。扭脱甲基杆菌(ATCC 14718,NCIB 9133)获自美国典型培养物保藏中心(American Type CultureCollection)。扭脱甲基杆菌AM1基因序列和基因组图谱获自BioCyc(https://biocyc.org)。引物和gBlock购自Integrated DNA Technologies(IDT)。分别用于克隆和重组蛋白质表达的大肠杆菌菌株[5α和BL21(DE3)]以及克隆试剂(限制酶、Q5 DNA聚合酶、OneTaq DNA聚合酶、T4 DNA连接酶和HiFi组装试剂盒、KLD Enzyme Mix)购自New EnglandBiolabs。PCR纯化和微量制备试剂盒(PCR cleanup and miniprep kit)来自Qiagen和Omega Bio-tek，并且凝胶提取使用来自Zymo Research的Zymoclean凝胶DNA回收试剂盒。Ni-NTA树脂购自Qiagen和Thermo Scientific。蛋白凝胶电泳使用自制或BioRad 4-20％梯度凝胶和Biorad Mini-Protean仪器，或Life Tech 16％Tris-甘氨酸凝胶和迷你凝胶仪器(mini gel apparatus)进行。自动化蛋白质色谱法使用GE Healthcare Biosciences AktaPure快速蛋白质液相色谱(FPLC)系统。使用石英比色皿(Starna Cells)在Agilent Cary60UV-可见分光光度计上获得UV-可见吸收光谱。使用Tecan Infinite M1000 Pro板读取器进行孔板分析。通过在Huck基因组学设施(Huck Genomics Facility)中测序来验证载体DNA序列，并在宾夕法尼亚州立大学(Penn State)的X射线晶体学和自动生物量热仪(X-rayCrystallography and Automated Biological Calorimetry Facility)进行CD和直接检测测量。为了使金属污染最小化，根据制造商的方案，将所有用于LanM实验的缓冲液用10g/L Chelex 100(BioRad，100-200目)处理>1小时，然后重新调节pH。所有蛋白质和金属溶液在获自Sarstedt的1.5mL微量离心管或15mL或50mL离心管中制备。

实验技术

扭脱甲基杆菌的生长。如Marx及其同事的描述制备MP培养基，只是将铁(如硫酸亚铁铵)从C7-金属溶液中除去并且在高压灭菌之前作为固体添加。培养基由以下组成：30mMPIPES(pH 6.75)、1.45mM K₂HPO₄、1.88mM NaH₂PO₄、8mM(NH₄)₂SO₄、0.5mM MgCl₂、20μM CaCl₂、45.6μM柠檬酸钠、18μM(NH₄)₂Fe(SO₄)₂、1.2μM ZnSO₄、1μM MnCl₂、14μMNa₂MoO₄、1μM CuSO₄、2μM CoCl₂和0.33μM Na₂WO₄，补充有0.5％v/v甲醇。所有生长在30℃进行。将扭脱甲基杆菌从甘油储备液中划线到MP培养基/甲醇1.5％琼脂板上。使用单个菌落接种14mL聚丙烯培养管(BD Falcon)中的3mL MP培养基/0.5％甲醇培养物并且以200rpm摇动生长～2d。起始培养物(2mL)用于接种补充有1μM LaCl₃的200mL MP-甲醇介质，并且使细胞生长至OD₆₀₀～0.8，此时将培养物用于接种6L烧瓶中的包含1μMLaCl₃的4×2L MP-甲醇培养基至OD₆₀₀～0.02。使培养物生长至OD₆₀₀～0.8-1.0。通过在4℃以7000g离心7分钟收集细胞，并在-80℃冷冻。每升培养物的典型产量为约1g细胞糊。

XoxF的纯化。所有操作在4℃进行。将来自8L扭脱甲基杆菌生长的细胞糊重悬于每10mL中5mL/g 20mM MES,pH 5.5(缓冲液A)和1个Roche Complete mini蛋白酶抑制剂片剂中。使混悬液通过14000psi的French压力室两次，并通过在4℃以30000×g离心20分钟沉淀出碎片。倾析出上清液，并在搅拌下经过在～15分钟将硫酸铵添加至40％饱和度(在4℃为226g/L)。进一步搅拌15分钟后，将混悬液在4℃以20000×g离心10分钟。倾析出上清液，并添加硫酸铵至80％饱和度(在4℃时另外258g/L)，然后如上所述进一步搅拌并离心。离心后将沉淀重悬在最小体积(～4mL)的补充有0.25mM PMSF的缓冲液A中，并施加于用具有0.25mM PMSF的缓冲液A预平衡的2.5×16cm(80mL)Sephadex G50柱。通过跟随浅红色蛋白质条带收集级分，并使用板读取器基于A_280nm合并含蛋白质的级分。使用Amicon Ultra10kDa MWCO离心过滤装置将合并的级分浓缩至5mL，并通过离心(14000×g,2分钟)除去不溶物。将上清液加载到GE Healthcare Akta Pure快速蛋白质液相色谱(FPLC)系统上的用缓冲液A预平衡的HiPrep SP FF 16/10柱(20mL柱体积，CV)上。将柱子用2CV的缓冲液A冲洗，并用缓冲液A中0-250mM NaCl的梯度经过10CV洗脱。以峰分级模式收集各级分(4mL)，并在280nm、346nm(PQQ吸收)和413nm(细胞色素Soret带)处收集色谱图。流速为2mL/min。使用支持信息(Supporting Information)中描述的染料连接的测定(dye-linked assay)基于活性合并各级分(每个级分2-5μL)。活性以～110-150mM NaCl处的346nm峰洗脱。使用Amicon Ultra 30kDa MWCO离心过滤装置将合并的级分浓缩至2mL，并在缓冲液B(20mMMOPS、20mM乙酸盐、100mM KCl,pH 7.0)中加载到HiLoad 16/600Superdex 75pg柱(120mL)中。将柱子以0.75mL/min运行，收集1.5mL级分，然后得到280、346和413nm处的吸光度。XoxF在～48-53mL时洗脱出来，并且LanM在73-77mL时洗脱出来。基于对异源表达的蛋白质的后续研究，LanM的洗脱时间表明其与La^III结合，但是蛋白质的纯度不足以进一步评估此观察结果。基于通过SDS-PAGE评估的纯度合并级分。使用30kDa MWCO过滤装置浓缩XoxF。使用通过ExPASy ProtParam工具获得的ε_280nm＝137mM^-1cm^-1(每单体)确定纯化的XoxF的浓度。A_280nm/A_350nm比率是10.2。为了产生纯化表(表7)，使用Pierce BCA Protein Assay Kit(Thermo)以牛血清白蛋白作为标准品确定最终色谱步骤之前样品中的蛋白质浓度。来自8L培养物的XoxF的产量为2-3mg。

表7.来自8L扭脱甲基杆菌细胞培养物(～10g细胞糊)的XoxF的纯化

*添加硫酸铵至80％饱和度并离心后使沉淀重悬

染料连接的活性测定。根据Day和Anthony的方法，使用吩嗪硫代硫酸盐(PES)作为电子受体通过2,6-二氯酚靛酚(DCPIP)的还原来测定色谱级分和纯化的XoxF的活性。每个测定混合物(485μL)包含：100mM Tris,pH 9.0、15mM NH₄Cl、1mM吩嗪乙基硫酸盐(PES)和100μM DCPIP。在室温(23℃)下以动力学模式在Cary 60UV可见分光光度计上进行测定，在600nm监测。将测定样品(1-10μL)添加到混合物中。存在大量的背景活性，尤其是在粗样品中；几分钟(1-5分钟)后，A_600nm读数稳定并添加10μL 1M(4.0％v/v)甲醇以测量甲醇依赖性活性。使用测得的斜率(ΔAU/min)计算酶活性，以单位(U)报告，其中1U定义为开始反应后15至30秒之间每分钟还原的1μmol O₂，对应于1μmol DCPIP还原/分钟。如下确定测定缓冲液中DCPIP的消光系数：将～3mM DCPIP的水性储备溶液稀释到20mM MOPS pH 7.0(pH 7.0下ε_600nm＝20600M^-1cm^-1)和100mM Tris pH 9.0中，然后比较吸光度值，得出ε_600nm＝22500M^- ¹cm^-1。通过BCA测定来确定粗样品中的蛋白质含量。

对凝胶切片进行质谱分析以鉴定LanM。

a)样品制备，凝胶切片。使用干净的剃刀刀片将凝胶切片切成～1mm³块，并用约5个凝胶体积的含有50mM三乙胺碳酸氢盐(triethylammonium bicarbonate，TEAB)的50％乙腈(MeCN)在37℃20分钟洗涤三次。通过将凝胶切片在Eppendorf Thermomixer R中混合的情况下在含有5mM三(2-羧乙基)膦盐酸盐(TCEP)的200mM TEAB中于37℃孵育30分钟，然后在50mM TEAB、100mM碘乙酰胺中于37℃孵育15分钟来进行二硫化物的还原和Cys残基的烷基化。除去还原和烷基化剂试剂；将凝胶如上所述在50％MeCN、50mM TEAB中洗涤3次，并在纯MeCN中脱水。在Speedvac(Thermo)中除去了残留的MeCN。

b)蛋白水解。将1μg/μL的测序级胰蛋白酶(Thermo)在1mM HCl水溶液中的储备溶液用冷却的50mM TEAB稀释100倍，并使干燥的凝胶块在蛋白酶溶液中完全再水合。除去过量的蛋白酶溶液，并添加足量的50mM TEAB以覆盖凝胶。在37℃进行蛋白水解过夜，然后将TEAB溶液转移到新的微量离心管中。用三个50μL体积的50％MeCN、0.1％甲酸和一个50μL体积的纯MeCN提取肽；然后将这些溶液与TEAB溶液合并，并在Speedvac中干燥。将干燥的肽在10μL 2％MeCN、0.1％甲酸中重构以用于LC MS²分析。

c)Nano-LC MS²。使用2％水性MeCN、0.1％甲酸作为流动相，以5μL/min的流速将肽加载到Acclaim PepMap100捕集柱(100μm×2cm,C18,5μm,

Thermo)上。在AcclaimPepMap RSLC柱(75μm×15cm,C18,2μm,

Thermo)上以含有0.1％甲酸的水中2-35％MeCN的30分钟线性梯度分离肽。通过Dionex Ultimate 3000nano-LC系统(Thermo)以300nL/min输送梯度。使用‘Nth order double play’方法在LTQ Orbitrap Velos(Thermo)上获得质谱：在R 60,000处进行完整FT MS扫描，然后对具有CID活化作用的最强前体进行10次离子阱MS²扫描。仅选择电荷状态为2或更高的前体进行MS²；启用了单同位素前体选择，并且隔离窗口(isolation window)为2m/z。445.120030m/z的聚硅氧烷信号用作锁定质量；离子注入时间和自动增益控制目标值设置为默认值。

d)数据分析。使用两种不同的应用程序对质谱进行了分析：具有SEQUEST搜索引擎的Proteome Discoverer 1.3(P.D.1.3,Thermo)以及具有PEAKS DB和Spider搜索算法的PEAKS Studio(Bioinformatics Solutions,bioinfor.com)。在这两种应用程序中，选择半胱氨酸脲基甲基化(cysteine carbamidomethylation)(+57.021)作为静态修饰，并且选择甲硫氨酸氧化(+15.995m.u.)作为动态修饰；允许两个错过的切割；并且前体和片段的质量公差分别设置为15ppm和0.5Da。蛋白质序列数据库编译自Uniprot参考蛋白质组UP000009081，扭脱甲基杆菌(菌株ATCC 14718/DSM 1338/JCM 2805/NCIMB 9133/AM1)的，包含6233个序列和一个常见的污染物数据库(299个序列)。

来自大肠杆菌周质的具有C末端TEV/His₆标签的LanM的构建、表达和纯化。

a)克隆。作为含有TEV蛋白酶切割位点和然后C末端的His₆标签(GENLYFQGHHHHHH)(SEQ ID NO:8)的461bp gBlock基因片段获得扭脱甲基杆菌AM1 META1p1786，其使用IDT的在线密码子优化工具进行了密码子优化以用于在大肠杆菌中表达(表9)。为了制备插入物，将gBlock(250ng,10ng/μL)用NdeI和EcoRI-HF消化1小时，并通过在65℃孵育20分钟使酶失活。用NdeI和EcoRI-HF(各20U)将pET-24a(2μg，表8为用于该研究的所有质粒)消化1小时，并且在凝胶电泳(1％琼脂糖)之后，切下载体片段并使用Zymoclean凝胶DNA回收试剂盒(Zymoclean Gel DNA Recovery Kit)纯化。根据制造商的方案，使用T4 DNA连接酶将插入物连接到经消化的载体(5:1插入物:载体)中。通过菌落PCR(OneTaq Quick-Load)筛选转化子的插入物，并在宾夕法尼亚州立大学基因组学核心设施(Penn State Genomics CoreFacility)使用引物T7P(表5，本研究中使用的所有引物)通过DNA测序确认正确的插入物，得到pET24a-LanM-TEV/His。

表9.扭脱甲基杆菌AM1 LanM(META1p1786)(SEQ ID NO:2)和用于表达LanM的gBlock的DNA序列。编码信号肽Metl-Ala21的区域用双下划线显示，并且TEV蛋白酶识别序列和His₆标签用下划线显示。

>META1p1786(SEQ ID NO:2)

>密码子优化的、C末端TEV和His₆位点(SEQ ID NO:11)

>密码子优化的、N末端TEV位点、His₆标签，来自pET28a(SEQ ID NO:12)

表8.本公开内容中使用的质粒

b)表达。用pET24a-LanM-TEV/His转化化学感受态大肠杆菌BL21(DE3)细胞，并铺板在含有50μg/mL卡那霉素(Km)的LB琼脂板上，并在37℃生长。单个菌落用于接种7mL LB(在所有生长培养基中具有50μg/mL Km)，使其在37℃以200rpm摇动生长～16小时。该培养物用于接种补充有0.5mM MgCl₂和0.1mM CaCl₂的LB培养基的一个2L培养物(在6L烧瓶中)，并且使培养物在37℃以200rpm摇动生长。在OD_600nm～0.6，添加异丙基β-D-1-硫代吡喃半乳糖苷(IPTG,Amresco)至终浓度为0.2mM；进一步孵育3小时后，通过4℃以7000×g离心7分钟使细胞沉淀，每L培养物产生～2g细胞糊。

c)纯化。将细胞糊重悬浮于40mL/g的30mM Tris、1mM EDTA、20％蔗糖，pH 7.4(缓冲液C)中，并在室温搅拌20分钟。将混悬液在4℃以9000×g离心10分钟。倾析出上清液，并在4℃搅拌20分钟而将细胞沉淀重悬于每克原始细胞糊20mL 5mM MgSO₄中，然后将混悬液在4℃以9000×g离心10分钟。倾析出上清液，添加0.05体积的1.0M Tris,pH 7.4，以及固体NaCl至100mM。将该溶液施加至在50mM磷酸钠、10mM咪唑、5％甘油，pH 7.0(缓冲液D)中预平衡的0.7×1.0cm(1.0mL)Ni-NTA琼脂糖柱。将柱子用30CV的含有100mM NaCl和0.25mM苯基甲基磺酰氟(PMSF)的缓冲液D冲洗，然后用15CV的50mM磷酸钠、250mM咪唑、5％甘油，pH 7.0洗脱(缓冲液E)洗脱。使用Amicon Ultra 15 3-kDa MWCO离心过滤装置将洗脱的蛋白质浓缩至1.5mL。

在HiLoad 16/600Superdex 75pg柱(GE Healthcare,120mL)上通过尺寸排阻色谱除去较高分子量的污染物，并将缓冲液交换成20mM MOPS、100mM KCl、1mM EDTA，pH 7.0(缓冲液F)。在以1.0mL/min进行柱平衡后，使用2mL毛细管定量环(capillary loop)将蛋白质加载到柱子上，并用1.2CV的缓冲液F以0.75mL/min对柱子进行洗脱，并以峰分级模式收集1mL级分(1mAU阈值)。LanM-TEV/His在54-63mL时洗脱出来。收集含蛋白质的级分并通过SDS-PAGE进行分析。使用Amicon Ultra 3-KDa MWCO离心过滤装置浓缩级分，并使用ε_280nm＝1490M^-1cm^-1(ExPASy ProtParam)估算蛋白质浓度。纯化产生了来自2L培养物的～1.4mgLanM-TEV/His。对LanM-TEV/His进行质谱。根据制造商的方案，使用0.5mL Zeba离心柱(Thermo Fisher)将LanM-TEV/His(～100μM,100μL)交换到水中。在宾夕法尼亚州立大学蛋白质组学和质谱学设施(Penn State Proteomics and Mass Spectrometry Facility)的Ultraflextreme质谱仪(Bruker Daltonics)上，以线性阳离子模式通过MALDI-TOF MS分析完整的蛋白质。

用于细胞溶质表达的LanM的克隆。作为380bp gBlock基因片段获得了缺少N末端信号序列并含有TEV蛋白酶切割位点(GENLYFQG)(SEQ ID NO:61)的扭脱甲基杆菌AM1META1p1786的可溶性结构域，其使用IDT的在线密码子优化工具进行密码子优化以用于在大肠杆菌中表达(表9)。用NdeI和EcoRI消化后，将gBlock插入到类似消化的pET-28a中，并且在宾夕法尼亚州立大学基因组学核心设施使用引物T7P通过DNA测序确认正确插入物，得到pET28a-His/TEV-LanM。

His/TEV-LanM的表达和纯化。用pET28a-His/TEV-LanM转化化学感受态大肠杆菌BL21(DE3)细胞，并铺板在含有50μg/mL Km的LB-琼脂板上，并在37℃生长。使用单个菌落接种100mL LB(在所有生长培养基中50μg/mL Km)，使其在37℃以220rpm摇动生长～16小时。培养物(40mL)用于接种补充有0.5mM MgCl₂和0.1mM CaCl₂的LB的一个2L培养物(在6L烧瓶中)，并且使培养物在37℃以200rpm摇动生长。在OD_600nm～0.5，添加IPTG至终浓度为0.2mM；进一步孵育3小时后，通过在4℃以7000×g离心7分钟以使细胞沉淀，每升培养物产生～2.2g细胞糊。将细胞沉淀物在-80℃冷冻。

所有操作在4℃进行。将细胞糊重悬于含有2个Roche Complete mini蛋白酶抑制剂片剂、2U/mL DNA酶和0.25mM苯基甲基磺酰氟(PMSF)的缓冲液D中。使混悬液通过14000psi的French压力室两次，并通过在4℃以30000×g离心20分钟沉淀出碎片。倾析出上清液，并施加于在缓冲液D中预平衡的1.5×2cm(3.5mL)Ni-NTA琼脂糖柱。将柱子用20CV的含100mM NaCl的缓冲液D冲洗，然后用10CV的缓冲液E洗脱。使用Amicon Ultra 3-kDa MWCO离心过滤装置将洗脱的蛋白质浓缩至～10mL。以25mL总体积，通过在具有100μL～25μM TEV蛋白酶(由宾夕法尼亚州立大学的X.Zhang的馈赠)的50mM Tris、5mM二硫苏糖醇、1mMEDTA，pH 7.4中孵育16小时来从5mL的蛋白质切割His₆标签和TEV识别序列。基于ε_275nm＝2800M^-1cm^-1(1个Tyr残基在标签中，并且1个在天然蛋白质序列中)，消化期间的近似蛋白质浓度为150μM。然后用50mM Tris，pH 7.4将溶液稀释至125mL，并通过与上述相同的预平衡Ni-NTA柱，并用1.5CV的50mM Tris,pH 7.4冲洗柱子。通过离心过滤(Amicon Ultra 3kDaMWCO)将合并的流通液和洗涤液浓缩至1.5mL。

在HiLoad 16/600Superdex 75pg柱上通过尺寸排阻色谱除去较高分子量的污染物，并将缓冲液交换成缓冲液B。柱平衡后，使用2mL毛细管定量环加载蛋白质样品，用3mL缓冲液B冲洗，并用1CV的缓冲液B以0.75mL/min洗脱，收集到1.5mL级分(在峰分级模式下的1mAU阈值)。基于A_280nm合并含LanM的级分(55-63mL)，并通过离心过滤浓缩至＜3mL。使用Slide-a-Lyzer透析盒(MWCO 3500)在室温将蛋白质相对于含有5gChelex-100的500mL缓冲液B透析过夜(～16h)(在搅拌1小时并且将pH校正至7.0之后)。以使用EMD MilliporeDirect Detect仪器确定的ε_275nm＝1400M^-1cm^-1确定蛋白浓度。纯化产生～15mg/L的培养物。除了使用缓冲的金属溶液进行XO滴定和K_d确定外，将所得Chelex处理的缓冲液用于所有后续实验。

因此，本公开内容的一个方面包括由核苷酸编码的分离的金属结合蛋白，所述核苷酸包含与SEQ ID NO:2的序列具有至少80％同一性的序列(参见表9)。在一个实施方案中，核苷酸包含与SEQ ID NO:2的序列具有至少85％、90％、93％、95％、97％、98％、99％或100％同一性的序列。例如，在一个实施方案中，核苷酸包含去除了SEQ ID NO:2的前21个核苷酸的序列。

具有His₆标签的LanM的构建和纯化。通过使用引物His-LanM-NdeI-正向、LanM-EcoRI-反向、LanM-NdeI-正向或LanM-His-EcoRI-反向对pET28a-His/TEV-LanM中的LanM基因进行PCR扩增来产生具有N末端或C末端His₆标签的构建体。在用NdeI和EcoRI-HF消化后，将插入物连接到类似消化的pET24a中，筛选并通过测序进行验证。将这些蛋白质类似于His/TEV-LanM进行表达和纯化，只是所用的柱子为8mL(1.5×4.5cm)，无需进行TEV消化，并且用于Superdex 75色谱的缓冲液为20mM MOPS、20mM KCl、5mM乙酸盐、1mM EGTA，pH 7.0(缓冲液G)。对于His-LanM和LanM-His，纯化分别产生了15mg和23mg蛋白质/L培养物。

使用二甲酚橙(XO)的竞争性测定。比色皿含有500μL的20mM MES-KOH、20mM乙酸盐、100mM KCl，pH 6.1(缓冲液H，与10g/L Chelex 100一起搅拌1小时，然后调节pH)，～7μM二甲酚橙，和0或～5μM LanM，向其中添加相同缓冲液中的625-1250μM LnCl₃溶液的0.5或1μL等分试样。在每次实验之前，将比色皿用6N HCl洗涤，以使实验中金属污染的可能性最小化。对于使用蛋白质的实验，将缓冲液和蛋白质预混，并在添加XO之前获取光谱，以计算比色皿中的蛋白质浓度。每次添加LnCl₃储备液之后获取240至800nm的光谱，直到～575nm处的Ln^III-XO吸收特征没有进一步变化(λ_max取决于实验中的Ln)。将针对溶液的体积变化校正的该波长下的吸收相对于金属离子浓度绘图。将使得A＝A_初始+0.1(A_最终–A_初始)的金属离子浓度(XO的10％饱和点)作为LanM上紧密结合位点饱和的点的估计。

圆二色光谱。使用在25℃恒温(thermostatted)的Jasco J-1500CD光谱仪和1mm光程石英CD比色皿(Jasco J/0556)收集LanM的圆二色性(CD)光谱。使用以下仪器设置在260至200nm扫描样品：1nm带宽，0.5nm数据间距，50nm/min扫描速率，4s平均时间。对于每种条件，采集三次扫描并且取平均值。对于用所有Ln^III离子和Ca^II对LanM进行化学计量滴定，对含有在200μL Chelex处理的缓冲液B中的20μM LanM的添加有1-8当量的每种金属离子(来自缓冲液B中的1mM溶液)的比色皿进行滴定，并获得每个光谱。从样品光谱减去缓冲液空白光谱，并且在绘图之前针对体积变化对光谱进行校正。

缓冲的Ca^II溶液的制备。

a.缓冲储备液的制备。将所有缓冲金属滴定所用的缓冲液制成2×储备液：60mMMOPS、200mM KCl，pH 7.2(缓冲液I)。将固体溶解在400mL Milli-Q水中，并在室温与25gChelex 100树脂一起搅拌过夜。将所得溶液的pH调节至7.2，并将瓶填充至500mL的终体积。

b.Ca^II-EGTA“高钙”缓冲液的制备。使用改良自Tsien和Pozzan的方法的pH滴定监测Ca^II和EGTA的相对量来制备Ca^II-EGTA的浓储备溶液。在50mL的Sarstedt锥形管中，将EGTA(99％,3.8415g,10.1mmol)溶解在15mL含19mmol(1.0661g)KOH的Milli-Q水中。将CaCl₂(1.397g,～9.5mmol)溶解在该溶液中，并将pH调节至7.3。向该溶液中添加CaCl₂(20μL，1M，0.02mmol)，注意到导致pH变化，并添加KOH(40μL，1M，0.04mmol)以使pH恢复至初始值。重复该过程直到每次添加CaCl₂的pH变化为初始值的一半(9次添加或180μL的1MCaCl₂)。将溶液的pH调节至7.2，并使溶液的最终体积为20.0mL，得到0.5M Ca^II-EGTA储备液(50×)。最终的Ca^II-EGTA缓冲液(20mL)包含：10mL 2×缓冲液I和400μL 50×Ca^II-EGTA储备液(10mM Ca^II-EGTA)，用Milli-Q使其达到20.0mL。

c.“低钙”缓冲液(30mM MOPS、100mM KCl、10mM EGTA，pH 7.2)的制备。通过将0.07683g的EGTA(99％，0.2mmol)与～2当量的KOH溶解在8mL Milli-Q水中来制备此缓冲液。添加缓冲液I(10mL)，并使溶液达到pH 7.2，并调节至20mL的终体积。

缓冲的Ln^III-EDDS溶液的制备。乙二胺N,N′-二琥珀酸(EDDS)以～35％(～1M)的三钠盐水溶液(Sigma)获得。为了进行金属-蛋白质K_d确定，利用金属结合后游离配体CD信号的变化来制备1:1金属EDDS储备溶液。使用缓冲液H、水和EDDS，在Sarstedt 50mL锥形管中制备30mM MOPS、100mM KCl和(标称)10mM EDDS，pH 7.2的溶液(缓冲液J)。将此溶液(300μL)置于1mm光程CD比色皿中，并且用30mM MOPS、100mM KCl,pH 7.2中的从～1M储备溶液的10×稀释得到的～100mM YCl₃、LaCl₃、NdCl₃、SmCl₃、GdCl₃、TbCl₃或HoCl₃的溶液进行滴定。在与上述相同的条件下，在260–215nm处获得CD光谱。以1.5-4μL的增量添加金属溶液，直到在滴定期间针对体积变化进行调节的220nm处的CD信号不再因添加金属而改变(1:1金属配体配合物)。根据拟合到滴定前半部分中点的线性回归线与信号恒定后的前三个点中的平均椭圆率的交点，计算出达到等当点所需的金属储备溶液的体积。假设商业储备液中的EDDS浓度为1M，我们确定了220nm处的摩尔椭圆率([θ]_220nm，所有的单位均为deg cm² dmol^-1)为：+2490(EDDS)、–9500(Y^III-EDDS)、–4300(La^III-EDDS)、–5630(Nd^III-EDDS)、–7750(Sm^III-EDDS)、–6420(Gd^III-EDDS)、–6980(Tb^III-EDDS)和–9640(Ho^III-EDDS)。为了制备1:1的金属:EDDS缓冲液，将10mL缓冲液H与200μL～1M EDDS溶液混合，并且从得到1:1金属:配体的滴定确定金属1M储备液的量。使用25μL的5M KOH将溶液的pH值调节至7.2，并且用水达到终体积20mL，制成“高Ln”缓冲液。使溶液稳定～1天，并且在将金属混合到预先准备的缓冲液H-EDDS-KOH溶液中后立即使用。

La^III-EGTA溶液的制备。由于LanM对于La^III的K_d太低而无法使用EDDS溶液(除了荧光滴定)精确测量，因此制备了La^III-EGTA溶液。类似于用于制备Ca^II-EGTA的pH滴定方法可能无法使用，这是因为Ln盐具有强的路易斯酸度，其掩盖了EGTA释放质子引起的pH改变。使用XO的UV-vis信号开发了另一种方法，以将金属储备溶液归一化至～1.0MEGTA溶液。在Milli-Q水中用2当量(～20mmol)KOH制备10mL的～1.0M EGTA的储备液。使该溶液达到pH7.2，并用水稀释至10mM。在添加最小体积的6.0N HCl的缓冲液H中制备LaCl₃的～1M储备溶液，并将溶液无菌过滤以除去任何沉淀物。将该溶液稀释至10mM。比色皿含有470μL缓冲液H、25μL～10mM EGTA和5μL～7mM XO。将～10mM LaCl₃溶液以1μL的增量滴定到比色皿中，并监测A_579nm。由于La^III-XO的K_d比La^III-EGTA的高得多，因此以La:EGTA相等作为A_579nm的增量超过滴定结束时总变化的2％的点。最终的La^III-EGTA缓冲液(20mL)包含：10mL 2×缓冲液H、200μL～1M EGTA和适量的～1M La^III储备液，其由得到等摩尔量的金属和EGTA的滴定确定，并且在将pH调节至7.2后，用Milli-Q水使其达到20mL。还根据该方案来制备了用于LanM(4P→4A)的CD滴定的Nd^III-EGTA溶液。

通过CD光谱法的K_d确定。将LanM的浓溶液(～2mM)分别在高Ln缓冲液和缓冲液J中稀释至15μM。将这两种蛋白质溶液在Sarstedt管中以不同的比例混合，得到多种游离金属浓度(如下所述计算)，每个样品为200μL。将相同比率的高Ln缓冲液和缓冲液J(不含蛋白质)混合在一起，得到用于CD实验的空白样品。将样品在室温孵育～1小时，以使其平衡，然后在25℃收集CD光谱。从Ln^III-LanM光谱中减去每种高Ln:缓冲液J比率的空白光谱，并且[θ]_222nm相对于游离金属浓度绘图。为了确定La^III-LanM(4P→4A)的K_d，溶液未在1小时内平衡，因此在收集数据之前将溶液孵育过夜。为了确定Ca^II-LanM的K_d，将未缓冲的Ca^II等份添加到200μL的15μM LanM中。对于涉及EGTA缓冲金属的滴定，单个空白光谱是足够的，因为EGTA在该光谱区域中没有CD信号。所有曲线拟合在Origin 2018(OriginLab Corporation)中进行，至具有一组或两组独立位点的希尔方程。

用于K_d确定的游离金属浓度的计算。使用以下等式确定“低金属”和“高金属”缓冲液的每种混合物中游离金属离子(Ca^II或Ln^III)的浓度[M_游离]：

[M_游离]＝(K_d,M[ML])/[L] (1)

其中[L]是未与M结合的所有EDDS或EGTA物质的浓度，[ML]是金属离子结合的EDDS或EGTA的浓度，并且K_d,M是配体对于M的有效K_d，定义为

K_d,M＝[1+10^(pKa1–^pH)+10^{(pKa2–pKa1–2pH)}]/K_M (2)

在等式2中，pK_a1和pK_a2是L的第一和第二pK_a，其通过向每个公开值增加0.11个单位而针对0.1M的离子强度进行校正。pH是缓冲液pH，并且K_M定义为：

K_M＝[ML]/([M][L]) (3)

由于配体的浓度(10mM)远大于蛋白质浓度(15μM)，所以每个样品的等式1近似于等式4，其中V_高和V_低是混合在一起的高金属溶液和低金属溶液的体积：

[M_游离]＝K_d,M·V_高/V_低 (4)

必须注意，固有K_d可能低于此处报告的表观K_d。此外，由于在这些计算中未考虑稀土离子催化的水解(其会降低游离金属浓度)，因此滴定实验中的真实游离金属浓度和因此真实K_d可能比此处计算的要小，特别是对于路易斯酸性更高的后面Ln^III和Y^III(即LanM的金属亲和力和选择性相对于其它金属离子如Ca^II比指出的甚至更高)。

用于K_d确定的误差分析。对于大多数滴定，使用不同蛋白质样品或缓冲的高金属溶液进行的重复之间的误差通常很小(<1pM)。因此，我们认为在我们的K_d测量中最大的不确定性来源可能是对用金属离子对EDDS进行滴定的终点的判断。例如，用～100mM GdCl₃储备溶液对300μL的～10mM EDDS进行滴定会在添加30.8-33.1μL金属储备溶液时达到终点，这取决于用于确定终点的线性回归线中包含的点的范围(参见“缓冲的Ln^III-EDDS溶液的制备”)。用其它金属离子进行滴定也显示出类似的不确定性。为了确定这些终点范围对K_d确定的影响，我们基于这些终点(30.8和33.1μL)中的每一个制备了“高Gd”溶液，并且如所述进行了LanM-His的滴定。对这些数据的拟合分别产生了16pM和14pM的表观K_d。因此，我们得出结论，金属-EDDS滴定终点确定中的不确定度为约±10％。鉴于终点确定中的类似不确定性，该值对于研究的所有Ln是类似的。尽管La-EGTA和Nd-EGTA滴定并未使用EDDS进行标准化(如上所述)，但我们估计在这种情况下判断滴定终点也存在类似的不确定性。将这些计算出的误差与实验重复之间的误差相组合，并且将这些组合值报告为不确定性。

LanM(4P→4A)的构建、表达和纯化。作为与wt蛋白相同的380bp gBlock基因片段获得了四重突变体LanM P36A/P60A/P85A/P109A，只是P36和P60的CCG密码子突变成了GCG并且P85A和P109A的CCT密码子突变成了GCT。如对于wt LanM那样，使用NdeI和EcoRI位点将gBlock连接到pET-28a中，产生了pET28a-His/TEV-LanM(4P→4A)。使用引物LanM-正向和LanM-His-反向，将该质粒用作模板以产生具有C端His₆标签的LanM(4P→4A)-His。将该蛋白类似于LanM-His进行表达和纯化，并且具有类似产率。

荧光光谱法。使用Varian Cary Eclipse分光光度计在23℃进行荧光实验。激发波长为278nm，并在300-400nm处收集发射数据，其中激发和发射缝隙为5nm，步长为1nm，平均时间为0.5秒。所有样品均为600μL，并在光程为10mm的半微石英荧光计池(Starna Cells)中制备。对于用La^III和Gd^III对LanM-His进行的化学计量滴定，比色皿含有在缓冲液B中的15μM LanM-His，从15mM储备溶液向其中滴定0-8当量的金属离子，所述储备溶液由如上所述针对EDDS标准化的～1M溶液制备。为了进行滴定以确定K_d,app值，如对于CD实验所述在多种游离La^III浓度下制备样品，只是每个样品为600μL的10μM LanM-His，并且使用La^III-EDDS。对每个滴定点的两次扫描取平均值。所有样品在减去缓冲液B的空白光谱之后进行分析。

等温滴定量热法。使用MicroCal Auto-iTC200仪器通过ITC分析Ca^II与wt-LanM的结合。所有实验在25℃在来自透析程序的Chelex处理的缓冲液B中进行。所有溶液在实验前均已脱气。ITC细胞包含40μM wt-LanM。滴定剂注射器含有在相同的缓冲液中的4.0mMCaCl₂。滴定设置如下：600rpm搅拌速度，60s初始延迟，5μcal/s参考功率，以及每次进样之间间隔180s。滴定由第一个0.2μL进样然后48×0.8μL进样组成。通过将相同的金属溶液滴定到没有蛋白质的含细胞的缓冲液中来确定稀释热。在分析之前，从反应热中减去这些数据。使用MicroCal Origin将结果数据拟合到具有两组非相互作用位点的制造商提供的模型中，以对于每组位点i获得位点数(n_i)、缔合常数(K_i)、结合焓(ΔH_i)和熵变(ΔS_i)，从其可以计算自由能变化(ΔG_i)。软件包随附的其它具有顺序或非顺序结合的模型均未产生被认为可以接受的拟合。

用于LaMP1研究的一般考虑。除非另有说明，否则化学试剂获自Sigma-Aldrich，以最高纯度获得。所有稀土元素盐(氯化物或乙酸盐)具有最低纯度99.9％的稀土金属含量。所有均获自Sigma-Aldrich，只是SmCl₃和ScCl₃来自Alfa Aesar，TmCl₃来自Strem，并且YCl₃来自Acros。引物订购自Integrated DNA Technologies(IDT)。分别用于克隆和重组蛋白质表达的大肠杆菌菌株[5α和10β]以及克隆试剂(限制性酶、Q5 DNA聚合酶、OneTaq DNA聚合酶、T4 DNA连接酶)获自New England Biolabs。PCR纯化和微量制备试剂盒(PCR cleanupand miniprep kits)来自Qiagen和Omega Bio-tek，并且凝胶提取使用来自Zymo Research的Zymoclean凝胶DNA回收试剂盒。Ni-NTA树脂购自Thermo Scientific。使用LifeTech16％Tris-甘氨酸凝胶和迷你凝胶仪器进行蛋白质凝胶电泳。自动化蛋白质色谱法使用GE Healthcare Biosciences Akta Pure快速蛋白质液相色谱(FPLC)系统。使用石英比色皿(Starna Cells)在Agilent Cary 60UV-可见分光光度计上获得UV-可见吸收光谱。使用Tecan Infinite M1000 Pro板读取器进行孔板分析。

LaMP1和LaMP1(4P→4A)的构建。使用引物ECFP-LanM-SphI-正向和Citrine-LanM-SacI-反向分别从pET24a-LanM-TEV/His和pET28a-His/TEV-LanM(4P→4A)扩增LanM和LanM(4P→4A)插入物。使用SphI和SacI(10U/μg)消化PCR产物并纯化。类似地消化pBAD-D2(Addgene#37470)，并且在琼脂糖凝胶电泳之后，切出并纯化载体片段。使用T4 DNA连接酶根据制造商的方案将插入物连接到消化的载体中(5:1，插入物:载体)。通过菌落PCR筛选转化子的插入物，并在宾夕法尼亚州立大学基因组学核心设施使用引物pBAD-F、pBAD-R和ECFP-mid通过DNA测序确认正确的插入物，得到pBAD-LaMP1和pBAD-LaMP1(4P→4A)。

LaMP1和LaMP1(4P→4A)的表达和纯化。用pBAD-LaMP1或pBAD-LaMP1(4P→4A)转化化学感受态大肠杆菌10β细胞，并铺板在含有100μg/mL氨苄青霉素(Amp)的LB-琼脂板上，并在37℃生长。使用单个菌落接种100mL LB(在所有生长培养基中100μg/mL Amp)并在37℃以200rpm摇动生长～16h。对于该培养物，将40mL用于接种6L LB培养基烧瓶中的一个1.5L培养物。使培养物在37℃以200rpm摇动生长。在OD_600nm～0.5，将培养物置于4℃30分钟，然后添加L-阿拉伯糖(Oakwood Chemical)至终浓度为500μM。在23℃以200rpm摇动进一步孵育16小时后，通过在4℃以7000×g离心7分钟来使细胞沉淀，得到6-7g细胞糊。

对于传感器纯化，所有操作在4℃进行。将细胞糊重悬于含有0.4mM苯基甲基磺酰氟(PMSF)的5mL/g的50mM磷酸钠、10mM咪唑、5％甘油，pH 7.0(缓冲液A)中。使混悬液在14000psi下通过French压力室两次。通过在4℃以40000×g离心30分钟来沉淀出碎片。倾析出上清液，并施加至在缓冲液A中预平衡的1.5×4.5cm(8.0mL)Ni-NTA琼脂糖柱。将柱子用15CV的缓冲液A冲洗，然后用3CV的50mM磷酸钠、250mM咪唑、5％甘油，pH 7.0(缓冲液B)洗脱。使用Amicon Ultra 30-kDa MWCO离心过滤装置将洗脱的蛋白质浓缩至1.5mL。使用2mL毛细管定量环将蛋白质施加至HiLoad 16/600Superdex 75pg柱(GE Healthcare)，柱子用1.2CV的30mM MOPS、100mM KCl，pH 7.2(缓冲液C)以0.75mL/ml运行，收集1.5mL级分(在峰分级模式下1mAU阈值)。由A_280nm、A_434nm、A_515nm判断包含LaMP1或LaMP1(4P→4A)的级分，合并在45-58mL[LaMP1]或45-52mL[LaMP1(4P→4A)]时洗脱出的级分，并通过离心过滤浓缩至～1.0mL。使用ε_515nm＝77000M^-1cm^-1确定蛋白质浓度。纯化产生～38mg/L培养物。

LaMP1传感器的体外表征。如所述的，在缓冲液C中制备乙二胺N,N′-二琥珀酸(EDDS)缓冲的Ln^III(La^III–Er^III)溶液。为了将La^III缓冲在10^-10至10^-6M游离金属离子浓度范围内，使用三亚甲基二次氮基四乙酸(trimethylenedinitrilotetraacetic acid,TMDTA)。将LaMP1在金属化和仅螯合剂的缓冲液中稀释至500nM，并且将这些溶液以多种比率合并，以使每个滴定点的最终体积为100μL。孵育15分钟后，使用433nm激发、450-550nm发射和130的增益在Greiner Cellstar 96孔半区μClear板中进行荧光测量。在30mM MOPS、100mMKCl、20mM乙酸盐，pH 7.2(缓冲液D)中进行未缓冲的滴定。从ECFP(475nm)和citrine(529nm)的荧光发射峰的强度计算出FRET比率F_529nm/F_475nm。

缓冲的La^III-TMDTA溶液的制备。通过将0.404mmol TMDTA(99％)(包含额外0.011％质量的TMDTA以补偿99％的纯度)和1.01mmol KOH溶解在缓冲液C中以得到10mL总体积来制备20mM TMDTA的20mL储备溶液。在临使用前通过将等摩尔量的来自缓冲液C中的0.9M LaCl₃储备溶液(如所述的通过针对EGTA滴定来校准)的La^III添加到2.5mL的20mMTMDTA制备液中来制备1:1La^III-TMDTA。使用KOH将所得溶液的pH调节至7.2，并且使用缓冲液C调节至5mL的体积。最终溶液为30mM MOPS、100mM KCl、10mM TMDTA、10mM LaCl₃，pH7.2。将该缓冲液以多种比率与由相同TMDTA储备液制备的含10mM TMDTA的缓冲液C组合，以产生一定范围的游离La^III浓度。如所述的，使用25℃、I＝0.11和pH 7.2计算游离La^III浓度。

使用缓冲液C中的5nM LaMP1进行检测限测定。将板读取器设置为250的增益和200Hz的闪烁频率。使用缓冲液空白对缓冲液对信号的贡献做减法。

表10.用于传感器研究的质粒。

表11.用于传感器实验的克隆和测序的引物*

*限制位点具有下划线

表12.传感器的DNA序列

ECFP具有下划线，citrine具有双下划线

>LaMP1(SEQ ID NO:4)

4p4a传感器(SEQ ID NO:5)

传感器

本公开内容的另一方面包括用于检测稀土元素的传感器。传感器概念利用了LanM的金属结合位点对稀土元素的高亲和力和选择性，和/或蛋白质表现出的大的金属依赖性构象变化。在此处描述的具体实施方案中，传感器可以构建为包含LanM作为两种荧光蛋白之间的接头，从而在与稀土元素结合后在LanM中发生构象变化时，调节两种荧光蛋白之间的

共振能量转移(FRET)效率。传感器蛋白在本文中称为LaMP1。选择两种荧光蛋白，使得第一荧光蛋白以一定波长发射，第二荧光蛋白在该波长下被激发并且以更高的波长发射。例如，第一蛋白质可以是青色荧光蛋白，并且第二蛋白质可以是被青色激发的黄色荧光蛋白。因此，当两种蛋白质足够接近且处于合适的方向时，由第一蛋白质发出的青色被第二蛋白质吸收，其然后发出黄色。另一方面，当两种蛋白质彼此间分隔或处于不太合适的方向时，第一蛋白质发出青色，但不能有效地激发第二蛋白质，并且获得较少的黄色信号。

利用我们对LanM的稀土元素结合特性的发现和表征，以及LanM的Y(III)结合形式的NMR分辨率结构，我们将LanM用作比例的基于蛋白质(遗传编码)的稀土荧光传感器的基础，我们将该荧光传感器称为LaMP1(基于镧调蛋白的蛋白质传感器1)。LaMP1是首个针对稀土的同类产品，并且已表明这种和相关的构建体可能是广泛用于工业、环境和生物样品中稀土检测的生物技术。为了构建LaMP1，我们从Tsien及其同事开发的基于钙调蛋白的传感器D2开始，该传感器由作为FRET对的C末端截短的增强型青色荧光蛋白(ECFP)和citrine(一种黄色荧光蛋白)组成。我们用LanM(Ala22-Arg133)(信号肽切割后的全长蛋白)替换了D2的钙调蛋白和M13肽成分，从而产生了LaMP1(图11)。在体外测定中，LaMP1对所有稀土元素表现出强的7倍比例FRET响应，对于Ln^III和Y^III的表观解离常数(K_d,app)在皮摩尔范围内，始终仅比天然LanM的弱～2倍(表13，图16)。通过圆二色光谱法测量的La^III-LaMP1的K_d,app与FRET得出的值一致，这表明LaMP1经历了与LanM本身相似的构象变化。我们用于滴定用于这些测定的螯合剂乙二胺N,N'-二琥珀酸(EDDS)的方法不能用于校准Tm、Yb和Lu的溶液；然而，我们基于K_d,app和离子半径之间的关系预测K_d,app值在40-50pM范围内。传感器也响应Sc^III，但是未确定K_d,app(图16D)。在La^III的情况下，我们在使用EDDS或三亚甲基二次氮基四乙酸(TMDTA)缓冲的或没有螯合剂的10^-13M至10^-2M的整个范围内的游离金属浓度下测试了荧光响应。在未缓冲的方案(>1μM)之前，在高于10^-10M没有观察到显著的额外荧光响应，这可能对应于基于我们先前对LanM的分析得出的金属与EF4的结合(图16B)。

图11示出了LaMP1的设计。该传感器包含ECFP(1-228)、LanM(22-133)和citrine。使用PyMOL从PDB代码1CV7(ECFP)导出荧光蛋白图像。表13显示了Ln^III-LaMP1和Ca^II-LaMP1的K_d,app滴定(0.5μM传感器，pH 7.2)的滴定数据。使用EDDS缓冲Ln(La-Er)和Y的游离金属浓度。将数据拟合到一组位点的希尔方程。

表13：来自用缓冲的Ln^III和Ca^II(25℃，pH 7.2)对LaMP1进行拟合荧光滴定的表观Kd、希尔系数(n)和FRET比率的变化倍数。通过组合来自三次滴定的标准偏差来确定不确定性，并且将不确定性在金属-EDDS溶液中校准，如参考文献1中所述。在周期表中Er^III的右侧，确定Ln^III-EDDS CD滴定的终点中的不确定性太大而不能可靠地确定Kd。注意，这些数据不包括在微摩尔范围的金属离子浓度内发生的FRET比率的额外增加。

图16显示了500nM LaMP1对0-4(黑-红)当量La^III(λ_ex＝433nm)的响应。(B)LaMP1的FRET比率(F_529nm/F_475nm)作为EDDS或TMDTA缓冲的或者未缓冲的游离La^III浓度的函数。(C)Ln^III-LaMP1的表观K_d相对于La^III–Er^III和Y^III的离子半径的图。(D)LaMP1的金属选择性。500nM LaMP1对以下的响应倍数：5μM La^III–Lu^III；10μM Sc^III、Y^III和Fe^III；100μM Cu^II；或1mMAl^III、Mn^II和Ca^II。

LaMP1还表现出对Ca^II的荧光响应，但是K_d,app为1.2mM，远高于可能的生理水平，而FRET响应仅为3倍(表13)。然而，我们注意到，此测定受到Ca^II浓度>10mM时荧光淬灭的限制，这可能掩盖了进一步的FRET增加。我们还针对浓度与水性环境样品(例如矿山浸出液)潜在相关的常见金属离子Fe^III、Al^III、Mn^II和Cu^II测试了LaMP1，并且发现几乎没有或没有响应(图16D)。在更高的浓度下，Fe^III淬灭了荧光，并且传感器显示出对Al^III和Mn^II适度响应，但是全部被5μM La^III超过(图12)。生物学相关离子Mg^II、Na⁺和K⁺的干扰也最小(图12)。因此，与LanM本身一样，相对于Ca^II和其它常见金属离子，LaMP1对Ln^III和Y^III表现出高选择性。

图12显示了相对于选择的常见一价、二价和三价金属离子，LaMP1对Ln^III具有选择性。(A)在不存在(白色条)或存在(阴影条)5μM La^III的情况下，将LaMP1(0.5μM)用环境样品中具有潜在干扰的指定金属离子孵育。(B)在不存在(白色条)或存在(阴影条)4当量La^III的情况下，将LaMP1(0.5μM)用缓冲液C中多种浓度的MgCl₂孵育(Apo＝无Mg^II)。尽管LaMP1在不存在La^III的情况下表现出对Mg^II的轻微响应，并且在La^III的存在下具有轻微干扰，但是细菌Mg^II水平通常严格控制在1-2mM左右，因此体内干扰可能很小。C)Na⁺和K⁺对LaMP1响应的影响(30mM MOPS，pH 7.0，缓冲液补充有指定浓度的NaCl或KCl)。已知氯化物在100mM Cl^–,pH7.0将YFP荧光淬灭约25％。因此，观察到的干扰很可能是由于Cl^–结合，而不是Na⁺或K⁺结合。

在板读取器荧光测定(5nM LaMP1)中，LaMP1在1分钟内的检测极限是10nM La^III(图13)。LaMP1的性能优于以前报道的选择性检测Ln的方法。He及其同事设计了一种细菌双组分系统，以通过引入镧系元素结合标签肽序列来检测Ln。生长6小时后，该系统对1μMTb^III表现出3倍的荧光响应和对200nM Tb^III表现出较小但显著的响应，但对50μM Ca^II也有2倍响应。Skovran,Martinez-Gomez及其同事最近报道了一种具有在xox1启动子的控制下的荧光蛋白基因的扭脱甲基杆菌菌株，其对2.5nM La^III具有响应，但是需要数小时的孵育时间；此外，该启动子仅响应于La-Sm。基于偶氮砷-III染料的比色法的检测限为～500nM，但是仅可靠地响应于La–Eu。因此，LaMP1是用于检测所有REE的独特、快速、选择性和高度敏感的工具。

图13显示了在荧光板读取器测量中LaMP1检测限的确定(**p<0.01)。

使用pH 6.0的EGTA缓冲的Pr^III溶液和LaMP1研究了LanM的金属结合亲和力的pH依赖性。该滴定的表观K_d值为26pM，FRET变化(R/R₀)为2.7。pH对表观K_d的较小影响(与图16C相比)表明LanM在较低pH时保留了蛋白质稳定性和对REE的高亲和力，直到负责金属配位的羧酸配体质子化，其可能在pH～3时发生。在酸性pH，此功能对于潜在的REE感测、提取和分离应用非常重要。pH 6.0时的FRET变化小于pH 7.2时的FRET变化可能与citrine生色团的部分质子化(pK_a～5.7)有关，这将减少citrine荧光，而ECFP荧光在此pH不受影响，或有稍微不同的构象变化。

我们还产生了LaMP1的4P→4A类似物。反映LanM(4P→4A)对比于LanM的特性，LaMP1(4P→4A)的荧光响应与LaMP1的荧光相应相似，并且对于La^III表现出稍低的K_d,app(图14)，但其对Ca^II的响应截然不同，存在两个阶段，K_d1,app＝1.6±0.1μM，并且K_d2,app＝63±9μM(图14)。与LaMP1相比，LaMP1(4P→4A)还表现出对Mn^II和Cu^II的稍微更大响应(图15)。两种传感器的最小FRET比率和整体FRET响应几乎相同。由于其对较低浓度的La^III以及可能所有其它稀土元素的响应性，LaMP1(4P→4A)也可能是检测水性样品中稀土元素的有用工具。

图14显示了使用La^III和Ca^II对LaMP1(4P→4A)进行K_d,app确定。图15显示了在不存在添加的金属离子(基线)和存在5μM La^III-Lu^III；10μM Y^III和Fe^III；1mM,Mn^II和Ca^II；或100μM Cu^II的情况下，LaMP1(4P→4A)的FRET变化倍数。

定点诱变以证明LanM骨架用于金属选择性再工程化的多功能性

命名方案实例：4P2A＝在所有四个EF手中，第2位的P残基突变为A(在本文的一些图中，该构建体也称为“4P→4A”，如其在原始LanM表征手稿那样；3D9H＝在前三个EF手中第9位的D残基突变为H。产生了LaMP1传感器的4P2A版本，以测试该构建体对一系列镧系元素的响应性(如果列出两个值，则响应是两阶段的。)

表14.在pH 7.2时LaMP1(4P→4A)(也称为LaMP1-4P2A)对选择的Ln^III的表观K_d

Ln(III)	K<sub>d,app</sub>
		La(III)	8pM
Nd(III)	2pM
		Gd(III)	～100fM,～1pM
Ho(III)	～20fM,～1pM

传感器对Nd右侧的响应分为2个阶段。我们对蛋白质和传感器进行的生物化学表征支持以下假设：这种2阶段响应可能是对于较小的后面镧系元素来说EF4与EF1配对不佳的结果，导致由于金属结合和EF2/3中的构象变化引起的第一响应(FRET比率为1.2至～3.5，整体～3倍变化)，然后是由于金属与EF1的结合引起的高至～9的FRET比率的第二响应。这表明去除EF1/4对将导致单阶段响应(见下文)。

该构建体的结果还表明，LaMP1-4P2A的表观K_d从对于La的8pM降低至对于Ho的20fM。整个镧系(La-Lu)的表观K_d的≥3个数量级变化表明，此构建体及其衍生物可能比野生型LanM本身更适合用于基于蛋白质的分离应用。

我们还使用LaMP1作为起点进行了更广泛的诱变研究，以利用在与本公开内容中其它地方所述的相同条件下进行的金属滴定来证明改变该蛋白质的金属选择性的可行性：

图15

斜体构建体可能是细胞内成像应用中最有用的。用其它潜在的干扰金属(Co(II)用作Fe(II)的替代物)测定了选择的构建体。NS＝在2mM时未检测到响应。ND＝未测定。

表16

D9H/3E12D和3D9H/3E12D/3T7S构建体的性质表明，它们可用作细胞内Mn(II)的选择性传感器(主要干扰物Zn通常以远低于μM的游离浓度存在于细胞中，因此它们不太可能对细胞中的Zn作出响应)。3D9H/3E12D对La(III)的响应为约～30μM，远高于与生理相关的游离浓度，并且远高于野生型传感器对La^III的表观K_d。因此，与本申请最相关的是，在证明合理地、实质性地改变LanM的金属结合选择性的能力方面，这些数据描述了一种重新改造LaMP1以及因此还有LanM对于潜在的任何期望的无机离子的金属选择性的方法。

最小的LanM构建体：如上所述，突变导致两阶段响应的倾向促使了用于感测、捕获和分离应用的表现出单一响应的构建体的开发。这种最小的构建物也可能潜在地能够以比野生型蛋白质更高的mg金属/g蛋白质比率结合稀土。基于与Y(III)结合的LanM的NMR结构，我们确定了去除EF1和EF4可能会产生保留与wt表观K_d相似但具有单阶段响应且更适合蛋白质工程的传感器。对于我们的初始实验，我们假设LanM/LaMP1的EF4之后的残基可能对疏水性包装很重要，并且因此即使EF4被去除，也应保留它们。我们注意到可以测试缺少这些C末端残基的其它构建体，或者也可以设计缺少EF2和EF3的类似构建体，以产生具有在EF1中的单个金属结合位点的构建体，或者可以制备去除了蛋白质的其它片段的衍生物。

为了测试N-末端截短的影响，将LanM最初在第30个和第48个残基处截短。将这些和其它LanM截短放置在LaMP1传感器骨架中，以快速确定对金属结合的影响。Δ30突变体在紧接EF1之前截短蛋白质，而Δ48突变体在该金属结合位点之后截短。预期两种突变体均具有功能性的EF2/3对。以下序列表示插入在ECFP/citrine FRET之间的LanM部分。

>野生型LanM(SEQ ID NO:41)

>LanM-Δ30(SEQ ID NO:42)

>LanM-Δ48(SEQ ID NO:43)

用EDDS缓冲的Pr(III)溶液对这些构建体的表征表明，Δ30变体表现出与wt几乎相同的表观K_d(～10pM)，但FRET变化为3。对于Δ48变体，表观K_d为～500pM，并且具有相同的FRET变化。Ca(II)响应小于2倍，表观K_d为～8mM。与wt LaMP1中相比较低的FRET变化表明荧光蛋白的相对取向不同和/或EF1/4对的不稳定。我们目前正在研究在这些位置之间进行的截短，以在保持低K_d,app的同时使蛋白质尺寸最小化。

使用以下构建体测试了EF4去除的影响。使用EDDS缓冲的Pr(III)溶液，所有这些构建体在具有3倍FRET变化的初始响应中均表现出相同的表观K_d，～50pM。

>LanM-ΔN108-E119_GSG(SEQ ID NO:44)

>LanM-ΔN108-E119_GGSGG(SEQ ID NO:44)

>LanM-ΔN108-E125_GSG(SEQ ID NO:45)

>LanM-ΔN108-E125_GGSGG(SEQ ID NO:46)

其中将EF1和EF4的截短组合的构建体正在进行中。然而，已经给出了以下实例，并已进行了初步测试：

>LanM-Δ48_ΔN108-E119_GGSGG(SEQ ID NO:47)

该构建体的行为与LanM-Δ48构建体基本相同。这些结果表明，我们对该蛋白功能的机械理解使我们能够设计出至少在EF2/3中保留了金属结合功能的有意义的突变和缺失。这些和相关的构建体可用于REE检测、捕获和分离应用。这些结果还表明，可以使用类似的实验来产生具有一系列金属结合功能(不同的金属化学计量、金属亲和力和金属选择性)的其它衍生物。

其它感测方式：用于快速分析任意环境样品中的稀土的基于荧光的检测平台的一些局限性是pH(至少对于ECFP/citrine FRET对)和强吸收/散射样品(例如，酸性矿山排水，含有颗粒混悬液的样品)。此外，虽然可以使用便携式荧光光谱仪，但使用更广泛可获得的仪器(如数码相机或电话)进行检测将是理想的。基于生物发光的感测为这些挑战提供了解决方案。我们正在寻求通过使用生物发光共振能量转移(BRET)来将LanM对稀土的选择性构象响应转变为生物发光输出的方法，该概念类似于FRET，但使用的是发光而非荧光供体。一种可能的方法是使用生物发光供体(例如NanoLuc)和作为BRET受体的磺基Cy3(与半胱氨酸残基缀合)或荧光蛋白(例如tdTomato)(参见下面的构建体)。也可以设计利用其它BRET对的方法。

>生物发光LaMP2：NanoLuc+LanM(带下划线)+半胱氨酸用于与磺基Cy3-马来酰亚胺缀合(SEQ ID NO:48)

>生物发光LaMP3：NanoLuc+LanM(带下划线)+tdTomato(大写)(SEQ ID NO:49)

这些结果表明，可以通过合理的方法对LanM及其衍生物进行工程改造，以改变金属选择性。出于工程改造目的，也可以使用LaMP1或衍生物作为读出来使用诸如定向进化的更高通量的方法。这些研究集中于金属结合位点的突变，但是金属结合位点之外的残基也可以被靶向。从理论上讲，该蛋白质可用于开发针对感兴趣的任何金属离子(或甚至可能任何无机阴离子)的传感器/结合蛋白。特别感兴趣的是用于选择性结合锕系元素(例如，铀酰(UO₂ ²⁺)或四价金属，例如Th(IV))的蛋白的开发。我们的数据表明，EF手中的第二、第九和第十二位似乎在改变金属结合选择性而不破坏构象反应方面特别有用，尽管EF手内和EF手之间的其它位置也可以变化以改变亲和力和协同性。例如，为了选择性地结合和感测铀酰，一种方法涉及利用赤道平面中的EF手羧酸并将轴向羧酸(第1和9位的残基)修饰为氢键合供体(例如Ser、Thr、Asn或主链酰胺)以与铀酰的独特氧代基团相互作用。

基于我们的分析，我们发现高度选择性的金属结合具有某些特征。特别地，具有一定数量的EF手基序和具有某间隔区的某些残基的分离的金属结合蛋白导致如本文公开的具有高三价和/或四价阳离子选择性的蛋白。在一个实施方案中，分离的金属结合蛋白可包含2、3或4个EF手基序，所述EF手基序中的至少一个具有至少2个羧酸残基，其中至少两个相邻的EF手基序被10-15个氨基酸残基例如11、12、13、14和15个氨基酸残基分隔，例如被12至13个氨基酸残基(包括端值)分隔。例如，该蛋白质可包含至少1个，优选至少两个2个以下形式的EF手基序：

(D/N)-X1-(D/N)-X2-(D/N)-X3-X4-X5-X6-X7-X8-(E/D)-[SEQ ID NO:3]其中每个X1至X8独立地是任何残基(即，不一定每个位置上是相同的残基)。至少两个相邻的EF手被10-15个残基例如12-13个氨基酸残基分隔。在一个实施方案中，X1是P(脯氨酸)。在某些方面，X6和/或X8可以是D或E。在某些方面，甘氨酸(G)是优选的，但不需要在X3。有利地，本公开内容的金属结合蛋白可以被纯化为至少约70％，例如至少约75％、80％、85％、90％、95％的纯形式。

例如，在一个实施方案中，该蛋白质可包含2、3或4个EF手基序，所述EF手基序包含上述形式(SEQ ID NO：3)，并且每对相邻的EF手基序被10-15例如12-13个氨基酸分隔。可以考虑其它排列。下表17给出了EF手基序的氨基酸序列的多种实例：

表17：EF手的多种序列

例如，在一个实施方案中，该蛋白质可以包含2个EF手基序，所述EF手基序包含SEQID NO:3并且被12-13个氨基酸分隔，或者蛋白质可以包含3个EF手基序，所述EF手基序包含SEQ ID NO:3并且每个相邻基序被12-13个氨基酸分隔，或者该蛋白质可以包含4个EF手基序，所述EF手基序包含SEQ ID NO:3并且每个相邻基序被12-13个氨基酸分隔。考虑了其它排列。

本公开内容的另一方面包括一种从诸如溶液、混悬液或胶体的介质中分离稀土或锕系元素、其化合物或盐(例如镧系元素)的方法。所述方法包括使包含三价阳离子的介质与金属结合蛋白接触以结合三价阳离子；分离结合有三价阳离子的金属结合蛋白。所述金属结合蛋白可以有利地对三价阳离子具有比非三价阳离子更高的选择性亲和力，其中所述三价阳离子选自由以下组成的组：来自稀土元素、其化合物、其盐、锕系元素、其化合物、其盐和其组合的三价阳离子。在本公开内容的一些方面，所述方法包括使包含一种或多种稀土元素、其化合物或盐(例如镧系元素或其盐)和/或一种或多种锕系元素、其化合物或盐的介质与金属结合蛋白接触，所述金属结合蛋白对稀土或锕系元素具有比对非稀土或非锕系元素高的选择性亲和力。所述方法还可以包括分离结合有稀土或锕系元素、其化合物或盐(例如镧系元素(3+)离子)的金属结合蛋白；以及任选地使一种或多种稀土或锕系元素与金属结合蛋白分离。

在一个实施方案中，金属结合蛋白可以固定在基底上，例如通过对该蛋白质进行生物素化并且用亲和素对基底进行表面处理。在一些实施方案中，使用点击化学例如叠氮化物-炔烃环加成来固定该蛋白质，例如通过用叠氮化物或炔烃标记该蛋白质并且使其分别与固定表面(例如树脂珠粒)上炔烃或叠氮化物反应。在一些实施方案中，使包含来自稀土或锕系元素、其化合物或盐的三价阳离子的介质与固定有金属结合蛋白的基底接触。然后，允许来自稀土或锕系元素、其化合物或盐的三价阳离子与金属结合蛋白结合(例如，但允许经过一定的时间，或通过施加电场以促进阳离子向基底移动)。然后除去介质，并处理结合有三价阳离子的基底以分离三价阳离子。在多种实施方案中，表面处理可包括用低pH溶液处理或用螯合剂例如EGTA、EDTA、柠檬酸盐、EDDS等处理。

在本公开内容中仅示出和描述了本发明的优选实施方案及其多功能性的实例。应当理解，本发明能够在各种其它组合和环境中使用，并且能够在如本文所表达的发明构思的范围内进行改变或修改。因此，例如，本领域技术人员将认识或仅使用常规实验就能够确定本文所述的具体物质、程序和布置的许多等同物。这样的等同物被认为是在本发明的范围内，并且被所附权利要求所覆盖。

Claims

1.一种分离的金属结合蛋白，对三价阳离子或四价阳离子具有比对非三价阳离子或非四价阳离子至少1000倍高的选择性亲和力，其中所述三价阳离子和四价阳离子选自由以下组成的组：来自稀土元素、其化合物、其盐，锕系元素、其化合物、其盐，及其组合的三价阳离子和四价阳离子。

2.根据权利要求1所述的分离的金属结合蛋白，其中所述蛋白质具有包含脯氨酸残基的金属配位基序。

3.根据权利要求2所述的分离的金属结合蛋白，其中所述脯氨酸残基被丙氨酸残基或其它氨基酸残基替换。

4.根据权利要求3所述的分离的金属结合蛋白，其中与具有包含脯氨酸的金属配位基序的金属结合蛋白相比，所述蛋白质对三价阳离子的构象响应提高了至少100倍。

5.根据权利要求1至4中任一项所述的分离的金属结合蛋白，其中所述稀土元素是镧系元素，并且所述非三价阳离子或非四价阳离子是二价阳离子。

6.根据权利要求1所述的分离的金属结合蛋白，其中所述蛋白质包含2、3或4个EF手基序，所述EF手基序中的至少一个包含至少3个羧酸残基，其中至少2个相邻的EF手基序被10-15个氨基酸残基分隔。

7.一种分离的金属结合蛋白，包含至少2个包含SEQ ID NO:3的序列的EF手基序，其中相邻的EF手基序被10-15个氨基酸分隔。

8.根据权利要求7所述的分离的金属结合蛋白，其中所述EF手基序中的至少一个具有至少3个羧酸残基。

9.根据权利要求7所述的分离的金属结合蛋白，其中所述EF手基序中的至少一个的第9和11位处的氨基酸中的一个或两个是D或E。

10.一种分离的金属结合蛋白，由包含与SEQ ID NO:2的序列具有至少80％同一性的序列的核苷酸编码。

11.一种用于感测三价或四价阳离子的存在的传感器，所述传感器包含：金属结合蛋白，所述金属结合蛋白对三价或四价阳离子具有比对非三价阳离子或非四价阳离子更高的选择性亲和力，其中所述三价和四价阳离子选自由以下组成的组：来自稀土元素、其化合物、其盐，锕系元素、其化合物、其盐，及其组合的三价和四价阳离子。

12.根据权利要求11所述的传感器，还包含：与所述金属结合蛋白结合的第一荧光蛋白和第二荧光蛋白，所述第二荧光蛋白的激发波长与所述第一荧光蛋白的发射波长基本相同；或者与所述金属结合蛋白结合的生物发光供体和第二荧光蛋白或小分子，所述第二荧光蛋白或小分子的激发波长与所述生物发光供体的发射波长基本相同。

13.根据权利要求12所述的传感器，其中当结合三价或四价阳离子时，所述第一荧光蛋白或所述生物发光供体与所述第二荧光蛋白或小分子之间的能量转移效率增加。

14.根据权利要求13所述的传感器，其中所述第一荧光蛋白具有在青色范围内的发射波长，并且所述第二荧光蛋白具有在黄色范围内的发射波长。

15.根据权利要求11所述的传感器，其中所述金属结合蛋白是具有2、3或4个包含SEQID NO:3的序列的EF手基序的蛋白质。

16.根据权利要求15所述的传感器，其中至少2个相邻的EF手基序被10-15个氨基酸残基分隔。

17.一种用于分离稀土或锕系元素的方法，所述方法包括：

使包含三价或四价阳离子的介质与包含金属结合蛋白的样品接触，以结合所述三价或四价阳离子；和

从所述介质中分离结合有所述三价或四价阳离子的所述金属结合蛋白，

其中所述金属结合蛋白对所述三价或四价阳离子具有比对非三价或非四价阳离子更高的选择性亲和力，其中所述三价阳离子或所述四价阳离子选自由以下组成的组：来自稀土元素、其化合物、其盐，锕系元素、其化合物、其盐，及其组合的三价或四价阳离子。

18.根据权利要求17所述的方法，还包括从结合有所述三价阳离子或所述四价阳离子的所述金属结合蛋白中分离所述三价阳离子或所述四价阳离子。

19.根据权利要求18所述的方法，其中分离所述三价阳离子包括用稀酸或包含金属螯合剂的溶液处理分离的具有所述三价阳离子或四价阳离子的金属结合蛋白。

20.根据权利要求19所述的方法，其中所述金属螯合剂包括EDTA、EGTA、EDDS、柠檬酸盐或其组合。