CN112930190A - 金属结合蛋白及其用途 - Google Patents
金属结合蛋白及其用途 Download PDFInfo
- Publication number
- CN112930190A CN112930190A CN201980070280.4A CN201980070280A CN112930190A CN 112930190 A CN112930190 A CN 112930190A CN 201980070280 A CN201980070280 A CN 201980070280A CN 112930190 A CN112930190 A CN 112930190A
- Authority
- CN
- China
- Prior art keywords
- lanm
- iii
- protein
- trivalent
- metal binding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 229910052751 metal Inorganic materials 0.000 title claims abstract description 178
- 239000002184 metal Substances 0.000 title claims abstract description 178
- 102000014914 Carrier Proteins Human genes 0.000 title claims abstract description 84
- 108091008324 binding proteins Proteins 0.000 title claims abstract description 84
- 150000001768 cations Chemical class 0.000 claims abstract description 89
- 229910052761 rare earth metal Inorganic materials 0.000 claims abstract description 51
- 238000000034 method Methods 0.000 claims abstract description 37
- 150000001875 compounds Chemical class 0.000 claims abstract description 30
- 229910052768 actinide Inorganic materials 0.000 claims abstract description 28
- 150000001255 actinides Chemical class 0.000 claims abstract description 25
- 229910052747 lanthanoid Inorganic materials 0.000 claims abstract description 21
- 150000002602 lanthanoids Chemical class 0.000 claims abstract description 20
- 108090000623 proteins and genes Proteins 0.000 claims description 139
- 102000004169 proteins and genes Human genes 0.000 claims description 132
- 235000018102 proteins Nutrition 0.000 claims description 128
- 230000004044 response Effects 0.000 claims description 46
- 150000001413 amino acids Chemical class 0.000 claims description 42
- 150000003839 salts Chemical class 0.000 claims description 33
- DEFVIWRASFVYLL-UHFFFAOYSA-N ethylene glycol bis(2-aminoethyl)tetraacetic acid Chemical compound OC(=O)CN(CC(O)=O)CCOCCOCCN(CC(O)=O)CC(O)=O DEFVIWRASFVYLL-UHFFFAOYSA-N 0.000 claims description 26
- 235000001014 amino acid Nutrition 0.000 claims description 22
- 108091006047 fluorescent proteins Proteins 0.000 claims description 22
- 102000034287 fluorescent proteins Human genes 0.000 claims description 21
- 150000002910 rare earth metals Chemical class 0.000 claims description 17
- 125000000539 amino acid group Chemical group 0.000 claims description 16
- 239000002773 nucleotide Substances 0.000 claims description 9
- 125000003729 nucleotide group Chemical group 0.000 claims description 9
- 150000001732 carboxylic acid derivatives Chemical group 0.000 claims description 8
- 239000002738 chelating agent Substances 0.000 claims description 8
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 claims description 6
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims description 6
- 230000005284 excitation Effects 0.000 claims description 6
- 150000003384 small molecules Chemical class 0.000 claims description 4
- 239000002253 acid Substances 0.000 claims description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 claims description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 2
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 claims 2
- VKZRWSNIWNFCIQ-WDSKDSINSA-N (2s)-2-[2-[[(1s)-1,2-dicarboxyethyl]amino]ethylamino]butanedioic acid Chemical compound OC(=O)C[C@@H](C(O)=O)NCCN[C@H](C(O)=O)CC(O)=O VKZRWSNIWNFCIQ-WDSKDSINSA-N 0.000 claims 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 claims 1
- 150000002500 ions Chemical class 0.000 abstract description 11
- QCWXUUIWCKQGHC-UHFFFAOYSA-N Zirconium Chemical compound [Zr] QCWXUUIWCKQGHC-UHFFFAOYSA-N 0.000 abstract description 2
- 229910052735 hafnium Inorganic materials 0.000 abstract description 2
- VBJZVLUMGGDVMO-UHFFFAOYSA-N hafnium atom Chemical compound [Hf] VBJZVLUMGGDVMO-UHFFFAOYSA-N 0.000 abstract description 2
- 229910052726 zirconium Inorganic materials 0.000 abstract description 2
- 239000000872 buffer Substances 0.000 description 84
- 239000000243 solution Substances 0.000 description 66
- 238000004448 titration Methods 0.000 description 63
- 101150048357 Lamp1 gene Proteins 0.000 description 60
- 239000011575 calcium Substances 0.000 description 46
- 229910004383 CaII Inorganic materials 0.000 description 44
- 210000004027 cell Anatomy 0.000 description 34
- 230000008859 change Effects 0.000 description 33
- VKZRWSNIWNFCIQ-UHFFFAOYSA-N 2-[2-(1,2-dicarboxyethylamino)ethylamino]butanedioic acid Chemical compound OC(=O)CC(C(O)=O)NCCNC(C(O)=O)CC(O)=O VKZRWSNIWNFCIQ-UHFFFAOYSA-N 0.000 description 32
- 229950007919 egtazic acid Drugs 0.000 description 31
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 26
- 238000000746 purification Methods 0.000 description 26
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 25
- 239000000499 gel Substances 0.000 description 24
- 229910021645 metal ion Inorganic materials 0.000 description 24
- 238000002474 experimental method Methods 0.000 description 22
- 238000002983 circular dichroism Methods 0.000 description 21
- 238000004458 analytical method Methods 0.000 description 20
- 108090000765 processed proteins & peptides Proteins 0.000 description 19
- 102000000584 Calmodulin Human genes 0.000 description 17
- 238000001228 spectrum Methods 0.000 description 17
- 239000011550 stock solution Substances 0.000 description 17
- 108010041952 Calmodulin Proteins 0.000 description 16
- 241000589308 Methylobacterium extorquens Species 0.000 description 16
- 238000007792 addition Methods 0.000 description 16
- 230000000694 effects Effects 0.000 description 16
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 16
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 15
- 102000004196 processed proteins & peptides Human genes 0.000 description 15
- ORZHVTYKPFFVMG-UHFFFAOYSA-N xylenol orange Chemical compound OC(=O)CN(CC(O)=O)CC1=C(O)C(C)=CC(C2(C3=CC=CC=C3S(=O)(=O)O2)C=2C=C(CN(CC(O)=O)CC(O)=O)C(O)=C(C)C=2)=C1 ORZHVTYKPFFVMG-UHFFFAOYSA-N 0.000 description 15
- 239000007993 MOPS buffer Substances 0.000 description 14
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 14
- 239000000523 sample Substances 0.000 description 14
- -1 calcium cations Chemical class 0.000 description 13
- 238000012512 characterization method Methods 0.000 description 13
- 238000002360 preparation method Methods 0.000 description 13
- 238000006467 substitution reaction Methods 0.000 description 13
- 241000588724 Escherichia coli Species 0.000 description 12
- 238000004587 chromatography analysis Methods 0.000 description 12
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 12
- 239000002609 medium Substances 0.000 description 12
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 11
- 238000005119 centrifugation Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 11
- 241000723792 Tobacco etch virus Species 0.000 description 10
- 210000004899 c-terminal region Anatomy 0.000 description 10
- 238000011534 incubation Methods 0.000 description 10
- 108020004705 Codon Proteins 0.000 description 9
- 238000003556 assay Methods 0.000 description 9
- 238000001142 circular dichroism spectrum Methods 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 108010045262 enhanced cyan fluorescent protein Proteins 0.000 description 9
- 238000001914 filtration Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- AFQIYTIJXGTIEY-UHFFFAOYSA-N hydrogen carbonate;triethylazanium Chemical compound OC(O)=O.CCN(CC)CC AFQIYTIJXGTIEY-UHFFFAOYSA-N 0.000 description 9
- 238000002955 isolation Methods 0.000 description 9
- 239000000725 suspension Substances 0.000 description 9
- 241000894006 Bacteria Species 0.000 description 8
- 108091005960 Citrine Proteins 0.000 description 8
- 108010076504 Protein Sorting Signals Proteins 0.000 description 8
- 239000011035 citrine Substances 0.000 description 8
- 238000010367 cloning Methods 0.000 description 8
- 230000001335 demethylating effect Effects 0.000 description 8
- 230000001419 dependent effect Effects 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 8
- 239000003446 ligand Substances 0.000 description 8
- 150000002739 metals Chemical class 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 238000001542 size-exclusion chromatography Methods 0.000 description 8
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- 241000282414 Homo sapiens Species 0.000 description 7
- 239000007983 Tris buffer Substances 0.000 description 7
- 108010048916 alcohol dehydrogenase (acceptor) Proteins 0.000 description 7
- 229940088598 enzyme Drugs 0.000 description 7
- 230000012010 growth Effects 0.000 description 7
- 229920001184 polypeptide Polymers 0.000 description 7
- 239000011780 sodium chloride Substances 0.000 description 7
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 7
- 239000006228 supernatant Substances 0.000 description 7
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 7
- BHPQYMZQTOCNFJ-UHFFFAOYSA-N Calcium cation Chemical compound [Ca+2] BHPQYMZQTOCNFJ-UHFFFAOYSA-N 0.000 description 6
- 108020004414 DNA Proteins 0.000 description 6
- 101150004094 PRO2 gene Proteins 0.000 description 6
- 230000008033 biological extinction Effects 0.000 description 6
- 239000001110 calcium chloride Substances 0.000 description 6
- 229910001628 calcium chloride Inorganic materials 0.000 description 6
- 238000000978 circular dichroism spectroscopy Methods 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 6
- 230000029087 digestion Effects 0.000 description 6
- 229910052739 hydrogen Inorganic materials 0.000 description 6
- 239000001257 hydrogen Substances 0.000 description 6
- 238000004949 mass spectrometry Methods 0.000 description 6
- 238000005259 measurement Methods 0.000 description 6
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 229910002476 CuII Inorganic materials 0.000 description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 5
- 239000012901 Milli-Q water Substances 0.000 description 5
- 229910003177 MnII Inorganic materials 0.000 description 5
- 238000002835 absorbance Methods 0.000 description 5
- 238000010521 absorption reaction Methods 0.000 description 5
- 238000010828 elution Methods 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 238000011084 recovery Methods 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 238000003756 stirring Methods 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 101150097079 AM1 gene Proteins 0.000 description 4
- 229920000936 Agarose Polymers 0.000 description 4
- 102000012410 DNA Ligases Human genes 0.000 description 4
- 108010061982 DNA Ligases Proteins 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 229910002553 FeIII Inorganic materials 0.000 description 4
- 229910002249 LaCl3 Inorganic materials 0.000 description 4
- FBWADIKARMIWNM-UHFFFAOYSA-N N-3,5-dichloro-4-hydroxyphenyl-1,4-benzoquinone imine Chemical compound C1=C(Cl)C(O)=C(Cl)C=C1N=C1C=CC(=O)C=C1 FBWADIKARMIWNM-UHFFFAOYSA-N 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- 239000012505 Superdex™ Substances 0.000 description 4
- 108010076818 TEV protease Proteins 0.000 description 4
- 238000000225 bioluminescence resonance energy transfer Methods 0.000 description 4
- 229910052791 calcium Inorganic materials 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000000502 dialysis Methods 0.000 description 4
- 238000011067 equilibration Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000004811 liquid chromatography Methods 0.000 description 4
- 238000001254 matrix assisted laser desorption--ionisation time-of-flight mass spectrum Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000012540 peak fractionation analysis Methods 0.000 description 4
- 239000008188 pellet Substances 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 239000001488 sodium phosphate Substances 0.000 description 4
- 229910000162 sodium phosphate Inorganic materials 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 4
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 3
- VDJKJPMLWJWQIH-UHFFFAOYSA-M 5-ethylphenazin-5-ium;ethyl sulfate Chemical compound CCOS([O-])(=O)=O.C1=CC=C2[N+](CC)=C(C=CC=C3)C3=NC2=C1 VDJKJPMLWJWQIH-UHFFFAOYSA-M 0.000 description 3
- 108010083590 Apoproteins Proteins 0.000 description 3
- 102000006410 Apoproteins Human genes 0.000 description 3
- 241000039087 Apostates Species 0.000 description 3
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 3
- 238000001712 DNA sequencing Methods 0.000 description 3
- VTLYFUHAOXGGBS-UHFFFAOYSA-N Fe3+ Chemical compound [Fe+3] VTLYFUHAOXGGBS-UHFFFAOYSA-N 0.000 description 3
- 239000006142 Luria-Bertani Agar Substances 0.000 description 3
- 241000432067 Methylobacterium extorquens AM1 Species 0.000 description 3
- 229910017908 MgII Inorganic materials 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 3
- 238000000862 absorption spectrum Methods 0.000 description 3
- 230000002378 acidificating effect Effects 0.000 description 3
- REDXJYDRNCIFBQ-UHFFFAOYSA-N aluminium(3+) Chemical compound [Al+3] REDXJYDRNCIFBQ-UHFFFAOYSA-N 0.000 description 3
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 3
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 3
- 235000011130 ammonium sulphate Nutrition 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 241001109796 bacterium Am-1 Species 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 229910001424 calcium ion Inorganic materials 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000000356 contaminant Substances 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 235000019253 formic acid Nutrition 0.000 description 3
- 238000001502 gel electrophoresis Methods 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 3
- 229910021644 lanthanide ion Inorganic materials 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 239000006873 mp medium Substances 0.000 description 3
- 108700043045 nanoluc Proteins 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 210000001322 periplasm Anatomy 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- MMXZSJMASHPLLR-UHFFFAOYSA-N pyrroloquinoline quinone Chemical compound C12=C(C(O)=O)C=C(C(O)=O)N=C2C(=O)C(=O)C2=C1NC(C(=O)O)=C2 MMXZSJMASHPLLR-UHFFFAOYSA-N 0.000 description 3
- 239000010453 quartz Substances 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000011347 resin Substances 0.000 description 3
- 229920005989 resin Polymers 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000036964 tight binding Effects 0.000 description 3
- 238000002371 ultraviolet--visible spectrum Methods 0.000 description 3
- 125000005289 uranyl group Chemical group 0.000 description 3
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 3
- 229910052727 yttrium Inorganic materials 0.000 description 3
- AXAVXPMQTGXXJZ-UHFFFAOYSA-N 2-aminoacetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol Chemical compound NCC(O)=O.OCC(N)(CO)CO AXAVXPMQTGXXJZ-UHFFFAOYSA-N 0.000 description 2
- PBVAJRFEEOIAGW-UHFFFAOYSA-N 3-[bis(2-carboxyethyl)phosphanyl]propanoic acid;hydrochloride Chemical compound Cl.OC(=O)CCP(CCC(O)=O)CCC(O)=O PBVAJRFEEOIAGW-UHFFFAOYSA-N 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 241000589173 Bradyrhizobium Species 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 108010078791 Carrier Proteins Proteins 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 2
- 229910052688 Gadolinium Inorganic materials 0.000 description 2
- 229910003317 GdCl3 Inorganic materials 0.000 description 2
- 229910052689 Holmium Inorganic materials 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- 241000589323 Methylobacterium Species 0.000 description 2
- 229910052779 Neodymium Inorganic materials 0.000 description 2
- 108010077519 Peptide Elongation Factor 2 Proteins 0.000 description 2
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 2
- 241000589776 Pseudomonas putida Species 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 229910052772 Samarium Inorganic materials 0.000 description 2
- 229910052771 Terbium Inorganic materials 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- 229910009523 YCl3 Inorganic materials 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 125000001931 aliphatic group Chemical group 0.000 description 2
- 150000001345 alkine derivatives Chemical class 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 150000001540 azides Chemical class 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 150000001735 carboxylic acids Chemical class 0.000 description 2
- 238000005277 cation exchange chromatography Methods 0.000 description 2
- 239000000084 colloidal system Substances 0.000 description 2
- 238000012875 competitive assay Methods 0.000 description 2
- 230000002860 competitive effect Effects 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 230000001086 cytosolic effect Effects 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 238000001506 fluorescence spectroscopy Methods 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 229910052742 iron Inorganic materials 0.000 description 2
- 238000000111 isothermal titration calorimetry Methods 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229910052746 lanthanum Inorganic materials 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000001819 mass spectrum Methods 0.000 description 2
- 238000001906 matrix-assisted laser desorption--ionisation mass spectrometry Methods 0.000 description 2
- DRLFMBDRBRZALE-UHFFFAOYSA-N melatonin Chemical compound COC1=CC=C2NC=C(CCNC(C)=O)C2=C1 DRLFMBDRBRZALE-UHFFFAOYSA-N 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000017854 proteolysis Effects 0.000 description 2
- 230000005588 protonation Effects 0.000 description 2
- 108010054624 red fluorescent protein Proteins 0.000 description 2
- 230000004043 responsiveness Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 102220131212 rs886046111 Human genes 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000000954 titration curve Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- HNSDLXPSAYFUHK-UHFFFAOYSA-N 1,4-bis(2-ethylhexyl) sulfosuccinate Chemical compound CCCCC(CC)COC(=O)CC(S(O)(=O)=O)C(=O)OCC(CC)CCCC HNSDLXPSAYFUHK-UHFFFAOYSA-N 0.000 description 1
- 102100025573 1-alkyl-2-acetylglycerophosphocholine esterase Human genes 0.000 description 1
- 101710097567 12 kDa protein Proteins 0.000 description 1
- IHPYMWDTONKSCO-UHFFFAOYSA-N 2,2'-piperazine-1,4-diylbisethanesulfonic acid Chemical compound OS(=O)(=O)CCN1CCN(CCS(O)(=O)=O)CC1 IHPYMWDTONKSCO-UHFFFAOYSA-N 0.000 description 1
- DMQQXDPCRUGSQB-UHFFFAOYSA-N 2-[3-[bis(carboxymethyl)amino]propyl-(carboxymethyl)amino]acetic acid Chemical compound OC(=O)CN(CC(O)=O)CCCN(CC(O)=O)CC(O)=O DMQQXDPCRUGSQB-UHFFFAOYSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KCJUWKMLSA-N 2-[[(2r)-2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]propanoyl]amino]acetic acid Chemical group OC(=O)CNC(=O)[C@@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KCJUWKMLSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 1
- 108010024976 Asparaginase Proteins 0.000 description 1
- 101100004028 Avena sativa P60A gene Proteins 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 238000000035 BCA protein assay Methods 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- OHZONXVXHVXTAN-UHFFFAOYSA-N C1=CC=C2C(=C1)N=C3C=CC=CC3=N2.OS(=O)(=S)O Chemical compound C1=CC=C2C(=C1)N=C3C=CC=CC3=N2.OS(=O)(=S)O OHZONXVXHVXTAN-UHFFFAOYSA-N 0.000 description 1
- 102100036339 Calmodulin-like protein 3 Human genes 0.000 description 1
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 1
- 229910021580 Cobalt(II) chloride Inorganic materials 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- JPVYNHNXODAKFH-UHFFFAOYSA-N Cu2+ Chemical compound [Cu+2] JPVYNHNXODAKFH-UHFFFAOYSA-N 0.000 description 1
- 102100030497 Cytochrome c Human genes 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- 108010075031 Cytochromes c Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- PIICEJLVQHRZGT-UHFFFAOYSA-N Ethylenediamine Chemical compound NCCN PIICEJLVQHRZGT-UHFFFAOYSA-N 0.000 description 1
- 210000000712 G cell Anatomy 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108010072039 Histidine kinase Proteins 0.000 description 1
- 101000714692 Homo sapiens Calmodulin-like protein 3 Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 229910052765 Lutetium Inorganic materials 0.000 description 1
- 239000002616 MRI contrast agent Substances 0.000 description 1
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 1
- 102000003939 Membrane transport proteins Human genes 0.000 description 1
- 108090000301 Membrane transport proteins Proteins 0.000 description 1
- 241000408736 Methylobacterium aquaticum Species 0.000 description 1
- 241000863391 Methylophilus Species 0.000 description 1
- 238000006957 Michael reaction Methods 0.000 description 1
- 101710164418 Movement protein TGB2 Proteins 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 229910020350 Na2WO4 Inorganic materials 0.000 description 1
- 229910017544 NdCl3 Inorganic materials 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 239000007990 PIPES buffer Substances 0.000 description 1
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 1
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 1
- 108010090127 Periplasmic Proteins Proteins 0.000 description 1
- 108010092494 Periplasmic binding proteins Proteins 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 241000320117 Pseudomonas putida KT2440 Species 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 238000010847 SEQUEST Methods 0.000 description 1
- 229910018057 ScCl3 Inorganic materials 0.000 description 1
- 229920005654 Sephadex Polymers 0.000 description 1
- 239000012507 Sephadex™ Substances 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 229910052775 Thulium Inorganic materials 0.000 description 1
- 101710159648 Uncharacterized protein Proteins 0.000 description 1
- 229910052770 Uranium Inorganic materials 0.000 description 1
- 229910052769 Ytterbium Inorganic materials 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 150000001242 acetic acid derivatives Chemical class 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 239000002168 alkylating agent Substances 0.000 description 1
- 229940100198 alkylating agent Drugs 0.000 description 1
- 230000029936 alkylation Effects 0.000 description 1
- 238000005804 alkylation reaction Methods 0.000 description 1
- 125000003368 amide group Chemical group 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 150000001449 anionic compounds Chemical class 0.000 description 1
- 150000001491 aromatic compounds Chemical class 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 239000012131 assay buffer Substances 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 238000010461 azide-alkyne cycloaddition reaction Methods 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 238000010256 biochemical assay Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 230000029918 bioluminescence Effects 0.000 description 1
- 238000005415 bioluminescence Methods 0.000 description 1
- 230000006406 biphasic response Effects 0.000 description 1
- 239000012496 blank sample Substances 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 229940043430 calcium compound Drugs 0.000 description 1
- 150000001674 calcium compounds Chemical class 0.000 description 1
- 238000007623 carbamidomethylation reaction Methods 0.000 description 1
- 238000004177 carbon cycle Methods 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000005341 cation exchange Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- PBAYDYUZOSNJGU-UHFFFAOYSA-N chelidonic acid Natural products OC(=O)C1=CC(=O)C=C(C(O)=O)O1 PBAYDYUZOSNJGU-UHFFFAOYSA-N 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 150000001805 chlorine compounds Chemical class 0.000 description 1
- 238000011210 chromatographic step Methods 0.000 description 1
- 238000004737 colorimetric analysis Methods 0.000 description 1
- 238000003271 compound fluorescence assay Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 239000000287 crude extract Substances 0.000 description 1
- 108010082025 cyan fluorescent protein Proteins 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 238000010217 densitometric analysis Methods 0.000 description 1
- 238000011082 depyrogenation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- IMBKASBLAKCLEM-UHFFFAOYSA-L ferrous ammonium sulfate (anhydrous) Chemical compound [NH4+].[NH4+].[Fe+2].[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O IMBKASBLAKCLEM-UHFFFAOYSA-L 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- MEANOSLIBWSCIT-UHFFFAOYSA-K gadolinium trichloride Chemical compound Cl[Gd](Cl)Cl MEANOSLIBWSCIT-UHFFFAOYSA-K 0.000 description 1
- 108010090623 galactose binding protein Proteins 0.000 description 1
- 102000021529 galactose binding proteins Human genes 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 239000011544 gradient gel Substances 0.000 description 1
- 231100001261 hazardous Toxicity 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000013383 initial experiment Methods 0.000 description 1
- 229910001412 inorganic anion Inorganic materials 0.000 description 1
- 229910001410 inorganic ion Inorganic materials 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 1
- 238000005468 ion implantation Methods 0.000 description 1
- 238000005040 ion trap Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- ICAKDTKJOYSXGC-UHFFFAOYSA-K lanthanum(iii) chloride Chemical compound Cl[La](Cl)Cl ICAKDTKJOYSXGC-UHFFFAOYSA-K 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L magnesium chloride Substances [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 238000006263 metalation reaction Methods 0.000 description 1
- WSFSSNUMVMOOMR-NJFSPNSNSA-N methanone Chemical compound O=[14CH2] WSFSSNUMVMOOMR-NJFSPNSNSA-N 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- ATINCSYRHURBSP-UHFFFAOYSA-K neodymium(iii) chloride Chemical compound Cl[Nd](Cl)Cl ATINCSYRHURBSP-UHFFFAOYSA-K 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 125000004043 oxo group Chemical group O=* 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000007030 peptide scission Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 238000011533 pre-incubation Methods 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000012460 protein solution Substances 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 239000012217 radiopharmaceutical Substances 0.000 description 1
- 229940121896 radiopharmaceutical Drugs 0.000 description 1
- 230000002799 radiopharmaceutical effect Effects 0.000 description 1
- 238000004725 rapid separation liquid chromatography Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 239000012508 resin bead Substances 0.000 description 1
- 238000002165 resonance energy transfer Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 102200004925 rs56136737 Human genes 0.000 description 1
- 102220137167 rs756021929 Human genes 0.000 description 1
- 239000012266 salt solution Substances 0.000 description 1
- DOSGOCSVHPUUIA-UHFFFAOYSA-N samarium(3+) Chemical compound [Sm+3] DOSGOCSVHPUUIA-UHFFFAOYSA-N 0.000 description 1
- BHXBZLPMVFUQBQ-UHFFFAOYSA-K samarium(iii) chloride Chemical compound Cl[Sm](Cl)Cl BHXBZLPMVFUQBQ-UHFFFAOYSA-K 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 229910052706 scandium Inorganic materials 0.000 description 1
- SIXSYDAISGFNSX-UHFFFAOYSA-N scandium atom Chemical compound [Sc] SIXSYDAISGFNSX-UHFFFAOYSA-N 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- PXQLVRUNWNTZOS-UHFFFAOYSA-N sulfanyl Chemical class [SH] PXQLVRUNWNTZOS-UHFFFAOYSA-N 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 238000004381 surface treatment Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- DNYWZCXLKNTFFI-UHFFFAOYSA-N uranium Chemical compound [U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U][U] DNYWZCXLKNTFFI-UHFFFAOYSA-N 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000002424 x-ray crystallography Methods 0.000 description 1
- VWQVUPCCIRVNHF-UHFFFAOYSA-N yttrium atom Chemical compound [Y] VWQVUPCCIRVNHF-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C22—METALLURGY; FERROUS OR NON-FERROUS ALLOYS; TREATMENT OF ALLOYS OR NON-FERROUS METALS
- C22B—PRODUCTION AND REFINING OF METALS; PRETREATMENT OF RAW MATERIALS
- C22B60/00—Obtaining metals of atomic number 87 or higher, i.e. radioactive metals
- C22B60/02—Obtaining thorium, uranium, or other actinides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C22—METALLURGY; FERROUS OR NON-FERROUS ALLOYS; TREATMENT OF ALLOYS OR NON-FERROUS METALS
- C22B—PRODUCTION AND REFINING OF METALS; PRETREATMENT OF RAW MATERIALS
- C22B3/00—Extraction of metal compounds from ores or concentrates by wet processes
- C22B3/20—Treatment or purification of solutions, e.g. obtained by leaching
- C22B3/22—Treatment or purification of solutions, e.g. obtained by leaching by physical processes, e.g. by filtration, by magnetic means, or by thermal decomposition
-
- C—CHEMISTRY; METALLURGY
- C22—METALLURGY; FERROUS OR NON-FERROUS ALLOYS; TREATMENT OF ALLOYS OR NON-FERROUS METALS
- C22B—PRODUCTION AND REFINING OF METALS; PRETREATMENT OF RAW MATERIALS
- C22B3/00—Extraction of metal compounds from ores or concentrates by wet processes
- C22B3/20—Treatment or purification of solutions, e.g. obtained by leaching
- C22B3/42—Treatment or purification of solutions, e.g. obtained by leaching by ion-exchange extraction
-
- C—CHEMISTRY; METALLURGY
- C22—METALLURGY; FERROUS OR NON-FERROUS ALLOYS; TREATMENT OF ALLOYS OR NON-FERROUS METALS
- C22B—PRODUCTION AND REFINING OF METALS; PRETREATMENT OF RAW MATERIALS
- C22B59/00—Obtaining rare earth metals
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P10/00—Technologies related to metal processing
- Y02P10/20—Recycling
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S530/00—Chemistry: natural resins or derivatives; peptides or proteins; lignins or reaction products thereof
- Y10S530/81—Carrier - bound or immobilized peptides or proteins and the preparation thereof, e.g. biological cell or cell fragment as carrier
Landscapes
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Metallurgy (AREA)
- Geology (AREA)
- Manufacturing & Machinery (AREA)
- Materials Engineering (AREA)
- Mechanical Engineering (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Environmental & Geological Engineering (AREA)
- Health & Medical Sciences (AREA)
- Geochemistry & Mineralogy (AREA)
- Gastroenterology & Hepatology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Peptides Or Proteins (AREA)
- Solid-Sorbent Or Filter-Aiding Compositions (AREA)
Abstract
公开了对某些三价阳离子和/或四价阳离子具有高选择性亲和力的金属结合蛋白,所述三价阳离子和/或四价阳离子衍生自例如稀土元素或其离子(例如镧系元素)和锕系元素或其离子,以及衍生自铪和锆元素或其化合物,以及包含所述金属结合蛋白的传感器,和用于使用所述金属结合蛋白捕获和分离这样的三价阳离子和/或四价阳离子的方法。
Description
相关申请的交叉引用
本申请要求于2018年9月5日提交的美国临时申请62/727,114的权益,其全部公开内容通过引用合并于此。
技术领域
本公开内容涉及金属结合蛋白,并且特别是对稀土元素具有选择性亲和力的蛋白质。
背景
稀土元素(REE)包括镧系元素(Ln)、钇和钪。这些元素(特别是Ln)作为诸如永磁体、电动和混合动力汽车电池、激光器、荧光粉和智能手机等技术中的关键组件是非常需要的。然而,这些元素的应用范围却与存在相对少的经济上可行的可采矿床以及从矿石和其它原料中提取Ln的难度形成鲜明对比。REE盐的不溶性及其化学性质的相似性要求使用苛刻、对环境有害且费力的方法来获取、回收和分离它们。
REE的技术重要性以及与其获取相关的挑战已经激发了用于更加简便和环境友好的REE分离的生物工程方法。尽管早已知道一些植物和微生物会积累这些金属,但直到最近才确定Ln在某些吡咯并喹啉醌(PQQ)依赖性醇脱氢酶,尤其是甲醇脱氢酶(MDH)的催化活性中起重要的生物学作用。这些观察结果提供了从生物学学习设计用于REE感测、捕获和分离的有效新方法的可能性。
因此,可以选择性结合镧系元素的蛋白质的鉴定和表征可以使其能够用于这些能力。
发明内容
本公开内容的优点包括相对于非三价和非四价阳离子,对某些三价和/或四价阳离子具有高选择性亲和力的金属结合蛋白。在一些方面中,相对于非三价和/或非四价阳离子,例如来自例如第II族元素化合物或其盐的二价阳离子,金属结合蛋白对来自例如稀土元素、其化合物或盐、或锕系元素、其化合物或盐的三价阳离子和/或四价阳离子具有高选择性亲和力(例如,至少1000倍,例如至少104、105、106或更高)。这样的二价阳离子包括例如钙阳离子。在一个实施方案中,相对于金属结合蛋白对二价离子(例如钙离子)的亲和力,金属结合蛋白对镧系离子的亲和力为至少1000倍,例如至少104、105、106或107倍。在一个实施方案中,相对于金属结合蛋白对二价离子(例如钙离子)的亲和力,金属结合蛋白对锕系离子的亲和力为至少1000倍,例如至少104、105、106或107倍。在一个实施方案中,金属结合蛋白不是天然存在的。在一个实施方案中,金属结合蛋白包含非天然标签,例如His6标签。有利地,本公开内容的金属结合蛋白可以被纯化为至少70%,例如至少75%、80%、85%、90%、95%的纯形式。
本公开内容的实施方案包括,例如,单独地或组合地,其中金属结合蛋白包含与SEQ ID NO:1的序列具有至少80%同一性,例如至少85%、90%、92%、95%、97%、98%、99%或100%同一性的序列。在另一些实施方案中,金属结合蛋白不是天然的和/或包含非天然标签,例如His6标签。
本公开内容的另一方面包括分离的金属结合蛋白,包含至少2个包含SEQ ID NO:3的序列的EF手基序,其中相邻的EF手基序被10-15个氨基酸分隔。本公开内容的实施方案包括,例如,单独地或组合地,其中相邻的EF手基序被11、12或13个氨基酸分隔。在一些实施方案中,分离的金属结合蛋白可包含2、3或4个EF手基序,所述EF手基序中的至少一个包含至少3个羧酸残基,并且至少2个相邻的EF手基序被10-15个氨基酸残基分隔,例如被12-13个氨基酸残基分隔。在另一些实施方案中,金属结合蛋白不是天然的和/或包含非天然标签,例如His6标签。
本公开内容的另一方面包括分离的金属结合蛋白,由包含与SEQ ID NO:2的序列具有至少80%同一性的序列的核苷酸编码。本公开内容的实施方案包括,例如,单独地或组合地,其中核苷酸包含与SEQ ID NO:2的序列具有至少85%、90%、93%、95%、97%、98%、99%或100%同一性的序列。在另一些实施方案中,金属结合蛋白不是天然的和/或包含非天然标签,例如His6标签。
本公开内容的另一方面包括传感器,用于相对于非三价和非四价阳离子来感测某些三价和/或四价阳离子的存在,例如来自例如稀土元素、其化合物或盐、或锕系元素、其化合物或盐、例如镧系离子的一种或多种三价阳离子。传感器包含金属结合蛋白,相对于非三价和非四价阳离子,例如来自例如第II族元素(例如钙化合物或其盐)的二价阳离子,所述金属结合蛋白对来自例如稀土元素、其化合物或盐、或锕系元素、其化合物或盐的三价和/或四价阳离子具有高选择性亲和力。在一个实施方案中,传感器还包含第一荧光蛋白和第二荧光蛋白,第二荧光蛋白的激发波长与第一荧光蛋白的发射波长基本相同。
本公开内容的另一方面包括从介质(例如溶液、混悬液或胶体)中相对于非三价阳离子或非四价阳离子来分离三价阳离子或四价阳离子的方法。所述方法包括使包含三价或四价阳离子的介质与金属结合蛋白接触以结合所述三价或四价阳离子。在一些实施方案中,所述三价或四价阳离子选自由以下组成的组:来自一种或多种稀土元素、其化合物或盐(例如镧系元素或其盐)或来自一种或多种锕系元素、其化合物、或其盐或来自稀土和锕系元素的组合的三价或四价阳离子。相对于非三价阳离子,金属结合蛋白可对三价阳离子具有高选择性亲和力。另外或作为替代,相对于非四价阳离子,金属结合蛋白可对四价阳离子具有高选择性亲和力。所述方法还可以包括从介质中分离结合有三价阳离子和/或四价阳离子(例如,镧系元素(3+)离子)的金属结合蛋白;以及任选地使三价和/或四价阳离子与金属结合蛋白分离。
通过下面的详细描述,本发明的其它优点对于本领域技术人员将变得明显,其中仅以说明预期实施本发明的最佳模式的方式示出和描述了本发明的优选实施方案。将会认识到,本发明能够具有其它和不同的实施方案,并且其若干细节能够在多个明显的方面进行修改,而所有这些都不脱离本发明。因此,附图和描述本质上应被认为是说明性的,而不是限制性的。
附图说明
参考附图,其中具有相同附图标记的元件在全文中表示相似的元件,并且其中:
图1A显示了XoxF纯化和共纯化条带(镧调蛋白(lanmodulin))的SDS-PAGE分析。
图1B显示了LanM和人CaM(作为代表性的典型含EF手的蛋白质)的EF手的序列。
图1C显示了扭脱甲基杆菌(M.extorquens)AM1 LanM(SEQ ID NO:1)和智人(H.sapiens)钙调蛋白的氨基酸序列的比较。
图2A显示了SP FF色谱后XoxF的Superdex S75色谱的部分洗脱曲线(67-83.5mL,级分40-50,1.5mL/级分)。
图2B显示了来自扭脱甲基杆菌的XoxF的纯化物的SDS-PAGE分析,说明了LanM的共纯化和分离。
图2C显示了级分44(B中的泳道10)的线性MALDI-TOF质谱,11759.574Da处的峰对应于LanM。
图3A显示了Superose 75色谱后纯化的LanM-TEV-His的线性MALDI-TOF质谱。
图3B显示了具有C末端TEV可切割的His6标签(GENLYFQHHHHHH)(SEQ ID NO:8)的全长LanM的预测氨基酸序列,以及当在大肠杆菌中表达时观察到的切割位点。
图4A显示了纯化的His-LanM和LanM-His的SDS-PAGE分析。
图4B显示了通过CD光谱监测的wt LanM、LanM-His和His-LanM(每种蛋白质15μM)与SmIII的配合物的Kd的确定。
图5A显示了在0-8当量LaIII存在下LanM(20μM)的CD光谱。
图5B显示了用0-8当量的LnIII离子(LaIII-LuIII和YIII)和用CaII对LanM(20μM)进行CD滴定的摩尔椭圆率变化的量级。
图5C显示了在二甲酚橙(7μM)存在下通过LanM(5μM)的竞争性滴定监测的LnIII与LanM结合的化学计量。
图6A显示了在多种浓度的LaIII存在下LanM的UV-可见光谱(相对于消光系数归一化)。
图6B显示了来自滴定的差异光谱,显示了在280和287nm处的两个尖锐的吸收特征。
图6C表明,滴定的A280 nm和A287 nm图证明了在4当量LaIII/LanM处的终点。
图7A和7B显示了(A)用CaII(0-160μM和0-5mM)对wt LanM(20μM)和(B)用0-5mMCaII对20μM LanM-His进行滴定的完整远UV CD光谱。
图8显示了在存在和不存在6μM LanM的情况下用LnIII(在这种情况下为SmIII)对二甲酚橙的代表性滴定。
图9显示了相对于有效离子半径绘制的多种LnIII-LanM配合物(Ln=La、Nd、Sm、Gd、Tb、Ho、Y)的Kd,app值。
图10A、10B、10C和10D显示了用LaIII和CaII对LanM和LanM(4P-4A)进行CD滴定,以用于表观Kd确定。将点拟合(红线)于具有一组或两组(在LaIII与wt蛋白结合的情况下)位点的协同结合模型(希尔方程(Hill equation)),参数在表3中给出。
图11显示了本公开内容的一个方面中的传感器(例如,LaMP1)的设计。
图12A、12B、12C提供了数据,显示了相对于所选的常见单价、二价和三价金属离子,LaMP1对LnIII的选择性。
图13显示了在荧光板读取器测量中LaMP1的检测极限的确定。
图14显示了使用LaIII和CaII对LaMP1(4P→4A)进行Kd,app确定。
图15显示了在不存在添加的金属离子(基线)和存在5μM LnIII、10μM ScIII、YIII和FeIII;1mM AlIII、MnII和CaII;或100μM CuII的情况下,LaMP1(4P→4A)的FRET变化倍数。
图16显示了基于LanM的FRET传感器LaMP1的荧光响应、表观Kd值和金属选择性的表征。
图17A、17B和17C显示了与Y(III)结合的LanM的结构。
发明详述
本公开内容涉及相对于非三价和非四价阳离子,对某些三价和/或四价阳离子具有高选择性亲和力的金属结合蛋白。特别地,相对于非三价阳离子,本公开内容的金属结合蛋白可对三价阳离子具有高选择性亲和力。另外或作为替代,相对于非四价阳离子,金属结合蛋白可对四价阳离子具有高选择性亲和力。本文公开的金属结合蛋白对来自例如稀土元素、其化合物或盐、或锕系元素、其化合物或盐的三价和/或四价阳离子具有亲和力,即为对于非三价阳离子和/或非四价阳离子,例如来自例如第II族元素(例如钙)、其化合物或盐的二价阳离子的至少1000倍高。本文公开的金属结合蛋白还可以对来自铪和锆元素、其化合物和盐的四价阳离子具有高亲和力。在一个实施方案中,相对于钙离子、化合物或盐,这样的金属结合蛋白可对镧系离子或锕系离子具有至少103、104、105、106、107或更高的亲和力。在一个实施方案中,金属结合蛋白不是天然存在的。在一个实施方案中,金属结合蛋白包含非天然标签,例如His6标签。有利地,这样的金属结合蛋白可以被包含作为对稀土或锕系元素具有高选择性的传感器,以用于检测稀土或锕系元素的存在。
在表征来自扭脱甲基杆菌(Methylorubrum extorquens)AM1的Ln依赖性甲醇脱氢酶(Ln-MDH)XoxF的工作中,鉴定了与Ln-MDH共纯化的LnIII结合蛋白。这种镧系调节蛋白的蛋白质被称为镧调蛋白(LanM),包含传统上与纳摩尔至毫摩尔亲和力CaII结合相关的金属配位基序(EF手)。然而,LanM以相对于CaII高至1亿倍的构象选择性(甚至更高)响应于LnIII和稀土。除其它事项外,本公开内容描述了LanM的鉴定、纯化和分离,其稀土元素结合特征,以及其相对于其它金属离子(例如CaII)而对稀土元素的结合和构象选择性的分子基础。图1C显示了LanM和人(智人(H.sapiens))钙调蛋白(CaM)的氨基酸序列。有利地,分离的金属结合蛋白包含与SEQ ID NO:1(LanM)至少80%相同,例如与SEQ ID NO:1至少82%、85%、87%、90%、92%、95%、99%或100%相同的序列。例如,在一个实施方案中,分离的金属结合蛋白具有去除了SEQ ID NO:1的前21个氨基酸残基的序列。另外或作为替代,分离的金属结合蛋白包含某些基序并且在基序对之间具有一定的间隔,其可以表现出与LanM相似的性质,如本文其它地方更详细地描述的。例如,在EF手的第9位包含羧酸残基并且在每个预测的EF环之间包含与LanM中相似数目的氨基酸的分离的金属结合蛋白将具有与LanM相似的特性。在一个实施方案中,这样的金属结合蛋白不是天然存在的。在另一个实施方案中,金属结合蛋白包含非天然标签,例如His6标签。有利地,本公开内容的金属结合蛋白可以被纯化为至少70%,例如至少75%、80%、85%、90%、95%的纯形式。
具有与参考氨基酸序列(例如SEQ ID NO:1等)至少例如约95%“相同”的氨基酸序列的多肽应理解为意指多肽的氨基酸序列与参考序列相同,只是氨基酸序列可包含对于参考氨基酸序列的每100个氨基酸至多约5个修饰。换句话说,为了获得具有与参考氨基酸序列至少约95%相同的氨基酸序列的肽,可以将参考序列的至多约5%的氨基酸残基缺失或替换成另一氨基酸,或者可以在参考序列中插入占参考序列中总氨基酸的至多约5%的数目的氨基酸。参考序列的这些修饰可发生在参考氨基酸序列的N末端或C末端位置或这些末端位置之间的任何位置,单独地散布于参考序列中的氨基酸之间,或散布在参考序列中的一个或多个连续基团中。
如本文所用,“同一性”是对与参考核苷酸或氨基酸序列相比核苷酸序列或氨基酸序列的同一性的量度。通常,对序列进行比对,以获得最高级别匹配。“同一性”本身具有本领域公认的含义,并且可以使用公知的技术来计算。尽管有多种方法来测量两个多核苷酸或多肽序列之间的同一性,但术语“同一性”是技术人员公知的(Carillo(1988)J.AppliedMath.48,1073)。用于确定两个序列之间的同一性和相似性的计算机程序方法的实例包括但不限于GCG程序包(Devereux(1984)Nucleic Acids Research 12,387)、BLASTP、ExPASy、BLASTN、FASTA(Atschul(1990)J.Mol.Biol.215,403)和FASTDB。确定同一性和相似性的方法的实例在Michaels(2011)Current Protocols in Protein Science,第1卷,JohnWiley&Sons中有所讨论。
在本发明的一个实施方案中,用于确定两个或更多个多肽之间的同一性的算法是BLASTP。在本发明的另一个实施方案中,用于确定两个或更多个多肽之间的同一性的算法是FASTDB,其基于Brutlag(1990)Comp.App.Biosci.6,237-245)的算法。在FASTDB序列比对中,查询序列和参考序列是氨基酸序列。序列比对的结果是同一性百分比。在一个实施方案中,可用于进行氨基酸序列的FASTDB比对以计算同一性百分比的参数包括但不限于:矩阵=PAM,k元组=2,错配罚分=1,连接罚分=20,随机化分组长度=0,截止评分=1,空位罚分=5,空位大小罚分0.05,窗口大小=500或主题氨基酸序列的长度(以较短者为准)。
如果由于N末端或C末端的添加或缺失(而不是由于内部的添加或缺失)而使得参考序列比查询序列短或长,则可以进行手动校正,因为FASTDB程序在计算同一性百分比时不考虑参考序列的N末端和C末端的截短或添加。对于相对于参考序列在N末端或C末端截短的查询序列,通过将查询序列中与参考序列的N末端或C末端不匹配/比对的残基数计算为查询序列总碱基的百分比,来校正同一性百分比。FASTDB序列比对的结果确定了匹配/比对。然后从使用指定参数通过上述FASTDB程序计算的同一性百分比中减去比对百分比,以得到最终的同一性百分比评分。该校正的评分可以用于确定比对如何彼此“对应”以及同一性百分比。出于手动调整同一性百分比评分的目的,可以考虑参考序列的延伸超过查询序列的N或C末端的残基。即,当手动调整同一性百分比评分或比对编号时,可以对与比较序列的N或C末端不匹配/不比对的残基进行计数。
例如,将90个氨基酸残基的查询序列与100个残基的参考序列进行比对以确定同一性百分比。缺失发生在查询序列的N末端,因此FASTDB比对不显示N末端的前10个残基的匹配/比对,10个未配对的残基占参考序列的10%(N和C末端不匹配的残基数/参考序列中的残基总数),因此从通过FASTDB程序计算的同一性百分比评分中减去10%。如果剩余的90个残基完全匹配(100%比对),则最终的同一性百分比将为90%(100%比对-10%未匹配突出端)。在另一个实例中,将90个残基的查询序列与100的个参考序列进行比较,只是缺失为内部缺失。在这种情况下,通过FASTDB计算的同一性百分比不进行手动校正,因为在主题序列的N或C末端不存在与查询不匹配/比对的残基。在另一个实例中,将110个氨基酸的查询序列与100个残基的参考序列进行比对以确定同一性百分比。查询中的添加发生在查询序列的N末端,因此FASTDB比对不显示N末端的前10个残基的匹配/比对。如果查询序列的剩余100个氨基酸残基与参考序列的全长具有95%的同一性,则查询的N末端添加将被忽略,并且查询与参考序列的同一性百分比将为95%。
另一方面,本公开内容提供了缺失变体,其中金属结合蛋白中的一个或多个氨基酸残基被移除。缺失可在经修饰的金属结合蛋白的一个或两个末端,或通过移除经修饰的金属结合蛋白的一个或多个非末端氨基酸残基来进行。因此,缺失变体包括经修饰的金属结合蛋白的所有片段。
在公开的同一性百分比的范围内,本发明还涉及本发明公开的多肽的替换变体。替换变体包括其中截短的金属结合蛋白的一个或多个氨基酸残基被去除并被替代残基替换的那些多肽。一方面,替换在性质上是保守的;然而,本发明还涵盖了非保守的替换。为此目的的保守替换可以定义为如下表所示。氨基酸可以根据物理性质以及对二级和三级蛋白质结构的贡献进行分类。保守替换在本领域中被认为是一个氨基酸被具有相似特性的另一氨基酸替换。示例性保守替换在以下给出。
表18:保守替换
侧链特征 | 氨基酸 |
<u>脂肪族</u> | |
非极性 | Gly、Ala、Pro、Iso、Leu、Val |
极性不带电荷 | Cys、Ser、Thr、Met、Asn、Gln |
极性带电荷 | Asp、Glu、Lys、Arg |
<u>芳香族</u> | His、Phe、Trp、Tyr |
<u>其它</u> | Asn、Gln、Asp、Glu |
或者,保守氨基酸可以如Lehninger(1975)Biochemistry,第二版;WorthPublishers,第71-77页中所述进行分组,如下所述。
表19:保守替换
侧链特征 | 氨基酸 |
<u>非极性(疏水)</u> | |
脂肪族: | Ala、Leu、Iso、Val、Pro |
芳香族: | Phe、Trp |
含硫: | Met |
类别模糊(Borderline): | Gly |
<u>不带电荷-极性</u> | |
羟基: | Ser、Thr、Tyr |
酰胺基: | Asn、Gln |
巯基(sulfhydryl): | Cys |
类别模糊: | Gly |
<u>正电荷(碱性):</u> | Lys、Arg、His |
<u>负电荷(酸性):</u> | Asp、Glu |
又或者,示例性的保守性替换如下所述。
表20:保守替换
在甲基营养细菌中发现的甲醇脱氢酶(MDH)是可溶性的周质酶,其催化甲醇氧化成甲醛,这是使甲醇能够作为用于生长的唯一碳源的关键代谢步骤,因此在全球碳循环中发挥关键作用。最广泛表征的MDH需要CaII离子来发挥活性,但是最近的研究表明数种生物体中特定的LnIII依赖性MDH(Ln-MDH,XoxF)的存在,其中来自模型甲基营养菌的扭脱甲基杆菌(Methylorubrum extorquens)和Methylacidiphilum fumariolicum SolV的酶被最佳表征。在存在编码两种系统的基因的情况下,例如扭脱甲基杆菌,Ca-MDH的表达在LnIII的存在下被抑制,并且严格需要前面(early)LnIII(La-Nd,并且在较小程度需要Sm)。考虑到CaII与生物学相关的前面LnIII的相似离子半径,两类MDH中几乎相同的金属配位环境,以及Ca比Ln显著更高的环境丰度,将LnIII(而不是CaII)具体引入Ln-MDH活性位点从化学的角度来看引起了极大的兴趣。
先前未表征的LanM(SEQ ID NO:1)已被鉴定为在从扭脱甲基杆菌细胞分离时与XoxF部分地共纯化的蛋白质。像XoxF一样,LanM是周质蛋白,并且在许多甲基营养菌基因组中是保守的。其对皮摩尔浓度的所有稀土金属(例如LaIII和LuIII和YIII)表现出很强的构象响应,而只有在近毫摩尔浓度下才对CaII具有响应。该蛋白质还对其它稀土金属ScIII(Kd未确定,但<μM)具有响应。这个结果是令人惊讶的,因为LanM包含传统上与高亲和力(纳摩尔至微摩尔)CaII结合相关的金属配位基序(EF手)。本文的分析表明,对LnIII的这种相对于CaII的108倍的选择性有一些归因于在LanM的每个EF手中发现的Pro残基。蛋白质的其它方面,例如每个EF手的第9位的羧酸残基的存在以及相邻EF手的融合也有助于EF手基序和因此的同源蛋白质对镧系元素或锕系元素三价阳离子的识别。例如,用Ala替换Pro残基会使对CaII的构象响应增加至少100倍。
未表征的蛋白质LanM与XoxF共纯化。从在1μM LaCl3和作为唯一碳源的甲醇的存在下生长的扭脱甲基杆菌AM1细胞纯化出XoxF。将该蛋白质通过硫酸铵沉淀、阳离子交换色谱和尺寸排阻色谱(SEC)纯化至高纯度(图1A),并且在23℃的比活度为22μmol/min/mg(表7)。在阳离子交换步骤之后,我们被以前从未注意到的数个共洗脱的低分子量条带的突出显现所震惊。将这些条带通过凝胶内胰蛋白酶消化、液相色谱和质谱进行分析;它们中在12kDa处的一种(图1A)对应于假设的蛋白质MexAM1_META1p1786(LanM)(基于代表蛋白质序列的75%的9种独特肽)(表1)。LanM与XoxF在两次独立的纯化中共纯化。LanM和XoxF凝胶条带的光密度分析表明在对蛋白质分子量进行归一化之后~1:1的LanM:XoxF(单体)。在最终的尺寸排阻色谱(SEC)步骤(图2)中使LanM与XoxF分离后,对完整蛋白质进行的MALDI-MS分析得出分子量为11759.574Da,与预期的信号肽的切割得到Ala22作为N末端残基(预期质量:11757.0Da)相一致。此结果表明LanM位于扭脱甲基杆菌周质中,其中XoxF和乙醇脱氢酶ExaF(先前在扭脱甲基杆菌中表征的唯一含Ln的蛋白质)二者也位于此处。
图1显示了镧调蛋白(LanM)的纯化和序列分析,表明其为新的含EF手的蛋白质。A)XoxF纯化和共纯化条带的SDS-PAGE分析。泳道1:分子量标准参照物。泳道2:扭脱甲基杆菌粗提物。泳道3:阳离子交换色谱后的XoxF(切下突出显现的条带并通过质谱进行分析,揭示为LanM)。泳道4:纯化的XoxF。泳道5:异源表达和纯化的LanM。B)LanM的EF手的序列(SEQ IDNO:1)和人CaM(作为代表性的典型含EF手的蛋白质)的EF手的序列。在CaM中,提供侧链CaII连接的残基显示为红色,并且参与金属配位的水分子的氢合键网络的残基显示为绿色;在LanM中,对齐的残基显示为蓝色,而独特的Pro残基为紫色加粗。C)扭脱甲基杆菌AM1 LanM与智人钙调蛋白的氨基酸序列的比较。在这两个序列中,EF手金属配位基序以红色显示。在LanM中,信号肽为蓝色。请注意,与钙调蛋白(EF1/2之间24个残基并且EF2/3之间和EF3/4之间25个残基)相比,LanM的预测的EF手环在每个EF手之间具有更短的序列(EF1/2之间和EF3/4之间12个残基,并且EF2/3之间13个残基)。在钙调蛋白中(以及一般的典型EF手)中,每个EF手包含具有9个残基的进入螺旋、9个残基的环和11个残基的离开螺旋的螺旋-环-螺旋基序。对于在每个EF手配位基序之间仅有12-13个残基,典型的EF手螺旋-环-螺旋结构可能仅可能与进入和离开螺旋融合,这表明LanM具有新的折叠,如通过与Y(III)结合的LanM的NMR分辨率结构(NMR solution structure)所示。
表1
上表1提供了肽的位置和数据。在SP快速流色谱(SP Fast Flow chromatography)之后,通过与XoxF共纯化的~12-kDa蛋白质条带的凝胶内消化和nanoLC-MS2分析鉴定出LanM肽。通过PEAKS DB搜索算法鉴定了代表全长蛋白质序列的75%(100/133个残基)的9种独特肽,其置信度得分-10logP≥30.1(蛋白质置信度得分-10lgP≥20),对应于0.9%的错误发现率(false discovery rate,FDR)。
图2显示了SP FF色谱之后XoxF的Superdex S75色谱的部分洗脱谱(67-83.5mL,级分40-50,1.5mL/级分)。LanM在该区域洗脱。级分44-46包含对应于LanM的最强烈条带;73-77.5mL的保留时间与同一柱子上纯化的LaIII-LanM-His的保留时间相关,表明LanM以LaIII结合形式从扭脱甲基杆菌分离。B)来自扭脱甲基杆菌的XoxF的纯化物的SDS-PAGE分析,显示了LanM的共纯化和分离。泳道1:分子量标准参照物。泳道2-4:SPox FF柱后和S75柱后的XoxF(纯化#1)可溶性裂解物。泳道5-6:SP FF柱和S75后的XoxF(纯化#2)。泳道7:LanM(使用TEV蛋白酶切割的His6标签),4μg。泳道8-15:来自纯化#2,S75级分42-49(各5μL)。图2C显示了级分44(B中的泳道10)的线性MALDI-TOF质谱,11759.574Da处的峰对应于LanM。考虑到这些级分的UV-可见特征,7952.316和3974.678的峰似乎是未知血红素蛋白(但不是XoxG或细胞色素cH)的m/z=+1和+2峰。
LanM的氨基酸序列引起了人们的兴趣,因为其具有四个富含羧酸的EF手基序(图1B)。尽管在文献中已经表征了许多类别的CaII结合的含EF手的蛋白质,但是就整体序列或功能而言,还没有表征的LanM同源物。因此,在这里,我们一般地在EF手蛋白的背景下讨论LanM的显著特征。在此将普遍存在的真核CaII结合蛋白钙调蛋白(CaM)称为该多样化蛋白家族的代表性实例,这是因为这两种蛋白质具有某些共同的特性,以及对CaM中的CaII和LnIII结合和金属离子连接的构象变化的广泛表征。然而,应注意,CaM和LanM在结构和功能上也存在明显差异。
EF手是由侧翼是两个α螺旋的金属结合环组成的结构基序,并且其经常成对出现,从而赋予金属离子结合的协同性。例如,CaM包含两对EF手,它们协同结合4个CaII离子,诱导构象变化以促进与靶蛋白的结合。在大多数EF手中,CaII离子是7-配位:基序的第1、第3、第5和第12位提供侧链氧配体,第7位提供主链羰基氧,并且第9位直接与CaII配位,或更通常地与配位的溶剂分子氢键键合(图1B)。EF手也结合LnIII,通常比CaII稍微更紧密(例如,TbIII-CaM为~1nM,对比于CaII-CaM为~1μM),尽管LnIII结合对于这些蛋白质来说不是生理相关的。
相对于典型EF手,LanM的EF手具有数个独特的特性。首先,LanM保留了典型EF手中存在的所有与金属结合的Asp和Asn残基,但在其每个EF手的第9位还具有Asp残基,而大约三分之一的EF手序列在此位置具有Asp。在模型EF手中显示,第9位的Asp残基贡献了相对于CaII而言对LnIII约2个数量级的选择性。其次,在功能性EF手中在第1位几乎从未观察到Asn,就像在LanM的EF手4(EF4)中一样。第三,LanM的所有EF手在第2位还具有Pro残基,这在一般EF手中是非常不常见的特征,仅在预测的CaM和CaM样蛋白的<0.5%的EF手中遇到。最后,LanM在每个EF手环之间具有不寻常的短序列(12-13个残基),而不是典型EF手中存在的24-25个残基(图1C)。这些不寻常的EF手的特征中的每一个都反映在如下表征的LanM的金属结合特性中,并提出了高度选择性稀土元素识别的原理。
LanM的纯化和表征。将LanM在大肠杆菌(E.coli)中表达以用于生物化学表征。我们最初在大肠杆菌中异源表达了包含天然信号肽的全长LanM蛋白(残基1-133),其具有C末端烟草蚀纹病毒(TEV)蛋白酶切割序列,接着是His6标签。尽管成功地对该蛋白质进行了周质提取和亲和纯化(图3),证实了LanM的周质定位,但产量很低(<1mg/L培养物)。由于LanM在其序列中不含Cys残基,因此不太可能需要定位在周质中以进行适当折叠,因此我们试图通过细胞溶质表达来获得更高的蛋白质产量。我们去除了信号肽的密码子,并表达了残基22-133(这是扭脱甲基杆菌中的天然形式),然后是蛋白酶可切割的His6标签(wt-LanM)。该构建体使得能够纯化显著更高量的LanM(15mg/L培养物)。在进行生物化学测定之前去除了N末端His6纯化标签,产生了wt蛋白。LanM还作为具有N末端或C末端His6标签但没有可切割接头的细胞溶质构建体(分别为His-LanM和LanM-His)纯化。wt-LanM、His-LanM和LanM-His的生物物理特性相似(图4),并且将LanM-His用于大多数实验。
图3显示了通过MALDI-MS对LanM-TEV-His的表征。A)来自Superose S75色谱的级分9和10(合并)的线性MALDI-TOF质谱。在L14、Y20和A22之前切割的蛋白质的预期质量分别为14245.70、13723.07和13488.81Da,如通过ExPASy ProtParam工具(https://web.expasy.org/protparam/)计算的。后者质量是通过SignalP4.0预测的。B)具有C末端TEV可切割的His6标签(GENLYFQHHHHHH)(SEQ ID NO:8)的全长LanM的预测氨基酸序列,其用于该分析。基于MS分析观察的信号肽切割位点用虚线表示。
图4显示了His-LanM、LanM-His和wt LanM的比较。图4A:纯化的His-LanM和LanM-His的凝胶。泳道1:分子量标准参照物;泳道2:His-LanM(2μg);泳道3:LanM-His(2μg)。凝胶上小的较低分子量条带可能是由于偶然的金属结合而导致的LanM的不同构象,因为LanM通过Superdex 75色谱作为单个峰洗脱,并且通过质谱仅观察到少的杂质。图4B:通过CD光谱监测的wt LanM、LanM-His和His-LanM(每种蛋白质为15μM)与SmIII的配合物的Kd的确定。如方法中所述,使用EDDS对SmIII浓度进行缓冲。将数据拟合到具有单组位点的希尔方程中,得出Kd为1.9pM(wt LanM)、4.3pM(LanM-His)和2.1pM(His-LanM),所有希尔斜率(Hillslope)为~3。
在纯化期间,我们注意到apo-LanM在SEC柱上以异常表观分子量(46kDa)迁移,其在与LaIII孵育后移至预期的~15kDa(表2)。尽管此结果可能表明脱辅蛋白质(apoprotein)的低聚化,但进一步表征却表明脱辅蛋白质表现出很少限定的结构:apo-LanM的远紫外圆二色(CD)谱(在203nm处具有明显的条带)与具有很少螺旋特征的不规则结构一致(图5A)。apo-LanM的低螺旋含量对于含EF手的蛋白质来说是令人惊讶和罕见的,因为每个EF手的两个a螺旋通常以apo和金属化(metallated)状态二者存在。值得注意的是,所有LnIII离子(La-Lu,除Pm外;和Y),导致222nm处的摩尔椭圆率[θ]222nm的~200%的增加,达到~4LnIII/LanM(图5B),特征为具有增加的α螺旋度并伴随着与无规卷曲(random coil)相关的光谱特征的减少。基于4个EF手的存在,预期化学计量为4LnIII/LanM。基于完全α-螺旋蛋白的平均残基椭圆率为–30000deg cm2 dmol-1,LanM与金属结合的平均残基椭圆率为–16000,表明该状态下~50%的螺旋特征。全蛋白质(holoprotein)(而不是脱辅蛋白质)的这种螺旋度与通过无序和二级结构预测算法(例如,Pondr和Jpred)计算出的一致,表明螺旋结构在apo状态下被抑制。添加多至8当量(160μM)CaII仅导致螺旋特性的微小增加(图7A)。因此,LanM以高度LnIII选择性的方式显示出从主要无序状态到有序状态的构象变化。
下表2提供了以下证据:wt LanM和LanM(4P→4A)在金属结合后发生了巨大的构象变化,以及apo状态下wt与突变体结构的差异。使用100μL环将LanM或LanM(4P→4A)(100μL~1.7mM蛋白质,apo或与4当量LaCl3预孵育)加载到HiLoad 16/600Superdex S75柱(120mL体积)上。对该柱子进行预平衡,并以0.75mL/min的流速在20mM MOPS、20mM KCl、5mM乙酸盐(pH 7.0)(对于脱辅蛋白质实验添加1mM EDTA)中运行。通过A280nm检测蛋白质。LanM或LanM(4P→4A)峰的洗脱时间报告如下。使用GE Gel Filtration Calibration Kit LMW校准柱子,由此计算出表观分子量。
表2.
蛋白质 | 洗脱体积(mL) | 表观分子量(kDA) |
LANM,APO | 59.8±0.4 | 46.1 |
LANM,4当量LA<sup>III</sup> | 76.3±0.2 | 15.1 |
LANM(4P→4A),APO | 62.1±0.7 | 39.4 |
LANM(4P→4A),4当量LA<sup>III</sup> | 76.0±0.3 | 15.4 |
图5显示LanM在LnIII存在下选择性地经历构象变化。图5A:在0-8当量LaIII存在下LanM(20μM)的CD光谱。图5B:用0-8当量的LnIII离子(LaIII-LuIII,除PmIII外,以及YIII)和用CaII对LanM(20μM)进行CD滴定的摩尔椭圆率变化的量级。图5C显示了在二甲酚橙(7μM)存在下通过LanM(5μM)的竞争性滴定监测的LnIII与LanM结合的化学计量。
图7显示了用(A)用0-160μM CaII对20μM wt-LanM和(B)用0-5mM CaII对20μMLanM-His进行滴定的完整远UV CD光谱。在向比色皿中添加CaII时,已针对体积变化对光谱进行了校正。注意在两种滴定中,222nm处的螺旋特征直到已经添加了>100μM(5当量)CaII才开始显现。(B)中的数据代表图10B中所示的滴定曲线。
确定了纯化的LanM在275nm处的消光系数为1400M-1cm-1。在早期的实验中,我们注意到该消光系数表现出对Ln存在的依赖性。用LaIII对LanM进行滴定导致其UV-可见光吸收光谱移动,在280和287nm处出现尖锐的峰(图6A、6B)。需要四当量LaIII来产生最大的吸光度变化。基于其它蛋白质中的类似吸收条带分配给涉及Tyr残基的羟基的氢键,我们表明这些条带反映了LanM的唯一Tyr残基(紧随EF3的Y96)的相似转变。Y96的UV-vis吸收光谱对Ln的敏感性以及一级序列中Y96与EF3的接近性表明,我们也许能够通过Tyr荧光测量来监测LanM中的金属结合和/或构象变化。实际上,通过添加~4当量LnIII(例如,图6C中的LaIII和GdIII),Y96的荧光发射(λex=278nm)被淬灭了~70%。使用缓冲的金属溶液,确定了LaIII的Kd,app。与CD滴定数据(见下文)不同,荧光滴定数据可以很好地拟合到单阶段,Kd,app=14±3pM且n=3.2±0.2。该Kd,app值与CD滴定中可见的次要的和亲和力稍低的结合事件非常相似,表明Tyr荧光可能特异性报告了LanM中两个金属诱导的构象变化中的第二个。
图6表明,在用LaIII进行滴定时,LanM的UV-vis吸收光谱改变。将螯合的20mMMOPS、100mM KCl、10mM乙酸盐(pH 7.0)中的ApoLanM-His(15μM)用相同缓冲液中5mM LaCl3的溶液进行滴定。图6A:光谱,相对于消光系数归一化。对于holo-LanM计算的消光系数为ε280nm=2000M-1cm-1。图6B:来自滴定的差异光谱,显示了在280和287nm处的两个尖锐的吸收特征。这些差异光谱与以下中的差异光谱几乎完全相同:天然胰岛素对比于释放含有Tyr26的肽的胰蛋白酶消化物,pH 6.94对比于pH 1.91的核糖核酸酶,以及大肠杆菌L-天冬酰胺酶的解折叠。在前两种情况下,实验表明与Tyr羟基的氢键合的差异导致了观察到的条带。图6C:滴定的A280nm和A287nm图,表明4当量LaIII/LanM处的终点。
为了探测LanM中这四个位点的近似金属亲和力,使用比色探针二甲酚橙(XO)进行竞争性测定。当在用LnIII对XO进行滴定中包含LanM时,与LnIII-XO配合物的形成相关的~575nm处的吸光度增加被完全抑制,直到添加了2.9±0.3当量的LnIII(图5C,图8;所有LnIII的平均值)。提议可以通过注意到EF4中第1位的Asn(Asn108)而使该化学计量与在我们的CD滴定中观察到的4个位点和LanM中的4个EF手相符。Asp是功能性EF手中共有序列第1个残基,并且预期替换为Asn将使EF手结构不稳定并且损害金属结合,表明EF4是用于LnIII结合的最低亲和力位点(类似于XO对LnIII离子的Kd,~1-10μM),并且因此未在XO滴定中未观察到。该提议也得到了YIII结合的LanM的NMR分辨率结构的支持(图17A)。
图8显示了在存在和不存在LanM的情况下用LnIII(在这种情况下为SmCl3)对二甲酚橙进行的代表性滴定。实验中LanM的浓度为6.0μM。当A575nm增加了观察到的总增加量的10%时认为是终点(这里,19.4μM SmIII或3.2当量金属),表明LanM上的紧密结合位点饱和。例如,YIII-LanM的NMR分辨率结构表明EF4的金属配位作用较弱。
图17显示了YIII-LanM(PDB代码6MI5)的NMR分辨率结构。图17A显示了整体结构。YIII离子为青色,并且EF环显示为灰色。在NMR时标的中间交换表明EF4的金属配位作用较弱。图17B:LanM(EF3)中YIII配位的细节,显示了配位残基和涉及Pro的Ni+1–H…Ni氢键。图17C:EF2/3对的氢键合连接性说明了协同作用在稀土识别中的重要性。
LanM对LnIII表现出相对于CaII的1亿倍的选择性。为了研究LnIII与3个紧密结合位点的结合,我们使用了金属螯合剂乙二醇-双(β-氨基乙基醚)--N,N,N',N'-四乙酸(EGTA)和乙二胺N,N'-二琥珀酸(EDDS)来将LnIII浓度缓冲在低皮摩尔范围内,并且通过CD光谱监测金属依赖性的构象变化(表3)。发现EDDS是除LaIII外的所有LnIII的合适的螯合剂,对于LaIII使用EGTA。在这些缓冲滴定中也观察到在化学计量滴定中观察到的[θ]222nm的完全增加(图5B),表明在皮摩尔游离金属浓度下监测的结合事件是LanM完全构象变化的原因。将[θ]222nm数据拟合到最小结合模型希尔方程,以提供关于近似表观Kd(Kd,app)值和协同性的基本信息(表3)。在所有情况下,滴定产生在低皮摩尔范围内的Kd,app,希尔系数(n)为3.2±1.3(所有测试的Ln的平均值),表明金属诱导的构象变化中的协同性。我们在所有LnIII的滴定曲线中观察到轻微的不对称性(图10A),表明存在两组位点(也得到了通过监测LanM的唯一Tyr残基Y96的固有荧光的滴定支持)。然而,只有在LaIII的情况下,两组位点才能得到充分分辨,以提供可接受的拟合误差;因此,对于除LaIII以外的所有LnIII,我们的报告符合具有一组位点的结合模型。有趣的是,在最低浓度下诱导LanM的构象变化的LnIII,即LaIII-SmIII(图9),也是仅有的在体内诱导来自xoxF1启动子的表达并激活扭脱甲基杆菌XoxF的Ln,这也许表明LanM可能涉及细胞中前面Ln和后面Ln的辨别。
表3.来自用LnIII和CaII对LanM和LanM(4P→4A)进行的拟合CD滴定的表观Kd、希尔系数(n)和222nm处摩尔椭圆率的变化(Δ[θ])。通过组合来自至少3次独立滴定[2次用于NdIII-LanM(4P-4A)]的标准偏差和如所述计算的误差来确定不确定度。在元素周期表中ErIII的右侧,在确定LnIII-EDDS CD滴定终点中的不确定性太大而无法可靠地确定Kd。LaIII的数据适合于两阶段,但是对于其它金属离子来说第二阶段不能很好地分辨。
图9示出了相对于有效离子半径绘图的LnIII-LanM配合物(Ln=La、Nd、Sm、Gd、Tb、Ho、Y)的Kd,app值。
图10表明LanM对前面LnIII表现出相对于CaII的108倍的选择性,而这通过替换LanM的EF手Pro残基而改变。使用CD光谱在多种螯合剂缓冲的游离金属离子浓度下监测[θ]222nm,并将数据拟合到希尔方程中以确定Kd,app(表3)。图15A:LaIII-LanM。图15B:CaII-LanM(未缓冲的CaII)。图15C:LaIII-LanM(4P→4A)。图15D:CaII-LanM(4P→4A)。
与LnIII相反,LanM对CaII的响应非常弱,因此用未缓冲的CaII进行CaII滴定。CaII诱导了CD光谱中与LnIII相似的变化,但是幅度稍小并且Kd,app为710±30μM且n=3.0±0.2(图10B,表3)。因此,相对于CaII,LanM在对LnIII的构象响应中表现出显著的~108倍选择性。这种选择性显著大于其它表征的含EF手的蛋白质;例如,相对于CaII,CaM对TbIII仅表现出~103倍的选择性,并且wt大肠杆菌半乳糖结合蛋白的EF手(第9位Gln)表现出相对于LnIII的<10倍选择性,并且在第9位进行Asp或Glu替换时仅表现出100至200倍的选择性。
LanM的保守Pro残基的突变恢复了较低浓度下的CaII响应。由于我们的CD来源的Kd,app值反映了构象变化,但不一定是用于金属结合的固有Kd,所以我们通过等温滴定量热法(ITC)评估了CaII结合(表4)。结合变化和构象变化二者可能有助于ITC等温线,但实验是在40μM LanM下进行的,远低于CaII的Kd,app,以使来自构象变化的影响最小化。使用具有Kd=2.5μM和2.8±0.4位点的吸热阶段和具有Kd=40μM和7.2±0.9位点的放热阶段的2组非相互作用位点的模型,获得了与我们数据的最佳拟合。虽然需要进一步的分析来建立完整的模型,但我们对这些结果的解释是CaII最初与3个EF手(也许是EF1-3)结合而不诱导构象变化,随后多个进一步的结合事件触发构象响应。因此,最初的CaII结合似乎与野生型(wt)LanM中的结构转变脱钩。为了测试这种脱钩(据我们所知在其它含EF手的蛋白质中未观察到)是否可能与LanM的EF手第2位的不寻常的保守Pro(“Pro2”)相关,我们将所有四个Pro2残基突变为Ala,这是典型EF手中此位置的常见残基。这种“4P→4A”变体的SEC表明,Pro→Ala突变显著改变了apo状态(但不是holo状态)下的蛋白质构象(表3)。LanM(4P→4A)保留了wt LanM对LnIII和CaII的全部摩尔椭圆率变化,但是其表现出改变的金属结合特性。在CD滴定中,虽然LanM(4P→4A)相对于wt LanM的5至10倍低的浓度响应LaIII和NdIII(图10C,表3),但是突变体以300倍低的浓度响应CaII响应,Kd,app=2.6±0.3μM(图10D,表3)。有趣的是,该值类似于通过ITC对CaII与wt LanM结合的第一阶段测得的Kd。不幸的是,我们通过ITC获得CaII-LanM(4P→4A)的固有Kd的尝试由于复杂的结合等温线和构象变化的贡献而尚未成功,因此必须采用专门的方法,例如流动透析(flow dialysis)。然而,LanM的EF手中Pro残基的替换显然使该蛋白质在构象上对CaII显著更加敏感。
表4.通过ITC评估的CaII与wt LanM结合的热力学参数。条件:细胞中40μM wtLanM,注射器中4.0mM CaII,缓冲液B,25℃。将数据拟合到具有两组非相互作用位点的结合模型。
从这些Ka计算出的Kd范围:1.6-5.7μM(位点1),28-60μM(位点2)。
K<sub>a</sub>(M<sup>-1</sup>) | n | ΔH(kJ mol<sup>-1</sup>) | ΔG(kJ mol<sup>-1</sup>) | ΔS(J K<sup>-1</sup>mol<sup>-1</sup>) | |
位点1 | (4.1±2.3)×10<sup>5</sup> | 2.8±0.4 | 1.4±0.5 | –31.7±11.4 | 111±5 |
位点2 | (2.6±0.9)×10<sup>4</sup> | 7.2±0.9 | –11.0±3.2 | –25.0±10.4 | 47±14 |
LanM,高选择性的Ln结合蛋白。我们对LanM的表征揭示,自然界已经改编了EF手的普遍存在的CaII结合框架,以便以比CaII高的亲和力和选择性与LnIII结合。尽管金属离子特性(例如离子半径和电荷)可能有所贡献,但是我们的数据表明,LanM不会那么多地抑制CaII结合(与专用的含CaII结合EF手的蛋白质的亲和力相比),因为其确实抑制了由该结合引起的构象响应。目前尚不清楚LnIII与LanM的结合是否也是如此,但是因为仅需要皮摩尔的LnIII来触发构象变化,所以这个问题对细胞的重要性可能比CaII响应性是否最小化要低(考虑到后者离子的丰度)。LanM的保守Pro残基及其不寻常的EF手的其它特性实现此壮举的详细机制将在本文其它地方进一步讨论。
除了LanM的Pro2残基在蛋白质对LnIII(相对于CaII)的构象响应的高选择性中的重要性以外,两个其它潜在的贡献因素是离子半径和电荷。LanM表现出与较小的后面LnIII相比稍微优先于较大的前面LnIII(图9),表观Kd的范围从对于LaIII(对于配位数6,有效离子半径为表6)的5pM到对于HoIII 的25pM,后者是详细研究了的最小LnIII。CaII的有效离子半径正好在该范围内类似于PrIII的。因此,尽管离子半径可能解释了对一种Ln比对另一种的优先响应,但其似乎对于LanM对LnIII(相对于CaII)的选择性贡献很少。
类似地,对LnIII(相对于CaII)的构象选择性为108(并且在亲和力方面的选择性为至少106),比CaM(~103)或某些工程EF手肽(~50)的大得多,表明LnIII比CaII更高的电荷也不足以解释LanM的Ln选择性。Falke及其同事的研究表明,含有单个EF手的大肠杆菌蛋白质的EF手第9位Asp或Glu残基的存在(如在LanM的所有EF手中发生的)相对于该位置的其它氨基酸将TbIII结合亲和力提高了10至100倍。类似地,可能LanM中LnIII配位的最接近的先例是镧系元素结合标签(LBT),即经工程化以便以更高的选择性与发光LnIII配位的CaII结合EF手,其在与LnIII离子配位的EF手的第9位也具有Glu残基。然而,LanM对于LnIII的Kd,app值比LBT(或据我们所知使用生物配体的Ln的任何其它配位基序)的Kd紧密~103-106倍,这取决于LnIII离子。总之,这些文献先例表明,LanM的第9位的Asp可能有助于该蛋白对LnIII的高度亲和力。对4D9N-LaMP1变体(见下文)的表征支持该观点,与wt相比,所述变体表现出更低的对CaII的表观Kd,但是更高的对LaIII的表观Kd。最后,相邻EF手融合以允许在金属与EF手结合时大量疏水性堆积的LanM的不寻常的结构(图17)可能也有助于蛋白质对稀土的高亲和力。如本文其它地方所讨论的,从我们的结果中得出的这些原理已用于设计对不同镧系元素或锕系元素具有增加或降低的选择性的LanM变体,并且其也可用于通过适当地突变合适的氨基酸来产生用于结合锕系元素离子(例如铀)的其它变体。换句话说,可以对LanM的同源物进行定制,以在不同镧系元素或锕系元素之间提供选择性。
表5.用于克隆和测序的引物
LanM在甲基营养菌中的保守性和LanM的生理作用。迄今为止,仅在几种甲基营养菌和恶臭假单胞菌(Pseudomonas putida)中表征了含Ln的酶。对恶臭假单胞菌KT2440基因组的BLAST分析未发现LanM同源物,但在预测的混合传感器组氨酸激酶/响应调节物(基因座WP_010954492)中鉴定出具有Pro2残基的假定EF手(DPDEDGFTICGD);这些观察结果促使人们探索具有Pro2残基的EF手是否更普遍地构成生物学中的Ln选择性配位基序,这可能有助于鉴定可利用Ln进行生长的新生物。然而,更重要的是,使用LanM序列作为查询的BLAST分析表明,具有至少一个含有Pro2标记的EF手的LanM样基因广泛分布在甲基杆菌属(Methylobacterium)和慢生根瘤菌属(Bradyrhizobium)基因组中。这些基因之一,来自水产甲基杆菌(Methylobacterium aquaticum)菌株22A的c02050,与LanM具有59%的序列同一性并且在其四个EF手中包含两个Pro2基序,其最近被证明诱导对LaIII的5倍响应(与鉴定LanM的生长条件一致)。未表征编码的蛋白质,并且没有证据表明其以这种相对于Ca和其它金属的选择性结合Ln。
在扭脱甲基杆菌基因组中,lanM与METAlp1785相邻,编码假定的TonB依赖性转运蛋白。TonB依赖性系统通常在金属获取(例如,FeIII-柠檬酸盐和FeIII-铁载体(FeIII-siderophore)摄取)中发挥作用,并且包含外膜转运蛋白和接收来自转运蛋白的货物的周质结合蛋白。确实,LanM来源传感器LaMP1已被用于表明,这些细菌分泌Ln结合分子(lanthanophore)以促进对前面Ln(La-Nd,和较小程度上Sm)的选择性摄取。此外,需要进一步的工作来确定LanM的生理功能,尽管其高度LnIII选择性的无序向有序转变指向一种功能:其中其对于仅在LnIII的存在下才会发生“活性”结构形成的细胞是关键的。
元素 | CN=6 | CN=7 | CN=8 | CN=9 | CN=10 | CN=12 |
Ca(II) | 1.14 | 1.20 | 1.26 | 1.32 | 1.37 | 1.48 |
Y(III) | 1.040 | 1.10 | 1.159 | 1.215 | ||
La(III) | 1.172 | 1.24 | 1.300 | 1.356 | 1.41 | 1.50 |
Ce(III) | 1.15 | 1.21 | 1.283 | 1.336 | 1.39 | 1.48 |
Pr(III) | 1.13 | 1.266 | 1.319 | |||
Nd(III) | 1.123 | 1.249 | 1.303 | 1.41 | ||
Sm(III) | 1.098 | 1.16 | 1.219 | 1.272 | 1.38 | |
Eu(III) | 1.087 | 1.15 | 1.206 | 1.260 | ||
Gd(III) | 1.078 | 1.14 | 1.193 | 1.247 | ||
Tb(III) | 1.063 | 1.12 | 1.18 | 1.235 | ||
Dy(III) | 1.052 | 1.11 | 1.167 | 1.223 | ||
Ho(III) | 1.041 | 1.155 | 1.212 | 1.26 | ||
Er(III) | 1.030 | 1.085 | 1.144 | 1.202 | ||
Tm(III) | 1.020 | 1.134 | 1.192 | |||
Yb(III) | 1.008 | 1.065 | 1.125 | 1.182 | ||
Lu(III) | 1.001 | 1.117 | 1.172 |
LanM的高度Ln选择性构象响应强烈表明,该蛋白质是甲基营养菌中新兴的“lanthanome”的成员,lanthanome由某些细菌和可能的其它生物体中参与Ln调节、摄取、运输、储存和利用的蛋白质和小分子组成。该网络的表征不仅丰富了我们对Ln离子的基本配位化学的理解;还将启发模型配合物以探测生物学上重要的Ln催化反应的化学过程,使得能够进行这些酶的电催化应用,以及为改造甲基营养菌或由其产生的蛋白质/小分子(例如LanM自身)的工作提供信息,以实现除了医学应用(例如,Gd结合的LanM或衍生物作为MRI造影剂,或者放射性Lu结合的LanM或衍生物作为放射性药物)之外那些相对难以获得但是在技术上越来越有用的元素的更可持续的提取和分离。
以下实施例旨在进一步说明本发明的某些优选实施方案,而本质上并非限制性的。本领域技术人员将认识或仅使用不超过常规实验就能够确定本文所述的特定物质和程序的许多等同物。
以下公开内容描述了为表征和测量LanM的多种性质而进行的实验。在这些实验中,镧系元素盐(氯化物或乙酸盐)的最低纯度为99.9%稀土金属含量。SmCl3获自AlfaAesar,TmCl3获自Strem,YCl3获自Acros,并且所有其它LnIII均获自Sigma-Aldrich。扭脱甲基杆菌(ATCC 14718,NCIB 9133)获自美国典型培养物保藏中心(American Type CultureCollection)。扭脱甲基杆菌AM1基因序列和基因组图谱获自BioCyc(https://biocyc.org)。引物和gBlock购自Integrated DNA Technologies(IDT)。分别用于克隆和重组蛋白质表达的大肠杆菌菌株[5α和BL21(DE3)]以及克隆试剂(限制酶、Q5 DNA聚合酶、OneTaq DNA聚合酶、T4 DNA连接酶和HiFi组装试剂盒、KLD Enzyme Mix)购自New EnglandBiolabs。PCR纯化和微量制备试剂盒(PCR cleanup and miniprep kit)来自Qiagen和Omega Bio-tek,并且凝胶提取使用来自Zymo Research的Zymoclean凝胶DNA回收试剂盒。Ni-NTA树脂购自Qiagen和Thermo Scientific。蛋白凝胶电泳使用自制或BioRad 4-20%梯度凝胶和Biorad Mini-Protean仪器,或Life Tech 16%Tris-甘氨酸凝胶和迷你凝胶仪器(mini gel apparatus)进行。自动化蛋白质色谱法使用GE Healthcare Biosciences AktaPure快速蛋白质液相色谱(FPLC)系统。使用石英比色皿(Starna Cells)在Agilent Cary60UV-可见分光光度计上获得UV-可见吸收光谱。使用Tecan Infinite M1000 Pro板读取器进行孔板分析。通过在Huck基因组学设施(Huck Genomics Facility)中测序来验证载体DNA序列,并在宾夕法尼亚州立大学(Penn State)的X射线晶体学和自动生物量热仪(X-rayCrystallography and Automated Biological Calorimetry Facility)进行CD和直接检测测量。为了使金属污染最小化,根据制造商的方案,将所有用于LanM实验的缓冲液用10g/L Chelex 100(BioRad,100-200目)处理>1小时,然后重新调节pH。所有蛋白质和金属溶液在获自Sarstedt的1.5mL微量离心管或15mL或50mL离心管中制备。
实验技术
扭脱甲基杆菌的生长。如Marx及其同事的描述制备MP培养基,只是将铁(如硫酸亚铁铵)从C7-金属溶液中除去并且在高压灭菌之前作为固体添加。培养基由以下组成:30mMPIPES(pH 6.75)、1.45mM K2HPO4、1.88mM NaH2PO4、8mM(NH4)2SO4、0.5mM MgCl2、20μM CaCl2、45.6μM柠檬酸钠、18μM(NH4)2Fe(SO4)2、1.2μM ZnSO4、1μM MnCl2、14μMNa2MoO4、1μM CuSO4、2μM CoCl2和0.33μM Na2WO4,补充有0.5%v/v甲醇。所有生长在30℃进行。将扭脱甲基杆菌从甘油储备液中划线到MP培养基/甲醇1.5%琼脂板上。使用单个菌落接种14mL聚丙烯培养管(BD Falcon)中的3mL MP培养基/0.5%甲醇培养物并且以200rpm摇动生长~2d。起始培养物(2mL)用于接种补充有1μM LaCl3的200mL MP-甲醇介质,并且使细胞生长至OD600~0.8,此时将培养物用于接种6L烧瓶中的包含1μMLaCl3的4×2L MP-甲醇培养基至OD600~0.02。使培养物生长至OD600~0.8-1.0。通过在4℃以7000g离心7分钟收集细胞,并在-80℃冷冻。每升培养物的典型产量为约1g细胞糊。
XoxF的纯化。所有操作在4℃进行。将来自8L扭脱甲基杆菌生长的细胞糊重悬于每10mL中5mL/g 20mM MES,pH 5.5(缓冲液A)和1个Roche Complete mini蛋白酶抑制剂片剂中。使混悬液通过14000psi的French压力室两次,并通过在4℃以30000×g离心20分钟沉淀出碎片。倾析出上清液,并在搅拌下经过在~15分钟将硫酸铵添加至40%饱和度(在4℃为226g/L)。进一步搅拌15分钟后,将混悬液在4℃以20000×g离心10分钟。倾析出上清液,并添加硫酸铵至80%饱和度(在4℃时另外258g/L),然后如上所述进一步搅拌并离心。离心后将沉淀重悬在最小体积(~4mL)的补充有0.25mM PMSF的缓冲液A中,并施加于用具有0.25mM PMSF的缓冲液A预平衡的2.5×16cm(80mL)Sephadex G50柱。通过跟随浅红色蛋白质条带收集级分,并使用板读取器基于A280nm合并含蛋白质的级分。使用Amicon Ultra10kDa MWCO离心过滤装置将合并的级分浓缩至5mL,并通过离心(14000×g,2分钟)除去不溶物。将上清液加载到GE Healthcare Akta Pure快速蛋白质液相色谱(FPLC)系统上的用缓冲液A预平衡的HiPrep SP FF 16/10柱(20mL柱体积,CV)上。将柱子用2CV的缓冲液A冲洗,并用缓冲液A中0-250mM NaCl的梯度经过10CV洗脱。以峰分级模式收集各级分(4mL),并在280nm、346nm(PQQ吸收)和413nm(细胞色素Soret带)处收集色谱图。流速为2mL/min。使用支持信息(Supporting Information)中描述的染料连接的测定(dye-linked assay)基于活性合并各级分(每个级分2-5μL)。活性以~110-150mM NaCl处的346nm峰洗脱。使用Amicon Ultra 30kDa MWCO离心过滤装置将合并的级分浓缩至2mL,并在缓冲液B(20mMMOPS、20mM乙酸盐、100mM KCl,pH 7.0)中加载到HiLoad 16/600Superdex 75pg柱(120mL)中。将柱子以0.75mL/min运行,收集1.5mL级分,然后得到280、346和413nm处的吸光度。XoxF在~48-53mL时洗脱出来,并且LanM在73-77mL时洗脱出来。基于对异源表达的蛋白质的后续研究,LanM的洗脱时间表明其与LaIII结合,但是蛋白质的纯度不足以进一步评估此观察结果。基于通过SDS-PAGE评估的纯度合并级分。使用30kDa MWCO过滤装置浓缩XoxF。使用通过ExPASy ProtParam工具获得的ε280nm=137mM-1cm-1(每单体)确定纯化的XoxF的浓度。A280nm/A350nm比率是10.2。为了产生纯化表(表7),使用Pierce BCA Protein Assay Kit(Thermo)以牛血清白蛋白作为标准品确定最终色谱步骤之前样品中的蛋白质浓度。来自8L培养物的XoxF的产量为2-3mg。
表7.来自8L扭脱甲基杆菌细胞培养物(~10g细胞糊)的XoxF的纯化
*添加硫酸铵至80%饱和度并离心后使沉淀重悬
染料连接的活性测定。根据Day和Anthony的方法,使用吩嗪硫代硫酸盐(PES)作为电子受体通过2,6-二氯酚靛酚(DCPIP)的还原来测定色谱级分和纯化的XoxF的活性。每个测定混合物(485μL)包含:100mM Tris,pH 9.0、15mM NH4Cl、1mM吩嗪乙基硫酸盐(PES)和100μM DCPIP。在室温(23℃)下以动力学模式在Cary 60UV可见分光光度计上进行测定,在600nm监测。将测定样品(1-10μL)添加到混合物中。存在大量的背景活性,尤其是在粗样品中;几分钟(1-5分钟)后,A600nm读数稳定并添加10μL 1M(4.0%v/v)甲醇以测量甲醇依赖性活性。使用测得的斜率(ΔAU/min)计算酶活性,以单位(U)报告,其中1U定义为开始反应后15至30秒之间每分钟还原的1μmol O2,对应于1μmol DCPIP还原/分钟。如下确定测定缓冲液中DCPIP的消光系数:将~3mM DCPIP的水性储备溶液稀释到20mM MOPS pH 7.0(pH 7.0下ε600nm=20600M-1cm-1)和100mM Tris pH 9.0中,然后比较吸光度值,得出ε600nm=22500M- 1cm-1。通过BCA测定来确定粗样品中的蛋白质含量。
对凝胶切片进行质谱分析以鉴定LanM。
a)样品制备,凝胶切片。使用干净的剃刀刀片将凝胶切片切成~1mm3块,并用约5个凝胶体积的含有50mM三乙胺碳酸氢盐(triethylammonium bicarbonate,TEAB)的50%乙腈(MeCN)在37℃20分钟洗涤三次。通过将凝胶切片在Eppendorf Thermomixer R中混合的情况下在含有5mM三(2-羧乙基)膦盐酸盐(TCEP)的200mM TEAB中于37℃孵育30分钟,然后在50mM TEAB、100mM碘乙酰胺中于37℃孵育15分钟来进行二硫化物的还原和Cys残基的烷基化。除去还原和烷基化剂试剂;将凝胶如上所述在50%MeCN、50mM TEAB中洗涤3次,并在纯MeCN中脱水。在Speedvac(Thermo)中除去了残留的MeCN。
b)蛋白水解。将1μg/μL的测序级胰蛋白酶(Thermo)在1mM HCl水溶液中的储备溶液用冷却的50mM TEAB稀释100倍,并使干燥的凝胶块在蛋白酶溶液中完全再水合。除去过量的蛋白酶溶液,并添加足量的50mM TEAB以覆盖凝胶。在37℃进行蛋白水解过夜,然后将TEAB溶液转移到新的微量离心管中。用三个50μL体积的50%MeCN、0.1%甲酸和一个50μL体积的纯MeCN提取肽;然后将这些溶液与TEAB溶液合并,并在Speedvac中干燥。将干燥的肽在10μL 2%MeCN、0.1%甲酸中重构以用于LC MS2分析。
c)Nano-LC MS2。使用2%水性MeCN、0.1%甲酸作为流动相,以5μL/min的流速将肽加载到Acclaim PepMap100捕集柱(100μm×2cm,C18,5μm,Thermo)上。在AcclaimPepMap RSLC柱(75μm×15cm,C18,2μm,Thermo)上以含有0.1%甲酸的水中2-35%MeCN的30分钟线性梯度分离肽。通过Dionex Ultimate 3000nano-LC系统(Thermo)以300nL/min输送梯度。使用‘Nth order double play’方法在LTQ Orbitrap Velos(Thermo)上获得质谱:在R 60,000处进行完整FT MS扫描,然后对具有CID活化作用的最强前体进行10次离子阱MS2扫描。仅选择电荷状态为2或更高的前体进行MS2;启用了单同位素前体选择,并且隔离窗口(isolation window)为2m/z。445.120030m/z的聚硅氧烷信号用作锁定质量;离子注入时间和自动增益控制目标值设置为默认值。
d)数据分析。使用两种不同的应用程序对质谱进行了分析:具有SEQUEST搜索引擎的Proteome Discoverer 1.3(P.D.1.3,Thermo)以及具有PEAKS DB和Spider搜索算法的PEAKS Studio(Bioinformatics Solutions,bioinfor.com)。在这两种应用程序中,选择半胱氨酸脲基甲基化(cysteine carbamidomethylation)(+57.021)作为静态修饰,并且选择甲硫氨酸氧化(+15.995m.u.)作为动态修饰;允许两个错过的切割;并且前体和片段的质量公差分别设置为15ppm和0.5Da。蛋白质序列数据库编译自Uniprot参考蛋白质组UP000009081,扭脱甲基杆菌(菌株ATCC 14718/DSM 1338/JCM 2805/NCIMB 9133/AM1)的,包含6233个序列和一个常见的污染物数据库(299个序列)。
来自大肠杆菌周质的具有C末端TEV/His6标签的LanM的构建、表达和纯化。
a)克隆。作为含有TEV蛋白酶切割位点和然后C末端的His6标签(GENLYFQGHHHHHH)(SEQ ID NO:8)的461bp gBlock基因片段获得扭脱甲基杆菌AM1 META1p1786,其使用IDT的在线密码子优化工具进行了密码子优化以用于在大肠杆菌中表达(表9)。为了制备插入物,将gBlock(250ng,10ng/μL)用NdeI和EcoRI-HF消化1小时,并通过在65℃孵育20分钟使酶失活。用NdeI和EcoRI-HF(各20U)将pET-24a(2μg,表8为用于该研究的所有质粒)消化1小时,并且在凝胶电泳(1%琼脂糖)之后,切下载体片段并使用Zymoclean凝胶DNA回收试剂盒(Zymoclean Gel DNA Recovery Kit)纯化。根据制造商的方案,使用T4 DNA连接酶将插入物连接到经消化的载体(5:1插入物:载体)中。通过菌落PCR(OneTaq Quick-Load)筛选转化子的插入物,并在宾夕法尼亚州立大学基因组学核心设施(Penn State Genomics CoreFacility)使用引物T7P(表5,本研究中使用的所有引物)通过DNA测序确认正确的插入物,得到pET24a-LanM-TEV/His。
表9.扭脱甲基杆菌AM1 LanM(META1p1786)(SEQ ID NO:2)和用于表达LanM的gBlock的DNA序列。编码信号肽Metl-Ala21的区域用双下划线显示,并且TEV蛋白酶识别序列和His6标签用下划线显示。
>META1p1786(SEQ ID NO:2)
>密码子优化的、C末端TEV和His6位点(SEQ ID NO:11)
>密码子优化的、N末端TEV位点、His6标签,来自pET28a(SEQ ID NO:12)
表8.本公开内容中使用的质粒
b)表达。用pET24a-LanM-TEV/His转化化学感受态大肠杆菌BL21(DE3)细胞,并铺板在含有50μg/mL卡那霉素(Km)的LB琼脂板上,并在37℃生长。单个菌落用于接种7mL LB(在所有生长培养基中具有50μg/mL Km),使其在37℃以200rpm摇动生长~16小时。该培养物用于接种补充有0.5mM MgCl2和0.1mM CaCl2的LB培养基的一个2L培养物(在6L烧瓶中),并且使培养物在37℃以200rpm摇动生长。在OD600nm~0.6,添加异丙基β-D-1-硫代吡喃半乳糖苷(IPTG,Amresco)至终浓度为0.2mM;进一步孵育3小时后,通过4℃以7000×g离心7分钟使细胞沉淀,每L培养物产生~2g细胞糊。
c)纯化。将细胞糊重悬浮于40mL/g的30mM Tris、1mM EDTA、20%蔗糖,pH 7.4(缓冲液C)中,并在室温搅拌20分钟。将混悬液在4℃以9000×g离心10分钟。倾析出上清液,并在4℃搅拌20分钟而将细胞沉淀重悬于每克原始细胞糊20mL 5mM MgSO4中,然后将混悬液在4℃以9000×g离心10分钟。倾析出上清液,添加0.05体积的1.0M Tris,pH 7.4,以及固体NaCl至100mM。将该溶液施加至在50mM磷酸钠、10mM咪唑、5%甘油,pH 7.0(缓冲液D)中预平衡的0.7×1.0cm(1.0mL)Ni-NTA琼脂糖柱。将柱子用30CV的含有100mM NaCl和0.25mM苯基甲基磺酰氟(PMSF)的缓冲液D冲洗,然后用15CV的50mM磷酸钠、250mM咪唑、5%甘油,pH 7.0洗脱(缓冲液E)洗脱。使用Amicon Ultra 15 3-kDa MWCO离心过滤装置将洗脱的蛋白质浓缩至1.5mL。
在HiLoad 16/600Superdex 75pg柱(GE Healthcare,120mL)上通过尺寸排阻色谱除去较高分子量的污染物,并将缓冲液交换成20mM MOPS、100mM KCl、1mM EDTA,pH 7.0(缓冲液F)。在以1.0mL/min进行柱平衡后,使用2mL毛细管定量环(capillary loop)将蛋白质加载到柱子上,并用1.2CV的缓冲液F以0.75mL/min对柱子进行洗脱,并以峰分级模式收集1mL级分(1mAU阈值)。LanM-TEV/His在54-63mL时洗脱出来。收集含蛋白质的级分并通过SDS-PAGE进行分析。使用Amicon Ultra 3-KDa MWCO离心过滤装置浓缩级分,并使用ε280nm=1490M-1cm-1(ExPASy ProtParam)估算蛋白质浓度。纯化产生了来自2L培养物的~1.4mgLanM-TEV/His。对LanM-TEV/His进行质谱。根据制造商的方案,使用0.5mL Zeba离心柱(Thermo Fisher)将LanM-TEV/His(~100μM,100μL)交换到水中。在宾夕法尼亚州立大学蛋白质组学和质谱学设施(Penn State Proteomics and Mass Spectrometry Facility)的Ultraflextreme质谱仪(Bruker Daltonics)上,以线性阳离子模式通过MALDI-TOF MS分析完整的蛋白质。
用于细胞溶质表达的LanM的克隆。作为380bp gBlock基因片段获得了缺少N末端信号序列并含有TEV蛋白酶切割位点(GENLYFQG)(SEQ ID NO:61)的扭脱甲基杆菌AM1META1p1786的可溶性结构域,其使用IDT的在线密码子优化工具进行密码子优化以用于在大肠杆菌中表达(表9)。用NdeI和EcoRI消化后,将gBlock插入到类似消化的pET-28a中,并且在宾夕法尼亚州立大学基因组学核心设施使用引物T7P通过DNA测序确认正确插入物,得到pET28a-His/TEV-LanM。
His/TEV-LanM的表达和纯化。用pET28a-His/TEV-LanM转化化学感受态大肠杆菌BL21(DE3)细胞,并铺板在含有50μg/mL Km的LB-琼脂板上,并在37℃生长。使用单个菌落接种100mL LB(在所有生长培养基中50μg/mL Km),使其在37℃以220rpm摇动生长~16小时。培养物(40mL)用于接种补充有0.5mM MgCl2和0.1mM CaCl2的LB的一个2L培养物(在6L烧瓶中),并且使培养物在37℃以200rpm摇动生长。在OD600nm~0.5,添加IPTG至终浓度为0.2mM;进一步孵育3小时后,通过在4℃以7000×g离心7分钟以使细胞沉淀,每升培养物产生~2.2g细胞糊。将细胞沉淀物在-80℃冷冻。
所有操作在4℃进行。将细胞糊重悬于含有2个Roche Complete mini蛋白酶抑制剂片剂、2U/mL DNA酶和0.25mM苯基甲基磺酰氟(PMSF)的缓冲液D中。使混悬液通过14000psi的French压力室两次,并通过在4℃以30000×g离心20分钟沉淀出碎片。倾析出上清液,并施加于在缓冲液D中预平衡的1.5×2cm(3.5mL)Ni-NTA琼脂糖柱。将柱子用20CV的含100mM NaCl的缓冲液D冲洗,然后用10CV的缓冲液E洗脱。使用Amicon Ultra 3-kDa MWCO离心过滤装置将洗脱的蛋白质浓缩至~10mL。以25mL总体积,通过在具有100μL~25μM TEV蛋白酶(由宾夕法尼亚州立大学的X.Zhang的馈赠)的50mM Tris、5mM二硫苏糖醇、1mMEDTA,pH 7.4中孵育16小时来从5mL的蛋白质切割His6标签和TEV识别序列。基于ε275nm=2800M-1cm-1(1个Tyr残基在标签中,并且1个在天然蛋白质序列中),消化期间的近似蛋白质浓度为150μM。然后用50mM Tris,pH 7.4将溶液稀释至125mL,并通过与上述相同的预平衡Ni-NTA柱,并用1.5CV的50mM Tris,pH 7.4冲洗柱子。通过离心过滤(Amicon Ultra 3kDaMWCO)将合并的流通液和洗涤液浓缩至1.5mL。
在HiLoad 16/600Superdex 75pg柱上通过尺寸排阻色谱除去较高分子量的污染物,并将缓冲液交换成缓冲液B。柱平衡后,使用2mL毛细管定量环加载蛋白质样品,用3mL缓冲液B冲洗,并用1CV的缓冲液B以0.75mL/min洗脱,收集到1.5mL级分(在峰分级模式下的1mAU阈值)。基于A280nm合并含LanM的级分(55-63mL),并通过离心过滤浓缩至<3mL。使用Slide-a-Lyzer透析盒(MWCO 3500)在室温将蛋白质相对于含有5gChelex-100的500mL缓冲液B透析过夜(~16h)(在搅拌1小时并且将pH校正至7.0之后)。以使用EMD MilliporeDirect Detect仪器确定的ε275nm=1400M-1cm-1确定蛋白浓度。纯化产生~15mg/L的培养物。除了使用缓冲的金属溶液进行XO滴定和Kd确定外,将所得Chelex处理的缓冲液用于所有后续实验。
因此,本公开内容的一个方面包括由核苷酸编码的分离的金属结合蛋白,所述核苷酸包含与SEQ ID NO:2的序列具有至少80%同一性的序列(参见表9)。在一个实施方案中,核苷酸包含与SEQ ID NO:2的序列具有至少85%、90%、93%、95%、97%、98%、99%或100%同一性的序列。例如,在一个实施方案中,核苷酸包含去除了SEQ ID NO:2的前21个核苷酸的序列。
具有His6标签的LanM的构建和纯化。通过使用引物His-LanM-NdeI-正向、LanM-EcoRI-反向、LanM-NdeI-正向或LanM-His-EcoRI-反向对pET28a-His/TEV-LanM中的LanM基因进行PCR扩增来产生具有N末端或C末端His6标签的构建体。在用NdeI和EcoRI-HF消化后,将插入物连接到类似消化的pET24a中,筛选并通过测序进行验证。将这些蛋白质类似于His/TEV-LanM进行表达和纯化,只是所用的柱子为8mL(1.5×4.5cm),无需进行TEV消化,并且用于Superdex 75色谱的缓冲液为20mM MOPS、20mM KCl、5mM乙酸盐、1mM EGTA,pH 7.0(缓冲液G)。对于His-LanM和LanM-His,纯化分别产生了15mg和23mg蛋白质/L培养物。
使用二甲酚橙(XO)的竞争性测定。比色皿含有500μL的20mM MES-KOH、20mM乙酸盐、100mM KCl,pH 6.1(缓冲液H,与10g/L Chelex 100一起搅拌1小时,然后调节pH),~7μM二甲酚橙,和0或~5μM LanM,向其中添加相同缓冲液中的625-1250μM LnCl3溶液的0.5或1μL等分试样。在每次实验之前,将比色皿用6N HCl洗涤,以使实验中金属污染的可能性最小化。对于使用蛋白质的实验,将缓冲液和蛋白质预混,并在添加XO之前获取光谱,以计算比色皿中的蛋白质浓度。每次添加LnCl3储备液之后获取240至800nm的光谱,直到~575nm处的LnIII-XO吸收特征没有进一步变化(λmax取决于实验中的Ln)。将针对溶液的体积变化校正的该波长下的吸收相对于金属离子浓度绘图。将使得A=A初始+0.1(A最终–A初始)的金属离子浓度(XO的10%饱和点)作为LanM上紧密结合位点饱和的点的估计。
圆二色光谱。使用在25℃恒温(thermostatted)的Jasco J-1500CD光谱仪和1mm光程石英CD比色皿(Jasco J/0556)收集LanM的圆二色性(CD)光谱。使用以下仪器设置在260至200nm扫描样品:1nm带宽,0.5nm数据间距,50nm/min扫描速率,4s平均时间。对于每种条件,采集三次扫描并且取平均值。对于用所有LnIII离子和CaII对LanM进行化学计量滴定,对含有在200μL Chelex处理的缓冲液B中的20μM LanM的添加有1-8当量的每种金属离子(来自缓冲液B中的1mM溶液)的比色皿进行滴定,并获得每个光谱。从样品光谱减去缓冲液空白光谱,并且在绘图之前针对体积变化对光谱进行校正。
缓冲的CaII溶液的制备。
a.缓冲储备液的制备。将所有缓冲金属滴定所用的缓冲液制成2×储备液:60mMMOPS、200mM KCl,pH 7.2(缓冲液I)。将固体溶解在400mL Milli-Q水中,并在室温与25gChelex 100树脂一起搅拌过夜。将所得溶液的pH调节至7.2,并将瓶填充至500mL的终体积。
b.CaII-EGTA“高钙”缓冲液的制备。使用改良自Tsien和Pozzan的方法的pH滴定监测CaII和EGTA的相对量来制备CaII-EGTA的浓储备溶液。在50mL的Sarstedt锥形管中,将EGTA(99%,3.8415g,10.1mmol)溶解在15mL含19mmol(1.0661g)KOH的Milli-Q水中。将CaCl2(1.397g,~9.5mmol)溶解在该溶液中,并将pH调节至7.3。向该溶液中添加CaCl2(20μL,1M,0.02mmol),注意到导致pH变化,并添加KOH(40μL,1M,0.04mmol)以使pH恢复至初始值。重复该过程直到每次添加CaCl2的pH变化为初始值的一半(9次添加或180μL的1MCaCl2)。将溶液的pH调节至7.2,并使溶液的最终体积为20.0mL,得到0.5M CaII-EGTA储备液(50×)。最终的CaII-EGTA缓冲液(20mL)包含:10mL 2×缓冲液I和400μL 50×CaII-EGTA储备液(10mM CaII-EGTA),用Milli-Q使其达到20.0mL。
c.“低钙”缓冲液(30mM MOPS、100mM KCl、10mM EGTA,pH 7.2)的制备。通过将0.07683g的EGTA(99%,0.2mmol)与~2当量的KOH溶解在8mL Milli-Q水中来制备此缓冲液。添加缓冲液I(10mL),并使溶液达到pH 7.2,并调节至20mL的终体积。
缓冲的LnIII-EDDS溶液的制备。乙二胺N,N′-二琥珀酸(EDDS)以~35%(~1M)的三钠盐水溶液(Sigma)获得。为了进行金属-蛋白质Kd确定,利用金属结合后游离配体CD信号的变化来制备1:1金属EDDS储备溶液。使用缓冲液H、水和EDDS,在Sarstedt 50mL锥形管中制备30mM MOPS、100mM KCl和(标称)10mM EDDS,pH 7.2的溶液(缓冲液J)。将此溶液(300μL)置于1mm光程CD比色皿中,并且用30mM MOPS、100mM KCl,pH 7.2中的从~1M储备溶液的10×稀释得到的~100mM YCl3、LaCl3、NdCl3、SmCl3、GdCl3、TbCl3或HoCl3的溶液进行滴定。在与上述相同的条件下,在260–215nm处获得CD光谱。以1.5-4μL的增量添加金属溶液,直到在滴定期间针对体积变化进行调节的220nm处的CD信号不再因添加金属而改变(1:1金属配体配合物)。根据拟合到滴定前半部分中点的线性回归线与信号恒定后的前三个点中的平均椭圆率的交点,计算出达到等当点所需的金属储备溶液的体积。假设商业储备液中的EDDS浓度为1M,我们确定了220nm处的摩尔椭圆率([θ]220nm,所有的单位均为deg cm2 dmol-1)为:+2490(EDDS)、–9500(YIII-EDDS)、–4300(LaIII-EDDS)、–5630(NdIII-EDDS)、–7750(SmIII-EDDS)、–6420(GdIII-EDDS)、–6980(TbIII-EDDS)和–9640(HoIII-EDDS)。为了制备1:1的金属:EDDS缓冲液,将10mL缓冲液H与200μL~1M EDDS溶液混合,并且从得到1:1金属:配体的滴定确定金属1M储备液的量。使用25μL的5M KOH将溶液的pH值调节至7.2,并且用水达到终体积20mL,制成“高Ln”缓冲液。使溶液稳定~1天,并且在将金属混合到预先准备的缓冲液H-EDDS-KOH溶液中后立即使用。
LaIII-EGTA溶液的制备。由于LanM对于LaIII的Kd太低而无法使用EDDS溶液(除了荧光滴定)精确测量,因此制备了LaIII-EGTA溶液。类似于用于制备CaII-EGTA的pH滴定方法可能无法使用,这是因为Ln盐具有强的路易斯酸度,其掩盖了EGTA释放质子引起的pH改变。使用XO的UV-vis信号开发了另一种方法,以将金属储备溶液归一化至~1.0MEGTA溶液。在Milli-Q水中用2当量(~20mmol)KOH制备10mL的~1.0M EGTA的储备液。使该溶液达到pH7.2,并用水稀释至10mM。在添加最小体积的6.0N HCl的缓冲液H中制备LaCl3的~1M储备溶液,并将溶液无菌过滤以除去任何沉淀物。将该溶液稀释至10mM。比色皿含有470μL缓冲液H、25μL~10mM EGTA和5μL~7mM XO。将~10mM LaCl3溶液以1μL的增量滴定到比色皿中,并监测A579nm。由于LaIII-XO的Kd比LaIII-EGTA的高得多,因此以La:EGTA相等作为A579nm的增量超过滴定结束时总变化的2%的点。最终的LaIII-EGTA缓冲液(20mL)包含:10mL 2×缓冲液H、200μL~1M EGTA和适量的~1M LaIII储备液,其由得到等摩尔量的金属和EGTA的滴定确定,并且在将pH调节至7.2后,用Milli-Q水使其达到20mL。还根据该方案来制备了用于LanM(4P→4A)的CD滴定的NdIII-EGTA溶液。
通过CD光谱法的Kd确定。将LanM的浓溶液(~2mM)分别在高Ln缓冲液和缓冲液J中稀释至15μM。将这两种蛋白质溶液在Sarstedt管中以不同的比例混合,得到多种游离金属浓度(如下所述计算),每个样品为200μL。将相同比率的高Ln缓冲液和缓冲液J(不含蛋白质)混合在一起,得到用于CD实验的空白样品。将样品在室温孵育~1小时,以使其平衡,然后在25℃收集CD光谱。从LnIII-LanM光谱中减去每种高Ln:缓冲液J比率的空白光谱,并且[θ]222nm相对于游离金属浓度绘图。为了确定LaIII-LanM(4P→4A)的Kd,溶液未在1小时内平衡,因此在收集数据之前将溶液孵育过夜。为了确定CaII-LanM的Kd,将未缓冲的CaII等份添加到200μL的15μM LanM中。对于涉及EGTA缓冲金属的滴定,单个空白光谱是足够的,因为EGTA在该光谱区域中没有CD信号。所有曲线拟合在Origin 2018(OriginLab Corporation)中进行,至具有一组或两组独立位点的希尔方程。
用于Kd确定的游离金属浓度的计算。使用以下等式确定“低金属”和“高金属”缓冲液的每种混合物中游离金属离子(CaII或LnIII)的浓度[M游离]:
[M游离]=(Kd,M[ML])/[L] (1)
其中[L]是未与M结合的所有EDDS或EGTA物质的浓度,[ML]是金属离子结合的EDDS或EGTA的浓度,并且Kd,M是配体对于M的有效Kd,定义为
Kd,M=[1+10(pKa1–pH)+10(pKa2–pKa1–2pH)]/KM (2)
在等式2中,pKa1和pKa2是L的第一和第二pKa,其通过向每个公开值增加0.11个单位而针对0.1M的离子强度进行校正。pH是缓冲液pH,并且KM定义为:
KM=[ML]/([M][L]) (3)
由于配体的浓度(10mM)远大于蛋白质浓度(15μM),所以每个样品的等式1近似于等式4,其中V高和V低是混合在一起的高金属溶液和低金属溶液的体积:
[M游离]=Kd,M·V高/V低 (4)
必须注意,固有Kd可能低于此处报告的表观Kd。此外,由于在这些计算中未考虑稀土离子催化的水解(其会降低游离金属浓度),因此滴定实验中的真实游离金属浓度和因此真实Kd可能比此处计算的要小,特别是对于路易斯酸性更高的后面LnIII和YIII(即LanM的金属亲和力和选择性相对于其它金属离子如CaII比指出的甚至更高)。
用于Kd确定的误差分析。对于大多数滴定,使用不同蛋白质样品或缓冲的高金属溶液进行的重复之间的误差通常很小(<1pM)。因此,我们认为在我们的Kd测量中最大的不确定性来源可能是对用金属离子对EDDS进行滴定的终点的判断。例如,用~100mM GdCl3储备溶液对300μL的~10mM EDDS进行滴定会在添加30.8-33.1μL金属储备溶液时达到终点,这取决于用于确定终点的线性回归线中包含的点的范围(参见“缓冲的LnIII-EDDS溶液的制备”)。用其它金属离子进行滴定也显示出类似的不确定性。为了确定这些终点范围对Kd确定的影响,我们基于这些终点(30.8和33.1μL)中的每一个制备了“高Gd”溶液,并且如所述进行了LanM-His的滴定。对这些数据的拟合分别产生了16pM和14pM的表观Kd。因此,我们得出结论,金属-EDDS滴定终点确定中的不确定度为约±10%。鉴于终点确定中的类似不确定性,该值对于研究的所有Ln是类似的。尽管La-EGTA和Nd-EGTA滴定并未使用EDDS进行标准化(如上所述),但我们估计在这种情况下判断滴定终点也存在类似的不确定性。将这些计算出的误差与实验重复之间的误差相组合,并且将这些组合值报告为不确定性。
LanM(4P→4A)的构建、表达和纯化。作为与wt蛋白相同的380bp gBlock基因片段获得了四重突变体LanM P36A/P60A/P85A/P109A,只是P36和P60的CCG密码子突变成了GCG并且P85A和P109A的CCT密码子突变成了GCT。如对于wt LanM那样,使用NdeI和EcoRI位点将gBlock连接到pET-28a中,产生了pET28a-His/TEV-LanM(4P→4A)。使用引物LanM-正向和LanM-His-反向,将该质粒用作模板以产生具有C端His6标签的LanM(4P→4A)-His。将该蛋白类似于LanM-His进行表达和纯化,并且具有类似产率。
荧光光谱法。使用Varian Cary Eclipse分光光度计在23℃进行荧光实验。激发波长为278nm,并在300-400nm处收集发射数据,其中激发和发射缝隙为5nm,步长为1nm,平均时间为0.5秒。所有样品均为600μL,并在光程为10mm的半微石英荧光计池(Starna Cells)中制备。对于用LaIII和GdIII对LanM-His进行的化学计量滴定,比色皿含有在缓冲液B中的15μM LanM-His,从15mM储备溶液向其中滴定0-8当量的金属离子,所述储备溶液由如上所述针对EDDS标准化的~1M溶液制备。为了进行滴定以确定Kd,app值,如对于CD实验所述在多种游离LaIII浓度下制备样品,只是每个样品为600μL的10μM LanM-His,并且使用LaIII-EDDS。对每个滴定点的两次扫描取平均值。所有样品在减去缓冲液B的空白光谱之后进行分析。
等温滴定量热法。使用MicroCal Auto-iTC200仪器通过ITC分析CaII与wt-LanM的结合。所有实验在25℃在来自透析程序的Chelex处理的缓冲液B中进行。所有溶液在实验前均已脱气。ITC细胞包含40μM wt-LanM。滴定剂注射器含有在相同的缓冲液中的4.0mMCaCl2。滴定设置如下:600rpm搅拌速度,60s初始延迟,5μcal/s参考功率,以及每次进样之间间隔180s。滴定由第一个0.2μL进样然后48×0.8μL进样组成。通过将相同的金属溶液滴定到没有蛋白质的含细胞的缓冲液中来确定稀释热。在分析之前,从反应热中减去这些数据。使用MicroCal Origin将结果数据拟合到具有两组非相互作用位点的制造商提供的模型中,以对于每组位点i获得位点数(ni)、缔合常数(Ki)、结合焓(ΔHi)和熵变(ΔSi),从其可以计算自由能变化(ΔGi)。软件包随附的其它具有顺序或非顺序结合的模型均未产生被认为可以接受的拟合。
用于LaMP1研究的一般考虑。除非另有说明,否则化学试剂获自Sigma-Aldrich,以最高纯度获得。所有稀土元素盐(氯化物或乙酸盐)具有最低纯度99.9%的稀土金属含量。所有均获自Sigma-Aldrich,只是SmCl3和ScCl3来自Alfa Aesar,TmCl3来自Strem,并且YCl3来自Acros。引物订购自Integrated DNA Technologies(IDT)。分别用于克隆和重组蛋白质表达的大肠杆菌菌株[5α和10β]以及克隆试剂(限制性酶、Q5 DNA聚合酶、OneTaq DNA聚合酶、T4 DNA连接酶)获自New England Biolabs。PCR纯化和微量制备试剂盒(PCR cleanupand miniprep kits)来自Qiagen和Omega Bio-tek,并且凝胶提取使用来自Zymo Research的Zymoclean凝胶DNA回收试剂盒。Ni-NTA树脂购自Thermo Scientific。使用LifeTech16%Tris-甘氨酸凝胶和迷你凝胶仪器进行蛋白质凝胶电泳。自动化蛋白质色谱法使用GE Healthcare Biosciences Akta Pure快速蛋白质液相色谱(FPLC)系统。使用石英比色皿(Starna Cells)在Agilent Cary 60UV-可见分光光度计上获得UV-可见吸收光谱。使用Tecan Infinite M1000 Pro板读取器进行孔板分析。
LaMP1和LaMP1(4P→4A)的构建。使用引物ECFP-LanM-SphI-正向和Citrine-LanM-SacI-反向分别从pET24a-LanM-TEV/His和pET28a-His/TEV-LanM(4P→4A)扩增LanM和LanM(4P→4A)插入物。使用SphI和SacI(10U/μg)消化PCR产物并纯化。类似地消化pBAD-D2(Addgene#37470),并且在琼脂糖凝胶电泳之后,切出并纯化载体片段。使用T4 DNA连接酶根据制造商的方案将插入物连接到消化的载体中(5:1,插入物:载体)。通过菌落PCR筛选转化子的插入物,并在宾夕法尼亚州立大学基因组学核心设施使用引物pBAD-F、pBAD-R和ECFP-mid通过DNA测序确认正确的插入物,得到pBAD-LaMP1和pBAD-LaMP1(4P→4A)。
LaMP1和LaMP1(4P→4A)的表达和纯化。用pBAD-LaMP1或pBAD-LaMP1(4P→4A)转化化学感受态大肠杆菌10β细胞,并铺板在含有100μg/mL氨苄青霉素(Amp)的LB-琼脂板上,并在37℃生长。使用单个菌落接种100mL LB(在所有生长培养基中100μg/mL Amp)并在37℃以200rpm摇动生长~16h。对于该培养物,将40mL用于接种6L LB培养基烧瓶中的一个1.5L培养物。使培养物在37℃以200rpm摇动生长。在OD600nm~0.5,将培养物置于4℃30分钟,然后添加L-阿拉伯糖(Oakwood Chemical)至终浓度为500μM。在23℃以200rpm摇动进一步孵育16小时后,通过在4℃以7000×g离心7分钟来使细胞沉淀,得到6-7g细胞糊。
对于传感器纯化,所有操作在4℃进行。将细胞糊重悬于含有0.4mM苯基甲基磺酰氟(PMSF)的5mL/g的50mM磷酸钠、10mM咪唑、5%甘油,pH 7.0(缓冲液A)中。使混悬液在14000psi下通过French压力室两次。通过在4℃以40000×g离心30分钟来沉淀出碎片。倾析出上清液,并施加至在缓冲液A中预平衡的1.5×4.5cm(8.0mL)Ni-NTA琼脂糖柱。将柱子用15CV的缓冲液A冲洗,然后用3CV的50mM磷酸钠、250mM咪唑、5%甘油,pH 7.0(缓冲液B)洗脱。使用Amicon Ultra 30-kDa MWCO离心过滤装置将洗脱的蛋白质浓缩至1.5mL。使用2mL毛细管定量环将蛋白质施加至HiLoad 16/600Superdex 75pg柱(GE Healthcare),柱子用1.2CV的30mM MOPS、100mM KCl,pH 7.2(缓冲液C)以0.75mL/ml运行,收集1.5mL级分(在峰分级模式下1mAU阈值)。由A280nm、A434nm、A515nm判断包含LaMP1或LaMP1(4P→4A)的级分,合并在45-58mL[LaMP1]或45-52mL[LaMP1(4P→4A)]时洗脱出的级分,并通过离心过滤浓缩至~1.0mL。使用ε515nm=77000M-1cm-1确定蛋白质浓度。纯化产生~38mg/L培养物。
LaMP1传感器的体外表征。如所述的,在缓冲液C中制备乙二胺N,N′-二琥珀酸(EDDS)缓冲的LnIII(LaIII–ErIII)溶液。为了将LaIII缓冲在10-10至10-6M游离金属离子浓度范围内,使用三亚甲基二次氮基四乙酸(trimethylenedinitrilotetraacetic acid,TMDTA)。将LaMP1在金属化和仅螯合剂的缓冲液中稀释至500nM,并且将这些溶液以多种比率合并,以使每个滴定点的最终体积为100μL。孵育15分钟后,使用433nm激发、450-550nm发射和130的增益在Greiner Cellstar 96孔半区μClear板中进行荧光测量。在30mM MOPS、100mMKCl、20mM乙酸盐,pH 7.2(缓冲液D)中进行未缓冲的滴定。从ECFP(475nm)和citrine(529nm)的荧光发射峰的强度计算出FRET比率F529nm/F475nm。
缓冲的LaIII-TMDTA溶液的制备。通过将0.404mmol TMDTA(99%)(包含额外0.011%质量的TMDTA以补偿99%的纯度)和1.01mmol KOH溶解在缓冲液C中以得到10mL总体积来制备20mM TMDTA的20mL储备溶液。在临使用前通过将等摩尔量的来自缓冲液C中的0.9M LaCl3储备溶液(如所述的通过针对EGTA滴定来校准)的LaIII添加到2.5mL的20mMTMDTA制备液中来制备1:1LaIII-TMDTA。使用KOH将所得溶液的pH调节至7.2,并且使用缓冲液C调节至5mL的体积。最终溶液为30mM MOPS、100mM KCl、10mM TMDTA、10mM LaCl3,pH7.2。将该缓冲液以多种比率与由相同TMDTA储备液制备的含10mM TMDTA的缓冲液C组合,以产生一定范围的游离LaIII浓度。如所述的,使用25℃、I=0.11和pH 7.2计算游离LaIII浓度。
使用缓冲液C中的5nM LaMP1进行检测限测定。将板读取器设置为250的增益和200Hz的闪烁频率。使用缓冲液空白对缓冲液对信号的贡献做减法。
表10.用于传感器研究的质粒。
表11.用于传感器实验的克隆和测序的引物*
*限制位点具有下划线
表12.传感器的DNA序列
ECFP具有下划线,citrine具有双下划线
>LaMP1(SEQ ID NO:4)
4p4a传感器(SEQ ID NO:5)
传感器
本公开内容的另一方面包括用于检测稀土元素的传感器。传感器概念利用了LanM的金属结合位点对稀土元素的高亲和力和选择性,和/或蛋白质表现出的大的金属依赖性构象变化。在此处描述的具体实施方案中,传感器可以构建为包含LanM作为两种荧光蛋白之间的接头,从而在与稀土元素结合后在LanM中发生构象变化时,调节两种荧光蛋白之间的共振能量转移(FRET)效率。传感器蛋白在本文中称为LaMP1。选择两种荧光蛋白,使得第一荧光蛋白以一定波长发射,第二荧光蛋白在该波长下被激发并且以更高的波长发射。例如,第一蛋白质可以是青色荧光蛋白,并且第二蛋白质可以是被青色激发的黄色荧光蛋白。因此,当两种蛋白质足够接近且处于合适的方向时,由第一蛋白质发出的青色被第二蛋白质吸收,其然后发出黄色。另一方面,当两种蛋白质彼此间分隔或处于不太合适的方向时,第一蛋白质发出青色,但不能有效地激发第二蛋白质,并且获得较少的黄色信号。
利用我们对LanM的稀土元素结合特性的发现和表征,以及LanM的Y(III)结合形式的NMR分辨率结构,我们将LanM用作比例的基于蛋白质(遗传编码)的稀土荧光传感器的基础,我们将该荧光传感器称为LaMP1(基于镧调蛋白的蛋白质传感器1)。LaMP1是首个针对稀土的同类产品,并且已表明这种和相关的构建体可能是广泛用于工业、环境和生物样品中稀土检测的生物技术。为了构建LaMP1,我们从Tsien及其同事开发的基于钙调蛋白的传感器D2开始,该传感器由作为FRET对的C末端截短的增强型青色荧光蛋白(ECFP)和citrine(一种黄色荧光蛋白)组成。我们用LanM(Ala22-Arg133)(信号肽切割后的全长蛋白)替换了D2的钙调蛋白和M13肽成分,从而产生了LaMP1(图11)。在体外测定中,LaMP1对所有稀土元素表现出强的7倍比例FRET响应,对于LnIII和YIII的表观解离常数(Kd,app)在皮摩尔范围内,始终仅比天然LanM的弱~2倍(表13,图16)。通过圆二色光谱法测量的LaIII-LaMP1的Kd,app与FRET得出的值一致,这表明LaMP1经历了与LanM本身相似的构象变化。我们用于滴定用于这些测定的螯合剂乙二胺N,N'-二琥珀酸(EDDS)的方法不能用于校准Tm、Yb和Lu的溶液;然而,我们基于Kd,app和离子半径之间的关系预测Kd,app值在40-50pM范围内。传感器也响应ScIII,但是未确定Kd,app(图16D)。在LaIII的情况下,我们在使用EDDS或三亚甲基二次氮基四乙酸(TMDTA)缓冲的或没有螯合剂的10-13M至10-2M的整个范围内的游离金属浓度下测试了荧光响应。在未缓冲的方案(>1μM)之前,在高于10-10M没有观察到显著的额外荧光响应,这可能对应于基于我们先前对LanM的分析得出的金属与EF4的结合(图16B)。
图11示出了LaMP1的设计。该传感器包含ECFP(1-228)、LanM(22-133)和citrine。使用PyMOL从PDB代码1CV7(ECFP)导出荧光蛋白图像。表13显示了LnIII-LaMP1和CaII-LaMP1的Kd,app滴定(0.5μM传感器,pH 7.2)的滴定数据。使用EDDS缓冲Ln(La-Er)和Y的游离金属浓度。将数据拟合到一组位点的希尔方程。
表13:来自用缓冲的LnIII和CaII(25℃,pH 7.2)对LaMP1进行拟合荧光滴定的表观Kd、希尔系数(n)和FRET比率的变化倍数。通过组合来自三次滴定的标准偏差来确定不确定性,并且将不确定性在金属-EDDS溶液中校准,如参考文献1中所述。在周期表中ErIII的右侧,确定LnIII-EDDS CD滴定的终点中的不确定性太大而不能可靠地确定Kd。注意,这些数据不包括在微摩尔范围的金属离子浓度内发生的FRET比率的额外增加。
图16显示了500nM LaMP1对0-4(黑-红)当量LaIII(λex=433nm)的响应。(B)LaMP1的FRET比率(F529nm/F475nm)作为EDDS或TMDTA缓冲的或者未缓冲的游离LaIII浓度的函数。(C)LnIII-LaMP1的表观Kd相对于LaIII–ErIII和YIII的离子半径的图。(D)LaMP1的金属选择性。500nM LaMP1对以下的响应倍数:5μM LaIII–LuIII;10μM ScIII、YIII和FeIII;100μM CuII;或1mMAlIII、MnII和CaII。
LaMP1还表现出对CaII的荧光响应,但是Kd,app为1.2mM,远高于可能的生理水平,而FRET响应仅为3倍(表13)。然而,我们注意到,此测定受到CaII浓度>10mM时荧光淬灭的限制,这可能掩盖了进一步的FRET增加。我们还针对浓度与水性环境样品(例如矿山浸出液)潜在相关的常见金属离子FeIII、AlIII、MnII和CuII测试了LaMP1,并且发现几乎没有或没有响应(图16D)。在更高的浓度下,FeIII淬灭了荧光,并且传感器显示出对AlIII和MnII适度响应,但是全部被5μM LaIII超过(图12)。生物学相关离子MgII、Na+和K+的干扰也最小(图12)。因此,与LanM本身一样,相对于CaII和其它常见金属离子,LaMP1对LnIII和YIII表现出高选择性。
图12显示了相对于选择的常见一价、二价和三价金属离子,LaMP1对LnIII具有选择性。(A)在不存在(白色条)或存在(阴影条)5μM LaIII的情况下,将LaMP1(0.5μM)用环境样品中具有潜在干扰的指定金属离子孵育。(B)在不存在(白色条)或存在(阴影条)4当量LaIII的情况下,将LaMP1(0.5μM)用缓冲液C中多种浓度的MgCl2孵育(Apo=无MgII)。尽管LaMP1在不存在LaIII的情况下表现出对MgII的轻微响应,并且在LaIII的存在下具有轻微干扰,但是细菌MgII水平通常严格控制在1-2mM左右,因此体内干扰可能很小。C)Na+和K+对LaMP1响应的影响(30mM MOPS,pH 7.0,缓冲液补充有指定浓度的NaCl或KCl)。已知氯化物在100mM Cl–,pH7.0将YFP荧光淬灭约25%。因此,观察到的干扰很可能是由于Cl–结合,而不是Na+或K+结合。
在板读取器荧光测定(5nM LaMP1)中,LaMP1在1分钟内的检测极限是10nM LaIII(图13)。LaMP1的性能优于以前报道的选择性检测Ln的方法。He及其同事设计了一种细菌双组分系统,以通过引入镧系元素结合标签肽序列来检测Ln。生长6小时后,该系统对1μMTbIII表现出3倍的荧光响应和对200nM TbIII表现出较小但显著的响应,但对50μM CaII也有2倍响应。Skovran,Martinez-Gomez及其同事最近报道了一种具有在xox1启动子的控制下的荧光蛋白基因的扭脱甲基杆菌菌株,其对2.5nM LaIII具有响应,但是需要数小时的孵育时间;此外,该启动子仅响应于La-Sm。基于偶氮砷-III染料的比色法的检测限为~500nM,但是仅可靠地响应于La–Eu。因此,LaMP1是用于检测所有REE的独特、快速、选择性和高度敏感的工具。
图13显示了在荧光板读取器测量中LaMP1检测限的确定(**p<0.01)。
使用pH 6.0的EGTA缓冲的PrIII溶液和LaMP1研究了LanM的金属结合亲和力的pH依赖性。该滴定的表观Kd值为26pM,FRET变化(R/R0)为2.7。pH对表观Kd的较小影响(与图16C相比)表明LanM在较低pH时保留了蛋白质稳定性和对REE的高亲和力,直到负责金属配位的羧酸配体质子化,其可能在pH~3时发生。在酸性pH,此功能对于潜在的REE感测、提取和分离应用非常重要。pH 6.0时的FRET变化小于pH 7.2时的FRET变化可能与citrine生色团的部分质子化(pKa~5.7)有关,这将减少citrine荧光,而ECFP荧光在此pH不受影响,或有稍微不同的构象变化。
我们还产生了LaMP1的4P→4A类似物。反映LanM(4P→4A)对比于LanM的特性,LaMP1(4P→4A)的荧光响应与LaMP1的荧光相应相似,并且对于LaIII表现出稍低的Kd,app(图14),但其对CaII的响应截然不同,存在两个阶段,Kd1,app=1.6±0.1μM,并且Kd2,app=63±9μM(图14)。与LaMP1相比,LaMP1(4P→4A)还表现出对MnII和CuII的稍微更大响应(图15)。两种传感器的最小FRET比率和整体FRET响应几乎相同。由于其对较低浓度的LaIII以及可能所有其它稀土元素的响应性,LaMP1(4P→4A)也可能是检测水性样品中稀土元素的有用工具。
图14显示了使用LaIII和CaII对LaMP1(4P→4A)进行Kd,app确定。图15显示了在不存在添加的金属离子(基线)和存在5μM LaIII-LuIII;10μM YIII和FeIII;1mM,MnII和CaII;或100μM CuII的情况下,LaMP1(4P→4A)的FRET变化倍数。
定点诱变以证明LanM骨架用于金属选择性再工程化的多功能性
命名方案实例:4P2A=在所有四个EF手中,第2位的P残基突变为A(在本文的一些图中,该构建体也称为“4P→4A”,如其在原始LanM表征手稿那样;3D9H=在前三个EF手中第9位的D残基突变为H。产生了LaMP1传感器的4P2A版本,以测试该构建体对一系列镧系元素的响应性(如果列出两个值,则响应是两阶段的。)
表14.在pH 7.2时LaMP1(4P→4A)(也称为LaMP1-4P2A)对选择的LnIII的表观Kd
Ln(III) | K<sub>d,app</sub> |
La(III) | 8pM |
Nd(III) | 2pM |
Gd(III) | ~100fM,~1pM |
Ho(III) | ~20fM,~1pM |
传感器对Nd右侧的响应分为2个阶段。我们对蛋白质和传感器进行的生物化学表征支持以下假设:这种2阶段响应可能是对于较小的后面镧系元素来说EF4与EF1配对不佳的结果,导致由于金属结合和EF2/3中的构象变化引起的第一响应(FRET比率为1.2至~3.5,整体~3倍变化),然后是由于金属与EF1的结合引起的高至~9的FRET比率的第二响应。这表明去除EF1/4对将导致单阶段响应(见下文)。
该构建体的结果还表明,LaMP1-4P2A的表观Kd从对于La的8pM降低至对于Ho的20fM。整个镧系(La-Lu)的表观Kd的≥3个数量级变化表明,此构建体及其衍生物可能比野生型LanM本身更适合用于基于蛋白质的分离应用。
我们还使用LaMP1作为起点进行了更广泛的诱变研究,以利用在与本公开内容中其它地方所述的相同条件下进行的金属滴定来证明改变该蛋白质的金属选择性的可行性:
图15
斜体构建体可能是细胞内成像应用中最有用的。用其它潜在的干扰金属(Co(II)用作Fe(II)的替代物)测定了选择的构建体。NS=在2mM时未检测到响应。ND=未测定。
表16
D9H/3E12D和3D9H/3E12D/3T7S构建体的性质表明,它们可用作细胞内Mn(II)的选择性传感器(主要干扰物Zn通常以远低于μM的游离浓度存在于细胞中,因此它们不太可能对细胞中的Zn作出响应)。3D9H/3E12D对La(III)的响应为约~30μM,远高于与生理相关的游离浓度,并且远高于野生型传感器对LaIII的表观Kd。因此,与本申请最相关的是,在证明合理地、实质性地改变LanM的金属结合选择性的能力方面,这些数据描述了一种重新改造LaMP1以及因此还有LanM对于潜在的任何期望的无机离子的金属选择性的方法。
最小的LanM构建体:如上所述,突变导致两阶段响应的倾向促使了用于感测、捕获和分离应用的表现出单一响应的构建体的开发。这种最小的构建物也可能潜在地能够以比野生型蛋白质更高的mg金属/g蛋白质比率结合稀土。基于与Y(III)结合的LanM的NMR结构,我们确定了去除EF1和EF4可能会产生保留与wt表观Kd相似但具有单阶段响应且更适合蛋白质工程的传感器。对于我们的初始实验,我们假设LanM/LaMP1的EF4之后的残基可能对疏水性包装很重要,并且因此即使EF4被去除,也应保留它们。我们注意到可以测试缺少这些C末端残基的其它构建体,或者也可以设计缺少EF2和EF3的类似构建体,以产生具有在EF1中的单个金属结合位点的构建体,或者可以制备去除了蛋白质的其它片段的衍生物。
为了测试N-末端截短的影响,将LanM最初在第30个和第48个残基处截短。将这些和其它LanM截短放置在LaMP1传感器骨架中,以快速确定对金属结合的影响。Δ30突变体在紧接EF1之前截短蛋白质,而Δ48突变体在该金属结合位点之后截短。预期两种突变体均具有功能性的EF2/3对。以下序列表示插入在ECFP/citrine FRET之间的LanM部分。
>野生型LanM(SEQ ID NO:41)
>LanM-Δ30(SEQ ID NO:42)
>LanM-Δ48(SEQ ID NO:43)
用EDDS缓冲的Pr(III)溶液对这些构建体的表征表明,Δ30变体表现出与wt几乎相同的表观Kd(~10pM),但FRET变化为3。对于Δ48变体,表观Kd为~500pM,并且具有相同的FRET变化。Ca(II)响应小于2倍,表观Kd为~8mM。与wt LaMP1中相比较低的FRET变化表明荧光蛋白的相对取向不同和/或EF1/4对的不稳定。我们目前正在研究在这些位置之间进行的截短,以在保持低Kd,app的同时使蛋白质尺寸最小化。
使用以下构建体测试了EF4去除的影响。使用EDDS缓冲的Pr(III)溶液,所有这些构建体在具有3倍FRET变化的初始响应中均表现出相同的表观Kd,~50pM。
>LanM-ΔN108-E119_GSG(SEQ ID NO:44)
>LanM-ΔN108-E119_GGSGG(SEQ ID NO:44)
>LanM-ΔN108-E125_GSG(SEQ ID NO:45)
>LanM-ΔN108-E125_GGSGG(SEQ ID NO:46)
其中将EF1和EF4的截短组合的构建体正在进行中。然而,已经给出了以下实例,并已进行了初步测试:
>LanM-Δ48_ΔN108-E119_GGSGG(SEQ ID NO:47)
该构建体的行为与LanM-Δ48构建体基本相同。这些结果表明,我们对该蛋白功能的机械理解使我们能够设计出至少在EF2/3中保留了金属结合功能的有意义的突变和缺失。这些和相关的构建体可用于REE检测、捕获和分离应用。这些结果还表明,可以使用类似的实验来产生具有一系列金属结合功能(不同的金属化学计量、金属亲和力和金属选择性)的其它衍生物。
其它感测方式:用于快速分析任意环境样品中的稀土的基于荧光的检测平台的一些局限性是pH(至少对于ECFP/citrine FRET对)和强吸收/散射样品(例如,酸性矿山排水,含有颗粒混悬液的样品)。此外,虽然可以使用便携式荧光光谱仪,但使用更广泛可获得的仪器(如数码相机或电话)进行检测将是理想的。基于生物发光的感测为这些挑战提供了解决方案。我们正在寻求通过使用生物发光共振能量转移(BRET)来将LanM对稀土的选择性构象响应转变为生物发光输出的方法,该概念类似于FRET,但使用的是发光而非荧光供体。一种可能的方法是使用生物发光供体(例如NanoLuc)和作为BRET受体的磺基Cy3(与半胱氨酸残基缀合)或荧光蛋白(例如tdTomato)(参见下面的构建体)。也可以设计利用其它BRET对的方法。
>生物发光LaMP2:NanoLuc+LanM(带下划线)+半胱氨酸用于与磺基Cy3-马来酰亚胺缀合(SEQ ID NO:48)
>生物发光LaMP3:NanoLuc+LanM(带下划线)+tdTomato(大写)(SEQ ID NO:49)
这些结果表明,可以通过合理的方法对LanM及其衍生物进行工程改造,以改变金属选择性。出于工程改造目的,也可以使用LaMP1或衍生物作为读出来使用诸如定向进化的更高通量的方法。这些研究集中于金属结合位点的突变,但是金属结合位点之外的残基也可以被靶向。从理论上讲,该蛋白质可用于开发针对感兴趣的任何金属离子(或甚至可能任何无机阴离子)的传感器/结合蛋白。特别感兴趣的是用于选择性结合锕系元素(例如,铀酰(UO2 2+)或四价金属,例如Th(IV))的蛋白的开发。我们的数据表明,EF手中的第二、第九和第十二位似乎在改变金属结合选择性而不破坏构象反应方面特别有用,尽管EF手内和EF手之间的其它位置也可以变化以改变亲和力和协同性。例如,为了选择性地结合和感测铀酰,一种方法涉及利用赤道平面中的EF手羧酸并将轴向羧酸(第1和9位的残基)修饰为氢键合供体(例如Ser、Thr、Asn或主链酰胺)以与铀酰的独特氧代基团相互作用。
基于我们的分析,我们发现高度选择性的金属结合具有某些特征。特别地,具有一定数量的EF手基序和具有某间隔区的某些残基的分离的金属结合蛋白导致如本文公开的具有高三价和/或四价阳离子选择性的蛋白。在一个实施方案中,分离的金属结合蛋白可包含2、3或4个EF手基序,所述EF手基序中的至少一个具有至少2个羧酸残基,其中至少两个相邻的EF手基序被10-15个氨基酸残基例如11、12、13、14和15个氨基酸残基分隔,例如被12至13个氨基酸残基(包括端值)分隔。例如,该蛋白质可包含至少1个,优选至少两个2个以下形式的EF手基序:
(D/N)-X1-(D/N)-X2-(D/N)-X3-X4-X5-X6-X7-X8-(E/D)-[SEQ ID NO:3]其中每个X1至X8独立地是任何残基(即,不一定每个位置上是相同的残基)。至少两个相邻的EF手被10-15个残基例如12-13个氨基酸残基分隔。在一个实施方案中,X1是P(脯氨酸)。在某些方面,X6和/或X8可以是D或E。在某些方面,甘氨酸(G)是优选的,但不需要在X3。有利地,本公开内容的金属结合蛋白可以被纯化为至少约70%,例如至少约75%、80%、85%、90%、95%的纯形式。
例如,在一个实施方案中,该蛋白质可包含2、3或4个EF手基序,所述EF手基序包含上述形式(SEQ ID NO:3),并且每对相邻的EF手基序被10-15例如12-13个氨基酸分隔。可以考虑其它排列。下表17给出了EF手基序的氨基酸序列的多种实例:
表17:EF手的多种序列
例如,在一个实施方案中,该蛋白质可以包含2个EF手基序,所述EF手基序包含SEQID NO:3并且被12-13个氨基酸分隔,或者蛋白质可以包含3个EF手基序,所述EF手基序包含SEQ ID NO:3并且每个相邻基序被12-13个氨基酸分隔,或者该蛋白质可以包含4个EF手基序,所述EF手基序包含SEQ ID NO:3并且每个相邻基序被12-13个氨基酸分隔。考虑了其它排列。
本公开内容的另一方面包括一种从诸如溶液、混悬液或胶体的介质中分离稀土或锕系元素、其化合物或盐(例如镧系元素)的方法。所述方法包括使包含三价阳离子的介质与金属结合蛋白接触以结合三价阳离子;分离结合有三价阳离子的金属结合蛋白。所述金属结合蛋白可以有利地对三价阳离子具有比非三价阳离子更高的选择性亲和力,其中所述三价阳离子选自由以下组成的组:来自稀土元素、其化合物、其盐、锕系元素、其化合物、其盐和其组合的三价阳离子。在本公开内容的一些方面,所述方法包括使包含一种或多种稀土元素、其化合物或盐(例如镧系元素或其盐)和/或一种或多种锕系元素、其化合物或盐的介质与金属结合蛋白接触,所述金属结合蛋白对稀土或锕系元素具有比对非稀土或非锕系元素高的选择性亲和力。所述方法还可以包括分离结合有稀土或锕系元素、其化合物或盐(例如镧系元素(3+)离子)的金属结合蛋白;以及任选地使一种或多种稀土或锕系元素与金属结合蛋白分离。
在一个实施方案中,金属结合蛋白可以固定在基底上,例如通过对该蛋白质进行生物素化并且用亲和素对基底进行表面处理。在一些实施方案中,使用点击化学例如叠氮化物-炔烃环加成来固定该蛋白质,例如通过用叠氮化物或炔烃标记该蛋白质并且使其分别与固定表面(例如树脂珠粒)上炔烃或叠氮化物反应。在一些实施方案中,使包含来自稀土或锕系元素、其化合物或盐的三价阳离子的介质与固定有金属结合蛋白的基底接触。然后,允许来自稀土或锕系元素、其化合物或盐的三价阳离子与金属结合蛋白结合(例如,但允许经过一定的时间,或通过施加电场以促进阳离子向基底移动)。然后除去介质,并处理结合有三价阳离子的基底以分离三价阳离子。在多种实施方案中,表面处理可包括用低pH溶液处理或用螯合剂例如EGTA、EDTA、柠檬酸盐、EDDS等处理。
在本公开内容中仅示出和描述了本发明的优选实施方案及其多功能性的实例。应当理解,本发明能够在各种其它组合和环境中使用,并且能够在如本文所表达的发明构思的范围内进行改变或修改。因此,例如,本领域技术人员将认识或仅使用常规实验就能够确定本文所述的具体物质、程序和布置的许多等同物。这样的等同物被认为是在本发明的范围内,并且被所附权利要求所覆盖。
Claims (20)
1.一种分离的金属结合蛋白,对三价阳离子或四价阳离子具有比对非三价阳离子或非四价阳离子至少1000倍高的选择性亲和力,其中所述三价阳离子和四价阳离子选自由以下组成的组:来自稀土元素、其化合物、其盐,锕系元素、其化合物、其盐,及其组合的三价阳离子和四价阳离子。
2.根据权利要求1所述的分离的金属结合蛋白,其中所述蛋白质具有包含脯氨酸残基的金属配位基序。
3.根据权利要求2所述的分离的金属结合蛋白,其中所述脯氨酸残基被丙氨酸残基或其它氨基酸残基替换。
4.根据权利要求3所述的分离的金属结合蛋白,其中与具有包含脯氨酸的金属配位基序的金属结合蛋白相比,所述蛋白质对三价阳离子的构象响应提高了至少100倍。
5.根据权利要求1至4中任一项所述的分离的金属结合蛋白,其中所述稀土元素是镧系元素,并且所述非三价阳离子或非四价阳离子是二价阳离子。
6.根据权利要求1所述的分离的金属结合蛋白,其中所述蛋白质包含2、3或4个EF手基序,所述EF手基序中的至少一个包含至少3个羧酸残基,其中至少2个相邻的EF手基序被10-15个氨基酸残基分隔。
7.一种分离的金属结合蛋白,包含至少2个包含SEQ ID NO:3的序列的EF手基序,其中相邻的EF手基序被10-15个氨基酸分隔。
8.根据权利要求7所述的分离的金属结合蛋白,其中所述EF手基序中的至少一个具有至少3个羧酸残基。
9.根据权利要求7所述的分离的金属结合蛋白,其中所述EF手基序中的至少一个的第9和11位处的氨基酸中的一个或两个是D或E。
10.一种分离的金属结合蛋白,由包含与SEQ ID NO:2的序列具有至少80%同一性的序列的核苷酸编码。
11.一种用于感测三价或四价阳离子的存在的传感器,所述传感器包含:金属结合蛋白,所述金属结合蛋白对三价或四价阳离子具有比对非三价阳离子或非四价阳离子更高的选择性亲和力,其中所述三价和四价阳离子选自由以下组成的组:来自稀土元素、其化合物、其盐,锕系元素、其化合物、其盐,及其组合的三价和四价阳离子。
12.根据权利要求11所述的传感器,还包含:与所述金属结合蛋白结合的第一荧光蛋白和第二荧光蛋白,所述第二荧光蛋白的激发波长与所述第一荧光蛋白的发射波长基本相同;或者与所述金属结合蛋白结合的生物发光供体和第二荧光蛋白或小分子,所述第二荧光蛋白或小分子的激发波长与所述生物发光供体的发射波长基本相同。
13.根据权利要求12所述的传感器,其中当结合三价或四价阳离子时,所述第一荧光蛋白或所述生物发光供体与所述第二荧光蛋白或小分子之间的能量转移效率增加。
14.根据权利要求13所述的传感器,其中所述第一荧光蛋白具有在青色范围内的发射波长,并且所述第二荧光蛋白具有在黄色范围内的发射波长。
15.根据权利要求11所述的传感器,其中所述金属结合蛋白是具有2、3或4个包含SEQID NO:3的序列的EF手基序的蛋白质。
16.根据权利要求15所述的传感器,其中至少2个相邻的EF手基序被10-15个氨基酸残基分隔。
17.一种用于分离稀土或锕系元素的方法,所述方法包括:
使包含三价或四价阳离子的介质与包含金属结合蛋白的样品接触,以结合所述三价或四价阳离子;和
从所述介质中分离结合有所述三价或四价阳离子的所述金属结合蛋白,
其中所述金属结合蛋白对所述三价或四价阳离子具有比对非三价或非四价阳离子更高的选择性亲和力,其中所述三价阳离子或所述四价阳离子选自由以下组成的组:来自稀土元素、其化合物、其盐,锕系元素、其化合物、其盐,及其组合的三价或四价阳离子。
18.根据权利要求17所述的方法,还包括从结合有所述三价阳离子或所述四价阳离子的所述金属结合蛋白中分离所述三价阳离子或所述四价阳离子。
19.根据权利要求18所述的方法,其中分离所述三价阳离子包括用稀酸或包含金属螯合剂的溶液处理分离的具有所述三价阳离子或四价阳离子的金属结合蛋白。
20.根据权利要求19所述的方法,其中所述金属螯合剂包括EDTA、EGTA、EDDS、柠檬酸盐或其组合。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862727114P | 2018-09-05 | 2018-09-05 | |
US62/727,114 | 2018-09-05 | ||
PCT/US2019/049652 WO2020051274A2 (en) | 2018-09-05 | 2019-09-05 | Metal-binding protein and use thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112930190A true CN112930190A (zh) | 2021-06-08 |
Family
ID=69722794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980070280.4A Pending CN112930190A (zh) | 2018-09-05 | 2019-09-05 | 金属结合蛋白及其用途 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210189521A1 (zh) |
CN (1) | CN112930190A (zh) |
AU (1) | AU2019334898A1 (zh) |
BR (1) | BR112021004123A2 (zh) |
WO (1) | WO2020051274A2 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022266120A3 (en) * | 2021-06-14 | 2023-01-26 | Lawrence Livermore National Security, Llc | Compositions comprising proteins and methods of use thereof for rare earth element separation |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020257702A1 (en) * | 2019-06-21 | 2020-12-24 | Ginkgo Bioworks, Inc. | Rare earth element (ree)-binding proteins |
TW202233654A (zh) * | 2020-11-02 | 2022-09-01 | 美商托特斯藥品公司 | 多肽組成物及使用方法 |
EP4373983A2 (en) * | 2021-07-19 | 2024-05-29 | The Penn State Research Foundation | A protein-based sensor for metals in environmental samples and uses thereof |
WO2023034810A1 (en) * | 2021-08-30 | 2023-03-09 | Board Of Trustees Of Michigan State University | Lanmodulin-based protein |
WO2023136956A1 (en) * | 2022-01-17 | 2023-07-20 | The Regents Of The University Of California | Metal-binding molecule production and use thereof |
WO2024050288A2 (en) * | 2022-08-31 | 2024-03-07 | The Regents Of The University Of California | Microbial platform for rare earth bioaccumulation |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5665865A (en) * | 1990-05-08 | 1997-09-09 | The Scripps Research Institute | Metal binding proteins |
WO2010099536A2 (en) * | 2009-02-27 | 2010-09-02 | Massachusetts Institute Of Technology | Engineered proteins with high affinity for dota chelates |
CN105612426A (zh) * | 2013-08-06 | 2016-05-25 | 佐治亚州立大学研究基金会公司 | 金属离子传感器和检测金属离子的方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140141044A1 (en) * | 2012-11-12 | 2014-05-22 | Dana-Farber Cancer Institute, Inc. | Cord Colitis Syndrome Pathogen |
WO2017216384A1 (en) * | 2016-06-17 | 2017-12-21 | Evaxion Biotech Aps | Vaccination targeting ichthyophthirius multifiliis |
-
2019
- 2019-09-05 BR BR112021004123-0A patent/BR112021004123A2/pt unknown
- 2019-09-05 AU AU2019334898A patent/AU2019334898A1/en active Pending
- 2019-09-05 CN CN201980070280.4A patent/CN112930190A/zh active Pending
- 2019-09-05 WO PCT/US2019/049652 patent/WO2020051274A2/en active Application Filing
- 2019-09-05 US US17/272,624 patent/US20210189521A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5665865A (en) * | 1990-05-08 | 1997-09-09 | The Scripps Research Institute | Metal binding proteins |
WO2010099536A2 (en) * | 2009-02-27 | 2010-09-02 | Massachusetts Institute Of Technology | Engineered proteins with high affinity for dota chelates |
CN105612426A (zh) * | 2013-08-06 | 2016-05-25 | 佐治亚州立大学研究基金会公司 | 金属离子传感器和检测金属离子的方法 |
Non-Patent Citations (2)
Title |
---|
ANNA WILKINS MANICCIA等: "Inverse tuning of metal binding affinity and protein stability by altering charged coordination residues in designed calcium binding proteins", PMC BIOPHYSICS, vol. 2, no. 11 * |
VUILLEUMIER, S.等: "conserved hypothetical protein; putative exported protein [Methylorubrum extorquens AM1], GenBank: ACS39628.1", GENBANK, pages 1 - 3 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022266120A3 (en) * | 2021-06-14 | 2023-01-26 | Lawrence Livermore National Security, Llc | Compositions comprising proteins and methods of use thereof for rare earth element separation |
Also Published As
Publication number | Publication date |
---|---|
BR112021004123A2 (pt) | 2021-05-25 |
WO2020051274A3 (en) | 2020-07-30 |
US20210189521A1 (en) | 2021-06-24 |
WO2020051274A2 (en) | 2020-03-12 |
AU2019334898A1 (en) | 2021-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112930190A (zh) | 金属结合蛋白及其用途 | |
JP6883529B2 (ja) | 融合タンパク質を合成するための方法および製品 | |
De Marco et al. | The solubility and stability of recombinant proteins are increased by their fusion to NusA | |
Camarero et al. | Biosynthesis of a head-to-tail cyclized protein with improved biological activity | |
US10494657B2 (en) | In vitro production of cyclic peptides | |
CN113195521A (zh) | Mtu ΔI-CM内含肽变体和其应用 | |
JP4263598B2 (ja) | チロシルtRNA合成酵素変異体 | |
Yu et al. | Tobacco etch virus protease mediating cleavage of the cellulose-binding module tagged colored proteins immobilized on the regenerated amorphous cellulose | |
Zong et al. | High-pressure-assisted reconstitution of recombinant chloroperoxidase | |
Lütticke et al. | E. coli LoiP (YggG), a metalloprotease hydrolyzing Phe–Phe bonds | |
EP3215608B1 (en) | Modified heterocyclase | |
JP7016552B2 (ja) | 組換えタンパク質の分泌を増加させる方法 | |
US9631180B2 (en) | Recombinant manganese oxidase | |
US9845343B2 (en) | Uranium-chelating peptides derived from EF-hand calcium-binding motif useful for uranium biodetection and biodecontamination | |
Lim et al. | Engineered lanthanide‐binding metallohomeodomains: Designing folded chimeras by modular turn substitution | |
US7879578B2 (en) | Self-assembled proteins and related methods and protein structures | |
EP2784094A1 (en) | New uranium-chelating peptides derived from EF-hand calcium-binding motif useful for uranium biodetection and biodecontamination | |
Bratkovič et al. | Engineered staphylococcal protein A’s IgG-binding domain with cathepsin L inhibitory activity | |
JP2004000143A (ja) | 組換え発光蛋白質およびその複合体 | |
Xiong et al. | The expressed α domain of mouse metallothionein‐I from Escherichia coli displays independent structure and function | |
WO2017013400A1 (en) | Single-stranded dna sensor | |
Calcote | Method Development Toward the Analysis of the Functionalization of Proteins | |
New | Analysis of Tha4 Function and Organization in Chloroplast Twin Arginine Transport | |
KR20230086504A (ko) | 나이트러스 옥사이드 리덕타제 단백질 변이체 및 그를 이용한 시료 중 나이트로스 옥사이드의 농도를 감소시키는 방법 | |
Reardon et al. | ReardonAbioticProteinFragmentation. pdf |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |