CN112961225B - 近红外荧光蛋白、重组载体、重组细胞及其应用 - Google Patents
近红外荧光蛋白、重组载体、重组细胞及其应用 Download PDFInfo
- Publication number
- CN112961225B CN112961225B CN201911289599.4A CN201911289599A CN112961225B CN 112961225 B CN112961225 B CN 112961225B CN 201911289599 A CN201911289599 A CN 201911289599A CN 112961225 B CN112961225 B CN 112961225B
- Authority
- CN
- China
- Prior art keywords
- ala
- leu
- fluorescent protein
- val
- infrared fluorescent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108091006047 fluorescent proteins Proteins 0.000 title claims abstract description 142
- 102000034287 fluorescent proteins Human genes 0.000 title claims abstract description 142
- 239000013598 vector Substances 0.000 title claims abstract description 45
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract 6
- 108090000623 proteins and genes Proteins 0.000 claims description 61
- 102000004169 proteins and genes Human genes 0.000 claims description 52
- 108091026890 Coding region Proteins 0.000 claims description 35
- 238000001514 detection method Methods 0.000 claims description 27
- 239000003153 chemical reaction reagent Substances 0.000 claims description 20
- 238000006862 quantum yield reaction Methods 0.000 claims description 19
- 230000005284 excitation Effects 0.000 claims description 13
- 108010082025 cyan fluorescent protein Proteins 0.000 claims description 7
- 238000002360 preparation method Methods 0.000 claims description 7
- 108010054624 red fluorescent protein Proteins 0.000 claims description 5
- 108091005957 yellow fluorescent proteins Proteins 0.000 claims description 5
- 108091005948 blue fluorescent proteins Proteins 0.000 claims description 3
- 239000003504 photosensitizing agent Substances 0.000 abstract description 16
- 150000001413 amino acids Chemical group 0.000 description 138
- 235000001014 amino acid Nutrition 0.000 description 61
- 229940024606 amino acid Drugs 0.000 description 59
- 235000018102 proteins Nutrition 0.000 description 48
- 230000035772 mutation Effects 0.000 description 28
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 27
- 230000001580 bacterial effect Effects 0.000 description 27
- 239000004474 valine Substances 0.000 description 27
- 235000004279 alanine Nutrition 0.000 description 23
- 210000004027 cell Anatomy 0.000 description 23
- 101000934569 Xanthomonas campestris pv. campestris (strain 8004) Bacteriophytochrome Proteins 0.000 description 22
- 238000003752 polymerase chain reaction Methods 0.000 description 21
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 20
- 229930182817 methionine Natural products 0.000 description 18
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 16
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 16
- 239000004473 Threonine Substances 0.000 description 16
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 16
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 15
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 15
- 241000894006 Bacteria Species 0.000 description 14
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 14
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 14
- 239000004475 Arginine Substances 0.000 description 13
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 13
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 13
- 235000003704 aspartic acid Nutrition 0.000 description 13
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 13
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 13
- 239000013078 crystal Substances 0.000 description 13
- 239000000975 dye Substances 0.000 description 13
- 238000011160 research Methods 0.000 description 13
- 238000012216 screening Methods 0.000 description 13
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 12
- 229960000310 isoleucine Drugs 0.000 description 12
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 12
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 12
- 238000000034 method Methods 0.000 description 12
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 11
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 11
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 10
- 239000000178 monomer Substances 0.000 description 10
- 239000004471 Glycine Substances 0.000 description 9
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 9
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 9
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 9
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 9
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 8
- 230000008033 biological extinction Effects 0.000 description 8
- 101150043522 HO gene Proteins 0.000 description 7
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 7
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 7
- 239000003814 drug Substances 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 7
- 238000003384 imaging method Methods 0.000 description 7
- 238000001727 in vivo Methods 0.000 description 7
- 108010057821 leucylproline Proteins 0.000 description 7
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 7
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 7
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical group OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 6
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 6
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 6
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 6
- UBTKNYUAMYRMKE-GOPGUHFVSA-N Ala-Trp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N UBTKNYUAMYRMKE-GOPGUHFVSA-N 0.000 description 6
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 6
- WTUZDHWWGUQEKN-SRVKXCTJSA-N Arg-Val-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O WTUZDHWWGUQEKN-SRVKXCTJSA-N 0.000 description 6
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 6
- OWAFTBLVZNSIFO-SRVKXCTJSA-N Cys-His-His Chemical compound N[C@@H](CS)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OWAFTBLVZNSIFO-SRVKXCTJSA-N 0.000 description 6
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 6
- MQJDLNRXBOELJW-KKUMJFAQSA-N Gln-Pro-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O MQJDLNRXBOELJW-KKUMJFAQSA-N 0.000 description 6
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 6
- DCWNCMRZIZSZBL-KKUMJFAQSA-N Gln-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O DCWNCMRZIZSZBL-KKUMJFAQSA-N 0.000 description 6
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 6
- RZMXBFUSQNLEQF-QEJZJMRPSA-N Glu-Trp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N RZMXBFUSQNLEQF-QEJZJMRPSA-N 0.000 description 6
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 6
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 6
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 6
- 102000016761 Haem oxygenases Human genes 0.000 description 6
- 108050006318 Haem oxygenases Proteins 0.000 description 6
- DYKZGTLPSNOFHU-DEQVHRJGSA-N His-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DYKZGTLPSNOFHU-DEQVHRJGSA-N 0.000 description 6
- OQDLKDUVMTUPPG-AVGNSLFASA-N His-Leu-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OQDLKDUVMTUPPG-AVGNSLFASA-N 0.000 description 6
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 6
- ODPKZZLRDNXTJZ-WHOFXGATSA-N Ile-Gly-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N ODPKZZLRDNXTJZ-WHOFXGATSA-N 0.000 description 6
- HQLSBZFLOUHQJK-STECZYCISA-N Ile-Tyr-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HQLSBZFLOUHQJK-STECZYCISA-N 0.000 description 6
- YHFPHRUWZMEOIX-CYDGBPFRSA-N Ile-Val-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)O)N YHFPHRUWZMEOIX-CYDGBPFRSA-N 0.000 description 6
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 6
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 6
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 6
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 6
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 6
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 6
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 6
- HOMFINRJHIIZNJ-HOCLYGCPSA-N Leu-Trp-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O HOMFINRJHIIZNJ-HOCLYGCPSA-N 0.000 description 6
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 6
- SBFPAAPFKZPDCZ-JYJNAYRXSA-N Met-Pro-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O SBFPAAPFKZPDCZ-JYJNAYRXSA-N 0.000 description 6
- DDYIRGBOZVKRFR-AVGNSLFASA-N Phe-Asp-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DDYIRGBOZVKRFR-AVGNSLFASA-N 0.000 description 6
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 6
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 6
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 6
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 6
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 6
- XQAPEISNMXNKGE-FXQIFTODSA-N Ser-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CS)C(=O)O XQAPEISNMXNKGE-FXQIFTODSA-N 0.000 description 6
- GZGFSPWOMUKKCV-NAKRPEOUSA-N Ser-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO GZGFSPWOMUKKCV-NAKRPEOUSA-N 0.000 description 6
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 6
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 6
- MROIJTGJGIDEEJ-RCWTZXSCSA-N Thr-Pro-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 MROIJTGJGIDEEJ-RCWTZXSCSA-N 0.000 description 6
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 6
- SYFHQHYTNCQCCN-MELADBBJSA-N Tyr-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O SYFHQHYTNCQCCN-MELADBBJSA-N 0.000 description 6
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 6
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 239000013604 expression vector Substances 0.000 description 6
- 238000010353 genetic engineering Methods 0.000 description 6
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 6
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 6
- 108010029020 prolylglycine Proteins 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 6
- JQHASVQBAKRJKD-GUBZILKMSA-N Arg-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JQHASVQBAKRJKD-GUBZILKMSA-N 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 5
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- 239000004472 Lysine Substances 0.000 description 5
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 5
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 5
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 5
- YTUABZMPYKCWCQ-XQQFMLRXSA-N Val-His-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N YTUABZMPYKCWCQ-XQQFMLRXSA-N 0.000 description 5
- 235000018417 cysteine Nutrition 0.000 description 5
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 5
- 238000000799 fluorescence microscopy Methods 0.000 description 5
- 235000013922 glutamic acid Nutrition 0.000 description 5
- 239000004220 glutamic acid Substances 0.000 description 5
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 5
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 5
- 108010092114 histidylphenylalanine Proteins 0.000 description 5
- 210000004962 mammalian cell Anatomy 0.000 description 5
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 4
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 4
- RCNSAJSGRJSBKK-NSQVQWHSSA-N Biliverdin IX Chemical compound N1C(=O)C(C)=C(C=C)\C1=C\C1=C(C)C(CCC(O)=O)=C(\C=C/2C(=C(C)C(=C/C=3C(=C(C=C)C(=O)N=3)C)/N\2)CCC(O)=O)N1 RCNSAJSGRJSBKK-NSQVQWHSSA-N 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 4
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 4
- 235000019892 Stellar Nutrition 0.000 description 4
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 4
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 4
- RGJZPXFZIUUQDN-BPNCWPANSA-N Tyr-Val-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O RGJZPXFZIUUQDN-BPNCWPANSA-N 0.000 description 4
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 4
- 108010070783 alanyltyrosine Proteins 0.000 description 4
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 4
- 244000000005 bacterial plant pathogen Species 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 238000000295 emission spectrum Methods 0.000 description 4
- 238000000695 excitation spectrum Methods 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 102200076228 rs199476151 Human genes 0.000 description 4
- 102200161838 rs62638195 Human genes 0.000 description 4
- 102220133376 rs748679499 Human genes 0.000 description 4
- 102200111189 rs906807 Human genes 0.000 description 4
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 3
- GWZYPXHJIZCRAJ-UHFFFAOYSA-N Biliverdin Natural products CC1=C(C=C)C(=C/C2=NC(=Cc3[nH]c(C=C/4NC(=O)C(=C4C)C=C)c(C)c3CCC(=O)O)C(=C2C)CCC(=O)O)NC1=O GWZYPXHJIZCRAJ-UHFFFAOYSA-N 0.000 description 3
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 3
- MBSSHYPAEHPSGY-LSJOCFKGSA-N His-Ala-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O MBSSHYPAEHPSGY-LSJOCFKGSA-N 0.000 description 3
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical group OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 3
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 3
- 108090000679 Phytochrome Proteins 0.000 description 3
- 108010079005 RDV peptide Proteins 0.000 description 3
- 102000003929 Transaminases Human genes 0.000 description 3
- 108090000340 Transaminases Proteins 0.000 description 3
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 3
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 235000009582 asparagine Nutrition 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- QBUVFDKTZJNUPP-UHFFFAOYSA-N biliverdin-IXalpha Natural products N1C(=O)C(C)=C(C=C)C1=CC1=C(C)C(CCC(O)=O)=C(C=C2C(=C(C)C(C=C3C(=C(C=C)C(=O)N3)C)=N2)CCC(O)=O)N1 QBUVFDKTZJNUPP-UHFFFAOYSA-N 0.000 description 3
- 239000006227 byproduct Substances 0.000 description 3
- 230000004186 co-expression Effects 0.000 description 3
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 108010000761 leucylarginine Proteins 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 108010091748 peptide A Proteins 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 3
- 238000001542 size-exclusion chromatography Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- ODWSTKXGQGYHSH-FXQIFTODSA-N Ala-Arg-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O ODWSTKXGQGYHSH-FXQIFTODSA-N 0.000 description 2
- IJPNNYWHXGADJG-GUBZILKMSA-N Arg-Ala-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O IJPNNYWHXGADJG-GUBZILKMSA-N 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 108050002598 GAF domains Proteins 0.000 description 2
- 102000012074 GAF domains Human genes 0.000 description 2
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- 108050009469 PAS domains Proteins 0.000 description 2
- 102000002131 PAS domains Human genes 0.000 description 2
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 2
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 2
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 2
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 2
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- UGFOSENEZHEQKX-PJODQICGSA-N Trp-Val-Ala Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](C)C(O)=O UGFOSENEZHEQKX-PJODQICGSA-N 0.000 description 2
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 2
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 2
- 238000000149 argon plasma sintering Methods 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 2
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 2
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 2
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 2
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- MOFVSTNWEDAEEK-UHFFFAOYSA-M indocyanine green Chemical compound [Na+].[O-]S(=O)(=O)CCCCN1C2=CC=C3C=CC=CC3=C2C(C)(C)C1=CC=CC=CC=CC1=[N+](CCCCS([O-])(=O)=O)C2=CC=C(C=CC=C3)C3=C2C1(C)C MOFVSTNWEDAEEK-UHFFFAOYSA-M 0.000 description 2
- 229960004657 indocyanine green Drugs 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000001766 physiological effect Effects 0.000 description 2
- 239000001022 rhodamine dye Substances 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 230000000087 stabilizing effect Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 description 2
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- YYOVLDPHIJAOSY-DCAQKATOSA-N Arg-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N YYOVLDPHIJAOSY-DCAQKATOSA-N 0.000 description 1
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- AUNGANRZJHBGPY-UHFFFAOYSA-N D-Lyxoflavin Natural products OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-UHFFFAOYSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 102000010911 Enzyme Precursors Human genes 0.000 description 1
- 108010062466 Enzyme Precursors Proteins 0.000 description 1
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical group NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- ULLIQRYQNMAAHC-RWMBFGLXSA-N Met-His-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N ULLIQRYQNMAAHC-RWMBFGLXSA-N 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- CDBXVDXSLPLFMD-BPNCWPANSA-N Tyr-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDBXVDXSLPLFMD-BPNCWPANSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 108010064539 amyloid beta-protein (1-42) Proteins 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 238000002189 fluorescence spectrum Methods 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 230000031700 light absorption Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 208000030454 monosomy Diseases 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 239000012460 protein solution Substances 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 239000000700 radioactive tracer Substances 0.000 description 1
- 210000003370 receptor cell Anatomy 0.000 description 1
- 235000019192 riboflavin Nutrition 0.000 description 1
- 229960002477 riboflavin Drugs 0.000 description 1
- 239000002151 riboflavin Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/58—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances
- G01N33/582—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving labelled substances with fluorescent label
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/195—Assays involving biological materials from specific organisms or of a specific nature from bacteria
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Genetics & Genomics (AREA)
- Immunology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Hematology (AREA)
- Organic Chemistry (AREA)
- Urology & Nephrology (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Pathology (AREA)
- Zoology (AREA)
- Food Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Peptides Or Proteins (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明涉及一种近红外荧光蛋白、重组载体、重组细胞及其应用。该近红外荧光蛋白的氨基酸序列由光敏素的PAS‑GAF结构域的氨基酸序列发生突变得到,所述PAS‑GAF结构域的氨基酸序列如SEQ ID No.1所示,发生突变的氨基酸位点包括第6、16、9、33、93、102、117、120、127、133、195、199、200、203、230、248、251、255、259、262、280、287、293、295、296、302、306、309及314位氨基酸位点中的至少一个。上述近红外荧光蛋白具有较高的荧光亮度。
Description
技术领域
本发明涉及生物技术领域,特别是涉及一种近红外荧光蛋白、重组载体、重组细胞及其应用。
背景技术
荧光成像技术的理论基础为荧光物质被激发后所发射的荧光信号的强度在一定的范围内与荧光素的量成线性关系。其中,绿色荧光蛋白(GFP)作为生物示踪分子被广泛地应用于生物学、医学、细胞生物学和神经科学等领域,使蛋白质在细胞内的定位和细胞内蛋白相互作用变成可视化。但是,由于GFP类荧光蛋白的激发峰波长不超过611nm,在此波长范围以下,生物组织内的血红蛋白对光具有较多的吸收,光散射也较强,同时核黄素等分子的荧光也较强,因此GFP类蛋白不适合应用于活体深层成像中。
近红外荧光成像技术具有较深的成像深度,在疾病早期诊断和药物开发方面具有潜在的应用价值。研究早期,主要是利用近红外染料(例如:吲哚菁绿,ICG)和有机染料(例如:花青类染料(Cyanine dyes)、罗丹明类染料(Rhodamine dyes)和氟硼吡咯类染料(BODIPY dyes)等)实现近红外荧光成像。但是,染料在合成的过程中存在副产物,对活体实验对象存在毒副作用,影响实验结果。一些研究发现,基于基因编码的近红外荧光蛋白具有较好的生物兼容性,能够适用于活体实验对象。然而,现有的近红外荧光蛋白的荧光亮度较低,难以满足实际检测需求。
发明内容
基于此,有必要提供一种荧光亮度较高的近红外荧光蛋白。
此外,还提供一种近红外荧光蛋白的应用、重组载体、重组细胞及其制备方法。
一种近红外荧光蛋白,所述近红外荧光蛋白的氨基酸序列由光敏素的PAS-GAF结构域的氨基酸序列发生突变得到,所述PAS-GAF结构域的氨基酸序列如SEQ ID No.1所示,发生所述突变的氨基酸位点包括第6位氨基酸位点、第16位氨基酸位点、第29位氨基酸位点、第33位氨基酸位点、第93位氨基酸位点、第102位氨基酸位点、第117位氨基酸位点、第120位氨基酸位点、第127位氨基酸位点、第133位氨基酸位点、第195位氨基酸位点、第199位氨基酸位点、第200位氨基酸位点、第203位氨基酸位点、第230位氨基酸位点、第248位氨基酸位点、第251位氨基酸位点、第255位氨基酸位点、第259位氨基酸位点、第262位氨基酸位点、第280位氨基酸位点、第287位氨基酸位点、第293位氨基酸位点、第295位氨基酸位点、第296位氨基酸位点、第302位氨基酸位点、第306位氨基酸位点、第309位氨基酸位点及第314位氨基酸位点中的至少一个。
本研究对转氨酶进行了大量的研究,意料不到的发现,将光敏素的PAS-GAF结构域的氨基酸序列中第6、16、9、33、93、102、117、120、127、133、195、199、200、203、230、248、251、255、259、262、280、287、293、295、296、302、306、309及314位氨基酸位点中的至少一个发生突变,且PAS-GAF结构域的氨基酸序列如SEQ ID No.1所示,得到的近红外荧光蛋白具有较高的荧光亮度,有利于提高检测结果的灵敏度和准确性。经试验验证,上述近红外荧光蛋白的荧光亮度是近红外荧光蛋白miRFP670的1倍~2.5倍,具有较高的荧光亮度。
其中一个实施例中,所述突变的方式包括如下突变方式中的至少一种:N6D、E16V、V29A、I33V、Q93R、W102Y、M117I、R120G、V127T、T128V、M133L、Y195F、D199L、I200T、Q203L、V230M、V248M、V251C、Y255F、M259I、T262S、S280V、H287R、M293L、D295A、V296L、R302K、G306A、G309S及V314E。
其中一个实施例中,所述近红外荧光蛋白的氨基酸序列如SEQ ID No.2所示;
及/或,所述近红外荧光蛋白为单体蛋白。
其中一个实施例中,所述近红外荧光蛋白的编码序列如SEQ ID No.3所示;
及/或,所述近红外荧光蛋白的量子产量为19.4%;
及/或,所述近红外荧光蛋白的激发峰值为633nm,所述近红外荧光蛋白的发射峰值为663nm。
一种重组载体,包括上述近红外荧光蛋白的编码序列。
其中一个实施例中,还包括发色团的编码序列,所述发色团的编码序列与所述近红外荧光蛋白的编码序列连接。
一种重组细胞,包括上述近红外荧光蛋白的编码序列或者上述重组载体。
一种检测试剂,包括上述近红外荧光蛋白。
其中一个实施例中,还包括非近红外荧光蛋白,所述非近红外荧光蛋白包括青色荧光蛋白、黄色荧光蛋白、红色荧光蛋白及蓝色荧光蛋白中的至少一种;
或者,所述检测试剂为蛋白标签。
上述近红外荧光蛋白、上述重组载体、上述重组细胞或者上述检测试剂在制备检测装置中的应用。
附图说明
图1为将细菌光敏素改造为近红外荧光蛋白的原理示意图;
图2为细菌XccBphP的PAS-GAF结构域和HO基因的共表达载体的结构示意图;
图3为XccBphP的PAS-GAF-BV复合物的三维结构;
图4为mIFP663的激发谱和发射谱曲线图;
图5为mIFP663、miRFP670和iRFP713的尺寸排阻色谱图。
图6为XccBphP的PAS-GAF结构域与已报道的近红外荧光蛋白的氨基酸序列比对图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合具体实施例及附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
一实施方式的近红外荧光蛋白,具有较高的荧光亮度,能够应用于制备检测试剂或者检测装置中。其中,检测装置例如可以为近红外荧光成像系统。检测试剂例如可以为用于筛选新药的试剂、用于评估药效的试剂或者疾病检测的试剂。在其中一个实施例中,检测试剂例如可以为蛋白标签。在其中一个实施例中,检测试剂还包括非近红外荧光蛋白。非近红外荧光蛋白包括青色荧光蛋白、黄色荧光蛋白、红色荧光蛋白及蓝色荧光蛋白中的至少一种。上述近红光荧光蛋白能够与青色荧光蛋白(mTFP1)、黄色荧光蛋白(mVenus)和红色荧光蛋白(mCherry)进行四色成像,并且可以和蓝光激发的光遗传学工具一起使用。
该近红外荧光蛋白的氨基酸序列由光敏素的PAS-GAF结构域的氨基酸序列发生突变得到,PAS-GAF结构域的氨基酸序列如SEQ ID No.1所示,发生所述突变的氨基酸位点包括第6位氨基酸位点、第16位氨基酸位点、第29位氨基酸位点、第33位氨基酸位点、第93位氨基酸位点、第102位氨基酸位点、第117位氨基酸位点、第120位氨基酸位点、第127位氨基酸位点、第133位氨基酸位点、第195位氨基酸位点、第199位氨基酸位点、第200位氨基酸位点、第203位氨基酸位点、第230位氨基酸位点、第248位氨基酸位点、第251位氨基酸位点、第255位氨基酸位点、第259位氨基酸位点、第262位氨基酸位点、第280位氨基酸位点、第287位氨基酸位点、第293位氨基酸位点、第295位氨基酸位点、第296位氨基酸位点、第302位氨基酸位点、第306位氨基酸位点、第309位氨基酸位点及第314位氨基酸位点中的至少一个。
本研究对转氨酶进行了大量的研究,意料不到的发现,将光敏素的PAS-GAF结构域的氨基酸序列中第6、16、9、33、93、102、117、120、127、133、195、199、200、203、230、248、251、255、259、262、280、287、293、295、296、302、306、309及314位氨基酸位点中的至少一个发生突变,且PAS-GAF结构域的氨基酸序列如SEQ ID No.1所示,得到的近红外荧光蛋白具有较高的荧光亮度,有利于提高检测结果的灵敏度和准确性。
其中,光敏素为植物致病菌来源的细菌光敏素XccBphP,PAS-GAF结构域能够与发色团BV结合。该光敏素的结构请参见图1,图1中,细菌光敏素由四个结构域组成,分别为:PAS、GAF、PHY和OM结构域,其中PAS-GAF结构域起到结合发色团BV分子的作用。Biliverdin(BV)表示发色团,即胆绿素。一些研究从蓝藻的光敏素获得近红外荧光蛋白,其发色团PCB(藻胆青素,phycocyanobilin)分子不存在于哺乳动物细胞中,因此不能很好的应用于活体深层成像中。而基于细菌光敏素的近红外荧光蛋白的发色团BV(胆绿素,Biliverdin)分子是普遍存在于哺乳动物细胞中,不需要额外添加,为活体深层成像提供了强有力的工具。
如SEQ ID No.1所示的氨基酸序列:MVSTATNPLDLDVCAREPIHIPGLIQPYGVLLVIDPADGRIVQASTTAADLLGVPMAALLGMPYTQVLTLPEAQPFAVDDQPQHLMHAEVRFPRRATPPASAWVAAWHLYPQQWLVEMEPRDARLLDVTLREAMPLLRSVERDPGIAEAAVRVAKGLRSLIGFDRVMIYRFDEEWNGDIIAEARKPELEAYLGLHFPASLTPAQARALYLRNRVRQIADVGYQPSPIQPTVHPQLGTPVDLSDVSLRSVSPCHLEYLANMGVTATLVASIVVNDALWGLIVCHHYSPHFTNHAMRDVTDAVARTLAGRIGALQAVARARLE。
在其中一个实施例中,上述突变的方式包括如下突变方式中的至少一种:N6D、E16V、V29A、I33V、Q93R、W102Y、M117I、R120G、V127T、T128V、M133L、Y195F、D199L、I200T、Q203L、V230M、V248M、V251C、Y255F、M259I、T262S、S280V、H287R、M293L、D295A、V296L、R302K、G306A、G309S及V314E。此种设置能够提高近红外荧光蛋白的荧光亮度和量子产量。
其中,N6D表示如SEQ ID No.1所示的氨基酸序列中第6位的天冬氨酸被天冬酰胺替代。E16V表示如SEQ ID No.1所示的氨基酸序列中第16位的谷氨酸被缬氨酸替代。V29A表示如SEQ ID No.1所示的氨基酸序列中第29位的缬氨酸被丙氨酸替代。I33V表示如SEQ IDNo.1所示的氨基酸序列中第33位的异亮氨酸被缬氨酸替代。Q93R表示如SEQ ID No.1所示的氨基酸序列中第93位的谷氨酰胺被精氨酸替代。W102Y表示如SEQ ID No.1所示的氨基酸序列中第102位的色氨酸被酪氨酸替代。M117I表示如SEQ ID No.1所示的氨基酸序列中第117位的蛋氨酸被异亮氨酸替代。R120G表示如SEQ ID No.1所示的氨基酸序列中第120位的精氨酸被甘氨酸替代。V127T表示如SEQ ID No.1所示的氨基酸序列中第127位的缬氨酸被苏氨酸替代。T128V表示如SEQ ID No.1所示的氨基酸序列中第128位的苏氨酸被缬氨酸替代。M133L表示如SEQ ID No.1所示的氨基酸序列中第133位的蛋氨酸被亮氨酸替代。Y195F表示如SEQ ID No.1所示的氨基酸序列中第195位的酪氨酸被苯丙氨酸替代。D199L表示如SEQ ID No.1所示的氨基酸序列中第199位的天冬酰胺被亮氨酸替代。I200T表示如SEQ IDNo.1所示的氨基酸序列中第200位的异亮氨酸被苏氨酸替代。Q203L表示如SEQ ID No.1所示的氨基酸序列中第203位的谷氨酰胺被亮氨酸替代。V230M表示如SEQ ID No.1所示的氨基酸序列中第230位的缬氨酸被蛋氨酸替代。V248M表示如SEQ ID No.1所示的氨基酸序列中第248位的缬氨酸被蛋氨酸替代。V251C表示如SEQ ID No.1所示的氨基酸序列中第251位的缬氨酸被半胱氨酸替代。Y255F表示如SEQ ID No.1所示的氨基酸序列中第255位的酪氨酸被苯丙氨酸替代。M259I表示如SEQ ID No.1所示的氨基酸序列中第259位的蛋氨酸被异亮氨酸替代。T262S表示如SEQ ID No.1所示的氨基酸序列中第262位的苏氨酸被丝氨酸替代。S280V表示如SEQ ID No.1所示的氨基酸序列中第280位的丝氨酸被缬氨酸替代。H287R表示如SEQ ID No.1所示的氨基酸序列中第287位的组氨酸被精氨酸替代。M293L表示如SEQID No.1所示的氨基酸序列中第293位的蛋氨酸被亮氨酸替代。D295A表示如SEQ ID No.1所示的氨基酸序列中第295位的天冬氨酸被异丙氨酸替代。V296L表示如SEQ ID No.1所示的氨基酸序列中第296位的缬氨酸被亮氨酸替代。R302K表示如SEQ ID No.1所示的氨基酸序列中第302位的精氨酸被赖氨酸替代。G306A表示如SEQ ID No.1所示的氨基酸序列中第306位的甘氨酸被丙氨酸替代。G309S表示如SEQ ID No.1所示的氨基酸序列中第309位的甘氨酸被丝氨酸替代。V314E表示如SEQ ID No.1所示的氨基酸序列中第314位的缬氨酸被谷氨酸替代。
在一个具体示例中,近红外荧光蛋白的氨基酸序列如SEQ ID No.2所示,该近红外荧光蛋白为单体蛋白,该近红外荧光蛋白命名为mIFP663。具体地,如SEQ ID No.2所示的氨基酸序列为:MVSTATDPLDLDVCAREPIHIPGLIQPYGALLVVDPADGRIVQASTTAADLLGVPMAALLGMPYTQVLTLPEAQPFAVDDQPQHLMHAEVRFPRRATPPASAYVAAWHLYPQQWLVEIEPGDARLLDTVLREALPLLRSVERDPGIAEAAVRVAKGLRSLIGFDRVMIYRFDEEWNGDIIAEARKPELEAYLGLHYPASLTPALARALYLRNRVRQIADVGYQPSPIQPTMHPQLGTPVDLSDVSLRSMSPCHLEFLANIGVSATLVASIVVNDALWGLIVCHHYSPRFTNHALRALTDAVAKTLAARIGALQAEARARLE。
目前,分子亮度较大的单体近红外荧光蛋白是miRFP670,其消光系数(EC)为87400M-1cm-1,量子产率(QY)为0.14。然而,miRFP670的荧光亮度太低,其分子亮度约为mEGFP(mEGFP的EC为56000M-1cm-1,QY为0.6)的三分之一,即便其激发峰值和发射峰值均位于近红外窗口内,由于其荧光亮度低,在活体内的荧光信号依然很弱。并且,miRFP670是一个弱二聚体,如果将其作为蛋白标签,会影响目的蛋白的功能。经试验验证,mIFP663的荧光亮度是miRFP670的2.5倍,mIFP663的量子产量为19.4%,mIFP663的激发峰值为633nm,近红外荧光蛋白的发射峰值为663nm,mIFP663为单体近红外荧光蛋白能够用作蛋白标签。
在其中一个实施例中,mIFP663的编码序列如SEQ ID No.3所示。具体地,如SEQ IDNo.3所示的序列为:ATGGTGAGCACCGCTACCGATCCCCTCGACCTGGATGTGTGTGCCAGAGAGCCCATCCACATCCCAGGACTGATCCAGCCTTACGGCGCGCTGCTCGTGGTCGACCCTGCCGACGGAAGAATCGTGCAGGCCTCTACAACAGCAGCCGATCTTCTGGGAGTGCCTATGGCTGCGCTGCTGGGCATGCCTTACACCCAGGTGCTGACACTGCCTGAGGCACAGCCCTTCGCCGTGGACGATCAGCCACAGCACCTGATGCATGCCGAGGTGCGGTTCCCTCGGAGAGCCACACCTCCTGCCTCTGCTTATGTGGCTGCCTGGCATCTTTATCCCCAGCAGTGGCTGGTGGAAATTGAACCCGGGGACGCCAGACTGCTGGACACCGTGCTGAGAGAAGCCCTGCCTCTCCTGCGGAGCGTGGAGAGAGATCCCGGAATTGCCGAAGCCGCTGTGCGGGTGGCCAAGGGCCTGAGATCTCTGATCGGCTTCGACCGCGTGATGATCTACAGATTCGACGAGGAATGGAACGGCGACATCATTGCCGAGGCTCGGAAGCCTGAGCTGGAAGCCTATCTGGGACTCCACTACCCTGCCAGCCTGACCCCTGCTCTGGCCAGAGCCCTGTACCTGCGGAATAGAGTGCGGCAGATCGCCGACGTGGGCTACCAGCCTAGCCCTATCCAGCCTACCATGCACCCTCAGCTGGGCACCCCTGTGGATCTGTCCGATGTGTCCCTGAGAAGCATGTCTCCATGCCACCTGGAATTCCTGGCCAACATCGGTGTGAGCGCTACCCTGGTCGCCAGCATCGTCGTGAACGATGCCCTGTGGGGACTGATCGTCTGCCACCACTACAGCCCAAGATTCACCAACCACGCCCTGCGCGCCTTGACAGACGCCGTGGCTAAAACACTGGCTGCCAGAATTGGCGCCCTGCAGGCTGAGGCCAGAGCCAGGCTGGAG。
需要说明的是,由于同一氨基酸可由几种不同的密码子来决定,故同一氨基酸可对应不同的编码序列。因此本申请中的如SEQ ID No.2所示的氨基酸序列,除可由如SEQ IDNo.3所示的编码序列所编码,也可由如SEQ ID No.3所示编码序列进行1个或几个核苷酸取代而得到的密码子同义突变的编码序列所编码得到。本领域技术人员可以根据本申请公开的如SEQ ID No.2所示的氨基酸序列,根据现有分子生物学技术,采用cDNA克隆和定点突变的方法或其他适合的方法获得本申请的如SEQ ID No.2所示的氨基酸序列,因此,如SEQ IDNo.2所示的氨基酸序列的编码序列并不仅限于SEQ ID No.3所示的编码序列。如果编码得到的蛋白与本申请的如SEQ ID No.2所示的氨基酸序列没有明显的功能差异,也包括在本发明的范围内。
此外,由于蛋白编码序列的多态性及变异,天然存在的蛋白质会出现基因突变,编码序列中碱基被缺失、替代或增加,或氨基酸的缺失、插入、取代或其它变异,从而导致蛋白质的氨基酸序列出现一个或多个氨基酸被缺失、替代或增加。因此,存在着一些生理和生物活性上基本等同于无变异蛋白质的蛋白。这些结构不同于相应的蛋白质,但与该蛋白质没有明显的功能差异的多肽或蛋白称为功能等同变异体。
功能等同的变异体同样适用于通过缺失、插入和突变等人工手段改变一个或多个密码子,从而向一种蛋白质的氨基酸序列中导入这类变异而制成的多肽。尽管这样能获得更多不同形式的变异体,但所得的变异体作为功能等同变异体的前提是其生理活性基本等同于原始无变异蛋白质的活性。
一般的,功能等同变异体的编码序列是同源的,因此,由至少一种改变(如蛋白质的编码序列中一个或多个碱基的缺失、插入或取代或者蛋白质的氨基酸序列中有一个或多个氨基酸缺失、插入或取代)所得的多肽或蛋白一般具有功能上等同于所述蛋白质的活性,因此,如果编码得到的蛋白与本申请的近红外荧光蛋白没有明显的功能差异,也包括在本申请的范围内。
在一个具体示例中,近红外荧光蛋白的氨基酸序列如SEQ ID No.4所示。具体地,如SEQ ID No.4所示的氨基酸序列为:MVSTATNPLDLDVCAREPIHIPGLIQPYGVLLVIDPADGRIVQASTTAADLLGVPMAALLGMPYTQVLTLPEAQPFAVDDQPQHLMHAEVRFPRRATPPASAWVAAWHLYPQQWLVEMEPRDARLLDVTLREAMPLLRSVERDPGIAEAAVRVAKGLRSLIGFDRVMIYRFDEEWNGDIIAEARKPELEAYLGLHFPASLTPAQARALYLRNRVRQIADVGYQPSPIQPTVHPQLGTPVDLSDVSLRSMSPCHLEFLANMGVTATLVASIVVNDALWGLIVCHHYSPHFTNHAMRDVTDAVARTLAGRIGALQAVARARLE。此种设置的近红外荧光蛋白具有较高的荧光亮度,且为单体蛋白,能够用作蛋白标签。
在一个具体示例中,近红外荧光蛋白的氨基酸序列如SEQ ID No.5所示。具体地,如SEQ ID No.5所示的氨基酸序列为:MVSTATNPLDLDVCAREPIHIPGLIQPYGVLLVVDPADGRIVQASTTAADLLGVPMAALLGMPYTQVLTLPEAQPFAVDDQPQHLMHAEVRFPRRATPPASAYVAAWHLYPQQWLVEIEPRDARLLDVTLREAMPLLRSVERDPGIAEAAVRVAKGLRSLIGFDRVMIYRFDEEWNGDIIAEARKPELEAYLGLHFPASLTPAQARALYLRNRVRQIADVGYQPSPIQPTVHPQLGTPVDLSDVSLRSMSPCHLEFLANMGVTATLVASIVVNDALWGLIVCHHYSPHFTNHAMRDVTDAVARTLAGRIGALQAVARARLE。此种设置的近红外荧光蛋白具有较高的荧光亮度,且为单体蛋白,能够用作蛋白标签。
在一个具体示例中,近红外荧光蛋白的氨基酸序列如SEQ ID No.6所示。具体地,如SEQ ID No.6所示的氨基酸序列为:MVSTATNPLDLDVCAREPIHIPGLIQPYGVLLVVDPADGRIVQASTTAADLLGVPMAALLGMPYTQVLTLPEAQPFAVDDQPQHLMHAEVRFPRRATPPASAYVAAWHLYPQQWLVEIEPRDARLLDVTLREAMPLLRSVERDPGIAEAAVRVAKGLRSLIGFDRVMIYRFDEEWNGDIIAEARKPELEAYLGLHFPASLTPAQARALYLRNRVRQIADVGYQPSPIQPTVHPQLGTPVDLSDVSLRSMSPCHLEFLANMGVTATLVASIVVNDALWGLIVCHHYSPRFTNHALRAVTDAVAKTLAARISALQAVARARLE。此种设置的近红外荧光蛋白具有较高的荧光亮度,且为单体蛋白,能够用作蛋白标签。
在一个具体示例中,近红外荧光蛋白的氨基酸序列如SEQ ID No.7所示。具体地,如SEQ ID No.7所示的氨基酸序列为:MVSTATNPLDLDVCARVPIHIPGLIQPYGVLLVVDPADGRIVQASTTAADLLGVPMAALLGMPYTQVLTLPEAQPFAVDDQPQHLMHAEVRFPRRATPPASAYVAAWHLYPQQWLVEIEPRDARLLDVTLREAMPLLRSVERDPGIAEAAVRVAKGLRSLIGFDRVMIYRFDEEWNGDIIAEARKPELEAYLGLHFPASLTPALARALYLRNRVRQIADVGYQPSPIQPTVHPQLGTPVDLSDVSLRSMSPCHLEFLANMGVSATLVASIVVNDALWGLIVCHHYSPRFTNHALRAVTDAVAKTLAARISALQAVARARLE。此种设置的近红外荧光蛋白具有较高的荧光亮度,且为单体蛋白,能够用作蛋白标签。
研究发现,基于细菌光敏素的近红外荧光蛋白的激发和发射峰波长都是接近或位于近红外窗口内(650nm~900nm),组织的自发荧光、光散射及光吸收都较低。因此,基于细菌光敏素的近红外荧光蛋白是非侵入性活体深层成像的良好工具。然而,现有的近红外荧光蛋白的荧光亮度都较低,并且单体性的近红外荧光蛋白较少。本研究对转氨酶进行了大量的研究,意料不到的发现,将光敏素的PAS-GAF结构域的氨基酸序列中第6、16、9、33、93、102、117、120、127、133、195、199、200、203、230、248、251、255、259、262、280、287、293、295、296、302、306、309及314位氨基酸位点中的至少一个发生突变,且PAS-GAF结构域的氨基酸序列如SEQ ID No.1所示,得到的近红外荧光蛋白具有较高的荧光亮度,有利于提高检测结果的灵敏度和准确性。经试验验证,上述近红外荧光蛋白的荧光亮度是近红外荧光蛋白miRFP670的1倍~2.5倍,具有较高的荧光亮度,并且上述近红外荧光蛋白为单体蛋白,能够用作蛋白标签,以用于目的蛋白的检测。
一般地,采用近红外染料和有机染料等实现近红外荧光成像。虽然这些染料具有较高的荧光亮度,但在活体内用于标记药物或药物靶点时染料的特异性差。并且,用于标记药物的染料在其合成过程中存在副产物,且很难分离纯化,副产物对活体实验对象存在毒性,不太适合应用于活体的研究中。基于基因编码的近红外荧光蛋白具有较好的生物兼容性,适用于活体内研究药物与靶点之间的相互作用,在疾病检测和药物筛选及药效评估方面具有广泛的应用前景。然而,现有分子亮度较大的单体近红外荧光蛋白是miRFP670,其消光系数(EC)为87400M-1cm-1,量子产率(QY)为0.14。但是,miRFP670的荧光亮度太低,其分子亮度约为mEGFP(mEGFP的EC为56000M-1cm-1,QY为0.6)的三分之一,即便其激发峰值和发射峰值均位于近红外窗口内,由于其荧光亮度低,在活体内的荧光信号依然很弱。并且,miRFP670是一个弱二聚体,如果将其作为蛋白标签,会影响目的蛋白的功能。经试验验证,上述近红外荧光蛋白中,mIFP663的荧光亮度是miRFP670的2.5倍,mIFP663的量子产量为19.4%,mIFP663的激发峰值为633nm,近红外荧光蛋白的发射峰值为663nm,mIFP663为单体近红外荧光蛋白能够用作蛋白标签。
一实施方式的重组载体,包括上述实施方式的近红外荧光蛋白的编码序列。
在其中一个实施例中,重组载体为表达载体。需要说明的是,重组载体不限于为表达载体,也可以为克隆载体。进一步地,重组载体还包括发色团的编码序列。发色团的编码序列与近红外荧光蛋白的编码序列连接。更进一步地,重组载体包括基因工程载体。上述近红外荧光蛋白的编码序列和发色团的编码序列插入基因工程载体中。具体地,基因工程载体为pJC载体,其经由商业载体pNCS改造而来,可以在细菌中产生BV分子。发色团为BV。近红外荧光蛋白需要结合发色团BV分子才具有荧光。
在一个具体示例中,上述近红外荧光蛋白为mIFP663。基因工程载体为pJC载体。发色团为BV。发色团的编码基因为HO(Heme oxygenase)基因(HO基因能在细菌内产生BV分子,常规的表达用工程细菌不含有內源BV分子)。mIFP663的编码基因的表达由T7启动子控制。HO基因的表达由EM7启动子控制。
需要说明的是,基因工程载体不限于上述指出基因工程载体,其他常见的基因工程载体也可以作用重组载体的基因工程载体,例如可以为pET-32a载体、pET28a载体、pGEX-6P-1载体、pPIC-9K载体或pPIC-Zα载体。只需要将mIFP663-HO基因插入上述载体即可。
上述重组载体能够较好地保存编码上述近红外荧光蛋白的编码序列,有利于近红外荧光蛋白的表达,能够应用于制备蛋白标签等检测试剂。进一步地,上述重组载体使得近红外荧光蛋白和发色团组成型表达,使得无需额外设置发色团即可产生荧光。
一种重组细胞,包括上述实施方式的近红外荧光蛋白的编码序列。
在其中一个实施例中,重组细胞为表达编码上述近红外荧光蛋白的编码序列的细胞。需要说明的是,重组细胞不限于为上述指出的细胞,也可以为克隆编码上述近红外荧光蛋白的编码序列的细胞。
在其中一个实施例中,重组细胞包括受体细胞。编码上述近红外荧光蛋白的编码序列或上述重组载体位于受体细胞内。
在其中一个实施例中,受体细胞为细菌。进一步地,受体细胞为Stellar大肠杆菌。需要说明的是,受体细胞不限于为细菌,也可以为酵母、放线菌、动物细胞或植物细胞等。
上述重组细胞能够克隆或表达上述近红外荧光蛋白,使得能够大规模的制备该近红外荧光蛋白,并且通过重组细胞定向表达该近红外荧光蛋白,以能够获得纯度较高的近红外荧光蛋白,进而有利于近红外荧光蛋白的应用,因此,上述重组细胞能够用于制备检测试剂或者检测装置。
上述实施方式的近红外荧光蛋白的制备方法,包括如下步骤:以植物致病菌来源的细菌光敏素XccBphP中结合BV分子的PAS-GAF结构域为模板,经过一系列的突变筛选得到的。实验原理详见图1。
具体地,近红外荧光蛋白的制备方法包括如下S110~S120:
S110、对光敏素的编码DNA序列进行基因密码子优化。
通过上述步骤使其成为人源化序列,以便于获得的近红外荧光蛋白能够在哺乳动物细胞内更好的表达。
其中,光敏素为野生型细菌光敏素XccBphP,来源于植物致病菌。
S120、以光敏素-BV复合物的晶体结构为基础,模拟获得近红外荧光蛋白-复合物的晶体结构,以近红外荧光蛋白-复合物的晶体结构为指导,结合与其它近红外荧光蛋白的氨基酸序列同源比对分析,同时运用随机突变技术,得到荧光亮度较高的近红外荧光蛋白。
其中,其他近红外荧光蛋白例如为miRFP670、miRFP670(nano,纳米型)、miRFP720、mIFP、SNIFP和BDFP1.5中的至少一种。
具体地,以XccBphP-BV复合物的晶体结构为基础,模拟获得mIFP663-BV复合物的晶体结构,以mIFP663-BV复合物的晶体结构为指导,结合与其它近红外荧光蛋白的氨基酸序列同源比对分析,同时运用Random PCR技术(即随机引物PCR技术),得到荧光亮度较高的近红外荧光蛋白。
目前荧光较亮的单体近红外荧光蛋白miRFP670的开发步骤如下:1、以细菌光敏素RpBphP1的发色团BV结合结构域PAS-GAF为起始模板,运用随机突变技术,通过构建细菌文库,在共表达HO(Heme Oxygenase,在细菌中产生BV分子)基因的细菌中筛选荧光亮度较高的突变体;2、其单体性的获得是通过对晶体结构的分析,找出相互作用的位点,然后通过定点突变消除相互作用;3、将性质优异的突变体分别在哺乳动物细胞中检测荧光亮度,选出荧光亮度最大的突变体,获得最终的miRFP670。从miRFP670开发的思路来看,此方法的缺点是:由于随机突变技术使用的DNA聚合酶对4中脱氧核糖核酸具有不同程度的偏爱性,并且突变效率低,需要构建非常庞大的突变体文库才能筛选到荧光亮度较高的突变体,并且不一定会筛选到高亮的近红外荧光蛋白。本研究将采用细菌光敏素XccBphP(其与细菌光敏素RpBphP1的氨基酸序列差异性较大)为DNA模板,通过XccBphP的晶体结构介导的理性设计结合随机突变技术,能够更加有效的开发荧光亮度更高的单体近红外荧光蛋白。
可以理解,不限于通过上述方法获得上述实施方式的近红外荧光蛋白,也可以其他方式获得上述实施方式的近红外荧光蛋白,例如可以为蛋白质化学合成法。
以下为具体实施例部分。
实施例中采用试剂和仪器如非特别说明,均为本领域常规选择。实施例中未注明具体条件的实验方法,通常按照常规条件,例如文献、书本中所述的条件或者试剂盒生产厂家推荐的方法实现。实施例中所使用的试剂均为市售。
实施例
1、对野生型细菌光敏素XccBphP(来源于植物致病菌)的编码DNA序列进行基因密码子优化,使其成为人源化序列,以便于获得的近红外荧光蛋白能够在哺乳动物细胞内更好的表达。野生型细菌光敏素XccBphP的PAS-GAF结构域的氨基酸序列如SEQ ID No.1所示。
2、组成型表达XccBphP的PAS-GAF结构域和HO基因的细菌共表达载体的构建:
细菌共表达载体的结构详见图2。其中,XccBphP的PAS-GAF结构域和HO基因插入基因工程载体中。基因工程载体为pJC载体。发色团为BV。发色团的编码基因为HO(Hemeoxygenase)基因(HO基因能在细菌内产生BV分子,常规的表达用工程细菌不含有內源BV分子)。XccBphP的PAS-GAF结构域的表达由T7启动子控制。HO基因的表达由EM7启动子控制。构建表达载体命名为pJC-PAS-GAF-HO。
3、以XccBphP-BV复合物的晶体结构为基础,获得XccBphP的PAS-GAF-BV复合物的晶体结构。详见图3,图3中箭头(3-1)所指的结构为XccBphP的PAS-GAF,箭头(3-2)所指的结构为发色团BV。以XccBphP的PAS-GAF-BV复合物的晶体结构为指导,结合XccBphP的PAS-GAF与已报道的近红外荧光蛋白的氨基酸序列同源比对分析,同时运用随机突变技术来提高XccBphP的PAS-GAF的荧光亮度。具体过程如下:
(1)稳定mIFP663发色团BV分子的结构:
根据XccBphP的PAS-GAF-BV复合物的晶体结构,选取XccBphP的PAS-GAF内部相邻或靠近BV分子的氨基酸位点,这些位点如下:C13(即第13位的半胱氨酸)、Q93(即第93位的谷氨酰胺)、M166(即第166位的蛋氨酸)、A182(即第182位的丙氨酸)、L193(即第193位的亮氨酸)、F195(即第195位的苯丙氨酸)、Y195(即第195位的酪氨酸)、T199(即第199位的苏氨酸)、I200(即第200位的异亮氨酸)、R246(即第246位的精氨酸)、V248(即第248位的缬氨酸)、V251(即第251位的缬氨酸)、Y255(即第255位的酪氨酸)、L256(即第256位的亮氨酸)、T264(即第264位的苏氨酸)、V266(即第266位的缬氨酸)、S280(即第280位的丝氨酸),这些位点突变后可能与BV分子产生新的氢键、疏水相互作用、离子键或π-cation相互作用。
结合mIFP663蛋白与已报道的近红外荧光蛋白mIFP、IFP1.4、IFP2.0、miRFP670、miRFP703、miRFP709、iRFP670、iRFP682、iRFP702、iRFP713和iRFP720进行氨基酸序列比对分析(氨基酸序列比对分析结果详见图6),上述位点可能存在如下突变:C13CS(即第13位的半胱氨酸被依次连接的半胱氨酸和丝氨酸替代)、Q93QR(即第93位的谷氨酰胺被依次连接的谷氨酰胺和精氨酸替代)、M166MK(即第166位的蛋氨酸被依次连接的蛋氨酸和赖氨酸替代)、A182AD(即第182位的丙氨酸被依次连接的丙氨酸和天冬氨酸替代)、L193LNH(即第193位的亮氨酸被依次连接的亮氨酸、天冬酰胺和组氨酸替代)、F195FY(即第195位的苯丙氨酸被依次连接的苯丙氨酸和酪氨酸替代)、Y195YF(即第195位的酪氨酸被依次连接的酪氨酸和苯丙氨酸替代)、T199TALMV(即第199位的苏氨酸被依次连接的苏氨酸、丙氨酸、亮氨酸、蛋氨酸和缬氨酸替代)、I200IVTA(即第200位的异亮氨酸被依次连接的亮氨酸、缬氨酸、苏氨酸和丙氨酸替代)、R246RK(即第246位的精氨酸被依次连接的精氨酸和赖氨酸替代)、V248VTMA(即第248位的缬氨酸被依次连接的蛋缬氨酸、苏氨酸、蛋氨酸和丙氨酸替代)、V251VC(即第251位的缬氨酸被依次连接的缬氨酸和半胱氨酸替代)、Y255YF(即第255位的酪氨酸被依次连接酪氨酸和苯丙氨酸替代)、L256LMEQKV(即第256位的亮氨酸被依次连接的亮氨酸、蛋氨酸、谷氨酸、谷氨酰胺、精氨酸和缬氨酸替代)、T264TS(即第264位的苏氨酸被依次连接的苏氨酸和丝氨酸替代)、V266VTS(即第266位的缬氨酸被依次连接的缬氨酸、苏氨酸和丝氨酸替代)、S280SVT(即第280位的丝氨酸被依次连接的丝氨酸、缬氨酸和苏氨酸替代)。
利用重叠PCR技术,将所有突变位点引入到XccBphP的PAS-GAF结构域DNA序列中,然后回收PCR产物,利用In-Fusion的方法,将PCR产物连接到pJC载体上,转入Clontech公司开发的Stellar大肠杆菌感受态中,在34℃培养箱中培养18h左右,最后利用自制的荧光筛选系统挑选荧光较亮的突变体,此荧光筛选系统由CCDOps software控制的MDK 41BU02CCD相机、Edmund公司的Mi-LED光源、索莱宝公司的610/13nm激发滤光片和687/75nm发射滤光片组成,整个系统安置在避光的黑箱子中。由于突变的位点较多,整个筛选过程分成三次进行,经过三轮细菌文库的筛选,从中选取荧光亮度最高的突变体,命名为R1-3。与PAS-GAF结构域的氨基酸序列相比,R1-3的氨基酸序列中引入如下八种突变:Q93R、Y195F、D199L、I200T、V248M、V251C、Y255F和S280V。
(2)稳定mIFP663的PAS结构域和GAF结构域:
以XccBphP的PAS-GAF-BV复合物的晶体结构为依据,同时已与报道的近红外荧光蛋白mIFP、IFP1.4、IFP2.0、miRFP670、miRFP703、miRFP709、iRFP670、iRFP682、iRFP702、iRFP713和iRFP720的氨基酸序列进行比对分析,从XccBphP的PAS-GAF结构域分子表面选取非保守氨基酸位点,这些氨基酸位点为I33(即第33位的异亮氨酸)、D49(即第49位的天冬氨酸)、L50(即第50位的亮氨酸)、F75(即第75位的苯丙氨酸)、W102(即第102位的色氨酸)、L108(即第108位的亮氨酸)、M117(即第117位的蛋氨酸)、F162(即第162位的苯丙氨酸)、W174(即第174位的色氨酸)、A189(即第189位的丙氨酸)、H287(即第287位的组氨酸)、A292(即第2922位的丙氨酸)、M293(即第293位的蛋氨酸)、D295(即第295位的天冬氨酸)、D298(即第298位的天冬氨酸)、R302(即第302位的精氨酸)、G306(即第306位的甘氨酸)、G309(即第309位的甘氨酸),这些位点突变后可能与周围氨基酸形成新的氢键、疏水相互作用、盐桥和cation-π等作用力或稳定蛋白二级结构(α-Helix和β-sheet)。
为了稳定PAS结构域,以R1-3的编码序列为模板,利用重叠PCR技术引入如下突变:I33VI(即第33位的异亮氨酸被依次连接的缬氨酸和异亮氨酸替代)、D49DT(即第49位的天冬氨酸被依次连接的天冬氨酸和苏氨酸替代)、L50LHKY(即50位的亮氨酸被依次连接的亮氨酸、组氨酸、赖氨酸和酪氨酸替代)、F75FY(即第75位的苯丙氨酸被依次连接的苯丙氨酸和酪氨酸替代)、W102WFY(即第102位的色氨酸被依次连接的色氨酸、苯丙氨酸和酪氨酸替代)、L108LTSVI(即第108位的亮氨酸被依次连接的亮氨酸、苏氨酸、丝氨酸、缬氨酸和异亮氨酸替代)、M117MVI(即第117位的蛋氨酸被依次连接的蛋氨酸、缬氨酸和异亮氨酸替代),然后将获得的PCR产物连接到pJC载体上,转化Stellar大肠杆菌,利用上述自制的荧光筛选系统,挑选荧光较亮的突变体,并将荧光亮度更高的突变体命名为R4。与R1-3相比,突变体R4的氨基酸序列中引入如下三种突变:I33V、W102Y和M117I。
然后,为了筛选稳定GAF结构域的位点,以R4的编码序列为模板,利用重叠PCR技术引入F162FY(即第162位的苯丙氨酸被依次连接的苯丙氨酸和酪氨酸替代)、W174WFY(即第174位的色氨酸被依次连接的色氨酸、苯丙氨酸和酪氨酸替代)、A189AS(即第189位的丙氨酸被依次连接的丙氨酸和丝氨酸替代)、H287HYR(即第287位的组氨酸被依次连接的组氨酸、酪氨酸和精氨酸替代)、A292AED(即第2922位的丙氨酸被依次连接的丙氨酸、谷氨酸和天冬氨酸替代)、M293ML(即第293位的蛋氨酸被依次连接的蛋氨酸和亮氨酸替代)、D295AD(即第295位的天冬氨酸被依次连接的丙氨酸和天冬氨酸替代)、D298DK(即第298位的天冬氨酸被依次连接的天冬氨酸和赖氨酸替代)、R302ER(即第302位的精氨酸被依次连接的谷氨酸和精氨酸替代)、G306GA(即第306位的甘氨酸被依次连接的甘氨酸和丙氨酸替代)、G309GAI(即第309位的甘氨酸被依次连接的甘氨酸、丙氨酸和异亮氨酸替代),然后将获得的PCR产物连接到pJC载体上,转化Stellar大肠杆菌,利用自制的荧光筛选系统,挑选荧光较亮的突变体,并将荧光亮度更高的突变体命名为R5。与R4相比,突变体R5的氨基酸序列中引入如下六种突变:H287R、M293L、D295A、R302K、G306A和G309S。
(3)利用随机突变技术提高mIFP663的荧光亮度:
以R5的编码序列为模板,利用易错PCR技术构建大规模细菌突变体文库。易错PCR包括如下组分:Taq DNA聚合酶,4中dNTP(dATP、dCTP、dGTP和dTTP)以及Mg2+和Mn2+。然后将易错PCR扩增的产物纯化,再连接到pJC载体上,转化入Stellar大肠杆菌。按照每个平板生长1000个菌落,每次涂布50个平板。经过5轮易错PCR及构建细菌文库进行筛选,总共构建的细菌文库约含有2.5×105个转化子。将每轮筛选到的荧光亮度较高的突变体,进行荧光亮度的比较,选出高荧光亮度的突变体,并进行DNA测序,将所有突变位点再次进行细菌文库筛选,得到高荧光亮度的突变体为R6(即表达R6的细菌)。与R5相比,突变体R6的氨基酸序列中引入如下三种突变:E16V、Q203L和T262S。
(4)通过提高mIFP663的折叠来提高荧光亮度:
研究发现,折叠不好的荧光蛋白与易聚集的蛋白融合后,其在细菌内的亮度会降低),而折叠好的荧光蛋白的消光系数会提高。利用此现象,构建表达融合蛋白Aβ42-R6的细菌,融合蛋白Aβ42-R6为R6与小肽Aβ42(阿尔茨海默症的标志蛋白,在细胞内易发生聚集)的融合蛋白,此融合蛋白是将小肽Aβ42放在R6蛋白的N端,通过7个氨基酸的linker(GGSGGGT)连接,比较R6与Aβ42-R6在细菌内的亮度。试验后发现,Aβ42-R6的荧光亮度低于R6。
以R6为模板,利用易错PCR技术构建大规模细菌突变体文库。易错PCR包括如下组分:Taq DNA聚合酶,4中dNTP(dATP、dCTP、dGTP和dTTP)以及Mg2+和Mn2+。然后将经过易错PCR扩增的R6产物纯化,然后利用重叠PCR技术与小肽Aβ42的DNA经由GGCGGAAGCGGAGGCGGTACC(如SEQ ID No.8所示)连接,将扩增的PCR产物纯化后,再连接到pJC载体上,转化Stellar大肠杆菌。按照每个平板生长1000个菌落,每次涂布50个平板。经过5轮易错PCR及构建细菌文库进行筛选,总共构建的细菌文库约含有2.5×105个转化子。将每轮筛选到的荧光亮度较高的突变体,进行荧光亮度的比较,选出高荧光亮度的突变体,并进行DNA测序,将所有突变位点再次进行细菌文库筛选,最终得到的高荧光亮度的突变体为即为mIFP663近红外荧光蛋白。与R6相比,mIFP663近红外荧光蛋白的氨基酸序列中引入如下十种突变:N6D、V29A、R120G、V127T、T128V、M133L、V230M、M259I、V296L和V314E。单体近红外荧光蛋白mIFP663即为本研究开发的高荧光亮度的单体近红外荧光蛋白。
测试:
1、测定mIFP663近红外荧光蛋白与现有的近红外荧光蛋白的激发峰值、发射峰值、摩尔消光系数、量子产率、荧光亮度和寡聚态。测定结果详见表1和图4。表1表示mIFP663近红外荧光蛋白与现有的近红外荧光蛋白的激发峰值、发射峰值、摩尔消光系数、量子产率、荧光亮度和寡聚态。图4为mIFP663近红外荧光蛋白的激发谱和发射谱,箭头(4-1)所指的曲线为发射谱,箭头(4-2)所指的曲线为激发谱。
其中,现有的近红外荧光蛋白为miRFP670、miRFP670(nano,纳米型)、miRFP720、mIFP、SNIFP和BDFP1.5。采用纯化的蛋白溶液利用Tecan公司的Infinite M1000 PRO酶标仪测定近红外荧光蛋白的激发谱和发射谱;采用文献Shcherbakova DM et al,2016,NatureCommunication中的方法,利用Infinite M1000 PRO酶标仪测定近红外荧光蛋白的摩尔消光系数;采用文献Shcherbakova DM et al,2016,Nature Communication中的方法,利用Infinite M1000 PRO酶标仪测定近红外荧光蛋白的量子产率;荧光亮度=摩尔消光系数*量子产率,相对荧光亮度即为检测到的各近红外荧光蛋白的相对于mIFP663的荧光亮度的百分比;采用尺寸排阻色谱法(Size exclusion chromatography)来测定寡聚态。
表1
表1中,括号中是文献Nat Commun,2016,7::1405中测得的数据。mIFP663和miRFP670的摩尔消光系数和量子产率是在pH7.0的PBS中测得。
从表1和图4可以看出,mIFP663的激发峰值为633nm,发射峰值为663nm,量子产量为19.4%,量子产量和荧光亮度均高于其他单体近红外荧光蛋白,荧光亮度较高,能够用作蛋白标签,以能够应用于制备检测试剂或者检测装置中。
2、采用尺寸排阻色谱法测试mIFP663的单体性能,同时以单体的miRFP670和二聚体的iRFP713为对照。测试结果详见图5。
从图5可以看出,mIFP663是一个单体性非常好的近红外荧光蛋白。
综上,上述近红外荧光蛋白的量子产量和荧光亮度均较高,并且上述近红外荧光蛋白为单体蛋白,能够用作蛋白标签,以用于目的蛋白的检测。此外,由于上述近红外荧光蛋白的荧光光谱处于近红外区域,能够很好的与青色荧光蛋白(mTFP1)、黄色荧光蛋白(mVenus)和红色荧光蛋白(mCherry)进行四色成像,并且可以和蓝光激发的光遗传学工具一起使用。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110> 中国科学院深圳先进技术研究院
<120> 近红外荧光蛋白、重组载体、重组细胞及其应用
<160> 9
<170> SIPOSequenceListing 1.0
<210> 1
<211> 321
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Met Val Ser Thr Ala Thr Asn Pro Leu Asp Leu Asp Val Cys Ala Arg
1 5 10 15
Glu Pro Ile His Ile Pro Gly Leu Ile Gln Pro Tyr Gly Val Leu Leu
20 25 30
Val Ile Asp Pro Ala Asp Gly Arg Ile Val Gln Ala Ser Thr Thr Ala
35 40 45
Ala Asp Leu Leu Gly Val Pro Met Ala Ala Leu Leu Gly Met Pro Tyr
50 55 60
Thr Gln Val Leu Thr Leu Pro Glu Ala Gln Pro Phe Ala Val Asp Asp
65 70 75 80
Gln Pro Gln His Leu Met His Ala Glu Val Arg Phe Pro Arg Arg Ala
85 90 95
Thr Pro Pro Ala Ser Ala Trp Val Ala Ala Trp His Leu Tyr Pro Gln
100 105 110
Gln Trp Leu Val Glu Met Glu Pro Arg Asp Ala Arg Leu Leu Asp Val
115 120 125
Thr Leu Arg Glu Ala Met Pro Leu Leu Arg Ser Val Glu Arg Asp Pro
130 135 140
Gly Ile Ala Glu Ala Ala Val Arg Val Ala Lys Gly Leu Arg Ser Leu
145 150 155 160
Ile Gly Phe Asp Arg Val Met Ile Tyr Arg Phe Asp Glu Glu Trp Asn
165 170 175
Gly Asp Ile Ile Ala Glu Ala Arg Lys Pro Glu Leu Glu Ala Tyr Leu
180 185 190
Gly Leu His Phe Pro Ala Ser Leu Thr Pro Ala Gln Ala Arg Ala Leu
195 200 205
Tyr Leu Arg Asn Arg Val Arg Gln Ile Ala Asp Val Gly Tyr Gln Pro
210 215 220
Ser Pro Ile Gln Pro Thr Val His Pro Gln Leu Gly Thr Pro Val Asp
225 230 235 240
Leu Ser Asp Val Ser Leu Arg Ser Val Ser Pro Cys His Leu Glu Tyr
245 250 255
Leu Ala Asn Met Gly Val Thr Ala Thr Leu Val Ala Ser Ile Val Val
260 265 270
Asn Asp Ala Leu Trp Gly Leu Ile Val Cys His His Tyr Ser Pro His
275 280 285
Phe Thr Asn His Ala Met Arg Asp Val Thr Asp Ala Val Ala Arg Thr
290 295 300
Leu Ala Gly Arg Ile Gly Ala Leu Gln Ala Val Ala Arg Ala Arg Leu
305 310 315 320
Glu
<210> 2
<211> 321
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Met Val Ser Thr Ala Thr Asp Pro Leu Asp Leu Asp Val Cys Ala Arg
1 5 10 15
Glu Pro Ile His Ile Pro Gly Leu Ile Gln Pro Tyr Gly Ala Leu Leu
20 25 30
Val Val Asp Pro Ala Asp Gly Arg Ile Val Gln Ala Ser Thr Thr Ala
35 40 45
Ala Asp Leu Leu Gly Val Pro Met Ala Ala Leu Leu Gly Met Pro Tyr
50 55 60
Thr Gln Val Leu Thr Leu Pro Glu Ala Gln Pro Phe Ala Val Asp Asp
65 70 75 80
Gln Pro Gln His Leu Met His Ala Glu Val Arg Phe Pro Arg Arg Ala
85 90 95
Thr Pro Pro Ala Ser Ala Tyr Val Ala Ala Trp His Leu Tyr Pro Gln
100 105 110
Gln Trp Leu Val Glu Ile Glu Pro Gly Asp Ala Arg Leu Leu Asp Thr
115 120 125
Val Leu Arg Glu Ala Leu Pro Leu Leu Arg Ser Val Glu Arg Asp Pro
130 135 140
Gly Ile Ala Glu Ala Ala Val Arg Val Ala Lys Gly Leu Arg Ser Leu
145 150 155 160
Ile Gly Phe Asp Arg Val Met Ile Tyr Arg Phe Asp Glu Glu Trp Asn
165 170 175
Gly Asp Ile Ile Ala Glu Ala Arg Lys Pro Glu Leu Glu Ala Tyr Leu
180 185 190
Gly Leu His Tyr Pro Ala Ser Leu Thr Pro Ala Leu Ala Arg Ala Leu
195 200 205
Tyr Leu Arg Asn Arg Val Arg Gln Ile Ala Asp Val Gly Tyr Gln Pro
210 215 220
Ser Pro Ile Gln Pro Thr Met His Pro Gln Leu Gly Thr Pro Val Asp
225 230 235 240
Leu Ser Asp Val Ser Leu Arg Ser Met Ser Pro Cys His Leu Glu Phe
245 250 255
Leu Ala Asn Ile Gly Val Ser Ala Thr Leu Val Ala Ser Ile Val Val
260 265 270
Asn Asp Ala Leu Trp Gly Leu Ile Val Cys His His Tyr Ser Pro Arg
275 280 285
Phe Thr Asn His Ala Leu Arg Ala Leu Thr Asp Ala Val Ala Lys Thr
290 295 300
Leu Ala Ala Arg Ile Gly Ala Leu Gln Ala Glu Ala Arg Ala Arg Leu
305 310 315 320
Glu
<210> 3
<211> 963
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
atggtgagca ccgctaccga tcccctcgac ctggatgtgt gtgccagaga gcccatccac 60
atcccaggac tgatccagcc ttacggcgcg ctgctcgtgg tcgaccctgc cgacggaaga 120
atcgtgcagg cctctacaac agcagccgat cttctgggag tgcctatggc tgcgctgctg 180
ggcatgcctt acacccaggt gctgacactg cctgaggcac agcccttcgc cgtggacgat 240
cagccacagc acctgatgca tgccgaggtg cggttccctc ggagagccac acctcctgcc 300
tctgcttatg tggctgcctg gcatctttat ccccagcagt ggctggtgga aattgaaccc 360
ggggacgcca gactgctgga caccgtgctg agagaagccc tgcctctcct gcggagcgtg 420
gagagagatc ccggaattgc cgaagccgct gtgcgggtgg ccaagggcct gagatctctg 480
atcggcttcg accgcgtgat gatctacaga ttcgacgagg aatggaacgg cgacatcatt 540
gccgaggctc ggaagcctga gctggaagcc tatctgggac tccactaccc tgccagcctg 600
acccctgctc tggccagagc cctgtacctg cggaatagag tgcggcagat cgccgacgtg 660
ggctaccagc ctagccctat ccagcctacc atgcaccctc agctgggcac ccctgtggat 720
ctgtccgatg tgtccctgag aagcatgtct ccatgccacc tggaattcct ggccaacatc 780
ggtgtgagcg ctaccctggt cgccagcatc gtcgtgaacg atgccctgtg gggactgatc 840
gtctgccacc actacagccc aagattcacc aaccacgccc tgcgcgcctt gacagacgcc 900
gtggctaaaa cactggctgc cagaattggc gccctgcagg ctgaggccag agccaggctg 960
gag 963
<210> 4
<211> 321
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 4
Met Val Ser Thr Ala Thr Asn Pro Leu Asp Leu Asp Val Cys Ala Arg
1 5 10 15
Glu Pro Ile His Ile Pro Gly Leu Ile Gln Pro Tyr Gly Val Leu Leu
20 25 30
Val Ile Asp Pro Ala Asp Gly Arg Ile Val Gln Ala Ser Thr Thr Ala
35 40 45
Ala Asp Leu Leu Gly Val Pro Met Ala Ala Leu Leu Gly Met Pro Tyr
50 55 60
Thr Gln Val Leu Thr Leu Pro Glu Ala Gln Pro Phe Ala Val Asp Asp
65 70 75 80
Gln Pro Gln His Leu Met His Ala Glu Val Arg Phe Pro Arg Arg Ala
85 90 95
Thr Pro Pro Ala Ser Ala Trp Val Ala Ala Trp His Leu Tyr Pro Gln
100 105 110
Gln Trp Leu Val Glu Met Glu Pro Arg Asp Ala Arg Leu Leu Asp Val
115 120 125
Thr Leu Arg Glu Ala Met Pro Leu Leu Arg Ser Val Glu Arg Asp Pro
130 135 140
Gly Ile Ala Glu Ala Ala Val Arg Val Ala Lys Gly Leu Arg Ser Leu
145 150 155 160
Ile Gly Phe Asp Arg Val Met Ile Tyr Arg Phe Asp Glu Glu Trp Asn
165 170 175
Gly Asp Ile Ile Ala Glu Ala Arg Lys Pro Glu Leu Glu Ala Tyr Leu
180 185 190
Gly Leu His Phe Pro Ala Ser Leu Thr Pro Ala Gln Ala Arg Ala Leu
195 200 205
Tyr Leu Arg Asn Arg Val Arg Gln Ile Ala Asp Val Gly Tyr Gln Pro
210 215 220
Ser Pro Ile Gln Pro Thr Val His Pro Gln Leu Gly Thr Pro Val Asp
225 230 235 240
Leu Ser Asp Val Ser Leu Arg Ser Met Ser Pro Cys His Leu Glu Phe
245 250 255
Leu Ala Asn Met Gly Val Thr Ala Thr Leu Val Ala Ser Ile Val Val
260 265 270
Asn Asp Ala Leu Trp Gly Leu Ile Val Cys His His Tyr Ser Pro His
275 280 285
Phe Thr Asn His Ala Met Arg Asp Val Thr Asp Ala Val Ala Arg Thr
290 295 300
Leu Ala Gly Arg Ile Gly Ala Leu Gln Ala Val Ala Arg Ala Arg Leu
305 310 315 320
Glu
<210> 5
<211> 321
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 5
Met Val Ser Thr Ala Thr Asn Pro Leu Asp Leu Asp Val Cys Ala Arg
1 5 10 15
Glu Pro Ile His Ile Pro Gly Leu Ile Gln Pro Tyr Gly Val Leu Leu
20 25 30
Val Val Asp Pro Ala Asp Gly Arg Ile Val Gln Ala Ser Thr Thr Ala
35 40 45
Ala Asp Leu Leu Gly Val Pro Met Ala Ala Leu Leu Gly Met Pro Tyr
50 55 60
Thr Gln Val Leu Thr Leu Pro Glu Ala Gln Pro Phe Ala Val Asp Asp
65 70 75 80
Gln Pro Gln His Leu Met His Ala Glu Val Arg Phe Pro Arg Arg Ala
85 90 95
Thr Pro Pro Ala Ser Ala Tyr Val Ala Ala Trp His Leu Tyr Pro Gln
100 105 110
Gln Trp Leu Val Glu Ile Glu Pro Arg Asp Ala Arg Leu Leu Asp Val
115 120 125
Thr Leu Arg Glu Ala Met Pro Leu Leu Arg Ser Val Glu Arg Asp Pro
130 135 140
Gly Ile Ala Glu Ala Ala Val Arg Val Ala Lys Gly Leu Arg Ser Leu
145 150 155 160
Ile Gly Phe Asp Arg Val Met Ile Tyr Arg Phe Asp Glu Glu Trp Asn
165 170 175
Gly Asp Ile Ile Ala Glu Ala Arg Lys Pro Glu Leu Glu Ala Tyr Leu
180 185 190
Gly Leu His Phe Pro Ala Ser Leu Thr Pro Ala Gln Ala Arg Ala Leu
195 200 205
Tyr Leu Arg Asn Arg Val Arg Gln Ile Ala Asp Val Gly Tyr Gln Pro
210 215 220
Ser Pro Ile Gln Pro Thr Val His Pro Gln Leu Gly Thr Pro Val Asp
225 230 235 240
Leu Ser Asp Val Ser Leu Arg Ser Met Ser Pro Cys His Leu Glu Phe
245 250 255
Leu Ala Asn Met Gly Val Thr Ala Thr Leu Val Ala Ser Ile Val Val
260 265 270
Asn Asp Ala Leu Trp Gly Leu Ile Val Cys His His Tyr Ser Pro His
275 280 285
Phe Thr Asn His Ala Met Arg Asp Val Thr Asp Ala Val Ala Arg Thr
290 295 300
Leu Ala Gly Arg Ile Gly Ala Leu Gln Ala Val Ala Arg Ala Arg Leu
305 310 315 320
Glu
<210> 6
<211> 321
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Met Val Ser Thr Ala Thr Asn Pro Leu Asp Leu Asp Val Cys Ala Arg
1 5 10 15
Glu Pro Ile His Ile Pro Gly Leu Ile Gln Pro Tyr Gly Val Leu Leu
20 25 30
Val Val Asp Pro Ala Asp Gly Arg Ile Val Gln Ala Ser Thr Thr Ala
35 40 45
Ala Asp Leu Leu Gly Val Pro Met Ala Ala Leu Leu Gly Met Pro Tyr
50 55 60
Thr Gln Val Leu Thr Leu Pro Glu Ala Gln Pro Phe Ala Val Asp Asp
65 70 75 80
Gln Pro Gln His Leu Met His Ala Glu Val Arg Phe Pro Arg Arg Ala
85 90 95
Thr Pro Pro Ala Ser Ala Tyr Val Ala Ala Trp His Leu Tyr Pro Gln
100 105 110
Gln Trp Leu Val Glu Ile Glu Pro Arg Asp Ala Arg Leu Leu Asp Val
115 120 125
Thr Leu Arg Glu Ala Met Pro Leu Leu Arg Ser Val Glu Arg Asp Pro
130 135 140
Gly Ile Ala Glu Ala Ala Val Arg Val Ala Lys Gly Leu Arg Ser Leu
145 150 155 160
Ile Gly Phe Asp Arg Val Met Ile Tyr Arg Phe Asp Glu Glu Trp Asn
165 170 175
Gly Asp Ile Ile Ala Glu Ala Arg Lys Pro Glu Leu Glu Ala Tyr Leu
180 185 190
Gly Leu His Phe Pro Ala Ser Leu Thr Pro Ala Gln Ala Arg Ala Leu
195 200 205
Tyr Leu Arg Asn Arg Val Arg Gln Ile Ala Asp Val Gly Tyr Gln Pro
210 215 220
Ser Pro Ile Gln Pro Thr Val His Pro Gln Leu Gly Thr Pro Val Asp
225 230 235 240
Leu Ser Asp Val Ser Leu Arg Ser Met Ser Pro Cys His Leu Glu Phe
245 250 255
Leu Ala Asn Met Gly Val Thr Ala Thr Leu Val Ala Ser Ile Val Val
260 265 270
Asn Asp Ala Leu Trp Gly Leu Ile Val Cys His His Tyr Ser Pro Arg
275 280 285
Phe Thr Asn His Ala Leu Arg Ala Val Thr Asp Ala Val Ala Lys Thr
290 295 300
Leu Ala Ala Arg Ile Ser Ala Leu Gln Ala Val Ala Arg Ala Arg Leu
305 310 315 320
Glu
<210> 7
<211> 321
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 7
Met Val Ser Thr Ala Thr Asn Pro Leu Asp Leu Asp Val Cys Ala Arg
1 5 10 15
Val Pro Ile His Ile Pro Gly Leu Ile Gln Pro Tyr Gly Val Leu Leu
20 25 30
Val Val Asp Pro Ala Asp Gly Arg Ile Val Gln Ala Ser Thr Thr Ala
35 40 45
Ala Asp Leu Leu Gly Val Pro Met Ala Ala Leu Leu Gly Met Pro Tyr
50 55 60
Thr Gln Val Leu Thr Leu Pro Glu Ala Gln Pro Phe Ala Val Asp Asp
65 70 75 80
Gln Pro Gln His Leu Met His Ala Glu Val Arg Phe Pro Arg Arg Ala
85 90 95
Thr Pro Pro Ala Ser Ala Tyr Val Ala Ala Trp His Leu Tyr Pro Gln
100 105 110
Gln Trp Leu Val Glu Ile Glu Pro Arg Asp Ala Arg Leu Leu Asp Val
115 120 125
Thr Leu Arg Glu Ala Met Pro Leu Leu Arg Ser Val Glu Arg Asp Pro
130 135 140
Gly Ile Ala Glu Ala Ala Val Arg Val Ala Lys Gly Leu Arg Ser Leu
145 150 155 160
Ile Gly Phe Asp Arg Val Met Ile Tyr Arg Phe Asp Glu Glu Trp Asn
165 170 175
Gly Asp Ile Ile Ala Glu Ala Arg Lys Pro Glu Leu Glu Ala Tyr Leu
180 185 190
Gly Leu His Phe Pro Ala Ser Leu Thr Pro Ala Leu Ala Arg Ala Leu
195 200 205
Tyr Leu Arg Asn Arg Val Arg Gln Ile Ala Asp Val Gly Tyr Gln Pro
210 215 220
Ser Pro Ile Gln Pro Thr Val His Pro Gln Leu Gly Thr Pro Val Asp
225 230 235 240
Leu Ser Asp Val Ser Leu Arg Ser Met Ser Pro Cys His Leu Glu Phe
245 250 255
Leu Ala Asn Met Gly Val Ser Ala Thr Leu Val Ala Ser Ile Val Val
260 265 270
Asn Asp Ala Leu Trp Gly Leu Ile Val Cys His His Tyr Ser Pro Arg
275 280 285
Phe Thr Asn His Ala Leu Arg Ala Val Thr Asp Ala Val Ala Lys Thr
290 295 300
Leu Ala Ala Arg Ile Ser Ala Leu Gln Ala Val Ala Arg Ala Arg Leu
305 310 315 320
Glu
<210> 8
<211> 2
<212> PRT
<213> 人工序列(Artificial Sequence)
<210> 8
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ggcggaagcg gaggcggtac c 21
Claims (9)
1.一种近红外荧光蛋白,其特征在于,所述近红外荧光蛋白的氨基酸序列如SEQ IDNo.2所示;
及,所述近红外荧光蛋白为单体蛋白。
2.根据权利要求1所述的近红外荧光蛋白,其特征在于,所述近红外荧光蛋白的编码序列如SEQ ID No.3所示;
及,所述近红外荧光蛋白的量子产率为19.4%;
及,所述近红外荧光蛋白的激发峰值为633nm,所述近红外荧光蛋白的发射峰值为663nm。
3.一种重组载体,其特征在于,包括权利要求1~2任一项所述的近红外荧光蛋白的编码序列。
4.根据权利要求3所述的重组载体,其特征在于,还包括发色团的编码序列,所述发色团的编码序列与所述近红外荧光蛋白的编码序列连接。
5.一种重组细胞,其特征在于,包括权利要求1~2任一项所述的近红外荧光蛋白的编码序列或者权利要求3~4任一项所述的重组载体。
6.一种检测试剂,其特征在于,包括权利要求1~2任一项所述的近红外荧光蛋白。
7.根据权利要求6所述的检测试剂,其特征在于,还包括非近红外荧光蛋白,所述非近红外荧光蛋白包括青色荧光蛋白、黄色荧光蛋白、红色荧光蛋白及蓝色荧光蛋白中的至少一种。
8.根据权利要求6所述的检测试剂,其特征在于,所述检测试剂为蛋白标签。
9.权利要求1~2任一项所述的近红外荧光蛋白、权利要求3~4任一项所述的重组载体、权利要求5所述的重组细胞或者权利要求6~8任一项所述的检测试剂在制备检测装置中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911289599.4A CN112961225B (zh) | 2019-12-14 | 2019-12-14 | 近红外荧光蛋白、重组载体、重组细胞及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911289599.4A CN112961225B (zh) | 2019-12-14 | 2019-12-14 | 近红外荧光蛋白、重组载体、重组细胞及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112961225A CN112961225A (zh) | 2021-06-15 |
CN112961225B true CN112961225B (zh) | 2022-08-19 |
Family
ID=76270878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911289599.4A Active CN112961225B (zh) | 2019-12-14 | 2019-12-14 | 近红外荧光蛋白、重组载体、重组细胞及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112961225B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114181286A (zh) * | 2021-11-01 | 2022-03-15 | 清华大学 | 一种纳米蛋白复合物、药物递送系统及应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109134644A (zh) * | 2018-08-30 | 2019-01-04 | 华中农业大学 | 远红光荧光蛋白及其融合蛋白 |
CN110386977A (zh) * | 2019-07-01 | 2019-10-29 | 广州天宝颂原生物科技开发有限公司 | 一种近红外光荧光蛋白及其融合蛋白 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9296797B2 (en) * | 2007-07-03 | 2016-03-29 | Wisconsin Alumni Research Foundation | Phytochrome-based fluorophores |
CN109762050B (zh) * | 2015-12-31 | 2020-08-28 | 深圳先进技术研究院 | 可用于高灵敏fret成像的荧光蛋白对及其应用 |
US10442839B2 (en) * | 2016-04-27 | 2019-10-15 | Albert Einstein College Of Medicine | Monomeric near-infrared fluorescent proteins engineered from bacterial phytochromes and methods for making same |
US11275079B2 (en) * | 2017-07-03 | 2022-03-15 | Massachusetts Institute Of Technology | Genetically encoded red fluorescent voltage sensors enabling millivolt-resolution and high-speed neural voltage imaging |
-
2019
- 2019-12-14 CN CN201911289599.4A patent/CN112961225B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109134644A (zh) * | 2018-08-30 | 2019-01-04 | 华中农业大学 | 远红光荧光蛋白及其融合蛋白 |
CN110386977A (zh) * | 2019-07-01 | 2019-10-29 | 广州天宝颂原生物科技开发有限公司 | 一种近红外光荧光蛋白及其融合蛋白 |
Also Published As
Publication number | Publication date |
---|---|
CN112961225A (zh) | 2021-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105504027B (zh) | 可用于高灵敏fret成像的荧光蛋白对及其应用 | |
CN109134644B (zh) | 远红光荧光蛋白及其融合蛋白 | |
CN108395484A (zh) | 支链氨基酸荧光探针及其应用 | |
CN109627344A (zh) | cAMP荧光探针及其应用 | |
CN106831971B (zh) | 一种远红色荧光蛋白、融合蛋白、分离的核酸、载体和应用 | |
US20130344591A1 (en) | Modified Fluorescent Proteins and Methods for Using Same | |
CN112961225B (zh) | 近红外荧光蛋白、重组载体、重组细胞及其应用 | |
US11021523B2 (en) | Cyanobacteriochromes active in the far-red to near-infrared | |
CN105585625B (zh) | 一种增强型绿色荧光蛋白 | |
US20210179675A1 (en) | Small near-infrared fluorescent proteins developed from cyanobacteriochrome and methods for their engineering | |
CN109517057B (zh) | 经基因改造的新型bdfp荧光蛋白及其融合蛋白 | |
CN109265523B (zh) | 源自bdfp近红外光荧光蛋白的新型荧光标记物及其融合蛋白 | |
US20180201655A1 (en) | ALLOPHYCOCYANIN ALPHA-SUBUNIT EVOLVED LABELING PROTEINS (smURFPs) | |
US10962528B2 (en) | Blue fluorescent protein monomers and uses thereof | |
KR101833896B1 (ko) | 플라빈 기반 형광 단백질 변이체 | |
US9023998B2 (en) | Near infrared fluorogen and fluorescent activating proteins for in vivo imaging and live-cell biosensing | |
CN109957604B (zh) | 一种荧光素酶荧光互补体系及其制备方法和应用 | |
CN109651495B (zh) | 橙色荧光蛋白、核酸分子、载体、融合蛋白和应用 | |
KR102210877B1 (ko) | 형광세기가 향상된 애기장대 유래 플라빈 모노뉴클레오타이드 결합 단백질 변이체들 | |
CN108659110B (zh) | 一种改进的红色荧光蛋白及其应用 | |
CN106632640B (zh) | 一种红色荧光蛋白、融合蛋白、分离的核酸、载体和应用 | |
KR20100119104A (ko) | 새로운 리포터와 분자 탐침자로서 빠르고 강한 형광이 유도되는 적색 형광 단백질 FmRed | |
KR102520959B1 (ko) | 형광세기가 향상된 슈도모나스 푸티다 유래 플라빈 모노뉴클레오타이드 결합 단백질 변이체들 | |
US20210347833A1 (en) | Blue fluorescent protein monomers and uses thereof | |
TWI580691B (zh) | 源自地毯海葵之藍色螢光蛋白 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240807 Address after: Room 402, building 24, Yuzhou Zunfu, Jinghai Town, Jinghai District, Tianjin Patentee after: Tianjin Haoning Technology Service Co.,Ltd. Country or region after: China Address before: 1068 No. 518055 Guangdong city in Shenzhen Province, Nanshan District City Xili University School Avenue Patentee before: SHENZHEN INSTITUTES OF ADVANCED TECHNOLOGY Country or region before: China |
|
TR01 | Transfer of patent right |