KR20230124938A - 복수의 표적 분자와 함께 복합체를 형성할 수 있는후보 분자의 스크리닝 방법 - Google Patents
복수의 표적 분자와 함께 복합체를 형성할 수 있는후보 분자의 스크리닝 방법 Download PDFInfo
- Publication number
- KR20230124938A KR20230124938A KR1020237022183A KR20237022183A KR20230124938A KR 20230124938 A KR20230124938 A KR 20230124938A KR 1020237022183 A KR1020237022183 A KR 1020237022183A KR 20237022183 A KR20237022183 A KR 20237022183A KR 20230124938 A KR20230124938 A KR 20230124938A
- Authority
- KR
- South Korea
- Prior art keywords
- molecule
- target molecule
- seq
- protein
- amino acid
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 282
- 238000012216 screening Methods 0.000 title claims abstract description 90
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 244
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 237
- 238000012360 testing method Methods 0.000 claims abstract description 93
- 150000001413 amino acids Chemical class 0.000 claims description 250
- 102000044159 Ubiquitin Human genes 0.000 claims description 52
- 108090000848 Ubiquitin Proteins 0.000 claims description 52
- 238000002156 mixing Methods 0.000 claims description 41
- 239000002157 polynucleotide Substances 0.000 claims description 29
- 102000040430 polynucleotide Human genes 0.000 claims description 28
- 108091033319 polynucleotide Proteins 0.000 claims description 28
- 238000010828 elution Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 15
- 108060001084 Luciferase Proteins 0.000 claims description 14
- 102000004190 Enzymes Human genes 0.000 claims description 13
- 108090000790 Enzymes Proteins 0.000 claims description 13
- 238000000338 in vitro Methods 0.000 claims description 13
- 239000005089 Luciferase Substances 0.000 claims description 11
- 108040000979 soluble NSF attachment protein activity proteins Proteins 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 6
- 238000011084 recovery Methods 0.000 abstract description 72
- 238000005516 engineering process Methods 0.000 abstract description 12
- 150000007523 nucleic acids Chemical class 0.000 description 109
- 102000039446 nucleic acids Human genes 0.000 description 103
- 108020004707 nucleic acids Proteins 0.000 description 103
- 108020004414 DNA Proteins 0.000 description 94
- 102000053602 DNA Human genes 0.000 description 94
- 230000027455 binding Effects 0.000 description 86
- 108090000765 processed proteins & peptides Proteins 0.000 description 81
- 229940024606 amino acid Drugs 0.000 description 73
- 150000001875 compounds Chemical class 0.000 description 71
- 238000006243 chemical reaction Methods 0.000 description 53
- 108020004999 messenger RNA Proteins 0.000 description 53
- 108700002875 GFP10 Proteins 0.000 description 48
- 239000000872 buffer Substances 0.000 description 46
- 108091028043 Nucleic acid sequence Proteins 0.000 description 42
- 210000004027 cell Anatomy 0.000 description 41
- 238000011529 RT qPCR Methods 0.000 description 39
- 229960002930 sirolimus Drugs 0.000 description 39
- 230000014616 translation Effects 0.000 description 39
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 38
- 239000000203 mixture Substances 0.000 description 37
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 37
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 36
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 36
- 241000282326 Felis catus Species 0.000 description 35
- 239000000243 solution Substances 0.000 description 34
- 241000588724 Escherichia coli Species 0.000 description 32
- 239000013598 vector Substances 0.000 description 32
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 31
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 31
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 31
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 30
- 238000004091 panning Methods 0.000 description 30
- 229920002477 rna polymer Polymers 0.000 description 30
- 108010076818 TEV protease Proteins 0.000 description 29
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 29
- 238000013519 translation Methods 0.000 description 29
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 27
- 239000013604 expression vector Substances 0.000 description 27
- 108700043045 nanoluc Proteins 0.000 description 26
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 26
- 108010054155 lysyllysine Proteins 0.000 description 25
- 108010090804 Streptavidin Proteins 0.000 description 24
- 239000011324 bead Substances 0.000 description 24
- 102000004196 processed proteins & peptides Human genes 0.000 description 23
- 108020004566 Transfer RNA Proteins 0.000 description 22
- 230000015572 biosynthetic process Effects 0.000 description 22
- 229960002685 biotin Drugs 0.000 description 22
- 239000011616 biotin Substances 0.000 description 22
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 21
- 238000003556 assay Methods 0.000 description 21
- 230000003993 interaction Effects 0.000 description 21
- 239000000047 product Substances 0.000 description 21
- 229950010131 puromycin Drugs 0.000 description 21
- 238000004458 analytical method Methods 0.000 description 20
- 238000003752 polymerase chain reaction Methods 0.000 description 19
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 18
- 108010047857 aspartylglycine Proteins 0.000 description 18
- 108010078144 glutaminyl-glycine Proteins 0.000 description 18
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 17
- 235000020958 biotin Nutrition 0.000 description 17
- 239000012634 fragment Substances 0.000 description 17
- 238000002824 mRNA display Methods 0.000 description 17
- 238000002360 preparation method Methods 0.000 description 17
- 108010034529 leucyl-lysine Proteins 0.000 description 16
- 239000006228 supernatant Substances 0.000 description 16
- 102000037865 fusion proteins Human genes 0.000 description 15
- 108020001507 fusion proteins Proteins 0.000 description 15
- 239000011780 sodium chloride Substances 0.000 description 15
- 239000007787 solid Substances 0.000 description 15
- 238000003786 synthesis reaction Methods 0.000 description 15
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 14
- 238000000746 purification Methods 0.000 description 14
- ZMANZCXQSJIPKH-UHFFFAOYSA-N Triethylamine Chemical compound CCN(CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-N 0.000 description 12
- 210000004900 c-terminal fragment Anatomy 0.000 description 12
- 238000003776 cleavage reaction Methods 0.000 description 12
- 210000004898 n-terminal fragment Anatomy 0.000 description 12
- 230000007017 scission Effects 0.000 description 12
- 108010061238 threonyl-glycine Proteins 0.000 description 12
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 11
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 11
- 108010070643 prolylglutamic acid Proteins 0.000 description 11
- 238000010839 reverse transcription Methods 0.000 description 11
- 239000000523 sample Substances 0.000 description 11
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 11
- 108010073969 valyllysine Proteins 0.000 description 11
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 10
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 10
- 108010037850 glycylvaline Proteins 0.000 description 10
- 239000002609 medium Substances 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 108010012581 phenylalanylglutamate Proteins 0.000 description 10
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 9
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 9
- 241000880493 Leptailurus serval Species 0.000 description 9
- CGNLCCVKSWNSDG-UHFFFAOYSA-N SYBR Green I Chemical compound CN(C)CCCN(CCC)C1=CC(C=C2N(C3=CC=CC=C3S2)C)=C2C=CC=CC2=[N+]1C1=CC=CC=C1 CGNLCCVKSWNSDG-UHFFFAOYSA-N 0.000 description 9
- 108010006785 Taq Polymerase Proteins 0.000 description 9
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 9
- 229960000723 ampicillin Drugs 0.000 description 9
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 9
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 9
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 8
- 108010070675 Glutathione transferase Proteins 0.000 description 8
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 8
- 241000723792 Tobacco etch virus Species 0.000 description 8
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 8
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 8
- 238000011088 calibration curve Methods 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 8
- 238000001514 detection method Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- 238000009396 hybridization Methods 0.000 description 8
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 8
- 125000003729 nucleotide group Chemical group 0.000 description 8
- 108010048818 seryl-histidine Proteins 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 7
- NECWUSYTYSIFNC-DLOVCJGASA-N Asp-Ala-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 NECWUSYTYSIFNC-DLOVCJGASA-N 0.000 description 7
- 108010069514 Cyclic Peptides Proteins 0.000 description 7
- 102000001189 Cyclic Peptides Human genes 0.000 description 7
- 241000196324 Embryophyta Species 0.000 description 7
- OGMQXTXGLDNBSS-FXQIFTODSA-N Glu-Ala-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O OGMQXTXGLDNBSS-FXQIFTODSA-N 0.000 description 7
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 7
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 7
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 7
- 101150105104 Kras gene Proteins 0.000 description 7
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 7
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 7
- UCXQIIIFOOGYEM-ULQDDVLXSA-N Leu-Pro-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCXQIIIFOOGYEM-ULQDDVLXSA-N 0.000 description 7
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 7
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 7
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 7
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 7
- 230000006287 biotinylation Effects 0.000 description 7
- 238000007413 biotinylation Methods 0.000 description 7
- 238000006911 enzymatic reaction Methods 0.000 description 7
- 239000000499 gel Substances 0.000 description 7
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 7
- 238000010438 heat treatment Methods 0.000 description 7
- 108010025306 histidylleucine Proteins 0.000 description 7
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 7
- 241000264288 mixed libraries Species 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 238000001243 protein synthesis Methods 0.000 description 7
- 239000011535 reaction buffer Substances 0.000 description 7
- 230000001131 transforming effect Effects 0.000 description 7
- 108010084932 tryptophyl-proline Proteins 0.000 description 7
- 238000012795 verification Methods 0.000 description 7
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 6
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 6
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 6
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 6
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 6
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 6
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 6
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 6
- FDKDGFGTHGJKNV-FHWLQOOXSA-N Tyr-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FDKDGFGTHGJKNV-FHWLQOOXSA-N 0.000 description 6
- LKUDRJSNRWVGMS-QSFUFRPTSA-N Val-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LKUDRJSNRWVGMS-QSFUFRPTSA-N 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- 238000000502 dialysis Methods 0.000 description 6
- 238000010790 dilution Methods 0.000 description 6
- 239000012895 dilution Substances 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 6
- 108010050848 glycylleucine Proteins 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 108010012058 leucyltyrosine Proteins 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 238000004321 preservation Methods 0.000 description 6
- 108010015796 prolylisoleucine Proteins 0.000 description 6
- 239000000758 substrate Substances 0.000 description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 5
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 5
- PYXXJFRXIYAESU-PCBIJLKTSA-N Asp-Ile-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PYXXJFRXIYAESU-PCBIJLKTSA-N 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 5
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 5
- DSZFTPCSFVWMKP-DCAQKATOSA-N Met-Ser-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN DSZFTPCSFVWMKP-DCAQKATOSA-N 0.000 description 5
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 5
- 108010079364 N-glycylalanine Proteins 0.000 description 5
- 108091005804 Peptidases Proteins 0.000 description 5
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 5
- 239000004365 Protease Substances 0.000 description 5
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 5
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 5
- 101710137500 T7 RNA polymerase Proteins 0.000 description 5
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 5
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 239000011230 binding agent Substances 0.000 description 5
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 5
- 108010079547 glutamylmethionine Proteins 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- 108010085325 histidylproline Proteins 0.000 description 5
- 108010003700 lysyl aspartic acid Proteins 0.000 description 5
- 108010009298 lysylglutamic acid Proteins 0.000 description 5
- 230000014759 maintenance of location Effects 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 235000019419 proteases Nutrition 0.000 description 5
- 230000004850 protein–protein interaction Effects 0.000 description 5
- 239000011541 reaction mixture Substances 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 108010071207 serylmethionine Proteins 0.000 description 5
- IGXNPQWXIRIGBF-KEOOTSPTSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IGXNPQWXIRIGBF-KEOOTSPTSA-N 0.000 description 4
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 4
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 4
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 4
- JNJHNBXBGNJESC-KKXDTOCCSA-N Ala-Tyr-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JNJHNBXBGNJESC-KKXDTOCCSA-N 0.000 description 4
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 4
- YFBGNGASPGRWEM-DCAQKATOSA-N Arg-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFBGNGASPGRWEM-DCAQKATOSA-N 0.000 description 4
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 4
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 4
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 4
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 4
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 4
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 4
- UWOPETAWXDZUJR-ACZMJKKPSA-N Asp-Cys-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O UWOPETAWXDZUJR-ACZMJKKPSA-N 0.000 description 4
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 4
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 4
- SWTQDYFZVOJVLL-KKUMJFAQSA-N Asp-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N)O SWTQDYFZVOJVLL-KKUMJFAQSA-N 0.000 description 4
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 4
- AKKUDRZKFZWPBH-SRVKXCTJSA-N Asp-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N AKKUDRZKFZWPBH-SRVKXCTJSA-N 0.000 description 4
- ZXRQJQCXPSMNMR-XIRDDKMYSA-N Asp-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N ZXRQJQCXPSMNMR-XIRDDKMYSA-N 0.000 description 4
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 4
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 102100021935 C-C motif chemokine 26 Human genes 0.000 description 4
- HAYVLBZZBDCKRA-SRVKXCTJSA-N Cys-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N HAYVLBZZBDCKRA-SRVKXCTJSA-N 0.000 description 4
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 4
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 4
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 4
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 4
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 4
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 4
- YQAQQKPWFOBSMU-WDCWCFNPSA-N Glu-Thr-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O YQAQQKPWFOBSMU-WDCWCFNPSA-N 0.000 description 4
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 4
- LLXVQPKEQQCISF-YUMQZZPRSA-N Gly-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN LLXVQPKEQQCISF-YUMQZZPRSA-N 0.000 description 4
- XXGQRGQPGFYECI-WDSKDSINSA-N Gly-Cys-Glu Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(O)=O XXGQRGQPGFYECI-WDSKDSINSA-N 0.000 description 4
- UEGIPZAXNBYCCP-NKWVEPMBSA-N Gly-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)CN)C(=O)O UEGIPZAXNBYCCP-NKWVEPMBSA-N 0.000 description 4
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 4
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 4
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 4
- ULZCYBYDTUMHNF-IUCAKERBSA-N Gly-Leu-Glu Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ULZCYBYDTUMHNF-IUCAKERBSA-N 0.000 description 4
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 4
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 4
- PYFHPYDQHCEVIT-KBPBESRZSA-N Gly-Trp-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O PYFHPYDQHCEVIT-KBPBESRZSA-N 0.000 description 4
- JBJNKUOMNZGQIM-PYJNHQTQSA-N His-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JBJNKUOMNZGQIM-PYJNHQTQSA-N 0.000 description 4
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 4
- NELVFWFDOKRTOR-SDDRHHMPSA-N His-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O NELVFWFDOKRTOR-SDDRHHMPSA-N 0.000 description 4
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 4
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 4
- 101000897493 Homo sapiens C-C motif chemokine 26 Proteins 0.000 description 4
- WZPIKDWQVRTATP-SYWGBEHUSA-N Ile-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 WZPIKDWQVRTATP-SYWGBEHUSA-N 0.000 description 4
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 4
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 4
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 4
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 4
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 4
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 4
- 102000000521 Immunophilins Human genes 0.000 description 4
- 108010016648 Immunophilins Proteins 0.000 description 4
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 4
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 4
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 4
- QONKWXNJRRNTBV-AVGNSLFASA-N Leu-Pro-Met Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N QONKWXNJRRNTBV-AVGNSLFASA-N 0.000 description 4
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 4
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 4
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 4
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 4
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 4
- CANPXOLVTMKURR-WEDXCCLWSA-N Lys-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN CANPXOLVTMKURR-WEDXCCLWSA-N 0.000 description 4
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 4
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 4
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 4
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 4
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 4
- DNDVVILEHVMWIS-LPEHRKFASA-N Met-Asp-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DNDVVILEHVMWIS-LPEHRKFASA-N 0.000 description 4
- PTYVBBNIAQWUFV-DCAQKATOSA-N Met-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCSC)N PTYVBBNIAQWUFV-DCAQKATOSA-N 0.000 description 4
- AWOMRHGUWFBDNU-ZPFDUUQYSA-N Met-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N AWOMRHGUWFBDNU-ZPFDUUQYSA-N 0.000 description 4
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 4
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 4
- YLBUMXYVQCHBPR-ULQDDVLXSA-N Met-Leu-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YLBUMXYVQCHBPR-ULQDDVLXSA-N 0.000 description 4
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 4
- FBLBCGLSRXBANI-KKUMJFAQSA-N Met-Phe-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FBLBCGLSRXBANI-KKUMJFAQSA-N 0.000 description 4
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 4
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- DRBBFCLWYRJSJZ-UHFFFAOYSA-N N-phosphocreatine Chemical compound OC(=O)CN(C)C(=N)NP(O)(O)=O DRBBFCLWYRJSJZ-UHFFFAOYSA-N 0.000 description 4
- 101710123388 Penicillin G acylase Proteins 0.000 description 4
- 108010067902 Peptide Library Proteins 0.000 description 4
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 4
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 4
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 4
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 4
- HXOLCSYHGRNXJJ-IHRRRGAJSA-N Pro-Asp-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HXOLCSYHGRNXJJ-IHRRRGAJSA-N 0.000 description 4
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 4
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 4
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 4
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 4
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 4
- UGGWCAFQPKANMW-FXQIFTODSA-N Ser-Met-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UGGWCAFQPKANMW-FXQIFTODSA-N 0.000 description 4
- XNXRTQZTFVMJIJ-DCAQKATOSA-N Ser-Met-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNXRTQZTFVMJIJ-DCAQKATOSA-N 0.000 description 4
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 4
- 239000012505 Superdex™ Substances 0.000 description 4
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 4
- LHUBVKCLOVALIA-HJGDQZAQSA-N Thr-Arg-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LHUBVKCLOVALIA-HJGDQZAQSA-N 0.000 description 4
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 4
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 4
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 4
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 4
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 4
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 4
- PGPCENKYTLDIFM-SZMVWBNQSA-N Trp-His-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PGPCENKYTLDIFM-SZMVWBNQSA-N 0.000 description 4
- XGFGVFMXDXALEV-XIRDDKMYSA-N Trp-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N XGFGVFMXDXALEV-XIRDDKMYSA-N 0.000 description 4
- XQYHLZNPOTXRMQ-KKUMJFAQSA-N Tyr-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XQYHLZNPOTXRMQ-KKUMJFAQSA-N 0.000 description 4
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 4
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 4
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 4
- LVILBTSHPTWDGE-PMVMPFDFSA-N Tyr-Trp-Lys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(O)=O)C1=CC=C(O)C=C1 LVILBTSHPTWDGE-PMVMPFDFSA-N 0.000 description 4
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 4
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 4
- SRWWRLKBEJZFPW-IHRRRGAJSA-N Val-Cys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N SRWWRLKBEJZFPW-IHRRRGAJSA-N 0.000 description 4
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 4
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 4
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 4
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 4
- WDIWOIRFNMLNKO-ULQDDVLXSA-N Val-Leu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WDIWOIRFNMLNKO-ULQDDVLXSA-N 0.000 description 4
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 4
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 4
- TVGWMCTYUFBXAP-QTKMDUPCSA-N Val-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N)O TVGWMCTYUFBXAP-QTKMDUPCSA-N 0.000 description 4
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 4
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 4
- 108010041407 alanylaspartic acid Proteins 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 210000004102 animal cell Anatomy 0.000 description 4
- 108010062796 arginyllysine Proteins 0.000 description 4
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 108091006004 biotinylated proteins Proteins 0.000 description 4
- 210000004899 c-terminal region Anatomy 0.000 description 4
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 4
- 229960005091 chloramphenicol Drugs 0.000 description 4
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000002523 gelfiltration Methods 0.000 description 4
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 4
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 4
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 239000003999 initiator Substances 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 108010064235 lysylglycine Proteins 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 4
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 4
- 108010025488 pinealon Proteins 0.000 description 4
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 239000011347 resin Substances 0.000 description 4
- 229920005989 resin Polymers 0.000 description 4
- 210000003705 ribosome Anatomy 0.000 description 4
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 4
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 4
- ATHGHQPFGPMSJY-UHFFFAOYSA-N spermidine Chemical compound NCCCCNCCCN ATHGHQPFGPMSJY-UHFFFAOYSA-N 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 4
- 108010003137 tyrosyltyrosine Proteins 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 3
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 3
- GRPHQEMIFDPKOE-HGNGGELXSA-N Ala-His-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GRPHQEMIFDPKOE-HGNGGELXSA-N 0.000 description 3
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 3
- DEWWPUNXRNGMQN-LPEHRKFASA-N Ala-Met-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N DEWWPUNXRNGMQN-LPEHRKFASA-N 0.000 description 3
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 3
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 3
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 3
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 3
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 3
- DXQIQUIQYAGRCC-CIUDSAMLSA-N Arg-Asp-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)CN=C(N)N DXQIQUIQYAGRCC-CIUDSAMLSA-N 0.000 description 3
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 3
- VRZDJJWOFXMFRO-ZFWWWQNUSA-N Arg-Gly-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O VRZDJJWOFXMFRO-ZFWWWQNUSA-N 0.000 description 3
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 3
- DIIGDGJKTMLQQW-IHRRRGAJSA-N Arg-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N DIIGDGJKTMLQQW-IHRRRGAJSA-N 0.000 description 3
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 3
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 3
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 3
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 3
- GWNMUVANAWDZTI-YUMQZZPRSA-N Asn-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GWNMUVANAWDZTI-YUMQZZPRSA-N 0.000 description 3
- JGIAYNNXZKKKOW-KKUMJFAQSA-N Asn-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N JGIAYNNXZKKKOW-KKUMJFAQSA-N 0.000 description 3
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 3
- FODVBOKTYKYRFJ-CIUDSAMLSA-N Asn-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FODVBOKTYKYRFJ-CIUDSAMLSA-N 0.000 description 3
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 3
- MYRLSKYSMXNLLA-LAEOZQHASA-N Asn-Val-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MYRLSKYSMXNLLA-LAEOZQHASA-N 0.000 description 3
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 3
- KVMPVNGOKHTUHZ-GCJQMDKQSA-N Asp-Ala-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KVMPVNGOKHTUHZ-GCJQMDKQSA-N 0.000 description 3
- QHAJMRDEWNAIBQ-FXQIFTODSA-N Asp-Arg-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O QHAJMRDEWNAIBQ-FXQIFTODSA-N 0.000 description 3
- ZCKYZTGLXIEOKS-CIUDSAMLSA-N Asp-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N ZCKYZTGLXIEOKS-CIUDSAMLSA-N 0.000 description 3
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 3
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 3
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 3
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 3
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 3
- -1 FRB Proteins 0.000 description 3
- 102000013446 GTP Phosphohydrolases Human genes 0.000 description 3
- 108091006109 GTPases Proteins 0.000 description 3
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 3
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 3
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 3
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 3
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 3
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 3
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 3
- APHGWLWMOXGZRL-DCAQKATOSA-N Glu-Glu-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O APHGWLWMOXGZRL-DCAQKATOSA-N 0.000 description 3
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 3
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 3
- LWYUQLZOIORFFJ-XKBZYTNZSA-N Glu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O LWYUQLZOIORFFJ-XKBZYTNZSA-N 0.000 description 3
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 3
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 3
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 3
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 3
- PMNHJLASAAWELO-FOHZUACHSA-N Gly-Asp-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PMNHJLASAAWELO-FOHZUACHSA-N 0.000 description 3
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 3
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 3
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 3
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 3
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 3
- MVORZMQFXBLMHM-QWRGUYRKSA-N Gly-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 MVORZMQFXBLMHM-QWRGUYRKSA-N 0.000 description 3
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 3
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 3
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 3
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 3
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 3
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 3
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 3
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 3
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 3
- UVTSZKIATYSKIR-RYUDHWBXSA-N Gly-Tyr-Glu Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O UVTSZKIATYSKIR-RYUDHWBXSA-N 0.000 description 3
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 3
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 3
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- WGVPDSNCHDEDBP-KKUMJFAQSA-N His-Asp-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WGVPDSNCHDEDBP-KKUMJFAQSA-N 0.000 description 3
- OZBDSFBWIDPVDA-BZSNNMDCSA-N His-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N OZBDSFBWIDPVDA-BZSNNMDCSA-N 0.000 description 3
- YYOCMTFVGKDNQP-IHRRRGAJSA-N His-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N YYOCMTFVGKDNQP-IHRRRGAJSA-N 0.000 description 3
- CSTDQOOBZBAJKE-BWAGICSOSA-N His-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N)O CSTDQOOBZBAJKE-BWAGICSOSA-N 0.000 description 3
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 3
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 3
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 3
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 3
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 3
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 3
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 3
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 3
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 3
- UIEZQYNXCYHMQS-BJDJZHNGSA-N Ile-Lys-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)O)N UIEZQYNXCYHMQS-BJDJZHNGSA-N 0.000 description 3
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 3
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 3
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 3
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 3
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 3
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 3
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 3
- WRLPVDVHNWSSCL-MELADBBJSA-N Leu-His-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N WRLPVDVHNWSSCL-MELADBBJSA-N 0.000 description 3
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 3
- PDQDCFBVYXEFSD-SRVKXCTJSA-N Leu-Leu-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PDQDCFBVYXEFSD-SRVKXCTJSA-N 0.000 description 3
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 3
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 3
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 3
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 3
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 3
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- 102000003960 Ligases Human genes 0.000 description 3
- NDORZBUHCOJQDO-GVXVVHGQSA-N Lys-Gln-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O NDORZBUHCOJQDO-GVXVVHGQSA-N 0.000 description 3
- IMAKMJCBYCSMHM-AVGNSLFASA-N Lys-Glu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN IMAKMJCBYCSMHM-AVGNSLFASA-N 0.000 description 3
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 3
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 3
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 3
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 3
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 3
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 3
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 3
- CHDYFPCQVUOJEB-ULQDDVLXSA-N Met-Leu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CHDYFPCQVUOJEB-ULQDDVLXSA-N 0.000 description 3
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 3
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 3
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 3
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 3
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 3
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 3
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 3
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 3
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 3
- HATVCTYBNCNMAA-AVGNSLFASA-N Pro-Leu-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O HATVCTYBNCNMAA-AVGNSLFASA-N 0.000 description 3
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 3
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 3
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 3
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 3
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 3
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 3
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 3
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 3
- KCGIREHVWRXNDH-GARJFASQSA-N Ser-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N KCGIREHVWRXNDH-GARJFASQSA-N 0.000 description 3
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 3
- FGBLCMLXHRPVOF-IHRRRGAJSA-N Ser-Tyr-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FGBLCMLXHRPVOF-IHRRRGAJSA-N 0.000 description 3
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 3
- 108010065917 TOR Serine-Threonine Kinases Proteins 0.000 description 3
- 102000013530 TOR Serine-Threonine Kinases Human genes 0.000 description 3
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 3
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 3
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 3
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 3
- ZBKDBZUTTXINIX-RWRJDSDZSA-N Thr-Ile-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZBKDBZUTTXINIX-RWRJDSDZSA-N 0.000 description 3
- XIULAFZYEKSGAJ-IXOXFDKPSA-N Thr-Leu-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 XIULAFZYEKSGAJ-IXOXFDKPSA-N 0.000 description 3
- ISLDRLHVPXABBC-IEGACIPQSA-N Thr-Leu-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISLDRLHVPXABBC-IEGACIPQSA-N 0.000 description 3
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 3
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 3
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 3
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 3
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 3
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 3
- BXPOOVDVGWEXDU-WZLNRYEVSA-N Tyr-Ile-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BXPOOVDVGWEXDU-WZLNRYEVSA-N 0.000 description 3
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 3
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 3
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 3
- BBSPTGPYIPGTKH-JYJNAYRXSA-N Tyr-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N BBSPTGPYIPGTKH-JYJNAYRXSA-N 0.000 description 3
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 3
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 3
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 3
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 3
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 3
- HNWQUBBOBKSFQV-AVGNSLFASA-N Val-Arg-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HNWQUBBOBKSFQV-AVGNSLFASA-N 0.000 description 3
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 3
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 3
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 3
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 3
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 3
- XPKCFQZDQGVJCX-RHYQMDGZSA-N Val-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N)O XPKCFQZDQGVJCX-RHYQMDGZSA-N 0.000 description 3
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 3
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 3
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 3
- NSUUANXHLKKHQB-BZSNNMDCSA-N Val-Pro-Trp Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CNC2=CC=CC=C12 NSUUANXHLKKHQB-BZSNNMDCSA-N 0.000 description 3
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 3
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 3
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 3
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 3
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 239000007864 aqueous solution Substances 0.000 description 3
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 3
- 239000002131 composite material Substances 0.000 description 3
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 3
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 239000012149 elution buffer Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000001917 fluorescence detection Methods 0.000 description 3
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 3
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 3
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 3
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010040030 histidinoalanine Proteins 0.000 description 3
- 108010028295 histidylhistidine Proteins 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 108010012988 lysyl-glutamyl-aspartyl-glycine Proteins 0.000 description 3
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000002503 metabolic effect Effects 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 230000035699 permeability Effects 0.000 description 3
- 108010018625 phenylalanylarginine Proteins 0.000 description 3
- 229910052700 potassium Inorganic materials 0.000 description 3
- GUUBJKMBDULZTE-UHFFFAOYSA-M potassium;2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid;hydroxide Chemical compound [OH-].[K+].OCCN1CCN(CCS(O)(=O)=O)CC1 GUUBJKMBDULZTE-UHFFFAOYSA-M 0.000 description 3
- 108090000250 sortase A Proteins 0.000 description 3
- 229910052717 sulfur Inorganic materials 0.000 description 3
- 108010009962 valyltyrosine Proteins 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- XJFPXLWGZWAWRQ-UHFFFAOYSA-N 2-[[2-[[2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O XJFPXLWGZWAWRQ-UHFFFAOYSA-N 0.000 description 2
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 2
- VHYFNPMBLIVWCW-UHFFFAOYSA-N 4-Dimethylaminopyridine Chemical compound CN(C)C1=CC=NC=C1 VHYFNPMBLIVWCW-UHFFFAOYSA-N 0.000 description 2
- 102000002281 Adenylate kinase Human genes 0.000 description 2
- 108020000543 Adenylate kinase Proteins 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- CRWFEKLFPVRPBV-CIUDSAMLSA-N Ala-Gln-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O CRWFEKLFPVRPBV-CIUDSAMLSA-N 0.000 description 2
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 2
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 2
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 2
- 101000787278 Arabidopsis thaliana Valine-tRNA ligase, chloroplastic/mitochondrial 2 Proteins 0.000 description 2
- 101000787296 Arabidopsis thaliana Valine-tRNA ligase, mitochondrial 1 Proteins 0.000 description 2
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 2
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 2
- DXVMJJNAOVECBA-WHFBIAKZSA-N Asn-Gly-Asn Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O DXVMJJNAOVECBA-WHFBIAKZSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 2
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 2
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 2
- VSMYBNPOHYAXSD-GUBZILKMSA-N Asp-Lys-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O VSMYBNPOHYAXSD-GUBZILKMSA-N 0.000 description 2
- GPPIDDWYKJPRES-YDHLFZDLSA-N Asp-Phe-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GPPIDDWYKJPRES-YDHLFZDLSA-N 0.000 description 2
- KBJVTFWQWXCYCQ-IUKAMOBKSA-N Asp-Thr-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KBJVTFWQWXCYCQ-IUKAMOBKSA-N 0.000 description 2
- ZUHQCDZJPTXVCU-UHFFFAOYSA-N C1#CCCC2=CC=CC=C2C2=CC=CC=C21 Chemical group C1#CCCC2=CC=CC=C2C2=CC=CC=C21 ZUHQCDZJPTXVCU-UHFFFAOYSA-N 0.000 description 2
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 2
- 102000004631 Calcineurin Human genes 0.000 description 2
- 108010042955 Calcineurin Proteins 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 2
- 102000004420 Creatine Kinase Human genes 0.000 description 2
- 108010042126 Creatine kinase Proteins 0.000 description 2
- 102000001493 Cyclophilins Human genes 0.000 description 2
- 108010068682 Cyclophilins Proteins 0.000 description 2
- ANPADMNVVOOYKW-DCAQKATOSA-N Cys-His-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ANPADMNVVOOYKW-DCAQKATOSA-N 0.000 description 2
- ALTQTAKGRFLRLR-GUBZILKMSA-N Cys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N ALTQTAKGRFLRLR-GUBZILKMSA-N 0.000 description 2
- 101000787280 Dictyostelium discoideum Probable valine-tRNA ligase, mitochondrial Proteins 0.000 description 2
- 206010059866 Drug resistance Diseases 0.000 description 2
- 102100021309 Elongation factor Ts, mitochondrial Human genes 0.000 description 2
- 102100033238 Elongation factor Tu, mitochondrial Human genes 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- 241000672609 Escherichia coli BL21 Species 0.000 description 2
- 241000620209 Escherichia coli DH5[alpha] Species 0.000 description 2
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 2
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 2
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 2
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 2
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 2
- HXOLDXKNWKLDMM-YVNDNENWSA-N Gln-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HXOLDXKNWKLDMM-YVNDNENWSA-N 0.000 description 2
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 2
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 2
- KLKYKPXITJBSNI-CIUDSAMLSA-N Gln-Met-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O KLKYKPXITJBSNI-CIUDSAMLSA-N 0.000 description 2
- BBFCMGBMYIAGRS-AUTRQRHGSA-N Gln-Val-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BBFCMGBMYIAGRS-AUTRQRHGSA-N 0.000 description 2
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 2
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 2
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 2
- VFZIDQZAEBORGY-GLLZPBPUSA-N Glu-Gln-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VFZIDQZAEBORGY-GLLZPBPUSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- STDOKNKEXOLSII-SZMVWBNQSA-N Glu-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CCC(=O)O)N STDOKNKEXOLSII-SZMVWBNQSA-N 0.000 description 2
- HGJREIGJLUQBTJ-SZMVWBNQSA-N Glu-Trp-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O HGJREIGJLUQBTJ-SZMVWBNQSA-N 0.000 description 2
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 2
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 2
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 2
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 2
- 108010050006 Gly-Asp-Gly-Arg Proteins 0.000 description 2
- JPWIMMUNWUKOAD-STQMWFEESA-N Gly-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN JPWIMMUNWUKOAD-STQMWFEESA-N 0.000 description 2
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 2
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 2
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 2
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 2
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 2
- FXTUGWXZTFMTIV-GJZGRUSLSA-N Gly-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN FXTUGWXZTFMTIV-GJZGRUSLSA-N 0.000 description 2
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 2
- 108010051724 Glycine-tRNA Ligase Proteins 0.000 description 2
- 102100036589 Glycine-tRNA ligase Human genes 0.000 description 2
- ZRALSGWEFCBTJO-UHFFFAOYSA-N Guanidine Chemical compound NC(N)=N ZRALSGWEFCBTJO-UHFFFAOYSA-N 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- VHOLZZKNEBBHTH-YUMQZZPRSA-N His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 VHOLZZKNEBBHTH-YUMQZZPRSA-N 0.000 description 2
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 2
- WYSJPCTWSBJFCO-AVGNSLFASA-N His-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CN=CN1)N WYSJPCTWSBJFCO-AVGNSLFASA-N 0.000 description 2
- VIJMRAIWYWRXSR-CIUDSAMLSA-N His-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 VIJMRAIWYWRXSR-CIUDSAMLSA-N 0.000 description 2
- 101150117869 Hras gene Proteins 0.000 description 2
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 2
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 2
- VNDQNDYEPSXHLU-JUKXBJQTSA-N Ile-His-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N VNDQNDYEPSXHLU-JUKXBJQTSA-N 0.000 description 2
- APDIECQNNDGFPD-PYJNHQTQSA-N Ile-His-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N APDIECQNNDGFPD-PYJNHQTQSA-N 0.000 description 2
- UWLHDGMRWXHFFY-HPCHECBXSA-N Ile-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@@H]1C(=O)O)N UWLHDGMRWXHFFY-HPCHECBXSA-N 0.000 description 2
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 2
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 2
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 2
- 102000009617 Inorganic Pyrophosphatase Human genes 0.000 description 2
- 108010009595 Inorganic Pyrophosphatase Proteins 0.000 description 2
- 101710176147 Isoleucine-tRNA ligase, cytoplasmic Proteins 0.000 description 2
- 102100035997 Isoleucine-tRNA ligase, mitochondrial Human genes 0.000 description 2
- 238000007397 LAMP assay Methods 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- WXHFZJFZWNCDNB-KKUMJFAQSA-N Leu-Asn-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXHFZJFZWNCDNB-KKUMJFAQSA-N 0.000 description 2
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 2
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 2
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 2
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 2
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 2
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 2
- VEGLGAOVLFODGC-GUBZILKMSA-N Lys-Glu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VEGLGAOVLFODGC-GUBZILKMSA-N 0.000 description 2
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 2
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 2
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 2
- OJDFAABAHBPVTH-MNXVOIDGSA-N Lys-Ile-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OJDFAABAHBPVTH-MNXVOIDGSA-N 0.000 description 2
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 2
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 2
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 2
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 2
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 2
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 108010092041 Lysine-tRNA Ligase Proteins 0.000 description 2
- 102100035529 Lysine-tRNA ligase Human genes 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 241001102832 Meseres Species 0.000 description 2
- SLQDSYZHHOKQSR-QXEWZRGKSA-N Met-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCSC SLQDSYZHHOKQSR-QXEWZRGKSA-N 0.000 description 2
- MYAPQOBHGWJZOM-UWVGGRQHSA-N Met-Gly-Leu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C MYAPQOBHGWJZOM-UWVGGRQHSA-N 0.000 description 2
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 2
- BMHIFARYXOJDLD-WPRPVWTQSA-N Met-Gly-Val Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O BMHIFARYXOJDLD-WPRPVWTQSA-N 0.000 description 2
- WTHGNAAQXISJHP-AVGNSLFASA-N Met-Lys-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WTHGNAAQXISJHP-AVGNSLFASA-N 0.000 description 2
- WXUUEPIDLLQBLJ-DCAQKATOSA-N Met-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N WXUUEPIDLLQBLJ-DCAQKATOSA-N 0.000 description 2
- JACMWNXOOUYXCD-JYJNAYRXSA-N Met-Val-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JACMWNXOOUYXCD-JYJNAYRXSA-N 0.000 description 2
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 2
- SCIFESDRCALIIM-UHFFFAOYSA-N N-Me-Phenylalanine Natural products CNC(C(O)=O)CC1=CC=CC=C1 SCIFESDRCALIIM-UHFFFAOYSA-N 0.000 description 2
- PSFABYLDRXJYID-VKHMYHEASA-N N-Methylserine Chemical compound CN[C@@H](CO)C(O)=O PSFABYLDRXJYID-VKHMYHEASA-N 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- PSFABYLDRXJYID-UHFFFAOYSA-N N-methyl-DL-serine Natural products CNC(CO)C(O)=O PSFABYLDRXJYID-UHFFFAOYSA-N 0.000 description 2
- GDFAOVXKHJXLEI-VKHMYHEASA-N N-methyl-L-alanine Chemical compound C[NH2+][C@@H](C)C([O-])=O GDFAOVXKHJXLEI-VKHMYHEASA-N 0.000 description 2
- SCIFESDRCALIIM-VIFPVBQESA-N N-methyl-L-phenylalanine Chemical compound C[NH2+][C@H](C([O-])=O)CC1=CC=CC=C1 SCIFESDRCALIIM-VIFPVBQESA-N 0.000 description 2
- AKCRVYNORCOYQT-YFKPBYRVSA-N N-methyl-L-valine Chemical compound CN[C@@H](C(C)C)C(O)=O AKCRVYNORCOYQT-YFKPBYRVSA-N 0.000 description 2
- SEQKRHFRPICQDD-UHFFFAOYSA-N N-tris(hydroxymethyl)methylglycine Chemical compound OCC(CO)(CO)[NH2+]CC([O-])=O SEQKRHFRPICQDD-UHFFFAOYSA-N 0.000 description 2
- 101150008132 NDE1 gene Proteins 0.000 description 2
- 101150073096 NRAS gene Proteins 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 2
- 241001443980 Oplophoridae Species 0.000 description 2
- 241000522587 Oplophorus gracilirostris Species 0.000 description 2
- 108010049977 Peptide Elongation Factor Tu Proteins 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 102100027913 Peptidyl-prolyl cis-trans isomerase FKBP1A Human genes 0.000 description 2
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 2
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 2
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 2
- ACJULKNZOCRWEI-ULQDDVLXSA-N Phe-Met-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O ACJULKNZOCRWEI-ULQDDVLXSA-N 0.000 description 2
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 2
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 2
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 2
- KQCCDMFIALWGTL-GUBZILKMSA-N Pro-Asn-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 KQCCDMFIALWGTL-GUBZILKMSA-N 0.000 description 2
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 2
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 2
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 2
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 2
- 101710149031 Probable isoleucine-tRNA ligase, cytoplasmic Proteins 0.000 description 2
- 102100028531 Probable proline-tRNA ligase, mitochondrial Human genes 0.000 description 2
- 101710164123 Probable proline-tRNA ligase, mitochondrial Proteins 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 101710115782 Proline-tRNA ligase Proteins 0.000 description 2
- 101710140381 Proline-tRNA ligase, cytoplasmic Proteins 0.000 description 2
- 102000001253 Protein Kinase Human genes 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 238000011530 RNeasy Mini Kit Methods 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 2
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 2
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 2
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 2
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 2
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 2
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 2
- 108010030161 Serine-tRNA ligase Proteins 0.000 description 2
- 102100040597 Serine-tRNA ligase, mitochondrial Human genes 0.000 description 2
- 108010034546 Serratia marcescens nuclease Proteins 0.000 description 2
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 2
- 108010006877 Tacrolimus Binding Protein 1A Proteins 0.000 description 2
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 2
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 2
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 2
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 2
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 2
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 108010029287 Threonine-tRNA ligase Proteins 0.000 description 2
- 102100028196 Threonine-tRNA ligase 2, cytoplasmic Human genes 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- CCZXBOFIBYQLEV-IHPCNDPISA-N Trp-Leu-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O CCZXBOFIBYQLEV-IHPCNDPISA-N 0.000 description 2
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 2
- KSVMDJJCYKIXTK-IGNZVWTISA-N Tyr-Ala-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 KSVMDJJCYKIXTK-IGNZVWTISA-N 0.000 description 2
- MTEQZJFSEMXXRK-CFMVVWHZSA-N Tyr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N MTEQZJFSEMXXRK-CFMVVWHZSA-N 0.000 description 2
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 2
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 2
- 102100025607 Valine-tRNA ligase Human genes 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 102000043871 biotin binding protein Human genes 0.000 description 2
- 108700021042 biotin binding protein Proteins 0.000 description 2
- 239000001110 calcium chloride Substances 0.000 description 2
- 229910001628 calcium chloride Inorganic materials 0.000 description 2
- 235000011148 calcium chloride Nutrition 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 239000012043 crude product Substances 0.000 description 2
- 239000012228 culture supernatant Substances 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000010511 deprotection reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 239000001177 diphosphate Substances 0.000 description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 2
- 235000011180 diphosphates Nutrition 0.000 description 2
- 108010063460 elongation factor T Proteins 0.000 description 2
- 239000011536 extraction buffer Substances 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 235000019253 formic acid Nutrition 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010010147 glycylglutamine Proteins 0.000 description 2
- 229960000789 guanidine hydrochloride Drugs 0.000 description 2
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 2
- 239000005457 ice water Substances 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 2
- UEGPKNKPLBYCNK-UHFFFAOYSA-L magnesium acetate Chemical compound [Mg+2].CC([O-])=O.CC([O-])=O UEGPKNKPLBYCNK-UHFFFAOYSA-L 0.000 description 2
- 235000011285 magnesium acetate Nutrition 0.000 description 2
- 239000011654 magnesium acetate Substances 0.000 description 2
- 229940069446 magnesium acetate Drugs 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 229930014626 natural product Natural products 0.000 description 2
- MXHCPCSDRGLRER-UHFFFAOYSA-N pentaglycine Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O MXHCPCSDRGLRER-UHFFFAOYSA-N 0.000 description 2
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 235000011056 potassium acetate Nutrition 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 108060006633 protein kinase Proteins 0.000 description 2
- 229940124823 proteolysis targeting chimeric molecule Drugs 0.000 description 2
- 239000012264 purified product Substances 0.000 description 2
- 102000016914 ras Proteins Human genes 0.000 description 2
- 108010014186 ras Proteins Proteins 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 239000012146 running buffer Substances 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000001632 sodium acetate Substances 0.000 description 2
- 235000017281 sodium acetate Nutrition 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 229940063673 spermidine Drugs 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 108010018381 streptavidin-binding peptide Proteins 0.000 description 2
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108010072695 valyl-valyl-tyrosyl-proline Proteins 0.000 description 2
- BYEAHWXPCBROCE-UHFFFAOYSA-N 1,1,1,3,3,3-hexafluoropropan-2-ol Chemical compound FC(F)(F)C(O)C(F)(F)F BYEAHWXPCBROCE-UHFFFAOYSA-N 0.000 description 1
- OHVLMTFVQDZYHP-UHFFFAOYSA-N 1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-2-[4-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]piperazin-1-yl]ethanone Chemical compound N1N=NC=2CN(CCC=21)C(CN1CCN(CC1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)=O OHVLMTFVQDZYHP-UHFFFAOYSA-N 0.000 description 1
- KZEVSDGEBAJOTK-UHFFFAOYSA-N 1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)-2-[5-[2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidin-5-yl]-1,3,4-oxadiazol-2-yl]ethanone Chemical compound N1N=NC=2CN(CCC=21)C(CC=1OC(=NN=1)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)=O KZEVSDGEBAJOTK-UHFFFAOYSA-N 0.000 description 1
- OZGSEIVTQLXWRO-UHFFFAOYSA-N 2,4,6-trichlorobenzoyl chloride Chemical compound ClC(=O)C1=C(Cl)C=C(Cl)C=C1Cl OZGSEIVTQLXWRO-UHFFFAOYSA-N 0.000 description 1
- WZFUQSJFWNHZHM-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperazin-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)N1CCN(CC1)CC(=O)N1CC2=C(CC1)NN=N2 WZFUQSJFWNHZHM-UHFFFAOYSA-N 0.000 description 1
- IHCCLXNEEPMSIO-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]piperidin-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C1CCN(CC1)CC(=O)N1CC2=C(CC1)NN=N2 IHCCLXNEEPMSIO-UHFFFAOYSA-N 0.000 description 1
- YJLUBHOZZTYQIP-UHFFFAOYSA-N 2-[5-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]-1,3,4-oxadiazol-2-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C1=NN=C(O1)CC(=O)N1CC2=C(CC1)NN=N2 YJLUBHOZZTYQIP-UHFFFAOYSA-N 0.000 description 1
- OZRFYUJEXYKQDV-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-carboxypropanoyl)amino]-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]butanedioic acid Chemical compound OC(=O)CC(N)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(O)=O OZRFYUJEXYKQDV-UHFFFAOYSA-N 0.000 description 1
- UMCMPZBLKLEWAF-BCTGSCMUSA-N 3-[(3-cholamidopropyl)dimethylammonio]propane-1-sulfonate Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCC[N+](C)(C)CCCS([O-])(=O)=O)C)[C@@]2(C)[C@@H](O)C1 UMCMPZBLKLEWAF-BCTGSCMUSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 1
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 1
- DXTYEWAQOXYRHZ-KKXDTOCCSA-N Ala-Phe-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N DXTYEWAQOXYRHZ-KKXDTOCCSA-N 0.000 description 1
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 description 1
- 102000002226 Alkyl and Aryl Transferases Human genes 0.000 description 1
- 108010014722 Alkyl and Aryl Transferases Proteins 0.000 description 1
- 241000024188 Andala Species 0.000 description 1
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 1
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 1
- LMPKCSXZJSXBBL-NHCYSSNCSA-N Arg-Gln-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O LMPKCSXZJSXBBL-NHCYSSNCSA-N 0.000 description 1
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 1
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- QBQVKUNBCAFXSV-ULQDDVLXSA-N Arg-Lys-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QBQVKUNBCAFXSV-ULQDDVLXSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 1
- IYVSIZAXNLOKFQ-BYULHYEWSA-N Asn-Asp-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IYVSIZAXNLOKFQ-BYULHYEWSA-N 0.000 description 1
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 1
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 1
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 1
- GFFRWIJAFFMQGM-NUMRIWBASA-N Asn-Glu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GFFRWIJAFFMQGM-NUMRIWBASA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- AEZCCDMZZJOGII-DCAQKATOSA-N Asn-Met-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O AEZCCDMZZJOGII-DCAQKATOSA-N 0.000 description 1
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 1
- QUCCLIXMVPIVOB-BZSNNMDCSA-N Asn-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N QUCCLIXMVPIVOB-BZSNNMDCSA-N 0.000 description 1
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 1
- UFAQGGZUXVLONR-AVGNSLFASA-N Asp-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N)O UFAQGGZUXVLONR-AVGNSLFASA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- LNENWJXDHCFVOF-DCAQKATOSA-N Asp-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N LNENWJXDHCFVOF-DCAQKATOSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- KFAFUJMGHVVYRC-DCAQKATOSA-N Asp-Leu-Met Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O KFAFUJMGHVVYRC-DCAQKATOSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- DPNWSMBUYCLEDG-CIUDSAMLSA-N Asp-Lys-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O DPNWSMBUYCLEDG-CIUDSAMLSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 1
- MRYDJCIIVRXVGG-QEJZJMRPSA-N Asp-Trp-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O MRYDJCIIVRXVGG-QEJZJMRPSA-N 0.000 description 1
- PLNJUJGNLDSFOP-UWJYBYFXSA-N Asp-Tyr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PLNJUJGNLDSFOP-UWJYBYFXSA-N 0.000 description 1
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 101100136076 Aspergillus oryzae (strain ATCC 42149 / RIB 40) pel1 gene Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- BHPQYMZQTOCNFJ-UHFFFAOYSA-N Calcium cation Chemical compound [Ca+2] BHPQYMZQTOCNFJ-UHFFFAOYSA-N 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 235000019750 Crude protein Nutrition 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 101710104441 FK506-binding protein 1 Proteins 0.000 description 1
- 101710132880 FK506-binding protein 1A Proteins 0.000 description 1
- 101710132879 FK506-binding protein 1B Proteins 0.000 description 1
- XZWYTXMRWQJBGX-VXBMVYAYSA-N FLAG peptide Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 XZWYTXMRWQJBGX-VXBMVYAYSA-N 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 102100030708 GTPase KRas Human genes 0.000 description 1
- 101710113436 GTPase KRas Proteins 0.000 description 1
- OVQXQLWWJSNYFV-XEGUGMAKSA-N Gln-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCC(N)=O)C)C(O)=O)=CNC2=C1 OVQXQLWWJSNYFV-XEGUGMAKSA-N 0.000 description 1
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 1
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 1
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- DRNMNLKUUKKPIA-HTUGSXCWSA-N Gln-Phe-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)CCC(N)=O)C(O)=O DRNMNLKUUKKPIA-HTUGSXCWSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- BUAKRRKDHSSIKK-IHRRRGAJSA-N Glu-Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BUAKRRKDHSSIKK-IHRRRGAJSA-N 0.000 description 1
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- VXQOONWNIWFOCS-HGNGGELXSA-N Glu-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N VXQOONWNIWFOCS-HGNGGELXSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- SUIAHERNFYRBDZ-GVXVVHGQSA-N Glu-Lys-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O SUIAHERNFYRBDZ-GVXVVHGQSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 1
- MXJYXYDREQWUMS-XKBZYTNZSA-N Glu-Thr-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O MXJYXYDREQWUMS-XKBZYTNZSA-N 0.000 description 1
- GWKBAXRZPLSWJS-QEJZJMRPSA-N Glu-Trp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GWKBAXRZPLSWJS-QEJZJMRPSA-N 0.000 description 1
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- QXUPRMQJDWJDFR-NRPADANISA-N Glu-Val-Ser Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXUPRMQJDWJDFR-NRPADANISA-N 0.000 description 1
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- DTRUBYPMMVPQPD-YUMQZZPRSA-N Gly-Gln-Arg Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DTRUBYPMMVPQPD-YUMQZZPRSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- CQIIXEHDSZUSAG-QWRGUYRKSA-N Gly-His-His Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CQIIXEHDSZUSAG-QWRGUYRKSA-N 0.000 description 1
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 1
- QSVMIMFAAZPCAQ-PMVVWTBXSA-N Gly-His-Thr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QSVMIMFAAZPCAQ-PMVVWTBXSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 1
- VPZXBVLAVMBEQI-VKHMYHEASA-N Glycyl-alanine Chemical compound OC(=O)[C@H](C)NC(=O)CN VPZXBVLAVMBEQI-VKHMYHEASA-N 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- MBSSHYPAEHPSGY-LSJOCFKGSA-N His-Ala-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O MBSSHYPAEHPSGY-LSJOCFKGSA-N 0.000 description 1
- TTZAWSKKNCEINZ-AVGNSLFASA-N His-Arg-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O TTZAWSKKNCEINZ-AVGNSLFASA-N 0.000 description 1
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 1
- JIUYRPFQJJRSJB-QWRGUYRKSA-N His-His-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)NCC(O)=O)C1=CN=CN1 JIUYRPFQJJRSJB-QWRGUYRKSA-N 0.000 description 1
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 1
- GHAFKUCRIVBLDJ-IHRRRGAJSA-N His-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N GHAFKUCRIVBLDJ-IHRRRGAJSA-N 0.000 description 1
- BZKDJRSZWLPJNI-SRVKXCTJSA-N His-His-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O BZKDJRSZWLPJNI-SRVKXCTJSA-N 0.000 description 1
- QPSCMXDWVKWVOW-BZSNNMDCSA-N His-His-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QPSCMXDWVKWVOW-BZSNNMDCSA-N 0.000 description 1
- BXOLYFJYQQRQDJ-MXAVVETBSA-N His-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CN=CN1)N BXOLYFJYQQRQDJ-MXAVVETBSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- JUIOPCXACJLRJK-AVGNSLFASA-N His-Lys-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N JUIOPCXACJLRJK-AVGNSLFASA-N 0.000 description 1
- VDHOMPFVSABJKU-ULQDDVLXSA-N His-Phe-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CN=CN2)N VDHOMPFVSABJKU-ULQDDVLXSA-N 0.000 description 1
- QLBXWYXMLHAREM-PYJNHQTQSA-N His-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N QLBXWYXMLHAREM-PYJNHQTQSA-N 0.000 description 1
- GGXUJBKENKVYNV-ULQDDVLXSA-N His-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N GGXUJBKENKVYNV-ULQDDVLXSA-N 0.000 description 1
- 101710177011 Histidine-tRNA ligase, cytoplasmic Proteins 0.000 description 1
- 102100029015 Histidine-tRNA ligase, mitochondrial Human genes 0.000 description 1
- 101000623857 Homo sapiens Serine/threonine-protein kinase mTOR Proteins 0.000 description 1
- 206010020649 Hyperkeratosis Diseases 0.000 description 1
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 1
- CWJQMCPYXNVMBS-STECZYCISA-N Ile-Arg-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CWJQMCPYXNVMBS-STECZYCISA-N 0.000 description 1
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 1
- KMBPQYKVZBMRMH-PEFMBERDSA-N Ile-Gln-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O KMBPQYKVZBMRMH-PEFMBERDSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- AMSYMDIIIRJRKZ-HJPIBITLSA-N Ile-His-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AMSYMDIIIRJRKZ-HJPIBITLSA-N 0.000 description 1
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 1
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 1
- VISRCHQHQCLODA-NAKRPEOUSA-N Ile-Pro-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N VISRCHQHQCLODA-NAKRPEOUSA-N 0.000 description 1
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 1
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 1
- XOZOSAUOGRPCES-STECZYCISA-N Ile-Pro-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XOZOSAUOGRPCES-STECZYCISA-N 0.000 description 1
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- QUAAUWNLWMLERT-IHRRRGAJSA-N Leu-Arg-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O QUAAUWNLWMLERT-IHRRRGAJSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 1
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 1
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 1
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 1
- AOFYPTOHESIBFZ-KKUMJFAQSA-N Leu-His-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O AOFYPTOHESIBFZ-KKUMJFAQSA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- KXCMQWMNYQOAKA-SRVKXCTJSA-N Leu-Met-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KXCMQWMNYQOAKA-SRVKXCTJSA-N 0.000 description 1
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 1
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- ZGGVHTQAPHVMKM-IHPCNDPISA-N Leu-Trp-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N ZGGVHTQAPHVMKM-IHPCNDPISA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- RDIILCRAWOSDOQ-CIUDSAMLSA-N Lys-Cys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RDIILCRAWOSDOQ-CIUDSAMLSA-N 0.000 description 1
- LXNPMPIQDNSMTA-AVGNSLFASA-N Lys-Gln-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 LXNPMPIQDNSMTA-AVGNSLFASA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- PAMDBWYMLWOELY-SDDRHHMPSA-N Lys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O PAMDBWYMLWOELY-SDDRHHMPSA-N 0.000 description 1
- JZMGVXLDOQOKAH-UWVGGRQHSA-N Lys-Gly-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O JZMGVXLDOQOKAH-UWVGGRQHSA-N 0.000 description 1
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- CENKQZWVYMLRAX-ULQDDVLXSA-N Lys-Phe-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O CENKQZWVYMLRAX-ULQDDVLXSA-N 0.000 description 1
- SVSQSPICRKBMSZ-SRVKXCTJSA-N Lys-Pro-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O SVSQSPICRKBMSZ-SRVKXCTJSA-N 0.000 description 1
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 1
- NQOQDINRVQCAKD-ULQDDVLXSA-N Lys-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N NQOQDINRVQCAKD-ULQDDVLXSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 1
- NKDSBBBPGIVWEI-RCWTZXSCSA-N Met-Arg-Thr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NKDSBBBPGIVWEI-RCWTZXSCSA-N 0.000 description 1
- YLLWCSDBVGZLOW-CIUDSAMLSA-N Met-Gln-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O YLLWCSDBVGZLOW-CIUDSAMLSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- VZBXCMCHIHEPBL-SRVKXCTJSA-N Met-Glu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN VZBXCMCHIHEPBL-SRVKXCTJSA-N 0.000 description 1
- RXWPLVRJQNWXRQ-IHRRRGAJSA-N Met-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 RXWPLVRJQNWXRQ-IHRRRGAJSA-N 0.000 description 1
- YYEIFXZOBZVDPH-DCAQKATOSA-N Met-Lys-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O YYEIFXZOBZVDPH-DCAQKATOSA-N 0.000 description 1
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 1
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 1
- AOLKTFKKSSMRTA-WDSOQIARSA-N Met-Trp-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N AOLKTFKKSSMRTA-WDSOQIARSA-N 0.000 description 1
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 1
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 1
- 241000713869 Moloney murine leukemia virus Species 0.000 description 1
- PYUSHNKNPOHWEZ-YFKPBYRVSA-N N-formyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC=O PYUSHNKNPOHWEZ-YFKPBYRVSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- CHJJGSNFBQVOTG-UHFFFAOYSA-N N-methyl-guanidine Natural products CNC(N)=N CHJJGSNFBQVOTG-UHFFFAOYSA-N 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102100026408 Peptidyl-prolyl cis-trans isomerase FKBP2 Human genes 0.000 description 1
- 108090000279 Peptidyltransferases Proteins 0.000 description 1
- CYZBFPYMSJGBRL-DRZSPHRISA-N Phe-Ala-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CYZBFPYMSJGBRL-DRZSPHRISA-N 0.000 description 1
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 1
- DFEVBOYEUQJGER-JURCDPSOSA-N Phe-Ala-Ile Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O DFEVBOYEUQJGER-JURCDPSOSA-N 0.000 description 1
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 1
- TXKWKTWYTIAZSV-KKUMJFAQSA-N Phe-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N TXKWKTWYTIAZSV-KKUMJFAQSA-N 0.000 description 1
- PEFJUUYFEGBXFA-BZSNNMDCSA-N Phe-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 PEFJUUYFEGBXFA-BZSNNMDCSA-N 0.000 description 1
- ZVRJWDUPIDMHDN-ULQDDVLXSA-N Phe-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 ZVRJWDUPIDMHDN-ULQDDVLXSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- MLQVJYMFASXBGZ-IHRRRGAJSA-N Pro-Asn-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O MLQVJYMFASXBGZ-IHRRRGAJSA-N 0.000 description 1
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 1
- WPQKSRHDTMRSJM-CIUDSAMLSA-N Pro-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 WPQKSRHDTMRSJM-CIUDSAMLSA-N 0.000 description 1
- OGRYXQOUFHAMPI-DCAQKATOSA-N Pro-Cys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O OGRYXQOUFHAMPI-DCAQKATOSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- AUYKOPJPKUCYHE-SRVKXCTJSA-N Pro-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 AUYKOPJPKUCYHE-SRVKXCTJSA-N 0.000 description 1
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 1
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 1
- 101710096715 Probable histidine-tRNA ligase, cytoplasmic Proteins 0.000 description 1
- 101710086015 RNA ligase Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- CXBFHZLODKPIJY-AAEUAGOBSA-N Ser-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N CXBFHZLODKPIJY-AAEUAGOBSA-N 0.000 description 1
- IOVBCLGAJJXOHK-SRVKXCTJSA-N Ser-His-His Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IOVBCLGAJJXOHK-SRVKXCTJSA-N 0.000 description 1
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 1
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 102100023085 Serine/threonine-protein kinase mTOR Human genes 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- UZMAPBJVXOGOFT-UHFFFAOYSA-N Syringetin Natural products COC1=C(O)C(OC)=CC(C2=C(C(=O)C3=C(O)C=C(O)C=C3O2)O)=C1 UZMAPBJVXOGOFT-UHFFFAOYSA-N 0.000 description 1
- DKGAVHZHDRPRBM-UHFFFAOYSA-N Tert-Butanol Chemical compound CC(C)(C)O DKGAVHZHDRPRBM-UHFFFAOYSA-N 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 1
- KZUJCMPVNXOBAF-LKXGYXEUSA-N Thr-Cys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KZUJCMPVNXOBAF-LKXGYXEUSA-N 0.000 description 1
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 1
- DSLHSTIUAPKERR-XGEHTFHBSA-N Thr-Cys-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O DSLHSTIUAPKERR-XGEHTFHBSA-N 0.000 description 1
- LKEKWDJCJSPXNI-IRIUXVKKSA-N Thr-Glu-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LKEKWDJCJSPXNI-IRIUXVKKSA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 1
- YZUWGFXVVZQJEI-PMVVWTBXSA-N Thr-Gly-His Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O YZUWGFXVVZQJEI-PMVVWTBXSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- 239000007997 Tricine buffer Substances 0.000 description 1
- PXYJUECTGMGIDT-WDSOQIARSA-N Trp-Arg-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 PXYJUECTGMGIDT-WDSOQIARSA-N 0.000 description 1
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 1
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 1
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 1
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 1
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 1
- BCOBSVIZMQXKFY-KKUMJFAQSA-N Tyr-Ser-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O BCOBSVIZMQXKFY-KKUMJFAQSA-N 0.000 description 1
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 description 1
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 description 1
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- WITCOKQIPFWQQD-FSPLSTOPSA-N Val-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O WITCOKQIPFWQQD-FSPLSTOPSA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- XEYUMGGWQCIWAR-XVKPBYJWSA-N Val-Gln-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N XEYUMGGWQCIWAR-XVKPBYJWSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- RFKJNTRMXGCKFE-FHWLQOOXSA-N Val-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC(C)C)C(O)=O)=CNC2=C1 RFKJNTRMXGCKFE-FHWLQOOXSA-N 0.000 description 1
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- UFCHCOKFAGOQSF-BQFCYCMXSA-N Val-Trp-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N UFCHCOKFAGOQSF-BQFCYCMXSA-N 0.000 description 1
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- XBJFCYDKBDVADW-UHFFFAOYSA-N acetonitrile;formic acid Chemical compound CC#N.OC=O XBJFCYDKBDVADW-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 238000003314 affinity selection Methods 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 125000000266 alpha-aminoacyl group Chemical group 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 229910001424 calcium ion Inorganic materials 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- BKHZIBWEHPHYAI-UHFFFAOYSA-N chloroform;3-methylbutan-1-ol Chemical compound ClC(Cl)Cl.CC(C)CCO BKHZIBWEHPHYAI-UHFFFAOYSA-N 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 239000012468 concentrated sample Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000003398 denaturant Substances 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- KCFYHBSOLOXZIF-UHFFFAOYSA-N dihydrochrysin Natural products COC1=C(O)C(OC)=CC(C2OC3=CC(O)=CC(O)=C3C(=O)C2)=C1 KCFYHBSOLOXZIF-UHFFFAOYSA-N 0.000 description 1
- SWSQBOPZIKWTGO-UHFFFAOYSA-N dimethylaminoamidine Natural products CN(C)C(N)=N SWSQBOPZIKWTGO-UHFFFAOYSA-N 0.000 description 1
- BNIILDVGGAEEIG-UHFFFAOYSA-L disodium hydrogen phosphate Chemical compound [Na+].[Na+].OP([O-])([O-])=O BNIILDVGGAEEIG-UHFFFAOYSA-L 0.000 description 1
- 229910000397 disodium phosphate Inorganic materials 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- CETRZFQIITUQQL-UHFFFAOYSA-N dmso dimethylsulfoxide Chemical compound CS(C)=O.CS(C)=O CETRZFQIITUQQL-UHFFFAOYSA-N 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229960004198 guanidine Drugs 0.000 description 1
- IIRDTKBZINWQAW-UHFFFAOYSA-N hexaethylene glycol Chemical compound OCCOCCOCCOCCOCCOCCO IIRDTKBZINWQAW-UHFFFAOYSA-N 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- QARBMVPHQWIHKH-UHFFFAOYSA-N methanesulfonyl chloride Chemical compound CS(Cl)(=O)=O QARBMVPHQWIHKH-UHFFFAOYSA-N 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 239000013586 microbial product Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 239000012299 nitrogen atmosphere Substances 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 101150040383 pel2 gene Proteins 0.000 description 1
- 101150050446 pelB gene Proteins 0.000 description 1
- 210000001322 periplasm Anatomy 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 239000000419 plant extract Substances 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 108020001775 protein parts Proteins 0.000 description 1
- 239000012521 purified sample Substances 0.000 description 1
- 239000008213 purified water Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000002702 ribosome display Methods 0.000 description 1
- 102220075811 rs759712157 Human genes 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- FSYKKLYZXJSNPZ-UHFFFAOYSA-N sarcosine Chemical compound C[NH2+]CC([O-])=O FSYKKLYZXJSNPZ-UHFFFAOYSA-N 0.000 description 1
- 238000010898 silica gel chromatography Methods 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000012536 storage buffer Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 125000004434 sulfur atom Chemical group 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- WHRNULOCNSKMGB-UHFFFAOYSA-N tetrahydrofuran thf Chemical compound C1CCOC1.C1CCOC1 WHRNULOCNSKMGB-UHFFFAOYSA-N 0.000 description 1
- WROMPOXWARCANT-UHFFFAOYSA-N tfa trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F.OC(=O)C(F)(F)F WROMPOXWARCANT-UHFFFAOYSA-N 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 108010060175 trypsinogen activation peptide Proteins 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43595—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from coelenteratae, e.g. medusae
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/536—Immunoassay; Biospecific binding assay; Materials therefor with immune complex formed in liquid phase
- G01N33/537—Immunoassay; Biospecific binding assay; Materials therefor with immune complex formed in liquid phase with separation of immune complex from unbound antigen or antibody
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6845—Methods of identifying protein-protein interactions in protein mixtures
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
- C12N9/1088—Glutathione transferase (2.5.1.18)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B30/00—Methods of screening libraries
- C40B30/04—Methods of screening libraries by measuring the ability to specifically bind a target molecule, e.g. antibody-antigen binding, receptor-ligand binding
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/15—Medicinal preparations ; Physical properties thereof, e.g. dissolubility
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/536—Immunoassay; Biospecific binding assay; Materials therefor with immune complex formed in liquid phase
- G01N33/542—Immunoassay; Biospecific binding assay; Materials therefor with immune complex formed in liquid phase with steric inhibition or signal modification, e.g. fluorescent quenching
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/23—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a GST-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/60—Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Organic Chemistry (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Food Science & Technology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Cell Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Pharmacology & Pharmacy (AREA)
- Tropical Medicine & Parasitology (AREA)
- Gastroenterology & Hepatology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Toxicology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Peptides Or Proteins (AREA)
Abstract
Split GFP 기술로 대표되는 기술에 어피니티를 이용한 후보 분자의 회수 방법을 적용하는 것에 의해, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자를 스크리닝하는 방법이 발견되었다. 당해 방법에서는, 단백질의 제1 부분에 연결된 제1 표적 분자, 해당 단백질의 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 공존시킨다. 그리고, 해당 제1 부분에 연결된 제1 표적 분자 및 해당 제2 부분에 연결된 제2 표적 분자와 복합체를 형성할 수 있었던 피험 분자를, 어피니티 기술을 사용하여 회수한다.
Description
본 개시는, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자의 스크리닝 방법에 관한 것이다.
복수의 표적 분자와 함께 복합체를 형성하는 분자로서는, 이중특이성 항체나 단백질 분해 유도 키메라(Proteolysis targeting chimera; PROTAC)로 대표되는 이중특이성 분자, 및, 라파마이신이나 FK506과 같이 FKBP(FK506 binding protein)와의 결합을 거쳐 표적 분자와 결합하는 분자 등이 알려져 있다. 전자의 분자의 작성 방법으로서, 상이한 표적에 결합할 수 있는 분자를 따로따로 취득한 후에 그들을 연결시키는 수법이 알려져 있다(비특허문헌 1). 후자의 분자의 취득 방법으로서, 시험 화합물을 FKBP와 혼합하여 2자 복합체를 형성시킨 후, 이것을 표적 단백질과 혼합하고, 삼자 복합체의 형성을 질량 분석에 의해 검출하는 방법이 알려져 있다(특허문헌 1).
Split GFP 기술은, 단독으로는 발광하지 않도록 분할된 GFP 단백질이 근접해서 회합함으로써 발광한다는 현상을 이용한 기술이다. 각 GFP 단편에 상이한 단백질을 결합시킴으로써, GFP의 발광을 지표로 단백질끼리의 상호작용을 검출할 수 있다. 구체적으로는, GFP를 베타 스트랜드 단위로 GFP1-9, GFP10, 및 GFP11로 3분할하고, GFP10 및 GFP11에 각각 다른 단백질을 결합시키고 GFP1-9를 첨가하면, 이들 단백질의 상호작용을 발광으로 검출할 수 있다는 보고가 있다(비특허문헌 2). split GFP를 발현시킨 세포를 사용하고, 세포내에서의 GTPase와 GTPase-binding domain의 상호작용에 의한 발광을 지표로 하여, GTPase의 활성화 상태를 검출한 보고가 있다(특허문헌 2, 비특허문헌 3).
Ulrich, H. W. et al. CANCER GENOMICS & PROTEOMICS 10: 1-18 (2013)
Cabantous, S. et al. Sci Rep. 2013; 3: 2854. doi: 10.1038/srep02854
Koraichi, F. et al. Journal of Cell Science 2018; 131: jcs210419 doi: 10.1242/jcs.210419
복수의 표적 분자와 함께 복합체를 형성하는 분자를 취득하려고 한 경우, (i) 표적 분자마다 스크리닝하여 얻은 바인더를 연결시키는 방법이나, (ii) 한쪽의 표적 분자에 대한 바인더를 취득한 후에 그 표적 분자와 바인더의 복합체를 다른 표적 분자에 접촉시키는 방법이 생각된다.
경구 흡수성을 높이는 것, 또는 세포내 표적을 노리는 경우, 후보 분자의 분자량을 어느 정도 작게 할 필요가 있다. 그 때문에, 이와 같은 목적으로 후보 분자를 취득하려고 한 경우, 각 표적 분자에 대한 바인더를 취득한 후에 이들을 연결하는 (i)의 방법에서는, 개개의 바인더의 분자량에 큰 제한이 걸린다. 한편, 분자량을 지나치게 작게 하면, 결합에 사용할 수 있는 후보 분자측의 구조나 표적 분자측의 결합 부위에 제한이 생기기 때문에, 적용 가능한 표적 분자가 한정되어 버린다. 다른 한편 (ii)의 방법은, 2개의 분자를 연결시키는 것이 아니라, 라이브러리로부터 원하는 성질을 갖는 분자를 스크리닝하는 것이지만, 단독의 표적 분자에 대한 단일특이성에 의한 선별이 제1 공정이 된다. 이 공정에 있어서, 해당 표적(제1 표적) 분자에 대해서 우위인 결합 양식을 갖는 분자가 농축되기 때문에, 다음 공정에서는, 제1 표적에 대한 결합 양식에 편향이 있는 분자 집단으로부터, 원하는 성질을 갖는 분자를 선별해야 한다. 제1 표적 분자에 대한 우위인 결합 양식이, 복수의 표적 분자와 함께 복합체를 형성하기 위한 결합 양식과 일치한다고는 한정할 수 없기 때문에, 스크리닝되는 화합물의 다양성에 제한이 생긴다. 각 표적 분자와의 다양한 결합 양식을 발생시킬 수 있는 라이브러리로부터, 원하는 성질을 갖는 분자를 직접 선별할 수 있는 스크리닝 방법이 요구된다.
또한, 단일의 표적 분자에 대한 결합 활성뿐만 아니라, 후보 분자에 다양한 성질을 요구할수록, 다양한 피험 분자가 포함되는 라이브러리로부터 스크리닝을 행할 필요성이 높아진다. 게다가, 복수의 표적 분자와 함께 복합체를 형성하기 위해서는, 후보 분자가 복잡한 결합·반응 양식을 가져올 것이 필요한 바, 그를 위해 최적인 분자 구조는 예측이 어렵기 때문에, 가능한 한 다양성이 있는 라이브러리에 적용 가능하고, 후보 분자의 선택과 동정이 간편한, 스루풋성이 높은 스크리닝 방법이 요구된다.
Split GFP 기술은, 단백질-단백질 상호작용(PPI)의 검출을 위해서 이용되고 있지만(비특허문헌 2), GFP의 발광을 지표로 하고 있기 때문에, 이것을 스크리닝에 적용한 경우의 스루풋성은 높지 않다. 즉, 형광 검출에 의한 경우, 웰 등의 하나하나의 폐쇄 공간에, 표적 분자 및 단일의 후보 분자를 준비할 필요가 있기 때문에 수고와 비용이 들어, 취급할 수 있는 피험 분자의 수에 제한이 걸린다. 효율화를 위해서, 만일 각 폐쇄 공간에 복수의 피험 분자를 포함하는 라이브러리를 준비하여 스크리닝을 시도했다고 하더라도, 특정한 후보 분자를 선택, 동정하기 위해서는, 단일 분자만의 형광을 확인할 수 있을 때까지 단계적으로, 복수회의 어세이가 필요하여, 전자와 마찬가지로 스루풋성은 높지 않다. 이와 같은 관점에서, GFP 단백질의 발광을 지표로 하는 방법을 대신하는 새로운 방법에 의해, 분할된 단백질의 근접 또는 회합을 검출하고, 그것을 회수할 것이 요구되고 있다.
본 발명은 이와 같은 상황을 감안하여 이루어진 것으로, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자의 스크리닝 방법을 제공하는 것을 과제의 하나로 한다.
본 발명자들은, 라이브러리에 포함되는 피험 분자와 복수의 표적 분자를 동일한 계 중에 공존시켜 스크리닝을 행하는 것이, 표적 분자와 많은 반응 양식을 만들어 내는, 가장 효과적인 방법이라고 생각했다. 그리고, 그를 위해 Split GFP 기술로 대표되는 기술에 어피니티를 이용한 후보 분자의 회수 방법을 적용하여, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자의 스크리닝 방법을 발견했다. 본 수법에서는, 1개의 표적 분자만과 복합체를 형성하는 피험 분자의 회수율을 억제하면서, 복수의 표적 분자와 함께 복합체를 형성하는 후보 분자의 회수가 가능하다는 것이 발견되었다.
본 발명은 이와 같은 지견에 기초하는 것으로, 비한정된 구체적인 일 태양에 있어서 이하를 포함한다.
〔1〕 이하 (1) 및 (2)의 공정을 포함하는, 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자를 스크리닝하는 방법:
(1) 제1 부분에 연결된 상기 제1 표적 분자, 제2 부분에 연결된 상기 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하는 공정이고, 해당 제1 부분 및 해당 제2 부분이 단백질의 일부 또는 전부를 구성하는 공정; 및
(2) 공정(1) 후에, 상기 제1 부분과 상기 제2 부분이 근접 또는 회합하고 있는 것을 검출할 수 있는 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체를 회수하는 공정.
〔1.1〕 공정(2)에 있어서의 상기 제1 표적 분자가, 상기 제1 부분에 연결된 제1 표적 분자이고, 상기 제2 표적 분자가, 상기 제2 부분에 연결된 제2 표적 분자인, 〔1〕에 기재된 방법.
〔2〕 공정(2) 후에, 회수된 복합체에 포함되는 후보 분자를 동정하는 공정(공정(3))을 추가로 포함하는, 〔1〕 또는 〔1.1〕에 기재된 방법.
〔3〕 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합한 경우에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하는 분자인, 〔1〕∼〔2〕 중 어느 하나에 기재된 방법.
〔4〕 상기 제3 분자는, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가 형성된 경우에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하는 분자인, 〔1〕∼〔3〕 중 어느 하나에 기재된 방법.
〔5〕 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접도 회합도 하고 있지 않은 경우, 상기 제1 부분 및/또는 상기 제2 부분과 실질적으로 반응하지 않는 분자인, 〔1〕∼〔4〕 중 어느 하나에 기재된 방법.
〔6〕 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접도 회합도 하고 있지 않은 경우, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합하고 있는 경우와 비교해서, 10분의 1 미만으로밖에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하지 않는 분자인, 〔1〕∼〔5〕 중 어느 하나에 기재된 방법.
〔7〕 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접도 회합도 하고 있지 않은 경우, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합하고 있는 경우와 비교해서, 20분의 1 미만으로밖에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하지 않는 분자인, 〔1〕∼〔6〕 중 어느 하나에 기재된 방법.
〔8〕 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접도 회합도 하고 있지 않은 경우, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합하고 있는 경우와 비교해서, 40분의 1 미만으로밖에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하지 않는 분자인, 〔1〕∼〔7〕 중 어느 하나에 기재된 방법.
〔9〕 상기 제3 분자는, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가 형성되지 않는 경우에, 상기 제1 부분 및/또는 상기 제2 부분과 실질적으로 반응하지 않는 분자인, 〔1〕∼〔8〕 중 어느 하나에 기재된 방법.
〔10〕 상기 제3 분자는, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가 형성되어 있지 않은 경우, 당해 복합체가 형성된 경우와 비교해서, 10분의 1 미만으로밖에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하지 않는 분자인, 〔1〕∼〔9〕 중 어느 하나에 기재된 방법.
〔11〕 상기 제3 분자는, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가 형성되어 있지 않은 경우, 당해 복합체가 형성된 경우와 비교해서, 20분의 1 미만으로밖에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하지 않는 분자인, 〔1〕∼〔10〕 중 어느 하나에 기재된 방법.
〔12〕 상기 제3 분자는, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가 형성되어 있지 않은 경우, 당해 복합체가 형성된 경우와 비교해서, 40분의 1 미만으로밖에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하지 않는 분자인, 〔1〕∼〔11〕 중 어느 하나에 기재된 방법.
〔12.1〕 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체는, 상기 제1 부분에 연결된 제1 표적 분자, 상기 제2 부분에 연결된 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체인, 〔1〕∼〔12〕 중 어느 하나에 기재된 방법.
〔13〕 상기 제3 분자는, 상기 제1 부분과, 상기 제2 부분을 포함하는 복합체를 검출할 수 있는 분자인, 〔1〕∼〔12.1〕 중 어느 하나에 기재된 방법.
〔14〕 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합한 경우에, 상기 제1 부분 및 상기 제2 부분을 포함하는 복합체를 형성시킬 수 있는 분자인, 〔1〕∼〔13〕 중 어느 하나에 기재된 방법.
〔15〕 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합한 경우에, 상기 제1 부분 및/또는 상기 제2 부분과 결합하는 분자인, 〔1〕∼〔14〕 중 어느 하나에 기재된 방법.
〔16〕 공정(2)와 공정(3) 사이에, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체로부터 상기 후보 분자를 용출하는 공정(공정(2A))을 추가로 포함하는, 〔2〕∼〔15〕 중 어느 하나에 기재된 방법.
〔16.1〕 공정(2A)가, 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체를 용출하는 공정인, 〔16〕에 기재된 방법.
〔17〕 공정(2A)와 공정(3) 사이에, 공정(2A)에서 용출된 후보 분자를 인코드하는 폴리뉴클레오타이드를 증폭하는 공정(공정(2B))을 추가로 포함하는, 〔16〕 또는 〔16.1〕에 기재된 방법.
〔18〕 공정(3)이, 공정(2A)에서 용출된 후보 분자를 인코드하는 폴리뉴클레오타이드의 서열, 또는 공정(2B)에서 증폭된 폴리뉴클레오타이드의 서열을 결정하는 것을 포함하는, 〔16〕 또는 〔17〕에 기재된 방법.
〔19〕 공정(1)이, 상기 제1 표적 분자, 상기 제2 표적 분자, 상기 복수의 피험 분자를 포함하는 라이브러리, 및 상기 제3 분자를 혼합하는 것을 포함하는, 〔1〕∼〔18〕 중 어느 하나에 기재된 방법.
〔19.1〕 공정(1)에서 혼합되는, 상기 제1 표적 분자가, 상기 제1 부분에 연결된 제1 표적 분자이고, 상기 제2 표적 분자가, 상기 제2 부분에 연결된 제2 표적 분자인, 〔19〕에 기재된 방법.
〔20〕 공정(1) 후에, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 복수의 피험 분자를 포함하는 라이브러리와, 상기 제3 분자를 혼합하는 공정(공정(1A))을 추가로 포함하는, 〔1〕∼〔18〕 중 어느 하나에 기재된 방법.
〔20.1〕 공정(1A)에서 혼합되는, 상기 제1 표적 분자가, 상기 제1 부분에 연결된 제1 표적 분자이고, 상기 제2 표적 분자가, 상기 제2 부분에 연결된 제2 표적 분자인, 〔20〕에 기재된 방법.
〔21〕 공정(1), (2) 및 (2B), 또는 공정(1), (1A), (2) 및 (2B)를 복수회 반복하는 공정을 포함하는, 〔16〕∼〔20.1〕 중 어느 하나에 기재된 방법.
〔22〕 공정(1), (2), (2A) 및 (2B), 또는 공정(1), (1A), (2), (2A) 및 (2B)를 복수회 반복하는 공정을 포함하는, 〔16〕∼〔21〕 중 어느 하나에 기재된 방법.
〔23〕 in vitro로 행해지는, 〔1〕∼〔22〕 중 어느 하나에 기재된 방법.
〔24〕 상기 피험 분자가 폴리뉴클레오타이드에 의해 코드되어 있는 분자인, 〔1〕∼〔23〕 중 어느 하나에 기재된 방법.
〔25〕 상기 피험 분자가 펩타이드인, 〔1〕∼〔23〕 중 어느 하나에 기재된 방법.
〔26〕 상기 피험 분자가 폴리뉴클레오타이드에 연결된 펩타이드인, 〔1〕∼〔23〕 중 어느 하나에 기재된 방법.
〔27〕 상기 피험 분자의 분자량이 3000 이하인, 〔1〕∼〔26〕 중 어느 하나에 기재된 방법.
〔28〕 상기 피험 분자의 분자량이 2000 이하인, 〔1〕∼〔27〕 중 어느 하나에 기재된 방법.
〔29〕 상기 피험 분자가 상기 제1 표적 분자 및 상기 제2 표적 분자의 어느 일방에 결합하는 것이 알려져 있는 분자인, 〔1〕∼〔28〕 중 어느 하나에 기재된 방법.
〔30〕 상기 라이브러리가, 디스플레이 라이브러리 또는 DNA 인코드 라이브러리인, 〔1〕∼〔29〕 중 어느 하나에 기재된 방법.
〔31〕 상기 디스플레이 라이브러리가, mRNA 디스플레이 라이브러리인, 〔30〕에 기재된 방법.
〔32〕 상기 라이브러리가, 1×104 이상의 다양성을 갖는 라이브러리인, 〔1〕∼〔31〕 중 어느 하나에 기재된 방법.
〔33〕 상기 라이브러리가, 1×105 이상의 다양성을 갖는 라이브러리인, 〔1〕∼〔32〕 중 어느 하나에 기재된 방법.
〔34〕 상기 라이브러리가, 1×106 이상의 다양성을 갖는 라이브러리인, 〔1〕∼〔33〕 중 어느 하나에 기재된 방법.
〔35〕 상기 라이브러리가, 1×108 이상의 다양성을 갖는 라이브러리인, 〔1〕∼〔34〕 중 어느 하나에 기재된 방법.
〔36〕 상기 라이브러리가, 1×1010 이상의 다양성을 갖는 라이브러리인, 〔1〕∼〔35〕 중 어느 하나에 기재된 방법.
〔37〕 상기 라이브러리가, 1×1011 이상의 다양성을 갖는 라이브러리인, 〔1〕∼〔36〕 중 어느 하나에 기재된 방법.
〔38〕 상기 라이브러리가, 1×1012 이상의 다양성을 갖는 라이브러리인, 〔1〕∼〔37〕 중 어느 하나에 기재된 방법.
〔39〕 상기 후보 분자가 펩타이드인, 〔1〕∼〔38〕 중 어느 하나에 기재된 방법.
〔40〕 상기 후보 분자가 환상 펩타이드인, 〔1〕∼〔39〕 중 어느 하나에 기재된 방법.
〔41〕 상기 후보 분자가, 상기 제1 표적 분자 및 상기 제2 표적 분자에 동시에 결합할 수 있는 분자인, 〔1〕∼〔40〕 중 어느 하나에 기재된 방법.
〔42〕 상기 후보 분자가, 상기 제1 표적 분자와 결합한 경우에, 상기 후보 분자 단독인 경우와 비교해서, 상기 제2 표적 분자에 대해서 2배 이상의 결합 친화성을 갖는, 〔1〕∼〔41〕 중 어느 하나에 기재된 방법.
〔43〕 상기 후보 분자가, 상기 제1 표적 분자와 결합한 경우에, 상기 후보 분자 단독인 경우와 비교해서, 상기 제2 표적 분자에 대해서 5배 이상의 결합 친화성을 갖는, 〔1〕∼〔42〕 중 어느 하나에 기재된 방법.
〔44〕 상기 후보 분자가, 상기 제1 표적 분자와 결합한 경우에, 상기 후보 분자 단독인 경우와 비교해서, 상기 제2 표적 분자에 대해서 10배 이상의 결합 친화성을 갖는, 〔1〕∼〔43〕 중 어느 하나에 기재된 방법.
〔45〕 상기 후보 분자가, 상기 제1 표적 분자와 결합한 경우에, 상기 후보 분자 단독인 경우와 비교해서, 상기 제2 표적 분자에 대해서 20배 이상의 결합 친화성을 갖는, 〔1〕∼〔44〕 중 어느 하나에 기재된 방법.
〔46〕 상기 후보 분자가, 이하 (i)∼(iii) 중 어느 성질을 갖는 분자인, 〔1〕∼〔45〕 중 어느 하나에 기재된 방법;
(i) 상기 제1 표적 분자와 결합 가능한 후보 분자이고, 해당 결합에 기인하여, 해당 후보 분자의 상기 제2 표적 분자에 대한 결합 친화성이, 해당 결합 전보다도 높아지는 분자,
(ii) 상기 제1 표적 분자와 결합 가능한 후보 분자이고, 해당 결합에 기인하여, 해당 후보 분자와 상기 제1 표적 분자의 복합체로서 상기 제2 표적 분자와 결합 가능해지는 분자, 및
(iii) 상기 제1 표적 분자와 결합 가능한 후보 분자이고, 해당 결합에 기인하여, 상기 제1 표적 분자의 상기 제2 표적 분자에 대한 결합 친화성이, 해당 결합 전보다도 높아지는 분자.
〔47〕 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자로 구성되는, 〔1〕∼〔46〕 중 어느 하나에 기재된 방법.
〔48〕 상기 후보 분자가, 상기 제1 표적 분자 및 상기 제2 표적 분자와 함께 형성할 수 있는 복합체가, 3자 복합체인, 〔1〕∼〔47〕 중 어느 하나에 기재된 방법.
〔49〕 공정(1)이 이하의 공정을 포함하는, 〔1〕∼〔48〕 중 어느 하나에 기재된 방법;
(i) 상기 제1 부분에 연결된 제1 표적 분자와 피험 분자를 혼합하는 공정, 및
(ii) 공정(i)에 있어서 얻어진 혼합물과 상기 제2 부분에 연결된 제2 표적 분자를 더 혼합하는 공정.
〔50〕 공정(1)이 이하의 공정을 포함하는, 〔1〕∼〔48〕 중 어느 하나에 기재된 방법;
(i) 상기 제2 부분에 연결된 제2 표적 분자와 피험 분자를 혼합하는 공정, 및
(ii) 공정(i)에 있어서 얻어진 혼합물과 상기 제1 부분에 연결된 제1 표적 분자를 더 혼합하는 공정.
〔51〕 상기 제1 부분과 상기 제1 표적 분자, 및 상기 제2 부분과 상기 제2 표적 분자가, 각각 링커에 의해 연결되어 있는, 〔1〕∼〔50〕 중 어느 하나에 기재된 방법.
〔52〕 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가 형성된 경우에, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합하는, 〔1〕∼〔51〕 중 어느 하나에 기재된 방법.
〔53〕 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합한 경우에, 상기 제1 부분 및/또는 상기 제2 부분에 상기 제3 분자가 반응 또는 결합하는, 〔52〕에 기재된 방법.
〔54〕 상기 피험 분자가 상기 제1 표적 분자 및 상기 제2 표적 분자의 어느 것에도 결합하지 않는 경우, 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가 형성되지 않는, 〔1〕∼〔53〕 중 어느 하나에 기재된 방법.
〔55〕 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체가 형성되지 않는 경우, 상기 제1 부분 및 상기 제2 부분이 근접도 회합도 하지 않는, 〔54〕에 기재된 방법.
〔56〕 상기 제1 부분 및 상기 제2 부분이 근접도 회합도 하지 않는 경우, 상기 제1 부분 및/또는 상기 제2 부분에 상기 제3 분자가 실질적으로 반응도 결합도 하지 않는, 〔55〕에 기재된 방법.
〔56.1〕 상기 제1 표적 분자, 상기 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체는, 상기 제1 부분에 연결된 제1 표적 분자, 상기 제2 부분에 연결된 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체인, 〔1〕∼〔56〕 중 어느 하나에 기재된 방법.
〔57〕 제1 부분에 FKBP를 연결시킨 분자, 제2 부분에 FRB를 연결시킨 분자, 및 핵산에 연결한 라파마이신을 혼합하고, 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여 핵산에 연결한 라파마이신을 회수한 경우의 회수율이, 제1 부분에 FKBP를 연결시킨 분자 또는 제2 부분에 FRB를 연결시킨 분자 중 어느 것과, 핵산에 연결한 라파마이신을 혼합하고, 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여 핵산에 연결한 라파마이신을 회수한 경우의 회수율의 5배 이상일 때, 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합한 경우에, 상기 제1 부분 및/또는 상기 제2 부분과 반응 또는 결합하는 분자라고 판정되는, 〔1〕∼〔56.1〕 중 어느 하나에 기재된 방법.
〔58〕 제1 부분에 FKBP를 연결시킨 분자, 제2 부분에 FRB를 연결시킨 분자, 및 핵산에 연결한 라파마이신을 혼합하고, 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여 핵산에 연결한 라파마이신을 회수한 경우의 회수율이, 제1 부분에 FKBP를 연결시킨 분자 또는 제2 부분에 FRB를 연결시킨 분자 중 어느 것과, 핵산에 연결한 라파마이신을 혼합하고, 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여 핵산에 연결한 라파마이신을 회수한 경우의 회수율의 5배 미만일 때, 상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합한 경우에, 상기 제1 부분 및/또는 상기 제2 부분과 실질적으로 반응도 결합도 하지 않는 분자라고 판정되는, 〔1〕∼〔57〕 중 어느 하나에 기재된 방법.
〔59〕 상기 제1 부분과 상기 제2 부분을 포함하는 복합체가, 상기 단백질의 일부 또는 전부를 포함하는, 〔13〕∼〔58〕 중 어느 하나에 기재된 방법.
〔60〕 상기 단백질이, GFP, 루시페라아제, 유비퀴틴, 또는 SNAP 태그인, 〔1〕∼〔59〕 중 어느 하나에 기재된 방법.
〔61〕 상기 제1 부분과 상기 제2 부분이, 각각 GFP10과 GFP11이거나, GFP11과 GFP10이고, 상기 제3 분자가 GFP1-9를 포함하는 단백질인, 〔1〕∼〔60〕 중 어느 하나에 기재된 방법.
〔62〕 상기 제1 부분과 상기 제2 부분이, 각각 SNAP 태그의 N 말단측 단편과 SNAP 태그의 C 말단측 단편이거나, SNAP 태그의 C 말단측 단편과 SNAP 태그의 N 말단측 단편이고, 상기 제3 분자가 SNAP 비오틴인, 〔1〕∼〔60〕 중 어느 하나에 기재된 방법.
〔63〕 상기 제1 부분과 상기 제2 부분이, 각각 유비퀴틴의 N 말단측 단편과 유비퀴틴의 C 말단측 단편이거나, 유비퀴틴의 C 말단측 단편과 유비퀴틴의 N 말단측 단편이고, 상기 제3 분자가 항유비퀴틴 항체인, 〔1〕∼〔60〕 중 어느 하나에 기재된 방법.
〔64〕 상기 제1 부분과 상기 제2 부분이, 각각 Nanoluc-9와 Nanoluc-10이거나, Nanoluc-10과 Nanoluc-9이고, 상기 제3 분자가 Nanoluc1-8을 포함하는 단백질인, 〔1〕∼〔60〕 중 어느 하나에 기재된 방법.
〔65〕 GFP10이 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔61〕 중 어느 하나에 기재된 방법;
(a) 서열 번호: 73으로 표시되는 아미노산 서열,
(b) 서열 번호: 73으로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 73으로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.
〔66〕 GFP11이 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔61〕 및 〔65〕 중 어느 하나에 기재된 방법;
(a) 서열 번호: 74로 표시되는 아미노산 서열,
(b) 서열 번호: 74로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 74로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.
〔67〕 GFP1-9가 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔61〕, 〔65〕 및 〔66〕 중 어느 하나에 기재된 방법;
(a) 서열 번호: 72로 표시되는 아미노산 서열,
(b) 서열 번호: 72로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 72로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.
〔68〕 SNAP 태그의 N 말단측 단편이 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔60〕 및 〔62〕 중 어느 하나에 기재된 방법;
(a) 서열 번호: 83으로 표시되는 아미노산 서열,
(b) 서열 번호: 83으로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 83으로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.
〔69〕 SNAP 태그의 C 말단측 단편이 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔60〕, 〔62〕 및 〔68〕 중 어느 하나에 기재된 방법;
(a) 서열 번호: 84로 표시되는 아미노산 서열,
(b) 서열 번호: 84로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 84로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.
〔70〕 유비퀴틴의 N 말단측 단편이 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔60〕 및 〔63〕 중 어느 하나에 기재된 방법;
(a) 서열 번호: 76으로 표시되는 아미노산 서열,
(b) 서열 번호: 76으로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 76으로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.
〔71〕 유비퀴틴의 C 말단측 단편이 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔60〕, 〔63〕 및 〔70〕 중 어느 하나에 기재된 방법;
(a) 서열 번호: 77로 표시되는 아미노산 서열,
(b) 서열 번호: 77로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 77로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.
〔72〕 Nanoluc-9가 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔60〕 및 〔64〕 중 어느 하나에 기재된 방법;
(a) 서열 번호: 80으로 표시되는 아미노산 서열,
(b) 서열 번호: 80으로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 80으로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.
〔73〕 Nanoluc-10이 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔60〕, 〔64〕 및 〔72〕 중 어느 하나에 기재된 방법;
(a) 서열 번호: 81로 표시되는 아미노산 서열,
(b) 서열 번호: 81로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 81로 표시되는 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열.
〔74〕 Nanoluc1-8이 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔60〕, 〔64〕, 〔72〕 및 〔73〕 중 어느 하나에 기재된 방법;
(a) 서열 번호: 79로 표시되는 아미노산 서열,
(b) 서열 번호: 79로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 79로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.
〔75〕 상기 제1 표적 분자가, 이뮤노필린 패밀리에 속하는 단백질인, 〔1〕∼〔74〕 중 어느 하나에 기재된 방법.
〔76〕 상기 제1 표적 분자가, FKBP(FK506 binding protein/FK506 결합 단백질), 사이클로필린, FRB, 칼시뉴린, 및 Kras, Nras, Hras 등의 RAS 단백질로 이루어지는 군으로부터 선택되는, 〔1〕∼〔74〕 중 어느 하나에 기재된 방법.
〔77〕 상기 어피니티를 이용한 방법이, 풀다운법인, 〔1〕∼〔76〕 중 어느 하나에 기재된 방법.
〔78〕 상기 어피니티를 이용한 방법이, 비오틴과 비오틴 결합 단백질 사이의 어피니티, 또는 항원과 항체 사이의 어피니티를 이용한 방법인, 〔1〕∼〔77〕 중 어느 하나에 기재된 방법.
〔79〕 공정(2A)에 있어서의 용출이, 효소, 또는 열에 의해 행해지는, 〔16〕∼〔78〕 중 어느 하나에 기재된 방법.
〔80〕 공정(2A)에 있어서의 용출이, 상기 단백질의 제1 부분과 상기 제1 표적 분자 사이에 위치하는 제1 링커, 및 상기 단백질의 제2 부분과 상기 제2 표적 분자 사이에 위치하는 제2 링커를 절단하는 것에 의해 행해지는, 〔16〕∼〔79〕 중 어느 하나에 기재된 방법.
〔81〕 상기 제1 및 제2 링커가, 효소에 의해 절단되는 서열을 포함하는, 〔80〕에 기재된 방법.
〔82〕 상기 효소가 TEV 프로테아제인, 〔81〕에 기재된 방법.
〔83〕 상기 제1 부분 및 제2 부분을 제공하는 상기 단백질이, 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔82〕 중 어느 하나에 기재된 방법;
(a) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열,
(b) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열.
〔84〕 상기 제1 부분 및 제2 부분을 제공하는 상기 단백질이, 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔83〕 중 어느 하나에 기재된 방법;
(a) 서열 번호: 71로 표시되는 아미노산 서열,
(b) 서열 번호: 71로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 71로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.
〔85〕 상기 제1 부분 및 제2 부분을 제공하는 상기 단백질이, 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔83〕 중 어느 하나에 기재된 방법;
(a) 서열 번호: 75로 표시되는 아미노산 서열,
(b) 서열 번호: 75로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 75로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.
〔86〕 상기 제1 부분 및 제2 부분을 제공하는 상기 단백질이, 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔83〕 중 어느 하나에 기재된 방법;
(a) 서열 번호: 78로 표시되는 아미노산 서열,
(b) 서열 번호: 78로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 78로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.
〔87〕 상기 제1 부분 및 제2 부분을 제공하는 상기 단백질이, 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 〔1〕∼〔83〕 중 어느 하나에 기재된 방법;
(a) 서열 번호: 82로 표시되는 아미노산 서열,
(b) 서열 번호: 82로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 82로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열.
〔88〕 상기 제3 분자가, 상기 제1 부분 및 상기 제2 부분을 제공하는 상기 단백질에서 유래하는, 〔1〕∼〔87〕 중 어느 하나에 기재된 방법.
〔89〕 이하의 공정을 추가로 포함하는, 〔1〕∼〔88〕 중 어느 하나에 기재된 방법:
(4) 고상 담체에 고정된 제1 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하고, 상기 제1 표적 분자에 결합할 수 있는 피험 분자를 회수하는 공정; 및/또는
(5) 고상 담체에 고정된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하고, 상기 제2 표적 분자에 결합할 수 있는 피험 분자를 회수하는 공정.
〔90〕 공정(4)에 있어서, 고상 담체에 고정된 제1 표적 분자, 유리된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하는, 〔89〕에 기재된 방법.
〔91〕 공정(5)에 있어서, 고상 담체에 고정된 제2 표적 분자, 유리된 제1 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하는, 〔89〕 또는 〔90〕에 기재된 방법.
〔92〕 공정(4) 및 (5)가, 공정(1) 전에 행해지는, 〔89〕∼〔91〕 중 어느 하나에 기재된 방법.
〔93〕 공정(4) 후에 공정(5)가 행해지거나, 공정(5) 후에 공정(4)가 행해지는, 〔89〕∼〔92〕 중 어느 하나에 기재된 방법.
본 개시에 있어서, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자의 스크리닝 방법이 제공되었다. 본 개시의 방법을 이용하는 것에 의해, 계 중에 복수의 표적 분자와 피험 분자를 공존시킨 상태로부터, 1개의 표적 분자만과 복합체를 형성하는 피험 분자를 배제하면서, 복수의 표적 분자와 함께 복합체를 형성하는 후보 분자를 선별할 수 있다.
도 1은, 비오틴화 GFP1-9와 스트렙트아비딘간의 상호작용을 이용한 겔 시프트를 SDS-PAGE로 평가한 도면이다. 검출은 CBB 염색으로 행했다. (레인 1: 분자량 마커, 레인 2: 비오틴화 GFP1-9와 스트렙트아비딘의 혼합물, 레인 3: 비오틴화 GFP1-9, 레인 4: 비오틴화 GFP1-9(1/10양), 레인 5: 스트렙트아비딘)
도 2는, 비오틴화 GFP1-9의 SEC 분석의 결과(위 도면)와, 동 칼럼에서 분자량 마커를 흘려보낸 결과(아래 도면)이다. (마커 분자량: 좌측의 피크부터, 290.00x103, 142.00x103, 67.00x103, 32.00x103, 12.40x103)
도 3은, 비오틴화 splitNanoluc와 스트렙트아비딘간의 상호작용을 이용한 겔 시프트를 SDS-PAGE로 평가한 도면이다. 검출은 CBB 염색으로 행했다. (레인 1: 분자량 마커, 레인 2: 비오틴화 splitNanoluc와 스트렙트아비딘의 혼합물, 레인 3: 비오틴화 splitNanoluc, 레인 4: 비오틴화 splitNanoluc(1/10양), 레인 5: 스트렙트아비딘)
도 4는, 비오틴화 splitNanoluc의 SEC 분석의 결과(위 도면)와, 동 칼럼에서 분자량 마커를 흘려보낸 결과(아래 도면)이다. (마커 분자량: 좌측의 피크부터, 290.00x103, 142.00x103, 67.00x103, 32.00x103, 12.40x103)
도 2는, 비오틴화 GFP1-9의 SEC 분석의 결과(위 도면)와, 동 칼럼에서 분자량 마커를 흘려보낸 결과(아래 도면)이다. (마커 분자량: 좌측의 피크부터, 290.00x103, 142.00x103, 67.00x103, 32.00x103, 12.40x103)
도 3은, 비오틴화 splitNanoluc와 스트렙트아비딘간의 상호작용을 이용한 겔 시프트를 SDS-PAGE로 평가한 도면이다. 검출은 CBB 염색으로 행했다. (레인 1: 분자량 마커, 레인 2: 비오틴화 splitNanoluc와 스트렙트아비딘의 혼합물, 레인 3: 비오틴화 splitNanoluc, 레인 4: 비오틴화 splitNanoluc(1/10양), 레인 5: 스트렙트아비딘)
도 4는, 비오틴화 splitNanoluc의 SEC 분석의 결과(위 도면)와, 동 칼럼에서 분자량 마커를 흘려보낸 결과(아래 도면)이다. (마커 분자량: 좌측의 피크부터, 290.00x103, 142.00x103, 67.00x103, 32.00x103, 12.40x103)
본 개시는, 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자의 스크리닝 방법에 관한 것이다. 어떤 국면에 있어서 본 개시에 있어서의 스크리닝 방법은, 이하 (1) 및 (2)의 공정을 포함한다.
(1) 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하는 공정이고, 해당 제1 부분 및 해당 제2 부분이 단백질의 일부 또는 전부를 구성하는 공정; 및
(2) 공정(1) 후에, 해당 제1 부분과 해당 제2 부분이 근접 또는 회합하고 있는 것을 검출할 수 있는 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여, 해당 제1 표적 분자, 해당 제2 표적 분자, 및 해당 후보 분자를 포함하는 복합체를 회수하는 공정.
공정(1)
본 개시에 있어서의 스크리닝 방법은, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하는 공정(공정(1))을 포함한다. 본 개시에 있어서는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를, 한번에 혼합할 수 있다. 또한 본 개시에 있어서는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를, 복수회로 나누어 혼합할 수 있다. 구체적으로는, 제1 부분에 연결된 제1 표적 분자와 제2 부분에 연결된 제2 표적 분자를 혼합하고, 다음으로 이들 혼합물에 피험 분자를 포함하는 라이브러리를 혼합할 수 있다. 또한 다른 태양에 있어서, 제1 부분에 연결된 제1 표적 분자와 피험 분자를 포함하는 라이브러리를 혼합하고, 다음으로 이들 혼합물에 제2 부분에 연결된 제2 표적 분자를 혼합할 수 있다. 또 다른 태양에 있어서는, 제2 부분에 연결된 제2 표적 분자와 피험 분자를 포함하는 라이브러리를 혼합하고, 다음으로 이들 혼합물에 제1 부분에 연결된 제1 표적 분자를 혼합할 수 있다.
즉 본 개시에 있어서의 공정(1)은, 일 태양에 있어서,
(i) 제1 부분에 연결된 제1 표적 분자와 제2 부분에 연결된 제2 표적 분자를 혼합하는 공정, 및
(ii) (i)에 있어서 얻어진 혼합물과 1 혹은 복수의 피험 분자 또는 그것을 포함하는 라이브러리를 혼합하는 공정
을 포함할 수 있다.
혹은 본 개시에 있어서의 공정(1)은, 일 태양에 있어서,
(i) 제1 부분에 연결된 제1 표적 분자와 1 혹은 복수의 피험 분자 또는 그것을 포함하는 라이브러리를 혼합하는 공정, 및
(ii) (i)에 있어서 얻어진 혼합물과 제2 부분에 연결된 제2 표적 분자를 혼합하는 공정
을 포함할 수 있다.
혹은 본 개시에 있어서의 공정(1)은, 일 태양에 있어서,
(i) 제2 부분에 연결된 제2 표적 분자와 1 혹은 복수의 피험 분자 또는 그것을 포함하는 라이브러리를 혼합하는 공정, 및
(ii) (i)에 있어서 얻어진 혼합물과 제1 부분에 연결된 제1 표적 분자를 혼합하는 공정
을 포함할 수 있다.
혹은 본 개시에 있어서의 공정(1)은, 일 태양에 있어서,
(A) 제1 부분을 연결시킨 상기 제1 표적 분자,
(B) 제2 부분을 연결시킨 상기 제2 표적 분자, 및
(C) 피험 분자,
에 의해 형성된 복합체를 제3 분자와 혼합하는 공정
을 포함할 수 있다.
혹은 본 개시에 있어서의 스크리닝 방법은, 공정(1) 후에, 공정(1)에 있어서 얻어지는 혼합물에, 제1 부분과 제2 부분이 근접 또는 회합하고 있는 것을 검출할 수 있는 제3 분자를 혼합하는 공정(공정(1A))을 포함해도 된다.
추가적인 태양에 있어서, 본 개시에 있어서의 스크리닝 방법은, 공정(1) 후에 공정(1A)를 포함하는 것 대신에, 공정(1) 자체가, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 제3 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하는 공정이어도 된다. 이 경우, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 제3 분자, 및 복수의 피험 분자를 포함하는 라이브러리는, 한번에 혼합해도 복수회로 나누어 혼합해도 된다. 또한 복수회로 나누어 혼합하는 경우, 이들 4개의 성분을 1개씩 순번으로 혼합해도 되고, 이들 4개 중 2개의 성분(예를 들면, 제1 부분에 연결된 제1 표적 분자와 제2 부분에 연결된 제2 표적 분자)을 포함하는 혼합물을 미리 준비하고, 거기에 다른 성분을 혼합해도 되고, 이들 4개 중 3개의 성분(예를 들면, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리)을 포함하는 혼합물을 미리 준비하고, 거기에 다른 성분을 혼합해도 된다.
또한 비한정된 일 태양에 있어서, 본 개시는, 이하 (1) 및 (2)의 공정을 포함하는, 제1 표적 분자 및 제2 표적 분자와 복합체를 형성할 수 있는 후보 분자를 스크리닝하는 방법이어도 된다.
(1) (A) 제1 부분을 연결시킨 제1 표적 분자,
(B) 제2 부분을 연결시킨 제2 표적 분자, 및
(C) 피험 분자
에 의해 형성된 복합체를,
제1 부분과 제2 부분이 근접 또는 회합하고 있는 것을 검출할 수 있는 제3 분자와 혼합하는 공정이고,
해당 제1 부분 및 해당 제2 부분은, 단백질의 일부 또는 전부를 구성하고,
해당 제3 분자는, 해당 제1 부분 및 해당 제2 부분이 근접한 경우에 해당 제1 부분 및/또는 해당 제2 부분과 결합하는, 공정; 및
(2) 공정(1) 후에, 해당 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여, 해당 복합체를 회수하는 공정.
본 개시에 있어서의 스크리닝 방법에 있어서는, 각 공정에 있어서 특정되는 분자를 혼합하는 것에 의해, 그들 분자가 스크리닝계에 있어서 공존한다. 따라서, 일례로서 본 개시에 있어서의 공정(1)은 다음과 같이 표현할 수도 있다.
(1) 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 공존시키는 공정이고, 해당 제1 부분 및 해당 제2 부분이 단백질의 일부 또는 전부를 구성하는 공정.
또한 본 개시에 있어서는, 각 공정에 있어서 특정되는 분자를 혼합하는 것에 의해, 그들 분자가 접촉해도 된다. 즉, 일례로서 본 개시에 있어서의 공정(1)은 다음과 같이 표현할 수도 있다.
(1) 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 접촉시키는 공정이고, 해당 제1 부분 및 해당 제2 부분이 단백질의 일부 또는 전부를 구성하는 공정.
한편 후술하는 바와 같이, 본 개시에 있어서의 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체에는, 후보 분자가 제1(또는 제2) 표적 분자와 결합하고, 제1(또는 제2) 표적 분자가 제2(또는 제1) 표적 분자와 결합하고 있는 태양(후보 분자는 제2(또는 제1) 표적 분자란 직접적으로는 결합하고 있지 않는 태양)도 포함된다. 따라서, 본 개시에 있어서의 공정(1)에 있어서는, 피험 분자가 제1 표적 분자 및 제2 표적 분자의 양방과 접촉하는 것은 필수는 아니다. 본 개시에 있어서의 공정(1)에는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리가 혼합되어 있는 한, 혹은 이들이 동일한 계에 공존하고 있는 한, 피험 분자가 제1 표적 분자 및 제2 표적 분자의 어느 일방과만 접촉하는 태양이 포함된다.
공정(2)
본 개시에 있어서의 스크리닝 방법은, 공정(1)에 있어서 형성된 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체를, 제1 부분과 제2 부분이 근접 또는 회합하고 있는 것을 검출할 수 있는 제3 분자를 개재시킨 어피니티를 이용하여 회수하는 공정(공정(2))을 포함한다. 본 개시에 있어서의 스크리닝 방법에 있어서는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체가 형성되면, 당해 복합체에 있어서, 제1 부분 및 제2 부분이 근접 또는 회합한다. 또한, 그에 수반하여, 혹은 그것과 연동하여, 제1 부분 및 제2 부분을 포함하는 복합체가 형성된다. 따라서 본 개시에 있어서는, 제1 부분 및 제2 부분이 근접 또는 회합하는 것을, 제1 부분 및 제2 부분을 포함하는 복합체가 형성된다고 표현할 수도 있다. 그리고 본 개시에 있어서의 스크리닝 방법에 있어서는, 제1 부분 및 제2 부분이 근접 또는 회합한 경우에, 제3 분자가 제1 부분 및/또는 제2 부분에 반응 또는 결합할 수 있다. 본 개시에 있어서의 스크리닝 방법에 있어서는, 이와 같이 해서 형성된 제1 표적 분자, 제2 표적 분자, 후보 분자, 및 제3 분자를 포함하는 복합체를 선택하고, 당해 복합체로부터, 후보 분자를 회수할 수 있다. 일 태양에 있어서, 제1 부분 및 제2 부분을 제1 표적 분자 및 제2 표적 분자로부터 각각 절단하면, 제1 표적 분자, 제2 표적 분자, 및 후보 분자로 이루어지는 복합체를 취득할 수 있다. 또, 당해 복합체로부터 후보 분자를 회수할 수 있다. 본 개시에 있어서의 제3 분자는, 상기, 「제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체」, 「제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체」, 「제1 부분 및 제2 부분을 포함하는 복합체」, 및 「제1 부분 및 제2 부분이 근접 또는 회합하고 있는 것」 중 적어도 1개를 검출하는 것이 가능한 분자이다.
한편, 본 개시에 있어서의 스크리닝 방법에 있어서는, 피험 분자가 제1 표적 분자 및 제2 표적 분자의 어느 것에도 결합하지 않는 경우, 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체는 형성되지 않는다. 그리고, 이와 같은 복합체가 형성되지 않는 경우, 제1 부분 및 제2 부분은 근접도 회합도 하지 않는다. 바꾸어 말하면, 후보 분자가 존재하지 않으면, 제1 부분 및 제2 부분을 포함하는 복합체는 형성되지 않는다. 이 경우, 제3 분자는 제1 부분 및/또는 제2 부분에 실질적으로 반응도 결합도 하지 않는다. 그리고, 이 경우, 제3 분자를 개재시킨 어피니티를 이용한 방법에 의해, 피험 분자는 회수되지 않는다. 따라서, 이 경우, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 후보 분자, 및 제3 분자를 포함하는 복합체는 형성되지 않고, 만일 피험 분자 중에 제1 표적 분자만과 복합체를 형성할 수 있는 분자, 혹은 제2 표적 분자만과 복합체를 형성할 수 있는 분자가 존재하고 있었다고 하더라도, 본 개시에 있어서의 스크리닝 방법을 이용하면, 그와 같은 피험 분자가 단리되어 버리는 확률을 저감할 수 있다. 본 개시의 스크리닝 방법은, 그와 같은 후보 분자의 존재에 기인한 검출 정밀도의 저하를 억제하는 것이 가능하다.
일 태양에 있어서, 공정(2)에 있어서 언급되는, 「제1 표적 분자, 제2 표적 분자, 및 후보 분자」를 포함하는 복합체로서는, 「제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자」를 포함하는 복합체를 가리킬 수 있고, 해당 복합체는, 문맥에 따라서 제3 분자를 추가로 포함하고 있어도 된다.
공정(2A)
일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법은, 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체를 회수한 후, 당해 복합체로부터 후보 분자를 용출하는 공정(공정(2A))을 추가로 포함할 수 있다. 일 태양에 있어서, 용출은, 효소 반응 또는 열 반응에 의해 행할 수 있다. 효소 반응에 의한 용출에는, 후술하는 TEV 프로테아제를 이용할 수 있다.
공정(2B)
일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법은, 후보 분자가 폴리뉴클레오타이드를 포함하거나 혹은 폴리뉴클레오타이드에 연결되어 있는 경우, 후보 분자가 폴리뉴클레오타이드에 의해 코드되는 경우, 또는 후보 분자가 폴리뉴클레오타이드 등인 경우, 당해 폴리뉴클레오타이드를 증폭하는 공정(공정(2B))을 포함할 수 있다. 폴리뉴클레오타이드의 증폭은, 폴리머라아제 연쇄 반응(PCR; polymerase chain reaction), LAMP(loop-mediated isothermal amplification), TMA(transcription-mediated amplification), TRC(transcription-reverse transcription concerned reaction), LCR(ligase chain reaction), SDA(standard displacement amplification), NASBA(nucleic acid sequence-based amplification) 등, 당업자에게 주지된 방법에 의해 행할 수 있다.
한편, 일 태양에 있어서, 상기에서 증폭된 폴리뉴클레오타이드를 전사하는 것에 의해, mRNA 라이브러리를 얻어도 되고, 이들을 주형으로 해서 재차 펩타이드의 라이브러리를 제조하고, 당해 라이브러리를 본 개시에 있어서의 스크리닝 방법에 제공할 수도 있다. 이와 같은 라이브러리는 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성할 수 있는 펩타이드가 농축되어 있기 때문에, 이 라이브러리를 이용하여 재차 패닝을 행함으로써, 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성할 수 있는 펩타이드를, 보다 농축할 수 있다. 본 개시에 있어서의 스크리닝 방법에 있어서는, 공정(1) 및 (2), 공정(1), (2) 및 (2B), 또는 공정(1), (1A), (2) 및 (2B)를 복수회(예를 들면, 2회 이상, 3회 이상 또는 4회 이상) 반복하는 것에 의해, 목적하는 후보 분자를 농축할 수 있다. 또한 본 개시에 있어서의 스크리닝 방법에 있어서는, 공정(1), (2), (2A) 및 (2B), 또는 공정(1), (1A), (2), (2A) 및 (2B)를 복수회(예를 들면, 2회 이상, 3회 이상 또는 4회 이상) 반복하는 것에 의해서도, 목적하는 후보 분자를 농축할 수 있다. 일 태양에 있어서, 후보 분자가 폴리뉴클레오타이드에 연결된 펩타이드인 경우, 이와 같이 해서 농축된 펩타이드에 포함되는 염기 서열 정보를 기초로 아미노산 서열을 동정하여, 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성할 수 있는 펩타이드를 제조할 수 있다. 일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법은, in vitro로 행할 수 있다.
공정(3)
일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법은, 회수된 제1 표적 분자, 제2 표적 분자, 및 후보 분자의 복합체에 포함되는 후보 분자를 동정하는 공정을 추가로 포함할 수 있다. 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체가 얻어지면, 당업자에게 주지된 방법에 의해, 그로부터 후보 분자를 단리, 취득할 수 있다. 일 태양에 있어서, 후보 분자의 동정은, 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체로부터 후보 분자를 단리한 후에 행할 수 있다. 후보 분자의 동정은 당업자에게 주지된 방법으로 행하는 것이 가능하지만, 예를 들면, 후보 분자가 폴리뉴클레오타이드에 연결된 펩타이드 또는 화합물인 경우, 당해 후보 분자를 인코드하는 폴리뉴클레오타이드의 염기 서열을 결정하는 것에 의해 해당 펩타이드 또는 화합물을 동정할 수 있다. 구체적으로는, 예를 들면 폴리뉴클레오타이드를 PCR 증폭하고, 그의 염기 서열을 해석함으로써, 폴리뉴클레오타이드에 연결된 펩타이드의 아미노산 서열 또는 화합물을 분명히 할 수 있다. 폴리뉴클레오타이드가 mRNA인 경우는 당해 mRNA로부터 cDNA를 합성한 것을 이용해도 된다.
또한 후보 분자에 태그가 부여되어 있지 않은 경우는, 예를 들면 ASMS(Affinity Selection Mass Spectrometry)에 의해 후보 분자를 동정할 수 있다.
공정(4) 및 (5)
일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법은, 고상 담체에 고정된 제1 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하고, 상기 제1 표적 분자에 결합할 수 있는 후보 분자를 회수하는 공정(「공정(4)」), 및/또는, 고상 담체에 고정된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하고, 상기 제2 표적 분자에 결합할 수 있는 후보 분자를 회수하는 공정(「공정(5)」)을 포함할 수 있다. 공정(4)에 있어서는, 고상 담체에 고정된 제1 표적 분자, 유리된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합해도 된다. 공정(5)에 있어서는, 고상 담체에 고정된 제2 표적 분자, 유리된 제1 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합해도 된다. 일 태양에 있어서, 공정(4) 후에 공정(5)를 행할 수 있고, 또는, 공정(5) 후에 공정(4)를 행할 수 있다. 공정(4) 및 (5)는, 공정(1)∼(3)과 조합할 수 있고, 예를 들면 공정(1) 전에 공정(4) 및 (5)를 행할 수 있다. 공정(4) 및 (5)의 실시 횟수에 제한은 없지만, 예를 들면 공정(4) 또는 (5)를 독립적으로 1회 또는 복수회(예를 들면, 2회 이상, 3회 이상 또는 4회 이상) 반복해서 실시해도 되고, 공정(4) 및 (5)를 1세트로 해서, 1회 또는 복수회(예를 들면, 2회 이상, 3회 이상 또는 4회 이상) 반복해서 실시할 수도 있다.
일 태양에 있어서, 공정(4) 및 (5)의 각각의 공정 후에, 전술한 공정(2A)와 마찬가지로, 피험 분자 또는 후보 분자를 용출하는 공정을 포함할 수 있다. 후보 분자가 폴리뉴클레오타이드를 포함하거나 혹은 폴리뉴클레오타이드에 연결되어 있는 경우에는, 공정(4) 및 (5)의 각각의 공정 후에, 전술한 공정(2B)와 마찬가지로, 폴리뉴클레오타이드를 증폭하는 공정을 포함할 수 있다. 일 태양에 있어서, 후보 분자의 동정은, 전술한 공정(3)에 따라 행할 수 있다.
특정한 이론에 구속되는 것은 아니지만, 피험 분자를 포함하는 라이브러리와 혼합할 때에, 한쪽의 표적 분자(예를 들면 제1 표적 분자)를 고상 담체에 고정하고, 다른 한쪽의 표적 분자(예를 들면 제2 표적 분자)를 유리된 상태로 함으로써, 회수되는 후보 분자군 중에는, 양방의 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자가 포함될 수 있다고 생각된다. 다음으로, 고상 담체에 고정하는 표적 분자와 유리된 표적 분자를 바꿔 넣은 상태에서, 앞서 얻어진 후보 분자군과 혼합하면, 양방의 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자가 농축된다고 생각된다. 이와 같이 표적 분자의 고정/유리 상태를 교대로 변경하면서 패닝을 행함으로써, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자를 라이브러리로부터 선택할 수 있다고 생각된다. 일 태양에 있어서, 공정(4) 및 (5)를 공정(1) 전에 행할 수 있지만, 이 순번으로 패닝을 행하는 것에 의해, 제1 표적 분자 및/또는 제2 표적 분자에 특이적으로 결합할 수 있는 후보 분자를 효율적으로 농축할 수 있다고 생각된다. 구체적으로는, 공정(1) 이후에 있어서, 표적 분자에 대한 결합 친화성을 갖지 않는 비특이적인 피험 분자의 잔존율을 저감할 수 있다고 생각된다.
일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법은, 이하의 공정을 포함하는, 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자를 스크리닝하는 방법이다:
(4) 고상 담체에 고정된 제1 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하고, 상기 제1 표적 분자에 결합할 수 있는 피험 분자를 회수하는 공정; 및
(5) 고상 담체에 고정된 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하고, 상기 제2 표적 분자에 결합할 수 있는 피험 분자를 회수하는 공정.
제3 분자
전술한 대로 본 개시에 있어서의 스크리닝 방법에 있어서는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자와의 사이에서 복합체가 형성된 경우, 제1 부분 및 제2 부분이 근접 또는 회합한다. 본 개시에 있어서 제3 분자는, 본 개시에 있어서의 제1 부분 및 제2 부분이 근접 또는 회합하고 있는 것을 검출하는 것이 가능한 분자이다. 또한 일 태양에 있어서 본 개시에 있어서의 제3 분자는, 제1 부분 및 제2 부분이 근접 또는 회합한 경우에, 제1 부분 및 제2 부분을 포함하는 복합체를 형성시킬 수 있는 분자이다. 일 태양에 있어서, 본 개시에 있어서의 제3 분자는, 제1 부분 및 제2 부분을 제공하는 단백질에서 유래하는 분자일 수 있다. 일 태양에 있어서, 제3 분자의 아미노산 서열은, 제1 부분 및 제2 부분을 제공하는 단백질 중에 존재하는 야생형의 아미노산 서열과 동일해도 되고, 상이해도 된다. 일 태양에 있어서, 본 개시에 있어서의 제3 분자는, 제1 부분 및 제2 부분과 함께, 어떤 단백질의 일부 또는 전부를 구성할 수 있고, 예를 들면, GFP 또는 루시페라아제의 전부를 구성할 수 있다. 이 경우여도, 제3 분자는, 제1 부분 및 제2 부분을 제공하는 단백질에 포함되지 않는 태그 및/또는 링커 서열 등을 포함할 수 있다. 이 경우여도, 제3 분자는, 제1 부분 및 제2 부분과 함께, 해당 단백질의 일부 또는 전부를 구성할 수 있다. 일 태양에 있어서, 본 개시에 있어서의 제3 분자에는, 아미노산 서열에 개변을 갖는 것도 포함된다. 예를 들면, 제3 분자의 조제나 안정성 등에 적합한 아미노산의 개변(1 또는 복수의 아미노산의 결실, 삽입, 치환 및/또는 부가)이 행해져도 된다.
종래의 발광을 지표로 한 방법 대신에 어피니티를 사용하여 피험 분자를 스크리닝하는 경우, 제3 분자는, 제1 부분 및 제2 부분이 근접 또는 회합한 경우에만, 해당 제1 부분 및/또는 제2 부분에 반응 또는 결합하는 분자일 것이 요구된다. 그래서 본 발명자들은, GFP1-9는 GFP10(또는 GFP11)의 비존재하에서 GFP11(또는 GFP10)과 회합할 수 있는 것인지, 아니면 GFP1-9가 GFP10 및 GFP11과 회합하기 위해서는 GFP10과 GFP11의 양방의 존재를 필요로 하는지에 대하여, 검증을 행했다. 그 결과, 본 발명자들은, GFP1-9는 GFP10(또는 GFP11)의 비존재하에서는 GFP11(또는 GFP10)과 회합하지 않는 것, GFP1-9가 GFP10 및 GFP11과 회합하기 위해서는 GFP10과 GFP11이 근접, 회합 혹은 상호작용하고 있을 것이 필요한 것을 발견했다.
또 본 발명자들은, 루시페라아제의 일종인 Nanoluc(등록상표)를 이용하여, 전술한 GFP와 마찬가지의 검증을 행했다. 즉, Nanoluc1-8은 Nanoluc-9(또는 Nanoluc-10)의 비존재하에서 Nanoluc-10(또는 Nanoluc-9)과 회합할 수 있는 것인지, 아니면 Nanoluc1-8이 Nanoluc-9 및 Nanoluc-10과 회합하기 위해서는 Nanoluc-9와 Nanoluc-10의 양방의 존재를 필요로 하는지에 대하여, 검증을 행했다. 그 결과, 본 발명자들은, Nanoluc1-8은 Nanoluc-9(또는 Nanoluc-10)의 비존재하에서는 Nanoluc-10(또는 Nanoluc-9)과 회합하지 않는 것, Nanoluc1-8이 Nanoluc-9 및 Nanoluc-10과 회합하기 위해서는 Nanoluc-9와 Nanoluc-10이 근접, 회합 혹은 상호작용하고 있을 것이 필요한 것을 발견했다.
이들 지견은, split GFP 기술이나 Nanoluc 기술로 대표되는 split-protein계에 어피니티를 이용한 후보 분자의 회수 방법을 적용하여, 일방의 표적 분자만과 복합체를 형성하는 피험 분자를 배제하면서, 다양성이 큰 라이브러리 중에서 후보 분자를 스크리닝하는 것이 가능한 계를 구축함에 있어서, 중요했다.
특정한 이론에 구속되는 것은 아니지만, 본 발명자들은 이하와 같이 고찰한다. 형광을 지표로 해서 라이브러리로부터 표적 분자에 대한 바인더의 스크리닝을 시도한 경우, 형광단의 성숙까지 어느 정도의 시간을 필요로 하기 때문에, 시간 경과와 함께 특정한 혹은 유사한 성질(예를 들면 높은 결합 활성)을 갖는 바인더 집단에 수속되어 버려, 다양한 성질을 갖는 후보 분자를 취득하는 것이 어려워질 가능성이 있다. 복잡한 결합·반응 양식을 가져오는 후보 분자의 취득 확률을 높이려면, 특정한 혹은 유사한 성질을 갖는 분자 집단이 아니라, 비록 결합 활성이 낮았다고 하더라도 가능한 한 다양한 성질을 갖는 후보 분자를 취득할 수 있는 스크리닝 방법인 것이 바람직하다. 이와 같은 관점에서도, 본 개시에 있어서의 후보 분자를 스크리닝하기 위해서는, 발광을 지표로 하는 방법을 대신하는 새로운 방법으로서, 어피니티를 사용한 후보 분자의 스크리닝 방법을 구축하는 것이 중요했다.
또 본 발명자들은, 단백질로서 유비퀴틴 및 SNAP 태그를 사용한 경우에도 GFP나 Nanoluc를 사용한 경우와 마찬가지로, 복수의 단백질과의 복합체를 형성할 수 있는 분자를 스크리닝하는 것이 가능한 것을 발견했다. 즉 본 발명자들은, 전장(全長) 유비퀴틴에 결합할 수 있는 한편으로, 그 단편인 split 유비퀴틴에는 결합할 수 없는 항유비퀴틴 항체를 사용하면, split 유비퀴틴을 이용하여 마찬가지의 스크리닝이 가능한 것을 착상하여, 이것을 분명히 했다. 또한, 전장 SNAP 태그는 기질인 SNAP-비오틴과 반응할 수 있는 데 비해, 그 단편인 split SNAP는 SNAP-비오틴과 반응할 수 없는 성질을 이용하면, split SNAP를 이용하여 마찬가지의 스크리닝이 가능한 것을 착상하여, 이것을 분명히 했다.
따라서, 일 태양에 있어서 본 개시에 있어서의 제3 분자는, 제1 부분 및 제2 부분이 근접 또는 회합한 경우에, 해당 제1 부분 및/또는 해당 제2 부분과 반응 또는 결합할 수 있는 분자이다. 또한 일 태양에 있어서 본 개시에 있어서의 제3 분자는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자와의 사이에서 복합체가 형성된 경우에, 해당 제1 부분 및/또는 해당 제2 부분과 반응 또는 결합할 수 있는 분자이다.
본 개시에 있어서의 일 태양에 있어서, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자와의 사이에서 복합체가 형성된 경우에, 제1 부분 및 제2 부분은 근접 또는 회합하고 있다고 말할 수 있다. 또한 일 태양에 있어서, 제1 부분 및 제2 부분을 포함하는 복합체가 형성되어 있을 때에, 제1 부분 및 제2 부분은 근접 또는 회합하고 있다고 말할 수 있다.
본 개시에 있어서의 제1 부분 및 제2 부분의 근접, 및 제1 부분 및 제2 부분의 회합은, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자와의 사이에서 복합체가 형성되는 것에 기인하는 것인 한, 그 정도 및 태양을 따지지 않는다. 예를 들면, 본 개시에 있어서의 제1 부분과 제2 부분이 근접 또는 회합하고 있는 상태에는, 제1 부분과 제2 부분이 분자간력 등에 의해 결합한 상태, 및 이들이 결합하고 있지 않는 상태 모두가 포함된다.
또한 전술한 대로, 본 개시에 있어서의 스크리닝 방법에 있어서는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자와의 사이에서 복합체가 형성되지 않는 경우, 제1 부분 및 제2 부분은 근접도 회합도 하지 않는다. 일 태양에 있어서 본 개시에 있어서의 제3 분자는, 제1 부분 및 제2 부분이 근접도 회합도 하지 않는 경우에, 해당 제1 부분 및/또는 해당 제2 부분과 실질적으로 반응도 결합도 하지 않는 분자이다. 또한 일 태양에 있어서 본 개시에 있어서의 제3 분자는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자와의 사이에서 복합체가 형성되지 않는 경우에, 해당 제1 부분 및/또는 해당 제2 부분과 실질적으로 반응도 결합도 하지 않는 분자이다.
또한 다른 태양에 있어서 본 개시에 있어서의 제3 분자는, 제1 부분 및 제2 부분이 근접도 회합도 하고 있지 않은 경우에, 제1 부분 및 제2 부분이 근접 또는 회합하고 있는 경우와 비교해서, 10분의 1 미만, 20분의 1 미만, 30분의 1 미만, 또는 40분의 1 미만으로밖에, 제1 부분 및/또는 제2 부분과 반응 또는 결합하지 않는 분자이다. 또한 다른 태양에 있어서, 본 개시에 있어서의 제3 분자는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체가 형성되어 있지 않은 경우, 당해 복합체가 형성된 경우와 비교해서, 10분의 1 미만, 20분의 1 미만, 30분의 1 미만, 또는 40분의 1 미만으로밖에, 제1 부분 및/또는 제2 부분과 반응 또는 결합하지 않는 분자이다.
제3 분자가, 제1 부분 및/또는 제2 부분과 반응 또는 결합하는지 여부는, 예를 들면 제1 표적 분자로서 FKBP(FK506 binding protein/FK506 결합 단백질), 제2 표적 분자로서 FRB(FKBP-rapamycin binding domain of FKBP12-rapamycin associated protein/FKBP-라파마이신 결합 단백질의 FKBP-라파마이신 결합 도메인), 피험 분자로서 라파마이신을 사용하여 본 개시에 있어서의 스크리닝 방법을 행하고, 제1 부분에 FKBP를 연결시킨 분자, 제2 부분에 FRB를 연결시킨 분자, 라파마이신, 및 제3 분자를 포함하는 복합체의 회수를 시도했을 때에, 또는 제1 부분에 FKBP를 연결시킨 분자, 제2 부분에 FRB를 연결시킨 분자, 및 라파마이신의 분자를 포함하는 복합체의 회수를 시도했을 때에, 당해 복합체가 회수되는지 여부에 의해 판정할 수 있다. 본 개시에 있어서는, 당해 복합체가 회수되었을 때에, 상기 제3 분자는 제1 부분 및/또는 제2 부분과 반응 또는 결합한 분자라고 판정할 수 있다. 또한 일 태양에 있어서, 당해 복합체가 회수되지 않을 때에, 상기 제3 분자는 제1 부분 및/또는 제2 부분과 실질적으로 반응도 결합도 하지 않은 분자라고 판정할 수 있다. 또한 본 개시에 있어서는, 어떤 분자의 제1 부분 및/또는 제2 부분에 대한 반응 또는 결합의 정도가, 제1 부분 및 제2 부분이 근접 또는 회합하고 있는 경우에 제1 부분 및/또는 제2 부분과 반응 또는 결합하는 것이 가능한 제3 분자의 그것과 비교해서, 10분의 1 미만, 20분의 1 미만, 30분의 1 미만, 또는 40분의 1 미만인 경우에, 당해 어떤 분자는, 제1 부분 및/또는 제2 부분과 실질적으로 반응도 결합도 하지 않은 분자라고 판정할 수 있다. 제1 부분에 FKBP를 연결시킨 분자, 제2 부분에 FRB를 연결시킨 분자, 라파마이신, 및 제3 분자를 포함하는 복합체, 또는 제1 부분에 FKBP를 연결시킨 분자, 제2 부분에 FRB를 연결시킨 분자, 및 라파마이신, 및 제3 분자를 포함하는 복합체가 회수되는지 여부, 또는 그 회수율은, 예를 들면, 라파마이신에 연결된 핵산의 양(분자수)을 지표로 산출할 수 있다.
또한 본 개시에 있어서는, (a) 제1 표적 분자로서 FKBP, 제2 표적 분자로서 FRB, 피험 분자로서 라파마이신을 사용하여 본 개시에 있어서의 스크리닝 방법을 행한 경우에 얻어지는 라파마이신의 회수율과, (b) 제2 표적 분자를 이용하지 않고서, 제1 표적 분자로서 FKBP, 피험 분자로서 라파마이신을 사용하여 본 개시에 있어서의 스크리닝 방법을 행한 경우에 얻어지는 라파마이신의 회수율, 또는 (c) 제1 표적 분자를 이용하지 않고서, 제2 표적 분자로서 FRB, 피험 분자로서 라파마이신을 사용하여 본 개시에 있어서의 스크리닝 방법을 행한 경우에 얻어지는 라파마이신의 회수율을 비교했을 때에, (a)에 있어서의 회수율이 (b) 또는 (c)에 있어서의 회수율의 5배 이상, 10배 이상, 15배 이상, 20배 이상, 30배 이상, 또는 40배 이상인 경우에, 제3 분자는 제1 부분 및 제2 부분이 근접 또는 회합한 경우에, 제1 부분 및/또는 제2 부분과 반응 또는 결합하는 분자라고 판정할 수 있다. 바꾸어 말하면, 이 경우, 제3 분자는, 제1 표적 분자 및 제2 표적 분자의 어느 일방만을 포함하는 복합체와는 유의하게 반응 또는 결합하지 않고, 피험 분자, 제1 부분에 연결된 제1 표적 분자 및 제2 부분에 연결된 제2 표적 분자를 포함하는 복합체만과 유의하게 반응 또는 결합하는 분자라고 판정할 수 있다. 또한 일 태양에 있어서, 상기 (a)와 상기 (b) 또는 (c)를 비교했을 때에, (a)에 있어서의 회수율이 (b) 또는 (c)에 있어서의 회수율의 5배 미만, 10배 미만, 15배 미만, 20배 미만, 30배 미만, 또는 40배 미만인 경우에, 제3 분자는 제1 부분 및 제2 부분이 근접 또는 회합한 경우에, 제1 부분 및/또는 제2 부분과 실질적으로 반응도 결합도 하지 않는 분자라고 판정할 수 있다. 이와 같은 평가는, 예를 들면 실시예의 기재에 기초하여 행할 수 있다.
전술한 대로 본 개시에 있어서의 스크리닝 방법은, Split GFP 기술로 대표되는 Split protein계에 어피니티를 이용한 후보 분자의 회수 방법을 적용한 것을 특징의 하나로 한다. 즉 본 개시에 있어서의 스크리닝 방법은, 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 후보 분자, 및 제3 분자를 포함하는 복합체, 또는 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체를 회수하는 공정을 포함한다. 따라서 본 개시에 있어서의 제3 분자는, 어피니티를 이용한 복합체의 회수를 위한 태그를 갖고 있어도 된다. 일 태양에 있어서, 제3 분자는, 비오틴화를 위한 태그 서열을 갖고 있어도 된다. 게다가, 제3 분자는, 정제를 위한 태그, 링커, 및/또는 그 밖의 서열을 포함하고 있어도 된다.
제1 부분, 제2 부분
본 개시의 일 태양에 있어서 제1 부분 및 제2 부분이란, 어떤 단백질의 일부를 구성하는 부분 또는 단편일 수 있다. 일 태양에 있어서, 상기 부분 또는 단편은, 해당 단백질의 본래의 기능이나 활성을 갖지 않는다. 본 개시에 있어서의 제1 부분 및 제2 부분은, 단백질을 2개, 3개, 또는 그 이상으로 분할하는 것에 의해 얻어지는 단백질의 부분(단편)일 수 있다. 혹은, 본 개시의 일 태양에 있어서의 제1 부분 및 제2 부분은, 이들이 근접 또는 회합했을 때에 원래의 단백질의 전부 또는 일부를 구성하는 부분일 수 있다. 여기에서, 분할된 단백질의 각 부분은, 일부 중복되는 아미노산 서열을 갖고 있어도 된다. 일 태양에 있어서, 그와 같은 중복되는 아미노산 서열은, 분할된 단백질의 각 부분의 말단 부분에 존재할 수 있다. 제1 부분 및 제2 부분이 회합한 경우에 원래의 단백질의 전부를 구성하는 태양에 있어서는, 제1 부분과 제2 부분이 회합한 단백질은, 해당 단백질이 분할되기 전에 갖고 있던 구조, 기능 또는 활성을 가질 수 있다. 또한 제1 부분 및 제2 부분이 회합한 경우에 원래의 단백질의 일부를 구성하는 태양에 있어서는, 제1 부분과 제2 부분이 근접 또는 회합한 단백질은, 해당 단백질을 구성하는 다른 부분, 예를 들면, 제3 분자와 추가로 회합하는 것에 의해, 해당 단백질이 분할되기 전에 갖고 있던 구조, 기능 또는 활성을 가질 수 있다. 전자의 단백질의 예로서, SNAP 태그 및 유비퀴틴을 들 수 있고, 후자의 단백질의 예로서, GFP 및 루시페라아제를 들 수 있다.
한편 본 개시에 있어서는, 제1 부분 및 제2 부분이 유래하는 단백질을, 「제1 부분 및 제2 부분을 제공하는 단백질」이라고 칭하는 경우가 있다.
본 개시에 있어서, 제1 부분 및/또는 제2 부분의 아미노산 서열은, 제1 부분 및 제2 부분을 제공하는 단백질의 야생형의 아미노산 서열과 동일해도 되고, 상이해도 된다. 예를 들면, 제1 부분이나 제2 부분의 조제나 안정성 등에 적합한 아미노산의 개변(1 또는 복수의 아미노산의 결실, 삽입, 치환 및/또는 부가)이 행해져도 된다.
제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체
본 개시에 있어서의 스크리닝 방법에 있어서는, 후보 분자가 제1 표적 분자 및 제2 표적 분자와 복합체를 형성하는 것이 가능한 분자인 경우, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체가 형성된다. 일 태양에 있어서, 당해 복합체로부터 제1 부분 및 제2 부분을 제거하면, 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체를 취득할 수 있다. 본 개시에 있어서 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체는, 바람직하게는, 제1 표적 분자, 제2 표적 분자, 및 후보 분자로 구성되는 복합체, 또는 제1 표적 분자, 제2 표적 분자, 후보 분자, 및 제3 분자로 구성되는 복합체이다. 또한 일 태양에 있어서, 본 개시에 있어서의 복합체는, 상기 3자 또는 4자를 포함하는 한, 다른 분자를 포함하는 4자, 5자, 또는 6자 이상의 복합체여도 되지만, 바람직하게는 3자 복합체이다.
본 개시에 있어서의 복합체는, 제1 표적 분자, 제2 표적 분자, 및 후보 분자가 복합체를 형성하고 있는 한, 그 태양은 따지지 않는다. 즉 본 개시에 있어서의 복합체에는, 후보 분자가 제1 표적 분자와 제2 표적 분자의 양방에 결합하는 것에 의해 복합체를 형성하는 태양이 포함된다. 이와 같은 태양에는, 후보 분자를 개재시켜 제1 표적 분자 및 제2 표적 분자가 결합하고 있는 것이나, 후보 분자, 제1 표적 분자 및 제2 표적 분자 모두가, 다른 2자의 양방과 결합하고 있는 것이 포함된다. 또한 일 태양에 있어서, 본 개시에 있어서의 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체에는, 후보 분자가 제1(또는 제2) 표적 분자와 결합하고, 제1(또는 제2) 표적 분자가 제2(또는 제1) 표적 분자와 결합하는 것에 의해 3자의 복합체가 형성되는 태양도 또한 포함된다. 이와 같은 태양에 있어서는, 후보 분자는 제2(또는 제1) 표적 분자와는 직접적으로는 결합하고 있지 않다. 또한, 일 태양에 있어서, 후보 분자가 제1(또는 제2) 표적 분자와 결합함으로써, 제1(또는 제2) 표적 분자의 구조가 변화되고, 제1(또는 제2) 표적 분자와 제2(또는 제1) 표적 분자의 결합 친화성이 향상되는 것에 의해 3자의 복합체의 형성이 촉진되는 태양도 또한 포함된다. 이와 같은 태양에 있어서는, 후보 분자는 제2(또는 제1) 표적 분자와는 직접적으로는 결합하고 있지 않다.
한편 전술한 대로, 본 개시에 있어서의 제1 부분 및 제2 부분은 단백질(구체적으로는, 제1 부분 및 제2 부분을 제공하는 단백질)의 단편이다. 따라서, 본 개시에 있어서의 「제1 부분에 연결된 제1 표적 분자 및 제2 부분에 연결된 제2 표적 분자를 포함하는 복합체」는, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질의 전부 또는 일부를 포함한다. 구체적으로는, 예를 들면 제1 부분 및 제2 부분을 제공하는 단백질이 후술하는 GFP나 루시페라아제인 경우의 일 태양에 있어서, 당해 복합체는 GFP나 루시페라아제의 일부를 포함한다. 한편, 예를 들면 제1 부분 및 제2 부분을 제공하는 단백질이 SNAP 태그 또는 유비퀴틴인 경우의 일 태양에 있어서, 당해 복합체는, SNAP 태그 또는 유비퀴틴의 전부를 포함한다.
제1 부분에 연결된 제1 표적· 제2 부분에 연결된 제2 표적
본 개시에 있어서, 제1 부분과 제1 표적 분자, 제2 부분과 제2 표적 분자는 링커를 개재시켜 연결되어 있어도 된다. 본 개시에 있어서는, 제1 부분과 제1 표적 분자 사이의 링커를 제1 링커, 제2 부분과 제2 표적 분자 사이의 링커를 제2 링커라고 부를 수 있다. 링커로서는, 유전자 공학에 의해 도입할 수 있는 임의의 펩타이드 링커, 또는 화학 합성에 의해 도입할 수 있는 링커(예를 들면, Protein Engineering, 9(3), 299-305, 1996 참조) 등을 이용할 수 있지만, 본 발명에 있어서는 펩타이드 링커가 바람직하다. 펩타이드 링커의 길이는 특별히 한정되지 않고, 목적에 따라서 당업자가 적절히 선택하는 것이 가능하지만, 바람직한 길이는 8 아미노산 이상(상한은 특별히 한정되지 않지만, 통상, 30 아미노산 이하, 바람직하게는 20 아미노산 이하)이고, 특히 바람직하게는 12 아미노산이다.
예를 들면, 펩타이드 링커의 경우:
Ser
Gly·Ser
Gly·Gly·Ser
Ser·Gly·Gly
Gly·Gly·Ser·Ser(서열 번호: 88)
Gly·Gly·Gly·Ser(서열 번호: 89)
Ser·Gly·Gly·Gly(서열 번호: 90)
Gly·Ser·Gly·Ser(서열 번호: 91)
Gly·Gly·Gly·Gly·Ser(서열 번호: 92)
Ser·Gly·Gly·Gly·Gly(서열 번호: 93)
Gly·Gly·Gly·Gly·Gly·Ser(서열 번호: 94)
Ser·Gly·Gly·Gly·Gly·Gly(서열 번호: 95)
Gly·Gly·Gly·Gly·Gly·Gly·Ser(서열 번호: 96)
Ser·Gly·Gly·Gly·Gly·Gly·Gly(서열 번호: 97)
(Gly·Gly·Gly·Gly·Ser)n
(Ser·Gly·Gly·Gly·Gly)n
Gly·Gly·Gly·Gly·Ser·Gly·Gly·Gly·Ser Gly·Gly·Ser(서열 번호: 124)
[n은 1 이상의 정수이다] 등을 들 수 있다. 단, 펩타이드 링커의 길이나 서열은 목적에 따라서 당업자가 적절히 선택할 수 있다.
또한 일 태양에 있어서, 후술하는 바와 같이 본 개시에 있어서의 링커는, 효소에 의해 절단 가능한 링커를 포함할 수 있다. 이와 같은 효소로서는, TEV 프로테아제(Tobacco Etch Virus Protease)가 예시되고, 본 개시에 있어서는, 안정성, 활성, 특이성 등을 향상시키기 위한 개량이 가해진 TEV 프로테아제를 이용해도 된다. 이와 같은 TEV 프로테아제는 시약 회사로부터 구입 가능하다. TEV 프로테아제에 의해 절단되는 링커로서는, 이하가 예시된다:
Glu·Asn·Leu·Tyr·Phe·Gln·Gly(서열 번호: 2).
피험 분자·라이브러리
본 개시에 있어서의 피험 분자로서는, 특별히 제한은 없고, 예를 들면, 천연물, 유기 화합물, 무기 화합물, 단백질, 펩타이드, 아미노산 등의 단일 화합물, 및, 화합물 라이브러리, 유전자 라이브러리의 발현 산물, 세포 추출물, 세포 배양 상청, 발효 미생물 산생물, 해양 생물 추출물, 식물 추출물, 원핵 세포 추출물, 진핵 단세포 추출물 혹은 동물 세포 추출물 등을 들 수 있다. 이들은 정제물이어도, 또한 식물, 동물 또는 미생물 등의 추출물 등과 같이 조(粗)정제물이어도 된다. 또한 피험 분자의 제조 방법도 특별히 제한되지 않고, 천연물로부터 단리된 것이어도, 화학적 또는 생화학적으로 합성된 것이어도, 또한 유전자 공학적으로 조제된 것이어도 된다.
일 태양에 있어서, 본 개시에 있어서의 피험 분자는 폴리뉴클레오타이드에 의해 코드되어 있는 분자일 수 있다. 이와 같은 분자로서 펩타이드를 들 수 있다. 또한 본 개시에 있어서의 피험 분자는, 태그가 되는 폴리뉴클레오타이드에 연결된 펩타이드여도 된다. 또한 본 개시에 있어서의 피험 분자는, 분자량이 3000 이하, 또는 2000 이하여도 된다. 한편 여기에서의 분자량은, 피험 분자가 태그로서의 폴리뉴클레오타이드나, 그것과 연결하기 위한 링커를 포함하는 경우, 폴리뉴클레오타이드나 링커를 제외한 부분의 분자량을 가리킨다.
본 개시에 있어서 펩타이드란, 2 이상의 아미노산이 아마이드 결합 및/또는 에스터 결합으로 결합한 것을 말한다. 한정을 의도하지 않지만, 본 개시에 있어서의 펩타이드에는, 쇄상 펩타이드, 및 환상 펩타이드가 포함된다. 또한, 본 개시에 있어서의 펩타이드에는, 펩타이드, 펩타이드와 폴리뉴클레오타이드의 복합체(펩타이드-폴리뉴클레오타이드 복합체), 펩타이드와 리보솜과 폴리뉴클레오타이드의 복합체 등이 포함된다. 또한, 본 개시에 있어서의 「폴리뉴클레오타이드」에는 DNA, mRNA, 및 tRNA가 포함된다. 또한, 본 개시에 있어서의 「펩타이드」에는, 그의 약학적으로 허용되는 염이 포함되어도 된다.
본 개시에 있어서의 펩타이드는, 일 태양에 있어서, 2∼100개, 3∼50개, 4∼30개, 또는 5∼20개의 아미노산이, 아마이드 결합 및/또는 에스터 결합에 의해 연결되어 있다. 예를 들면, 일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법에 의해 얻어지는 펩타이드를 의약품으로서 사용하는 경우, 높은 막투과성을 획득하기 위해서, 펩타이드를 구성하는 아미노산의 수는 20 이하가 바람직하고, 18 이하, 16 이하, 15 이하, 또는 14 이하가 보다 바람직하고, 13 이하가 특히 바람직하며, 구체적으로는, 9, 10, 11, 12, 13이 예시된다. 또한 높은 대사 안정성을 획득하기 위해서는, 펩타이드를 구성하는 아미노산의 수는 8 이상인 것이 바람직하고, 9 이상이 보다 바람직하고, 10 이상이 더 바람직하며, 11 이상이 특히 바람직하다. 막투과성과 대사 안정성의 양립을 고려하면, 펩타이드를 구성하는 아미노산의 수는 5∼20, 또는 7∼20이 바람직하고, 7∼17, 8∼16, 9∼16, 또는 10∼16이 보다 바람직하고, 8∼13, 10∼15, 11∼15, 10∼14, 10∼13, 또는 11∼14가 더 바람직하며, 11∼13이 특히 바람직하다.
환상 펩타이드의 환상부를 구성하는 아미노산의 수는 한정되지 않지만, 예를 들면, 4 이상, 6 이상, 7 이상, 8 이상, 9 이상, 10 이상, 11 이상, 12 이상의 어느 것과, 20 이하, 18 이하, 16 이하, 15 이하, 14 이하, 13 이하, 12 이하, 11 이하의 어느 것의 조합에 의해 특정 가능한 범위를 들 수 있다. 막투과성과 대사 안정성의 양립을 고려하면, 상기 환상부를 구성하는 아미노산의 수는, 5∼16이 바람직하고, 5∼15, 5∼14, 7∼14, 또는 8∼14가 보다 바람직하고, 8∼13, 9∼13, 8∼12, 8∼11, 또는 9∼12가 더 바람직하며, 9∼11이 특히 바람직하다. 일 태양에 있어서, 환상 펩타이드의 환상부를 구성하는 아미노산의 수로서, 예를 들면, 7, 8, 9, 10, 11, 12, 13, 14, 15, 및 16을 들 수 있다. 한편, 본 개시에 있어서 펩타이드의 「환상부」란, 4 이상의 아미노산 잔기가 연결되어, 형성되어 있는 환상의 부분을 의미한다.
비한정된 일 태양에 있어서, 본 개시에 있어서의 환상 펩타이드는 직쇄부를 갖고 있어도 된다. 본 개시에 있어서, 환상 펩타이드의 부분 구조를 가리킬 때에 사용되는 「직쇄부」란, 환상부의 주쇄 구조에 포함되지 않는 부분이고, 해당 부분의 쇄 상에 적어도 1개의 아마이드 결합 및/또는 에스터 결합을 갖는 것을 말한다. 직쇄부의 아미노산의 수(유닛의 수)는 0∼8인 것이 바람직하고, 0∼5가 보다 바람직하며, 0∼3이 보다 바람직하다. 한편, 비한정된 일 태양에 있어서, 본 개시에 있어서의 직쇄부에는 천연 아미노산이나 비천연 아미노산(화학 수식이나 골격 변환된 아미노산을 포함한다)이 포함되는 경우가 있다.
비한정된 일 태양에 있어서, 본 개시에 있어서의 펩타이드에 포함되는 비천연 아미노산의 수는, 2 이상이 바람직하고, 4 이상, 또는 5 이상이 보다 바람직하고, 6 이상이 더 바람직하며, 또한 20 이하, 15 이하, 14 이하, 13 이하, 12 이하, 10 이하가 바람직하게 예시된다. 본 개시에 있어서의 펩타이드에 포함되는 비천연 아미노산의 수로서는, 환상부를 구성하는 아미노산의 수의 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상이 예시된다. 또한, 본 개시에 있어서의 펩타이드에 포함되는 비천연 아미노산의 종류는, 1 이상이 바람직하고, 2 이상, 3 이상, 또는 4 이상이 보다 바람직하고, 7 이상이 더 바람직하며, 또한 20 이하, 15 이하, 14 이하, 13 이하, 12 이하, 10 이하가 바람직하게 예시된다.
한편 본 개시에 있어서의 피험 분자는, 본 개시에 있어서의 제1 표적 분자 및 제2 표적 분자의 어느 일방에 결합하는 것이 이미 알려져 있는 것이어도 된다. 또한 본 개시에 있어서의 피험 분자는, 공지된 스크리닝계에 있어서 선택된 분자여도 된다. 따라서 본 개시에 있어서의 스크리닝 방법은, 공정(1) 전에 공지된 스크리닝계를 사용하여 피험 분자를 취득하는 공정을 추가로 포함할 수 있다. 본 개시에 있어서의 스크리닝 방법에 있어서는, 이와 같이 해서 취득된 피험 분자(예를 들면, 제1 표적 분자 및 제2 표적 분자의 어느 일방에 결합하는 것이 이미 알려져 있는 분자 등)를 공정(1)에 있어서의 피험 분자로서 사용할 수 있다.
본 개시에 있어서의 피험 분자는 라이브러리를 구성할 수 있다. 본 개시에 있어서의 라이브러리에는, 핵산(「폴리뉴클레오타이드」라고도 한다)에 의해 태그 붙이기(즉, 인코드)된 라이브러리(예를 들면, DNA 인코드 라이브러리; DNA-encoded library/DEL, mRNA 디스플레이 라이브러리, DNA 디스플레이 라이브러리; 예를 들면 Molecules. 2019 Apr; 24(8): 1629.를 참조.), 태그 없는 화합물 라이브러리가 포함된다. 또한 본 개시에 있어서의 라이브러리로서는, 디스플레이 라이브러리가 바람직하다. 디스플레이 라이브러리로서는, 디스플레이를 이용한 라이브러리가 예시되고, 그 중에서도 mRNA 디스플레이 라이브러리, DNA 디스플레이 라이브러리, 리보솜 디스플레이 라이브러리가 바람직하고, mRNA 디스플레이 라이브러리가 보다 바람직하다.
핵산에 의해 태그 붙이기(인코드)된 라이브러리는, 라이브러리를 구성하는 각 화합물이 바코드가 되는 특이적인 폴리뉴클레오타이드에 의해 태그 붙이기된 라이브러리이다. 이 라이브러리를 사용하여, 표적 분자에 특이적으로 결합할 수 있는 후보 분자를 스크리닝할 수 있다. 예를 들면, 원하는 표적에 라이브러리를 접촉시키고, 표적에 결합하지 않는 분자를 씻어 보냄으로써, 표적에 결합하는 후보 분자의 농축이 가능하다(패닝법). 이와 같은 과정을 거쳐 선택된 후보 분자에 대응되어 있는 태그를 해석함으로써 표적에 결합한 후보 분자를 분명히 할 수 있다(예를 들면 WO2013/100132를 참조).
피험 분자로서 펩타이드가 이용되는 경우, 표현형인 펩타이드와 그 유전자형인 펩타이드를 코드하는 RNA 혹은 DNA가 대응된다. 예를 들면, 아미노아실 tRNA의 아날로그인 항생 물질 퓨로마이신이 리보솜에 의한 mRNA 번역 신장 중의 단백질에 비특이적으로 연결되는 것을 이용하는 방법이 mRNA 디스플레이(Proc Natl Acad Sci USA. 1997;94:12297-302. RNA-peptide fusions for the in vitro selection of peptides and proteins. Roberts RW, Szostak JW.) 내지는 in vitro virus(FEBS Lett. 1997;414:405-8. In vitro virus: bonding of mRNA bearing puromycin at the 3'-terminal end to the C-terminal end of its encoded protein on the ribosome in vitro. Nemoto N, Miyamoto-Sato E, Husimi Y, Yanagawa H.)로서 보고되어 있다.
T7 프로모터 등의 프로모터를 포함하는 DNA 라이브러리로부터 전사로 얻은 mRNA의 라이브러리의 3' 말단에 퓨로마이신 등의 스페이서를 결합해 두고, 무세포 번역계에서 mRNA를 단백질로 번역시키면 퓨로마이신이 리보솜에 의해 아미노산과 뒤바뀌어 단백질에 도입되고, mRNA와 이것에 코드되는 단백질이 연결되어, mRNA와 그 산물이 대응된 라이브러리가 된다. 이 과정에서는 대장균 등의 형질 전환을 포함하지 않기 때문에 높은 효율이 실현되고, 대규모인 디스플레이 라이브러리를 구축할 수 있다. 패닝으로 농축, 선택된 분자에 붙어 있는 유전자 정보를 포함하는 태그인 mRNA로부터 cDNA를 합성하고, PCR 증폭하고, 염기 서열을 해석함으로써 결합한 펩타이드의 서열을 분명히 할 수 있다.
무세포 번역계를 이용한 디스플레이 라이브러리에는, mRNA 디스플레이 외에, 펩타이드와 퓨로마이신의 복합체가 결합하고 있는 펩타이드를 코드하는 cDNA로 이루어지는 라이브러리인 cDNA 디스플레이(Nucleic Acids Res. 2009;37(16) :e108.cDNA display: a novel screening method for functional disulfide-rich peptides by solid-phase synthesis and stabilization of mRNA-protein fusions. Yamaguchi J, Naimuddin M, Biyani M, Sasaki T, Machida M, Kubo T, Funatsu T, Husimi Y, Nemoto N.), mRNA 번역 중에 리보솜과 번역 산물이 비교적 안정된 복합체인 것을 이용한 리보솜 디스플레이(Proc Natl Acad Sci U S A. 1994;91:9022-6. An in vitro polysome display system for identifying ligands from very large peptide libraries. Mattheakis LC, Bhatt RR, Dower WJ.), bacteriophage endonuclease P2A가 DNA와 공유 결합을 형성하는 것을 이용한 covalent display(Nucleic AcidsRes. 2005;33:e10.Covalent antibody display--an in vitro antibody-DNA library selection system. Reiersen H, Lobersli I, Loset GA, Hvattum E, Simonsen B, Stacy JE, McGregor D, Fitzgerald K, Welschof M, Brekke OH, Marvik OJ.), 미생물의 플라스미드의 복제 개시 단백 RepA가 복제 개시점 ori에 결합하는 것을 이용한 CIS display(Proc Natl Acad Sci U S A. 2004;101:2806-10. CIS display: In vitro selection of peptides from libraries of protein-DNA complexes. Odegrip R, Coomber D, Eldridge B, Hederer R, Kuhlman PA, Ullman C, FitzGerald K, McGregor D.)가 알려져 있다. 또한, DNA 라이브러리를 구성하는 DNA의 1분자마다에 전사 번역계를 water-in-oil 에멀션이나 리포솜에 봉입하고, 번역 반응을 행하는 in vitro compartmentalization(Nat Biotechnol. 1998;16:652-6. Man-made cell-like compartments for molecular evolution. Tawfik DS, Griffiths AD.)도 알려져 있다. 적절히 공지된 방법을 이용하여 상기 방법을 사용할 수 있다.
태그 없는 화합물 라이브러리로서는, 핵산 라이브러리, 핵산 라이브러리를 번역하여 얻어지는 펩타이드 라이브러리, 화학 합성에 의해 얻어지는 화합물의 라이브러리 등을 예시할 수 있다. 여기에서의 「핵산」에는, 데옥시리보핵산(DNA), 리보핵산(RNA), 혹은 인공 염기를 갖는 뉴클레오타이드 유도체를 포함할 수도 있다. 또한, 펩타이드 핵산(PNA)을 포함할 수도 있다. 본 개시에 있어서 핵산은, 목적으로 하는 유전 정보가 유지되는 한, 이들 핵산 중 어느 하나, 혹은 혼성으로 할 수도 있다. 즉, DNA-RNA의 하이브리드 뉴클레오타이드나 DNA와 RNA와 같은 상이한 핵산이 1본쇄에 연결된 키메라 핵산도 본 개시에 있어서의 핵산에 포함된다.
펩타이드 라이브러리에 포함되는 펩타이드의 주형이 되는 핵산의 라이브러리로서는, mRNA 라이브러리, DNA 라이브러리 등이 예시된다. 펩타이드 서열 상에서 아미노산 잔기를 고정하지 않는 개소는 염기를 섞어 합성하는 것에 의해, 핵산 라이브러리를 얻을 수 있다. 예를 들면, DNA 라이브러리로서는, A, T, G, C, RNA 라이브러리로서는, A, U, G, C의 각각 4염기의 혼합(N)의 3의 배수개의 반복, 혹은 코돈의 1문자째 2문자째는 N, 3문자째는 W, M, K, S 등의 2염기의 혼합으로서 합성하고, 추가로 도입하는 아미노산의 종류를 16 이하로 억제하는 것이면, 3문자째를 1종류의 염기로 하는 방법도 있다. 또한, 코돈의 3문자에 상당하는 코돈 유닛을 준비하고, 이것을 임의의 비율로 혼합하여 합성에 이용하는 것에 의해 아미노산 잔기의 출현 빈도를 자유롭게 조정할 수 있다.
무세포 번역계를 이용하여 이들 핵산 라이브러리를 번역할 수 있다. 무세포 번역계를 사용하는 경우, 목적하는 핵산의 하류에 스페이서를 코드하는 서열을 포함하는 것이 바람직하다. 스페이서 서열로서는, 글라이신이나 세린을 포함하는 서열을 들 수 있지만 이것으로 한정되지 않는다. 또한 퓨로마이신, 그의 유도체 등 리보솜에 의한 번역 시에 펩타이드에 도입되는 화합물과 핵산 라이브러리 사이에는, RNA, DNA, 헥사에틸렌 글라이콜(spc18)의 폴리머(예를 들면 5개의 폴리머) 등으로 형성되는 링커를 포함하는 것이 바람직하다.
본 명세서에 있어서, 라이브러리에 포함되는 피험 분자의 배리에이션(종류)의 수를 「다양성」이라고 한다. 본 개시에 있어서의 라이브러리에 포함되는 후보 분자의 다양성은 특별히 한정되지 않지만, 1×103 이상, 1×104 이상, 1×105 이상, 1×106 이상, 1×107 이상, 1×108 이상, 1×109 이상, 1×1010 이상, 1×1011 이상, 및 1×1012 이상이 예시된다. 이들 다양성은, 실측치로 한정되는 것은 아니고, 이론치여도 된다.
후보 분자
본 개시에 있어서의 후보 분자는, 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성하는 것이 가능한 분자이다. 해당 복합체는, 제1 표적 분자, 제2 표적 분자 및 후보 분자를 포함하는 한, 다른 분자를 포함하고 있어도 되고, 3자 복합체, 4자 복합체, 5자 복합체, 또는 그 이상의 분자로 구성되는 복합체여도 되지만, 3자 복합체가 바람직하다.
본 개시에 있어서의 후보 분자는, 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성하는 것이 가능한 한 한정되는 것은 아니지만, 바람직하게는 펩타이드, 보다 바람직하게는 환상 펩타이드가 예시된다.
일 태양에 있어서 본 개시에 있어서의 후보 분자는, 그것 단독으로 제1 표적 분자에 대한 결합 활성 및 제2 표적 분자에 대한 결합 활성을 갖는 분자일 수 있다. 또한 일 태양에 있어서 본 개시에 있어서의 후보 분자는, 제1 표적 분자 및 제2 표적 분자에 동시에 결합할 수 있는 분자일 수 있다. 또한 본 개시에 있어서의 후보 분자에는, 이와 같은 분자에 더하여, 그것 단독으로는 제2(또는 제1) 표적 분자에 대한 결합 활성을 갖지 않지만, 제1(또는 제2) 표적 분자에 결합하는 것에 의해 해당 제2(또는 해당 제1) 표적 분자에 대한 결합 활성을 획득하고, 그에 의해 제1 표적 분자 및 제2 표적 분자에 결합할 수 있는 분자도 포함될 수 있다. 이와 같은 분자로서 예를 들면, 그것 단독일 때보다도 제1(또는 제2) 표적 분자에 결합했을 때인 쪽이, 제2(또는 제1) 표적 분자에 대해서 2배 이상, 5배 이상, 10배 이상, 20배 이상, 또는 그 이상의 결합 친화성을 갖는 분자가 포함된다. 또 본 개시에 있어서는,
(i) 제1(또는 제2) 표적 분자와 결합 가능한 후보 분자이고, 해당 결합에 기인하여, 해당 후보 분자의 제2(또는 제1) 표적 분자에 대한 결합 활성이, 해당 결합 전보다도 높아지는 분자,
(ii) 제1(또는 제2) 표적 분자와 결합 가능한 후보 분자이고, 해당 결합에 기인하여, 해당 후보 분자와 해당 제1(또는 해당 제2) 표적 분자의 복합체로서 해당 제2(또는 해당 제1) 표적 분자와 결합 가능해지는 분자, 및
(iii) 제1(또는 제2) 표적 분자와 결합 가능한 후보 분자이고, 해당 결합에 기인하여, 해당 제1(또는 해당 제2) 표적 분자의 제2 표적 분자에 대한 결합 친화성이, 해당 결합 전보다도 높아지는 분자
도 또한 후보 분자에 포함될 수 있다.
이와 같은 후보 분자로서 예를 들면, 제1(또는 제2) 표적 분자와 결합하는 것에 의해 제1(또는 제2) 표적 분자의 구조를 변화시키고, 그에 의해 제1(또는 제2) 표적 분자의 제2(또는 제1) 표적 분자에 대한 결합 친화성이 높아지고, 그 결과, 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체의 형성을 유도하는 것이 가능한 분자가 포함될 수 있다.
본 개시에 있어서의 「제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체」에 있어서는, 후보 분자는 제1 표적 분자에만 결합해도 되고, 제2 표적 분자에만 결합해도 되고, 제1 표적 분자와 제2 표적 분자의 양방에 결합해도 된다.
비한정된 일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법에 의해 얻어지는 후보 분자는, 공지된 방법에 의해 화학 수식 등 함으로써 최적화해도 된다. 또한 후보 분자의 유도체를 화학 합성해도 된다. 본 개시에 있어서 「최적화」란, 보다 드럭라이크한 분자가 되도록 화학 수식하는, 보다 약효 표적에 강한 활성을 갖는 분자가 되도록 화학 수식하고, 및/또는, 보다 독성이 회피된 분자가 되도록 화학 수식하는 것을 의미한다. 예를 들면 후보 분자가 펩타이드인 경우, 펩타이드 중의 각각의 아미노산의 구조를 변환시키는 것에 의해 「최적화」할 수 있다. 본 개시에 있어서는, 이와 같이 최적화된 후보 분자 또는 후보 분자의 유도체의 평가를 위해서, 이들을 본 개시에 있어서의 스크리닝 방법에 제공해도 된다.
표적 분자
본 개시에 있어서 제1 표적 분자 및 제2 표적 분자는 특별히 한정되지 않고, 단백질, 펩타이드, 핵산, 당, 지질 등이 예시되지만, 그 중에서도 단백질을 표적 분자로 하는 것이 바람직하다. 또한 생체내에 있어서의 표적 분자의 존재 장소도 특별히 한정되지 않는다. 일 태양에 있어서, 세포내의 단백질을 표적 분자로 할 수도 있다. 또한 일 태양으로서, 지금까지 창약이 곤란하다고 여겨져 온 tough target에 대한 창약을 가능하게 할 수 있는 단백질을 표적 분자로 할 수 있다.
일 태양에 있어서, 제1 표적 분자로서 이뮤노필린 패밀리에 속하는 단백질, 유비퀴틴 E3 리가아제 등이 예시된다. 이뮤노필린 패밀리에 속하는 단백질로서는, FKBP(FK506 binding protein/FK506 결합 단백질), 사이클로필린 등을 들 수 있다. 또한 제2 표적 분자도 특별히 한정되는 것은 아니지만, 제1 표적 분자로서 예를 들면 이뮤노필린 패밀리에 속하는 단백질을 사용하는 경우, 칼시뉴린, FRB(FKBP-rapamycin binding domain of FKBP12-rapamycin associated protein/FKBP-라파마이신 결합 단백질의 FKBP-라파마이신 결합 도메인), 또는 이것을 포함하는 단백질을 예시할 수 있다.
다른 일 태양에 있어서, 제1 표적 분자로서 Kras, Nras, Hras 등의 Ras 단백질을 예시할 수 있다. 이 경우, 일 태양에 있어서, 제2 표적 분자로서 FKBP를 예시할 수 있다.
일 태양에 있어서, 표적 분자는 고상 담체에 고정되어 있어도 된다. 예를 들면, 공정(4) 및 (5)에 있어서, 한쪽의 표적 분자를 고상 담체에 고정하고, 다른 한쪽의 표적 분자를 유리 상태로 할 수 있다. 고상 담체로서는, 표적 분자를 고정할 수 있는 담체이면 특별히 한정되지 않고, 본 분야에서 통상 사용되는 것을 사용할 수 있다. 예를 들면, 비즈(예를 들면, 자기 비즈, 유리 비즈), 멤브레인, 마이크로플레이트, 실리콘 칩 등이 예시된다. 표적 분자는, 이들 고상 담체에 공지된 방법으로 고정할 수 있다.
어피니티를 사용한 방법
본 개시에 있어서의 스크리닝 방법에 있어서는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체를, 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여 회수할 수 있다. 어피니티를 이용한 방법으로서는 풀다운법을 예시할 수 있다. 풀다운법은, 단백질 또는 단백질의 복합체에 태그를 붙이고, 해당 태그와, 해당 태그와 상호작용하는 단백질의 상호작용을 이용하여, 해당 단백질 또는 단백질의 복합체를 검출하는 방법이다. 풀다운법의 일례로서, 제3 분자에 태그를 붙이고, 해당 태그와 상호작용하는 단백질 사이의 상호작용을 이용하는 것에 의해, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 후보 분자, 및 제3 분자를 포함하는 복합체를 선택할 수 있다. 일 태양에 있어서, 제3 분자와 태그는, 전술한 본 개시의 링커를 개재시켜 연결되어 있어도 된다. 또한, 일 태양에 있어서, 태그 자체를 제3 분자로서 이용할 수도 있다. 이 경우, 근접 또는 회합한 제1 부분과 제2 부분의 어느 하나 또는 양방에 태그 붙이기하고, 해당 태그와 상호작용하는 단백질 사이의 상호작용을 이용하는 것에 의해, 상기 복합체를 선택할 수도 있다. 전술한 대로 본 개시의 스크리닝 방법에 있어서는, 제3 분자는, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체와 특이적으로 반응 또는 결합할 수 있으므로, 당해 제3 분자와의 어피니티를 이용하는 것에 의해, 제1 표적 분자 및 제2 표적 분자와 결합한 후보 분자를 효율적으로 취득할 수 있다.
본 개시에 있어서 태그로서 이용 가능한 단백질과, 당해 태그와 상호작용하는 단백질의 조합으로서는, 비오틴 또는 그 유도체와 비오틴 결합 단백질(예를 들면 스트렙트아비딘)의 조합, Strep-tag(등록상표)와 Strep-Tactin(등록상표)의 조합, SBP(Streptavidin binding peptide)-tag와 스트렙트아비딘의 조합, 공지된 펩타이드 태그(His-tag, HA-tag, FLAG-tag 등)와 그에 대한 항체의 조합 등을 예시할 수 있다.
또한 본 개시에 있어서는, 항원과 항체 사이의 어피니티를 이용하여, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체를 회수할 수도 있다. 구체적으로는, 근접 또는 회합한 제1 부분 및 제2 부분을 포함하는 복합체를 특이적으로 인식하는 항체를 사용하여, 제1 부분에 연결된 제1 표적 분자, 제2 부분에 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체를 회수할 수 있다.
일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법에 있어서는, 용출에 의해, 후보 분자, 또는 후보 분자를 포함하는 복합체를 단리할 수 있다. 일 태양에 있어서, 용출은, 효소 반응 또는 열 반응에 의해 행할 수 있다. 추가적인 태양에 있어서, 용출은, 제3 분자에 포함되는 링커를 절단하는 것에 의해 행해도 된다. 추가적인 태양에 있어서, 용출은, 제1 부분과 제1 표적 분자 사이에 위치하는 제1 링커, 및/또는, 단백질의 제2 부분과 제2 표적 분자 사이에 위치하는 제2 링커를 절단하는 것에 의해 행해도 된다. 그 경우, 제3 분자에 포함되는 링커, 또는, 제1 링커 및/혹은 제2 링커는, 예를 들면 효소 반응에 의해 절단할 수 있다. 따라서 본 개시에 있어서의 제3 분자에 포함되는 링커, 또는, 제1 링커 및/혹은 제2 링커는, 효소에 의해 절단 가능한 서열을 포함할 수 있다. 효소와 효소에 의해 절단 가능한 서열의 조합으로서는, TEV 프로테아제와 ENLYFQG(서열 번호: 2) 등을 들 수 있다. 제1 부분과 제1 표적 분자 사이에 위치하는 제1 링커, 및/또는, 단백질의 제2 부분과 제2 표적 분자 사이에 위치하는 제2 링커를 절단하는 용출 방법에 의하면, 제1 부분, 제2 부분, 또는 제3 분자 등에 결합한 목적으로 하지 않는 피험 분자의 회수율을 더 억제할 수 있는 점에서 유용하다.
제1 부분, 제2 부분, 및 제3 분자의 구체적인 태양
본 개시에 있어서의 스크리닝 방법에 있어서는, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질로서, GFP, 루시페라아제, SNAP 태그, 유비퀴틴 등을 예시할 수 있고, 본 명세서에 있어서의 이들 용어에는, 각각의 아미노산 개변체가 포함된다. 상기 단백질로서, GFP(Cabantous, S. et al. Sci Rep. 2013; 3: 2854. doi: 10.1038/srep02854, Wen-Xue J. et al. Sci Rep. 2016; 6: 20568. doi: 10.1038/srep20568을 예시로서 참조할 것.), SNAP 태그(Analyst, 2012, 137, 4760-4765; Anal. Chem. 2016, 88, 8166-8171을 예시로서 참조할 것.), 유비퀴틴(PNAS July 3, 2007 104 (27) 11209-11214를 예시로서 참조할 것.), 및 루시페라아제(예를 들면, 심해 새우(Oplophorus gracilirostris) 유래의 루시페라아제, 그 중에서도 Nanoluc(등록상표)를 들 수 있다. US2010/0281552, US2012/0174242 및 US2018/0172692, 및 Andrew, D. et al. Sci Rep. 2017; 7: 8186. doi:10.1038/s41598-017-07569-y; Anal. Chem. 2018, 90, 3001-3004를 예시로서 참조할 것.)가 예시된다. 각각의 아미노산 서열로서는, GFP(서열 번호: 71), SNAP 태그(서열 번호: 82), 유비퀴틴(서열 번호: 75), Nanoluc(서열 번호: 78) 등을 예시할 수 있고, 이들 아미노산 개변체를 이용해도 된다.
본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질은, 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함할 수 있다;
(a) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열,
(b) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열.
본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질은, 당업자에게 주지된 야생형의 단백질 및 아미노산이 개변된 단백질을 포함한다.
또한 본 개시에 있어서의 제1 부분 및 제2 부분으로서, GFP, SNAP 태그, 유비퀴틴, 또는 루시페라아제(예를 들면 Nanoluc)를 분할하는 것에 의해 얻어지는 부분을 예시할 수 있다. 상기 분할은, 2분할 이상이면 되고, 3분할 또는 4분할이어도 된다. 3분할하는 경우에는, 본 개시에 있어서의 제1 부분 및 제2 부분으로서는, 분할된 단편 중, 분자량이 작은 단편을 사용하는 것이 바람직하고, GFP에 있어서의 GFP10 및 GFP11, Nanoluc에 있어서의 Nanoluc-9 및 Nanoluc-10이 예시된다. 이 경우, 나머지 단편(GFP에 있어서의 GFP1-9, Nanoluc에 있어서의 Nanoluc1-8)을 본 개시에 있어서의 제3 분자에 포함시킬 수 있다.
한편 본 개시에 있어서의 유비퀴틴은, 13번째의 Ile가 Ala로 치환된 유비퀴틴(I13A)인 것이 바람직하다.
구체적으로는, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질이 예를 들면 GFP인 경우, 전장 GFP(서열 번호: 71)의 192번째∼210번째의 아미노산 서열로 이루어지는 부분(서열 번호: 73), 및 상기 전장 GFP의 211번째∼231번째의 아미노산 서열로 이루어지는 부분(서열 번호: 74)을 각각, 제1 부분 및 제2 부분, 또는 제2 부분 및 제1 부분으로서 예시할 수 있다. 한편 GFP에 있어서 192번째∼210번째의 아미노산 서열로 이루어지는 부분은 GFP10, 211번째∼231번째의 아미노산 서열로 이루어지는 부분은 GFP11로서 알려져 있다. 일 태양에 있어서 본 개시에 있어서의 스크리닝 방법에 있어서는, 서열 번호: 73에 기재된 아미노산 서열을 포함하는 GFP10을 이용할 수 있다. 또한 일 태양에 있어서 본 개시에 있어서의 스크리닝 방법에 있어서는, 서열 번호: 74에 기재된 아미노산 서열을 포함하는 GFP11을 사용할 수 있다. 본 명세서에 있어서, GFP의 단편을 split GFP라고 칭하는 경우가 있고, GFP1-9, GFP10, 및 GFP11을 각각 splitGFP1-9, splitGFP10, 및 splitGFP11이라고 칭하는 경우가 있다.
또한, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질이 예를 들면 SNAP 태그인 경우, 전장 SNAP 태그(서열 번호: 82)의 1번째∼91번째의 아미노산 서열로 이루어지는 부분(SNAP 태그의 N 말단측 단편: 서열 번호: 83), 및 전장 SNAP 태그의 92번째∼196번째의 아미노산 서열로 이루어지는 부분(SNAP 태그의 C 말단측 단편: 서열 번호: 84)을 각각, 제1 부분 및 제2 부분, 또는 제2 부분 및 제1 부분으로서 예시할 수 있다. 본 개시에 있어서 전장 SNAP 태그의 1번째∼91번째의 아미노산 서열로 이루어지는 부분은 SNAP(N), 92번째∼196번째의 아미노산 서열로 이루어지는 부분은 SNAP(C)라고도 칭해진다. 일 태양에 있어서 본 개시에 있어서의 스크리닝 방법에 있어서는, 서열 번호: 83에 기재된 아미노산 서열을 포함하는 SNAP(N)을 이용할 수 있다. 또한 일 태양에 있어서 본 개시에 있어서의 스크리닝 방법에 있어서는, 서열 번호: 84에 기재된 아미노산 서열을 포함하는 SNAP(C)를 사용할 수 있다. 본 명세서에 있어서, SNAP 태그 단편을 split SNAP라고 칭하는 경우가 있다.
또한, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질이 예를 들면 유비퀴틴(I13A)인 경우, 전장 유비퀴틴(서열 번호: 75)의 1번째∼37번째의 아미노산 서열로 이루어지는 부분(유비퀴틴의 N 말단측 단편, 서열 번호: 76), 및 전장 유비퀴틴의 35번째∼76번째의 아미노산 서열로 이루어지는 부분(유비퀴틴의 C 말단측 단편, 서열 번호: 77)을 각각, 제1 부분 및 제2 부분, 또는 제2 부분 및 제1 부분으로서 예시할 수 있다. 본 개시에 있어서 전장 유비퀴틴의 1번째∼37번째의 아미노산 서열로 이루어지는 부분은 splitUb(N), 35번째∼76번째의 아미노산 서열로 이루어지는 부분은 splitUb(C)라고도 칭해진다. 일 태양에 있어서 본 개시에 있어서의 스크리닝 방법에 있어서는, 서열 번호: 76에 기재된 아미노산 서열을 포함하는 splitUb(N)을 이용할 수 있다. 또한 일 태양에 있어서 본 개시에 있어서의 스크리닝 방법에 있어서는, 서열 번호: 77에 기재된 아미노산 서열을 포함하는 splitUb(C)를 사용할 수 있다.
한편 본 개시에 있어서는, splitUb(N)과 splitUb(C)를 링커(GSGS/서열 번호: 90)로 연결시킨 단백질을 splitUb(N-C)라고 부르는 경우가 있다. 본 개시에 있어서의 유비퀴틴에는 이와 같은 splitUb(N-C)도 포함된다.
본 명세서에 있어서, 유비퀴틴의 단편을 split 유비퀴틴 또는 splitUb라고 칭하는 경우가 있다.
또한, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질이 예를 들면 루시페라아제의 일종인 Nanoluc인 경우, 전장 Nanoluc(서열 번호: 78)의 153번째∼163번째의 아미노산 서열로 이루어지는 부분(서열 번호: 80), 및 상기 전장 Nanoluc의 164번째∼174번째의 아미노산 서열로 이루어지는 부분(서열 번호: 81)을 각각, 제1 부분 및 제2 부분, 또는 제2 부분 및 제1 부분으로서 예시할 수 있다. 본 개시에 있어서 전장 Nanoluc의 153번째∼163번째의 아미노산 서열로 이루어지는 부분은 split Nanoluc-9, 164번째∼174번째의 아미노산 서열로 이루어지는 부분은 split Nanoluc-10이라고도 칭해진다. 일 태양에 있어서 본 개시에 있어서의 스크리닝 방법에 있어서는, 서열 번호: 80에 기재된 아미노산 서열을 포함하는 split Nanoluc-9를 이용할 수 있다. 또한 일 태양에 있어서 본 개시에 있어서의 스크리닝 방법에 있어서는, 서열 번호: 81에 기재된 아미노산 서열을 포함하는 split Nanoluc-10을 사용할 수 있다. 본 명세서에 있어서, Nanoluc의 단편을 split Nanoluc라고 칭하는 경우가 있고, Nanoluc1-8, Nanoluc-9, 및 Nanoluc-10을 각각, splitNanoluc1-8, splitNanoluc-9, 및 splitNanoluc-10으로 칭하는 경우가 있다.
또한 본 개시에 있어서의 제3 분자로서는, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질이 GFP인 경우, 전장 GFP의 1∼191번째의 아미노산 서열을 갖는 GFP1-9(서열 번호: 72)를 포함하는 분자가 예시되고, 보다 구체적으로는 서열 번호: 48의 아미노산 서열을 갖는 분자가 예시된다. 또한 단백질이 SNAP 태그인 경우, SNAP-비오틴이 예시된다. 또한 단백질이 유비퀴틴(I13A)인 경우, 항유비퀴틴 항체가 예시된다. SNAP-비오틴 및 항유비퀴틴 항체는 당업자에게 주지된 것을 사용할 수 있지만, 전장 유비퀴틴에 결합할 수 있는 한편으로, 그 단편인 split 유비퀴틴에는 결합할 수 없는 항유비퀴틴 항체가 바람직하게 예시된다. 본 개시에 있어서의 항유비퀴틴 항체는, splitUb(N) 또는 splitUb(C)가 근접 또는 회합하고 있지 않는 경우에는 이들을 인식하지 않고, splitUb(N) 및 splitUb(C)가 근접 또는 회합하고 있는 경우에 특이적으로 인식하는 항체인 것이 보다 바람직하다. 항유비퀴틴 항체로서는, Mouse IgG1 모노클로날 항체(클론: FK2, [MBL사]), Mouse IgG1 모노클로날 항체(클론: 1B3, [MBL사])가 예시된다. 또한, 단백질이 Nanoluc인 경우, 전장 Nanoluc의 1∼152번째의 아미노산 서열을 갖는 split Nanoluc1-8(서열 번호: 79)을 포함하는 분자가 예시되고, 보다 구체적으로는 서열 번호: 85의 아미노산 서열을 갖는 분자가 예시된다.
본 개시에 있어서의 스크리닝 방법에 있어서는, 예를 들면 제1 부분 및 제2 부분을 제공하는 단백질이 GFP인 경우, 예를 들면 스트렙트아비딘과 비오틴의 상호작용을 이용하여, 비오틴화된 GFP1-9, GFP10에 연결된 제1 표적 분자, GFP11에 연결된 제2 표적 분자, 및 후보 분자의 복합체를 회수할 수 있다. 또한, 상기 단백질이 Nanoluc인 경우, 예를 들면 스트렙트아비딘과 비오틴의 상호작용을 이용하여, 비오틴화된 splitNanoluc1-8, splitNanoluc-9에 연결된 제1 표적 분자, splitNanoluc-10에 연결된 제2 표적 분자, 및 후보 분자의 복합체를 회수할 수 있다. 또한, SNAP 태그는 기질인 SNAP-비오틴과 결합하면, 효소 반응에 의해 비오틴화된 SNAP 태그가 생성된다. 따라서, 본 개시에 있어서의 단백질로서 SNAP 태그를 사용하는 경우, SNAP 태그에 결합한 비오틴과 스트렙트아비딘의 상호작용을 이용하는 것에 의해, 비오틴화된 SNAP 태그, 제1 표적 분자, 제2 표적 분자, 및 후보 분자의 복합체를 회수할 수 있다. 본 개시에 있어서의 제3 분자는, 비오틴화를 위한 태그 서열(예를 들면, Avi 태그 서열(서열 번호: 1)), 용출을 위한 절단 서열(예를 들면, TEV 프로테아제에 의한 절단 서열), 정제를 위한 태그 서열(예를 들면, His 태그 서열), 및/또는 그 밖의 서열을 포함하고 있어도 된다.
또한 일 태양에 있어서, 본 개시에 있어서의 스크리닝 방법에 있어서는, 제3 분자 그 자체를 사용하여 제1 표적 분자, 제2 표적 분자, 및 후보 분자를 포함하는 복합체를 회수할 수도 있다. 예를 들면 본 개시에 있어서의 단백질로서 유비퀴틴이 이용되는 경우, 제3 분자인 항유비퀴틴 항체와 유비퀴틴 사이의 어피니티에 기초하여, splitUb(N)과 연결된 제1 표적 분자, splitUb(C)와 연결된 제2 표적 분자, 및 후보 분자를 포함하는 복합체를 회수할 수도 있다.
본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 분자에는, 상기 아미노산 서열을 갖는 것에 더하여, 상기 아미노산 서열에 있어서 개변을 갖는 것도 포함된다.
구체적으로는, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질에는, 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열을 포함하는 단백질에 더하여,
(1) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열을 포함하는 단백질이고, 각각 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열을 포함하는 단백질과 기능적으로 동등한 단백질, 및
(2) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질이고, 각각 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열을 포함하는 단백질과 기능적으로 동등한 단백질
이 포함된다.
또한, 본 개시에 있어서의 제1 부분, 및 제2 부분에는, 상기 서열 번호: 73, 74, 76, 77, 80, 81, 83 또는 84로 표시되는 아미노산 서열을 포함하는 단백질에 더하여,
(1) 서열 번호: 73, 74, 76, 77, 80, 81, 83 또는 84로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열을 포함하는 단백질이고, 각각 서열 번호: 73, 74, 76, 77, 80, 81, 83 또는 84로 표시되는 아미노산 서열을 포함하는 단백질과 기능적으로 동등한 단백질, 및
(2) 서열 번호: 73, 74, 76, 77, 80, 81, 83 또는 84로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질이고, 각각 서열 번호: 73, 74, 76, 77, 80, 81, 83 또는 84로 표시되는 아미노산 서열을 포함하는 단백질과 기능적으로 동등한 단백질
이 포함된다.
또한, 본 개시에 있어서의 제3 분자로서는, 상기 서열 번호: 72 또는 79로 표시되는 아미노산 서열을 포함하는 단백질이 예시되지만, 전술한 대로, 풀다운에 이용되는 비오틴화를 위한 Avi 태그 서열, 용출에 이용되는 TEV 프로테아제에 의한 절단 서열, 정제를 위한 His 태그, 및/또는 그 밖의 서열을 포함하고 있어도 된다. 즉, 일 태양에 있어서, 본 개시에 있어서의 제3 분자로서는, 서열 번호: 72 또는 79로 표시되는 아미노산 서열을 포함하고 있기만 하면, 본 개시의 스크리닝법을 실시할 수 있는 한, 이것에 어떠한 서열이 부가되어 있어도 된다. 예를 들면, 본 실시예에서는, GFP1-9로서, Avi 태그(서열 번호: 1), TEV 프로테아제 절단 서열(서열 번호: 2), His 태그 서열(서열 번호: 3), 및 GFP1-9(서열 번호: 72)를 포함하는 GFP1-9(서열 번호: 48)를 사용하고 있다.
또한, 본 개시에 있어서의 제3 분자에는,
(1) 서열 번호: 48, 72 또는 79로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열을 포함하는 단백질이고, 서열 번호: 48, 72 또는 79로 표시되는 아미노산 서열을 포함하는 단백질과 기능적으로 동등한 단백질, 및
(2) 서열 번호: 48, 72 또는 79로 표시되는 아미노산 서열과 80% 이상, 85% 이상, 90% 이상, 95% 이상, 또는 98% 이상의 서열 동일성을 갖는 아미노산 서열을 포함하는 단백질이고, 서열 번호: 48, 72 또는 79로 표시되는 아미노산 서열을 포함하는 단백질과 기능적으로 동등한 단백질
도 포함된다.
아미노산의 부가, 결실, 치환, 및/또는 삽입은, 당 분야에서 공지된 방법에 의해 행하는 것이 가능하다. 예를 들면, 아미노산 서열을 코드하는 핵산에 대해서, 예를 들면 부위 특이적 변이 유발법(Kunkel et al., Proc. Natl. Acad. Sci. USA 82, 488-492(1985))이나 Overlap extension PCR을 행할 수 있다. 이들을 적절히 단독으로 또는 조합하여 행해도 된다.
일반적으로, 단백질에 있어서의 1개 또는 복수(예를 들면, 2, 3, 4, 5, 6, 7, 8, 9, 10, 또는 10을 초과한다)의 아미노산의 개변(예를 들면, 보존적인 치환, 결실, 삽입, 및/또는 부가)은, 그 펩타이드의 기능에 영향을 미치지 않거나, 또는 원래의 단백질의 기능을 강화하기까지 하는 것이 알려져 있다. 아미노산은, 그 측쇄의 특징에 따라서, 소수성 아미노산(A, I, L, M, F, P, W, Y, V), 친수성 아미노산(R, D, N, C, E, Q, G, H, K, S, T)으로 분류된다. 또한 아미노산의 측쇄는, 지방족 측쇄(G, A, V, L, I, P), 하이드록실기를 포함하는 측쇄(S, T, Y), 황 원자를 포함하는 측쇄(C, M), 카복실산 및 아마이드를 포함하는 측쇄(D, N, E, Q), 염기를 포함하는 측쇄(R, K, H), 및 방향족을 포함하는 측쇄(H, F, Y, W)로 분류할 수도 있다. 서열 번호: 71∼84의 어느 하나로 표시되는 아미노산 서열을 포함하는 단백질에 포함되는 아미노산을, 동일한 특징을 갖는 그룹으로 분류되는 다른 아미노산으로 개변된 단백질도 또한, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 분자에 포함된다. 단, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 분자는, 서열 번호: 48, 71∼84의 어느 하나에 기재된 아미노산 서열을 포함하는 단백질과 기능적으로 동등한 한, 비보존적 개변도 포함해도 된다.
또한 본 발명의 일 태양에 있어서, 서열 번호: 48, 71∼84의 어느 하나로 표시되는 아미노산 서열과 높은 서열의 동일성을 갖는 아미노산 서열을 포함하는 단백질도 또한, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 분자에 포함된다. 본 개시에 있어서 높은 동일성이란, 아미노산 서열 전체 혹은 염기 서열 전체에서, 적어도 50% 이상, 더 바람직하게는 70% 이상, 75% 이상, 80% 이상, 85% 이상, 더 바람직하게는 90% 이상(예를 들면, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상)의 서열의 동일성을 가리킨다. 서열의 동일성은, 칼린 및 알츌에 의한 알고리즘 BLAST(Proc. Natl. Acad. Sci. USA 87:2264-2268, 1990, Proc Natl Acad Sci USA 90: 5873, 1993)를 이용하여 결정할 수 있다. BLAST의 알고리즘에 기초한 BLASTN이나 BLASTX로 불리는 프로그램이 개발되어 있다(Altschul SF, et al: J Mol Biol 215: 403, 1990). BLASTN을 이용하여 염기 서열을 해석하는 경우는, 파라미터는, 예를 들면 score=100, wordlength=12로 한다. 또한, BLASTX를 이용하여 아미노산 서열을 해석하는 경우는, 파라미터는, 예를 들면 score=50, wordlength=3으로 한다. BLAST와 Gapped BLAST 프로그램을 이용하는 경우는, 각 프로그램의 디폴트 파라미터를 이용한다. 이들 해석 방법의 구체적인 수법은 공지이다.
본 개시에 있어서 「기능적으로 동등」이란, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 분자가 아미노산의 개변 전에 갖고 있던 기능을 유지하고 있는 것을 말한다. 구체적으로는, 본 개시에 있어서의 제1 부분과 제2 부분이 근접 또는 회합하고 있는 것을, 제3 분자에 의해 검출할 수 있는 한, 그들은 아미노산의 개변의 전후로 기능적으로 동등하다고 판단된다. 한편, 아미노산의 개변을 행한 것에 의해, 본 개시에 있어서의 제1 부분과 제2 부분이 근접 또는 회합하고 있는 것을, 제3 분자에 의해 검출할 수 없게 된 경우에는, 그들은 아미노산의 개변의 전후로 기능적으로 동등하지는 않다고 판단된다. 예를 들면 GFP이면, GFP10 및 GFP11이 근접했을 때에 GFP1-9와 회합하는 성질을 유지하고 있으면 본 개시의 스크리닝 방법에 이용할 수 있기 때문에, 만일 아미노산의 개변이 되어 있었다고 하더라도, 상기 성질을 갖고 있으면 기능적으로 동등하다. 루시페라아제(예를 들면, Nanoluc), SNAP 태그, 및 유비퀴틴에 대해서도 마찬가지이다.
본 개시에 있어서의, 아미노산 서열에 있어서 개변을 갖는, 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 분자는, 당해 단백질을 코드하는 핵산을 이용하여 조제할 수 있다. 이와 같은 핵산을 조제하기 위한 방법으로서, 예를 들면, site-directed mutagenesis법(Kramer, W. and Fritz, H.-J. (1987) Oligonucleotide-directed construction of mutagenesis via gapped duplex DNA. Methods in Enzymology, 154: 350-367)을 들 수 있다. 혹은, 하이브리다이제이션 기술(Southern, E.M. (1975) Journal of Molecular Biology, 98, 503)에 의해서도, 서열 번호: 48, 71∼84의 어느 하나에 기재된 단백질과 기능적으로 동등한 단백질을 코드하는 핵산을 얻는 것도 가능하다. 즉, 본 개시에 있어서의 개변된, 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 부분을 코드하는 핵산은, 서열 번호: 48, 71∼84의 어느 하나에 기재된 아미노산 서열을 코드하는 핵산과 스트린젠트한 조건하에서 하이브리다이즈하는 것이어도 된다. 스트린젠트한 하이브리다이제이션 조건은, 당업자이면, 적절히 선택할 수 있다. 일례를 나타내면, 25% 폼아마이드, 보다 엄격한 조건에서는 50% 폼아마이드, 4×SSC, 50mM Hepes pH 7.0, 10×덴하르트 용액, 20μg/ml 변성 연어 정자 DNA를 포함하는 하이브리다이제이션 용액 중, 42℃에서 하룻밤 프리하이브리다이제이션을 행한 후, 표지한 프로브를 첨가하고, 42℃에서 하룻밤 보온하는 것에 의해 하이브리다이제이션을 행한다. 그 후의 세정에 있어서의 세정액 및 온도 조건은, 예를 들면 「2×SSC, 0.1% SDS, 50℃」, 「2×SSC, 0.1% SDS, 42℃」, 「1xSSC, 0.1% SDS, 37℃」 정도이고, 보다 엄격한 조건으로서는 「2×SSC, 0.1% SDS, 65℃」, 「0.5xSSC, 0.1% SDS, 42℃」 정도이며, 더 엄격한 조건으로서는 「0.2xSSC, 0.1% SDS, 65℃」 정도에서 실시할 수 있다. 이와 같이 하이브리다이제이션의 조건이 엄격해질수록, 서열 번호: 48, 71∼84의 어느 하나에 기재된 아미노산 서열을 코드하는 핵산 서열과 높은 상동성을 갖는 핵산의 단리를 기대할 수 있다. 단, 상기 SSC, SDS 및 온도의 조건의 조합은 예시이고, 당업자이면, 하이브리다이제이션의 스트린젠시를 결정하는 상기 혹은 다른 요소(예를 들면, 프로브 농도, 프로브의 길이, 하이브리다이제이션 반응 시간 등)를 적절히 조합하는 것에 의해, 상기와 마찬가지의 스트린젠시를 실현하는 것이 가능하다.
이에 의해 단리된 핵산은, 아미노산 서열의 레벨에 있어서, 서열 번호: 48, 71∼84의 어느 하나에 기재된 아미노산 서열을 갖는 단백질과 높은 상동성을 갖는다고 생각된다. 또한 염기 서열의 레벨에 있어서, 서열 번호: 48, 71∼84의 어느 하나에 기재된 아미노산 서열을 코드하는 핵산의 염기 서열과 높은 상동성을 갖는다고 생각된다. 높은 상동성이란, 전술한 대로, 아미노산 서열 전체 혹은 염기 서열 전체로, 적어도 50% 이상, 바람직하게는 70% 이상, 또는 75% 이상, 더 바람직하게는 80% 이상, 또는 85% 이상, 특히 바람직하게는 90% 이상(예를 들면, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상)의 서열의 동일성을 가리킨다.
본 개시의 핵산은, 예를 들면, 본 개시에 있어서의 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 분자, 및 이들의 아미노산 개변체의 조제 등에 이용하는 것이 가능하다. 이들 제1 부분 및 제2 부분을 제공하는 단백질, 제1 부분, 제2 부분, 및 제3 분자, 및 이들의 아미노산 개변체를 조제하는 경우에는, 통상, 이들을 코드하는 핵산을 적당한 발현 벡터에 삽입하고, 해당 벡터를 적당한 세포에 도입하고, 형질 전환 세포를 배양하여, 발현시킨 개변된 단백질을 단리, 정제, 배양한다. 이와 같은 단백질은, 정제를 용이하게 하는 등의 목적으로, 다른 단백질과의 융합 단백질로서 발현시키는 것도 가능하다. 예를 들면, 대장균을 숙주로 해서 말토오스 결합 단백질과의 융합 단백질로서 조제하는 방법(미국 New England BioLabs사 발매의 벡터 pMAL 시리즈), 글루타티온-S-트랜스퍼라아제(GST)와의 융합 단백질로서 조제하는 방법(Amersham Pharmacia Biotech사 발매의 벡터 pGEX 시리즈), 히스티딘 태그(예를 들면 서열 번호: 3)를 부가하여 조제하는 방법(Novagen사의 pET 시리즈) 등을 이용하는 것이 가능하다. 숙주 세포로서는, 재조합 단백질의 발현에 적합한 세포이면 특별히 제한은 없고, 상기의 대장균 외, 예를 들면, 효모, 여러 가지 동식물 세포, 곤충 세포 등을 이용하는 것이 가능하다. 숙주 세포로의 벡터의 도입에는, 당업자에게 공지된 여러 가지 방법을 이용하는 것이 가능하다. 예를 들면, 대장균으로의 도입에는, 칼슘 이온을 이용한 도입 방법(Mandel, M., Higa, A. (1970) Journal of Molecular Biology, 53, 158-162, Hanahan, D. (1983) Journal of Molecular Biology, 166, 557-580)을 이용할 수 있다. 숙주 세포내에서 발현시킨 단백질은, 해당 숙주 세포 또는 그의 세포 배양물 혹은 배양 상청으로부터, 당업자에게 공지된 방법에 의해 정제하여, 회수하는 것이 가능하다. 단백질을 상기의 말토오스 결합 단백질 등과의 융합 단백질로서 발현시킨 경우에는, 용이하게 어피니티 정제를 행하는 것이 가능하다.
본 개시의 일 태양에 있어서, 핵산은 벡터에 삽입된 것이어도 된다. 벡터로서는, 예를 들면, 대장균을 숙주로 하는 경우에는, 벡터를 대장균(예를 들면, JM109, DH5α, HB101, XL1Blue) 등에서 대량으로 증폭시켜 대량 조제하기 위해서, 대장균에서 증폭되기 위한 「ori」를 가지고, 추가로 형질 전환된 대장균의 선발 유전자(예를 들면, 약제(암피실린이나 테트라사이클린, 카나마이신, 클로람페니콜 등)에 의해 판별할 수 있는 약제 내성 유전자)를 갖는 벡터를 들 수 있지만 이것으로 한정되지 않는다. 이와 같은 벡터의 예로서는, M13계 벡터, pUC계 벡터, pBR322, pBluescript, pCR-Script 등을 들 수 있다. 또한, cDNA의 서브클로닝, 절출을 목적으로 한 경우, 상기 벡터 외에, 예를 들면, pGEM-T, pDIRECT, pT7 등을 들 수 있다. 단백질을 생산하는 목적에 있어서 벡터를 사용하는 경우에는, 특히, 발현 벡터가 유용하다. 발현 벡터로서는, 예를 들면, 대장균에서의 발현을 목적으로 한 경우는, 벡터가 대장균으로 증폭되는 상기 특징을 가지는 것 외에, 숙주를 JM109, DH5α, HB101, XL1-Blue 등의 대장균으로 한 경우에 있어서는, 대장균에서 효율 좋게 발현할 수 있는 프로모터, 예를 들면, lacZ 프로모터(Ward 등, Nature (1989) 341, 544-546; FASEB J. (1992) 6, 2422-2427), araB 프로모터(Better 등, Science (1988) 240, 1041-1043), 또는 T7 프로모터 등을 가지고 있는 것이 불가결하다. 이와 같은 벡터로서는, 상기 벡터 외에 pGEX-5X-1(파마시아사제), 「QIAexpress system」(퀴아젠사제), pEGFP, 또는 pET 등을 들 수 있다.
또한, 벡터에는, 폴리펩타이드 분비를 위한 시그널 서열이 포함되어 있어도 된다. 폴리펩타이드 분비를 위한 시그널 서열로서는, 대장균의 페리플라즘에 산생시키는 경우, pelB 시그널 서열(Lei, S. P. et al J. Bacteriol. (1987) 169, 4379)을 사용하면 된다. 숙주 세포로의 벡터의 도입은, 예를 들면 염화 칼슘법, 일렉트로포레이션법을 이용하여 행할 수 있다. 또한 식물체 내에서 발현하는 벡터로서 pMH1, pMH2, pCAMBIA 등의 벡터를 들 수 있다.
대장균 이외에도, 예를 들면, 단백질을 제조하기 위한 벡터로서는, 포유동물 유래의 발현 벡터(예를 들면, pcDNA3(인비트로젠사제)이나, pEGF-BOS(Nucleic Acids. Res. 1990, 18(17), p5322), pEF, pCDM8), 곤충 세포 유래의 발현 벡터(예를 들면 「Bac-to-BAC baculovairus expression system」(깁코 BRL사제), pBacPAK8), 식물 유래의 발현 벡터(예를 들면 pMH1, pMH2), 동물 바이러스 유래의 발현 벡터(예를 들면, pHSV, pMV, pAdexLcw), 레트로바이러스 유래의 발현 벡터(예를 들면, pZIPneo), 효모 유래의 발현 벡터(예를 들면, 「Pichia Expression Kit」(인비트로젠사제), pNV11, SP-Q01), 고초균 유래의 발현 벡터(예를 들면, pPL608, pKTH50) 등을 들 수 있다.
CHO 세포, COS 세포, NIH3T3 세포 등의 동물 세포에서의 발현을 목적으로 한 경우에는, 세포내에서 발현시키기 위해서 필요한 프로모터, 예를 들면 SV40 프로모터(Mulligan 등, Nature (1979) 277, 108), MMLV-LTR 프로모터, EF1α 프로모터(Mizushima 등, Nucleic Acids Res. (1990) 18, 5322), CMV 프로모터 등을 가지고 있는 것이 불가결하고, 세포로의 형질 전환을 선발하기 위한 유전자(예를 들면, 약제(네오마이신, G418 등)에 의해 판별할 수 있는 약제 내성 유전자)를 가지면 더 바람직하다. 이와 같은 특성을 갖는 벡터로서는, 예를 들면, pMAM, pDR2, pBK-RSV, pBK-CMV, pOPRSV, pOP13 등을 들 수 있다.
형질 전환 세포는, 예를 들면, 단백질의 제조나 발현을 위한 산생계로서 사용할 수 있다. 단백질의 제조를 위한 산생계는, in vitro 및 in vivo의 산생계가 있다.
진핵 세포를 사용하는 경우, 예를 들면, 동물 세포, 식물 세포, 진균 세포를 숙주에 이용할 수 있다. 동물 세포로서는, 포유류 세포(예를 들면, 전술한 CHO 세포, COS 세포, NIH3T3 세포에 더하여, 3T3, 미엘로마 세포, BHK(baby hamster kidney), HeLa, Vero 등의 세포), 양서류 세포(예를 들면 아프리카발톱개구리 난모 세포(Valle, et al., Nature (1981) 291, 358-340)), 혹은 곤충 세포(예를 들면, sf9, sf21, Tn5 등의 세포)가 알려져 있다. CHO 세포로서는, 특히, DHFR 유전자를 결손한 CHO 세포인 dhfr-CHO(Proc. Natl. Acad. Sci. USA (1980) 77, 4216-4220)나 CHO K-1(Proc. Natl. Acad. Sci. USA (1968) 60, 1275)을 적합하게 사용할 수 있다. 대량 발현을 목적으로 하는 경우에는 특히 CHO 세포가 바람직하다.
식물 세포로서는, 후술하는 식물 유래의 세포 외, 예를 들면, 니코티아나 타바쿰(Nicotiana tabacum) 유래의 세포가 단백질 생산계로서 알려져 있고, 이것을 캘러스 배양하면 된다.
또한 진균 세포로서는, 효모, 예를 들면, 사카로마이세스(Saccharomyces)속, 예를 들면, 사카로마이세스 세레비시애(Saccharomyces cerevisiae), 사상균, 예를 들면, 아스퍼질러스(Aspergillus)속, 예를 들면, 아스퍼질러스 니제르(Aspergillus niger)가 알려져 있지만 이들로 한정되지 않는다.
비한정된 일 태양에 있어서, 본 개시는, 본 개시에 있어서의 스크리닝 방법에 의해 얻어진 후보 분자의 제조 방법에 관한 것이다. 예를 들면 후보 분자가 펩타이드인 경우, 당해 펩타이드의 아미노산 서열에 기초하여 펩타이드를 제조할 수 있다.
본 명세서에 있어서, 「1E+N」은 1×10의 N승을 의미한다. 예를 들면, 1E+8은 1×10의 8승을, 1E+6이면 1×10의 6승을 의미한다. 마찬가지로, 1.8E+12이면 1.8×10의 12승을, 3.03E+05이면 3.03×10의 5승을 의미한다.
본 명세서에 있어서, 「및/또는」이라는 용어의 의의는, 「및」과 「또는」이 적절히 조합된 모든 조합을 포함한다. 구체적으로는, 예를 들면, 「A, B, 및/또는 C」에는, 이하의 7방법의 배리에이션이 포함된다;
(i) A, (ii) B, (iii) C, (iv) A 및 B, (v) A 및 C, (vi) B 및 C, (vii) A, B, 및 C.
본 명세서에 있어서, 범위를 나타내는 「∼」는 그 양단의 값을 포함하고, 예를 들면, 「A∼B」는, A 이상이고, 또한 B 이하인 범위를 의미한다.
한편, 본 명세서에 있어서 인용된 모든 선행기술문헌은, 참조로서 본 명세서에 원용된다.
실시예
본 발명은, 이하의 실시예에 의해 더 예시되지만, 하기의 실시예로 한정되는 것은 아니다.
실시예 중에서는 이하의 약호를 사용했다.
DMSO 다이메틸설폭사이드
DTT 다이싸이오트레이톨
FA 폼산
TFA 트라이플루오로아세트산
THF 테트라하이드로퓨란
TCEP 트리스(2-카복시에틸)포스핀
TEA 트라이에틸아민
HFIP 헥사플루오로아이소프로판올
실시예 1 비오틴화 GFP1-9 단백질의 조제
벡터 조제
pET-15b 벡터에, 서열 번호: 15(D-1)의 합성 DNA를 Nde1/BamH1의 제한 효소를 사용하여 삽입한 발현 벡터를 조제했다.
합성 DNA 서열 번호: 15(D-1)
DNA 서열:
CATATGGGTGGCACCAGCAGCAAGGGCGAGGAACTGTTCACCGGTGTGGTTCCGATCCTGGTGGAGCTGGACGGCGATGTTAACGGTCACAAATTTAGCGTGCGTGGTGAGGGCGAAGGTGACGCGACCATCGGCAAGCTGACCCTGAAATTCATTAGCACCACCGGTAAACTGCCGGTGCCGTGGCCGACCCTGGTTACCACCCTGACCTACGGTGTGCAGGCGTTTAGCCGTTATCCGGACCACATGAAGCGTCACGATTTCTTTAAAAGCGCGATGCCGGAGGGCTACGTTCAAGAACGTACCATTAGCTTCAAGGACGATGGCAAGTATAAAACCCGTGCGGTGGTTAAATTTGAGGGCGATACCCTGGTTAACCGTATCGAGCTGAAGGGTACCGACTTCAAAGAAGATGGCAACATTCTGGGTCACAAGCTGGAATACAACTTTAACAGCCACAACGTGTATATCACCGCGGACAAGCAGAAAAACGGCATTAAAGCGAACTTCACCGTGCGTCACAACGTTGAGGACGGTAGCGTTCAACTGGCGGATCACTACCAGCAAAACACCCCGATTGGTGATGGTACCCGTGGCAGCGGTAGCATTGAAGGTCGTCATAGCGGCAGCGGTAGCCCGGTGCTGCTGCCGGACAACCACTATCTGAGCACCCAGACCGTTCTGAGCAAAGATCCGAACGAGGCGGGCACTCGTGGCAGCGGTAGCATCGAAGGTCGTCACAGCGGCAGCGGTAGCCGTGACCACATGGTGCTGCACGAATACGTTAACGCGGCGGGCATCACCCACGGTATGGACGAACTGTATAAAGGCAGCGGCGGCACCTAAGGATCC
단백질에 비오틴화를 위한 Avi 태그 서열(서열 번호: 1), 절단을 위한 TEV 프로테아제 인식 서열(서열 번호: 2), 정제를 위한 His 태그(서열 번호: 3)를 부가하기 위해서, Nco1/Nde1 제한 효소를 이용하여, 인서트 태그 서열(서열 번호: 16)을 목적 단백질의 N 말단에 삽입했다. Ligation 산물을 사용하여, 대장균 DH5α 컴피텐트 셀(도요보, #DNA-903)을 형질 전환하고, 클로닝 후, 삽입 개소의 서열 해석을 행하여, 태그 부가 발현 벡터의 완성을 확인했다.
추가로 발현 효율과 His 태그 정제의 효율을 올리기 위해, His 태그와 ORF 서열 사이의 서열에 Gly-Gly-Ser-Ser(서열 번호: 88)의 서열을 PCR로 삽입했다. 구체적으로는, 1x Prime STAR Max Premix(다카라), 2μM Fw-primer(서열 번호: 13), 2μM Rv-primer(서열 번호: 14), 1.4ng 태그 부가 발현 벡터를 혼합하고, 98℃ 10초, 55℃ 15초, 72℃ 45초 사이클을 30사이클 반복했다. PCR 산물을 사용하여, 대장균 DH5α 컴피텐트 셀(도요보, #DNA-903)을 형질 전환하고, 클로닝 후, 삽입 개소의 서열 해석을 행하여, 본 실시예에서 사용하는 GFP1-9 발현 벡터의 완성을 확인했다.
단백질 발현 및 정제
대장균 BL21(DE3) 컴피텐트 셀(Novagen)을, GFP1-9 발현 벡터와, pACYC184 벡터에 대장균 BirA 유전자를 도입한 BirA 발현 벡터로 형질 전환하여, 발현주를 구축했다.
구축한 대장균 발현주를 배지 A(10g/L Tryptone, 5g/L Yeast Extract, 10g/L NaCl, 100μg/mL 암피실린, 34μg/mL 클로람페니콜)에 식균하고, 37℃, 200rpm으로 배양했다. OD600=0.7에 이른 시점에서, 빙수에 플라스크를 5분 침지하여, 4℃까지 배양액의 온도를 낮췄다. 0.5mM IPTG(아이소프로필-β-싸이오갈락토피라노사이드), 50μM Biotin이 되도록 가하고, 19℃, 200rpm으로 하룻밤 배양함으로써 비오틴화 수식을 받은 목적 단백질을 발현시켰다. 배양균체는 원심에 의해 회수하고, 액체 질소로 동결한 후, -80℃에서 보존했다.
동결균체를 extraction buffer(50mM Tris pH 8.0, 150mM NaCl, 1% CHAPS, 5% Glycerol, Proteinase Inhibitor Cocktail(EDTA-free))를 이용하여 현탁하고, 5kUnit/E.coli가 되도록 rLysozyme(Novagen, #71110-3)을 첨가한 후, 실온에서 20분 방치했다. 재차 현탁하고, 초음파 파쇄한 후, 1M MgCl2를 0.2%v/v가 되도록, 25U/μL benzonase(EMD millipore, #70746-2.5KUN)를 0.03%v/v가 되도록 가하고, 재차 실온에서 20분 정치했다. 샘플을 원심하여 회수한 상청을, 0.22μm 필터로 여과했다.
여과한 샘플을, HisTrap HP 5mL(GE Healthcare, #17-5248-02)를 사용하여 정제했다. GFP10, GFP11 부분을 절단하기 위해, 용출 샘플에 종농도 2mM이 되도록 CaCl2를 가하고, 샘플의 1/100양(w/w)의 Factor Xa Protease(New England Biolabs, #P8010L)를 가했다. 투석 카세트: Slide-A-Lyzer 10K Dialysis Cassettes G2 30mL Capacity(Thermo Fisher, #87732)를 이용하여, 샘플을 투석 Buffer(50mM Tris-HCl(pH 8.0), 150mM NaCl, 2mM CaCl2)로 치환했다.
투석 샘플을 회수 후, Streptavidin Mutein Matrix(Roche, #03708152001)를 이용하여 정제했다. 목적 단백질을 포함하는 프랙션을 회수하고, 합계 10mL를 Amicon Ultra-15 10K(MERCK, #UFC901024)에 의해, 3mL volume이 되도록 농축했다. 6M Gdn Buffer(50mM Tris-HCl, 150mM NaCl, 10% Glycerol, 3M Guanidine-Hydrochloride(pH 8.0))를 등량 가하고, 40분간 빙상에서 변성시켰다. 변성 전후에서의 흡수 파장 스펙트럼의 변화를 확인하여, 변성되어 있는 것을 확인한 후, HiLoad 26/600 Superdex 75 pg(GE 헬스케어, #28-9893-34)에 의해, 겔 여과 정제했다. 겔 여과 정제의 Running buffer로서, 50mM Tris-HCl, 150mM NaCl, 10% Glycerol, 3M Guanidine Hydrochloride(pH 8.0), 1mM DTT를 이용했다. 마지막으로 변성제의 구아니딘을 제거하고, 리폴딩시키기 위해, 얻어진 샘플을 투석 카세트: Slide-A-Lyzer 10K Dialysis Cassette 30mL capacity(Thermo Fisher, #87732)로 투석했다.
SDS-PAGE 분석의 결과, 목적 단백질의 이론 분자량에 대응하는 위치에 단일 밴드를 나타냈다. 또한, 비오틴화 단백질과 스트렙트아비딘간의 상호작용을 이용한 겔 시프트 어세이에 의해, 목적 단백질이 비오틴화되어 있는 것을 확인했다. SEC 분석의 결과, 목적 단백질의 주성분은, 32kDa의 분자량 마커와 동일한 정도의 유지 시간을 나타내고, 또한 단량체로서 존재하고 있는 것을 확인했다. SDS-PAGE의 레인 정보를 표 1, 결과를 도 1에, SEC 분석의 결과를 도 2에 나타낸다. SEC 분석의 칼럼에는, AdvanceBio SEC 300A 2.7μm 4.6×150mm(Agilent사, #PL1580-3301)를 사용했다.
실시예 2 mRNA Display를 이용한 splitGFP의 재회합 어세이
복수의 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자를 라이브러리로부터 스크리닝할 때, 1개의 표적 분자만과 복합체를 형성하는 피험 분자의 회수율을 낮게 억제한 계가 필요해진다.
그래서, GFP10(서열 번호: 40), GFP11(서열 번호: 41), 및 GFP10-11 연결체(서열 번호: 39) 각각의, GFP1-9(서열 번호: 48)에 대한 결합능을 평가했다. GFP10, GFP11, 및 GFP10-11 연결체의 각각에 핵산을 연결시킨 Display 분자를 조제하고, 이들을 GFP1-9와 인큐베이트하고, GFP1-9에 결합한 분자의 핵산 부분을 qPCR했다. 한편, 본 실시예에서는, N 말단에 Avi 태그 서열, TEV 프로테아제 인식 서열, 및 His 태그 서열이 부가된 GFP의 1∼9번째의 스트랜드를 GFP1-9, C 말단에 GS 링커가 부가된 GFP의 10번째의 스트랜드를 GFP10, C 말단에 GS 링커가 부가된 GFP의 11번째의 스트랜드를 GFP11, GFP9와 GFP10이 연결되고 C 말단에 GS 링커가 부가된 단백질을 GFP10-11로 표기하는 경우가 있다.
(1) mRNA의 합성
주형 DNA(서열 번호: 17(D-3)∼서열 번호: 19(D-5))로부터, T7 RNA polymerase를 이용한 in vitro 전사 반응에 의해 mRNA(서열 번호: 29(mR-1)∼서열 번호: 31(mR-3))를 합성하고, RNeasy kit(Qiagen사)에 의해 정제했다.
주형 DNA 서열 번호: 17(D-3)
DNA 서열: GFP10-11
GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGGACCTGCCGGACGACCACTACCTGTCTACCCAGACCATCCTGCTGAAAGACCTGAACGAAAAACGTGACCACATGGTTCTGCTGGAATACGTTACCGCGGCGGGTATCACCGACGCGTCTGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA
주형 DNA 서열 번호: 18(D-4)
DNA 서열: GFP10
GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGGACCTGCCGGACGACCACTACCTGTCTACCCAGACCATCCTGCTGAAAGACCTGAACGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA
주형 DNA 서열 번호: 19(D-5)
DNA 서열: GFP11
GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGGAAAAACGTGATCATATGGTGCTGCTGGAATATGTGACCGCGGCGGGCATTACCGATGCGTCTGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA
mRNA 서열 번호: 29(mR-1)
GFP10-11 RNA 서열:
GGGUUAACUUUAAGAAGGAGAUAUACAUAUGGACCUGCCGGACGACCACUACCUGUCUACCCAGACCAUCCUGCUGAAAGACCUGAACGAAAAACGUGACCACAUGGUUCUGCUGGAAUACGUUACCGCGGCGGGUAUCACCGACGCGUCUGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA
mRNA 서열 번호: 30(mR-2)
GFP10 RNA 서열:
GGGUUAACUUUAAGAAGGAGAUAUACAUAUGGACCUGCCGGACGACCACUACCUGUCUACCCAGACCAUCCUGCUGAAAGACCUGAACGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA
mRNA 서열 번호: 31(mR-3)
GFP11 RNA 서열:
GGGUUAACUUUAAGAAGGAGAUAUACAUAUGGAAAAACGUGAUCAUAUGGUGCUGCUGGAAUAUGUGACCGCGGCGGGCAUUACCGAUGCGUCUGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA
(2) mRNA Display에 의한 재회합 어세이
mRNA와 펩타이드가 연결된 Display 분자를 조제하고, 비오틴화 GFP1-9에 의한 회수율을 조사했다. WO2013/100132에 기재된 방법으로, 상기에서 정제한 mRNA의 3' 말단에 링커를 개재시켜 퓨로마이신을 연결하고, 이것을 번역하는 것에 의해 mRNA-펩타이드의 Display 분자를 조제했다. 번역계는, 원핵생물 유래의 재구성 무세포 단백질 합성계인 PUREfrex2.0(GeneFrontier사)을 이용하여, 부속의 프로토콜에 따라 번역했다.
각 Display 분자의 제시율을 확인하기 위해서, RNaseONE(Promega)에 의해 RNA 부분을 분해하고, TricinePAGE에서, 영동 분리했다. Display 분자를 형성하고 있는 경우는 번역 펩타이드와 퓨로마이신 링커의 연결체가 되고, Display 분자를 형성하고 있지 않는 경우는 번역 펩타이드의 결합하고 있지 않는 링커만이 되어, 전자보다도 낮은 위치에 검출되어, 합계 2개의 밴드가 검출된다. 그 밴드비로부터, 이하의 식에 의해 Display 분자의 제시율(%)을 계산했다.
Display 분자의 제시율(%)=번역 펩타이드와 링커로 이루어지는 밴드 강도/밴드 강도의 합계×100
RNaseONE에 의한 구체적인 반응액은, 1xReaction buffer, 0.84μM 연결체, 0.5U/μL RNaseONE을 혼합하고, 37℃에서 1시간 반응시켰다.
TricinePAGE의 검출은, 형광 표지한 퓨로마이신 링커를 검출했다. TricinePAGE의 결과 얻어진 제시율은 표 2와 같이 되었다.
재회합 어세이에 사용할 때는, 형광 표지가 없는 퓨로마이신 링커를 사용하고, 번역 산물은, mRNA 부분에서의 결합을 회피하기 위해서 역전사를 행했다. 구체적인 방법으로서는, 1xM-MLV RT Reaction buffer(Promega, #368B), 0.5mM dNTP, 8U/μL M-MLV RT (H-) Point Mutant(Promega, #368B), 3μM Rv-primer(서열 번호: 5), 0.5μM 번역 산물이 되도록 혼합하고, 42℃에서 1시간 반응시켰다.
1xTBS의 버퍼 중에서, 0.42μM의 각 Display 분자와, 1μM의 비오틴화 GFP1-9와 혼합하고, 실온에서 1시간 반응시켰다.
Streptavidin 코팅 자기 비즈를 이용한 풀다운에 의해 비오틴화 GFP1-9 혹은 이것을 포함하는 복합체를 회수하고, tTBS(나카라이 테스크)로 수회 세정 후, GFP1-9와 비오틴 사이에 도입한 TEV 프로테아제 인식 서열을 인식하는 TEV 프로테아제에 의해 절단하여 핵산의 용출을 행했다. 구체적인 TEV 용출액은, 1xTEV buffer, 1mM DTT, 0.2U/μL AcTEV 프로테아제(서모 피셔 사이언티픽사, #12575015)를, 세정 후의 비즈에 첨가하여 반응시켰다. 반응 후, 상청을 회수하고, 상보성을 가지는 primer(Fw-primer(서열 번호: 4), Rv-primer(서열 번호: 5))로 qPCR을 걸었다. qPCR의 반응액은, 1xExtaq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, #50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 57℃ 20초, 72℃ 30초 사이클을 40사이클 반복했다. 비오틴화 GFP1-9와 반응시키기 전의 각 Display 분자도 마찬가지로 qPCR을 행하여, 인풋의 핵산량(분자수)을 산출했다. 표 중에서는 핵산량(분자수)의 단위를 「분자」라고 표기했다.
각 서열에서 검량선을 긋기 위해서, 핵산량(분자수)으로, 1E+8/μL, 1E+7/μL, 1E+6/μL, 1E+5/μL, 1E+4/μL가 되도록 희석하고, 마찬가지의 조건의 qPCR에 걸었다.
GFP1-9와의 결합에 의해 회수된 각 Display 분자의 핵산량을, GFP1-9와 혼합하기 전에 존재하고 있던 각 Display 분자의 핵산량(인풋의 값)으로 나눈 겉보기의 회수율을 산출하고, 추가로 제시율로 보정한 회수율을, 표 3에 정리했다.
겉보기의 회수율(%)=회수된 핵산량(분자수)/인풋의 핵산량(분자수)×100
회수율(%)=회수된 핵산량(분자수)/(인풋의 핵산량(분자수)×각 제시율×0.01)×100
결과, GFP1-9에 의해 GFP10-11 연결체가 회수되고, GFP10 단독, 혹은 GFP11 단독의 회수율은, 연결체의 회수율에 비해 1000배 정도 낮은 것이 나타났다. 즉, GFP1-9는 GFP10(또는 GFP11)의 비존재하에서는 GFP11(또는 GFP10)과 회합하지 않는 것, GFP1-9가 GFP10 및 GFP11과 회합하기 위해서는 GFP10과 GFP11이 근접, 회합 혹은 상호작용하고 있을 것이 필요하다는 것이 나타났다. 이 결과로부터, GFP10을 어떤 표적 단백질에 결합시킨 분자, GFP11을 다른 표적 단백질에 결합시킨 분자, 및 GFP1-9를 사용하면, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자(예를 들면, 복수의 표적 분자 사이의 결합을 증강 또는 저해하는 분자, 복수의 표적 분자를 연결하는 분자, 복수의 표적 분자에 의한 복합체의 형성을 유발하는 분자 등)의 효율적인 스크리닝이 가능해지는 것이 나타났다.
실시예 3 GFP의 재회합을 이용한, 라파마이신 회수 검증 실험
다음으로, GFP10, GFP11에 각각 다른 단백질을 결합시킨 융합 단백질을 조제하고, 상기 단백질이 복합체를 형성하는 것에 의한 GFP10, GFP11의 근접 효과로, GFP1-9에 의해 상기 단백질의 복합체를 선택적으로 회수하는 것이 가능한지를 검증했다. 복합체 형성을 위한 단백질 페어의 모델로서, FKBP(FK506-binding protein)와 FRB(FKBP-Rapamycin binding domain of FKBP12-Rapamycin associated protein)를 이용했다. 이 2개의 단백질은 라파마이신 존재하에서 복합체를 형성하는 것이 알려져 있다.
라파마이신에 화학적으로 핵산을 결합시킨 라파마이신-핵산을 조제하고, GFP1-9에 의해, 2개의 융합 단백질과 라파마이신의 복합체가 회수되는지 여부를 검증했다.
(1) 라파마이신-클릭 태그의 조제
LCMS의 분석 조건은, 하기와 같다.
(1-1) 다이벤조사이클로옥틴(DBCO) 수식된 라파마이신 유도체의 합성
라파마이신, 42-[22-(11,12-다이데하이드로다이벤조[b,f]아조신-5(6H)-일)-17,22-다이옥소-4,7,10,13-테트라옥사-16-아자도코산-1-오에이트](화합물 nk01)의 합성
질소 분위기하, 다이벤조사이클로옥틴-PEG4-산(7.5mg, 0.013mmol)을 테트라하이드로퓨란(THF)(64.3μL)에 용해시켜 혼합물을 0℃로 냉각 후, 트라이에틸아민(2.7μL, 0.019mmol) 및 2,4,6-트라이클로로벤조일 클로라이드(2.0μL, 0.013mmol)를 가하고 0℃에서 1시간 교반했다. 반응 혼합물에 라파마이신(11.8mg, 0.013mmol) 및 4-다이메틸아미노피리딘(1.6mg, 0.013mmol)을 첨가했다. 반응 혼합물을 0℃에서 5분간 교반한 후, 15℃에서 3시간 교반 후, 역상 실리카 겔 칼럼 크로마토그래피(0.1% 폼산 수용액/0.1% 폼산 아세토나이트릴 용액)로 정제하여, 라파마이신, 42-[22-(11,12-다이데하이드로다이벤조[b,f]아조신-5(6H)-일)-17,22-다이옥소-4,7,10,13-테트라옥사-16-아자도코산-1-오에이트](화합물 nk01)(3.9mg, 21%)를 얻었다.
LCMS(ESI)m/z=1477(M+H)+
유지 시간: 1.15분(분석 조건 SQDFA05)
(1-2) 라파마이신-핵산의 조제
화합물 nk02의 합성
10mM 42-[22-(11,12-다이데하이드로다이벤조[b,f]아조신-5(6H)-일)-17,22-다이옥소-4,7,10,13-테트라옥사-16-아자도코산-1-오에이트](화합물 nk01)의 DMSO 용액(20μL), 2mM DNA-N3(서열 번호: 98)의 10mM 아세트산 나트륨 수용액(20μL), DMSO(20μL)를 각각 가하고, 37℃에서 16시간 정치했다. 반응 혼합물에 물(60μL), 클로로폼-아이소아밀 알코올 혼합액(120μL)을 가하여, 액 추출을 행하고, 수층을 동결 건조하고, 얻어진 잔사를 DMSO(80μL)에 녹여, 조생성물(화합물 nk02)의 DMSO 용액을 얻었다.
LC-HRMS:m/z=934.5680(M-9H)9-, Calcd 934.5685(M-9H)9-, (Calcd for C302H437N68O168P23:Molecular Weight 8420.4)
유지 시간: 6.57분(분석 조건 LTQ TEA/HFIP20_01)
화합물 nk03의 합성
20mM 다이벤조사이클로옥틴-PEG4-산의 DMSO 용액(2.5μL), 2mM DNA-N3(서열 번호: 98)의 수용액(5μL), 20mM 아세트산 나트륨 수용액(2.5μL)을 각각 가하고, 37℃에서 16시간 정치했다. 반응액을 동결 건조하고, 얻어진 잔사를 DMSO(20μL)에 녹여, 조생성물(화합물 nk03)의 DMSO 용액을 얻었다.
LC-HRMS:m/z=1503.7145(M-5H)5-, Calcd 1503.7196 (M-5H)5-, (Calcd for C251H360N67O156P23:Molecular Weight 7524.3)
유지 시간: 3.61분(분석 조건 LTQ TEA/HFIP20_01)
(2) 라파마이신-핵산의 조제
화합물 nk02 혹은 화합물 nk03에, T4 RNA ligase에 의해, qPCR로 검출하기 위한 핵산을 연결하고, 모델 실험에 사용하기 위한 라파마이신-클릭 태그-핵산 분자(화합물 nk04, 화합물 nk06) 및 클릭 태그-핵산 분자(화합물 nk05, 화합물 nk07: 네거티브 컨트롤에 사용)를 조제했다.
주형 DNA(서열 번호: 20(D-6), 서열 번호: 120(D-22), 서열 번호: 121(D-23))로부터, RiboMAX Large Scale RNA production System T7(Promega사, P1300)을 이용한 in vitro 전사 반응에 의해 주형 mRNA(서열 번호: 32(mR-4), 서열 번호: 122(mR-17), 서열 번호: 123(mR-18))를 합성하고, RNeasy Mini kit(Qiagen사)에 의해 정제했다. 1xligation buffer(50mM HEPES·KOH(pH 8.2), 10mM MgCl2, 2.67mM DTT, 0.67mM ATP), 10% PEG8000, 32μM 화합물 nk02 혹은 화합물 nk03, 10μM mR-4, 2U/μL T4RNAligase(NEB, #M0204L)가 되도록 혼합하고, 37℃ 1시간 인큐베이트하여, 라이게이션 반응을 행했다. 라이게이션 반응 후, RNeasy Mini kit(Qiagen사)에 의해 정제하여, 조제했다. 서열 번호: 32와 화합물 nk02가 연결된 것을 화합물 nk04, 서열 번호: 32와 화합물 nk03이 연결된 것을 화합물 nk05, 서열 번호: 122 혹은 서열 번호: 123과 화합물 nk02가 연결된 혼합물을 화합물 nk06, 서열 번호: 122 혹은 서열 번호: 123과 화합물 nk03이 연결된 혼합물을 화합물 nk07로 했다.
서열 번호: 120, 서열 번호: 121의 (Random)9는, AAC, ACT, AGG, AGT, ATT, CAG, CAT, CCG, CGG, CGT, CTA, GAA, GCT, GGT, GTA, TGC, TGG, TTT 중 어느 코돈이 랜덤으로 9잔기 출현한다.
서열 번호: 122, 서열 번호: 123의 (Random)9는, AAC, ACU, AGG, AGU, AUU, CAG, CAU, CCG, CGG, CGU, CUA, GAA, GCU, GGU, GUA, UGC, UGG, UUU 중 어느 코돈이 랜덤으로 9잔기 출현한다.
주형 DNA 서열 번호: 20(D-6)
GTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGCAGTTTATGTTTTAGGAGATTCTGAGGCCGACCGGCACCGGCACCGGCGATAGGGCGGCGGGGACAAA
mRNA 서열 번호: 32(mR-4)
GGGUUAACUUUAAGAAGGAGAUAUACAUAUGCAGUUUAUGUUUUAGGAGAUUCUGAGGCCGACCGGCACCGGCACCGGCGAUAGGGCGGCGGGGACAAA
주형 DNA 서열 번호: 120(D-22)
GTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATG(Random)9ATGCCGACCGGCACCGGCACCGGCGATAGGGCGGCGGGGACAAA
주형 DNA 서열 번호: 121(D-23)
GTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATG(Random)9TAGCCGACCGGCACCGGCACCGGCGATAGGGCGGCGGGGACAAA
mRNA 서열 번호: 122(mR-17)
GGGUUAACUUUAAGAAGGAGAUAUACAUAUG(Random)9AUGCCGACCGGCACCGGCACCGGCGAUAGGGCGGCGGGGACAAA
mRNA 서열 번호: 123(mR-18)
GGGUUAACUUUAAGAAGGAGAUAUACAUAUG(Random)9UAGCCGACCGGCACCGGCACCGGCGAUAGGGCGGCGGGGACAAA
(3) 융합 단백질의 조제
FKBP와 GFP11을 연결한 융합 단백질(Hisx6-FKBP12-Link12-GFP11, (염기 서열의 서열 번호: 21, 아미노산 서열의 서열 번호: 86) 및 FRB와 GFP10을 연결한 융합 단백질(GFP10-Link12-FRB-Hisx6, 염기 서열의 서열 번호: 22, 아미노산 서열의 서열 번호: 87)을 조제했다.
구체적으로는, 발현 벡터에 pET11a를 이용하여, 대장균 BL21(DE3)을 형질 전환하여 발현주를 작성했다. OD600이 0.5가 될 때까지, 암피실린이 함유된 TB 배지에서 배양하고, 0.5mM의 IPTG로 유도를 걸고, Hisx6-FKBP12-Link12-GFP11은 37℃에서 4시간, GFP10-Link12-FRB-Hisx6은 15℃에서 하룻밤 배양했다. 회수한 가용성 분획을 Profinity IMAC Ni-Charged Resin(BIO-RAD)을 이용하여 기본 프로토콜에 따라 정제하여, 보존 buffer(50mM Tris-HCl, 150mM NaCl, 10% Glycerol, pH 8.0)에 넣고, -80℃에서 보존했다.
융합되는 단백질 사이에는, 12잔기의 GS 링커를 넣었다. 각 단백질의 아미노산 서열은 표 5와 같다.
(4) GFP의 재회합을 이용한, 라파마이신 회수 검증 실험
화합물 nk06과, GFP1-9, 라파마이신을 개재시켜 복합체를 형성하는 단백질(FKBP 또는 FRB)과 GFP11 또는 10을 연결한 융합 단백질(Hisx6-FKBP12-Link12-GFP11 혹은 GFP10-Link12-FRB-Hisx6)을 이용하여, GFP10 및 11의 근접 효과에 의한 GFP1-9와의 재회합의 이용에 의해, 상기 복합체를 회수할 수 있는지를, 화합물 nk06의 핵산의 회수량을 지표로 검증했다.
화합물 nk06 혹은 화합물 nk07의 mRNA 부분에서의 결합을 회피하기 위해서, mRNA 부위의 역전사를 행했다. 1xM-MLV RT Reaction buffer(Promega, #368B), 0.5mM dNTP, 8U/μL M-MLV RT (H-) Point Mutant(Promega, #368B), 3μM Rv-primer(서열 번호: 6), 0.5μM 화합물 nk06 혹은 화합물 nk07이 되도록 혼합하고, 42℃에서 1시간 반응시켰다.
조건 1에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, Hisx6-FKBP12-Link12-GFP11, GFP10-Link12-FRB-Hisx6, 및 비오틴화 GFP1-9를 각각 1μM이 되도록 혼합하고, 화합물 nk06의 역전사 산물을 0.375μM이 되도록 가하고, 실온에서 1시간 반응시켰다.
조건 2에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, Hisx6-FKBP12-Link12-GFP11, GFP10-Link12-FRB-Hisx6을 각각 1μM이 되도록 혼합하고, 화합물 nk06의 역전사 산물을 0.375μM이 되도록 가하고, 실온에서 1시간 반응시켰다.
조건 3에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, Hisx6-FKBP12-Link12-GFP11과 비오틴화 GFP1-9를 각각 1μM이 되도록 혼합하고, 화합물 nk06의 역전사 산물을 0.375μM이 되도록 가하고, 실온에서 1시간 반응시켰다.
조건 4에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, GFP10-Link12-FRB-Hisx6과 비오틴화 GFP1-9를 각각 1μM이 되도록 혼합하고, 화합물 nk06의 역전사 산물을 0.375μM이 되도록 가하고, 실온에서 1시간 반응시켰다.
조건 5에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, Hisx6-FKBP12-Link12-GFP11, GFP10-Link12-FRB-Hisx6, 및 비오틴화 GFP1-9를 각각 1μM이 되도록 혼합하고, 화합물 nk07의 역전사 산물을 0.375μM이 되도록 가하고, 실온에서 1시간 반응시켰다.
Streptavidin 코팅 자기 비즈를 이용한 풀다운에 의해 비오틴화 GFP1-9 혹은 이것을 포함하는 복합체를 회수하고, tTBS(나카라이 테스크)로 수회 세정 후, 용출 buffer(1xEx taq buffer, 0.2mM dNTP, 0.5μM Fw-primer(서열 번호: 4), 0.5μM Rv-primer(서열 번호: 6))를 가하여 현탁하고, 95℃에서 10분간 가열하여, 핵산을 용출했다. 반응 후, 상청을 회수하고, 상보성을 가지는 primer(Fw-primer(서열 번호: 4), Rv-primer(서열 번호: 6))로 qPCR을 걸었다. qPCR의 반응액은, 1xEx taq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, 50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 57℃ 20초, 72℃ 30초 사이클을 40사이클 반복했다.
각 서열에서 검량선을 긋기 위해서, 핵산량으로, 1E+8/μL, 1E+6/μL, 1E+4/μL가 되도록 희석하고, 마찬가지의 조건의 qPCR에 걸었다.
Hisx6-FKBP12-Link12-GFP11과 GFP10-Link12-FRB-Hisx6을 개재시켜 GFP1-9와의 결합에 의해 회수된, 화합물 nk06 혹은 화합물 nk07의 핵산의 회수율을, 인풋의 값(어세이에 반입한 화합물 nk06 혹은 화합물 nk07의 양)으로 나눈 회수율을 이하의 식으로부터 산출하고, 표 6에 정리했다.
회수율(%)=회수된 핵산량/인풋의 핵산량×100
결과, 화합물 nk06, Hisx6-FKBP12-Link12-GFP11, GFP10-Link12-FRB-Hisx6, 및 비오틴화 GFP1-9의 모든 것이 갖추어진 조건(조건 1)에서만 회수율이 높았다. 이것으로부터, 비오틴화 GFP1-9를 개재시켜 화합물 nk06이 회수되기 위해서는, Hisx6-FKBP12-Link12-GFP11 및 GFP10-Link12-FRB-Hisx6의 양방이 존재할 것이 필요하고, GFP 시스템을 사용함으로써 라파마이신과 같이 2종의 단백질의 상호작용을 촉진할 수 있는 분자를 선택적으로 취득하는 것이 가능하다는 것이 시사되었다.
라파마이신은, FKBP12 단백질에는 Kd=12nM 정도의 결합력을 나타내는 것이 알려져 있지만(J Am Chem Soc. 2005;127:4715-21), GFP10-Link12-FRB-Hisx6이 존재하지 않는 조건에서는, 라파마이신은 회수되지 않았다(조건 2). 실시예 2의 결과와 합하면, GFP10과 GFP11의 각각에 다른 표적 단백질을 연결시키면, 이들 표적 단백질과의 3자 복합체를 형성할 수 있는 시험 화합물을 선택적으로 회수할 수 있고, 어느 표적 단백질만과 복합체를 형성할 수 있는 시험 화합물은 회수되지 않는 것이 나타났다.
실시예 4 GFP 이외의 단백질의 응용예
다음으로, GFP 이외의 분자에서도, 시험 화합물을 개재시킨 근접 효과에 의해 표적 단백질을 회수하는 것이 가능한지 검증했다. 사용한 단백질은, 인간 O6-alkylguanine-DNA alkyltransferase(hAGT)를 개변해서 작성되고, 벤질구아닌 유도체가 특이적 반응 이질이 되는 SNAP 태그, 모노유비퀴틴, 및 심해 새우(Oplophorus gracilirostris) 유래의 루시페라아제, Nanoluc(등록상표)이다.
실시예 4-1 mRNA Display를 이용한 splitSNAP-tag의 재회합 어세이
split SNAP-tag는, SNAP-tag를 91번째와 92번째의 잔기 사이에서 분할한 단백질이고, 양자가 근접하는 것에 의해 효소 활성이 회복하기 때문에 세포내에서의 PPI의 이미징에 이용되고 있다.
이 성질을 응용하여, split SNAP-tag의 N 말단 분자, 혹은 split SNAP-tag의 C 말단 분자만으로는, 비오틴 수식된 SNAP-tag 기질(SNAP-Biotin)과는 반응하지 않고, 전장체만이 반응할 수 있어, 이에 의해 전장체의 선택적인 회수가 가능한지 여부를 검증하기 위한 실험을 행했다.
실시예 4-1-1 주형 DNA의 합성
pSNAPf vector(New ENGLAND BioLabs사)를 주형으로 하고, C 말단에 GS 링커가 부가된 SNAP 태그 N 말단 단편, C 말단에 GS 링커가 부가된 SNAP 태그 C 말단 단편, C 말단에 GS 링커가 부가된 전장 SNAP 태그를 각각 코드하는 DNA 서열(서열 번호: 23(D-9)∼서열 번호: 25(D-11))을 PCR에 의해 조제했다. 한편, 본 실시예에서는, C 말단에 GS 링커가 부가된 SNAP-tagN 말단 단편을 SNAP(N)과, C 말단에 GS 링커가 부가된 SNAP-tagC 말단 단편을 SNAP(C), C 말단에 GS 링커가 부가된 전장 SNAP 태그를 SNAP(full)이라고 표기하는 경우가 있다.
C 말단에 GS 링커가 부가된 SNAP 태그 N 말단 단편을 코드하는 DNA(서열 번호: 23(D-9))의 조제는, 하기의 프라이머를 이용하여 2단계의 PCR을 실시하는 것에 의해 행했다.
1st PCR에 있어서는, pSNAPf vector(New ENGLAND BioLabs사)를 주형으로 하고, Fw-primer(서열 번호: 7), Rv-primer(서열 번호: 8)를 이용했다.
2nd PCR에 있어서는, 1st PCR 산물을 주형으로 하고, Fw-primer(서열 번호: 9), Rv-primer(서열 번호: 10)를 이용하여 PCR을 행함으로써 목적하는 DNA 서열(서열 번호: 23(D-9))을 얻었다.
DNA 서열 번호: 23(D-9)
DNA 서열: SNAP(N)
GGCGTAATACGACTCACTATAGGGTTAACTTTAATAAGGAGATATAAATATGGACAAAGACTGCGAAATGAAGCGCACCACCCTGGATAGCCCTCTGGGCAAGCTGGAACTGTCTGGGTGCGAACAGGGCCTGCACCGTATCATCTTCCTGGGCAAAGGAACATCTGCCGCCGACGCCGTGGAAGTGCCTGCCCCAGCCGCCGTGCTGGGCGGACCAGAGCCACTGATGCAGGCCACCGCCTGGCTCAACGCCTACTTTCACCAGCCTGAGGCCATCGAGGAGTTCCCTGTGCCAGCCCTGCACCACCCAGTGTTCCAGCAGGGCTCTGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA
C 말단에 GS 링커가 부가된 SNAP 태그 C 말단 단편을 코드하는 DNA(서열 번호: 24(D-10))의 조제는, 하기의 프라이머를 이용하여 2단계의 PCR을 실시하는 것에 의해 행했다.
1st PCR에 있어서는, pSNAPf vector(New ENGLAND BioLabs사)를 주형으로 하고, Fw-primer(서열 번호: 11), Rv-primer(서열 번호: 12)를 이용했다.
2nd PCR에 있어서는, 1st PCR 산물을 주형으로 하고, Fw-primer(서열 번호: 9), Rv-primer(서열 번호: 10)를 이용하여 PCR을 행함으로써 목적하는 DNA 서열(서열 번호: 24(D-10))을 얻었다.
DNA 서열 번호: 24(D-10)
DNA 서열: SNAP(C)
GGCGTAATACGACTCACTATAGGGTTAACTTTAATAAGGAGATATAAATATGGTCGACGAGAGCTTTACCCGCCAGGTGCTGTGGAAACTGCTGAAAGTGGTGAAGTTCGGAGAGGTCATCAGCTACAGCCACCTGGCCGCCCTGGCCGGCAATCCCGCCGCCACCGCCGCCGTGAAAACCGCCCTGAGCGGAAATCCCGTGCCCATTCTGATCCCCTGCCACCGGGTGGTGCAGGGCGACCTGGACGTGGGGGGCTACGAGGGCGGGCTCGCCGTGAAAGAGTGGCTGCTGGCCCACGAGGGCCACAGACTGGGCAAGCCTGGGCTGGGTCCTGCAGGCGGATCCGCGTTTAAACTCGAGGTTAATGGCTCTGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA
C 말단에 GS 링커가 부가된 전장 SNAP 태그를 코드하는 DNA(서열 번호: 25(D-11))의 조제는, 하기의 프라이머를 이용하여 2단계의 PCR을 실시하는 것에 의해 행했다.
1st PCR에 있어서는, pSNAPf vector(New ENGLAND BioLabs사)를 주형으로 하고, Fw-primer(서열 번호: 7), Rv-primer(서열 번호: 12)를 이용했다.
2nd PCR에 있어서는, 1st PCR 산물을 주형으로 하고, Fw-primer(서열 번호: 9), Rv-primer(서열 번호: 10)를 이용하여 PCR을 행함으로써 목적하는 DNA 서열(서열 번호: 25(D-11))을 얻었다.
DNA 서열 번호: 25(D-11)
DNA 서열: SNAP(full)
GGCGTAATACGACTCACTATAGGGTTAACTTTAATAAGGAGATATAAATATGGACAAAGACTGCGAAATGAAGCGCACCACCCTGGATAGCCCTCTGGGCAAGCTGGAACTGTCTGGGTGCGAACAGGGCCTGCACCGTATCATCTTCCTGGGCAAAGGAACATCTGCCGCCGACGCCGTGGAAGTGCCTGCCCCAGCCGCCGTGCTGGGCGGACCAGAGCCACTGATGCAGGCCACCGCCTGGCTCAACGCCTACTTTCACCAGCCTGAGGCCATCGAGGAGTTCCCTGTGCCAGCCCTGCACCACCCAGTGTTCCAGCAGGAGAGCTTTACCCGCCAGGTGCTGTGGAAACTGCTGAAAGTGGTGAAGTTCGGAGAGGTCATCAGCTACAGCCACCTGGCCGCCCTGGCCGGCAATCCCGCCGCCACCGCCGCCGTGAAAACCGCCCTGAGCGGAAATCCCGTGCCCATTCTGATCCCCTGCCACCGGGTGGTGCAGGGCGACCTGGACGTGGGGGGCTACGAGGGCGGGCTCGCCGTGAAAGAGTGGCTGCTGGCCCACGAGGGCCACAGACTGGGCAAGCCTGGGCTGGGTCCTGCAGGCGGATCCGCGTTTAAACTCGAGGTTAATGGCTCTGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA
실시예 4-1-2 mRNA의 합성
주형 DNA(서열 번호: 23(D-9)∼서열 번호: 25(D-11))로부터, T7 RNA polymerase를 이용한 in vitro 전사 반응에 의해 mRNA(서열 번호: 33(mR-5)∼서열 번호: 35(mR-7))를 합성하고, RNeasy kit(Qiagen사)에 의해 정제했다.
mRNA 서열 번호: 33(mR-5)
RNA 서열: SNAP(N)_A7_mRNA
GGGUUAACUUUAAUAAGGAGAUAUAAAUAUGGACAAAGACUGCGAAAUGAAGCGCACCACCCUGGAUAGCCCUCUGGGCAAGCUGGAACUGUCUGGGUGCGAACAGGGCCUGCACCGUAUCAUCUUCCUGGGCAAAGGAACAUCUGCCGCCGACGCCGUGGAAGUGCCUGCCCCAGCCGCCGUGCUGGGCGGACCAGAGCCACUGAUGCAGGCCACCGCCUGGCUCAACGCCUACUUUCACCAGCCUGAGGCCAUCGAGGAGUUCCCUGUGCCAGCCCUGCACCACCCAGUGUUCCAGCAGGGCUCUGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA
mRNA 서열 번호: 34(mR-6)
RNA 서열: SNAP(C)_A7_mRNA
GGGUUAACUUUAAUAAGGAGAUAUAAAUAUGGUCGACGAGAGCUUUACCCGCCAGGUGCUGUGGAAACUGCUGAAAGUGGUGAAGUUCGGAGAGGUCAUCAGCUACAGCCACCUGGCCGCCCUGGCCGGCAAUCCCGCCGCCACCGCCGCCGUGAAAACCGCCCUGAGCGGAAAUCCCGUGCCCAUUCUGAUCCCCUGCCACCGGGUGGUGCAGGGCGACCUGGACGUGGGGGGCUACGAGGGCGGGCUCGCCGUGAAAGAGUGGCUGCUGGCCCACGAGGGCCACAGACUGGGCAAGCCUGGGCUGGGUCCUGCAGGCGGAUCCGCGUUUAAACUCGAGGUUAAUGGCUCUGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA
mRNA 서열 번호: 35(mR-7)
RNA 서열: SNAP(full)_A7_mRNA
GGGUUAACUUUAAUAAGGAGAUAUAAAUAUGGACAAAGACUGCGAAAUGAAGCGCACCACCCUGGAUAGCCCUCUGGGCAAGCUGGAACUGUCUGGGUGCGAACAGGGCCUGCACCGUAUCAUCUUCCUGGGCAAAGGAACAUCUGCCGCCGACGCCGUGGAAGUGCCUGCCCCAGCCGCCGUGCUGGGCGGACCAGAGCCACUGAUGCAGGCCACCGCCUGGCUCAACGCCUACUUUCACCAGCCUGAGGCCAUCGAGGAGUUCCCUGUGCCAGCCCUGCACCACCCAGUGUUCCAGCAGGAGAGCUUUACCCGCCAGGUGCUGUGGAAACUGCUGAAAGUGGUGAAGUUCGGAGAGGUCAUCAGCUACAGCCACCUGGCCGCCCUGGCCGGCAAUCCCGCCGCCACCGCCGCCGUGAAAACCGCCCUGAGCGGAAAUCCCGUGCCCAUUCUGAUCCCCUGCCACCGGGUGGUGCAGGGCGACCUGGACGUGGGGGGCUACGAGGGCGGGCUCGCCGUGAAAGAGUGGCUGCUGGCCCACGAGGGCCACAGACUGGGCAAGCCUGGGCUGGGUCCUGCAGGCGGAUCCGCGUUUAAACUCGAGGUUAAUGGCUCUGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA
실시예 4-1-3 mRNA Display에 의한 재회합 어세이
WO2013/100132에 기재된 방법으로, 상기에서 정제한 mRNA의 3' 말단에 링커를 개재시켜 퓨로마이신을 연결하고, 이것을 번역하는 것에 의해 mRNA-펩타이드의 Display 분자를 조제했다. 번역계는, 원핵생물 유래의 재구성 무세포 단백질 합성계인 PUREfrex2.0(GeneFrontier사)을 이용하여, 부속의 프로토콜의 조성에 따라 번역했다.
각 Display 분자의 제시율을 확인하기 위해서, RNaseONE(Promega)에 의해 RNA 부분을 분해하고, TricinePAGE에서, 영동 분리했다. Display 분자를 형성하고 있는 경우는 번역 펩타이드와 퓨로마이신 링커의 연결체가 되고, Display 분자를 형성하고 있지 않는 경우는 번역 펩타이드의 결합하고 있지 않는 링커만이 되어, 전자보다도 낮은 위치에 검출되어, 합계 2개의 밴드가 검출된다. 그 밴드비로부터, 전술한 식에 따라 Display 분자의 제시율(%)을 계산했다. RNaseONE에 의한 구체적인 반응액은, 1xReaction buffer, 0.84μM 연결체, 0.5U/μL RNaseONE을 혼합하고, 37℃에서 1시간 반응시켰다.
TricinePAGE의 검출은, 형광 표지한 퓨로마이신 링커를 검출했다. TricinePAGE의 결과 얻어진 제시율은 표 7과 같이 되었다.
mRNA 부분에서의 결합을 회피하기 위해서, mRNA 부위의 역전사를 행했다. 1xM-MLV RT Reaction buffer(Promega, #368B), 0.5mM dNTP, 8U/μL M-MLV RT (H-) Point Mutant(Promega, #368B), 3μM Rv-primer(서열 번호: 5), 0.5μM 번역 산물이 되도록 혼합하고, 42℃에서 1시간 반응시켰다.
각 Display 분자 단독, 또는 SNAP(N)의 Display 분자와 SNAP(C)의 Display 분자를 등량 혼합한 mixture를, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중, 4℃에서 30분 정치했다. 이 용액에, 1/4양의 5mM DTT, 2500nM의 SNAP-Biotin(New ENGLAND BioLabs사)의 PBS 용액을 가하고, 37℃에서 30분 효소 반응을 행했다.
Streptavidin 코팅 자기 비즈를 이용한 풀다운에 의해, 효소 반응에 의해 비오틴화된 Display 분자 혹은 미반응의 SNAP-Biotin을 회수하고, tTBS(나카라이 테스크)로 수회 세정 후, 정제수를 가하고 95℃에서 5분간 인큐베이트하여 핵산의 용출을 행했다.
반응 후, 상청을 회수하고, 상보성을 가지는 primer(Fw-primer(서열 번호: 99), Rv-primer(서열 번호: 10)로 qPCR을 걸었다. qPCR의 반응액은, 1xEx taq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, #50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 55℃ 20초, 72℃ 60초 사이클을 50사이클 반복했다.
각 서열에서 검량선을 긋기 위해서, 셀렉션 전에 조제한 각 Display 분자(인풋)를 핵산량으로, 1E+8/μL, 1E+6/μL, 1E+4/μL가 되도록 희석하고, 마찬가지의 조건의 qPCR에 걸었다.
SNAP-Biotin과의 반응과, 그것에 이어지는 Streptavidin 코팅 자기 비즈를 이용한 풀다운에 의해 회수된 각 Display 분자의 핵산량을, 반응계 중에 가한 핵산의 이론량으로 나눔으로써 겉보기의 회수율(겉보기의 회수율(%)=회수된 핵산량/가한 핵산량의 이론치×100)을 산출하고, 추가로 제시율로 보정한 「회수율」(회수율(%)=회수된 핵산량/(가한 핵산량의 이론치×제시율×0.01)×100)을, 표 8에 정리했다.
결과, SNAP(full)을 제시한 클론은 SNAP-Biotin의 존재하만 효율적으로 회수되고, 그 밖의 컨트롤과 비교해서 적어도 50배 이상 회수율이 높은 것이 분명해졌다.
이 결과로부터, SNAP(N)을 어떤 표적 단백질에 결합시킨 분자, SNAP(C)를 다른 표적 단백질에 결합시킨 분자, 및 SNAP-Biotin을 사용하면, GFP와 마찬가지로, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자의 효율적인 스크리닝이 가능해지는 것이 나타났다.
실시예 4-2 mRNA Display를 이용한 splitUbiquitin의 재회합 어세이
split 유비퀴틴은 세포내의 단백질간 상호작용 해석에 이용되는 툴이고, 유비퀴틴의 13번째의 Ile를 Ala로 치환(I13A)함으로써, N 말단 분자와 C 말단측 분자가 자연히 회합하지 않는 것이 보고되어 있다.
전술한 대로, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자를 라이브러리로부터 스크리닝하는 경우, 1개의 표적 분자만과 복합체를 형성하는 피험 분자의 회수율을 낮게 억제한 계가 필요해진다. split 유비퀴틴을 이 스크리닝에 이용할 수 있는지를 검증하기 위해서, split 유비퀴틴 N 말단 분자, 혹은 split 유비퀴틴 C 말단 분자만으로는, 항유비퀴틴 항체에 결합하지 않고, 전장체로만 상기 항체에 결합하는 것의 검증 실험을 행했다. 유비퀴틴의 I13A 변이체를 실험에 이용했다. 한편, 본 실시예에서는, C 말단에 GS 링커가 부가된 유비퀴틴 N 말단 단편을 splitUb(N)과, C 말단에 GS 링커가 부가된 유비퀴틴 C 말단 단편을 splitUb(C), splitUb(N)과 splitUb(C)가 GSGS 링커로 연결되고, C 말단에 GS 링커가 부가된 단백질을 splitUb(N-C)라고 표기하는 경우가 있다.
실시예 4-2-1 mRNA의 합성
주형 DNA(서열 번호: 26(D-12)∼서열 번호: 28(D-14))로부터, T7 RNA polymerase를 이용한 in vitro 전사 반응에 의해 mRNA(서열 번호: 36(mR-8)∼서열 번호: 38(mR-10))를 합성하고, RNeasy kit(Qiagen사)에 의해 정제했다.
주형 DNA 서열 번호: 26(D-12)
DNA 서열: splitUb(N)
GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGATGCAGATCTTCGTGAAGACCCTGACCGGCAAGACCGCCACTCTGGAGGTGGAGCCCAGTGACACCATCGAAAATGTGAAGGCCAAGATCCAAGATAAAGAAGGCATCCCCGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA
주형 DNA 서열 번호: 27(D-13)
DNA 서열: splitUb(C)
GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGGGCATCCCCCCCGACCAGCAGAGGCTCATCTTTGCAGGCAAGCAGCTGGAAGATGGCCGCACTCTTTCTGACTACAACATCCAGAAAGAGTCGACCCTGCACCTGGTCCTGCGCCTGAGGGGTGGCGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA
주형 DNA 서열 번호: 28(D-14)
DNA 서열: splitUb(N-C)
GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGATGCAGATCTTCGTGAAGACCCTGACCGGCAAGACCGCCACTCTGGAGGTGGAGCCCAGTGACACCATCGAAAATGTGAAGGCCAAGATCCAAGATAAAGAAGGCATCCCCGGCTCTGGCTCTGGCATCCCCCCCGACCAGCAGAGGCTCATCTTTGCAGGCAAGCAGCTGGAAGATGGCCGCACTCTTTCTGACTACAACATCCAGAAAGAGTCGACCCTGCACCTGGTCCTGCGCCTGAGGGGTGGCGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA
mRNA 서열 번호: 36(mR-8)
RNA 서열: splitUb(N)
GGGUUAACUUUAAGAAGGAGAUAUACAUAUGAUGCAGAUCUUCGUGAAGACCCUGACCGGCAAGACCGCCACUCUGGAGGUGGAGCCCAGUGACACCAUCGAAAAUGUGAAGGCCAAGAUCCAAGAUAAAGAAGGCAUCCCCGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA
mRNA 서열 번호: 37(mR-9)
RNA 서열: splitUb(C)
GGGUUAACUUUAAGAAGGAGAUAUACAUAUGGGCAUCCCCCCCGACCAGCAGAGGCUCAUCUUUGCAGGCAAGCAGCUGGAAGAUGGCCGCACUCUUUCUGACUACAACAUCCAGAAAGAGUCGACCCUGCACCUGGUCCUGCGCCUGAGGGGUGGCGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA
mRNA 서열 번호: 38(mR-10)
RNA 서열: splitUb(N-C)
GGGUUAACUUUAAGAAGGAGAUAUACAUAUGAUGCAGAUCUUCGUGAAGACCCUGACCGGCAAGACCGCCACUCUGGAGGUGGAGCCCAGUGACACCAUCGAAAAUGUGAAGGCCAAGAUCCAAGAUAAAGAAGGCAUCCCCGGCUCUGGCUCUGGCAUCCCCCCCGACCAGCAGAGGCUCAUCUUUGCAGGCAAGCAGCUGGAAGAUGGCCGCACUCUUUCUGACUACAACAUCCAGAAAGAGUCGACCCUGCACCUGGUCCUGCGCCUGAGGGGUGGCGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA
실시예 4-2-2 mRNA Display에 의한 재회합 어세이
WO2013/100132에 기재된 방법으로, 상기에서 정제한 mRNA의 3' 말단에 링커를 개재시켜 퓨로마이신을 연결하고, 이것을 번역하는 것에 의해 mRNA-펩타이드의 Display 분자를 조제했다. 번역계는, 원핵생물 유래의 재구성 무세포 단백질 합성계인 PUREfrex2.0(GeneFrontier사)을 이용하여, 부속의 프로토콜의 조성에 따라 번역했다.
각 Display 분자의 제시율을 확인하기 위해서, RNaseONE(Promega)에 의해 RNA 부분을 분해하고, TricinePAGE에서, 영동 분리했다. Display 분자를 형성하고 있는 경우는 번역 펩타이드와 퓨로마이신 링커의 연결체가 되고, Display 분자를 형성하고 있지 않는 경우는 번역 펩타이드의 결합하고 있지 않는 링커만이 되어, 전자보다도 낮은 위치에 검출되어, 합계 2개의 밴드가 검출된다. 그 밴드비로부터, 전술한 식에 따라 Display 분자의 제시율(%)을 계산했다. RNaseONE에 의한 구체적인 반응액은, 1xReaction buffer, 0.42μM 연결체, 0.5U/μL RNaseONE을 혼합하고, 37℃에서 1시간 반응시켰다.
각 Display 분자의 제시율을 확인하는 경우는, 형광 표지한 퓨로마이신 링커를 이용하고 있어, 형광 검출치를 평가했다. Tricine PAGE의 결과 얻어진 제시율은 표 9와 같이 되었다.
mRNA 부분에서의 결합을 회피하기 위해서, mRNA 부위의 역전사를 행했다. 1xM-MLV RT Reaction buffer(Promega, #368B), 0.5mM dNTP, 8U/μL M-MLV RT (H-) Point Mutant(Promega, #368B), 3μM Rv-primer(서열 번호: 5), 0.5μM 번역 산물이 되도록 혼합하고, 42℃에서 1시간 반응시켰다.
번역 조제한 각 Display 분자를, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, 항유비퀴틴 항체(Mouse IgG1 모노클로날 항체; 클론명 FK2) 고정 비즈인, Anti-Multi Ubiquitin mAb-Magnetic Beads(MBL사, #D058-11)와 혼합하고, 실온에서 1시간 반응시켰다.
유비퀴틴 N 말단 단편과 C 말단 단편이 독립할 때의 상호작용도 함께 평가하기 위해, splitUb(N)의 디스플레이 분자와 splitUb(C)의 Display 분자를 1:1로 혼합한 조건도 이와 마찬가지로 행했다.
상청을 제거하고, tTBS(나카라이 테스크)로 수회 세정 후, 상청과 등량의 용출 buffer(1xEx taq buffer, 0.2mM dNTP)를 가하여 현탁하고, 95℃에서 10분간 가열하여, 핵산을 용출했다. 상청을 회수하고, 상보성을 가지는 primer(Fw-primer(서열 번호: 4), Rv-primer(서열 번호: 5))로 qPCR을 걸었다. qPCR의 반응액은, 1xEx taq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, #50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 57℃ 20초, 72℃ 30초 사이클을 40사이클 반복했다. 항유비퀴틴 항체 고정 비즈와 반응시키기 전의 각 Display 분자도 마찬가지로 qPCR을 행하여, 인풋의 핵산량을 산출했다.
각 서열에서 검량선을 긋기 위해서, 핵산량으로, 1E+8/μL, 1E+6/μL, 1E+4/μL가 되도록 희석하고, 마찬가지의 조건의 qPCR에 걸었다.
항유비퀴틴 항체와의 결합에 의해 회수된 각 Display 분자의 핵산량을, 반응계 중과 혼합하기 전에 존재하고 있던 각 Display 분자의 핵산량(인풋의 값)으로 나눈 겉보기의 회수율을 산출하고, 추가로 제시율로 보정한 회수율을 표 10에 정리했다.
겉보기의 회수율(%)=회수된 핵산량/인풋의 핵산량×100
회수율(%)=회수된 핵산량/(인풋의 핵산량×각 제시율×0.01)×100
결과, splitUb(N-C)의 존재하에서는 효율적으로 회수되고, 그 밖의 컨트롤과 비교해서 적어도 16배 이상 회수율이 높은 것이 분명해졌다.
이 결과로부터, split 유비퀴틴(I13A)의 N 말단 분자를 어떤 표적 단백질에 결합시킨 분자, split 유비퀴틴의 C 말단 분자를 다른 표적 단백질에 결합시킨 분자, 및 항유비퀴틴 항체를 사용하면, GFP와 마찬가지로, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자의 효율적인 스크리닝이 가능해지는 것이 나타났다.
실시예 4-3 전하 펩타이드의 상호작용을 이용한 splitUbiquitin의 재회합 어세이
다음으로, splitUb(N)과 splitUb(C)에 각각 전하를 가진 펩타이드 서열(플러스의 전하를 가지는 아미노산을 많이 포함하는 K-peptide(「Kpep」라고 표기하는 경우도 있다.), 혹은 마이너스의 전하를 가지는 아미노산을 많이 포함하는 E-peptide(「Epep」라고 표기하는 경우도 있다.))를 부가한 컨스트럭트(서열 번호: 55(P-11)∼서열 번호: 57(P-13))로 이루어지는 Display 분자를 조제했다. 부가한 펩타이드끼리가 전하에 의해 서로 끌어당기면 splitUb끼리가 근접해서 항유비퀴틴 항체로 회수되고, 반대로 전하에 의해 서로 반발하면 회수되지 않는다. 이것이 검증되면, splitUb에 부가된 분자끼리의 복합체 형성을, 유비퀴틴과 항유비퀴틴 항체를 개재시킨 회수율로 평가하는 것이 가능해진다.
실시예 4-3-1 mRNA의 합성
주형 DNA(서열 번호: 49(D-15)∼서열 번호: 51(D-17))로부터, T7 RNA polymerase를 이용한 in vitro 전사 반응에 의해 mRNA(서열 번호: 52(mR-11)∼서열 번호: 54(mR-13))를 합성하고, RNeasy kit(Qiagen사)에 의해 정제했다.
주형 DNA 서열 번호: 49(D-15)
DNA 서열: Kpep-splitUb(N)
GTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGAAAGTGAGCGCGCTGAAAGAAAACGTGAGCGCCCTGAAAGAAAAAGTGAGCGCGCTGACCGAAAAAGTGAGCGCGCTGAAAGAGAAAGTGAGCGCGCTGAAAGAAGGCTCTGGCTCTGGCTCTGGCTCTATGCAGATCTTCGTGAAGACCCTGACCGGCAAGACCGCCACTCTGGAGGTGGAGCCCAGTGACACCATCGAAAATGTGAAGGCCAAGATCCAAGATAAAGAAGGCATCCCCGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA
주형 DNA 서열 번호: 50(D-16)
DNA 서열: Epep-splitUb(N)
GTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGAAAGTGAGCGCGCTGGAAAACGAAGTGAGCGCGCTGGAAAAAGAAGTGAGCGTGCTGGAAAAAGAAGTGAGCGCGCTGGAAAAAGAAGTGCGCGCGCTGGAAAAAGGCTCTGGCTCTGGCTCTGGCTCTATGCAGATCTTCGTGAAGACCCTGACCGGCAAGACCGCCACTCTGGAGGTGGAGCCCAGTGACACCATCGAAAATGTGAAGGCCAAGATCCAAGATAAAGAAGGCATCCCCGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA
주형 DNA 서열 번호: 51(D-17)
DNA 서열: Epep-splitUb(C)
GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGGGCATCCCCCCCGACCAGCAGAGGCTCATCTTTGCAGGCAAGCAGCTGGAAGATGGCCGCACTCTTTCTGACTACAACATCCAGAAAGAGTCGACCCTGCACCTGGTCCTGCGCCTGAGGGGTGGCGGCTCTGGCTCTGGCTCTGGCTCTAAAGTGAGCGCGCTGGAAAACGAAGTGAGCGCGCTGGAAAAAGAAGTGAGCGTGCTGGAAAAAGAAGTGAGCGCGCTGGAAAAAGAAGTGCGCGCGCTGGAAAAAGGCTCTGGCTCTGGCTCTGGCTCTAAAAAAA
mRNA 서열 번호: 52(mR-11)
RNA 서열: Kpep-splitUb(N)
GGGUUAACUUUAAGAAGGAGAUAUACAUAUGAAAGUGAGCGCGCUGAAAGAAAACGUGAGCGCCCUGAAAGAAAAAGUGAGCGCGCUGACCGAAAAAGUGAGCGCGCUGAAAGAGAAAGUGAGCGCGCUGAAAGAAGGCUCUGGCUCUGGCUCUGGCUCUAUGCAGAUCUUCGUGAAGACCCUGACCGGCAAGACCGCCACUCUGGAGGUGGAGCCCAGUGACACCAUCGAAAAUGUGAAGGCCAAGAUCCAAGAUAAAGAAGGCAUCCCCGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA
mRNA 서열 번호: 53(mR-12)
RNA 서열: Epep-splitUb(N)
GGGUUAACUUUAAGAAGGAGAUAUACAUAUGAAAGUGAGCGCGCUGGAAAACGAAGUGAGCGCGCUGGAAAAAGAAGUGAGCGUGCUGGAAAAAGAAGUGAGCGCGCUGGAAAAAGAAGUGCGCGCGCUGGAAAAAGGCUCUGGCUCUGGCUCUGGCUCUAUGCAGAUCUUCGUGAAGACCCUGACCGGCAAGACCGCCACUCUGGAGGUGGAGCCCAGUGACACCAUCGAAAAUGUGAAGGCCAAGAUCCAAGAUAAAGAAGGCAUCCCCGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA
mRNA 서열 번호: 54(mR-13)
RNA 서열: Epep-splitUb(C)
GGGUUAACUUUAAGAAGGAGAUAUACAUAUGGGCAUCCCCCCCGACCAGCAGAGGCUCAUCUUUGCAGGCAAGCAGCUGGAAGAUGGCCGCACUCUUUCUGACUACAACAUCCAGAAAGAGUCGACCCUGCACCUGGUCCUGCGCCUGAGGGGUGGCGGCUCUGGCUCUGGCUCUGGCUCUAAAGUGAGCGCGCUGGAAAACGAAGUGAGCGCGCUGGAAAAAGAAGUGAGCGUGCUGGAAAAAGAAGUGAGCGCGCUGGAAAAAGAAGUGCGCGCGCUGGAAAAAGGCUCUGGCUCUGGCUCUGGCUCUAAAAAAA
실시예 4-3-2 mRNA Display에 의한 재회합 어세이
WO2013/100132에 기재된 방법으로, 상기에서 정제한 mRNA의 3' 말단에 링커를 개재시켜 퓨로마이신을 연결하고, 이것을 번역하는 것에 의해 mRNA-펩타이드의 Display 분자를 조제했다. 번역계는, 원핵생물 유래의 재구성 무세포 단백질 합성계인 PUREfrex2.0(GeneFrontier사)을 이용하여, 부속의 프로토콜의 조성에 따라 번역했다.
각 Display 분자의 제시율을 확인하기 위해서, RNaseONE(Promega)에 의해 RNA 부분을 분해하고, TricinePAGE에서, 영동 분리했다. Display 분자를 형성하고 있는 경우는 번역 펩타이드와 퓨로마이신 링커의 연결체가 되고, Display 분자를 형성하고 있지 않는 경우는 번역 펩타이드의 결합하고 있지 않는 링커만이 되어, 전자보다도 낮은 위치에 검출되어, 합계 2개의 밴드가 검출된다. 그 밴드비로부터, 전술한 식에 따라 Display 분자의 제시율(%)을 계산했다. RNaseONE에 의한 구체적인 반응액은, 1xReaction buffer, 0.42μM 연결체, 0.5U/μL RNaseONE을 혼합하고, 37℃에서 1시간 반응시켰다.
각 Display 분자의 제시율을 확인하는 경우는, 형광 표지한 퓨로마이신 링커를 이용하여, 형광 검출치를 평가했다. TricinePAGE의 결과 얻어진 제시율은 표 11과 같이 되었다.
mRNA 부분에서의 결합을 회피하기 위해서, mRNA 부위의 역전사를 행했다. 1xM-MLV RT Reaction buffer(Promega, #368B), 0.5mM dNTP, 8U/μL M-MLV RT (H-) Point Mutant(Promega, #368B), 3μM Rv-primer(서열 번호: 5), 0.5μM 번역 산물이 되도록 혼합하고, 42℃에서 1시간 반응시켰다.
조건 1에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, Kpep-splitUb(N)의 Display 분자, Epep-splitUb(C)의 Display 분자를 각각 0.2μM이 되도록 가하고, 실온에서 1시간 반응시켰다.
조건 2에서는 Epep-splitUb(N)의 Display 분자, Epep-splitUb(C)의 Display 분자를 각각 0.2μM, 조건 3에서는 Kpep-splitUb(N)의 Display 분자를 0.4μM, 조건 4에서는 Epep-splitUb(N)의 Display 분자를 0.4μM, 조건 5에서는 Epep-splitUb(C)의 Display 분자를 0.4μM이 되도록 가한 점을 제외하고, 조건 1과 마찬가지의 조건에서 반응시켰다.
항유비퀴틴 항체 고정 비즈인, Anti-Multi Ubiquitin mAb-Magnetic(MBL사, #D058-11)과 혼합하고, 실온에서 30분 반응시켰다.
상청을 제거하고, tTBS(나카라이 테스크)로 수회 세정 후, 상청과 등량의 용출 buffer(1xEx taq buffer, 0.2mM dNTP)를 가하여 현탁하고, 95℃에서 5분간 가열하여, 핵산을 용출했다. 상청을 회수하고, 상보성을 가지는 primer(Fw-primer(서열 번호: 4), Rv-primer(서열 번호: 5))로 qPCR을 걸었다. qPCR의 반응액은, 1xEx taq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, #50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 57℃ 20초, 72℃ 30초 사이클을 40사이클 반복했다. 항유비퀴틴 항체 고정 비즈와 반응시키기 전의 각 Display 분자도 마찬가지로 qPCR을 행하여, 인풋의 핵산량을 산출했다.
각 서열에서 검량선을 긋기 위해서, 핵산량으로, 1E+8/μL, 1E+6/μL, 1E+4/μL가 되도록 희석하고, 마찬가지의 조건의 qPCR에 걸었다.
항유비퀴틴 항체에 의해 회수된, 핵산의 회수율을, 인풋의 값(어세이에 반입한 Display 분자의 양)으로 나눈 회수율을 이하의 식으로부터 산출하고, 표 12에 정리했다.
겉보기의 회수율(%)=회수된 핵산량/인풋의 핵산량×100
회수율(%)=회수된 핵산량/(인풋의 핵산량×각 제시율×0.01)×100
결과, Kpep-splitUb(N)과 Epep-splitUb(C)가 갖추어진 조건(조건 1)에서만 회수율이 높았다. 이것으로부터, splitUb(N)과 splitUb(C)에 부가된 분자끼리가 상호작용하여, 복합체를 형성하는 경우만, splitUb(N)과 splitUb(C)가 근접하여, 항유비퀴틴 항체에 의해, 회수할 수 있는 것이 증명되었다.
실시예 4-4 mRNA Display를 이용한 split Nanoluc의 재회합 어세이
Nanoluc는 10개의 β 스트랜드로 이루어지는 발광 단백질이고, 이것을 1-8번째의 β 스트랜드, 9번째의 β 스트랜드, 10번째의 β 스트랜드로 3분할하여, 친화성을 조정함으로써, PPI를 발광으로 검출하기 위한 split Nanoluc 시스템이 보고되어 있다. 본 시스템에서는 전술한 split GFP 시스템과 마찬가지로, PPI를 검출하고자 하는 2종류의 단백질에 대해, 9번째의 스트랜드 및 10번째의 스트랜드를 결합시킨다. 9번째 내지 10번째의 스트랜드 단체와 1-8번째의 스트랜드를 혼합해서 기질을 가해도 발광은 관측할 수 없는 한편, 이 2개의 단백질이 근접했을 때만 나머지1-8번째의 β 스트랜드와 복합체를 형성하고, 기질을 첨가함으로써 발광을 관측할 수 있기 때문에, wash free의 ELISA 등으로의 이용이 이루어지고 있다. 한편으로, 9번째 및 10번째의 스트랜드 단체가 1-8번째의 스트랜드와 어느 정도 결합할지에 관해서는 분명해져 있지 않아, 선택적 풀다운에 이용할 수 있을지는 검증이 필요했다.
그래서, 9번째와 10번째의 스트랜드를 링커로 연결한 분자는 1-8번째의 스트랜드를 이용함으로써 풀다운 가능한 한편, 9번째 내지 10번째의 스트랜드 단체, 내지 이 양자를 단순히 혼합한 경우에는 1-8번째의 스트랜드에서는 풀다운할 수 없는 것을 검증했다. 이 가설이 검증되면, 목적물의 선택적 풀다운이 가능해진다. 한편, 본 실시예에서는, N 말단에 Avi 태그 서열 및 His 태그 서열이 부가된 Nanoluc의 1-8번째의 스트랜드를 splitNanoluc1-8, C 말단에 GS 링커 및 TEV 프로테아제 인식 서열이 부가된 9번째의 스트랜드를 splitNanoluc-9, C 말단에 GS 링커 및 TEV 프로테아제 인식 서열이 부가된 10번째의 스트랜드를 splitNanoluc-10, splitNanoluc-9와 splitNanoluc-10이 GS 링커로 연결되고, C 말단에 GS 링커 및 TEV 프로테아제 인식 서열이 부가된 단백질을 splitNanoluc9-10으로 표기하는 경우가 있다.
실시예 4-4-1 비오틴화 splitNanoluc1-8 단백질의 조제
벡터 조제
pET-15b 벡터에, 서열 번호: 58(D-18)의 합성 DNA를 Nco1/BamH1의 제한 효소를 사용하여 삽입한 발현 벡터를 조제했다.
합성 DNA 서열 번호: 58(D-18)
DNA 서열:
CCATGGGCCTGAACGATATTTTTGAAGCGCAGAAGATTGAGTGGCACGAACACCATCATCATCATCACGGTGGTAGCAGCGTGTTCACCCTGGAGGACTTTGTTGGCGATTGGGAACAGACCGCGGCGTACAACCTGGACCAGGTGCTGGAGCAAGGTGGCGTTAGCAGCCTGCTGCAGAACCTGGCGGTGAGCGTTACCCCGATCCAACGTATTGTTCGTAGCGGCGAGAACGCGCTGAAGATCGACATTCACGTGATCATTCCGTATGAAGGCCTGAGCGCGGATCAGATGGCGCAAATCGAGGAAGTGTTCAAGGTGGTTTACCCGGTTGACGATCACCACTTTAAAGTGATCCTGCCGTATGGTACCCTGGTGATTGACGGCGTTACCCCGAACATGCTGAACTACTTCGGTCGTCCGTATGAAGGCATCGCGGTTTTTGATGGTAAGAAAATTACCGTTACCGGCACCCTGTGGAACGGCAACAAGATTATTGACGAACGCCTGATTACCCCGGACTAATGAGGATCC
단백질 발현 및 정제
대장균 SHuffle T7 Express Competent E.coli(NEW ENGLAND BioLabs, Cat.No C3029H)를, splitNanoluc 발현 벡터와, pACYC184 벡터에 대장균 BirA 유전자를 도입한 BirA 발현 벡터로 형질 전환하여, 발현주를 구축했다.
구축한 대장균 발현주를 배지 A(LB 배지(invitrogen, #12780-052), 100μg/mL 암피실린, 50μg/mL 스펙티노마이신 이염산염, 34μg/mL 클로람페니콜)에서 OD600=0.5가 될 때까지 배양한 후, 빙수에 플라스크를 5분 침지하여, 4℃까지 배양액의 온도를 낮췄다. 200μM IPTG(아이소프로필-β-싸이오갈락토피라노사이드), 50μM Biotin이 되도록 가하고, 16℃, 200rpm으로 하룻밤 배양함으로써 비오틴화 수식을 받은 목적 단백질을 발현시켰다. 배양균체는 원심에 의해 회수하고, 액체 질소로 동결한 후, -80℃에서 보존했다.
동결균체를 extraction buffer(50mM 인산 수소 나트륨 pH 7.5, 500mM NaCl, ProteinaseInhibitorCocktail(EDTA-free))를 이용하여 현탁하고, 5k U/E.coli가 되도록 rLysozyme(Novagen, #71110-3)을 첨가한 후, 실온에서 20분 방치했다. 재차 현탁하고, 초음파 파쇄한 후, 1M MgCl2를 0.2%v/v가 되도록, 25U/μL benzonase(EMD Millipore, #70746-2.5KUN)를 0.03%v/v가 되도록 가하고, 재차 실온에서 20분 정치했다. 샘플을 원심하여 회수한 상청을, 0.22μm 필터로 여과했다.
여과한 샘플을, HisTrap HP 1mL(GE Healthcare, #17-5247-01)를 사용하여 정제했다.
정제 샘플을 회수 후, Streptavidin Mutein Matrix(Roche, #03708152001)를 이용하여 정제했다. 목적 단백질을 포함하는 프랙션을 회수하고, Amicon Ultra-15 10K(MERCK, #UFC801024)에 의해, 1/10 volume이 되도록 농축했다.
농축 샘플을, 겔 여과 정제했다. 겔 여과 정제의 Running buffer로서, 50mM Tris-HCl, 150mM NaCl, 10% Glycerol, pH 8.0을 이용했다.
SDS-PAGE 분석의 결과, 목적 단백질의 이론 분자량에 대응하는 위치에 단일 밴드를 나타냈다. 또한, 비오틴화 단백질과 스트렙트아비딘간의 상호작용을 이용한 겔 시프트 어세이에 의해, 목적 단백질이 비오틴화되어 있는 것을 확인했다.
실시예 4-4-2 mRNA Dispaly를 이용한 split Nanoluc의 재회합 어세이
복수의 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자를 라이브러리로부터 스크리닝하는 경우, 1개의 표적 분자만과 복합체를 형성하는 피험 분자의 회수율을 낮게 억제한 계가 필요해진다.
그래서, splitNanoluc-9(서열 번호: 66), splitNanoluc-10(서열 번호: 67), 및 splitNanoluc9-10 연결체(서열 번호: 65) 각각의, splitNanoluc1-8(서열 번호: 85)에 대한 결합능을 평가했다. splitNanoluc-9, splitNanoluc-10, 및 splitNanoluc9-10 연결체의 각각에 핵산을 연결시킨 Display 분자를 조제하고, 이들을 splitNanoluc1-8과 인큐베이트하고, splitNanoluc1-8에 결합한 분자의 핵산 부분을 qPCR했다.
(1) mRNA의 합성
주형 DNA(서열 번호: 59(D-19)∼서열 번호: 61(D-21))로부터, T7 RNA polymerase를 이용한 in vitro 전사 반응에 의해 mRNA(서열 번호: 62(mR-14)∼서열 번호: 64(mR-16))를 합성하고, RNeasy kit(Qiagen사)에 의해 정제했다.
주형 DNA 서열 번호: 59(D-19)
DNA 서열: splitNanoluc9-10
GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGGGCAGCATGCTGTTTCGTGTGACCATTAACAGCGGCGGCGGCAGCGGCGGCGGCGGCAGCGGCGTGAGCGGCTGGCGTCTGTTTAAAAAAATTAGCGGTTCTGGTTCTGGTTCTGGTTCTGAAAACCTGTATTTTCAGGGCAAAAAAA
주형 DNA 서열 번호: 60(D-20)
DNA 서열: splitNanoluc-9
GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGGGCAGCATGCTGTTTCGTGTGACCATTAACAGCGGTTCTGGTTCTGGTTCTGGTTCTGAAAACCTGTATTTTCAGGGCAAAAAAA
주형 DNA 서열 번호: 61(D-21)
DNA 서열: splitNanoluc-10
GGCGTAATACGACTCACTATAGGGTTAACTTTAAGAAGGAGATATACATATGGTGAGCGGCTGGCGTCTGTTTAAAAAAATTAGCGGTTCTGGTTCTGGTTCTGGTTCTGAAAACCTGTATTTTCAGGGCAAAAAAA
mRNA 서열 번호: 62(mR-14)
splitNanoluc9-10 RNA 서열:
GGGUUAACUUUAAGAAGGAGAUAUACAUAUGGGCAGCAUGCUGUUUCGUGUGACCAUUAACAGCGGCGGCGGCAGCGGCGGCGGCGGCAGCGGCGUGAGCGGCUGGCGUCUGUUUAAAAAAAUUAGCGGUUCUGGUUCUGGUUCUGGUUCUGAAAACCUGUAUUUUCAGGGCAAAAAAA
mRNA 서열 번호: 63(mR-15)
splitNanoluc-9 RNA 서열:
GGGUUAACUUUAAGAAGGAGAUAUACAUAUGGGCAGCAUGCUGUUUCGUGUGACCAUUAACAGCGGUUCUGGUUCUGGUUCUGGUUCUGAAAACCUGUAUUUUCAGGGCAAAAAAA
mRNA 서열 번호: 64(mR-16)
splitNanoluc-10 RNA 서열:
GGGUUAACUUUAAGAAGGAGAUAUACAUAUGGUGAGCGGCUGGCGUCUGUUUAAAAAAAUUAGCGGUUCUGGUUCUGGUUCUGGUUCUGAAAACCUGUAUUUUCAGGGCAAAAAAA
(2) mRNA Display에 의한 재회합 어세이
mRNA와 펩타이드가 연결된 Display 분자를 조제하고, 비오틴화 splitNanoluc1-8에 의한 회수율을 조사했다. WO2013/100132에 기재된 방법으로, 상기에서 정제한 mRNA의 3' 말단에 링커를 개재시켜 퓨로마이신을 연결하고, 이것을 번역하는 것에 의해 mRNA-펩타이드의 Display 분자를 조제했다. 번역계는, 원핵생물 유래의 재구성 무세포 단백질 합성계인 PUREfrex2.0(GeneFrontier사)을 이용하여, 부속의 프로토콜에 따라 번역했다.
각 Display 분자의 제시율을 확인하기 위해서, RNaseONE(Promega)에 의해 RNA 부분을 분해하고, TricinePAGE에서, 영동 분리했다. Display 분자를 형성하고 있는 경우는 번역 펩타이드와 퓨로마이신 링커의 연결체가 되고, Display 분자를 형성하고 있지 않는 경우는 번역 펩타이드의 결합하고 있지 않는 링커만이 되어, 전자보다도 낮은 위치에 검출되어, 합계 2개의 밴드가 검출된다. 그 밴드비로부터, 이하의 식에 의해 Display 분자의 제시율(%)을 계산했다.
Display 분자의 제시율(%)=번역 펩타이드와 링커로 이루어지는 밴드 강도/밴드 강도의 합계×100
RNaseONE에 의한 구체적인 반응액은, 1xReaction buffer, 0.84μM 연결체, 0.5U/μL RNaseONE을 혼합하고, 37℃에서 1시간 반응시켰다.
TricinePAGE의 검출은, 형광 표지한 퓨로마이신 링커를 검출했다. TricinePAGE의 결과 얻어진 제시율은 표 14와 같이 되었다.
재회합 어세이에 사용할 때는, 형광 표지가 없는 퓨로마이신 링커를 사용하고, 번역 산물은, mRNA 부분에서의 결합을 회피하기 위해서 역전사를 행했다. 구체적인 방법으로서는, 1xM-MLV RT Reaction buffer(Promega, #368B), 0.5mM dNTP, 8U/μL M-MLV RT (H-) Point Mutant(Promega, #368B), 3μM Rv-primer(서열 번호: 68), 0.5μM 번역 산물이 되도록 혼합하고, 42℃에서 1시간 반응시켰다.
각 Display 분자를, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, 33nM의 Display 분자에 대해서, 1μM의 비오틴화 splitNanoluc1-8을 가하여 혼합하고, 실온에서 1시간 반응시켰다.
Streptavidin 코팅 자기 비즈를 이용한 풀다운에 의해 비오틴화 splitNanoluc1-8 혹은 이것을 포함하는 복합체를 회수하고, tTBS(나카라이 테스크)로 수회 세정 후, splitNanoluc-9 혹은 splitNanoluc-10과 연결한 스스로를 코드하는 mRNA 부분 사이에 도입한 TEV 프로테아제 인식 서열을 인식하는 TEV 프로테아제에 의해 절단하여 핵산의 용출을 행했다. 구체적인 TEV 용출액은, 1xTEV buffer, 1mM DTT, 0.2U/μL AcTEV 프로테아제(서모 피셔 사이언티픽사, #12575015)를, 세정 후의 비즈에 첨가하여 반응시켰다. 반응 후, 상청을 회수하고, 상보성을 가지는 primer(Fw-primer(서열 번호: 4), Rv-primer(서열 번호: 68))로 qPCR을 걸었다. qPCR의 반응액은, 1x Ex taq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, #50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 57℃ 20초, 72℃ 30초 사이클을 40사이클 반복했다. 비오틴화 splitNanoluc1-8과 반응시키기 전의 각 Display 분자도 마찬가지로 qPCR을 행하여, 인풋의 핵산량을 산출했다.
각 서열에서 검량선을 긋기 위해서, 핵산량으로, 1E+8/μL, 1E+6/μL, 1E+4/μL가 되도록 희석하고, 마찬가지의 조건의 qPCR에 걸었다.
splitNanoluc1-8과의 결합에 의해 회수된 각 Display 분자의 핵산량을, splitNanoluc1-8과 혼합하기 전에 존재하고 있던 각 Display 분자의 핵산량(인풋의 값)으로 나눈 겉보기의 회수율을 산출하고, 추가로 제시율로 보정한 회수율을, 표 15에 정리했다.
겉보기의 회수율(%)=회수된 핵산량/인풋의 핵산량×100
회수율(%)=회수된 핵산량/(인풋의 핵산량×각 제시율×0.01)×100
결과, splitNanoluc1-8에 의해 splitNanoluc9-10의 연결체가 회수되고, splitNanoluc-9 단독, 혹은 splitNanoluc-10 단독의 회수율은, 연결체의 회수율에 비해 300배 이상 낮은 것이 나타났다. 즉, Nanoluc1-8은 Nanoluc-9(또는 Nanoluc-10)의 비존재하에서는 Nanoluc-10(또는 Nanoluc-9)과 회합하지 않는 것, Nanoluc1-8이 Nanoluc-9 및 Nanoluc-10과 회합하기 위해서는 Nanoluc-9와 Nanoluc-10이 근접, 회합 혹은 상호작용하고 있을 것이 필요하다는 것이 나타났다. 이 결과로부터, splitNanoluc-9를 어떤 표적 단백질에 결합시킨 분자, splitNanoluc-10에 다른 표적 단백질에 결합시킨 분자, 및 splitNanoluc1-8을 사용하면, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자의 효율적인 스크리닝이 가능해지는 것이 나타났다.
실시예 5 펩타이드 라이브러리 중의 라파마이신-핵산 농축 검증 실험
전술한, GFP의 재회합을 이용한 라파마이신 회수 검증 실험에 있어서, GFP10, GFP11, GFP1-9의 삼자를 이용하여 효율적으로 라파마이신을 회수할 수 있는 것이 나타났다. 그래서, 펩타이드 디스플레이 라이브러리에 라파마이신-핵산(화합물 nk04)을 1/(1×10의 3승), 혹은 1/(1×10의 6승)의 비율이 되도록 혼합한, 혼합 라이브러리를 조제하고, 1라운드의 mRNA Display의 패닝 조작을 행함으로써, 목적하는 라파마이신-핵산이 농축되는지를 검증했다.
펩타이드 디스플레이 라이브러리의 조제
번역에 사용하는 아실화 tRNA의 합성
WO2013/100132에 기재된 수법으로 패닝에 사용하는 아실화 tRNA를 조제했다. WO2018/225864에 기재된 MeHnl7F2, S3F5MePyr, MeSnPr, MeA3Pyr, F3Cl, Pic2, MeG, Nle, MeStBuOH, SNtBuAca, SiPen, nBuG, MeHph, SPh2C, Ala(4-Thz)를 포함하는 15종류의 아미노산을 이용하여, Elongator 아미노아실화 tRNA 혼합물을 조제했다. 각각의 아실화 tRNA의 번역액 중의 최종 농도는 10μM∼20μM이었다. Pnaz 보호의 pCpA 아미노산은, 탈보호를 실시하지 않고서 페놀 추출 이후의 작업을 행했다. Initiator 아미노아실화 tRNA는, WO2017/150732에 기재된 화합물 AAtR-3(Acbz-MeCys(StBu)-tRNAfMetCAU)와 동일 화합물이고, 최종 농도가 25μM이 되도록 번역액 중에 첨가하여 이용했다.
펩타이드 화합물 라이브러리를 코드하는 랜덤화된 2본쇄 DNA 라이브러리
WO2013/100132에 기재된 수법으로 DNA 라이브러리를 구축했다. TTT, TTG, CTT, ATT, ATG, GTT, CCG, ACT, GCT, CAT, CAG, AAC, GAA, TGG, CGG, AGT, AGG, GGT, CTG, GTG, TCT, TCG, TGC, CGT를 포함하는 24종류의 트리플렛이 랜덤으로 8회 내지 9회 반복해서 출현하는 것을 준비했다.
번역계는, 원핵생물 유래의 재구성 무세포 단백질 합성계인 PURE system을 이용했다. 구체적으로는, 1mM의 GTP, 1mM의 ATP, 20mM의 크레아틴 인산, 50mM의 HEPES-KOH pH 7.6, 100mM의 아세트산 칼륨, 10mM의 아세트산 마그네슘, 2mM의 스페르미딘, 1mM의 다이싸이오트레이톨, 1mg/mL E.coli MRE600(RNase 네거티브) 유래 tRNA(Roche사)(비특허문헌: Yokogawa T et al. 2010에 기재된 방법으로, 일부의 tRNA를 제거하고 있다), 4μg/mL의 크레아틴 키나아제, 3μg/mL의 미오키나아제, 2unit/mL의 무기 파이로포스파타아제, 1.1μg/mL의 뉴클레오타이드 이인산 키나아제, 0.26μM의 EF-G, 2.7μM의 IF1, 0.4μM의 IF2, 1.5μM의 IF3, 40μM의 EF-Tu, 35μM의 EF-Ts, 1.2μM의 리보솜, 2.73μM의 AlaRS, 1μM의 GlyRS, 0.4μM의 IleRS, 0.5μM의 변이체 PheRS(WO2016/148044), 0.16μM의 ProRS, 1μM의 변이체 SerRS(WO2016/148044), 0.09μM의 ThrRS, 1μM의 변이체 ValRS(WO2016/148044), 0.11μM의 LysRS, 0.5μM의 HisRS, 3μM의 in vitro 전사 대장균 tRNA Ala1B, 250μM의 글라이신, 100μM의 아이소류신, 250μM의 프롤린, 250μM의 트레오닌, 250μM의 라이신, 5mM의 N-메틸발린, 5mM의 N-메틸세린, 5mM의 N-메틸알라닌, 5mM의 N-메틸페닐알라닌, 1mM Ala(4-Thz), Elongator 아미노아실화 tRNA 혼합물, 25μM Initiator 아미노아실화 tRNA(WO2020/138336A1), 0.5μM Penicillin G Amidase(PGA), 1μM의 EF-P-Lys, 전술한 2본쇄 DNA 라이브러리로부터 WO2013/100132에 따라 조제한 mRNA-퓨로마이신 연결체를 1μM이 되도록 번역 반응 혼합물에 첨가하고, 37℃에서 1시간 정치함으로써 번역을 행했다.
번역한 라이브러리에 대해서, 핵산의 분자수로서 1/(1×10의 3승)의 비율이 되도록 라파마이신-핵산(화합물 nk04)을 가한 혼합물을 혼합 라이브러리 A, 마찬가지로 1/(1×10의 6승)의 비율이 되도록 라파마이신-핵산(화합물 nk04)을 가한 혼합물을 혼합 라이브러리 B로서 조제했다. 혼합 라이브러리 A와 혼합 라이브러리 B를 사용하여, WO2013/100132를 모방하여 패닝을 1라운드 실시했다.
조건 1에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, 2μM Hisx6-FKBP12-Link12-GFP11, 2μM GFP10-Link12-FRB-Hisx6, 1μM 비오틴화 GFP1-9에 대해서, 혼합 라이브러리 A를 0.3μM이 되도록 가하고, 실온에서 1.5시간 반응시켰다.
조건 2에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, 2μM Hisx6-FKBP12-Link12-GFP11, 2μM GFP10-Link12-FRB-Hisx6, 1μM 비오틴화 GFP1-9에 대해서, 혼합 라이브러리 B를 0.3μM이 되도록 가하고, 실온에서 1.5시간 반응시켰다.
Streptavidin 코팅 자기 비즈를 이용한 풀다운에 의해 비오틴화 GFP1-9 혹은 이것을 포함하는 복합체를 회수하고, tTBS(나카라이 테스크)로 수회 세정 후, GFP1-9와 비오틴 사이에 도입한 TEV 프로테아제 인식 서열을 인식하여 절단하는 TEV 프로테아제에 의해 처리하여 핵산의 용출을 행했다. 구체적인 TEV 용출액으로서, 1xTEV buffer, 1mM DTT, 0.2U/μL AcTEV 프로테아제(서모 피셔 사이언티픽사, #12575015)를, 세정 후의 비즈에 첨가하여 반응시켰다. 반응 후, 상청을 회수하고, 라이브러리 A(혹은 B)의 전체 서열(화합물 nk04의 부가 핵산 서열을 포함한다)에 상보성을 가지는 프라이머(Fw-primer(서열 번호: 117), Rv-primer(서열 번호: 118))로 PCR한 후, 그 PCR 산물의 qPCR을 행하고, 라이브러리의 서열의 평가를 행했다. 단, 화합물 nk04 부가 핵산 서열과 그것 이외의 라이브러리 유래의 서열에서 동 프라이머를 사용했을 때의 PCR 증폭 효율에 차가 없는 것은 확인되어 있다(데이터를 나타내지 않는다). qPCR의 프라이머에는, 전술한 프라이머(Fw-primer(서열 번호: 4), Rv-primer(서열 번호: 6)) 혹은 화합물 nk04의 부가 핵산 서열에만 상보성을 가지는 프라이머((Fw-primer(서열 번호: 69), Rv-primer(서열 번호: 70))를 사용했다. qPCR의 반응액은, 1xEx taq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, #50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 57℃ 20초, 72℃ 30초 사이클을 40사이클 반복했다.
각 서열에서 검량선을 긋기 위해서, 인풋 핵산량으로, 1E+8/μL, 1E+6/μL, 1E+4/μL가 되도록 희석하고, 마찬가지의 조건의 qPCR에 걸었다.
화합물 nk04의 핵산의 회수율과, 라이브러리 A(혹은 B)의 전체 핵산 회수율을 비교함으로써, 패닝을 1라운드 행한 후의 라이브러리 중의 화합물 nk04의 분자 농도(%)를 이하의 식에 의해 산출했다(표 16).
화합물 nk04의 분자 농도(%)=화합물 nk04 부가 핵산 서열 핵산 농도(분자수/μL)/라이브러리의 핵산 농도(분자수/μL)×100
결과, 패닝 실시 전후로, 라이브러리 중의 화합물 nk04의 분자 농도가 400∼3000배가 되어 있고, splitGFP를 사용한 mRNA display panning에 의해, 2개의 표적을 인식하는 분자가 효율적으로 농축되는 것이 나타났다.
실시예 6 splitGFP 기술을 사용한 bispecific 분자의 패닝
전술한 대로, 펩타이드 디스플레이 라이브러리와 혼합한 라파마이신-핵산을, GFP의 재회합에 의해 농축하는 것이 나타났다. 다음으로, 1x10의 12승으로 이루어지는 펩타이드 디스플레이 라이브러리로부터, 동 수법으로, 2개의 표적 단백질에 결합하는 펩타이드를 취득 가능한지, mRNA 디스플레이 패닝을 행하여 검증했다.
패닝의 1라운드째에서는, 비즈에 편측의 표적 단백질의 비오틴화체를 고정하고, 다른 편측의 표적 단백질을 유리된 상태로 존재시켜 셀렉션을 행했다. 2라운드째에서는, 비즈에 고정하는 비오틴화 표적 단백질과 유리된 표적 단백질을 바꿔 넣고, 셀렉션했다.
3라운드째 이후는, GFP10 및 GFP11에 각각의 표적 단백질을 결합시킨 융합 단백질을 조제하고, 이들 2개의 융합 단백질과, 비오틴화 GFP1-9의 존재하에서 셀렉션을 행했다.
실시예 6-1 패닝 표적 단백질의 조제
패닝에 사용하는 표적 단백질로서, 대장균으로 발현·정제한 GTPase KRas(KRAS)를 이용했다. C 말단에 소르타제 인식 서열(LPXTG 서열(X는 임의의 아미노산)(서열 번호 116)), His 태그, TEV 프로테아제 절단 태그, 비오틴화 효소 인식 태그를 부가한, KRAS-FLAGSorHisTEV-Bio(서열 번호 100)를 조제했다.
구체적으로는, 발현 벡터에 pET21a(+)를 이용하여 대장균 BL2(DE3)을, 비오틴 리가아제(BirA) 발현 벡터와 함께, 형질 전환하여 발현주를 작성했다. OD600이 0.7이 될 때까지, 암피실린과 클로람페니콜이 함유된 LB 배지에서 배양하고, 1mM의 IPTG로 유도를 걸고, 0.1mM의 biotin 존재하에서, 30℃에서 5시간 배양했다. 회수한 가용성 분획을 Ni Sepharose High Performance(GE)를 이용하여 정제하고, 그 후, Streptavidin Mutein Matrix(Roche)를 이용하여 정제했다. 정제는, 각각 제품에 첨부된 기본 프로토콜에 따라 행했다. Superdex 75 Increase 10/300 GL(GE)을 이용하여, 사이즈 분획 크로마토그래피를 행하고, 정제한 최종 산물을, 보존 buffer(25mM HEPES, 150mM NaCl, 1mM MsCl2, 1mM DTT, 10% Glycerol, pH 7.6)에 넣고, -80℃에서 보존했다.
SDS-PAGE 분석의 결과, 목적 단백질의 이론 분자량에 대응하는 위치에 단일 밴드를 나타냈다. SEC 분석의 결과, 목적 단백질이 이론치 부근의 분자량 마커와 동일한 정도의 유지 시간을 나타내고, 또한 단량체로서 존재하고 있는 것을 확인했다. SEC 분석의 칼럼에는, TSKgel G2000SWXL(TOSOH, #08540)을 사용했다.
패닝에 사용하는 표적 단백질로서, N 말단에 정제 태그, thronbin 절단 사이트를 부가한, HAT-KRAS-nonbio(서열 번호 101)를 조제했다.
구체적으로는, 발현 벡터에 pETBlue1을 이용하여, 대장균 Tuner(DE3)pLacI(Novagen)을 형질 전환하여 발현주를 작성했다. OD600이 0.6이 될 때까지, 암피실린이 함유된 LB 배지에서 배양하고, 0.1mM의 IPTG로 유도를 걸고, 30℃에서 하룻밤 배양했다. 회수한 가용성 분획을 Ni Sepharose excel(GE healthcare)을 이용하여 기본 프로토콜에 따라 정제했다. HiLoad 26/600 Superdex 75 pg(GE healthcare)를 이용하여, 사이즈 분획 크로마토그래피를 행하고, 정제한 최종 산물을 보존 buffer(20mM HEPES, 100mM NaCl, 1mM DTT, 5mM MgCl2, pH 8.0)에 넣고, -80℃에서 보존했다.
SDS-PAGE 분석의 결과, 목적 단백질의 이론 분자량에 대응하는 위치에 단일 밴드를 나타냈다.
패닝에 사용하는 표적 단백질로서, 대장균으로 발현·정제한 글루타티온 S-트랜스퍼라아제(GST)를 이용했다. C 말단에 정제 태그, TEV 프로테아제 절단 태그, 비오틴화 효소 인식 태그를 부가한, GST-HisTEVAvi(서열 번호 103)를 조제했다.
구체적으로는, 발현 벡터에 pGEX-4T-1을 이용하여, 대장균 BL21 star(DE3)을 형질 전환하여 발현주를 작성했다. OD600이 1.2가 될 때까지, TB 배지에서 배양하고, 0.5mM의 IPTG로 유도를 걸고, 37℃에서 4시간 배양했다. 회수한 가용성 분획을 Profinity IMAC Ni-Charged Resin(BIO-RAD)을 이용하여 제품에 첨부된 기본 프로토콜에 따라 정제하여, 보존 buffer(50mM Tris-HCl, 150mM NaCl, 10% Glycerol, pH 8.0)에 넣고, -80℃에서 보존했다.
SDS-PAGE 분석의 결과, 목적 단백질의 이론 분자량에 대응하는 위치에 단일 밴드를 나타냈다.
전술에서 조제한 GST-HisTEV-Avi를 비오틴 존재하에서 비오틴 리가아제(BirA)에 의해 처리하여, GST-HisTEV-Bio(서열 번호 102)를 얻었다.
BirA를 대장균으로 조제·정제했다. 구체적으로는, 발현 벡터에 pET30a를 이용하여, 대장균 BL21(DE3)을 형질 전환하여 발현주를 작성했다. OD600이 4가 될 때까지, 암피실린이 함유된 TB 배지에서 배양하고, 0.5mM의 IPTG로 유도를 걸고, 15℃에서 16시간 배양했다. 회수한 가용성 분획을 Profinity IMAC Ni-Charged Resin(BIO-RAD)을 이용하여 기본 프로토콜에 따라 정제하여, 보존 buffer(50mM Tris-HCl, 150mM NaCl, 10% Glycerol, pH 8.0)에 넣고, -80℃에서 보존했다.
비오틴화 반응액은, 46mM Tris HCl pH 8.3, 9mM Mg(OAc)2, 35μM biotin, 0.825μM BirA, 30.5μM GST-HisTev-Avi가 되도록 조제하고, 실온에서 1시간 정치했다. 비오틴화 단백질과 스트렙트아비딘간의 상호작용을 이용한 겔 시프트 어세이에 의해, 목적 단백질이 비오틴화되어 있는 것을 확인했다.
패닝에 사용하는 표적 단백질로서, 대장균으로 발현·정제한 글루타티온 S-트랜스퍼라아제(GST)를 이용했다. C 말단에 정제용 His 태그, 소르타제 인식 서열을 부가한, GST-SorAHis(서열 번호 104)를 조제했다.
구체적으로는, 발현 벡터에 pGEX-4T-1을 이용하여, 대장균 BL21 Star(DE3)을 형질 전환하여 발현주를 작성했다. OD600이 1.2가 될 때까지, 암피실린이 함유된 LB 배지에서 배양하고, 0.5mM의 IPTG로 유도를 걸고, 15℃에서 하룻밤 배양했다. 회수한 가용성 분획을 Profinity IMAC Ni-Charged Resin(BIO-RAD)을 이용하여 제품에 첨부된 기본 프로토콜에 따라 정제하여, 보존 buffer(50mM Tris-HCl, 150mM NaCl, 10% Glycerol, pH 8.0)에 넣고, -80℃에서 보존했다.
SDS-PAGE 분석의 결과, 목적 단백질의 이론 분자량에 대응하는 위치에 단일 밴드를 나타냈다.
패닝에 사용하는 표적 단백질로서, 대장균으로 발현·정제한 FKBP12를 이용했다. C 말단에 정제 태그, TEV 프로테아제 절단 태그, 비오틴화 효소 인식 태그를 부가한, FKBP-HisTEVAvi(서열 번호 114)를 조제했다. 구체적으로는, 발현 벡터에 pET11a를 이용하여, 대장균 BL21(DE3)을 형질 전환하여 발현주를 작성했다. OD600이 0.5가 될 때까지, 암피실린이 함유된 LB 배지에서 배양하고, 1.0mM의 IPTG로 유도를 걸고, 37℃에서 3시간 배양했다. 회수한 가용성 분획을 His Trap FF(Cytiva)를 이용하여 제품에 첨부된 기본 프로토콜에 따라 정제하여, Amicon Ultra-15 10k cut(Merck Millipore)로 농축하고 0.22μm filter 처리한 것을, Superdex 75pg column(Cytiva)에 의해 SEC 정제했다. 보존 buffer(50mM Tris, pH 7.5, 150mM NaCl, 1mM TCEP)에 넣고, -80℃에서 보존했다.
SDS-PAGE 분석의 결과, 목적 단백질의 이론 분자량에 대응하는 위치에 단일 밴드를 나타냈다.
전술에서 조제한 FKBP-HisTEV-Avi를 비오틴 존재하에서 비오틴 리가아제(BirA)에 의해 처리하여, FKBP-HisTEV-Bio(서열 번호 115)를 얻었다. 비오틴화 단백질과 스트렙트아비딘간의 상호작용을 이용한 겔 시프트 어세이에 의해, 목적 단백질이 비오틴화되어 있는 것을 확인했다.
전술한 조제 단백질의 서열을 아래 표에 나타낸다. 「K*」는, 비오틴화된 Lys를 나타내고 있다.
실시예 6-2: GFP10 또는 GFP11이 연결된 표적 단백질의 조제
상기 방법에 의해 조제한 C 말단에 소르타제 인식 서열을 포함하는 KRAS-SorHisTEVAvi와 GST-SorAHis의 컨스트럭트에 대해, LPXTG 서열(X는 임의의 아미노산)을 인식하는 트랜스펩티다아제인 eSrtA를 이용한 소르타제 반응에 의해 GFP10 또는 GFP11을 부가하여, 융합 단백질을 조제했다.
실시예 6-2-1 Sortase A pentamutant (eSrtA)의 조제
비특허문헌 Proc. Natl. Acad. Sci. USA. 2011 Jul 12;108(28):11399-11404.의 방법에 준하여, eSrtA를 대장균으로 발현시켜, 정제했다. 한편, 여기에서 합성한 소르타제 A는 야생형이 아니라, 보다 고활성인 P94R/D160N/D165A/K190E/K196T 오중 변이체(Sortase A pentamutant(eSrtA))이다(서열 번호: 105).
실시예 6-2-2 tri-Gly 부가 GFP 펩타이드의 합성
N 말단에 소르타제의 기질이 되는 Gly-Gly-Gly를 포함하는 GFP 펩타이드(Sor-sp11-L12, 서열 번호: 106 및 Sor-sp10-12, 서열 번호: 107)를, 고상 합성법에 의한 통상적 방법에 의해 합성했다.
실시예 6-2-3 소르타제 반응에 의한, 표적 단백질에의 GFP10 또는 GFP11의 부가
KRAS와 GFP10을 연결한 융합 단백질(KRAS-sp10, 아미노산 서열의 서열 번호: 109), KRAS와 GFP11을 연결한 융합 단백질(KRAS-sp11, 아미노산 서열의 서열 번호: 108), GST와 GFP10을 연결한 연결 단백질(GST-sp10, 아미노산 서열의 서열 번호: 110)의 조제를 행했다.
구체적으로는, 반응 Buffer(0.05M Tris-HCl(pH 7.5), 0.15M NaCl, 10mM CaCl2) 중, 40μM KRAS-SorTEVHisAvi, 1mM Sor-sp10-12(혹은, 1mM Sor-sp11-L12), 1μM eSrtA를 빙상에서 혼합하고, 4℃에서 하룻밤 인큐베이트했다. 반응 후의 액에 20mM의 EDTA를 가하여 반응을 정지시켰다.
마찬가지로, GSTSorAHis에 대해서도 마찬가지의 반응액을 조제하고, GFP10을 부가했다. 반응은, 37℃에서 2시간 인큐베이트했다.
소르타제 반응의 전후의 샘플을 SDS-PAGE 분석하고, 목적 단백질의 이론 분자량에 대응하는 겔 시프트를 확인함으로써, 반응이 정상적으로 진행된 것을 확인했다. 이들 반응으로 얻어진 표적 단백질의 전장 서열을 아래 표에 나타낸다.
실시예 6-3 펩타이드 디스플레이 라이브러리의 조제
실시예 6-3-1 번역에 사용하는 아실화 tRNA의 합성
WO2018/143145 및 WO2018/225864에 기재된 수법에 준하여 패닝에 사용하는 아실화 tRNA를 조제했다. Pro(4-pip-4-F2), Asp(SMe), Hph(3-Cl), cisPro(4-pip-4-F2), MeHnl(7-F2), Ser(3-F-5-Me-Pyr), MeSer(nPr), MeAla(3-Pyr), Phe(3-Cl), Pic(2), MeGly, Nle, MeSer(tBuOH), Ser(NtBu-Aca), Ser(iPen), nBuGly, MeHph, Ser(Ph-2-Cl)을 포함하는 19종류의 아미노산을 이용하여, Elongator 아미노아실화 tRNA 혼합물을 조제했다. 각각의 아실화 tRNA의 번역액 중의 최종 농도는 10μM∼20μM이었다. Pnaz 보호의 pCpA 아미노산은, 탈보호를 실시하지 않고서 페놀 추출 이후의 작업을 행한 Initiator 아미노아실화 tRNA는, WO2020/138336에 기재된 화합물 AAtR-18(BdpFL-Phe-tRNA(fMet)cau)과 동일 화합물이고, 최종 농도가 25μM이 되도록 번역액 중에 첨가하여 이용했다.
실시예 6-3-2 펩타이드 라이브러리를 코드하는 랜덤화된 2본쇄 DNA 라이브러리
WO2013/100132에 기재된 수법에 준하여, DNA 라이브러리를 구축했다. TTT, TTG, CTT, CTG, ATT, ATG, GTT, GTG, TCT, TCG, CCG, ACT, GCT, TAC, CAT, CAG, AAC, GAT, GAG, TGC, TGG, CGT, CGG, AGT, AGG, GGT의 26종류의 트리플렛이 랜덤으로 8회 내지 9회 반복해서 출현하는 것을 준비했다.(서열 번호: 111, 119)
DNA 라이브러리(서열 번호: 111)
GTAATACGACTCACTATAGGGTTAACTTTAATAAGGAGATATAAATATG(Random_triplet)9TAGCCGACCGGCACCGGCACCGGCAAAAAAA
DNA 라이브러리(서열 번호: 119)
GTAATACGACTCACTATAGGGTTAACTTTAATAAGGAGATATAAATATG(Random_triplet)8TAGCCGACCGGCACCGGCACCGGCAAAAAAA
실시예 6-3-3 펩타이드 디스플레이 라이브러리의 번역
번역계는, 원핵생물 유래의 재구성 무세포 단백질 합성계인 PURE system을 이용했다. 구체적으로는, 1mM의 GTP, 1mM의 ATP, 20mM의 크레아틴 인산, 50mM의 HEPES-KOH pH 7.6, 100mM의 아세트산 칼륨, 1mM의 아세트산 마그네슘, 2mM의 스페르미딘, 1mM의 다이싸이오트레이톨, 1mg/mL E.coli MRE600(RNase 네거티브) 유래 tRNA(Roche사)(비특허문헌: Yokogawa T et al. 2010에 기재된 방법으로, 일부의 tRNA를 제거하고 있다), 4μg/mL의 크레아틴 키나아제, 3μg/mL의 미오키나아제, 2unit/mL의 무기 파이로포스파타아제, 1.1μg/mL의 뉴클레오타이드 이인산 키나아제, 0.26μM의 EF-G, 2.7μM의 IF1, 0.4μM의 IF2, 1.5μM의 IF3, 40μM의 EF-Tu, 59μM의 EF-Ts, RNasein 0.4U/μL, 1.2μM의 리보솜, 1μM의 EF-P-Lys, 2.73μM의 AlaRS, 1μM의 GlyRS, 0.4μM의 IleRS, 0.5μM의 변이체 PheRS(WO2016/148044), 0.16μM의 ProRS, 1μM의 변이체 SerRS(WO2016/148044), 0.09μM의 ThrRS, 1μM의 변이체 ValRS(WO2016/148044), 0.11μM의 LysRS, 3μM의 in vitro 전사 대장균 tRNA Ala1B, 250μM의 글라이신, 100μM의 아이소류신, 250μM의 프롤린, 250μM의 트레오닌, 250μM의 라이신, 5mM의 N-메틸발린, 5mM의 N-메틸세린, 5mM의 N-메틸알라닌, 5mM의 N-메틸페닐알라닌, Elongator 아미노아실화 tRNA 혼합물, 25μM Initiator 아미노아실화 tRNA(WO2017/150732에 기재된 화합물 AAtR-3(Acbz-MeCys(StBu)-tRNAfMetCAU)), 0.5μM Penicillin G Amidase(PGA), 전술한 2본쇄 DNA 라이브러리로부터 WO2013/100132에 따라 조제한 mRNA-퓨로마이신 연결체를 1μM이 되도록 번역 반응 혼합물에 첨가하고, 37℃에서 1시간 정치함으로써 번역을 행했다.
실시예 6-4 패닝
번역한 display 라이브러리를 사용하여, WO2013/100132를 모방하여 패닝을 5라운드 실시했다.
실시예 6-4-1 GST 및 KRas를 표적 단백질로서 이용한 패닝
라운드 1에서는, Streptavidin 코팅 자기 비즈에, GST-HisTev-Bio가 0.4μM이 되도록 고정하고, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼에, display 라이브러리를 0.6μM이 되도록 가하고, 4μM HAT-KRAS-nonbio, 0.4mM GDP 존재하에서, 4℃에서 2시간 반응시켰다.
반응 후에, 마그넷으로 모아 상청을 제거한 비즈를, 2mM DTT가 되도록 가한 tTBS(나카라이 테스크)로 수회 세정 후, TEV 프로테아제 인식 서열을 인식하여 절단하는 TEV 프로테아제에 의해 처리하여 핵산의 용출을 행했다.
구체적인 TEV 용출액으로서, 1xTEV buffer, 10mM DTT, 0.1U/μL AcTEV 프로테아제(서모 피셔 사이언티픽사, #12575015)를, 세정 후의 비즈에 첨가하여 반응시켰다. 반응 후, 상청을 회수하고, 라이브러리 인식 프라이머(Fw-primer(서열 번호: 112), Rv-primer(서열 번호: 113))로 PCR하여, 다음 라운드의 인풋 라이브러리로 했다.
또한, TEV 용출 산물의 일부를 사용하여 qPCR을 행하고, 각 라운드의 라이브러리의 회수율을 평가했다. qPCR의 프라이머에는, 전술한 프라이머(Fw-primer(서열 번호: 112), Rv-primer(서열 번호: 113))를 사용했다. qPCR의 반응액은, 1x Ex taq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, #50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 57℃ 20초, 72℃ 30초 사이클을 40사이클 반복했다.
라운드 2에서는, Streptavidin 코팅 자기 비즈에, KRAS-FLAG-Sor-His-Tev-Bio가 0.4μM이 되도록 고정하고, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼에, display 라이브러리를 0.3μM이 되도록 가하고, 4μM GST-HisTevAvi, 0.4mM GDP 존재하에서, 4℃에서 2시간 반응시켰다.
그 후는, TEV 용출액의 DTT 농도를 1mM로 변경하고, 그것 이외는 라운드 1과 마찬가지의 작업을 행했다.
라운드 3∼라운드 5에서는, 1xTBS, 2mg/mL BSA(Invitrogen사)의 버퍼 중에서, 0.8μM KRAS-sp11, 0.8μM GST-sp10, 1μM 비오틴화 GFP1-9에 대해서, display 라이브러리를 0.3μM이 되도록 가하고, 4℃에서 2시간 반응시켰다.
Streptavidin 코팅 자기 비즈를 이용한 풀다운에 의해 비오틴화 GFP1-9 혹은 이것을 포함하는 복합체를 회수하고, tTBS(나카라이 테스크)로 수회 세정 후, GFP1-9와 비오틴 사이에 도입한 TEV 프로테아제 인식 서열을 인식하여 절단하는 TEV 프로테아제에 의해 처리하여 핵산의 용출을 행했다. 구체적인 TEV 용출액으로서, 1xTEV buffer, 1mM DTT, 0.1U/μL AcTEV 프로테아제(서모 피셔 사이언티픽사, #12575015)를, 세정 후의 비즈에 첨가하여 반응시켰다. 반응 후, 상청을 회수하고, 라이브러리 인식 프라이머(Fw-primer(서열 번호: 112), Rv-primer(서열 번호: 113))로 PCR하여, 다음 라운드의 인풋 라이브러리로 했다.
또한, TEV 용출 산물의 일부를 사용하여 qPCR을 행하고, 라이브러리의 회수율을 평가했다. qPCR의 프라이머에는, 전술한 프라이머(Fw-primer(서열 번호: 112), Rv-primer(서열 번호: 113))를 사용했다. qPCR의 반응액은, 1x Ex taq buffer, 0.2mM dNTP, 0.5μM Fw-primer, 0.5μM Rv-primer, 200000배 희석 SYBR Green I(Lonza, #50513), 0.02U/μL Ex Taq polymerase(TAKARA)를 혼합하고, 95℃에서 2분 가열 후, 95℃ 10초, 57℃ 20초, 72℃ 30초 사이클을 40사이클 반복했다.
라이브러리의 회수율을 추측하는 검량선을 긋기 위해서, 인풋 라이브러리를, 1E+8/μL, 1E+6/μL, 1E+4/μL가 되도록 희석하고, 마찬가지의 조건의 qPCR에 걸었다.
2라운드째 이후는, 인풋 라이브러리를 2개로 나누고, 한쪽은 표적 단백질 존재하, 다른 한쪽은 표적 단백질 비존재하에서 셀렉션을 행하고, 쌍방의 핵산 회수율을, qPCR의 결과로부터 평가했다. 패닝의 각 라운드의 회수율(%)을 이하의 식에 의해 산출했다. 결과를 아래 표에 나타낸다.
라이브러리의 회수율(%)=라이브러리의 아웃풋 핵산량(분자수)/(라이브러리의 인풋 핵산량(분자수))×100
라운드 1에서는, GST-HisTev-Bio 대신에 KRAS-FLAGSorHisTev-Bio를 사용하고, HAT-KRAS-nonbio 대신에 GST-HisTevAvi를 사용, 라운드 2에서는 KRAS-FLAGSorHisTev-Bio 대신에 GST-HisTev-Bio를 사용하고, GST-HisTevAvi 대신에 HAT-KRAS-nonbio를 사용한 것 이외에는 실시예 6-4-1의 방법에 준하여 패닝을 행했다. 라운드 3∼라운드 5에 대해서는 실시예 6-4-1의 방법에 따라 행했다. 패닝의 각 라운드의 회수율(%)을 아래 표에 나타낸다.
결과, 표 21 및 22에 나타내는 바와 같이 후반 라운드에 있어서, 표적 단백질 존재하와 표적 단백질 비존재하의 셀렉션간에 회수율에 차가 나 있는 것으로부터, 표적 단백질 존재하에 있어서만 회수되는 분자가, 각 라운드의 라이브러리에 존재하고, 그들이 라운드를 거듭할 때마다 농축되고 있을 가능성이 생각된다.
실시예 6-4-2 FKBP 및 KRAS를 표적 단백질로서 이용한 패닝
GST-HisTev-Bio 대신에 FKBP-HisTev-Bio를 사용하고, GST-HisTevAvi 대신에 FKBP-HisTevAvi를 사용한 것 이외에는 실시예 6-4-1의 방법에 준하여 라운드 1 및 라운드 2를 행했다.
KRAS-sp11 대신에 Hisx6-FKBP12-Link12-GFP11을 사용하고, GST-sp10 대신에 KRAS-sp10을 사용한 것 이외에는 실시예 6-4-1의 방법에 준하여 라운드 3∼라운드 5를 행했다.
패닝의 각 라운드의 회수율(%)을 아래 표에 나타낸다.
라운드 1에서는, FKBP-HisTev-Bio 대신에 KRAS-HisTev-Bio를 사용하고, KRAS-FLAG-Sor-His-Tev-Bio 대신에 FKBP-HisTevAvi를 사용, 라운드 2에서는 KRAS-FLAGSorHisTev-Bio 대신에 FKBP-HisTev-Bio를 사용하고, FKBP-HisTevAvi 대신에 HAT-KRAS-nonbio를 사용한 것 이외에는, 실시예 6-4-1의 방법에 준하여 패닝을 행했다.
FKBP-HisTev-Bio 대신에 KRAS-HisTev-Bio를 사용하고, KRAS-FLAG-Sor-His-Tev-Bio 대신에 FKBP-HisTevAvi를 사용한 것 이외에는 실시예 6-4-2의 방법에 준하여 라운드 1 및 라운드 2를 행했다. 라운드 3∼라운드 5에 대해서는 실시예 6-4-2의 방법에 따라 행했다. 패닝의 각 라운드의 회수율(%)을 아래 표에 나타낸다.
결과, 표 23 및 24에 나타내는 바와 같이 후반 라운드에 있어서, 표적 단백질 존재하와 표적 단백질 비존재하의 셀렉션간에 회수율에 차가 나 있는 것으로부터, 표적 단백질 존재하에 있어서만 회수되는 분자가, 각 라운드의 라이브러리에 존재하고, 그들이 라운드를 거듭할 때마다 농축되고 있을 가능성이 생각된다.
본 개시에 있어서의 스크리닝 방법에 의해, 다양한 분자를 포함하는 라이브러리 중에서, 복수의 표적 분자와 함께 복합체를 형성할 수 있는 분자를 하이스루풋으로 선택할 수 있다. 본 개시의 스크리닝 방법에 의하면, 1개의 표적 분자만과 복합체를 형성하는 피험 분자를 배제하면서, 목적하는 후보 분자를 효율적으로 취득하는 것이 가능하다. 또한 본 개시에 있어서의 스크리닝 방법을 이용하면, 복수의 표적 분자와의 다양한 결합 양식을 발생시킬 수 있는 후보 분자를 취득하는 것을 기대할 수 있다. 본 개시에 있어서의 스크리닝 방법은, 의약품의 새로운 후보 분자의 탐색에 있어서 유용하다.
SEQUENCE LISTING
<110> CHUGAI SEIYAKU KABUSHIKI KAISHA
<120> Method for screening a candidate molecule which can form a
complex with multiple target molecules
<130> C1-A2032P
<150> JP 2020-216004
<151> 2020-12-25
<160> 124
<170> PatentIn version 3.5
<210> 1
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Avi-tag sequence
<400> 1
Gly Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu
1 5 10 15
<210> 2
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> TEV protease sequence
<400> 2
Glu Asn Leu Tyr Phe Gln Gly
1 5
<210> 3
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> His tag sequence
<400> 3
His His His His His His
1 5
<210> 4
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Fw(GFP)
<400> 4
gtaatacgac tcactatagg gttaacttta agaaggag 38
<210> 5
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Rv(GFP)
<400> 5
tttttttaga gccagagcca gagccaga 28
<210> 6
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> reverse transcription S2_mRNA#13
<400> 6
tttgtccccg ccgccctatc gccggtgccg gtgccggtcg g 41
<210> 7
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Fw_1for SNAP(N) prep.
<400> 7
taaggagata taaatatgga caaagactgc gaa 33
<210> 8
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Rv_1for SNAP(N) prep.
<400> 8
agagccagag ccagagccag agccagagcc ctgctggaac actgggtggt 50
<210> 9
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Fw_2 for SNAP(N) prep.
<400> 9
ggcgtaatac gactcactat agggttaact ttaataagga gatataaata tg 52
<210> 10
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Rv_2 for SNAP(N) prep.
<400> 10
tttttttaga gccagagcca gagccagagc cagagcc 37
<210> 11
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Fw_1for SNAP(C) prep.
<400> 11
taaggagata taaatatggt cgacgagagc tttacccgcc aggt 44
<210> 12
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Rv_1for SNAP(C) prep.
<400> 12
agagccagag ccagagccag agccagagcc attaacctcg agtttaaacg c 51
<210> 13
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> GGSS-primer_F
<400> 13
tggtggcagc agcagcaagg gcgaggaact gtt 33
<210> 14
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> GGSS-primer_R
<400> 14
ctgctgctgc caccatgatg gtgatgatgg tgac 34
<210> 15
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> GFP1-9
<400> 15
catatgggtg gcaccagcag caagggcgag gaactgttca ccggtgtggt tccgatcctg 60
gtggagctgg acggcgatgt taacggtcac aaatttagcg tgcgtggtga gggcgaaggt 120
gacgcgacca tcggcaagct gaccctgaaa ttcattagca ccaccggtaa actgccggtg 180
ccgtggccga ccctggttac caccctgacc tacggtgtgc aggcgtttag ccgttatccg 240
gaccacatga agcgtcacga tttctttaaa agcgcgatgc cggagggcta cgttcaagaa 300
cgtaccatta gcttcaagga cgatggcaag tataaaaccc gtgcggtggt taaatttgag 360
ggcgataccc tggttaaccg tatcgagctg aagggtaccg acttcaaaga agatggcaac 420
attctgggtc acaagctgga atacaacttt aacagccaca acgtgtatat caccgcggac 480
aagcagaaaa acggcattaa agcgaacttc accgtgcgtc acaacgttga ggacggtagc 540
gttcaactgg cggatcacta ccagcaaaac accccgattg gtgatggtac ccgtggcagc 600
ggtagcattg aaggtcgtca tagcggcagc ggtagcccgg tgctgctgcc ggacaaccac 660
tatctgagca cccagaccgt tctgagcaaa gatccgaacg aggcgggcac tcgtggcagc 720
ggtagcatcg aaggtcgtca cagcggcagc ggtagccgtg accacatggt gctgcacgaa 780
tacgttaacg cggcgggcat cacccacggt atggacgaac tgtataaagg cagcggcggc 840
acctaaggat cc 852
<210> 16
<211> 109
<212> DNA
<213> Artificial Sequence
<220>
<223> Tag insert sequence
<400> 16
ccatgggtct gaacgacatc ttcgaggcgc aaaaaattga gtggcacgag gagaacctgt 60
acttccaggg tcaccatcat caccatcata tgcgtaaggg cgaggaact 109
<210> 17
<211> 203
<212> DNA
<213> Artificial Sequence
<220>
<223> GFP10-11
<400> 17
ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tggacctgcc 60
ggacgaccac tacctgtcta cccagaccat cctgctgaaa gacctgaacg aaaaacgtga 120
ccacatggtt ctgctggaat acgttaccgc ggcgggtatc accgacgcgt ctggctctgg 180
ctctggctct ggctctaaaa aaa 203
<210> 18
<211> 140
<212> DNA
<213> Artificial Sequence
<220>
<223> GFP10
<400> 18
ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tggacctgcc 60
ggacgaccac tacctgtcta cccagaccat cctgctgaaa gacctgaacg gctctggctc 120
tggctctggc tctaaaaaaa 140
<210> 19
<211> 146
<212> DNA
<213> Artificial Sequence
<220>
<223> GFP11
<400> 19
ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tggaaaaacg 60
tgatcatatg gtgctgctgg aatatgtgac cgcggcgggc attaccgatg cgtctggctc 120
tggctctggc tctggctcta aaaaaa 146
<210> 20
<211> 117
<212> DNA
<213> Artificial Sequence
<220>
<223> Rapamycin-nucleic acid
<400> 20
gtaatacgac tcactatagg gttaacttta agaaggagat atacatatgc agtttatgtt 60
ttaggagatt ctgaggccga ccggcaccgg caccggcgat agggcggcgg ggacaaa 117
<210> 21
<211> 450
<212> DNA
<213> Artificial Sequence
<220>
<223> Hisx6-FKBP12-Link12-GFP11
<400> 21
atgcaccacc accaccacca catgggcgtc caagtcgaaa cgatcagtcc gggcgatggc 60
cgtaccttcc cgaaacgcgg tcaaacgtgc gtggttcatt ataccggcat gctggaagat 120
ggtaaaaaat ttgatagctc tcgtgaccgc aacaaaccgt ttaaattcat gctgggcaaa 180
caggaagtga ttcgtggctg ggaagaaggt gttgcacaga tgagcgtcgg tcaacgcgct 240
aaactgacca tcagtccgga ttatgcgtac ggtgccacgg gccatccggg tattatcccg 300
ccgcacgcaa ccctggtctt tgacgtggaa ctgctgaaac tggaaggcgg tggcggttca 360
ggcggtggct cgggtggcag tacgtccgaa aaacgcgatc acatggttct gctggaatat 420
gtcacggctg cgggtatcac cgatgcttcg 450
<210> 22
<211> 390
<212> DNA
<213> Artificial Sequence
<220>
<223> GFP10-Link12-FRB-Hisx6
<400> 22
atggacctgc cggacaatca ctatctgagt acgcaaacga tcctgctgaa agacctgaac 60
gatgttggtg gtggtggctc tggcggtggc agcggcggtt ctgaaatgtg gcatgaaggt 120
ctggaagaag caagccgtct gtattttggc gaacgcaacg tgaaaggcat gttcgaagtt 180
ctggaaccgc tgcacgctat gatggaacgt ggcccgcaga ccctgaaaga aacgagtttt 240
aaccaagcgt atggtcgtga tctgatggaa gcccaggaat ggtgccgcaa atacatgaaa 300
tccggcaatg tcaaagacct gacccaagcc tgggacctgt attaccatgt ctttcgtcgc 360
atctctaaac aacaccatca tcatcaccat 390
<210> 23
<211> 359
<212> DNA
<213> Artificial Sequence
<220>
<223> SNAP(N) whole_DNA
<400> 23
ggcgtaatac gactcactat agggttaact ttaataagga gatataaata tggacaaaga 60
ctgcgaaatg aagcgcacca ccctggatag ccctctgggc aagctggaac tgtctgggtg 120
cgaacagggc ctgcaccgta tcatcttcct gggcaaagga acatctgccg ccgacgccgt 180
ggaagtgcct gccccagccg ccgtgctggg cggaccagag ccactgatgc aggccaccgc 240
ctggctcaac gcctactttc accagcctga ggccatcgag gagttccctg tgccagccct 300
gcaccaccca gtgttccagc agggctctgg ctctggctct ggctctggct ctaaaaaaa 359
<210> 24
<211> 404
<212> DNA
<213> Artificial Sequence
<220>
<223> SNAP(C) whole_DNA
<400> 24
ggcgtaatac gactcactat agggttaact ttaataagga gatataaata tggtcgacga 60
gagctttacc cgccaggtgc tgtggaaact gctgaaagtg gtgaagttcg gagaggtcat 120
cagctacagc cacctggccg ccctggccgg caatcccgcc gccaccgccg ccgtgaaaac 180
cgccctgagc ggaaatcccg tgcccattct gatcccctgc caccgggtgg tgcagggcga 240
cctggacgtg gggggctacg agggcgggct cgccgtgaaa gagtggctgc tggcccacga 300
gggccacaga ctgggcaagc ctgggctggg tcctgcaggc ggatccgcgt ttaaactcga 360
ggttaatggc tctggctctg gctctggctc tggctctaaa aaaa 404
<210> 25
<211> 668
<212> DNA
<213> Artificial Sequence
<220>
<223> SNAP(full) whole_DNA
<400> 25
ggcgtaatac gactcactat agggttaact ttaataagga gatataaata tggacaaaga 60
ctgcgaaatg aagcgcacca ccctggatag ccctctgggc aagctggaac tgtctgggtg 120
cgaacagggc ctgcaccgta tcatcttcct gggcaaagga acatctgccg ccgacgccgt 180
ggaagtgcct gccccagccg ccgtgctggg cggaccagag ccactgatgc aggccaccgc 240
ctggctcaac gcctactttc accagcctga ggccatcgag gagttccctg tgccagccct 300
gcaccaccca gtgttccagc aggagagctt tacccgccag gtgctgtgga aactgctgaa 360
agtggtgaag ttcggagagg tcatcagcta cagccacctg gccgccctgg ccggcaatcc 420
cgccgccacc gccgccgtga aaaccgccct gagcggaaat cccgtgccca ttctgatccc 480
ctgccaccgg gtggtgcagg gcgacctgga cgtggggggc tacgagggcg ggctcgccgt 540
gaaagagtgg ctgctggccc acgagggcca cagactgggc aagcctgggc tgggtcctgc 600
aggcggatcc gcgtttaaac tcgaggttaa tggctctggc tctggctctg gctctggctc 660
taaaaaaa 668
<210> 26
<211> 194
<212> DNA
<213> Artificial Sequence
<220>
<223> UbNter_DNA
<400> 26
ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tgatgcagat 60
cttcgtgaag accctgaccg gcaagaccgc cactctggag gtggagccca gtgacaccat 120
cgaaaatgtg aaggccaaga tccaagataa agaaggcatc cccggctctg gctctggctc 180
tggctctaaa aaaa 194
<210> 27
<211> 209
<212> DNA
<213> Artificial Sequence
<220>
<223> UbCter_DNA
<400> 27
ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tgggcatccc 60
ccccgaccag cagaggctca tctttgcagg caagcagctg gaagatggcc gcactctttc 120
tgactacaac atccagaaag agtcgaccct gcacctggtc ctgcgcctga ggggtggcgg 180
ctctggctct ggctctggct ctaaaaaaa 209
<210> 28
<211> 332
<212> DNA
<213> Artificial Sequence
<220>
<223> UbI13A full_DNA
<400> 28
ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tgatgcagat 60
cttcgtgaag accctgaccg gcaagaccgc cactctggag gtggagccca gtgacaccat 120
cgaaaatgtg aaggccaaga tccaagataa agaaggcatc cccggctctg gctctggcat 180
cccccccgac cagcagaggc tcatctttgc aggcaagcag ctggaagatg gccgcactct 240
ttctgactac aacatccaga aagagtcgac cctgcacctg gtcctgcgcc tgaggggtgg 300
cggctctggc tctggctctg gctctaaaaa aa 332
<210> 29
<211> 182
<212> RNA
<213> Artificial Sequence
<220>
<223> GFP10-11
<400> 29
ggguuaacuu uaagaaggag auauacauau ggaccugccg gacgaccacu accugucuac 60
ccagaccauc cugcugaaag accugaacga aaaacgugac cacaugguuc ugcuggaaua 120
cguuaccgcg gcggguauca ccgacgcguc uggcucuggc ucuggcucug gcucuaaaaa 180
aa 182
<210> 30
<211> 119
<212> RNA
<213> Artificial Sequence
<220>
<223> GFP10
<400> 30
ggguuaacuu uaagaaggag auauacauau ggaccugccg gacgaccacu accugucuac 60
ccagaccauc cugcugaaag accugaacgg cucuggcucu ggcucuggcu cuaaaaaaa 119
<210> 31
<211> 125
<212> RNA
<213> Artificial Sequence
<220>
<223> GFP11
<400> 31
ggguuaacuu uaagaaggag auauacauau ggaaaaacgu gaucauaugg ugcugcugga 60
auaugugacc gcggcgggca uuaccgaugc gucuggcucu ggcucuggcu cuggcucuaa 120
aaaaa 125
<210> 32
<211> 99
<212> RNA
<213> Artificial Sequence
<220>
<223> Rapamycin-nucleic acid
<400> 32
ggguuaacuu uaagaaggag auauacauau gcaguuuaug uuuuaggaga uucugaggcc 60
gaccggcacc ggcaccggcg auagggcggc ggggacaaa 99
<210> 33
<211> 338
<212> RNA
<213> Artificial Sequence
<220>
<223> SNAP(N) whole_mRNA
<400> 33
ggguuaacuu uaauaaggag auauaaauau ggacaaagac ugcgaaauga agcgcaccac 60
ccuggauagc ccucugggca agcuggaacu gucugggugc gaacagggcc ugcaccguau 120
caucuuccug ggcaaaggaa caucugccgc cgacgccgug gaagugccug ccccagccgc 180
cgugcugggc ggaccagagc cacugaugca ggccaccgcc uggcucaacg ccuacuuuca 240
ccagccugag gccaucgagg aguucccugu gccagcccug caccacccag uguuccagca 300
gggcucuggc ucuggcucug gcucuggcuc uaaaaaaa 338
<210> 34
<211> 383
<212> RNA
<213> Artificial Sequence
<220>
<223> SNAP(C) whole_mRNA
<400> 34
ggguuaacuu uaauaaggag auauaaauau ggucgacgag agcuuuaccc gccaggugcu 60
guggaaacug cugaaagugg ugaaguucgg agaggucauc agcuacagcc accuggccgc 120
ccuggccggc aaucccgccg ccaccgccgc cgugaaaacc gcccugagcg gaaaucccgu 180
gcccauucug auccccugcc accggguggu gcagggcgac cuggacgugg ggggcuacga 240
gggcgggcuc gccgugaaag aguggcugcu ggcccacgag ggccacagac ugggcaagcc 300
ugggcugggu ccugcaggcg gauccgcguu uaaacucgag guuaauggcu cuggcucugg 360
cucuggcucu ggcucuaaaa aaa 383
<210> 35
<211> 647
<212> RNA
<213> Artificial Sequence
<220>
<223> SNAP(full) whole_mRNA
<400> 35
ggguuaacuu uaauaaggag auauaaauau ggacaaagac ugcgaaauga agcgcaccac 60
ccuggauagc ccucugggca agcuggaacu gucugggugc gaacagggcc ugcaccguau 120
caucuuccug ggcaaaggaa caucugccgc cgacgccgug gaagugccug ccccagccgc 180
cgugcugggc ggaccagagc cacugaugca ggccaccgcc uggcucaacg ccuacuuuca 240
ccagccugag gccaucgagg aguucccugu gccagcccug caccacccag uguuccagca 300
ggagagcuuu acccgccagg ugcuguggaa acugcugaaa guggugaagu ucggagaggu 360
caucagcuac agccaccugg ccgcccuggc cggcaauccc gccgccaccg ccgccgugaa 420
aaccgcccug agcggaaauc ccgugcccau ucugaucccc ugccaccggg uggugcaggg 480
cgaccuggac guggggggcu acgagggcgg gcucgccgug aaagaguggc ugcuggccca 540
cgagggccac agacugggca agccugggcu ggguccugca ggcggauccg cguuuaaacu 600
cgagguuaau ggcucuggcu cuggcucugg cucuggcucu aaaaaaa 647
<210> 36
<211> 173
<212> RNA
<213> Artificial Sequence
<220>
<223> UbNter_mRNA
<400> 36
ggguuaacuu uaagaaggag auauacauau gaugcagauc uucgugaaga cccugaccgg 60
caagaccgcc acucuggagg uggagcccag ugacaccauc gaaaauguga aggccaagau 120
ccaagauaaa gaaggcaucc ccggcucugg cucuggcucu ggcucuaaaa aaa 173
<210> 37
<211> 188
<212> RNA
<213> Artificial Sequence
<220>
<223> UbCter_mRNA
<400> 37
ggguuaacuu uaagaaggag auauacauau gggcaucccc cccgaccagc agaggcucau 60
cuuugcaggc aagcagcugg aagauggccg cacucuuucu gacuacaaca uccagaaaga 120
gucgacccug caccuggucc ugcgccugag ggguggcggc ucuggcucug gcucuggcuc 180
uaaaaaaa 188
<210> 38
<211> 311
<212> RNA
<213> Artificial Sequence
<220>
<223> UbI13A full_mRNA
<400> 38
ggguuaacuu uaagaaggag auauacauau gaugcagauc uucgugaaga cccugaccgg 60
caagaccgcc acucuggagg uggagcccag ugacaccauc gaaaauguga aggccaagau 120
ccaagauaaa gaaggcaucc ccggcucugg cucuggcauc ccccccgacc agcagaggcu 180
caucuuugca ggcaagcagc uggaagaugg ccgcacucuu ucugacuaca acauccagaa 240
agagucgacc cugcaccugg uccugcgccu gagggguggc ggcucuggcu cuggcucugg 300
cucuaaaaaa a 311
<210> 39
<211> 51
<212> PRT
<213> Artificial Sequence
<220>
<223> GFP10-GFP11-GS4
<400> 39
Met Asp Leu Pro Asp Asp His Tyr Leu Ser Thr Gln Thr Ile Leu Leu
1 5 10 15
Lys Asp Leu Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Tyr Val
20 25 30
Thr Ala Ala Gly Ile Thr Asp Ala Ser Gly Ser Gly Ser Gly Ser Gly
35 40 45
Ser Lys Lys
50
<210> 40
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> GFP10-GS4
<400> 40
Met Asp Leu Pro Asp Asp His Tyr Leu Ser Thr Gln Thr Ile Leu Leu
1 5 10 15
Lys Asp Leu Asn Gly Ser Gly Ser Gly Ser Gly Ser Lys Lys
20 25 30
<210> 41
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> GFP11-GS4
<400> 41
Met Glu Lys Arg Asp His Met Val Leu Leu Glu Tyr Val Thr Ala Ala
1 5 10 15
Gly Ile Thr Asp Ala Ser Gly Ser Gly Ser Gly Ser Gly Ser Lys Lys
20 25 30
<210> 42
<211> 103
<212> PRT
<213> Artificial Sequence
<220>
<223> splitSNAP (N)-GS5
<400> 42
Met Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu
1 5 10 15
Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Arg Ile Ile
20 25 30
Phe Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala
35 40 45
Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala
50 55 60
Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro
65 70 75 80
Val Pro Ala Leu His His Pro Val Phe Gln Gln Gly Ser Gly Ser Gly
85 90 95
Ser Gly Ser Gly Ser Lys Lys
100
<210> 43
<211> 118
<212> PRT
<213> Artificial Sequence
<220>
<223> SNAP (C)-GS5
<400> 43
Met Val Asp Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys
1 5 10 15
Val Val Lys Phe Gly Glu Val Ile Ser Tyr Ser His Leu Ala Ala Leu
20 25 30
Ala Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly
35 40 45
Asn Pro Val Pro Ile Leu Ile Pro Cys His Arg Val Val Gln Gly Asp
50 55 60
Leu Asp Val Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu
65 70 75 80
Leu Ala His Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala
85 90 95
Gly Gly Ser Ala Phe Lys Leu Glu Val Asn Gly Ser Gly Ser Gly Ser
100 105 110
Gly Ser Gly Ser Lys Lys
115
<210> 44
<211> 206
<212> PRT
<213> Artificial Sequence
<220>
<223> SNAP (full)-GS5
<400> 44
Met Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu
1 5 10 15
Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Arg Ile Ile
20 25 30
Phe Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala
35 40 45
Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala
50 55 60
Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro
65 70 75 80
Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg
85 90 95
Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile
100 105 110
Ser Tyr Ser His Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala
115 120 125
Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro
130 135 140
Cys His Arg Val Val Gln Gly Asp Leu Asp Val Gly Gly Tyr Glu Gly
145 150 155 160
Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu
165 170 175
Gly Lys Pro Gly Leu Gly Pro Ala Gly Gly Ser Ala Phe Lys Leu Glu
180 185 190
Val Asn Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Lys Lys
195 200 205
<210> 45
<211> 48
<212> PRT
<213> Artificial Sequence
<220>
<223> splitUb (N)-GS4
<400> 45
Met Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ala Thr Leu
1 5 10 15
Glu Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln
20 25 30
Asp Lys Glu Gly Ile Pro Gly Ser Gly Ser Gly Ser Gly Ser Lys Lys
35 40 45
<210> 46
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> splitUb (C)-GS4
<400> 46
Met Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys Gln
1 5 10 15
Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu Ser
20 25 30
Thr Leu His Leu Val Leu Arg Leu Arg Gly Gly Gly Ser Gly Ser Gly
35 40 45
Ser Gly Ser Lys Lys
50
<210> 47
<211> 94
<212> PRT
<213> Artificial Sequence
<220>
<223> splitUb (N-C)-GS4
<400> 47
Met Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ala Thr Leu
1 5 10 15
Glu Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln
20 25 30
Asp Lys Glu Gly Ile Pro Gly Ser Gly Ser Gly Ile Pro Pro Asp Gln
35 40 45
Gln Arg Leu Ile Phe Ala Gly Lys Gln Leu Glu Asp Gly Arg Thr Leu
50 55 60
Ser Asp Tyr Asn Ile Gln Lys Glu Ser Thr Leu His Leu Val Leu Arg
65 70 75 80
Leu Arg Gly Gly Gly Ser Gly Ser Gly Ser Gly Ser Lys Lys
85 90
<210> 48
<211> 233
<212> PRT
<213> Artificial Sequence
<220>
<223> Avi-Tev-His-GFP1-9
<400> 48
Met Gly Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu
1 5 10 15
Glu Asn Leu Tyr Phe Gln Gly His His His His His His Gly Gly Ser
20 25 30
Ser Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
35 40 45
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu
50 55 60
Gly Glu Gly Asp Ala Thr Ile Gly Lys Leu Thr Leu Lys Phe Ile Ser
65 70 75 80
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu
85 90 95
Thr Tyr Gly Val Gln Ala Phe Ser Arg Tyr Pro Asp His Met Lys Arg
100 105 110
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
115 120 125
Thr Ile Ser Phe Lys Asp Asp Gly Lys Tyr Lys Thr Arg Ala Val Val
130 135 140
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Thr
145 150 155 160
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
165 170 175
Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly
180 185 190
Ile Lys Ala Asn Phe Thr Val Arg His Asn Val Glu Asp Gly Ser Val
195 200 205
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Thr
210 215 220
Arg Gly Ser Gly Ser Ile Glu Gly Arg
225 230
<210> 49
<211> 320
<212> DNA
<213> Artificial Sequence
<220>
<223> Kpep-UbNter_DNA
<400> 49
gtaatacgac tcactatagg gttaacttta agaaggagat atacatatga aagtgagcgc 60
gctgaaagaa aacgtgagcg ccctgaaaga aaaagtgagc gcgctgaccg aaaaagtgag 120
cgcgctgaaa gagaaagtga gcgcgctgaa agaaggctct ggctctggct ctggctctat 180
gcagatcttc gtgaagaccc tgaccggcaa gaccgccact ctggaggtgg agcccagtga 240
caccatcgaa aatgtgaagg ccaagatcca agataaagaa ggcatccccg gctctggctc 300
tggctctggc tctaaaaaaa 320
<210> 50
<211> 320
<212> DNA
<213> Artificial Sequence
<220>
<223> Epep-UbNter_DNA
<400> 50
gtaatacgac tcactatagg gttaacttta agaaggagat atacatatga aagtgagcgc 60
gctggaaaac gaagtgagcg cgctggaaaa agaagtgagc gtgctggaaa aagaagtgag 120
cgcgctggaa aaagaagtgc gcgcgctgga aaaaggctct ggctctggct ctggctctat 180
gcagatcttc gtgaagaccc tgaccggcaa gaccgccact ctggaggtgg agcccagtga 240
caccatcgaa aatgtgaagg ccaagatcca agataaagaa ggcatccccg gctctggctc 300
tggctctggc tctaaaaaaa 320
<210> 51
<211> 338
<212> DNA
<213> Artificial Sequence
<220>
<223> Epep-UbCter_DNA
<400> 51
ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tgggcatccc 60
ccccgaccag cagaggctca tctttgcagg caagcagctg gaagatggcc gcactctttc 120
tgactacaac atccagaaag agtcgaccct gcacctggtc ctgcgcctga ggggtggcgg 180
ctctggctct ggctctggct ctaaagtgag cgcgctggaa aacgaagtga gcgcgctgga 240
aaaagaagtg agcgtgctgg aaaaagaagt gagcgcgctg gaaaaagaag tgcgcgcgct 300
ggaaaaaggc tctggctctg gctctggctc taaaaaaa 338
<210> 52
<211> 302
<212> RNA
<213> Artificial Sequence
<220>
<223> Kpep-UbNter_mRNA
<400> 52
ggguuaacuu uaagaaggag auauacauau gaaagugagc gcgcugaaag aaaacgugag 60
cgcccugaaa gaaaaaguga gcgcgcugac cgaaaaagug agcgcgcuga aagagaaagu 120
gagcgcgcug aaagaaggcu cuggcucugg cucuggcucu augcagaucu ucgugaagac 180
ccugaccggc aagaccgcca cucuggaggu ggagcccagu gacaccaucg aaaaugugaa 240
ggccaagauc caagauaaag aaggcauccc cggcucuggc ucuggcucug gcucuaaaaa 300
aa 302
<210> 53
<211> 302
<212> RNA
<213> Artificial Sequence
<220>
<223> Epep-UbNter_mRNA
<400> 53
ggguuaacuu uaagaaggag auauacauau gaaagugagc gcgcuggaaa acgaagugag 60
cgcgcuggaa aaagaaguga gcgugcugga aaaagaagug agcgcgcugg aaaaagaagu 120
gcgcgcgcug gaaaaaggcu cuggcucugg cucuggcucu augcagaucu ucgugaagac 180
ccugaccggc aagaccgcca cucuggaggu ggagcccagu gacaccaucg aaaaugugaa 240
ggccaagauc caagauaaag aaggcauccc cggcucuggc ucuggcucug gcucuaaaaa 300
aa 302
<210> 54
<211> 317
<212> RNA
<213> Artificial Sequence
<220>
<223> Epep-UbCter_mRNA
<400> 54
ggguuaacuu uaagaaggag auauacauau gggcaucccc cccgaccagc agaggcucau 60
cuuugcaggc aagcagcugg aagauggccg cacucuuucu gacuacaaca uccagaaaga 120
gucgacccug caccuggucc ugcgccugag ggguggcggc ucuggcucug gcucuggcuc 180
uaaagugagc gcgcuggaaa acgaagugag cgcgcuggaa aaagaaguga gcgugcugga 240
aaaagaagug agcgcgcugg aaaaagaagu gcgcgcgcug gaaaaaggcu cuggcucugg 300
cucuggcucu aaaaaaa 317
<210> 55
<211> 91
<212> PRT
<213> Artificial Sequence
<220>
<223> Kpep-splitUb(N)-GS4
<400> 55
Met Lys Val Ser Ala Leu Lys Glu Asn Val Ser Ala Leu Lys Glu Lys
1 5 10 15
Val Ser Ala Leu Thr Glu Lys Val Ser Ala Leu Lys Glu Lys Val Ser
20 25 30
Ala Leu Lys Glu Gly Ser Gly Ser Gly Ser Gly Ser Met Gln Ile Phe
35 40 45
Val Lys Thr Leu Thr Gly Lys Thr Ala Thr Leu Glu Val Glu Pro Ser
50 55 60
Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp Lys Glu Gly Ile
65 70 75 80
Pro Gly Ser Gly Ser Gly Ser Gly Ser Lys Lys
85 90
<210> 56
<211> 91
<212> PRT
<213> Artificial Sequence
<220>
<223> Epep-splitUb(N)-GS4
<400> 56
Met Lys Val Ser Ala Leu Glu Asn Glu Val Ser Ala Leu Glu Lys Glu
1 5 10 15
Val Ser Val Leu Glu Lys Glu Val Ser Ala Leu Glu Lys Glu Val Arg
20 25 30
Ala Leu Glu Lys Gly Ser Gly Ser Gly Ser Gly Ser Met Gln Ile Phe
35 40 45
Val Lys Thr Leu Thr Gly Lys Thr Ala Thr Leu Glu Val Glu Pro Ser
50 55 60
Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp Lys Glu Gly Ile
65 70 75 80
Pro Gly Ser Gly Ser Gly Ser Gly Ser Lys Lys
85 90
<210> 57
<211> 96
<212> PRT
<213> Artificial Sequence
<220>
<223> Epep-splitUb(C)-GS4
<400> 57
Met Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys Gln
1 5 10 15
Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu Ser
20 25 30
Thr Leu His Leu Val Leu Arg Leu Arg Gly Gly Gly Ser Gly Ser Gly
35 40 45
Ser Gly Ser Lys Val Ser Ala Leu Glu Asn Glu Val Ser Ala Leu Glu
50 55 60
Lys Glu Val Ser Val Leu Glu Lys Glu Val Ser Ala Leu Glu Lys Glu
65 70 75 80
Val Arg Ala Leu Glu Lys Gly Ser Gly Ser Gly Ser Gly Ser Lys Lys
85 90 95
<210> 58
<211> 533
<212> DNA
<213> Artificial Sequence
<220>
<223> Avi-His-splitNanoluc1-8
<400> 58
ccatgggcct gaacgatatt tttgaagcgc agaagattga gtggcacgaa caccatcatc 60
atcatcacgg tggtagcagc gtgttcaccc tggaggactt tgttggcgat tgggaacaga 120
ccgcggcgta caacctggac caggtgctgg agcaaggtgg cgttagcagc ctgctgcaga 180
acctggcggt gagcgttacc ccgatccaac gtattgttcg tagcggcgag aacgcgctga 240
agatcgacat tcacgtgatc attccgtatg aaggcctgag cgcggatcag atggcgcaaa 300
tcgaggaagt gttcaaggtg gtttacccgg ttgacgatca ccactttaaa gtgatcctgc 360
cgtatggtac cctggtgatt gacggcgtta ccccgaacat gctgaactac ttcggtcgtc 420
cgtatgaagg catcgcggtt tttgatggta agaaaattac cgttaccggc accctgtgga 480
acggcaacaa gattattgac gaacgcctga ttaccccgga ctaatgagga tcc 533
<210> 59
<211> 200
<212> DNA
<213> Artificial Sequence
<220>
<223> Nanoluc9-10
<400> 59
ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tgggcagcat 60
gctgtttcgt gtgaccatta acagcggcgg cggcagcggc ggcggcggca gcggcgtgag 120
cggctggcgt ctgtttaaaa aaattagcgg ttctggttct ggttctggtt ctgaaaacct 180
gtattttcag ggcaaaaaaa 200
<210> 60
<211> 137
<212> DNA
<213> Artificial Sequence
<220>
<223> Nanoluc-9
<400> 60
ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tgggcagcat 60
gctgtttcgt gtgaccatta acagcggttc tggttctggt tctggttctg aaaacctgta 120
ttttcagggc aaaaaaa 137
<210> 61
<211> 137
<212> DNA
<213> Artificial Sequence
<220>
<223> Nanoluc-10
<400> 61
ggcgtaatac gactcactat agggttaact ttaagaagga gatatacata tggtgagcgg 60
ctggcgtctg tttaaaaaaa ttagcggttc tggttctggt tctggttctg aaaacctgta 120
ttttcagggc aaaaaaa 137
<210> 62
<211> 179
<212> RNA
<213> Artificial Sequence
<220>
<223> Nanoluc9-10
<400> 62
ggguuaacuu uaagaaggag auauacauau gggcagcaug cuguuucgug ugaccauuaa 60
cagcggcggc ggcagcggcg gcggcggcag cggcgugagc ggcuggcguc uguuuaaaaa 120
aauuagcggu ucugguucug guucugguuc ugaaaaccug uauuuucagg gcaaaaaaa 179
<210> 63
<211> 116
<212> RNA
<213> Artificial Sequence
<220>
<223> Nanoluc-9
<400> 63
ggguuaacuu uaagaaggag auauacauau gggcagcaug cuguuucgug ugaccauuaa 60
cagcgguucu gguucugguu cugguucuga aaaccuguau uuucagggca aaaaaa 116
<210> 64
<211> 116
<212> RNA
<213> Artificial Sequence
<220>
<223> Nanoluc-10
<400> 64
ggguuaacuu uaagaaggag auauacauau ggugagcggc uggcgucugu uuaaaaaaau 60
uagcgguucu gguucugguu cugguucuga aaaccuguau uuucagggca aaaaaa 116
<210> 65
<211> 50
<212> PRT
<213> Artificial Sequence
<220>
<223> SplitNanoluc9-10-GS4-TEV
<400> 65
Met Gly Ser Met Leu Phe Arg Val Thr Ile Asn Ser Gly Gly Gly Ser
1 5 10 15
Gly Gly Gly Gly Ser Gly Val Ser Gly Trp Arg Leu Phe Lys Lys Ile
20 25 30
Ser Gly Ser Gly Ser Gly Ser Gly Ser Glu Asn Leu Tyr Phe Gln Gly
35 40 45
Lys Lys
50
<210> 66
<211> 29
<212> PRT
<213> Artificial Sequence
<220>
<223> SplitNanoluc-9-GS4-TEV
<400> 66
Met Gly Ser Met Leu Phe Arg Val Thr Ile Asn Ser Gly Ser Gly Ser
1 5 10 15
Gly Ser Gly Ser Glu Asn Leu Tyr Phe Gln Gly Lys Lys
20 25
<210> 67
<211> 29
<212> PRT
<213> Artificial Sequence
<220>
<223> SplitNanoluc-10-GS4-TEV
<400> 67
Met Val Ser Gly Trp Arg Leu Phe Lys Lys Ile Ser Gly Ser Gly Ser
1 5 10 15
Gly Ser Gly Ser Glu Asn Leu Tyr Phe Gln Gly Lys Lys
20 25
<210> 68
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Nanoluc_qPCR_Rvprimer
<400> 68
tttttttgcc ctgaaaatac aggttttc 28
<210> 69
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Fw primer for #13Rapa_F5
<400> 69
gatatacata tgcagtttat gtt 23
<210> 70
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Rv primer for #13Rapa_R4
<400> 70
ggtcggcctc agaatctcct a 21
<210> 71
<211> 231
<212> PRT
<213> Artificial Sequence
<220>
<223> GFP full
<400> 71
Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
1 5 10 15
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu
20 25 30
Gly Glu Gly Asp Ala Thr Ile Gly Lys Leu Thr Leu Lys Phe Ile Ser
35 40 45
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu
50 55 60
Thr Tyr Gly Val Gln Ala Phe Ser Arg Tyr Pro Asp His Met Lys Arg
65 70 75 80
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
85 90 95
Thr Ile Ser Phe Lys Asp Asp Gly Lys Tyr Lys Thr Arg Ala Val Val
100 105 110
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Thr
115 120 125
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
130 135 140
Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly
145 150 155 160
Ile Lys Ala Asn Phe Thr Val Arg His Asn Val Glu Asp Gly Ser Val
165 170 175
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Asp
180 185 190
Leu Pro Asp Asp His Tyr Leu Ser Thr Gln Thr Ile Leu Leu Lys Asp
195 200 205
Leu Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Tyr Val Thr Ala
210 215 220
Ala Gly Ile Thr Asp Ala Ser
225 230
<210> 72
<211> 191
<212> PRT
<213> Artificial Sequence
<220>
<223> GFP1-9
<400> 72
Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val
1 5 10 15
Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu
20 25 30
Gly Glu Gly Asp Ala Thr Ile Gly Lys Leu Thr Leu Lys Phe Ile Ser
35 40 45
Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu
50 55 60
Thr Tyr Gly Val Gln Ala Phe Ser Arg Tyr Pro Asp His Met Lys Arg
65 70 75 80
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg
85 90 95
Thr Ile Ser Phe Lys Asp Asp Gly Lys Tyr Lys Thr Arg Ala Val Val
100 105 110
Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Thr
115 120 125
Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn
130 135 140
Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly
145 150 155 160
Ile Lys Ala Asn Phe Thr Val Arg His Asn Val Glu Asp Gly Ser Val
165 170 175
Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
180 185 190
<210> 73
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> GFP10
<400> 73
Asp Leu Pro Asp Asp His Tyr Leu Ser Thr Gln Thr Ile Leu Leu Lys
1 5 10 15
Asp Leu Asn
<210> 74
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> GFP11
<400> 74
Glu Lys Arg Asp His Met Val Leu Leu Glu Tyr Val Thr Ala Ala Gly
1 5 10 15
Ile Thr Asp Ala Ser
20
<210> 75
<211> 76
<212> PRT
<213> Artificial Sequence
<220>
<223> Ubiquitin full
<400> 75
Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ala Thr Leu Glu
1 5 10 15
Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp
20 25 30
Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys
35 40 45
Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu
50 55 60
Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Gly
65 70 75
<210> 76
<211> 37
<212> PRT
<213> Artificial Sequence
<220>
<223> splitUb (N)
<400> 76
Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ala Thr Leu Glu
1 5 10 15
Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp
20 25 30
Lys Glu Gly Ile Pro
35
<210> 77
<211> 42
<212> PRT
<213> Artificial Sequence
<220>
<223> splitUb (C)
<400> 77
Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys Gln Leu
1 5 10 15
Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu Ser Thr
20 25 30
Leu His Leu Val Leu Arg Leu Arg Gly Gly
35 40
<210> 78
<211> 170
<212> PRT
<213> Artificial Sequence
<220>
<223> Nanoluc full
<400> 78
Met Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Glu Gln Thr Ala
1 5 10 15
Ala Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu
20 25 30
Leu Gln Asn Leu Ala Val Ser Val Thr Pro Ile Gln Arg Ile Val Arg
35 40 45
Ser Gly Glu Asn Ala Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr
50 55 60
Glu Gly Leu Ser Ala Asp Gln Met Ala Gln Ile Glu Glu Val Phe Lys
65 70 75 80
Val Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu Pro Tyr
85 90 95
Gly Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Leu Asn Tyr Phe
100 105 110
Gly Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr
115 120 125
Val Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu
130 135 140
Ile Thr Pro Asp Gly Ser Met Leu Phe Arg Val Thr Ile Asn Ser Val
145 150 155 160
Ser Gly Trp Arg Leu Phe Lys Lys Ile Ser
165 170
<210> 79
<211> 148
<212> PRT
<213> Artificial Sequence
<220>
<223> SplitNanoluc1-8
<400> 79
Met Val Phe Thr Leu Glu Asp Phe Val Gly Asp Trp Glu Gln Thr Ala
1 5 10 15
Ala Tyr Asn Leu Asp Gln Val Leu Glu Gln Gly Gly Val Ser Ser Leu
20 25 30
Leu Gln Asn Leu Ala Val Ser Val Thr Pro Ile Gln Arg Ile Val Arg
35 40 45
Ser Gly Glu Asn Ala Leu Lys Ile Asp Ile His Val Ile Ile Pro Tyr
50 55 60
Glu Gly Leu Ser Ala Asp Gln Met Ala Gln Ile Glu Glu Val Phe Lys
65 70 75 80
Val Val Tyr Pro Val Asp Asp His His Phe Lys Val Ile Leu Pro Tyr
85 90 95
Gly Thr Leu Val Ile Asp Gly Val Thr Pro Asn Met Leu Asn Tyr Phe
100 105 110
Gly Arg Pro Tyr Glu Gly Ile Ala Val Phe Asp Gly Lys Lys Ile Thr
115 120 125
Val Thr Gly Thr Leu Trp Asn Gly Asn Lys Ile Ile Asp Glu Arg Leu
130 135 140
Ile Thr Pro Asp
145
<210> 80
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> SplitNanoluc-9
<400> 80
Gly Ser Met Leu Phe Arg Val Thr Ile Asn Ser
1 5 10
<210> 81
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> SplitNanoluc-10
<400> 81
Val Ser Gly Trp Arg Leu Phe Lys Lys Ile Ser
1 5 10
<210> 82
<211> 194
<212> PRT
<213> Artificial Sequence
<220>
<223> SNAP (full)
<400> 82
Met Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu
1 5 10 15
Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Arg Ile Ile
20 25 30
Phe Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala
35 40 45
Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala
50 55 60
Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro
65 70 75 80
Val Pro Ala Leu His His Pro Val Phe Gln Gln Glu Ser Phe Thr Arg
85 90 95
Gln Val Leu Trp Lys Leu Leu Lys Val Val Lys Phe Gly Glu Val Ile
100 105 110
Ser Tyr Ser His Leu Ala Ala Leu Ala Gly Asn Pro Ala Ala Thr Ala
115 120 125
Ala Val Lys Thr Ala Leu Ser Gly Asn Pro Val Pro Ile Leu Ile Pro
130 135 140
Cys His Arg Val Val Gln Gly Asp Leu Asp Val Gly Gly Tyr Glu Gly
145 150 155 160
Gly Leu Ala Val Lys Glu Trp Leu Leu Ala His Glu Gly His Arg Leu
165 170 175
Gly Lys Pro Gly Leu Gly Pro Ala Gly Gly Ser Ala Phe Lys Leu Glu
180 185 190
Val Asn
<210> 83
<211> 91
<212> PRT
<213> Artificial Sequence
<220>
<223> SplitSNAP (N)
<400> 83
Met Asp Lys Asp Cys Glu Met Lys Arg Thr Thr Leu Asp Ser Pro Leu
1 5 10 15
Gly Lys Leu Glu Leu Ser Gly Cys Glu Gln Gly Leu His Arg Ile Ile
20 25 30
Phe Leu Gly Lys Gly Thr Ser Ala Ala Asp Ala Val Glu Val Pro Ala
35 40 45
Pro Ala Ala Val Leu Gly Gly Pro Glu Pro Leu Met Gln Ala Thr Ala
50 55 60
Trp Leu Asn Ala Tyr Phe His Gln Pro Glu Ala Ile Glu Glu Phe Pro
65 70 75 80
Val Pro Ala Leu His His Pro Val Phe Gln Gln
85 90
<210> 84
<211> 105
<212> PRT
<213> Artificial Sequence
<220>
<223> SplitSNAP (C)
<400> 84
Val Asp Glu Ser Phe Thr Arg Gln Val Leu Trp Lys Leu Leu Lys Val
1 5 10 15
Val Lys Phe Gly Glu Val Ile Ser Tyr Ser His Leu Ala Ala Leu Ala
20 25 30
Gly Asn Pro Ala Ala Thr Ala Ala Val Lys Thr Ala Leu Ser Gly Asn
35 40 45
Pro Val Pro Ile Leu Ile Pro Cys His Arg Val Val Gln Gly Asp Leu
50 55 60
Asp Val Gly Gly Tyr Glu Gly Gly Leu Ala Val Lys Glu Trp Leu Leu
65 70 75 80
Ala His Glu Gly His Arg Leu Gly Lys Pro Gly Leu Gly Pro Ala Gly
85 90 95
Gly Ser Ala Phe Lys Leu Glu Val Asn
100 105
<210> 85
<211> 173
<212> PRT
<213> Artificial Sequence
<220>
<223> Avi-His-spNluc1-8
<400> 85
Met Gly Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu
1 5 10 15
His His His His His His Gly Gly Ser Ser Val Phe Thr Leu Glu Asp
20 25 30
Phe Val Gly Asp Trp Glu Gln Thr Ala Ala Tyr Asn Leu Asp Gln Val
35 40 45
Leu Glu Gln Gly Gly Val Ser Ser Leu Leu Gln Asn Leu Ala Val Ser
50 55 60
Val Thr Pro Ile Gln Arg Ile Val Arg Ser Gly Glu Asn Ala Leu Lys
65 70 75 80
Ile Asp Ile His Val Ile Ile Pro Tyr Glu Gly Leu Ser Ala Asp Gln
85 90 95
Met Ala Gln Ile Glu Glu Val Phe Lys Val Val Tyr Pro Val Asp Asp
100 105 110
His His Phe Lys Val Ile Leu Pro Tyr Gly Thr Leu Val Ile Asp Gly
115 120 125
Val Thr Pro Asn Met Leu Asn Tyr Phe Gly Arg Pro Tyr Glu Gly Ile
130 135 140
Ala Val Phe Asp Gly Lys Lys Ile Thr Val Thr Gly Thr Leu Trp Asn
145 150 155 160
Gly Asn Lys Ile Ile Asp Glu Arg Leu Ile Thr Pro Asp
165 170
<210> 86
<211> 150
<212> PRT
<213> Artificial Sequence
<220>
<223> Hisx6-FKBP12-Link12-GFP11
<400> 86
Met His His His His His His Met Gly Val Gln Val Glu Thr Ile Ser
1 5 10 15
Pro Gly Asp Gly Arg Thr Phe Pro Lys Arg Gly Gln Thr Cys Val Val
20 25 30
His Tyr Thr Gly Met Leu Glu Asp Gly Lys Lys Phe Asp Ser Ser Arg
35 40 45
Asp Arg Asn Lys Pro Phe Lys Phe Met Leu Gly Lys Gln Glu Val Ile
50 55 60
Arg Gly Trp Glu Glu Gly Val Ala Gln Met Ser Val Gly Gln Arg Ala
65 70 75 80
Lys Leu Thr Ile Ser Pro Asp Tyr Ala Tyr Gly Ala Thr Gly His Pro
85 90 95
Gly Ile Ile Pro Pro His Ala Thr Leu Val Phe Asp Val Glu Leu Leu
100 105 110
Lys Leu Glu Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Thr
115 120 125
Ser Glu Lys Arg Asp His Met Val Leu Leu Glu Tyr Val Thr Ala Ala
130 135 140
Gly Ile Thr Asp Ala Ser
145 150
<210> 87
<211> 130
<212> PRT
<213> Artificial Sequence
<220>
<223> GFP10-Link12-FRB-Hisx6
<400> 87
Met Asp Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Thr Ile Leu Leu
1 5 10 15
Lys Asp Leu Asn Asp Val Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly
20 25 30
Gly Ser Glu Met Trp His Glu Gly Leu Glu Glu Ala Ser Arg Leu Tyr
35 40 45
Phe Gly Glu Arg Asn Val Lys Gly Met Phe Glu Val Leu Glu Pro Leu
50 55 60
His Ala Met Met Glu Arg Gly Pro Gln Thr Leu Lys Glu Thr Ser Phe
65 70 75 80
Asn Gln Ala Tyr Gly Arg Asp Leu Met Glu Ala Gln Glu Trp Cys Arg
85 90 95
Lys Tyr Met Lys Ser Gly Asn Val Lys Asp Leu Thr Gln Ala Trp Asp
100 105 110
Leu Tyr Tyr His Val Phe Arg Arg Ile Ser Lys Gln His His His His
115 120 125
His His
130
<210> 88
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> GS linker
<400> 88
Gly Gly Ser Ser
1
<210> 89
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> GS linker
<400> 89
Gly Gly Gly Ser
1
<210> 90
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> GS linker
<400> 90
Ser Gly Gly Gly
1
<210> 91
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> GS linker
<400> 91
Gly Ser Gly Ser
1
<210> 92
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> GS linker
<400> 92
Gly Gly Gly Gly Ser
1 5
<210> 93
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> GS linker
<400> 93
Ser Gly Gly Gly Gly
1 5
<210> 94
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> GS linker
<400> 94
Gly Gly Gly Gly Gly Ser
1 5
<210> 95
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> GS linker
<400> 95
Ser Gly Gly Gly Gly Gly
1 5
<210> 96
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> GS linker
<400> 96
Gly Gly Gly Gly Gly Gly Ser
1 5
<210> 97
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> GS linker
<400> 97
Ser Gly Gly Gly Gly Gly Gly
1 5
<210> 98
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Annealing seq. for Rapamycin-nucleic acid prep.
<400> 98
cccgtccccg ccgccct 17
<210> 99
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> SNAP_qPCR_Fw
<400> 99
gtaatacgac tcactatagg gttaacttta ataaggag 38
<210> 100
<211> 233
<212> PRT
<213> Artificial Sequence
<220>
<223> KRAS-FLAGSorHisTEV-Bio
<400> 100
Met Thr Glu Tyr Lys Leu Val Val Val Gly Ala Asp Gly Val Gly Lys
1 5 10 15
Ser Ala Leu Thr Ile Gln Leu Ile Gln Asn His Phe Val Asp Glu Tyr
20 25 30
Asp Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val Val Ile Asp Gly
35 40 45
Glu Thr Cys Leu Leu Asp Ile Leu Asp Thr Ala Gly Gln Glu Glu Tyr
50 55 60
Ser Ala Met Arg Asp Gln Tyr Met Arg Thr Gly Glu Gly Phe Leu Cys
65 70 75 80
Val Phe Ala Ile Asn Asn Thr Lys Ser Phe Glu Asp Ile His His Tyr
85 90 95
Arg Glu Gln Ile Lys Arg Val Lys Asp Ser Glu Asp Val Pro Met Val
100 105 110
Leu Val Gly Asn Lys Cys Asp Leu Pro Ser Arg Thr Val Asp Thr Lys
115 120 125
Gln Ala Gln Asp Leu Ala Arg Ser Tyr Gly Ile Pro Phe Ile Glu Thr
130 135 140
Ser Ala Lys Thr Arg Gln Gly Val Asp Asp Ala Phe Tyr Thr Leu Val
145 150 155 160
Arg Glu Ile Arg Lys His Lys Glu Lys Met Ser Lys Asp Gly Gly Ser
165 170 175
Ser Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly Ser Ser Leu Pro Met
180 185 190
Thr Gly Gly Gly Gly Ser Ser His His His His His His Ser Ser Gly
195 200 205
Glu Asn Leu Tyr Phe Gln Gly Ser Gly Gly Gly Leu Asn Asp Ile Phe
210 215 220
Glu Ala Gln Lys Ile Glu Trp His Glu
225 230
<210> 101
<211> 205
<212> PRT
<213> Artificial Sequence
<220>
<223> HAT-KRAS-nonbio
<400> 101
Met Lys Asp His Leu Ile His Asn Val His Lys Glu Glu His Ala His
1 5 10 15
Ala His Ser Ser Gly Ser Leu Val Pro Arg Gly Ser Ser Gly Gly Ser
20 25 30
Thr Glu Tyr Lys Leu Val Val Val Gly Ala Asp Gly Val Gly Lys Ser
35 40 45
Ala Leu Thr Ile Gln Leu Ile Gln Asn His Phe Val Asp Glu Tyr Asp
50 55 60
Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val Val Ile Asp Gly Glu
65 70 75 80
Thr Cys Leu Leu Asp Ile Leu Asp Thr Ala Gly Gln Glu Glu Tyr Ser
85 90 95
Ala Met Arg Asp Gln Tyr Met Arg Thr Gly Glu Gly Phe Leu Cys Val
100 105 110
Phe Ala Ile Asn Asn Thr Lys Ser Phe Glu Asp Ile His His Tyr Arg
115 120 125
Glu Gln Ile Lys Arg Val Lys Asp Ser Glu Asp Val Pro Met Val Leu
130 135 140
Val Gly Asn Lys Cys Asp Leu Pro Ser Arg Thr Val Asp Thr Lys Gln
145 150 155 160
Ala Gln Asp Leu Ala Arg Ser Tyr Gly Ile Pro Phe Ile Glu Thr Ser
165 170 175
Ala Lys Thr Arg Gln Gly Val Asp Asp Ala Phe Tyr Thr Leu Val Arg
180 185 190
Glu Ile Arg Lys His Lys Glu Lys Met Ser Lys Asp Gly
195 200 205
<210> 102
<211> 258
<212> PRT
<213> Artificial Sequence
<220>
<223> GST-HisTEV-Bio
<400> 102
Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro
1 5 10 15
Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu
20 25 30
Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu
35 40 45
Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys
50 55 60
Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn
65 70 75 80
Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu
85 90 95
Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser
100 105 110
Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu
115 120 125
Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn
130 135 140
Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp
145 150 155 160
Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu
165 170 175
Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr
180 185 190
Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala
195 200 205
Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Gly Gly Ser Ser
210 215 220
His His His His His His Ser Ser Gly Glu Asn Leu Tyr Phe Gln Gly
225 230 235 240
Ser Gly Gly Gly Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp
245 250 255
His Glu
<210> 103
<211> 258
<212> PRT
<213> Artificial Sequence
<220>
<223> GST-HisTEVAvi
<400> 103
Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro
1 5 10 15
Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu
20 25 30
Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu
35 40 45
Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys
50 55 60
Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn
65 70 75 80
Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu
85 90 95
Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser
100 105 110
Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu
115 120 125
Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn
130 135 140
Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp
145 150 155 160
Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu
165 170 175
Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr
180 185 190
Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala
195 200 205
Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Gly Gly Ser Ser
210 215 220
His His His His His His Ser Ser Gly Glu Asn Leu Tyr Phe Gln Gly
225 230 235 240
Ser Gly Gly Gly Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp
245 250 255
His Glu
<210> 104
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> GST-SrtAHis
<400> 104
Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro
1 5 10 15
Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu
20 25 30
Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu
35 40 45
Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys
50 55 60
Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn
65 70 75 80
Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu
85 90 95
Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser
100 105 110
Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu
115 120 125
Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn
130 135 140
Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp
145 150 155 160
Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu
165 170 175
Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr
180 185 190
Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala
195 200 205
Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Gly Gly Ser Ser
210 215 220
Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly Ser Ser Leu Pro Met Thr
225 230 235 240
Gly Gly Gly Gly Ser Ser His His His His His His His His
245 250
<210> 105
<211> 156
<212> PRT
<213> Artificial Sequence
<220>
<223> eSrtA
<400> 105
Met Gln Ala Lys Pro Gln Ile Pro Lys Asp Lys Ser Lys Val Ala Gly
1 5 10 15
Tyr Ile Glu Ile Pro Asp Ala Asp Ile Lys Glu Pro Val Tyr Pro Gly
20 25 30
Pro Ala Thr Arg Glu Gln Leu Asn Arg Gly Val Ser Phe Ala Glu Glu
35 40 45
Asn Glu Ser Leu Asp Asp Gln Asn Ile Ser Ile Ala Gly His Thr Phe
50 55 60
Ile Asp Arg Pro Asn Tyr Gln Phe Thr Asn Leu Lys Ala Ala Lys Lys
65 70 75 80
Gly Ser Met Val Tyr Phe Lys Val Gly Asn Glu Thr Arg Lys Tyr Lys
85 90 95
Met Thr Ser Ile Arg Asn Val Lys Pro Thr Ala Val Glu Val Leu Asp
100 105 110
Glu Gln Lys Gly Lys Asp Lys Gln Leu Thr Leu Ile Thr Cys Asp Asp
115 120 125
Tyr Asn Glu Glu Thr Gly Val Trp Glu Thr Arg Lys Ile Phe Val Ala
130 135 140
Thr Glu Val Lys Leu Glu His His His His His His
145 150 155
<210> 106
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> Sor-sp11-L12
<400> 106
Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Thr Ser Glu Lys
1 5 10 15
Arg Asp His Met Val Leu Leu Glu Tyr Val Thr Ala Ala Gly Ile Thr
20 25 30
Asp Ala Ser
35
<210> 107
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> Sor-sp10-12
<400> 107
Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Met Asp Leu Pro
1 5 10 15
Asp Asp His Tyr Leu Ser Thr Gln Thr Ile Leu Leu Lys Asp Leu Asn
20 25 30
<210> 108
<211> 228
<212> PRT
<213> Artificial Sequence
<220>
<223> KRAS-sp11
<400> 108
Met Thr Glu Tyr Lys Leu Val Val Val Gly Ala Asp Gly Val Gly Lys
1 5 10 15
Ser Ala Leu Thr Ile Gln Leu Ile Gln Asn His Phe Val Asp Glu Tyr
20 25 30
Asp Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val Val Ile Asp Gly
35 40 45
Glu Thr Cys Leu Leu Asp Ile Leu Asp Thr Ala Gly Gln Glu Glu Tyr
50 55 60
Ser Ala Met Arg Asp Gln Tyr Met Arg Thr Gly Glu Gly Phe Leu Cys
65 70 75 80
Val Phe Ala Ile Asn Asn Thr Lys Ser Phe Glu Asp Ile His His Tyr
85 90 95
Arg Glu Gln Ile Lys Arg Val Lys Asp Ser Glu Asp Val Pro Met Val
100 105 110
Leu Val Gly Asn Lys Cys Asp Leu Pro Ser Arg Thr Val Asp Thr Lys
115 120 125
Gln Ala Gln Asp Leu Ala Arg Ser Tyr Gly Ile Pro Phe Ile Glu Thr
130 135 140
Ser Ala Lys Thr Arg Gln Gly Val Asp Asp Ala Phe Tyr Thr Leu Val
145 150 155 160
Arg Glu Ile Arg Lys His Lys Glu Lys Met Ser Lys Asp Gly Gly Ser
165 170 175
Ser Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly Ser Ser Leu Pro Met
180 185 190
Thr Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Thr Ser Glu
195 200 205
Lys Arg Asp His Met Val Leu Leu Glu Tyr Val Thr Ala Ala Gly Ile
210 215 220
Thr Asp Ala Ser
225
<210> 109
<211> 225
<212> PRT
<213> Artificial Sequence
<220>
<223> KRAS-sp10
<400> 109
Met Thr Glu Tyr Lys Leu Val Val Val Gly Ala Asp Gly Val Gly Lys
1 5 10 15
Ser Ala Leu Thr Ile Gln Leu Ile Gln Asn His Phe Val Asp Glu Tyr
20 25 30
Asp Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val Val Ile Asp Gly
35 40 45
Glu Thr Cys Leu Leu Asp Ile Leu Asp Thr Ala Gly Gln Glu Glu Tyr
50 55 60
Ser Ala Met Arg Asp Gln Tyr Met Arg Thr Gly Glu Gly Phe Leu Cys
65 70 75 80
Val Phe Ala Ile Asn Asn Thr Lys Ser Phe Glu Asp Ile His His Tyr
85 90 95
Arg Glu Gln Ile Lys Arg Val Lys Asp Ser Glu Asp Val Pro Met Val
100 105 110
Leu Val Gly Asn Lys Cys Asp Leu Pro Ser Arg Thr Val Asp Thr Lys
115 120 125
Gln Ala Gln Asp Leu Ala Arg Ser Tyr Gly Ile Pro Phe Ile Glu Thr
130 135 140
Ser Ala Lys Thr Arg Gln Gly Val Asp Asp Ala Phe Tyr Thr Leu Val
145 150 155 160
Arg Glu Ile Arg Lys His Lys Glu Lys Met Ser Lys Asp Gly Gly Ser
165 170 175
Ser Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly Ser Ser Leu Pro Met
180 185 190
Thr Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Met Asp Leu
195 200 205
Pro Asp Asp His Tyr Leu Ser Thr Gln Thr Ile Leu Leu Lys Asp Leu
210 215 220
Asn
225
<210> 110
<211> 272
<212> PRT
<213> Artificial Sequence
<220>
<223> GST-sp10
<400> 110
Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro
1 5 10 15
Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu
20 25 30
Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu
35 40 45
Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys
50 55 60
Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn
65 70 75 80
Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu
85 90 95
Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser
100 105 110
Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu
115 120 125
Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn
130 135 140
Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp
145 150 155 160
Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu
165 170 175
Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr
180 185 190
Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala
195 200 205
Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Gly Gly Ser Ser
210 215 220
Asp Tyr Lys Asp Asp Asp Asp Lys Gly Gly Ser Ser Leu Pro Met Thr
225 230 235 240
Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser Met Asp Leu Pro
245 250 255
Asp Asp His Tyr Leu Ser Thr Gln Thr Ile Leu Leu Lys Asp Leu Asn
260 265 270
<210> 111
<211> 107
<212> DNA
<213> Artificial Sequence
<220>
<223> DNA library
<220>
<221> misc_feature
<222> (50)..(52)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<220>
<221> misc_feature
<222> (53)..(55)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<220>
<221> misc_feature
<222> (56)..(58)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<220>
<221> misc_feature
<222> (59)..(61)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<220>
<221> misc_feature
<222> (62)..(64)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<220>
<221> misc_feature
<222> (65)..(67)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<220>
<221> misc_feature
<222> (68)..(70)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<220>
<221> misc_feature
<222> (71)..(73)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<220>
<221> misc_feature
<222> (74)..(76)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<400> 111
gtaatacgac tcactatagg gttaacttta ataaggagat ataaatatgn nnnnnnnnnn 60
nnnnnnnnnn nnnnnntagc cgaccggcac cggcaccggc aaaaaaa 107
<210> 112
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> qPCR primer_Fw
<400> 112
gtaatacgac tcactatagg gttaacttta ataaggag 38
<210> 113
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> qPCR primer_Rv
<400> 113
tttttttgcc ggtgccggtg ccggtcggct a 31
<210> 114
<211> 156
<212> PRT
<213> Artificial Sequence
<220>
<223> FKBP-HisTEVAvi
<400> 114
Met Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe
1 5 10 15
Pro Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu
20 25 30
Asp Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys
35 40 45
Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val
50 55 60
Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp
65 70 75 80
Tyr Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala
85 90 95
Thr Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu Gly Gly Ser Ser
100 105 110
Leu Pro Met Thr Gly Gly Gly Gly Ser Ser His His His His His His
115 120 125
Ser Ser Gly Glu Asn Leu Tyr Phe Gln Gly Ser Gly Gly Gly Leu Asn
130 135 140
Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu
145 150 155
<210> 115
<211> 156
<212> PRT
<213> Artificial Sequence
<220>
<223> FKBP-SrtAHis
<400> 115
Met Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe
1 5 10 15
Pro Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu
20 25 30
Asp Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys
35 40 45
Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val
50 55 60
Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp
65 70 75 80
Tyr Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala
85 90 95
Thr Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu Gly Gly Ser Ser
100 105 110
Leu Pro Met Thr Gly Gly Gly Gly Ser Ser His His His His His His
115 120 125
Ser Ser Gly Glu Asn Leu Tyr Phe Gln Gly Ser Gly Gly Gly Leu Asn
130 135 140
Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu
145 150 155
<210> 116
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> sortase recognition sequence
<220>
<221> misc_feature
<222> (3)..(3)
<223> Xaa can be any naturally occurring amino acid
<400> 116
Leu Pro Xaa Thr Gly
1 5
<210> 117
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Fw-primer
<400> 117
gtaatacgac tcactatagg gttaacttta agaaggaga 39
<210> 118
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Rv-primer
<400> 118
tttgtccccg ccgccctatc gccggtgccg gtgccggtcg gct 43
<210> 119
<211> 104
<212> DNA
<213> Artificial Sequence
<220>
<223> v9case1 lib
<220>
<221> misc_feature
<222> (50)..(52)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<220>
<221> misc_feature
<222> (53)..(55)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<220>
<221> misc_feature
<222> (56)..(58)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<220>
<221> misc_feature
<222> (59)..(61)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<220>
<221> misc_feature
<222> (62)..(64)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<220>
<221> misc_feature
<222> (65)..(67)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<220>
<221> misc_feature
<222> (68)..(70)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<220>
<221> misc_feature
<222> (71)..(73)
<223> nnn = ttt, ttg, ctt, ctg, att, atg, gtt, gtg, tct, tcg, ccg, act,
gct, tac, cat, cag, aac, gat, gag, tgc, tgg, cgt, cgg, agt, agg,
or ggt
<400> 119
gtaatacgac tcactatagg gttaacttta ataaggagat ataaatatgn nnnnnnnnnn 60
nnnnnnnnnn nnntagccga ccggcaccgg caccggcaaa aaaa 104
<210> 120
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> v7c1 ID45_9 (ATG)
<220>
<221> misc_feature
<222> (50)..(52)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<220>
<221> misc_feature
<222> (53)..(55)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<220>
<221> misc_feature
<222> (56)..(58)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<220>
<221> misc_feature
<222> (59)..(61)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<220>
<221> misc_feature
<222> (62)..(64)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<220>
<221> misc_feature
<222> (65)..(67)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<220>
<221> misc_feature
<222> (68)..(70)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<220>
<221> misc_feature
<222> (71)..(73)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<220>
<221> misc_feature
<222> (74)..(76)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<400> 120
gtaatacgac tcactatagg gttaacttta agaaggagat atacatatgn nnnnnnnnnn 60
nnnnnnnnnn nnnnnnatgc cgaccggcac cggcaccggc gatagggcgg cggggacaaa 120
<210> 121
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> v7c1 ID45_9 (TAG)
<220>
<221> misc_feature
<222> (50)..(52)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<220>
<221> misc_feature
<222> (53)..(55)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<220>
<221> misc_feature
<222> (56)..(58)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<220>
<221> misc_feature
<222> (59)..(61)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<220>
<221> misc_feature
<222> (62)..(64)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<220>
<221> misc_feature
<222> (65)..(67)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<220>
<221> misc_feature
<222> (68)..(70)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<220>
<221> misc_feature
<222> (71)..(73)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<220>
<221> misc_feature
<222> (74)..(76)
<223> nnn = aac, act, agg, agt, att, cag, cat, ccg, cgg, cgt, cta, gaa,
gct, ggt, gta, tgc, tgg, or ttt
<400> 121
gtaatacgac tcactatagg gttaacttta agaaggagat atacatatgn nnnnnnnnnn 60
nnnnnnnnnn nnnnnntagc cgaccggcac cggcaccggc gatagggcgg cggggacaaa 120
<210> 122
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> v7c1 ID45_9 (ATG)
<220>
<221> misc_feature
<222> (32)..(34)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<220>
<221> misc_feature
<222> (35)..(37)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<220>
<221> misc_feature
<222> (38)..(40)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<220>
<221> misc_feature
<222> (41)..(43)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<220>
<221> misc_feature
<222> (44)..(46)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<220>
<221> misc_feature
<222> (47)..(49)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<220>
<221> misc_feature
<222> (50)..(52)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<220>
<221> misc_feature
<222> (53)..(55)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<220>
<221> misc_feature
<222> (56)..(58)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<400> 122
ggguuaacuu uaagaaggag auauacauau gnnnnnnnnn nnnnnnnnnn nnnnnnnnau 60
gccgaccggc accggcaccg gcgauagggc ggcggggaca aa 102
<210> 123
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> v7c1 ID45_9 (TAG)
<220>
<221> misc_feature
<222> (32)..(34)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<220>
<221> misc_feature
<222> (35)..(37)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<220>
<221> misc_feature
<222> (38)..(40)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<220>
<221> misc_feature
<222> (41)..(43)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<220>
<221> misc_feature
<222> (44)..(46)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<220>
<221> misc_feature
<222> (47)..(49)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<220>
<221> misc_feature
<222> (50)..(52)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<220>
<221> misc_feature
<222> (53)..(55)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<220>
<221> misc_feature
<222> (56)..(58)
<223> nnn = aac, acu, agg, agu, auu, cag, cau, ccg, cgg, cgu, cua, gaa,
gcu, ggu, gua, ugc, ugg, or uuu
<400> 123
ggguuaacuu uaagaaggag auauacauau gnnnnnnnnn nnnnnnnnnn nnnnnnnnua 60
gccgaccggc accggcaccg gcgauagggc ggcggggaca aa 102
<210> 124
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> GS linker
<400> 124
Gly Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Ser
1 5 10
Claims (15)
- 이하 (1) 및 (2)의 공정을 포함하는, 제1 표적 분자 및 제2 표적 분자와 함께 복합체를 형성할 수 있는 후보 분자를 스크리닝하는 방법:
(1) 제1 부분에 연결된 상기 제1 표적 분자, 제2 부분에 연결된 상기 제2 표적 분자, 및 복수의 피험 분자를 포함하는 라이브러리를 혼합하는 공정이고, 해당 제1 부분 및 해당 제2 부분이 단백질의 일부 또는 전부를 구성하는 공정; 및
(2) 공정(1) 후에, 상기 제1 부분과 상기 제2 부분이 근접 또는 회합하고 있는 것을 검출할 수 있는 제3 분자를 개재시킨 어피니티를 이용한 방법을 이용하여, 상기 제1 부분에 연결된 제1 표적 분자, 상기 제2 부분에 연결된 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체를 회수하는 공정. - 제 1 항에 있어서,
공정(2) 후에, 회수된 복합체에 포함되는 후보 분자를 동정하는 공정(공정(3))을 추가로 포함하는, 방법. - 제 1 항 또는 제 2 항에 있어서,
상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접 또는 회합한 경우에, 상기 제1 부분 및/또는 상기 제2 부분과 반응하는 분자인, 방법. - 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
상기 제3 분자는, 상기 제1 부분 및 상기 제2 부분이 근접도 회합도 하고 있지 않은 경우, 상기 제1 부분 및/또는 상기 제2 부분과 실질적으로 반응하지 않는 분자인, 방법. - 제 2 항 내지 제 4 항 중 어느 한 항에 있어서,
공정(2)와 공정(3) 사이에, 상기 제1 부분에 연결된 제1 표적 분자, 상기 제2 부분에 연결된 제2 표적 분자, 및 상기 후보 분자를 포함하는 복합체로부터 상기 후보 분자를 용출하는 공정(공정(2A))을 추가로 포함하는, 방법. - 제 5 항에 있어서,
공정(3)이, 공정(2A)에서 용출된 후보 분자를 인코드하는 폴리뉴클레오타이드의 서열을 결정하는 것을 포함하는, 방법. - 제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
공정(1) 및 (2)를 복수회 반복하는 공정을 포함하는, 방법. - 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
in vitro로 행해지는, 방법. - 제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
상기 라이브러리가, 디스플레이 라이브러리 또는 DNA 인코드 라이브러리인, 방법. - 제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
상기 라이브러리가, 1×104 이상의 다양성을 갖는 라이브러리인, 방법. - 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
상기 단백질이, GFP, 루시페라아제, 유비퀴틴, 또는 SNAP 태그인, 방법. - 제 1 항 내지 제 11 항 중 어느 한 항에 있어서,
상기 어피니티를 이용한 방법이, 풀다운법인, 방법. - 제 5 항 내지 제 12 항 중 어느 한 항에 있어서,
공정(2A)에 있어서의 용출이, 효소, 또는 열에 의해 행해지는, 방법. - 제 5 항 내지 제 13 항 중 어느 한 항에 있어서,
공정(2A)에 있어서의 용출이, 상기 단백질의 제1 부분과 상기 제1 표적 분자 사이에 위치하는 제1 링커, 및 상기 단백질의 제2 부분과 상기 제2 표적 분자 사이에 위치하는 제2 링커를 절단하는 것에 의해 행해지는, 방법. - 제 1 항 내지 제 14 항 중 어느 한 항에 있어서,
상기 제1 부분 및 제2 부분을 제공하는 상기 단백질이, 이하 (a)∼(c)로 이루어지는 군으로부터 선택되는 아미노산 서열을 포함하는, 방법;
(a) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열,
(b) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열에 있어서, 1 또는 복수의 아미노산이 결실, 삽입, 치환 및/또는 부가된 아미노산 서열, 및
(c) 서열 번호: 71, 75, 78, 또는 82로 표시되는 아미노산 서열과 80% 이상의 서열 동일성을 갖는 아미노산 서열.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPJP-P-2020-216004 | 2020-12-25 | ||
JP2020216004 | 2020-12-25 | ||
PCT/JP2021/048097 WO2022138892A1 (ja) | 2020-12-25 | 2021-12-24 | 複数の標的分子と共に複合体を形成し得る候補分子のスクリーニング方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230124938A true KR20230124938A (ko) | 2023-08-28 |
Family
ID=82158044
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237022183A KR20230124938A (ko) | 2020-12-25 | 2021-12-24 | 복수의 표적 분자와 함께 복합체를 형성할 수 있는후보 분자의 스크리닝 방법 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20240069033A1 (ko) |
EP (1) | EP4257978A1 (ko) |
JP (1) | JPWO2022138892A1 (ko) |
KR (1) | KR20230124938A (ko) |
CN (1) | CN116670284A (ko) |
TW (1) | TW202242415A (ko) |
WO (1) | WO2022138892A1 (ko) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9428845B1 (en) | 2010-12-28 | 2016-08-30 | Warp Drive Bio, Inc. | Identifying new therapeutic agents |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040053388A1 (en) * | 2002-01-03 | 2004-03-18 | Eckert Jorg H. | Detection of protein conformation using a split ubiquitin reporter system |
EP1828408A4 (en) * | 2004-12-04 | 2008-08-27 | Univ California Los Alamos Nat | PROTEIN-PROTEIN INTERACTION DETECTION SYSTEM USING FLUORESCENT PROTEIN MICRODOMANS |
DK3181687T3 (en) | 2009-05-01 | 2018-09-10 | Promega Corp | Synthetic oplophorus luciferases with increased light yield |
US8669103B2 (en) | 2010-11-02 | 2014-03-11 | Promega Corporation | Oplophorus-derived luciferases, novel coelenterazine substrates, and methods of use |
TWI640541B (zh) | 2011-12-28 | 2018-11-11 | 中外製藥股份有限公司 | Peptide compound having an annular portion and pharmaceutical composition thereof |
US20150099271A1 (en) * | 2013-10-04 | 2015-04-09 | Los Alamos National Security, Llc | Fluorescent proteins, split fluorescent proteins, and their uses |
JP7020910B2 (ja) | 2015-03-13 | 2022-02-16 | 中外製薬株式会社 | 改変アミノアシルtRNA合成酵素およびその用途 |
US10782304B2 (en) | 2015-06-24 | 2020-09-22 | INSERM (Institut National de la Santé et de la Recherche Médicale) | Methods for detecting protein-protein interactions |
US20190338050A1 (en) | 2016-03-03 | 2019-11-07 | Chugai Seiyaku Kabushiki8 Kaisha | Production method for noncyclic peptide-nucleic acid complex having, at n-terminal, amino acid with thiol group near amino group, library thereof, and cyclic peptide-nucleic acid complex library derived from same |
US10634680B2 (en) | 2016-04-26 | 2020-04-28 | University Of Utah Research Foundation | Target-binding activated split reporter systems for analyte detection and related components and methods |
JP7187323B2 (ja) | 2017-01-31 | 2022-12-12 | 中外製薬株式会社 | 無細胞翻訳系におけるペプチドの合成方法 |
WO2018225864A1 (ja) | 2017-06-09 | 2018-12-13 | 中外製薬株式会社 | 膜透過性の高い環状ペプチド化合物、及びこれを含むライブラリ |
CN113423877A (zh) | 2018-12-26 | 2021-09-21 | 中外制药株式会社 | 用于密码子扩展的突变tRNA |
CN110283244B (zh) * | 2019-07-10 | 2020-12-22 | 重庆医科大学 | 用于蛋白相互作用检测的分段绿色荧光蛋白系统 |
-
2021
- 2021-12-24 KR KR1020237022183A patent/KR20230124938A/ko unknown
- 2021-12-24 EP EP21911029.3A patent/EP4257978A1/en active Pending
- 2021-12-24 WO PCT/JP2021/048097 patent/WO2022138892A1/ja active Application Filing
- 2021-12-24 CN CN202180085635.4A patent/CN116670284A/zh active Pending
- 2021-12-24 TW TW110148605A patent/TW202242415A/zh unknown
- 2021-12-24 JP JP2022571665A patent/JPWO2022138892A1/ja active Pending
- 2021-12-24 US US18/268,470 patent/US20240069033A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9428845B1 (en) | 2010-12-28 | 2016-08-30 | Warp Drive Bio, Inc. | Identifying new therapeutic agents |
Non-Patent Citations (3)
Title |
---|
Cabantous, S. et al. Sci Rep. 2013; 3: 2854. doi: 10.1038/srep02854 |
Koraichi, F. et al. Journal of Cell Science 2018; 131: jcs210419 doi: 10.1242/jcs.210419 |
Ulrich, H. W. et al. CANCER GENOMICS & PROTEOMICS 10: 1-18 (2013) |
Also Published As
Publication number | Publication date |
---|---|
JPWO2022138892A1 (ko) | 2022-06-30 |
EP4257978A1 (en) | 2023-10-11 |
WO2022138892A1 (ja) | 2022-06-30 |
TW202242415A (zh) | 2022-11-01 |
US20240069033A1 (en) | 2024-02-29 |
CN116670284A (zh) | 2023-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Obexer et al. | Exploring sequence space: harnessing chemical and biological diversity towards new peptide leads | |
JP6440055B2 (ja) | ペプチドライブラリの製造方法、ペプチドライブラリ、及びスクリーニング方法 | |
Lee et al. | Glutamine (Q)‐peptide screening for transglutaminase reaction using mRNA display | |
Fleming et al. | Exploring the post-translational enzymology of PaaA by mRNA display | |
WO2014119600A1 (ja) | Flexible Display法 | |
JP6357154B2 (ja) | 荷電性非タンパク質性アミノ酸含有ペプチドの製造方法 | |
CN114829591A (zh) | 用于非核糖体肽合成酶和聚酮合成酶的适配器系统 | |
US20130288930A1 (en) | Efficient method for displaying protein multimer | |
JP4917044B2 (ja) | 非天然アミノ酸をタンパク質に導入するためのtRNA変異体 | |
Garbe et al. | Protein trans‐splicing on an M13 bacteriophage: towards directed evolution of a semisynthetic split intein by phage display | |
KR20230124938A (ko) | 복수의 표적 분자와 함께 복합체를 형성할 수 있는후보 분자의 스크리닝 방법 | |
WO2020080490A1 (ja) | ペプチドライブラリーの製造方法 | |
JP2011178691A (ja) | カテニン結合プローブとその用途 | |
JP2019073511A (ja) | アゾリン化合物及びアゾール化合物のライブラリー、並びにその製造方法 | |
AU2010336004B2 (en) | Protein display | |
KR102264642B1 (ko) | 단백질 스크리닝 및 검출 방법 | |
JP6478392B2 (ja) | 核酸リンカー | |
WO2015115661A1 (ja) | アゾール誘導体骨格を有するペプチドの製造方法 | |
KR102129377B1 (ko) | 특정 특성이 발현된 단백질을 암호화하는 플라스미드를 선별하는 유도 플라스미드 디스플레이 시스템 | |
WO2023048290A1 (ja) | ポリペプチドの作製方法、タグ、発現ベクター、ポリペプチドの評価方法、核酸ディスプレイライブラリの作製方法及びスクリーニング方法 | |
JP6057297B2 (ja) | 核酸構築物、核酸−蛋白質複合体、及びその利用 | |
Reyes et al. | PURE mRNA display and cDNA display provide rapid detection of consensus binding motif via high-throughput sequencing | |
KR20220113729A (ko) | 비천연 아미노산을 포함하는 펩타이드의 제조 방법 | |
CN116348479A (zh) | 用于产生丝状噬菌体的细菌菌毛蛋白质复合物FimGt-DsF稳定蛋白质复合物 | |
Truong | Expanding Protein Sequence Space through Incorporation of Non-Canonical Amino Acids |