KR102647829B1 - 삼량체를 형성하는 코로나-19 바이러스 (COVID-19, Coronavirus Disease 2019)의 재조합 스파이크 단백질 및 식물에서의 상기 재조합 스파이크 단백질의 대량 생산 방법과 이를 기반으로하는 백신조성물 제조 방법 - Google Patents
삼량체를 형성하는 코로나-19 바이러스 (COVID-19, Coronavirus Disease 2019)의 재조합 스파이크 단백질 및 식물에서의 상기 재조합 스파이크 단백질의 대량 생산 방법과 이를 기반으로하는 백신조성물 제조 방법 Download PDFInfo
- Publication number
- KR102647829B1 KR102647829B1 KR1020210052660A KR20210052660A KR102647829B1 KR 102647829 B1 KR102647829 B1 KR 102647829B1 KR 1020210052660 A KR1020210052660 A KR 1020210052660A KR 20210052660 A KR20210052660 A KR 20210052660A KR 102647829 B1 KR102647829 B1 KR 102647829B1
- Authority
- KR
- South Korea
- Prior art keywords
- protein
- recombinant
- leu
- thr
- ser
- Prior art date
Links
- 101710198474 Spike protein Proteins 0.000 title claims abstract description 90
- 229940096437 Protein S Drugs 0.000 title claims abstract description 83
- 238000004519 manufacturing process Methods 0.000 title claims description 22
- 241000700605 Viruses Species 0.000 title description 28
- 238000002255 vaccination Methods 0.000 title description 3
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 147
- 241001678559 COVID-19 virus Species 0.000 claims abstract description 63
- 239000013638 trimer Substances 0.000 claims abstract description 54
- 238000000034 method Methods 0.000 claims abstract description 31
- 102000004169 proteins and genes Human genes 0.000 claims description 86
- 241000196324 Embryophyta Species 0.000 claims description 79
- 239000013598 vector Substances 0.000 claims description 47
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 46
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 44
- 241000711573 Coronaviridae Species 0.000 claims description 35
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 18
- 239000012528 membrane Substances 0.000 claims description 13
- 102100028233 Coronin-1A Human genes 0.000 claims description 9
- 101000860852 Homo sapiens Coronin-1A Proteins 0.000 claims description 9
- 108010061994 Coronavirus Spike Glycoprotein Proteins 0.000 claims description 7
- 241000701489 Cauliflower mosaic virus Species 0.000 claims description 6
- 241000127282 Middle East respiratory syndrome-related coronavirus Species 0.000 claims description 5
- 241000315672 SARS coronavirus Species 0.000 claims description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 4
- 208000025721 COVID-19 Diseases 0.000 claims description 4
- 238000010298 pulverizing process Methods 0.000 claims description 4
- 102000007469 Actins Human genes 0.000 claims description 3
- 108010085238 Actins Proteins 0.000 claims description 3
- 241000894006 Bacteria Species 0.000 claims description 3
- 241000206602 Eukaryota Species 0.000 claims description 3
- 102000044159 Ubiquitin Human genes 0.000 claims description 3
- 108090000848 Ubiquitin Proteins 0.000 claims description 3
- 239000000427 antigen Substances 0.000 abstract description 18
- 102000036639 antigens Human genes 0.000 abstract description 18
- 108091007433 antigens Proteins 0.000 abstract description 18
- 230000005847 immunogenicity Effects 0.000 abstract description 13
- 230000002708 enhancing effect Effects 0.000 abstract description 2
- 102100039371 ER lumen protein-retaining receptor 1 Human genes 0.000 description 36
- 101000812437 Homo sapiens ER lumen protein-retaining receptor 1 Proteins 0.000 description 36
- 150000001413 amino acids Chemical class 0.000 description 33
- 229960005486 vaccine Drugs 0.000 description 33
- 230000003053 immunization Effects 0.000 description 26
- 238000002649 immunization Methods 0.000 description 26
- 210000004027 cell Anatomy 0.000 description 22
- 230000003472 neutralizing effect Effects 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 14
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 14
- 230000014509 gene expression Effects 0.000 description 14
- 108020004414 DNA Proteins 0.000 description 12
- 241000207746 Nicotiana benthamiana Species 0.000 description 11
- 239000000203 mixture Substances 0.000 description 11
- 238000000746 purification Methods 0.000 description 11
- 238000000926 separation method Methods 0.000 description 11
- 241001465754 Metazoa Species 0.000 description 10
- 238000007792 addition Methods 0.000 description 10
- 238000004440 column chromatography Methods 0.000 description 10
- 238000012217 deletion Methods 0.000 description 10
- 230000037430 deletion Effects 0.000 description 10
- 230000007717 exclusion Effects 0.000 description 10
- 108091033319 polynucleotide Proteins 0.000 description 10
- 102000040430 polynucleotide Human genes 0.000 description 10
- 239000002157 polynucleotide Substances 0.000 description 10
- 210000002966 serum Anatomy 0.000 description 10
- 239000013604 expression vector Substances 0.000 description 9
- 239000000284 extract Substances 0.000 description 9
- 108010089804 glycyl-threonine Proteins 0.000 description 9
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 9
- 108010061238 threonyl-glycine Proteins 0.000 description 9
- 239000002671 adjuvant Substances 0.000 description 8
- 238000001042 affinity chromatography Methods 0.000 description 8
- 102000022324 chaperone binding proteins Human genes 0.000 description 8
- 108091012160 chaperone binding proteins Proteins 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 208000015181 infectious disease Diseases 0.000 description 8
- 229940125575 vaccine candidate Drugs 0.000 description 8
- 238000001262 western blot Methods 0.000 description 8
- 241000880493 Leptailurus serval Species 0.000 description 7
- 241000699666 Mus <mouse, genus> Species 0.000 description 7
- 241000699670 Mus sp. Species 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 230000006698 induction Effects 0.000 description 7
- 108010057821 leucylproline Proteins 0.000 description 7
- 230000001681 protective effect Effects 0.000 description 7
- 230000004083 survival effect Effects 0.000 description 7
- 241000589158 Agrobacterium Species 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 6
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 6
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 6
- 108020003175 receptors Proteins 0.000 description 6
- 102000005962 receptors Human genes 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 241000699800 Cricetinae Species 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- 238000010171 animal model Methods 0.000 description 5
- 210000004369 blood Anatomy 0.000 description 5
- 239000008280 blood Substances 0.000 description 5
- 108010037850 glycylvaline Proteins 0.000 description 5
- 238000001764 infiltration Methods 0.000 description 5
- 108010027338 isoleucylcysteine Proteins 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 4
- XMIAMUXIMWREBJ-HERUPUMHSA-N Ala-Trp-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XMIAMUXIMWREBJ-HERUPUMHSA-N 0.000 description 4
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 4
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 4
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 4
- IZVICCORZOSGPT-JSGCOSHPSA-N Gly-Val-Tyr Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IZVICCORZOSGPT-JSGCOSHPSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- 244000309467 Human Coronavirus Species 0.000 description 4
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 4
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 4
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 4
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 4
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 4
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 4
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 210000004899 c-terminal region Anatomy 0.000 description 4
- NKLPQNGYXWVELD-UHFFFAOYSA-M coomassie brilliant blue Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=C1 NKLPQNGYXWVELD-UHFFFAOYSA-M 0.000 description 4
- 108010069495 cysteinyltyrosine Proteins 0.000 description 4
- 230000001086 cytosolic effect Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 4
- 108010087823 glycyltyrosine Proteins 0.000 description 4
- 230000008595 infiltration Effects 0.000 description 4
- 108010053037 kyotorphin Proteins 0.000 description 4
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 4
- 230000021633 leukocyte mediated immunity Effects 0.000 description 4
- 230000014759 maintenance of location Effects 0.000 description 4
- 239000013642 negative control Substances 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 108020003589 5' Untranslated Regions Proteins 0.000 description 3
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 3
- 241000288673 Chiroptera Species 0.000 description 3
- 108050007222 Coronin Proteins 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- MFVQGXGQRIXBPK-WDSKDSINSA-N Gly-Ala-Glu Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFVQGXGQRIXBPK-WDSKDSINSA-N 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 3
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 3
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 3
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 3
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 3
- 208000025370 Middle East respiratory syndrome Diseases 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 3
- CXBFHZLODKPIJY-AAEUAGOBSA-N Ser-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N CXBFHZLODKPIJY-AAEUAGOBSA-N 0.000 description 3
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 3
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 3
- 201000003176 Severe Acute Respiratory Syndrome Diseases 0.000 description 3
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 3
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 3
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 3
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 3
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 102000018123 coronin Human genes 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005194 fractionation Methods 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 238000007918 intramuscular administration Methods 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 239000013600 plasmid vector Substances 0.000 description 3
- 238000010186 staining Methods 0.000 description 3
- 230000010474 transient expression Effects 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- 230000005727 virus proliferation Effects 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 2
- LBJYAILUMSUTAM-ZLUOBGJFSA-N Ala-Asn-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LBJYAILUMSUTAM-ZLUOBGJFSA-N 0.000 description 2
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 2
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 2
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 2
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 2
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 2
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 2
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 2
- PVQLRJRPUTXFFX-CIUDSAMLSA-N Ala-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PVQLRJRPUTXFFX-CIUDSAMLSA-N 0.000 description 2
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 2
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 2
- 244000291564 Allium cepa Species 0.000 description 2
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 2
- 101100400074 Arabidopsis thaliana LTI65 gene Proteins 0.000 description 2
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 2
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 2
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 2
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 2
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 2
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 2
- VRZDJJWOFXMFRO-ZFWWWQNUSA-N Arg-Gly-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O VRZDJJWOFXMFRO-ZFWWWQNUSA-N 0.000 description 2
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 2
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 2
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 2
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 2
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 2
- QNJIRRVTOXNGMH-GUBZILKMSA-N Asn-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(N)=O QNJIRRVTOXNGMH-GUBZILKMSA-N 0.000 description 2
- QPTAGIPWARILES-AVGNSLFASA-N Asn-Gln-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QPTAGIPWARILES-AVGNSLFASA-N 0.000 description 2
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 2
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 2
- SUEIIIFUBHDCCS-PBCZWWQYSA-N Asn-His-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUEIIIFUBHDCCS-PBCZWWQYSA-N 0.000 description 2
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 2
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 2
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 2
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 2
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 2
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 2
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 2
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 2
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 2
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 2
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 2
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 2
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 2
- LTXGDRFJRZSZAV-CIUDSAMLSA-N Asp-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N LTXGDRFJRZSZAV-CIUDSAMLSA-N 0.000 description 2
- PGUYEUCYVNZGGV-QWRGUYRKSA-N Asp-Gly-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PGUYEUCYVNZGGV-QWRGUYRKSA-N 0.000 description 2
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 2
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 2
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 2
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 2
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 2
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 2
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 2
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 206010011224 Cough Diseases 0.000 description 2
- XMTDCXXLDZKAGI-ACZMJKKPSA-N Cys-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N XMTDCXXLDZKAGI-ACZMJKKPSA-N 0.000 description 2
- OIMUAKUQOUEPCZ-WHFBIAKZSA-N Cys-Asn-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIMUAKUQOUEPCZ-WHFBIAKZSA-N 0.000 description 2
- WDQXKVCQXRNOSI-GHCJXIJMSA-N Cys-Asp-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WDQXKVCQXRNOSI-GHCJXIJMSA-N 0.000 description 2
- WXKWQSDHEXKKNC-ZKWXMUAHSA-N Cys-Asp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N WXKWQSDHEXKKNC-ZKWXMUAHSA-N 0.000 description 2
- UYYZZJXUVIZTMH-AVGNSLFASA-N Cys-Glu-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UYYZZJXUVIZTMH-AVGNSLFASA-N 0.000 description 2
- DZSICRGTVPDCRN-YUMQZZPRSA-N Cys-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N DZSICRGTVPDCRN-YUMQZZPRSA-N 0.000 description 2
- ANRWXLYGJRSQEQ-CIUDSAMLSA-N Cys-His-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O ANRWXLYGJRSQEQ-CIUDSAMLSA-N 0.000 description 2
- VPQZSNQICFCCSO-BJDJZHNGSA-N Cys-Leu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VPQZSNQICFCCSO-BJDJZHNGSA-N 0.000 description 2
- CNAMJJOZGXPDHW-IHRRRGAJSA-N Cys-Pro-Phe Chemical compound N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O CNAMJJOZGXPDHW-IHRRRGAJSA-N 0.000 description 2
- JLZCAZJGWNRXCI-XKBZYTNZSA-N Cys-Thr-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O JLZCAZJGWNRXCI-XKBZYTNZSA-N 0.000 description 2
- JTEGHEWKBCTIAL-IXOXFDKPSA-N Cys-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CS)N)O JTEGHEWKBCTIAL-IXOXFDKPSA-N 0.000 description 2
- FCXJJTRGVAZDER-FXQIFTODSA-N Cys-Val-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O FCXJJTRGVAZDER-FXQIFTODSA-N 0.000 description 2
- NGOIQDYZMIKCOK-NAKRPEOUSA-N Cys-Val-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NGOIQDYZMIKCOK-NAKRPEOUSA-N 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- LVNILKSSFHCSJZ-IHRRRGAJSA-N Gln-Gln-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LVNILKSSFHCSJZ-IHRRRGAJSA-N 0.000 description 2
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 2
- JXBZEDIQFFCHPZ-PEFMBERDSA-N Gln-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JXBZEDIQFFCHPZ-PEFMBERDSA-N 0.000 description 2
- JKGHMESJHRTHIC-SIUGBPQLSA-N Gln-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JKGHMESJHRTHIC-SIUGBPQLSA-N 0.000 description 2
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 2
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 2
- DSRVQBZAMPGEKU-AVGNSLFASA-N Gln-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DSRVQBZAMPGEKU-AVGNSLFASA-N 0.000 description 2
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 2
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 2
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 2
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 2
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 2
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 2
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 2
- FKGNJUCQKXQNRA-NRPADANISA-N Glu-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O FKGNJUCQKXQNRA-NRPADANISA-N 0.000 description 2
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 2
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 2
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 2
- KJBGAZSLZAQDPV-KKUMJFAQSA-N Glu-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KJBGAZSLZAQDPV-KKUMJFAQSA-N 0.000 description 2
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 2
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 2
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 2
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 2
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 2
- SUDUYJOBLHQAMI-WHFBIAKZSA-N Gly-Asp-Cys Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O SUDUYJOBLHQAMI-WHFBIAKZSA-N 0.000 description 2
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 2
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 2
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 2
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 2
- YYXJFBMCOUSYSF-RYUDHWBXSA-N Gly-Phe-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYXJFBMCOUSYSF-RYUDHWBXSA-N 0.000 description 2
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 2
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 2
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 2
- KBBFOULZCHWGJX-KBPBESRZSA-N Gly-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN)O KBBFOULZCHWGJX-KBPBESRZSA-N 0.000 description 2
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 2
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 2
- KSOBNUBCYHGUKH-UWVGGRQHSA-N Gly-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN KSOBNUBCYHGUKH-UWVGGRQHSA-N 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- ULRFSEJGSHYLQI-YESZJQIVSA-N His-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ULRFSEJGSHYLQI-YESZJQIVSA-N 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 2
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 2
- YPQDTQJBOFOTJQ-SXTJYALSSA-N Ile-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N YPQDTQJBOFOTJQ-SXTJYALSSA-N 0.000 description 2
- PFTFEWHJSAXGED-ZKWXMUAHSA-N Ile-Cys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N PFTFEWHJSAXGED-ZKWXMUAHSA-N 0.000 description 2
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 2
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 2
- JLWLMGADIQFKRD-QSFUFRPTSA-N Ile-His-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CN=CN1 JLWLMGADIQFKRD-QSFUFRPTSA-N 0.000 description 2
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 2
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 2
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 2
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 2
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 2
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 2
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 2
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 2
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 2
- IPFKIGNDTUOFAF-CYDGBPFRSA-N Ile-Val-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IPFKIGNDTUOFAF-CYDGBPFRSA-N 0.000 description 2
- 102100037850 Interferon gamma Human genes 0.000 description 2
- 108010074328 Interferon-gamma Proteins 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 2
- YORLGJINWYYIMX-KKUMJFAQSA-N Leu-Cys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YORLGJINWYYIMX-KKUMJFAQSA-N 0.000 description 2
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 2
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 2
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 2
- APFJUBGRZGMQFF-QWRGUYRKSA-N Leu-Gly-Lys Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN APFJUBGRZGMQFF-QWRGUYRKSA-N 0.000 description 2
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 2
- OYQUOLRTJHWVSQ-SRVKXCTJSA-N Leu-His-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O OYQUOLRTJHWVSQ-SRVKXCTJSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 2
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 2
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 2
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 2
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 2
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 2
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 2
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 2
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 2
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 2
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 2
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 2
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 2
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 2
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 2
- OPTCSTACHGNULU-DCAQKATOSA-N Lys-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCCN OPTCSTACHGNULU-DCAQKATOSA-N 0.000 description 2
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 2
- IRRZDAIFYHNIIN-JYJNAYRXSA-N Lys-Gln-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IRRZDAIFYHNIIN-JYJNAYRXSA-N 0.000 description 2
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 2
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 2
- JYVCOTWSRGFABJ-DCAQKATOSA-N Lys-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N JYVCOTWSRGFABJ-DCAQKATOSA-N 0.000 description 2
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 2
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 2
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 2
- UIJVKVHLCQSPOJ-XIRDDKMYSA-N Lys-Ser-Trp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O UIJVKVHLCQSPOJ-XIRDDKMYSA-N 0.000 description 2
- ZVXSESPJMKNIQA-YXMSTPNBSA-N Lys-Thr-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ZVXSESPJMKNIQA-YXMSTPNBSA-N 0.000 description 2
- PELXPRPDQRFBGQ-KKUMJFAQSA-N Lys-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O PELXPRPDQRFBGQ-KKUMJFAQSA-N 0.000 description 2
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 2
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- BVXXDMUMHMXFER-BPNCWPANSA-N Met-Ala-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVXXDMUMHMXFER-BPNCWPANSA-N 0.000 description 2
- HLQWFLJOJRFXHO-CIUDSAMLSA-N Met-Glu-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O HLQWFLJOJRFXHO-CIUDSAMLSA-N 0.000 description 2
- 241000699660 Mus musculus Species 0.000 description 2
- 230000004988 N-glycosylation Effects 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 2
- HCTXJGRYAACKOB-SRVKXCTJSA-N Phe-Asn-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HCTXJGRYAACKOB-SRVKXCTJSA-N 0.000 description 2
- UUWCIPUVJJIEEP-SRVKXCTJSA-N Phe-Asn-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N UUWCIPUVJJIEEP-SRVKXCTJSA-N 0.000 description 2
- PSBJZLMFFTULDX-IXOXFDKPSA-N Phe-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N)O PSBJZLMFFTULDX-IXOXFDKPSA-N 0.000 description 2
- NKLDZIPTGKBDBB-HTUGSXCWSA-N Phe-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O NKLDZIPTGKBDBB-HTUGSXCWSA-N 0.000 description 2
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 2
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 2
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 2
- METZZBCMDXHFMK-BZSNNMDCSA-N Phe-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N METZZBCMDXHFMK-BZSNNMDCSA-N 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- CJAHQEZWDZNSJO-KKUMJFAQSA-N Phe-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CJAHQEZWDZNSJO-KKUMJFAQSA-N 0.000 description 2
- ZUQACJLOHYRVPJ-DKIMLUQUSA-N Phe-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZUQACJLOHYRVPJ-DKIMLUQUSA-N 0.000 description 2
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 2
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 2
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 2
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 2
- BQMFWUKNOCJDNV-HJWJTTGWSA-N Phe-Val-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BQMFWUKNOCJDNV-HJWJTTGWSA-N 0.000 description 2
- VDTYRPWRWRCROL-UFYCRDLUSA-N Phe-Val-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VDTYRPWRWRCROL-UFYCRDLUSA-N 0.000 description 2
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 2
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 2
- HQVPQXMCQKXARZ-FXQIFTODSA-N Pro-Cys-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O HQVPQXMCQKXARZ-FXQIFTODSA-N 0.000 description 2
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 2
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 2
- BUEIYHBJHCDAMI-UFYCRDLUSA-N Pro-Phe-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BUEIYHBJHCDAMI-UFYCRDLUSA-N 0.000 description 2
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 2
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 2
- WVXQQUWOKUZIEG-VEVYYDQMSA-N Pro-Thr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O WVXQQUWOKUZIEG-VEVYYDQMSA-N 0.000 description 2
- AJJDPGVVNPUZCR-RHYQMDGZSA-N Pro-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1)O AJJDPGVVNPUZCR-RHYQMDGZSA-N 0.000 description 2
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 2
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 2
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 2
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 2
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 2
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 2
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 2
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 2
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 2
- 101710137302 Surface antigen S Proteins 0.000 description 2
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 2
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 2
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 2
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 2
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 2
- WLDUCKSCDRIVLJ-NUMRIWBASA-N Thr-Gln-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O WLDUCKSCDRIVLJ-NUMRIWBASA-N 0.000 description 2
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 2
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 2
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 2
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 2
- HPQHHRLWSAMMKG-KATARQTJSA-N Thr-Lys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N)O HPQHHRLWSAMMKG-KATARQTJSA-N 0.000 description 2
- FDQXPJCLVPFKJW-KJEVXHAQSA-N Thr-Met-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O FDQXPJCLVPFKJW-KJEVXHAQSA-N 0.000 description 2
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 2
- VTMGKRABARCZAX-OSUNSFLBSA-N Thr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O VTMGKRABARCZAX-OSUNSFLBSA-N 0.000 description 2
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 2
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 2
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 2
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 2
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 2
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 2
- BPGDJSUFQKWUBK-KJEVXHAQSA-N Thr-Val-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 BPGDJSUFQKWUBK-KJEVXHAQSA-N 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 244000098338 Triticum aestivum Species 0.000 description 2
- ICNFHVUVCNWUAB-SZMVWBNQSA-N Trp-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ICNFHVUVCNWUAB-SZMVWBNQSA-N 0.000 description 2
- VUMCLPHXCBIJJB-PMVMPFDFSA-N Trp-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N VUMCLPHXCBIJJB-PMVMPFDFSA-N 0.000 description 2
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 2
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 2
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 2
- CKHQKYHIZCRTAP-SOUVJXGZSA-N Tyr-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CKHQKYHIZCRTAP-SOUVJXGZSA-N 0.000 description 2
- MPKPIWFFDWVJGC-IRIUXVKKSA-N Tyr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O MPKPIWFFDWVJGC-IRIUXVKKSA-N 0.000 description 2
- WAPFQMXRSDEGOE-IHRRRGAJSA-N Tyr-Glu-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O WAPFQMXRSDEGOE-IHRRRGAJSA-N 0.000 description 2
- LHTGRUZSZOIAKM-SOUVJXGZSA-N Tyr-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O LHTGRUZSZOIAKM-SOUVJXGZSA-N 0.000 description 2
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 2
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 2
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 2
- OLYXUGBVBGSZDN-ACRUOGEOSA-N Tyr-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 OLYXUGBVBGSZDN-ACRUOGEOSA-N 0.000 description 2
- PSALWJCUIAQKFW-ACRUOGEOSA-N Tyr-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N PSALWJCUIAQKFW-ACRUOGEOSA-N 0.000 description 2
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 2
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 2
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 2
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 2
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 2
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 2
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 2
- AFWXOGHZEKARFH-ACRUOGEOSA-N Tyr-Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=C(O)C=C1 AFWXOGHZEKARFH-ACRUOGEOSA-N 0.000 description 2
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 2
- LNYOXPDEIZJDEI-NHCYSSNCSA-N Val-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LNYOXPDEIZJDEI-NHCYSSNCSA-N 0.000 description 2
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 2
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 2
- AGKDVLSDNSTLFA-UMNHJUIQSA-N Val-Gln-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N AGKDVLSDNSTLFA-UMNHJUIQSA-N 0.000 description 2
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 2
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 2
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 2
- MJOUSKQHAIARKI-JYJNAYRXSA-N Val-Phe-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 MJOUSKQHAIARKI-JYJNAYRXSA-N 0.000 description 2
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 2
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 2
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 229940037003 alum Drugs 0.000 description 2
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 108010054812 diprotin A Proteins 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000003114 enzyme-linked immunosorbent spot assay Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 238000012226 gene silencing method Methods 0.000 description 2
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 2
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 2
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 2
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 230000028996 humoral immune response Effects 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 2
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 108010024607 phenylalanylalanine Proteins 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 239000000419 plant extract Substances 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- 238000011830 transgenic mouse model Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- 108010009962 valyltyrosine Proteins 0.000 description 2
- INOZZBHURUDQQR-AJNGGQMLSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(1h-imidazol-5-yl)propanoyl]amino]-3-carboxypropanoyl]amino]-4-carboxybutanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 INOZZBHURUDQQR-AJNGGQMLSA-N 0.000 description 1
- NWFLONJLUJYCNS-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-phenylpropanoyl)amino]acetyl]amino]acetyl]amino]-3-phenylpropanoic acid Chemical compound C=1C=CC=CC=1CC(C(O)=O)NC(=O)CNC(=O)CNC(=O)C(N)CC1=CC=CC=C1 NWFLONJLUJYCNS-UHFFFAOYSA-N 0.000 description 1
- CTRXDTYTAAKVSM-UHFFFAOYSA-N 3-{[ethyl({4-[(4-{ethyl[(3-sulfophenyl)methyl]amino}phenyl)(2-sulfophenyl)methylidene]cyclohexa-2,5-dien-1-ylidene})azaniumyl]methyl}benzene-1-sulfonate Chemical compound C=1C=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C(=CC=CC=2)S(O)(=O)=O)C=CC=1N(CC)CC1=CC=CC(S(O)(=O)=O)=C1 CTRXDTYTAAKVSM-UHFFFAOYSA-N 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- 102000053723 Angiotensin-converting enzyme 2 Human genes 0.000 description 1
- 108090000975 Angiotensin-converting enzyme 2 Proteins 0.000 description 1
- 108010037365 Arabidopsis Proteins Proteins 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 235000017060 Arachis glabrata Nutrition 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- 235000018262 Arachis monticola Nutrition 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 1
- UBKOVSLDWIHYSY-ACZMJKKPSA-N Asn-Glu-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UBKOVSLDWIHYSY-ACZMJKKPSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 1
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- ZQFRDAZBTSFGGW-SRVKXCTJSA-N Asp-Ser-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZQFRDAZBTSFGGW-SRVKXCTJSA-N 0.000 description 1
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 1
- 208000031504 Asymptomatic Infections Diseases 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 208000031648 Body Weight Changes Diseases 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 235000010149 Brassica rapa subsp chinensis Nutrition 0.000 description 1
- 235000000536 Brassica rapa subsp pekinensis Nutrition 0.000 description 1
- 241000499436 Brassica rapa subsp. pekinensis Species 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000282832 Camelidae Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 240000005250 Chrysanthemum indicum Species 0.000 description 1
- 244000241235 Citrullus lanatus Species 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 241000675108 Citrus tangerina Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 102100031673 Corneodesmosin Human genes 0.000 description 1
- 101710139375 Corneodesmosin Proteins 0.000 description 1
- 208000001528 Coronaviridae Infections Diseases 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 241000219112 Cucumis Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 240000004244 Cucurbita moschata Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 235000009355 Dianthus caryophyllus Nutrition 0.000 description 1
- 240000006497 Dianthus caryophyllus Species 0.000 description 1
- 235000011511 Diospyros Nutrition 0.000 description 1
- 241000723267 Diospyros Species 0.000 description 1
- 206010013975 Dyspnoeas Diseases 0.000 description 1
- 241000709661 Enterovirus Species 0.000 description 1
- 235000016623 Fragaria vesca Nutrition 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 235000011363 Fragaria x ananassa Nutrition 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 241000702463 Geminiviridae Species 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 1
- KZEUVLLVULIPNX-GUBZILKMSA-N Gln-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N KZEUVLLVULIPNX-GUBZILKMSA-N 0.000 description 1
- RGAOLBZBLOJUTP-GRLWGSQLSA-N Gln-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N RGAOLBZBLOJUTP-GRLWGSQLSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- KVBPDJIFRQUQFY-ACZMJKKPSA-N Glu-Cys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O KVBPDJIFRQUQFY-ACZMJKKPSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- HMHRTKOWRUPPNU-RCOVLWMOSA-N Gly-Ile-Gly Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O HMHRTKOWRUPPNU-RCOVLWMOSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 206010019233 Headaches Diseases 0.000 description 1
- 241000282375 Herpestidae Species 0.000 description 1
- KECFCPNPPYCGBL-PMVMPFDFSA-N His-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CN=CN4)N KECFCPNPPYCGBL-PMVMPFDFSA-N 0.000 description 1
- 101000596741 Homo sapiens Testis-specific protein TEX28 Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- CEPIAEUVRKGPGP-DSYPUSFNSA-N Ile-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 CEPIAEUVRKGPGP-DSYPUSFNSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 1
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- 241000234435 Lilium Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- 235000011430 Malus pumila Nutrition 0.000 description 1
- 235000015103 Malus silvestris Nutrition 0.000 description 1
- 244000070406 Malus silvestris Species 0.000 description 1
- 108010090054 Membrane Glycoproteins Proteins 0.000 description 1
- 102000012750 Membrane Glycoproteins Human genes 0.000 description 1
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 1
- FIZZULTXMVEIAA-IHRRRGAJSA-N Met-Ser-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FIZZULTXMVEIAA-IHRRRGAJSA-N 0.000 description 1
- 101100107522 Mus musculus Slc1a5 gene Proteins 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 241000208125 Nicotiana Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 206010068319 Oropharyngeal pain Diseases 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 240000004371 Panax ginseng Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 235000004347 Perilla Nutrition 0.000 description 1
- 244000124853 Perilla frutescens Species 0.000 description 1
- 201000007100 Pharyngitis Diseases 0.000 description 1
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 1
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 1
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- CZQZSMJXFGGBHM-KKUMJFAQSA-N Phe-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O CZQZSMJXFGGBHM-KKUMJFAQSA-N 0.000 description 1
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- 235000016761 Piper aduncum Nutrition 0.000 description 1
- 240000003889 Piper guineense Species 0.000 description 1
- 235000017804 Piper guineense Nutrition 0.000 description 1
- 235000008184 Piper nigrum Nutrition 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 102000029797 Prion Human genes 0.000 description 1
- 108091000054 Prion Proteins 0.000 description 1
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 1
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 1
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 1
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 1
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- 102000029301 Protein S Human genes 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 235000009827 Prunus armeniaca Nutrition 0.000 description 1
- 244000018633 Prunus armeniaca Species 0.000 description 1
- 240000005809 Prunus persica Species 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 240000001987 Pyrus communis Species 0.000 description 1
- 244000088415 Raphanus sativus Species 0.000 description 1
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 235000004789 Rosa xanthina Nutrition 0.000 description 1
- 241000109329 Rosa xanthina Species 0.000 description 1
- 208000037847 SARS-CoV-2-infection Diseases 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 1
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 1
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 1
- 235000003434 Sesamum indicum Nutrition 0.000 description 1
- 244000040738 Sesamum orientale Species 0.000 description 1
- 101000629318 Severe acute respiratory syndrome coronavirus 2 Spike glycoprotein Proteins 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 240000003829 Sorghum propinquum Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 230000024932 T cell mediated immunity Effects 0.000 description 1
- 102100035104 Testis-specific protein TEX28 Human genes 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 1
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 1
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 1
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 1
- NCGUQWSJUKYCIT-SZZJOZGLSA-N Thr-His-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NCGUQWSJUKYCIT-SZZJOZGLSA-N 0.000 description 1
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- KVEWWQRTAVMOFT-KJEVXHAQSA-N Thr-Tyr-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O KVEWWQRTAVMOFT-KJEVXHAQSA-N 0.000 description 1
- YXSSXUIBUJGHJY-SFJXLCSZSA-N Trp-Thr-Phe Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)[C@H](O)C)C(O)=O)C1=CC=CC=C1 YXSSXUIBUJGHJY-SFJXLCSZSA-N 0.000 description 1
- 241000722921 Tulipa gesneriana Species 0.000 description 1
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 1
- XFEMMSGONWQACR-KJEVXHAQSA-N Tyr-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XFEMMSGONWQACR-KJEVXHAQSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- DLLRRUDLMSJTMB-GUBZILKMSA-N Val-Ser-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N DLLRRUDLMSJTMB-GUBZILKMSA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 1
- 235000011453 Vigna umbellata Nutrition 0.000 description 1
- 240000001417 Vigna umbellata Species 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 244000126002 Ziziphus vulgaris Species 0.000 description 1
- 235000008529 Ziziphus vulgaris Nutrition 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 108010036533 arginylvaline Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 238000011888 autopsy Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 235000021015 bananas Nutrition 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 230000004579 body weight change Effects 0.000 description 1
- 229940105402 brillant blue Drugs 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 235000011148 calcium chloride Nutrition 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 230000004709 cell invasion Effects 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 210000005220 cytoplasmic tail Anatomy 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 231100000517 death Toxicity 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 230000029578 entry into host Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000005227 gel permeation chromatography Methods 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- 231100000869 headache Toxicity 0.000 description 1
- 108010041601 histidyl-aspartyl-glutamyl-leucine Proteins 0.000 description 1
- 230000004727 humoral immunity Effects 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 102000002574 p38 Mitogen-Activated Protein Kinases Human genes 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 235000021018 plums Nutrition 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010020432 prolyl-prolylisoleucine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 239000013639 protein trimer Substances 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 229940126583 recombinant protein vaccine Drugs 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 208000026425 severe pneumonia Diseases 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- 210000004989 spleen cell Anatomy 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 238000005829 trimerization reaction Methods 0.000 description 1
- 229920000785 ultra high molecular weight polyethylene Polymers 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000004580 weight loss Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8257—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8257—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
- C12N15/8258—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon for the production of oral vaccines (antigens) or immunoglobulins
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55505—Inorganic adjuvants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/57—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
- A61K2039/575—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 humoral response
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2511/00—Cells for large scale production
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20041—Use of virus, viral particle or viral elements as a vector
- C12N2770/20043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20051—Methods of production or purification of viral material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20071—Demonstrated in vivo effect
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Virology (AREA)
- Microbiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Gastroenterology & Hepatology (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Plant Pathology (AREA)
- Immunology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Communicable Diseases (AREA)
- Epidemiology (AREA)
- Mycology (AREA)
- Oncology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
Abstract
본 발명은 삼량체를 형성하는 코로나-19 바이러스의 재조합 스파이크 단백질 및 식물에서의 상기 재조합 스파이크 단백질을 대량 생산하는 방법에 관한 것으로서, 자세하게는 면역원성 증진 및 효과적인 항원 전달을 위한 목적으로 삼량체를 형성하는 코로나-19 바이러스의 재조합 스파이크 단백질을 발현하는 재조합 유전자를 디자인하는 방법 및 식물에서의 상기 재조합 스파이크 (Spike) 재조합 단백질을 대량 생산하는 방법에 관한 것이다.
Description
본 발명은 삼량체를 형성하는 코로나-19 바이러스의 재조합 스파이크 단백질 및 식물에서의 상기 재조합 스파이크 단백질을 대량 생산하는 방법에 관한 것으로서, 자세하게는 면역원성 증진 및 효과적인 항원 전달을 위한 목적으로 삼량체를 형성하는 코로나-19 바이러스의 재조합 스파이크 단백질을 발현하는 재조합 유전자를 디자인하는 방법 및 식물에서의 상기 재조합 스파이크(Spike) 재조합 단백질을 대량 생산하는 방법에 관한 것이다. 그리고 식물에서 생산된 삼량체 스파이크 단백질(trimeric spike protein)을 이용하여 COVID-19에 대해서 효과적인 백신물질을 제공하는 것이다.
최근에 식물에서 재조합 단백질을 저비용을 생산할 수 있는 가능성들이 제안되었으며, 이로 인하여 다양한 시도들이 진행되고 있다 (Schillberg et al., 2003; Holtz et al., 2015; Marusic et al., 2016). 특히 다양한 의료용 단백질의 생산 가능성 등을 확인하는 연구들이 진행되고 있다. 식물에서 재조합 단백질을 생산하는 경우에 다양한 장점들이 있을 수 있는데 그 중에 하나는 대장균 등 미생물에 존재하는 내독소와 같은 독소가 거의 존재하지 않는 다는 것과 인체에 감염할 수 있는 병원체들이 없다는 것이다. 또한 프리온과 같은 유해한 단백질도 없는 것으로 알려져 있어서 동물 세포나 미생물에 비해서 안전한 재조합 단백질을 생산할 수 있다는 것이다. 또한 제조 단가에서도 동물세포보다는 대단히 저렴하며, 식물을 재배하는 방법에 따라서 대규모 생산에 있어서는 대장균 등과 같은 미생물보다 더 경제적이다. 이러한 가능성을 실현하기 위해서는 몇 가지의 필수적인 기술들의 개발이 필요하다. 그 중에 가장 중요한 첫 번째 기술이 식물에서 유전자의 고발현을 유도할 수 있는 발현 벡터의 개발이다 (Staub et al, 2000; Regnard et al., 2010). 식물에서는 다양한 방법을 통해서 유전자의 발현을 유도할 수 있다. 재조합 유전자를 식물체의 게놈에 integration 시키는 방법, 엽록체의 게놈에 integration 시키는 방법, 아그로박테리움 (Agrobacterium)을 이용하여 일과성 있게 유전자를 발현시키는 방법 등 다양한 방법들이 가능하다 (Arzola et al., 2011; Werner et al., 2011). Nuclear genome이나 엽록체 genome에 재조합 유전자를 integration 시키는 방법은 기본적으로 형질전환체를 확보하는 과정을 통해서 식물에서 단백질을 생산하게 된다. 반면에 Agrobacterium을 식물 조직에 침투시켜 유전자의 일과성 발현을 유도하여 단백질을 생산하는 경우에는 형질 전환체의 제조 과정이 포함되지 않으므로 단백질 생산기간이 짧으며, 대체로 형질 전환체를 통한 단백질 생산에 비해서 단백질 생산 수준이 현저하게 높은 장점이 있다 (Arzola et al., 2011). 또한 식물이 가지고 있는 다른 유전자의 발현 억제 기작을 유전자 침묵 억제 인자를 co-infiltration하여 억제할 수 있으므로 단백질의 발현 수준을 더욱 높게 유도할 수 있다 (Garabagi et al., 2011). 그러나 일과성 발현을 하고자 할 때마다 목적 유전자를 포함하는 바이너리 벡터를 도입한 아그로박테리움 배양과 p38 유전자 침묵 억제 인자를 발현하는 바이너리 벡터를 도입한 아그로박테리움 배양을 따로 만들어서 이를 적절한 비율로 섞어서 co-infiltration 하는 과정을 수행하여야 하는 단점이 있다. 특히 두 종류의 아그로박테리움을 배양하는 경우에는 시간 및 경제적인 면에서 한계가 있다.
코로나 바이러스는 아데노바이러스, 리노바이러스와 함께 사람에게 감기를 일으키는 3대 바이러스 중 하나로, 사람과 다양한 감염될 수 있는 유전자 크기 27~32kb의 RNA 바이러스이다. 전자 현미경으로 봤을 때, 바이러스 입자 표면이 돌기처럼 튀어나와 있는데 이 모양이 마치 왕관처럼 생겼다고 해서 라틴어로 왕관을 뜻하는 “corona”에서 파생돼 명명됐다. 주로 추운 겨울철에 발생하는 성인 감기의 10 ~ 30를 차지하며, 두통이나 인후통, 기침을 동반한 코감기를 주 증상으로 한다. 코로나 바이러스는 1930년대 닭에서 처음으로 발견된 이후 개, 돼지, 조류 등의 동물에서 발견되었고, 1960년대에는 사람에서도 발견되었다. 코로나 바이러스는 동물과 사람 모두에게 발견되었고, 인간 활동 영역이 광범위해지면서 동물 사이에서만 유행하던 바이러스가 생존을 위해 유전자 변이를 일으켜 사람에게로 넘어오기도 한다. 예컨대 사스(박쥐와 사향 고양이), 메르스 (박쥐와 낙타), 코로나바이러스감염증-19(박쥐로 추정)가 이에 해당된다. 지금까지 발견된 코로나바이러스는 알파(Alpha)·베타(Beta)·감마(Gamma)·델타(Delta) 등 4속(屬)으로 분류된다. 여기서 알파는 다시 1a형과 1b형으로 나뉘고 베타는 2a, 2b, 2c, 2d형으로 나뉜다. 이 중 알파와 베타는 사람과 동물에게 감염되며, 감마와 델타는 동물에게 감염된다. 현재까지 확인된 인체 전염 코로나바이러스는 총 7종으로, HCoV 229E·HCoV NL63·HCoV OC43·HCoV HKU1·SARS-CoV·MERS-CoV·SARS-CoV-2가 이에 해당한다. 이 가운데 4종(229E, OC43, NL63, HKU1)은 감기와 비슷한 가벼운 증상만 일으킨다. 하지만 사스(SARS-CoV·중증급성호흡기증후군)와 메르스(MERS-CoV·중동호흡기증후군), 코로나바이러스감염증-19(SARS-CoV-2,severe acute respiratory syndrome coronavirus 2)는 중증 폐렴 등 심각한 호흡기 질환을 일으킬 수 있으며, 많은 사망자를 발생시킨다.
코로나-19 바이러스(COVID-19)은 2019년 12월 중국 우한에서 처음 발생한 이후 중국 전역과 전 세계로 확산된, 새로운 유형의 코로나바이러스(SARS-CoV-2)이다. 코로나-19 바이러스는 대단히 높은 전파율을 보여서 전염성이 특히 높다. 코로나-19 바이러스에 감염되면 약 2~14일(추정)의 잠복기를 거친 뒤 발열(37.5도) 및 기침이나 호흡곤란 등 호흡기 증상, 폐렴이 주증상으로 나타나지만 무증상 감염 사례도 드물지 않게 나오고 있다. 코로나-19 바이러스(COVID-19)의 스파이크 (S) 단백질은 대단히 커다란 ecto-domain 영역, 단일 막 관통(transmembrane domain; TMD) 및 짧은 세포질 꼬리 포함하는 타입 1의 막 당단백질(glycoprotein)이다. 상기 스파이크 단백질은 다른 코로나바이러스의 스파이크 (spike; S) 단백질과 마찬가지로 바이러스의 표면에 삼량체로 존재하며, 바이러스의 숙주세포 침입에 필요한 수용체 결합 영역 (receptor binding domain)과 세포 침입 시 바이러스 막과 세포 소기관막 사이의 융합을 유도하는 fusion peptide를 가지고 있으며, 자연 숙주에서 상기 스파이크 단백질에 대한 중화된 항체를 유도하는 등의 역할을 하는 것으로 알려져 있다. 상기 코로나 스파이크 단백질은 바이러스막의 표면에 삼량체로 존재한다. 따라서 삼량체형의 스파이크 단백질이 항원으로 작용할 것으로 생각되고 중화항체의 유도에도 삼량체가 중요할 것으로 생각된다. 비슷하게 인플루엔자 바이러스의 경우에도 HA 단백질이 바이러스의 표면에 삼량체로 존재하며 이 삼량체의 형성이 항원성이 높은 것으로 알려져 있다.
재조합 단백질은 안전성에서는 우수하지만 생 바이러스 (live virus)에 비해서는 면역원성이 낮고 생산단가가 높은 점이 단점이다. 따라서 이 안전성이 탁월한 재조합 단백질을 이용하여 효율적인 예방을 위해서는 다양한 면역반응을 유도할 수 있으며, 높은 면역반응을 유도할 수 있는 고면역원성의 재조합 단백질 백신을 제작하는 것이 필수적이며, 또한 효과적인 전달이 가능하도록 제작된 재조합 단백질이 필요하다.
코로나-19 바이러스의 재조합 스파이크 단백질을 이용하여 백신을 개발하고자 하였다. Spike protein은 COVID-19이 infection 하는 동안 S1과 S2의 두개의 subunit으로 processing이 일어나며 infection에 필요한 receptor에 binding 하는 domain은 S1에 존재하며, S2는 fusion peptide를 가지게 된다. 따라서 항원으로서 S1, S2, 또는 full length를 사용하였을 때 방어적인 면역효과에 있어서 어떤 효과를 줄지 예측하는 것은 쉽지 않다. S1은 RBD를 가지고 있으므로 RBD에 결합하는 항체를 유도할 수 있을 것이며 이러한 항체의 결합을 통해서 receptor에 결합을 방해하여 virus의 infection을 막을 수 있을 것이다. 반면에 S1은 가장 많은 mutation이 도입되는 부분을 포함하고 있으므로 다양한 변종을 커버할 수는 없을 가능성도 존재한다. 반면에 S2의 경우에는 유도되는 항체들이 virus가 receptor에 결합하는 것을 막을 수는 없을 것이지만 fusion step을 방해하는 항체를 생성할 수도 있을 것으로 예측할 수 있다. Full length의 경우에는 두 부분을 다 포함하므로 Receptor에 바이러스의 결합을 방해하는 항체와 fusion 과정을 방해하는 항체를 유도할 수도 있을 것이다. 하지만 항원으로 사용되는 단백질의 생산에 있어서 S1과 S2에 비교해 더 어려울 수도 있다.
이러한 다양한 고려를 바탕으로 스파이크 단백질(spike protein)을 식물에서 항원으로 생산하기 위해서 재조합 유전자를 구축하고자 하였다. 재조합 단백질의 대량 생산을 위해서 TMD와 cytosolic domain을 제외한 full length ecto-domain을 이용하여 재조합 단백질을 만들고자 하였으며, 특히 스파이크 단백질이 바이러스의 표면에 존재하는 형태인 ecto-domain만을 이용하여 삼량체를 만들어 항원성을 높이고자 하였다. 이를 위하여 코로나-19 바이러스의 스파이크 (Spike; (s))에서 16 번째 아미노산에서 1213번째 아미노산까지, 총 1198 개의 잔기를 포함하는 fragment (SfΔ(TMD-CT)이라 명명함)를 이용 하였다. 또한 코로나 바이러스의 스파이크 단백질에서 leader sequence가 없는 N-말단부터 16번째 아미노산에서 서브도메인 2(sub-domain 2; SD2)의 681번째 아미노산까지를 포함하는 S1 subunit (S1s라 명명); spike protein 중에서 돌연변이가 잘 일어나지 않는다고 알려진 S2 subunit의 C-terminal region에 존재하는 TMD와 cytosolic tail domain이 없는 fragment (682번째 아미노산에서 to 1213 번째 아미노산까지를 포함하는 부위로, 총 532 개의 잔기, [S2sΔ(TMD-CT)]로 명명함)를 이용하여 식물에서 발현 시스템을 구축하고자 하였다. 식물에서 생산된 이들 두 종류의 재조합 단백질을 만들고, 이들을 항원물질로 활용하여 백신으로 개발하고자 하였다. 스파이크 단백질의 전장(full length)은 바이러스의 표면에 존재할 때 삼량체(trimer)를 형성하지만 스파이크 단백질을 코딩하는 유전자 중 TMD 및 cytosolic region이 없는 엑토-도메인이나 TMD와 cytosolic domain이 없는 S2를 코딩하는 부분을 이용하여 재조합 단백질을 만들면 상기 재조합 단백질들은 삼량체를 잘 형성하지 않을 것으로 추정하였다. 백신 목적으로 사용하기 위해서 이들 두 종류의 재조합 단백질을 식물에서 삼량체(trimer)의 형태로 생산하는 기술을 개발하고자 하였다. 이렇게 제작된 재조합 스파이크 단백질을 발현할 수 있는 벡터를 식물에서 고발현하도록 하는 바이너리 벡터(binary vector)를 구축하였다.
또한 본 발명은 식물세포에 만들어진 이들 단백질을 순수 분리정제하여 백신 조성을 제공하는 것을 목적으로 한다. 식물세포에 만들어진 단백질의 수율을 높이기 위해서는 적절한 buffer 조성이 중요하다. 이들 단백질은 size가 크고 heavily glycosylated protein이므로 solubilization을 위하여 다양한 buffer 조성을 비교 분석하여 최적의 buffer 조성을 확보하여야 한다. 그리고 단백질의 분리정제는 C-terminal에 존재하는 His tag를 이용하여 Ni2+-NTA affinity column chromatography 및 size exclusion gel filtration column chromatography를 통해서 순수 분리 정제하고자 하였다.
그리고 이렇게 생산된 Spike protein의 trimeric 형태의 다양한 단백질을 이용하여 mouse와 hamster에 면역주사를 통해서 항체유도의 정도를 확인할 수 있으며 이렇게 유도된 항체들이 어느 정도의 방어능 (PRNT50)을 갖는지를 확인할 수 있다. 또한 hamster의 경우에는 COVID-19에 대해서 어느 정도 감수성을 가지고 있으므로 실제로 COVID-19의 공격접종을 통해서 바이러스의 증식에 대한 억제의 정도를 확인할 수 있다. 이러한 과정을 통해서 최적의 백신후보물질을 선발할 수 있다.
본 발명은 상기의 문제를 해결하기 위해 안착된 것으로, 본 발명의 목적은 (i) 코로나 바이러스의 full length 스파이크 단백질에서 막 관통 도메인 (trans-membrane domain)부터 C-말단까지 결여된 단백질 (SfΔ(TMD-CT); 또는 코로나 바이러스의 스파이크 단백질에서 leader sequence를 제외한 N-말단부터 서브도메인 2(sub-domain 2; SD2)까지를 포함하는 S1 subunit 단백질 (S1s); 또는 코로나 바이러스의 스파이크 단백질의 S2 subunit에서 막 관통 도메인 (trans-membrane domain)부터 C-말단까지가 결여된 단백질 S2sΔ(TMD-CT);을 코딩하는 유전자 및 (ii) mouse Coronin 1 (mCor1)의 삼량체 모티프(trimeric motif) 부위의 단백질을 코딩하는 유전자; 분리정제를 위해서 5개의 His residue를 코딩하는 유전자; 그리고 식물의 소포체에 축적되도록 하는 ER retention motif인 HDEL을 코딩하나는 유전자;를 포함하는 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질 SfΔ(TMD-CT):mCor1:Hisx5:HDEL (Sfull-t로 명명), S1:mCor1:Hisx5:HDEL (S1s-t으로 명명) 또는 S2Δ(TMD-CT):mCor1:Hisx5:HDEL (S2s-t로 명명)단백질을 생산하기 위한 재조합 벡터를 제공하는 것이다. 그리고 대조군으로서 mCor를 갖지 않는 SfΔ(TMD-CT):Hisx5:HDEL (Sfull-m으로 명명), S1:Hisx5:HDEL (S1s-m으로 명명) 또는 S2Δ(TMD-CT):Hisx5:HDEL (S2s-m으로 명명)단백질을 생산하기 위한 재조합 벡터를 제공하는 것이다.
본 발명의 다른 목적은 하기의 단계를 포함하는 식물에서 삼량체를 형성하는 코로나바이러스의 재조합 스파이크 단백질을 생산하는 방법을 제공하는 것이다:
(a) 상기 서술한 재조합 벡터를 제작하는 단계;
(b) 상기 재조합 벡터를 생물에 도입하여 형질 전환 생물을 제조하는 단계;
(c) 상기 형질 전환 생물을 배양하는 단계;
(d) 상기 배양물을 식물에 침윤하는 단계; 및
(e) 상기 식물을 분쇄하여 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 수득하는 단계.
본 발명의 다른 목적의 하나는 spike protein 유래의 재조합 단백질인 SfΔ(TMD-CT):mCor1:Hisx5:HDEL (Sfull-t로 명명), S1s:mCor1:Hisx5:HDEL (S1s-t으로 명명) 또는 S2sΔ(TMD-CT):mCor1:Hisx5:HDEL (S2s-t로 명명)을 식물세포에서 발현 후 식물추출물로부터 고효율로 분리정제하기 위한 조건을 제공하는 것이다.
본 발명의 다른 목적은 이들 여러 spike 유래의 재조합 단백질들 중 두 종류 SfΔ(TMD-CT):mCor1:Hisx5:HDEL과 S2sΔ(TMD-CT):mCor1:Hisx5:HDEL를 이용하여 COVID-19를 효과적으로 방어하는 백신조성물을 제공하는 것이다.
본 발명은 (i) 코로나 바이러스의 스파이크 단백질에서 막 관통 도메인 (trans-membrane domain)부터 C-말단까지 결여된 단백질 SfΔ(TMD-CT); 또는 코로나 바이러스의 스파이크 단백질의 S1 subunit을 포함하는 단백질 (S1s); 또는 코로나 바이러스의 스파이크 단백질의 S2 subunit에서 TMD 및 C-말단까지 결여된 단백질 S2sΔ(TMD-CT);을 포함하는 유전자, 및 (ii) Coronin 1 (mCor1)의 삼량체 모티프(trimeric motif) 부위의 단백질을 코딩하는 유전자; 분리정제를 위해서 5개의 His residue를 코딩하는 유전자; 그리고 식물의 소포체에 축적되도록 하는 ER retention motif인 HDEL을 코딩하나는 유전자;를 포함하는 삼량체를 형성하는 COVID-19 바이러스의 재조합 스파이크 단백질 Sfull-t 또는 S2s-t를 생산하기 위한 재조합 벡터를 제공하는 것이다.
상기 코로나 바이러스는 사스(SARS-Corona Virus), 메르스(MERS-Corona Virus) 및 코로나-19(SARS-Corona Virus-2)로 이루어진 군으로부터 선택되는 어느 하나일 수 있다.
상기 코로나-19 바이러스의 스파이크 단백질에서 막 관통 도메인 (transmembrane domain)부터 C-말단까지 결여된 단백질은 서열번호 2의 아미노산 서열을 포함할 수 있다.
상기 코로나-19 바이러스의 스파이크 단백질에서 막 관통 도메인 (transmembrane domain)부터 C-말단까지 결여된 단백질을 코딩하는 유전자는 서열번호 1의 염기서열을 포함할 수 있다.
상기 코로나-19 바이러스의 스파이크 단백질에서 S1 subunit의 16번째 아미노산에서 681번째 아미노산까지를 포함하는 단백질 (S1s)은 서열번호 4의 아미노산 서열을 포함할 수 있다.
상기 코로나-19 바이러스의 스파이크 단백질에서 S1 subunit의 16번째 아미노산에서 681 번째 아미노산까지를 포함하는 단백질을 코딩하는 유전자는 서열번호 3의 염기서열을 포함할 수 있다.
상기 코로나-19 바이러스의 스파이크 단백질에서 S2 subunit의 682번째 아미노산에서 1213번째 아미노산까지를 포함하는 단백질은 서열번호 6의 아미노산 서열을 포함할 수 있다.
상기 코로나-19 바이러스의 스파이크 단백질에서 S2 subunit의 682번째 아미노산에서 1213번째 아미노산까지를 포함하는 단백질을 코딩하는 유전자는 서열번호 5의 염기서열을 포함할 수 있다.
상기 Coronin 1 (mCor1)의 삼량체 모티브(trimeric motif) 부위의 단백질은 서열번호 8의 아미노산 서열을 포함할 수 있다.
상기 Coronin 1 (mCor1)의 삼량체 모티브(trimeric motif) 부위의 단백질을 코딩하는 유전자는 서열번호 7의 염기서열을 포함할 수 있다.
상기 5'-UTR의 코딩하는 유전자는 서열번호 14의 염기서열을 포함할 수 있다.
본 발명은 또한 상기 재조합 벡터에 Hisx5 tag의 단백질을 코딩하는 유전자를 추가로 포함하는 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터를 제공할 수 있다.
본 발명은 또한 상기 재조합 벡터에 HDEL motif의 단백질을 코딩하는 유전자를 추가로 포함하는 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터를 제공할 수 있다.
상기 HDEL motif의 단백질은 서열번호 13의 아미노산 서열을 포함할 수 있다.
상기 HDEL motif 도메인의 단백질을 코딩하는 유전자는 서열번호 12의 염기서열을 포함할 수 있다.
상기 재조합 벡터는 꽃양배추 모자이크 바이러스 (cauliflower mosaic virus)에서 유래한 35S 프로모터, 꽃양배추 모자이크 바이러스 (cauliflower mosaic virus)에서 유래한 19S RNA 프로모터, Mac 프로모터 (Mac promoter), 식물의 액틴 단백질 프로모터 및 유비퀴틴 단백질 프로모터로 이루어진 군으로부터 선택되는 어느 하나의 프로모터를 추가로 포함할 수 있다.
본 발명은 또한 상기 재조합 벡터로 형질 전환된 형질 전환 생물을 제공할 수 있다.
상기 형질 전환된 형질 전환 생물은 원핵생물 또는 진핵생물일 수 있다.
본 발명은 하기의 단계를 포함하는 식물에서 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하는 방법을 제공할 수 있다:
(a) 상기 서술한 재조합 벡터를 제작하는 단계;
(b) 상기 재조합 벡터를 생물에 도입하여 형질 전환 생물을 제조하는 단계;
(c) 상기 형질 전환 생물을 배양하는 단계;
(d) 상기 배양물을 식물에 침윤하는 단계; 및
(e) 상기 식물을 분쇄하여 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 수득하는 단계.
본 발명은 식물 추출물로부터 Sfull-t와 S2s-t단백질 등을 Ni2+-NTA affinity column chromatography와 size exclusion column chromatography를 이용하여 분리 정제하는 과정을 통해서 백신후보물질의 생산방법을 제공할 수 있다.
본 발명의 다른 목적은 이들 두 종류의 spike protein인 Sfull-t과 S2s-t을 이용하여 COVID-19를 효과적으로 방어하는 백신조성물을 제공하는 것이다. 이들 단백질을 adjuvant와 함께, 또는 adjuvant 없이 단독으로 백신조성물을 제공할 수 있으며, 단백질의 양은 1 microgram에서부터 30 microgram에 이를 수 있다.
본 발명의 삼량체를 형성하는 코로나-19 바이러스의 재조합 스파이크 단백질은 코로나-19 바이러스의 스파이크 단백질의 막관통 도메인에서 C-말단까지 결여된 스파이크 단백질의 엑토-도메인(ecto-domain; 16 번째 아미노산에서 1213번째 아미노산 까지, 총 1198 개의 잔기)으로 구성된 Se 단백질, 또는 코로나 바이러스의 스파이크 단백질에서 S1 subunit의 16 번째 아미노산에서 681 번째 아미노산 까지를 포함하는 단백질 (총 666개의 잔기), 또는 코로나 바이러스의 스파이크 단백질에서 막 관통 도메인 (trans-membrane domain)부터 C-말단까지 결여된 S2 subunit의 682 번째 아미노산에서 1213 번째 아미노산까지를 포함하는 단백질 (총 532개의 잔기);을 코딩하는 유전자, 마우스의 Coronin 1의 삼량체 모티프 (trimeric motif)를 가져서 삼량체를 형성하여 면역성이 증가하며, C-terminal 말단에 HDEL을 포함하여 식물의 소포체에서 단백질의 축적이 되도록 되어 있어서 식물에서 다량으로 제조 할 수 있고, His tag domain을 C-말단 부위에 포함하여 단백질의 분리정제를 쉽게 하도록 되어 있는 재조합 단백질을 구성한다.
이렇게 식물에서 생산된 COVID-19의 S protein의 Sfull-t, 또는 S2s-t 재조합 단백질로 구성된 백신조성물을 포함한다. 이 백신 조성물은 식물생산 단백질로만 이루어질 수도 있고 alum과 같은 adjuvant를 포함할 수도 있다.
도 1은 본 발명에서 사용한 여러 재조합 벡터의 구성을 나타낸 도면이다.
도 2는 His tag, HDEL을 갖는 SfΔ(TMD-CT), S1s와 S2sΔ(TMD-CT) 단백질과 이들 3 종류의 단백질이 추가적으로 mCor1을 단백질을 발현하는 N. benthamiana의 총 추출물을 SDS/PAGE로 분리한 후 anti-His antibody를 이용하여 western blot 분석 및 Coomassie brillant blue로 염색한 결과를 나타낸 것이다.
도 3은 N. benthamiana extract로부터 Ni2+-NTA 친화 컬럼 크로마토그래피를 이용하여 Sfull-t과 S2s-t을 순수 분리정제하고 이를 SDS/PAGE로 전개한 후 anti-His antibody를 이용하여 Western blot으로 분석한 후 membrane을 다시 Coomassie brillient blue로 염색한 결과를 나타낸 것이다.
도 4는 N. benthamiana extract로부터 Ni2+-NTA 친화 컬럼 크로마토그래피를 이용하여 분리한 Sfull-t을 size-exclusion column chromatography로 fractionation하고 이들 분획을 SDS/PAGE로 전개한 후 Coomassie brillient blue로 염색한 결과를 나타낸 것이다.
도 5는 N. benthamiana extract로부터 Ni2+-NTA 친화 컬럼 크로마토그래피를 이용하여 분리된 Sfull-t과 Sfull-m을 순수 분리정제하고 이들을 size exclusion column chromatography로 fractionation한 후 이들 fraction을 anti-His antibody를 이용하여 western blot 분석을 한 결과와 분리 정제된 Sfull-t을 negative staining을 한 후 이 단백질을 전자현미경을 이용하여 단백질의 morphology를 확인한 결과 trimer를 형성한다는 것을 확인한 결과이다.
도 6은 N. benthamiana extract로부터 Ni2+-NTA 친화 컬럼 크로마토그래피를 이용하여 분리한 S2s-t을 size-exclusion column chromatography로 fractionation하고 이들 분획을 SDS/PAGE로 전개한 후 Coomassie brillient blue로 염색한 결과를 나타낸 것이다.
도 7은 COVID-19 식물백신 후보물질의 실험동물 (마우스, Balb/c)에서의 면역원성 평가한 결과를 나타낸 것이다. 이를 위해서 체액성 면역반응 분석 (도 7B), 중화항체 유도 분석 (도 7C, D) 및 세포매개면역반응 분석 (도 7E)을 수행한 후 그 결과를 나타내었다.
도 8은 COVID-19 식물백신 후보물질의 실험동물 (TG마우스)에서의 보호효능 평가를 수행한 실험으로 각 면역항원은 근육 내 경로로 2주 간격으로 총 2회 면역하였으며, 면역항원에 대한 항체 생성을 확인하기 위해, 면역 전, 1차 면역, 2차 면역 2주 후 채혈을 실시하여 혈청에서의 항체(IgGs) 생성 및 중화항체 생성 등의 면역원성 평가를 실시한 결과를 나타내었으며 (도 8A), 식물백신 면역에 따른 항체유도 분석 (도 8B), 식물백신 면역에 따른 햄스터 공격접종에 따른 생존율 및 조직역가 분석 (도 8 C, D, E)한 결과를 나타내었다.
도 2는 His tag, HDEL을 갖는 SfΔ(TMD-CT), S1s와 S2sΔ(TMD-CT) 단백질과 이들 3 종류의 단백질이 추가적으로 mCor1을 단백질을 발현하는 N. benthamiana의 총 추출물을 SDS/PAGE로 분리한 후 anti-His antibody를 이용하여 western blot 분석 및 Coomassie brillant blue로 염색한 결과를 나타낸 것이다.
도 3은 N. benthamiana extract로부터 Ni2+-NTA 친화 컬럼 크로마토그래피를 이용하여 Sfull-t과 S2s-t을 순수 분리정제하고 이를 SDS/PAGE로 전개한 후 anti-His antibody를 이용하여 Western blot으로 분석한 후 membrane을 다시 Coomassie brillient blue로 염색한 결과를 나타낸 것이다.
도 4는 N. benthamiana extract로부터 Ni2+-NTA 친화 컬럼 크로마토그래피를 이용하여 분리한 Sfull-t을 size-exclusion column chromatography로 fractionation하고 이들 분획을 SDS/PAGE로 전개한 후 Coomassie brillient blue로 염색한 결과를 나타낸 것이다.
도 5는 N. benthamiana extract로부터 Ni2+-NTA 친화 컬럼 크로마토그래피를 이용하여 분리된 Sfull-t과 Sfull-m을 순수 분리정제하고 이들을 size exclusion column chromatography로 fractionation한 후 이들 fraction을 anti-His antibody를 이용하여 western blot 분석을 한 결과와 분리 정제된 Sfull-t을 negative staining을 한 후 이 단백질을 전자현미경을 이용하여 단백질의 morphology를 확인한 결과 trimer를 형성한다는 것을 확인한 결과이다.
도 6은 N. benthamiana extract로부터 Ni2+-NTA 친화 컬럼 크로마토그래피를 이용하여 분리한 S2s-t을 size-exclusion column chromatography로 fractionation하고 이들 분획을 SDS/PAGE로 전개한 후 Coomassie brillient blue로 염색한 결과를 나타낸 것이다.
도 7은 COVID-19 식물백신 후보물질의 실험동물 (마우스, Balb/c)에서의 면역원성 평가한 결과를 나타낸 것이다. 이를 위해서 체액성 면역반응 분석 (도 7B), 중화항체 유도 분석 (도 7C, D) 및 세포매개면역반응 분석 (도 7E)을 수행한 후 그 결과를 나타내었다.
도 8은 COVID-19 식물백신 후보물질의 실험동물 (TG마우스)에서의 보호효능 평가를 수행한 실험으로 각 면역항원은 근육 내 경로로 2주 간격으로 총 2회 면역하였으며, 면역항원에 대한 항체 생성을 확인하기 위해, 면역 전, 1차 면역, 2차 면역 2주 후 채혈을 실시하여 혈청에서의 항체(IgGs) 생성 및 중화항체 생성 등의 면역원성 평가를 실시한 결과를 나타내었으며 (도 8A), 식물백신 면역에 따른 항체유도 분석 (도 8B), 식물백신 면역에 따른 햄스터 공격접종에 따른 생존율 및 조직역가 분석 (도 8 C, D, E)한 결과를 나타내었다.
이하 본 발명을 자세히 설명한다.
코로나-19 바이러스의 막 단백질로서 세포에 침투에 중요하다고 알려진 스파이크 단백질은 코로나-19 바이러스의 감염을 예방할 수 있는 백신 후보군(candidate)으로 생각된다. 본 발명에서는 이 스파이크 단백질에 기반은 다양한 재조합 단백질을 만들고 이들을 활용하여 백신으로 개발하고자 하였다. 스파이크 단백질의 전장(full length)은 바이러스의 표면에 존재할 때 삼량체(trimer)를 형성하지만 스파이크 유전자 중 전체 또는 일부분의 엑토-도메인만을 코딩하는 부분을 이용하여 재조합 단백질을 만들면 상기 재조합 단백질은 삼량체를 잘 형성하지 않을 것으로 추정하였다. 따라서 이들 재조합 단백질들을 이용하여 백신으로 활용하기 위해서는 이 단백질이 바이러스의 표면에 존재할 때와 같이 삼량체(trimer)를 형성하는 것이 중요하다고 생각하였으며, 이들이 soluble form으로 존재할 때도 삼량체를 유지하도록 하는 기술을 개발하고자 하였다. 본 발명에서는 스파이크 단백질의 ecto-domain의 전체 [SfΔ(TMD-CT)], S1s, 또는 TMD와 C-말단이 없는 S2 부위 [S2sΔ(TMD-CT)]의 재조합 단백질을 식물에서 발현 및 생산할 때 삼량체(trimer)를 형성하도록 유도하는 기술을 개발하고자 하였다. 이에 대량 생산할 수 있는 코로나-19 바이러스의 스파이크 막 관통 도메인부터 C-말단까지 결여된 스파이크 단백질의 엑토-도메인(Se; 16 번째 아미노산에서 1213번째 아미노산까지, 총 1198 개의 잔기), N-말단에서부터 SD2 도메인까지를 포함하는 부위 (S1s; 16번째 아미노산부터 681번째 아미노산 까지, 총 666 개의 잔기), 또는 S2 subunit에서 TMD와 C-말단이 없는 부위 (S2sΔ(TMD-CT); 682번째 아미노산에서 1213번째 아미노산까지, 총 532 개의 잔기)를 삼량체 구조를 형성하는 마우스의 Coronin 1의 삼량체 모티프 (trimeric motif)에 fusion하고 추가적으로 Hisx5와 HDEL을 코딩하는 부위에 연결하는 construct를 구축하였다. 이들 재조합 단백질에 대한 대조군으로 mCor1이 없는 construct를 구축하였다. 상기의 다양한 스파이크 단백질을 부분들을 포함하는 재조합 유전자들을 식물에서 고발현할 수 있는 바이너리 벡터(binary vector)를 구축하였다.
본 발명은 (i) 코로나 바이러스의 스파이크 단백질에있어서 막 관통 도메인 (trans-membrane domain)부터 C-말단까지의 아미노산 서열이 결여된 단백질 (SfΔ(TMD-CT)); 또는 코로나 바이러스의 스파이크 단백질에서 N-말단부터 서브도메인 2(sub-domain 2; SD2)까지를 포함하는 S1 subunit 단백질(S1s); 또는 코로나 바이러스 스파이크 단백질의 S2 서브 유닛(subunit)에서 막 관통 도메인 (trans-membrane domain)와 C- 말단까지의 아미노산 서열이 결여된 단백질, (S2sΔ(TMD-CT));을 코딩하는 유전자; 및 (ii) Coronin 1 (mCor 1)의 삼량체 모티프(trimeric motif) 부위의 단백질을 코딩하는 유전자;를 포함하는 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터를 제공할 수 있다.
코로나-19 바이러스의 재조합 스파이크 단백질을 이용하여 백신을 개발하기 위해서 막 관통 도메인에서 C-말단까지를 없앤 스파이크 단백질의 엑토-도메인 (S의 full length ecto-domain; 16 번째 아미노산에서 1213번째 아미노산 까지, 총 1198 개의 잔기), 또는 N-말단에서부터 서브 도메인 2 (sub domain 2; SD2)까지를 포함하는 부위 (16번째 아미노산부터 681번째 아미노산 까지, 총 666 개의 잔기), 또는 S2의 ectodomain (682 번째 아미노산에서 1213번째 아미노산까지, 총 532 개의 잔기)를 이용하여 재조합 단백질을 만들고 이를 이용하여 백신으로 개발하고자 하였다. 스파이크 단백질의 전장은 바이러스 표면에 존재할 때 삼량체를 형성하지만 스파이크 단백질을 코딩하는 유전자 중 전체 또는 일부분의 ecto-domain 부분을 이용하여 발현시켜 재조합 단백질을 발현하면, 삼량체를 잘 형성하지 않을 것으로 예상하였고, 상기 삼량체의 미형성으로 인하여 면역원성이 낮을 것으로 예상되었다. 따라서 본 발명에서는 원래 스파이크 전장 단백질이 바이러스에 표면에 존재하는 것과 같은 삼량체 형태의 스파이크 단백질의 전체, 또는 N-말단에서 SD2 도메인까지의 S1c 엑토 도메인, 또는 S2의 ectodomain의 재조합 단백질을 만들고자 하였다. 이를 위해서 본 발명에서는 코로나-19 (COVID-19)를 선택하여 마우스의 Coronin1 (mCor1)의 122번째 아미노산부터 153번째 아미노산까지의 32개의 잔기를 12개의 아미노산 잔기를 갖는 링커를 이용하여 융합하여 컨스트럭을 구축하였다.
이어서 재조합 단백질의 분리 정제를 위해서 5개의 His 잔기를 갖는 His tag를 융합하고 마지막으로 ER에 축적하기 위해 HDEL 모티프를 융합하여 컨스트럭을 완성하였다 (SfΔ(TMD-CT):mCor1:Hisx5:HDEL, S1s:mCor1:Hisx5:HDEL, S2sΔ(TMD-CT):mCor1:Hisx5:HDEL, 도 1). 그리고 위의 3 종류의 스파이크 재조합 단백질에서 mCor1이 없는 construct들을 구축하여 대조군으로 사용하였다.
상기 코로나 바이러스는 사스(SARS-Corona Virus), 메르스(MERS-Corona Virus) 및 코로나-19(SARS-Corona Virus-2)로 이루어진 군으로부터 선택되는 어느 하나일 수 있다.
상기 코로나-19 바이러스의 스파이크 단백질에서 막 관통 도메인 (transmembrane domain)부터 C-말단까지 결여된 단백질은 서열번호 2의 아미노산 서열을 포함할 수 있다.
상기 코로나-19 바이러스의 스파이크 단백질에서 막 관통 도메인 (transmembrane domain)부터 C-말단까지 결여된 단백질을 코딩하는 유전자는 서열번호 1의 염기서열을 포함할 수 있으며, 구체적으로 상기 유전자는 서열 번호 1의 염기서열과 각각 70% 이상, 더욱 바람직하게는 80% 이상, 더더욱 바람직하게는 90% 이상, 가장 바람직하게는 95%이상의 서열 상동성을 가지는 염기 서열을 포함할 수 있다. 폴리뉴클레오티드에 대한 "서열 상동성의 %"는 두 개의 최적으로 배열된 서열과 비교 영역을 비교함으로써 확인되며, 비교 영역에서의 폴리뉴클레오티드 서열의 일부는 두 서열의 최적 배열에 대한 참고 서열(추가 또는 삭제를 포함하지 않음)에 비해 추가 또는 삭제(즉, 갭)를 포함할 수 있다.
상기 코로나-19 바이러스의 스파이크 단백질에서 N-말단부터 서브도메인 2(sub-domain 2; SD2)까지를 포함하는 S1s 단백질은 서열번호 4의 아미노산 서열을 포함할 수 있다.
상기 코로나-19 바이러스의 스파이크 단백질에서 N-말단부터 서브도메인 2(sub-domain 2; SD2)까지를 포함하는 S1s 단백질을 코딩하는 유전자는 서열번호 3의 염기서열을 포함할 수 있으며, 구체적으로 상기 유전자는 서열 번호 3의 염기서열과 각각 70% 이상, 더욱 바람직하게는 80% 이상, 더 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95%이상의 서열 상동성을 가지는 염기 서열을 포함할 수 있다. 폴리뉴클레오티드에 대한 "서열 상동성의 %"는 두 개의 최적으로 배열된 서열과 비교 영역을 비교함으로써 확인되며, 비교 영역에서의 폴리뉴클레오티드 서열의 일부는 두 서열의 최적 배열에 대한 참고 서열(추가 또는 삭제를 포함하지 않음)에 비해 추가 또는 삭제(즉, 갭)를 포함할 수 있다.
상기 코로나-19 바이러스의 스파이크 단백질에서 S2 단백질은 서열번호 x의 아미노산 서열을 포함할 수 있다.
상기 Coronin 1 (mCor 1)의 삼량체 모티브(trimeric motif) 부위의 단백질은 서열번호 6의 아미노산 서열을 포함할 수 있다.
상기 Coronin 1 (mCor 1)의 삼량체 모티브(trimeric motif) 부위의 단백질을 코딩하는 유전자는 서열번호 5의 염기서열을 포함할 수 있으며. 구체적으로 상기 유전자는 서열 번호 5의 염기서열과 각각 70% 이상, 더욱 바람직하게는 80% 이상, 더 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95%이상의 서열 상동성을 가지는 염기 서열을 포함할 수 있다. 폴리뉴클레오티드에 대한 "서열 상동성의 %”는 두 개의 최적으로 배열된 서열과 비교 영역을 비교함으로써 확인되며, 비교 영역에서의 폴리뉴클레오티드 서열의 일부는 두 서열의 최적 배열에 대한 참고 서열(추가 또는 삭제를 포함하지 않음)에 비해 추가 또는 삭제(즉, 갭)를 포함할 수 있다.
상기 재조합 유전자들을 식물체 발현 벡터인 pTEX1에 도입하여 식물 발현 벡터를 만들었다. COVID-19의 스파이크 유전자로부터 6종류의 ecto-domain의 재조합 단백질 유전자들 구축하고 (도 1), 이들을 식물 (Nicotiana benthamiana)에 도입하여 재조합 단백질의 발현을 유도하였다. 이들 유전자를 도입한 N. benthamiana의 잎 추출물에서의 단백질의 발현을 확인하기 위해서 anti-His antibody를 이용하여 western blot 분석을 하였다. 도 2와 같이 Sfull이 약 180kD 위치에서 확인되었다. 스파이크 단백질의 N-glycosylation을 형성하기 때문에 계산상의 단백질 위치보다 크게 나왔다고 판단하였다. S1과 S2는 각각 100kD과 75kD 위치에서 나왔으며, 이들 두 단백질 역시 계산상의 크기보다 더 크게 나왔으므로 이 역시 N-glycosylation이 되는 것으로 판단되었다 (도 2).
그리고 이들 두 종류의 단백질을 순수 분리하기 위해서 N. benthamiana의 총 추출물을 만들고 이로부터 Ni2+-NTA 친화 컬럼 크로마토그래피를 이용하여 순수 분리 정제 한 후 이를 SDS/PAGE를 통해서 분리 정제하고 Coomassie brillian로 염색하였다. 이를 통해서 두 종류의 스파이크 단백질의 재조합 단백질을 순수 분리 정제할 수 있음을 확인하였다 (도 3).
상기 재조합 벡터는 꽃양배추 모자이크 바이러스 (cauliflower mosaic virus)에서 유래한 35S 프로모터, 꽃양배추 모자이크 바이러스 (cauliflower mosaic virus)에서 유래한 19S RNA 프로모터, Mac 프로모터 (Mac promoter), 식물의 액틴 단백질 프로모터 및 유비퀴틴 단백질 프로모터로 이루어진 군으로부터 선택되는 어느 하나의 프로모터를 추가로 포함할 수 있으며, 바람직하게는 Mac 프로모터 (Mac promoter)일 수 있으며, 더 바람직하게는 MacT 프로모터 (MacT promoter)일 수 있다.
상기 Mac T 프로모터는 Mac 프로모터 염기서열의 3’말단 염기인 A를 T로 치환한 프로모터일 수 있으며, 상기 Mac T 프로모터는 서열 번호 17의 염기서열을 포함할 수 있으며, 구체적으로 상기 유전자는 서열 번호 17의 염기서열과 각각 70% 이상, 더욱 바람직하게는 80% 이상, 더 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상의 서열 상동성을 가지는 염기 서열을 포함할 수 있다. 폴리뉴클레오티드에 대한 "서열 상동성의 %"는 두 개의 최적으로 배열된 서열과 비교 영역을 비교함으로써 확인되며, 비교 영역에서의 폴리뉴클레오티드 서열의 일부는 두 서열의 최적 배열에 대한 참고 서열(추가 또는 삭제를 포함하지 않음)에 비해 추가 또는 삭제(즉, 갭)를 포함할 수 있다.
상기 재조합 벡터는 RD29B-t 종결 부위를 추가로 포함할 수 있으며, 상기 RD29B-t 종결 부위는 서열 번호 18의 염기서열을 포함할 수 있으며, 구체적으로 상기 유전자는 서열 번호 18의 염기서열과 각각 70% 이상, 더욱 바람직하게는 80% 이상, 더 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95%이상의 서열 상동성을 가지는 염기 서열을 포함할 수 있다. 폴리뉴클레오티드에 대한 "서열 상동성의 %”는 두 개의 최적으로 배열된 서열과 비교 영역을 비교함으로써 확인되며, 비교 영역에서의 폴리뉴클레오티드 서열의 일부는 두 서열의 최적 배열에 대한 참고 서열(추가 또는 삭제를 포함하지 않음)에 비해 추가 또는 삭제(즉, 갭)를 포함할 수 있다.
재조합 단백질의 유전자의 N-말단과 C-말단에 각각 BiP의 signal sequence와 ER retention signal인 HDEL를 포함으로써, ER(소포체)에 고농도로 축적을 유도하는 효과를 가질 수 있다. 상기 재조합 벡터는 BiP(chaperone binding protein) 및 HDEL(His-Asp-Glu-Leu) 펩타이드로 이루어진 군으로부터 선택되는 어느 하나를 추가로 포함할 수 있고, 상기 BiP(chaperone binding protein)는 서열 번호 12의 염기서열을 포함할 수 있고, HDEL(His-Asp-Glu-Leu)는 서열 번호 10의 염기서열을 포함할 수 있다.
상기 재조합은 세포가 이종의 핵산을 복제하거나, 상기 핵산을 발현하거나 또는 펩티드, 이종의 펩티드 또는 이종의 핵산에 의해 암호화된 단백질을 발현하는 세포를 지칭하는 것이다. 재조합 세포는 상기 세포의 천연 형태에서는 발견되지 않는 유전자 또는 유전자 절편을 센스 또는 안티센스 형태 중 하나로 발현할 수 있다. 또한 재조합 세포는 천연 상태의 세포에서 발견되는 유전자를 발현할 수 있으며, 그러나 상기 유전자는 변형된 것으로서 인위적인 수단에 의해 세포 내 재도입된 것이다.
용어 "재조합 발현 벡터"는 세균 플라스미드, 파아지, 효모 플라스미드, 식물 세포 바이러스, 포유동물 세포 바이러스 또는 다른 벡터를 의미한다. 대체로, 임의의 플라스미드 및 벡터는 숙주 내에서 복제 및 안정화할 수 있다면 사용될 수 있다. 상기 발현 벡터의 중요한 특성은 복제 원점, 프로모터, 마커 유전자 및 번역 조절 요소(translation control element)를 가지는 것이다. 상기 재조합 발현 벡터 및 적당한 전사/번역 조절 신호를 포함하는 발현 벡터는 당업자에 주지된 방법에 의해 구축될 수 있다. 상기 방법은 시험관내 재조합 DNA 기술, DNA 합성 기술 및 생체 내 재조합 기술 등을 포함한다.
본 발명의 재조합 벡터의 바람직한 예는 적당한 숙주에 존재할 때 그 자체의 일부, 소위 T-영역을 식물 세포로 전이시킬 수 있는 Ti-플라스미드 벡터이다. 다른 유형의 Ti-플라스미드 벡터는 현재 식물 세포, 또는 잡종 DNA를 식물의 게놈 내에 적당하게 삽입시키는 새로운 식물이 생산될 수 있는 원형질체로 잡종 DNA 서열을 전이시키는데 이용되고 있다. Ti-플라스미드 벡터의 특히 바람직한 형태는 EP 0120 516 B1호 및 미국 특허 제4,940,838호에 청구된 바와 같은 소위 바이너리(binary) 벡터이다. 본 발명에 따른 DNA를 식물 숙주에 도입시키는데 이용될 수 있는 다른 적합한 벡터는 이중 가닥 식물 바이러스(예를 들면, CaMV) 및 단일 가닥 바이러스, 게미니 바이러스 등으로부터 유래될 수 있는 것과 같은 바이러스 벡터, 예를 들면 비완전성 식물 바이러스벡터로부터 선택될 수 있다. 그러한 벡터의 사용은 특히 식물 숙주를 적당하게 형질 전환하는 것이 어려울 때 유리할 수 있다.
본 발명은 또한 상기 재조합 벡터로 형질 전환된 형질 전환 생물을 제공할 수 있다.
상기 형질 전환된 형질 전환 생물은 원핵생물 또는 진핵생물일 수 있으며, 그 예로서, 효모(Saccharomyce cerevisiae), 대장균 등의 곰팡이, 곤충세포, 사람세포 (예컨대, CHO 세포주 (Chinese hamster ovary), W138, BHK, COS-7, 293, HepG2, 3T3, RIN 및 MDCK 세포주) 및 식물세포 등이 이용 될 수 있으며, 바람직하게는 아그로박테리움(Agrobacterium)될 수 있다. 곤충세포, 사람세포 등의 경우에는 삼량체를 형성하는 재조합 스파이크 단백질을 코딩하는 유전자를 를 이들 각 종류의 동물 세포의 발현에 필요한 발현 벡터를 사용하여 발현할 수 있다.
본 발명의 벡터를 숙주세포 내로 운반하는 방법은, 숙주 세포가 원핵 세포인 경우, CaCl2 방법, 하나한 방법 (Hanahan, D., J. Mol. Biol., 166:557-580(1983)) 및 전기천공 방법 등에 의해 실시될 수 있다. 또한, 숙주세포가 진핵세포인 경우에는, 미세주입법, 칼슘포스페이트 침전법, 전기천공법, 리포좀-매개 형질감염법, DEAE-덱스트란 처리법, 및 유전자 밤바드먼트 등에 의해 벡터를 숙주세포 내로 주입할 수 있다.
본 발명은 하기의 단계를 포함하는 식물에서 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하는 방법을 제공할 수 있다:
a) 상기 서술한 재조합 벡터를 제작하는 단계;
(b) 상기 재조합 벡터를 생물에 도입하여 형질 전환 생물을 제조하는 단계;
(c) 상기 형질 전환 생물을 배양하는 단계;
(d) 상기 배양물을 식물에 침윤하는 단계; 및
(e) 상기 식물을 분쇄하여 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 수득하는 단계.
상기 식물에 침유하는 방법은 화학 전지법, 진공 또는 주사기 침윤 방법이 있고 가장 바람직하게는 주사기 침윤 방법일 수 있으나, 이에 제한되는 것이 아니다.
상기 식물은 벼, 밀, 보리, 옥수수, 콩, 감자, 밀, 팥, 귀리, 수수를 포함하는 식량작물류; 애기장대, 배추, 무, 고추, 딸기, 토마토, 수박, 오이, 양배추, 참외, 호박, 파, 양파, 당근을 포함하는 채소작물류; 인삼, 담배, 목화, 참깨, 사탕수수, 사탕무, 들깨, 땅콩, 유채를 포함하는 특용작물류; 사과나무, 배 나무, 대추나무, 복숭아, 포도, 감귤, 감, 자두, 살구, 바나나를 포함하는 과수류; 장미, 카네이션, 국화, 백합, 튤립을 포함하는 화훼류로부터 선택되는 것일 수 있다.
이렇게 식물에서 생산한 COVID-19 바이러스의 스파이크 단백질들을 C-말단의 His tag를 이용하여 Ni2+-NTA affinity column chromatography으로 분리 정제할 수 있다. 그리고 이렇게 분리된 단백질은 순도를 높이기 위해서 다시 size exclusion gel chromatography를 이용하여 추가적으로 분리할 수 있다.
본 발명의 또 하나의 목적은 이들 식물 생산 코로나-19의 스파이크 단백질을 이용하여 백신조성물을 제공하는 것이다. 스파이크 단백질의 삼량체의 Sfull-t나 S2s-t를 alum과 함께 또는 alum 없이 백신조성물을 구성할 수 있다.
이하, 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시한다. 그러나 하기의 실시예는 본 발명을 보다 쉽게 이해하기 위하여 제공되는 것일 뿐, 하기 실시예에 의해 본 발명의 내용이 한정되는 것은 아니다.
<실시예 1> 삼량체를 형성하는 코로나-19 바이러스의 재조합 스파이크 단백질을 코딩하는 유전자의 설계
코로나-19 바이러스 표면 단백질 유래 spike (S)를 ER lumen에 수용성 형태(soluble form)로 발현하도록 유도하기 위해 막 관통 도메인(TMD)에서 C-terminus까지를 없앤 스파크 단백질의 엑토-도메인 (ecto-domain; 16 번째 아미노산에서 1213번째 아미노산까지, 총 1198 개의 잔기, SfΔ(TMD-CT)), N-말단에서부터 SD2 도메인까지를 포함하는 S1 subunit 부위 (16번째 아미노산부터 681번째 아미노산 까지, 총 666 개의 잔기), 또는 S2의 ectodomain 부위 (682번째 아미노산부터 1213번째 아미노산까지, 총 562개의 잔기)를 확보하였다. 상기 코로나-19 바이러스의 스파크 유전자의 5'-말단에 애기장대 단백질인 BiP로부터 확보한 ER 표적화 신호를 융합하여 ER 타겟팅 되도록 하였다. 그리고 이렇게 만들어진 재조합 스파이크 단백질의 삼량체 형성을 유도하기 위해, 마우스 mCoronin1이라는 단백질로부터 동종 삼량체의 형성을 유도하는 모티프를 linker를 통해서 이들 스파이크 단백질의 C-말단에 fusion 하였으며, Hisx5 태그 및 ER retention motif인 HDEL을 스파이크 단백질의 정제 및 ER에서의 고축적을 위해서 mCor1의 C-말단에 순차적으로 융합하여 컨스트럭을 구축하였다. 발현을 위해서 macT를 사용하였으며 Rd29b의 말단을 전사종결자로 사용하였다. 상기 전사 종결자는 이전 연구결과 높은 전사효율을 보이는 것으로 확인되었다. 실험에 사용되는 염기 서열은 하기 표 1과 같다 (도 1).
그리고 이들 construct를 pTEX에 도입하여 최종적인 식물발현 vector 9 종을 구축하였다.
서열(5‘-3) | ||
SfΔ(TMD-CT) 염기서열 | gttaaccttaccaccagaactcagttacccccagcatacactaattctttcacacgtggtgtttactaccctgacaaagttttcagaagcagcgttttacacagcactcaggatttattcctacctttcttttccaacgtgacctggttccatgctatacatgtatctgggaccaatggtaccaagaggtttgataacccggtcctaccatttaatgatggagtctattttgcctccactgagaagtctaatataataagaggctggatttttggaactactcttgattcgaagacccagagtctacttattgttaataacgctacaaatgttgttatcaaagtatgtgaatttcaattctgtaatgatccattcttgggtgtttactaccacaaaaacaacaaaagttggatggaaagtgagtttcgggtttatagcagtgcgaataattgcacttttgagtacgtctcccaaccttttcttatggaccttgaaggaaagcagggaaatttcaagaatcttcgcgaatttgtgtttaagaatatcgatggttatttcaagatatattctaagcacacgcctattaatttagtgcgagatctccctcagggtttttcggcgctggaaccattggtagatttgccgataggaatcaatatcactaggttccagactttacttgctctgcatagaagttacttgacccctggagatagctcatcaggttggacagctggtgcggcagcttattacgtggggtatcttcagcctaggacgttcctattaaaatataatgaaaatggaaccattacagatgctgtagactgtgcacttgaccctctctcagaaacaaagtgtacgttgaaatccttcacggtagaaaaagggatctaccaaacgtctaacttcagagtccagccaacagaatctattgtgagatttcccaatattacaaacttgtgccctttcggagaagtttttaacgccaccaggtttgcatcggtttatgcttggaacaggaaaagaatcagcaactgtgttgctgattatagtgtcctatataactccgcatccttttccactttcaagtgttacggagtttctcctactaaattaaatgatctctgctttactaatgtctatgcagattcatttgtaatcagaggtgatgaggtcagacaaatcgctccagggcagactggaaagattgctgattataattataagcttcctgatgattttacaggctgcgttatagcatggaattctaataatcttgactctaaggtggggggaaattataattacctgtatagactgtttaggaagagcaatctcaagcctttcgagagagacatttcaactgagatctaccaggcgggaagcactccgtgtaatggtgttgagggttttaattgttactttcctttacagtcatacggtttccaacccacgaatggggttggttaccaaccgtaccgagtagtagtactttctttcgagcttctacatgccccagcaactgtttgtggacctaagaagtctactaatttggttaaaaataagtgtgtcaattttaatttcaatggacttacgggcacaggagttcttactgagtctaacaagaagtttctgcctttccagcagttcggcagagatattgctgacactactgatgctgtgcgtgatccacagacacttgaaattcttgacattacaccatgttcttttggtggcgtgagtgttataactcccggaacaaatacctccaaccaggtggctgttctgtatcaggacgtgaactgtacagaagtccctgttgcaattcatgcagatcagcttactcctacctggcgtgtttattctacgggttccaatgtttttcaaacacgtgcaggctgcttgataggggctgaacatgtcaacaactcatatgaatgcgacatacccataggtgcaggtatatgcgctagttatcagactcagaccaattctccgcggcgggcacgaagtgtagctagtcaatccatcattgcctacactatgtcacttggtgcagaaaattcagttgcttactctaataactctattgccatacccacaaattttactattagtgttaccacagaaattctaccagtgtctatgaccaagacatcagttgactgtacaatgtatatttgcggggattcaactgagtgctcgaatctgttgttgcaatacggcagtttttgtacccaattgaaccgggctctgactggaatagctgtggaacaagataaaaacacccaagaagtttttgcacaagtcaaacaaatttataaaacaccaccaattaaagatttcggtggtttcaacttctcacaaatactgccagatccgagcaaaccaagcaagaggtcattcattgaagacctacttttcaacaaagtgacacttgcagatgctggcttcattaaacagtatggtgattgcttgggggatattgctgctagagacctcatttgtgcacaaaagtttaacgggctgacagtgttgccacctttgttgacagatgagatgattgctcagtacacttctgcactgctcgctggtacaatcacatctgggtggacctttggtgcaggtgctgccttacaaataccatttgctatgcagatggcttataggttcaatggtatcggagttacacagaacgttctctatgagaaccaaaaattgattgccaaccaattcaatagtgccattggcaagattcaggactcactttcaagcacagcgagtgcacttggaaagttgcaagatgtggtcaaccagaatgcacaagctttaaacacgcttgtgaaacaactcagctccaactttggggcaatttcaagtgttttgaatgatatcctttcacgtcttgataaagtggaagccgaggtgcaaattgacaggttgatcacaggccgacttcaaagtttgcagacttatgtgactcaacaattaattagggcagcagaaatccgcgcttcggctaatctggcggctactaaaatgtcagagtgtgtacttggacaatctaaacgagttgatttttgcggaaagggctatcatctcatgtccttccctcagtcagcgcctcacggtgtagtgttcttgcacgtgacttacgttcctgcacaagaaaagaatttcacaactgctccggccatttgtcatgatggaaaagcccactttccgcgtgaaggtgtctttgtttcgaatggcacacactggtttgtaacccaaaggaatttttatgagccacaaatcattacgacggacaacacttttgtgtctggtaattgtgatgttgtaatcggaatcgtcaacaacaccgtttacgatcctttgcagcctgagttagattctttcaaagaggagctggataagtatttcaagaatcatacatcacccgatgttgatctcggtgatatctctggaattaatgcttcagttgtgaacattcaaaaggagattgaccgcctcaatgaggttgccaagaatttgaatgaatcgctcatcgatctccaagaacttggaaagtatgagcagtatatcaagtggcca | 서열번호 1 |
SfΔ(TMD-CT) 아미노산 서열 | vnlttrtqlppaytnsftrgvyypdkvfrssvlhstqdlflpffsnvtwfhaihvsgtngtkrfdnpvlpfndgvyfasteksniirgwifgttldsktqsllivnnatnvvikvcefqfcndpflgvyyhknnkswmesefrvyssannctfeyvsqpflmdlegkqgnfknlrefvfknidgyfkiyskhtpinlvrdlpqgfsaleplvdlpiginitrfqtllalhrsyltpgdsssgwtagaaayyvgylqprtfllkynengtitdavdcaldplsetkctlksftvekgiyqtsnfrvqptesivrfpnitnlcpfgevfnatrfasvyawnrkrisncvadysvlynsasfstfkcygvsptklndlcftnvyadsfvirgdevrqiapgqtgkiadynyklpddftgcviawnsnnldskvggnynylyrlfrksnlkpferdisteiyqagstpcngvegfncyfplqsygfqptngvgyqpyrvvvlsfellhapatvcgpkkstnlvknkcvnfnfngltgtgvltesnkkflpfqqfgrdiadttdavrdpqtleilditpcsfggvsvitpgtntsnqvavlyqdvnctevpvaihadqltptwrvystgsnvfqtragcligaehvnnsyecdipigagicasyqtqtnsprrarsvasqsiiaytmslgaensvaysnnsiaiptnftisvtteilpvsmtktsvdctmyicgdstecsnlllqygsfctqlnraltgiaveqdkntqevfaqvkqiyktppikdfggfnfsqilpdpskpskrsfiedllfnkvtladagfikqygdclgdiaardlicaqkfngltvlpplltdemiaqytsallagtitsgwtfgagaalqipfamqmayrfngigvtqnvlyenqklianqfnsaigkiqdslsstasalgklqdvvnqnaqalntlvkqlssnfgaissvlndilsrldkveaevqidrlitgrlqslqtyvtqqliraaeirasanlaatkmsecvlgqskrvdfcgkgyhlmsfpqsaphgvvflhvtyvpaqeknfttapaichdgkahfpregvfvsngthwfvtqrnfyepqiittdntfvsgncdvvigivnntvydplqpeldsfkeeldkyfknhtspdvdlgdisginasvvniqkeidrlnevaknlneslidlqelgkyeqyikwp | 서열번호 2 |
S1s 염기서열 | gttaaccttaccaccagaactcagttacccccagcatacactaattctttcacacgtggtgtttactaccctgacaaagttttcagaagcagcgttttacacagcactcaggatttattcctacctttcttttccaacgtgacctggttccatgctatacatgtatctgggaccaatggtaccaagaggtttgataacccggtcctaccatttaatgatggagtctattttgcctccactgagaagtctaatataataagaggctggatttttggaactactcttgattcgaagacccagagtctacttattgttaataacgctacaaatgttgttatcaaagtatgtgaatttcaattctgtaatgatccattcttgggtgtttactaccacaaaaacaacaaaagttggatggaaagtgagtttcgggtttatagcagtgcgaataattgcacttttgagtacgtctcccaaccttttcttatggaccttgaaggaaagcagggaaatttcaagaatcttcgcgaatttgtgtttaagaatatcgatggttatttcaagatatattctaagcacacgcctattaatttagtgcgagatctccctcagggtttttcggcgctggaaccattggtagatttgccgataggaatcaatatcactaggttccagactttacttgctctgcatagaagttacttgacccctggagatagctcatcaggttggacagctggtgcggcagcttattacgtggggtatcttcagcctaggacgttcctattaaaatataatgaaaatggaaccattacagatgctgtagactgtgcacttgaccctctctcagaaacaaagtgtacgttgaaatccttcacggtagaaaaagggatctaccaaacgtctaacttcagagtccagccaacagaatctattgtgagatttcccaatattacaaacttgtgccctttcggagaagtttttaacgccaccaggtttgcatcggtttatgcttggaacaggaaaagaatcagcaactgtgttgctgattatagtgtcctatataactccgcatccttttccactttcaagtgttacggagtttctcctactaaattaaatgatctctgctttactaatgtctatgcagattcatttgtaatcagaggtgatgaggtcagacaaatcgctccagggcagactggaaagattgctgattataattataagcttcctgatgattttacaggctgcgttatagcatggaattctaataatcttgactctaaggtggggggaaattataattacctgtatagactgtttaggaagagcaatctcaagcctttcgagagagacatttcaactgagatctaccaggcgggaagcactccgtgtaatggtgttgagggttttaattgttactttcctttacagtcatacggtttccaacccacgaatggggttggttaccaaccgtaccgagtagtagtactttctttcgagcttctacatgccccagcaactgtttgtggacctaagaagtctactaatttggttaaaaataagtgtgtcaattttaatttcaatggacttacgggcacaggagttcttactgagtctaacaagaagtttctgcctttccagcagttcggcagagatattgctgacactactgatgctgtgcgtgatccacagacacttgaaattcttgacattacaccatgttcttttggtggcgtgagtgttataactcccggaacaaatacctccaaccaggtggctgttctgtatcaggacgtgaactgtacagaagtccctgttgcaattcatgcagatcagcttactcctacctggcgtgtttattctacgggttccaatgtttttcaaacacgtgcaggctgcttgataggggctgaacatgtcaacaactcatatgaatgcgacatacccataggtgcaggtatatgcgctagttatcagactcagaccaattctccg | 서열번호 3 |
S1s protein 아미노산 서열 | vnlttrtqlppaytnsftrgvyypdkvfrssvlhstqdlflpffsnvtwfhaihvsgtngtkrfdnpvlpfndgvyfasteksniirgwifgttldsktqsllivnnatnvvikvcefqfcndpflgvyyhknnkswmesefrvyssannctfeyvsqpflmdlegkqgnfknlrefvfknidgyfkiyskhtpinlvrdlpqgfsaleplvdlpiginitrfqtllalhrsyltpgdsssgwtagaaayyvgylqprtfllkynengtitdavdcaldplsetkctlksftvekgiyqtsnfrvqptesivrfpnitnlcpfgevfnatrfasvyawnrkrisncvadysvlynsasfstfkcygvsptklndlcftnvyadsfvirgdevrqiapgqtgkiadynyklpddftgcviawnsnnldskvggnynylyrlfrksnlkpferdisteiyqagstpcngvegfncyfplqsygfqptngvgyqpyrvvvlsfellhapatvcgpkkstnlvknkcvnfnfngltgtgvltesnkkflpfqqfgrdiadttdavrdpqtleilditpcsfggvsvitpgtntsnqvavlyqdvnctevpvaihadqltptwrvystgsnvfqtragcligaehvnnsyecdipigagicasyqtqtnsp | 서열번호 4 |
S2sΔ (TMD-CT) 염기서열 |
cggcgggcacgaagtgtagctagtcaatccatcattgcctacactatgtcacttggtgcagaaaattcagttgcttactctaataactctattgccatacccacaaattttactattagtgttaccacagaaattctaccagtgtctatgaccaagacatcagttgactgtacaatgtatatttgcggggattcaactgagtgctcgaatctgttgttgcaatacggcagtttttgtacccaattgaaccgggctctgactggaatagctgtggaacaagataaaaacacccaagaagtttttgcacaagtcaaacaaatttataaaacaccaccaattaaagatttcggtggtttcaacttctcacaaatactgccagatccgagcaaaccaagcaagaggtcattcattgaagacctacttttcaacaaagtgacacttgcagatgctggcttcattaaacagtatggtgattgcttgggggatattgctgctagagacctcatttgtgcacaaaagtttaacgggctgacagtgttgccacctttgttgacagatgagatgattgctcagtacacttctgcactgctcgctggtacaatcacatctgggtggacctttggtgcaggtgctgccttacaaataccatttgctatgcagatggcttataggttcaatggtatcggagttacacagaacgttctctatgagaaccaaaaattgattgccaaccaattcaatagtgccattggcaagattcaggactcactttcaagcacagcgagtgcacttggaaagttgcaagatgtggtcaaccagaatgcacaagctttaaacacgcttgtgaaacaactcagctccaactttggggcaatttcaagtgttttgaatgatatcctttcacgtcttgataaagtggaagccgaggtgcaaattgacaggttgatcacaggccgacttcaaagtttgcagacttatgtgactcaacaattaattagggcagcagaaatccgcgcttcggctaatctggcggctactaaaatgtcagagtgtgtacttggacaatctaaacgagttgatttttgcggaaagggctatcatctcatgtccttccctcagtcagcgcctcacggtgtagtgttcttgcacgtgacttacgttcctgcacaagaaaagaatttcacaactgctccggccatttgtcatgatggaaaagcccactttccgcgtgaaggtgtctttgtttcgaatggcacacactggtttgtaacccaaaggaatttttatgagccacaaatcattacgacggacaacacttttgtgtctggtaattgtgatgttgtaatcggaatcgtcaacaacaccgtttacgatcctttgcagcctgagttagattctttcaaagaggagctggataagtatttcaagaatcatacatcacccgatgttgatctcggtgatatctctggaattaatgcttcagttgtgaacattcaaaaggagattgaccgcctcaatgaggttgccaagaatttgaatgaatcgctcatcgatctccaagaacttggaaagtatgagcagtatatcaagtggcca | 서열번호 5 |
S2sΔ (TMD-CT) protein 아미노산 서열 |
RRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWP | 서열번호 6 |
mCOr1 염기서열 | gtgtctaggcttgaggaagatgttagaaatctcaacgcaattgtccagaaacttcaggaaaggttggataggctggaggaaactgttcaagctaag | 서열번호 7 |
mCor1 아미노산 서열 | vsrleedvrnlnaivqklqerldrleetvqak | 서열번호 8 |
Linker 염기 서열 |
ggaggttcaggaggttcaggaggttcaggaggttca | 서열번호 9 |
Linker 아미노산 서열 | ggsggsggsggs | 서열번호 10 |
BiP 염기 서열 |
atggctcgct cgtttggagc taacagtacc gttgtgttgg cgatcatctt cttcggtgag tgattttccg atcttcttct ccgatttaga tctcctctac attgttgctt aatctcagaa ccttttttcg ttgttcctgg atctgaatgt gtttgtttgc aatttcacga tcttaaaagg ttagatctcg attggtattg acgattggaa tctttacgat ttcaggatgt ttatttgcgt tgtcctctgc aatagaagag gctacgaagt ta | 서열번호 11 |
HDEL 염기 서열 |
cacgatgagctc | 서열번호 12 |
HDEL 아미노산 서열 |
His-Asp-Glu-Leu | 서열번호 13 |
5'UTR 염기서열 | aattattacatcaaaacaaaaa | 서열번호 14 |
MacT nucleotide sequence | agagatctcctttgccccagagatcacaatggacgacttcctctatctctacgatctagtcaggaagttcgacggagaaggtgacgataccatgttcaccactgataatgagaagattagccttttcaatttcagaaagaatgctaacccacagatggttagagaggcttacgcagcaggtctcatcaagacgatctacccgagcaataatctccaggagatcaaataccttcccaagaaggttaaagatgcagtcaaaagattcaggactaactgcatcaagaacacagagaaagatatatttctcaagatcagaagtactattccagtatggacgattcaaggcttgcttcacaaaccaaggcaagtaatagagattggagtctctaaaaaggtagttcccactgaatcaaaggccatggagtcaaagattcaaatagaggacctaacagaactcgccgtaaagactggcgaacagttcatacagagtctcttacgactcaatgacaagaagaaaatcttcgtcaacatggtggagcacgacacgcttgtctactccaaaaatatcaaagatacagtctcagaagaccaaagggcaattgagacttttcaacaaagggtaatatccggaaacctcctcggattccattgcccagctatctgtcactttattgtgaagatagtggaaaaggaaggtggctcctacaaatgccatcattgcgataaaggaaaggccatcgttgaagatgcctctgccgacagtggtcccaaagatggacccccacccacgaggagcatcgtggaaaaagaagacgttccaaccacgtcttcaaagcaagtggattgatgtgacgcaagacgtgacgtaagtatctgagctagtttttatttttctactaatttggtcgtttatttcggcgtgtaggacatggcaaccgggcctgaatttcgcgggtattctgtttctattccaactttttcttgatccgcagccattaacgacttttgaatagatacgctgacacgccaagcctcgctagtcaaaagtgtaccaaacaacgctttacagcaagaacggaatgcgcgtgacgctcgcggtgacgccatttcgccttttcagaaatggataaatagccttgcttcctattatatcttcccaaattaccaatacattacactagcatctgaatttcataaccaatctcgatacaccaaatcgt | 서열번호 15 |
RD29B terminator 염기 서열 | aattttactcaaaatgttttggttgctatggtagggactatggggttttcggattccggtggaagtgagtggggaggcagtggcggaggtaagggagttcaagattctggaactgaagatttggggttttgcttttgaatgtttgcgtttttgtatgatgcctctgtttgtgaactttgatgtattttatctttgtgtgaaaaagagattgggttaataaaatatttgcttttttggataagaaactcttttagcggcccattaataaaggttacaaatgcaaaatcatgttagcgtcagatatttaattattcgaagatgattgtgatagatttaaaattatcctagtcaaaaagaaagagtaggttgagcagaaacagtgacatctgttgtttgtaccatacaaattagtttagattattggttaacatgttaaatggctatgcatgtgacatttagaccttatcggaattaatttgtagaattattaattaagatgttgattagttcaaacaaaaat | 서열번호 16 |
<실시예 2> 삼량체를 형성하는 코로나-19 바이러스의 재조합 스파이크 단백질을 코딩하는 유전자의 발현 및 확인
도 1에 표시된 6 종류의 construct [SfΔ(TMD-CT):mCor1:Hisx5:HDEL (Sfull-t), SfΔ(TMD-CT):Hisx5:HDEL (Sfull-m), S1s:mCor1:Hisx5:HDEL (S1s-t), S1s:Hisx5:HDEL (S1s-m), S2sΔ(TMD-CT):mCor1:Hisx5:HDEL (S2s-t), S2sΔ(TMD-CT):Hisx5:HEDL (S2s-m)]들을 vacuum infiltration 방법을 사용하여 4-5주령 Nicotiana benthamiana 식물 잎에서 일과성 발현을 통하여 발현을 유도하였다. 침윤된 잎을 침윤 후 5 일 (dpi)에 수확하고, 액체 질소에서 완전히 분쇄하고 3 부피의 완충액에 용해시켰다. 침윤된 잎 추출물로부터의 총 가용성 단백질을 SDS-PAGE로 전개한 후 이를 western blot 분석을 수행하였다. 스파이크 (S) 재조합 단백질들은 anti-His antibody에 의해서 Sfull-t과 Sfull-m이 약 180 kD 위치에서 확인되었고, S1s-t와 S1s-m은 100 kD 위치에서 확인되었다. 그리고 S2s-t과 S2s-m은 75 kD 위치에서 확인되었다. mCor를 갖지 않는 construct와 mCor1을 갖는 단백질의 위치를 비교하면 mCor1을 갖는 것이 없는 것보다 보다 약간 작게 나온 것으로부터 이들의 차이는 mCor1에 의한 것으로 알 수 있다. 또한 이들 6 종의 재조합 단백질 모두 계산상의 크기보다 더 크게 나왔으므로, 이는 N-glycosylation 때문에 그러한 것으로 판단되었다 (도 2). 그리고 같은 멤브레인을 쿠마시 브릴리언트 블루로 염색하여 밴드를 확인하였을 때 여기에서도 관찰되었다. 이들 재조합 단백질의 발현 수준을 밴드 강도로부터 판단하건대 침윤된 잎에서 20 - 50μg/g 생 중량 (fresh weight) 정도인 것으로 추정되었다.
<실시예 3> 삼량체를 형성하는 코로나-19 바이러스의 재조합 스파크 단백질의 분리 정제
두 종류의 코로나-19 바이러스 S protein의 재조합 단백질인 Sfull-t과 S2s-t을 N. benthamiana에서 발현 시키고 이들을 Ni2+-NTA affinity column으로 분리 정제하고 이들을 SDS/PAGE를 통해서 전개한 후 anti-His antibody를 이용하여 western blot을 수행하여 분리정제를 확인하였다. 그리고 이어서 membrane을 Coomassie brilliant blue로 염색하였다. 이를 통해서 두 종류의 스파크 단백질 유래의 재조합 단백질을 순수 분리 정제할 수 있음을 확인하였다 (도 3).
<실시예 4> 삼량체를 형성하는 Sfull-t의 재조합 단백질의 size exclusion column chromatography를 통한 분리 정제
Ni2+-NTA affinity column으로 분리 정제한 Sfull-t의 재조합 단백질을 농축하여 이들 다시 size exclusion column chromatography를 이용하여 분리 정제하였다. Column에서 확보한 fraction을 7번부터 20번까지를 SDS/PAGE를 통해서 전개하고 이를 anti-His antibody를 이용하여 Western blot을 수행하여 Se의 재조합 단백질의 위치와 elution된 양을 확인하였다. 그리고 이후 membrane을 Coomassie brilliant blue로 염색하여 다른 단백질 band의 contamination을 확인하였다 (도 4).
<실시예 5> 코비드-19 바이러스의 SfΔ(TMD-CT)의 mCor1이 있는 것과 없는 것의 재조합 단백질의 size exclusion column을 통한 fractionation에서의 차이 확인 및 mCor1에 의한 Sfull-t 재조합 단백질의 삼량체 형성
Sfull-t과 Sfull-m 각각을 발현하는 N. benthamiana 잎 추출물로부터 Ni2+-NTA affinity column으로 단백질을 분리 정제한 후 (도 5A, B), 이들 단백질을 size exclusion column chromatography를 이용하여 fractionation 한 후 (도 6C), 이들 fraction을 SDS/PAGE를 이용하여 정제한 후 이를 anti-His antibody를 이용하여 Western blotting하여 분석하였다 (도 5D). 분리된 Sfull-t 단백질을 negative staining 한 후 전자현미경을 이용하여 단백질의 형태를 관찰하여 삼량체의 형성을 확인하였다 (도 5E).
<실시예 6> 삼량체를 형성하는 S2e의 재조합 단백질의 size exclusion column chromatography를 통한 분리 정제
Ni2+-NTA affinity column으로 분리 정제한 S2s-t의 재조합 단백질을 농축하여 이들 다시 size exclusion column chromatography를 이용하여 분리 정제하였다. Column에서 확보한 fraction을 7번부터 20번까지를 SDS/PAGE를 통해서 전개하고 이를 anti-His antibody를 이용하여 Western blot을 수행하여 S2s-t의 재조합 단백질의 위치와 elution된 양을 확인하였다 (도 6).
<실시예 7> 코로나19 식물백신 후보물질의 실험동물에서의 면역원성 평가
(1) COVID-19 식물백신 후보물질의 실험동물 (마우스, Balb/c)에서의 면역원성 평가
제작된 식물백신의 면역원성을 평가하기 위한 동물실험은 6주령의 암컷 마우스(Balb/c)를 사용하였으며, 실험군당 5마리씩, 면역은 네 가지의 용량(1, 5, 15, 30㎍)으로 실시하였다. 각 면역항원 (Sfull-t)은 근육 내 경로로 2주 간격으로 총 3회 면역하였으며, 면역항원에 대한 항체 생성을 확인하기 위해, 면역 전, 1차 면역, 2차 면역, 3차 면역 2주 후 채혈을 실시하여 혈청에서의 항체(IgGs) 생성 및 중화항체 생성 등의 면역원성 평가를 실시하였다. 이때 음성대조군은 PBS를 면역하였다.
1) 체액성 면역반응 분석
제작된 식물백신 면역원성 평가는 혈청 내에서 항원 특이적인 항체가 생성되는지를 ELISA를 통해 확인하였다. 총2회 또는 3회 마우스 면역 후 충분한 IgG 역가가 나타남을 확인하였으며, 본 백신에 의해 S항원의 서브도메인인 S1 그리고 S2 특이 항체가 모두 생성되는 것을 확인하였고, 특히 S2에 대한 역가가 높게 생성됨을 확인할 수 있었다. 또한, 면역보조제(수산화알루미늄)를 동시에 면역한 그룹이 동시 투여하지 않은 그룹에 비해 IgG 역가와 중화항체 역가가 다소 높게 나타남이 확인되었다.
2) 중화항체 유도 분석
제작된 식물백신으로 면역된 마우스의 혈액에서 혈청을 분리한 후, 일반적으로 바이러스 중화항체를 측정하는 방법 중 “gold standard” 로 알려진 Plaque reduction neutralization test (PRNT)법을 이용하여, SARS-CoV-2에 대한 항체의 중화능을 확인하였다. 중화항체 역가를 분석하기 위해 국가병원체자원은행(National Culture Collection for Pathogens)으로부터 분양받은 SARS-CoV-2 바이러스(BetaCoV/Korea/KCDC03/2020)를 이용하여, 바이러스에 마우스 혈청(항체)을 처리한 뒤 감염률의 변화를 확인하였다. 또한 최근 보고된 영국 변이주 (B.1.1.7), 남아공 변이주 (B.1.351)에 대한 교체 반응 분석도 실시하였다.
중화항체 유도는, IgG 생성결과와 유사하게 면역항원 단독으로 주입한 집단보다, 면역보조제를 동시에 면역한 집단에서 더 높은 중화 항체 역가를 보였으며, 낮은 농도로 면역한 혈청에서 보다, 높은 농도로 면역한 후 채취한 혈청에서 더 높은 중화항체가를 나타냄을 확인하였다. 또한, 음성대조군인 PBS 그룹에서는 중화 항체가 유도되지 않는 것을 확인할 수 있었다(도 7C). 또한 최근 문제가 되고있는 영국 그리고 남아공 변이주에 대해서도 교차반응이 나타남을 확인 하였음(도 7D).
3) 세포매개면역반응 분석
식물백신 면역에 따른 세포매개면역반응은 ELISPOT 시험법을 통해 분석하였다. ELISPOST 분석은 상용 IFN-γ ELISPOT kit을 사용하였다. 세포매개면역반응은, 대조군 (PBS 그룹)에 비해, 식물백신으로 면역한 그룹에서 IFN-γ를 분비하는 비장세포의 수가 증가하였고, 항원양과는 유의하게 비례하지 않음을 확인할 수 있었다. 그리고 면역보조제에 따른 증가효과는 나타나지 않았다. 결론적으로, 식물백신 면역에 의해 체액성 면역과 더불어 세포성 면역반응이 함께 유도되는 것을 확인 할 수 있었다(도 7E).
<실시예 8> COVID-19 식물백신 후보물질의 실험동물 (TG마우스)에서의 보호효능 평가
본 발명에 따라 제조된 식물백신의 보호효능을 평가하기 위한 동물실험은 SARS-CoV-2 사람 수용체 ACE2가 발현되는 6주령 형질전환 마우스(B6.Cg-Tg(K18-ACE2)2Primn/J)를 사용하였으며, 실험군당 14마리씩(대조군 12마리), 면역은 두 가지의 용량(15, 30㎍)으로 실시하였다. 각 면역항원은 근육 내 경로로 2주 간격으로 총 2회 면역하였으며, 면역항원에 대한 항체 생성을 확인하기 위해, 면역 전, 1차 면역, 2차 면역 2주 후 채혈을 실시하여 혈청에서의 항체(IgGs) 생성 및 중화항체 생성 등의 면역원성 평가를 실시하였다. 이때 음성대조군은 PBS를 면역하였다. 바이러스 공격접종은 최초 면역 28일 후 2 x 104pfu/mouse의 농도로 비강 감염을 실시한 후 생존율과 조직 역가를 측정하였다(도 8A).
1) 식물백신 면역에 따른 항체유도 분석
제작된 식물백신으로 면역된 마우스의 혈액에서 혈청을 분리한 후, 혈청 내에서 항원 특이적인 항체가 생성되는지를 ELISA를 통해 확인하였다. 총 2회 면역 후 충분한 IgG 역가가 나타남을 확인하였으며, 본 백신에 의해 S항원의 서브도메인인 S1 그리고 S2 특이 항체가 모두 생성되는 것을 확인하였고 면역보조제(수산화알루미늄)를 동시에 면역한 그룹이 동시 투여하지 않은 그룹에 비해 IgG 역가가 높게 나타나는 것을 확인되었다(도 8B).
2) 식물백신 면역에 따른 햄스터 공격접종에 따른 생존율 및 조직역가 분석
최초 면역 28일 후, 면역원성이 확인된 형질전환 마우스 에서의 SARS-CoV-2에 감염에 대한 보호능을 확인하기 위하여 바이러스를 비강내로 감염하고, 감염 후 14일간 체중, 체온 측정 및 임상증상을 관찰하였다(도 8C). 감염 후, 2주간 체중변화를 측정한 결과, 식물백신으로 면역한 햄스터에서 음성 대조군인 PBS 그룹에 비해 적은 체중감소를 보였다. 식물백신 면역그룹의 생존율 분석결과 15와 30㎍ 면역그룹은 100% 생존하였고 15와 30㎍과 면역보조제 동시 투여 집단은 80%의 생존율을 보였다. 그리고 대조군(PBS) 면역집단의 생존율은 3마리중 1마리 생존(33%)로 확인 되었다 (그림 8D). 바이러스 공격접종에 따른 폐 조직 내에서 바이러스 증식 양상 및 조직병리 소견을 확인하기 위해 감염 후 3, 5, 7일에 부검을 진행하였고, 부검한 폐조직내 바이러스 역가를 측정하였다. 식물백신 면역그룹에서 대조군에 비해 투여 용량에 비례하여 바이러스 증식 억제가 확인되었고 7일차에 30㎍과 면역보조제 동시 투여 집단에서는 바이러스가 검출되지 않았다 (도 8E).
<110> POSTECH ACADEMY-INDUSTRY FOUNDATION
Korea Disease Control and Prevention Agency
BioApplications Inc.
<120> Production method for trimeric spike protein of Corona-19 virus
in plants and its use for vaccination
<130> 1067332
<150> KR 10-2020-0048980
<151> 2020-04-22
<160> 16
<170> KoPatentIn 3.0
<210> 1
<211> 3594
<212> DNA
<213> Artificial Sequence
<220>
<223> Sf delta (TMD-CT)
<400> 1
gttaacctta ccaccagaac tcagttaccc ccagcataca ctaattcttt cacacgtggt 60
gtttactacc ctgacaaagt tttcagaagc agcgttttac acagcactca ggatttattc 120
ctacctttct tttccaacgt gacctggttc catgctatac atgtatctgg gaccaatggt 180
accaagaggt ttgataaccc ggtcctacca tttaatgatg gagtctattt tgcctccact 240
gagaagtcta atataataag aggctggatt tttggaacta ctcttgattc gaagacccag 300
agtctactta ttgttaataa cgctacaaat gttgttatca aagtatgtga atttcaattc 360
tgtaatgatc cattcttggg tgtttactac cacaaaaaca acaaaagttg gatggaaagt 420
gagtttcggg tttatagcag tgcgaataat tgcacttttg agtacgtctc ccaacctttt 480
cttatggacc ttgaaggaaa gcagggaaat ttcaagaatc ttcgcgaatt tgtgtttaag 540
aatatcgatg gttatttcaa gatatattct aagcacacgc ctattaattt agtgcgagat 600
ctccctcagg gtttttcggc gctggaacca ttggtagatt tgccgatagg aatcaatatc 660
actaggttcc agactttact tgctctgcat agaagttact tgacccctgg agatagctca 720
tcaggttgga cagctggtgc ggcagcttat tacgtggggt atcttcagcc taggacgttc 780
ctattaaaat ataatgaaaa tggaaccatt acagatgctg tagactgtgc acttgaccct 840
ctctcagaaa caaagtgtac gttgaaatcc ttcacggtag aaaaagggat ctaccaaacg 900
tctaacttca gagtccagcc aacagaatct attgtgagat ttcccaatat tacaaacttg 960
tgccctttcg gagaagtttt taacgccacc aggtttgcat cggtttatgc ttggaacagg 1020
aaaagaatca gcaactgtgt tgctgattat agtgtcctat ataactccgc atccttttcc 1080
actttcaagt gttacggagt ttctcctact aaattaaatg atctctgctt tactaatgtc 1140
tatgcagatt catttgtaat cagaggtgat gaggtcagac aaatcgctcc agggcagact 1200
ggaaagattg ctgattataa ttataagctt cctgatgatt ttacaggctg cgttatagca 1260
tggaattcta ataatcttga ctctaaggtg gggggaaatt ataattacct gtatagactg 1320
tttaggaaga gcaatctcaa gcctttcgag agagacattt caactgagat ctaccaggcg 1380
ggaagcactc cgtgtaatgg tgttgagggt tttaattgtt actttccttt acagtcatac 1440
ggtttccaac ccacgaatgg ggttggttac caaccgtacc gagtagtagt actttctttc 1500
gagcttctac atgccccagc aactgtttgt ggacctaaga agtctactaa tttggttaaa 1560
aataagtgtg tcaattttaa tttcaatgga cttacgggca caggagttct tactgagtct 1620
aacaagaagt ttctgccttt ccagcagttc ggcagagata ttgctgacac tactgatgct 1680
gtgcgtgatc cacagacact tgaaattctt gacattacac catgttcttt tggtggcgtg 1740
agtgttataa ctcccggaac aaatacctcc aaccaggtgg ctgttctgta tcaggacgtg 1800
aactgtacag aagtccctgt tgcaattcat gcagatcagc ttactcctac ctggcgtgtt 1860
tattctacgg gttccaatgt ttttcaaaca cgtgcaggct gcttgatagg ggctgaacat 1920
gtcaacaact catatgaatg cgacataccc ataggtgcag gtatatgcgc tagttatcag 1980
actcagacca attctccgcg gcgggcacga agtgtagcta gtcaatccat cattgcctac 2040
actatgtcac ttggtgcaga aaattcagtt gcttactcta ataactctat tgccataccc 2100
acaaatttta ctattagtgt taccacagaa attctaccag tgtctatgac caagacatca 2160
gttgactgta caatgtatat ttgcggggat tcaactgagt gctcgaatct gttgttgcaa 2220
tacggcagtt tttgtaccca attgaaccgg gctctgactg gaatagctgt ggaacaagat 2280
aaaaacaccc aagaagtttt tgcacaagtc aaacaaattt ataaaacacc accaattaaa 2340
gatttcggtg gtttcaactt ctcacaaata ctgccagatc cgagcaaacc aagcaagagg 2400
tcattcattg aagacctact tttcaacaaa gtgacacttg cagatgctgg cttcattaaa 2460
cagtatggtg attgcttggg ggatattgct gctagagacc tcatttgtgc acaaaagttt 2520
aacgggctga cagtgttgcc acctttgttg acagatgaga tgattgctca gtacacttct 2580
gcactgctcg ctggtacaat cacatctggg tggacctttg gtgcaggtgc tgccttacaa 2640
ataccatttg ctatgcagat ggcttatagg ttcaatggta tcggagttac acagaacgtt 2700
ctctatgaga accaaaaatt gattgccaac caattcaata gtgccattgg caagattcag 2760
gactcacttt caagcacagc gagtgcactt ggaaagttgc aagatgtggt caaccagaat 2820
gcacaagctt taaacacgct tgtgaaacaa ctcagctcca actttggggc aatttcaagt 2880
gttttgaatg atatcctttc acgtcttgat aaagtggaag ccgaggtgca aattgacagg 2940
ttgatcacag gccgacttca aagtttgcag acttatgtga ctcaacaatt aattagggca 3000
gcagaaatcc gcgcttcggc taatctggcg gctactaaaa tgtcagagtg tgtacttgga 3060
caatctaaac gagttgattt ttgcggaaag ggctatcatc tcatgtcctt ccctcagtca 3120
gcgcctcacg gtgtagtgtt cttgcacgtg acttacgttc ctgcacaaga aaagaatttc 3180
acaactgctc cggccatttg tcatgatgga aaagcccact ttccgcgtga aggtgtcttt 3240
gtttcgaatg gcacacactg gtttgtaacc caaaggaatt tttatgagcc acaaatcatt 3300
acgacggaca acacttttgt gtctggtaat tgtgatgttg taatcggaat cgtcaacaac 3360
accgtttacg atcctttgca gcctgagtta gattctttca aagaggagct ggataagtat 3420
ttcaagaatc atacatcacc cgatgttgat ctcggtgata tctctggaat taatgcttca 3480
gttgtgaaca ttcaaaagga gattgaccgc ctcaatgagg ttgccaagaa tttgaatgaa 3540
tcgctcatcg atctccaaga acttggaaag tatgagcagt atatcaagtg gcca 3594
<210> 2
<211> 1198
<212> PRT
<213> Artificial Sequence
<220>
<223> Sf delta (TMD-CT)
<400> 2
Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser
1 5 10 15
Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val
20 25 30
Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr
35 40 45
Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe
50 55 60
Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr
65 70 75 80
Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp
85 90 95
Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val
100 105 110
Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val
115 120 125
Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val
130 135 140
Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe
145 150 155 160
Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu
165 170 175
Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His
180 185 190
Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu
195 200 205
Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln
210 215 220
Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser
225 230 235 240
Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln
245 250 255
Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp
260 265 270
Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu
275 280 285
Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg
290 295 300
Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu
305 310 315 320
Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr
325 330 335
Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val
340 345 350
Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser
355 360 365
Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser
370 375 380
Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr
385 390 395 400
Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly
405 410 415
Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly
420 425 430
Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro
435 440 445
Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro
450 455 460
Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr
465 470 475 480
Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val
485 490 495
Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro
500 505 510
Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe
515 520 525
Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe
530 535 540
Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala
545 550 555 560
Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser
565 570 575
Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln
580 585 590
Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala
595 600 605
Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly
610 615 620
Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His
625 630 635 640
Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys
645 650 655
Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val
660 665 670
Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn
675 680 685
Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr
690 695 700
Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser
705 710 715 720
Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn
725 730 735
Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu
740 745 750
Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala
755 760 765
Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly
770 775 780
Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg
785 790 795 800
Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala
805 810 815
Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg
820 825 830
Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro
835 840 845
Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala
850 855 860
Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln
865 870 875 880
Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val
885 890 895
Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe
900 905 910
Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser
915 920 925
Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu
930 935 940
Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser
945 950 955 960
Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val
965 970 975
Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr
980 985 990
Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
995 1000 1005
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg
1010 1015 1020
Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser
1025 1030 1035 1040
Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
1045 1050 1055
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys Ala
1060 1065 1070
His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His Trp Phe
1075 1080 1085
Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr Thr Asp Asn
1090 1095 1100
Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly Ile Val Asn Asn
1105 1110 1115 1120
Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu
1125 1130 1135
Leu Asp Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly
1140 1145 1150
Asp Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile
1155 1160 1165
Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp
1170 1175 1180
Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro
1185 1190 1195
<210> 3
<211> 1998
<212> DNA
<213> Artificial Sequence
<220>
<223> S1s
<400> 3
gttaacctta ccaccagaac tcagttaccc ccagcataca ctaattcttt cacacgtggt 60
gtttactacc ctgacaaagt tttcagaagc agcgttttac acagcactca ggatttattc 120
ctacctttct tttccaacgt gacctggttc catgctatac atgtatctgg gaccaatggt 180
accaagaggt ttgataaccc ggtcctacca tttaatgatg gagtctattt tgcctccact 240
gagaagtcta atataataag aggctggatt tttggaacta ctcttgattc gaagacccag 300
agtctactta ttgttaataa cgctacaaat gttgttatca aagtatgtga atttcaattc 360
tgtaatgatc cattcttggg tgtttactac cacaaaaaca acaaaagttg gatggaaagt 420
gagtttcggg tttatagcag tgcgaataat tgcacttttg agtacgtctc ccaacctttt 480
cttatggacc ttgaaggaaa gcagggaaat ttcaagaatc ttcgcgaatt tgtgtttaag 540
aatatcgatg gttatttcaa gatatattct aagcacacgc ctattaattt agtgcgagat 600
ctccctcagg gtttttcggc gctggaacca ttggtagatt tgccgatagg aatcaatatc 660
actaggttcc agactttact tgctctgcat agaagttact tgacccctgg agatagctca 720
tcaggttgga cagctggtgc ggcagcttat tacgtggggt atcttcagcc taggacgttc 780
ctattaaaat ataatgaaaa tggaaccatt acagatgctg tagactgtgc acttgaccct 840
ctctcagaaa caaagtgtac gttgaaatcc ttcacggtag aaaaagggat ctaccaaacg 900
tctaacttca gagtccagcc aacagaatct attgtgagat ttcccaatat tacaaacttg 960
tgccctttcg gagaagtttt taacgccacc aggtttgcat cggtttatgc ttggaacagg 1020
aaaagaatca gcaactgtgt tgctgattat agtgtcctat ataactccgc atccttttcc 1080
actttcaagt gttacggagt ttctcctact aaattaaatg atctctgctt tactaatgtc 1140
tatgcagatt catttgtaat cagaggtgat gaggtcagac aaatcgctcc agggcagact 1200
ggaaagattg ctgattataa ttataagctt cctgatgatt ttacaggctg cgttatagca 1260
tggaattcta ataatcttga ctctaaggtg gggggaaatt ataattacct gtatagactg 1320
tttaggaaga gcaatctcaa gcctttcgag agagacattt caactgagat ctaccaggcg 1380
ggaagcactc cgtgtaatgg tgttgagggt tttaattgtt actttccttt acagtcatac 1440
ggtttccaac ccacgaatgg ggttggttac caaccgtacc gagtagtagt actttctttc 1500
gagcttctac atgccccagc aactgtttgt ggacctaaga agtctactaa tttggttaaa 1560
aataagtgtg tcaattttaa tttcaatgga cttacgggca caggagttct tactgagtct 1620
aacaagaagt ttctgccttt ccagcagttc ggcagagata ttgctgacac tactgatgct 1680
gtgcgtgatc cacagacact tgaaattctt gacattacac catgttcttt tggtggcgtg 1740
agtgttataa ctcccggaac aaatacctcc aaccaggtgg ctgttctgta tcaggacgtg 1800
aactgtacag aagtccctgt tgcaattcat gcagatcagc ttactcctac ctggcgtgtt 1860
tattctacgg gttccaatgt ttttcaaaca cgtgcaggct gcttgatagg ggctgaacat 1920
gtcaacaact catatgaatg cgacataccc ataggtgcag gtatatgcgc tagttatcag 1980
actcagacca attctccg 1998
<210> 4
<211> 666
<212> PRT
<213> Artificial Sequence
<220>
<223> S1s protein
<400> 4
Val Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser
1 5 10 15
Phe Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val
20 25 30
Leu His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr
35 40 45
Trp Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe
50 55 60
Asp Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr
65 70 75 80
Glu Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp
85 90 95
Ser Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val
100 105 110
Ile Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val
115 120 125
Tyr Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val
130 135 140
Tyr Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe
145 150 155 160
Leu Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu
165 170 175
Phe Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His
180 185 190
Thr Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu
195 200 205
Glu Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln
210 215 220
Thr Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser
225 230 235 240
Ser Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln
245 250 255
Pro Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp
260 265 270
Ala Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu
275 280 285
Lys Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg
290 295 300
Val Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu
305 310 315 320
Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr
325 330 335
Ala Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val
340 345 350
Leu Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser
355 360 365
Pro Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser
370 375 380
Phe Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr
385 390 395 400
Gly Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly
405 410 415
Cys Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly
420 425 430
Asn Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro
435 440 445
Phe Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro
450 455 460
Cys Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr
465 470 475 480
Gly Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val
485 490 495
Val Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro
500 505 510
Lys Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe
515 520 525
Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe
530 535 540
Leu Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala
545 550 555 560
Val Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser
565 570 575
Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln
580 585 590
Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala
595 600 605
Ile His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly
610 615 620
Ser Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His
625 630 635 640
Val Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys
645 650 655
Ala Ser Tyr Gln Thr Gln Thr Asn Ser Pro
660 665
<210> 5
<211> 1596
<212> DNA
<213> Artificial Sequence
<220>
<223> S2s delta (TMD-CT)
<400> 5
cggcgggcac gaagtgtagc tagtcaatcc atcattgcct acactatgtc acttggtgca 60
gaaaattcag ttgcttactc taataactct attgccatac ccacaaattt tactattagt 120
gttaccacag aaattctacc agtgtctatg accaagacat cagttgactg tacaatgtat 180
atttgcgggg attcaactga gtgctcgaat ctgttgttgc aatacggcag tttttgtacc 240
caattgaacc gggctctgac tggaatagct gtggaacaag ataaaaacac ccaagaagtt 300
tttgcacaag tcaaacaaat ttataaaaca ccaccaatta aagatttcgg tggtttcaac 360
ttctcacaaa tactgccaga tccgagcaaa ccaagcaaga ggtcattcat tgaagaccta 420
cttttcaaca aagtgacact tgcagatgct ggcttcatta aacagtatgg tgattgcttg 480
ggggatattg ctgctagaga cctcatttgt gcacaaaagt ttaacgggct gacagtgttg 540
ccacctttgt tgacagatga gatgattgct cagtacactt ctgcactgct cgctggtaca 600
atcacatctg ggtggacctt tggtgcaggt gctgccttac aaataccatt tgctatgcag 660
atggcttata ggttcaatgg tatcggagtt acacagaacg ttctctatga gaaccaaaaa 720
ttgattgcca accaattcaa tagtgccatt ggcaagattc aggactcact ttcaagcaca 780
gcgagtgcac ttggaaagtt gcaagatgtg gtcaaccaga atgcacaagc tttaaacacg 840
cttgtgaaac aactcagctc caactttggg gcaatttcaa gtgttttgaa tgatatcctt 900
tcacgtcttg ataaagtgga agccgaggtg caaattgaca ggttgatcac aggccgactt 960
caaagtttgc agacttatgt gactcaacaa ttaattaggg cagcagaaat ccgcgcttcg 1020
gctaatctgg cggctactaa aatgtcagag tgtgtacttg gacaatctaa acgagttgat 1080
ttttgcggaa agggctatca tctcatgtcc ttccctcagt cagcgcctca cggtgtagtg 1140
ttcttgcacg tgacttacgt tcctgcacaa gaaaagaatt tcacaactgc tccggccatt 1200
tgtcatgatg gaaaagccca ctttccgcgt gaaggtgtct ttgtttcgaa tggcacacac 1260
tggtttgtaa cccaaaggaa tttttatgag ccacaaatca ttacgacgga caacactttt 1320
gtgtctggta attgtgatgt tgtaatcgga atcgtcaaca acaccgttta cgatcctttg 1380
cagcctgagt tagattcttt caaagaggag ctggataagt atttcaagaa tcatacatca 1440
cccgatgttg atctcggtga tatctctgga attaatgctt cagttgtgaa cattcaaaag 1500
gagattgacc gcctcaatga ggttgccaag aatttgaatg aatcgctcat cgatctccaa 1560
gaacttggaa agtatgagca gtatatcaag tggcca 1596
<210> 6
<211> 532
<212> PRT
<213> Artificial Sequence
<220>
<223> S2s delta (TMD-CT)
<400> 6
Arg Arg Ala Arg Ser Val Ala Ser Gln Ser Ile Ile Ala Tyr Thr Met
1 5 10 15
Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala
20 25 30
Ile Pro Thr Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val
35 40 45
Ser Met Thr Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp
50 55 60
Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr
65 70 75 80
Gln Leu Asn Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn
85 90 95
Thr Gln Glu Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro
100 105 110
Ile Lys Asp Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro
115 120 125
Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys
130 135 140
Val Thr Leu Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu
145 150 155 160
Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly
165 170 175
Leu Thr Val Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr
180 185 190
Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly
195 200 205
Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg
210 215 220
Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys
225 230 235 240
Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser
245 250 255
Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn
260 265 270
Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn
275 280 285
Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp
290 295 300
Lys Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu
305 310 315 320
Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu
325 330 335
Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val
340 345 350
Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu
355 360 365
Met Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val
370 375 380
Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile
385 390 395 400
Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser
405 410 415
Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
420 425 430
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val
435 440 445
Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu
450 455 460
Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser
465 470 475 480
Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val Val
485 490 495
Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys Asn Leu
500 505 510
Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr
515 520 525
Ile Lys Trp Pro
530
<210> 7
<211> 96
<212> DNA
<213> Artificial Sequence
<220>
<223> mCOr1
<400> 7
gtgtctaggc ttgaggaaga tgttagaaat ctcaacgcaa ttgtccagaa acttcaggaa 60
aggttggata ggctggagga aactgttcaa gctaag 96
<210> 8
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<223> mCor1
<400> 8
Val Ser Arg Leu Glu Glu Asp Val Arg Asn Leu Asn Ala Ile Val Gln
1 5 10 15
Lys Leu Gln Glu Arg Leu Asp Arg Leu Glu Glu Thr Val Gln Ala Lys
20 25 30
<210> 9
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Linker
<400> 9
ggaggttcag gaggttcagg aggttcagga ggttca 36
<210> 10
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> Linker
<400> 10
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser
1 5 10
<210> 11
<211> 272
<212> DNA
<213> Artificial Sequence
<220>
<223> BiP
<400> 11
atggctcgct cgtttggagc taacagtacc gttgtgttgg cgatcatctt cttcggtgag 60
tgattttccg atcttcttct ccgatttaga tctcctctac attgttgctt aatctcagaa 120
ccttttttcg ttgttcctgg atctgaatgt gtttgtttgc aatttcacga tcttaaaagg 180
ttagatctcg attggtattg acgattggaa tctttacgat ttcaggatgt ttatttgcgt 240
tgtcctctgc aatagaagag gctacgaagt ta 272
<210> 12
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> HDEL
<400> 12
cacgatgagc tc 12
<210> 13
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> HDEL
<400> 13
His Asp Glu Leu
1
<210> 14
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'UTR
<400> 14
aattattaca tcaaaacaaa aa 22
<210> 15
<211> 1220
<212> DNA
<213> Artificial Sequence
<220>
<223> MacT
<400> 15
agagatctcc tttgccccag agatcacaat ggacgacttc ctctatctct acgatctagt 60
caggaagttc gacggagaag gtgacgatac catgttcacc actgataatg agaagattag 120
ccttttcaat ttcagaaaga atgctaaccc acagatggtt agagaggctt acgcagcagg 180
tctcatcaag acgatctacc cgagcaataa tctccaggag atcaaatacc ttcccaagaa 240
ggttaaagat gcagtcaaaa gattcaggac taactgcatc aagaacacag agaaagatat 300
atttctcaag atcagaagta ctattccagt atggacgatt caaggcttgc ttcacaaacc 360
aaggcaagta atagagattg gagtctctaa aaaggtagtt cccactgaat caaaggccat 420
ggagtcaaag attcaaatag aggacctaac agaactcgcc gtaaagactg gcgaacagtt 480
catacagagt ctcttacgac tcaatgacaa gaagaaaatc ttcgtcaaca tggtggagca 540
cgacacgctt gtctactcca aaaatatcaa agatacagtc tcagaagacc aaagggcaat 600
tgagactttt caacaaaggg taatatccgg aaacctcctc ggattccatt gcccagctat 660
ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc tcctacaaat gccatcattg 720
cgataaagga aaggccatcg ttgaagatgc ctctgccgac agtggtccca aagatggacc 780
cccacccacg aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt 840
ggattgatgt gacgcaagac gtgacgtaag tatctgagct agtttttatt tttctactaa 900
tttggtcgtt tatttcggcg tgtaggacat ggcaaccggg cctgaatttc gcgggtattc 960
tgtttctatt ccaacttttt cttgatccgc agccattaac gacttttgaa tagatacgct 1020
gacacgccaa gcctcgctag tcaaaagtgt accaaacaac gctttacagc aagaacggaa 1080
tgcgcgtgac gctcgcggtg acgccatttc gccttttcag aaatggataa atagccttgc 1140
ttcctattat atcttcccaa attaccaata cattacacta gcatctgaat ttcataacca 1200
atctcgatac accaaatcgt 1220
<210> 16
<211> 520
<212> DNA
<213> Artificial Sequence
<220>
<223> RD29B terminator
<400> 16
aattttactc aaaatgtttt ggttgctatg gtagggacta tggggttttc ggattccggt 60
ggaagtgagt ggggaggcag tggcggaggt aagggagttc aagattctgg aactgaagat 120
ttggggtttt gcttttgaat gtttgcgttt ttgtatgatg cctctgtttg tgaactttga 180
tgtattttat ctttgtgtga aaaagagatt gggttaataa aatatttgct tttttggata 240
agaaactctt ttagcggccc attaataaag gttacaaatg caaaatcatg ttagcgtcag 300
atatttaatt attcgaagat gattgtgata gatttaaaat tatcctagtc aaaaagaaag 360
agtaggttga gcagaaacag tgacatctgt tgtttgtacc atacaaatta gtttagatta 420
ttggttaaca tgttaaatgg ctatgcatgt gacatttaga ccttatcgga attaatttgt 480
agaattatta attaagatgt tgattagttc aaacaaaaat 520
Claims (14)
- (i) 코로나 바이러스의 스파이크 단백질에 있어서 막 관통 도메인 (trans-membrane domain)부터 C-말단까지의 아미노산 서열이 결여된 것으로, 서열번호 2의 아미노산 서열로 이루어진 단백질을 코딩하는 유전자; 및
(ii) Coronin 1 (mCor 1)의 삼량체 모티프(trimeric motif) 부위의 단백질을 코딩하는 유전자;를 포함하는, 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터.
- 제1 항에 있어서, 상기 코로나 바이러스는 사스(SARS-Corona Virus), 메르스(MERS-Corona Virus) 및 코로나-19(SARS-Corona Virus-2)로 이루어진 군으로부터 선택되는 어느 하나인, 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터.
- 삭제
- 제2 항에 있어서, 상기 코로나-19 바이러스의 스파이크 단백질에서 막 관통 도메인 (transmembrane domain)부터 C-말단까지의 아미노산 서열이 결여된 단백질을 코딩하는 유전자는 서열번호 1의 염기서열을 포함하는, 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터.
- 삭제
- 제2 항에 있어서, 상기 코로나-19 바이러스의 스파이크 단백질에서 N-말단부터 서브도메인 2(sub-domain 2; SD 2)까지를 포함하는 단백질을 코딩하는 유전자는 서열번호 3의 염기서열을 포함하는, 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터.
- 삭제
- 제1 항에 있어서, 상기 Coronin 1 (mCor 1)의 삼량체 모티브(trimeric motif) 부위의 단백질을 코딩하는 유전자는 서열번호 5의 염기서열을 포함하는, 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터.
- 제1 항에 있어서,
상기 벡터는 바이너리 벡터인, 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터.
- 제1 항에 있어서, 상기 재조합 벡터는 꽃양배추 모자이크 바이러스 (cauliflower mosaic virus)에서 유래한 35S 프로모터, 꽃양배추 모자이크 바이러스 (cauliflower mosaic virus)에서 유래한 19S RNA 프로모터, Mac 프로모터 (Mac promoter), 식물의 액틴 단백질 프로모터 및 유비퀴틴 단백질 프로모터로 이루어진 군으로부터 선택되는 어느 하나의 프로모터를 추가로 포함하는, 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하기 위한 재조합 벡터.
- 제1 항의 재조합 벡터로 형질 전환된 형질 전환 생물.
- 제11 항에 있어서, 상기 형질 전환된 형질 전환 생물은 원핵생물 또는 진핵생물인, 형질 전환체.
- (a) 제1 항의 재조합 벡터를 제작하는 단계;
(b) 상기 재조합 벡터를 생물에 도입하여 형질 전환 생물을 제조하는 단계;
(c) 상기 형질 전환 생물을 배양하는 단계;
(d) 상기 배양물을 식물에 침윤하는 단계; 및
(e) 상기 식물을 분쇄하여 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 수득하는 단계를 포함하는,
식물에서 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하는 방법.
- 제13 항의 삼량체를 형성하는 코로나 바이러스의 재조합 스파이크 단백질을 생산하는 방법에 따라 제조된 재조합 단백질.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200048980 | 2020-04-22 | ||
KR20200048980 | 2020-04-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210130664A KR20210130664A (ko) | 2021-11-01 |
KR102647829B1 true KR102647829B1 (ko) | 2024-03-14 |
Family
ID=78269837
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210052660A KR102647829B1 (ko) | 2020-04-22 | 2021-04-22 | 삼량체를 형성하는 코로나-19 바이러스 (COVID-19, Coronavirus Disease 2019)의 재조합 스파이크 단백질 및 식물에서의 상기 재조합 스파이크 단백질의 대량 생산 방법과 이를 기반으로하는 백신조성물 제조 방법 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230203101A1 (ko) |
EP (1) | EP4141120A4 (ko) |
JP (1) | JP2023526770A (ko) |
KR (1) | KR102647829B1 (ko) |
CN (1) | CN115867662A (ko) |
WO (1) | WO2021215857A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115845042B (zh) * | 2022-07-07 | 2023-08-29 | 华素生物科技(北京)有限公司 | 重组新型冠状病毒s蛋白三聚体疫苗组合物及其应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102089432A (zh) | 2008-07-08 | 2011-06-08 | 麦迪卡格公司 | 可溶性重组流感抗原 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8300698A (nl) | 1983-02-24 | 1984-09-17 | Univ Leiden | Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten. |
KR101956910B1 (ko) * | 2008-01-21 | 2019-03-12 | 메디카고 인코포레이티드 | 헤마글루티닌을 발현하는 트랜스제닉 식물에서 생산된 재조합 인플루엔자 바이러스-유사 입자(VLPs) |
EP3046579A1 (en) * | 2013-09-19 | 2016-07-27 | Novavax, Inc. | Immunogenic middle east respiratory syndrome coronavirus (mers-cov) compositions and methods |
EA201791683A1 (ru) * | 2015-01-23 | 2017-12-29 | Медикаго Инк. | Получение ротавирусоподобных частиц в растениях |
EP3261665A1 (en) * | 2015-02-24 | 2018-01-03 | The United States of America, as represented by The Secretary, Department of Health and Human Services | Middle east respiratory syndrome coronavirus immunogens, antibodies, and their use |
WO2018097603A2 (ko) * | 2016-11-23 | 2018-05-31 | 에스케이케미칼 주식회사 | 중동호흡기증후군 코로나바이러스 s 단백질 면역원 조성물 및 이의 제작 방법 |
KR20200048980A (ko) | 2018-10-31 | 2020-05-08 | 동국대학교 경주캠퍼스 산학협력단 | 이중나사선 볼트, 너트 및 압축결합 너트 |
-
2021
- 2021-04-22 US US17/920,526 patent/US20230203101A1/en active Pending
- 2021-04-22 WO PCT/KR2021/005124 patent/WO2021215857A1/ko unknown
- 2021-04-22 JP JP2022564531A patent/JP2023526770A/ja active Pending
- 2021-04-22 KR KR1020210052660A patent/KR102647829B1/ko active IP Right Grant
- 2021-04-22 CN CN202180035797.7A patent/CN115867662A/zh active Pending
- 2021-04-22 EP EP21791771.5A patent/EP4141120A4/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102089432A (zh) | 2008-07-08 | 2011-06-08 | 麦迪卡格公司 | 可溶性重组流感抗原 |
Also Published As
Publication number | Publication date |
---|---|
WO2021215857A1 (ko) | 2021-10-28 |
JP2023526770A (ja) | 2023-06-23 |
EP4141120A1 (en) | 2023-03-01 |
CN115867662A (zh) | 2023-03-28 |
KR20210130664A (ko) | 2021-11-01 |
EP4141120A4 (en) | 2024-05-22 |
US20230203101A1 (en) | 2023-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20080091759A (ko) | 신규 식물 바이러스 입자 및 그의 불활성화 방법 | |
EP2486791A2 (en) | Highly pathogenic avian influenza virus protein vaccine derived from transgenic plants, and method for preparing same | |
KR102317403B1 (ko) | 당화된 Ag85A 단백질을 포함하는 결핵 예방용 백신 조성물 및 이의 제조방법 | |
KR102647829B1 (ko) | 삼량체를 형성하는 코로나-19 바이러스 (COVID-19, Coronavirus Disease 2019)의 재조합 스파이크 단백질 및 식물에서의 상기 재조합 스파이크 단백질의 대량 생산 방법과 이를 기반으로하는 백신조성물 제조 방법 | |
US20220133879A1 (en) | Porcine epidemic diarrhea (ped) virus vaccine composition and preparation method thereof | |
US8557246B2 (en) | Fusion protein that directs vaccine antigens to antigen-presenting cells, and applications thereof | |
KR101680903B1 (ko) | 돼지 유행성 설사병 바이러스의 에피토프와 로타바이러스 유전자를 발현하는 형질전환체 및 이를 포함하는 백신 조성물 | |
KR102444019B1 (ko) | 아프리카 돼지열병의 예방을 위한 항원 생산용 재조합 벡터 및 이의 용도 | |
KR20120066555A (ko) | 돼지 유행성 설사병 바이러스의 에피토프 단백질을 발현하는 형질전환체 및 이를 포함하는 pedv 백신 조성물 | |
KR102571164B1 (ko) | 삼량체를 형성하는 인플루엔자 바이러스 표면 단백질 유래 재조합 혈구응집소 (ha)의 단백질 유전자 디자인, 식물에서의 상기 ha 재조합 단백질을 대량 생산하는 방법 및 이를 포함하는 인플루엔자 바이러스 감염 질환의 예방 및 치료용 약학적 조성물 | |
CN107746848B (zh) | 重组猪瘟病毒e2蛋白及其表达细胞系、制备方法、应用及猪瘟病毒亚单位疫苗 | |
EP1401493B1 (en) | Subunit vaccines and processes for the production thereof | |
KR101671528B1 (ko) | 돼지 유행성 설사병 바이러스의 에피토프와 점막면역보조제를 발현하는 형질전환체 및 이를 포함하는 백신 조성물 | |
WO2021215855A1 (ko) | 삼량체를 형성하는 인플루엔자 바이러스 표면 단백질 유래 재조합 혈구응집소 단백질 및 이의 용도 | |
KR102557550B1 (ko) | 식물 기반 covid-19 변이 재조합 스파이크 단백질 발현 벡터 및 상기 발현 벡터를 이용한 재조합 단백질 | |
CN113186204B (zh) | 新型冠状病毒巴西株p.1突变株rbd的基因及其应用 | |
KR101783677B1 (ko) | 식물 바이러스 발현 시스템을 이용한 재조합 뎅기 바이러스 백신을 대량 생산하는 방법 | |
KR20230105738A (ko) | 당쇄 구조가 변형된 식물로부터 생산된 SARS-CoV-2의 스파이크 단백질의 수용체 결합 도메인 및 이의 용도 | |
CN117586422A (zh) | 一种鸭坦布苏病毒核酸疫苗及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |