CN112391399B - 调控水稻穗粒数和株型的基因gh1及其应用 - Google Patents
调控水稻穗粒数和株型的基因gh1及其应用 Download PDFInfo
- Publication number
- CN112391399B CN112391399B CN201910756064.7A CN201910756064A CN112391399B CN 112391399 B CN112391399 B CN 112391399B CN 201910756064 A CN201910756064 A CN 201910756064A CN 112391399 B CN112391399 B CN 112391399B
- Authority
- CN
- China
- Prior art keywords
- plant
- gene
- protein
- rice
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 241000196324 Embryophyta Species 0.000 title claims abstract description 133
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 112
- 235000013339 cereals Nutrition 0.000 title claims abstract description 49
- 235000007164 Oryza sativa Nutrition 0.000 title claims abstract description 46
- 235000009566 rice Nutrition 0.000 title claims abstract description 44
- 230000001105 regulatory effect Effects 0.000 title claims abstract description 16
- 240000007594 Oryza sativa Species 0.000 title abstract description 45
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 66
- 210000004027 cell Anatomy 0.000 claims description 56
- 238000000034 method Methods 0.000 claims description 50
- 230000009418 agronomic effect Effects 0.000 claims description 40
- 239000000203 mixture Substances 0.000 claims description 26
- 102000004373 Actin-related protein 2 Human genes 0.000 claims description 23
- 108090000963 Actin-related protein 2 Proteins 0.000 claims description 23
- 230000002829 reductive effect Effects 0.000 claims description 22
- UJVUMTUBMCYKBK-BNOPZSDTSA-N [(2r)-2-hexadecanoyloxy-3-[hydroxy-[(2r,3r,5s,6r)-2,3,5,6-tetrahydroxy-4-phosphonooxycyclohexyl]oxyphosphoryl]oxypropyl] hexadecanoate Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@@H](OC(=O)CCCCCCCCCCCCCCC)COP(O)(=O)OC1[C@H](O)[C@H](O)C(OP(O)(O)=O)[C@H](O)[C@H]1O UJVUMTUBMCYKBK-BNOPZSDTSA-N 0.000 claims description 21
- 230000014509 gene expression Effects 0.000 claims description 21
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 17
- 230000000694 effects Effects 0.000 claims description 17
- 239000003112 inhibitor Substances 0.000 claims description 15
- 230000015572 biosynthetic process Effects 0.000 claims description 12
- 210000001519 tissue Anatomy 0.000 claims description 12
- 102000007469 Actins Human genes 0.000 claims description 9
- 108010085238 Actins Proteins 0.000 claims description 9
- 230000001404 mediated effect Effects 0.000 claims description 9
- 238000006116 polymerization reaction Methods 0.000 claims description 9
- 239000000126 substance Substances 0.000 claims description 8
- 150000003905 phosphatidylinositols Chemical class 0.000 claims description 7
- 230000002401 inhibitory effect Effects 0.000 claims description 6
- 230000032341 cell morphogenesis Effects 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 238000009472 formulation Methods 0.000 claims description 4
- 230000001965 increasing effect Effects 0.000 claims description 4
- 238000002360 preparation method Methods 0.000 claims description 4
- 229930192334 Auxin Natural products 0.000 claims description 3
- IXVMHGVQKLDRKH-VRESXRICSA-N Brassinolide Natural products O=C1OC[C@@H]2[C@@H]3[C@@](C)([C@H]([C@@H]([C@@H](O)[C@H](O)[C@H](C(C)C)C)C)CC3)CC[C@@H]2[C@]2(C)[C@@H]1C[C@H](O)[C@H](O)C2 IXVMHGVQKLDRKH-VRESXRICSA-N 0.000 claims description 3
- 229930191978 Gibberellin Natural products 0.000 claims description 3
- 239000002363 auxin Substances 0.000 claims description 3
- IXVMHGVQKLDRKH-KNBKMWSGSA-N brassinolide Chemical compound C1OC(=O)[C@H]2C[C@H](O)[C@H](O)C[C@]2(C)[C@H]2CC[C@]3(C)[C@@H]([C@H](C)[C@@H](O)[C@H](O)[C@@H](C)C(C)C)CC[C@H]3[C@@H]21 IXVMHGVQKLDRKH-KNBKMWSGSA-N 0.000 claims description 3
- 239000003448 gibberellin Substances 0.000 claims description 3
- IXORZMNAPKEEDV-OBDJNFEBSA-N gibberellin A3 Chemical class C([C@@]1(O)C(=C)C[C@@]2(C1)[C@H]1C(O)=O)C[C@H]2[C@]2(C=C[C@@H]3O)[C@H]1[C@]3(C)C(=O)O2 IXORZMNAPKEEDV-OBDJNFEBSA-N 0.000 claims description 3
- 241000209094 Oryza Species 0.000 claims 5
- PWVXXGRKLHYWKM-UHFFFAOYSA-N 5-[2-(benzenesulfonyl)ethyl]-3-[(1-methylpyrrolidin-2-yl)methyl]-1h-indole Chemical compound CN1CCCC1CC(C1=C2)=CNC1=CC=C2CCS(=O)(=O)C1=CC=CC=C1 PWVXXGRKLHYWKM-UHFFFAOYSA-N 0.000 claims 1
- 230000001172 regenerating effect Effects 0.000 claims 1
- 101150009271 gh1 gene Proteins 0.000 abstract description 53
- 230000001276 controlling effect Effects 0.000 abstract description 2
- 229920001184 polypeptide Polymers 0.000 description 43
- 108090000765 processed proteins & peptides Proteins 0.000 description 43
- 102000004196 processed proteins & peptides Human genes 0.000 description 43
- 108091033319 polynucleotide Proteins 0.000 description 26
- 102000040430 polynucleotide Human genes 0.000 description 26
- 239000002157 polynucleotide Substances 0.000 description 26
- 108020004414 DNA Proteins 0.000 description 24
- 210000003632 microfilament Anatomy 0.000 description 21
- 239000013598 vector Substances 0.000 description 21
- 108091033409 CRISPR Proteins 0.000 description 17
- 239000002773 nucleotide Substances 0.000 description 16
- 125000003729 nucleotide group Chemical group 0.000 description 16
- 230000006870 function Effects 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 14
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 11
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 11
- 238000011161 development Methods 0.000 description 11
- 230000018109 developmental process Effects 0.000 description 11
- 239000013604 expression vector Substances 0.000 description 11
- 239000012634 fragment Substances 0.000 description 11
- 230000035772 mutation Effects 0.000 description 10
- 108091034117 Oligonucleotide Proteins 0.000 description 9
- -1 antibody Chemical class 0.000 description 9
- 238000010367 cloning Methods 0.000 description 8
- 150000007523 nucleic acids Chemical class 0.000 description 8
- 238000006467 substitution reaction Methods 0.000 description 8
- 210000003527 eukaryotic cell Anatomy 0.000 description 7
- 241000588724 Escherichia coli Species 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 210000003763 chloroplast Anatomy 0.000 description 6
- 238000007796 conventional method Methods 0.000 description 6
- 239000003623 enhancer Substances 0.000 description 6
- 102000039446 nucleic acids Human genes 0.000 description 6
- 108020004707 nucleic acids Proteins 0.000 description 6
- 230000009261 transgenic effect Effects 0.000 description 6
- 238000010354 CRISPR gene editing Methods 0.000 description 5
- 108020004511 Recombinant DNA Proteins 0.000 description 5
- 150000001413 amino acids Chemical class 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 239000005090 green fluorescent protein Substances 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 230000006911 nucleation Effects 0.000 description 5
- 238000010899 nucleation Methods 0.000 description 5
- 230000002018 overexpression Effects 0.000 description 5
- 230000004960 subcellular localization Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 241000238631 Hexapoda Species 0.000 description 4
- 241000209504 Poaceae Species 0.000 description 4
- 108091027967 Small hairpin RNA Proteins 0.000 description 4
- 108020004459 Small interfering RNA Proteins 0.000 description 4
- 238000010459 TALEN Methods 0.000 description 4
- 235000021307 Triticum Nutrition 0.000 description 4
- 241000209140 Triticum Species 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 230000000692 anti-sense effect Effects 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000013632 homeostatic process Effects 0.000 description 4
- 239000003446 ligand Substances 0.000 description 4
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 4
- 108091070501 miRNA Proteins 0.000 description 4
- 239000002679 microRNA Substances 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 150000003915 phosphatidylinositol 4,5-bisphosphates Chemical class 0.000 description 4
- 238000003259 recombinant expression Methods 0.000 description 4
- 238000010188 recombinant method Methods 0.000 description 4
- 239000002924 silencing RNA Substances 0.000 description 4
- 239000004055 small Interfering RNA Substances 0.000 description 4
- 150000003384 small molecules Chemical class 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 241000209524 Araceae Species 0.000 description 3
- 241000743774 Brachypodium Species 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 3
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 3
- 241000219071 Malvaceae Species 0.000 description 3
- 102000002151 Microfilament Proteins Human genes 0.000 description 3
- 108010040897 Microfilament Proteins Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 240000006394 Sorghum bicolor Species 0.000 description 3
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 3
- 240000008042 Zea mays Species 0.000 description 3
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 3
- 238000009395 breeding Methods 0.000 description 3
- 230000001488 breeding effect Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000030609 dephosphorylation Effects 0.000 description 3
- 238000006209 dephosphorylation reaction Methods 0.000 description 3
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- SZPQTEWIRPXBTC-LNNNXZRXSA-N 1,2-dipalmitoyl-sn-glycero-3-phospho-(1D-myo-inositol-5-phosphate) Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@@H](OC(=O)CCCCCCCCCCCCCCC)COP(O)(=O)O[C@@H]1[C@H](O)[C@H](O)[C@@H](O)[C@H](OP(O)(O)=O)[C@H]1O SZPQTEWIRPXBTC-LNNNXZRXSA-N 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 241000219194 Arabidopsis Species 0.000 description 2
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- 108091033380 Coding strand Proteins 0.000 description 2
- 241000142975 Cornaceae Species 0.000 description 2
- 230000006820 DNA synthesis Effects 0.000 description 2
- 241000234272 Dioscoreaceae Species 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 241000218791 Ginkgoaceae Species 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 241001113566 Hydrocharitaceae Species 0.000 description 2
- 241000195948 Lycopodiaceae Species 0.000 description 2
- 241000218231 Moraceae Species 0.000 description 2
- 241000219926 Myrtaceae Species 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 240000002582 Oryza sativa Indica Group Species 0.000 description 2
- 240000008467 Oryza sativa Japonica Group Species 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 2
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 2
- 244000184734 Pyrus japonica Species 0.000 description 2
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 2
- 241000218998 Salicaceae Species 0.000 description 2
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 2
- 244000062793 Sorghum vulgare Species 0.000 description 2
- 241000187747 Streptomyces Species 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 239000000443 aerosol Substances 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 229930002875 chlorophyll Natural products 0.000 description 2
- 235000019804 chlorophyll Nutrition 0.000 description 2
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 238000000975 co-precipitation Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000002380 cytological effect Effects 0.000 description 2
- 210000004292 cytoskeleton Anatomy 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000002552 dosage form Substances 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 239000006260 foam Substances 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000003205 genotyping method Methods 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 239000008187 granular material Substances 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 230000014726 immortalization of host cell Effects 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000010297 mechanical methods and process Methods 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 235000019713 millet Nutrition 0.000 description 2
- 230000009456 molecular mechanism Effects 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 239000006072 paste Substances 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000000492 total internal reflection fluorescence microscopy Methods 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 241000701161 unidentified adenovirus Species 0.000 description 2
- 241000701447 unidentified baculovirus Species 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- AUXMWYRZQPIXCC-KNIFDHDWSA-N (2s)-2-amino-4-methylpentanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.CC(C)C[C@H](N)C(O)=O AUXMWYRZQPIXCC-KNIFDHDWSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 241000219066 Actinidiaceae Species 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 1
- SHYYAQLDNVHPFT-DLOVCJGASA-N Ala-Asn-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SHYYAQLDNVHPFT-DLOVCJGASA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- VHEVVUZDDUCAKU-FXQIFTODSA-N Ala-Met-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O VHEVVUZDDUCAKU-FXQIFTODSA-N 0.000 description 1
- SYIFFFHSXBNPMC-UWJYBYFXSA-N Ala-Ser-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N SYIFFFHSXBNPMC-UWJYBYFXSA-N 0.000 description 1
- BVLPIIBTWIYOML-ZKWXMUAHSA-N Ala-Val-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BVLPIIBTWIYOML-ZKWXMUAHSA-N 0.000 description 1
- 241000209514 Alismataceae Species 0.000 description 1
- 241000219317 Amaranthaceae Species 0.000 description 1
- 240000001592 Amaranthus caudatus Species 0.000 description 1
- 235000009328 Amaranthus caudatus Nutrition 0.000 description 1
- 241000234270 Amaryllidaceae Species 0.000 description 1
- 241000208223 Anacardiaceae Species 0.000 description 1
- 241000542898 Aponogetonaceae Species 0.000 description 1
- 241000209034 Aquifoliaceae Species 0.000 description 1
- 241000233788 Arecaceae Species 0.000 description 1
- KJGNDQCYBNBXDA-GUBZILKMSA-N Arg-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N KJGNDQCYBNBXDA-GUBZILKMSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- WESHVRNMNFMVBE-FXQIFTODSA-N Arg-Asn-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N WESHVRNMNFMVBE-FXQIFTODSA-N 0.000 description 1
- PTVGLOCPAVYPFG-CIUDSAMLSA-N Arg-Gln-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PTVGLOCPAVYPFG-CIUDSAMLSA-N 0.000 description 1
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- UAOSDDXCTBIPCA-QXEWZRGKSA-N Arg-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UAOSDDXCTBIPCA-QXEWZRGKSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 1
- RFNDQEWMNJMQHD-SZMVWBNQSA-N Arg-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RFNDQEWMNJMQHD-SZMVWBNQSA-N 0.000 description 1
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 1
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 1
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 1
- PTNFNTOBUDWHNZ-GUBZILKMSA-N Asn-Arg-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O PTNFNTOBUDWHNZ-GUBZILKMSA-N 0.000 description 1
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- SQZIAWGBBUSSPJ-ZKWXMUAHSA-N Asn-Cys-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N SQZIAWGBBUSSPJ-ZKWXMUAHSA-N 0.000 description 1
- OLVIPTLKNSAYRJ-YUMQZZPRSA-N Asn-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N OLVIPTLKNSAYRJ-YUMQZZPRSA-N 0.000 description 1
- VXLBDJWTONZHJN-YUMQZZPRSA-N Asn-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N VXLBDJWTONZHJN-YUMQZZPRSA-N 0.000 description 1
- KMCRKVOLRCOMBG-DJFWLOJKSA-N Asn-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KMCRKVOLRCOMBG-DJFWLOJKSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- KHCNTVRVAYCPQE-CIUDSAMLSA-N Asn-Lys-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O KHCNTVRVAYCPQE-CIUDSAMLSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- ILJQISGMGXRZQQ-IHRRRGAJSA-N Asp-Arg-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ILJQISGMGXRZQQ-IHRRRGAJSA-N 0.000 description 1
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 1
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 241000209763 Avena sativa Species 0.000 description 1
- 235000007558 Avena sp Nutrition 0.000 description 1
- 241000219495 Betulaceae Species 0.000 description 1
- 241000234670 Bromeliaceae Species 0.000 description 1
- 241000231390 Burmanniaceae Species 0.000 description 1
- 241000208229 Burseraceae Species 0.000 description 1
- 241000489499 Butomaceae Species 0.000 description 1
- 241000208195 Buxaceae Species 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000208671 Campanulaceae Species 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- 241000234586 Cannaceae Species 0.000 description 1
- 241000208365 Celastraceae Species 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 241000233833 Commelinaceae Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241000220284 Crassulaceae Species 0.000 description 1
- 241000218931 Cycadaceae Species 0.000 description 1
- 241000234646 Cyperaceae Species 0.000 description 1
- UCMIKRLLIOVDRJ-XKBZYTNZSA-N Cys-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N)O UCMIKRLLIOVDRJ-XKBZYTNZSA-N 0.000 description 1
- RWAZRMXTVSIVJR-YUMQZZPRSA-N Cys-Gly-His Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CNC=N1)C(O)=O RWAZRMXTVSIVJR-YUMQZZPRSA-N 0.000 description 1
- BLGNLNRBABWDST-CIUDSAMLSA-N Cys-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N BLGNLNRBABWDST-CIUDSAMLSA-N 0.000 description 1
- AZDQAZRURQMSQD-XPUUQOCRSA-N Cys-Val-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AZDQAZRURQMSQD-XPUUQOCRSA-N 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- 108700034637 EC 3.2.-.- Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241001112007 Eriocaulaceae Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 241000221017 Euphorbiaceae Species 0.000 description 1
- 241000220485 Fabaceae Species 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 241000731959 Flagellariaceae Species 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 1
- JKDBRTNMYXYLHO-JYJNAYRXSA-N Gln-Tyr-Leu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 JKDBRTNMYXYLHO-JYJNAYRXSA-N 0.000 description 1
- IRDASPPCLZIERZ-XHNCKOQMSA-N Glu-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N IRDASPPCLZIERZ-XHNCKOQMSA-N 0.000 description 1
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- CYHBMLHCQXXCCT-AVGNSLFASA-N Glu-Asp-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CYHBMLHCQXXCCT-AVGNSLFASA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- CBWKURKPYSLMJV-SOUVJXGZSA-N Glu-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CBWKURKPYSLMJV-SOUVJXGZSA-N 0.000 description 1
- TWYFJOHWGCCRIR-DCAQKATOSA-N Glu-Pro-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYFJOHWGCCRIR-DCAQKATOSA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- FQKKPCWTZZEDIC-XPUUQOCRSA-N Gly-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 FQKKPCWTZZEDIC-XPUUQOCRSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- YIFUFYZELCMPJP-YUMQZZPRSA-N Gly-Leu-Cys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O YIFUFYZELCMPJP-YUMQZZPRSA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 1
- MWWOPNQSBXEUHO-ULQDDVLXSA-N His-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 MWWOPNQSBXEUHO-ULQDDVLXSA-N 0.000 description 1
- JWTKVPMQCCRPQY-SRVKXCTJSA-N His-Asn-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JWTKVPMQCCRPQY-SRVKXCTJSA-N 0.000 description 1
- LYSMQLXUCAKELQ-DCAQKATOSA-N His-Asp-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N LYSMQLXUCAKELQ-DCAQKATOSA-N 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- ZVKDCQVQTGYBQT-LSJOCFKGSA-N His-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O ZVKDCQVQTGYBQT-LSJOCFKGSA-N 0.000 description 1
- UWNUQPZUSRFIIN-JUKXBJQTSA-N His-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N UWNUQPZUSRFIIN-JUKXBJQTSA-N 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 241001091442 Hydrangeaceae Species 0.000 description 1
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 1
- CYHJCEKUMCNDFG-LAEOZQHASA-N Ile-Gln-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N CYHJCEKUMCNDFG-LAEOZQHASA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- DFFTXLCCDFYRKD-MBLNEYKQSA-N Ile-Gly-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N DFFTXLCCDFYRKD-MBLNEYKQSA-N 0.000 description 1
- CCYGNFBYUNHFSC-MGHWNKPDSA-N Ile-His-Phe Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CCYGNFBYUNHFSC-MGHWNKPDSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 1
- 241001113425 Iridaceae Species 0.000 description 1
- 241000758791 Juglandaceae Species 0.000 description 1
- 241000731961 Juncaceae Species 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 1
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 1
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- MJTOYIHCKVQICL-ULQDDVLXSA-N Leu-Met-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MJTOYIHCKVQICL-ULQDDVLXSA-N 0.000 description 1
- HGUUMQWGYCVPKG-DCAQKATOSA-N Leu-Pro-Cys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HGUUMQWGYCVPKG-DCAQKATOSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 1
- CNWDWAMPKVYJJB-NUTKFTJISA-N Leu-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CNWDWAMPKVYJJB-NUTKFTJISA-N 0.000 description 1
- YWFZWQKWNDOWPA-XIRDDKMYSA-N Leu-Trp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O YWFZWQKWNDOWPA-XIRDDKMYSA-N 0.000 description 1
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- 241000234280 Liliaceae Species 0.000 description 1
- GGNOBVSOZPHLCE-GUBZILKMSA-N Lys-Gln-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GGNOBVSOZPHLCE-GUBZILKMSA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- WINFHLHJTRGLCV-BZSNNMDCSA-N Lys-Tyr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 WINFHLHJTRGLCV-BZSNNMDCSA-N 0.000 description 1
- 241000219991 Lythraceae Species 0.000 description 1
- 241000234676 Marantaceae Species 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- HLQWFLJOJRFXHO-CIUDSAMLSA-N Met-Glu-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O HLQWFLJOJRFXHO-CIUDSAMLSA-N 0.000 description 1
- UZWMJZSOXGOVIN-LURJTMIESA-N Met-Gly-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(=O)NCC(O)=O UZWMJZSOXGOVIN-LURJTMIESA-N 0.000 description 1
- VWWGEKCAPBMIFE-SRVKXCTJSA-N Met-Met-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O VWWGEKCAPBMIFE-SRVKXCTJSA-N 0.000 description 1
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 1
- 241000234615 Musaceae Species 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 101710118186 Neomycin resistance protein Proteins 0.000 description 1
- 241000209018 Nyssaceae Species 0.000 description 1
- BZQFBWGGLXLEPQ-UHFFFAOYSA-N O-phosphoryl-L-serine Natural products OC(=O)C(N)COP(O)(O)=O BZQFBWGGLXLEPQ-UHFFFAOYSA-N 0.000 description 1
- 241000207834 Oleaceae Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000233855 Orchidaceae Species 0.000 description 1
- 101100190461 Oryza sativa subsp. japonica PDIL1-3 gene Proteins 0.000 description 1
- 241000558265 Pandaceae Species 0.000 description 1
- 241000233929 Pandanaceae Species 0.000 description 1
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 1
- IUVYJBMTHARMIP-PCBIJLKTSA-N Phe-Asp-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IUVYJBMTHARMIP-PCBIJLKTSA-N 0.000 description 1
- FXYXBEZMRACDDR-KKUMJFAQSA-N Phe-His-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FXYXBEZMRACDDR-KKUMJFAQSA-N 0.000 description 1
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 1
- KIQUCMUULDXTAZ-HJOGWXRNSA-N Phe-Tyr-Tyr Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O KIQUCMUULDXTAZ-HJOGWXRNSA-N 0.000 description 1
- GLUYKHMBGKQBHE-JYJNAYRXSA-N Phe-Val-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 GLUYKHMBGKQBHE-JYJNAYRXSA-N 0.000 description 1
- 241000169085 Philydraceae Species 0.000 description 1
- 241000218641 Pinaceae Species 0.000 description 1
- 235000011613 Pinus brutia Nutrition 0.000 description 1
- 241000013557 Plantaginaceae Species 0.000 description 1
- 241000209464 Platanaceae Species 0.000 description 1
- 241000757039 Pontederiaceae Species 0.000 description 1
- 241000756999 Potamogetonaceae Species 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- SRBFGSGDNNQABI-FHWLQOOXSA-N Pro-Leu-Trp Chemical compound N([C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 SRBFGSGDNNQABI-FHWLQOOXSA-N 0.000 description 1
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 1
- SXJOPONICMGFCR-DCAQKATOSA-N Pro-Ser-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O SXJOPONICMGFCR-DCAQKATOSA-N 0.000 description 1
- 241000218201 Ranunculaceae Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 241000731960 Restionaceae Species 0.000 description 1
- 241000219100 Rhamnaceae Species 0.000 description 1
- 241000120622 Rhizophoraceae Species 0.000 description 1
- 235000004789 Rosa xanthina Nutrition 0.000 description 1
- 241000220222 Rosaceae Species 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- 241000221035 Santalaceae Species 0.000 description 1
- 241001122838 Scheuchzeriaceae Species 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 241000195975 Selaginellaceae Species 0.000 description 1
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 1
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 1
- OCWWJBZQXGYQCA-DCAQKATOSA-N Ser-Lys-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O OCWWJBZQXGYQCA-DCAQKATOSA-N 0.000 description 1
- JUTGONBTALQWMK-NAKRPEOUSA-N Ser-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N JUTGONBTALQWMK-NAKRPEOUSA-N 0.000 description 1
- FZEUTKVQGMVGHW-AVGNSLFASA-N Ser-Phe-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZEUTKVQGMVGHW-AVGNSLFASA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- DKGRNFUXVTYRAS-UBHSHLNASA-N Ser-Ser-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O DKGRNFUXVTYRAS-UBHSHLNASA-N 0.000 description 1
- SZRNDHWMVSFPSP-XKBZYTNZSA-N Ser-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N)O SZRNDHWMVSFPSP-XKBZYTNZSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 1
- 240000002751 Sideroxylon obovatum Species 0.000 description 1
- 241000244978 Stemonaceae Species 0.000 description 1
- 241000893011 Tamaricaceae Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 241000617412 Triuridaceae Species 0.000 description 1
- UUZYQOUJTORBQO-ZVZYQTTQSA-N Trp-Val-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 UUZYQOUJTORBQO-ZVZYQTTQSA-N 0.000 description 1
- 241000233945 Typhaceae Species 0.000 description 1
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 1
- IXTQGBGHWQEEDE-AVGNSLFASA-N Tyr-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IXTQGBGHWQEEDE-AVGNSLFASA-N 0.000 description 1
- NLMXVDDEQFKQQU-CFMVVWHZSA-N Tyr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLMXVDDEQFKQQU-CFMVVWHZSA-N 0.000 description 1
- HZZKQZDUIKVFDZ-AVGNSLFASA-N Tyr-Gln-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)O HZZKQZDUIKVFDZ-AVGNSLFASA-N 0.000 description 1
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 1
- JKUZFODWJGEQAP-KBPBESRZSA-N Tyr-Gly-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O JKUZFODWJGEQAP-KBPBESRZSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- 241000218220 Ulmaceae Species 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 1
- DBOXBUDEAJVKRE-LSJOCFKGSA-N Val-Asn-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N DBOXBUDEAJVKRE-LSJOCFKGSA-N 0.000 description 1
- UZDHNIJRRTUKKC-DLOVCJGASA-N Val-Gln-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UZDHNIJRRTUKKC-DLOVCJGASA-N 0.000 description 1
- OQWNEUXPKHIEJO-NRPADANISA-N Val-Glu-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N OQWNEUXPKHIEJO-NRPADANISA-N 0.000 description 1
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- RFKJNTRMXGCKFE-FHWLQOOXSA-N Val-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC(C)C)C(O)=O)=CNC2=C1 RFKJNTRMXGCKFE-FHWLQOOXSA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 241001276591 Xyridaceae Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 241000234299 Zingiberaceae Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 235000011148 calcium chloride Nutrition 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 230000021523 carboxylation Effects 0.000 description 1
- 238000006473 carboxylation reaction Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 239000003398 denaturant Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 229950006137 dexfosfoserine Drugs 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000003337 fertilizer Substances 0.000 description 1
- 238000001506 fluorescence spectroscopy Methods 0.000 description 1
- 235000021393 food security Nutrition 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000012214 genetic breeding Methods 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- FDZZZRQASAIRJF-UHFFFAOYSA-M malachite green Chemical compound [Cl-].C1=CC(N(C)C)=CC=C1C(C=1C=CC=CC=1)=C1C=CC(=[N+](C)C)C=C1 FDZZZRQASAIRJF-UHFFFAOYSA-M 0.000 description 1
- 229940107698 malachite green Drugs 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- KJBLQGHJOCAOJP-UHFFFAOYSA-N metoclopramide hydrochloride Chemical compound O.Cl.CCN(CC)CCNC(=O)C1=CC(Cl)=C(N)C=C1OC KJBLQGHJOCAOJP-UHFFFAOYSA-N 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000002808 molecular sieve Substances 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 1
- USRGIUJOYOXOQJ-GBXIJSLDSA-N phosphothreonine Chemical compound OP(=O)(O)O[C@H](C)[C@H](N)C(O)=O USRGIUJOYOXOQJ-GBXIJSLDSA-N 0.000 description 1
- DCWXELXMIBXGTH-UHFFFAOYSA-N phosphotyrosine Chemical compound OC(=O)C(N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-UHFFFAOYSA-N 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 238000000751 protein extraction Methods 0.000 description 1
- 102000034272 protein filaments Human genes 0.000 description 1
- 108091005974 protein filaments Proteins 0.000 description 1
- 230000020978 protein processing Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 238000010379 pull-down assay Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 238000004153 renaturation Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 1
- 210000002377 thylakoid Anatomy 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 238000004627 transmission electron microscopy Methods 0.000 description 1
- 108010036387 trimethionine Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000003963 x-ray microscopy Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N33/00—Biocides, pest repellants or attractants, or plant growth regulators containing organic nitrogen compounds
- A01N33/02—Amines; Quaternary ammonium compounds
- A01N33/12—Quaternary ammonium compounds
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N43/00—Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds
- A01N43/02—Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds having rings with one or more oxygen or sulfur atoms as the only ring hetero atoms
- A01N43/04—Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds having rings with one or more oxygen or sulfur atoms as the only ring hetero atoms with one hetero atom
- A01N43/06—Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds having rings with one or more oxygen or sulfur atoms as the only ring hetero atoms with one hetero atom five-membered rings
- A01N43/12—Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds having rings with one or more oxygen or sulfur atoms as the only ring hetero atoms with one hetero atom five-membered rings condensed with a carbocyclic ring
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N43/00—Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds
- A01N43/02—Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds having rings with one or more oxygen or sulfur atoms as the only ring hetero atoms
- A01N43/04—Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds having rings with one or more oxygen or sulfur atoms as the only ring hetero atoms with one hetero atom
- A01N43/22—Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds having rings with one or more oxygen or sulfur atoms as the only ring hetero atoms with one hetero atom rings with more than six members
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N43/00—Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds
- A01N43/90—Biocides, pest repellants or attractants, or plant growth regulators containing heterocyclic compounds having two or more relevant hetero rings, condensed among themselves or with a common carbocyclic ring system
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N45/00—Biocides, pest repellants or attractants, or plant growth regulators, containing compounds having three or more carbocyclic rings condensed among themselves, at least one ring not being a six-membered ring
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01N—PRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
- A01N57/00—Biocides, pest repellants or attractants, or plant growth regulators containing organic phosphorus compounds
- A01N57/10—Biocides, pest repellants or attractants, or plant growth regulators containing organic phosphorus compounds having phosphorus-to-oxygen bonds or phosphorus-to-sulfur bonds
- A01N57/16—Biocides, pest repellants or attractants, or plant growth regulators containing organic phosphorus compounds having phosphorus-to-oxygen bonds or phosphorus-to-sulfur bonds containing heterocyclic radicals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/03—Phosphoric monoester hydrolases (3.1.3)
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Plant Pathology (AREA)
- Dentistry (AREA)
- Pest Control & Pesticides (AREA)
- Environmental Sciences (AREA)
- Agronomy & Crop Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明提供了调控水稻穗粒数和株型的新基因GH1及其应用,具体地,本发明首次意外地发现了一种GH1基因或其编码蛋白,通过对该基因的表达模式进行分析,首次发现,降低所述植物(如水稻)中GH1基因或其编码蛋白的表达量或活性,可显著改良植物的农艺性状。
Description
技术领域
本发明涉及农学领域,具体地,涉及调控水稻穗粒数和株型的基因GH1及其应用。
背景技术
水稻是世界上最重要的粮食作物之一,也是我们国家的主粮,养育着全球一半以上的人口。因此,如何提高水稻的产量和品质,培育能够适应复杂多变环境的优良品种已经成为我们国家粮食安全和农业可持续发展领域所面临的重大科学问题。决定水稻产量的因素主要包括每株有效分蘖数、每穗粒数和粒重,而每穗粒数则是由一次枝梗和二次枝梗数决定的。除此之外,株高在现代农业育种中也起到了至关重要的作用。世界粮食产量在1960-1970年代出现了一次飞跃,主要原因就是选育了一系列株高较矮的品种,这些品种相对于早期的高秆品种更加抗倒伏,从而耐肥能力强、利于机械化收割,极大地增加了水稻产量,矮化育种也因此成为了第一次绿色革命的标志。因此,研究穗粒数和株高等产量相关性状对于水稻高产育种具有重要意义。相较于传统遗传育种的方法,利用现代分子遗传学的理论方法深入研究作物产量形成的分子机理可以帮助我们最大程度地提高作物的产量,从而满足人口增长的迫切需要。近些年来,科学家们利用分子遗传学理论和方法,深入开展水稻分子遗传和功能基因组学研究,挖掘控制水稻产量性状相关的基因,解析其作用机理,取得了许多重要的进展。水稻也因此已经发展成为了植科学研究中重要的模式作物。
因此,本领域迫切需要鉴定控制穗粒数和株高等产量相关性状的基因。
发明内容
本发明的目的在于提供一种控制穗粒数和株高等产量相关性状的基因。
本发明的第一方面提供了一种GH1基因或其编码蛋白的抑制剂的用途,用于调控植物的农艺性状或制备调控植物的农艺性状的制剂或组合物,其中,所述植物的农艺性状选自下组的一种或多种:
(i) 株高
(ii) 细胞大小;
(iii)每穗粒数;
(iv)粒型大小。
在另一优选例中,所述“调控植物的农艺性状”包括:
(i) 降低株高;和/或
(ii) 减小细胞长度;和/或
(iii)减少每穗粒数;和/或
(iv)减小粒型大小。
在另一优选例中,所述组合物或制剂还用于选自下组的一种或多种用途:
(a) 提高磷脂酰肌醇的含量;
(b) 抑制Arp2/3复合体介导的肌动蛋白微丝聚合和分枝网络的形成;
(c) 调控细胞的形态建成;
(d) 抑制VCA蛋白和Arp2/3复合体的结合。
在另一优选例中,所述磷脂酰肌醇选自下组:PI4P、PI(4,5)P2、或其组合。
在另一优选例中,所述制剂包括农用制剂。
在另一优选例中,所述组合物包含(a)GH1基因或其编码蛋白的抑制剂;和(b)农学上可接受的载体。
在另一优选例中,所述组合物或制剂的剂型选自下组:溶液剂、乳剂、混悬剂、粉剂、泡沫剂、糊剂、颗粒剂、气雾剂、或其组合。
在另一优选例中,所述抑制剂选自下组:反义核酸、抗体、小分子化合物、Crispr试剂、siRNA、shRNA、miRNA、小分子配体、或其组合。
在另一优选例中,所述组合物还包括其他调控植物的农艺性状的物质。
在另一优选例中,所述其他调控植物的农艺性状的物质选自下组:赤霉素、矮壮素、生长素、油菜素内酯、或其组合。
在另一优选例中,所述组合物包括农用组合物。
在另一优选例中,所述GH1基因包括野生型GH1基因和突变型GH1基因。
在另一优选例中,所述的突变型包括突变后编码蛋白的功能未发生改变的突变形式(即功能与野生型编码蛋白相同或基本相同)。
在另一优选例中,所述的突变型GH1基因编码的多肽与野生GH1基因所编码的多肽相同或基本相同。
在另一优选例中,所述的突变型GH1基因包括与野生GH1基因相比,同源性≥80%(较佳地≥90%,更佳地≥95%,更佳地,≥98%或99%)的多核苷酸。
在另一优选例中,所述的突变型GH1基因包括在野生型GH1基因的5'端和/或3'端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸。
在另一优选例中,所述的GH1基因包括cDNA序列、基因组序列、或其组合。
在另一优选例中,所述GH1基因来自禾本科作物。
在另一优选例中,所述的GH1基因来自选自下组的一种或多种植物:水稻、小麦、玉米、高粱、拟南芥、大豆、谷子、二穗短柄草、或其组合。
在另一优选例中,所述GH1基因选自下组:水稻的GH1基因(Os02g0554300)、小麦的GH1同源基因(Traes_1AL_2AD7BC3B3;Traes_1BL_8414A93D1;Traes_1DL_0CB363172)、拟南芥的GH1同源基因 (AT3G51460)、玉米的GH1同源基因 (GRMZM2G171080)、谷子的GH1同源基因(Seita.1G192600)、高粱的GH1同源基因(Sobic.004G176200)、二穗短柄草的GH1同源基因(Bradi4g42300)、大豆的GH1同源基因(Glyma.01G159400)、或其组合。
在另一优选例中,所述GH1蛋白的氨基酸序列选自下组:
(i) 具有SEQ ID NO.:1所示氨基酸序列的多肽;
(ii) 将如SEQ ID NO.:1所示的氨基酸序列经过一个或几个(如1-10个)氨基酸残基的取代、缺失或添加而形成的,具有所述调控植物农艺性状功能的、由(i)衍生的多肽;或(iii)氨基酸序列与SEQ ID NO.:1所示氨基酸序列的同源性≥90%(较佳地≥95%,更佳地≥98%或99%),具有所述调控植物农艺性状功能的多肽。
在另一优选例中,所述GH1基因的核苷酸序列选自下组:
(a) 编码如SEQ ID NO.:1所示多肽的多核苷酸;
(b) 序列如SEQ ID NO.:2所示的多核苷酸;
(c) 核苷酸序列与SEQ ID NO.:2所示序列的同源性≥95%(较佳地≥98%,更佳地≥99%)的多核苷酸;
(d) 在SEQ ID NO.:2所示多核苷酸的5’端和/或3’端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(e) 与(a)-(d)任一所述的多核苷酸互补的多核苷酸。
在另一优选例中,所述的植物选自下组:杨柳科(Salicaceae)、桑科(Moraceae)、桃金娘科(Myrtaceae)、石松科(Lycopodiaceae)、(Selaginellaceae)、银杏科(Ginkgoaceae)、松科(Pinaceae)、苏铁科(Cycadaceae)、天南星科(Araceae)、毛茛科(Ranunculaceae)、悬铃木科(Platanaceae)、榆科(Ulmaceae)、胡桃科(Juglandaceae)、桦科(Betulaceae)、猕猴桃科(Actinidiaceae)、锦葵科(Malvaceae)、梧桐科(Sterculiaceae)、椴树科(Tiliaceae)、柽柳科(Tamaricaceae)、蔷薇科(Rosaceae)、景天科(Crassulaceae)、苏木科(Caesalpinaceae)、蝶形花科(Fabaceae)、石榴科(Punicaceae)、珙桐科(Nyssaceae)、山茱萸科(Cornaceae)、八角枫科(Alangiaceae)、卫矛科(Celastraceae)、冬青科(Aquifoliaceae)、黄杨科(Buxaceae)、大戟科(Euphorbiaceae)、小盘木科(Pandaceae)、鼠李科(Rhamnaceae)、葡萄科(Vitaceae)、漆树科(Anacardiaceae),橄榄科(Burseraceae)、桔梗科(Campanulaceae)、红树科(Rhizophoraceae)、檀香科(Santalaceae)、木犀科(Oleaceae)、玄参科(Scrophulariaceae)、禾本科(Gramineae)、露兜树科(Pandanaceae)、黑三棱科(Sparganiaceae)、水蕹科(Aponogetonaceae)、眼子菜科(Potamogetonaceae)、茨藻科(Najadaceae)、冰沼草科(Scheuchzeriaceae)、泽泻科(Alismataceae)、花蔺科(Butomaceae)、水鳖科(Hydrocharitaceae)、霉草科(Triuridaceae)、莎草科(Cyperaceae)、棕榈科 (Palmae)、天南星科(Araceae)、浮萍科(Lemnaceae)、须叶藤科(Flagellariaceae)、帚灯草科(Restionaceae)、刺鳞草科(Centrolepidaceae)、黄眼草科(Xyridaceae)、谷精草科(Eriocaulaceae)、凤梨科(Bromeliaceae)、鸭跖草科(Commelinaceae)、雨久花科(Pontederiaceae)、田葱科(Philydraceae)、灯心草科(Juncaceae)、百部科(Stemonaceae)、百合科(Liliaceae)、石蒜科(Amaryllidaceae)、蒟蒻薯科(箭根薯科)(Taccaceae)、薯蓣科(Dioscoreaceae)、鸢尾科(Iridaceae)、芭蕉科(Musaceae)、姜科(Zingiberaceae)、美人蕉科(Cannaceae)、竹芋科(Marantaceae)、水玉簪科(Burmanniaceae)、藜科(Chenopodiaceae)、兰科(Orchidaceae)、或其组合。
在另一优选例中,所述的植物包括禾本科植物,较佳地,禾本科农作物。
在另一优选例中,所述的禾本科植物选自下组:小麦、水稻、大麦、燕麦、黑麦、高粱、玉米、狗尾草、二穗短柄草、或其组合。
在另一优选例中,所述的水稻包括籼稻、粳稻、或其组合。
本发明第二方面提供了一种组合物,包括:
(a) GH1基因或其编码蛋白的抑制剂;和
(b) 农学上可接受的载体。
在另一优选例中,所述组合物包括农用组合物。
在另一优选例中,所述组合物的剂型选自下组:溶液剂、乳剂、混悬剂、粉剂、泡沫剂、糊剂、颗粒剂、气雾剂、或其组合。
在另一优选例中,所述组合物中,含有0.0001-99wt%,较佳地0.1-90wt%的组分(a),以所述组合物的总重量计。
在另一优选例中,所述组合物中,所述GH1基因或其编码蛋白的抑制剂的含量(wt%)为0.05%-10%,较佳地,0.1%-8%,更佳地,0.5%-6%。
在另一优选例中,所述抑制剂选自下组:反义核酸、抗体、小分子化合物、Crispr试剂、siRNA、shRNA、miRNA、小分子配体、或其组合。
在另一优选例中,所述组合物还包括其他调控植物的农艺性状的物质。
在另一优选例中,所述其他调控植物的农艺性状的物质选自下组:赤霉素、矮壮素、生长素、油菜素内酯、或其组合。
本发明第三方面提供了一种本发明第二方面所述的组合物的用途,用于改良植物农艺性状。
本发明第四方面提供了一种改良植物农艺性状的方法,包括步骤:
降低所述植物中GH1基因或其编码蛋白的表达量和/或活性,从而改良植物的农艺性状。
在另一优选例中,所述方法包括给予植物GH1基因或其编码蛋白的抑制剂。
在另一优选例中,所述方法包括步骤:
(i) 提供一植物或植物细胞;和
(ii) 将GH1基因或其编码蛋白的抑制剂导入所述植物或植物细胞,从而获得改造的植物或植物细胞。
在另一优选例中,所述抑制剂选自下组:反义核酸、抗体、小分子化合物、Crispr试剂、siRNA、shRNA、miRNA、小分子配体、或其组合。
在另一优选例中,所述植物中GH1基因或其编码蛋白的表达量或活性降低了≥50%,较佳地,≥70%,更佳地,≥90%或100%。
在另一优选例中,所述“降低”是指GH1基因或其编码蛋白的表达或活性降低满足以下条件:
A1/A0的比值≤80%,更佳地,≤50%,更佳地≤20%,最佳地为0-10%;其中,A1为GH1基因或其编码蛋白的表达或活性;A0为野生型同种类型植物植株中相同GH1基因或其编码蛋白的表达或活性。
在另一优选例中,所述的降低指与野生型GH1基因或其编码蛋白的表达水平E0相比,所述植株中GH1基因或其编码蛋白的表达水平E1为野生型的0-80%,较佳地0-60%,更佳地0-40%。
在另一优选例中,所述的降低植株中GH1基因或其编码蛋白的表达或活性通过选自下组的方式实现:基因突变、基因敲除、基因中断、RNA干扰技术、Crispr技术、ZFN(锌指核酸内切酶技术)、TALEN(类转录激活因子效应物核酸酶)、或其组合。
在另一优选例中,所述“改良植物的农艺性状”包括:
(i) 降低株高;和/或
(ii) 减小细胞长度;和/或
(iii)减少每穗粒数;和/或
(iv)减小粒型大小。
本发明第五方面提供了一种制备基因工程的植物组织或植物细胞的方法,包括步骤:
降低植物组织或植物细胞中的GH1基因或其编码蛋白的表达和/或活性,从而获得基因工程的植物组织或植物细胞。
在另一优选例中,所述方法还包括向植物组织或植物细胞中导入GH1基因或其编码蛋白的抑制剂。
在另一优选例中,所述抑制剂选自下组:反义核酸、抗体、小分子化合物、Crispr试剂、siRNA、shRNA、miRNA、小分子配体、或其组合。
本发明第六方面提供了一种制备基因工程植物的方法,包括步骤:
将本发明第五方面所述方法制备的基因工程的植物组织或植物细胞再生为植物体,从而获得基因工程植物。
在另一优选例中,所述方法包括用RNA干扰技术、Crispr技术、ZFN(锌指核酸内切酶技术)、TALEN(类转录激活因子效应物核酸酶) 降低植物组织或植物细胞中的BXL基因或其编码蛋白的表达和/或活性。
本发明第七方面提供了一种基因工程植物,所述的植物是用本发明第六方面所述的方法制备的。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了亲本GC和CB的表型特征。其中,(a)亲本GC和CB的株型;(b) GC和CB的穗型;(c) GC和CB的粒型;(d) GC和CB的茎;(e-h) GC和CB的表型比较,包括平均株高(e)、穗粒数(f)、粒长(g)和粒宽(h);(i-l) 近等基因系NIL-GH1 GC 和NIL-GH1 CB 的表型比较,包括平均株高(i)、穗粒数(j)、粒长(k)和粒宽(l)。
图2显示了GH1的图位克隆与转基因功能验证。
其中,(a) GH1的图位克隆;(b-e) 近等基因系NIL-GH1 GC 和NIL-GH1 CB 的株型(b)、穗型(c)、粒型(d)、和茎(e);(f-h) CRISPR/Cas9转基因株系GH1 Cas9 的株型(f)、穗型(g)、和粒型(h)。
图3显示了GH1的酶活分析与亚细胞定位。其中,(a) CB等位基因GH1 CB 中C到T的突变导致翻译提前终止,使得GH1CB的C端缺失;(b) GH1GC磷酸酶能够特异性去磷酸化PI4P和PI(4,5)P2,而GH1CB失去了去磷酸化活性;(c-d)近等基因系NIL-GH1 GC 和NIL-GH1 CB 中PI4P(c)和PI(4,5)P2(d)含量比较;(e) GH1定位在内质网上。
图4显示了GH1过表达株系的特征。(a-c) GH1过表达株系GH1 OE 的株型(a)、穗型(b)、和粒型(c);(d-g) GH1过表达株系GH1 OE 的株高(d)、穗粒数(e)、粒长(f)、和粒宽(g)统计;(h) GH1过表达株系GH1 OE 中GH1基因的表达量分析;(i-j) GH1过表达株系GH1 OE 中PI4P(i)和PI(4,5)P2(j)含量比较。
图5显示了NIL-GH1 GC 和NIL-GH1 CB 的细胞学显微观察。其中,(a) NIL-GH1 GC 和NIL-GH1 CB 茎细胞的显微观察;(b) NIL-GH1 GC 和NIL-GH1 CB 茎细胞长度和宽度统计;(c) 亲本GC和CB以及NIL-GH1 GC 和NIL-GH1 CB 中肌动蛋白微丝骨架观察;(d)亲本GC和CB以及NIL-GH1 GC 和NIL-GH1 CB 中肌动蛋白微丝骨架的可视化统计;(e-f)亲本GC和CB以及NIL-GH1 GC 和NIL-GH1 CB 的高尔基体(e)和叶绿体(f)观察。
图6显示了PI4P和PI(4,5)P2调节Arp2/3复合体的功能。其中,(a)荧光光谱法测定肌动蛋白微丝聚合,PI(4,5)P2可以抑制Arp2/3复合体介导的肌动蛋白微丝聚合;(b)TIRFM显微观察肌动蛋白微丝聚合,PI4P和PI(4,5)P2抑制了Arp2/3复合体介导的肌动蛋白微丝成核;(c) GST pull-down检测,PI(4,5)P2特异性抑制VCA和Arp2/3复合体的结合。
具体实施方式
经过广泛而深入的研究,本发明人通过对大量的植物农艺性状位点的研究和筛选,首次意外地发现了一种GH1基因或其编码蛋白,通过对该基因的表达模式进行分析,首次发现,降低所述植物(如水稻)中GH1基因或其编码蛋白的表达量或活性,可显著改良植物的农艺性状。在此基础上,发明人完成了本发明。
具体地,当降低所述植物中GH1基因或其编码蛋白的表达量或活性时,可以(i) 降低株高;和/或(ii) 减小细胞长度;和/或(iii)减少每穗粒数;和/或(iv)减小粒型大小。
GH1基因
如本文所用,术语“本发明的GH1基因”、“GH1基因”可互换使用,均指来源于农作物(如水稻、小麦)的GH1基因或其变体。在一优选实施方式中,本发明的GH1基因的核苷酸序列如SEQ ID NO.:2所示。
本发明还包括与本发明的优选基因序列(SEQ ID NO.: 2)具有50%或以上(优选60%以上,70%以上,80%以上,更优选90%以上,更优选95%以上,最优选98%以上,如99%)同源性的核酸,所述核酸也能有效地调控植物 (如水稻)的农艺性状。“同源性”是指按照位置相同的百分比,两条或多条核酸之间的相似水平(即序列相似性或同一性)。在本文中,所述基因的变体可以通过插入或删除调控区域,进行随机或定点突变等来获得。
在本发明中,SEQ ID NO.: 2中的核苷酸序列可以经过取代、缺失或添加一个或多个,生成SEQ ID NO.: 2的衍生序列,由于密码子的简并性,即使与SEQ ID NO.: 2的同源性较低,也能基本编码出如SEQ ID NO.: 1所示的氨基酸序列。另外,“在SEQ ID NO.: 2中的核苷酸序列经过取代、缺失或添加至少一个核苷酸衍生序列”的含义还包括能在中度严谨条件下,更佳的在高度严谨条件下与SEQ ID NO.: 2所示的核苷酸序列杂交的核苷酸序列。这些变异形式包括(但并小限于):若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
应理解,尽管本发明的实例中提供的基因来源于水稻,但是来源于其它类似的植物(尤其是与水稻属于同一科或属的植物)的、与本发明的序列(优选地,序列如SEQ IDNO.: 2所示)具有一定同源性(保守性)的GH1的基因序列,也包括在本发明的范围内,只要本领域技术人员在阅读了本申请后根据本申请提供的信息可以方便地从其它植物中分离得到该序列。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括:DNA、基因组DNA或人工合成的DNA,DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码成熟多肽的编码区序列可以与SEQ ID NO.: 2所示的编码区序列相同或者是简并的变异体。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多苷或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酞胺,0.1%小牛血清/0.1 %Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在90%以上,更好是95%以上时才发生杂交。
应理解,虽然本发明的GH1基因优选来自水稻,但是来自其它植物的与水稻GH1基因高度同源(如具有80%以上,如85%,90%,95%甚至98%序列相同性)的其它基因也在本发明考虑的范围之内。比对序列相同性的方法和工具也是本领域周知的,例如BLAST。
本发明的GH1核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的DNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。目前,已经可以完全通过化学合成来得到编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
GH1基因编码的多肽
如本文所用,术语“本发明多肽”、“GH1基因的编码蛋白”、可以互换使用,都是指来源于水稻的GH1的多肽及其变体。在一优选实施方式中,本发明多肽的一种典型的氨基酸序列如SEQ ID NO.:1所示。
本发明涉及一种调控植物农艺性状的GH1多肽及其变体,在本发明的一个优选例中,所述多肽的氨基酸序列如SEQ ID NO.: 1所示。本发明的多肽能够有效调控植物 (如水稻)的农艺性状。
本发明还包括与本发明的SEQ ID NO.:1所示序列具有50%或以上(优选60%以上,70%以上,80%以上,更优选90%以上,更优选95%以上,最优选98%以上,如99%)同源性的具有相同或相似功能的多肽或蛋白。
所述“相同或相似功能”主要是指:“调控植物或农作物(如水稻)的农艺性状”。
本发明的多肽可以是重组多肽、天然多肽、合成多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有GH1蛋白活性的GH1蛋白片段和类似物。如本文所用,术语“片段”和“类似物”是指基本上保持本发明的天然GH1蛋白相同的生物学功能或活性的多肽。
本发明的多肽片段、衍生物或类似物可以是:(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的;或(ii)在一个或多个氨基酸残基中具有取代基团的多肽;或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽;或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列,或融合蛋白)。根据本文的定义这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明中,所述的多肽变体是如SEQ ID NO.: 1所示的氨基酸序列,经过若干个(通常为1-60个,较佳地1-30个,更佳地1-20个,最佳地1-10个)取代、缺失或添加至少一个氨基酸所得的衍生序列,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在所述蛋白中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能,在C末端和/或\末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。这些保守性变异最好根据表1进行替换而产生。
表1
最初的残基 | 代表性的取代 | 优选的取代 |
Ala (A) | Val; Leu; Ile | Val |
Arg (R) | Lys; Gln; Asn | Lys |
Asn (N) | Gln; His; Lys; Arg | Gln |
Asp (D) | Glu | Glu |
Cys (C) | Ser | Ser |
Gln (Q) | Asn | Asn |
Glu (E) | Asp | Asp |
Gly (G) | Pro; Ala | Ala |
His (H) | Asn; Gln; Lys; Arg | Arg |
Ile (I) | Leu; Val; Met; Ala; Phe | Leu |
Leu (L) | Ile; Val; Met; Ala; Phe | Ile |
Lys (K) | Arg; Gln; Asn | Arg |
Met (M) | Leu; Phe; Ile | Leu |
Phe (F) | Leu; Val; Ile; Ala; Tyr | Leu |
Pro (P) | Ala | Ala |
Ser (S) | Thr | Thr |
Thr (T) | Ser | Ser |
Trp (W) | Tyr; Phe | Tyr |
Tyr (Y) | Trp; Phe; Thr; Ser | Phe |
Val (V) | Ile; Leu; Met; Phe; Ala | Leu |
本发明还包括所要求保护的蛋白的类似物。这些类似物与天然SEQ ID NO.:1差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些蛋白的类似物包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分了生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的蛋白并不限于上述例举的代表性的蛋白。
修饰(通常不改变一级结构)形式包括:体内或体外蛋白的化学衍生形式如乙酸化或羧基化。修饰还包括糖基化,如那些在蛋白质合成和加工中进行糖基化修饰。这种修饰可以通过将蛋白暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。
表达载体
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或本发明突变蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列可用来表达或生产重组的突变蛋白。一般来说有以下步骤:
(1).用本发明的编码本发明突变蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明还提供了一种包括本发明的基因的重组载体。作为一种优选的方式,重组载体的启动子下游包含多克隆位点或至少一个酶切位点。当需要表达本发明目的基因时,将目的基因连接入适合的多克隆位点或酶切位点内,从而将目的基因与启动子可操作地连接。作为另一种优选方式,所述的重组载体包括(从5’到3’方向):启动子,目的基因,和终止子。如果需要,所述的重组载体还可以包括选自下组的元件:3’多聚核苷酸化信号;非翻译核酸序列;转运和靶向核酸序列;抗性选择标记(二氢叶酸还原酶、新霉素抗性、潮霉素抗性以及绿色荧光蛋白等);增强子;或操作子。
在本发明中,编码突变蛋白的多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含本发明突变蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
本领域普通技术人员可以使用熟知的方法构建含有本发明所述的基因的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。使用本发明的基因构建重组表达载体时,可在其转录起始核苷酸前加上任何一种增强型、组成型、组织特异型或诱导型启动子。
包括本发明基因、表达盒或的载体可以用于转化适当的宿主细胞,以使宿主表达蛋白质。宿主细胞可以是原核细胞,如大肠杆菌,链霉菌属、农杆菌;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如植物细胞。本领域一般技术人员都清楚如何选择适当的载体和宿主细胞。用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物(如大肠杆菌)时,可以用CaCl2法处理,也可用电穿孔法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法(如显微注射、电穿孔、脂质体包装等)。转化植物也可使用农杆菌转化或基因枪转化等方法,例如叶盘法、幼胚转化法、花芽浸泡法等。对于转化的植物细胞、组织或器官可以用常规方法再生成植株,从而获得转基因的植物。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母、植物细胞(如水稻细胞)。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
改良植物的农艺性状
在本发明中,还提供了一种改良植物农艺性状的方法,具体地,抑制GH1基因或其编码蛋白的表达,从而改良植物的农艺性状,所述农艺性状选自下组的一种或多种:
(i) 株高
(ii) 细胞大小;
(iii)每穗粒数;
(iv)粒型大小。
在一优选实施方式中,所述改良植物的农艺性状包括:
(i) 降低株高;和/或
(ii) 减小细胞长度;和/或
(iii)减少每穗粒数;
(iv)减小粒型大小。
本发明的主要优点包括:
(1)本发明首次筛选到一种GH1基因,GH1基因对于水稻株高的发育和穗粒数的形成具有重要的功能。
(2)本发明首次发现,降低GH1基因或其编码蛋白的表达,可调控植物的农艺性状,比如降低株高、减小细胞长度、提高磷脂酰肌醇的含量、抑制Arp2/3复合体介导的肌动蛋白微丝聚合和分枝网络的形成、调控细胞的形态建成、抑制VCA蛋白和Arp2/3复合体的结合等。
(3) 本发明首次发现,GH1编码一个定位于内质网的磷酸酶,可以特异性对PI4P和PI(4,5)P2进行去磷酸化修饰。
(4) 本发明首次发现,GH1参与调控肌动蛋白微丝骨架稳态以及高尔基体和叶绿体发育。
(5) 本发明首次发现,GH1突变导致细胞肌动蛋白微丝骨架紊乱,以及高尔基体和叶绿体发育异常,最终抑制了细胞伸长。
(6) 本发明首次发现,PI(4,5)P2通过抑制VCA和Arp2/3复合体的相互作用,特异性的抑制了Arp2/3复合体介导的肌动蛋白微丝成核和分枝网络的形成,可以通过分子设计改良GH1基因的功能、精细调节PI(4,5)P2含量、准确调控Arp2/3复合体的功能和控制肌动蛋白微丝骨架网络形成、以改良水稻的穗粒数和株高性状和提高水稻产量。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York: Cold Spring HarborLaboratory Press, 1989)中所述的条件,或按照制造厂商所建议的条件。除非有特别说明,否则实施例中所用的材料和试剂均为市售产品。
通用方法
1.实验材料和定位克隆
我们利用籼稻品种桂朝2号(GC)和粳稻品种CB,构建了F2分离群体,用于后续图位克隆(如图1、2所示)。首先,我们利用186株水稻将GH1初定位在第2号染色体上,即分子标记RM324和RM1920之间。然后,我们又利用6379株水稻将其精细定位在分子标记NB-2-83c和NB-2-83d之间。结果发现,这个区间内有四个候选基,分别为Os02g0554300、Os02g0554500、Os02g0554800、和Os02g0554900(如图2所示)。我们进一步通过GH1 Genotyping引物测序发现,候选基因Os02g0554300在CB背景中存在多个SNP,其第5518位一个C到T的突变直接导致第351位的精氨酸突变为终止密码子,从而导致GH1蛋白翻译提前终止。因此,我们猜测候选基因Os02g0554300可能就是GH1。在此基础上,我们在CB背景下分别构建了近等基因系NIL-GH1 GC 和NIL-GH1 CB ,用于后续研究。研究中用到的代表性的引物如下:
RM324的5’端寡核苷酸引物序列为:
5’-GATTCCACGTCAGGATCTTCTGG-3’(SEQ ID NO.:3)
3’端引物序列为:
5’-GCTCACCAGTTGAGATTGAAAGG-3’(SEQ ID NO.:4)
RM1920的5’端寡核苷酸引物序列为:
5’-GCCTGGTAAGTGGTAATGTAATGG-3’(SEQ ID NO.:5)
3’端引物序列为:
5’-GTGAATTCCTCCTTGGTCTTGG-3’(SEQ ID NO.:6)
NB-2-83c的5’端寡核苷酸引物序列为:
5’-AACTAAAGTCACCAGCCAAA-3’ (SEQ ID NO.:7)
3’端引物序列为:
5’-TTGACACAATGCCTGTATTC-3’ (SEQ ID NO.:8)
NB-2-83d的5’端寡核苷酸引物序列为:
5’-CCGACTTACTAGTGGTGTGTTT-3’ (SEQ ID NO.:9)
3’端引物序列为:
5’-AGGAGTACAACTCTGAACATGC-3’ (SEQ ID NO.:10)
GH1 Genotyping的5’端寡核苷酸引物序列为:
5’-TTGGAATCACCTTGTCTTTCG-3’ (SEQ ID NO.:11)
3’端引物序列为:
5’-TTGCTCTTCCCTTTGCCTAC-3’ (SEQ ID NO.:12)
2. CRISPR/Cas9基因编辑和GH1过表达
为了进一步转基因验证候选基因Os02g0554300,我们利用CRISPR/Cas9技术设计了目的基因对应的靶点,对GH1进行转基因敲除,并获得了相应的GH1敲除突变体,考察其表型。除此之外,我们将来源于GC的Os02g0554300的CDS序列构建到pCOMBIA1306过表达载体上,然后通过根癌农杆菌EHA105介导的水稻幼胚转化法进行遗传转化,筛选转基因阳性株系,种植在大田并对转基因T2代考察表型。
CRISPR/Cas9敲除GH1载体构建的5’端寡核苷酸引物序列为:
5’-GGCAAGTCAGCAAGACCATCAAT-3’ (SEQ ID NO.:13)
5’-GCCGGAGTTCTCAAGCTTTCAGT-3’ (SEQ ID NO.:14)
3’端引物序列为:
5’-AAACATTGATGGTCTTGCTGACT-3’ (SEQ ID NO.:15)
5’-AAACACTGAAAGCTTGAGAACTC-3’ (SEQ ID NO.:16)
pCOMBIA1306过表达载体构建的5’端寡核苷酸引物序列为:
5’-CTAGTCTAGAATGGGTGGGGCAAATGACTC-3’ (SEQ ID NO.:17)
3’端引物序列为:
5’-ACGCGTCGACATGGCGCGACTGATAAAAAC-3’ (SEQ ID NO.:18)
3.GH1磷酸酶活性和底物特异性鉴定
GH1编码一个具有单次跨膜结构域的磷酸酶,因此推测具有去磷酸化活性。我们利用高效率的杆状病毒表达系统在sf9昆虫中表达了GH1GC和GH1CB蛋白。GH1 GC 和GH1 CB 的编码序列被克隆到pFastBacHT-C载体上,然后培养昆虫细胞进行转化,形成重组杆粒和杆状病毒。在昆虫细胞中高效表达后,再通过膜蛋白提取方法获得GH1GC和GH1CB蛋白。我们进一步利用孔雀石绿法检测了磷酸酶活性,磷酸酶底物包括PI4P、PI(4,5)P2、PI3P、PI5P和PI(3,4)P2。
构建pFastBacHT-C-GH1的5’端寡核苷酸引物序列为:
5’-CGAGCTCACTAGTCGCATGGGTGGGGCAAAT-3’ (SEQ ID NO.:19)
3’端引物序列为:
5’-cgacaagcttggtacATGGCGCGACTGATA-3’ (SEQ ID NO.:20)
4.亚细胞定位检测
为了研究GH1磷酸酶的亚细胞定位,我们利用水稻原生体进行了进一步检测。我们分别将GH1基因的编码序列融合构建在pA7-GFP 载体上,通过 PEG 介导转入水稻原生质体中瞬时表达,在共聚焦显微镜下观察拍照。
GH1亚细胞定位的pA7-GFP载体构建的5’端寡核苷酸引物序列为:
5’-gatactcgagATGGGTGGGGCAAATGACTC-3’ (SEQ ID NO.:21)
3’端引物序列为:
5’-caccatactagtATGGCGCGACTGATAAAAAC-3’ (SEQ ID NO.:22)
实施例1 利用籼稻品种桂朝2号(GC)和粳稻品种CB,通过图位克隆的方法,克隆到一个控制水稻穗粒数和株高的基因GH1
首先,我们利用大穗高产的籼稻品种桂朝2号(GC)和来源于美国的矮秆、小穗的粳稻品种CB作为亲本构建了F2分离群体。如图1a-h所示,亲本GC株型和每穗粒数明显高于CB,因此我们利用图位克隆的方法,定位到一个控制穗粒数和株高的基因,并命名为GRAIN NUMBER AND PLANT HEIGHT 1 (GH1) (如图2a所示)。测序结果表明,来源于亲本CB的GH1 CB 等位基因含有多个SNP,其中第5518位一个C到T的突变直接导致第351位的精氨酸突变为终止密码子,从而导致GH1蛋白翻译提前终止(如图2a所示)。GH1基因被预测编码一个功能未知的含有suppressor of actin (SAC)结构域的磷酸酶(如图3a所示)。进一步通过比较近等基因系NIL-GH1 GC 和NIL-GH1 CB 发现,NIL-GH1 CB 株高明显矮于NIL-GH1 GC ,每穗粒数也显著减少(如图1,i-l所示)。利用CRISPR/Cas9技术在GC背景中敲除GH1发现,转基因敲除株系也表现为明显的株高变矮以及穗粒数减少。统计学表明,这些差异均具有显著性(如图2b-h所示)。因此,GH1基因对于水稻株高的发育和穗粒数的形成具有重要的功能。
实施例2GH1定位于内质网上,可以特异性对PI4P和PI(4,5)P2进行去磷酸化修饰
GH1被预测编码一个含有SAC结构域的磷酸酶,这提示GH1可能可以去磷酸化修饰磷脂酰肌醇(如图3a所示)。我们通过体外纯化GH1磷酸酶,利用不同磷脂酰肌醇底物进行去磷酸化实验,结果表明,来源于GC的野生型GH1GC可以对PI4P和PI(4,5)P2进行去磷酸化修饰,而来源于CB的GH1CB丧失了去磷酸化活性(如图3b所示)。进一步研究发现,GH1GC不能对PI3P、PI5P、和PI(3,4)P2进行去磷酸化修饰(如图3b所示)。该结果表明,含有SAC结构域的磷酸酶GH1可以特异性去磷酸化修饰PI4P和PI(4,5)P2。利用酶联免疫吸附实验分别在近等基因系NIL-GH1 GC 和NIL-GH1 CB 中检测了体内PI4P和PI(4,5)P2的含量,我们发现,相较于NIL-GH1 GC ,NIL-GH1 CB 中PI4P和PI(4,5)P2的含量显著升高(如图3c-d所示)。而过表达GH1转基因株系中PI4P和PI(4,5)P2的含量明显降低(如图4a-j所示)。这些结果表明,GH1突变影响了水稻体内PI4P和PI(4,5)P2的代谢。我们进一步用水稻原生质体进行亚细胞定位发现,GH1是一个定位于内质网的磷酸酶(如图3e所示)。综上所述,GH1编码一个定位于内质网的磷酸酶,可以特异性对PI4P和PI(4,5)P2进行去磷酸化修饰。
实施例3 GH1参与调控肌动蛋白微丝骨架稳态以及高尔基体和叶绿体发育
为了研究GH1参与调控水稻生长发育的细胞学基础,我们利用X-ray显微技术观察了茎秆的细胞组成。结果发现,相较于近等基因系NIL-GH1 GC ,NIL-GH1 CB 的细胞长度明显缩短,细胞宽度没有显著性差异(如图5a-b所示)。这表明,GH1失活影响了细胞的伸长发育。进一步对水稻幼根细胞的肌动蛋白微丝骨架进行染色观察,结果发现,亲本GC和近等基因系NIL-GH1 GC 微丝骨架结构分布调理清楚,并且具有极性。然而,亲本CB和近等基因系NIL-GH1 CB 微丝骨架结构明显紊乱,失去了极性(如图5c-d所示)。该结果表明,GH1对于细胞微丝骨架的形成是非常重要的。我们进一步通过透射电镜观察发现,相较于亲本GC和近等基因系NIL-GH1 GC ,亲本CB和近等基因系NIL-GH1 CB 的高尔基体发育明显受到损伤,出现了碎片化和囊泡状结构(如图5e所示);而且叶绿体发育过程中类囊体层数也明显减少,基粒分布更加疏松(如图5f所示)。该结果表明,GH1突变影响了NIL-GH1 CB 的高尔基体和叶绿体发育。综上所述,由GH1失活而引起的PI4P和PI(4,5)P2的过量积累通过影响肌动蛋白微丝骨架的稳态参与细胞的形态建成。
实施例4 PI(4,5)P2特异性抑制Arp2/3复合体介导的肌动蛋白微丝聚合过程
根据以上的研究,过量积累的PI4P和PI(4,5)P2可能影响了肌动蛋白微丝骨架的稳态,但是具体的分子机制还不清楚。在细胞骨架相关蛋白中,Arp2/3复合体是一类比较特殊的蛋白,它主要参与到肌动蛋白微丝(Actin)的分枝形成过程,从而使得细胞内可以形成具有复杂网络状结构的细胞骨架。Arp2/3复合体本身并不具有催化肌动蛋白组装的活性,其需要被含有VCA结构域的WASp/SCARE / WAVE类蛋白激活才能起始分枝过程。我们进一步利用体外肌动蛋白微丝聚合实验,并结合TIRFM显微技术研究发现,相较于Arp2/3复合体和VCA复合物一起能够起始肌动蛋白微丝成核与分枝过程,PI4P和PI(4,5)P2却明显抑制了Arp2/3复合体介导的肌动蛋白微丝成核与分枝过程(如图6a所示)。另外,我们还发现,相较于PI4P,PI(4,5)P2更显著地抑制了Arp2/3的成核作用,并且展示出了一定的浓度梯度依赖效应(如图6b所示)。我们又通过GST pull-down实验进一步研究发现,随着PI(4,5)P2浓度的提高,PI(4,5)P2可以竞争性抑制VCA蛋白和Arp2/3复合体的结合(如图6c所示)。该结果提示,PI(4,5)P2可能作为一个竞争性抑制剂阻止了VCA蛋白和Arp2/3复合体的互作。综上所述,PI(4,5)P2通过抑制VCA和Arp2/3复合体的相互作用,特异性的抑制了Arp2/3复合体介导的肌动蛋白微丝聚合和分枝网络的形成,从而调控细胞的形态建成。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 中国科学院上海生命科学研究院
<120> 调控水稻穗粒数和株型的基因GH1及其应用
<130> P2019-0422
<160> 12
<170> SIPOSequenceListing 1.0
<210> 1
<211> 597
<212> PRT
<213> 水稻(Oryza sativa)
<400> 1
Met Gly Gly Ala Asn Asp Ser Ser Pro Ser Ser Lys Leu His Thr Arg
1 5 10 15
Leu Arg Leu Trp Glu Phe Pro Asp Arg Tyr Val Phe Glu Pro Ile Asp
20 25 30
Gly Leu Ala Asp Leu Tyr Leu Ser Ala Asn Arg Ser Asp Gly Ser Met
35 40 45
Asn Leu Val Glu Glu Leu Pro Pro Arg Asp Ser Ser Thr Lys Pro Lys
50 55 60
Cys Gln Thr Val Tyr Gly Val Ile Gly Val Leu Lys Leu Ser Val Gly
65 70 75 80
Ser Tyr Phe Leu Val Ile Thr Gly Arg Asp Cys Val Gly Ser Tyr Leu
85 90 95
Gly His Ala Ile Phe Lys Val Thr Gly Leu Lys Val Leu Pro Cys Ser
100 105 110
Asn Ser Arg Ser Thr Ser Gly Asn Gln Ser Lys Met Glu Thr Glu Phe
115 120 125
Ser Glu Leu Leu His Ala Ala Glu Lys Thr Ile Gly Leu Tyr Phe Ser
130 135 140
Tyr Asp Ile Asn Leu Thr Leu Thr Leu Gln Arg Leu His Asn Leu Gly
145 150 155 160
Asp Glu Phe Lys Ser Leu Pro Leu Trp Arg Gln Ala Glu Pro Arg Phe
165 170 175
Leu Trp Asn Ser Tyr Leu Leu Glu Pro Leu Ile Glu Asn Lys Leu Asp
180 185 190
Gln Tyr Leu Leu Pro Val Ile Gln Gly Ser Phe Gln Asn Ile His Ala
195 200 205
Glu Val Gly Ser Glu Lys Val Asn Val Thr Leu Ile Ala Arg Arg Cys
210 215 220
Thr Arg Arg Ile Gly Thr Arg Met Trp Arg Arg Gly Ala Asp Pro Glu
225 230 235 240
Gly Tyr Ala Ala Asn Phe Val Glu Ser Glu Gln Ile Met Glu Ser Lys
245 250 255
Gly Phe Thr Ala Ser Tyr Val Gln Val Arg Gly Ser Ile Pro Phe Leu
260 265 270
Trp Val Gln Ile Val Asp Leu Thr Tyr Lys Pro Ser Phe Asp Ile Val
275 280 285
Arg Gln Glu Glu Ala Pro Arg Ile Leu Glu Arg His Phe His Asp Leu
290 295 300
Gln Lys Lys Tyr Gly Ala Val Leu Ala Val Asp Leu Val Asn Thr His
305 310 315 320
Gly Gly Glu Gly Arg Leu His Asp Arg Tyr Ala Lys Ser Ile Glu Pro
325 330 335
Ile Leu Ser Glu Asp Ile Arg Tyr Val His Phe Asp Phe His Arg Ile
340 345 350
Cys Gly His Ile His Phe Glu Arg Leu Ser Gln Leu Tyr Asp Gln Ile
355 360 365
Glu Asp Tyr Leu Lys Lys His Arg Tyr Phe Leu Leu Asn Gly Lys Gly
370 375 380
Glu Lys Ile Glu Glu Gln Thr Gly Thr Ile Arg Thr Asn Cys Val Asp
385 390 395 400
Cys Leu Asp Arg Thr Asn Val Thr Gln Ser Met Ile Gly Gly Lys Ile
405 410 415
Leu Glu Asn Gln Leu Gln Arg Ile Gly Val Leu Gly Val Asn Asp Thr
420 425 430
Ile Ser Asn His Pro Ala Phe Asp Ala Lys Tyr Lys Val Leu Trp Ala
435 440 445
Asn His Gly Asp Ser Ile Ser Thr Gln Tyr Ser Gly Thr Pro Ala Leu
450 455 460
Lys Gly Asp Phe Val Arg Tyr Gly Lys Arg Ser Thr Gln Gly Ile Leu
465 470 475 480
Asn Asp Leu Trp Asn Ser Leu Ala Arg Tyr Tyr Leu Asn Asn Phe Ala
485 490 495
Asp Gly Thr Lys Gln Asp Ala Met Asp Leu Leu Gln Gly His Tyr Ile
500 505 510
Ile Ser Val Ser Arg Asp Met Ala Gly Pro Ser Lys Ala Gly Leu Leu
515 520 525
Glu Asn Tyr Ala Ser Phe Arg Leu Ala Phe Ala Leu Val Met Gly Ala
530 535 540
Leu Met Phe Met Met Met Ser Leu Arg Gln Ala Arg Asn Asp Val Arg
545 550 555 560
His Leu Val Leu Ser Leu Leu Trp Ala Gly Leu Cys Ile Gly Ile Thr
565 570 575
His Phe Val Arg Ala Asn Gly Arg Val Phe Thr Asn Arg Pro Arg Phe
580 585 590
Tyr Gln Ser Arg His
595
<210> 2
<211> 9752
<212> DNA
<213> 水稻(Oryza sativa)
<400> 2
atgggtgggg caaatgactc aagtccatcc tctaaacttc acacaagact gagactatgg 60
gagttcccag accgctatgt atttgagccg attgatggtc ttgctgactt gtatctgtca 120
gctaaccgtt ctgatggttc aatgaatcta gttgaagagt tgccaccacg tgactcttct 180
acaaaaccaa aatgtcaaac agtgtatggt gtgataggag ttctcaagct ttcagttgga 240
tcatattttt tagtgataac aggccgtgat tgtgtgggat cctacttggg acatgcaatt 300
tttaaagtga caggactaaa agttctcccc tgcagtaact cgcgtagcac ttctggcaat 360
caggtcaagc aatacttatg ccttcacagt tttatatagc ttccatctat ttttcaatta 420
gtgatttgag taagctgttg gcagagtaaa atggaaacag aattttcaga actcctgcat 480
gctgcagaga agactatagg cctgtacttc tcatatgata tcaacttaac acttacgtga 540
gtatccttct tgtcaaacat agtcacattc tagtgtctta tagtcaaagc ttacaacctc 600
ttgttgcata cttgcattga ggatttccag catagtatgc aattctatgc atggggttct 660
tctattttag tagatggcat tctctattta tttttacagt ccacctgtgc tatcatcttt 720
catttaattc tcttcttctg tttttggctt attgcaacag catgcttatc tatgtttcct 780
tctattgcag tttgcagagg ctacataatc ttggtgatga gttcaaatca cttccgcttt 840
ggagacaggt ttgctgcctt caccatttgg aaccttttag ttctagagtt tgtttatacc 900
catagggtct gagctttctc cattgttctt gtaatccctg atcttttgct gcctatactt 960
tactgctgtg gtgccaaaag ctacttcttg ttcacttcat ctttagctat cagtttacac 1020
atctgatgta gaaatatgga cataaactaa accagtctga tttttaattc caattcccag 1080
acacaatttg taatggttga ttattttgac atttatgaaa aagggaaatt aattaacaaa 1140
gaagtcagaa gaggttgcat attggccact tgtatttatg tgttttgcca tcatggttca 1200
agaaggcgct aggcactaga gggtcagcag ggcgcgccct aggcgtcact tagctagcat 1260
ctaggtccaa catgacttgt gaaatccaag caattagcca gcatattaca tataaatgtt 1320
agacagtagg acattaaatt agcagctaaa ggagcccaca tggatggtta gccgcccaag 1380
gccactccca atgggagttt cattctcact aaatagagtg ccatgtcaat attttttatg 1440
atgtggcaag gaattgatga agagattaag ggcctgtttg ggggagcttt agattctgag 1500
aagcagctgt ttggtagcca gcttctgcga atctggaaaa gctctgaaac ccagcttctc 1560
cagcttctgg cttcttagct catttttcag aatctgtaac tacagattct cagaagctgt 1620
ggactgtttg gggcagcttt taggaaaagc tgcagctggg acaagctccc ccaaacaggg 1680
cctaagagag aggtggaatg ggtttcatca agatgaaact atgtgtacac tatgtccaat 1740
atctgttgtc tcttgcattt attgcctagg aaacaacaaa atgaaaaaaa tgcatcgtat 1800
gggctgtttc caccatcaac taagggtatg tttggatgct caggtaagtt tagctatagc 1860
tcgaatgggc aaactagctc attttagcta tgctcatttc aactagctca tttcagctat 1920
tgctgctctt gcccaagcac catatttggt ttccttgctt ttaccccacg ttgagaaacg 1980
gctatcagtt tttcccctca cgtatgcact tcttgccgat gagagagagc caattcggtt 2040
ctcatggctg agcaaggttt ttcttgccca tcaaggctag cttgtccctc aaagctagct 2100
tgtccctcaa agctaggata tttcatcggt accaaacacc aagcctggct aggctaggct 2160
agaaaatctt tagccaagga tccaaacacg ggggatgcta gtgcgcgcgt gcgcgccagg 2220
gaaaggagcc ggcgcgtgcg ccagctgcgt ccctacacgt ttcttttttt tttctagatc 2280
tcctatttta acgtcacttt tttgtttcct tttttaaacc gcttcttttt ttctagattt 2340
ttttaatcgc ttctttcttt tccacactcg cgcatgattt ttttgtgata ttttataaat 2400
tcaatctttc accttcaata tcagttgaga gttttgaatt tgagttgaaa agtttctaaa 2460
atttaagttt aatgttttga attttgagat gaaagttttc aaattttgtc aaatattttg 2520
aattttgagg tgaaagcttt taaatttgag ctaaaagttt tcaaacctca gttaagtttt 2580
caaatcttga cttgaatttt ttaaatttga attgaaagtt tcaaatcttt agttgaaagt 2640
tttcaagtcc gagttgaaag ttttcaaatc cgagttgaac attttcaaat ccaagttgaa 2700
agtttttaaa tccgagttga aagttttcaa atctgagtta aaagttttta aatcttgact 2760
tgaaagtttt caaatattga ctcctactct tagacgcgtg tggtagttaa cggccaaaaa 2820
aaaaagaaag aaagaaacac ggctgttgcg cctaccgaaa aaaaaggaaa aaaaaagaaa 2880
aaagaagcac gcaggcttgg tcgtaggagg acccgccatg tggcacgctc gcgacttgga 2940
gaagtcgcgt gtacgcgcga attaggattc ctgtccaaac gcaccctaaa tgttttgttg 3000
cttatttggc attcttggaa acataaaact gaaaccttcc actagtaatg atctaatgcc 3060
taattcaggt ggctacctgg cacctagagc cgatttgtat aacactgttt gccatttgag 3120
cgcctggaat tttatttttg cttctgctgc ttctatagtc cagtaattgc tgcacaatta 3180
tcttgccatc taggaaaaca tagatcccat ctaggaacat tggagcttta atagcatttg 3240
ttttaaagac ctgtcttgtc cccaaaaagt agcatgctgt ggcttaagtt aaaactttca 3300
gtagttaagc atgaaaaatg taaagagtgc taaattttta cagagtaaca tactacagta 3360
ctttttttcc actggggagt taagtactgt tgaattaaca ttttatactg tgaaacatcc 3420
atcttgcact gtccttttcc acaaaggctc aaaatgggtc atatgtgaca ataattctgt 3480
aaatatctcc ttttttaatc atataccata tgtattttac tttcaagact ggggcaattc 3540
cttattttga attttaaatt tataagctat gccttgaact tgtatacagt agcttcttaa 3600
agcaacaaca tagtgctgct atgtcaaaag ttgctcgtgc taaatgccta aaagcacaac 3660
agattaaaca tgtaaacaaa aaattcctgt gccttttcaa atctatattg cacaggtgaa 3720
ataattacat tctttacagg cagaaccaag atttctatgg aacagttact tgctggaacc 3780
tctaattgag aacaaggcaa gaattaaatt tgaagcttac tgatttcata gttttgaaga 3840
attaaataac tgatacttgc aaaatgtatt gattgtttct ttcttcctta acagctggac 3900
cagtacttgt tgccagtcat tcaaggcagt atcctttgtt tgtcatatga catttcaatt 3960
tggtcactgt cagaaatgca atataataat atattattat ttgaacttga gtcaccttcc 4020
ctagggtcat atgtcaatat aagtcgcaga cacttaactg aatatcaggc tttcagaata 4080
tccatgcaga agttggatcg gagaaggtaa atgtgaccct gattgcacgt aggtgcacac 4140
ggaggatagg tgagaatcat cagtgatcag aataagttca catgttctct tctgcttatt 4200
gtcacttgaa aatatttttt tatatgtatt tgattatttt ttctaatttt tattacatcc 4260
tggctcctta tttttgagaa actcactggc atatgagtag atttaattac agttgatgag 4320
ttttttttta actaaaaggt acacgaatgt ggagacgtgg agctgaccca gagggttatg 4380
ctgccaactt tgttgaatca gagcagataa tggaatcaaa agggttcaca gcatcctatg 4440
tacaagtaag tttcttagga tagtttaaaa ccaaccaatc tgcctttcta tcaatttgtg 4500
agttgcaatt tcatcagtag gttattacta ttttattttt accacattct agtaccttga 4560
caaattaatg tgcttttagg ttcgagggtc cataccattc ttgtgggtgc agattgttga 4620
tttgacatat aaacctagct ttgacattgt tagacaagag gaggcggtga gctcactcaa 4680
tttattcctt gttttttgtt gactatgtca caattactaa actatacatt ttcaatggct 4740
ttctgtgtta tactaaccca gcatggttag ttgtttctct gcaatgcaac ctaaactttt 4800
tccttttgtt ttaatttgtc tttggcttct ttcttcagcc acgcatactt gagcggcact 4860
ttcatgatct acagaagaaa tatggagctg tattggctgt tgatcttgtc aatacagtaa 4920
gtatcgtgcc tttaaacttt ggaatcacct tgtctttcgt atttttttag aactaagtat 4980
atttacttgc taaaatgtca ccacatttga ttttgccact acccaaggtg tctatcatac 5040
aaaatcagat tcttgtttat tttaggattg atcttcaata ttggttctgc ccagttccat 5100
gctattctgt tgattgggca tactattact atgttcctgg gaatagaacc aagctattac 5160
ttttaccttg attttatgca tagacatttc atgattttat ctaaaaagtg caatatgatt 5220
ttgttatatt ttttgtttaa gttagaggat gccgattatt ctgatattct agtttgttgc 5280
tttatccttt taacaacatg gctgttcatc ctttaatttt aattccaatt cctatataca 5340
gcacggtggt gaaggtcgcc tccatgacag atatgcaaaa tctattgaac ctattctcag 5400
tgaagacata aggtagcaat ttcttttgcc caaatgcagt gttctccaac atatattact 5460
gtagttaaca tatctatcaa tgcgtgcact tgcagatatg tgcattttga cttccatcga 5520
atctgtggtc atattcactt tgagcgcctt tctcagctct acgatcaaat tgaagattat 5580
ctcaagaaac ataggtatat ttttggcaga tacattatag agtgctccat ttgatctgtt 5640
tatcattttc tggcctcagt gcccatgaca tgtattttgg tgttacttaa tccattgctt 5700
tttccctgca tttgtttgct gtcttttttt tttctgttat tgggtttcat tcgctaagca 5760
accccccaaa atcattaggc tatttaccac gtgactacac atgctttcaa atgaatgcag 5820
agtcaatttt tggtgcacta gttcttgact cttggtttgg catatgaaac ttctaaagca 5880
gacacttgca tcatgttact ttatttagca aacaattggt tctgttacta cttctgagtt 5940
tcagtcatct gaatattggt tgattactca atcactgtgc agtaatacct atacattaaa 6000
aacacaaata ctccagcagt atgtagatta ttttcgtgca ctgaattctc tggcatagta 6060
ggcaaaggga agagcaatag tcacttgtgt tagtcatact gtttttaagt ccttgtttag 6120
gtgttttagc atccgctccc ctcctctctt ttgctctatt aacagaaaga aaggggaaaa 6180
agttccaggt ctgagatttt cagtacatct ctgtactatc ccaactctct tatgcctttg 6240
gacagagcat tttcattact atggaacatg gtggatatat tttctccttc ttgatcttgc 6300
taataatgtt atgggttagg tatttccttt tgaatggtaa aggtgaaaaa attgaggagc 6360
agactggcac tatcaggaca aattgtgtcg attgcttaga tcgcaccaat gtaactcagg 6420
tatatactgt caagtatagt ttttgttgca cgtcaaattt aattgtagat attgtgaaca 6480
cttatggtta ctggataatt tacctaccat gttgcactgt agtagctaat tcttgatagt 6540
ttctcttcct tcttttgaga tctgtgtgga agacaatgtt tttttaaata agtggcattg 6600
ctcttttttt agactattac aaacctagat gtgctgccag atagatctac aacctgagtt 6660
aacttgtcat tttgcagtgg gttgtctcat tggatttatc taaatcaaat ccaaactgtt 6720
ggacttaata tatattgatg tacccttaag gactggcttg agttactttg atttgctggt 6780
tgatgtattc tagaacagaa cctattgact gatgtagtaa gatcacatgc ctcaaaggga 6840
aaagccactt cagttactcc taagtatcta attgcagtca agtagactag gttaacttca 6900
aagtataata cttaatactt atccatcgtt tatttatgtc ttatttcccc ctcttccgtg 6960
gagttttcac tttaccagaa ttctgattat caatatgatg actaaacaga gcatgattgg 7020
aggaaagata ctagaaaacc aacttcagcg aataggggtt ctcggtgtta atgatacgat 7080
aagcaaccat ccagcttttg atgcaaaata caaagtttgt gagttgttca tgttcactaa 7140
ccctggttct tcttgtttgt attcctcatg cttgtttgta tctcctatgc ttcttcttga 7200
tgcaaaatac tcttgttcag tatgggccaa ccatggagat tcaataagca ctcagtactc 7260
tggaactccg gcattgaagg gcgattttgt tcggtaattc ctaaatagaa aaactgcctt 7320
ttcttcattt ccaaagtgca gcacatttac tggaacagtg ttactggaag ttcatggtga 7380
acagtattac tggaagttcc ttctttgtta tcaagagaaa gaactacttc cagcttacat 7440
cagaaaagga aaatcatagt gattgttatc accttgagtc tgttcacatc tgagccactt 7500
atgttttgtg tggaacttgg aagttttaag agtttcaatg ggctatcatg aagttgatgt 7560
ccttttacta ttcttgctga aatgtctcca tacttgtggg caaccaaata ccctatgggt 7620
tgtaactgat ttccagcatg ctaataacca tcagtgaaaa aaggcctaag atagttccag 7680
atcccatgac gggctaacat tactaagtag tatacatgct cttttggggc actcataagt 7740
ttgtgctgct aaatttatgc tcgtttttct ttcatattct gatattgaca aataaaatgc 7800
ggcagcataa tttattactt gtttgtttgt tcccatattt aacaattgtt tttgttttat 7860
taggtatggg aagagaagta cccagggaat tctgaatgat ctgtggaatt cacttgctag 7920
atactacttg aataactttg cagatggcac taaacaggta aatgactgac tttgcatgaa 7980
aatcaataaa tcagaatgac caaaacaatg aaccccattc accgctaata tgccagctta 8040
ttttcttgtg aatttctcac ttaatcgtga tagaccatta gtcatgcaaa catcctcaag 8100
caatagtaag cattgctttt ggatattggt agtgcattgg aatgttttac gtggtcactc 8160
atttgccatt tcaccagccc tagaaaaatt taaaccaagc tagagcattg ccttattatt 8220
tttctgttgt tttttatagg atgccatgga tctacttcaa ggacattaca ttatatctgt 8280
tagccgcgac atggcaggtc caagcaaagc aggacttcta gagaattatg cggtgggtac 8340
atttttgctg tagtgtataa ttgctctttt atactgacac atgaattgct actgggaaag 8400
ccttctttgt taccctgtca aacacttacg actaggcaca tgtgcgtagg aacttactct 8460
atggtctgta tgtatgagaa actgttggat cagttatgga ctgtattttg tatctttctc 8520
caatgggata aagctcttaa ttgcacaatt cttattttgc agtccttccg ccttgctttt 8580
gcattggtta tgggagctct tatgttcatg atgatgtcac taagacaagg taagatttct 8640
gtgactgttg aagcagacac agtggagtat atttaacaat tgttttctta acagatattt 8700
ttcttaggtt tatttgcacc gtgtcaggca gcatttcctc tgctctctgt gcatattaca 8760
ttacacaaag aactctctct tacaattctt ggttccttta ggttcaccca tctgcaaaat 8820
aattttgcta tatattgttg ccagtttttt agtatgcaac cttttcttcg ctctgatgtc 8880
atgcccagtg cgatttgcaa ggcatagttg tgcacgaaag atgggagact ttgtccaggt 8940
cctgactcct gacaaggagt gacattgctg gtaatcaaga agtaacagaa aaaaagcaag 9000
tacaaagaga gatgcactta ggcagttagg aatggaggag gacaagtgac aaggatatac 9060
atatttcttc cttaatttat tgatggtcac tgatccttgt ttaggatcac acttccaagc 9120
ccaaacatgg atacctaaca caagtcccat ttctggtcgt aactcaccta atatatccca 9180
ctttcctata tctcaaaaac tcaaactcag taaacaagat agctagtcat aaaattcaaa 9240
tccaagttac ttggatttct gctgatatga tgctatgcta cgcttgtaaa actgaaaaaa 9300
agtaaagttg cataggctaa tactgctggg tgctgactat tttttcttct tttgcatgtt 9360
gcaaaacatg agaggtaagg tggtttagaa cgttggggct tatttacatt ggttttgata 9420
gcatgactga aatttgaacc gctcttataa ttgaggatgg cattggacat gtatcacagt 9480
tgagtaaaat aaatttgttt caagttataa ccatccgaat acatatgtac tttctcaaag 9540
aagattttgg agtcacattc tatttttact atataatggg aatatatgtg cagctaatta 9600
actgcttcaa tatctctgca gccaggaatg atgttcgcca tttagtgttg tcacttctat 9660
gggctggtct ttgcattggc atcacacatt ttgtcagagc caatggtcgg gtgttcacca 9720
acagacctcg tttttatcag tcgcgccatt ga 9752
<210> 3
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<400> 3
gattccacgt caggatcttc tgg 23
<210> 4
<211> 23
<212> DNA
<213> 人工序列(artificial sequence)
<400> 4
gctcaccagt tgagattgaa agg 23
<210> 5
<211> 24
<212> DNA
<213> 人工序列(artificial sequence)
<400> 5
gcctggtaag tggtaatgta atgg 24
<210> 6
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 6
gtgaattcct ccttggtctt gg 22
<210> 7
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 7
aactaaagtc accagccaaa 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 8
ttgacacaat gcctgtattc 20
<210> 9
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 9
ccgacttact agtggtgtgt tt 22
<210> 10
<211> 22
<212> DNA
<213> 人工序列(artificial sequence)
<400> 10
aggagtacaa ctctgaacat gc 22
<210> 11
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 11
ttggaatcac cttgtctttc g 21
<210> 12
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 12
ttgctcttcc ctttgcctac 20
Claims (10)
1.一种GH1基因或其编码蛋白的抑制剂的用途,其特征在于,用于调控植物的农艺性状或制备调控植物的农艺性状的制剂或组合物,其中,所述“调控植物的农艺性状”包括:
(i) 降低株高;和/或
(iii)减少每穗粒数;和/或
(iv)减小粒型大小,所述植物为水稻,所述GH1蛋白的氨基酸序列如SEQ ID NO.1所示。
2.如权利要求1所述的用途,其特征在于,所述组合物或制剂还用于选自下组的一种或多种用途:
(a) 提高磷脂酰肌醇的含量;
(b) 抑制Arp2/3复合体介导的肌动蛋白微丝聚合和分枝网络的形成;
(c) 调控细胞的形态建成;
(d) 抑制VCA蛋白和Arp2/3复合体的结合。
3.如权利要求2所述的用途,其特征在于,所述磷脂酰肌醇选自下组:PI4P、PI(4,5)P2、或其组合。
4.一种组合物的用途,所述组合物包括:(a) GH1基因或其编码蛋白的抑制剂;和 (b)农学上可接受的载体,其特征在于,用于改良植物农艺性状,所述“改良植物的农艺性状”包括:
(i) 降低株高;和/或
(iii)减少每穗粒数;和/或
(iv)减小粒型大小,所述植物为水稻;
所述GH1蛋白的氨基酸序列如SEQ ID NO.1所示。
5.如权利要求4所述的用途,其特征在于,所述组合物中,所述GH1基因或其编码蛋白的抑制剂的含量(wt%)为0.05%-10%。
6.如权利要求4所述的用途,其特征在于,所述组合物还包括其他调控植物的农艺性状的物质。
7.如权利要求6所述的用途,其特征在于,所述其他调控植物的农艺性状的物质选自下组:赤霉素、矮壮素、生长素、油菜素内酯、或其组合。
8.一种改良植物农艺性状的方法,其特征在于,包括步骤:
降低所述植物中GH1基因或其编码蛋白的表达量和/或活性,从而改良植物的农艺性状,所述“改良植物的农艺性状”包括:
(i) 降低株高;和/或
(iii)减少每穗粒数;和/或
(iv)减小粒型大小,所述植物为水稻,所述GH1蛋白的氨基酸序列如SEQ ID NO.1所示。
9.一种制备基因工程的植物组织或植物细胞的方法,其特征在于,包括步骤:
降低植物组织或植物细胞中的GH1基因或其编码蛋白的表达和/或活性,从而获得具有改良的农艺性状的基因工程的植物组织或植物细胞,所述“改良的农艺性状”包括:
(i) 降低株高;和/或
(iii)减少每穗粒数;和/或
(iv)减小粒型大小,所述植物为水稻;
所述GH1蛋白的氨基酸序列如SEQ ID NO. 1所示。
10.一种制备基因工程植物的方法,其特征在于,包括步骤:
将权利要求9所述方法制备的基因工程的植物组织或植物细胞再生为植物体,从而获得具有改良的农艺性状的基因工程植物,所述“改良的农艺性状”包括:
(i) 降低株高;和/或
(iii)减少每穗粒数;和/或
(iv)减小粒型大小,所述植物为水稻;
所述GH1蛋白的氨基酸序列如SEQ ID NO. 1所示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910756064.7A CN112391399B (zh) | 2019-08-15 | 2019-08-15 | 调控水稻穗粒数和株型的基因gh1及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910756064.7A CN112391399B (zh) | 2019-08-15 | 2019-08-15 | 调控水稻穗粒数和株型的基因gh1及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112391399A CN112391399A (zh) | 2021-02-23 |
CN112391399B true CN112391399B (zh) | 2022-09-16 |
Family
ID=74601795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910756064.7A Active CN112391399B (zh) | 2019-08-15 | 2019-08-15 | 调控水稻穗粒数和株型的基因gh1及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112391399B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101501495A (zh) * | 2005-07-05 | 2009-08-05 | 西托斯科莱顿股份有限公司 | Rho蛋白质检测 |
WO2014202616A2 (en) * | 2013-06-19 | 2014-12-24 | Dsm Ip Assets B.V. | Rasamsonia gene and use thereof |
CN108866072A (zh) * | 2017-05-09 | 2018-11-23 | 中国科学院上海生命科学研究院 | OsEXP10基因调控水稻生长以及对褐飞虱抗性的应用 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8299318B2 (en) * | 2007-07-05 | 2012-10-30 | Ceres, Inc. | Nucleotide sequences and corresponding polypeptides conferring modulated plant characteristics |
-
2019
- 2019-08-15 CN CN201910756064.7A patent/CN112391399B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101501495A (zh) * | 2005-07-05 | 2009-08-05 | 西托斯科莱顿股份有限公司 | Rho蛋白质检测 |
WO2014202616A2 (en) * | 2013-06-19 | 2014-12-24 | Dsm Ip Assets B.V. | Rasamsonia gene and use thereof |
CN108866072A (zh) * | 2017-05-09 | 2018-11-23 | 中国科学院上海生命科学研究院 | OsEXP10基因调控水稻生长以及对褐飞虱抗性的应用 |
Non-Patent Citations (3)
Title |
---|
A SAC phosphoinositide phosphatase controls rice development via hydrolyzing phosphatidylinositol 4-phosphate and phosphatidylinositol 4,5-bisphosphate;Tao Guo et al.;《bioRxiv》;20190819;第1-34页 * |
Mutations in the Arabidopsis Phosphoinositide Phosphatase Gene SAC9 Lead to Overaccumulation of PtdIns(4,5)P2 and Constitutive Expression of the Stress-Response Pathway;Mary Elizabeth Williams et al.;《Plant Physiology》;20050527;第138卷;第686-700页 * |
两个基因型水稻利用有机磷的差异及其与根系分泌酸性磷酸酶活性的关系;李永夫等;《应用生态学报》;20090531;第20卷(第5期);第1072-1078页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112391399A (zh) | 2021-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100429311C (zh) | 高抗草苷膦的epsp合成酶及其编码序列 | |
CA2359231C (en) | Methods and means for modification of plant characteristics using the vernalization gene vrn2 | |
JP4091114B2 (ja) | 開花遺伝子 | |
WO2018196709A1 (zh) | 一种调控作物矮化及其产量的基因及其应用 | |
CN108866072B (zh) | OsEXP10基因调控水稻生长以及对褐飞虱抗性的应用 | |
CN101161675A (zh) | 水稻大粒基因及其应用 | |
HUP0001660A2 (hu) | Megváltoztatott növekedésű növények | |
CN101747418A (zh) | 一种植物叶片卷曲调控基因及其应用 | |
US6639130B2 (en) | Plant sterol reductases and uses thereof | |
CN101585869B (zh) | 一种水稻分蘖相关蛋白及其编码基因与应用 | |
CN110592134A (zh) | 一种sdg40基因或其编码蛋白的应用 | |
CN111837964B (zh) | 调控水稻分蘖数和粒型的新基因tsg1及其应用 | |
CN113846117B (zh) | 一种增强植物香味的方法 | |
CN101210247B (zh) | 胚乳特异表达启动子、胚乳细胞特异基因及其应用 | |
JP2002525121A (ja) | 野生型cop1遺伝子およびそのcoilドメインをコードする植物および植物細胞 | |
CN112391399B (zh) | 调控水稻穗粒数和株型的基因gh1及其应用 | |
US20030093835A1 (en) | Chimeric genes controlling flowering | |
CN110241130B (zh) | 控制植物粒数和粒重的gsn1基因、编码蛋白及其应用 | |
CN103865936B (zh) | 控制植物叶片转绿的基因及其使用方法和应用 | |
CN115044592B (zh) | 一种调控玉米株型和瘤黑粉病抗性的基因ZmADT2及其编码蛋白和应用 | |
WO2021155753A1 (zh) | 抗除草剂基因、多肽及其在植物育种中的应用 | |
CN111269300A (zh) | 一个调控木质素合成的基因及应用 | |
CN113880927B (zh) | 通过过表达锌指蛋白OsCIP3增强水稻低温耐受性的方法 | |
CN114685634A (zh) | 一种调控结实率的基因及其应用 | |
CN101575366B (zh) | 水稻株型基因及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |