JP2023548301A - ダイズにおけるレグヘモグリン - Google Patents
ダイズにおけるレグヘモグリン Download PDFInfo
- Publication number
- JP2023548301A JP2023548301A JP2023525960A JP2023525960A JP2023548301A JP 2023548301 A JP2023548301 A JP 2023548301A JP 2023525960 A JP2023525960 A JP 2023525960A JP 2023525960 A JP2023525960 A JP 2023525960A JP 2023548301 A JP2023548301 A JP 2023548301A
- Authority
- JP
- Japan
- Prior art keywords
- leghemoglobin
- soybean
- protein
- seed
- soybean seed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 244000068988 Glycine max Species 0.000 title claims abstract description 327
- 235000010469 Glycine max Nutrition 0.000 title claims abstract description 323
- 108010063653 Leghemoglobin Proteins 0.000 claims abstract description 298
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 221
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 153
- 241000196324 Embryophyta Species 0.000 claims abstract description 83
- 238000000034 method Methods 0.000 claims abstract description 73
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 claims abstract description 23
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 claims abstract description 19
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 claims abstract description 19
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 claims abstract description 19
- 239000005642 Oleic acid Substances 0.000 claims abstract description 19
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 claims abstract description 19
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 claims abstract description 19
- MUPFEKGTMRGPLJ-RMMQSMQOSA-N Raffinose Natural products O(C[C@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@@H](O[C@@]2(CO)[C@H](O)[C@@H](O)[C@@H](CO)O2)O1)[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 MUPFEKGTMRGPLJ-RMMQSMQOSA-N 0.000 claims abstract description 9
- MUPFEKGTMRGPLJ-UHFFFAOYSA-N UNPD196149 Natural products OC1C(O)C(CO)OC1(CO)OC1C(O)C(O)C(O)C(COC2C(C(O)C(O)C(CO)O2)O)O1 MUPFEKGTMRGPLJ-UHFFFAOYSA-N 0.000 claims abstract description 9
- MUPFEKGTMRGPLJ-ZQSKZDJDSA-N raffinose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO[C@@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)O1 MUPFEKGTMRGPLJ-ZQSKZDJDSA-N 0.000 claims abstract description 9
- DTOSIQBPPRVQHS-PDBXOOCHSA-N alpha-linolenic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCC(O)=O DTOSIQBPPRVQHS-PDBXOOCHSA-N 0.000 claims abstract description 8
- 239000000137 peptide hydrolase inhibitor Substances 0.000 claims abstract description 8
- 235000020661 alpha-linolenic acid Nutrition 0.000 claims abstract description 7
- 229960004488 linolenic acid Drugs 0.000 claims abstract description 7
- KQQKGWQCNNTQJW-UHFFFAOYSA-N linolenic acid Natural products CC=CCCC=CCC=CCCCCCCCC(O)=O KQQKGWQCNNTQJW-UHFFFAOYSA-N 0.000 claims abstract description 7
- 102000040430 polynucleotide Human genes 0.000 claims description 89
- 108091033319 polynucleotide Proteins 0.000 claims description 89
- 239000002157 polynucleotide Substances 0.000 claims description 89
- 230000014509 gene expression Effects 0.000 claims description 77
- 108091026890 Coding region Proteins 0.000 claims description 74
- 230000004048 modification Effects 0.000 claims description 74
- 238000012986 modification Methods 0.000 claims description 74
- 239000002773 nucleotide Substances 0.000 claims description 74
- 125000003729 nucleotide group Chemical group 0.000 claims description 74
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 62
- 230000008685 targeting Effects 0.000 claims description 58
- 238000003780 insertion Methods 0.000 claims description 50
- 230000037431 insertion Effects 0.000 claims description 50
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 42
- 238000006467 substitution reaction Methods 0.000 claims description 38
- 210000002706 plastid Anatomy 0.000 claims description 36
- 230000001105 regulatory effect Effects 0.000 claims description 36
- 238000012217 deletion Methods 0.000 claims description 32
- 230000037430 deletion Effects 0.000 claims description 32
- 108010016634 Seed Storage Proteins Proteins 0.000 claims description 31
- 108010083391 glycinin Proteins 0.000 claims description 31
- 229920001184 polypeptide Polymers 0.000 claims description 31
- 150000007523 nucleic acids Chemical class 0.000 claims description 29
- 235000012054 meals Nutrition 0.000 claims description 28
- 238000010362 genome editing Methods 0.000 claims description 27
- 102000039446 nucleic acids Human genes 0.000 claims description 27
- 108020004707 nucleic acids Proteins 0.000 claims description 27
- 150000003278 haem Chemical class 0.000 claims description 26
- 108010023021 Glutamyl-tRNA reductase Proteins 0.000 claims description 25
- 230000000694 effects Effects 0.000 claims description 19
- 230000003834 intracellular effect Effects 0.000 claims description 16
- 230000009261 transgenic effect Effects 0.000 claims description 15
- 230000001965 increasing effect Effects 0.000 claims description 13
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical group [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 claims description 11
- 235000019764 Soybean Meal Nutrition 0.000 claims description 10
- 108091008324 binding proteins Proteins 0.000 claims description 10
- 235000014113 dietary fatty acids Nutrition 0.000 claims description 10
- 229930195729 fatty acid Natural products 0.000 claims description 10
- 239000000194 fatty acid Substances 0.000 claims description 10
- 150000004665 fatty acids Chemical class 0.000 claims description 10
- 239000000047 product Substances 0.000 claims description 10
- 239000004455 soybean meal Substances 0.000 claims description 10
- ZGXJTSGNIOSYLO-UHFFFAOYSA-N 88755TAZ87 Chemical compound NCC(=O)CCC(O)=O ZGXJTSGNIOSYLO-UHFFFAOYSA-N 0.000 claims description 9
- 108010054147 Hemoglobins Proteins 0.000 claims description 9
- 229960002749 aminolevulinic acid Drugs 0.000 claims description 9
- 102000001554 Hemoglobins Human genes 0.000 claims description 8
- 238000004519 manufacturing process Methods 0.000 claims description 8
- 230000031787 nutrient reservoir activity Effects 0.000 claims description 7
- 238000003860 storage Methods 0.000 claims description 7
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 5
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 claims description 5
- 239000003623 enhancer Substances 0.000 claims description 5
- 150000004676 glycans Chemical class 0.000 claims description 5
- 239000012466 permeate Substances 0.000 claims description 5
- 229920001282 polysaccharide Polymers 0.000 claims description 5
- 239000005017 polysaccharide Substances 0.000 claims description 5
- 108010063589 raffinose synthase Proteins 0.000 claims description 5
- 108010059820 Polygalacturonase Proteins 0.000 claims description 4
- 108010093305 exopolygalacturonase Proteins 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 230000035772 mutation Effects 0.000 claims description 4
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 claims description 3
- 101001090103 Arabidopsis thaliana Kunitz trypsin inhibitor 4 Proteins 0.000 claims description 3
- 229910019142 PO4 Inorganic materials 0.000 claims description 3
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 claims description 3
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 claims description 3
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 claims description 3
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 claims description 3
- 108010002430 hemicellulase Proteins 0.000 claims description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims description 3
- 239000010452 phosphate Substances 0.000 claims description 3
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 claims description 3
- 101150115493 FAD3 gene Proteins 0.000 claims description 2
- 108700019146 Transgenes Proteins 0.000 claims description 2
- 230000011713 vesicle targeting Effects 0.000 claims description 2
- 102000023732 binding proteins Human genes 0.000 claims 4
- 102000005575 Cellulases Human genes 0.000 claims 1
- 108010084185 Cellulases Proteins 0.000 claims 1
- 230000002708 enhancing effect Effects 0.000 claims 1
- 235000018102 proteins Nutrition 0.000 abstract description 141
- 239000000203 mixture Substances 0.000 abstract description 18
- 108010073771 Soybean Proteins Proteins 0.000 abstract description 17
- 239000012141 concentrate Substances 0.000 abstract description 12
- UQZIYBXSHAGNOE-USOSMYMVSA-N Stachyose Natural products O(C[C@H]1[C@@H](O)[C@H](O)[C@H](O)[C@@H](O[C@@]2(CO)[C@H](O)[C@@H](O)[C@@H](CO)O2)O1)[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@H](CO[C@@H]2[C@@H](O)[C@@H](O)[C@@H](O)[C@H](CO)O2)O1 UQZIYBXSHAGNOE-USOSMYMVSA-N 0.000 abstract description 6
- UQZIYBXSHAGNOE-XNSRJBNMSA-N stachyose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO[C@@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO[C@@H]3[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O3)O)O2)O)O1 UQZIYBXSHAGNOE-XNSRJBNMSA-N 0.000 abstract description 6
- 235000019710 soybean protein Nutrition 0.000 abstract description 5
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 abstract description 3
- 108010042407 Endonucleases Proteins 0.000 description 57
- 102000004533 Endonucleases Human genes 0.000 description 55
- 108020004414 DNA Proteins 0.000 description 54
- 210000004027 cell Anatomy 0.000 description 52
- 230000008569 process Effects 0.000 description 30
- 238000002474 experimental method Methods 0.000 description 28
- 108020005004 Guide RNA Proteins 0.000 description 26
- 108091028043 Nucleic acid sequence Proteins 0.000 description 23
- 239000000523 sample Substances 0.000 description 23
- 230000005782 double-strand break Effects 0.000 description 21
- 230000009466 transformation Effects 0.000 description 21
- 230000001404 mediated effect Effects 0.000 description 20
- 108090000790 Enzymes Proteins 0.000 description 18
- 102000004190 Enzymes Human genes 0.000 description 17
- 235000001014 amino acid Nutrition 0.000 description 17
- 229940088598 enzyme Drugs 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 16
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 16
- 150000001413 amino acids Chemical class 0.000 description 15
- 230000037361 pathway Effects 0.000 description 15
- 108091033409 CRISPR Proteins 0.000 description 14
- 239000000463 material Substances 0.000 description 13
- 239000002609 medium Substances 0.000 description 13
- 238000013518 transcription Methods 0.000 description 13
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 12
- 230000008859 change Effects 0.000 description 12
- 238000003776 cleavage reaction Methods 0.000 description 12
- 230000029087 digestion Effects 0.000 description 12
- 239000003921 oil Substances 0.000 description 12
- 230000007017 scission Effects 0.000 description 12
- 229940001941 soy protein Drugs 0.000 description 12
- 238000013461 design Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 230000035897 transcription Effects 0.000 description 11
- 239000013598 vector Substances 0.000 description 11
- 101000709208 Arabidopsis thaliana Probable galactinol-sucrose galactosyltransferase 2 Proteins 0.000 description 10
- 101000709207 Arabidopsis thaliana Probable galactinol-sucrose galactosyltransferase 4 Proteins 0.000 description 10
- 108700037728 Glycine max beta-conglycinin Proteins 0.000 description 10
- 102000004142 Trypsin Human genes 0.000 description 10
- 108090000631 Trypsin Proteins 0.000 description 10
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 10
- 239000012634 fragment Substances 0.000 description 10
- 108060003196 globin Proteins 0.000 description 10
- 102000018146 globin Human genes 0.000 description 10
- 239000007787 solid Substances 0.000 description 10
- 239000002904 solvent Substances 0.000 description 10
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 10
- 229960000268 spectinomycin Drugs 0.000 description 10
- 210000001519 tissue Anatomy 0.000 description 10
- 239000012588 trypsin Substances 0.000 description 10
- 229910052725 zinc Inorganic materials 0.000 description 10
- 239000011701 zinc Substances 0.000 description 10
- 102000053602 DNA Human genes 0.000 description 9
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 9
- 238000013459 approach Methods 0.000 description 9
- 230000027455 binding Effects 0.000 description 9
- 150000004032 porphyrins Chemical class 0.000 description 9
- 230000002759 chromosomal effect Effects 0.000 description 8
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 8
- 239000006228 supernatant Substances 0.000 description 8
- 108010076504 Protein Sorting Signals Proteins 0.000 description 7
- 108091028113 Trans-activating crRNA Proteins 0.000 description 7
- 239000002253 acid Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 239000000499 gel Substances 0.000 description 7
- 150000002500 ions Chemical class 0.000 description 7
- 230000002018 overexpression Effects 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- UMCMPZBLKLEWAF-BCTGSCMUSA-N 3-[(3-cholamidopropyl)dimethylammonio]propane-1-sulfonate Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCC[N+](C)(C)CCCS([O-])(=O)=O)C)[C@@]2(C)[C@@H](O)C1 UMCMPZBLKLEWAF-BCTGSCMUSA-N 0.000 description 6
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- 238000010354 CRISPR gene editing Methods 0.000 description 6
- 102000014914 Carrier Proteins Human genes 0.000 description 6
- 101710163270 Nuclease Proteins 0.000 description 6
- 125000003275 alpha amino acid group Chemical group 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 210000003763 chloroplast Anatomy 0.000 description 6
- 230000007423 decrease Effects 0.000 description 6
- -1 ferrochetalase Proteins 0.000 description 6
- 230000006801 homologous recombination Effects 0.000 description 6
- 238000002744 homologous recombination Methods 0.000 description 6
- 230000001939 inductive effect Effects 0.000 description 6
- 239000000843 powder Substances 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 238000011084 recovery Methods 0.000 description 6
- 239000002002 slurry Substances 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 230000033616 DNA repair Effects 0.000 description 5
- 230000007018 DNA scission Effects 0.000 description 5
- 108010029485 Protein Isoforms Proteins 0.000 description 5
- 102000001708 Protein Isoforms Human genes 0.000 description 5
- 108020004511 Recombinant DNA Proteins 0.000 description 5
- 229910000831 Steel Inorganic materials 0.000 description 5
- 108090000848 Ubiquitin Proteins 0.000 description 5
- 102000044159 Ubiquitin Human genes 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 230000001851 biosynthetic effect Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 150000001720 carbohydrates Chemical class 0.000 description 5
- 235000014633 carbohydrates Nutrition 0.000 description 5
- 235000013312 flour Nutrition 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 229910052757 nitrogen Inorganic materials 0.000 description 5
- 230000006780 non-homologous end joining Effects 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 239000010959 steel Substances 0.000 description 5
- 238000013060 ultrafiltration and diafiltration Methods 0.000 description 5
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 4
- 229920001817 Agar Polymers 0.000 description 4
- 241000589158 Agrobacterium Species 0.000 description 4
- 241000219194 Arabidopsis Species 0.000 description 4
- 102000003875 Ferrochelatase Human genes 0.000 description 4
- 108010057394 Ferrochelatase Proteins 0.000 description 4
- 244000046052 Phaseolus vulgaris Species 0.000 description 4
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 4
- 102000004389 Ribonucleoproteins Human genes 0.000 description 4
- 108010081734 Ribonucleoproteins Proteins 0.000 description 4
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 4
- 229930006000 Sucrose Natural products 0.000 description 4
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 4
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 4
- 229940122618 Trypsin inhibitor Drugs 0.000 description 4
- 101710162629 Trypsin inhibitor Proteins 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 4
- 239000008272 agar Substances 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 238000009838 combustion analysis Methods 0.000 description 4
- 210000002257 embryonic structure Anatomy 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 235000019253 formic acid Nutrition 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 235000013372 meat Nutrition 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 125000006850 spacer group Chemical group 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 239000005720 sucrose Substances 0.000 description 4
- 238000004885 tandem mass spectrometry Methods 0.000 description 4
- 239000002753 trypsin inhibitor Substances 0.000 description 4
- 238000000108 ultra-filtration Methods 0.000 description 4
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 229920001213 Polysorbate 20 Polymers 0.000 description 3
- 108020001991 Protoporphyrinogen Oxidase Proteins 0.000 description 3
- 102000005135 Protoporphyrinogen oxidase Human genes 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 241000193996 Streptococcus pyogenes Species 0.000 description 3
- 239000013504 Triton X-100 Substances 0.000 description 3
- 229920004890 Triton X-100 Polymers 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 101100084091 Zea mays PPR10 gene Proteins 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 230000000433 anti-nutritional effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 239000008367 deionised water Substances 0.000 description 3
- 229910021641 deionized water Inorganic materials 0.000 description 3
- 239000012153 distilled water Substances 0.000 description 3
- 238000001035 drying Methods 0.000 description 3
- 239000012636 effector Substances 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 239000011536 extraction buffer Substances 0.000 description 3
- 239000012065 filter cake Substances 0.000 description 3
- 230000037433 frameshift Effects 0.000 description 3
- 108091008053 gene clusters Proteins 0.000 description 3
- 239000000411 inducer Substances 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 239000003112 inhibitor Substances 0.000 description 3
- 229910052742 iron Inorganic materials 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 229920001542 oligosaccharide Polymers 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 239000004033 plastic Substances 0.000 description 3
- 229920003023 plastic Polymers 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 3
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000010833 quantitative mass spectrometry Methods 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 230000005783 single-strand break Effects 0.000 description 3
- 238000003756 stirring Methods 0.000 description 3
- 230000005026 transcription initiation Effects 0.000 description 3
- 101150084750 1 gene Proteins 0.000 description 2
- WLKSPGHQGFFKGE-UHFFFAOYSA-N 1-chloropropan-2-yl n-(3-chlorophenyl)carbamate Chemical compound ClCC(C)OC(=O)NC1=CC=CC(Cl)=C1 WLKSPGHQGFFKGE-UHFFFAOYSA-N 0.000 description 2
- 108020005345 3' Untranslated Regions Proteins 0.000 description 2
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 2
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 2
- 229910000013 Ammonium bicarbonate Inorganic materials 0.000 description 2
- 101100208963 Arabidopsis thaliana UPL3 gene Proteins 0.000 description 2
- 101000654927 Arachis hypogaea Stilbene synthase 3 Proteins 0.000 description 2
- 238000009010 Bradford assay Methods 0.000 description 2
- 240000002791 Brassica napus Species 0.000 description 2
- 108091079001 CRISPR RNA Proteins 0.000 description 2
- 238000010453 CRISPR/Cas method Methods 0.000 description 2
- 108090000489 Carboxy-Lyases Proteins 0.000 description 2
- 108010059892 Cellulase Proteins 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 108010044091 Globulins Proteins 0.000 description 2
- 102000006395 Globulins Human genes 0.000 description 2
- 108010057891 Glutamate-1-semialdehyde 2,1-aminomutase Proteins 0.000 description 2
- 108010056651 Hydroxymethylbilane synthase Proteins 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 108090001090 Lectins Proteins 0.000 description 2
- 102000004856 Lectins Human genes 0.000 description 2
- 241000209510 Liliopsida Species 0.000 description 2
- 244000061176 Nicotiana tabacum Species 0.000 description 2
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 2
- 102000004316 Oxidoreductases Human genes 0.000 description 2
- 108090000854 Oxidoreductases Proteins 0.000 description 2
- 239000004743 Polypropylene Substances 0.000 description 2
- 102100034391 Porphobilinogen deaminase Human genes 0.000 description 2
- 108010026552 Proteome Proteins 0.000 description 2
- 108700005075 Regulator Genes Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- OJOBTAOGJIWAGB-UHFFFAOYSA-N acetosyringone Chemical compound COC1=CC(C(C)=O)=CC(OC)=C1O OJOBTAOGJIWAGB-UHFFFAOYSA-N 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 210000005006 adaptive immune system Anatomy 0.000 description 2
- 235000012538 ammonium bicarbonate Nutrition 0.000 description 2
- 239000001099 ammonium carbonate Substances 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 239000007844 bleaching agent Substances 0.000 description 2
- GPRBEKHLDVQUJE-VINNURBNSA-N cefotaxime Chemical compound N([C@@H]1C(N2C(=C(COC(C)=O)CS[C@@H]21)C(O)=O)=O)C(=O)/C(=N/OC)C1=CSC(N)=N1 GPRBEKHLDVQUJE-VINNURBNSA-N 0.000 description 2
- 229960004261 cefotaxime Drugs 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 229940106157 cellulase Drugs 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 238000002485 combustion reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000007865 diluting Methods 0.000 description 2
- 235000021186 dishes Nutrition 0.000 description 2
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 2
- 230000012361 double-strand break repair Effects 0.000 description 2
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 2
- 238000002635 electroconvulsive therapy Methods 0.000 description 2
- 238000000132 electrospray ionisation Methods 0.000 description 2
- 239000003797 essential amino acid Substances 0.000 description 2
- 235000020776 essential amino acid Nutrition 0.000 description 2
- 241001233957 eudicotyledons Species 0.000 description 2
- 235000019197 fats Nutrition 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 239000000706 filtrate Substances 0.000 description 2
- 239000000796 flavoring agent Substances 0.000 description 2
- 235000019634 flavors Nutrition 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 229940059442 hemicellulase Drugs 0.000 description 2
- 238000000265 homogenisation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 239000002523 lectin Substances 0.000 description 2
- 235000021374 legumes Nutrition 0.000 description 2
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000002552 multiple reaction monitoring Methods 0.000 description 2
- 150000002482 oligosaccharides Chemical class 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000004069 plant analysis Substances 0.000 description 2
- 239000004417 polycarbonate Substances 0.000 description 2
- 229920001155 polypropylene Polymers 0.000 description 2
- 239000002244 precipitate Substances 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 238000000751 protein extraction Methods 0.000 description 2
- 239000012460 protein solution Substances 0.000 description 2
- 230000018883 protein targeting Effects 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 239000012465 retentate Substances 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 239000012882 rooting medium Substances 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 230000000392 somatic effect Effects 0.000 description 2
- 235000013322 soy milk Nutrition 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 239000005631 2,4-Dichlorophenoxyacetic acid Substances 0.000 description 1
- GWCRPYGYVRXVLI-UHFFFAOYSA-N 2-ethyl-4-hydroxy-5-methyl-3(2H)-furanone Chemical compound CCC1OC(C)=C(O)C1=O GWCRPYGYVRXVLI-UHFFFAOYSA-N 0.000 description 1
- 101710168820 2S seed storage albumin protein Proteins 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 101150011812 AADAC gene Proteins 0.000 description 1
- 240000005020 Acaciella glauca Species 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 108010039224 Amidophosphoribosyltransferase Proteins 0.000 description 1
- 101100450469 Arabidopsis thaliana CPX1 gene Proteins 0.000 description 1
- 101100337028 Arabidopsis thaliana GLX2-1 gene Proteins 0.000 description 1
- 101100450416 Arabidopsis thaliana HEMB1 gene Proteins 0.000 description 1
- ZOXJGFHDIHLPTG-UHFFFAOYSA-N Boron Chemical compound [B] ZOXJGFHDIHLPTG-UHFFFAOYSA-N 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- OBMZMSLWNNWEJA-XNCRXQDQSA-N C1=CC=2C(C[C@@H]3NC(=O)[C@@H](NC(=O)[C@H](NC(=O)N(CC#CCN(CCCC[C@H](NC(=O)[C@@H](CC4=CC=CC=C4)NC3=O)C(=O)N)CC=C)NC(=O)[C@@H](N)C)CC3=CNC4=C3C=CC=C4)C)=CNC=2C=C1 Chemical compound C1=CC=2C(C[C@@H]3NC(=O)[C@@H](NC(=O)[C@H](NC(=O)N(CC#CCN(CCCC[C@H](NC(=O)[C@@H](CC4=CC=CC=C4)NC3=O)C(=O)N)CC=C)NC(=O)[C@@H](N)C)CC3=CNC4=C3C=CC=C4)C)=CNC=2C=C1 OBMZMSLWNNWEJA-XNCRXQDQSA-N 0.000 description 1
- 101100184662 Caenorhabditis elegans mogs-1 gene Proteins 0.000 description 1
- 101000767750 Carya illinoinensis Vicilin Car i 2.0101 Proteins 0.000 description 1
- 108700004991 Cas12a Proteins 0.000 description 1
- 206010068051 Chimerism Diseases 0.000 description 1
- KZBUYRJDOAKODT-UHFFFAOYSA-N Chlorine Chemical compound ClCl KZBUYRJDOAKODT-UHFFFAOYSA-N 0.000 description 1
- 108020004998 Chloroplast DNA Proteins 0.000 description 1
- 241000223782 Ciliophora Species 0.000 description 1
- 238000011537 Coomassie blue staining Methods 0.000 description 1
- 101000767759 Corylus avellana Vicilin Cor a 11.0101 Proteins 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- LEVWYRKDKASIDU-QWWZWVQMSA-N D-cystine Chemical compound OC(=O)[C@H](N)CSSC[C@@H](N)C(O)=O LEVWYRKDKASIDU-QWWZWVQMSA-N 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 101150108526 GLY1 gene Proteins 0.000 description 1
- 101150106478 GPS1 gene Proteins 0.000 description 1
- 208000034951 Genetic Translocation Diseases 0.000 description 1
- 101000582320 Homo sapiens Neurogenic differentiation factor 6 Proteins 0.000 description 1
- 101001021103 Homo sapiens Oxygen-dependent coproporphyrinogen-III oxidase, mitochondrial Proteins 0.000 description 1
- 108090001042 Hydro-Lyases Proteins 0.000 description 1
- 102000004867 Hydro-Lyases Human genes 0.000 description 1
- 229920001479 Hydroxyethyl methyl cellulose Polymers 0.000 description 1
- 108091029795 Intergenic region Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 101000622316 Juglans regia Vicilin Jug r 2.0101 Proteins 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 108010059724 Micrococcal Nuclease Proteins 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 108010086093 Mung Bean Nuclease Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000204025 Mycoplasma capricolum Species 0.000 description 1
- 101710202365 Napin Proteins 0.000 description 1
- 102100030589 Neurogenic differentiation factor 6 Human genes 0.000 description 1
- 108010020943 Nitrogenase Proteins 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 241000588843 Ochrobactrum Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 102100036201 Oxygen-dependent coproporphyrinogen-III oxidase, mitochondrial Human genes 0.000 description 1
- 101710176384 Peptide 1 Proteins 0.000 description 1
- 101000854546 Petunia hybrida Protein WUSCHEL Proteins 0.000 description 1
- 108700011203 Phaseolus vulgaris phaseolin Proteins 0.000 description 1
- 101000767757 Pinus koraiensis Vicilin Pin k 2.0101 Proteins 0.000 description 1
- 101000767758 Pistacia vera Vicilin Pis v 3.0101 Proteins 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 108010072970 Porphobilinogen synthase Proteins 0.000 description 1
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- 241000589194 Rhizobium leguminosarum Species 0.000 description 1
- 101001025539 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Homothallic switching endonuclease Proteins 0.000 description 1
- 239000005708 Sodium hypochlorite Substances 0.000 description 1
- 240000006394 Sorghum bicolor Species 0.000 description 1
- 235000007230 Sorghum bicolor Nutrition 0.000 description 1
- 241000592344 Spermatophyta Species 0.000 description 1
- 241000970875 Streptomyces spectabilis Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 240000001417 Vigna umbellata Species 0.000 description 1
- 235000011453 Vigna umbellata Nutrition 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 101710185494 Zinc finger protein Proteins 0.000 description 1
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 235000013527 bean curd Nutrition 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 229910052796 boron Inorganic materials 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000007248 cellular mechanism Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 238000003501 co-culture Methods 0.000 description 1
- 230000008045 co-localization Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 229960003067 cystine Drugs 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000004807 desolvation Methods 0.000 description 1
- 201000009028 early myoclonic encephalopathy Diseases 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 108010050663 endodeoxyribonuclease CreI Proteins 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 230000009144 enzymatic modification Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000001125 extrusion Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 235000012041 food component Nutrition 0.000 description 1
- 239000005417 food ingredient Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003198 gene knock in Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 239000012869 germination medium Substances 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 101150107144 hemC gene Proteins 0.000 description 1
- IIRDTKBZINWQAW-UHFFFAOYSA-N hexaethylene glycol Chemical group OCCOCCOCCOCCOCCOCCO IIRDTKBZINWQAW-UHFFFAOYSA-N 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 description 1
- 210000002231 macronucleus Anatomy 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 239000012569 microbial contaminant Substances 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000007479 molecular analysis Methods 0.000 description 1
- 239000004570 mortar (masonry) Substances 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000000643 oven drying Methods 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 244000000003 plant pathogen Species 0.000 description 1
- 230000008119 pollen development Effects 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 235000003499 redwood Nutrition 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000013557 residual solvent Substances 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- SUKJFIGYRHOWBL-UHFFFAOYSA-N sodium hypochlorite Chemical compound [Na+].Cl[O-] SUKJFIGYRHOWBL-UHFFFAOYSA-N 0.000 description 1
- 239000011343 solid material Substances 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 235000013528 soy cheese Nutrition 0.000 description 1
- 229940071440 soy protein isolate Drugs 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 229910001220 stainless steel Inorganic materials 0.000 description 1
- 239000010935 stainless steel Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 238000000194 supercritical-fluid extraction Methods 0.000 description 1
- 239000010414 supernatant solution Substances 0.000 description 1
- 238000005496 tempering Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 238000001195 ultra high performance liquid chromatography Methods 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 210000005167 vascular cell Anatomy 0.000 description 1
- 230000006656 viral protein synthesis Effects 0.000 description 1
- 230000007923 virulence factor Effects 0.000 description 1
- 239000000304 virulence factor Substances 0.000 description 1
- 238000004065 wastewater treatment Methods 0.000 description 1
- 239000003643 water by type Substances 0.000 description 1
- 238000003809 water extraction Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
- C12N15/8251—Amino acid content, e.g. synthetic storage proteins, altering amino acid biosynthesis
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H6/00—Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
- A01H6/54—Leguminosae or Fabaceae, e.g. soybean, alfalfa or peanut
- A01H6/542—Glycine max [soybean]
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/10—Processes for modifying non-agronomic quality output traits, e.g. for industrial processing; Value added, non-agronomic traits
- A01H1/101—Processes for modifying non-agronomic quality output traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine or caffeine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
- A01H5/10—Seeds
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Botany (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Developmental Biology & Embryology (AREA)
- Environmental Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Cell Biology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Physiology (AREA)
- Nutrition Science (AREA)
- Gastroenterology & Hepatology (AREA)
- Natural Medicines & Medicinal Plants (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Beans For Foods Or Fodder (AREA)
- Enzymes And Modification Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
- Pretreatment Of Seeds And Plants (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Polysaccharides And Polysaccharide Derivatives (AREA)
Abstract
レグヘモグロビンを含むダイズ種子を生産するダイズ植物が、ダイズ植物のゲノムを改変することによって生産される。レグヘモグロビンを含むダイズ植物、ダイズ種子及びダイズタンパク質組成物が提供される。レグヘモグロビンと、更に高オレイン酸、低リノレン酸、高タンパク質、低スタキオース、低ラフィノース及び低プロテアーゼインヒビターのうちの1つ以上と、を含む、ダイズ植物、ダイズ種子及びダイズタンパク質組成物が提供される。ダイズ単離物及び濃縮物などのレグヘモグロビンを含むタンパク質組成物が、ダイズ種子から作製され得る。更に、レグヘモグロビンを含む植物、種子及びタンパク質組成物を生成並びに使用するための方法が開示される。
Description
電子的に提出された配列表の参照
配列表の正式な写しは、2020年10月28日に作成されたファイル名8429-US-PSP_SequenceListing_ST25.txtの、94キロバイトのサイズを有するASCIIフォーマットの配列表としてEFS-Webを介して電子的に提出され、本明細書と同時に提出される。このASCIIフォーマット文書に含まれる配列表は、本明細書の一部であり、参照により全体として本明細書に組み込まれる。
配列表の正式な写しは、2020年10月28日に作成されたファイル名8429-US-PSP_SequenceListing_ST25.txtの、94キロバイトのサイズを有するASCIIフォーマットの配列表としてEFS-Webを介して電子的に提出され、本明細書と同時に提出される。このASCIIフォーマット文書に含まれる配列表は、本明細書の一部であり、参照により全体として本明細書に組み込まれる。
植物ベースのタンパク質を用いた動物ベースの肉代替品は、食品用途における産業のトレンドになりつつある。ダイズマメヘモグロビン、又はレグヘモグロビンは、マメ科植物の窒素固定根粒に見出されるグロビンタンパク質である。それは鉄含有分子であるヘムを担持し、ニトロゲナーゼ酵素を酸素不活性から保護し、窒素固定細菌への酸素の流れを容易にするように機能する。レグヘモグロビンは、操作された酵母から発酵させることができ、肉中のヘモグロビンによってもたらされる風味を模倣することによって、肉代替品において使用される。ダイズにおいて、レグヘモグロビンを発現させるための組成物及び方法が提供される。
ダイズゲノムに組み込まれたレグヘモグロビンコード配列を含む組換え構築物からレグヘモグロビンを発現させることなく、ダイズ種子中の総タンパク質の少なくとも0.5%の量でレグヘモグロビンタンパク質を含有するダイズ種子が提供される。レグヘモグロビンコード配列を含有する組換え構築物を含まないダイズ種子ゲノムは、コード配列若しくは調節配列などの天然レグヘモグロビン遺伝子に挿入、欠失、若しくは置換を導入するように改変され得るか、又は種子貯蔵タンパク質のコード配列の全部又は一部をレグヘモグロビンコード配列で置き換えるように改変され得る。
ダイズ種子ゲノムが、天然レグヘモグロビン遺伝子に挿入、欠失、若しくは置換を導入するように改変されているか、又は種子貯蔵タンパク質のコード配列の全部又は一部をレグヘモグロビンコード配列で置き換えるように改変されているダイズ種子が提供される。
いくつかの実施形態では、輸送ペプチドなどの標的化配列は、レグヘモグロビンを色素体などの細胞内区画に向かせるために、レグヘモグロビンコード配列に作動可能に連結されている。
いくつかの実施形態では、レグヘモグロビンタンパク質が種子の横断面において、ダイズ種子にピンク色を付与するのに十分な量で、又は総種子タンパク質の少なくとも0.1%の量でダイズ種子中で発現される、ゲノム改変を含むダイズ種子が提供される。
いくつかの実施形態では、ダイズは、種子色素体中で特異的にレグヘモグロビンを直接発現するように改変される。
いくつかの実施形態では、天然レグヘモグロビン遺伝子における改変、核ゲノム中の異なる天然プロモーターの制御下でのレグヘモグロビン遺伝子の挿入、又は色素体ゲノム中のレグヘモグロビン配列の封入のうちの1つ以上を有するダイズ種子は、そのゲノム中に組み込まれたレグヘモグロビンコード配列を含む組換え構築物を更に含む。
いくつかの実施形態では、ダイズ種子は、グルタミルtRNAレダクターゼ、フェロケタラーゼ(ferrochetalase)、グルタミルtRNAレダクターゼ結合タンパク質、及びアミノレブリン酸シンターゼをコードする1つ以上の遺伝子へのヌクレオチド挿入、欠失、又は置換などの更なる改変を含有する。いくつかの実施形態では、ダイズ種子は、グルタミルtRNAレダクターゼ、フェロケタラーゼ、グルタミルtRNAレダクターゼ結合タンパク質、及び/又はアミノレブリン酸シンターゼのコード配列を含有する1つ以上の組換え構築物を含有する。
総種子タンパク質の少なくとも0.5%の量でレグヘモグロビンタンパク質を含有し、以下の特徴:(i)総種子脂肪酸の少なくとも50%のオレイン酸含有量;(ii)総種子脂肪酸の3%未満のリノレン酸含有量;(iii)13%の水分で測定されるか、又は13%の水分に調整されたダイズの総重量の少なくとも37%のタンパク質含有量;(iv)対照の非改変ダイズの活性の5%未満のクニッツトリプシンプロテアーゼインヒビター活性;(v)対照の非改変ダイズの5%未満のボーマン・バークプロテアーゼインヒビター活性;(vi)13%の水分での1重量%未満のスタキオース含有量;及び(vii)13%の水分での0.5重量%未満のラフィノース含有量のうちの1つ以上を有するダイズ種子が提供される。
いくつかの実施形態では、配列番号2と少なくとも95%の同一性を有するレグヘモグロビンタンパク質をコードするポリヌクレオチドを含む組換え構築物を含有し、その構築物がタンパク質貯蔵小胞標的化配列を含まない、トランスジェニックダイズ種子が提供され、ダイズは、(i)グルタミルtRNAレダクターゼをコードする配列、又は短縮型部分を含む組換え構築物、(ii)フェロケタラーゼをコードする配列を含む組換え構築物、(iii)グルタミルtRNAレダクターゼ結合タンパク質を含む組換え構築物、及び(iv)アミノレブリン酸シンターゼを含む組換え構築物を含有せず、ダイズ種子は、総種子タンパク質の少なくとも0.5%の量で種子中にレグヘモグロビンを含む。
いくつかの実施形態では、総タンパク質の少なくとも0.5%の量で、レグヘモグロビンタンパク質を含有するダイズ種子は、(i)その挿入が非ダイズゲノム配列を除外するダイズゲノム配列の核酸挿入、(ii)1つ以上の核酸置換、(iii)1つ以上の核酸欠失、及び(iv)それらの任意の組合せのうちの少なくとも1つを含むゲノム改変を有し、そのゲノム改変が、(a)天然レグヘモグロビン遺伝子に対してなされた改変、又は(b)天然レグヘモグロビン遺伝子の少なくとも一部を含む挿入を含む。
いくつかの実施形態では、ダイズはレグヘモグロビンを発現し、グリシニン又はコングリシニンなどの1つ以上の種子貯蔵コード配列の発現を低減又は防止するための異なる改変を更に含む。
いくつかの実施形態では、ダイズはレグヘモグロビンを発現し、高オレイン酸、低リノレン酸、13%の水分での少なくとも37%の総種子タンパク質のうちの1つ以上を更に含む。
いくつかの実施形態では、レグヘモグロビンを含有する改変されたダイズ種子から成長させた植物及び植物部分が提供される。
いくつかの実施形態では、レグヘモグロビンを発現する改変されたダイズ種子から抽出されたダイズミールを処理するための方法が提供され、この中でミールは、セルラーゼ、ヘミセルラーゼ、及びペクチナーゼのうちの少なくとも1つと、ミール中の多糖類を分解するのに十分な条件下で接触され、透過液(permeant)が残渣から濾過される。総タンパク質の重量で、少なくとも0.1%、0.2%、0.3%、0.4%、又は0.5%のレグヘモグロビンを含有する改変されたダイズ種子から抽出されたミールが提供される。
いくつかの実施形態では、総タンパク質の重量で少なくとも0.2%のレグヘモグロビンを含み、レグヘモグロビンの少なくとも約50%が鉄基でヘム化されているダイズ単離物が提供され、これはレグヘモグロビンを発現する改変された種子から生成される。
いくつかの実施形態では、レグヘモグロビンを含む改変されたダイズ種子及び高オレイン酸を含むダイズ種子からダイズミール又は単離物を生成するための方法が提供され、この中で豆が高オレイン酸及びレグヘモグロビンの少なくとも約50%が鉄基でヘム化されているヘモグロビンを含む、ミール又は単離物を生成するように処理される。
本開示は、本出願の一部を形成する下記の詳細な説明並びに本明細書に付随する図面及び配列表から、より十分に理解することができよう。
配列記述(表1)は、参照により本明細書に組み込まれる本明細書に添付の配列表を要約する。配列表は、Nucleic Acids Research 13:3021-3030(1985)及びBiochemical Journal 219(2):345-373(1984)に記載されるIUPAC-IUB標準で定義される通りの、ヌクレオチド配列特性に関する1文字コード、並びにアミノ酸に関する1文字及び3文字コードを含む。
本開示は、レグヘモグロビンタンパク質、レグヘモグロビン複合体、又はその組合せを発現する改変されたダイズ種子を記載する。レグヘモグロビンは、窒素固定細菌によるコロニー形成の際にダイズ根粒中で合成されるタンパク質である。本明細書で使用される場合、「レグヘモグロビンタンパク質」又は「レグヘモグロビン」は、モノマー中に折り畳まれていないか、又は折り畳まれているかに関わらず、グロブリンタンパク質又はポリペプチドを指し、それはヘム基(鉄に結合したポルフィリン)と会合していてもしていなくてもよい。本明細書で使用される場合、「レグヘモグロビン複合体」又は「レグヘモグロビンタンパク質複合体」は、特に、ヘム基(鉄に結合したポルフィリン)と会合したレグヘモグロビンタンパク質を含む複合体を指す。そのような複合体は、十分な量で存在するとき、例えば、レグヘモグロビン複合体を発現するダイズ種子の横断面において、目で検出可能な、その複合体を含有する細胞又は組織に赤色若しくはピンク色を付与することができる。横断面におけるダイズの色に関連して本明細書で使用される場合、ピンク色は、ピンク又は赤のあらゆる色合いを意味する。
ダイズ種子は、レグヘモグロビンの発現をタンパク質貯蔵小胞、又は他の標的化された細胞区画に標的化する必要なしに、ヘム複合体を形成するレグヘモグロビンの発現を増加させるように改変することができる。
いくつかの実施形態では、ヘム基を含まないレグヘモグロビン、レグヘモグロビン複合体、又は両方の形態の組合せは、総種子タンパク質の少なくとも0.01%、0.05%、0.5%、1%、1.5%、2%、2.5%、3%、4%、5%、6%、7%、8%、9%、10%以上、且つ75%、50%、25%、20%、15%、10%、5%、4%、又は3%未満でダイズ種子中に存在することができる。
好適には、総レグヘモグロビンの少なくとも5、10、15、20、25、30、40、50、60、70、80、90又は95パーセント、且つ100、99.9、95、90、85、80、70、60又は50パーセント未満は、ダイズ種子中でヘム基との複合体を形成する。
本明細書に開示されるダイズ種子、並びに植物部分、植物細胞、組織培養物及びそれらから成長させた植物が提供される。
ある特定の実施形態では、ダイズ種子には、ダイズ種子細胞中で機能するプロモーターに作動可能に連結されたレグヘモグロビンコード配列を含む組換え構築物が導入されている。本明細書で使用される場合、組換え構築物は、ポリペプチドをコードするポリヌクレオチドに作動可能に連結されたプロモーター配列、及び任意選択で他の調節配列を含む構築物であり、組換え構築物は、植物、植物細胞、又は種子に対して外因性である。本明細書で使用される場合、核酸に関する「外因性」という用語は、核酸がその天然のゲノム位置にはないことを示す。そのような組換え構築物を含有する植物は、トランスジェニック植物と称される。調節該列は、ポリペプチドコード配列の転写又は終止を促進する遺伝子内又は遺伝子の周りにある配列であり得る。
組換えDNA構築物の非限定的な例としては、「調節エレメント」とも称される異種配列に作動可能に連結された着目したポリヌクレオチドが含まれ、これは、着目した配列の発現、自己複製、及び/又はゲノム挿入における助けとなる。そのような調節エレメントとしては、例えば、プロモーター、終止配列、エンハンサーなど、又は発現カセットの任意の成分;プラスミド、コスミド、ウイルス、自律複製配列、ファージ、又は直線状若しくは環状の一本鎖若しくは二本鎖DNA又はRNAヌクレオチド配列;並びに/又は異種ポリペプチドをコードする配列が挙げられる。
提供される組換えDNA構築物又は組換え構築物は、ゲノム中に組み込まれるとき、ダイズゲノム中のその天然の位置には存在しないか、又は別の種のゲノムに由来する少なくとも1つの調節エレメントを含む。ある特定の実施形態では、組換えDNA構築物の少なくとも1つの調節エレメントは、プロモーター、好ましくはグリシニン又はコングリシニンプロモーターなどの種子中のレグヘモグロビンの発現を駆動する異種プロモーターを含む。
ある実施形態では、レグヘモグロビンコード配列を含む組換え構築物を含有するダイズ種子は、以下のうちの1つ以上又は全てを含有しない:(i)グルタミルtRNAレダクターゼをコードする配列、又はその短縮型部分を含む組換え構築物、(ii)フェロケタラーゼをコードする配列を含む組換え構築物、(iii)グルタミルtRNAレダクターゼ結合タンパク質を含む組換え構築物、及び(iv)アミノレブリン酸シンターゼを含む組換え構築物。短縮型コード配列は、コード配列のN’又はC’末端、若しくはその両方が除去され、それによって天然の非切断型ポリペプチドよりも短く、C’末端又はN’末端、若しくは両方でのアミノ酸の数を欠くコード配列からポリペプチドが合成されるようにした配列である。本発明者らは、これらの追加の組換え構築物を用いて発現を増強する必要なく、且つレグヘモグロビンの、タンパク質貯蔵小胞などの特定の細胞区画に向かわせる標的化配列を含む必要なく、ピンク色を付与することを通して、目によって検出可能な量で高レベルのレグヘモグロビン及びレグヘモグロビン複合体が発現され得ることを発見した。
いくつかの実施形態では、天然レグヘモグロビン遺伝子が改変される。レグヘモグロビン遺伝子のゲノム配列は、配列番号43で提供されており、改変は、この配列の全て若しくは一部を含むようになされてもよく、又は本明細書で同定される特定の領域を含む、ダイズゲノム中の配列番号43に対応する配列に対してなされてもよい。配列番号43に関して、プロモーター及び5’UTRを含む調節領域は、ヌクレオチドの1位~2058位に由来し、エクソン1は2059位~2156位に由来し、イントロン1は2157位~2275位に由来し、エクソン2は2276位~2384位に由来し、イントロン2は2385位~2574位に由来し、エクソン3は2575位~2679位に由来し、イントロン3は2680位~2876位に由来し、エクソン4は2877位~3002位に由来し、3’UTRを含むターミネーターは3003位~5214位に由来する。
いくつかの実施形態では、改変は、配列番号43の1位~2058位で、配列番号43の100位~2058位で、配列番号43の200位~2058位で、配列番号43の300位~2058位で、配列番号43の400位~2058位で、配列番号43の500位~2058位で、配列番号43の600位~2058位で、配列番号43の700位~2058位で、配列番号43の800位~2058位で、配列番号43の900位~2058位で、配列番号43の1000位~2058位で、配列番号43の1100位~2058位で、配列番号43の1200位~2058位で、配列番号43の1300位~2058位で、配列番号43の1400位~2058位で、配列番号43の1500位~2058位で、配列番号43の1600位~2058位で、配列番号43の1700位~2058位で、配列番号43の1800位~2058位で、又は配列番号43の1900位~2058位で行われる。
いくつかの実施形態では、ダイズ種子の色素体ゲノムは、レグヘモグロビンタンパク質をコードする配列が色素体ゲノム中に挿入され、それによりレグヘモグロビンポリペプチドが、輸送ペプチドを必要とすることなく、種子色素体中で直接発現される改変を含む。種子特異的色素体形質転換は、配列番号44などのDicisGG配列に接続されたレグヘモグロビンコード配列を含む構築物を挿入することによって達成することができる。植物は、PPRタンパク質、例えば、配列番号46又は48などのPPR10タンパク質を発現するために、種子中で活性であり、且つ種子特異的であるプロモーター、例えばグリシニン又はコングリシニンなどの種子貯蔵タンパク質のプロモーターの活性の制御下で、PPRタンパク質をコードする配列と共に同時形質転換される。異なる種子特異的プロモーターは、PPRタンパク質の発現の量を調整するように選択することができる。或いは、PPRタンパク質の発現は、例えば、種子貯蔵タンパク質の遺伝子座において、種子特異的様式で発現される天然配列の全部又は一部を置き換えるためのゲノム編集を通して達成することができる。PPRタンパク質は、根、茎、葉、及び花などの非種子の植物部分において生じる発現なしに、又はその少ない若しくは最小限の発現で種子色素体中のレグヘモグロビンの直接発現を容易にするために、DicisGG配列に対して種子中のトリガーとして作用する。
レグヘモグロビンの色素体発現は、核ゲノム供給源からのレグヘモグロビンの発現と組み合わせることができ、1つ以上のヌクレオチドを天然レグヘモグロビン遺伝子中に挿入、欠失、若しくは置換することによって、又はレグヘモグロビンが種子貯蔵タンパク質の代わりに発現されるように、種子貯蔵タンパク質のコード配列の全部又は一部を置き換えるために、種子貯蔵タンパク質遺伝子中にレグヘモグロビン配列を挿入させることによるなど、ダイズ種子中で高度に発現される遺伝子のゲノム編集によるものなど、例えば、核ゲノムのトランスジェニック構築物による形質転換によって、又は天然核遺伝子のゲノム編集によって組み合わせることができる。レグヘモグロビンの色素体発現は、本明細書に開示されるものなどのヘム生合成経路の制御をコードするか又は寄与する他の遺伝子の増加した又は減少した発現と組み合わせることができる。
いくつかの実施形態では、色素体標的化配列などの細胞内標的化配列又は輸送配列が含まれ、レグヘモグロビンをコードする配列に作動可能に連結され、例えば、レグヘモグロビンをコードする配列のN’末端の直前に配置され、それにより細胞内標的化配列は、レグヘモグロビンの発現をタンパク質貯蔵小胞又は色素体などの細胞内区画へ標的化させる。例えば、配列番号31又は配列番号32をコードするポリヌクレオチドで生じる標的化配列及び作動可能に連結されたレグヘモグロビン配列は、組換え構築物中の調節配列に作動可能に連結され、ダイズを形質転換するために使用することができる。標的化配列は、例えば、配列番号31、又は配列番号32をコードする配列で生じるレグヘモグロビン配列に作動可能に連結することができ、グリシニン又はコングリシニンなどの種子貯蔵タンパク質のコード配列の全部又は一部を置き換えるために、ゲノム編集を通して挿入されることができ、それによって、レグヘモグロビンタンパク質が輸送ペプチドと共に発現され、細胞内区画を標的化するように、種子貯蔵タンパク質の天然調節エレメントは、標的化配列及びレグヘモグロビンコード配列の発現に向かせる。標的化配列は、任意選択で他の挿入、又は欠失又は置換を伴って、天然レグヘモグロビン遺伝子中に挿入されることができ、それにより、レグヘモグロビンが輸送ペプチドと共にその天然遺伝子座からダイズ種子中で発現され、細胞内区画を標的化する。一実施形態では、色素体標的化配列がコード配列又は着目したポリペプチドのN’末端で含まれる。色素体標的化配列の一例は、配列番号31の1位~165位のヌクレオチド配列によってコードされ、配列番号32の1位~55位での対応するペプチド標的化配列を伴うものなどの、Rubisco SSUSP色素体標的化配列である。レグヘモグロビンコード配列は、配列番号31の166位~603位に由来し、対応するペプチドは、配列番号32の56位~200位に由来する。
いくつかの実施形態では、ダイズ種子が提供され、このダイズ種子は、(i)ゲノムに挿入された組換え構築物、(ii)レグヘモグロビンコード配列が、本明細書に記載されるような種子貯蔵タンパク質コード配列の全部又は一部に置き換わるゲノム改変、(iii)天然レグヘモグロビン遺伝子が、レグヘモグロビン遺伝子の調節領域又はコード配列中などへの挿入、欠失、又は置換のうちの1つ以上を含むように改変されるゲノム改変、並びに(iv)色素体ゲノムがレグヘモグロビンコード配列を発現するように改変されている色素体ゲノム改変のうちの2つ以上に由来するなどの、2つ以上の供給源、構築物又はゲノム位置に由来するレグヘモグロビンを発現する。いくつかの実施形態では、2つ以上の供給源は、レグヘモグロビンコード配列が、本明細書に記載されるような色素体標的化配列などの細胞内標的化配列に作動可能に連結されている少なくとも1つの供給源、及びレグヘモグロビンコード配列が細胞内標的化配列に作動可能に連結されていない別の供給源を含む。
ある特定の実施形態では、レグヘモグロビン及び任意選択で本明細書に記載されるような他の改変を含むダイズ種子は、ダイズ種子中のレグヘモグロビン複合体の量を増加させるための改変を更に含むことができる。レグヘモグロビン複合体を増加させるための改変は、グルタミル-tRNAレダクターゼ、グルタメート-1-セミアルデヒド2,1-アミノムターゼ、アミノレブリン酸デヒドラターゼ(HEMB1)、ヒドロキシメチルビランシンターゼ(HEMC)、ウロホルフィリノーゲンIIIシンターゼ、ウロホルフィリノーゲンデカルボキシラーゼ、コポルフィリノーゲンIIIオキシダーゼ(HEMF、CPOX)、プロトポルフィリノーゲンオキシダーゼ(PPOX)、及び/又はフェロケラターゼ(ferrochelatase)のうちの1つ以上の改変された発現を含むことができる。改変は、組換え構築物の植物のゲノム中への導入を含むことができ、又は改変は遺伝子編集改変、例えば、これらの遺伝子のコード配列の転写を増強させるために、これらのペプチドが発現される遺伝子への挿入、欠失、及び/又は置換などを含むことができる。
いくつかの実施形態では、ダイズ植物、細胞及び種子は、ヘム生成又はレグヘモグロビンのヘム化に寄与するホウ素の酵素の発現又は活性を調整する調節タンパク質をコードする遺伝子中の改変を含む。例えば、グルタミル-tRNAレダクターゼ活性を調節するタンパク質をコードするダイズ遺伝子は、グルタミル-tRNAレダクターゼ結合タンパク質(Glyma.08G222600)、葉緑体シグナル粒子43(Glyma.11G097200)並びにFLUORESCENT IN BLUE LIGHT(Glyma.16G010200及びGlyma.07G041700)を含み、ダイズ中のヘム及び/又はレグヘモグロビン複合体の形成を増加若しくは増強させるために、例えば、挿入、欠失、又は置換によって改変され得る。
ある特定の実施形態では、ダイズ種子は、種子貯蔵タンパク質をコードする天然遺伝子中に挿入され、天然種子貯蔵コード配列の全部又は一部に置き換わるレグヘモグロビンコード配列を含有するように編集される。ゲノム中のその天然位置において、天然プロモーターに作動可能に連結された外因性核酸コード配列を含むそのような編集された構築物は、組換え構築物とは見なされず、なぜならプロモーター及び他の調節エレメントがそれらの天然環境に対して外因性ではないためである。例えば、編集されたゲノムでは、遺伝子構造はほぼ変更されないままであることができ、天然種子貯蔵タンパク質コード配列は、異なるコード配列によって、例えば、レグヘモグロビンなどのグロブリンタンパク質で置き換えられている状態である。そのような植物、種子及び細胞は、改変若しくは編集された植物、種子又は細胞と称されてもよい。
1つ以上の好適な貯蔵タンパク質コード配列は、例えば、グリシニン、コングリシニン、2Sアルブミン、クニッツトリプシンインヒビター(KTI)、ボーマン・バークインヒビター(BBI)、又はそれらの組合せをコードする配列を含むレグヘモグロビンコード配列などのグロブリンコード配列で、本明細書に記載される方法を使用して置き換えることができる。
クニッツトリプシンインヒビター(KTI)及びボーマン・バークインヒビター(BBI)活性は、クニッツトリプシンインヒビター(KTI)又はボーマン・バークインヒビター(BBI)コード配列の発現を低減若しくは防止するための改変を有していない野生型、ヌル又は対照のダイズ中で見出される活性の50%、40%、30%、20%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.4%、0.3%、0.2%、又は0.1%未満まで低減され得る。
本明細書で使用される場合、特定の核酸に関する「コードする」、「コードされた」などは、特定のタンパク質への翻訳に関する情報を含むことを意味する。タンパク質をコードする核酸は、核酸の翻訳領域内に非翻訳配列(例えば、イントロン)を含んでもよく、或いはそのような介在非翻訳配列を含まなくてもよい(例えば、cDNAにおけるように)。タンパク質がコードされる情報は、コドンの使用によって特定される。典型的には、アミノ酸配列は、「普遍的」遺伝子コードを使用して核酸によってコードされる。しかしながら、一部の植物、動物及び真菌のミトコンドリア、細菌のマイコプラズマ・カプリコルム(Mycoplasma capricolum)(Yamao,et al.,(1985)Proc.Natl.Acad.Sci.USA 82:2306-9)又は繊毛虫の大核中に存在するような、普遍的コードの多様体が、核酸がこれらの生物体を用いて発現される場合に使用されてもよい。
核酸が合成的に調製又は変更される場合、核酸が発現されることになる意図された宿主の既知のコドン選好をうまく利用することができる。例えば、本明細書に開示される核酸配列は、単子葉植物種及び双子葉植物種の両方で発現され得るが、配列は、単子葉植物又は双子葉植物の特定のコドン選好及びGC含量選好を考慮して改変することができ、これは、これらの選好が異なることが示されているためである(Murray,et al.,(1989)Nucleic Acids Res.17:477-98)。
本明細書で使用される場合、「ポリヌクレオチド」には、デオキシリボポリヌクレオチド、リボポリヌクレオチド、又はそれらがストリンジェントなハイブリダイゼーション条件下で、天然に存在するヌクレオチドと実質的に同じヌクレオチド配列にハイブリダイズし、及び/又は天然に存在するヌクレオチドと同じアミノ酸への翻訳を可能にするという点で、天然リボヌクレオチドの本質的な性質を有するそれらの類似体への言及が含まれる。ポリヌクレオチドは、構造遺伝子又は調節遺伝子の完全長若しくは部分配列であり得る。別段の指示がない限り、本用語には、特定の配列並びにその相補的配列への言及が含まれる。したがって、安定性のために、又は他の理由で改変された骨格を有するDNA又はRNAは、用語が本明細書で意図しているような、「ポリヌクレオチド」である。更に、ほんの2つの例を挙げると、イノシンなどの通常ではない塩基、又はトリチル化塩基などの改変された塩基を含むDNA又はRNAは、用語が本明細書で使用されているようなポリヌクレオチドである。当業者に既知の多くの有用な目的を果たす様々な改変が、DNA及びRNAになされていることが理解されよう。本明細書で使用されるポリヌクレオチドという用語は、ポリヌクレオチドの化学的、酵素的、又は代謝的に改変された形態、並びにとりわけ単純な細胞及び複雑な細胞を含む、ウイルス及び細胞に特徴的なDNA及びRNAの化学的形態を包含する。
用語「ポリペプチド」、「ペプチド」及び「タンパク質」は、本明細書では互換的に使用され、アミノ酸残基からなるポリマーを指す。この用語は、1つ以上のアミノ酸残基が対応する天然アミノ酸の人工的な化学的類似物であるアミノ酸ポリマー、及び天然のアミノ酸ポリマーに適用される。
本明細書で使用される場合、2つの核酸又はポリペプチド配列と関連する「配列同一性」又は「同一性」は、特定の比較ウィンドウに最大の対応でアラインしたときに同じである2つの配列の残基への言及を含む。配列同一性のパーセンテージをタンパク質に関して使用する場合、同一でない残基位置が、しばしば保存的アミノ酸置換により異なることが認識される。ここで、アミノ酸残基は、類似の化学特性(例えば、電荷又は疎水性)を有する他のアミノ酸残基で置換され、それゆえ、分子の機能特性が変化しない。配列が保存的置換で異なる場合、同一性のパーセントが使用され得る。そのような保存的置換により異なる配列は、「配列類似性」又は「類似性」を有するといわれる。この調整を行う手段は、当業者にはよく知られている。一般的には、これには、保存的置換を、完全ミスマッチとしてではなく部分的ミスマッチとして採点し、それにより、配列同一性パーセントを高める方法が含まれる。したがって、例えば、同一のアミノ酸に1点を与え、非保存的置換に0点を与える場合、保存的置換に0~1点を与える。保存的置換の採点が、例えば、Meyers and Miller,(1988)Computer Applic.Biol.Sci.4:11-17のアルゴリズムに従って、例えば、プログラムPC/GENE(Intelligenetics,Mountain View,California,USA)において実施されるように計算される。
本明細書で使用される場合、「配列同一性のパーセンテージ」は、比較ウィンドウに最適にアラインされた2つの配列を比較することにより決定される値を意味し、ここで、比較ウィンドウにおけるポリヌクレオチド配列の部分は、2つの配列の最適なアライメントについて、参照配列(これは、付加も欠失も含まない)と比較した場合に、付加又は欠失(すなわち、ギャップ)を含み得る。パーセンテージは、双方の配列内で同一の核酸塩基又はアミノ酸残基が生じる位置の数を求めて、マッチした位置の数を得て、マッチした位置の数を、比較ウィンドウ内の位置の総数で除して、その結果に100を乗じて配列同一性のパーセンテージを得ることによって、算出される。
配列番号1~48のいずれか1つのポリペプチド及びポリヌクレオチドに対して、又は本明細書に開示されるような配列番号1~48のいずれか1つの定義された位置内で指定された配列に対して、少なくとも50%、55%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、若しくは99.9%、又は少なくとも約50%、55%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、若しくは99.9%、且つ100%、99%、95%、又は90%未満の同一性を有するポリヌクレオチド及びポリペプチド配列が提供される。
本明細書で使用される場合、「参照配列」は、配列比較の基準として使用される規定の配列である。参照配列は、特定の配列のサブセット又はその全体、例えば、全長cDNA又は遺伝子配列の断片、或いは完全なcDNA又は遺伝子配列であり得る。
本明細書で使用される場合、「比較ウィンドウ」は、ポリヌクレオチド配列の連続した特定の断片をいい、ここで、ポリペプチド配列は参照配列と比較することができ、比較ウィンドウにおけるポリヌクレオチド配列の一部は、2つの配列の最適なアライメントのために、参照配列(これは付加も欠失も含まない)と比較して、付加又は欠失(すなわち、ギャップ)を含み得る。一般に、比較ウィンドウは、少なくとも20の連続したヌクレオチド長であり、必要に応じて、30、40、50、100又はそれ以上であり得る。当業者であれば、ポリヌクレオチド配列にギャップを含むことによって、参照配列に対し高い類似性を有することを避けるために、通常、ギャップペナルティが導入され、マッチ数から差し引かれることを理解している。
比較のためのヌクレオチド及びアミノ酸配列のアライメント方法は、当該技術分野においてよく知られている。Smith and Waterman,(1981)Adv.Appl.Math 2:482のローカルホモロジーアルゴリズム(BSTFIT)を、Needleman and Wunsch,(1970)J.Mol.Biol.48:443-53のホモロジーアライメントアルゴリズム(GAP)によって;Pearson and Lipman,(1988)Proc.Natl.Acad.Sci.USA 85:2444の類似性検索法(Tfasta及びFasta)によって;限定されないが:Intelligenetics,Mountain View,CaliforniaによるPC/GeneプログラムにおけるCLUSTAL、Wisconsin Genetics Software Package(登録商標),Version 8におけるGAP、BESTFIT、BLAST、FASTA及びTFASTA(Genetics Computer Groupから入手可能(GCG(登録商標)プログラム(Accelrys,Inc.,San Diego,CA))が挙げられるこれらのアルゴリズムのコンピュータによる実行によって、比較のための配列の最適なアライメントを実行することができる。CLUSTALプログラムは、Higgins and Sharp,(1988)Gene 73:23744、Higgins and Sharp,(1989)CABIOS 5:1513、Corpet,et al.,(1988)Nucleic Acids Res.16:10881-90、Huang,et al.,(1992)Computer Applications in the Biosciences 8:155-65、及びPearson,et al.,(1994)Meth.Mol.Biol.24:307-31によって十分に説明されている。複数の配列の最適なグローバルアライメントで使用するための好ましいプログラムは、PileUpである(Feng and Doolittle,(1987)J.Mol.Evol.,25:351-60、これはHiggins and Sharp,(1989)CABIOS 5:151-53によって記載された方法と同様であり、参照により本明細書に組み込まれる)。データベースの類似性検索のために使用することができるプログラムのBLASTファミリーには:ヌクレオチドデータベース配列に対するヌクレオチドクエリー配列のためのBLASTN;タンパク質データベース配列に対するヌクレオチドクエリー配列のためのBLASTX;タンパク質データベース配列に対するタンパク質クエリー配列のためのBLASTP;ヌクレオチドデータベース配列に対するタンパク質クエリー配列のためのTBLASTN;及びヌクレオチドデータベース配列に対するヌクレオチドクエリー配列のためのTBLASTXが挙げられる。Current Protocols in Molecular Biology,Chapter 19,Ausubel,et al.,eds.,Greene Publishing and Wiley-Interscience,New York(1995)を参照されたい。
GAPは、Needleman及びWunschのアルゴリズム(前出)を使用して、マッチ数を最大化しギャップ数を最小化する2つの完全な配列のアライメントを見出す。GAPは全ての可能なアライメントを考慮し、マッチした塩基の最大数と最小のギャップ数を有するアライメント作製する。これにより、マッチした塩基の単位におけるギャップクリエーションペナルティ及びギャップ伸長ペナルティの提示が可能になる。GAPは、挿入される各ギャップにマッチするギャップクリエーションペナルティ数を得る必要がある。ゼロより大きいギャップ伸長ペナルティを選択するなら、GAPは更に、挿入される各ギャップに対し、ギャップ伸長ペナルティのギャップ倍長の長さを得る必要がある。Wisconsin Genetics Software Package(登録商標)のVersion 10におけるデフォルトのギャップクリエーションペナルティ値及びギャップ伸長ペナルティ値は、それぞれ8及び2である。ギャップクリエーションペナルティ及びギャップ伸長ペナルティは、0~100からなる整数の群から選択される整数で表すことができる。したがって、例えば、ギャップクリエーションペナルティ及びギャップ伸長ペナルティは、0、1、2、3、4、5、6、7、8、9、10、15、20、30、40、50又はそれ以上であり得る。
GAPは、最良のアライメントファミリーの1メンバーを示す。このファミリーには多くのメンバーが存在し得るが、より良好なクオリティを有するメンバーは他に存在しない。GAPは、アライメントのための4つの性能指数を表示する:クオリティ、率(Ratio)、同一性及び類似性。クオリティは、配列をアラインするために最大化された量である。率(Ratio)は、クオリティを短い断片中の塩基数で除したものである。パーセント同一性は、実際に一致している記号のパーセントである。類似性パーセントは、類似している記号のパーセントである。ギャップに向かい合っている記号は無視する。1対の記号のスコアリングマトリクス値が類似性閾値の0.50より大きいか又は等しいとき、類似性のスコアが付けられる。Wisconsin Genetics Software Package(登録商標)のVersion 10において使用されるスコアリングマトリクスは、BLOSUM62である(Henikoff and Henikoff,(1989)Proc.Natl.Acad.Sci.USA 89:10915を参照されたい)。
特に明記しない限り、本明細書で提供される配列同一性/類似性値は、デフォルトパラメータを使用するBLAST 2.0プログラムのスウィートを使用して得られる値を指す(Altschul,et al.,(1997)Nucleic Acids Res.25:3389-402)。
本明細書に記載されるレグヘモグロビン配列及び組換え構築物は、着目した植物又は着目した生物における発現のために提供され得る。カセットは、レグヘモグロビンポリヌクレオチド又は改変されたレグヘモグロビンポリヌクレオチドに作動可能に連結された5’及び3’調節配列を含み得る。「作動可能に連結された」は、2つ以上のエレメント間の機能的連結を意味するように意図する。例えば、着目したポリヌクレオチドと調節配列(例えば、プロモーター)との間の作動可能な連結は、着目したポリヌクレオチドの発現を可能にする機能的連結である。作動可能に連結したエレメントは、隣接していても隣接していなくてもよい。2つのタンパク質コード領域の連結を指すために使用する場合、作動可能に連結されるとは、コード領域が同じリーディングフレームにあることが意図されている。カセットは、加えて、生物に同時形質転換しようとする少なくとも1つの追加的な遺伝子を含有し得る。或いは、追加の遺伝子を、複数の発現カセットに供してもよい。そのような発現カセットには、調節領域の転写調節下に改変されたグリシニンポリヌクレオチドを挿入するための複数の制限部位、及び/又は認識部位が提供される。発現カセットは、選択マーカー遺伝子を含有することができる。
発現カセットは、転写の5’-3’方向に、植物内で機能する、転写及び翻訳開始領域(例えば、プロモーター)、本明細書に記載される改変されたレグヘモグロビンポリヌクレオチド、並びに転写及び翻訳終止領域(例えば、終止領域)を含むことができる。調節領域(例えば、プロモーター、転写調節領域、及び翻訳終止領域)、及び/又は改変されたレグヘモグロビンポリヌクレオチドは、宿主細胞に対し、又は相互に天然/類似であり得る。或いは、調節領域及び/又は改変されたレグヘモグロビンポリヌクレオチドは、宿主細胞に対し、又は相互に異種であり得る。
本明細書で使用される場合、配列に関連した「異種の」は、外来種を起源とする配列であるか、又は同一種からのものであれば、組成及び/又はゲノム遺伝子座が意図的な人的介入によって天然の形態から変化した配列である。例えば、異種ポリヌクレオチドに作動に可能に連結したプロモーターは、そのポリヌクレオチドが由来する種と異なる種からのものであるか、又は、同一/類似種からのものであれば、一方若しくは両方が元の形態及び/若しくはゲノム遺伝子座から実質的に改変されており、或いは、プロモーターが、作動可能に連結されているポリヌクレオチドに対し天然のプロモーターではない。
終止領域は、転写開始領域と、植物宿主と天然であってもよく、又はプロモーター、改変されたグリシニンポリヌクレオチド、植物宿主、又はそれらの任意の組合せとは別の供給源に由来してもよい(すなわち、外来性又は異種)。
発現カセットは更に、5’リーダー配列を含むことができる。そのようなリーダー配列は、翻訳を強化するように働き得る。翻訳リーダーは、当該技術分野で知られており、ウイルス翻訳リーダー配列が挙げられる。
発現カセットの調製には、各種DNA断片が、適当な配向で、必要ならば、適当なリーディングフレームにおけるDNA配列を提供するように操作され得る。この終わり近くに、アダプター又はリンカーがDNA断片の結合に使用され得、或いは、適当な制限酵素認識部位、不要なDNAの除去、制限酵素認識部位の除去などを提供するための他の操作が行われ得る。この目的のために、インビトロの変異誘発、プライマー修復、制限、アニーリング、再置換、例えば、移行及びトランスバージョンを関与させてもよい。
本明細書で使用される「プロモーター」は、転写開始点の上流のDNA領域を指し、RNAポリメラーゼ、及び転写を開始する他のタンパク質の認識及び結合に関与している。「植物プロモーター」は、植物細胞において転写を開始することができるプロモーターである。植物プロモーターの例としては、限定はされないが、植物、植物ウイルス、並びにアグロバクテリウム属(Agrobacterium)又はリゾビウム属(Rhizobium)のような植物細胞で発現する遺伝子を含む細菌から得られるものが挙げられる。ある特定のタイプのプロモーターは、葉、根、種子、繊維、木部導管、仮道管又は厚壁組織などのある特定の組織において、転写を優先して開始させる。そのようなプロモーターは「組織優先的」と呼ばれる。「細胞型」特異的プロモーターは、1種以上の器官の特定の細胞型、例えば根又は葉の血管細胞における発現を主に駆動する。「誘導性」又は「調節可能な」プロモーターは、環境制御下にあるプロモーターである。誘導性プロモーターによる転写に影響を及ぼし得る環境条件の例として、嫌気的条件、又は光の存在が挙げられる。別のタイプのプロモーターは、発現制御されたプロモーターであり、例えば、花粉の発育中に発現を駆動するプロモーターである。組織優先的プロモーター、細胞型特異的プロモーター、発現制御されたプロモーター、及び誘導性プロモーターは、「非構成的」プロモーター類を構成する。「構成的」プロモーターは、ほとんどの環境条件下で活性を有するプロモーターである。構成的プロモーターとしては、例えば、Rsyn7プロモーターのコアプロモーター、並びに国際公開第99/43838号パンフレット及び米国特許第6,072,050号明細書に開示の他の構成的プロモーター;コアCaMV 35Sプロモーター(Odell et al.(1985)Nature 313:810-812);コメアクチン(McElroy et al.(1990)Plant Cell 2:163-171);ユビキチン(Christensen et al.(1989)Plant Mol.Biol.12:619-632及びChristensen et al.(1992)Plant Mol.Biol.18:675-689);pEMU(Last et al.(1991)Theor.Appl.Genet.81:581-588);MAS(Velten et al.(1984)EMBO J.3:2723-2730);ALSプロモーター(米国特許第5,659,026号明細書)などが挙げられる。他の構成プロモーターには、例えば、米国特許第5,608,149号明細書、同第5,608,144号明細書、同第5,604,121号明細書、同第5,569,597号明細書、同第5,466,785号明細書、同第5,399,680号明細書、同第5,268,463号明細書、同第5,608,142号明細書及び同第6,177,611号明細書が挙げられる。
1つ以上の異種調節エレメントの組合せを含む合成プロモーターも企図される。
プロモーターは、当該技術分野において既知の任意のタイプ又は部類のプロモーターであることができ、それによって着目したポリヌクレオチド配列の天然プロモーターを含む多数のプロモーターのいずれか1つを使用して、本明細書に開示される様々な改変されたレグヘモグロビン配列を発現させることができる。本明細書に開示される組換えDNA構築物で使用するためのプロモーターは、望んでいる結果に基づいて選択することができる。
ある特定の実施形態では、本明細書に記載される組換えDNA構築物は、植物又は種子中で発現される。ある特定の実施形態では、植物又は種子は、ダイズ植物又はダイズ種子である。本明細書で使用される場合、用語「縮物」は、植物プロトプラスト、そこから植物が再生できる植物細胞組織培養物、植物カルス、植物塊、及び植物又は植物部分の中で損傷を受けていない、胚、花粉、胚珠、種子、葉、花、枝、果実、穀粒、穂、穂軸、莢、柄、根、根端、葯などの植物細胞が含まれる。穀粒は、それらの種の栽培又は繁殖と異なる目的で栽培業者が生産する成熟種子を意味するものである。再生植物の子孫、多様体及び変異体もまた、それらの一部が導入遺伝子を含むなら、本開示に含まれる。
ある特定の実施形態では、ダイズ植物又はダイズ種子は、対照種子(例えば、少なくとも1つの改変を含まない種子)と比較して、種子中の総プロテインを増加させる少なくとも1つの追加の改変を更に含む。ある特定の実施形態では、少なくとも1つの改変を含むダイズ種子は、対照種子と比較して、少なくとも約1%、1.5%、2%、2.5%、3%、3.5%、4%、5%、10%、又は15%、且つ20%、15%、10%、9%、8%、7%、6%、又は5%未満の乾燥重量に基づいて測定された総タンパク質におけるパーセントポイント増加を含む。
ある特定の実施形態では、ダイズ植物又はダイズ種子は、種子中のラフィノースファミリーオリゴ糖(RFO)含量を減少させる少なくとも1つの追加の改変を更に含む。ある特定の実施形態では、この改変は、ラフィノースシンターゼの発現及び/又は活性における減少を含む。ある特定の実施形態では、この改変は、ラフィノースシンターゼ2(RS2)且つ/又はラフィノースシンターゼ4(RS4)の発現、及び/又は活性における減少を含む。ある特定の実施形態では、ダイズ種子は、対照種子と比較して、少なくとも35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、又は99%のRS2、RS4、又はRS2及びRS4の発現における減少を含む。ある特定の実施形態では、種子は、乾燥重量に基づいて、約6%、5.5%、5%、4.5%、4%、3.5%、3%、2.5%、2%、1.5%、1%、又は0.5%未満のRFO含有量を含む。ある特定の実施形態では、導入された改変は、対照種子と比較して、RFO含有量を、少なくとも約1%、1.5%、2%、2.5%、3%、3.5%、4%、5%、10%、又は15%、且つ20%、15%、10%、9%、8%、7%、6%、又は5%未満の乾燥重量に基づいて測定された総タンパク質におけるパーセントポイント増加だけ減少させる。
ある特定の実施形態では、ダイズ植物又はダイズ種子は、種子中のオレイン酸の量を増加させる、種子中のリノレン酸の量を減少させる、種子タンパク質の量を増加させる、又はそれらの組合せの少なくとも1つの追加の改変を更に含む。例えば、改変は、FAD2-1A、FAD2-1B、FAD3a、FAD3b遺伝子内にあり得る。
ある特定の実施形態では、ダイズ植物又はダイズ種子は、総タンパク質の量を増加させる少なくとも1つの追加の改変を更に含み、これは、例えば、(i)CCTドメイン含有タンパク質、(ii)レティキュロン、(iii)トレハロースリン酸シンターゼ、(iv)HECTユビキチンリガーゼ(HEL又はUPL3)、(v)MFT(mother of flowering)ポリペプチド、(vi)米国特許第5,710,365号明細書、同第8728726号明細書、及び同第10,081,814号明細書(これらの各々は、その全体が参照により本明細書に組み込まれる)に開示されるような、ラフィノースシンターゼRS2、RS3、又はRS4、若しくは(vii)これらの任意の組合せをコードする遺伝子のうちの1つ以上の改変による。
例えば、レグヘモグロビンを本明細書に開示される量で含み、処理されて油及びミールを生成することができるダイズ種子、及びこれから生成される油が提供され、このダイズ及び/又は油は、総脂肪酸の少なくとも50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、若しくは90重量パーセント、又は少なくとも約50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、若しくは90重量パーセントのオレイン(C18:1)酸、且つ総脂肪酸の100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、76、75、74、73、72、71、若しくは70重量パーセント未満、又は約100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、76、75、74、73、72、71、若しくは70重量パーセント未満のオレイン酸を有する。
例えば、レグヘモグロビンを本明細書に開示される量で(本明細書に開示される量で)含み、処理されて油を生成することができるダイズ種子、及びこれから生成される油が提供され、このダイズ及び/又は油は、総脂肪酸の少なくとも0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、若しくは3.0重量パーセント、又は少なくとも約0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、若しくは3.0重量パーセントのリノレン(C18:3)酸、且つ総脂肪酸の6、5.5、5、4.5、4、3.9、3.8、3.7、3.6、3.5、3.4、3.3、3.2、3.1、3.0、2.9、2.8、2.7、2.6、2.5、2.4、2.3、2.2、2.1、若しくは2.0重量パーセント未満、又は約6、5.5、5、4.5、4、3.9、3.8、3.7、3.6、3.5、3.4、3.3、3.2、3.1、3.0、2.9、2.8、2.7、2.6、2.5、2.4、2.3、2.2、2.1、若しくは2.0重量パーセント未満のリノレン酸を有する。
例えば、レグヘモグロビンを本明細書に開示される量で含み、13%の水分で測定されるか、又は13%の水分に調整される場合、総種子重量の少なくとも35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、若しくは55%、又は少なくとも約35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、若しくは55%、且つ総種子重量の65%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、若しくは50%未満、又は約65%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、若しくは50%未満のタンパク質含有量を有するダイズ種子が提供される。
例えば、レグヘモグロビンを本明細書に開示される量で含み、13%の水分で測定されるか、又は13%の水分に調整される場合、総種子重量の4%、3.5%、3%、2.5%、2%、1.5%、1%、0.5%、0.4%、0.3%、0.2%、若しくは0.1%未満、又は約4%、3.5%、3%、2.5%、2%、1.5%、1%、0.5%、0.4%、0.3%、0.2%、若しくは0.1%未満、且つ総種子重量の少なくとも0%、0.01%、0.05%、0.06%、0.07%、0.08%、若しくは0.09%、又は少なくとも約0%、0.01%、0.05%、0.06%、0.07%、0.08%、若しくは0.09%のスタキオース含有量を有するダイズ種子が提供される。
例えば、レグヘモグロビンを本明細書に開示される量で含み、13%の水分で測定されるか、又は13%の水分に調整される場合、総種子重量の2%、1.5%、1.4%、1.3%、1.2%、1.1%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%、若しくは0.1%未満、又は約2%、1.5%、1.4%、1.3%、1.2%、1.1%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%、若しくは0.1%未満、且つ総種子重量の少なくとも0%、0.01%、0.05%、0.06%、0.07%、0.08%、若しくは0.09%、又は少なくとも約0%、0.01%、0.05%、0.06%、0.07%、0.08%、若しくは0.09%のラフィノース含有量を有するダイズ種子が提供される。
本明細書で使用される場合、「ダイズタンパク質組成物」は、ダイズタンパク質を含有するヒト又は動物用の食物成分を指す。ある特定の実施形態では、組成物は、ヒト食物組成物である。ある特定の実施形態では、ヒト食物組成物は、ダイズミール、ダイズ粉、脱脂ダイズ粉、豆乳、スプレードライ豆乳、ダイズタンパク質濃縮物、組織化されたダイズタンパク質濃縮物、加水分解ダイズタンパク質、ダイズタンパク質単離物、高野豆腐、ダイズミートアナログ、ダイズチーズアナログ、及びダイズコーヒー用クリームからなる群から選択される組成物である。
いくつかの実施形態では、総タンパク質の重量で少なくとも0.1%、0.2%、0.3%、0.4%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%若しくは10%且つ25%、20%、15%、10%、9%、8%、7%、6%、5%、4%、3%、2%若しくは1%未満のレグヘモグロビンを含むダイズ単離物又はダイズタンパク質が提供され、レグヘモグロビンの少なくとも約25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、80%、85%、90%若しくは95%且つ99.9%、99%、98%、97%、96%、95%、90%、85%、80%、若しくは75%未満が、鉄基でヘム化されている。
ある特定の実施形態では、本明細書に記載されるようなレグヘモグロビンを含む種子を生産する植物は、対照種子と比較して、少なくとも約10%、15%、20%、25%、30%、35%、40%、50%、60%、70%、80%、90%、100%、若しくは500%且つ約1000%、500%、100%、90%、80%、70%、60%、若しくは50%の1つ以上の必須アミノ酸の量における増加を含む。
本明細書で使用される場合、「パーセント増加」は、対照値の割合で表された変化又は差を指し、例えば、{[改変された/トランスジェニック/試験値(%)-対照値(%)]/対照値(%)}×100%=パーセント変化であるか、又は{[第1の場所で得られた値(%)-第2の場所で得られた値(%)]/第2の場所で得られた値(%)}×100=パーセント変化である。
ある特定の実施形態では、1つ以上の必須アミノ酸は、メチオニン、シスチン、トリプトファン、スレオニン、及びリジンのうちの1つ以上、又はそれらの組合せである。
ある特定の実施形態では、対照種子(例えば、少なくとも1つの改変を含まない種子)と比較して、種子中の総タンパク質を増加させる少なくとも1つの追加の改変を更に含む方法、植物及び種子が提供される。ある特定の実施形態では、導入された改変は、対照種子と比較して、レグヘモグロビンを含むダイズ種子中のタンパク質含有量を、少なくとも約1%、1.5%、2%、2.5%、3%、3.5%、4%、5%、10%、若しくは15%且つ20%、15%、10%、9%、8%、7%、6%、若しくは5%未満の乾燥重量に基づいて測定された総タンパク質におけるパーセントポイント増加まで増加させる。
ある特定の実施形態では、方法は、種子中のラフィノースファミリーオリゴ糖(RFO)含有量を減少させる少なくとも1つの改変を導入することを更に含む。ある特定の実施形態では、この改変は、ラフィノースシンターゼの発現及び/又は活性における減少を含む。ある特定の実施形態では、この改変は、ラフィノースシンターゼ2(RS2)且つ/又はラフィノースシンターゼ4(RS4)の発現、及び/又は活性における減少を含む。ある特定の実施形態では、ダイズ種子は、対照種子と比較して、少なくとも35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、又は99%のRS2、RS4、又はRS2及びRS4の発現における減少を含む。ある特定の実施形態では、種子は、乾燥重量に基づいて、約6%、5.5%、5%、4.5%、4%、3.5%、3%、2.5%、2%、1.5%、1%、又は0.5%未満のRFO含有量を含む。ある特定の実施形態では、導入された改変は、対照種子と比較して、RFO含有量を、少なくとも約1%、1.5%、2%、2.5%、3%、3.5%、4%、5%、10%、若しくは15%且つ20%、15%、10%、9%、8%、7%、6%、若しくは5%未満の乾燥重量に基づいて測定された総タンパク質におけるパーセントポイント増加まで減少させる。
ある特定の実施形態では、本方法は:(a)ガイドRNA、少なくとも1つのポリヌクレオチド改変テンプレート、及び少なくとも1つのCasエンドヌクレアーゼを植物細胞に提供することであって、少なくとも1つのCasエンドヌクレアーゼが、植物細胞中で改変されることになるエンドヌクレアーゼ遺伝子において二本鎖切断を導入し、ポリヌクレオチド改変テンプレートが、本明細書に記載されるポリぺプチドのいずれかをコードする改変遺伝子を生成する、提供することと、(b)植物細胞から植物を得ることと、(c)子孫植物を生成することと、を含む。
天然に存在するポリヌクレオチド又は調節エレメント、コード配列、及び非コード配列を含む組み込まれたトランスジェニック配列を改変するための方法及び組成物が本明細書に提供される。これらの方法及び組成物はまた、核酸をゲノム中の予め操作された標的認識配列に標的化させるのに有用である。ポリヌクレオチドの改変は、例えば、一本鎖切断又は二本鎖切断をDNA分子に導入することによって達成されてもよい。
ある特定の実施形態では、本方法は:(a)ガイドRNA、少なくとも1つのポリヌクレオチド改変テンプレート、及び少なくとも1つのCasエンドヌクレアーゼを植物細胞に提供することであって、少なくとも1つのCasエンドヌクレアーゼが、植物細胞中で改変されることになるエンドヌクレアーゼ遺伝子において二本鎖切断を導入し、ポリヌクレオチド改変テンプレートが、本明細書に記載されるポリぺプチドのいずれかをコードする改変遺伝子を生成する、提供することと、(b)植物細胞から植物を得ることと、(c)子孫植物を生成することと、を含む。
ポリヌクレオチド鎖内のホスホジエステル結合を切断するエンドヌクレアーゼなどの二本鎖切断誘導剤によって誘導された二本鎖切断は、非相同末端結合経路、及び相同組換えを含むDNA修復機構の誘導をもたらし得る。エンドヌクレアーゼは、制限エンドヌクレアーゼ(例えば、Roberts et al.,(2003)Nucleic Acids Res 1:418-20)、Roberts et al.,(2003)Nucleic Acids Res 31:1805-12、及びBelfort et al.,(2002)in Mobile DNA II,pp.761-783,Eds.Craigie et al.,(ASM Press,Washington,DC)を参照されたい)、メガヌクレアーゼ(例えば、国際公開第2009/114321号パンフレット;Gao et al.(2010)Plant Journal 1:176-187を参照されたい)、TALエフェクターヌクレアーゼ又はTALEN(例えば、米国特許出願公開第20110145940号パンフレット、Christian,M.,T.Cermak,et al.2010.Targeting DNA double-strand breaks with TAL effector nucleases.Genetics 186(2):757-61及びBoch et al.,(2009),Science 326(5959):1509-12を参照されたい)、ジンクフィンガーヌクレアーゼ(例えば、Kim,Y.G.,J.Cha,et al.(1996).“Hybrid restriction enzymes:zinc finger fusions to FokI cleavage”を参照されたい)、並びにCRISPR-Casエンドヌクレアーゼ(例えば、2007年3月1日公開の国際公開第2007/025097号パンフレットの出願を参照されたい)を含む様々な範囲の酵素を含む。
二本鎖切断がゲノム内に導入されると、細胞のDNA修復機構は、切断を修復するように活性化される。2つのDNA修復経路がある。一方は、非相同末端結合(NHEJ)経路と称されるものであり(Bleuyard et al.,(2006)DNA Repair 5:1-12)、他方は、相同組換え修復(HDR)である。染色体の構造的完全性は、典型的には、NHEJにより維持されるが、欠失、挿入又は他の再配列(染色体転座など)もあり得る(Siebert and Puchta,2002,Plant Cell 14:1121-31;Pacher et al.,2007,Genetics 175:21-9)。HDR経路は、二本鎖DNA切断を修復するための別の細胞の機構であり、相同組換え(HR)及び一本鎖アニーリング(SSA)を含む(Lieber.2010 Annu.Rev.Biochem.79:181-211)。
二本鎖切断誘導剤に加えて、部位特異的塩基変換もまた、ゲノム中への本明細書に記載される1つ以上の改変を作製するために、1つ以上のヌクレオチド変化を操作することを達成することができる。これらには、例えば、C・GからT・Aへの、又はA・TからG・Cへの塩基編集デアミナーゼ酵素によって媒介される部位特異的塩基編集が含まれる(Gaudelli et al.,Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage.”Nature(2017);Nishida et al.“Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems.”Science 353(6305)(2016);Komor et al.“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage.”Nature 533(7603)(2016):420-4。
本明細書に記載される方法では、内因性遺伝子は、CRISPR関連(Cas)エンドヌクレアーゼ、Zn-フィンガーヌクレアーゼ媒介系、メガヌクレアーゼ媒介系、オリゴヌクレオベース媒介系、又は当業者に既知のあらゆる遺伝子改変系によって改変され得る。
ある特定の実施形態では、内因性遺伝子は、CRISPR関連(Cas)エンドヌクレアーゼによって改変される。
クラスICasエンドヌクレアーゼは、マルチサブユニットエフェクター複合体(タイプI、III、及びIV)を含み、一方、クラス2系は、単一のタンパク質エフェクター(II、V、及びVI)を含む(Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15;Zetsche et al.,2015,Cell 163,1-13;Shmakov et al.,2015,Molecular Cell 60,1-13;Haft et al.,2005,Computational Biology,PLoS Comput Biol 1(6):e60;及びKoonin et al.2017,Curr Opinion Microbiology 37:67-78)。クラス2タイプII系では、Casエンドヌクレアーゼはガイドポリヌクレオチドとの複合体で作用する。
したがって、本明細書に記載される方法のある特定の実施形態では、Casエンドヌクレアーゼは、ガイドポリヌクレオチドとの複合体(例えば、ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体)を形成する。
本明細書で使用される場合、用語「ガイドポリヌクレオチド」は、Casエンドヌクレアーゼ、例えば、本明細書に記載のCasエンドヌクレアーゼと複合体を形成することができ、CasエンドヌクレアーゼがDNA標的部位を認識し、任意選択により結合し、且つ任意選択により切断することを可能にするポリヌクレオチド配列を指す。ガイドポリヌクレオチド配列は、RNA配列、DNA配列、又はこれらの組合せ(RNA-DNA組合せ配列)であってよい。ガイドポリヌクレオチドは、限定されないが、ロックド核酸(LNA)、5-メチルdC、2,6-ジアミノプリン、2’-フルオロA、2’-フルオロU、2’-O-メチルRNA、ホスホロチオエート結合、コレステロール分子への連結、ポリエチレングリコール分子への連結、スペーサー18(ヘキサエチレングリコール鎖)分子への連結、又は環化をもたらす5’から3’への共有結合的連結などの化学的に改変された塩基を更に含んでもよい。
ある特定の実施形態では、CasエンドヌクレアーゼがDNA標的を切断し、Casエンドヌクレアーゼによる標的認識、結合及び切断を可能にするようにCasエンドヌクレアーゼを向けさせるガイドポリヌクレオチド(例えば、gRNA)との複合体を形成する。ガイドポリヌクレオチド(例えば、gRNA)は、Casエンドヌクレアーゼと相互作用するCasエンドヌクレアーゼ認識(CER)ドメイン、及び標的DNA中のヌクレオチド配列にハイブリダイズする可変標的化(VT)ドメインを含み得る。ある特定の実施形態では、ガイドポリヌクレオチド(例えば、gRNA)は、CRISPRヌクレオチド(crヌクレオチド;例えば、crRNA)及びトランス活性化型CRISPRヌクレオチド(tracrヌクレオチド;例えば、tracrRNA)を含み、CasエンドヌクレアーゼをそのDNA標的にガイドする。ガイドポリヌクレオチド(例えば、gRNA)は、二本鎖DNA標的の一本の鎖に相補的なスペーサー領域、及びtracrヌクレオチド(例えば、tracrRNA)と塩基対を形成し、ヌクレオチド二本鎖(例えば、RNA二本鎖)を形成する領域を含む。
ある特定の実施形態では、gRNAは、crRNAとtracrRNAとの合成誘導体を含む「シングルガイドRNA」(sgRNA)である。多くの系では、Casエンドヌクレアーゼ-ガイドポリヌクレオチド複合体は、「プロトスペーサー隣接モチーフ」(PAM)と呼ばれる標的配列(プロトスペーサー)に隣接する短いヌクレオチド配列を認識する。
用語「シングルガイドRNA」及び「sgRNA」は、本明細書では互換的に使用され、tracrRNA(トランス活性化CRISPR RNA)に融合した(tracrRNAにハイブリダイズするtracrメイト配列に結合した)可変標的化ドメインを含むcrRNA(CRISPR RNA)である、2つのRNA分子の合成融合に関する。シングルガイドRNAは、II型Casエンドヌクレアーゼと複合体を形成することができるII型CRISPR/CasシステムのcrRNA又はcrRNA断片及びtracrRNA又はtracrRNA断片を含み得、前記ガイドRNA/Casエンドヌクレアーゼ複合体は、CasエンドヌクレアーゼをDNA標的部位に誘導することができ、CasエンドヌクレアーゼがそのDNA標的部位を認識し、任意選択により結合し、且つ任意選択により切れ目を入れるか又は切断(一本鎖又は二本鎖切断を導入)するのを可能にする。
一本鎖ガイドポリヌクレオチドのcrヌクレオチドとtracrヌクレオチドとを連結するヌクレオチド配列は、RNA配列、DNA配列又はRNA-DNA組合せ配列を含むことができる。一実施形態では、シングルガイドポリヌクレオチドのcrヌクレオチドとtracrヌクレオチドとを連結するヌクレオチド配列の長さは、少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、又は100ヌクレオチド長であり得る。一実施形態では、シングルガイドポリヌクレオチドのcrヌクレオチドとtracrヌクレオチドとを連結するヌクレオチド配列は、限定されないがGAAAテトラループ配列等のテトラループ配列を含むことができる。
用語「可変標的化ドメイン」若しくは「VTドメイン」は、本明細書では互換的に使用され、二本鎖DNA標的部位の1本の鎖(ヌクレオチド配列)にハイブリダイズできる(相補的である)ヌクレオチド配列を含む。いくつかの実施形態では、可変標的ドメインは12~30ヌクレオチドの連続するストレッチを含む。可変標的ドメインは、DNA配列、RNA配列、改変DNA配列、改変RNA配列、又はこれらの任意の組合せで構成され得る。
(ガイドポリヌクレオチドの)「Casエンドヌクレアーゼ認識ドメイン」又は「CERドメイン」という用語は、本明細書中で互換的に使用され、Casエンドヌクレアーゼポリペプチドと相互作用するヌクレオチド配列を含む。CERドメインは、(トランス作用)tracrヌクレオチドメイト配列に続いてtracrヌクレオチド配列を含む。CERドメインは、DNA配列、RNA配列、改変DNA配列、改変RNA配列(例えば、2015年2月26日に公開された米国特許出願公開第20150059010A1号明細書を参照されたい)又はこれらの任意の組合せで構成され得る。
本明細書で使用される「プロトスペーサー隣接モチーフ」(PAM)は、本明細書に記載したガイドポリヌクレオチド/Casエンドヌクレアーゼ系によって認識(標的化)される標的配列(プロトスペーサー)に隣接する短鎖ヌクレオチド配列を意味する。ある特定の実施形態では、Casエンドヌクレアーゼは、標的DNA配列がPAM配列に隣接していないか、又はその近くにない場合は、標的DNA配列を正しく認識することはできない。ある特定の実施形態では、PAMは、標的配列(例えば、Cas12a)に先行する。ある特定の実施形態では、PAMは、標的配列(例えば、化膿性連鎖球菌(S.pyogenes)Cas9)に続く。本明細書におけるPAMの配列及び長さは、用いるCasタンパク質、又はCasタンパク質複合体に応じて異なり得る。PAM配列は任意の長さであり得るが、一般には、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19又は20ヌクレオチド長である。
本明細書で使用される場合、用語「ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体」、「ガイドポリヌクレオチド/Casエンドヌクレアーゼシステム」、「ガイドポリヌクレオチド/Cas複合体」、「ガイドポリヌクレオチド/Casシステム」、「誘導型Casシステム」、「ポリヌクレオチド誘導型エンドヌクレアーゼ」、及び「PGEN」は、本明細書では互換的に使用され、複合体を形成することができる少なくとも1つのガイドポリヌクレオチド及び少なくとも1つのCasエンドヌクレアーゼを指し、ここで前記ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体は、CasエンドヌクレアーゼをDNA標的部位に誘導することができ、CasエンドヌクレアーゼがDNA標的部位を認識し、それに結合し、且つ任意選択により切れ目を入れるか又は切断する(一本鎖又は二本鎖切断を導入する)ことを可能にする。本明細書におけるガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体は、既知のCRISPRシステム(Horvath and Barrangou,2010,Science 327:167-170;Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15;Zetsche et al.,2015,Cell 163,1-13;Shmakov et al.,2015,Molecular Cell 60,1-13)のいずれかのCasタンパク質及び好適なポリヌクレオチド成分を含み得る。ある特定の実施形態では、ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体はリボヌクレオタンパク質(RNP)として提供され、ここではCasエンドヌクレアーゼ成分はタンパク質として提供され、ガイドポリヌクレオチド成分はリボヌクレオチドとして提供される。
本明細書に記載される方法で使用するためのCasエンドヌクレアーゼの例としては、Cas9及びCpf1が挙げられるが、これらに限定されない。Cas9(以前は、Cas5、Csn1、又はCsx12と称されていた)は、クラス2タイプIICasエンドヌクレアーゼである(Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15)。Cas9-gRNA複合体は、標的部位において、3’PAM配列(化膿性連鎖球菌(S.pyogenes)Cas9のためのNGG)を認識し、ガイドRNAのスペーサーが二本鎖DNA標的に侵入することを可能にし、そして、スペーサーとプロトスペーサーとの間の十分な相同性が存在する場合、二本鎖切断の開裂を生成する。Cas9エンドヌクレアーゼは、二本鎖切断を一緒に生成するRuvC及びHNHドメインを含み、別々に一本鎖切断を生成することができる。化膿性連鎖球菌(S.pyogenes)Cas9エンドヌクレアーゼについては、二本鎖切断により平滑末端が残る。Cpf1は、クラス2タイプVCasエンドヌクレアーゼであり、ヌクレアーゼRuvCドメインを含むが、HNHドメインを欠く(Yamane et al.,2016,Cell 165:949-962)。Cpf1エンドヌクレアーゼは、「粘着性の」オーバーハング末端を作り出す。
ゲノム標的部位におけるCas9-gRNA系のためのいくつかの使用には、標的部位での1つ以上のヌクレオチドの挿入、欠失、置換、又は改変;目的のヌクレオチド配列(調節エレメントなど)の改変又は置換;目的のポリヌクレオチドの挿入;遺伝子ノックアウト;遺伝子ノックイン;スプライシング部位の改変及び/又は代替スプライシング部位の導入;目的タンパク質をコードするヌクレオチド配列の改変;アミノ酸及び/又はタンパク質の融合;並びに目的遺伝子中に逆方向リピートを発現することによる遺伝子サイレンシングが挙げられるが、これらに限定されない。
用語「標的部位」、「標的配列」、「標的部位配列」、「標的DNA」、「標的遺伝子座」、「ゲノム標的部位」、「ゲノム標的配列」、「ゲノム標的遺伝子座」及び「プロトスペーサー」は、本明細書中で互換的に使用され、以下に限定はされないが、ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体が認識し、それに結合し、且つ任意選択により切れ目を入れるか又は切断をすることができる、細胞の、染色体、エピソーム、遺伝子座又はゲノム中の他の任意のDNA分子(例えば、染色体DNA、葉緑体DNA、ミトコンドリアDNA、プラスミドDNA)上のヌクレオチド配列などのポリヌクレオチド配列を指す。標的部位は、細胞のゲノム中の内在性部位であり得るか、又は代わりに、標的部位は、細胞に対して異種であり得、そのため、細胞のゲノム中に天然には存在し得るか、若しくは標的部位は、天然で生じる場所に対して異種のゲノム位置に見出され得る。本明細書で使用される場合、用語「内在性標的配列」及び「天然標的配列」は、本明細書中で互換的に使用され、細胞のゲノムに内在するか又は天然のものであり、細胞のゲノム中のその標的配列の内在性又は天然の位置に存在する標的配列を指す。「人工標的部位」又は「人工標的配列」は、本明細書中で互換的に使用され、細胞のゲノムに導入される標的配列を指す。このような人工標的配列は、細胞のゲノム中の内在性標的配列又は天然標的配列と配列は、同一であるが、細胞のゲノム中の異なる位置(すなわち非内在位置又は非発生位置)に位置し得る。「変更標的部位」、「変更標的配列」、「改変標的部位」、「改変標的配列」は、本明細書中で互換的に使用され、非変更標的配列と比較して少なくとも1つの変更を含む、本明細書に開示の標的配列を指す。そのような「変更」としては、例えば、(i)少なくとも1つのヌクレオチドの置換、(ii)少なくとも1つのヌクレオチドの欠失、(iii)少なくとも1つのヌクレオチドの挿入、又は(iv)(i)~(iii)の任意の組合せが挙げられる。
編集対象のヌクレオチド配列と比較するとき、少なくとも1つのヌクレオチド改変を含む「ポリヌクレオチド改変テンプレート」も提供される。例えば、コードされるポリペプチド中でアミノ置換を誘導するための、配列番号1に対応する内因性遺伝子中の改変である。ヌクレオチド改変は、少なくとも1つのヌクレオチド置換、付加、欠失、又は化学的変更であり得る。場合により、ポリヌクレオチド改変テンプレートは、更に、少なくとも1つのヌクレオチド改変にフランキングする相同ヌクレオチド配列を含み得、そのフランキング相同ヌクレオチド配列は、編集されるべき所望のヌクレオチド配列に十分な相同性を提供する。
本明細書に開示される方法のある特定の実施形態では、目的のポリヌクレオチドは、標的部位で挿入され、「ドナーDNA」分子の一部として提供される。本明細書で使用される場合、「ドナーDNA」は、Casエンドヌクレアーゼの標的部位内に挿入される目的のポリヌクレオチドを含むDNAコンストラクトである。ドナーDNAコンストラクトは、目的のポリヌクレオチドに隣接する第1及び第2の相同領域を更に含む。ドナーDNAの第1及び第2の相同領域は、細胞又は生物のゲノムの標的部位中に存在する又はこの標的部位に隣接する第1及び第2のゲノム領域に対し相同性をそれぞれ有する。ドナーDNAは、ガイドポリヌクレオチドに結合させることができる。繋留されたドナーDNAは、ゲノムの編集、遺伝子の挿入及び標的ゲノムの調節に有用な標的及びドナーDNAの共局在化を可能にする場合があり、また、内在性のHR機構の機能が大きく低下していると考えられる分裂終了細胞の標的化に有用であり得る(Mali et al.,2013,Nature Methods Vol.10:957-963)。標的ポリヌクレオチドとドナーポリヌクレオチドによって共有される相同性又は配列同一性の量は変動する場合があり、全長及び/又は領域を含む。
改変テンプレートを用いて、Cas9-gRNA二本鎖切断部位においてゲノム配列を編集するためのプロセスは、一般的に:宿主細胞のゲノム中の標的配列を認識し、ゲノム配列中の二本鎖切断を誘導することができるCas9-gRNA複合体、及び編集されるヌクレオチド配列と比較したときに、少なくとも1つのヌクレオチド変更を含む少なくとも1つのポリヌクレオチド改変テンプレートを、宿主細胞に提供することを含む。ポリヌクレオチド改変テンプレートは、更に、少なくとも1つのヌクレオチド変更部にフランキングするヌクレオチド配列を含み得る。そのフランキング配列は、二本鎖切断にフランキングする染色体領域に実質的に相同である。二本鎖切断誘導剤、例えばCas9-gRNA複合体を使用するゲノム編集は、例えば、2015年3月19日に公開された米国特許出願公開第20150082478号明細書、2015年2月26日に公開された国際公開第2015026886号パンフレット、2016年1月14日に公開された国際公開第2016007347号パンフレット及び2016年2月18日に公開された国際公開第2016025131号パンフレットに記載されている。
真核細胞についての最適な発現及び核局在化を容易にするために、Casエンドヌクレアーゼを含む遺伝子は、2016年11月24日に公開の国際公開第2016186953号パンフレットに記載される通りに最適化され、続いて当技術分野で知られる方法によってDNA発現カセットとして細胞に送達され得る。ある特定の実施形態では、Casエンドヌクレアーゼは、ポリペプチドとして提供される。ある特定の実施形態では、Casエンドヌクレアーゼは、ポリペプチドをコードするポリヌクレオチドとして提供される。ある特定の実施形態では、ガイドRNAは、1つ以上のRNA分子をコードするDNA分子として提供される。ある特定の実施形態では、ガイドRNAは、RNA又は化学的に改変されたRNAとして提供される。ある特定の実施形態では、Casエンドヌクレアーゼタンパク質及びガイドRNAは、リボヌクレオタンパク質複合体(RNP)として提供される。
ある特定の実施形態では、ジンクフィンガー媒介ゲノム編集プロセスによって内因性を改変するための方法が提供される。染色体配列を編集するためのジンクフィンガー媒介ゲノム編集プロセスは、例えば:(a)染色体配列中の標的配列を認識し、染色体配列中の部位を切断することができるジンクフィンガーヌクレアーゼをコードする少なくとも1つの核酸、及び任意選択で、(i)切断部位のいずれかの側と同一である実質的な配列を示す、上流配列及び下流配列によってフランキングされた組込みのための配列を含む少なくとも1つのドナーポリヌクレオチド、又は(ii)切断部位において、染色体配列の一部と実質的に同一である配列を含み、少なくとも1つのヌクレオチド変更を更に含む配列を含む少なくとも1つの交換ポリヌクレオチドを細胞中に導入することと、(b)細胞を培養し、ジンクフィンガーヌクレアーゼが染色体配列中に二本鎖切断を導入するように、ジンクフィンガーヌクレアーゼの発現を可能にすることと、を含み、二本鎖切断が、(i)不活性化突然変異が接触体配列中に導入されるような、非相同末端結合修復プロセスによって、又は(ii)ドナーポリヌクレオチド中の配列が染色体配列中に組み込まれるか、又は交換ポリヌクレオチド中の配列が染色体配列の一部と交換されるような、相同組換え修復プロセスによって修復される。
ジンクフィンガーヌクレアーゼは、DNA結合ドメイン(すなわち、ジンクフィンガー)及び切断ドメイン(すなわち、ヌクレアーゼ)を含む。ジンクフィンガーヌクレアーゼをコードする核酸は、DNA又はRNAを含み得る。ジンクフィンガー結合ドメインは、選択のいずれかの核酸配列を認識し、それに結合するように操作され得る。例えば、Beerli et al.(2002)Nat.Biotechnol.20:135-141;Pabo et al.(2001)Ann.Rev.Biochem.70:313-340;Choo et al.(2000)Curr.Opin.Struct.Biol.10:411-416;及びDoyon et al.(2008)Nat.Biotechnol.26:702-708;Santiago et al.(2008)Proc.Natl.Acad.Sci.USA 105:5809-5814;Urnov,et al.,(2010)Nat Rev Genet.11(9):636-46;及びShukla,et al.,(2009)Nature 459(7245):437-41を参照されたい。操作されたジンクフィンガー結合ドメインは、天然に存在するジンクフィンガータンパク質と比較して、新規の結合特異性を有し得る。例として、米国特許第6,453,242号明細書に記載されるアルゴリズムを使用して、予め選択された配列を標的化するジンクフィンガー結合ドメインを設計することができる。非退化認識コード表(Nondegenerate recognition code table)を用いて、特定の配列を標的化するために、ジンクフィンガー結合ドメインを設計することもできる(Sera et al.(2002)Biochemistry 41:7074-7081)。DNA配列中の潜在的な標的部位を特定し、ジンクフィンガー結合ドメインを設計するためのツールを使用してもよい(Mandell et al.(2006)Nuc.Acid Res.34:W516-W523;Sander et al.(2007)Nuc.Acid Res.35:W599-W605)。
例示的なジンクフィンガーDNA結合ドメインは、所望の標的配列と少なくとも約80%の配列同一性を有する配列を認識し、それに結合する。他の実施形態では、配列同一性は、約81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、又は100%であってもよい。
ジンクフィンガーヌクレアーゼは、切断ドメインも含む。ジンクフィンガーヌクレアーゼの切断ドメイン部分は、任意のエンドヌクレアーゼ又はエキソヌクレアーゼから得ることができる。切断ドメインが誘導され得るエンドヌクレアーゼの非限定的な例としては、制限エンドヌクレアーゼ及びホーミングエンドヌクレアーゼが挙げられるが、これらに限定されない。例えば、2010-2011 Catalog,New England Biolabs,Beverly,Mass.;及びBelfort et al.(1997)Nucleic Acids Res.25:3379-3388を参照されたい。DNAを切断する追加の酵素は知られている(例えば、S1ヌクレアーゼ;マングビーンヌクレアーゼ;膵臓DNase I;ミクロコッカスヌクレアーゼ;酵母HOエンドヌクレアーゼ)。これらの酵素のうちの1つ以上(又はその機能断片)は、切断ドメインの供給源として使用されてもよい。
本明細書に記載される方法のある特定の実施形態では、内因性遺伝子は、植物ゲノムを改変するために生成された「特注の」メガヌクレアーゼを使用することによって改変される(例えば、国際公開第2009/114321号パンフレット;Gao et al.(2010)Plant Journal 1:176-187を参照されたい)。用語「メガヌクレアーゼ」は、一般に、12塩基対よりも大きく、対応するイントロン導入部位を包含する認識配列における二本鎖DNAに結合する天然に存在するホーミングエンドヌクレアーゼを指す。天然に存在するメガヌクレアーゼは、単量体(例えば、I-SceI)又は二量体(例えば、I-CreI)であり得る。用語メガヌクレアーゼは、本明細書で使用される場合、単量体メガヌクレアーゼ、二量体メガヌクレアーゼを指すか、又は会合して二量体メガヌクレアーゼを形成する単量体を指すように使用され得る。
例えば、LAGLIDADGファミリーからの天然に存在するメガヌクレアーゼは、植物、酵母、ショウジョウバエ、哺乳動物細胞及びマウスにおいて部位特異的ゲノム改変を効果的に促進するために使用されている。Zea mays(トウモロコシ)のゲノムで見出された22の塩基対のDNA配列を認識し、切断する、例えば、LIG-34メガヌクレアーゼなどの操作されたメガヌクレアーゼが知られている(例えば、米国特許出願公開第20110113509号パンフレットを参照されたい)。
本明細書に記載される方法の特定の実施形態では、内因性遺伝子は、TALエンドヌクレアーゼ(TALEN)を使用することによって改変される。植物病原菌ザントモナス属(Xanthomonas)に由来するTAL(転写活性化因子様)エフェクターは、植物細胞核中で転写活性化因子として作用する重要な病原性因子であり、ここでは、それらはタンデムリピートのセントラルドメインを介してDNAに直接結合する。転写活性化因子様(TAL)エフェクター-DNA改変酵素(TALE又はTALEN)もまた、遺伝子変化を操作するために使用される。例えば、米国特許出願公開第20110145940号パンフレット、Boch et al.,(2009),Science 326(5959):1509-12を参照されたい。TALエフェクターのFokIヌクレアーゼへの融合は、特定の位置でのDNAに結合し、それを切断するTALENを提供する。標的特異性は、TALエフェクター中のカスタマイズされたアミノ酸リピートを開発することによって決定される。
本明細書に記載される方法のある特定の実施形態では、内因性遺伝子は、オリゴヌクレオベース媒介系などの塩基編集を使用することによって改変される。二本鎖切断誘導剤に加えて、部位特異的塩基変換もまた、1つ以上のヌクレオチド変化を操作して、本明細書に記載される1つ以上のEMEをゲノム中に作製することを達成できる。これらには、例えば、C・GからT・Aにすることによって媒介される部位特異的塩基編集、又はA・TからG・Cへの塩基編集デアミナーゼ酵素が挙げられる(Gaudelli et al.,Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage.”Nature(2017);Nishida et al.“Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems.”Science 353(6305)(2016);Komor et al.“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage.”Nature 533(7603)(2016):420-4。シスチジンデアミナーゼに融合された触媒的に死んだdCas9又はアデニンデアミナーゼタンパク質は、DNA切断を誘導することなくDNA塩基を変更することができる特異的塩基エディターになる。塩基エディターは、C->T(又は反対の鎖上でG->A)に変換し、又はアデニンをイノシンに変換するアデニン塩基エディターは、gRNAによって特定される編集ウィンドウ内のA->G変化をもたらす。
植物育種の方法であって、本明細書に記載されるダイズ植物のいずれかを第2の植物と交配して、本明細書に記載される少なくとも1つの改変を含む子孫種子を生産することを含む方法が更に提供される。ある特定の実施形態では、植物は、子孫種子から生産される。
以下は、本発明のいくつかの態様の特定の実施形態の例である。実施例は、説明の目的のためにのみ提供されるものであり、決して本発明の範囲を限定することを意図するものではない。
実施例1:ダイズ種子中のダイズレグヘモグロビンタンパク質の発現
ダイズレグヘモグロビン遺伝子(Glyma.20g191200)を、ダイズゲノム中で同定した。この遺伝子は、4つのエクソンと共にレグヘモグロビンペプチド(配列番号2)をコードするそのCDS(配列番号1)を含有する。図1に示すように、ダイズレグヘモグロビンを、ダイズ種子中でシグナルペプチドを用いずに発現させた。加えて、数個のタンパク質標的化シグナル配列を用いて、レグヘモグロビンをダイズ種子中のタンパク質貯蔵小胞中へ標的化させた(表2)。ベータ-コングリシニンアルファ’SPPは、配列番号3の1位から195位までのヌクレオチドによってコードされ、その対応するペプチド配列は、配列番号4の1位から65位によって定義された。レクチンSPは、配列番号5の1位から105位までのヌクレオチドによってコードされ、その対応するペプチド配列は、配列番号6の1位から35位によって定義される。GY1 SPは、配列番号7の1位から66位までのヌクレオチドによってコードされ、その対応するペプチド配列は、配列番号8の1位から22位によって定義される。強力な種子特異的プロモーター、例えば、ベータ-コングリシニンプロモーター(配列番号9)又はグリシニンプロモーター(配列番号10)を使用して、レグヘモグロビンの発現を駆動させた。Rubisco小サブユニット(Rubisco SSU)色素体標的化配列も用いて、レグヘモグロビンタンパク質を色素体に標的化させた。Rubisco SSUSP色素体標的化配列は、配列番号31の1位から165位までのヌクレオチド配列によってコードされ、対応するペプチド標的化配列は、配列番号32の1位から55位でコードされる。レグヘモグロビンコード配列は、配列番号31の166位~603位に由来し、対応するペプチドは、配列番号32の56位~200位に由来する。オクロバクテリウム属(Ochrobactrum)媒介又はアグロバクテリア属(Agrobacteria)媒介ダイズ胚軸形質転換によってダイズ種子中に導入され、前者は、米国特許公開第2018/0216123号パンフレットに記載されている。結果を実施例7に記載する。
ダイズレグヘモグロビン遺伝子(Glyma.20g191200)を、ダイズゲノム中で同定した。この遺伝子は、4つのエクソンと共にレグヘモグロビンペプチド(配列番号2)をコードするそのCDS(配列番号1)を含有する。図1に示すように、ダイズレグヘモグロビンを、ダイズ種子中でシグナルペプチドを用いずに発現させた。加えて、数個のタンパク質標的化シグナル配列を用いて、レグヘモグロビンをダイズ種子中のタンパク質貯蔵小胞中へ標的化させた(表2)。ベータ-コングリシニンアルファ’SPPは、配列番号3の1位から195位までのヌクレオチドによってコードされ、その対応するペプチド配列は、配列番号4の1位から65位によって定義された。レクチンSPは、配列番号5の1位から105位までのヌクレオチドによってコードされ、その対応するペプチド配列は、配列番号6の1位から35位によって定義される。GY1 SPは、配列番号7の1位から66位までのヌクレオチドによってコードされ、その対応するペプチド配列は、配列番号8の1位から22位によって定義される。強力な種子特異的プロモーター、例えば、ベータ-コングリシニンプロモーター(配列番号9)又はグリシニンプロモーター(配列番号10)を使用して、レグヘモグロビンの発現を駆動させた。Rubisco小サブユニット(Rubisco SSU)色素体標的化配列も用いて、レグヘモグロビンタンパク質を色素体に標的化させた。Rubisco SSUSP色素体標的化配列は、配列番号31の1位から165位までのヌクレオチド配列によってコードされ、対応するペプチド標的化配列は、配列番号32の1位から55位でコードされる。レグヘモグロビンコード配列は、配列番号31の166位~603位に由来し、対応するペプチドは、配列番号32の56位~200位に由来する。オクロバクテリウム属(Ochrobactrum)媒介又はアグロバクテリア属(Agrobacteria)媒介ダイズ胚軸形質転換によってダイズ種子中に導入され、前者は、米国特許公開第2018/0216123号パンフレットに記載されている。結果を実施例7に記載する。
実施例2:グルタミル-tRNAレダクターゼ及びフェロケラターゼを操作するポルフィリン経路によるダイズレグヘモグロビン発現レベルの改善
種子中のダイズレグヘモグロビン発現を改善するために、ポルフィリン経路操作アプローチを使用した。ヘム生合成をもたらすポルフィリン経路には、少なくとも9つの酵素ステップがある。その中で、図2に示すように、グルタミル-tRNAレダクターゼ(glyma.04g089800)及びフェロケラターゼ(glyma.04g050400)を、ダイズ種子中のより高いレグヘモグロビン蓄積及びヘム充填量を促進するためのヘム産生の増加について試験した。この目的のために、4つの追加のダイズベクターを作製し、それらの各々は、実施例1のレグヘモグロビン発現カセットに加えて、グルタミル-tRNAレダクターゼ(配列番号11、12)及びフェロケラターゼ(配列番号13、14)の発現を含有した。2つの生合成遺伝子は、インゲンマメ(Phaseolus vulgaris)ファゼオリンプロモーター(配列番号15)、又はナタネ(Brassica napus)ナピンプロモーター(配列番号16)などの強力な種子特異的プロモーターによって駆動された。これらの4つのベクターにおいて、これらの2つの生合成遺伝子の発現カセットは、異なるシグナルペプチド標的化配列を含むか、又は含まないレグヘモグロビンの4つの発現カセットを用いて、分子的に積み重ねられた。これらの発現ベクターは、米国特許公開第2018/0216123号パンフレットに記載されるように、オクロバクテリウム属(Ochrobactrum)媒介ダイズ胚軸形質転換によって、ダイズ植物中に導入された。結果を実施例7に記載する。
種子中のダイズレグヘモグロビン発現を改善するために、ポルフィリン経路操作アプローチを使用した。ヘム生合成をもたらすポルフィリン経路には、少なくとも9つの酵素ステップがある。その中で、図2に示すように、グルタミル-tRNAレダクターゼ(glyma.04g089800)及びフェロケラターゼ(glyma.04g050400)を、ダイズ種子中のより高いレグヘモグロビン蓄積及びヘム充填量を促進するためのヘム産生の増加について試験した。この目的のために、4つの追加のダイズベクターを作製し、それらの各々は、実施例1のレグヘモグロビン発現カセットに加えて、グルタミル-tRNAレダクターゼ(配列番号11、12)及びフェロケラターゼ(配列番号13、14)の発現を含有した。2つの生合成遺伝子は、インゲンマメ(Phaseolus vulgaris)ファゼオリンプロモーター(配列番号15)、又はナタネ(Brassica napus)ナピンプロモーター(配列番号16)などの強力な種子特異的プロモーターによって駆動された。これらの4つのベクターにおいて、これらの2つの生合成遺伝子の発現カセットは、異なるシグナルペプチド標的化配列を含むか、又は含まないレグヘモグロビンの4つの発現カセットを用いて、分子的に積み重ねられた。これらの発現ベクターは、米国特許公開第2018/0216123号パンフレットに記載されるように、オクロバクテリウム属(Ochrobactrum)媒介ダイズ胚軸形質転換によって、ダイズ植物中に導入された。結果を実施例7に記載する。
実施例3:ポルフィリン酵素改変又は発現によるダイズレグヘモグロビン発現レベルの改善
実施例2に記載された方法と同様の技術的アプローチを用いて、グルタメート-1-セミアルデヒド2,1-アミノムターゼ、アミノレブリン酸デヒドラターゼ、ヒドロキシメチルビランシンターゼ、ウロホルフィリノーゲンIIIシンターゼ、ウロホルフィリノーゲンデカルボキシラーゼ、コポルフィリノーゲンIIIオキシダーゼ、及びプロトポルフィリノーゲンオキシダーゼなどのポルフィリン経路についての他の酵素ステップを調節する。使用されるポルフィリン経路のためのダイズ遺伝子の例を、表3に列挙する。ダイズ種子中のこれらの天然代謝酵素遺伝子の過剰発現は、ダイズ種子中の発現を提供する調節配列に作動可能に連結されたこれらのポリペプチドのためのコード配列を含む、組換え構築物によるダイズの形質転換によって達成される。第2に、これらの酵素の増加された発現は、遺伝子編集を通して達成される。これらの酵素のフィードバック感受性調節ドメインを同定し、遺伝子編集短縮化、欠失、置換又は挿入によって除去若しくは不活性化する。増加したレグヘモグロビンタンパク質複合体を産生するように改変された、ダイズ種子中で産生されるレグヘモグロビンタンパク質のヘム含有量の増強が達成されることが予想される。フィードバックに感受性ではないように、又は酵素発現、安定性若しくは活性を増強させるように、他の方法で改変若しくは編集されているヘム生合成酵素がダイズ種子中で発現され、ヘム産生を更に増加させ、これがダイズ種子中のより高いレグヘモグロビン蓄積及びヘム充填を可能にする。具体的には、グルタミル-tRNAレダクターゼ(GTR)酵素活性は、タンパク質 FLUORESCENT IN BLUE LIGHT(FLU)、グルタミル-tRNAレダクターゼ結合タンパク質(GBP)、葉緑体シグナル粒子43(SRP43)によって媒介される組合せ翻訳後制御下にある(表4)。遺伝子編集、種子優先的過剰発現又はRNA干渉によって達成される単一の、又はこれらの3つのタンパク質の任意の組合せの変更された発現は、発育する種子においてヘム生合成活性を増加させることによって、より高いレベルのヘム含有レグヘモグロビンを達成すると予想される。
実施例2に記載された方法と同様の技術的アプローチを用いて、グルタメート-1-セミアルデヒド2,1-アミノムターゼ、アミノレブリン酸デヒドラターゼ、ヒドロキシメチルビランシンターゼ、ウロホルフィリノーゲンIIIシンターゼ、ウロホルフィリノーゲンデカルボキシラーゼ、コポルフィリノーゲンIIIオキシダーゼ、及びプロトポルフィリノーゲンオキシダーゼなどのポルフィリン経路についての他の酵素ステップを調節する。使用されるポルフィリン経路のためのダイズ遺伝子の例を、表3に列挙する。ダイズ種子中のこれらの天然代謝酵素遺伝子の過剰発現は、ダイズ種子中の発現を提供する調節配列に作動可能に連結されたこれらのポリペプチドのためのコード配列を含む、組換え構築物によるダイズの形質転換によって達成される。第2に、これらの酵素の増加された発現は、遺伝子編集を通して達成される。これらの酵素のフィードバック感受性調節ドメインを同定し、遺伝子編集短縮化、欠失、置換又は挿入によって除去若しくは不活性化する。増加したレグヘモグロビンタンパク質複合体を産生するように改変された、ダイズ種子中で産生されるレグヘモグロビンタンパク質のヘム含有量の増強が達成されることが予想される。フィードバックに感受性ではないように、又は酵素発現、安定性若しくは活性を増強させるように、他の方法で改変若しくは編集されているヘム生合成酵素がダイズ種子中で発現され、ヘム産生を更に増加させ、これがダイズ種子中のより高いレグヘモグロビン蓄積及びヘム充填を可能にする。具体的には、グルタミル-tRNAレダクターゼ(GTR)酵素活性は、タンパク質 FLUORESCENT IN BLUE LIGHT(FLU)、グルタミル-tRNAレダクターゼ結合タンパク質(GBP)、葉緑体シグナル粒子43(SRP43)によって媒介される組合せ翻訳後制御下にある(表4)。遺伝子編集、種子優先的過剰発現又はRNA干渉によって達成される単一の、又はこれらの3つのタンパク質の任意の組合せの変更された発現は、発育する種子においてヘム生合成活性を増加させることによって、より高いレベルのヘム含有レグヘモグロビンを達成すると予想される。
実施例4:レグヘモグロビン遺伝子の天然ダイズグリシニン遺伝子座へのゲノム操作
CRISPR/Cas9系を用いて、本発明者らは、グリシニン1(GY1)遺伝子(glyma.03g163500、ヌクレオチド配列については配列番号20、ペプチド配列については配列番号21)を標的化するために、特定のgRNAを設計した(GM-GY-CR1、配列番号17;GM-GY-CR2、配列番号18;及びGM-GY-CR3、配列番号19)。GM-GY1-CR1を、プロ-グリシニン1タンパク質のエクソン1の開始部の近くの部位を標的化するように設計した。GM-GY1-CR2を、プロ-グリシニン1の酸性サブユニット(配列番号21中のアミノ酸#1~#310)と、塩基性サブユニット(配列番号21中のアミノ酸#311~#495)との間の接合部を標的化するように設計した。GM-GY1-CR3を、グリシニン1遺伝子の3’UTRの開始部を標的化するように設計した。図3及び4に示すように、バイナリーベクターは、CR1/CR2又はCR1/CR3 gRNA組合せのいずれか、及びそれらの対応するドナーDNAテンプレート(配列番号22及び配列番号23)を含有した。相同組換え(HR)断片を使用して、レグヘモグロビン/GY1配列をフランキングし、相同媒介組換えプロセスを容易にした。CR1又はCR2又はCR3 gRNA標的部位も使用してドナーDNAをフランキングし、二本鎖切断修復プロセスのために、バイナリーベクターからそれらを切除できるようにした。これらの配列は、表5に明示される。
CRISPR/Cas9系を用いて、本発明者らは、グリシニン1(GY1)遺伝子(glyma.03g163500、ヌクレオチド配列については配列番号20、ペプチド配列については配列番号21)を標的化するために、特定のgRNAを設計した(GM-GY-CR1、配列番号17;GM-GY-CR2、配列番号18;及びGM-GY-CR3、配列番号19)。GM-GY1-CR1を、プロ-グリシニン1タンパク質のエクソン1の開始部の近くの部位を標的化するように設計した。GM-GY1-CR2を、プロ-グリシニン1の酸性サブユニット(配列番号21中のアミノ酸#1~#310)と、塩基性サブユニット(配列番号21中のアミノ酸#311~#495)との間の接合部を標的化するように設計した。GM-GY1-CR3を、グリシニン1遺伝子の3’UTRの開始部を標的化するように設計した。図3及び4に示すように、バイナリーベクターは、CR1/CR2又はCR1/CR3 gRNA組合せのいずれか、及びそれらの対応するドナーDNAテンプレート(配列番号22及び配列番号23)を含有した。相同組換え(HR)断片を使用して、レグヘモグロビン/GY1配列をフランキングし、相同媒介組換えプロセスを容易にした。CR1又はCR2又はCR3 gRNA標的部位も使用してドナーDNAをフランキングし、二本鎖切断修復プロセスのために、バイナリーベクターからそれらを切除できるようにした。これらの配列は、表5に明示される。
アグロバクテリウム属(Agrobacterium)媒介ダイズ胚軸形質転換によって、バイナリーベクターをダイズ植物中に導入した。相同媒介二本鎖切断DNA修復プロセスによるドナーDNAの部位特異的組込みを用いて、(i)天然グリシニン1遺伝子座における酸性サブユニットをコードするゲノム配列を置き換えることによって、又は(ii)天然グリシニン1遺伝子座において、グリシニン1タンパク質全体をコードするゲノム配列を置き換えることによって、ダイズレグヘモグロビンを有するグリシニン1のゲノム編集多様体を作製した。グリシニン1遺伝子全体を、天然グリシニン1遺伝子座にてレグヘモグロビンコード配列で置き換えるために、合計で1452個のT0植物をCR1/CR3デザインについて生成した(図3)。本発明者らは、2種のPCR分析を用いて完全な遺伝子組込みイベントを特定し、1種はグリシニン1遺伝子座の5’領域でPCR分析、別のものは3’領域でのPCR分析であった。1452個のT0植物について、10個の潜在的な2×HDR完全組込みイベントをT0植物において同定した。PCR産物の強度に基づいて、本発明者らはそれらを3つのカテゴリー:強い(4つのイベント)、中間(3つのイベント)及び弱い(3つのイベント)に分類した。これらの10個のイベントで、本発明者らはPCR産物の配列決定分析を実施し、10個のイベントのうち2つ(1つは強い、及び1つは弱いイベント)が二本鎖切断修復プロセスからのSNP変異を有していたため、本発明者らはこれらの2つのイベントを更に進めなかった。T1種子を、全ての残りの8つの陽性イベントから収穫した。我々のT0植物分析に基づいて、トップの6つのイベントからT1種子のレグヘモグロビン定量化を進め(3つの強いイベント:198A、315A、956A、及び3つの中間イベント:407A、419A、及び628A)、315Aイベントが、T1種子中で最も高いグロビン蓄積を与えた(乾燥重量ベースで、種子の1.16%の総タンパク質)。
本発明者らは、同じ6つのイベントからのT1種子を播種氏、同じPCR分子分析をそれらのT1植物で実施した。これらの分析において、2×HDR完全組込みT1植物は、分析された6つのイベントのうちの3つにおいてだけ(198A、315A、628A)一貫して確認することができた。956Aイベントについては、わずか1つの2×HDR植物を、スクリーニングされた37個のT1植物から検出することができた。他の2つのイベント(407A及び419A)については、本発明者らは、いかなる2×HDR PCR産物も検出することができず、それらのT0植物分析からの2×HDRシグナルは、T1プラントは伝達されなかったことを示し、これは、おそらく、形質転換プロセスにおけるキメラ性に起因する。これらの2つのイベントは、T1植物でのランダムに組み込まれたトランスジェニックイベント賭して再分類された。T2種子は、2×HDRの完全な組み込まれたイベントに対して、並びにランダムに組み込まれたトランスジェニックイベントに対して収穫される。レグヘモグロビンレベルを全てのホモ接合型T2種子において分析され、グリシニン1天然遺伝子座におけるレグヘモグロビン発現レベルをランダムトランスジェニック遺伝子座と比較する。レグヘモグロビンレベルは、T1種子におけるレグヘモグロビンレベルと比較して、完全な組み込まれたイベントにおいて2倍になり、乾燥重量ベースで総種子タンパク質の訳2.3%以上に達すると予想される。
実施例5:レグヘモグロビン遺伝子の他の天然ダイズ種子貯蔵タンパク質遺伝子座へのゲノム操作
他のグリシニンタンパク質又はコングリシニンタンパク質などの他の種子貯蔵タンパク質を、表6及び7に示す。これらの貯蔵タンパク質をコードする遺伝子を、この実施例に記載されるようにダイズ種子中のダイズレグヘモグロビン過剰発現のための遺伝子編集ターゲットとして使用する。
他のグリシニンタンパク質又はコングリシニンタンパク質などの他の種子貯蔵タンパク質を、表6及び7に示す。これらの貯蔵タンパク質をコードする遺伝子を、この実施例に記載されるようにダイズ種子中のダイズレグヘモグロビン過剰発現のための遺伝子編集ターゲットとして使用する。
実施例4におけるプロトコルに従って、これらの遺伝子に対する特定のgRNAを設計する。各遺伝子標的に対するバイナリーベクターを、アグロバクテリウム属(Agrobacterium)媒介ダイズ胚軸形質転換によって、ダイズ植物中に導入する。相同媒介二本鎖切断DNA修復プロセスによるドナーDNAの部位特異的組込みを用いることによって、コード配列に置き換わるダイズレグヘモグロビンによる種子貯蔵タンパク質遺伝子のゲノム編集多様体が、各種子貯蔵タンパク質遺伝子に対して、単独で、又はGLY1若しくは他の種子貯蔵タンパク質遺伝子と組み合わせて作製される。植物を温室で生育させる。本発明者らは、収穫されたT1種子が総種子タンパク質の少なくとも1%又はそれよりも高い量のレグヘモグロビンを含有すると予想する。
実施例6:タンパク質リバランシングによるダイズ種子中のダイズレグヘモグロビン発現レベルの改善
グリシニン及びコングリシニンは、ダイズ種子中の2つの主要な部類の種子貯蔵タンパク質である。ダイズ種子において、豊富な7Sグロブリン貯蔵タンパク質であるβ-コングリシニン、及びグリシニンは、それぞれ総タンパク質含有量の訳21%及び33%を構成する。総ダイズタンパク質含有量は、RNAiによるβ-コングリシニンのα及びα’サブユニットのサイレンス後に変化しなかった。得られる操作された種子は、総種子タンパク質の50%超を占めるより多くのグリシニンを蓄積し、操作された種子中の欠如しているβ-コングリシニンを補った。β-コングリシニンは、3つのアイソフォーム、α、α’及びβからなる。必要に応じて、β-コングリシニン遺伝子ファミリー(アルファ’、アルファ及びベータサブユニットに対して、6~7個の遺伝子)は、CRISPR/Cas編集による遺伝子クラスタードロップアウト又はフレームシフトノックアウト突然変異を用いて排除し、次いで、より多くのタンパク質合成資源を、ダイズ種子中のレグヘモグロビン産生に振り向けることができる。
グリシニン及びコングリシニンは、ダイズ種子中の2つの主要な部類の種子貯蔵タンパク質である。ダイズ種子において、豊富な7Sグロブリン貯蔵タンパク質であるβ-コングリシニン、及びグリシニンは、それぞれ総タンパク質含有量の訳21%及び33%を構成する。総ダイズタンパク質含有量は、RNAiによるβ-コングリシニンのα及びα’サブユニットのサイレンス後に変化しなかった。得られる操作された種子は、総種子タンパク質の50%超を占めるより多くのグリシニンを蓄積し、操作された種子中の欠如しているβ-コングリシニンを補った。β-コングリシニンは、3つのアイソフォーム、α、α’及びβからなる。必要に応じて、β-コングリシニン遺伝子ファミリー(アルファ’、アルファ及びベータサブユニットに対して、6~7個の遺伝子)は、CRISPR/Cas編集による遺伝子クラスタードロップアウト又はフレームシフトノックアウト突然変異を用いて排除し、次いで、より多くのタンパク質合成資源を、ダイズ種子中のレグヘモグロビン産生に振り向けることができる。
一例として、gRNAは、Cas9/gRNA編集によって6つの想定されるβ-コングリシニンアイソフォームをノックアウトし、プロテオームをグリシニンにリバランスするように設計された。3α、2α’及び2βアイソフォームを含む7つのβ-コングリシニン候補物質を同定した。Glyma.10g246400(α)及びGlyma.20g146200(β)を除いて、全ての他のアイソフォームは、ダイズ種子中で開化後(DAF)30日又は50日で比較的高い発現レベルを示す(表7)。
4つのgRNAを用いて、7つのβ-コングリシニンアイソフォームのうち6つを欠失させた。図5に示すように、GM-CONG-gRNA1(配列番号24)及びGM-CONG-gRNA2(配列番号25)は、染色体20上のコングリシニンクラスター(Gm20)をドロップアウトするのに使用し;GM-CONG-gRNA3(配列番号26)及びGM-CONG-gRNA4(配列番号27)は、染色体10上のコングリシニンクラスター(Gm10)をドロップアウトするのに用いた。
コングリシニンGm10遺伝子座ドロップアウト実験からのT2ホモ接合型種子を生成した。種子タンパク質の分析を、SDS-PAGEクマシーブルーゲル染色分析によって実施した(図6)。コングリシニンタンパク質のアルファ’サブユニットは、Gm10遺伝子座ドロップアウト多様体からのそれらのT2ホモ接合型種子では検出されず、これはダイズゲノムからのそれらの遺伝子の完全な除去と一致する、ダイズ種子中のコングリシニンアルファ’サブユニットタンパク質の完全な除去を実証している。これらのT2種子の総タンパク質含有量は、野生型と比較して変化しておらず、他のダイズタンパク質がこれらの編集多様体中のコングリシニンアルファ’サブユニットタンパク質の喪失を補っていることを示している。第2の編集実験については、Gm20遺伝子座ドロップアウトからのT2種子をタンパク質ゲル分析によって分析した(図7)。この結果は、コングリシニンアルファサブユニットタンパク質がホモ接合型ドロップアウト植物のダイズ種子において完全に除去されていることを示した。データはまた、コングリシニンベータサブユニットタンパク質も、Glyma.20g148200遺伝子の除去のためにこのドロップアウト多様体中で低減されることを示した。しかしながら、ベータサブユニットの一部は依然として検出される場合があり、これはドロップアウトデザインが適度に発現されたGlyma.20g146200遺伝子を含まなかったためである。これらのアルファ’及びアルファ/ベータドロップアウト遺伝子座は互いに遺伝子的に交雑され、完全なコングリシニンノックアウトダイズ種子を作り出すであろう。
別の編集実験において、3つのgRNA(配列番号28、29、30)を、5つの高度に発現されたコングリシニン遺伝子(glyma.20g148200、glyma.20g148300、glyma.20g148400、glyma.10g246300、及びglyma.10g246500)並びに1つの適切なレベルで発現されたglyma.20g146200を、多重フレームシフトノックアウトアプローチでフレームシフトノックアウトを行うように設計した。ホモ接合型T2種子を、タンパク質プロファイル変化及びアミノ酸組成改善について分析する。
レグヘモグロビン過剰発現アプローチ及びコングリシニンノックアウトアプローチを、いずれかの遺伝子交雑によって、又はレグヘモグロビン過剰発現ダイズ系統において遺伝子編集を実施することによって、又はレグヘモグロビン過剰発現カセットをコングリシニンノックアウトダイズ系統中に再形質転換することによって組み合わされる。これらのダイズ種子中のコングリシニンタンパク質が存在しないことで、グリシニン又は他のダイズタンパク質の含有量は、タンパク質リバランシングによってコングリシニンタンパク質の喪失を補うように増加することが予想される。ダイズレグヘモグロビン過剰発現とコングリシニンドロップアウトアプローチを組み合わせることによって、ダイズ種子中のレグヘモグロビンレベルが増加すると予想される。
実施例7:ダイズ種子中のダイズレグヘモグロビン発現の特性評価
実施例1及び2に記載された8つのトランスジェニック構築物について、T1種子を生成した。結果は非常に驚くべきものであった。GY1-SP/GY1塩基性サブユニット標的化デザインを有する2つの構築物(図1及び2の実験4及び8)において、蓄積されたレグヘモグロビンはほとんどなかった。レクチンSP標的化デザインを有する2つの構築物(図1及び2の実験3及び7)において、非常に低いレベルのレグヘモグロビン蓄積があり(総種子タンパク質の約0.1%)、ダイズは黄色に見えた。最良の発現デザインは、レグヘモグロビンに対するシグナルペプチドを有さない2つの構築物(図1及び2に示された実験1及び5)からのものであった。図8及び10に示すように、「赤」(すなわち、横断面がピンク色に染まった)色の種子は、これらの2つの実験では目で容易に識別可能であって、レグヘモグロビン発現レベルが高く、タンパク質が鉄中心モルフィリン(ヘム)を含有するレグヘモグロビンタンパク質複合体として効率的に組み立てられたことを示している。実験1デザイン(シグナルペプチドなし)からの5つのイベント及び実験5デザイン(シグナルペプチドがないことに加えて2つのヘム経路遺伝子がない)からの4つのイベントを生じさせ、9つのイベント全てが「赤い」種子表現型を有していた。種子中のレグヘモグロビンの存在を、種子タンパク質抽出、SDS PAGEゲル、及びクマシーブルー染色を実施することによって更に確認した。16KDのレグヘモグロビンは、クマシーブルーによって容易に見ることができる(図9及び11の矢印)。図9において、レーン1、2、3、5、6、7、9、10、11は、実験1デザインにおける3つの独立したイベントからの「赤い」ピンク色のレグヘモグロビン陽性種子からのタンパク質サンプルであり、レーン4、8、12は、同じ3つのイベントからの黄色のnull隔離種子からのタンパク質サンプルである。同様に、図11において、#14レーンは黄色のnull隔離種子からのものであり、#11、#21、#33、#43は実験5デザインからの3つの独立したイベントからの「赤い」(ピンク色の)レグヘモグロビン陽性種子に由来するタンパク質サンプルである。
実施例1及び2に記載された8つのトランスジェニック構築物について、T1種子を生成した。結果は非常に驚くべきものであった。GY1-SP/GY1塩基性サブユニット標的化デザインを有する2つの構築物(図1及び2の実験4及び8)において、蓄積されたレグヘモグロビンはほとんどなかった。レクチンSP標的化デザインを有する2つの構築物(図1及び2の実験3及び7)において、非常に低いレベルのレグヘモグロビン蓄積があり(総種子タンパク質の約0.1%)、ダイズは黄色に見えた。最良の発現デザインは、レグヘモグロビンに対するシグナルペプチドを有さない2つの構築物(図1及び2に示された実験1及び5)からのものであった。図8及び10に示すように、「赤」(すなわち、横断面がピンク色に染まった)色の種子は、これらの2つの実験では目で容易に識別可能であって、レグヘモグロビン発現レベルが高く、タンパク質が鉄中心モルフィリン(ヘム)を含有するレグヘモグロビンタンパク質複合体として効率的に組み立てられたことを示している。実験1デザイン(シグナルペプチドなし)からの5つのイベント及び実験5デザイン(シグナルペプチドがないことに加えて2つのヘム経路遺伝子がない)からの4つのイベントを生じさせ、9つのイベント全てが「赤い」種子表現型を有していた。種子中のレグヘモグロビンの存在を、種子タンパク質抽出、SDS PAGEゲル、及びクマシーブルー染色を実施することによって更に確認した。16KDのレグヘモグロビンは、クマシーブルーによって容易に見ることができる(図9及び11の矢印)。図9において、レーン1、2、3、5、6、7、9、10、11は、実験1デザインにおける3つの独立したイベントからの「赤い」ピンク色のレグヘモグロビン陽性種子からのタンパク質サンプルであり、レーン4、8、12は、同じ3つのイベントからの黄色のnull隔離種子からのタンパク質サンプルである。同様に、図11において、#14レーンは黄色のnull隔離種子からのものであり、#11、#21、#33、#43は実験5デザインからの3つの独立したイベントからの「赤い」(ピンク色の)レグヘモグロビン陽性種子に由来するタンパク質サンプルである。
単一の種子分析のためのサンプル調製
個々の隔離したT0植物から収穫した単一のT1赤色及び黄色ダイズを、キャップ付きのSpex Certiprep 1/2×2’’ポリカーボネートバイアル(cat#3116PC)内に配置した。3/8’’ステンレススチールボールベアリングを添加した。Spex Certiprep 2000 Geno/Grinder内で1500ストローク/分にて、各サイクル間で30秒の間隔及び1分の休止での3サイクルの粉砕を実施した。
個々の隔離したT0植物から収穫した単一のT1赤色及び黄色ダイズを、キャップ付きのSpex Certiprep 1/2×2’’ポリカーボネートバイアル(cat#3116PC)内に配置した。3/8’’ステンレススチールボールベアリングを添加した。Spex Certiprep 2000 Geno/Grinder内で1500ストローク/分にて、各サイクル間で30秒の間隔及び1分の休止での3サイクルの粉砕を実施した。
或いは、ダイズを予め冷却した乳鉢内で、液体窒素の存在下で、ダイズを乳棒で粉砕した。次いで、粉末を48時間凍結乾燥させ、処理するまでデシケーター内で-20℃にて保管した。
含水量の測定を、以下のように米国油脂化学協会(AOCS公定法Ba 2a-38(少量サンプル用に改変))に従って実施した。
粉末状サンプル材料を秤量し(およそ100mg;0.1mgの精度で)、予め秤量し(及び記録した)、13×100mmのガラスチューブVWR(53283-800)に入れて再び秤量する。
サンプルを、130℃に余熱した強制空気オーブン内に配置する。
材料を2時間乾燥させる。
チューブを取り出し、デシケーターキャビネットに入れ、室温に戻し、その後再び秤量する。
チューブにキャップをして、残留乾燥材料をその後のタンパク質の燃焼分析(以下を参照)のために保存する。
更なる分析のためにデシケーター内で保管する。
総タンパク質分析。
上記のオーブン乾燥をさせるか、又は凍結乾燥させた粉末の燃焼分析によってタンパク質含有量を推定した。分析を、N-タンパク質モードで運転するFlash 1112EA燃焼分析装置(Thermoから市販されている)で、アスパラギン酸を標準として使用して、製造元の指示に従って実施した。Mettler-Toledo MX5微量天秤上で、0.001mgの精度で秤量した30~40mgの粉末状サンプルを分析用に使用した。タンパク質含有量を、分析装置によって決定された%Nに6.25を掛けることによって算出した。最終的タンパク質含有量は、オーブン乾燥させた材料についての乾燥ベースで、及び凍結乾燥された材料について測定されたものを基準として想定された。
上記のオーブン乾燥をさせるか、又は凍結乾燥させた粉末の燃焼分析によってタンパク質含有量を推定した。分析を、N-タンパク質モードで運転するFlash 1112EA燃焼分析装置(Thermoから市販されている)で、アスパラギン酸を標準として使用して、製造元の指示に従って実施した。Mettler-Toledo MX5微量天秤上で、0.001mgの精度で秤量した30~40mgの粉末状サンプルを分析用に使用した。タンパク質含有量を、分析装置によって決定された%Nに6.25を掛けることによって算出した。最終的タンパク質含有量は、オーブン乾燥させた材料についての乾燥ベースで、及び凍結乾燥された材料について測定されたものを基準として想定された。
LC-MS-MSによるグロビンタンパク質の定量化。
グロビンタンパク質のアミノ酸配列(表1;配列番号2)を、潜在的なトリプシン消化部位及び定量的質量分析に対する結果として生じるペプチドの適合性についてインシリコで評価した。以下の基準を適用した;
ペプチドは、6~20個のアミノ酸の長さであった
ペプチド内のアミノ酸は、二次改変を受ける可能性は低かった。
硫黄含有アミノ酸の非存在
溶解度及び等電点。
グロビンタンパク質のアミノ酸配列(表1;配列番号2)を、潜在的なトリプシン消化部位及び定量的質量分析に対する結果として生じるペプチドの適合性についてインシリコで評価した。以下の基準を適用した;
ペプチドは、6~20個のアミノ酸の長さであった
ペプチド内のアミノ酸は、二次改変を受ける可能性は低かった。
硫黄含有アミノ酸の非存在
溶解度及び等電点。
これらの基準を使用して、3つの見込みのあるペプチドを同定した。これらを、Thermo Fisher Scientificからthermofisher.com/us/en/home/life-science/protein-biology/peptides-proteins/custom-peptide-synthesis-services/peptide-analyzing-tool.htmlで入手可能なオンラインアプリケーションを使用して更に分析した。このアプリケーションの出力に基づいて、2つのペプチドを選択した。これらのペプチドの配列を、NCBIタンパク質BLAST(タンパク質-タンパク質)プログラムblast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&PAGE_TYPE=BlastSearch&LINK_LOC=blasthomeを使用して、BLAST検索にかけ、ダイズ(Glycine max)ゲノム内のダイズグロビン配列に特徴的であることを決定した。ペプチドを、以下のように合成した:
ペプチド1:K.ANGTVVADAALGSIHAQK.A[配列番号2の78位~95位]配列番号33
ペプチド2:K.AITDPQFVVVK.E[96位~106位]配列番号34
ペプチド1:K.ANGTVVADAALGSIHAQK.A[配列番号2の78位~95位]配列番号33
ペプチド2:K.AITDPQFVVVK.E[96位~106位]配列番号34
「.」は酵素消化部位を示し、括弧内の値は成熟グロビンタンパク質のN末端に対するアミノ酸残基位置を示す。
500ppmの濃度でのペプチドストックを調製し、-80℃で一定分量として保存した。これらのストックを、ペプチドの定量分析に対する適合性を更に評価するために用いた。ペプチドストックを、質量分析計(SCIEX 5500 Qtrap;SCIEX LLC,Redwood City,CA USA)に注入し、検出用のパラメータを最適化した。分析の結果、ペプチドAITDPQFVVVK(ペプチド2)が、親イオンの+2電荷状態(608.9m/z)を伴って、最良の候補物質であることが判明した。衝突セル内での断片化の最適化後に、最も高い存在量のサロゲート娘イオン(816.6m/z)を選択し、それに対して定量化した。第2の確認イオン(444.3m/z)も選択した。
サンプルの調製
約10~20mgの粉末サンプル(秤量し、0.1mgの精度で記録した)を、1.2mlのマイクロタイターチューブ(Fisherブランド02-681-376)内に置いた。抽出バッファー、8mMの(3-[(3-コールアミドプロピル)ジメチルアンモニオ]-1-プロパンスルホネート水和物、(CHAPS);0.1%のTriton X-100、pH8.4を25の組織重量対体積比で添加した。1つの小さな鋼球を各バイアルに添加し、栓をした後に、サンプルをGeno/Grinder内;毎分1150振動数にて30秒間抽出した。鋼球を除去した均質化チューブの内容物を、清浄な1.5mlの微量遠心管に定量的に移し、サンプルを微量遠心機内;10,670×gで10分間清澄化させた。上清を、清浄な1.5mlの微量遠心管に移し、サンプルを10,670×gで5分間再度遠心分離した。上清の総可溶性タンパク質濃度を、ブラッドフォードアッセイを使用して決定し、結果を用いてサンプルを正規化して、トリプシン消化バッファー(100mMの重炭酸アンモニウム;0.05%のTween-20;pH8.3)で希釈することによって、1ml当たり1mgの可溶性タンパク質にした。50ulのタンパク質正規化抽出物を、100ulのトリプシン消化バッファー、6ulの0.25M DTT(ジチオスレイトール;消化バッファー中)に添加し、それらを95℃で20分間インキュベートすることによってトリプシン消化のためのサンプルを調製した。ヨードアセトアミドの300mMストック6ulを各サンプルに添加し、それらを暗所で室温にて1時間インキュベートした。トリプシン(Pierce,MS Grade;Thermo Fisher Scientific)の0.1ug/ulストックの10ulを各サンプルに添加し、それらを静的インキュベーター内で37℃にて一晩インキュベートした。10%のギ酸10ulを添加することによって、トリプシン消化を停止させた。次いで、サンプルをUHPLC-MS-MS分析を使用して分析した。
約10~20mgの粉末サンプル(秤量し、0.1mgの精度で記録した)を、1.2mlのマイクロタイターチューブ(Fisherブランド02-681-376)内に置いた。抽出バッファー、8mMの(3-[(3-コールアミドプロピル)ジメチルアンモニオ]-1-プロパンスルホネート水和物、(CHAPS);0.1%のTriton X-100、pH8.4を25の組織重量対体積比で添加した。1つの小さな鋼球を各バイアルに添加し、栓をした後に、サンプルをGeno/Grinder内;毎分1150振動数にて30秒間抽出した。鋼球を除去した均質化チューブの内容物を、清浄な1.5mlの微量遠心管に定量的に移し、サンプルを微量遠心機内;10,670×gで10分間清澄化させた。上清を、清浄な1.5mlの微量遠心管に移し、サンプルを10,670×gで5分間再度遠心分離した。上清の総可溶性タンパク質濃度を、ブラッドフォードアッセイを使用して決定し、結果を用いてサンプルを正規化して、トリプシン消化バッファー(100mMの重炭酸アンモニウム;0.05%のTween-20;pH8.3)で希釈することによって、1ml当たり1mgの可溶性タンパク質にした。50ulのタンパク質正規化抽出物を、100ulのトリプシン消化バッファー、6ulの0.25M DTT(ジチオスレイトール;消化バッファー中)に添加し、それらを95℃で20分間インキュベートすることによってトリプシン消化のためのサンプルを調製した。ヨードアセトアミドの300mMストック6ulを各サンプルに添加し、それらを暗所で室温にて1時間インキュベートした。トリプシン(Pierce,MS Grade;Thermo Fisher Scientific)の0.1ug/ulストックの10ulを各サンプルに添加し、それらを静的インキュベーター内で37℃にて一晩インキュベートした。10%のギ酸10ulを添加することによって、トリプシン消化を停止させた。次いで、サンプルをUHPLC-MS-MS分析を使用して分析した。
LC/MS/MS法
トリプシン消化の定量分析を、陽イオンモードで動作する、SCIEX 5500 Qtrap検出器を備えたUHPLC(Agilent 1290)で実施した。サンプル及び標準物質(10ulの注入量)を、40℃で維持したWaters Cortex C18、2.7um(2.1×100mm)逆相カラム上で分離させた。溶媒流量は、90%の溶媒A(99.9%のMSグレード水;0.1%のギ酸)-10%の溶媒A(99.9%のアセトニトリル、0.1%のギ酸)の開始条件で、300ul/分であった。条件を、60%の溶媒A-40%の溶媒Bに7分間にわたって高め、続いて10%の溶媒A-90%の溶媒Bに0.5分間にわたって高めた。次いで、溶媒を開始条件に3分間にわたって戻し、カラムを開始条件下で更に3分間平衡化させて、その後次の注入を行った。エレクトロスプレーイオン化(ESI)ソースを用いて、サンプルをMSに導入した。ソースパラメータは、以下の通りであった:デクラスタリングポテンシャル 135(V)、温度 350℃、及びイオンスプレー電圧 350V。MRM(多重反応モニタリング)検出技術を、親+2分子(m/z608.9)を断片化するために35(eV)の衝突セルエネルギーを使用して、プロダクトイオン(m/z:816.6)を同定し定量化するために用いた。別のプロダクトイオン(m/z:444.3)を用いて、同一性を確認した(存在又は非存在に基づいて)。上述したサンプル調製ステップの全てを通して採取されたペプチドの標準曲線に対して定量化を実施した。
トリプシン消化の定量分析を、陽イオンモードで動作する、SCIEX 5500 Qtrap検出器を備えたUHPLC(Agilent 1290)で実施した。サンプル及び標準物質(10ulの注入量)を、40℃で維持したWaters Cortex C18、2.7um(2.1×100mm)逆相カラム上で分離させた。溶媒流量は、90%の溶媒A(99.9%のMSグレード水;0.1%のギ酸)-10%の溶媒A(99.9%のアセトニトリル、0.1%のギ酸)の開始条件で、300ul/分であった。条件を、60%の溶媒A-40%の溶媒Bに7分間にわたって高め、続いて10%の溶媒A-90%の溶媒Bに0.5分間にわたって高めた。次いで、溶媒を開始条件に3分間にわたって戻し、カラムを開始条件下で更に3分間平衡化させて、その後次の注入を行った。エレクトロスプレーイオン化(ESI)ソースを用いて、サンプルをMSに導入した。ソースパラメータは、以下の通りであった:デクラスタリングポテンシャル 135(V)、温度 350℃、及びイオンスプレー電圧 350V。MRM(多重反応モニタリング)検出技術を、親+2分子(m/z608.9)を断片化するために35(eV)の衝突セルエネルギーを使用して、プロダクトイオン(m/z:816.6)を同定し定量化するために用いた。別のプロダクトイオン(m/z:444.3)を用いて、同一性を確認した(存在又は非存在に基づいて)。上述したサンプル調製ステップの全てを通して採取されたペプチドの標準曲線に対して定量化を実施した。
表8は、黄色(WT)及び標的化配列を含まないレグヘモグロビン構築物(実験1からの材料)を発現する隔離T0植物から収穫した赤色ダイズの定量的質量分析を示す。可溶性タンパク質を分析された抽出物中で測定し、燃焼分析によって決定されるように、マメ粉の総タンパク質含有量に対する%として表される。レグヘモグロビンタンパク質を、UHPLC-MS-MSによって定量化し、可溶性タンパク質又は総タンパク質ベースの重量%で表される。
出発物質の総タンパク質含有量に対する%としての抽出されたサンプルの可溶性タンパク質の発現は、抽出の効率が27.7~81.3%の範囲であり、平均で61.3%であることを示した(表8)。これは、単位当たりの可溶性タンパク質ベース又は単位当たりの総タンパク質ベースで表されるとき、グロビンタンパク質含有量%で実質的な差をもたらした。黄色の野生型のマメ(GMZ3A9.1.30 WT及びGMZ3A9.1.20;WT)は、それらの中に検出可能なグロビンタンパク質を有さなかった(表8)。赤色のマメは、可溶性タンパク質ベースで表されるとき、0.34~1.93重量%のグロビンタンパク質を有しており、総タンパク質ベースで表されるとき、最大0.8重量%のグロビンタンパク質を有していた。
抽出効率を改善しサンプル調製をより均一にするために、サンプル調製を以下のように改変した;10+/-0.5mgの粉末サンプル(秤量し、0.1mgの精度で記録した)を1.2mlのマイクロタイターチューブ(Fisherブランド02-681-376)中に置いた。抽出バッファー、8mMの(3-[(3-コールアミドプロピル)ジメチルアンモニオ]-1-プロパンスルホネート水和物、(CHAPS);0.1%のTriton X-100、pH8.4を50の組織重量対体積比で添加した。1つの小さな鋼球を各バイアルに添加し、栓をした後に、サンプルをGeno/Grinder内;毎分1150振動数にて30秒間抽出し、次いで回転(end over end)ローターを10分間行い、次いでジェノグライディングステップを繰り返した。鋼球を除去した均質化チューブの内容物を、清浄な1.5mlの微量遠心管に定量的に移し、サンプルを微量遠心機内;10,670×gで10分間清澄化させた。上清を、清浄な1.5mlの微量遠心管に移し、サンプルを10,670×gで5分間再度遠心分離した。上清の総可溶性タンパク質濃度を、ブラッドフォードアッセイを使用して決定し、結果を用いてサンプルを正規化して、トリプシン消化バッファー(100mMの重炭酸アンモニウム;0.05%のTween-20;pH8.3)で希釈することによって、1ml当たり1mgの可溶性タンパク質にした。25ulのタンパク質正規化抽出物を、125ulのトリプシン消化バッファー、6ulの0.25M DTT(ジチオスレイトール;消化バッファー中)に添加し、それらを95℃で20分間インキュベートすることによってトリプシン消化のためのサンプルを調製した。ヨードアセトアミドの300mMストック6ulを各サンプルに添加し、それらを暗所で室温にて1時間インキュベートした。トリプシン(Pierce,MS Grade;Thermo Fisher Scientific)の0.1ug/ulストックの10ulを各サンプルに添加し、それらを静的インキュベーター内で37℃にて一晩インキュベートした。10%のギ酸10ulを添加することによって、トリプシン消化を停止させた。次いで、サンプルをUHPLC-MS-MS分析を使用して分析した。
改変された抽出法は、平均で97%(95.5~100%の範囲)の第1の抽出で抽出される可溶性タンパク質をもたらした。これは、抽出される材料の総タンパク質含有量の平均で71%(62~78%の範囲)に相当した。この方法を用いて、レグヘモグロビンのみが発現された場合(実験1)のイベントからの黄色及び赤色ダイズを、レグヘモグロビンタンパク質が2つのヘム経路遺伝子と併せて発現された場合(シグナルペプチドなし)(実験5)のイベントからの黄色及び赤色ダイズと比較した。結果を表9に示す。表9は、レグヘモグロビン構築物のみ(標的化配列なし)を発現する実験1又は2つのヘム経路遺伝子と併せてレグヘモグロビン構築物(標的化配列なし)を発現する(実験5)隔離T0植物から収穫された黄色(WT)及び赤色ダイズの定量的質量分析である。可溶性タンパク質を分析された抽出物中で測定し、燃焼分析によって決定されるように、マメ粉の総タンパク質含有量に対する%として表される。レグヘモグロビンタンパク質を、UHPLC-MS-MSによって定量化し、可溶性タンパク質又は総タンパク質ベースの重量%で表す。
データは、レグヘモグロビンタンパク質の量が両方の実験で同様なレベルに達したことを示しており、ヘム経路のアップレギュレーションが最大レベルを有するこれらのイベントにおけるレグヘモグロビンタンパク質のレベルに正又は負の影響も及ぼさなかったことを示し、総タンパク質ベースで表されるとき、レグヘモグロビンプラスヘム経路遺伝子(実験5)では0.82%に達し、レグヘモグロビンタンパク質のみの材料(実験1)では0.80%に達した。
視覚的には、各実験の豆の赤色における明らかな強度の差はなく、これは2つの実験から豆に含まれるレグヘモグロビンタンパク質複合体の量に差がないことを示していると解釈された。実験1及び5からの種子を、次の世代で分析した。
表9Aのデータは、ホモ接合型種子が同じイベントからのT1種子よりもより高い量のレグヘモグロビンを有することを示している。例えば、イベントGMZ3A9.001.24aからのT2種子では、総タンパク質の1.38%(乾燥ベースで)がレグヘモグロビンであることが決定され、これはT1種子における0.65重量%と比較して2倍の増加であった。同様に、イベントGM9RDV.001.5aからのT2種子では、総タンパク質の1.84重量%(乾燥ベースで)がレグヘモグロビンであることが決定され、これは0.71重量%のT1種子の値(3つの種子の平均)と比較して、2.6倍の増加であった。データは、種子がホモ接合型であるとき、レグヘモグロビンレベルが2倍になることを示している。
実施例8:高オレイン酸系統によるダイズレグヘモグロビン系統のスタッキング
上述したトランスジェニックレグヘモグロビンイベントを、総脂肪酸に対して少なくとも50%、70%、又は75%のオレイン酸を含有するような高オレイン酸系統と遺伝的に交雑させる。同様に、上述したレグヘモグロビン遺伝子編集多様体を、総脂肪酸に対して少なくとも50%、70%、又は75%のオレイン酸を含有するような高オレイン酸系統と遺伝的に交雑させる。或いは、レグヘモグロビン遺伝子編集を高オレイン酸系統において直接実施する。更に、両方のレグヘモグロビン遺伝子編集及びFAD2/FAD3編集を一緒に実施して、遺伝子編集アプローチを通して、高オレイン酸形質を有するレグヘモグロビン形質を排他的に積み重ねる。結果として得られたダイズ種子は増加した栄養価を有し、ダイズタンパク質、ダイズ単離物、又はダイズ濃縮物に改善された風味を提供する。
上述したトランスジェニックレグヘモグロビンイベントを、総脂肪酸に対して少なくとも50%、70%、又は75%のオレイン酸を含有するような高オレイン酸系統と遺伝的に交雑させる。同様に、上述したレグヘモグロビン遺伝子編集多様体を、総脂肪酸に対して少なくとも50%、70%、又は75%のオレイン酸を含有するような高オレイン酸系統と遺伝的に交雑させる。或いは、レグヘモグロビン遺伝子編集を高オレイン酸系統において直接実施する。更に、両方のレグヘモグロビン遺伝子編集及びFAD2/FAD3編集を一緒に実施して、遺伝子編集アプローチを通して、高オレイン酸形質を有するレグヘモグロビン形質を排他的に積み重ねる。結果として得られたダイズ種子は増加した栄養価を有し、ダイズタンパク質、ダイズ単離物、又はダイズ濃縮物に改善された風味を提供する。
実施例9:ダイズからのレグヘモグロビン複合体の抽出
レグヘモグロビン複合化タンパク質が下流製品として使用されるためには、ダイズが処理される必要がある。典型的には、これには、油のテンパリング、クラッキング、脱皮(dehulling)、溶媒除去、及び残留溶媒を除去して、プロテアーゼインヒビターなどのタンパク質性抗栄養因子を不活性化するためのトースティングを伴う。これらの処理ステップから得られるミール又は穀粉(典型的には、47.5%超のタンパク質)を、可溶性糖類を除去することによってタンパク質画分を濃縮するために更に精製され、ダイズタンパク質濃縮物(典型的には、65%超のタンパク質)を形成することができる。ダイズタンパク質濃縮物を作製するために使用される3つのプロセスがあり、いわゆるアルコール洗浄、酸洗浄、熱水抽出である(Deak,N.A.,Johnston,L.A.,Lusas,E.W.,and Rhee,K.C.,2008.Soybeans:Chemistry,Production,Processing,and utilization.Johnston,L.A.,White,P.J.,and Galloway,R.eds AOCS Press)。これらのプロセスは全て、レグヘモグロビン複合体を実質的に脱ヘム化し、回収及びその後の使用には不向きなものにすることが予想される。
レグヘモグロビン複合化タンパク質が下流製品として使用されるためには、ダイズが処理される必要がある。典型的には、これには、油のテンパリング、クラッキング、脱皮(dehulling)、溶媒除去、及び残留溶媒を除去して、プロテアーゼインヒビターなどのタンパク質性抗栄養因子を不活性化するためのトースティングを伴う。これらの処理ステップから得られるミール又は穀粉(典型的には、47.5%超のタンパク質)を、可溶性糖類を除去することによってタンパク質画分を濃縮するために更に精製され、ダイズタンパク質濃縮物(典型的には、65%超のタンパク質)を形成することができる。ダイズタンパク質濃縮物を作製するために使用される3つのプロセスがあり、いわゆるアルコール洗浄、酸洗浄、熱水抽出である(Deak,N.A.,Johnston,L.A.,Lusas,E.W.,and Rhee,K.C.,2008.Soybeans:Chemistry,Production,Processing,and utilization.Johnston,L.A.,White,P.J.,and Galloway,R.eds AOCS Press)。これらのプロセスは全て、レグヘモグロビン複合体を実質的に脱ヘム化し、回収及びその後の使用には不向きなものにすることが予想される。
或いは、ダイズはダイズタンパク質単離物(典型的には、90%超のタンパク質)の形態に処理され得る。これは、不溶性炭水化物(繊維)画分のバルクを除去するための遠心分離の前に、軽くトーストされた白色フレーク(脱脂ミール)のタンパク質画分の可溶化によって達成される。次いで、pHを調節することによってタンパク質を沈殿させ、洗浄して残っている可溶性炭水化物を除去する。精製されたタンパク質画分を、粉末を乾燥させる前に、残留プロテアーゼインヒビター活性及び微生物汚染物質を不活性化するために低温殺菌する。ダイズ単離物生産プロセスにおけるこれらの最終的ステップもまた、レグヘモグロビン複合体を実質的に脱ヘム化し、それらを回収及び後続の使用のために不向きなものにすることが予想される。
ダイズからのレグヘモグロビンタンパク質の溶解性/抽出性を調べるために、以下の実験を実施した。赤色レグヘモグロビン発現ダイズからのダイズ粉末サンプル(10+/-0.5mg;秤量し、0.1mgの精度で記録した)を、1.2mlのマイクロタイターチューブ(Fisherブランド02-681-376)に配置した。抽出バッファー、8mMの(3-[(3-コールアミドプロピル)ジメチルアンモニオ]-1-プロパンスルホネート水和物、(CHAPS);0.1%のTriton X-100、pH8.4を50の組織重量対体積比で添加した。1つの小さな鋼球を各バイアルに添加し、栓をした後に、サンプルをGeno/Grinder内;毎分1150振動数にて30秒間抽出し、次いで回転(end over end)ローターを10分間行い、次いでジェノグライディングステップを繰り返した。鋼球を除去した均質化チューブの内容物を、清浄な1.5mlの微量遠心管に定量的に移し、サンプルを微量遠心機内;10,670×gで10分間清澄化させた。上清を清浄な1.5mlの微量遠心管に移した。このステップからの残留ペレットを、記載したように更に2回抽出した。第1、第2及び第3の上清からのアリコートを、実施例7に記載されるように、可溶性タンパク質及びレグヘモグロビンについて分析した。結果を表10に示す。
データは、レグヘモグロビンタンパク質の全てが第1の抽出で回収されたことを示す。
実施例10:レグヘモグロビンダイズに対する酵素的ダイズ処理(E-SOY)
タンパク質をダイズミールから単離するための課題は、物理的に処理され得るスラリーを得るための高い水:固形物比を必要とすることである。これはプロセスにおける大量の水につながり、このことが抽出されたタンパク質の濃縮、不溶化ミール残留物の乾燥、及び最終的に廃水処理に関連する処理コストを増大させる。ミール中の不溶性又は粘性多糖類材料を、可溶化された短鎖多糖類に変換するための食品グレードの多糖類分解酵素を使用する脱脂ダイズミールからタンパク質を単離するための新規なアプローチは、タンパク質抽出及び単離に必要とされる大量の水を大幅に削減する。より伝統的なダイズタンパク質濃縮物及び単離物を単離するために使用されるこのプロセスは、無傷のレグヘモグロビン複合体を維持しながら、レグヘモグロビンの単離を容易にすることが予想される。一般化された酵素ダイズ(E-SOY)プロセスを、以下に概説する。
タンパク質をダイズミールから単離するための課題は、物理的に処理され得るスラリーを得るための高い水:固形物比を必要とすることである。これはプロセスにおける大量の水につながり、このことが抽出されたタンパク質の濃縮、不溶化ミール残留物の乾燥、及び最終的に廃水処理に関連する処理コストを増大させる。ミール中の不溶性又は粘性多糖類材料を、可溶化された短鎖多糖類に変換するための食品グレードの多糖類分解酵素を使用する脱脂ダイズミールからタンパク質を単離するための新規なアプローチは、タンパク質抽出及び単離に必要とされる大量の水を大幅に削減する。より伝統的なダイズタンパク質濃縮物及び単離物を単離するために使用されるこのプロセスは、無傷のレグヘモグロビン複合体を維持しながら、レグヘモグロビンの単離を容易にすることが予想される。一般化された酵素ダイズ(E-SOY)プロセスを、以下に概説する。
プロセスフローチャート
図12は、E-SOYプロセスについての一般化されたプロセスフローチャートの一例を示す。実験室で脱脂された全ダイズミール(典型的には、実験室プロセスでは40gのアリコート)を、ビーカー内で余熱した水と3:1の液体:固形物の比で混合した。インキュベーション時間後、ビーカーを調節された水浴(典型的には、50℃に維持された)上に置いた。低剪断インペラを装備したオーバーヘッドスターラー(Lightnin Mixer)を用いて、ミールドウを撹拌した。混合物の粘度は、200rpmでドウを撹拌するのに必要なスターラー出力(ワット)によって推定された。撹拌しながら5N HClのアリコートをドウに滴加し(典型的には、4~5mL)、スラリーのpHをpH3.8~4.5の範囲に低下させた。異なる原料のpHを低下させるのに必要な酸の抽出量を、大量の水中に懸濁させた原料を使用して別々に決定した。市販の酵素のアリコート(典型的には、200μLのセルラーゼ、ヘミセルラーゼ、及びペクチナーゼ、液体ペクチナーゼについては10μL)であった。次いで、ドウを撹拌して、様々な時間で酵素と反応させたが、日常的には3時間を使用した。オーバーヘッドミキサーの出力読み取り値を記録し、オーバーヘッドミキサーの出力読み取り値を、ドウスラリーの粘度を監視するために間隔をおいて記録した。
図12は、E-SOYプロセスについての一般化されたプロセスフローチャートの一例を示す。実験室で脱脂された全ダイズミール(典型的には、実験室プロセスでは40gのアリコート)を、ビーカー内で余熱した水と3:1の液体:固形物の比で混合した。インキュベーション時間後、ビーカーを調節された水浴(典型的には、50℃に維持された)上に置いた。低剪断インペラを装備したオーバーヘッドスターラー(Lightnin Mixer)を用いて、ミールドウを撹拌した。混合物の粘度は、200rpmでドウを撹拌するのに必要なスターラー出力(ワット)によって推定された。撹拌しながら5N HClのアリコートをドウに滴加し(典型的には、4~5mL)、スラリーのpHをpH3.8~4.5の範囲に低下させた。異なる原料のpHを低下させるのに必要な酸の抽出量を、大量の水中に懸濁させた原料を使用して別々に決定した。市販の酵素のアリコート(典型的には、200μLのセルラーゼ、ヘミセルラーゼ、及びペクチナーゼ、液体ペクチナーゼについては10μL)であった。次いで、ドウを撹拌して、様々な時間で酵素と反応させたが、日常的には3時間を使用した。オーバーヘッドミキサーの出力読み取り値を記録し、オーバーヘッドミキサーの出力読み取り値を、ドウスラリーの粘度を監視するために間隔をおいて記録した。
溶液の粘度が、自由流動スラリーを形成するのに十分なほど低減したときに、混合物を500uMメッシュのポリプロピレンスクリーンが装備されているブフナー漏斗に定量的に移し、真空濾過した。フィルターケーキを、60mLの水で洗浄した。濾液を、105umメッシュのポリプロピレンスクリーンを装備した第2のブフナー漏斗上を通過させて、洗浄ボトルからの脱イオン水で濯いだ。500um及び105umの濾過からのフィルターケーキを、準備した容器に定量的に移し、65℃の真空オーブン内で少なくとも48時間乾燥させた。合わせたフィルターケーキの乾燥重量を決定し、残渣(ミール残渣)をコーヒーミルで粉砕して、その後更に分析した。
105um濾過からの濾液スラリーを、2N NaOHでpH6.5~7に調節したが、レグヘモグロビン単離のためには、7~11のpHを使用するであろう。撹拌後に、溶液を遠心分離ボトルに移し、固定角ローター内で7000rpmで10分間遠心分離した。上清溶液を、真空下の濾過のための使い捨て0.45um-1Lフィルター装置に注意深く注いだ。遠心分離機の固形物(濃縮沈殿タンパク質濃縮物、又はCPPC)を脱イオン水中に懸濁させ、準備したフラスコに定量的に移し、シェル凍結し、凍結乾燥させた。回収されたCPPCの乾燥重量を、凍結乾燥後に決定した。
0.45um濾過された可溶性タンパク質溶液(SPS)の上清を、PES膜モジュール(Vivaflow 200、実験に応じて可変MWCO)を装備した限外濾過装置に移した。SPSを約50mLの容量まで濃縮し、次いで、脱イオン水(実験に応じて、100~300mL)で透析濾過した。UF/DF透過液を、更なる処理のためにフラスコ内に収集した。UF/DFステップが完了したら、保持溶液を遠心分離ボトルに定量的に移し、7000rpmで10分間遠心分離し、UF/DFプロセス中に形成されたあらゆる沈殿物を除去した。上清を、準備したフラスコにデカンテーションし、シェル凍結及び凍結乾燥させた。回収した固形物(濃縮可溶性タンパク質単離物、又はCSPI)を秤量し、更なる研究のために保管した。遠心分離ステップから何らかの固形物が回収される場合(可溶性タンパク質溶液沈殿物、又はSPS-ppt)、それを別の準備したフラスコに定量的に移し、凍結し、凍結乾燥し、分析した。
UF/DFプロセスの一部の変更において、一連の減少するMWCOポロシティを使用するシーケンシャル方式UF/DFを検討した。このプロセスは、最も高いMWCOステップからの透過物が次に低いMWCO膜を連続して通過し、保持物が個々の準備されたフラスコに移され、凍結及び凍結乾燥される以外は本質的に同じである。
最終的限外濾過透過液をロータリーエバポレーター上で濃縮し、準備した丸底フラスコ内で乾燥させた。フラスコを真空オーブンに移し、65℃で少なくとも48時間更に乾燥させた。固形物の乾燥重量を決定し、材料をフラスコ壁から擦り取り、容器に移して保管した。
タンパク質を、燃焼分析装置(CE Elantech,Flash EA 1112シリーズ)を使用して、総窒素含有量として決定した。総窒素含有量を、%Nに6.25を掛けることによって総タンパク質に変換した。
市販のダイズミールからのタンパク質の回収を、表11に示す。
ダイズタンパク質の異なる溶解度、及びそれらのpH6未満での低い溶解度のために、抽出されたダイズミールのミール残渣(MR)画分は、66.3%のタンパク質純度で開始タンパク質の65%を保持した。これは、実際には、元々の50.9%のタンパク質含有量からのダイズミールの濃縮に相当し、>65%のタンパク質濃度の基準を満たす。初期タンパク質のはるかに低い割合が濃縮物及び単離物の画分で回収され、これらの生成物の初期タンパク質でわずか15%しか回収されなかった。濃縮物画分は、実際には、ミール残渣よりもタンパク質含有量が低かった(62.2%対66.3%)。単離物画分の純度は、102.5%と優れており、比較的低いレベルのタンパク質が、UF透過液で見出された。総タンパク質の回収は、フィルタースクリーンからミール残渣を分離することの物理的な難しさによって損なわれた。固形分の割合が高いことを考えると、消化されたミールスラリーの溶解したタンパク質からの固形物の異なる物理的分離を利用する方が効率的であり得る。
予想外の発見は、タンパク質単離物がタンパク質画分の分子量に基づいて予測されたよりもはるかに高いMWCO限外濾過膜を使用して回収できることであった。予期せぬ溶液中の凝集挙動のために、はるかに高いMWCO膜を効率的に使用することができた。同様な回収が、レグヘモグロビン含有ダイズから生成された単離物に対して達成されると予想される。プロセスにおいてハイフラックス膜を使用することは、必要とされる総表面積を低減させ、それによって資本コストを節約する。
プロセスの初期段階中に高度に可溶性のレグヘモグロビンタンパク質を上清に優先的に抽出させ、限外濾過ステップ中での差次的精製を可能にするステップが実行される。これは、下流製品の配合に使用することができる高価値の共産物を生み出すであろう。
プロセスはテストされており、一般に的に表12に列挙した脂肪種子原料に適用可能である。
追加のタンパク質収量の改善は、脱脂及び脱溶媒化プロセスを最適化して、ミールマトリックス内のタンパク質及びレグヘモグロビン複合体の不可逆的な変性を最小限に抑えることによって実現される。更に、E-Soy処理スキームは、プロテオームリバランシングによって作り出されたダイズ(実施例6に示されたような)に対して最適化され、ミールからのタンパク質の潜在的な回収を更に増強させることができる。レグヘモグロビンタンパク質を発現するように操作された高オレイン酸油ダイズ(実施例8に示すような)に由来のミールのタンパク質抽出を最適化するためのE-Soyプロセスの更なる改変はまた、改善された感覚特性及び処理特性にもなおつながることが予想される。例えば、原料として使用される好適なダイズ単離物の例及び高オレイン酸ダイズと関連する利点については、参照により本明細書に組み込まれる米国特許第9,918,485号明細書を参照されたい。
実施例11:低減された抗栄養因子及び/又は増加されたタンパク質含有量と組み合わせてレグヘモグロビンを発現するダイズ種子
その後続の食品への組込みのためにダイズタンパク質を濃縮する多くの収穫後処理ステップは、タンパク質ベースの因子(例えば、プロテアーゼインヒビター)及び炭水化物ベースの因子(例えば、ラフィノ-オリゴ糖)などの抗栄養因子を除去又は不活性化する。そのようなステップは、レグヘモグロビン複合化タンパク質を脱ヘム化して、それを下流の使用に適さないものにする。
その後続の食品への組込みのためにダイズタンパク質を濃縮する多くの収穫後処理ステップは、タンパク質ベースの因子(例えば、プロテアーゼインヒビター)及び炭水化物ベースの因子(例えば、ラフィノ-オリゴ糖)などの抗栄養因子を除去又は不活性化する。そのようなステップは、レグヘモグロビン複合化タンパク質を脱ヘム化して、それを下流の使用に適さないものにする。
ゲノム編集技法は、クニッツトリプシンプロテアーゼインヒビター及びボーマン・バークプロテアーゼインヒビターのうちの1つ以上の発現を低減若しくはノックアウトさせ、及び/又はラフィノース及びスタキオースのうちの1つ以上の合成を阻害するために使用される。これらのダイズ種子はまた、以前の実施例に記載されたように、増加されたレグヘモグロビン又は複合体化レグヘモグロビンを発現するように編集される。或いは、増加されたレグヘモグロビン又は複合体化レグヘモグロビンを発現する編集されたダイズは、クニッツトリプシンプロテアーゼインヒビター及びボーマン・バークプロテアーゼインヒビターの発現を低減若しくはノックアウトさせ、及び/又はラフィノース及びスタキオースの合成を阻害するように編集されたダイズと交配させて、編集された遺伝子の育種スタックを作り出す。ゲノム編集を用いて、RS2、RS3、RS4などのラフィノースシンターゼ遺伝子のノックアウトによって、ラフィノース及びスタキオースなどの不溶性炭水化物を低減させる。操作アプローチの有効性を決定するためのアッセイは、米国油脂化学協会の公定法Ba 12-75を使用して、残留トリプシンインヒビター活性を測定するであろう。可溶性炭水化物プロファイルにおける変化は、参照により本明細書に組み込まれる、米国特許出願公開第20190383733号明細書に概説されるような方法を使用して決定されるであろう。
ゲノム編集は、重要な調節遺伝子のノックアウト又は改変によって種子中の総タンパク質含有量を増加させるためにも用いられ、例えば、参照により本明細書に組み込まれる、PCT/米国特許出願公開第2019/058747号明細書に開示されるような、CCTドメイン含有タンパク質、レティキュロン、トレハロースリン酸シンターゼ、HECTユビキチンリガーゼ(HEL又はUPL3)、MFT(mother of flowering time)突然変異若しくは改変された植物及び趣旨である。この実施例に記載されるような、それらの加工可能性を最適化するように操作されたダイズ中のレグヘモグロビンの発現は、そのようなダイズの価値及び有用性を高めるであろう。
収穫後加工を最小限に抑えるようにダイズを操作することは、無傷のレグヘモグロビン複合体のより大きな収量をもたらすと予想される。そのようなダイズは、ダイズ加工に通常使用される油を除去するための溶媒の使用又はトースティングステップの必要なく処理される。そのようなダイズ種子は、冷間プレス、押出成形又は超臨界流体抽出((Friedrich J.P.,List G.R.,and Heakin A.J.,1982.Journal of the American Oil Chemists Society.59(7);288-292)のうちの1つ以上を使用して処理される。
実施例12.PPR10多様体の種子特異的発現のための核ゲノムの形質転換
Di et al.((1996)Plant Cell Rep 15:746-750)の記載のように、12N HCl3.5mLと100mLの市販漂白剤(5.25%次亜塩素酸ナトリウム)を混合して製造した塩素ガスを使用して、ダイズ株の成熟した乾燥種子の表面を16時間殺菌する。消毒した種子を、滅菌蒸留水中に、室温で16時間浸漬させ(25×100mmのペトリ皿中100個の種子)、5g/lのスクロース及び6g/lの寒天を含有する半固体培地上に、暗所中室温で浸した。終夜のインキュベーション後、暗所で更に3~4時間、室温で種子を蒸留水に浸漬させる。無傷の胚軸を浸した種子から単離する。アグロバクテリウム(Agrobacterium)媒介EA形質転換を以下に記載される通りに実行する。
Di et al.((1996)Plant Cell Rep 15:746-750)の記載のように、12N HCl3.5mLと100mLの市販漂白剤(5.25%次亜塩素酸ナトリウム)を混合して製造した塩素ガスを使用して、ダイズ株の成熟した乾燥種子の表面を16時間殺菌する。消毒した種子を、滅菌蒸留水中に、室温で16時間浸漬させ(25×100mmのペトリ皿中100個の種子)、5g/lのスクロース及び6g/lの寒天を含有する半固体培地上に、暗所中室温で浸した。終夜のインキュベーション後、暗所で更に3~4時間、室温で種子を蒸留水に浸漬させる。無傷の胚軸を浸した種子から単離する。アグロバクテリウム(Agrobacterium)媒介EA形質転換を以下に記載される通りに実行する。
pH5.4の1/10×Gamborg B5塩基性培地、30g/Lのスクロース、20mMのMES、0.25mg/LのGA3、1.67mg/LのBAP、200μMのアセトシリンゴン及び1mMのジチオスレイトールから構成される感染培地中の15mLの容量の、ダイズ核形質転換バイナリーベクター(図1)を担持するアグロバクテリウム・ツメファシエンス(A.tumefaciens)LBA4404又はAGL-1懸濁液(600nmでOD 0.5)を約200~300個のEAに添加し、それらを25×100mmの深型ペトリ皿に置く。パラフィルム(カタログ番号52858、「Parafilm M」VWR)でプレートに封をし、その後、30秒間超音波(Sonicator-VWR model 50T)処理を行う。超音波処理後、EAを室温で2時間インキュベートする。摂種後、過剰の細菌懸濁液を除去し、約200~300個のEAを、25×100mmのペトリ皿内のオートクレーブ処理した滅菌濾紙(カタログ番号28320-020、VWR)の単一層に移す。この皿を、Microporeテープ(カタログ番号1530-0、3M、St.Paul,MN,USA)で密閉し、3日にわたり21℃で、16時間にわたる弱い光(1~2μE/m2/s)、冷白色蛍光ランプ下でインキュベートした。共培養後、各胚軸の基部を、pH5.7で30g/Lのスクロース、6g/Lの寒天、及び25mg/Lの選択可能剤としてのスペクチノマイシン(S742、PhytoTech Labs)並びに300mg/Lのセフォタキシム(GoldBio,ST Louis,MO,USA)を含有するシュート誘導培地(R7100、PhytoTech Labs)中に埋め込む。16時間にわたる光周期及び60~100μE/m2/sの光強度にて、26℃でPercival Biological Incubator(Percival Scientific,Perry,IA,USA)又は生育室において、シュートの誘導を実行した。選択培地中で4~6週間後、スペクチノマイシン耐性シュートを切断し、更なるシュート及び根の伸長のための15g/Lのスクロース、寒天6g/L、10mg/Lのスペクチノマイシン及び250mg/Lのセフォタキシムを含有する1/2強度のMS発根培地(M404、PhytoTech Labs)に移す。形質転換効率を、EAの総数で割った陽性トランスジェニックダイズT0植物の数に基づいて算出する。
スペクチノマイシンマーカー遺伝子を含まないT0イベントを作り出すためのダイズのヒートショック処理については、スペクチノマイシンを含まない発根培地上、100×25mmのペトリ皿又はマジェンタボックス内の2~4cmの根のついたT0小植物を、Percivalインキュベーター(Percival Scientific,Perry,IA,USA)、45℃、70%の湿度に移し、暗所に2時間置いた。ヒートショック処理されていないT0小植物を、対照として使用する。ヒートショック処理後、T0小植物を湿らせたBerger BM2土壌(Berger,Saint-Modeste,QC,Canada)に移し、250~350μE/m2/sでの光周期で、Percivalインキュベーター内で26℃にて16時間透明なプラスチックトレイボックス内に閉じ込められた状態で保管した。T0イベント順化後2週間で、新しく生育したものからの2~4個のリーフパンチサンプルを、qPCR及びSbS分析用に採集する。
図13は、T-DNA内のダイズ核形質転換バイナリーベクターを示す概略図である。図13では、RB及びLBは、それぞれT-DNAの右側ボーダー及び左側ボーダーにあり、GM-GY1 Proはダイズグリシニン種子特異的プロモーターであり、AtUBQ10Proはシロイヌナズナ(Arabidopsis)ユビキチン10プロモーターであり、PPR10GGはトウモロコシ又はダイズRNA結合タンパク質PPR10多様体であり、UBQ10TERMはシロイヌナズナ(Arabidopsis)ユビキチン10ターミネーターであり、LoxPはlox組換え部位であり、Gm-HSP17.3BProはダイズヒートショックhs6871プロモーターであり、MoCreはCreリコンビナーゼであり、SB-GKAFTermはソルガム(Sorghum bicolor)ガンマカフィリン貯蔵タンパク質ターミネーターであり、At-UBQ10 Proはシロイヌナズナ(Arabidopsis)ユビキチン10プロモーターであり、SpcNはストレプトマイセス・スペクタビリス(Streptomyces spectabilis)Genebankタンパク質ID AAD50455からのダイズコドン最適化スペクチノマイシン耐性遺伝子であり、そしてUBQ14Termはシロイヌナズナ(Arabidopsis)ユビキチン14ターミネーターである。
実施例13.トランスプラストミックダイズ植物における種子特異的レグヘモグロビン発現:遺伝子銃媒介ダイズ葉緑体形質転換
GM-GY1 Pro:PPR10GG:SB-GAKF TERM発現カセットを担持するマーカーフリーのT1ホモ接合型株を、葉緑体形質転換のためのドナー材料として使用する。未成熟の莢を、ダイズマーカーフリーのT1-2ホモ接合型株から採集し、莢を開けて約2~8mmの長さの未成熟な種子を取り出す。未成熟な種子を採集し、50mLの10%の漂白剤、0.02%のTween-20溶液を含有する50mLのスクリューキャップチューブ中で、軽く15分撹拌しながら表面を滅菌し、次いで、合計で500mLの滅菌蒸留水で10回濯ぐ。表面滅菌した種子を、顕微鏡下又は拡大鏡下で切断して開く。典型的には、各未成熟種子の胚軸を切り取り、2つの子葉片を取り外す。未成熟子葉を採集し、液体S30培地を含有するフラスコに移す(表13)。
GM-GY1 Pro:PPR10GG:SB-GAKF TERM発現カセットを担持するマーカーフリーのT1ホモ接合型株を、葉緑体形質転換のためのドナー材料として使用する。未成熟の莢を、ダイズマーカーフリーのT1-2ホモ接合型株から採集し、莢を開けて約2~8mmの長さの未成熟な種子を取り出す。未成熟な種子を採集し、50mLの10%の漂白剤、0.02%のTween-20溶液を含有する50mLのスクリューキャップチューブ中で、軽く15分撹拌しながら表面を滅菌し、次いで、合計で500mLの滅菌蒸留水で10回濯ぐ。表面滅菌した種子を、顕微鏡下又は拡大鏡下で切断して開く。典型的には、各未成熟種子の胚軸を切り取り、2つの子葉片を取り外す。未成熟子葉を採集し、液体S30培地を含有するフラスコに移す(表13)。
未成熟子葉を、S30培地中で10日間前培養し、直接的遺伝子銃媒介DNA形質転換の標的に定める。前培養の10日後、20個の未成熟子葉を遺伝子銃のために小ペトリプレート(60×15mm)の中心に、40mg/Lの2,4-Dを補充したM2固体培地の表面に置く。未成熟子葉に0.6μmの金粒子/プラスミドDNA(図2)混合物を、30ピコグラム/塩基対/ショットの濃度で650psiにて、28mm Hgの遺伝子銃(PDS 1000/He、Bio-Rad)を用いて衝突させる。M2固体培地中での共培養の2日後に、衝突させた未成熟子葉を、300mg/Lのスペクチノマイシンを含有する液体S30培地に移す。300mg/Lのスペクチノマイシンを含有する新鮮なS30培地を、2週間ごとに交換する。選択の8~12週後に、スペクチノマイシン耐性の黄緑色から緑色のカルスが外植片の表面から出現する。推定される形質転換された緑色のカルスを顕微鏡下で単離し、M7寒天培地に重なる滅菌濾紙を含むペトリプレートに植え付ける。ペトリプレートを、MicroporeTM外科用テープ(3M Health Care,St.Paul,MN,USA)で密閉し、35~60μE/m2/sの光強度で18時間の光周期を用いて26℃でインキュベートする。M7培地上での3~4週間の成熟後、成熟体細胞胚を滅菌ペトリ皿内に配置し、体細胞胚の乾燥のためにMicroporeTM外科用テープで密閉するか、又はプラスチックボックス内に密閉せずに室温で4~7日間配置する。4~7日後に、乾燥された胚を、10μg/Lのスペクチノマイシンを補充したM8培地上に植え付け、35~60μE/m2/sの光強度で18時間の光周期を用いて26℃で発芽させた。M8発芽培地上で4~6週間後に、小植物を湿らせたBerger BM2土壌(Berger Peat Moss,Saint-Modeste,Canada)を含有する3インチのポットに移し、透明なプラスチックトレイボックスに閉じ込められた状態で保管し、その後90~150μE/m2/s及び26℃日中温度/24℃夜間温度で16時間の光周期を用いて、培養室内で順化させた。順化後、硬くなった小植物を、湿らせたBerger MB1(Berger Peat Moss,Saint-Modeste,Canada)を含有する2ガロンのポットに植え付け、温室内で種子を付ける成熟状態まで生育させる。
図14は、ダイズ葉緑体形質転換ベクターの概略図である。GM-TRNVはダイズ色素体TRNV相同領域であり、NT-PSBA ProはタバコPSBA色素体プロモーターであり、AADAはスペクチノマイシンアデニリルトランスフェラーゼ遺伝子であり、NT-PSBA 3UTRはタバコPSBA 3UTRであり、DicisGGはジシストロニックなオペロンの遺伝子間領域(配列番号44)へのGG結合部位であり、レグヘモグロビン(Leghemoglobin)はダイズレグヘモグロビンコード配列(Glyma.20g191200)であり、GM-RPSはダイズ色素体RPS相同領域である。
ダイズ種子は、根、茎、葉、及び花などの植物の非種子部分における最小のレグヘモグロビンの発現、又はレグヘモグロビンの発現なしに、種子の色素体中でレグヘモグロビンを発現すると予想される。
実施例14.トランスプラストミックダイズ植物における種子特異的レグヘモグロビン発現:核形質転換後の色素体形質転換
開始ドナー材料が、null又は非形質転換ダイズであることを除いて、実施例13の方法論に従う。次いで、得られた形質転換色素体を含有するダイズ種子及び植物を、実施例12に記載される方法に従って形質転換する。ダイズ種子は、根、茎、葉、及び花などの植物の非種子部分における最小のレグヘモグロビンの発現、又はレグヘモグロビンの発現なしに、種子の色素体中でレグヘモグロビンを発現すると予想される。
開始ドナー材料が、null又は非形質転換ダイズであることを除いて、実施例13の方法論に従う。次いで、得られた形質転換色素体を含有するダイズ種子及び植物を、実施例12に記載される方法に従って形質転換する。ダイズ種子は、根、茎、葉、及び花などの植物の非種子部分における最小のレグヘモグロビンの発現、又はレグヘモグロビンの発現なしに、種子の色素体中でレグヘモグロビンを発現すると予想される。
本明細書における全ての刊行物及び特許出願は、本発明が属する技術分野の当業者の水準を示すものである。全て刊行物及び特許出願は、あたかも個々の刊行物又は特許出願が、明確に且つ個々に参照により指示されているのと同程度に、参照により本明細書に組み込まれる。
特に定義しない限り、本明細書で用いられる全ての技術用語及び科学用語は、本発明が属する技術分野の当業者によって一般に理解されるものと同じ意味を有する。特に明記しない限り、本明細書で採用されるか、又は企図される技法は、当業者に周知の標準的な方法である。材料、方法及び実施例は、例示のためのものに過ぎず、限定するものではない。
本明細書で記載されている本発明の多くの変更及び他の実施形態は、これらの発明が関連する技術分野の当業者であって、前述の説明及び添付の図面に提示された教示を利用できる者であれば、思い付くであろう。したがって、本発明が、本明細書に開示した特定の実施形態に限定されるべきではなく、また、変更やその他の実施形態が添付の請求項の範囲に含まれることを意図していることは理解されるべきである。本明細書中には特定の用語が使用されるが、それらは、一般的且つ記述的意味でのみ使用されものであって、限定を目的として使用されるものではない。
単位、接頭語及び記号は、それらのSIが承認した形態で表記され得る。他に特に指示しない限り、それぞれ、核酸は5’から3’への方向で左から右へと記載され、アミノ酸配列はアミノからカルボキシへの方向で左から右へと記載される。数値範囲は、範囲を定義する数字を含む。アミノ酸は、本明細書では、一般に知られている3文字の記号、又はIUPAC-IUB生化学命名委員会が推奨する1文字の記号のいずれかで称されてもよい。同様に、ヌクレオチドは、それらの一般的に認められた1文字コードによって称されてもよい。
Claims (79)
- ダイズ種子であって、前記ダイズ種子中の総タンパク質の少なくとも0.5%の量でレグヘモグロビンタンパク質を含み、前記ダイズ種子が、そのゲノムに組み込まれたレグヘモグロビンコード配列を含む組換え構築物を含有しない、ダイズ種子。
- 前記ダイズ種子ゲノムが、天然レグヘモグロビン遺伝子中に挿入、欠失、又は置換を導入するように改変されている、請求項1に記載のダイズ種子。
- 前記ダイズ種子ゲノムが、(i)挿入であって、前記挿入が調節エンハンサー若しくはプロモーター配列を含む、挿入、又は(ii)置換であって、前記置換が調節エンハンサー若しくはプロモーター配列を作製又は増強する、置換を導入するように改変されている、請求項1又は2に記載のダイズ種子。
- 前記ダイズ種子ゲノムが、挿入を導入するように改変されており、前記挿入が、前記レグヘモグロビン遺伝子のレグヘモグロビンコード配列に作動可能に連結された標的化配列を含み、前記標的化配列が前記レグヘモグロビンを細胞内区画に標的化する、請求項1又は2に記載のダイズ種子。
- 前記標的化配列が、前記レグヘモグロビンを色素体に標的化させる、請求項4に記載のダイズ種子。
- 前記標的化配列が、配列番号32と少なくとも95%の同一性を有するポリペプチドをコードするポリヌクレオチドを含む、請求項5に記載のダイズ種子。
- 前記ダイズ種子ゲノムが、種子貯蔵タンパク質のコード配列の全部又は一部をレグヘモグロビンコード配列で置き換えるように改変されている、請求項1に記載のダイズ種子。
- 前記ダイズ種子ゲノムが、挿入を導入するように改変されており、前記挿入が前記ヘモグロビンを細胞内区画に標的化させる前記レグヘモグロビンコード配列に作動可能に連結された標的化配列を含む、請求項7に記載のダイズ種子。
- 前記標的化配列が、前記レグヘモグロビンを前記色素体に標的化させる、請求項8に記載のダイズ種子。
- 前記標的化配列が、配列番号32と少なくとも95%の同一性を有するポリペプチドをコードするポリヌクレオチドを含む、請求項9に記載のダイズ種子。
- ゲノム改変を含むダイズ種子であって、前記ゲノム改変がレグヘモグロビンコード配列の天然種子貯蔵タンパク質遺伝子への挿入を含み、それによって前記レグヘモグロビンコード配列が、前記天然貯蔵タンパク質遺伝子コード配列の全部又は一部に置き換わり、前記レグヘモグロビンタンパク質が前記種子の断面において、前記ダイズ種子にピンク色を付与するのに十分な量で前記ダイズ種子中で発現される、ダイズ種子。
- 前記レグヘモグロビンタンパク質が、前記総種子タンパク質の少なくとも0.1%の量で発現される、請求項11に記載のダイズ種子。
- 前記天然種子貯蔵タンパク質遺伝子が、グリシニン又はコングリシニンをコードする、請求項11又は12に記載のダイズ種子。
- 前記レグヘモグロビンコード配列が、配列番号2と少なくとも95%の同一性を有するポリペプチドをコードする、請求項11~13のいずれか一項に記載のダイズ種子。
- 前記レグヘモグロビンコード配列が、配列番号1と少なくとも95%の同一性を有する、請求項14に記載のダイズ種子。
- 前記挿入が、前記レグヘモグロビンを細胞内区画に標的化させる前記レグヘモグロビンコード配列に作動可能に連結された標的化配列を更に含む、請求項11~15のいずれか一項に記載のダイズ種子。
- 前記標的化配列が、前記レグヘモグロビンを前記色素体に標的化させる、請求項16に記載のダイズ種子。
- 前記標的化配列が、配列番号32と少なくとも95%の同一性を有するポリペプチドをコードするポリヌクレオチドを含む、請求項17に記載のダイズ種子。
- 前記ダイズ種子が、そのゲノムに組み込まれた組換え構築物を更に含み、前記組換え構築物がレグヘモグロビンコード配列を含む、請求項11~18のいずれか一項に記載のダイズ種子。
- 前記組換え構築物が、前記組換え構築物の前記レグヘモグロビンコード配列に作動可能に連結された輸送配列を含み、前記輸送配列が前記組換え構築物から産生された前記レグヘモグロビンを細胞内区画に標的化させる、請求項19に記載のダイズ種子。
- 前記輸送配列が、前記組換え構築物から産生された前記レグヘモグロビンを前記色素体に標的化させる、請求項20に記載のダイズ種子。
- 前記ダイズ種子が、(i)グルタミルtRNAレダクターゼ、(ii)フェロケタラーゼ、(iii)グルタミルtRNAレダクターゼ結合タンパク質、及び(iv)アミノレブリン酸シンターゼをコードする遺伝子中への1つ以上のヌクレオチド挿入、欠失、又は置換を有するように改変されている、請求項11~18のいずれか一項に記載のダイズ種子。
- 前記挿入、欠失、又は置換が、前記遺伝子の調節ドメインで行われる、請求項22に記載のダイズ。
- 前記挿入、欠失、又は置換が、前記遺伝子のコード配列で行われる、請求項22に記載のトランスジェニックダイズ。
- 改変されたレグヘモグロビン遺伝子を含むダイズ種子であって、前記改変されたレグヘモグロビン遺伝子が、天然ヘモグロビン遺伝子への少なくとも1つの欠失、挿入、又は置換を含み、前記レグヘモグロビンタンパク質が、横断面又は前記種子において前記ダイズ種子にピンク色を付与するのに十分な量で前記ダイズ種子中で発現される、ダイズ種子。
- 前記レグヘモグロビンタンパク質が、前記総種子タンパク質の少なくとも0.5%の量で発現される、請求項25に記載のダイズ種子。
- 前記改変されたレグヘモグロビン遺伝子が、プロモーター又は調節増強配列の挿入を含む、請求項25又は26に記載のダイズ種子。
- 前記改変されたレグヘモグロビン遺伝子が、前記レグヘモグロビン遺伝子のレグヘモグロビンコード配列に作動可能に連結された標的化配列の挿入を含み、前記標的化配列が前記レグヘモグロビンを細胞内区画に標的化させる、請求項25~27のいずれか一項に記載のダイズ種子。
- 前記標的化配列が、前記レグヘモグロビンを前記色素体に標的化させる、請求項28に記載のダイズ種子。
- 前記標的化配列が、配列番号32と少なくとも95%の同一性を有するポリペプチドをコードするポリヌクレオチドを含む、請求項29に記載のダイズ種子。
- 前記ダイズ種子が、そのゲノムに組み込まれた組換え構築物を更に含み、前記組換え構築物がレグヘモグロビンコード配列を含む、請求項25~30のいずれか一項に記載のダイズ種子。
- 前記組換え構築物が、前記組換え構築物の前記レグヘモグロビンコード配列に作動可能に連結された輸送配列を含み、前記輸送配列が前記組換え構築物から産生された前記レグヘモグロビンを細胞内区画に標的化させる、請求項31に記載のダイズ種子。
- 前記輸送配列が、前記組換え構築物から産生された前記レグヘモグロビンを前記色素体に標的化させる、請求項32に記載のダイズ種子。
- 前記ダイズ種子が、天然種子貯蔵タンパク質遺伝子へのレグヘモグロビンコード配列の挿入を更に含み、それによって前記レグヘモグロビンコード配列が、前記天然貯蔵タンパク質遺伝子コード配列の全部又は一部に置き換わる、請求項25~33のいずれか一項に記載のダイズ種子。
- レグヘモグロビンタンパク質をダイズ種子中の総タンパク質の少なくとも0.5%の量で含むダイズ種子であって、前記ダイズが以下の特性:(i)前記種子の総脂肪酸の少なくとも50%のオレイン酸含有量;(ii)前記種子の総脂肪酸の3%未満のリノレン酸含有量;(iii)13%の水分で測定されるか、又は13%の水分に調整された前記ダイズの総重量の少なくとも37%のタンパク質含有量;(iv)対照の非改変ダイズの活性の5%未満のクニッツトリプシンプロテアーゼインヒビター活性;(v)対照の非改変ダイズの5%未満のボーマン・バークプロテアーゼインヒビター活性;(vi)13%の水分での1重量%未満のスタキオース含有量;及び(vii)13%の水分での0.5重量%未満のラフィノース含有量のうちの1つ以上を更に含む、ダイズ種子。
- 前記ダイズ種子が、前記ダイズゲノム中の前記天然レグヘモグロビン遺伝子への少なくとも1つの欠失、挿入、又は置換を含む、請求項35に記載のダイズ種子。
- 前記レグヘモグロビンコード配列が、配列番号1と少なくとも95%の同一性を有する、請求項35又は36に記載のダイズ種子。
- 前記ダイズ種子が、レグヘモグロビンコード配列に作動可能に連結された調節配列を含む組換え構築物を含む、請求項35に記載のダイズ種子。
- 前記ダイズ種子が、天然種子貯蔵タンパク質遺伝子へのレグヘモグロビンコード配列の挿入を含むゲノム改変を含み、それによって前記レグヘモグロビンコード配列が、前記天然貯蔵タンパク質遺伝子コード配列の全部又は一部に置き換わる、請求項35に記載のダイズ種子。
- 改変されたレグヘモグロビン遺伝子を含むダイズ種子であって、前記改変されたレグヘモグロビン遺伝子が、前記天然レグヘモグロビン遺伝子調節配列への少なくとも1つの欠失、挿入、又は置換を含み、前記ダイズ種子が総種子タンパク質の0.5%の量でレグヘモグロビンタンパク質を発現する、ダイズ種子。
- 挿入が天然レグヘモグロビン遺伝子調節配列中で行われ、前記挿入がプロモーター又は調節増強配列を含む、請求項40に記載のダイズ種子。
- 配列番号2と少なくとも95%の同一性を有するレグヘモグロビンタンパク質をコードするポリヌクレオチドを含む組換え構築物を含むトランスジェニックダイズ種子であって、前記構築物がタンパク質貯蔵小胞標的化配列を含まず、前記ダイズが、(i)グルタミルtRNAレダクターゼをコードする配列、又はその短縮型部分を含む組換え構築物、(ii)フェロケタラーゼをコードする配列を含む組換え構築物、(iii)グルタミルtRNAレダクターゼ結合タンパク質を含む組換え構築物、及び(iv)アミノレブリン酸シンターゼを含む組換え構築物を含有せず、前記ダイズ種子が総種子タンパク質の少なくとも0.5%の量でレグヘモグロビンを前記種子に含む、トランスジェニックダイズ種子。
- 前記ダイズ種子が、(i)グルタミルtRNAレダクターゼ、(ii)フェロケタラーゼ、(iii)グルタミルtRNAレダクターゼ結合タンパク質、及び(iv)アミノレブリン酸シンターゼをコードする遺伝子への1つ以上のヌクレオチド挿入、欠失、又は置換を有するように改変されている、請求項42に記載のトランスジェニックダイズ種子。
- 前記挿入、欠失、又は置換が前記遺伝子の調節ドメインにおいて行われる、請求項43に記載のトランスジェニックダイズ。
- 前記挿入、欠失、又は置換が、前記遺伝子のコード配列で行われる、請求項43に記載のトランスジェニックダイズ。
- ダイズの色素体のゲノムに組み込まれたレグヘモグロビンタンパク質をコードするポリヌクレオチドを含む、ダイズ種子。
- 前記ダイズ種子が、種子貯蔵プロモーターに動作可能に接続されたPPRタンパク質コード配列を含むゲノム改変を更に含む、請求項46に記載のダイズ種子。
- 種子貯蔵プロモーターに作動可能に接続された前記PPRタンパク質コード配列が、組換え構築物中で生じる、請求項47に記載のダイズ種子。
- 前記PPRタンパク質コード配列が、天然種子貯蔵コード配列の天然プロモーターに作動可能に接続されており、前記PPRタンパク質コード配列が、前記天然種子貯蔵タンパク質コード配列の全部又は一部に置き換わる、請求項47に記載のダイズ種子。
- 前記ダイズ種子が、そのゲノムに組み込まれた組換え構築物を更に含み、前記組換え構築物がレグヘモグロビンコード配列を含む、請求項46~49のいずれか一項に記載のダイズ種子。
- 前記ダイズ種子が、前記天然レグヘモグロビン遺伝子のゲノム改変を更に含む、請求項46~50のいずれか一項に記載のダイズ種子。
- 前記ダイズ種子が、種子貯蔵タンパク質のコード配列の全部又は一部がレグヘモグロビンコード配列で置き換えられるゲノム改変を更に含む、請求項46~52のいずれか一項に記載のダイズ種子。
- 前記ダイズ種子が、(i)グルタミルtRNAレダクターゼ、(ii)フェロケタラーゼ、(iii)グルタミルtRNAレダクターゼ結合タンパク質、及び(iv)アミノレブリン酸シンターゼをコードする遺伝子中への1つ以上のヌクレオチド挿入、欠失、又は置換を有するように改変されている、請求項46~52のいずれか一項に記載のダイズ種子。
- レグヘモグロビンタンパク質をダイズ種子中の総タンパク質の少なくとも0.5%の量で含むダイズ種子であって、前記ダイズ種子が、(i)その挿入が非ダイズゲノム配列を除外するダイズゲノム配列の核酸挿入、(ii)1つ以上の核酸置換、(iii)1つ以上の核酸欠失、及び(iv)それらの任意の組合せのうちの少なくとも1つを含むゲノム改変を含み、前記ゲノム改変が、(a)天然レグヘモグロビン遺伝子に対して行われた改変、又は(b)前記天然レグヘモグロビン遺伝子の少なくとも一部を含む挿入を含む、ダイズ種子。
- 前記ゲノム改変が前記天然レグヘモグロビン遺伝子への挿入、欠失、又は置換を含む、請求項54に記載のダイズ種子。
- 前記ゲノム改変が、(i)挿入であって、調節エンハンサー又はプロモーター配列を含む、挿入、又は(ii)置換であって、調節エンハンサー又はプロモーター配列を作製若しくは増強する置換を含む、請求項54又は55に記載の方法。
- 前記ゲノム改変が前記挿入を含み、前記挿入が前記レグヘモグロビン遺伝子のレグヘモグロビンコード配列に作動可能に連結された標的化配列を含み、前記標的化配列が前記レグヘモグロビンを細胞内区画に標的化させる、請求項54又は55に記載のダイズ種子。
- 前記標的化配列が、前記レグヘモグロビンを前記色素体に標的化させる、請求項57に記載のダイズ種子。
- 前記標的化配列が、配列番号32と少なくとも95%の同一性を有するポリペプチドをコードするポリヌクレオチドを含む、請求項58に記載のダイズ種子。
- 前記ゲノム改変が、レグヘモグロビンコード配列による種子貯蔵タンパク質のコード配列の全部又は一部の前記置き換えを含む、請求項54に記載のダイズ種子。
- 前記レグヘモグロビンコード配列が標的化配列に作動可能に連結されており、前記標的化配列が、前記レグヘモグロビンを細胞内区画に標的化させる、請求項60に記載のダイズ種子。
- 前記標的化配列が、前記レグヘモグロビンを前記色素体に標的化させる、請求項62に記載のダイズ種子。
- 前記標的化配列が、配列番号32と少なくとも95%の同一性を有するポリペプチドをコードするポリヌクレオチドを含む、請求項62に記載のダイズ種子。
- 前記天然レグヘモグロビン遺伝子が、配列番号43に相当する配列である、請求項54~63のいずれか一項に記載のダイズ種子。
- 前記レグヘモグロビンタンパク質の少なくとも50%が、複合体中でヘムと結合している、請求項1~64のいずれか一項に記載のダイズ種子。
- 前記種子が、前記種子の横断面でピンク色を有する、請求項1~10及び32~64のいずれか一項に記載のダイズ種子。
- 前記ダイズが、1つ以上の異なる種子貯蔵コード配列の発現を低減又は防止するための異なる改変を更に含み、前記レグヘモグロビンタンパク質の前記発現が、レグヘモグロビンを発現するが前記異なる改変を欠如する同等のダイズ種子と比較して増加されている、請求項1~64のいずれか一項に記載のダイズ。
- 前記異なる改変が、(i)グリシニンポリペプチド配列、(ii)コングリシニンポリペプチド配列、又は(iii)それらの組合せの含有量を減少させる、請求項67に記載のダイズ種子。
- 前記ダイズが、少なくとも50%のオレイン酸を含む、請求項1~68のいずれか一項に記載のダイズ種子。
- 前記ダイズが、3%未満のリノレン酸を含む、請求項1~69のいずれか一項に記載のダイズ種子。
- 前記ダイズが、天然FAD2コード配列の発現をダウンレギュレートする導入遺伝子とFAD3遺伝子中の突然変異とを含む、請求項69又は70に記載のダイズ種子。
- 前記ダイズが13%の水分で測定されるか、又は13%の水分に調整されるとき、重量で少なくとも37%のタンパク質を含む、請求項1~71のいずれか一項に記載のダイズ種子。
- 前記ダイズ種子が種子タンパク質含有量を向上させるための改変を含み、前記改変が。(i)CCTドメイン含有タンパク質、(ii)レティキュロン、(iii)トレハロースリン酸センターゼ、(iv)HECTユビキチンリガーゼ、(v)MFT(mother of flowering)ポリペプチド、及び(vi)ラフィノースシンターゼのうちの少なくとも1つをコードする遺伝子内にある、請求項72に記載のダイズ種子。
- 請求項1~73のいずれか一項に記載のダイズ種子から生育させた、植物。
- 請求項1~73のいずれか一項に記載のダイズ種子から抽出したダイズミールを処理するための方法であって、前記ミールが多糖類を含み、前記方法が、前記ミールをセルラーゼ、ヘミセルラーゼ、及びペクチナーゼのうちの少なくとも1つと、前記ミール中の前記多糖類を分解させるのに十分な条件下で接触させることと、残渣から透過液を濾過することと、を含む、方法。
- 請求項1~73のいずれか一項に記載の種子から生成されるダイズ単離物であって、前記単離物が総タンパク質の重量で少なくとも0.2%のレグヘモグロビンを含み、前記レグヘモグロビンの少なくとも約50%が、鉄基でヘム化されている、ダイズ単離物。
- 請求項1~73のいずれか一項に記載のダイズ種子から抽出されるミールであって、前記ミールが総タンパク質の重量で少なくとも0.1%のレグヘモグロビンを含む、ミール。
- ダイズミール又は単離物を生産するための方法であって、前記方法が、レグヘモグロビンを含むダイズ種子を高オレイン酸を含むダイズ種子と組み合わせることと、前記種子を処理して前記ミール又は前記単離物を生産することと、を含み、前記ミール又は前記単離物がレグヘモグロビン及び高オレイン酸を含み、前記レグヘモグロビンの少なくとも約50%が、鉄基でヘム化されている、方法。
- レグヘモグロビンを生産するための方法であって、前記方法が、請求項78に記載の方法によって生産されたミールからレグヘモグロビンを抽出することを含む、方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063106519P | 2020-10-28 | 2020-10-28 | |
US63/106,519 | 2020-10-28 | ||
PCT/US2021/071984 WO2022094532A1 (en) | 2020-10-28 | 2021-10-22 | Leghemoglobin in soybean |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023548301A true JP2023548301A (ja) | 2023-11-16 |
Family
ID=81256883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023525960A Pending JP2023548301A (ja) | 2020-10-28 | 2021-10-22 | ダイズにおけるレグヘモグリン |
Country Status (8)
Country | Link |
---|---|
US (4) | US20220127631A1 (ja) |
EP (1) | EP4236682A1 (ja) |
JP (1) | JP2023548301A (ja) |
CN (1) | CN116507728A (ja) |
AR (1) | AR123928A1 (ja) |
AU (1) | AU2021369580A1 (ja) |
CA (1) | CA3198652A1 (ja) |
WO (1) | WO2022094532A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024026348A1 (en) * | 2022-07-28 | 2024-02-01 | Pioneer Hi-Bred International, Inc. | Production of leghemoglobin in plants |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2736930B1 (fr) * | 1995-07-17 | 1997-09-19 | Biocem | Procede de production, par des cellules vegetales, de proteines heminiques, proteines ainsi obtenues et produits contenant ces proteines |
US20050108791A1 (en) * | 2001-12-04 | 2005-05-19 | Edgerton Michael D. | Transgenic plants with improved phenotypes |
AR037699A1 (es) * | 2001-12-04 | 2004-12-01 | Monsanto Technology Llc | Maiz transgenico con fenotipo mejorado |
US7807870B2 (en) * | 2002-12-23 | 2010-10-05 | Max-Planck-Gesellschaft | Method for altering the content of reserve substances in plants |
EP2363408A3 (en) * | 2008-06-23 | 2012-07-11 | Nestec S.A. | Genes for modulating coffee maturation and methods for their use |
WO2009158694A1 (en) * | 2008-06-28 | 2009-12-30 | The Donald Danforth Plant Science Center | Improved protein production and storage in plants |
EP2365071B1 (en) * | 2008-11-28 | 2016-04-06 | Hokko Chemical Industry Co., Ltd. | Transformed soybean plant which stores vaccine, and use thereof |
CN101845461A (zh) * | 2010-02-09 | 2010-09-29 | 上海师范大学 | 大豆血红蛋白基因提高莱茵衣藻生物制氢产量的方法 |
KR102024952B1 (ko) | 2011-07-12 | 2019-09-26 | 임파서블 푸즈 인크. | 소비재를 위한 방법 및 조성물 |
US20140220217A1 (en) | 2011-07-12 | 2014-08-07 | Maraxi, Inc. | Method and compositions for consumables |
CN104620104B (zh) | 2012-03-16 | 2017-03-01 | 非凡食品有限公司 | 用于蛋白质纯化的亲和试剂 |
US10039306B2 (en) * | 2012-03-16 | 2018-08-07 | Impossible Foods Inc. | Methods and compositions for consumables |
CA2873073A1 (en) * | 2012-04-16 | 2013-10-24 | The University Of Western Australia | Peptides for the binding of nucleotide targets |
US20160340411A1 (en) * | 2013-01-11 | 2016-11-24 | Impossible Foods Inc. | Secretion of heme-containing polypeptides |
RU2769287C2 (ru) | 2013-01-11 | 2022-03-30 | Импоссибл Фудз Инк. | Способы и композиции пригодных к потреблению материалов |
EP3679785A3 (en) * | 2013-04-05 | 2020-09-16 | Dow AgroSciences LLC | Methods and compositions for integration of an exogenous sequence within the genome of plants |
US10136646B2 (en) * | 2013-06-26 | 2018-11-27 | Indigo Ag, Inc. | Agricultural endophyte-plant compositions, and methods of use |
WO2015017510A1 (en) * | 2013-07-31 | 2015-02-05 | E. I. Du Pont De Nemours And Company | Modification of soybean seed composition to enhance feed, food and other industrial applications of soybean products |
SI3044320T1 (sl) * | 2013-09-11 | 2020-07-31 | Impossible Foods Inc. | Sekrecija polipeptidov, ki vsebujejo hem |
JP6759103B2 (ja) | 2014-03-31 | 2020-09-23 | インポッシブル フーズ インコーポレイテッド | ひき肉レプリカ |
PL3201336T3 (pl) | 2014-10-01 | 2021-12-13 | Impossible Foods Inc. | Sposoby ekstrakcji i oczyszczania białek niezdenaturowanych |
CN104292359A (zh) * | 2014-11-11 | 2015-01-21 | 济南凯因生物科技有限公司 | 一种生物酶法从大豆粕中提取大豆多糖的方法 |
US20190292217A1 (en) * | 2016-12-02 | 2019-09-26 | Impossible Foods Inc. | Transgenic plants with upregulated heme biosynthesis |
WO2018102656A1 (en) | 2016-12-02 | 2018-06-07 | City Of Hope | Producing recombinant products in contained systems |
CN109679984B (zh) * | 2017-10-19 | 2022-08-02 | 北京睿诚海汇健康科技有限公司 | 植物作为宿主在表达血红蛋白中的应用 |
CN110093355A (zh) * | 2019-05-11 | 2019-08-06 | 信阳师范学院 | 一种参与豆科植物共生结瘤的豆血红蛋白GmLbc2基因及应用 |
WO2022072846A2 (en) | 2020-10-02 | 2022-04-07 | Impossible Foods Inc. | Transgenic plants with altered fatty acid profiles and upregulated heme biosynthesis |
WO2022072833A2 (en) | 2020-10-02 | 2022-04-07 | Impossible Foods Inc. | Expression constructs and methods of genetically engineering cells |
-
2021
- 2021-10-22 US US17/451,913 patent/US20220127631A1/en not_active Abandoned
- 2021-10-22 CA CA3198652A patent/CA3198652A1/en active Pending
- 2021-10-22 AU AU2021369580A patent/AU2021369580A1/en active Pending
- 2021-10-22 JP JP2023525960A patent/JP2023548301A/ja active Pending
- 2021-10-22 US US18/250,912 patent/US20230380373A1/en active Pending
- 2021-10-22 EP EP21887808.0A patent/EP4236682A1/en active Pending
- 2021-10-22 WO PCT/US2021/071984 patent/WO2022094532A1/en active Application Filing
- 2021-10-22 CN CN202180073425.3A patent/CN116507728A/zh active Pending
- 2021-10-26 AR ARP210102975A patent/AR123928A1/es unknown
- 2021-12-21 US US17/557,353 patent/US11359206B2/en active Active
-
2022
- 2022-06-30 US US17/810,000 patent/US11965168B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
WO2022094532A1 (en) | 2022-05-05 |
CN116507728A (zh) | 2023-07-28 |
EP4236682A1 (en) | 2023-09-06 |
CA3198652A1 (en) | 2022-05-05 |
US11965168B2 (en) | 2024-04-23 |
AU2021369580A1 (en) | 2023-05-11 |
US20220127632A1 (en) | 2022-04-28 |
AR123928A1 (es) | 2023-01-25 |
US20220127631A1 (en) | 2022-04-28 |
US20220340923A1 (en) | 2022-10-27 |
US11359206B2 (en) | 2022-06-14 |
US20230380373A1 (en) | 2023-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220177900A1 (en) | Genome modification using guide polynucleotide/cas endonuclease systems and methods of use | |
US20230270067A1 (en) | Heterozygous cenh3 monocots and methods of use thereof for haploid induction and simultaneous genome editing | |
CA3035484A1 (en) | Methods for altering amino acid content in plants | |
US20210403933A1 (en) | Soybean gene and use for modifying seed composition | |
US11965168B2 (en) | Leghemoglobin in soybean | |
US20190177735A1 (en) | Methods and compositions for modification of plastid genomes | |
US20230232763A1 (en) | Soybean with altered seed protein | |
US20230124856A1 (en) | Genome editing in sunflower | |
US11312972B2 (en) | Methods for altering amino acid content in plants through frameshift mutations | |
WO2023201186A1 (en) | Plant regulatory elements and uses thereof for autoexcision | |
Kumar et al. | CRISPR-Cas9/Cpf1-Based Multigene Editing in Crops | |
OA21074A (en) | Heterozygous CENH3 monocots and methods of use thereof for haploid induction and simultaneous genome editing. | |
WO2022086951A1 (en) | Plant regulatory elements and uses thereof for autoexcision | |
WO2022246387A1 (en) | Modified seed oil content in plants |