CN116802305A - 与大豆中疾病抗性相关联的新颖的抗性基因 - Google Patents
与大豆中疾病抗性相关联的新颖的抗性基因 Download PDFInfo
- Publication number
- CN116802305A CN116802305A CN202280014367.1A CN202280014367A CN116802305A CN 116802305 A CN116802305 A CN 116802305A CN 202280014367 A CN202280014367 A CN 202280014367A CN 116802305 A CN116802305 A CN 116802305A
- Authority
- CN
- China
- Prior art keywords
- plant
- nucleic acid
- soybean
- acid sequence
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 244000068988 Glycine max Species 0.000 title claims abstract description 398
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 281
- 235000010469 Glycine max Nutrition 0.000 title claims abstract description 260
- 208000035240 Disease Resistance Diseases 0.000 title description 15
- 241000196324 Embryophyta Species 0.000 claims abstract description 710
- 238000000034 method Methods 0.000 claims abstract description 189
- 206010034133 Pathogen resistance Diseases 0.000 claims abstract description 94
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 claims abstract description 60
- 244000052769 pathogen Species 0.000 claims abstract description 36
- 150000007523 nucleic acids Chemical class 0.000 claims description 319
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 192
- 210000004027 cell Anatomy 0.000 claims description 177
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 171
- 102000039446 nucleic acids Human genes 0.000 claims description 170
- 108020004707 nucleic acids Proteins 0.000 claims description 170
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 169
- 229920001184 polypeptide Polymers 0.000 claims description 168
- 230000014509 gene expression Effects 0.000 claims description 152
- 230000001965 increasing effect Effects 0.000 claims description 138
- 102000004169 proteins and genes Human genes 0.000 claims description 118
- 125000003729 nucleotide group Chemical group 0.000 claims description 107
- 239000002773 nucleotide Substances 0.000 claims description 104
- 108020004414 DNA Proteins 0.000 claims description 91
- 239000003550 marker Substances 0.000 claims description 79
- 108700028369 Alleles Proteins 0.000 claims description 64
- 239000000523 sample Substances 0.000 claims description 58
- 239000012634 fragment Substances 0.000 claims description 46
- 230000002068 genetic effect Effects 0.000 claims description 46
- 230000009466 transformation Effects 0.000 claims description 44
- 238000010362 genome editing Methods 0.000 claims description 43
- 210000001519 tissue Anatomy 0.000 claims description 42
- 230000009261 transgenic effect Effects 0.000 claims description 42
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 37
- 239000013598 vector Substances 0.000 claims description 36
- 210000000349 chromosome Anatomy 0.000 claims description 33
- 238000009395 breeding Methods 0.000 claims description 31
- 230000001488 breeding effect Effects 0.000 claims description 31
- 239000003147 molecular marker Substances 0.000 claims description 30
- 238000003752 polymerase chain reaction Methods 0.000 claims description 29
- 125000000539 amino acid group Chemical group 0.000 claims description 27
- 239000004009 herbicide Substances 0.000 claims description 27
- 210000001161 mammalian embryo Anatomy 0.000 claims description 22
- 108091033409 CRISPR Proteins 0.000 claims description 21
- 108700019146 Transgenes Proteins 0.000 claims description 21
- 235000021307 Triticum Nutrition 0.000 claims description 20
- 241000209140 Triticum Species 0.000 claims description 20
- 230000000694 effects Effects 0.000 claims description 19
- 238000010354 CRISPR gene editing Methods 0.000 claims description 18
- 230000004048 modification Effects 0.000 claims description 18
- 238000012986 modification Methods 0.000 claims description 18
- 241000221785 Erysiphales Species 0.000 claims description 15
- 230000002363 herbicidal effect Effects 0.000 claims description 15
- 238000004519 manufacturing process Methods 0.000 claims description 14
- 240000007594 Oryza sativa Species 0.000 claims description 12
- 108091093088 Amplicon Proteins 0.000 claims description 11
- 108091092878 Microsatellite Proteins 0.000 claims description 11
- 235000007164 Oryza sativa Nutrition 0.000 claims description 11
- 241000233614 Phytophthora Species 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 230000001976 improved effect Effects 0.000 claims description 11
- 235000009566 rice Nutrition 0.000 claims description 11
- 241000233866 Fungi Species 0.000 claims description 10
- 241001330975 Magnaporthe oryzae Species 0.000 claims description 10
- 241000244206 Nematoda Species 0.000 claims description 10
- 230000001580 bacterial effect Effects 0.000 claims description 10
- 230000002349 favourable effect Effects 0.000 claims description 10
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 claims description 10
- 241001124076 Aphididae Species 0.000 claims description 9
- 238000010459 TALEN Methods 0.000 claims description 9
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims description 9
- 238000007792 addition Methods 0.000 claims description 9
- 241001233957 eudicotyledons Species 0.000 claims description 9
- 230000001939 inductive effect Effects 0.000 claims description 9
- 238000007834 ligase chain reaction Methods 0.000 claims description 9
- 241000894006 Bacteria Species 0.000 claims description 8
- 241000209510 Liliopsida Species 0.000 claims description 8
- 206010037888 Rash pustular Diseases 0.000 claims description 8
- 240000008042 Zea mays Species 0.000 claims description 8
- 238000012217 deletion Methods 0.000 claims description 8
- 230000037430 deletion Effects 0.000 claims description 8
- 208000029561 pustule Diseases 0.000 claims description 8
- 230000010076 replication Effects 0.000 claims description 8
- 108020004711 Nucleic Acid Probes Proteins 0.000 claims description 7
- 241000167882 Rhopalosiphum maidis Species 0.000 claims description 7
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 7
- 239000002853 nucleic acid probe Substances 0.000 claims description 7
- 238000006467 substitution reaction Methods 0.000 claims description 7
- 241000498254 Heterodera glycines Species 0.000 claims description 6
- 241000243785 Meloidogyne javanica Species 0.000 claims description 6
- 241000813090 Rhizoctonia solani Species 0.000 claims description 6
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 6
- 235000009973 maize Nutrition 0.000 claims description 6
- 241000208838 Asteraceae Species 0.000 claims description 5
- 241000254127 Bemisia tabaci Species 0.000 claims description 5
- 241000256593 Brachycaudus schwartzi Species 0.000 claims description 5
- 241000219112 Cucumis Species 0.000 claims description 5
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 claims description 5
- 240000008067 Cucumis sativus Species 0.000 claims description 5
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 claims description 5
- 241000122106 Diatraea saccharalis Species 0.000 claims description 5
- 240000000111 Saccharum officinarum Species 0.000 claims description 5
- 235000007201 Saccharum officinarum Nutrition 0.000 claims description 5
- 206010042434 Sudden death Diseases 0.000 claims description 5
- 235000009754 Vitis X bourquina Nutrition 0.000 claims description 5
- 235000012333 Vitis X labruscana Nutrition 0.000 claims description 5
- 240000006365 Vitis vinifera Species 0.000 claims description 5
- 235000014787 Vitis vinifera Nutrition 0.000 claims description 5
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 208000011580 syndromic disease Diseases 0.000 claims description 5
- 241001516694 Cratoxylum Species 0.000 claims description 4
- 206010011732 Cyst Diseases 0.000 claims description 4
- 244000046052 Phaseolus vulgaris Species 0.000 claims description 4
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims description 4
- 241000221696 Sclerotinia sclerotiorum Species 0.000 claims description 4
- 241000003866 Umbilicaria Species 0.000 claims description 4
- 208000031513 cyst Diseases 0.000 claims description 4
- 239000000843 powder Substances 0.000 claims description 4
- 230000001172 regenerating effect Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 125000003275 alpha amino acid group Chemical group 0.000 claims 10
- 230000001717 pathogenic effect Effects 0.000 abstract description 24
- 239000000203 mixture Substances 0.000 abstract description 20
- 102000040430 polynucleotide Human genes 0.000 description 137
- 108091033319 polynucleotide Proteins 0.000 description 137
- 108700026215 vpr Genes Proteins 0.000 description 131
- 239000002157 polynucleotide Substances 0.000 description 128
- 235000018102 proteins Nutrition 0.000 description 114
- 101150090155 R gene Proteins 0.000 description 99
- 239000013615 primer Substances 0.000 description 87
- 238000003556 assay Methods 0.000 description 52
- 238000009396 hybridization Methods 0.000 description 51
- 108091026890 Coding region Proteins 0.000 description 42
- 150000001413 amino acids Chemical group 0.000 description 39
- 201000010099 disease Diseases 0.000 description 36
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 36
- 108090000790 Enzymes Proteins 0.000 description 35
- 102000004190 Enzymes Human genes 0.000 description 31
- 229940088598 enzyme Drugs 0.000 description 30
- 108091092195 Intron Proteins 0.000 description 28
- 230000002759 chromosomal effect Effects 0.000 description 28
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 27
- 230000001105 regulatory effect Effects 0.000 description 27
- 230000000875 corresponding effect Effects 0.000 description 25
- 230000000295 complement effect Effects 0.000 description 23
- 108020004999 messenger RNA Proteins 0.000 description 21
- 108010006444 Leucine-Rich Repeat Proteins Proteins 0.000 description 20
- 210000004901 leucine-rich repeat Anatomy 0.000 description 20
- 230000027455 binding Effects 0.000 description 19
- 238000001514 detection method Methods 0.000 description 19
- 238000013518 transcription Methods 0.000 description 19
- 239000000047 product Substances 0.000 description 18
- 230000035897 transcription Effects 0.000 description 18
- 210000002257 embryonic structure Anatomy 0.000 description 17
- 238000005516 engineering process Methods 0.000 description 17
- 102000053602 DNA Human genes 0.000 description 14
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 14
- 230000000749 insecticidal effect Effects 0.000 description 14
- 238000003199 nucleic acid amplification method Methods 0.000 description 14
- 238000005406 washing Methods 0.000 description 14
- 239000004471 Glycine Substances 0.000 description 13
- 230000003321 amplification Effects 0.000 description 13
- 230000015572 biosynthetic process Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 210000001938 protoplast Anatomy 0.000 description 13
- 230000002441 reversible effect Effects 0.000 description 13
- 241000894007 species Species 0.000 description 13
- 241000219823 Medicago Species 0.000 description 12
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 12
- 208000035199 Tetraploidy Diseases 0.000 description 12
- 244000000003 plant pathogen Species 0.000 description 12
- 238000005215 recombination Methods 0.000 description 12
- 230000006798 recombination Effects 0.000 description 12
- 241000238631 Hexapoda Species 0.000 description 11
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 11
- 108091034117 Oligonucleotide Proteins 0.000 description 11
- 230000000306 recurrent effect Effects 0.000 description 11
- 238000013519 translation Methods 0.000 description 11
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 10
- 108020003589 5' Untranslated Regions Proteins 0.000 description 10
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 10
- 238000011161 development Methods 0.000 description 10
- 230000018109 developmental process Effects 0.000 description 10
- 230000001404 mediated effect Effects 0.000 description 10
- 210000000056 organ Anatomy 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- 238000011160 research Methods 0.000 description 10
- 238000011144 upstream manufacturing Methods 0.000 description 10
- 108020005345 3' Untranslated Regions Proteins 0.000 description 9
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 9
- 238000010453 CRISPR/Cas method Methods 0.000 description 9
- 108090000637 alpha-Amylases Proteins 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 208000015181 infectious disease Diseases 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 230000037039 plant physiology Effects 0.000 description 9
- 230000010152 pollination Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- -1 rRNA Proteins 0.000 description 9
- IAKHMKGGTNLKSZ-INIZCTEOSA-N (S)-colchicine Chemical compound C1([C@@H](NC(C)=O)CC2)=CC(=O)C(OC)=CC=C1C1=C2C=C(OC)C(OC)=C1OC IAKHMKGGTNLKSZ-INIZCTEOSA-N 0.000 description 8
- 101000658547 Escherichia coli (strain K12) Type I restriction enzyme EcoKI endonuclease subunit Proteins 0.000 description 8
- 101000658543 Escherichia coli Type I restriction enzyme EcoAI endonuclease subunit Proteins 0.000 description 8
- 101000658546 Escherichia coli Type I restriction enzyme EcoEI endonuclease subunit Proteins 0.000 description 8
- 101000658530 Escherichia coli Type I restriction enzyme EcoR124II endonuclease subunit Proteins 0.000 description 8
- 101000658540 Escherichia coli Type I restriction enzyme EcoprrI endonuclease subunit Proteins 0.000 description 8
- 101000658545 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) Type I restriction enyme HindI endonuclease subunit Proteins 0.000 description 8
- 101000658548 Methanocaldococcus jannaschii (strain ATCC 43067 / DSM 2661 / JAL-1 / JCM 10045 / NBRC 100440) Putative type I restriction enzyme MjaIXP endonuclease subunit Proteins 0.000 description 8
- 101000658542 Methanocaldococcus jannaschii (strain ATCC 43067 / DSM 2661 / JAL-1 / JCM 10045 / NBRC 100440) Putative type I restriction enzyme MjaVIIIP endonuclease subunit Proteins 0.000 description 8
- 101000658529 Methanocaldococcus jannaschii (strain ATCC 43067 / DSM 2661 / JAL-1 / JCM 10045 / NBRC 100440) Putative type I restriction enzyme MjaVIIP endonuclease subunit Proteins 0.000 description 8
- 108020004511 Recombinant DNA Proteins 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 101001042773 Staphylococcus aureus (strain COL) Type I restriction enzyme SauCOLORF180P endonuclease subunit Proteins 0.000 description 8
- 101000838760 Staphylococcus aureus (strain MRSA252) Type I restriction enzyme SauMRSORF196P endonuclease subunit Proteins 0.000 description 8
- 101000838761 Staphylococcus aureus (strain MSSA476) Type I restriction enzyme SauMSSORF170P endonuclease subunit Proteins 0.000 description 8
- 101000838758 Staphylococcus aureus (strain MW2) Type I restriction enzyme SauMW2ORF169P endonuclease subunit Proteins 0.000 description 8
- 101001042566 Staphylococcus aureus (strain Mu50 / ATCC 700699) Type I restriction enzyme SauMu50ORF195P endonuclease subunit Proteins 0.000 description 8
- 101000838763 Staphylococcus aureus (strain N315) Type I restriction enzyme SauN315I endonuclease subunit Proteins 0.000 description 8
- 101000838759 Staphylococcus epidermidis (strain ATCC 35984 / RP62A) Type I restriction enzyme SepRPIP endonuclease subunit Proteins 0.000 description 8
- 101000838756 Staphylococcus saprophyticus subsp. saprophyticus (strain ATCC 15305 / DSM 20229 / NCIMB 8711 / NCTC 7292 / S-41) Type I restriction enzyme SsaAORF53P endonuclease subunit Proteins 0.000 description 8
- 108091036066 Three prime untranslated region Proteins 0.000 description 8
- 241000607479 Yersinia pestis Species 0.000 description 8
- 235000001014 amino acid Nutrition 0.000 description 8
- 229940024606 amino acid Drugs 0.000 description 8
- 238000002869 basic local alignment search tool Methods 0.000 description 8
- 239000002299 complementary DNA Substances 0.000 description 8
- 230000010354 integration Effects 0.000 description 8
- 239000003921 oil Substances 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 230000028070 sporulation Effects 0.000 description 8
- 230000001629 suppression Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 241000589158 Agrobacterium Species 0.000 description 7
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 7
- 230000009418 agronomic effect Effects 0.000 description 7
- 230000001364 causal effect Effects 0.000 description 7
- 230000002538 fungal effect Effects 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 241000219194 Arabidopsis Species 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- 108020005004 Guide RNA Proteins 0.000 description 6
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 6
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 6
- 229920002472 Starch Polymers 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 6
- 108020002326 glutamine synthetase Proteins 0.000 description 6
- 230000003902 lesion Effects 0.000 description 6
- 238000002844 melting Methods 0.000 description 6
- 230000008018 melting Effects 0.000 description 6
- 238000010369 molecular cloning Methods 0.000 description 6
- 230000008488 polyadenylation Effects 0.000 description 6
- 239000002987 primer (paints) Substances 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 235000019698 starch Nutrition 0.000 description 6
- 239000008107 starch Substances 0.000 description 6
- 108010000700 Acetolactate synthase Proteins 0.000 description 5
- 108010084185 Cellulases Proteins 0.000 description 5
- 102000005575 Cellulases Human genes 0.000 description 5
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 5
- 108700024394 Exon Proteins 0.000 description 5
- 108700009124 Transcription Initiation Site Proteins 0.000 description 5
- 108091023045 Untranslated Region Proteins 0.000 description 5
- 102000004139 alpha-Amylases Human genes 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000002708 enhancing effect Effects 0.000 description 5
- 244000053095 fungal pathogen Species 0.000 description 5
- 102000054766 genetic haplotypes Human genes 0.000 description 5
- 102000005396 glutamine synthetase Human genes 0.000 description 5
- 230000005764 inhibitory process Effects 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 108091027963 non-coding RNA Proteins 0.000 description 5
- 102000042567 non-coding RNA Human genes 0.000 description 5
- 230000008929 regeneration Effects 0.000 description 5
- 238000011069 regeneration method Methods 0.000 description 5
- 150000003839 salts Chemical class 0.000 description 5
- 239000002689 soil Substances 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 238000011426 transformation method Methods 0.000 description 5
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 4
- 108020005544 Antisense RNA Proteins 0.000 description 4
- 241000193388 Bacillus thuringiensis Species 0.000 description 4
- 102100032487 Beta-mannosidase Human genes 0.000 description 4
- 230000004544 DNA amplification Effects 0.000 description 4
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 4
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 4
- 102000019223 Interleukin-1 receptor Human genes 0.000 description 4
- 108050006617 Interleukin-1 receptor Proteins 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- 102000035195 Peptidases Human genes 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- 108091081024 Start codon Proteins 0.000 description 4
- 108090000704 Tubulin Proteins 0.000 description 4
- 241000607757 Xenorhabdus Species 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- OJOBTAOGJIWAGB-UHFFFAOYSA-N acetosyringone Chemical compound COC1=CC(C(C)=O)=CC(OC)=C1O OJOBTAOGJIWAGB-UHFFFAOYSA-N 0.000 description 4
- 229940024171 alpha-amylase Drugs 0.000 description 4
- 230000000692 anti-sense effect Effects 0.000 description 4
- 229940097012 bacillus thuringiensis Drugs 0.000 description 4
- 108010055059 beta-Mannosidase Proteins 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 229960001338 colchicine Drugs 0.000 description 4
- 239000003184 complementary RNA Substances 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 4
- 235000013399 edible fruits Nutrition 0.000 description 4
- 239000012870 embryo rescue medium Substances 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 238000003205 genotyping method Methods 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 102000054765 polymorphisms of proteins Human genes 0.000 description 4
- 238000001742 protein purification Methods 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 230000001131 transforming effect Effects 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 238000011282 treatment Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical class O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 3
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 description 3
- 102000000452 Acetyl-CoA carboxylase Human genes 0.000 description 3
- 108010016219 Acetyl-CoA carboxylase Proteins 0.000 description 3
- 108010018763 Biotin carboxylase Proteins 0.000 description 3
- 108700004991 Cas12a Proteins 0.000 description 3
- 241000221955 Chaetomium Species 0.000 description 3
- LMKYZBGVKHTLTN-NKWVEPMBSA-N D-nopaline Chemical compound NC(=N)NCCC[C@@H](C(O)=O)N[C@@H](C(O)=O)CCC(O)=O LMKYZBGVKHTLTN-NKWVEPMBSA-N 0.000 description 3
- 239000003155 DNA primer Substances 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 108091060211 Expressed sequence tag Proteins 0.000 description 3
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 3
- 102100022624 Glucoamylase Human genes 0.000 description 3
- 239000005562 Glyphosate Substances 0.000 description 3
- 102000004157 Hydrolases Human genes 0.000 description 3
- 108090000604 Hydrolases Proteins 0.000 description 3
- 108010028688 Isoamylase Proteins 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 3
- 244000061176 Nicotiana tabacum Species 0.000 description 3
- 108091005461 Nucleic proteins Proteins 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 108700001094 Plant Genes Proteins 0.000 description 3
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 3
- 229940100389 Sulfonylurea Drugs 0.000 description 3
- 108091028113 Trans-activating crRNA Proteins 0.000 description 3
- 241000499912 Trichoderma reesei Species 0.000 description 3
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- JFDZBHWFFUWGJE-UHFFFAOYSA-N benzonitrile Chemical compound N#CC1=CC=CC=C1 JFDZBHWFFUWGJE-UHFFFAOYSA-N 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 230000036978 cell physiology Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 230000009918 complex formation Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000000593 degrading effect Effects 0.000 description 3
- 235000019621 digestibility Nutrition 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000000855 fermentation Methods 0.000 description 3
- 230000004151 fermentation Effects 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 3
- 229940097068 glyphosate Drugs 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 238000003306 harvesting Methods 0.000 description 3
- 239000005556 hormone Substances 0.000 description 3
- 229940088597 hormone Drugs 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 239000003112 inhibitor Substances 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000035800 maturation Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 108010058731 nopaline synthase Proteins 0.000 description 3
- 238000007899 nucleic acid hybridization Methods 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 238000003976 plant breeding Methods 0.000 description 3
- 210000002706 plastid Anatomy 0.000 description 3
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 3
- 108020001580 protein domains Proteins 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000001850 reproductive effect Effects 0.000 description 3
- 230000001568 sexual effect Effects 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 150000008163 sugars Chemical class 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000005026 transcription initiation Effects 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 230000014621 translational initiation Effects 0.000 description 3
- MYPYJXKWCTUITO-UHFFFAOYSA-N vancomycin Natural products O1C(C(=C2)Cl)=CC=C2C(O)C(C(NC(C2=CC(O)=CC(O)=C2C=2C(O)=CC=C3C=2)C(O)=O)=O)NC(=O)C3NC(=O)C2NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(CC(C)C)NC)C(O)C(C=C3Cl)=CC=C3OC3=CC2=CC1=C3OC1OC(CO)C(O)C(O)C1OC1CC(C)(N)C(O)C(C)O1 MYPYJXKWCTUITO-UHFFFAOYSA-N 0.000 description 3
- 239000011782 vitamin Substances 0.000 description 3
- 229940088594 vitamin Drugs 0.000 description 3
- 229930003231 vitamin Natural products 0.000 description 3
- 235000013343 vitamin Nutrition 0.000 description 3
- 150000003722 vitamin derivatives Chemical class 0.000 description 3
- 229910052725 zinc Inorganic materials 0.000 description 3
- 239000011701 zinc Substances 0.000 description 3
- 108090000344 1,4-alpha-Glucan Branching Enzyme Proteins 0.000 description 2
- 102000003925 1,4-alpha-Glucan Branching Enzyme Human genes 0.000 description 2
- KIAPWMKFHIKQOZ-UHFFFAOYSA-N 2-[[(4-fluorophenyl)-oxomethyl]amino]benzoic acid methyl ester Chemical compound COC(=O)C1=CC=CC=C1NC(=O)C1=CC=C(F)C=C1 KIAPWMKFHIKQOZ-UHFFFAOYSA-N 0.000 description 2
- QUTYKIXIUDQOLK-PRJMDXOYSA-N 5-O-(1-carboxyvinyl)-3-phosphoshikimic acid Chemical compound O[C@H]1[C@H](OC(=C)C(O)=O)CC(C(O)=O)=C[C@H]1OP(O)(O)=O QUTYKIXIUDQOLK-PRJMDXOYSA-N 0.000 description 2
- 241000219195 Arabidopsis thaliana Species 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 240000006439 Aspergillus oryzae Species 0.000 description 2
- 229930192334 Auxin Natural products 0.000 description 2
- 102100026189 Beta-galactosidase Human genes 0.000 description 2
- 235000005078 Chaenomeles speciosa Nutrition 0.000 description 2
- 240000000425 Chaenomeles speciosa Species 0.000 description 2
- 241001478240 Coccus Species 0.000 description 2
- 240000004792 Corchorus capsularis Species 0.000 description 2
- 239000005504 Dicamba Substances 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 108090000371 Esterases Proteins 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 2
- 239000005561 Glufosinate Substances 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 241000192943 Glycine curvata Species 0.000 description 2
- 241000192963 Glycine falcata Species 0.000 description 2
- 241000192962 Glycine latifolia Species 0.000 description 2
- 235000005335 Glycine tabacina Nutrition 0.000 description 2
- 240000003082 Glycine tabacina Species 0.000 description 2
- 241000178321 Glycine tomentella Species 0.000 description 2
- 241000896246 Golovinomyces cichoracearum Species 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 238000009015 Human TaqMan MicroRNA Assay kit Methods 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- 102000015696 Interleukins Human genes 0.000 description 2
- 108010063738 Interleukins Proteins 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 108090001090 Lectins Proteins 0.000 description 2
- 102000004856 Lectins Human genes 0.000 description 2
- 108090001060 Lipase Proteins 0.000 description 2
- 102000004882 Lipase Human genes 0.000 description 2
- 239000004367 Lipase Substances 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 241000588622 Moraxella bovis Species 0.000 description 2
- 241000235395 Mucor Species 0.000 description 2
- 240000002778 Neonotonia wightii Species 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 241000440444 Phakopsora Species 0.000 description 2
- 108010064851 Plant Proteins Proteins 0.000 description 2
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 2
- 238000011529 RT qPCR Methods 0.000 description 2
- 241000235403 Rhizomucor miehei Species 0.000 description 2
- 241000235527 Rhizopus Species 0.000 description 2
- 241000722027 Schizaphis graminum Species 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 244000062793 Sorghum vulgare Species 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 241001521901 Tribulus lanuginosus Species 0.000 description 2
- 241000223259 Trichoderma Species 0.000 description 2
- 102000004243 Tubulin Human genes 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241000607735 Xenorhabdus nematophila Species 0.000 description 2
- JUGOREOARAHOCO-UHFFFAOYSA-M acetylcholine chloride Chemical compound [Cl-].CC(=O)OCC[N+](C)(C)C JUGOREOARAHOCO-UHFFFAOYSA-M 0.000 description 2
- 108010093941 acetylxylan esterase Proteins 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 150000003838 adenosines Chemical class 0.000 description 2
- 108010030291 alpha-Galactosidase Proteins 0.000 description 2
- 108010061314 alpha-L-Fucosidase Proteins 0.000 description 2
- 108010044879 alpha-L-rhamnosidase Proteins 0.000 description 2
- 108010012864 alpha-Mannosidase Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 239000012491 analyte Substances 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 239000002363 auxin Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 208000036815 beta tubulin Diseases 0.000 description 2
- 108010019077 beta-Amylase Proteins 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- 108010047754 beta-Glucosidase Proteins 0.000 description 2
- 238000004166 bioassay Methods 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 239000007844 bleaching agent Substances 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 101150038500 cas9 gene Proteins 0.000 description 2
- 210000002421 cell wall Anatomy 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- SBPBAQFWLVIOKP-UHFFFAOYSA-N chlorpyrifos Chemical compound CCOP(=S)(OCC)OC1=NC(Cl)=C(Cl)C=C1Cl SBPBAQFWLVIOKP-UHFFFAOYSA-N 0.000 description 2
- 239000013611 chromosomal DNA Substances 0.000 description 2
- 108010005400 cutinase Proteins 0.000 description 2
- JHIVVAPYMSGYDF-UHFFFAOYSA-N cyclohexanone Chemical compound O=C1CCCCC1 JHIVVAPYMSGYDF-UHFFFAOYSA-N 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- IWEDIXLBFLAXBO-UHFFFAOYSA-N dicamba Chemical compound COC1=C(Cl)C=CC(Cl)=C1C(O)=O IWEDIXLBFLAXBO-UHFFFAOYSA-N 0.000 description 2
- 102000038379 digestive enzymes Human genes 0.000 description 2
- 108091007734 digestive enzymes Proteins 0.000 description 2
- 235000021186 dishes Nutrition 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 239000012877 elongation medium Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000004720 fertilization Effects 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 102000034356 gene-regulatory proteins Human genes 0.000 description 2
- 108091006104 gene-regulatory proteins Proteins 0.000 description 2
- 230000004077 genetic alteration Effects 0.000 description 2
- 231100000118 genetic alteration Toxicity 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 239000012869 germination medium Substances 0.000 description 2
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 2
- 108010039239 glyphosate N-acetyltransferase Proteins 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 108010002430 hemicellulase Proteins 0.000 description 2
- 210000000087 hemolymph Anatomy 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000009655 industrial fermentation Methods 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 238000011081 inoculation Methods 0.000 description 2
- 238000011016 integrity testing Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 239000002523 lectin Substances 0.000 description 2
- 235000019421 lipase Nutrition 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- SXTAYKAGBXMACB-UHFFFAOYSA-N methionine sulfoximine Chemical compound CS(=N)(=O)CCC(N)C(O)=O SXTAYKAGBXMACB-UHFFFAOYSA-N 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 230000006780 non-homologous end joining Effects 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 230000002974 pharmacogenomic effect Effects 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 150000004713 phosphodiesters Chemical group 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 150000004804 polysaccharides Chemical class 0.000 description 2
- 230000001124 posttranscriptional effect Effects 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000003007 single stranded DNA break Effects 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 230000001954 sterilising effect Effects 0.000 description 2
- 238000004659 sterilization and disinfection Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 239000003053 toxin Substances 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- 108700012359 toxins Proteins 0.000 description 2
- ZSDSQXJSNMTJDA-UHFFFAOYSA-N trifluralin Chemical compound CCCN(CCC)C1=C([N+]([O-])=O)C=C(C(F)(F)F)C=C1[N+]([O-])=O ZSDSQXJSNMTJDA-UHFFFAOYSA-N 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- DYLIWHYUXAJDOJ-OWOJBTEDSA-N (e)-4-(6-aminopurin-9-yl)but-2-en-1-ol Chemical compound NC1=NC=NC2=C1N=CN2C\C=C\CO DYLIWHYUXAJDOJ-OWOJBTEDSA-N 0.000 description 1
- JIHQDMXYYFUGFV-UHFFFAOYSA-N 1,3,5-triazine Chemical compound C1=NC=NC=N1 JIHQDMXYYFUGFV-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- IBXNCJKFFQIKKY-UHFFFAOYSA-N 1-pentyne Chemical compound CCCC#C IBXNCJKFFQIKKY-UHFFFAOYSA-N 0.000 description 1
- NDUPDOJHUQKPAG-UHFFFAOYSA-M 2,2-Dichloropropanoate Chemical compound CC(Cl)(Cl)C([O-])=O NDUPDOJHUQKPAG-UHFFFAOYSA-M 0.000 description 1
- GOCUAJYOYBLQRH-UHFFFAOYSA-N 2-(4-{[3-chloro-5-(trifluoromethyl)pyridin-2-yl]oxy}phenoxy)propanoic acid Chemical compound C1=CC(OC(C)C(O)=O)=CC=C1OC1=NC=C(C(F)(F)F)C=C1Cl GOCUAJYOYBLQRH-UHFFFAOYSA-N 0.000 description 1
- SXERGJJQSKIUIC-UHFFFAOYSA-N 2-Phenoxypropionic acid Chemical compound OC(=O)C(C)OC1=CC=CC=C1 SXERGJJQSKIUIC-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- 102100027328 2-hydroxyacyl-CoA lyase 2 Human genes 0.000 description 1
- 101150090724 3 gene Proteins 0.000 description 1
- CXURGFRDGROIKG-UHFFFAOYSA-N 3,3-bis(chloromethyl)oxetane Chemical compound ClCC1(CCl)COC1 CXURGFRDGROIKG-UHFFFAOYSA-N 0.000 description 1
- UPMXNNIRAGDFEH-UHFFFAOYSA-N 3,5-dibromo-4-hydroxybenzonitrile Chemical compound OC1=C(Br)C=C(C#N)C=C1Br UPMXNNIRAGDFEH-UHFFFAOYSA-N 0.000 description 1
- 102100026105 3-ketoacyl-CoA thiolase, mitochondrial Human genes 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- 108010011619 6-Phytase Proteins 0.000 description 1
- CKOMXBHMKXXTNW-UHFFFAOYSA-N 6-methyladenine Chemical compound CNC1=NC=NC2=C1N=CN2 CKOMXBHMKXXTNW-UHFFFAOYSA-N 0.000 description 1
- WFPZSXYXPSUOPY-ROYWQJLOSA-N ADP alpha-D-glucoside Chemical compound C([C@H]1O[C@H]([C@@H]([C@@H]1O)O)N1C=2N=CN=C(C=2N=C1)N)OP(O)(=O)OP(O)(=O)O[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O WFPZSXYXPSUOPY-ROYWQJLOSA-N 0.000 description 1
- 101710103719 Acetolactate synthase large subunit Proteins 0.000 description 1
- 101710182467 Acetolactate synthase large subunit IlvB1 Proteins 0.000 description 1
- 101710171176 Acetolactate synthase large subunit IlvG Proteins 0.000 description 1
- 101710176702 Acetolactate synthase small subunit Proteins 0.000 description 1
- 101710147947 Acetolactate synthase small subunit 1, chloroplastic Proteins 0.000 description 1
- 101710095712 Acetolactate synthase, mitochondrial Proteins 0.000 description 1
- 108010003902 Acetyl-CoA C-acyltransferase Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 101100385358 Alicyclobacillus acidoterrestris (strain ATCC 49025 / DSM 3922 / CIP 106132 / NCIMB 13137 / GD3B) cas12b gene Proteins 0.000 description 1
- 101710171801 Alpha-amylase inhibitor Proteins 0.000 description 1
- 108010039224 Amidophosphoribosyltransferase Proteins 0.000 description 1
- 244000226021 Anacardium occidentale Species 0.000 description 1
- 244000099147 Ananas comosus Species 0.000 description 1
- 235000007119 Ananas comosus Nutrition 0.000 description 1
- 108700011902 Arabidopsis BAF60 Proteins 0.000 description 1
- 101710152845 Arabinogalactan endo-beta-1,4-galactanase Proteins 0.000 description 1
- 235000017060 Arachis glabrata Nutrition 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- 235000018262 Arachis monticola Nutrition 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241001408449 Asca Species 0.000 description 1
- 241001513093 Aspergillus awamori Species 0.000 description 1
- 101001065065 Aspergillus awamori Feruloyl esterase A Proteins 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 1
- 241001132374 Asta Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 235000007558 Avena sp Nutrition 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000193755 Bacillus cereus Species 0.000 description 1
- 101100007609 Bacillus thuringiensis subsp. aizawai cry1Fa gene Proteins 0.000 description 1
- 101100497219 Bacillus thuringiensis subsp. kurstaki cry1Ac gene Proteins 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 241001450781 Bipolaris oryzae Species 0.000 description 1
- 241001480061 Blumeria graminis Species 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 1
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 1
- 241000193764 Brevibacillus brevis Species 0.000 description 1
- 241000193417 Brevibacillus laterosporus Species 0.000 description 1
- 241000186146 Brevibacterium Species 0.000 description 1
- 239000005489 Bromoxynil Substances 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- 238000006037 Brook Silaketone rearrangement reaction Methods 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 101100274581 Caenorhabditis elegans chc-1 gene Proteins 0.000 description 1
- 101100532801 Caenorhabditis elegans sdn-1 gene Proteins 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 229920000049 Carbon (fiber) Polymers 0.000 description 1
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 1
- 235000009467 Carica papaya Nutrition 0.000 description 1
- 240000006432 Carica papaya Species 0.000 description 1
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 1
- 244000020518 Carthamus tinctorius Species 0.000 description 1
- 241001107116 Castanospermum australe Species 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- 108091092236 Chimeric RNA Proteins 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 108010089254 Cholesterol oxidase Proteins 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 241000272194 Ciconiiformes Species 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 240000007154 Coffea arabica Species 0.000 description 1
- 241000218631 Coniferophyta Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241001362614 Crassa Species 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 108010025880 Cyclomaltodextrin glucanotransferase Proteins 0.000 description 1
- CMSMOCZEIVJLDB-UHFFFAOYSA-N Cyclophosphamide Chemical compound ClCCN(CCCl)P1(=O)NCCCO1 CMSMOCZEIVJLDB-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 1
- 102000003849 Cytochrome P450 Human genes 0.000 description 1
- MTCFGRXMJLQNBG-UWTATZPHSA-N D-Serine Chemical compound OC[C@@H](N)C(O)=O MTCFGRXMJLQNBG-UWTATZPHSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 108020001019 DNA Primers Proteins 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 101710096830 DNA-3-methyladenine glycosylase Proteins 0.000 description 1
- 102100039128 DNA-3-methyladenine glycosylase Human genes 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 241001300076 Deroceras reticulatum Species 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241001273467 Didymella pinodes Species 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 241000219764 Dolichos Species 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 108010001817 Endo-1,4-beta Xylanases Proteins 0.000 description 1
- 101710147028 Endo-beta-1,4-galactanase Proteins 0.000 description 1
- 102100023164 Epididymis-specific alpha-mannosidase Human genes 0.000 description 1
- 241000510928 Erysiphe necator Species 0.000 description 1
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 1
- 241000220485 Fabaceae Species 0.000 description 1
- 108010087894 Fatty acid desaturases Proteins 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 241000628997 Flos Species 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 241000702463 Geminiviridae Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 206010071602 Genetic polymorphism Diseases 0.000 description 1
- 108050008938 Glucoamylases Proteins 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 108010056771 Glucosidases Proteins 0.000 description 1
- 102000004366 Glucosidases Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 241000233600 Glycine albicans Species 0.000 description 1
- 241000192922 Glycine arenaria Species 0.000 description 1
- 241000192919 Glycine argyrea Species 0.000 description 1
- 241000233596 Glycine canescens Species 0.000 description 1
- 241000192940 Glycine cyrtoloba Species 0.000 description 1
- 241000514774 Glycine gracei Species 0.000 description 1
- 241000192961 Glycine latrobeana Species 0.000 description 1
- 241000192959 Glycine microphylla Species 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 240000008907 Gonostegia hirta Species 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 241000878113 Gyrotrema album Species 0.000 description 1
- 229940121710 HMGCoA reductase inhibitor Drugs 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 244000020551 Helianthus annuus Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 108010034145 Helminth Proteins Proteins 0.000 description 1
- 101000742054 Homo sapiens Protein phosphatase 1D Proteins 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 241001632576 Hyacinthus Species 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- IMQLKJBTEOYOSI-GPIVLXJGSA-N Inositol-hexakisphosphate Chemical compound OP(O)(=O)O[C@H]1[C@H](OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@@H]1OP(O)(O)=O IMQLKJBTEOYOSI-GPIVLXJGSA-N 0.000 description 1
- 108700001097 Insect Genes Proteins 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 108010044467 Isoenzymes Proteins 0.000 description 1
- FAIXYKHYOGVFKA-UHFFFAOYSA-N Kinetin Natural products N=1C=NC=2N=CNC=2C=1N(C)C1=CC=CO1 FAIXYKHYOGVFKA-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 108010029541 Laccase Proteins 0.000 description 1
- 241000229179 Ledebouriella Species 0.000 description 1
- 241000029590 Leptotrichia wadei Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241000186781 Listeria Species 0.000 description 1
- 241000390917 Listeria newyorkensis Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000568397 Lysinibacillus Species 0.000 description 1
- 241001472591 Lysinibacillus sp. Species 0.000 description 1
- 241000193386 Lysinibacillus sphaericus Species 0.000 description 1
- 101150050813 MPI gene Proteins 0.000 description 1
- 241000208467 Macadamia Species 0.000 description 1
- 241001344131 Magnaporthe grisea Species 0.000 description 1
- 235000014826 Mangifera indica Nutrition 0.000 description 1
- 240000007228 Mangifera indica Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 229920000881 Modified starch Polymers 0.000 description 1
- 241000143639 Monocystis Species 0.000 description 1
- 241000542065 Moraxella bovoculi Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 241000721623 Myzus Species 0.000 description 1
- 241001460678 Napo <wasp> Species 0.000 description 1
- 241000498271 Necator Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108010033272 Nitrilase Proteins 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 240000007817 Olea europaea Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 101150014068 PPIP5K1 gene Proteins 0.000 description 1
- 102100026367 Pancreatic alpha-amylase Human genes 0.000 description 1
- 241000816823 Panellus luminescens Species 0.000 description 1
- 102000003992 Peroxidases Human genes 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 241000682645 Phakopsora pachyrhizi Species 0.000 description 1
- IMQLKJBTEOYOSI-UHFFFAOYSA-N Phytic acid Natural products OP(O)(=O)OC1C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C1OP(O)(O)=O IMQLKJBTEOYOSI-UHFFFAOYSA-N 0.000 description 1
- 241000948155 Phytophthora sojae Species 0.000 description 1
- 241000758706 Piperaceae Species 0.000 description 1
- 108020005120 Plant DNA Proteins 0.000 description 1
- 241000317981 Podosphaera fuliginea Species 0.000 description 1
- 241000951259 Podosphaera xanthii Species 0.000 description 1
- 108010059820 Polygalacturonase Proteins 0.000 description 1
- 229920000331 Polyhydroxybutyrate Polymers 0.000 description 1
- 101710196435 Probable acetolactate synthase large subunit Proteins 0.000 description 1
- 101710181764 Probable acetolactate synthase small subunit Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 102100038675 Protein phosphatase 1D Human genes 0.000 description 1
- 108020001991 Protoporphyrinogen Oxidase Proteins 0.000 description 1
- 102000005135 Protoporphyrinogen oxidase Human genes 0.000 description 1
- 235000009827 Prunus armeniaca Nutrition 0.000 description 1
- 244000018633 Prunus armeniaca Species 0.000 description 1
- 235000006029 Prunus persica var nucipersica Nutrition 0.000 description 1
- 244000017714 Prunus persica var. nucipersica Species 0.000 description 1
- 241001547082 Pseudobacillus Species 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 241000508269 Psidium Species 0.000 description 1
- 241000221300 Puccinia Species 0.000 description 1
- 101710104000 Putative acetolactate synthase small subunit Proteins 0.000 description 1
- 241000233639 Pythium Species 0.000 description 1
- 241000918584 Pythium ultimum Species 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 101150075111 ROLB gene Proteins 0.000 description 1
- 101150013395 ROLC gene Proteins 0.000 description 1
- 241000125167 Rhopalosiphum padi Species 0.000 description 1
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 1
- 101150008294 SDN2 gene Proteins 0.000 description 1
- 101150073692 SDN3 gene Proteins 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 241001533598 Septoria Species 0.000 description 1
- CSPPKDPQLUUTND-NBVRZTHBSA-N Sethoxydim Chemical compound CCO\N=C(/CCC)C1=C(O)CC(CC(C)SCC)CC1=O CSPPKDPQLUUTND-NBVRZTHBSA-N 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 101000611441 Solanum lycopersicum Pathogenesis-related leaf protein 6 Proteins 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 235000019764 Soybean Meal Nutrition 0.000 description 1
- 241000592344 Spermatophyta Species 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 1
- 108010039811 Starch synthase Proteins 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 241000819233 Tribulus <sea snail> Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108010046334 Urease Proteins 0.000 description 1
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Natural products O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 1
- 241000510764 Villosa Species 0.000 description 1
- 241000123579 Xenorhabdus bovienii Species 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 101150067314 aadA gene Proteins 0.000 description 1
- 230000036579 abiotic stress Effects 0.000 description 1
- 239000000370 acceptor Substances 0.000 description 1
- 108091000039 acetoacetyl-CoA reductase Proteins 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 102000005840 alpha-Galactosidase Human genes 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 102000012086 alpha-L-Fucosidase Human genes 0.000 description 1
- 102000019199 alpha-Mannosidase Human genes 0.000 description 1
- OQXCFOKEAFQNJL-UHFFFAOYSA-N amino diethyl phosphate Chemical compound CCOP(=O)(ON)OCC OQXCFOKEAFQNJL-UHFFFAOYSA-N 0.000 description 1
- 229940126575 aminoglycoside Drugs 0.000 description 1
- 239000003392 amylase inhibitor Substances 0.000 description 1
- 229940025131 amylases Drugs 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 230000000721 bacterilogical effect Effects 0.000 description 1
- 235000013527 bean curd Nutrition 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000000440 bentonite Substances 0.000 description 1
- 229910000278 bentonite Inorganic materials 0.000 description 1
- SVPXDRXYRYOSEX-UHFFFAOYSA-N bentoquatam Chemical compound O.O=[Si]=O.O=[Al]O[Al]=O SVPXDRXYRYOSEX-UHFFFAOYSA-N 0.000 description 1
- 108010048056 beta-1,3-exoglucanase Proteins 0.000 description 1
- 102000006995 beta-Glucosidase Human genes 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 238000012742 biochemical analysis Methods 0.000 description 1
- 238000010364 biochemical engineering Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 229920000704 biodegradable plastic Polymers 0.000 description 1
- 235000021279 black bean Nutrition 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 235000011089 carbon dioxide Nutrition 0.000 description 1
- 239000004917 carbon fiber Substances 0.000 description 1
- 150000003857 carboxamides Chemical class 0.000 description 1
- 230000000747 cardiac effect Effects 0.000 description 1
- 101150059443 cas12a gene Proteins 0.000 description 1
- 101150098304 cas13a gene Proteins 0.000 description 1
- 108010079058 casein hydrolysate Proteins 0.000 description 1
- 235000020226 cashew nut Nutrition 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 101150052795 cbh-1 gene Proteins 0.000 description 1
- 101150114858 cbh2 gene Proteins 0.000 description 1
- 229960004261 cefotaxime Drugs 0.000 description 1
- AZZMGZXNTDTSME-JUZDKLSSSA-M cefotaxime sodium Chemical compound [Na+].N([C@@H]1C(N2C(=C(COC(C)=O)CS[C@@H]21)C([O-])=O)=O)C(=O)\C(=N/OC)C1=CSC(N)=N1 AZZMGZXNTDTSME-JUZDKLSSSA-M 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 108091092328 cellular RNA Proteins 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 108010080434 cephalosporin-C deacetylase Proteins 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 108090001092 clostripain Proteins 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 235000016213 coffee Nutrition 0.000 description 1
- 235000013353 coffee beverage Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000009850 completed effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- 238000009402 cross-breeding Methods 0.000 description 1
- 230000010154 cross-pollination Effects 0.000 description 1
- 101150065438 cry1Ab gene Proteins 0.000 description 1
- 101150102059 cry3Aa gene Proteins 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- OILAIQUEIWYQPH-UHFFFAOYSA-N cyclohexane-1,2-dione Chemical compound O=C1CCCCC1=O OILAIQUEIWYQPH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- GVJHHUAWPYXKBD-UHFFFAOYSA-N d-alpha-tocopherol Natural products OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000001784 detoxification Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 108010050200 endo-1,4-beta-D-mannanase Proteins 0.000 description 1
- YERABYSOHUZTPQ-UHFFFAOYSA-P endo-1,4-beta-Xylanase Chemical compound C=1C=CC=CC=1C[N+](CC)(CC)CCCNC(C(C=1)=O)=CC(=O)C=1NCCC[N+](CC)(CC)CC1=CC=CC=C1 YERABYSOHUZTPQ-UHFFFAOYSA-P 0.000 description 1
- 230000037149 energy metabolism Effects 0.000 description 1
- 239000003256 environmental substance Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- NSYZCCDSJNWWJL-YXOIYICCSA-N erythromycin ethylsuccinate Chemical compound O1[C@H](C)C[C@H](N(C)C)[C@@H](OC(=O)CCC(=O)OCC)[C@@H]1O[C@H]1[C@@](O)(C)C[C@@H](C)C(=O)[C@H](C)[C@@H](O)[C@](C)(O)[C@@H](CC)OC(=O)[C@H](C)[C@@H](O[C@@H]2O[C@@H](C)[C@H](O)[C@](C)(OC)C2)[C@@H]1C NSYZCCDSJNWWJL-YXOIYICCSA-N 0.000 description 1
- 108010038658 exo-1,4-beta-D-xylosidase Proteins 0.000 description 1
- 108010093305 exopolygalacturonase Proteins 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 239000003008 fumonisin Substances 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 230000035784 germination Effects 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 150000002333 glycines Chemical class 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 244000000013 helminth Species 0.000 description 1
- 230000002573 hemicellulolytic effect Effects 0.000 description 1
- 230000010196 hermaphroditism Effects 0.000 description 1
- 229920000140 heteropolymer Polymers 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000000984 immunochemical effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 1
- 238000012994 industrial processing Methods 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 108010090785 inulinase Proteins 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 229930014550 juvenile hormone Natural products 0.000 description 1
- 239000002949 juvenile hormone Substances 0.000 description 1
- 150000003633 juvenile hormone derivatives Chemical class 0.000 description 1
- QANMHLXAZMSUEX-UHFFFAOYSA-N kinetin Chemical compound N=1C=NC=2N=CNC=2C=1NCC1=CC=CO1 QANMHLXAZMSUEX-UHFFFAOYSA-N 0.000 description 1
- 229960001669 kinetin Drugs 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 230000001418 larval effect Effects 0.000 description 1
- 108010005131 levanase Proteins 0.000 description 1
- 229920005610 lignin Polymers 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 230000004777 loss-of-function mutation Effects 0.000 description 1
- 235000020044 madeira Nutrition 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 108010083942 mannopine synthase Proteins 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000010198 maturation time Effects 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 230000021121 meiosis Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000003595 mist Substances 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 235000019426 modified starch Nutrition 0.000 description 1
- 230000009753 muscle formation Effects 0.000 description 1
- 239000006199 nebulizer Substances 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 235000021049 nutrient content Nutrition 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 235000014571 nuts Nutrition 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 229940124276 oligodeoxyribonucleotide Drugs 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 238000013021 overheating Methods 0.000 description 1
- 210000004681 ovum Anatomy 0.000 description 1
- 230000020477 pH reduction Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 108040007629 peroxidase activity proteins Proteins 0.000 description 1
- 230000000361 pesticidal effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 1
- 230000029553 photosynthesis Effects 0.000 description 1
- 238000010672 photosynthesis Methods 0.000 description 1
- 229940068041 phytic acid Drugs 0.000 description 1
- 239000000467 phytic acid Substances 0.000 description 1
- 235000002949 phytic acid Nutrition 0.000 description 1
- 239000003375 plant hormone Substances 0.000 description 1
- 239000005014 poly(hydroxyalkanoate) Substances 0.000 description 1
- 239000005015 poly(hydroxybutyrate) Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000002331 protein detection Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 238000003127 radioimmunoassay Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000009711 regulatory function Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 239000011833 salt mixture Substances 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 230000010153 self-pollination Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000011869 shoot development Effects 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- SUKJFIGYRHOWBL-UHFFFAOYSA-N sodium hypochlorite Chemical compound [Na+].Cl[O-] SUKJFIGYRHOWBL-UHFFFAOYSA-N 0.000 description 1
- 239000004455 soybean meal Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- 230000021595 spermatogenesis Effects 0.000 description 1
- 210000001324 spliceosome Anatomy 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 238000004781 supercooling Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000005062 synaptic transmission Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- HOWHQWFXSLOJEF-MGZLOUMQSA-N systemin Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H]2N(CCC2)C(=O)[C@H]2N(CCC2)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)C(C)C)CCC1 HOWHQWFXSLOJEF-MGZLOUMQSA-N 0.000 description 1
- 108010050014 systemin Proteins 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 235000013616 tea Nutrition 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 229940027257 timentin Drugs 0.000 description 1
- 229960001295 tocopherol Drugs 0.000 description 1
- 229930003799 tocopherol Natural products 0.000 description 1
- 235000010384 tocopherol Nutrition 0.000 description 1
- 239000011732 tocopherol Substances 0.000 description 1
- UZKQTCBAMSWPJD-UQCOIBPSSA-N trans-Zeatin Natural products OCC(/C)=C\CNC1=NC=NC2=C1N=CN2 UZKQTCBAMSWPJD-UQCOIBPSSA-N 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 238000012250 transgenic expression Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 230000035903 transrepression Effects 0.000 description 1
- 150000003918 triazines Chemical class 0.000 description 1
- YWBFPKPWMSWWEA-UHFFFAOYSA-O triazolopyrimidine Chemical compound BrC1=CC=CC(C=2N=C3N=CN[N+]3=C(NCC=3C=CN=CC=3)C=2)=C1 YWBFPKPWMSWWEA-UHFFFAOYSA-O 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 150000005691 triesters Chemical class 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 210000001113 umbilicus Anatomy 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 229940117167 vancomycin 100 mg/ml Drugs 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 229920001221 xylan Polymers 0.000 description 1
- 150000004823 xylans Chemical class 0.000 description 1
- 229940023877 zeatin Drugs 0.000 description 1
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 description 1
Landscapes
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
Abstract
本发明涉及使用衍生自短绒野大豆的基因来鉴定、选择和/或产生病原体抗性植物或种质(例如,大豆植物或种质)的方法和组合物。提供了能够赋予病原体抗性(例如,对亚洲大豆锈病)的候选基因。还提供了通过本发明的任何方法鉴定、选择和/或产生的植物或种质。还提供了病原体抗性种子、植物和种质。
Description
技术领域
本发明涉及用于使用新颖的抗性基因来鉴定、选择和产生增强的疾病和/或病原体抗性植物的组合物和方法。
相关申请
本申请要求于2021年2月10日提交的美国临时专利申请号63/147,849以及于2021年6月10日提交的美国临时专利申请号63/209,005的优先权,其内容通过引用以其全文并入本文。
关于电子提交序列表的声明
提供ASCII文本格式的序列表作为纸质副本的替代,该序列表是根据37C.F.R.§1.821提交的,名称为“82250PCT_ST25.txt”,大小为大约9.07MB,于2022年1月7日生成并经由EFS-Web提交。这个序列表特此通过引用以其全文并入本说明书中。
背景技术
已知植物病原体对重要作物造成相当大的损害,这导致显著的农业损失,伴随着对依赖植物材料的食物供应和其他工业的广泛的后果。同样,申请人期望降低农业病原体对作物产生的发病率和/或影响。
若干种病原体与对大豆的损害相关联,该损害在美国和全世界范围内单独地和共同地有可能造成重大的产量损失。示例性病原体包括但不限于真菌(例如,疫霉属和亚洲大豆锈病豆薯层锈菌(Phakopsora pahyrhizi))、线虫(例如,根结线虫属,特别是爪哇根结线虫)和大豆茎溃疡病。鉴于这些病原体存在对全球食物供应的显著威胁以及与处理大豆作物以预防产量损失相关联的时间和花费,需要用于产生病原体抗性大豆栽培品种的新方法。所需要的是可以引入商业大豆植物以控制大豆病原体的新颖的抗性基因(本文中,“R基因”)。
发明内容
本概述列出了本披露的主题的若干实施例,并且在许多情况下列出了这些实施例的变化。因此,在实施例中,本披露的主题的一个目的是提供用于将病原体抗性传递到非抗性植物和种质的方法。此外,本披露的主题提供了新颖的大豆(Glycine max)品系,该大豆品系基因组中包含染色体区间(chromosome interval)、基因座和/或基因,该染色体区间、基因座和/或基因衍生自短绒野大豆(Glycine tomentella)且给所述新颖的大豆品系赋予病原体抗性,该目的通过本披露主题全部或部分地实现。
在本发明的实施例中,植物或种质是大豆植物或种质,并且病原体是大豆病原体,特别是大豆真菌病原体,例如亚洲大豆锈病(例如,豆薯层锈菌(Phakopsora pachyrhizi);本文中“ASR”)。
本发明提供了衍生自短绒野大豆、特别地登录品系PI505267的染色体区间,当将其引入植物(例如,大豆植物,例如大豆株系Williams82或优良大豆品系)中时足以赋予与不包含所述染色体区间的对照植物相比增加的锈病抗性,例如增加的亚洲大豆锈病(“ASR”)抗性。
本发明还提供了衍生自赋予锈病抗性的短绒野大豆登录品系PI505267的染色体区间的新颖的蛋白质和核酸。在本发明的实施例中,新颖的蛋白质是SEQ ID NO:5的蛋白质或其功能变体,例如基本上类似(例如,具有至少85%、至少90%或至少95%序列同一性)且给表达该蛋白质的植物赋予增加的ASR抗性的变体。在另外的实施例中,提供了包含和/或编码衍生自短绒野大豆登录品系PI505267的染色体区间的新颖的R-基因的核酸,这些核酸在植物中表达时赋予锈病抗性。在实施例中,核酸包含编码SEQ ID NO:5的新颖的蛋白质、或其功能变体的核苷酸序列。在其他实施例中,核酸包含SEQ ID NO:2-4和11-12中的任一个的核苷酸序列;或基本上类似并且能够赋予ASR抗性的序列(例如与SEQ ID NO:2-4和11-12中的任一个具有至少85%、至少90%或至少95%序列同一性的序列)。
本发明还提供了包含本发明的新颖的R-基因和/或编码本发明的新颖的蛋白质的表达盒、载体、和DNA构建体。在实施例中,表达盒允许经由与其可操作地连接的启动子对新颖的核酸和/或蛋白质进行转基因表达。在其他实施例中,DNA构建体允许对新颖的核酸和/或蛋白质进行基因编辑。
本发明还涵盖了新颖的植物,这些新颖的植物基因组中稳定地掺入了衍生自短绒野大豆登录品系PI505267的染色体区间的新颖的核酸序列(例如编码SEQ ID NO:5的新颖的蛋白质或基本上类似的多肽的核酸),该新颖的核酸序列赋予该新颖的植物与不包含该核酸的对照植物相比增加的病原体抗性。在实施例中,植物是新颖的大豆植物和/或新颖的优良大豆植物,其与对照植物相比具有增加的ASR抗性。在实施例中,新颖的核酸序列通过转基因表达、通过基因渗入、通过已知的育种方法、或通过基因编辑而引入植物中。
本发明还提供了通过引入本发明的编码新颖的R-基因和/或蛋白质的核酸序列产生具有增加的ASR抗性的植物的方法。在特别的实施例中,提供了产生抗ASR抗性改善的转基因植物的方法,通过引入包含编码新颖的蛋白质的核苷酸序列(例如,编码SEQ ID NO:5的蛋白质或基本上类似的序列,或包含SEQ ID NO:2-4、11-12中的任一个的核苷酸序列、或基本上类似的序列)的核酸分子进行。在实施例中,核酸通过包含核酸序列的表达盒而引入,将该表达盒引入受体植物中以获得转基因植物,其中该转基因植物与受体植物相比具有增加的抗ASR抗性。
提供了用于鉴定、选择和产生具有增强的病原体(例如,锈病)抗性的大豆属(Glycines)植物(包括野生大豆属、优良大豆属品系和大豆品系)的组合物和方法。还提供了病原体抗性植物和种质(例如,大豆植物和种质)。在一些实施例中,提供了产生ASR抗性大豆植物的方法。
在一些实施例中,提供了鉴定锈病抗性大豆植物或种质的方法。这样的方法可以包括在大豆植物或种质中检测与增强的疾病抗性(特别是ASR抗性)相关联的遗传基因座或分子标记(例如SNP或数量性状基因座(QTL))。在一些实施例中,遗传基因座或分子标记与包含SEQ ID NO 1、2-4、11、或12的核苷酸序列、或其部分的染色体区间的存在相关联,其中其部分与ASR抗性相关联。
前述的以及本发明的其他目的和方面将在以下阐述的附图和说明中进行详细解释。
附图说明
图1是二元载体25845的示意图。
图2是二元载体25899的示意图。
图3示出了对从构建体25845和25899生成的初级大豆事件收集的叶进行的锈病生物测定实验的照片。来自两种构建体(构建体25845的GVG01375963和构建体25899的GVG013773804)的初级大豆事件显示了针对测试的所有三种锈病群体(RTP1、BRS和SUL)的红棕色病灶,然而来自对照(具有相同遗传背景但没有转基因)的叶显示了棕褐色反应和大量的孢子形成。
图4是从构建体25845和25899相对于对照生成的初级大豆事件的疾病抗性评级的表。从构建体25845生成的T0事件GVG01375963以及从25899生成的GVG01373804多次显示出与对照(包含相同遗传背景但没有转基因)相比高水平的疾病抗性。结果使用标准大豆锈病评级量表,其中红棕色(RB)类型指示具有抗性,而棕褐色评级指示易感。RB评级后的数字基于病灶密度或病灶大小的组合(其中从高到中等抗性为1-4级),以及无孢子形成(NSP)或极少孢子形成(SPL)的指示。棕褐色评级后的数字基于脓疱密度和孢子形成水平的组合,其中从低到高孢子形成为1-5级。
图5中图显示了在接种3个锈病群体(SUL、BRS和RTP1)后14天时由二元载体25845和25899构建的两个事件上大豆锈病β-微管蛋白基因的相对表达(y轴)。经由qRT-PCR利用真菌β-微管蛋白在分子水平上测量事件GVG01375963和GVG013773804的抗性水平,并与对照的测量进行比较。数量测量与表型观察一致,即事件显示出高抗性水平。
图6是二元载体25992的示意图。
图7是二元载体26015的示意图。
图8是二元载体25950的示意图。
图9显示了对从构建体25950生成的初级大豆事件收集的叶进行的锈病生物测定实验的照片。两个初级大豆事件都显示了针对测试的锈病群体(RTP1、BRS和SUL)的红棕色病灶,然而来自对照(具有相同遗传背景但没有转基因)的叶显示了棕褐色反应和大量的孢子形成。这指示这些事件对锈病群体具有强抗性。
图10中图显示了在接种3个锈病群体(SUL、BRS和RTP1)后14天时由二元载体25950构建的两个事件上大豆锈病β-微管蛋白基因的相对表达(y轴)。经由qRT-PCR利用真菌β-微管蛋白在分子水平上测量事件的抗性水平,并与对照的测量进行比较。来自T0事件的叶显示的水平为易感对照的<1%。数量测量与表型观察一致,即事件显示出高抗性水平。
图11中图描绘了将来自短绒野大豆的与ASR抗性相关联的基因组区域渗入野生大豆属的示例方法,通过加倍ASR易感的大豆品系以产生四倍体大豆品系,然后使ASR易感的四倍体大豆品系与ASR抗性的二倍体短绒野大豆品系杂交进行。在一些实施例中,大豆品系是优良的大豆品系。在一些实施例中,经基因渗入的基因组区域是赋予增加的ASR抗性的SEQ ID NO:1或其功能片段。在一些实施例中,经基因渗入的基因组区域是SEQ ID NO:2-4、11-12中的任一个。
序列表说明
SEQ ID NO:1是衍生自短绒野大豆品系登录号PI505267的染色体区间,其在本文也称为“重叠群0133”。重叠群0133已定位到短绒野大豆(基因型D3),在3号染色体上约9.28MB-16.48MB(即大小约33.8Mbp)的近似区间。PI505267的遗传群体定位研究指示,短绒野大豆3号染色体含有与ASR抗性高度相关联的染色体区间(例如,如对应于SEQ ID NO:1)。可以将该染色体区间或其部分引入(例如,转基因地,通过基因编辑、和/或通过使用胚拯救和标记辅助育种(MAB)而基因渗入)大豆品系以产生对各种疾病(例如ASR)具有抗性的大豆品系。在实施例中,“重叠群0133”在3号染色体上,在参考基因组的位置3004342-36810588的跨度中。
对该区间的进一步研究发现了多个可能与增加的病原体抗性性状相关联的推定因果基因(本文也称为R-基因)。来自以上区间的推定基因位于或对应于短绒野大豆3号染色体。鉴定并分离了每个因果基因,验证了其功能并且评估了它们抗大豆病原体的功效。如以下实例所述,衍生自短绒野大豆登录号PI505267的SEQ ID NO:1的染色体区间可用作对应于SEQ ID NO:2-5和7-8的R-基因的来源。
SEQ ID NO:2是编码蛋白质的来自PI505267的大豆锈病抗性候选基因(本文称为“GtoRG30”)的基因组DNA序列,该蛋白质含有Toll/白细胞介素-1受体(TIR)、核苷酸结合位点(NBS)、和富含亮氨酸重复序列(LRR)结构域(本文中“TNL”R-基因基序)。基因与Glyma.05G165800(大豆_william82_v2)同线。基因组DNA片段已定位到短绒野大豆的3号染色体上约11.44MB-11.46MB的近似区间。基因组DNA序列包括具有其天然5’UTR和3’UTR和天然内含子的基因。
SEQ ID NO:3是具有其天然5’UTR和3’UTR以及具有被拟南芥属内含子iAtBAF60-01(SEQ ID NO:21)替代的第一天然内含子的大豆锈病抗性候选基因GtoRG30的基因组DNA序列。
SEQ ID NO:4是编码含有toll/白细胞介素受体-1(TIR)、核苷酸结合位点(NBS)、和富含亮氨酸重复序列(LRR)结构域的蛋白质的大豆锈病抗性候选基因GtoRG30的DNA编码序列。第一天然内含子被拟南芥属内含子iAtBAF60-01(SEQ ID NO:21)替代。
SEQ ID NO:5是由大豆锈病抗性候选基因GtoRG30编码的蛋白质的氨基酸序列。SEQ ID NO:5的蛋白质由SEQ ID NO:2-4和11-12的核酸序列中的任一个编码。
SEQ ID NO:6是编码蛋白质的来自PI505267的大豆锈病抗性候选基因的基因组DNA序列,该蛋白质包含卷曲-卷曲(CC)、核苷酸结合位点(NBS)、和富含亮氨酸重复序列(LRR)结构域(本文中,“CNL”R-基因基序)。
SEQ ID NO:7是编码蛋白质的来自PI505267的另一个大豆锈病抗性候选基因的基因组DNA序列,该蛋白质包含卷曲-卷曲(CC)、核苷酸结合位点(NBS)、和富含亮氨酸重复序列(LRR)结构域。SEQ ID NO.6-7的基因与Glyma.05G165600(大豆_william82_v2)同线。
SEQ ID NO:8-9是可用于生成包含大豆锈病抗性候选基因GtoRG30的扩增子(例如经由PCR)的引物对的DNA序列。
SEQ ID NO:10是可用于检测包含大豆锈病抗性基因GtoRG30的多核苷酸(例如扩增子)的探针的DNA序列。
SEQ ID NO:11是具有其天然启动子(SEQ ID NO:15)和终止子(SEQ ID NO:18)且第一天然内含子被拟南芥属内含子iAtBAF60-01(SEQ ID NO:21)替代的大豆锈病抗性候选基因GtoRG30的基因组DNA序列(gGtoRG30-01)。
SEQ ID NO:12是大豆锈病抗性候选基因GtoRG30的cDNA序列。
SEQ ID NO:13是来自蒺藜苜蓿基因Mt12344的启动子的DNA序列。该启动子在植物细胞中具有活性并且可以用于驱动异源核酸序列(例如任何R-基因)的表达。
SEQ ID NO:14是来自蒺藜苜蓿基因Mt51186的启动子的DNA序列。该启动子在植物细胞中具有活性并且可以用于驱动异源核酸序列(例如任何R-基因)的表达。
SEQ ID NO:15是来自大豆锈病抗性候选基因(本文称为“GtoRG30”)的内源启动子(“RG30_启动子”)的DNA序列。它由候选基因的5’-非转录序列和5’UTR(SEQ ID NO:19)组成。
SEQ ID NO:16是来自蒺藜苜蓿基因Mt12344的终止子的DNA序列。
SEQ ID NO:17是来自蒺藜苜蓿基因Mt51186的终止子的DNA序列。该启动子在植物细胞中具有活性并且可以用于驱动异源核酸序列(例如任何R-基因)的表达。
SEQ ID NO:18是来自大豆锈病抗性候选基因(本文称为“GtoRG30”)的内源终止子(“RG30_终止子”)的DNA序列。它由候选基因的3’-非转录序列和3’UTR(SEQ ID NO:20)组成。
SEQ ID NO:19是来自大豆锈病抗性候选基因(本文称为“GtoRG30”)的5’UTR的DNA序列。
SEQ ID NO:20是来自大豆锈病抗性候选基因(本文称为“GtoRG30”)的3’UTR的DNA序列。
SEQ ID NO:21是拟南芥(Arabidopsis thaliana)BAF60同源物的内含子iAtBAF60-01的DNA序列。
可以使用具有编码与SEQ ID NO:5基本上相同(例如,与SEQ ID NO:5具有至少70%序列同一性)的多肽的序列的核酸将ASR抗性引入大豆植物中。例如,可以通过引入包含SEQ ID NO:2-4、6-7、11-12中的任一个或与SEQ ID NO:2-4、6-7、和11-12中的任一个基本上相同(例如,具有至少70%序列同一性)的核酸序列的核酸而引入ASR抗性。
表6中列出的SEQ ID NO:22-237描述了示例测定组分(包括引物和探针)的DNA序列,其可用于检测和区分与SEQ ID NO:1的染色体区间内给定的SNP位置相关联的有利和不利等位基因。
具体实施方式
本披露的主题涉及用于将编码针对病原体抗性的新颖的蛋白质的新颖的抗性基因(本文中“R-基因”)引入商业植物中以控制植物病原体的组合物和方法。这些方法涉及用核酸分子转化生物体,该核酸分子具有编码针对本发明的病原体抗性的新颖的蛋白质的核苷酸序列。本发明的核苷酸序列可用于产生对植物病原体,特别是真菌病原体例如亚洲大豆锈病(本文中,“ASR”)的抗性增加的植物,特别是大豆植物。因此,提供了转化的植物、植物细胞、植物组织和种子。组合物包括与病原体抗性植物以及转化的植物、植物组织和种子有关的核酸和蛋白质。披露了包含新颖的R-基因和/或编码新颖的抗性蛋白的氨基酸序列的核酸的核苷酸序列。这些序列可用于构建载体和表达盒以随后转化到目的植物中,作为用于检测和分离R-基因的探针和/或引物等。在特别的实施例中,这些组合物和方法用于将新颖的R-基因引入大豆植物中以控制大豆病原体,例如真菌病原体(例如,ASR)和/或线虫。
该说明书并非旨在成为可以实现本发明的所有不同方式的详细目录或者可以被添加至本发明的所有特征的详细目录。例如,关于一个实施例所说明的特征可以并入其他实施例中,并且关于一个特定实施例所说明的特征可以从那个实施例删除。因此,本发明预期了,在本发明的一些实施例中,可以排除或省略本文阐述的任何特征或特征的组合。此外,鉴于本披露内容,本文建议的各种实施例的众多变化和添加对于本领域技术人员是显而易见的,这不脱离本发明。因此,以下描述旨在说明本发明的一些特别的实施例,并且并没有穷尽地叙述其所有排列、组合和变化。
下面列出的所有参考文献、以及在即时披露中引用的所有参考文献,包括但不限于所有专利、专利申请及其出版物、科学杂志上的文章以及数据库条目(例如,数据库条目及所有在其中可获得的注释)均通过引用以其全文并入本文,其并入程度是它们补充、解释、提供本文采用的方法、技术和/或组合物的背景或传授本文采用的方法、技术和/或组合物。
本文提供的核苷酸序列以5'至3'方向从左至右表示,并且使用代表核苷酸碱基的标准代码表示,如37CFR§§1.821-1.825和世界知识产权组织(WIPO)标准ST.25中所示,例如:腺嘌呤(A)、胞嘧啶(C)、胸腺嘧啶(T)、以及鸟嘌呤(G)。
氨基酸同样是使用WIPO标准ST.25来指示,例如:丙氨酸(Ala;A)、精氨酸(Arg;R)、天冬酰胺(Asn;N)、天冬氨酸(Asp;D)、半胱氨酸(Cys;C)、谷氨酰胺(Gln;Q)、谷氨酸(Glu;E)、甘氨酸(Gly;G)、组氨酸(His;H)、异亮氨酸(Ile;1)、亮氨酸(Leu;L)、赖氨酸(Lys;K)、甲硫氨酸(Met;M)、苯丙氨酸(Phe;F)、脯氨酸(Pro;P)、丝氨酸(Ser;S)、苏氨酸(Thr;T)、色氨酸(Trp;W)、酪氨酸(Tyr;Y)、以及缬氨酸(Val;V)。
定义
除非另外定义,否则本文使用的所有技术和科学术语具有与本披露的主题所属领域的普通技术人员通常所理解的相同的意义。
尽管认为以下术语可以很好地为本领域的普通技术人员所理解,但是提出以下定义是为了使本披露的主题容易理解。
如在本发明的说明书和所附的权利要求中所用,单数形式“一个/种(a/an)”和“该/所述(the)”旨在也包括复数形式,除非上下文清楚地另外指示。
如本文所用,“和/或”是指并且涵盖一个或多个相关的列出项的任何及全部可能组合,连同当以可替代性(“或”)解释时组合的缺少。
如本文所用,术语“约”当是指一个可测量的值如剂量或时间段等时意在涵盖±20%、±10%、±5%、±1%、±0.5%、或甚至±0.1%的指定量的变化。如本文所用,短语如“在约X和Y之间”意指“在约X和约Y之间”,并且短语如“从约X至Y”意指“从约X至约Y”。
除非上下文另外指示,否则如本文所用,例如“在约X和Y之间”、“在约X和约Y之间”、“从X至Y”和“从约X至约Y”(以及类似短语)的短语应被解释为包括X和Y。
如本文所用,“编码序列”或“CDS”是转录成RNA(例如mRNA、rRNA、tRNA、snRNA、有义RNA或反义RNA)的核酸序列。在实施例中,RNA随后被翻译以产生蛋白质。在示例实施例中,CDS衍生自cDNA序列,并且包括DNA注释中转录物的剪接外显子序列,并且不包括任何内含子或5′或3′-未翻译区(UTR)。在其他示例实施例中,CDS衍生自基因组DNA序列,并且包括DNA注释中转录物的剪接外显子序列以及一个或多个内含子、和5′和/或3′-未翻译区(UTR)。
如本文所用,“密码子优化的”核苷酸序列意指重组的、转基因的、或合成的多核苷酸的核苷酸序列,其中这些密码子被选择以反映宿主细胞或生物体可以具有的特定的密码子偏好性。这典型地是以如下方式来完成,该方式是为了保持由密码子优化的核苷酸序列所编码的多肽的氨基酸序列。在某些实施例中,针对构建体有待在其中进行表达的细胞(例如,动物、植物、真菌或细菌细胞)对核苷酸序列进行密码子优化。例如,有待在植物细胞中表达的构建体可以使其全部或部分序列进行密码子优化用于在植物中表达。参见例如,美国专利号6,121,014。在实施例中,本发明的多核苷酸被密码子优化用于在植物细胞(例如,双子叶植物细胞或单子叶植物细胞)或细菌细胞中表达。
术语“包含(comprise)”、“包含(comprises)”或“包含(comprising)”当用于本说明书中时指示所陈述的特征、整数、步骤、操作、要素、或组分的存在,但并不排除一个或多个其他特征、整数、步骤、操作、要素、组分、和/或其组的存在或添加。
如本文所用,过渡短语“基本上由……组成”(以及语法变体)意指,权利要求书的范围有待被解读为涵盖权利要求书中所列举的指定材料或步骤以及不实质上改变所要求的发明的一个或多个基本和新颖特征的那些。因此,当用于本发明的权利要求中时,术语“基本上由……组成”并不旨在被解释为等同于“包含(comprising)”。
在核酸序列或蛋白质序列的上下文中,术语“对应于”意指当某些序列的核酸序列或氨基酸序列与彼此比对时,“对应于”在本发明中某些枚举的位置的核酸或氨基酸是与参考序列中的这些位置比对的那些,但相对于本发明的特定核酸序列而言并不一定位于这些精确的数字位置中。可以通过已知算法的计算机化实施方式或者通过目视检查进行用于比较的序列的最佳比对。易于获得的序列比较和多重序列比对算法分别是可在因特网(例如,EMBL-EBI的网站)上获得的基本局部比对搜索工具(BLAST)和ClustalW/ClustalW2/Clustal Omega程序。其他合适的程序包括但不限于GAP、BestFit、Plot Similarity和FASTA,它们是可从Accelrys公司(美国加利福尼亚州圣地亚哥)获得的Accelrys GCG软件包的一部分。还参见Smith和Waterman,1981;Needleman和Wunsch,1970;Pearson和Lipman,1988;Ausubel等人,1988;以及Sambrook和Russell,2001。
除非另有陈述,否则同一性和相似性将通过Needleman-Wunsch全局比对和评分算法(Needleman和Wunsch(1970)J.Mol.Biol.[分子生物学杂志]48(3):443-453,如通过“needle”程序实施,作为EMBOSS软件包(Rice,P.Longden和Bleasby,A.,EMBOSS:TheEuropean Molecular Biology Open Software Suite[EMBOSS:欧洲分子生物学开放软件套件],2000,Trends in Genetics[遗传学趋势]16,(6)pp276-277,6.3.1版,获得自EMBnet的embnet.org/resource/emboss and emboss.sourceforge.net以及其他来源)的一部分分布)使用默认空位罚分和评分矩阵(EBLOSUM62用于蛋白质,EDNAFULL用于DNA)进行计算。也可以使用等效程序。“等效程序”是指任何序列比较程序,对于任两个所讨论序列,在与通过EMBOSS 6.3.1版的needle生成的相应比对相比时,该程序生成具有相同的核苷酸残基匹配和相同的序列同一性百分比的比对。
另外的数学算法是本领域已知的并且可以用于比较两个序列。参见例如,Karlin和Altschul(1990)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]87:2264的算法,该算法在Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:5873-5877中进行了改良。将这样的算法整合入Altschul等人(1990)J.Mol.Biol.[分子生物学杂志]215:403的BLAST程序中。BLAST核苷酸搜索可以利用以下程序进行:利用BLASTN程序(针对核苷酸序列搜索核苷酸查询)以获得与本发明的核酸分子同源的核苷酸序列,或者利用BLASTX程序(针对蛋白质序列搜索翻译的核苷酸查询)以获得与本发明的核酸分子同源的蛋白质序列。BLAST蛋白质搜索可以利用以下程序进行:利用BLASTP程序(针对蛋白质序列搜索蛋白质查询)以获得与本发明的蛋白质分子同源的氨基酸序列,或者利用TBLASTN程序(针对翻译的核苷酸序列搜索蛋白质查询)以获得与本发明的蛋白质分子同源的核苷酸序列。为了获得用于比较目的的有空位的比对,可以使用如Altschul等人(1997)NucleicAcids Res.[核酸研究]25:3389中所述的Gapped BLAST(在BLAST 2.0中)。可替代地,可以使用PSI-Blast进行迭代搜索,该迭代搜索检测分子之间的远的关系。参见Altschul等人(1997)同上。当使用BLAST、Gapped BLAST、以及PSI-Blast程序时,可以使用对应程序(例如BLASTX和BLASTN)的默认参数。比对也可以通过检查手动进行。
如本文所用,“表达盒”意指能够指导至少一种目的多核苷酸的表达的核酸分子,该多核苷酸如包含编码本发明的蛋白质的R-基因多核苷酸的序列的核酸,该蛋白质在适当的宿主细胞中表达时赋予增加的病原体抗性,该表达盒包含可操作地连接至目的多核苷酸(其可操作地连接至终止信号)的启动子。“表达盒”还典型地包含另外的多核苷酸以促进目的多核苷酸的正确翻译。表达盒还可以包含与目的多核苷酸的表达无关的但是由于用于从表达载体去除表达盒的方便限制性位点而存在的其他多核苷酸。在实施例中,表达盒中的至少一种组分相对于至少一种其他组分(例如,与目的多核苷酸可操作相关联的异源启动子)可以是异源的(即外来的)。表达盒还可以是天然存在的但已经以用于异源表达的重组形式获得的表达盒。然而,典型地,表达盒相对于宿主是异源的,即该表达盒(或甚至目的多核苷酸)不是天然存在于宿主细胞中的,并且已经通过转化方法或育种方法引入到该宿主细胞或其祖先细胞中。该表达盒中的一个或多个目的多核苷酸的表达通常是在启动子的控制下。启动子可以是异源启动子或衍生自与目的核酸相同来源的内源(或天然)启动子。在多细胞生物体(如植物)的情况下,启动子还可能对于特定组织、或器官、或者发育阶段是特异性的或优先的(如本文更详细描述的)。当被转化进植物中时,表达盒或其片段也可被称为“插入的多核苷酸”或者“插入多核苷酸”。
如本文所用,关于植物的术语“引入”意指以任何方式完成,该方式包括但不限于:基因渗入、转基因、规律成簇的间隔短回文重复修饰(CRISPR)、转录激活子样效应子核酸酶(TALEN)(Feng等人2013,Joung和Sander 2013)、大范围核酸酶或锌指核酸酶(ZFN)。
如本文所用,术语“野生大豆属”是指多年生大豆属植物,例如灰毛大豆(G.canescens)、银毛大豆(G.argyrea)、澎湖大豆(G.clandestine)、车轴大豆(G.latrobeana)、白色大豆(G.albicans)、G.aphyonota、沙生大豆(G.arenaria)、弯大豆(G.curvata)、弯裂片大豆(G.cyrtoloba)、扁豆荚大豆(G.dolichocarpa)、镰状大豆(G.falcate)、G.gracei、密毛大豆(G.hirticaulis)、乳绿大豆(G.lactovirens)、阔叶大豆(G.latifolia)、小叶大豆(G.microphylla)、蒙蒂-道格拉斯大豆(G.montis-douglas)、西澳烟豆(G.peratosa)、澎湖烟豆(G.pescadrensis)、G.pindanica、宽叶沙烟豆(G.pullenii)、黄紫大豆(G.rubiginosa)、白毛烟豆(G.stenophita)、玫红野大豆(G.syndetika)、或短绒野大豆中任一种。
如本文所用,术语“等位基因”是指在特定基因座处出现的两个或更多个不同核苷酸或核苷酸序列中的一个。
当标记与性状连锁并且当标记的存在指示了期望的性状或性状形式是否会和/或会以什么程度发生在包含标记的植物/种质中时,该标记与该性状“相关联”。类似地,当标记与等位基因连锁并且当标记的存在指明了等位基因是否存在于包含标记的植物/种质中时,该标记与该等位基因“相关联”。例如,“与增强的病原体抗性相关联的标记”是指其存在或不存在可用于预测植物是否和/或在何种程度上显示病原体抗性表型的标记。在本发明的示例实施例中,包含目的R-基因并能够赋予增强的病原体抗性的核酸(例如,染色体区间)可以根据“有利”标记(例如表1和/或2中有利标记中的任一个)的存在来检测、鉴定或选择。
标记可以是但不限于等位基因、基因、单倍型、限制性片段长度多态性(RFLP)、简单序列重复(SSR)、随机扩增多态性DNA(RAPD)、切割扩增多态性序列(CAPS)(Rafalski和Tingey,Trends in Genetics[遗传学趋势]9:275(1993))、扩增片段长度多态性(AFLP)(Vos等人,Nucleic Acids Res.[核酸研究]23:4407(1995))、单核苷酸多态性(SNP)(Brookes,Gene[基因]234:177(1993))、序列特征扩增区(SCAR)(Paran和Michelmore,Theor.Appl.Genet.[理论与应用遗传学]85:985(1993))、序列标签位点(STS)(Onozaki等人,Euphytica[荷兰植物育种杂志]138:255(2004))、单链构象多态性(SSCP)(Orita等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:2766(1989))、简单序列间重复(ISSR)(Blair等人,Theor.Appl.Genet.[理论与应用遗传学]98:780(1999))、逆转座子间扩增多态性(IRAP)、逆转座子微卫星扩增多态性(REMAP)(Kalendar等人,Theor.Appl.Genet.[理论与应用遗传学]98:704(1999))、染色体区间或RNA切割产物(例如Lynx标签)。标记可以存在于基因组核酸或表达的核酸(例如EST)中。术语标记还可以指用作根据本领域熟知的方法(例如,使用PCR)用于扩增、杂交和/或检测核酸分子的探针或引物(例如引物对)的核酸。大量的大豆分子标记是本领域已知的,并且是已公开的或可以从各种来源如SoyBase互联网资源获得。
可以通过本领域中公认的方法检测对应于群体成员之间的遗传多态性的标记。这些方法包括,例如核酸测序、杂交方法、扩增方法(例如基于PCR的序列特异性扩增方法)、限制性片段长度多态性检测(RFLP)、同功酶标记检测、通过等位基因特异性杂交(ASH)进行的多核苷酸多态性检测、植物基因组的扩增可变序列检测、自主序列复制检测、简单序列重复检测(SSR)、单核苷酸多态性检测(SNP)、和/或扩增片段长度多态性检测(AFLP)。已知公认的方法也用于检测表达的序列标签(EST)和衍生自EST序列的SSR标记,以及随机扩增多态性DNA(RAPD)。
“标记等位基因”,也描述为“标记基因座的等位基因”,可以是指在群体中对标记基因座而言是多态性的该标记基因座处发现的多个多态性核苷酸序列中的一个。
“标记辅助选择”(MAS)是基于标记基因型选择表型的方法。在一些实施例中,标记基因型用于鉴定将被选择用于育种程序或用于种植的植物。在一些实施例中,标记基因型用于鉴定将不被选择用于育种程序或用于种植的植物(即,反选植物(counter-selectedplant)),允许它们从育种/种植群体中去除。
如本文所用,术语“标记基因座(marker locus和marker loci)”是指在其中可以找到一个或多个特异性标记的生物体基因组中的一个或多个特定染色体定位。标记基因座可用于追踪第二连锁基因座(例如编码或有助于表型性状表达的连锁基因座)的存在。例如,标记基因座可以用来监测在基因座(如QTL或单一基因)处的等位基因的分离,这些等位基因遗传地或物理地连锁至该标记基因座上。
如本文所用,术语“标记探针”和“探针”是指可用于检测标记基因座内一个或多个特定等位基因的存在的核苷酸序列或核酸分子(例如,通过核酸杂交与该标记或标记基因座中的所有或部分互补的核酸探针)。包含约8、10、15、20、30、40、50、60、70、80、90、100或更多个连续核苷酸的标记探针可用于核酸杂交。可替代地,在一些方面,标记探针是指能够区分(即基因分型)存在于标记基因座处的特定等位基因的任何类型的探针。
如本文所用,当鉴定连锁基因座时,术语“分子标记”或“遗传标记”可以用于指如上文定义的遗传标记,或其用作参照点的编码产物(例如,蛋白质)。分子标记能够衍生自基因组核苷酸序列或表达的核苷酸序列(例如来自剪接的RNA、cDNA等)。该术语也指与标记序列互补或与位于其侧翼的核苷酸序列,例如,用作能够扩增标记序列的探针和/或引物的核苷酸序列。例如根据沃森-克里克碱基配对原则,当核苷酸序列在溶液中特异性杂交时,这些核苷酸序列是“互补的”。当位于indel区域上时,本文所述的标记中的一些也称为杂交标记。因此,该标记仅需要指示该indel区域是否存在。可以使用任何合适的标记检测技术来鉴定这种杂交标记,例如,用于本文提供的实例中的SNP技术。
如本文所用,术语“回交”和“回交的”是指一种方法,凭借该方法将子代植物反复与其亲本之一回交。在回交方案中,“供体”亲本是指具有待基因渗入的期望的基因或基因座的亲本植物。“受体”亲本(使用一次或多次)或“轮回”亲本(使用两次或更多次)是指基因或基因座被基因渗入其中的亲本植物。例如,参见Ragot,M.等人Marker-assistedBackcrossing:A Practical Example[标记辅助回交:实践实例],Techniques etUtilisations des Marqueurs Moleculaires Les Colloques,第72卷,第45-56页(1995);和Openshaw等人,Marker-assisted Selection in Backcross Breeding[回交育种中的标记辅助选择],Proceedings of the Symposium“Analysis of Molecular Marker Data”[专题讨论会会议记录“分子标记数据分析”],第41-53页(1994)。初始杂交产生F1代。术语“BC1”是指第二次使用轮回亲本,“BC2”是指第三次使用轮回亲本,以此类推。
厘摩(“cM”)是重组频率的度量单位。一个cM等于有1%的机会,一个遗传基因座处的标记会由于单代中的杂交而与第二基因座处的标记分离。
如本文所用,关于特定基因座和/或等位基因使用的术语“由……定义并包括其的染色体区间”是指由所陈述基因座/等位基因限定并涵盖基因座/等位基因的染色体区间。
如本文所用,术语“杂交(cross)”或“经杂交的(crossed)”是指通过授粉融合配子以产生子代(例如,细胞、种子或植物)。该术语涵盖有性杂交(一个植物由另一个授粉)和自交(自花授粉,例如当花粉和胚珠是来自同一植物时)两者。术语“杂交(crossing)”是指通过授粉使配子融合以产生子代的行为。
如本文所用,术语“栽培品种”和“品种”是指可以通过结构或遗传特点和/或表现与相同物种内的其他品种区别开的一组相似的植物。
如本文所用,术语“期望的等位基因”、“有利等位基因”和“目的等位基因”可互换使用以指与期望的性状(例如ASR抗性)相关联的等位基因。在示例实施例中,期望的等位基因可以经由基于标记的测定,例如使用SNP标记测定来检测或鉴定。
如本文所用,术语“增强的病原体抗性”、“增强的疾病抗性”以及“赋予或增强抗病原体抗性”是指与一种或多种对照植物(例如,亲本中的一个或两个、或缺乏包含与抗相应病原体/疾病的病原体抗性增强相关联的R-基因或标记的核酸的植物)相比,尽管感染了病原体或疾病(例如亚洲大豆锈病),植物的耐受和/或繁殖能力的改善、增强或增加。增强的植物病原体抗性包括对植物病原体的抗性的任何统计学上显著的增加,包括例如增加至少1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或更高。对照植物可能对病原体完全易感或对病原体具有有限的抗性。增强的疾病抗性包括减少指示对应的疾病(如亚洲大豆锈病、大豆胞囊线虫、疫霉菌等)感染的症状表达的任何机制(除了全株植物免疫或抗性)。赋予或增强抗性可能包括减少(部分减少或完全减少)与对病原体易感性相关的症状或表型特征和/或增加与对病原体抗性相关的表型特征。在示例实施例中,赋予或增加对亚洲大豆锈病的抗性可以包括病灶的数量、大小和/或密度的减少,病灶颜色的变化(例如从棕褐色着色到红棕色着色),脓疱形成的数量和密度的减少,孢子形成的减少,或其任何组合。
在实施例中,编码在植物细胞中表达时赋予增强的病原体抗性的蛋白质的本发明的核酸在本文也称为抗性基因或R-基因,可以用于增强抗真菌病原体和/或线虫的病原体抗性。作为非限制性实例,本发明的R-基因可以用于增强抗以下的抗性:大豆胞囊线虫、细菌性脓疱、根结线虫、大豆灰斑病、疫霉菌、褐茎腐病、线虫、亚洲大豆锈病、黑粉病、二孢白粉菌(Golovinomyces cichoracearum)、菊科白粉菌(Erysiphe cichoracearum)、小麦白粉菌(Blumeria graminis)、瓜类单囊壳(Podosphaera xanthii)、黄瓜白粉菌(Sphaerothecafuliginea)、终极腐霉菌(Pythium ultimum)、葡萄钩丝壳(Uncinula necator)、豌豆球腔菌(Mycosphaerella pinodes)、稻瘟菌(Magnaporthe grisea)、稻平脐蠕孢(Bipolarisoryzae)、稻瘟菌、立枯丝核菌(Rhizoctonia solani)、大豆疫霉菌(Phytophthora sojae)、麦二叉蚜(Schizaphis graminum)、烟粉虱(Bemisia tabaci)、玉米蚜(Rhopalosiphummaidis)、网纹野蛞蝓(Deroceras reticulatum)、小蔗螟(Diatraea saccharalis)、麦二叉蚜(Schizaphis graminum)、桃蚜(Myzus persicae)、核盘菌(Sclerotiniasclerotiorum)、菜豆壳球孢菌(Macrophomina phaseolina)或北美大豆猝死综合症病菌(Fusarium virguliforme)。
“优良品系”或“优良株系”是农艺学上有优势的品系,该品系是从针对有优势的农艺学表现的许多个周期的选育而产生的。众多的优良品系是可获得的并且对于大豆育种领域的普通技术人员是已知的。“优良群体”是一类优良个体或品系,其可以用来代表在给定作物物种(如大豆)的农艺学上有优势的基因型方面的现有技术。类似地,“优良种质”或种质的优良株系是农艺学上有优势的种质,典型地衍生自和/或能够产生具有有优势的农艺学表现的植物,例如现有的或新开发的大豆优良品系。
“优良”植物是来自优良品系的任何植物,因此优良植物是来自优良品种的代表性植物。农民或大豆育种者可商购的优良大豆品种的非限制性实例包括:AG00802、A0868、AG0902、A1923、AG2403、A2824、A3704、A4324、A5404、AG5903、AG6202、AG0934;AG1435;AG2031;AG2035;AG2433;AG2733;AG2933;AG3334;AG3832;AG4135;AG4632;AG4934;AG5831;AG6534;和AG7231(阿斯格罗种子公司(Asgrow Seeds),德梅因(Des Moines),爱荷华州,美国);BPR0144RR、BPR 4077NRR和BPR 4390NRR(生物植物研究所(Bio Plant Research),营点(Camp Point),伊利诺伊州,美国);DKB17-51和DKB37-51(迪卡白遗传公司(DeKalbGenetics),迪卡尔布(DeKalb),伊利诺伊州,美国);DP 4546RR、和DP 7870RR(三角洲和松树陆地公司(Delta&Pine Land Company),卢博克市(Lubbock),德克萨斯州,美国);JG03R501、JG 32R606C ADD和JG 55R503C(JGL有限公司(JGL Inc.),格林卡斯尔(Greencastle),印第安纳州,美国);NKS13-K2(先正达种子公司NK部门(NK Division ofSyngenta Seeds),黄金谷(Golden Valley),明尼苏达洲,美国);90M01、91M30、92M33、93M11、94M30、95M30、97B52、P008T22R2;P16T17R2;P22T69R;P25T51R;P34T07R2;P35T58R;P39T67R;P47T36R;P46T21R;和P56T03R2(先锋良种国际有限公司(Pioneer Hi-BredInternational),庄士敦(Johnston),爱荷华州,美国);SG4771NRR和SG5161NRR/STS(大豆遗传学有限责任公司(Soygenetics,LLC,),拉斐特(Lafayette),印第安纳州,美国);S00-K5、S11-L2、S28-Y2、S43-B1、S53-A1、S76-L9、S78-G6、S0009-M2;S007-Y4;S04-D3;S14-A6;S20-T6;S21-M7;S26-P3;S28-N6;S30-V6;S35-C3;S36-Y6;S39-C4;S47-K5;S48-D9;S52-Y2;S58-Z4;S67-R6;S73-S8;和S78-G6(先正达种子公司,亨德森市(Henderson),肯塔基州,美国);Richer(北极星种业有限责任公司(Northstar Seed Ltd.),亚伯达省(Alberta),加拿大);14RD62(斯汀种子公司(Stine Seed Co.),爱荷华州,美国);或Armor 4744(阿莫尔种子有限责任公司(Armor Seed,LLC),阿拉斯加州,美国)。
如本文所用,术语“农艺学上优良的”意指具有许多可区分性状(例如出苗、活力、营养活力、疾病抗性、结实(seed set)、可立性、产量和脱粒性)的基因型,其允许生产者收获具有商业意义的产物。
“天然”或“野生型”核酸、核苷酸序列、多肽或氨基酸序列是指天然存在的或内源性的核酸、核苷酸序列、多肽或氨基酸序列。因此,例如,“野生型mRNA”是天然存在于生物体中的或对生物体来说是内源性的mRNA。
术语“核酸”、“核酸分子”、“核苷酸序列”、“寡核苷酸”、“多核酸”和“多核苷酸”本文可以互换地使用,除非上下文另外指示,并且是指核苷酸的杂聚物。这些术语包括但不限于DNA和RNA分子,包括cDNA、基因组DNA、合成的(例如,化学合成的)DNA和RNA、质粒DNA、mRNA、反义RNA和RNA/DNA杂交体,其中的任一项都可以是线状的或分支的、单链的或双链的、或其组合。当合成地产生dsRNA时,较少见的碱基,如肌苷,5-甲基胞嘧啶、6-甲基腺嘌呤、次黄嘌呤和其他也可以用于反义、dsRNA和核酶配对作用。例如,已经显示含有尿苷和胞苷的C-5丙炔类似物的多核苷酸以高亲和力结合RNA并且是基因表达的强力反义抑制剂。也可以作出其他修饰,如修饰磷酸二酯主链或RNA的核糖基团中的2'-羟基。在实施例中,“核酸”、“核酸分子”、“核苷酸序列”、“寡核苷酸”或“多核苷酸”是指DNA。
如本文所用,“可操作地连接”或“可操作地相关联”意指所指示的元件是彼此功能上相关的,并且还通常是物理相关的。因此,如本文所用,术语“可操作地连接”或“可操作地相关联”是指在功能上相关联的单一核酸分子上的核苷酸序列。因此,可操作地连接至第二核苷酸序列的第一核苷酸序列是指当该第一核苷酸序列被放入与该第二核苷酸序列的功能关系中时的情况。例如,如果启动子影响核苷酸序列的转录或表达,则该启动子与所述核苷酸序列可操作地相关联。本领域技术人员将理解,控制序列(例如启动子)不需要和与其可操作地相关联的核苷酸序列邻接,只要该控制序列能发挥指导其表达的功能。因此,例如,介入未翻译的、已转录的序列可以存在于启动子与核苷酸序列之间,并且该启动子仍可以被认为“可操作地连接至”该核苷酸序列上或与该核苷酸序列“可操作地相关联”。
如本文所用,术语“疾病耐受性”和“疾病抗性”是指尽管感染了对应的疾病,植物的耐受和/或繁殖能力。当关于种质使用时,这些术语是指尽管感染了对应的疾病,由该种质产生的植物的耐受和/或繁殖能力。在一些实施例中,感染的疾病抗性大豆植物可以与未感染的大豆植物一样(或几乎同样)产出。通常,如果植物或种质显示“增强的病原体抗性”,则标记为“疾病抗性”。
如本文所用,术语“内源”或“天然”是指材料起源于生物体或细胞内。相反,“异质”或“异源”或“外源”是指材料由于修饰人工引入其内源状态而并非天然源自生物体或细胞内。这典型地适用于在生产经转化或转基因宿主细胞和植物中使用的核酸分子。例如,包含本发明的R-基因的核酸分子是用于在用该核酸分子转化的植物细胞中赋予或增强病原体抗性的外源核酸。
如本文所用,术语“外来的”、“外来品系”和“外来种质”是指不是优良的任何植物、品系或种质。通常,外来植物/种质不是衍生自任何已知的优良植物或种质,而是选择的以将一个或多个期望的遗传元件引入育种程序(例如,将新颖的等位基因引入育种程序中)。
如本文所用,“遗传图谱”是对给定物种内的一个或多个染色体上的基因座之间的遗传连锁关系的描述,通常以图表或表格形式描绘。对于每个遗传图谱,基因座之间的距离是通过它们之间的重组频率来测量的。基因座之间的重组可以使用各种标记来检测。遗传图谱是定位群体、所用标记的类型以及不同群体之间每个标记的多态性潜力的产物。一个遗传图谱与另一个遗传图谱的基因座之间的顺序和遗传距离可以不同。
如本文所用,术语“基因组”应用于植物细胞时不仅包括发现于细胞核内的染色体DNA,而且包括发现于细胞的亚细胞组分内的细胞器DNA。
术语“基因”或“基因组序列”意指包含染色体DNA、基因组DNA、质粒DNA、cDNA、人工DNA多核苷酸或编码目的多肽的其他DNA的核酸。在特别的实施例中,基因的核酸序列编码蛋白质,该蛋白质在表达时至少部分地负责特定特征或性状。在实施例中,基因可以是天然的、经修饰的(例如,通过定向重组或位点特异性突变)或合成的。在示例实施例中,基因在细胞中被转录成RNA分子(例如,mRNA),其中RNA可以编码目的肽、多肽或蛋白质,并且在一些实例中,还可以编码在编码序列侧翼的遗传元件,这些遗传元件参与调节本发明的mRNA或多肽的表达。因此,基因可以包含数个可操作地连接的序列,例如启动子序列、5′前导序列(包括例如参与翻译起始的序列)、(蛋白质)编码区(包含cDNA或基因组DNA)、3′非翻译序列(包含例如转录终止序列位点、内含子(例如,一个或多个天然、外来或经修饰的内含子))。在示例实施例中,分离基因的核酸序列可以包括内含子、外显子、5′或3′-未翻译区(UTR)和天然调节元件(例如,天然启动子)。在其他示例实施例中,基因包含用于目的多肽的编码序列,而不包含任何调节元件(例如,不含任何天然或外来内含子,含有一些被外来或经修饰的内含子替代的天然内含子,不含任何未翻译的序列,或含有被外来、异源或经修饰的调节元件替代的天然调节元件)。
基因或核酸的“片段”是全长核酸分子的一部分,其至少具有能够转录成RNA、翻译成肽或用作DNA检测方法中的探针或引物的最小长度。基因或核酸的“功能片段”是全长核酸分子的一部分,该部分能够执行与全长核酸分子相同的功能。在实施例中,赋予增加的病原体抗性的染色体区间的功能片段包括衍生自染色体区间的基因。
术语“核酸”、“核酸分子”和“多核苷酸”在本文中可互换使用。在实施例中,基因是单链、双链或部分双链DNA或RNA、或其杂交体的区段,该区段可以从任何来源分离或合成。在本披露的上下文中,基因典型地是DNA的区段。在一些实施例中,本披露的基因包括分离的核酸分子。在一些实施例中,本披露的基因包含在载体、表达盒、植物、或植物细胞中。
如本文所用,在特别的实施例中,“R-基因”或“抗性基因”是指具有编码目的多肽、R-蛋白、或抗性蛋白的核苷酸序列的核酸(例如,DNA序列),该核酸在植物细胞中表达时赋予植物细胞、和/或包含该植物细胞的植物具有对一种或多种植物病原体的增加的抗性。例如,在实施例中,本披露的一个或多个R-基因编码多肽或R-蛋白,其在大豆植物细胞中表达时赋予大豆植物至少对亚洲大豆锈病的抗性。在实施例中,R-基因可以包含与相应R-蛋白的一个或多个结构域相关联的一个或多个基序。例如,R-基因的实施例可以包含TNL基序,该基序包含Toll/白细胞介素-1受体(TIR)基序、核苷酸结合位点(NBS)和富含亮氨酸重复序列(LRR)基序。当表达时,TNL基序编码R-蛋白中的TNL基序,该基序包含Toll/白细胞介素-1受体(TIR)结构域、核苷酸结合位点(NBS)结构域和富含亮氨酸重复序列(LRR)结构域。在其他实施例中,R-基因可以包含CNL基序,该基序包含卷曲螺旋(CC)基序、核苷酸结合位点(NBS)、和富含亮氨酸重复序列(LRR)基序。当表达时,CNL基序编码R-蛋白中的CNL基序,该基序包含卷曲螺旋(CC)结构域、核苷酸结合位点(NBS)结构域和富含亮氨酸重复序列(LRR)结构域。R-基因还可以包含其他结构域和基序,例如WRKY基序。在实施例中,R-基因的核酸序列衍生自展现出对病原体的增加的抗性的野生植物,并且包括编码R-蛋白的至少一个编码序列。R-基因的核酸序列可以进一步包含对应于一个或多个天然调节元件(例如天然内含子、天然启动子、天然UTR)、一个或多个异源调节元件(例如异源启动子和内含子)、及其组合的核酸序列。在染色体位置(例如,稳定整合到植物基因组中)或染色体外位置(例如,在载体或质粒上)将R-基因插入对病原体抗性降低(例如,无抗性或部分或完全易感)的植物中可以将野生植物衍生的病原体抗性赋予受体植物。例如,在代表性实施例中,本发明的R-基因衍生自短绒野大豆并且可以插入大豆植物中以赋予或增强大豆植物对亚洲大豆锈病的抗性。
如本文所用,术语“基因型”是指与可观察到的和/或可检测的和/或所表现的性状(表型)形成对照,在一个或多个遗传基因座处的个体(或个体组)的遗传组成。基因型由个体遗传自其亲本的一个或多个已知基因座的一个或多个等位基因定义。术语基因型可以用来指单一基因座处、多个基因座处的个体的遗传组成,或者更普遍地,术语基因型可以用来指其基因组中所有基因的个体遗传构成。可以例如使用标记来间接表征基因型和/或通过核酸测序来直接表征基因型。
如本文所用,术语“种质”是指属于或来自个体(例如,植物)、个体群体(例如,植物品系、品种或家族)、或衍生自品系、品种、物种或培养物的克隆的遗传物质。种质可以是生物体或细胞的一部分,或也可以与生物体或细胞分离。通常,种质提供了具有特定分子构成的遗传物质,该分子构成提供了对于生物体或细胞培养物的一些或所有遗传品质而言的物理基础。如本文所用,种质可以是指可以从中生长新植物的种子、细胞(包括原生质体和愈伤组织)、或组织,以及可以培养成全株植物的植物部分(例如,茎、芽、根、叶等)。
如本文所用,“异源DNA”序列是指源自外来来源或物种的多核苷酸序列,或者如果来自相同来源,则从其原始形式修饰的多核苷酸序列。
如本文所用,“同源DNA”是指来自与受体细胞相同来源的DNA。
如本文所用,术语“杂种”是指当至少两个遗传上不相同的亲本杂交时产生的种子和/或植物。
如本文所用,术语“近交”是指基本上纯合的植物或品种。该术语可以是指在整个基因组中基本上纯合的植物或品种,或者相对于特别目的基因组部分是基本上纯合的植物或植物品种。
如本文所用,术语“indel”是指在一对核苷酸序列中的插入或缺失,其中第一序列可被称为具有相对于第二序列的插入,或第二序列可被称为具有相对于第一序列的缺失。
如本文所用,术语“基因渗入(introgression)”、“使基因渗入(introgressing)”和“经基因渗入的(introgressed)”是指使一个或多个遗传基因座的期望的等位基因或期望的等位基因的组合从一个遗传背景到另一个遗传背景的自然和人工传送。例如,可以通过相同物种的两个亲本之间的有性杂交将指定基因座处的期望的等位基因传送给至少一个子代,其中这些亲本中的至少一个在其基因组内具有该期望的等位基因。可替代地,例如,等位基因的传送可以通过两个供体基因组之间的重组而发生,例如在融合的原生质体中,其中至少一个供体原生质体在其基因组中具有期望的等位基因。期望的等位基因可以是标记的经选择的等位基因、QTL、转基因等。包括期望的等位基因的后代可以重复地与具有一个期望的遗传背景的品系回交,并且对于期望的等位基因进行选择,其中结果是期望的等位基因变得在一个期望的遗传背景中是固定的。例如,与增强的ASR耐受性或抗性相关联的R-基因或标记可以从供体基因渗入到不具有疾病抗性的轮回亲本中。然后可以将得到的后代重复回交并选择,直到子代在轮回亲本背景中具有一个或多个ASR耐受性等位基因。
如本文所用,“分离的”核酸分子或基因基本上与通常与核酸相关联的其他核酸或基因序列分离开来,例如与核酸或基因天然存在的细胞的染色体或染色体外DNA分离开来。当核酸分子包含存在于另一生物体基因组中的转基因或转基因的一部分时,它是分离的核酸分子。该术语还包括经生物化学纯化以基本上去除污染核酸和其他细胞组分的核酸。
如果多肽是从天然伴随它的细胞组分(核酸、脂质、碳水化合物和其他多肽)中分离出来的,或者是化学合成或重组的,则该多肽称为“分离的”。当多肽分子在另一个生物体中从转基因表达时,该多肽分子是分离的多肽分子。当样品中至少60重量%、优选90重量%或更多、更优选95重量%或更多、最优选超过99重量%由单体多肽构成时,该单体多肽是分离的。蛋白质纯度或均一性例如通过以下来指示:蛋白质样品的聚丙烯酰胺凝胶电泳,随后在聚丙烯酰胺凝胶染色后可视单个多肽条带;高压液相色谱法;或其他常规方法。蛋白质可以通过本领域已知的任何方法纯化,例如如以下中所述:Guide to Protein Purification[蛋白质纯化指南],Deutscher编辑,Meth.Enzymol.[酶学方法]185,学术出版社(AcademicPress),圣地亚哥,1990年;以及Scopes,Protein Purification:Principles andPractice[蛋白质纯化:原理与实践],斯普林格,纽约,1982。
使用熟知的方法,本领域技术人员可以容易地产生提供经修饰的基因产物的基因和蛋白质的核苷酸和氨基酸序列变体。核酸的化学合成可以例如在自动化寡核苷酸合成仪上进行。这样的变体优选不改变核酸的蛋白质编码区的阅读框。本发明还涵盖缺乏全长蛋白质的至少一个残基,但基本上保持该蛋白质的活性的蛋白质片段。
“基因座”是基因或标记或等位基因所在的染色体上的位置。在一些实施例中,基因座可以涵盖一个或多个核苷酸。
“非天然存在的大豆品种”是自然界中不存在的任何品种的大豆。可以通过本领域已知的任何方法产生“非天然存在的大豆品种”,该方法包括但不限于转化大豆植物或种质、转染大豆植物或种质并将天然存在的大豆品种与非天然存在的大豆品种杂交。在一些实施例中,“非天然存在的大豆品种”可以包含一种或多种异源核苷酸序列。在一些实施例中,“非天然存在的大豆品种”可以包含天然存在的核苷酸序列的一个或多个非天然存在的拷贝(即天然存在于大豆中的基因的外来拷贝)。在一些实施例中,“非天然存在的大豆品种”可以包含两种或更多种天然存在的核苷酸序列的非天然组合(即,在同一大豆中不天然存在的两种或更多种天然存在的基因,例如在大豆品系中未发现的基因(例如来自野生大豆属物种的多核苷酸))。
如本文所用,术语“表型”、“表型性状”或“性状”是指生物体的一种或多种性状和/或表现。表型是对于裸眼或通过本领域已知的任何其他评价手段(例如,显微术、生物化学分析、或电子机械测定)可以观察的表现。在一些情况中,表型或性状直接由单一基因或遗传基因座控制,即,“单基因性状”。在其他情况下,表型或性状是多个基因的结果。应当指出,如本文所用,术语“病原体抗性表型”或“疾病抗性表型”考虑了可能影响对应的病原体或疾病的环境条件,这样使得该效应是真实且是可重复的。
如本文所用,术语“植物”可以是指全株植物、其任何部分、或衍生自植物的细胞或组织培养物。因此,术语“植物”可以指以下中的任一项:全株植物、植物组分或器官(例如,根、茎、叶、芽、花、荚等)、植物组织、种子和/或植物细胞。植物细胞是从植物取得的植物细胞,或者是通过培养从取自植物的细胞衍生的植物细胞。因此,术语“大豆植物”可以是指整株大豆植物、大豆植物的一个或多个部分(例如,根、根尖、茎、叶、芽、花、豆荚、种子、子叶等)、大豆植物细胞、大豆植物原生质体和/或大豆植物愈伤组织。
“植物细胞”是植物(包含原生质体和细胞壁)的结构和生理单位。植物细胞可以处于分离的单个细胞或培养细胞的形式,或者是作为较高级的组织单位(如例如,植物组织、植物器官、或全株植物)的一部分。在实施例中,植物细胞是不繁殖的和/或不能再生全株植物。
“植物细胞培养物”意指植物单元(如例如,原生质体、细胞培养物细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、接合子以及处于不同发育阶段的胚)的培养物。
“植物材料”是指叶、茎、根、花或花的部分、果实、花粉、卵细胞、接合子、种子、切条、细胞或组织培养物、或植物的任何其他部分或产物。
“植物器官”是植物的独特而明显的已结构化并且分化的部分,如根、茎、叶、花芽或胚。
如本文所用,术语“植物部分”包括但不限于,胚、花粉、胚珠、种子、叶、花、枝、果实、茎秆、根、根尖、花药、和/或植物细胞(包括在植物和/或植物的部分中完整的植物细胞)、植物原生质体、植物组织、植物细胞组织培养物、植物愈伤组织、植物团(plantclumps)等。
如本文所用,“植物组织”意指组织化成结构和功能单元的一组植物细胞。包括植物中或培养物中的任何植物组织。这个术语包括但不限于:全株植物、植物器官、植物种子、组织培养物以及被组织化成结构或功能单元的任何植物细胞群组。该术语与如以上列出的或由该定义以其他方式涵盖的任何特定类型的植物组织的联合应用或单独应用并不旨在排除任何其他类型的植物组织。
“多腺苷酸化信号”或“聚A信号”是指位于编码区3'的核酸序列,其导致在从编码区转录的mRNA的3'末端添加腺苷酸核苷酸。
“聚合酶链式反应(PCR)”是指DNA扩增方法,其使用酶促技术来建立一个核酸序列(扩增子)的多个拷贝。DNA分子的拷贝是通过在两个扩增物之间穿梭DNA聚合酶来制备的。这种扩增方法的基础是多个循环的温度变化以变性,然后使扩增物(DNA引物分子)重新退火,接着是延伸,在位于侧翼扩增物之间的区域中合成新的DNA链。核酸扩增可以通过本领域已知的各种核酸扩增方法中的任何一种来完成,包括聚合酶链式反应(PCR)。本领域已知多种扩增方法,并且特别是在美国专利号4,683,195和4,683,202以及PCR Protocols:AGuide to Methods and Applications[PCR方案:方法和应用指南],Innis等人编辑,学术出版社,圣地亚哥,1990中描述的。已经开发了PCR扩增方法,以扩增多达22kb基因组DNA和多达42kb的噬菌体DNA(Cheng等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]91:5695-5699,1994)。这些方法以及DNA扩增领域中已知的其他方法可用于本发明的实践。
如本文所用,术语“引物”是指当置于诱导合成引物延伸产物的条件(例如在核苷酸和用于聚合的试剂(如DNA聚合酶)的存在下并且在合适的温度和pH)下时能够退火至核酸靶并用作DNA合成的启动点的寡核苷酸。为了在延伸和/或扩增中获得最大效率,在一些实施例中,引物(在一些实施例中是延伸引物,并且在一些实施例中是扩增引物)是单链的。在一些实施例中,引物是寡脱氧核糖核苷酸。引物典型地足够长以在用于聚合的试剂存在下引发延伸和/或扩增产物的合成。引物的最小长度可以取决于许多因素,包括但不限于该引物的温度和组成(A/T对比G/C含量)。在扩增引物的情况下,这些扩增引物典型地作为由一个正向和一个反向引物组成的一对双向引物提供,或作为DNA扩增领域中(例如在PCR扩增中)常用的一对正向引物提供。如此,应该理解的是,如本文所用,术语“引物”可以指超过一种引物,特别是在关于待扩增的靶区域的一个或多个末端序列的信息中存在一些歧义的情况下。因此,“引物”可以包括含有代表该序列中的可能变异的序列的引物寡核苷酸的集合,或包括允许典型的碱基配对的核苷酸。可以通过任何本领域已知的合适的方法来制备引物。用于制备特异性序列的寡核苷酸的方法是本领域已知的,并且包括例如适当的序列的克隆和限制以及直接化学合成。化学合成方法可以包括例如美国专利号4,458,066中披露的磷酸二酯或三酯法、二乙基氨基磷酸酯法和固相支持体法。若需要,可以通过掺入可检测部分,例如光谱部分、荧光部分、光化学部分、生物化学部分、免疫化学部分或化学部分来标记引物。可以对如表1-5中任一个中描述的任何有利SNP建立诊断ASR抗性(即能够基于ASR抗性等位基因的存在来鉴定或选择)的引物。PCR方法在手册中已经很好地描述,并且是本领域技术人员已知的。通过PCR扩增后,可以通过与探针多核苷酸杂交来检测靶多核苷酸,该探针多核苷酸在严格至中等严格的杂交和洗涤条件下与靶序列形成稳定的杂交体。如果预期探针与靶序列基本上完全互补(即,约99%或更多),则可以使用严格条件。如果预期有一些错配,例如如果预期变体品种会导致探针不完全互补,则可以降低杂交的严格度。在一些实施例中,选择条件以排除非特异性/偶然结合。影响杂交的条件和针对非特异性结合选择的条件是本领域已知的,并且描述于例如Sambrook和Russell(2001)中。MolecularCloning:A Laboratory Manual[分子克隆:实验室手册],第三版,Cold Spring HarborLaboratory Press[冷泉港实验室出版社],Cold Spring Harbor[冷泉港],纽约,美国。通常,较低的盐浓度和较高温度的杂交和/或洗涤增加了杂交条件的严格度。
如本文所用,术语“子代”和“子代植物”是指从一个或多个亲本植物通过无性或有性繁殖产生的植物。子代植物可以通过克隆或单一亲本植物自交,或者通过两种亲本植物杂交来获得。
如本文所用,“蛋白质”是指多核苷酸,通常在它的编码多核苷酸的上游(5’),它通过提供对正确转录所需的RNA聚合酶以及其他因子的识别来控制该编码多核苷酸的表达。在本发明的示例实施例中,提供了蛋白质或多核苷酸,其在植物或植物细胞中表达时赋予植物增强的抗植物病原体抗性。
术语“启动子”或“启动子区”是指起调节元件作用的多核酸分子,通常在编码序列的上游(5')发现,该多核酸分子通过提供RNA聚合酶的识别位点和/或在正确位点开始转录所必需的其他因子来控制信使RNA(mRNA)的产生来控制编码序列的表达。如本文所设想的,启动子或启动子区包括通过连接到各种调节序列、随机或受控诱变以及增强子序列的添加或重复而衍生的启动子的变化。本文披露的启动子区及其生物学功能等价物在作为合适的重组DNA构建体的一部分引入宿主时负责驱动在其控制下的编码序列的转录,如其产生mRNA的能力所证明的。在一些实施例中,例如在本文披露的载体构建体和表达盒中,例如当启动子和编码序列衍生自不同的来源,例如不同的生物体(例如,在实施例中,本文所述的载体包含衍生自短绒野大豆的R-基因序列以及衍生自蒺藜苜蓿的启动子序列)时,启动子对于编码序列可以是异源的,该编码序列的表达由启动子控制。在其他实例中,例如当启动子和编码序列衍生自常见的来源,例如常见的生物体时,启动子对于编码序列可以是内源的或天然的,该编码序列的表达由启动子控制。许多启动子可用于表达盒中,包括编码R蛋白的R基因的天然启动子和一个或多个异源启动子的组合。
可替代地,可以根据期望的结果来选择启动子。这样的启动子包括但不限于“组成型启动子”(其中与启动子可操作地连接的多核苷酸序列的表达不受调节,因此是连续的)、“诱导型启动子”(其中与启动子可操作地连接的多核苷酸序列的表达由分析物、辅因子、调节蛋白等诱导)、“阻抑型启动子”(其中与启动子可操作地连接的多核苷酸序列的表达被分析物、辅因子、调节蛋白等抑制)和“组织偏好型启动子”(其中与启动子可操作地连接的多核苷酸序列的表达,相对于其他组织,在偏好组织中较高,例如相对于其他植物组织,在叶组织中较高)。
如本文所用,“植物启动子”意指驱动在植物中表达的启动子,例如用于在植物中使用的组成型、诱导型(例如化学、环境、病原体或伤口诱导)、阻抑型、组织偏好型或其他启动子。
示例性启动子示出于WO 99/43838和美国专利号:8,575,425;7,790,846;8,147,856;8,586832;7,772,369;7,534,939;6,072,050;5,659,026;5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142;和6,177,611;其通过引用并入本文。示例组成型启动子包括CaMV 35S启动子(Odell等人(985)Nature[自然]313:810-812);稻肌动蛋白(McElroy等人(1990)Plant Cell[植物细胞]2:163-171);泛素(Christensen等人(1989)Plant Mol.Biol.[植物分子生物学]12:619-632和Christensen等人(1992)Plant Mol.Biol.[植物分子生物学]18:675-689);pEMU(Last等人(1991)Theor.Appl.Genet.[理论与应用遗传学]81:581 -588);MAS(Velten等人(1984)EMBO J.[欧洲分子生物学组织杂志]3:2723-2730)。示例性诱导型启动子包括那些驱动病程相关蛋白(PR蛋白)表达的启动子,这些蛋白在病原体感染后被诱导。参见例如,Redolfi等人(1983)Neth.J.Plant Pathol.[荷兰植物病理学杂志]89:245-254;Uknes等人(1992)PlantCell[植物细胞]4:645-656;和Van Loon(1985)Plant Mol.Virol.[植物分子病毒学]4:111-116;以及WO 99/43819,这些文献通过引用并入本文。也可使用在病原体感染部位或附近局部表达的启动子(Marineau等人(1987)Plant Mol.Biol.[植物分子生物学]9:335-342;Matton等人(1989)Molecular Plant-Microbe Interactions[分子植物-微生物相互作用]2:325-331;Somsisch等人(1986)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]83:2427-2430;Somsisch等人(1988)Mol.Gen.Genet.[分子遗传学和普通遗传学]2:93-98;以及Yang(1996)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]93:14972-14977;Chen等人(1996)Plant J.[植物杂志]10:955-966;Zhang等人(1994)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]91:2507-2511;Warner等人(1993)Plant J.[植物杂志]3:191-201;Siebertz等人(1989)Plant Cell[植物细胞]1:961-968;Cordero等人(1992)Physiol.Mol.Plant Path.[生理学与分子植物病理学]41:189-200;美国专利号5,750,386(线虫诱导型);以及其中引用的参考文献)。
伤口诱导型启动子包括pin II启动子(Ryan(1990)Ann.Rev.Phytopath.[植物病理学年评]28:425-449;Ouan等人(1996)Nature Biotechnology[自然生物技术]14:494-498);wunl和wun2(美国专利号5,428,148);winl和win2(Stanford等人(1989)Mol.Gen.Genet.[分子遗传学和普通遗传学]215:200-208);系统素(McGurl等人(1992)Science[科学]225:1570-1573);WIP1(Rohmeier等人(1993)Plant Mol.Biol.[植物分子生物学]22:783-792;Eckelkamp等人(1993)FEBS Letters[欧洲生化学会联盟通讯]323:73-76);MPI基因(Corderok等人(1994)Plant J.[植物杂志]6(2):141-150);等等,这些文献通过引用并入本文。
用于在本发明中使用的组织偏好型启动子包括在以下文献中所示的那些:Yamamoto等人(1997)Plant J.[植物杂志]12(2):255-265;Kawamata等人(1997)PlantCell Physiol.[植物细胞生理学]38(7):792-803;Hansen等人(1997)Mol.Gen Genet.[分子遗传学和普通遗传学]254(3):337-343;Russell等人(1997)Transgenic Res.[转基因研究]6(2):157-168;Rinehart等人(1996)Plant Physiol.[植物生理学]112(3):1331-1341;Van Camp等人(1996)Plant Physiol.[植物生理学]112(2):525-535;Canevascim等人(1996)Plant Physiol.[植物生理学]112(2):513-524;Yamamoto等人(1994)Plant CellPhysiol.[植物细胞生理学]35(5):773-778;Lam(1994)Results Probl.Cell Differ.[细胞分化中的结果与问题]20:181-196;Orozco等人(1993)PlantMolBiol.[植物分子生物学]23(6):1129-1138;Matsuoka等人,(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90(20):9586-9590;以及Guevara-Garcia等人(1993)Plant J.[植物杂志]4(3):495-505。
叶偏好型启动子包括在以下文献中所示的那些:Yamamoto等人(1997)Plant J.[植物杂志]12(2):255-265;Kwon等人(1994)Plant Physiol.[植物生理学]105:357-67;Yamamoto等人(1994)Plant Cell Physiol.[植物细胞生理学]35(5):773-778;Gotor等人(1993)Plant J.[植物杂志]3:509-18;Orozco等人(1993)Plant Mol.Biol.[植物分子生物学]23(6):1129-1138;以及Matsuoka等人(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90(20):9586-9590。
根偏好型启动子是已知的并且包括在以下文献中的那些:Hire等人(1992)PlantMol.Biol.[植物分子生物学]20(2):207-218(大豆根特异性谷氨酰胺合成酶基因);Keller和Baumgartner(1991)Plant Cell[植物细胞]3(10):1051-1061(根特异性对照元件);Sanger等人(1990)Plant Mol.Biol.[植物分子生物学]14(3):433-443(根癌土壤杆菌(Agrobacterium tumefaciens)的甘露氨酸合酶(MAS)基因);以及Miao等人(1991)PlantCell[植物细胞]3(1):11-22(胞质谷氨酰胺合成酶(GS));Bogusz等人(1990)Plant Cell[植物细胞]2(7):633-641;Leach和Aoyagi(1991)Plant Science[植物科学](利默里克市(Limerick))79(l):69-76(rolC和rolD);Teeri等人(1989)EMBO J.[欧洲分子生物学组织杂志]8(2):343-350;Kuster等人(1995)Plant Mol.Biol.[植物分子生物学]29(4):759-772(VfENOD-GRP3基因启动子);以及Capana等人(1994)Plant Mol.Biol.[植物分子生物学]25(4):681-691(rolB启动子)。还参见美国专利号5,837,876;5,750,386;5,633,363;5,459,252;5,401,836;5,110,732;和5,023,179。
如本文所用,“重组”是指核酸(例如,DNA或RNA)和/或蛋白质和/或生物体的如下形式,该形式通常不会在自然界中发现并且正因为如此通过人类干预来产生。这样的人为干预可能会产生重组核酸分子和/或重组植物。如本文所用,“重组DNA分子”是包含不会天然地一起存在的DNA分子组合的DNA分子,并且是人为干预的结果,例如,由至少两种彼此异源的DNA分子的组合组成的DNA分子,和/或人工合成的并且包括偏离通常存在于自然界中的多核苷酸的多核苷酸的DNA分子,和/或人工掺入宿主细胞基因组DNA和该宿主细胞基因组的相关侧翼DNA的DNA分子。重组DNA分子的实例是由将转基因或基因组修饰(即,基因编辑)插入至植物的基因组DNA而产生的DNA分子,这可以最终导致重组RNA和/或蛋白质分子在该生物体中表达。如本文所用,“重组植物”是通常不会在自然界中存在的植物,是人类干预的结果,并且含有掺入至其基因组中的转基因和/或异源DNA分子和/或基因组修饰(即,基因编辑)。由于这样的基因组改变,重组植物明显不同于相关的野生型植物。术语“重组DNA构建体”是指任何试剂,例如质粒、粘粒、病毒、自主复制序列、噬菌体、或线性或环状单链或双链DNA或RNA核苷酸序列,其衍生自任何来源,能够基因组整合或自主复制,包含一个或多个DNA序列已经以功能性操作方式连接的DNA分子。重组DNA构建体可以构建成能够表达反义RNA或稳定的双链反义RNA。
在两个核酸或两个氨基酸序列的上下文中,短语“基本上相同的”是指当针对最大对应性进行比较和比对时具有至少约50%核苷酸或氨基酸残基同一性(如使用序列比较算法或通过目测检查所测量的)的两个或更多个序列或子序列。在某些实施例中,基本上相同的序列具有至少约60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的核苷酸或氨基酸残基同一性。在某些实施例中,相对于蛋白质序列或编码其的核苷酸序列,在序列至少约50个氨基酸残基、100个氨基酸残基、150个氨基酸残基、200个氨基酸残基、250个氨基酸残基、300个氨基酸残基、350个氨基酸残基、400个氨基酸残基、450个氨基酸残基、500个氨基酸残基、525个氨基酸残基、526个氨基酸残基、527个氨基酸残基、528个氨基酸残基、529个氨基酸残基、530个氨基酸残基、531个氨基酸残基、532个氨基酸残基、533个氨基酸残基、534个氨基酸残基、535个氨基酸残基、536个氨基酸残基的区域中存在基本同一性。在另外的实施例中,当这些序列在编码区的整个长度上时,这些序列是基本上相同的。
在两个核酸或氨基酸序列的情况下,术语“同一性”、“序列同一性”、“同源性”、“相似性”、“序列相似性”或“相同的”是指在全面比对两个序列时,如与测试(“受试”)序列相比,参考(“查询”)序列(或其互补链)的线性多核苷酸或氨基酸序列中相同核苷酸或氨基酸的百分比。除非另有陈述,否则如本文所用的序列同一性是指如下获得的值:使用在EMBOSSNeedle比对工具中实现的Needleman和Wunsch算法((1970)J.Mol.Biol.[分子生物学杂志]48:443-453),使用默认矩阵文件EBLOSUM62(用于蛋白质)和默认参数(空位开放=10,空位延伸=0.5,末端空位罚分=假,末端空位开放=10,末端空位延伸=0.5)或DNAfull(用于核酸)和默认参数(空位开放=10,空位延伸=0.5,末端空位罚分=假,末端空位开放=10,末端空位延伸=0.5);或其任何等效程序。EMBOSS Needle可从例如EMBL-EBI获得,如在以下网站获得:ebi.ac.uk/Tools/psa/emboss_needle/,并且如以下出版物中所述:“TheEMBL-EBI search and sequence analysis tools APIs in 2019[2019年的EMBL-EBI搜索和序列分析工具API]”。Madeira等人Nucleic Acids Research[核酸研究],2019年6月,47(W1):W636-W641。如本文所用,术语“等效程序”是指任何序列比较程序,对于任两个所讨论序列,在与通过EMBOSS Needle生成的相应比对相比时,该程序生成具有相同的核苷酸或氨基酸残基匹配和相同的序列同一性百分比的比对。在优选实施例中,基本上相同的核酸或氨基酸序列可以发挥基本上相同的功能。在实施例中,基本上相同的序列彼此具有至少60%、至少70%、至少80%、至少85%、至少90%、或至少95%序列同一性。
术语关于核苷酸或氨基酸序列的“同源性”“序列相似性”或“序列同一性”意指两个或更多个序列的同一性或相似性程度,并且可以常规地通过使用已知软件或计算机程序(如Best-Fit或Gap成对比较程序(GCG威斯康星软件包(Wisconsin Package),遗传学计算机集团公司(Genetics Computer Group),威斯康星州麦迪逊科学先驱路575号(575Science Drive,Madison,Wis.),53711)确定。BestFit使用Smith和Waterman,Advances in Applied Mathematics[应用数学进展]2:482-489(1981)的局部同源性算法以找到两个序列之间最佳的同一性或相似性区段。通常通过在比较窗口上比较这两个序列的部分来进行两个或更多个多核苷酸或多肽之间的序列比较,以鉴定并比较序列相似性的局部区域。比较窗口通常是从约20至200个连续核苷酸。Gap使用Needleman和Wunsch,J.Mol.Biol.[分子生物学杂志]48:443-453(1970)的方法执行所有一个序列与所有另一个相似序列的全局比对。当使用序列比对程序(如BestFit)来确定DNA序列同源性、相似性或同一性的程度时,可以使用默认设置,或者可以选择适当的评分矩阵以优化同一性、相似性或同源性评分。类似地,当使用程序(如BestFit)来确定两个不同氨基酸序列之间的序列同一性、相似性或同源性时,可以使用默认设置,或者可以选择适当的评分矩阵(如blosum45或blosum80)以优化同一性、相似性或同源性评分。
当两个核苷酸序列在严格条件下彼此杂交时,也可以认为这两个序列是基本上相同的。在代表性实施例中,被认为基本上相同的两个核苷酸序列在高严格条件下彼此杂交。
术语“严格条件”或“严格杂交条件”包括提及如下条件,在这些条件下,核酸将与靶序列以明显高于其他序列的程度选择性杂交(例如,超过非靶序列至少2倍),并且任选地可以基本上排除与非靶序列的结合。严格条件是序列依赖性的并且在不同的情况下将会改变。通过控制杂交和/或洗涤条件的严格度,可以鉴定可能与参考核苷酸序列高达100%互补的靶序列。可替代地,可以使用中等或甚至低严格度的条件来允许序列中的一些错配,从而检测到更低程度的序列相似性。例如,本领域技术人员将理解,为了起到引物或探针的作用,核酸序列仅需要在所采用的条件下与靶序列充分互补以与其实质性结合,以形成稳定的双链结构。因此,可以在高、中等或甚至低严格度的条件下使用引物或探针。同样,低或中等严格度的条件可以有利于检测序列同一性程度低于在高严格条件下可鉴定的程度的同源物、直系同源物和/或旁系同源物序列。
如本文所用,术语“互补的”或“互补性”(和类似术语)是指多核苷酸在允许的盐和温度条件下通过碱基配对进行的天然结合。例如,序列“A-G-T”与互补序列“T-C-A”结合。两个单链分子之间的互补性可能是部分的,其中只有一些核苷酸结合,或者当单链分子之间存在全互补性时,该互补性可能是完全的。核酸链之间的互补性程度对于分子之间杂交的效率和强度具有显著影响。如本文所用,术语“基本上互补的”(和类似术语)意指,两个核酸序列是至少约50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更多互补的。可替代地,术语“基本上互补的”(和类似术语)可以意指,两个核酸序列可以在高严格度条件(如本文所述)下杂交在一起。
如本文所用,“特异性地”或“选择性地”杂交(和类似术语)是指分子在严格条件下与特定核酸靶序列的结合、双链化或杂交(在该序列存在于复合混合物(例如,总细胞DNA或RNA)中时),以基本上排除非靶核酸,或甚至与非靶序列没有可检测的结合、双链化或杂交。特异性或选择性杂交序列典型地是至少约40%互补的,并且任选地是基本上互补的或甚至完全互补的(即,100%相同的)。
对于DNA-DNA杂交体,Tm可以从Meinkoth和Wahl,Anal.Biochem.[分析生物化学]138:267-84(1984)的等式中进行估计:Tm=81.5℃+16.6(log M)+0.41(GC%)-0.61(甲酰胺%)-500/L;其中M是单价阳离子的摩尔浓度,GC%是DNA中鸟苷和胞嘧啶核苷酸的百分比,甲酰胺%是杂交溶液中甲酰胺的百分比,并且L是该杂交体以碱基对计的长度。Tm是50%的互补靶序列与完全匹配的探针杂交的温度(在限定的离子强度及pH下)。对于每1%的错配,Tm降低约1℃;因此,可以调整Tm、杂交和/或洗涤条件以与具有期望的同一性程度的序列杂交。例如,如果寻找具有>90%同一性的序列,可以使Tm降低10℃。通常,严格条件被选择为比特定序列及其补体在限定的离子强度及pH下的热熔点(Tm)低约5℃。然而,高严格条件可以利用在热熔点(Tm)或比热熔点(Tm)低1℃、2℃、3℃或4℃下杂交和/或洗涤;中等严格条件可以利用在比热熔点(Tm)低6℃、7℃、8℃、9℃或10℃下杂交和/或洗涤;低严格度条件可以利用在比热熔点(Tm)低11℃、12℃、13℃、14℃、15℃或20℃下杂交和/或洗涤。如果期望的错配程度导致Tm低于45℃(水溶液)或32℃(甲酰胺溶液),则任选地可以增加SSC浓度以使得可以使用更高温度。对核酸杂交的广泛指导见于Tijssen的LaboratoryTechniques in Biochemistry and Molecular Biology-Hybridization with NucleicAcid Probes[生物化学和分子生物学实验室技术-使用核酸探针的杂交]第I部分第2章“Overview of principles of hybridization and the strategy of nucleic acidprobe assays[杂交原理和核酸探针测定策略综述]”,爱思唯尔,纽约(1993);CurrentProtocols in Molecular Biology[现代分子生物学实验技术],第2章,Ausubel等人编辑,Greene Publishing与Wiley-Interscience,纽约(1995);以及Green和Sambrook,In:Molecular Cloning,A Laboratory Manual[分子克隆,实验手册],第4版,冷泉港实验室出版社,冷泉港,纽约(2012)。
典型地,严格条件是如下那些:其中在约pH 7.0至pH 8.3下盐浓度小于约1.5M Na离子,典型地约0.01M至1.0M Na离子浓度(或其他盐),并且温度为至少约30℃(对于短探针,例如,10至50个核苷酸)和至少约60℃(对于长探针,例如,大于50个核苷酸)。严格条件还可以通过添加去稳定剂如甲酰胺或Denhardt's(在500ml水中的5g Ficoll、5g聚乙烯吡咯烷酮、5g牛血清白蛋白)来实现。示例性低严格度条件包括用30%至35%甲酰胺、1MNaCl、1% SDS(十二烷基硫酸钠)的缓冲溶液在37℃下杂交以及在1X至2X SSC(20X SSC=3.0M NaCl/0.3M柠檬酸三钠)中在50℃至55℃下洗涤。示例性中等严格度条件包括在40%至45%甲酰胺、1M NaCl、1%SDS中在37℃下杂交以及在0.5X至1X SSC中在55℃至60℃下洗涤。示例性高严格度条件包括在50%甲酰胺、1M NaCl、1% SDS中在37℃下杂交以及在0.1XSSC中在60℃至65℃下洗涤。高严格度条件的另一非限制性实例包括在4X SSC、5XDenhardt's、0.1mg/ml煮鲑鱼精DNA和25mM磷酸Na中在65℃下杂交以及在0.1X SSC、0.1%SDS中在65℃下洗涤。高严格度杂交条件的另一说明包括在7%SDS、0.5M NaPO4、1mM EDTA中在50℃下杂交以及在2X SSC、0.1% SDS中在50℃下洗涤,可替代地在1X SSC、0.1% SDS中在50℃下洗涤,可替代地在0.5X SSC、0.1% SDS中在50℃下洗涤,或者可替代地在0.1XSSC、0.1% SDS中在50℃下洗涤,或者甚至在0.1XSSC、0.1% SDS中在65℃下洗涤。本领域技术人员将了解,特异性典型地是杂交后洗涤的函数,相关参数是最终洗涤溶液的离子强度和温度。
如果在严格条件下彼此不杂交的核酸所编码的蛋白质是基本上相同的,则它们仍然是基本上相同的(例如,由于遗传密码的简并性)。
两个核酸序列或蛋白质基本上相同的另一个指示是,第一核酸编码的蛋白质在免疫学上与第二核酸编码的蛋白质交叉反应。因此,一种蛋白质典型地与第二种蛋白质基本上相同,例如,在这两种蛋白质的区别仅为保守取代的情况下。
术语“载体”是指用于将一种或多种核酸转移、递送或引入细胞中的组合物。载体包含含有待转移、递送或引入的一个或多个核苷酸序列的核酸分子。
本文提供了表达多肽的植物,与不表达该多肽的对照植物相比,该多肽增加了植物的病原体抗性能力。多肽包括SEQ ID NO:5及其功能片段和变体。还披露了将核酸序列引入大豆植株的各种方法,包括转基因方法、基因编辑和育种。还披露了用于鉴定这些核酸序列在植物中存在的标记。
在一些实施例中,本文提供的植物是具有期望的性状的非天然存在的大豆品种。在特定实施例中,非天然存在的大豆品种是优良大豆品种。“非天然存在的大豆品种”是自然界中不存在的任何品种的大豆。可以通过本领域已知的任何方法产生“非天然存在的大豆品种”,该方法包括但不限于转化大豆植物或种质、转染大豆植物或种质并将天然存在的大豆品种与非天然存在的大豆品种杂交。在一些实施例中,“非天然存在的大豆品种”可以包含一种或多种异源核苷酸序列。在一些实施例中,“非天然存在的大豆品种”可以包含天然存在的核苷酸序列的一个或多个非天然存在的拷贝(即天然存在于大豆中的基因的外来拷贝)。在一些实施例中,“非天然存在的大豆品种”可以包含两种或更多种天然存在的核苷酸序列的非天然组合(即,在同一大豆中不天然存在的两种或更多种天然存在的基因,例如在大豆品系中未发现的基因)。
提供了提高在植物、植物部分、或种子中的病原体抗性能力的方法和组合物。在特定实施例中,提供了使植物、植物部分、或种子中抗亚洲大豆锈病抗性增加的各种方法和组合物。病原体抗性的增加包括与适当的对照植物或植物部分相比时,植物抵抗病原体感染能力的任何统计学上显著的增加。
“主题植物或植物细胞”是对目的多核苷酸进行遗传改变(例如转化)受到影响的植物或植物细胞,或者是由如此改变的植物或细胞遗传下来的并包含该改变的植物或植物细胞。“对照”或“对照植物”或“对照植物细胞”提供了用于测量主题植物或植物细胞的表型的变化的一个参考点。对照植物或植物细胞可以包含,例如:(a)野生型植物或细胞,即与用于导致主题植物或细胞的遗传改变的起始材料具有相同的基因型;(b)植物或植物细胞,其与起始材料具有相同的基因型但已经用无效构建体(即,对目的性状没有已知影响的构建体,例如包含标记基因的构建体)转化;(c)植物或植物细胞,其是主题植物或植物细胞的子代中的非转化的分离子;(d)植物或植物细胞,其与主题植物或植物细胞基因上相同的但未暴露于将诱导目的基因的表达的条件或刺激;或(e)在未表达目的基因的条件下,主题植物或植物细胞本身。
赋予增加的病原体抗性的多核苷酸和多肽的表达
提供了赋予增加的病原体抗性的组合物和方法。提供了赋予增加的病原体抗性的多肽、多核苷酸及其功能片段和变体。在一些实施例中,多肽是SEQ ID NO:5或SEQ ID NO:5的片段或变体。在一些实施例中,多核苷酸是SEQ ID NO:1、2-4、11和12中的任一个或编码具有SEQ ID NO:5的序列的多肽的多核苷酸,或其任一个的片段或变体。在各种实施例中,多肽和多核苷酸或其变体和片段赋予增加的抗亚洲大豆锈病抗性。
在植物、植物部分、或种子中表达时增加病原体抗性的多肽的片段包括比全长序列短的那些,由于使用了替代的下游开始位点,或者由于加工产生了具有活性的较短的蛋白质。这样的生物活性部分可以通过重组技术制备并评估其能够赋予增加的病原体抗性的活性。
本文披露的变体包括具有如下氨基酸序列的多肽,该氨基酸序列与SEQ ID NO:5的氨基酸序列具有至少60%、约65%、约70%、约75%、约80%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%同一性。类似地,本文披露的变体包括具有如下核苷酸序列的多核苷酸,该核苷酸序列与SEQ ID NO:1、2-4和11-12中的任一个的核苷酸序列具有至少60%、约65%、约70%、约75%、约80%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%同一性。这样的变体在植物、植物部分、或种子中表达时将增加病原体抗性。在一些实施例中,变体多核苷酸/多肽包含在天然多核苷酸/多肽内的一个或多个内部位点处的一个或多个核苷酸/氨基酸的缺失和/或添加,和/或在天然多核苷酸/多肽中的一个或多个位点处的一个或多个核苷酸/氨基酸的取代。
在一些实施例中,本文披露的多肽可以包含与其附接的异源氨基酸序列。例如,多肽可以具有与其附接的多肽标签或另外的蛋白质结构域。异源氨基酸序列可以附接至N末端、C末端或多肽内部。在一些实例中,多肽可以在多肽的一个或多个位置处具有与其附接的一个或多个多肽标签和/或另外的蛋白质结构域。
在一些实施例中,编码本文披露的多肽的核酸序列可以包含与其附接的异源核酸序列。例如,异源核酸序列可以编码将与编码的多肽附接的多肽标签或另外的蛋白质结构域。作为另一个实例,异源核酸序列可以编码调节元件,例如内含子、增强子、启动子、终止子等。异源核酸序列可位于5’末端、3’末端、或多肽的编码序列内的框内。在一些实例中,编码本文披露的多肽的核酸序列可以在核酸序列的一个或多个位置处具有与其附接的一个或多个异源核酸序列。在仍其他实施例中,本文披露的核苷酸序列进一步包含一个或多个天然调节元件,包括,例如,天然启动子序列、天然5’UTR、天然3’UTR和/或天然终止子、或其任何组合。
编码本文提供的多肽的多核苷酸可以在表达盒(本文也称为“DNA构建体”)中提供,用于在目的生物体中表达。该盒将包括与编码本文提供的多肽的多核苷酸可操作地连接的5’和3’调节序列,其允许在植物中表达包含R-基因的多核苷酸,从而赋予表达它们的植物对病原体的抗性。该盒可以另外含有待共转化至生物体中的至少一个另外的基因或遗传元件。在包括另外的基因或元件的情况下,这些组分是可操作地连接的。可替代地,另外的一个或多个基因或元件可以提供在多个表达盒上。这样的表达盒设置有多个限制性位点和/或重组位点以使多核苷酸的插入在调节元件或区域的转录调节下。表达盒可以另外含有选择性标记基因。
“DNA构建体”是指构成重组DNA分子的可操作地彼此连接的遗传元件,并且可以包括提供DNA多核苷酸分子在宿主细胞中表达的元件以及提供构建体在宿主细胞中的维持的元件。DNA构建体内的各种遗传元件对于编码多肽的多核苷酸可以是天然的或者对于编码多肽的天然多核苷酸可以是异源的。植物表达盒包含遗传元件的可操作连接,该遗传元件在转入植物细胞时提供期望的基因产物的表达。“植物表达盒”是指嵌合DNA片段,这些嵌合DNA片段包含可操作地连接以提供转基因产物在植物中的表达的调节元件。启动子、前导序列、内含子、编码转运肽的多核酸、3'转录终止区都是植物分子生物学领域的技术人员可操作地连接以向本发明的R-基因提供期望的水平的表达或功能的遗传元件。DNA构建体可以包含表达本发明的DNA分子或在作物植物基因工程中使用的其他DNA分子的一个或多个植物表达盒。可用于表达本发明的R-基因的DNA构建体的一个实例是具有包含R-基因的核酸序列的载体,该核酸序列可操作地连接至一个或多个异源调节元件(例如,异源启动子和/或内含子)或天然调节元件(例如,天然启动子、内含子、或终止子区域)。
表达盒将在5’-3’转录方向包含在目的生物体(即,植物或细菌)中起作用的转录和翻译起始区(即,启动子)、本发明的多核苷酸、以及转录和翻译终止区(即,终止区)。本发明的启动子能够指导或驱动编码序列在宿主细胞中的转录和表达。调节区(即启动子、转录调节区和翻译终止区)对于宿主细胞或对于彼此可以是内源的或异源的。如本文所用,嵌合基因或嵌合核酸分子包含与转录起始区可操作地连接的编码序列,该转录起始区对于该编码序列是异源的。
多种转录终止子可用于在表达盒中使用。这些转录终止子负责转基因以外的转录终止以及正确的mRNA多腺苷酸化。终止区可以天然地与转录起始区在一起,可以天然地与可操作地连接的目的DNA序列在一起,可以天然地与植物宿主在一起,或者可能衍生自另一来源(即,对于启动子、目的DNA序列、植物宿主或其任何组合是外来的或异源的)。适当的转录终止子是已知在植物中发挥作用的那些,并且包括CAMV 35S终止子、tml终止子、胭脂碱合酶终止子以及豌豆rbcs E9终止子。这些终止子可以在单子叶植物和双子叶植物两者中使用。可以使用的其他终止子还包括衍生自拟南芥属基因的异源终止子,例如SEQ ID NO:16-17的终止子。此外,可以使用基因的天然转录终止子。在一个示例实施例中,使用了编码赋予增加的病原体抗性的多肽的核酸(R-基因)的天然转录终止子,例如SEQ ID NO:18的天然终止子。在表达盒中使用的终止区还可以从例如,根癌土壤杆菌的Ti-质粒获得,如章鱼碱合酶和胭脂碱合酶终止区。还参见Guerineau等人(1991)Mol.Gen.Genet.[分子遗传学和普通遗传学]262:141-144;Proudfoot(1991)Cell[细胞]64:671-674;Sanfacon等人(1991)Genes Dev.[基因与发育]5:141-149;Mogen等人(990)Plant Cell[植物细胞]2:1261-1272;Munroe等人(1990)Gene[基因]91:151-158;Ballas等人(1989)Nucleic Acids Res.[核酸研究]17:7891-7903;以及Joshi等人(1987)Nucleic Acid Res.[核酸研究]15:9627-9639。
另外的调节信号包括但不限于转录起始开始位点、操纵子、激活子、增强子、其他调节元件、核糖体结合位点、起始密码子、终止信号等。参见,例如,美国专利号5,039,523和4,853,331;EPO 0480762A2;Sambrook等人(1992)Molecular Cloning:A LaboratoryManual[分子克隆:实验室手册],Maniatis等人编辑(Cold Spring Harbor LaboratoryPress[冷泉港实验室出版社],Cold Spring Harbor[冷泉港],N.Y.[纽约]),以下称为“Sambrook 11”;Davis等人编辑,(1980)。
在制备表达盒时,可以操纵各种DNA片段,以便提供呈适当取向并且视情况呈适当阅读框的DNA序列。为此,可以采用衔接子或接头来连接DNA片段,或者可以涉及其他操纵以提供方便的限制性位点、去除多余DNA的、去除限制性位点等。出于此目的,可以涉及体外诱变、引物修复、限制、退火、再取代(例如,转换和颠换)。
在营养组织如叶、茎、根和块茎中组成型活性或特异性活性的多种启动子可用于表达本发明的核酸或R-基因。可以根据期望的结果来选择启动子。核酸可以与组成型、诱导型、组织偏好型、或其他启动子组合用于在目的生物体中表达。参见例如以下中所示启动子:WO 99/43838和美国专利号:8,575,425;7,790,846;8,147,856;8,586832;7,772,369;7,534,939;6,072,050;5,659,026;5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142;和6,177,611;其通过引用并入本文。在一些实施例中,用于驱动本文提供的多核苷酸的表达的启动子包含在自然界植物中未发现的外源启动子,例如,合成启动子。在一些实施例中,用于驱动本文提供的多核苷酸的表达的启动子包含源自与R-基因来源的生物体不同的生物体的异源启动子。在示例实施例中,包含R-基因的核酸在大豆植物中表达,其中该表达由衍生自蒺藜苜蓿的植物启动子,例如SEQ ID NO:13-14的启动子驱动。
在实施例中,启动子还可以任选地包含内含子。在一些实施例中,启动子包含已知或预测的编码序列的翻译开始位点上游(5')的约2kb区域或由其组成。在其他实施例中,启动子是仅包含启动转录所需的那些元件的最小或核心启动子。例如,最小启动子可以由转录开始位点(TSS)、RNA聚合酶结合位点和转录因子结合位点(如TATA盒或B识别元件)组成。这种最小启动子可以不包含任何内含子或剪接位点。
在一些实施例中,驱动本文提供的多核苷酸的表达的本文所用的启动子包含天然启动子或其活性变体或片段。出于本披露的目的,术语“天然启动子”可以与术语“内源启动子”互换使用,是指在自然界植物中发现的启动子。天然启动子的活性变体或片段是指具有一个或多个核苷酸取代、缺失、或插入的并且可以在类似于在天然启动子具有活性的条件下的那些条件下驱动可操作地连接的多核苷酸序列的表达的启动子序列。这样的活性变体或片段可以通过定点诱变、诱导突变产生,或者可以作为等位基因变体(多态性)。在一些实施例中,天然启动子包含具有SEQ ID NO:15的序列的多核苷酸。在一些实施例中,本文披露了构建体,该构建体包含可操作地连接至编码具有SEQ ID NO:5的序列、或SEQ ID NO:5的片段或变体的多肽的多核苷酸的天然启动子(例如,包含SEQ ID NO:15的天然启动子)或其活性变体或片段(例如,与天然启动子具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性,其中其变体或片段保留指导目的序列的表达的能力);并且该构建体引入植物中时赋予增加的病原体抗性。在一些实施例中,天然启动子是对多核苷酸的异源启动子。
翻译前导序列是指位于基因启动子和编码序列之间的DNA分子。翻译前导序列存在于完全加工的mRNA中的翻译起始序列上游。翻译前导序列可影响初级转录物至mRNA的加工、mRNA稳定性或翻译效率。翻译前导序列的实例包括玉蜀黍和碧冬茄属热休克蛋白前导序列、植物病毒外壳蛋白前导序列,植物二磷酸核酮糖羧化酶(rubisco)基因前导序列等(Turner和Foster,Molecular Biotechnology[分子生物技术]3:225,1995)。
“3′非翻译序列”(或3′未翻译序列或3′-UTR)意指位于结构多核苷酸序列下游的DNA序列,并且包括编码多腺苷酸化和能够影响mRNA加工或基因表达的其他调节信号的序列。多腺苷酸化信号在植物中的作用是导致多个腺苷酸核苷酸添加到mRNA前体的3’末端。多腺苷酸化序列可衍生自天然基因、衍生自各种植物基因、或衍生自T-DNA。多腺苷酸化序列的实例是胭脂碱合酶3’序列(nos 3′;Fraley等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]80:4803-4807,1983)。不同3'非翻译序列的使用例示于Ingelbrecht等人,Plant Cell[植物细胞]1:671-680,1989。在本发明的实施例中,编码赋予增加的病原体抗性的多肽的核酸包含R-基因的天然或内源3′-UTR,例如SEQ ID NO:20的3′-UTR。
“5′非翻译序列”(或5′未翻译序列或5′-UTR)意指位于结构多核苷酸序列的起始密码子的上游的DNA序列,并且包括能够影响mRNA序列的翻译的序列。5′-UTR序列也称为前导序列。在不同的生物体中,5′-UTR可以保持未翻译状态,并且形成复杂的二级结构以调节下游序列的翻译。前导序列可以衍生自天然基因或衍生自各种植物基因。在本发明的实施例中,编码赋予增加的病原体抗性的多肽的核酸包含R-基因的天然或内源5′-UTR,例如SEQID NO:19的5′-UTR。
如本文所用,术语“内含子”是指在基因内(也就是说,在基因内区域中)提供的核苷酸序列,并且其在最终RNA产物成熟过程中通过剪接被去除。因此,内含子是RNA转录物或编码它的DNA的非编码区。内含子可以具有调节功能,例如由于嵌入其中的转录增强子或阻遏序列的存在。示例内含子包括衍生自拟南芥属基因的内含子,例如SEQ ID NO:21的内含子。内含子分隔外显子,使得剪接导致内含子的去除和外显子的连接。内含子的标志是在5'和3'末端处存在被称为剪接位点的保守序列。典型地,5'末端处的剪接位点包括AG序列,而3'末端处的剪接位点包括GU序列。内含子的剪接由包含RNA和蛋白质的剪接体催化。在一些实施例中(例如,对于更大的启动子序列,如近端或远端启动子的启动子序列),启动子序列可以包括内含子。在其他实施例中,如本文所述,内含子可以任选地偶联到最小或核心启动子序列,以及偶联到编码目的蛋白的核酸,以改善蛋白质的表达。
这在实施例中,披露了用于在植物细胞中多核苷酸和多肽的表达的新颖的调节元件。在特别的实施例中,新颖的调节元件用于表达多核苷酸和多肽,这些多核苷酸和多肽在植物细胞中表达时赋予植物例如对ASR的增加的病原体抗性。新颖的调节元件包括包含SEQID NO:15的核苷酸序列、或SEQ ID NO:15的活性变体或片段(例如,与SEQ ID NO:15具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%序列同一性并且保留驱动可操作地连接的目的多核苷酸的表达的能力)的天然启动子。在其他实施例中,SEQ ID 15所示的启动子可操作地连接至编码目的多肽的多核苷酸。在特定实施例中,目的多核苷酸序列编码多肽,该多肽在植物细胞中表达后增加植物细胞对植物病原体(例如ASR)的抗性。这样的多肽包括但不限于SEQ ID NO:5的多肽或其活性变体或片段或编码R-基因的多肽,如美国专利公开号US20200354739和PCT公开号WO 2019103918、WO 2021154632A1、WO2021022022、WO 2021022026、WO 2021022101、WO 2021260673、和WO 2021263249中的任一个所阐述,其各自的内容通过引用以其全文并入本文。
新颖的调节元件进一步包括天然终止子,该天然终止子包含SEQ ID NO:18的核苷酸序列、或与SEQ ID NO:18基本上相同的序列(例如,具有至少90%或至少95%序列同一性)。新颖的调节元件进一步包括天然5′-和3′-UTR,该天然5′-和3′-UTR包含SEQ ID NO:19和/或20的核苷酸序列、或与SEQ ID NO:19和/或20基本上相同的序列(例如,具有至少90%或至少95%序列同一性)。
本发明的多核苷酸包含可以表达新颖的R-基因并且编码赋予增加的病原体抗性的多肽的任何编码序列。在特别的实施例中,编码序列包含编码多肽的任何多核苷酸,该多肽具有SEQ ID NO:5的氨基酸序列、或与SEQ ID NO:5具有至少90%或至少95%序列同一性的氨基酸序列,并且当表达时赋予增加的病原体抗性。在示例实施例中,编码序列包含具有SEQ ID NO:1、2-4和11-12中的任一个的核苷酸序列的核酸,或与SEQ ID NO:1、2-4和11-12中的任一个具有至少90%或至少95%序列同一性的任何核酸。
在示例实施例中,编码序列是cDNA衍生的核苷酸序列,该核苷酸序列包含一起剪接的R-基因的外显子(没有间插的内含子的序列),或上游和下游UTR(例如,SEQ ID NO:12的R-基因编码序列)。在其他示例实施例中,编码序列是基因组DNA衍生的核苷酸序列,该核苷酸序列包含有间插的天然内含子的任何组合(例如,一个或多个或所有间插的内含子)的外显子、天然5′和3′UTR、天然启动子和天然终止子。本领域技术人员可以使用重组DNA技术中的标准程序将编码序列选项中的任一个与天然或外源终止子、天然或外源启动子、以及表达盒中的天然或外源调节元件的任何组合进行组合。
在一个实施例中,除了天然5′和3′UTR和天然启动子和终止子之外,本发明的R-基因的基因组DNA衍生的编码序列还包含基因的所有天然内含子和外显子(例如,SEQ ID NO:2的R-基因编码序列)。在其他示例实施例中,天然内含子中的一个或多个被非天然内含子(例如已知增强在宿主细胞中的转化、转录、或翻译活性的内含子)替代(例如,SEQ ID NO:3-4和11-12的R-基因编码序列,其中第一天然内含子被SEQ ID NO:21的内含子替代)。在仍另外的实施例中,编码序列包含允许由天然启动子驱动的基因表达的天然启动子和终止子以及天然UTR(例如,SEQ ID NO:11的R-基因编码序列)。在其他实施例中,编码序列包含天然UTR但不包含天然启动子或终止子,以允许由异质启动子驱动的基因表达(例如,SEQ IDNO:3-4的R-基因编码序列)。
本文使用的重组DNA技术中的实验室程序是本领域中熟知的和通常采用的那些程序。标准技术用于克隆、DNA和RNA分离、扩增和纯化。通常,涉及DNA连接酶、DNA聚合酶、限制性内切核酸酶等的酶促反应根据制造商的规范进行。这些技术和各种其他技术通常根据Sambrook等人(1989)执行。
本发明的核酸、多核苷酸、核苷酸序列、R-基因、载体和DNA构建体可通过本领域技术人员熟知的各种常规转化技术引入期望的植物宿主的基因组中。“转化”是指将外源核酸分子(例如,DNA构建体、载体、表达盒、或重组多核酸分子)稳定引入细胞或原生质体中,并且将该外源核酸分子稳定地掺入宿主细胞基因组或细胞器基因组(例如,叶绿体或线粒体)中或能够自主复制的过程。“转化的”或“转基因的”是指外来多核酸例如DNA载体或重组多核酸分子掺入并维持的细胞、组织、器官或生物体。此外,一旦稳定转化到细胞中,外来多核酸就可以传递给细胞的子代。“转基因的”、“转化的”或“稳定转化的”细胞或生物体还包括细胞或生物体的子代和从育种程序产生的子代,该育种程序采用“转基因的”植物作为杂交中的亲本,并且从育种程序产生的子代展现出由于外来多核酸分子的存在而导致的改变的表型。
植物细胞或组织的转化方法包括但不限于土壤杆菌介导的转化方法和基因枪或粒子枪介导的转化方法。用于土壤杆菌介导转化的目的的合适植物转化载体包括-源自根癌土壤杆菌的肿瘤诱导(Ti)质粒的那些元件,例如右边界(RB)区和左边界(LB)区,以及Herrera-Estrella等人,Nature[自然]303:209(1983);Bevan,Nucleic Acids Res.[核酸研究]12:8711-8721(1984);Klee等人,Bio-Technology[生物技术]3(7):637-642(1985)披露的其他元件。除了衍生自土壤杆菌Ti或根诱导(Ri)质粒的植物转化载体外,可使用替代方法将本发明的DNA构建体插入植物细胞。这些方法可以涉及但不限于例如脂质体的使用、电穿孔、增加游离DNA摄取的化学物质、通过微射弹轰击的游离DNA递送、以及使用病毒或花粉的转化。
可以制备掺入本发明的R-基因编码序列的DNA构建体、载体、和表达盒,用于指导直接从宿主植物细胞质体表达这些序列。适用于此目的的这样的构建体的实例和方法是本领域已知的并且通常描述于例如Svab等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]87:8526-8530,(1990)和Svab等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:913-917(1993)和美国专利号5,693,507。
当获得足够数量的含有编码本发明多肽的外源核酸分子的细胞时,可以培养这些细胞,然后将其再生为全株植物。“再生”是指从植物细胞(例如,植物原生质体或外植体)生长出植物的过程。这种再生技术依赖于组织培养生长培养基中某些植物激素的操纵,典型地依赖于已与期望的核苷酸序列一起引入的杀生物剂和/或除草剂标记。再生步骤的方法选择并不重要,参见例如,Ammirato等人,Handbook of Plant Cell Culture—CropSpecies.[植物细胞培养-作物物种手册]Macmillan Publ.Co.[Macmillan出版公司](1984);Shimamoto等人,Nature[自然]338:274-276(1989);Fromm,UCLA Symposium onMolecular Strategies for Crop Improvement[加州大学洛杉矶分校作物改良分子策略研讨会],1990年4月16日至22日.Keystone,Colo.[基斯通,科罗拉多州](1990);Vasil等人,Bio/Technology[生物/技术]8:429-434(1990);Vasil等人,Bio/Technology[生物/技术]10:667-674(1992);Hayashimoto,Plant Physiol.[植物生理学]93:857-863(1990);以及Datta等人,Bio-technology[生物技术]8:736-740(1990)。这样的再生技术通常是Klee等人,Ann.Rev.Plant Phys.[植物生理学年度综述]38:467-486(1987)中描述的。
含有编码目的多肽的外源多核酸分子的转基因植物的发育或再生是本领域熟知的。优选地,再生的植物自花授粉以提供纯合转基因植物,如上所述。另外,从再生的植物获得的花粉与重要农艺品系的种子生长植物杂交。相反,来自这些重要品系植物的花粉被用来为再生的植物授粉。
在某些实施例中,可以将编码赋予增强的病原体抗性的蛋白质的本发明的多核苷酸与目的多核苷酸序列的任何组合叠加以产生具有期望的性状的植物。如本文所用,性状是指衍生自特定序列或序列组的表型。例如,编码新颖的R基因的多核苷酸可以与任何其他的编码赋予期望的性状的多肽的多核苷酸进行叠加,这些性状包括但不限于:对于疾病、昆虫、以及除草剂的抗性,对于热和干旱的耐受性,缩短的作物成熟时间,改善的工业加工(例如,用于将淀粉或生物质转化为可发酵的糖)、以及改善的农艺质量(例如,高油含量和高蛋白含量)。
在本发明的特别的实施例中,可以叠加多核苷酸(或者,可替代地,可以将多个表达盒叠加在单一多核苷酸上),以在植物内表达超过一种R-基因。当例如一种R-基因特别适合用于提供对一类植物病原体(例如,第一个锈病分离物)的抗性,而另一种提供对不同类别的植物病原体(或不同的结果分离物)的抗性,这是特别有利的。在替代的实施例中,提供了第一R-基因,其经由第一作用方式提供了抗植物病原体(例如,ASR)抗性,而另一种R-基因经由第二不同作用方式提供了抗相同植物病原体的抗性。在本文中,不同R-基因的不同作用方式的协同作用可以提供比任一个R-基因本身更高的整体病原体抗性增加。在一种多肽表达固有的病原体抗性但是稍微不稳定的情况下,叠加由不同R-基因编码的多肽也是一个优点。
可以与本发明的多核苷酸叠加的编码赋予增加的病原体抗性的蛋白质的示例性多核苷酸包括编码赋予增加的ASR抗性的蛋白质的多核苷酸,如以下中所述:美国专利公开号US20200354739和PCT公开号WO 2019103918、WO 2021154632A1、WO 2021022022、WO2021022026、WO 2021022101、WO 2021260673、和WO 2021263249,其各自通过引用以其全文并入。
可以与编码新颖的R-基因的本发明的多核苷酸叠加的示例性多核苷酸包括编码多肽的多核苷酸,这些多肽赋予抗有害生物/病原体如病毒、线虫、昆虫或真菌等的抗性。可以与本发明的多核苷酸叠加的示例性多核苷酸包括编码以下的多核苷酸:具有杀有害生物和/或杀昆虫活性的多肽,例如其他苏云金芽孢杆菌(Bacillus thuringiensis)毒性蛋白(描述于美国专利号5,366,892;5,747,450;5,737,514;5,723,756;5,593,881;以及Geiser等人(1986)Gene[基因]48:109),凝集素(Van Damme等人(1994)Plant Mol.Biol.[植物分子生物学]24:825,五邻体(pentin)(描述于美国专利号5,981,722)等;疾病或除草剂抗性所期望的性状(例如,伏马菌素解毒基因(美国专利号5,792,931);无毒力和疾病抗性基因(Jones等人(1994)Science[科学]266:789;Martin等人(1993)Science[科学]262:1432;Mindrinos等人(1994)Cell[细胞]78:1089);编码赋予对某些类别的生长素和乙酰辅酶A羧化酶除草剂的抗性的芳氧基链烷酸酯双加氧酶的基因(例如在PCT公开号WO 2008/141154、WO 2007/053482中或在美国专利号6,153,401中对2,4D产生抗性的tfdA基因);编码赋予对麦草畏的抗性的麦草畏单加氧酶的基因(Behrens等人(2007)Science[科学],316,1185);编码赋予对抑制HST的除草剂的抗性的尿黑酸茄呢基转移酶(HST)的基因(PCT公开号WO2010/029311);编码赋予对含腈除草剂的抗性的腈水解酶(例如bxnA溴草腈腈水解酶)的基因;产生除草剂抗性的乙酰乳酸合酶(ALS)突变体,例如S4和/或Hra突变;草甘膦抗性(例如,5-烯醇-丙酮酰-莽草酸-3-磷酸-合酶(EPSPS)基因,描述于美国专利号4,940,935和5,188,642中;或草甘膦N-乙酰转移酶(GAT)基因,描述于Castle等人(2004)Science[科学],304:1151-1154;和美国专利申请公开号20070004912、20050246798、和20050060767中));草铵膦抗性(例如,膦丝菌素乙酰转移酶基因PAT和BAR,描述于美国专利号5,561,236和5,276,268);赋予对尤其HPPD除草剂的除草剂抗性或耐受性的细胞色素P450或其变体(美国专利申请公开号20090011936;美国专利号6,380,465;6,121,512;5,349,127;6,649,814;和6,300,544;以及PCT公开号WO 2007/000077);以及对于以下的加工或过程产物的期望的性状:例如高油(例如,美国专利号6,232,529);改性的油(例如,脂肪酸去饱和酶基因(美国专利号5,952,544;PCT公开号WO 94/11516));改性的淀粉(例如,ADPG焦磷酸化酶(AGPase)、淀粉合酶(SS)、淀粉分支酶(SBE)、和淀粉脱支酶(SDBE));以及聚合物或生物塑料(例如,美国专利号5.602,321;β-酮硫解酶、聚羟基丁酸合酶、和乙酰乙酰辅酶A还原酶(Schubert等人(1988)J.Bacteriol.[细菌学杂志]170:5837-5847)有利于聚羟基链烷酸酯(PHA)的表达)。
这些叠加的组合可以通过任何方法来产生,该方法包括但不局限于通过任何常规方法或顶交方法对植物进行杂交育种,或者遗传转化。如果这些序列是通过将植物遗传转化来叠加的,那么目的多核苷酸序列可以在任何时间并且以任何顺序进行组合。例如,包含一种或多种期望性状的转基因植物可以用作靶标以通过随后的转化来引入其他性状。这些性状可以在共转化方案中与通过转化盒的任何组合提供的目的多核苷酸同时引入。例如,如果将引入两个序列,这两个序列可以含于单独转化盒中(反式)或含于同一转化盒上(顺式)。这些序列的表达可以由相同启动子或由不同启动子驱动。在某些情形中,引入会抑制目的多核苷酸的表达的转化盒可能是期望的。这可以与其他抑制盒或过表达盒的任何组合组合,以在植物中生成期望的性状组合。进一步认识到的,可以使用位点特异性重组系统在期望的基因组位置处叠加多核苷酸序列。参见例如,PCT公开号WO 99/25821、WO 99/25854、WO 99/25840、WO 99/25855、以及WO 99/25853。
疾病抗性大豆植物和种质
在本文提供的植物中,如本披露更早描述的多核苷酸是在植物的基因组中的异源核酸序列。如本文所用,在染色体区段的上下文中,术语“异源”是指在自然界中未发现的构型的一个或多个DNA序列(例如,遗传基因座),例如由于减数分裂期间同源染色体之间的重组事件,或者例如由于转基因序列的引入,或者例如由于通过基因编辑的修饰。
尽管大豆植物在整个申请中用于举例说明组合物和方法,但本文提供的多核苷酸可以引入任何植物物种(包括但不限于单子叶植物和双子叶植物)中。目的植物的实例包括但不限于玉米(玉蜀黍)、高粱、小麦、向日葵、番茄、十字花科植物、胡椒、马铃薯、棉花、稻、大豆、甜菜、甘蔗、烟草、大麦和油籽油菜、芸苔属、苜蓿、黑麦、粟类、红花、花生、甘薯、木薯、咖啡、椰子、菠萝、柑桔树、可可、茶叶、香蕉、油桃、无花果、番石榴、芒果、橄榄、木瓜、腰果、澳洲坚果、杏、燕麦、蔬菜、观赏植物以及针叶树。
大豆属(大豆(soybean或soya bean))是大豆家族豆科的属。大豆属植物可以是沙生大豆(Glycine arenaria)、银毛大豆、弯裂片大豆(Glycine cyrtoloba)、灰色大豆(Glycine canescens)、澎湖大豆(Glycine clandestine)、弯大豆(Glycine curvata)、镰叶大豆(Glycinefalcata)、阔叶大豆(Glycine latifolia)、小叶大豆(Glycinemicrophylla)、澎湖烟豆、白毛烟豆、Glycine syndetica、盐地野生大豆(Glycine sojaSeib.Et Zucc.)、毛豆(Glycine max(L.)Merrill.)、烟豆(Glycine tabacina)或短绒野大豆(Glycine tomentella)。
在一些实施例中,本文提供的植物是优良植物或衍生自优良品系。
如本文所用,“优良品系”是农艺学上有优势的品系,该品系是从针对有优势的农艺学表现的许多个周期的选育而产生的。众多的优良品系是可获得的并且对于大豆育种领域的普通技术人员是已知的。“优良群体”是一类优良个体或品系,其可以用来代表在给定作物物种(如大豆)的农艺学上有优势的基因型方面的现有技术。类似地,“优良种质”或种质的优良株系是农艺学上有优势的种质,典型地衍生自和/或可以给予具有有优势的农艺学表现的植物,例如现有的或新开发的大豆优良品系。
“优良”植物是来自优良品系的任何植物,因此优良植物是来自优良品种的代表性植物。在一些实施例中,包含编码本文披露的多肽中的任一个的多核苷酸的大豆植物是优良大豆植物。农民或大豆育种者可商购的优良大豆品种的非限制性实例包括:AG00802、A0868、AG0902、A1923、AG2403、A2824、A3704、A4324、A5404、AG5903、AG6202、AG0934;AG1435;AG2031;AG2035;AG2433;AG2733;AG2933;AG3334;AG3832;AG4135;AG4632;AG4934;AG5831;AG6534;和AG7231(阿斯格罗种子公司(Asgrow Seeds),德梅因(Des Moines),爱荷华州,美国);BPR0144RR、BPR 4077NRR和BPR 4390NRR(生物植物研究所(Bio PlantResearch),营点(Camp Point),伊利诺伊州,美国);DKB 17-51和DKB37-51(迪卡白遗传公司(DeKalb Genetics),迪卡尔布(DeKalb),伊利诺伊州,美国);DP 4546RR、和DP 7870RR(三角洲和松树陆地公司(Delta&Pine Land Company),卢博克市(Lubbock),德克萨斯州,美国);JG 03R501、JG 32R606C ADD和JG 55R503C(JGL有限公司(JGL Inc.),格林卡斯尔(Greencastle),印第安纳州,美国);NKS13-K2(先正达种子公司NK部门(NK Division ofSyngenta Seeds),黄金谷(Golden Valley),明尼苏达洲,美国);90M01、91M30、92M33、93M11、94M30、95M30、97B52、P008T22R2;P16T17R2;P22T69R;P25T51R;P34T07R2;P35T58R;P39T67R;P47T36R;P46T21R;和P56T03R2(先锋良种国际有限公司(Pioneer Hi-BredInternational),庄士敦(Johnston),爱荷华州,美国);SG4771NRR和SG5161NRR/STS(大豆遗传学有限责任公司(Soygenetics,LLC,),拉斐特(Lafayette),印第安纳州,美国);S00-K5、S11-L2、S28-Y2、S43-B1、S53-A1、S76-L9、S78-G6、S0009-M2;S007-Y4;S04-D3;S14-A6;S20-T6;S21-M7;S26-P3;S28-N6;S30-V6;S35-C3;S36-Y6;S39-C4;S47-K5;S48-D9;S52-Y2;S58-Z4;S67-R6;S73-S8;和S78-G6(先正达种子公司,亨德森市(Henderson),肯塔基州,美国);Richer(北极星种业有限责任公司(Northstar Seed Ltd.),亚伯达省(Alberta),加拿大);14RD62(斯汀种子公司(Stine SeedCo.),爱荷华州,美国);或Armor 4744(阿莫尔种子有限责任公司(Armor Seed,LLC),阿拉斯加州,美国)。
本发明的疾病抗性大豆植物或种质可以通过任何方法产生,借这些方法将本发明的R-基因引入大豆植物或种质中,这些方法包括但不限于转化、原生质体转化、或融合、双单倍体技术、胚拯救、基因编辑、常规育种和/或通过任何其他核酸转移系统产生。
在一些实施例中,大豆植物或种质包含非天然存在的大豆品种。在一些实施例中,大豆植物或种质与优良大豆品种的基因组具有至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性。
疾病抗性大豆植物或种质可以是优良大豆品种与包含用于增强的疾病耐受性或抗性(例如ASR)的R-基因的大豆品种之间的杂交的子代,其中该R-基因是编码赋予增加的病原体抗性的蛋白质的新颖的基因;与SEQ ID NO:1、2-4、11-12中的任一个基本上相同的R-基因;或编码与SEQ ID NO:5基本上相同同时在植物中赋予或增强病原体抗性(例如,ASR抗性)的多肽的R-基因。在许多实例中,R-基因的可替代实施例将与SEQ ID NO:1、2-4、和11-12中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同源性。在许多实例中,R-基因的可替代实施例将与编码SEQ ID NO:5的多肽的核酸分子或编码与SEQ ID NO:5具有至少90%同源性同时在植物中提供ASR抗性的多肽的核酸分子具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同源性。在许多实例中,由R-基因编码的多肽将与SEQ ID NO:5具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%同源性。
在特别的实施例中,疾病抗性大豆植物或种质可以是优良大豆品种与包含用于增强的疾病耐受性(例如ASR)的R-基因的大豆品种之间的杂交的子代,其中该R-基因是编码赋予增强的病原体抗性的蛋白质的新颖的基因,其中该R-基因与SEQ ID NO:1、2-4、11-12中的任一个基本上相同,或是编码与SEQ ID NO:5基本上相同且同时在植物中赋予ASR抗性的多肽的R-基因。在许多实例中,R-基因的可替代实施例将与SEQ ID NO:1、2-4、11-12中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同源性。在许多实例中,R-基因的可替代实施例将与编码SEQ ID NO:5的多肽的核苷酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同源性。在许多实例中,由SEQID NO:1、2-4、和11-12的R-基因编码的多肽将与SEQ ID NO:5包含至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%同源性中的一个,同时赋予ASR抗性。
疾病抗性大豆植物或种质可以是基因渗入的子代,其中轮回亲本是优良大豆品种,并且供体包含与增强的疾病耐受性和/或抗性相关联的R-基因,其中该供体携带与SEQID NO:1、2-4、和11-12中的任一个具有基本同一性的R-基因或编码与SEQ ID NO:5具有基本同一性的多肽的R-基因。在一些实施例中,植物将包含与SEQ ID NO:1、2-4、11-12中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同源性的R-基因,且与不包含该R-基因的植物相比具有增加的ASR耐受性。在一些实施例中,植物将包含编码与SEQ ID NO:5具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同源性的蛋白质的R-基因,且与不包含该R-基因的植物相比具有增加的ASR耐受性。
疾病抗性大豆植物或种质可以是第一优良大豆品种(例如,测试品系)之间的杂交的子代,和第二优良大豆品种(例如,轮回亲本)与包含R-基因的大豆品种之间的杂交的子代。
本发明的疾病抗性大豆植物和种质可以包含本发明的一个或多个R-基因(例如,SEQ ID NO:1、2、3、4、6、7、11和12中的任一个)。
在一些实施例中,本文提供的植物可以包含编码另外的多肽的一个或多个另外的多核苷酸,该另外的多肽可以赋予增加的病原体抗性的表型。
在特定实施例中,具有本文披露的异源多核苷酸或多肽或其活性变体和片段的植物、植物部分或种子可以具有经修饰的表达水平的多核苷酸或多肽(即,表达水平增加或降低)。在其他实施例中,具有本文披露的异源多核苷酸或多肽或其活性变体和片段的植物、植物部分或种子可以具有经修饰的活性水平的多肽(即,活性水平增加或降低)。产生这样的经修饰的表达或活性水平的方法在本文其他地方披露,并且包括但不限于育种、基因编辑、和转基因技术。
可以将如上所述产生的植物繁殖以产生子代植物,并且可选择在其基因组中稳定掺入了赋予增加的病原体抗性的多核苷酸的子代植物,并且如果需要可进一步繁殖。术语“子代”是指特定杂交的一个或多个后裔。典型地,子代由两个个体的育种产生,但一些物种(特别是一些植物和雌雄同体的动物)可以自体受精(即,同一个植株充当雄性和雌性配子两者的供体)。该一个或多个后裔可以是例如F1、F2或任何后续世代。
除了表型性状之外,由遗传标记特征表示的植物的遗传特征可以用于选择具有期望的性状的植物。术语“基于标记的选择”是指使用遗传标记从植物中检测一个或多个核酸,其中该核酸与期望的性状相关联,以鉴别出携带期望的(或不期望的)性状的基因的植物。标记包括但不限于限制性片段长度多态性(RFLP)、随机扩增多态性DNA(RAPD)、随机引物聚合酶链式反应(AP-PCR)、DNA扩增指纹分析(DAF)、序列特征扩增区(SCAR)、扩增片段长度多态性(AFLP)、简单序列重复(SSR)(也称为微卫星)、和单核苷酸多态性(SNP)。已知有一系列公开标记正在由ASTA和其他行业组织根据美国植物品种保护法(US Plant VarietyProtection Act)研究,研究其在标准化确定什么构成基本衍生品种中的适用性。然而,这些标准标记并不限制可用于育种或开发回交转化、或用于区分品种或植物部分或植物细胞或验证子代谱系的标记和标记特征的类型。用于测定这些和其他标记的引物和PCR方案在位于万维网的129.186.26.94/SSR.html的Soybase(由USDA农业研究局(AgriculturalResearch Service)和爱荷华州立大学(Iowa State University)资助)中披露。
在一个实施例中,用于鉴定包含本文披露的多核苷酸的植物的标记是SNP。SNP基因分型方法的非限制性实例包括杂交、引物延伸、寡核苷酸连接、核酸酶切割、微测序和编码球(coded sphere)。这样的方法是熟知的并且披露于例如,Gut,I.G.,Hum.Mutat.[人类突变]17:475-492(2001);Shi,Clin.Chem.[临床化学]47(2):164-172(2001);Kwok,Pharmacogenomics[药物基因组学]1(1):95-100(2000);以及Bhattramakki和Rafalski,Discovery and application of single nucleotide polymorphism markers in plants[单核苷酸多态性标记在植物中的发现和应用],在PLANT GENOTYPING:THE DNAFINGERPRINTING OF PLANTS[植物基因分型:植物DNA指纹分析],CABI出版社,瓦林福德(Wallingford)(2001)。大范围的可商购的技术利用这些和其他方法询问SNP,包括Masscode SupTM/Sup(凯杰公司(Qiagen),日耳曼敦市,马里兰州)、(好乐杰公司(Hologic),麦迪逊,威斯康星州)、(应用生物系统公司(Applied Biosystems),福斯特城(Foster City),加利福尼亚州)、(应用生物系统公司,福斯特城,加利福尼亚州)和Beadarrays SupTM/Sup(亿明达公司(Illumina),圣地亚哥,加利福尼亚州)。
在一些实施例中,测定(例如,通常为两步等位基因鉴别测定或类似测定)、KASPSupTM/Sup测定(通常是以下定义的一步等位基因鉴别测定或类似测定)、或两者均可用于鉴定与增加的病原体抗性相关联的SNP。在示例性两步测定中,采用了正向引物、反向引物、以及在SNP位点处识别两个不同的等位基因(或杂交寡核苷酸)的两种测定探针。将正向和反向引物用于扩增包含与增加的病原体抗性相关联的SNP的遗传基因座。然后,在SNP位置处存在的特定核苷酸是使用探针测定的。在一些实施例中,设计测定探针和反应条件使得测定探针将仅与100%完全匹配的序列的反向互补物杂交,从而允许基于杂交的检测来鉴定存在的哪种或哪些等位基因。在一些实施例中,将探针例如用荧光团进行差异标记,以便在单个反应中区分两个测定探针。扩增的示例性方法包括采用聚合酶链式反应(PCR)或连接酶链式反应(LCR),使用分离自大豆植物或种质的核酸作为PCR或LCR中的模板。
在一些实施例中,可以使用序列内或跨连锁序列的许多SNP等位基因一起来描述任何特定的基因型的单倍型。Ching等人,BMC Genet.[BMC遗传学]3:19(2002)(14页);Gupta等人,(2001)Curr Sci.[当代科学]80:524-535,Rafalski,Plant Sci[植物科学]162:329-333(2002)。在一些情况下,单倍型可以比单个SNP更具信息性,并且可以更详细地描述任何特定的基因型。例如,对于特定的疾病抗性品系或品种,单个SNP可以是等位基因“T”,但等位基因“T”也可以出现在用于轮回亲本的大豆育种群体中。在这种情况下,连锁SNP的等位基因的组合可以更具信息性。一旦将独特的单倍型分配给供体染色体区域,该单倍型可以用于该群体或其任何亚群中以确定个体是否具有特定的基因。使用本领域普通技术人员已知的自动化高通量标记检测平台使得该方法高效且有效。
这些SNP标记可用于标记辅助育种程序,以将性状(例如天然性状或转基因赋予的性状或基因组编辑赋予的性状)转移到期望的植物背景中。如本文所用,术语“天然性状”是指种质中已经存在的性状,包括作物物种的野生近缘种,或可以通过现有性状的重组产生的性状。例如,可以对来自基因组中包含编码SEQ ID NO:1、2-4、11或12的核酸序列的供体大豆植物与不包含所述核酸序列的受体大豆植物之间的杂交的子代植物进行筛选以检测与增加的病原体抗性特征相关联的标记的存在。可以选择包含所述标记的植物,并验证其与对照植物相比增加的病原体抗性。在本发明的实施例中,可以使用表1和/或2的“有利”SNP标记的任何组合来鉴定、检测、或选择基因组中包含编码SEQ ID NO:1、2-4、11或12的核酸序列的植物。
本文还提供了可以用于将如本披露所述的多核苷酸序列引入受体植物中或者在植物中检测如本披露所述的多核苷酸序列的试剂盒和引物。
在一些实施例中,试剂盒还可以包含具有与以下对应或互补的序列的一个或多个探针:与转基因事件或基因编辑事件的特定区域具有80%至100%序列同一性的序列。在一些实施例中,试剂盒可以包括执行测定或检测方法所需的任何试剂和材料。
在实施例中,基于分子标记的测定可以用于选择针对繁殖的亲本品系并且还可以用于选择子代植物。在示例实施例中,这样的基于标记的测定可以使用表1和/或2中SNP标记中的任一个以鉴定具有与增加的病原体抗性性状相关联的“有利”等位基因的植物。在实施例中,基于引物的测定可以用于检测包含本发明的新颖的R-基因的扩增子的存在。在示例实施例中,这样的基于引物的测定可以使用SEQ ID NO:8-9的引物对或表6中列出的引物对中的任一个。此外,探针可以用于检测扩增子的存在,例如使用表6中列出的任何探针或SEQ ID NO:10的探针。
在一些实施例中,植物细胞、种子、或植物部分或收获产物可以从如上所产生的植物中获得,并且植物细胞、种子、或植物部分可以使用上文披露的方法进行筛选,用于证明多核苷酸的稳定掺入。术语“稳定掺入”是指将核酸序列整合到植物的基因组中并且所述核酸序列能够由其子代遗传。如本文所用,术语“植物部分”指示植物的一部分,包括单细胞和细胞组织(例如植物中完整的植物细胞)、细胞团块和可以再生植物的组织培养物。植物部分的实例包括但不限于来自以下的单细胞和组织:花粉、胚珠、接合子、叶、胚、根、根尖、花药、花、花器部分、果实、茎、芽、插条和种子;以及花粉、胚珠、卵细胞、接合子、叶、胚、根、根尖、花药、花、花器部分、果实、茎、芽、插条、接穗、根茎、种子、原生质体、愈伤组织等。
在一些实施例中,植物产物可以从上文披露的植物中收获,并且加工以产生加工产物,例如面粉、大豆粗粉、油、淀粉等。这些加工产物也在本发明的范围内,条件是它们包含本文披露的多核苷酸或多肽或其变体。其他大豆植物产物包括但不限于蛋白质浓缩物、蛋白质分离物、大豆皮、粗粉、花、油和整个大豆本身。
疾病抗性大豆种子
本发明提供了疾病抗性大豆种子。如上所述,本发明的方法可用于鉴定、产生和/或选择疾病抗性大豆种子。除了上述方法,疾病抗性大豆种子可以通过任何方法产生,借这些方法将R-基因引入大豆种子中,这些方法包括但不限于转化、原生质体转化或融合、双单倍体技术、胚拯救、基因编辑(例如CRISPR或TALEN或大范围核酸酶),和/或通过任何其他核酸转移系统产生。
在一些实施例中,疾病抗性大豆种子包含非天然存在的大豆品种。在一些实施例中,大豆种子与优良大豆品种的基因组具有至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性。
疾病抗性大豆种子可以由通过本发明的方法鉴定、产生或选择的疾病抗性大豆植物产生。
本发明的疾病抗性大豆种子可以包含来自本发明的一个或多个新颖的R-基因、通过使用其选择或通过使用其产生。
产生病原体抗性增加的植物品种的方法
本文提供了产生病原体抗性增加的植物的方法,通过引入编码本文提供的多肽的核酸序列来进行。可以通过多种方式将核酸序列引入植物细胞,例如通过转化、通过基因组修饰技术(例如通过基因组编辑)或通过育种。在一个方面,可以通过将编码上文披露的多肽的核酸序列转化至受体植物中来产生植物。在一个方面,该方法可以包括编辑受体植物的基因组,使得所得植物包含编码上文披露的多肽的多核苷酸。在又另一方面,该方法可以包括在受体植物中增加上述蛋白质的表达水平和/或活性,例如通过增强启动子活性或用更强的启动子替换内源启动子进行。在另一方面,该方法可以包括用受体植物育种包含如上所述的多核苷酸的供体植物以及选择将多核苷酸掺入受体植物基因组中。
在一些实施例中,该方法包括将本文披露的多核苷酸或其活性变体或片段转化至受体植物中以获得转基因植物,并且所述转基因植物具有增加的病原体抗性。包含编码如上所述的多肽的多核苷酸的表达盒可用于转化目的植物。
如本文所用,术语“转基因”及其语法变体是指其中异源核酸被整合到基因组中的植物,包括衍生自植物的任何部分,例如细胞、组织或器官。在特定实施例中,异源核酸是包含一个或多个核酸的重组构建体、载体或表达盒。在其他实施例中,转基因植物通过基因工程方法(例如土壤杆菌转化)产生。通过基因技术,将异源核酸稳定整合到染色体中,使下一代也可以是转基因的。如本文所用,“转基因”及其语法变体还包括生物处理,其包括植物杂交和/或自然重组。
转化产生转化的植物,包括全株植物以及植物器官(例如叶、茎、根等)、种子、植物细胞、繁殖体、及其胚和子代。植物细胞可以是分化的或未分化的(例如愈伤组织、悬浮培养细胞、原生质体、叶细胞、根细胞、韧皮部细胞、花粉)。转化可以使得核酸稳定或瞬时掺入到细胞中。“稳定转化”旨在意指被引入宿主细胞中的核苷酸构建体整合到宿主细胞的基因组中并且能够被其子代遗传。“瞬时转化”旨在意指将多核苷酸引入宿主细胞中并且它不整合到该宿主细胞的基因组中。
用于转化的方法典型地涉及将核苷酸构建体引入到植物中。在一些实施例中,转化方法是土壤杆菌介导的转化。在一些实施例中,转化方法是基因枪介导的转化。转化还可以通过以下方式进行:感染、转染、微量注射、电穿孔、微喷射(microprojection)、基因枪或粒子轰击、电穿孔、二氧化硅/碳纤维、超声介导、PEG介导、磷酸钙共沉淀、聚阳离子DMSO技术、DEAE葡聚糖程序、土壤杆菌和病毒介导(例如,花椰菜病毒、双生病毒、RNA植物病毒)、脂质体介导等。
转化方案以及将多肽或多核苷酸序列引入植物中的方案,可根据要靶向转化的植物或者植物细胞的类型(即单子叶植物或者双子叶植物)而变化。用于转化的方法是本领域已知的,并且包括以下中所示的那些:美国专利号8,575,425;7,692,068;8,802,934;和7,541,517;其各自通过引用并入本文。还参见,Rakoczy-Trojanowska,M.(2002)Cell MolBiol Lett.[细胞分子生物学快报]7:849-858;Jones等人(2005)Plant Methods[植物方法],第1卷,第5篇;Rivera等人(2012)Physics of Life Reviews[生命物理学评论]9:308-345;Bartlett等人(2008)Plant Methods[植物方法]4:1-12;Bates,G.W.(1999)Methodsin Molecular Biology[分子生物学方法]111:359-366;Binns和Thomashow(1988)AnnualReviews in Microbiology[微生物学年度评论]42:57Sup'/Sup5-606;Christou,P.(1992)The Plant Journal[植物杂志]2:275-281;Christou,P.(1995)Euphytica[荷兰植物育种杂志]85:13-27;Tzfira等人(2004)TRENDS in Genetics[遗传学趋势]20:375-383;Yao等人(2006)Journal of Experimental Botany[实验植物学杂志]57:3737-3746;Zupan和Zambryski(1995)Plant Physiology[植物生理学]107:
转化叶绿体的方法是本领域已知的。参见,例如,Svab等人(1990)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]87(21):8526-8530;Svab和Maliga(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90(3):913-917;Staub和Maliga(1993)EMBO J.[欧洲分子生物学组织杂志]12(2):601-606。该方法依赖于粒子枪递送含有选择性标记的DNA,且通过同源重组将DNA靶向定位到质体基因组中。另外,通过对核编码的、质体定位RNA聚合酶的组织偏好型表达,实现沉默质体载行转基因的反式激活,可以完成质体转化。McBride等人(1994)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]91(15):7301-7305已经报道了这样的系统。
可依据常规方式将已转化的细胞培养成植物。参见例如,McCormick等人(1986)Plant Cell Reports[植物细胞报告]5:81-84。然后可以培育这些植物,并用相同的经转化株系或者不同的株系授粉,并鉴定出具有期望的表型特征的组成型表达的所得杂交体。可以培育两代或更多代,以确保期望的表型特征的表达稳定地保持并遗传,并且然后收获种子以确保已经实现了期望的表型特征的表达。以这种方式,本发明提供了转化种子(也称为“转基因种子”),该转化种子具有可稳定地掺入到它们的基因组中的本发明的核苷酸构建体,例如本发明的表达盒。
在一些实施例中,该方法包括使包含编码本文披露的多肽的多核苷酸的供体植物与受体植物杂交,并且多肽能够在受体植物中赋予增加的病原体抗性。如本文所用,术语“杂交”和“育种”是指配子融合以产生子代(例如,通过受精,如在植物中通过授粉产生种子)。在一些实施例中,“杂交”、“育种”或“异体受精”是一个个体被另一个体受精(例如,植物中的异花授粉)。本文披露的植物可以是全株植物,或者可以是植物细胞、种子或组织,或植物部分,例如叶、茎、花粉或可培养成全株植物的细胞。
在一些实施例中,通过本文称为“回交”的方法使通过杂交或育种方法产生的子代植物反复与其亲本之一回交。在回交方案中,“供体”亲本是指具有待基因渗入的期望的基因或基因座的亲本植物。“受体”亲本(使用一次或多次)或“轮回”亲本(使用两次或更多次)是指基因或基因座被基因渗入其中的亲本植物。例如,参见Ragot,M.等人Marker-assistedBackcrossing:A Practical Example[标记辅助回交:实践实例],Techniques etUtilisations des Marqueurs Moleculaires Les Colloques,第72卷,第45-56页(1995);和Openshaw等人,Marker-assisted Selection in Backcross Breeding[回交育种中的标记辅助选择],Proceedings of the Symposium“Analysis of Molecular Marker Data”[专题讨论会会议记录“分子标记数据分析”],第41-43页(1994)。初始杂交产生F1代。术语“BC1”是指第二次使用轮回亲本,“BC2”是指第三次使用轮回亲本,以此类推。
在一些实施例中,供体大豆植物是大豆植物。在一些实施例中,供体大豆植物是野生大豆植物。在一些实施例中,受体大豆植物是优良大豆植物或优良野生大豆植物。
在一些实施例中,本文提供的多核苷酸序列可以在受体植物细胞的基因组内靶向特定位点。这样的方法包括但不限于针对目的植物基因组序列CRISPR-Cas9设计的大范围核酸酶、TALEN和用于精确编辑基因组的其他技术(Feng等人Cell Research[细胞研究]23:1229-1232,2013,WO 2013/026740);Cre-lox位点特异性重组;FLP-FRT重组(Li等人(2009)Plant Physiol[植物生理学]151:1087-1095);Bxbl介导的整合(Yau等人Plant J[植物杂志](2011)701:147-166);锌指介导的整合(Wright等人(2005)Plant J[植物杂志]44:693-705;Cai等人(2009)Plant Mol Biol[植物分子生物学]69:699-709);以及同源重组(Lieberman-Lazarovich和Levy(2011)Methods Mol Biol[分子生物学方法]:51-65);引物编辑和转座酶(Anzalone,A.等人,Nat Biotechnol.[自然生物技术]2020年7月;38(7):824-844);易位;和倒位。
本文所述的方法的各种实施例使用基因编辑。在一些实施例中,基因编辑用于诱变植物的基因组以产生具有能够赋予增加的病原体抗性的多肽中的一个或多个的植物。
在一些实施例中,本文提供了用如上所述的基因编辑机制转化并对其表达的植物,这些植物当与靶植物杂交时,使得在靶植物中发生基因编辑。通常,基因编辑可能涉及基因编辑组分或系统的瞬时、诱导型或组成型表达。基因编辑可能涉及基因编辑组分或系统的基因组整合或游离体存在。
基因编辑通常是指使用定点核酸酶(包括但不限于CRISPR/Cas、锌指、大范围核酸酶等)在期望的位置处剪短核苷酸序列。这可能导致插入/缺失(“indel”)突变(即,“SDN1”)、碱基编辑(即,“SDN2”)或等位基因插入或替代(即,“SDN3”)。SDN2或SDN3基因编辑可以包括提供一个或多个重组模板(例如,在载体中),该模板包含可用于植物内同源定向修复(HDR)的目的基因序列(即,待引入到植物基因组中)。在一些实施例中,目的基因或等位基因是能够赋予植物改善的性状(例如,增加的病原体抗性、增加的ASR抗性等)的基因或等位基因。可以将重组模板引入到植物中,利用包含重组模板的供体植物通过转化或通过育种进行编辑。可以将植物基因组中的断裂引入到靶序列的内部、上游和/或下游。在一些实施例中,在靶序列基因座内部或附近产生双链DNA断裂。在一些实施例中,在靶序列基因座的上游和下游产生断裂,这可以导致其从基因组中切除。在一些实施例中,在靶序列内部、上游和/或下游产生一个或多个单链DNA断裂(切口)(例如,使用切口酶Cas9变体)。这些DNA断裂中的任一个以及经由本领域技术人员已知的其他方法引入的那些DNA断裂都可以诱导HDR。通过HDR,靶序列被所提供的重组模板的序列替代,该重组模板包含目的多核苷酸,例如SEQ ID NO:2-4、11、12,或者可以在模板上/作为模板提供编码具有SEQ ID NO:5序列的多肽的多核苷酸。通过设计该系统,使得一个或多个单链或双链断裂被引入到不包含目的基因序列的植物基因组中相应区域的内部、上游和/或下游,该区域可以用模板替代。在一些实施例中,目的多核苷酸可操作地连接至启动子,并且由启动子控制的目的多核苷酸的表达赋予植物增加的病原体抗性。在一些实施例中,启动子是天然启动子或其活性变体或片段,如上所述。在一些实施例中,天然启动子包含SEQ ID NO:15。
在一些实施例中,可以在不使用重组模板的情况下经由靶向引入DNA双链断裂来产生本文所述的目的基因中的突变。这样的断裂可以通过非同源末端连接(NHEJ)过程进行修复,这可能导致在修复位点产生小的插入或缺失(indel)。这样的indel可能导致移码突变,从而引起靶向基因中过早终止密码子或其他类型的功能丧失突变。
在一些实施例中,基因编辑可能涉及靶植物中基因编辑组分或系统的瞬时、诱导型或组成型表达。基因编辑还可能涉及靶植物中基因编辑组分或系统的基因组整合或游离体存在。
在某些实施例中,核酸修饰或突变由(经修饰的)锌指核酸酶(ZFN)系统实现。ZFN系统使用人工限制性内切酶,该人工限制性内切酶通过将锌指DNA结合结构域与DNA切割结构域融合而生成,该DNA切割结构域可以被工程化以靶向期望的DNA序列。使用ZFN进行基因组编辑的示例性方法可以在例如以下中发现:美国专利号6,534,261;6,607,882;6,746,838;6,794,136;6,824,978;6,866,997;6,933,113;和6,979,539。
在某些实施例中,核酸修饰由(经修饰的)大范围核酸酶实现,大范围核酸酶是脱氧核糖核酸内切酶,其特征在于大的识别位点(12至40个碱基对的双链DNA序列)。使用大范围核酸酶的示例性方法可以在美国专利号:8,163,514;8,133,697;8,021,867;8,119,361;8,119,381;8,124,369;和8,129,134中找到,这些文献特别地通过引用并入。
在某些实施例中,核酸修饰由(经修饰的)CRISPR/Cas复合物或系统实现。在某些实施例中,CRISPR/Cas系统或复合物是2类CRISPR/Cas系统。在某些实施例中,所述CRISPR/Cas系统或复合物是II型、V型或VI型CRISPR/Cas系统或复合物。CRISPR/Cas系统不需要生成定制的蛋白质来靶向特定序列,而是可以通过RNA指导序列(gRNA)对单一Cas蛋白进行编程以识别特定的核酸靶标,换句话说,可以使用所述短RNA指导序列将Cas酶蛋白募集到目的特定核酸靶标基因座(该基因座可能包含RNA和/或DNA或由其组成)。
通常,CRISPR/Cas或CRISPR系统如本文上述文献所用,统指涉及CRISPR相关(“Cas”)基因的表达或指导其活性的转录物和其他元件,包括编码Cas基因的序列以及以下中的一个或多个:tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr-配对序列(在内源CRISPR系统的上下文中包含“直接重复序列”和tracrRNA处理的部分直接重复序列)、指导序列(在内源CRISPR系统的上下文中也称为“间隔子”)、或一种或多种如本文中使用的术语“RNA”(例如,用于指导Cas例如Cas9的一种或多种RNA,例如CRISPRRNA以及在适用的情况下的反式激活(tracr)RNA或单指导RNA(sgRNA)(嵌合RNA))或来自CRISPR基因座的其他序列和转录物。通常,CRISPR系统特征在于在靶序列的位点处促进CRISPR复合物形成的元件(在内源CRISPR系统的上下文中也称为原型间隔子)。在形成CRISPR复合物的情况下,“靶序列”是指指导序列被设计为与其具有互补性的序列,其中靶序列与指导序列之间的杂交促进CRISPR复合物的形成。靶序列可以包含任何多核苷酸,例如DNA或RNA多核苷酸。
在某些实施例中,gRNA是嵌合指导RNA或单一指导RNA(sgRNA)。在某些实施例中,gRNA包含指导序列和tracr配对序列(或直接重复序列)。在某些实施例中,gRNA包含指导序列、tracr配对序列(或直接重复序列)和tracr序列。在某些实施例中,如本文所述的CRISPR/Cas系统或复合物不包含和/或不依赖于tracr序列的存在(例如,如果Cas蛋白是Cas12a)。
如本文提及的Cas蛋白,例如但不限于Cas9、Cas12a(以前称为Cpf1)、Cas12b(以前称为C2c1)、Cas13a(以前称为C2c2)、C2c3、Cas13b蛋白,可源自任何合适的来源,因此可以包括来自多种(原核)生物体的不同直系同源物,如在本领域中被充分记载的。在某些实施例中,Cas蛋白是(经修饰的)Cas9,优选(经修饰的)金黄色葡萄球菌Cas9(SaCas9)或(经修饰的)化脓性链球菌Cas9(SpCas9)。在某些实施例中,Cas蛋白是Cas12a,任选地来自氨基酸球菌属物种,例如氨基酸球菌属物种BV3L6 Cpf1(AsCas12a),或毛螺菌科细菌Cas12a,例如毛螺菌科细菌MA2020或毛螺菌科细菌MD2006(LBCas12a)。参见美国专利号10,669,540,通过引用以其全文并入本文。可替代地,Cas12a蛋白可以来自牛眼莫拉菌(Moraxellabovoculi)AAX08_00205(Mb2Cas12a)或牛眼莫拉菌AAX11_00205(Mb3Cas12a)。参见,WO2017/189308,通过引用以其全文并入本文。在某些实施例中,Cas蛋白是(经修饰的)C2c2,优选瓦氏纤毛菌(Leptotrichia wadei)C2c2(LwC2c2)或纽约李斯特菌(Listerianewyorkensis)FSL M6-0635 C2c2(LbFSLC2c2)。在某些实施例中,(经修饰的)Cas蛋白是C2c1。在某些实施例中,(经修饰的)Cas蛋白是C2c3。在某些实施例中,(经修饰的)Cas蛋白是Cas13b。本领域技术人员可以获得其他Cas酶。
基因编辑方法和组合物也披露于美国专利号10,519,456和10,285,348 82中,其全部内容通过引用并入本文。
引入植物中的基因编辑机制(例如,DNA修饰酶)可以由能够驱动重组基因在植物中表达的任何启动子控制。在一些实施例中,启动子是组成型启动子。在一些实施例中,启动子是组织特异性启动子,例如花粉特异性启动子或精细胞特异性启动子,接合子特异性启动子,或在精子、卵子和接合子中高度表达的启动子(例如,prOsActin1)。合适的启动子披露于美国专利号10,519,456中,其全部内容通过引用并入本文。
在另一个方面,本文提供了编辑植物基因组DNA的方法。在一些实施例中,该方法包括使用表达DNA修饰酶和至少一种任选的如上所述的指导核酸的第一大豆植物来对包含待编辑的基因组DNA的靶植物进行授粉。
本文提供的各种多核苷酸及其变体可以与编码期望的性状的一个或多个多核苷酸叠加,例如赋予例如,昆虫、疾病或除草剂抗性或其他期望的目的农艺性状的多核苷酸,这些农艺性状包括但不限于与以下相关联的性状:高油含量;高蛋白含量;提高的消化率;平衡的氨基酸含量;以及高能量含量。这样的性状可以是指种子和非种子植物组织的特性,或由具有这样的性状的植物或种子制备的食物或饲料的特性。
如本文所用,基因或性状“叠加”是将期望的基因或性状组合成转基因植物品系。作为一种方法,植物育种家通过亲本(每个亲本均具有期望的性状)之间进行杂交然后鉴定具有这两种期望的性状的后代来叠加转基因性状(所称的“育种叠加”)。叠加基因的另一种方式是在转化的同时将两个或更多个基因转移至植物的细胞核中。叠加基因的另一种方式是通过用另一个目的基因重新转化转基因植物。例如,基因叠加可用于组合两个不同的昆虫抗性性状,即昆虫抗性性状和疾病抗性性状,或除草剂抗性性状(比如Bt11)。除了目的基因外还使用选择性标记也被认为是基因叠加。
在一些实施例中,本披露的核酸分子或载体可以包括用于农艺性状的一种或多种目的多肽或双链RNA分子(dsRNA)的另外的编码序列,这些农艺性状的主要受益者是种子公司、栽培者或谷物加工者。目的多肽可以是由目的核苷酸序列编码的任何多肽。适用于在植物中生产的目的多肽的非限制性实例包括产生农艺学重要性状的那些多肽,这些性状如除草剂抗性(有时也称为“除草剂耐受性”)、病毒抗性、细菌病原体抗性、昆虫抗性、线虫抗性、或真菌抗性。参见,例如美国专利号5,569,823;5,304,730;5,495,071;6,329,504;和6,337,431。多肽还可以是提高植物活力或产量(包括允许植物在不同的温度、土壤条件以及日光和沉淀水平下生长的性状)的性状、或是允许对展现目的性状的植物进行鉴定的性状(例如,选择性标记、种皮颜色、相对成熟度组等)。不同的目的多肽以及将这些多肽引入植物的方法描述于例如美国专利号4,761,373;4,769,061;4,810,648;4,940,835;4,975,374;5,013,659;5,162,602;5,276,268;5,304,730;5,495,071;5,554,798;5,561,236;5,569,823;5,767,366;5,879,903;5,928,937;6,084,155;6,329,504和6,337,431;以及美国专利公开号2001/0016956中。
赋予对抑制生长点或分生组织的除草剂(如咪唑啉酮或磺酰脲)的抗性/耐受性的多核苷酸也可以适用于一些实施例中。对于突变型ALS和AHAS酶在这一分类号中的示例性多核苷酸如描述于例如,美国专利号5,767,366和5,928,937中。美国专利号4,761,373和5,013,659涉及抗不同的咪唑啉酮或磺酰脲除草剂的植物。美国专利号4,975,374涉及含有如下核酸的植物细胞和植物,该核酸编码突变型谷氨酰胺合成酶(GS),该突变型谷氨酰胺合成酶抗已知抑制GS的除草剂(例如,膦丝菌素和甲硫氨酸磺基肟(methioninesulfoximine))的抑制作用。美国专利号5,162,602披露了抗环己二酮和芳氧苯氧丙酸除草剂的抑制作用的植物。该抗性由改变的乙酰辅酶A羧化酶(ACCase)赋予。
赋予对草甘膦抗性的、由核苷酸序列编码的多肽也适用于本披露。参见,例如,美国专利号4,940,835和美国专利号4,769,061。美国专利号5,554,798披露了抗草甘膦的转基因玉蜀黍植物,该抗性由改变的5-烯醇丙酮莽草酸-3-磷酸(EPSP)合酶基因赋予。
编码对磷酰基化合物(如草铵膦或膦丝菌素、以及吡啶氧丙酸或苯氧丙酸以及环己酮)的抗性的多核苷酸也是适合的。参见,欧洲专利申请号0 242 246。还参见美国专利号5,879,903、5,276,268和5,561,236。
其他合适的多核苷酸包括编码对抑制光合作用的除草剂(如三嗪和苯基氰(腈水解酶))的抗性的那些,参见美国专利号4,810,648。编码用于除草剂抗性的另外的适合的多核苷酸包括编码对2,2-二氯丙酸、烯禾啶、吡氟氯禾灵、咪唑啉酮除草剂、磺酰脲除草剂、三唑并嘧啶除草剂、均三嗪除草剂以及溴草腈的抗性的那些。以下多核苷酸也是合适的:这些多核苷酸赋予原卟啉原氧化酶抗性或提供增强的植物病害抗性;增强对不利环境条件(非生物胁迫)的耐受性,包括但不限于干旱、过冷、过热或土壤盐分过高或极端的酸度或碱度;和植物结构或发育的改变,包括发育时间的变化。参见,例如,美国专利公开号2001/0016956和美国专利号6,084,155。
另外的合适的多核苷酸包括对杀昆虫多肽进行编码的那些。这些多肽可以按足以控制例如昆虫有害生物的量(即,昆虫控制量)进行生产。应当认识到在植物中对控制昆虫或其他有害生物必要的杀昆虫多肽的生产量可以变化,这取决于栽培品种、有害生物的类型、环境因素等。可用于另外的昆虫或有害生物抗性的多核苷酸包括例如编码芽孢杆菌属(Bacillus)生物中鉴定到的毒素的那些。已经克隆了包含编码来自几个亚种的苏云金芽孢杆菌(Bt)Cry蛋白的核苷酸序列的多核苷酸,并且已经发现这些重组克隆对鳞翅目、双翅目和/或鞘翅目昆虫幼虫是有毒的。这样的Bt杀昆虫蛋白的实例包括如下Cry蛋白,例如Cry1Aa、Cry1Ab、Cry1Ac、Cry1B、Cry1C、Cry1D、Cry1Ea、Cry1Fa、Cry3A、Cry9A、Cry9B、Cry9C等,以及营养期杀昆虫蛋白例如Vip1、Vip2、Vip3等。Bt衍生的蛋白的完整清单可以在万维网在苏塞克斯大学(University of Sussex)维护的苏云金芽孢杆菌毒素命名法数据库中找到(还参见,Crickmore等人(1998)Microbiol.Mol.Biol.Rev.[微生物分子生物学综述]62:807-813)。
在实施例中,另外的多肽是衍生自非Bt来源的杀昆虫多肽,包括但不限于:α淀粉酶、过氧化物酶、胆固醇氧化酶、马铃薯糖蛋白、蛋白酶、蛋白酶抑制剂、脲酶、α-淀粉酶抑制剂、成孔蛋白、几丁质酶、凝集素、工程化抗体或抗体片段、蜡样芽孢杆菌杀昆虫蛋白、致病杆菌属物种(如嗜线虫致病杆菌(X.nematophila)或伯氏致病杆菌(X.bovienii))杀昆虫蛋白、发光杆菌属物种(如发光杆菌(P.luminescens)或P.asymobiotica)杀昆虫蛋白、短芽胞杆菌属物种(如侧孢短芽孢杆菌(B.laterosporous))杀昆虫蛋白、赖氨酸芽胞杆菌属物种(Lysinibacillus spp.)(如球形赖氨酸芽孢杆菌(L.Sphearicus))杀昆虫蛋白、色杆菌属物种(如C.subtsugae或C.piscinae)杀昆虫蛋白、耶尔森菌属物种(如耶尔森噬虫霉(Y.entomophaga))杀昆虫蛋白、类芽孢杆菌属物种(如丙型类芽孢杆菌属(P.propylaea))杀昆虫蛋白、梭菌属物种(如双酶梭菌(C.bifermentans))杀昆虫蛋白、假单胞菌属物种(Pseudomonas spp.)(如荧光假单胞菌(P.fluorescens)杀昆虫蛋白和木质素。
适用于在植物中生产的多肽进一步包括改善或通过其他方式有助于收获的植物或植物部分转化成为商业上有用的产品(包括例如增加的或改变的碳水化合物含量或分布、改善的发酵特性、增加的油含量、增加的蛋白质含量、经修饰的油特征、改善的消化率、以及增加的营养成分含量(例如,增加的植物甾醇含量、增加的生育酚含量、增加的甾烷醇含量或增加的维生素含量))的那些。目的多肽还包括,例如在收获的作物中导致或促成不需要的组分(例如植酸、或降解糖的酶类)的含量降低的那些。“导致(resulting in)”或“促成(contributing to)”是指这种目的多肽可以直接或间接地促成目的性状的存在(例如,通过异源纤维素酶的使用来增加纤维素降解)。
在一些实施例中,该多肽促成了食品或饲料的改善的消化率。木聚糖酶是半纤维素分解酶,这些酶改进了植物细胞壁的分解,这导致动物更好地利用这些植物营养素。这导致了改进的生长率和饲料转化。同样,可以减小含有木聚糖的饲料的粘度。在植物细胞内异源产生木聚糖酶也可以促进木质纤维素转化成工业加工中的可发酵糖。
已经鉴定和表征了来自真菌和细菌微生物的许多木聚糖酶(参见,例如,美国专利号5,437,992;Coughlin等人(1993)“Proceedings of the Second TRICEL Symposium onTrichoderma reesei Cellulases and Other Hydrolases[里氏木霉纤维素酶和其他水解酶的第二届TRICEL研讨会论文集]”埃斯波(Espoo);Souminen和Reinikainen编辑,(1993)Foundation for Biotechnical and Industrial Fermentation Research[生物技术和工业发酵研究基金会]8:125-135;美国专利公开号2005/0208178;以及PCT公开号WO 03/16654)。特别地,已经在里氏木霉中鉴定出三种特定的木聚糖酶(XYL-I、XYL-II和XYL-III)(Tenkanen等人(1992)Enzyme Microb.Technol.[酶与微生物技术]14:566;Torronen等人(1992)Bio/Technology[生物/技术]10:1461;和Xu等人(1998)Appl.Microbiol.Biotechnol.[应用微生物学和生物技术]49:718)。
在其他实施例中,可用于本披露的多肽可以是多糖降解酶。产生这样的酶的本披露的植物对于产生例如用于生物加工的发酵原料会是有用的。在一些实施例中、可用于发酵过程的酶包括α淀粉酶、蛋白酶、支链淀粉酶、异淀粉酶、纤维素酶、半纤维素酶、木聚糖酶、环糊精糖基转移酶、脂肪酶、植酸酶、漆酶、氧化酶、酯酶、角质酶、颗粒淀粉水解酶以及其他葡糖淀粉酶。
多糖降解酶包括:淀粉降解酶如α-淀粉酶(EC 3.2.1.1)、葡糖醛酸糖苷酶(E.C.3.2.1.131);外切-1,4-α-D葡聚糖酶如淀粉葡糖苷酶和葡糖淀粉酶(EC 3.2.1.3)、β-淀粉酶(EC 3.2.1.2)、α-葡糖苷酶(EC 3.2.1.20)和其他外切淀粉酶;淀粉脱支酶,如a)异淀粉酶(EC 3.2.1.68)、支链淀粉酶(EC 3.2.1.41)等;b)纤维素酶如外切-1,4-3-纤维二糖水解酶(EC 3.2.1.91)、外切-1,3-β-D-葡聚糖酶(EC 3.2.1.39)、β-葡糖苷酶(EC3.2.1.21);c)L-阿拉伯糖酶(arabinase)、如内切-1,5-α-L-阿拉伯糖酶(EC 3.2.1.99)、α-阿拉伯糖苷酶(EC 3.2.1.55)等;d)半乳聚糖酶如内切-1,4-β-D-半乳聚糖酶(EC3.2.1.89)、内切-1,3-β-D-半乳聚糖酶(EC 3.2.1.90)、α-半乳糖苷酶(EC 3.2.1.22)、β-半乳糖苷酶(EC 3.2.1.23)等;e)甘露聚糖酶,如内切-1,4-β-D-甘露聚糖酶(EC 3.2.1.78)、β-甘露糖苷酶(EC 3.2.1.25)、α-甘露糖苷酶(EC 3.2.1.24)等;f)木聚糖酶,如内切-1,4-β-木聚糖酶(EC 3.2.1.8)、β-D-木糖苷酶(EC 3.2.1.37)、1,3-β-D-木聚糖酶等;和g)其他酶如α-L-岩藻糖苷酶(EC 3.2.1.51)、α-L-鼠李糖苷酶(EC 3.2.1.40)、果聚糖酶(EC3.2.1.65)、菊粉酶(EC 3.2.1.7)等。在一个实施例中,α-淀粉酶是描述于美国专利号8,093,453(通过引用以其全文并入本文)中的合成α-淀粉酶Amy797E。
可以与本披露一起使用的另外的酶包括蛋白酶,如真菌和细菌蛋白酶。真菌蛋白酶包括但不限于从曲霉属(Aspergillus)、木霉属(Trichoderma)、毛霉属(Mucor)和根霉属(Rhizopus),如黑曲霉(A.niger)、泡盛曲霉(A.awamori)、米曲霉(A.oryzae)和米黑毛霉(M.miehei)获得的那些。在一些实施例中,本披露的多肽可以是纤维二糖水解酶(CBH)(EC3.2.1.91)。在一个实施例中,该纤维二糖水解酶可以是CBH1或CBH2。
对本披露有用的其他酶包括但不限于半纤维素酶,如甘露聚糖酶和阿拉伯呋喃糖苷酶(EC 3.2.1.55);木质素酶;脂肪酶(例如,E.C.3.1.1.3)、葡糖氧化酶、果胶酶、木聚糖酶、转葡糖苷酶、α1,6葡糖苷酶(例如,E.C.3.2.1.20);酯酶,如阿魏酸酯酶(EC 3.1.1.73)和乙酰基木聚糖酯酶(EC 3.1.1.72);以及角质酶(例如E.C.3.1.1.74)。
对本披露有用的双链RNA分子包括但不限于抑制靶昆虫基因的那些。如本文所用,词语“基因抑制”当一起考虑时旨在是指用于减少作为基因转录为mRNA和该mRNA的后续翻译的结果而产生的蛋白质的水平的任何熟知的方法。基因抑制还旨在意指减少从基因或编码序列表达蛋白质,包括转录后基因抑制和转录抑制。转录后基因抑制由从靶向抑制的基因或编码序列转录的mRNA的全部或其一部分与用于抑制的相应双链RNA之间的同源性介导,并且是指在细胞中可供被核糖体结合使用的可获得的mRNA的量的实质且可测量的减少。经转录的RNA可以处于正义方向而发挥作用,称为共抑制,处于反义方向而发挥作用,称为反义抑制,或在两个方向上产生dsRNA而发挥作用,称为RNA干扰(RNAi)。转录抑制由细胞中存在作为基因抑制剂的与启动子DNA序列或其补体展示出实质序列同一性而发挥作用的dsRNA介导,称为启动子反式抑制。针对与性状相关的天然植物基因,基因抑制可以是有效的,例如,以提供具有减少水平的由该天然基因编码的蛋白质或具有增强或减少水平的受影响代谢物的植物。针对植物有害生物中的靶基因,基因抑制也可以是有效的,这些有害生物可以摄取或接触含有基因抑制剂的植物材料,这些基因抑制剂专门设计用于阻抑或抑制一种或多种同源或互补序列在该有害生物的细胞中的表达。靶向抑制的这样的基因可以编码必需蛋白质,其预测功能选自由以下组成的组:肌肉形成、保幼激素形成、保幼激素调节、离子调节和转运、消化酶合成、细胞膜电势的维持、氨基酸生物合成、氨基酸降解、精子形成、外激素(pheromone)合成、外激素感测、触角形成、翼形成、腿形成、发育和分化、卵形成、幼虫成熟、消化酶形成、血淋巴合成、血淋巴维持、神经传递、细胞分裂、能量代谢、呼吸以及凋亡。
本发明的非限制性实施例包括表达时赋予增加的病原体抗性的蛋白质和核酸。在实施例中,多肽选自:(a)具有SEQ ID NO:5中所示的氨基酸序列或其任何部分、以及具有与其附接的异源氨基酸序列的多肽,其中所述多肽或其部分的表达赋予植物增加的病原体抗性;(b)包含SEQ ID NO:5的氨基酸序列、以及具有一个或多个氨基酸残基的取代和/或缺失和/或添加的多肽,其中所述多肽的表达赋予所述植物增加的病原体抗性;(c)与SEQ IDNO:5的氨基酸序列具有超过99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、或超过80%序列同一性的多肽,其中所述多肽在植物中表达时赋予所述植物增加的病原体抗性;或者(d)包含SEQ ID NO:5的氨基酸序列、或如(a)至(c)中的任一个所定义的多肽的融合多肽。在实施例中,核酸分子包含:(a)编码蛋白质的核苷酸序列,该蛋白质具有与SEQ ID NO:5共享至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%序列同一性的氨基酸序列,其中所述核苷酸序列包含与其附接的异源核酸序列,并且该核酸分子的表达赋予植物增加的病原体抗性;(b)编码前述多肽的核苷酸序列;(c)包含SEQ ID NO:2-4和11-12中的任一个的序列的部分(a)的核苷酸序列;或(d)与SEQ ID NO:2-4和11-12中的任一个具有至少超过99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、或超过80%序列同一性的部分(a)的核苷酸序列。
本发明的非限制性实施例包括包含赋予增加的病原体抗性的前述核酸分子和/或表达前述多肽的表达盒、载体和DNA构建体。在实施例中,表达盒包含本发明的前述核酸分子或编码本发明的前述多肽。在表达盒的实施例中,核酸分子可操作地连接至能够指导在植物细胞中表达的启动子。在一些实施例中,启动子是内源启动子。在其他实施例中,启动子是外源启动子。在特别的实施例中,启动子包含SEQ ID NO:13-15中的任一个。在实施例中,载体包含前述核酸分子或表达盒。在实施例中,转基因细胞包含本发明的核酸分子或表达盒。
非限制性实施例包括具有增加的病原体抗性的转基因植物。在实施例中,提供了植物,其基因组中稳定地掺入了可操作地连接至在该植物中具有活性的启动子的核酸序列,其中该核酸序列编码具有以下的多肽:与SEQ ID NO:5具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%序列同一性的氨基酸序列;或SEQ ID NO:5中所示的氨基酸序列,其中所述核酸序列对于该植物是异源的,并且其中该植物与不包含该核酸序列的对照植物相比具有增加的病原体抗性。在植物的实施例中,核酸序列与SEQ IDNO:2-4和11-12中的任一个包含至少85%同一性、至少90%同一性、或至少95%同一性;或者核酸序列是SEQ ID NO:2、3、4、11或12。在植物的实施例中,核酸序列通过转基因表达而引入基因组中。在植物的实施例中,启动子是内源启动子。在特别的实施例中,内源启动子与SEQ ID NO:15包含至少90%、95%、96%、97%、98%、99%、或100%序列同一性。在植物的实施例中,启动子是与SEQ ID NO:13或14包含至少90%、95%、96%、97%、98%、99%、或100%序列同一性的异源启动子。在植物的实施例中,启动子是组成型启动子、诱导型启动子、或组织特异性启动子。在特别的实施例中,植物是双子叶植物,例如大豆植物或优良大豆植物。在其他实施例中,植物是单子叶植物,例如单子叶植物选自由以下组成的组:稻、小麦、玉蜀黍、和甘蔗。在实施例中,植物是农艺学上优良植物,其具有商业上显著的产量和/或商业上易感的活力、结实、可立性、脱粒性、非生物/生物抗性、或除草剂耐受性。在前述植物实施例中的任一个中,植物对以下病原体中的任一个具有增加的抗性:大豆胞囊线虫、细菌性脓疱、根结线虫、大豆灰斑病、疫霉菌、褐茎腐病、线虫、亚洲大豆锈病、黑粉病、二孢白粉菌、菊科白粉菌、小麦白粉菌、瓜类单囊壳、黄瓜白粉菌、终极腐霉菌、葡萄钩丝壳、豌豆球腔菌、稻瘟菌、稻平脐蠕孢、稻瘟菌、立枯丝核菌、大豆疫霉菌、麦二叉蚜、烟粉虱、玉米蚜、网纹野蛞蝓、小蔗螟、麦二叉蚜、桃蚜、核盘菌、菜豆壳球孢菌或北美大豆猝死综合症病菌。在特别的实施例中,植物是与对照植物相比具有增加的抗ASR抗性的大豆植物。
本发明的非限制性实施例进一步包括具有增加的病原体抗性的基因编辑的植物。基因编辑的植物的实施例包括植物,其基因组已经编辑以包含编码与SEQ ID NO:5具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的至少一个多肽的核酸序列,其中所述多肽赋予相对于对照植物的增加的病原体抗性,其中该植物在基因组编辑前不包含所述核酸序列。在植物的实施例中,核酸序列通过SEQ IDNO:1、2、3、4、11和/或12中的任一个所示的核酸序列的基因组编辑而引入所述植物基因组中。在实施例中,基因组编辑包含核酸序列的复制、倒位、启动子修饰、终止子修饰和/或剪接修饰。在特别的实施例中,基因组编辑通过CRISPR、TALEN、大范围核酸酶或通过基因组核酸的修饰来完成。在实施例中,基因编辑的植物是农艺学上优良植物,其具有商业上显著的产量和/或商业上易感的活力、结实、可立性、脱粒性、非生物/生物抗性、或除草剂耐受性。在实施例中,核酸序列可操作地连接至异源启动子,并且其中该异源启动子在植物中具有活性。在特别的实施例中,在植物中具有活性的异源启动子与SEQ ID NO:13和14中的一个具有至少95%序列同一性。在其他实施例中,异源启动子是天然启动子或其活性变体或片段,并且其中任选地该天然启动子与SEQ ID NO:15具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%序列同一性。在特别的实施例中,植物相对于对照植物对亚洲大豆锈病具有增加的抗性。
非限制性实施例进一步包括具有增加的病原体抗性的大豆植物。在实施例中,提供了优良大豆植物,其基因组中具有来自供体大豆属植物的核酸序列,其中该供体大豆属植物是与该优良大豆植物不同的株系,并且其中该核酸序列编码与SEQ ID NO:5具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%序列同一性的至少一个多肽,其中所述多肽赋予优良大豆植物相较于不包含所述核酸序列的对照植物增加的病原体抗性。在实施例中,供体大豆属植物是短绒野大豆植物、或其子代。在特别的实施例中,短绒野大豆植物是短绒野大豆登录品系PI505267或其子代的植物。在另外的实施例中,核酸序列与SEQ ID NO:2-4和11-12中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%序列同一性。在仍其他实施例中,核酸序列与SEQ ID NO:1、或其功能片段具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性,其中该功能片段包含至少10%;至少15%;至少20%;至少25%;至少30%;至少35%;至少40%;至少45%;至少50%;至少55%;至少60%;至少65%;至少70%;至少75%;至少80%;至少85%;至少90%;至少95%;96%、97%、98%、或99%的SEQ ID NO:1,并且赋予增加的病原体抗性。在实施例中,核酸序列包含与增加的ASR抗性相关联的SNP标记,其中所述SNP标记是表1和/或2中有利标记中的任一个。在特别的实施例中,来自供体大豆属植物的核酸序列插入植物的3号染色体中。在实施例中,所述核酸序列通过对应于并包含SEQID NO:1、2-4、和11-12中的任一个的基因组序列的基因组编辑而引入所述植物基因组中,其中该基因组编辑赋予优良植物增强的病原体抗性,并且其中该基因编辑通过CRISPR、TALEN、大范围核酸酶、或通过基因组核酸的修饰进行。在其他实施例中,所述核酸序列通过以下的转基因表达而引入所述植物基因组中:(a)与SEQ ID NO:2-4和11-12中的任一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的核酸序列,(b)编码与SEQ ID NO:5具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽的核酸序列;或(c)编码具有SEQ ID NO:5的序列的多肽的核酸序列;其中所述多肽赋予所述优良大豆植物增强的病原体抗性。在特别的实施例中,所述核酸序列通过使用以下中的一种或多种而渗入所述植物的基因组中:(a)化学诱导的染色体加倍;以及(b)加倍优良大豆品系以获得加倍的大豆植物,然后使所述加倍的植物与衍生自登录品系PI505267或其子代的短绒野大豆植物杂交,如实例3中所述,所述短绒野大豆植物包含所述核酸序列。在实施例中,植物对以下病原体中的任何一个或多个具有增加的抗性:大豆胞囊线虫、细菌性脓疱、根结线虫、大豆灰斑病、疫霉菌、褐茎腐病、线虫、亚洲大豆锈病、黑粉病、二孢白粉菌、菊科白粉菌、小麦白粉菌、瓜类单囊壳、黄瓜白粉菌、终极腐霉菌、葡萄钩丝壳、豌豆球腔菌、稻瘟菌、稻平脐蠕孢、稻瘟菌、立枯丝核菌、大豆疫霉菌、麦二叉蚜、烟粉虱、玉米蚜、网纹野蛞蝓、小蔗螟、麦二叉蚜、桃蚜、核盘菌、菜豆壳球孢菌或北美大豆猝死综合症病菌。在特别的实施例中,植物对亚洲大豆锈病具有增加的抗性。在实施例中,优良大豆植物是农艺学上优良的大豆植物,其具有商业上显著的产量和/或商业上易感的活力、结实、可立性、脱粒性、非生物/生物抗性、或除草剂耐受性。
本发明的非限制性实施例包括具有增加的病原体抗性的植物、植物部分和产物。在实施例中,提供了来自前述植物中的任一个的子代植物,其中该子代植物的基因组中稳定掺入了本发明的核酸序列。在实施例中,提供了衍生自前述植物中的任一个的植物细胞、种子、或植物部分,其中所述植物细胞、种子或植物部分的基因组中稳定掺入了核酸序列。
本发明的非限制性实施例包括产生转基因植物的方法。在实施例中,提供了本发明的前述多肽或核酸分子或表达盒或载体或转基因细胞在赋予抗亚洲大豆锈病(ASR)的增加的抗性中的用途。在特别的实施例中,该方法包括本发明的表达盒在细胞中的用途,其中多肽在细胞中的表达水平和/或活性增加,并且细胞对亚洲大豆锈病的抗性增强。实施例包括改善植物抗ASR抗性的方法,该方法包括增加本发明多肽在植物中的表达水平和/或活性。在实施例中,该增加包括增加本发明的核酸分子在植物中的表达水平和/或活性。在实施例中,增加植物中的表达水平和/或活性通过转基因方式或通过育种来实现。提供了用于产生抗ASR抗性改善的转基因植物的方法的实施例,该方法包括:将本发明的核酸分子或表达盒引入受体植物中以获得转基因植物,其中该转基因植物与受体植物相比具有增加的抗ASR抗性。
非限制性实施例包括产生具有增加的病原体抗性的植物的方法,该方法包括通过育种方法。在实施例中,产生具有增加的病原体抗性的大豆植物的方法包括以下步骤:a)提供供体大豆植物,所述供体大豆植物在其基因组中包含编码与SEQ ID NO:5具有至少90%同一性或95%同一性的至少一个多肽的核酸序列,其中所述核酸序列赋予所述供体大豆植物相较于基因组中不包含所述核酸序列的另一种供体大豆植物增加的病原体抗性;b)使a)的所述供体大豆植物与不包含所述核酸序列的受体大豆植物杂交;以及c)通过在来自b)的杂交的子代植物中检测所述核酸序列的存在、或与所述核酸序列相关联的一个或多个分子标记的存在来选择所述子代植物,从而产生具有增加的病原体抗性的大豆植物。在方法的实施例中,分子标记是单核苷酸多态性(SNP)、数量性状基因座(QTL)、扩增片段长度多态性(AFLP)、随机扩增多态性DNA(RAPD)、限制性片段长度多态性(RFLP)或微卫星。在特别的实施例中,分子标记是选自表1和/或表2的至少一个有利SNP标记,或位于选自表1或表2的有利SNP标记的20cM、10cM、5cM、1cM、或0.5cM内的分子标记。在实施例中,供体大豆植物和受体大豆植物中的一种或多种是优良大豆植物。实施例包括用于产生具有增加的抗ASR抗性的大豆植物的方法,该方法包括以下步骤:提供短绒野大豆植物品系、或其子代,其包含编码与SEQ ID NO:5具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的至少一个多肽的核酸序列;基本上如US 7,842,850所述或转基因地实施胚拯救方法;收集由b)的方法产生的种子;以及将c)的种子再生为植物。在特别的实施例中,短绒野大豆植物品系是登录品系PI505267、或其子代。在实施例中,核酸序列是:与SEQ IDNO:2-4和11-12中的任一个包含至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的核酸序列;或SEQ ID NO:2、3、4、11或12的核酸序列;
实施例包括产生具有增加的抗亚洲大豆锈病(ASR)抗性的大豆植物的方法,该方法包括以下步骤:a)从大豆植物中分离核酸;b)在a)的核酸中检测与包含SEQ ID NO:2-4中的任一个的核酸序列相关联的至少一个分子标记,其中所述核酸序列赋予所述大豆植物增加的ASR抗性;c)基于b)中检测的分子标记的存在,选择大豆植物;以及d)从鉴定为具有与增加的ASR抗性相关联的所述分子标记的c)的植物产生大豆子代植物。在实施例中,分子标记是选自表1或表2的有利SNP标记,或位于选自表1和/或表2的有利SNP标记的20cM、10cM、5cM、1cM、或0.5cM内的分子标记。在实施例中,检测包括扩增分子标记基因座或该分子标记基因座的一部分,并检测所得扩增的分子标记扩增子。在实施例中,扩增包括采用聚合酶链式反应(PCR)或连接酶链式反应(LCR),使用分离自大豆植物或种质的核酸作为PCR或LCR中的模板。在特别的实施例中,扩增进一步包括采用选自包含以下的组的引物对:SEQ ID NO:8-9的引物对;以及来自表6中引物的引物对。在特别的实施例中,检测进一步包括采用选自包含以下的组的核酸探针:SEQ ID NO:10的探针以及来自表6中探针的探针。在实施例中,核酸是DNA或RNA。在实施例中,提供了通过前述方法中的任一种而产生的植物。
非限制性实施例包括赋予植物增加的ASR抗性的方法,该方法包括:a)将可操作地连接至在所述植物中具有活性的启动子的核酸分子引入所述植物的基因组中,其中将所述核酸序列稳定地掺入所述基因组中,其中所述核酸序列编码多肽,所述多肽具有:(i)与SEQID NO:5包含至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列,或(ii)如SEQ ID NO:5所示的氨基酸序列,其中所述核酸序列对该植物是异源的,其中与不表达所述核酸序列的对照植物相比,所述核酸序列的表达增加ASR抗性。在实施例中,核酸序列通过转化而引入植物的基因组中。在其他实施例中,核酸序列通过使包含该核酸序列的供体植物与植物杂交而引入该植物的基因组中以产生具有增加的ASR抗性的子代植物。在特别的实施例中,核酸序列插入3号染色体中。在特别的实施例中,启动子是外源启动子,并且其中任选地该外源启动子包含SEQ ID NO:13或14。在其他实施例中,启动子是内源启动子,并且其中任选地该内源启动子包含SEQ ID NO:15。在实施例中,该方法进一步包括用PCR和/或测序筛选引入的核酸序列。在特别的实施例中,植物是双子叶植物,并且其中该双子叶植物是大豆植物。在其他实施例中,植物是选自由以下组成的组的单子叶植物:稻、小麦、玉蜀黍、和甘蔗。在实施例中,植物通过前述方法中的任一种而产生。
在非限制性实施例中,提供了用于扩增本发明的核酸分子的引物对。在特别的实施例中,引物对是SEQ ID NO:8-9的引物对或选自表6中引物的引物对。在实施例中,提供了诊断ASR抗性的引物,其中所述引物可用于PCR反应以指示与ASR抗性相关联的等位基因的存在,其中所述等位基因是如表1和/或2中描述的任何有利等位基因,并且其中所述引物是选自表6中引物的任何引物。
实例
以下实例不旨在是一个本发明得以实施的所有不同方式或可以加入本发明中的所有特征的详细目录。本领域的技术人员将理解到可以在不偏离本发明的情况下对各种实施例作出众多变化和添加。因此,以下描述旨在说明本发明的一些特别的实施例,并且并没有穷尽地叙述其所有排列、组合和变化。
实例1:ASR抗性野生大豆属品系的鉴定
针对在各种环境中收集的十六种锈病菌株,评估野生大豆属品系的ASR抗性。使用来自USDA-ARS(FL Q09、FL Q12、LABR13、FLQ11)的单个脓疱衍生的分离物和田间群体(FLQ15、NC06、Vero、GLC15、UBL、BR南(BR south)和BR中心(BR central))单个脓疱衍生的分离株生成锈病数据。在封闭的设施中进行筛选。每个野生大豆属品系在多天的感染过程中进行评估,并在不同的时间点进行评级。基于Burdon和Speer(Euphytica[荷兰植物育种杂志],33:891-896,1984;也称为TAG,1984)使用本领域熟知的方法进行评级和评估。使用锈病分离株的大量不同的组,在北美洲和南美洲,将每个目的登录品系筛选>2次,每次约4株植物。基于锈病数据的分析,确定野生短绒野大豆登录品系PI505267是目的ASR抗性野生大豆属品系。
实例2:等位基因挖掘和关联到PI505267ASR基因座
使用Data2Bio的基因组群体分离分析(gBSA)技术(埃姆斯公司(Ames),爱荷华州(IA))进行四倍体大豆群体(PI505267)中的因果基因座的染色体发现。Data2Bio从在两个易感组织库和一个抗性组织库中提取的DNA样品中生成了几个文库,并在八(8)个IlluminaHiSeq2000 2x100 bp配对末端(PE)泳道(圣地亚哥,加利福尼亚州)中对它们进行了测序。对原始数据进行的加工包括质量调整、比对、SNP发现和SNP影响。在各种过滤步骤之后,在PI505267基因组中鉴定出与ASR抗性显著相关联的多个信息性SNP。然后使用贝叶斯(Bayesian)方法计算性状相关联概率。接下来,创建了靠前重叠群(top contig)的性状相关联SNP(概率截止值为0.01)的物理图谱。SNP的聚类指示ASR抗性基因座位于一个特定的支架重叠群0133(SEQ ID NO:1)上或附近,该支架被鉴定并定位到短绒野大豆登录品系PI505267的3号染色体上。将与来自该支架的SNP相关联的背景序列也与公开大豆基因组比对,以产生对定位区间的染色体水平的理解。数据指示一个或多个因果R-基因在3号染色体上可以定位在重叠群0133的9.28到16.48MB的区间内或附近。预期来自该区间的基因编码一种或多种多肽,其可以在植物中转基因表达或被遗传修饰(即经由TALEN或CRISPR编辑的基因)以赋予疾病抗性(例如,亚洲大豆锈病(ASR)抗性)。
在SEQ ID NO:1中与ASR抗性相关联的单核苷酸多态性(SNP)的列表在以下表1和2中提供。通过使ASR抗性品系PI505267与两种不同的易感雌性品系杂交来鉴定和验证SNP。确定了所鉴定的SNP的所有等位基因与抗性或易感性显著相关(p<0.05)。分子标记(例如表1和/或2中有利标记中的任一个)在从植物中分离的核酸中的存在的检测可以用于鉴定或选择具有衍生自ASR抗性短绒野大豆品系的ASR抗性等位基因的植物,例如由于SEQ ID NO:1的染色体区间、或其功能片段(例如包含因果R-基因的SEQ ID NO:1的染色体区间的功能片段)的基因渗入。
表1:衍生自抗性雄性与易感雌性1杂交的SNP的列表。SNP以如下格式列出:(SNPID、相对于参考基因组的SNP位置、有利等位基因、不利等位基因),各自用空格隔开。
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
表2:衍生自抗性雄性与易感雌性1杂交的SNP的列表。SNP以如下格式列出:SNPID、相对于参考基因组的SNP位置、有利等位基因、不利等位基因,各自用空格隔开。
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
实例3:R-基因区间基因渗入到大豆品系中
从野生大豆属物种的基因渗入的已知的方法涉及加倍的F1植物(F1D)。然而,由于产生的不育杂种数量很少,这样的方法往往效率低下。此外,很少有杂种在随后的染色体加倍过程中存活下来,其中不育杂种的染色体通过化学试剂(典型地是秋水仙碱)加倍以使其可育。
在从野生大豆属物种的基因渗入的另一种方法中,如下所述且如图11所示,申请人使用四倍体大豆基因渗入ASR抗性性状。简而言之,使用四倍体大豆进行基因渗入的方法涉及将家养大豆基因组加倍,使其与野生大豆属基因组更兼容和有效杂交。该方法允许高效生产可育杂种,这些杂种可以进一步回交,以将期望的基因和性状从野生大豆属转移到家养和优良大豆品系中,而不需要人工遗传修饰或基因编辑。
加倍的大豆品系(四倍体大豆)由两个ASR易感的大豆优良品系(本文称为雌性1和雌性2(两个先正达公司(Syngenta)专有品系))产生。加倍的易感大豆品系具有2n=40条染色体(G1G1基因组)并且在加倍后呈4n=80的四倍体状态。相比之下,短绒野大豆抗性亲本具有2n=78或40条染色体(分别为D3E1或D基因组)。为了加倍,将在组织培养基中大豆品系的未成熟大豆胚在25℃下用大约0.25-1.0mg/ml秋水仙碱处理3-4天。将再生植物转移到土壤中,并且采集叶片样品进行倍性分析以确认染色体加倍。允许四倍体植物进行自体受精,并且对胚进行倍性分析以确认加倍。通过允许四倍体大豆进行自体受精来产生无限的种子供应。
通过轻轻去除萼片和花瓣以暴露成熟的柱头准备开花前的花芽以用于加倍的雌性品系。通过轻轻去除花瓣以暴露成熟花药并将花粉撒到大豆柱头上来从短绒野大豆(2n=78或40)的刚开放花中获得花粉。杂交示于表3中。
表3:植物杂交
将麦草畏(一种合成生长素除草剂)(FeXapan,科迪华农业科技公司(CortevaAgriscience),威尔明顿,特拉华州)喷洒在四倍体x大豆属杂交上以产生豆荚和胚形成。以3至20mg/L浓度喷洒麦草畏。使用喷雾瓶或雾化器来实现授粉的雌蕊及其附着节点的良好饱和度。
通过将加倍的易感大豆亲本与抗性短绒野大豆亲本杂交生成多个B1胚和B1植株(如果使用标准基因渗入,这些植物将是F1D植株)。然后经由TaqMan测定(应用生物系统公司(Applied Biosystems),沃尔瑟姆,马萨诸塞州)验证杂交。在一个特别的实例中,表4中描述的TaqMan测定用于确认杂种植物中与ASR抗性相关联的染色体区间(即,包含SEQ IDNO:1的区间)的存在。
表4.确认杂种的Taqman数据
本领域熟知给定与给定性状(例如ASR抗性)相关联的序列和SNP等位基因,本领域普通技术人员可以开发寡核苷酸引物并使用所述引物来鉴定携带包含因果基因的在SEQID NO:1中描述的染色体区间、或其功能片段的植物。测定(例如,通常为两步等位基因鉴别测定或类似测定)、KASPTM测定(通常是下文定义的一步等位基因鉴别测定或类似测定)、或两者均可用于测定如本文披露的SNP。在示例性两步测定中,采用正向引物、反向引物、和两个测定探针(或杂交寡核苷酸;本文也称为测定引物或测定探针)(参见在表5-6详述的SEQ ID NO:22-237)。将正向和反向引物用于扩增包含与ASR抗性基因座相关联的SNP的遗传基因座。然后使用测定引物来测定存在于SNP位置的特定核苷酸,这些测定引物在每对中针对存在于SNP位置的核苷酸而彼此不同(尽管注意到在任何给定的对中,引物在它们的5’或3’末端可以不同而不影响它们区分存在于相应SNP位置的核苷酸的能力)。在一些实施例中,将每对测定引物用例如荧光团进行差异标记,以便在单个反应中区分两个测定探针。在一些实施例中,设计测定引物和反应条件使得测定引物将仅与100%完全匹配的序列的反向互补物杂交,从而允许基于杂交的检测来鉴定存在的哪种或哪些等位基因。
表5提供了示例测定ID的列表,其中每个测定ID对应于SEQ ID NO:1所表示的染色体区间内的特定SNP位置。这些测定如所示的旨在区分与给定SNP位置相关联的有利和不利等位基因。
表6提供了表5中列出的每种测定中使用的测定组分的列表和序列。特别地,表6列出了特定正向和反向引物的序列以及用于每种测定的荧光团的序列和组合。在测定组分的列表中,测定组分ID指示相关的测定ID(表5)和组分的性质(无论是探针还是引物)。后缀F2指示相应序列针对正向引物,后缀R1指示相应序列针对正向引物,后缀FM指示相应序列针对具有FAM荧光团的测定探针,并且后缀TT指示相应序列针对具有TET荧光团的测定探针。例如,“S21399A1FM”、“S21399A1TT”、“S21399F2”和“S21399R1”分别是指针对用于鉴定对应于位置10832017处的SNP的等位基因的测定ID S21399的FAM探针、TET探针、正向引物和反向引物。
表5:在SEQ ID NO:1中与抗ASR抗性增加相关联的SNP位置相关联的测定
/>
/>
表6:用于与SEQ ID NO:1内SNP位置相关联的测定的测定组分的序列。后缀“F2”是指正向引物;后缀“R1”是指反向引物。具有常见的前缀的引物可以形成引物对。后缀FM和TT是指探针。
/>
/>
/>
/>
/>
/>
/>
/>
将R基因区间基因渗入大豆中可以可替代地使用胚拯救和化学加倍来实现。其中,首先必须产生大豆和短绒野大豆的不育杂种,这是一个低效的过程,导致不育杂种的数量很少。接下来,必须进行胚拯救并施加化学处理以生成双二倍体芽。如果双二倍体植物是可育的,它们被用来与大豆回交几代,以逐渐消除多年生大豆属染色体。
在一个实例中,进行远缘杂交,其中优良先正达大豆品系(RM 3.7至4.8)用作雌性(花粉受体)并且所列举的短绒野大豆的登录品系用作雄性或花粉供体。接下来,在适当的发育阶段从含有花药的大豆属植物中选择花。新鲜、全开、鲜艳的花朵保持具有成熟花粉的花药。花粉呈现松散的黄色尘状。这些花从大豆属植物中取出并带至大豆植物进行授粉。来自大豆属植物的花粉通常在除花后30分钟内使用。鉴定和选择准备授粉的大豆花芽。当与未成熟的芽相比时,当大豆花芽的尺寸较大时,其通常是可供使用的(ready)。大豆花的萼片颜色较浅,并且花瓣刚刚开始出现。首先,使用一对细尖的镊子小心地从花芽上分离萼片,露出外层花瓣。然后,轻轻地抓住并去除花上的花瓣(总共5片),露出雌蕊周围的雄蕊环。由于在花药开始脱落花粉前1天,柱头受到花粉,因此认识到“雌性可供使用,雄性未能供使用(not ready)”的阶段性发育是很重要的。当在这个发育阶段授粉大豆花时,没有必要去除雌花。接下来,柱头位于大豆花上。然后使用1朵雄花,小心地剥离花瓣以露出花药,并将花粉粒轻轻撒在大豆花的柱头上。在此过程中,随时注意不要损害柱头。在授粉后的第二天开始,将激素混合物喷洒在授粉的花上,并且最终每天发育F1豆荚一次直至收获。授粉的花或豆荚充满了激素混合物的轻雾,注意不要使花/豆荚过早地从植物上脱落。该混合物含有100mg GA3、25mg NAA和5mg激动素/L蒸馏水。这些激素有助于保持豆荚发育和增加的豆荚生长。
在授粉后大约14至16天收获来自远缘杂交的豆荚。在选择单独的豆荚收获之前,确认萼片被去除(表明远缘杂交尝试)并且种子大小与针对远缘杂交预期的一样。收集豆荚并根据远缘杂交组合进行计数以确定杂交成功。平均杂交成功率可能大约为40%。远缘杂交豆荚可以含有1至3个种子,但通常在每个F1荚中发现2个种子。
将收获的豆荚收集并带回实验室进行灭菌。首先用70% EtOH冲洗豆荚2至3分钟,然后在平台振荡器上以大约130RPM将其置于10% Clorox漂白剂中持续另外30分钟。最后,用无菌水冲洗豆荚多次以去除任何残留的漂白剂。在豆荚灭菌后可以立即开始胚分离,或者在胚分离之前豆荚可以在4℃储存长达24小时。接下来,将灭菌的豆荚放入层流净化罩中,在其中可以拯救胚。将个体豆荚置于无菌皮氏培养皿中并使用手术刀和镊子打开。沿着远缘杂交豆荚的长度远离种子做一个切口。然后可以容易地打开豆荚以暴露种子。可替代地,可以使用两对镊子来分离豆荚壳。小心地从豆荚中取出种子,并在解剖显微镜下放入无菌皮氏培养皿中。非常精细的镊子用于将胚与种子分离。用一只手握住镊子,轻轻地将种子的一侧远离胚,使脐朝上。另一只手使用另一对镊子从含有胚的种子一侧去除种皮。胚周围的膜被剥离,并且胚从底部向上推。胚应该经过球状发育阶段,并且优选地经过早期心(heart)发育阶段(中期到晚期心阶段、子叶阶段和早期成熟阶段胚是期望的)。将分离的胚转移至胚拯救培养基。此时可以处理胚以诱导染色体加倍。(有关染色体加倍的详细信息,参见下文。)在24℃下,将分离的胚在胚拯救培养基上保留21至30天。胚可以在胚拯救培养基的整个孵育中保持在黑暗中,可以在黑暗中开始孵育并且在光照下完成,或者可以在光照下进行整个孵育。该方案中没有愈伤组织诱导阶段。芽直接从胚发育而来。
秋水仙碱或氟乐灵(两者,西格玛奥德里奇公司(Sigma-Aldrich),圣路易斯,密苏里州)可以用于诱导染色体加倍。理想地,对晚期心阶段远缘杂交胚(或更大)进行化学处理以在分离长达1周后的任何时间紧接分离进行诱导染色体加倍。双倍剂可以在固体或液体培养基中混合并施用数小时或长达几天。氟乐灵在固体或液体培养基中以10uM-40uM浓度使用。此外,秋水仙碱在固体或液体培养基中以0.4mg/ml-1mg/ml的浓度使用。化学处理后,将胚转移到新鲜胚拯救培养基中。
在24℃的光照下将发育中的胚从拯救培养基转移到萌发培养基,如大豆ER GSMv2(即,3.1g B5基础盐,Gamborg的1ml B5维生素1000×,40g蔗糖[C12H22O11],0.25g酪蛋白水解物,0.25ml BAP,0.75g MgCl2*6H20,20ml谷氨酰胺25mg/ml,0.1g丝氨酸[C3H7NO3],4ml天冬酰胺25mg/ml和0.05ml的IBA 1mg/ml)中持续大约3至5周。可替代地,在24℃的光照下可以将发育中的胚从拯救培养基转移至伸长培养基,如大豆E1 0No TCV(即,4.3g MS基础盐混合物[MSP01],5ml MS铁200×,30g蔗糖[C12H22011],1gMES[C6H13NO4S],8g纯化琼脂,1ml B5维生素100×,2ml谷氨酰胺25mg/ml,0.50ml玉米素核苷,反式异构体1mg/ml,0.1ml IAA 1mg/ml,0.2ml GA3 5mg/ml,1.5ml特美汀100mg/ml,0.3ml头孢噻肟250mg/ml,0.5ml万古霉素100mg/ml)中持续大约3至5周。发育中的芽可以从培养基平板转移到含有萌发或伸长培养基的Phytocons(植物技术实验室(PhytoTechnology Laboratories),雷内克萨,堪萨斯州)中,用于进一步芽发育。将已建立的芽移至土壤中。最初的植物护理对于这些芽的存活至关重要。
使用流式细胞仪进行倍性分析。从培养物中或在土壤中建立后的小芽中收集用于倍性分析的叶组织。将组织在干冰上收集并储存在-80℃直至分析,或在湿冰上收集并在同一天进行分析。0.5cm2的样品尺寸是足够的。根据标准技术制备样品。每个样品组含有未处理的F1植物(未处理以诱导染色体加倍)作为对照。
以上所述的方法实现比文献中报道的显著更高的远缘杂交成功率。此外,雌性花不需要去雄,这节省了时间并降低了对柱头损害的风险。
实例4:鉴定的染色体区间内候选R-基因的鉴定。
短绒野大豆染色体区间(SEQ ID NO:1)的进一步基因分型发现了所披露的区间内3号染色体上的三个潜在的ASR抗性因果基因(本文也称为候选R-基因)。验证了各个候选基因与ASR抗性之间的关联,并且评估了各个基因在赋予ASR抗性方面的功效。
基因之一(本文也称为“GtoRG30”)编码具有TNL基序的R-基因(SEQ ID NO:2-4)。由R-基因编码的多肽的序列在SEQ ID NO:5中描述。该基因的天然启动子在SEQ ID NO:15中提供。关于R-基因的验证和功效的详细信息提供在实例6、8以及图3-5和9-10中。
另外,鉴定了两个其他编码CNL基序的R基因,如SEQ ID NO:6和7所描述。验证了这两种R-基因。
预期本发明的R-基因或其变体、片段、同源物或直系同源物可用于如上所述利用胚拯救、四倍体大豆或其他基因渗入方法的转基因方法、基因编辑方法或育种方法中以产生对包括ASR在内的真菌病原体具有增加的抗性的植物。另外,或任选地,包含本发明的R-基因编码序列(例如,SEQ ID NO:2-4、11-12中的任一个)的核酸分子,或具有与本发明的R-基因编码序列(例如,SEQ ID NO:2-4、11-12)基本上相同的核苷酸序列的核酸分子,或包含编码具有SEQ ID NO:5的氨基酸序列的多肽、或具有与SEQ ID NO:5基本上相同的氨基酸序列的多肽的核苷酸序列的核酸分子用于如上所述利用胚拯救、四倍体大豆或其他基因渗入方法的转基因方法、基因编辑方法或育种方法中以产生病原体抗性(例如,ASR抗性)植物。
鉴于R-基因的序列和相关性状(例如ASR抗性),可以开发寡核苷酸引物,并使用所述引物来鉴定携带具有SEQ ID NO:2-4、11-12中所描述的核苷酸序列的基因的植物。测定(例如,通常为两步等位基因鉴别测定或类似测定)、KASPTM测定(通常是下文定义的一步等位基因鉴别测定或类似测定)、或两者均可用于测定基因。在示例性两步测定中,采用包含正向引物和反向引物的引物对以扩增与赋予ASR抗性相关联的基因、或其功能部分。此外,可以采用测定探针(或杂交寡核苷酸)与引物对一起检测扩增基因中存在的靶序列。探针可以用例如荧光团标记,以便于检测。此外,探针在3′末端处可以包括小沟结合物(MGB)部分,该部分提高探针的熔融温度(Tm)并稳定探针-靶杂交。这样可以缩短探针的长度,同时仍提供序列鉴别和灵活性以适应靶。此外,探针可以包括非荧光淬灭剂(NFQ)以吸收(淬灭)来自探针另一端的荧光染料标记的信号,从而降低背景噪声并提高探针的灵敏度。在一些实施例中,设计测定引物和反应条件使得测定引物将仅与100%完全匹配的序列的反向互补物杂交,从而允许基于杂交的检测来检测基因。
作为非限制性实例,包含SEQ ID NO:2-4、11-12中的任一个的R-基因序列或与SEQID NO:2-4、11-12中的任一个具有至少90%序列同一性、至少95%序列同一性、或至少99%序列同一性的序列的核酸分子;或编码SEQ ID NO:5的蛋白质或编码与SEQ ID NO:5具有至少90%序列同一性、至少95%序列同一性、或至少99%序列同一性的蛋白质的核苷酸序列的存在可以通过使用SEQ ID NO:8-9的引物对产生扩增子来检测并且/或者使用SEQ IDNO:10的探针序列来检测,该探针在5′末端处包含FAM荧光团并且在3′末端处包含MGB和NFQ部分。在一个实例中,R-基因、或其功能部分在疾病抗性植物(例如,ASR抗性大豆植物)中的存在可以通过从所述植物中分离核酸分子并使用上述引物和/或探针产生包含R-基因中的至少一部分的扩增子来鉴定。
在仍另外的实例中,包含SEQ ID NO:2-4、11-12中的任一个的R-基因序列或与SEQID NO:2-4、11-12中的任一个具有至少90%序列同一性、至少95%序列同一性、或至少99%序列同一性的序列的核酸分子或编码SEQ ID NO:5的蛋白质或编码与SEQ ID NO:5具有至少90%序列同一性、至少95%序列同一性、或至少99%序列同一性的蛋白质的核苷酸序列的存在可以通过检测由R-基因编码的R-蛋白的存在来确定。例如,R-基因、或其功能部分在疾病抗性植物(例如,ASR抗性大豆植物)中的存在可以通过以下确定:从所述植物中分离蛋白质并且使用通常已知的蛋白质检测测定(例如,蛋白质印迹、ELISA、放射免疫测定等)检测由R-基因编码的蛋白质(例如具有SEQ ID NO:5或与SEQ ID NO:5具有至少90%序列同一性的多肽序列的蛋白质)的存在。
在仍另外的实例中,包含SEQ ID NO:2-4、11-12中的任一个的R-基因序列或与SEQID NO:2-4、11-12中的任一个具有至少90%序列同一性、至少95%序列同一性、或至少99%序列同一性的序列的核酸分子;或编码SEQ ID NO:5的蛋白质或编码与SEQ ID NO:5具有至少90%序列同一性、至少95%序列同一性、或至少99%序列同一性的蛋白质的核苷酸序列的存在可以通过使用包含选自表5-6中引物的正向引物和反向引物的引物对产生扩增子来检测,并且使用选自表5-6中探针的探针来检测。
实例5:包含R-基因的载体的构建和转化
产生了包含可操作地偶联至异源启动子的R-基因的DNA构建体,特别地载体。载体中使用的R-基因的核苷酸序列包含R-基因(本文也称为“GtoRG30”)的基因组DNA序列或编码序列,并且先前在实例4中描述(SEQ ID NO:2-4、11-12)。DNA构建体包含可操作地连接至能够使R-基因在植物细胞中的表达的异源启动子的R-基因编码序列。在第一组构建体中,R-基因GtoRG30的转录由蒺藜苜蓿启动子prMt12344驱动。在第二组构建体中,R-基因GtoRG30的转录由蒺藜苜蓿启动子prMt51186驱动。在第三组构建体中,R-基因GtoRG30的转录由天然启动子(RG30_启动子)驱动。产生的包含R-基因GtoRG30的二元载体在表7中列出。
表7:使用鉴定的新颖的R-基因产生的构建体
a)包含SEQ ID NO:3的R-基因的25845载体构建体
图1提供了包含SEQ ID NO:3的R-基因的载体25845的示意图。特征描述如下。
载体类型:二元载体
构建体大小(bp):30,982
功能描述:用于在ALS选择情况下的大豆转化的二元载体,其具有编码蛋白质的来自PI_505267(短绒野大豆)的chr3b的大豆锈病抗性候选基因gGtoRG30-02,该蛋白质含有Toll/白细胞介素受体-1(TIR)、核苷酸结合位点(NBS)、和富含亮氨酸重复序列(LRR)结构域。该抗性基因包括其天然5’UTR和3’UTR以及编码序列cGtoRG30-01。第一天然内含子被拟南芥属内含子替代。该抗性基因由蒺藜苜蓿启动子prMt12344-02和相应终止子tMt12344-01驱动。载体还含有ALS选择盒prGmEF-05/cNtALS-01/tGmEPSPS-04。
特征:
oVS1。起点:19359终点:19763。根癌土壤杆菌宿主中的复制起点。
cRepA。起点:18243终点:19316。cRepA-01,其中在nt735处A变为G。
cVirG。起点:17488终点:18213。来自pAD1289的virG(假定),其具有TTG起始密码子。virGN54D来自Hansen等人1994,PNAS[美国国家科学院院刊]91:7603-7607中所述的pAD1289。
prVirG。起点:17283终点:17413。virG启动子(Winans J.Bact.[细菌学杂志]172:2433-38(1990)),其由两个启动子元件组成,一个响应于乙酰丁香酮和磷酸盐饥饿(bp 45至83),另一个响应于中度酸化(86至128)。
cSpec。起点:16400终点:17188。也称为aadA;编码酶氨基糖苷3’腺苷酰转移酶的基因,赋予了对壮观霉素和链霉素的抗性以用于将载体保持在大肠杆菌和土壤杆菌中。
bNLB。起点:16026终点:16050。根癌土壤杆菌胭脂碱ti质粒的T-DNA的25bp左边界重复区。
bNLB。起点:15991终点:16120。根癌土壤杆菌胭脂碱ti质粒的T-DNA的左边界区。
xTAG。起点:15943终点:15982。40bp位点用于植物插入物完整性测试和停止通读ORF。
xSTOPS起点:15931终点:15942。6框终止以使意外ORF通读最小化。
xSTOPS起点:15855终点:15866。6框终止以使意外ORF通读最小化。
tGmEPSPS起点:15057终点:15854。来自大豆的EPSPS终止子。
cNtALS起点:13056终点:15050。NtALSDNA片段编码来自普通烟草(Nicotianatabacum)的乙酰乳酸合酶(ALS)双突变体(P191A、W568L)。它被密码子优化以用于大豆表达。
u5GmEF起点:13037终点:13047。大豆延伸因子(EF)基因的第二5’UTR。
iGmEF起点:12128终点:13036。大豆延伸因子(EF)基因的第一内含子。iGmEF-01,其中内部BamHI位点和3’末端意外ORF被去除。
u5GmEF起点:12065终点:12127。大豆延伸因子(EF)基因的第一5’UTR。
起点起点:12065终点:12065。转录开始位点。
prGmEF起点:10982终点:13047。翻译延伸因子EF-1α/Tu启动子,包括第一内含子和相邻的UTR,来自大豆(williams 82)。
xSTOPS起点:10970终点:10981。6框终止以使意外ORF通读最小化。
tMt12344起点:9956终点:10962。基于蒺藜苜蓿基因的终止子。它由3’-UTR和3’-非转录序列组成。
gGtoRG30-02起点:2231终点:9955。含有编码蛋白质的大豆R-基因(SEQ ID NO:3)及其天然5’UTR和3’UTR的基因组片段,该蛋白质含有Toll/白细胞介素-1受体(TIR)、核苷酸结合位点(NBS)、和富含亮氨酸重复序列(LRR)结构域。第一天然内含子被拟南芥属内含子iAtBAF60-01替代。基因组片段包含以下组分:RG30_5’UTR起点:2231;终点:2730;RG30_3'UTR起点:9318终点:9955;内含子4起点:7094终点:8693;内含子3起点:5401终点:6262;内含子2起点:4877终点:5124;iAtBAF60-01起点:3357终点:3765;拟南芥BAF60同源物的内含子(Chromatin数据库CHC1),插入GUS编码序列中以预防细菌表达;cGtoRG30-01起点:2731终点:9317;来自R-基因的CDS。编码序列包含(参考SEQ ID NO:3):
起点起点:2043终点:2043基于cDNA/gDNA比对的转录开始位点。
prMt12344起点:217终点:2218来自蒺藜苜蓿基因的启动子。它由5’-非转录序列和5’UTR组成。
xSTOPS起点:184终点:195 6框终止以使意外ORF通读最小化
xTAG起点:144终点:183 40bp位点用于植物插入物完整性测试和停止通读ORF。
bNRB-01起点:101终点:125右边界重复
bNRB-04起点:4终点:143根癌土壤杆菌胭脂碱ti质粒的T-DNA的右边界区。
b)包含SEQ ID NO:3的R-基因的25899载体构建体
图2提供了包含SEQ ID NO:4的R-基因的载体25899的示意图。特征描述如下。
oCOLE起点:20,955终点:21,761从pUC19得到的在大肠杆菌中起作用的ColE1复制起点。
oVS1起点:19,873终点:根癌土壤杆菌宿主中的复制起点。
cRepA起点:18,757终点:19,830cRepA,其中在nt735处A变为G。
cVirG起点:18,002终点:18,727来自pAD1289的virG(假定),其具有TTG起始密码子。virGN54D来自Hansen等人1994,PNAS[美国国家科学院院刊]91:7603-7607中所述的pAD1289。
prVirG起点:17,797终点:17,927virG启动子(Winans J.Bact.[细菌学杂志]172:2433-38(1990)),其由两个启动子元件组成,一个响应于乙酰丁香酮和磷酸盐饥饿(bp 45至83),另一个响应于中度酸化(86至128)。
cSpec起点:16,914终点:17,702也称为aadA;编码酶氨基糖苷3’腺苷酰转移酶的基因,赋予了对壮观霉素和链霉素的抗性以用于将载体保持在大肠杆菌和土壤杆菌中。
bNLB起点:16,540终点:16,564根癌土壤杆菌胭脂碱ti质粒的T-DNA的25bp左边界重复区。
bNLB起点:16,505终点:16,634根癌土壤杆菌胭脂碱ti质粒的T-DNA的左边界区。
xTAG起点:16,457终点:16,496 40bp位点用于植物插入物完整性测试和停止通读ORF。
xSTOPS起点:16,445终点:16,456 6框终止以使意外ORF通读最小化。
xSTOPS起点:16,369终点:16,380 6框终止以使意外ORF通读最小化。
tGmEPSPS起点:15,571终点:16,368来自大豆的EPSPS终止子。在终止子的3’末端处的6框终止的去除。
cNtALS起点:13,570终点:15,564NtALSDNA片段编码来自普通烟草的乙酰乳酸合酶(ALS)双突变体(P191A、W568L)。它被密码子优化以用于大豆表达并且由GeneArt合成。
u5GmEF起点:13,551终点:13,561大豆延伸因子(EF)基因的第二5’UTR。
iGmEF起点:12,642终点:13,550大豆延伸因子(EF)基因的第一内含子。
u5GmEF起点:12,579终点:12,641大豆延伸因子(EF)基因的第一5’UTR。
起点起点:12,579终点:12,579转录开始位点。
prGmEF起点:11,496终点:13,561翻译延伸因子EF-1α/Tu启动子,包括第一内含子和相邻的UTR,来自大豆(williams 82)。
xSTOPS起点:11,484终点:11,495 6框终止以使意外ORF通读最小化。
xSTOPS起点:11,465终点:11,476 6框终止以使意外ORF通读最小化。
tMt51186起点:10,465终点:11,464蒺藜苜蓿基因的经修饰的终止子。
gGtoRG30-02(SEQ ID NO:3)起点:2,734终点:10,458;含有编码蛋白质的大豆R-基因及其天然5’UTR和3’UTR的基因组片段,该蛋白质含有Toll/白细胞介素受体-1(TIR)、核苷酸结合位点(NBS)、和富含亮氨酸重复序列(LRR)结构域。第一天然内含子被拟南芥属内含子iAtBAF60-01替代。基因组片段包含以下组分:RG30_5'UTR起点:2,734终点:3,233;RG30_3'UTR起点:9,821终点:10,458;内含子4起点:7,597终点:9,196;内含子3起点:5,904终点:6,765;内含子2起点:5,380终点:5,627;iAtBAF60-01起点:3,860终点:4,268;拟南芥BAF60同源物的内含子(Chromatin数据库CHC1),插入GUS编码序列中以预防细菌表达;cGtoRG30-01起点:3,234终点:9,820;R-基因的CDS。
iMt51186起点:2,450终点:2,700蒺藜苜蓿基因的第一内含子。
起点起点:2,313终点:2,313基于cDNA/gDNA比对的转录开始。
prMt51186起点:217终点:2,721来自蒺藜苜蓿基因的启动子。
xSTOPS起点:184终点:195 6框终止以使意外ORF通读最小化。
xTAG起点:144终点:183 40bp位点用于植物插入物完整性测试和停止通读ORF。
bNRB起点:101终点:125右边界重复
bNRB-04起点:4终点:143根癌土壤杆菌胭脂碱ti质粒的T-DNA的右边界区。与bNRB-03在5'末端相差20bp。
c)包含SEQ ID NO:11的R-基因的25950载体构建体
图8提供了包含SEQ ID NO:11的R-基因的载体29590的示意图。特征描述如下。
载体类型:二元载体
构建体大小(bp):20,738
功能描述:用于在ALS选择情况下的大豆转化的二元载体,其具有编码蛋白质的大豆锈病抗性候选基因gGtoRG30-01,该蛋白质含有Toll/白细胞介素受体-1(TIR)、核苷酸结合位点(NBS)、和富含亮氨酸重复序列(LRR)结构域。第一天然内含子被拟南芥属内含子替代。载体还含有ALS选择盒prGmEF-05/cNtALS-01/tGmEPSPS-04。
特征:
xTAG起点:144终点:183 40bp位点用于植物插入物完整性测试和停止通读ORF。
xTAG起点:15,422终点:15,461 40bp位点用于植物插入物完整性测试和停止通读ORF。
xSTOPS起点:15,410终点:15,421 6框终止以使意外ORF通读最小化
xSTOPS起点:15,334终点:15,345 6框终止以使意外ORF通读最小化
xSTOPS起点:10,449终点:10,460 6框终止以使意外ORF通读最小化
xSTOPS起点:184终点:195 6框终止以使意外ORF通读最小化
prGmEF起点:12,516终点:12,526翻译延伸因子EF-1α/Tu启动子,包括第一内含子和相邻的UTR,来自大豆(williams 82)。
prGmEF起点:11,544终点:11,606翻译延伸因子EF-1α/Tu启动子,包括第一内含子和相邻的UTR,来自大豆(williams 82)。
tGmEPSPS起点:15,536终点:15,333来自大豆的EPSPS终止子。
gGtoRG30-01起点:8,804终点:10,441含有编码蛋白质的大豆锈病抗性候选基因的基因组片段,该蛋白质含有toll/白细胞介素受体-1(TIR)、核苷酸结合位点(NBS)、和富含亮氨酸重复序列(LRR)结构域。第一天然内含子被拟南芥属内含子iAtBAF60-01替代。编码序列包含(参考SEQ ID NO:11):
prVirG起点:16,762终点:16,892virG启动子(Winans J.Bact.[细菌学杂志]172:2433-38(1990)),其由两个启动子元件组成,一个响应于乙酰丁香酮和磷酸盐饥饿(bp 45至83),另一个响应于中度酸化(86至128)
prGmEF起点:10,461终点:12,526翻译延伸因子EF-1α/Tu启动子,包括第一内含子和相邻的UTR,来自大豆(williams 82)。
oVS1起点:18,838终点:19,242根癌土壤杆菌宿主中的复制起点oCOLE起点:20,726终点:19,920大肠杆菌中起作用的ColE1复制起点
prGmEF-05起点:11,607终点:12,515翻译延伸因子EF-1α/Tu启动子,包括第一内含子和相邻的UTR,来自大豆(williams 82)。
iAtBAF60起点:2,843终点:3,251拟南芥BAF60同源物的内含子(Chromatin数据库CHC1),插入以预防细菌表达</nobr></html>
cVirG起点:16,967终点:17,692在Hansen等人1994,PNAS[美国国家科学院院刊]91:7603-7607中所述的来自pAD1289的virG,其具有TTG起始密码子
cSpec起点:15,879终点:16,667编码酶氨基糖苷3’腺苷酰转移酶的基因,赋予了对壮观霉素和链霉素的抗性以用于将载体保持在大肠杆菌和土壤杆菌中。
cRepA起点:17,722终点:18,795cRepA-01,其中在nt735处A变为G
cNtALS起点:12,535终点:14,529编码来自普通烟草的乙酰乳酸合酶双突变体,该双突变体被密码子优化用于大豆表达
bNRB起点:125终点:101根癌土壤杆菌胭脂碱ti质粒的T-DNA的右边界区
bNLB起点:15,529终点:15,505根癌土壤杆菌胭脂碱ti质粒的T-DNA的左边界重复区
使用已知的植物转化方法(例如,经由土壤杆菌介导的转化)将每个构建体转化到大豆细胞,以产生初级大豆事件。
实例6:R-基因抗ASR的验证
在表型分型工作中,已经使用了症状评估和分子测定来进行锈病抗性或易感性评级。症状评估是Burdon和Speer(Euphytica[荷兰植物育种杂志],33:891-896,1984;也称为T A G 1984)的锈病评级量表的修订版。分子测定是基于真菌管家基因β-微管蛋白,其中β-微管蛋白的探针靶向大豆锈病的特定区域,而不是其他病原体或植物物种。此外,分子测定通过与表型症状观察偶联来验证,如图3-4和9所示。
图3比较了由二元构建体24845(T0事件GVG01375963)和二元构建体25899(T0事件GVG013773804)的转化生成的初级大豆事件的叶与来自对照的叶。图9比较了由二元构建体25950(T0事件GVG01740892和GVG01740893)生成的初级大豆事件的叶与来自对照的叶。图4示出了初级大豆事件相对于对照的疾病抗性评级。对照具有相同遗传背景但没有转基因。
将来自初级事件的叶放在皮氏培养皿中的湿纸巾上,然后接种三种不同锈病群体(RTP1;BRO1-巴西;BRO3-巴西)的大豆锈病孢子悬浮液。具有相同的遗传背景但不具有转基因的植物叶作为阴性对照。14天后,评估两个事件和对照的叶对大豆锈病的抗性。如图3、4和9所示,与野生型对照相比,来自T0事件的叶显示出明显的对大豆锈病的抗性的证据。T0事件叶显示红棕色病灶的存在(每行前两个小图),而对照的叶(每行最后一个小图)显示棕褐色反应并且有大量孢子形成,因此指示新颖的R-基因赋予抗ASR抗性。
图3和9中的结果使用标准大豆锈病评级量表显示,其中RB类型指示事件具有抗性,并且棕褐色评级指示事件易感。RB后列出的数字是病灶密度或病灶大小的组合评级,其中1-4级指示高到中等抗性,无孢子形成(NSP)或很少孢子形成(SPL)。棕褐色后列出的数字是脓疱密度和孢子形成水平的组合的评级,其中1-5级指示低到高孢子形成水平。从评级的差异可以看出,与对照相比,T0事件多次显示出高水平的疾病抗性。
使用真菌β-微管蛋白转录物进行的数量测量与这些表型观察一致,如图5和10中图所示。经由qRT-PCR利用真菌β-微管蛋白在分子水平上针对事件和对照测量抗性水平。与对照相比,包含TNL R-基因的事件显示出高水平的抗性,其中真菌生物质的减少超过90%。对照的平均qRT值为约981,而事件的平均qRT值为约79。数据还显示所鉴定的TNL R-基因在所测定的事件中表达。
在该验证中,我们证明了构建体25845和构建体25950针对所有测试的锈病显示出强抗性(>90%)和广谱。
实例7:另外的载体构建实例
另外的载体构建体也以举例的方式提供。
d)包含SEQ ID NO:4的R-基因的25992载体构建体
图6提供了包含SEQ ID NO:4的R-基因的载体25992的示意图。特征描述如下。
oCOLE起点:19,303终点:20,109。大肠杆菌中起作用的ColE1复制起点。
oVS1起点:18,221终点:18,625。根癌土壤杆菌宿主中的复制起点。
cRepA起点:17,105终点:18,178。cRepA-01,其中在nt735处A变为G。
cVirG起点:16,350终点:17,075。来自pAD1289的virG(假定),其具有TTG起始密码子。virGN54D来自Hansen等人1994,PNAS[美国国家科学院院刊]91:7603-7607中所述的pAD1289。
prVirG起点:16,145终点:16,275。virG启动子(Winans J.Bact.[细菌学杂志]172:2433-38(1990)),其由两个启动子元件组成,一个响应于乙酰丁香酮和磷酸盐饥饿(bp45至83),另一个响应于中度酸化(86至128)。
cSpec起点:15,262终点:16,050。也称为aadA;编码酶氨基糖苷3’腺苷酰转移酶的基因,赋予了对壮观霉素和链霉素的抗性以用于将载体保持在大肠杆菌和土壤杆菌中。
bNLB起点:14,888终点:14,912 25bp。根癌土壤杆菌胭脂碱ti质粒的T-DNA的左边界重复区。
bNLB起点:14,853终点:14,982。根癌土壤杆菌胭脂碱ti质粒的T-DNA的左边界区。
xTAG起点:14,805终点:14,844。40bp位点用于植物插入物完整性测试和停止通读ORF。
xSTOPS起点:14,793终点:14,804。6框终止以使意外ORF通读最小化。
xSTOPS起点:14,717终点:14,728。6框终止以使意外ORF通读最小化。
tGmEPSPS起点:13,919终点:14,716。tGMEPS-02的经修饰版本;来自大豆的EPSPS终止子。
cNtALS起点:11,918终点:13,912。NtALSDNA片段编码来自普通烟草的乙酰乳酸合酶双突变体(P191A、W568L)。它被密码子优化以用于大豆表达。
u5GmEF起点:11,899终点:11,909。大豆延伸因子(EF)基因的第二5’UTR。
iGmEF起点:10,990终点:11,898。大豆延伸因子(EF)基因的第一内含子。
u5GmEF起点:10,927终点:10,989。大豆延伸因子(EF)基因的第一5’UTR。
起点起点:10,927终点:10,927。转录开始位点
prGmEF起点:9,844终点:11,909。翻译延伸因子EF-1α/Tu启动子,包括第一内含子和相邻的UTR,来自大豆(williams 82)。
xSTOPS起点:9,832终点:9,843。6框终止以使意外ORF通读最小化。
tMt12344起点:8,818终点:9,824。基于蒺藜苜蓿基因的终止子。它由3’-UTR和3’-非转录序列组成。
内含子4起点:6,594终点:8,193
内含子3起点:4,901终点:5,762
内含子2起点:4,377终点:4,624
iAtBAF60起点:2,857终点:3,265。拟南芥BAF60同源物的内含子,插入GUS编码序列中以预防细菌表达。
cGtoRG30(SEQ ID NO:4)起点:2,231终点:8,817。编码蛋白质的大豆R-基因的CDS,该蛋白质含有toll/白细胞介素受体-1(TIR)、核苷酸结合位点(NBS)、和富含亮氨酸重复序列(LRR)结构域。该CDS来自短绒野大豆PI 505267的3号染色体上的R-基因。
起点起点:2,043终点:2,043。基于cDNA/gDNA比对的转录开始位点。
prMt12344起点:217终点:2,218。来自蒺藜苜蓿基因的启动子。它由5’-非转录序列和5’UTR组成。
xSTOPS起点:184终点:195。6框终止以使意外ORF通读最小化。
xTAG起点:144终点:183。40bp位点用于植物插入物完整性测试和停止通读ORF。典型地,由土壤杆菌(agro)RB提供。比-01有1bp不同。
bNRB起点:101终点:125。右边界重复。
bNRB起点:4终点:143。根癌土壤杆菌胭脂碱ti质粒的T-DNA的右边界区。
e)包含SEQ ID NO:4的R-基因的26015载体构建体
图7提供了包含SEQ ID NO:4的R-基因的载体26015的示意图。特征描述如下。
oCOLE起点:19,817终点:20,623。大肠杆菌中起作用的ColE1复制起点。
oVS1起点:18,735终点:19,139。根癌土壤杆菌宿主中的复制起点。
cRepA起点:17,619终点:18,692。cRepA-01,其中在nt735处A变为G。
cVirG起点:16,864终点:17,589。来自pAD1289的virG(假定),其具有TTG起始密码子。virGN54D来自Hansen等人1994,PNAS[美国国家科学院院刊]91:7603-7607中所述的pAD1289。
prVirG起点:16,659终点:16,789。virG启动子(Winans J.Bact.[细菌学杂志]172:2433-38(1990)),其由两个启动子元件组成,一个响应于乙酰丁香酮和磷酸盐饥饿(bp45至83),另一个响应于中度酸化(86至128)。
cSpec起点:15,776终点:16,564。也称为aadA;编码酶氨基糖苷3’腺苷酰转移酶的基因,赋予了对壮观霉素和链霉素的抗性以用于将载体保持在大肠杆菌和土壤杆菌中。
bNLB起点:15,402终点:15,426根癌土壤杆菌胭脂碱ti质粒的T-DNA的25bp左边界重复区
bNLB起点:15,367终点:15,496根癌土壤杆菌胭脂碱ti质粒的T-DNA的左边界区。
xTAG起点:15,319终点:15,358。40bp位点用于植物插入物完整性测试和停止通读ORF。
xSTOPS-01起点:15,307终点:15,318。6框终止以使意外ORF通读最小化。
xSTOPS起点:15,231终点:15,242。6框终止以使意外ORF通读最小化
tGmEPSPS起点:14,433终点:15,242。来自大豆的EPSPS终止子。
cNtALS起点:12,432终点:14,426。NtALSDNA片段编码来自普通烟草的乙酰乳酸合酶双突变体(P191A、W568L)。它被密码子优化以用于大豆表达。
u5GmEF起点:12,413终点:12,423。大豆延伸因子(EF)基因的第二5’UTR。
iGmEF起点:11,504终点:12,412。大豆延伸因子(EF)基因的第一内含子。
u5GmEF起点:11,441终点:11,503。大豆延伸因子(EF)基因的第一5’UTR。
起点起点:11,441终点:11,441。转录开始位点
prGmEF起点:10,358终点:12,423。翻译延伸因子EF-1α/Tu启动子,包括第一内含子和相邻的UTR,来自大豆(williams 82)。
xSTOPS起点:10,346终点:10,357。6框终止以使意外ORF通读最小化。
xSTOPS起点:10,327终点:10,338。6框终止以使意外ORF通读最小化。
tMt51186起点:9,327终点:10,326。蒺藜苜蓿基因的经修饰的终止子。
内含子4起点:7,097终点:8,696。
内含子3起点:5,404终点:6,265。
内含子2起点:4,880终点:5,127。
iAtBAF60起点:3,360终点:3,768。拟南芥BAF60同源物的内含子(Chromatin数据库CHC1),插入GUS编码序列中以预防细菌表达。
cGtoRG30-01(SEQ ID NO:4)起点:2,734终点:9,320。编码蛋白质的大豆R-基因的CDS,该蛋白质含有toll/白细胞介素受体-1(TIR)、核苷酸结合位点(NBS)、和富含亮氨酸重复序列(LRR)结构域。该CDS来自短绒野大豆PI_505267的3号染色体上的R-基因。
iMt51186起点:2,450终点:2,700蒺藜苜蓿基因的第一内含子。
iMt51186起点:2,450终点:2,574蒺藜苜蓿基因的第一内含子的截短版本。
起点起点:2,313终点:2,313基于cDNA/gDNA比对的转录开始。
prMt51186起点:217终点:2,721来自蒺藜苜蓿基因的启动子。
xSTOPS起点:184终点:195 6框终止以使意外ORF通读最小化
xTAG起点:144终点:183 40bp位点用于植物插入物完整性测试和停止通读ORF。
bNRB起点:101终点:125右边界重复
bNRB起点:4终点:143根癌土壤杆菌胭脂碱ti质粒的T-DNA的右边界区。
以上实例清楚地说明了本发明的各种实施例的优点。虽然已经参考某些实施例的特定细节描述本发明,但不希望这样的细节被视为对本发明范围的限制,除非它们被包括在所附权利要求书中或到它们被包括在所附权利要求书中的程度。
在整个申请中,引用了各种专利、专利出版物和非专利出版物。这些专利、专利出版物和非专利出版物的披露内容通过引用以其全文在此并入本申请中,以便更全面地描述本发明所属领域的现状。
Claims (81)
1.一种多肽,其选自:
(a)具有SEQ ID NO:5中所示的氨基酸序列或其任何部分、以及具有与其附接的异源氨基酸序列的多肽,其中所述多肽或其部分的表达赋予植物增加的病原体抗性;
(b)包含SEQ ID NO:5的氨基酸序列、以及具有一个或多个氨基酸残基的取代和/或缺失和/或添加的多肽,其中所述多肽的表达赋予所述植物增加的病原体抗性;
(c)与SEQ ID NO:5的氨基酸序列具有超过99%、超过95%、超过90%、超过85%、或超过80%序列同一性的多肽,其中所述多肽在植物中表达时赋予所述植物增加的病原体抗性;或者
(d)包含SEQ ID NO:5的氨基酸序列、或如(a)至(c)中的任一个所定义的多肽的融合多肽。
2.一种核酸分子,其包含:
(a)编码蛋白质的核苷酸序列,所述蛋白质具有与SEQ ID NO:5共享至少90%、95%或100%序列同一性的氨基酸序列,其中所述核苷酸序列包含与其附接的异源核酸序列,并且所述核酸分子的表达赋予所述植物增加的病原体抗性;
(b)编码如权利要求1所述的多肽的核苷酸序列;
(c)包含SEQ ID NO:2-4和11-12中的任一个的序列的部分(a)的核苷酸序列;或者
(d)与SEQ ID NO:2-4和11-12中的任一个具有至少超过99%、至少95%、至少90%、至少85%、或至少80%同一性的部分(a)的核苷酸序列。
3.一种表达盒,其包含如权利要求2所述的核酸分子或编码如权利要求1所述的多肽。
4.如权利要求3所述的表达盒,其中所述核酸分子可操作地连接至能够指导在植物细胞中表达的启动子。
5.如权利要求4所述的表达盒,其中所述启动子是内源启动子。
6.如权利要求4所述的表达盒,其中所述启动子是外源启动子。
7.如权利要求4所述的表达盒,其中所述启动子包含SEQ ID NO:13-15中的任一个。
8.一种载体,其包含如权利要求2所述的核酸分子或如权利要求3-7中任一项所述的表达盒。
9.一种转基因细胞,其包含如权利要求2所述的核酸分子或如权利要求3-7中任一项所述的表达盒。
10.一种植物,其基因组中稳定地掺入了可操作地连接至在所述植物中具有活性的启动子的核酸序列,其中所述核酸序列编码具有以下的多肽:
(a)与SEQ ID NO:5具有至少85%同一性、至少90%同一性、或至少95%同一性的氨基酸序列;或者
(b)SEQ ID NO:5中所示的氨基酸序列,
其中所述核酸序列对于所述植物是异源的,并且其中所述植物与不包含所述核酸序列的对照植物相比具有增加的病原体抗性。
11.如权利要求10所述的植物,其中
(a)所述核酸序列与SEQ ID NO:2-4和11-12中的任一个包含至少85%同一性、至少90%同一性、或至少95%同一性;或者
(b)所述核酸序列是SEQ ID NO:2、3、4、11或12。
12.如权利要求10或11所述的植物,其中所述核酸序列通过转基因表达而引入所述基因组中。
13.如权利要求10-12中任一项所述的植物,其中所述启动子是内源启动子。
14.如权利要求13所述的植物,其中所述内源启动子与SEQ ID NO:15包含至少95%序列同一性。
15.如权利要求10-12中任一项所述的植物,其中所述启动子是异源启动子,并且其中所述异源启动子与SEQ ID NO:13或14包含至少95%序列同一性。
16.如权利要求10-12中任一项所述的植物,其中所述启动子是组成型启动子、诱导型启动子、或组织特异性启动子。
17.如权利要求10-16中任一项所述的植物,其中所述植物是双子叶植物。
18.如权利要求17所述的植物,其中所述双子叶植物是大豆植物或优良大豆植物。
19.如权利要求10-16中任一项所述的植物,其中所述植物是单子叶植物。
20.如权利要求19所述的植物,其中所述单子叶植物选自由以下组成的组:稻、小麦、玉蜀黍、和甘蔗。
21.如权利要求10-20中任一项所述的植物,其中所述植物是农艺学上优良植物,其具有商业上显著的产量和/或商业上易感的活力、结实、可立性、脱粒性、非生物/生物抗性、或除草剂耐受性。
22.如权利要求10-21中任一项所述的植物,其中所述植物对以下病原体中的任一个具有增加的抗性:大豆胞囊线虫、细菌性脓疱、根结线虫、大豆灰斑病、疫霉菌、褐茎腐病、线虫、亚洲大豆锈病、黑粉病、二孢白粉菌、菊科白粉菌、小麦白粉菌、瓜类单囊壳、黄瓜白粉菌、终极腐霉菌、葡萄钩丝壳、豌豆球腔菌、稻瘟菌、稻平脐蠕孢、稻瘟菌、立枯丝核菌、大豆疫霉菌、麦二叉蚜、烟粉虱、玉米蚜、网纹野蛞蝓、小蔗螟、麦二叉蚜、桃蚜、核盘菌、菜豆壳球孢菌或北美大豆猝死综合症病菌。
23.如权利要求22所述的植物,其中所述植物是大豆植物,并且其中所述大豆植物与所述对照植物相比对ASR具有增加的抗性。
24.一种植物,其基因组已经编辑以包含编码与SEQ ID NO:5具有至少90%同一性或95%同一性的至少一个多肽的核酸序列,其中所述多肽赋予相对于对照植物的增加的病原体抗性,其中所述植物在所述基因组编辑前不包含所述核酸序列。
25.如权利要求24所述的植物,其中所述核酸序列通过SEQ ID NO:1、2、3、4、11和/或12中的任一个所示的核酸序列的基因组编辑而引入所述植物基因组中。
26.如权利要求24或25所述的植物,其中所述基因组编辑包含所述核酸序列的复制、倒位、启动子修饰、终止子修饰和/或剪接修饰。
27.如权利要求24-26中任一项所述的植物,其中所述基因组编辑通过CRISPR、TALEN、大范围核酸酶或通过基因组核酸的修饰来完成。
28.如权利要求24-27中任一项所述的植物,其中所述植物是农艺学上优良植物,其具有商业上显著的产量和/或商业上易感的活力、结实、可立性、脱粒性、非生物/生物抗性、或除草剂耐受性。
29.如权利要求24-28中任一项所述的植物,其中所述核酸序列可操作地连接至异源启动子,并且其中所述异源启动子在所述植物中具有活性。
30.如权利要求29所述的植物,其中在所述植物中具有活性的所述异源启动子与SEQID NO:13和14中之一具有至少95%序列同一性。
31.如权利要求29所述的植物,其中所述异源启动子是天然启动子或其活性变体或片段,并且其中任选地所述天然启动子与SEQ ID NO:15具有至少95%序列同一性。
32.如权利要求24-31中任一项所述的植物,其中所述植物是大豆植物,所述大豆植物相对于所述对照植物对亚洲大豆锈病具有增加的抗性。
33.一种优良大豆植物,其基因组中具有来自供体大豆属植物的核酸序列,其中所述供体大豆属植物是与所述优良大豆植物不同的株系,并且其中所述核酸序列编码与SEQ IDNO:5具有至少90%同一性或95%同一性的至少一个多肽,其中所述多肽赋予所述优良大豆植物相较于不包含所述核酸序列的对照植物增加的病原体抗性。
34.如权利要求33所述的植物,其中所述供体大豆属植物是短绒野大豆植物、或其子代。
35.如权利要求34所述的植物,其中所述短绒野大豆植物是短绒野大豆登录品系PI505267或其子代的植物。
36.如权利要求33-35中任一项所述的植物,其中所述核酸序列与SEQ ID NO:2-4和11-12中的任一个具有至少90%同一性、至少95%同一性、或至少100%同一性。
37.如权利要求33-35中任一项所述的植物,其中所述核酸序列与SEQ ID NO:1、或其功能片段具有至少90%同一性、至少95%同一性、或至少100%同一性,其中所述功能片段包含SEQ ID NO:1的至少10%;至少15%;至少20%;至少25%;至少30%;至少35%;至少40%;至少45%;至少50%;至少55%;至少60%;至少65%;至少70%;至少75%;至少80%;至少85%;至少90%;至少95%;或至少99%,并且赋予增加的病原体抗性。
38.如权利要求37所述的植物,其中所述核酸序列包含与增加的ASR抗性相关联的SNP标记,其中所述SNP标记是表1和/或2中有利标记中的任一个。
39.如权利要求33-38中任一项所述的植物,其中来自所述供体大豆属植物的所述核酸序列插入所述植物的3号染色体中。
40.如权利要求33-39中任一项所述的植物,其中所述核酸序列通过对应于并包含SEQID NO:1、2-4、和11-12中的任一个的基因组序列的基因组编辑而引入所述植物基因组中,其中所述基因组编辑赋予所述优良植物增强的病原体抗性,并且其中所述基因编辑通过CRISPR、TALEN、大范围核酸酶、或通过基因组核酸的修饰进行。
41.如权利要求33-39中任一项所述的植物,其中所述核酸序列通过以下的转基因表达而引入所述植物基因组中:
(a)与SEQ ID NO:2-4和11-12中的任一个具有至少90%同一性或至少95%同一性的核酸序列,
(b)编码与SEQ ID NO:5具有至少90%同一性或至少95%同一性的多肽的核酸序列;
(c)编码具有SEQ ID NO:5的序列的多肽的核酸序列;
其中所述多肽赋予所述优良大豆植物增强的病原体抗性。
42.如权利要求33-39中任一项所述的植物,其中所述核酸序列通过使用以下中的一种或多种而渗入所述植物的所述基因组中:
(a)化学诱导的染色体加倍;和
(b)加倍优良大豆品系以获得加倍的大豆植物,然后使所述加倍的植物与衍生自登录品系PI505267或其子代的短绒野大豆植物杂交,如实例3中所述,所述短绒野大豆植物包含所述核酸序列。
43.如权利要求33-42中任一项所述的植物,其中所述植物对以下病原体中的任何一个或多个具有增加的抗性:大豆胞囊线虫、细菌性脓疱、根结线虫、大豆灰斑病、疫霉菌、褐茎腐病、线虫、亚洲大豆锈病、黑粉病、二孢白粉菌、菊科白粉菌、小麦白粉菌、瓜类单囊壳、黄瓜白粉菌、终极腐霉菌、葡萄钩丝壳、豌豆球腔菌、稻瘟菌、稻平脐蠕孢、稻瘟菌、立枯丝核菌、大豆疫霉菌、麦二叉蚜、烟粉虱、玉米蚜、网纹野蛞蝓、小蔗螟、麦二叉蚜、桃蚜、核盘菌、菜豆壳球孢菌或北美大豆猝死综合症病菌。
44.如权利要求43所述的植物,其中所述植物对亚洲大豆锈病具有增加的抗性。
45.如权利要求33-44中任一项所述的植物,其中所述优良大豆植物是农艺学上优良的大豆植物,其具有商业上显著的产量和/或商业上易感的活力、结实、可立性、脱粒性、非生物/生物抗性、或除草剂耐受性。
46.一种子代植物,其来自如权利要求10-45中任一项所述的植物,其中所述子代植物的基因组中稳定掺入了所述核酸序列。
47.一种植物细胞、种子或植物部分,其衍生自如权利要求10-46中任一项所述的植物,其中所述植物细胞、种子或植物部分的基因组中稳定掺入了所述核酸序列。
48.如权利要求1所述的多肽或如权利要求2所述的核酸分子或如权利要求3-7中任一项所述的表达盒或如权利要求8所述的载体或如权利要求9所述的转基因细胞在赋予增加的抗亚洲大豆锈病(ASR)抗性中的用途。
49.如权利要求3-7中任一项所述的表达盒在细胞中的用途,其中所述多肽在所述细胞中的表达水平和/或活性增加,并且所述细胞对亚洲大豆锈病的抗性增强。
50.一种用于改善植物抗ASR抗性的方法,所述方法包括增加如权利要求1所述的多肽在所述植物中的表达水平和/或活性。
51.如权利要求50所述的方法,其中所述增加包括增加如权利要求2所述的核酸分子在所述植物中的表达水平和/或活性。
52.如权利要求50或51所述的方法,其中增加所述植物中的表达水平和/或活性通过转基因方式或通过育种来实现。
53.一种用于产生抗ASR抗性改善的转基因植物的方法,所述方法包括:将如权利要求1所述的核酸分子或如权利要求3-7中任一项所述的表达盒引入受体植物以获得转基因植物,其中与所述受体植物相比,所述转基因植物具有增加的抗ASR抗性。
54.一种产生具有增加的病原体抗性的大豆植物的方法,所述方法包括以下步骤:
a)提供供体大豆植物,所述供体大豆植物在其基因组中包含编码与SEQ ID NO:5具有至少90%同一性或95%同一性的至少一个多肽的核酸序列,其中所述核酸序列赋予所述供体大豆植物相较于基因组中不包含所述核酸序列的另一种供体大豆植物增加的病原体抗性;
b)使a)的所述供体大豆植物与不包含所述核酸序列的受体大豆植物杂交;和
c)通过在来自b)的杂交的子代植物中检测所述核酸序列的存在、或与所述核酸序列相关联的一个或多个分子标记的存在来选择所述子代植物,从而产生具有增加的病原体抗性的大豆植物。
55.如权利要求54所述的方法,其中所述分子标记是单核苷酸多态性(SNP)、数量性状基因座(QTL)、扩增片段长度多态性(AFLP)、随机扩增多态性DNA(RAPD)、限制性片段长度多态性(RFLP)或微卫星。
56.如权利要求55所述的方法,其中所述分子标记是选自表1和/或表2的至少一个有利SNP标记,或位于选自表1和/或表2的有利SNP标记的20cM、10cM、5cM、1cM、或0.5cM内的分子标记。
57.如权利要求54-56中任一项所述的方法,其中所述供体大豆植物和所述受体大豆植物中的一种或多种是优良大豆植物。
58.一种用于产生具有增加的抗ASR抗性的大豆植物的方法,所述方法包括以下步骤:
a.提供短绒野大豆植物品系、或其子代,所述短绒野大豆植物品系、或其子代包含编码与SEQ ID NO:5具有至少90%同一性或95%同一性的至少一个多肽的核酸序列;
b.基本上如US 7,842,850所述或转基因地实施胚拯救方法;
c.收集由b)的方法产生的种子
d.将c)的种子再生为植物。
59.如权利要求58所述的方法,其中所述短绒野大豆植物品系是登录品系PI505267、或其子代。
60.如权利要求58所述的方法,其中所述核酸序列是:
(a)与SEQ ID NO:2-4和11-12中的任一个包含至少85%同一性、至少90%同一性、或至少95%同一性的核酸序列;或者
(b)SEQ ID NO:2、3、4、11或12的核酸序列。
61.一种产生具有增加的抗亚洲大豆锈病(ASR)抗性的大豆植物的方法,所述方法包括以下步骤:
a)从大豆植物中分离核酸;
b)在a)的核酸中检测与包含SEQ ID NO:2-4中的任一个的核酸序列相关联的至少一个分子标记,其中所述核酸序列赋予所述大豆植物增加的ASR抗性;
c)基于b)中检测的分子标记的存在,选择大豆植物;和
d)从鉴定为具有与增加的ASR抗性相关联的所述分子标记的c)的植物产生大豆子代植物。
62.如权利要求61所述的方法,其中所述分子标记是选自表1或表2的有利SNP标记,或位于选自表1或表2的有利SNP标记的20cM、10cM、5cM、1cM、或0.5cM内的分子标记。
63.如权利要求60或61所述的方法,其中所述检测包括扩增分子标记基因座或所述分子标记基因座的一部分,并检测所得扩增的分子标记扩增子。
64.如权利要求63所述的方法,其中所述扩增包括采用聚合酶链式反应(PCR)或连接酶链式反应(LCR),使用分离自大豆植物或种质的核酸作为所述PCR或LCR中的模板。
65.如权利要求63或64所述的方法,其中所述扩增进一步包括采用选自包含以下的组的引物对:SEQ ID NO:8-9的引物对;以及来自表6中引物的引物对。
66.如权利要求63-65中任一项所述的方法,其中所述检测进一步包括采用选自包含以下的组的核酸探针:SEQ ID NO:10的探针以及来自表6中探针的探针。
67.如权利要求61所述的方法,其中所述核酸是DNA或RNA。
68.一种植物,其通过如权利要求54-67中任一项所述的方法产生。
69.一种赋予植物增加的ASR抗性的方法,所述方法包括:
a)将可操作地连接至在所述植物中具有活性的启动子的核酸分子引入所述植物的基因组中,其中将所述核酸序列稳定地掺入所述基因组中,其中所述核酸序列编码多肽,所述多肽具有:
(i)与SEQ ID NO:5包含至少85%、至少90%、或至少95%同一性的氨基酸序列,或者
(ii)SEQ ID NO:5所示的氨基酸序列,
其中所述核酸序列对于所述植物是异源的,并且
其中与不表达所述核酸序列的对照植物相比,所述核酸序列的表达增加ASR抗性。
70.如权利要求69所述的方法,其中所述核酸序列通过转化而引入所述植物的基因组中。
71.如权利要求69所述的方法,其中所述核酸序列通过使包含所述核酸序列的供体植物与所述植物杂交而引入所述植物的基因组中以产生具有增加的ASR抗性的子代植物。
72.如权利要求69所述的方法,其中所述核酸序列插入3号染色体中。
73.如权利要求69-72中任一项所述的方法,其中所述启动子是外源启动子,并且其中任选地所述外源启动子包含SEQ ID NO:13或14。
74.如权利要求69-72中任一项所述的方法,其中所述启动子是内源启动子,并且其中任选地所述内源启动子包含SEQ ID NO:15。
75.如权利要求69-74中任一项所述的方法,其中所述方法进一步包括用PCR和/或测序筛选引入的核酸序列。
76.如权利要求69-75中任一项所述的方法,其中所述植物是双子叶植物,并且其中所述双子叶植物是大豆植物。
77.如权利要求69-75中任一项所述的方法,其中所述植物是选自由以下组成的组的单子叶植物:稻、小麦、玉蜀黍、和甘蔗。
78.一种植物,其通过如权利要求69-77中任一项所述的方法产生。
79.一种引物对,其用于扩增如权利要求1所述的核酸分子。
80.如权利要求79所述的引物对,其中所述引物对是SEQ ID NO:8-9的引物对或选自表6中引物的引物对。
81.一种诊断ASR抗性的引物,其中所述引物可用于PCR反应以指示与ASR抗性相关联的等位基因的存在,其中所述等位基因是如表1和/或2中描述的任何有利等位基因,并且其中所述引物是选自表6中引物的任何引物。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/147,849 | 2021-02-10 | ||
US202163209005P | 2021-06-10 | 2021-06-10 | |
US63/209,005 | 2021-06-10 | ||
PCT/US2022/015172 WO2022173659A2 (en) | 2021-02-10 | 2022-02-04 | Novel resistance genes associated with disease resistance in soybeans |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116802305A true CN116802305A (zh) | 2023-09-22 |
Family
ID=88048414
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280014367.1A Pending CN116802305A (zh) | 2021-02-10 | 2022-02-04 | 与大豆中疾病抗性相关联的新颖的抗性基因 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116802305A (zh) |
-
2022
- 2022-02-04 CN CN202280014367.1A patent/CN116802305A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210011425A1 (en) | Corn event 5307 | |
US20240110199A1 (en) | Novel genetic loci associated with disease resistance in soybeans | |
EP2736322B1 (en) | Insect resistant and herbicide tolerant breeding stack of soybean event pdab9582.814.19.1 and pdab4468.04.16.1 | |
KR101268896B1 (ko) | 옥수수 이벤트 mir604 | |
JP5685228B2 (ja) | トウモロコシイベントdas−59122−7およびその検出のための方法 | |
US20170114356A1 (en) | Novel alternatively spliced transcripts and uses thereof for improvement of agronomic characteristics in crop plants | |
US20150315605A1 (en) | Novel transcripts and uses thereof for improvement of agronomic characteristics in crop plants | |
AU2019460919B2 (en) | Nucleic acid sequence for detecting soybean plant DBN8002 and detection method therefor | |
US20230383307A1 (en) | Corn Elite Event MZIR098 | |
US20210171968A1 (en) | Tissue-specific expression and hybrid plant production | |
WO2017214074A1 (en) | Corn elite event mzhg0jg | |
CN116802305A (zh) | 与大豆中疾病抗性相关联的新颖的抗性基因 | |
WO2023151004A1 (en) | Methods and compositions for increasing protein and oil content and/or modifying oil profile in plant | |
WO2024107598A1 (en) | Novel resistance genes associated with disease resistance in soybeans | |
WO2023151007A1 (en) | Methods and compositions for increasing protein and/or oil content and modifying oil profile in a plant |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |