CN114641572A - 来自香蕉的野生近缘种的抗性基因的鉴定及其在控制巴拿马病中的用途 - Google Patents
来自香蕉的野生近缘种的抗性基因的鉴定及其在控制巴拿马病中的用途 Download PDFInfo
- Publication number
- CN114641572A CN114641572A CN202080057974.7A CN202080057974A CN114641572A CN 114641572 A CN114641572 A CN 114641572A CN 202080057974 A CN202080057974 A CN 202080057974A CN 114641572 A CN114641572 A CN 114641572A
- Authority
- CN
- China
- Prior art keywords
- plant
- seq
- nucleic acid
- transformed
- musa
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims description 410
- 240000005561 Musa balbisiana Species 0.000 title description 312
- 201000010099 disease Diseases 0.000 title description 65
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title description 65
- 235000021015 bananas Nutrition 0.000 title description 62
- 241000845082 Panama Species 0.000 title description 17
- 238000000034 method Methods 0.000 claims abstract description 246
- 241000196324 Embryophyta Species 0.000 claims description 471
- 150000007523 nucleic acids Chemical class 0.000 claims description 218
- 235000018290 Musa x paradisiaca Nutrition 0.000 claims description 181
- 102000004169 proteins and genes Human genes 0.000 claims description 154
- 102000039446 nucleic acids Human genes 0.000 claims description 152
- 108020004707 nucleic acids Proteins 0.000 claims description 152
- 235000018102 proteins Nutrition 0.000 claims description 146
- 241000234295 Musa Species 0.000 claims description 144
- 238000006467 substitution reaction Methods 0.000 claims description 116
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 91
- 230000014509 gene expression Effects 0.000 claims description 83
- 235000001014 amino acid Nutrition 0.000 claims description 77
- 150000001413 amino acids Chemical group 0.000 claims description 65
- 241000223221 Fusarium oxysporum Species 0.000 claims description 59
- 108020005004 Guide RNA Proteins 0.000 claims description 53
- 108091033409 CRISPR Proteins 0.000 claims description 50
- 238000009395 breeding Methods 0.000 claims description 49
- 239000013598 vector Substances 0.000 claims description 47
- 230000009466 transformation Effects 0.000 claims description 43
- 235000003805 Musa ABB Group Nutrition 0.000 claims description 40
- 235000015266 Plantago major Nutrition 0.000 claims description 40
- 230000001488 breeding effect Effects 0.000 claims description 40
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 27
- 239000004474 valine Substances 0.000 claims description 27
- 101710163270 Nuclease Proteins 0.000 claims description 25
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 23
- 238000004519 manufacturing process Methods 0.000 claims description 23
- 238000004113 cell culture Methods 0.000 claims description 22
- 230000005782 double-strand break Effects 0.000 claims description 18
- 238000012239 gene modification Methods 0.000 claims description 16
- 230000005017 genetic modification Effects 0.000 claims description 16
- 235000013617 genetically modified food Nutrition 0.000 claims description 16
- 238000010459 TALEN Methods 0.000 claims description 15
- 108010017070 Zinc Finger Nucleases Proteins 0.000 claims description 15
- 235000013399 edible fruits Nutrition 0.000 claims description 15
- 239000004475 Arginine Substances 0.000 claims description 11
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 11
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 11
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims description 11
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 11
- 235000003704 aspartic acid Nutrition 0.000 claims description 11
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 11
- 235000013922 glutamic acid Nutrition 0.000 claims description 11
- 239000004220 glutamic acid Substances 0.000 claims description 11
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 10
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 9
- 230000004075 alteration Effects 0.000 claims description 9
- 230000001131 transforming effect Effects 0.000 claims description 9
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 7
- -1 meganuclease Proteins 0.000 claims description 7
- 238000004161 plant tissue culture Methods 0.000 claims description 5
- 239000003147 molecular marker Substances 0.000 claims description 3
- 238000010354 CRISPR gene editing Methods 0.000 claims 4
- 241000234587 Canna Species 0.000 claims 3
- 150000001484 arginines Chemical class 0.000 claims 2
- 150000003680 valines Chemical class 0.000 claims 2
- 241000223218 Fusarium Species 0.000 abstract description 38
- 239000000203 mixture Substances 0.000 abstract description 16
- 244000053095 fungal pathogen Species 0.000 abstract description 8
- 210000004027 cell Anatomy 0.000 description 207
- 108090000765 processed proteins & peptides Proteins 0.000 description 95
- 108700028369 Alleles Proteins 0.000 description 89
- 102000004196 processed proteins & peptides Human genes 0.000 description 87
- 108020004414 DNA Proteins 0.000 description 86
- 239000002773 nucleotide Substances 0.000 description 84
- 125000003729 nucleotide group Chemical group 0.000 description 83
- 229920001184 polypeptide Polymers 0.000 description 83
- 244000052769 pathogen Species 0.000 description 72
- 210000001519 tissue Anatomy 0.000 description 71
- 102000040430 polynucleotide Human genes 0.000 description 69
- 108091033319 polynucleotide Proteins 0.000 description 69
- 239000002157 polynucleotide Substances 0.000 description 69
- 230000001717 pathogenic effect Effects 0.000 description 63
- 241000700605 Viruses Species 0.000 description 62
- 108091027544 Subgenomic mRNA Proteins 0.000 description 56
- 241000186216 Corynebacterium Species 0.000 description 54
- 108091028113 Trans-activating crRNA Proteins 0.000 description 50
- 239000012634 fragment Substances 0.000 description 50
- 108091026890 Coding region Proteins 0.000 description 49
- 125000003275 alpha amino acid group Chemical group 0.000 description 48
- 238000010362 genome editing Methods 0.000 description 48
- 241000894007 species Species 0.000 description 48
- 238000012217 deletion Methods 0.000 description 43
- 230000037430 deletion Effects 0.000 description 43
- 230000000875 corresponding effect Effects 0.000 description 42
- 229940024606 amino acid Drugs 0.000 description 41
- 240000008042 Zea mays Species 0.000 description 39
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 39
- 230000002068 genetic effect Effects 0.000 description 39
- 238000004458 analytical method Methods 0.000 description 36
- 230000000295 complement effect Effects 0.000 description 36
- 239000013615 primer Substances 0.000 description 36
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 35
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 33
- 235000009973 maize Nutrition 0.000 description 33
- 230000006870 function Effects 0.000 description 30
- 238000003976 plant breeding Methods 0.000 description 30
- 108010042407 Endonucleases Proteins 0.000 description 27
- 102000004533 Endonucleases Human genes 0.000 description 27
- 108020004999 messenger RNA Proteins 0.000 description 27
- 238000003752 polymerase chain reaction Methods 0.000 description 27
- 208000035240 Disease Resistance Diseases 0.000 description 25
- 230000003612 virological effect Effects 0.000 description 24
- 208000015181 infectious disease Diseases 0.000 description 23
- 230000035772 mutation Effects 0.000 description 23
- 230000000694 effects Effects 0.000 description 22
- 239000000047 product Substances 0.000 description 22
- 230000001105 regulatory effect Effects 0.000 description 22
- 230000004048 modification Effects 0.000 description 21
- 238000012986 modification Methods 0.000 description 21
- 235000017590 Nymphoides indica Nutrition 0.000 description 20
- 240000000905 Nymphoides indica Species 0.000 description 20
- 238000003780 insertion Methods 0.000 description 20
- 230000037431 insertion Effects 0.000 description 20
- 239000013612 plasmid Substances 0.000 description 20
- 230000006872 improvement Effects 0.000 description 19
- 241000894006 Bacteria Species 0.000 description 18
- 238000009396 hybridization Methods 0.000 description 18
- 208000024891 symptom Diseases 0.000 description 18
- 235000005273 Canna coccinea Nutrition 0.000 description 17
- 244000292211 Canna coccinea Species 0.000 description 17
- 241001223281 Peronospora Species 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 17
- 239000012636 effector Substances 0.000 description 17
- 239000003550 marker Substances 0.000 description 17
- 241000228143 Penicillium Species 0.000 description 16
- 230000009261 transgenic effect Effects 0.000 description 16
- 241000589158 Agrobacterium Species 0.000 description 15
- 102000004190 Enzymes Human genes 0.000 description 15
- 108090000790 Enzymes Proteins 0.000 description 15
- 229940088598 enzyme Drugs 0.000 description 15
- 239000000463 material Substances 0.000 description 15
- 101150084750 1 gene Proteins 0.000 description 14
- 230000008569 process Effects 0.000 description 14
- 125000000539 amino acid group Chemical group 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 13
- 230000036961 partial effect Effects 0.000 description 13
- 230000010076 replication Effects 0.000 description 13
- 239000000523 sample Substances 0.000 description 13
- 239000013603 viral vector Substances 0.000 description 13
- 101710132601 Capsid protein Proteins 0.000 description 12
- 101710094648 Coat protein Proteins 0.000 description 12
- 108020004705 Codon Proteins 0.000 description 12
- 241001480224 Heterodera Species 0.000 description 12
- 101710125418 Major capsid protein Proteins 0.000 description 12
- 241000244206 Nematoda Species 0.000 description 12
- 101710141454 Nucleoprotein Proteins 0.000 description 12
- 101710083689 Probable capsid protein Proteins 0.000 description 12
- 210000003763 chloroplast Anatomy 0.000 description 12
- 230000001404 mediated effect Effects 0.000 description 12
- 230000008685 targeting Effects 0.000 description 12
- 206010020649 Hyperkeratosis Diseases 0.000 description 11
- 241000607479 Yersinia pestis Species 0.000 description 11
- 230000001580 bacterial effect Effects 0.000 description 11
- 210000000349 chromosome Anatomy 0.000 description 11
- 238000012163 sequencing technique Methods 0.000 description 11
- 238000013518 transcription Methods 0.000 description 11
- 230000035897 transcription Effects 0.000 description 11
- 241000223208 Curvularia Species 0.000 description 10
- 241000252165 Elops saurus Species 0.000 description 10
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 10
- 244000291473 Musa acuminata Species 0.000 description 10
- 240000008790 Musa x paradisiaca Species 0.000 description 10
- 241000813090 Rhizoctonia solani Species 0.000 description 10
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000003776 cleavage reaction Methods 0.000 description 10
- 230000001939 inductive effect Effects 0.000 description 10
- 231100000350 mutagenesis Toxicity 0.000 description 10
- 230000007017 scission Effects 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- 238000012546 transfer Methods 0.000 description 10
- 230000014616 translation Effects 0.000 description 10
- 241000233866 Fungi Species 0.000 description 9
- 241000223195 Fusarium graminearum Species 0.000 description 9
- 108020004485 Nonsense Codon Proteins 0.000 description 9
- 238000007792 addition Methods 0.000 description 9
- 239000002299 complementary DNA Substances 0.000 description 9
- 230000000408 embryogenic effect Effects 0.000 description 9
- 239000013604 expression vector Substances 0.000 description 9
- 238000000338 in vitro Methods 0.000 description 9
- 230000010354 integration Effects 0.000 description 9
- 230000002829 reductive effect Effects 0.000 description 9
- 238000011160 research Methods 0.000 description 9
- 230000002441 reversible effect Effects 0.000 description 9
- 230000035945 sensitivity Effects 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 241000131448 Mycosphaerella Species 0.000 description 8
- 241000684075 Rhizoctonia sp. Species 0.000 description 8
- 230000027455 binding Effects 0.000 description 8
- 238000010367 cloning Methods 0.000 description 8
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 8
- 210000000056 organ Anatomy 0.000 description 8
- 238000013519 translation Methods 0.000 description 8
- 241000222290 Cladosporium Species 0.000 description 7
- 241000395107 Cladosporium cucumerinum Species 0.000 description 7
- 102000053602 DNA Human genes 0.000 description 7
- 108091029865 Exogenous DNA Proteins 0.000 description 7
- 241000235527 Rhizopus Species 0.000 description 7
- 108091023040 Transcription factor Proteins 0.000 description 7
- 102000040945 Transcription factor Human genes 0.000 description 7
- 108700019146 Transgenes Proteins 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 239000003795 chemical substances by application Substances 0.000 description 7
- 230000002538 fungal effect Effects 0.000 description 7
- 230000030279 gene silencing Effects 0.000 description 7
- 238000012226 gene silencing method Methods 0.000 description 7
- 238000001727 in vivo Methods 0.000 description 7
- 229960000318 kanamycin Drugs 0.000 description 7
- 239000002245 particle Substances 0.000 description 7
- 230000004568 DNA-binding Effects 0.000 description 6
- 241000209510 Liliopsida Species 0.000 description 6
- 206010028851 Necrosis Diseases 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 241000013557 Plantaginaceae Species 0.000 description 6
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 6
- 235000005822 corn Nutrition 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 6
- 230000002708 enhancing effect Effects 0.000 description 6
- 241001233957 eudicotyledons Species 0.000 description 6
- 235000013305 food Nutrition 0.000 description 6
- 230000012010 growth Effects 0.000 description 6
- 229930027917 kanamycin Natural products 0.000 description 6
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 6
- 229930182823 kanamycin A Natural products 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 230000017074 necrotic cell death Effects 0.000 description 6
- 230000037039 plant physiology Effects 0.000 description 6
- 230000000644 propagated effect Effects 0.000 description 6
- 210000001938 protoplast Anatomy 0.000 description 6
- 125000006850 spacer group Chemical group 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 238000010453 CRISPR/Cas method Methods 0.000 description 5
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 5
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- 241000238631 Hexapoda Species 0.000 description 5
- 235000000139 Musa basjoo Nutrition 0.000 description 5
- 240000000569 Musa basjoo Species 0.000 description 5
- 241000588653 Neisseria Species 0.000 description 5
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- 241001123567 Puccinia sorghi Species 0.000 description 5
- 208000026487 Triploidy Diseases 0.000 description 5
- 239000003242 anti bacterial agent Substances 0.000 description 5
- 230000000692 anti-sense effect Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 230000006378 damage Effects 0.000 description 5
- 210000002257 embryonic structure Anatomy 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 239000004009 herbicide Substances 0.000 description 5
- 210000005260 human cell Anatomy 0.000 description 5
- 230000002458 infectious effect Effects 0.000 description 5
- 238000011081 inoculation Methods 0.000 description 5
- 238000002955 isolation Methods 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- 238000002703 mutagenesis Methods 0.000 description 5
- 230000010152 pollination Effects 0.000 description 5
- 238000006116 polymerization reaction Methods 0.000 description 5
- 239000002987 primer (paints) Substances 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 238000002864 sequence alignment Methods 0.000 description 5
- 230000001568 sexual effect Effects 0.000 description 5
- 230000009885 systemic effect Effects 0.000 description 5
- 238000011426 transformation method Methods 0.000 description 5
- 230000001052 transient effect Effects 0.000 description 5
- 229940035893 uracil Drugs 0.000 description 5
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 4
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 4
- 108091079001 CRISPR RNA Proteins 0.000 description 4
- 108700010070 Codon Usage Proteins 0.000 description 4
- 241000371644 Curvularia ravenelii Species 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- 241000186660 Lactobacillus Species 0.000 description 4
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 4
- 241000495102 Maize mosaic nucleorhabdovirus Species 0.000 description 4
- 241000219823 Medicago Species 0.000 description 4
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 4
- 241000243785 Meloidogyne javanica Species 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 240000007594 Oryza sativa Species 0.000 description 4
- 235000007164 Oryza sativa Nutrition 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- 239000004365 Protease Substances 0.000 description 4
- 108010076504 Protein Sorting Signals Proteins 0.000 description 4
- 241000087479 Pseudocercospora fijiensis Species 0.000 description 4
- 241000589615 Pseudomonas syringae Species 0.000 description 4
- 238000010240 RT-PCR analysis Methods 0.000 description 4
- 108020004511 Recombinant DNA Proteins 0.000 description 4
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 4
- 241000711931 Rhabdoviridae Species 0.000 description 4
- 241001019511 Sarocladium zeae Species 0.000 description 4
- 241001558929 Sclerotium <basidiomycota> Species 0.000 description 4
- 244000309478 Septoria zeae Species 0.000 description 4
- 241000209072 Sorghum Species 0.000 description 4
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 4
- 241000723806 Sugarcane mosaic virus Species 0.000 description 4
- 208000035199 Tetraploidy Diseases 0.000 description 4
- 108700009124 Transcription Initiation Site Proteins 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-N acetic acid Substances CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 229940088710 antibiotic agent Drugs 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000037429 base substitution Effects 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 230000007123 defense Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000004069 differentiation Effects 0.000 description 4
- 241001493065 dsRNA viruses Species 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 230000001976 improved effect Effects 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 239000003112 inhibitor Substances 0.000 description 4
- 229940039696 lactobacillus Drugs 0.000 description 4
- 230000013011 mating Effects 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 210000004940 nucleus Anatomy 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 230000004936 stimulating effect Effects 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- KPQFKCWYCKXXIP-XLPZGREQSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-(methylamino)pyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(NC)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 KPQFKCWYCKXXIP-XLPZGREQSA-N 0.000 description 3
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 3
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 241000203069 Archaea Species 0.000 description 3
- 241000228212 Aspergillus Species 0.000 description 3
- 230000033616 DNA repair Effects 0.000 description 3
- 230000007018 DNA scission Effects 0.000 description 3
- 241000588698 Erwinia Species 0.000 description 3
- 241000306559 Exserohilum Species 0.000 description 3
- 241000427940 Fusarium solani Species 0.000 description 3
- 241000702463 Geminiviridae Species 0.000 description 3
- 235000010469 Glycine max Nutrition 0.000 description 3
- 244000068988 Glycine max Species 0.000 description 3
- 241000589989 Helicobacter Species 0.000 description 3
- 241000590002 Helicobacter pylori Species 0.000 description 3
- 101000794213 Homo sapiens Thymus-specific serine protease Proteins 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- 208000032420 Latent Infection Diseases 0.000 description 3
- 241000255777 Lepidoptera Species 0.000 description 3
- 241000186779 Listeria monocytogenes Species 0.000 description 3
- 241000218922 Magnoliophyta Species 0.000 description 3
- 241000723994 Maize dwarf mosaic virus Species 0.000 description 3
- 241000724202 Maize stripe tenuivirus Species 0.000 description 3
- 241000589325 Methylobacillus Species 0.000 description 3
- 241001504470 Motacillidae Species 0.000 description 3
- 241000234615 Musaceae Species 0.000 description 3
- 241001459119 Musella Species 0.000 description 3
- 108091092724 Noncoding DNA Proteins 0.000 description 3
- 241000228150 Penicillium chrysogenum Species 0.000 description 3
- 241001112091 Pseudoviridae Species 0.000 description 3
- 241000918585 Pythium aphanidermatum Species 0.000 description 3
- 241000334150 Ramulispora sorghi f. maydis Species 0.000 description 3
- 241001361634 Rhizoctonia Species 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 241000228417 Sarocladium strictum Species 0.000 description 3
- 241000221696 Sclerotinia sclerotiorum Species 0.000 description 3
- 241000193996 Streptococcus pyogenes Species 0.000 description 3
- 102100030138 Thymus-specific serine protease Human genes 0.000 description 3
- 102100026260 Titin Human genes 0.000 description 3
- 241000209140 Triticum Species 0.000 description 3
- 235000021307 Triticum Nutrition 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 230000009418 agronomic effect Effects 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 230000008827 biological function Effects 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 210000002421 cell wall Anatomy 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 244000038559 crop plants Species 0.000 description 3
- 210000000805 cytoplasm Anatomy 0.000 description 3
- 238000006481 deamination reaction Methods 0.000 description 3
- 230000007614 genetic variation Effects 0.000 description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 3
- 229910052737 gold Inorganic materials 0.000 description 3
- 239000010931 gold Substances 0.000 description 3
- 229940037467 helicobacter pylori Drugs 0.000 description 3
- 230000002363 herbicidal effect Effects 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000008595 infiltration Effects 0.000 description 3
- 238000001764 infiltration Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 239000012139 lysis buffer Substances 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 230000000442 meristematic effect Effects 0.000 description 3
- 238000000520 microinjection Methods 0.000 description 3
- 238000001823 molecular biology technique Methods 0.000 description 3
- 238000009343 monoculture Methods 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 239000013600 plasmid vector Substances 0.000 description 3
- 235000013824 polyphenols Nutrition 0.000 description 3
- 230000035755 proliferation Effects 0.000 description 3
- 230000009145 protein modification Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 230000010153 self-pollination Effects 0.000 description 3
- HBMJWWWQQXIZIP-UHFFFAOYSA-N silicon carbide Chemical class [Si+]#[C-] HBMJWWWQQXIZIP-UHFFFAOYSA-N 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 3
- 229910052721 tungsten Inorganic materials 0.000 description 3
- 239000010937 tungsten Substances 0.000 description 3
- 241001430294 unidentified retrovirus Species 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 108020005345 3' Untranslated Regions Proteins 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 241001600124 Acidovorax avenae Species 0.000 description 2
- 241000606748 Actinobacillus pleuropneumoniae Species 0.000 description 2
- 241000948980 Actinobacillus succinogenes Species 0.000 description 2
- 241000606731 Actinobacillus suis Species 0.000 description 2
- 241000186361 Actinobacteria <class> Species 0.000 description 2
- 241001621927 Aminomonas Species 0.000 description 2
- 101100202645 Arabidopsis thaliana SDN1 gene Proteins 0.000 description 2
- 101100202646 Arabidopsis thaliana SDN2 gene Proteins 0.000 description 2
- 101100202647 Arabidopsis thaliana SDN3 gene Proteins 0.000 description 2
- 241000228197 Aspergillus flavus Species 0.000 description 2
- 241000228245 Aspergillus niger Species 0.000 description 2
- 235000007319 Avena orientalis Nutrition 0.000 description 2
- 244000075850 Avena orientalis Species 0.000 description 2
- 241000193755 Bacillus cereus Species 0.000 description 2
- 241000193399 Bacillus smithii Species 0.000 description 2
- 244000063299 Bacillus subtilis Species 0.000 description 2
- 235000014469 Bacillus subtilis Nutrition 0.000 description 2
- 241000193388 Bacillus thuringiensis Species 0.000 description 2
- 241000724306 Barley stripe mosaic virus Species 0.000 description 2
- 241000709756 Barley yellow dwarf virus Species 0.000 description 2
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 2
- 241000123650 Botrytis cinerea Species 0.000 description 2
- 102100036008 CD48 antigen Human genes 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 241001115395 Caulimoviridae Species 0.000 description 2
- 108010061190 Cinnamyl-alcohol dehydrogenase Proteins 0.000 description 2
- 241000193403 Clostridium Species 0.000 description 2
- 241000193171 Clostridium butyricum Species 0.000 description 2
- 241000228437 Cochliobolus Species 0.000 description 2
- 241000254173 Coleoptera Species 0.000 description 2
- 241001429695 Colletotrichum graminicola Species 0.000 description 2
- 241000186249 Corynebacterium sp. Species 0.000 description 2
- 241000724252 Cucumber mosaic virus Species 0.000 description 2
- 102100026846 Cytidine deaminase Human genes 0.000 description 2
- 108010031325 Cytidine deaminase Proteins 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 230000008836 DNA modification Effects 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- 241001422851 Didymella maydis Species 0.000 description 2
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 241000588914 Enterobacter Species 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 101000658547 Escherichia coli (strain K12) Type I restriction enzyme EcoKI endonuclease subunit Proteins 0.000 description 2
- 101000658543 Escherichia coli Type I restriction enzyme EcoAI endonuclease subunit Proteins 0.000 description 2
- 101000658546 Escherichia coli Type I restriction enzyme EcoEI endonuclease subunit Proteins 0.000 description 2
- 101000658530 Escherichia coli Type I restriction enzyme EcoR124II endonuclease subunit Proteins 0.000 description 2
- 101000658540 Escherichia coli Type I restriction enzyme EcoprrI endonuclease subunit Proteins 0.000 description 2
- 241000589601 Francisella Species 0.000 description 2
- 241000223193 Fusarium acuminatum Species 0.000 description 2
- 241001149959 Fusarium sp. Species 0.000 description 2
- 241000027294 Fusi Species 0.000 description 2
- 102100026406 G/T mismatch-specific thymine DNA glycosylase Human genes 0.000 description 2
- 241000968725 Gammaproteobacteria bacterium Species 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 239000005561 Glufosinate Substances 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 101000658545 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) Type I restriction enyme HindI endonuclease subunit Proteins 0.000 description 2
- 241000606766 Haemophilus parainfluenzae Species 0.000 description 2
- 241000543133 Helicobacter canadensis Species 0.000 description 2
- 240000000594 Heliconia bihai Species 0.000 description 2
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 2
- 241000258937 Hemiptera Species 0.000 description 2
- 241001481225 Heterodera avenae Species 0.000 description 2
- 101000716130 Homo sapiens CD48 antigen Proteins 0.000 description 2
- 240000005979 Hordeum vulgare Species 0.000 description 2
- 235000007340 Hordeum vulgare Nutrition 0.000 description 2
- 241000257303 Hymenoptera Species 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 241001429318 Johnsongrass mosaic virus Species 0.000 description 2
- 101100288095 Klebsiella pneumoniae neo gene Proteins 0.000 description 2
- 125000000393 L-methionino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])C([H])([H])C(SC([H])([H])[H])([H])[H] 0.000 description 2
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- 241000584607 Macrospora Species 0.000 description 2
- 241000611254 Maize rayado fino virus Species 0.000 description 2
- 241000702659 Maize rough dwarf virus Species 0.000 description 2
- 241000702489 Maize streak virus Species 0.000 description 2
- 101000658548 Methanocaldococcus jannaschii (strain ATCC 43067 / DSM 2661 / JAL-1 / JCM 10045 / NBRC 100440) Putative type I restriction enzyme MjaIXP endonuclease subunit Proteins 0.000 description 2
- 101000658542 Methanocaldococcus jannaschii (strain ATCC 43067 / DSM 2661 / JAL-1 / JCM 10045 / NBRC 100440) Putative type I restriction enzyme MjaVIIIP endonuclease subunit Proteins 0.000 description 2
- 101000658529 Methanocaldococcus jannaschii (strain ATCC 43067 / DSM 2661 / JAL-1 / JCM 10045 / NBRC 100440) Putative type I restriction enzyme MjaVIIP endonuclease subunit Proteins 0.000 description 2
- 241001480037 Microsporum Species 0.000 description 2
- 241001459120 Musella lasiocarpa Species 0.000 description 2
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 2
- 244000061176 Nicotiana tabacum Species 0.000 description 2
- 241001246255 Oat sterile dwarf virus Species 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 241000606856 Pasteurella multocida Species 0.000 description 2
- 206010034133 Pathogen resistance Diseases 0.000 description 2
- 235000017337 Persicaria hydropiper Nutrition 0.000 description 2
- 240000000275 Persicaria hydropiper Species 0.000 description 2
- 108020005089 Plant RNA Proteins 0.000 description 2
- 241000209504 Poaceae Species 0.000 description 2
- 108010039918 Polylysine Proteins 0.000 description 2
- 208000020584 Polyploidy Diseases 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 238000002123 RNA extraction Methods 0.000 description 2
- 241000201375 Radopholus similis Species 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 241000702247 Reoviridae Species 0.000 description 2
- 241000235546 Rhizopus stolonifer Species 0.000 description 2
- 241000190950 Rhodopseudomonas palustris Species 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 241000724205 Rice stripe tenuivirus Species 0.000 description 2
- 240000000111 Saccharum officinarum Species 0.000 description 2
- 235000007201 Saccharum officinarum Nutrition 0.000 description 2
- 241001533598 Septoria Species 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 240000003768 Solanum lycopersicum Species 0.000 description 2
- 241001455595 Sorghum mosaic virus Species 0.000 description 2
- 241000191967 Staphylococcus aureus Species 0.000 description 2
- 101001042773 Staphylococcus aureus (strain COL) Type I restriction enzyme SauCOLORF180P endonuclease subunit Proteins 0.000 description 2
- 101000838760 Staphylococcus aureus (strain MRSA252) Type I restriction enzyme SauMRSORF196P endonuclease subunit Proteins 0.000 description 2
- 101000838761 Staphylococcus aureus (strain MSSA476) Type I restriction enzyme SauMSSORF170P endonuclease subunit Proteins 0.000 description 2
- 101000838758 Staphylococcus aureus (strain MW2) Type I restriction enzyme SauMW2ORF169P endonuclease subunit Proteins 0.000 description 2
- 101001042566 Staphylococcus aureus (strain Mu50 / ATCC 700699) Type I restriction enzyme SauMu50ORF195P endonuclease subunit Proteins 0.000 description 2
- 101000838763 Staphylococcus aureus (strain N315) Type I restriction enzyme SauN315I endonuclease subunit Proteins 0.000 description 2
- 101000838759 Staphylococcus epidermidis (strain ATCC 35984 / RP62A) Type I restriction enzyme SepRPIP endonuclease subunit Proteins 0.000 description 2
- 101000838756 Staphylococcus saprophyticus subsp. saprophyticus (strain ATCC 15305 / DSM 20229 / NCIMB 8711 / NCTC 7292 / S-41) Type I restriction enzyme SsaAORF53P endonuclease subunit Proteins 0.000 description 2
- 241000692746 Stenocarpella maydis Species 0.000 description 2
- 241000194017 Streptococcus Species 0.000 description 2
- 241000194020 Streptococcus thermophilus Species 0.000 description 2
- 235000021536 Sugar beet Nutrition 0.000 description 2
- 235000016639 Syzygium aromaticum Nutrition 0.000 description 2
- 244000223014 Syzygium aromaticum Species 0.000 description 2
- 108700026226 TATA Box Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 108010035344 Thymine DNA Glycosylase Proteins 0.000 description 2
- 241000219793 Trifolium Species 0.000 description 2
- 229910052770 Uranium Inorganic materials 0.000 description 2
- 244000301083 Ustilago maydis Species 0.000 description 2
- 108020005202 Viral DNA Proteins 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- 241000726445 Viroids Species 0.000 description 2
- 241000589636 Xanthomonas campestris Species 0.000 description 2
- 241000209149 Zea Species 0.000 description 2
- 241000845448 [Rhizoctonia] zeae Species 0.000 description 2
- 230000036579 abiotic stress Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 229940097012 bacillus thuringiensis Drugs 0.000 description 2
- 244000052616 bacterial pathogen Species 0.000 description 2
- 230000033590 base-excision repair Effects 0.000 description 2
- 238000007475 c-index Methods 0.000 description 2
- 108010035812 caffeoyl-CoA O-methyltransferase Proteins 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 235000011089 carbon dioxide Nutrition 0.000 description 2
- 101150038500 cas9 gene Proteins 0.000 description 2
- 239000012707 chemical precursor Substances 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 239000005081 chemiluminescent agent Substances 0.000 description 2
- 210000003555 cloaca Anatomy 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 238000004883 computer application Methods 0.000 description 2
- 230000010154 cross-pollination Effects 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 108010029834 cytosine-DNA glycosidase Proteins 0.000 description 2
- 230000009615 deamination Effects 0.000 description 2
- 210000001840 diploid cell Anatomy 0.000 description 2
- 208000037771 disease arising from reactivation of latent virus Diseases 0.000 description 2
- 230000024346 drought recovery Effects 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000012520 frozen sample Substances 0.000 description 2
- 239000000417 fungicide Substances 0.000 description 2
- 238000012252 genetic analysis Methods 0.000 description 2
- 102000054766 genetic haplotypes Human genes 0.000 description 2
- 239000003365 glass fiber Substances 0.000 description 2
- 125000001165 hydrophobic group Chemical group 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000002649 immunization Methods 0.000 description 2
- 230000003053 immunization Effects 0.000 description 2
- 238000009399 inbreeding Methods 0.000 description 2
- 239000012678 infectious agent Substances 0.000 description 2
- 230000036512 infertility Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 2
- 235000019341 magnesium sulphate Nutrition 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 210000004379 membrane Anatomy 0.000 description 2
- 239000004570 mortar (masonry) Substances 0.000 description 2
- 229940051027 pasteurella multocida Drugs 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 230000008659 phytopathology Effects 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical group [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 229920000656 polylysine Polymers 0.000 description 2
- 150000008442 polyphenolic compounds Chemical class 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 238000002708 random mutagenesis Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 239000013605 shuttle vector Substances 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 238000010532 solid phase synthesis reaction Methods 0.000 description 2
- 210000001082 somatic cell Anatomy 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 241000114864 ssRNA viruses Species 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 108010076424 stilbene synthase Proteins 0.000 description 2
- 230000035882 stress Effects 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 150000003679 valine derivatives Chemical class 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- 210000002845 virion Anatomy 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 1
- ZBMRKNMTMPPMMK-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid;azane Chemical compound [NH4+].CP(O)(=O)CCC(N)C([O-])=O ZBMRKNMTMPPMMK-UHFFFAOYSA-N 0.000 description 1
- 108020005065 3' Flanking Region Proteins 0.000 description 1
- LOJNBPNACKZWAI-UHFFFAOYSA-N 3-nitro-1h-pyrrole Chemical compound [O-][N+](=O)C=1C=CNC=1 LOJNBPNACKZWAI-UHFFFAOYSA-N 0.000 description 1
- 108020005029 5' Flanking Region Proteins 0.000 description 1
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 1
- OZFPSOBLQZPIAV-UHFFFAOYSA-N 5-nitro-1h-indole Chemical compound [O-][N+](=O)C1=CC=C2NC=CC2=C1 OZFPSOBLQZPIAV-UHFFFAOYSA-N 0.000 description 1
- 235000003934 Abelmoschus esculentus Nutrition 0.000 description 1
- 241001430193 Absiella dolichum Species 0.000 description 1
- 241000208140 Acer Species 0.000 description 1
- 235000004422 Acer negundo Nutrition 0.000 description 1
- 241001600699 Acidovorax avenae subsp. avenae Species 0.000 description 1
- 241001600126 Acidovorax citrulli Species 0.000 description 1
- 241000606750 Actinobacillus Species 0.000 description 1
- 241001147825 Actinomyces sp. Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000055025 Adenosine deaminases Human genes 0.000 description 1
- 241001522110 Aegilops tauschii Species 0.000 description 1
- 241000234282 Allium Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 241001439211 Almeida Species 0.000 description 1
- 241000266327 Alternaria alternariae Species 0.000 description 1
- 241000223602 Alternaria alternata Species 0.000 description 1
- 241000726124 Amazona Species 0.000 description 1
- 229910052695 Americium Inorganic materials 0.000 description 1
- 241001212647 Anisodes Species 0.000 description 1
- 241000256186 Anopheles <genus> Species 0.000 description 1
- 108020005098 Anticodon Proteins 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 241000256844 Apis mellifera Species 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 101100215673 Arabidopsis thaliana AGL11 gene Proteins 0.000 description 1
- 241000222195 Ascochyta Species 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000132177 Aspergillus glaucus Species 0.000 description 1
- 240000006439 Aspergillus oryzae Species 0.000 description 1
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 1
- 241000228257 Aspergillus sp. Species 0.000 description 1
- BHELIUBJHYAEDK-OAIUPTLZSA-N Aspoxicillin Chemical compound C1([C@H](C(=O)N[C@@H]2C(N3[C@H](C(C)(C)S[C@@H]32)C(O)=O)=O)NC(=O)[C@H](N)CC(=O)NC)=CC=C(O)C=C1 BHELIUBJHYAEDK-OAIUPTLZSA-N 0.000 description 1
- 241000222400 Athelia Species 0.000 description 1
- 241001530056 Athelia rolfsii Species 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 1
- 241000606125 Bacteroides Species 0.000 description 1
- 241000725138 Banana bunchy top virus Species 0.000 description 1
- 241001647745 Banksia Species 0.000 description 1
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 241000228438 Bipolaris maydis Species 0.000 description 1
- 241000228439 Bipolaris zeicola Species 0.000 description 1
- 241000335423 Blastomyces Species 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 241001465180 Botrytis Species 0.000 description 1
- 241000339490 Brachyachne Species 0.000 description 1
- 241000589171 Bradyrhizobium sp. Species 0.000 description 1
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 1
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 1
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 1
- 241000193764 Brevibacillus brevis Species 0.000 description 1
- 241000186146 Brevibacterium Species 0.000 description 1
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 1
- 238000010443 CRISPR/Cpf1 gene editing Methods 0.000 description 1
- 241000219357 Cactaceae Species 0.000 description 1
- 241000244203 Caenorhabditis elegans Species 0.000 description 1
- 241000222122 Candida albicans Species 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 description 1
- 241000629503 Carbomyces Species 0.000 description 1
- 241000252254 Catostomidae Species 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- 241000024827 Cephalotrichum Species 0.000 description 1
- 241000227752 Chaetoceros Species 0.000 description 1
- 241000221955 Chaetomium Species 0.000 description 1
- 206010068051 Chimerism Diseases 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 206010008570 Chloasma Diseases 0.000 description 1
- 244000260524 Chrysanthemum balsamita Species 0.000 description 1
- 235000005633 Chrysanthemum balsamita Nutrition 0.000 description 1
- 108090000317 Chymotrypsin Proteins 0.000 description 1
- 241001149955 Cladosporium cladosporioides Species 0.000 description 1
- 241000186650 Clavibacter Species 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 241000222199 Colletotrichum Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 241000217270 Cornucopiae Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- 241000219104 Cucurbitaceae Species 0.000 description 1
- 241000235555 Cunninghamella Species 0.000 description 1
- 241000667819 Cunninghamella sp. Species 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- IMXSCCDUAFEIOE-UHFFFAOYSA-N D-Octopin Natural products OC(=O)C(C)NC(C(O)=O)CCCN=C(N)N IMXSCCDUAFEIOE-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- LMKYZBGVKHTLTN-NKWVEPMBSA-N D-nopaline Chemical compound NC(=N)NCCC[C@@H](C(O)=O)N[C@@H](C(O)=O)CCC(O)=O LMKYZBGVKHTLTN-NKWVEPMBSA-N 0.000 description 1
- IMXSCCDUAFEIOE-RITPCOANSA-N D-octopine Chemical compound [O-]C(=O)[C@@H](C)[NH2+][C@H](C([O-])=O)CCCNC(N)=[NH2+] IMXSCCDUAFEIOE-RITPCOANSA-N 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- 101150074155 DHFR gene Proteins 0.000 description 1
- 108020001738 DNA Glycosylase Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 102000028381 DNA glycosylase Human genes 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 108010079412 DNA topoisomerase VI Proteins 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 1
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 241000588700 Dickeya chrysanthemi Species 0.000 description 1
- 241000935926 Diplodia Species 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 241000399934 Ditylenchus Species 0.000 description 1
- 241000399949 Ditylenchus dipsaci Species 0.000 description 1
- 241001525375 Dolichodorus heterocephalus Species 0.000 description 1
- 241000219764 Dolichos Species 0.000 description 1
- 241001114512 Doratomyces Species 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 235000001950 Elaeis guineensis Nutrition 0.000 description 1
- 244000127993 Elaeis melanococca Species 0.000 description 1
- 244000148064 Enicostema verticillatum Species 0.000 description 1
- 241000194032 Enterococcus faecalis Species 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000234643 Festuca arundinacea Species 0.000 description 1
- 241000702658 Fijivirus Species 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 241000223194 Fusarium culmorum Species 0.000 description 1
- 241000879841 Fusarium oxysporum f. cubense Species 0.000 description 1
- 241001274282 Fusarium zeae Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 206010071602 Genetic polymorphism Diseases 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- 241000282819 Giraffa Species 0.000 description 1
- 241000364040 Glauce Species 0.000 description 1
- 241001468096 Gluconacetobacter diazotrophicus Species 0.000 description 1
- 241000589236 Gluconobacter Species 0.000 description 1
- 108010051815 Glutamyl endopeptidase Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 241000308375 Graminicola Species 0.000 description 1
- 241000606790 Haemophilus Species 0.000 description 1
- 244000020551 Helianthus annuus Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 235000000046 Heliconia caribaea Nutrition 0.000 description 1
- 241001148481 Helicotylenchus Species 0.000 description 1
- 241000678007 Heliospora Species 0.000 description 1
- 241000700130 Heterocephalus Species 0.000 description 1
- 241000580313 Heterodera zeae Species 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000617285 Homo sapiens Tyrosine-protein phosphatase non-receptor type 6 Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 108010044467 Isoenzymes Proteins 0.000 description 1
- 241000256602 Isoptera Species 0.000 description 1
- 240000007049 Juglans regia Species 0.000 description 1
- 235000009496 Juglans regia Nutrition 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 241001134659 Lactobacillus curvatus Species 0.000 description 1
- 241000692127 Lactobacillus vini Species 0.000 description 1
- 241000594386 Lasianthus Species 0.000 description 1
- 241001177160 Lasioderma Species 0.000 description 1
- 241001469654 Lawsonia <weevil> Species 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 241000234435 Lilium Species 0.000 description 1
- 241000186781 Listeria Species 0.000 description 1
- 241001220360 Longidorus Species 0.000 description 1
- 241001424413 Lucia Species 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241001547796 Macrophoma Species 0.000 description 1
- 206010025421 Macule Diseases 0.000 description 1
- 241000499445 Maize chlorotic dwarf virus Species 0.000 description 1
- 241000442455 Maize white line mosaic virus Species 0.000 description 1
- VPRLICVDSGMIKO-UHFFFAOYSA-N Mannopine Natural products NC(=O)CCC(C(O)=O)NCC(O)C(O)C(O)C(O)CO VPRLICVDSGMIKO-UHFFFAOYSA-N 0.000 description 1
- 241001279692 Megachile rotundata Species 0.000 description 1
- 208000003351 Melanosis Diseases 0.000 description 1
- 241001143352 Meloidogyne Species 0.000 description 1
- 241000243786 Meloidogyne incognita Species 0.000 description 1
- 235000006679 Mentha X verticillata Nutrition 0.000 description 1
- 235000002899 Mentha suaveolens Nutrition 0.000 description 1
- 235000001636 Mentha x rotundifolia Nutrition 0.000 description 1
- 241001112067 Metaviridae Species 0.000 description 1
- 241000589323 Methylobacterium Species 0.000 description 1
- 241000863391 Methylophilus Species 0.000 description 1
- 244000174681 Michelia champaca Species 0.000 description 1
- 241000192041 Micrococcus Species 0.000 description 1
- 108091092878 Microsatellite Proteins 0.000 description 1
- 241000228347 Monascus <ascomycete fungus> Species 0.000 description 1
- 241000031003 Monascus ruber Species 0.000 description 1
- 241000588621 Moraxella Species 0.000 description 1
- 241000235395 Mucor Species 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 241001218803 Musa hirta Species 0.000 description 1
- 208000031888 Mycoses Diseases 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 241001336717 Nanoviridae Species 0.000 description 1
- 241000234479 Narcissus Species 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- IOVCWXUNBOPUCH-UHFFFAOYSA-M Nitrite anion Chemical compound [O-]N=O IOVCWXUNBOPUCH-UHFFFAOYSA-M 0.000 description 1
- 241000143395 Nitrosomonas sp. Species 0.000 description 1
- 241000191474 Northern cereal mosaic cytorhabdovirus Species 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 241000233855 Orchidaceae Species 0.000 description 1
- 241000238814 Orthoptera Species 0.000 description 1
- 241000932831 Pantoea stewartii Species 0.000 description 1
- 241000589598 Paracoccus sp. Species 0.000 description 1
- 241000710936 Partitiviridae Species 0.000 description 1
- 241000588702 Pectobacterium carotovorum subsp. carotovorum Species 0.000 description 1
- 241001507677 Penicillium commune Species 0.000 description 1
- 241000228168 Penicillium sp. Species 0.000 description 1
- 241000317173 Perla Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 241000369402 Phycus Species 0.000 description 1
- 241000203073 Phytoplasma sp. Species 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- 101000900567 Pisum sativum Disease resistance response protein Pi49 Proteins 0.000 description 1
- 241001127637 Plantago Species 0.000 description 1
- 241001544359 Polyspora Species 0.000 description 1
- 241000726324 Potato spindle tuber viroid Species 0.000 description 1
- 241000605861 Prevotella Species 0.000 description 1
- 101710130420 Probable capsid assembly scaffolding protein Proteins 0.000 description 1
- 241000899394 Pseudocercospora Species 0.000 description 1
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 1
- 241001281802 Pseudoperonospora Species 0.000 description 1
- 241000221300 Puccinia Species 0.000 description 1
- 241001672981 Purpura Species 0.000 description 1
- 206010037549 Purpura Diseases 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 241000233639 Pythium Species 0.000 description 1
- 241001622911 Pythium graminicola Species 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 241001135508 Ralstonia syzygii Species 0.000 description 1
- 241000218206 Ranunculus Species 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- 241000187693 Rhodococcus rhodochrous Species 0.000 description 1
- 241001478306 Rhodovulum sp. Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 235000004789 Rosa xanthina Nutrition 0.000 description 1
- 241000109329 Rosa xanthina Species 0.000 description 1
- 241001132771 Rotylenchus buxophilus Species 0.000 description 1
- 101150073911 STK gene Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000607149 Salmonella sp. Species 0.000 description 1
- 101710204410 Scaffold protein Proteins 0.000 description 1
- 241000342317 Sclerospora Species 0.000 description 1
- 240000005319 Sedum acre Species 0.000 description 1
- 241000287219 Serinus canaria Species 0.000 description 1
- 241001313308 Serranus tabacarius Species 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 241000258242 Siphonaptera Species 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241001250060 Sphacelotheca Species 0.000 description 1
- 241001136275 Sphingobacterium Species 0.000 description 1
- 241000202917 Spiroplasma Species 0.000 description 1
- 241001250070 Sporisorium reilianum Species 0.000 description 1
- 241001085826 Sporotrichum Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 1
- 241000101515 Staphylotrichum Species 0.000 description 1
- 241000692760 Stenocarpella Species 0.000 description 1
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 1
- 241000194022 Streptococcus sp. Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 102000019197 Superoxide Dismutase Human genes 0.000 description 1
- 108010012715 Superoxide dismutase Proteins 0.000 description 1
- 244000152045 Themeda triandra Species 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 241001414989 Thysanoptera Species 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 241000589886 Treponema Species 0.000 description 1
- 241000589906 Treponema sp. Species 0.000 description 1
- 241001414983 Trichoptera Species 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 241001593750 Turcica Species 0.000 description 1
- 102100033019 Tyrosine-protein phosphatase non-receptor type 11 Human genes 0.000 description 1
- 101710116241 Tyrosine-protein phosphatase non-receptor type 11 Proteins 0.000 description 1
- 102100021657 Tyrosine-protein phosphatase non-receptor type 6 Human genes 0.000 description 1
- 241000196252 Ulva Species 0.000 description 1
- 108020004417 Untranslated RNA Proteins 0.000 description 1
- 102000039634 Untranslated RNA Human genes 0.000 description 1
- 101900122744 Uracil-DNA glycosylase (isoform 1) Proteins 0.000 description 1
- 102300041059 Uracil-DNA glycosylase isoform 1 Human genes 0.000 description 1
- 241001474928 Ustilaginoidea virens Species 0.000 description 1
- 235000015919 Ustilago maydis Nutrition 0.000 description 1
- 241001123668 Verticillium dahliae Species 0.000 description 1
- 235000010749 Vicia faba Nutrition 0.000 description 1
- 240000006677 Vicia faba Species 0.000 description 1
- 235000002098 Vicia faba var. major Nutrition 0.000 description 1
- 241000510764 Villosa Species 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 241000893385 Waitea circinata Species 0.000 description 1
- 241001429320 Wheat streak mosaic virus Species 0.000 description 1
- 108700041896 Zea mays Ubi-1 Proteins 0.000 description 1
- 101710185494 Zinc finger protein Proteins 0.000 description 1
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 1
- 235000006886 Zingiber officinale Nutrition 0.000 description 1
- 244000273928 Zingiber officinale Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 239000009057 abana Substances 0.000 description 1
- 206010000210 abortion Diseases 0.000 description 1
- 231100000176 abortion Toxicity 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- JUGOREOARAHOCO-UHFFFAOYSA-M acetylcholine chloride Chemical compound [Cl-].CC(=O)OCC[N+](C)(C)C JUGOREOARAHOCO-UHFFFAOYSA-M 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010050181 aleurone Proteins 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- LXQXZNRPTYVCNG-UHFFFAOYSA-N americium atom Chemical compound [Am] LXQXZNRPTYVCNG-UHFFFAOYSA-N 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 150000001483 arginine derivatives Chemical class 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- MXWJVTOOROXGIU-UHFFFAOYSA-N atrazine Chemical compound CCNC1=NC(Cl)=NC(NC(C)C)=N1 MXWJVTOOROXGIU-UHFFFAOYSA-N 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 235000021028 berry Nutrition 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 230000008238 biochemical pathway Effects 0.000 description 1
- 238000007622 bioinformatic analysis Methods 0.000 description 1
- 239000003124 biologic agent Substances 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 238000010805 cDNA synthesis kit Methods 0.000 description 1
- 229940095731 candida albicans Drugs 0.000 description 1
- 230000021523 carboxylation Effects 0.000 description 1
- 238000006473 carboxylation reaction Methods 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000036978 cell physiology Effects 0.000 description 1
- 230000008614 cellular interaction Effects 0.000 description 1
- 108010040093 cellulose synthase Proteins 0.000 description 1
- 239000000919 ceramic Substances 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000009402 cross-breeding Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 238000007598 dipping method Methods 0.000 description 1
- 231100000676 disease causative agent Toxicity 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000009144 enzymatic modification Effects 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 230000004345 fruit ripening Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 238000003197 gene knockdown Methods 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- 235000008397 ginger Nutrition 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 210000003783 haploid cell Anatomy 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 210000001320 hippocampus Anatomy 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 208000006278 hypochromic anemia Diseases 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 230000003116 impacting effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 210000001699 lower leg Anatomy 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- VPRLICVDSGMIKO-SZWOQXJISA-N mannopine Chemical compound NC(=O)CC[C@@H](C(O)=O)NC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO VPRLICVDSGMIKO-SZWOQXJISA-N 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 210000000633 nuclear envelope Anatomy 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 229940124276 oligodeoxyribonucleotide Drugs 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 238000009400 out breeding Methods 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000002888 pairwise sequence alignment Methods 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 230000007918 pathogenicity Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N phenol group Chemical group C1(=CC=CC=C1)O ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 210000002826 placenta Anatomy 0.000 description 1
- 210000000745 plant chromosome Anatomy 0.000 description 1
- 230000008121 plant development Effects 0.000 description 1
- 230000008638 plant developmental process Effects 0.000 description 1
- 230000008635 plant growth Effects 0.000 description 1
- 244000000003 plant pathogen Species 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 230000008119 pollen development Effects 0.000 description 1
- 229920000768 polyamine Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 239000003380 propellant Substances 0.000 description 1
- 238000001814 protein method Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 229940026314 red yeast rice Drugs 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000008261 resistance mechanism Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 101150087005 rga2 gene Proteins 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 230000034655 secondary growth Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-L succinate(2-) Chemical compound [O-]C(=O)CCC([O-])=O KDYFGRWQOYBRFD-UHFFFAOYSA-L 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 229940126577 synthetic vaccine Drugs 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 210000000538 tail Anatomy 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000012090 tissue culture technique Methods 0.000 description 1
- 230000000451 tissue damage Effects 0.000 description 1
- 231100000827 tissue damage Toxicity 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 238000012250 transgenic expression Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 239000011882 ultra-fine particle Substances 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 210000003934 vacuole Anatomy 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 235000020234 walnut Nutrition 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8279—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
- C12N15/8282—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for fungal resistance
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Botany (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
- Peptides Or Proteins (AREA)
Abstract
本公开提供了用于提供对真菌病原体(例如镰刀菌属真菌)和由其衍生的植物的广泛抗性的组合物和方法。
Description
相关申请的交叉引用
本申请要求于2019年6月26日提交的美国临时专利申请第62/866,872号和2019年10月7日提交的美国临时专利申请第62/912,010号的权益,其每一个的全部内容均通过引用并入本文。
技术领域
本公开总体上涉及农业工业领域,尤其是具有病原抗性的消费作物的生产。更具体地,本公开涉及用于产生植物的组合物和方法,所述植物具有抗例如土生镰刀菌真菌等真菌病原体的性状和/或显示出对由所述真菌病原体引起的疾病的抗性。
对以电子方式提交的文本文件的描述
与本申请相关的序列表以文本格式提供,而不是纸质副本。随附以电子方式提交的文本文件的内容通过引用以其整体并入本文:序列表的计算机可读格式副本(文件名称:EVOL_009_02WO_SeqList_ST25.txt,记录的日期:2020年5月28日,文件大小:≈26.9千字节)。
背景技术
香蕉是世界上最大的水果作物之一,总产量超过1亿公吨。香蕉是发达国家最受欢迎的水果,并且是世界大部分地区的重要食物和收入来源,为许多热带和亚热带国家提供了食物安全。事实上,香蕉是发展中国家第四重要的粮食作物,在这些发展中国家中,绝大多数的香蕉是在当地生产和消费的。主要生产国是印度、中国、厄瓜多尔、巴西和一些非洲国家。
约15%的香蕉产量在全球市场上交易,每年产生约80亿美元。最大的出口国是厄瓜多尔、菲律宾、哥斯达黎加和哥伦比亚。
然而,这一重要作物现在受到由尖孢镰刀菌古巴专化型(Fusarium oxysporumf.sp.cubense)(Foc)引起的枯萎病(其还被称为巴拿马病)的严重威胁。
世界上一半的商业香蕉作物并且甚至在一些国家高达90%的香蕉出口都由单一的一组克隆繁殖的栽培品种香芽蕉基因型(Cavendish genotypes)组成。此外,大多数商业交易的香蕉和许多当地消费的香蕉都是在特定的地区与单一作物克隆种植的,被称为“单一栽培”。单一栽培已经被农民广泛地实践以大量生产高度需求的作物(例如香蕉),这种作物很容易受到一系列真菌、病毒、细菌和线虫疾病的影响。显然,由于易受感染的香芽蕉的大规模单一栽培,目前巴拿马病流行的蔓延尤其具有破坏性。
香芽蕉是属于AAA香蕉栽培品种组的香芽蕉亚组的许多香蕉栽培品种之一的果实。同样的术语也用于描述其上生长有香蕉的植物。它们包括商业上重要的栽培品种,如‘矮小香芽蕉(Dwarf Cavendish)’(1888)和‘大矮蕉(Grand Nain)’(“金吉达(Chiquita)香蕉”)。“威廉斯(Williams)”是香芽蕉亚群中“粗把香芽蕉”类型的栽培品种。它是商业种植园中种植最广泛的栽培品种之一。“Formosana”是体细胞克隆变种“GCTCV-218”的另一个名称,它对枯萎病TR4具有一定的抗性。其他代表性的商业品种包括“Masak Hijau”和“Robusta”。自20世纪50年代以来,这些栽培品种一直都是国际贸易最多的香蕉。在受到巴拿马病的破坏后,他们更换了大米歇尔香蕉(Gros Michel banana)(在肯尼亚通常被称为坎帕拉香蕉(Kampala banana),并且在乌干达)被称为博戈亚(Bogoya))。
因此,在本领域中存在对枯萎病或巴拿马病具有抗性的香蕉的迫切需求。
发明内容
本公开通过鉴定引起抗性的潜在遗传结构解决了上述巴拿马病问题。此外,本公开教导了可以将这种抗性遗传结构导入易受疾病影响的香蕉并且因此使这些香蕉具有抗病性的方法。这种遗传结构的导入可以采取多种形式,如本文所详述的,包括:传统的植物育种、转基因基因工程改造、下一代植物育种(CRISPR、碱基编辑、MAS等)和其他方法。
在一些实施例中,本文提供了分离的核酸分子,所述分离的核酸分子包含当在植物中表达时编码对尖孢镰刀菌小种4的易感性的核酸序列SEQ ID NO:14,其中SEQ ID NO:14被一个、两个、三个或四个核酸取代修饰,使得所得到的核酸序列当在植物中表达时编码对尖孢镰刀菌小种4的抗性。在一些实施例中,分离的核酸分子包括核酸取代,所述核酸取代包括用G替换对应于SEQ ID NO:14的位置148的T(148T>G)。在一些实施例中,分离的核酸分子包括核酸取代,所述核酸取代包括用A替换对应于SEQ ID NO:14的位置323的T(323T>A)。在一些实施例中,分离的核酸分子包括核酸取代,所述核酸取代包括用C替换对应于SEQID NO:14的位置344的G(344G>C)。在一些实施例中,分离的核酸分子包括核酸取代,所述核酸取代包括用T替换对应于SEQ ID NO:14的位置347的A(347A>T)。在一些实施例中,分离的核酸分子包括核酸取代,所述核酸取代包括用A替换对应于位置323的T(323T>A)、用C替换对应于位置344的G(344G>C)和用T替换对应于位置347的A(347A>T),并且其中所有位置均基于SEQ ID NO:14。在一些实施例中,SEQ ID NO:14的分离的核酸分子编码SEQ ID NO:15的氨基酸序列,并且其中所述核酸取代导致用缬氨酸替换对应于SEQ ID NO:15的位置50的亮氨酸(50L>V)。在一些实施例中,分离的核酸分子包括编码SEQ ID NO:15的氨基酸序列的SEQ ID NO:14,并且其中核酸取代导致用谷氨酸替换对应于SEQ ID NO:15的位置108的缬氨酸(108V>E)。在一些实施例中,分离的核酸包括编码SEQ ID NO:15的氨基酸序列的SEQID NO:14,并且其中核酸取代导致用脯氨酸替换对应于SEQ ID NO:15的位置115的精氨酸(115R>P)。在一些实施例中,分离的核酸分子包括编码SEQ ID NO:15的氨基酸序列的SEQID NO:14,并且其中核酸取代导致用缬氨酸替换对应于SEQ ID NO:15的位置116的天冬氨酸(116D>V)。在一些实施例中,分离的核酸分子包括编码SEQ ID NO:15的氨基酸序列的SEQID NO:14,并且其中核酸取代导致用谷氨酸替换对应于SEQ ID NO:15的位置108的缬氨酸(108V>E),用脯氨酸替换对应于SEQ ID NO:15的位置115的精氨酸(115R>P),和用缬氨酸替换对应于SEQ ID NO:15的位置116的天冬氨酸(116D>V)。
在一些实施例中,所述表达发生在植物细胞、植物组织、植物细胞培养物、植物组织培养物或整株植物中。在一些实施例中,所述表达发生在芭蕉属(Musa)细胞、组织、细胞培养物、组织培养物或整株植物中。在一些实施例中,所述表达发生在小果野蕉(Musaacuminata)细胞、组织、细胞培养物、组织培养物或整株植物中。
在一些实施例中,一种核酸构建体包含与能够驱动核酸序列的表达的启动子可操作地连接的本发明的核酸序列。在一些实施例中,启动子是植物启动子。在一些实施例中,启动子是35S启动子。在一些实施例中,启动子由SEQ ID NO:31编码。
在一些实施例中,一种转化载体包含本发明的核酸构建体。
在一些实施例中,本文提供了一种转化植物细胞的方法,其包括将本发明的转化载体引入到植物细胞中,由此转化的植物细胞表达编码对尖孢镰刀菌小种4的抗性的核酸序列。在一些实施例中,所述方法使用植物细胞,所述植物细胞是芭蕉属植物细胞。在一些实施例中,所述方法使用植物细胞,所述植物细胞是小果野蕉植物细胞。
在一些实施例中,转化的植物组织由转化的植物细胞产生。在一些实施例中,转化的小植株(plantlet)由转化的植物组织产生。在一些实施例中,从转化的小植株产生克隆。在一些实施例中,所述方法包括将转化的小植株或转化的小植株的克隆生长成成熟的转化植物。在一些实施例中,成熟的转化植物是芭蕉属植物并且成熟的转化的芭蕉属植物能够产生果实。在一些实施例中,本发明的方法包括进一步产生成熟的转化的芭蕉属植物的克隆。在一些实施例中,成熟的转化的芭蕉属植物或成熟的转化的芭蕉属植物的克隆被用于育种方法中。
在一些实施例中,本发明提供了一种分离的氨基酸分子,所述分离的氨基酸分子包含编码当在植物中产生时导致对尖孢镰刀菌小种4的易感性的蛋白质的SEQ ID NO:15的氨基酸序列,其中SEQ ID NO:15通过1、2、3或4个氨基酸取代来修饰,使得其编码当在植物中产生时导致对尖孢镰刀菌小种4的抗性的蛋白质。在一些实施例中,氨基酸取代包括用缬氨酸替换对应于SEQ ID NO:15的位置50的亮氨酸(50L>V)。在一些实施例中,氨基酸取代包括用谷氨酸替换对应于SEQ ID NO:15的位置108的缬氨酸(108V>E)。在一些实施例中,氨基酸取代包括用脯氨酸替换对应于SEQ ID NO:15的位置115的精氨酸(115R>P)。在一些实施例中,氨基酸取代包括用缬氨酸替换对应于SEQ ID NO:15的位置116的天冬氨酸(116D>V)。在一些实施例中,氨基酸取代包括用谷氨酸替换对应于SEQ ID NO:15的位置108的缬氨酸(108V>E),用脯氨酸替换对应于SEQ ID NO:15的位置115的精氨酸(115R>P),和用缬氨酸替换对应于SEQ ID NO:15的位置116的天冬氨酸(116D>V)。在一些实施例中,蛋白质产生发生在植物细胞、植物组织、植物细胞培养物、植物组织培养物或整株植物中。在一些实施例中,蛋白质产生发生在芭蕉属细胞、组织、细胞培养物、组织培养物或整株植物中。在一些实施例中,蛋白质产生发生在小果野蕉植物细胞、组织、细胞培养物、组织培养物或整株植物中。
在一些实施例中,本发明的核酸构建体包含当在植物中表达时编码对尖孢镰刀菌小种4的抗性的核酸序列,其中所述核酸序列选自由SEQ ID NO:2、SEQ ID NO:5、SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:18、SEQ ID NO:21、SEQ ID NO:24和SEQ ID NO:29组成的群组,其中核酸序列被可操作地连接至能够驱动核酸序列的表达的启动子。在一些实施例中,启动子是植物启动子。在一些实施例中,启动子是35S启动子。在一些实施例中,启动子由SEQ ID NO:31编码。在一些实施例中,一种转化载体包含本发明的核酸构建体。在一些实施例中,本发明提供了转化植物细胞的方法,其包括将转化载体引入到植物细胞中,由此转化的植物细胞表达编码对尖孢镰刀菌小种4的抗性的核酸序列。在一些实施例中,植物细胞是芭蕉属植物细胞。在一些实施例中,植物细胞是小果野蕉植物细胞。在一些实施例中,所述方法进一步包括从转化的植物细胞产生转化的植物组织。在一些实施例中,转化的小植株由转化的植物组织产生。在一些实施例中,所述方法进一步包括产生转化的小植株的克隆。在一些实施例中,所述方法进一步包括将转化的小植株或转化的小植株的克隆生长成成熟的转化植物。在一些实施例中,成熟的转化植物是芭蕉属植物并且成熟的转化的芭蕉属植物能够产生果实。在一些实施例中,所述方法进一步包括产生成熟的转化的芭蕉属植物的克隆。在一些实施例中,所述成熟的转化的芭蕉属植物或成熟的转化的芭蕉属植物的克隆被用于育种方法中。
在一些实施例中,本发明提供了一种香蕉育种方法,其包括将包含编码对尖孢镰刀菌小种4的抗性的核酸序列的第一芭蕉属植物与对尖孢镰刀菌小种4敏感的第二芭蕉属植物杂交,并基于它们对尖孢镰刀菌小种4的抗性选择杂交的所得后代,其中所述编码对尖孢镰刀菌小种4的抗性的核酸序列选自由SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:9、SEQ IDNO:11、SEQ ID NO:18、SEQ ID NO:21、SEQ ID NO:24和SEQ ID NO:29组成的群组。在一些实施例中,香蕉育种方法进一步包括产生杂交的所得后代的克隆,其中基于它们对尖孢镰刀菌小种4的抗性选择克隆。在一些实施例中,第一芭蕉属植物和第二芭蕉属植物来自不同的芭蕉属物种。在一些实施例中,第一芭蕉属植物和第二芭蕉属植物来自相同的芭蕉属物种。在一些实施例中,第一芭蕉属植物和/或第二芭蕉属植物是小果野蕉植物。在一些实施例中,使用分子标记物来选择表现出对尖孢镰刀菌小种4的抗性的杂交的后代,所述分子标记物基于编码对尖孢镰刀菌小种4的抗性的核酸序列被设计,所述核酸序列存在于在杂交中使用的第一芭蕉属植物中。
在一些实施例中,本发明提供了用于获得具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物细胞的方法,所述方法包括将双链断裂引入到由SEQID NO:14编码的内源性基因中的至少一个位点中,以产生具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物细胞。在一些实施例中,所述方法进一步包括从具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物细胞产生小果野蕉植物,以产生具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物。在一些实施例中,所述方法进一步包括在香蕉育种程序中使用具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物。在一些实施例中,本发明的方法利用植物细胞,所述植物细胞是具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物细胞。在一些实施例中,双链断裂由选自由TALEN、巨型核酸酶(meganuclease)、锌指核酸酶和CRISPR相关的核酸酶组成的群组的核酸酶诱导。在一些实施例中,双链断裂由CRISPR相关核酸酶诱导并且其中提供了向导RNA。
在一些实施例中,本发明提供了用于产生对尖孢镰刀菌小种4的抗性的植物细胞的方法,其包括将至少一种遗传修饰引入到编码对尖孢镰刀菌小种4的易感性的一种或多种内源性核酸序列中,其中所述遗传修饰赋予植物细胞对尖孢镰刀菌小种4的抗性。在一些实施例中,至少一种遗传修饰由TALEN、巨型核酸酶、锌指核酸酶或CRISPR相关的核酸酶引入。在一些实施例中,至少一种遗传修饰由CRISPR相关核酸酶和相关的向导RNA引入。在一些实施例中,至少一种遗传修饰选自由以下组成的列表:用G替换对应于SEQ ID NO:14的位置148的T(148T>G),用A替换对应于SEQ ID NO:14的位置323的T(323T>A),用C替换对应于SEQ ID NO:14的位置344的G(344G>C),和用T替换对应于SEQ ID NO:14的位置347的A(347A>T)。在一些实施例中,至少一种遗传修饰导致选自由以下组成的群组的氨基酸的改变:用缬氨酸替换对应于SEQ ID NO:15的位置50的亮氨酸(50L>V),用谷氨酸替换对应于SEQ IDNO:15的位置108的缬氨酸(108V>E),用脯氨酸替换对应于SEQ ID NO:15的位置115的精氨酸(115R>P),和用缬氨酸替换对应于SEQ ID NO:15的位置116的天冬氨酸(116D>V)。在一些实施例中,植物细胞是芭蕉属植物细胞。在一些实施例中,植物细胞是小果野蕉植物细胞。在一些实施例中,所述方法进一步包括从转化的植物细胞产生转化的植物组织。在一些实施例中,所述方法进一步包括从转化的植物组织产生转化的小植株。在一些实施例中,所述方法进一步包括产生转化的小植株的克隆。在一些实施例中,所述方法进一步包括将转化的小植株或转化的小植株的克隆生长成成熟的转化植物。在一些实施例中,成熟的转化植物是芭蕉属植物并且成熟的转化的芭蕉属植物能够产生果实。在一些实施例中,所述方法进一步包括产生成熟的转化的芭蕉属植物的克隆。在一些实施例中,所述方法进一步包括在育种方法中使用成熟的转化的芭蕉属植物或成熟的转化的芭蕉属植物的克隆。
附图说明
图1说明了比对的香蕉FusR1编码序列。启动(开始)和终止(终止)密码子带下划 线。
芭蕉属物种之间的FusR1核苷酸碱基取代被加粗。编码替代氨基酸残基的取代(即,非同义的)以带有星号(*)的粗体字体显示;沉默的取代以带点(·)的粗体字体显示。前96个碱基编码从成熟蛋白质上切割下来的前导肽(以小写字母显示)。已知这对于Bowman-Birk蛋白来说很常见(Barbosa等人,2007)。发明人使用两种不同的生物信息学工具SignalP-5.0(Armenteros等人,2019)和PrediSi(Hiller等人,2004)确认了前导序列的范围,这两种工具均鉴定了相同的前导肽。使用生物信息学工具DeepLoc-1.0(Armenteros等人,2017),发明人确定成熟的FUSR1蛋白被定位于细胞质(可能性为0.9732)。
大写字母(UPPER CASE)中显示的碱基编码成熟的蛋白质。
相对于其他FusR1序列,野蕉(M.balbisiana)FusR1序列中缺失的碱基(如破折号(-)所示)会导致过早的终止密码子(以斜体的带下划线的小写字母显示)。如文本中所描述的,如文中所述,发明人检查的来自所有野蕉种质(accessions)的FusR1 mRNA具有未剪接的(即表达的)内含子;为了图中清楚起见,并且为了关注来自不同香蕉物种的FusR1编码序列中的序列相似性/差异,此处已经从野蕉中去除了内含子序列,尽管发明人没有看到这种情况发生。因此,SEQ ID NO:27是“假设的”编码序列。
阿宽蕉FusR1序列是从多个种质(ITC1526、ITC1571和PT-BA-00223)获得的,所有这些种质都具有FW抗性。标记为‘FW-抗性’的小果野蕉FusR1序列是从多重FW-抗性的种质获得,包括ITC0896(M.a.subspecies banksii)和PT-BA-00281(Pisang Bangkahulu)。标记为“敏感”的小果野蕉序列来自FW敏感种质ITC0507、ITC0685、PT-BA-00304、PT-BA-00310和PT-BA-00315。这些种质包括来自香蕉栽培品种的多个样品,例如Pisang Madu、PisangPipit和Pisang Rojo Uter,所有这些都被充分表征为FW敏感的(Chen等人,2019)。此处包含的野蕉序列由ITC1016获得。来自芭蕉的FusR1来自FW抗性种质(ITC0061和PD#3064)。
对图1的检查揭示了,我们的FusR1香蕉序列在编码前导肽的区域中是非常保守的,如所预期的。然而,编码成熟FusR1蛋白的FusR1序列显示了异常高数量的非同义取代。这是对这些蛋白质的严重选择压力的结果,这反映在针对这些基因观察到的Ka/Ks比率升高上。(参见下文。)发明人发现了来自阿宽蕉的FusR1的2个FW抗性等位基因。这些差异非常微小并且为了简单起见,在图1中仅示出了来自阿宽蕉的等位基因1(SEQ ID NO:2)。来自阿宽蕉的等位基因2编码序列作为SEQ ID NO:5被包含在序列表中。类似地,发明人在小果野蕉中发现了2个FusR1FW抗性等位基因。这些差异仅在于单个沉默碱基取代。再次,为了简单起见,图1仅示出了这些等位基因之一(SEQ ID NO:9)。第二个等位基因(未显示在图1中)在序列表中被记录为SEQ ID NO:11。
图2说明了比对的香蕉FUSR1蛋白质序列。香蕉FUSR1蛋白序列之间不同的氨基酸残基用下划线标出。前32个残基构成从成熟蛋白质上切割下来的前导肽。前导序列残基以小写字母显示,并且成熟蛋白质残基以大写字母显示。
功能性折叠的香蕉FUSR1蛋白由两个子结构域组成:子结构域1用浅灰色阴影表示;子结构域2由深灰色阴影表示。与其他Bowman-Birk蛋白一样,香蕉FUSR1结构由14个二硫键维持。形成这些二硫键的半胱氨酸残基以粗体显示。每个子结构域都包含反应性位点,其以斜体显示。对胰蛋白酶(子结构域1)和糜蛋白酶(子结构域2)具有特异性的残基用星号(*)表示。对于小果野蕉,Foc4敏感的FusR1等位基因与Foc-4抗性等位基因之间不同的残基用点(·)表示,其中解释Foc4敏感性的精氨酸残基(编号115)以带点(·)的粗体字体显示。
图3提供了基于C2H2基因的核苷酸序列的几种香蕉物种的系统发育树。
此处显示的树拓扑是从我们的香蕉C2H2核苷酸序列的分析中恢复的。这种拓扑与从C2H2蛋白质序列的分析中恢复的拓扑相同。从我们的TOPO6核苷酸和蛋白质序列中恢复相同的树。此处显示的拓扑也类似于参考文献中的拓扑。
值得注意的是,相比之下,从FusR1蛋白质序列和FusR1基因的蛋白质编码区恢复的拓扑给出了不同的拓扑,这显然是在适应期间由于镰刀菌的挑战而对FusR1施加的选择性压力的结果。FusR1的非编码区与C2H2和TOPO6的系统发育树具有相同的拓扑。
使用最大简约法来推断进化史。显示了单个最简约的树。对于所有位点,一致性指数为1.000000,保留指数为1.000000,并且综合指数为1.000000。MP树是使用搜索级别为0的子树修剪再嫁接(Subtree-Pruning-Regrafting)(SPR)算法获得的,其中初始树是通过随机添加序列(10次重复)获得的。该分析涉及5个核苷酸序列。包括的密码子位置是第1+第2+第3+非编码。位点覆盖率低于95%的所有位置都被消除,即在任何位置都允许少于5%的比对缺口、缺失数据和不明确的碱基(部分删除选项)。在最终数据集中存在总共218个位置。进化分析在MEGA X(Kumar等人.2018)中进行。
图4提供了基于FUSR1蛋白序列的几个香蕉物种的系统发生树。应当注意,这棵树将小果野蕉和芭蕉结合在一起,这与它们实际的系统发育关系相反。小果野蕉与野蕉的亲缘关系最密切,其中芭蕉是这两个物种的姐妹分类群(分类单元,taxon)。然而,由于阳性选择的严重影响,小果野蕉和芭蕉的FusR1蛋白序列聚集在一起。(事实上,这些蛋白质序列是相同的。)
使用最大简约法来推断进化史。显示了长度=55的单个最简约的树。对于所有位点,一致性指数为0.963636,保留指数为0.875000,并且综合指数为0.843182。MP树是使用搜索级别为0的子树修剪再嫁接(SPR)算法获得的,其中初始树是通过随机添加序列(10次重复)获得的。进化分析在MEGA X中进行。
图5提供了来自FW敏感的野蕉种质的FusR1 mRNA序列的比对。此处包含的序列从许多野蕉种质(包括ITC1016、ITC0545、ITC0080、ITC1527、ITC0565、ITC1781、ITC1580和其他几个)获得。
野蕉种质之间的FusR1核苷酸碱基取代为斜体。起始和终止(终止)密码子以小写字母显示。相对于其他野蕉种质(以及相对于来自发明人分析的所有其他植物的FusR1序列)的插入被加粗。核苷酸缺失通过冒号(:)表示。来自种质ITC0545和ITC1781的FusR1中的85个碱基对缺失是野蕉独有的。由于来自ITC1781的FusR1序列与来自ITC0545的序列相同,因此在图5中未显示ITC1781。同样,在这些FW敏感的野蕉种质中发现的单个碱基对缺失在任何其他FusR1序列中都没有发现。然而,它存在于发明人分析的所有野蕉种质中。这种单个碱基对缺失导致相对于来自FW抗性香蕉种质的FusR1序列的过早终止密码子。
发明人检查的所有野蕉种质都具有此处显示的4种等位基因类型之一。几个种质共享相同的FusR1等位基因。因此,为了简单起见,在该图中仅显示了4个种质。这4个FusR1等位基因在核苷酸序列上都非常相似。在种质之间存在转录变体,但所有这些变体都具有表达的、非剪接的内含子。所有种质也具有单个碱基对碱基对缺失。三个种质也具有85个碱基对缺失,并且几个具有4个碱基对插入。
因此,所有这些FusR1序列都被“破坏”,并且它们都编码非功能性FusR1蛋白。值得注意的是,所有这些野蕉种质都是FW敏感的。
具体实施方式
本公开通过诱导对许多入侵病原体的防御反应提供了真菌、病毒、细菌和/或线虫疾病的解决方案。本公开提供了鉴定可以在包括香蕉的植物中以及在植物和植物部分中驱动抗病性和/或真菌抗性的遗传材料的方法。此外,本公开提供了将遗传材料转移到易感香蕉栽培品种以便产生疾病和/或真菌抗性的性状的方法。此外,本公开教导了新鉴定的遗传组分和产生具有修饰的抗病性的遗传修饰的植物、植物细胞、组织和种子的方法。
I.定义
除非另有说明,否则本文使用的所有技术术语和科学术语具有与本公开所属领域的普通技术人员通常理解的相同的含义。虽然以下术语被认为是本领域普通技术人员很好理解的,但是阐述以下定义是为了便于解释当前公开的主题。尽管在本公开的实践或测试中可以使用类似于或等同于本文所述的方法和材料的任何方法和材料,但是描述了优选的方法和材料。以下术语定义如下。这些定义是为了说明的目的,并不旨在限制所定义术语领域中的普通含义。
术语“一(a)”或“一(an)”指的是该实体中的一个或多个,即,可以指复数指代物。同样,术语“一(a)”或“一(an)”、“一个或多个”和“至少一个”在本文中可以互换使用。此外,通过不定冠词“一(a)”或“一(an)”提及“一个要素”并不排除存在要素中的多于一个的可能性,除非上下文明确要求存在要素中的一个且仅一个。
如在本说明书中所使用的,术语“和/或”在本公开中用于表示“和”或“或”,除非另有说明。
在整个说明书中,除非上下文另有要求,否则词语“包括(comprise)”或诸如“包括(comprises)”或“包括(comprising)”的变体将被理解为暗示包括所陈述的要素或整数或要素或整数的组,但不排除任何其他要素或整数或要素或整数的组。
如在本申请中所使用的,术语“约(about)”和“约(approximately)”被用作等同物。在本申请中使用的任何带有或不带有约/约的数字意在覆盖相关领域的普通技术人员所理解的任何正常波动。在某些实施例中,术语“约”或“约”是指在所述参考值的任一方向上(大于或小于)落在所述参考值的25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更小的范围内的值,除非另有说明或以其他方式从上下文中明显的(除非这样的数目将超过可能值的100%)。
如本文所使用的,术语核酸或多肽的“至少一部分”或“片段”是指具有此类序列的最小尺寸特征的部分,或全长分子的任何较大片段,直到并包括全长分子。本公开的多核苷酸的片段可以编码遗传调节元件的生物活性部分。遗传调节元件的生物活性部分可以通过分离包含遗传调节元件的本公开的多核苷酸之一的一部分并评估如本文所述的活性来制备。类似地,多肽的一部分可以是4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸等,一直到全长多肽。待使用的部分的长度将取决于特定应用。可用作杂交探针的核酸的一部分可以短至12个核苷酸;在一些实施例中,它是20个核苷酸。可用作表位的多肽的一部分可以短至4个氨基酸。执行全长多肽的功能的多肽的一部分通常将长于4个氨基酸。在一些实施例中,多肽或多核苷酸的片段占参考多肽或多核苷酸的全长的至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%或99%。在一些实施例中,多肽或多核苷酸片段可以包含5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000或更多个核苷酸或氨基酸。
如本文所使用的,术语“密码子优化”意指DNA或RNA的密码子使用与感兴趣的细胞或生物体的密码子使用相适应,以提高感兴趣的细胞或生物体中所述重组核酸的转录速率。本领域技术人员很清楚这样的事实,即由于密码子的简并性,靶核酸可以在一个位置处被修饰,而这种修饰在翻译后仍将在该位置产生相同的氨基酸序列,这是通过密码子优化以考虑靶细胞或生物体的物种特异性密码子使用来实现的。
如本文所使用的,术语“内源性的”或“内源性基因”是指天然存在的基因,位于其在宿主细胞基因组中天然存在的位置。“内源性基因”与“天然基因”同义,如本文所使用的。如本文所述的内源性基因可以包括根据本公开的任何方法已经突变的天然存在的基因的等位基因,即内源性基因可以通过传统的植物育种方法和/或下一代植物育种方法在某个时候被修饰。
如本文所使用的,术语“外源性的”是指来自除了其天然来源之外的某些来源的物质。例如,术语“外源性蛋白质”或“外源性基因”是指来自非天然来源并且其已经被人工提供给生物系统的蛋白质或基因。如本文所使用的,术语“外源性的”与术语“异源性的”可互换使用,并且指来自除其天然来源之外的某些来源的物质。
术语“遗传工程改造的宿主细胞”、“重组宿主细胞”和“重组菌株”在本文中可互换使用,并且是指已经通过本公开的方法进行遗传工程改造的宿主细胞。因此,该术语包括宿主细胞(例如,细菌、酵母细胞、真菌细胞、CHO、人细胞、植物细胞、源自植物的原生质体、愈伤组织等),其已经被遗传改变、修饰或工程改造,使得与来源于它的天然存在的宿主细胞相比,它表现出改变的、修饰的或不同的基因型和/或表型(例如,当遗传修饰影响编码核酸序列时)。应当理解,这些术语不仅指所讨论的特定重组宿主细胞,而且还指此类宿主细胞的后代或潜在后代。
如本文所使用的,术语“异源性的”是指来自除了其天然来源或位置之外的某些来源或位置的物质。在一些实施例中,术语“异源性核酸”是指在特定生物体中不是天然存在的核酸序列。例如,术语“异源性启动子”可以指从一个来源生物体中获取并在另一个生物体中利用的启动子,其中启动子不是天然存在的。然而,术语“异源性启动子”也可指来自同一来源生物体内的启动子,但仅移动到所述启动子通常不位于的新位置。
可以通过使用“表达载体”将异源基因序列引入到靶细胞中,所述“表达载体”可以是真核表达载体,例如植物表达载体。用于构建载体的方法是本领域技术人员熟知的,并且在各种出版物中进行了描述。特别地,用于构建合适的载体的技术(包括功能性组分例如启动子、增强子、终止和聚腺苷酸化信号、选择标记物、复制起点和剪接信号的描述)在现有技术中进行了综述。载体可以包括但不限于质粒载体、噬菌粒、粘粒、人工/微染色体(例如ACE),或病毒载体例如杆状病毒、逆转录病毒、腺病毒、腺相关病毒、单纯疱疹病毒、逆转录病毒、噬菌体。真核表达载体通常还将包含有助于载体在细菌中繁殖的原核生物序列,例如复制起点和用于在细菌中选择的抗生素抗性基因。多种真核表达载体(其包含多核苷酸可以被可操作地连接到其中的克隆位点)在本领域中是熟知的并且一些可以从例如Stratagene,加利福尼亚州拉霍亚(La Jolla,Calif.);Invitrogen,加利福尼亚州卡尔斯巴德(Carlsbad,Calif.);Promega,威斯康星州麦迪逊(Madison,Wis)或BD BiosciencesClontech,加利福尼亚州帕洛阿尔托(Palo Alto,Calif)的公司商业上获得。在一个实施例中,所述表达载体包含至少一个核酸序列,所述核酸序列是对编码感兴趣的肽/多肽/蛋白质的核苷酸序列进行转录和翻译所必需的调节序列。
如本文所使用的,当应用于核酸、多肽、细胞或生物体时,术语“天然存在的”是指在自然界中发现的核酸、多肽、细胞或生物体。术语“天然存在的”可以指来源于天然存在的来源的基因或序列。因此,出于本公开的目的,“非天然存在的”序列是已经被合成、被突变、被工程改造、被编辑或以其他方式被修饰以具有与已知天然序列不同的序列的序列。在一些实施例中,修饰可以在蛋白质水平(例如,氨基酸取代)。在其他实施例中,修饰可以在DNA水平(例如,核苷酸取代)。
如本文所使用的,术语“核苷酸改变”或“核苷酸修饰”是指例如核苷酸取代、缺失和/或插入,如本领域中所熟知的。例如,此类核苷酸改变/修饰包括含有产生沉默取代、添加或缺失的改变的突变,但不改变编码的蛋白质的性质或活性或蛋白质的制造方式。作为另一个实例,此类核苷酸改变/修饰包括含有产生替换取代、添加或缺失的改变的突变,这些改变改变了编码的蛋白质的性质或活性或蛋白质的制造方式。
如本文所使用的,术语“蛋白质修饰”是指例如氨基酸取代、氨基酸修饰、缺失和/或插入,如本领域中所熟知的。
术语“下一代植物育种”是指当今育种者可用的许多植物育种工具和方法。下一代植物育种的关键区别特征是育种者不再局限于依靠观察到的表型变异以便推断给定性状的潜在遗传原因。而是,下一代植物育种可以包括利用分子标记物和标记物辅助选择(MAS),使得育种者可以直接观察等位基因和感兴趣的遗传元件从育种群体中的一种植物到另一种植物的移动,并且不限于仅仅观察表型。此外,下一代植物育种方法并不局限于利用在植物群体中发现的自然遗传变异。而是,利用下一代植物育种方法的育种者可以访问许多现代基因工程改造工具,这些工具以有针对性的方式直接改变/变化/编辑植物的基础遗传结构,以便产生感兴趣的表型性状。在方面中,用下一代植物育种方法培育的植物与以传统方式培育的植物无法区分,因为所得到的最终产品植物理论上可以通过任何一种方法开发。在特定的方面中,下一代植物育种方法可以产生包括以下的植物:任何大小的缺失或插入的遗传修饰;一个或多个碱基对取代的遗传修饰;遗传修饰,其是从植物的天然基因池(例如可以与感兴趣的植物杂交或育种的任何植物)内或从植物中核酸序列的编辑引入核酸序列以对应于已知在植物的天然基因池中出现的序列;和所述植物的后代。
如本文所使用的,术语“可操作地连接”是指核酸序列在单个核酸片段上的结合,使得一个核酸片段的功能受另一个核酸片段调节。例如,当启动子能够调节编码序列的表达时(即编码序列在启动子的转录控制下),启动子与编码序列可操作地连接。编码序列可以以有义或反义方向与调控序列可操作地连接。在另一个实例中,本公开的互补RNA区域可以直接或间接地可操作地连接至靶mRNA的5',或靶mRNA的3',或靶mRNA内,或者第一互补区域是5'并且它的补体在靶mRNA的3'端。
本文中可互换使用的术语“多核苷酸”、“核酸”和“核苷酸序列”是指任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸或其类似物)的聚合物形式。该术语指的是分子的一级结构,因此包括双链的和单链的DNA,以及双链的和单链的RNA。该术语包括但不限于单链的、双链的或多链的DNA或RNA、基因组DNA、cDNA、DNA-RNA杂交体,或包含嘌呤和嘧啶碱基或其他天然的、化学或生物化学修饰的、非天然的、或衍生的核苷酸碱基的聚合物。它还包括修饰的核酸,例如甲基化的和/或封端的核酸、含有修饰的碱基的核酸、骨架修饰等。“寡核苷酸”通常是指单链DNA或双链DNA的约5至约100个核苷酸的多核苷酸。然而,出于本公开的目的,对寡核苷酸的长度没有上限。寡核苷酸也称为“寡聚体(oligomers)”或“寡聚体(oligos)”,并且可以从基因中分离,或者通过本领域中已知的方法化学合成。术语“多核苷酸”、“核酸”和“核苷酸序列”应被理解为如适用于所描述的实施例包括单链(例如有义或反义)和双链多核苷酸。
术语“肽”、“多肽”和“蛋白质”在本文中可互换使用,并且是指任何长度的氨基酸的聚合物形式,其可以包括编码的和未编码的氨基酸、化学或生物化学修饰的或衍生的氨基酸以及具有修饰的肽主链的多肽。
如本文所使用的,短语“重组构建体”、“表达构建体”、“嵌合构建体”、“构建体”和“重组DNA构建体”在本文中可互换使用。重组构建体包含核酸片段的人工组合,例如在自然界中未一起发现的调控序列和编码序列。例如,嵌合构建体可以包含来自不同来源的调节序列和编码序列,或者来自相同来源但是以不同于在自然界中发现的方式排列的调节序列和编码序列。此类构建体可以单独使用或者可以与载体结合使用。如果使用载体,那么载体的选择取决于将用于转化宿主细胞的方法,如本领域技术人员所熟知的。例如,可以使用质粒载体。技术人员非常清楚为了成功地转化、选择和繁殖包含本公开的任何分离的核酸片段的宿主细胞,必须存在于载体上的遗传元件。本领域技术人员还将认识到,不同的独立转化事件将导致不同的表达水平和模式(Jones等人,(1985)EMBO J.4:2411-2418;DeAlmeida等人,(1989)《分子和普通遗传学(Mol.Gen.Genetics)》218:78-86),因此必须筛选多个事件,以便获得显示所需的表达水平和模式的品系。这种筛选可以通过DNA的Southern分析、mRNA表达的Northern分析、蛋白质表达的免疫印迹分析或表型分析以及其他来完成。载体可以是质粒、病毒、噬菌体、前病毒、噬菌粒、转座子、人工染色体等,其自主地复制或者可以整合到宿主细胞的染色体中。载体也可以是不自主地复制的裸RNA多核苷酸、裸DNA多核苷酸、由同一条链内的DNA和RNA组成的多核苷酸、聚赖氨酸缀合的DNA或RNA、肽缀合的DNA或RNA、脂质体缀合的DNA等。如本文所使用的,术语“表达”是指产生功能性终产物,例如mRNA或蛋白质(前体或成熟)。
术语“传统植物育种”是指利用在植物群体中发现的自然变异作为等位基因和遗传变体的来源,这些等位基因和遗传变体赋予给定的植物感兴趣的性状。传统的育种方法利用杂交程序,其主要依赖于观察到的表型变异来推断致病等位基因关联。也就是说,传统的植物育种依赖于观察给定植物的表达的表型来推断潜在的遗传原因。这些观察结果用于为育种程序提供信息,以便将等位基因变异移动到感兴趣的种质(germplasm)中。此外,传统的植物育种也被表征为包括随机诱变技术,其可以用于将遗传变异引入到给定的种质中。这些随机诱变技术可以包括化学和/或基于辐射的诱变程序。因此,传统植物育种的一个关键特征是,育种者不利用以靶向的方式直接改变/变化/编辑植物的潜在遗传结构的基因工程改造工具,以便引入遗传多样性并产生感兴趣的表型性状。
因此,如本文所使用的“CRISPR相关的效应子”可以被定义为与CRISPR(聚集的规则间隔的短回文重复序列(Clustered Regularly Interspaced Short PalindromicRepeats))相关的任何核酸酶、切口酶或重组酶,其具有将单链或双链切割引入到基因组靶位点中的能力,或具有将靶向的修饰(包括点突变、插入或缺失)引入到感兴趣的基因组靶位点中的能力。至少一种CRISPR相关的效应子可以单独发挥作用,或作为分子复合物的一部分与其他分子联合发挥作用。CRISPR相关的效应子可以作为融合分子存在,或者作为通过与gRNA和/或靶位点的共价或非共价相互作用中的至少一种结合或被结合的单个分子存在,使得CRISPR相关的复合物的组分在物理上紧密接近。
如本文所使用的“碱基编辑器”是指具有与其衍生的蛋白质相同的催化活性的蛋白质或其片段,该蛋白质或其片段单独或当作为分子复合物(在本文中被称为碱基编辑复合物)提供时具有介导靶向的碱基修饰的能力,即导致感兴趣的点突变的感兴趣的碱基的转化,这又可以导致靶向的突变,如果碱基转化不引起沉默突变,而是由包含待用碱基编辑器转换的位置的密码子编码的氨基酸的转化。至少一个根据本公开的碱基编辑器与至少一个CRISPR相关的效应子临时或永久地连接,或任选地与至少一个CRISPR相关的效应子复合物的组分连接。
术语“Cas9核酸酶”和“Cas9”在本文中可以可互换地使用,其指与CRISPR(聚集的规则间隔的短回文重复序列)相关的RNA引导的DNA核酸内切酶,包括Cas9蛋白或其片段(例如,包含Cas9的活性DNA切割结构域和/或Cas9的gRNA结合结构域的蛋白)。Cas9是CRISPR/Cas基因组编辑系统的组分,其在向导RNA的引导下,靶向并裂解DNA靶序列,以形成DNA双链断裂(DSB)。
术语“CRISPR RNA”或“crRNA”是指负责与靶DNA序列杂交,并募集CRISPR核酸内切酶和/或CRISPR相关的效应子的RNA链。crRNA可以是天然存在的,或者可以根据任何已知的生产RNA的方法合成。
术语“tracrRNA”是指小的反式编码的RNA。TracrRNA与crRNA互补并与crRNA成碱基对,以形成crRNA/tracrRNA杂交体,其能够将CRISPR核酸内切酶和/或CRISPR相关的效应子募集到靶序列中。
如本文所使用的术语“向导RNA”或“gRNA”是指能够将CRISPR核酸内切酶和/或CRISPR相关的效应子募集到靶序列中的RNA序列或序列的组合。通常,gRNA由通过部分互补形成复合物的crRNA和tracrRNA分子组成,其中crRNA包含与用于杂交的靶序列充分互补的序列,并且指导CRISPR复合物(即Cas9-crRNA/tracrRNA杂交体)特异性地结合至靶序列。此外,可以设计包含crRNA和tracrRNA的特征的单向导RNA(sgRNA)。因此,如本文所使用的,向导RNA可以是天然或合成的crRNA(例如,对于Cpf1)、天然或合成的crRNA/tracrRNA杂交体(例如,对于Cas9)或单向导RNA(sgRNA)。
术语“引导序列”或“间隔子序列”是指负责与靶DNA杂交的crRNA或向导RNA(gRNA)的部分。
术语“原型间隔子(protospacer)”是指由crRNA或gRNA的引导序列靶向的DNA序列。在一些实施例中,原型间隔子序列与CRISPR复合物的crRNA或gRNA引导(间隔子)序列杂交。
如本文所使用的术语“CRISPR着陆位点”是指能够被CRISPR-Cas复合物靶向的DNA序列。在一些实施例中,CRISPR着陆位点包含能够被CRISPR复合物切割的邻近放置的原型间隔子/原型间隔子邻近基序组合序列。
术语“CRISPR复合物”、“CRISPR核酸内切酶复合物”、“CRISPR Cas复合物”或“CRISPR-gRNA复合物”在本文中可互换使用。“CRISPR复合物”是指与向导RNA(gRNA)复合的Cas9核酸酶和/或CRISPR相关的效应子。因此,术语“CRISPR复合物”是指能够在CRISPR着陆位点处诱导双链断裂的CRISPR核酸内切酶和向导RNA的组合。在一些实施例中,本公开的“CRISPR复合物”是指催化死亡的Cas9蛋白和向导RNA的组合,其能够靶向靶序列,但由于其失去核酸酶活性而不能在CRISPR着陆位点处诱导双链断裂。在其他实施例中,本公开的“CRISPR复合物”是指能够在DNA中引入gRNA靶向的单链断裂而不是由野生型Cas酶产生的双链断裂的Cas9切口酶和向导RNA的组合。
如本文所使用的,术语“引导序列特异性结合”在CRISPR复合物的上下文中指的是向导RNA将CRISPR核酸内切酶和/或CRISPR相关的效应子募集至CRISPR着陆位点的能力。
如本文所使用的,术语“脱氨酶”是指催化脱氨反应的酶。在本公开的一些实施例中,脱氨酶是指胞苷脱氨酶,其分别催化胞苷或脱氧胞苷脱氨基为尿嘧啶或脱氧尿苷。在本公开的其他实施例中,脱氨酶是指腺苷脱氨酶,其催化腺嘌呤的脱氨基作用以形成次黄嘌呤(以其核苷肌苷的形式),其被DNA聚合酶读作鸟嘌呤。
如本文所使用的,术语“糖基化酶”是指参与碱基切除修复的酶家族,其以EC编号EC3.2.2分类。碱基切除修复是DNA中受损的碱基被移除和替换的机制。DNA糖基化酶催化这一过程的第一步。它们除去受损的含氮碱基,同时保持糖-磷酸骨架完整,形成无嘌呤/无嘧啶位点(其通常称为AP位点)。这是通过将受损的碱基从双螺旋中翻转出来,然后切割N-糖苷键来实现的。在本公开的一些实施例中,在期望提供与脱氨酶等的突变引入趋势不同的突变引入趋势中,使用通过水解DNA的N-糖苷键,然后在细胞的修复过程中诱导突变引入的碱基切除反应。在方面中,使用具有胞嘧啶-DNA糖基化酶(CDG)活性或胸腺嘧啶-DNA糖基化酶(TDG)活性的酶。在方面,酵母线粒体尿嘧啶-DNA糖基化酶(UNG 1)的突变体被用作进行此类碱基切除反应的酶。Nishida等人,2017年11月9日公布的US 2017/0321210 Al,通过引用并入本文。
如本文所使用的,术语“靶向的”是指预期一个项目或分子将以一定程度的特异性与另一个项目或分子相互作用,以便排除非靶向的项目或分子。例如,根据本公开,靶向第二多核苷酸的第一多核苷酸已经被设计成以序列特异性方式(例如,通过Watson-Crick碱基配对)与第二多核苷酸杂交。在一些实施例中,设计所选择的杂交区域,以便杂交对于一个或多个靶向的区域是唯一的。如果第二多核苷酸的靶向序列(杂交的区域)发生突变,或者以其他方式从第二多核苷酸中去除/分离,则第二多核苷酸可以不再是第一靶向多核苷酸的靶标。此外,“靶向的”可以与“位点特异性的”或“位点定向的”可互换地使用,其指的是分子生物学的作用,其使用关于待修饰的感兴趣的基因组区域的序列的信息,并且其进一步依赖于分子工具的作用机制的信息,例如核酸酶,包括CRISPR核酸酶及其变体、TALEN、ZFN、巨型核酸酶或重组酶、DNA修饰酶,包括碱基修饰酶如胞苷脱氨酶、组蛋白修饰酶等、DNA结合蛋白、cr/tracr RNA、向导RNA等。
术语“种子区”是指crRNA或向导RNA的引导序列中最容易与其靶错配的关键部分。在一些实施例中,crRNA/gRNA的种子区中的单个错配可以使CRISPR复合物在该结合位点处失活。在一些实施例中,Cas9核酸内切酶的种子区位于引导序列的3'部分的最后约12nt上,其与邻近PAM的原型间隔子靶序列的部分相对应(杂交)。在一些实施例中,Cpf1核酸内切酶的种子区位于引导序列5'部分的前约5nt,其与邻近PAM的原型间隔子靶序列的部分相对应(杂交)。
术语“序列同一性”是指相同且处于相同相对位置的两个多核苷酸或多肽序列之间的碱基或氨基酸的百分比。因此,与另一种多核苷酸或多肽序列相比,一种多核苷酸或多肽序列具有一定百分比的序列同一性。对于序列比较,通常一个序列充当参考序列,测试序列与该参考序列进行比较。术语“参考序列”是指与测试序列进行比较的分子。当参考蛋白质使用序列同一性百分比时,认识到不相同的残基位置通常因保守的氨基酸取代而不同,其中氨基酸残基被具有相似化学性质(例如电荷或疏水性)的其他氨基酸残基取代,因此不改变分子的功能性质。当序列在保守取代方面不同时,可以向上调整序列同一性百分比以校正取代的保守性质。因此类保守取代而不同的序列被称为具有“序列相似性”或“相似性”。用于进行这种调整的手段是本领域技术人员熟知的。通常,这包括将保守取代评分为部分错配而不是完全错配,从而增加序列同一性百分比。因此,例如,在相同的氨基酸被给予1的评分并且非保守取代被给予0的评分的情况下,保守取代被给予0与1之间的评分。保守替代的评分是根据例如Meyers和Miller,《计算机在生物科学中的应用(ComputerApplic.Biol.Sci.)》4:11-17(1988)的算法计算的。
“互补的”是指通过碱基堆积和特定的氢键,在包含天然或非天然存在的碱基或其类似物的两个序列之间配对的能力。例如,如果核酸的一个位置处的碱基能够与靶的相应位置处的碱基氢键合,则认为这些碱基在该位置处彼此互补。核酸可以包含通用碱基或惰性无碱基间隔子,它们对氢键合没有正或负的贡献。碱基配对可以包括标准Watson-Crick碱基配对和非Watson-Crick碱基配对(例如,Wobble碱基配对和Hoogsteen碱基配对)。应当理解,对于互补碱基配对,腺苷型碱基(A)与胸苷型碱基(T)或尿嘧啶型碱基(U)互补,胞嘧啶型碱基(C)与鸟苷型碱基(G)互补,并且通用碱基例如如3-硝基吡咯或5-硝基吲哚可以与任何A、C、U或T杂交并被认为与它们互补。Nichols等人,《自然(Nature)》,1994;369:492-493和Loakes等人,《核酸研究(Nucleic Acids Res.)》,1994;22:4039-4043。肌苷(I)在本领域中也已经被认为是通用碱基并且被认为与任何A、C、U或T互补。参见Watkins andSanta Lucia,《核酸研究》,2005;33(19):6258-6267。
如本文所提及的,“互补的核酸序列”是包含核苷酸的序列的核酸序列,所述核苷酸的序列使其能够在适当的体外和/或体内温度和溶液离子强度条件下以序列特异性、反平行的方式(即,核酸特异性地结合至互补的核酸)与另一核酸非共价结合。
用于比较和确定百分比序列同一性和百分比互补性的序列比对的方法在本领域中是熟知的。用于比较的序列的最佳比对可以例如通过Needleman和Wunsch,(1970)《分子生物学杂志(J.Mol.Biol.)》48:443的同源比对算法,通过Pearson和Lipman,(1988)《美国国家科学院院刊(Proc.Nat'l.Acad.Sci.USA)》85:2444的相似性搜索方法,通过这些算法的计算机化实现(威斯康星遗传学软件包中的GAP、BESTFIT、FASTA和TFASTA(GAP,BESTFIT,FASTA,and TFASTA in the Wisconsin Genetics Software Package),遗传学计算机组(Genetics Computer Group),575Science Dr.,Madison,WI),通过手动对齐和目视检查(参见,例如,Brent等人,(2003)《分子生物学的当前协议(Current Protocols inMolecular Biology)》),通过使用本领域中已知的算法(包括BLAST和BLAST 2.0算法,其分别在Altschul等人,(1977)《核酸研究》25:3389-3402;和Altschul等人,(1990)《分子生物学杂志》215:403-410中描述)来进行。用于执行BLAST分析的软件可通过国家生物技术信息中心(National Center for Biotechnology Information)公开获得。一些比对程序是MacVector(牛津分子有限公司(Oxford Molecular Ltd),英国牛津)、ALIGN Plus(科学和教育软件(Scientific and Educational Software),宾夕法尼亚州)和AlignX(VectorNTI,Invitrogen,加利福尼亚州卡尔斯巴德)。另一个比对程序是使用默认参数的Sequencher(Gene Codes,密歇根州安阿伯(Ann Arbor,Michigan))和MUSCLE(通过对数期望的多序列比较;一种作为公共领域许可的计算机软件)。
在本文中,术语“杂交”是指互补的核苷酸碱基之间的配对(例如,腺嘌呤(A)与DNA分子中的胸腺嘧啶(T)和RNA分子中的尿嘧啶(U)形成碱基对,并且鸟嘌呤(G)与DNA分子和RNA分子中的胞嘧啶(C)形成碱基对)以形成双链核酸分子。(参见,例如,Wahl和Berger(1987)《酶学方法(Methods Enzymol.)》152:399;Kimmel,(1987)《酶学方法》152:507)。此外,在本领域中还已知,两个RNA分子(例如dsRNA)之间的杂交,即鸟嘌呤(G)碱基对与尿嘧啶(U)的杂交。例如,在tRNA反密码子与mRNA中的密码子碱基配对的情况下,G/U碱基配对是遗传密码简并(即冗余)的部分原因。在本公开的上下文中,向导RNA分子的蛋白质结合区段(dsRNA双链体)的鸟嘌呤(G)被认为与尿嘧啶(U)互补,并且反之亦然。因此,当G/U碱基对可以在向导RNA分子的蛋白质结合区段(dsRNA双链体)的给定核苷酸位置形成时,该位置不被认为是非互补的,而是被认为是互补的。在本领域中应当理解,多核苷酸的序列不需要与其靶核酸的序列100%互补就可特异性杂交。此外,多核苷酸可以在一个或多个区段上杂交,使得插入的或相邻的区段不参与杂交事件(例如,环结构或发夹结构)。多核苷酸可以包含与它们所靶向的靶核酸序列内的靶区域至少70%、至少80%、至少90%、至少95%、至少99%或100%的序列互补性。
术语“修饰的”是指与相应的未修饰的物质或化合物相比已经被改变或变化的物质或化合物(例如,细胞、多核苷酸序列和/或多肽序列)。
“分离的”指的是这样的材料,所述材料在不同程度上游离于通常伴随它以其天然状态存在的组分。
如本文所使用的术语“基因编辑的植物、部分或细胞”是指包含一个或多个由基因编辑系统编辑的内源性基因的植物、部分或细胞。本公开的基因编辑系统包括靶向元件和/或编辑元件。靶向元件能够识别靶基因组序列。编辑元件能够修饰靶基因组序列,例如通过在基因组序列中取代或插入一个或多个核苷酸,在基因组序列中删除一个或多个核苷酸,改变基因组序列以包括调节序列,在安全港基因组位点或基因组中的其他特定位置处插入转基因,或其任意组合。靶向元件和编辑元件可以在相同的核酸分子或不同的核酸分子上。在一些实施例中,编辑元件能够通过使用碱基编辑器(例如胞嘧啶碱基编辑器(CBE)和/或腺嘌呤碱基编辑器(ABE))取代单个核苷酸进行精确的基因组编辑,所述碱基编辑器直接或间接地与CRISPR相关的效应子蛋白融合。
术语“植物”是指整株植物。术语“植物部分”包括分化的和未分化的组织,包括但不限于:植物器官、植物组织、根、茎、芽、砧木、接穗、托叶、花瓣、叶、花、胚珠、花粉、苞片、叶柄、节间、树皮、短柔毛、分蘖、根状茎、复叶、叶片、雄蕊、果实、种子、肿瘤组织和植物细胞(例如,单细胞、原生质体、胚胎和愈伤组织)。植物细胞包括但不限于来自种子、悬浮培养物、胚胎、分生组织区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子的细胞。植物组织可以在植物中或在植物器官、组织或细胞培养物中。
如本文在讨论植物时所使用的,术语“胚珠”是指雌配子体,而术语“花粉”是指雄配子体。
如本文所使用的,术语“植物组织”是指植物的任何部分。植物器官的实例包括但不限于叶、茎、根、块茎、种子、分枝、短柔毛、根瘤、叶腋、花、花粉、雄蕊、雌蕊、花瓣、花序梗、茎、柱头、花柱、苞片、果实、树干、心皮、萼片、花药、胚珠、花梗、针、球果、根茎、匍匐茎、嫩枝、果皮、胚乳、胎盘、浆果、雄蕊和叶鞘。
如本文所使用的,术语“表型”是指个体的细胞、细胞培养物、生物体(例如植物)或生物体的组的可观察的特征,其由该个体的遗传组成(即基因型)与环境之间的相互作用产生。
如本文所使用的术语“转基因”或“转基因的”是指至少一种核酸序列,其取自一种生物体的基因组,或合成产生,然后被导入感兴趣的宿主细胞或生物体或组织中,并随后通过“稳定的”转化或转染方法被整合到宿主的基因组中。相反,术语“瞬时”转化或转染或导入是指一种导入分子工具的方式,所述分子工具包括至少一种核酸(DNA、RNA、单链的或双链的或其混合物)和/或至少一种氨基酸序列,任选地包括合适的化学或生物学药剂,以实现向细胞的至少一个感兴趣的区室(包括但不限于细胞质、细胞器(包括细胞核)、线粒体、液泡、叶绿体)中的转移,或者向膜中的转移,导致导入的至少一种分子的转录和/或翻译和/或缔合和/或活性,而没有实现导入到细胞的基因组中的相应的至少一种分子的稳定整合或掺入以及因此遗传(inheritance)。术语“无转基因”是指在感兴趣的宿主细胞或组织或生物体的基因组中不存在或未发现转基因的情况。
如本文所使用的,术语“组织培养物”表示包含相同或不同类型的分离的细胞或被组织成植物的部分的此类细胞的集合的组合物。组织培养物的示例性类型是原生质体、愈伤组织、植物团块和可以产生在植物或植物的部分中完整的组织培养物的植物细胞,例如胚、花粉、花、种子、叶、茎、根、根尖、花药、雌蕊、分生组织细胞、腋芽、子房、种皮、胚乳、下胚轴、子叶等。术语“植物器官”是指植物组织或构成植物的形态和功能上不同的部分的一组组织。“后代”包括植物的任何后续世代。
分子和细胞生物化学的一般方法可以在此类标准教科书中找到,如《分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)》,第3版.(Sambrook等人,港湾实验室出版社(HaRBor Laboratory Press)2001);《分子生物学的简短协议(Short Protocolsin Molecular Biology)》,第4版.(Ausubel等人编辑,约翰·威利父子有限公司(JohnWiley&Sons)1999);Protein Methods(Bollag等人,约翰·威利父子有限公司1996);《用于基因疗法的非病毒载体(Nonviral Vectors for Gene Therapy)》(Wagner等人编辑,学术出版社(Academic Press)1999);《病毒载体(Viral Vectors)》(Kaplift&Loewy编辑,学术出版社1995);《免疫学方法手册(Immunology Methods Manual)》(I.Lefkovits编辑,学术出版社1997);以及《细胞和组织培养:生物技术中的实验室程序(Cell and TissueCulture:Laboratory Procedures in Biotechnology)》(Doyle&Griffiths,约翰·威利父子有限公司1998),其公开通过引用并入本文。
如本文所使用的,术语“AGAMOUS Clade转录因子”或“AG clade转录因子”是MIKC型MADS-box基因的AGAMOUS(AG)亚家族的成员。“MIKC型”蛋白代表一类MADS结构域转录因子,并且由独特的结构域结构定义:(1)'M'-高度保守的DNA结合MADS结构域,(2)'I'–介入的结构域,(3)'K'-角蛋白样K结构域,和(4)'C'-C末端结构域。在一些实施例中,“AGAMOUSClade转录因子”或“AG clade转录因子”进一步包含N-末端区域。在另外的实施例中,“AGAMOUS Clade转录因子”或“AG clade转录因子”在本公开的植物中包含AG、SHP1、SHP2和STK基因,其每一个在M结构域中具有NN基序,在K结构域中具有YQQ基序,和/或在C结构域中具有R/Q(R或Q)。
“生物活性部分”是指全长亲本肽或多肽的一部分,该部分保留了亲本分子的活性。例如,本公开的多肽的生物活性部分将保留赋予抗病性,特别是对真菌病原体如镰刀菌属(Fusarium)的抗性的能力。如本文所使用的,术语“生物活性部分”包括缺失突变体和肽(例如具有至少约8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、40、50、60、70、80、90、100、120、150、300、400、500、600、700、800、900或1000个邻接氨基酸),其包含亲本分子的活性。这种类型的部分可以通过应用标准重组核酸技术获得,或者使用常规的液相或固相合成技术合成。例如,可以参考溶液合成或固相合成,如例如在Atherton和Shephard的题为“肽合成(Peptide Synthesis)”的第9章中所述,该章被包含在由Nicholson编辑并由Blackwell Scientific Publications出版的题为“合成疫苗(Synthetic Vaccines)”的出版物中。可替代地,可以通过用蛋白酶例如endoLys-C、endoArg-C、endoGlu-C和葡萄球菌V8蛋白酶消化本公开的肽或多肽来产生肽。消化的片段可以通过例如高效液相色谱(HPLC)技术进行纯化。重组核酸技术也可以用于产生此类部分。
“对应于(corresponds to)”或“对应于(corresponding to)”是指多核苷酸(a)具有与参考多核苷酸序列的全部或部分基本上相同或互补的核苷酸序列,或(b)编码与肽或蛋白质中的氨基酸序列相同的氨基酸序列。该短语在其范围内还包括具有与参考肽或蛋白质中的氨基酸的序列基本上相同的氨基酸序列的肽或多肽。
如本文所使用的术语“生长”或“再生”是指从植物细胞、一组植物细胞、植物部分(包括种子)或植物片(例如,来自原生质体、愈伤组织或组织部分)生长完整的、分化的植物。
如本文所使用的,术语“衍生自(derived from)”是指起源或来源,并且可以包括天然存在的、重组的、未纯化的或纯化的分子。衍生自起源或来源的核酸或氨基酸可以具有如本文别处定义的所有种类的核苷酸变化或蛋白质修饰。
“从……获得”是指样品例如如核酸提取物或多肽提取物从特定来源分离或衍生自特定来源。例如,提取物可以直接从植物(特别是单子叶植物并且更特别是非禾本科单子叶植物,例如香蕉)中分离。
术语“病原体”在本文中以其最广泛的含义使用,以指其感染有活力的植物组织的细胞引起疾病应答的生物体或感染因子(infectious agent)。
“变体”多肽是指通过在天然蛋白质的N-末端和/或C-末端缺失(所谓的截短)或添加一个或多个氨基酸;在天然蛋白质中的一个或多个位点处缺失或添加一个或多个氨基酸;或在天然蛋白质中的一个或多个位点处取代一个或多个氨基酸而衍生自天然蛋白质的多肽。由本公开所涵盖的变体蛋白质是生物活性的,即它们继续具有天然蛋白质的所需的生物活性(即如本文所述的调控的(modulating)或调节性的活性)。此类变体可能由例如遗传多态性或人类操作产生。本公开的天然R蛋白的生物活性变体将与天然蛋白的氨基酸序列具有至少40%、50%、60%、70%、通常至少75%、80%、85%、优选地约90%至95%或更多、并且更优选地约98%或更多的序列同一性,如通过本文别处所述的序列比对程序使用缺省参数测定的。本公开的蛋白质的生物活性变体可以与该蛋白质相差少至1-15个氨基酸残基、少至1-10个,例如6-10个、少至5个、少至4个、3个、2个或甚至1个氨基酸残基。
本公开的蛋白质可以以各种方式(包括氨基酸取代、缺失、截短和插入)改变。用于此类操作的方法在本领域中是公知的。例如,R蛋白的氨基酸序列变体可以通过DNA中的突变来制备。用于诱变和核苷酸序列改变的方法在本领域中是熟知的。参见,例如,Kunkel(1985)《美国国家科学院院刊》82:488-492;Kunkel等人.(1987)《酶学方法》.154:367-382;美国专利号4,873,192;Walker和Gaastra编辑.(1983)《分子生物学技术(Techniques inMolecular Biology)》(麦克米伦出版公司(MacMillan Publishing Company),纽约)和其中引用的参考文献。关于不影响感兴趣的蛋白质的生物活性的适当氨基酸取代的指导可以在Dayhoff等人.(1978)《蛋白质序列和结构图谱(Atlas of Protein Sequence andStructure)》(Natl.Biomed.Res.Found.,Washington,D.C.)(其通过引用并入本文)的模型中找到。保守取代(例如,将一个氨基酸与具有相似性质的另一个氨基酸交换)可能是优选的。
改变、添加或删除单个氨基酸或编码的序列中一小部分氨基酸(通常少于5%,更通常少于1%)的单独的取代、缺失或添加是“保守修饰的变异”,其中改变导致氨基酸被化学上相似的氨基酸取代。提供功能上相似的氨基酸的保守取代表在本领域中是熟知的。以下五组均包含彼此保守取代的氨基酸:脂肪族:甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、亮氨酸(L)、异亮氨酸(I);芳香族:苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);含硫:蛋氨酸(M)、半胱氨酸(C);碱性:精氨酸I、赖氨酸(K)、组氨酸(H);酸性:天冬氨酸(D)、谷氨酸(E)、天冬酰胺(N)、谷氨酰胺(Q)。还参见,Creighton,1984。此外,改变、添加或删除编码的序列中的单个氨基酸或一小部分氨基酸的单独的取代、缺失或添加也是“保守修饰的变异”。
如本文所使用的“表达盒”是指能够指导特定核苷酸序列在合适的宿主细胞中表达的DNA序列,其包含与感兴趣的核苷酸序列可操作地连接的启动子,所述感兴趣的核苷酸序列与终止信号可操作地连接。它通常还包含正确翻译核苷酸序列所需的序列。编码区通常编码感兴趣的蛋白质,但也可以在有义或反义方向上编码感兴趣的功能性RNA,例如反义RNA或非翻译的RNA。包含感兴趣的核苷酸序列的表达盒可以是嵌合的,这意味着其组分中的至少一种相对于其其他组分中的至少一种是异源的。表达盒也可以是天然存在的但已以可用于异源表达的重组形式获得的表达盒。核苷酸序列在表达盒中的表达可以受组成型启动子或诱导型启动子的控制,所述启动子仅在宿主细胞被暴露于一些特定的外部刺激时启动转录。在多细胞生物体的情况下,启动子也可以对动物和/或植物(包括香蕉物种)中的特定组织或器官或发育阶段具有特异性。
如本文所使用的,术语“载体”、“质粒”或“构建体”广义地指编码外源核酸的任何质粒或病毒。该术语还应被解释为包括促进核酸转移到病毒体(virion)或细胞中的非质粒和非病毒化合物,例如如聚赖氨酸化合物等。载体可以是适合作为用于将核酸或其突变体递送至细胞的递送载体的病毒载体,或者载体可以是适合于相同目的的非病毒载体。用于将DNA递送至细胞和组织的病毒和非病毒载体的实例在本领域中是熟知的,并且在例如Ma等人.(1997,《美国国家科学院院刊》94:12744-12746)中描述。病毒载体的实例包括但不限于重组植物病毒。植物病毒的非限制性实例包括TMV介导的(瞬时)转染到烟草中(Tuipe,T-H等人(1993),《病毒学方法杂志(J.Virology Meth)》42:227-239)、ssDNA基因组病毒(例如,双生病毒科(Geminiviridae)家族)、逆转录病毒(例如,花椰菜病毒科(Caulimoviridae)、假病毒科(Pseudoviridae)和转座病毒科(Metaviridae)家族)、dsNRA病毒(例如,呼肠孤病毒科(Reoviridae)和分体病毒科(Partitiviridae)家族)、(-)ssRNA病毒(例如,弹状病毒科(Rhabdoviridae)和布尼亚病毒科(Bunyaviridae)家族)、(+)ssRNA病毒(例如,雀麦花叶病毒科(Bromoviridae)、长线形病毒科(Closteroviridae)、豇豆花叶病毒科(Comoviridae)、黄症病毒科(Luteoviridae)、马铃薯Y病毒科(Potyviridae)、伴生病毒科(Sequiviridae)和番茄丛矮病毒科(Tombusviridae)家族)和类病毒(例如,马铃薯纺锤形块茎类病毒科(Pospiviroldae)和鳄梨白斑类病毒科(Avsunviroidae)家族)。植物病毒的详细分类信息可以Fauquet等人(2008,“双生病毒株的划分和命名(Geminivirusstrain demarcation and nomenclature)”.《病毒学档案(Archives of Virology)》153:783–821(其通过引用以其整体并入本文)和Khan等人.(作为分子病原体的植物病毒(Plantviruses as molecular pathogens);出版商Routledge,2002,ISBN 1560228954,9781560228950)中找到。非病毒载体的实例包括但不限于脂质体、DNA的多胺衍生物等。
此外,“载体”被定义为尤其包括双链或单链线性或环状形式的任何质粒、粘粒、噬菌体或农杆菌二元载体,其可以是或可以不是自传递的或可移动的,并且其可以通过整合到细胞基因组中或以染色体外方式存在来转化原核或真核宿主(例如,具有复制起点的自主复制质粒)。
具体包括的是穿梭载体,其意指能够在两种不同的宿主生物体中天然或通过设计复制的DNA载体,所述宿主生物体可以选自放线菌和相关物种、细菌和真核生物(例如高等植物、哺乳动物、酵母或真菌细胞)。
优选地,载体中的核酸受合适的启动子或其他调节元件的控制并且可操作地连接至所述合适的启动子或其他调节元件,以用于在宿主细胞例如微生物细胞例如细菌细胞,或植物细胞中转录。载体可以是在多个宿主中起作用的双功能表达载体。在基因组DNA的情况下,这可能包含它自己的启动子或其他调控元件,并且在cDNA的情况下,这可能受适当的启动子或其他调控元件的控制,以用于在宿主细胞中表达。
“克隆载体”通常包含一个或少量的限制性核酸内切酶识别位点(在这些位点处可以以可确定的方式插入外源DNA序列,而不会丧失载体的基本生物学功能),以及适合用于鉴定和选择用克隆载体转化的细胞的标记物基因。标记物基因通常包括提供四环素抗性、潮霉素抗性或氨苄青霉素抗性的基因。
如本文所使用的,术语“抗性(resistant)”或“抗性(resistance)”描述对生物害虫或病原体表现出比对该生物害虫或病原体敏感(或更敏感)的植物、品系或品种(variety)更少或减少的症状的植物、系或栽培品种。这些术语被不同地用于描述没有表现出症状的植物以及表现出一些症状但仍然能够以可接受的产量生产可销售产品的植物。一些被称为抗性的品系只是在某种意义上说,它们仍然可以生产作物,尽管与未感染的植物相比,这些植物可能视觉上看起来发育不良并且产量被降低。根据国际种子联合会(ISF)(一种代表种业的非政府、非营利组织)的定义(参见“描述植物对害虫或病原体的反应以及对蔬菜种业的非生物胁迫的反应的术语定义(Definition of the Terms Describing theReaction of Plants to Pests or Pathogens and to Abiotic Stresses for theVegetable Seed Industry)”,2005年5月),对植物是否受害虫或病原体影响或经受害虫或病原体的识别可以取决于所采用的分析方法。抗性由ISF定义为在相似的环境条件和害虫或病原体压力下,当与易感植物品种相比时,植物类型限制特定害虫或病原体的生长和发育和/或造成损害的能力。抗性植物类型可能仍会表现出一些疾病症状或损害。定义了两个水平的抗性。术语“高/标准抗性”用于当与易感品种相比时,在正常害虫或病原体压力下高度限制特定害虫或病原体的生长和发育的植物品种。“中度/中等抗性(moderate/intermediate resistance)”适用于这样的植物类型,所述植物类型限制特定害虫或病原体的生长和发育,但与具有高抗性的植物类型相比,表现出更大范围的症状或损害。当在相似的田间条件和病原体压力下生长时,具有中等抗性的植物类型将比易感植物品种表现出更不严重的症状。评估抗性的方法是本领域技术人员熟知的。此类评估可以通过目视观察植物或植物部分(例如,叶、根、花、果实等)来确定症状的严重程度。例如,当基于反应或症状的严重程度给与每种植物1至5的标度上的抗性评分时,其中1是应用于最具抗性的植物(例如,没有症状,或具有最少症状)的抗性评分,并且5是应用于具有最严重症状的植物的评分,那么当至少75%的植物具有1、2或3级的抗性评分时,品系被评为具有抗性,而易感品系是那些超过25%的植物评分为4或5级的植物。如果更加详述的视觉评估是可能的,那么可以使用从1到10的标度,以便拓宽评分的范围,从而有希望在被评估的植物中提供更大的评分分布。
另一个评分系统是基于接种后坏死的发展及其朝向子叶的位置的根接种试验(例如来源于Bosland等人,1991的根接种试验),其中0代表在感染后无症状;1代表在感染后的下胚轴处的小坏死;2代表在感染后在子叶下面的坏死;3代表在感染后在子叶以上的坏死;4代表在感染后在子叶上方的坏死以及植物的枯萎,而最终,5代表死亡的植物。
除了此类视觉评价之外,疾病评价可以通过使用电子显微镜和/或通过分子生物学方法(例如蛋白质杂交(例如ELISA,测量病原体蛋白质密度)和/或核酸杂交(例如RT-PCR,测量病原体RNA密度))确定植物或植物部分中的病原体生物密度来进行。取决于特定的病原体/植物组合,可以确定植物对病原体具有抗性,例如,如果它具有的病原体RNA/DNA和/或蛋白质密度是易感植物中RNA/DNA和/或蛋白质密度的约50%、或约40%、或约30%、或约20%、或约10%、或约5%、或约2%、或约1%、或约0.1%、或约0.01%、或约0.001%、或约0.0001%。
用于培育植物抗病性的方法与用于培育其他特性的方法相似。有必要尽可能多地了解宿主植物中抗性特性的遗传性质以及病原体的生理小种或菌株的存在。
如本文所使用的,术语“完全抗性”是指病原体在感染后完全不能发展,并且可以是病原体不能进入细胞的结果(没有初始感染),或者可以是病原体不能在细胞中增殖并感染随后的细胞的结果(没有潜意识的感染,没有扩散)。完全抗性的存在可以通过在将植物暴露于感染性剂量的病原体时(即在“感染”后),确定在所述植物的细胞中不存在病原体蛋白或病原体RNA,以及在所述植物中不存在任何疾病症状来确定。在育种者中,这种表型通常被称为“免疫”。因此,如本文所使用的“免疫”是指一种抗性形式,其特征在于即使当病原体通过例如电穿孔被主动转移到细胞中时也不存在病原体复制。
如本文所使用的,术语“部分抗性”是指病原体在细胞中的减少的增殖、病原体的减少的(全身性)运动和/或感染后减少的症状发展。部分抗性的存在可以通过在植物中建立低浓度的病原体蛋白质或病原体RNA的系统存在以及当所述植物暴露于感染性剂量的病原体时在所述植物中存在减少或延迟的疾病症状来确定。蛋白质浓度可以通过使用定量检测方法(例如ELISA方法或定量逆转录酶-聚合酶链反应(RT-PCR))来确定。在育种者中,这种表型通常被称为“中等抗性”。
如本文所使用的,术语“耐受的”在本文中用于指示植物的表型,其中当所述植物暴露于感染性剂量的病原体时,疾病症状保持不存在,由此可以确定系统性或局部病原体感染的存在、病原体增殖、至少病原体基因组序列在所述植物的细胞中的存在和/或其基因组整合。因此,耐受的植物对症状表达具有抗性,但对病原体的无症状载体具有抗性。有时,病原体序列可能在植物中存在或者甚至繁殖,而不会引起疾病症状。这种现象也被称为“潜伏感染”。在潜伏感染中,病原体可能以真正潜伏的非传染性隐匿形式存在,可能作为整合的基因组或附加体剂(使得在细胞质中找不到病原体蛋白,而PCR方案可能表明存在病原体核酸序列)或作为传染性和连续复制的药剂存在。重新激活的病原体可能会在易感接触者中传播并引发疫情。“潜伏感染”的存在与植物中“耐受”表型的存在无法区分。
如本文所使用的,术语“易感”在本文中用于指对病原体没有抗性或几乎没有抗性的植物,导致病原体进入植物并繁殖和系统性传播(spread)病原体,导致疾病症状。因此,术语“易感”等同于“非抗性”。
如本文所使用的,术语“后代”是指由来自一种或多种亲本植物或其后代的营养或有性生殖的后代产生的任何植物。例如,可以通过克隆或自交亲本植物或通过杂交两个亲本植物获得后代植物,包括自交以及F1或F2或更远的世代。F1是由亲本产生的第一代后代,其中至少一个亲本首次用作性状的供体,而第二代(F2)或后续几代(F3,F4等)的后代是由F1、F2等的自交产生的标本。因此,F1可以是(并且通常是)由两个真正的育种亲本之间的杂交产生的杂种(真正的育种对于性状是纯合的),而F2可以是(并且通常是)由所述F1杂种的自花授粉产生的后代。
如本文所使用的,术语“双子叶植物(dicotyledon)”、“双子叶植物(dicot)”和“双子叶植物的(dicotyledonous)”是指具有包含两个种子半体或子叶的胚的开花植物。实例包括烟草;西红柿;豆科植物,包括豌豆、苜蓿、三叶草和大豆;橡树;枫树;玫瑰;薄荷糖;小南瓜;雏菊;核桃;仙人掌;紫罗兰和毛茛。
如本文所使用的,术语“单子叶植物(monocotyledon)”、“单子叶植物(monocot)”或“单子叶植物的(monocotyledonous)”是指开花植物的亚类(单子叶植物科)中的任何一种,所述开花植物具有仅包含一片种子叶的胚,并且通常具有平行脉状叶、3的倍数的花部分,并且在茎和根中没有二次生长。实例包括香蕉、水仙花、甘蔗、生姜、百合、兰花、水稻、玉米、草,例如高羊茅、山羊草和草地早熟禾;谷物,例如小麦、燕麦和大麦、鸢尾;洋葱和棕榈。
如本文所使用的,术语“基因”是指与生物学功能相关的DNA的任何区段。因此,基因包括但不限于编码序列和/或它们表达所需的调控序列。基因还可以包括未表达的DNA区段,其例如形成其他蛋白质的识别序列。基因可以从多种来源获得,包括从感兴趣的来源克隆或从已知或预测的序列信息合成,并且可以包括被设计成具有所需参数的序列。
如本文所使用的,术语“基因型”是指单独的细胞、细胞培养物、组织、生物体(例如植物)或一组生物体的遗传组成。
如本文所使用的,术语“等位基因”是指基因的一种或多种替代形式中的任何一种,所有等位基因都与至少一种性状或特征相关。在二倍体细胞中,给定基因的两个等位基因占据一对同源染色体上的相应位点。由于本公开涉及QTL,即可以包含一个或多个基因或调节序列的基因组区域,所以在一些情况下,更准确的说法是使用“单体型”(即染色体片段的等位基因)代替“等位基因”,然而,在那些情况下,术语“等位基因”应被理解为包含术语“单体型”。当等位基因表达相似的表型时,它们被认为是相同的。序列差异是可能的,但并不重要,只要它们不影响表型。
如本文所使用的,术语“基因座(locus)”(复数:“基因座(loci)”)是指已被遗传定义的任何位点。基因座可能是基因,或基因的一部分,或具有某种调节作用的DNA序列,并且可能被不同的序列占据。
如本文所使用的,术语“分子标记物”或“遗传标记物”是指用于使核酸序列的特征的差异可视化的方法中的指示物。此类指示物的实例是限制性片段长度多态性(RFLP)标记物、扩增片段长度多态性(AFLP)标记物、单核苷酸多态性(SNP)、插入突变、微卫星标记物(SSR)、序列表征的扩增区域(SCAR)、裂解的扩增多态性序列(CAPS)标记物或同工酶标记物或本文所述的定义了特定的遗传和染色体位置的标记物的组合。等位基因附近的分子标记物的作图是一种可以由分子生物学技术领域的普通技术人员非常容易地进行的程序,该技术例如在Lefebvre和Chevre,1995;Lorez和Wenzel,2007,Srivastava和Narula,2004,Meksem和Kahl,2005,Phillips和Vasil,2001中描述。关于AFLP技术的一般信息可以在Vos等人.(1995,AFLP:“一种新的DNA指纹技术(a new technique for DNAfingerprinting)”,《核酸研究》.1995年11月11日;23(21):4407–4414)中找到。
如本文所使用的,术语“半合子的”是指基因在基因型中仅存在一次的细胞、组织或生物体,如单倍体细胞或生物体中的基因、异配子体性别中的性连锁基因、或二倍体细胞或生物体中其伴侣区段已被缺失的染色体的区段中的基因。
如本文所使用的,术语“杂合体”是指具有在至少一个基因座处存在的不同等位基因(给定基因的形式)的二倍体或多倍体个体细胞或植物。
如本文所使用的,术语“杂合的”是指在特定的基因基因座处存在不同的等位基因(给定基因的形式)。
如本文所使用的,术语“纯合子”是指在一个或多个基因座处具有相同等位基因的单独的细胞或植物。
如本文所使用的,术语“纯合的”是指在同源染色体区段中的一个或多个基因座处存在相同的等位基因。
如本文所使用的,术语“同源的”或“同源物”在本领域中是已知的,并且是指共享共同祖先或家族成员并基于序列同一性的程度确定的相关序列。术语“同源性”、“同源的”、“基本上相似”和“基本上对应”在本文中可互换使用。同源物通常控制、介导或影响相同或相似的生化途径,但特定的同源物可能会产生不同的表型。因此,如本领域技术人员将理解的,应当理解,本公开涵盖多于一种特定的示例性序列。这些术语描述了在一个物种、亚种、品种、栽培品种或品系中发现的基因与另一物种、亚种、品种、栽培品种或品系中的相应或等效基因之间的关系。出于本公开的目的,比较同源序列。
术语“同源物”有时用于指因物种形成事件而分离的基因之间的关系(参见“直系同源物”),或因基因复制事件而分离的基因之间的关系(参见“旁系同源物”)。
术语“部分同源物((homeolog)”是指由多倍体或染色体复制事件产生的部分同源的基因或染色体。这与上面刚定义的更常见的“同源物”形成对比。
术语“直系同源物”是指通过物种形成从共同的祖先基因进化而来的不同物种中的基因。通常,直系同源物在进化过程中保留相同的功能。直系同源物的鉴定对于可靠预测新测序的基因组中的基因功能至关重要。
术语“旁系同源物”是指通过基因组内的复制而相关的基因。虽然直系同源物在进化过程中通常保留相同的功能,但旁系同源物可以进化出新的功能,即使这些功能与原始功能有关。
“同源序列”或“同源物”或“直系同源物”被认为、相信或已知在功能上是相关的。功能关系可以多种方式中的任何一种表示,包括但不限于:(a)序列同一性的程度和/或(b)相同或相似的生物学功能。优选地,指明(a)和(b)。序列同一性的程度可以变化,但在一个实施例中,为至少50%(当使用本领域中已知的标准序列比对程序时)、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少98.5%、或至少约99%、或至少99.5%、或至少99.8%、或至少99.9%。同源性可以使用本领域中可容易获得的软件程序来确定,例如在《分子生物学的当前协议》(F.M.Ausubel等人编辑,1987)补刊30,第7.718节,表7.71中讨论的那些软件程序。一些比对程序是MacVector(牛津分子有限公司,英国牛津)和ALIGN Plus(科学教育软件,宾夕法尼亚州)。其他非限制性的比对程序包括Sequencher(Gene Codes,密歇根州安阿伯)、AlignX和Vector NTI(Invitrogen,加利福尼亚州卡尔斯巴德)。
如本文所使用的,术语“杂种”是指由一种或多种基因不同的亲本之间的杂交产生的任何单独的细胞、组织或植物。
如本文所使用的,术语“近交”或“近交系”是指相对真实的育种品系。
如本文所使用的术语“单个等位基因转化植物”是指通过被称为回交的植物育种技术开发的那些植物,其中除了通过回交技术被转移到近交系中的单个等位基因之外,基本上所有的近交系的所需的形态和生理特征都被恢复。
如本文所使用的,术语“系(line)”广泛地用于包括但不限于通过组织培养技术从单个亲本植物中植物性繁殖的一组植物,或由于来自共同亲本的祖先而在遗传上非常相似的一组近交植物。如果植物(a)是从特定品系的材料再生的初级转化体(T0)植物,(b)具有由该品系的T0植物组成的系谱;或者(c)由于共同的祖先(例如,通过近亲繁殖或自交)而在遗传上非常相似,则该植物被称为“属于”该品系。在此上下文中,术语“系谱”表示植物的谱系,例如就受影响的有性杂交而言,使得杂合子(半合子)或纯合子条件下的基因或基因的组合赋予植物所需的性状。
如本文所使用的,术语“基因渗入(introgression)”、“基因渗入(introgressed)”和“基因渗入(introgressing)”是指一个物种、品种或栽培品种的基因通过与这些物种杂交而移动到另一个物种、品种或栽培品种的基因组中的过程。杂交可以是自然的或人工的。该过程可以任选地通过回交至轮回亲本来完成,在这种情况下,基因渗入是指通过种间杂种与其亲本之一的重复回交,一个物种的基因渗入到另一个物种的基因池中。基因渗入也可以被描述为稳定地整合在受体植物的基因组中的异源遗传材料。
如本文所使用的,术语“群体”是指共享共同的遗传衍生的遗传上同质或异质的植物集合。
如本文所使用的,术语“品种”或“栽培品种”是指通过结构特征和性能可以与同一物种内的其他品种中识别出的一组相似植物。如本文所使用的术语“品种”与1961年12月2日的《保护植物新品种国际公约(International Convention for the Protection ofNew Varieties of Plant)》(UPOV条约)中的相应定义具有相同的含义,该公约于1972年11月10日、1978年10月23日和1991年3月19日在日内瓦修订。因此,“品种”是指在已知最低等级的单一植物分类单元内的植物分组,无论是否完全满足授予育种者权利的条件,该分组可以i)通过表达由给定基因型或基因型的组合产生的特征来定义,ii)通过所述特征中的至少一个的表达来区别于任何其他植物分组,以及iii)就其不变地繁殖的适用性而言被视为一个单元。
如本文所使用的,术语“质量选择”是指这样的选择形式,其中选择单独的植物,并从它们的种子聚集体繁殖下一代。质量选择的更多细节在本文在本说明书中描述。
如本文所使用的,术语“开放授粉”指的是自由暴露于某些基因流的植物群体,与其中存在对基因流的有效屏障的封闭群体相反。
如本文所使用的,术语“开放授粉群体”或“开放授粉品种”是指通常能够进行至少一些杂交受精的植物,按照标准选择,其可以表现出变异,但也具有一种或多种基因型或表型特征,通过这些特征可以将群体或品种与其他物种区分开来。对异花授粉没有障碍的杂种是开放授粉的群体或开放授粉的品种。
如本文所使用的,术语“自交”、“自花授粉(self pollinated)”或“自花授粉(self-pollination)”是指将一株植物上的一朵花的花粉(人工或自然地)施用于同一株植物上相同或不同花的胚珠(柱头)。
如本文所使用的,术语“杂交(cross)”、“杂交(crossing)”、“异花授粉(crosspollination)”或“杂交育种”是指将一株植物上的一朵花的花粉(人工或自然地)施用于另一株植物上的花的胚珠(柱头)的过程。
如本文所使用的,术语“衍生自”是指起源或来源,并且可以包括天然存在的、重组的、未纯化的或纯化的分子。衍生自起源或来源的核酸或氨基酸可以具有如本文别处定义的所有种类的核苷酸变化或蛋白质修饰。
如本文所使用的术语“引物”是指这样的寡核苷酸,其能够退火至扩增靶,允许DNA聚合酶附着,从而当置于诱导引物延伸产物的合成的条件下时,即在核苷酸和用于聚合的药剂例如DNA聚合酶的存在下,并且在合适的温度和pH下,用作DNA合成的起始点对于最大的扩增效率,(扩增)引物优选地是单链的。优选地,引物是寡脱氧核糖核苷酸。引物必须足够长以在用于聚合的药剂的存在下引发延伸产物的合成。引物的确切长度将取决于许多因素,包括温度和引物的组成(A/T和G/C含量)。一对双向引物由一个正向引物和一个反向引物组成,如在DNA扩增领域(例如在PCR扩增中)中通常使用的。
探针包含识别靶核酸序列的可识别的、分离的核酸。探针包括连接到可寻址的位置、可检测的标记或其他报告分子并与靶序列杂交的核酸。典型的标记包括放射性同位素、酶底物、辅因子、配体、化学发光或荧光剂、半抗原和酶。用于标记的方法和选择适合于各种用途的标记的指南在例如Sambrook等人(编辑),《分子克隆:实验室手册》第2版,第1-3卷,冷泉港实验室出版社,纽约冷泉港(Cold Spring Harbor,NY),1989和Ausubel等人.《分子生物学的简短协议》第4版,约翰·威利父子有限公司,1999中讨论。
用于制备和使用核酸探针和引物的方法描述在例如Sambrook等人(编辑),《分子克隆:实验室手册》第2版,第1-3卷,冷泉港实验室出版社,纽约冷泉港,1989;Ausubel等人.《分子生物学的简短协议》第4版,约翰·威利父子有限公司,1999;和Innis等人.《PCR方案,方法和应用指南(PCRProtocols,A Guide to Methods and Applications)》,学术出版社有限公司,加利福尼亚州圣地亚哥(San Diego,CA),1990中。扩增引物对可以衍生自已知序列,例如,通过使用旨在用于该目的的计算机程序,例如PRIMER(版本0.5,1991,怀特海生物医学研究所(Whitehead Institute for Biomedical Research),马萨诸塞州剑桥(Cambridge,MA))。本领域普通技术人员将理解,特定探针或引物的特异性随着其长度而增加。因此,为了获得更大的特异性,可以选择包含靶核苷酸序列的至少20、25、30、35、40、45、50个或更多个连续核苷酸的探针和引物。
对于本文公开的多核苷酸的PCR扩增,可以设计寡核苷酸引物用于PCR反应,以从任何感兴趣的生物体提取的cDNA或基因组DNA中扩增相应的DNA序列。用于设计PCR引物和PCR克隆的方法在本领域中是公知的,并且被公开在Sambrook等人.(2001)《分子克隆:实验室手册》(第3版,冷泉港实验室出版社,纽约普莱恩维尤(Plainview,New York))中。还参见Innis等人编辑.(1990)《PCR方案,方法和应用指南》,学术出版社,纽约);Innis和Gelfand编辑.(1995)《PCR策略(PCR Strategies)》(学术出版社,纽约);以及Innis和Gelfand编辑.(1999)《PCR方法手册(PCR Methods Manual)》(学术出版社,纽约)。已知的PCR的方法包括但不限于使用配对引物、巢式引物、单特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等的方法。
本公开提供了一种分离的核酸序列,其包含选自由FusR1、FusR1的同源物、FusR1的直系同源物、FusR1的旁系同源物及其片段和变体的序列。在一个实施例中,本公开提供了一种分离的多核苷酸,其编码由用于FusR1的核酸序列产生的蛋白质,所述分离的多核苷酸包含与FusR1共享至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%或至少99.9%同一性的核酸序列。
用于比较的序列的比对方法在本领域中是熟知的。各种程序和比对算法在以下中描述:Smith和Waterman(Adv.Appl.Math.,2:482,1981);Needleman和Wunsch(《分子生物学杂志》,48:443,1970);Pearson和Lipman(《美国国家科学院院刊》85:2444,1988);Higgins和Sharp(《基因(Gene)》,73:237-44,1988);Higgins和Sharp(CABIOS,5:151-53,1989);Corpet等人.(《核酸研究》,16:10881-90,1988);Huang等人.(Comp.Appls Biosci.,8:155-65,1992);和Pearson等人.(《分子生物学方法(Meth.Mol.Biol.)》,24:307-31,1994).Altschul等人.(《自然-遗传学(Nature Genet.)》,6:119-29,1994)呈现了序列比对方法和同源性计算的详细考虑。
本公开还提供了一种嵌合基因,其包含与合适的调节序列可操作地连接的上述任何一种多核苷酸的分离的核酸序列。
本公开还提供了一种包含上述嵌合基因的重组构建体。在一个实施例中,所述重组构建体是基因沉默构建体,例如用于RNAi基因沉默。在另一个实施例中,所述重组构建体是基因编辑构建体,例如用于CRISPR-Cas基因编辑系统。
本公开的表达载体可以包括至少一种可选择的标记物。此类标记物包括用于真核细胞培养的二氢叶酸还原酶、G418或新霉素抗性基因以及用于在大肠杆菌和其他细菌中培养的四环素、卡那霉素或氨苄青霉素抗性基因。
本公开还提供了一种包含上述嵌合基因的转化的宿主细胞。在一个实施例中,所述宿主细胞选自由细菌、酵母、丝状真菌、藻类、动物和植物(包括但不限于芭蕉属的属)组成的群组。
这些序列允许设计针对FusR1的基因特异性引物和探针、FusR1的同源物、FusR1的直系同源物、FusR1的部分同源物、FusR1的旁系同源物及其片段和变体。
II.抗病性的调节
本公开涉及新鉴定的FusR1(镰刀菌抗性1)的多核苷酸和/或多肽以及用于调节、刺激或增强植物中由病原体引起的抗病性的方法。本公开的病原体包括但不限于细菌、真菌、病毒或类病毒、线虫、昆虫等。
细菌病原体包括但不限于燕麦假单胞菌燕麦亚种(Pseudomonas avenaesubsp.Avenae)、野油菜黄单胞菌栖绒毛草致病变种(Xanthomonas campestrispv.Holcicola)、溶解肠杆菌(Enterobacter dissolvens)、溶解欧文氏菌(Erwiniadissolvens)、软腐欧氏杆菌软腐亚种(Ervinia carotovora subsp.carotovora)、菊欧文氏菌玉米致病变种(Erwinia chrysanthemi pv.zeae)、须芝草假单胞菌(Pseudomonasandropogonis)、丁香假单胞杆菌晕斑致病变种(Pseudomonas syringaepv.coronafaciens)、密执安棒形杆菌密执安亚种(Clavibacter michiganensis subsp.)、密执安棒杆菌小麦致病变种(Corynebacterium michiganense pv.nebraskense)、丁香假单胞菌丁香致病变种(Pseudomonas syringae pv.syringae)、Herniparasitic bacteria(参见根据真菌)、枯草芽孢杆菌(Bacillus subtilis)、玉米细菌性枯萎病菌(Erwiniastewartii)和玉米矮缩螺原体(Spiroplasma kunkelii)。
真菌病原体包括但不限于草坪炭疽菌(Collelotrichum graminicola)、禾谷炭疽菌(Glomerella graminicola Politis)、Glomerella lucumanensis、黄曲霉菌(Aspergillus flavus)、立枯丝核菌(Rhizoctonia solani Kuhn)、烟草靶斑病菌(Thanatephorus cucumeris)、直立顶孢霉(Acremonium strictum)W.Gams、顶头孢(Cephalosporium acremonium)Auct.non Corda Black Lasiodiplodia theobromae=BoIr odiplodiay theobromae Borde blanco微皮伞(Marasmiellus sp.)、玉蜀黍节壶菌(Physoderma maydis)、世木伏革菌(Cephalosporium Corticium sasakii)、棒状弯孢(Curvularia clavata)、C.maculans、斑点弯孢(Cochhobolus eragrostidis)、不等弯孢(Curvularia inaequahs)、中间弯孢(C.intermedia)(有性型中间旋孢腔菌(Cochhobolusintermedius)、新月弯孢(Curvularia lunata)(有性型:月状旋孢腔菌(Cochlioboluslunatus)、苍白弯孢(Curvularia pallescens)(有性型—苍白旋孢腔菌(Cochlioboluspallescens))、塞内加尔弯孢霉(Curvularia senegalensis)、C.luberculata(有性型:Cochliobolus tuberculatus)、Didymella exitalis Diplodiaftumenti(有性型—羊茅葡萄座腔菌(Botryosphaeriafestucae)、马伊德壳色单隔孢(Diplodia maydis)=Stenocarpella maydis、Stenocarpella macrospora=大孢色二孢(Diplodiamacrospora)、玉米褐条霜霉病菌(Sclerophthora rayssiae var.zeae)、水稻霜霉病(Sclerophthora macrospora)=大孢指疫霉(Sclerospora macrospora)、禾生指梗霜霉(Sclerospora graminicola)、玉蜀黍指霜霉(Peronosclerospora maydis)=玉蜀黍指梗霉(Sclerospora maydis)、菲律宾指霜霉(Peronosclerospora philippinensis)、菲律宾指梗霉(Sclerospora philippinensis)、高粱霜霉菌(Peronosclerospora sorghi)=高粱霜霉病(Sclerospora sorghi)、甜根子草指霜霉病菌(Peronosclerospora spontanea)=Sclerospora spontanea、甘蔗指霜霉(Peronosclerospora sacchari)=甘蔗指梗霉(Sclerospora sacchari)、稻褐纹病菌(Nigrospora oryzae(有性型:稻黑孢(Khuskiaoryzae)A.Iternaria alternala=细链格孢(A.tenuis)、灰绿曲霉(Aspergillusglaucus)、黑曲霉(A.niger)、曲霉(Aspergillus spp.)、灰葡萄孢(Botrytis cinerea)、小克银汉霉(Cunninghamella sp.)、苍白弯孢属(Curvulariapallescens)、Doratomycesslemonitis=Cephalotrichum slemonitis,黄色镰孢(Fusarium culmorum)、单纯节葡萄孢霉属(Gonatobotrys simplex)、玉米皮斯霉(Pithomyces maydicus)、小孢根霉(Rhizopus microsporus Tiegh.)、匍枝根霉(R.stolonifer)=黑根霉菌(R.nigricans)、布朗氏帚霉(Scopulariopsis brumptii)、巨大麦角(Claviceps gigantea)(无性型:钟穗花(Sphacelia sp.)玉蜀黍短梗霉(Aureobasidium zeae)=玉蜀黍球梗孢(Kabatiellazeae)、usarium subglutinans=串珠镰孢胶孢变种(F.moniliforme var.subglutinans)、串珠镰刀菌(Fusarium moniliforme)、燕麦镰刀菌(Fusarium avenaceum)(有性型—燕麦赤霉(Gibberella avenacea)、玉米灰穗病(Botryosphaeria zeae=玉米穗粒腐病(Physalospora zeae)(无性型:Allacrophoma zeae)、高粱尾孢(Cercospora sorghi)=高粱尾孢玉米变种(C.sorghi var.maydis)、Helminthosporium pedicellatum(有性型:Selosphaeriapedicellata)、枝孢样枝孢霉(Cladosporium cladosporioides)=芽孢状单孢枝霉(Hormodendrum cladosporioides)、腊叶芽枝菌(C.herbarum)(有性型—大麦叶烧病菌(Mycosphaerella tassiana)、玉蜀黍头孢霉(Cephalosporium maydis)、稗草链格抱菌(A.Iternaria alternata,A.scochyta maydis、小麦粒线虫(A.tritici)、玉米粒线虫(A.zeicola)、Bipolaris victoriae、维多利蠕孢菌病毒(Helminthosporium victoriae)(有性型Cochhoholus victoriae)、栽培番红花(C.sativus)(无性型:禾草离蠕孢(Bipolaris sorokiniana)=H.sorokinianum=叶部根腐病(H.sativum)、黑附球菌(Epicoccum nigrum)、长脐凸脐蠕孢(Exserohilum prolatum)=Drechslera prolata(有性型:玉米大斑病菌(Setosphaeriaprolata)、拟青霉粘束梗霉(Graphiumpenicillioides)、Leptosphaeria maydis、玉蜀黍小球腔菌(Leptothyrium zeae)、Ophiosphaerella herpotricha(无性型—线形孢(Scolecosporiella sp.)、Pataphaeosphaeria michotii、茎点霉(Phoma sp.)、玉蜀黍壳针孢(Septoria zeae)、玉蜀黍生壳针孢(S.zeicola)、玉蜀黍壳针孢(S.zeina)冠茎Setosphaeria turcica、大斑病明脐菌(Exserohilzim turcicum)=大斑病长蠕孢(Helminthosporium furcicum)、Cochhoholus carbonum,Bipolaris zeicola=炭色长蠕孢(Helminthosporiumcarhonum)、青霉(Penicillium spp.)、产黄青霉(P.chrysogenum)、扩展青霉(P.expansum)、草酸青霉(P.oxalicum)、Phaeocytostroma ambiguum、Phaeocylosporellazeae、马伊德小暗球壳(Phaeosphaeria maydis)=马伊德亚球壳(Sphaerulina nmaydis)、Botryosphaeriafestucae=Physalospora zeicola(无性型:干腐壳色单隔孢(Diplodiaftumenfi)、兼性寄生菌和真菌(Herniparasitic bacteria and fungi)Pyrenochaeta(土壤茎点霉(Phoma terrestris)=壤棘壳孢(Pyrenochaeta terrestris)、腐霉(Pythium spp.)、强雄腐霉(P.arrhenomanes)、禾生腐霉(P.graminicola)、瓜果腐霉(Pythium aphanidermatum)=巴特勒腐霉(P.hutleri L.)、玉蜀黍丝核菌(Rhizoctoniazeae)(有性型:Waitea circinata)、立枯丝核菌(Rhizoctonia solani)、玉蜀黍丝核菌次要链格孢(minor A Iternaria alternala)、高粱尾孢(Cercospora sorghi)、Dictochaetaftrtilis、尖圭镰孢(Fusarium acuminatum)(有性型Gihherellaacuminata)、泡状木贼镰孢(E.equiseti)(有性型:G.intricans)、尖镰孢(E.oxysporum)、早熟禾镰孢(E.pallidoroseum)、土粉红镰孢(E.poae)、E.roseum、G.cyanogena(无性型:硫色镰刀菌(E.sulphureum))、Microdochium holleyi、毛霉(Mucor sp.)、Periconiacircinata、恶疫霉(Phytophthora cactorum)、德雷疫霉(P.drechsleri)、寄生疫霉变种(P.nicotianae var.parasitica)、少根根霉的种(Phytophthora spp.)、Rhizopusarrhizus、长喙球隔孢(Setosphaeria rostrata)、喙状明脐菌(Exserohilum rostratum)=嘴突长蠕孢(Helminthosporium rostratum)、高粱柄锈菌(Puccinia sorghi)、多堆柄锈菌(Physopella pallescens)、玉蜀黍壳锈菌(P.zeae)、齐整小核菌(Sclerotium rofsiiSacc.)(有性型Athelia rotfsii)、Bipolaris sorokiniana、B.zeicola=炭色长蠕孢(Helminthosporium carbonum)、马伊德壳色单隔孢(Diplodia maydis)、Exserohilumpedicillatum、大斑病明脐菌(Exserohilum furcicum)=大斑病长蠕孢(Helminthosporium turcicum)、燕麦镰孢(Fusarium avenaceum)、黄色镰孢(E.culmorum)、小孢串球镰孢(E.moniliforme)、玉蜀黍赤霉(Gibberella zeae)(无性型—禾谷镰孢(E.graminearum)、菜豆壳球孢(Macrophominaphaseolina)、青霉、茎点霉(Phomopsis sp.)、腐霉、立枯丝核菌(Rhizoctonia solani)、玉蜀黍丝核菌(R.zeae,Sclerotium rolfsfi)、穗霉(Spicaria sp.)、壳月孢(Selenophoma sp.)、禾顶囊孢(Gaeumannomyces graminis)、禾漆斑菌(Myrothecium gramineum)、紫红曲(Monascuspurpureus)、红色红曲(M.ruber Smut)、玉蜀黍黑粉菌(Ustilago zeae)=U.maydis Smut、稻绿核菌(Ustilaginoidea virens Smut)、丝轴黑粉菌(Sphacelotheca reiliana)=Sporisorium holci、异旋孢腔菌(Cochliobolus heterostrophus)(无性型:Bipolarismaydis=玉蜀黍长蠕孢(Helminthosporium maydis))、Stenocarpella macrospora=大孢色二孢(Diplodia macrospora)、高粱尾孢、Fusarium episphaeria、节状镰孢(E.merismoides)、尖镰孢(F.oxysporum Schlechtend)、尖孢镰刀菌古巴专化型(Foc)、镰刀霉的种(Fusarium spp.)、E.poae、粉红镰孢(E.roseum)、腐皮镰孢(E.solani)(有性型:Nectria haematococca)、三隔镰孢(F.tricincturn)、Mariannaea elegans、毛霉(Mucorsp.)、玉蜀黍褐孢座壳(Rhopographus zeae)、穗霉(Spicaria sp.)、曲霉(Aspergillusspp.)、青霉、Trichoderma viride=木素木霉(T.lignorum,有性型:肉座菌(Hypocreasp.)、Stenocarpella maydis=玉蜀黍壳色单隔孢(Diplodia zeae)、Ascochytaischaemi、马伊德叶点霉(Phyllosticta maydis)(有性型:Mycosphaerella zeae-maydis)、斐济球腔菌(Mycosphaerella fijiensis);斐济假尾孢(假尾孢(Paracercospora))和高粱胶尾孢。
病毒或类病毒包括但不限于美洲小麦条点花叶病毒(AWSMV)、大麦条纹花叶病毒(BSMV)、大麦黄矮病毒(BYDV)、香蕉束顶病毒、雀麦花叶病毒(BMV)、谷物褪绿斑驳病毒(CCMV)、玉米褪绿条带病毒(CCVBV)、玉米褪绿斑驳病毒(MCMV)、玉米矮花叶病毒(MDMV)、A或B、小麦条纹花叶病毒(WSMV)、黄瓜花叶病毒(CMV)、cynodon褪绿条纹病毒(CCSV)、约翰逊草花叶病毒(JGMV)、玉米丛生矮化或支原体样生物(NILO)、玉米褪绿矮缩病毒(MCDV)、玉米褪绿斑驳病毒(MCMV)、玉米矮缩花叶病毒(MDMV)株A、D、E和F,玉米叶斑病毒(MLFV)、玉米线病毒(NELV)、玉米花叶病毒(MMV)、玉米斑驳和褪绿矮化病毒、玉米透明环斑病毒(MPRV)、玉米缨粒病毒(MRGV)、玉米rayado fino病毒(MRFV)、玉米红叶红条病毒(MRSV)、玉米环斑驳病毒(MRMV)、玉米rio cuarto病毒(MRCV)、玉米粗矮病毒(MRDV)、玉米不育矮化病毒(大麦黄纹病毒株)、玉米条纹病毒(MSV)、玉米褪绿条纹病、玉米hoja玉米条纹病毒blanca、玉米矮化病毒、玉米雄穗败育病毒(MTAV)、玉米叶脉突起病毒(MVEV)、玉米鼠耳病毒(MAVEV)、玉米白叶病毒、玉米白线花叶病毒(NTVVLMV)、粟红叶病毒(NMV)、纳米病毒科家族的病毒,北方谷物花叶病毒(NCMV)、燕麦假菊形团病毒、燕麦不育矮化病毒(OSDV)、水稻黑条矮缩病毒(RBSDV)、水稻条纹病毒(RSV)、高粱花叶病毒(SrMV),以前被称为甘蔗花叶病毒(SCMV))染色H、I和M、甘蔗斐济病病毒(FDV)、甘蔗花叶病毒(SCMV)株A、B、D、E、SC、BC、Sabi和NM叶脉突起病毒以及小麦斑点花叶病毒(WSMV)。
寄生线虫包括但不限于Awl锥线虫(Dolichodorus spp.)、异头锥线虫(D.heterocephalus)球茎和茎(欧洲)、起绒草茎线虫(Ditylenchus dipsaci Burrowing)相似穿孔线虫(Radopholus similis)胞囊燕麦异皮线虫(Heterodera avenae)、玉米异皮线虫(H.zeae)、查尔科斑皮线虫(Punctodera chalcoensis Dagger)剑线虫(Xiphinemaspp.)、美洲剑线虫(X.americanum)、地中海剑线虫(X.mediterraneum)假根结背侧珍珠线虫(Nacobbus dorsalis)Lance、哥伦比亚纽带线虫(Hoplolaimus columbus)Lance(纽带线虫、帽状纽带线虫(H.galeatus)损伤短体线虫(Lesion Pratylenchus spp.)、最短尾短体线虫(P.brachyurus)、刻痕短体线虫(P.crenalus)、六纹短体线虫(P.hexincisus)、落选短体线虫(P.neglectus)、穿刺短体线虫(P.penetrans)、斯氏短体线虫(P.scribneri)、索氏短体线虫(P.thornei)、玉米短体线虫(P.zeae)针长针线虫(Needle Longidorus spp.)、短环长针线虫(L.breviannulatus)环小环线虫(Ring Criconemella spp.)、装饰小环线虫(Cornata)根结根结线虫(Root-knot Meloidogyne spp.)、奇氏奶结线虫(M.chitwoodi)、南方根结线虫(M.incognita)、爪哇根结线虫(M.javanica)螺旋螺旋线虫(SpiralHelicotylenchus spp.)、刺线虫(Belonolaimus spp.)、长地刺线虫粗短根异毛刺线虫(Stubby-root Paratrichodorus spp.)、克氏异毛刺线虫(P.christiei)、较小异毛刺线虫(P.minor)、锐利异毛刺线虫(Ouinisulcius aculus)和毛刺线虫(Trichodorus spp.)。
害虫包括选自鞘翅目、双翅目、膜翅目、鳞翅目、食心虫目、同翅目、半翅目、直翅目、缨翅目、皮翅目、等翅目、按蚊目、蚤目、毛翅目等的昆虫,特别是鞘翅目和鳞翅目。
在一些实施例中,植物病原体选自真菌,特别是土传真菌例如尖孢镰刀菌,水和气传病毒例如香蕉叶斑病(Mycosphaerella fijiensis)(Morelet)、香蕉褐条斑小球壳菌(Mycosphaerella musicola)(Leach ex Mulder)、菲氏假尾孢(Pseudocercospora(Paracercospora)fijiensi)、大丽轮枝菌、枝孢霉和烟草劳尔氏菌(RalstonaSolanaceum)。
在一些实施例中,所述疾病是枯萎病(也被称为巴拿马病),其是由土传真菌尖孢镰刀菌古巴专化型(Foc)引起的致死性真菌疾病。所述疾病也可以被称为巴拿马病TR4、Foc、巴拿马病热带小种4或TR4。在一些实施例中,对TR4的抗性在单个栽培品种内与对一种或多种额外疾病的遗传抗性或耐受性组合,例如对由细菌、其他真菌、病毒、线虫、昆虫等引起的疾病的抗性。
枯萎病是香蕉的最具破坏性和臭名昭著的疾病之一。它也被称为巴拿马病,因为它在这个中美洲国家的出口种植园中造成了广泛的破坏。到1960年,枯萎病已经摧毁了估计40,000公顷的“大米歇尔”(AAA),导致出口行业转向香芽蕉亚群(AAA)的栽培品种(Ploetz和Pegg,2000)。枯萎病是由土传丝孢菌施勒希特尖孢镰刀菌古巴专化型引起的。它是引起开花植物的维管枯萎的多于120种的尖孢镰刀菌的专化型(特殊形式)之一。这种病原体影响芭蕉属和蝎尾蕉属(Heliconia)的物种,并且根据对田间中的寄主栽培品种的致病性,菌株已被分为4个生理小种(小种1,‘大米歇尔’;小种2,“Bluggoe”;小种3,蝎尾蕉;和小种4,香芽蕉栽培品种和对小种1和小种2易感的所有栽培品种)。已经命名了四个尖孢镰刀菌小种,小种1到小种4。小种1是许多香蕉栽培品种的关键病原体。小种2攻击烹饪香蕉。小种3影响美洲的香蕉近缘种,但似乎不会影响香蕉。目前的威胁来自尖孢镰刀菌小种4(也被称为TR4(热带小种4)的扩展,其被指定为“Foc-TR4”。小种4具有两个亚组,TR4和SR4(亚热带小种4)。直到最近,小种4才被记录为在澳大利亚、南非、加那利群岛和中国台湾的亚热带地区造成严重损失。香蕉种植者和香蕉公司一再表示,如果这一小种变得在美洲确立,世界出口产业将受到严重影响,因为没有普遍接受的香芽蕉栽培品种的替代品(Bentley等人,1998)。
最近,(Stokstad,2019),目前已经在西半球检测到巴拿马病小种4(枯萎病)。在哥伦比亚的四个种植园中发现了这种疾病。这四个种植园立即被隔离。然而,香蕉市场的很大一部分由从中美洲和南美洲对美国的出口组成。这个市场现在岌岌可危,使得迅速解决危机变得甚至更加紧迫。最近在西半球出现的巴拿马病TR4使得迅速解决危机变得甚至更加紧迫。
在一些实施例中,“枯萎病”或“FW”可以可互换地使用,其表示如在受感染的香蕉植物中表现出的疾病。
在20世纪50年代和20世纪60年代,单一品种大米歇尔被广泛种植。它对容易传播的真菌尖孢镰刀菌古巴专化型高度敏感。特别地,正是热带镰刀菌小种1(Foc-TR1)引起了致命的枯萎病,并且全球香蕉产业几乎被摧毁。发现香芽蕉品种对Foc-TR1具有高度抗性,并切取代大米歇尔用于全球香蕉生产。在20世纪90年代,种植者开始发现香蕉植株感染了Foc-TR4,这是一种新出现的小种。Foc-TR4也很容易传播,并且已经在亚洲、中东和非洲的香蕉种植园中发现,再次威胁全球香蕉作物。最近在加勒比地区识别的Foc-TR4已经引起了人们的极大关注,这意味着该真菌现在已在西半球具有滩头阵地,从而威胁到拉丁美洲的香蕉生产。在一些实施例中,本公开提供了对由Foc-TR4引起的香蕉上的严重问题的解决方案。在一些实施例中,将该解决方案用于鉴定抗病遗传材料和/或结构,并将所述遗传材料和结构导入易感染致病真菌(例如Foc-TR4)的香蕉品种。
香蕉也易感染其他病原真菌,特别是导致黑叶斑病(也被称为黑叶斑病(BlackSigatoka)和Black Sig)的斐济球腔菌(Mycosphaerella fijiensis)(Morelet)和导致黄色Sigatoka叶斑病的香蕉生球腔菌(M.musicola)。已知这些真菌(斐济球腔菌和香蕉生球腔菌)用杀真菌剂控制,但杀真菌剂针对Foc-TR4无效。
本公开教导了使用下一代植物育种技术(也被称为新的育种技术)调节、刺激或增强由例如Foc-TR4等病原体引起的植物的抗病性的方法。
新的育种技术(NBT)是指被开发和/或用于通过遗传变异在植物中创建新的特性的各种新技术,其目的是靶向诱变、新基因的靶向引入或基因沉默(RdDM)。以下育种技术在NBT的范围内:通过使用锌指核酸酶(ZFN)技术(ZFN-1、ZFN-2和ZFN-3,参见美国专利号9,145,565(其通过引用以其整体并入))促进的靶向序列改变、寡核苷酸定向诱变(ODM,又称定点诱变)、近缘转基因(Cisgenesis)和内转基因(intragenesis)、表观遗传方法例如RNA依赖的DNA甲基化(RdDM,其不一定改变核苷酸序列,但可以改变序列的生物活性)、嫁接(在GM砧木上)、反向育种、用于瞬时基因表达的农业渗透(农业渗透“狭义的”、农业接种、花卉浸渍)、转录激活物样效应子核酸酶(TALENs,参见美国专利号8,586,363和9,181,535(其通过引用以其整体并入))、CRISPR/Cas系统(参见美国专利号8,697,359;8,771,945;8,795,965;8,865,406;8,871,445;8,889,356;8,895,308;8,906,616;8,932,814;8,945,839;8,993,233;和8,999,641,其均据此通过引用并入),工程改造的巨型核酸酶、重新工程改造的归巢核酸内切酶、DNA引导的基因组编辑(Gao等人,《自然生物技术(NatureBiotechnology)》(2016),doi:10.1038/nbt.3547,其通过引用以其整体并入)和合成基因组学。当今靶向的基因组编辑的一个主要部分(即新的育种技术的另一个名称)是在基因组中要进行修饰的选定位置处诱导DNA双链断裂(DSB)的应用。DSB的定向修复允许靶向的基因组编辑。此类应用可以用于产生突变(例如,靶向的突变或精确的天然基因编辑)以及基因的精确插入(例如,近缘转基因、内转基因或远缘转基因(transgenes))。导致突变的应用通常被确定为定点核酸酶(SDN)技术,例如SDN1、SDN2和SDN3。对于SDN1,结果是靶向的、非特异性的遗传缺失突变:DNA DSB的位置被精确选择,但通过宿主细胞的DNA修复是随机的,并且导致小的核苷酸缺失、添加或取代。对于SDN2,SDN用于产生靶向的DSB,并且DNA修复模板(除了一个或几个核苷酸变化之外,与靶向的DSB DNA序列相同的短DNA序列)用于修复DSB:这导致感兴趣的所需基因中的靶向的和预定的点突变。对于SDN3,SDN与包含新的DNA序列(例如基因)的DNA修复模板一起使用。该技术的结果将是将该DNA序列整合到植物基因组中。说明使用SDN3的最可能的应用是在选定的基因组位置处插入近缘转基因的、内转基因的或转基因的表达盒。这些技术中的每一种的完整描述可以在欧盟委员会联合研究中心(JRC)前瞻性技术研究机构(Joint Research Center(JRC)Institute for ProspectiveTechnological Studies of the European Commission)在2011年发表的并且题为“新的植物育种技术—最先进水平和商业发展前景(New plant breeding techniques-State-of-the-art and prospects for commercial development)”的报告(其通过引用以其整体并入)中找到。
在一些实施例中,已经采取各种方法来预防或治疗Foc-TR4感染。本公开教导了,预防或治疗Foc-TR4的关键方法是(1)发现抗性香蕉栽培品种,(2)从选定的香蕉栽培品种中鉴定抗性基因和/或性状,以及(3)将抗性基因和/或性状培育/引入到敏感的香蕉栽培品种中。
Zuo等人.(2018)评估了129个香蕉种质,并且发现10个对Foc-TR4具有高度抗性—从而为研究提供了天然存在的抗性栽培品种。
Li等人.(2012)研究了抗性突变体的根的转录组和表达谱,并且在用Foc-TR4攻击后的两个时间点将它们与敏感的野生型巴西香芽蕉进行了比较。他们发现了约88,000个单基因,其中5,000个与其他植物中的防御途径相关。他们得出结论,约2,600个基因在抗性突变体中被差异表达,包括一些在抗性突变体中以相同或较低水平表达的植物细胞木质化基因。
以类似的方式,Bai等人.(2013)将来自Foc-TR4敏感巴西栽培品种的根转录组与已知具有低得多的疾病严重程度的Yueyoukang 1栽培品种进行比较。Bai等人发现500到2000个不同的单基因在不同的时间点的差异表达,并且这些单基因可以被聚集成11种不同类型的代谢途径。Bai等人发现了与细胞壁木质化相关的基因,这些基因在敏感栽培品种与抗性栽培品种之间被差异调节—特别是4-香豆酸:CoA连接酶(4CL)、谷胱甘肽S-转移酶(GST)、纤维素合酶、咖啡酰-CoA O-甲基转移酶(CCoAM)和肉桂醇脱氢酶(CAD)在抗性栽培品种中以较高的水平表达,并得出以下结论:细胞壁木质化可能是Foc-TR4抗性中涉及的机制之一。Bai等人指出,这与Li等人(2012)的结果不一致,并得出结论:不同的植物可能具有不同的抗性机制,并且需要更多的工作来破译香蕉栽培品种如何能够抵抗Foc-TR4。
Wang等人.(2017)还研究了花芽分化时的差异根基因表达,并且发现在易感染的香蕉栽培品种与敏感的香蕉栽培品种之间的根中有107个基因差异表达。
Zhang等人(2018)表明,Foc-TR4感染在抗病栽培品种(Pahang)和易感染栽培品种(巴西)的根中类似地进行,直至到达球茎,在球茎中Pahang相对于巴西真菌生物量和坏死的程度显著更低。(香蕉的“球茎”是一种地下茎或根茎,根从中生长。)
Van der Berg等人(2007)使用定量的RT-PCR来鉴定在感染Foc-4后FW耐受的GCTCV-218香蕉栽培品种中上调的基因。他们的对照是FW敏感的威廉斯栽培品种。他们发现,与FW敏感的威廉斯相比,在FW耐受的GCTCV-218中许多基因被上调。如预期的,许多上调的基因与已知的防御相关基因(包括细胞壁强化基因)同源。他们报告了13种在根中上调的基因。虽然他们声称“这些结果阐明了参与防御的基因,并为理解香蕉的枯萎病提供了步骤,从而开发了一种有效的疾病管理策略”,但该论文并未表明他们保藏在GenBank中的13种基因中的任何一种可以用于控制枯萎病。没有给出使用这些基因来控制枯萎病的特定策略。
Vishnevetsky等人(2009)(美国专利号7,534,930)描述了一种对香蕉植物进行遗传工程改造以赋予外源性抗病性状的方法,所述性状包括对黑色和黄色Sigatoka和Botrytis的抗性。Vishnevetsky等人操纵三种多核苷酸进入香蕉植物,包括编码内切几丁质酶、芪合酶(stilbene synthase)和超氧化物歧化酶的基因。
Paul等人(2011)从线虫秀丽线虫(C.elegans)中分离出基因,该基因当被稳定地转化为“女士手指(Lady finger)”香蕉栽培品种时出现在温室试验中,以赋予对巴拿马病的小种1的抗性。
尽管消费者不太可能接受用衍生自线虫的基因转化香蕉,但Dale的团队用衍生自香蕉的基因进行的后续工作确实显示了在GMO-转化的香蕉中实现镰刀菌抗性的希望。例如,Peraza-Echeverria等人(2009年)从野生香蕉小果野蕉malaccensis中分离出抗性基因类似物(RGA2)基因。该基因是大型NB-LRR型抗性基因家族的成员。当转化到FW敏感的香芽蕉植物中时(Dale等人,2017),该基因似乎赋予了对镰刀菌的抗性。Dale等人(2017)对转基因香蕉植物进行了3年的田间试验。在试验结束时,约67%到100%的FW敏感的对照植物死亡或被感染。然而,在用它们的候选基因转染的四个香蕉品系中,不到30%的转化的香蕉显示出严重感染的迹象(即≥70%显示出一些耐受性或抗性)。一种用RGA2转化的品系似乎对TR4免疫。虽然这是该基因可能赋予某些FW抗性的良好证据,但该基因在10多年前首次被分离出来,并且目前尚不清楚香蕉种植行业是否会接受RGA2基因。
值得注意的是,据信(与香蕉产业育种者和科学家的未公开的通信)在芭蕉属基因组中可能存在多达四种基因(其对镰孢菌有一定程度的抗性),因此单独的RGA2不太可能解决当前的危机,即使它被种植者接受。即使RGA2获得认可,该行业也迫切需要多个基因来控制TR4。
发明人注意到本公开的FusR1与RGA2完全无关。这两个基因具有完全不同的核苷酸序列(即,它们没有序列同一性),它们位于不同的染色体上,它们具有不同的生物化学,并且它们在植物中具有不同的作用机制。
Wu等人(2016)对在中国亚热带发现的抗病野生香蕉近缘种阿宽蕉进行了测序。计算Ks值以便估计芭蕉属的属中的物种形成和古倍体化(paleoploidization)事件。此外,计算了Ka/Ks值以表明如预期的那样,阿宽蕉基因组中的大多数基因都经历了纯化选择。表明,阿宽蕉已知具有抗病性,因此可以从其基因组中挖掘抗病基因。
在一些实施例中,本公开提供了从FW抗性的香蕉栽培品种中发现、鉴定和选择抗病例如枯萎病的基因的方法。在其他实施例中,本公开提供了由本公开的方法鉴定的镰刀菌抗性基因(例如FusR1基因)的核苷酸和多肽序列。在另外的实施例中,本公开教导了通过使用下一代植物育种技术(其包括但不限于本公开中描述的CRISPR技术)产生和/或生产具有抗性基因和/或性状的香蕉品种的方法。
III.从芭蕉属的属中鉴定FusR1基因
栽培的香蕉通常为三倍体(尽管少数为二倍体),这是因为它们复杂的进化和驯化历史,其涉及许多种间和种内杂交事件,既有自然的也有人为的。食用的栽培的香蕉主要是两种野生二倍体物种小果野蕉和野蕉之间的杂交的结果(Christelová等人,2017)。人类驯化香蕉始于约7000年前的东南亚(D'Hont等人,2012)。衍生自小果野蕉的香蕉基因组被称为“A”基因组,而衍生自野蕉的香蕉具有“B”基因组(D'Hont等人,2012)。因此二倍体小果野蕉的基因组结构被标记为AA,并且二倍体野蕉的基因组结构为BB。因此,食用的香蕉栽培品种可能具有三倍体AAA基因组(如香芽蕉或大米歇尔)、AAB基因组(如在许多大蕉中)或ABB基因组(如Cachaco地方品种)。小果野蕉可能起源于马来西亚或印度尼西亚(Christelová等人,2017)。相比之下,野蕉被认为起源于印度、泰国或菲律宾(Christelová等人,2017)。因此,这两个物种最初是异地的,并且地理隔离为每个物种提供了发展独特性状的机会。当人类后来将小果野蕉栽培品种转移到野蕉居住的地区时,发生了种间杂交。
经济上至关重要的香芽蕉栽培品种(其占商业香蕉出口产量的至少99%)表现出三倍体诱导的不育性。这与单性结实相结合,产生了没有种子的可食用果实,但严重阻碍了育种,因此香芽蕉是生长地繁殖的(无性系地繁殖的)。香芽蕉基因型具有三个小果野蕉衍生的“A”基因组。
在一些实施例中,发明人鉴定了有效地控制香蕉中的枯萎病的基因。例如,本公开教导了,通过使用发明人的分子进化分析方法鉴定了名为FusR1(镰刀菌抗性1)的基因。最近的公开教导了,FusR1基因是芭蕉属物种中的天然基因,包括栽培的香蕉、阿宽蕉、小果野蕉、野蕉、芭蕉以及密切相关的属的唯一成员的地涌金莲。来自野生香蕉近缘种阿宽蕉的直系同源物(两个等位基因)在此以SEQ ID NO:1和SEQ ID NO:4给出。阿宽蕉FusR1序列获自多个种质(包括但不限于ITC1526、ITC1571和PT-BA-00223)。所有阿宽蕉种质都具有极强的FW抗性(Li等人,2015年;Wu等人,2016年)。
本公开教导发明人在阿宽蕉中鉴定了FusR1的两个等位基因。SEQ ID NO:1给出了FusR1mRNA序列的等位基因#1。SEQ ID NO:2给出了等位基因#1编码序列。SEQ ID NO:4给出了FusR1 mRNA序列的等位基因#2。SEQ ID NO:5给出等位基因#2编码序列。等位基因1和2在序列上非常相似:它们仅编码四个氨基酸差异。
FusR1的第二个转录本是从阿宽蕉中鉴定出来的(SEQ ID NO:7);该转录本具有表达的(即未剪接的)内含子,其导致正确阅读框的破坏。它以非常低的水平表达。
阿宽蕉自然对枯萎病的影响具有极强的抗性(Li等人,2015;Wu等人,2016)。在一些实施例中,来自阿宽蕉的FusR1基因负责对枯萎病的抗性。
本公开进一步教导了发明人鉴定小果野蕉中的FusR1的3个等位基因。这些等位基因中的两个是从小果野蕉的FW抗性种质中分离出来的。第三个等位基因是从FW敏感的小果野蕉种质中分离出来的。小果野蕉FusR1 FW抗性序列从多个FW抗性种质中获得,包括ITC0896(M.a.subspecies banksii)和PT_BA-00281(Pisang Bangkahulu)。小果野蕉FW-敏感序列来自FW敏感的种质ITC0507、ITC0685、PT-BA-00304、PT-BA-00310和PT-BA-00315。
SEQ ID NO:8给出了来自小果野蕉的FW-抗性FusR1基因的等位基因1的mRNA序列。SEQ ID NO:10给出了来自小果野蕉的FW-抗性FusR1基因的等位基因2的mRNA序列。来自小果野蕉的FW-抗性等位基因1的编码序列在SEQ ID 9中给出。SEQ ID NO:11给出了来自小果野蕉的FW抗性等位基因2的编码序列。
SEQ ID NO:13给出了来自小果野蕉的FW-抗性FusR1等位基因的mRNA序列。(小果野蕉FW敏感序列是从种质ITC0507、ITC0685、PT-BA-00304、PT-BA-00310和PT-BA-00315中鉴定的。这些种质包括来自香蕉栽培品种的多个样品,例如Pisang Madu、Pisang Pipit和Pisang Rojo Uter,所有这些都被充分表征为FW敏感的(Chen等人,2019)。
发明人从小果野蕉中鉴定了FusR1的推定核心启动子。发明人使用了两种不同的启动子预测应用程序,试图从不同的算法/软件中找到一致的预测。
作为第一步骤,本发明人扩增和测序了753bp的序列片段(SEQ ID NO:31),该片段开始于衍生自小果野蕉的FusR1基因的FW-抗性等位基因的编码区域的上游。该片段与GenBank登录NC_025206的bp7868911–bp7869210和bp7869341-bp7869743为100%相同(小果野蕉subsp.malaccensis染色体5,ASM31385v2,全基因组鸟枪序列),其位于小果野蕉染色体5上。
发明人首先使用“神经网络启动子预测”(NNPP)(其可在伯克利果蝇基因组项目(Berkeley Drosophila Genome Project)(BDGP)上获得)分析了FusR1的上游区域。BDGP是果蝇基因组中心的联盟,其由国家人类基因组研究所(National Human Genome ResearchInstitute)、国家癌症研究所(National Cancer Institute)和霍华德·休斯医学研究所(Howard Hughes Medical Institute)资助。NNPP软件是在人类和黑腹果蝇启动子序列上“训练”的,但已被证明在鉴定启动子序列方面通常是有效的,甚至在植物中也是如此(Reese,2001)。
NNPP分析成功地鉴定了FusR1的核心启动子。分析结果如下。SEQ ID NO:31的前189个碱基(以小写字母显示)为非编码上游序列,包括FusR1的5'UTR序列;接下来的423个碱基是编码序列(以大写字母显示)。该编码序列与SEQ ID NO:9相同。最后141个碱基是3'UTR(以小写字母显示)。SEQ ID NO:31的碱基92-141是NNPP预测的启动子序列,其以小写字母粗体显示。碱基对132处的转录起始位点(TSS)以小写字母加下划线的粗体显示。NNPP为这个启动子分配.88的评分(即88%的置信水平)。
SEQ ID NO:31
然后,发明人使用“植物启动子预测(Prediction of PLANT Promoters)”(TSSP)软件分析了来自小果野蕉的FusR1的上游区域,该软件专门针对植物启动子序列的鉴定(Solovyev和Shahmuradov,2003)。这是由Softberry,Inc.生产的一套序列分析软件的一部分。TSSP将转录起始位点(TSS)鉴定为SEQ ID NO:31中的位置132,这与NNPP软件结果(参见上文)相同。TSSP将FusR1 TATA框(上面以小写字母斜体显示)定位在SEQ ID NO:31的碱基102-107处。因此,如预期的,FusR1 TATA框位于TSS上游的25个碱基对处。
由于这2种不同的启动子预测应用给出了一致的结果,因此发明人鉴定了小果野蕉的正确启动子序列。
本公开教导了将新鉴定的FusR1基因及其变体引入到栽培的香蕉,特别是镰刀菌敏感的香芽蕉栽培品种中,以便使这些栽培品种对枯萎病具有抗性的方法。在一些实施例中,本公开教导了,传统的植物育种方法可以用于将来自阿宽蕉的FusR1基因/性状引入到香芽蕉和其他栽培的香蕉中。在其他实施例中,本公开教导了,下一代植物育种方法可以用于将来自阿宽蕉的FusR1基因/性状引入到香芽蕉和其他栽培的香蕉中。在另外的实施例中,本公开教导了,使用基因组编辑技术将来自阿宽蕉的FusR1基因/性状引入到香芽蕉和其他栽培的香蕉中的方法,所述基因组编辑技术例如使用锌指核酸酶(ZFN)、转录激活物样效应核酸酶(TALEN)或利用具有由CRISPR RNA(crRNA)指导的序列特异性的CRISPR相关(Cas)蛋白的核酸内切酶活性的CRISPR/Cas9系统技术的靶向基因组编辑系统。
鉴于香芽蕉可能灭绝的威胁,本公开提供了一种使用CRISPR/Cas9系统的快速的、有效的和精确的基因组编辑方法,该方法适于生产具有镰刀菌抗性基因/性状的最低限度遗传编辑的香蕉,这将被接受,特别是在香蕉提供关键的经济和食品安全的发展中国家。本公开教导了天然FusR1基因从阿宽蕉到栽培的香蕉的转移可以用CRISPR技术最佳地完成,其允许靶向的、干净的和有效的转移,并且与更传统的遗传编辑技术相比,其使潜在的副作用最小化。
在一些实施例中,FusR1(SEQ ID NO:8和SEQ ID NO:10)的有用等位基因是从天然FW抗性的小果野蕉群体中鉴定的。这些等位基因赋予FW抗性。本公开教导了,衍生自小果野蕉的FusR1等位基因可以与衍生自阿宽蕉的FusR1等位基因(SEQ ID NO:2和SEQ ID NO:5)结合使用,以增强栽培的香蕉(特别是香芽蕉)中的FW抗性。
本公开教导了与由本公开中公开的发明人鉴定的至少两个FusR1基因的基因堆叠。
阿宽蕉FusR1直系同源物(SEQ ID NO:2和SEQ ID NO:5)和小果野蕉FW-抗性等位基因(SEQ ID NO:8和SEQ ID NO:10)均可以用于传统的植物育种和/或新一代植物育种方法。新一代植物育种方法包括但不限于栽培的香蕉中的标记物辅助选择(MAS)和/或基因组编辑技术。
一些野蕉种质已经被严格地表征为对FW具有很强的抗性,而另一些对FW极为敏感。虽然可以预期野生野蕉种质对如镰刀菌的病原体将具有抗性,但研究人员很难理解为什么密切相关的种质在FW抗性方面差异如此显著。
发明人发现FusR1基因在FW-敏感的野蕉种质中的核苷酸序列的结构上的差异,如图5所示。发明人分析的所有FW敏感的野蕉种质都包含“断裂的”FusR1转录本。这种分析限于在所有被检查的FW敏感的种质中发现的“断裂的”FusR1基因。发明人检查的所有野蕉中的FusR1 mRNA都具有未剪接的、表达的内含子,该内含子破坏了正确的阅读框。此外,发明人发现(i)在几个FusR1 mRNA(2)中具有长的82或84bp的缺失,在所有种质中有较小的1bp缺失,或(ii)在一些种质中,4bp插入,其中每个还破坏开放阅读框,从而编码突变的、无功能的FUSR1蛋白。所有FW敏感的野蕉种质都具有上述这些阅读框破坏子中的一种或多种,导致无功能的蛋白质。在一些实施例中,本公开教导了一些野蕉种质具有所有四种阅读框破坏子。参见图5。
在其他实施例中,发明人在研究FW抗性相对于FW敏感的小果野蕉种质时还发现了另一个显著差异。在一些实施例中,小果野蕉中的FusR1根据FusR1等位基因给出抗性相对于敏感性。本公开教导了,两个等位基因(其被证明是“抗性等位基因”)赋予FW抗性;SEQ IDNO:8和SEQ ID NO:10。这两个等位基因在序列上与衍生自FW抗性野生香蕉空间芭蕉(SEQID NO:17和SEQ ID NO:20)的FusR1直系同源物非常相似。第三个等位基因(即FW敏感的等位基因)仅在FW敏感的小果野蕉种质(SEQ ID NO:13)中发现。
野蕉FusR1序列(SEQ ID NO:26和SEQ ID NO:27)不赋予FW抗性,因为该基因通过破坏阅读框的插入缺失和/或表达的导致FW抗性丧失的未剪接的内含子而被破坏(如同在所有被检查的FW敏感的野蕉种质中一样)。
在另外的实施例中,衍生自FW抗性小果野蕉种质的FusR1序列(SEQ ID NO:8和SEQID NO:10)与衍生自芭蕉的FusR1直系同源物((SEQ ID ID:17))具有非常高的序列相似性。芭蕉是对FW具有很强抗性的野生香蕉物种((Li等人.2015)。在其他实施例中,来自FW敏感的小果野蕉种质的FusR1序列(SEQ ID NO:13)不同于FW抗性的小果野蕉等位基因(SEQ IDNO:8和SEQ ID NO:10)。
本公开教导了小果野蕉中的FW抗性取决于具有仅在FW抗性种质中发现的等位基因。尽管小果野蕉和野蕉彼此之间的亲缘关系比与阿宽蕉或芭蕉的亲缘关系更密切,但控制FW抗性的FusR1序列聚集在一起,这与物种之间的实际亲缘关系形成了直接对比。在其他实施例中,FusR1基因已经被适应(即,被阳性选择),使得FusR1不能反映芭蕉属物种内的实际关系。本公开教导了两个独立的适应性事件(收敛进化),或者可能FW抗性FusR1版本已经在各种芭蕉属物种之间进行了交易(基因转移)。
发明人通过对来自几个芭蕉属物种的两个不同的、保守的单拷贝基因C2H2和TOPO6进行测序,证实了这些芭蕉属物种之间真正的系统发育关系。C2H2型锌指蛋白在植物发育和生长以及非生物胁迫抗性(包括香蕉中的果实成熟)中发挥重要作用(Han等人,《植物科学前沿(Front.Plant Sci.)》,第11卷,文章115:1-13,2020年2月20日;Han等人.《收获后生物学与技术(Postharvest Biology and Technology)》,116:8-15,2016年6月)。TOPO6(一种古细菌拓扑异构酶VI的植物同源物的亚基B的核基因标记物区域)在大多数植物组的单倍体基因组中作为单个拷贝基因座出现(Frank R.Blattner,《植物系统学和进化(PlantSystematics and Evolution)》,第302卷:239-244,2016)。这两个基因(其生化功能是熟知的)在病原体控制中没有作用,这使它们非常适合作为理解由于暴露于镰刀菌而在香蕉FusR1上施加的适应性变化的“对照”。因此,本公开教导了,文献中关于小果野蕉和野蕉是姐妹物种的共识是正确的,这意味着我们新鉴定的基因FusR1在这些香蕉物种中发生了显著变化,提供了FusR1赋予FW抗性的更多证据。参见图3和4中提供的系统发育树。
本公开教导了来自阿宽蕉的强FW抗性的FusR1等位基因之间的关键序列差异,这允许发明人确定使FusR1能够控制FW的确切的几个核苷酸。基于发明人的发现,本公开教导了一种使用CRISPR/Cas系统通过仅精确地改变FusR1中的几个关键核苷酸来赋予FW敏感的香芽蕉(以及所有其他栽培的香蕉)中的FW抗性的方法。此外,本公开还教导了使用这些关键核苷酸来产生具有比天然基因更大的FW抗性的新型FusR1序列的方法。
IV.FusR1基因及其变体
本公开部分地基于从香蕉品种和物种中分离新的FusR1基因。该FusR1基因的核苷酸序列及其直系同源物序列分别在SEQ ID NO:1-2、4-5、7-11、13-14、16-18、20-21、23-24和26-31中呈现。
在一些实施例中,SEQ ID NO:1是来自阿宽蕉(最具镰刀菌抗性的野生香蕉物种)的FusR1的等位基因1的部分mRNA序列。SEQ ID NO:4是来自阿宽蕉的FusR1的等位基因2的部分mRNA序列。
前述来自阿宽蕉的FusR1等位基因(SEQ ID NO:1和SEQ ID NO:4)编码略微不同的蛋白质,其分别为SEQ ID NO:3和SEQ ID NO:6。SEQ ID NO:1的翻译的多肽被表示为SEQ IDNO:3。SEQ ID NO:4的翻译的多肽被表示为SEQ ID NO:6。这些只是略微不同,其中少数不同的氨基酸残基都是生化保守的。在一些实施例中,对5个不同的阿宽蕉种质进行了测序,并且所有种质都具有这两个相同的FusR1等位基因。
在一些实施例中,SEQ ID NO:8和SEQ ID NO:10是部分mRNA(包括完整编码序列)。这些是来自小果野蕉的种斑克木(banksia)(种质号ITC0896)和PT_BA-00281(PisangBankahulu)的FusR1的FW抗性等位基因。这两个等位基因在单个沉默位点上不同。在其他实施例中,SEQ ID NO:13代表来自小果野蕉的FW敏感的等位基因。在另外的实施例中,SEQ IDNO:9和SEQ ID NO:11代表来自小果野蕉的FW抗性等位基因的编码序列。此外,SEQ ID NO:12代表来自小果野蕉的FW抗性蛋白质序列,其是SEQ ID NO:8和SEQ ID NO:10的翻译的多肽序列。
在一些实施例中,SEQ ID NO:17和SEQ ID NO:20是来自芭蕉(一种对镰刀菌有抗性的野生香蕉物种)的部分的mRNA FusR1等位基因。在其他实施例中,SEQ ID NO:23是来自另一个野生香蕉近缘种地涌金莲(地涌金莲)的FusR1序列。
应当注意,发明人在本文中报告的所有mRNA序列在技术上都是部分的,因为它们缺少一点5'UTR,并且通常缺少3'UTR的末端的几个碱基。本文报告的绝大多数mRNA非常接近于完整序列。
在一些实施例中,SEQ ID NO:26和SEQ ID NO:28-30是来自几个不同的野蕉种质的部分的mRNA FusR1序列。SEQ ID NO:27是来自野蕉的FusR1编码序列。在一些实施例中,检查了大量FW敏感的野蕉种质。在来自FW-敏感的野蕉种质的所有FusR1序列中,FusR1序列的结构被破坏和/或损坏。所有FW敏感的野蕉种质都具有FusR1编码序列,在编码序列的位置340处具有1bp的缺失。所有FW敏感的野蕉种质在编码序列中也都具有长的未剪接的表达的内含子。一些也具有长(82-84bp)的缺失,一些具有另一种4bp的缺失,并且在所有情况下,一个碱基对缺失(相对于来自其他植物物种的FusR1,包括所有其他香蕉种质,虽然84bp(作为3的倍数)确实不会破坏阅读框,但它确实从蛋白质的一级结构中去除了28个氨基酸残基,因此潜在地破坏了折叠蛋白质的三级结构,从而对功能产生负面影响。在任何情况下,根据我们的发现,普遍存在的1bp缺失总是会导致阅读框破坏。
发明人纳入了来自野蕉种质的mRNA序列,发明人对其进行了FusR1测序。这些说明了FusR1在野蕉中被“破坏”的各种方式。发明人在此指出,发明人分析的每一个野蕉种质都具有断裂的FusR1 mRNA转录本。图5示出了这些对齐的野蕉FusR1序列。
野蕉种质ITC1016(SEQ ID NO:26)包含82碱基对未剪接的表达的内含子。该内含子破坏阅读框架,导致位于内含子中的8bp的过早终止密码子,这导致截短的141bp编码序列(与正确的423bp编码序列相反)。此外,该种质(以及事实上,所有的野蕉种质)也具有一个碱基对缺失,其位于真正终止密码子的5'侧的约90bp处,这(即使内含子已被正确剪出)导致过早终止密码子,给出截短的编码序列。
野蕉种质ITC0545(SEQ ID NO:28)包含相同的82碱基对未剪接的表达的内含子。该内含子破坏了阅读框,导致位于内含子中的8bp的过早终止密码子,导致截短的141bp编码序列(与正确的423bp编码序列相反)。表达的内含子下游的另一个27bp在于85bp的缺失。虽然这与84bp表达的内含子结合将在数学上恢复正确的阅读框(85bp-82bp=3bp),如上所述,它会导致位于折叠的FusR1蛋白的功能关键区的28个氨基酸残基的丢失。此外,该种质还具有一个碱基对缺失,其位于真正终止密码子的5'方向的约90bp处,这(即使内含子已被正确剪出)导致过早终止密码子,给出截短的编码序列。最后,来自该种质的FusR1 mRNA在更远的下游也具有破坏框架的4bp插入。
野蕉种质ITC0080(SEQ ID NO:29)包含与先前种质相同的未剪接的、表达的内含子,不同之处在于该版本的未剪接的内含子的长度为84bp。虽然这个表达的内含子不会破坏阅读框,但它确实引入了28个额外的氨基酸残基,这些氨基酸残基位于折叠蛋白的功能关键区域,因此很可能会阻止FusR1蛋白的正确折叠。此外,该种质还具有一个碱基对缺失,其位于真正终止密码子的5'侧的约90bp处,这(即使内含子已被正确剪出)导致过早终止密码子,给出截短的编码序列。
野蕉种质ITC1527(SEQ ID NO:30)包含与先前种质相同的未剪接的、表达的内含子,这次是82bp长。同样,该内含子破坏阅读框,导致位于内含子中的8bp处的过早终止密码子,导致截短的141bp编码序列(与正确的423bp编码序列相反)。此外,来自该种质的FusR1mRNA在更远的下游具有4bp的插入。此外,该种质还具有一个碱基对缺失,其位于真正终止密码子的5'侧的约90bp处,这(即使内含子已被正确剪出)导致过早终止密码子,给出截短的编码序列。
发明人分析的所有野蕉在其FusR1 mRNA中具有这些不同缺陷中的一种或多种的某种组合。
表1总结了本公开的序列信息。
表1.序列信息的汇总
*FW–枯萎病
根据本公开,新的FusR1基因及其直系同源物将用于促进对病原性疾病,特别是由真菌病原体、病毒、线虫、昆虫等引起的疾病具有抗性的作物植物的构建。本公开的FusR1基因还可以用作遗传作图以及评估感兴趣植物的抗病性中的标记物。因此,序列可以用于育种程序。例如,参见Gentzbittel等人.(1998,《理论和应用遗传学(Theor.Appl.Genet.)》96:519-523)。本公开的序列的另外的用途包括使用所述序列作为诱饵以分离防御/抗性途径上的其他信号传导组分并分离相应的启动子序列。该序列还可以用于调节植物发育过程,例如花粉发育、器官形状的调节、糊粉和芽表皮的分化、胚胎发生能力和细胞/细胞相互作用。通常参见Sambrook等人.(1989)《分子克隆:实验室手册》(第2版,冷泉港实验室出版社,纽约州普莱恩维尤)。本公开的序列还可以用于产生变体(例如,通过“结构域交换”)以用于产生新的抗性特异性。
本公开包括分离的或基本上纯化的核酸或蛋白质组合物。“分离的”或“纯化的”核酸分子或蛋白质或其生物活性部分大体上或基本上不含通常伴随核酸分子或蛋白质或与核酸分子或蛋白质相互作用的组分,如在其天然存在的环境中发现的。因此,当通过重组技术生产时,分离的或纯化的多核苷酸或多肽大体上不含其他细胞材料或培养基,或者当化学合成时,大体上不含化学前体或其他化学物质。合适地,“分离的”多核苷酸不含在多核苷酸衍生自的生物体的基因组DNA中天然地位于多核苷酸侧面的序列(尤其是蛋白质编码序列)(即位于多核苷酸的5'和3'端的序列)。例如,在各种实施例中,分离的多核苷酸可以包含小于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸序列,所述核苷酸序列在所述多核苷酸衍生自的细胞的基因组DNA中天然地位于所述多核苷酸的侧面。大体上不含细胞材料的多肽包括具有小于约30%、20%、10%、5%(按干重计)污染蛋白的蛋白的制剂。当重组生产本公开的蛋白质或其生物活性部分时,培养基合适地代表小于约30%、20%、10%或5%(按干重计)的化学前体或非感兴趣的蛋白质的化学品。
编码本公开的FusR1多肽的生物活性部分的FusR1核苷酸序列的一部分将编码约至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、40、50、60、70、80、90、100、120、150、300、400、500、600、700、800、900或1000个邻接氨基酸残基,或几乎高达本公开的全长FUSR1多肽中存在的氨基酸总数(例如,对于SEQ ID NO:3、6、12、19或22分别为140个氨基酸残基)。可用作杂交探针或PCR引物的FusR1核苷酸序列的部分通常不需要编码FUSR1多肽的生物活性部分。
因此,FusR1核苷酸序列的一部分可以编码FUSR1多肽的生物活性部分,或者它可以是可以使用本领域中已知的标准方法用作杂交探针或PCR引物的片段。可以通过分离本公开的FusR1核苷酸序列之一的一部分,表达FUSR1多肽的编码部分(例如,通过体外重组表达),并评估FUSR1多肽的编码部分的活性来制备FUSR1多肽的生物活性部分。作为FusR1核苷酸序列的一部分的核酸分子包含至少约15、16、17、18、19、20、25、30、50、75、100、150、200、250、300、350、400、450、500、550、600或650个核苷酸,或几乎高达本文公开的全长FusR1核苷酸序列中存在的核苷酸数的数目(例如,对于SEQ ID NO:1-2、4-5、8-10、17-18或20-21分别为约350至650个核苷酸)。
本公开还考虑了所公开的核苷酸序列的变体。核酸变体可以是天然存在的,例如等位基因变体(相同基因座)、同源物(不同基因座)和直系同源物(不同生物体),或者可以是非天然存在的。可以使用熟知的分子生物学技术来鉴定天然存在的变体,例如,使用如本领域中已知的聚合酶链反应(PCR)和杂交技术。非天然存在的变体可以通过诱变技术(包括那些应用于多核苷酸、细胞或生物体的技术)制造。变体可以包含核苷酸取代、缺失、倒位和插入。变异可以发生在编码区和非编码区中的一个或两个中。变异可以产生保守的和非保守的氨基酸取代(与编码的产物相比)。对于核苷酸序列,保守的变体包括由于遗传密码的简并性而编码本公开的FUSR1多肽之一的氨基酸序列的那些序列。变体核苷酸序列还包括合成衍生的核苷酸序列,例如通过例如使用定点诱变产生的但其仍然编码本公开的FUSR1多肽的那些。通常,本公开的特定核苷酸序列的变体将与该特定核苷酸序列具有至少约30%、40%、50%、55%、60%、65%、70%,通常至少约75%、80%、85%,理想地约90%至95%或更多,并且更合适地约98%或更多的序列同一性,如通过使用默认参数在本文别处描述的序列比对程序确定的。
变体核苷酸序列还包括衍生自诱变或重组程序的序列,例如“DNA改组”,其可以用于将感兴趣的多肽中的结构域与其他多肽的结构域交换。通过DNA改组,可以操纵一个或多个不同的FusR1编码序列以创建具有所需性质的新的FusR1序列。在该程序中,重组多核苷酸的文库由相关多核苷酸的群体产生,所述相关多核苷酸的群体包含具有实质序列同一性且可以在体外或体内被同源重组的序列区域。例如,使用这种方法,编码感兴趣的结构域的序列基序可以在本公开的FusR1基因与其他已知的FusR1基因之间进行改组,以获得编码具有改进的感兴趣的性质(例如拓宽的抗病谱)的蛋白质的新基因。用于DNA改组的策略在本领域中是已知的。参见,例如:Stemmer(1994,《美国科学院院刊》91:10747-10751;1994,《自然(Nature)》370:389-391);Crameri等人.(1997,《自然生物技术(Nature Biotech.)》15:436-438);Moore等人.(1997,《分子生物学杂志》272:336-347);Zlang等人.(1997《美国科学院院刊》94:450-44509);Crameri等人.(1998,《自然》391:288-291);以及美国专利号5,605,793和5,837,458。
本公开提供了包含由用于FusR1的核苷酸序列、FusR1的同源物、FusR1的直系同源物、FusR1的旁系同源物及其片段和变体编码的分离的蛋白质的至少一部分的核苷酸序列。
在一些实施例中,本公开提供了编码FUSR1和/或其功能片段和变体的核苷酸序列,其包含与SEQ ID NO:1,SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:8、SEQ IDNO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:17或SEQ ID NO:18共享至少约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、或约99%、约99.1%、约99.2%、约99.3%、约99.4%、约99.5%、约99.6%、约99.7%、约99.8%或约99.9%的序列同一性的核苷酸序列。在一些实施例中,编码FUSR1的核苷酸序列具有SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:17或SEQ ID NO:18的核酸序列。
在一些实施例中,本公开提供了用于FusR1的核苷酸序列、FusR1的同源物、FusR1的直系同源物、FusR1的旁系同源物及其片段和变体,其包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQID NO:17或SEQ ID NO:18共享至少约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、或约99%、约99.1%、约99.2%、约99.3%、约99.4%、约99.5%、约99.6%、约99.7%、约99.8%或约99.9%的序列同一性的核苷酸序列。在一些实施例中,用于FusR1的核苷酸序列、FusR1的同源物、FusR1的直系同源物、FusR1的旁系同源物及其片段和变体具有SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:17或SEQ ID NO:18的核酸序列。
在一些实施例中,用于FusR1的核苷酸序列、FusR1的同源物、FusR1的直系同源物、FusR1的旁系同源物及其片段和变体可以被用于在植物中表达。在一些实施例中,所述核苷酸序列可以被用于掺入到表达盒中,所述表达盒能够指导在植物细胞(例如本文所公开的香蕉品种)中表达用于FusR1的核苷酸序列、FusR1的同源物、FusR1的直系同源物、FusR1的旁系同源物及其片段和变体。此表达盒包括可操作地连接至感兴趣的核苷酸序列(即FusR1、FusR1的直系同源物及其片段和变体)的启动子,所述核苷酸序列被可操作地连接至终止信号。它通常还包含正确翻译核苷酸序列所需的序列。编码区通常编码感兴趣的蛋白质(即FUSR1)。在一些实施例中,包括用于FusR1的核苷酸序列、FusR1的同系物、FusR1的直系同源物、FusR1的旁系同源物及其片段和变体的表达盒是嵌合的,使得其至少一种组分相对于其至少一种其他组分是异源的。
在其他实施例中,表达盒是天然存在的但是已经以可用于异源表达的重组形式获得的表达盒。核苷酸序列在表达盒中的表达可以在组成型启动子或诱导型启动子的控制下,所述启动子仅在宿主细胞被暴露于某些特定的外部刺激时启动转录。此外,核苷酸序列在表达盒中的表达可以在组织特异性启动子的控制下。在多细胞生物体的情况下,启动子也可以对动物和/或植物(包括香蕉物种)中的特定组织或器官或发育阶段具有特异性。
本公开提供了多肽和氨基酸序列,其包含由用于FusR1的核苷酸序列、FusR1的同系物、FusR1的直系同源物、FusR1的旁系同源物及其片段和变体编码的蛋白质的至少一部分。
本公开还提供了一种由FusR1的核酸序列、FusR1的同系物、FusR1的直系同源物、FusR1的旁系同源物和/或其片段和变体编码的氨基酸序列。在一些实施例中,本公开提供了一种分离的多肽,其包含与由FusR1的核酸序列、FusR1的同系物、FusR1的直系同源物、FusR1的旁系同源物和/或其片段和变体编码的氨基酸序列共享至少约70%、约75%、约80%、约85%、至少约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、约99.1%、约99.2%、约99.3%、约99.4%、约99.5%、约99.6%、约99.7%、约99.8%或约99.9%的同一性的氨基酸序列。在一个实施例中,本公开提供了一种包含氨基酸序列的分离的多肽,其编码与由FusR1的核酸序列、FusR1的同系物、FusR1的直系同源物、FusR1的旁系同源物和/或其片段和变体编码的氨基酸序列共享至少约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、约99.1%、约99.2%、约99.3%、约99.4%、约99.5%、约99.6%、约99.7%、约99.8%或约99.9%的同一性的氨基酸序列。
本公开还涵盖由FusR1的核酸序列、FusR1的同系物、FusR1的直系同源物和/或FusR1的旁系同源物编码的氨基酸序列的蛋白质的变体和片段。变体可以包含组成蛋白质的氨基酸序列的改变。关于多肽的术语“变体”是指相对于参考序列被一个或多个氨基酸改变的氨基酸序列。变体可以具有“保守的”变化或“非保守的”变化,例如类似的微小变化还可以包括氨基酸缺失或插入,或两者。
多肽的功能性片段和变体包括维持亲本多肽的一种或多种功能的那些片段和变体。人们认识到,编码多肽的基因或cDNA可以被显著突变,而不会实质性地改变多肽的功能中的一种或多种。首先,众所周知遗传密码是简并的,因此不同的密码子编码相同的氨基酸。其次,即使引入了氨基酸替代,突变也可能是保守的,并且对蛋白质的基本功能没有实质性影响。参见,例如,Stryer,《生物化学(Biochemistry)》第3版,1988。第三,多肽链的一部分可以被删除而不损害或消除其所有功能。第四,可以在多肽链中进行插入或添加,例如添加表位标签,而不损害或消除其功能(Ausubel等人,《免疫学杂志(J.Immunol.)》159(5):2502-12,1997)。可以在不实质性地损害多肽的一种或多种功能的情况下进行的其他修饰可以包括,例如,体内或体外化学和生物化学修饰或掺入不寻常的氨基酸。此类修饰包括但不限于例如乙酰化、羧化、磷酸化、糖基化、泛素化、标记(例如用放射性核苷酸)和各种酶促修饰,如本领域技术人员将容易理解的。用于标记多肽的多种方法和可用于此类目的的标记在本领域中是熟知的,并且包括放射性同位素例如32P、与标记的特异性结合配偶体(例如抗体)结合或被标记的特异性结合配偶体结合的配体、荧光团、化学发光剂、酶和抗配体。功能性片段和变体可以具有不同的长度。例如,一些片段具有至少10、25、50、75、100、200或甚至更多的氨基酸残基。这些突变可以是自然的,或者可以是有意改变的。在一些实施例中,包含产生沉默的取代、添加或缺失但不改变蛋白质的性质或活性或蛋白质如何制备的改变的突变是本公开的实施例。
保守氨基酸取代是那些在进行时最少干扰原始蛋白质的性质的取代,即蛋白质的结构并且特别是蛋白质的功能是保守的,并且不会被此类取代显著改变。保守取代通常维持(a)取代的区域内的多肽主链的结构,例如,作为折叠(sheet)或螺旋构象,(b)靶位点处分子的电荷或疏水性,或(c)侧链的主体(bulk)。有关保守取代的另外的信息可以在例如Ben Bassat等人.(《细菌学杂志(J.Bacteriol.)》,169:751 757,1987),O’Regan等人.(《基因(Gene)》,77:237251,1989),Sahin Toth等人.(《蛋白质科学(Protein Sci.)》,3:240247,1994),Hochuli等人.(《生物技术(Bio/Technology)》,6:1321 1325,1988)中以及在广泛使用的遗传学和分子生物学的教科书中找到。Blosum矩阵通常用于确定多肽序列的相关性。Blosum矩阵是使用可信比对的大型数据库(BLOCKS数据库)创建的,其中计算了小于某个阈值百分比同一性的成对序列比对(Henikoff等人,《美国国家科学院院刊》,89:10915-10919,1992)。90%同一性的阈值用于BLOSUM90矩阵的高度保守的目标频率。65%同一性的阈值用于BLOSUM65矩阵。Blosum矩阵中零和零以上的评分被视为所选的同一性百分比的“保守取代”。下表2显示了示例性的保守氨基酸取代。
表2.列出的示例性保守氨基酸取代
在一些实例中,变体可以具有不超过3、5、10、15、20、25、30、40、50或100个保守氨基酸改变(例如非常高度保守的或高度保守的氨基酸取代)。在其他实例中,变体序列中的一个或几个疏水性残基(例如Leu、Ile、Val、Met、Phe或Trp)可以被不同的疏水性残基(例如Leu、Ile、Val、Met、Phe或Trp)替代,以创建这样的变体,所述变体在功能上类似于所公开的由FusR1的核酸序列,FusR1的同系物,FusR1的直系同源物和/或FusR1的旁系同源物和/或其片段和变体编码的氨基酸序列。
在一些实施例中,变体可以通过改变编码区以适应分子将被导入的特定生物体的密码子使用偏向而与所公开的序列不同。在其他实施例中,可通过利用遗传密码的简并性以改变编码序列来改变编码区,使得尽管核苷酸序列被显著改变,但其仍编码具有与所公开的由FusR1的核酸序列,FusR1的同系物,FusR1的直系同源物和/或FusR1的旁系同源物和/或其片段和变体编码的氨基酸序列大体上相似的氨基酸序列的蛋白质。
在一些实施例中,提供了衍生自本公开的FusR1直系同源物的功能片段。当在植物中表达时,功能片段仍然可以赋予对病原体的抗性。在一些实施例中,功能片段至少包含野生型FusR1直系同源物或其功能变体的保守区域或Bowman-Birk抑制剂结构域。在一些实施例中,功能片段包含一个或多个保守区域,所述保守区域由两个或更多个FusR1直系同源物共享,由同一植物属中的两个或更多个FusR1直系同源物共享,由两个或更多个双子叶植物FUSR1直系同源物共享,和/或由两个或更多个单子叶植物FusR1直系同源物共享。保守区域或Bowman-Birk抑制剂结构域可以通过任何合适的计算机程序(例如NCBI蛋白BLAST程序和NCBI比对程序或等效程序)来确定。在一些实施例中,功能性片段与本公开的FusR1直系同源物相比短1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个氨基酸。在一些实施例中,通过删除本公开的FusR1直系同源物的一个或多个氨基酸来制备功能性片段。在一些实施例中,功能性片段与本公开的FusR1直系同源物共享至少80%、85%、90%、95%、96%、97%、98%、99%或更多的同一性。
在一些实施例中,提供了衍生自本公开的FusR1直系同源物的功能性的嵌合多肽或合成多肽。当在植物中表达时,功能性的嵌合多肽或合成多肽仍可以赋予对病原体的抗性。在一些实施例中,功能性的嵌合多肽或合成多肽至少包含野生型FUSR1直系同源物或其功能变体的保守区域或Bowman-Birk抑制剂结构域。在一些实施例中,功能性的嵌合多肽或合成多肽包含一个或多个保守区域,所述保守区域由两个或更多个FUSR1直系同源物共享,由同一植物属中的两个或更多个FusR1直系同源物共享,由两个或更多个单子叶植物FusR1直系同源物共享,和/或由两个或更多个双子叶植物FUSR1直系同源物共享。非限制性的示例性的保守区域在图2中示出。保守区域或Bowman-Birk抑制剂结构域可以通过任何合适的计算机程序(例如NCBI蛋白BLAST程序和NCBI比对程序或等效程序)来确定。在一些实施例中,功能性的嵌合多肽或合成多肽与本公开的FusR1直系同源物共享至少80%、85%、90%、95%、96%、97%、98%、99%或更多的同一性。
FW敏感的等位基因特有的保守区域的序列也可以用于敲低一个或多个FusR1直系同源物的水平。在一些实施例中,保守区域的序列可以用于制造基因沉默分子以靶向一种或多种FusR1直系同源物。在一些实施例中,基因沉默分子选自由双链多核苷酸、单链多核苷酸或混合双重寡核苷酸组成的群组。在一些实施例中,基因沉默分子包含约10bp、15bp、19bp、20bp、21bp、25bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、150bp、200pb、250bp、300bp、350bp、400bp、500bp、600bp、700bp、800bp、900bp、1000bp或更多的多核苷酸的DNA/RNA片段,其中DNA/RNA片段与本公开的FusR1直系同源物序列或其互补序列的保守区域共享至少90%、95%、99%或更多的同一性。
V.植物转化
编码本公开的FUSR1,FusR1的同系物,FusR1的直系同源物和/或FusR1的旁系同源物和/或片段和变体的本发明的多核苷酸可以被转化到香蕉或其他植物属中。
产生转基因植物的方法是本领域普通技术人员熟知的。现在可以通过多种不同的转化方法来生产转基因植物,包括但不限于电穿孔;显微注射;微弹射体轰击(microprojectile bombardment)(也被称为粒子加速或基因枪轰击);病毒介导的转化;和农杆菌介导的转化。参见,例如,美国专利号5,405,765;5,472,869;5,538,877;5,538,880;5,550,318;5,641,664;5,736,369和5,736,369;国际专利申请公开号WO2002/038779和WO/2009/117555;Lu等人(《植物细胞报告(Plant Cell Reports)》,2008,27:273-278);Watson等人,《重组DNA(Recombinant DNA)》,美国科学书籍(Scientific American Books)(1992);Hinchee等人,《生物技术》.6:915-922(1988);McCabe等人,《生物技术》.6:923-926(1988);Toriyama等人,《生物技术》.6:1072-1074(1988);Fromm等人,《生物技术》.8:833-839(1990);Mullins等人,《生物技术》.8:833-839(1990);Hiei等人,《植物分子生物学(Plant Molecular Biology)》35:205-218(1997);Ishida等人,《自然生物技术》14:745-750(1996);Zhang等人,《分子生物技术(Molecular Biotechnology)》8:223-231(1997);Ku等人,《自然生物技术》17:76-80(1999);和Raineri等人,《生物技术》.8:33-38(1990)),其每一个通过引用以其整体明确并入本文。
根癌农杆菌(Agrobacterium tumefaciens)是一种天然存在的细菌,其能够将其DNA(遗传信息)插入到植物中,导致一种被称为冠瘿的对植物的损伤。大多数植物物种现在可以使用这种方法进行转化,包括葫芦科物种。
微弹射体轰击也被称为粒子加速、基因枪轰击和基因枪(基因枪)。基因枪用于将包被有基因(例如,用于所需的性状)的小球射入植物种子或植物组织中,以便使植物细胞随后表达新的基因。基因枪使用真正的炸药(.22口径的坯料)来推进材料。压缩空气或蒸汽也可以用作推进剂。基因枪由John Sanford、Edward Wolf和NelsonAllen于1983-1984年在康奈尔大学发明。它及其注册商标现在归E.I.du Pont de Nemoursand Company所有。大多数植物物种都已经使用这种方法被转化。
用于将新的遗传材料引入到植物基因组中的最常见方法涉及使用细菌病原体根癌农杆菌的活细胞将一段DNA(被称为转移或T-DNA)真正地注射到单独的植物细胞中(通常在组织损伤之后),在那里它靶向植物细胞核以用于染色体整合。存在许多管理农杆菌介导的转化和专门设计用于农杆菌的特定DNA递送质粒的专利--例如,US4536475、EP0265556、EP0270822、WO8504899、WO8603516、US5591616、EP0604662、EP0672752、WO8603776、WO9209696、WO9419930、WO9967357、US4399216、WO8303259、US5731179、EP068730、WO9516031、US5693512、US6051757和EP904362A1。农杆菌介导的植物转化包括作为第一步将克隆在质粒上的DNA片段置于活的农杆菌细胞中,然后将其随后用于转化到单独的植物细胞中。因此,农杆菌介导的植物转化是一种间接的植物转化方法。涉及使用不含T-DNA的载体的农杆菌介导的植物转化的方法也是本领域技术人员熟知的,并且可以在本公开中具有适用性。参见,例如,美国专利号7,250,554,其在转化载体中使用P-DNA代替T-DNA。
使用农杆菌转化方法形成的转基因植物通常在一条染色体上包含单个基因,尽管多个拷贝是可能的。此类转基因植物可以被称为对于添加的基因是半合的。这种植物更准确的名称是独立的分离物,因为每个转化的植物代表独特的T-DNA整合事件(美国专利号6,156,953)。转基因基因座通常通过转基因的存在和/或不存在来表征。其中一个等位基因对应于转基因的缺失的杂合基因型也被称为半合子的(美国专利号6,008,437)。
还报道了使用DNA的直接植物转化方法。历史上报道的第一种方法是电穿孔,其利用施加至含有植物细胞的溶液的电流(M.E.Fromm等人,《自然》,319,791(1986);H.Jones等人,《植物分子生物学》,13,501(1989)和H.Yang等人,《植物细胞报告》7,421(1988)。另一种被称为“基因枪轰击”的直接方法是使用超细颗粒(通常是钨或金),这些颗粒包被有DNA,然后以足够的力被喷射到植物组织的表面上,以使颗粒穿透植物细胞,包括厚的细胞壁、膜和核被膜(nuclear envelope),但不会杀死其中的至少一些(US 5,204,253、US 5,015,580)。第三种直接方法使用金属或陶瓷的纤维形式,其由尖锐的、多孔的或中空的针状突起组成,这些突起真正地刺穿细胞以及细胞的核被膜。碳化硅和硼酸铝晶须均已经被用于植物转化(Mizuno等人,2004;Petolino等人,2000;US5302523美国申请20040197909)以及细菌和动物转化(Kaepler等人,1992;Raloff,1990;Wang,1995)。存在报告的其他方法,并且毫无疑问地,将开发另外的方法。然而,这些间接或直接方法中的每一种在将外源DNA引入到植物细胞中的效率总是非常低,使得有必要使用一些方法来仅选择那些已经被转化的细胞,并且进一步地,仅允许那些已经被转化的细胞生长和再生到植物中。
为了有效的植物转化,必须采用一种选择方法,使得从单个转化的细胞再生整株植物,并且转化的植物的每个细胞都携带感兴趣的DNA。这些方法可以采用阳性选择,由此将外源性基因提供给植物细胞,允许其利用存在于培养基中的底物,否则它无法使用,例如甘露糖或木糖(例如,参见US 5767378;US 5994629)。然而,更典型地,使用阴性选择是因为它更有效,利用选择性药剂例如除草剂或抗生素,其杀死或抑制未转化的植物细胞的生长并降低嵌合体(chimeras)的可能性。针对阴性选择性药剂有效的抗性基因被提供在用于植物转化的导入的外源DNA上。例如,使用的最流行的选择性药剂之一是抗生素卡那霉素,以及赋予对卡那霉素和相关抗生素的抗性的抗性基因新霉素磷酸转移酶(nptII)(参见,例如,Messing&Vierra,《基因》19:259-268(1982);Bevan等人,《自然》304:184-187(1983))。然而,许多不同的抗生素和抗生素抗性基因可以用于转化目的(参考US 5034322、US6174724和US 6255560)。此外,数种除草剂和除草剂抗性基因已经被用于转化目的,包括赋予对除草剂草丁膦(phosphinothricin)抗性的bar基因(White等人,《核酸研究》18:1062(1990),Spencer等人,《理论和应用遗传学》79:625-631(1990),US 4795855、US 5378824和US 6107549)。此外,赋予抗癌剂甲氨蝶呤抗性的dhfr基因已经被用于选择(Bourouis等人,EMBO J.2(7):1099-1104(1983)。
用于调节给定蛋白质的表达的表达控制元件可以是通常发现的与编码序列相关的表达控制元件(同源表达元件),或者可以是异源表达控制元件。多种同源和异源表达控制元件在本领域中是已知的,并且可以容易地用于制备用于本公开的表达单元。例如,转录起始区域可以包括在根癌农杆菌的Ti质粒中发现的各种确信起始区域中的任何一种,例如章鱼碱、甘露碱(mannopine)、胭脂碱(nopaline)等。可替代地,也可以使用植物病毒启动子,例如花椰菜花叶病毒19S和35S启动子(分别为CaMV 19S和CaMV 35S启动子),以控制植物中的基因表达(例如美国专利号5,352,605;5,530,196和5,858,742)。也可以使用衍生自CaMV的增强子序列(例如美国专利号5,164,316;5,196,525;5,322,938;5,530,196;5,352,605;5,359,142;和5,858,742)。最后,还可以使用植物启动子,例如浒苔启动子(proliferapromoter)、果实特异性启动子、Ap3启动子、热休克启动子、种子特异性启动子等。
通常使用本领域中已知的标准技术将配子特异性启动子、组成型启动子(例如CaMV或Nos启动子)、器官特异性启动子(例如来自番茄的E8启动子)或诱导型启动子连接到蛋白质或反义编码区域。可以通过使用补充元件例如转录终止子和/或增强子元件来进一步优化表达单元。
因此,对于在植物中的表达,除了蛋白质序列之外,表达单元通常还将包含植物启动子区、转录起始位点和转录终止序列。通常包括在表达单元的5'和3'端的独特限制性酶位点,以允许容易地插入到预先存在的载体中。
在构建异源性启动子/结构基因或反义组合时,启动子优选地位于距异源转录起始位点的距离与其在其自然环境中距转录起始位点的距离大致相同的位置。然而,如本领域中已知的,在不损失启动子功能的情况下,可以适应该距离的一些变化。
除了启动子序列之外,表达盒还可以包含结构基因下游的转录终止区,以提供有效的终止。终止区可以从与启动子序列相同的基因获得,或者可以从不同的基因获得。如果由结构基因编码的mRNA要被有效地加工,向导RNA的多聚腺苷酸化的DNA序列也通常被添加到载体构建体中。多聚腺苷酸化序列包括但不限于农杆菌章鱼碱合酶信号(Gielen等人,EMBO J 3:835-846(1984))或胭脂碱合酶信号(Depicker等人,《分子和应用遗传学》1:561-573(1982))。所得的表达单元被连接到或以其他方式被构建为包含在适合高等植物转化的载体中。一个或多个表达单元可以被包含在同一载体中。载体通常将包含可选择的标记物基因表达单元,通过该标记物基因表达单元可以在培养物中鉴定转化的植物细胞。通常,标记物基因将编码对抗生素(例如G418、潮霉素、博来霉素、卡那霉素或庆大霉素)或对除草剂(例如草甘膦(Round-Up)或草铵膦(BASTA)或莠去津(atrazine))的抗性。通常还包括细菌或病毒来源的复制序列,以允许将载体克隆到细菌或噬菌体宿主中;优选地包括原核复制起源的广泛宿主范围。还可以包括细菌的选择性的标记物以允许选择带有所需构建体的细菌细胞。合适的原核选择性的标记物包括对抗生素(例如氨苄青霉素、卡那霉素或四环)的抗性。如本领域中已知的,其他编码附加功能的DNA序列也可以存在于载体中。例如,在农杆菌转化的情况下,还将包括T-DNA序列,用于随后转移到植物染色体中。
通过常规方法引入所需的基因或基因的集合需要两个品系之间的有性杂交,然后在杂交后代与亲本之一之间重复回交,直到获得具有所需特征的植物。然而,这个过程仅限于可以有性杂交的植物,并且除了所需基因之外的基因也将被转移。
重组DNA技术允许植物研究人员通过以下绕过这些限制:使植物遗传学家能够鉴定和克隆所需的性状(例如改善的脂肪酸组成)的特定基因,并将这些基因引入到已经有用的植物品种中。一旦外源性基因已经被引入到植物中,该植物就可以用于imp植物育种方案(例如,系谱育种、单种子血统育种方案、互惠轮回选择),以产生也含有感兴趣的基因的后代。
可以使用同源重组以定点方式引入基因。同源重组允许内源性基因中的位点特异性修饰,因此遗传或获得性突变可以被纠正,和/或新的改变可以被工程改造到基因组中。植物中的同源重组和定点整合在例如美国专利号5,451,513;5,501,967和5,527,695号中被讨论。
根据Ploetz(2015,《植物病理学(Phytopathology)》105:1512-1521),“香蕉的遗传转化已经变得司空见惯,并且抗病性是最受追捧的性状之一[引文省略]。”用于转化和再生香蕉植物的技术在本领域中是熟知的。参见,例如,美国专利号7,534,930;美国专利号6,133,035;Sagi等人,《生物技术》13,481-485,1995;May等人,《生物技术》13,485-492,1995;Vishnevetsky等人,《转基因研究(Transgenic Res.)》20(1):61-71,2011;Paul等人.(2011);Zhong等人,《植物生理学(Plant Physiol.)》110,1097-1107,1996;和Dugdale等人,《普通病毒学杂志(Journal of General Virology)》79:2301-2311,1998,其每一个通过引用以其整体明确并入本文。对于概述和历史,参见,例如,Mohan and Swennen(编辑),2004,《香蕉改良:细胞、分子生物学和诱导的突变(Banana improvement:cellular,molecular biology,and induced mutations)》,科学出版有限公司(SciencePublishers,Inc.);和Remy等人,2013,《转基因香蕉:过去、现在和未来(Geneticallymodified bananas:Past,present and future)》,Acta Horticulturae 974:71-80,其每一个通过引用以其整体明确并入本文。
在将本发明简化为实践的同时,本发明人可以构建一种表达构建体,其包括编码FUSR1、FusR1的同源物、FusR1的直系同源物和/或FusR1的旁系同源物、和/或其片段和变体的核苷酸序列。可以将本发明的表达构建体引入到商品香蕉的胚胎发生愈伤组织中,并且所得的转化的细胞可以被再生为植物。预计转基因香蕉植物将表达抗FW的FUSR1蛋白和病原体抗性。
根据本发明的一个方面,提供了一种生产抗病香蕉植物的方法。所述方法通过用至少一种编码能够赋予香蕉植物抗病性的多肽(例如FW抗性FusR1)的外源多核苷酸转化香蕉细胞来实现。
根据本发明的另一个方面,提供了一种生产抗病香蕉植物的方法。所述方法通过以下来实现:用至少一个含有编码CRISPR相关效应蛋白的多核苷酸和能够靶向至少一个FW敏感的FusR1等位基因的向导RNA的外源表达盒转化香蕉细胞,从而赋予香蕉植物抗病性。
本发明的香蕉细胞可以是任何香蕉品种或栽培品种,包括但不限于商业上重要的小果野蕉(香芽蕉、矮小香芽蕉、大矮蕉等)。优选地,用于转化的香蕉细胞是能够形成整株植物的胚胎发生细胞。更优选地,香蕉细胞是胚胎发生愈伤组织细胞。
本文使用的短语“胚胎发生愈伤组织细胞”是指包含在体外产生的细胞团中的胚胎发生细胞。
适合于转化的香蕉胚胎发生愈伤组织细胞可以使用熟知的方法产生。例如,未成熟的雄花(花序)可以在25℃下在降低的光强度(50-100lux)下在M1培养基(参见下文表1中的内容物)中解剖和孵育。在M1培养基中孵育3-5个月后,将黄色胚胎发生愈伤组织转移到M2培养基(参见下文表1中的内容物)中并在27℃下在黑暗中孵育至少4个月以促进胚胎发生。
如上所述,此类香蕉胚胎发生愈伤组织细胞适合用包括至少一种编码抗病多肽的多核苷酸的核酸构建体进行转化。
短语“能够赋予抗病性的多肽”和“抗病多肽”在本文中可互换使用,以指代能够保护香蕉植物(表达多肽)免受病原体感染或由病原体感染产生的有害影响的任何肽、多肽或蛋白质。
合适的抗病性多肽也可以是能够诱导或增强植物中的抗性的多肽,例如描述于美国专利号6,091,004和6,316,697中。
如上所述,本发明的方法通过用至少一种编码能够赋予香蕉植物抗病性的多肽的多核苷酸转化香蕉细胞来实现。
在一些实施方案中,香蕉细胞用编码来自阿宽蕉的FUSR1蛋白的多核苷酸序列转化,其实例在SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:4和SEQ ID NO:5中列出。
在一些实施例中,香蕉细胞用编码来自小果野蕉的FUSR1蛋白的多核苷酸序列转化,其实例在SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:11中列出。
在一些实施例中,香蕉细胞用编码来自芭蕉的FUSR1蛋白的多核苷酸序列转化,其实例在SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:20和SEQ ID NO:21中列出。
在一些实施例中,香蕉细胞用编码来自地涌金莲的FUSR1蛋白的多核苷酸序列转化,其实例在SEQ ID NO:23中列出。
在一些实施例中,香蕉细胞用编码来自野蕉的FUSR1蛋白的多核苷酸序列转化,其实例在SEQ ID NO:26中列出。
在一些实施例中,仅用单一外源性抗病多肽(例如FUSR1)转化的植物可能仅表现出部分和短期的保护(参见,例如,在Jach等人,Plant J.8:97-108,1995中)。在其他实施例中,本发明的香蕉细胞/植物优选地表达多种外源抗病多肽,因此比未修饰的植物具有大体上更强的抗病性。
可以利用几种方法在植物细胞中转化和共表达这些多核苷酸。
尽管不太优选,但可以通过使用三种单独的核酸构建体将上述多核苷酸序列中的每一个单独地引入到香蕉细胞中。在一些实施例中,可以使用单个核酸构建体在香蕉细胞中共同引入和共同表达三种多核苷酸序列。这种构建体可以被设计成具有单个启动子序列,其可以转录包括所有三种多核苷酸序列的多顺反子信息。为了能够共同翻译由多顺反子信息编码的三种多肽,多核苷酸序列可以通过内部核糖体进入位点(IRES)序列被相互连接,所述内部核糖体进入位点(IRES)序列促进位于IRES序列下游的多核苷酸序列的翻译。在这种情况下,编码上述三种多肽的转录的多顺反子RNA分子将从多顺反子RNA分子的封闭的5'端和两个内部IRES序列翻译,从而在细胞中产生所有三种多肽。
可替代地,编码能够赋予抗病性的多种多肽的多核苷酸片段可以通过蛋白酶识别位点被翻译融合,所述蛋白酶识别位点可被待用核酸构建体转化的细胞表达的蛋白酶切割。在这种情况下,被翻译的嵌合多肽将被细胞表达的蛋白酶切割,从而产生多种多肽。
在其它实施例中,本发明利用包含三个启动子序列的核酸构建体,每个启动子序列能够指导上述多核苷酸序列的特定多核苷酸序列的转录。
可以用于本发明的核酸的合适的启动子包括组成型启动子、诱导型启动子或组织特异性启动子。
合适的组成型启动子包括,例如,CaMV 35S启动子(Odell等人,《自然》313:810-812,1985);玉米Ubi 1(Christensen等人,Plant Sol.Biol.18:675-689,1992);水稻肌动蛋白(McElroy等人.《植物细胞(Plant Cell)》2:163-171,1990);pEMU(Last等人,《理论和应用遗传学》81:581-588,1991);和合成的超级MAS(Ni等人,《植物杂志(The PlantJournal)》7:661-76,1995).其他组成型启动子包括在美国专利号5,659,026、5,608,149;5,608,144;5,604,121;5,569,597:5,466,785;5,399,680;5,268,463;和5,608,142中的那些。
合适的诱导型启动子可以是病原体诱导型启动子,例如如苜蓿PR10启动子(Coutos-Thevenot等人,《实验植物学杂志(Journal of Experimental Botany)》52:901-910,2001)和由Marineau等人,《植物分子生物学》9:335-342,1987;Matton等人.《植物-微生物分子相互作用(Molecular Plant-Microbe Interactions)》2:325-331,1989;Somsisch等人,《美国国家科学院院刊》83:2427-2430,1986:Somsisch等人,《分子和普通遗传学(Mol.Gen.Genet.)》2:93-98,1988;和Yang,《美国国家科学院院刊》93:14972-14977,1996描述的启动子。
合适的组织特异性启动子包括但不限于叶特异性启动子,例如如通过Yamamoto等人,《植物杂志》12:255-265,1997;Kwon等人,《植物生理学》105:357-67,1994;Yamamoto等人,《植物细胞生理学(Plant Cell Physiol.)》35:773-778,1994;Gotor等人,《植物杂志》3:509-18,1993;Orozco等人,《植物分子生物学》23:1129-1138,1993;和Matsuoka等人,《美国国家科学院院刊》90:9586-9590,1993所描述的。
本发明的核酸构建体还可以包括至少一种选择性的标记物,例如如nptII。优选地,核酸构建体是穿梭载体,其既可以在大肠杆菌中繁殖(其中构建体包含合适的选择性标记物和复制起点)又可以与细胞中的繁殖相容。根据本发明的构建体可以是例如质粒、杆粒、噬菌粒、粘粒、噬菌体、病毒或人工染色体,优选地质粒。
本发明的核酸构建体可以用于稳定地转化香蕉细胞。使外源性DNA稳定整合到香蕉基因组中的主要方法包括两种主要方法:
(i)农杆菌介导的基因转移:Klee等人.(1987)《植物生理学年度评论(Annu.Rev.Plant Physiol.)》38:467-486;Klee和Rogers《植物的细胞培养和体细胞遗传学(Cell Culture and Somatic Cell Genetics of Plants)》,第6卷,《植物核基因的分子生物学(Molecular Biology of Plant Nuclear Genes)》,编辑.Schell,J和Vasil,L.K.,学术出版社(Academic Publishers),加利福尼亚州圣地亚哥(1989)第2-25页;Gatenby,《植物生物技术(Plant Biotechnology)》,编辑.Kung,S和Arntzen,C.J.,巴特沃斯出版社(Butterworth Publishers),马萨诸塞州波士顿(Boston,Mass).(1989)第93-112页。
(ii)直接DNA摄取:Paszkowski等人,《植物的细胞培养和体细胞遗传学》,第6卷,《植物核基因的分子生物学》,编辑.Schell,J和Vasil,L.K.,学术出版社,加利福尼亚州圣地亚哥(1989)第52-68页;包括用于将DNA直接摄取到原生质体中的方法,Toriyama,K等人(1988)《生物技术》6:1072-1074.“由植物细胞的短暂电击诱导的DNA摄取(DNA uptakeinduced by brief electric shock of plant cells)”:Zhang等人.《植物细胞报告(Plant Cell Rep.)》(1988)7:379-384.Fromm等人.《自然》(1986)319:791-793.“通过粒子轰击将DNA注射到植物细胞或组织中(DNA injection into plant cells or tissues byparticle bombardment)”,Klein等人.《生物技术》(1988)6:559-563;McCabe等人.《生物技术》(1988)6:923-926;Sanford,《植物生理学(Physiol.Plant.)》(1990)79:206-209;通过使用微量移液管系统:Neuhaus等人,《理论和应用遗传学》(1987)75:30-36;Neuhaus和Spangenberg,《植物生理学》(1990)79:213-217;“玻璃纤维或碳化硅晶须转化细胞培养物、胚胎或愈伤组织(glass fibers or silicon carbide whisker transformation of cellcultures,embryos or callus tissue)”,美国专利号5,464,765或通过将DNA与萌发的花粉直接孵育(by the direct incubation of DNA with germinating pollen),DeWet等人.《胚珠组织的实验操作(Experimental Manipulation of Ovule Tissue)》,编辑.Chapman,G.P和Mantell,S.H和Daniels,W.Longman,London,(1985)第197-209页;以及Ohta,《美国国家科学院院刊》(1986)83:715-719。
农杆菌系统包括使用包含整合到植物基因组DNA中的确定的DNA区段的质粒载体。植物组织的接种的方法根据植物物种和农杆菌递送系统而变化。一种广泛使用的方法是叶盘程序,所述叶盘程序可以用任何组织外植体进行,所述组织外植体为整株植物分化的起始提供了良好的来源。Horsch等人.在《植物分子生物学手册A5(Plant Molecular BiologyManual A5)》,克鲁瓦学术出版社(Kluwer Academic Publishers),Dordrecht(1988)第1-9页中。补充方法采用农杆菌递送系统与真空渗透相结合。用于将外源性DNA引入到香蕉细胞中的合适的农杆菌介导的程序由Dougale等人.(《普通病毒学杂志》,79:2301-2311,1998)和美国专利号6,395,962描述。
存在多种将DNA直接转移到植物细胞中的方法。在电穿孔中,原生质体被短暂地暴露于强电场。在显微注射(microinjection)中,使用非常小的微量移液器将DNA直接机械地注射到细胞中。在微粒轰击中,DNA被吸附在例如硫酸镁晶体或钨颗粒的微弹射体(microprojectiles)上,并且微弹射体被物理加速进入细胞或植物组织。
可替代地,可以通过微弹射体轰击将本发明的核酸构建体引入到香蕉细胞中。在该技术中,用外源性DNA包被的钨或金颗粒被加速朝向靶细胞。通过微弹射体轰击的合适的香蕉转化程序由Sagi等人.(《生物技术》13:481-485,1995)和Dougale等人.(《普通病毒学杂志》,79:2301-2311,1998)描述。优选地,通过如下文实例4中所述的微弹射体轰击程序将本发明的核酸构建体引入到香蕉细胞中。
在转化后,对转化的细胞进行微繁殖,以提供转化的材料的快速的、一致的繁殖。
微繁殖是已经从选定的亲本植物或栽培品种上切下的单片组织生长新一代植物的过程。该过程允许具有表达融合蛋白的优选的组织的植物的大量繁殖。产生的新一代植物在遗传上与原始植物相同,并且具有原始植物的所有特征。微繁殖允许在短时间段内大量生产优质的植物材料,并且在保留原始转基因或转化植物的特征的情况下,提供选定栽培品种的快速繁殖。克隆植物的优点是植物繁殖的速度以及所生产的植物的质量和均匀性。
微繁殖是一个多阶段程序,其需要在阶段之间改变培养基或生长条件。因此,微繁殖过程包括四个基本阶段:第一阶段,初始组织培养;第二阶段,组织培养增殖;第三阶段,分化和植物形成;和第四阶段,温室栽培和硬化。在第一阶段(初始组织培养)期间,组织培养被建立并被证明是无污染的。在第二阶段期间,使初始的组织培养增殖,直到产生足够数量的组织样品以满足生产目标。在第三阶段期间,将在第二阶段中生长的组织样品分成单独的小植株并使之生长。在第四阶段,将转化的小植株转移到温室中用于硬化,在温室中植物对光的耐受性逐渐增加,使得其可以在自然环境中生长。
因此,可以使用本领域中已知的方法将转化的香蕉细胞微繁殖并再生为植物,所述方法例如描述在美国专利号6,133,035和Novak等人,1989;Dhed'a等人,1991;Cote等人,1996;Becker等人,2000;Sagi等人.《植物细胞报告》13:262-266,1994;Grapin等人,CellDev.Biol.Plant.32:66-71,1996;Marroquin等人,《体外细胞和发育生物学(In VivoCell.Div.Biol.)》.29P:43-46,1993;和Escalant等人.,《体外细胞和发育生物学》.30:181-186,1994)中。
外源性DNA序列在转化的植物的基因组中的稳定整合可以使用本领域中熟知的标准分子生物学技术例如PCR和Southern印迹杂交来测定。
尽管稳定的转化是目前优选的,但本发明也设想了培养的细胞、叶细胞、分生组织细胞或整株植物的瞬时转化。
瞬时转化可以通过上述任何直接DNA转移方法或通过使用修饰的植物病毒的病毒感染来实现。
病毒感染是优选的,因为它能够避免微繁殖和从培养的细胞再生整株植物。已经证明可用于转化植物宿主的病毒包括CaMV、TMV和BV。使用植物病毒的植物转化描述在美国专利号4,855,237(BGV)、EP-A 67,553(TMV)、日本公布的申请号63-14693(TMV)、EPA 194,809(BV)、EPA 278,667(BV);和Gluzman等人.(《分子生物学通讯:病毒载体》(Communications in Molecular Biology:Viral Vectors),冷泉港实验室,纽约,第172-189页,1988)。在WO 87/06261中描述了用于在许多宿主(包括植物)中表达外源性DNA的假病毒颗粒。
用于在植物中引入和表达非病毒外源性核酸序列的植物RNA病毒的构建由上述参考文献以及Dawson等人.(《病毒学(Virology)》172:285-292,1989;Takamatsu等人.EMBOJ.6:307-311,1987;French等人.(《科学(Science)》231:1294-1297,1986);和Takamatsu等人.(FEBS Letters 269:73-76,1990)证明。
当病毒是DNA病毒时,可以对病毒本身进行适当的修饰。可替代地,可以首先将病毒克隆到细菌质粒中,以便于用外源DNA构建所需的病毒载体。然后可以从质粒中切除病毒。如果病毒是DNA病毒,则细菌复制起点可以被附着至病毒DNA,其然后由细菌进行复制。该DNA的转录和翻译将产生外壳蛋白,该外壳蛋白将包裹病毒DNA。
如果病毒是RNA病毒,则通常将病毒克隆为cDNA并插入到质粒中。然后使用质粒进行所有构建。然后,通过转录质粒的病毒序列和翻译病毒基因以产生包裹病毒RNA的外壳蛋白,来产生RNA病毒。
用于在植物中引入和表达非病毒外源性核酸序列(例如包含在本发明的构建体中的那些)的植物RNA病毒的构建已经由上述参考文献以及在美国专利号5,316,931中被证明。
在一个实施例中,提供了一种植物病毒核酸,其中天然外壳蛋白编码序列已从病毒核酸中缺失,已经插入了非天然植物病毒外壳蛋白编码序列和非天然启动子,优选地非天然外壳蛋白编码序列的亚基因组启动子,其能够在植物宿主中表达,包装重组植物病毒核酸,并确保通过重组植物病毒核酸对宿主的系统感染。可替代地,外壳蛋白基因可以通过在其中插入非天然核酸序列而失活,使得产生蛋白质。重组植物病毒核酸可以包含一种或多种额外的非天然亚基因组启动子。每个非天然亚基因组启动子都能够在植物宿主中转录或表达相邻基因或核酸序列,并且不能相互重组且不能与天然亚基因组启动子重组。如果包含多于一种核酸序列,则可以将非天然(外源)核酸序列插入到天然植物病毒亚基因组启动子或天然和非天然植物病毒亚基因组启动子附近。非天然核酸序列在亚基因组启动子的控制下在宿主植物中被转录或表达以产生所需的产物。
在第二实施例中,如在第一实施例中一样提供了一种重组植物病毒核酸,不同之处在于将天然外壳蛋白编码序列放置在非天然外壳蛋白亚基因组启动子之一附近而不是非天然外壳蛋白编码序列附近。
在第三实施例中,提供了一种重组植物病毒核酸,其中天然外壳蛋白基因与其亚基因组启动子相邻,并且一个或多个非天然亚基因组启动子已经被插入到病毒核酸中。插入的非天然亚基因组启动子能够在植物宿主中转录或表达相邻基因,并且不能相互重组且不能与天然亚基因组启动子重组。可以将非天然核酸序列插入到非天然亚基因组植物病毒启动子附近,使得该序列在亚基因组启动子的控制下在宿主植物中被转录或表达以产生所需的产物。
在第四实施例中,如第三实施例中一样提供了一种重组植物病毒核酸,不同之处在于天然外壳蛋白编码序列被非天然外壳蛋白编码序列替换。
病毒载体被由重组植物病毒核酸编码的外壳蛋白包裹以产生重组植物病毒。重组植物病毒核酸或重组植物病毒用于感染合适的宿主植物。重组植物病毒核酸能够在宿主中复制、在宿主中系统传播以及在宿主中转录或表达外源性基因(分离的核酸),以产生所需的蛋白质。
除了上述之外,本发明的核酸分子还可以被引入到叶绿体基因组中,从而能够实现叶绿体表达。
用于将外源性核酸序列引入到叶绿体的基因组中的技术是已知的。该技术涉及以下程序。首先,对植物细胞进行化学处理,以便将每个细胞的叶绿体的数量减少到约一个。然后,通过粒子轰击将外源性核酸引入到细胞中,目的是将至少一种外源性核酸分子引入到叶绿体中。选择外源性核酸,使得其可通过同源重组整合到叶绿体的基因组中,同源重组很容易受到叶绿体固有的酶的影响。为此,除了感兴趣的基因之外,外源性核酸还包括至少一个衍生自叶绿体的基因组的核酸段(stretch)。此外,外源性核酸包括选择性的标记物,其通过顺序选择程序用于确定在此类选择之后叶绿体基因组的所有或大体上所有的拷贝将包括外源性核酸。与该技术相关的另外的细节在美国专利号4,945,050;和5,693,507(其通过引用并入本文)中找到。因此,多肽可以由叶绿体的蛋白质表达系统产生并变得被整合到叶绿体的内膜中。
在外源性多肽赋予植物抗病性的情况下,可以基于对病原体的抗性或耐受性的增加来确定表达,优选地与类似的野生型(非转化的)植物相比。植物对病原体的抗性或耐受性的比较评价可以使用植物病理学领域中熟知的体外或体内生物测定法来实现,例如由如Agrios,G.N编辑.(植物病理学(Plant Pathology),第三版,学术出版社,纽约,1988)描述的。
评估植物对病原体的抗性或耐受性可以通过将病原体暴露于从植物组织获得的提取物并且体外确定该提取物对病原体生长的影响来实现。在一些实施例中,通过将病原体暴露于植物组织(例如,叶组织)来评估植物对病原体的抗性或耐受性。
在其他实施例中,通过将病原体暴露于整株植物来评估植物对病原体的抗性或耐受性。例如,评估植物对尖孢镰刀菌古巴专化型(Foc)(巴拿马病的致病因子)的抗性或耐受性可以通过将转化的香蕉植物种植在靠近被病原体感染的非转化植物(用作接种源)的开阔的田地中来实现。与未转化的植物相比,随后在转化的植物中发展的疾病的严重程度被评估。疾病的严重程度优选地通过视觉评估(损害通常出现在具有至少5-12片叶子的吸盘上)并进行统计分析以确定植物品系之间对巴拿马病的抗性或耐受性的显著差异。
因此,本发明提供了包含一种或多种编码抗病多肽的多核苷酸的核酸构建体、表达外源抗病性状的转化的香蕉细胞和转化的香蕉植物,及其生产方法。
VI.育种方法
开放授粉群体.作物诸如黑麦、许多玉米和甜菜、牧草、豆科植物(例如苜蓿和三叶草)以及热带树木作物(例如可可、椰子、油棕和一些橡胶)的开放授粉群体的改良主要取决于改变基因频率,以趋向于固定有利的等位基因,同时保持较高(但远非最大)程度的杂合性。此类群体中的一致性是不可能的,并且开放授粉品种中的类型真实性是整个群体的统计特征,而不是单独的植物的特征。因此,开放授粉群体的异质性与近交系、无性系和杂种的同质性(或几乎如此)形成对比。
群体改良方法自然分为两组,一组基于纯表型选择(通常被称为大规模选择),并且另一组基于后代测试的选择。群体间改良利用开放育种群体的概念;允许基因从一个群体流向另一个群体。一个群体(栽培品种、品系、生态型或任何种质来源)中的植物与来自其他群体的植物自然杂交(例如,通过风)或通过人工或通过蜜蜂(通常为Apis mellifera L或Megachile rotundata F.)杂交。通过从两个来源中分离出具有所需性状的植物,选择被用于改善一个(或有时两个)群体。
基本上存在两种主要的开放授粉群体改良的方法。首先,存在这样的情况,其中群体被选定的选择程序集体改变。结果是改进的种群,所述改进的种群可以通过在自身内孤立地随机交配而无限繁殖。其次,合成品种获得与群体改良相同的最终结果,但其本身不可繁殖;它必须由亲本系或克隆重建。这些用于改善开放授粉群体的植物育种程序是本领域技术人员熟知的,并且在许多文本和文章中提供了对常规用于改善异花授粉植物的育种程序的全面综述,包括:Allard,《植物育种原理(Principles of Plant Breeding)》,约翰·威利父子有限公司,(1960);Simmonds,《作物改良原理(Principles of CropImprovement)》,朗文集团有限公司(Longman Group Limited)(1979);Hallauer和Miranda,《玉米育种中的数量遗传学(Quantitative Genetics in Maize Breeding)》,爱荷华州立大学出版社(Iowa State University Press)(1981);和Jensen,《植物育种方法论(Plant Breeding Methodology)》,约翰·威利父子有限公司(1988)。对于特定于大豆的群体改良方法,参见例如J.R.Wilcox编辑(1987)《大豆:改良、生产和用途(SOYBEANS:Improvement,Production,and Uses)》,第二版,美国农艺学会有限公司(AmericanSociety of Agronomy,Inc.),美国作物科学协会有限公司(Crop Science Society ofAmerica,Inc.)和美国土壤科学学会有限公司出版社,888页。
大规模选择。在大规模选择中,选择、收获所需的单独的植物,并且在没有后代测试的情况下合成种子,以产生下一代。由于选择仅基于母体亲本,并且对授粉没有控制,因此大规模选择相当于一种随机交配与选择的形式。如上所述,大规模选择的目的是增加群体中优良基因型的比例。
合成物(Synthetics)。合成品种是通过在所有可能的杂交组合中杂交许多选择的具有良好配合力的基因型而产生的,随后通过开放授粉保持该品种。无论亲本是(或多或少是近亲繁殖的)种子繁殖系(如在一些甜菜和豆类(蚕豆)中)或无性系(如在牧草、丁香和苜蓿中),原则上没有区别。亲本根据一般配合力选择,有时通过测试杂交或顶部杂交,更一般地通过多交种选择。亲本种子系可能是故意近交的(例如通过自交或同胞杂交)。然而,即使亲本不是故意近交的,在系维护期间的系内选择也将确保发生一些近交。当然,克隆亲本将保持不变且高度杂合。
合成物是可以从亲本种子生产地直接进入农户手中,还是必须首先经历一到两个繁殖周期,取决于种子产量和对种子的需求规模。在实践中,草和丁香通常繁殖一次或两次,因此从原始合成物中被大量去除。
虽然有时使用大规模选择,但后代测试对于多交种通常是优选的,因为它们操作简单,并且与目标明显相关,即利用合成物中的一般配合力。
进入合成品种的亲本系或克隆的数量差异很大。在实践中,亲本系的数量在10到几百的范围内,其中平均为100到200个。由100个或更多克隆形成的宽基合成物预期在种子繁殖期间比窄基合成物更稳定。
杂种.如上所述,杂种是由不同基因型的亲本之间杂交产生的个体植物。商业杂种现在被广泛用于许多作物,包括玉米(corn)(玉米(maize))、高粱、甜菜、向日葵和西兰花。杂种可以以许多不同的方式形成,包括通过直接杂交两个亲本(单杂交杂种),通过将单杂交杂种与另一亲本杂交(三向或三重杂交杂种),或通过杂交两个不同的杂种(四向或双重杂交杂种)。
严格来说,外育种(即开放授粉的)群体中的大多数个体都是杂种,但该术语通常保留用于这样的情况,即亲本是其基因组对它们足够不同以被识别为不同的物种或亚种的个体。根据两个亲本的基因组的质量和/或数量差异,杂种可能是可育的或不育的。杂种优势(Heterosis)或杂种优势(hybrid vigor)通常与杂合性有关,与用于形成杂种的亲本系相比,增加的杂合性导致杂种的生长、存活和生育性的活力增加。最大杂种优势通常通过杂交两个遗传不同的高度近交系来实现。
杂种的生产是良好发展的产业,涉及亲本系和由杂交这些系产生的杂种的分离的生产。对于杂交生产过程的详细讨论,参见,例如,Wright,《商业化杂交种子生产(Commercial Hybrid Seed Production)》8:161-176,在作物植物的杂交(Hybridizationof Crop Plants中)。
批量分离分析(Bulk Segregation Analysis)(BSA)。BSA(又名批量分离分析(bulked segregation analysis)或批量分离分析(bulk segregant analysis))是由Michelmore等人.(Michelmore等人,1991,“通过批量分离分析鉴定与抗病基因相关的标记物:一种通过使用分离群体来检测特定基因组区域中的标记物的快速方法(Identification of markers linked to disease-resistance genes by bulkedsegregant analysis:a rapid method to detect markers in specific genomicregions by using segregating populations)”.《美国国家科学院院刊(Proceedings ofthe National Academy of Sciences,USA)》,99:9828-9832)和Quarrie等人.(Quarrie等人.“利用分子标记物的批量分离分析及其在玉米中用于改善抗旱性中的应用(Bulksegregant analysis with molecular markers and its use for improving droughtresistance in maize)”,1999,《实验植物学杂志》,50(337):1299-1306)描述的方法。
对于感兴趣的性状的BSA,选择具有某些不同表型的亲本系并进行杂交以产生F2、双单倍体或重组近交群体,并进行QTL分析。然后对群体进行表型分析以鉴定具有高或低表达性状的单独的植物或品系。制备两个DNA批次,一个来自具有一种表型(例如,对病原体有抗性)的个体,并且另一个来自具有反向表型(例如,对病原体有易感性)的个体,并用分子标记物分析等位基因频率。如果标记物是显性的(例如,RAPD),则每个批次中只需要几个个体(例如,每个批次10株植物)。当标记物是共显性的(例如,RFLP)时,需要更多的个体。与表型相关的标记物可以被识别并用于育种或QTL作图。
基因聚合(Gene Pyramiding).将在不同亲本中鉴定的一系列靶基因组合成单一基因型的方法通常称为基因聚合。基因聚合育种的第一部分被称为系谱,并且旨在在单个基因型(被称为根基因型)中累积所有靶基因的一个拷贝。第二部分称为固定步骤,并且旨在将靶基因固定为纯合状态,即从根基因型中衍生出理想的基因型(ideotype)。基因聚合可以与标记物辅助选择(MAS,参见Hospital等人,1992,1997a和1997b以及Moreau等人,1998)或基于标记物的复发性选择(MBRS,参见Hospital等人,2000)相结合。
香蕉育种计划(尤其是对于可食用香蕉)受到高的不育、三倍体和无籽的阻碍。很少有二倍体香蕉克隆产生有活力的花粉,并且商业香蕉克隆的种质是雄性不育的和雌性不育的。尽管存在这些问题和挑战,但是近年来在芭蕉属的遗传改良方面已经取得了重要进展,并且新品种并没有从香蕉育种计划中获得(Escalant和Jain,第30章,用细胞和分子生物学的香蕉改良,和诱导的突变:未来和展望(Banana improvement with cellular andmolecular biology,and induced mutations:future and perspectives),8页,在Jain和Swennan,编辑,香蕉改良:细胞、分子生物学和诱导的突变,2004,联合国粮食及农业组织(Food and Agriculture Organization of the United Nations),学术出版社有限公司(Science Publishers,Inc.))。
有关香蕉育种的信息,参见,例如,Heslop-Harrison和Schwarzacher,《植物学年鉴(Annals of Botany)》100:1073-1084,2007;Bakry等人,第1章,“香蕉的遗传改良(Genetic Improvement in Banana)”,50页,育种种植树木作物:热带物种中(BreedingPlantation Tree Crops:Tropical Species),2009;Heslop-Harrison等人,“基因组学、香蕉育种和超驯化(Genomics,Banana Breeding and Superdomestication)”,ActaHort.897:55-62,2011;Jenny等人.,Jacome等人编辑,《香蕉的球腔菌属叶斑病:现状与展望(Mycosphaerella leaf spot diseases of banana:present status and outlook)》,2002年5月20日至23日在哥斯达黎加圣何塞举行的第二届球腔菌属叶斑病国际研讨会记录,第4次会议,第199-208页(Proceedings of the 2nd International Workshop onMycosphaerella leaf spot diseases held in San José,Costa Rica,20-23May 2002,Session 4,pages 199-208);Ortiz等人,《香蕉和大蕉育种(Banana and PlantainBreeding)》,第10章,第110-146页,Gowen等人编辑,《香蕉和大蕉,世界作物系列(Bananasand Plantains,World Crop Series)》,斯普林格链接(Springer Link),1995;Batte等人,《植物科学前沿(Frontiers in Plant Science)》,第10卷,文章81,9页,2019年2月。
VII.基因编辑
如本文所使用的,术语“基因编辑系统”是指包括一种或多种DNA结合结构域或组分和一种或多种DNA修饰结构域或组分,或编码所述DNA结合结构域或组分和DNA修饰结构域或组分的分离的核酸(例如一种或多种载体)的系统。基因编辑系统用于修饰靶基因的核酸和/或用于调节靶基因的表达。例如,在已知的基因编辑系统中,一种或多种DNA结合结构域或组分与一种或多种DNA修饰结构域或组分相关,使得一种或多种DNA结合结构域将一种或多种DNA修饰结构域或组分靶向至特定的核酸位点。用于增强基因编辑的方法和组合物在本领域中是熟知的。参见例如美国专利申请公开第2018/0245065号,其通过引用以其整体并入。
某些基因编辑系统在本领域中是已知的,并且包括但不限于锌指核酸酶、转录激活因子样效应核酸酶(TALEN);成簇的规则间隔的短回文重复序列(CRISPR)/Cas系统、巨型核酸酶系统和病毒载体介导的基因编辑。
在一些实施例中,本公开教导了利用DNA核酸酶进行基因编辑/克隆的方法。CRISPR复合物、转录激活因子样效应核酸酶(TALEN)、锌指核酸酶(ZFN)和FokI限制性酶,它们是一些已经用作基因编辑工具的序列特异性核酸酶。这些酶能够通过与工程改造成识别感兴趣的序列的引导区的相互作用,将它们的核酸酶活性靶向所需的靶基因座。在一些实施例中,本公开教导了基于CRISPR的基因编辑方法,以对本公开的香蕉物种的基因组进行工程改造以便刺激、增强或调节对病原体的抗病性。
(i)CRISPR系统
CRISPR(成簇的规则间隔的短回文重复)和CRI SPR相关(cas)核酸内切酶最初作为由细菌和古细菌进化的适应性免疫系统被发现,以保护免受病毒和质粒的入侵。细菌中天然存在的CRISPR/Cas系统由一个或多个Cas基因和一个或多个CRISPR阵列组成,所述阵列由碱基序列的短回文重复序列组成,所述碱基序列由从以前遇到的病毒和质粒(被称为间隔子)获得的基因组靶向序列分离。(Wiedenheft,B等人,《自然》.2012;482:331;Bhaya,D等人,Annu.Rev.Genet.2011;45:231;和Terms,M.P等人.,Curr.Opin.Microbiol.2011;14:321)。具有一个或多个CRISPR基因座的细菌和古细菌通过将外源序列的短片段(原型间隔子)整合到CRISPR阵列近端的宿主染色体中来响应病毒或质粒攻击。CRISPR基因座的转录生成CRISPR衍生的RNA(crRNA)的文库,所述文库包含与之前遇到的入侵核酸互补的序列(Haurwitz,RE,等人,《科学》.2012:329;1355;Gesner,E.M等人.Nat.Struct.Mol.Biol.2001:18;688;Jinek,M等人,《科学》.2012:337;816-21)。通过该crRNA的目标识别通过与靶DNA的互补碱基配对发生,这通过Cas蛋白指导外源序列的切割。(Jinek等人.2012“在适应性的细菌免疫中的可编程的双RNA引导的DNA核酸内切酶(AProgrammable dual-RNA-guided DNA endonuclease in adaptive bacterialimmunity).”《科学》.2012:337;816-821)。
至少存在五种主要的CRISPR系统类型(I、II、III、IV和V型)和至少16个不同的亚型(Makarova,K.S等人,《自然评论微生物学(Nat Rev Microbiol)》.2015.《自然评论微生物学》.13,722–736)。CRISPR系统也根据其效应蛋白进行分类。第1类系统拥有多亚基crRNA效应子复合物,而在第2类系统中,效应子复合物的所有功能都由单个蛋白质(例如,Cas9或Cpf1)执行。在一些实施例中,本公开提供使用II型和/或V型单亚基效应子系统。
由于这些天然存在于许多不同类型的细菌中,因此CRISPR的确切排列以及Cas基因及其产物的结构、功能和数量因物种而稍微不同。Haft等人.(2005)PLoSComput.Biol.1:e60;Kunin等人.(2007)《基因组生物学(Genome Biol.)》8:R61;Mojica等人.(2005)《分子进化杂志(J.Mol.Evol.)》60:174-182;Bolotin等人.(2005)《微生物学(Microbiol.)》151:2551-2561;Pourcel等人.(2005)《微生物学》151:653-663;和Stern等人(2010)Trends.Genet.28:335-340。例如,Cse(Cas亚型,大肠杆菌)蛋白(例如,CasA)形成功能复合物Cascade,其将CRISPR RNA转录本加工成Cascade保留的间隔子重复单元。Brouns等人.(2008)《科学》321:960-964.在其他原核生物中,Cas6加工CRISPR转录本。大肠杆菌中基于CRISPR的噬菌体灭活需要Cascade和Cas3,但不需要Cas1或Cas2。嗜热古细菌和其他原核生物中的Cmr(Cas RAMP模块)蛋白与识别和切割互补性靶RNA的小CRISPR RNA形成功能复合物。一个更简单的CRISPR系统依赖于蛋白质Cas9,它是一种具有两个活性切割位点的核酸酶,对于双螺旋的每条链有一个切割位点。将Cas9与修饰的CRISPR基因座RNA结合可以用于基因编辑的系统。Pennisi(2013)《科学》341:833-836.
(ii)CRISPR/Cas9
在一些实施例中,本公开提供了使用II型CRISPR系统的基因编辑的方法。II型系统依赖于i)单个核酸内切酶蛋白,ii)反式激活的crRNA(tracrRNA),以及iii)crRNA,其中crRNA 5'端的约20-核苷酸(nt)部分与靶核酸互补。与其靶DNA原型间隔子互补的CRISPRcrRNA链的区域据此被称为“引导序列”。
在一些实施例中,II型系统的tracrRNA和crRNA组分可以被单个向导RNA(sgRNA)(也被称为向导RNA(gRNA))替代。sgRNA可以包括,例如,包含与靶DNA序列(引导序列)互补的至少12-20个核苷酸序列的核苷酸序列,并且可以在其3'末端包括普通的支架RNA序列。如本文所使用的,“普通的支架RNA”是指模拟tracrRNA序列的任何RNA序列或用作tracrRNA的任何RNA序列。
Cas9核酸内切酶产生钝端DNA断裂,并且通过crRNA和tracrRNA寡聚体的组合被募集至靶DNA,其通过RNA CRISPR复合物的互补杂交来束缚核酸内切酶。
在一些实施例中,通过crRNA/核酸内切酶复合物对DNA的识别需要与位于靶DNA的3'部分、靶原型间隔子下游的原型间隔子邻近基序(PAM)(例如5'-NGG-3')进行额外的互补碱基配对。(Jinek,M等人,《科学》.2012,337:816-821)。在一些实施例中,由Cas9识别的PAM基序因不同的Cas9蛋白而异。
在一些实施例中,本文公开的Cas9可以是衍生自或分离自任何来源的任何变体。在其他实施例中,本公开的Cas9肽可以包括文献中描述的一种或多种突变,包括但不限于在以下中描述的功能性突变:Fonfara等人.《核酸研究》.2014年2月;42(4):2577-90;Nishimasu H等人.《细胞》.2014年2月27日,156(5):935-49;Jinek M等人,《科学》.2012337:816-21;和Jinek M等人,《科学》.2014年3月14日,343(6176);还参见2013年3月15日提交的美国专利申请号13/842,859,其据此通过引用并入;此外,参见美国专利号8,697,359;8,771,945;8,795,965;8,865,406;8,871,445;8,889,356;8,895,308;8,906,616;8,932,814;8,945,839;8,993,233;和8,999,641,其均据此通过引用并入。因此,在一些实施例中,本文公开的系统和方法可以与具有双链核酸酶活性的野生型Cas9蛋白、充当单链切口酶的Cas9突变体或具有修饰的核酸酶活性的其他突变体一起使用。
根据本公开,衍生自或基于多种物种的Cas9蛋白的Cas9分子可以用于本文所述的方法和组合物中。例如,衍生自或基于例如化脓性链球菌、嗜热链球菌、金黄色葡萄球菌和/或脑膜炎奈瑟菌Cas9分子的Cas9分子可以用于本文所述的系统、方法和组合物。另外的Cas9物种包括:西瓜嗜酸菌(Acidovorax avenae)、胸膜肺炎放线杆菌(Actinobacilluspleuropneumoniae)、琥珀酸放线杆菌(Actinobacillus succinogenes)、猪放线杆菌(Actinobacillus suis)、放线菌(Actinomyces sp.)、cycliphilus denitrificans)、贫食氨基单胞菌(Aminomonas paucivorans)、蜡状芽孢杆菌(Bacillus cereus)、史密氏杆菌(Bacillus smithii)、苏云金杆菌(Bacillus thuringiensis)、拟杆菌(Bacteroidessp.)、滨海芽生螺旋菌(Blastopirellula marina)、大豆根瘤菌的种(Bradyrhiz obiumsp.)、侧孢短芽孢杆菌(Brevibacillus latemsporus)、大肠弯曲杆菌(Campylobactercoli)、空肠弯曲菌(Campylobacter jejuni)、Campylobacter lad、CandidatusPuniceispirillum、解纤维梭菌(Clostridiu cellulolyticum)、产气荚膜梭菌(Clostridium perfringens)、拥挤棒杆菌(Corynebacterium accolens)、白喉棒杆菌(Corynebacterium diphtheria)、马氏棒杆菌(Corynebacterium matruchotii)、柴氏鞭毛虫玫瑰杆菌(Dinoroseobacter sliibae)、细长真杆菌(Eubacterium dolichum)、γ-变形菌纲(gamma proteobacterium)、重氮营养葡糖酸醋杆菌(Gluconacetobaclerdiazotrophicus)、副流感嗜血杆菌(Haemophilus parainfluenzae)、Haemophilussputorum、加拿大螺杆菌(Helicobacter canadensis)、同性恋螺杆菌(Helicobactercinaedi)、雪貂螺杆菌(Helicobacter mustelae)、Ilyobacler polytropus、金格杆菌(Kingella kingae)、弯曲乳酸杆菌(Lactobacillus crispatus)、依氏利斯特菌(Listeriaivanovii)、单核细胞增生性李斯特氏菌(Listeria monocytogenes)、Listeriaceaebacterium、甲基孢囊菌(Methylocystis sp.)、发孢甲基弯菌(Methylosinustrichosporium)、羞怯动弯杆菌(Mobiluncus mulieris)、短杆奈瑟氏菌(Neisseriabacilliformis)、灰色奈瑟氏菌(Neisseria cinerea)、浅黄奈瑟氏菌(Neisseriaflavescens)、乳糖奈瑟氏菌(Neisseria lactamica)、奈瑟氏菌(Neisseria sp.)、华兹华斯奈瑟氏菌(Neisseria wadsworthii)、亚硝酸菌(Nitrosomonas sp.)、嗜洗涤剂短棒菌(Parvibaculum lavamentivorans)、多杀性巴氏杆菌(Pasteurella multocida)、琥珀酸考拉杆菌(Phascolarctobacterium succinatutens)、蒲桃拉氏菌(Ralstonia syzygii)、沼泽红假单胞菌(Rhodopseudomonas palustris)、小红卵菌(Rhodovulum sp.)、米氏西蒙斯氏菌(Simonsiella muelleri)、鞘氨醇单胞菌(Sphingomonas sp.)、葡萄园芽孢乳杆菌(Sporolactobacillus vineae)、路邓葡萄球菌(Staphylococcus lugdunensis)、链球菌(Streptococcus sp.)、罕见小球菌(Subdoligranulum sp.)、运动发酵杆菌(Tislrellamobilis)、密螺旋体(Treponema sp.)或艾森氏蠕形杆菌(Verminephrobacter eiseniae)。
在一些实施例中,本公开教导了用于基因组编辑技术的工具在植物例如作物中的用途以及使用CRISPR-相关(cas)核酸内切酶(包括SpyCas9、SaCas9、St1Cas9)进行基因编辑的方法。这些可以应用于植物基因组编辑的强大的用于基因组编辑的工具在本领域中是熟知的。参见,例如,Song等人.(2016),CRISPR/Cas9:“作物基因组编辑的有力工具(Apowerful tool for crop genome editing)”,《作物杂志(The Crop Journal)》4:75-82,Mali等人.(2013)“通过cas9进行RNA引导的人类基因组工程(RNA-guided human genomeengineering via cas9)”,《科学》339:823-826;Ran等人.(2015)“使用金黄色葡萄球菌cas9进行体内基因组编辑(In vivo genome editing using staphylococcus aureuscas9)”,《自然》520:186-191;Esvelt等人.(2013)“用于rna引导的基因调控和编辑的正交cas9蛋白(Orthogonal cas9 proteins for rna-guided gene regulation andediting)”,《自然方法(Nature methods)》10(11):1116-1121,其每一个都是出于所有目的据此通过引用以其整体并入。
(iii)CRISPR/Cpf1
在其他实施例中,本公开提供了使用V型CRISPR系统进行基因编辑的方法。在一些实施例中,本公开提供了使用来自普氏菌、弗朗西丝氏菌属、氨基酸球菌属、毛螺旋菌属和莫拉克氏菌属(Cpf1)的CRISPR进行基因编辑的方法。
本公开的Cpf1 CRISPR系统包含i)单一核酸内切酶蛋白,和ii)crRNA,其中crRNA的3'端的一部分包含与靶核酸互补的引导序列。在这个系统中,Cpf1核酸酶被crRNA直接募集到靶DNA。在一些实施例中,Cpfl的引导序列必须为至少12nt、13nt、14nt、15nt或16nt以便实现可检测的DNA切割,并且为最少14nt、15nt、16nt、17nt或18nt以实现有效的DNA切割。
本公开的Cpf1系统在多种方面不同于Cas9。首先,与Cas9不同,Cpf1不需要单独的tracrRNA用于切割。在一些实施例中,Cpf1 crRNA可以短至约42-44个碱基长—其中23-25nt是引导序列,并且19nt是组成型直接重复序列。相比之下,组合的Cas9 tracrRNA和crRNA合成序列可以长约100个碱基。
其次、某些Cpf1系统偏爱位于其靶上游5'的“TTN”PAM基序。这与位于常见Cas9系统(例如化脓性链球菌Cas9)的靶DNA的3'上的“NGG”PAM基序形成对比。在一些实施例中,紧接在引导序列之前的尿嘧啶碱基不能被取代(Zetsche,B等人2015.“Cpf1是2类CRISPR-Cas系统的单个RNA引导的核酸内切酶(Cpf1 Is a Single RNA-Guided Endonuclease of aClass 2CRISPR-Cas System)”《细胞》163,759-771,其据此出于所有目的通过引用以其整体并入)。
第三,Cpf1的切割位点错开约3-5个碱基,这会产生“粘性末端”(Kim等人,2016.“全基因组分析揭示了人类细胞中Cpf1核酸内切酶的特异性(Genome-wide analysisreveals specificities of Cpf1 endonucleases in human cells)”,其在线发表于2016年6月6日)。这些带有3-5nt突出端的粘性末端被认为有助于NHEJ介导的连接,并且改善具有匹配末端的DNA片段的基因编辑。切割位点位于靶DNA的3'端,远离PAM所在的5'端。切割位置通常跟随未杂交链上的第18个碱基和与crRNA杂交的互补链上的相应的第23个碱基。
第四,在Cpf1复合物中,“种子”区域位于引导序列的前5nt内。Cpf1 crRNA种子区域对突变高度敏感,并且甚至该区域中的单个碱基取代可以显著降低切割活性(参见Zetsche B等人.2015“Cpf1是2类CRISPR-Cas系统的单个RNA引导的核酸内切酶”《细胞》163,759-771)。至关重要的是,与Cas9 CRISPR靶不同,Cpf1系统的切割位点和种子区域不重叠。有关设计Cpf1 crRNA靶向寡聚体的另外的指南可在Zetsche B.等人.2015.(“Cpf1是2类CRISPR-Cas系统的单个RNA引导的核酸内切酶”《细胞》163,759-771)获得。
(iv)向导RNA(gRNA)
在一些实施例中,本公开的向导RNA包含两个编码区,分别编码crRNA和tracrRNA。在其他实施例中,向导RNA是单个向导RNA(sgRNA)合成的crRNA/tracrRNA杂交体。在其他实施例中,向导RNA是Cpf1核酸内切酶的crRNA。
本领域技术人员将理解,除非另有说明,否则本公开中对单个向导RNA(sgRNA)的所有提及都可以被理解为指的是向导RNA(gRNA)。因此,本公开中描述的指代单个向导RNA(sgRNA)的实施例也将被理解为指的是向导RNA(gRNA)。
设计向导RNA以便将CRISPR核酸内切酶募集到靶DNA区域。在一些实施例中,本公开教导了鉴定可行的靶CRISPR着陆位点和设计用于靶向该位点的向导RNA的方法。例如,在一些实施例中,本公开教导了被设计成促进识别靶DNA区域内的CRISPR着陆位点的算法。
在一些实施例中,本公开教导了软件程序的应用,该软件程序被设计为基于特定CRISPR酶的期望的引导序列长度和CRISPR基序序列(PAM,原型间隔子邻近基序)来识别输入DNA序列的两条链上的候选CRISPR靶序列。例如,对于来自新凶手弗朗西斯菌(Francisella novicida)U112的Cpf1的靶位点(具有PAM序列TTN)可以通过在输入序列和输入的反向互补序列上搜索5′-TTN-3′来识别。来自毛螺旋菌属和氨基酸球菌属的Cpf1的靶位点(具有PAM序列TTN)可以通过在输入序列和输入的反向互补序列上搜索5'-TTTN-3'来识别。同样,对于嗜热链球菌CRISPR的Cas9的靶位点(具有PAM序列NNAGAAW)可以通过在输入序列和输入的反向互补序列上搜索5′-Nx-NNAGAAW-3′来识别。化脓性链球菌的Cas9的PAM序列是5'-NGG-3'。
由于在DNA靶位点的基因组中的多次出现可能导致非特异性基因组编辑,在鉴定所有潜在的位点后,可以根据序列在相关参考基因组或模块化CRISPR构建体中出现的次数将序列过滤掉。对于那些序列特异性由“种子”序列决定的CRISPR酶(例如Cpf1介导的切割的引导序列的前5bp),过滤步骤也可以解释任何种子序列限制。
在一些实施例中,算法工具还可以鉴定特定引导序列的潜在脱靶位点。例如,在一些实施例中,Cas-Offinder可以用于鉴定Cpf1的潜在脱靶位点(参见Kim等人,2016年.“全基因组分析揭示了人类细胞中Cpf1核酸内切酶的特异性(Genome-wide analysis revealsspecificities of Cpf1 endonucleases in human cells)”《自然生物技术(NatureBiotechnology)》34,863-868)。也可以使用任何其他公开可用的CRISPR设计/鉴定工具,包括例如Zhang lab crispr.mit.edu工具(参见Hsu等人.2013“RNA引导的Cas9核酸酶的DNA靶向特异性(DNA targeting specificity of RNA guided Cas9 nucleases)”《自然生物技术》31,827-832).
在一些实施例中,可以允许用户选择种子序列的长度。也可以允许用户指定种子:PAM序列在基因组中出现的次数,以便通过过滤器。默认是筛选唯一的序列。过滤水平通过改变种子序列的长度和该序列在基因组中出现的次数来改变。该程序可以另外或替代地通过提供所鉴定的靶序列的反向互补序列来提供与所报告的靶序列互补的引导序列的序列。
在向导RNA中,“间隔子/引导序列”的序列与DNA靶中的“原型间隔子”序列互补。用于单链gRNA结构的gRNA“支架”被Cas9蛋白识别。
在一些实施例中,本公开中教导的转基因植物、植物部分、植物细胞或植物组织培养物包含重组构建体,其包含至少一种编码向导RNA的核酸序列。在一些实施例中,核酸与启动子可操作地连接。在其他实施例中,重组构建体进一步包含编码成簇的规则间隔的短回文重复序列(CRISPR)核酸内切酶的核酸序列。在其他实施例中,向导RNA能够与所述CRISPR核酸内切酶形成复合物,并且所述复合物能够结合至所述植物基因组的基因组靶序列并在所述植物基因组的基因组靶序列中产生双链断裂。在其他实施例中,CRISPR核酸内切酶是Cas9。
在另外的实施例中,靶序列是用于FusR1的核酸,FusR1的同系物,FusR1的直系同源物和/或FusR1的旁系同源物,和/或其片段和变体。在一些实施例中,本公开教导了使用本文所述的基因工程改造技术对易受镰刀菌病原体影响的FW敏感的香蕉品种中的FusR1的基因编辑。
本公开教导了基于本公开中给出的序列信息通过将FW敏感等位基因转变为FW抗性等位基因来调节、刺激和增强抗病性的靶向基因编辑技术。本公开教导了FW抗性等位基因和FW敏感等位基因的序列信息。使用CRISPR/Cas系统,将FW抗性性状引入到FW敏感的香蕉品种。
在一些实施例中,FW敏感的FusR1等位基因将作为敲除的目标。在一些实施例中,负责FW敏感性性状的保守区域的序列可以用于制造基因编辑机器(例如CRISPR相关效应蛋白、ZFN、TALEN等)以靶向一种或多种FusR1直系同源物。
在一些实施例中,内源性FW敏感等位基因的表达的破坏通过基因编辑技术进行。在一些实施例中,FW敏感等位基因的敲除通过基因编辑技术进行。在一些实施例中,将FW敏感等位基因碱基编辑成FW抗性等位基因是通过基因编辑技术进行的。在一些实施例中,基因编辑技术是ZFN。在其他实施例中,基因编辑技术是TALEN。在另外的实施例中,基因编辑技术是CRISPR/Cas系统。在另外的实施例中,所述CRISPR系统包含核酸分子和酶促蛋白,其中所述核酸分子是向导RNA(gRNA)分子并且所述酶促蛋白是Cas蛋白或Cas直系同源物。在另外的实施例中,至少两个表达盒被串联堆叠在表达载体中。
在一些实施例中,修饰的植物细胞在内源性靶基因的基因组DNA序列中包含一种或多种修饰(例如,一种或多种核酸的插入、缺失或突变),导致内源性基因的功能改变,从而调节、刺激或增强抗病性。在此类实施例中,修饰的植物细胞包含“修饰的内源性靶基因”。在一些实施例中,基因组DNA序列中的修饰引起突变,从而将FW敏感的FUSR1蛋白的功能改变为FW抗性FUSR1蛋白。在一些实施例中,基因组DNA序列中的修饰导致氨基酸取代,从而改变所编码的蛋白质的正常功能。在一些实施例中,基因组DNA序列中的修饰编码修饰的内源性蛋白,所述修饰的内源性蛋白与FW敏感香蕉种质中内源性蛋白的未修饰的(即FW敏感)版本相比具有调节的、改变的、刺激的或增强的疾病/病原体抗性功能。
在一些实施例中,本文所述的修饰的植物细胞包含一个或多个修饰的内源性靶基因,其中与未修饰的植物细胞相比,所述一个或多个修饰导致由内源性靶基因编码的基因产物(即蛋白质)的功能改变。例如,在一些实施例中,修饰的植物细胞表现出FW抗性的FUSR1蛋白的表达或所述蛋白的上调表达。在一些实施例中,与基因产物(例如FW敏感的FusR1)在未修饰的植物细胞中的表达相比,基因产物(例如来自FW敏感的FusR1的基因工程改造的FW抗性FusR1)在修饰的植物细胞中的表达被增强了至少0.5%、1%、2%、3%、4%、5%或更高。在其他实施例中,与基因产物(例如FW敏感的FusR1)在未修饰的植物细胞中的表达相比,基因产物(例如基因工程改造的FW抗性FusR1)在修饰的植物细胞中的表达被增强了至少10%、20%、30%、40%、50%、60%、70%、80%、90%或更高。在一些实施例中,与基因产物在未修饰的植物细胞中的表达相比,本文所述的修饰的植物细胞显示出由多个(例如,两个或更多个)内源性靶基因编码的基因产物的增强的表达和/或功能。例如,在一些实施例中,与基因产物在未修饰的植物细胞中的表达相比,修饰的植物细胞显示出来自2、3、4、5、6、7、8、9、10或更多个内源性靶基因的基因产物的增强的表达和/或功能。
在一些实施例中,本文所述的修饰的植物细胞包含一个或多个修饰的内源性靶基因,其中与在未修饰的植物细胞中表达的相应蛋白质(例如“未修饰的内源性蛋白质”)的功能相比,对靶DNA序列的一个或多个修饰导致具有降低的或改变的功能的蛋白(例如,“修饰的内源性蛋白”)的表达。在一些实施例中,本文所述的修饰的植物细胞包含2、3、4、5、6、7、8、9、10个或更多个修饰的内源性靶基因,其编码2、3、4、5、6、7、8、9、10或更多种修饰的内源性蛋白。在一些实施例中,修饰的内源性蛋白表现出对由修饰的植物细胞表达或由另一种细胞表达的另一种蛋白的增强或改变的结合亲和力;增强的或改变的信号传导能力;增强的或改变的酶促活性;增强的或改变的DNA结合活性;或者降低的或改变的作为支架蛋白的能力。
实例
本发明通过以下不应被解释为限制性的实例进一步说明。在整个本申请中引用的所有参考文献、专利和公开的专利申请以及附图的内容出于所有目的通过引用以其整体并入本文。
实例1:用于测序的方法和材料
(1)材料
新鲜和冻干的香蕉叶组织获自Bioversity International(比利时鲁汶(Leuven,Belgium))、Inter-TROP CRB Plantes Tropicales(瓜德罗普岛(Guadeloupe))和IITAGenebank(尼日利亚伊巴丹(Ibadan,Nigeria))、Plant Delights Nursery(北卡罗来纳州罗利(Raleigh,NC))和Flower Bin(Longmont,CO)。
(2)RNA
使用改良的Ishihara方案从新鲜的、冷冻的和冻干的香蕉叶中提取总RNA(Ishihara等人,2016)。使用干净的、干冰冷却的研钵和研杵将约100mg的新鲜或冷冻的香蕉组织研磨成粉末,研杵用RNase AwayTM(Invitrogen,加利福尼亚州卡尔斯巴德)处理。将约20-30mg的冻干的香蕉组织在不含液体的裂解基质D管(Lysing Matrix D Tube)(MPBio,加利福尼亚州圣安娜)中匀浆。向每个样品中加入1毫升的多酚裂解缓冲液(800μl的RLT缓冲液(Qiagen,马里兰州日耳曼敦(Germantown,MD))、200μl的Fruit-mate(Takara,加利福尼亚州山景城(Mountain View,CA))和10μl的β-巯基乙醇)。将新鲜和冷冻的样品在FastPrep 120(ThermoFisher Scientific,马萨诸塞州沃尔瑟姆(Waltham,MA))的速度6设置下均质40秒,而将冻干的样品在高速下涡旋1分钟。所有样品在冰上孵育4分钟,然后以8000x g离心2分钟。将上清液转移到新的2.0ml管中,并向上清液加入另外1.0ml的多酚裂解缓冲液。将样品在高速下涡旋1分钟,在冰上孵育4分钟,并以8000x g离心2分钟。将上清液在两个QIAshredder柱(Qiagen,马里兰州日耳曼敦)之间分流,并在最大速度下离心2分钟,直到所有上清液已经被加工。RNA提取的其余步骤根据Ishihara方案进行。任选的溶液内DNase消化和RNA清除方案也如在RNeasy Mini方案(Qiagen,马里兰州日耳曼敦)中详述的进行。使用NanoDropTM One(ThermoFisher Scientific,马萨诸塞州沃尔瑟姆)分光光度计测定样品的浓度和纯度。
(3)DNA
使用改良的PowerPlant Pro DNA分离试剂盒方案(MO BIO,加利福尼亚州卡尔斯巴德)从新鲜的、冷冻的和冻干的香蕉叶中提取总DNA。使用干净的、干冰冷却的研钵和研杵将约40mg的新鲜或冷冻的香蕉组织研磨成粉末,研杵用RNase AwayTM(Invitrogen,加利福尼亚州卡尔斯巴德)处理。将约10-20mg的冻干的香蕉组织在不含液体的Lysing Matrix DTube(MP Bio,Santa Ana,CA)中匀浆。DNA提取的其余步骤根据MO BIO方案进行。将酚类分离溶液加入到裂解缓冲液中,并使用250μl的PD3缓冲液。使用NanoDropTM One(ThermoFisher Scientific,马萨诸塞州沃尔瑟姆)分光光度计测定样品的浓度和纯度。
(4)cDNA
使用第1链cDNA合成试剂盒(Epicentre,Madison,WI)从1.0μg的总RNA合成cDNA。使用来自Invitrogen的3'-RACE试剂盒(Invitrogen,加利福尼亚州卡尔斯巴德)的衔接子引物(AP)代替聚dT引物。
(5)引物
使用OligoAnalyzer工具(IDT,Coralville,IA)程序,针对退火温度为57-64℃的假定靶基因的同源区域设计引物序列。引物购自IDT。
(6)PCR
在Veriti热循环仪(应用生物系统公司(Applied Biosystems),加利福尼亚州卡尔斯巴德)中,在25μl的反应中进行PCR反应,该反应包含最终浓度为1XHF缓冲液、300μM每种dNTP、0.3μM每种正向和反向引物、0.5单位1X高保真度DNA聚合酶(ThermoFisher Scientific,马萨诸塞州沃尔瑟姆)。一般PCR条件是98℃持续2分钟,然后是98℃持续10秒、55°-62℃持续30秒(取决于引物Ta)和72℃持续30秒的35个循环,然后在72℃下最终延伸10分钟并保持在4℃下。PCR产物在1.5%琼脂糖凝胶上运行并且在Alpha成像仪EC(Alpha Innotech,加利福尼亚州圣莱安德罗)上使用核酸染色剂(Biotium,Hayward,CA)进行可视化。
(7)克隆
根据制造商的方案,使用4μl的PCR产物,使用Zero Blunt TOPO PCR克隆试剂盒(Invitrogen,加利福尼亚州卡尔斯巴德)来克隆PCR片段。使用化学转化方案将连接的载体转化到Top10 One Shot化学感受态细胞(Invitrogen,加利福尼亚州卡尔斯巴德)中。将转化的大肠杆菌细胞铺在含有50μg/ml卡那霉素的LB琼脂平板上,并将平板在37℃下孵育过夜。
(8)菌落PCR
使用带有M13正向引物和反向引物的PCR来筛选含有重组质粒的菌落。在Veriti热循环仪(Applied Biosystems,加利福尼亚州卡尔斯巴德)中,在15μl体积中进行PCR反应,所述体积包含60mM的Tris-SO4(pH 8.9)、18mM硫酸铵、2.0mM硫酸镁、0.2mM每种dNTP、0.2μM每种正向引物和反向引物、0.3单位的铂Taq高保真度(Invitrogen,加利福尼亚州卡尔斯巴德)挑取菌落并接种到PCR反应中,然后接种50μl的LB-卡那霉素。菌落PCR条件为94℃持续2分钟,然后是94℃持续30秒、50℃持续30秒和68℃持续1分钟的35个循环,然后在68℃下最终延伸10分钟并保持在4℃下。PCR产物在1.5%琼脂糖凝胶上运行并且在Alpha成像仪EC(Alpha Innotech,San Leandro,CA)上使用核酸染色剂(Biotium,加利福尼亚海沃德)进行可视化。对产生预期大小的产物的菌落PCR反应进行测序。
(9)测序
使用2μl的高通量ExoSAP-IT(Affymetrix,Santa Clara,CA)通过酶促处理来制备5微升的每种PCR产物用于测序。反应在37℃下孵育15分钟,然后在80℃下孵育15分钟。使用BigDye终止子v3.1循环测序试剂盒(Applied Biosystems,加利福尼亚州卡尔斯巴德)标记模板用于测序如下:将2μl的模板和2μl的0.8μM测序引物加入到在10μl反应中的BigDyeTerminator测序缓冲液、BigDye终止子v3.1就绪反应混合物和水的混合物中。BigDye测序反应条件如下:96℃持续1分钟,然后是96℃持续10秒,50℃持续5秒,和60℃持续75秒的25个循环。使用BigDye XTerminator纯化试剂盒(Applied Biosystems,Carlsbad,CA)移除未整合的BigDye终止子。使用Applied Biosystems 3500遗传分析仪(Applied Biosystems,Carlsbad,CA)对反应进行测序。
(10)序列比对
将来自ABI 3500遗传分析仪的序列文件导入Sequencher v4.8 Build 3767(GeneCodes,Ann Arbor,MI)中。使用修剪载体工具修剪载体序列。然后将序列自动对齐并手动编辑以用于测序人工制品。
实例2:鉴定枯萎病(FW)抗性基因与枯萎病(FW)敏感基因之间的结构差异
在本实例中,如下所述,通过分析从GenBank检索的DNA序列发现了枯萎病抗性基因。来自几种香蕉物种(即阿宽蕉、小果野蕉、芭蕉、地涌金莲、野蕉)的核苷酸序列被下载。阿宽蕉FusR1序列是从多个种质(ITC1526、ITC1571和PT-BA-00223)获得的,所有这些种质都具有FW抗性。标记为‘FW-抗性’的小果野蕉FusR1序列是从多个FW抗性种质(包括ITC0896(M.a.subspecies banksii)和PT_BA-00281(Pisang Bangkahulu))获得的。标记为“敏感”的小果野蕉序列来自FW敏感种质(ITC0507、ITC0685、PT-BA-00304、PT-BA-00310和PT-BA-00315)。这些种质包括来自香蕉栽培品种的多个样品,例如Pisang Madu、Pisang Pipit和Pisang Rojo Uter,所有这些都被充分表征为FW敏感的(Chen等人,2019)。野蕉序列是从几个FW敏感的种质(包括ITC1016、ITC0545、ITC0080和ITC0565)获得的。来自芭蕉的FusR1来自FW抗性种质(ITC0061和PD#3064)。然后将自动化生物信息学分析应用于每个成对比较,并且仅保留那些包含产生进化上显著变化的核苷酸变化(或多个变化)的序列用于进一步分析。这使得能够鉴定已经被进化以赋予某些进化优势的基因以及鉴定特定的进化变化。
可以采用几种不同的分子进化分析或Ka/Ks类型方法中的任何一种来定量和定性地评估来自相关物种的同源基因序列之间的鉴定的核苷酸变化的进化意义(Kreitman和Akashi,1995;Li,1997)。例如,蛋白质上的阳性选择(即分子水平的适应性进化)可以通过成对比较每个非同义位点的非同义核苷酸取代(Ka)与每个同义位点的同义取代(Ks)的比率而在蛋白质编码基因中被检测到(Li等人.1985;Li,1993)。可以使用Ka和Ks的任何比较,尽管将这两个变量作为比率进行比较是特别方便和最有效的。使用标准统计方法,通过展示Ka与Ks之间的统计显著差异来鉴定序列。
在一些方面,Li等人(1993)的Ka/Ks分析用于实施本公开,尽管也可以使用可以检测物种之间的阳性选择基因的其他分析程序(Li等人.1985;Li,1993;Messier和Stewart,1997;Nei,1987)。
Ka/Ks方法(其包括将基因的同源蛋白质编码区域之间的每个非同义位点的非同义取代率与每个同义位点的同义取代率在比率方面进行比较)用于鉴定在进化期间可能由适应性选择而不是中性取代驱动的序列取代。同义(“沉默”)取代是由于遗传密码的简并性对编码的氨基酸序列没有改变的取代;非同义取代导致氨基酸替换。每种类型变化的程度可以分别被估计为Ka和Ks,即每个同义位点的同义取代的数目和每个非同义位点的非同义取代的数目。Ka/Ks的计算可以手动或通过使用软件进行。合适的程序的实例是Li93(Li,1993)或MEGA X:跨计算平台的分子进化遗传学分析(Molecular Evolutionary GeneticsAnalysis Across Computing Platforms)(Kumar等人,2018)。
为了估计Ka和Ks,使用完整或部分蛋白质编码序列来计算同义取代和非同义取代以及非同义位点和同义位点的总数。分析的多核苷酸序列的长度可以是任何合适的长度。优选地,比较整个编码序列以便确定任何和所有的显著变化。公开可用的计算机程序,例如Li93(Li,1993)或MEGA X:跨计算平台的分子进化遗传学分析(Kumar等人,2018)可以用于计算所有成对比较的Ka和Ks值。
这种分析可以进一步适用于以“滑动窗口”的方式检查序列,使得少量的重要变化不会被整个序列掩盖。“滑动窗口”是指对基因的连续的、重叠的子部分进行检查(子部分可以是任何长度)。
非同义和同义取代率的比较通常由Ka/Ks比率表示。Ka/Ks已被证明是适应性进化在研究的序列中起作用的程度的反映。编码序列的全长或部分区段可以用于Ka/Ks分析。Ka/Ks比率越高,序列经历适应性进化的可能性就越大,并且非同义取代在进化上具有显著意义。参见,例如,Messier和Stewart(1997)。
Ka/Ks比率显著大于一(1.0)强烈表明,阳性选择具有固定的氨基酸替换的数量,该数量大于可以仅由偶然因素引起的预期数量,并且这与最常观察到的比率小于或等于1的模式形成对比(Nei,1987;Hughes和Nei,1988;Messier和Stewart,1994;Kreitman和Akashi,1995;Messier和Stewart,1997)。小于1的比率通常表示阴性选择或纯化选择的作用,表明在功能性的有效蛋白质的一级结构上存在保持不变的强大压力。
用于计算Ka/Ks比率的所有方法都基于对来自相关物种的同源基因的蛋白质编码区的每个非同义位点的非同义取代的数目与每个同义位点的同义取代的数目的成对比较。每种方法实施不同的校正以用于估计“多重命中”(即,在同一位点处多于一个核苷酸取代)。对于DNA序列如何随进化时间变化,每种方法也使用不同的模型。因此,优选地,来自不同算法的结果的组合用于增加检测阳性选择基因的灵敏度水平和结果的置信度。
应当理解,本文所述的方法可以导致与香蕉蛋白质编码序列功能上相关的香蕉多核苷酸序列的鉴定。此类序列可以包括但不限于非编码序列或不编码蛋白质的编码序列。例如,这些相关的序列可以在物理上与香蕉基因组中的香蕉蛋白质编码序列相邻,例如内含子或5'-和3'-侧翼序列(包括控制元件,例如启动子和增强子)。这些相关的序列可以通过搜索公共基因组数据库例如GenBank获得,或者可替代地,通过以蛋白质编码序列作为探针筛选和测序合适的基因组文库获得。
在鉴定候选基因后,通过标准DNA测序技术仔细地验证每个直系同源基因对中基因的核苷酸序列,然后对每个仔细测序的候选基因对重复Ka/Ks分析。更具体地说,该软件运行了来自栽培的香蕉、小果野蕉(AAA亚群香芽蕉)的每个基因的推定直系同源物与来自野生物种的直系同源物之间的所有可能的成对比较,寻找高Ka/Ks比率。软件BLASTed(以自动化方式)将来自栽培的香蕉的每个mRNA序列与转录组中从野生近缘种(例如野蕉)测序的每个序列进行比较。然后该软件对每个基因对(即直系同源物的每个集合)进行Ka/Ks分析,标记具有高Ka/Ks评分的基因对。
然后,该软件将每个栽培的香蕉序列与另一个野生近缘种(例如芭蕉)的每个序列进行比较,再次通过进行一系列BLAST然后筛选高Ka/Ks评分。因此,它对所有连续野生物种的转录组序列都是如此。这为后续分析提供了候选物的集合(参见下文)。该软件接下来将野蕉的转录组中的每一个基因序列与芭蕉的每一个序列进行比较,再次通过进行一系列的BLAST,然后筛选高Ka/Ks评分。因此,它最终将每一个香蕉物种的利用的cDNA文库中所代表的所有表达基因与每一个其他香蕉物种(野生型和栽培型)的所有基因进行了比较,目的是找到每一个显示出阳性选择的证据的基因。
然后,将出现的标记的基因对在实验室中单独和仔细地重新测序,以检查原始高通量读数的准确性,以消除假阳性。
接下来,检查每一个具有高Ka/Ks评分的剩余的候选基因对,以确定该比较是真正的直系同源的,还是仅仅是由旁系同源比较引起的人工假阳性。
使用上述方法,分析了GenBank中可用的香蕉基因序列,以鉴定本领域中的香蕉物种中未与FW抗性性状相关的阳性选择基因。发明人鉴定并选择了预期会产生FW抗性的该基因,然后将其命名为镰刀菌抗性1(FusR1)。值得注意的是,发明人发现来自高度抗性野生香蕉近缘阿宽蕉的FusR1直系同源物与来自FW敏感的香芽蕉(小果野蕉)的FusR1之间的3.6的异常高的Ka/Ks比率。
发明人从芭蕉属、地涌金莲(Musella)和象腿蕉属(Ensete)的属中获得了许多类型的香蕉的种质,包括香蕉栽培品种和地方品种,以及野生(未驯化的)香蕉品种。这三个属包括香蕉科芭蕉科。发明人付出了大量的努力来获得小果野蕉(“A”-基因组)和野蕉(“B”-基因组)种质的多个样品,以充分地采样香蕉的分类和地理多样性。发明人获得了大多数acuminata亚种的种质。此外,对于外群分析,发明人从已知与芭蕉科密切相关的植物科中获得了植物种质。
众所周知,一些B组香蕉物种/品种对Foc-TR4高度敏感(Chen等人,2019),即使有时显示出期望的农艺性状例如耐旱性。A基因组的香蕉显示出一系列的镰刀菌抗性、耐受性和敏感性,这取决于特定物种或栽培的品种。因此,许多野生香蕉品种和栽培的香蕉品种已经被仔细和严格地表征了对TR4的抗性、耐受性或敏感性(Li等人,2012,Ssali等人,2013,Li等人,2015,Wu等人,2016,Ribeiro等人,2018,Niu等人,2018以及Zuo等人.2018)。
只要有可能,发明者都会选择制备RNA(用于转化为cDNA)和基因组DNA(gDNA)。大多数种质以新鲜的样品、冷冻的样品或冻干的样品的形式获得,并且这通常允许成功的RNA提取。对于一些样品,特别是当较老或部分降解时,只能分离出gDNA。如表1和序列表中所述,本文提供了许多芭蕉属、地涌金莲和象腿蕉属和外群物种的mRNA序列和/或仅编码序列、内含子序列和一些序列(参见序列表)。方法的详细描述在实例1的方法和材料部分中给出。
栽培的香蕉是B基因组香蕉(野蕉组)与A基因组香蕉(小果野蕉组)之间杂交事件的产物。众所周知,一些B组香蕉物种/品种对Foc-TR4敏感(Chen等人,2019),即使有时具有期望的农艺性状例如耐旱性(REF)。相比之下,A基因组的香蕉显示出一系列的镰刀菌抗性、耐受性和敏感性,这取决于特定的物种或栽培品种。一些A基因组物种(例如阿宽蕉和芭蕉)已被证明对Foc-TR4具有极强的抗性(Li等人,2015;Wu等人,2016),而一些A基因组栽培品种如香芽蕉对镰刀菌极其敏感。
对这些序列的分析揭示了重要的结果;也就是说,所有已经被表征为镰刀菌抗性的“A”基因组香蕉物种(或栽培的香蕉品种)都共享属于共同组的FusR1序列,而镰刀菌敏感的香蕉物种/品种属于不同的组。引人注目的是,发明人检查的每一个B基因组种质都是“FW敏感的”,并且来自B基因组种质的所有FusR1序列都以某种方式被破坏和/或损坏,具有编码序列碱基对缺失的某种组合。通常,缺失的尺寸是长的,例如82或85bp,然而,发明人还发现了一致的单个碱基缺失。这些缺失通过破坏阅读框来改变推断的蛋白质序列,通常导致截短的蛋白质。此外,所有B基因组FusR1编码序列都包含未剪接的84bp内含子,其通常与85bp缺失一起出现。
对于A基因组香蕉,发明人发现已知对Foc-TR4具有抗性的A基因组种质都共享共同的FusR1序列组,而Foc-TR4敏感的A-基因组种质都共享不同的FusR1序列组。
这是强有力的证据表明FusR1是观察到的镰刀菌抗性与镰刀菌敏感物种之间的疾病抗性模式的原因。本实例中的分析表明,与对镰刀菌小种4敏感性不同的抗性与FusR1序列差异密切相关。
对这一点的另外的支持来自我们对少数已经被表征为“枯萎病耐受性”的香蕉物种的检查。这些物种都具有属于第三序列组的FusR1序列,它们都介于镰刀菌抗性和镰刀菌敏感序列组之间。
在20世纪50年代,当镰刀菌(巴拿马病)小种1对大米歇尔构成重大威胁时,香蕉产业被迫从其主要栽培品种大米歇尔转变为香芽蕉栽培品种。香芽蕉(其是大米歇尔的半同胞(两者都是“A”基因组物种))被发现对小种1具有抗性。因此,密切相关的香芽蕉和大米歇尔栽培品种对各种镰刀菌小种显示出不同的抗性概况。(两者都对Foc-TR4敏感,这是目前对香蕉产业的威胁。)
发明人对来自许多小果野蕉种质的FusR1进行了测序。在每种情况下,如实例1中所描述的,发明人克隆了FusR1基因,然后对FusR1基因的多个克隆进行测序。这些小果野蕉种质中的一些已经被充分表征了枯萎病抗性/敏感性。发明人发现小果野蕉FusR1的三个等位基因。关键的观察是所有枯萎病抗性的种质共享相似的FusR1序列。来自FW抗性小果野蕉种质的两个FusR1等位基因是枯萎病抗性FusR1等位基因或简称为“抗性等位基因”(SEQ IDNO:8和SEQ ID NO:10)。相比之下,所有FW敏感的小果野蕉种质共享不同的等位基因,其被称为枯萎病敏感的FusR1等位基因(SEQ ID NO:13)。FW抗性FusR1等位基因与FW敏感等位基因的不同之处仅在于几个关键的核苷酸取代。(参见图1)。这强烈地表明枯萎病抗性/敏感性受香蕉植物携带的特定FusR1等位基因的控制。
实例3:香蕉的抗性育种
FW敏感的香芽蕉栽培品种((小果野蕉;AAAA)的四倍体版本是可用的或者可以通过大型授粉/育种项目开发,这些项目侧重于创建、鉴定和分离所产生的相对较低百分比的四倍体后代(例如,Aguilar Morán,J.F.,2013,通过常规育种改良香芽蕉栽培品种(Improvement of Cavendish Banana cultivars through conventional breeding),Acta Hortic.986:205-208;Jenny等人,Jacome等人编辑,《香蕉的球腔菌属叶斑病:现状与展望(》,2002年5月20日至23日在哥斯达黎加圣何塞举行的第二届球腔菌属叶斑病国际研讨会记录,第4次会议,第199-208页)或者通过使二倍体AA基因型经受体外多倍体化(Amah等人,2019年11月,《植物科学前沿》,第10卷,文章1450,12页).
小果野蕉的种斑克木的FW抗性FusR1(AA)的二倍体版本可以使用本领域技术人员已知的方法被鉴定或开发(例如,Bakry等人,第1章,“香蕉的遗传改良”,50页,育种种植树木作物:热带物种中,2009)。针对SEQ ID NO:8和/或SEQ ID NO:10(mRNA序列)的存在筛选所得的二倍体。
四倍体FW敏感的香芽蕉植物(例如“Naine”或“威廉斯”栽培品种的四倍体)可以在与用作母本的二倍体FW抗性FusR1小果野蕉的种斑克木植物(例如二倍体‘ITC0896’)杂交时用作父本。
筛选大量所得后代的三倍体植物(AAA),包括SEQ ID NO:8和/或SEQ ID NO:10(mRNA序列),并且随后评估农艺性状。
全部所得的/选择的具有TR4抗性的香蕉植物都可以通过无性繁殖维持并用于生产或随后的育种项目。
实例4:用于植物转化的材料和方法
香蕉转化系统将使用选定香蕉品系的无菌材料。将使用各种组织培养和转化方法来增加成功的可能性。参见,例如,在以下中描述的转化方案:Ploetz(2015,《植物病理学》105:1512-1521),美国专利号7,534,930;美国专利号6,133,035;Sagi等人,《生物技术》13,481-485,1995;May等人,《生物技术》13,485-492,1995;Vishnevetsky等人,《转基因研究》20(1):61-71,2011;Paul等人.(2011);Zhong等人,《植物生理学》.110,1097-1107,1996;Dugdale等人,《普通病毒学杂志》79:2301-2311,1998;Mohan和Swennen(编辑),2004,《香蕉改良:细胞、分子生物学和诱导的突变》,学术出版社有限公司;以及Remy等人,2013,《转基因香蕉:过去、现在和未来》,Acta Horticulturae 974:71-80,其每一个通过引用明确地以其整体并入本文。
这些方法将侧重于组织培养条件、鉴定用于再生/激发的不同组织类型、培养基配方、农杆菌菌株、选择盒、构建对照和递送载体、基因递送、选择性的标记物以及用于DNA递送和转化的靶组织/细胞底物。初步实验将使用视觉标记物和选择盒来部署对照载体,以快速优化实验方向并筛选潜在的转基因事件。平行实验将针对优化转化效率和使用感兴趣的基因(GOI)。
将对培养基配方、载体和转化过程进行修改,以提高过程和转化效率。包含感兴趣的关键基因的转化载体将继续被转化以产生额外的过表达或敲除事件。必要时待使用的载体包括但不限于多基因堆叠载体、多顺反子基因载体和多gRNA CRISPR编辑载体,用于在香蕉中测试功效。将对T0事件进行测试以显示选择性的标记物基因或GOI的存在和拷贝数。此外,mRNA表达分析将根据需要用于任何关键的GOI。推定的转变的植物材料将用于随后的测试或分析。
CRISPR技术在本文其他地方被详细地描述,包括对使用CRISPR编辑植物基因组(例如香蕉基因组)的组合物和程序的参考。在WO 2019/118342(PCT/US2018/064735)、WO2018/220581(PCT/IB2018/053903)和US 2019/0032070(US 16/072,706)(其每一个通过引用具体地和整体地并入本文)中分别提供了用于利用CRISPR敲除植物中产生感兴趣的表型(例如对真菌病原体如镰刀菌的抗性)的基因的详细组合物和程序。
一旦用于敲除候选基因(例如,内源性FW敏感的FusR1基因)的靶位点被计算机筛选和选择,在感兴趣的植物中发现的候选基因中的靶向突变的CRISPR/Cas9载体将被构建成用于将载体转化到感兴趣的植物中(即FW敏感的香蕉栽培品种,例如广泛生长的三倍体、不育的香芽蕉品种及其后代)。
将使用本领域中已知的农杆菌介导的方案(参见例如Ma等人,2015)和/或由发明人开发或精制的农杆菌介导的方案,将CRISPR/Cas9载体转化到感兴趣的植物中,例如香蕉栽培品种,特别是FW敏感香蕉。将相应地进行转化植物的组织培养和再生。
将再生和测试具有CRISPR/Cas9载体的转化植物,以验证CRISPR/Cas9载体引入到感兴趣的植物细胞中。作为用于诱导插入缺失的对照,在本实验中也将使用表达野生型Cas9的构建体。
将在所有转化的植物中检查候选基因的敲除。将通过(1)PCR以检查候选基因的抑制和/或沉默,或(2)PCR扩增和随后的桑格测序和/或高通量深度测序来研究敲除。此外,将通过使用质谱法进行蛋白质测序来分析由引入的向靶基因组区域的移框引起的氨基酸取代。
获得的转化植物将在受控的温室和/或田间条件下生长。用感兴趣的氨基酸插入、缺失或取代验证的转化植物将观察到对FW、巴拿马病或被尖孢镰刀菌古巴专化型热带小种4感染的增强的抗性。
实例5:香蕉转化
易感尖孢镰刀菌小种4(又名热带小种4或TR4)的香蕉植物可以通过使用实例4中提供的香蕉转化技术和如本文提供的编码TR4抗性的FusR1核苷酸序列用编码抗性的核苷酸序列转化它们而被转化成TR4抗性植物。例如,TR4易感的香芽蕉栽培品种可以用如本文提供的编码TR4抗性的FusR1等位基因之一来转化。作为另外的实例,TR4易感的香芽蕉栽培品种可以用一个或多个以下编码TR4抗性的核苷酸编码序列转化:SEQ ID NO:2、SEQ IDNO:5、SEQ ID NO:9SEQ ID NO:11、SEQ ID NO:18、SEQ ID NO:21和/或SEQ ID NO:24。
例如,香芽蕉栽培品种‘大矮蕉’(AAA)可以使用美国专利号7,534,930((‘转基因抗病香蕉(Transgenic Disease Resistant Banana)’),其公开的所有内容均以其整体并入本文)中阐述的转化方案用SEQ ID NO 2、SEQ ID NO 5、SEQ ID NO 9和/或SEQ ID NO 11进行转化。
总之,香芽蕉栽培品种(例如‘大矮蕉’和‘威廉斯’)的未成熟的雄花,用于产生胚胎发生愈伤组织。构建了与35S启动子序列可操作地连接的核酸构建体,所述核酸构建体包含SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO 11、SEQ ID NO:18、SEQ ID NO:21和/或SEQ ID NO:24。或者,可替代地,来自小果野蕉的FusR1的FW抗性等位基因1的启动子序列(SEQ ID NO 31)可以用于驱动抗性等位基因的表达。使用微弹射物轰击将该构建体引入到胚胎发生愈伤组织中。从胚胎发生愈伤组织中再生被轰击的小植株,并且小植株经历PCR分析以确定哪些小植株被用TR4抗性基因转化。测试来自所得到的阳性表达TR4抗性基因的植物的组织培养提取物抑制TR4生长的能力。此外,测试推定的转化植物对TR4的抗性。TR4抗性植物被分离和克隆。TR4抗性植物可以用于育种项目以转移抗性基因,如实例3中所述。
在转化的植物表达SEQ ID NO 2或SEQ ID NO 5;并且,还表达SEQ ID NO:9或SEQID NO:11的情况下,鉴定转化的植物包含编码TR4抗性的两种不同核酸,则该转化的植物将具有对TR4的堆叠的抗性基因。如上所讨论的和在表1中呈现的,SEQ ID NO:2和SEQ ID NO:5分别是FusR1等位基因1和等位基因2编码序列,其编码如从阿宽蕉获得的抗性。相比之下,SEQ ID NO:9和SEQ ID NO:11分别是FusR1等位基因1和等位基因2编码序列,其编码从小果野蕉的种斑克木获得的抗性。因此,表达两种类型抗性基因的转化植物将对巴拿马病热带小种4具有堆叠的或金字塔形的抗性。
所有得到的/选择的对TR4具有抗性的香蕉植株都可以通过无性繁殖维持并用于生产或随后的育种项目。
实例6:从包含抗性的栽培品种开始的香蕉转化
可以使用实例5中概述的程序来生产对巴拿马病热带小种4具有抗性的转化的香蕉植物,其中初始的未转化的植物也具有对TR4和/或对一种或多种另外的疾病的抗性。以这种方式,所得到的转化植物可以具有多个或堆叠的抗性基因。例如,在实例5的转化程序中使用的起始栽培品种可以是具有抗性基因RGA2的香芽蕉栽培品种(Dale等人,2017)。因此,可以转化包含RGA2编码序列的香芽蕉栽培品种以表达SEQ ID NO:2、SEQ ID NO:5、SEQID NO:9和/或SEQ ID NO:11、SEQ ID NO:18、SEQ ID NO:21和/或SEQ ID NO:24,从而具有对TR4的堆叠的抗性基因。
所有所得到的/选择的对TR4具有抗性的香蕉植物都可以通过无性繁殖维持并用于生产或随后的育种项目。
实例7:敲除FusR1易感性基因的表达
除了根据实例5或实例6转化植物之外,或者替代地代替根据实例5或实例6转化植物,可以使用TALEN、巨型核酸酶、锌指核酸酶、CRISPR相关核酸酶或其它合适的基因编辑工具来敲除编码对小果野蕉(例如SEQ ID NO:14)中的TR4易感性的FusR1等位基因的核苷酸序列。
在一种这样的方法中,向导RNA可以与合适的CRISPR相关核酸酶一起使用,包括其中向导RNA包含与SEQ ID NO:14的全部或部分序列互补的可变靶向结构域。例如,可以使用修饰的SEQ ID NO:14将双链断裂引入到香蕉细胞中编码小果野蕉(SEQ ID NO:14)中的FW敏感的FusR1等位基因的内源性序列中,其中修饰的SEQ ID NO 14包含敲除SEQ ID NO:14的基因功能的核酸改变。
关于如何在植物中构建和使用此类CRISPR相关核酸酶和向导RNA的细节,参见例如美国专利申请公开号2019/0032070A1和WO 2019/118342 A1,其每一个通过引用以其整体并入。对于在香蕉中使用CRISPR作为基因编辑工具,包括沉默疾病易感性基因,参见,例如,WO 2018/220581A1(“用于提高香蕉货架期的组合物和方法(Compositions andMethods for Increasing Shelf-Life of Banana)”);Tripahi等人,2019,“芭蕉的B基因组中的内源性香蕉条纹病毒的CRISPR/Cas9编辑克服了香蕉育种中的主要挑战(CRISPR/Cas9 editing of endogenous banana streak virus in the B genome of Musaspp.overcomes a major challenge in banana breeding)”,《生物学通讯(Communications Biology)》,2,文章46,11页;和Ntui等人,2020年1月,“用于香蕉和大蕉(芭蕉)的稳健的CRISPR/Cas9介导的基因组编辑工具(Robust CRISPR/Cas9 mediatedgenome editing tool for banana and plantain(Musa spp.))”,第21卷,10页。
经修饰的植物细胞可以产生/再生为可以通过无性繁殖维持的香蕉植物。
对TR4敏感性敲除的所有所得到的/选择的香蕉植物可以通过无性繁殖被维持,并且用于生产或后续育种项目。
实例8:对TR4敏感的香蕉的基因编辑
通过使用实例4中提供的香蕉基因编辑技术和如本文提供的编码TR4抗性的FusR1核苷酸序列,使用基因靶向/基因编辑工具将编码易感性的内源性核酸序列改变为编码抗性的核苷酸序列,可以将对尖孢镰刀菌小种4(又名热带小种4或TR4)易感的香蕉植物修饰成TR4抗性植物。例如,可以基于如本文提供的编码TR4抗性的FusR1等位基因之一的核酸序列来改变在香芽蕉栽培品种中编码TR4易感性的内源性核酸序列。作为另外的实例,可以基于以下编码TR4抗性的核苷酸编码序列中的一个或多个来改变在香芽蕉栽培品种中编码TR4易感性的核酸序列:SEQ ID NO 2、SEQ ID NO 5、SEQ ID NO 9、SEQ ID NO 11、SEQ IDNO:18、SEQ ID NO:21和/或SEQ ID NO:24。
例如,香芽蕉栽培品种‘大矮蕉’(AAA)可以使用现代基因编辑工具基于如本文所述的编码对TR4的抗性的核酸序列(即,基于SEQ ID NO 2、SEQ ID NO 5、SEQ ID NO 9、SEQID NO 11、SEQ ID NO:18、SEQ ID NO:21和/或SEQ ID NO:24)进行修饰。参见图1。
在一些一般的实例中,基于其与SEQ ID NO 2、SEQ ID NO 5、SEQ ID NO、SEQ IDNO 11、SEQ ID NO:18、SEQ ID NO:21、和/或SEQ ID NO:24的FW抗性FusR1基因的比对,SEQID NO 14的内源性FW易感性FusR1基因被一种或多种下列变化修饰。参见图1。
在一些具体的实例中,基于其与SEQ ID NO 9的比对(参见序列比对,图1),SEQ IDNO 14通过以下变化被修饰:对应于位置148的T用G替换(148T>G);对应于位置323的T用A替换(323T>A);对应于位置344的G用C替换(344G>C);和/或,对应于位置347的A用T替换(347A>T)。在一个实例中,唯一进行的取代是344G>C。在一个实例中,进行以下三种取代:323T>A、344G>C和347A>T。在又一个实例中,进行所有四种取代:148T>G、323T>A、344G>C和347A>T。参见图1。
在一些一般的实例中,对编码FW易感FUSR1蛋白的核酸序列进行任何和所有核酸取代,使得所得到的经修饰的核酸编码FW抗性FUSR1蛋白。参见图1和图2。
在一些具体的实例中,编码SEQ ID NO:15的FW易感FUSR1蛋白的内源性核酸序列基于其与SEQ ID NO:12的FW抗性FUSR1蛋白的比对通过一个或多个核酸变化被修饰以产生以下蛋白质变化:对应于位置50的亮氨酸用缬氨酸替换(50L>V);对应于位置108的缬氨酸用谷氨酸替换(108V>E);在位置115处的精氨酸用脯氨酸替换(115R>P);和/或,在位置116处的天冬氨酸用缬氨酸替换(116D>V)。在一个实例中,唯一进行的蛋白质取代是115R>P。在另一个实例中,唯一进行的蛋白质取代是108V>E、115R>P和116D>V。在又一个实例中,进行所有四种蛋白质取代:50L>V、108V>E、115R>P和116D>V。参见图2。
来自以下出版物的香蕉特异性基因编辑方案提供了在香蕉中进行必要的核苷酸碱基对取代的方案:Shao等人,2020,“使用CRISPR/Cas9基因组编辑系统创建MaGA20ox2基因修饰的半矮秆香蕉(Using CRISPR/Cas9 genome editing system to createMaGA20ox2 gene-modified semi-dwarf banana)”,《植物生物技术杂志》,18:17-19;Kaur等人,2017,“CRISPR/Cas9介导的在八氢番茄红素去饱和酶(PDS)中的高效编辑证明了香蕉cv.Rasthali基因组的精确操作(CRISPR/Cas9-mediated efficient editing inphytoene desaturase(PDS)demonstrates precise manipulation in bananacv.Rasthali genome)”,《功能和整合基因组学(Functional&Integrative Genomics)》,18(1):89-99;Otang等人,2020,“用于香蕉和大蕉(芭蕉)的稳健的CRISPR/Cas9介导的基因组编辑工具”,《当前植物生物学(Current Plant Biology)》,21,10页;Tripathi等人,2019,“芭蕉的B基因组中的内源性香蕉条纹病毒的CRISPR/Cas9编辑克服了香蕉育种中的主要挑战”,《生物学通讯》,2:46,11页;以及美国专利号7,381,556,其每一个教导的所有内容均通过引用完全并入本文。
总之,香芽蕉栽培品种(例如‘大矮蕉’或‘威廉斯’)的未成熟的雄花用于产生胚胎发生愈伤组织和/或胚胎发生细胞悬浮液。CRISPR/Cas9构建体按照上述任何一个或多个科学和专利出版物中的程序概述来制备,其中该构建体是基于图1中提供的序列比对构建的。将构建体递送到胚胎发生愈伤组织或胚胎发生细胞悬浮液中,并产生根良好的小植株。使用引物通过PCR选择随机再生并筛选Cas9基因的存在。将Cas9 PCR阳性事件和对照植物的根良好的小植株驯化并在温室中进行盆栽。进行分子分析以确认内源性FusR1基因中的基因编辑。
对基因组编辑的植物和对照植物进行农艺性状评估并评估TR4抗性。克隆所得到的基因编辑的植物,这些植物阳性地表达TR4抗性蛋白并表现出对TR4的抗性。基因编辑的TR4抗性植物可以用于育种项目以转移抗性基因,如实例3中所述。
所有所得到的/选择的对TR4具有抗性的香蕉植株都可以通过无性繁殖被维持并被用于生产或随后的育种项目。
本公开的进一步编号的实施例
本发明所考虑的其他的主题在以下编号的实施例中阐述:
1.一种分离的核酸分子,所述分离的核酸分子包含当在植物中表达时编码对尖孢镰刀菌小种4的易感性的核酸序列SEQ ID NO:14,其中SEQ ID NO:14通过一个、两个、三个或四个核酸取代被修饰,使得所得到的核酸序列当在植物中表达时编码对尖孢镰刀菌小种4的抗性。
2.根据实施例1所述的分离的核酸分子,其中所述核酸取代包括用G替换对应于SEQ ID NO:14的位置148的T(148T>G)。
3.根据实施例1所述的分离的核酸分子,其中所述核酸取代包括用A替换对应于SEQ ID NO:14的位置323的T(323T>A)。
4.根据实施例1所述的分离的核酸分子,其中所述核酸取代包括用C替换对应于SEQ ID NO:14的位置344的G(344G>C)。
5.根据实施例1所述的分离的核酸分子,其中所述核酸取代包括用T替换对应于SEQ ID NO:14的位置347的A(347A>T)。
6.根据实施例1所述的分离的核酸分子,其中所述核酸取代包括用A替换对应于位置323的T(323T>A),用C替换对应于位置344的G(344G>C),和用T替换对应于位置347的A(347A>T),并且其中所有位置均基于SEQ ID NO:14。
7.根据实施例1所述的分离的核酸分子,其中SEQ ID NO:14编码SEQ ID NO:15的氨基酸序列并且其中所述核酸取代导致用缬氨酸替换对应于SEQ ID NO:15的位置50的亮氨酸(50L>V)。
8.根据实施例1所述的分离的核酸分子,其中SEQ ID NO:14编码SEQ ID NO:15的氨基酸序列并且其中所述核酸取代导致用谷氨酸替换对应于SEQ ID NO:15的位置108的缬氨酸108V>E)。
9.根据实施例1所述的分离的核酸分子,其中SEQ ID NO:14编码SEQ ID NO:15的氨基酸序列并且其中所述核酸取代导致用脯氨酸替换对应于SEQ ID NO:15的位置115的精氨酸115R>P)。
10.根据实施例1所述的分离的核酸分子,其中SEQ ID NO:14编码SEQ ID NO:15的氨基酸序列并且其中所述核酸取代导致用缬氨酸替换对应于SEQ ID NO:15的位置116的天冬氨酸(116D>V)。
11.根据实施例1所述的分离的核酸分子,其中SEQ ID NO:14编码SEQ ID NO:15的氨基酸序列并且其中所述核酸取代导致用谷氨酸替换对应于SEQ ID NO:15的位置108的缬氨酸(108V>E)、用脯氨酸替换对应于SEQ ID NO:15的位置115的精氨酸(115R>P)和用缬氨酸替换对应于SEQ ID NO:15的位置116的天冬氨酸(116D>V)。
12.根据实施例1-11所述的分离的核酸分子,其中所述表达发生在植物细胞、植物组织、植物细胞培养物、植物组织培养物或整株植物中。
13.根据实施例12所述的分离的核酸分子,其中所述表达发生在芭蕉属细胞、组织、细胞培养物、组织培养物或整株植物中。
14.根据实施例13所述的分离的核酸分子,其中所述表达发生在小果野蕉细胞、组织、细胞培养物、组织培养物或整株植物中。
15.一种包含实施例1-11所述的分离的核酸分子的核酸构建体,其中所述核酸序列被可操作地连接至能够驱动所述核酸序列的表达的启动子。
16.根据实施例15所述的核酸构建体,其中所述启动子是植物启动子。
17.根据实施例15所述的核酸构建体,其中所述启动子是35S启动子。
18.根据实施例15所述的核酸构建体,其中所述启动子由SEQ ID NO:31编码。
19.一种包含实施例15-18所述的核酸构建体的转化载体。
20.一种转化植物细胞的方法,其包括将实施例19的转化载体引入到植物细胞中,由此转化的植物细胞表达编码对尖孢镰刀菌小种4的抗性的核酸序列。
21.根据实施例20所述的方法,其中所述植物细胞是芭蕉属植物细胞。
22.根据实施例20所述的方法,其中所述植物细胞是小果野蕉植物细胞。
23.根据实施例20-22所述的方法,其进一步包括从转化的植物细胞产生转化的植物组织。
24.根据实施例23所述的方法,其进一步包括从转化的植物组织产生转化的小植株。
25.根据实施例24所述的方法,其进一步包括产生转化的小植株的克隆。
26.根据实施例24或25所述的方法,其进一步包括将转化的小植株或转化的小植株的克隆生长成成熟的转化植物。
27.根据实施例26所述的方法,其中成熟的转化植物是芭蕉属植物并且成熟的转化的芭蕉属植物能够产生果实。
28.根据实施例27所述的方法,其进一步包括产生成熟的转化的芭蕉属植物的克隆。
29.根据实施例27或28所述的方法,其进一步包括在育种方法中使用所述成熟的转化的芭蕉属植物或所述成熟的转化的芭蕉属植物的克隆。
30.一种分离的氨基酸分子,所述分离的氨基酸分子包含编码当在植物中产生时导致对尖孢镰刀菌小种4的易感性的蛋白质的SEQ ID NO:15的氨基酸序列,其中SEQ IDNO:15被一个、两个、三个或四个氨基酸取代修饰,使得其编码当在植物中产生时导致对尖孢镰刀菌小种4的抗性的蛋白质。
31.根据实施例30所述的分离的氨基酸分子,其中所述氨基酸取代包括用缬氨酸替换对应于SEQ ID NO:15的位置50的亮氨酸(50L>V)。
32.根据实施例30所述的分离的氨基酸分子,其中所述氨基酸取代包括用谷氨酸替换对应于SEQ ID NO:15的位置108的缬氨酸(108V>E)
33.根据实施例30所述的分离的氨基酸分子,其中所述氨基酸取代包括用脯氨酸(115R>P)替换对应于SEQ ID NO:15的位置115的精氨酸。
34.根据实施例30所述的分离的氨基酸分子,其中所述氨基酸取代包括用缬氨酸替换对应于SEQ ID NO:15的位置116的天冬氨酸(116D>V)。
35.根据实施例30所述的分离的氨基酸分子,其中所述氨基酸取代包括用谷氨酸替换对应于SEQ ID NO:15的位置108的缬氨酸(108V>E),用脯氨酸替换对应于SEQ ID NO:15的位置115的精氨酸(115R>P),以及用缬氨酸替换对应于SEQ ID NO:15的位置116的天冬氨酸(116D>V)。
36.根据实施例30-35所述的分离的氨基酸分子区段,其中所述产生发生在植物细胞、植物组织、植物细胞培养物、植物组织培养物或整株植物中。
37.根据实施例36所述的分离的氨基酸分子区段,其中所述产生发生在芭蕉属细胞、组织、细胞培养物、组织培养物或整株植物中。
38.根据实施例36所述的分离的氨基酸分子区段,其中所述产生发生在小果野蕉细胞、组织、细胞培养物、组织培养物或整株植物中。
39.一种核酸构建体,所述核酸构建体包含当在植物中表达时编码对尖孢镰刀菌小种4的抗性的核酸序列,其中所述核酸序列选自由SEQ ID NO:2、SEQ ID NO:5、SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:18、SEQ ID NO:21、和SEQ ID NO:24组成的群组,并且其中所述核酸序列与能够驱动所述核酸序列的表达的启动子可操作地连接。
40.根据实施例39所述的核酸构建体,其中所述启动子是植物启动子。
41.根据实施例39所述的核酸构建体,其中所述启动子是35S启动子。
42.根据实施例39所述的核酸构建体,其中所述启动子由SEQ ID NO:31编码。
43.一种包含实施例39-42所述的核酸构建体的转化载体。
44.一种转化植物细胞的方法,其包括将实施例43所述的转化载体引入到植物细胞中,由此转化的植物细胞表达编码对尖孢镰刀菌小种4的抗性的核酸序列。
45.根据实施例44所述的方法,其中所述植物细胞是芭蕉属植物细胞。
46.根据实施例44所述的方法,其中所述植物细胞是小果野蕉植物细胞。
47.根据实施例44-46所述的方法,其进一步包括从转化的植物细胞产生转化的植物组织。
48.根据实施例47所述的方法,其进一步包括从转化的植物组织产生转化的小植株。
49.根据实施例48所述的方法,其进一步包括产生转化的小植株的克隆。
50.根据实施例48或49所述的方法,其进一步包括将转化的小植株或转化的小植株的克隆生长成成熟的转化植物。
51.根据实施例50所述的方法,其中成熟的转化植物是芭蕉属植物并且成熟的转化的芭蕉属植物能够产生果实。
52.根据实施例51所述的方法,其进一步包括产生成熟的转化的芭蕉属植物的克隆。
53.根据实施例51或52所述的方法,其进一步包括在育种方法使用成熟的转化的芭蕉属植物或成熟的转化的芭蕉属植物的克隆。
54.一种香蕉育种方法,其包括将包含编码对尖孢镰刀菌小种4的抗性的核酸序列的第一芭蕉属植物与对尖孢镰刀菌小种4易感的第二芭蕉属植物杂交,并且基于它们对尖孢镰刀菌小种4的抗性选择杂交的所得后代,其中编码对尖孢镰刀菌小种4的抗性的所述核酸序列选自由SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:18、SEQID NO:21、和SEQ ID NO:24组成的群组。
55.根据实施例54所述的香蕉育种方法,其进一步包括产生杂交的所得后代的克隆,其中基于它们对尖孢镰刀菌小种4的抗性来选择所述克隆。
56.根据实施例54所述的香蕉育种方法,其中第一芭蕉属植物和第二芭蕉属植物来自不同的芭蕉属物种。根据实施例54所述的香蕉育种方法,其中第一芭蕉属植物和第二芭蕉属植物来自相同的芭蕉属物种。根据实施例54所述的香蕉育种方法,其中第一芭蕉属植物和/或第二芭蕉属植物是小果野蕉植物。
57.根据实施例54所述的香蕉育种方法,其中使用分子标记物来选择表现出对尖孢镰刀菌小种4的抗性的杂交的后代,所述分子标记物基于编码对尖孢镰刀菌小种4的抗性的核酸序列而设计,所述核酸序列存在于所述杂交中使用的第一芭蕉属植物中。
58.一种用于获得具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物细胞的方法,所述方法包括将双链断裂引入到由SEQ ID NO:14编码的外源性基因中的至少一个位点,以产生具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物细胞。
59.根据实施例58所述的方法,其进一步包括从具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物细胞产生小果野蕉植物,以产生具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物。
60.根据实施例59所述的方法,其进一步包括在香蕉育种项目中使用具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物。
61.根据实施例20或44所述的方法,其中所述植物细胞是实例59所述的具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物细胞。
62.根据实施例58所述的方法,其中所述双链断裂由选自由TALEN、巨型核酸酶、锌指核酸酶和CRISPR相关核酸酶组成的群组的核酸酶诱导。
63.根据权利要求62所述的方法,其中所述双链断裂由CRISPR相关核酸酶诱导并且其中提供了向导RNA。
64.一种用于产生对尖孢镰刀菌小种4的抗性的植物细胞的方法,其包括将至少一种遗传修饰引入到一个或多个编码对尖孢镰刀小种4的易感性的内源性核酸序列中,其中所述遗传修饰赋予所述植物细胞对尖孢镰刀菌小种4的抗性。
65.根据实施例64所述的方法,其中所述至少一种遗传修饰通过TALEN、巨型核酸酶、锌指核酸酶或CRISPR相关核酸酶引入。
66.根据权利要求64所述的方法,其中所述至少一种遗传修饰通过CRISPR相关核酸酶和相关的向导RNA引入。
67.根据实施例64所述的方法,其中所述至少一种遗传修饰选自由以下组成的列表:用G替换对应于SEQ ID NO:14的位置148的T(148T>G),用A替换对应于SEQ ID NO:14的位置323的T(323T>A),用C替换对应于SEQ ID NO:14的位置344的G(344G>C),和用T替换对应于SEQ ID NO:14的位置347的A(347A>T)。
68.根据实施例64所述的方法,其中所述至少一种遗传修饰导致选自由以下组成的群组的氨基酸的改变:用缬氨酸替换对应于SEQ ID NO:15的位置50的亮氨酸(50L>V),用谷氨酸替换对应于SEQ ID NO:15的位置108的缬氨酸(108V>E),用脯氨酸替换对应于SEQID NO:15的位置115的精氨酸(115R>P),和用缬氨酸替换对应于SEQ ID NO:15的位置116的天冬氨酸(116D>V)。
69.根据实施例64-68所述的方法,其中所述植物细胞是芭蕉属植物细胞。
70.根据实施例64-68所述的方法,其中所述植物细胞是小果野蕉植物细胞。
71.根据实施例64-70所述的方法,其进一步包括从转化的植物细胞产生转化的植物组织。
72.根据实施例71所述的方法,其进一步包括从转化的植物组织产生转化的小植株。
73.根据实施例72所述的方法,其进一步包括产生转化的小植株的克隆。
74.根据实施例71或72所述的方法,其进一步包括将转化的小植株或转化的小植株的克隆生长成成熟的转化植物。
75.根据实施例74所述的方法,其中成熟的转化植物是芭蕉属植物并且成熟的转化的芭蕉属植物能够产生果实。
76.根据实施例75所述的方法,其进一步包括产生成熟的转化的芭蕉属植物的克隆。
77.根据实施例75或76所述的方法,其进一步包括在育种方法使用所述成熟的转化的芭蕉属植物或所述成熟的转化的芭蕉属植物的克隆。
通过引用的并入
本文在上述文本中引用的和/或在下文中引用的所有参考文献、文章、出版物、专利、专利出版物和专利申请出于所有目的都通过引用以其整体并入。然而,本文引用的任何参考文献、文章、出版物、专利、专利出版物和专利申请的提及不是,并且不应被视为承认或任何形式的暗示它们构成有效的现有技术或构成世界上任何国家的公知常识的一部分。
美国专利文件
其他出版物
Armenteros,J.J.A.A.2017.“DeepLoc:使用深度学习预测蛋白质亚细胞定位(DeepLoc:prediction of protein subcellular localization using deeplearning)”.《生物信息学(Bioinformatics)》33(21):3387–3395.
Armenteros等人.2019.“SignalP 5.0使用深度神经网络改进了信号肽预测(SignalP 5.0improves signal peptide predictions using deep neural networks)”.《自然生物技术》37:420–423.
Bai,T-T等人.2013.“用尖孢镰刀菌古巴专化型热带小种4攻击的高度抗性和敏感性的香蕉根的转录组和表达谱分析(Transcriptome and Expression Profile Analysisof Highly Resistant and Susceptible Banana Roots Challenged with Fusariumoxysporum f.sp.cubense Tropical Race4)”.PLOS|One:2013年9月23日公布.
Barbosa,J.A.R.G等人,2007.“来自豇豆种子的Bowman-Birk抑制剂与β-胰蛋白酶以分离度复合物的晶体结构及其与蛋白酶相关的结构性质(Crystal Structure ofthe Bowman-Birk Inhibitor from Vigna unguiculata Seeds in Complex withβ-Trypsin atResolution and Its Structural Properties in Association withProteinases)”.《生物物理杂志(Biophysical Journal.)》92(5):1638-1650.
Chen,A等人.2019.“评估香蕉物种中宿主对尖孢镰刀菌古巴专化型小种4抗性的变化,其中重点关注亚热带小种4号(Assessing Variations in Host Resistance toFusarium oxysporum f sp.cubense Race 4in Musa Species,With a Focus on theSubtropical Race 4)”.《微生物学前沿(Front.Microbiol)》.10.
Christelová,P等人.2017.“全球芭蕉属种质收集的分子和细胞学表征提供了对香蕉多样性宝藏的见解(Molecular and cytological characterization of the globalMusa germplasm collection provides insights into the treasure of bananadiversity)”.Biodivers.Conserv.26:801.
Dale,J等人2017.“对枯萎病热带小种4具有抗性的转基因香芽蕉(TransgenicCavendish bananas with resistance to Fusarium wilt tropical race 4)”.《自然通讯(Nature Communications)》.8:文章编号1496.
Davey,M.W等人.2013.“用于多倍体、种间和种内特异性芭蕉属杂种中分子遗传学的野蕉基因组序列草案(A draft Musa balbisiana genome sequence for moleculargenetics in polyploid,inter-and intra-specific Musa hybrids)”.BMC Genomics14:683.
D'Hont,A等人.2012.“香蕉(小果野蕉)基因组与单子叶植物的进化(The banana(Musa acuminata)genome and the evolution of monocotyledonous plants)”.《自然》488:213–217.
Dita,M等人.2018.“香蕉的枯萎病:流行病学的当前知识和可持续疾病管理的研究需求。(Fusarium Wilt of banana:current knowledge on epidemiology andresearch needs toward sustainable disease management)”.《植物科学前沿》.9:1468.
Heslop-Harrison,J.S和Schwarzacher,T.2007.“香蕉的驯化、基因组学和未来(Domestication,Genomics and the Future for Banana)”.《植物学年鉴(Annals ofBotany)》100(5):1073–1084.
Hiller,K等人.2004.“PrediSi:信号肽及其切割位置的预测(PrediSi:prediction of signal peptides and their cleavage positions)”.《核酸研究》.32(网络服务器发布(Web Server issue)):W375-9.
Hippolyte,I等人.2012.“从SSR标记物的等位基因分布揭示食用芭蕉属三倍体的基础特征(Foundation characteristics of edible Musa triploids revealed fromallelic distribution of SSR markers)”.《植物学年鉴》109(5):937–951.
Hughes,A.L和Nei,M.1988《自然》335:167-170.
Ishihara等人.2016.“一种从木本豆科物种夏威夷金合欢和银合欢((Lam.)deWit))中提取RNA的改进方法(An improved method for RNA extraction from woodylegume species Acacia koa A.Gray and Leucaena leucocephala(Lam.)de Wit)”.Int.J.For.Wood Sci.3(1):31-35.
Kreitman,M和Akashi,H.1995.“自然选择的分子证据(Molecular evidence fornatural selection)”.《生态学系统年度评论(Annu.Rev.Ecol.Syst.)》26:403-422.
Kumar,S.,等人.2018.“MEGA X:跨计算平台的分子进化遗传学分析”.《分子生物学与进化(Molecular Biology and Evolution)》35:1547-1549.
Li,C.-Y等人.2012.“在接种尖孢镰刀菌古巴专化型热带小种4后抗性和易感的香芽蕉根的转录组概况(Transcriptome profiling of resistant and susceptibleCavendish banana roots following inoculation with Fusarium oxysporumf.sp.cubense tropical race 4)”.BMC Genomics13:374.
Li,W.-H等人.1985.“一种考虑核苷酸和密码子变化的相对可能性来估计核苷酸取代的同义和非同义率的新方法(A new method for estimating synonymous andnonsynonymous rates of nucleotide substitution considering the relativelikelihood of nucleotide and codon changes)”.《分子生物学与进化》2:150-174.
Li,W.-H.1993.“同义取代率和非同义取代率的无偏估计(Unbiased estimationof the rates of synonymous and nonsynonymous substitution)”.《分子进化杂志(J.Mol.Evol)》.36:9699.
Li,W.-H.,1997.《分子进化(Molecular Evolution)》.Sunderland,Massachusetts:Sinauer Associates.
Li,W.M等人.2015.“香蕉野生近缘种中的尖孢镰刀菌古巴专化型热带小种4的抗性来源(Resistance sources to Fusarium oxysporum f.sp.cubense tropical race4in banana wild relatives)”.《植物病理学》64:1061-1067.
Ma,X等人.2015“用于单子叶植物和双子叶植物的方便、高效率的多重基因组编辑的稳健的CRISPR/Cas9系统(A Robust CRISPR/Cas9 System for Convenient,High-Efficiency Multiplex Genome Editing in Monocot and Dicot Plants)”.Mol.Plant.8:1274–1284.
Messier,W和Stewart,C.-B.1994《当前生物学(Current Biol.)》4:911-913.
Messier,W和Stewart,C-B.1997.《自然》385:151-154.
Nei M和Kumar S.2000.《分子进化和系统发育学(Molecular Evolution andPhylogenetics)》.纽约牛津大学出版社.
Paul,J.-Y等人.2011.“凋亡相关基因赋予转基因‘女士手指’香蕉对枯萎病的抗性(Apoptosis-related genes confer resistance to Fusarium wilt in transgenic‘Lady Finger’bananas)”.《植物生物技术杂志》
Niu,Y等人.2018.“高度抗性的和易感的香蕉栽培品种的组织培养的小植株对尖孢镰刀菌响应的比较数字基因表达分析(Comparative digital gene expressionanalysis of tissue-cultured plantlets of highly resistant and susceptiblebanana cultivars in response to Fusarium oxysporum)”.Int.J.Mol.Sci.19.doi:10.3390/ijms19020350.
Peraza-Echeverria,S等人.2009.“香蕉中潜在的镰刀菌抗性基因的分子克隆及计算机分析(Molecular cloning and in silico analysis of potential Fusariumresistance genes in banana)”.《分子育种(Mol.Breeding)》.23(3):431-443.
Ploetz,R.C.2015.“香蕉的枯萎病(Fusarium Wilt of banana)”.《植物病理学评论(Phytopathology Review)》.
Raboin,L-M等人.2005.“三倍体出口香蕉栽培品种的二倍体祖先:2n个恢复配子供体和n个配子供体的分子鉴定(Diploid Ancestors of Triploid Export BananaCultivars:Molecular Identification of 2n Restitution Gamete Donors and nGamete Donors)”.《分子育种》16:333.
Reese M.G.2001.“时滞神经网络在果蝇基因组的启动子注释中的应用(Application of a time-delay neural network to promoter annotation in theDrosophila melanogaster genome)”.Comput.Chem.26(1):51-56.
Ribeiro,L.R等人.2018.“香蕉种质中的尖孢镰刀菌古巴专化型的抗性来源(Sources of resistance to Fusarium oxysporum f.sp.cubense in bananagermplasm)”.Rev.Bras.Frutic.40:1.Epub 2018年2月8日.
Rouard,M等人.2018.“三个新的基因组装体支持了在小果野蕉(野生香蕉)中的快速辐射(Three New Genome Assemblies Support a Rapid Radiation in Musaacuminata(Wild Banana))”.《基因组生物学与进化(Genome Biology and Evolution)》10(12):3129–3140.
Solovyev V.V和Salamov A.A.1997.“用于分析人类和模型生物体基因组序列的基因查找器计算机工具。(The Gene-Finder computer tools for analysis of humanand model organisms genome sequences)”.在第五届分子生物学智能系统国际会议记录中(In Proceedings of the Fifth International Conference on IntelligentSystems for Molecular Biology)(编辑.Rawling C.,Clark D.,Altman R.,Hunter L.,Lengauer T.,Wodak S.),Halkidiki,Greece,AAAI出版,294-302.
Solovyev V.V.2001.“真核生物基因预测的统计方法(Statistical approachesin Eukaryotic gene prediction)”.在《统计遗传学手册(Handbook of StatisticalGenetics)》中(编辑.Balding D等人),约翰·威利父子有限公司,第83-127页.
Solovyev V.V和Shahmuradov I.A.2003.“PromH:使用同源性基因组序列鉴定启动子(PromH:Promoters identification using orthologous genomic sequences)”.《核酸研究》31(13):3540-3545.
Stokstad,E.2019.“香蕉真菌使拉丁美洲处于戒备状态(Banana fungus putsLatin America on alert)”.《科学》365(6450):207-208.
Ssali,R等人.2013.“香蕉中的尖孢镰刀菌古巴专化型小种4抗性的遗传(Inheritance of resistance to Fusarium oxysporum f.sp.cubense race 1inbananas)”.Euphytica 194:425.Van der Berg,N等人.2007.“香蕉对枯萎病的耐受性与根中细胞壁增强基因的早期上调有关。(Tolerance in banana to Fusarium wilt isassociated with early up-regulation of cell wall-strengthening genes in theroots)”.《分子植物病理学》.8(3):333-341.
Venkataramana,R.K等人.2015.“通过转录组学方法洞察野蕉和小果野蕉物种分化和基因微卫星的发育(Insights into Musa balbisiana and Musa acuminata speciesdivergence and development of genic microsatellites by transcriptomicsapproach)”.《植物基因(Plant Gene)》4:78-82.
Wang,Y等人.2017.“香蕉根响应于枯萎病的差异基因表达(Differential geneexpression in banana roots in response to Fusarium wilt)”.《加拿大植物病理学杂志(Canadian Journal of Plant Pathology)》39(2):163-175.doi.org/10.1080/07060661.2017.1342693.
Wu,W等人.2016.“香蕉野生亲缘阿宽蕉的全基因组测序提供了芭蕉属的属的谱系特异性多样性的见解(Whole genome sequencing of a banana wild relative Musaitinerans provides insights into lineage-specific diversification of the Musagenus)”.《科学报告(Scientific Reports)》6:文章编号:31586.
Zhang,L等人.(2018)“小果野蕉Pahang中尖孢镰刀菌古巴专化型热带小种4的抗性鉴定与评价(Identification and evaluation of resistance to Fusariumoxysporum f.sp.cubense tropical race 4in Musa acuminata Pahang)”.Euphytica214:106.
Zuo,C等人.2018.“对尖孢镰刀菌古巴专化型热带小种4(Foc-TR4)的抗性的芭蕉质筛选(Germplasm screening of Musa spp.for resistance to Fusarium oxysporumf.sp.cubense tropical race 4(Foc-TR4))”.Eur J Plant Pathol.151:723。
序列表
<110> EG农作物科学股份有限公司
<120> 来自香蕉的野生近缘种的抗性基因的鉴定及其在控制巴拿马病中的用途
<130> EVOL-009/02WO 307903-2044
<150> US 62/912,010
<151> 2019-10-07
<150> US 62/866,872
<151> 2019-06-26
<160> 32
<170> PatentIn version 3.5
<210> 1
<211> 553
<212> DNA
<213> 阿宽蕉(Musa itinerans)
<400> 1
gtaagcaatg gctggaggag gcaaaagagg tgaagcgtcg tctcttctac ttgtgacgct 60
gctcgtgatg ttgttggcct tcttcgccac cgactcctcg gcggcccgtg tcacaccccg 120
tccgcactcc ctcgccagag cggtactgag tgcgttggag gcaagggcag atgggccgtg 180
ttgcagatgc atctgtcctc tcatttaccc acctacttgg tgcgtttgca gcggcgtatg 240
gcaaggctcc tgcccttccg cctgcaccaa ctgcgagtgt ctcctcaacg agtgcacttg 300
cctcgatcac gtggactaca aggcctgcca ggccgactcc tgtggctggc ttgatggcgt 360
ccccaaacta gagccgtcgc agcagtgggc gatcgaagaa accggtggga aattagcgat 420
gatggtgtga tccaattgtg tttgtgatcg cctgtcgtct tctctcgctc cgtcccatcc 480
atctatccat ccatctactt ataatctatg tcgtgtaccg tcgtgcggcg ttgctttgct 540
tcggtaataa aat 553
<210> 2
<211> 423
<212> DNA
<213> 阿宽蕉
<400> 2
atggctggag gaggcaaaag aggtgaagcg tcgtctcttc tacttgtgac gctgctcgtg 60
atgttgttgg ccttcttcgc caccgactcc tcggcggccc gtgtcacacc ccgtccgcac 120
tccctcgcca gagcggtact gagtgcgttg gaggcaaggg cagatgggcc gtgttgcaga 180
tgcatctgtc ctctcattta cccacctact tggtgcgttt gcagcggcgt atggcaaggc 240
tcctgccctt ccgcctgcac caactgcgag tgtctcctca acgagtgcac ttgcctcgat 300
cacgtggact acaaggcctg ccaggccgac tcctgtggct ggcttgatgg cgtccccaaa 360
ctagagccgt cgcagcagtg ggcgatcgaa gaaaccggtg ggaaattagc gatgatggtg 420
tga 423
<210> 3
<211> 140
<212> PRT
<213> 阿宽蕉
<400> 3
Met Ala Gly Gly Gly Lys Arg Gly Glu Ala Ser Ser Leu Leu Leu Val
1 5 10 15
Thr Leu Leu Val Met Leu Leu Ala Phe Phe Ala Thr Asp Ser Ser Ala
20 25 30
Ala Arg Val Thr Pro Arg Pro His Ser Leu Ala Arg Ala Val Leu Ser
35 40 45
Ala Leu Glu Ala Arg Ala Asp Gly Pro Cys Cys Arg Cys Ile Cys Pro
50 55 60
Leu Ile Tyr Pro Pro Thr Trp Cys Val Cys Ser Gly Val Trp Gln Gly
65 70 75 80
Ser Cys Pro Ser Ala Cys Thr Asn Cys Glu Cys Leu Leu Asn Glu Cys
85 90 95
Thr Cys Leu Asp His Val Asp Tyr Lys Ala Cys Gln Ala Asp Ser Cys
100 105 110
Gly Trp Leu Asp Gly Val Pro Lys Leu Glu Pro Ser Gln Gln Trp Ala
115 120 125
Ile Glu Glu Thr Gly Gly Lys Leu Ala Met Met Val
130 135 140
<210> 4
<211> 534
<212> DNA
<213> 阿宽蕉
<400> 4
ggtaagcaat ggctggagga ggcaaaagag gtgaagcgtc gtctcttcta cttgtgacgc 60
tgctcgtgat gttgttggcc ttcttcgcca ccgactcctc ggcggcccgt gtcacacccc 120
gtccgcactc cctcgccaga gcggtactga gtgcgttgga gggaagggcc gatgggccgt 180
gttgcagatg catctgtcct ctcatttacc cacctacttg gtgcatttgc agcggcgtat 240
ggcaaggctc ctgcccttcc gcctgcacca actgcgagtg tctcctcaac gagtgcactt 300
gcctcgatca cgtggactac aaggcctgcg aggccgactc ctgtggctgg cttgatggcg 360
tccccaaact agagccgtcg cagcagtggg cgatcgaaga aaccggtggg aaattagcgg 420
cgatggtgtg atccaaatgt gtttgtgttc gcctgtcgtc ttctctcgcg ccgtcctatc 480
catctatcca tccatctact tataatctat gtcgtgtacc gtcgtgtggt gttg 534
<210> 5
<211> 423
<212> DNA
<213> 阿宽蕉
<400> 5
atggctggag gaggcaaaag aggtgaagcg tcgtctcttc tacttgtgac gctgctcgtg 60
atgttgttgg ccttcttcgc caccgactcc tcggcggccc gtgtcacacc ccgtccgcac 120
tccctcgcca gagcggtact gagtgcgttg gagggaaggg ccgatgggcc gtgttgcaga 180
tgcatctgtc ctctcattta cccacctact tggtgcattt gcagcggcgt atggcaaggc 240
tcctgccctt ccgcctgcac caactgcgag tgtctcctca acgagtgcac ttgcctcgat 300
cacgtggact acaaggcctg cgaggccgac tcctgtggct ggcttgatgg cgtccccaaa 360
ctagagccgt cgcagcagtg ggcgatcgaa gaaaccggtg ggaaattagc ggcgatggtg 420
tga 423
<210> 6
<211> 140
<212> PRT
<213> 阿宽蕉
<400> 6
Met Ala Gly Gly Gly Lys Arg Gly Glu Ala Ser Ser Leu Leu Leu Val
1 5 10 15
Thr Leu Leu Val Met Leu Leu Ala Phe Phe Ala Thr Asp Ser Ser Ala
20 25 30
Ala Arg Val Thr Pro Arg Pro His Ser Leu Ala Arg Ala Val Leu Ser
35 40 45
Ala Leu Glu Gly Arg Ala Asp Gly Pro Cys Cys Arg Cys Ile Cys Pro
50 55 60
Leu Ile Tyr Pro Pro Thr Trp Cys Ile Cys Ser Gly Val Trp Gln Gly
65 70 75 80
Ser Cys Pro Ser Ala Cys Thr Asn Cys Glu Cys Leu Leu Asn Glu Cys
85 90 95
Thr Cys Leu Asp His Val Asp Tyr Lys Ala Cys Glu Ala Asp Ser Cys
100 105 110
Gly Trp Leu Asp Gly Val Pro Lys Leu Glu Pro Ser Gln Gln Trp Ala
115 120 125
Ile Glu Glu Thr Gly Gly Lys Leu Ala Ala Met Val
130 135 140
<210> 7
<211> 398
<212> DNA
<213> 阿宽蕉
<400> 7
acgttgtgat agaaagttca gcggtaagca atggctggag gaggcaaaag aggtgaagcg 60
tcgtctcttc tacttgtgac gctgctcgtg atgttgttgg ccttcttcgc caccgactcc 120
tcggcggccc gtgtcacacc ccgtccgcac tccctcgcca gagcggcgta tggcaaggct 180
cctgcccttc cgcctgcacc aactgcgagt gtctcctcaa cgagtgcact tgcctcgatc 240
acgtggacta caaggcctgc caggccgact cctgtggctg gcttgatggc gtccccaaac 300
tagagccgtc gcagcagtgg gcgatcgaag aaaccggtgg gaaattagcg atgatggtgt 360
gatccaattg tgtttgtgat cgcctgtcgt cttctctc 398
<210> 8
<211> 616
<212> DNA
<213> 小果野蕉(Musa acuminata)
<400> 8
actccctcat acttgcacag gtacgttgtg atagaaagtt cagaggtaag cgatggctgg 60
aggaggcaaa agaggtgaag cgtcgtctct tctacttgtg acgctgctcg tgacgttgtt 120
ggctttcttc gccaccaact cctcggcagc ccgtgtcaca ccccgtccgc aatccctcgc 180
cagagcggca ctgagtgcgg tgggggcaag gcaagatgag ccgtgctgca gatgcgcgtg 240
tcctctcatt tacccaccta cttggtgcat ttgcggcggc atatggcaag gctcctgccc 300
ttccgcctgc aacaactgcc agtgtgtcct caacgagtgc acttgcctcg atcttatgga 360
ccccaaggtc tgcgaggcca actcctgtcc ctggcctgtt gcagccccca aagtagagcc 420
ggcgcagcag tgggctatcg aagaaaccgg tgggaaatta gcgatgatgg tgtgatccaa 480
ttgtgtttgt gatcgcctgt cgtcttctct cgctccgtcc tatccatcta tccatccatc 540
tacttataat ctatgtcgtg taccgtcgtg tggtgttgct ttgcttcagt aataaaaata 600
aaatgcttct gctttt 616
<210> 9
<211> 423
<212> DNA
<213> 小果野蕉
<400> 9
atggctggag gaggcaaaag aggtgaagcg tcgtctcttc tacttgtgac gctgctcgtg 60
acgttgttgg ctttcttcgc caccaactcc tcggcagccc gtgtcacacc ccgtccgcaa 120
tccctcgcca gagcggcact gagtgcggtg ggggcaaggc aagatgagcc gtgctgcaga 180
tgcgcgtgtc ctctcattta cccacctact tggtgcattt gcggcggcat atggcaaggc 240
tcctgccctt ccgcctgcaa caactgccag tgtgtcctca acgagtgcac ttgcctcgat 300
cttatggacc ccaaggtctg cgaggccaac tcctgtccct ggcctgttgc agcccccaaa 360
gtagagccgg cgcagcagtg ggctatcgaa gaaaccggtg ggaaattagc gatgatggtg 420
tga 423
<210> 10
<211> 616
<212> DNA
<213> 小果野蕉
<400> 10
actccctcat acttgcacag gtacgttgtg atagaaagtt cagaggtaag cgatggctgg 60
aggaggcaaa agaggtgaag cgtcgtctct tctacttgtg acgctgctcg tgacgttgtt 120
ggctttcttc gccaccaact cctcggcagc ccgtgtcaca ccccgtccgc aatccctcgc 180
cagagcggca ctgagtgcgg tgggggcaag gcaagatgag ccgtgctgca gatgcgcgtg 240
tcctctcatt tacccaccta cttggtgcat ttgcggcggc atatggcaag gctcctgccc 300
ttccgcctgc aacaactgcc agtgtgtcct gaacgagtgc acttgcctcg atcttatgga 360
ccccaaggtc tgcgaggcca actcctgtcc ctggcctgtt gcagccccca aagtagagcc 420
ggcgcagcag tgggctatcg aagaaaccgg tgggaaatta gcgatgatgg tgtgatccaa 480
ttgtgtttgt gatcgcctgt cgtcttctct cgctccgtcc tatccatcta tccatccatc 540
tacttataat ctatgtcgtg taccgtcgtg tggtgttgct ttgcttcagt aataaaaata 600
aaatgcttct gctttt 616
<210> 11
<211> 423
<212> DNA
<213> 小果野蕉
<400> 11
atggctggag gaggcaaaag aggtgaagcg tcgtctcttc tacttgtgac gctgctcgtg 60
acgttgttgg ctttcttcgc caccaactcc tcggcagccc gtgtcacacc ccgtccgcaa 120
tccctcgcca gagcggcact gagtgcggtg ggggcaaggc aagatgagcc gtgctgcaga 180
tgcgcgtgtc ctctcattta cccacctact tggtgcattt gcggcggcat atggcaaggc 240
tcctgccctt ccgcctgcaa caactgccag tgtgtcctga acgagtgcac ttgcctcgat 300
cttatggacc ccaaggtctg cgaggccaac tcctgtccct ggcctgttgc agcccccaaa 360
gtagagccgg cgcagcagtg ggctatcgaa gaaaccggtg ggaaattagc gatgatggtg 420
tga 423
<210> 12
<211> 140
<212> PRT
<213> 小果野蕉
<400> 12
Met Ala Gly Gly Gly Lys Arg Gly Glu Ala Ser Ser Leu Leu Leu Val
1 5 10 15
Thr Leu Leu Val Thr Leu Leu Ala Phe Phe Ala Thr Asn Ser Ser Ala
20 25 30
Ala Arg Val Thr Pro Arg Pro Gln Ser Leu Ala Arg Ala Ala Leu Ser
35 40 45
Ala Val Gly Ala Arg Gln Asp Glu Pro Cys Cys Arg Cys Ala Cys Pro
50 55 60
Leu Ile Tyr Pro Pro Thr Trp Cys Ile Cys Gly Gly Ile Trp Gln Gly
65 70 75 80
Ser Cys Pro Ser Ala Cys Asn Asn Cys Gln Cys Val Leu Asn Glu Cys
85 90 95
Thr Cys Leu Asp Leu Met Asp Pro Lys Val Cys Glu Ala Asn Ser Cys
100 105 110
Pro Trp Pro Val Ala Ala Pro Lys Val Glu Pro Ala Gln Gln Trp Ala
115 120 125
Ile Glu Glu Thr Gly Gly Lys Leu Ala Met Met Val
130 135 140
<210> 13
<211> 445
<212> DNA
<213> 小果野蕉
<400> 13
gtaagcgatg gctggaggag gcaaaagagg tgaagcgtcg tctcttctac ttgtgacgct 60
gctcgtgacg ttgttggctt tcttcgccac caactcctcg gcagcccgtg tcacaccccg 120
tccgcaatcc ctcgccagag cggcactgag tgcgttgggg gcaaggcaag atgagccgtg 180
ctgcagatgc gcgtgtcctc tcatttaccc acctacttgg tgcatttgcg gcggcatatg 240
gcaaggctcc tgcccttccg cctgcaacaa ctgccagtgt gtcctcaacg agtgcacttg 300
cctcgatctt atggacccca aggtctgcgt ggccaactcc tgtccctggc gtgatgcagc 360
ccccaaagta gagccggcgc agcagtgggc gatcgaagaa accggtggga aattagcgat 420
gatggtgtga tccaattgtg tttgt 445
<210> 14
<211> 423
<212> DNA
<213> 小果野蕉
<400> 14
atggctggag gaggcaaaag aggtgaagcg tcgtctcttc tacttgtgac gctgctcgtg 60
acgttgttgg ctttcttcgc caccaactcc tcggcagccc gtgtcacacc ccgtccgcaa 120
tccctcgcca gagcggcact gagtgcgttg ggggcaaggc aagatgagcc gtgctgcaga 180
tgcgcgtgtc ctctcattta cccacctact tggtgcattt gcggcggcat atggcaaggc 240
tcctgccctt ccgcctgcaa caactgccag tgtgtcctca acgagtgcac ttgcctcgat 300
cttatggacc ccaaggtctg cgtggccaac tcctgtccct ggcgtgatgc agcccccaaa 360
gtagagccgg cgcagcagtg ggcgatcgaa gaaaccggtg ggaaattagc gatgatggtg 420
tga 423
<210> 15
<211> 140
<212> PRT
<213> 小果野蕉
<400> 15
Met Ala Gly Gly Gly Lys Arg Gly Glu Ala Ser Ser Leu Leu Leu Val
1 5 10 15
Thr Leu Leu Val Thr Leu Leu Ala Phe Phe Ala Thr Asn Ser Ser Ala
20 25 30
Ala Arg Val Thr Pro Arg Pro Gln Ser Leu Ala Arg Ala Ala Leu Ser
35 40 45
Ala Leu Gly Ala Arg Gln Asp Glu Pro Cys Cys Arg Cys Ala Cys Pro
50 55 60
Leu Ile Tyr Pro Pro Thr Trp Cys Ile Cys Gly Gly Ile Trp Gln Gly
65 70 75 80
Ser Cys Pro Ser Ala Cys Asn Asn Cys Gln Cys Val Leu Asn Glu Cys
85 90 95
Thr Cys Leu Asp Leu Met Asp Pro Lys Val Cys Val Ala Asn Ser Cys
100 105 110
Pro Trp Arg Asp Ala Ala Pro Lys Val Glu Pro Ala Gln Gln Trp Ala
115 120 125
Ile Glu Glu Thr Gly Gly Lys Leu Ala Met Met Val
130 135 140
<210> 16
<211> 525
<212> DNA
<213> 小果野蕉
<400> 16
gtaagcgatg gctggaggag gcaaaagagg tgaagcgtcg tctcttctac ttgtgacgct 60
gctcgtgacg ttgttggctt tcttcgccac caactcctcg gcagcccgtg tcacaccccg 120
tccgcaatcc ctcgccagag gtaggttggt aaatatgcat gcgaacatct atgattgggc 180
tggagatcga ggcatcgtta attccttctt catgctgcag cggcactgag tgcgttgggg 240
gcaaggcaag atgagccgtg ctgcagatgc gcgtgtcctc tcatttaccc acctacttgg 300
tgcatttgcg gcggcatatg gcaaggctcc tgcccttccg cctgcaacaa ctgccagtgt 360
gtcctcaacg agtgcacttg cctcgatctt atggacccca aggtctgcgt ggccaactcc 420
tgtccctggc gtgatgcagc ccccaaagta gagccggcgc agcagtgggc gatcgaagaa 480
accggtggga aattagcgat gatggtgtga tccaattgtg tttgt 525
<210> 17
<211> 514
<212> DNA
<213> 芭蕉(Musa basjoo)
<400> 17
aggtaagcga tggctggagg aggcaaaaga ggtgaagcgt cgtctcttct acttgtgacg 60
ctgctcgtga cgttgttggc tttcttcgcc accaactcct cagcagcccg tgtcacaccc 120
cgtccgcaat ccctcgccag agcggcactg agtgcggtgg gggcaaggca agatgagccg 180
tgctgcagat gcgcgtgtcc tctcatttac ccacctactt ggtgcatttg cggcggcata 240
tggcaaggct cctgcccttc cgcctgcaac aactgccagt gtgtcctcaa cgagtgcact 300
tgcctcgatc ttatggaccc caaggtctgc gaggccaact cctgtccctg gcctgttgca 360
gcccccaaag tagagccggc gcagcagtgg gctatcgaag aaaccggtgg gaaattagcg 420
atgatggtgt gatccaattg tgtttgtgat cgcctgtcgt cttctctcgc tccgtcctat 480
ccatctatcc atccatctac ttataatcta tgtc 514
<210> 18
<211> 423
<212> DNA
<213> 芭蕉
<400> 18
atggctggag gaggcaaaag aggtgaagcg tcgtctcttc tacttgtgac gctgctcgtg 60
acgttgttgg ctttcttcgc caccaactcc tcagcagccc gtgtcacacc ccgtccgcaa 120
tccctcgcca gagcggcact gagtgcggtg ggggcaaggc aagatgagcc gtgctgcaga 180
tgcgcgtgtc ctctcattta cccacctact tggtgcattt gcggcggcat atggcaaggc 240
tcctgccctt ccgcctgcaa caactgccag tgtgtcctca acgagtgcac ttgcctcgat 300
cttatggacc ccaaggtctg cgaggccaac tcctgtccct ggcctgttgc agcccccaaa 360
gtagagccgg cgcagcagtg ggctatcgaa gaaaccggtg ggaaattagc gatgatggtg 420
tga 423
<210> 19
<211> 140
<212> PRT
<213> 芭蕉
<400> 19
Met Ala Gly Gly Gly Lys Arg Gly Glu Ala Ser Ser Leu Leu Leu Val
1 5 10 15
Thr Leu Leu Val Thr Leu Leu Ala Phe Phe Ala Thr Asn Ser Ser Ala
20 25 30
Ala Arg Val Thr Pro Arg Pro Gln Ser Leu Ala Arg Ala Ala Leu Ser
35 40 45
Ala Val Gly Ala Arg Gln Asp Glu Pro Cys Cys Arg Cys Ala Cys Pro
50 55 60
Leu Ile Tyr Pro Pro Thr Trp Cys Ile Cys Gly Gly Ile Trp Gln Gly
65 70 75 80
Ser Cys Pro Ser Ala Cys Asn Asn Cys Gln Cys Val Leu Asn Glu Cys
85 90 95
Thr Cys Leu Asp Leu Met Asp Pro Lys Val Cys Glu Ala Asn Ser Cys
100 105 110
Pro Trp Pro Val Ala Ala Pro Lys Val Glu Pro Ala Gln Gln Trp Ala
115 120 125
Ile Glu Glu Thr Gly Gly Lys Leu Ala Met Met Val
130 135 140
<210> 20
<211> 370
<212> DNA
<213> 芭蕉
<400> 20
gcactgagtg cggtgggggc aagcaaagat gagccgtgct gcagatgcgc gtgtcctctc 60
atttacccac ctacttggtg catttgcagc ggcatatggc aaggctcctg cccttccgcc 120
tgcaacaact gccagtgtgt cctcaacgag tgcacttgcc tcgatcttat ggaccccaag 180
gtctgcgagg ccaactcctg tccctggcct gttgcagccc ccaaagtaga gccggcgcag 240
cagtgggcta tcgaagaaac cggtgggaaa ttagcgatga tggtgtgatc caattgtgtt 300
tgtgatcacc tgtcgtcttc tctcgctccg tcctatccat ctatccatcc atctacttat 360
aatctatgtc 370
<210> 21
<211> 288
<212> DNA
<213> 芭蕉
<400> 21
gcactgagtg cggtgggggc aagcaaagat gagccgtgct gcagatgcgc gtgtcctctc 60
atttacccac ctacttggtg catttgcagc ggcatatggc aaggctcctg cccttccgcc 120
tgcaacaact gccagtgtgt cctcaacgag tgcacttgcc tcgatcttat ggaccccaag 180
gtctgcgagg ccaactcctg tccctggcct gttgcagccc ccaaagtaga gccggcgcag 240
cagtgggcta tcgaagaaac cggtgggaaa ttagcgatga tggtgtga 288
<210> 22
<211> 95
<212> PRT
<213> 芭蕉
<400> 22
Ala Leu Ser Ala Val Gly Ala Ser Lys Asp Glu Pro Cys Cys Arg Cys
1 5 10 15
Ala Cys Pro Leu Ile Tyr Pro Pro Thr Trp Cys Ile Cys Ser Gly Ile
20 25 30
Trp Gln Gly Ser Cys Pro Ser Ala Cys Asn Asn Cys Gln Cys Val Leu
35 40 45
Asn Glu Cys Thr Cys Leu Asp Leu Met Asp Pro Lys Val Cys Glu Ala
50 55 60
Asn Ser Cys Pro Trp Pro Val Ala Ala Pro Lys Val Glu Pro Ala Gln
65 70 75 80
Gln Trp Ala Ile Glu Glu Thr Gly Gly Lys Leu Ala Met Met Val
85 90 95
<210> 23
<211> 438
<212> DNA
<213> 地涌金莲(Musella lasiocarpa)
<438> 23
ggtaagcaat ggctggagga ggcaaaagag gtgaagcgtc gtctcttctg cttgtgacgc 60
tgctcgtgac gttgttggcc ttcttcgcca ccgactcctc ggcagcccgt gtcacgcccc 120
gtccgcaatc cctcgccaga gtggcactga gcgcgttggg cgtaaggcaa gatgagccgt 180
gctgcagatg catctgtcct cgcatttacc caactgcttg gtgcatttgc agcggcgcat 240
ggcaaggctc ctgcccttcc gcctgcacca cctgcaagtg tgacctcaac gagtgcactt 300
gcgacgatat cgtggactac aatgcctgcc tggccgactc ctgtccctgg cttgatgcag 360
cagcccccaa ggtagagccg tcgcagcagt gggcgatcga agaaaccggt gggaaattag 420
cgacgatggt gtgatccg 438
<210> 24
<211> 426
<212> DNA
<213> 地涌金莲
<400> 24
atggctggag gaggcaaaag aggtgaagcg tcgtctcttc tgcttgtgac gctgctcgtg 60
acgttgttgg ccttcttcgc caccgactcc tcggcagccc gtgtcacgcc ccgtccgcaa 120
tccctcgcca gagtggcact gagcgcgttg ggcgtaaggc aagatgagcc gtgctgcaga 180
tgcatctgtc ctcgcattta cccaactgct tggtgcattt gcagcggcgc atggcaaggc 240
tcctgccctt ccgcctgcac cacctgcaag tgtgacctca acgagtgcac ttgcgacgat 300
atcgtggact acaatgcctg cctggccgac tcctgtccct ggcttgatgc agcagccccc 360
aaggtagagc cgtcgcagca gtgggcgatc gaagaaaccg gtgggaaatt agcgacgatg 420
gtgtga 426
<210> 25
<211> 141
<212> PRT
<213> 地涌金莲
<400> 25
Met Ala Gly Gly Gly Lys Arg Gly Glu Ala Ser Ser Leu Leu Leu Val
1 5 10 15
Thr Leu Leu Val Thr Leu Leu Ala Phe Phe Ala Thr Asp Ser Ser Ala
20 25 30
Ala Arg Val Thr Pro Arg Pro Gln Ser Leu Ala Arg Val Ala Leu Ser
35 40 45
Ala Leu Gly Val Arg Gln Asp Glu Pro Cys Cys Arg Cys Ile Cys Pro
50 55 60
Arg Ile Tyr Pro Thr Ala Trp Cys Ile Cys Ser Gly Ala Trp Gln Gly
65 70 75 80
Ser Cys Pro Ser Ala Cys Thr Thr Cys Lys Cys Asp Leu Asn Glu Cys
85 90 95
Thr Cys Asp Asp Ile Val Asp Tyr Asn Ala Cys Leu Ala Asp Ser Cys
100 105 110
Pro Trp Leu Asp Ala Ala Ala Pro Lys Val Glu Pro Ser Gln Gln Trp
115 120 125
Ala Ile Glu Glu Thr Gly Gly Lys Leu Ala Thr Met Val
130 135 140
<210> 26
<211> 521
<212> DNA
<213> 野蕉(Musa balbisiana)
<400> 26
atggctggag gaggcaaaag gggtgaagcg tcgtctcttc tacttgtgac gctgctcgtg 60
acgttgttgg ccttcttcgc caccgactcc tcggcagccc gtgtcgcacc ccgtccgcac 120
tccctcgcca gaggtaggta gataaatatg catgcgaact tgtatatgat tgggctggag 180
atcgaggcat cgttaattcc gtcttcatgc tgcagcggca ctgagtgcgt tgggggtaag 240
gcaagatgcg ccgtgctgca catgcgtctg tcctctcatt tacccacctc ctttttgctt 300
ttgcggcggc gtatggcaag gctcctgccc gtccgcctgc accaactgcg agtgtgtcct 360
caacgagtgc acttgcatcg atcgtgtgga ccccaaggcc tgcgaggccg actcctgtgc 420
cggctcgatg cagcccccaa agtagagccg tcgcagcagt gggcgaccga agaaaccggt 480
gggaaattag ggacgatggt gtgatccaat tgtgtttgtg a 521
<210> 27
<211> 363
<212> DNA
<213> 野蕉
<400> 27
atggctggag gaggcaaaag gggtgaagcg tcgtctcttc tacttgtgac gctgctcgtg 60
acgttgttgg ccttcttcgc caccgactcc tcggcagccc gtgtcgcacc ccgtccgcac 120
tccctcgcca gagcggcact gagtgcgttg ggggtaaggc aagatgcgcc gtgctgcaca 180
tgcgtctgtc ctctcattta cccacctcct ttttgctttt gcggcggcgt atggcaaggc 240
tcctgcccgt ccgcctgcac caactgcgag tgtgtcctca acgagtgcac ttgcatcgat 300
cgtgtggacc ccaaggcctg cgaggccgac tcctgtgccg gctcgatgca gcccccaaag 360
tag 363
<210> 28
<211> 428
<212> DNA
<213> 野蕉
<400> 28
atggctggag gaggcaaaag gggtgaagcg tcgtctcttc tacttgtgac gctgctcgtg 60
acgttgttgg ccttcttcgc caccgactcc tcggcagccc gtgtcgcacc ccgtccgcac 120
tccctcgcca gaggtaggta gataaatatg catgcgaact tgtatatgat tgggctggag 180
atcgaggcat cgttaatccc gtcttcatgc tgcagcggca ctgagtgcgt tgggggtaaa 240
gccccttccg cctgcaccaa ctgcgagtgt gtcctcaacg agtgcacttg catcgatcgt 300
gtggacccca aggcctgcga ggccgactcc tgtgccggct ggctcgatgc agcccccaaa 360
gtagagccgt cgcagcagtg ggcgaccgaa gaaaccggtg ggaaattagg gacgatggtg 420
tgatccaa 428
<210> 29
<211> 523
<212> DNA
<213> 野蕉
<400> 29
atggctggag gaggcaaaag gggtgaagcg tcgtctcttc tacttgtgac gctgctcgtg 60
acgttgttgg ccttcttcgc caccgactcc tcggcagccc gtgtcgcacc ccgtccgcac 120
tccctcgcca gaggtaggta gataaatatg catgcgaaca tgtatatatg attgggctgg 180
agatcgaggc atcgttaatc ccgtcttcat gctgcagcgg cactgagtgc gttgggggta 240
aggcaagatg cgccgtgctg cacatgcgtc tgtcctctca tttacccacc tcctttttgc 300
ttttgcggcg gcgtatggca aggctcctgc ccgtccgcct gcaccaactg cgagtgtgtc 360
ctcaacgagt gcacttgcat cgatcgtgtg gaccccaagg cctgcgtggc cgactcctgt 420
gccggctcga tgcagccccc aaagtagagc cgtcgcagca gtgggcgacc gaagaaaccg 480
gtgggaaatt agggacgatg gtgtgatcca attgtgtttg tga 523
<210> 30
<211> 523
<212> DNA
<213> 野蕉
<400> 30
atggctggag gaggcaaaag gggtgaagcg tcgtctcttc tacttgtgac gctgctcgtg 60
acgttgttgg ccttcttcgc caccgactcc tcggcagccc gtgtcgcacc ccgtccgcac 120
tccctcgcca gaggtaggta gataaatatg catgcgaact tgtatatgat tgggctggag 180
atcgaggcat cgttaatccc gtcttcatgc tgcagcggca ctgagtgcgt tgggggtaag 240
gcaagatgcg ccgtgctgca catgcgtctg tcctctcatt tacccacctc ctttttgctt 300
ttgcggcggc gtmtggcaag gctcctgccc gtccgcctgc accaactgcg agtgtgtcct 360
caacgagtgc acttgcatcg atcgtgtgga ccccaaggcc tgcgaggccg actcctgtgc 420
cggctggctc gatgcagccc ccaaagtaga gccgtcgcag cagtgggcga ccgaagaaac 480
cggtgggaaa ttagggacga tggtgtgatc caattgtgtt tgt 523
<210> 31
<211> 753
<212> DNA
<213> 小果野蕉
<400> 31
gtagagacac ttgagttgaa ttctgaatcc attatttctt ctcatgaacg catacgtccc 60
accatacaca ccaaatctta atggctcaag catcgtggca ctataaatag gacaagagga 120
gggatgaggt aaaacgcact ccctcatact tgcacaggta cgttgtgata gaaagttcag 180
aggtaagcga tggctggagg aggcaaaaga ggtgaagcgt cgtctcttct acttgtgacg 240
ctgctcgtga cgttgttggc tttcttcgcc accaactcct cggcagcccg tgtcacaccc 300
cgtccgcaat ccctcgccag agcggcactg agtgcggtgg gggcaaggca agatgagccg 360
tgctgcagat gcgcgtgtcc tctcatttac ccacctactt ggtgcatttg cggcggcata 420
tggcaaggct cctgcccttc cgcctgcaac aactgccagt gtgtcctcaa cgagtgcact 480
tgcctcgatc ttatggaccc caaggtctgc gaggccaact cctgtccctg gcctgttgca 540
gcccccaaag tagagccggc gcagcagtgg gctatcgaag aaaccggtgg gaaattagcg 600
atgatggtgt gatccaattg tgtttgtgat cgcctgtcgt cttctctcgc tccgtcctat 660
ccatctatcc atccatctac ttataatcta tgtcgtgtac cgtcgtgtgg tgttgctttg 720
cttcagtaat aaaaataaaa tgcttctgct ttt 753
<210> 32
<211> 120
<212> PRT
<213> 野蕉
<400> 32
Met Ala Gly Gly Gly Lys Arg Gly Glu Ala Ser Ser Leu Leu Leu Val
1 5 10 15
Thr Leu Leu Val Thr Leu Leu Ala Phe Phe Ala Thr Asp Ser Ser Ala
20 25 30
Ala Arg Val Ala Pro Arg Pro His Ser Leu Ala Arg Ala Ala Leu Ser
35 40 45
Ala Leu Gly Val Arg Gln Asp Ala Pro Cys Cys Thr Cys Val Cys Pro
50 55 60
Leu Ile Tyr Pro Pro Pro Phe Cys Phe Cys Gly Gly Val Trp Gln Gly
65 70 75 80
Ser Cys Pro Ser Ala Cys Thr Asn Cys Glu Cys Val Leu Asn Glu Cys
85 90 95
Thr Cys Ile Asp Arg Val Asp Pro Lys Ala Cys Glu Ala Asp Ser Cys
100 105 110
Ala Gly Ser Met Gln Pro Pro Lys
115 120
Claims (77)
1.一种分离的核酸分子,所述分离的核酸分子包含当在植物中表达时编码对尖孢镰刀菌小种4的易感性的核酸序列SEQ ID NO:14,其中SEQ ID NO:14通过一个、两个、三个或四个核酸取代被修饰,使得所得到的核酸序列当在植物中表达时编码对尖孢镰刀菌小种4的抗性。
2.根据权利要求1所述的分离的核酸分子,其中所述核酸取代包括用G替换对应于SEQID NO:14的位置148的T(148T>G)。
3.根据权利要求1所述的分离的核酸分子,其中所述核酸取代包括用A替换对应于SEQID NO:14的位置323的T(323T>A)。
4.根据权利要求1所述的分离的核酸分子,其中所述核酸取代包括用C替换对应于SEQID NO:14的位置344的G(344G>C)。
5.根据权利要求1所述的分离的核酸分子,其中所述核酸取代包括用T替换对应于SEQID NO:14的位置347的A(347A>T)。
6.根据权利要求1所述的分离的核酸分子,其中所述核酸取代包括用A替换对应于位置323的T(323T>A),用C替换对应于位置344的G(344G>C),和用T替换对应于位置347的A(347A>T),并且其中所有位置均基于SEQ ID NO:14。
7.根据权利要求1所述的分离的核酸分子,其中SEQ ID NO:14编码SEQ ID NO:15的氨基酸序列并且其中所述核酸取代导致用缬氨酸替换对应于SEQ ID NO:15的位置50的亮氨酸(50L>V)。
8.根据权利要求1所述的分离的核酸分子,其中SEQ ID NO:14编码SEQ ID NO:15的氨基酸序列并且其中所述核酸取代导致用谷氨酸替换对应于SEQ ID NO:15的位置108的缬氨酸(108V>E)。
9.根据权利要求1所述的分离的核酸分子,其中SEQ ID NO:14编码SEQ ID NO:15的氨基酸序列并且其中所述核酸取代导致用脯氨酸替换对应于SEQ ID NO:15的位置115的精氨酸115R>P)。
10.根据权利要求1所述的分离的核酸分子,其中SEQ ID NO:14编码SEQ ID NO:15的氨基酸序列并且其中所述核酸取代导致用缬氨酸替换对应于SEQ ID NO:15的位置116的天冬氨酸(116D>V)。
11.根据权利要求1所述的分离的核酸分子,其中SEQ ID NO:14编码SEQ ID NO:15的氨基酸序列并且其中所述核酸取代导致用谷氨酸替换对应于SEQ ID NO:15的位置108的缬氨酸(108V>E)、用脯氨酸替换对应于SEQ ID NO:15的位置115的精氨酸(115R>P)和用缬氨酸替换对应于SEQ ID NO:15的位置116的天冬氨酸(116D>V)。
12.根据权利要求1-11所述的分离的核酸分子,其中所述表达发生在植物细胞、植物组织、植物细胞培养物、植物组织培养物或整株植物中。
13.根据权利要求12所述的分离的核酸分子,其中所述表达发生在芭蕉属细胞、组织、细胞培养物、组织培养物或整株植物中。
14.根据权利要求13所述的分离的核酸分子,其中所述表达发生在小果野蕉细胞、组织、细胞培养物、组织培养物或整株植物中。
15.一种包含权利要求1-11所述的分离的核酸分子的核酸构建体,其中所述核酸序列被可操作地连接至能够驱动所述核酸序列的表达的启动子。
16.根据权利要求15所述的核酸构建体,其中所述启动子是植物启动子。
17.根据权利要求15所述的核酸构建体,其中所述启动子是35S启动子。
18.根据权利要求15所述的核酸构建体,其中所述启动子由SEQ ID NO:31编码。
19.一种包含权利要求15-18所述的核酸构建体的转化载体。
20.一种转化植物细胞的方法,其包括将权利要求19所述的转化载体引入到植物细胞中,由此转化的植物细胞表达编码对尖孢镰刀菌小种4的抗性的核酸序列。
21.根据权利要求20所述的方法,其中所述植物细胞是芭蕉属植物细胞。
22.根据权利要求20所述的方法,其中所述植物细胞是小果野蕉植物细胞。
23.根据权利要求20-22所述的方法,其进一步包括从转化的植物细胞产生转化的植物组织。
24.根据权利要求23所述的方法,其进一步包括从转化的植物组织产生转化的小植株。
25.根据权利要求24所述的方法,其进一步包括产生所述转化的小植株的克隆。
26.根据权利要求24或25所述的方法,其进一步包括将所述转化的小植株或所述转化的小植株的克隆生长成成熟的转化植物。
27.根据权利要求26所述的方法,其中所述成熟的转化植物是芭蕉属植物并且所述成熟的转化的芭蕉属植物能够产生果实。
28.根据权利要求27所述的方法,其进一步包括产生所述成熟的转化的芭蕉属植物的克隆。
29.根据权利要求27或28所述的方法,其进一步包括在育种方法中使用所述成熟的转化的芭蕉属植物或所述成熟的转化的芭蕉属植物的克隆。
30.一种分离的氨基酸分子,所述分离的氨基酸分子包含编码当在植物中产生时导致对尖孢镰刀菌小种4的易感性的蛋白质的SEQ ID NO:15的氨基酸序列,其中SEQ ID NO:15被一个、两个、三个或四个氨基酸取代修饰,使得其编码当在植物中产生时导致对尖孢镰刀菌小种4的抗性的蛋白质。
31.根据权利要求30所述的分离的氨基酸分子,其中所述氨基酸取代包括用缬氨酸替换对应于SEQ ID NO:15的位置50的亮氨酸(50L>V)。
32.根据权利要求30所述的分离的氨基酸分子,其中所述氨基酸取代包括用谷氨酸替换对应于SEQ ID NO:15的位置108的缬氨酸(108V>E)。
33.根据权利要求30所述的分离的氨基酸分子,其中所述氨基酸取代包括用脯氨酸替换对应于SEQ ID NO:15的位置115的精氨酸(115R>P)。
34.根据权利要求30所述的分离的氨基酸分子,其中所述氨基酸取代包括用缬氨酸替换对应于SEQ ID NO:15的位置116的天冬氨酸(116D>V)。
35.根据权利要求30所述的分离的氨基酸分子,其中所述氨基酸取代包括用谷氨酸替换对应于SEQ ID NO:15的位置108的缬氨酸(108V>E),用脯氨酸替换对应于SEQ ID NO:15的位置115的精氨酸(115R>P),以及用缬氨酸替换对应于SEQ ID NO:15的位置116的天冬氨酸(116D>V)。
36.根据权利要求30-35所述的分离的氨基酸分子区段,中所述产生发生在植物细胞、植物组织、植物细胞培养物、植物组织培养物或整株植物中。
37.根据权利要求36所述的分离的氨基酸分子区段,其中所述产生发生在芭蕉属细胞、组织、细胞培养物、组织培养物或整株植物中。
38.根据权利要求36所述的分离的氨基酸分子区段,其中所述产生发生在小果野蕉细胞、组织、细胞培养物、组织培养物或整株植物中。
39.一种核酸构建体,所述核酸构建体包含当在植物中表达时编码对尖孢镰刀菌小种4的抗性的核酸序列,其中所述核酸序列选自由SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:18、SEQ ID NO:21和SEQ ID NO:24组成的群组,并且其中所述核酸序列与能够驱动所述核酸序列的表达的启动子可操作地连接。
40.根据权利要求39所述的核酸构建体,其中所述启动子是植物启动子。
41.根据权利要求39所述的核酸构建体,其中所述启动子是35S启动子。
42.根据权利要求39所述的核酸构建体,其中所述启动子由SEQ ID NO:31编码。
43.一种包含权利要求39-42所述的核酸构建体的转化载体。
44.一种转化植物细胞的方法,其包括将权利要求43所述的转化载体引入到植物细胞中,由此转化的植物细胞表达编码对尖孢镰刀菌小种4的抗性的核酸序列。
45.根据权利要求44所述的方法,其中所述植物细胞是芭蕉属植物细胞。
46.根据权利要求44所述的方法,其中所述植物细胞是小果野蕉植物细胞。
47.根据权利要求44-46所述的方法,其进一步包括从转化的植物细胞产生转化的植物组织。
48.根据权利要求47所述的方法,其进一步包括从所述转化的植物组织产生转化的小植株。
49.根据权利要求48所述的方法,其进一步包括产生所述转化的小植株的克隆。
50.根据权利要求48或49所述的方法,其进一步包括将所述转化的小植株或所述转化的小植株的克隆生长成成熟的转化植物。
51.根据权利要求50所述的方法,其中所述成熟的转化植物是芭蕉属的属植物并且所述成熟的转化的芭蕉属植物能够产生果实。
52.根据权利要求51所述的方法,其进一步包括产生所述成熟的转化的芭蕉属植物的克隆。
53.根据权利要求51或52所述的方法,其进一步包括在育种方法使用所述成熟的转化的芭蕉属植物或所述成熟的转化的芭蕉属植物的克隆。
54.一种香蕉育种方法,其包括将包含编码对尖孢镰刀菌小种4的抗性的核酸序列的第一芭蕉属植物与对尖孢镰刀菌小种4易感的第二芭蕉属植物杂交,并且基于它们对尖孢镰刀菌小种4的抗性选择杂交的所得后代,其中编码对尖孢镰刀菌小种4的抗性的所述核酸序列选自由SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:18、SEQ IDNO:21和SEQ ID NO:24组成的群组。
55.根据权利要求54所述的香蕉育种方法,其进一步包括产生杂交的所得后代的克隆,其中基于它们对尖孢镰刀菌小种4的抗性来选择所述克隆。
56.根据权利要求54所述的香蕉育种方法,其中所述第二芭蕉属植物是小果野蕉植物。
57.根据权利要求54所述的香蕉育种方法,其中使用分子标记物来选择表现出对尖孢镰刀菌小种4的抗性的杂交的后代,所述分子标记物基于编码对尖孢镰刀菌小种4的抗性的核酸序列而设计,所述核酸序列存在于所述杂交中使用的第一芭蕉属植物中。
58.一种用于获得具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物细胞的方法,所述方法包括将双链断裂引入到由SEQ ID NO:14编码的外源性基因中的至少一个位点,以产生具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物细胞。
59.根据权利要求58所述的方法,其进一步包括从具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物细胞产生小果野蕉植物,以产生具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物。
60.根据权利要求59所述的方法,其进一步包括在香蕉育种项目中使用具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物。
61.根据权利要求20或44所述的方法,其中所述植物细胞是权利要求59所述的具有编码对尖孢镰刀菌小种4的易感性的沉默的内源性基因的小果野蕉植物细胞。
62.根据权利要求58所述的方法,其中所述双链断裂由选自由TALEN、巨型核酸酶、锌指核酸酶和CRISPR相关核酸酶组成的群组的核酸酶诱导。
63.根据权利要求62所述的方法,其中所述双链断裂由CRISPR相关核酸酶诱导并且其中提供了向导RNA。
64.一种用于产生对尖孢镰刀菌小种4的抗性的植物细胞的方法,其包括将至少一种遗传修饰引入到一个或多个编码对尖孢镰刀小种4的易感性的内源性核酸序列中,其中所述遗传修饰赋予所述植物细胞对尖孢镰刀菌小种4的抗性。
65.根据权利要求64所述的方法,其中所述至少一种遗传修饰通过TALEN、巨型核酸酶、锌指核酸酶或CRISPR相关核酸酶引入。
66.根据权利要求64所述的方法,其中所述至少一种遗传修饰通过CRISPR相关核酸酶和相关的向导RNA引入。
67.根据权利要求64所述的方法,其中所述至少一种遗传修饰选自由以下组成的列表:用G替换对应于SEQ ID NO:14的位置148的T(148T>G),用A替换对应于SEQ ID NO:14的位置323的T(323T>A),用C替换对应于SEQ ID NO:14的位置344的G(344G>C),和用T替换对应于SEQ ID NO:14的位置347的A(347A>T)。
68.根据权利要求64所述的方法,其中所述至少一种遗传修饰导致选自由以下组成的群组的氨基酸的改变:用缬氨酸替换对应于SEQ ID NO:15的位置50的亮氨酸(50L>V),用谷氨酸替换对应于SEQ ID NO:15的位置108的缬氨酸(108V>E),用脯氨酸替换对应于SEQ IDNO:15的位置115的精氨酸(115R>P),和用缬氨酸替换对应于SEQ ID NO:15的位置116的天冬氨酸(116D>V)。
69.根据权利要求64-68所述的方法,其中所述植物细胞是芭蕉属植物细胞。
70.根据权利要求64-68所述的方法,其中所述植物细胞是小果野蕉植物细胞。
71.根据权利要求64-70所述的方法,其进一步包括从转化的植物细胞产生转化的植物组织。
72.根据权利要求71所述的方法,其进一步包括从转化的植物组织产生转化的小植株。
73.根据权利要求72所述的方法,其进一步包括产生所述转化的小植株的克隆。
74.根据权利要求71或72所述的方法,其进一步包括将所述转化的小植株或所述转化的小植株的克隆生长成成熟的转化植物。
75.根据权利要求74所述的方法,其中所述成熟的转化植物是芭蕉属植物并且所述成熟的转化的芭蕉属植物能够产生果实。
76.根据权利要求75所述的方法,其进一步包括产生所述成熟的转化的芭蕉属植物的克隆。
77.根据权利要求75或76所述的方法,其进一步包括在育种方法使用所述成熟的转化的芭蕉属植物或所述成熟的转化的芭蕉属植物的克隆。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962866872P | 2019-06-26 | 2019-06-26 | |
US62/866,872 | 2019-06-26 | ||
US201962912010P | 2019-10-07 | 2019-10-07 | |
US62/912,010 | 2019-10-07 | ||
PCT/US2020/036828 WO2020263561A1 (en) | 2019-06-26 | 2020-06-09 | Identification of resistance genes from wild relatives of banana and their uses in controlling panama disease |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114641572A true CN114641572A (zh) | 2022-06-17 |
Family
ID=74043501
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080057974.7A Pending CN114641572A (zh) | 2019-06-26 | 2020-06-09 | 来自香蕉的野生近缘种的抗性基因的鉴定及其在控制巴拿马病中的用途 |
Country Status (15)
Country | Link |
---|---|
US (3) | US20210332379A9 (zh) |
EP (1) | EP3990645A4 (zh) |
JP (1) | JP2022539310A (zh) |
CN (1) | CN114641572A (zh) |
AU (1) | AU2020307369A1 (zh) |
BR (1) | BR112021026227A2 (zh) |
CA (1) | CA3143157A1 (zh) |
CO (1) | CO2022000135A2 (zh) |
CR (1) | CR20220013A (zh) |
EC (1) | ECSP22003275A (zh) |
MA (1) | MA56409A (zh) |
MX (1) | MX2022000162A (zh) |
PE (1) | PE20220595A1 (zh) |
WO (1) | WO2020263561A1 (zh) |
ZA (1) | ZA202200835B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3990645A4 (en) | 2019-06-26 | 2023-08-23 | EG Crop Science, Inc. | IDENTIFICATION OF RESISTANCE GENES FROM WILD BANANA RELATIVES AND THEIR USES IN THE CONTROL OF PANAMA DISEASE |
CN114303930B (zh) * | 2021-12-21 | 2023-03-14 | 中国热带农业科学院海口实验站 | 一种提高香蕉结实率的方法 |
WO2023118547A1 (en) | 2021-12-23 | 2023-06-29 | Keygene N.V. | Panama disease resistance in banana |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070204368A1 (en) * | 2003-09-25 | 2007-08-30 | Dale James L | Banana Resistance Genes And Uses Thereof |
CN101899506A (zh) * | 2010-05-18 | 2010-12-01 | 华南农业大学 | 香蕉枯萎病菌1号和4号生理小种检测引物和快速检测方法 |
CN109006000A (zh) * | 2018-08-07 | 2018-12-18 | 广西壮族自治区农业科学院 | 一种鉴定筛选香蕉枯萎病抗耐病种苗的方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6133035A (en) | 1997-07-16 | 2000-10-17 | Dna Plant Technology Corporation | Method of genetically transforming banana plants |
CN1411469A (zh) | 2000-01-06 | 2003-04-16 | 孟山都技术有限公司 | 脱敏蛋白及置换蛋白的制备 |
JP4834554B2 (ja) * | 2003-11-06 | 2011-12-14 | ジェネンコー・インターナショナル・インク | 糸状菌におけるプロテアーゼ抑制剤及びその変異体の発現 |
PA8617201A1 (es) | 2003-11-14 | 2006-09-22 | Israel State | Banana transgenica resistente a enfermedades |
US10508281B2 (en) | 2014-11-12 | 2019-12-17 | Thomas Schmuelling | Disruption of ROCK1 gene leads to plants with improved traits |
GB201708662D0 (en) | 2017-05-31 | 2017-07-12 | Tropic Biosciences Uk Ltd | Compositions and methods for increasing shelf-life of banana |
EP3990645A4 (en) * | 2019-06-26 | 2023-08-23 | EG Crop Science, Inc. | IDENTIFICATION OF RESISTANCE GENES FROM WILD BANANA RELATIVES AND THEIR USES IN THE CONTROL OF PANAMA DISEASE |
-
2020
- 2020-06-09 EP EP20832496.2A patent/EP3990645A4/en active Pending
- 2020-06-09 CN CN202080057974.7A patent/CN114641572A/zh active Pending
- 2020-06-09 WO PCT/US2020/036828 patent/WO2020263561A1/en unknown
- 2020-06-09 AU AU2020307369A patent/AU2020307369A1/en active Pending
- 2020-06-09 PE PE2021002233A patent/PE20220595A1/es unknown
- 2020-06-09 BR BR112021026227A patent/BR112021026227A2/pt unknown
- 2020-06-09 MA MA056409A patent/MA56409A/fr unknown
- 2020-06-09 CR CR20220013A patent/CR20220013A/es unknown
- 2020-06-09 MX MX2022000162A patent/MX2022000162A/es unknown
- 2020-06-09 US US16/896,682 patent/US20210332379A9/en not_active Abandoned
- 2020-06-09 JP JP2021575024A patent/JP2022539310A/ja active Pending
- 2020-06-09 CA CA3143157A patent/CA3143157A1/en active Pending
-
2022
- 2022-01-12 CO CONC2022/0000135A patent/CO2022000135A2/es unknown
- 2022-01-14 EC ECSENADI20223275A patent/ECSP22003275A/es unknown
- 2022-01-18 ZA ZA2022/00835A patent/ZA202200835B/en unknown
- 2022-04-29 US US17/733,561 patent/US11913009B2/en active Active
-
2024
- 2024-02-23 US US18/586,110 patent/US20240254503A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070204368A1 (en) * | 2003-09-25 | 2007-08-30 | Dale James L | Banana Resistance Genes And Uses Thereof |
CN101899506A (zh) * | 2010-05-18 | 2010-12-01 | 华南农业大学 | 香蕉枯萎病菌1号和4号生理小种检测引物和快速检测方法 |
CN109006000A (zh) * | 2018-08-07 | 2018-12-18 | 广西壮族自治区农业科学院 | 一种鉴定筛选香蕉枯萎病抗耐病种苗的方法 |
Non-Patent Citations (6)
Title |
---|
ANGE´LIQUE D’HONT等: "The banana (Musa acuminata) genome and the evolution of monocotyledonous plants", 《NATURE》, vol. 488, 9 August 2012 (2012-08-09), pages 213 - 219 * |
EUKARYOTA等: "PREDICTED: Musa acuminata subsp. malaccensis Bowman-Birk type proteinase inhibitorlike (LOC103984596), transcript variant X2, mRNA", 《GENBANK DATABASE》, 25 October 2016 (2016-10-25), pages 009402124 * |
LI-JIA QU等: "Molecular Cloning and Functional Analysis of a Novel Type of Bowman-Birk Inhibitor Gene Family in Rice", 《PLANT PHYSIOLOGY》, vol. 133, 31 October 2003 (2003-10-31), pages 560 * |
NOËLANI VAN DEN BERG等: "Tolerance in banana to Fusarium wilt is associated with early up-regulation of cell wall-strengthening genes in the roots", 《MOLECULAR PLANT PATHOLOGY》, vol. 8, no. 3, 31 May 2007 (2007-05-31), pages 334, XP055778749, DOI: 10.1111/j.1364-3703.2007.00389.x * |
左存武等: "香蕉对尖孢镰刀菌热带4号小种的抗性评价方法的建立", 《园艺学报》, vol. 43, no. 05, 25 May 2016 (2016-05-25), pages 876 - 884 * |
彭埃天等: "香蕉枯萎病菌4号生理小种分子检测与枯萎病生物防治研究进展", 《果树学报》, vol. 26, no. 01, 15 January 2009 (2009-01-15), pages 77 - 81 * |
Also Published As
Publication number | Publication date |
---|---|
US20200407743A1 (en) | 2020-12-31 |
WO2020263561A1 (en) | 2020-12-30 |
MA56409A (fr) | 2022-05-04 |
BR112021026227A2 (pt) | 2022-03-22 |
JP2022539310A (ja) | 2022-09-08 |
US20240254503A1 (en) | 2024-08-01 |
US11913009B2 (en) | 2024-02-27 |
EP3990645A4 (en) | 2023-08-23 |
CR20220013A (es) | 2022-05-20 |
ZA202200835B (en) | 2023-12-20 |
CA3143157A1 (en) | 2020-12-30 |
CO2022000135A2 (es) | 2022-01-17 |
AU2020307369A1 (en) | 2022-01-20 |
US20220267790A1 (en) | 2022-08-25 |
US20210332379A9 (en) | 2021-10-28 |
ECSP22003275A (es) | 2022-05-31 |
PE20220595A1 (es) | 2022-04-22 |
EP3990645A1 (en) | 2022-05-04 |
MX2022000162A (es) | 2022-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9745596B2 (en) | Identification and use of KRP mutants in wheat | |
US11913009B2 (en) | Identification of resistance genes from wild relatives of banana and their uses in controlling panama disease | |
WO2021000878A1 (en) | Novel genetic loci associated with rust resistance in soybeans | |
US20220372508A1 (en) | Dirigent gene eg261 and its orthologs and paralogs and their uses for pathogen resistance in plants | |
EP2927323A2 (en) | Identification and the use of krp mutants in plants | |
US9862962B2 (en) | Identification and use of tomato genes controlling salt/drought tolerance and fruit sweetness | |
CN111542608A (zh) | 马铃薯y病毒抗性基因及使用方法 | |
OA20947A (en) | Identification of resistance genes from wild relatives of banana and their uses in controlling Panama disease | |
US20230392159A1 (en) | Engineering increased suberin levels by altering gene expression patterns in a cell-type specific manner | |
US9605274B2 (en) | Dirigent gene EG261 and its orthologs and paralogs and their uses for pathogen resistance in plants | |
WO2023164515A2 (en) | Compositions and methods for increasing periderm in plant roots | |
CN115335528A (zh) | 孢囊线虫属病原体抗性基因 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |