TW201639447A - 性別鑑定基因及其在育種上的用途 - Google Patents
性別鑑定基因及其在育種上的用途 Download PDFInfo
- Publication number
- TW201639447A TW201639447A TW105100663A TW105100663A TW201639447A TW 201639447 A TW201639447 A TW 201639447A TW 105100663 A TW105100663 A TW 105100663A TW 105100663 A TW105100663 A TW 105100663A TW 201639447 A TW201639447 A TW 201639447A
- Authority
- TW
- Taiwan
- Prior art keywords
- plant
- gene
- plants
- male
- female
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 492
- 238000009395 breeding Methods 0.000 title claims abstract description 99
- 230000001488 breeding effect Effects 0.000 title claims abstract description 98
- 230000020509 sex determination Effects 0.000 title 1
- 241000196324 Embryophyta Species 0.000 claims abstract description 854
- 238000000034 method Methods 0.000 claims abstract description 137
- 230000010200 gynoecium development Effects 0.000 claims abstract description 111
- 230000014509 gene expression Effects 0.000 claims abstract description 97
- 230000002829 reductive effect Effects 0.000 claims abstract description 29
- 241000234427 Asparagus Species 0.000 claims abstract 6
- 235000005340 Asparagus officinalis Nutrition 0.000 claims description 136
- 101150108692 GDS gene Proteins 0.000 claims description 111
- 230000035772 mutation Effects 0.000 claims description 107
- 244000003416 Asparagus officinalis Species 0.000 claims description 98
- 239000003112 inhibitor Substances 0.000 claims description 90
- 102000004169 proteins and genes Human genes 0.000 claims description 74
- 239000012634 fragment Substances 0.000 claims description 70
- 239000002773 nucleotide Substances 0.000 claims description 63
- 125000003729 nucleotide group Chemical group 0.000 claims description 63
- 238000009396 hybridization Methods 0.000 claims description 57
- 230000005764 inhibitory process Effects 0.000 claims description 45
- 230000010165 autogamy Effects 0.000 claims description 35
- 238000004519 manufacturing process Methods 0.000 claims description 33
- 150000007523 nucleic acids Chemical group 0.000 claims description 30
- 241000894007 species Species 0.000 claims description 30
- 239000002299 complementary DNA Substances 0.000 claims description 29
- 230000002708 enhancing effect Effects 0.000 claims description 26
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 23
- 230000008439 repair process Effects 0.000 claims description 19
- 230000010076 replication Effects 0.000 claims description 19
- 101100293191 Arabidopsis thaliana MYB35 gene Proteins 0.000 claims description 17
- 238000000338 in vitro Methods 0.000 claims description 17
- 230000001603 reducing effect Effects 0.000 claims description 16
- 230000002452 interceptive effect Effects 0.000 claims description 15
- 230000002401 inhibitory effect Effects 0.000 claims description 14
- 238000005516 engineering process Methods 0.000 claims description 13
- 230000002441 reversible effect Effects 0.000 claims description 11
- 102000054766 genetic haplotypes Human genes 0.000 claims description 10
- 230000009467 reduction Effects 0.000 claims description 10
- 231100000350 mutagenesis Toxicity 0.000 claims description 9
- 230000006698 induction Effects 0.000 claims description 8
- 206010047486 Virilism Diseases 0.000 claims description 7
- 230000007423 decrease Effects 0.000 claims description 7
- 231100000794 masculinization Toxicity 0.000 claims description 7
- 230000001939 inductive effect Effects 0.000 claims description 6
- 238000002703 mutagenesis Methods 0.000 claims description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 3
- 230000010159 dioecy Effects 0.000 claims description 3
- 230000002285 radioactive effect Effects 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 3
- 108020004414 DNA Proteins 0.000 claims 1
- 230000009469 supplementation Effects 0.000 claims 1
- 238000009399 inbreeding Methods 0.000 abstract description 15
- 230000000306 recurrent effect Effects 0.000 abstract description 2
- 235000021028 berry Nutrition 0.000 description 124
- 108700028369 Alleles Proteins 0.000 description 105
- 239000003550 marker Substances 0.000 description 100
- 230000002068 genetic effect Effects 0.000 description 90
- 230000010196 hermaphroditism Effects 0.000 description 76
- 235000018102 proteins Nutrition 0.000 description 68
- 102100020720 Calcium channel flower homolog Human genes 0.000 description 67
- 101000932468 Homo sapiens Calcium channel flower homolog Proteins 0.000 description 66
- 230000011987 methylation Effects 0.000 description 62
- 238000007069 methylation reaction Methods 0.000 description 62
- 238000011161 development Methods 0.000 description 60
- 230000018109 developmental process Effects 0.000 description 60
- 244000193174 agave Species 0.000 description 54
- 230000006870 function Effects 0.000 description 51
- 238000012360 testing method Methods 0.000 description 48
- 235000013399 edible fruits Nutrition 0.000 description 45
- 241000219194 Arabidopsis Species 0.000 description 43
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 40
- 238000002474 experimental method Methods 0.000 description 40
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 37
- 150000001413 amino acids Chemical group 0.000 description 33
- 108091092878 Microsatellite Proteins 0.000 description 30
- 238000003559 RNA-seq method Methods 0.000 description 30
- 210000004027 cell Anatomy 0.000 description 30
- 238000012217 deletion Methods 0.000 description 30
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 29
- 230000037430 deletion Effects 0.000 description 28
- 238000004458 analytical method Methods 0.000 description 27
- 230000006798 recombination Effects 0.000 description 25
- 238000005215 recombination Methods 0.000 description 25
- 235000001014 amino acid Nutrition 0.000 description 23
- 229940024606 amino acid Drugs 0.000 description 22
- 238000012163 sequencing technique Methods 0.000 description 22
- 230000008128 stamen development Effects 0.000 description 22
- 238000003780 insertion Methods 0.000 description 20
- 239000000047 product Substances 0.000 description 20
- 230000008859 change Effects 0.000 description 19
- 210000000349 chromosome Anatomy 0.000 description 19
- 239000000523 sample Substances 0.000 description 19
- 240000007594 Oryza sativa Species 0.000 description 18
- 235000007164 Oryza sativa Nutrition 0.000 description 18
- 229940104302 cytosine Drugs 0.000 description 18
- 230000037431 insertion Effects 0.000 description 18
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 18
- 206010021929 Infertility male Diseases 0.000 description 16
- 208000007466 Male Infertility Diseases 0.000 description 16
- 230000005855 radiation Effects 0.000 description 16
- 210000001519 tissue Anatomy 0.000 description 16
- 229930024421 Adenine Natural products 0.000 description 15
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 15
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 15
- 108700003861 Dominant Genes Proteins 0.000 description 15
- 229960000643 adenine Drugs 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 15
- 230000000875 corresponding effect Effects 0.000 description 15
- 235000009566 rice Nutrition 0.000 description 15
- 230000000692 anti-sense effect Effects 0.000 description 14
- 230000000694 effects Effects 0.000 description 14
- 229940113082 thymine Drugs 0.000 description 14
- 108020004999 messenger RNA Proteins 0.000 description 13
- 235000015097 nutrients Nutrition 0.000 description 13
- 238000000926 separation method Methods 0.000 description 13
- 230000008685 targeting Effects 0.000 description 13
- 101100132367 Arabidopsis thaliana MYB80 gene Proteins 0.000 description 12
- 102000039446 nucleic acids Human genes 0.000 description 12
- 108020004707 nucleic acids Proteins 0.000 description 12
- 210000003765 sex chromosome Anatomy 0.000 description 12
- 238000013519 translation Methods 0.000 description 12
- 210000000056 organ Anatomy 0.000 description 11
- 230000008775 paternal effect Effects 0.000 description 11
- 230000001850 reproductive effect Effects 0.000 description 11
- 238000012546 transfer Methods 0.000 description 11
- 230000014616 translation Effects 0.000 description 11
- 206010069754 Acquired gene mutation Diseases 0.000 description 10
- 102000004190 Enzymes Human genes 0.000 description 10
- 108090000790 Enzymes Proteins 0.000 description 10
- 108091023040 Transcription factor Proteins 0.000 description 10
- 102000040945 Transcription factor Human genes 0.000 description 10
- 230000002950 deficient Effects 0.000 description 10
- 229940088598 enzyme Drugs 0.000 description 10
- 230000001105 regulatory effect Effects 0.000 description 10
- 230000003252 repetitive effect Effects 0.000 description 10
- 239000000243 solution Substances 0.000 description 10
- 230000000392 somatic effect Effects 0.000 description 10
- 230000037439 somatic mutation Effects 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- 102100039208 Cytochrome P450 3A5 Human genes 0.000 description 9
- 241001320695 Hermas Species 0.000 description 9
- 101000745710 Homo sapiens Cytochrome P450 3A5 Proteins 0.000 description 9
- 230000012010 growth Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000000717 retained effect Effects 0.000 description 9
- 238000007480 sanger sequencing Methods 0.000 description 9
- 241000589158 Agrobacterium Species 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 8
- 102100034343 Integrase Human genes 0.000 description 8
- 210000002593 Y chromosome Anatomy 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 8
- 238000002955 isolation Methods 0.000 description 8
- 238000002372 labelling Methods 0.000 description 8
- 239000000463 material Substances 0.000 description 8
- 238000002844 melting Methods 0.000 description 8
- 230000008018 melting Effects 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 102000054765 polymorphisms of proteins Human genes 0.000 description 8
- 108091008146 restriction endonucleases Proteins 0.000 description 8
- 230000001568 sexual effect Effects 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 8
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 7
- 230000007067 DNA methylation Effects 0.000 description 7
- 108700024394 Exon Proteins 0.000 description 7
- 206010049290 Feminisation acquired Diseases 0.000 description 7
- 208000034793 Feminization Diseases 0.000 description 7
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 7
- 108700005079 Recessive Genes Proteins 0.000 description 7
- 102000052708 Recessive Genes Human genes 0.000 description 7
- 230000007152 anther development Effects 0.000 description 7
- 230000002072 anti-mutant effect Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 230000027455 binding Effects 0.000 description 7
- 230000007850 degeneration Effects 0.000 description 7
- 210000002257 embryonic structure Anatomy 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 7
- 230000001965 increasing effect Effects 0.000 description 7
- 230000021121 meiosis Effects 0.000 description 7
- 238000007481 next generation sequencing Methods 0.000 description 7
- 210000001672 ovary Anatomy 0.000 description 7
- 230000037361 pathway Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 230000001052 transient effect Effects 0.000 description 7
- 241000219195 Arabidopsis thaliana Species 0.000 description 6
- GUTLYIVDDKVIGB-OUBTZVSYSA-N Cobalt-60 Chemical compound [60Co] GUTLYIVDDKVIGB-OUBTZVSYSA-N 0.000 description 6
- 102100033126 Phosphatidate cytidylyltransferase 2 Human genes 0.000 description 6
- 101710178746 Phosphatidate cytidylyltransferase 2 Proteins 0.000 description 6
- 108010064851 Plant Proteins Proteins 0.000 description 6
- 102100028680 Protein patched homolog 1 Human genes 0.000 description 6
- 101710161390 Protein patched homolog 1 Proteins 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 108700025695 Suppressor Genes Proteins 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 230000004075 alteration Effects 0.000 description 6
- 238000001369 bisulfite sequencing Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000002759 chromosomal effect Effects 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 230000005251 gamma ray Effects 0.000 description 6
- 238000013507 mapping Methods 0.000 description 6
- 230000013011 mating Effects 0.000 description 6
- 230000001404 mediated effect Effects 0.000 description 6
- 235000021118 plant-derived protein Nutrition 0.000 description 6
- 230000033458 reproduction Effects 0.000 description 6
- 230000010153 self-pollination Effects 0.000 description 6
- 230000023939 stigma development Effects 0.000 description 6
- 230000009261 transgenic effect Effects 0.000 description 6
- 101100440894 Arabidopsis thaliana CP33 gene Proteins 0.000 description 5
- 101710178747 Phosphatidate cytidylyltransferase 1 Proteins 0.000 description 5
- 102100031075 Serine/threonine-protein kinase Chk2 Human genes 0.000 description 5
- 240000008042 Zea mays Species 0.000 description 5
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 210000003484 anatomy Anatomy 0.000 description 5
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 230000007547 defect Effects 0.000 description 5
- 230000007812 deficiency Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 230000030279 gene silencing Effects 0.000 description 5
- 238000012252 genetic analysis Methods 0.000 description 5
- 238000011835 investigation Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 238000003976 plant breeding Methods 0.000 description 5
- 238000012552 review Methods 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 238000005204 segregation Methods 0.000 description 5
- 238000002741 site-directed mutagenesis Methods 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 101100433747 Arabidopsis thaliana ABCA2 gene Proteins 0.000 description 4
- 101100288148 Arabidopsis thaliana KNAT5 gene Proteins 0.000 description 4
- 101100293190 Arabidopsis thaliana MYB34 gene Proteins 0.000 description 4
- 101100135611 Arabidopsis thaliana PAP12 gene Proteins 0.000 description 4
- 108010027344 Basic Helix-Loop-Helix Transcription Factors Proteins 0.000 description 4
- 102000018720 Basic Helix-Loop-Helix Transcription Factors Human genes 0.000 description 4
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 4
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 4
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 4
- 235000002566 Capsicum Nutrition 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 4
- 108010042407 Endonucleases Proteins 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 101100208763 Oryza sativa subsp. japonica UDT1 gene Proteins 0.000 description 4
- 239000006002 Pepper Substances 0.000 description 4
- 235000016761 Piper aduncum Nutrition 0.000 description 4
- 240000003889 Piper guineense Species 0.000 description 4
- 235000017804 Piper guineense Nutrition 0.000 description 4
- 235000008184 Piper nigrum Nutrition 0.000 description 4
- 108010029485 Protein Isoforms Proteins 0.000 description 4
- 102000001708 Protein Isoforms Human genes 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- 241001464837 Viridiplantae Species 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 4
- 239000011543 agarose gel Substances 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 4
- 238000011109 contamination Methods 0.000 description 4
- 235000005822 corn Nutrition 0.000 description 4
- 238000005520 cutting process Methods 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 4
- -1 diethyl sulfate Ester Chemical class 0.000 description 4
- 230000035558 fertility Effects 0.000 description 4
- 238000012226 gene silencing method Methods 0.000 description 4
- 230000001976 improved effect Effects 0.000 description 4
- 239000012071 phase Substances 0.000 description 4
- 230000010152 pollination Effects 0.000 description 4
- 230000032361 posttranscriptional gene silencing Effects 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 230000001737 promoting effect Effects 0.000 description 4
- 230000000644 propagated effect Effects 0.000 description 4
- 210000001938 protoplast Anatomy 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- FSYKKLYZXJSNPZ-UHFFFAOYSA-N sarcosine Chemical compound C[NH2+]CC([O-])=O FSYKKLYZXJSNPZ-UHFFFAOYSA-N 0.000 description 4
- 101150033532 virG gene Proteins 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 101150084750 1 gene Proteins 0.000 description 3
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 3
- 108020005544 Antisense RNA Proteins 0.000 description 3
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 3
- 108091033409 CRISPR Proteins 0.000 description 3
- 238000010354 CRISPR gene editing Methods 0.000 description 3
- 241001164374 Calyx Species 0.000 description 3
- 206010068051 Chimerism Diseases 0.000 description 3
- 108091062157 Cis-regulatory element Proteins 0.000 description 3
- 108700029231 Developmental Genes Proteins 0.000 description 3
- 206010059866 Drug resistance Diseases 0.000 description 3
- 102100031780 Endonuclease Human genes 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 3
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 3
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- 101150074741 MDH1 gene Proteins 0.000 description 3
- 108060004795 Methyltransferase Proteins 0.000 description 3
- 102000016397 Methyltransferase Human genes 0.000 description 3
- 108020004485 Nonsense Codon Proteins 0.000 description 3
- 101710163270 Nuclease Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 108700001094 Plant Genes Proteins 0.000 description 3
- 241000985694 Polypodiopsida Species 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- 108700008625 Reporter Genes Proteins 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 101100018379 Shigella flexneri icsA gene Proteins 0.000 description 3
- 241000219289 Silene Species 0.000 description 3
- 235000002597 Solanum melongena Nutrition 0.000 description 3
- 244000061458 Solanum melongena Species 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- 102100033254 Tumor suppressor ARF Human genes 0.000 description 3
- 101100476911 Yersinia enterocolitica yscW gene Proteins 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000011681 asexual reproduction Effects 0.000 description 3
- 238000013465 asexual reproduction Methods 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000031018 biological processes and functions Effects 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 230000010154 cross-pollination Effects 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 238000004090 dissolution Methods 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000004547 gene signature Effects 0.000 description 3
- 230000007614 genetic variation Effects 0.000 description 3
- 230000006607 hypermethylation Effects 0.000 description 3
- 239000012535 impurity Substances 0.000 description 3
- 108010053156 lipid transfer protein Proteins 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 230000008774 maternal effect Effects 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 238000002493 microarray Methods 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 210000002706 plastid Anatomy 0.000 description 3
- 238000003908 quality control method Methods 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 230000004960 subcellular localization Effects 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 229940104230 thymidine Drugs 0.000 description 3
- 231100000331 toxic Toxicity 0.000 description 3
- 230000002588 toxic effect Effects 0.000 description 3
- 238000002054 transplantation Methods 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- IAKHMKGGTNLKSZ-INIZCTEOSA-N (S)-colchicine Chemical compound C1([C@@H](NC(C)=O)CC2)=CC(=O)C(OC)=CC=C1C1=C2C=C(OC)C(OC)=C1OC IAKHMKGGTNLKSZ-INIZCTEOSA-N 0.000 description 2
- 101150028074 2 gene Proteins 0.000 description 2
- 101150111419 ATH1 gene Proteins 0.000 description 2
- 241001270131 Agaricus moelleri Species 0.000 description 2
- 108700007036 Arabidopsis TDF1 Proteins 0.000 description 2
- 101100324810 Arabidopsis thaliana ATH1 gene Proteins 0.000 description 2
- 101000980996 Arabidopsis thaliana Phosphatidate cytidylyltransferase 3 Proteins 0.000 description 2
- BHELIUBJHYAEDK-OAIUPTLZSA-N Aspoxicillin Chemical compound C1([C@H](C(=O)N[C@@H]2C(N3[C@H](C(C)(C)S[C@@H]32)C(O)=O)=O)NC(=O)[C@H](N)CC(=O)NC)=CC=C(O)C=C1 BHELIUBJHYAEDK-OAIUPTLZSA-N 0.000 description 2
- 101150002428 Atoh1 gene Proteins 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 2
- 235000006008 Brassica napus var napus Nutrition 0.000 description 2
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 2
- 244000188595 Brassica sinapistrum Species 0.000 description 2
- 101100344720 Caenorhabditis elegans mdh-1 gene Proteins 0.000 description 2
- 101100057132 Candida albicans (strain SC5314 / ATCC MYA-2876) ATC1 gene Proteins 0.000 description 2
- 108091006146 Channels Proteins 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 240000008067 Cucumis sativus Species 0.000 description 2
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 2
- 102100039203 Cytochrome P450 3A7 Human genes 0.000 description 2
- 230000030933 DNA methylation on cytosine Effects 0.000 description 2
- 101100136092 Drosophila melanogaster peng gene Proteins 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 102100038804 FK506-binding protein-like Human genes 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- 101000745715 Homo sapiens Cytochrome P450 3A7 Proteins 0.000 description 2
- 101000623713 Homo sapiens Motile sperm domain-containing protein 3 Proteins 0.000 description 2
- 241000218228 Humulus Species 0.000 description 2
- 241000257303 Hymenoptera Species 0.000 description 2
- GHSJKUNUIHUPDF-BYPYZUCNSA-N L-thialysine Chemical compound NCCSC[C@H](N)C(O)=O GHSJKUNUIHUPDF-BYPYZUCNSA-N 0.000 description 2
- 101150116579 LTP1 gene Proteins 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- 101150058595 MDH gene Proteins 0.000 description 2
- 101150019925 MDH2 gene Proteins 0.000 description 2
- 101150118867 ML4 gene Proteins 0.000 description 2
- 102100025169 Max-binding protein MNT Human genes 0.000 description 2
- 101100122010 Methanocella arvoryzae (strain DSM 22066 / NBRC 105507 / MRE50) glmM gene Proteins 0.000 description 2
- 102100023091 Motile sperm domain-containing protein 3 Human genes 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 235000003445 Pistacia Nutrition 0.000 description 2
- 241000543704 Pistacia Species 0.000 description 2
- 241000965485 Prodiplosis longifila Species 0.000 description 2
- 108010026552 Proteome Proteins 0.000 description 2
- 238000001190 Q-PCR Methods 0.000 description 2
- 108020005067 RNA Splice Sites Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 108700005075 Regulator Genes Proteins 0.000 description 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 2
- 108010077895 Sarcosine Proteins 0.000 description 2
- 101100495925 Schizosaccharomyces pombe (strain 972 / ATCC 24843) chr3 gene Proteins 0.000 description 2
- 108010016634 Seed Storage Proteins Proteins 0.000 description 2
- PXIPVTKHYLBLMZ-UHFFFAOYSA-N Sodium azide Chemical compound [Na+].[N-]=[N+]=[N-] PXIPVTKHYLBLMZ-UHFFFAOYSA-N 0.000 description 2
- 240000003768 Solanum lycopersicum Species 0.000 description 2
- 101000942680 Sus scrofa Clusterin Proteins 0.000 description 2
- 241001116500 Taxus Species 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 102100029373 Transcription factor ATOH1 Human genes 0.000 description 2
- 101710103850 Transcription factor MYB34 Proteins 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- 239000013504 Triton X-100 Substances 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 206010000210 abortion Diseases 0.000 description 2
- 231100000176 abortion Toxicity 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 108010045649 agarase Proteins 0.000 description 2
- 230000010177 andromonoecy Effects 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 229910052918 calcium silicate Inorganic materials 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000009402 cross-breeding Methods 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000009034 developmental inhibition Effects 0.000 description 2
- 230000013020 embryo development Effects 0.000 description 2
- 210000002615 epidermis Anatomy 0.000 description 2
- 230000008995 epigenetic change Effects 0.000 description 2
- 229940011871 estrogen Drugs 0.000 description 2
- 239000000262 estrogen Substances 0.000 description 2
- 108010093305 exopolygalacturonase Proteins 0.000 description 2
- 230000008124 floral development Effects 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000004545 gene duplication Effects 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 239000003966 growth inhibitor Substances 0.000 description 2
- 239000002515 guano Substances 0.000 description 2
- 230000002363 herbicidal effect Effects 0.000 description 2
- 239000004009 herbicide Substances 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 230000000652 homosexual effect Effects 0.000 description 2
- 238000003018 immunoassay Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000000126 in silico method Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 239000012139 lysis buffer Substances 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 238000011880 melting curve analysis Methods 0.000 description 2
- 230000020429 meristem development Effects 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 238000002887 multiple sequence alignment Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 238000000053 physical method Methods 0.000 description 2
- 230000008635 plant growth Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000003127 radioimmunoassay Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000005070 ripening Effects 0.000 description 2
- 230000035936 sexual power Effects 0.000 description 2
- 230000037432 silent mutation Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 210000001082 somatic cell Anatomy 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 229910021653 sulphate ion Inorganic materials 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 108091006107 transcriptional repressors Proteins 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 230000001228 trophic effect Effects 0.000 description 2
- 230000003827 upregulation Effects 0.000 description 2
- 108700026220 vif Genes Proteins 0.000 description 2
- 101150085703 vir gene Proteins 0.000 description 2
- 101150076562 virB gene Proteins 0.000 description 2
- 230000028604 virus induced gene silencing Effects 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- QCHFTSOMWOSFHM-WPRPVWTQSA-N (+)-Pilocarpine Chemical compound C1OC(=O)[C@@H](CC)[C@H]1CC1=CN=CN1C QCHFTSOMWOSFHM-WPRPVWTQSA-N 0.000 description 1
- OQCFWECOQNPQCG-UHFFFAOYSA-N 1,3,4,8-tetrahydropyrimido[4,5-c]oxazin-7-one Chemical compound C1CONC2=C1C=NC(=O)N2 OQCFWECOQNPQCG-UHFFFAOYSA-N 0.000 description 1
- NUKQEEMKQGMUQH-UHFFFAOYSA-N 1-methyl-1-nitrosoguanidine Chemical compound O=NN(C)C(N)=N NUKQEEMKQGMUQH-UHFFFAOYSA-N 0.000 description 1
- 101150072531 10 gene Proteins 0.000 description 1
- 101150029062 15 gene Proteins 0.000 description 1
- IHPYMWDTONKSCO-UHFFFAOYSA-N 2,2'-piperazine-1,4-diylbisethanesulfonic acid Chemical compound OS(=O)(=O)CCN1CCN(CCS(O)(=O)=O)CC1 IHPYMWDTONKSCO-UHFFFAOYSA-N 0.000 description 1
- WTLKTXIHIHFSGU-UHFFFAOYSA-N 2-nitrosoguanidine Chemical compound NC(N)=NN=O WTLKTXIHIHFSGU-UHFFFAOYSA-N 0.000 description 1
- 101150033839 4 gene Proteins 0.000 description 1
- 101150017816 40 gene Proteins 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- HUNCSWANZMJLPM-UHFFFAOYSA-N 5-methyltryptophan Chemical compound CC1=CC=C2NC=C(CC(N)C(O)=O)C2=C1 HUNCSWANZMJLPM-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 241001504639 Alcedo atthis Species 0.000 description 1
- 101100456369 Aquifex aeolicus (strain VF5) mdh1 gene Proteins 0.000 description 1
- 108700021158 Arabidopsis FWA Proteins 0.000 description 1
- 101100433920 Arabidopsis thaliana ACO4 gene Proteins 0.000 description 1
- 101100503240 Arabidopsis thaliana FOLT1 gene Proteins 0.000 description 1
- 101100175473 Arabidopsis thaliana GL1 gene Proteins 0.000 description 1
- 101100293189 Arabidopsis thaliana MYB33 gene Proteins 0.000 description 1
- 101100132357 Arabidopsis thaliana MYB65 gene Proteins 0.000 description 1
- 235000012871 Arctostaphylos uva ursi Nutrition 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000123643 Asparagaceae Species 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241001404726 Asparagoideae Species 0.000 description 1
- 241000674147 Asparagus altissimus Species 0.000 description 1
- 244000145717 Asparagus aphyllus Species 0.000 description 1
- 241000635846 Asparagus inderiensis Species 0.000 description 1
- 241000432828 Asparagus kiusianus Species 0.000 description 1
- 241000605558 Asparagus maritimus Species 0.000 description 1
- 241001408926 Asparagus officinalis subsp. prostratus Species 0.000 description 1
- 241000432831 Asparagus oligoclonos Species 0.000 description 1
- 241000635962 Asparagus plocamoides Species 0.000 description 1
- 241000432769 Asparagus stipularis Species 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 229930192334 Auxin Natural products 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- NOWKCMXCCJGMRR-UHFFFAOYSA-N Aziridine Chemical compound C1CN1 NOWKCMXCCJGMRR-UHFFFAOYSA-N 0.000 description 1
- 101150079123 Bad gene Proteins 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 241000283725 Bos Species 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000012905 Brassica oleracea var viridis Nutrition 0.000 description 1
- 238000010446 CRISPR interference Methods 0.000 description 1
- 101100076252 Caenorhabditis elegans mdh-2 gene Proteins 0.000 description 1
- 101100240528 Caenorhabditis elegans nhr-23 gene Proteins 0.000 description 1
- 101100422770 Caenorhabditis elegans sup-1 gene Proteins 0.000 description 1
- 101710131373 Calpain small subunit 1 Proteins 0.000 description 1
- 241000218236 Cannabis Species 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 1
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 1
- KXDHJXZQYSOELW-UHFFFAOYSA-M Carbamate Chemical compound NC([O-])=O KXDHJXZQYSOELW-UHFFFAOYSA-M 0.000 description 1
- 235000009467 Carica papaya Nutrition 0.000 description 1
- 240000006432 Carica papaya Species 0.000 description 1
- LZZYPRNAOMGNLH-UHFFFAOYSA-M Cetrimonium bromide Chemical compound [Br-].CCCCCCCCCCCCCCCC[N+](C)(C)C LZZYPRNAOMGNLH-UHFFFAOYSA-M 0.000 description 1
- 241000195628 Chlorophyta Species 0.000 description 1
- 102100029318 Chondroitin sulfate synthase 1 Human genes 0.000 description 1
- 235000010523 Cicer arietinum Nutrition 0.000 description 1
- 244000045195 Cicer arietinum Species 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 201000000233 Coffin-Siris syndrome 1 Diseases 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 235000004035 Cryptotaenia japonica Nutrition 0.000 description 1
- 241000219112 Cucumis Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 241000274965 Cyrestis thyodamas Species 0.000 description 1
- 102100024812 DNA (cytosine-5)-methyltransferase 3A Human genes 0.000 description 1
- 108050002829 DNA (cytosine-5)-methyltransferase 3A Proteins 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 241000218165 Dioscoreophyllum Species 0.000 description 1
- 101100082633 Drosophila melanogaster nub gene Proteins 0.000 description 1
- 108700039964 Duplicate Genes Proteins 0.000 description 1
- 206010058314 Dysplasia Diseases 0.000 description 1
- 101150026775 EAT1 gene Proteins 0.000 description 1
- 102000010911 Enzyme Precursors Human genes 0.000 description 1
- 108010062466 Enzyme Precursors Proteins 0.000 description 1
- 101100288094 Escherichia coli aphA1 gene Proteins 0.000 description 1
- 101100440919 Escherichia phage 186 CP80 gene Proteins 0.000 description 1
- 101100440920 Escherichia phage 186 CP81 gene Proteins 0.000 description 1
- PLUBXMRUUVWRLT-UHFFFAOYSA-N Ethyl methanesulfonate Chemical compound CCOS(C)(=O)=O PLUBXMRUUVWRLT-UHFFFAOYSA-N 0.000 description 1
- IAYPIBMASNFSPL-UHFFFAOYSA-N Ethylene oxide Chemical compound C1CO1 IAYPIBMASNFSPL-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241001147665 Foraminifera Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 102000005720 Glutathione transferase Human genes 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- 108091071244 HSP26 family Proteins 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101001031402 Homo sapiens FK506-binding protein-like Proteins 0.000 description 1
- 101000874141 Homo sapiens Probable ATP-dependent RNA helicase DDX43 Proteins 0.000 description 1
- 101000964421 Homo sapiens Zinc finger and BTB domain-containing protein 12 Proteins 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- 206010020649 Hyperkeratosis Diseases 0.000 description 1
- 101100049353 Hypocrea virens (strain Gv29-8 / FGSC 10586) virC gene Proteins 0.000 description 1
- 206010021928 Infertility female Diseases 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- 108010044467 Isoenzymes Proteins 0.000 description 1
- 102000011782 Keratins Human genes 0.000 description 1
- 108010076876 Keratins Proteins 0.000 description 1
- 101100288095 Klebsiella pneumoniae neo gene Proteins 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical class C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101150019256 MYB34 gene Proteins 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- 240000000233 Melia azedarach Species 0.000 description 1
- 101710169670 Myb-related protein 308 Proteins 0.000 description 1
- FUSGACRLAFQQRL-UHFFFAOYSA-N N-Ethyl-N-nitrosourea Chemical compound CCN(N=O)C(N)=O FUSGACRLAFQQRL-UHFFFAOYSA-N 0.000 description 1
- ZRKWMRDKSOPRRS-UHFFFAOYSA-N N-Methyl-N-nitrosourea Chemical compound O=NN(C)C(N)=O ZRKWMRDKSOPRRS-UHFFFAOYSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 101100522129 Oryza sativa subsp. japonica PTC1 gene Proteins 0.000 description 1
- 101001000260 Oryza sativa subsp. japonica Transcription factor MYB80 Proteins 0.000 description 1
- 239000007990 PIPES buffer Substances 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 229920005439 Perspex® Polymers 0.000 description 1
- 235000010659 Phoenix dactylifera Nutrition 0.000 description 1
- 244000104275 Phoenix dactylifera Species 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241001495084 Phylo Species 0.000 description 1
- 108020005120 Plant DNA Proteins 0.000 description 1
- 108010059820 Polygalacturonase Proteins 0.000 description 1
- 102100035724 Probable ATP-dependent RNA helicase DDX43 Human genes 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- WDVSHHCDHLJJJR-UHFFFAOYSA-N Proflavine Chemical compound C1=CC(N)=CC2=NC3=CC(N)=CC=C3C=C21 WDVSHHCDHLJJJR-UHFFFAOYSA-N 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 101100290490 Rattus norvegicus Mdh1 gene Proteins 0.000 description 1
- 102000014011 SANT domains Human genes 0.000 description 1
- 108050003888 SANT domains Proteins 0.000 description 1
- QCHFTSOMWOSFHM-UHFFFAOYSA-N SJ000285536 Natural products C1OC(=O)C(CC)C1CC1=CN=CN1C QCHFTSOMWOSFHM-UHFFFAOYSA-N 0.000 description 1
- 102100036546 Salivary acidic proline-rich phosphoprotein 1/2 Human genes 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 101100194363 Schizosaccharomyces pombe (strain 972 / ATCC 24843) res2 gene Proteins 0.000 description 1
- 241000239226 Scorpiones Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 102100022978 Sex-determining region Y protein Human genes 0.000 description 1
- 241000589324 Solanum quadriloculatum Species 0.000 description 1
- 235000000644 Solanum quadriloculatum Nutrition 0.000 description 1
- 241000187191 Streptomyces viridochromogenes Species 0.000 description 1
- 101710151717 Stress-related protein Proteins 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical compound OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 101150077085 TCP1 gene Proteins 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 101710103849 Transcription factor MYB35 Proteins 0.000 description 1
- 101710103859 Transcription factor MYB76 Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 102000007641 Trefoil Factors Human genes 0.000 description 1
- 235000015724 Trifolium pratense Nutrition 0.000 description 1
- 239000007984 Tris EDTA buffer Substances 0.000 description 1
- 244000003892 Vaccinium erythrocarpum Species 0.000 description 1
- 241000792914 Valeriana Species 0.000 description 1
- 235000013832 Valeriana officinalis Nutrition 0.000 description 1
- 244000126014 Valeriana officinalis Species 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 240000004517 Willughbeia edulis Species 0.000 description 1
- 210000001766 X chromosome Anatomy 0.000 description 1
- 108700029634 Y-Linked Genes Proteins 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 102100040328 Zinc finger and BTB domain-containing protein 12 Human genes 0.000 description 1
- 108091007916 Zinc finger transcription factors Proteins 0.000 description 1
- 102000038627 Zinc finger transcription factors Human genes 0.000 description 1
- 102000011041 Zinc finger, CCHC-type Human genes 0.000 description 1
- 108050001235 Zinc finger, CCHC-type Proteins 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 101150039403 ams gene Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 239000002363 auxin Substances 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000011712 cell development Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- WXANAQMHYPHTGY-UHFFFAOYSA-N cerium;ethyne Chemical compound [Ce].[C-]#[C] WXANAQMHYPHTGY-UHFFFAOYSA-N 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000008711 chromosomal rearrangement Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 230000009194 climbing Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 229960001338 colchicine Drugs 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 239000012297 crystallization seed Substances 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000000432 density-gradient centrifugation Methods 0.000 description 1
- 210000003298 dental enamel Anatomy 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000001784 detoxification Methods 0.000 description 1
- UREBDLICKHMUKA-CXSFZGCWSA-N dexamethasone Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@]2(F)[C@@H]1[C@@H]1C[C@@H](C)[C@@](C(=O)CO)(O)[C@@]1(C)C[C@@H]2O UREBDLICKHMUKA-CXSFZGCWSA-N 0.000 description 1
- 229960003957 dexamethasone Drugs 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 229940008406 diethyl sulfate Drugs 0.000 description 1
- 238000004980 dosimetry Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000002550 fecal effect Effects 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 230000001135 feminizing effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 239000008098 formaldehyde solution Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000007849 functional defect Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000008303 genetic mechanism Effects 0.000 description 1
- 210000004392 genitalia Anatomy 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000011905 homologation Methods 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 101150046722 idh1 gene Proteins 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 239000007943 implant Substances 0.000 description 1
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 208000000509 infertility Diseases 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 208000021267 infertility disease Diseases 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000002085 irritant Substances 0.000 description 1
- 231100000021 irritant Toxicity 0.000 description 1
- 101150044508 key gene Proteins 0.000 description 1
- 238000003368 label free method Methods 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000005923 long-lasting effect Effects 0.000 description 1
- 150000002668 lysine derivatives Chemical class 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 230000001356 masculinizing effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000005305 organ development Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 238000012261 overproduction Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000001776 parthenogenetic effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 101150037117 pct-1 gene Proteins 0.000 description 1
- 210000002824 peroxisome Anatomy 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 229960001416 pilocarpine Drugs 0.000 description 1
- 230000008121 plant development Effects 0.000 description 1
- 230000026786 pollen maturation Effects 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 230000003234 polygenic effect Effects 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 239000004926 polymethyl methacrylate Substances 0.000 description 1
- 229910052573 porcelain Inorganic materials 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 229960000286 proflavine Drugs 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000018883 protein targeting Effects 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000012925 reference material Substances 0.000 description 1
- 230000003938 response to stress Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 229940043230 sarcosine Drugs 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 210000004999 sex organ Anatomy 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 230000005259 style development Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000005029 transcription elongation Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 210000002993 trophoblast Anatomy 0.000 description 1
- 238000010396 two-hybrid screening Methods 0.000 description 1
- 235000016788 valerian Nutrition 0.000 description 1
- 235000017468 valeriana Nutrition 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/02—Methods or apparatus for hybridisation; Artificial pollination ; Fertility
- A01H1/022—Genic fertility modification, e.g. apomixis
- A01H1/024—Female sterility
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/04—Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
- A01H1/045—Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection using molecular markers
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/06—Processes for producing mutations, e.g. treatment with chemicals or with radiation
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
- A01H5/04—Stems
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H6/00—Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
- A01H6/12—Asparagaceae, e.g. Hosta
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8287—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Botany (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Developmental Biology & Embryology (AREA)
- Environmental Sciences (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Physiology (AREA)
- Physics & Mathematics (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Natural Medicines & Medicinal Plants (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
本發明係關於增進雌雄異株植物之育種的方法,較佳為天門冬屬植物,包括提供一植物,其中雌蕊發育之顯性抑制體的功能性表現受到干擾或降低,並引進所述植物於近交、回交育種、反覆回交育種或雙單倍體育種技術。較佳為雌蕊發育之所述顯性抑制體為包括DUF247域的基因。亦提供雌雄異株植物,其中此基因之表現受到干擾或降低。
Description
本發明係關於植物育種領域,特別係雌雄異株植物的育種,特別係天門冬屬(蘆筍,Asparagus)。本發明延伸至古典及分子植物遺傳學領域,並涉及含有基因及其突變體的新型DUF247模體(motif),以及其在標記輔助育種、靶向誘變或在轉基因植物的用途,例如:生產雌性化或去雌性化植物。本發明更關於同源於阿拉伯芥(Arabidopsis)TDF1基因(AT3G28470)或水稻(Oryza sativa)osTDF基因(LOC_Os03g18480)的天門冬屬(蘆筍,Asparagus)序列,以及其在標記輔助育種或在轉基因植物的用途,例如:生產雌性化或去雌性化植物。
植物育種是人類最古老的成就之一。其開始於藉由在控制的條件下使種植(domesticated)植物發育,並挑選提供可靠食物來源的類型以栽培植物。沒有什麼植物育種的技術或科學之產品會比雜交變種(hybrid varieties)對於世界上日益增加的飼料或食物來源具有更大的影響。首先,玉米具有顯著的成功,其用途已蔓延到其他作物,包括交叉及自花授粉品種。雜交變種係那些被用作經濟作物的F1群體。F1的親本可能是
自交系(inbred lines)、基因改植變體或其他族群。雜交變種被用於從雜交增加的產量比從與其發展相關的額外成本及其種子生產價格的額外成本更多的地方。一個額外的價格誘因在自交系的雜交情況下為均一性(uniformity)。FN Briggs及PF Knowles的書”植物育種的介紹(Introduction to Plant Breeding,1967 supra p223-239)”提供發展雜交變種的方法。
植物育種目標係基於遺傳變異的開發以生產改進的作物變種,其存在植物品種的種質(germplasm)。傳統上,遺傳變異係藉由雜交兩代基因相異的植物來創造雜交種後代以獲得。在發展雜交變種的過程中,雜交不是針對生產純種交配族群,而是生產F1雜交植物作為最後的品種。
不同基因型之間雜交的F1雜交種經常較其親本更加強壯。此種雜交活性或雜交優勢可以許多方式來表現,包括提高的發育速度、較佳的均一性、較早的開花及增加的產量,其中最重要的則是在農業上的應用。
雜交變異的生產通常包括三個步驟:(1)挑選較優的植物;(2)對一些世代進行近親交配(簡稱近交,inbreeding)以產生一系列的自交系,儘管其將不同於彼此原本的純種交配及高度均一性;及(3)雜交所選的自交系。在近親交配期間,相較於場花授粉(field-pollinated)的變種,自交系的活性急遽下降。然而,當任意兩個不相關的自交系彼此雜交時,及在一些情況下自交系之間的F1雜交種優於開花授粉(open-pollinated)變種時,會恢復活性。自交系的同型接合性(homozygosity)之一個重要結果是,任何兩個自交系之間的雜交種總是相同的。
一旦鑑定出具有最佳雜交種的近交,則可以生產任何所需量的雜交種子。
如上所述,在創造雜交品種中不可或缺的步驟係獲得自交系。在非異株作物中,獲得這些同型接合(homozygous)植物之常用方法係對一些世代進行自花傳粉(self-pollination)及自花受精(self-fertilization)(近交)。或者,藉由自花傳粉之一些世代的近交過程可以被取代成創造完全源自於配子的植物,例如卵細胞(雌核生殖(gynogenesis))或經由花粉(雄核生殖(androgenesis))。當源自配體的植物之遺傳內容加倍時,藉由化學方法(例如藉由使用秋水仙素)或藉由自發染色體加倍,以獲得完全同型接合的植物。此類植物稱為雙單倍體(doubled haploids)。在諸如辣椒,茄子,黃瓜,玉米,油菜,西蘭花等非異株作物中,可透過種子繁殖來增加雙單倍體(doubled haploids),例如僅透過使此類植物自花受精。這允許親系的快速繁殖,其在大規模雜交種子生產中作為親系植物為非常理想的。雙單倍體的種子繁殖之另一個優點是允許方便儲存,例如種子可在控制的氣候條件下,在相對較小的腔室中儲存相對較長的時間。相較於活體植物的儲存,其需要土地或溫室空間,且容易產生不利的環境條件、病原體攻擊及體細胞突變,種子儲存則相對的安全且成本低。再者,可使用種子繁殖以擺脫特定的(非種子傳送的)病原體。此外,種子繁殖可增進前體外(ex-vitro)植物的發育,由於組織培養期間所施加的激素效果持久,故其可次優(sub-optimal)發育(Smulders及de Klerk,2011),就某方面而言,儘管一些甲基化的變化可能為遺傳的
(例如,參見Stelplug et al.,2014),其可儲存由組織培養所造成之降低的DNA甲基化(Machczynska et al.,2014)。在這個意義上,種子繁殖可正向地改善外植體的生理狀態。明顯地,透過種子繁殖以再生雙單倍體的能力提供了許多優點。在雌雄異株(dioecious)作物天門冬屬之雙單倍體的生產中,應用花藥培養(Qiao及Falavigna,1990)或小孢子培養(Peng及Wolyn,1999),且沒有關於天門冬屬之成功的體外雌核生殖之報告。因此,體外單倍體生產被限制為雄性植物,也就是那些能夠生產功能性花藥的植物。假使那些種子親本在早期世代雜交試驗中顯示良好的結合能力,則無法自花受精及/或無法適用於體外雄核生殖會阻礙商業的雜交種之種子親本的改善(對於早期試驗(for early testing),參見Longin et al.,2007)。上述與諸如玉米,辣椒,茄子,芸苔屬等非雌雄異株作物的情況相反,其中雜交品種的種子親本可以直接增進或藉由使用單株作為起點進一步地近親繁殖或單倍體生產。綜上所述,對於雌性天門冬屬植物而言,藉由自花授粉及體外雄核生殖之近親繁殖及/或種子繁殖完全受到阻礙。直接的體外雄核生殖無法應用至諸如天門冬屬雜交種之種子親本的雌性植物。
除了以近親繁殖或雙單倍體生產作為工具來創造優良的雜交親本系之外,育種者亦可使用其他技術。其中之一此技術稱為回交育種(back-cross breeding)或反覆回交(recurrent back-crossing)。在回交中,具有一或多個感興趣的基因之給方親本(donor parent)雜交至反覆親本,其為可藉由加入上述一或多個感興趣的基因來改進之優良系。此類雜交的後
代被選擇用於感興趣的性狀,並接著回交至反覆親本。重複此過程並依照需求進行多次回交,以創造出基因上相似(同基因(syngeneic))於反覆親本的品系,當然除了感興趣的基因之外。回交的目的是為了獲得盡可能與已加入感興趣基因的反覆親本相同的品系,該感興趣基因係透過此育種過程而加入。反覆回交或回交育種為增進親本系的品質的有效方法,已知其如同雜交的親本可以良好的結合,但目前為止缺乏某些性狀以使這些成為更加理想的親本系。在非異株作物中,是否需要引進一性狀至育種品系,使其最後作為雜交種之雌性親本或雄性親本,係無關緊要的。然而,在諸如天門冬屬的雌雄異株作物中,由於雌性不可能與雌性雜交,因此第一雜交將發現於雌性給方植物的性狀引進雜交種之種子親本係不可能的。同樣地,大部分雄性植物無法與諸如天門冬屬的雌雄異株作物異質雜交(intercross),因此,開啟回交程序之第一雜交將源自雄性植物的性狀引進另一雄性是不可能的。下方將進一步說明,對於諸如天門冬屬的雌雄異株作物而言,利用回交以引進全雄性雜交種的雄性親本之性狀是存在問題的,甚至係在該性狀的給方是雌性植物的情況下。
一般而言,上面概述之育種工具,例如(1)應用自花受精的能力,(2)應用連續回交的能力,(3)應用雙單倍體或自交系之種子繁殖及/或種子儲存的能力或(4)藉由體外雄核生殖進一步改善早期世代雜交之種子親本的能力可使用於許多非異株作物品種(例如玉米,辣椒,油菜籽,甘藍,花椰菜,西蘭花葵,大麥,黃瓜)。然而,在天門冬屬育種中,非蘆筍
之雌雄同體性的雌雄異株,限制了雜交種子親本之雙單倍體及體外雄核生殖的自花受精、回交及種子繁殖。因此,需要提供一種方法,以至少部分地克服天門冬屬的育種及種子繁殖因雌雄異株所導致的限制。為了明白這點,應當了解關於蘆筍性別遺傳之所有方面,及所謂”超雄性”的使用以創造全雄性蘆筍雜交種。這將在下面進一步說明。首先描述一些關於性別性狀的遺傳之定義,其將使讀者能更加理解下述發明內容。雌性蘆筍係只生產具有發育完全的雌性器官之花朵的植物,例如花柱(style)和柱頭(stigma),其允許著果(fruit set)且只生產白色發育不全(rudimentary)的花藥。雄性蘆筍植物能夠生產具有發育完全的花藥之花朵。若雄性植物能夠生產漿果(berries),則其不是雄性雌雄同體(andromonoecious)則為雌雄同體(hermaphrodite)。雄性雌雄同體植物帶有只具發育不全的雌性器官的雄性花朵以及雌雄同體”兩性”花,而雌雄同體植物僅會生產雌雄同體花朵。人們預期高度非雄性雌雄同體植物但至少一真實雌雄同體植物將生產源自幾乎每一朵花的漿果。然而,如同將在下面進一步討論的,對於類型為雌雄同體(Thevenin,1967)或非記錄為高度雄性雌雄同體(Wricke,1968,Wricke,1973)的植物而言,並非總是如此,其相當令人困惑。
蘆筍(Asparagus officinalis)係具有生產雄性或雌性花朵的獨立單性個體之雌雄異株品種。於發展過程的早期階段,雄性及雌性花朵兼具心皮(carpels)及雄器(stamens);性別分化似乎是雄性花朵中心皮及雌性花朵中雄器之選擇性敗育(abortion)的結果。然而,敗育方式在兩種性別中不同:在雌性
花朵中,雄器停止發展且瓦解,而在雄性花朵中,在雄器接替之後,子房(ovary)的發育仍保持在阻斷狀態而沒有退化(Lazarte及Palsen.1979,Caporali et al.,1994)。
在此植物中,性別鑑定之遺傳控制係基於一模型,其調控基因控制了涉及存在於兩性的雄器及心皮之結構基因的表現。Westergaard(1958)在Silene所提中的兩個調控基因之類型”雄性活化體”及”雌性抑制體(suppressor)”,已建議在蘆筍中操作。Wricke(1968)為第一作者之一,其提出以Westergaard模型作為蘆筍中性別鑑定的模型。在該刊物之介紹中,作者描述分別為雌雄同熟(homogamous)XX及異形配子生殖(heterogamous)X的雌性及雄性蘆筍植物,並進一步提及藉由自花生殖以獲得雌雄同熟YY雄性植物的能性(亦由Rick與Hanna 1948及Sneep 1953提出)。由於小部份的雄性植物能夠生產雌雄同體花朵,故此種自花受精是可能的。當這些植物被雜交為雌性植物時,YY雄性植物,亦被稱為”超雄性”,允許完全無雌性品種的生產,其亦也被稱為”全雄性雜交種”。若全雄性品種完全不生產漿果,則屬於此品種的植物特別珍貴,且這存在衝突。藉由生產雌雄同體花朵的植物之自花受精來生產YY雄性的能力是可遺傳的,此性狀有可能轉移到雜交種,其為不期望的情形。何種程度的相對量使生產雌雄同體花朵是可遺傳的之問題更早係由Beeskow(引用於Wricke,1968)所提出,其將所有具有花藥的花朵以羅馬數字I、II、III及IV分類,以描述完全不具花柱或柱頭的花朵之階段:(I)提升至具有完全發育的花柱及柱頭之花朵;(IV)Wricke(1968)
解釋他研究的材料可區分為兩個群組,其中一個群組主要生產第IV型花朵(且不會有第I型花朵),然而其他群組主要生產第I型花朵(且不會有第IV型花朵)。基於上述事實,一些雜交至特定的雌性的雄性導致主要生產第IV型花朵的後代,然而其他雜交至相同雌性的雄性導致主要生產第I型花朵的後代(見他的表1)。Wricke(1968)的結論為Y染色體上的主要因子賦予了”雄性雌雄同體度(andromonoecy-degree)”。此種解釋備受爭議。雖然他的數據確實顯示雄性雌雄同體化(andromonoecy)的程度似乎取決於所選擇的特定父本植物,但由於只使用一個雌性植物的限制條件(6株母本植物對20株不同的父本植物),因此這些結果也沒有排除這可能僅是單純偶然所導致(因此未必是取決於父本,而非任何親本)。Wricke藉由在以下刊物所提出的新表1(Wricke,1973)來對抗他顯示於表1(出版於1968)之結果中具有爭議性的解釋,其中他顯示了雌性與雄性之間第二代雜交譜系(pedigree)的結果,譜系之成員相較他們先前的譜系,顯現高或低程度的雄性雌雄同體化。事實上,從Wricke(1973)所提出的這些譜系所獲得的結果指出賦予雄性雌雄同體化的因子必須位在Y染色體上。在Wricke 1968年的刊物中(也顯示於他的論文之副標題”Ein Majorfaktor für die Ausprägung des Adromonoöziegrades”),他經常提及在Y染色體上賦予雄性雌雄同體的主要因子,且他透過從高度雄性雌雄同體化的植物”143/4a/5”所得到結果之詳細討論來尋找對於此假說的證據。此植物(它顯示第III型及第IV型的花朵)雜交至三株母本植物。在這些雜交中,獲得雄
性雌雄同體植物(第IV型)及雌性植物。當植物沒有開花的後代被解釋為雌性(其通常顯示延遲開花),這對於植物相應於1:1比例,其用於分離花藥之存在或不存在,但對於發育完全的花柱或柱頭為真正的生育。植物143/4a/5更進一步雜交至三株父本植物,其全部被假設為具有低程度的雄性雌雄同體化。後代結果(特別指4、5及6)缺乏雌性且包括雄性(第I類)及雄性雌雄同體植物(第VI類)。Wricke(1968)解釋這些結果係基因作用所致,其中”Y1染色體顯性YIV染色體”與顯性的雌性抑制體相符,由引用於他論文中的Westergaard(1958)在Silene(從前稱為Melandrium)中所提出。然而,對於後代5及6得到Wricke(1968)的結果,其假設為XYIV×YIYI,事實上與此模型不一致;觀察到大量的雄性雌雄同體植物,理論上不能因為同型接合的父本(YIYI)之假定的顯性地位而存在。由於在Wricke的兩個刊物中,皆沒有描述漿果著果的程度及隨後的種子生產,故關於其自花生育力(self-fertility)的資料仍然不清楚。在Wricke(1973)中,甚至明確地提及著果尚未被記錄。Wricke(1973)作品的另一個限制為他僅描述表1中雄性雌雄同體化的平均水平,而沒有提供那些譜系內雄性雌雄同體化的分離比例。綜上所述,Wricke(1968,1973)的作品所提供之關於雄性雌雄同體的遺傳之確切模型的教示不足,且其呈現的數據沒有(充分地)支持他的結論。
在第二研究中,Westergaard(1958)提出其模型係針對天門冬數之性別鑑定的模型,其為Thevenin(1967)的作品。第1類代表具有發育完全的雌器(pistil)、三小葉柱頭及白
色發育不全花藥之雌性花朵。第2類代表雌雄同體,其具有可媲美於雌性花朵的雌器及各在各點可媲美於那些雄性的六個黃色雄器。第3類代表雄性類型的花朵或具有中間表現型及具有更多或更少縮小的雌蕊之花朵(尺寸縮小的子房、縮小的花柱或甚至沒有花柱(零)、具有一或兩葉的柱頭及數量減少或沒有乳突(papilla))。她進一步指出帶有雌性花朵的植物不帶有其他類型,其也適用於帶有第2類花朵的植物。綜上所述,Thevenin(1967)描述每朵花都可以是完全的(perfect)植物。然而,請注意除了第1類之外,漿果及種子的生產並非完全地取決於花朵的型態。在Thevenin的作品中,解釋了通常只帶有第2類花朵的植物製造一些漿果,其數量改變可從0至1甚至到幾千,僅管後者數量是例外。很重要應注意的是,Thevenin(1967)的作品中,關於她是否曾經找到從每朵花著果的雌雄同體(從開花推斷)仍然不清楚。上述之雌雄同體生產僅包含單一種子的小漿果。Thevenin(1967)指出雌雄同體通常生產至少一些具有一不完全的(imperfect)(白色)種子表皮之種子,而非通常在雌性植物中可找到之黑色完全的種子表皮。藉由允許未受控制及受控制的自花受精,Thevenin(1967)獲得分類為第2類或第3類的植物之後代(基於在那些植物上所觀察到的花朵)。其中每個後代以雌性、雄性及雙性植物分隔開來。事實上,在此後代中發現的雄性及雙性植物皆存在一個問題。如同Wricke(1968),Thevenin也採用了Westergaard(1958)的模型。她推測這些雙性植物由會產生一對連鎖基因[M su]的染色體互換(crossing-over)之情況所造成,其中”M”代表參與花藥發育
的基因,且”su”代表顯性的雌性抑制體Su之隱性等位基因(recessive allele),其通常連鎖至M。若根據此模型[M su/M su]植物為自花受精,理論排除了後代中[M su/M su]雄性的存在,然而此論點已在Thevenin(1967)的研究中發現。為了解釋上述,Thevenin導入一系列隱性基因”r”,其在同型接合的條件下對帶有顯性M基因的植物之柱頭發育有負面的干擾,故只在雄性植物中有影響。Marks(1973)是最後一位描述關於蘆筍的性別鑑定之遺傳機制係由兩個連鎖基因所致的人。儘管作者沒有明確指出Westergaard(1958)提出等效模型,其中隱性基因”g”控制雌蕊且與涉及雄蕊的顯性基因”A”有密切的聯繫。Marks(1973)指出相較於其他模型,此模型是較為合適的”由於它不需修改或極少修改來解釋以雌雄同體所獲得的結果”,且為了說明他的案例,他使用之前由Peirce及Currence(1962)所獲得的數據。後面這些作者描述具有完全的花朵之雌雄同體蘆筍栽培植物,並實行雜交實驗以揭開雌雄同體的遺傳。這是Peirce及Currence(1962)的結論,藉由以30至40厘米的交換距離所隔開之位於性染色體上的一些顯性連鎖基因來控制雌雄同體。因此,相較於報導了一些顯性基因的Peirce及Currence(1962)之解釋,Marks(1973)報導了關於雌蕊發育的連鎖隱性基因結合之關於雄蕊發育的顯性基因,其模型與Peirce及Currence(1962)相當不同。雖然Mark(1973)的模型適合於兩個譜系(“2-3”及”3-4”),但他的模型無法解釋雄性在其它兩個譜系(“1-6”及”4-1”)的存在。這些雄性接著被Marks(1973)解釋為”作為遺傳雌雄同體,就gA基因座而言,
但有另外一個隱性基因s,當同型接合子抑制雌蕊,此類植物則作為雄性表現型”。在此意義上,如同Thevenin(1967)的模型,他的模型為多基因的。Marks(1973)解釋由譜系”2-1”所造成的第二代F2及BC1譜系中,理論比例與觀察之間的不一致係因不均等分離比(distorted segregation)所致。雖然他宣稱提供模型在他看來他來“不需修改或極少修改以解釋與雌雄同體所獲得的結果“,如同其他模型,它仍然係基於解釋性假說,諸如隱性變更基因(modifier)及不均等分離比都還沒被進一步的測試。Marks(1973)回應需要更多關於Thevenin的問題之數據,其在討論部份指出他的論文(第129頁)如何驗證他的假說。新罕布什爾大學名譽教授Lincoln C.Peirce(電子郵件,2010年和2015年)在個人通信指出,更多未公佈的數據已經獲得,其指出對於譜系2-3所得到的實驗證據,特別是更遠的世代,較由Marks(1973)所指出之模型而引起的更不清楚。Lincoln C.Peirce曾經指出:"在完成原本的作品並公佈之後,我繼續進行雜交,希望能更了解遺傳系統。我進行越多的雜交或自花傳粉,我將發現越多前後矛盾的地方,其皆來自衍生自原本的雜交或回交之材料"。且他更寫到:""2-3"是獨一無二的-我從來沒在之後的雜交或自交中發現像它一樣的植物。這使我得出結論,必須有其他的因素參與其中,但我從來沒能去探究它。"在詳細說明2-3之獨特性的問題中,Lincoln C.Peirce回應他"從來沒有發現任何像2-3一樣的品系",從某種意義來說"從來沒有發現任何像2-3一樣強的雌雄同體之衍生品系,其中每朵花生產漿果卻已充分發育花藥"。這些未公布的結果
與Marks(1973)的模型形成對比,基於控制雌蕊的隱性基因”g”,其與參與雄蕊的顯性基因"A"息息相關,且預測會在後代中觀察到與2-3一樣強壯的植物。綜上所述,在每個研究中,其中Westergaard(1958)描述顯性雌性抑制體的模型應該表此時天門冬屬中,此結果並未完全地符合此模型或更嚴格地說,此結果會排斥此模型。在Westergaard的模型公開之前,更早的作品係源自於Sneep(Sneep,1953a,1953b)。這個作者大力提倡使用雄性雌雄同體植物以獲得如同雜交親本的超雄性,承認防止商品種子中雄性雌雄同體化的重要性,並實行性狀的遺傳分析,有可能解決此問題。他描述後代中一個雄性雌雄同體的姊妹種(sibling)其跨越三代且真正的孕育此性狀,然而另一個雄性雌雄同體的姊妹種,除了生產雄性雌雄同體個體之外,其能夠生產純的雄性個體。結果,Sneep(1958b)得出結論,雄性雌雄同體化係藉由顯性因子來控制,且後代尺寸太小以至於無法預測該因子所涉及的數量。至於防止雄性雌雄同體化的方法,他建議選擇對於控制雄性雌雄同體化的顯性基因具有隱性等位基因的植物。
Franken(1970)提出另一個模型,其類似於Westergaard(1958)的模型,但只是部分重疊。此作者研究一些自花受精雄性雌雄同體植物的的後代,並得出結論認為,部分顯性基因(變更基因,他命名為”A”)負責雌蕊發育的抑制(見下表);並且,該基因獨立地遺傳自位於X染色體上的雄性不孕性(sterility)等位基因。
Franken(1970)所提出的表現型(性別)及基因型作
為性遺傳的模型
由Franken所提出的模型(1970)與Galli et al.(1993)的結果一致,分析雌蕊在一些回交中的長度之後,得到的結論為影響柱頭長度及花柱發育(變更基因)的因子並非位於性染色體。在Galli et al.(1993)的模型中,柱頭長度的回交分布吻合至少兩個基因座(loci)的模型。主要呈現於上表之Franken的模型為互補基因作用的附加遺傳模型,其中Y染色體會產生雄性(staminate)花朵(有花藥但沒有雌蕊),且隱性”a”等位基因減輕了Y染色體的影響並允許一些雌蕊發育。將花朵推向雄性的方向(有花藥但沒有雌蕊)之Y染色體的數量與允許一定程度的雌蕊發展隱性”a”等位基因的數量之間的平衡,設置了可以產生完全花朵的水平。Franken(1970)承認並非所有他的雜交結果都可以透過簡單的遺傳模型來解釋,且仔細研究Franken博士論文(見Franken,1969第56-58頁第8章之表37a及表37b)中的統計結果,指出雄性雌雄同體化為定量而非定性之性狀,其可受到環境的影響。為了達到這個數量方面,特別是解釋有時候傾向於變得更加雄性雌雄同體化之YYAa植物,Franken(1969,1970)提出了正向地促進雄性之柱頭發展的G因子。因此如同Sneep(1953b),Franken(1969,1970)也描述了可促進雄性雌雄同體的顯性基因。
上述所有研究主要證明雄型植物可以藉由雄性雌雄同體植物的花朵之自花受精來生產,當所有花朵都是完全的,則該植物有時被稱為雌雄同體。根據進一步說明,若雄性雌雄同體植物(XY)為自花受精,則四分之一的後代將為YY;在蘆筍育種中稱為超雄性。一旦使用超雄性作為父本來授粉給母本,其得到的雜交後代之所有植物皆為XY,故在某種程度上為雄性,所有的這些植物將生產花藥。然而,那些植物是否將能夠生產漿果取決於多重因子,諸如”Su/su”及“r”(Thevenin,1967)、“Y”、”A/a”、及”G”(Franken,1969,1970)、“一些顯性因子”(Sneep,1953a,1953b,Peirce及Currence,1961)及“SuF/suF””中度或強力地控制柱頭發育之遞增變更基因”(Wricke,1967,p209)及”當同型接合子抑制雌蕊之隱性基因s”或可能被不均等分離比所影響之表型頻率(Marks,1973)。這些所有變更基因或因子,其中一些可能指定相同的基因或因子,是未知的。如Sneep所指出,用來創造超雄性的雄性雌雄同體性狀最終必定不會成為商品種子。這會造成矛盾:雜交品種的親本品系可以藉由自花受精並透過可遺傳的雄性雌雄同體性來創造,且越是表現此可遺傳的性狀,則該品系的創造力將更加有效。然而,產生自此類親本系之間的雜交之雜交種不應表現該可遺傳的性狀。若該可遺傳的性狀為複雜且未知,則一方面,育種者無法利用表現以創造雜交種的自交親本品系,且另一方面,當使用親本系以創造商品雜交種時,育種者無法避免表現。因此,育種者最好避免透過自交雄性雌雄同體植物來獲得YY植物,而是透過雄性植物的花藥培養來獲得這些。然而,
即使是使用雙單倍體作為親本植物的情況,也可以創造出雜交種,當來自母系或父系的親本植物堆積足夠數量的變更基因,其克服Y染色體之假設的雄性化效應(masculinizing effect),該雜交種為雄性其雄同體(如同Franken,1970之假說)。應進一步注意的是,若育種者願意藉由使用雄性雌雄同體植物實行近交,此工就受限於該事實,即由於雄性雌雄同體或雌雄同體存在約0.1至2%的育種材料中,故雄性雌雄同體僅限於基因庫或種原(germplasm)之一個小子集(Thevenin,1967,Sneep,1958)。綜上所述,育種者必須避免變更基因最終成為雜交種,再者,育種者受限於整個培育場中足夠雄性雌雄同體之難得的可用性。無論超雄性是否藉由使用雄性雌雄同體或花藥培養的自花受精來獲得,相較於屬於一般自花傳粉品種(諸如番茄、辣椒、茄子、油菜、花椰菜等)的作物之雜交種的雄性親本,創造出來的超雄性具有某些的缺點。首先,由於必須避免有利於將表現型修飾為雄性雌雄同體的基因(其他雜交種會生產不期望的漿果),這表示超雄性永遠無法大規模繁殖為種子。其次,這是重要的方面,由於從第一回交中獲得的F1植物為雄性,其無法正交(direct corss)至應引進新性狀於其中之超雄性,故超雄性無法藉由連續的回交來改善。
若育種者欲使用允許自花受精之完全的花朵,至少雌雄同體性狀的簡單遺傳是期望的,最好是單一基因於所偏好的遺傳性狀,這容易於一或僅少數個世代中擺脫。更好地,此類單基因(monogenie)性狀可以通過遺傳標記來挑選。總之,蘆筍育種的技藝會強力地受益於僅為遺傳之雌雄同體的可用
性,因此是高度可預測且容易選擇成為或選擇對抗特定階段的育種,較好是藉由基因標記來挑選。再者,若育種者可使用允許透過自花受精來育種,且允許種子繁殖自交系或種子繁殖雙單倍體的方法,則蘆筍育種之技藝會強力地受益。最後,蘆筍育種者希望能夠應用直接的反覆回交於超雄性植物作為反覆的親本。育種者希望能夠實行所有上述方法,而不要受到所導入的未知變更基因干擾,未連鎖至性染色體,其偏好雄性雌雄同體或受到限制數量之表現出足夠自然雄性雌雄同體的植物干擾。理想情況下,用以解決上述所有問題之從雄性植物至雌雄同體的轉變,或更一般地,於育種方案中影響植物性別的方法,是具有針對性且為暫時的作用。在一個更理想的情況下,鑑定雌性抑制體或雌蕊發展抑制體,其曾被假設但從未完全地被證明其存在或至少未被證明其為單基因且能夠在”將它打開或關閉”的意義中操作。
凡育種者可能有興趣於允許或禁止雌蕊發育,此育種者-取決於植物的預期用途如種子或花粉親本或兩者-也可有興趣使雄蕊能夠發展。使雄蕊能夠於雌性植物中發育以從本質上改變性別,將允許在沒有雜交授粉下(因此透過自花受精)從原本的雌性植物中獲得種子,且將從此類植物透過體外雄核生殖以提供獲得雙單倍體的能力。這將允許近交可能導致育種品系相較於能夠自花授粉的原雌性植物更加優越。此將允許雌性育種品系的種子儲存。調節及改變雌性植物(原本缺乏功能性花藥)及雄性植物(原本完全或部分缺乏雌蕊發育)之性別的能力,將允許雜交方案的適應性,其目前受到雌雄異株(dioecy)
的阻礙。調節及改變雄性及雌性植物之性別的能力也可擴展到基因庫以創造雜交種,當雄性植物於雜交種中似乎為良好的一般組合,其可被改變為雌性植物,接著雜交至適合的雄性植物,或當雌性植物於雜交種中似乎為良好的一般組合,其可被改變為雄性植物,接著可被雜交至雌性植物。
在此領域中,已經指出此類性別改變可能發生(Maeda et al.2005),但迄今為止證據太薄弱以致無法絕對地確定這已經發生,更不用說理解這是如何完成的了。在Maeda et al.(2005)所發表的研究中,已經假設從雄性體外選殖(vitroclone)品種Festo中獲得的雌性蘆筍植物是由體外胚胎發育(embryogenesis)的結果。它記載了性別轉換已被”鑑定”且”性轉換在目前的研究可能是”體細胞突變(somatic mutation)的結果,諸如體細胞染色體互換,染色體重排之一”。此性別轉換的假設係基於在評估領域找到之單一雌性植物的遺傳分析,其係相較於五株雄性植物。Maeda et al.(2005)使用之前被Ozaki et al.(2000a)使用的異位酶(allozymes),其中Ozaki是這兩件研究的通訊作者。Ozaki et al.(2000a)按照檢測汙染重複地討論異位酶的使用。然而,不同於測試植物汙染,Maeda et al.(2005)僅按照多重體細胞汙染情況討論其結果,並在性別轉換的理論上闡述異型接合性的喪失,特別是Mdhl異位酶基因座(基因座)鬆散地連鎖至M基因座之改變。明顯地,基本上測試所觀察的雌性表現型之一半基因座不同於雄性其被預期源自於...。作者測試八個異位酶基因座,其中他發現雌性植物在五個基因座處相似於雄性植物:"bb"於Aat I、"aa"於Aat 2、
"bb"於Aat-3、"bc"於Pgm-1及"ab"於Skdh-1中。這是數量少的基因座,且看來這些相似基因座Aat I及Aat 2兩者的辨別力(discriminate power)可能被限制。Ozaki et al.(2000a)顯示九株品種測試,只有於Aat I觀察到兩個等位基因,且其中觀察到八個“bb”同型接合基因型。進一步看來,Aat 2完全沒有顯示變異。應進一步注意的是,兩個其它的基因座Pdm-1及Skdh-1緊密相連(4-6cM見Ozaki et al.,2000a及其中參考資料),由於這些基因座標記實質上靶向相似的基因座,故其也限制辨別力。於另外三個基因座處,分別觀察雄性控制組植物與雌性植物之差異;"an"與"nn"於Mdh I、"an"與"un"於Mdh 2及"an"與"aa"於Idh I。作者推論性別轉換可能是在性別決定基因座中基因型從"Mm"轉變為"mm"的結果,且”Mdh-1及Idh-1依據突變從異型接合(heterozygous)轉變為同型接合”。此外,這是高度推測的,此理論似乎是基於實際上為錯誤的假設。作者引用Maestri et al.(1991)的作品,其證明MdhI至M-基因座的連鎖,且這的確揭示於引用的文件中。作者也指出”三個連鎖對Aat-1/Mdh-1、Aat-1/Idh-1及Pgm-1/Skdh-1之前已被辨識(Ozaki et al.,2000b)”,但由於Ozaki et al.(2000b)發現Idh1是連鎖至Aat3而非Aat1,故這是不正確的。因此,兩者基因座”根據突變改變”,似乎這是影響(部分)一及相同的染色體之顯而易見的情況,此情形是不被支持的。為了得到至少一些異型接合的Mdh1喪失之證據,其連接至一可與假設的性別轉換相關之突變,必須證明在雌性中觀察到之據稱為遺失的等位基因已連鎖於耦合期或”順(in cis)”至顯性M等位基因,其於原本品
種中賦予雄性表現型。此假設之測試容易藉由試驗雜交(testcross)來實行,例如藉由Maestri et al.(1991)所作,使用偏好同型接合上與品種Festo在MdhI基因座為不同之雌性。Maeda et al.(2005)從未實行此實驗且這留下連結,在偶然之間,在據稱的遺失MdhI等位基因與據稱的性別轉換之間仍尚未解決。
第三變異基因座Mdh2,尚未被發現連鎖至Mdh1(見Ozaki et al.,2000b)。Limgroup專有的標記靶向Mdh基因:CAGCTATAGGGACGGTAGAATTTAC[C/T]GGGTTGCTAATGATGTGAATGA被發現連鎖至Asp276:
。被繪製到染色體指定的染色體8於專有的圖譜群體,而非性染色體。這證實了Mdh1連鎖至M基因座及Mdh2並非連鎖至Maeda et al.(2005)可提供更多這方面的決定性數據,例如,澄清可從所觀察之遺傳變異推斷是否為汙染物在評估領域中為常見情況。它無法解釋為何第二株植物尚未經過測試。綜上所述,根據Maeda et al.(2005)之性別轉換的報告已受鑑定,將會受到此技藝人士之爭論,且對於此技藝人士將產生許多懸而未決的問題,故提供不充分的教示關於是否性別轉換的蘆筍植物可藉由體外胚胎發育獲得。因此,雌雄同體植物的育種者,尤其是天門冬屬植物仍然需要僅為遺傳的雌雄同體之可用性,故為高度可預測且容易選擇成為或選擇對抗特定階段的育種。再者,此技藝之育種者也會有興
趣使雄蕊發展。使雄蕊於雌性植物中發展以本質上改變性別,將允許在沒有雜交授粉下(因此透過自花受精)從原本的雌性植物中獲得種子,且將從此類植物透過體外雄核生殖以提供獲得雙單倍體的能力。
本發明係關於增進雌雄異株植物之育種的方法,包括:提供植物,其中雌蕊發育之顯性抑制子的功能性表現受到干擾或減少,且引進所述植物於近交、回交育種、反覆回交育種或雙單倍體種子生產。在更多實施例中,本發明係關於雌雄異株植物的自花受精或異質雜交(intercorssing),其中一或兩者親本植物為雌蕊發育之顯性抑制子的功能性表現受到干擾或減少之植物。在進一步的實施例中,本發明係關於生產植物的方法,其中雌蕊發育之顯性抑制子的功能性表現藉由抑制GDS蛋白質的表現而受到干擾或減少,較佳為減少描述於SEQ ID NO:2中的胺基酸序列或其異種同源物(ortholog)或功能性同源物(homolog)之表現。在本發明這些方法中較特別的是,雌蕊發育之顯性抑制子的功能性表現之干擾或減少是藉由抑制GDS基因之表現所造成,較佳為其中GDS基因包括提供於SEQ ID NO:1中的序列或其異種同源物、功能性同源物或功能性片段。較佳地,本發明之方法包括於GDS基因中導入突變之步驟以干擾或減少雌蕊發育之顯性抑制子的功能性表現。結果,較佳的是上述所提之方法使用包括突變GDS基因的植物,較佳為其中突變是藉由DNA置換而造成。在較佳的實施例中,本發明之方法係實行於天門冬屬(Asparagus)植物,較佳為蘆筍
(Asparagus officinalis)。
本發明之部分亦為雌雄異株植物,較佳為天門冬屬植物,更加為蘆筍品種植物,其中雌蕊發育蛋白質之顯性抑制子的功能性表現受到干擾或減少。在所述植物中較佳為GDS基因之表現受到干擾或減少。在一更佳的實施例中,所述植物已受到突變誘發(mutagenesis)處理,較佳為其中所述處理包括以放射性元素輻射。更佳關於所述植物為以核苷酸序列來轉化(transform)或轉染(transfect),該核苷酸序列能夠干擾或減少雌蕊發育的所述顯性抑制子之表現,較佳為其中所述核苷酸序列為同源或部分同源於GDS基因之序列,特別是其中所述表現之干擾或減少為可逆的。
本發明亦包括增進雌雄異株植物的育種之方法,包括:提供一植物,其中顯性雄性刺激子(stimulator)的功能性表現被修復,且引進所述植物於近交、回交育種、反覆回交育種或雙單倍體育種技術。在另一實施例中,本發明包括增進雌雄異株植物的育種之方法,包括一植物,其中顯性雄性刺激子的功能性表現之缺乏藉由顯性雄性刺激子的功能性複製來補充,並引進所述植物於近交、回交育種、反覆回交育種或雙單倍體育種技術。所述方法中較佳為顯性雄性刺激子的引進係藉由在雌雄異株植物中誘導異源(heterologous)顯性雄性刺激子之表現來實行,較佳為其中所述顯性雄性刺激子為TDF1蛋白質,較佳為其中所述TDF1蛋白質為描述於SEQ ID NO:5中的蘆筍TDF1基因或其異種同源物或功能性同源物或功能性片段,其功能性片段較佳為包括至少TDF1蛋白質或其異種同源
物或功能性同源物的R2及R3域(domain)。在更佳的實施例中,編碼為顯性雄性刺激子的基因為描述於SEQ ID NO:4之蘆筍TDF1基因或其異種同源物或功能性同源物或其片段,其編碼為上述定義之TDF1蛋白質的片段。
本發明的另一部分係雌雄異株植物的自花受精或異質雜交之方法,其中親本植物之一或兩者為一植物,其中顯性雄性刺激子的功能性表現之缺乏藉由顯性雄性刺激子的功能性複製來修復或補充,較佳為其中所述之顯性雄性刺激子為TDF1蛋白質或其異種同源物或同源物。
本發明之一部分係體外雄核生殖的方法,其中用於提供花藥的植物為一植物,其中顯性雄性刺激子的功能性表現之缺乏藉由顯性雄性刺激子的功能性複製來修復或補充,較佳為其中所述之顯性雄性刺激子為TDF1蛋白質或其異種同源物或同源物。
本發明之一部分亦為能夠抑制蘆筍植物的雌蕊發育之蛋白質,包括SEQ ID NO:2胺基酸序列或其異種同源物或功能性同源物。本發明還包括編碼為所述蛋白質之核酸序列,其中所述核酸序列為描述於SEQ ID NO:1之cDNA序列或可以源自於SEQ ID NO:3之基因組序列。
本發明之一部分亦為能夠從雌雄異株品種中提供雄性化(masculinization)的蛋白質,包括SEQ ID NO:5之胺基酸序列或其異種同源物或功能性同源物或如上述定義之其片段。本發明還包括編碼為根據權利要求第23項所述蛋白質之核酸序列,其中所述核酸序列為描述於SEQ ID NO:4之
cDNA序列或其片段,其能夠編碼為上述定義之片段。
本發明之一部分亦為從一育種方案中獲得之雌雄異株品種的雜交植物,較佳為從透過根據本發明的育種方法之一來生產的自交植物。
本發明的另一部分為增進雌雄異株植物的育種之方法,包括提供雌性化植物並引進所述植物於近交、回交育種、反覆回交育種或雙單倍體種子生產。
本發明更包括增進雌雄異株植物的育種之方法,包括提供去雌性化植物並引進所述植物於近交、回交育種、反覆回交育種或雙單倍體種子生產。
本發明更包括增進雌雄異株植物的育種之方法,包括提供雄性化植物並引進所述植物於近交、回交育種、反覆回交育種或雙單倍體種子生產。
本發明亦包括增進雌雄異株植物的育種之方法,包括提供去雄性化植物並引進所述植物於近交、回交育種、反覆回交育種或雙單倍體種子生產。
第1A圖係顯示DH00/094(表示為”XX Female Resequence”軌跡(track))之讀取片段(reads)的讀取覆蓋度度(read coverage)之支架(支架)905的實施例,所有的突降在位置104688(從30x至零),然而雄性DH00/086(表示為”YY雄性定位(mapping)”軌跡)的讀取覆蓋度仍然很高。這指出此區域可能代表體染色體(autosomal)部分與性染色體之雄性特定部分
(male specific part,MSY)之間的邊界。
第1B圖係公開的標記Asp1-T7及Asp2-SP6所位於之支架905位置之實施例。請注意,Asp2-T6位於非常接近預測的基因Aof31527.1。讀取片段缺乏重新定序的雌性(見XX Female Resequence軌跡),然而豐富的讀取片段發生於重新定序的雄性(表示為”YY雄性定位”軌跡)。於位置312500處所缺乏的讀取片段為存在於雙端定序讀取(mate對reads)之未知的序列NNNN的結果。
第1C圖係公開的標記Asp1-T7及Asp2-SP6所位於之M基因座_支架4位置之實施例。請注意,Asp2-T6位於非常接近預測的基因Aof0065.2。讀取片段缺乏重新定序的雌性(見XX Female Resequence軌跡),然而豐富的讀取片段發生於重新定序的雄性(表示為”YY雄性定位”系列)。請注意,這表示類似於給出了支架905(第1-C圖)但方向相反。進一步應注意的是,其中支架905第二外顯子(外顯子)被分解於兩個部分,它顯示為單一外顯子於M基因座支架4中。Sanger定序揭示了M基因座_支架4表徵(representation)對第二外顯子為準確的,故相較於支架905為較好的表徵,其顯然包括一些微小的組合誤差。
第2圖係供給體剪接位點(donor splice sites)內含子(intron)2。ML4 DUF247位於CDS2/Intron2邊界位置。EVM1預測直接地顯示上述正鏈序列(plus-strand sequence)並預測假定的5’-剪接位點以黑線條所表示:TG/GC。從基因型DH00/086的花苞分離的源自於RNA的兩個cDNA序列是在由
CP35CR55_57和CR55CR57_57所表示的負鏈序列(minus-strand sequence)之下方。實際的剪接位點係以cDNA 5’-剪接位點:GG/GT表示。位於2795位置的胞嘧啶(胞嘧啶)從未被報導為植物供給體剪接位點。位於2835位置的胸腺嘧啶(Thymidine)係100%的保留。
第3圖係基於蘆筍的基因組DNA之不同的分析,對於DUF247基因的替代cDNA序列。
第4圖係G033(如LIM_G033_Alignments所示)及K323(如LIM_K323_Alignments所示)與Y連接的M-基因座支架4組合支架註解為基因特徵Aof000065.2之短序列比對(Short read alignment)。BGI基因軌跡註解顯示粗條中FGENESH預測的外顯子被較細的線分開以顯示預測的內含子。EVM顯示基於基因模型的證據(見實施例1之文本的描述)。虛線鄰接沒有讀取片段定位為G033之區域,其指出基本上DUF247的這部分被刪除。箭頭代表內插子(insert)的邊界之夾式讀取(clip-reads)指示。
第5圖:A.使用引子對CN78/CN83從定序雌雄同體G033所獲得之兩個Sanger讀取片段之實施例,並將使用引子對CN59/CN70的野生型雜交之Sanger讀取片段作為參考。關於引子對請見引子表3。B.雄性定序之比對,雌雄同體5375及雌雄同體G033以顯示內含子位置,於該位置G033序列相較於其他讀取片段顯示不同。
第6圖係累計數量的植物自3E譜系的第一植物開花,偽測試雜交:雌性1800×所擇的F1(5375×1770)開花(設置為第
1天)。實線曲線代表來自雄性植物之累計數量的花朵,且虛線顯示雌雄同體植物之累計數量的花朵。
第7A圖係GENEVESTICATOR(www.gene研究者.org,NEBION AG,Zurich,Switzerland)實驗,使用阿拉伯芥之10個類DUF247基因跨越阿拉伯芥品系之10個發育階段之所有可用的基因表現數據。AT2G38540係無關的阿拉伯芥TDF1基因。表現潛能百分比(Percent of Expression Potential)顯示與六組顏色指示組合之每個基因階段。
第7B圖係GENEVESTICATOR(www.gene研究者.org,NEBION AG,Zurich,Switzerland)實驗,使用阿拉伯芥之9個顏色指示類DUF247基因跨越阿拉伯芥品系之10個發育階段之所有可用的基因表現數據。AT2G38540係無關的阿拉伯芥TDF1基因。表現的程度(阿拉伯芥ATH1基因組陣列的訊號強度)顯示每個基因階段組合如LOW、MEDIUM或HIGH。
第7圖係GENEVESTICATOR(www.gene研究者.org,NEBION AG,Zurich,Switzerland)實驗,使用阿拉伯芥之10個類DUF247基因跨越阿拉伯芥品系之127個解剖部分之所有可用的基因表現數據。表現潛能百分比顯示與六組顏色指示組合之每個基因解剖部分。阿拉伯芥花序(inflorescence)數據詳細顯示了花朵器官,突出顯示雌蕊數據中基因表現之相對低的數值。
第8圖係FGenesh*ML4 DUF247 FG及EVM(ML4 DUF247 EVM)及其各自的編碼序列(對於FG預測之CDS1,CDS2及對於EVM預測之CDS1-CDS3)的2基因預測(暗色)之總覽。中
間欄代表一般序列及相應的編碼序列,如藉由從DH雄性DH00/086之花苞的mRNA之cDNA定序來偵測。內含子2的5’剪接位點相較於EVM預測位移了42bp上游。
第9A圖係GENEVESTICATOR(www.gene研究者.org,NEBION AG,Zurich,Switzerland)實驗,使用含有阿拉伯芥基因的10個DUF247域跨越所選的阿拉伯芥野生型實驗之解剖部分之基因表現數據。該選擇包括年輕且已發育的花朵表現數據之4個數據集。AT2G38540為不相關的阿拉伯芥TDF1基因。表現潛能百分比顯示與六組顏色指示組合之每個基因解剖部分。阿拉伯芥花序數據詳細顯示了花朵器官,突出顯示對於基因表現之8個基因之相對低的數值。
第9B圖係對於第9A圖中個體花朵實驗之基因表現數據的詳細視圖。
第9C圖係解剖部分的分層聚類(Hierarchical Clustering)(Pearson相關指數)及第9A圖中所示之表現潛能百分比。對於基因的3個集群之高度相關值是由在各個相關樹木線的長度所表示
第10圖係預測的編碼序列ML4 DUF247 EVM(描述為EVM)與對於同功型(isoform)ML4 DUF247 DH(描述為DH),其發現於源自全部RNA的DH00/0865花苞之cDNA定序。詳細的編碼序列請參見表6。
第11圖係從基因型DH00/086(參考基因組序列的超雄性)獲得的PCR產物,使用引子對CN78/83及CN78/CN84的雌雄同體突變G033及超雄性K323分別在100bp尺寸位置的右邊
及左邊,其被診斷為缺失插入事件,故為雌雄同體突變G033之DUF247基因中的單一序列(unique sequences)。請注意GO33為單一及主要PCR產物,然而其它(雄性)樣品顯示非特定的指紋狀圖案。
第12圖係A:雌雄同體G33的表現型顯示完全的漿果著果。B:3個WT K323的花朵(左手邊)在三個G033花朵旁邊;應注意雌雄同體G033的花朵相較於WT K323雄性植物顯示較長的花柱、發育較好的柱頭及較大的果實。C:G033花朵(左)的器官發育與所有雄性雜交種K323(右邊兩個)的兩朵花之差異,其在尺規旁邊以允許尺寸差異之估計。
第13圖係從PCR片段獲得之Sanger讀取片段,其使用基因型DH00/086、9M、88M、K323、雌雄同體5375及雌雄同體G033作為模板DNA來定序,以及本案所提到之支架的序列:lcl|M-基因座_支架4、支架905、支架3098、支架10515。
第14圖係"花朵表現型之實施例”,使用育種品系之雌性花朵的實施例在試驗雜交中作為雌性之雌性花朵,以及分隔於861BC1d之代表這兩者之表現類型的兩種典型花朵。
第15圖係”K1036的CHG甲基化及讀取覆蓋度與在支架_905的DH00/086及品系9”。每個位置CHG甲基化程度被繪製成針對品系K1036(頂圖)及DH00/086的長條圖與針對位置49.815至51.249(基因組版本2.0)之支架_905的品系9(底圖)。每個位置信息讀取覆蓋度繪製以交叉代表K1036、三角形代表DH0086及圓形代表品系9。取決於CHF位置之部分,信息的讀取片段僅源自於Watson或Crick股。請注意對於K1036而
言許多CHG位置被甲基化(由眾多的長條狀表示),然而DH00/086及品系9之CHG甲基化位置是非常有限的;請注意只有極少數量的長條狀指出DH00/086及品系9的甲基化,這代表在許多其它CHG位置,甲基化程度等於0%(沒有長條狀)。
第16圖係蘆筍雄性DH00/086之4.6X覆蓋之PacBio長定序讀取之尺寸分布。
第17圖係M基因座區域中BioNano重疊群(重疊群)BNG28及與其對準的AGS V2.0支架。箭頭及引子密碼顯示PCR中引子測試的位置以分析半合子狀態(hemizygosity)喪失或異型接合性(heterozygosity)喪失,其診斷為鈷60伽馬射線輻射所造成的尺寸缺失。
第18圖係蘆筍的類TDF CDS。外顯子為大寫字體及陰影。
第19圖係營養層發育及功能1缺陷(Defective in Tapetal Development and Function 1)基因中類MYB34蘆筍異種同源物之276 AA轉譯,阿拉伯芥AT3G28470之同源物及水稻TDF1(LOC_Os03g18480)。
第20圖係使用ATH TDF1作為AGS V2.0組件數據庫之查詢的tBLASTN結果。AGHS 2.0支架436及1220具有最高辨識性。而AGS V2.0支架1220在第一SANT域中具有較低辨識性。
第21圖使用微衛星標記(sat)及HRM標記以確認於特殊雜交種中發現的突變真實性。突變基因型與屬於那些突變的對照雜交一起顯示。顯示一些對照植物以說明通常用於觀察那些標記的變異性。顯示那些雜交種的親本等位基因(當已知)。
第22圖係由鈷60輻射後所獲得之雜交種K1150、K1129及K323之突變的花朵之影像。請見實施例6及實施例7之描述。
第23圖係顯示對於支架部分之讀取深度的實施例。一個攜帶As-TDF1而另一個攜帶具有DUF247域的GDS基因。請注意用於觀察雄性至雄性的讀取深度很低及/或讀取片段不存在,該事實指出該缺失重疊了Y特定及偽體染色體區兩者。
在此描述中,除非另外指出,否則使用於此的術語及定義即為使用於(Mendelian)遺傳學者,其中引用係出自於M.W.Strickberger,遺傳學(Genetics),第二版(1976),特別是第113-122及164-177頁。如其中所提到的,”基因”通常表示遺傳的因子,其決定了生物體(即植物)的生物特性,且”等位基因”係存在於多倍體(multiploid)生物體中基因對的個體基因,諸如雙倍體(蘆筍)植物。
天生雄蕊顯著(natural staminose)植物定義為天生具有一或多個生產功能性花粉的功能性花藥之植物。雄蕊顯著(staminose)之術語定義為具有一或多個生產功能性花粉的功能性花藥之花朵並排除雌性植物。雄蕊顯著之術語可相似於朗文生物學辭典第11版第560頁所使用之雄蕊顯著術語,但可能不相似於相同手冊中之雄蕊顯著,其描述含有雄器但無心皮之花朵。
同基因(Syngeneic)用於定義基因完全相同。
雌蕊(Gynoecium)係指產生胚珠(ovules)並最終發育成果實和種子之部分花朵的集合名詞。雌蕊可包括一或更多分離的雌器(pistils)。雌器通常包括擴大的基部稱為子房(ovary)、延長的部分稱為花柱(stylc)及接收花粉的頂端結構稱為柱頭(stigma)。
雌蕊發育係指雌蕊之發育以生產胚珠並最終發育成果實及種子。
天生雌性植物為只生產具有完全發育的雌性器官之花朵的植物,諸如花柱及柱頭及允許著果之子房,且只生產發育不全無功能的花藥如同可於自然界中找到,因為它天生缺乏雌蕊發育之顯性抑制體且天生缺乏賦予雄蕊發育之顯性基因。
雌性化作用(Feminization)或被雌性化定義為藉由干擾或降低雌蕊發育(GDS)基因、其同源物或異種同源物之抑制體之功能性表現以修復或增進植物之雌蕊發育,如本文件中定義為人類干預之結果。
在雌性化植物中雌蕊之修復或增進發育可藉由此技藝人士將其與適合的參考植物比較來決定,暴露在相同的生長條件,其中假如雌性化植物相較於參考植物生產較少的功能性花粉,它將被授粉使得授粉本身不會限制著果。所述參考植物將具有與雌性化植物相同的倍體程度,非雌性,且本文件中所揭示之所述參考植物中雌蕊發育(GDS)基因、其同源物或異種同源物之抑制體之功能性表現尚未受到干擾或減少。最佳地,參考植物與所評估的雌性化植物同基因。較佳的參考植物
之實施例係由成為雌性化之植物的無性生殖(vegetative propagation)所獲得之同基因植物,在人類干預靶向其GDS基因之前,較佳為藉由短暫繁殖階段以避免體細胞變異,這可能使得兩株植物不足以同基因以進行適當的比較。合適的參考之另一較佳實施例為從兩個雙單倍體親本之間的雜交產生的(平均或其中一員)大量的親姊妹種(siblings),或與雜交種為相同親本之純種(故高度近交),從中雌性化植物進行評估的結果,其中所述親姊妹種或任何他們的親本尚未成為人類干預靶向雌蕊發育(GDS)基因、其同源物或異種同源物之抑制體的目標。假如前述較佳參考植物無法使用,例如,假如人類干預靶向雌蕊發育(GDS)基因的抑制體實行於配子上,此技藝人士可能需要足夠多的兄弟姐妹,其非雌性植物,其中所述姊妹種或任何他們的親本尚未成為此類人類干預的目標,作為雌性化植物之參考。若這些姊妹種無法使用或數量很少,此技藝人士可以作為參考,將雌性化植物之直系的雄性上代(ancestor)作為參考植物,其中所述雄性上代尚未成為人類干預靶向雌蕊發育(GDS)基因、其同源物或異種同源物之抑制體的目標。為了使所述雄性上代為可用,此技藝人士可無性繁殖該上代。
當參考植物為基因上可變異,其可阻礙與高度同基因參考植物之比較,此技藝人士可測試修復或增進雌性化植物之雌蕊發育的性狀是否為零假設,其獨立地分離該靶向的GDS基因及/或它的同源物或異種同源物,在合適的試驗雜交中族群應被接受或拒絕。精細定位及表現型可接著提供進一步的說明於GDS基因在雌性化作用中之角色。
修復或增進雌蕊發育如同使用於雌性化之定義,意指增進或修復雌蕊發育的植物,其相較於適合的參考植物較能夠生產包括可生長發育的(viable)種子之漿果。
增進或修復雌蕊發育可包括花柱長度的增加及更多顯著的柱頭,其可藉由一尺度來測量或推斷,例如由Franken(1969,1970)及Beeskov(1967)所應用之尺度,增進或修復雌蕊發育於上述之尺度意指雌性化植物之花朵將於所述尺度得到相較於參考植物更高的分數。
去雌性化作用(Defeminization)或被去雌性化定義為藉由修復或增進雌蕊發育(GDS)基因、其同源物或異種同源物之抑制體之功能性表現來干擾或降低雌蕊發育,如本文件所定義,其為人類干預之結果。
雌蕊發育受到干擾或降低的去雌性化植物可藉由此技藝人士將其與合適的參考植物比較來決定,暴露在相同的生長條件,其中在該情況下參考植物相較於去雌性化植物生產較少的功能性花粉,它將被授粉使得授粉本身不會限制著果。所述參考植物將具有與去雌性化植物相同的倍體程度,為雄蕊顯著植物,且本文件中所揭示之所述參考植物中,雌蕊發育(GDS)基因、其同源物或異種同源物之抑制體之功能性表現尚未修復或增進。最佳地,參考植物與所評估的雌性化植物同基因。較佳的參考植物之實施例係由成為去雌性化之植物的無性生殖(vegetative propagation)所獲得之同基因植物,在人類干預造成修復或增進GDS基因之功能性表現之前,較佳為藉由短暫繁殖階段以避免體細胞變異,這可能使得兩株植物不足以
同基因以進行適當的比較。。合適的參考之另一較佳實施例為從兩個雙單倍體親本之間的雜交產生的(平均或其中一員)大量的親姊妹種,或與雜交種為相同親本之純種(故高度近交),從中去雌性化植物進行評估的結果,其中所述親姊妹種或任何他們的親本尚未成為人類干預靶向雌蕊發育(GDS)基因、其同源物或異種同源物之抑制體的目標。假如前述較佳參考植物無法使用,例如,假如人類干預修復或增進雌蕊發育(GDS)基因之抑制體的功能性表現,實行於配子(配子)上,此技藝人士可能需要足夠多的兄弟姐妹,其為雄蕊顯著植物,其中所述姊妹種或任何他們的親本尚未成為此類人類干預的目標,作為雌性化植物之參考。若這些姊妹種無法使用或數量很少,此技藝人士可以作為參考,將去雌性化植物之雄蕊顯著上代作為參考植物,其中所述雄性上代尚未成為人類干預造成修復或增進雌蕊發育(GDS)基因、其同源物或異種同源物之抑制體的功能性表現之目標。為了使所述雄性上代為可用,此技藝人士可無性繁殖該上代。
當參考植物為基因上可變異,其可阻礙與高度同基因參考植物之比較,此技藝人士可測試干擾或降低去雌性化植物之雌蕊發育的性狀是否為零假設,其獨立地分離GDS基因及/或它的同源物或異種同源物之已修復或增進的功能性表現,在合適的試驗雜交中族群應被接受或拒絕。精細定位及表現型可接著提供進一步的說明於GDS基因在去雌性化作用中之角色。
干擾或降低雌蕊發育如同使用於去雌性化之定
義,意指所述受干擾或降低雌蕊發育的植物,其相較於合適的參考植物較無法生產包括可生長發育的(viable)種子之漿果。
干擾或降低雌蕊發育,如使用於去雌性化作用之定義,可包括減少花柱長度及較少顯著的柱頭,其可藉由一尺度來測量或推斷,例如由Franken(1969,1970)及Beeskov(1967)所應用之尺度,降低或干擾雌蕊發育於上述之尺度意指去雌性化植物之花朵將於所述尺度上得到相較於參考植物更低的分數。
本定義中所提及之人類干預的雌性化作用或去雌性化作用包括誘發的突變之任何形式,無論是透過輻射、化學處理或任何其它方式之突變誘發。亦包括任何形式之基因的干擾(雌性化作用)或修復(去雌性化作用)或干擾基因之轉錄及轉譯。關於此之實施例為編碼序列之基因修飾、剪接變異體之誘導、由於甲基化之後生(epigenetic)改變、藉由RNAi抑制表現、CRISPR、反義(anti-sense)表現、基因之順調控元件中修飾之位置等。亦包括植物之雜交,其具有突變的基因與未修飾的植物,並在存在突變的GDS基因且在標記輔助選擇引導下挑選後代。
雄性化作用(Masculinization)或被雄性化定義為定義為藉由修復或增進顯性雄性刺激子(e.g.AsOsTDF1)、其同源物或異種同源物之功能性表現以修復或增進雄蕊發育,如本文件中定義為修復或增進係人類干預之結果。
在雄性化植物中雄蕊之修復或增進發育可藉由此技藝人士將其與適合的參考植物比較來決定,暴露在相同的生
長條件。所述參考植物將具有與雄性化植物相同的倍體程度,非天生雄蕊顯著植物,且本文件中所揭示之所述參考植物中雄性刺激子基因、其同源物或異種同源物之功能性表現尚未受到修復或增進。最佳地,參考植物與所評估的雄性化植物同基因。較佳的參考植物之實施例係由成為雄性化之植物的無性生殖所獲得之同基因植物,在人類干預造成修復或增進雄性刺激子基因之功能性表現之前,較佳為藉由短暫繁殖階段以避免體細胞變異,這可能使得兩株植物不足以同基因以進行適當的比較。假如前述較佳參考植物無法使用,例如,假如人類干預造成修復或增進雄性刺激子基因之功能性表現實行於配子上,此技藝人士可能需要足夠多的兄弟姐妹,其非雄蕊顯著植物,其中所述姊妹種或任何他們的親本尚未成為此類人類干預的目標,作為雄性化植物之參考。若這些姊妹種無法使用或數量很少,此技藝人士可以作為參考,將雄性化植物之直系的雌性上代作為參考植物,其中所述雌性上代尚未成為人類干預造成修復或增進雄性刺激子基因、其同源物或異種同源物之功能性表現的目標。為了使所述雌性上代為可用,此技藝人士可無性繁殖該上代。
當參考植物為基因上可變異,其會阻礙與高度同基因參考植物之比較,此技藝人士可測試修復或增進雄性化植物之雄蕊發育的性狀是否為零假設,其獨立地分離雄性刺激子及/或其同源物或異種同源物之功能性表現的修復或增進,在合適的試驗雜交中族群應被接受或拒絕。精細定位及表現型可接著提供進一步的說明於靶向的雄性刺激子基因在雄性化作
用中之角色。
修復或增進雄蕊發育如同使用於雄性化之定義,意指所述增進或修復雄蕊發育的植物,其相較於合適的參考植物較能夠生產包括功能性花粉之功能性花藥。
增進或修復雄蕊發育可包括花絲(filament)長度的增加、較大的花藥(故尺寸增加),相較於天生雄蕊顯著植物具有營養層(tapetal)(或營養層(tapetum))發育。相較於天生雄蕊顯著植物的營養層發育意指其相較於通常在天生雌性中觀察到的,將顯示沒有或至少更少的營養層退化。
去雄性化作用(Demasculinization)或被去雄性化定義為藉由干擾或降低顯性雄性刺激子(例如AsOsTDF1)、其同源物或異種同源物之抑制體之功能性表現來干擾或降低雄蕊發育,如本文件所定義干擾或降低為人類干預之結果。
去雄性化植物中干擾或降低雄蕊發育可藉由此技藝人士將其與合適的參考植物比較來決定,暴露在相同的生長條件。所述參考植物將具有與去雄性化植物相同的倍體程度,為雄蕊顯著植物,且本文件所揭示之所述參考植物中,雄性刺激子基因、其同源物或異種同源物之功能性表現尚未受到干擾或降低。最佳地,參考植物與所評估的去雄性化植物為真正地同基因。較佳的參考植物之實施例係由成為去雄性化之植物的無性生殖所獲得之同基因植物,在人類干預靶向雄性刺激子基因之前,較佳為藉由短暫繁殖階段以避免體細胞變異,這可能使得兩株植物不足以同基因以進行適當的比較。合適的參考之另一較佳實施例為從兩個雙單倍體親本之間的雜交產生
的(平均或其中一員)大量的親姊妹種,或與雜交種為相同親本之純種(故高度近交),從中去雄性化植物進行評估的結果,其中所述親姊妹種或任何他們的親本尚未成為人類干預靶向雄性刺激子基因、其同源物或異種同源物的目標。假如前述較佳參考植物無法使用,例如,假如人類干預靶向雄性刺激子基因實行於配子(配子)上,此技藝人士可能需要足夠多的兄弟姐妹,其為雄蕊顯著植物,其中所述姊妹種或任何他們的親本尚未成為此類人類干預的目標,作為去雄性化植物之參考。若這些姊妹種無法使用或數量很少,此技藝人士可以作為參考,將去雄性化植物之直系雄性或雄蕊顯著上代作為參考植物,其中所述雄蕊顯著上代尚未成為人類干預靶向其雄性刺激子基因、其同源物或異種同源物之目標。為了使所述雄性雄蕊顯著上代為可用,此技藝人士可無性繁殖該上代。
當參考植物為基因上可變異,其會阻礙與高度同基因參考植物之比較,此技藝人士可測試干擾或降低去雄性化植物之雄蕊發育的性狀是否為零假設,其獨立地分離靶向的雄性刺激子及/或它的同源物或異種同源物,在合適的試驗雜交中族群應被接受或拒絕。精細定位及表現型可接著提供進一步的說明於靶向的雄性刺激子基因在去雄性化作用中之角色。
降低或干擾雄蕊發育如同使用於去雄性化之定義,意指獲得所述降低或干擾發育的植物,其相較於合適的參考植物較無法生產包括功能性花粉之功能性花藥。
降低或干擾雄蕊發育可包括花絲(filament)長度的減少、較小的花藥(故尺寸減小),相較於天生雌性植物具有營
養層(tapetal)(或營養層(tapetum))發育,例如,相較於天生雌性植物顯示營養層發育意指其相較於通常在雄蕊顯著植物中觀察到的,將顯示如同通常在雌性植物中所觀察之沒有營養層發育或至少更少的營養層發育。
本定義中所提及之人類干預的雄性化作用或去雄性化作用包括誘發的突變之任何形式,無論是透過輻射、化學處理或任何其它方式之突變誘發。亦包括任何形式之基因的修復(雄性化作用)或干擾(去雄性化作用)或干擾基因之轉錄及轉譯。關於此之實施例為編碼序列之基因修飾、剪接變異體之誘導、由於甲基化之後生(epigenetic)改變、藉由RNAi抑制表現、CRISPR、反義表現、基因之順調控元件中修飾之位置等。亦包括植物之雜交,其具有突變的基因與未修飾的植物,並在存在突變的雄性刺激子基因且在標記輔助選擇引導下挑選後代。
雄性上代定義為雄蕊顯著植物,能夠生產屬於一植物的譜系之功能性花藥,該植物源自於後代植物,其可包括上代的無性繁殖,它的體細胞或體組織係源自於一植物。
譜系,為可繁衍植物後代之上代的列表。
雌蕊發育之抑制(Suppression)或雌蕊發育之抑制(inhibition)定義為通常在雄性及雄性雌雄同體(故不同於雌雄同體)或中性植物中觀察到的現象,其顯性抑制體基因阻礙雌蕊發育。通常,雌蕊發育之抑制不會在天生雌性中觀察到,或生產許多漿果的天生雌雄同體,包括可生長發育的種子,且應從所有他們的花朵中生產漿果,條件是那些植物係在最佳條件
下生長及條件是那些植物可以透過可生長發育的花粉來受精,且不會受到近交衰退或突變之損害,其可能造成適應度降低而影響著果。被假設為會抑制雌蕊發育之植物無法從他們的花朵或不會從所有他們的花朵著果,甚至當他們在最佳條件下生長且可以透過可生長發育的花粉來受精,且不會受到近交衰退或突變之損害,其可能造成適應度降低而影響著果。除了降低生產漿果的能力,包括可生長發育的種子,顯示雌蕊發育之抑制的植物應該展現明顯的花柱長度減少及/或較少顯著的柱頭,其可藉由一尺度來測量或推斷,例如由Franken(1969,1970)及Beeskov(1967)所應用之尺度。根據Beeskov(1967)之尺度,顯示抑制雌蕊發育之植物應該具有花朵,其將被分類為分數少於IV,較佳為少於III,較佳為少II,較佳為等於I。根據Franken(1969,1970)之尺度,顯示抑制雌蕊發育之植物應該具有花朵,其將被分類為分數少於5,較佳為少於4,較佳為少3,較佳為少於2,較佳為等於I。雌蕊發育之抑制應該係雌蕊發育抑制體GDS基因之功能性表現的結果,其同源於本文件所提供之序列。在植物中活躍的顯性抑制體基因可藉由將植物之試驗雜交後代表現型來測試,並拒絕干擾雌蕊發育表現型及連鎖於M基因座之標記的假設,例如描述於技術獨立分離者。
雄蕊(Androecium)係指花朵的雄器(stamens)之集合術語,其中瓷器通常包含稱為花絲的炳及含有孢子囊(microsporangia)的花藥,其中花粉粒由小孢子發育而成。
TDF1標記輔助選擇定義為具有一個目標在於引
進誘發雄性化作用或去雄性化作用之任何突變之標記輔助選擇,或其係藉由基於試驗的信息來引導(例如但不限於Sanger定序、CAPS標記分析,高解析溶解曲線標記分析、Taqman試驗、Kasp試驗等),目的是闡明本文件所揭示之TDF1基因、其同源物或異種同源物之序列信息至植物譜系。TDF1標記輔助選擇亦可包括使用信息,目的是闡明親本植物之TDF1基因、其同源物或異種同源物的序列信息,以下介紹譜系中期望的TDF1等位基因,其中使用其它標記而非靶向TDF1基因者,其充分地連鎖至期望的TDF等位基因,較佳為20cM以內,更佳為10cM以內,更佳為5cM以內,更佳為1cM以內。
GDS標記輔助選擇定義為具有一個目標在於引進誘發雌性化作用之任何突變之標記輔助選擇,或其係藉由基於定序或試驗的信息來引導(例如但不限於CAPS標記分析,高解析溶解曲線標記分析、Taqman試驗、Kasp試驗等),目的是闡明本文件所揭示之GDS基因、其同源物或異種同源物之序列信息至植物譜系。GDS標記輔助選擇亦可包括使用信息,目的是闡明親本植物之GDS基因、其同源物或異種同源物的序列信息,以下介紹譜系中期望的GDS等位基因,其中使用其它標記而非靶向GDS基因者,其充分地連鎖至期望的GDS等位基因,較佳為20cM以內,更佳為10cM以內,更佳為5cM以內,更佳為1cM以內。
突變誘發(mutagenesis)或突變誘發處理定義為使能夠,較佳為增進,以穩定的方式改變生物體的遺傳訊息之過程,造成實驗上達成之突變,因此不同於在自然界中自發產
生的突變,不同於藉由施用非自然的輻射劑量或非自然的暴露於誘變劑。
顯性雄性刺激子(基因)為連鎖至或存在於M基因座的基因,其授予雄蕊顯著植物之發育或源自於此基因之基因產物。此顯性雄性刺激子(亦表示為雄蕊發育之刺激子或花藥發育之刺激子)為蛋白質,其編碼為相同於TDF1基因或為TDF1(營養層發育及功能1缺陷)基因之同源物或異種同源物,其發現於阿拉伯芥AT3G28470及水稻(osTDF1、LOC_Os03g18480)。蘆筍中異種同源物基因之序列,AsOsTDF1,由SEQ ID NO:4、SEQ ID NO:5及SEQ ID NO:6提供。
由於一些原因,描述於Maeda et al.(2005)之”原生質體培養”章節之體細胞胚胎之程序包括引用Kunitake及Mii(1990)之方法及移植由所述體細胞胚胎獲得的植物至一領域,其不包括雌蕊之增進物理特性之人類干預的實施例。如本文件已討論之文獻回顧,Meada(2005)之作品提供給此技藝人士之關於從體細胞胚胎獲得性轉換植物之教示不充分,且這將提供可實行的方法。儘管無法完全地排除其充分地證明性轉換植物可藉由胚胎培養接著移植來產生,如同Maeda et al.(2005)所採用,本發明之作者對於排除Maeda et al.(2005)描述之方法沒有任何問題,如本文件中定義雌性化作用所使用之人類干預。此技藝人士將了解人類干預之任何方法,其延伸至描述於Maeda et al.(2005)之體細胞胚胎及移植,因此包括額外的步驟。較佳為所述步驟會包括突變誘發或GDS標記輔助選擇之
應用,在體細胞胚胎之前或之後,但排除傳統的雜交以產生可生長發育的後代作為唯一額外的人類干預。在這樣的方式下,就有可能獲得雌性化植物,其接下來可為不同的方法。
天生雄性蘆筍植物定義為能夠生產具有完全發育的花藥之花朵的植物,其如同可被發現於自然界中之植物,係由於它具有至少一個顯性蘆筍基因的天生功能性複製,其同源於營養層發育及功能1缺陷(TDF1)。
當植物包含相同於等位基因的基因時,所述基因稱為”同型接合(homozygous)”,而當植物包含兩個不同於等位基因的基因時,所述基因稱為"異型接合(heterozygous)"。大寫字母之使用代表顯性(形式)基因,且小寫字母之使用代表隱性基因。因此,對於基因或屬性X,"XX"代表同型合子(homozygote)顯性基因型;"Xx"或"xX"代表異型合子(heterozygote)基因型;且"xx"代表同型合子隱性基因型。如所周知,只有同型合子隱性基因型將大致提供相應的隱性表現型(即導致植物顯示屬性或性狀"x"),然而異型合子即同型合子顯性基因型將大致提供相應的顯性表現型(即導致植物顯示屬性或性狀"X"),除非諸如多重等位基因、抑制體、共顯性等的其他基因及/或因子(也)扮演決定表現型的角色。當植物僅具有染色體對或染色體片段的其中一股而非平常的兩股,該植物稱為”半合子(hemizygote)”;本發明更明確地描述術語半合子係指特定地Y連鎖基因,故在雄性染色體中,在某種程度上雄性植物具有雌性缺乏的染色體片段。
如本文所使用,術語”植物”包括整體植物或其任
何部分或衍生物,例如植物細胞、植物原生質體、植物(例如蘆筍植物)可以再生之植物細胞組織培養、植物細胞(plantcalli)、植物細胞叢(clumps)及在植物中完好的植物細胞,或植物之部分,例如胚胎、花粉、胚珠、果實(例如採收的番茄)、花朵、葉子、種子、根、根尖等。
根據本發明異種同源物或異種同源的基因為物種或同樣品種之間進化分歧的基因。這代表本文所定義的GDS基因之異種同源物在物種中可代表任何基因,其不同於源自於本案之GDS序列之物種或品種,且從相同的上代序列進化而來。應當意識到,即使不是全部,大部分的異種同源基因之情況可維持所述基因之功能。在此意義上,如本文所指明之GDS基因的異種同源物具有與本案所描述之蘆筍的GDS基因相同之功能。異種同源物可分享很大程度的同源物,但非必須。通常不同品種中異種同源基因被發現於相似的遺傳環境,即在基因簇之內聚集,對於大部分存在於群集中的基因,這可以說是異種同源的。
根據本發明之同源物或同源的序列為與所述同源物之序列具有高程度序列相似度(identity)之序列。在這方面之高度序列相似度或高度同源性代表兩個同源序列之核酸序列在選擇的雜交條件下,會選擇性地互相雜交。同源的核酸被認為是功能性同源物或功能性同源序列,若其編碼為具有生物功能之胺基酸序列,其功能相似於編碼為被認為是同源基因的蛋白質之功能。
在此意義上,本發明中高度序列相似度之定義包
括核苷酸序列,其具有關於序列之相似度的百分比,它們被認為是65%至95%的同源性。因此,例如,相似度之百分比可為至少65%,70%,75%,80%,85%,90%,或95%。基於核苷酸序列之序列相似度可以藉由使用BLASTN電腦程式來計算(其為公開可用的,例如透過國家生物技術信息中心(NCBI),可透過網路http://www.ncbi.nlm.nih.gov/取得),使用內定設定,字長(W)為11、期望值(E)為10、對於一對配對殘基(M)之獎勵分數為5、對於失配(N)之懲罰分數為-4及截點為100。
此外,可以根據編碼為所述核苷酸序列之蛋白質的氨基酸序列來測量同源性。對於胺基酸而言,可以透過BLASTP電腦程式(也可透過http://www.ncbi.nlm.nih.gov/取得)來測量序列相似度。在胺基酸的標準上,功能性同源物定義為與所述蛋白質之胺基酸序列具有至少50%的序列相似度之氨基酸序列,較佳為至少55%,更佳為至少60%,更佳為至少70%,更佳為至少80%,更佳為至少90%,更佳為至少95%。蛋白質的功能性同源物或異種同源物定義為具有相似於被認為是同源或異種同源的蛋白質之生物功能。
編碼為胺基酸序列之核酸序列可具有許多變異。由於遺傳密碼的性質,故有不同的核苷酸之三聯體,其可轉譯成一及相同的氨基酸。應當理解,編碼為蛋白質之核酸可大幅地改變而不會造成不同的氨基酸序列。此類遺傳密碼的不穩定可能不會影響兩個編碼為同源或異種同源蛋白質之核酸序列的同源性程度。根據本文所使用之定義,若編碼的蛋白質被視為是高度同源或異種同源,則編碼的核酸亦應被視為高度同
源。
本發明之第一目的係藉由改變雌性抑制體基因之表現及/或改變能夠使雄蕊發育的基因之表現,以提供改變植物的性別或性之方法。另一目的是藉由使用雌性抑制體基因功能喪失及/或提供能夠使雄蕊發育的基因,以提供雌雄異株植物之自花受精或異質雜交的另一種方法,該植物較佳為蘆筍植物。
第二目的係提供技術上的教示於如何"雌性化植物",可以明確地獲得雌雄同體、或部分雌雄同體或雄性雌雄同體植物、或較佳為來自天門冬屬之雌性植物,其不同於本領域中已知的方式。
第三目的係提供技術上的教示於如何將雌性植物雄性化成具有功能性雄蕊的雄性植物。
本發明建立精心設計的試驗雜交,雌性化植物之單基因隱性性連鎖遺傳,特別是雌雄同體表現型之存在。再者,鑑定雌蕊發育的性連鎖顯性抑制子。此基因之特性揭示了這是包含基因的DUF 247域。發現具有雌雄同體或雌性表現型的十個突變,它們全部包含與此基因表現相關之不同突變,在本發明中指定為GDS基因。發現一些突變也缺乏功能性TDF1基因之表現(營養層發育及功能1缺陷,同源於阿拉伯芥AT3G28470)及水稻osTDF1(LOC_Os03g18480),其將它們的表現型從雄性改變成雌性。
此單基因隱性遺傳性連鎖雌雄同體表現型之存
在,測試三個獨立突變在譜系中之分離,指出賦予雌性化作用的基因在蘆筍中為顯性雌性抑制體,演化的生物學家(Westergaard,1958,Charlesworth及Charlesworth,1978)通常將其預測為雌雄異株品種,但其從未被有力的證明存在於蘆筍中。本發明教示了此類雌性抑制體的確存在於蘆筍中,且可以這樣的方式操作,它失去了其雌性抑制能力且將原本絕對的雄性植物轉化為具有完全花朵的植物,其可以自花受精及/或雜交至另一雄性植物,或者,假如失去了雌性抑制體之操控再加上雄性刺激子,原本的雄性植物可以轉化成雌性植物。此外,本發明描述了可以引進/漸滲(introgressed)失去其雌性抑制能力之雌性抑制體的等位基因,再加上其他植物中基因上連鎖的雄性(花粉)生育力,以創造新的雌雄同體植物。本發明描述自花受精或雜交至其他雄性植物之不同於現有方式的方法,例如使用雄性雌雄同體植物或雌雄同體植物於其它已被描述之遺傳模型-或至少為基因上更複雜-相較本發明所開發之簡易單基因隱性遺傳。
再者,本發明包括提供此類植物之方法,且其中所述植物僅暫時地表現此表現型。
此外,本發明揭示將雌性植物改變為雄性植物之方法,其應藉由引進功能性複製或TDF1基因產物來完成。
此技藝人士將理解,切換雌性抑制體之開關,或更細微地,部分增進或降低雌蕊發育之抑制係使用於其廣義的解釋中。使能夠或增進雌蕊發育之抑制可以是提供賦予抑制雌蕊發育的基因之功能性複製的結果。"關閉",使無法或降低雌
蕊發育之抑制可包括任何方法以降低賦予抑制雌蕊發育的基因之表現或功能。此技藝人士亦將了解切換賦予抑制雌蕊發育的基因之開關或降低及增進所述基因之抑制並非僅限定於所提供之帶有功能性花藥的植物。若雄性植物之賦予抑制雌蕊發育的基因(部分)關閉(例如:功能性表現降低),其確實可能造成(更多)雄性雌雄同體植物或雌雄同體植物。然而,雌蕊發育之抑制的降低也可能與花藥功能性的不存在或降低同時發生,例如但不限於雌蕊發育之抑制體及花藥發育之刺激子兩者被單一缺失共同干擾之情況。在該情況中,雄性或雄性雌雄同體植物轉變為雌性植物,且該情況(其中改變雌蕊發育之顯性抑制體同時干擾雄蕊發育之刺激子)也包括在本發明之中,作為控制雌蕊發育之抑制體的功能性之方法。
在此上下文中,應當理解,本文所使用之術語雌蕊發育抑制體-基因(GDS基因)或-等位基因係指具有描述於SEQ ID No:1之序列的等位基因或其功能性同源物異種同源物。此類基因或等位基因之較佳實施例係含有基因之特定的天門冬屬DUF247域,其中cDNA係提供於SEQ ID NO:1。因此,本發明之部分為能夠對蛋白質進行編碼之所有核酸序列,該蛋白質係異種同源或功能性同源於編碼為SEQ ID NO:1之核苷酸序列的胺基酸序列。
本文顯示此基因之功能喪失提升了雌蕊發育之抑制。GDS基因之功能喪失或功能降低係藉由偵測漿果數量來定量測量,且相對於屬於所述植物之譜系的同代或前代,生產於植物上的種子增加。此類功能喪失通常係藉由相較於譜系之
前代為新穎的突變所造成。本文所使用之突變GDS基因或等位基因可能因此是指GDS基因之任何功能喪失,其造成產生或促使本發明之表現型。描述於本文的一突變為GDS-缺失-插入等位基因,從伽馬射線處理的結果而獲得,其具有開始於支架M基因座4(基因組版本V1.1)之第1820個核苷酸之缺失-插入事件,其被推斷為造成SEQ ID NO:1之核苷酸567之後的編碼資訊不存在。
描述於本文的另一個突變為GDS-缺失-等位基因,其具有胸腺嘧啶(單一鹼基對)缺失於GDS基因之第一外顯子的3'末端,其為胸腺嘧啶之缺失,相應於SEQ ID NO:1之位置527的缺失,其將導致讀框(reading frame)位移。
描述於本文的另一突變為GDS epi-等位基因,其為超甲基化的結果,其中所述甲基化覆蓋第一預測外顯子、第一預測內含子並部分重疊GDS基因的第二預測外顯子2。所述甲基化特別是(但不僅僅是)CHG甲基化,跨越支架905(基因組版本V1.1)之核酸309762-308323或1053-2492或支架M基因座4(基因組版本1.1)。觀察到的表觀等位基因(epi-allele)之CHG甲基化差異將與SEQ ID NO:1重疊於從第5至第859個核苷酸的區間中。然而,描述於本文的另一突變{K5756]為GDS等位基因,其特徵在於將SEQ ID NO:1之位置684之胞嘧啶(cytosine)改變為腺嘌呤(adenine),其導致脯胺酸(proline)變為蘇胺酸(threonine)之胺基酸改變(Pro→Thr)。
本文所述之另一突變為GDS等位基因[K4381],其特徵在於將SEQ ID NO:1之位置166的胞嘧啶改變為腺嘌
呤。
本文所述之另一突變為GDS等位基因[K1150],其由伽馬射線處理所導致,其特徵在於將相對於SEQ ID NO:1中位置1193之位置的腺嘌呤改變為鳥糞嘌呤,其導致胺基酸天門冬醯(asparagine,N)改變為胺絲胺酸(serine,S)。
本文所述之另一突變為GDS等位基因[K1129-300-8]為將相同於SEQ ID NO:3之核苷酸位置1160之腺嘌呤改變為胸腺嘧啶。此腺嘌呤至胸腺嘧啶之改變係被665核苷酸從GDS基因之第一預測起始密碼子之腺嘌呤分隔開來。
描述於本文之三個相似突變為三個分別獲得的非天然GDS無效等位基因(null-allele),其中GDS基因已完全地刪除(在本案例中為伽馬射線處理之結果),其係從遺傳標記等位基因及序列的喪失所推斷。
GDS基因在本文中被理解為包括在其蛋白質序列中的未知功能之域(Domain of Unknown Function)247的基因,其可屬於蛋白質之族群於雌雄異株蘆筍品種中,抑制雌器發育及結果。所述GDS基因的較佳實施例為包含描述於本文之基因的天門冬屬DUF247域。然而,本發明亦包括此GDS基因的功能性同源物及/或異種同源物。
本說明書亦使用”雌蕊發育之顯性抑制體”之術語。此術語更明確地解釋雌性抑制體GDS基因之功能,但對於其餘的應被視為相同於此術語。
抑制雌蕊發育的雌性抑制體基因也可被引進其它
植物中,例如提供雌性不孕性(sterility)以防不期望的著果。
本發明之雌雄異株植物較佳為天門冬屬,更加為蘆筍品種。然而,本發明亦考慮其他雌雄異株植物,例如作物大麻(Cannabis),西非防己屬(Dioscoreophyllum volkensii),葎草(Humulus),黃連木(Pistacia),紅豆杉(Taxus)和纈草(Valeriana)。
天門冬屬為一屬別,在植物中之科別為天門冬科(Asparagaceae),亞科別為天門冬科(Asparagoideae)。其包括高達300種物種。大部分為常綠長壽多年生植物,其生長於諸如藤本植物、灌木或攀爬植物之下層植物。最知名的物種為可食用的蘆筍(Asparagus officinalis),通常僅稱為蘆筍(asparagus)。本發明之目的為改變天門冬屬植物之性別或雜交並選擇屬於亞屬天門冬屬(見Norup et al.2015及亞屬天門冬屬分支系於他們的第3圖)的天門冬屬植物,該物種通常是雌雄異株,例如但不限於A.aphyllus、A.stipularis、A.ffilicinus、A.schoberoides、A.kiusianus、A.oligoclonos、A.maritimus、A.inderiensis、A.officinalis或A.cochinchinensis或A.prostratus或其時常為雌雄異株(gynodioecius),例如但不限於A.plocamoides、A.altissimu、A nesiotes及A acutifolius。假如本文係指蘆筍或天門冬屬植物或蘆筍植物,至少所有上述用於育種之天門冬屬物種或屬於天門冬屬之任何的蘆筍植物皆包括在內。
包括雌蕊發育(GDS)基因及等位基因之抑制體的核酸序列或片段,及包括GDS基因及等位基因的核酸序列或
片段也可藉由它們與上述GDS”雜交(hybridise)”的能力來定義,特別是提供於SEQ ID NO:1或SEQ ID NO:3或所述基因之剪接變異體之序列,較佳為在中度條件下,更佳為在嚴格雜交條件下。本文中”嚴格雜交條件”定義為允許至少約25,較佳為約50、75或100個核苷酸之核酸序列的條件,更佳為約200或更多核苷酸,以在約65℃的溫度下於包括約1M鹽的溶液中雜交,較佳為6 x SSC或任何具有相當於該離子強度的其它溶液,並在65℃下於包括約0.1M或更少鹽的溶液中清洗,較佳為0.2 x SSC或任何具有相當於該離子強度的其它溶液。較佳地,實行該雜交至隔夜,即至少10個小時,且較佳的清洗為以至少兩種不同的清洗液實行至少一小時。這些條件通常將允許具有約90%或更高相似度的序列之特定雜交。
本文中”中度雜交條件”定義為允許至少約50個核苷酸,較佳為約200或更多核苷酸之核酸序列的條件,以在約45℃的溫度下於包括約1M鹽的溶液中雜交,較佳為6 x SSC或任何具有相當的離子強度之其它溶液,並在室溫下於包括約1M鹽的溶液中清洗,較佳為6x SSC或任何具有相當的離子強度之其它溶液。較佳地,實行該雜交至隔夜,即至少10個小時,且較佳的清洗為以至少兩種不同的清洗液實行至少一小時。
這些條件通常將允許具有高達50%序列相似度的序列之特定雜交。本領域之技藝人士將能夠修改這些雜交條件,以便具體地鑑定相似度改變於50%與90%之間的序列。
本發明之重要實施例為增進雌雄異株植物之育種
的方法,包括提供一植物,其中雌蕊發育之顯性抑制體的功能性表現受到干擾或降低,且引進所述植物於[1]近交、[2]回交育種或反覆回交育種或[3]雙單倍體育種技術。如在背景技術部分中所說明,由於自花受精、回交及種子繁殖之使用限制,雌雄異株植物之育種受到阻礙。本發明所提供之植物中GDS基因之表現受到干擾或阻礙解決了此問題,因為它使得雌雄同體或部分雌雄同體植物能夠發育,其可以用來產生純種親本品系。
本發明之特定的實施例中,描述於本發明之”雌雄同體性種”係用於雌雄異株植物之育種,較佳為天門冬屬植物以便創造近交品系。
基本上,根據本發明以創造一或多個近交品系包括下述步驟:
[1]創造新穎的雌雄同體植物,其中雌蕊發育之顯性抑制體的功能性表現受到干擾或降低,其造成具有功能性雌蕊及功能性雄蕊兩者的植物,下文中亦稱為具有”雌雄同體性狀”的植物。下文將進一步描述如何創造該新穎的雌雄同體植物,其中雌蕊發育之顯性抑制體的功能性表現受到干擾或降低。
[2]藉由製備包括”雌雄同體性狀”的雜交植物以製備新穎的雌雄同體植物,至少有一個包括”雌雄同體性狀”的第一植物與第二植物雜交之雜交種。
[3]促進由步驟[1]或步驟[2]所獲得的植物之自花受精,並從其後代中挑選一或多個較佳的植物。
[4]可選地重複由步驟[3]所獲得的植物之自花受精之步驟
一或多次,並從其後代中挑選一或多個較佳的植物。
[5]藉由充分地修復雌蕊發育之顯性抑制體之功能或表現,可選地將由步驟[3]所獲得之包括”雌雄同體性狀”的植物之性別改變為雄性植物。
本發明之一特定實施例中,步驟[2]之所述新穎的雌雄同體植物係藉由將包括所述”雌雄同體性狀”的第一植物與雌性性別之第二植物雜交所創造,並從其後代中挑選包括所述”雌雄同體性狀”的植物。在本發明另一實施例中,步驟[2]之所述新穎的雌雄同體植物係藉由將包括所述”雌雄同體性狀”的第一植物與包括所述”雌雄同體性狀”之第二植物所創造,並從其後代中挑選包括所述”雌雄同體性狀”的植物。
在本發明又一實施例中,步驟[2]之所述新穎的雌雄同體植物係藉由將包括所述”雌雄同體性狀”的第一植物與雄性性別的第二植物雜交所創造,該第二植物對於雌蕊發育之顯性抑制體並非同型接合,並從其後代中挑選包括所述”雌雄同體性狀”的植物。
在本發明另一實施例中,步驟[2]之所述新穎的雌雄同體植物係藉由第一步驟(a)其中將包括所述”雌雄同體性狀”的第一植物與雄性性別的第二植物雜交所創造,該第二植物對於雌蕊發育之顯性抑制體為同型接合或異型接合,並從其後代中挑選雄性植物,其將能夠轉移該”雌雄同體性狀”至下一代,接著是第二步驟(b)其中將從步驟(a)所獲得的雄性植物作為第一植物並與第二植物進行雜交,該第二植物對於雌蕊發育之顯性抑制體並非同型接合,並從其後代中挑選包括所述”雌
雄同體性狀”的植物。
關於此第一實施例,提供了本發明之雌性植物,其中GDS及TDF1基因兩者之表現共同受到干擾或阻礙。該植物有助於解決此問題,因為它使此作為雌蕊親本的特定雌性植物能夠與源自所述雌性植物的植物進行雜交,但該植物仍然包含GDS及TDF1兩者基因。此類雜交基本上為可以用來產生純種親本品系的雜交種。關於上述所討論之實施例的可能性係提及以闡明一植物,其中GDS基因受到干擾或阻礙可使雌雄同體或部分雌雄同體植物能夠發育,但在特定情況下延伸至雌性植物的發育。
本發明之又一實施例中,利用雌雄同體性狀於回交育種中。特別是本發明提供將”遺傳性狀”引進超雄性植物之遺傳背景之方法,以提供同基因的超雄性植物,其中超雄性植物定義為將無法提供雌性植物於其直系後代之植物。由本發明所獲得之超雄性植物為高度同基因,係由於其具有使超雄性之一級血親與超雄性本身之間進行正交的能力。因此,本發明提供之方法允許一級血親與其超雄性親本之正交以獲得所述雜交之後代。這可藉由所提供之方法以達成,包括下述步驟:
[1]製備F1雜交植物後代作為第一步驟以引進”遺傳性狀”(即感興趣之性狀)至超雄性植物的遺傳背景中,其係藉由將包括”遺傳性狀”的第一植物與超雄性之第二植物進行雜交,並從其後代中挑選能夠將”遺傳性狀”轉移至下一代的植物。
此技藝人士可理解在步驟[1]中,能夠轉移”遺傳性
狀”至超雄性之遺傳背景的第一植物可以為任何性別。然而,假如所述第一植物為雄性性別,則使用於第一步驟[1]之雜交的第一植物或第二植物或兩者,即至少單一植物,必須能夠生產種子。能夠生產種子的該植物應為雌性化。該雌性化植物為”雄性至雌雄同體變性”或”雄性至雄性雌雄同體變性”。因此,該植物可能為干擾雌蕊發育之顯性抑制體的功能或降低雌蕊發育之顯性抑制體的表現之結果,或其為雄性至雌性變性係干擾雌蕊發育之顯性抑制體的功能或降低植物雌蕊發育之顯性抑制體的表現之結果,其中雄蕊發育之刺激子之表現也受到干擾或降低。
此技藝人士將認識到本發明提供製造F1雜交種的方法,其係藉由將能夠轉移”遺傳性狀”的雄性植物直接地雜交至超雄性植物,該方法迄今為止在本領域中係不可能的,除非用於步驟[1]之第一植物或第二植物或兩者植物表現天生的雌雄同體或雄性雌雄同體,根據本發明其不同於雌性化作用。此技藝人士將認識到,沒有必要特別描述步驟[1]中之植物是否為雌性化,由於第一步驟描述了"後代"必須從一植物中獲得,其中"可以挑選主要能夠將"遺傳性狀"轉移至下一代的該植物"。然而,此技藝人士將意識到此能力,即使用能夠轉移"遺傳性狀的雄性植物作為步驟[1]之第一植物具有可變性(flexibility)。
[2]第二步驟(BC1或Back-Cross 1)係將由步驟[1]獲得的雜交種與第二植物進行進行回交,該第二植物與用於步驟[1]之超雄性相同或與該超雄性具有相似的基因型,其中第一
植物或第二植物或兩者植物,即步驟[2]之雜交之至少單一植物,受到雌性化,其為干擾雌蕊發育之顯性抑制體的功能或降低雌蕊發育之顯性抑制體的表現之結果,較佳為短暫地,從其BCI後代中挑選主要能夠將"遺傳性狀"轉移至下一代且具有功能性雄蕊的植物。
[3]可選地重複步驟[2]一或"n"次以保證由步驟[2]獲得的雜交種足以與首先使用於步驟[1]之超雄性植物同基因,並從其後代中挑選主要能夠將"遺傳性狀"轉移至下一代且具有功能性雄蕊的BC2或BCn植物。
可選地,且較佳為短暫地干擾植物雌蕊發育之顯性抑制體的功能,或較佳為暫時地降低植物雌蕊發育之顯性抑制體的表現,該植物為由步驟[1]或步驟[2]或步驟[3]中獲得的BC1或BC2或BCn(其中BCn代表對n世代回交之較高世代)植物,以促進自花受精並從其後代中挑選對"遺傳性狀"同型接合並代表超雄性的植物。
可選地獲得由步驟[1]或步驟[2]或步驟[3]中獲得的雙單倍體植物,以挑選對"遺傳性狀"同型接合並代表超雄性的植物。
可選地修復由步驟[2]或[3]或[4]獲得的植物之雌蕊發育之顯性抑制體的功能或表現,使得所述植物之"雌雄同體性狀"不再轉移到下一代,因此變為超雄性,其較佳為對該"遺傳性狀"同型接合。
此技藝人士將理解在由步驟[2]或[3]或[4]或甚至[5]中所獲得之植物的譜系中此步驟[6]將是必要的,引進永久
而非短暫的功能喪失或永久而非短暫的降低雌蕊發育之顯性抑制體的表現,其可允許"雌雄同體性狀"之不期望的轉移至下一代,故必須修復到雄性性狀(故通常至少足夠程度的雌蕊發育之抑制作為非雌雄同體或非雄性雌雄同體的雄性)。
此技藝人士將理解實行一級血親與其超雄性親本的正交以藉所述雜交來獲得後代之方法目前為止是不可能的。在引進遺傳性狀至超雄性之傳統方法中,雜交可以在具有所述"遺傳性狀"的植物之間進行,藉由將包括所述"遺傳性狀"的第一植物與第二"超雄性"植物進行雜交。然而,最後的雜交種將為雄性,且其永遠無法在隨後的世代中正交至超雄性反覆親本。取而代之地,在下一雜交之前,其先將所述雜交種與雌性植物進行額外的雜交,其為後者雜交之保留了"遺傳性狀"之結果,這是因為雌性親本可以再次雜交至超雄性反覆親本。在由本發明所提供的方法中,由於此超雄性或所述雜交種或兩者植物將為"雄性至雌雄同體的變性"或"雄性至雄性雌雄同體的變性"或"雄性或雄性雌雄同體至雌性的變性",其包括雌性化性狀,故與超雄性具有一級親緣的雜交種可以隨時與隨後世代中的超雄性進行正交。
例外的情況是,當一級血親或超雄性親本包括"天生的雌雄同體或雄性雌雄同體"時,將不可能提供一級血親與其超雄性親本之正交以藉由所述雜交獲得後代。該"天生的雌雄同體或雄性雌雄同體"並非雌蕊發育之顯性抑制體的表現受到干擾或降低之結果,而是自然發生的未知結果,非雌蕊發育抑制體GDS,如文獻中前面的段落所概述,"修飾基因"在本領
域中已被推測,故其不同於將”雌雄同體性狀”作為工具以創造本發明所提供之同基因的超雄性。
負責表現雌性抑制體(即雌蕊發育之抑制體)的GDS基因之操作,可以各種方式達成。GDS基因可表示為基因(SEQ ID NO:1)之假設的cDNA:
此cDNA轉譯成下列蛋白質:
另外,取決於分析基因組序列之方式,基因的cDNA表示為5個其它基因序列,如第3圖所列示。這些序列在本案中也被辨識為”剪接變異體”或”剪接變異”或SEQ ID NO:1之同源的天門冬屬序列(例如M4及3098,見實施例1)。應進一步指出的是,這些序列係源自列示於第13圖之基因組序列。
使用於本案之術語”GDS基因”被視為包括所有剪接變異體(包括SEQID NO:1)及所有基因組序列(包括內含子),其可源自於第13圖編碼為功能性雌性抑制體或編碼為同源/異種同源的基因之基因組序列。任何靶向此基因或被其轉錄之mRNA的遺傳構築物(construct)較佳為靶向外顯子1、外顯子2(或外顯子3)或DUF247域。關於DUF域,無法給出確切的共識。根據DUF247家族之EMBL-EBI定義,此域的特徵在於下列數據庫系列,其被用作種子來建立家族定義:#=GS Q9SJR2_ARATH/47-434 AC Q9SJR2.1
#=GS Y3720_ARATH/48-447 AC Q9SD53.1
#=GS Q8L703_ARATH/63-464 AC Q8L703.1
#=GS Q9FK84_ARATH/46-474 AC Q9FK84.1
#=GS Q9FK85_ARATH/33-422 AC Q9FK85.1
#=GS Q01J11_ORYSA/116-543 AC Q01J11.1
#=GS Q9SNE9_ARATH/180-572 AC Q9SNE9.1
#=GS Q5XVA4_ARATH/115-523 AC Q5XVA4.1
#=GS Q9SN03_ARATH/92-493 AC Q9SN03.1
#=GS A0MF17_ARATH/106-485 AC A0MF17.1
#=GS A0MF16_ARATH/141-548 AC A0MF16.1
#=GS Q6ZC88_ORYSJ/184-584 AC Q6ZC88.1
#=GS Q0ISB3_ORYSJ/59-439 AC Q0ISB3.1
#=GS Q2QQW6_ORYSJ/36-452 AC Q2QQW6.1
#=GS Q2QQW3_ORYSJ/44-442 AC Q2QQW3.1
#=GS Q2R303_ORYSJ/44-473 AC Q2R303.1
#=GS Q1RU73_MEDTR/31-462 AC Q1RU73.1
#=GS Q6YPE9_ORYSJ/42-450 AC Q6YPE9.1
#=GS Q6YRM8_ORYSJ/34-376 AC Q6YRM8.1
#=GS O22159_ARATH/86-487 AC O22159.2
#=GS Q5S4X4_ARATH/111-507 AC Q5S4X4.1
#=GS Q6E287_ARATH/8-398 AC Q6E287.1
#=GS Q8VYN0_ARATH/16-440 AC Q8VYN0.1
#=GS Q1ZY19_BETVU/30-415 AC Q1ZY19.1
#=GS O49393_ARATH/295-669 AC O49393.2
#=GS Q9LFM8_ARATH/35-411 AC Q9LFM8.1
#=GS Q65XU3_ORYSJ/66-531 AC Q65XU3.1
#=GS Q65XU0_ORYSJ/49-551 AC Q65XU0.1
#=GS Q65XT8_ORYSJ/62-514 AC Q65XT8.1
#=GS Q9FP37_ORYSJ/53-496 AC Q9FP37.1
#=GS Q6ZKD8_ORYSJ/79-483 AC Q6ZKD8.1
#=GS Q69TN1_ORYSJ/150-572 AC Q69TN1.1
#=GS Q7XDW8_ORYSJ/117-510 AC Q7XDW8.1
#=GS Q0J689_ORYSJ/12-411 AC Q0J689.2
#=GS Q0J2S9_ORYSJ/46-452 AC Q0J2S9.1
#=GS Q0J2T1_ORYSJ/42-479 AC Q0J2T1.1
#=GS Q651E4_ORYSJ/52-471 AC Q651E4.1
#=GS Q2QPY1_ORYSJ/9-413 AC Q2QPY1.1
#=GS Q2QPX9_ORYSJ/148-562 AC Q2QPX9.1
#=GS Q656Q9_ORYSJ/57-451 AC Q656Q9.1
#=GS Q94D69_ORYSJ/72-478 AC Q94D69.1
#=GS Q94D66_ORYSJ/18-428 AC Q94D66.1
#=GS Q6ET10_ORYSJ/21-420 AC Q6ET10.1
#=GS Q8LJD1_ORYSJ/36-407 AC Q8LJD1.1
#=GS Q60E19_ORYSJ/30-431 AC Q60E19.1
#=GS Q10RD5_ORYSJ/49-462 AC Q10RD5.1
#=GS Q6H4T3_ORYSJ/102-533 AC Q6H4T3.1
#=GS Q6K301_ORYSJ/128-542 AC Q6K301.1
如上所述,透過GDS基因之編碼序列或表現的改變來提供雌蕊發育之抑制,以生產各種突變。在第一實施例中,雌性抑制體靶向基因之干擾包括預防其轉錄。這可以藉由下列方式來達成,例如:RNA寡核苷酸、DNA寡核苷酸或RNAi分子導向對抗靶向基因啟動子(promoter)。
上述基因表現之抑制較佳為藉由提供具有能夠表現抑制化合物的構築物之植物來完成。基因表現之抑制係指從雌性抑制體靶向基因之蛋白質及/或mRNA產物之程度中不存在(或可觀察的降低)。抑制的專一性係指抑制雌性抑制體靶向基因的能力,而在細胞的其它基因上沒有明顯的影響。抑制的結果可以藉由檢查細胞或生物體的外表特性(在本發明具體的案例中為有性表現型)或藉由生化技術來確認,例如:RNA液相雜交、核酸酶保護、Northern雜交、反轉錄、利用微陣列監控基因表現、抗體結合、酵素連結免疫吸附法(ELISA)、西方墨點法(Western blotting)、放射免疫分析(RIA)、其它免疫試驗及螢光活化細胞分析(FACS)。基本上,此時已知抑制的四種方法且納入本案中:反義(antisense)表現、正義(sense)共抑制、RNA-抑制(RNAi)及CRISPR-Cas或CRISPR-Cp介導基因靜默。然而,本發明並非限制於這些方法,且任何造成內生的(endogenous)雌性抑制體基因之靜默的其它方法皆包括在內。
對於反義表現,雌性抑制體基因之核苷酸序列,或至少其19個核苷酸之部分,通常為至少21個或更多核苷酸,較佳為GDS域,擺脫了組成或性器官專一啟動子於反義方向中。在此核苷酸序列之轉錄之後,生產了一mRNA,其互
補於透過內生的雌性抑制體基因之轉錄所形成的mRNA。此時已充分證明此類反義mRNA之生產能夠抑制互補的基因之內生的表現。此外,已證明即使序列少於100%同源性對於達成此效果也是有用的。也可使用短於應被抑制的內生mRNA之反義mRNA。通常,可以接受23或更多核苷酸之mRNA序列,其具有70%或更高的相似度,將能夠產生抑制效果。主要的專利參考文獻為Calgene Inc之EP 240,208。沒有理由懷疑反義技術的可操作性。它在全世界的實驗室中為完善且經常使用的,且其所使用之產物已上市。
第二方法通常稱為正義共抑制(sense co-inhibition)。當雌性抑制體基因或部分所述基因表現於其正義方向時會發生此現象。雖然最常用的全長基因之此種表現常常造成基因的過度表現,已經發此時一些情況中,且特別是當使用短於全長序列的序列之情況中,此基因或片段之表現造成內生基因的抑制。主要的專利參考文獻於正義共抑制為以DNA植物技術的名義之IncEP 465,572。
Bird及Ray(Gen.Eng.Reviews 9:207-221,1991)重新探討了正義及反義基因調控。因此,基因靜默可以藉由插入靶向生物體之基因組以獲得,靶向雌性抑制體基因之額外複製之編碼序列可包括全部或部分或被截斷的序列,且可為正義或反義之方向。此外,可從基因組序列獲得的內含子序列可用於抑制載體之建構。也有一些關於基因靜默之報告,其在轉基因及內生基因兩者之中達成,其中只有序列相似度在啟動子區域之中。
第三個靜默基因的可能方法為藉由使用所謂的RNAi技術,其包含所有應用,其中使用雙股RNA以達成內生基因之靜默。如Fire et al.關於dsRNA之應用(Nature,391:806-811,1998)所證明,其中一股至少部分互補於內生產生的mRNA,無論是生產的細胞內或額外的細胞外都非常能夠抑制mRNA轉譯成蛋白質。人們認為此現象係透過短鏈dsRNA(具有23個核苷酸長度)之中間體生產而起作用。為了達成dsRNA之生產,製作了藏有正義及反義核苷酸序列兩者(同時也被稱為反向重複)的構築物,至少19個,通常為23或更多的核苷酸,其中之一互補於需要被靜默的內生基因。正義及反義核苷酸序列可以透過任何長度之間格核苷酸序列來連接,其允許形成的RNA之摺疊,使得雙股RNA藉由正義及反義序列以形成。間格接著用以形成連接正義及反義序列兩者的髮夾環圈。正義及反義序列的順序不重要。亦有可能在一個及相同的構築物中結合多於一個正義-反義結合。若簡單形式描述為:prom-S-spac-AS-term,則也可以應用下列構築物:prom-S1-spac-AS1-spac-S2-spac-AS2-term,or prom-S2-spac-S1-spac-AS1-spac-AS2-term。只要所述構築物之轉錄的最終產物產生一或更多dsRNAs,構築物的建立中變異是有可能的。另外,雙股結構可藉由兩個分離的構築物來形成,其編碼為互補的RNA股,其中雙股RNA形成發生在細胞中。總之,這些構築物看起來像:prom1-S1-term1及prom2-AS1-term2。Prom1及prom2可為相同或不同,但兩者都應為持續型或果實專一啟動子,,term1及term2可為相同或
不同。可以使用同的載體將兩者構築物引進細胞中,但也可使用兩種不同的載體。
與靶向雌性抑制體基因之蛋白質相同之含有RNA的核苷酸序列較佳為抑制。相對於靶向序列之具有插入、缺失及單點突變的RNA序列也被發現具有抑制的效果。因此,可使用具有少於100%序列相似度的序列。序列相似度可藉由本領域習知之序列比較及比對算法來計算(見Gribskov及Devereux,Sequence Analysis引子,Stockton Press,1991及在此引用之參考文獻),例如藉由使用Smith-Waterman algorithm如實施於使用內定參數之BESTFIT軟體程式(例如University of Wisconsin Computing Group)。因此,RNA雙股區域可功能性地定義為(雙股)核苷酸序列,其能夠與靶向基因轉錄本進行雜交(例如:400mM NaCl,40mM PIPES pH 6.4,1mM EDTA,50℃至65℃下進行雜交12-16小時;接著進行清洗)。相同的核苷酸序列之長度應為至少23個核苷酸,但較佳為更大:40、50、100、200、300或400個鹼基。
如本文所揭示,抑制構築物及靶向內生基因之間的100%序列相似度並不需要於本發明中實行。本發明具有能夠容忍序列變異之優點,其可能因遺傳突變、品系多型性(多態性)或趨異演化(evolutionary divergence)而被預期。
因此本發明亦包括在性器官專一啟動子的控制下具有核苷酸序列的構築物,其中所述核苷酸序列包括SEQ ID NO:1之序列或與其具有大於70%,較佳為大於80%,大於90%,大於95%或大於98%的序列相似度之部分19或更多核
苷酸於正義方向,或於反義方向或於反向重複形式。
根據本發明之方法所使用之重組DNA構築物可使用本領域之技藝人士所習知之重組DNA技術來建構。重組基因構築物可被插入載體中,該載體可為市售、適合轉化至植物且適合在轉化細胞中表現基因產物。較佳為使用二元載體,其對於使用農桿菌來進行植物轉化為有效的。
另外,藉由作用在靶向基因啟動子上的負性轉錄因子(negatively acting transcription factor)之表現來預防轉錄。該負性轉錄因子可為天然或人造的。可以藉由耦合至一般轉錄抑制體之基因工程的多指鋅指(polydactyl zinc-finger)轉錄因子之過度表現來採用人造的負性轉錄因子。根據另一實施例,靶向基因之干擾包括去穩定化靶向基因mRNA,特別是藉由互補於靶向基因mRNA之核酸分子,其選自含有反義RNA、RNAi分子之群組。Virus Induced Gene Silencing(VIGS)、共同抑制體分子、RNA寡核苷酸或DNA寡核苷酸。在另一實施例中,靶向基因之干擾包括抑制靶向基因表現之產物。這可以藉由一或更多顯性負核酸構築物的表現產物來達成,過度表現一或更多與靶向基因產物反應之抑制體,或藉由一或更多化合物來達成。一種在(真核生物)基因之轉錄中引進定點改變(site-specific alteration)的新方法係藉由最近描述於CRISPR-Cas遺傳基因工程、同源重組系統中之變異(Cong L et al.Science 2013;339:819-823;Mali P et al.Science 2013;339:823-826;Cho SW et al.Nat Biotechnol 2013;31:230-232;Jinek M et al.Elife 2013;2:e00471)。此變異需要
使用在核酸內切酶活性中有缺陷之Cas酶,但當與gRNA共同表現時,其保留專一地干擾轉錄延長、RNA聚合酶結合或轉錄因子結合的能力。此系統亦稱為CRISPRi.(Qi LS et al.Cell 2013;152:1173-1183;Larson,MH et al 2013,Nature Protocols 8:2180-2196;Amelio,I.and Melino G.,2015,Cell Death & Differentiation,22:3-5)。
上述系統皆為作用在表現的系統且未改變基因之根本的遺傳序列。在這方面,當需要抑制表現或當不再需要抑制表現時,這些系統也相對容易地瞬間開啟或關閉。該轉換可以受到有利的影響,例如將一或所有靜默系統的成分之表現控制在特定時間或限制位置的啟動子之條件下。該啟動子可以為僅在植物發育的特定階段期間或在植物特定器官中表現之啟動子。這些實施例為基因的啟動子專一地表現於例如開花期間或於植物生殖器官中。在另一實施例中,可使用可誘導的啟動子。用於導入可誘導的表現於植物中之系統為習知的(例如Borghi L 2010,Methods Mol Biol. 655:65-75)。在這些系統中另外的外生因素,例如諸如乙醇或地塞米松(dexamethasone)的化合物,可觸發表現的啟動或干擾。
接下來為基因表現之變化,基因本身可能改變使得功能性蛋白質不再表現。這可藉由突變基因來達成。可以藉由一或更多化合物及/或物理方法及/或藉由插入遺傳元素以隨機地導入一或多個突變。合適的化合物為乙基甲磺酸酯,亞硝甲脲(nitrosomethylurea),羥胺,原黃素,N-甲基-N-亞硝基胍,N-乙基-N-亞硝基脲,N-甲基-N-硝基“亞硝基胍,硫酸二乙
酯,乙烯亞胺,疊氮化鈉,福爾馬林,氨基甲酸酯,苯酚及環氧乙烷。可以使用之物理方法包括UV輻射、快中子暴露X射線及伽馬射線輻射。遺傳物質為跳躍子(ransposon)、T-DNA或反轉錄病毒元素。
對所謂的定點突發誘變技術提供更有效及更有針對性的技術。關於定點突發誘變(SDM)的許多系統為此技藝人士所習知,最為人所知即為基於核酸酶的SDM系統,例如鋅指核酸酶、轉錄激活樣效應因子核酸酶(TALENs)及LAGLIDADG歸巢內切酶基因((Curtin,S.J.et al.,2012,The植物Genome 5:42-50)。另一個SDM技術係基於與靶向基因的同源重組。歷史最悠久的是已被廣泛描述的Cre-Lox系統。不久之前模型已被Bundock et al.(WO02/052026)及Prokopishyn et al.(WO03/062425)提出。最近,上述所討論之CRISPR-Cas,基於植物中之同源重組,已被證實對SDM非常有效(WO2014/144155)。
如前方介紹所述,本領域之育種者(特別是雌雄異株植物,更特別是蘆筍)也會對賦予植物雄蕊發育的能力感興趣。賦予雌性植物雄蕊發育的能力以本質上改變性別,將允許在缺乏雜交授粉之下(故藉由自花受精),從原本的雌性植物中獲得種子的雌性植物獲得種子,且將藉由該植物之體外雄核生殖以提供獲得雙單倍體的能力。可以藉由調控生產顯性雄性刺激子的基因表現來誘導雄蕊發育或雌蕊發育之抑制。
此顯性雄性刺激子(也稱為雄蕊發育之刺激子或花藥發育之刺激子)係由相同於或同源於或異種同源於
TDF1(營養層發育及功能1缺陷)基因的基因所編碼之蛋白質,其被發現於阿拉伯芥AT3G28470及水稻(osTDF1,LOC_Os03g18480)之中。較佳地,具有此功能的蛋白質由如SEQ ID NO:5所描述之蘆筍的TDF1異種同源物所編碼。
本核酸序列之功能性同源物在此定義為與編碼為描述於SEQ ID NO:5胺基酸序列的序列具有高度序列相似度之核酸序列,且較佳為與編碼為描述於SEQ ID NO:4之核苷酸序列具有高度序列相似度,當表現於不帶有花藥的雌雄異株植物時,其應能夠誘導花藥形成。
從這些序列與阿拉伯芥及水稻之序列比較中,似乎蛋白質所謂的R2及R3域為提供本發明所需之功能性的域。因此,本發明包括任何包含TDF1基因之R2及R3域的蛋白質序列及/或任何編碼為此類蛋白質序列的核苷酸序列,當表現於雌雄異株植物中時其序列將具有功能性。特別佳為包括SEQ ID NO:5所描述之蘆筍TDF1基因的R2及R3域之序列,其位於蛋白質的第一125胺基酸序列。較佳為從約aa 14-aa 57(R2)及從約aa 70至約aa 112(R3)找到所述R2及R3域。
上述已討論使用這些核苷酸及/或胺基酸序列於雌雄異株植物,較佳為蘆筍之育種的方法。
本發明又一實施例為偵測植物是否具有從處理中所預期之性能的方法。若該處理包括降低顯性雌蕊發育抑制基因之表現,應調查植物是否變得(更)雌性化。這可藉由評估表現型來完成,即等植物成熟並確認是否出現雌性化作用的表現型特性。然而,更快且更可靠的方法為使用GDS標記輔助選
擇。假如GDS標記輔助選擇已確定可造成GDS基因之功能喪失之突變,所述突變之導入可藉由更遠世代中的GDS標記輔助選擇來引導或藉由分子生物來確認,例如使用足夠基因連鎖至GDS基因中突變的標記,較佳為GDS基因之遺傳距離小於50cM,更佳為少於40cM,更佳為少於30cM,更佳為少於20cM,更佳為少於10cM,更佳為少於5cM,更佳為少於2cM,更佳為少於1cM至M-基因座以允許間接的。如實施例中將建立,一或二個標記的存在可分發,諸如AO022、Asp1-T7、Asp2-Sp6、Asp4-Sp6、T35R54-1600seq、Asp80、Asp432/448、Asp446、10A3_forward標記及10B6_forward標記或CE64/CE66-HRM,,其基因型存在故其表現型將由它所造成。接下來為使用於本發明之實驗部分的標記,也有可能使用SEQ NO:1或SEQ NO:3之遺傳形成以得到任何標記或發展基於分子的方法以決定植物之遺傳補償。再者,可替換地,標記可源自源M-基因座_支架4序列或第13圖所示之支架905。
一般來說,根據本發明之挑選及雜交植物的方法,至少於一挑選步驟中,使用一標記來協助挑選。本領域已知用於指示特定性狀或條件的標記可被發現於體內及體外於不同的生物級別。例如,可於胜肽級別或於基因級別找到標記。於基因級別,可以在RNA級別或DNA級別偵測到標記。較佳地,本案中藉由上述之標記,可在DNA級別偵測到此類標記的存在。另外,可藉由專一結合蛋白質的抗體來實行免疫測定,以評估植物部分中GDS基因表現之改變。如下文表3所述之引子也可使用於放大GDS基因,其存在可藉由與此基
因之序列結合的探針來測試,例如源自於SEQ ID NO:1之序列。再者,亦可使用於編碼序列附近找到的專一標記,諸如已使用於本發明之實驗部分的標記。在轉基因方法的情況下,可藉由使用下方所討論之可選擇的標記或報導基因來完成轉化的植物之挑選。
在一些情況下,透過短暫的表現來實行本發明之方法為可能為適當的。短暫的基因表現為快速、易適應且可再現的方法以高度表現有用的蛋白質,例如透過農桿菌來達成。在植物中,可使用根癌農桿菌(Agrobacterium tumefaciens)之重組菌株於基因的短暫表現,該基因已被插入細菌Ti質體之T-DNA區域。細菌培養滲透到葉子中,一旦T-DNA轉移,則有感興趣的基因之異位表現於植物細胞中。然而,由於異位RNA表此時2-3天後停止,故系統之效用受到限制。結果顯示後轉錄基因靜默(PTGS)為缺乏效率的主要原因。根據基因靜默之病毒編碼抑制體的共表現之系統,番茄叢矮病毒(TBSV)之p19蛋白質預防了PTGS的發生於滲透組織中,並允許高度的短暫表現。蛋白質的表現範圍在存在p19下增進50倍或更多,使得蛋白質純化只需100mg的滲透葉材料即可達成。顯然地,p18的使用具有優點,但沒有p19的農桿菌也可使用於測試候選片段及功能性同源物的功能性,例如,使用於RNAi構築物及/或CRISPR-Cas構築物的片段及功能性同源物。
於本發明之特定實施例中,較佳為修復雌蕊發育之顯性抑制體的表現之干擾或降低。該方法可由已顯示於Plants(Jiang et al.,2013)之CRISPR-CAS提供,其中證明了干
擾GFP蛋白質可藉由CRISPR-Cas來修復。
再者,本發明包括增進雌雄異株植物育種的方法,包括提供一植物,其中顯性雄性刺激子的功能性表現受到修復,並引進所述植物於近交、回交育種、反覆回交育種或雙單倍體育種技術。功能性表現之修復可藉由與顯性雄性刺激子的功能性複製互補來完成。
在一替代的實施例中,本發明包括雌雄異株植物之自花受精的方法,其中親本植物之一或兩者為依植物,其中顯性雄性刺激子的功能性表現與所述顯性雄性刺激子的功能性複製互補。當雌性植物提供有雄性顯性刺激子的功能性複製時,所述植物將變得更加雄性化,故將生產花藥,且因此這些植物可被視為雌雄同體。如上所述,此類雌雄同體植物可以多種方式來使用於本發明之方法中。
由於提供有功能性顯性雄性刺激子的植物生產花藥,本發明亦涉及一種體外雄核生殖的方法,包括提供具有能夠生產該功能性蛋白質的基因之植物。為了生產該植物,可以使用提供具有編碼為蛋白質之核酸構築物或蛋白質本身之植物或植物細胞的所有方法。該方法已於上方簡單描述且對本領域之技藝人士為習知。有多種方式可以將(重組)核酸轉移至植物細胞,例如農桿菌介導轉化。然而,當人們希望實行本發明時,除了藉由農桿菌感染之外,有其他的方法有效地將DNA傳遞至接收植物細胞。將DNA傳遞至植物細胞之合適方法被認為包括可將DNA導入細胞之幾乎任何方法,例如藉由DNA之直接傳遞,例如藉由原生質體之PEG介導轉化,藉由乾燥/
抑制介導的DNA攝入(Potrykus et al.,Mol.Gen.Genet.,199:183-188,1985)、藉由電穿孔(U.S.Pat.No.5,384,253)、藉由碳化矽纖維攪拌(Kaeppler et al.,1990;U.S.Pat.No.5,302,523;and U.S.Pat.No.5,464,765)及藉由DNA包覆粒子的加速度(U.S.Pat.No.5,550,318;U.S.Pat.No.5,538,877;and U.S.Pat.No.5,538,880)。透過本發明之諸如這些的技術,幾乎任何植物物種的細胞可穩定地轉化,且這些細胞可進一步發育成轉基因植物。
假如使用農桿菌介導轉移,較佳為使用毒性顯著的農桿菌宿主細胞,例如根癌農桿菌,例如藉由菌株A281或源自於它的菌株或本領域可得之另一毒性菌株。這些農桿菌菌株帶有DNA區域,其源自於含有virB、virC及virG基因的Ti質體pTiBo542之毒性區。根癌農桿菌的毒性(vir)區產物協調T-DNA處理與其至植物細胞之轉移。Vir基因表現藉由virA及virG來控制,其中virA在誘導信號的感受下,藉由磷酸化來活化virG。接著,VirG誘導virB,C,D,E之表現。編碼為蛋白質的這些基因涉及DNA之轉移。pTiBo542之增進的毒性被視為由Ti植體上的高毒性virG基因所造成(Chen et al.Mol.Gen.Genet 230:302-309,1991)。
在核酸轉移至植物或植物細胞之後,必須確定哪個植物或植物細胞已提供所述核酸。這可使用分子測定技術來完成,例如已分子標記或基於PCR之技術的序列比對,但也可藉由使用可選擇的標記或報導基因來完成。在所選的標記或選擇之中,最廣泛用於植物轉化的基因為細菌黴素磷酸轉移酶
基因(nptI,nptII及nptIII基因),在EP131623中提出其對選擇性試劑卡那黴素kanamycin具有抗藥性,且EP186425指出細菌aphIV基因對潮黴素hygromycin具有抗藥性。EP 275957揭示了來自Streptomyces viridochromogenes的乙醯轉移酶基因,其對膦除草劑(herbicide phosphinotricin)具有抗藥性。EP218571指出植物基因對草甘膦除草劑(herbicide glyphosate)具有相對的抗藥性。抗藥性是基於編碼為5-烯醇莽草酸-3-磷酸合成酶(EPSPS)的基因表現,其相對地耐受於N-磷酸甲基甘氨酸。特定胺基酸,諸如賴氨酸、蘇氨酸或賴氨酸衍生物氨基乙基半胱氨酸(AEC)及色氨酸類似物像5-甲基色氨酸也可用於選擇性試劑,這是由於當施用於高濃度時,它們具有抑制細胞生長的能力。在選擇系統中,可挑選的標記基因之表現由轉機因細胞造成胺基酸的生產過剩,該轉基因細胞允許轉基因在選擇下成長。報導基因之合適的實施例為β-葡糖醛酸酶(GUS)、β-半乳糖苷酶、熒光素酶和綠色熒光蛋白(GFP)。然而,較佳為使用無標記方法,例如揭示於WO 03/010319,其中抗藥基因的存在可以由基於核苷酸序列之方法來測定。
接下來為導入(基因編碼為)顯性雄性刺激子的方法,此蛋白質的表現也可由上述方法來抑制。基因之抑制或基因之干擾可使用上述技術來完成以抑制雌蕊發育之顯性抑制體。如上所討論,顯性雄性抑制體的抑制,除了去活化雌性抑制體之外,應提供源自於雄性或雄性雌雄同體植物的雌性植物,其包括在期望的雌性化植物之實施例中。此外,顯性雄性刺激子之抑制於雜交中可能為有用的,其中需要去雄
(emasculation)以提供去雄的替代方法。
下文非限制性的實施例進一步地描述本發明
雌雄同體突變5375之遺傳分析
下述異型接合雄性(XY)之花藥培養,Riccardi et al.(2010)所獲得的雄性(YY)、雌性(XX)及“5375”基因型,完全地雌雄同體殖株之罕見的實施例。所有的花朵為雌雄同體之此基因型不同於雄性雌雄同體基因型,其具有不同比例的雄性與雌雄同體花朵。完全地雌雄同體殖株作為成熟的植物顯示了從其所有花朵生產漿果的能力,相較於曾經由CRA-ORL,Lodi,Italy之研究所評估的所有雄性種畜之著果,其在連續三季蓬勃生長期間展現了前所未有的高度著果。提供用來獲得雌雄同體5375之來源材料的雜交植物為無法生產漿果的雄性植物,且由於用於育種之花藥培養的來源植物較佳為顯示非常限制的漿果著果(berry set),故一旦漿果在某些季節被忽略其將只有少數。
在園藝蘆筍中,在兩個連鎖基因(A、F)的兩個顯性等位基因分別假設為控制雄蕊發育及抑制雌蕊發育(Bracale et al.,1990,Sex Plant Reprod.3:23-30;Bracale et al.,1991,Plant Sci 80:67-77)。
在Riccardi et al.(2010)引用之模型中,雌性具有‘aaff’基因型、異型接合雄性具有‘AaFf’基因型及超雄性具有‘AAFF’基因型。Riccardi et al(2010)推測“5375”之M基因座之中的重組事件生產了雙單倍體及具有AAff基因型的完全雌雄
同體植物。為了測試這個假說,計畫了一些雜交種,其為關於開花的表現型(分類為雌性、雄性或雌雄同體其中之一),並分析性連鎖標記。藉由使用高度變化的單一基因座微衛星標記,後來被證實特定的雌雄同體‘5375’並非雙單倍體而事實上為高度異型接合。有人提出假設為雌雄同體‘5375’代表雜交種的軀體選殖,其捐贈了用於組織培養的花藥,而非源自於花粉配子的雙單倍體,其中罕見的重組發生。結果,基因型‘Aaff’被視為更合適。在此模型下,此基因型保留了其對於在一般雄性中所觀察到之顯性雄蕊發育基因‘Aa’的異型接合性,且其更帶有顯性雌蕊發育抑制基因的兩個隱性等位基因‘ff’,這是因為功能突變喪失干擾雌蕊發育抑制體基因,其原本存在於捐獻了特定花藥的異型接合雄性。於一方案中:AaFf(突變)→Aaff。
為了測試具有性染色體或‘M-基因座’的雌雄同體性狀之共分離,使用性連鎖標記。第一標記為專有微衛星標記,其源自於GcnBank accession CV287860之特定的AO022,其具有下列序列:
此標記之前已被測試於育種及群體研究中,且總是定位於遺傳距離,從零改變到來自M基因座的五個厘-M器官。第二標記為Jamsari et al(2004)所提出之Asp1-T7,其具有下述序列:
為了找到假想的”Aaff”基因型之證據,進行一些試驗雜交。在第一譜系中,特別指譜系1E,允許雌雄同體5375(Aaff)自花受精。所謂的”S1”或”F2”之結果,譜系1E的後代包
括雌雄同體及雌性兩者而沒有雄性植物。分析此後代的花朵並記錄著果(在沒有昆蟲的條件下)。觀察到的雌雄同體及雌性之數量分別為166及56,其遵循3:1比例,其預期為賦予雌雄同體的單基因顯性基因。所有後代中的雌雄同體在沒有昆蟲的條件下著果。很重要應注意的是,成熟雌雄同體植物的莖之所有花朵皆源自於5375著果,故生產漿果,且所有含有黑色的漿果完全地發育種子。此類發育完好的種子可媲美通常觀察於雌雄同體親本植物5375之雌性植物標記分析,其揭露了161/169基因型之標記AO022,其中161及169係指在毛細管電泳系統中估計的片段尺寸。估計的片段尺寸有可能根據每個毛細管系統而異,但此技藝人士可以明確的區分彼此。再者,雌雄同體5375顯示PCR標記Asp1-T7之存在。看來觀察到的雌雄同體性狀與AO022微衛星標記基因座係緊密相連的。166個雌雄同體植物中有163個發現AO022-169等位基因,然而58個雌性植物中有53個缺乏此等位基因。測試此族群之所有植物的Asp1-T7雄性標記。所有166個雌雄同體之測試皆具有Asp1-T7雄性標記等位基因,然而所有65個雌性之測試皆缺乏Asp1-T7雄性標記等位基因。譜系1E植物子集的結果總結於表1a。
表1a譜系1E。從花朵表現型獲得的結果及後代之標記隔離,其係由具有對於標記AO022之161/169基因型的雌雄同體5375之自花受精所造成,並在作為模板DNA時顯示Asp1-T7雄性診斷的片段。
人們可以得出此結論,除了少數例外,微衛星標記必須由重組事件所造成,缺乏AO022-169等位基因(161/161基因型)及缺乏顯性Asp1-T7雄性標記等位基因也缺乏花藥故為雌性。因此,可以推測雌蕊抑制體已失去雌雄同體5375(其接著允許柱頭發育及著果),然而生產花藥的能力已保留於異型接合的條件下,其在此雜交中分離並連鎖於提供的遺傳標記。在第二代中,由具有26個F2植物之自花受精所獲得的26個F3家族進一步地顯現表現型,該26個F2植物具有表示為Aaff基因型的標記AO022之161/169基因型。那些家族後代在每個家族的4到89個體之間規模不等。在所有這些F3家族中,除了其中3株之外,可觀察到雌雄同體及雌性的再次分離之總數分別為589對193。預期賦予雌雄同體的顯性基因再次為3:1之比例,其中雌蕊發育的顯性基因在雌蕊發育抑制體一定不存在的遺傳背景中分離。在其它三個(161/169-F2植物來源)F3家族包括80、12或11個體中,只有發現雌雄同體,故沒有雌性。這可能是對於此特定的植物,儘管此特定自花受精植物之161/169基因型具有AAff基因型,重組事件發生於微衛星標記與性別鑑定基因之間。最大的家族中,10個植
物用來測試Asp1-T7片段的存在,且的確這些植物皆沒有缺乏雄性Asp1-T7等位基因。另外14個F3家族,後代規模介於8至88之間不等,其源自於具有表示為AAff基因型的標記AO022之169/169基因型的自花受精F2植物,生產總計為324個雌雄同體姊妹種且沒有雌性植物。譜系1E F3雜交之結果顯示於表2中。
表2:表中顯示AO022微衛星等位基因及Asp-1_T7標記結果,且F2家族之植物表現型加上花朵(及自發的漿果著果)表現型之分離,作為雌性(F)及/或雌雄同體(H)於獲得那些個體F2植物的F3家族中。”M”代表標記,AspT7-106係指診斷為雄性專一區域之PCR片段之存在。
在第二譜系中,特別指譜系2E,將雌性雙單倍體”5459”雜交至雌雄同體‘5375’。在之前所提出的遺傳模型中為:5495×5375=aaff×Aaff。對於微衛星標記AO022,植物5495及5375分別顯示166/166及161/169基因型。此試驗雜交2E的後代顯示64個雌雄同體及83個雌性植物而沒有雄性植物。這與1:1分離比例並沒有明顯地不同,其與花藥發育的分離式顯性基因是一致的。再者,此族群顯示完全沒有雌蕊發育抑制,其在此後代中沒有分離,這說明了或至少並不反對5375對於雌蕊抑制基因之功能喪失為有效地同型接合。表現型分類及標記之分離顯示於表1b。標記結果顯示,如同在雜交
1E中已觀察到,AO022-169等位基因與雌雄同體花朵性狀係緊密相連地。64個雌雄同體中有60個存在AO022-169等位基因,然而在83個雌性植物中有82個缺乏此等位基因。測試Asp1 T7的植物子集(11個雌雄同體及10個雌性)顯示雄性等位基因與雌雄同體性狀之完全連鎖。
表1b譜系2E。雜交後代中花朵表現型及標記隔離所獲得之結果:分別具有AO022基因型166/166及161/169之雌性5459x雌雄同體5375,其中只有5375顯示不存在於雌性親本中之診斷雄性Asp1-T7片段。
在第三譜系中,特別指3E譜系,將雌雄同體植物‘5375’雄性化並與雙單倍體超雄性‘1770’進行雜交。在此雜交中,獲得12個F1植物。所有12個植物中之2個預期為不同的基因型‘AaFf’及‘AAFf’為雄性,故無法生產果實及種子。這指出抑制雌蕊發育之雄性性狀對於雌雄同體性狀為顯性。因此證實了雌雄同體性狀(即具有功能性花藥以生產雄蕊及具有種子的果實之植物的能力)為隱性。從以下之標記分析證明了小量植物的確包括基因型‘AaFf’及‘AAFf’兩者,故‘Af’配子’(通常為雌雄同體)且不只是‘af’配子(其可從一般的雌性及異型接
合雄性中獲得)的確促成了此後代的世代。雙單倍體1770具有對於標記AO022之166/166標記基因型。表現型結果及微衛星標記結果顯示於表1c中。7個F1植物顯示了AO022微衛星標記161/166基因型。由於微衛星AO022等位基因‘161’與雌性表現型(於譜系1E及2E中確認)之間的遺傳連鎖,那些植物或絕大多數的那些植物必定是由具有雌性染色體基因型‘af’的雌雄同體5375之母系配子及雙單倍體超雄性1770‘AF’之父系配子所造成。結果,那些植物可能具有‘AaFf’基因型。剩下的5個植物具有AO022微衛星標記基因型169/166,且由於微衛星AO022等位基因‘169’與雌雄同體表現型之間的連鎖,那些植物或絕大多數的那些植物必定是由帶有造成雌雄同體性狀於等位基因”Af”中的雄性染色體之雌雄同體5375的母系配子及雙單倍體超雄性1770之父系‘AF’配子所造成。結果,那些植物可能具有‘AAFf’基因型。因此,證實了雌雄同體性狀(即具有功能性花藥以生產雄蕊及具有種子的果實之植物的能力)為隱性。這些植物用來測試標記Asp1-T7且所有植物顯示了此雄性專一標記的雄性等位基因。
表1c譜系3E。對於F1雜交5375 x(5375 x 1770)花朵表現型及標記隔離所獲得之結果,其中使用具有基因型169/166的F1植物來對雄性化的5375進行授粉:
表1d譜系3E。偽試驗雜交1800x所選的F1(5375 x 1770)之花朵表現型及標記隔離所獲得之結果,其標記相應於1800(166/166)x所選的F1(169/166):
表1e譜系3E。偽試驗雜交1800x所選的F1(5375 x 1770)之花朵表現型及標記隔離所獲得之結果,其標記相應於1800(HRM曲線‘T缺失’)x所選的F1(HRM溶解曲線WT):
在譜系3E的下一代中,進行偽試驗雜交。挑選源自於5375 x 1770雜交單一雄性植物為其AO022標記基因型169/166,由於標記及性別鑑定基因之間的連鎖,幾乎可確定將具有基因型AAFf。將所選的植物雜交至對於標記AO022具有166/166基因型的雙單倍體雌性植物‘1800’。以公式表示:1800×selected F1(5375 x 1770)=166/166×169/166=aaff x AAFf。此家族分離了121個雄性對比118個雌雄同體,其與顯性雌蕊發育抑制體Ff對比ff之分離所預期的1:1比例是一致的。亦與遺傳模型為一致的,其預測所有姊妹種將與雄蕊發育基因異型接合‘Aa’故其皆具有花藥。對於此偽試驗雜交之24
株植物的子集,對AO022微衛星基因型進行鑑定。結果顯示於表1d。12個雌雄同體中有11個具有166/169基因型,166等位基因與雌蕊發育抑制基因之間的可能重組具有166/166基因型。所有12株雄性植物具有166/166基因型。這證實了AO022微衛星父系標記等位基因‘166’(源自於雄性祖父1770)與雌蕊發育抑制之間的連鎖。更進一步指出由於沒有連鎖至雌雄同體祖父的AO022169父系等位基因之雌蕊發育抑制等位基因,故允許雌蕊發育。
上述所有雜交教示了觀察到的分離與雌雄同體殖株5375的‘Aaff’基因型為一致的,如同一般的雄性,其對雄蕊發育基因為異型接合但缺乏雌蕊發育抑制基因之功能性等位基因。隱性地遺傳雌雄同體連鎖至蘆筍的性染色體且在此提出之遺傳分析提供一種方法,其中可以測試或驗證性染色體上的性狀與標記之間的遺傳連鎖。明顯地,此技藝人士也可以使用其他標記來測試雌雄同體性狀對性染色體的連鎖。
雜交的結果更教示了雌雄同體能夠自花受精並在更遠世代中提供後代,其造成近交。可以從AO022基因型的分析來推斷此實施例的近交。舉例來說,對於譜系1E,在AO022基因座的異型接合減少了50%。對於任何遺傳學家或育種者可以理解此種近交可以減少在任何其他基因座的異型接合性。再者,此技藝人士將清楚地了解,相較於全同胞交配(full-sib mating),在此提出之藉由自花受精之近交能更有效地發生。在全同胞交配中,如同隨後的姊妹種及兄弟種之雜交,相較於自花受精,其需要三倍多的世代以達成於異型接合性中相似的減
少(Bos,1985.Thevenin,1967;p108)。可以進一步理解,人們可以藉由針對雄蕊發育基因挑選(例如藉由使用連鎖標記)來輕鬆地擺脫特定近交世代中的雌雄同體性狀,以最終地獲得近交雌性植物,假如不再需要其將不會傳送雌雄同體性狀至下一代(例如商業的F1雜交)。因此,提供一種藉由自花受精來獲得近交系的方法,其並非取決於賦予自花受精能力的體染色體修飾基因(對於那些修飾基因請見Franken,1969,1970)。取而代之地,本發明之近交依賴於對允許雌蕊發育的隱性等位基因之挑選,其連鎖至允許雄蕊發育的顯性基因‘Af’,接著,對兩個連鎖基因的等位基因結合‘Af’進行選擇以獲得共同的雌性近交系。
由於有雌雄同體性狀與標記Asp1-T7的共分離,其表示為一個染色體區段特有的雄性植物,之前由Riccardi et al(2010)所提出之理論遭到拒絕,該理論為重組事件將位於雄性專一染色體區段上的雌蕊抑制”取代”為天生缺乏雌蕊抑制的雌性染色體區段。取而代之地,人們推測突變發生在雄性染色體區段上的雌蕊抑制,其仍然存在於雌雄同體植物中且尚未透過重組而失去。此突變可以傳遞給下一代並顯示Mendelian單一基因座分離。因此,其努力的目標在於找到發生突變的基因。
Dr.James H Leebens-Mack(University of Georgia at Athens,USA)的實驗室與北京基因組機構Shenzhen,China(BGI)合作,致力於研究雙單倍體超雄性DH00/086(version 1.0)之基因組序列草圖。
對此,分離出從矛或蕨類植物組織分離的基因組DNA(gDNA)並合併至Illumina HiSeq序列。簡單來說,合併的gDNA係藉由堅硬片段及gDNA之末端修復、轉接接合、尺寸篩選、PCR放大、基因庫純化及品質控制(Quality Control),為散彈槍基因庫(shotgun library)製備作準備。使用總共9個短插入配對末端庫(short-insert對ed-end libraries)及6個長插入配對末端庫(Mate對)被用於下代定序(Next Generation Sequencing;NGS);準備21個流動通道,且基因庫定序於Hiseq2500 2x100nt末端配對模式之中。根據Illumina管道1.8中之品質分數收集並過濾數據。總共163個Gigabase的序列傳給品質標準,其相應於蘆筍的單倍體基因組之大約123X覆蓋。從頭測序(De Novo)組合進行於具有多重k-mer策略(Luo et al.,2012,Peng et al,2012)的SOAPdenov2管道之中。如同SOAPdenovo,SOAPdenovo2由6個處理讀取錯誤校正的模組、de Bruijn圖(DBG)結構、重疊群組裝、末端配對讀取定位、支架結構及空缺區域補齊(gap closure)所組成。從頭測序(de novo)組合有具有前綴(prefix)ScafSeq-的24,113個支架,其中的115個為由基因組序列之比對所組成的偽支架,其最有可能定位至M-基因座及周圍的區域。偽支架具有前綴M-基因座_支架。用於比對的基因組序列包括細菌人工染色體(Bacterial Artificial Chromosome;BAC)重疊群序列,其源自於從基因型DH00/086(超雄性)及DH00/94(雌性)之高分子量基因組DNA所構成的兩個BAC-基因庫(Leebens-Mack,JH,personal communication 2010)。基因庫以連接至M-基因座表現型的分
子標記基因篩選,且接著使用基因組分析IIx系統之Illumina TruSeq原子簇化學對候選殖株之BAC DNA進行定序。一個從頭測序(De Novo)組合之有用的統計,諸如蘆筍的24,113個含有支架的組合為N50值。簡單來說,重疊群或支架N50為中位數統計,使得整個組件的50%被包含在重疊群中,或支架等於或大於此數值。蘆筍之數據組合的結果呈現了21,179之重疊群N50及301,040之支架N50,代表其單倍體基因組的80%。支架的共通(consensus)序列被用於註解之目的,例如假定的重複元素及重頭起算(ab initio)基因預測,並在cDNA讀取定位實驗兩者中擔任參考基因組,稱之為一些蘆筍基因型的RNA-Seq實驗及基因組重新定序實驗。所使用的參考基因組稱為天門冬屬基因組支架V1.10(AGS V1.10),註釋元數據被儲存為個別文件於基於AGS V1.10之關係型數據庫中。
許多用於篩選AGS V1.10的方法對於所有已知分類的重複元件及重複元件的新發現預測,包括植物轉座子元件。LTRharvest是一個套裝軟體(software package),計算基因組序列中長末端重複反轉錄轉座子的邊界位置(Ellinghaus et al.,2008)。LTRharvest是在預設情況下使用,並手動設置相似性指數和輸出文件包含FASTA格式和GFF3格式預測。重複瀏覽器(RepeatExplorer)是一個Python指令碼軟體套裝,包含實用於重複序列的特性及轉座元件編碼序列於NGS數據中(Novak et al 2010)。下一步命令行版本重複瀏覽器在基於Galaxy的網頁服務器上可獲取:www.repeatexplorer.org(Novak et al.,2013)。RepeatMasker為一個程式,其對穿插的
重複及低複雜度序列作DNA序列篩選。RepeatMasker(Institute for Systems Biology,Seattle,WA)是一組基於BLAST的程式,其比對輸入查詢序列以策劃重複元件的數據庫,且輸出文件包括掩蔽的查詢序列,其中預測的重複元件的核苷酸被符號N取代。在預設靈敏度下使用RMBlast屏蔽查詢AGS V1.10。屏蔽的輸出文件(rmAGS V1.10)被用於重頭起算基因預測。基本上,程式使用受過訓練的算法集以藉由辨別候選訊號位點來收集證據基因,例如:啟動子、轉譯起始子、終端、剪接供體、剪接分支及剪接受體位點,其由基因證據給出的來源所提出。於預設設定下使用BGI管道(Fgenesh and GlimmerHMM)來實行重頭起算基因預測,造成對基因證據(Elsik,2007)的GLEAN文件合併。組合包括28,288個預測的蛋白質編碼基因,其具有1006bp的平均CDS長度及平均每個預測轉錄子中有4.75個外顯子。此外,具有Viridiplantae設定的SNAP(Semi-HMM-based Nucleic acid Parser,Korf,2004)套裝軟體被用於預測基因模型。SNAP算法預測出共24,116個基因。
實行兩種RNA-Seq實驗。設計第一個實驗以鑑定雌性、雄性及超雄性天門冬屬基因型之差異表現的轉錄子,並接著將這些轉錄子定位至AGSV1.10基因組組合。總共對13個Limgroup蘆筍品系,分別是9雌性(9F),9雄性(9M),88F,88M,88超雄性(88supM),89F,89M,89supM,103F,103M,103supM及雄性DH系DH00/86及DN3389進行處理(Limgroup BV,Horst,The Netherlands)。簡單來說,使用RNeasy Plant Mini
Kit實驗流程(Qiagen GmbH,Hilden Germany)從花苞中分離整個RNA,且RNA品質以Agilent RNA生物分析儀實驗流程(Agilent,Santa Clara,CA)評估。將RNA轉換成雙股cDNA並藉由轉接接合、尺寸篩選、PCR放大、基因庫純化及品質控制為Illumina NGS散彈槍基因庫製備作準備。總共13個短插入配對末端庫被使用於NGS;準備3個流動通道並將基因庫定序於Hiseq2500 2x100nt配對末端模式中。根據Illumina pipeline 1.8中之品質分數收集並過濾數據。總共500百萬讀取傳給品質標準(Quality criteria)。執行從頭測序(De novo t)轉錄組合於Trinity套裝軟體中(Grabher et al.,2013)。Trinity結合三種獨立的軟體模組:尺蠖,蛹及蝴蝶,依序應用於處理大量的RNA-seq讀取。Trinity將序列數據劃分成許多個別的De Bruijn Graphs,各自代表於所給基因或基因座的轉錄複雜度,接著獨立地處理每個圖表以提取全長剪接異構體,並分離源自於種內同源基因的轉錄子。經過配對末端之歸一化讀取之後,276,556序列以378Mb及2386 N50總長度進行組合。13個配對末端讀取數據設定被定位回從頭測序(De novo)組合,且基因型的數據相較之下需要性別專一表現的單一核苷酸多態性(eSNPs)及短插入/缺失(indels),其係使用套裝軟體vcftools(變型調用格式,Wellcome Trust Sanger Institue,Cambridge,UK)。進行並審核多項嚴格設置。其結論為沒有嚴格的性別專一eSNP或插入/缺失(indels)可被要求進一步的驗證。亦使用RNA-Seq數據以解決基因之差異表現於前述11個LimGroup樣品中,其使用Cufflinks套裝軟體版本Cufflinks 2.2.1(Trapnell et al.,2010)。
Cufflinks組合轉錄子,估計其豐度,並測試RNA-Seq樣本之差異表現及調控。這接受了對齊的RNA-Seq讀取並將比對集合至一套轉錄子中。Cufflinks接著基於多少讀取支持每個轉錄子以估計這些轉錄子的相對豐度。簡單來說,將RNA-Seq數據比對至參考AGS V1.10,其使用預設嚴格設定之TopHat 2.0.13(Kim et al.,2013)。TopHat比對RNA Seq讀取至rmAGS V1.10參考並分析定位結果以鑑定外顯子之間的剪接點。於Cufflinks中使用Cuffdif2演算法(Trapnell et al.,2012)來處理數據以鑑定並量化差異表現的轉錄子。表現之比較顯示了品系之間及一般性別之間的模式。表現模式的集群分析(Cluster analysis)顯示三個集群出現,與88及89基因型相關的集群,及具有9及103基因型表現模式的第三集群。所有基因型中雄性對雌性表現之比較顯示了269基因在雄性樣本中明顯為正調控而有2個負調控。所有基因型中超雄性對雌性表現之比較顯示了434個基因正調控及49個負調控。許多涉及花藥發育的基因被認為是超雄性對雌性之差異表現,包括對異常終止孢子AMS’(ABORTED MICROSPORES AMS’)異種同源的基因及註解為阿拉伯芥擬南芥之雄性不育MS2(MALE STERILITY MS2)。至少40個基因列表顯示雌性樣本中沒有表現。
設計第二RNA-Seq實驗以研究整個基因組基因表現於花苞中,其係從特定發育階段的天門冬屬之不同基因型中所獲得。選擇來作RNASeq分析的基因型及其相關樣本為如下所述:DH雄性1770=樣本1;DH雌性1800=樣本2;Herma 5375=樣本3;譜系1E之5植物AAff Herma=Bulk 1且譜系3E之4
植物AaFf雄性=Bulk 2。從每株植物中,對三個花苞階段進行採樣:A)前減數分裂(對於Herma及雄性為1.0-1.2mm長,對於雌性為0.8-1.0mm);B)單核小孢子(1.6-1.8mm)或剛發育的子房(1.2-1.4mm);C)完全發育的心皮(剛好在萼片打開之前)。簡單來說,使用NucleoSpin RNA植物Kit(Macherey-Nagel GmbH & Co.Düren,Germany)從花苞中分離整個RNA,且RNA品質以Agilent RNA生物分析儀實驗流程(Agilent,Santa Clara,CA)評估。將RNA轉換成雙股cDNA並藉由轉接接合、尺寸篩選、PCR放大、基因庫純化及品質控制(Quality Control)為Illumina NGS散彈槍基因庫製備作準備。總共13個短插入配對末端庫被使用於NGS;準備2個流動通道並將基因庫定序於Hiseq2500 2x100nt配對末端模式中。根據Illumina pipeline 1.7中之品質分數收集並過濾數據。將RNA-Seq數據比對至參考AGS V1.10,其使用靈敏嚴格設定(--b2-very-sensitive)及最大內含子尺寸之TopHat 2.0.13(Kim et al.,2014)。將TopHat註釋數據儲存為詮釋資料至AGS V1.10並加載個別的軌道於整合基因組學瀏覽器(Integrated Genomics Viewer)(IGV,Robinson et al.,2011)。在IGV中,AGS V1.10的基因組支架可分別地進行檢查。
Dr.Leebens-Mack的實驗室亦應用AUGUSTUS基因預測(Hoff et al.,2013)及EVM(Evidence Modeler,Haas et al.,2008)以從多個來源中聚集基因模型預測。AUGUSTUS基因預測涉及兩個連續步驟:對天門冬屬創造訓練集及實際的基因預測。訓練軟體自動地從基因組序列產生基因組,且Trinity
組聚集(assemblies)之後對新物種訓練AUGUSTUS參數。將這些新參數及提供的外部證據應用於基因預測模組中。使用EVM以整合所有可用的gDNA及RNA-Seq數據。軟體將重頭起算基因預測與轉錄子比對結合至加權的共通基因結構。對於天門冬屬,這包括GLEAN,SNAP,Trinity,Cufflinks及AUGUSTUS數據組。最高權重給予了Cufflinks數據及最低權重是給GLEAN數據。總共24k基因模組被註解。將基因預測詮釋資料儲存為個別文件於基於AGS V1.10的相關數據庫中。
重新定序包括讀取之定位或比對至參考資料及錯誤校正。對此,蘆筍基因型DH00/094獲得短插入配對末端Illumina HiSeq定序數據(BGI,Shenzhen,China Shenzhen,China Shenzhen,China)。DH00/094為雌性雙單倍體,其係從DH00/086所起源之相同雜交種的組織培養所獲得。數據包括100nt配對末端讀取代表大約40X基因處覆蓋度。使用具有預設設定之套裝軟體bwa-MEM中之Burrows-Wheeler Aligner(Li and Durban,2009),以及包括於套裝軟體Bowtie2之最近開發的超快短讀對準(Langmead et al.,2012),將DH00/086及DH00/094兩者之讀取比對至參考基因組。DH00/094定位被用於使用套裝軟體vcftools以取得性別專一的SNPs及短插入/缺失(變異調用格式(variant call format),Wellcome Trust Sanger Institue,Cambridge,UK)。進行並審核多項嚴格設置。最初,SNPs被發現於至少3,195個基因模型中。將重新定序詮釋資料儲存為個別文件於基於AGS V1.10的相關數據庫中。所有至AGS V1.10的詮釋資料包括前述的LTR-harvest數據、基因預
測、Trinity RNA-Seq組合、Cufflinks註釋,且將重新定序數據儲存為個別軌道於基因組瀏覽器JBrowse 1.11.4中(Generic Model Organism Database project GMOD,2013)。軌道可以對AGS V1.10之所有基因組支架個別地進行可視化。
已知所有基因組序列可用的遺傳及分子數據相關於蘆筍中的M-基因座被用作查詢序列於局部比對搜尋中(BLAT,BLAST,Althschul et al.,1990)於參考基因組支架AGS V1.10之blast數據庫中。實行搜尋於預設設定中。這些分子列包括公開的遺傳標記緊密相連於M-基因座指定的Asp1-T7,Asp2-Sp6,Asp4-Sp6(Jamsari et al.,2004),T35R54-1600seq(Kanno et al.,2013)及遺傳標記,其係藉由Limgroup指定的Asp80、Asp432/448、Asp446、10A3_forward標記及10B6_forward標記所發展。Asp1-T7(510nt)與位於位置305206-304717的支架905及位於位置5470-5959的相關偽分子M-基因座_支架4(ML4)具有98.37%的相似度。Asp2-Sp6(634nt)與位於位置307405-306883的支架905及位於位置3271-3793的ML4具有98.85%相似度,且與位於位置464878-464359的支架199具有96%的相似度。Asp4-Sp6(443nt)與位於位置224027-224469的支架997具有96.62%相似度,並對更多303基因組支架顯示高度相似度(>80%)。Asp-Sp6之序列註解為LTR-反轉錄轉座子,子類Ty1-copia相關。序列T35R54(1586nt)為天門冬屬基因組中的部分高度重複區域,並對25基因組支架具有100%相似度,其中ML4位
於位置22173-21039。將Asp80比對至支架1194,Asp432/448比對至支架206及Asp446比對至支架1539。10A3_forward標記及10B6_forward標記之序列比對為與支架997及相關的偽分子M-基因座_支架2具有100%相似度。由於三個緊密連鎖的序列比對至支架905及ML4的小區域,這些支架優先作為對象以進行進一步研究。EVM數據顯示15個基因模組於支架905(351847bp)及3個基因模組於ML4(94405bp)中。2個EVM註釋鄰近於標記序列Asp1-T7,Asp2-Sp6及T35R54之位置:evm_1.TU.M-基因座_支架4.1(類型:mRNA,189bp)及EVM_1預測M-基因座_支架4.2(類型:基因2640bp)。
EVM註釋兩者被轉譯並用作查詢於比對軟體BLASTP中,其係使用Genbank CDS轉譯之非冗餘的蛋白質序列加上數據庫PDB、Swissprot、PIR及PRF中的蛋白質序列(ncbi.nlm.org updated 2015.1.5,54183042 sequences)。序列被限制於包括低複雜性過濾器的Viridiplantae[ORGN]。所有其他設定為預設。evm_1.TU.M-基因座_支架4.1之轉譯在數據庫中沒有任何顯著匹配。EVM_1預測M-基因座_支架4.2轉譯對於葡萄(Vitis vinifera)(Hit:CAN82114,Id:147844299)之假定的蛋白質VITISV_031339及葡萄(Vitis vinifera)(Hit:XP_010657662,Id:731377489)之預測的UPF0481蛋白質類AT3G47200兩者具有高度顯著相似度(38.54%)。這兩個項目被用於保留域(conserved domain)中比對於NCBI(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi),且與Pfam03140家族之成員具有高度相似性,未知功能的植物蛋白
質(Domain of Unknown Function,DUF247)。Pfam數據庫為蛋白質家族的大集合,各自代表多個序列比對及隱藏的Markov models(HMMs)。目前的版本為Pfam 27.0(March 2013,14831 families)。家族Pfam03140(PF3140)包括48個成員且屬於DUF247超家族cI03911。構成此超家族的植物蛋白質功能為未知。類DUF247基因序列,其暫時地稱為‘DUF247-like’,被用作Query於參考基因組支架AGS V1.10之數據庫中。接著,支架905及來自兩個不相關支架的偽分子ML4之2個類DUF247序列被送回:區域類DUF247支架3098(1965bp)及區域類DUF247支架10515(1422bp)。以Clustal Omega(Sievers et al.,2011)創造比對於標準的設定中。類DUF247支架10515從CDS2之位置69至1186比對為具有91%相似度,且類DUF支架3098從第二內含子之位置1至位置1970比對為具有92%相似度。比對顯示於第2圖中。類DUF支架3098基因被預測於EVM1及AUGUSTUS註釋中(支架3098支架3098:9541 1..97134(+strand)class=基因length=1724)且被Cufflinks註釋(TCONS_00149163)所支持。上述所討論的支架之序列可以於第13圖中找到。
在阿拉伯芥信息資源(TAIR10)中,使用查詢術語AT3G47200並回傳2基因座配對,具有5個不同基因模型的AT3G47200及AT3G47210。這決定調查所有發現於TAIR蛋白質(蛋白質)序列之BlastP的阿拉伯芥基因模型的關係,其係使用EVM_1預測M-基因座_支架4.2轉譯作為查詢。最高分數AT3G50150.1,未知功能(DUF247)的植物蛋白質,
chr3:18595809-18597551反向長度=509(分數=201bits(511),期望值=8e-52,相似度=133/425(31%),陽性(Positive)=216/425(50%),缺口(Gaps)=34/425(8%))及AT3G50160.1,為之功能的植物蛋白質,chr3:18598826-18600903反向長度=503(197位元(502),期望值(Expect)=8e-51,相似度=132/413(31%),陽性=207/413(50%),缺口=29/413(7%))。應注意的是,AT3G47200.1基因模型顯示較少相似度:(DUF247),chr3:17377658-17379088 REVERSE LENGTH=476(Score=130bits(326),期望值=2e-30,相似度=104/417(24%),陽性=195/417(46%),缺口=52/417(12%))。具有顯著相似度的阿拉伯芥基因列表於表X,欄為AGI碼。類DUF支架3098之種內同源序列的轉譯回傳對於AT3G50150.1之最高分數,未知功能(DUF247)的植物蛋白質比對為181/454胺基酸之較低顯著分數。AT3G50150及ATG3G50160之TAIR描述包括:未知功能(DUF247)的植物蛋白質;涉及:未知生物過程;位於:原生質膜;表現於:幼穗發育、花瓣、下胚軸、根;表現期間:4開花期。
外部連結可取得更多訊息。植物蛋白質組數據庫(PPDB)回傳對於阿拉伯芥的另外4個基因模型及10個基因模型於水稻(Oryza sativa)數據庫中。亞細胞蛋白質組數據庫(SUBA3)覆蓋大規模蛋白質體學及來自阿拉伯芥的細胞區室之GFP定位組。亦包括對於蛋白質亞細胞定位之預編譯的生物信息學預測。最近已加入蛋白質-蛋白質交互作用的新數據組。預測的亞細胞位於AT3G47200蛋白質(衍生自GenBank登
錄第AK221225.1號的核苷酸序列)來自註釋以及Ms/Ms實驗兩者指向原生質膜、過氧化體及質體。其他數據庫中都沒有保存此相關的信息蛋白質而有一個例外:Phytozome植物基因家族數據庫(www.phytozome.net)展示了Viridiplantae的分支代表之具有涵蓋40個基因組序列的群集38694300,包括綠藻。與此家族相關的本體(ontologies)包括PF03140(DUF247)及生物過程GO:0008150;當此術語用於註釋,則表明沒有關於註釋的基因產物之生物過程的資訊可以取得。證據碼而非數據用以指示這個。少數本體包括PF00043、穀胱甘肽S-轉移酶之PfamA註釋、C端域。接著為真核生物之解毒功能,該域也在蛋白質中找到,其並沒有藏匿這樣的活性,例如壓力相關的蛋白質之HSP26家族,其包括植物中調控生長素的蛋白質。為了調查阿拉伯芥中PF03140之家族成員的表現概況,對基因研究者介面進行探討(www.gene研究者.org,NEBION AG,Zurich,Switzerland)。基因研究者對於基因表現分析為高性能搜尋引擎。其整合了數以千計的手動管理、充分描述的公用微陣列及RNAseq實驗,且將基因表現可視化,其跨越諸如組織或基因型之不同生物環境。在植物生物數據庫中,描述了10個物種,包括10773個樣本代表600個阿拉伯芥微陣列實驗之研究。對於這些研究,收錄了基因Chip®阿拉伯芥ATH1基因組陣列(Affymetrix,Santa Clara,CA)實驗。ATH1是設計與前TIGR機構合作(此時為Craig Venter Institute,Rockville,MA)且包括多於22500個探針組,代表約24000個基因。在基因研究者之條件環境中,選擇所有ATH實驗以調查基因在表X中
之表現,包括At2G38540、對於營養層發育及功能1缺陷基因模型作為控制組(Jun Zhu,2008)。在基因研究者ATH1數據中未找到AT3G47200。使用所有ATH實驗於阿拉伯芥的10個發育階段之表現程度的概觀顯示了對於所有基因之相對低程度的基因表現,除了AT3G4725及AT2G38540之外,其顯示較高的基因表現於階段2-9中,如同可以從表現潛力之百分比(第7A圖及第7B圖)所見。所有ATH實驗於阿拉伯芥127個解剖部分之概觀顯示了對於表列的PF3140基因之中度的基因表現,在所有解剖部分中,除了對於根之AT3G47250未偵測的表現,及所有基因之極低的基因表現,除了AT3G47250於離區中(第7C圖)。下個實驗包括可得的4個數據組,其中描述了幼年的基因表現及發育的花朵,不包括實驗中具有外部干擾的樣本,且創造了野生型阿拉伯芥樣本,其係使用引用文獻及所使用的數據庫之資料。所選的解剖部分此時除了AT3G47210,AT3G47250及ATH TDF1控制組之外,對於列示的PF3140基因顯示很低的表現潛力百分比於花朵中(第9A圖)。基因表現之詳細視圖於早期及晚期的花朵中顯示對於5個基因模型沒有基因表現,考慮到的是,實驗數據的數量仍明顯受到限制(第9A圖)。雄器及雌器中重新計算的絕對表現水平顯示了相同的結果(未顯示數據)。解剖部分及表現潛力百分比兩者之分層聚類(Pearson correlation indices)對於群集{AT3G50130,AT3G50140,AT3G50190},群集{AT3G50150,AT3G50160,AT3G50120,AT3G50180}及不相關的群集cluster{AT3G250,AT2G38540}具有高度相關值(第9C圖)。綜上所
述,仔細注意收錄的阿拉伯芥基因表現數據,所選的類DUF247基因於基因研究者界面中,對於在10個發育階段及127的解剖部分之基因表現的相關性,顯示3個高度相關群集,其相較於其他兩個群集的器官幾乎沒有基因表現於花朵中。此外,在系統化方式下,ATH TDF1基因在橫跨所有發育階段中,以高水平表現。人們可以推測DUF247,即顯性雌性抑制體基因,在雌雄同體阿拉伯芥花朵中應確實是幾乎處於非活性狀態,然而諸如ATH TDF1的隱性雄性促進基因於早期及晚期花朵發育中應有活性。這決定調查是否突變於AT3G50150基因中,且因此相較於未突變的表現型將給出明確的表現型差異,其推斷為蘆筍花序發育中DUF247的功能。
對此,Nottingham阿拉伯芥股票中心(NASC,University of Nottingham,Loughborough,United Kingdom)調查所列DUF247基因模型之序列-指示突變系的可利用性。對於所有基因模型,突變系種質可藉由NASC來取得。人們調查等位基因類型,即等位基於所述基因之表現型及基因型之基因的分類是否為已知。結果為列出的品系中沒有給出可靠的等位基因型及表現型描述於TAIR及相關的數據庫,例如NASC及AtGDB(http://www.植物gdb.org/AtGDB/)。這在SALK Institute驗證了對於由前綴SALK_顯示之插入品系且的確沒有可得的等位基因型(J.Ecker,Salk Institute for Biological Studies,La Jolla CA,USA)。6個品系指出”所調查的”一般為目測檢查生長、開花期、花序結構及小穗形成。對此,此品系約50個種子的典型實驗包括e Col-0基因型(物種Variant:90)進行簡
單的滅菌並塗盤於固體MS1培養皿上,放置24小時於黑暗的4℃下,且在無菌條件下發芽10-15天於23℃連續光照生長室。將幼苗轉移到土壤中,並在10天後監測其生長。對於基因型顯示沒有觀察到與Col-0背景之明顯的表現型差異。對於SALK_109348.55.50.X(AT3G50150)、SALK_122060(AT3G50160)及SALK_009839(AT3G47200)之子集,在顯微鏡下研究花朵結構。結果顯示在階段8-13之花苞的準備中,相較於Col-0背景,沒有觀察到花朵解剖部位相應的差異(與WUR,Dept.of Biochemistry,Wageningen,The Netherlands合作)。可得出結論,6個品系的類DUF247阿拉伯芥基因在目測檢查下,相較於Col-0背景沒有觀察到明顯表現型差異,從而無法推斷蘆筍花序發育中DUF247之生物功能。所有指出的同型接合突變之進一步調查將使用數位表型於空格鍵(Digital Phenotyping in the KeyBox)(Key Gene,Wageningen,The Netherlands)來實行。
表X:阿拉伯芥基因對於蘆筍類DUF247基因具有顯著同一性。顯示為基因ID(AGI Code),預測的亞細胞定位(SUBA)及NASC ID及對於基因之突變品系的信息。詳情請參閱正文。
只要沒有觀察到明顯表現型於阿拉伯芥中,意即這些DUF域包括阿拉伯芥基因可被視為同源於SEQ ID NO:1之GDS DUF247基因。
決定進一步調查類ML4 DUF247基因於一些天門冬屬基因型。使用引子3之設計的引子對(Untergasser,2007)執行雙脫氧定序(Sanger定序)於包括預測類DUF247基因的區域中。這些引子稱為CN59/CN60、CN67/CN68、CN69/CN70、CN71/CN72、CN59/CN70、CN67/CN82、CN69/CN81列表於表3。我們已獲得4個無關的雄性植物DH00/086,9M,88M,K323,12_25及雌雄同體Herma5375之序列。實施例中之預測開始於由EVM模型所預測的起始密碼子(見表6)。在CDS1中之核苷酸位置527處,所有雄性植物顯示胸腺嘧啶鹼基,然而雌雄同體於此位置顯示單一鹼基對缺失。此缺失將造成框架位移於讀框中,胺基酸改變且剪接後其可能造成提前終止密碼子。如黑1色背景中顯示之白色文字,指出對於雌雄同體的胺基酸及對於CDS2之預期的提前終止密碼子。除了於外顯子之結構差異,獨特的雌雄同體5375,在第一內含子中於9M發現2個SNPs及1個SNP於CDS2中,其為一同義替換(不會導致成氨基酸變化的靜默突變)。12_25M,K323及Herma 5375相較於其他定序的雄性顯示單一鹼基對INDEL於預測的內含子中。在CDS3
中,對於樣本沒有發現差異,其中序列數據為可得的;DH00/086,K323及Herma 5375。此外,於前述之第二RNA-Seq實驗之結果中列入ML4 DUF247之調查。基因型及挑選為RNA-Seq分析之其相關樣本如下所示:DH雄性1770=樣本1;DH雌性1800=樣本2;Herma 5375=樣本3;譜系1E之5植物AAff Herma=Bulk 1及譜系3E之4植物AaFf雄性=Bulk 2。從每個植物中,對三個花苞階段進行採樣:A)前減數分裂(對於Herma及雄性為1.0-1.2mm長,對於雌性為0.8-1.0mm);B)單核小孢子(1.6-1.8mm)或剛發育的子房(1.2-1.4mm);C)完全發育的心皮(剛好在萼片打開之前)。將結果RNA-Seq數據比對至使用TopHat 2.0.13之參考AGS V1.10 using(Kim et al.,2014)。目測觀察ML4 DUF247 EVM1註釋。首先,可檢測到基因表現但平均少於2片段每千鹼基之外顯子每百萬片段定位(Fragments Per Kilobase Of外顯子Per Million Fragments Mapped,FPKM)。少數來自雄性Bulk 2及雄性1770階段C的對齊讀取顯示相同的序列於CDS1中,如同由來自4個不相關雄性植物DH00/086,9M,88M,K323,12_25之RNA-Seq數據所獲得,包括Thymidine鹼基於CDS1中之位置527。2個來自Herma Bulk 1的對齊讀取顯示相同的單一胸腺嘧啶缺失於CSS1中之位置527,如獲得來自Herma 5373之RNA-Seq數據。綜上所述,在2個分開的RNA-Seq實驗中執行不相關的來自花朵器官的雄性及雌雄同體天門冬屬樣本,在所有情況下,偵測到單一鹼基插入缺失於ML4 DUF247 CDS1之位置527,造成提前終止密碼子於ML4 DUF247之mRNA中。
為了確認類DUF247基因之EVM註釋,藉由從DH00/86(蘆筍參考序列之植物)之花苞及其他2個非相關植物中分離出總RNA來研究表現。使用RNeasy® Plant Mini Kit(Qiagen)分離出總RNA,根據RNeasy Mini手冊(Qiagen)使用來自蘆筍之15mg新鮮的年幼花苞及完全開花的年長花朵,其落第於液氮中。為了避免RNA分解,使用無RNase的耗材及0.1% DEPC處理杵及玻璃器皿。在cDNA分析之前,根據廠商實驗流程以DNase I(Sigma Aldrich)處理RNA。接著,藉由使用最大值反轉錄酶(Thermo Scientific)來分析cDNA,使用2μl總RNA,1μl(200U)最大值反轉錄酶,100pmol oligo(dT)引子,0.5mM dNTP混合物(各10mM),5x RT緩衝液及無RNase的水於最終體積40μl。於50℃下培養混合物30分鐘,接著於85℃下去活化5分鐘。接著根據廠商實驗流程(Thermo Scientific,Pittsburgh,PA,Sigma-Aldrich,St.Louis,MO)之DNAse I處理,以瓊脂糖凝膠電泳及Agilent RNA生物分析儀實驗流程(Agilent,Santa Clara,CA)評估RNA品質。之後,藉由使用最大值反轉錄酶(最大值反轉錄酶)(Thermo Scientific Pittsburgh,PA)來分析第一股cDNA,使用2μl總RNA,1μl(200U)最大值反轉錄酶及100pmol oligo(dT)引子。使用引子靶向預測的外顯子位置(表3),使用預備的第一股cDNA作為PCR之模板,並使用Phire熱啟動子II DNA聚合酶(Thermo Scientific,Pittsburgh,PA)將特定PCR產物放大。如控制組樣本,基因組DNA被列為單獨的PCR模板。所有引子對CR55/CR57,CP35/CR57,CP45/CR57,CP61/CP40,CP61/CR56,CP33/CP38,CP33/CP40產生單一PCR產物,其具有與基因預測有很好的對應之尺寸,如從其相較於GeneRuler 100bp Plus DNA Ladder(Thermo Scientific,Pittsburgh,PA)在
1.5%瓊脂糖凝膠上之遷移所推斷。相較於cDNA模板,基因組控制磨粄粽是產生預期尺寸之較長片段。引子對CP61/CP62,CP33/CP62無法放大任何cDNA模板上之產物,然而基因組DNA模板產生預期尺寸之片段。對於CR55/CR57及CP35/CR57之PCR產物於一批總RNA之第一股cDNA上,其係來自DH00/086之一些發育階段的花苞,藉由直接定序於BaseClear(Leiden,The Netherlands)來獲得正向及反向序列讀取兩者。這些4序列之比對顯示AUGUSTUS之5’-剪接位點及對於CDS2/intron 2之邊界的EVM1註釋是不正確的。事實上,ML4之基因序列中位於位置2795的胞嘧啶從未在阿拉伯芥剪接數據中觀察到(Szczeniak et al.,2013)。新的剪接位點具有100%保存的鳥糞嘌呤-胸腺嘧啶雙核苷酸於ML4之基因序列中之位置2834-2835。結果,導入(TGA)新的終止密碼子於基因序列中位置3616-3618,且因此CDS3僅有27bp。對於DUF247 EVM1及DUF247_DH之最終剪接序列以及其各自的轉譯顯示於第10圖中。
為了解決ML4類DUF247轉錄子之3’-未轉譯序列,設計了cDNA末端快速放大(3’-RACE)。對此,使用DH00/086之一些發育階段中來自花包的一批總RNA。藉由使用最大值反轉錄酶(Thermo Scientific Pittsburgh,PA)來分析第一股cDNA,使用2μl總RNA,1μl(200U)最大值反轉錄酶及100pmol接合器(Adaptor)寡(dT)引子(5’-GACCACGCGTATCGATGTCGACTTTTTTTTTTTTTTTTTTTTVN)。使用正向引子CP39及CP35將第一股cDNA用於線性PCR。稀釋這些線性PCR的產物並用作巢狀PCR的模板,使用CP411(下游CP39)及CP39(下游CP35)及反向引子互補於接合器寡(dT)引子之尾端。在電泳之後,2個PCR產物從瓊脂
糖凝膠上切除並送至Baseclear(Leiden,The Netherlands)定序。
表3:使用於實施例1之引子
這些結果證明了類DUF247基因表現於花苞中,且雌雄同體(至少)之表現的基因序列藉由單一核苷酸缺失而與雄性植物之基因序列有所差異。已經提到基因發現於接近公開的性連鎖標記。為了證明突變本身及雌雄同體花朵性狀的連鎖,我們分析譜系Cross 3E的一些植物。我們使用引子對CR39/CR40(表3)於高解析融化曲線分析中,其基本上遵循描述於Wittwer et al(2003)的方法。結果顯示於表1e中。結果顯示標記及雌雄同體性狀之完全共分離。所有12個雌雄同體具有標記等位基因診斷為胸腺嘧啶缺失,然而所有12個雄性植物具有野生型基因等位基因。這證實了單一雌雄同體植物,其之前描述具有未預期的166/166AO022微衛星標記基因型,其的確為166個等位基因及雌蕊發育抑制基因之間的重組事件之結果,且此植物顯示CR39/CR40標記基因型診斷為單一鹼基對缺失且必須具有‘Aaff’基因型。此結果證實了使用dCAPS標記使用引子對CR37/CR38及限制酶Hpy188III。這些標記因此合適於此專一缺失突變之檢測,且可以用於描述於本案之診斷及育種方法。基於上述提供之證據,結論為類DUF247基因為雌蕊發育抑制(GDS)基因。
一般來說,可以說許多本案所提及之標記可適用於指出GDS基因中或接近GDS基因之突變的存在及/或適用於指出GDS基因之等位基因的存在。較佳為此類標記靶向GDS基因、其突變或等位基因或5’UTR或3’UTR或其順式調控元素。然而,其他標記也可用以合適地指出GDS基因中或接近GDS基因之突變的存在及/或適用於指出GDS基因之等位基因的存在,當這些標記基因上連鎖於GDS基因可以揭示植物多態性,其已顯示出具有突變於GDS基因中或接近GDS基因,其將造成GDS基因之降低的功能性表現。因此,所有標記可有利於用於標記輔助育種。可以用於偵測突變的引子對可從下列群組中選擇:CN67/CN68,CN69/CN70,CN71/CN72,CN59/CN70,CN67/CN82,CN69/CN81,CP31/CP32,CP33/CP34,CP35/CP36,CP37/CP38,CP39/C40,CP41/CN72,CR61/CR57,CP35/CR57,但這些引子之其他組合及/或提及於表3之其他引子也將成為可能。
再者,位於接近GDS基因座之標記及可用於標記輔助育種者上述已經提及,例如AO022及Asp1-T7列示於表5中。
表5:對於GDS基因可以有利於用作標記輔助育種之標記。
因此,顯示優異的雌雄同體植物已獲得下列組織培養,其比任何已知的雄性祖先更能夠生產漿果,其具有單一
核苷酸缺失於基因中,此時設計一雌蕊發育抑制體基因,位於由公開的遺傳標記所靶向之半合子區域。再者,其已顯示GDS基因具有此單一核苷酸缺失與植物共分離,從而保留雌雄同體表現型。組織培養方法基本上遵循Qiao & Falavigna(1990)公開的方法來實行。簡單來說,在包含2,4D之胚胎誘導培養基中移植花藥,獲得類胚胎結構(直徑1mm的球狀),其轉移至下個培養液中設計以產生萌芽的癒傷組織,將這些芽砍成碎片以允許新的芽從葉腋分生組織中形成,最後將芽放置到生根誘導培養基上以獲得紮根的迷你樹冠,其最終可以轉移至溫室中。自上個世紀80年代以來,人們以認識到植物的組織培養對於體細胞變異造成了風險(Evans et al 1984)。體細胞變異可包括點突變(Jiang et al 2011)體細胞變異已被確認為新穎基因型之恢復的可能性(Evans & Bravo,1986)。體細胞變異被描述為造成蘆筍之表現型變異,包括植物顯示差異於花朵型態中。Pontaroli & Camadro(2005)比較了各自的供體殖株及其再生劑之植物高度、葉狀枝長度和形狀、顏色葉子。這些作者獲得了再生劑,其中之一為藍綠色(灰綠)而非綠色如同供體及所有其他再生劑。對於實施例更重要的是,Pontaroli & Camadro(2005)獲得之再生劑具有高於一般數量之雄器的異常花朵,其中有些被粘附到萼片,有些萼片與終端葉狀枝融合。
在5375觀察到之特定的突變可能由體細胞變異所造成,其可遵循Qiao & Falavigna(1990)之方法潛在地發生於花藥培養中,這是由於植物其中被送往開啟培養的組織未顯示雌雄同體表現型。
如將在實施例6及實施例2所指出,GDS基因位於雄性中染色體區半合子,其不存在於雌性中。此結果為單一GDS基因之等位基因功能喪失,若其發生於體內異型接合雄性
中,將不會被GDS基因之另一野生型等位基因所屏蔽,且被忽視的可能性很低。
表6:預測之外顯子DUF247 FG(FGenesh預測)及DUF247 EVM(Evidence Modeler預測)及檢測到的cDNA序列(DUF247 DH)之編碼序列(CDS)。下方為CDS結構之各自的概念性轉譯。
雌雄同體突變K323-G33之遺傳分析
所有雄性雜交K323為從品種Gladio之花藥培養所獲得之雌性雙單倍體LIM425與從品種Gijnlim之花藥培養所獲得之雄性雙單倍體LIM428之間的雜交種。
選擇LIM428作為親本植物,這是因為在其他條件中,無法生產漿果。儘管雄性雜交K323於雌蕊中具有發育不全的花柱,且儘管事實上其祖父Gijnlim有時候藏有雄性雌雄同體植物,在評估於1998-2007期間的各種雜交路徑中,其從未顯示單一漿果於大於15,159株植物中。決定創造K323之突變版本,其需要雌雄同體性狀作為藉由輻射介導的突變誘發所改變的GDS之結果。提供另一實施例之決定,其中GDS之突變造成具有性連鎖雌雄同體性狀的植物被作出來,這是因為此雜交種擁有對於突變誘發之良好的起始材料。第一個原因為此雜交種完全沒有生產漿果的傾向,即使是在偏向雄性雌雄同體的情況下,例如短天數及低溫(Franken,1970),且植物年齡之雄性雌雄同體波峰的傾向為三年(Franken 1970)。在任何情況下,此條件應發生於K323長時間的評估期間。第二原因為所有此雜交的植物為基因上相同,這是由於其為兩個雙單被體親本之間的雜交之結果。因此,於屬於雜交K323之植物中的任何表現型改變必須為突變之結果。
為了創造突變,將由蜜蜂授粉於隔離的溫室所獲
得之34000個種子暴露至鈷60伽馬射線於450灰度於協同保健(Synergy Health)設備(Synergy Health Ede B.V.Morsestraat 3.Ede,The Netherlands)的劑量,使用其”試驗裝置”。在此裝置中,鈷60來源由鉛筆型棒所組成,其同軸地安排成一個其中可以放置樣本的圓柱形容器。提供種子於堆在此容器的培養皿中並暴露至指示的450Gray之劑量。藉由典型的劑量測定系統測量劑量傳遞,其涉及了Perspex之使用以測量由劑量所造成的色度變化。
2012年五月K323之輻射種子在荷蘭霍斯特的戶外播種,且在隔年2013年四月直到2013年七月觀察並檢測到第一朵花。據估計大約有一半的種子最後提供成熟的植物,意指評估了大約17000株開花植物。單一植物發現結果顯示帶有柄的漿果似乎已從每朵花中發育。此外,此植物具有生產完全花朵的第二花柄。與之前觀察一致地,所有其他K323植物沒有生產任何漿果。將單一雌雄同體K323植物,特別指‘K323-G033’或較短為‘G033’轉移至無昆蟲的溫室並進一步在充滿草皮的鍋裡生長,其中生產了新的花柄且所有花柄都顯示完全的花朵並接著全面地著果。著果的一實施例顯示於第12-A圖中。典型的K323-G033花朵相較於野生型(WT)K323植物生長於相似的溫室條件下顯示於第12-B圖中。G033花朵具有較長的花柱及發育較好的柱頭葉片,其較長且較彎相較於WTK323花朵。在後來的季節中,在短短幾天,其已證明偏向雄性雌雄同體於其他雜交種中(Franken 1970)收集最完美的WT K323花朵且再次與G033比較以找出是否其最佳發育的花柱及柱頭可達到圖變中觀察到的程度(第12-C圖)。突變G033之平均花柱長度為2毫米,然而WTK323植物最大限度為生產1毫米的花柱。明顯地,已經創造了突變,其相較於雜交種之WT
版顯示了更完美的花朵,且顯示其WT雜交種之植物及其父係從未做到之完全地漿果著果。
突變分析以專利微衛星標記驗證,這證實了其預測的真實性;其顯示獨特的微衛星輪廓,其為對此雜交種具有高度鑑別性及特徵,其中此雌雄同體表現型已獲得(未顯示結果)。為了比較其序列並找出哪個基因突變造成雌雄同體表現型,其決定了野生型K323及其衍生的雌雄同體植物K323-G033兩者之序列。將序列比對至基因型參考序列,其由James H Leebens-Mack之實驗室所組成,其與北京基因組機構(BGI)合作致力於雙單倍體超雄性DH00/086(版本1.0)之基因組序列草圖。於其工作中,將序列讀取定位至100-90bp配對終端及交配配對Illumina序列之組合,其由對於共163gigabases序列之BGI所獲得,且大約為123X之覆蓋度。所得到的組合由北京基因組機構(Beijing Genomics Institute)之生物信息學家所建構,使用SOAP彙編器,展示21,179bp之重疊群N50及301,040bp之支架N50。換句話說,組裝一半的基因組於1196序列支架中,其長度至少為301,040bp。北京基因組機構(BGI)更產生對於DH00/94雌性雙單倍體之100nt配對末端Illumina短讀取之接近40X基因組覆蓋度,DH00/086雄性雙單倍體個體的姊妹種被用於基因組組裝及註釋。
使用預設設定之bwa-mem將來自G033及WT K323的短讀取兩者比對至參考基因組(Li and Durban,2009)。以Bowtie2生產同時比對,需要末端對末端讀取比對且不允許軟削波或分裂讀取比對。
來自G033及野生型K323植物的葉子組織被相似地定序於Leebens-Mack實驗室,對於每個數據庫產生大約7X
整個基因組散彈槍覆蓋度(Illumina配對末端100nt讀取)。將來自兩者數據庫的讀取使用bwa-mem比對至基因組。於每個非轉座子基因組的讀取覆蓋度特點為以GLEAN所生產的起始BGI註釋(例如,整個基因、mRNA、個體外顯子、CDS,UTR)佔據了使用bedtools coverageBed的兩者數據庫。在假設伽馬射線誘導G033植物中的缺失之下,以0讀取支援G033植物及5讀取於K323植物來將數據分類以鑑定基因特徵,接著更以2個體之間最大讀取覆蓋度差異來分類以鑑定基因特徵。
藉由使用此方法,鑑定出變異序列可能大於2千鹼基對,其對於G033之基因組序列為獨特的。CDS外顯子位於性連鎖BAC組裝(M-基因座_支架4)於位置2201:2926,具有18對齊的K323讀取及0對齊的G033讀取。讀取覆蓋度可視化於Jbrowse基因組瀏覽情況之中。對於此變異之邊界有強力的支撐,由bwa-mem軟性裁剪讀取於5讀取中單一位置所表示,於第4圖中顯示為箭頭於讀取之右側。由於缺乏支持讀取以識別其他邊界,變異的確切尺寸為未知(見下文進一步解釋)。比周圍的基因組之200KB更多的序列被認為是半合子(Y-專一),透過DH00/086讀取覆蓋的存在和DH00/94讀取覆蓋的缺乏。
它可以從Jbrowse可視化(第4圖)來推斷,其在基因組區由支架M-基因座_支架4(且相遇於基因座支架905)所表示,一個事件已發生,其導致在一區域中缺乏對於突變雌雄同體G033之讀取,其重疊大部分預測的內含子,預測的第二個外顯子及另外大部分的轉錄序列,其可能包括含有基因之DUF247之可能的第三個外顯子(如由EVM所預測)。2個獨特的基因預測可視化於第4圖中。這些基因預測之序列可在第4及13圖中找到。
在比對之缺乏讀取G033的左邊界處,發現所謂的”削波讀取(clipped reads)”(第4圖中由箭頭表示)。這些讀取從基因庫序列數據中檢索,且其整個基因序列使其為”削波讀取”。在那些削波讀取中,一個區域(左,相對於該部分是讀取或在GO033缺失)顯示同源於M-基因座_支架4(序列描述於第13圖),然而其他於右側的區域與這些讀取相同但始終不同於M-基因座_支架4。基於這些削波讀取,可作出共通序列,其顯示並指出於M-基因座_支架4之位置處,已發生取代了原來序列的插入。與內含子中此插入一致之削波讀取相近於內含子之外顯子1側為:
,其中底線部分指出插入特定部分。
使用此底線部分作為查詢以開採G033基因庫的序列數據,鑑定交配配對序列,其提供進一步延伸到插入部分的共通序列。此序列共通為:
,其中N端代表未知的鹼基。2個反向引子,特別是設計CN83及CN84(見引子表3),其退火所謂插入之序列並指向第一外顯子。將這些與專一於外顯子1之引子CN78結合的引子測試於PCR中以確認至今對於G033所收集之所有短序列提供插入邊界之正確的表示。所使用的模板序列為K323-WT、雌雄同體G033及
DH00/086之序列,其中最後模板代表相應於參考基因組的樣本。對突變G033獲得獨特的片段,其可以用作遺傳標記(見第11圖),其缺乏K323-WT植物且在參考基因組樣品中。由定序此片段所獲得之Sanger序列顯示於下列序列中。
此序列之比對於預測的內含子顯示於第5圖。Sanger定序的確證明了片段為”嵌合體”,故包含已知發生於預測的內含子之序列,接著獨特的”下游”部分其必須由類似插入事件所造成,可能最好稱為”取代插入”。不論確切事件可以是G033突變植物明確地缺乏讀取於預測的內含子中和GDS基因之預測的外顯子2及外顯子3(描述於實施例1),因此具有干擾GDS基因。於J-瀏覽中讀取定位之研究教示了G033的讀取缺乏序列進一步下游GDS基因。下游區域包括重複DNA之延伸,由低或單一複製區域分離,其可以從雌性參考DH00/94之讀取定位來推斷(實施例1中所述),其顯示一些讀取定位至特定的子區域(包括高複製DNA),於讀取覆蓋中透過缺口之干
擾,因為沒有雌性讀取可以定位至這些真正獨特及DNA之對雄性專一的子區域。如所預測,讀取之此”片狀分佈”未觀察到對於DH00/086的讀取,其定位至相同的參考。這似乎從研究讀取定位於基因組瀏覽J-瀏覽,從G033獲得之讀取顯示片狀讀取分佈,相當於DH00/094之分布,高達位置17,500於M基因座-支架4中,然而相較於DH00/086參考雄性,K323-WT之讀取定位顯示典型連續的讀取定位。綜上所述,讀取定位景觀之前景指出,由G033中”插入-取代事件”所造成之缺失部分的末端置於從GDS基因內含子至大約支架起始前1.8kb的位置。後者位置之再往下游,對G033及K323 WT控制植物兩者觀察到讀取定位之可比較的深度。在區域中跨越干擾GDS基因達”插入-取代事件”之假定的末端,可以找到3個編碼序列如同由FGEMESH所鑑定。所有3個編碼序列皆有命中,其係使用BLASTx(Altshul et al.,1990)對比非冗餘蛋白質,例如整合酶,催化區;鋅指,CCHC型(ABD32582.1),反轉錄轉座子禁制蛋白質[蘆筍]ABD63142.1及反轉錄轉座子禁制蛋白質[蘆筍]ABD63135.1。由於這些註釋相關於轉座子而非植物基因,其得到結論為,相似於實施例1所描述之突變,已藉由GDS基因中之突變創造出雌雄同體植物。
為了進一步調查G033之雌雄同體性狀的分離,製作了一些雜交。從後代中記錄性別且為CN78/CN83標記之共分離之後來研究分離出DNA,用於指示插入-取代事件。藉由花朵(輸入這些作為完全/雌性/雄性其中之一)之目測檢視及藉
由在無昆蟲條件下檢測完全地漿果著果來實行表現型。獲得的結果顯示於表4。
表4:為3個譜系(G033自花受精、GO33雜交至雄性DH及雌性雜交至G033)所獲得之表現型分離結果,其係藉由使用突變G033親本植物及其標記結果所製成。”標記表示”意指藉由引子對CN78/CN83或CN78/CN84所產生之PCR片段,其診斷為缺失/插入被放大,因此藉由對於特定植物使用模板DNA而存在,研究顯示於第11圖(進一步解釋見本文)。
從G033之自花受精所獲得的後代可具有預期的基因型Aaff造成46個雌雄同體及8個雌性,其明顯地不同於預期的3:1比例(p<0.02)。此偏差的說明假設為於生長季節期間一些植物並非為表現型,其可能是雌性,這是由於雌性植物通常開花晚於雄性植物(Lopez_Anido & Cointry,2008,p89)且
也可能晚於雌雄同體。除了1株之外,所有15株沒有開花的植物缺乏對於GDS基因突變的診斷標記,其與連鎖至雌雄同體性狀的GDS基因為一致,且可能為雌性植物之較晚開花。再者,所有雌雄同體具有CN78/CN83標記,然而其缺乏於8株雌性中。
在第二雜交中,將雌雄同體G033雄性化並作為母本植物雜交至雄性雙單倍體,其可表示為具有遺傳構造Aaff x AAFF之雜交型態。獲得24株雄性植物之譜系,其中GDS基因中診斷為突變之標記分離為1:1比例(10:14)。這與表示於實施例1之結果為一致,其再次指出來自雄性親本之雌蕊發育抑制之顯性等位基因阻礙了之前觀察到的雌雄同體之雌蕊發育。因此可得到結論為雌雄同體性狀為隱性性狀。
在第三雜交中,將雌性透過雌雄同體授粉以產生93株植物之後代,包括53個雌雄同體及33個雌性。此比例明顯地偏離自3:1比例,且若為假設,如上所述,7株尚未開花的植物為雌性植物,此偏差更為極端。然而,GDS基因中對於”插入-缺失事件’的診斷標記完全地與雌雄同體性狀共分離,其證實了顯性基因之遺傳模型,其允許花藥發育於毫無抑制雌蕊發育的顯性基因之譜系中。
應注意的是,在所有上述雜交中,所有發育漿果之雌雄同體的花朵為完全的。
綜上所述,證明了使用輻射突變誘發以創造GDS基因中雄性特定區域處之干擾。此突變的基因可以轉移至下一代並授予了雌雄同體性狀之孟德爾遺傳。
包含雌性抑制體基因的DUF247域之表觀等位基因(epi-allele)
當育種系K1036種子繁殖於隔離的溫室中,其中放置蜜蜂以授粉,可以注意到所有植物皆生產漿果,然而通常一半預期為雄性的植物不會生產漿果。一些年之後,許多K1036再次播種以揭開雌雄同體性狀之遺傳。評估16株植物之開花及著果。所有具有發育良好花藥的植物能夠在無昆蟲的條件下著果。有人指出著果在那些植物及/或在其分支中稍有變化。儘管有些著果失敗,植物上漿果數量可達到95%高之程度,其為非常高的。由於所提供之育種紀錄對於世代之數量資訊不足,育種品系K1036已繁殖,使用30個專有的衛星標記之組合使5株K1036植物為基因型,其用於例行的基礎以監控真實性及種畜之近交程度兩者。5個雌雄同體出現完全地同型接合於30個(高度變異)基因座且幾乎相同(結果未顯示);4株植物完全相同且1株植物不同於其他3株植物於僅三分之二之基因座,其中,其同型接合地差異於替代的等位基因。對K1036觀察之同質接合性(homozygosity)程度通常僅發現於花藥培養獲得的雙單倍體。綜上所述,雌雄同體K1036代表完全地同型接合(同基因)於近交材料。
儘管事實上一些植物的著果高達95%,並非所有植物完全地著果且一些植物從數十朵花中缺乏漿果。由於發現植物幾乎同基因,著果之差異最初歸因於不一致的生長條件,例如植物遮蔽桌上其他植物,翻盆後植物成長不佳,水分不足,授粉於溫暖天氣條件下等。為了進一步分析不完全著果的現象,將一些K1036雌雄同體與2個(品系88及品系105)雌性測試者雜交。所有由這些試驗雜交所獲得之結果的F1植物皆生產花藥且所有植物能夠在無昆蟲的條件下生產漿果。將著果評分為類別1-5,其大約相應於0-20%,20%-40%,40%-60%,60%-80%,80%-100%著果。可觀察到大部分F1為高度雌雄同
體(類別5)彷彿所有F1雜交種遺傳了基本上為完全滲透之性狀。然而,再次指出不良著果的植物再次於F1譜系中之植物,且一株小的F1後代因低很多的著果而特別突出(867F1b,其具有ID 215292之父本植物),似乎有可能是不同於特定F1後代之可遺傳的因素。F1試驗雜交之著果顯示於表31。於另一實驗中,紀錄了由個別自花受精K1036雌雄同體所獲得之譜系之著果。這些結果顯示於表32中。這些結果再次指出家族在著果方面似乎分離且平均著果在譜系之間有所差異。然而,當人們看著特定K1036父本植物ID之著果作為自花受精之結果,並將此著果與雌性試驗雜交譜系之著果作比較,其為由那些特定個體K1036父本植物ID所生殖之譜系,似乎沒有明顯的相關性(見表31及表32對於相似的21529x ID)
表31:著果於F1試驗雜交之級別,其源自於K1036父本植物授粉於雌性測試者(品系88或品系105)。將著果評分為類別1-5,其大致相應於0-20%,20%-40%,40%-60%,60%-80%,80%-100%著果(漿果)。
表32:著果於F1植物之級別,其源自於自花授粉(selfing)特別是K1036植物由其植物ID所指示。將著果評
分為類別1-5,其大致相應於0-20%,20%-40%,40%-60%,60%-80%,80%-100%著果(漿果)。
因此,觀察到的變異是否可遺傳或受到環境很大程度上的控制仍然值得商榷。為了進一步分析遺傳,將雄性化的雌雄同體K1036植物(ID 215297)雜交至超雄性(品系88雙單倍體,特別指DH02/504)。此雜交產生3個F1雜交種(特別指861F1-124M,861F1-126M及861F1-128M),其全為完全雄性,這代表那些植物皆具有富饒的花藥且並未生產任何漿果。這指出源自於K1036的雌雄同體性狀為隱性至超雄性DH02/504之雄性性狀。事實上,K1036及雌性植物之間的試驗雜交產生雌雄同體,然而與超雄性植物之雜交僅產生雄性,這指出K1036可能缺乏雌性抑制體,如同在實施例1及實施例2之雌雄同體所發現。為了調查這點,將雌雄同體×超雄性F1回交至品系88雌性植物。譜系861BC1d,其為個體雌性88-100599與個體861F1-124M之間的雜交,以著果及花朵型態為表現型,且使用性連鎖標記為基因型。遺傳上,這是偽試驗雜交類型:近交品系88雌性×(雌雄同體K1036×近交品系88超雄性)。總共91株植物可為性別類型,其中53株為雄性及38株
為雌雄同體,其並未明顯地不同於1:1比例(p>0.11),標記AO022具有3個重組事件於91個受測的樣本中,且標記Asp_80(對於引子,見表3,實施例1)顯示在85個受測的個體中僅有2個重組事件。這顯示了隱性雌雄同體性狀連鎖至M-基因座,如同在實施例1及實施例2之雌雄同體所發現。相對於源自於K1036的其他譜系,其顯示一些變異於著果,在雌雄同體之中沒有標記的變異於此特定的譜系861BC1d中;所有雌雄同體顯示近乎完全著果且具有最大著果級分”5”。譜系861BC1d之所有雌雄同體顯示發育良好的花柱,其使用Franken,1969 p37之分類可被評分為4或5。在譜系861BC1d之所有雄性中,缺乏花柱且這些雄性皆沒有生產任何漿果,因此沒有任何些微地雄性雌雄同體。第14圖顯示兩個花朵表現型之實施例,其分離於861BC1d中且代表分離的表現型於此族群中。綜上所述,源自於K1036並分離於譜系861F1d中的雌雄同體為連鎖至M-基因座之明顯的單基因隱性性狀。
由於實施例1及實施例2之雌雄同體分別顯示單一核苷酸缺失且大量插入缺失,在連鎖GDS基因之M基因座中,也預期一突變為K1036雌雄同體M-基因座GDS等位基因。使用K1036作為模板DNA並使用引子對CN67/68,CN67/CN82,CN59/CN70,CN69/CN81,CN59/CN60(見表3,實施例1)將PCR片段於兩個方向中定序,然而,沒有發現獨特的序列變異。K1036顯示GDS基因單倍型,其特徵為SNP位於絲胺酸胺基酸(AGC to AGT)之第三密碼子位置,位於第二預測外顯子之第58個胺基酸,其為同義替換(故為保留了絲胺酸
氨基酸之靜默突變),其也可以發現於育種系9M(對於9M之序列,見第13圖),其為雄性(而非雌雄同體),指出此特定的SNP對於性別鑑定沒有什麼影響。此特定的SNP後來被開發為遺傳標記靶向(見下方)。
雌雄同體K1036之連鎖M-基因座的GDS基因序列及雄性9M被發現為完全地相同。努力獲得序列上游信息對於突變之M-基因座-連鎖的-GDS基因,其可從9M單倍型中區分K1036已失敗(結果未顯示),其可能取決於此序列的性質。提供重疊未知上游區域之3個PAC Bio讀取,GDS基因朝向含有位於更上游支架905的基因之DUF4283(未顯示結果)。由這些PAC BIO讀取所獲得之信息指出GDS基因的上游區域為高度重複且藏有大量AT重複或大量富含AT的重複,其藉由短的富含CG的重複穿插其中,使其不可能設計引子,這對於K1036及9M兩者(結果未顯示)會允許GDS基因(其可能包括基因引導子或其他順式調控元素)上游序列的Sanger定序。使用引子、側接”序列缺口”提供的指紋狀圖案或不可信的片段來長距離放大,這是由於這些片段也放大於PCR中,其缺乏初始用作配對的二分之一個引子;未顯示結果。綜上所述,不可能獲得連鎖M-基因座的GDS基因之上游序列信息。
為了了解是否值得努力去偵測接近GDS之序列變異,故品系K1036中隻突變的確應尋求於連鎖M-基因座的GDS基因(區域)中,力求進一步的精細定位K1036雌雄同體性狀。為此,製作了更多‘861-BC1雜交’類型:近交品系88雌性×(雌雄同體K1036×近交品系88超雄性)。最佳的溫室使用需
要藉由挑選並只保留年幼植物來縮減族群,其具有微衛星標記AO022與Asp-80之間的重組事件(關於詳細標記請見實施例1),其位於連鎖M-基因座的GDS基因之兩側在小於5centi-Morgan之遺傳距離。那些"標記重組植物"接著對於開花及著果呈現表現型。除了標記AO022及Asp-80之外,藉由溶解曲線標記CP80/CP81使植物對於其GDS等位基因呈現基因型(對於引子請見表3)。此標記靶向SNP於雌雄同體祖父母K1036之GDS基因的第二預測外顯子中,其不同於其他祖父母DH02/504(即品系88超雄性)的等位基因。
對於群組861BC1a,861BC1b,861BC1c,861BC1e,及861BC1f,分別生長了22,327,135,86及33個體,其中獲得標記AO022與GDS基因座之間的18個重組及GDS基因座與Asp_80之間的8個重組以使其進一步呈現表現型。那些重組加上一些"對照植物"(其中AO022,GDS及Asp_80並未重組),提供了一組作為調查對象之44株植物,其於下一季中進一步呈現表現型。2在該組植物中之5株植物,其具有源自於DH02/504雄性祖父母之GDS等位基因,無法生產漿果。在Franken,1969;p37.的標準中,所有那些25株植物具有可被分類為1的花柱長度(完全沒有花柱)。綜上所述,若BC1植物接收到DH02/504雄性祖父母親本M-基因座GDS等位基因,其則為雄性植物。於組別中之19株植物具有K1036雌雄同體祖父母親本M-基因座GDS-等位基因。在這些19株植物中觀察到變異性:12株植物生產超過500個漿果且這些植物具有之花柱分類為‘5’(n=9株植物)或‘4’(n=3株植物)。2株植物生產大
約200個漿果且具有之花柱分類為‘5’或‘4’。另外2株植物生產約100個漿果且具有之花柱分類為‘3’或‘2’。其餘3株植物具有之花柱分類為‘1’,僅生產5個漿果(n=1株植物)或完全沒有漿果(n=2株植物)。一株能夠著果的植物,其帶有K1036雌雄同體祖父母親本M-基因座GDS等位基因,為"對照的"雌雄同體而非"標記重組",其指出變異著果之現象並非與本身相關的重組事件於M-基因座區域中但通常發生於此群組中。
綜上所述,在額外的861BC1譜系中,沒有觀察到著果於帶有DH02/504雄性祖父母親本M-基因座GDS等位基因的植物中,其全部為雄性(如同譜系861BC1d),然而在帶有K1036雌雄同體祖父母親本M-基因座GDS等位基因的植物中,除了2株植物外,所有植物皆著果。然而,在那些著果的植物中觀察到著果程度的變異。此著果似乎關係到花柱是如何地發展。在此情況下,觀察到的額外861BC1(861BC1a-f而非861BC1d)譜系相較於譜系861BC1d所獲得之結果有所不同,這是因為在後者族群中,於帶有K1036雌雄同體祖父母親本M-基因座GDS等位基因之所有植物(故沒有例外)中,觀察到不變地高水平之雌雄同體。
於實施例1及實施例2中,其顯示了隱性等位基因造成正常的顯性雌性抑制體GDS之喪失,於本實施例中譜系861BC1d所獲得之結果與模型一致,儘管功能喪失的原因還不太清楚。對於其他861BC1譜系,發現表現型其指出K1036雌雄同體祖父母親本M-基因座GDS等位基因之不完全地外顯,這可能必須解釋為"不完全喪失"或"不完全地抑制"之雌性
抑制體GDS基因。
在後期其重疊之前譜系之表係型的階段中,另一861BC1譜系,特別指‘861BC1j’,對於2個標記呈現基因型。第一HRM-標記位於類A20/AN1鋅指(zinc finger)家族蛋白質基因,簡稱‘類A20/AN1’(引子CM45/CM46,見表33),其取代標記AO22,且第二標記為Asp_80(CK63/CK64,表3實施例1)。
當時後代861BC1j被評估為漿果著果,基本上是未知,一些譜系可顯示基因上的鑑定而非環境的控制,對於那些植物之漿果著果及著果之可變數量大致評定為能夠或不能夠著果,而非以定量評估。
發現一些142株植物,其對於標記為‘類A20/AN1’及Asp_80位於兩側之GDS基因座的K1036雌雄同體祖父母親本等位基因為"非重組"。在那142株植物中,118株生產漿果及24株植物並未著果。發現一些135株植物為"非重組"且對於標記類A20/AN1及Asp_80兩側的GDS基因座具有DH02/504雄性祖父母親本等位基因,其全部為雄性且不會生產漿果。6個標記重組顯示表現型,其被預期為基於他們的GDS等位基因類型。
儘管其等位基因為K1036雌雄同體祖父母親本起源,24株植物並未生產漿果,且保持表現型於下一季中,加上8株雌雄同體"對照植物"及11株雄性"對照植物"(這些對照植物顯示表現型與其標記等位基因類A20/AN1及分別源自於雌雄同體K1036及雄性DH02/504祖父母親本一致),加上3株以前未呈現表現型之植物,1株具有類A20/AN1及GDS基因之
間的重組事件之植物,及4株顯示重組事件於GDS基因及Asp_80之間的植物。
在接下來的評估中,將更仔細地鑑定漿果數量及花朵型態。11株雄性對照植物再次完全沒有生產漿果,且其具有患病發育的花柱(分數1)。預期為雌雄同體的植物基於其連鎖至GDS基因座之標記的祖父母親本等位基因顯示變異性於著果及花朵型態中。具有K1036雌雄同體祖父母親本GDS等位基因的36株植物中,6株植物生產超過100個漿果,6株生產25-65個漿果,7株生產1-18個漿果及剩餘的完全沒有生產漿果。這再次顯示K1036祖父母親本GDS等位基因之雌性抑制的喪失在此譜系中為不完全的。
為了瞭解是否源自於K1036的GDS等位基因可為表觀等位基因,如同發現於甜瓜中的性別鑑定(Martin et al.,2009),其決定獲得對於雌雄同體K1036的亞硫酸氫鹽定序數據,雄性DH00/086的參考基因組及對於品系9雄性,其具有相同於K1036的GDS單倍體(因為共享的SNPs)。下面描述了用於獲得該數據的材料和方法。
從亞硫酸氫鹽轉化的DNA準備Illumina定序基因庫。以下將亞硫酸氫鹽轉化未甲基化胞嘧啶轉化成尿嘧啶,然而5-甲基胞嘧啶保持完整。以下為PCR放大,轉化的核苷酸產生胸腺嘧啶,然而未轉化的核苷酸仍然為胞嘧啶。
對於每個基因庫,使用Covaris-S2將2μg的總
DNA進行超聲波處理至~550nt。根據廠商指示,使用End-It Kit(Epicentre)實行末端修復(End Repair)。使用0.8X AmpureXP磁珠清洗反應。使用Klenow(3’至5’exo minus,NEB)實行A-tailing並於37℃下溫育30分鐘。再次使用0.8X AmpureXP磁珠清洗反應。使用1X AmpureXP將NextFlex定序接合器連接到每個A-tailed片段。根據廠商指示使用MethylCode kit(Life Technologies)實行亞硫酸鹽轉化。根據以下操作步驟將經亞硫酸氫鹽處理的DNA以Kapa Uracil+ 2x Readymix放大:在95℃下2分鐘,在98℃下30秒,接著以下4個循環[在98℃下15秒,在60℃下30秒及在72℃下4分鐘]結束於72℃下10分鐘。
使用1X AmpureXP將放大的亞硫酸氫鹽基因庫再次清洗,並以Illumina NextSeq500上之配對末端的150nt讀取定序。
使用具有bwa-mem(Li,2013)版本0.10之BWA-meth(Pedersen,2014)將配對末端Illumina讀取定位至Asparagus 2.0參考基因組(來源),使用以下命令行(command line)(/usr/local/bin/bwameth.py--reference../Genome/02.assembly_result/V2.0/Asparagus.V2.0.genome.fa -t 10 --calmd -p DH0086 DH0086_bisulfite_1.fq.gz DH0086_bisulfite_2.fq.gz)。bwa-meth創造了2個計算轉換參考序列,其中之一係對於正向或Watson股,其中所有胞嘧啶轉換成胸腺嘧啶且另一個係對於Crick或反向股,其中所有鳥
糞嘌呤轉換成腺嘌呤。讀取配對定位至計算轉換的基因組兩者,當配對以高於40的定位分數定位至Watson或Crick股時,該配對被保留。當配對匹配於Watson及Crick股兩者時,僅保留最高分數之配對。於最終BAM比對文件“YD:Z:f”之定制讀取族群標籤(custom read group tag)鑑定了定位至Watson股的讀取配對,然而“YD:Z:r”鑑定讀取定位至Crick股。根據這些標籤,使用以下bash指令碼將讀取分成Watson定位及Crick定位配對:“samtools view -h all.bam |tee>(grep "^@\|YD:Z:f" |samtools view -Shb->Watson.bam)|grep "^@\|YD:Z:r" |samtools view -Shb->Crick.bam“。使用Samtools(http://www.htslib.org/download)版本1.2。
以下為定位,創建了一個定制的(custom)Python腳本其遍歷所有核苷酸於基因組中。可以通過熟悉本領域之任何有能力的生物信息學家來實現建立這樣一個(Python)腳本。對於所有胞嘧啶於Watson及Crick兩股上,證實了正確的上下文CG,CHG或CHH(其中H為C、A或T)。一核苷酸被認為是在CG上下文即使按照此雙核苷酸對之鹼基也是G,所以於序列“CGG”中之第一核苷酸被認為是在Watson股上之CG上下文中。第二位置上相反於G之胞嘧啶,其駐留在Crick股,也被認為是在CG上下文,如同3'下游核苷酸於相同股上在此為G。同樣地,相反於第三G之胞嘧啶被認為在CHG上下文中,如同第一3’下游核苷酸於Crick股上為C,然而第二3’下游核苷酸於其股上為G。藉由計算未轉換之數量對比於總核苷酸數量來分別測定對於Watson及Crick股之甲基化程度。在
Watson股上,轉換的核苷酸由具有參考核苷酸C之胸腺嘧啶(T)所表示,然而在Crick股上,轉換的核苷酸由具有參考核苷酸G的腺嘌呤所表示。使用samtools(版本1.2)堆積在每個位置的轉換率同時計算Watson及Crick股兩者上之胞嘧啶。甲基化僅召集沒有核苷酸多態性係明顯的位置。甲基化多態性可以從核苷酸多態性(SNPs)區分,這是因為在後者Watson及Crick兩股之情況下顯示多態性之證據,然而甲基化多態性僅存在於Watson或Crick其中一股。這是由於事實上,亞硫酸氫鹽轉換僅影響了胞嘧啶,留下完好的鳥糞嘌呤於相反股上。由於足夠的讀取定位覆蓋度於兩股上,故甲基化多態性可以從核苷酸多態性中確實地區分開來。
具有名稱為“Aof030575.3”之M基因座連鎖的基因(由編碼區域表示SEQ ID NO:1見實施例1)位於支架_905上天門冬屬版本2.0參考基因組具有DUF247域顯示顯著的差異於CHG甲基化中介於K1036與DH00/086之間於從位置49.815至51.249之1434鹼基對區域。總共有113個核苷酸於CHG上下文存在於此區域中。對於K1036,平均甲基化程度為0.73,然而對於DH00/086,平均甲基化程度為0.03。一個實行於Microsoft Excel v15.13.1(150807)之學生T-test假設的不等方差,以沒有差異之零假設介於K1036與DH00/086之間的平均甲基化程度之間,基P(T<=t)=9,03E-61被拒絕。甲基化中之差異介於K1036及DH00/086之間,對於支架_905基因組版本2.0於鹼基49.815至51.249之間(相應於第13圖之
位置309757-308323於支架_905中)為高度顯著的。分析之結果顯示於第15圖。
由於亞硫酸氫鹽數據揭示了顯著高的CHG甲基化於K1036 GDS等位基因中,其決定從4個861BC1姊妹種中獲得亞硫酸氫鹽定序數。所有這4個姊妹種具有來自組父母親本K1036的GDS等位基因。然而,2個為高度雌雄同體(n>100漿果)而另外2個姊妹種為幾乎無法生產漿果。假設為若甲基化扮演抑制雌性抑制體基因的角色,將可以預期植物,其具有雌雄同體祖父母親本K1036之GDS等位基因且保留高度甲基化的植物將為雌雄同體,然而由於某些原因而(部分)喪失此甲基化的植物將為"去抑制",因此具有活化的雌性抑制體且變得較不雌雄同體,若非完全的雄性。植物被假設為改變其表現型從高度雌雄同體至不良雌雄同體或甚至雄性,這是由於其甲基化喪失被指定為"反突變體(revertants)"。
藉由使用引子的PCR來獲得來自亞硫酸氫鹽處理的基因組DNA之Sanger讀取片段,該引子允許亞硫酸氫鹽處理的模板之放大。對此,GDS基因序列被導入亞硫酸氫鹽引子Seeker 12S之中以製造在矽片(in silico)轉換之序列。接著,將此序列導入引子3(Untergrasser,2012)以設計並挑選引子。亞硫酸氫鹽處理的DH00/086及K1036模板之Watson及Crick序列讀取之J-Browse中的可視化表示允許了仔細挑選一相對較小的目標(100-300nt),其包括有差別的甲基化(或單一甲基化多態性;SMP’s)。選擇引子使得這些並沒有退火至SMP’s,其係因為這將產生錯配於差別的甲基化DNA目標。
引子設計為CS77及CS78(見表33),其允許使用亞硫酸氫鹽處理的模板DNA以將256nt片段放大。使用Kapa Uracil Plus作為聚合酶(從Sopachem,Ochten,The Netherlands所購買)來實行PCR,根據廠商操作步驟,使用EZ DNA Melthylate-LightningTM Kit(Zymogen Irvine,CA 92614,U.S.A)施加於亞硫酸氫鹽處理的CTAB分離了DNA(Doyle and Doyle,1990)。藉由BaseClear,Leiden,The Netherlands將PCR片段進行Sanger定序。於基因中之比對(Biomatters,Auckland,New Zealand)提供‘高品質序列部分’,其為:
在此高品質序列部分中,發現SMP脫穎而出作為”雙波峰C/T SNPs”,其位於11個位置,分別是:79,88,103,119,127,142,176,196,207,220及227,然而在許多其他位置(n=26)亞硫酸氫鹽C至T轉換已完成,故對於4個樣本顯示無雙波峰而只有胸腺嘧啶,這是表示對於所有樣本分析之成功的亞硫酸氫鹽處理。
為了定量胞嘧啶之相對含量作為其相對波峰圖高度於那些SMPs之混合的C vs T波峰圖之中,使用程式Mutation Surveyor 5.0(Softinheriteds,State College,Pasadena,U.S.A.)。導入abi文件作為”樣本文件”且導入高品質序列
FASTA作為需要的‘基因庫序列文件’於Mutation Surveyor之Open File目錄中。調整設定於Process->Settings->Others目錄,其中確認甲基化選項。在Set by User目錄中,只有CG>TG選項未選擇,接著按下‘Run’於Process下拉式選單中並按下MutationQuantifier按鈕於工具欄。量化的突變(SMPs)接著出現於電子表格,其中取得胞嘧啶之百分比於特定的SMP中並總結於表34中。
明顯地,雙重C versus T波峰揭示了單一甲基化多態性或”SMPs”,其中相較於對回复突變所觀察到的胞嘧啶波峰高度,胞嘧啶的波峰高度較高於2個雌雄同體樣本中。這代表在2個高度雌雄同體的樣本中為更加突出,相較於回复突變”,其為定性而非”全有或全無”差異。由於亞硫酸氫鹽定序因會打破目標DNA有技術上的困難,故應用其他方法來量化GDS基因中差異的甲基化。對此,對於SMP檢查序列,其與甲基化敏感/受損的限制性內切酶之辨識位置重疊。透過此程序設計了2項試驗。在第一試驗中,使用引子CN67及CP32(表3實施例1)將片段放大以覆蓋353nt基因組區域,其包括2個甲基化敏感限制酶EcoRII(CCWGG:靶向CmCTGG於正股上及CmCAGG於負股上,其中mC為目標SMP)之辨識位置於位置82-86及148-152相對於CN67 5’主要末端。在第二試驗中,使用引子CP35及CN82(表3實施例1)將片段放大以覆蓋基因組區域,其包括對於酶GsuI之單一重組位置(分別靶向CTCmCAG及mCTGGAG於正股及負股上,其中mC為目標SMP)位置184-189相對於CP35 5’主要末端。
使用sbeadex® mini plant kit(LGC Genomics GmbH,Berlin,Germany)分離之40奈米克(nano-grams)之基因組模板DNA於KingFisher 96儀器(Thermo-Scientific,Breda,The Netherlands)上進行了4小時的酶切作用,分別使用2單位的EcoRII及GsuI(Life-Technologies)於1 x標準緩衝液於15μl體積。對照DNA包括相似的培養,除此之外將酵素取代成MQ水。接著,2μl的此酵素及未經酵素處理的模板DNA分別使用於10μl PCR中於由CFX96 Real Time System所覆蓋之C1000 Touch Thermal循環機(Bio-Rad,Veenendaal,The Netherlands),設計程式為98℃ 1分鐘,40個循環之[98℃:10秒,62℃:5秒及72℃:10秒]使用PhireII(Life技術)及LC green Biofire defense(Salt Lake City,U.S.A)。
表34:胞嘧啶(C+T=100%)之百分比於11個SMP於Sanger序列讀取來自258nt PCR片段由亞硫酸氫鹽處理的基因組DNA模板所獲得。模板為由2個強壯雌雄同體(每株植物生產超過100個漿果)所獲得之303及580及由2個'反突變體'所獲得之600及606,其中一者僅生產單一漿果而另一者未生產任何漿果,儘管其K1036祖父母親本DUF247等位基因。對於正向讀取,一些SMP無法被召集因為缺乏(可靠的)信息;顯示為'nd'。於26個其他位置處,所有樣本皆完成C至T轉換(未顯示結果)。請注意,胞嘧啶百分比保留於兩者讀取中,其表示為甲基化,相較於反突變體其對於雌雄同體高得多。這指出明顯的甲基化喪失重新激活了雌性抑制體基因,其導致在反突變體之較低著果。
表35:CQ值提供一些對於性別的回交個體類型;用於分離雌雄同體(雄性雌雄同體)及雄性表現型。請注意在861BC1d族群個體中(表中較低部分),對於植物之CQ值較低,其從K1036接收了祖父母親本等位基因,且這些植物為雌雄同體,其中對於接收DH02/504等位基因的植物,可發現相反的關係。
CQ值差異(delta CQ),其為從酶切的模板的DNA減去非酶切模板DNA所獲得的CQ值,被用作測量DNA甲基化。此試驗之結果顯示於表35。結果顯示雌雄同體植物具有約為零的delta CQ值,表示高度甲基化(由於酵素無法切除提供給PCR的模板),然而反突變體具有delta CQ值,其大於零之介於1.9-7.1,表示不良的甲基化於GDS基因區域中。對於族群861BC1d,顯示具有DH02/504祖父母親本GDS等位基因之雄性植物具有大於零的delta CQ值,然而具有K1036祖父母親本GDS等位基因之雌雄同體具有接近零的delta CQ值。
這顯示此方法可以用來監控雄性植物之雌雄同體傾向,故其能夠生產漿果。此技藝人士將認識到甲基化敏感限制酶酶切作用之方法,隨後是Q-PCR為粗糙的方法且不完美。在表35給出的實例的結果表明1個雌雄同體(ID:409455)顯示對於EcoRII複製1之delta CQ為1.2(而非大約零)。此技藝人士將理解為了使用最佳化之此方法,一些複製及使用的更多目標較佳為使用一些甲基化敏感限制酶。綜上所述,相似於已在亞硫酸氫鹽定序實驗中所觀察,在Q-PCR實驗中偵測到差異的DNA甲基化,如從甲基化損壞的限制酶處理模板DNA之CQ差異所推斷,其係相對於未處理的模板DNA。對於反突變體及對於雄性,較低甲基化脫穎而出作為相對高的差異於CQ值中,其係從甲基化損壞的限制酶處理模板DNA相對於用於PCR之未處理的模板DNA所獲得。此差別的甲基化明確且穩定地分離於回交族群861Bc1d中。K1036之GDS祖父母親本等位基因之甲基化顯示為不穩定於其他譜系中,其與也是不穩定的雌雄同體表現型具有一致性。微衛星標記分析,使用多於5個高度變異的基因座,證明了那些不穩定的植物或反突變體為真正屬於那些譜系之植物(結果未顯示)。
越來越多的科學論文報導基因及基因組的甲基化及表觀等位基因的遺傳(e.g.Ji et al.,2015;Greaves et al.,2014,Zhang et al.,2013)。在植物DNA中,甲基化分離於3個不同的上下文中:CG,CHG及CHH(其中H=A,T或C)。在所有三種上下文之基因組甲基化的區域常常會導致在目標區域及某些情況下在鄰近的區域中沉默(見參考文獻於Ji et al.,2015)。許多沉默基因具有較低的表現,因為啟動子甲基化從重複序列(或複製)擴散至基因(cmWIP1,booster1,BSN,FOLT1;見Ji et al 2015)中。還有一些實施例,其中外顯子之甲基化,而不是啟動子中,導致較低的表現。最早的實施例之一發現阿拉伯芥中SUPERMAN基因之所謂的clark kent(clk)等位基因。SUPERMAN為當被基因突變剔除時造成較高數量花藥之基因,其中發現等位基因形式提供相同的表現型,但揭示其與野生型之間沒有核酸差異。然而,亞硫酸氫鹽定序揭示了那些(clk)表現型,沒有胞嘧啶甲基化在野生型或在sup'無意義'等位基因(sup-1)中,而大量的甲基化在所有上下文中發現於clk等位基因,其覆蓋轉錄的起始子及大部分轉錄區域。有趣的是,也觀察到反突變體及較強及較弱的clk等位基因,其相關於DNA甲基化。表現型反轉與野生型RNA表現之復原及SUPERMAN基因DNA的胞嘧啶甲基化之降低兩者相關。
此技藝人士將理解本文證明了於蘆筍GDS基因作觀察到的甲基化及與降低的甲基化相關之反突變體現象,反映出找到SUPERMAN的情況。由於技術上的原因結合GDS基因之低野生型表現,似乎不可能明確地確定是否GDS基因甲基
化會造成較低表現或替代的定序。此技藝人士將理解這種關係很有可能,且基因捕捉技術其次為RNAseq研究,採樣特定組織或發育階段將有可能確認雌雄同體表現型與GDS基因甲基化之間的關係及降低的表現水平或剪接。
本實施例報導雌雄同體之後生控制於許多K1036及其衍生的後代中。其揭露了GDS基因的甲基化提供獲得雌雄同體植物的方法。本實施例也證明了允許偵測甲基化的方法,例如但不限於亞硫酸氫鹽定序(部分)GDS基因或經甲基化受損的限制酶之使用,其靶向GDS基因,可以用於診斷以預測植物是否具有變成或保持雌雄同體的傾向。
此技藝人士將認識到有很多允許偵測DNA甲基化的方法,例如但不限於由Shen & Waterland,2007所綜述的方法且任何這樣的方法可以用於本發明中。
此技藝人士亦將認識到藉由增加或降低來影響GDS之DNA甲基化,將造成於基因表現及/或剪接之改變,其將降低或增加雌性抑制作用。在本實施例中,甲基化局限於轉錄區域,但此技藝人士亦將理解引導子或其他接近基因的順式調控元件可造成降低的表現或替代的剪接,因此可造成降低的雌性抑制作用。在所有上下文中,可以藉由病毒誘導的基因靜默來建立甲基化,且部分此甲基化即使在病毒被消滅後還可以存留(例如見Dalakouras et al.,2012)。
其他建立基因甲基化的方法由Zhang & Hsieh(2013)提出,其說明透過基因座特定後生操作的作物改良,透過基於TALE或CRISPR之基因組編輯技術,變得越來越可行。
最近,目標甲基化已達到降低基因之表現,其表現於人類癌症的許多形式(Nunna et al.,2014),藉由靶向基因啟動子之甲基化。這些作者使用基因工程的Zinc Finger,其專一地結合至基因啟動子,其已融合至DNA甲基轉移酶的催化域。此技藝人士將理解,任何提供催化基團的技術,其傳遞靜默信號加上目標部分,其確認催化基團的專一結合以定義基因組靶可允許目標甲基化。該技術可於不久的將來被開發。甲基轉移酶較佳為增進DUF247基因之編碼區域的CHG甲基化,而非Nunna et al.所使用之Dnmt3a甲基轉移酶。可藉由靶向組蛋白修飾以達成相似的超甲基化效果。涉及非CG甲基化之基因的實施例在Stroud et al(2014)中進行了綜述。本實施例教示了甲基化於所有上下文中,但值得注意的是,DUF247基因之外顯子及內含子CHG甲基化將造成雌性化作用。
組氨酸至谷氨酸突變於GDS基因之第二預測外顯子中
品種K5756為全雄性雜交品種,其為選殖雌性植物之間的雜交;169F1-85V及雙單倍體雄性植物;DH05/128。由於後者在其他條件下不會生產漿果,選擇其雙單倍體作為親本植物。
此雜交的第一年植物首次種植於苗圃場中,此後樹冠被重植於雜交評估田野中。
有個很小的機率,當樹冠在移植前套袋時,其可被分成2個樹冠。
將雜交K5756試驗於每20株植物的4重複樣區中。當評估時,於相同樣區中2株不同的植物為完全的漿果,而於任何4個樣區中的此雜交之所有其他個體不帶有任何漿果,且那些漿果包括可存活的種子。在季末之檢測的時刻,一些盛開的花朵仍存在於2株帶有漿果的植物上,其顯示殘餘的花藥及大花瓣,這證實了其明顯的雌蕊及雄蕊,因此真正為雌雄同體性。從2株植物中採收漿果,其總共提供了1016個種子。蕨類係取自2株雌雄同體及相同雜交之對照植物。使用引組合CN82/CN67,CN59/CN70,CN69/CN81,將由2株雌雄同體所獲得的模板DNA進行Sanger定序於正向及反向兩者。從兩者引子對CN59/CN70,CN69/CN81所獲得之序列讀取揭露了相似的胞嘧啶至精氨酸易位(transversion)。此易位干擾了共3個HphI酶切位點中之第2個HphI酶切位點(在此情況下為5-^(N)7TCACC-3),存在於CN69/CN70 PCR片段,因此片段可用於診斷中。此診斷類型實行於2個雌雄同體及從田野取得之雄性對照樣本。此分析通常稱為CAPS標記分析,證實了特定易位對於2株雌雄同體植物為獨一無二的。
使用7個專有的高度變異基因座之微衛星分析顯示2株雌雄同體具有相同的基因型,其不同於對照樣本。然而,於雌雄同體及雄性植物中所觀察到的等位基因皆證實了這些是屬於相同的雜交。綜上所述,在所有雄性雜交5756中,發現突變於M連鎖的GDS基因中於2個雌雄同體選殖複製中。此殖株僅提供發現於此雜交之雌雄同體樣本。特定突變將組氨酸(H)之位於第三密碼子位置之胞嘧啶(於SEQ ID NO:1之位置
684)改變為腺嘌呤,提供密碼子給谷氨酰胺(Q);因此CAC>CAA。
在包含雌性抑制體基因之GDS域之第二預測外顯子中,將脯胺酸改變成蘇胺酸的突變創造出雌雄同體
品種K4381為全雄性雜交品種,其為雌性雙單倍體DH366/1與雄性雙單倍體DH02/047之間的雜交種,其中每一株都是由花藥培養得到。DH02/047在其他條件中選擇作為此雜交的親本植物,這是因為它沒有生產漿果。對於由DH02/047試驗所製成之超過190個基因上不同的雜交種,在我們的育種數據庫中沒有著果的報告。此類雙單倍體×雙單倍體雜交作為K4381之個體為基因上相同。
品種K4381生長於4X20植物(故為n=80株植物)田野試驗。在這80株植物中,鑑定出完全雌雄同體的單一植物。此單一植物生產數百個漿果,包括可存活的種子,然而所有其他個體沒有生產任何漿果。分析此雌雄同體非正常型植物之微衛星標記,顯示了其完全相同於此特定K4381品種的參考個體(結果未顯示)。綜上所述,此雌雄同體個體並非本試驗中遺傳雜質的結果。為了找出GDS基因中的突變是否產生K4381雌雄同體植物,使用引子對CN82/CN67,CN59/CN70,CN69/CN81由此K4381雌雄同體植物中獲得序列。這些引子涵蓋GDS基因之第一預測外顯子、預測內含子1及第二預測外顯子。
相較於參考基因組,發現了之前已鑑定之多態性。此多態性包括7個胸腺嘧啶之延伸而非6個,接近預測內含子1受體位置其發現於支架905(基因組版本2.0)位置50,941-50,946,其亦發現於相似的單倍型中,例如於超雄性12_25、雌雄同體5375、所有雄性雜交K323及雌雄同體突變K323-G033。更重要的是,發現單一核苷酸多態性(SNP),其中相較於所有目前已知且定序的單倍型,雌雄同體個體K4381是獨一無二的。此SNP為第一預測外顯子中,胞嘧啶至腺嘌呤之改變,其相應於SEQ ID NO:1之位置166,這導致脯胺酸改變成蘇胺酸胺基酸於SEQ ID NO:2之位置56。
此特定突變是作為非極性氨基酸改變為極性氨基酸的非保留取代。本實施例教示了GDS基因中此特定胺基酸取代顯然足以將雄性改變成雌雄同體植物,其較其雄性祖先生產了更多的漿果。
營養層發育及功能1缺陷(Defective in Tapetal development and function 1)之蘆筍同源物為雄性活化體基因
為了分離雄性啟動子基因,藉由實行生物奈米基因組圖譜(Bionano Genomics)進一步調查M-基因座區。藉由此方法,將DNA序列基因組支架(包括由性連鎖標記標籤之支架)比對至BioNano重疊群,及1個可能跨越M-基因座的重疊群。鑑定新的基因組定支架,且於部分基因組中那些支架其中之一
上,其中雌性讀取並未定位至雄性參考基因組,鑑定出同源於As-TDF1的候選基因。
雄性中存在TDF1的半合子,其缺失突變之表現型及表現之研究及基因組讀取,其定位於與成員基因同源的天門冬屬基因,預期將作用於路徑下游AS-TDF,這指出AS-TDF1為雄性刺激子基因。
將蘆筍基因型DH00/086及DH00/094之高分子量基因組DNA分離出來。Leebens-Mack laboratory University of Georgia at Athens所使用之DH00/086為超雄性以創造蘆筍之參考基因組。DH00/為來自相同雜交之組織培養中所獲得之雌性雙單倍體,其中產生了雙重雜交雄性DH00/86(Limgroup BV,Horst,The Netherlands)。對此,清洗新鮮葉片於10mL TEN緩衝液中(10mM Tris,10mM EDTA,100mM NaCl,pH7.5)且固定於新鮮配製的TEN/2%甲醛溶液中。將葉片切碎成小片並培養於15mL隔離緩衝液中(IB:15mM Tris,10mM EDTA,130mM KCl,20mM NaCl,8%(m/V)PVP10,pH9.4)包含+0.1% Triton X-100以釋出細胞核。藉由密度梯度離心在20mL之75% Percoll於IB/0.1% Triton X-100中以2000RPM下20分鐘純化細胞核。將所得穩定化的勻質物嵌入瓊脂糖凝膠基質中,藉由溫和攪拌與IB/1.5%低溶點瓊脂糖凝膠混合於60℃,接著倒出混合物於預冷的瓊脂糖凝膠栓塞鑄型(Bio-Rad,Hercules CA,USA)在冰上10分鐘。收集220μL栓塞於溶解緩衝液中(1%肌氨酸,0.25M EDTA pH 8.0及0.2mg/ml蛋白質水解酶K)於50℃下一天隨著溶解緩衝液的一個改變。在徹底清洗於TE緩
衝液之後,藉由溫和融化於60℃及GELaseTM(Epicentre,Madison,WI,USA)處理以復原HMW DNA,上述GELaseTM處理係每個栓塞使用3單位的GelaseTM 10-20分鐘。藉由降透析於定量CHEF電泳之前(CHEF-DRII系統,Bio-Rad,Hercules,CA,USA),進一步清洗高分子量(HMW)DNA。平均來說,每栓塞得到3-4μg HMW DNA。HMW DNA內部處理於生物奈米基因組實驗室(BioNano Genomics,Inc.,San Diego,CA,USA)創造基因組圖譜,即天門冬屬雄性及雌性基因組之遠程物理圖譜(由Brown,2002所綜述),使用其專有的Irys技術管道。Irys技術涉及了以熒光染劑(IrysPrep®)標籤HMW DNA,奈米通道(IrysChip®)中單分子的移動,藉由CCD照相機(Irys儀器)掃描染劑之分子位置及從頭測序組合及基因組圖譜重疊群的可視化(Irysview Software®,Shelton et al.,2015)。
簡單來說,根據IrysPrep®方法中的實驗流程標記8μg之HMW DNA。以內切核酸酶Nt.BspQI使HMW DNA具有缺口於GCTCTTCN/N(New England Biolabs,NEB,Ipswich,MA,USA)。以Alexa546-dUTP(Thermo Fisher Scientific,Waltham,MA,USA)及Taq DNA聚合酶(NEB)標記有缺口的DNA。在標記之後,藉由加入dNTP及T4 DNA連接酶(NEB)將DNA連接。將標記的DNA樣本吸取到各個IrysChip®於兩者流通槽中。所述Irys儀器控制DNA在流通槽電泳架的移動。使用Alexa546的綠雷射將線性分子成像。CCD照相機,連接專有的自動聚焦機構及控制軟體,快速地掃描芯片。接著,標籤(Alexa546)沿著每個分子的位置分別進行檢測,並使用
Irysview Software®組進行分析。首先,標記的長DNA分子的原始影像數據被轉換為模體專一的標籤圖案之數字表示。接著,藉由對相似於彼此的所有分子評分及藉由R-package Fastcluster(Daniel Müllner,2013)來聚集單分子Nt.BspQI數據。從集群中繪製標籤的位置。最後,使用InterView®數據分析軟體從頭測序地將數據組合,以重新創建蘆筍基因型DH00/086及DH00/094之原始基因組的整個基因組共通圖譜。對於蘆筍基因型DH00/086(雄性),收集了88Gb(79X)的數據(分子>150kb)。由此產生的生物奈米基因組共通組合尺寸為1.205Gb包含1364重疊群。數據之重疊群組合展現1,24Mb之重疊群N50。重疊群數據庫稱為BNG V1.0且個別的重疊群作為前綴<BNG>數字。
使用Irysview Software®包裝,將由NGS(AGS V1.10)所獲得之天門冬屬的支架參考基因組連鎖至BNG V1.0重疊群。藉由將透過PacBio RS II定序(Pacific Biosciences,CA,USA)所獲得的長序列讀取比對至AGS V1.10支架來升級第一AGS V1.10,其係使用算法及稱為BPJelly之相關的軟體工具(English et al.,2012)。PBJelly是一個高度自動化的管道,其比對長序列於FASTA格式以設計組合。PBJelly填滿或減少捕獲的缺口(N延伸於AGS V1.10)以生產升級的基因組草圖。簡單來說,如前所述,將蘆筍基因型DH00/086及DH00/094之高分子量(HMW)基因組DNA分離出來,並根據廠商指示(Pacific Biosciences,CA,USA),將其用作輸入於PacBio SMRTbell基因庫準備。將準備好的基因庫尺寸篩選為>20Kb片段,其係使
用BluePippin System於HMW DNA(Sage Science,MA,USA)之目標尺寸篩選。產生接近6.07Gb的長讀取定序數據,相應於蘆筍基因組之4.6X覆蓋度。第16圖顯示PacBio實驗之觀察到的長度分布。PBJelly運行於北京基因組機構(BGI,Shenzhen,China)。由此產生的參考基因組被稱為天門冬屬基因組支架V2.0(AGS V2.0)及個別的支架作為前綴<AsOf_V2.0_支架>數字。將註釋詮釋資料儲存為個別文件於基於AGS V2.0的關係數據庫。
將AGS V2.0支架大於20Kb(5198 AGS V2.0支架代表1,113Mb)用於定位至BNG V1.0重疊群,其係藉由偵測切口核酸內切酶Nt.BspQI的辨識序列於GCTCTTCN/N位置在矽中(in silico)。將由此產生的AGS V2.0支架(Query_id)之物理圖譜比對至BNG V1.0物理圖譜(Anchor_id),以嚴格的標準設定使用Irysview Software®包裝。此軟體創造了Anchor_ids及Query_ids之配對(Matches)(Match_ids)。總共,將2725個AGS V2.0支架(52%)比對至BNG V1.0重疊群代表875Mb(79%)。將由此產生的對比圖(cmap)儲存為Asparagus.V2.0.genome.stable_BspQI_res29_to_20150505_asparagus_UGA_Assemble_Molecules.xmap且可透過強調數據於比較圖模式使用Irysview Software®包裝來查看。在此環境之中,可將cmap的一些方面可視化及配對表對於每個單獨的Match_id列示相應於Anchor_id,Anchor起始,AnchorEnd,Anchor尺寸,Query_id,Query起始,QueryEnd及關於Anchor的Query_id之Orientation皆包括在內。
表61總結了對於蘆筍基因型DH00/086(雄性)V2.0支架之對照圖的結果,使用遺傳標記信息來偵測,例如:表3之HRM標記及物理信息(BAC選殖;結果未顯示)。第一欄顯示用於比較之ASG V2.0支架,其係基於遺傳標記信息於第三欄中(性連鎖)並相應於生物奈米(BioNano)V1.0重疊群。偵測到總共8個相應的生物奈米重疊群(BNG7,BNG22,BNG28,BNG55,BNG438,BNG833,BNG1030 and BNG1138),且藉由檢查列示的BNG重疊群之缺口數據來建立,這些重疊群之間沒有物理重疊。這些數據(表61)強力指出所有8個重疊群群集於染色體區域覆蓋了蘆筍的M-基因座。對所有8個重疊群檢查其對齊的AGS V2.0支架之序列內容及其BNG V1.0及AGS V2.0 cmaps之間的共線性。
BNG28為長度3.45Mb及cmap顯示線性對於含有GDS的AsOf_V2.0_支架905以及性連鎖的AsOf_V2.0_支架206,AsOf_V2.0_支架945,AsOf_V2.0_支架1194,AsOf_V2.0_支架1204,AsOf_V2.0_支架1539及AsOf_V2.0_支架2312(第17圖,表3)。之前已經證明這些支架的性連鎖,其係使用分子標記於群集以分離性別(未顯示結果)。用以測試那些支架的性連鎖標記列示於表3。此外,4個支架,AsOf_V2.0_支架436,AsOf_V2.0_支架2510,AsOf_V2.0_支架3294及AsOf_V2.0_支架3779配對BNG28且以前並未鑑定(標記為‘新的’於表61之第三欄)。BNG28的cmap及表示為11之AGS V2.0支架揭示了支架的線性順序於BNG28,支架的方向及5個支架的嵌合性。嵌合性定義為一個或更多個序列組合在
蘆筍V1.10及V2.0的支架之接合,其未反映出用於下代定序及基因組組合(Next Generation Sequencing and Genome Assembly)之原始的基因組DNA序列。結果,發現AsOf_V2.0_支架206,AsOf_V2.0_支架436,AsOf_V2.0_支架945,AsOf_V2.0_支架1204及AsOf_V2.0_支架2312為嵌合體。這是藉由在JBrowse環境中(JBrowse 1.1.16,Skinner et al.,2009,.)DH00/094重新定序數據之雌性讀取存在(非MSY)或不存在(MSY)以確認。MSY係指Y染色體之雄性專一區域,其係來自人類遺傳所採取的用語(但亦適用於雌雄異株植物,例如木瓜;見Yu et al 2009)旨在闡明基因組片段為雄性專一,也就是說,從定序的雌性所獲得的讀取將不會顯示,因此缺乏定位至雄性參考基因組之此區域的讀取。
剩下的7個AGS V2.0支架於表61為已知的性連鎖,其配對至cmap而非BNG28,亦檢查其嵌合性及在這些支架中遺傳標記序列的位置。從這7個支架中,發現AsOf_V2.0_支架997及AsOf_V2.0_支架1166為嵌合體。取出這些支架之未配對的序列,並用於新的定位至BNG V1.0重疊群,基本上如所描述之AGS V2.0支架代表1,113Mb。結果,AsOf_V2.0_支架997 Region=1..140,022,其並未配對至BNG222且包含性連鎖標記(未顯示數據)定位至BNG28於位置1,093,801..1,169,913重疊於AsOf_V2.0_支架436之非共線區域。將AsOf_V2.0_支架1166之未配對序列比對至BNG37。
嚴格地與BNG28共線之所有AGS V2.0 cmap區域被取出並用於AUGUSTUS基因預測(Hoff et al.,2013)或是人
工檢查於JBrowse環境。將轉譯的註釋用作Query於比對軟體BLASTP程式Blast2.3.0使用數據庫:Genbank CDS轉譯之非冗餘蛋白質序列(nr)加上蛋白質序列於數據庫PDB,Swissprot,PIR及PRF排除來自WGS項目(ncbi.nlm.org updated Oct 2015 version 210)之環境樣本。序列限制於Viridiplantae[ORGN]包括低複雜性過濾器。所有其它設定為預設。將由此所得之BLAST分數過濾(e-values<1E-40)並手動製造錯誤註釋及確認雌性DH00/094e之讀取覆蓋於J-Browse旁邊的DUF247基因模型,證明是參與了雌性抑制作用,此時指定為GDS基因,2個其它基因模型被發現可參與雄性、雌性及雌雄同體之花朵發育:PREDICTED:脂質轉移蛋白質(LIPID TRANSFER PROTEI1)(LTP1)基因模型At2G38540於阿拉伯芥(Arabidopsis thaliana)中AsOf_V2.0_支架905上及PREDICTED:轉錄因子MYB34[Phoenix dactylifera]於部分AsOf_V2.0_支架436上,其與BNG28共平面Region=380,000..496,167。LTP1基因圖譜於BNG28~280Kb之線性順序遠離DUF247基因模型,此時指定為GDS基因,且遺傳圖譜實驗其使用介於這2個基因模型之間的信息標記顯示出LTP1並非完全地性別連鎖(Limseeds BV,Horst,The Netherlands)。MYB34相關的基因模型為~600Kb鄰近DUF247基因模型此時指定為GDS基因。進一步調查MYB34相關的基因模型由於一些研究指出MYB-class轉錄因子為關鍵調控子於路徑中,其涉及發育過程及一般壓力反應。MYB33,MYB35,MYB65及MYB103為轉錄因子作用於基因調控網絡,其涉及
雄器發育之後期,更確切地,將該階段描述為營養層發育於早期小孢子母細胞發育中(Jun Zhu et al.,2008,Harkess et al.,2015,Ci-Feng Cai et al.,2015)。使用一些基因專一的引子透過Sanger定序來檢查MYB34相關的基因模型,且可藉由使用RNA-Seq數據之缺口的從頭測序組合來填滿1個N延伸。從組合中丟棄一個反向重複。重建的MYB34相關基因模型具有3個內含子(第18圖)且編碼為31Kdal之276 AA蛋白質(第19圖)。當重複使用作為Query於BLASTP,其使用所有非冗餘Genbank CDS轉譯之數據庫,使用SmartBlast選項。SmartBlast選項於NCBI Blast環境中回報最佳配對的簡明摘要於序列數據庫中,加上2個來自充分研究的參考物種之最佳配對,顯示基於多重序列比對及保存的蛋白質域之phylo遺傳關係。使用SmartBlast於標準設定中,輸出為:分生組織發育及功能1缺陷(DEFECTIVE IN MERISTEM DEVELOPMENT AND FUNCTION 1)(擬南芥),PREDICTED:myb相關的蛋白質308(鷹嘴豆),PREDICTED:轉錄因子類MYB35(大豆),PREDICTED:轉錄因子MYB76(蓮),PREDICTED:轉錄因子MYB34(椰棗)。阿拉伯芥之:分生組織發育及功能1缺陷基因(DEFECTIVE IN MERISTEM DEVELOPMENT AND FUNCTION 1)係屬於MYB35-子類其含有MYB的基因家族,且特徵為2個DNA結合的SANT超家族域(亦稱為R2R3子類)。結合為取決於重複之序列,其包括富含G/C的模體[C2-3A(CA)1-6]。該域被嚴格地發現於植物界中作為部分調控轉錄抑制複合體,其中它結合(綜述於Jin及Martin,1999).阿拉伯芥的營養層發育及功能缺陷1基
因基於選殖而被定位,其係藉由使用單一突變品系及由其所衍生之圖譜群集(Jun Zhu,2008),且重新命名為營養層發育及功能1缺陷(ATH TDF1),描述其對於阿拉伯芥中抱子成熟之必要的角色於花藥發育及營養層功能中。蘆筍類MYB34基因用於Query也屬於轉錄因子之MYB35類別且共享高度序列相似度於具有ATH TDF1的SANT超家族域中。因此,類MYB34基因模型重新命名為AsOf類TDF1。在AsOf類TDF1中的SANT超家族域發現兩次於殘基16(H)-60(Y)及76(F)-K(151)處。MYB35相關的蛋白質之成員為~300-350個胺基酸,而AsOf類TDF1具有276個胺基酸;蛋白質具有高相似度於N端SANT超家族域組織且序列相似度較低朝向蛋白質的C末端。當ATH TDF1蛋白質序列被拿來做為Query於AGS V2.0數據庫時,tBLASTN輸出具有2個明顯的命中:AsOf_V2.0_支架436旁邊及AsOf_V2.0_支架1220,後者具有較低相似度於高度保存的第一SANT超家族域(78%對比52%,見第20圖)。
為了找出是否可獲得雄性不育植物,故缺乏功能性TDF1基因,實行重新的輻射實驗。
種子批中3株不同的全雄性雜交,特別指K1150,K323及K1129,所有這些都源自於雙單倍體之間的雜交,因此,其每粒種子很多會產生基因上相似的個體,經受300灰度(n=11,00粒種子)及600灰度(n=13,000粒種子)的輻射劑量,其係來自實施例2所解釋之鈷60來源。這些雜交種的父本植物挑選於其他條件中,這是因為這些幾乎無法生產漿果。K1129以前有一次偶然生產了少數漿果於某一年在總共6個試
驗之其中1試驗,而並沒有進一步調查這些植物,K323及K1150從未在多重試驗中生產漿果。
從這些種子培育出的植物生長於育苗盤中,植物最後轉移至鄰近特魯希略(祕魯)的田野中。挑選出特定的雜交,由於這些雜交沒有傾向於自發地生產漿果,如同它們先前多年來的評估期間所建立。因此,任何生產於植物上的漿果因而可表示為突變,其造成生產漿果的這種能力。從24,000粒種子中所獲得成功度過輻射處理的6,680株植物,在植物生長的10個月之後檢查其著果,其中在4個月之後蕨類被切斷以獲得重新的開花及/或著果,我們當地的助手在6-8周後(Nov-Dec 2015)觀察到三次。多數的那些植物植物係源自於300灰度劑量,至於600灰度劑量僅有1492株植物,其係來自成功度過輻射處理的13,000粒種子。16株植物被發現能夠從至少其分支之一生產漿果。每株植物所形成之漿果數量為1至174個漿果。然而,由於植物深受柑橘癭蚊(citrus gall midge)Prodiplosis longifila Gagné感染,這已對漿果造成損害並導致果實不發育,發現於植物上之漿果的數量不能被解釋為雌性生育率的定量測量。綜上所述,存在大於1個漿果為雌性生育率的定量指標。能夠生產漿果(K1150-600-1)的16株植物之一具有2朵雌性花朵。在第二莖嫩芽中,K1150-600-1及K323-600A6兩者之沖洗照片可被取出,但第三植物沒有顯示缺失(K1150-300-12),在切除蕨類後並未保持其生長,但其中F1植物目前生長於我們的溫室中以進一步分析。
能夠生產漿果的植物之模板DNA及無漿果生產之雄性對照植物的一些DNA被用於高解析融化曲線分析(基本上使用描述於Gady et al.,2009的指南來實行),使用引子對CP31/CP32,CP33/CP34,CP35/CP36,CP37/CP38,CP39CP40,CP41/CN72靶向DUF247其含有M基因座連鎖的雌性抑制體基因或GDS基因。這些引子列示於表3。分析片段之融化曲線差異,其指示為突變於M-基因座連鎖的雌蕊發育抑制體(GDS)基因。看起來片段不可被放大或產生融化曲線形狀,其看起來非常不同於所分析之16株植物其中之3株之野生形融化曲線。這指出正宗DUF247之放大所需的模板,其包括雌蕊發育(GDS)之M-基因座連鎖的抑制體基因,缺乏於3株植物中。為了確認此假設的基因組DNA被定序,其對K1150-600-1,K323-600A6及K1150-300-11使用大規模平行定序,其係根據揭示於實施例2之方法。定位讀取,特別是於半合子M基因座區域中,使用J-Browse檢查指出雌性讀取之缺乏如同在天生雌性中(見第23圖)。在區域位於半合子M-基因座兩側,觀察到異型接合喪失,其中缺失與染色體之異形接合部分重疊。所創造的缺失之正確邊界之測定為待定中。
由於雌性植物亦應為天生缺乏M-基因座連鎖的雌蕊發育抑制體基因GDS,其可能自發地發生於種子批中,其機會非常小(但不容忽視的),分析植物之遺傳純度。由那些個體植物中獲得的模板DNA經受微衛星分析,其使用14個專有的微衛星標記(相較於設計,使用及辨別力如Caruso et al.,2008所概述;事實上,AO110為它們的標記CV291890)及7
個專有的高解析融化曲線SNP標記,這顯示16分之14株植物能夠漿果著果,當然這些都屬於雜交種的正宗代表。兩株其他植物顯示偏離的微衛星基因型。那些植物之一植物顯示不同的等位基因於所有14個微衛星基因座及5個SNP標記基因座,且由於這肯定不是雜交種的正宗成員。另一株植物顯示所有微衛星等位基因預期為特定雜交,其中有一值得注意的例外,其為父系等位基因對於AO022微衛星標記之缺乏,已知為連鎖至M基因座區域。性連鎖基因座AO022之父系等位基因的典型單一喪失應為染色體片段喪失之指示,其必須已喪失作為鈷60輻射的結果。此片段,至少對於特定植物,必須涵蓋上升M-基因座連鎖的雌蕊發育抑制體(GDS)基因與微衛星標記基因座AO022之間的區域。
微衛星分析之概觀用以確認該突變的真實性,且其對照雜交顯示於第21圖。
所有缺乏GDS基因片段的植物進一步受到標記靶向的基因組支架,其已知為位於基因上接近或位於M-基因座區域中。這些引子對為:CK63/64,CM45/46,CN96/97,CM98/99,CQ31/32,CT13/14,CE40/41及CE64/CE66(見表3)。第17圖顯示支架(或支架部分)之概觀,其可定位於M-基因座區域中。取決於標記是否提供有用信息,其指出染色體片段之額外部分,故除了已被發現為缺乏之雌蕊發育抑制體基因之外,更缺乏於能夠生產漿果的輻射植物。
看起來突變事件使其能夠生產漿果的3株植物缺乏染色體片段,其位於GDS基因發育及營養層發育及功能1
缺陷(TDF1)兩者上。如之前指出:對這3株植物中之其中2株之花朵進行檢查,且證明為雌性型,故其具有完全發育的雌蕊之花朵但更缺乏花藥。這提供了證據,雄性植物可以轉換成雌性植物,其係藉由切除其GDS基因及雄性刺激子兩者或蘆筍中營養層發育缺陷基因(AS-TDF1)。此技藝人士將理解相反的效果,其包括導入此兩者基因於雌性植物之中,將有可能導致雄性植物。此技藝人士亦將理解僅藉由導入營養層發育及功能1缺陷基因(TDF1),於是亦沒有包括DUF247域,其包括雌蕊發育之M-基因座連鎖的抑制體基因,於雌性植物之中將改變雌性植物成雌雄同體植物。
另一證據之獨立且強的品系其支持TDF1基因作為是雄性刺激子為基因表現之分析於所有基因展示性連鎖中。使用雙單倍體圖譜群集之72個體來建構~3.2百萬SNP遺傳圖譜,以界定抑制重組之區域於Y上,其包括370座註釋的基因模型。藉由對所有370個基因計算標準化的基因表現值於抑制重組之區域(M-基因座區域),我們首先鑑定11個基因,其具有表現值<1 FPKM於至少四分之三的XX雌性基因庫中,合理的切斷以確定基因為未表現的。這11個之中,我們鑑定了伽馬-輻射的DUF247雌性抑制基因,及10個假定的雄性促進候選基因。候選者首先客觀地刪減,其係基於1)雌性基因庫中的表現,2)存在重複的基因於體染色體上,3)不良基因註釋(即錯誤註釋的反轉錄轉座子),4)基因表現及剔除模型系統中之表現型。從Harkess et al.(2015)的研究中,只有4個雄性及超雄性基因庫(89株雄性,9株雄性,89株超雄性,103株雄性)
富含雄性生殖基因表現,可能為於育種品系之間生殖發育變異的結果。這4個基因庫顯示與10分之3的假定候選者一致的正調控,脂質轉移蛋白質(DIR1),營養層異型增生功能1(Tapetum Dysfunction 1;TDF1),及外果膠酶(Exopolygalacturonase)蛋白質。LTP1基因被發現已重組於育種族群(CN94/CN95-HRM;;引子見表3)。外果膠酶僅鬆散的相關於花藥活性,且為天門冬屬中多重基因家族之成員,允許了由於基因複製之間的高相似性而錯位RNAseq讀取的可能性。另一方面,TDF1基因為單一複製於天門冬屬基因組中,且只存在於Y上抑制的重組之此區域。
事實上,AsOf類TDF1限於雄性蘆筍,故不存在於雌性蘆筍中,為單一複製基因模型基因,在接近雌性抑制體基因周圍,稱之為來自AsOf_V2.0_支架905的DUF247,其透過一些DNA-標記以基因上側接(例如CE64/CE66-HRM;表3),且高水平表現於雄性及超雄性中,這擁有強力的證據證明AsOf類TDF1為雄性-促進基因,正如2基因模型所預測為性染色體的起源(Charlesworth & Charlesworth,1979)。
基因稱為AsOf TDF1。
營養層(tapetum)發育的遺傳路徑大致上保留,給出阿拉伯芥及水稻(Oryza sativa)之間的相似性(Cai et al.,2015,及本文參考文獻)。這是在兩者花藥發育之關鍵事件的情況下,例如孢子體壁分化,營養層特殊化,減數分裂和花粉成熟,以及以及用於這些過程的關鍵調控子。於阿拉伯芥及稻米(rice)中,鑑定出對於營養層發育及功能為必要的轉錄因子(TFs)。
在阿拉伯芥中,這些包括bHLH家族成員、功能性缺陷營養層(DYSFUNCTIONAL TAPETUM;DYT1)及異常終止孢子(AMS),R2R3 MYB TFs營養層發育及功能1缺陷(TDF1)及MS188/MYB0及PHD-指蛋白質雄性不育(MS1)。對於這些TF的稻米同源物包括未發育的營養層(UNDEVELOPED TAPETUM;UDT1)、營養層退化發育遲緩(TDR1)、OsTDF1,OSMYB103/OsMYB80及持久性營養層細胞1(PTC1)。這些調控子形成遺傳路徑DYT1/UDT1→TDF1/OsTDF1→AMS/TDR→MS188/OsMS188→MS1/PTC1。其中TDR與2個其它bHLH家族成員(bHLH142及EAT1見Cai et al.,2015)進行反應。在阿拉伯芥及稻米兩者中,DYT1/UDT調控對於所有下游基因之花粉壁發育的基因表現,主要透過TDF1/OsTDF1。利用基因表現數據支持AsOf TDF1作為雄性啟動子於天門冬屬中進行了證據之2線路:正向遺傳方法,其中分析所有展現性連鎖的基因,及反向遺傳遺傳方法,其中所提及之保留的遺傳路徑用以分析阿拉伯芥及水道中關鍵調控子之天門冬屬同源物的表現。
第一方法中(描述於Harkess et al.,2015),使用72個蘆筍個體以建立~3.2百萬單一核苷酸多態性(SNP)遺傳圖譜,DH圖譜族群(Limgroup,Horst,The Netherlands)界定了抑制重組的區域於性染色體的Y專一區域上,其包括370註釋的基因模型。藉由對所有370個基因計算標準化的基因表現值於抑制重組的此區域中,11個基因並未表現於DH雌性品系中;DUF247雌性抑制基因(SGD基因相同於SEQ ID:NO1及SED
NO3),及10個假定雄性促進候選基因。候選者首先客觀地刪減基於體染色體上重複基因的存在,不良基因註釋(即錯誤註釋的反轉錄轉座子)及基因表現及剔除表現型於阿拉伯芥及水稻中。Harkess et al.(2015)描述只有4株雄性及超雄性樣本用於RNA-Seq實驗(89株雄性,9株雄性,89株超雄性,103株雄性)顯示差異的雄性生殖基因表現,可能為於育種品系之間生殖發育變異的結果。此結果顯示與10分之3的假定候選者一致的正調控,其為脂質轉移蛋白質蛋白質DIR1 LTP1、AsOf TDF1(SEQ ID NO:4)及外果膠酶蛋白質之天門冬屬同源物。外果膠酶僅鬆散的相關於花藥活性,且為天門冬屬中多重基因家族之成員,允許了由於基因複製之間的高相似性而錯位RNAseq讀取的可能性。這些結果指出AsOf TDF1參與了雄性專一的基因表現。
第二方法使用阿拉伯芥及水稻序列,其係於保留的遺傳路徑中對於營養層發育之關鍵調控,以分析候選同源基因模型於天門冬屬基因組支架V2.0(AGS V2.0)及註釋資料中。對此,以關鍵調控子的蛋白質序列使用tBLASTN,其作為Query於AGS V2.0及RNA-Seq三位一體從頭測序組合之BLAST數據庫中。檢查具有顯著相似性分數之回傳的序列並藉由標準設定的BLASTP評估,以候選者之轉譯作為Query於阿拉伯芥及水稻之NCBI非冗餘蛋白質數據庫中。
對於DYT1/UDT1非顯著tBLASTN命中發現於AGS V2.0及1個相關的命中於三位一體(Trinity)組合中:
comp64619_c4_seq3之847nt.SEQ ID:NO 10SEQ ID NO:10 comp64619_c4_seq3之847nt。
當用作Query於BLASTP中,最高得分序列包括bHLH域於AMS/TDR1中及TF SCREAM2於阿拉伯芥中。可作出結論為,DYT1/UDT1不具有顯著的同源序列於所用的雄性數據庫中。
對於TDF1/OsTDF1,同源基因組序列之前已被描述且可發現於SEQ ID NO:雌性序列不存在且表現為雄性-限制的正調控(Harkess et al.,2015及個人觀察,Limgroup,Horst,The Netherlands)。
對於AMS/TDR1,一tBLASTN序列被發現於AGSV2.0:AsOf V2.0支架2800位置121055..121735其具有相似度73/227(33%)及陽性98/227(44%)。AMS/TDR1預測的cDNA提供於SEQ ID NO:7中。
比對的檢查顯示分數為比對於保留的bHLH家族域之結果。此序列不同於AMS相關序列,其由Harkess et al.所描述(Harkess et al.,2015)。在此研究中,AMS候選RNA為雄性-限制的正調控,正如類AMS/TDR1序列所預期。參考雌性DH00/094及4株雙單倍體雌性之AsOf V2.0支架2800株雌
性讀取覆蓋度的檢查顯示讀取覆蓋度沒有顯著的降低(未顯示結果),這指出AMS基因並未缺乏於雌性中。
對於MS188/OsMS188,發現1個高度顯著的序列,其係使用tBLASTN於AGS V2.0中:AsOf V2,0_支架3320位置107598..106444rev。序列MS188/OsMS188之預測的cDNA提供於SEQ ID NO:8中。
檢查顯示兩者蛋白質序列與天門冬屬同源基因模型幾乎完全對準,並使用BLASTP於非冗餘蛋白質數據庫中,於NCBI回傳的MS188處,其對於阿拉伯芥及OsMS188作為最高得分命中。此外,AsOf V2,0_支架3320被雌性專一讀取圖譜完好覆蓋,使其有可能分析對於此非性連鎖基因模型之基因表現於雄性及雌性兩者中。RNA-Seq數據顯示對於基因模型之嚴格的雄性-偏差表現,即讀取圖譜不存在於雌性表現數據中。在前述所包括的RNA-Seq中,研究了整個基因組從不同
基因型之天門冬屬及特定發育階段所獲得的花苞之基因表現。從這些數據中,可得到結論為,天門冬屬類MS188/OsMS188基因模型表現只限於預減數分裂階段的雄性表現型中。於預減數分裂階段之基因模型及時空表現很好地相應於MS188及OsMS188數據(Gu et al.,2014,Cai et al.,2015)。因此,得到結論為,此基因模型為MS188/OsMS188之天門冬屬同源物。該基因被稱為AsOf MS188。
對於MS1/PTC1,數據對比於那些AsOf MYB188。顯著的命中(hit)回傳,其係使用tBLASTN於AGS V2.0中:AsOf V2.0支架2421位置133601..134341。預測的cDNA序列MS1/PTC1提供於SEQ ID NO:9中:
檢查顯示兩者蛋白質序列與天門冬屬同源基因模型幾乎完全對準,並使用BLASTP於非冗餘蛋白質數據庫中,在NCBI回傳的MS1處,其對於阿拉伯芥及PTC1(Os09g0449000)作為最高得分命中。此外,AsOf V2,0_支架2421被雌性專一讀取圖譜完好覆蓋,使其有可能分析對於此非性連鎖基因模型之基因表現於雄性及雌性兩者中。RNA-Seq數據顯示對於基因模型之所有4個外顯子之嚴格的雄性-偏差表現,即讀取圖譜不存在於雌性表現數據中。一些非特異的讀取圖譜發生在雄性及雌性兩者中。在前述所包括的RNA-Seq中,研究了整個基因組從不同基因型之天門冬屬及特定發育階段所獲得的花苞之基因表現。從這些數據中,可得到結論為,天門冬屬類MS1/TCP1基因模型表現只限於預減數分裂階段的雄性表現型中。於預減數分裂階段之基因模型及時空表現很好地相應於MS1及PCT數據(Gu et al.,2014,Cai et al.,2015)。因此,得到結論為,此基因模型為MS1/PCT1之天門冬屬同源物。該基因被稱為AsOf MS1。值得注意的是,AsOf MS1之雄性-偏差RNA-seq讀取圖譜不存在於品系9M中(Limgroup.Horst,
The Netherlands)。這是因為小量的花苞係採樣於一些特定階段。綜上所述,調控子網絡揭示:DYT1/UDT(無可靠的預測)→TDF1/OsTDF1/AsOf TDF1→AMS/TDR1(?)→MS188/OsMS188/AsOf MS188→MS1/PTC1/AsOf MS1。
事實上,類AsOf TDF1限於雄性蘆筍,故不存在於雌性蘆筍中,其為單一複製基因模型,鄰近於雌性抑制體基因,其被稱為雌蕊發育抑制體(GDS基因)或含有來自AsOf_V2.0_支架905的基因之DUF247域,其為基因上側接於一些DNA-標記,高水平表現於雄性及超雄性,且為部分對於營養層發育充分研究的遺傳路徑,其中天門冬屬同源物顯示預期的時空表現型態,其擁有強力的證據證明AsOf類TDF1為雄性-促進基因,如對於性染色體之起源的2個基因模型所預測(Charlesworth & Charlesworth,1979)。此外,人們可以有把握地斷定,以ASOF TDF1互補雌性蘆筍植物將復原功能性雄蕊發育。
Cai et al(2015)證明了OsTDF1的表現於阿拉伯芥tdf1突變復原其生殖力,這指出此同源物可以完成阿拉伯芥中TDF1的正常功能。水稻OsTDF1基因及阿拉伯芥TDF1基因顯示為相當不同但保留於R2R3 MYB模體中。此知識結合本文件所揭露的知識指出雌性蘆筍植物補充以sOf TDF1之同源物或異種同源物也可復原功能性雄蕊發育。
表61:蘆筍基因型DH00/086(雄性)及AGS V2.0支架之生物奈米基因組重疊群組合的結果,其係使用Irysview Software®包裝。基於遺傳標記的信息,挑選(性連鎖)16個AGS
V2.0支架作為Query並產生8個不同的生物奈米重疊群(7,22,28,55,438,833,1030及1138)或無重疊群(0)。表中顯示7個性連鎖支架配對至BNG V1.0重疊群28,且未被遺傳標記篩選的支架(新)也配對至重疊群28。基於配對訊息,得出結論為,至少7M-基因座支架為嵌合的組合。
雌性化植物(包括雌性)由伽馬輻射所創造;其著果,其花朵,其被證明的突變
在本實施例7中將提供更多關於突變植物的細節,其係由實施例6所描述的伽馬輻射所獲得。當時正在進行書面研究。下方文本提供了目前已知的記錄。應注意的是,當時第一及第二評估的植物遭受Prodiplosis longifila感染,因此著果本來可以更多於已被報導的那些植物。2015年12月,進行第二評估於一個也可能對著果產生負面影響溫暖的時期。
對於所有突變,對其DNA進行HRM分析,如實施例6所描述,除了雄性至雌性變性之外,僅顯示融化曲線差異於K1150_300_11,其的確具有突變(見下方)。為了確定一些突變沒有被HRM遺漏(例如A->T type 4 SNP),將基因區域進行定序於除了K1150-600-2之所有突變(派出大規模平行定序),其係使用引子CN86/CN87,CN88/CN89,CP41/CN60,CN59/CN70,CN67/CN82,CN69/CN81(表3)。只有1個突變顯示SNP於序列中,其由在轉譯區外及在被HRM標記靶向的的區域之CN86/CN87所獲得。這說明了轉譯區外的延伸定序可允許更多突變的偵測。然而,如之前已指出,上游基因的區域,其中PAB BIO讀取顯示富含AT的重複DNA,其位於富含GC島的兩側(未顯示結果)。一包含重複的區域可包括順式-調控元素,例如已顯示的阿拉伯芥Fwa基因(Soppe et al 2000)。所有突變的真實性至少已被標記AO008,AO022,AO058,AO069,AO097,AO110,,AO145所證明,且除了K323-_600A3之外顯示無雜質。此數量的基因座足以召集任何雜質(未公開的結
果)。然而,特別是(雌性)突變其受到高成本的基因組定序,進行更多的標記,例如第21圖所示。
K1150-600-1為雌性亦描述於實施例6中,其顯示包括GDS及AS-TDF1基因的缺失。記錄第一次檢查其雌性開花朵但拍攝不佳。幾週之後,植物再次生產雌性花朵,並拍下其中之一其顯示於第22圖中。漿果發現於3根莖上,2根帶有5個漿果及1根帶有4個漿果,9個成熟的漿果提供11粒可存活的種子。4個月之後,在切斷蕨類之前,發現植物生產152個當前正在熟化的新漿果。
K1150-600-2,生產5根莖(分別具有4,2,14,57及4個漿果),其中4個為熟化其提供5粒可存活的種子,幾週之後拍攝花朵於第22圖中。花朵顯示花柱及柱頭發育,這對於此雜交並非例外。最近,K1150-600-2生產20個熟化的新漿果。基因組重新定序指出一個小的候選缺失起始於位置1449至2023,這是由於使引子CN88/CN89,CN86/CN87及CN62/CN68(表3)之PCR失敗,其沒有提供確鑿的證據於該缺失的日期。定序此突變的GDS區域為待定中。
K323-600A-3,不具年幼的花朵於第一次的評估,且生產4根莖,其分別具有21,100,1及11個漿果。因為此突變會出現種子汙染,故後來被歸類為假的(第21圖)。
K323 600A-4結束開花且接著被發現生產3根莖並分別具有2,1及4個熟化的漿果,其提供8粒可存活的種子。此時新的漿果已獲得K323 600A-4於新枝嫩芽中。
K1129-300-5具有1根莖其生產2個熟化的漿果,
其中獲得2粒可存活的種子。獲得植物的花朵於新的嫩芽中(第22圖)。該影像顯示發育非常好的三葉型柱頭,其並未在雜交種的參考花朵上觀察到。最近,此植物被報導生產了26個新的漿果。
K1129-300-7生產1根莖其包括3個熟化的漿果,其中獲得4粒可存活的種子,其圖片顯示具有一些柱頭發育的花柱(但可能少於K1129-300-5)。最近檢查植物新枝顯示沒有新的著果。
K1129-300-8被發現生產1個熟化的漿果且下個嫩芽提供單一可存活的種子。此植物的花朵顯示於第22圖。請注意,此花朵也具有發育非常良好的柱頭。使用引子對CN86/CN87的Sanger定序K1129-300-8揭示了腺嘌呤至胸腺嘧啶的改變,其相同於SEQ ID NO:3之核苷酸位置1160。此腺嘌呤至胸腺嘧啶的改變被665個核苷酸從GDS基因之第一預測起始密碼子的腺嘌呤分離。此腺嘌呤至胸腺嘧啶的結論為係從比較序列信息所推斷,其獲得K1129參考雜交,及其它植物例如K1036(實施例6之基因型)育種品系9M,及雜交K1150參考基因組雙單倍體DH00/086。單靠偶然於此區域偵測到該突變的可能性一定是極小,因此可以預料該突變可使得K1129-300-8能夠生產至少1個漿果。進一步的調查為待定中。到目前為止,沒有獲得新的漿果於莖的第二嫩芽中。
K1129-300-9生產1個熟化的漿果,其包括1粒可存活的種子。拍攝的照片顯示沒有顯著的花柱發育(第22圖),且其目前並未報導有生產新的漿果。
K1150-300-10具有單一莖,其上發現3個熟化的漿果其中獲得2粒可存活的種子。其顯示了相對較大的果實。該植物目前並未被報導具有任何新的漿果。
K1129-300-11具有3根莖,其上發現1,2及3個漿果,其中僅可獲得1粒可存活的種子。拍攝來自第2莖嫩芽的花朵之照片(第22圖),其顯示異常長的花柱,幾乎頂到其花藥。迄今,新枝尚未提供新的漿果。使用引子對CP41/CN72的高解析度融化分析產生非正常型(off-type)的融化曲線於植物K1150_300_11,相較於其它屬於品種K1150的個體。使用引子對CN69/CN81的Sanger定序(表3,實施例1)顯示一腺嘌呤至鳥糞嘌呤的改變,相當於SEQ ID NO:1之1160之位置,其導致天門冬醯胺(N)至絲胺酸(S)的胺基酸改變。此SNP不存在於序列中,其獲得K1150_300參考雜交及許多參考序列,例如DH00/086,雜交K323及88M,5375,9M等,且被認為是獨一無二的。由於能夠生產漿果的此突變具有胺基酸改變於雌蕊發育抑制體中,這使其與無法生產漿果之原始的K1150有所區別。得出結論為,此特定的突變提供了雌性化植物。
K1150-300-12具有2根莖其包括174及6個漿果其中收集到>200粒可存活的種子。植物在檢查時及在切斷蕨類後結束開花以獲得新枝,該植物尚未復原。進行進一步的調查目前生長於溫室中的12株幼苗,其係從這些漿果中所獲得。幸運地,在切斷蕨類之前取出組織以分離DNA,如實施例6所描述,包括GDS及雄性刺激子基因的缺失被證明存在。新花朵的缺乏目前阻礙了其預期的雌性表現型之確認。未來的研
究目標在於從此植物的譜系獲得新的花朵,其可進一步確認缺失之間的關係且雌性花朵表現型為待定中。
K1150-300-13具有1根莖其上發現3個熟化的漿果其中可獲得11粒可存活的種子。其花朵之一的影像(第22圖)顯示非常長的花柱。在最近成立的新枝中18個新的漿果已被報導。
K1150-300-14生產2根莖其上發現3及4個熟化的漿果其生產6粒可存活的種子。花朵(其中切掉部分的子房)顯示於第22圖。迄今為止,沒有從新枝中獲得漿果。沒有獲得被拍攝的花朵。K1150-300-15生產1根莖其上發現單一熟化的漿果其不具有(登錄的)可存活的種子。K1150-300-16生產1根莖其上發現單一熟化的漿果包括2粒可存活的種子。最近發現生產3個新的漿果於莖的第二嫩芽上。目前,收集更多花朵用於雜交K1129的參考植物。請注意,那些植物並未發育任何花柱或非常小。這指出如K1129-5及K1129-8所示的花柱發育是十分不尋常的。
Altschul SF, Gish W, Miller W, Myers E, Lipman D (1990). Basic local alignment search tool. Journal of Molecular Biology 215 (3):403-410.
von Beeskov, H.
Untersuchungen über die Variabilität der Adrnomonözie / Diözie und ihre Korrelationionen met verschiedenen Ertragsfaktoren bei Sparege (Asparagus off. L.) unter besondere Berücksichtigungen der Züchting rein männlicher Sorten). Z. PlfZucht 57:254-283Bos I (1985). Selectiemethoden Deel A. Populatie-genetische grondslagen. Landbouw Hogeschool Vakgroep Planten verdeling Wageningen.; A remark on full sib mating and its inbreeding efficiency compared to self-fertilization based on theoretical ground is presented in Dutch on page 29.
Bracale M, Galli MG, Falavigna A, Soave C (1990). Sexual differentiation in Asparagus officinalis L. II. Total and newly synthesized proteins in male and female flower. Sex. Plant Reprod. 3:23-30. Bracale M, Caporali E, Galli MG, Longo C, Marziani-Longo, G. Rossi G, Spada A, Soave C, Falavigna A, Raffaldi F, Maestri
Brown, TA (2002). Mapping genomes. Genomes, 2nd edition, Wiley-Liss, Oxford. ISBN-10: 0-471-25046.
Shelton, JM et al. (2015). Tools and pipelines for BioNano data: molecule assembly pipeline and FASTA super scaffolding tool. BMC Genomics 16:734.
Bracale M, Caporali, E, Galli, MG, Longo C,. Marziani-Longo CG, Rossi G, Spada A, Soave C, Falavigna A Raffaldi F, Maestri E, Restivo FM, Tassi F (1991). Sex determination and differentiation in Asparagus officinalis L.. Plant Science 80:67-77.
E. Caporali, Carboni A, Galli MG, Rossi G, Spada A,. Marziani Longo GP. Development of male and female flower in Asparagus officinalis. Search for point of transition from hermaphroditic to unisexual developmental pathway. Sexual Plant Reproduction July 1994, Volume 7, Issue 4, pp 239-249
Briggs, FN, Knowless, PF. (1967) Rheinhold Publishing Corparation
Cai Ci-Feng, Jun Zhu, Yue Lou, Zong-Li Guo Shuang-Xi Xiong, Ke Wang, Zhong-Nan Yang The functional analysis of OsTDF1 reveals a conserved genetic
pathway for tapetal development between rice and Arabidopsis Sci. Bull. (2015) 60(12):1073-1082 www.scibull.com DOI 10.1007/s11434-015-0810-3
Charlesworth B, Charlesworth D (1978). A model for the evolution of dieocy and gynodioecy. The American Naturalist 112 (988):975-997.
Caruso, M, Federici, CT, Roose, ML,. EST-SSR markers for asparagus genetic diversity evaluation and cultivar identification. Mol. Breed. 2008, 21, 195-204.
Dalakouras A, Dadami E, Zwiebel M, Krczal G, Wassenegger M.
Transgenerational maintenance of transgene body CG but not CHG and CHH methylation.
Epigenetics. 2012 Sep;7(9):1071-8. Epub 2012 Aug 6.
Doyle, J. J. and J. L. Doyle. 1990. A rapid total DNA preparation procedure for fresh plant tissue. Focus 12:13-15.
Ellinghaus D, Kurtz S, Willhoeft U (2008). LTRharvest, an efficient and flexible software for de novo detection of LTR retrotransposons. BMC Bioinformatics 9:18.
Elsik CG, Mackey AJ, Reese JT, Milshina NV, Roos DS, Weinstock GM (2007). Creating a honey bee consensus gene set. Genome Biology 2007, 8:R13.
English, AC et al. (2012). Mind the Gap: Upgrading Genomes with Pacific Biosciences RS Long-Read Sequencing Technology. PLoS ONE 7(11): e47768. doi:10.1371/journal.pone.0047768. Evans DA, Bravo JE (1986). Phenotypic and Genotypic Stability of Tissue Cultured Plants. Tissue culture as a plant production system for horticultural crops. Current Plant Science and Biotechnology in Agriculture 2:73-94.
Evans, DA, Sharp, WR, Medina-Filho, HP Somaclonal and Gametoclonal Variation. American Journal ofBotany Vol. 71, No. 6 (Jul., 1984), pp. 759-774
Franken AA (1969) Geslachtskenmerken en geslachtsovererving bij asperge. Proefschift Landbouw Hogeschool. Pudoc Centrum voor Landbouwpublikaties and Landbouwdocumentatie Franken AA (1970). Sex characteristics and inheritance of sex in asparagus (Asparagus officinalis L.). Euphytica 19:277-287.
Gady AL, Hermans FW, Van de Wal MH, van Loo EN, Visser RG, Bachem CW. Implementation of two high through-put techniques in a novel application: detecting point mutations in large EMS mutated plant populations. Plant Methods. 2009 Oct 7;5:13. doi: 10.1186/1746-4811-5-13.
Greaves IK, Groszmann M, Wang A, Peacock WJ, Dennis ES. Inheritance of Trans Chromosomal Methylation patterns from Arabidopsis F1 hybrids.
Proc Natl Acad Sci U S A. 2014 Feb 4;111(5):2017-22. doi: 10.1073/pnas.1323656111. Epub 2014 Jan 21.
Haas BJ, Salzberg SL, Zhu W, Pertea M, Allen JE, Orvis J, White O, C Buell R, Wortman JR (2008). Automated eukaryotic gene structure annotation using EVidenceModeler and the Program to Assemble Spliced Alignments.Genome Biology 2008, 9:R7.
Hoff KJ, Stanke M (2013). WebAUGUSTUS--a web service for training AUGUSTUS and predicting genes in eukaryotes. Nucleic Acids Res. 2013 Jul;41(Web Server issue):W123-8.
Jamsari A (2003). Construction of high-density genetic and physical maps around the sex gene M of Asparagus officinalis L. Doctoral Thesis. Institute für Planzenzüchting. Agrar- und Ernährungswissenschaftlichen Fakultät der Christian-Albrechts-Universität zu Kiel.
Jamsari A, Nitz I, Reamon-Büttner SM, Jung C (2004). BAC-derived diagnostic markers for sex determination in asparagus. Theor. Appl. Genet. 108 (6):1140-1146.
Jiang W, Zhou H, Bi H, Fromm M, Yang B, Weeks DP (2013). Demonstration of CRISPR/Cas9/sgRNA-mediated targeted gene modification in Arabidopsis, tobacco, sorghum and rice. Nucleic Acids Res. 2013 Nov;41(20):e188. doi: 10.1093/nar/gkt780. Epub 2013 Sep 2.
Jiang, C., Mithani, A., Gan, X., Belfield, E. J., Klingler, J. P., Zhu, J.-K., ... Harberd, N. P. (2011). Regenerant Arabidopsis Lineages Display a Distinct Genome-Wide Spectrum of Mutations Conferring Variant Phenotypes. Current Biology, 21(16), 1385-1390.
http://doi.org/10.1016/j.cub.2011.07.002
Jin and Martin (1999). Multifunctionality and diversity within the plant MYB-gene family. Plant Mol Biol. Nov; 41(5):577-85.
Kanno A, Kubota, S Ishino, K. (2013). Conversion of a male-specific RAPD marker into an STS marker in Asparagus officinalis L.. Euphytica, 197 (1):39-46.
Kent WJ (2002). BLAT-the BLAST-like alignment tool. Genome Res. 12, 656-664. Korf I (2004). Gene finding in novel genomes. BMC Bioinformatics. 2004;5:59.
Daehwan Kim, Pertea G, Trapnell C, Pimentel H, Kelleyand R, Salzberg (2013). TopHat2: accurate alignment of transcriptomes in the presence of insertions, deletions and gene fusions. Genome Biology 14:R36.
Langmead B, Salzberg SL (2012). Fast gapped-read alignment with Bowtie 2. Nat. Methods. 9 (4):357-359.
Lazarte JE, Palser BF (1979). Morphology, vascular anatomy and embryology of pistillate and staminate flowers of Asparagus officinalis. Amer. J. Bot. 66:753-764.
López-Anido F, Cointry E (2008). Asparagus. Handbook of Plant Breeding, 2: Volume package: Vegetables Vegetables II. Fabaceae, Liliaceae, Solanaceae, and Umbelliferae. Prohens-Tomás, J, Nuez, F (Eds.) XI, 365 p.
Löptien H (1976). Giemsa-Banden auf Mitosechromosomen des Spargels (Asparagus officinalis L.) und des Spinats (Spinacia oleracea L.). Z. Pflanzenzüecht. 76:225-230.
Longin CF, Utz HF, Reif JC, Wegenast T, Schipprack W, Melchinger AE. Hybrid maize breeding with doubled haploids: III. Efficiency of early testing prior to doubled haploid production in two-stage selection for testcross performance. Theor Appl Genet. 2007 Aug;115(4):519-27. Epub 2007 Jun 29.
Li H and Durbin R (2009). Fast and accurate short read alignment with Burrows-Wheeler Transform. Bioinformatics, 25:1754-60.
Li, H. (2013). Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. arXiv.org.
Ji L, Neumann DA, Schmitz RJ. Crop Epigenomics: Identifying, Unlocking, and Harnessing Cryptic Variation in Crop Genomes. Mol Plant. 2015 Jun;8(6):860-70. doi:10.1016/j.molp.2015.01.021. Epub 2015 Jan 29.
Liang C, Mao L, Ware D, Stein L (2009). Evidence-based gene predictions in plant genomes. Genome Res. 19(10):1912-1923.
Ruibang Luo, Binghang Liu, Yinlong Xie, Zhenyu Li, Weihua Huang, Jianying Yuan, Guangzhu He, Yanxiang Chen, Qi Pan, Yunjie Liu, Jingbo Tang, Gengxiong Wu, Hao Zhang, Yujian Shi, Yong Liu, Chang Yu, Bo Wang, Yao Lu, Changlei Han, David W Cheung, Siu-Ming Yiu, Shaoliang Peng, Zhu Xiaoqian, Guangming Liu, Xiangke Liao, Yingrui Li, Huanming Yang, Jian Wang, Tak-Wah Lam and Jun Wang (2012). SOAPdenovo2: an empirically improved memory-efficient short-read de novo assembler. GigaScience 1:18.
Machczynska J, Orowska R, Mankowski DR, Zimny J, and Bednarek PT. (2014). DNA methylation changes in triticale due to in vitro culture plant regeneration and consecutive reproduction. Plant Cell Tiss. Organ Cult. 119:289-299.
Maeda T, Ozakit Y, Sonoda T, Inoue N, Narikly K, Okubo, H (2005). Sex-conversion from Male to Female during Somatic Embryogenesis from Protoplasts in Asparagus (Asparagus ofiicinalis L.). Journal of the Faculty of Agriculture, Kyushu University 50(2):585-592.
Marks GE (1979). Hermaphrodites, do they have a role in asparagus breeding? Proceeding of the 5th lnternational Asparagus Symposium, G. Reuther, ed., Eucarpia, Geisenheim, pp 39-41. Martin A, Troadec C, Boualem A, Rajab M, Fernandez R, Morin H, Pitrat M, Dogimont C, Bendahmane A (2009). A transposon-induced epigenetic change leads to sex determination in melon. Nature 461 (7267):1135-8.
Müllner, D (2013). Fastcluster: Fast Hierarchical, Agglomerative Clustering Routines for R and Python. Journal of Statistical Software 53, no. 9, 1-18.
Nunna S, Reinhardt R, Ragozin S, Je ltsch A.. Targeted methylation of the epithelial cell adhesion molecule (EpCAM) promoter to silence its expression in ovarian cancer cells.PLoS One. 2014 Jan 29;9(1):e87703. doi: 10.1371/journal.pone.0087703. eCollection 2014
Novák P, Neumann P and Macas J (2010). Graph-based clustering and characterization of repetitive sequences in next-generation sequencing data. BMC Bioinfonnatics 11:378.
Novák P, Neumann P, Pech J, Steinhaisl J, Macas J (2013). RepeatExplorer: a Galaxy-based web server for genome-wide characterization of eukaryotic repetitive elements from next generation sequence reads. Bioinformatics, Advance Access publication February 1, 2013.
Ozaki, Y.. T. Tashiro and H. Okubo 2000a Use of allozyme variation for evaluating genetic purity in asparagus (Asparagus offici?~alis L.) cultivars. J. Hort. Sci. Biotech., 75: 105-110
Ozaki, Y. T. Tashiro and H. Okubo 2000b Linkage arrangement of allozyme loci in asparagus (Asparagus officinalis L.). J. Japa7b. Soc. Hort. Sci., 69: 440~42
Peirce LC, Currence TT (1962). The inheritance of hermaphroditism in Asparagus officinalis. Proc. Am. Soc. Hort. Sci 80:368-376.
Lincoln C. Peirce (e-mails from 2010 and 2015). The address of emeritus Professor Lincoln C. Peirce was obtained from Elizabeth Slomba, University Archives, University of New Hampshire, on Oct 19th 2010
Subsequently, a conversation by e-mail took place which provided the citations from Lincoln C. Peirce that were used by his permission.
Peng, M, Wolyn, DJ Development of a microspore culture method to produce haploid and double-haploid asparagus (Asparagus officinalis L.) plants. ActaHortic.1999.479.49
Peng Y, Leung HC, Yiu SM, Chin FY (2012), IDBA-UD: a de novo assembler for single-cell and metagenomic sequencing data with highly uneven depth. Bioinfonnatics. 2012;28:1420-1428.
Pedersen, B. S., Eyring, K., De, S., Yang, I. V., & Schwartz, D. A. (2014). Fast and accurate alignment of long bisulfite-seq reads. arXiv:1401.1129v2.
Pontaroli AC, Camadro EL (2005). Somaclonal variation in Asparagus officinalis plants regenerated by organogenesis from long-term callus cultures. Genet. Mol. Biol.28 (3):423-430. Qiao YM and Falavigna A (1990). An imporived in vitro anther culture method for obtaining doubled-haploid clones of Asparagus Acta Hort. (ISHS) 271:145-150.
Smulders MJM, de Klerk GJ (2011). Epigenetics in plant tissue culture. Plant Growth Regul. 63:137-146.
Soppe WJ, Jacobsen SE, Alonso-Blanco C, Jackson JP, Kakutani T, Koornneef M, Peeters AJ. The late flowering phenotype of fwa mutants is caused by gain-of-function epigenetic alleles of a homeodomain gene. Mol Cell. 2000 Oct;6(4):791-802.
Sinner et al. (2009). JBrowse: A next-generation genome browser. Genome Res. 19:1630-1638. Stroud, H., Do, T., Du, J., Zhong, X., Feng, S., Johnson, L., ... Jacobsen, S. E. (2014). The roles of non-CG methylation in Arabidopsis. Nature Structural & Molecular Biology, 21(1), 64-72.
http://doi.org/10.1038/nsmb.2735
Trapnell C, Williams BA, Pertea G, Mortazavi A, Kwan G, van Baren MJ, Salzberg SL, Wold BJ, Pachter L (2010). Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nature Biotechnology 28 (5):511-515.
Trapnell C, Roberts A, Goff L, Pertea G, Kim D, Kelley DR, Pimentel H, Salzberg SL, Rinn JL, Pachter L (2012). Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. Nature Protocols 7:562-578.
Riccardi P, Longo C, Mercati F, Sunseri F, Leebens-Mack JH, Falavigna A (2010). Sex inheritance in Asparagus: A hermaphrodite doubled haploid line confirms and old theory? Proceedings of the 54th Italian Society of Agricultural Genetics Annual Congress. Matera, Italy 27/30 September, 2010. ISBN 978-88-904570-0-5.
Rick CM, Hanna GC (1943). Determination of sex in Asparagus officinalis L.. Amer. J. Bot. 30: 711-714.
Sievers F, Wilm A, Dineen DG, Gibson TJ, Karplus K, Li W, Lopez R, McWilliam H, Remmert M, Söding J, Thompson JD, Higgins DG (2011). Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Molecular Systems Biology 7:539.
Shen L1, Waterland RA. Methods of DNA methylation analysis.
Curr Opin Clin Nutr Metab Care. 2007 Sep;10(5):576-81.
Sneep (1953a) The significance of andromonoecy for the breeding of Asparagus officinalis L. Euphytica 2 (2):89-95
Sneep (1953b). The significance of andromonoecism for the breeding of Asparagus officinalis L. II Euphytica 2,(3), 224-228
Sneep J, Hendriksen AJT (1979). Plant breeding perspectives. Centennial publication of Koninklijk Kweekbedrijf en Zaadhandel D.J. van der Have. 1879-1979. Review
Stelpflug SC, Eichten SR, Hermanson PJ, Springer NM, Kaeppler SM3
Consistent and heritable alterations of DNA methylation are induced by tissue culture in maize. Genetics. 2014 Sep;198(1):209-18. doi: 10.1534/genetics.114.165480. Epub 2014 Jul 14.
Sneep J, Hendrksen AJT (eds.) Holbeck O (coed.) (1979). Pudoc Center for Agricultural Publishing and Documentation Wageningen.
Solovyev V, Kosarev P, Seledsov I, Vorobyev D (2006). Automatic annotation of eukaryotic genes, pseudogenes and promoters. Genome Biol. 7, Suppl. 1:10.1-10.12.
Szczeniak MW, Kabza M, Pokrzywa R, Gudy A, Makaowska I (2013). ERISdb: a database of plant splice sites and splicing signals. Plant Cell Physiol. 2013 Feb;54(2).
Thévenin L (1967a). Les problèmes d’amélioration chez Asparagus officinalis L.. I. Biologie et amélioration. Ann. Amélior. Plantes 17:33-66.
Thévenin L (1967). Contribution a l’étude de la sexualité et de l’haploidie chez l’asperge cultiveé (Asparagus officinalis L.) Thèse présentée àt la Faculté des Sciences de Montpellier pour obtenir la grade de Docteur Ingénieur. University de Montpellier Faculté des Sciences.
Untergasser A, Nijveen H, Rao X, Bisseling T, Geurts R, Leunissen JAM (2007). Primer3Plus, an enhanced web interface to Primer3. Nucleic Acids Res. 35 (Web Server issue):W71-W74.
Untergrasser A ,Cutcutache I,Koressaar T,Ye J, Faircloth BC,Remm M,Rozen SG(2012)Primer3-new capabilities and interfaces.Nucleic Acids Research40(15):e115
Vuylsteke M, Peleman JD, van Eijk MJ (2007). AFL P-based transcript profiling (cDNA-AFLP) for genome-wide expression analysis. Nature protocols 2(6):1399-413.
Westergaard M (1958). The Mechanism of Sex Determination in Dioecious Flowering Plants. Advances in Genetics 9:217-281.
Wittwer CT, Reed GH, Gundry CN, Vandersteen JG, Pryor RJ (2003). High-resolution genotyping by amplicon melting analysis using LCGreen. Clin. Chem. 49(6 Pt 1):853-60.
Wricke G (1967). Untersuchung zur Vererbung des Geslechts bei Asparagus officinalis L. Z. Pl.Zücht. 60:201-211.
Wricke G (1973). Untersuchungen zur Vererbung des Geschlechts bei Asparagus officinalis L.. II. Y-Chromosome-gebundene Unterschiede im Andromonoziegrad. Z. Pflanzenzucht Sept. 1973, 70 (2) p. 91-98.
Yu Q, Tong E, Skelton RL, Bowers JE, Jones MR, Murray JE, Hou S, Guan P, Acob RA, Luo MC, Moore PH, Alam M, Paterson AH, Ming R. A physical map of the papaya genome with integrated genetic map and genome sequence. BMC Genomics. 2009 Aug 7;10:371. doi: 10.1186/1471-2164-10-371.
Zhang C, , Hsieh TF. Heritable Epigenetic Variation and its Potential Applications for Crop Improvement. Plant Breeding and Biotechnology 2013;1:307-319.
Claims (29)
- 一種增進雌雄異株植物之育種的方法,包括:提供一植物,其中雌蕊發育之顯性抑制體的功能性表現受到干擾或降低,並引進所述植物於近交、回交育種、反覆回交育種或雙單倍體種子生產。
- 一種雌雄異株植物之自花受精或異質雜交的方法,其中親本植物之一或兩者為一植物,其雌蕊發育之顯性抑制體的功能性表現受到干擾或降低。
- 一種生產植物的方法,其中藉由抑制GDS蛋白質的表現,較佳為降低描述於SEQ ID NO:2之胺基酸序列或其異種同源物或功能性同源物的表現,以干擾或降低雌蕊發育之顯性抑制體的功能性表現。
- 如申請專利範圍第1至3項中任一項所述之方法,其中雌蕊發育之顯性抑制體的功能性表現之干擾或降低係藉由抑制GDS基因之表現所造成,較佳為其中GDS基因包括提供於SEQ ID NO:1的序列或為其異種同源物、功能性同源物或功能性片段。
- 如申請專利範圍第1至3項中任一項所述之方法,其中雌蕊發育之顯性抑制體的功能性表現受到干擾或降低,其中該植物包括突變的GDS基因,包括引進突變於GDS基因中。
- 如申請專利範圍第5項所述之方法,其中該突變係由DNA置換所造成。
- 如申請專利範圍第1至6項中任一項所述之方法,其中該雌雄異株植物為天門冬屬(genus Asparagus),較佳為蘆筍 (Asparagus officinalis)。
- 一種雌雄異株植物,較佳為天門冬屬(genus Asparagus)植物,更佳為蘆筍種(species Asparagus officinalis)植物,其中雌性發育蛋白質之顯性抑制體的表現受到干擾或降低。
- 如申請專利範圍第8項所述之雌雄異株植物,其中GDS基因之表現受到干擾或降低。
- 如申請專利範圍第8或9項所述之雌雄異株植物,其中所述植物已受到突發誘變處理,較佳為其中所述處理包括以放射性元素輻射。
- 如申請專利範圍第8至10項中任一項所述之雌雄異株植物,其中所述植物經核苷酸序列轉化或轉染,其能夠干擾或降低雌蕊發育之所述顯性抑制體的表現,較佳為其中所述核苷酸序列同源或部分同源於GDS基因之序列。
- 如申請專利範圍第11項所述之雌雄異株植物,其中表現之所述干擾或降低為可逆的。
- 一種增進雌雄異株植物之育種的方法,包括提供一植物,其中顯性雄性刺激子的功能性表現受到修復,並引進所述植物於近交、回交育種、反覆回交育種或雙單倍體育種技術。
- 一種增進雌雄異株植物之育種的方法,包括一植物,其中顯性雄性刺激子的功能性表現之缺乏藉由顯性雄性刺激子的功能性複製來補充,並引進所述植物於近交、回交育種、反覆回交育種或雙單倍體育種技術。
- 如申請專利範圍第13或14述之方法,其中顯性雄性刺激 子之引進係藉由誘導雌雄異株植物中異源顯性雄性刺激子之表現來實行,較佳為其中所述顯性雄性刺激子為TDF1蛋白質。
- 如申請專利範圍第15項所述之方法,其中所述TDF1蛋白質為描述於SEQ ID NO:5之蘆筍TDF1基因或其異種同源物或功能性同源物或功能性片段。
- 如申請專利範圍第16項所述之方法,其中所述功能性片段包括至少TDF1蛋白質或其異種同源物或功能性同源物之R2及R3域。
- 一種雌雄異株植物之自花受精或異質雜交的方法,其中親本植物之一或兩者為一植物,其中顯性雄性刺激子的功能性表現之缺乏藉由顯性雄性刺激子的功能性複製來修復或補充,較佳為其中所述顯性雄性刺激子為TDF1蛋白質或其異種同源物或同源物。
- 一種體外雄核生殖(androgenesis)的方法,其中用於提供花藥的植物為一植物,其中顯性雄性刺激子的功能性表現之缺乏藉由顯性雄性刺激子的功能性複製來修復或補充,較佳為其中所述顯性雄性刺激子為TDF1蛋白質或其異種同源物或同源物。
- 如申請專利範圍第13至19項中任一項所述之方法,其中編碼為顯性雄性刺激子的基因係描述於SEQ ID NO:4之蘆筍TDF1基因或其異種同源物或功能性同源物或其片段,其編碼為如申請專利範圍第17項所定義之TDF1蛋白質片段。
- 一種能夠於蘆筍植物中抑制雌蕊發育的蛋白質,包括SEQ ID NO:2之胺基酸序列或其異種同源物或功能性同源物。
- 一種編碼為申請專利範圍第21項所述之蛋白質的核酸序列,其中所述核酸序列為描述於SEQ ID NO:1之cDNA序列或可以源自於SEQ ID NO:3之基因組序列。
- 一種能夠於來自雌雄異株物種之植物中提供雄性化作用的蛋白質,包括SEQ ID NO:5之胺基酸序列或其異種同源物或功能性同源物,或其如申請專利範圍第17項所定義之片段。
- 一種編碼為申請專利範圍第23項所述之蛋白質的核酸序列,其中所述核酸序列為描述於SEQ ID NO:4之cDNA序列或其片段,其能夠編碼為如申請專利範圍第17項所定義之片段。
- 一種從育種方案獲得之雌雄異株物種的雜交植物,較佳為來自透過如申請專利範圍第1-7或13-20項中任一項所述之育種方法所生產之近交植物。
- 一種增進雌雄異株植物之育種的方法,包括:提供一雌性化植物,並引進所述植物於近交、回交育種、反覆回交育種或雙單倍體種子生產。
- 一種增進雌雄異株植物之育種的方法,包括:提供一去雌性化植物,並引進所述植物於近交、回交育種、反覆回交育種或雙單倍體種子生產。
- 一種增進雌雄異株植物之育種的方法,包括:提供一雄性化植物,並引進所述植物於近交、回交育種、反覆回交育種或雙單倍體種子生產。
- 一種增進雌雄異株植物之育種的方法,包括:提供一去雄性化植物,並引進所述植物於近交、回交育種、反覆回交育種或雙單倍體種子生產。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
NL2014107A NL2014107B1 (en) | 2015-01-09 | 2015-01-09 | New methods and products for breeding of asparagus. |
Publications (1)
Publication Number | Publication Date |
---|---|
TW201639447A true TW201639447A (zh) | 2016-11-16 |
Family
ID=52774466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW105100663A TW201639447A (zh) | 2015-01-09 | 2016-01-11 | 性別鑑定基因及其在育種上的用途 |
Country Status (14)
Country | Link |
---|---|
US (1) | US11439072B2 (zh) |
EP (1) | EP3242549A2 (zh) |
JP (1) | JP6867952B2 (zh) |
KR (1) | KR20170116034A (zh) |
CN (1) | CN107708408A (zh) |
AU (1) | AU2016205877A1 (zh) |
CA (1) | CA2973320A1 (zh) |
IL (1) | IL253308A0 (zh) |
MA (1) | MA41316A (zh) |
MX (1) | MX2017009039A (zh) |
NL (1) | NL2014107B1 (zh) |
PE (1) | PE20171381A1 (zh) |
TW (1) | TW201639447A (zh) |
WO (1) | WO2016110780A2 (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2552657A (en) * | 2016-07-29 | 2018-02-07 | Elsoms Dev Ltd | Wheat |
EP3301111A1 (de) * | 2016-10-02 | 2018-04-04 | Kws Saat Se | Pflanze der gattung triticum, in der das tdf-gen durch ein markergen inaktiviert ist |
CN110317856B (zh) * | 2018-03-28 | 2023-08-11 | 中国科学院分子植物科学卓越创新中心 | 基于表观组信息低成本组装解析生物核心基因组信息 |
CN109652412B (zh) * | 2019-01-22 | 2022-04-01 | 西北农林科技大学 | 一种snp分子标记、检测甜瓜花性型的方法及应用 |
CN110972933A (zh) * | 2019-12-26 | 2020-04-10 | 山西农业大学 | 一种四倍体曼地亚红豆杉培育方法 |
CN111088370B (zh) * | 2020-01-20 | 2022-06-21 | 中国水产科学研究院南海水产研究所 | 一种卵形鲳鲹性别特异性分子标记引物、鉴别方法及其应用 |
CN112063705A (zh) * | 2020-09-23 | 2020-12-11 | 国家林业和草原局泡桐研究开发中心 | 用于鉴别柿树性别的引物及其应用 |
CN112266974B (zh) * | 2020-11-25 | 2023-09-15 | 江苏海洋大学 | 一种用于鉴定龙须菜性别的引物及鉴定方法 |
CN112631562B (zh) * | 2020-12-01 | 2022-08-23 | 上海欧易生物医学科技有限公司 | 基于python的二代测序样本混样方法、应用、设备、计算机可读存储介质 |
CN112680458B (zh) * | 2021-03-12 | 2021-06-22 | 北京科技大学 | 雄性不育基因ZmMYB33及其在创制玉米雄性不育系中的应用 |
CN113215190B (zh) * | 2021-06-03 | 2022-09-27 | 西南大学 | CRISPR/Cas9介导的基因编辑技术制备柑橘纯合突变体的方法 |
CN114350776B (zh) * | 2021-11-24 | 2023-08-29 | 山东省农业科学院 | 石刁柏雄性特异的引物及生物性别鉴定方法 |
CN114182038B (zh) * | 2021-11-29 | 2024-01-30 | 河南师范大学 | 一种菠菜y染色体特异的核苷酸探针及其应用 |
WO2023137336A1 (en) * | 2022-01-11 | 2023-07-20 | Phylos Bioscience, Inc. | Hermaphroditism markers |
CN114717354B (zh) * | 2022-04-13 | 2023-08-11 | 河南师范大学 | 一种芦笋超雄株鉴定用分子标记组合、引物组、试剂盒、鉴定方法及应用 |
WO2024220792A1 (en) * | 2023-04-20 | 2024-10-24 | Pioneer Hi-Bred International, Inc. | Methods for improved double haploid production |
KR20250035639A (ko) * | 2023-09-05 | 2025-03-13 | 경상국립대학교산학협력단 | 유전자 교정에 의해 양적 형질이 조절된 다배체 식물의 제조방법 및 상기 방법에 의해 제조된 양적 형질이 조절된 다배체 식물 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USPP4999P (en) * | 1981-01-21 | 1983-03-15 | Research Corporation | Asparagus Plant No. 22 |
JPH0714349B2 (ja) | 1983-01-17 | 1995-02-22 | モンサント カンパニ− | 植物細胞での発現に適したキメラ遺伝子 |
CA1340766C (en) | 1984-12-24 | 1999-09-28 | Clive Waldron | Selectable marker for development of vectors and transformation systems in plants |
AU590597B2 (en) | 1985-08-07 | 1989-11-09 | Monsanto Technology Llc | Glyphosate-resistant plants |
IL81737A (en) | 1986-03-28 | 1992-11-15 | Calgene Inc | Regulation of gene expression in plant cells |
CN87100603A (zh) | 1987-01-21 | 1988-08-10 | 昂科公司 | 抗黑素瘤疫苗 |
US5034323A (en) | 1989-03-30 | 1991-07-23 | Dna Plant Technology Corporation | Genetic engineering of novel plant phenotypes |
US5302523A (en) | 1989-06-21 | 1994-04-12 | Zeneca Limited | Transformation of plant cells |
US5550318A (en) | 1990-04-17 | 1996-08-27 | Dekalb Genetics Corporation | Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof |
US5484956A (en) | 1990-01-22 | 1996-01-16 | Dekalb Genetics Corporation | Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin |
US5384253A (en) | 1990-12-28 | 1995-01-24 | Dekalb Genetics Corporation | Genetic transformation of maize cells by electroporation of cells pretreated with pectin degrading enzymes |
RU2077191C1 (ru) * | 1994-09-14 | 1997-04-20 | Чувашский сельскохозяйственный институт | Способ селекции унисексуальной конопли |
EP1217074A1 (en) | 2000-12-22 | 2002-06-26 | Universiteit Leiden | Nucleic acid integration in eukaryotes |
EP1279737A1 (en) | 2001-07-27 | 2003-01-29 | Coöperatieve Verkoop- en Productievereniging, van Aardappelmeel en Derivaten AVEBE B.A. | Transformation method for obtaining marker-free plants |
US20050081258A1 (en) | 2002-01-18 | 2005-04-14 | Prokopishyn Nicole Lesley | Short fragment homologous recombination to effect targeted genetic alterations in plants |
JP2005073521A (ja) | 2003-08-28 | 2005-03-24 | Japan Atom Energy Res Inst | 放射線による植物の性変化 |
CN101263783B (zh) | 2008-03-25 | 2012-02-29 | 浙江大学 | 利用除草剂巴尔板快速培育芦笋全雄株品系的方法 |
US9737077B2 (en) | 2011-08-19 | 2017-08-22 | Kirin Holdings Kabushiki Kaisha | Method for controlling sexuality of hop |
US20140273235A1 (en) | 2013-03-15 | 2014-09-18 | Regents Of The University Of Minnesota | ENGINEERING PLANT GENOMES USING CRISPR/Cas SYSTEMS |
US20150191743A1 (en) | 2013-03-15 | 2015-07-09 | E I Du Pont De Nemours And Company | Cloning and use of the ms9 gene from maize |
-
2015
- 2015-01-09 NL NL2014107A patent/NL2014107B1/en active
-
2016
- 2016-01-09 MA MA041316A patent/MA41316A/fr unknown
- 2016-01-10 JP JP2017554655A patent/JP6867952B2/ja active Active
- 2016-01-10 EP EP16709559.5A patent/EP3242549A2/en active Pending
- 2016-01-10 AU AU2016205877A patent/AU2016205877A1/en not_active Abandoned
- 2016-01-10 WO PCT/IB2016/000031 patent/WO2016110780A2/en active Application Filing
- 2016-01-10 US US15/541,188 patent/US11439072B2/en active Active
- 2016-01-10 CA CA2973320A patent/CA2973320A1/en active Pending
- 2016-01-10 CN CN201680014318.2A patent/CN107708408A/zh active Pending
- 2016-01-10 KR KR1020177022312A patent/KR20170116034A/ko not_active Withdrawn
- 2016-01-10 PE PE2017001201A patent/PE20171381A1/es unknown
- 2016-01-10 MX MX2017009039A patent/MX2017009039A/es unknown
- 2016-01-11 TW TW105100663A patent/TW201639447A/zh unknown
-
2017
- 2017-07-04 IL IL253308A patent/IL253308A0/en unknown
Also Published As
Publication number | Publication date |
---|---|
NL2014107B1 (en) | 2016-09-29 |
JP6867952B2 (ja) | 2021-05-12 |
PE20171381A1 (es) | 2017-09-15 |
AU2016205877A1 (en) | 2017-07-20 |
IL253308A0 (en) | 2017-09-28 |
NL2014107A (en) | 2016-09-23 |
WO2016110780A2 (en) | 2016-07-14 |
EP3242549A2 (en) | 2017-11-15 |
KR20170116034A (ko) | 2017-10-18 |
CA2973320A1 (en) | 2016-07-14 |
US11439072B2 (en) | 2022-09-13 |
US20170347549A1 (en) | 2017-12-07 |
MA41316A (fr) | 2017-11-14 |
CN107708408A (zh) | 2018-02-16 |
MX2017009039A (es) | 2018-01-30 |
JP2018501821A (ja) | 2018-01-25 |
WO2016110780A3 (en) | 2016-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11439072B2 (en) | Sex determination genes and their use in breeding | |
Soyk et al. | Duplication of a domestication locus neutralized a cryptic variant that caused a breeding barrier in tomato | |
Strable et al. | Maize YABBY genes drooping leaf1 and drooping leaf2 regulate plant architecture | |
Bielenberg et al. | Sequencing and annotation of the evergrowing locus in peach [Prunus persica (L.) Batsch] reveals a cluster of six MADS-box transcription factors as candidate genes for regulation of terminal bud formation | |
US12234467B2 (en) | Diplospory gene | |
US20200399717A1 (en) | Gene controlling shell phenotype in palm | |
US20230242932A1 (en) | Autoflowering Markers | |
Li et al. | Gynoecy instability in cucumber (Cucumis sativus L.) is due to unequal crossover at the copy number variation-dependent Femaleness (F) locus | |
US20230383308A1 (en) | Modified promoter of a parthenogenesis gene | |
Tang et al. | Fertility restorer gene CaRf and PepperSNP50K provide a promising breeding system for hybrid pepper | |
Liu et al. | Cytological and transcriptional insights of late-acting self-incompatibility in tea plants (Camellia sinensis) | |
Low et al. | Oil Palm Genome: Strategies and Applications | |
CN113754746B (zh) | 水稻雄性育性调控基因、其应用以及利用CRISPR-Cas9调控水稻育性的方法 | |
Chae et al. | Sex-linked gene expression and the reversion to hermaphroditism in Carica papaya L.(Caricaceae) | |
CN117402887B (zh) | 一种玉米雄性育性调控基因ZmMS2085及其突变体与应用 | |
Kaur | Development of an in vivo haploid induction system in rice through distant hybridization and manipulation of CenH3 gene | |
Liut et al. | of ovate family protein gene family associated with number | |
Zerpa Catanho | Genomic analysis of sex chromosomes and sex differentiation in Caricaceae | |
Higgins | Characterization of kinesin motor proteins and evolution of a meiotic drive element in zea mays | |
Wadlington | Characterization of the sex chromosomes in spinach | |
CN113754747A (zh) | 一种水稻雄性育性调控基因突变体及其分子标记和应用 | |
Guo | Mutations in FT-, TFL1-, and FRI paralogs of rapeseed (Brassica napus L.) and their effect on flowering time and heterosis | |
Gschwend | Molecular analysis of sex chromosome evolution in papaya | |
Parvathaneni | Isolation, characterization and the dynamic structure of the pearl millet d2 dwarfing gene | |
Sanei | Analysis of uniparental chromosome elimination in wide crosses |