KR20230085165A - 단위결과성 수박 식물 - Google Patents
단위결과성 수박 식물 Download PDFInfo
- Publication number
- KR20230085165A KR20230085165A KR1020237015642A KR20237015642A KR20230085165A KR 20230085165 A KR20230085165 A KR 20230085165A KR 1020237015642 A KR1020237015642 A KR 1020237015642A KR 20237015642 A KR20237015642 A KR 20237015642A KR 20230085165 A KR20230085165 A KR 20230085165A
- Authority
- KR
- South Korea
- Prior art keywords
- plant
- allele
- seq
- protein
- mutant
- Prior art date
Links
- 241000219109 Citrullus Species 0.000 title claims description 19
- 241000196324 Embryophyta Species 0.000 claims abstract description 720
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 claims abstract description 252
- 235000013399 edible fruits Nutrition 0.000 claims abstract description 239
- 238000004519 manufacturing process Methods 0.000 claims abstract description 35
- 108700028369 Alleles Proteins 0.000 claims description 779
- 108090000623 proteins and genes Proteins 0.000 claims description 693
- 102000004169 proteins and genes Human genes 0.000 claims description 504
- 150000001413 amino acids Chemical class 0.000 claims description 250
- 238000000034 method Methods 0.000 claims description 141
- 230000035772 mutation Effects 0.000 claims description 132
- 208000026487 Triploidy Diseases 0.000 claims description 112
- 230000010152 pollination Effects 0.000 claims description 94
- 210000004027 cell Anatomy 0.000 claims description 82
- 108010066805 F-Box Proteins Proteins 0.000 claims description 67
- 102000018700 F-Box Proteins Human genes 0.000 claims description 67
- 208000035199 Tetraploidy Diseases 0.000 claims description 67
- 230000002829 reductive effect Effects 0.000 claims description 64
- 108020004705 Codon Proteins 0.000 claims description 60
- 210000000349 chromosome Anatomy 0.000 claims description 57
- 108010021466 Mutant Proteins Proteins 0.000 claims description 50
- 102000008300 Mutant Proteins Human genes 0.000 claims description 50
- 230000014509 gene expression Effects 0.000 claims description 50
- 238000012217 deletion Methods 0.000 claims description 42
- 230000037430 deletion Effects 0.000 claims description 42
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 40
- 238000003780 insertion Methods 0.000 claims description 39
- 230000037431 insertion Effects 0.000 claims description 39
- 108020004999 messenger RNA Proteins 0.000 claims description 33
- 238000009396 hybridization Methods 0.000 claims description 22
- 230000003321 amplification Effects 0.000 claims description 17
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 17
- 230000001105 regulatory effect Effects 0.000 claims description 17
- 238000006467 substitution reaction Methods 0.000 claims description 17
- 208000007466 Male Infertility Diseases 0.000 claims description 16
- 238000003306 harvesting Methods 0.000 claims description 16
- 238000005520 cutting process Methods 0.000 claims description 14
- 239000002751 oligonucleotide probe Substances 0.000 claims description 13
- 206010021929 Infertility male Diseases 0.000 claims description 12
- 108020005187 Oligonucleotide Probes Proteins 0.000 claims description 12
- 210000001161 mammalian embryo Anatomy 0.000 claims description 12
- 238000012163 sequencing technique Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 10
- 239000003155 DNA primer Substances 0.000 claims description 7
- 230000012010 growth Effects 0.000 claims description 7
- 230000000644 propagated effect Effects 0.000 claims description 7
- 210000001938 protoplast Anatomy 0.000 claims description 7
- 239000002299 complementary DNA Substances 0.000 claims 1
- 240000008067 Cucumis sativus Species 0.000 abstract description 174
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 abstract description 152
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 abstract description 108
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 abstract description 100
- 244000241235 Citrullus lanatus Species 0.000 abstract 2
- 241000219112 Cucumis Species 0.000 abstract 2
- 235000018102 proteins Nutrition 0.000 description 496
- 244000270200 Citrullus vulgaris Species 0.000 description 345
- 235000001014 amino acid Nutrition 0.000 description 261
- 229940024606 amino acid Drugs 0.000 description 246
- 244000241257 Cucumis melo Species 0.000 description 171
- 101150084750 1 gene Proteins 0.000 description 142
- 239000002773 nucleotide Substances 0.000 description 109
- 125000003729 nucleotide group Chemical group 0.000 description 108
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 101
- 108020004414 DNA Proteins 0.000 description 96
- 238000003556 assay Methods 0.000 description 94
- 239000013615 primer Substances 0.000 description 79
- 230000006870 function Effects 0.000 description 65
- 238000003205 genotyping method Methods 0.000 description 61
- 239000000523 sample Substances 0.000 description 60
- 239000003550 marker Substances 0.000 description 50
- 150000007523 nucleic acids Chemical class 0.000 description 47
- 210000001519 tissue Anatomy 0.000 description 45
- 238000003752 polymerase chain reaction Methods 0.000 description 33
- 108091028043 Nucleic acid sequence Proteins 0.000 description 30
- 102000039446 nucleic acids Human genes 0.000 description 30
- 108020004707 nucleic acids Proteins 0.000 description 30
- 101100501281 Caenorhabditis elegans emb-1 gene Proteins 0.000 description 28
- 231100000350 mutagenesis Toxicity 0.000 description 27
- 239000000047 product Substances 0.000 description 27
- 238000002703 mutagenesis Methods 0.000 description 24
- 238000009395 breeding Methods 0.000 description 22
- 230000001488 breeding effect Effects 0.000 description 20
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 20
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 19
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 19
- 230000002068 genetic effect Effects 0.000 description 19
- 238000001727 in vivo Methods 0.000 description 19
- 108091026890 Coding region Proteins 0.000 description 18
- 230000000295 complement effect Effects 0.000 description 18
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 18
- 108091034117 Oligonucleotide Proteins 0.000 description 17
- 230000008859 change Effects 0.000 description 17
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 16
- 108091033409 CRISPR Proteins 0.000 description 16
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 16
- 230000000694 effects Effects 0.000 description 16
- 235000009849 Cucumis sativus Nutrition 0.000 description 15
- 239000002987 primer (paints) Substances 0.000 description 15
- 108020004485 Nonsense Codon Proteins 0.000 description 14
- 230000037433 frameshift Effects 0.000 description 14
- 238000000338 in vitro Methods 0.000 description 14
- 101710125222 Cyclin-SDS-like Proteins 0.000 description 13
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 12
- 230000005094 fruit set Effects 0.000 description 12
- 230000009261 transgenic effect Effects 0.000 description 12
- 238000001514 detection method Methods 0.000 description 11
- 235000009831 Citrullus lanatus Nutrition 0.000 description 10
- 238000010362 genome editing Methods 0.000 description 10
- 229940113082 thymine Drugs 0.000 description 10
- 108700005079 Recessive Genes Proteins 0.000 description 9
- 102000052708 Recessive Genes Human genes 0.000 description 9
- 230000004720 fertilization Effects 0.000 description 9
- 231100000221 frame shift mutation induction Toxicity 0.000 description 9
- 230000037434 nonsense mutation Effects 0.000 description 9
- 230000012846 protein folding Effects 0.000 description 9
- 241000894007 species Species 0.000 description 9
- 230000037436 splice-site mutation Effects 0.000 description 9
- 208000020584 Polyploidy Diseases 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000005078 fruit development Effects 0.000 description 8
- 230000001776 parthenogenetic effect Effects 0.000 description 8
- 230000002441 reversible effect Effects 0.000 description 8
- 238000012225 targeting induced local lesions in genomes Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 238000010354 CRISPR gene editing Methods 0.000 description 7
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 7
- 238000012408 PCR amplification Methods 0.000 description 7
- 240000003768 Solanum lycopersicum Species 0.000 description 7
- 230000002759 chromosomal effect Effects 0.000 description 7
- 230000010153 self-pollination Effects 0.000 description 7
- 102000053602 DNA Human genes 0.000 description 6
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 6
- 238000002944 PCR assay Methods 0.000 description 6
- 230000002860 competitive effect Effects 0.000 description 6
- 229940104302 cytosine Drugs 0.000 description 6
- 101150107684 emb-1 gene Proteins 0.000 description 6
- 239000003147 molecular marker Substances 0.000 description 6
- 238000007899 nucleic acid hybridization Methods 0.000 description 6
- 210000001672 ovary Anatomy 0.000 description 6
- 238000002708 random mutagenesis Methods 0.000 description 6
- 235000009842 Cucumis melo Nutrition 0.000 description 5
- 241000219104 Cucurbitaceae Species 0.000 description 5
- 101000955067 Homo sapiens WAP four-disulfide core domain protein 2 Proteins 0.000 description 5
- 102100038965 WAP four-disulfide core domain protein 2 Human genes 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000004113 cell culture Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 239000003471 mutagenic agent Substances 0.000 description 5
- 230000004853 protein function Effects 0.000 description 5
- 230000004850 protein–protein interaction Effects 0.000 description 5
- 230000005855 radiation Effects 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- IAKHMKGGTNLKSZ-INIZCTEOSA-N (S)-colchicine Chemical compound C1([C@@H](NC(C)=O)CC2)=CC(=O)C(OC)=CC=C1C1=C2C=C(OC)C(OC)=C1OC IAKHMKGGTNLKSZ-INIZCTEOSA-N 0.000 description 4
- PLUBXMRUUVWRLT-UHFFFAOYSA-N Ethyl methanesulfonate Chemical compound CCOS(C)(=O)=O PLUBXMRUUVWRLT-UHFFFAOYSA-N 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 4
- 238000009015 Human TaqMan MicroRNA Assay kit Methods 0.000 description 4
- 240000005561 Musa balbisiana Species 0.000 description 4
- 235000021015 bananas Nutrition 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 231100000707 mutagenic chemical Toxicity 0.000 description 4
- 238000010899 nucleation Methods 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 102000054765 polymorphisms of proteins Human genes 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 238000003757 reverse transcription PCR Methods 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 238000009331 sowing Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 4
- 108020005544 Antisense RNA Proteins 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 235000002566 Capsicum Nutrition 0.000 description 3
- 238000007400 DNA extraction Methods 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- 206010021518 Impaired gastric emptying Diseases 0.000 description 3
- 239000006002 Pepper Substances 0.000 description 3
- 235000016761 Piper aduncum Nutrition 0.000 description 3
- 240000003889 Piper guineense Species 0.000 description 3
- 235000017804 Piper guineense Nutrition 0.000 description 3
- 235000008184 Piper nigrum Nutrition 0.000 description 3
- 244000061458 Solanum melongena Species 0.000 description 3
- 235000002597 Solanum melongena Nutrition 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000027455 binding Effects 0.000 description 3
- 239000003184 complementary RNA Substances 0.000 description 3
- 230000010154 cross-pollination Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000000796 flavoring agent Substances 0.000 description 3
- 208000001288 gastroparesis Diseases 0.000 description 3
- 238000012239 gene modification Methods 0.000 description 3
- 230000005017 genetic modification Effects 0.000 description 3
- 235000013617 genetically modified food Nutrition 0.000 description 3
- 238000009399 inbreeding Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000008774 maternal effect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000021121 meiosis Effects 0.000 description 3
- -1 melon amino acids Chemical class 0.000 description 3
- 238000002844 melting Methods 0.000 description 3
- 230000008018 melting Effects 0.000 description 3
- 238000002887 multiple sequence alignment Methods 0.000 description 3
- 230000003505 mutagenic effect Effects 0.000 description 3
- 239000003375 plant hormone Substances 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008929 regeneration Effects 0.000 description 3
- 238000011069 regeneration method Methods 0.000 description 3
- 230000008117 seed development Effects 0.000 description 3
- 238000005382 thermal cycling Methods 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 229930192334 Auxin Natural products 0.000 description 2
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 2
- 235000006008 Brassica napus var napus Nutrition 0.000 description 2
- 240000000385 Brassica napus var. napus Species 0.000 description 2
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 2
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 2
- 101100189378 Caenorhabditis elegans pat-3 gene Proteins 0.000 description 2
- 101100232929 Caenorhabditis elegans pat-4 gene Proteins 0.000 description 2
- 229920000742 Cotton Polymers 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 241000219146 Gossypium Species 0.000 description 2
- 108091029795 Intergenic region Proteins 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- UPYKUZBSLRQECL-UKMVMLAPSA-N Lycopene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1C(=C)CCCC1(C)C)C=CC=C(/C)C=CC2C(=C)CCCC2(C)C UPYKUZBSLRQECL-UKMVMLAPSA-N 0.000 description 2
- JEVVKJMRZMXFBT-XWDZUXABSA-N Lycophyll Natural products OC/C(=C/CC/C(=C\C=C\C(=C/C=C/C(=C\C=C\C=C(/C=C/C=C(\C=C\C=C(/CC/C=C(/CO)\C)\C)/C)\C)/C)\C)/C)/C JEVVKJMRZMXFBT-XWDZUXABSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 238000000636 Northern blotting Methods 0.000 description 2
- 240000000905 Nymphoides indica Species 0.000 description 2
- 235000017590 Nymphoides indica Nutrition 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- 244000250129 Trigonella foenum graecum Species 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 244000098338 Triticum aestivum Species 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241000219094 Vitaceae Species 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 230000010165 autogamy Effects 0.000 description 2
- 239000002363 auxin Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000031018 biological processes and functions Effects 0.000 description 2
- 239000011449 brick Substances 0.000 description 2
- 229960001338 colchicine Drugs 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 238000001035 drying Methods 0.000 description 2
- 235000019634 flavors Nutrition 0.000 description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 230000002496 gastric effect Effects 0.000 description 2
- 238000012252 genetic analysis Methods 0.000 description 2
- 235000021021 grapes Nutrition 0.000 description 2
- 238000003018 immunoassay Methods 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 208000021267 infertility disease Diseases 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 229960004999 lycopene Drugs 0.000 description 2
- OAIJSZIZWZSQBC-GYZMGTAESA-N lycopene Chemical compound CC(C)=CCC\C(C)=C\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C=C(/C)CCC=C(C)C OAIJSZIZWZSQBC-GYZMGTAESA-N 0.000 description 2
- 239000001751 lycopene Substances 0.000 description 2
- 235000012661 lycopene Nutrition 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 239000011574 phosphorus Substances 0.000 description 2
- 210000002706 plastid Anatomy 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000005204 segregation Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- ZCIHMQAPACOQHT-ZGMPDRQDSA-N trans-isorenieratene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/c1c(C)ccc(C)c1C)C=CC=C(/C)C=Cc2c(C)ccc(C)c2C ZCIHMQAPACOQHT-ZGMPDRQDSA-N 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- 150000003722 vitamin derivatives Chemical class 0.000 description 2
- XODFRIRFUUFZQV-REOHCLBHSA-N (2s)-2-(dinitroamino)propanoic acid Chemical compound OC(=O)[C@H](C)N([N+]([O-])=O)[N+]([O-])=O XODFRIRFUUFZQV-REOHCLBHSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- FGRBYDKOBBBPOI-UHFFFAOYSA-N 10,10-dioxo-2-[4-(N-phenylanilino)phenyl]thioxanthen-9-one Chemical compound O=C1c2ccccc2S(=O)(=O)c2ccc(cc12)-c1ccc(cc1)N(c1ccccc1)c1ccccc1 FGRBYDKOBBBPOI-UHFFFAOYSA-N 0.000 description 1
- FFRBMBIXVSCUFS-UHFFFAOYSA-N 2,4-dinitro-1-naphthol Chemical compound C1=CC=C2C(O)=C([N+]([O-])=O)C=C([N+]([O-])=O)C2=C1 FFRBMBIXVSCUFS-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 241000269350 Anura Species 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 244000132059 Carica parviflora Species 0.000 description 1
- 235000014653 Carica parviflora Nutrition 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000252254 Catostomidae Species 0.000 description 1
- 108091060290 Chromatid Proteins 0.000 description 1
- 235000012840 Citrullus vulgaris Nutrition 0.000 description 1
- 235000008733 Citrus aurantifolia Nutrition 0.000 description 1
- 235000005979 Citrus limon Nutrition 0.000 description 1
- 244000131522 Citrus pyriformis Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 235000009847 Cucumis melo var cantalupensis Nutrition 0.000 description 1
- 235000015001 Cucumis melo var inodorus Nutrition 0.000 description 1
- 240000002495 Cucumis melo var. inodorus Species 0.000 description 1
- 240000004244 Cucurbita moschata Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 238000007900 DNA-DNA hybridization Methods 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000237858 Gastropoda Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 229930191978 Gibberellin Natural products 0.000 description 1
- 241000132456 Haplocarpha Species 0.000 description 1
- 241000257303 Hymenoptera Species 0.000 description 1
- 206010020649 Hyperkeratosis Diseases 0.000 description 1
- 206010021928 Infertility female Diseases 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 108010006444 Leucine-Rich Repeat Proteins Proteins 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 239000005587 Oryzalin Substances 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000287219 Serinus canaria Species 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241001661355 Synapsis Species 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 240000006909 Tilia x europaea Species 0.000 description 1
- 235000011941 Tilia x europaea Nutrition 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 235000001484 Trigonella foenum graecum Nutrition 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 102000005506 Tryptophan Hydroxylase Human genes 0.000 description 1
- 108010031944 Tryptophan Hydroxylase Proteins 0.000 description 1
- 208000024780 Urticaria Diseases 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 230000036579 abiotic stress Effects 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 206010000210 abortion Diseases 0.000 description 1
- 231100000176 abortion Toxicity 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009418 agronomic effect Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 238000007844 allele-specific PCR Methods 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 238000000540 analysis of variance Methods 0.000 description 1
- 239000003080 antimitotic agent Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 230000004790 biotic stress Effects 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000002962 chemical mutagen Substances 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000004756 chromatid Anatomy 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 230000009137 competitive binding Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 238000009402 cross-breeding Methods 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 210000001840 diploid cell Anatomy 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 230000008126 female flower development Effects 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 229940014144 folate Drugs 0.000 description 1
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 1
- 235000019152 folic acid Nutrition 0.000 description 1
- 239000011724 folic acid Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000008369 fruit flavor Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000003144 genetic modification method Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 239000003448 gibberellin Substances 0.000 description 1
- IXORZMNAPKEEDV-OBDJNFEBSA-N gibberellin A3 Chemical class C([C@@]1(O)C(=C)C[C@@]2(C1)[C@H]1C(O)=O)C[C@H]2[C@]2(C=C[C@@H]3O)[C@H]1[C@]3(C)C(=O)O2 IXORZMNAPKEEDV-OBDJNFEBSA-N 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 210000003783 haploid cell Anatomy 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000003898 horticulture Methods 0.000 description 1
- 101150063121 iaaM gene Proteins 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 210000004901 leucine-rich repeat Anatomy 0.000 description 1
- 239000004571 lime Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 238000003204 nucleic acid hybridization-based method Methods 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000002420 orchard Substances 0.000 description 1
- UNAHYJYOSSSJHH-UHFFFAOYSA-N oryzalin Chemical compound CCCN(CCC)C1=C([N+]([O-])=O)C=C(S(N)(=O)=O)C=C1[N+]([O-])=O UNAHYJYOSSSJHH-UHFFFAOYSA-N 0.000 description 1
- 230000008186 parthenogenesis Effects 0.000 description 1
- 101150101567 pat-2 gene Proteins 0.000 description 1
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical group [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 1
- 238000005554 pickling Methods 0.000 description 1
- 210000002826 placenta Anatomy 0.000 description 1
- 108091007030 plant F-box proteins Proteins 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000002331 protein detection Methods 0.000 description 1
- 238000001273 protein sequence alignment Methods 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- RCTGMCJBQGBLKT-PAMTUDGESA-N scarlet red Chemical compound CC1=CC=CC=C1\N=N\C(C=C1C)=CC=C1\N=N\C1=C(O)C=CC2=CC=CC=C12 RCTGMCJBQGBLKT-PAMTUDGESA-N 0.000 description 1
- 229960005369 scarlet red Drugs 0.000 description 1
- 230000009919 sequestration Effects 0.000 description 1
- 230000003584 silencer Effects 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 235000001019 trigonella foenum-graecum Nutrition 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H6/00—Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
- A01H6/34—Cucurbitaceae, e.g. bitter melon, cucumber or watermelon
- A01H6/342—Citrullus lanatus [watermelon]
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H1/00—Processes for modifying genotypes ; Plants characterised by associated natural traits
- A01H1/12—Processes for modifying agronomic input traits, e.g. crop yield
- A01H1/121—Plant growth habits
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
- A01H5/08—Fruits
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/13—Plant traits
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Botany (AREA)
- Developmental Biology & Embryology (AREA)
- Environmental Sciences (AREA)
- Organic Chemistry (AREA)
- Physiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Natural Medicines & Medicinal Plants (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Pretreatment Of Seeds And Plants (AREA)
- Cultivation Of Plants (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 씨없는 과실을 생산하는 수박, 오이 또는 멜론 식물에 관한 것이다. 본 발명은 또한 상기 식물을 생산하는 방법 및 씨없는 수박, 오이 또는 멜론 과실을 생산하는 방법을 포함한다.
Description
본 발명은 WAP5.1로 지칭되는 열성 유전자의 돌연변이체 대립유전자의 존재로 인해 암꽃의 수분 없이 씨없는 과실을 생산하는 단위결과성 수박 식물에 관한 것이다. 돌연변이체 대립유전자가 동형접합 형태인 경우, 수분되지 않은 꽃은 씨없는 과실을 생산한다. 그러나, 꽃이 수분되는 경우, 정상적인 씨있는 과실이 생산된다. 이 형질은 통성 단위결과로 지칭된다. 본 발명은 또한 상기 식물을 생산하는 방법 및 씨없는 수박 과실의 생산을 위한 wap5.1로 지칭되는 돌연변이체 대립유전자의 용도를 포함한다.
대부분의 상업용 씨없는 과실은 정상적으로 과실이 과실의 과육 전체에 걸쳐 분포된 상대적으로 크고 단단한 수많은 종자를 함유하는 식물로부터 개발되었다. 씨없는 과실은 예를 들어 수박, 토마토, 오이, 가지, 포도, 바나나, 감귤류의 과실, 예컨대 오렌지, 레몬 및 라임에 대해 공지되어 있다. 씨없는 과실은 일반적으로 더 쉽고 더 편리하게 소비되기 때문에 가치있는 것으로 간주된다.
과실 발달은 정상적으로 꽃의 배주 구획에 있는 하나 이상의 난세포가 화분으로부터의 웅핵에 의해 수정될 때 시작된다.
씨없는 과실은 두 가지 상이한 현상으로 인해 발생할 수 있다. 일부 경우에 화분에 의한 배주의 수정 없이 과실이 발달하는데, 이는 단위결과로 공지된 현상이다. 다른 경우에 씨없는 과실은 수분 후에 종자 (배아 및/또는 내배유) 성장이 억제되거나 종자가 일찍 사멸하지만 과실의 나머지는 계속 성장할 때 발생한다 (위단위결과). 단위결과와는 대조적으로, 위단위결과는 과실 성장의 개시를 위해 수분을 필요로 한다.
씨없는 오렌지 과실은 단위결과의 예이다. 일부 오렌지 품종 (예를 들어, 네이블(Navel))은 생존가능한 화분을 생산하지 않는다. 그러나, 이들은 다른 품종으로부터의 화분과 교차-수분될 수 있다. 과수원에서 웅성 불임 품종만이 성장될 경우, 수분이 없고 단위결과성 씨없는 과실이 생산될 것이다. 각각의 오렌지 나무의 번식은 일반적으로 삽목 후 또 다른 근경에 접목하여 수행된다.
씨없는 바나나는 3배체이다. 일부 경우에 수분이 정상일 수 있지만, 대부분의 과실에는 씨가 없다. 이는 염색체의 고르지 않은 세트 (3x)로 인해 감수분열 동안 염색체의 부적절한 분열로 이어지고 그 결과, 생존불가능한 화분이 생산되는 것으로 설명된다. 수정 없이, 3배체 바나나는 또한 씨없는 과실을 결실하고 발달시킬 수 있다. 수분이 일어나는 경우에도, 300개의 과실 중 최대 1개가 몇 개의 종자를 포함한다. 이는 설명된 이유 때문에 3배체 화분이 비생존가능하기 때문일 수 있다. 따라서, 바나나 식물은 일반적으로 단위결과성인 것으로 볼 수 있다. 바나나 식물은 일반적으로 주 줄기의 바닥에 있는 측면 새싹 또는 흡지로부터 무성 번식되며, 이는 제거되고 재배종을 계속하기 위해 재식될 수 있다. 재배자들은 또한 특히 무병 물질을 생산하기 위해 조직 배양에 의해 바나나를 번식시킨다.
씨없는 오이, 씨없는 호박 및 씨없는 가지는 예를 들어 수분이 손상된 조건 (예를 들어, 낮은 온도) 하에 수분 없이 씨없는 과실을 생산할 수 있는 작물의 예이다 (단위결과). 그럼에도 불구하고, 상업용 품질 과실이 이들 조건 하에 생산될 수 있다. 그러나 이들 모든 작물은 수분 시 종자 보유 과실을 생산할 수 있다. 따라서, 이들 작물은 통성 단위결과성이다. 작물의 번식은 자가- 또는 타가 수분, 시험관내 번식, 및 접목에 의해 수행될 수 있다.
토마토 돌연변이체로부터, 정상적인 수분/수정이 손상된 조건 하에 (예를 들어, 낮은 온도의 환경 하에) 씨없는 과실을 생산할 수 있는 것이 또한 공지되어 있다. 그러므로, 이들 돌연변이체는 또한 통성 단위결과성이다. 이 표현형을 나타내는 것으로 공지된 돌연변이체는 pat, pat-2 및 pat-3/pat-4 시스템이다. 이들 돌연변이의 기저에 있는 유전자는 공지되어 있지 않으며, pat-3/pat-4 시스템은 다중 로커스에 의존하는 것으로 보인다.
단위결과는 또한 유전자 변형에 의해 여러 식물 종에 도입되었다. 배주 및 태반 특이적 DefH9 프로모터의 제어 하에 옥신 합성을 부여하는 박테리아 트립토판 모노옥시게나제 (iaaM)의 발현은 오이 (Yin et al., 2006, Clular & molecular Biotech. Letters 11, 279-290), 가지 (Acciarri et al., 2002, BMC Biotech. 2(4)), 토마토 (Rotino et al., 2005, BMC Biotech. 5(32)) 및 담배에서 단위결과를 유도하였다.
이들 트랜스제닉 식물은 종자 및 과실 발달에서 식물 호르몬의 중요성을 입증한다. 종자 및 과실 발달이 다른 인자 외에 여러 식물 호르몬의 강력한 제어 하에 있다는 것은 관련 기술분야에 널리 공지되어 있다. 과실의 씨없음의 논리적 결과를 포함하여 단위결과가 또한 예를 들어 식물 호르몬, 특히 옥신 또는 지베렐린의 외인성 적용에 의해 유도될 수 있다 (Ruan et al., Trends in Plant Sci. 17(11), 1360-1385).
현재 육종가에 의해 생산되는 씨없는 수박은 위단위결과성 작물의 예이다. 정상적인 수박 식물은 2배체 (2n)이다. 씨없는 과실 생산 수박은 웅성 2배체 (2n) 수박 식물과 자성 4배체 (4n) 수박 식물의 교배에 의해 생산된 하이브리드이다. 생성된 F1 하이브리드 종자는 3배체 (3n)이다. 3배체 F1 하이브리드 식물의 과실 결실의 유도는 수분을 필요로 한다. 3배체 (3n) F1 하이브리드 식물은 가임성 화분을 생산하지 않기 때문에, 소위 화분매개자 또는 수분수 식물은 동일한 밭에 식재되어야 한다. 화분매개자 식물은 2배체 (2n)이다. 일반적으로 모든 F1 하이브리드 식물을 수분하기 위한 충분한 화분을 제공하기 위해 주어진 체계에서 대략 1 대 3의 화분매개자 대 하이브리드 식물의 비율이 식재되어야 한다. 2배체 (2n) 화분매개자 및 자성 3배체 (3n) 하이브리드 식물의 꽃 사이의 교차-수분은 과실 결실을 유도하고 3배체 하이브리드 식물에서 씨없는 3배체 과실의 생산을 유발한다. F1 하이브리드의 2배체 (2n) 및 4배체 (4n) 부모는 각각 종자 보유 과실을 생산하며 둘 다 자가-수분에 의해 서로 독립적으로 번식될 수 있다.
씨없는 포도는 단위결과 또는 위단위결과인 식물로부터 생산될 수 있다. 품종 블랙 코린트(Black Corinth)는 단위결과인 반면, 술타니나(Sultanina)는 위단위결과이다. 포도나무 식물은 일반적으로 삽목 및 또 다른 근경에의 연속적인 접목에 의해 번식된다.
감수분열의 불규칙성은 식물이 씨없는 과실을 생산하도록 유발하는 인자가 될 수 있다. 씨없는 과실을 생산하는 식물의 예는 씨없는 수박을 개시하는 문헌 [Zhang et al. (2012, Scientia Horticulture 140, 107-114)]에 제공된다. 종자에 감마선을 조사한 후 F1-하이브리드의 자손으로부터 웅성 및 자성 불임 (MFS) 돌연변이체를 수득하였다. MFS 돌연변이체로부터의 화분은 전혀 생존가능하지 않았다. 웅성 가임성 식물로부터의 화분으로 수분될 때 MFS 식물에 의해 씨없는 과실이 생산된다. 따라서 MFS 수박 식물은 위단위결과성으로 분류될 수 있다. 상이한 웅성 가임성 식물로부터의 화분과 MFS 돌연변이체의 교차-수분 시 거의 종자가 생산되지 않았기 때문에 배주는 또한 거의 완전히 생존불가능하였다. MFS 돌연변이체에서 불완전한 시냅시스 및 감수분열 동안 염색분체의 비정상적인 분리가 관찰되었으며, 이는 웅성 및 자성 불임의 원인으로 여겨졌다. MFS 돌연변이체에 존재하는 효과를 담당하는 유전자는 식별되지 않았지만, MFS 돌연변이체의 표현형은 단일 열성 유전자로 인한 것으로 보인다.
상기 논의로부터, 식물이 씨없는 과실을 생산하는지 여부를 결정하는 인자는 본질적으로 여러 가지이며 여러 원인, 예를 들어 형태학적, 생리학적 및/또는 유전적 원인으로 존재할 수 있음이 분명하다.
위단위결과성 작물, 예컨대 3배체 (3n) 수박 식물에서 씨없는 과실을 생산하기 위해, 식물의 암꽃 부분이 수분되어야 한다. 오늘날 성장되는 위단위결과성 작물은 웅성 불임이다. 그 결과, 자성 식물 외에, 상이한 웅성 가임성 식물 (화분매개자 또는 수분수)은 또한 동일한 밭에서 성장되어야 한다. 화분매개자 식물에 사용되는 면적은 씨없는 과실 생산 자성 식물에 이용가능한 면적을 희생하기 때문에, 재배 하에 면적당 수확량이 감소된다. 일반적으로, 화분매개자 식물은 또한 자가-수분될 수 있는 정상적인 식물이다. 그러나 화분매개자 식물에 의해 생산된 과실은 종자를 생산한다. 수박에서, 화분매개자 식물은 정상적으로 2배체 (2n)이며, 이는 자가-수분 시 씨있는 과실을 생산하고, 이는 일부 예에서 또한 수확되고 별도로 판매될 수 있다 (WO2012069539 참조). 상업적인 이유로 화분매개자 식물로부터의 이들 씨있는 과실은 씨없는 과실과 혼합되어서는 안된다. 따라서, 씨없는 과실 및 씨있는 과실은 수확 시 또는 수확 후에 분리되도록 보장되어야 하며, 이는 기계 수확을 어렵거나 불가능하게 하거나 수확 후 추가 가공 단계를 필요로 할 수 있다. 이러한 추가 예방조치는 씨없는 과실 생산의 투입 비용을 증가시킨다. 또한, 화분매개자 식물은 개화하고 충분한 생존가능한 화분을 생산함과 동시에 자성 식물 꽃 및 이의 암술머리가 과실 결실의 유도를 위해 화분을 받아들일 수 있도록 개발된다. 그러므로, 화분매개자 식물은 개화 및 수정 시기와 관련하여 씨없는 과실을 생산하는 자성 식물과 맞아야 한다. 화분매개자 식물 및 각 자성 식물의 개화 시기가 충분히 동기화되지 않으면, 수분이 일어나지 않거나 불충분한 경우에만 일어난다. 그 결과, 위단위결과성 자성 식물에 의해 더 적은 과실이 생산된다. 또한, 비, 열 등과 같은 기후 조건이 유전자형 상이한 자성 식물의 암술머리 가임성 시기와는 상이하게 수분수 식물의 화분 생산에 영향을 미칠 수 있다는 것은 관련 기술분야에 널리 공지되어 있다. 따라서, 기후 조건은 또한 수확량을 낮추는 효과와 함께 화분매개자 및 자성 식물의 가임성 시기의 비동기성을 유발할 수 있다.
본 발명자들은 본원에서 WAP5.1 유전자로 지칭되는 재배 수박에서 단일 열성 유전자를 돌연변이시키는 것이 꽃이 수분되지 않을 때 수박 식물이 씨없는 과실을 발달시키는 것, 즉 단위결과를 초래한다는 것을 발견하였다. 꽃이 수분되면, 발달하는 과실은 정상적인 생존가능한 종자를 생산한다. 따라서, 이러한 유형의 단위결과는 수분의 부재 하에서만 볼 수 있으므로 통성 단위결과로 지칭된다. 따라서, WAP5.1 유전자는 수박에서 통성 단위결과를 담당한다. 그러므로, 돌연변이체 wap5.1 대립유전자가 본원에서 wap5.1/wap5.1로 표시되는 2배체 수박 식물에서 동형접합 형태로 존재하는 경우, 식물은 통성 단위결과성이고 비수분된 꽃으로부터 씨없는 과실 및 수분된 꽃으로부터 정상적인 씨있는 과실을 생산한다.
이 유전자는 2배체 수박에서 큰 장점을 가지며, 특히 암꽃의 수분의 부재를 보장하기 위해 웅성 불임 (MS)과 조합된 경우 (식물에서 생산된 수꽃이 불임이기 때문에) 또는 수분이 발생하는 경우, 식물의 emb1 돌연변이체의 동형접합성 존재로 인해 과실에 씨가 없는 것을 보장하기 위해 emb1 돌연변이체 (예를 들어, 동형접합 형태, emb1/emb1)와 조합된 경우에 그러하다. emb1 돌연변이체는 수분 시 씨없는 과실이 생산되도록 초래하는 위단위결과 돌연변이체이다. emb1 돌연변이체 대립유전자를 포함하는 종자는 수탁 번호 NCIMB42532로 2016년 1월 27일에 넌헴스 비.브이.(Nunhems B.V.)에 의해 기탁되었다.
WAP5.1 유전자는 또한 예를 들어 돌연변이체 대립유전자의 2 또는 3개 카피를 갖는 3배체 수박에서 큰 장점을 가지며, 이는 더 이상 이러한 3배체 수박 식물을 수분자 식물 (이는 정상적으로 야생형 WAP5.1 대립유전자의 3개 카피를 갖는 정상적인 3배체에서 과실 결실을 유도하는데 필요함)로 내식할 필요가 없기 때문이다. 이들 단위결과성 3배체 식물은 과실 결실을 유도하기 위해 수분의 필요 없이 씨없는 과실을 생산한다. 따라서, 기본적으로 정상적인 3배체 수박의 위단위결과성 성질이 단위결과로 변화된다. 씨없는 3배체 과실의 수확량은 이에 의해 크게 증가되며, 이는 수분자 식물이 밭에서 더 이상 필요하지 않고 전체 밭이 3배체 수박 식물을 포함할 수 있기 때문이다.
수분이 발생할 수 없도록 곤충-방지 온실에서 성장된 돌연변이유발된 M2 2배체 수박 식물의 집단에서, 비수분된 암꽃으로부터 씨없는 과실을 생산하는 식물 (도 1 참조)이 20,000개 초과의 식물을 스크리닝할 때 관찰되었다. 과실은 공지된 3배체 씨없는 과실에서 볼 수 있는 것과 유사한 모계 기원의 외피의 일부 흔적만을 함유하였다. 유전자 분석은 해당 형질이 단일 열성 유전자로서 격리되었음을 나타내었다. 유전자는 WAP5.1로 지정되었고, 돌연변이체 대립유전자는 wap5.1로 지정되었다.
단일 식물 계통과 상이한 유전적 배경을 갖는 여러 F2 맵핑 집단이 생성되었으며, 이는 단위결과성 과실을 생산할 수 있었다. 2개의 상이한 배경으로부터 유래된 2개의 F2 집단을 표현형분석하고 유전자형분석하였다. QTL은 염색체 5 상의 0.47 Mb 영역에 맵핑되었으며, 이는 2개의 돌연변이를 함유하였으며, 그 중 하나는 유전자간 영역에 있고 또 다른 하나는 유전자에 있으며, 고도로 보존된 아미노산을 류신에서 페닐알라닌 (L528F)으로 변화시킨다. 도 2는 각각 서열식별번호(SEQ ID NO): 1 및 서열식별번호: 4의 야생형 및 돌연변이체 WAP5.1 단백질의 아미노산 서열을 보여준다. 실선 박스는 고도로 보존된 F-박스 도메인을 보여주고, 파선 박스는 고도로 보존된 LRR 도메인 (류신 풍부 반복 도메인)을 보여준다. 도 3a는 야생형 WAP5.1 단백질의 3차원 구조를 보여주며, 단백질의 C-말단에 있는 LRR-도메인의 고도로 정렬된 구조를 보여준다. F-박스는 단백질의 N-말단에 있고, F-박스 다음 단백질의 나머지 부분 (즉, LRR-도메인)은 나선, 베타-브릿지 및 코일에 의해 일종의 꼬리 구조로 폴딩된다. 돌연변이체 wap5.1 단백질에서 페닐알라닌 (즉, L528F 돌연변이)에 의해 대체된 것으로 밝혀진 아미노산 류신 L528의 위치는 도 3a에 표시되어 있으며, LRR-도메인의 코일 영역의 일부이다. 도 3b는 L528F 돌연변이체의 3차원 구조를 보여주며, 여기서 LRR-도메인은 꼬리 구조로 적절하게 폴딩하지 않고 아미노산의 전체 스트레치 (예를 들어 Q581 포함)는 루프에서 튀어나온 것으로 보인다. 적절한 폴딩 (3-D 구조)을 갖지 않는 돌연변이체 단백질은 생체내에서 전혀 기능을 하지 않거나 야생형 단백질과 비교하여 손상된 생체내 기능을 가지며, 이에 의해 돌연변이체가 동형접합 형태일 때 (통성) 단위결과의 표현형을 유발하는 것으로 생각된다.
수박의 게놈에서, 야생형 유전자는 염색체 5에서 발견되며, 예를 들어 cucurbitgenomics.org에서 발견된 찰스턴 그레이 V2 게놈에서 발견되고, WAP5.1 유전자는 ClCG05G015740.1로 라벨링되고 뉴클레오티드 27630305에서 시작하여 뉴클레오티드 27637763에서 끝나는 플러스 가닥에서 발견된다. "F-박스/LRR 반복부" 단백질을 코딩한다고 하지만, 생체내 기능 또는 표현형은 공지되어 있지 않다. 돌연변이체가 생성된 수박 계통 (TY-계통으로 지칭됨)에 찰스턴 그레이 V2 게놈의 야생형 WAP5.1 단백질과 상이한 단일 아미노산이 존재한다. 이 단일 아미노산은 아미노산 번호 51이며, 이는 찰스턴 그레이(Charleston Grey) 게놈의 유전자에 의해 코딩된 WAP5.1 단백질의 글리신 (G)이지만, TY-계통에 의해 코딩된 단백질의 아르기닌 (R)이다. 따라서 야생형 WAP5.1 단백질은 예를 들어 서열식별번호: 1 (G51) 또는 서열식별번호: 9 (R51)의 서열을 갖는다. 본원에서 수박의 야생형 WAP5.1 단백질 (또는 야생형 WAP5.1 단백질을 코딩하는 유전자)을 언급할 때, 따라서, 한 측면에서 서열식별번호: 1의 단백질 또는 서열식별번호: 9의 단백질, 또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질이 언급된다. R51이 또한 다른 수박, 예컨대 품종 97103 (V2, cucurbitgenomics.org)에서 발견된다. 이 게놈에서 유전자는 Cla97C05G096710이라고 불리며, 뉴클레오티드 위치 25813434 내지 25820323 (+ 가닥)에 있는 염색체 5에 위치된다. 이 유전자에 의해 코딩된 야생형 WAP5.1 단백질은 서열식별번호: 9의 TY-계통의 야생형 단백질과 100% 동일하다.
도 4에 나타낸 바와 같이 오이 및 멜론에 대한 공개 데이터베이스로부터 오르토로거스 단백질이 수득되었다 (본원에서 서열식별번호: 2는 오이 WAP5.1 오르토로그이고, 서열식별번호: 3은 멜론 WAP5.1 오르토로그임). 도 4에서 볼 수 있는 것은 F-박스 도메인 및 LRR-도메인이 둘 다 이들 3개의 단백질 사이에서 고도로 보존되어 있고, F-박스 앞의 N-말단 아미노산 서열이 더 가변적 (즉 덜 보존됨)이라는 것이다. F-박스 도메인은 수박, 멜론 및 오이 WAP5.1 단백질 간에 100% 동일하고 (도 4 참조), LRR-도메인은 수박 및 오이 간에 96.2%, 수박 및 멜론 간에 98%, 및 오이 및 멜론 간에 97.8% 동일하다 (엠보스-니들(Emboss-Needle)을 사용한 쌍별 정렬에서). 이는 공지된 F-박스/LRR 도메인 단백질에 대한 연구와 일치하며, 예를 들어 식물의 F-박스 단백질에 대한 검토 (Xu et al. 2009, PNAS vol. 106, no. 3, pp 835-840) 및 아라비돕시스(Arabidopsis) SLOMO F-박스/LRR 단백질에 대한 연구 (Lohmann et al., 2010, The Plant Cell, Vol. 22: 335-348)를 참조한다. 흥미롭게도, 로만(Lohmann) 등은 3개의 상이한 SLOMO 돌연변이체, slomo-1, slomo-2 및 slomo-3을 비교하였으며, 여기서 slomo-1은 LRR-도메인에 단일 아미노산 치환을 가졌고, slomo-2는 LRR-도메인 앞에 조기 정지-코돈을 가졌고, slomo-3은 제1 인트론에 T-DNA 삽입을 가졌으며, 단백질 생산을 방지한다 (예를 들어 보충 도 2 A 참조). 3개의 돌연변이체 모두는 기능 상실을 갖는 것으로 기재되어 있지만, LRR-도메인의 단일 아미노산 치환이 가장 강한 표현형을 갖는다는 점이 또한 언급되어 있다. 그러므로, 단일 아미노산 대체는 돌연변이체 단백질로 이어져, 기능 상실 또는 표현형이 강하게 발현되는 이러한 감소된 기능을 초래할 수 있으며, 이는 아마도 LRR-도메인의 3차원 구조 (예컨대 올바른 폴딩 및/또는 다른 단백질 또는 기질과의 상호작용)가 영향을 받기 때문일 것이다.
WAP5.1 단백질에 돌연변이를 함유하는 추가 수박 식물이 TILLING 집단에서 생성되고 식별되었으며, 돌연변이체 대립유전자가 동형접합 형태인 경우에 이들 각각이 또한 수박에 통성 단위결과를 부여하는지 여부가 확인될 것이다. L528F 돌연변이체의 잘못된 단백질 폴딩이 표현형의 원인이 되는 것으로 보이기 때문에, 잘못된 단백질 폴딩 또는 기질 또는 다른 단백질과의 잘못된 상호작용을 유발하는 임의의 돌연변이가 단백질의 감소된 기능 또는 기능 상실, 및 이에 의해 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 유발할 것이라고 가정하는 것이 합리적이다. 명백히, 또한 예를 들어 LRR 도메인의 전부 또는 일부의 말단절단을 유발하는 돌연변이는 단백질의 감소된 기능 또는 기능 상실, 및 이에 의해 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 유발할 것이다. 유사하게, 단백질의 조절 영역, 예컨대 프로모터 또는 인핸서에 하나 이상의 돌연변이를 포함하는 돌연변이체 wap5.1 대립유전자는 감소된 활성 야생형 단백질이 생성되거나 생성되지 않도록 초래하며, 이에 의해 동일하게 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 초래할 것으로 예상된다.
현재까지 수박에서 표 1에 나타낸 바와 같이 총 9개의 돌연변이체 대립유전자가 식별되었다. 생성된 돌연변이체 단백질이 야생형 WAP5.1 단백질과 비교하여 변화된 3차원 구조를 갖는 것으로 예측되는지 여부는 RaptorX 접촉 예측 (본원에서 RaptorX 구조 예측으로도 지칭됨)을 사용하여 추정되었다.
표 1
언급된 바와 같이, 적어도 야생형 단백질과 비교하여 고도로 보존된 F-박스 또는 LRR-도메인에 아미노산 치환을 갖거나, 또는 F-박스 또는 LRR-도메인의 전부 또는 일부의 부재를 초래하는 조기 정지 코돈을 갖고/거나, 및/또는 야생형 WAP5.1 단백질과 비교하여 변형된 3차원 구조/잘못된 3차원 폴딩을 보여줄 것으로 예측되는 돌연변이체 단백질은 돌연변이체 대립유전자가 동형접합 형태인 경우에 표현형을 보여줄 것이며 (즉, 식물은 통성 단위결과를 보여줄 것임), 즉 돌연변이체 대립유전자가 동형접합 형태인 경우, 예를 들어 2배체 식물에 있는 경우에 수분 없이 씨없는 과실 및 수분될 때 씨있는 과실을 생산할 것으로 예상된다. 이것이 사실인지 여부는 돌연변이체 wap5.1 대립유전자에 대해 동형접합성인 식물을 생성하고, 이를 수분의 부재 하에 성장시키고, 이들 환경 하에 씨없는 과실을 생산하는지 여부 및 수분될 때 씨있는 과실을 생산하는지 여부를 분석함으로써 테스트될 수 있다. 분명히, 다른 돌연변이체 wap5.1 대립유전자는 수박, 오이 또는 멜론 WAP5.1 유전자에서 예를 들어 무작위 돌연변이유발 또는 표적화된 돌연변이유발에 의해 생성될 수 있다.
상기 돌연변이체, 또는 식물의 내인성 WAP5.1 유전자의 다른 돌연변이체는 예를 들어 무작위 돌연변이유발 또는 표적화된 돌연변이유발, 예컨대 CRISPR-기반 방법에 의해 생성될 수 있다. 표적화된 유전자 편집의 검토는 예를 들어 문헌 [Erpen-Dalla Corte et al. in Plants 2019, 8, 601 (doi:10.3390/plants8120601)] 및 [Bed Prakash Bhatta and Subas Malla in Plants 2020, 9, 1360; doi:10.3390/plants9101360]에 제공된다. Crispr-기반 편집은 또한 수박 및 다른 호로과 작물에서 이미 수행되었으며, 그러므로 수박, 멜론 또는 오이, 또는 오르토로거스 유전자를 포함하는 기타 호로과 종의 내인성 WAP5.1 유전자를 편집하기 위해 통상의 기술자에 의해 사용될 수 있다.
보존된 F-박스 도메인 및/또는 LRR-도메인 (또는 단백질의 다른 부분)에서의 돌연변이와 관련하여, 한 측면에서 특히 아미노산 대체를 유발하는 돌연변이 (여기서 야생형 아미노산 및 대체된 아미노산의 특성은 상이함)는 본원의 한 측면이며, 이와 같이 상이한 아미노산 특성은 단백질 또는 도메인의 적절한 폴딩 및/또는 정상적인 기능을 감소 또는 폐지할 것이다. 따라서, 예를 들어 비극성 아미노산을 극성 아미노산 (친수성 측쇄 포함)으로 대체하는 것 (또는 그 반대도 마찬가지임), 또는 하전된 측쇄를 갖는 아미노산을 비하전된 또는 상이하게 하전된 측쇄를 갖는 아미노산으로 대체하는 것. 비극성 아미노산은 알라닌 (A 또는 Ala), 시스테인 (C 또는 Cys), 글리신 (G 또는 Gly), 이소류신 (I 또는 Ile), 류신 (L 또는 Leu), 메티오닌 (M 또는 Met), 페닐알라닌 (F 또는 Phe), 프롤린 (P 또는 Pro), 트립토판 (W 또는 Trp), 발린 (V 또는 Val)이다. 극성 아미노산은 아르기닌 (R 또는 Arg), 아스파라긴 (N 또는 Asn), 아스파르테이트 (D 또는 Asp), 글루타메이트 (E 또는 Glu), 글루타민 (Q 또는 Gln), 히스티딘 (H 또는 His), 리신 (K 또는 Lys), 세린 (S 또는 Ser), 트레오닌 (T 또는 Thr), 티로신 (Y 또는 Tyr)이다.
그러므로, 한 측면에서 F-박스 도메인의 24개의 비극성 아미노산 중 임의의 하나 (또는 그 초과)는 극성 아미노산에 의해 대체되고/거나, F-박스 도메인의 17개의 극성 아미노산 중 임의의 하나 (또는 그 초과)는 비극성 아미노산에 의해 대체된다. 그 후, 생성된 돌연변이체 대립유전자는 돌연변이체 대립유전자에 대해 동형접합성인 식물을 생성하고 표현형을 분석함으로써 이의 기능에 대해 테스트될 수 있다. 돌연변이체 대립유전자가 식물이 통성 단위결과성이 되도록 초래하는 경우, 돌연변이체 대립유전자는 생체내에서 감소된 기능을 갖거나 기능을 갖지 않는 돌연변이체 wap5.1 단백질을 코딩하는 대립유전자이다.
한 측면에서 수박 WAP5.1 유전자는 WAP5.1 단백질을 코딩하는 유전자이며, 여기서 WAP5.1 단백질은 서열식별번호: 1 또는 서열식별번호: 9의 단백질, 또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 포함하는 단백질이다. 수박 WAP5.1 유전자는 시트룰루스 라나투스(Citrullus lanatus) WAP5.1의 경우에 ClWAP5.1로도 지칭될 수 있다. 서열식별번호: 1의 야생형 단백질은 예를 들어 찰스턴 그레이 게놈에서 발견되는 단백질이지만, 다른 재배 수박, 예컨대 본원에서 사용된 계통 TY 또는 동아시아 품종 97103 (이의 게놈은 또한 시퀀싱되었고 cucurbitgenomics.org에서 V1 및 V2로 제공됨)은 1 또는 2개의 아미노산의 작은 차이를 함유하며, 즉 단백질은 서열식별번호: 1과 99.9% 또는 99.8% 동일하다. 따라서, 다른 재배 수박은 서열식별번호: 1에 대해 적어도 94%, 95%, 96%, 97%, 98% 또는 99% 또는 99.5% 또는 99.8% 또는 99.9% 서열 동일성을 갖는 야생형 (기능적) WAP5.1 단백질을 코딩하는 WAP5.1 유전자를 함유한다. 예는 서열식별번호: 9의 단백질을 코딩하는 유전자이며, 이는 서열식별번호: 1의 단백질과 단일 아미노산 (아미노산 51)만이 상이하다. 그러므로 서열식별번호: 1 및 서열식별번호: 9는 아미노산 서열에서 99.9% 동일하고, 둘 다 기능적 (야생형) WAP5.1 단백질이다. 이들 야생형 단백질을 코딩하는 유전자를 포함하는 수박 식물은 단위결과성이 아니며, 즉 이들은 수분 후에만 과실을 생산한다.
또 다른 측면에서 오이 WAP5.1 유전자는 WAP5.1 단백질을 코딩하는 유전자이며, 여기서 WAP5.1 단백질은 서열식별번호: 2의 단백질 또는 서열식별번호: 2에 대해 적어도 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질이다. 오이 WAP5.1 유전자는 쿠쿠미스 사티부스(Cucumis sativus) WAP5.1의 경우에 CsWAP5.1로도 지칭될 수 있다.
또 다른 측면에서 멜론 WAP5.1 유전자는 WAP5.1 단백질을 코딩하는 유전자이며, 여기서 WAP5.1 단백질은 서열식별번호: 3의 단백질 또는 서열식별번호: 3에 대해 적어도 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질이다. 멜론 WAP5.1 유전자는 쿠쿠미스 멜로(Cucumis melo) WAP5.1의 경우에 CmWAP5.1로도 지칭될 수 있다.
본 발명의 한 측면에서 식물 또는 식물 세포가 상응하는 야생형 식물 세포와 비교하여 WAP5.1 단백질의 감소된 활성을 갖는 것을 특징으로 하는 식물 또는 식물 세포가 제공되며, 여기서 야생형 식물 세포의 WAP5.1 단백질은 하기로 이루어진 군으로부터 선택된 핵산 분자에 의해 코딩된다:
a) 서열식별번호: 1 또는 서열식별번호: 9 (수박) 또는 서열식별번호: 2 (오이) 또는 서열식별번호: 3 (멜론)에 주어진 아미노산 서열을 갖는 단백질을 코딩하는 핵산 분자;
b) 서열식별번호: 1 또는 서열식별번호: 9 (수박) 또는 서열식별번호: 2 (오이) 또는 서열식별번호: 3 (멜론)에 주어진 아미노산 서열과 적어도 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9%의 동일성을 갖는 서열을 갖는 단백질을 코딩하는 핵산 분자;
c) 서열식별번호: 1 또는 서열식별번호: 9 (수박) 또는 서열식별번호: 2 (오이) 또는 서열식별번호: 3 (멜론)에 주어진 아미노산 서열과 적어도 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9%의 동일성을 갖는 서열을 갖는 단백질을 코딩하는 핵산 분자로서, 여기서 단백질은 F-박스 도메인의 아미노산 서열, 즉 서열식별번호: 1 또는 서열식별번호: 9의 아미노산 237 내지 277 (아미노산 LTDDLLHMVFSFLDHINLCRAAIVCRQWQAASAHEDFWRCL - 서열식별번호: 13)을 포함하고 LRR-도메인을 포함하며, 여기서 LRR-도메인은 서열식별번호: 1 또는 서열식별번호: 9의 아미노산 291 내지 1033 (수박), 또는 서열식별번호: 2의 아미노산 298 내지 1040 (오이), 또는 아미노산 301 내지 1043 (멜론)의 영역인 핵산 분자.
WAP5.1 단백질의 감소된 활성은 돌연변이체 wap5.1 대립유전자에 의해 유발된다. 감소된 활성은 돌연변이체 wap5.1 대립유전자의 발현의 녹다운 또는 녹아웃 (예를 들어, 프로모터 또는 다른 조절 서열에서의 돌연변이를 통해) 또는 기능 상실 또는 감소된 기능 WAP5.1 단백질 (돌연변이체 WAP5.1 단백질)을 코딩하는 돌연변이체 wap5.1 대립유전자를 통해 유발될 수 있다.
한 측면에서 돌연변이체 wap5.1 대립유전자는 야생형 단백질과 비교하여 감소된 기능 또는 기능 상실을 갖는 돌연변이체 WAP5.1 단백질을 코딩하며, 예를 들어 돌연변이체 WAP5.1 단백질은 야생형 단백질과 비교하여 대체, 결실 또는 삽입된 하나 이상의 아미노산을 포함한다. 한 측면에서 돌연변이체 WAP5.1 단백질은 단백질의 보존된 "F-박스" 도메인 및/또는 단백질의 보존된 LRR-도메인에 대체, 결실 또는 삽입된 하나 이상의 아미노산을 포함한다. 바람직한 측면에서, 보존된 "F-박스 도메인" 및/또는 "LRR-도메인" 내의 적어도 하나의 아미노산은 또 다른 아미노산 또는 정지 코돈에 의해 대체되어, 대립유전자가 동형접합 형태인 경우에 (야생형 대립유전자가 2배체 식물 또는 식물 세포에 존재하지 않는 경우에) 통성 단위결과 및 기능 상실 또는 감소된 기능 단백질을 초래한다. 또 다른 측면에서 보존된 "F-박스 도메인" 및/또는 "LRR-도메인"의 하나 이상의 아미노산은 예를 들어 조기 정지 코돈을 유발하는 돌연변이를 통해 누락되어, 대립유전자가 동형접합 형태인 경우에 (야생형 대립유전자가 2배체 식물 또는 식물 세포에 존재하지 않는 경우에) 통성 단위결과 및 기능 상실 또는 감소된 기능 단백질을 초래한다.
한 측면에서 돌연변이체 wap5.1 대립유전자는 예를 들어 RaptorX 접촉 예측 도구를 사용하여 야생형 단백질 및 돌연변이체 단백질의 3차원 구조를 비교함으로써 볼 수 있는 바와 같이 야생형 WAP5.1 단백질과 비교하여 3차원 구조 / 단백질 폴딩과 비교하여 변형된 3차원 구조 / 단백질 폴딩을 갖는 돌연변이체 WAP5.1 단백질을 코딩한다. 특히 LRR-도메인의 적절한 폴딩에 영향을 미치는 아미노산 변화 (치환 또는 결실)을 쉽게 볼 수 있다. 야생형 LRR-도메인은 도 3a에 나타낸 바와 같이 긴 꼬리-유사 구조로 폴딩한다. 임의의 부적절한 폴딩은 예를 들어 도 3b에 나타낸 바와 같이 쉽게 가시적이 된다. 또한, 말단절단된 WAP5.1 단백질에서 LRR-도메인의 전부 또는 일부의 부재는 야생형 단백질과 비교하여 변형된 3차원 구조 / 단백질 폴딩을 갖는 단백질인 것으로 본원에 포함된다. LRR-도메인은 고도로 구조화되고 보존되어 있기 때문에, 이의 구조의 임의의 변화는 단백질의 기능 상실 또는 감소된 기능 및 이에 의해 2배체 식물에서 돌연변이체 대립유전자가 동형접합 형태인 경우에 생체내 표현형 (통성 단위결과)을 유발할 것으로 예측된다.
한 측면에서 돌연변이체 대립유전자는 돌연변이체 단백질을 코딩하며, 여기서 서열식별번호: 1 또는 서열식별번호: 9의 아미노산 528, 266, 287, 257, 333, 274, 209, 308 또는 330, 또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산은 상이한 아미노산 또는 정지 코돈에 의해 결실 또는 대체된다. 동등한 아미노산은 예를 들어 서열식별번호: 1 또는 서열식별번호: 9와의 쌍별 정렬 (예를 들어, 프로그램 니들 사용)에 의해 식별될 수 있으며 (예를 들어 도 4 참조), 여기서 언급된 수박 아미노산 및 동등한 오이 및 멜론 아미노산은 굵게 표시되어 있다.
한 측면에서 수박 단백질의 L528 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94% 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)은 F에 의해 대체되고/거나, 수박 단백질의 A266 (또는 서열식별번호: 1에 대해 적어도 94% 또는 95% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)은 V에 의해 대체되고/거나, 수박 단백질의 E287 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94% 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)은 K에 의해 대체되고/거나, 수박 단백질의 A257 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94% 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)은 V에 의해 대체되고/거나, 수박 단백질의 Q333 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94% 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)은 정지 코돈에 의해 대체되고/거나, 수박 단백질의 W274 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94% 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)는 정지 코돈에 의해 대체되고/거나, 수박 단백질의 D209 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94% 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)는 V에 의해 대체되고/거나, 수박 단백질의 P308 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94% 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)은 L에 의해 대체되고/거나, 수박 단백질의 G330 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94% 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)은 E에 의해 대체된다.
WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 재배 수박, 오이 또는 멜론 식물 또는 식물 부분이 제공되며, 상기 돌연변이체 대립유전자는 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 부여한다.
한 측면에서 유전자는 수박 게놈의 염색체 5에 위치되고, 특히 유전자는 예를 들어 찰스턴 그레이 염색체의 염색체 5의 염기쌍 27630305에서 시작하여 염기쌍 27637763에서 끝나는 영역, 또는 예를 들어 수박 97103 V2 염색체의 염색체 5의 염기쌍 25813434에서 시작하여 염기쌍 25820323에서 끝나는 영역에 위치된다.
한 실시양태에서 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는 식물 또는 식물 부분은 2배체, 4배체, 3배체 또는 다배수체이다. 바람직하게는 돌연변이체 대립유전자는 2배체 식물 또는 식물 부분에 2개 카피로, 4배체 식물 또는 식물 부분에 4개 카피로 또는 3배체 식물 또는 식물 부분에 1, 2 또는 3개 카피로 존재한다.
임의로 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는 식물 또는 식물 부분은 웅성 불임을 부여하는 유전자 또는 위단위결과를 부여하는 유전자, 예컨대 WO2017202715 및/또는 WO2019238832에 기재된 유전자를 추가로 포함한다.
임의로 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는 식물 또는 식물 부분은 단위결과를 부여하는 유전자, 예를 들어 WO2018/060444에 기재된 유전자를 추가로 포함한다.
WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는 식물 부분은 세포, 꽃, 잎, 줄기, 삽목, 배주, 화분, 뿌리, 근경, 접순, 과실, 원형질체, 배아, 꽃밥일 수 있다.
또한 WAP5.1 유전자의 적어도 하나의 돌연변이체 대립유전자를 포함하는 이러한 식물 부분으로부터 번식된 영양 번식 수박, 오이 또는 멜론 식물이 포함된다.
마찬가지로 본 발명의 식물이 성장될 수 있는 종자가 제공된다.
또한, 본 발명에 따른 식물에 의해 생산된 씨없는 과실이 제공된다.
씨없는 수박, 오이 또는 멜론 과실을 생산하는 방법이 제공되며, 상기 방법은 WAP5.1 유전자의 돌연변이체 대립유전자의 2개 카피를 포함하는 2배체 식물을 성장시키는 단계 및 상기 식물에 의해 생산된 과실을 수확하는 단계를 포함한다. 특히 과실은 암꽃의 수분 없이 발달하는 반면, 씨있는 과실은 꽃의 수분 시 생산된다.
씨없는 수박 과실을 생산하는 방법이 제공되며, 상기 방법은 WAP5.1 유전자의 돌연변이체 대립유전자의 1, 2 또는 3개 카피를 포함하는 3배체 식물을 성장시키는 단계 및 상기 식물에 의해 생산된 과실을 수확하는 단계를 포함한다. 특히 과실은 암꽃의 수분 없이 발달하며, 즉 과실 발달을 유도하기 위해 화분이 필요하지 않다.
WAP5.1 유전자의 돌연변이체 대립유전자의 1, 2 또는 3개 카피를 포함하는 3배체 수박 식물을, 특히 수분자 식물이 없는 밭에서 성장시키는 단계, 및 임의로 상기 식물로부터 씨없는 수박 과실을 수확하는 단계를 포함하는, 수박 식물을 성장시키는 방법이 제공된다.
하기 단계를 포함하는, 통성 단위결과성 재배 수박, 오이 또는 멜론 식물을 생산하는 방법이 제공된다:
a) 수박, 오이 또는 멜론 식물 집단에 돌연변이를 도입하거나; 또는 돌연변이체 식물 집단 (예를 들어, TILLING 집단, 예를 들어 M2, M3, M4 또는 추가 세대)을 제공하는 단계;
b) 암꽃의 수분 없이 씨없는 과실을 생산하고 암꽃의 수분 후 씨있는 과실을 생산하는 식물을 선택하는 단계;
c) 임의로 b)에서 선택된 식물이 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는지 확인하는 단계; 및
d) 임의로 c)에서 수득된 식물을 성장시키는 단계.
하기 단계를 포함하는, 통성 단위결과성 재배 수박, 오이 또는 멜론 식물을 생산하는 방법이 제공된다:
a) 수박, 오이 또는 멜론 식물에 돌연변이를 도입하거나; 또는 돌연변이체 식물 집단 (예를 들어, TILLING 집단, 예를 들어 M2, M3, M4 또는 추가 세대)을 제공하는 단계;
b) WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는 식물을 선택하는 단계;
c) 임의로 WAP5.1 유전자의 돌연변이체 대립유전자에 대해 동형접합성인 식물을 생성하기 위해 선택된 식물을 자가생식하는 단계;
d) 임의로 식물을 성장시키는 단계.
상기 방법에 의해 생산된 수박, 오이 또는 멜론 식물 또는 과실이 본원에 포함된다.
바람직하게는 식물의 암꽃의 수분 없이 씨없는 수박, 오이 또는 멜론 과실을 생산하기 위한 통성 단위결과성 수박, 오이 또는 멜론 식물의 용도가 또한 본 발명의 한 측면이다.
통성 단위결과성 수박, 오이 또는 멜론 식물을 생산하기 위한 본원에 기재된 바와 같은 WAP5.1 유전자의 돌연변이체 wap5.1 대립유전자의 용도가 또한 본 발명의 한 측면이다.
하기 단계를 포함하는, 수분의 부재 하에 씨없는 과실 및 수분의 존재 하에 씨있는 과실을 생산하는 재배 수박, 오이 또는 멜론 식물을 생산하는 방법이 제공된다:
a) 하나 이상의 수박, 오이 또는 멜론 식물, 식물 부분 또는 종자에 무작위 또는 표적화된 돌연변이를 도입하거나; 또는 돌연변이체 식물 또는 종자 집단 (예를 들어, TILLING 집단, 예를 들어 M2, M3, M4 또는 추가 세대)를 제공하는 단계,
b) wap5.1 유전자의 돌연변이체 대립유전자, 예를 들어 유의하게 감소된 야생형 WAP5.1 단백질을 생산하거나 전혀 생산하지 않는 돌연변이체 대립유전자 (예를 들어, 녹아웃 대립유전자) 또는 야생형 단백질과 비교하여 결실, 대체, 삽입 또는 복제된 하나 이상의 아미노산을 포함하는 단백질을 코딩하는 돌연변이체 대립유전자를 포함하는 식물을 선택하는 단계,
c) 임의로 식물로부터 임의의 트랜스제닉 구축물 (예를 들어, CRISPR 구축물)을 제거하는 단계, 및/또는
d) 임의로 돌연변이체 대립유전자에 대해 동형접합성인 식물을 생성하고, 씨없는 과실이 수분의 부재 하에 발달하는지 및 씨있는 과실이 수분의 존재 하에 발달하는지 여부를 분석하는 단계.
하기 단계를 포함하는, 수박, 오이 또는 멜론 식물, 종자 또는 식물 부분을 선택 또는 식별하는 방법이 제공된다:
a) 식물 또는 식물 부분의 게놈 DNA가 이들의 게놈에 돌연변이체 대립유전자를 포함하고/거나 WAP5.1 유전자의 야생형 대립유전자를 포함하는지 여부를 분석하는 단계, 및 임의로
b) 게놈에 wap5.1 유전자의 돌연변이체 대립유전자의 1 또는 2개 카피를 포함하는 식물 또는 식물 부분을 선택하는 단계,
여기서 수박 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩하고, 오이 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 2의 단백질 (또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩하고, 멜론 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 3의 단백질 (또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩한다.
단계 a)는 예를 들어 PCR 기반 방법, 시퀀싱 기반 방법, 핵산 혼성화 기반 방법, 유전자 발현 수준 등을 사용하여 다양한 방식으로 수행될 수 있다. 한 측면에서 예를 들어 KASP 검정이 사용될 수 있다.
하기 단계를 포함하는, 수박, 오이 또는 멜론 식물, 종자 또는 식물 부분의 게놈 DNA를 스크리닝하는 방법 (예를 들어, 유전자형분석)이 제공된다:
a) 수박, 멜론 또는 오이 식물 또는 복수의 식물 (예를 들어, F2 집단, 근친교배 계통, 역교배 집단, 육종 집단, 하이브리드 식물 등)의 게놈 DNA의 샘플 (또는 복수의 샘플)을 제공하는 단계,
b) 한 쌍의 PCR 프라이머 또는 올리고뉴클레오티드 프로브를 제공하는 단계로서, 상기 프라이머 또는 (올리고뉴클레오티드) 프로브는 수박, 오이 또는 멜론 WAP5.1 유전자의 게놈 WAP5.1 대립유전자의 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22개 또는 그 초과의 연속 뉴클레오티드를 포함하고, PCR 검정에서 게놈 대립유전자에 혼성화하고/거나 게놈 대립유전자의 일부를 증폭시킬 수 있는 것인 단계, 및
c) 단계 a)의 샘플(들)에 대해 프라이머 쌍을 사용하는 PCR 검정 또는 단계 b)의 프로브를 사용하는 혼성화 검정을 수행하는 단계, 및 임의로
d) 게놈에 수박, 오이 또는 멜론 WAP5.1 유전자의 대립유전자 (예를 들어, 야생형 대립유전자 및/또는 돌연변이체 대립유전자)의 1 또는 2개 카피를 포함하는 식물 또는 식물 부분 또는 종자를 선택하는 단계,
여기서 수박 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩하고, 오이 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 2의 단백질 (또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩하고, 멜론 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 3의 단백질 (또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩한다.
단계 b)에서 PCR 프라이머 쌍은 WAP5.1 대립유전자의 DNA 가닥 중 하나에 상보적인 적어도 하나의 정방향 프라이머, 및 WAP5.1 대립유전자의 다른 DNA 가닥에 상보적인 하나의 역방향 프라이머이며, 상기 프라이머 쌍은 PCR 반응에서 변성된 게놈 DNA에 혼성화하고 WAP5.1 대립유전자의 일부를 증폭시킨다. 프라이머는 프라이머 설계 도구를 사용하여 야생형 또는 임의의 돌연변이체 WAP5.1 대립유전자를 증폭시키도록 설계될 수 있다. 한 측면에서 2개의 정방향 프라이머가 사용되며, 하나는 야생형 대립유전자를 증폭시키도록 설계되고, 하나는 WAP5.1 유전자의 돌연변이체 대립유전자를 증폭시키도록 설계되고, 하나는 공통 역방향 프라이머이다. 이들 3개의 프라이머가 단계 a)의 샘플을 유전자형분석하기 위해 KASP-검정에서 사용될 수 있다. 그러므로, 한 측면에서 단계 c)의 검정은 KASP-검정이지만, 또한 다른 유전자형분석 검정, 예컨대 월드 와이드 웹 biosearchtech.com/sectors/agrigenomics/agrigenomics-pcr-qpcr-technologies에 기재된 검정이 사용될 수 있다.
한 측면에서 검정은 WAP5.1 유전자의 야생형 및 돌연변이체 대립유전자 사이, 예를 들어 야생형 WAP5.1 대립유전자 및 표 1의 돌연변이체 대립유전자 사이, 또는 또 다른 돌연변이체 대립유전자를 구별한다.
게놈 DNA를 분석하기 위해 적어도 조질 게놈 DNA 추출이 필요할 수 있다. 게놈 DNA 내의 돌연변이체 대립유전자 또는 야생형 대립유전자의 존재는 직접적으로 또는 간접적으로 검출될 수 있다. 예를 들어 직접적으로는 예를 들어 올리고뉴클레오티드 프로브의 핵산 혼성화에 의한 것일 수 있다. 예를 들어 간접적으로는 예를 들어 PCR 프라이머를 사용하는 핵산 증폭에 의한 것일 수 있으며, 이는 예를 들어 프라이머에 부착된 꼬리 서열을 포함하고, PCR 동안 대립유전자-특이적 프라이머는 주형 DNA에 결합하고 신장하여, 이에 의해 꼬리 서열을 새로 합성된 가닥에 부착하고 후속 PCR 라운드에서 FRET 카세트 (형광 공명 에너지 전달 카세트)는 꼬리에 결합하고 형광을 방출한다. 그 후 형광 신호가 검출될 수 있다. 이는 예를 들어 KASP-검정에서 사용된다.
돌연변이체 대립유전자는 다양한 측면에서, 예를 들어 프로모터 서열 또는 단백질 코딩 서열 또는 인트론/엑손 스플라이스 부위에서 야생형 대립유전자와 상이할 수 있다. 돌연변이체 대립유전자는 감소된 유전자 발현을 갖거나 유전자 발현을 갖지 않을 수 있거나, 야생형 단백질과 비교하여 결실, 대체, 또는 삽입 또는 복제된 하나 이상의 아미노산을 포함하는 단백질의 생산을 초래할 수 있다.
한 측면에서 돌연변이체 대립유전자는 표 1에 기재된 바와 같은 돌연변이체 단백질을 코딩하는 대립유전자이다.
한 측면에서 식물 또는 식물 부분은 수박이고, 돌연변이체 대립유전자는 서열식별번호: 4 또는 서열식별번호: 10의 단백질을 코딩한다.
또한 이들의 게놈에 수박 WAP5.1 유전자, 또는 오이 WAP5.1 유전자 또는 멜론 WAP5.1 유전자의 적어도 하나의 돌연변이체 대립유전자를 포함하는 식물 또는 식물 부분을 생성 및/또는 선택하는 방법이 제공된다.
한 측면에서 또한 게놈에서 수박 WAP5.1 유전자, 또는 오이 WAP5.1 유전자 또는 멜론 WAP5.1 유전자의 야생형 대립유전자 및/또는 돌연변이체 대립유전자의 존재를 검출하는 방법이 제공된다.
한 측면에서, 수박 식물 또는 식물 부분 또는 종자가 예를 들어 서열식별번호: 1 또는 9의 단백질을 코딩하는 야생형 대립유전자의 적어도 하나의 카피를 포함하고/거나, 예를 들어 서열식별번호: 4 또는 10의 단백질을 코딩하는 돌연변이체 대립유전자의 적어도 하나의 카피, 또는 표 1에 나타낸 바와 같은 돌연변이체 단백질을 포함하는지 여부를 검출하고, 임의로 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하는 식물, 식물 부분 또는 종자를 선택하는 방법이 제공된다.
또한, 2개의 대립유전자 특이적 정방향 프라이머, 예를 들어 FAM 프라이머 및 VIC 프라이머 및 공통 역방향 프라이머를 포함하는 KASP-검정 (케이바이오사이언스(Kbioscience) 경쟁적 대립유전자 특이적 PCR-유전자형분석 검정)이 제공된다. 분명히, 야생형 대립유전자 및 예를 들어 야생형 단백질에 대해 대체, 복제, 결실 또는 삽입된 하나 이상의 아미노산을 포함하는 임의의 다른 돌연변이체 대립유전자를 검출 및/또는 구별하기 위해 다른 대립유전자 특이적 프라이머가 개발될 수 있다.
마찬가지로, (야생형 또는 돌연변이체) 게놈 서열, cDNA 또는 mRNA 서열, 단백질 서열의 단리된 서열 또는 분자, 뿐만 아니라 수박 WAP5.1 유전자, 또는 오이 WAP5.1 유전자 또는 멜론 WAP5.1 유전자의 야생형 또는 돌연변이체 대립유전자를 검출하기 위한 올리고뉴클레오티드 프라이머 또는 프로브가 본원에 포함된다.
또한, 하기 단계를 포함하는, 수박, 오이 또는 멜론 식물, 종자 또는 식물 부분의 게놈 DNA (이의 일부)의 PCR 증폭 생성물 및/또는 올리고뉴클레오티드 혼성화 생성물을 생성하는 방법이 제공된다:
a) 수박, 멜론 또는 오이 식물 또는 복수의 식물 (예를 들어, F2 집단, 근친교배 계통, 역교배 집단, 육종 집단, 하이브리드 식물 등)의 게놈 DNA의 샘플 (또는 복수의 샘플)을 제공하는 단계,
b) 적어도 한 쌍의 PCR 프라이머 또는 적어도 하나의 올리고뉴클레오티드 프로브를 제공하는 단계로서, 상기 프라이머 또는 (올리고뉴클레오티드) 프로브는 수박, 오이 또는 멜론 WAP5.1 유전자의 게놈 WAP5.1 대립유전자의 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22개 또는 그 초과의 연속 뉴클레오티드를 포함하고, PCR 검정에서 게놈 대립유전자에 혼성화하고/거나 게놈 대립유전자의 일부를 증폭시킬 수 있는 것인 단계, 및
c) PCR 증폭 생성물 및/또는 올리고뉴클레오티드 혼성화 생성물을 생성하기 위해 단계 a)의 샘플(들)에 대해 프라이머 쌍을 사용하는 PCR 검정 또는 단계 b)의 프로브를 사용하는 혼성화 검정을 수행하는 단계, 및 임의로
d) 게놈에 WAP5.1 유전자의 대립유전자 (예를 들어, 야생형 대립유전자 및/또는 돌연변이체 대립유전자)의 1 또는 2개 카피를 포함하는 식물 또는 식물 부분 또는 종자를 선택하는 단계,
여기서 수박 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩하고, 오이 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 2의 단백질 (또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩하고, 멜론 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 3의 단백질 (또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩한다.
추가로, 하기 단계를 포함하는, 수박, 오이 또는 멜론 식물, 종자 또는 식물 부분의 게놈 DNA (이의 일부)를 증폭 및/또는 혼성화하는 방법이 제공된다:
a) 수박, 멜론 또는 오이 식물 또는 복수의 식물 (예를 들어, F2 집단, 근친교배 계통, 역교배 집단, 육종 집단, 하이브리드 식물 등)의 게놈 DNA의 샘플 (또는 복수의 샘플)을 제공하는 단계,
b) 적어도 한 쌍의 PCR 프라이머 또는 적어도 하나의 올리고뉴클레오티드 프로브를 제공하는 단계로서, 상기 프라이머 또는 (올리고뉴클레오티드) 프로브는 수박, 오이 또는 멜론 WAP5.1 유전자의 게놈 WAP5.1 대립유전자의 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22개 또는 그 초과의 연속 뉴클레오티드를 포함하고, PCR 검정에서 게놈 대립유전자에 혼성화하고/거나 게놈 대립유전자의 일부를 증폭시킬 수 있는 것인 단계, 및
c) PCR 증폭 생성물 및/또는 올리고뉴클레오티드 혼성화 생성물을 생성하기 위해 단계 a)의 샘플(들)에 대해 프라이머 쌍을 사용하는 PCR 검정 또는 단계 b)의 프로브를 사용하는 혼성화 검정을 수행하는 단계, 및 임의로
d) 게놈에 수박, 오이 또는 멜론 WAP5.1 유전자의 대립유전자 (예를 들어, 야생형 대립유전자 및/또는 돌연변이체 대립유전자)의 1 또는 2개 카피를 포함하는 식물 또는 식물 부분 또는 종자를 선택하는 단계,
여기서 수박 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩하고, 오이 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 2의 단백질 (또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩하고, 멜론 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 3의 단백질 (또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩한다.
또한 WAP5.1 유전자의 게놈 DNA의 일부를 증폭 및/또는 혼성화하기 위한 프라이머 및/또는 프로브 및 반응 구성성분을 포함하는 유전자형분석 키트가 제공된다.
프라이머 및 프로브는 바람직하게는 증폭 또는 혼성화 반응 생성물을 검출할 수 있도록 예를 들어 꼬리 서열 또는 라벨에 의해 라벨링 또는 변형된다.
일반적인 정의
동사 "포함하다" 및 그 활용형은 이의 비제한적인 의미로 단어 뒤에 오는 항목이 포함되지만 구체적으로 언급되지 않은 항목은 배제되지 않는다는 의미로 사용된다. 또한, 단수형에 의한 요소에 대한 언급은 문맥상 요소 중 하나 및 오직 하나만이 존재함을 명백히 요구하지 않는 한, 하나 초과의 요소가 존재할 가능성을 배제하지 않는다. 그러므로 단수형은 대개 "적어도 하나"를 의미하며, 예를 들어 "식물"은 또한 여러 세포 식물 등을 지칭한다. 유사하게, "과실" 또는 "식물"은 또한 복수의 과실 및 식물을 지칭한다.
본원에서 사용된 바와 같은 용어 "식물"은 바람직하게는 식물이 수득되는 식물과 동일한 유전적 구성을 갖는 전체 식물 또는 이의 임의의 부분 또는 파생물, 예컨대 식물 기관 (예를 들어, 수확된 또는 수확되지 않은 과실, 잎, 꽃, 꽃밥 등), 식물 세포, 식물 원형질체, 전체 식물을 재생시킬 수 있는 식물 세포 조직 배양물, 식물 캘러스, 식물 세포 덩어리, 식물 이식체, 묘목, 식물에서 무손상인 식물 세포, 식물 클론 또는 미세번식, 또는 식물의 부분, 예컨대 식물 삽목, 배아, 화분, 꽃밥, 배주, 과실 (예를 들어, 수확된 조직 또는 기관), 꽃, 잎, 종자, 무성적으로 번식된 식물, 뿌리, 줄기, 근단, 접목 (접순 및/또는 근경) 등을 포함한다. 또한, 임의의 발달 단계, 예컨대 묘목, 발근 전 또는 후의 삽목 등이 포함된다. "식물의 종자"가 언급될 때, 이들은 식물이 성장될 수 있는 종자 또는 자가-수정 또는 교차-수정 후 식물 상에 생산된 종자를 지칭한다.
본원에서 사용된 바와 같은 용어 "품종" 또는 "재배종"은 주어진 유전자형 또는 유전자형의 조합으로부터 기인하는 특징의 발현에 의해 정의될 수 있는 가장 낮은 공지된 등급의 단일 식물학 분류군 내의 식물 그룹화를 의미한다.
용어 "대립유전자(들)"는 특정 로커스, 예를 들어 WAP5.1 로커스 (WAP5.1 유전자가 위치된 곳; 유전자의 대립유전자는 WAP5.1로 지정된 야생형 대립유전자, 또는 wap5.1로 지정된 돌연변이체 대립유전자일 수 있음)에 있는 유전자의 하나 이상의 대안적 형태 중 임의의 것을 의미하며, 이들 모든 대립유전자는 특정 로커스에 있는 하나의 형질 또는 특징에 관한 것이다 (예를 들어, 통성 단위결과). 유기체의 2배체 세포에서, 주어진 유전자의 대립유전자는 염색체 상의 특정 위치 또는 로커스 (복수의 로커스들)에 위치된다. 상동 염색체 쌍의 각 염색체 상에 하나의 대립유전자가 존재한다. 2배체 식물 종은 특정 로커스에서 다수의 상이한 대립유전자를 포함할 수 있다. 이들은 유전자의 동일한 대립유전자 (동형접합성) 또는 2개의 상이한 대립유전자 (이형접합성), 예를 들어 돌연변이체 wap5.1 대립유전자의 2개의 동일한 카피 (즉, wap5.1/wap5.1) 또는 돌연변이체 wap5.1 대립유전자의 1개 카피 및 야생형 대립유전자의 1개 카피 (즉, wap5.1/WAP5.1)일 수 있다. 마찬가지로 3배체 식물은 유전자의 3개의 동일한 대립유전자를 갖는 경우에 유전자에 대해 동형접합성으로 지칭되고 (예를 들어, 돌연변이체 wap5.1 대립유전자의 3개 카피, 즉 wap5.1/wap5.1wap5.1), 4배체 식물은 유전자의 4개의 동일한 대립유전자를 갖는 경우에 유전자에 대해 동형접합성으로 지칭된다 (예를 들어, 돌연변이체 wap5.1 대립유전자의 4개 카피 (즉, wap5.1 / wap5.1 / wap5.1 / wap5.1)).
"WAP5.1 유전자"는 염색체 5 상의 재배 수박에서 식별된 단일, 열성 유전자이며, 이는 돌연변이된 경우에 단위결과, 특히 통성 단위결과를 초래한다. WAP5.1은 비-단위결과성 재배 수박 식물에 존재하는 바와 같은 야생형 (WT), 기능적 대립유전자이고, wap5.1은 대립유전자가 2배체 (wap5.1/wap5.1), 3배체 (wap5.1/ wap5.1/ wap5.1), 4배체 (wap5.1/ wap5.1/ wap5.1/ wap5.1), 또는 다른 다배수체, 예를 들어 8배체 등에서 동형접합 형태인 경우에 단위결과를 초래하는 돌연변이체 대립유전자이다. 한 측면에서 WAP5.1 유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질을 코딩하거나, 또는 쌍별 정렬된 경우에 서열식별번호: 1 또는 서열식별번호: 9 (수박)에 대해 적어도 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하는 유전자이다. 이는 한 측면에서 오이 (서열식별번호: 2) 및 멜론 (서열식별번호: 3)에서 WAP5.1의 오르토로그를 포함한다.
"단위결과" 또는 "단위결과성"은 일반적으로 관련 기술분야에서 이해되고, 또한 본 발명과 관련하여 자성 배주의 수정 없이 과실의 발달을 기술하는 것으로 이해되어야 한다. 과실을 생산하기 위해서는 수분 프로세스가 필요하지 않지만 수분 결여의 결과로 상기 과실은 씨가 없다. 그러므로, 단위결과는 본원에서 암꽃의 수분 없이 식물 상에 과실이 형성되는 것을 의미한다. 마찬가지로 "단위결과성 식물" 또는 "동형접합 형태인 경우에 단위결과를 부여하는 돌연변이체 유전자 (또는 유전자의 돌연변이체 대립유전자)를 포함하는 식물"은 식물이 암꽃의 수분 없이 씨없는 과실을 생산한다는 것을 의미한다.
"통성 단위결과"는 통성 단위결과성 식물의 꽃이 수분될 때 단위결과 형질이 보이지 않고, 이 경우 정상적인 수정 및 정상적인 과실 발달이 일어난다는 것을 의미하는 것으로 이해된다. 정상적인 수정이 일어나면, 과실은 씨가 있다.
"F1, F2, F3 등"은 2개의 부모 식물 또는 부모 계통 사이의 교잡 후 연속적인 관련 세대를 지칭한다. 2개의 식물 또는 계통의 교배에 의해 생산된 종자로부터 성장된 식물은 F1 세대라고 불린다. F1 식물의 자가생식은 F2 세대 등을 초래한다.
"F1 하이브리드" 식물 (또는 F1 하이브리드 종자)은 2개의 근친교배 부모 계통의 교배로부터 수득된 세대이다. 그러므로, F1 하이브리드 종자는 F1 하이브리드 식물이 성장하는 종자이다. F1 하이브리드는 헤테로시스로 인해 더 활발하고 더 높은 수율을 보인다. 근친교배 계통은 본질적으로 게놈의 대부분의 로커스에서 동형접합성이다.
"식물 계통" 또는 "육종 계통"은 식물 및 이의 자손을 지칭한다. 본원에서 사용된 바와 같은 용어 "근친교배 계통"은 반복적으로 자가생식되고 거의 동형접합성인 식물 계통을 지칭한다. 그러므로, "근친교배 계통" 또는 "부모 계통"은 여러 세대 (예를 들어, 적어도 5, 6, 7 또는 그 초과)의 근친교배를 거쳐 높은 균일성을 갖는 식물 계통을 초래하는 식물을 지칭한다.
용어 "유전자"는 세포 내에서 메신저 RNA 분자 (mRNA)로 전사되는 영역 (전사된 영역), 및 작동가능하게 연결된 조절 영역 (예를 들어, 프로모터)을 포함하는 (게놈) DNA 서열을 의미한다. 예는 본 발명의 WAP5.1 유전자이다. 그러므로 유전자의 상이한 대립유전자는 유전자의 상이한 대체 형태이며, 이는 예를 들어 게놈 DNA 서열 (예를 들어, 프로모터 서열, 엑손 서열, 인트론 서열 등), mRNA 및/또는 코딩된 단백질의 아미노산 서열의 하나 이상의 뉴클레오티드의 차이의 형태일 수 있다.
"돌연변이체 wap5.1 대립유전자" 또는 "wap5.1 대립유전자"는 본원에서 수박의 염색체 5에 있는 WAP5.1 유전자의 돌연변이체 대립유전자를 지칭하며, 이는 돌연변이체 대립유전자가 동형접합 형태인 경우에 식물이 통성 단위결과성이 되도록 유발한다. 돌연변이체 대립유전자에서의 돌연변이는 결실, 말단절단, 삽입, 점 돌연변이, 넌센스 돌연변이, 미스센스 돌연변이 또는 비동의 돌연변이, 스플라이스-부위 돌연변이, 프레임 시프트 돌연변이 및/또는 하나 이상의 조절 서열, 예컨대 프로모터 서열, 또는 인핸서 또는 사일런서 서열 내의 돌연변이를 포함하는 임의의 돌연변이 또는 돌연변이의 조합일 수 있다. 한 측면에서 돌연변이체 wap5.1 대립유전자는 WAP5.1 유전자의 돌연변이체 대립유전자이며, 여기서 WAP5.1 유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질을 코딩하거나, 또는 (쌍별 정렬된 경우에) 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하는 유전자이다. 이는 한 측면에서 오이 또는 멜론 식물 또는 식물 세포에 존재하는 오이 (서열식별번호: 2) 및 멜론 (서열식별번호: 3)에서 WAP5.1 유전자의 오르토로그의 돌연변이체 대립유전자를 포함한다.
"야생형 WAP5.1 대립유전자" 또는 "WAP5.1 대립유전자"는 본원에서 WAP5.1 유전자의 기능적 대립유전자를 지칭하며, 이는 식물이 정상적인 과실 결실을 갖도록 유발하여, 과실 결실을 위해 정상적인 수분 및 수정을 필요로 한다. 야생형 WAP5.1 대립유전자는 수박의 임의의 상업용 품종 (예를 들어, 넌헴스 품종 프리미엄 F1, 몬트리올 F1 등)에서 발견된다. 한 측면에서 야생형 WAP5.1 대립유전자는 WAP5.1 유전자의 야생형 대립유전자이며, 여기서 WAP5.1 유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질을 코딩하거나, 또는 (쌍별 정렬된 경우에) 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하는 유전자이다. 이는 한 측면에서 오이 또는 멜론 식물 또는 식물 세포에 존재하는 오이 (서열식별번호: 2) 및 멜론 (서열식별번호: 3)에서 WAP5.1 유전자의 오르토로그를 포함한다.
용어 "로커스" (복수의 로커스들)는 예를 들어 유전자 또는 유전적 마커가 발견되는 염색체 상의 특정 장소 또는 장소들 또는 부위를 의미한다. 그러므로, WAP5.1 로커스는 WAP5.1 유전자의 돌연변이체 대립유전자 및/또는 야생형 대립유전자가 발견되는 수박 게놈 내의 위치이다. WAP5.1 로커스는 재배 수박 염색체 5 상의 로커스이며 ("수박: 게놈", "찰스턴 그레이" 또는 "수박 97103" 하에 월드 와이드 웹 cucurbitgenomics.org에서 발견되는 공개된 수박 게놈의 염색체 할당 사용), 즉 wap5.1은 돌연변이유발에 의해 재배 수박 게놈에서 생성되었고, 돌연변이체 wap5.1 대립유전자는 재배 수박의 염색체 5의 정의된 영역에 맵핑되었다.
"유도된 돌연변이체" 대립유전자는 돌연변이(들)가 인간 개입에 의해, 예를 들어 물리적 또는 화학적 돌연변이유발 방법을 통한 또는 예를 들어 조직 배양을 통한 돌연변이유발에 의해 유도된 돌연변이체 대립유전자이다 (예를 들어 문헌 [Zhang et al., Plos 9(5) e96879]에 기재된 바와 같음) (또한 표적화된 유전자 편집 기술 (예컨대 Crispr 기반 기술, TALENS 등) 포함).
"2배체 식물"은 2배체 식물이 성장될 수 있는 식물, 영양 식물 부분(들), 또는 종자를 지칭하며, 본원에서 2n으로 지정된 2개 세트의 염색체를 갖는다.
"DH 식물" 또는 "배가된-반수체 식물"은 예를 들어 시험관내 기술을 사용하여 2배체 식물의 반수체 게놈을 배가함으로써 생산되는 2배체 식물이다. 따라서, DH 식물은 모든 로커스에서 동형접합성이다.
"3배체 식물"은 본원에서 3n으로 지정된 3개 세트의 염색체를 갖는 식물, 영양 식물 부분(들), 또는 3배체 식물이 성장될 수 있는 종자를 지칭한다.
"4배체 식물"은 본원에서 4n으로 지정된 4개 세트의 염색체를 갖는 식물, 영양 식물 부분(들), 또는 4배체 식물이 성장될 수 있는 종자를 지칭한다.
"다배수체 식물"은 2배체보다 더 높은 배수체, 즉 3배체 (3n), 4배체 (4n), 6배체 (6n), 8배체 (8n) 등을 갖는 식물을 지칭한다.
"수분자 식물" 또는 "수분자"는 3배체 식물에 과실 결실을 유도하기 위한 수분자로서 적합한 (근친교배 또는 하이브리드) 2배체 식물, 또는 이의 부분 (예를 들어, 이의 화분 또는 접순)을 지칭한다. 그러므로, 수분자 식물은 적절한 낮 시간에 및 적절한 기간 동안 적절한 양의 화분을 생산함으로써 정상적인 3배체 식물 (야생형 WAP5.1 대립유전자의 3개 카피 포함)의 양호한 과실 결실 (및 양호한 3배체 과실 수확량)을 유발할 수 있다.
"하이브리드 3배체 식물" 또는 "F1 3배체" 또는 "3배체 하이브리드"는 웅성 2배체 부모와 자성 4배체 부모의 교잡 수정으로부터 수득된 하이브리드, 3배체 종자로부터 성장된 3배체 식물이다. 웅성 부모는 4배체 자성 부모에서 과실 결실 및 종자 생산을 유도하여, F1 하이브리드 3배체 종자를 함유하는 과실을 초래하기 위해 사용된다. F1 3배체 종자를 생산하는데 사용되는 웅성 부모 및 자성 부모 둘 다는 각 부모 계통이 거의 동형접합성이고 안정적이도록 근친교배이다.
"씨없는 과실"은 생존가능한 성숙 종자를 함유하지 않는 과실이다. 과실은 예를 들어 도 1 또는 도 5에서 볼 수 있는 바와 같이 하나 이상의 작고 식용의 백색 배주를 함유할 수 있다. 임의로 과실은 몇 개의 갈색 또는 흑색 종자를 함유할 수 있지만, 이들은 생존가능하지 않다. 생존가능한 성숙 종자는 적절한 조건 하에 토양에서 발아되고 식물로 성장할 수 있는 종자이다.
"식재" 또는 "식재된"은 기계 또는 손에 의해 밭에 파종 (직파)하거나 묘목 (소식물체)을 식재하는 것을 지칭한다.
"영양 번식" 또는 "무성 번식"은 예를 들어 시험관내 번식 또는 접목 방법 (접순 및 근경 사용)에 의해 영양 조직으로부터 식물의 번식을 지칭한다. 시험관내 번식은 시험관내 세포 또는 조직 배양 및 시험관내 배양으로부터 전체 식물의 재생을 수반한다. 접목은 근경에 접목에 의해 원래 식물을 번식시키는 것을 수반한다. 그러므로 원래 식물의 클론 (즉, 유전적으로 동일한 영양 번식)은 시험관내 배양 또는 접목에 의해 생성될 수 있다. "세포 배양" 또는 "조직 배양"은 식물의 세포 또는 조직의 시험관내 배양을 지칭한다. "재생"은 세포 배양 또는 조직 배양 또는 영양 번식으로부터 식물의 발달을 지칭한다. "비번식 세포"는 전체 식물로 재생될 수 없는 세포를 지칭한다.
"열성"은 2배체 게놈에 우성 대립유전자가 존재하지 않는 경우, 즉 2배체에서 동형접합성인 경우에 이의 표현형 (예를 들어, 단위결과 또는 통성 단위결과)을 발현하는 대립유전자를 지칭한다. 돌연변이체 wap5.1 대립유전자는 2배체 식물에서 2개 카피로, 임의로 4배체 식물에서 4개 카피로 또는 3배체 식물에서 2 또는 3개 카피로 또는 또 다른 다배수체에서 각각의 수의 카피로 존재하는 경우에 (통성) 단위결과성 식물을 초래한다. 우성 대립유전자는 본원에서 야생형 (WT) 대립유전자로도 지칭된다.
"재배 수박" 또는 "시트룰루스 라나투스"는 본원에서 양호한 농경학적 특징을 갖고, 특히 양호한 과실 품질 및 과실 균일성의 시장성 있는 과실을 생산하는 시트룰루스 라나투스 아종 불가리스(Citrullus lanatus ssp. vulgaris), 또는 시트룰루스 라나투스 (Thunb.) 마트숨. & 나카이 아종 불가리스(Matsum. & Nakai subsp. vulgaris) (Schrad.)를 지칭한다. 재배 오이 및 재배 멜론은 양호한 농경학적 특징을 갖고, 특히 양호한 과실 품질 및 과실 균일성의 시장성 있는 과실을 생산하는 쿠쿠미스 사티부스 및 쿠쿠미스 멜로 식물을 지칭한다.
"야생 수박"은 본원에서 불량한 품질 및 불량한 균일성의 과실을 생산하는 시트룰루스 라나투스 아종 라나투스(Citrullus lanatus ssp. lanatus) 및 시트룰루스 라나투스 아종 무코소스페르무스(Citrullus lanatus ssp. mucosospermus)를 지칭한다.
"SNP 마커"는 예를 들어 돌연변이체 wap5.1 대립유전자 및 야생형 WAP5.1 대립유전자 사이의 단일 뉴클레오티드 다형성을 지칭한다. 예를 들어 서열식별번호: 8은 뉴클레오티드 61에 SNP를 포함하는 서열을 제공하며, 여기서 'C' (시토신)의 존재는 야생형 WAP5.1 대립유전자의 존재를 나타내고, 'T' (티민)의 존재는 서열식별번호: 4의 단백질을 코딩하는 돌연변이체 대립유전자의 존재를 나타낸다 (L528F 돌연변이). WAP5.1 유전자의 돌연변이체 및 야생형 대립유전자를 구별할 수 있는 SNP 마커 검정 (즉, 대립유전자 특이적 검정)을 사용하여, 돌연변이체 대립유전자 및/또는 야생형 대립유전자의 존재에 대해 식물, 식물 부분 또는 이로부터의 DNA를 스크리닝할 수 있다.
"INDEL 마커"는 예를 들어 돌연변이체 wap5.1 대립유전자 및 야생형 WAP5.1 대립유전자 사이의 삽입/결실 다형성을 지칭한다. 유전자의 돌연변이체 및 야생형 대립유전자를 구별할 수 있는 INDEL 마커 검정 (즉, 대립유전자 특이적 검정)을 사용하여, 돌연변이체 대립유전자의 존재에 대해 식물, 식물 부분 또는 이로부터의 DNA를 스크리닝할 수 있다.
"유전자형분석" 방법은 식물 또는 식물 부분 또는 종자의 유전자형 또는 대립유전자 조성을 결정할 수 있는 방법이다. 이중-대립유전자 유전자형분석 검정, 예컨대 KASP-검정은 로커스에서 2개의 대립유전자를 구별할 수 있다.
"재배 수박 게놈" 및 "재배 수박 게놈 상의 물리적 위치" 및 "염색체 5"는 재배 수박의 물리적 게놈을 지칭하며, 참조 게놈은 "수박: 게놈", 예를 들어 "수박 (찰스턴 그레이)" 및 물리적 염색체 및 염색체 상의 물리적 위치 하에 월드 와이드 웹 cucurbitgenomics.org에서 찾을 수 있다.
"돌연변이체 wap5.1 대립유전자를 포함하는 염색체 영역"은 예를 들어 돌연변이체 wap5.1 대립유전자를 운반하는 재배 수박의 염색체 5의 게놈 영역을 지칭한다. 대립유전자의 존재는 표현형적으로 및/또는 하나 이상의 분자 마커, 예를 들어 돌연변이체 wap5.1 대립유전자에 연결된 SNP 마커 또는 다른 마커 또는 바람직하게는 상이한 wap5.1 대립유전자를 구별하는 마커의 존재에 의해 또는 대립유전자 서열 자체의 게놈 서열에 의해 (예를 들어, 대립유전자의 시퀀싱) 결정될 수 있다. 마커는 대립유전자에 물리적으로 커플링된 경우에 "wap5.1 대립유전자에 연결"된다. "대립유전자 특이적 마커"는 특정 대립유전자 (예를 들어, 특이적 돌연변이체 대립유전자)에 특이적이고 그러므로 예를 들어 돌연변이체 대립유전자 및 야생형 대립유전자를 구별하는 마커이다.
한 쌍의 "플랭킹 마커"는 wap5.1 대립유전자에 연결되고/거나 wap5.1 대립유전자에 밀접하게 연결된 2개의 마커, 바람직하게는 2개의 SNP 마커 또는 SNP 마커를 포함하는 2개의 서열을 지칭하며, 여기서 wap5.1 대립유전자는 2개의 마커 사이에 또는 마커를 포함하는 2개의 서열 사이에 위치된다.
"브릭스" 또는 "브릭스도" 또는 "° 브릭스"는 굴절계를 사용하여 여러 성숙 과실에서 측정된 바와 같은 평균 총 가용성 고체 함량을 지칭한다. 바람직하게는 절단-개방 과실의 중앙 및 껍질 사이에서 각각 측정된 적어도 3개의 과실의 평균이 계산된다.
과실 품질과 관련하여 "시장성 있는"은 수박 과실이 신선한 소비를 위해 판매되기에 적합하고, 양호한 향미 (이취 없음), 적어도 9.0, 바람직하게는 적어도 10.0 또는 적어도 11.0의 브릭스도 및 바람직하게는 또한 균일한 과실 과육 색상 (예를 들어 백색 (예를 들어, 품종 서스캐처원 크림(Cream of Saskatchewan)), 노란색 (예를 들어, 품종 야마토 크림(Yamato Cream) 1), 주황색 (예를 들어, 품종 텐더스위트(Tendersweet)), 분홍색 (예를 들어, 품종 사둘(Sadul)), 적분홍색 (예를 들어, 품종 크림슨 스위트(Crimson Sweet)), 적색 (예를 들어, 품종 슈가 베이비(Sugar Baby)) 또는 암적색 (예를 들어, 품종 딕시 리(Dixie Lee)))을 갖는 것을 의미한다.
"균일한 과실 과육 색상"은 중간 (중간부)을 통해 절단 개방하였을 때 성숙 과실 전체에 걸친 색상이 과실 과육 전체에 걸쳐 고르게 분포되어 있음 (즉 드문드문하지 않음)을 의미한다. 그러므로, 적색 과실은 과실 과육 전체에 걸쳐 적색이고 백색 패치를 함유하지 않는다. 균일한 적색 색상을 갖는 과실의 예는 2배체 품종 프리미엄 F1 (넌헴스)이다.
동일한 염색체 상의 로커스 사이 (예를 들어, 분자 마커 사이 및/또는 표현형 마커 사이)의 "물리적 거리"는 염기 또는 염기쌍 (bp), 킬로 염기 또는 킬로 염기쌍 (kb) 또는 메가 염기 또는 메가 염기쌍 (Mb)으로 표현되는 실제 거리이다.
동일한 염색체 상의 로커스 사이 (예를 들어, 분자 마커 사이 및/또는 표현형 마커 사이)의 "유전적 거리"는 교차 빈도 또는 재조합 빈도 (RF)에 의해 측정되며 센티모건 (cM)으로 표시된다. 1 cM은 약 1%의 재조합 빈도에 상응한다. 재조합체를 찾을 수 없는 경우, RF는 0이고 로커스는 물리적으로 함께 극히 가깝거나 동일하다. 2개의 로커스가 멀리 떨어져 있을수록 RF가 높아진다.
"균일성" 또는 "균일한"은 식물 계통 또는 품종의 유전적 및 표현형 특징과 관련된다. 근친교배 계통은 여러 세대의 근친교배에 의해 생산되기 때문에 유전적으로 고도로 균일하다. 마찬가지로, 및 이러한 근친교배 계통으로부터 생산되는 F1 하이브리드 및 3배체 하이브리드는 이들의 유전자형 및 표현형 특징 및 성능에서 고도로 균일하다.
형질 (예컨대 단위결과)을 부여하는 유전적 요소, 이입 단편, 또는 유전자 또는 대립유전자는 유전적 요소, 로커스, 이입 단편, 유전자 또는 대립유전자에 의해 부여된 형질의 첨가 외에 수용자 식물의 표현형 변화를 초래하지 않고 전통적인 육종 기술을 사용하여 그것이 존재하는 식물 또는 종자로부터 그것이 존재하지 않는 또 다른 식물 또는 종자로 전달될 수 있는 경우 (예컨대 비-단위결과성 계통 또는 품종) 식물 또는 종자 또는 조직 또는 세포"로부터 수득가능한"이라고 하거나, "로부터 수득" 또는 "로부터 유래가능"할 수 있거나, "로부터 유래" 또는 "에 존재하는 바와 같이" 또는 "에서 발견된 바와 같을" 수 있다. 상기 용어는 상호교환가능하게 사용되고, 유전적 요소, 로커스, 이입 단편, 유전자 또는 대립유전자는 그러므로 형질이 결여된 임의의 다른 유전적 배경으로 전달될 수 있다. 유전적 요소, 로커스, 이입 단편, 유전자 또는 대립유전자 (예를 들어, 돌연변이체 wap5.1 대립유전자)를 함유하는 재배 수박은 예를 들어 돌연변이유발 (예를 들어, 화학적 돌연변이유발, CRISPR-Cas 유도 등)에 의해 드 노보 생성된 후, 예를 들어 다른 재배 수박으로 교배될 수 있다. 오이 및 멜론에 동일하게 적용되며, 즉 돌연변이체 wap5.1 대립유전자는 돌연변이유발에 의해 드 노보 생성될 수 있다.
"애버리지" 또는 "평균"은 본원에서 산술 평균을 지칭하고, 용어 둘 다는 상호교환가능하게 사용된다. 그러므로 용어 "애버리지" 또는 "평균"은 여러 측정의 산술 평균을 지칭한다. 통상의 기술자는 식물 계통 또는 품종의 표현형이 어느 정도 성장 조건에 의존하고, 따라서 적어도 10, 15, 20, 30, 40, 50개 또는 그 초과의 식물 (또는 식물 부분)의 산술 평균이 바람직하게는 동일한 실험에서 동일한 조건 하에 성장된 여러 복제물 및 적합한 대조군 식물을 사용한 무작위화된 실험 설계에서 측정된다는 것을 이해한다. "통계적으로 유의한" 또는 "통계적으로 유의하게" 상이함 또는 "유의하게" 상이함은 적합한 대조군과 비교할 때 대조군 (의 평균)으로부터 해당 특징의 통계적으로 유의한 차이 (예를 들어, p-값이 0.05 미만임, p < 0.05, ANOVA 사용)를 나타내는 식물 계통 또는 품종의 특징을 지칭한다.
용어 "전통적인 육종 기술"은 본원에서 교배, 역교배, 자가생식, 선택, 이중 반수체 생산, 염색체 배가, 배아 구조, 원형질체 융합, 마커 보조 선택, 돌연변이 육종 등을 포함하며, 모두는 육종가에게 공지되어 있으며 (즉, 유전자 변형 / 형질전환 / 트랜스제닉 방법 이외의 방법), 이에 의해 예를 들어 돌연변이체 wap5.1 대립유전자를 포함하는 염색체 5가 수득, 식별 및/또는 전달될 수 있다.
"역교배"는 (단일) 형질, 예컨대 통성 단위결과 형질을 하나의 (종종 열등한) 유전적 배경 ("공여자"로도 지칭됨)으로부터 또 다른 (종종 우수한) 유전적 배경 ("반복친"으로도 지칭됨)으로 전달할 수 있는 육종 방법을 지칭한다. 교잡의 자손 (예를 들어, 예를 들어 공여자와 반복친 수박의 교배에 의해 수득된 F1 식물, 또는 F1의 자가생식으로부터 수득된 F2 식물 또는 F3 식물 등)은 예를 들어 우수한 유전적 배경을 갖는 부모로 "역교배"된다. 반복된 역교배 후, 하나의 (종종 열등한) 유전적 배경의 형질이 다른 (종종 우수한) 유전적 배경에 혼입될 것이다.
또 다른 마커 (또는 분자 마커를 포함하는 서열) 또는 로커스의 5 Mb, 3 Mb, 2.5 Mb, 2 Mb, 1 Mb, 0.5 Mb, 0.4Mb, 0.3Mb, 0.2Mb, 0.1 Mb, 74kb, 50kb, 20kb, 10kb, 5kb, 2kb, 1kb 또는 그 미만 이내의 분자 마커 (또는 분자 마커를 포함하는 서열)는 게놈 DNA 영역 플랭킹 마커 (즉, 마커의 어느 한쪽)의 5 Mb, 3 Mb, 2.5 Mb, 2 Mb, 1 Mb, 0.5 Mb, 0.4Mb, 0.3Mb, 0.2Mb, 0.1 Mb, 74kb, 50kb, 20kb, 10kb, 5kb, 2kb, 1kb 또는 그 미만 이내에 물리적으로 위치된 마커를 지칭한다.
"LOD-스코어" (오즈의 대수 (밑수 10))는 동물 및 식물 집단에서 연결 분석을 위해 종종 사용되는 통계 테스트를 지칭한다. LOD 스코어는 2개의 로커스 (분자 마커 로커스 및/또는 표현형 형질 로커스)가 실제로 연결된 경우에 테스트 데이터를 수득할 가능도를 순전히 우연히 동일한 데이터를 관찰할 가능도와 비교한다. 양의 LOD 스코어는 연결의 존재를 선호하고, 3.0 초과의 LOD 스코어는 연결에 대한 증거로 간주된다. +3의 LOD 스코어는 관찰 중인 연결이 우연히 발생하지 않았다는 오즈가 1000 대 1임을 나타낸다.
"트랜스진" 또는 "키메라 유전자"는 형질전환, 예컨대 아그로박테리움 매개 형질전환에 의해 식물의 게놈에 도입된 DNA 서열, 예컨대 재조합 유전자를 포함하는 유전자의 로커스를 지칭한다. 이의 게놈에 안정적으로 통합된 트랜스진을 포함하는 식물은 "트랜스제닉 식물"로 지칭된다.
"단리된 핵산 서열" 또는 "단리된 DNA"는 그것이 단리된 자연 환경에서 더 이상 존재하지 않는 핵산 서열, 예를 들어 박테리아 숙주 세포 또는 식물 핵 또는 색소체 게놈 내의 핵산 서열을 지칭한다. 본원에서 "서열"을 언급할 때, 이러한 서열을 갖는 분자는 예를 들어 핵산 분자를 지칭하는 것으로 이해된다.
"숙주 세포" 또는 "재조합 숙주 세포" 또는 "형질전환된 세포"는 상기 세포에 도입된 적어도 하나의 핵산 분자의 결과로서 발생하는 새로운 개별 세포 (또는 유기체)를 지칭하는 용어이다. 숙주 세포는 바람직하게는 식물 세포 또는 박테리아 세포이다. 숙주 세포는 염색체외 (에피솜) 복제 분자로서 핵산을 함유할 수 있거나, 또는 숙주 세포의 핵 또는 색소체 게놈에 통합된 핵산, 또는 도입된 염색체, 예를 들어 미니염색체로서 핵산을 포함할 수 있다.
"서열 동일성" 및 "서열 유사성"은 글로벌 또는 로컬 정렬 알고리즘을 사용하여 2개의 펩티드 또는 2개의 뉴클레오티드 서열의 정렬에 의해 결정될 수 있다. 그 후, 서열은 예를 들어 프로그램 GAP 또는 BESTFIT 또는 엠보스 프로그램 "니들" (디폴트 파라미터 사용, 하기 참조)에 의해 최적으로 정렬되어 적어도 특정 최소 백분율의 서열 동일성 (하기 추가로 정의된 바와 같음)을 공유하는 경우에 "실질적으로 동일한" 또는 "본질적으로 유사한"으로 지칭될 수 있다. 이들 프로그램은 매치의 수를 최대화하고 갭의 수를 최소화하면서 2개의 서열을 이들의 전체 길이에 걸쳐 정렬하기 위해 니들만 및 분쉬 글로벌 정렬 알고리즘을 사용한다. 일반적으로, 디폴트 파라미터가 사용되며, 갭 생성 페널티 = 10 및 갭 연장 페널티 = 0.5 (둘 다는 뉴클레오티드 및 단백질 정렬을 위한 것임)이다. 뉴클레오티드의 경우 사용되는 디폴트 스코어링 매트릭스는 DNAFULL이고, 단백질의 경우 디폴트 스코어링 매트릭스는 Blosum62이다 (Henikoff & Henikoff, 1992, PNAS 89, 10915-10919). 백분율 서열 동일성에 대한 서열 정렬 및 스코어는 예를 들어 컴퓨터 프로그램, 예컨대 엠보스 (월드 와이드 웹 ebi.ac.uk/Tools/psa/emboss_needle/에서 이용가능함)를 사용하여 결정될 수 있다. 대안적으로 서열 유사성 또는 동일성은 데이터베이스, 예컨대 FASTA, BLAST 등에 대해 써치함으로써 결정될 수 있지만, 히트는 검색되고 서열 동일성을 비교하기 위해 쌍별 정렬되어야 한다. 2개의 단백질 또는 2개의 단백질 도메인, 또는 2개의 핵산 서열은 백분율 서열 동일성이 적어도 85%, 90%, 92%, 95%, 98%, 99% 또는 그 초과인 경우에 "실질적인 서열 동일성"을 갖는다 (디폴트 파라미터, 즉 갭 생성 페널티 = 10, 갭 연장 페널티 = 0.5를 사용하여 엠보스 "니들"에 의해 결정된 바와 같음, 핵산의 경우 스코어링 매트릭스 DNAFULL 및 단백질의 경우 Blosum62 사용).
참조 서열에 대해 "실질적인 서열 동일성"을 갖거나 참조 서열에 대해 적어도 80%의 서열 동일성, 예를 들어 적어도 85%, 90%, 91%, 92%, 93%, 94%, 95%, 98%, 99%, 99.2%, 99.5%, 99.9% 핵산 서열 동일성을 갖는 핵산 서열 (예를 들어, DNA 또는 게놈 DNA)을 참조할 때, 한 실시양태에서 상기 뉴클레오티드 서열은 주어진 뉴클레오티드 서열과 실질적으로 동일한 것으로 간주되며, 엄격한 혼성화 조건을 사용하여 식별될 수 있다. 또 다른 실시양태에서, 핵산 서열은 주어진 뉴클레오티드 서열과 비교하여 하나 이상의 돌연변이를 포함하지만, 여전히 엄격한 혼성화 조건을 사용하여 식별될 수 있다.
"엄격한 혼성화 조건"은 주어진 뉴클레오티드 서열과 실질적으로 동일한 뉴클레오티드 서열을 식별하기 위해 사용될 수 있다. 엄격한 조건은 서열 의존적이며 상이한 환경에서 상이할 것이다. 일반적으로, 엄격한 조건은 정의된 이온 강도 및 pH에서 특이적 서열에 대한 열 융점 (Tm)보다 약 5℃ 더 낮도록 선택된다. Tm은 표적 서열의 50%가 완벽하게 매치된 프로브에 혼성화되는 온도 (정의된 이온 강도 및 pH 하에)이다. 전형적으로, 염 농도가 pH 7에서 약 0.02 몰이고 온도가 적어도 60℃인 엄격한 조건이 선택될 것이다. 염 농도를 낮추고/거나 온도를 증가시키는 것은 엄격성을 증가시킨다. RNA-DNA 혼성화를 위한 엄격한 조건 (예를 들어 100nt의 프로브를 사용하는 노던 블롯)은 예를 들어 63℃에서 20분 동안 0.2X SSC에서 적어도 한 번의 세척을 포함하는 조건, 또는 동등한 조건이다. DNA-DNA 혼성화를 위한 엄격한 조건 (예를 들어 100nt의 프로브를 사용하는 서던 블롯)은 예를 들어 적어도 50℃, 대개 약 55℃의 온도에서 20분 동안 0.2X SSC에서 적어도 한 번의 세척 (대개 2회)을 포함하는 조건, 또는 동등한 조건이다.
본 발명과 관련하여 "M1 세대" 또는 "M1 식물"은 돌연변이유발 처리로부터 직접적으로 생산되는 1세대를 지칭할 것이다. 돌연변이원으로 처리된 종자로부터 성장된 식물은 예를 들어 M1 세대를 대표한다.
"M2 세대" 또는 "M2 식물"은 본원에서 M1 세대의 자가-수분으로부터 수득된 세대를 지칭할 것이다. 자가-수분된 M1 식물로부터 수득된 종자로부터 성장된 식물은 M2 식물을 나타낸다. M3, M4 등은 자가-수분 후 수득된 추가 세대를 지칭한다.
"대립성 테스트"는 2개의 식물 계통 또는 품종에서 보여지는 표현형, 예를 들어 통성 단위결과가 동일한 유전자 또는 로커스 또는 상이한 유전자 또는 로커스에 의해 결정되는지 여부를 테스트할 수 있는 유전자 테스트를 지칭한다. 예를 들어, 테스트될 식물은 서로 교배되고 (바람직하게는 이들이 동형접합성인지 보장하기 위해 자가생식 후), F1 또는 추가 자가생식 또는 역교배 자손 중에서 표현형의 격리가 결정된다. 격리 비율은 유전자 또는 로커스가 대립유전자인지 또는 이들이 상이한지 여부를 나타낸다. 따라서 예를 들어 대립유전자가 동일한 유전자인 경우, F1 식물 (2개의 동형접합성 식물의 교배에 의해 생산됨)은 모두 (100%) 동일한 표현형을 가질 것이나, 대립유전자가 상이한 유전자인 경우에는 그렇지 않을 수 있다. 마찬가지로 F2 식물에서 표현형 격리는 동일한 또는 상이한 유전자가 관여하는지 여부를 나타낼 것이다.
"mRNA 코딩 서열"은 본원에서 일반적인 의미를 가질 것이다. mRNA 코딩 서열은 티민 (T)이 우라실 (U)에 의해 대체되는 것을 제외하고 유전자/대립유전자의 각각의 DNA 코딩 (cDNA) 서열에 상응한다.
핵산 분자 (DNA 또는 RNA)에서의 "돌연변이"는 예를 들어 하나 이상의 뉴클레오티드의 대체, 결실 또는 삽입에 의한 상응하는 야생형 서열과 비교하여 하나 이상의 뉴클레오티드의 변화이다. 이러한 돌연변이의 예는 점 돌연변이, 넌센스 돌연변이, 미스센스 돌연변이, 스플라이스-부위 돌연변이, 프레임 시프트 돌연변이 또는 조절 서열에서의 돌연변이이다.
"핵산 분자"는 관련 기술분야에서 일반적인 이해를 가질 것이다. 이는 당 데옥시리보스 (DNA) 또는 리보스 (RNA) 중 하나를 포함하는 뉴클레오티드로 구성된다.
"점 돌연변이"는 단일 뉴클레오티드의 대체, 또는 단일 뉴클레오티드의 삽입 또는 결실이다.
"넌센스 돌연변이"는 단백질을 코딩하는 핵산 서열에서의 (점) 돌연변이이며, 여기서 핵산 분자의 코돈은 정지 코돈으로 변화된다. 이는 조기 정지 코돈이 mRNA에 존재하도록 초래하고 말단절단된 단백질의 번역을 초래한다. 말단절단된 단백질은 감소된 기능 또는 기능 상실을 가질 수 있다.
"미스센스 또는 비동의 돌연변이"는 단백질을 코딩하는 핵산 서열에서의 (점) 돌연변이이며, 여기서 코돈은 상이한 아미노산을 코딩하도록 변화된다. 생성된 단백질은 감소된 기능 또는 기능 상실을 가질 수 있다.
"스플라이스-부위 돌연변이"는 단백질을 코딩하는 핵산 서열에서의 돌연변이이며, 여기서 프리-mRNA의 RNA 스플라이싱이 변화되어, 야생형과 상이한 뉴클레오티드 서열을 갖는 mRNA 및 상이한 아미노산 서열을 갖는 단백질을 초래한다. 생성된 단백질은 감소된 기능 또는 기능 상실을 가질 수 있다.
"프레임 시프트 돌연변이"는 단백질을 코딩하는 핵산 서열에서의 돌연변이이며, 여기서 mRNA의 리딩 프레임이 변화되어, 상이한 아미노산 서열을 초래한다. 생성된 단백질은 감소된 기능 또는 기능 상실을 가질 수 있다.
본 발명의 맥락에서 "결실"은 상응하는 야생형 서열의 핵산 서열과 비교하여 주어진 핵산 서열의 어느 곳에서든 적어도 하나의 뉴클레오티드가 누락되거나, 상응하는 (야생형) 서열의 아미노산 서열과 비교하여 주어진 아미노산 서열의 어느 곳에서든 적어도 하나의 아미노산이 누락됨을 의미할 것이다.
"말단절단"은 상응하는 야생형 서열의 핵산 서열과 비교하여 뉴클레오티드 서열의 3'-말단 또는 5'-말단에 있는 적어도 하나의 뉴클레오티드가 누락되거나, 상응하는 야생형 단백질의 아미노산 서열과 비교하여 단백질의 N-말단 또는 C-말단에 있는 적어도 하나의 아미노산이 누락됨을 의미하는 것으로 이해될 것이며, 여기서 3'-말단 또는 C-말단 말단절단에서 각각 적어도 5'-말단에 있는 제1 뉴클레오티드 또는 N-말단에 있는 제1 아미노산이 여전히 존재하고, 5'-말단 또는 N-말단 말단절단에서 각각 적어도 3'-말단에 있는 마지막 뉴클레오티드 또는 C-말단에 있는 마지막 아미노산이 여전히 존재한다. 5'-말단은 상응하는 야생형 핵산 서열의 번역에서 시작 코돈으로서 사용되는 ATG 코돈에 의해 결정된다.
"대체"는 핵산 서열 내의 적어도 하나의 뉴클레오티드 또는 단백질 서열 내의 하나의 아미노산이 각각의 단백질의 코딩 서열 내의 뉴클레오티드의 교환으로 인해 상응하는 야생형 핵산 서열 또는 상응하는 야생형 아미노산 서열과 비교하여 각각 상이함을 의미할 것이다.
"삽입"은 단백질의 핵산 서열 또는 아미노산 서열이 상응하는 야생형 핵산 서열 또는 상응하는 야생형 아미노산 서열과 비교하여 각각 적어도 하나의 추가 뉴클레오티드 또는 아미노산을 포함함을 의미할 것이다.
본 발명과 관련하여 "조기 정지 코돈"은 상응하는 야생형 코딩 서열의 정지 코돈과 비교하여 5'-말단에서 시작 코돈에 더 가까운 코딩 서열 (cds)에 정지 코돈이 존재함을 의미한다.
"조절 서열에서의 돌연변이", 예를 들어 유전자의 프로모터 또는 인핸서에서의 돌연변이는 야생형 서열과 비교하여 하나 이상의 뉴클레오티드의 변화 (예를 들어 하나 이상의 뉴클레오티드의 대체, 결실 또는 삽입에 의한)이며, 이는 예를 들어 유전자의 감소된 mRNA 전사체가 생성되거나 전혀 생성되지 않도록 유발한다.
"단백질에서의 돌연변이"는 야생형 서열과 비교하여 하나 이상의 아미노산 잔기의 변화 (예를 들어 하나 이상의 아미노산 잔기의 대체, 결실, 말단절단 또는 삽입에 의한)이다.
"돌연변이체 단백질"은 본원에서 단백질을 코딩하는 핵산 서열에서의 하나 이상의 돌연변이를 포함하는 단백질이며, 여기서 돌연변이는 예를 들어 생체내에서 측정가능한 바와 같이, 예를 들어 돌연변이체 대립유전자에 의해 부여된 표현형에 의해 "감소된 기능" 또는 "기능 상실" 단백질을 (코딩하는 돌연변이체 핵산 분자를) 초래한다.
"야생형 3차원 구조" 또는 "야생형 단백질 폴딩"은 생체내에서 이의 정상적인 기능을 수행하기 위한 야생형 단백질의 생체내 폴딩을 지칭한다. "변형된 3차원 구조 또는 변형된 단백질 폴딩"은 야생형 단백질과 상이한 폴딩을 갖는 돌연변이체 단백질을 지칭하며, 이는 생체내에서 이의 정상적인 기능 또는 활성을 감소 또는 폐지하며, 즉 단백질은 감소된 기능 또는 기능 상실을 갖는다.
본 발명의 맥락에서, 단백질의 "감소된 활성"은 상응하는 야생형 식물 세포 또는 상응하는 야생형 식물과 비교할 때 WAP5.1 단백질의 활성의 감소를 의미할 것이다. 감소는 한 측면에서 유전자 발현의 전체 녹아웃 또는 녹다운, 또는 기능 상실 또는 감소된 기능 WAP5.1 단백질의 생산을 포함할 것이며, 예를 들어 돌연변이체 WAP5.1 단백질은 야생형 기능적 WAP5.1 단백질과 비교하여 상실된 기능 또는 감소된 기능을 가질 수 있다. 활성의 감소는 WAP5.1 단백질을 코딩하는 유전자의 발현의 감소 (녹다운으로도 지칭됨), 또는 WAP5.1 단백질을 코딩하는 유전자의 발현의 녹아웃 및/또는 세포 내 WAP5.1 단백질의 양의 감소, 또는 세포 내 WAP5.1 단백질의 활성의 감소된 기능 또는 기능 상실일 수 있다.
본 발명과 관련하여, 용어 "야생형 식물 세포" 또는 "야생형 식물"은 야생형 wap5.1 대립유전자를 포함하고 돌연변이체 wap5.1 대립유전자를 포함하지 않음을 의미한다. 그러므로, 야생형 식물 또는 야생형 식물 세포는 완전히 기능적인 WAP5.1 단백질 (야생형 WAP5.1 단백질로도 지칭됨)을 코딩하는 완전히 기능적인 WAP5.1 유전자를 포함하는 식물 또는 식물 세포이며, 예를 들어 수박 식물 또는 식물 세포와 관련하여 2배체 수박 식물은 서열식별번호: 1 또는 서열식별번호: 9의 단백질 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99% 서열 동일성을 포함하는 단백질)을 생산하고 수분 후에만 과실을 생산한다. 또는, 멜론 식물 또는 세포와 관련하여 2배체 멜론 식물은 서열식별번호: 3의 단백질 (또는 서열식별번호: 3에 대해 적어도 95% 96%, 97%, 98%, 99% 서열 동일성을 포함하는 단백질)을 생산하거나, 또는 오이 식물 또는 세포와 관련하여 2배체 오이 식물은 서열식별번호: 2의 단백질 (또는 서열식별번호: 2에 대해 적어도 95% 96%, 97%, 98%, 99% 서열 동일성을 포함하는 단백질)을 생산한다.
"녹아웃" 또는 "전체 녹아웃"은 각각의 유전자의 발현이 더 이상 검출가능하지 않음을 의미하는 것으로 이해되어야 한다.
"기능 상실" 또는 "감소된-기능" 또는 "감소된 기능"은 본 발명의 맥락에서 단백질이 가능하게는 상응하는 야생형 단백질과 동일한 또는 유사한 양으로 존재하지만 더 이상 이의 정상적인 효과를 나타내지 않음을 의미할 것이며, 즉 2배체 식물에 동형접합 형태로 존재할 때 이러한 단백질을 코딩하는 돌연변이체 대립유전자의 경우, 식물은 수분의 부재 하에 씨없는 과실 및 수분의 존재 하에 씨있는 과실을 생산한다.
"보존된 도메인"은 보존된 단백질 도메인, 예컨대 "LRR-도메인" 및 "F-박스 도메인"을 지칭하며, 이들 둘 다는 단백질-단백질 상호작용에 관여할 가능성이 있다. 서열식별번호: 1 또는 서열식별번호: 9의 수박 WAP5.1 단백질에서, F-박스 도메인은 아미노산 237 내지 277에서 발견되고, 서열식별번호: 2의 오이 WAP5.1 단백질에서 아미노산 244 내지 284에서 발견되고, 서열식별번호: 3의 멜론 단백질에서 아미노산 247 내지 287에서 발견된다. 서열식별번호: 1 또는 서열식별번호: 9의 수박 WAP5.1 단백질에서, LRR-도메인 도메인은 아미노산 291 내지 1033에서 발견되고, 서열식별번호: 2의 오이 WAP5.1 단백질에서 아미노산 297 내지 1040에서 발견되고, 서열식별번호: 3의 멜론 단백질에서 아미노산 301 내지 1043에서 발견된다. 보존된 도메인은 예를 들어 NCBI의 보존된 도메인 데이터베이스에서 찾을 수 있다 (월드 와이드 웹 ncbi.nlm.nih.gov/cdd).
"마커 보조 선택" 또는 "MAS"는 특정 로커스 또는 영역 또는 대립유전자의 존재에 대해 식물을 선택하기 위해 특정 로커스 또는 특정 염색체 영역 또는 대립유전자 특이적 마커에 유전적으로 및 물리적으로 연결된 분자 마커 (예컨대 SNP 마커 또는 INDEL 마커)의 존재를 사용하는 프로세스이다. 예를 들어, 돌연변이체 wap5.1 대립유전자 또는 대립유전자 특이적 마커에 유전적으로 및 물리적으로 연결된 분자 마커는 예를 들어 돌연변이체 wap5.1 대립유전자를 포함하는 수박 식물 또는 식물 부분을 검출 및/또는 선택하기 위해 사용될 수 있다. 대립유전자 특이적 마커는 대립유전자에 대해 직접적으로 선택하므로 바람직한 마커이다.
"표적화된 유전자 편집"은 내인성 표적 유전자를 변형할 수 있는 기술, 예를 들어 하나 이상의 뉴클레오티드가 예를 들어 프로모터 또는 코딩 서열에서 삽입, 대체 및/또는 결실될 수 있는 기술로 지칭된다. 예를 들어 CRISPR 기반 기술, 예컨대 Crispr-Cas9 유전자 편집, Crispr-CpfI 유전자 편집, 또는 '베이스 편집' 또는 '프라이머 편집'이라고 불리는 더 최근의 기술은 수박에서 내인성 표적 유전자, 예컨대 내인성 야생형 WAP5.1 유전자 (서열식별번호: 1 또는 9의 단백질, 또는 서열식별번호: 1 또는 9에 대해 적어도 95% 서열 동일성을 포함하는 야생형 단백질을 코딩함)를 변형시키기 위해 사용될 수 있다. 본원에 기재된 돌연변이체는 예를 들어 야생형 WAP5.1 유전자의 표적화된 유전자 편집에 의해 재생될 수 있다.
"올리고뉴클레오티드" 또는 "올리고" 또는 "올리고뉴클레오티드 프라이머 또는 프로브"는 핵산의 짧은 단일-가닥 중합체, 예를 들어 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24개 또는 그 초과의 뉴클레오티드 길이이다. 올리고는 이들의 의도된 용도에 따라 다양한 화학으로 비변형 또는 변형될 수 있으며, 예를 들어 5' 또는 3' 포스페이트 기의 첨가는 프로브로서 사용하기 위한 방사성핵종 또는 형광단 및/또는 켄처로 라벨링하여 각각 라이게이션 또는 블록 연장을 가능하게 하고, 티올, 아미노, 또는 다른 반응성 모이어티의 혼입은 기능적 분자, 예컨대 효소의 공유결합적 커플링, 및 다양한 관능성의 다른 링커 및 스페이서를 사용한 연장을 가능하게 한다. DNA 올리고가 가장 흔하게 사용되지만, RNA 올리고가 또한 이용가능하다. 올리고의 길이는 대개 접미사 -mer를 첨가함으로써 지정된다. 예를 들어, 19개 뉴클레오티드 (염기)를 갖는 올리고뉴클레오티드는 19-mer라고 불린다. 대부분의 용도의 경우, 올리고뉴클레오티드는 DNA 또는 RNA 가닥과 염기쌍을 형성하도록 설계된다. 올리고뉴클레오티드에 대한 가장 일반적인 용도는 PCR (폴리머라제 연쇄 반응)을 위한 프라이머로서의 용도이다. 프라이머는 증폭을 위해 표적화된 서열에 상보적인 이들의 서열의 적어도 일부로 설계된다. 상보적 서열에 대한 최적의 프라이머 길이는 예를 들어 18 내지 22개 뉴클레오티드이다. PCR을 위한 최적의 프라이머 서열은 대개 프라이머 설계 소프트웨어에 의해 결정된다.
"DNA 마이크로어레이"는 고체 지지체 상에 결합된 DNA, 대개 올리고뉴클레오티드의 많은 미시적 스팟을 갖는 어레이이다. 검정 표적은 DNA, cDNA 또는 cRNA일 수 있다. 시스템에 따라, 특이적 스팟에 대한 표적의 혼성화는 형광, 화학발광, 또는 콜로이드성 은 또는 금에 의해 검출된다. 마이크로어레이는 다중 적용, 예컨대 다수의 유전자의 발현의 동시 측정을 위해 사용되어, 게놈-차원의 유전자 발현 분석, 뿐만 아니라 예를 들어 단일-뉴클레오티드 다형성 (SNP) 또는 InDel 분석을 사용한 유전자형분석 연구를 가능하게 한다.
"상보적 가닥"은 상보적 서열의 2개 가닥을 지칭하고, 이중 가닥 DNA에 대해 센스 (또는 플러스) 및 안티센스 (또는 마이너스) 가닥으로 지칭될 수 있다. 센스 / 플러스 가닥은 일반적으로 DNA의 전사된 서열 (또는 전사에서 생성된 mRNA)인 반면, 안티센스 / 마이너스 가닥은 센스 서열에 상보적인 가닥이다. 본원에 제공된 임의의 서열에 대해 서열의 한 가닥만이 제공되지만, 주어진 가닥의 상보적 가닥이 또한 본원에 포함된다. DNA의 상보적 뉴클레오티드는 T에 상보적인 A, 및 C에 상보적인 G이다. RNA의 상보적 뉴클레오티드는 U에 상보적인 A, 및 C에 상보적인 G이다.
도 1: 위치 528에 있는 아미노산 류신이 아미노산 페닐알라닌에 의해 대체된 단백질 (L528F)을 코딩하는 돌연변이체 wap5.1 대립유전자에 대해 동형접합성인 식물 상에 수분의 부재 하에 발달된 수박 과실의 단면 사진.
도 2: 아미노산 528에 아미노산 류신 (L)을 포함하는 수박 야생형 ('wt'로서 라벨링됨) WAP5.1 단백질 및 아미노산 528에 페닐알라닌 (F)을 포함하는 돌연변이체 WAP5.1 단백질 ('wap5.1'로서 라벨링됨)의 단백질 서열 정렬. 또한 F-박스는 실선 박스에 의해 표시되고, LRR-도메인은 파선 박스에 의해 표시된다.
도 3a: RaptorX 접촉 예측에 의해 생성된 서열식별번호: 1의 야생형 WAP5.1 단백질의 3차원 구조. 아미노산 류신 528은 화살표로 표시된다. LRR-도메인은 긴 꼬리-유사 구조로 폴딩된다.
도 3b: RaptorX 접촉 예측에 의해 생성된, 위치 528에 (류신 대신) 페닐알라닌을 포함하는 서열식별번호: 4의 돌연변이체 WAP5.1 단백질의 3차원 구조. 튀어나온 루프에서 볼 수 있는 바와 같이, 도 3a의 야생형 단백질에서 보이는 3차원 꼬리 구조가 붕괴되고, 단백질이 적절하게 폴딩되지 않는다. 이 붕괴는 루프에서 튀어나온 아미노산 Q581을 지나 연장된다.
도 4: 수박 ('wap5.1'로서 라벨링됨, 서열식별번호: 1), 멜론 (서열식별번호: 3) 및 오이 (서열식별번호: 2)의 야생형 WAP5.1 단백질의 다중 서열 정렬. 도시된 수박 단백질은 서열식별번호: 1의 단백질이다. 서열식별번호: 9의 야생형 WAP5.1 수박 단백질은 도시되지 않았지만, 아미노산 51이 상이한 것을 제외하고 서열식별번호: 1과 동일하다. 서열식별번호: 1 및 서열식별번호: 9의 야생형 WAP5.1 단백질은 99.9% 서열 동일성을 갖는다. 각 아미노산 아래의 별표는 동일한 아미노산을 나타낸다. 실선 박스에 의해 둘러싸인 F-박스 도메인은 수박, 오이 및 멜론 WAP5.1 단백질 사이에 100% 동일하다. 파선 박스에 의해 둘러싸인 LRR-도메인은 또한 수박, 오이 및 멜론 WAP5.1 단백질 사이에 높은 아미노산 동일성을 갖는다. F-박스 앞의 N-말단 영역은 3개의 종 사이에 가장 적게 보존된다. 굵은 글씨로 강조된 아미노산은 수박에서 돌연변이체 대립유전자가 생성된 아미노산 위치 (단일 아미노산 치환 또는 정지 코돈 돌연변이체) 및 멜론 및 오이에서 생성될 수 있는 아미노산 위치를 나타낸다.
도 5: 위치 528에 있는 아미노산 류신이 아미노산 페닐알라닌에 의해 대체된 단백질 (L528F)을 코딩하는 돌연변이체 wap5.1 대립유전자에 대해 동형접합성인 식물 상에 수분의 부재 하에 발달된 절단된 수박 과실의 사진.
도 2: 아미노산 528에 아미노산 류신 (L)을 포함하는 수박 야생형 ('wt'로서 라벨링됨) WAP5.1 단백질 및 아미노산 528에 페닐알라닌 (F)을 포함하는 돌연변이체 WAP5.1 단백질 ('wap5.1'로서 라벨링됨)의 단백질 서열 정렬. 또한 F-박스는 실선 박스에 의해 표시되고, LRR-도메인은 파선 박스에 의해 표시된다.
도 3a: RaptorX 접촉 예측에 의해 생성된 서열식별번호: 1의 야생형 WAP5.1 단백질의 3차원 구조. 아미노산 류신 528은 화살표로 표시된다. LRR-도메인은 긴 꼬리-유사 구조로 폴딩된다.
도 3b: RaptorX 접촉 예측에 의해 생성된, 위치 528에 (류신 대신) 페닐알라닌을 포함하는 서열식별번호: 4의 돌연변이체 WAP5.1 단백질의 3차원 구조. 튀어나온 루프에서 볼 수 있는 바와 같이, 도 3a의 야생형 단백질에서 보이는 3차원 꼬리 구조가 붕괴되고, 단백질이 적절하게 폴딩되지 않는다. 이 붕괴는 루프에서 튀어나온 아미노산 Q581을 지나 연장된다.
도 4: 수박 ('wap5.1'로서 라벨링됨, 서열식별번호: 1), 멜론 (서열식별번호: 3) 및 오이 (서열식별번호: 2)의 야생형 WAP5.1 단백질의 다중 서열 정렬. 도시된 수박 단백질은 서열식별번호: 1의 단백질이다. 서열식별번호: 9의 야생형 WAP5.1 수박 단백질은 도시되지 않았지만, 아미노산 51이 상이한 것을 제외하고 서열식별번호: 1과 동일하다. 서열식별번호: 1 및 서열식별번호: 9의 야생형 WAP5.1 단백질은 99.9% 서열 동일성을 갖는다. 각 아미노산 아래의 별표는 동일한 아미노산을 나타낸다. 실선 박스에 의해 둘러싸인 F-박스 도메인은 수박, 오이 및 멜론 WAP5.1 단백질 사이에 100% 동일하다. 파선 박스에 의해 둘러싸인 LRR-도메인은 또한 수박, 오이 및 멜론 WAP5.1 단백질 사이에 높은 아미노산 동일성을 갖는다. F-박스 앞의 N-말단 영역은 3개의 종 사이에 가장 적게 보존된다. 굵은 글씨로 강조된 아미노산은 수박에서 돌연변이체 대립유전자가 생성된 아미노산 위치 (단일 아미노산 치환 또는 정지 코돈 돌연변이체) 및 멜론 및 오이에서 생성될 수 있는 아미노산 위치를 나타낸다.
도 5: 위치 528에 있는 아미노산 류신이 아미노산 페닐알라닌에 의해 대체된 단백질 (L528F)을 코딩하는 돌연변이체 wap5.1 대립유전자에 대해 동형접합성인 식물 상에 수분의 부재 하에 발달된 절단된 수박 과실의 사진.
본 발명의 제1 실시양태는 돌연변이체 대립유전자가 동형접합 형태인 경우에 단위결과, 특히 통성 단위결과를 부여하는 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는, 재배 수박 식물, 시트룰루스 라나투스에 관한 것이다. 그러므로, 한 측면에서 WAP5.1이라고 불리는 단일 열성 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 재배 수박 식물이 제공된다.
WAP5.1 유전자는 재배 수박의 내인성 유전자이며, 이는 돌연변이된 경우에 및 동형접합 형태인 경우에 단위결과, 특히 통성 단위결과를 초래한다.
본 발명자들에 의해 식별된 돌연변이체 단위결과성 수박 식물을 엘리트 수박 계통과 교배시킴으로써 생성된 격리 집단은 염색체 5 상의 영역으로의 WAP5.1 유전자의 맵핑을 가능하게 하였다. 2개의 맵핑 집단에서의 추가 분석은 코딩된 단백질에서 단일 아미노산 치환 (L528F)을 유발하는 돌연변이를 포함하는 유전자의 식별에 이르게 하였다. 돌연변이는 계통에 고유하였고, 93 전체 게놈 재시퀀싱된 계통에서 발견되지 않았다. 유전자는 WAP5.1로 명명되었다 (염색체 5 상의 수박 단위결과 유전자에 대해). 돌연변이체 대립유전자에 대해 식물을 스크리닝하기 위해 대립유전자 특이적 마커를 설계하였으며, 서열식별번호: 8에 제공된다.
돌연변이체 단위결과성 수박 식물에서 야생형 WAP5.1 단백질 (서열식별번호: 1 또는 서열식별번호: 9)의 위치 528에 있는 류신은 도 2에 나타낸 바와 같이 돌연변이체 단백질 (서열식별번호: 4 또는 서열식별번호: 10에 표시됨)에서 페닐알라닌 (L528F)에 의해 대체되었다. 돌연변이체 대립유전자 (서열식별번호: 5 또는 서열식별번호: 12)의 cDNA에서 뉴클레오티드 1582는 티민 (T)인 반면, 야생형 wap5.1 cDNA (서열식별번호: 6 또는 서열식별번호: 11)에서는 시토신 (C)이다. 이 단일 뉴클레오티드 변화 (또는 SNP, C→T)는 코돈 CTT (류신, L을 코딩함)로부터 TTT (페닐알라닌, F를 코딩함)로의 코돈 변화를 초래한다. 서열식별번호: 7의 게놈 DNA (찰스턴 그레이 게놈의 야생형 WAP5.1 대립유전자를 코딩함)에서 돌연변이는 뉴클레오티드 4123에 있는 C의 뉴클레오티드 4123에 있는 T로의 변화, 코돈 CTT의 TTT로의 변화에 상응한다. 서열식별번호: 14의 게놈 DNA (수박 97103 게놈의 야생형 WAP5.1 대립유전자를 코딩함)에서 돌연변이는 뉴클레오티드 4118에 있는 C의 뉴클레오티드 4118에 있는 T로의 변화, 코돈 CTT의 TTT로의 변화에 상응한다.
돌연변이체 WAP5.1 단백질의 이 단일 아미노산 변화는 LRR-도메인의 정상적인 단백질 폴딩을 변화시켜 단백질이 비기능적이거나 생체내에서 감소된 기능을 갖도록 유발하는 것으로 나타났다. 그 결과, 이 돌연변이체 단백질에 대해 동형접합성인 (및 그러므로 기능적 야생형 단백질이 결여된) 식물은 수분의 부재 하에 씨없는 과실, 및 수분이 일어날 때 정상적인 씨있는 과실을 발달시킨다.
WAP5.1 대립유전자에서의 다른 돌연변이체가 생성되었고, 또한 오이 및 멜론의 오르토로그가 식별되었다. 따라서, 이 발견은 통성 단위결과성 수박 식물, 뿐만 아니라 통성 단위결과성 오이 또는 멜론 식물의 생산을 가능하게 한다.
한 측면에서 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 수박, 오이 또는 멜론 식물 또는 식물 부분이 제공되며, 여기서 상기 돌연변이체 대립유전자는
a) 야생형 대립유전자와 비교하여 대립유전자의 발현 없음 또는 감소된 발현을 초래하는 조절 요소에 하나 이상의 돌연변이를 포함하고/거나,
b) 야생형 단백질과 비교하여 대체, 삽입 또는 결실된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하고,
여기서 a) 또는 b)의 상기 돌연변이체 대립유전자는 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 부여하고, 여기서 야생형 수박 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질, 또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하고, 야생형 오이 대립유전자는 서열식별번호: 2의 단백질 또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하고, 야생형 멜론 대립유전자는 서열식별번호: 3의 단백질 또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩한다.
수박, 오이 및 멜론의 야생형 기능적 WAP5.1 단백질은 서열식별번호: 1 및 서열식별번호: 9 (수박), 서열식별번호: 2 (오이) 및 서열식별번호: 3 (멜론)에 제공된다. 이들은 또한 도 4의 다중 서열 정렬에 도시되어 있다. 그러나 각 종에 일부 아미노산 서열 변이가 있을 수 있으며, 기능적 WAP5.1 단백질은 예를 들어 본원에 제공된 서열식별번호: 1, 2 및 3과 상이한 1, 2, 3, 4 또는 5개의 아미노산을 포함할 수 있거나, 여기서 단백질은 서열식별번호: 1, 2 또는 3의 단백질에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 99.5% 또는 99.6%, 99.7%, 99.8% 또는 99.9% 서열 동일성을 포함한다. 예를 들어 수박 찰스턴 그레이 품종 및 엘리트 계통 TY에서 야생형 단백질 간에 차이가 발견되었다. 엘리트 수박 계통 TY에서, 야생형 WAP5.1 단백질 (서열식별번호: 9)은 야생형 찰스턴 그레이 WAP5.1 단백질 (서열식별번호: 1)로부터의 아미노산 51이 상이한 것으로 밝혀졌다. 계통 TY는 아미노산 51에 아르기닌 (R)을 갖는 반면, 찰스턴 그레이는 아미노산 51에 글리신 (G)을 갖는다. 계통 TY의 cDNA에서 서열식별번호: 11의 뉴클레오티드 151 내지 153에 있는 코돈은 'CGT'인 반면, 찰스턴 그레이의 cDNA에서 서열식별번호: 6의 뉴클레오티드 151 내지 153에 있는 코돈은 'GGT'이다. 대립유전자 간의 또 다른 차이는 S450에 대한 코돈이 상이한 반면, 아미노산 (S450)이 동일하다는 것이다. TY 계통에서 서열식별번호: 11의 뉴클레오티드 1348 내지 1350에 있는 코돈은 'AGC' (Ser, S를 코딩함)인 반면, 찰스턴 그레이 대립유전자에서 서열식별번호: 6의 뉴클레오티드 1348 내지 1350에 있는 코돈은 'AGT' (Ser, S를 코딩함)이다. 야생형 대립유전자의 게놈 DNA는 분명히 이들 코돈의 동일한 차이를 포함한다.
그러므로, 수박에서 예를 들어 참조 게놈 찰스턴 그레이는 서열식별번호: 1의 단백질을 코딩하는 유전자를 함유하는 반면, 품종 97103의 참조 게놈 (게놈 버전 v2) 및 엘리트 계통 TY는 서열식별번호: 1과 상이한 1개의 아미노산 (아미노산 51)을 갖는 WAP5.1 유전자를 함유하며, 즉 단백질은 서열식별번호: 1과 99.9% 동일하다 (쌍별 정렬, 예컨대 엠보스-니들에서). F-박스 앞의 N-말단 서열은 덜 보존되어 있으며 이들은 기능적 (야생형) WAP5.1 단백질이다. 따라서, 한 측면에서 수박 단백질 (서열식별번호: 1 및 서열식별번호: 9), 오이 단백질 (서열식별번호: 2) 및 멜론 단백질 (서열식별번호: 3)의 기능적 변이체는 쌍별 정렬된 경우에 (예를 들어 디폴트 파라미터를 사용하는 니들 사용) 서열식별번호: 1, 9, 2 또는 3의 단백질에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 99.5% 또는 99.6%, 99.7%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질이다.
한 측면에서 아미노산 서열 변이는 F-박스 앞에 있으며, 즉 서열식별번호: 1 또는 서열식별번호: 9 (수박)의 아미노산 1 내지 236, 또는 서열식별번호: 2 (오이)의 아미노산 1 내지 243 또는 서열식별번호: 3 (멜론)의 아미노산 1 내지 246에 있다. 한 측면에서 기능적 단백질은 서열식별번호: 1, 9, 2 또는 3의 단백질에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 99.5% 또는 99.6%, 99.7%, 99.8% 또는 99.9% 서열 동일성을 포함하고, 따라서 아미노산 237에서 시작하여 서열식별번호: 1 또는 9의 끝까지, 또는 아미노산 244에서 시작하여 서열식별번호: 2의 끝까지, 또는 아미노산 247에서 시작하여 서열식별번호: 3의 끝까지의 영역에 대해 서열식별번호: 1, 9, 2 또는 3과 100% 동일한 아미노산을 포함하며, 이는 변이가 F-박스 도메인 앞에 있기 때문이다.
F-박스 도메인 및 LRR-도메인은 고도로 보존되어 있기 때문에 (둘 다는 종 내에 및 종 간에 있음), 이들 보존된 도메인 중 어느 하나에서의 임의의 돌연변이는 생체내에서 감소된 기능을 갖거나 기능을 갖지 않는 돌연변이체 WAP5.1 단백질을 유발하여, 이에 의해 예를 들어 2배체 식물에서 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과성 표현형을 유발할 것으로 예측된다.
언급된 바와 같이, F-박스는 수박, 오이 및 멜론 WAP5.1 단백질 간에 100% 동일하다. F-박스는 일반적으로 단백질-단백질 상호작용에 관여하는 도메인이며, 따라서 F-박스에서 하나 이상의 아미노산의 삽입, 결실 또는 대체에 의한 F-박스 서열의 변화는 단백질 기능에 부정적인 영향을 미칠 것이다.
따라서, 한 측면에서 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 수박, 오이 또는 멜론 식물 또는 식물 부분이 제공되며, 여기서 상기 돌연변이체 대립유전자는 서열식별번호: 1 또는 9 (수박)의 아미노산 237에서 시작하여 아미노산 277에서 끝나는, 서열식별번호: 2 (오이)의 아미노산 244에서 시작하여 아미노산 284에서 끝나는, 서열식별번호: 3 (멜론)의 아미노산 247에서 시작하여 아미노산 287에서 끝나는 단백질의 F-박스 도메인에서 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하며, 여기서 상기 돌연변이체 대립유전자는 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 부여하고,
여기서 야생형 수박 대립유전자는 서열식별번호: 1 또는 9의 단백질 또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하고, 야생형 오이 대립유전자는 서열식별번호: 2의 단백질 또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하고, 야생형 멜론 대립유전자는 서열식별번호: 3의 단백질 또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩한다. 상기 언급된 바와 같이, 기능적 야생형 단백질에서 적어도 95% 96%, 97%, 98%, 99% 또는 99.5% 또는 99.6%, 99.7%, 99.8% 또는 99.9% 서열 동일성의 변이는 한 측면에서 F-박스 도메인 앞의 N-말단 부분에, 즉 서열식별번호: 1 또는 9 (수박)의 아미노 1 내지 236의 단백질 영역, 또는 서열식별번호: 2 (오이)의 아미노산 1 내지 243, 또는 서열식별번호: 3 (멜론)의 아미노산 1 내지 246의 영역에 있다.
용어 '에서 시작하여' 및 '에서 끝나는' 또는 '부터' 및 '까지'는 언급된 첫 번째 및 마지막 아미노산을 포함한다.
LRR-도메인은 또한 하기 표에 나타낸 바와 같이 고도로 보존되어 있다 (둘 다는 종 내에 및 종 간에 있음) (니들, 디폴트 파라미터를 사용하여 LRR-도메인의 쌍별 정렬을 사용한 서열 동일성):
LRR-도메인은 또한 일반적으로 단백질-단백질 상호작용에 관여하는 도메인이며, 따라서 LRR-도메인에서 하나 이상의 아미노산의 삽입, 결실 또는 대체에 의한 LRR-도메인 서열의 변화는 단백질 기능에 부정적인 영향을 미칠 것이다. LRR-도메인은 수박의 야생형 WAP5.1 단백질에서 폴딩하는 '꼬리 유사' 구조에서 볼 수 있는 바와 같이 고도로 구조화되어 있다 (도 3a 참조). 아미노산 치환, 결실 또는 삽입은 LRR-도메인의 부적절한 폴딩을 유발할 수 있다. 이는 하기 표 1 및 도 3b에 나타낸 바와 같이 프로그램 RaptorX 접촉 예측을 사용하여 분석될 수 있으며, 여기서 단일 아미노산 치환 (L528F)은 손상된 또는 부적절한 LRR-도메인 폴딩 (야생형 LRR-도메인과 비교하여)을 초래하고, 이 돌연변이체 대립유전자는 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 초래한다.
따라서, 한 측면에서 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 수박, 오이 또는 멜론 식물 또는 식물 부분이 제공되며, 여기서 상기 돌연변이체 대립유전자는 서열식별번호: 1 또는 9 (수박)의 아미노산 291에서 시작하여 아미노산 1033에서 끝나는, 서열식별번호: 2 (오이)의 아미노산 298에서 시작하여 아미노산 1040에서 끝나는, 서열식별번호: 3 (멜론)의 아미노산 301에서 시작하여 아미노산 1043에서 끝나는 단백질의 LRR-도메인에서 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하고, 바람직하게는 여기서 상기 삽입, 결실 또는 대체는 단백질의 LRR-도메인의 부적절한 폴딩을 초래하며, 여기서 상기 돌연변이체 대립유전자는 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 부여하고,
여기서 야생형 수박 대립유전자는 서열식별번호: 1 또는 9의 단백질, 또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하고, 야생형 오이 대립유전자는 서열식별번호: 2의 단백질 또는 서열식별번호: 2에 대해 적어도 95% 서열 동일성을 포함하는 단백질을 코딩하고, 야생형 멜론 대립유전자는 서열식별번호: 3의 단백질 또는 서열식별번호: 3에 대해 적어도 95% 서열 동일성을 포함하는 단백질을 코딩한다. 상기 언급된 바와 같이, 기능적 야생형 단백질에서 적어도 95% 96%, 97%, 98%, 99% 또는 99.5% 또는 99.6%, 99.7%, 99.8% 또는 99.9% 서열 동일성의 변이는 한 측면에서 F-박스 도메인 앞의 N-말단 부분에, 즉 서열식별번호: 1 또는 9 (수박)의 아미노 1 내지 236의 단백질 영역, 또는 서열식별번호: 2 (오이)의 아미노산 1 내지 243, 또는 서열식별번호: 3 (멜론)의 아미노산 1 내지 246의 영역에 있다.
부적절한 폴딩은 RaptorX 접촉 예측에 기초하여 예측될 수 있으며, 여기서 LRR-도메인 또는 '꼬리'의 3차원 모델은 돌연변이체 단백질의 LRR 도메인 폴딩이 야생형 단백질의 꼬리-유사 폴딩에서 벗어남을 보여주며, 예를 들어 꼬리로부터 튀어나온 루프 또는 꼬리는 예를 들어 적어도 5, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 250, 300, 350, 400, 450, 500개 또는 그 초과의 C-말단 아미노산에 의해 말단절단되거나 전체 꼬리가 부재한다.
그러므로, LRR-도메인에서 하나 이상의 아미노산의 삽입, 결실 및/또는 대체는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 아미노산의 삽입, 결실 및/또는 대체일 수 있다. 또한 코돈의 정지 코돈으로의 돌연변이를 통한 하나 이상의 아미노산의 결실이 본원에 포함된다.
돌연변이체 대립유전자는 다양한 기술, 예컨대 무작위 돌연변이유발 또는 표적화된 유전자 편집에 의해 생성될 수 있고, 그 후 돌연변이체 대립유전자의 표현형은 돌연변이체 대립유전자에 대해 동형접합성인 식물에서 분석될 수 있다.
야생형 기능적 단백질의 하나 이상의 아미노산의 삽입, 결실 및/또는 대체를 초래하는 임의의 돌연변이체 대립유전자는 감소된 기능을 갖거나 기능을 갖지 않는 돌연변이체 단백질을 초래할 수 있고, 그러므로 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과의 표현형을 초래할 수 있다. 한 측면에서 서열식별번호: 1 또는 9의 수박 WAP5.1 단백질, 서열식별번호: 2의 오이 WAP5.1 단백질 및 서열식별번호: 3의 멜론 WAP5.1 단백질 사이에 보존된 임의의 아미노산 중 하나 이상 (다중 서열 정렬 아래에 *로서 도 4에 표시됨)은 상이한 아미노산에 의해 대체되거나 결실되거나 코돈이 정지 코돈으로 돌연변이된다. 이러한 돌연변이체 대립유전자를 포함하는 식물 및 식물 부분이 본원의 한 실시양태이다.
본원에서 다수의 돌연변이체 대립유전자가 상기 표 1에 나타낸 바와 같이 수박 식물 (엘리트 TY 계통)에서 생성되었다. 이들 돌연변이체 대립유전자, 및 이들을 포함하는 수박, 오이 또는 멜론 식물 및 식물 부분이 또한 한 측면이다. 그러므로 한 측면에서 식물 또는 식물 부분은 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하며, 여기서 상기 돌연변이체 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질)의 아미노산 번호 D209, A257, A266, W274, E287, Q333, L528, P308 또는 G330을 코딩하거나 서열식별번호: 2 또는 3 내의 동등한 아미노산 (또는 서열식별번호: 2 또는 3에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질)을 코딩하는 코돈에 돌연변이를 포함한다. 이들 아미노산은 또한 도 4에서 볼 수 있는 바와 같이 3개의 종 사이에 보존되어 있으며, 여기서 이들은 굵은 글씨로 강조되어 있다. 한 측면에서 코돈에서의 돌연변이는 상이한 아미노산을 코딩하거나 정지 코돈을 코딩하도록 코돈을 변화시킨다.
'동등한 아미노산'은 아미노산 서열 정렬에 의해 쉽게 결정될 수 있다 (예를 들어 도 4 참조, 여기서 오이 및 멜론의 동등한 아미노산은 굵은 글씨로 강조됨).
코돈에서의 돌연변이는 코돈에서의 (적어도 하나의) 뉴클레오티드 삽입, 결실 또는 대체일 수 있으며, 예를 들어 상이한 리딩 프레임 또는 상이한 코돈이 예를 들어 상이한 아미노산 또는 정지 코돈을 코딩하도록 유발한다. 또한 전체 코돈은 결실되거나 상이한 코돈 (또는 임의로 정지 코돈)에 의해 대체될 수 있으며, 코딩된 아미노산의 결실 또는 이의 대체를 초래한다.
한 측면에서 돌연변이체 대립유전자는 서열식별번호: 1 또는 9 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질)의 아미노산 번호 D209, A257, A266, W274, E287, Q333, L528, P308 또는 G330 또는 서열식별번호: 2 또는 3 (또는 서열식별번호: 2 또는 3에 대해 적어도 95% 서열 동일성을 포함하는 단백질) 내의 동등한 아미노산의 아미노산 치환 또는 정지 코돈을 코딩한다.
추가 측면에서 돌연변이체 대립유전자는 하기 변화 중 하나 이상을 코딩한다: 서열식별번호: 1 또는 서열식별번호: 9 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질)의 D209V, A257V, A266V, W274STOP, E287K, Q333STOP, L528F, P308L 및/또는 G330E 또는 서열식별번호: 2 또는 3 (또는 서열식별번호: 2 또는 3에 대해 적어도 95% 서열 동일성을 포함하는 단백질) 내의 동등한 아미노산.
언급된 바와 같이 수박, 오이 또는 멜론 식물 또는 종자 또는 식물 부분은 돌연변이체 wap5.1 대립유전자를 포함할 수 있으며, 여기서 돌연변이체 대립유전자는 무작위 돌연변이유발 또는 표적화된 돌연변이유발, 예컨대 CRISPR 기반 방법에 의해 생산된다. 무작위 돌연변이유발은 예를 들어 화학적 유도된 (예를 들어, EMS 처리) 또는 방사선 유도된 돌연변이유발 또는 다른 방법일 수 있으며, 여기서 돌연변이는 게놈에서 무작위로 유도된 후, 내인성 wap5.1 유전자에 돌연변이를 포함하는 식물 또는 식물 부분은 스크리닝 및 식별될 수 있다. 표적화된 돌연변이유발은 예를 들어 Crispr-Cas9, 또는 Crispr-CpfI 또는 다른 공지된 방법을 사용하여 돌연변이를 표적 유전자, 예컨대 wap5.1 유전자에 특이적으로 도입하는 방법이다. 이러한 방법을 사용하여, 예를 들어 표 1에 기재된 돌연변이체 대립유전자가 과도한 부담 없이 생성될 수 있거나 다른 돌연변이체 대립유전자가 만들어질 수 있음을 주목해야 한다.
본원에서 수박, 오이 또는 멜론 식물을 언급할 때 이는 한 측면에서 식물이 성장될 수 있는 종자를 포함하며, 즉 종자 내의 배아는 기재된 바와 같은 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함할 수 있다.
한 측면에서 돌연변이체 대립유전자를 포함하는 식물은 본질적으로 생물학적 프로세스에 의해 배타적으로 생산되지 않으며, 이는 돌연변이체 대립유전자가 한 지점에서 인간 개입에 의해 생성되었음을 의미한다. 이러한 인간 생성된 돌연변이체 대립유전자가 교배 및 선택에 의해 한 식물로부터 또 다른 식물로 전달되는 경우, 식물 자체가 교배 및 선택에 의해서만 생성된 경우에도 특허는 돌연변이체 대립유전자를 포함하는 식물을 포함한다. 바람직하게는 식물은 트랜스제닉이 아니고, 예를 들어 표적화된 유전자 편집의 경우에 내인성 유전자를 변형시키는데 사용된 임의의 구축물은 게놈으로부터 제거되었다. 또한 돌연변이체 wap5.1 대립유전자가 외부로부터 도입되어 식물 형질전환 기술을 사용하여 식물 게놈의 어느 곳에도 통합되지 않는다는 점에서 식물은 바람직하게는 트랜스제닉 식물이 아니며, 오히려 돌연변이체 대립유전자는 야생형 대립유전자가 위치된 게놈 내의 로커스에서 돌연변이된 (표적화된 또는 무작위 돌연변이유발 사용) 내인성, 야생형 WAP5.1 대립유전자이다.
한 측면에서 수박, 오이 또는 멜론 식물은 2배체이고, 상기 기재된 바와 같은 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하며, 즉 식물은 이형접합성이다. 표현형은 돌연변이체 대립유전자가 동형접합 형태인 경우에만 나타나기 때문에, 이들 식물은 통성 단위결과성이 아니지만, 수분 시 정상적인 씨있는 과실을 생산하고 꽃의 수분의 부재 하에 과실을 생산하지 않는다. 이러한 이형접합성 식물의 자가생식은 동형접합성이고 돌연변이체 대립유전자의 2개 카피를 포함하는 식물을 생성할 것이다. 한 측면에서 수박, 오이 또는 멜론 식물은 2배체이고, 상기 기재된 바와 같은 돌연변이체 wap5.1 대립유전자의 2개 카피를 포함하며, 즉 식물은 동형접합성이다. 따라서, 식물은 또한 통성 단위결과성이며, 수분의 부재 하에 씨없는 과실 및 수분이 일어나는 경우에 씨있는 과실을 생산한다.
돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하는 식물 및 식물 부분은 바람직하게는 야생 식물이 아닌 재배 식물이다. 따라서, 바람직하게는 재배 수박 (시트룰루스 라나투스), 재배 오이 (쿠쿠미스 사티부스) 또는 재배 멜론 (쿠쿠미스 멜로)이다. 식물은 근친교배 계통, F1 하이브리드 또는 육종 계통일 수 있다.
한 측면에서 식물은 수박 식물이고, 수박 식물은 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하는 2배체, 3배체 또는 4배체이다. 2배체 식물 또는 식물 부분은 한 측면에서 2개 카피를 포함하고, 3배체 식물 또는 식물 부분은 1, 2 또는 3개 카피를 포함하고, 4배체 식물 또는 식물 부분은 돌연변이체 wap5.1 대립유전자의 2 또는 4개 카피를 포함한다.
또한 상기 기재된 바와 같은 식물 또는 식물 부분이 성장될 수 있는 종자가 본원에 포함된다.
마찬가지로 상기 기재된 식물에 의해 생산된 과실이 본원에 포함되며, 임의로 여기서 과실은 씨가 없고 수분의 부재 하에 생산된다.
따라서, 식물 또는 식물 부분은 웅성 불임을 부여하는 유전자 또는 위단위결과를 부여하는 유전자 또는 단위결과를 부여하는 또 다른 유전자를 추가로 포함할 수 있다.
식물 부분은 세포, 꽃, 잎, 줄기, 삽목, 배주, 화분, 뿌리, 근경, 접순, 과실, 원형질체, 배아, 꽃밥일 수 있다.
추가로, 식물 부분으로부터 번식되고 이의 게놈에 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하는 영양 번식 식물이 제공된다.
한 측면에서 또한 씨없는 수박 과실을 생산하는 방법이 제공되며, 상기 방법은 기재된 바와 같은 돌연변이체 wap5.1 대립유전자의 2개 카피를 포함하는 2배체 수박 식물을 성장시키는 단계를 포함하며, 여기서 꽃의 수분은 성장 동안 방지된다. 수분의 방지는 다양한 방법에 의해, 예를 들어 수꽃 또는 웅성 생식 기관 (수술, 화분)의 제거, 곤충이 없는 환경에서의 성장 및/또는 식물의 웅성 불임에 의해 수행될 수 있다.
추가 측면에서 씨없는 수박 과실을 생산하는 방법이 제공되며, 상기 방법은 기재된 바와 같은 돌연변이체 wap5.1 대립유전자의 1, 2 또는 3개 카피를 포함하는 3배체 수박 식물을 성장시키는 단계를 포함하며, 여기서 성장 동안 수분자 식물이 존재하지 않는다.
WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 존재에 대해 식물, 종자, 식물 부분 또는 이로부터의 DNA를 스크리닝 또는 검출 또는 유전자형분석하기 위한, 또는 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자를 포함하는 식물, 종자 또는 식물 부분을 선택하기 위한, 또는 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자를 포함하는 식물, 종자 또는 식물 부분을 생성하기 위한 방법이 제공되며, 여기서 상기 돌연변이체 대립유전자는
a) 야생형 대립유전자와 비교하여 대립유전자의 발현 없음 또는 감소된 발현을 초래하는 조절 요소에 하나 이상의 돌연변이를 포함하고/거나,
b) 야생형 단백질과 비교하여 대체, 삽입 또는 결실된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하고,
여기서 야생형 수박 대립유전자는 서열식별번호: 1 또는 9의 단백질 또는 서열식별번호: 1 또는 9에 대해 적어도 95% 서열 동일성을 포함하는 단백질을 코딩하고, 야생형 오이 대립유전자는 서열식별번호: 2의 단백질 또는 서열식별번호: 2에 대해 적어도 95% 서열 동일성을 포함하는 단백질을 코딩하고, 야생형 멜론 대립유전자는 서열식별번호: 3의 단백질 또는 서열식별번호: 3에 대해 적어도 95% 서열 동일성을 포함하는 단백질을 코딩한다.
한 측면에서 돌연변이체 wap5.1 대립유전자는 상기 기재된 바와 같이 삽입, 결실 또는 대체된 하나 이상의 아미노산, 예를 들어 서열식별번호: 1 또는 서열식별번호: 9의 D209, A257, A266, E287, W274, Q333, L528, P308 또는 G330 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열 내의 동등한 아미노산) 또는 서열식별번호: 2 또는 3 (또는 서열식별번호: 2 또는 3에 대해 적어도 95% 동일성을 포함하는 서열) 내의 동등한 아미노산을 포함하는 돌연변이체 WAP5.1 단백질의 발현을 초래하는 게놈 DNA에 돌연변이를 포함한다.
그러나, 또한 동형접합 형태인 경우에 통성 단위결과를 유발하는 WAP5.1 유전자의 상이한 돌연변이체 대립유전자가 본 발명의 실시양태이다. 이러한 상이한 돌연변이체 wap5.1 대립유전자는 과도한 부담 없이 통상의 기술자에 의해 생성될 수 있다. 통상의 기술자는 예를 들어 WAP5.1 유전자에서 다른 돌연변이체를 생성하고, 이들이 동일하게 2배체 수박, 오이 또는 멜론 식물에서 동형접합 형태인 경우에 통성 단위결과를 초래하는지 여부를 결정할 수 있다.
유전자의 뉴클레오티드 서열을 식별한 후, 통상의 기술자는 WAP5.1 유전자에 돌연변이체를 포함하는 수박, 멜론 또는 오이 식물을 다양한 방법, 예를 들어 돌연변이유발, TILLING 또는 CRISPR-Cas 또는 관련 기술분야에 공지된 다른 방법에 의해 생성할 수 있다. 특히 표적화된 유전자 변형 기술, 예컨대 Crispr-Cas, TALENS 등을 사용하여, 표적화된 돌연변이가 관련 기술분야의 통상의 기술자에 의해 만들어질 수 있다. 그 후, 돌연변이체 wap5.1 대립유전자에 대해 동형접합성인 식물의 표현형, 즉 통성 단위결과성을 확인할 수 있다. 따라서, 통상의 기술자는 본 발명자들에 의해 생성된 특정 WAP5.1 돌연변이체 (통상의 기술자가 또한 생성할 수 있음)에 제한되지 않지만, 통상의 기술자는 수박 및 또한 오이 및 멜론의 wap5.1 대립유전자에서 다른 돌연변이를 동일하게 생성할 수 있으며, 이에 의해 동형접합 형태인 경우에 통성 단위결과를 유발하는 다른 돌연변이체를 생성할 수 있다. 다양한 돌연변이가 생성되고 생성된 표현형에 대해 테스트될 수 있으며, 예를 들어 조절 요소는 대립유전자의 발현 (녹다운)을 감소시키거나 발현 (녹아웃)을 제거하고 그러므로 세포 또는 식물에 존재하는 WAP5.1 단백질의 양을 감소 또는 제거하도록 돌연변이될 수 있다. 대안적으로, WAP5.1 단백질의 감소된 기능 또는 기능 상실을 유발하는 돌연변이, 즉 하나 이상의 아미노산이 치환, 삽입 또는 결실되도록 유발하는 돌연변이 (예컨대 미스센스 돌연변이 또는 프레임 시프트 돌연변이) 또는 코딩 서열에서 정지-코돈의 도입을 통해 단백질이 말단절단되는 돌연변이 (넌센스 돌연변이)가 생성될 수 있다. WAP5.1 단백질이 2개의 보존된 도메인, "F-박스 도메인" 및 "LRR-도메인"을 포함하기 때문에, 한 측면에서 하나 이상의 아미노산이 이들 도메인 중 어느 하나에서 대체, 결실 또는 삽입되는 것이 포함되며, 이는 이러한 돌연변이가 단백질 기능을 감소시키거나 기능 상실을 초래할 가능성이 있기 때문이다. 그 후, 돌연변이가 예상된 표현형 (통성 단위결과)을 초래하는지 여부는 자가생식을 통해 돌연변이에 대해 동형접합성인 식물을 생성하고, 꽃의 수분의 존재 및 부재 하에 식물 계통을 성장시켜 과실이 통성 단위결과성 방식으로 발달하는지 확인함으로써 테스트될 수 있다.
대안적으로, 통상의 기술자는 하기 단계를 포함하는, 통성 단위결과성 재배 수박, 오이 또는 멜론 식물을 생산하는 방법을 수행할 수 있다:
a) 수박, 오이 또는 멜론 식물(들) 또는 종자(들), 특히 재배 식물(의 집단)에 돌연변이를 도입하거나, 또는 돌연변이된 식물(들) 또는 종자 또는 이의 자손(의 집단)을 제공하는 단계;
b) 암꽃의 수분 없이 씨없는 과실을 생산하고 암꽃의 수분 후 씨있는 과실을 생산하는 식물을 선택하는 단계;
c) 임의로 b)에서 선택된 식물이 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는지 결정하는 단계; 및
d) 임의로 c)에서 수득된 식물을 성장시키는 단계.
단계 b)는 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는 식물을 선택하는 단계이고, 단계 c)는 식물 (또는 자가생식에 의해 생산된 이의 자손)이 암꽃의 수분 없이 씨없는 과실을 생산하고 암꽃의 수분 후 씨있는 과실을 생산하는지 결정하는 단계가 되도록, 단계 b) 및 c)는 또한 전환될 수 있다.
단계 a)는 예를 들어 수박, 오이 또는 멜론의 하나 이상의 계통 또는 품종의 종자의 돌연변이유발에 의해, 예를 들어 돌연변이유발제, 예컨대 화학적 돌연변이원, 예를 들어 EMS (에틸 메탄 술포네이트)를 사용한 처리, 또는 UV 방사선, X선 또는 감마선 등을 사용한 조사에 의해 수행될 수 있다. 집단은 예를 들어 TILLING 집단일 수 있다. 바람직하게는 돌연변이유발된 식물 집단은 단계 b)를 수행하기 전에 적어도 1회 자가생식된다 (예를 들어, M2 세대, 또는 M3, M4 등을 생산하기 위해). 표현형분석과 관련된 단계 b)에서, 식물은 바람직하게는 곤충 화분매개자의 존재를 회피하기 위해 곤충 방지 환경에서 성장된다. 암꽃의 정기적인 육안 검사, 수분 없이 꽃의 과실 결실 및 성숙 과실의 육안 검사 (예를 들어, 생존가능한 종자의 존재 또는 씨없음)는 암꽃의 수분 없이 씨없는 과실을 생산하는 돌연변이체를 식별하기 위해 수행될 수 있다. 이러한 식물 또는 이의 자가생식 자손은 수분 후 과실이 씨가 있는지 확인하기 위해 암꽃을 수분함으로써, WAP5.1 유전자 및 코딩된 단백질에서의 돌연변이에 대해 식물을 유전자형분석함으로써, 또는 WAP5.1 유전자의 발현, 시퀀싱 및 통상의 기술자에게 공지된 다른 방법에 의해 돌연변이체 WAP5.1 유전자의 존재에 대해 테스트될 수 있다. 그러므로, 표현형적으로 선택된 식물이 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는지 확인하기 위한 다양한 방법 또는 방법의 조합이 있다.
단계 b)가 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는 식물의 선택인 경우, 통상의 기술자는 또한 돌연변이체 wap5.1 대립유전자를 포함하는 식물을 식별하기 위해 WAP5.1 유전자의 DNA, mRNA 또는 단백질을 검출하기 위한 다양한 방법을 사용할 수 있다. 기능적 WAP5.1 단백질 (서열식별번호: 1)을 코딩하는 야생형 수박 wap5.1 유전자의 게놈 DNA는 서열식별번호: 7의 DNA이고, 서열식별번호: 1의 단백질을 코딩하는 cDNA (mRNA)는 서열식별번호: 6에 제공된다. 기능적 WAP5.1 단백질 (서열식별번호: 9)을 코딩하는 야생형 수박 wap5.1 유전자의 게놈 DNA는 서열식별번호: 14의 DNA이고, 서열식별번호: 9의 단백질을 코딩하는 cDNA (mRNA)는 서열식별번호: 11에 제공된다. 프로모터는 이 서열의 상류에 있고, 예를 들어 시퀀싱에 의해 또는 수박 게놈 데이터베이스로부터 검색될 수 있다. 마찬가지로, 오이 또는 멜론 WAP5.1 유전자의 프로모터 서열은 통상의 기술자에 의해 쉽게 검색될 수 있다. 특정 단백질을 코딩하는 게놈 서열은 약간 다를 수 있기 때문에 (예를 들어, 유전자 코드의 축퇴로 인해 또는 인트론 서열의 변이로 인해), 야생형 WAP5.1 단백질을 코딩하는 게놈 대립유전자는 서열식별번호: 7 및/또는 서열식별번호: 14에 대해 적어도 90%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 서열 동일성을 포함할 수 있다.
한 측면에서 WAP5.1 유전자의 돌연변이체 대립유전자는 WAP5.1 유전자의 감소된 발현 또는 발현 없음을 초래하는 돌연변이체 대립유전자이거나, 또는 야생형 WAP5.1 단백질과 비교하여 코딩된 WAP5.1 단백질의 하나 이상의 아미노산이 대체, 삽입 또는 결실되도록 초래하는 돌연변이체 대립유전자이다.
한 측면에서 WAP5.1 유전자의 돌연변이체 대립유전자는 유전자 (프로모터 또는 다른 조절 요소, 스플라이스 부위, 코딩 영역 등)에 표적화된 또는 무작위 돌연변이를 유도하고, 돌연변이체 wap5.1 대립유전자를 포함하는 식물 (예를 들어 자손으로부터)을 선택함으로써 수득가능하다. 한 측면에서 코돈, 특히 F-박스 또는 LRR-도메인의 코돈에 돌연변이를 포함하는 대립유전자, 예를 들어 아미노산 대체, 프레임 시프트 또는 정지-코돈을 야기하는 돌연변이가 선택된다. 한 측면에서 돌연변이체 대립유전자는 수박 WAP5.1 유전자에서 표 1에 표시된 변화 또는 오이 또는 멜론 WAP5.1 유전자에서 동등한 변화를 야기한다.
한 측면에서 서열식별번호: 8 (마커 mWM23348429)의 뉴클레오티드 61에 있는 SNP 마커 티민 (T)은 수박, 멜론 또는 오이 식물 또는 식물 부분의 게놈 또는 이로부터의 DNA에서 검출된다.
이 SNP 마커는 수박에서 L528F 돌연변이를 포함하는 대립유전자, 또는 오이 또는 멜론 wap5.1 대립유전자의 상응하는 아미노산 변화를 검출한다. 티민을 포함하는 게놈 영역은 서열식별번호: 8의 서열과 적어도 92%, 93%, 94%, 95%, 96% 또는 97% 동일할 수 있고 (서열에 2개의 'Y' 뉴클레오티드가 있기 때문에, 뉴클레오티드는 피리미딘 (C 또는 T)을 지칭함), 서열식별번호: 8의 뉴클레오티드 61에 있는 SNP를 플랭킹하는 게놈 서열에 다른 동일하지 않은 뉴클레오티드가 있을 수 있음을 주목해야 한다. 수박 찰스턴 그레이 게놈에 대한 서열식별번호: 8의 Blast는 예를 들어 서열식별번호: 8이 돌연변이가 결여되어 있고 게놈 서열의 뉴클레오티드 61에 C (시토신)을 포함하는 찰스턴 그레이 참조 게놈과 97.52% 동일함을 보여준다.
다른 돌연변이체 wap5.1 대립유전자의 경우, 유사한 SNP 마커 (또는 다른 마커) 및 SNP 유전자형분석 (또는 다른 유전자형분석) 검정이 쉽게 설계될 수 있다. 그러므로, 특히 수박, 오이 또는 멜론의 WAP5.1 단백질의 F-박스 또는 LRR-도메인에서 아미노산 삽입, 결실 또는 대체를 초래하는 임의의 돌연변이체 대립유전자에 대한 대립유전자 특이적 마커 및 검출 방법이 본원에 포함된다.
특히 한 측면에서 마커 mWM23348429의 유전자형은 서열식별번호: 8의 뉴클레오티드 61에 티민을 포함하고 그러므로 서열식별번호: 1 또는 9의 아미노산 L528 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열의 상응하는 아미노산)이 F (페닐알라닌)에 의해 대체되거나, 또는 멜론 또는 오이에서 상응하는 L (류신)이 F (페닐알라닌)에 의해 대체된 돌연변이체 wap5.1 대립유전자를 포함하는 식물 또는 자손 식물을 선택하기 위해 결정 및 사용될 수 있으며, 여기서 상응하는 아미노산은 오이에서 서열식별번호: 2의 L535 (또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 서열의 상응하는 아미노산) 및 멜론에서 서열식별번호: 3의 L538 (또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 서열의 상응하는 아미노산)이다.
wap5.1에 대해 이형접합성인 2배체 식물 (즉, wap5.1/WAP5.1)은 SNP 마커에 대해 이형접합성일 것이며, 예를 들어 서열식별번호: 8의 뉴클레오티드 61에 대한 유전자형 'TC'를 가질 것인 반면 (즉, 식물은 서열식별번호: 8의 뉴클레오티드 61에 또는 서열식별번호: 8에 대해 적어도 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 그 초과의 서열 동일성을 포함하는 서열의 뉴클레오티드 61에 티민 (T)을 갖는 하나의 염색체 및 서열식별번호: 8의 뉴클레오티드 61에 또는 서열식별번호: 8에 대해 적어도 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 그 초과의 서열 동일성을 포함하는 서열의 뉴클레오티드 61에 시토신 (C)을 갖는 제2 염색체을 포함함), wap5.1에 대해 동형접합성인 식물 (즉, wap5.1/wap5.1)은 서열식별번호: 8의 뉴클레오티드 61에 대한 유전자형 'TT'를 가질 것이다 (즉, 식물은 둘 다 서열식별번호: 8의 뉴클레오티드 61에 또는 서열식별번호: 8에 대해 적어도 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 그 초과의 서열 동일성을 포함하는 서열의 뉴클레오티드 61에 티민 (T)을 갖는 2개의 염색체를 포함함).
마커 mWM23348429는 서열식별번호: 7의 야생형 WAP5.1 유전자의 게놈 DNA에서 뉴클레오티드 4123 (시토신)의 티민 (C4123→T)으로의 유도된 돌연변이에 기초하여 설계되었으며, 여기서 코돈 CTT (류신을 코딩함)는 코돈 TTT (페닐알라닌을 코딩함)로 변화되어, 수박 WAP5.1 단백질에서 L528P 치환을 초래한다. 그러므로, 서열식별번호: 7의 게놈 WAP5.1 서열의 뉴클레오티드 4123은 서열식별번호: 8의 마커 mWM23348429의 뉴클레오티드 61에 상응한다.
마찬가지로, 서열식별번호: 14의 게놈 DNA에서 마커 mWM23348429는 서열식별번호: 14의 야생형 WAP5.1 유전자의 게놈 DNA에서 뉴클레오티드 4118 (시토신)의 티민 (C4118→T)으로의 돌연변이에 대한 SNP를 포함하며, 여기서 코돈 CTT (류신을 코딩함)는 코돈 TTT (페닐알라닌을 코딩함)로 변화되어, 수박 WAP5.1 단백질에서 L528P 치환을 초래한다.
돌연변이체-대립유전자-특이적 마커 및 마커 검정은 임의의 돌연변이체 wap5.1 대립유전자에 대해 동일하게 쉽게 개발될 수 있으며, 근본적인 게놈 변화 (예를 들어 코돈에서)가 게놈 변화, 예를 들어 표 1에 개시된 근본적인 아미노산 변화 또는 야생형 WAP5.1 대립유전자와 비교하여 돌연변이체 wap5.1 대립유전자의 다른 게놈 변화를 검출하기 위한 마커 검정을 설계하는데 사용될 수 있기 때문이다.
특이적 돌연변이체 wap5.1 대립유전자를 검출하는 이러한 대립유전자-특이적 마커를 사용하여, 유전자형분석은 식물 및 식물 물질 (또는 이로부터 유래된 DNA)에서 대립유전자의 존재 및 카피 수를 검출하기 위해 수행될 수 있다. 따라서 2배체에서, 상기 돌연변이체 wap5.1 대립유전자에 대한 마커 유전자형 (수박에서 단백질의 L528F 변화 또는 오이 또는 멜론에서 상응하는 변화의 기초가 됨)은 돌연변이체 대립유전자가 동형접합 형태인 경우 'TT'이다. 3배체 또는 4배체에서 마커 유전자형은 돌연변이체 대립유전자의 카피 수를 결정하는데 사용될 수 있다. 그러므로 유전자형은 예를 들어 3배체에 3개 카피가 존재하는 경우 TTT, 또는 4배체에 4개 카피가 존재하는 경우 TTTT, 또는 3배체에 2개 카피가 존재하는 경우 TTC 등일 수 있다.
식물 및 식물 부분
한 실시양태에서 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 재배 수박, 오이 또는 멜론 식물 또는 이의 부분 (예컨대 세포, 조직, 기관, 과실 등)이 제공되며, 상기 돌연변이체 대립유전자는 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 부여한다.
한 측면에서 돌연변이체 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9의 WAP5.1 단백질, 또는 서열식별번호: 1 또는 서열식별번호: 9 (야생형 기능적 단백질)에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하는 수박 유전자의 돌연변이체 대립유전자이거나, 또는 서열식별번호: 2의 WAP5.1 단백질 또는 서열식별번호: 2 (야생형 기능적 단백질)에 대해 적어도 95%, 96%, 97% 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하는 오이 유전자의 돌연변이체 대립유전자이거나, 또는 서열식별번호: 3의 WAP5.1 단백질 또는 서열식별번호: 3 (야생형 기능적 단백질)에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하는 멜론 유전자의 돌연변이체 대립유전자이며, 여기서 돌연변이체 대립유전자는 감소된 발현 또는 발현 없음을 갖거나, 또는 여기서 돌연변이체 대립유전자는 야생형 단백질과 비교하여 대체, 삽입 또는 결실된 하나 이상의 아미노산을 포함하는 돌연변이체 WAP5.1 단백질을 코딩한다.
한 실시양태에서 하나 이상의 아미노산 대체, 삽입 또는 결실은 보존된 도메인, 즉 F-박스 도메인 및 LRR-도메인 중 하나 또는 둘 다에서 하나 이상의 아미노산의 대체, 삽입 또는 결실을 포함하거나 이로 이루어진다. 돌연변이체 단백질은 야생형 단백질과 비교하여 (및 그러므로 야생형 WAP5.1 유전자를 포함하는 야생형 식물과 비교하여) 감소된 기능 또는 기능 상실을 가지며, 바람직하게는 동형접합 형태의 돌연변이체 대립유전자를 포함하는 식물 세포 또는 식물은 통성 단위결과성이다.
본원에서 특정 뉴클레오티드 또는 아미노산 위치를 언급할 때 (예를 들어 서열식별번호: 1 또는 9의 아미노산 528에서, "또는 서열식별번호에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 서열의 아미노산 528에서" (또는 '적어도 95% …를 포함하는 서열의 동등한 위치에서')), 이는 뉴클레오티드 또는 아미노산이 변이체 서열, 즉 언급된 서열식별번호에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 서열에서 동일한 뉴클레오티드 또는 아미노산 (예를 들어, 서열식별번호: 1 또는 9의 아미노산 528에 상응함)에 상응하는 뉴클레오티드 또는 아미노산에서 변이체 서열에 존재함을 의미한다. 예를 들어 변이체 서열은 하나 또는 몇 개의 뉴클레오티드 또는 아미노산이 더 짧을 수 있지만, 변이체 서열을 언급된 서열식별번호와 쌍별 정렬할 때, 변이체 서열의 어떤 뉴클레오티드 또는 아미노산이 동일한 뉴클레오티드 또는 아미노산에 상응하는지 확인할 수 있다. 변이체 서열에서 이는 예를 들어 언급된 서열의 아미노산 528에 상응하는 변이체 서열의 아미노산 527 또는 529일 수 있다.
돌연변이체 대립유전자는 재배 수박, 오이 및 멜론의 내인성 유전자의 돌연변이이다. 통성 단위결과를 부여하는 유전자의 존재는 통상의 기술자가 예를 들어 임의의 재배된 계통 또는 품종에서 유전자의 다른 드 노보 돌연변이체를 생성하는 것을 가능하게 한다.
통상의 기술자는 과도한 부담 없이 예를 들어 돌연변이체 집단에서 WAP5.1 돌연변이체의 생성 및/또는 식별을 위한 방법을 수행함으로써 또는 WAP5.1 유전자의 표적화된 유전자 편집에 의해 본 발명에 따른 식물을 생성할 수 있다.
상기 언급된 바와 같이, WAP5.1 유전자는 정상적인 비-단위결과성 수박 식물에서 서열식별번호: 1 또는 9의 단백질 (야생형 수박 단백질)을 코딩하는 유전자인 것으로 식별되었기 때문에, 본 발명자들에 의해 생성된 것과 다른 돌연변이체 (예를 들어, 서열식별번호: 4 또는 서열식별번호: 10의 돌연변이체 단백질, 또는 상기 표 1에 언급된 다른 돌연변이체 단백질을 코딩함)가 드 노보 생성될 수 있다. 오이 및 멜론도 마찬가지이며, 또한 여기서 임의의 돌연변이체가 드 노보 생성될 수 있다.
야생형 기능적 WAP5.1 단백질에 자연 변이가 존재할 수 있기 때문에, 야생형 WAP5.1 단백질은 서열식별번호: 1, 9, 2 또는 3의 단백질과 100% 동일할 필요는 없지만, 서열식별번호: 1, 9, 2 또는 3에 대해 더 적은 서열 동일성, 예를 들어 서열식별번호: 1, 9, 2 또는 3에 대해 전체 길이에 걸쳐 쌍별 정렬된 경우에 적어도 95% 96%, 97%, 98%, 99% 또는 99.5% 또는 99.6%, 99.7%, 99.8% 또는 99.9%를 가질 수 있다. 그러나 한 측면에서 보존된 F-박스 도메인은 서열식별번호: 1, 9, 2 또는 3의 것과 100% 동일하므로, 적어도 95% 동일성의 변이는 F-박스 도메인의 외부에 있다. 또 다른 측면에서 보존된 LRR-도메인은 서열식별번호: 1, 9, 2 또는 3의 것과 100% 동일하므로, 적어도 95% 동일성의 변이는 LRR-도메인의 외부에 있다. 추가 측면에서 적어도 95% 동일성의 변이는 LRR-도메인의 외부 및 LRR-도메인의 외부에 있다. 또 다른 측면에서 서열식별번호: 1, 9, 2 또는 3의 기능적 야생형 단백질에서 적어도 95% 서열 동일성의 변이는 F-박스 도메인 앞의 N-말단 부분에, 즉 서열식별번호: 1 또는 9 (수박)의 아미노 1 내지 236의 단백질 영역, 또는 서열식별번호: 2 (오이)의 아미노산 1 내지 243, 또는 서열식별번호: 3 (멜론)의 아미노산 1 내지 246의 영역에 있다.
언급된 바와 같이, WAP5.1 단백질-코딩 유전자의 돌연변이체 대립유전자는 식물이 돌연변이체 대립유전자에 대해 동형접합성인 경우 (특히 돌연변이체 대립유전자에 대해 동형접합성인 2배체 식물 및 임의로 돌연변이체 대립유전자의 적어도 1, 2 또는 3개 카피를 포함하는 3배체 식물 또는 돌연변이체 대립유전자의 적어도 2 또는 4개 카피를 포함하는 4배체 식물) 식물이 수분의 부재 하에 씨없는 과실 및 수분의 존재 하에 씨있는 과실을 생산하도록 야기한다. 본 발명의 실시양태와 관련하여, WAP5.1 단백질-코딩 유전자의 돌연변이체 대립유전자에서의 돌연변이는 결실, 말단절단, 삽입, 점 돌연변이, 넌센스 돌연변이, 미스센스 또는 비동의 돌연변이, 스플라이스-부위 돌연변이, 프레임 시프트 돌연변이 및/또는 조절 서열에서의 돌연변이를 포함하는 임의의 돌연변이일 수 있다. 한 측면에서 WAP5.1 단백질-코딩 유전자의 돌연변이체 대립유전자에서의 돌연변이는 점 돌연변이이다. 돌연변이는 WAP5.1 단백질-코딩 유전자의 코딩 서열을 포함하는 DNA 서열에서 또는 WAP5.1 단백질을 코딩하는 RNA 서열에서 발생할 수 있거나, WAP5.1 단백질의 아미노산에서 발생할 수 있다. WAP5.1 단백질-코딩 유전자의 DNA 서열과 관련하여 돌연변이는 코딩 서열에서 발생할 수 있거나, WAP5.1 단백질 -코딩 유전자의 비-코딩 서열, 예컨대 5'- 및 3'-비번역된 영역, 프로모터, 인핸서 등에서 발생할 수 있다. WAP5.1 단백질을 코딩하는 RNA와 관련하여 돌연변이는 프리-mRNA 또는 mRNA에서 발생할 수 있다. 한 측면에서 돌연변이체 대립유전자는 하나 이상의 아미노산이 대체, 삽입 및/또는 결실됨으로 인해 (예를 들어 보존된 F-박스 도메인 또는 LRR-도메인에서 하나 이상의 아미노산이 대체, 삽입 또는 결실되도록 초래함) 기능 상실 또는 기능 감소를 갖는 단백질을 초래한다. 예를 들어, 이들 도메인 중 하나 또는 둘 다, 또는 이들 도메인 중 하나의 일부의 결실을 야기하는 단백질의 말단절단은 단백질의 기능 상실 또는 기능 감소를 초래할 것이다. 그러므로, 정지 코돈 돌연변이, 예를 들어 F-박스 도메인 앞의 N-말단 부분에 (서열식별번호: 1 또는 9의 아미노산 1 내지 236 또는 서열식별번호: 1 또는 9에 대해 적어도 95% 서열 동일성을 포함하는 서열; 서열식별번호: 2의 아미노산 1 내지 243 또는 서열식별번호: 2에 대해 적어도 95% 서열 동일성을 포함하는 서열; 서열식별번호: 3의 아미노산 1 내지 246 또는 서열식별번호: 3에 대해 적어도 95% 서열 동일성을 포함하는 서열) 또는 보존된 도메인 중 하나에 있는 정지 코돈 돌연변이는 감소된 기능 또는 기능 상실을 갖는 말단절단된 단백질을 초래한다.
마찬가지로, F-박스 도메인 또는 보존된 도메인 중 하나, 즉 F-박스 도메인 또는 LRR-도메인 앞의 N-말단 부분에서 아미노산 삽입, 결실 또는 대체는 감소된 기능 또는 기능 상실을 갖는 단백질을 초래할 수 있다.
한 측면에서 RaptorX 접촉 예측 분석에 의해 예측된 바와 같은 일탈적/부적절한 3차원 단백질 폴딩을 초래하는 임의의 아미노산 삽입, 결실 및/또는 대체는 돌연변이체 WAP5.1 단백질의 감소된 생체내 기능 또는 기능 없음을 초래할 가능성이 있다.
임의의 돌연변이체 대립유전자는 실제로 식물이 통성 단위결과성이 되는지 확인하기 위해 예를 들어 2배체 식물에서 대립유전자가 동형접합 형태인 경우에 표현형에 대해 분석될 수 있다.
따라서 본 발명의 한 실시양태는 WAP5.1 단백질-코딩 유전자의 돌연변이체 대립유전자를 포함하는 본 발명에 따른 식물 세포 또는 식물에 관한 것이며, 돌연변이체 대립유전자는 하기로 이루어진 군으로부터 선택된 하나 이상의 돌연변이를 포함 또는 수행하는 것을 특징으로 한다:
a) 게놈 서열에서의 결실, 말단절단, 삽입, 점 돌연변이, 넌센스 돌연변이, 미스센스 또는 비동의 돌연변이, 스플라이스-부위 돌연변이, 프레임 시프트 돌연변이;
b) 하나 이상의 조절 서열에서의 돌연변이;
c) 코딩 서열에서의 결실, 말단절단, 삽입, 점 돌연변이, 넌센스 돌연변이, 미스센스 또는 비동의 돌연변이, 스플라이스-부위 돌연변이, 프레임 시프트 돌연변이;
d) 프리-mRNA 또는 mRNA에서의 결실, 말단절단, 삽입, 점 돌연변이, 넌센스 돌연변이, 미스센스 또는 비동의 돌연변이, 스플라이스-부위 돌연변이, 프레임 시프트 돌연변이; 및/또는
e) WAP5.1 단백질에서의 하나 이상의 아미노산의 결실, 말단절단, 삽입 또는 대체.
한 측면에서 돌연변이체 대립유전자는 WAP5.1 유전자의 감소된 발현 또는 발현 없음을 초래하거나, 돌연변이체 대립유전자는 감소된 기능 또는 기능 상실을 갖는 단백질을 코딩한다.
감소된 발현 또는 발현 없음은 WAP5.1 유전자의 조절 영역, 예컨대 프로모터에 돌연변이가 있음을 의미하며, 여기서 야생형 WAP5.1 대립유전자를 포함하는 식물 및 식물 부분과 비교하여 WAP5.1 대립유전자의 감소된 mRNA 전사체가 만들어지거나 mRNA 전사체가 만들어지지 않는다. 예를 들어 발현의 감소는 예를 들어 노던 블롯 분석 또는 RT-PCR을 사용하여 WAP5.1 단백질을 코딩하는 mRNA 전사체의 양을 측정함으로써 결정될 수 있다. 여기서, 감소는 바람직하게는 야생형 WAP5.1 유전자를 포함하는 식물 또는 식물 부분과 비교하여 적어도 50%만큼, 특히 적어도 70%만큼, 임의로 적어도 85%만큼 또는 적어도 95%만큼, 또는 심지어 100%만큼 (발현 없음) RNA 전사체의 양의 감소를 의미한다. 발현은 예를 들어 어린 잎 조직 또는 씨방 조직에서 분석될 수 있다.
한 측면에서 야생형 단백질과 비교하여 대체, 삽입 또는 결실된 하나 이상의 아미노산을 포함하는 단백질. 그러므로, 수박의 경우, 서열식별번호: 1 또는 9의 야생형 WAP5.1 단백질, 또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 야생형 WAP5.1 단백질과 비교하여 하나 이상의 아미노산이 삽입, 결실 또는 대체되고; 오이의 경우, 서열식별번호: 2의 야생형 WAP5.1 단백질 또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97% 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 야생형 WAP5.1 단백질과 비교하여 하나 이상의 아미노산이 삽입, 결실 또는 대체되고; 멜론의 경우, 서열식별번호: 3의 야생형 WAP5.1 단백질 또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97% 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 야생형 WAP5.1 단백질과 비교하여 하나 이상의 아미노산이 삽입, 결실 또는 대체되며, 여기서 돌연변이체 단백질은 야생형 단백질과 비교하여 감소된 기능 또는 기능 상실을 가지며, 그러므로 2배체 식물에서 돌연변이체 대립유전자가 동형접합 형태로 존재하는 경우에 통성 단위결과를 초래한다.
한 측면에서 야생형 WAP5.1 단백질은 보존된 F-박스 도메인을 포함한다. 그러므로 한 측면에서 돌연변이체 대립유전자는 유전자 WAP5.1의 돌연변이체 대립유전자이며, 상기 유전자는 서열식별번호: 1 또는 9 (수박) 또는 서열식별번호: 2 (오이) 또는 서열식별번호: 3 (멜론)의 야생형 단백질, 또는 서열식별번호: 1 또는 9, 서열식별번호: 2 또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97% 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 야생형 단백질을 코딩하고, 여기서 야생형 단백질은 서열식별번호: 1 또는 9의 아미노산 237 내지 277의 보존된 F-박스 도메인을 포함한다.
한 측면에서 야생형 WAP5.1 단백질은 보존된 LRR-도메인을 포함한다. 그러므로 한 측면에서 돌연변이체 대립유전자는 유전자 WAP5.1의 돌연변이체 대립유전자이며, 상기 유전자는 서열식별번호: 1 또는 9 (수박) 또는 서열식별번호: 2 (오이) 또는 서열식별번호: 3 (멜론)의 야생형 단백질, 또는 서열식별번호: 1 또는 9, 서열식별번호: 2 또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97% 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 야생형 단백질을 코딩하고, 여기서 수박 야생형 단백질은 서열식별번호: 1 또는 9 (수박)의 아미노산 291 내지 1033의 보존된 LRR-도메인을 포함하거나, 오이 야생형 단백질은 서열식별번호: 2 (오이)의 아미노산 298 내지 1040의 보존된 LRR-도메인을 포함하거나, 멜론 야생형 단백질은 서열식별번호: 3 (멜론)의 아미노산 301 내지 1043의 보존된 LRR-도메인을 포함한다.
한 측면에서 야생형 WAP5.1 단백질은 보존된 F-박스 및 LRR-도메인을 포함하며, 즉 기능적 야생형 단백질의 임의의 변이는 F-박스 도메인 앞의 N-말단에 있다. 그러므로 한 측면에서 돌연변이체 대립유전자는 유전자 WAP5.1의 돌연변이체 대립유전자이며, 상기 유전자는 서열식별번호: 1 또는 9 (수박) 또는 서열식별번호: 2 (오이) 또는 서열식별번호: 3 (멜론)의 야생형 단백질, 또는 서열식별번호: 1 또는 9, 서열식별번호: 2 또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97% 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하고, 여기서 수박 야생형 단백질은 서열식별번호: 1 또는 9 (수박)의 아미노산 237 내지 1033을 포함하거나, 오이 야생형 단백질은 서열식별번호: 2 (오이)의 아미노산 244 내지 1040을 포함하거나, 멜론 야생형 단백질은 서열식별번호: 3 (멜론)의 아미노산 247 내지 1043을 포함한다.
상기 야생형 대립유전자의 돌연변이체 대립유전자는 한 측면에서 감소된 발현 또는 발현 없음 (예를 들어 프로모터 또는 인핸서 요소에서의 돌연변이를 통해)을 갖거나 야생형 단백질과 비교하여 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 생산하는 돌연변이체 대립유전자이며, 여기서 예를 들어 돌연변이체 단백질의 3차원 단백질 폴딩은 RaptorX 접촉 예측에 의해 분석될 수 있는 바와 같이 야생형 폴딩으로부터 벗어났고/거나, 돌연변이체 단백질은 식물에서 돌연변이체 대립유전자가 동형접합 형태인 경우에 결정될 수 있는 바와 같이 및 수분의 부재 하에 (단위결과), 예를 들어 곤충이 없는 환경에서 성장되는 경우에 식물이 과실을 생산하는지 여부 및 수분되지 않았음에도 불구하고 (자성) 꽃이 과실을 생산하는지 여부를 분석함으로써 생체내에서 감소된 기능 또는 기능 없음을 갖는다. 또한, 식물은 (자성) 꽃이 수분되는 경우에 정상적인 씨있는 과실을 생산하는지 여부에 대해 테스트될 수 있다. 돌연변이체 대립유전자가 생체내에서 통성 단위결과를 야기하는 반면, 야생형 WAP5.1 대립유전자만을 포함하는 대조군 식물은 통성 단위결과성이 아닌 경우, 돌연변이체 단백질은 야생형 단백질과 비교하여 감소된 기능 또는 기능 없음을 갖는다. 감소된 유전자 발현 또는 유전자 발현 없음을 갖는 돌연변이체 대립유전자에 대해 동일한 표현형 분석이 수행될 수 있다. 그러므로, 임의의 돌연변이체 대립유전자는 식물에서 동형접합성으로 만들어질 수 있고, 표현형은 원래의 비-돌연변이된 대립유전자를 포함하는 대조군 식물과 비교될 수 있다.
F-박스 도메인은 도 4에 나타낸 바와 같이 3개의 쿠쿠르비타세아에(Cucurbitaceae) 종, 수박, 멜론 및 오이 간에 동일한 것으로 밝혀졌다. 이것은 서열 LTDDLLHMVFSFLDHINLCRAAIVCRQWQAASAHEDFWRCL (서열식별번호: 13)을 포함하며, 이는 서열식별번호: 1 및 9의 야생형 ClWAP5.1의 아미노산 237 내지 277, 서열식별번호: 2의 야생형 CsWAP5.1의 아미노산 244 내지 284, 서열식별번호: 3의 야생형 CmWAP5.1의 아미노산 247 내지 287에 존재한다.
필시, F-박스는 고도로 보존되어 있고 단백질의 적절한 기능 (필시 단백질-단백질 상호작용을 통해)에 필요하기 때문에 다른 야생형 기능적 WAP5.1 변이체에서도 100% 동일할 것이다. 따라서, 이의 아미노산 중 하나 이상을 삽입, 결실 또는 대체함으로써 F-박스를 돌연변이시키는 것은 생체내에서 WAP5.1 단백질 기능을 감소 또는 폐지할 것이다.
한 측면에서, 따라서, 본원에 제공된 식물은 서열 LTDDLLHMVFSFLDHINLCRAAIVCRQWQAASAHEDFWRCL (서열식별번호: 13)의 F-박스 도메인에서 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 WAP5.1 단백질을 코딩하는 돌연변이체 WAP5.1 대립유전자를 포함한다. 삽입, 대체 또는 결실된 하나 이상의 아미노산을 포함하도록 돌연변이된 야생형 기능적 WAP5.1 단백질은 서열식별번호: 1 또는 서열식별번호: 9의 ClWAP5.1 또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 단백질, 서열식별번호: 2의 CsWAP5.1 또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 단백질, 및 서열식별번호: 3의 CmWAP5.1 또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 단백질로부터 선택되며, 여기서 모든 야생형 단백질은 서열 LTDDLLHMVFSFLDHINLCRAAIVCRQWQAASAHEDFWRCL (서열식별번호: 13)의 F-박스 도메인을 포함한다.
추가 측면에서 삽입, 대체 또는 결실된 하나 이상의 아미노산을 포함하도록 돌연변이된 야생형 기능적 WAP5.1 단백질은 서열식별번호: 1 또는 서열식별번호: 9의 ClWAP5.1, 또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 단백질, 서열식별번호: 2의 CsWAP5.1 또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 단백질, 및 서열식별번호: 3의 CmWAP5.1 또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 단백질로부터 선택되며, 여기서 모든 야생형 단백질은 서열 LTDDLLHMVFSFLDHINLCRAAIVCRQWQAASAHEDFWRCL (서열식별번호: 13)의 F-박스 도메인을 포함하고, 여기서 '적어도 95%' 서열 변이는 F-박스 도메인 앞의 단백질의 N-말단 부분에서 발견된다. 그러므로, 한 측면에서, F-박스의 시작부터 단백질의 끝까지의 영역은 서열식별번호: 1, 9, 2 또는 3과 서열이 100% 동일하다.
F-박스 도메인에서 하나 이상의 아미노산의 변화를 유발하는 프레임 시프트를 포함하는 돌연변이체 단백질 또는 F-박스 도메인의 하나 이상의 아미노산의 결실을 유발하는 말단절단을 포함하는 돌연변이체 단백질은 생체내에서 감소된 기능 또는 기능 없음을 포함하는 돌연변이체 단백질인 것으로 본원에 포함된다.
표 1 및 도 4에 나타낸 바와 같이, F-박스 도메인에서 3개의 특이적 돌연변이체가 수박에서 생성되었다. 한 측면에서 ClWAP5.1, CsWAP5.1 또는 CmWAP5.1 단백질의 F-박스 도메인에서 이들 3개의 특이적 돌연변이체 중 임의의 것을 각각 포함하는 수박, 오이 또는 멜론 식물이 본원에 포함된다.
한 측면에서 따라서 돌연변이체 단백질을 코딩하는 돌연변이체 ClWAP5.1 대립유전자가 제공되며, 여기서 서열식별번호: 1 또는 서열식별번호: 9 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열)의 A257, 서열식별번호: 1 또는 9 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열)의 A266 및/또는 서열식별번호: 1 또는 9 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열)의 W274는 또 다른 아미노산에 의해 대체되거나 결실된다.
또 다른 측면에서 따라서 돌연변이체 단백질을 코딩하는 돌연변이체 CsWAP5.1 대립유전자가 제공되며, 여기서 서열식별번호: 2 (또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 서열)의 A264, 서열식별번호: 2 (또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 서열)의 A273 및/또는 서열식별번호: 2 (또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 서열)의 W281은 또 다른 아미노산에 의해 대체되거나 결실된다.
또 다른 측면에서 따라서 돌연변이체 단백질을 코딩하는 돌연변이체 CmWAP5.1 대립유전자가 제공되며, 여기서 서열식별번호: 3 (또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 서열)의 A267, 서열식별번호: 3 (또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 서열)의 A276 및/또는 서열식별번호: 3 (또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 서열)의 W284는 또 다른 아미노산에 의해 대체되거나 결실된다.
하나의 아미노산부터 또 다른 아미노산까지의 아미노산이 본원에서 언급될 때 이는 언급된 시작/첫 번째 및 끝/마지막 아미노산을 포함한다.
LRR-도메인은 도 4에 나타낸 바와 같이 3개의 쿠쿠르비타세아에 종, 수박, 멜론 및 오이 사이에 고도로 보존된 것으로 밝혀졌다. LRR-도메인은 수박 및 오이 사이에 96.2% 동일하고, 수박 및 멜론 사이에 98% 동일하고, 오이 및 멜론 사이에 97.8% 동일하다 (엠보스-니들을 사용한 쌍별 정렬에서). 또한 도 3a에서 볼 수 있는 바와 같이 이는 일종의 '꼬리'로 폴딩하기 때문에 고도로 구조화되어 있다.
LRR-도메인은 서열식별번호: 1 및 서열식별번호: 9의 야생형 ClWAP5.1의 아미노산 291 내지 1033, 서열식별번호: 2의 야생형 CsWAP5.1의 아미노산 298 내지 1040 및 서열식별번호: 3의 야생형 CmWAP5.1의 아미노산 301 내지 1043에 존재한다. 필시, LRR-도메인은 고도로 보존되어 있고 단백질의 적절한 3차원 폴딩 및 적절한 기능 (필시 단백질-단백질 상호작용을 통해)에 필요하기 때문에 다른 야생형 기능적 WAP5.1 변이체에서도 서열식별번호: 1, 9, 2 또는 3의 LRR-도메인과 적어도 95%, 96%, 97%, 98% 또는 99% 동일할 것이다. 따라서, 이의 아미노산 중 하나 이상을 삽입, 결실 또는 대체함으로써 LRR-도메인을 돌연변이시키는 것은 도메인의 상이한 3차원 단백질 폴딩을 초래하고/거나 생체내에서 WAP5.1 단백질 기능을 감소 또는 폐지할 것이다.
한 측면에서, 따라서, 본원에 제공된 식물은 서열식별번호: 1, 9, 2 또는 3의 LRR-도메인, 또는 서열식별번호: 1, 9, 2 또는 3의 LRR-도메인과 적어도 95%, 96%, 97%, 98% 또는 99% 동일한 LRR-도메인에서 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 WAP5.1 단백질을 코딩하는 돌연변이체 WAP5.1 대립유전자를 포함한다.
또 다른 측면에서, 따라서, 본원에 제공된 식물은 서열식별번호: 1, 9, 2 또는 3의 LRR-도메인, 또는 변이체 야생형 WAP5.1 단백질의 LRR-도메인에서 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 WAP5.1 단백질을 코딩하는 돌연변이체 WAP5.1 대립유전자를 포함하며, 상기 야생형 단백질은 서열식별번호: 1, 9, 2 또는 3에 대해 적어도 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 포함한다.
한 측면에서 LRR-도메인에서 삽입, 대체 또는 결실된 하나 이상의 아미노산을 포함하도록 돌연변이된 야생형 기능적 WAP5.1 단백질은 서열식별번호: 1 또는 서열식별번호: 9의 ClWAP5.1, 또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 단백질, 서열식별번호: 2의 CsWAP5.1 또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 단백질, 및 서열식별번호: 3의 CmWAP5.1 또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 단백질로부터 선택되며, 여기서 모든 야생형 단백질은 서열식별번호: 1, 9, 2 또는 3의 LRR-도메인과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 LRR-도메인을 포함한다.
한 측면에서 LRR-도메인에서 삽입, 대체 또는 결실된 하나 이상의 아미노산을 포함하도록 돌연변이된 야생형 기능적 WAP5.1 단백질은 서열식별번호: 1 또는 서열식별번호: 9의 ClWAP5.1, 또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 단백질, 서열식별번호: 2의 CsWAP5.1 또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 단백질, 및 서열식별번호: 3의 CmWAP5.1 또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 단백질로부터 선택되며, 여기서 '적어도 95%, 96% 또는 그 초과'의 서열 변이는 단백질의 N-말단 부분 (즉, F-박스 도메인 앞의)에서의 서열 변이로 인한 것인 반면, 단백질의 나머지 부분 (F-박스 도메인의 시작부터 단백질의 끝까지)은 서열식별번호: 1, 9, 2 또는 3의 서열과 동일하다.
LRR-도메인에서 하나 이상의 아미노산의 변화를 유발하는 프레임 시프트를 포함하는 돌연변이체 단백질 또는 LRR-도메인의 하나 이상의 아미노산의 결실을 유발하는 말단절단을 포함하는 돌연변이체 단백질은 생체내에서 감소된 기능 또는 기능 없음을 포함하는 돌연변이체 단백질인 것으로 본원에 포함된다.
표 1 및 도 4에 나타낸 바와 같이, LRR-도메인에서 4개의 특이적 돌연변이체가 수박에서 생성되었다. 한 측면에서 ClWAP5.1, CsWAP5.1 또는 CmWAP5.1 단백질의 LRR-도메인에서 이들 4개의 특이적 돌연변이체 중 임의의 것을 각각 포함하는 수박, 오이 또는 멜론 식물이 본원에 포함된다.
한 측면에서 따라서 돌연변이체 단백질을 코딩하는 돌연변이체 ClWAP5.1 대립유전자가 제공되며, 여기서 서열식별번호: 1 또는 서열식별번호: 9 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열)의 Q333 및/또는 서열식별번호: 1 또는 서열식별번호: 9 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열)의 L528 및/또는 서열식별번호: 1 또는 서열식별번호: 9 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열)의 P308, 및/또는 서열식별번호: 1 또는 서열식별번호: 9 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열)의 G330은 또 다른 아미노산에 의해 대체되거나 결실된다.
한 측면에서 돌연변이체 단백질을 코딩하는 돌연변이체 CsWAP5.1 대립유전자가 제공되며, 여기서 서열식별번호: 2 (또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 서열)의 Q340 및/또는 서열식별번호: 2 (또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 서열)의 L535 및/또는 서열식별번호: 2 (또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 서열)의 P315, 및/또는 서열식별번호: 2 (또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 서열)의 G337은 또 다른 아미노산에 의해 대체되거나 결실된다.
한 측면에서 돌연변이체 단백질을 코딩하는 돌연변이체 CmWAP5.1 대립유전자가 제공되며, 여기서 서열식별번호: 3 (또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 서열)의 Q343 및/또는 서열식별번호: 3 (또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 서열)의 L538, 및/또는 서열식별번호: 3 (또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 서열)의 P318, 및/또는 서열식별번호: 3 (또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 서열)의 G340은 또 다른 아미노산에 의해 대체되거나 결실된다.
아미노산이 '결실'되는 것을 언급할 때, 이는 코돈이 정지 코돈으로 변화되거나 코돈이 결실되는 돌연변이, 또는 프레임시프트가 있어 아미노산이 코딩되지 않도록 초래하는 돌연변이를 포함한다. 동일하게, 아미노산이 '대체'되는 것을 언급할 때, 이는 코돈이 상이한 아미노산을 코딩하거나 코돈이 삽입되는 돌연변이, 또는 프레임시프트가 있어 상이한 아미노산이 코딩되도록 초래하는 돌연변이를 포함한다.
돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하는 식물 및 식물 부분은 쿠쿠르비타세아에 과의 식물, 특히 재배 종, 예컨대 오이 (쿠쿠미스 사티부스), 멜론 (쿠쿠미스 멜로) 및 수박 (시트룰루스 라나투스)일 수 있다. 또한 돌연변이체 wap5.1 대립유전자의 2개 카피를 포함하는 쿠쿠르비타세아에 과의 식물 및 식물 부분, 특히 오이, 멜론 및 수박이 본원에 포함되며, 여기서 돌연변이체 wap5.1 대립유전자의 2개 카피를 포함하는 2배체 식물은 통성 단위결과의 표현형을 나타내는 식물을 초래한다.
한 측면에서 돌연변이체 wap5.1 대립유전자는 2배체 식물 세포 또는 식물, 예를 들어 2배체 수박, 오이 또는 멜론 식물에서 이형접합성이다. 또 다른 측면에서 돌연변이체 wap5.1 대립유전자는 2배체 식물 세포 또는 식물에서 동형접합성이다.
식물 세포 및 식물은 바람직하게는 야생 식물이 아닌 재배 식물, 예컨대 엘리트 육종 계통 또는 품종이다. 오이는 임의의 유형의 오이, 예컨대 긴 오이, 피클링 오이, 슬라이싱 오이 등일 수 있다. 마찬가지로 멜론은 임의의 유형의 멜론 (갈리아(Galia), 피엘 데 사포(Piel de Sapo), 칸탈루프(Cantaloupe), 허니듀(honeydew) 등)일 수 있고, 수박은 임의의 유형의 수박일 수 있다.
돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하는 수박 식물 및 이의 부분은 2배체, 4배체 또는 3배체일 수 있다. 또 다른 측면에서 이는 또 다른 다배수체, 예를 들어 5배체, 6배체, 7배체, 8배체 등일 수 있다. wap5.1의 4개 카피를 포함하는 4배체 식물은 예를 들어 염색체 배가에 의해 8배체를 만드는데 사용될 수 있다. 이러한 8배체를 wap5.1에 대해 동형접합성인 2배체와 교배하는 것은 wap5.1의 5개 카피를 포함하는 5배체를 초래할 것이다. 한 측면에서 다배수성 수박 식물은 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하지만, 이는 또한 더 많은 카피를 포함할 수 있으며, 예를 들어 바람직한 측면에서 3배체 식물은 돌연변이체 wap5.1 대립유전자의 2 또는 3개 카피를 포함하거나, 4배체는 돌연변이체 wap5.1 대립유전자의 2 또는 4개 카피를 포함한다.
그러므로 2배체 식물은 유전자형 wap5.1/WAP5.1 (돌연변이체 대립유전자에 대해 이형접합성) 또는 wap5.1/wap5.1 (돌연변이체 대립유전자에 대해 동형접합성)을 가질 수 있다. 한 측면에서 동형접합 형태의 wap5.1 대립유전자를 포함하는 2배체 식물은 이중 반수체 식물 (DH), 예를 들어 이중 반수체 수박, 오이 또는 멜론 식물 또는 식물 세포 또는 식물 부분이다. DH 식물은 반수체 세포의 염색체 배가 (예를 들어, 콜히친 처리를 통해)에 의해 만들어질 수 있다.
3배체 수박 식물은 유전자형 wap5.1/WAP5.1/WAP5.1 또는 wap5.1/wap5.1/WAP5.1 또는 wap5.1/wap5.1/wap5.1을 가질 수 있다. 유전자형 wap5.1/WAP5.1/WAP5.1을 갖는 3배체 식물은 야생형 자성 4배체 (WAP5.1/WAP5.1/ WAP5.1/WAP5.1)와 돌연변이체 대립유전자에 대해 동형접합성인 웅성 2배체 (wap5.1/wap5.1)의 교배에 의해 만들어질 수 있다. 유전자형 wap5.1/wap5.1/WAP5.1을 갖는 3배체 식물은 자성 4배체 (wap5.1/wap5.1/ wap5.1/wap5.1)와 야생형 대립유전자에 대해 동형접합성인 웅성 2배체 (WAP5.1/WAP5.1)의 교배에 의해 만들어질 수 있다.
4배체 수박 식물은 유전자형 wap5.1/WAP5.1/WAP5.1/WAP5.1 또는 wap5.1/wap5.1/WAP5.1 /WAP5.1 또는 wap5.1/wap5.1/wap5.1/WAP5.1 또는 wap5.1/wap5.1/ wap5.1/wap5.1을 가질 수 있다. 유전자형 wap5.1/wap5.1/WAP5.1 /WAP5.1은 2배체 wap5.1/WAP5.1의 염색체 배가에 의해 만들어질 수 있다. 유전자형 wap5.1/wap5.1/ wap5.1/wap5.1은 2배체 wap5.1/wap5.1의 염색체 배가에 의해 만들어질 수 있다. 다른 2개의 유전자형, wap5.1/ WAP5.1 / WAP5.1 / WAP5.1 및 wap5.1/ wap5.1/ wap5.1/ WAP5.1은 예를 들어 유전자형 wap5.1/w wap5.1/ WAP5.1 / WAP5.1의 2개의 4배체의 교배 및 자손에서 유전자형의 식별에 의해 만들어질 수 있다.
한 측면에서 수박 식물은 wap5.1에 대해 동형접합성이고, 또 다른 측면에서 wap5.1에 대해 이형접합성이다. 한 측면에서 이는 근친교배 계통 또는 품종이다. 추가 측면에서 이는 F1 하이브리드이다.
기재된 임의의 수박 식물, 오이 식물 또는 멜론 식물이 성장될 수 있는 종자가 또한 본원에 포함되며, 이러한 식물의 부분도 마찬가지로, 예컨대 수분의 부재 하에 생산된 씨없는 과실, 꽃, 세포, 뿌리, 근경, 접순, 잎, 줄기, 영양 번식, 삽목, 종자 번식 (예를 들어, 자가생식) 및 또한 시험관내 세포- 또는 조직 배양물, 뿐만 아니라 화분, 씨방 등이 본원에 포함된다.
돌연변이체 wap5.1 대립유전자를 포함하는 2배체 수박, 오이 및 멜론 식물
한 측면에서 수박 식물 또는 오이 또는 멜론 식물은 wap5.1의 적어도 하나의 돌연변이체 카피, 바람직하게는 2개의 돌연변이체 카피 (즉, wap5.1에 대해 동형접합성임)를 포함하는 2배체 계통 (예를 들어, 근친교배 계통) 또는 품종이다. 암꽃의 수분을 방지하는 경우, wap5.1에 대해 동형접합성인 2배체 식물은 씨없는 과실을 생산할 것이다. 수분이 발생하는 경우, 과실은 씨가 있을 것이다.
수분을 방지하기 위해 예를 들어 식물을 곤충이 없는 환경에서 성장시킬 수 있다. 그러나, 또한 웅성 불임인 2배체 식물을 생산할 수 있다. 그러므로, 본 발명의 한 측면에서 wap5.1에 대해 동형접합성이고 추가적으로 웅성 불임인 2배체 식물이 제공된다. 웅성 불임은 식물이 기능적 꽃밥, 화분 또는 웅성 배우자를 생산하지 못하는 것이다. ms-1 유전자를 포함하여 여러 웅성 불임 유전자가 수박에서 식별되었다. ms-1 핵 유전자는 웅성 불임을 제어하고, 동형접합 형태의 ms-1 유전자 (ms-1은 열성임)를 갖는 식물에서, 꽃밥의 정상적인 발달은 방해받는 반면 암꽃 발달은 정상적이다. 유전자는 화분 생산을 제거한다. ms-1 유전자에 대한 마커 및 상기 유전자를 포함하는 식물은 EP2959771에 기재되어 있으며, 데이터베이스 PINTO는 세미니스(Seminis)의 품종 본타(Bonta) 또는 본타 F1이 본 특허에 따른 식물임을 언급하고 있다. ms-1 유전자는 또한 문헌 [Zhang et al. 1996 (HortScience 31(1): 123-126)]에 기재되어 있다. ms-1 유전자는 수박의 염색체 6 상에 있으며, 따라서 염색체 5 상의 wap5.1과 쉽게 조합될 수 있다. 멜론에도 웅성 불임 유전자가 존재한다. 오이에서 돌연변이체 wap5.1 대립유전자는 자주성, 즉 자성 암꽃의 생산과 조합될 수 있다.
따라서, 한 측면에서 본 발명에 따른 2배체 식물 및 식물 부분은 웅성 불임이고/거나 웅성 불임 유전자를 포함한다. 웅성 불임 유전자가 열성 유전자인 경우, 식물 및 식물 부분은 바람직하게는 동형접합 형태의 유전자를 포함한다. 한 측면에서 수박 식물은 ms-1 유전자를 바람직하게는 동형접합 형태로 포함한다. 그러므로, 한 측면에서 2배체 수박 식물은 염색체 5 상에 동형접합 형태의 돌연변이체 wap5.1 유전자 (wap5.1/wap5.1)를 포함하고, 웅성 불임 유전자, 예를 들어 ms-1을, 예를 들어 웅성 불임 유전자가 열성인 경우에 동형접합 형태로 (예를 들어, ms-1/ms-1) 또는 임의로 웅성 불임이 우성인 경우에 이형접합 형태로 추가로 포함한다. 하나의 바람직한 식물은 wap5.1에 대해 동형접합성이고 ms-1에 대해 동형접합성인 2배체 식물이다.
본 발명에 따른 식물, 특히 2배체 수박 식물이 항상 (수분의 부재 하에서 뿐만 아니라) 씨없는 과실을 생산하도록 보장하는 추가 방법은 동형접합 형태의 wap5.1 유전자를 위단위결과를 부여하는 유전자와 조합하여 수분이 발생하더라도 수분에도 불구하고 과실이 씨가 없도록 하는 것이다. 한 측면에서 위단위결과 유전자는 emb1이라고 불리는 열성 유전자이다. 야생형 및 돌연변이체 Emb1 유전자는 동시 계류 중인 출원 EP16171462.1에 기재되어 있다. Emb1 유전자는 사이클린 SDS 유사 단백질을 코딩한다. 돌연변이체 대립유전자 emb1이 동형접합 형태인 경우, 위단위결과가 초래된다. "위단위결과"는 과실 결실의 유도 및 발달이 수분을 필요로 하지만 성숙 또는 생존가능한 종자를 생산하는 과실이 없는 것을 의미한다. 성숙 또는 생존가능한 종자는 성숙함에 도달하기 전에 저지된 종자 발달 또는 배주 및/또는 배아 및/또는 내배유의 분해 또는 배주 및/또는 배아 및/또는 내배유의 유산으로 인해 위단위결과성 식물에서 발달되지 않는다. 그러므로, 돌연변이체 emb1 대립유전자에 대해 동형접합성인 2배체 식물 (emb1/emb1)이 자가-수분되거나 또 다른 식물로부터의 화분에 의해 수분되는 경우, 이들은 씨없는 2배체 과실을 생산하였다.
그러므로, 한 측면에서 2배체 수박 식물은 염색체 5 상에 동형접합 형태의 wap5.1 유전자 (wap5.1/wap5.1)를 포함하고, 위단위결과 유전자, 예를 들어 emb1을, 예를 들어 위단위결과 유전자가 열성인 경우에 동형접합 형태로 (예를 들어, emb1/emb1) 또는 임의로 위단위결과 유전자가 우성인 경우에 이형접합 형태로 추가로 포함한다. 하나의 바람직한 식물은 wap5.1에 대해 동형접합성이고 emb1에 대해 동형접합성인 2배체 식물이다.
emb1의 하나의 돌연변이체 대립유전자는 NCIMB 42532 하에 넌헴스 비.브이.에 의해 기탁된 사이클린 SDS 유사 단백질 코딩 유전자 (Emb1 유전자로도 지칭됨)의 돌연변이체 대립유전자에 대해 이형접합성 또는 동형접합성인 수박 종자로부터 수득될 수 있다. 이들 종자 중 25%는 서열식별번호: 28의 돌연변이체 단백질을 코딩하는 돌연변이체 대립유전자 (서열식별번호: 27의 mRNA 참조)를 함유한다. Emb1 유전자의 야생형 대립유전자는 NCIMB 42532 하에 넌헴스 비.브이.에 의해 기탁된 야생형 사이클린 SDS 유사 단백질 코딩 유전자에 대해 이형접합성 또는 동형접합성인 수박 종자로부터 수득될 수 있다. 이들 종자 중 25%는 서열식별번호: 26의 야생형 단백질을 코딩하는 서열식별번호: 25의 야생형 대립유전자를 동형접합 형태로 함유한다. Emb1 유전자의 다른 돌연변이체 대립유전자는 예를 들어 돌연변이유발 또는 통상의 기술자에게 공지된 다른 방법에 의해 드 노보 생성될 수 있다. 서열식별번호: 25에 표시된 게놈 Emb1 뉴클레오티드 서열은 서열식별번호: 26에 표시된 바와 같은 아미노산 서열을 갖는 시트룰루스 라나투스의 야생형 사이클린 SDS 유사 단백질을 코딩한다. 서열식별번호: 27에 표시된 mRNA 서열, 및 서열식별번호: 28에 표시된 돌연변이체 단백질은 NCIMB42532 하에 기탁된 종자에서 발견된 돌연변이체 emb1 대립유전자의 것이다.
emb1의 돌연변이체 대립유전자는 식물이 돌연변이체 대립유전자에 대해 동형접합성인 경우에 식물이 웅성 가임성이지만 씨없는 과실을 생산하도록 야기한다. Emb1 유전자에서의 돌연변이는 결실, 말단절단, 삽입, 점 돌연변이, 넌센스 돌연변이, 미스센스 또는 비동의 돌연변이, 스플라이스-부위 돌연변이, 프레임 시프트 돌연변이 및/또는 조절 서열에서의 돌연변이를 포함하는 임의의 돌연변이일 수 있다. 바람직하게는 돌연변이는 점 돌연변이 및/또는 스플라이스-부위 돌연변이이다. 돌연변이는 사이클린 SDS 유사 단백질 코딩 유전자 (Emb1 유전자)의 코딩 서열을 포함하는 DNA 서열에서 또는 사이클린 SDS 유사 단백질을 코딩하는 RNA 서열에서 발생할 수 있거나, 사이클린 SDS 유사 단백질 (또는 Emb1 단백질)의 아미노산에서 발생할 수 있다. 사이클린 SDS 유사 단백질 코딩 유전자의 DNA 서열과 관련하여 돌연변이는 코딩 서열 (cds, 엑손으로 구성됨)에서 발생할 수 있거나, 사이클린 SDS 유사 단백질 코딩 유전자의 비-코딩 서열, 예컨대 5'- 및 3'-비번역된 영역, 인트론, 프로모터, 인핸서 등에서 발생할 수 있다. 사이클린 SDS 유사 단백질을 코딩하는 RNA와 관련하여 돌연변이는 프리-mRNA 또는 mRNA에서 발생할 수 있다.
사이클린 SDS 유사 단백질 코딩 유전자의 돌연변이체 대립유전자에 대해 격리하는 식물의 2배체 시트룰루스 라나투스 종자는 2016년 1월 27일에 NCIMB Ltd. (영국 스코틀랜드 에이비21 9와이에이 애버딘 벅스번 크레이브스톤 이스테이트 퍼거슨 빌딩)에서 수탁 번호 NCIMB 42532 하에 넌헴스 비.브이.에 의해 부다페스트 조약 하에 기탁되었다. 종자 기탁을 위해 사이클린 SDS 유사 단백질 코딩 유전자의 대립유전자는 emb1로 지정되었다.
기탁된 종자는 emb1 돌연변이체 대립유전자에 대해 동형접합성인 식물과 emb1 야생형 대립유전자에 대해 동형접합성인 식물의 자가-수분된 역교배로부터 수득되었다. 따라서 기탁된 종자의 25%는 emb1 돌연변이체 대립유전자에 대해 동형접합성이고 씨없는 과실을 생산하고, 50%는 돌연변이체 대립유전자에 대해 이형접합성이고, 25%는 야생형 사이클린 SDS 유사 단백질을 코딩하는 야생형 대립유전자에 대해 동형접합성이다.
한 측면에서 따라서 본 발명은 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피, 바람직하게는 2개 카피, 및 돌연변이체 emb1 대립유전자의 적어도 하나의 카피, 바람직하게는 돌연변이체 emb1 대립유전자의 2개 카피를 포함하는 2배체 수박 식물 또는 식물 부분에 관한 것이다. 한 측면에서 돌연변이체 emb1 대립유전자는 NCIMB 42532 하에 기탁된 종자에서 발견되는 대립유전자이다.
이러한 2배체 식물이 성장될 수 있는 종자가 또한 본원에 포함되며, 이러한 식물의 부분도 마찬가지로, 예컨대 2배체 씨없는 과실, 꽃, 잎, 줄기, 영양 번식, 세포, 삽목, 종자 번식 (예를 들어, 자가생식) 및 또한 시험관내 세포- 또는 조직 배양물, 뿐만 아니라 화분, 씨방, 근경, 접순 등이 본원에 포함된다. 그러므로, 한 실시양태에서 2배체 식물, 또는 식물이 성장될 수 있는 종자, 또는 식물의 조직 또는 부분 (화분, 꽃밥, 배주)은 상기 표 1에 기재된 바와 같은 돌연변이체 wap5.1 대립유전자 또는 상이한 돌연변이체 wap5.1 대립유전자를 포함한다.
돌연변이체 wap5.1 대립유전자를 포함하는 4배체 수박 식물
씨없는 3배체 수박 생산은 2배체 웅성 부모 식물로부터의 화분을 사용하여 4배체 모계 부모 식물의 꽃을 수정시키는 것을 수반한다. 2배체 화분을 사용한 4배체 꽃의 수분은 3배체인 F1 종자를 유발한다 (Kihara, 1951, Proceedings of American Society for Horticultural Science 58: 217-230; Eigsti 1971, Hort Science 6: 1-2). 이들 F1 종자로부터 성장된 3배체 하이브리드 식물은 염색체 불균형으로 인해 불임 화분을 생산하므로 자가-불임성이다. 따라서, 3배체 하이브리드는 정상적으로 수박 과실을 생산하기 위해 2배체 수분자에 의해 수분될 필요가 있다.
그러나, 본 발명에 따르면 돌연변이체 wap5.1 유전자의 1, 2 또는 3개 카피를 포함하는 3배체 식물은 수분 없이 과실을 생산하고 더 이상 수분자 식물이 존재할 필요가 없다. 따라서, 씨없는 과실을 생산하기 위해 이러한 3배체 수박 식물을 예를 들어 수분자 식물의 부재 하에 및/또는 (가임성) 화분의 부재 하에 밭에서 성장시키는 방법이 본원에 포함된다.
본 발명의 한 측면에서 따라서 자성 부모로서 사용하기 위한, 바람직하게는 열성 wap5.1 대립유전자의 4개 카피를 포함하는 4배체 식물, 및 웅성 부모로서 사용하기 위한, 바람직하게는 열성 wap5.1 대립유전자의 2개 카피를 포함하는 2배체 식물 둘 다, 뿐만 아니라 2배체 웅성 부모와 4배체 자성 부모의 교배에 의해 생산된 3배체 F1 하이브리드 (바람직하게는 돌연변이체 wap5.1 대립유전자의 3개 카피를 포함함)가 제공된다.
이러한 4배체 식물을 만들기 위해, 바람직하게는 wap5.1에 대해 동형접합성인 상기 기재된 임의의 2배체 식물이 4배체 식물을 생성하기 위한 출발 물질로서 사용될 수 있다. 통상의 기술자에게 공지된 염색체 배가 기술이 이러한 2배체 식물로부터 4배체 식물을 생성하기 위해 사용될 수 있다. 예를 들어 문헌 [Noh et al. (2012) Hort. Environ. Biotechnol. 53(6):521-529]은 4배체 수박을 생성하는 상이한 방법을 평가하였다. 모든 방법에서 염색체 배가를 유도하기 위해 항유사분열제, 예컨대 콜히친, 디니트로알라닌 또는 오리잘린이 사용된다. 임의로 조직 배양이 식물 부분으로부터 4배체 식물을 생성하기 위해 사용될 수 있다. 식물이 4배체인지 확인하기 위해 염색체 번호를 확인할 수 있다. 배수성은 염색체 계수 또는 유동 세포계측법 또는 다른 공지된 방법에 의해 쉽게 결정될 수 있다 (Sari et al. 1999, Scientia Horticulturae 82: 265 - 277, 본원에 참조로 포함됨).
그러므로, 본 발명의 한 측면에서 시트룰루스 라나투스 종의 4배체 재배 수박 식물이 제공되며, 여기서 상기 식물은 돌연변이체 wap5.1 대립유전자 (상기 기재된 바와 같음)의 2개 또는 바람직하게는 4개 카피를 포함하고, 4개의 염색체 5 각각 상에 하나씩 있다.
상기 돌연변이체 wap5.1 대립유전자에 대해 기재된 모든 실시양태는 4배체에 동일하게 적용된다. 따라서 예를 들어 4배체 식물은 표 1에 기재된 wap5.1 대립유전자의 4개 카피, 또는 상기 추가로 기재된 바와 같은 상이한 돌연변이체 wap5.1 대립유전자의 4개 카피를 포함할 수 있다.
그러므로, 한 측면에서 본 발명은 서열식별번호: 1 또는 서열식별번호: 9의 단백질, 또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하는 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 1, 2, 3 또는 4개 카피를 포함하는 4배체 수박 식물 또는 식물 부분을 포함한다. 돌연변이체 wap5.1 대립유전자의 1 또는 2개 카피를 포함하는 2배체 수박 식물에 대해 상기 기재된 돌연변이체 wap5.1 대립유전자에 관한 측면은 4배체 식물 및 식물 부분에 적용된다. 따라서, 예를 들어 한 측면에서 돌연변이체 대립유전자는 WAP5.1 유전자의 감소된 발현 또는 발현 없음을 초래하거나, 돌연변이체 대립유전자는 감소된 기능 또는 기능 상실을 갖는 돌연변이체 WAP5.1 단백질을 코딩한다.
한 측면에서 4배체 식물은 LRR-도메인에 L528F 아미노산 대체를 포함하는 서열식별번호: 4 또는 서열식별번호: 10의 돌연변이체 단백질을 코딩하는 돌연변이체 wap5.1 대립유전자의 2개 또는 바람직하게는 4개 카피를 포함한다.
4배체 식물 또는 식물 부분 (세포, 잎, DNA 등)의 유전자형분석은 예를 들어 SNP 유전자형을 구별하기 위해 KASP-검정을 사용하여 2배체와 동일한 방식으로 수행될 수 있으며, 예를 들어 서열식별번호: 8의 뉴클레오티드 61에 마커 mwm233348429에 대한 TTTT (L528F 돌연변이를 포함하는 서열식별번호: 4 또는 서열식별번호: 10의 단백질을 코딩하는 4개의 돌연변이체 wap5.1 대립유전자를 검출함)를 포함하는 식물 또는 부분은 이들의 게놈에서 서열식별번호: 8의 뉴클레오티드 61에 마커 mwm233348429에 대한 CTTT (서열식별번호: 4 또는 서열식별번호: 10의 단백질을 코딩하는 3개의 돌연변이체 대립유전자를 검출함), CCTT (서열식별번호: 4 또는 서열식별번호: 10의 단백질을 코딩하는 2개의 돌연변이체 대립유전자를 검출함), CCCT (서열식별번호: 4 또는 서열식별번호: 10의 단백질을 코딩하는 하나의 돌연변이체 대립유전자를 검출함) 또는 CCCC (서열식별번호: 1 또는 서열식별번호: 9의 단백질을 코딩하는 4개의 야생형 대립유전자를 검출함)를 포함하는 식물 또는 부분과 구별될 수 있다. 다른 대립유전자-특이적 마커에 동일하게 적용된다.
본 발명의 한 측면에서 돌연변이체 wap5.1 대립유전자 (상기 기재된 바와 같음)의 적어도 1 또는 2 또는 3개 카피를 포함하지만 바람직하게는 돌연변이체 wap5.1 대립유전자 (상기 기재된 바와 같음)의 4개 카피를 포함하는 4배체 수박이 제공된다. 바람직하게는 수박 식물은 F1 하이브리드 종자 생산을 위한 부모로서 적합한 4배체 근친교배 자성 계통이다.
4배체 자성 근친교배 계통의 생성은 염색체를 배가하고 4배체 식물을 생성하기 위해 wap5.1 대립유전자의 1개 또는 바람직하게는 2개 카피를 포함하는 2배체 식물을 사용함으로써 수행될 수 있다. 예를 들어 wap5.1에 대해 동형접합성인 2배체 근친교배 계통이 4배체 식물을 생성하기 위해 사용될 수 있다.
돌연변이체 wap5.1 대립유전자의 4개 카피를 포함하는 4배체 식물은 표현형, 즉 통성 단위결과성을 발현할 것이다.
이러한 4배체 식물이 성장될 수 있는 종자가 또한 본원에 포함되며, 이러한 식물의 부분도 마찬가지로, 예컨대 수분의 부재 하에 생산된 4배체 씨없는 과실, 꽃, 잎, 줄기, 삽목, 영양 번식, 세포, 종자 번식 (예를 들어, 자가생식) 및 또한 시험관내 세포- 또는 조직 배양물, 뿐만 아니라 화분, 씨방, 근경, 접순 등이 본원에 포함된다. 그러므로, 한 실시양태에서 4배체 식물, 또는 식물이 성장될 수 있는 종자, 또는 식물의 조직 또는 부분 (화분, 꽃밥, 배주)은 상기 기재된 바와 같은 돌연변이체 wap5.1 대립유전자를 포함한다.
4배체는 상이한 돌연변이체 wap5.1 대립유전자, 예를 들어 말단절단된 WAP5.1 단백질을 코딩하는 2개의 돌연변이체 wap5.1 대립유전자 및 아미노산 치환을 갖는 WAP5.1 단백질을 코딩하는 2개의 돌연변이체 wap5.1 대립유전자를 포함할 수 있다. 이러한 식물은 예를 들어 먼저 상이한 돌연변이체 wap5.1 대립유전자를 포함하는 2배체를 만든 후, 이러한 2배체의 염색체를 배가함으로써 만들어질 수 있다. 그러나, 한 측면에서 4배체는 동일한 돌연변이체 wap5.1 대립유전자의 4개 카피를 포함하며, 즉 4배체는 wap5.1 대립유전자에 대해 동형접합성인 2배체로부터 만들어진다.
돌연변이체 wap5.1 대립유전자를 포함하는 3배체 수박 식물
추가 측면에서 돌연변이체 wap5.1 대립유전자의 1, 2 또는 3개 카피를 포함하는 3배체 수박 종자, 식물 및 식물 부분이 제공된다 (즉, 각각 wap5.1 /WAP5.1/WAP5.1 또는 wap5.1 / wap5.1 /WAP5.1 또는 wap5.1 / wap5.1 / wap5.1). 이러한 3배체는 상기 기재된 바와 같이, 그리고 하기 표 2에 나타낸 바와 같이 만들어질 수 있다:
표 2
한 측면에서 돌연변이체 wap5.1 대립유전자의 4개 카피를 포함하는 4배체 식물이 자성 부모로서 사용되고, 돌연변이체 wap5.1 대립유전자의 2개 카피를 포함하는 2배체 웅성 부모의 화분으로 수분되고, 교배로부터의 종자가 수확된다. 이들 종자는 3배체이고, 이들은 본 발명의 돌연변이체 wap5.1 대립유전자의 3개 카피를 포함한다 (표 2, A행). 이들 종자로부터 성장된 식물은 과실 결실을 유도하기 위해 수분의 필요 없이 씨없는 수박 과실 (3배체 과실)을 생산한다. 이들 F1 3배체 종자로부터 성장된 3배체 하이브리드 식물은 염색체 불균형으로 인해 불임 화분을 생산하므로 자가-불임성이다. 그러므로 이들 종자는 수분자 식물의 필요 없이 생산 밭에서 성장될 수 있다. 이는 화분 및 수분자 식물의 부재 하에 씨없는 3배체 수박 과실을 생산할 수 있는 최초의 사례이다.
한 측면에서 상기 A행의 3배체는 3개의 동일한 돌연변이체 wap5.1 대립유전자를 포함하며, 즉 자성 및 웅성 부모는 동일한 돌연변이체 대립유전자를 포함한다. 그러나, 또 다른 측면에서 자성 부모 및 웅성 부모는 상이한 돌연변이체 wap5.1 대립유전자를 포함할 수 있다. 예를 들어 자성 부모는 말단절단된 WAP5.1 단백질을 코딩하는 4개의 돌연변이체 wap5.1 대립유전자를 포함할 수 있고, 웅성 부모는 아미노산 치환을 갖는 WAP5.1 단백질을 코딩하는 2개의 돌연변이체 wap5.1 대립유전자를 포함할 수 있으며, 예를 들어 서열식별번호: 1 또는 9 (또는 이들 중 어느 하나에 대해 적어도 95% 동일성을 포함하는 서열)의 류신 528은 페닐알라닌 (돌연변이체 L528F)에 의해 대체되거나, 또는 그 반대이다.
한 측면에서 본원에 기재된 통성 단위결과를 부여하는 돌연변이체 wap5.1 대립유전자는 단위결과를 부여하는, 특히 통성 단위결과를 부여하는 또 다른 돌연변이체 대립유전자와 조합된다. 이러한 또 다른 돌연변이체 대립유전자는 예를 들어 WO2018/060444에 기재된 wop1 대립유전자이며, 이는 염색체 4 상에 위치된다 (이는 wap4.1로도 지칭됨). 한 측면에서 돌연변이체 wap5.1 대립유전자는 2배체, 3배체 또는 4배체 수박 식물에서 돌연변이체 wop1 대립유전자와 조합된다. wop1은 상이한 염색체 상에 있기 때문에, wop1 및 wap5.1 사이에 상이한 조합, 예를 들어 3배체 수박에서 wop1 및 of wap5.1 각각의 3개의 돌연변이체 카피, 또는 3배체 수박에서 wop1의 1 또는 2개의 돌연변이체 카피 및 wap5.1의 3개의 돌연변이체 카피, 또는 그 반대 등을 만들 수 있다.
3배체 씨없는 과실은 바람직하게는 시장성이 있다. 바람직하게는 이들은 적어도 6.0, 7.0, 8.0 또는 바람직하게는 적어도 9.0, 바람직하게는 적어도 10.0, 보다 바람직하게는 적어도 11.0의 애버리지 브릭스를 갖는다. 과실은 임의의 크기, 형상, 색상 및 껍질 패턴의 것일 수 있다. 바람직하게는 성숙기의 과실 과육 색상은 균일하다. 한 측면에서 과실 과육은 적색 또는 암적색이다.
3개 카피에 wap5.1을 포함하는 3배체 하이브리드의 애버리지 과실 중량은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14 kg과 동일하거나 그 초과실 수 있다. 또 다른 실시양태에서 3개 카피에 wap5.1을 포함하는 3배체 하이브리드의 애버리지 과실 중량은 5 kg, 예를 들어 4, 3, 2, 1.5 또는 1 kg 또는 심지어 그 미만과 동일하거나 그 미만일 수 있다.
씨없는 과실은 임의의 형상 (예를 들어, 길쭉한, 타원형, 괴상형, 구형 또는 원형), 과실 표면 (고랑, 매끄러운), 과육 색상 (적색, 암적색, 스칼렛 레드, 코랄 레드, 주황색, 연어색, 분홍색, 적분홍색, 노란색, 카나리아 옐로 또는 백색), 껍질 색상 (예를 들어, 밝은 녹색; 암녹색; 좁은, 중간 또는 넓은 줄무늬를 갖는 녹색-줄무늬; 회색 유형; 반점 있음 또는 없음; 황금색), 껍질 두께, 껍질 인성, 껍질 패턴 (예를 들어, 줄무늬 있음, 줄무늬 없음, 그물형), 과육 구조 / 과육 치밀도, 리코펜 및/또는 비타민 함량, 다양한 당도 대 산 비율, 과실 향미 등의 것일 수 있다.
그러므로, 돌연변이체 wap5.1 대립유전자는 전통적인 육종에 의해 다양한 형상 및 크기 등의 과실을 생산하는 다양한 씨없는 품종을 육종하는데 사용될 수 있다. 문헌 [Guner and Wehner 2004, Hort Science 39(6): 1175-1182], 특히 과실 특징에 대한 유전자를 기술하는 페이지 1180-1181을 참조한다. 일반적으로 중요한 육종 목적은 조기 성숙, 높은 과실 수확량, 높은 내부 과실 품질 (양호한 균일한 색상, 높은 당도, 적절한 당도 : 산 비율, 양호한 향미, 높은 비타민 및 리코펜 함량, 치밀한 과육 질감, 비섬유질 과육 질감, 결함, 예컨대 중심 공동, 껍질 괴사, 꽃말썩음병 또는 크로스 스티치가 없음 및 양호한 껍질 특징 및 내균열성)이다.
이러한 3배체 F1 하이브리드 식물이 성장될 수 있는 종자는 본 발명의 한 측면이다. 그러므로, 한 측면에서 3배체 수박 식물 성장/ 씨없는 수박 과실 생산 방법은 하기 단계를 포함한다: 이들의 게놈에 1, 2 또는 3개의 돌연변이체 wap5.1 대립유전자를 포함하는 3배체 수박 식물을 파종 또는 식재하는 단계, 임의로 꽃의 수분을 방지하는 단계 (예를 들어, 웅성 불임, 수분자의 부재 및/또는 화분의 부재에 의해) 및 단위결과를 통해 수분의 부재 하에 발달하는 씨없는 수박 과실을 수확하는 단계. 원칙적으로, 3배체 과실은 어쨌든 씨없는 과실을 생산하기 때문에 수분의 방지는 필요하지 않다. 차이점은 돌연변이체 wap5.1 대립유전자(들)를 포함하는 3배체는 과실 발달을 유도하기 위해 더 이상 화분을 필요로 하지 않으므로, 재배 구역이 3배체 식물에 의해 완전히 점유될 수 있고 수분자 식물의 내식이 더 이상 필요하지 않다는 것이다.
또한 돌연변이체 wap5.1 대립유전자의 2개 카피를 포함하는 2배체 수박 식물에 대해 씨없는 과실을 생산하는 방법이 제공된다. 그러므로, 한 측면에서 2배체 수박 식물 성장/ 씨없는 수박 과실 생산 방법은 하기 단계를 포함한다: 이들의 게놈에 돌연변이체 wap5.1 대립유전자의 2개 카피를 포함하는 2배체 수박 식물을 파종 또는 식재하는 단계, 꽃의 수분을 방지하는 단계 (예를 들어, 웅성 불임, 수분자의 부재 및/또는 화분의 부재에 의해) 및 단위결과를 통해 수분의 부재 하에 발달하는 씨없는 수박 과실을 수확하는 단계. 2배체 재배의 경우에 과실은 달리 종자를 함유할 것이므로 암꽃의 수분을 방지할 필요가 있다. 수분은 다양한 수단 또는 이들의 조합에 의해, 예를 들어 보호되고 화분이 없는 환경에서 식물을 성장시킴, 식물이 웅성 불임이고/거나 화분을 생산하지 않도록 보장, 화분 생산 및 암꽃 개화에 시차 생성, 수꽃 제거 등에 의해 방지될 수 있다.
본 발명의 돌연변이체 wap5.1 대립유전자의 1 또는 2개 카피만을 포함하는 3배체 종자 및 3배체 식물에 관하여 (상기 표 2, B행 및 C행에 나타낸 바와 같음), 표현형은 아직 테스트되지 않았지만, 이들은 또한 화분 없이 씨없는 과실을 생산하기에 적합할 수 있고, 또한 수분자 식물이 없는 밭에서 성장될 수 있다. 임의의 경우에, 이러한 3배체 식물 및 이러한 식물이 성장될 수 있는 종자는 본 발명의 측면이며, 이러한 식물에 의해 생산된 3배체 과실 및 이의 부분도 마찬가지이다. 바람직하게는 이러한 3배체 과실은 시장성이 있다. 바람직하게는 이들은 적어도 6.0, 7.0, 8.0 또는 바람직하게는 적어도 9.0, 바람직하게는 적어도 10.0, 보다 바람직하게는 적어도 11.0의 애버리지 브릭스를 갖는다. 과실은 임의의 크기, 형상, 색상 및 껍질 패턴의 것일 수 있다. 바람직하게는 성숙기의 과실 과육 색상은 균일하다. 한 측면에서 과실 과육은 적색 또는 암적색이다.
한 측면에서 본 발명의 3배체 식물은 영양 번식이다.
또한 3배체 하이브리드 수박 종자를 생산하는 방법이 제공되며, 여기서 이러한 종자로부터 성장된 3배체 식물은 수분의 부재 하에 과실을 생산하며, 상기 방법은 하기를 포함한다:
(a) 통성 단위결과성 2배체 수박 식물 및 통성 단위결과성 4배체 식물 (예를 들어 표 2 A행 참조)을 제공하는 단계,
(b) 2배체 식물의 화분으로 4배체 식물의 암꽃의 수분을 허용하는 단계, 및
(c) 4배체 식물의 과실에서 생산된 종자를 수확하는 단계, 및 임의로
(d) 수확된 종자를 건조시키는 단계.
그 후, 임의로 건조 및 수확된 F1 종자는 포장된다. 이들은 또한 포장 전에 처리될 수 있다. 그러므로, 상기 방법에 의해 수득된 종자를 포함하거나 이로 이루어진 패키지 또는 컨테이너는 본원의 실시양태이다.
또한 3배체 하이브리드 수박 종자를 생산하는 방법이 제공되며, 상기 방법은 하기를 포함한다:
(a) 돌연변이체 wap5.1 대립유전자가 결여된 2배체 수박 식물 및 돌연변이체 wap5.1 대립유전자의 4개 카피를 포함하는 4배체 식물 (예를 들어 표 2 B행 참조)을 제공하거나, 또는 돌연변이체 wap5.1 대립유전자에 대해 동형접합성인 2배체 수박 식물 및 돌연변이체 wap5.1 대립유전자가 결여된 4배체 식물 (예를 들어, 표 2 C행)을 제공하는 단계,
(b) 2배체 식물의 화분으로 4배체 식물의 암꽃의 수분을 허용하는 단계, 및
(c) 4배체 식물의 과실에서 생산된 종자를 수확하는 단계, 및 임의로
(d) 수확된 종자를 건조시키는 단계.
그 후, 임의로 건조 및 수확된 F1 종자는 포장된다. 이들은 또한 포장 전에 처리될 수 있다. 그러므로, 상기 방법에 의해 수득된 종자를 포함하거나 이로 이루어진 패키지 또는 컨테이너는 본원의 실시양태이다.
임의의 상기 3배체 식물이 성장될 수 있는 종자가 또한 본원에 포함되며, 이러한 식물의 부분도 마찬가지로, 예컨대 3배체 과실, 꽃, 잎, 줄기, 삽목, 영양 번식, 세포, 종자 번식 (예를 들어, 자가생식) 및 또한 시험관내 세포- 또는 조직 배양물, 뿐만 아니라 화분, 씨방, 근경, 접순 등이 본원에 포함된다. 그러므로, 한 실시양태에서 3배체 식물, 또는 식물이 성장될 수 있는 종자, 또는 식물의 조직 또는 부분 (화분, 꽃밥, 배주)은 상기 기재된 바와 같은 돌연변이체 wap5.1 대립유전자를 포함한다.
돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하는 3배체 식물을 성장시키는 방법이 또한 제공된다. 3배체 식물은 위단위결과성에서 단위결과성으로 변화되며, 즉 꽃으로부터 과실 발달을 유도하기 위해 수분자 식물이 더 이상 필요하지 않고, 따라서 이들 식물은 수분자 식물의 부재 하에 성장되어 씨없는 과실을 생산할 수 있다. 그러므로, 전체 밭 또는 온실은 3배체 식물만으로 성장될 수 있어 씨없는 3배체 과실의 수확량을 증가시킨다. 이들의 게놈에 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피 (또는 2 또는 3개 카피)를 포함하는 씨없는 과실이 또한 본원에 포함되며, 과실 또는 과실 부분을 포함하는 식품 또는 사료 제품도 마찬가지이다.
그러므로 상기 방법은 하기를 포함한다: 수분자 식물의 존재 없이 (예를 들어, 수분자 식물의 내식 없이) 재배 구역, 예컨대 밭 또는 온실 또는 터널에서 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하는 3배체 수박 식물을 파종 또는 성장시키는 단계, 및 꽃의 수분 없이 과실이 발달하도록 허용하는 단계 (단위결과성), 및 임의로 씨없는 3배체 과실을 수확하는 단계.
영양 번식 및 세포 또는 조직 배양
상기 2배체 식물, 4배체 식물 또는 3배체 식물 (또는 다른 다배수체)은 또한 영양적으로 (무성적으로) 재생될 수 있고, 이러한 영양 번식 식물 또는 '영양 번식'은 본 발명의 실시양태이다. 이들은 돌연변이체 wap5.1 대립유전자의 존재에 의해 및/또는 표현형적으로 다른 수박, 오이 또는 멜론 식물과 쉽게 구별될 수 있다. 하나 이상의 돌연변이체 wap5.1 대립유전자의 존재는 본원의 다른 곳에 기재된 바와 같이 결정될 수 있다.
영양 번식은 다양한 방법에 의해 만들어질 수 있다. 예를 들어 본 발명의 식물의 하나 이상의 접순은 상이한 근경, 예를 들어 생물적 또는 비생물적 스트레스 관용적 근경에 접목될 수 있다.
다른 방법은 시험관내 세포 또는 조직 배양 방법 및 이러한 배양물로부터 영양 번식의 재생을 포함한다. 이러한 세포 또는 조직 배양물은 본 발명의 식물의 다양한 세포 또는 조직을 포함하거나 이로 이루어진다. 한 측면에서 이러한 세포 또는 조직 배양물은 본 발명의 식물의 영양 세포 또는 영양 조직을 포함하거나 이로 이루어진다.
또 다른 측면에서 세포 또는 조직 배양물은 본 발명의 식물의 생식 세포 또는 조직, 예컨대 꽃밥 또는 배주를 포함하거나 이로 이루어진다. 이러한 배양물은 예를 들어 이중 반수체 식물을 만들기 위해 염색체 배가제로 처리될 수 있거나, 또는 대안적으로 반수체 식물을 만들기 위해 사용될 수 있다 (예를 들어, 4배체로부터 2배체를 만들기 위해 또는 2배체로부터 반수체를 만들기 위해).
그러므로 시험관내 세포 또는 조직 배양물은 하기로 이루어진 군으로부터 선택된 식물 부분으로부터의 세포 또는 원형질체 또는 식물 조직을 포함하거나 이로 이루어질 수 있다: 과실, 배아, 분열조직, 떡잎, 화분, 배주, 잎, 꽃밥, 뿌리, 근단, 암술, 꽃, 종자, 줄기. 또한 예를 들어 종피 단독 (모계 조직)과 같은 이들 중 임의의 것의 부분이 포함된다.
그러므로, 본 발명의 한 측면에서 돌연변이체 wap5.1 대립유전자의 1, 2, 3 또는 4개 카피를 포함하는 식물의 세포의 세포 배양물 또는 조직 배양물 (모두 상기 기재된 바와 같음)이 제공된다. 언급된 바와 같이, 세포 배양물 또는 조직 배양물은 돌연변이체 wap5.1 대립유전자를 포함하는 식물의 식물 부분으로부터의 세포 또는 원형질체 또는 식물 조직을 포함하며, 하기로 이루어진 군으로부터 선택된 세포 또는 조직을 포함하거나 이로 이루어질 수 있다: 배아, 분열조직, 떡잎, 화분, 잎, 꽃밥, 뿌리, 근단, 암술, 꽃, 종자, 줄기; 또는 이들 중 임의의 것의 부분.
또한 이러한 세포 배양물 또는 조직 배양물로부터 재생된 수박, 오이 또는 멜론 식물이 제공되며, 여기서 재생된 식물 (또는 예를 들어 재생된 식물의 자가생식 후 수득된 이의 자손)은 돌연변이체 wap5.1 대립유전자를 포함한다. 따라서, 한 측면에서 하나 이상의 카피에 돌연변이체 wap5.1 대립유전자를 포함하는 수박, 오이 또는 멜론 식물은 영양 번식 수박, 오이 또는 멜론 식물이다.
상이한 측면에서 하나 이상의 카피에 wap5.1을 포함하는 본 발명의 세포 및 조직 (및 임의로 또한 세포 또는 조직 배양물)은 비번식 세포 또는 조직이다.
방법
씨없는 3배체 수박 과실 생산 방법이 제공되며, 상기 방법은 하기를 포함한다:
1. 돌연변이체 wap5.1 대립유전자의 적어도 1개, 바람직하게는 2개 또는 바람직하게는 3개 카피를 포함하는 3배체 하이브리드 (F1) 수박 식물 또는 종자를 제공하는 단계,
2. 상기 3배체 하이브리드 식물을 밭에 식재 또는 파종하는 단계 (바람직하게는 2배체 수분자 식물을 동일한 밭에 식재 또는 파종하지 않고), 및 임의로
3. 3배체 식물 상에 생산된 씨없는 수박 과실을 수확하는 단계로서, 여기서 과실은 바람직하게는 암꽃의 수분 없이 생산되는 것인 단계.
한 측면에서 단계 1의 3배체 하이브리드 식물은 바람직하게는 상이한 근경에 접목되지 않는다. 또 다른 측면에서 이는 상이한 근경에 접목될 수 있다.
언급된 바와 같이, 3배체 식물의 암꽃의 과실 결실을 유도하기 위해 2배체 수분자 식물을 더 이상 제공할 필요가 없다. 이는 전체 밭이 본질적으로 F1 3배체 종자 또는 식물의 종자 또는 이식체만으로 파종 또는 식재될 수 있음을 의미한다. 따라서 헥타르당 씨없는 수박 과실의 수확량이 크게 향상된다. 또한 하나의 유전자형만이 파종 또는 식재되기 때문에 파종 및 식재가 훨씬 더 쉽게 이루어진다.
그러므로, 방법은 또한 씨없는 수박 과실을 생산하는 방법으로서 기재될 수 있으며, 상기 방법은 돌연변이체 wap5.1 대립유전자의 적어도 1개, 바람직하게는 2개, 보다 바람직하게는 3개 카피를 포함하는 3배체 식물을 성장시키는 단계 및 상기 식물에 의해 생산된 과실을 수확하는 단계를 포함한다. 과실은 바람직하게는 암꽃의 수분 없이, 즉 생존가능한 또는 가임성 화분의 부재 하에 발달한다. 곤충, 예컨대 꿀벌은 과실 결실에 더 이상 필요하지 않으며, 즉 밭 안 또는 근처에 벌집을 배치할 필요가 없다.
수확된 3배체 씨없는 과실은 신선한 시장 또는 가공을 위해 포장될 수 있다. 상기 방법에 의해 수득가능한 1, 2 또는 3개의 wap5.1 대립유전자를 포함하는 과실이 본원에 포함된다. 임의로 돌연변이체 wap5.1 대립유전자의 검출 (예를 들어 다른 곳에 기재된 바와 같은 DNA, RNA 또는 단백질 검출을 사용한 돌연변이체 wap5.1 대립유전자의 검출에 의해, 예를 들어 wap5.1 대립유전자에 연결 (또는 밀접하게 연결)되거나 대립유전자-특이적인 (예를 들어, 야생형 대립유전자로부터 돌연변이체 대립유전자를 구별하는 돌연변이를 검출함) 마커의 PCR, 유전자형분석 또는 마커 분석에 의해)은 이러한 과실을 구별할 수 있다. 그러므로, 한 실시양태에서, 수확된 3배체 과실 (즉, wap5.1/WAP5.1/WAP5.1 또는 wap5.1/wap5.1/WAP5.1 또는 wap5.1/ wap5.1/wap5.1), 예컨대 포장된 전체 과실 또는 과실 부분 및/또는 가공된 과실 또는 과실 부분이 제공된다.
또한 하기 단계를 포함하는, 통성 단위결과성 재배 수박 식물의 생산 방법이 제공된다:
a) 수박 식물 집단에 돌연변이를 도입하거나, 또는 돌연변이체 수박 식물 집단을 제공하는 단계;
b) 암꽃의 수분 없이 씨없는 과실을 생산하고 암꽃의 수분 후 씨있는 과실을 생산하는 식물을 선택하고/거나, WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는 식물을 선택하는 단계;
c) 임의로 b)에서 선택된 식물이 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는지 확인하는 단계; 및
d) 임의로 c)에서 수득된 식물을 성장시키는 단계.
상기 방법에 의해 생산된 수박 식물이 포함된다.
a)에서 수박 식물 집단은 바람직하게는 돌연변이유발성 작용제로 처리되는 / 처리된 (또는 이에 적용되는) 재배 수박 육종 계통 또는 품종의 단일 유전자형, 또는 이러한 집단의 자손 (예를 들어 M2, M3 또는 추가 세대 식물을 생산하기 위해 집단의 개체의 자가생식 후 수득됨)이다. 이는 예를 들어 TILLING 집단일 수 있다.
단계 b)에서 식물은 표현형, 즉 통성 단위결과성에 대해 스크리닝되고/거나, 식물 (또는 식물 부분 또는 이로부터의 DNA)은 WAP5.1 유전자의 돌연변이체 대립유전자, 즉 야생형 WAP5.1 단백질의 감소된 발현 또는 발현 없음을 갖는 대립유전자 또는 돌연변이체 WAP5.1 단백질을 코딩하는 대립유전자의 존재에 대해 스크리닝된다. 표현형에 대한 스크리닝에 관하여, 암꽃의 수분 없이 씨없는 과실이 발달해야 하며; 암꽃의 수분으로 씨있는 과실이 발달해야 하는 것으로 이해된다. 이 표현형 스크리닝은 여러 단계로 수행될 수 있다. 예를 들어 제1 식물은 곤충이 없는 환경에서 성장될 수 있고 수꽃은 제거될 수 있다. 암꽃은 개화 및 과실 발달 (화분의 부재 하에)에 대해 육안으로 관찰될 수 있다. 발달된 과실을 성숙기에 반으로 절단하여 씨가 없는지 체크할 수 있다. 선택된 식물은 예를 들어 영양적으로 재생되어 단위결과 표현형을 확인하고/거나, 예를 들어 꽃을 손으로 수분하여 수분 시 과실이 씨가 있는지 확인할 수 있다 (통성 단위결과). WAP5.1 유전자의 돌연변이체 대립유전자의 존재에 대한 식물의 스크리닝에 관하여, 이는 예를 들어 wap5.1 DNA, RNA 또는 단백질을 검출하는 다양한 방법에 의해, 예를 들어 식물이 게놈 DNA에 돌연변이를 포함하는지 결정하기 위해 게놈 DNA를 증폭시키기 위해 코딩 영역의 일부 또는 코딩 영역 전체를 증폭시키는 PCR 프라이머를 설계함으로써, 또는 다른 방법에 의해 수행될 수 있다.
단계 c)는 돌연변이체 wap5.1 대립유전자가 존재하는지 여부를 결정하기 위한 다양한 방법을 수반할 수 있다. 예를 들어 WAP5.1 로커스를 포함하는 염색체 영역의 마커 분석 또는 서열 분석이 수행될 수 있거나, 또는 wap5.1 대립유전자 (또는 이의 부분) 또는 mRNA (cDNA)를 증폭시키기 위해 PCR 또는 RT-PCR이 사용될 수 있다. 또한 열성 유전을 결정하기 위한 유전자 분석이 수행될 수 있다.
또한 바람직하게는 식물의 암꽃의 수분 없이 씨없는 수박 과실을 생산하기 위한 통성 단위결과성 수박 식물의 용도가 제공된다. 추가로 통성 단위결과성 수박 식물 및/또는 암꽃의 수분의 부재 하에 씨없는 수박 과실을 생성하기 위한 돌연변이체 wap5.1 대립유전자의 용도가 제공된다. 마찬가지로 통성 단위결과성 수박 식물을 생산하기 위한 본 발명에 따른 WAP5.1 유전자의 돌연변이체 wap5.1 대립유전자의 용도가 본원에 포함된다.
한 측면에서 본 발명에 따른 식물, 식물 부분 및 식물 세포는 규칙 28 (2) EPC (유럽 특허 협약)에 의해 정의된 바와 같이 본질적으로 생물학적 프로세스에 의해 배타적으로 수득되는 것은 아니다.
한 측면에서 식물은 비-GMO (유전자 변형되지 않음)이다.
한 측면에서 돌연변이체 대립유전자는 돌연변이유발 (예를 들어, 화학적 또는 방사선 돌연변이유발) 또는 표적화된 돌연변이유발에 의해, 특히 CRISPR 시스템 (예를 들어, Crispr/Cas9 또는 Crispr/CpfI 또는 다른 뉴클레아제)을 사용하여 생성된다. 한 측면에서 돌연변이체 wap5.1 대립유전자를 포함하는 재배 식물은 트랜스제닉 식물이 아니며, 예를 들어 CRISPR 구축물을 포함하지 않는 비-트랜스제닉 자손이 예를 들어 선택된다.
한 측면에서 WAP5.1 유전자의 돌연변이체 대립유전자는 인간 유도된 돌연변이, 즉 돌연변이유발 기술, 예컨대 화학적 돌연변이유발 또는 방사선 돌연변이유발, 또는 표적화된 돌연변이유발 기술, 예컨대 Crispr 기반 기술에 의해 도입된 돌연변이를 포함한다.
임의의 표적화된 유전자 변형 방법, 예컨대 CRISPR 기반 방법 (예를 들어, Crispr/Cas9 또는 Crispr/CpfI), TALENS, 아연 핑거 또는 다른 방법을 사용하여 수박, 멜론 및 오이에서 내인성 WAP5.1 유전자의 표적화된 돌연변이유발 방법이 본원에 제공된다.
한 측면에서 단리된 돌연변이체 WAP5.1 단백질 및 단리된 야생형 WAP5.1 단백질, 또는 돌연변이체 WAP5.1 단백질 또는 야생형 WAP5.1 단백질을 코딩하는 단리된 핵산 분자가 제공된다. 또한 돌연변이체 또는 야생형 WAP5.1 단백질에 결합할 수 있는 항체가 본원에 포함된다.
검출 방법
한 측면에서 이들의 게놈에 WAP5.1 단백질-코딩 유전자의 돌연변이체 대립유전자를 포함하는 종자, 식물 또는 식물 부분 또는 이러한 종자, 식물 또는 식물 부분으로부터의 DNA를 식별 및/또는 선택하기 위한 스크리닝 방법이 제공된다.
상기 방법은 돌연변이체 대립유전자의 존재를 검출하기 위해 공지된 방법을 사용하여 DNA, RNA (또는 cDNA) 또는 단백질 수준에서 스크리닝하는 것을 포함한다. 유전자의 돌연변이체 대립유전자의 존재를 검출하기 위한 많은 방법이 있다.
그러므로, 하기 단계 중 하나 이상을 포함하는, 돌연변이체 wap5.1 대립유전자의 존재에 대해 식물 또는 식물 물질 또는 식물 부분, 또는 이로부터 유래된 DNA 또는 RNA 또는 단백질을 스크리닝 및/또는 선택하는 방법이 제공된다:
a) 내인성 WAP5.1 유전자의 유전자 발현이 감소 또는 폐지되었는지 결정하는 단계;
b) 야생형 WAP5.1 단백질의 양이 감소 또는 폐지되었는지 결정하는 단계;
c) 돌연변이체 WAP5.1 단백질을 코딩하는 돌연변이체 mRNA, cDNA 또는 게놈 DNA가 존재하는지 결정하는 단계;
d) 돌연변이체 WAP5.1 단백질이 존재하는지 결정하는 단계;
e) 식물 또는 이의 자손이 통성 단위결과성인지 결정하는 단계.
일상적인 방법, 예컨대 RT-PCR, PCR, 항체 기반 검정, 시퀀싱, 유전자형분석 검정 (예를 들어, 대립유전자-특이적 유전자형분석), 표현형분석 등이 사용될 수 있다.
식물 또는 식물 물질 또는 식물 부분은 수박, 오이 또는 멜론 식물 또는 식물 물질 또는 식물 부분, 예컨대 잎, 잎 부분, 세포, 과실, 과실 부분, 씨방, 줄기, 배축, 종자, 종자의 부분, 종피, 배아 등일 수 있다.
예를 들어 야생형 및 돌연변이체 대립유전자 사이에 단일 뉴클레오티드 차이 (단일 뉴클레오티드 다형성, SNP)가 있는 경우, SNP 유전자형분석 검정은 식물 또는 식물 부분 또는 세포가 이의 게놈에 야생형 뉴클레오티드 또는 돌연변이체 뉴클레오티드를 포함하는지 여부를 검출하기 위해 사용될 수 있다. 예를 들어 SNP는 KASP-검정 (월드 와이드 웹 kpbioscience.co.uk 참조) 또는 다른 SNP 유전자형분석 검정을 사용하여 쉽게 검출될 수 있다. KASP-검정을 개발하기 위해, 예를 들어 SNP의 70개 염기쌍 상류 및 70개 염기쌍 하류를 선택할 수 있고, 2개의 대립유전자-특이적 정방향 프라이머 및 1개의 대립유전자 특이적 역방향 프라이머를 설계할 수 있다. 예를 들어 문헌 [Allen et al. 2011, Plant Biotechnology J. 9, 1086-1099], 특히 KASP-검정 방법에 대한 p097-1098을 참조한다.
동일하게 다른 유전자형분석 검정이 사용될 수 있다. 예를 들어, TaqMan SNP 유전자형분석 검정, 고분해능 용융 (HRM) 검정, SNP-유전자형분석 어레이 (예를 들어, 플루이다임(Fluidigm), 일루미나(Illumina) 등) 또는 DNA 시퀀싱이 동일하게 사용될 수 있다.
한 측면에서 예를 들어 서열식별번호: 8의 뉴클레오티드 61, 또는 서열식별번호: 8에 대해 적어도 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 포함하는 서열의 뉴클레오티드 61에 있는 SNP 마커 mwm23348429는 수박에서 L528F 아미노산 치환, 오이에서 L535F 아미노산 치환 또는 멜론에서 L538F 아미노산 치환을 포함하는 돌연변이체 단백질을 코딩하는 돌연변이체 wap5.1 대립유전자의 존재 또는 부재를 검출하기 위해 사용될 수 있다. 야생형 대립유전자 및 돌연변이체 대립유전자의 게놈 서열 사이의 차이에 기초하여, 통상의 기술자는 특이적 대립유전자를 검출하기 위해 사용될 수 있는 마커를 쉽게 개발할 수 있다.
또한, 돌연변이체 wap5.1 대립유전자를 포함하는 수박, 오이 또는 멜론 식물 (또는 식물 부분)을 식별하는 방법이 본원에 제공되며, 상기 방법은 식물 (또는 식물 부분)에서 돌연변이체 wap5.1 대립유전자의 존재를 검출하는 것을 포함하며, 여기서 존재는 wap5.1 대립유전자 내의 적어도 하나의 마커에 의해 또는 wap5.1 대립유전자에 의해 코딩된 단백질을 검출함으로써 검출된다. 돌연변이체 wap5.1 대립유전자를 검출하는 방법은 대립유전자에 의해 코딩된 wap5.1 단백질을 검출하기 위한 PCR 증폭, 핵산 시퀀싱, 핵산 혼성화 및 항체 기반 검정 (예를 들어, 면역검정)으로 이루어진 군으로부터 선택된다.
또한, 조절 요소에 돌연변이를 포함하는 돌연변이체 wap5.1 대립유전자를 포함하는 수박, 오이 또는 멜론 식물 (또는 식물 부분)을 식별하는 방법이 본원에 제공되며, 상기 방법은 식물 (또는 식물 부분)에서 돌연변이체 wap5.1 대립유전자의 감소된 유전자 발현 또는 유전자 발현의 부재를 검출하는 것을 포함하며, 여기서 존재는 야생형 WAP5.1 대립유전자의 mRNA 수준 (cDNA)에 의해 또는 야생형 WAP5.1 단백질의 단백질 수준을 검출함으로써 검출된다. 돌연변이체 wap5.1 대립유전자를 검출하는 방법은 대립유전자에 의해 코딩된 WAP5.1 단백질을 검출하기 위한 PCR 증폭 (예를 들어, RT-PCR), 핵산 시퀀싱, 웨스턴 블롯팅 및 항체 기반 검정 (예를 들어, 면역검정)으로 이루어진 군으로부터 선택된다.
또한, 세포 또는 수박 식물 또는 식물 부분이 서열식별번호: 1 또는 9의 단백질, 또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97% 또는 98% 서열 동일성을 포함하는 단백질을 코딩하는 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자를 포함하는지 여부를 결정 또는 검출 또는 검정하는 방법이 본원에 제공된다. 한 측면에서 방법은 대립유전자의 발현을 결정하는 것, 및/또는 대립유전자의 코딩 서열을 결정하는 것, 및/또는 대립유전자의 코딩 서열의 일부 (예를 들어, 대립유전자의 SNP 유전자형)를 결정하는 것, 및/또는 생산된 단백질의 아미노산 서열 및/또는 생산된 단백질의 양을 결정하는 것을 포함한다. 세포 또는 오이 또는 멜론 식물 또는 식물 부분이 서열식별번호: 2의 단백질, 또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97% 또는 98% 서열 동일성을 포함하는 단백질 (오이), 또는 서열식별번호: 3의 단백질, 또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97% 또는 98% 서열 동일성을 포함하는 단백질 (멜론)을 코딩하는 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자를 포함하는지 여부를 결정 또는 검출 또는 검정하는 방법에 동일하게 적용된다.
식물 또는 이의 부분이 본 발명의 돌연변이체 wap5.1 대립유전자를 포함하는지 여부를 결정하는데 다양한 방법이 사용될 수 있다. 언급된 바와 같이, 야생형 대립유전자의 감소된 발현 또는 발현 없음이 있는지 확인하기 위해 야생형 대립유전자의 mRNA (또는 cDNA) 수준을 결정할 수 있거나, 야생형 단백질 수준을 결정될 수 있다. 또한, 코딩 서열 또는 이의 부분이 분석될 수 있으며, 예를 들어 어떤 돌연변이체 대립유전자가 존재할 수 있는지 이미 알고 있는 경우, 돌연변이를 검출하기 위한 검정이 개발될 수 있으며, 예를 들어 SNP 유전자형분석 검정은 예를 들어 돌연변이체 대립유전자 및 야생형 대립유전자의 존재를 구별할 수 있다 (예를 들어 마커 mwm23348429에 대한 유전자형분석).
하기 단계를 포함하는, 식물 또는 종자의 선택 방법:
a) WAP5.1 단백질을 코딩하는 유전자의 대립유전자에 돌연변이를 갖는 식물 또는 종자를 식별하는 단계로서, 여기서 유전자의 야생형 대립유전자는 서열식별번호: 1 또는 서열식별번호: 1 또는 서열식별번호: 2 또는 서열식별번호: 3의 군으로부터 선택된 단백질 중 어느 하나에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 WAP5.1 단백질을 코딩하는 것인 단계, 및 임의로
b) 식물 또는 자가-수정에 의해 생산된 자손 식물이 통성 단위결과성인지 여부를 결정하는 단계, 및 임의로
c) 단계 a)의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 식물 또는 종자를 선택하는 단계.
하기 단계를 포함하는, 식물, 바람직하게는 수박, 멜론 또는 오이 식물의 생산 방법:
a) 식물 또는 종자 집단에 돌연변이를 도입하는 단계,
b) 수분의 부재 하에 씨없는 과실 및 수분 후 씨있는 과실을 생산하는 식물을 선택하고/거나, 이의 게놈에 돌연변이체 wap5.1 대립유전자를 포함하는 식물 또는 종자를 선택하는 단계,
c) 임의로 b)에서 선택된 식물이 WAP5.1 단백질을 코딩하는 대립유전자에 돌연변이를 갖는지 확인하는 단계, 및 임의로
d) c)에서 수득된 식물 또는 종자를 성장 또는 재배하는 단계,
여기서 유전자의 야생형 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9 또는 서열식별번호: 2 또는 서열식별번호: 3의 군으로부터 선택된 단백질 중 어느 하나에 대해 적어도 95% 서열 동일성을 포함하는 WAP5.1 단백질을 코딩한다.
하기 단계를 포함하는, 식물의 생산 방법:
a) 외래 핵산 분자를 식물에 도입하는 단계로서, 여기서 외래 핵산 분자는 하기로 이루어진 군으로부터 선택되는 것인 단계:
i) WAP5.1 단백질을 코딩하는 내인성 유전자의 발현 감소에 영향을 미치는 적어도 하나의 안티센스 RNA를 코딩하는 DNA 분자;
ii) 공동-저해 효과에 의해 WAP5.1 단백질을 코딩하는 내인성 유전자의 발현 감소를 유발하는 DNA 분자;
iii) WAP5.1 단백질을 코딩하는 내인성 유전자의 특이적 전사체를 분할하는 적어도 하나의 리보자임을 코딩하는 DNA 분자;
iv) 적어도 하나의 안티센스 RNA 및 적어도 하나의 센스 RNA를 동시에 코딩하는 DNA 분자, 여기서 상기 안티센스 RNA 및 상기 센스 RNA는 WAP5.1 단백질을 코딩하는 내인성 유전자의 발현 감소에 영향을 미치는 이중-가닥 RNA 분자를 형성함 (RNAi 기술);
v) WAP5.1 단백질을 코딩하는 내인성 유전자에서 이종 서열의 돌연변이 또는 삽입을 유발하는 생체내 돌연변이유발에 의해 도입된 핵산 분자, 여기서 돌연변이 또는 삽입은 WAP5.1 단백질을 코딩하는 유전자의 발현 감소에 영향을 미치거나 기능 상실 또는 감소된 기능 WAP5.1 단백질의 합성을 초래함;
vi) 항체를 코딩하는 핵산 분자, 여기서 항체는 내인성 WAP5.1 단백질에 대한 항체의 결합으로 인해 WAP5.1 단백질을 코딩하는 내인성 유전자의 활성 감소를 초래함;
vii) 트랜스포존을 함유하는 DNA 분자, 여기서 이들 트랜스포존의 통합은 WAP5.1 단백질을 코딩하는 내인성 유전자에서 돌연변이 또는 삽입을 유발하며, 이는 WAP5.1 단백질을 코딩하는 내인성 유전자의 발현 감소에 영향을 미치거나 비활성 단백질의 합성을 초래함;
viii) WAP5.1 단백질을 코딩하는 내인성 유전자에서의 삽입으로 인해 WAP5.1 단백질을 코딩하는 내인성 유전자의 발현 감소에 영향을 미치거나, 기능 상실 또는 감소된 기능 WAP5.1 단백질의 합성을 초래하는 T-DNA 분자;
ix) 희귀-절단 엔도뉴클레아제 또는 맞춤형 희귀-절단 엔도뉴클레아제, 바람직하게는 메가뉴클레아제, TALEN 또는 CRISPR/Cas 시스템을 코딩하는 핵산 분자.
b) 식물을 선택하며, 여기서 식물 또는 자가-수정에 의해 생산된 식물의 자손은 수분의 부재 하에 씨없는 과실 및 수분 후 씨있는 과실을 생산하는 것인 단계, 임의로
c) b)에서 선택된 식물이 이의 게놈에 예를 들어 외래 핵산 분자가 통합되지 않은 야생형 식물과 비교하여 WAP5.1 단백질의 감소된 활성을 갖는지 확인하는 단계, 임의로
d) c)에서 수득된 식물을 성장/재배하는 단계.
임의의 상기 방법에 의해 수득된 식물이 본원에 포함된다.
한 측면에서 유전적으로 변형된 식물 및 식물 부분이 제공되며, 여기서 식물은 예를 들어 내인성 WAP5.1 유전자의 침묵을 통해 내인성 WAP5.1 유전자의 감소된 발현 또는 발현 없음을 갖는다. 이러한 식물은 임의의 식물일 수 있으며, 한 측면에서 이는 수박, 멜론 또는 오이이다. 그러나, 이는 또한 옥수수, 대두, 밀, 카놀라, 토마토, 목화 등일 수 있다.
또 다른 측면에서 내인성 WAP5.1 유전자에 돌연변이, 예를 들어 표적화된 돌연변이유발에 의해 예를 들어 생성된 유도된 돌연변이를 포함하는 식물 및 식물 부분이 제공되며, 여기서 유전자 발현은 감소 또는 폐지되거나, 발현된 유전자는 야생형 단백질과 비교하여 감소된 기능 또는 기능 상실 WAP5.1 단백질을 코딩한다. 이러한 식물은 임의의 식물일 수 있으며, 한 측면에서 이는 기재된 바와 같이 수박, 멜론 또는 오이이다. 그러나, 이는 또한 옥수수, 대두, 밀, 카놀라, 토마토, 목화, 후추 등일 수 있다. 다른 종의 WAP5.1 유전자는 쿠르비타세아에 WAP5.1 유전자에 대해 더 적은 서열 동일성을 가질 수 있기 때문에, 본 발명의 이 측면에서 WAP5.1 유전자는 서열식별번호: 1, 9, 2 또는 3에 대해 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 서열 동일성을 포함하는 단백질을 코딩하는 유전자임이 본원에 포함된다. 임의로 WAP5.1 유전자는 서열식별번호: 1, 9, 2 또는 3에 대해 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 서열 동일성을 포함하는 단백질을 코딩하는 유전자이며, 여기서 단백질은 서열식별번호: 1, 9, 2 또는 3의 보존된 F-박스 도메인 및/또는 LRR-도메인, 또는 서열식별번호: 1, 9, 2 또는 3의 F-박스 또는 LRR-도메인에 대해 적어도 70%, 75%, 80%, 85%, 90%, 95% 서열 동일성을 포함하는 F-박스 또는 LRR-도메인을 포함한다. 통상의 기술자는 이러한 다른 종에서, 예를 들어 후추 또는 토마토에서 WAP5.1 유전자의 오르토로그를 식별하고, 이에 의해 통성 단위결과성 후추 또는 토마토 식물을 만들 수 있다. 수박, 오이 및 멜론에 대해 본원에 기재된 모든 실시양태는 WAP5.1 유전자가 그러므로 서열식별번호: 1, 9, 2 또는 3의 야생형 WAP5.1 수박, 오이 또는 멜론 단백질에 대해 각각 95% 미만의 서열 동일성을 갖는 단백질을 코딩할 수 있다는 차이를 제외하고는 다른 작물 종에 동일하게 적용된다.
또한, 하기 단계를 포함하는, WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 존재에 대해 수박 식물, 종자, 식물 부분 또는 이로부터의 DNA를 스크리닝하기 위한, 또는 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자를 포함하는 수박 식물, 종자 또는 식물 부분을 선택하기 위한 방법이 본원에 제공된다:
a) 게놈 DNA가 서열식별번호: 1 또는 9의 단백질을 코딩하는 야생형 WAP5.1 대립유전자 및/또는 야생형 WAP5.1 단백질과 비교하여 대체, 삽입 또는 결실된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하는 돌연변이체 WAP5.1 대립유전자를 포함하는지 여부를 분석하는 단계, 및 임의로
b) 야생형 대립유전자의 2개 카피, 돌연변이체 대립유전자의 2개 카피 또는 야생형 대립유전자의 1개 카피 및 돌연변이체 대립유전자의 1개 카피를 포함하는 식물, 종자 또는 식물 부분을 선택하는 단계.
한 측면에서 방법 단계 a)는 하기로부터 선택된 방법을 포함한다:
i) WAP5.1 대립유전자의 DNA에 혼성화하는 하나 이상의 올리고뉴클레오티드 프라이머를 사용한 WAP5.1 대립유전자의 적어도 일부의 증폭,
ii) WAP5.1 대립유전자의 DNA의 적어도 일부에 대한 하나 이상의 올리고뉴클레오티드 프로브의 혼성화,
iii) WAP5.1 대립유전자의 DNA, mRNA 또는 cDNA의 시퀀싱.
따라서, 예를 들어 DNA 샘플은 식물, 종자 또는 식물 부분으로부터 수득될 수 있고, 야생형 WAP5.1 대립유전자의 일부 및/또는 돌연변이체 WAP5.1 대립유전자의 일부를 증폭시키기 위해 PCR 반응이 수행될 수 있다. 예를 들어 경쟁적 PCR 방법은 게놈 DNA의 WAP5.1 로커스에 존재하는 대립유전자의 증폭 생성물을 생성하기 위해 사용될 수 있다 (예컨대 KASP 검정). 유사하게, 올리고뉴클레오티드 프로브는 게놈 DNA의 WAP5.1 로커스에 존재하는 대립유전자의 혼성화 생성물을 생성할 수 있다. 프라이머 또는 프로브는 예를 들어 야생형 대립유전자 및 돌연변이체 대립유전자를 구분하기 위해 특정 WAP5.1 대립유전자에 특이적이도록 설계될 수 있다. 예를 들어, SNP 마커 mwm23348429는 뉴클레오티드 61에 SNP를 포함하며, 이는 아미노산 L528을 포함하는 단백질을 코딩하는 야생형 대립유전자 및 서열식별번호: 1 또는 9에서 아미노산 F528을 포함하는 단백질을 코딩하는 돌연변이체 대립유전자를 구분한다. 프라이머 또는 프로브는 이러한 SNP를 검출하도록 설계될 수 있으며, 야생형 및 돌연변이체 WAP5.1 대립유전자, 예컨대 표 1의 것들 사이에서 발견되는 임의의 다른 다형성 (예를 들어, SNP 또는 INDEL)에 대해서도 동일하게 수행될 수 있다.
한 측면에서, 하기 단계를 포함하는, 수박 식물, 종자, 식물 부분, 세포 또는 조직의 유전자형분석을 위한 유전자형분석 검정이 제공된다:
a) 하나 이상의 수박 식물 또는 식물 집단의 게놈 DNA를 제공하는 단계, 및
b) 서열식별번호: 1 또는 9의 단백질을 코딩하는 야생형 대립유전자의 존재 및/또는 돌연변이체 대립유전자의 존재를 검출하는 유전자형분석 검정을 수행하는 단계로서, 여기서 돌연변이체 대립유전자는 서열식별번호: 1 또는 9에 대해 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하는 것인 단계, 및 임의로
c) 야생형 대립유전자의 2개 카피, 또는 야생형 대립유전자의 1개 카피 및 돌연변이체 대립유전자의 1개 카피, 또는 돌연변이체 대립유전자의 2개 카피를 포함하는 식물, 종자, 식물 부분, 세포 또는 조직을 선택하는 단계.
단계 b)에서 돌연변이체 대립유전자에서의 돌연변이는 바람직하게는 하나 이상의 아미노산이 야생형 단백질에 대해 삽입, 결실 또는 대체되도록 야기하며, 예를 들어 돌연변이체 대립유전자는 본원에 기재된, 예를 들어 표 1에 기재된 돌연변이체 WAP5.1 단백질 중 하나를 코딩한다.
야생형 대립유전자는 예를 들어 기재된 영역의 찰스턴 그레이 로커스 또는 앞서 기재된 영역의 품종 97103 로커스에 상응하는 염색체 5 상의 로커스에 있는 게놈 DNA이다. 이들 WAP5.1 로커스는 각각 서열식별번호: 7 및 서열식별번호: 14의 게놈 서열을 포함한다. 둘 다는 프로그램 니들을 사용하여 쌍별 정렬된 경우에 99.8%의 서열 동일성을 갖는다. 야생형 로커스에 의해 코딩된 cDNA는 각각 서열식별번호: 6의 cDNA (서열식별번호: 1의 야생형 단백질을 코딩함) 및 서열식별번호: 11의 cDNA (서열식별번호: 9의 야생형 단백질을 코딩함)이다.
단계 a)는 유전자형분석 검정에서 분석될 식물, 종자, 식물 부분, 세포 또는 조직으로부터의 게놈 DNA의 단리를 포함할 수 있다. 관련 기술분야에 공지된 바와 같이 종종 조질 DNA 추출 방법이 사용될 수 있다.
단계 b)는 바람직하게는 이중-대립유전자 유전자형분석 검정을 포함하며, 이는 대립유전자-특이적 올리고뉴클레오티드 프라이머 및/또는 대립유전자-특이적 프로브, 즉 야생형 대립유전자 및 돌연변이체 대립유전자를 구별하는 프라이머 또는 프로브를 사용한다.
단계 a)의 식물은 예를 들어 화학적 또는 방사선 돌연변이원 또는 유전자 편집 기술을 사용하여 돌연변이유발될 수 있다. 그러므로 단계 a) 이전에 식물, 종자 또는 식물 부분을 돌연변이유발제로 처리하거나 WAP5.1 대립유전자에서 표적화된 돌연변이를 유도하는 단계가 있을 수 있다.
INDEL 및 SNP를 검출할 수 있고 게놈 DNA에 존재하는 야생형 대립유전자 (염색체 5 상의 WAP5.1 로커스에서) 또는 게놈 DNA에 존재하는 WAP5.1 유전자의 돌연변이체 대립유전자를 구분할 수 있는 한, 다양한 유전자형분석 검정이 사용될 수 있다. 유전자형분석 검정은 일반적으로 야생형 또는 돌연변이체 대립유전자를 증폭시키고 증폭 생성물을 검출하기 위해 PCR 또는 열 순환 반응 (폴리머라제 연쇄 반응)에서 사용되는 대립유전자-특이적 프라이머, 또는 야생형 대립유전자 또는 돌연변이체 대립유전자 또는 둘 다에 혼성화하는 대립유전자-특이적 올리고뉴클레오티드 프로브에 기초한다. 예를 들어 BHQplus 프로브를 사용한 유전자형분석은 다형성 영역을 플랭킹하는 2개의 대립유전자 특이적 프로브 및 2개의 프라이머를 사용하고, 열 순환 동안 폴리머라제는 DNA에 결합된 대립유전자-특이적 프로브를 만나 형광 신호를 방출한다. 대립유전자 구별은 2개의 대립유전자-특이적 BHQPlus 프로브의 경쟁적 결합을 수반한다 (또한 biosearchtech.com 참조).
유전자형분석 검정의 예는 경쟁적 대립유전자-특이적 PCR 및 종점 형광 검출에 기반한 KASP-검정 (LGC에 의한, www LGCgenomics.com 및 또한 www biosearchtech.com/products/ pcr-kits-and-reagents/ genotyping-assays/ kasp-genotyping-chemistry 참조), TaqMan-검정 (어플라이드 바이오시스템즈(Applied Biosystems)) (이는 또한 PCR 기반임), HRM 검정 (고분해능 용융 검정) (여기서 대립유전자-특이적 프로브는 실시간 PCR을 사용하여 검출됨), 또는 rhAmp 검정 (Rnase H2-의존적 PCR, BHQplus 유전자형분석, BHQplex CoPrimer 유전자형분석 등에 기반함)이다.
KASP-검정은 또한 문헌 [He C, Holme J, Anthony J. 'SNP genotyping: the KASP assay. Methods Mol Biol. 2014;1145:75-86'] 및 EP1726664B1 또는 US7615620 B2 (참조로 포함됨)에 기재되어 있다. KASP 유전자형분석 검정은 단일 뉴클레오티드 다형성 (SNP) 또는 삽입물 및 결실물 (InDels)을 검출하기 위해 뉴클레오티드 수준에서 발생하는 유전적 변이의 식별 및 측정을 위한 신규의 균질 형광-기반 보고 시스템과 조합된 경쟁적 대립유전자-특이적 PCR의 고유한 형태를 활용한다. KASP 기술은 다양한 장비 플랫폼에서 사용하기에 적합하고, 분석될 수 있는 SNP의 수 및 샘플의 수의 측면에서 유연성을 제공한다. KASP 화학은 96-, 384- 및 1,536-웰 마이크로타이터 플레이트 형식에서 동일하게 잘 기능하고, 인간, 동물 및 식물 유전학 분야의 사용자에 의해 크고 작은 실험실에서 수년에 걸쳐 활용되어 왔다.
TaqMan 유전자형분석 검정은 또한 문헌 [Woodward J. 'Bi-allelic SNP genotyping using the TaqMan® assay.' Methods Mol Biol. 2014;1145:67-74], US5210015 및 US5487972 (본원에 참조로 포함됨)에 기재되어 있다. TaqMan(®) 기술을 통해 대립유전자-특이적 프로브는 공지된 다형성 부위의 신속하고 신뢰가능한 유전자형분석을 위해 활용된다. TaqMan 검정은 단일 뉴클레오티드 다형성, 삽입/결실 및 존재/부재 변이체를 포함하여 다중 변이체 유형의 유전자형분석에 강력하다. 단일 이중-대립유전자 다형성을 쿼리하기 위해, 별개의 형광단으로 라벨링된 2개의 TaqMan 프로브는 주변 표적 영역의 PCR-기반 증폭 동안 상이한 대립유전자에 혼성화하도록 설계된다. PCR의 프라이머 연장 단계 동안, Taq 폴리머라제의 5'-3' 엑소뉴클레아제 활성이 결합된 프로브로부터 형광단을 절단 및 방출한다. PCR의 종료 시, 각 형광단의 방출 강도를 측정하고, 쿼리된 부위에서 대립유전자 결정을 수행할 수 있다.
따라서 서열식별번호: 1 또는 9의 단백질을 코딩하는 WAP5.1 유전자의 야생형 대립유전자 또는 WAP5.1 유전자의 돌연변이체 대립유전자의 존재를 구분할 수 있는 다양한 유전자형분석 검정이 사용될 수 있다. WAP5.1 유전자의 다양한 돌연변이체 대립유전자가 검출될 수 있다. 따라서, 서열식별번호: 4 또는 서열식별번호: 10의 단백질을 코딩하는 돌연변이체 대립유전자 (L528F 돌연변이 포함), 뿐만 아니라 표 1에 기재된 것들 및 기타를 포함하여 WAP5.1 유전자의 임의의 다른 돌연변이체 대립유전자를 검출하기 위한 검정이 설계될 수 있다.
언급된 바와 같이 바람직하게는 이중-대립유전자 유전자형분석 검정, 예를 들어 KASP-검정, TaqMan 검정, BHQplus 검정, PACE 유전자형분석 (월드 와이드 웹 idtdna.com/pages/products/qpcr-and-pcr/genotyping/pace-snp-genotyping-assays 참조) 또는 임의의 다른 이중-대립유전자 유전자형분석 검정이 사용된다.
한 측면에서 상기 방법의 단계 b)에서 유전자형분석 검정은 KASP-검정이다. 그러므로 단계 b)에서 경쟁적 PCR은 2개의 정방향 프라이머 및 1개의 공통 역방향 프라이머를 사용하여 수행된다. 2개의 정방향 프라이머는 게놈 서열 (또는 이의 상보체 가닥)에 상보적인 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 뉴클레오티드를 포함한다. 또한 2개의 정방향 프라이머는 야생형 서열을 대립유전자의 돌연변이체 서열과 구분하는 SNP 또는 INDEL에 대한 특이성을 제공하는 1, 2, 3개 또는 그 초과의 뉴클레오티드 (바람직하게는 프라이머의 3' 말단에)를 포함한다. 이에 의해 2개의 정방향 프라이머는 야생형 대립유전자 또는 돌연변이체 대립유전자에 대한 상이한 결합 특이성 (또는 선호도)을 갖는다. 예를 들어 Fam-프라이머는 예를 들어 야생형 서열의 17개 뉴클레오티드 및 돌연변이체 대립유전자의 뉴클레오티드에 특이적인 1개 뉴클레오티드를 포함할 수 있고, VIC-프라이머는 야생형 대립유전자의 18개 뉴클레오티드 및 야생형 대립유전자의 뉴클레오티드에 특이적인 1개 뉴클레오티드를 포함할 수 있다. KASP-검정은 야생형 대립유전자 및 하나 이상의 뉴클레오티드가 삽입, 결실 또는 대체되어 야생형 대립유전자와 상이한 WAP5.1 유전자의 임의의 돌연변이체 대립유전자를 구분하도록 쉽게 설계될 수 있으며, 따라서 예를 들어 검정은 2개의 대립유전자를 구분하는 임의의 SNP 또는 INDEL에 대해 설계될 수 있다.
유전자형분석 검정, 예컨대 KASP 검정은 또한 2배체 수박 식물 및 식물 부분에 대해 기재된 바와 동일한 방식으로 3배체 또는 4배체 수박 식물 및 식물 부분에서 돌연변이체 및/또는 야생형 WAP5.1 대립유전자를 검출하기 위해 수행될 수 있음을 주목해야 한다.
한 측면에서 WAP5.1 유전자의 돌연변이체 대립유전자는 본원의 다른 곳에 이미 기재된 바와 같이 서열식별번호: 1 또는 9의 야생형 단백질에 대해 삽입, 대체 또는 결실된 하나 이상의 아미노산을 포함하는 단백질을 코딩한다.
따라서, 한 실시양태에서 하기를 포함하는, WAP5.1로 명명된 유전자의 야생형 대립유전자 및/또는 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 수박 식물, 종자 또는 식물 부분을 검출하고 임의로 선택하기 위한 방법이 제공된다:
a) 수박 식물 또는 복수의 식물 (예를 들어, 육종 집단, F2, 역교배 등)의 게놈 DNA를 제공하는 단계,
b) 유전자의 야생형 대립유전자 및/또는 유전자의 돌연변이체 대립유전자의 존재를 검출하기 위해 핵산 증폭 (예를 들어, 대립유전자 특이적 올리고뉴클레오티드 프라이머의 사용을 포함함) 및/또는 핵산 혼성화 (예를 들어, 대립유전자-특이적 올리고뉴클레오티드 프로브의 사용을 포함함)에 기초하여 a)의 게놈 DNA에서 대립유전자의 존재를 구별하거나 구별할 수 있는 검정 (예를 들어, 이중-대립유전자 유전자형분석 검정)을 수행하는 단계로서, 여기서 야생형 대립유전자는 서열식별번호: 1 또는 9의 단백질 (또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.8% 또는 99.9% 동일성을 포함하는 야생형 WAP5.1 단백질)을 코딩하고, 돌연변이체 대립유전자는 서열식별번호: 1 또는 9의 야생형 단백질에 대해 (또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.8% 또는 99.9% 동일성을 포함하는 야생형 WAP5.1 단백질에 대해) 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 단백질을 코딩하는 것인 단계, 및 임의로
c) 돌연변이체 대립유전자의 1 또는 2개 카피를 포함하는 식물, 종자 또는 식물 부분을 선택하는 단계.
단계 b)에서 유전자형분석 검정은 예를 들어 올리고뉴클레오티드 프라이머, 예컨대 PCR (폴리머라제 연쇄 반응) 및 PCR 프라이머, 바람직하게는 대립유전자-특이적 프라이머를 사용하는 핵산 (특히 DNA) 증폭 반응, 및/또는 올리고뉴클레오티드 프로브, 바람직하게는 대립유전자-특이적 프로브를 사용하는 핵산 혼성화에 기초하여 야생형 및 돌연변이체 대립유전자를 구별한다.
프라이머 또는 프로브는 바람직하게는 라벨, 예를 들어 형광 라벨을 포함하거나 꼬리 서열 또는 다른 변형을 포함하도록 변형된다.
한 측면에서, 임의의 상기 방법에서 검정은 하나 이상의 WAP5.1 대립유전자 특이적 프라이머 또는 하나 이상의 WAP5.1 대립유전자 특이적 프로브를 사용한다. 언급된 바와 같이, 서열식별번호: 7 또는 14의 게놈 서열 또는 서열식별번호: 1 또는 9의 단백질을 코딩하는 다른 (예를 들어, 축퇴) 게놈 서열 또는 예를 들어 서열식별번호: 1 또는 9와 비교하여 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 단백질을 코딩하는 돌연변이체 대립유전자의 게놈 서열에 기초하여, PCR 프라이머 및 핵산 프로브는 올리고뉴클레오티드 설계를 위한 공지된 방법 또는 소프트웨어 프로그램을 사용하여 설계될 수 있다. 프라이머 및 프로브는 예를 들어 길이가 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24개 또는 그 초과의 뉴클레오티드 (염기)일 수 있고, 주형 DNA 서열에 어닐링 (또는 혼성화)하며, 즉 이들은 바람직하게는 표적 서열에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 야생형 대립유전자 또는 돌연변이체 대립유전자에 대한 프라이머 또는 프로브 특이성은 프라이머 또는 프로브의 적어도 1, 2, 3개 또는 그 초과의 뉴클레오티드가 대립유전자에 대해 특이적이기 때문이다. 그러므로 프라이머 또는 프로브는 표적 유전자의 2개의 대립유전자 사이의 다형성 (예를 들어, SNP 또는 InDel) 주위에 설계되어 이들을 구별한다. 한 측면에서 검정은 예를 들어 KASP-검정, TaqMan-검정, BHQplus 프로브 검정 또는 임의의 다른 이중-대립유전자 유전자형분석 검정으로부터 선택된 이중-대립유전자 유전자형분석 검정이다.
한 측면에서, 돌연변이체 대립유전자는 대립유전자의 코딩 영역에서 삽입 또는 복제된 적어도 하나의 코돈, 또는 또 다른 코돈으로 변화된 적어도 하나의 코돈 (예를 들어, 단일 뉴클레오티드 변화를 통해), 또는 결실되거나 정지 코돈으로 변화된 적어도 하나의 코돈을 포함한다.
임의의 상기 방법에서, 한 측면에서 돌연변이체 대립유전자는 표 1에 기재된 바와 같은 단백질을 코딩한다. 그러므로, 한 측면에서 방법은 서열식별번호: 1 또는 9의 단백질을 코딩하는 야생형 WAP5.1 대립유전자의 2개 카피, 표 1의 돌연변이체 단백질을 코딩하는 돌연변이체 WAP5.1 대립유전자의 2개 카피, 또는 각 대립유전자의 1개 카피 (이형접합성)를 포함하는 식물, 종자 또는 식물 부분을 구별하기 위해 사용될 수 있다. 임의로 이들 유전자형 중 임의의 것을 포함하는 식물, 식물 부분 또는 종자는 예를 들어 추가 육종을 위해 또는 수박 생산에서 사용하기 위해 선택될 수 있다.
임의의 DNA 유전자형분석 검정이 상기 방법에서 사용될 수 있지만 (PCR 기반 (PCR 프라이머 사용) 및/또는 혼성화 기반 (프로브 사용)), 한 측면에서 KASP-검정은 야생형 및 돌연변이체 대립유전자를 구별하기 위해 사용된다. 검정은 높은 처리량 방식으로, 예를 들어 96 웰 플레이트 또는 그 초과의 웰 플레이트 (예를 들어, 384 웰 플레이트)에서 사용될 수 있다.
한 측면에서 검정은 서열식별번호: 8의 뉴클레오티드 61에서 C/T SNP를 구별한다. 따라서 프라이머 또는 프로브는 서열식별번호: 8의 뉴클레오티드 61에서 C 또는 T를 포함하는 대립유전자를 검출한다.
야생형 및 돌연변이체 WAP5.1 대립유전자 사이의 SNP 또는 INDEL에 따라, 검정에서 사용하기 위한 다양한 대립유전자-특이적 프라이머 및 프로브를 설계할 수 있다.
한 측면에서 2개의 정방향 프라이머 (하나는 야생형 대립유전자에 대한 것이고 하나는 돌연변이체 대립유전자에 대한 것임) 및 1개의 공통 역방향 프라이머 (둘 다 야생형 및 돌연변이체 대립유전자에 대한 것임)가 KASP-검정에서 사용된다. 한 측면에서 2개의 정방향 프라이머 및 역방향 프라이머는 게놈 WAP5.1 서열 또는 이의 상보체 서열의 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19개 또는 그 초과의 뉴클레오티드를 포함한다. 정방향 프라이머는 야생형 대립유전자의 증폭 또는 돌연변이체 대립유전자의 증폭에 대한 특이성 (또는 선호도)을 부여하는 적어도 1, 2 또는 3개의 뉴클레오티드 (바람직하게는 프라이머의 3' 말단에)를 추가로 포함한다. 각 정방향 프라이머는 공통 역방향 프라이머와 프라이머 쌍을 형성하여 열 순환 동안 프라이머 쌍 사이의 표적 대립유전자의 DNA 서열을 증폭시킨다. 열 순환을 위한 표준 구성성분이 사용되고, KASP-검정을 위한 표준 구성성분이 사용된다.
또 다른 실시양태에서 하기를 포함하는, WAP5.1로 명명된 유전자의 야생형 대립유전자 및/또는 돌연변이체 대립유전자의 혼성화 생성물 또는 증폭 생성물을 생산하는 방법이 제공된다:
a) 수박 식물 또는 복수의 식물 (예를 들어, 육종 집단, F2, 역교배 등)의 게놈 DNA를 제공하는 단계,
b) a)의 게놈 DNA에서 대립유전자의 존재를 구별하거나 구별할 수 있는 검정 (예를 들어, 이중-대립유전자 유전자형분석 검정)을 수행하는 단계로서, 상기 검정은 핵산 증폭 생성물을 생성하고/거나 (예를 들어, 생성물을 생성하기 위한 대립유전자 특이적 올리고뉴클레오티드 프라이머의 사용을 통해), 상기 검정은 핵산 혼성화 생성물을 생성하고 (예를 들어, 혼성화 생성물을 생성하기 위한 대립유전자-특이적 올리고뉴클레오티드 프로브의 사용을 통해), 여기서 증폭 생성물 또는 혼성화 생성물은 DNA에서 유전자의 야생형 대립유전자 및/또는 유전자의 돌연변이체 대립유전자의 존재를 나타내며, 여기서 야생형 대립유전자는 서열식별번호: 1 또는 9의 단백질을 코딩하고, 돌연변이체 대립유전자는 서열식별번호: 1 또는 9의 야생형 단백질에 대해 삽입, 복제, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 단백질을 코딩하는 것인 단계, 및 임의로
c) 돌연변이체 대립유전자의 1 또는 2개 카피를 포함하는 식물, 종자 또는 식물 부분을 선택하는 단계.
또한, 수박 식물, 식물 부분 또는 종자로부터 유래된 게놈 DNA 샘플로부터 돌연변이체 및/또는 야생형 WAP5.1 대립유전자의 전부 또는 일부를 증폭시키는 방법이 제공되며, 상기 방법은 샘플에서 돌연변이체 WAP5.1 또는 야생형 WAP5.1 대립유전자의 전부 또는 일부를 증폭시키는 프라이머 쌍과 게놈 DNA를 접촉시키는 단계, 및 증폭 생성물을 검출하는 단계를 포함한다.
또한, 수박 식물, 식물 부분 또는 종자로부터 유래된 게놈 DNA 샘플에서 돌연변이체 및/또는 야생형 WAP5.1 대립유전자에 프로브를 혼성화하는 방법이 제공되며, 상기 방법은 샘플에서 돌연변이체 WAP5.1 또는 야생형 WAP5.1 대립유전자에 혼성화하는 올리고뉴클레오티드 프로브와 게놈 DNA를 접촉시키는 단계, 및 혼성화 생성물을 검출하는 단계를 포함한다.
상기 및 본원의 다른 곳에 기재된 모든 실시양태는 또한 이들 실시양태에 적용된다. 그러므로 증폭 생성물은 예를 들어 DNA 샘플에서 돌연변이체 및/또는 야생형 대립유전자를 검출하기 위한 KASP 검정 또는 다른 검정에서 생성된 PCR 증폭 생성물, 예를 들어 경쟁적 PCR 증폭 생성물일 수 있다. 그러므로 혼성화 생성물은 DNA 샘플에서 돌연변이체 및/또는 야생형 대립유전자를 검출하기 위해 DNA 샘플에서 핵산에 혼성화하는 올리고뉴클레오티드 프로브의 혼성화 생성물일 수 있다. 프라이머 쌍 또는 프로브는 바람직하게는 대립유전자 특이적이고, 그러므로 생성물은 야생형 대립유전자의 2개 카피, 돌연변이체 대립유전자의 2개 카피 또는 수박 식물, 식물 부분 또는 종자의 게놈 DNA에 존재하는 각각의 1개 카피로서 구별가능하다.
프라이머 또는 프로브는 바람직하게는 변형되며, 예를 들어 꼬리 서열 또는 형광 라벨에 의해 라벨링되거나, 증폭 또는 혼성화하는 야생형 서열과 관련하여 달리 변형된다.
기재된 방법은 식물, 식물 부분 또는 종자의 게놈 DNA에서 돌연변이체 및/또는 야생형 대립유전자의 검출을 필요로 하기 때문에, 게놈 DNA는 검출을 위해 접근가능할 필요가 있으며, 예를 들어 이는 DNA 추출 방법을 사용하여 식물 세포로부터 추출될 수 있거나, 적어도 손상된 세포로부터 용액 (예를 들어, 완충 용액)으로 용리될 수 있다.
다른 쿠쿠르비타세아에의 오르토로그 유전자가 본원에 제공되기 때문에, 상기 방법은 또한 다른 종, 특히 오이 및 멜론에서 다른 WAP5.1 유전자 및 대립유전자에 적용될 수 있다.
한 측면에서, 따라서, 하기 단계를 포함하는, 수박, 오이 또는 멜론 식물, 종자, 식물 부분, 세포 또는 조직의 유전자형분석을 위한 유전자형분석 검정이 제공된다:
a) 하나 이상의 수박, 오이 또는 멜론 식물 또는 식물 집단 (예를 들어, 육종 집단, F2 집단, 역교배 집단 등)의 게놈 DNA를 제공하는 단계, 및
b) 서열식별번호: 1 또는 9의 단백질 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (수박 야생형 WAP5.1 단백질) 또는 서열식별번호: 2 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (오이 야생형 WAP5.1 단백질) 또는 서열식별번호: 3 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (멜론 야생형 WAP5.1 단백질)을 코딩하는 야생형 대립유전자의 존재 및/또는 돌연변이체 대립유전자의 존재를 검출할 수 있는 (또는 검출하는) 유전자형분석 검정을 수행하는 단계로서, 여기서 돌연변이체 대립유전자는 서열식별번호: 1 또는 9 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해), 또는 서열식별번호: 2 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해) 또는 서열식별번호: 3 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해)에 대해 삽입, 결실, 대체 또는 복제된 하나 이상의 아미노산을 포함하는 것인 단계, 및 임의로
c) 야생형 대립유전자의 2개 카피, 또는 야생형 대립유전자의 1개 카피 및 돌연변이체 대립유전자의 1개 카피, 또는 돌연변이체 대립유전자의 2개 카피를 포함하는 식물, 종자, 식물 부분, 세포 또는 조직을 선택하는 단계.
그러므로, 하기를 포함하는, ClWAP5.1 (시트룰루스 라나투스 WAP5.1), CsWAP5.1 (쿠쿠미스 사티부스 WAP5.1) 또는 CmWAP5.1 (쿠쿠미스 멜로 WAP5.1)로 명명된 유전자의 야생형 대립유전자 및/또는 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 수박, 오이 또는 멜론 식물, 종자 또는 식물 부분을 검출하고 임의로 선택하기 위한 방법이 제공된다:
a) 유전자의 야생형 대립유전자 및/또는 유전자의 돌연변이체 대립유전자의 존재를 검출하기 위해 핵산 증폭 및/또는 핵산 혼성화에 기초하여 WAP5.1 대립유전자를 검출 또는 구별하는 검정을 적어도 하나의 식물로부터 수득된 게놈 DNA 샘플에 대해 수행하는 단계로서, 여기서 야생형 대립유전자는 서열식별번호: 1 또는 9의 단백질 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (수박에서), 서열식별번호: 2 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (오이에서) 및 서열식별번호: 3 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (멜론에서)을 코딩하고, 돌연변이체 대립유전자는 서열식별번호: 1 또는 9 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해), 서열식별번호: 2 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해) 또는 서열식별번호: 3 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해)에 대해 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 것인 단계, 및 임의로
b) 돌연변이체 대립유전자의 1 또는 2개 카피를 포함하는 식물, 종자 또는 식물 부분을 선택하는 단계.
추가로, 하기를 포함하는, WAP5.1 유전자의 유전자형을 결정하고 임의로 특정 유전자형, 예를 들어 ClWAP5.1 (시트룰루스 라나투스 WAP5.1), CsWAP5.1 (쿠쿠미스 사티부스 WAP5.1) 또는 CmWAP5.1 (쿠쿠미스 멜로 WAP5.1)로 명명된 유전자의 야생형 대립유전자 및/또는 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 수박, 오이 또는 멜론 식물, 종자 또는 식물 부분을 선택하기 위한 방법이 제공된다:
a) 하나 이상의 식물로부터 수득된 하나 이상의 게놈 DNA 샘플에 대해 이중-대립유전자 유전자형분석 검정을 수행하는 단계로서, 여기서 상기 유전자형분석 검정은 WAP5.1 대립유전자-특이적 프라이머 및/또는 WAP5.1 대립유전자-특이적 프로브에 기초하여 WAP5.1 대립유전자를 검출 또는 구별하며, 상기 대립유전자 특이적 프라이머 또는 대립유전자 특이적 프로브는 유전자의 야생형 대립유전자 또는 유전자의 돌연변이체 대립유전자의 존재를 검출하며, 여기서 야생형 대립유전자는 서열식별번호: 1 또는 9의 단백질 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (수박에서), 서열식별번호: 2 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (오이에서) 및 서열식별번호: 3 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (멜론에서)을 코딩하고, 돌연변이체 대립유전자는 서열식별번호: 1 또는 9 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해), 서열식별번호: 2 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해) 또는 서열식별번호: 3 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해)에 대해 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 것인 단계, 및 임의로
b) 돌연변이체 대립유전자의 1 또는 2개 카피를 포함하는 하나 이상의 식물, 종자 또는 식물 부분을 선택하는 단계.
이러한 검정은 예를 들어 특정 유전자형을 포함하는 식물, 예를 들어 WAP5.1 유전자의 야생형 대립유전자에 대해 동형접합성, WAP5.1 대립유전자의 돌연변이체 대립유전자에 대해 동형접합성 또는 이형접합성인 식물을 선택하기 위한 육종 프로그램에서 식물의 마커 보조 선택 (MAS)을 위해 사용될 수 있다.
따라서, 또한 수박, 오이 또는 멜론 식물의 육종 방법이 본원에 제공되며, 상기 방법은 게놈 내의 WAP5.1 로커스에서 대립유전자 조성에 대해 하나 이상의 식물을 유전자형분석하는 단계 및 임의로 WAP5.1 로커스에 특이적 유전자형을 갖는 하나 이상의 식물을 선택하는 단계를 포함한다. 한 측면에서 또한 시퀀싱에 의한 유전자형분석은 WAP5.1 유전자에 대해 수행될 수 있다.
언급된 바와 같이, 임의로 돌연변이체 WAP5.1 대립유전자의 2개 카피를 포함하는 식물 또는 종자는 성장되고 통성 단위결과에 대해 표현형분석될 수 있다. 돌연변이체 대립유전자는 한 측면에서 동형접합 형태로 통성 단위결과를 부여하는 돌연변이체 대립유전자이다.
상이한 측면에서 수박에서 ClWAP5.1, 오이에서 CsWAP5.1 및 멜론에서 CmWAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 수박, 오이 또는 멜론 식물, 종자 또는 식물 부분이 제공되며, 여기서 상기 돌연변이체 대립유전자는
a) 야생형 대립유전자와 비교하여 대립유전자의 발현 없음 또는 감소된 발현을 초래하는 조절 요소에 하나 이상의 돌연변이를 포함하고/거나,
b) 야생형 단백질과 비교하여 대체, 삽입 또는 결실된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하고,
여기서 a) 또는 b)의 상기 돌연변이체 대립유전자는 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 부여하고 (동형접합 형태의 야생형 대립유전자를 포함하는 식물과 비교하여), 여기서 야생형 수박 ClWAP5.1 대립유전자는 서열식별번호: 1 또는 9의 단백질 또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 포함하는 단백질을 코딩하며, 여기서 야생형 오이 CsWAP5.1 대립유전자는 서열식별번호: 2의 단백질 또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 포함하는 단백질을 코딩하고, 여기서 야생형 멜론 CmWAP5.1 대립유전자는 서열식별번호: 3의 단백질 또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 포함하는 단백질을 코딩한다.
육종 방법
추가로, 본원에 기재된 바와 같은 적어도 하나의 돌연변이체 WAP5.1 대립유전자를 포함하는 식물을 예를 들어 돌연변이체 WAP5.1 대립유전자가 결여된 식물과 교배시키는 방법이 제공되고, 돌연변이체 WAP5.1 대립유전자의 적어도 하나의 카피를 포함하는 자손을 선택하는 방법이 제공된다.
그러므로, 한 측면에서 하기 단계를 포함하는, 수박, 오이 또는 멜론 식물을 생성하는 방법이 제공된다:
a) 기재된 바와 같은 돌연변이체 WAP5.1 대립유전자의 적어도 하나의 카피를 포함하는 수박, 오이 또는 멜론 식물을 제공하는 단계;
b) 상기 수박, 오이 또는 멜론 식물을 또 다른 수박, 오이 또는 멜론 식물과 교배시켜 F1 종자를 생산하는 단계;
c) 임의로 F1 종자로부터 성장된 수박 식물을 1회 이상 자가생식시켜 F2, F3 또는 추가 세대 자가생식 자손을 생산하는 단계;
d) 상기 F1 또는 추가 세대 자가생식 자손을 단계 b)의 식물과 교배시켜 역교배 자손을 생산하는 단계;
e) 단계 a)의 돌연변이체 WAP5.1 대립유전자를 포함하는 역교배 자손을 선택하는 단계.
임의로 단계 e)의 식물은 돌연변이체 WAP5.1 대립유전자의 2개 카피를 포함하고 통성 단위결과성이다.
임의로 임의의 단계에서 돌연변이체 WAP5.1 대립유전자의 존재의 선택 또는 검출은 분자 방법, 예컨대 SNP 또는 INDEL 유전자형분석, 시퀀싱 등을 사용하여 수행될 수 있다.
바람직하게는 단계 a)에서 대립유전자는 동형접합 형태인 경우에 통성 단위결과를 부여하는 돌연변이체 대립유전자이다. 한 측면에서 단계 a)에서 식물은 이형접합 또는 동형접합 형태의 표 1의 돌연변이체 대립유전자를 포함하는 수박 식물이다.
또한, 하기 단계를 포함하는, 수박 식물의 생산 방법이 제공된다:
a) 수박 식물 집단에 돌연변이를 도입하거나, 또는 돌연변이유발된 수박 식물 집단, 예를 들어 M2, M3 또는 추가 세대의 TILLING 집단을 제공하는 단계,
b) WAP5.1 단백질을 코딩하는 대립유전자에 돌연변이를 갖는 식물을 식별하는 단계로서, 여기서 유전자의 야생형 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질에 대해 적어도 95% 서열 동일성을 포함하는 WAP5.1 단백질을 코딩한다.
상기 방법은 하기 단계 중 하나 또는 둘 다를 추가로 포함할 수 있다:
단계 b)의 돌연변이체 대립유전자의 적어도 2개 카피를 포함하는 식물을 선택하는 단계,
수분의 부재 하에 식물이 과실을 생산하는지 결정하는 단계.
추가로, 제공된 서열에 대해 적어도 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 서열과 같이, 임의의 서열 및 서열의 분자가 포함된다. 또한 임의의 단편 및/또는 변형된 서열 (예를 들어, 서열 또는 상보체 서열의 적어도 10, 15, 16, 17, 18, 19, 20개 또는 그 초과의 뉴클레오티드를 포함하는 프라이머 또는 프로브) 및 육종 (예를 들어, MAS) 또는 식물 또는 식물 부분의 검출 또는 선택에서의 이들의 용도가 제공된다.
돌연변이체 단백질이 기재될 때, 단백질에서의 돌연변이를 유발하는 돌연변이를 코딩하는 게놈 서열 및 mRNA 또는 cDNA 서열은 본원에 포함되고, 아미노산 변화를 유발하는 돌연변이를 포함하는 게놈 내의 대립유전자를 검출하고 예를 들어 돌연변이체 대립유전자에 지정된 유전자형분석 검정을 수행하기 위해 사용될 수 있다는 것은 명백하다.
서열 설명
서열식별번호: 1: 수박의 야생형 WAP5.1 단백질.
서열식별번호: 2: 오이의 야생형 WAP5.1 단백질.
서열식별번호: 3: 멜론의 야생형 WAP5.1 단백질.
서열식별번호: 4: 돌연변이체 수박 WAP5.1 단백질, 여기서 아미노산 L (류신) 528은 F (페닐알라닌)에 의해 대체된다.
서열식별번호: 5: 서열식별번호: 4의 돌연변이체 WAP5.1 단백질을 코딩하는 cDNA.
서열식별번호: 6: 서열식별번호: 1의 야생형 WAP5.1 단백질을 코딩하는 cDNA.
서열식별번호: 7: 서열식별번호: 1의 야생형 WAP5.1 단백질을 코딩하는 게놈 DNA.
서열식별번호: 8: 돌연변이체 wap5.1 대립유전자 또는 야생형 Wap5.1 대립유전자를 검출하기 위한 뉴클레오티드 61 (C/T)에 있는 SNP 마커 (mwm23348429). 야생형 대립유전자에서 코돈 CTT는 류신, 서열식별번호: 1 또는 서열식별번호: 9의 L528, 또는 서열식별번호: 2의 L535 또는 서열식별번호: 3의 L538을 코딩한다. 돌연변이체 대립유전자에서 C는 T로 변화되고 (C→T), 생성된 돌연변이된 코돈 TTT는 L, 류신 대신 F, 페닐알라닌을 코딩한다. 그러므로 서열식별번호: 8 또는 서열식별번호: 8에 대해 적어도 92%, 93%, 94%, 95% 또는 그 초과의 서열 동일성을 포함하는 서열의 뉴클레오티드 61에 T를 포함하는 SNP 마커는 돌연변이체 wap5.1 대립유전자를 검출하기 위해 사용될 수 있는 반면, 서열식별번호: 8, 또는 서열식별번호: 8에 대해 적어도 92%, 93%, 94%, 95% 또는 그 초과의 서열 동일성을 포함하는 서열의 뉴클레오티드 61에 C를 포함하는 SNP 마커는 야생형 wap5.1 대립유전자를 검출하기 위해 사용될 수 있다.
서열식별번호: 9: 수박 계통 TY의 야생형 수박 WAP5.1 단백질의 단백질 서열; 아미노산 51이 R (Arg)임을 주목한다.
서열식별번호: 10: 계통 TY에 존재하는 돌연변이체 수박 WAP5.1 단백질, 여기서 아미노산 L (류신) 528은 F (페닐알라닌)에 의해 대체된다.
서열식별번호: 11: 서열식별번호: 9의 야생형 단백질을 코딩하는 cDNA.
서열식별번호: 12: 서열식별번호: 10의 돌연변이체 단백질을 코딩하는 cDNA.
서열식별번호: 13: F-박스 도메인.
서열식별번호: 14: 서열식별번호: 9의 야생형 단백질을 코딩하는 게놈 DNA.
실시예
수박 돌연변이체 집단 (TY라고 불리는 엘리트 계통의 EMS 처리를 통해 발달됨)은 칠레에서 정방향 스크리닝 접근법으로 스크리닝되었으며, 곤충 방지 온실에서 수분 없이 과실을 생산한 하나의 돌연변이체가 발견되었다.
단위결과성 과실을 생산할 수 있는 단일 식물을 선택하고, 상이한 유전적 배경에서 여러 F2 맵핑 집단을 만드는데 사용하였다. 한 집단에서 QTL은 염색체 5 상의 0.47 Mb/8.2 cM 영역에 맵핑되었다. 이 간격 내에 2개의 돌연변이가 있었으며: 제1 돌연변이는 유전자간 영역에 있었고, 제2 돌연변이는 본원에서 wap5.1로 명명된 유전자에서 고도로 보존된 아미노산을 류신 (L)에서 페닐알라닌 (L528F)으로 변화시켰다.
이 돌연변이체 wap5.1 대립유전자는 93개의 전체 게놈 재시퀀싱된 계통과 비교할 때 이 계통에 완전히 고유한 것으로 밝혀졌다.
염색체 5 간격을 포화시키는 마커를 설계하고, F2 집단에서 실행하였다. 형질과 가장 높은 연관성을 갖는 마커인 mWM23348429는 wap5.1 유전자에서의 비동의 돌연변이에 대해 설계되었다. 이 돌연변이를 확인하기 위해, 추가 92개의 F2 식물을 mWM23348429 및 플랭킹 마커로 유전자형분석하였다. 가장 높은 연관된 마커는 mWM23348429였으며, 이는 이 마커가 설계된 돌연변이가 형질의 근본임을 추가로 확인하였다.
wap5.1 유전자는 단일 열성 유전자이고, 돌연변이에 대해 동형접합성인 식물 (wap5.1/wap5.1)에서 돌연변이체 wap5.1 대립유전자와 공동-격리된 통성 단위결과성 표현형이다.
RaptorX 접촉 예측을 야생형 및 돌연변이체 Wap5.1 단백질에 대해 수행하였으며, 이는 L528F 돌연변이가 야생형 단백질과 비교하여 LRR-도메인의 잘못된 3차원 단백질 폴딩을 유발하여, 필시 정상적인 생체내 단백질 기능을 유의하게 감소시키거나 심지어 정상적인 생체내 기능을 완전히 폐지할 가능성이 높다는 것을 보여준다. LRR-도메인은 단백질-단백질 상호작용에 관여할 가능성이 높기 때문에, 이 고도로 정렬되고 고도로 보존된 단백질 도메인의 작은 구조적 변화가 기능에 유의한 영향을 미칠 수 있다.
BLAST 분석을 사용하여 Wap5.1 유전자의 오르토로그를 식별하였다. 오이 및 멜론 단백질은 3개의 쿠쿠르비타세아에 종 모두에서 동일한 F-박스 도메인을 함유하였다. 또한 LRR-도메인은 고도로 보존되었다. 대부분의 아미노산 변이는 F-박스 도메인 앞에 있는 N-말단 단백질 부분에 있는 것으로 밝혀졌다.
추가로, wap5.1 유전자의 돌연변이체가 돌연변이체 수박 집단에서 식별되었으며 (표 1 참조), 돌연변이체 대립유전자에 대해 동형접합성인 식물에서 이들의 표현형에 대해 테스트될 것이다.
추가로, 야생형 배경 수박 계통 TY 및 돌연변이체 wap5.1 계통 (TY 배경에서 생성됨)에서 WAP5.1 유전자의 게놈 서열을 살펴보면, 위치 51에 있는 아미노산이 찰스턴 그레이 참조 게놈에서 발견되는 G (Gly; 글리신, 서열식별번호: 6의 뉴클레오티드 151 내지 153에 있는 코돈 GGT)가 아닌 R (Arg; 아르기닌, 서열식별번호: 11 및 12의 뉴클레오티드 151 내지 153에 있는 코돈 CGT)임이 밝혀졌다. R51은 계통 TY의 야생형 WAP5.1 단백질 및 돌연변이체 wap5.1 단백질 (L528F 치환 포함) 둘 다에서 발견된다. 또한 동일한 R51이 본원에서 앞서 기재된 바와 같이 수박 97103 게놈의 야생형 WAP5.1 단백질에서 발견되었다.
또한, TY-계통에서 S450 (세린 450)은 서열식별번호: 11 및 12의 뉴클레오티드 1348 내지 1350에 있는 코돈 AGC에 의해 코딩되는 반면, 찰스턴 그레이 참조 게놈에서 S450은 서열식별번호: 6의 뉴클레오티드 1348 내지 1350에 있는 코돈 AGT에 의해 코딩된다. 계통 TY의 야생형 WAP5.1 단백질은 본원에서 서열식별번호: 9에 제공되고, 계통 TY의 야생형 WAP5.1 단백질을 코딩하는 cDNA는 본원에서 서열식별번호: 11에 제공된다. cDNA는 cucurbitgenomics.org 데이터베이스에서 발견되는 품종 97103 V2의 cDNA와 동일하다. 야생형 WAP5.1 단백질을 코딩하는 서열식별번호: 14의 게놈 서열은 수박 품종 97103 V2 데이터베이스로부터 수득된다.
TY 돌연변이체 집단에서 발견되고 L528F 아미노산 치환을 포함하는 돌연변이체 wap5.1 단백질은 본원에서 서열식별번호: 10에 제공된다. 마찬가지로 이 돌연변이체 단백질을 코딩하는 cDNA는 서열식별번호: 12에 제공된다.
서열식별번호: 1의 야생형 WAP5.1 단백질 (찰스턴 그레이 게놈) 및 서열식별번호: 9의 야생형 WAP5.1 단백질 (TY-계통 및 수박 97103 게놈)은 서로에 대해 99.9% 서열 동일성을 포함하며, 쌍별 정렬된 경우에 단일 아미노산만이 상이하기 때문이다.
서열식별번호: 1의 야생형 WAP5.1 단백질 (찰스턴 그레이 게놈)을 코딩하는 cDNA 및 서열식별번호: 9의 야생형 WAP5.1 단백질 (TY 계통)을 코딩하는 cDNA는 또한 99.9% 서열 동일성을 포함하며, 2개의 뉴클레오티드가 상이하다.
돌연변이체 wap5.1 대립유전자 (L528F 치환 포함)에 대해 동형접합성인 수박 식물은 정상적인 성장 및 형태를 가졌다. 식물의 성장 및 발달 동안 이상은 관찰되지 않았다. 동형접합성 wap5.1 돌연변이체 식물에서 볼 수 있는 유일한 표현형 차이는 수분의 부재 하에 발달한 성숙 과실이 한쪽 끝에 약간 삼각형 형상을 가졌다는 것이다 (도 5 참조). 그러나, 이것이 돌연변이의 효과인지 배경 효과인지는 명확하지 않다.
SEQUENCE LISTING
<110> Nunhems B.V.
<120> Parthenocarpic watermelon plants
<130> 202259WO01
<150> EP20201337.1
<151> 2020-10-12
<150> US63111898
<151> 2020-11-10
<150> US63117223
<151> 2020-11-23
<160> 14
<170> PatentIn version 3.5
<210> 1
<211> 1033
<212> PRT
<213> artificial
<220>
<223> Wild type watermelon WAP5.1 protein
<400> 1
Met Thr Ile Trp Cys Cys Leu Cys Phe Thr Val Gly Glu Glu Asp Glu
1 5 10 15
Arg Glu Arg Glu Glu Glu Leu Lys Lys Glu Gly Glu Met Lys Pro Met
20 25 30
Met Arg Glu Glu Val Phe Glu Asn Gln Asp Asp Ser Asp Arg Ile Val
35 40 45
Arg Asn Gly Asp Asp Ser Gln Gly Ser Asn Pro Leu Pro Ile Ala Val
50 55 60
Asp Asp Ala Pro Asp Arg His Asp Gly Asp Arg Leu Arg Leu Phe Glu
65 70 75 80
Asp Met Val Arg Ala Met His Asp Gly Ala Asp Gly Gly Gly Ala His
85 90 95
Trp Asp Asp Glu Leu Arg Gly Gly Gly Gly Gly Ala Ile Asn Pro Trp
100 105 110
Asn Phe Ser Phe Gly Ile Leu His Gln Ser Glu Gly Gly Glu Ser Ser
115 120 125
Ser Ala Ser Ala Leu Ser Leu Ser Ser Thr Val Glu Thr Ser Asn Glu
130 135 140
Glu Arg Asp Arg Asp Ala Asn His Lys Arg Ala Lys Val Leu Ser Lys
145 150 155 160
Phe Thr Glu Ser Ser Phe Ala Thr Pro Trp Pro Leu Gly Ala Gly Asn
165 170 175
Pro Met Arg Asp Tyr Asp Phe Ile His Gly Ser Ser Ser Ile Met Ser
180 185 190
Arg Asn Glu Phe Leu Tyr His Ala Ser Thr Ser Cys Arg Val Asp Glu
195 200 205
Asp Leu Glu Ser Ser Phe Gly Arg Asp Asp Gly Ile Asn Asp Asn Asp
210 215 220
Thr Cys Lys Ser Glu Gly Phe Glu Val Arg Met Asp Leu Thr Asp Asp
225 230 235 240
Leu Leu His Met Val Phe Ser Phe Leu Asp His Ile Asn Leu Cys Arg
245 250 255
Ala Ala Ile Val Cys Arg Gln Trp Gln Ala Ala Ser Ala His Glu Asp
260 265 270
Phe Trp Arg Cys Leu Asn Phe Glu Asn Arg Asn Ile Ser Met Glu Gln
275 280 285
Phe Glu Asp Met Cys Gly Arg Tyr Pro Asn Ala Thr Glu Val Asn Ile
290 295 300
Ser Gly Val Pro Ala Val His Leu Leu Ala Met Lys Ala Val Ser Ser
305 310 315 320
Leu Arg His Leu Glu Val Leu Thr Leu Gly Arg Gly Gln Leu Ala Asp
325 330 335
Asn Phe Phe His Ala Leu Thr Asp Cys His Leu Leu Lys Ser Leu Thr
340 345 350
Val Asn Asp Ser Thr Leu Val Asn Val Thr Gln Glu Ile Pro Ile Ser
355 360 365
His Asp Arg Leu Arg His Leu His Leu Thr Lys Cys Arg Val Ile Arg
370 375 380
Ile Ser Val Arg Cys Pro Gln Leu Glu Thr Leu Ser Leu Lys Arg Ser
385 390 395 400
Asn Met Ala Gln Ala Val Leu Asn Cys Pro Leu Leu Arg Asp Leu Asp
405 410 415
Ile Gly Ser Cys His Lys Leu Ser Asp Ala Ala Ile Arg Ser Ala Ala
420 425 430
Ile Ser Cys Pro Gln Leu Glu Ser Leu Asp Met Ser Asn Cys Ser Cys
435 440 445
Val Ser Asp Glu Thr Leu Arg Glu Ile Ser Ala Asn Cys Pro Asn Leu
450 455 460
Gln Leu Leu Asn Ala Ser Tyr Cys Pro Asn Ile Ser Leu Glu Ser Val
465 470 475 480
Arg Leu Thr Met Leu Thr Val Leu Lys Leu His Ser Cys Glu Gly Ile
485 490 495
Thr Ser Ala Ser Met Thr Ala Ile Ser Ser Ser Ser Gly Leu Lys Val
500 505 510
Leu Glu Leu Asp Asn Cys Ser Leu Leu Thr Ser Val Ser Leu Asp Leu
515 520 525
Pro His Leu Gln Asn Ile Arg Leu Val His Cys Arg Lys Phe Ser Asp
530 535 540
Leu Ser Leu Gln Ser Val Lys Leu Ser Ser Ile Met Val Ser Asn Cys
545 550 555 560
Pro Ser Leu His Arg Ile Asn Ile Thr Ser Asn Leu Leu Gln Lys Leu
565 570 575
Val Leu Lys Lys Gln Glu Ser Leu Ala Lys Leu Val Leu Gln Cys Pro
580 585 590
Ser Leu Gln Asp Val Asp Leu Thr Asp Cys Glu Ser Leu Thr Asn Ser
595 600 605
Ile Cys Glu Val Phe Ser Asp Gly Gly Gly Cys Pro Met Leu Lys Ser
610 615 620
Leu Val Leu Asp Asn Cys Glu Ser Leu Thr Ala Val Arg Phe Cys Ser
625 630 635 640
Ser Ser Leu Gly Ser Leu Ser Leu Val Gly Cys Arg Ala Ile Thr Ser
645 650 655
Leu Glu Leu Gln Cys Pro Asn Leu Glu Gln Val Ser Leu Asp Gly Cys
660 665 670
Asp His Leu Glu Arg Ala Ser Phe Ser Pro Val Gly Leu Arg Ser Leu
675 680 685
Asn Leu Gly Ile Cys Pro Lys Leu Asn Glu Leu Lys Leu Glu Ala Pro
690 695 700
Arg Met Asp Leu Leu Glu Leu Lys Gly Cys Gly Gly Leu Ser Glu Ala
705 710 715 720
Ala Ile Asn Cys Pro Arg Leu Thr Ser Leu Asp Ala Ser Phe Cys Gly
725 730 735
Gln Leu Lys Asp Glu Cys Leu Ser Ala Thr Thr Ala Ser Cys Pro Gln
740 745 750
Ile Glu Ser Leu Ile Leu Met Ser Cys Pro Ser Val Gly Ser Glu Gly
755 760 765
Leu Tyr Ser Leu Arg Cys Leu Leu Lys Leu Val Val Leu Asp Leu Ser
770 775 780
Tyr Thr Phe Leu Met Ser Leu Gln Pro Val Phe Glu Ser Cys Ile Gln
785 790 795 800
Leu Lys Val Leu Lys Leu Gln Ala Cys Lys Tyr Leu Thr Asp Ser Ser
805 810 815
Leu Glu Pro Leu Tyr Lys Glu Asp Ala Leu Pro Ala Leu Gln Glu Leu
820 825 830
Asp Leu Ser Tyr Gly Thr Leu Cys Gln Ser Ala Ile Glu Glu Leu Leu
835 840 845
Ala Cys Cys Thr His Leu Thr His Val Ser Leu Asn Gly Cys Val Asn
850 855 860
Met His Asp Leu Asn Trp Gly Cys Ser Ile Gly Gln Leu Ser Leu Ser
865 870 875 880
Ser Ile Pro Ile Pro Leu Gly Gln Ala Thr Leu Asp Glu Ile Glu Glu
885 890 895
Pro Val Ala Gln Pro Asn Arg Leu Leu Gln Asn Leu Asn Cys Val Gly
900 905 910
Cys Gln Asn Ile Arg Lys Val Leu Ile Pro Pro Ala Ala Arg Cys Phe
915 920 925
His Leu Ser Ser Leu Asn Leu Ser Leu Ser Ser Asn Leu Lys Glu Val
930 935 940
Asp Val Ser Cys Tyr Asn Leu Cys Phe Leu Asn Leu Ser Asn Cys Cys
945 950 955 960
Ser Leu Glu Val Leu Lys Leu Asp Cys Pro Arg Leu Thr Ser Leu Phe
965 970 975
Leu Gln Ser Cys Asn Ile Glu Glu Glu Val Val Val Ala Ala Val Ser
980 985 990
Arg Cys Ser Met Leu Glu Thr Leu Asp Val Arg Leu Cys Pro Lys Ile
995 1000 1005
Ser Ser Ile Ser Met Val Gln Leu Arg Ile Ala Cys Pro Ser Leu
1010 1015 1020
Lys Arg Ile Phe Ser Thr Leu Ser Pro Thr
1025 1030
<210> 2
<211> 1040
<212> PRT
<213> artificial
<220>
<223> wild type cucumber WAP5.1 ortholog
<400> 2
Met Thr Ile Trp Cys Cys Leu Cys Phe Thr Val Gly Glu Glu Glu Glu
1 5 10 15
Glu Asp Glu Arg Ala Arg Glu Glu Glu Val Lys Lys Glu Glu Gly Glu
20 25 30
Met Lys Pro Met Met Arg Glu Glu Val Phe Glu Asn Gln Asp Asp Ser
35 40 45
Asp Arg Ile Val Arg Asn Gly Asp Asp Ser Gln Gly Ser Asn Pro Leu
50 55 60
Ala Ser Ala Val Asp Asp Val Pro Glu Arg His Asp Gly Asp Arg Leu
65 70 75 80
Arg Leu Phe Glu Asp Met Val Arg Ala Met His Asp Gly Gly Asp Gly
85 90 95
Gly Ala His Trp Asp Asp Glu Leu Arg Gly Ala Gly Ala Gly Gly Gly
100 105 110
Ala Ile Asn Pro Trp Asn Leu Ser Phe Gly Ile Met His Gln Ser Glu
115 120 125
Gly Gly Glu Ser Ser Ser Ala Ser Ala Leu Pro Leu Ser Ser Met Val
130 135 140
Glu Thr Ser Met Glu Glu Arg Asp Arg Asp Ala His His Lys Arg Ala
145 150 155 160
Lys Val His Ser Lys Phe Ile Glu Ser Ser Phe Ala Thr Pro Trp Pro
165 170 175
Leu Gly Ala Gly Asn Pro Met Arg Glu Tyr Asp Phe Ile His Gly Ser
180 185 190
Pro Ser Ile Met Ser Arg Asn Glu Phe Leu Tyr His Ala Ser Thr Ser
195 200 205
Ser Arg Phe Asp Ala Asp Lys Asp Leu Glu Ser Ser Phe Gly Arg Asp
210 215 220
Asp Gly Ile Asn Glu Asn Asp Thr Cys Lys Ser Glu Gly Phe Glu Val
225 230 235 240
Arg Met Asp Leu Thr Asp Asp Leu Leu His Met Val Phe Ser Phe Leu
245 250 255
Asp His Ile Asn Leu Cys Arg Ala Ala Ile Val Cys Arg Gln Trp Gln
260 265 270
Ala Ala Ser Ala His Glu Asp Phe Trp Arg Cys Leu Asn Phe Glu Asn
275 280 285
Lys Asn Ile Ser Met Glu Gln Phe Glu Asp Met Cys Gly Arg Tyr Pro
290 295 300
Asn Ala Thr Glu Val Asn Ile Ser Gly Val Pro Ala Val His Leu Leu
305 310 315 320
Ala Met Lys Ala Val Ser Ser Leu Arg Asn Leu Glu Val Leu Thr Leu
325 330 335
Gly Arg Gly Gln Leu Ala Asp Asn Phe Phe His Ala Leu Ala Asp Cys
340 345 350
His Leu Leu Lys Ser Leu Thr Val Asn Asp Ser Thr Leu Val Asn Val
355 360 365
Thr Gln Glu Ile Pro Ile Ser His Asp Gly Leu Arg His Leu His Leu
370 375 380
Thr Lys Cys Arg Val Ile Arg Ile Ser Val Arg Cys Pro Gln Leu Glu
385 390 395 400
Thr Leu Ser Leu Lys Arg Ser Asn Met Ala Gln Ala Val Leu Asn Cys
405 410 415
Pro Leu Leu Arg Asp Leu Asp Ile Gly Ser Cys His Lys Leu Ser Asp
420 425 430
Ala Ala Ile Arg Ser Ala Ala Ile Ser Cys Pro Gln Leu Glu Ser Leu
435 440 445
Asp Met Ser Asn Cys Ser Cys Val Ser Asp Glu Thr Leu Arg Glu Ile
450 455 460
Ser Gly Ser Cys Pro Asn Leu Gln Leu Leu Asn Ala Ser Tyr Cys Pro
465 470 475 480
Asn Ile Ser Leu Glu Ser Val Arg Leu Thr Met Leu Thr Val Leu Lys
485 490 495
Leu His Ser Cys Glu Gly Ile Thr Ser Ala Ser Met Thr Ala Ile Ser
500 505 510
Asn Ser Ser Ser Leu Lys Val Leu Glu Leu Asp Asn Cys Ser Leu Leu
515 520 525
Thr Ser Val Cys Leu Asp Leu Pro Asp Leu Gln Asn Ile Arg Leu Val
530 535 540
His Cys Arg Lys Phe Ser Asp Leu Ser Leu Gln Ser Ile Lys Leu Ser
545 550 555 560
Ser Ile Met Val Ser Asn Cys Pro Ser Leu His Arg Ile Asn Ile Thr
565 570 575
Ser Asn Leu Leu Gln Lys Leu Val Leu Lys Lys Gln Glu Ser Leu Ala
580 585 590
Lys Leu Ile Leu Gln Cys Pro Ser Leu Gln Asp Val Asp Leu Thr Asp
595 600 605
Cys Glu Ser Leu Thr Asn Ser Leu Cys Glu Val Phe Ser Asp Gly Gly
610 615 620
Gly Cys Pro Met Leu Lys Ser Leu Val Leu Asp Asn Cys Glu Ser Leu
625 630 635 640
Thr Ala Val Arg Phe Cys Ser Ser Ser Leu Gly Ser Leu Ser Leu Val
645 650 655
Gly Cys Arg Ala Ile Thr Ser Leu Glu Leu Gln Cys Pro Asn Leu Glu
660 665 670
Lys Val Ser Leu Asp Gly Cys Asp Arg Leu Glu Arg Ala Ser Phe Ser
675 680 685
Pro Val Gly Leu Arg Ser Leu Asn Leu Gly Ile Cys Pro Lys Leu Asn
690 695 700
Glu Leu Lys Leu Glu Ala Pro His Met Asp Leu Leu Glu Leu Lys Gly
705 710 715 720
Cys Gly Gly Leu Ser Glu Ala Ala Ile Asn Cys Pro Arg Leu Thr Ser
725 730 735
Leu Asp Ala Ser Phe Cys Ser Gln Leu Lys Asp Glu Cys Leu Ser Ala
740 745 750
Thr Thr Ala Ser Cys Pro Gln Ile Glu Ser Leu Ile Leu Met Ser Cys
755 760 765
Pro Ser Val Gly Ser Glu Gly Leu Tyr Ser Leu Gln Cys Leu Leu Lys
770 775 780
Leu Val Val Leu Asp Leu Ser Tyr Thr Phe Leu Leu Asn Leu Gln Pro
785 790 795 800
Val Phe Glu Ser Cys Ile Gln Leu Lys Val Leu Lys Leu Gln Ala Cys
805 810 815
Lys Tyr Leu Thr Asp Ser Ser Leu Glu Pro Leu Tyr Lys Glu Gly Ala
820 825 830
Leu Pro Ala Leu Gln Glu Leu Asp Leu Ser Tyr Gly Thr Leu Cys Gln
835 840 845
Ser Ala Ile Glu Glu Leu Leu Ala Cys Cys Thr His Leu Thr His Val
850 855 860
Ser Leu Asn Gly Cys Val Asn Met His Asp Leu Asn Trp Gly Cys Ser
865 870 875 880
Ile Gly Gln Leu Ser Leu Ser Gly Ile Pro Ile Pro Leu Gly Gln Ala
885 890 895
Thr Phe Asp Glu Ile Glu Glu Pro Ile Ala Gln Pro Asn Arg Leu Leu
900 905 910
Gln Asn Leu Asn Cys Val Gly Cys Gln Asn Ile Arg Lys Val Leu Ile
915 920 925
Pro Pro Ala Ala Arg Cys Phe His Leu Ser Ser Leu Asn Leu Ser Leu
930 935 940
Ser Ser Asn Leu Lys Glu Val Asp Val Ser Cys Tyr Asn Leu Cys Val
945 950 955 960
Leu Asn Leu Ser Asn Cys Cys Ser Leu Glu Val Leu Lys Leu Asp Cys
965 970 975
Pro Arg Leu Thr Asn Leu Phe Leu Gln Ser Cys Asn Ile Glu Glu Glu
980 985 990
Val Val Val Ala Ala Val Ser Lys Cys Ser Met Leu Glu Thr Leu Asp
995 1000 1005
Val Arg Phe Cys Pro Lys Ile Ser Ser Ile Ser Met Val Gln Leu
1010 1015 1020
Arg Ile Ala Cys Pro Ser Leu Lys Arg Ile Phe Ser Ser Leu Ser
1025 1030 1035
Pro Thr
1040
<210> 3
<211> 1043
<212> PRT
<213> artificial
<220>
<223> wild type melon WAP5.1 ortholog protein
<400> 3
Met Thr Ile Trp Cys Cys Leu Cys Phe Thr Val Gly Glu Glu Glu Glu
1 5 10 15
Glu Glu Asp Glu Arg Glu Arg Glu Glu Glu Val Lys Lys Glu Glu Gly
20 25 30
Glu Met Lys Pro Met Met Arg Glu Glu Val Phe Glu Asn Gln Asp Asp
35 40 45
Ser Asp Arg Ile Val Arg Asn Gly Asp Asp Ser Gln Gly Ser Asn Pro
50 55 60
Leu Ala Ser Ala Val Asp Asp Val Pro Glu Arg His Gly Ser Asp Gln
65 70 75 80
Leu Arg Leu Phe Glu Asp Met Val Arg Ala Met His Asp Gly Gly Asp
85 90 95
Gly Gly Ala His Cys His Trp Asp Asp Glu Leu Arg Gly Gly Gly Ala
100 105 110
Gly Gly Gly Val Ile Asn Pro Trp Asn Leu Ser Phe Gly Ile Met His
115 120 125
Gln Ser Glu Gly Gly Glu Ser Ser Ser Ala Ser Ala Leu Pro Leu Ser
130 135 140
Ser Met Ala Glu Thr Ser Ile Glu Glu Arg Asp Arg Asp Ala His His
145 150 155 160
Lys Arg Ala Lys Val His Ser Lys Phe Ile Glu Ser Ser Phe Ala Thr
165 170 175
Pro Trp Pro Leu Gly Ala Gly Asn Pro Met Arg Glu Phe Asp Phe Ile
180 185 190
His Gly Ser Ser Ser Ile Met Ser Arg Asn Glu Phe Leu Tyr His Ala
195 200 205
Ser Thr Ser Ser Arg Ile Asp Ala Asp Lys Asp Leu Glu Ser Ser Phe
210 215 220
Gly Arg Asp Asp Gly Ile Asn Glu Asn Asp Thr Cys Lys Ser Glu Gly
225 230 235 240
Phe Glu Val Arg Met Asp Leu Thr Asp Asp Leu Leu His Met Val Phe
245 250 255
Ser Phe Leu Asp His Ile Asn Leu Cys Arg Ala Ala Ile Val Cys Arg
260 265 270
Gln Trp Gln Ala Ala Ser Ala His Glu Asp Phe Trp Arg Cys Leu Asn
275 280 285
Phe Glu Asn Arg Asn Ile Ser Met Glu Gln Phe Glu Asp Met Cys Gly
290 295 300
Arg Tyr Pro Asn Ala Thr Glu Val Asn Ile Ser Gly Val Pro Ala Val
305 310 315 320
His Leu Leu Ala Met Lys Ala Val Ser Ser Leu Arg Asn Leu Glu Val
325 330 335
Leu Thr Leu Gly Arg Gly Gln Leu Ala Asp Asn Phe Phe His Ala Leu
340 345 350
Ala Asp Cys His Leu Leu Lys Ser Leu Thr Val Asn Asp Ser Thr Leu
355 360 365
Val Asn Val Thr Gln Glu Ile Pro Ile Ser His Asp Arg Leu Arg His
370 375 380
Leu His Leu Thr Lys Cys Arg Val Ile Arg Ile Ser Val Arg Cys Pro
385 390 395 400
Gln Leu Glu Thr Leu Ser Leu Lys Arg Ser Asn Met Ala Gln Ala Val
405 410 415
Leu Asn Cys Pro Leu Leu Arg Asp Leu Asp Ile Gly Ser Cys His Lys
420 425 430
Leu Ser Asp Ala Ala Ile Arg Ser Ala Ala Ile Ser Cys Pro Gln Leu
435 440 445
Glu Ser Leu Asp Met Ser Asn Cys Ser Cys Val Ser Asp Glu Thr Leu
450 455 460
Arg Glu Ile Ser Gly Ser Cys Pro Asn Leu Gln Leu Leu Asn Ala Ser
465 470 475 480
Tyr Cys Pro Asn Ile Ser Leu Glu Ser Val Arg Leu Thr Met Leu Thr
485 490 495
Val Leu Lys Leu His Ser Cys Glu Gly Ile Thr Ser Ala Ser Met Thr
500 505 510
Ala Ile Ser Asn Ser Ser Ser Leu Lys Val Leu Glu Leu Asp Asn Cys
515 520 525
Ser Leu Leu Thr Ser Val Cys Leu Asp Leu Pro His Leu Gln Asn Ile
530 535 540
Arg Leu Val His Cys Arg Lys Phe Ser Asp Leu Ser Leu Gln Ser Val
545 550 555 560
Lys Leu Ser Ser Ile Met Val Ser Asn Cys Pro Ser Leu His Arg Ile
565 570 575
Asn Ile Thr Ser Asn Leu Leu Gln Lys Leu Val Leu Lys Lys Gln Glu
580 585 590
Ser Leu Ala Lys Leu Val Leu Gln Cys Pro Ser Leu Gln Asp Val Asp
595 600 605
Leu Thr Asp Cys Glu Ser Leu Thr Asn Ser Ile Cys Glu Val Phe Ser
610 615 620
Asp Gly Gly Gly Cys Pro Met Leu Lys Ser Leu Val Leu Asp Asn Cys
625 630 635 640
Glu Ser Leu Thr Ala Val Arg Phe Cys Ser Ser Ser Leu Gly Ser Leu
645 650 655
Ser Leu Val Gly Cys Arg Ala Ile Thr Ser Leu Glu Leu Gln Cys Pro
660 665 670
Asn Leu Glu Gln Val Ser Leu Asp Gly Cys Asp His Leu Glu Arg Ala
675 680 685
Ser Phe Ser Pro Val Gly Leu Arg Ser Leu Asn Leu Gly Ile Cys Pro
690 695 700
Lys Leu Asn Glu Leu Lys Leu Glu Ala Pro Arg Met Asp Leu Leu Glu
705 710 715 720
Leu Lys Gly Cys Gly Gly Leu Ser Glu Ala Ala Ile Asn Cys Pro Arg
725 730 735
Leu Thr Ser Leu Asp Ala Ser Phe Cys Gly Gln Leu Lys Asp Glu Cys
740 745 750
Leu Ser Ala Thr Thr Ala Ser Cys Pro Gln Ile Glu Ser Leu Ile Leu
755 760 765
Met Ser Cys Pro Ser Val Gly Ser Glu Gly Leu Tyr Ser Leu Arg Cys
770 775 780
Leu Leu Lys Leu Val Val Leu Asp Leu Ser Tyr Thr Phe Leu Met Asn
785 790 795 800
Leu Gln Pro Val Phe Glu Ser Cys Ile Gln Leu Lys Val Leu Lys Leu
805 810 815
Gln Ala Cys Lys Tyr Leu Thr Asp Ser Ser Leu Glu Pro Leu Tyr Lys
820 825 830
Glu Gly Ala Leu Pro Ala Leu Gln Glu Leu Asp Leu Ser Tyr Gly Thr
835 840 845
Leu Cys Gln Ser Ala Ile Glu Glu Leu Leu Ala Cys Cys Thr His Leu
850 855 860
Thr His Val Ser Leu Asn Gly Cys Val Asn Met His Asp Leu Asn Trp
865 870 875 880
Gly Cys Ser Ile Gly Gln Leu Ser Leu Ser Val Ile Pro Ile Pro Leu
885 890 895
Gly Gln Ala Thr Phe Asp Glu Ile Glu Glu Pro Val Ala Gln Pro Asn
900 905 910
Arg Leu Leu Gln Asn Leu Asn Cys Val Gly Cys Pro Asn Ile Arg Lys
915 920 925
Val Leu Ile Pro Pro Ala Ala Arg Cys Phe His Leu Ser Ser Leu Asn
930 935 940
Leu Ser Leu Ser Ser Asn Leu Lys Glu Val Asp Val Ser Cys Tyr Asn
945 950 955 960
Leu Cys Phe Leu Asn Leu Ser Asn Cys Cys Ser Leu Glu Val Leu Lys
965 970 975
Leu Asp Cys Pro Arg Leu Thr Ser Leu Phe Leu Gln Ser Cys Asn Ile
980 985 990
Glu Glu Glu Val Val Val Ala Ala Val Ser Lys Cys Ser Met Leu Glu
995 1000 1005
Thr Leu Asp Val Arg Phe Cys Pro Lys Ile Ser Ser Ile Ser Met
1010 1015 1020
Val Gln Leu Arg Ile Ala Cys Pro Ser Leu Lys Arg Ile Phe Ser
1025 1030 1035
Ser Leu Ser Pro Thr
1040
<210> 4
<211> 1033
<212> PRT
<213> artificial
<220>
<223> Mutant wap5.1 protein with L528F substitution
<400> 4
Met Thr Ile Trp Cys Cys Leu Cys Phe Thr Val Gly Glu Glu Asp Glu
1 5 10 15
Arg Glu Arg Glu Glu Glu Leu Lys Lys Glu Gly Glu Met Lys Pro Met
20 25 30
Met Arg Glu Glu Val Phe Glu Asn Gln Asp Asp Ser Asp Arg Ile Val
35 40 45
Arg Asn Gly Asp Asp Ser Gln Gly Ser Asn Pro Leu Pro Ile Ala Val
50 55 60
Asp Asp Ala Pro Asp Arg His Asp Gly Asp Arg Leu Arg Leu Phe Glu
65 70 75 80
Asp Met Val Arg Ala Met His Asp Gly Ala Asp Gly Gly Gly Ala His
85 90 95
Trp Asp Asp Glu Leu Arg Gly Gly Gly Gly Gly Ala Ile Asn Pro Trp
100 105 110
Asn Phe Ser Phe Gly Ile Leu His Gln Ser Glu Gly Gly Glu Ser Ser
115 120 125
Ser Ala Ser Ala Leu Ser Leu Ser Ser Thr Val Glu Thr Ser Asn Glu
130 135 140
Glu Arg Asp Arg Asp Ala Asn His Lys Arg Ala Lys Val Leu Ser Lys
145 150 155 160
Phe Thr Glu Ser Ser Phe Ala Thr Pro Trp Pro Leu Gly Ala Gly Asn
165 170 175
Pro Met Arg Asp Tyr Asp Phe Ile His Gly Ser Ser Ser Ile Met Ser
180 185 190
Arg Asn Glu Phe Leu Tyr His Ala Ser Thr Ser Cys Arg Val Asp Glu
195 200 205
Asp Leu Glu Ser Ser Phe Gly Arg Asp Asp Gly Ile Asn Asp Asn Asp
210 215 220
Thr Cys Lys Ser Glu Gly Phe Glu Val Arg Met Asp Leu Thr Asp Asp
225 230 235 240
Leu Leu His Met Val Phe Ser Phe Leu Asp His Ile Asn Leu Cys Arg
245 250 255
Ala Ala Ile Val Cys Arg Gln Trp Gln Ala Ala Ser Ala His Glu Asp
260 265 270
Phe Trp Arg Cys Leu Asn Phe Glu Asn Arg Asn Ile Ser Met Glu Gln
275 280 285
Phe Glu Asp Met Cys Gly Arg Tyr Pro Asn Ala Thr Glu Val Asn Ile
290 295 300
Ser Gly Val Pro Ala Val His Leu Leu Ala Met Lys Ala Val Ser Ser
305 310 315 320
Leu Arg His Leu Glu Val Leu Thr Leu Gly Arg Gly Gln Leu Ala Asp
325 330 335
Asn Phe Phe His Ala Leu Thr Asp Cys His Leu Leu Lys Ser Leu Thr
340 345 350
Val Asn Asp Ser Thr Leu Val Asn Val Thr Gln Glu Ile Pro Ile Ser
355 360 365
His Asp Arg Leu Arg His Leu His Leu Thr Lys Cys Arg Val Ile Arg
370 375 380
Ile Ser Val Arg Cys Pro Gln Leu Glu Thr Leu Ser Leu Lys Arg Ser
385 390 395 400
Asn Met Ala Gln Ala Val Leu Asn Cys Pro Leu Leu Arg Asp Leu Asp
405 410 415
Ile Gly Ser Cys His Lys Leu Ser Asp Ala Ala Ile Arg Ser Ala Ala
420 425 430
Ile Ser Cys Pro Gln Leu Glu Ser Leu Asp Met Ser Asn Cys Ser Cys
435 440 445
Val Ser Asp Glu Thr Leu Arg Glu Ile Ser Ala Asn Cys Pro Asn Leu
450 455 460
Gln Leu Leu Asn Ala Ser Tyr Cys Pro Asn Ile Ser Leu Glu Ser Val
465 470 475 480
Arg Leu Thr Met Leu Thr Val Leu Lys Leu His Ser Cys Glu Gly Ile
485 490 495
Thr Ser Ala Ser Met Thr Ala Ile Ser Ser Ser Ser Gly Leu Lys Val
500 505 510
Leu Glu Leu Asp Asn Cys Ser Leu Leu Thr Ser Val Ser Leu Asp Phe
515 520 525
Pro His Leu Gln Asn Ile Arg Leu Val His Cys Arg Lys Phe Ser Asp
530 535 540
Leu Ser Leu Gln Ser Val Lys Leu Ser Ser Ile Met Val Ser Asn Cys
545 550 555 560
Pro Ser Leu His Arg Ile Asn Ile Thr Ser Asn Leu Leu Gln Lys Leu
565 570 575
Val Leu Lys Lys Gln Glu Ser Leu Ala Lys Leu Val Leu Gln Cys Pro
580 585 590
Ser Leu Gln Asp Val Asp Leu Thr Asp Cys Glu Ser Leu Thr Asn Ser
595 600 605
Ile Cys Glu Val Phe Ser Asp Gly Gly Gly Cys Pro Met Leu Lys Ser
610 615 620
Leu Val Leu Asp Asn Cys Glu Ser Leu Thr Ala Val Arg Phe Cys Ser
625 630 635 640
Ser Ser Leu Gly Ser Leu Ser Leu Val Gly Cys Arg Ala Ile Thr Ser
645 650 655
Leu Glu Leu Gln Cys Pro Asn Leu Glu Gln Val Ser Leu Asp Gly Cys
660 665 670
Asp His Leu Glu Arg Ala Ser Phe Ser Pro Val Gly Leu Arg Ser Leu
675 680 685
Asn Leu Gly Ile Cys Pro Lys Leu Asn Glu Leu Lys Leu Glu Ala Pro
690 695 700
Arg Met Asp Leu Leu Glu Leu Lys Gly Cys Gly Gly Leu Ser Glu Ala
705 710 715 720
Ala Ile Asn Cys Pro Arg Leu Thr Ser Leu Asp Ala Ser Phe Cys Gly
725 730 735
Gln Leu Lys Asp Glu Cys Leu Ser Ala Thr Thr Ala Ser Cys Pro Gln
740 745 750
Ile Glu Ser Leu Ile Leu Met Ser Cys Pro Ser Val Gly Ser Glu Gly
755 760 765
Leu Tyr Ser Leu Arg Cys Leu Leu Lys Leu Val Val Leu Asp Leu Ser
770 775 780
Tyr Thr Phe Leu Met Ser Leu Gln Pro Val Phe Glu Ser Cys Ile Gln
785 790 795 800
Leu Lys Val Leu Lys Leu Gln Ala Cys Lys Tyr Leu Thr Asp Ser Ser
805 810 815
Leu Glu Pro Leu Tyr Lys Glu Asp Ala Leu Pro Ala Leu Gln Glu Leu
820 825 830
Asp Leu Ser Tyr Gly Thr Leu Cys Gln Ser Ala Ile Glu Glu Leu Leu
835 840 845
Ala Cys Cys Thr His Leu Thr His Val Ser Leu Asn Gly Cys Val Asn
850 855 860
Met His Asp Leu Asn Trp Gly Cys Ser Ile Gly Gln Leu Ser Leu Ser
865 870 875 880
Ser Ile Pro Ile Pro Leu Gly Gln Ala Thr Leu Asp Glu Ile Glu Glu
885 890 895
Pro Val Ala Gln Pro Asn Arg Leu Leu Gln Asn Leu Asn Cys Val Gly
900 905 910
Cys Gln Asn Ile Arg Lys Val Leu Ile Pro Pro Ala Ala Arg Cys Phe
915 920 925
His Leu Ser Ser Leu Asn Leu Ser Leu Ser Ser Asn Leu Lys Glu Val
930 935 940
Asp Val Ser Cys Tyr Asn Leu Cys Phe Leu Asn Leu Ser Asn Cys Cys
945 950 955 960
Ser Leu Glu Val Leu Lys Leu Asp Cys Pro Arg Leu Thr Ser Leu Phe
965 970 975
Leu Gln Ser Cys Asn Ile Glu Glu Glu Val Val Val Ala Ala Val Ser
980 985 990
Arg Cys Ser Met Leu Glu Thr Leu Asp Val Arg Leu Cys Pro Lys Ile
995 1000 1005
Ser Ser Ile Ser Met Val Gln Leu Arg Ile Ala Cys Pro Ser Leu
1010 1015 1020
Lys Arg Ile Phe Ser Thr Leu Ser Pro Thr
1025 1030
<210> 5
<211> 3102
<212> DNA
<213> artificial
<220>
<223> cDNA encoding mutant wap5.1 protein of SEQ ID NO: 4
<400> 5
atgacgattt ggtgctgctt atgcttcacc gttggagaag aagacgaaag ggaaagggaa 60
gaggaactga agaaggaagg tgaaatgaaa cccatgatgc gtgaggaggt ttttgagaac 120
caggatgact ctgatcgcat tgtgcgaaat ggtgatgatt ctcaagggag taatccactt 180
ccgattgctg tagatgatgc gcctgaccgt catgacggtg atcgacttag actgtttgag 240
gatatggtca gagcaatgca cgatggcgcc gatggtggtg gtgctcattg ggacgatgag 300
ctgcgcggcg gcggcggcgg ggctattaat ccctggaatt tttcttttgg aattctgcat 360
caatctgagg gaggagaaag tagtagcgcc tcggctttgt ccttgtcttc tacggtggag 420
acttctaatg aggaacgcga tcgggatgcc aaccataagc gcgctaaagt tctctccaaa 480
ttcactgaga gctcatttgc aactccatgg cctttgggtg ctggaaatcc tatgagagat 540
tatgatttta ttcacggatc atcttcaatt atgagtagga atgaatttct ataccatgct 600
tctacatcat gcagagttga cgaagatttg gaatctagtt ttggtagaga tgatgggatc 660
aatgataatg acacctgtaa atcagaagga tttgaagtaa gaatggatct tacagatgat 720
ttactgcata tggtgttctc tttcttggat cacatcaatc tttgtcgagc tgctatagtc 780
tgcaggcagt ggcaagctgc tagtgctcat gaagatttct ggaggtgttt gaattttgaa 840
aataggaaca tatccatgga acaattcgag gatatgtgtg gaagatatcc aaatgctaca 900
gaggtcaata tctctggtgt acctgccgtt cacttgcttg ccatgaaagc agtttcttct 960
ttaagacatc tggaggtttt aactctgggg agaggacaac tggcagataa cttttttcac 1020
gccctgactg attgccattt attgaagagt ttgactgtca atgattctac gctggttaat 1080
gttacacaag agatacctat aagccatgat agactgcgtc atcttcatct tactaaatgt 1140
cgtgttatac gcatatctgt tagatgtcca caacttgaaa cattgtcgtt gaagcgcagc 1200
aacatggcac aggctgttct taactgcccc cttcttcggg acctggatat aggctcttgc 1260
cacaagctct cagatgctgc aattcgctca gccgctattt catgcccaca gttggaatct 1320
cttgatatgt ctaattgttc atgtgttagt gatgagacat tacgtgaaat ttctgcaaac 1380
tgcccgaatc tccagcttct gaatgcatca tactgcccaa atatatcttt ggagtctgta 1440
agactgacaa tgctgaccgt gcttaagctt cacagctgtg agggcatcac atcagcttca 1500
atgaccgcaa tatctagtag ttctggtttg aaggttttgg agcttgataa ttgcagtctt 1560
ttgacttctg tttctctgga ttttccccat ttacagaata tcagacttgt tcattgccgc 1620
aaattctcag acttgagttt acagagtgtt aaattatcat ccataatggt ctctaattgt 1680
ccatcacttc atcggatcaa catcacttcc aatttacttc aaaaattggt gttgaagaaa 1740
caagagagct tggccaaatt ggttttgcag tgccctagtc tgcaagatgt ggacctcaca 1800
gactgtgaat cgctaacgaa ttctatttgt gaggttttta gtgatggtgg tggatgccct 1860
atgttgaaat cacttgttct tgataactgt gagagtctga ctgctgttcg attctgtagc 1920
agttctttag gcagtctttc ccttgttggt tgccgggcaa tcacttcact tgaacttcaa 1980
tgccctaatc tcgaacaggt ttctttagat ggctgtgatc atcttgagag agcatcattt 2040
tccccggttg gtctgcggtc actaaacctg ggaatctgtc ccaaattgaa tgaattaaaa 2100
cttgaggccc ctcggatgga tttacttgag ttaaaaggtt gtggtggatt gtctgaagca 2160
gccatcaatt gtcctcgtct aacatcgttg gatgcttcct tttgtggcca actgaaagat 2220
gagtgtttgt ctgcgactac tgcctcatgt ccacagattg agtcgttaat actgatgtca 2280
tgtccatcgg ttggttcaga ggggctttac tctctgcgat gccttctgaa gttggttgtg 2340
ctcgatttat catatacctt tttgatgagc ttgcagccag tcttcgagtc ttgtatacaa 2400
cttaaggtat tgaaactaca agcatgcaag tatttaactg actcatcgct agagcctctt 2460
tataaggaag acgctcttcc agctcttcaa gagttagact tatcttacgg gactctttgt 2520
cagtctgcca tagaagagct tcttgcttgt tgcactcact taactcatgt gagcttaaat 2580
gggtgtgtga acatgcatga tctaaattgg ggttgtagca ttggacagct ttcgttgtcc 2640
agcatcccaa ttcctcttgg tcaggccact cttgatgaga ttgaggaacc agttgcacag 2700
ccaaaccgtt tgttacagaa ccttaactgt gtaggttgtc agaatattag aaaggttctc 2760
attcctccag ctgctcgttg ttttcattta tcatcattaa acctatcctt gtcttcaaat 2820
ctcaaggaag ttgacgtctc ttgttacaac ctatgctttc ttaatttgag taattgctgc 2880
tctttggaag ttctaaaact tgactgcccg cggttaacca gtctctttct tcagtcttgc 2940
aacattgaag aagaagtggt tgtggctgcg gtatcgagat gtagcatgct cgagacgttg 3000
gatgtccgct tatgtccaaa gatctcctct attagcatgg tacaactgcg tattgcttgt 3060
ccaagtttga agcggatctt cagcactctg tctccaacat ga 3102
<210> 6
<211> 3102
<212> DNA
<213> artificial
<220>
<223> cDNA encoding wild type WAP5.1 protein of SEQ ID NO: 1
<400> 6
atgacgattt ggtgctgctt atgcttcacc gttggagaag aagacgaaag ggaaagggaa 60
gaggaactga agaaggaagg tgaaatgaaa cccatgatgc gtgaggaggt ttttgagaac 120
caggatgact ctgatcgcat tgtgcgaaat ggtgatgatt ctcaagggag taatccactt 180
ccgattgctg tagatgatgc gcctgaccgt catgacggtg atcgacttag actgtttgag 240
gatatggtca gagcaatgca cgatggcgcc gatggtggtg gtgctcattg ggacgatgag 300
ctgcgcggcg gcggcggcgg ggctattaat ccctggaatt tttcttttgg aattctgcat 360
caatctgagg gaggagaaag tagtagcgcc tcggctttgt ccttgtcttc tacggtggag 420
acttctaatg aggaacgcga tcgggatgcc aaccataagc gcgctaaagt tctctccaaa 480
ttcactgaga gctcatttgc aactccatgg cctttgggtg ctggaaatcc tatgagagat 540
tatgatttta ttcacggatc atcttcaatt atgagtagga atgaatttct ataccatgct 600
tctacatcat gcagagttga cgaagatttg gaatctagtt ttggtagaga tgatgggatc 660
aatgataatg acacctgtaa atcagaagga tttgaagtaa gaatggatct tacagatgat 720
ttactgcata tggtgttctc tttcttggat cacatcaatc tttgtcgagc tgctatagtc 780
tgcaggcagt ggcaagctgc tagtgctcat gaagatttct ggaggtgttt gaattttgaa 840
aataggaaca tatccatgga acaattcgag gatatgtgtg gaagatatcc aaatgctaca 900
gaggtcaata tctctggtgt acctgccgtt cacttgcttg ccatgaaagc agtttcttct 960
ttaagacatc tggaggtttt aactctgggg agaggacaac tggcagataa cttttttcac 1020
gccctgactg attgccattt attgaagagt ttgactgtca atgattctac gctggttaat 1080
gttacacaag agatacctat aagccatgat agactgcgtc atcttcatct tactaaatgt 1140
cgtgttatac gcatatctgt tagatgtcca caacttgaaa cattgtcgtt gaagcgcagc 1200
aacatggcac aggctgttct taactgcccc cttcttcggg acctggatat aggctcttgc 1260
cacaagctct cagatgctgc aattcgctca gccgctattt catgcccaca gttggaatct 1320
cttgatatgt ctaattgttc atgtgttagt gatgagacat tacgtgaaat ttctgcaaac 1380
tgcccgaatc tccagcttct gaatgcatca tactgcccaa atatatcttt ggagtctgta 1440
agactgacaa tgctgaccgt gcttaagctt cacagctgtg agggcatcac atcagcttca 1500
atgaccgcaa tatctagtag ttctggtttg aaggttttgg agcttgataa ttgcagtctt 1560
ttgacttctg tttctctgga tcttccccat ttacagaata tcagacttgt tcattgccgc 1620
aaattctcag acttgagttt acagagtgtt aaattatcat ccataatggt ctctaattgt 1680
ccatcacttc atcggatcaa catcacttcc aatttacttc aaaaattggt gttgaagaaa 1740
caagagagct tggccaaatt ggttttgcag tgccctagtc tgcaagatgt ggacctcaca 1800
gactgtgaat cgctaacgaa ttctatttgt gaggttttta gtgatggtgg tggatgccct 1860
atgttgaaat cacttgttct tgataactgt gagagtctga ctgctgttcg attctgtagc 1920
agttctttag gcagtctttc ccttgttggt tgccgggcaa tcacttcact tgaacttcaa 1980
tgccctaatc tcgaacaggt ttctttagat ggctgtgatc atcttgagag agcatcattt 2040
tccccggttg gtctgcggtc actaaacctg ggaatctgtc ccaaattgaa tgaattaaaa 2100
cttgaggccc ctcggatgga tttacttgag ttaaaaggtt gtggtggatt gtctgaagca 2160
gccatcaatt gtcctcgtct aacatcgttg gatgcttcct tttgtggcca actgaaagat 2220
gagtgtttgt ctgcgactac tgcctcatgt ccacagattg agtcgttaat actgatgtca 2280
tgtccatcgg ttggttcaga ggggctttac tctctgcgat gccttctgaa gttggttgtg 2340
ctcgatttat catatacctt tttgatgagc ttgcagccag tcttcgagtc ttgtatacaa 2400
cttaaggtat tgaaactaca agcatgcaag tatttaactg actcatcgct agagcctctt 2460
tataaggaag acgctcttcc agctcttcaa gagttagact tatcttacgg gactctttgt 2520
cagtctgcca tagaagagct tcttgcttgt tgcactcact taactcatgt gagcttaaat 2580
gggtgtgtga acatgcatga tctaaattgg ggttgtagca ttggacagct ttcgttgtcc 2640
agcatcccaa ttcctcttgg tcaggccact cttgatgaga ttgaggaacc agttgcacag 2700
ccaaaccgtt tgttacagaa ccttaactgt gtaggttgtc agaatattag aaaggttctc 2760
attcctccag ctgctcgttg ttttcattta tcatcattaa acctatcctt gtcttcaaat 2820
ctcaaggaag ttgacgtctc ttgttacaac ctatgctttc ttaatttgag taattgctgc 2880
tctttggaag ttctaaaact tgactgcccg cggttaacca gtctctttct tcagtcttgc 2940
aacattgaag aagaagtggt tgtggctgcg gtatcgagat gtagcatgct cgagacgttg 3000
gatgtccgct tatgtccaaa gatctcctct attagcatgg tacaactgcg tattgcttgt 3060
ccaagtttga agcggatctt cagcactctg tctccaacat ga 3102
<210> 7
<211> 6896
<212> DNA
<213> artificial
<220>
<223> genomic DNA of wild type WAP5.1 gene
<400> 7
atgacgattt ggtgctgctt atgcttcacc gttggagaag aagacgaaag ggaaagggaa 60
gaggaactga agaaggaagg tgaaatgaaa cccatgatgc gtgaggaggt ttttgagaac 120
caggatgact ctgatcgcat tgtgcgaaat ggtgatgatt ctcaagggag taatccactt 180
ccgattgctg tagatgatgc gcctgaccgt catgacggtg atcgacttag actgtttgag 240
gatatggtca gagcaatgca cgatggcgcc gatggtggtg gtgctcattg ggacgatgag 300
ctgcgcggcg gcggcggcgg ggctattaat ccctggaatt tttcttttgg aattctgcat 360
caatctgagg gaggagaaag tagtagcgcc tcggctttgt ccttgtcttc tacggtggag 420
acttctaatg aggaacgcga tcgggatgcc aaccataagc gcgctaaagt tctctccaaa 480
ttcacgtgag tcacttgtag actgcttctg gatatgaatt atgctaaggt ttcatgggtt 540
tgccattttt cttggttttc ttttccccct tttccgaaag gggtgttggt tttttttttt 600
tttttttttt tttcttgttc cttcttaaat gttctctctt tgtgggattt aggactagat 660
attgtggtgg tttttggatg gagatcgtta gcatttattg aggttatcat ttacgaatat 720
gcagggttct ttgtaattta gctatcaatg caggctgttt gttgttattt ttgtgccggc 780
atctctgaat aatttgctgt tttgcactgc aagatagcta tggaaaatta cgtattttat 840
gatctaaacg tgctccgctt ctttagctct cgggctgtat cagcgtttgg aaagtagttg 900
ttctatagat tttcacgagc accttctatt cttgaatact tgaagtggtg tctaatataa 960
agcaatatgt ttttgcatcg accttatccc gtccatcttt attgtatgta ttagactgtt 1020
ggcaggctct ttatcattgt attttaaata ttttttcccg atttctaaat tagaaatgtg 1080
tttcttaatc aatagtggca tgttgcttgg gcttttctag aagagatatc atacggtgtg 1140
ccaagatgat atctcaaagt cttcttcagt tgcgagtctt ctgagtgagt tgtcaccatg 1200
gaaaagtttc cttttcttca tggaatagaa aatcatttat atttgagaaa ttcaatatat 1260
ggttttcttt ctctgagaag agtttgaaaa tgaaaagtat agatatgaat gtttattgtt 1320
tttgattgtc ttattaattg tttttttgaa gcaaaccttc atgtacaacg atatttaggg 1380
tgtttgaatg cacataggtt ctcctattac atgatttatt tatgtactga aaattaaagg 1440
tgtattaaat ttgagtcata atttttgtaa aaactattct ttctaaattg ttttctggat 1500
atgcccaaac aagtccttat attttcaagc actgttgacc ttggtagtat agttatcaca 1560
ctcatttgca aacctacttg tgatactata ctttcattac tagttaaaaa aatgtcttcg 1620
ttaaggttta tcatggaggg atgagtatat agctgttgtc ttactgctaa atatgatctt 1680
atgttggaaa ctctgccctt cacatggtgg ttgatgatgt atcatgtgat ctttagttta 1740
aaaaagagta aactctgagt taactaaatg taagtatgtg cagtaatact cattccagat 1800
aattcacatt ctctcaaccg tttagatctt gcaaattagc accatcaagt ttcctataat 1860
ttacaagtta gactaactga taagtgtaaa gttagaaatg atgctcgtta ttcactttta 1920
acaattgttt cttattttct tttcttttca atcttcccta gtgagagctc atttgcaact 1980
ccatggcctt tgggtgctgg aaatcctatg agagattatg attttattca cggatcatct 2040
tcaattatga gtaggaatga atttctatac catgcttcta catcatgcag agttgacgaa 2100
gatttggaat ctagttttgg tagagatgat gggatcaatg ataatgacac ctgtaaatca 2160
gaaggatttg aagtaagaat ggatcttaca gatgatttac tgcatatggt atgcatctcc 2220
agagatttat tattgttttc ttgcttaccg tcttatttct tggatttctt attcacatga 2280
agttaaatta attgatatca ggtgttctct ttcttggatc acatcaatct ttgtcgagct 2340
gctatagtct gcaggcagtg gcaagctgct agtgctcatg aagatttctg gaggtgtttg 2400
aattttgaaa ataggaacat atccatggaa caatgtaggt gttgttctgc ttcttccttt 2460
cattttctag agtagttgag acaagaatga ggtgatttta aaaatgttgg ttgcctcttg 2520
gaaatagagg tgatatatta tgatgtaact tcaaaacatg taggatgcag tatttgagtc 2580
tggaatgtct ttagcactca tgaaatgttg ttaaaagcct aggactgcga catatttggg 2640
gcttgttttc agtactcagt aggatttttc tccctaaatc tttttgacta ggtatgtata 2700
taatattaaa ggaaagaact tcttgatgct atttttagct ttggcaatct cttgattctt 2760
ttaaaataag ttctggatat aattgtataa atgtgatagg atgtgacata tctctgtagc 2820
agtcttggtg ccagtgccaa tgcaacactt tcaatcgtat ttcaagttta acctactttt 2880
atccagtcac attttctttc tacccaccat acagtataaa ttgatccggt tgtatttctt 2940
tgtgcctctg tattaacaac tgtcctatcc tattctatgt tgcttacttt ctaacatcat 3000
tctgatttgg agctagttag ttaattgatt aattctgact gcagtcgagg atatgtgtgg 3060
aagatatcca aatgctacag aggtcaatat ctctggtgta cctgccgttc acttgcttgc 3120
catgaaagca gtttcttctt taaggtaatg attacggttt tgtatttttg ttttttttcc 3180
tcatcctgaa tctttatggt ggtgcttatt attttattat tgtctcagac atctggaggt 3240
tttaactctg gggagaggac aactggcaga taactttttt cacgccctga ctgattgcca 3300
tttattgaag agtttgactg tcaatgattc tacgctggtt aatgttacac aagagatacc 3360
tataagccat gatagactgc gtcatcttca tcttactaaa tgtcgtgtta tacgcatatc 3420
tgttaggttg ctaatgttta tgtatcttaa tgctaactgt atttaattgt ttagtttgtt 3480
tttttttttt tttggtctaa agcatgtttt cttgcagatg tccacaactt gaaacattgt 3540
cgttgaagcg cagcaacatg gcacaggctg ttcttaactg cccccttctt cgggacctgg 3600
atataggctc ttgccacaag ctctcagatg ctgcaattcg ctcagccgct atttcatgcc 3660
cacagttgga atctcttgat atgtctaatt gttcatgtgt tagtgatgag acattacgtg 3720
aaatttctgc aaactgcccg aatctccagc ttctgaatgc atcatactgc ccaaatatat 3780
ctttggaggt ggcataccat ttttagttaa attttgagcg aaagtgacta ttttgccctt 3840
cagacttgtt tttcctgata ttttggttcc tttttctttt gaagtctgta agactgacaa 3900
tgctgaccgt gcttaagctt cacagctgtg agggcatcac atcagcttca atgaccgcaa 3960
tatctagtag ttctggtttg aaggtctgaa ataacctatt tcgactgttt atattttcta 4020
gttgtctggt gctgtgtctg agttagttga aaatggaatg gagacttatt gcaggttttg 4080
gagcttgata attgcagtct tttgacttct gtttctctgg atcttcccca tttacagaat 4140
atcagacttg ttcattgccg caagtatgtc ttctcatctc caagcaactc atagcttcta 4200
tcacatgatt aatttcattt agaaggactt ttgaactggg ccttcacttc ttttttcctt 4260
gagttgaatc tgtttcgcca ttcttgcaga ttctcagact tgagtttaca gagtgttaaa 4320
ttatcatcca taatggtctc taattgtcca tcacttcatc ggatcaacat cacttccaat 4380
ttacttcaag tatgtcgtaa tggatcttaa agttttcttt cttattaatt tcatttcata 4440
agggtataaa cgaacattgg actgtacttt tgtggacttg cagaaattgg tgttgaagaa 4500
acaagagagc ttggccaaat tggttttgca gtgccctagt ctgcaagatg tggacctcac 4560
agactgtgaa tcgctaacga attctatttg tgaggttttt agtgatggtg gtggatgccc 4620
tatgttgaaa tcacttgttc ttgataactg tgaggtaagt agcttggtgt tacccatcag 4680
tatcatcgca ttggcccttg tgatttcata atttggaaat tatttgattg agactttcca 4740
ttgatttcta atgtgaacat gtttcttttg ttcagagtct gactgctgtt cgattctgta 4800
gcagttcttt aggcagtctt tcccttgttg gttgccgggc aatcacttca cttgaacttc 4860
aatgccctaa tctcgaacag gtttctttag atggctgtga tcatcttgag agagcatcat 4920
tttccccggt atgtgaaaac tgacaacttg taaatttttc tcagtcacta tattataaat 4980
attctcctta gcgctaaaga ttgggctttt ttctctcttt tttaaggttg gtctgcggtc 5040
actaaacctg ggaatctgtc ccaaattgaa tgaattaaaa cttgaggccc ctcggatgga 5100
tttacttgag ttaaaaggtt gtggtggatt gtctgaagca gccatcaatt gtcctcgtct 5160
aacatcgttg gatgcttcct tttgtgggtt agtttgttat gattatttgg atgacacctt 5220
ctatttgatg gatactggtt gcttatgtcg ttgagttctt ctttttccct tgcagccaac 5280
tgaaagatga gtgtttgtct gcgactactg cctcatgtcc acagattgag tcgttaatac 5340
tgatgtcatg tccatcggtt ggttcagagg ggctttactc tctgcgatgc cttctgaagt 5400
tggttgtgct cgatttatca tatacctttt tgatgagctt gcagccagtc ttcgagtctt 5460
gtatacaact taaggtacct ttttgataga tattatcatg acccctgtct gatttctgtt 5520
gtattgatgc cttcttcttt gtgttcttaa tgaaggtatt gaaactacaa gcatgcaagt 5580
atttaactga ctcatcgcta gagcctcttt ataaggaaga cgctcttcca gctcttcaag 5640
agttagactt atcttacggg actctttgtc agtctgccat agaagagctt cttgcttgtt 5700
gcactcactt aactcatgtg agcttaaatg ggtgtgtgaa catgcatgat ctaaattggg 5760
gttgtagcat tggacagctt tcgttgtcca gcatcccaat tcctcttggt caggccactc 5820
ttgatgagat tgaggaacca gttgcacagc caaaccgttt gttacagaac cttaactgtg 5880
taggttgtca gaatattaga aaggttctca ttcctccagc tgctcgttgt tttcatttat 5940
catcattaaa cctatccttg tcttcaaatc tcaaggaagt tgacgtctct tgttacaacc 6000
tatgctttct taatttgagg ttatgccccc ctaccctttt gctccattaa caattttagt 6060
tggttccttt cttttttttt tttttggcct accctgctaa atccgtgttt ttgtgatcta 6120
gtaattgctg ctctttggaa gttctaaaac ttgactgccc gcggttaacc agtctctttc 6180
ttcaggtaat tttttcttca atgtaagttt tggatgttca tactaatcta ctctgaatag 6240
tccagaatct ggtcttccaa gcaatccgaa actaaccgtt ggggataggg tggacaaaaa 6300
atggggtcaa gacagattac aacgcacaag tccacattat aaggacccag tcaatgactg 6360
gagttgaact cccaacctga gacccccctg tagggctgta ggcctcgggt ctaaggaccc 6420
caattttgtt tgcatccccc tccactttta accttttttt tttttttttt ttttgggata 6480
ggaattcatc cattgttgga atcatttgat tatagtttat tttttatctt attttttact 6540
gttgtgttgg gtaaacaata ctttggtttc aaacttgaga aaaaaagaaa tggcagctaa 6600
gagatgcata tgaattttat gatatgaggc taactagatc tgtcttttcc tagtcttgca 6660
acattgaaga agaagtggtt gtggctgcgg tatcgagatg tagcatgctc gagacgttgg 6720
atgtccgctt atgtccaaag gtgaggggtg tctctctttt cctctacatt gtttgatagt 6780
tttggctgac ttcataatat ttcttctact ggcagatctc ctctattagc atggtacaac 6840
tgcgtattgc ttgtccaagt ttgaagcgga tcttcagcac tctgtctcca acatga 6896
<210> 8
<211> 121
<212> DNA
<213> artificial
<220>
<223> marker mwm23348429 to detect mutant allele encoding L528F mutant
wap5.1 protein
<220>
<221> C/T SNP
<222> (61)..(61)
<400> 8
gacttattgc aggttttgga gcttgataat tgcagtcttt tgacttctgt ttctytggat 60
tttccccatt tacagaatat cagacttgty cattgccgca agtatgtctt ctcatctcca 120
a 121
<210> 9
<211> 1033
<212> PRT
<213> Citrullus lanatus
<400> 9
Met Thr Ile Trp Cys Cys Leu Cys Phe Thr Val Gly Glu Glu Asp Glu
1 5 10 15
Arg Glu Arg Glu Glu Glu Leu Lys Lys Glu Gly Glu Met Lys Pro Met
20 25 30
Met Arg Glu Glu Val Phe Glu Asn Gln Asp Asp Ser Asp Arg Ile Val
35 40 45
Arg Asn Arg Asp Asp Ser Gln Gly Ser Asn Pro Leu Pro Ile Ala Val
50 55 60
Asp Asp Ala Pro Asp Arg His Asp Gly Asp Arg Leu Arg Leu Phe Glu
65 70 75 80
Asp Met Val Arg Ala Met His Asp Gly Ala Asp Gly Gly Gly Ala His
85 90 95
Trp Asp Asp Glu Leu Arg Gly Gly Gly Gly Gly Ala Ile Asn Pro Trp
100 105 110
Asn Phe Ser Phe Gly Ile Leu His Gln Ser Glu Gly Gly Glu Ser Ser
115 120 125
Ser Ala Ser Ala Leu Ser Leu Ser Ser Thr Val Glu Thr Ser Asn Glu
130 135 140
Glu Arg Asp Arg Asp Ala Asn His Lys Arg Ala Lys Val Leu Ser Lys
145 150 155 160
Phe Thr Glu Ser Ser Phe Ala Thr Pro Trp Pro Leu Gly Ala Gly Asn
165 170 175
Pro Met Arg Asp Tyr Asp Phe Ile His Gly Ser Ser Ser Ile Met Ser
180 185 190
Arg Asn Glu Phe Leu Tyr His Ala Ser Thr Ser Cys Arg Val Asp Glu
195 200 205
Asp Leu Glu Ser Ser Phe Gly Arg Asp Asp Gly Ile Asn Asp Asn Asp
210 215 220
Thr Cys Lys Ser Glu Gly Phe Glu Val Arg Met Asp Leu Thr Asp Asp
225 230 235 240
Leu Leu His Met Val Phe Ser Phe Leu Asp His Ile Asn Leu Cys Arg
245 250 255
Ala Ala Ile Val Cys Arg Gln Trp Gln Ala Ala Ser Ala His Glu Asp
260 265 270
Phe Trp Arg Cys Leu Asn Phe Glu Asn Arg Asn Ile Ser Met Glu Gln
275 280 285
Phe Glu Asp Met Cys Gly Arg Tyr Pro Asn Ala Thr Glu Val Asn Ile
290 295 300
Ser Gly Val Pro Ala Val His Leu Leu Ala Met Lys Ala Val Ser Ser
305 310 315 320
Leu Arg His Leu Glu Val Leu Thr Leu Gly Arg Gly Gln Leu Ala Asp
325 330 335
Asn Phe Phe His Ala Leu Thr Asp Cys His Leu Leu Lys Ser Leu Thr
340 345 350
Val Asn Asp Ser Thr Leu Val Asn Val Thr Gln Glu Ile Pro Ile Ser
355 360 365
His Asp Arg Leu Arg His Leu His Leu Thr Lys Cys Arg Val Ile Arg
370 375 380
Ile Ser Val Arg Cys Pro Gln Leu Glu Thr Leu Ser Leu Lys Arg Ser
385 390 395 400
Asn Met Ala Gln Ala Val Leu Asn Cys Pro Leu Leu Arg Asp Leu Asp
405 410 415
Ile Gly Ser Cys His Lys Leu Ser Asp Ala Ala Ile Arg Ser Ala Ala
420 425 430
Ile Ser Cys Pro Gln Leu Glu Ser Leu Asp Met Ser Asn Cys Ser Cys
435 440 445
Val Ser Asp Glu Thr Leu Arg Glu Ile Ser Ala Asn Cys Pro Asn Leu
450 455 460
Gln Leu Leu Asn Ala Ser Tyr Cys Pro Asn Ile Ser Leu Glu Ser Val
465 470 475 480
Arg Leu Thr Met Leu Thr Val Leu Lys Leu His Ser Cys Glu Gly Ile
485 490 495
Thr Ser Ala Ser Met Thr Ala Ile Ser Ser Ser Ser Gly Leu Lys Val
500 505 510
Leu Glu Leu Asp Asn Cys Ser Leu Leu Thr Ser Val Ser Leu Asp Leu
515 520 525
Pro His Leu Gln Asn Ile Arg Leu Val His Cys Arg Lys Phe Ser Asp
530 535 540
Leu Ser Leu Gln Ser Val Lys Leu Ser Ser Ile Met Val Ser Asn Cys
545 550 555 560
Pro Ser Leu His Arg Ile Asn Ile Thr Ser Asn Leu Leu Gln Lys Leu
565 570 575
Val Leu Lys Lys Gln Glu Ser Leu Ala Lys Leu Val Leu Gln Cys Pro
580 585 590
Ser Leu Gln Asp Val Asp Leu Thr Asp Cys Glu Ser Leu Thr Asn Ser
595 600 605
Ile Cys Glu Val Phe Ser Asp Gly Gly Gly Cys Pro Met Leu Lys Ser
610 615 620
Leu Val Leu Asp Asn Cys Glu Ser Leu Thr Ala Val Arg Phe Cys Ser
625 630 635 640
Ser Ser Leu Gly Ser Leu Ser Leu Val Gly Cys Arg Ala Ile Thr Ser
645 650 655
Leu Glu Leu Gln Cys Pro Asn Leu Glu Gln Val Ser Leu Asp Gly Cys
660 665 670
Asp His Leu Glu Arg Ala Ser Phe Ser Pro Val Gly Leu Arg Ser Leu
675 680 685
Asn Leu Gly Ile Cys Pro Lys Leu Asn Glu Leu Lys Leu Glu Ala Pro
690 695 700
Arg Met Asp Leu Leu Glu Leu Lys Gly Cys Gly Gly Leu Ser Glu Ala
705 710 715 720
Ala Ile Asn Cys Pro Arg Leu Thr Ser Leu Asp Ala Ser Phe Cys Gly
725 730 735
Gln Leu Lys Asp Glu Cys Leu Ser Ala Thr Thr Ala Ser Cys Pro Gln
740 745 750
Ile Glu Ser Leu Ile Leu Met Ser Cys Pro Ser Val Gly Ser Glu Gly
755 760 765
Leu Tyr Ser Leu Arg Cys Leu Leu Lys Leu Val Val Leu Asp Leu Ser
770 775 780
Tyr Thr Phe Leu Met Ser Leu Gln Pro Val Phe Glu Ser Cys Ile Gln
785 790 795 800
Leu Lys Val Leu Lys Leu Gln Ala Cys Lys Tyr Leu Thr Asp Ser Ser
805 810 815
Leu Glu Pro Leu Tyr Lys Glu Asp Ala Leu Pro Ala Leu Gln Glu Leu
820 825 830
Asp Leu Ser Tyr Gly Thr Leu Cys Gln Ser Ala Ile Glu Glu Leu Leu
835 840 845
Ala Cys Cys Thr His Leu Thr His Val Ser Leu Asn Gly Cys Val Asn
850 855 860
Met His Asp Leu Asn Trp Gly Cys Ser Ile Gly Gln Leu Ser Leu Ser
865 870 875 880
Ser Ile Pro Ile Pro Leu Gly Gln Ala Thr Leu Asp Glu Ile Glu Glu
885 890 895
Pro Val Ala Gln Pro Asn Arg Leu Leu Gln Asn Leu Asn Cys Val Gly
900 905 910
Cys Gln Asn Ile Arg Lys Val Leu Ile Pro Pro Ala Ala Arg Cys Phe
915 920 925
His Leu Ser Ser Leu Asn Leu Ser Leu Ser Ser Asn Leu Lys Glu Val
930 935 940
Asp Val Ser Cys Tyr Asn Leu Cys Phe Leu Asn Leu Ser Asn Cys Cys
945 950 955 960
Ser Leu Glu Val Leu Lys Leu Asp Cys Pro Arg Leu Thr Ser Leu Phe
965 970 975
Leu Gln Ser Cys Asn Ile Glu Glu Glu Val Val Val Ala Ala Val Ser
980 985 990
Arg Cys Ser Met Leu Glu Thr Leu Asp Val Arg Leu Cys Pro Lys Ile
995 1000 1005
Ser Ser Ile Ser Met Val Gln Leu Arg Ile Ala Cys Pro Ser Leu
1010 1015 1020
Lys Arg Ile Phe Ser Thr Leu Ser Pro Thr
1025 1030
<210> 10
<211> 1033
<212> PRT
<213> Citrullus lanatus
<400> 10
Met Thr Ile Trp Cys Cys Leu Cys Phe Thr Val Gly Glu Glu Asp Glu
1 5 10 15
Arg Glu Arg Glu Glu Glu Leu Lys Lys Glu Gly Glu Met Lys Pro Met
20 25 30
Met Arg Glu Glu Val Phe Glu Asn Gln Asp Asp Ser Asp Arg Ile Val
35 40 45
Arg Asn Arg Asp Asp Ser Gln Gly Ser Asn Pro Leu Pro Ile Ala Val
50 55 60
Asp Asp Ala Pro Asp Arg His Asp Gly Asp Arg Leu Arg Leu Phe Glu
65 70 75 80
Asp Met Val Arg Ala Met His Asp Gly Ala Asp Gly Gly Gly Ala His
85 90 95
Trp Asp Asp Glu Leu Arg Gly Gly Gly Gly Gly Ala Ile Asn Pro Trp
100 105 110
Asn Phe Ser Phe Gly Ile Leu His Gln Ser Glu Gly Gly Glu Ser Ser
115 120 125
Ser Ala Ser Ala Leu Ser Leu Ser Ser Thr Val Glu Thr Ser Asn Glu
130 135 140
Glu Arg Asp Arg Asp Ala Asn His Lys Arg Ala Lys Val Leu Ser Lys
145 150 155 160
Phe Thr Glu Ser Ser Phe Ala Thr Pro Trp Pro Leu Gly Ala Gly Asn
165 170 175
Pro Met Arg Asp Tyr Asp Phe Ile His Gly Ser Ser Ser Ile Met Ser
180 185 190
Arg Asn Glu Phe Leu Tyr His Ala Ser Thr Ser Cys Arg Val Asp Glu
195 200 205
Asp Leu Glu Ser Ser Phe Gly Arg Asp Asp Gly Ile Asn Asp Asn Asp
210 215 220
Thr Cys Lys Ser Glu Gly Phe Glu Val Arg Met Asp Leu Thr Asp Asp
225 230 235 240
Leu Leu His Met Val Phe Ser Phe Leu Asp His Ile Asn Leu Cys Arg
245 250 255
Ala Ala Ile Val Cys Arg Gln Trp Gln Ala Ala Ser Ala His Glu Asp
260 265 270
Phe Trp Arg Cys Leu Asn Phe Glu Asn Arg Asn Ile Ser Met Glu Gln
275 280 285
Phe Glu Asp Met Cys Gly Arg Tyr Pro Asn Ala Thr Glu Val Asn Ile
290 295 300
Ser Gly Val Pro Ala Val His Leu Leu Ala Met Lys Ala Val Ser Ser
305 310 315 320
Leu Arg His Leu Glu Val Leu Thr Leu Gly Arg Gly Gln Leu Ala Asp
325 330 335
Asn Phe Phe His Ala Leu Thr Asp Cys His Leu Leu Lys Ser Leu Thr
340 345 350
Val Asn Asp Ser Thr Leu Val Asn Val Thr Gln Glu Ile Pro Ile Ser
355 360 365
His Asp Arg Leu Arg His Leu His Leu Thr Lys Cys Arg Val Ile Arg
370 375 380
Ile Ser Val Arg Cys Pro Gln Leu Glu Thr Leu Ser Leu Lys Arg Ser
385 390 395 400
Asn Met Ala Gln Ala Val Leu Asn Cys Pro Leu Leu Arg Asp Leu Asp
405 410 415
Ile Gly Ser Cys His Lys Leu Ser Asp Ala Ala Ile Arg Ser Ala Ala
420 425 430
Ile Ser Cys Pro Gln Leu Glu Ser Leu Asp Met Ser Asn Cys Ser Cys
435 440 445
Val Ser Asp Glu Thr Leu Arg Glu Ile Ser Ala Asn Cys Pro Asn Leu
450 455 460
Gln Leu Leu Asn Ala Ser Tyr Cys Pro Asn Ile Ser Leu Glu Ser Val
465 470 475 480
Arg Leu Thr Met Leu Thr Val Leu Lys Leu His Ser Cys Glu Gly Ile
485 490 495
Thr Ser Ala Ser Met Thr Ala Ile Ser Ser Ser Ser Gly Leu Lys Val
500 505 510
Leu Glu Leu Asp Asn Cys Ser Leu Leu Thr Ser Val Ser Leu Asp Phe
515 520 525
Pro His Leu Gln Asn Ile Arg Leu Val His Cys Arg Lys Phe Ser Asp
530 535 540
Leu Ser Leu Gln Ser Val Lys Leu Ser Ser Ile Met Val Ser Asn Cys
545 550 555 560
Pro Ser Leu His Arg Ile Asn Ile Thr Ser Asn Leu Leu Gln Lys Leu
565 570 575
Val Leu Lys Lys Gln Glu Ser Leu Ala Lys Leu Val Leu Gln Cys Pro
580 585 590
Ser Leu Gln Asp Val Asp Leu Thr Asp Cys Glu Ser Leu Thr Asn Ser
595 600 605
Ile Cys Glu Val Phe Ser Asp Gly Gly Gly Cys Pro Met Leu Lys Ser
610 615 620
Leu Val Leu Asp Asn Cys Glu Ser Leu Thr Ala Val Arg Phe Cys Ser
625 630 635 640
Ser Ser Leu Gly Ser Leu Ser Leu Val Gly Cys Arg Ala Ile Thr Ser
645 650 655
Leu Glu Leu Gln Cys Pro Asn Leu Glu Gln Val Ser Leu Asp Gly Cys
660 665 670
Asp His Leu Glu Arg Ala Ser Phe Ser Pro Val Gly Leu Arg Ser Leu
675 680 685
Asn Leu Gly Ile Cys Pro Lys Leu Asn Glu Leu Lys Leu Glu Ala Pro
690 695 700
Arg Met Asp Leu Leu Glu Leu Lys Gly Cys Gly Gly Leu Ser Glu Ala
705 710 715 720
Ala Ile Asn Cys Pro Arg Leu Thr Ser Leu Asp Ala Ser Phe Cys Gly
725 730 735
Gln Leu Lys Asp Glu Cys Leu Ser Ala Thr Thr Ala Ser Cys Pro Gln
740 745 750
Ile Glu Ser Leu Ile Leu Met Ser Cys Pro Ser Val Gly Ser Glu Gly
755 760 765
Leu Tyr Ser Leu Arg Cys Leu Leu Lys Leu Val Val Leu Asp Leu Ser
770 775 780
Tyr Thr Phe Leu Met Ser Leu Gln Pro Val Phe Glu Ser Cys Ile Gln
785 790 795 800
Leu Lys Val Leu Lys Leu Gln Ala Cys Lys Tyr Leu Thr Asp Ser Ser
805 810 815
Leu Glu Pro Leu Tyr Lys Glu Asp Ala Leu Pro Ala Leu Gln Glu Leu
820 825 830
Asp Leu Ser Tyr Gly Thr Leu Cys Gln Ser Ala Ile Glu Glu Leu Leu
835 840 845
Ala Cys Cys Thr His Leu Thr His Val Ser Leu Asn Gly Cys Val Asn
850 855 860
Met His Asp Leu Asn Trp Gly Cys Ser Ile Gly Gln Leu Ser Leu Ser
865 870 875 880
Ser Ile Pro Ile Pro Leu Gly Gln Ala Thr Leu Asp Glu Ile Glu Glu
885 890 895
Pro Val Ala Gln Pro Asn Arg Leu Leu Gln Asn Leu Asn Cys Val Gly
900 905 910
Cys Gln Asn Ile Arg Lys Val Leu Ile Pro Pro Ala Ala Arg Cys Phe
915 920 925
His Leu Ser Ser Leu Asn Leu Ser Leu Ser Ser Asn Leu Lys Glu Val
930 935 940
Asp Val Ser Cys Tyr Asn Leu Cys Phe Leu Asn Leu Ser Asn Cys Cys
945 950 955 960
Ser Leu Glu Val Leu Lys Leu Asp Cys Pro Arg Leu Thr Ser Leu Phe
965 970 975
Leu Gln Ser Cys Asn Ile Glu Glu Glu Val Val Val Ala Ala Val Ser
980 985 990
Arg Cys Ser Met Leu Glu Thr Leu Asp Val Arg Leu Cys Pro Lys Ile
995 1000 1005
Ser Ser Ile Ser Met Val Gln Leu Arg Ile Ala Cys Pro Ser Leu
1010 1015 1020
Lys Arg Ile Phe Ser Thr Leu Ser Pro Thr
1025 1030
<210> 11
<211> 3102
<212> DNA
<213> Citrullus lanatus
<400> 11
atgacgattt ggtgctgctt atgcttcacc gttggagaag aagacgaaag ggaaagggaa 60
gaggaactga agaaggaagg tgaaatgaaa cccatgatgc gtgaggaggt ttttgagaac 120
caggatgact ctgatcgcat tgtgcgaaat cgtgatgatt ctcaagggag taatccactt 180
ccgattgctg tagatgatgc gcctgaccgt catgacggtg atcgacttag actgtttgag 240
gatatggtca gagcaatgca cgatggcgcc gatggtggtg gtgctcattg ggacgatgag 300
ctgcgcggcg gcggcggcgg ggctattaat ccctggaatt tttcttttgg aattctgcat 360
caatctgagg gaggagaaag tagtagcgcc tcggctttgt ccttgtcttc tacggtggag 420
acttctaatg aggaacgcga tcgggatgcc aaccataagc gcgctaaagt tctctccaaa 480
ttcactgaga gctcatttgc aactccatgg cctttgggtg ctggaaatcc tatgagagat 540
tatgatttta ttcacggatc atcttcaatt atgagtagga atgaatttct ataccatgct 600
tctacatcat gcagagttga cgaagatttg gaatctagtt ttggtagaga tgatgggatc 660
aatgataatg acacctgtaa atcagaagga tttgaagtaa gaatggatct tacagatgat 720
ttactgcata tggtgttctc tttcttggat cacatcaatc tttgtcgagc tgctatagtc 780
tgcaggcagt ggcaagctgc tagtgctcat gaagatttct ggaggtgttt gaattttgaa 840
aataggaaca tatccatgga acaattcgag gatatgtgtg gaagatatcc aaatgctaca 900
gaggtcaata tctctggtgt acctgccgtt cacttgcttg ccatgaaagc agtttcttct 960
ttaagacatc tggaggtttt aactctgggg agaggacaac tggcagataa cttttttcac 1020
gccctgactg attgccattt attgaagagt ttgactgtca atgattctac gctggttaat 1080
gttacacaag agatacctat aagccatgat agactgcgtc atcttcatct tactaaatgt 1140
cgtgttatac gcatatctgt tagatgtcca caacttgaaa cattgtcgtt gaagcgcagc 1200
aacatggcac aggctgttct taactgcccc cttcttcggg acctggatat aggctcttgc 1260
cacaagctct cagatgctgc aattcgctca gccgctattt catgcccaca gttggaatct 1320
cttgatatgt ctaattgttc atgtgttagc gatgagacat tacgtgaaat ttctgcaaac 1380
tgcccgaatc tccagcttct gaatgcatca tactgcccaa atatatcttt ggagtctgta 1440
agactgacaa tgctgaccgt gcttaagctt cacagctgtg agggcatcac atcagcttca 1500
atgaccgcaa tatctagtag ttctggtttg aaggttttgg agcttgataa ttgcagtctt 1560
ttgacttctg tttctctgga tcttccccat ttacagaata tcagacttgt tcattgccgc 1620
aaattctcag acttgagttt acagagtgtt aaattatcat ccataatggt ctctaattgt 1680
ccatcacttc atcggatcaa catcacttcc aatttacttc aaaaattggt gttgaagaaa 1740
caagagagct tggccaaatt ggttttgcag tgccctagtc tgcaagatgt ggacctcaca 1800
gactgtgaat cgctaacgaa ttctatttgt gaggttttta gtgatggtgg tggatgccct 1860
atgttgaaat cacttgttct tgataactgt gagagtctga ctgctgttcg attctgtagc 1920
agttctttag gcagtctttc ccttgttggt tgccgggcaa tcacttcact tgaacttcaa 1980
tgccctaatc tcgaacaggt ttctttagat ggctgtgatc atcttgagag agcatcattt 2040
tccccggttg gtctgcggtc actaaacctg ggaatctgtc ccaaattgaa tgaattaaaa 2100
cttgaggccc ctcggatgga tttacttgag ttaaaaggtt gtggtggatt gtctgaagca 2160
gccatcaatt gtcctcgtct aacatcgttg gatgcttcct tttgtggcca actgaaagat 2220
gagtgtttgt ctgcgactac tgcctcatgt ccacagattg agtcgttaat actgatgtca 2280
tgtccatcgg ttggttcaga ggggctttac tctctgcgat gccttctgaa gttggttgtg 2340
ctcgatttat catatacctt tttgatgagc ttgcagccag tcttcgagtc ttgtatacaa 2400
cttaaggtat tgaaactaca agcatgcaag tatttaactg actcatcgct agagcctctt 2460
tataaggaag acgctcttcc agctcttcaa gagttagact tatcttacgg gactctttgt 2520
cagtctgcca tagaagagct tcttgcttgt tgcactcact taactcatgt gagcttaaat 2580
gggtgtgtga acatgcatga tctaaattgg ggttgtagca ttggacagct ttcgttgtcc 2640
agcatcccaa ttcctcttgg tcaggccact cttgatgaga ttgaggaacc agttgcacag 2700
ccaaaccgtt tgttacagaa ccttaactgt gtaggttgtc agaatattag aaaggttctc 2760
attcctccag ctgctcgttg ttttcattta tcatcattaa acctatcctt gtcttcaaat 2820
ctcaaggaag ttgacgtctc ttgttacaac ctatgctttc ttaatttgag taattgctgc 2880
tctttggaag ttctaaaact tgactgcccg cggttaacca gtctctttct tcagtcttgc 2940
aacattgaag aagaagtggt tgtggctgcg gtatcgagat gtagcatgct cgagacgttg 3000
gatgtccgct tatgtccaaa gatctcctct attagcatgg tacaactgcg tattgcttgt 3060
ccaagtttga agcggatctt cagcactctg tctccaacat ga 3102
<210> 12
<211> 3102
<212> DNA
<213> Citrullus lanatus
<400> 12
atgacgattt ggtgctgctt atgcttcacc gttggagaag aagacgaaag ggaaagggaa 60
gaggaactga agaaggaagg tgaaatgaaa cccatgatgc gtgaggaggt ttttgagaac 120
caggatgact ctgatcgcat tgtgcgaaat cgtgatgatt ctcaagggag taatccactt 180
ccgattgctg tagatgatgc gcctgaccgt catgacggtg atcgacttag actgtttgag 240
gatatggtca gagcaatgca cgatggcgcc gatggtggtg gtgctcattg ggacgatgag 300
ctgcgcggcg gcggcggcgg ggctattaat ccctggaatt tttcttttgg aattctgcat 360
caatctgagg gaggagaaag tagtagcgcc tcggctttgt ccttgtcttc tacggtggag 420
acttctaatg aggaacgcga tcgggatgcc aaccataagc gcgctaaagt tctctccaaa 480
ttcactgaga gctcatttgc aactccatgg cctttgggtg ctggaaatcc tatgagagat 540
tatgatttta ttcacggatc atcttcaatt atgagtagga atgaatttct ataccatgct 600
tctacatcat gcagagttga cgaagatttg gaatctagtt ttggtagaga tgatgggatc 660
aatgataatg acacctgtaa atcagaagga tttgaagtaa gaatggatct tacagatgat 720
ttactgcata tggtgttctc tttcttggat cacatcaatc tttgtcgagc tgctatagtc 780
tgcaggcagt ggcaagctgc tagtgctcat gaagatttct ggaggtgttt gaattttgaa 840
aataggaaca tatccatgga acaattcgag gatatgtgtg gaagatatcc aaatgctaca 900
gaggtcaata tctctggtgt acctgccgtt cacttgcttg ccatgaaagc agtttcttct 960
ttaagacatc tggaggtttt aactctgggg agaggacaac tggcagataa cttttttcac 1020
gccctgactg attgccattt attgaagagt ttgactgtca atgattctac gctggttaat 1080
gttacacaag agatacctat aagccatgat agactgcgtc atcttcatct tactaaatgt 1140
cgtgttatac gcatatctgt tagatgtcca caacttgaaa cattgtcgtt gaagcgcagc 1200
aacatggcac aggctgttct taactgcccc cttcttcggg acctggatat aggctcttgc 1260
cacaagctct cagatgctgc aattcgctca gccgctattt catgcccaca gttggaatct 1320
cttgatatgt ctaattgttc atgtgttagc gatgagacat tacgtgaaat ttctgcaaac 1380
tgcccgaatc tccagcttct gaatgcatca tactgcccaa atatatcttt ggagtctgta 1440
agactgacaa tgctgaccgt gcttaagctt cacagctgtg agggcatcac atcagcttca 1500
atgaccgcaa tatctagtag ttctggtttg aaggttttgg agcttgataa ttgcagtctt 1560
ttgacttctg tttctctgga ttttccccat ttacagaata tcagacttgt tcattgccgc 1620
aaattctcag acttgagttt acagagtgtt aaattatcat ccataatggt ctctaattgt 1680
ccatcacttc atcggatcaa catcacttcc aatttacttc aaaaattggt gttgaagaaa 1740
caagagagct tggccaaatt ggttttgcag tgccctagtc tgcaagatgt ggacctcaca 1800
gactgtgaat cgctaacgaa ttctatttgt gaggttttta gtgatggtgg tggatgccct 1860
atgttgaaat cacttgttct tgataactgt gagagtctga ctgctgttcg attctgtagc 1920
agttctttag gcagtctttc ccttgttggt tgccgggcaa tcacttcact tgaacttcaa 1980
tgccctaatc tcgaacaggt ttctttagat ggctgtgatc atcttgagag agcatcattt 2040
tccccggttg gtctgcggtc actaaacctg ggaatctgtc ccaaattgaa tgaattaaaa 2100
cttgaggccc ctcggatgga tttacttgag ttaaaaggtt gtggtggatt gtctgaagca 2160
gccatcaatt gtcctcgtct aacatcgttg gatgcttcct tttgtggcca actgaaagat 2220
gagtgtttgt ctgcgactac tgcctcatgt ccacagattg agtcgttaat actgatgtca 2280
tgtccatcgg ttggttcaga ggggctttac tctctgcgat gccttctgaa gttggttgtg 2340
ctcgatttat catatacctt tttgatgagc ttgcagccag tcttcgagtc ttgtatacaa 2400
cttaaggtat tgaaactaca agcatgcaag tatttaactg actcatcgct agagcctctt 2460
tataaggaag acgctcttcc agctcttcaa gagttagact tatcttacgg gactctttgt 2520
cagtctgcca tagaagagct tcttgcttgt tgcactcact taactcatgt gagcttaaat 2580
gggtgtgtga acatgcatga tctaaattgg ggttgtagca ttggacagct ttcgttgtcc 2640
agcatcccaa ttcctcttgg tcaggccact cttgatgaga ttgaggaacc agttgcacag 2700
ccaaaccgtt tgttacagaa ccttaactgt gtaggttgtc agaatattag aaaggttctc 2760
attcctccag ctgctcgttg ttttcattta tcatcattaa acctatcctt gtcttcaaat 2820
ctcaaggaag ttgacgtctc ttgttacaac ctatgctttc ttaatttgag taattgctgc 2880
tctttggaag ttctaaaact tgactgcccg cggttaacca gtctctttct tcagtcttgc 2940
aacattgaag aagaagtggt tgtggctgcg gtatcgagat gtagcatgct cgagacgttg 3000
gatgtccgct tatgtccaaa gatctcctct attagcatgg tacaactgcg tattgcttgt 3060
ccaagtttga agcggatctt cagcactctg tctccaacat ga 3102
<210> 13
<211> 41
<212> PRT
<213> Citrullus lanatus
<400> 13
Leu Thr Asp Asp Leu Leu His Met Val Phe Ser Phe Leu Asp His Ile
1 5 10 15
Asn Leu Cys Arg Ala Ala Ile Val Cys Arg Gln Trp Gln Ala Ala Ser
20 25 30
Ala His Glu Asp Phe Trp Arg Cys Leu
35 40
<210> 14
<211> 6890
<212> DNA
<213> Citrullus lanatus
<400> 14
atgacgattt ggtgctgctt atgcttcacc gttggagaag aagacgaaag ggaaagggaa 60
gaggaactga agaaggaagg tgaaatgaaa cccatgatgc gtgaggaggt ttttgagaac 120
caggatgact ctgatcgcat tgtgcgaaat cgtgatgatt ctcaagggag taatccactt 180
ccgattgctg tagatgatgc gcctgaccgt catgacggtg atcgacttag actgtttgag 240
gatatggtca gagcaatgca cgatggcgcc gatggtggtg gtgctcattg ggacgatgag 300
ctgcgcggcg gcggcggcgg ggctattaat ccctggaatt tttcttttgg aattctgcat 360
caatctgagg gaggagaaag tagtagcgcc tcggctttgt ccttgtcttc tacggtggag 420
acttctaatg aggaacgcga tcgggatgcc aaccataagc gcgctaaagt tctctccaaa 480
ttcacgtgag tcacttgtag actgcttctg gatatgaatt atgctaaggt ttcatgggtt 540
tgccattttt cttggttttc ttttccccct tttccgaaag gggtgttggt tttttttttt 600
tttttttttg ttccttctta aatgttctct ctttgtggga tttaggacta gatattgtgg 660
tggtttttgg atggagatcg ttagcattta ttgaggttat catttacgaa tatgcagggt 720
tctttgtaat ttagctatca atgcaggctg tttgttgtta tttttgtgcc ggcatctctg 780
aataatttgc tgttttgcac tgcaagatag ctatggaaaa ttacgtattt tatgatctaa 840
acgtgctccg cttctttagc tctcgggctg tatcagcgtt tggaaagtag ttgttctata 900
gattttcacg agcaccttct attcttgaat acttgaagtg gtgtctaata taaagcaata 960
tgtttttgca tcgaccttat cccgtccatc tttattgtat gtattagact gttggcaggc 1020
tctttatcat tgtattttaa atattttttc ccgatttcta aattagaaat gtgtttctta 1080
atcaatagtg gcatgttgct tgggcttttc tagaagagat atcatacggt gtgccaagat 1140
gatatctcaa agtcttcttc agttgcgagt cttctgagtg agttgtcacc atggaaaagt 1200
ttccttttct tcatggaata gaaaatcatt tatatttgag aaattcaata tatggttttc 1260
tttctctgag aagagtttga aaatgaaaag tatagatatg aatgtttatt gtttttgatt 1320
gtcttattaa ttgttttttt gaagcaaacc ttcatgtaca acgatattta gggtgtttga 1380
atgcacatag gttctcctat tacatgattt atttatgtac tgaaaattaa aggtgtatta 1440
aatttgagtc ataatttttg taaaaactat tctttctaaa ttgttttctg gatatgccca 1500
aacaagtcct tatattttca agcactgttg accttggtag tatagttatc acactcattt 1560
gcaaacctac ttgtgatact atactttcat tactagttaa aaaaatgtct tcgttaaggt 1620
ttatcatgga gggatgagta tatagctgtt gtcttactgc taaatatgat cttatgttgg 1680
aaactctgcc cttcacatgg tggttgatga tgtatcatgt gatctttagt ttaaaaaaga 1740
gtaaactctg agttaactaa atgtaagtat gtgcagtaat actcattcca gataattcac 1800
attctctcaa ccgtttagat cttgcaaatt agcaccatca agtttcctat aatttacaag 1860
ttagactaac tgataagtgt aaagttagaa atgatgctcg ttattcactt ttaacaattg 1920
tttcttattt tcttttcttt tcaatcttcc ctagtgagag ctcatttgca actccatggc 1980
ctttgggtgc tggaaatcct atgagagatt atgattttat tcacggatca tcttcaatta 2040
tgagtaggaa tgaatttcta taccatgctt ctacatcatg cagagttgac gaagatttgg 2100
aatctagttt tggtagagat gatgggatca atgataatga cacctgtaaa tcagaaggat 2160
ttgaagtaag aatggatctt acagatgatt tactgcatat ggtatgcatc tccagagatt 2220
tattattgtt ttcttgctta ccgtcttatt tcttggattt cttattcaca tgaagttaaa 2280
ttaattgata tcaggtgttc tctttcttgg atcacatcaa tctttgtcga gctgctatag 2340
tctgcaggca gtggcaagct gctagtgctc atgaagattt ctggaggtgt ttgaattttg 2400
aaaataggaa catatccatg gaacaatgta ggtgttgttc tgcttcttcc tttcattttc 2460
tagagtagtt gagacaagaa tgaggtgatt ttaaaaatgt tggttgcctc ttggaaatag 2520
aggtgatata ttatgatgta acttcaaaac atgtaggatg cagtatttga gtctggaatg 2580
tctttagcac tcatgaaatg ttgttaaaag cctaggactg cgacatattt ggggcttgtt 2640
ttcagtactc agtaggattt ttctccctaa atctttttga ctaggtatgt atataatatt 2700
aaaggaaaga acttcttgat gctattttta gctttggcaa tctcttgatt cttttaaaat 2760
aagttctgga tataattgta taaatgtgat aggatgtgac atatctctgt agcagtcttg 2820
gtgccagtgc caatgcaaca ctttcaatcg tatttcaagt ttaacctact tttatccagt 2880
cacattttct ttctacccac catacagtat aaattgatcc ggttgtattt ctttgtgcct 2940
ctgtattaac aactgtccta tcctattcta tgttgcttac tttctaacat cattctgatt 3000
tggagctagt tagttaattg attaattctg actgcagtcg aggatatgtg tggaagatat 3060
ccaaatgcta cagaggtcaa tatctctggt gtacctgccg ttcacttgct tgccatgaaa 3120
gcagtttctt ctttaaggta atgattacgg ttttgtattt ttgttttttt tcctcatcct 3180
gaatctttat ggtggtgctt attattttat tattgtctca gacatctgga ggttttaact 3240
ctggggagag gacaactggc agataacttt tttcacgccc tgactgattg ccatttattg 3300
aagagtttga ctgtcaatga ttctacgctg gttaatgtta cacaagagat acctataagc 3360
catgatagac tgcgtcatct tcatcttact aaatgtcgtg ttatacgcat atctgttagg 3420
ttgctaatgt ttatgtatct taatgctaac tgtatttaat tgtttagttt gttttttttt 3480
tttttttggg tctaaagcat gttttcttgc agatgtccac aacttgaaac attgtcgttg 3540
aagcgcagca acatggcaca ggctgttctt aactgccccc ttcttcggga cctggatata 3600
ggctcttgcc acaagctctc agatgctgca attcgctcag ccgctatttc atgcccacag 3660
ttggaatctc ttgatatgtc taattgttca tgtgttagcg atgagacatt acgtgaaatt 3720
tctgcaaact gcccgaatct ccagcttctg aatgcatcat actgcccaaa tatatctttg 3780
gaggtggcat accattttta gttaaatttt gagcgaaagt gactattttg cccttcagac 3840
ttgtttttcc tgatattttg gttccttttt cttttgaagt ctgtaagact gacaatgctg 3900
accgtgctta agcttcacag ctgtgagggc atcacatcag cttcaatgac cgcaatatct 3960
agtagttctg gtttgaaggt ctgaaataac ctatttcgac tgtttatatt ttctagttgt 4020
ctggtgctgt gtctgagtta gttgaaaatg gaatggagac ttattgcagg ttttggagct 4080
tgataattgc agtcttttga cttctgtttc tctggatctt ccccatttac agaatatcag 4140
acttgttcat tgccgcaagt atgtcttctc atctccaagc aactcatagc ttctatcaca 4200
tgattaattt catttagaag gacttttgaa ctgggccttc acttcttttt tccttgagtt 4260
gaatctgttt cgccattctt gcagattctc agacttgagt ttacagagtg ttaaattatc 4320
atccataatg gtctctaatt gtccatcact tcatcggatc aacatcactt ccaatttact 4380
tcaagtatgt cgtaatggat cttaaagttt tctttcttat taatttcatt tcataagggt 4440
ataaacgaac attggactgt acttttgtgg acttgcagaa attggtgttg aagaaacaag 4500
agagcttggc caaattggtt ttgcagtgcc ctagtctgca agatgtggac ctcacagact 4560
gtgaatcgct aacgaattct atttgtgagg tttttagtga tggtggtgga tgccctatgt 4620
tgaaatcact tgttcttgat aactgtgagg taagtagctt ggtgttaccc atcagtatca 4680
tcgcattggc ccttgtgatt tcataatttg gaaattattt gattgagact ttccattgat 4740
ttctaatgtg aacatgtttc ttttgttcag agtctgactg ctgttcgatt ctgtagcagt 4800
tctttaggca gtctttccct tgttggttgc cgggcaatca cttcacttga acttcaatgc 4860
cctaatctcg aacaggtttc tttagatggc tgtgatcatc ttgagagagc atcattttcc 4920
ccggtatgtg aaaactgaca acttgtaaat ttttctcagt cactatatta taaatattct 4980
ccttagcgct aaagattggg cttttttctc tcttttttaa ggttggtctg cggtcactaa 5040
acctgggaat ctgtcccaaa ttgaatgaat taaaacttga ggcccctcgg atggatttac 5100
ttgagttaaa aggttgtggt ggattgtctg aagcagccat caattgtcct cgtctaacat 5160
cgttggatgc ttccttttgt gggttagttt gttatgatta tttggatgac accttctatt 5220
tgatggatac tggttgctta tgtcgttgag ttcttctttt tcccttgcag ccaactgaaa 5280
gatgagtgtt tgtctgcgac tactgcctca tgtccacaga ttgagtcgtt aatactgatg 5340
tcatgtccat cggttggttc agaggggctt tactctctgc gatgccttct gaagttggtt 5400
gtgctcgatt tatcatatac ctttttgatg agcttgcagc cagtcttcga gtcttgtata 5460
caacttaagg tacctttttg atagatatta tcatgacccc tgtctgattt ctgttgtatt 5520
gatgccttct tctttgtgtt cttaatgaag gtattgaaac tacaagcatg caagtattta 5580
actgactcat cgctagagcc tctttataag gaagacgctc ttccagctct tcaagagtta 5640
gacttatctt acgggactct ttgtcagtct gccatagaag agcttcttgc ttgttgcact 5700
cacttaactc atgtgagctt aaatgggtgt gtgaacatgc atgatctaaa ttggggttgt 5760
agcattggac agctttcgtt gtccagcatc ccaattcctc ttggtcaggc cactcttgat 5820
gagattgagg aaccagttgc acagccaaac cgtttgttac agaaccttaa ctgtgtaggt 5880
tgtcagaata ttagaaaggt tctcattcct ccagctgctc gttgttttca tttatcatca 5940
ttaaacctat ccttgtcttc aaatctcaag gaagttgacg tctcttgtta caacctatgc 6000
tttcttaatt tgaggttatg cccccctacc cttttgctcc attaacaatt ttagttggtt 6060
cctttctttt tttttttttt ggcctaccct gctaaatccg tgtttttgtg atctagtaat 6120
tgctgctctt tggaagttct aaaacttgac tgcccgcggt taaccagtct ctttcttcag 6180
gtaatttttt cttcaatgta agttttggat gttcatacta atctactctg aatagtccag 6240
aatctggtct tccaagcaat ccgaaactaa ccgttgggga tagggtggac aaaaaatggg 6300
gtcaagacag attacaacgc acaagtccac attataagga cccagtcaat gactggagtt 6360
gaactcccaa cctgagaccc ccctgtaggg ctgtaggcct cgggtctaag gaccccaatt 6420
ttgtttgcat ccccctccac ttttaacctt tttttttttt ttttttttgg gataggaatt 6480
catccattgt tggaatcatt tgattatagt ttatttttta tcttattttt tactgttgtg 6540
ttgggtaaac aatactttgg tttcaaactt gagaaaaaaa gaaatggcag ctaagagatg 6600
catatgaatt ttatgatatg aggctaacta gatctgtctt ttcctagtct tgcaacattg 6660
aagaagaagt ggttgtggct gcggtatcga gatgtagcat gctcgagacg ttggatgtcc 6720
gcttatgtcc aaaggtgagg ggtgtctctc ttttcctcta cattgtttga tagttttggc 6780
tgacttcata atatttcttc tactggcaga tctcctctat tagcatggta caactgcgta 6840
ttgcttgtcc aagtttgaag cggatcttca gcactctgtc tccaacatga 6890
Claims (18)
- 염색체 5에 위치된 WAP5.1로 명명된 내인성 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 수박 식물 또는 식물 부분으로서, 여기서 상기 돌연변이체 대립유전자는
a) 야생형 대립유전자와 비교하여 대립유전자의 발현 없음 또는 감소된 발현을 초래하는 조절 요소에 하나 이상의 돌연변이를 포함하거나, 또는
b) 야생형 단백질과 비교하여 대체, 삽입 또는 결실된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하고,
여기서 a) 또는 b)의 상기 돌연변이체 대립유전자는 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 부여하고, 여기서 야생형 WAP5.1 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질, 또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95% 서열 동일성을 포함하는 단백질을 코딩하는 것인 수박 식물 또는 식물 부분. - 제1항에 있어서, 상기 돌연변이체 대립유전자가 서열식별번호: 1 또는 서열식별번호: 9의 아미노산 237에서 시작하여 아미노산 277에서 끝나는 단백질의 F-박스 도메인에서 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하는 것인 수박 식물 또는 식물 부분.
- 제1항에 있어서, 상기 돌연변이체 대립유전자가 서열식별번호: 1 또는 서열식별번호: 9의 아미노산 291에서 시작하여 아미노산 1033에서 끝나는 단백질의 LRR-도메인에서 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하며, 여기서 상기 삽입, 결실 또는 대체가 단백질의 LRR-도메인의 부적절한 폴딩을 초래하는 것인 수박 식물 또는 식물 부분.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 돌연변이체 대립유전자가 서열식별번호: 1 또는 서열식별번호: 9의 아미노산 번호 D209, A257, A266, W274, E287, Q333, L528, P308 또는 G330을 코딩하는 코돈에 돌연변이를 포함하는 것인 수박 식물 또는 식물 부분.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 돌연변이체 대립유전자가 서열식별번호: 1 또는 서열식별번호: 9의 아미노산 번호 D209, A257, A266, W274, E287, Q333, L528, P308 또는 G330의 아미노산 치환 또는 정지 코돈을 코딩하는 것인 수박 식물 또는 식물 부분.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 돌연변이체 대립유전자가 서열식별번호: 1 또는 서열식별번호: 9의 하기 아미노산 변화: D209V, A257V, A266V, W274STOP, E287K, Q333STOP, L528F, P308L 또는 G330E 중 하나 이상을 코딩하는 것인 수박 식물 또는 식물 부분.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 식물 또는 식물 부분이 2배체이고 돌연변이체 대립유전자에 대해 동형접합성인 수박 식물 또는 식물 부분.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 수박 식물이 2배체, 3배체 또는 4배체인 식물 또는 식물 부분.
- 제8항에 있어서, 2배체 식물 또는 식물 부분이 돌연변이체 대립유전자의 2개 카피를 포함하고, 3배체 식물 또는 식물 부분이 1, 2 또는 3개 카피를 포함하고, 4배체 식물 또는 식물 부분이 2 또는 4개 카피를 포함하는 것인 식물 또는 식물 부분.
- 제1항 내지 제9항 중 어느 한 항에 따른 식물 또는 식물 부분이 성장될 수 있는 종자.
- 제1항 내지 제9항 중 어느 한 항에 따른 식물에 의해 생산된 과실로서, 임의로 여기서 과실은 씨가 없고 수분의 부재 하에 생산된 것인 과실.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 식물 또는 식물 부분이 웅성 불임을 부여하는 유전자 또는 위단위결과를 부여하는 유전자 또는 단위결과를 부여하는 또 다른 유전자를 추가로 포함하는 것인 식물 또는 식물 부분.
- 제1항 내지 제9항 및 제12항 중 어느 한 항에 있어서, 식물 부분이 세포, 꽃, 잎, 줄기, 삽목, 배주, 화분, 뿌리, 근경, 접순, 과실, 원형질체, 배아, 꽃밥인 식물 부분.
- 제13항에 따른 식물 부분으로부터 번식된 영양 번식 식물.
- 제1항 내지 제6항 중 어느 한 항에 따른 돌연변이체 대립유전자의 2개 카피를 포함하는 2배체 수박 식물을 성장시키는 단계로서, 여기서 꽃의 수분이 성장 동안 방지되는 것인 단계, 및 수분되지 않은 꽃으로부터 생산된 씨없는 과실을 수확하는 단계를 포함하는, 씨없는 수박 과실을 생산하는 방법.
- 제1항 내지 제6항 중 어느 한 항에 따른 돌연변이체 대립유전자의 1, 2 또는 3개 카피를 포함하는 3배체 수박 식물을 성장시키는 단계로서, 여기서 성장 동안 수분자 식물이 존재하지 않는 것인 단계, 및 수분되지 않은 꽃으로부터 생산된 씨없는 과실을 수확하는 단계를 포함하는, 씨없는 수박 과실을 생산하는 방법.
- 하기 단계를 포함하는, WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 존재에 대해 수박 식물, 종자, 식물 부분 또는 이로부터의 DNA를 스크리닝하기 위한, 또는 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자를 포함하는 수박 식물, 종자 또는 식물 부분을 선택하기 위한 방법:
a) 게놈 DNA가 서열식별번호: 1 또는 9의 단백질, 또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95% 서열 동일성을 포함하는 단백질을 코딩하는 야생형 WAP5.1 대립유전자, 및/또는 야생형 WAP5.1 단백질과 비교하여 대체, 삽입 또는 결실된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하는 돌연변이체 WAP5.1 대립유전자를 포함하는지 여부를 분석하는 단계, 및 임의로
b) 야생형 대립유전자의 2개 카피, 돌연변이체 대립유전자의 2개 카피 또는 야생형 대립유전자의 1개 카피 및 돌연변이체 대립유전자의 1개 카피를 포함하는 식물, 종자 또는 식물 부분을 선택하는 단계. - 제17항에 있어서, 단계 a)가 하기로부터 선택된 방법을 포함하는 것인 방법:
i) WAP5.1 대립유전자의 DNA에 혼성화하는 하나 이상의 올리고뉴클레오티드 프라이머를 사용한 WAP5.1 대립유전자의 적어도 일부의 증폭,
ii) WAP5.1 대립유전자의 DNA의 적어도 일부에 대한 하나 이상의 올리고뉴클레오티드 프로브의 혼성화,
iii) WAP5.1 대립유전자의 DNA, mRNA 또는 cDNA의 시퀀싱.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20201337.1 | 2020-10-12 | ||
EP20201337 | 2020-10-12 | ||
US202063111898P | 2020-11-10 | 2020-11-10 | |
US63/111,898 | 2020-11-10 | ||
US202063117223P | 2020-11-23 | 2020-11-23 | |
US63/117,223 | 2020-11-23 | ||
PCT/EP2021/077239 WO2022078792A1 (en) | 2020-10-12 | 2021-10-04 | Parthenocarpic watermelon plants |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230085165A true KR20230085165A (ko) | 2023-06-13 |
Family
ID=78049260
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237015642A KR20230085165A (ko) | 2020-10-12 | 2021-10-04 | 단위결과성 수박 식물 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20230371453A1 (ko) |
EP (1) | EP4225020A1 (ko) |
JP (1) | JP2023544432A (ko) |
KR (1) | KR20230085165A (ko) |
CN (1) | CN116390646A (ko) |
AU (1) | AU2021359680A1 (ko) |
IL (1) | IL302009A (ko) |
MX (1) | MX2023004203A (ko) |
WO (1) | WO2022078792A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2022301661A1 (en) | 2021-06-30 | 2024-02-08 | Nunhems B.V. | Methods for selecting watermelon plants and plant parts comprising a modified dwarf14 gene |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5210015A (en) | 1990-08-06 | 1993-05-11 | Hoffman-La Roche Inc. | Homogeneous assay system using the nuclease activity of a nucleic acid polymerase |
GB0510979D0 (en) | 2005-05-28 | 2005-07-06 | Kbiosciences Ltd | Detection system for PCR assay |
MX2013005856A (es) | 2010-11-24 | 2013-12-06 | Nunhems Bv | Sandias polinizadoras de doble proposito. |
US10316369B2 (en) | 2014-06-27 | 2019-06-11 | Seminis Vegetable Seeds, Inc. | Methods and assays for male sterile watermelon |
US10745710B2 (en) * | 2015-08-06 | 2020-08-18 | University Of Tsukuba | Plant having mutant cyclin F-box gene |
EA201892624A1 (ru) | 2016-05-26 | 2019-06-28 | Нунхемс Б.В. | Растения, дающие бессемянные плоды |
AU2017336342B2 (en) | 2016-09-30 | 2023-09-21 | Nunhems B.V. | Parthenocarpic watermelon plants |
WO2019238832A1 (en) | 2018-06-15 | 2019-12-19 | Nunhems B.V. | Seedless watermelon plants comprising modifications in an abc transporter gene |
-
2021
- 2021-10-04 WO PCT/EP2021/077239 patent/WO2022078792A1/en unknown
- 2021-10-04 US US18/031,322 patent/US20230371453A1/en active Pending
- 2021-10-04 AU AU2021359680A patent/AU2021359680A1/en active Pending
- 2021-10-04 KR KR1020237015642A patent/KR20230085165A/ko unknown
- 2021-10-04 JP JP2023521707A patent/JP2023544432A/ja active Pending
- 2021-10-04 EP EP21785904.0A patent/EP4225020A1/en active Pending
- 2021-10-04 IL IL302009A patent/IL302009A/en unknown
- 2021-10-04 CN CN202180069936.8A patent/CN116390646A/zh active Pending
- 2021-10-04 MX MX2023004203A patent/MX2023004203A/es unknown
Also Published As
Publication number | Publication date |
---|---|
IL302009A (en) | 2023-06-01 |
MX2023004203A (es) | 2023-05-17 |
US20230371453A1 (en) | 2023-11-23 |
AU2021359680A1 (en) | 2023-06-15 |
WO2022078792A1 (en) | 2022-04-21 |
JP2023544432A (ja) | 2023-10-23 |
AU2021359680A9 (en) | 2024-02-08 |
EP4225020A1 (en) | 2023-08-16 |
CN116390646A (zh) | 2023-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2017336342B2 (en) | Parthenocarpic watermelon plants | |
KR20230098337A (ko) | 단위결과성 수박 식물 | |
CN113365494B (zh) | 能够发生种子败育型的果实形成的茄子科植物 | |
US20230371453A1 (en) | Parthenocarpic watermelon plants | |
US20230404007A1 (en) | Parthenocarpic watermelon plants | |
US20240164270A1 (en) | Watermelon gene conferring a high number of male flowers | |
US11987799B2 (en) | Downy mildew resistance in Cucurbitaceae plants | |
US20230323385A1 (en) | Plants with improved nematode resistance | |
US20230189732A1 (en) | Didymella bryoniae internal fruit rot resistance in cucumis sativus plants | |
OA21227A (en) | Parthenocarpic watermelon plants. | |
OA21301A (en) | Parthenocarpic watermelon plants. | |
CN116615098A (zh) | 单性结实西瓜植物 | |
KR20240029040A (ko) | 변형된 dwarf14 유전자를 포함하는 수박 식물 및 식물 부분을 선택하는 방법 | |
JP2024523647A (ja) | 改変dwarf14遺伝子を含むスイカ植物及び植物部分を選択する方法 | |
CN117677286A (zh) | 用于选择包含修饰的dwarf14基因的西瓜植物和植物部分的方法 |