KR102248730B1 - 유전자 표적화를 위한 범용 공여자 시스템 - Google Patents
유전자 표적화를 위한 범용 공여자 시스템 Download PDFInfo
- Publication number
- KR102248730B1 KR102248730B1 KR1020167014602A KR20167014602A KR102248730B1 KR 102248730 B1 KR102248730 B1 KR 102248730B1 KR 1020167014602 A KR1020167014602 A KR 1020167014602A KR 20167014602 A KR20167014602 A KR 20167014602A KR 102248730 B1 KR102248730 B1 KR 102248730B1
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- polynucleotide
- dna
- plant
- gene
- Prior art date
Links
- 238000010363 gene targeting Methods 0.000 title description 3
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 239
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 239
- 239000002157 polynucleotide Substances 0.000 claims abstract description 238
- 230000010354 integration Effects 0.000 claims abstract description 48
- 230000008685 targeting Effects 0.000 claims abstract description 37
- 241000196324 Embryophyta Species 0.000 claims description 315
- 108090000623 proteins and genes Proteins 0.000 claims description 232
- 230000027455 binding Effects 0.000 claims description 139
- 238000000034 method Methods 0.000 claims description 134
- 150000007523 nucleic acids Chemical group 0.000 claims description 89
- 230000014509 gene expression Effects 0.000 claims description 85
- 239000013612 plasmid Substances 0.000 claims description 83
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 76
- 101710163270 Nuclease Proteins 0.000 claims description 71
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 65
- 229910052725 zinc Inorganic materials 0.000 claims description 65
- 239000011701 zinc Substances 0.000 claims description 65
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 62
- 239000002773 nucleotide Substances 0.000 claims description 61
- 125000003729 nucleotide group Chemical group 0.000 claims description 59
- 229920001184 polypeptide Polymers 0.000 claims description 56
- 238000004458 analytical method Methods 0.000 claims description 50
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 48
- 108700019146 Transgenes Proteins 0.000 claims description 47
- 230000004568 DNA-binding Effects 0.000 claims description 45
- 230000009261 transgenic effect Effects 0.000 claims description 39
- 239000003550 marker Substances 0.000 claims description 36
- 108091008146 restriction endonucleases Proteins 0.000 claims description 36
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 34
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 30
- 108091026890 Coding region Proteins 0.000 claims description 25
- 238000003556 assay Methods 0.000 claims description 24
- 108091008324 binding proteins Proteins 0.000 claims description 18
- 229940104302 cytosine Drugs 0.000 claims description 16
- 230000010076 replication Effects 0.000 claims description 16
- 240000007594 Oryza sativa Species 0.000 claims description 14
- 108091033409 CRISPR Proteins 0.000 claims description 10
- 244000068988 Glycine max Species 0.000 claims description 9
- 241000209140 Triticum Species 0.000 claims description 9
- 230000006798 recombination Effects 0.000 claims description 9
- 238000005215 recombination Methods 0.000 claims description 9
- 239000005562 Glyphosate Substances 0.000 claims description 8
- 108700008625 Reporter Genes Proteins 0.000 claims description 8
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 claims description 8
- 229940097068 glyphosate Drugs 0.000 claims description 8
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 claims description 7
- 229930027917 kanamycin Natural products 0.000 claims description 7
- 229960000318 kanamycin Drugs 0.000 claims description 7
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 claims description 7
- 229930182823 kanamycin A Natural products 0.000 claims description 7
- 101150113864 pat gene Proteins 0.000 claims description 7
- 238000010354 CRISPR gene editing Methods 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 6
- 241001233957 eudicotyledons Species 0.000 claims description 5
- 230000011987 methylation Effects 0.000 claims description 5
- 238000007069 methylation reaction Methods 0.000 claims description 5
- 101100442689 Caenorhabditis elegans hdl-1 gene Proteins 0.000 claims description 4
- 241001057636 Dracaena deremensis Species 0.000 claims description 4
- 235000004341 Gossypium herbaceum Nutrition 0.000 claims description 4
- 240000002024 Gossypium herbaceum Species 0.000 claims description 4
- 229960005091 chloramphenicol Drugs 0.000 claims description 4
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 claims description 4
- 229960000268 spectinomycin Drugs 0.000 claims description 4
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 claims description 4
- 238000010459 TALEN Methods 0.000 claims description 3
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims description 3
- 229960000723 ampicillin Drugs 0.000 claims description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 claims description 3
- 101150054900 gus gene Proteins 0.000 claims description 3
- 230000008263 repair mechanism Effects 0.000 claims description 3
- JQXXHWHPUNPDRT-WLSIYKJHSA-N rifampicin Chemical compound O([C@](C1=O)(C)O/C=C/[C@@H]([C@H]([C@@H](OC(C)=O)[C@H](C)[C@H](O)[C@H](C)[C@@H](O)[C@@H](C)\C=C\C=C(C)/C(=O)NC=2C(O)=C3C([O-])=C4C)C)OC)C4=C1C3=C(O)C=2\C=N\N1CC[NH+](C)CC1 JQXXHWHPUNPDRT-WLSIYKJHSA-N 0.000 claims description 3
- 229960001225 rifampicin Drugs 0.000 claims description 3
- 102000023732 binding proteins Human genes 0.000 claims 4
- 240000000385 Brassica napus var. napus Species 0.000 claims 2
- 108020004414 DNA Proteins 0.000 description 251
- 210000004027 cell Anatomy 0.000 description 160
- 101710185494 Zinc finger protein Proteins 0.000 description 119
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 119
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 108
- 240000008042 Zea mays Species 0.000 description 80
- 238000003776 cleavage reaction Methods 0.000 description 80
- 230000007017 scission Effects 0.000 description 80
- 102000039446 nucleic acids Human genes 0.000 description 72
- 108020004707 nucleic acids Proteins 0.000 description 72
- 102000004169 proteins and genes Human genes 0.000 description 63
- 235000018102 proteins Nutrition 0.000 description 62
- 235000007244 Zea mays Nutrition 0.000 description 48
- 230000009466 transformation Effects 0.000 description 47
- 229940088598 enzyme Drugs 0.000 description 45
- 102000004190 Enzymes Human genes 0.000 description 44
- 108090000790 Enzymes Proteins 0.000 description 44
- 210000001938 protoplast Anatomy 0.000 description 40
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 32
- 239000012634 fragment Substances 0.000 description 32
- 238000013461 design Methods 0.000 description 29
- 230000000694 effects Effects 0.000 description 29
- 238000009396 hybridization Methods 0.000 description 29
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 27
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 27
- 239000000523 sample Substances 0.000 description 27
- 239000000047 product Substances 0.000 description 26
- 210000001519 tissue Anatomy 0.000 description 26
- 238000003780 insertion Methods 0.000 description 25
- 230000037431 insertion Effects 0.000 description 25
- 239000004009 herbicide Substances 0.000 description 24
- 239000013598 vector Substances 0.000 description 24
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 22
- 238000002844 melting Methods 0.000 description 21
- 230000008018 melting Effects 0.000 description 21
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 20
- 235000005822 corn Nutrition 0.000 description 20
- 239000000203 mixture Substances 0.000 description 20
- 239000013600 plasmid vector Substances 0.000 description 20
- 230000001105 regulatory effect Effects 0.000 description 20
- 238000006243 chemical reaction Methods 0.000 description 18
- 230000001939 inductive effect Effects 0.000 description 18
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 17
- 230000006780 non-homologous end joining Effects 0.000 description 17
- 241000589158 Agrobacterium Species 0.000 description 16
- 230000001404 mediated effect Effects 0.000 description 16
- 230000004048 modification Effects 0.000 description 16
- 238000012986 modification Methods 0.000 description 16
- 102000037865 fusion proteins Human genes 0.000 description 15
- 108020001507 fusion proteins Proteins 0.000 description 15
- 230000035772 mutation Effects 0.000 description 15
- 102000014914 Carrier Proteins Human genes 0.000 description 14
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 14
- 241000238631 Hexapoda Species 0.000 description 14
- 241000700605 Viruses Species 0.000 description 14
- 235000001014 amino acid Nutrition 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 239000000243 solution Substances 0.000 description 14
- 102000053602 DNA Human genes 0.000 description 13
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 13
- 150000001413 amino acids Chemical class 0.000 description 13
- 238000013518 transcription Methods 0.000 description 13
- 230000035897 transcription Effects 0.000 description 13
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 12
- 108010042407 Endonucleases Proteins 0.000 description 12
- 102000004533 Endonucleases Human genes 0.000 description 12
- 244000061176 Nicotiana tabacum Species 0.000 description 12
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 12
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 12
- 230000004927 fusion Effects 0.000 description 12
- 235000009973 maize Nutrition 0.000 description 12
- 230000000295 complement effect Effects 0.000 description 11
- 238000004519 manufacturing process Methods 0.000 description 11
- 238000003199 nucleic acid amplification method Methods 0.000 description 11
- 238000013519 translation Methods 0.000 description 11
- 108091034117 Oligonucleotide Proteins 0.000 description 10
- 235000007164 Oryza sativa Nutrition 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 125000003275 alpha amino acid group Chemical group 0.000 description 10
- 230000003321 amplification Effects 0.000 description 10
- 238000001514 detection method Methods 0.000 description 10
- 238000002744 homologous recombination Methods 0.000 description 10
- 230000006801 homologous recombination Effects 0.000 description 10
- 238000012546 transfer Methods 0.000 description 10
- 238000005406 washing Methods 0.000 description 10
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 9
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 235000009566 rice Nutrition 0.000 description 9
- 108010048818 seryl-histidine Proteins 0.000 description 9
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 8
- 108091079001 CRISPR RNA Proteins 0.000 description 8
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 8
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 8
- 238000012408 PCR amplification Methods 0.000 description 8
- 239000011543 agarose gel Substances 0.000 description 8
- 150000001875 compounds Chemical class 0.000 description 8
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 8
- 239000000411 inducer Substances 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 230000008439 repair process Effects 0.000 description 8
- 108091093088 Amplicon Proteins 0.000 description 7
- 239000002202 Polyethylene glycol Substances 0.000 description 7
- 230000001580 bacterial effect Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 239000002299 complementary DNA Substances 0.000 description 7
- 238000005520 cutting process Methods 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 238000007481 next generation sequencing Methods 0.000 description 7
- 229920001223 polyethylene glycol Polymers 0.000 description 7
- 150000003839 salts Chemical class 0.000 description 7
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 6
- DQTIWTULBGLJBL-DCAQKATOSA-N Asn-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N DQTIWTULBGLJBL-DCAQKATOSA-N 0.000 description 6
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 6
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 6
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 6
- -1 but not limited to Chemical class 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 6
- 238000006471 dimerization reaction Methods 0.000 description 6
- 230000005782 double-strand break Effects 0.000 description 6
- 230000002363 herbicidal effect Effects 0.000 description 6
- 238000001727 in vivo Methods 0.000 description 6
- 239000012528 membrane Substances 0.000 description 6
- 230000008929 regeneration Effects 0.000 description 6
- 238000011069 regeneration method Methods 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 238000011282 treatment Methods 0.000 description 6
- 240000002791 Brassica napus Species 0.000 description 5
- 101710132601 Capsid protein Proteins 0.000 description 5
- 230000007018 DNA scission Effects 0.000 description 5
- 235000010469 Glycine max Nutrition 0.000 description 5
- 244000020551 Helianthus annuus Species 0.000 description 5
- 235000003222 Helianthus annuus Nutrition 0.000 description 5
- 240000005979 Hordeum vulgare Species 0.000 description 5
- 235000007340 Hordeum vulgare Nutrition 0.000 description 5
- 241000227653 Lycopersicon Species 0.000 description 5
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 5
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 5
- 241000723792 Tobacco etch virus Species 0.000 description 5
- 241000723873 Tobacco mosaic virus Species 0.000 description 5
- 235000021307 Triticum Nutrition 0.000 description 5
- 241000589634 Xanthomonas Species 0.000 description 5
- 239000002253 acid Substances 0.000 description 5
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 5
- 210000002421 cell wall Anatomy 0.000 description 5
- 238000005119 centrifugation Methods 0.000 description 5
- 239000000539 dimer Substances 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 238000004520 electroporation Methods 0.000 description 5
- 238000002955 isolation Methods 0.000 description 5
- 210000000056 organ Anatomy 0.000 description 5
- 244000052769 pathogen Species 0.000 description 5
- 230000001717 pathogenic effect Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- NJRXVEJTAYWCQJ-UHFFFAOYSA-N thiomalic acid Chemical compound OC(=O)CC(S)C(O)=O NJRXVEJTAYWCQJ-UHFFFAOYSA-N 0.000 description 5
- 239000005631 2,4-Dichlorophenoxyacetic acid Substances 0.000 description 4
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 4
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 4
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 4
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 4
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 4
- 108010077544 Chromatin Proteins 0.000 description 4
- 101710094648 Coat protein Proteins 0.000 description 4
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 4
- 208000035240 Disease Resistance Diseases 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 4
- 101710186901 Globulin 1 Proteins 0.000 description 4
- 241000219146 Gossypium Species 0.000 description 4
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 4
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 4
- 206010020649 Hyperkeratosis Diseases 0.000 description 4
- IMQLKJBTEOYOSI-GPIVLXJGSA-N Inositol-hexakisphosphate Chemical compound OP(O)(=O)O[C@H]1[C@H](OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@@H]1OP(O)(O)=O IMQLKJBTEOYOSI-GPIVLXJGSA-N 0.000 description 4
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 4
- 101710125418 Major capsid protein Proteins 0.000 description 4
- 229930195725 Mannitol Natural products 0.000 description 4
- 101710141454 Nucleoprotein Proteins 0.000 description 4
- 238000010222 PCR analysis Methods 0.000 description 4
- 101710083689 Probable capsid protein Proteins 0.000 description 4
- 241000607479 Yersinia pestis Species 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 230000004075 alteration Effects 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 230000000692 anti-sense effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 210000003483 chromatin Anatomy 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 230000021615 conjugation Effects 0.000 description 4
- 244000038559 crop plants Species 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 235000013399 edible fruits Nutrition 0.000 description 4
- 210000002257 embryonic structure Anatomy 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 230000009368 gene silencing by RNA Effects 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 239000000594 mannitol Substances 0.000 description 4
- 235000010355 mannitol Nutrition 0.000 description 4
- 238000000520 microinjection Methods 0.000 description 4
- 238000002703 mutagenesis Methods 0.000 description 4
- 231100000350 mutagenesis Toxicity 0.000 description 4
- 235000002949 phytic acid Nutrition 0.000 description 4
- 238000003976 plant breeding Methods 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 230000001172 regenerating effect Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 231100000331 toxic Toxicity 0.000 description 4
- 230000002588 toxic effect Effects 0.000 description 4
- 238000011426 transformation method Methods 0.000 description 4
- 230000001131 transforming effect Effects 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 3
- 241000724328 Alfalfa mosaic virus Species 0.000 description 3
- 241000219195 Arabidopsis thaliana Species 0.000 description 3
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 3
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 3
- 229930192334 Auxin Natural products 0.000 description 3
- 108090001008 Avidin Proteins 0.000 description 3
- 241000219198 Brassica Species 0.000 description 3
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 3
- 244000020518 Carthamus tinctorius Species 0.000 description 3
- 238000002965 ELISA Methods 0.000 description 3
- 238000012286 ELISA Assay Methods 0.000 description 3
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 3
- 239000005561 Glufosinate Substances 0.000 description 3
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 3
- 108010033040 Histones Proteins 0.000 description 3
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 3
- 235000004431 Linum usitatissimum Nutrition 0.000 description 3
- 240000006240 Linum usitatissimum Species 0.000 description 3
- 108060001084 Luciferase Proteins 0.000 description 3
- 239000005089 Luciferase Substances 0.000 description 3
- 240000003183 Manihot esculenta Species 0.000 description 3
- 108091061960 Naked DNA Proteins 0.000 description 3
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 238000002944 PCR assay Methods 0.000 description 3
- 241000219843 Pisum Species 0.000 description 3
- 108020001991 Protoporphyrinogen Oxidase Proteins 0.000 description 3
- 102000005135 Protoporphyrinogen oxidase Human genes 0.000 description 3
- 108091030071 RNAI Proteins 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 3
- 108091028113 Trans-activating crRNA Proteins 0.000 description 3
- 229920002494 Zein Polymers 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 108010041407 alanylaspartic acid Proteins 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 239000000427 antigen Substances 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 239000002363 auxin Substances 0.000 description 3
- 101150103518 bar gene Proteins 0.000 description 3
- JFDZBHWFFUWGJE-UHFFFAOYSA-N benzonitrile Chemical compound N#CC1=CC=CC=C1 JFDZBHWFFUWGJE-UHFFFAOYSA-N 0.000 description 3
- 244000275904 brauner Senf Species 0.000 description 3
- 238000009395 breeding Methods 0.000 description 3
- 230000001488 breeding effect Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 108010031100 chloroplast transit peptides Proteins 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 239000005547 deoxyribonucleotide Substances 0.000 description 3
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 3
- 239000012636 effector Substances 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 239000013613 expression plasmid Substances 0.000 description 3
- 235000004426 flaxseed Nutrition 0.000 description 3
- 108010020688 glycylhistidine Proteins 0.000 description 3
- 238000006460 hydrolysis reaction Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 235000016709 nutrition Nutrition 0.000 description 3
- YCIMNLLNPGFGHC-UHFFFAOYSA-N o-dihydroxy-benzene Natural products OC1=CC=CC=C1O YCIMNLLNPGFGHC-UHFFFAOYSA-N 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 108010082527 phosphinothricin N-acetyltransferase Proteins 0.000 description 3
- 230000037039 plant physiology Effects 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 101150075980 psbA gene Proteins 0.000 description 3
- 238000010791 quenching Methods 0.000 description 3
- 230000000171 quenching effect Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- HBMJWWWQQXIZIP-UHFFFAOYSA-N silicon carbide Chemical class [Si+]#[C-] HBMJWWWQQXIZIP-UHFFFAOYSA-N 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 230000009870 specific binding Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 229940093612 zein Drugs 0.000 description 3
- 239000005019 zein Substances 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- HXKWSTRRCHTUEC-UHFFFAOYSA-N 2,4-Dichlorophenoxyaceticacid Chemical compound OC(=O)C(Cl)OC1=CC=C(Cl)C=C1 HXKWSTRRCHTUEC-UHFFFAOYSA-N 0.000 description 2
- 108020005345 3' Untranslated Regions Proteins 0.000 description 2
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 description 2
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 108010016119 Alpha-Ketoglutarate-Dependent Dioxygenase FTO Proteins 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- 241000219194 Arabidopsis Species 0.000 description 2
- 244000105624 Arachis hypogaea Species 0.000 description 2
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 2
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 2
- 206010003694 Atrophy Diseases 0.000 description 2
- KHBQMWCZKVMBLN-UHFFFAOYSA-N Benzenesulfonamide Chemical compound NS(=O)(=O)C1=CC=CC=C1 KHBQMWCZKVMBLN-UHFFFAOYSA-N 0.000 description 2
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 2
- 235000011331 Brassica Nutrition 0.000 description 2
- 235000005156 Brassica carinata Nutrition 0.000 description 2
- 244000257790 Brassica carinata Species 0.000 description 2
- 244000178993 Brassica juncea Species 0.000 description 2
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 2
- 235000011293 Brassica napus Nutrition 0.000 description 2
- 240000007124 Brassica oleracea Species 0.000 description 2
- 238000010453 CRISPR/Cas method Methods 0.000 description 2
- 102000000584 Calmodulin Human genes 0.000 description 2
- 108010041952 Calmodulin Proteins 0.000 description 2
- 108010022172 Chitinases Proteins 0.000 description 2
- 102000012286 Chitinases Human genes 0.000 description 2
- 241000207199 Citrus Species 0.000 description 2
- 229920000742 Cotton Polymers 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- 240000001980 Cucurbita pepo Species 0.000 description 2
- 235000009852 Cucurbita pepo Nutrition 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 2
- 101710096438 DNA-binding protein Proteins 0.000 description 2
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 2
- 102000016680 Dioxygenases Human genes 0.000 description 2
- 108010028143 Dioxygenases Proteins 0.000 description 2
- AOJJSUZBOXZQNB-TZSSRYMLSA-N Doxorubicin Chemical compound O([C@H]1C[C@@](O)(CC=2C(O)=C3C(=O)C=4C=CC=C(C=4C(=O)C3=C(O)C=21)OC)C(=O)CO)[C@H]1C[C@H](N)[C@H](O)[C@H](C)O1 AOJJSUZBOXZQNB-TZSSRYMLSA-N 0.000 description 2
- 241000710188 Encephalomyocarditis virus Species 0.000 description 2
- 101000889905 Enterobacteria phage RB3 Intron-associated endonuclease 3 Proteins 0.000 description 2
- 101000889904 Enterobacteria phage T4 Defective intron-associated endonuclease 3 Proteins 0.000 description 2
- 101000889900 Enterobacteria phage T4 Intron-associated endonuclease 1 Proteins 0.000 description 2
- 101000889899 Enterobacteria phage T4 Intron-associated endonuclease 2 Proteins 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 2
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 2
- 108010060309 Glucuronidase Proteins 0.000 description 2
- 102000053187 Glucuronidase Human genes 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 235000009438 Gossypium Nutrition 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 108020005004 Guide RNA Proteins 0.000 description 2
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 2
- ZPVJJPAIUZLSNE-DCAQKATOSA-N His-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O ZPVJJPAIUZLSNE-DCAQKATOSA-N 0.000 description 2
- 102100033636 Histone H3.2 Human genes 0.000 description 2
- 101000899240 Homo sapiens Endoplasmic reticulum chaperone BiP Proteins 0.000 description 2
- SIKJAQJRHWYJAI-UHFFFAOYSA-N Indole Chemical compound C1=CC=C2NC=CC2=C1 SIKJAQJRHWYJAI-UHFFFAOYSA-N 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- 108700005090 Lethal Genes Proteins 0.000 description 2
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 2
- 241001424413 Lucia Species 0.000 description 2
- 241000710118 Maize chlorotic mottle virus Species 0.000 description 2
- 241000723994 Maize dwarf mosaic virus Species 0.000 description 2
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 2
- 241000219823 Medicago Species 0.000 description 2
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 2
- XUMBMVFBXHLACL-UHFFFAOYSA-N Melanin Chemical compound O=C1C(=O)C(C2=CNC3=C(C(C(=O)C4=C32)=O)C)=C2C4=CNC2=C1C XUMBMVFBXHLACL-UHFFFAOYSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 108091092724 Noncoding DNA Proteins 0.000 description 2
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 2
- 102000015636 Oligopeptides Human genes 0.000 description 2
- 108010038807 Oligopeptides Proteins 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 108091081548 Palindromic sequence Proteins 0.000 description 2
- 244000062780 Petroselinum sativum Species 0.000 description 2
- 241000709664 Picornaviridae Species 0.000 description 2
- 108010059820 Polygalacturonase Proteins 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 241000220324 Pyrus Species 0.000 description 2
- 241000589771 Ralstonia solanacearum Species 0.000 description 2
- 101100087805 Ralstonia solanacearum rip19 gene Proteins 0.000 description 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 2
- 235000004443 Ricinus communis Nutrition 0.000 description 2
- 235000007201 Saccharum officinarum Nutrition 0.000 description 2
- 240000000111 Saccharum officinarum Species 0.000 description 2
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 2
- 244000044822 Simmondsia californica Species 0.000 description 2
- 235000004433 Simmondsia californica Nutrition 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 244000062793 Sorghum vulgare Species 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 235000021536 Sugar beet Nutrition 0.000 description 2
- 229940100389 Sulfonylurea Drugs 0.000 description 2
- 241000970807 Thermoanaerobacterales Species 0.000 description 2
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 2
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 2
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 2
- 108090000848 Ubiquitin Proteins 0.000 description 2
- 102000044159 Ubiquitin Human genes 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 2
- 101500015412 Zea mays Ubiquitin Proteins 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 239000000443 aerosol Substances 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 108090000637 alpha-Amylases Proteins 0.000 description 2
- 239000003392 amylase inhibitor Substances 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 101150037081 aroA gene Proteins 0.000 description 2
- MXWJVTOOROXGIU-UHFFFAOYSA-N atrazine Chemical compound CCNC1=NC(Cl)=NC(NC(C)C)=N1 MXWJVTOOROXGIU-UHFFFAOYSA-N 0.000 description 2
- 230000037444 atrophy Effects 0.000 description 2
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 2
- 235000013734 beta-carotene Nutrition 0.000 description 2
- 239000011648 beta-carotene Substances 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 238000004061 bleaching Methods 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 230000010307 cell transformation Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 239000013043 chemical agent Substances 0.000 description 2
- 239000003593 chromogenic compound Substances 0.000 description 2
- 235000020971 citrus fruits Nutrition 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- OILAIQUEIWYQPH-UHFFFAOYSA-N cyclohexane-1,2-dione Chemical compound O=C1CCCCC1=O OILAIQUEIWYQPH-UHFFFAOYSA-N 0.000 description 2
- 230000001086 cytosolic effect Effects 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000007123 defense Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000001066 destructive effect Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000009510 drug design Methods 0.000 description 2
- VLCYCQAOQCDTCN-UHFFFAOYSA-N eflornithine Chemical compound NCCCC(N)(C(F)F)C(O)=O VLCYCQAOQCDTCN-UHFFFAOYSA-N 0.000 description 2
- 239000002158 endotoxin Substances 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 2
- 238000012215 gene cloning Methods 0.000 description 2
- 108020002326 glutamine synthetase Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 239000003630 growth substance Substances 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 239000000833 heterodimer Substances 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 239000000710 homodimer Substances 0.000 description 2
- IGMNYECMUMZDDF-UHFFFAOYSA-N homogentisic acid Chemical compound OC(=O)CC1=CC(O)=CC=C1O IGMNYECMUMZDDF-UHFFFAOYSA-N 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 229930014550 juvenile hormone Natural products 0.000 description 2
- 239000002949 juvenile hormone Substances 0.000 description 2
- 150000003633 juvenile hormone derivatives Chemical class 0.000 description 2
- 229930191400 juvenile hormones Natural products 0.000 description 2
- 231100000518 lethal Toxicity 0.000 description 2
- 230000001665 lethal effect Effects 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 239000011859 microparticle Substances 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000007857 nested PCR Methods 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 239000003921 oil Substances 0.000 description 2
- 239000002751 oligonucleotide probe Substances 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 235000011197 perejil Nutrition 0.000 description 2
- 150000002989 phenols Chemical class 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 230000009894 physiological stress Effects 0.000 description 2
- 210000002706 plastid Anatomy 0.000 description 2
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 102000021127 protein binding proteins Human genes 0.000 description 2
- 108091011138 protein binding proteins Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 210000003660 reticulum Anatomy 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 230000035882 stress Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 2
- 108700020534 tetracycline resistance-encoding transposon repressor Proteins 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 231100000167 toxic agent Toxicity 0.000 description 2
- 231100000701 toxic element Toxicity 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- OENHQHLEOONYIE-JLTXGRSLSA-N β-Carotene Chemical compound CC=1CCCC(C)(C)C=1\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C OENHQHLEOONYIE-JLTXGRSLSA-N 0.000 description 2
- MJYQFWSXKFLTAY-OVEQLNGDSA-N (2r,3r)-2,3-bis[(4-hydroxy-3-methoxyphenyl)methyl]butane-1,4-diol;(2r,3r,4s,5s,6r)-6-(hydroxymethyl)oxane-2,3,4,5-tetrol Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O.C1=C(O)C(OC)=CC(C[C@@H](CO)[C@H](CO)CC=2C=C(OC)C(O)=CC=2)=C1 MJYQFWSXKFLTAY-OVEQLNGDSA-N 0.000 description 1
- CXNPLSGKWMLZPZ-GIFSMMMISA-N (2r,3r,6s)-3-[[(3s)-3-amino-5-[carbamimidoyl(methyl)amino]pentanoyl]amino]-6-(4-amino-2-oxopyrimidin-1-yl)-3,6-dihydro-2h-pyran-2-carboxylic acid Chemical compound O1[C@@H](C(O)=O)[C@H](NC(=O)C[C@@H](N)CCN(C)C(N)=N)C=C[C@H]1N1C(=O)N=C(N)C=C1 CXNPLSGKWMLZPZ-GIFSMMMISA-N 0.000 description 1
- FCHBECOAGZMTFE-ZEQKJWHPSA-N (6r,7r)-3-[[2-[[4-(dimethylamino)phenyl]diazenyl]pyridin-1-ium-1-yl]methyl]-8-oxo-7-[(2-thiophen-2-ylacetyl)amino]-5-thia-1-azabicyclo[4.2.0]oct-2-ene-2-carboxylate Chemical compound C1=CC(N(C)C)=CC=C1N=NC1=CC=CC=[N+]1CC1=C(C([O-])=O)N2C(=O)[C@@H](NC(=O)CC=3SC=CC=3)[C@H]2SC1 FCHBECOAGZMTFE-ZEQKJWHPSA-N 0.000 description 1
- JYEUMXHLPRZUAT-UHFFFAOYSA-N 1,2,3-triazine Chemical compound C1=CN=NN=C1 JYEUMXHLPRZUAT-UHFFFAOYSA-N 0.000 description 1
- FYADHXFMURLYQI-UHFFFAOYSA-N 1,2,4-triazine Chemical compound C1=CN=NC=N1 FYADHXFMURLYQI-UHFFFAOYSA-N 0.000 description 1
- XUHGTGGPZFJRMF-UHFFFAOYSA-N 1,3-dihydropyrazole-2-carboxylic acid Chemical compound OC(=O)N1CC=CN1 XUHGTGGPZFJRMF-UHFFFAOYSA-N 0.000 description 1
- GOCUAJYOYBLQRH-UHFFFAOYSA-N 2-(4-{[3-chloro-5-(trifluoromethyl)pyridin-2-yl]oxy}phenoxy)propanoic acid Chemical compound C1=CC(OC(C)C(O)=O)=CC=C1OC1=NC=C(C(F)(F)F)C=C1Cl GOCUAJYOYBLQRH-UHFFFAOYSA-N 0.000 description 1
- NEAQRZUHTPSBBM-UHFFFAOYSA-N 2-hydroxy-3,3-dimethyl-7-nitro-4h-isoquinolin-1-one Chemical class C1=C([N+]([O-])=O)C=C2C(=O)N(O)C(C)(C)CC2=C1 NEAQRZUHTPSBBM-UHFFFAOYSA-N 0.000 description 1
- 102100027328 2-hydroxyacyl-CoA lyase 2 Human genes 0.000 description 1
- AOPRXJXHLWYPQR-UHFFFAOYSA-N 2-phenoxyacetamide Chemical class NC(=O)COC1=CC=CC=C1 AOPRXJXHLWYPQR-UHFFFAOYSA-N 0.000 description 1
- UPMXNNIRAGDFEH-UHFFFAOYSA-N 3,5-dibromo-4-hydroxybenzonitrile Chemical compound OC1=C(Br)C=C(C#N)C=C1Br UPMXNNIRAGDFEH-UHFFFAOYSA-N 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- XMTQQYYKAHVGBJ-UHFFFAOYSA-N 3-(3,4-DICHLOROPHENYL)-1,1-DIMETHYLUREA Chemical compound CN(C)C(=O)NC1=CC=C(Cl)C(Cl)=C1 XMTQQYYKAHVGBJ-UHFFFAOYSA-N 0.000 description 1
- KKADPXVIOXHVKN-UHFFFAOYSA-M 3-(4-hydroxyphenyl)pyruvate Chemical compound OC1=CC=C(CC(=O)C([O-])=O)C=C1 KKADPXVIOXHVKN-UHFFFAOYSA-M 0.000 description 1
- QUTYKIXIUDQOLK-PRJMDXOYSA-N 5-O-(1-carboxyvinyl)-3-phosphoshikimic acid Chemical compound O[C@H]1[C@H](OC(=C)C(O)=O)CC(C(O)=O)=C[C@H]1OP(O)(O)=O QUTYKIXIUDQOLK-PRJMDXOYSA-N 0.000 description 1
- 108010011619 6-Phytase Proteins 0.000 description 1
- PQJUJGAVDBINPI-UHFFFAOYSA-N 9H-thioxanthene Chemical compound C1=CC=C2CC3=CC=CC=C3SC2=C1 PQJUJGAVDBINPI-UHFFFAOYSA-N 0.000 description 1
- 108010000700 Acetolactate synthase Proteins 0.000 description 1
- 101710103719 Acetolactate synthase large subunit Proteins 0.000 description 1
- 101710182467 Acetolactate synthase large subunit IlvB1 Proteins 0.000 description 1
- 101710171176 Acetolactate synthase large subunit IlvG Proteins 0.000 description 1
- 101710176702 Acetolactate synthase small subunit Proteins 0.000 description 1
- 101710147947 Acetolactate synthase small subunit 1, chloroplastic Proteins 0.000 description 1
- 101710095712 Acetolactate synthase, mitochondrial Proteins 0.000 description 1
- 101000818108 Acholeplasma phage L2 Uncharacterized 81.3 kDa protein Proteins 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 101710197633 Actin-1 Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 101710146995 Acyl carrier protein Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 241000589156 Agrobacterium rhizogenes Species 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 102000000383 Alpha-Ketoglutarate-Dependent Dioxygenase FTO Human genes 0.000 description 1
- 235000003840 Amygdalus nana Nutrition 0.000 description 1
- 244000296825 Amygdalus nana Species 0.000 description 1
- 108010065511 Amylases Proteins 0.000 description 1
- 241001465677 Ancylostomatoidea Species 0.000 description 1
- 102100030988 Angiotensin-converting enzyme Human genes 0.000 description 1
- 108700042778 Antimicrobial Peptides Proteins 0.000 description 1
- 102000044503 Antimicrobial Peptides Human genes 0.000 description 1
- 108020004491 Antisense DNA Proteins 0.000 description 1
- 101710081722 Antitrypsin Proteins 0.000 description 1
- 238000006677 Appel reaction Methods 0.000 description 1
- 102000007347 Apyrase Human genes 0.000 description 1
- 108010007730 Apyrase Proteins 0.000 description 1
- 241000209524 Araceae Species 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 1
- JTKLCCFLSLCCST-SZMVWBNQSA-N Arg-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JTKLCCFLSLCCST-SZMVWBNQSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 1
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 1
- GMRGSBAMMMVDGG-GUBZILKMSA-N Asn-Arg-Arg Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N GMRGSBAMMMVDGG-GUBZILKMSA-N 0.000 description 1
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- ZVGRHIRJLWBWGJ-ACZMJKKPSA-N Asp-Ser-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZVGRHIRJLWBWGJ-ACZMJKKPSA-N 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 241001465318 Aspergillus terreus Species 0.000 description 1
- 235000005781 Avena Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 101150076489 B gene Proteins 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 108010029675 Bacillus licheniformis alpha-amylase Proteins 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 239000005711 Benzoic acid Substances 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 241000611157 Brachiaria Species 0.000 description 1
- 235000011303 Brassica alboglabra Nutrition 0.000 description 1
- 235000003351 Brassica cretica Nutrition 0.000 description 1
- 235000011332 Brassica juncea Nutrition 0.000 description 1
- 235000014700 Brassica juncea var napiformis Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 235000011302 Brassica oleracea Nutrition 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 240000008100 Brassica rapa Species 0.000 description 1
- 235000011292 Brassica rapa Nutrition 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 235000003343 Brassica rupestris Nutrition 0.000 description 1
- 239000005489 Bromoxynil Substances 0.000 description 1
- 229910000906 Bronze Inorganic materials 0.000 description 1
- 101150061009 C1 gene Proteins 0.000 description 1
- 0 C[C@](CC1)*C1=*=* Chemical compound C[C@](CC1)*C1=*=* 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000189662 Calla Species 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 240000008574 Capsicum frutescens Species 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- 108010059892 Cellulase Proteins 0.000 description 1
- 229930186147 Cephalosporin Natural products 0.000 description 1
- 241000195585 Chlamydomonas Species 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 244000189548 Chrysanthemum x morifolium Species 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 241000755729 Clivia Species 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000218631 Coniferophyta Species 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 235000002787 Coriandrum sativum Nutrition 0.000 description 1
- 244000018436 Coriandrum sativum Species 0.000 description 1
- 101710190853 Cruciferin Proteins 0.000 description 1
- 241000724252 Cucumber mosaic virus Species 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 101710095468 Cyclase Proteins 0.000 description 1
- 206010011732 Cyst Diseases 0.000 description 1
- 102000000311 Cytosine Deaminase Human genes 0.000 description 1
- 108010080611 Cytosine Deaminase Proteins 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 241000208175 Daucus Species 0.000 description 1
- 241001338022 Daucus carota subsp. sativus Species 0.000 description 1
- 208000005156 Dehydration Diseases 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 239000005504 Dicamba Substances 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 108010016626 Dipeptides Proteins 0.000 description 1
- 241000238791 Diploptera punctata Species 0.000 description 1
- 101710173731 Diuretic hormone receptor Proteins 0.000 description 1
- 239000005510 Diuron Substances 0.000 description 1
- AHMIDUVKSGCHAU-UHFFFAOYSA-N Dopaquinone Natural products OC(=O)C(N)CC1=CC(=O)C(=O)C=C1 AHMIDUVKSGCHAU-UHFFFAOYSA-N 0.000 description 1
- 241000512897 Elaeis Species 0.000 description 1
- 235000001942 Elaeis Nutrition 0.000 description 1
- 235000001950 Elaeis guineensis Nutrition 0.000 description 1
- 240000003133 Elaeis guineensis Species 0.000 description 1
- 101100491986 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) aromA gene Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241000132521 Erigeron Species 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 239000005558 Fluroxypyr Substances 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 241000223221 Fusarium oxysporum Species 0.000 description 1
- 102000048120 Galactokinases Human genes 0.000 description 1
- 108700023157 Galactokinases Proteins 0.000 description 1
- 102100034013 Gamma-glutamyl phosphate reductase Human genes 0.000 description 1
- 101710198928 Gamma-glutamyl phosphate reductase Proteins 0.000 description 1
- JESJDAAGXULQOP-CIUDSAMLSA-N Gln-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N JESJDAAGXULQOP-CIUDSAMLSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- 102000005720 Glutathione transferase Human genes 0.000 description 1
- XZRZILPOZBVTDB-GJZGRUSLSA-N Gly-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)CN)C(O)=O)=CNC2=C1 XZRZILPOZBVTDB-GJZGRUSLSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108700037728 Glycine max beta-conglycinin Proteins 0.000 description 1
- 101000912350 Haemophilus phage HP1 (strain HP1c1) DNA N-6-adenine-methyltransferase Proteins 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- MWAJSVTZZOUOBU-IHRRRGAJSA-N His-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 MWAJSVTZZOUOBU-IHRRRGAJSA-N 0.000 description 1
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 1
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 1
- 101000687346 Homo sapiens PR domain zinc finger protein 2 Proteins 0.000 description 1
- 241000209219 Hordeum Species 0.000 description 1
- 108700025438 Hordeum vulgare ribosome-inactivating Proteins 0.000 description 1
- 102000004157 Hydrolases Human genes 0.000 description 1
- 108090000604 Hydrolases Proteins 0.000 description 1
- 102000018251 Hypoxanthine Phosphoribosyltransferase Human genes 0.000 description 1
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 108010042889 Inulosucrase Proteins 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- 101000790844 Klebsiella pneumoniae Uncharacterized 24.8 kDa protein in cps region Proteins 0.000 description 1
- WTDRDQBEARUVNC-UHFFFAOYSA-N L-Dopa Natural products OC(=O)C(N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-UHFFFAOYSA-N 0.000 description 1
- AHMIDUVKSGCHAU-LURJTMIESA-N L-dopaquinone Chemical compound [O-]C(=O)[C@@H]([NH3+])CC1=CC(=O)C(=O)C=C1 AHMIDUVKSGCHAU-LURJTMIESA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 241000208822 Lactuca Species 0.000 description 1
- 241001293495 Lactuca virosa Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 101710084376 Lipase 3 Proteins 0.000 description 1
- 239000000232 Lipid Bilayer Substances 0.000 description 1
- 241000209082 Lolium Species 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- 235000002262 Lycopersicon Nutrition 0.000 description 1
- 108700012133 Lycopersicon Pto Proteins 0.000 description 1
- 101001133631 Lysinibacillus sphaericus Penicillin acylase Proteins 0.000 description 1
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- WSMYVTOQOOLQHP-UHFFFAOYSA-N Malondialdehyde Chemical compound O=CCC=O WSMYVTOQOOLQHP-UHFFFAOYSA-N 0.000 description 1
- 241000220225 Malus Species 0.000 description 1
- 244000070406 Malus silvestris Species 0.000 description 1
- 108091022912 Mannose-6-Phosphate Isomerase Proteins 0.000 description 1
- 108010087870 Mannose-Binding Lectin Proteins 0.000 description 1
- MYKLINMAGAIRPJ-CIUDSAMLSA-N Met-Gln-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MYKLINMAGAIRPJ-CIUDSAMLSA-N 0.000 description 1
- 241000192041 Micrococcus Species 0.000 description 1
- 108010086093 Mung Bean Nuclease Proteins 0.000 description 1
- 208000031888 Mycoses Diseases 0.000 description 1
- 102100026933 Myelin-associated neurite-outgrowth inhibitor Human genes 0.000 description 1
- BKAYIFDRRZZKNF-VIFPVBQESA-N N-acetylcarnosine Chemical compound CC(=O)NCCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BKAYIFDRRZZKNF-VIFPVBQESA-N 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 108090000189 Neuropeptides Proteins 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 101710138657 Neurotoxin Proteins 0.000 description 1
- 241000208125 Nicotiana Species 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 1
- 108010047956 Nucleosomes Proteins 0.000 description 1
- 241000795633 Olea <sea slug> Species 0.000 description 1
- 240000007817 Olea europaea Species 0.000 description 1
- 229940122060 Ornithine decarboxylase inhibitor Drugs 0.000 description 1
- 102000052812 Ornithine decarboxylases Human genes 0.000 description 1
- 108700005126 Ornithine decarboxylases Proteins 0.000 description 1
- 241001233986 Orychophragmus Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000209094 Oryza Species 0.000 description 1
- 101710149663 Osmotin Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 101150084044 P gene Proteins 0.000 description 1
- 102100024885 PR domain zinc finger protein 2 Human genes 0.000 description 1
- 102000016387 Pancreatic elastase Human genes 0.000 description 1
- 108010067372 Pancreatic elastase Proteins 0.000 description 1
- 241000222291 Passalora fulva Species 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 108090000882 Peptidyl-Dipeptidase A Proteins 0.000 description 1
- 101710132602 Peroxidase 5 Proteins 0.000 description 1
- 241000218196 Persea Species 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 241000219833 Phaseolus Species 0.000 description 1
- 102100035362 Phosphomannomutase 2 Human genes 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 102000014750 Phosphorylase Kinase Human genes 0.000 description 1
- 108010064071 Phosphorylase Kinase Proteins 0.000 description 1
- 108010060806 Photosystem II Protein Complex Proteins 0.000 description 1
- IMQLKJBTEOYOSI-UHFFFAOYSA-N Phytic acid Natural products OP(O)(=O)OC1C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C(OP(O)(O)=O)C1OP(O)(O)=O IMQLKJBTEOYOSI-UHFFFAOYSA-N 0.000 description 1
- 241000218657 Picea Species 0.000 description 1
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 235000011613 Pinus brutia Nutrition 0.000 description 1
- 108700001094 Plant Genes Proteins 0.000 description 1
- 229920001030 Polyethylene Glycol 4000 Polymers 0.000 description 1
- 108010068086 Polyubiquitin Proteins 0.000 description 1
- 241000709992 Potato virus X Species 0.000 description 1
- 241000723762 Potato virus Y Species 0.000 description 1
- 101710196435 Probable acetolactate synthase large subunit Proteins 0.000 description 1
- 101710181764 Probable acetolactate synthase small subunit Proteins 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 235000011432 Prunus Nutrition 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 241000589623 Pseudomonas syringae pv. syringae Species 0.000 description 1
- 101710104000 Putative acetolactate synthase small subunit Proteins 0.000 description 1
- 101150041925 RBCS gene Proteins 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- MUPFEKGTMRGPLJ-RMMQSMQOSA-N Raffinose Natural products O(C[C@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@@H](O[C@@]2(CO)[C@H](O)[C@@H](O)[C@@H](CO)O2)O1)[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 MUPFEKGTMRGPLJ-RMMQSMQOSA-N 0.000 description 1
- 101100272715 Ralstonia solanacearum (strain GMI1000) brg11 gene Proteins 0.000 description 1
- 241000220259 Raphanus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 1
- 240000000528 Ricinus communis Species 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 101001025539 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Homothallic switching endonuclease Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000239226 Scorpiones Species 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- 241000270295 Serpentes Species 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 235000002634 Solanum Nutrition 0.000 description 1
- 241000207763 Solanum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 101001044900 Solanum tuberosum Proteinase inhibitor 1 Proteins 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 235000009337 Spinacia oleracea Nutrition 0.000 description 1
- 244000300264 Spinacia oleracea Species 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- 101710154134 Stearoyl-[acyl-carrier-protein] 9-desaturase, chloroplastic Proteins 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 239000005618 Sulcotrione Substances 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- 241001104043 Syringa Species 0.000 description 1
- OAOIXPPCQSJBRI-UHFFFAOYSA-N Thioxanthine monophosphate Chemical compound N1C(=O)NC(=S)C2=C1N(OP(O)(=O)O)C=N2 OAOIXPPCQSJBRI-UHFFFAOYSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 241000724291 Tobacco streak virus Species 0.000 description 1
- 108090000340 Transaminases Proteins 0.000 description 1
- 102000003929 Transaminases Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 239000005627 Triclopyr Substances 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 235000007264 Triticum durum Nutrition 0.000 description 1
- 241000209143 Triticum turgidum subsp. durum Species 0.000 description 1
- RWAYYYOZMHMEGD-XIRDDKMYSA-N Trp-Leu-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 RWAYYYOZMHMEGD-XIRDDKMYSA-N 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000018690 Trypsinogen Human genes 0.000 description 1
- 108010027252 Trypsinogen Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108010027697 Type I Site-Specific Deoxyribonucleases Proteins 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 1
- 108060008724 Tyrosinase Proteins 0.000 description 1
- MUPFEKGTMRGPLJ-UHFFFAOYSA-N UNPD196149 Natural products OC1C(O)C(CO)OC1(CO)OC1C(O)C(O)C(O)C(COC2C(C(O)C(O)C(CO)O2)O)O1 MUPFEKGTMRGPLJ-UHFFFAOYSA-N 0.000 description 1
- 241000256856 Vespidae Species 0.000 description 1
- 240000004922 Vigna radiata Species 0.000 description 1
- 235000010721 Vigna radiata var radiata Nutrition 0.000 description 1
- 235000011469 Vigna radiata var sublobata Nutrition 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 235000009392 Vitis Nutrition 0.000 description 1
- 241000219095 Vitis Species 0.000 description 1
- 101001036768 Zea mays Glucose-1-phosphate adenylyltransferase large subunit 1, chloroplastic/amyloplastic Proteins 0.000 description 1
- 101001040871 Zea mays Glutelin-2 Proteins 0.000 description 1
- 108700042569 Zea mays P Proteins 0.000 description 1
- 101000662549 Zea mays Sucrose synthase 1 Proteins 0.000 description 1
- MNOGBRROKHFONU-CJUKMMNNSA-N ac1l2wzw Chemical compound C1N2C(C(C(C)=C(NCCOP(O)(O)=O)C3=O)=O)=C3[C@@H](COC(N)=O)[C@@]2(OC)[C@@H]2[C@H]1N2 MNOGBRROKHFONU-CJUKMMNNSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- JUGOREOARAHOCO-UHFFFAOYSA-M acetylcholine chloride Chemical compound [Cl-].CC(=O)OCC[N+](C)(C)C JUGOREOARAHOCO-UHFFFAOYSA-M 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000033289 adaptive immune response Effects 0.000 description 1
- IRLPACMLTUPBCL-FCIPNVEPSA-N adenosine-5'-phosphosulfate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@@H](CO[P@](O)(=O)OS(O)(=O)=O)[C@H](O)[C@H]1O IRLPACMLTUPBCL-FCIPNVEPSA-N 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 244000193174 agave Species 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- OENHQHLEOONYIE-UKMVMLAPSA-N all-trans beta-carotene Natural products CC=1CCCC(C)(C)C=1/C=C/C(/C)=C/C=C/C(/C)=C/C=C/C=C(C)C=CC=C(C)C=CC1=C(C)CCCC1(C)C OENHQHLEOONYIE-UKMVMLAPSA-N 0.000 description 1
- 102000004139 alpha-Amylases Human genes 0.000 description 1
- 229940024171 alpha-amylase Drugs 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 229940126575 aminoglycoside Drugs 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 230000000340 anti-metabolite Effects 0.000 description 1
- 230000001475 anti-trypsic effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 229940100197 antimetabolite Drugs 0.000 description 1
- 239000002256 antimetabolite Substances 0.000 description 1
- 239000003816 antisense DNA Substances 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 230000010165 autogamy Effects 0.000 description 1
- 229940097012 bacillus thuringiensis Drugs 0.000 description 1
- 244000000005 bacterial plant pathogen Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 235000010233 benzoic acid Nutrition 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- TUPZEYHYWIEDIH-WAIFQNFQSA-N beta-carotene Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CCCC1(C)C)C=CC=C(/C)C=CC2=CCCCC2(C)C TUPZEYHYWIEDIH-WAIFQNFQSA-N 0.000 description 1
- 229960002747 betacarotene Drugs 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000029918 bioluminescence Effects 0.000 description 1
- 238000005415 bioluminescence Methods 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- QKSKPIVNLNLAAV-UHFFFAOYSA-N bis(2-chloroethyl) sulfide Chemical compound ClCCSCCCl QKSKPIVNLNLAAV-UHFFFAOYSA-N 0.000 description 1
- CXNPLSGKWMLZPZ-UHFFFAOYSA-N blasticidin-S Natural products O1C(C(O)=O)C(NC(=O)CC(N)CCN(C)C(N)=N)C=CC1N1C(=O)N=C(N)C=C1 CXNPLSGKWMLZPZ-UHFFFAOYSA-N 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000010974 bronze Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 229940106157 cellulase Drugs 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 229940124587 cephalosporin Drugs 0.000 description 1
- 150000001780 cephalosporins Chemical class 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 230000007073 chemical hydrolysis Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 210000001726 chromosome structure Anatomy 0.000 description 1
- 238000003501 co-culture Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- KUNSUQLRTQLHQQ-UHFFFAOYSA-N copper tin Chemical compound [Cu].[Sn] KUNSUQLRTQLHQQ-UHFFFAOYSA-N 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 208000031513 cyst Diseases 0.000 description 1
- 239000002852 cysteine proteinase inhibitor Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- IWEDIXLBFLAXBO-UHFFFAOYSA-N dicamba Chemical compound COC1=C(Cl)C=CC(Cl)=C1C(O)=O IWEDIXLBFLAXBO-UHFFFAOYSA-N 0.000 description 1
- 235000015872 dietary supplement Nutrition 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- MHUWZNTUIIFHAS-CLFAGFIQSA-N dioleoyl phosphatidic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(COP(O)(O)=O)OC(=O)CCCCCCC\C=C/CCCCCCCC MHUWZNTUIIFHAS-CLFAGFIQSA-N 0.000 description 1
- 235000004879 dioscorea Nutrition 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 229960004679 doxorubicin Drugs 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 108010057988 ecdysone receptor Proteins 0.000 description 1
- 150000002061 ecdysteroids Chemical class 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 108010050663 endodeoxyribonuclease CreI Proteins 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000007824 enzymatic assay Methods 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- 239000002532 enzyme inhibitor Substances 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 230000004129 fatty acid metabolism Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 244000037666 field crops Species 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 229930002879 flavonoid pigment Natural products 0.000 description 1
- 150000004638 flavonoid pigments Chemical class 0.000 description 1
- XRECTZIEBJDKEO-UHFFFAOYSA-N flucytosine Chemical compound NC1=NC(=O)NC=C1F XRECTZIEBJDKEO-UHFFFAOYSA-N 0.000 description 1
- 229960004413 flucytosine Drugs 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- MEFQWPUMEMWTJP-UHFFFAOYSA-N fluroxypyr Chemical compound NC1=C(Cl)C(F)=NC(OCC(O)=O)=C1Cl MEFQWPUMEMWTJP-UHFFFAOYSA-N 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 108010062699 gamma-Glutamyl Hydrolase Proteins 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 102000005396 glutamine synthetase Human genes 0.000 description 1
- 230000002414 glycolytic effect Effects 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 235000021384 green leafy vegetables Nutrition 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 108010002685 hygromycin-B kinase Proteins 0.000 description 1
- 238000012744 immunostaining Methods 0.000 description 1
- 239000002596 immunotoxin Substances 0.000 description 1
- 231100000608 immunotoxin Toxicity 0.000 description 1
- 229940051026 immunotoxin Drugs 0.000 description 1
- 230000002637 immunotoxin Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- PZOUSPYUWWUPPK-UHFFFAOYSA-N indole Natural products CC1=CC=CC2=C1C=CN2 PZOUSPYUWWUPPK-UHFFFAOYSA-N 0.000 description 1
- RKJUIXBNRJVNHR-UHFFFAOYSA-N indolenine Natural products C1=CC=C2CC=NC2=C1 RKJUIXBNRJVNHR-UHFFFAOYSA-N 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000749 insecticidal effect Effects 0.000 description 1
- 239000002917 insecticide Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- CTAPFRYPJLPFDF-UHFFFAOYSA-N isoxazole Chemical compound C=1C=NOC=1 CTAPFRYPJLPFDF-UHFFFAOYSA-N 0.000 description 1
- 108010080576 juvenile hormone esterase Proteins 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 229960004502 levodopa Drugs 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 230000002366 lipolytic effect Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 229910001425 magnesium ion Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 235000005739 manihot Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 229960001924 melphalan Drugs 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000007102 metabolic function Effects 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000000394 mitotic effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 229930003658 monoterpene Natural products 0.000 description 1
- 150000002773 monoterpene derivatives Chemical class 0.000 description 1
- 235000002577 monoterpenes Nutrition 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 235000010460 mustard Nutrition 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 239000002581 neurotoxin Substances 0.000 description 1
- 231100000618 neurotoxin Toxicity 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 210000001623 nucleosome Anatomy 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 235000014571 nuts Nutrition 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 239000002818 ornithine decarboxylase inhibitor Substances 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 101150041247 p1 gene Proteins 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 230000001769 paralizing effect Effects 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- LCCNCVORNKJIRZ-UHFFFAOYSA-N parathion Chemical compound CCOP(=S)(OCC)OC1=CC=C([N+]([O-])=O)C=C1 LCCNCVORNKJIRZ-UHFFFAOYSA-N 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000007918 pathogenicity Effects 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 235000021017 pears Nutrition 0.000 description 1
- 101150009166 pehA gene Proteins 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 239000010451 perlite Substances 0.000 description 1
- 235000019362 perlite Nutrition 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 150000002995 phenylpropanoid derivatives Chemical class 0.000 description 1
- 239000003016 pheromone Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 108010026239 phosphonate monoester hydrolase Proteins 0.000 description 1
- 125000001476 phosphono group Chemical group [H]OP(*)(=O)O[H] 0.000 description 1
- 230000029553 photosynthesis Effects 0.000 description 1
- 238000010672 photosynthesis Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 239000000467 phytic acid Substances 0.000 description 1
- 229940068041 phytic acid Drugs 0.000 description 1
- 229930195732 phytohormone Natural products 0.000 description 1
- 230000003032 phytopathogenic effect Effects 0.000 description 1
- 230000019612 pigmentation Effects 0.000 description 1
- 239000003375 plant hormone Substances 0.000 description 1
- 238000013492 plasmid preparation Methods 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 239000002574 poison Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 230000032361 posttranscriptional gene silencing Effects 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000019525 primary metabolic process Effects 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 235000014774 prunus Nutrition 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- MUPFEKGTMRGPLJ-ZQSKZDJDSA-N raffinose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO[C@@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)O1 MUPFEKGTMRGPLJ-ZQSKZDJDSA-N 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 101150021296 rip2 gene Proteins 0.000 description 1
- 230000002786 root growth Effects 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 238000003345 scintillation counting Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 229930004725 sesquiterpene Natural products 0.000 description 1
- 150000004354 sesquiterpene derivatives Chemical class 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 229910001415 sodium ion Inorganic materials 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 230000003381 solubilizing effect Effects 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 108010048090 soybean lectin Proteins 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 235000020354 squash Nutrition 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 108010031092 starch-branching enzyme II Proteins 0.000 description 1
- 239000008117 stearic acid Substances 0.000 description 1
- 239000003270 steroid hormone Substances 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 235000021012 strawberries Nutrition 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- PQTBTIFWAXVEPB-UHFFFAOYSA-N sulcotrione Chemical compound ClC1=CC(S(=O)(=O)C)=CC=C1C(=O)C1C(=O)CCCC1=O PQTBTIFWAXVEPB-UHFFFAOYSA-N 0.000 description 1
- 229940124530 sulfonamide Drugs 0.000 description 1
- 150000003456 sulfonamides Chemical class 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000006032 tissue transformation Effects 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- REEQLXCGVXDJSQ-UHFFFAOYSA-N trichlopyr Chemical compound OC(=O)COC1=NC(Cl)=C(Cl)C=C1Cl REEQLXCGVXDJSQ-UHFFFAOYSA-N 0.000 description 1
- PIEPQKCYPFFYMG-UHFFFAOYSA-N tris acetate Chemical compound CC(O)=O.OCC(N)(CO)CO PIEPQKCYPFFYMG-UHFFFAOYSA-N 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- 238000010396 two-hybrid screening Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 101150101900 uidA gene Proteins 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 241001478887 unidentified soil bacteria Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 150000003672 ureas Chemical class 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 1
- 239000010455 vermiculite Substances 0.000 description 1
- 235000019354 vermiculite Nutrition 0.000 description 1
- 229910052902 vermiculite Inorganic materials 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000001018 virulence Effects 0.000 description 1
- 108091009357 vitamin binding proteins Proteins 0.000 description 1
- 102000028728 vitamin binding proteins Human genes 0.000 description 1
- 235000020138 yakult Nutrition 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8209—Selection, visualisation of transformants, reporter constructs, e.g. antibiotic resistance markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8209—Selection, visualisation of transformants, reporter constructs, e.g. antibiotic resistance markers
- C12N15/821—Non-antibiotic resistance markers, e.g. morphogenetic, metabolic markers
- C12N15/8212—Colour markers, e.g. beta-glucoronidase [GUS], green fluorescent protein [GFP], carotenoid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8274—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
- C12N15/8275—Glyphosate
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Cell Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
식물 게놈 내의 표적화 위치에 삽입되어 특정 게놈 위치 내의 공여자 분자의 신속 및 고처리량 통합을 용이하게 수 있는 범용 공여자 폴리뉴클레오티드가 기재된다.
Description
관련 출원의 상호 참조
본 출원은 35 U.S.C. § 119(e) 하에 2013년 11월 4일에 출원된 미국 특허 가출원 번호 61/899,543에 대해 이익을 주장하며, 그 내용은 그 전문이 본 출원에 참조로 포함된다.
전자적으로 제출된 서열 목록에 대한 참조
서열 목록의 공식 사본은 파일명 "74435_ST25.txt"의 2014년 11월 3일에 생성된 100 킬로바이트 크기의 ASCII 포맷 서열 목록으로서 EFS-웹을 통해 전자적으로 제출되었고, 이는 본 명세서와 공동으로 출원된다. 이러한 ASCII 포맷 문서에 포함된 서열 목록은 본 명세서의 일부이고 그 전문이 본원에 참조로 포함된다.
발명의 분야
본 개시내용은 식물에서의 식물 정밀 형질전환, 유전자 표적화, 표적화 게놈 통합 및 단백질 발현의 분야에 관한 것이다. 한 실시양태에서, 본 개시내용은 식물 게놈에서 표적화 위치에 삽입되고 고처리량 및 효율적인 방식으로 검정될 수 있는 범용 공여자 폴리뉴클레오티드 분자를 기재한다.
식물 내로의 농경학상 중요한 형질의 도입은 영양가 품질을 개선시키고/거나 수확량을 증가시키고/거나 해충 또는 질병 저항성을 제공하고/거나 가뭄 및 스트레스 내성을 증가시키고/거나 원예 품질 (예를 들어, 색소형성 및 개화)을 개선시키고/거나 제초제 저항성을 부여하고/거나 식물로부터 산업적으로 유용한 화합물 및/또는 물질의 생산을 가능하게 하고/거나 제약의 생산을 가능하게 하기 위해 사용될 수 있다. 트랜스제닉 식물은 전형적으로 아그로박테리움(Agrobacterium)-매개 형질전환 기술에 의해 생성된다. 원형질체에서의 PEG-매개 DNA 흡수, 미세발사체 충격 및 규소 휘스커-매개 형질전환과 같은 다른 형질전환 기술이 또한 트랜스제닉 식물을 생산하는데 사용될 수 있다. 클로닝된 유전자의 식물 세포 내로의 도입 및 안정한 생식력 있는 트랜스제닉 식물의 회수가 식물의 상기 변형을 이루기 위해 사용될 수 있고, 작물 개선을 위한 식물의 유전자 조작을 가능하게 하였다. 이들 방법을 사용하여, 외래 DNA를 진핵 식물 세포의 핵 또는 색소체 DNA 내로 무작위로 통합한 후, 세포의 DNA 내로 통합된 외래 DNA를 함유하는 세포를 단리하여 안정하게 형질전환된 식물 세포를 생산한다.
상기 기재된 식물 형질전환 방법은 식물 게놈의 무작위 위치 내의 트랜스진의 통합을 일으키고 가변적인 카피수를 생성한다. 빈번하게, 트랜스진은 전체 트랜스진 또는 그의 일부의 반복체로서 통합된다. 복합체 통합 패턴은 트랜스진의 발현 수준에 영향을 미치고 (예를 들어, 전사후 유전자 침묵 메카니즘을 통한 전사된 RNA의 파괴에 의해, 또는 도입된 DNA의 메틸화의 유도에 의해), 이로써 트랜스진의 전사를 하향조절할 수 있다. 게다가, 트랜스진의 발현 수준은 식물 게놈 내의 통합의 위치 (예를 들어, 위치 효과)에 의해 영향받을 수 있다. 이들 인자의 조합은 상이한 트랜스제닉 식물 세포 및 식물 주 사이에서 관심 트랜스진 또는 외래 DNA의 발현 수준의 큰 차이를 생성한다. 또한, 관심 외래 DNA의 통합은 통합이 발생하는 게놈의 영역에 대해 파괴적인 효과를 가질 수 있고, 그 표적 영역의 정상 기능에 영향을 미치거나 방해하여 종종 바람직하지 않은 부작용을 야기할 수 있다.
상기 방법은 특정한 외래 DNA의 식물 내로의 도입 효과를 조사할 때마다 유의한 결과를 얻기 위해 매우 많은 트랜스제닉 식물 주를 생성하고 분석하는 것을 필요로 한다. 마찬가지로, 목적하는 표현형을 갖는 트랜스제닉 식물을 제공하기 위해 특정한 관심 DNA가 식물 내에 도입된 트랜스제닉 작물 식물의 생성 시에, 트랜스진을 최적으로 발현하며 트랜스제닉 식물의 전체 표현형에 대해 최소 부작용을 갖거나 부작용을 갖지 않는 식물 주의 선택을 가능하게 하기 위해 독립적으로 생성된 트랜스제닉 식물 주의 거대 집단이 생성된다. 특히 상기 분야에서, 예를 들어 원치 않는 트랜스제닉 이벤트의 제거를 위해 필요한 반복된 시험과 연관된 부담스러운 규제 요건 및 고비용을 고려하여, 보다 지정된 트랜스제닉 접근법이 요구된다. 게다가, 표적화 DNA 삽입의 가능성이 또한 트랜스진 스택킹의 과정에서 유익할 것임이 명백해질 것이다.
식물에서 트랜스진 삽입을 제어하기 위한 노력으로 여러 방법이 개발된 바 있다. 예를 들어, 문헌 [Kumar and Fladung (2001) Trends Plant Sci. 6:155-9]을 참조한다. 이들 방법은 상동 재조합-기반 트랜스진 통합에 의존한다. 이 전략은 원핵생물 및 하등 진핵생물에 성공적으로 적용된 바 있다. 문헌 [Paszkowski et al. (1988) EMBO J. 7:4021-6]을 참조한다. 그러나, 식물의 경우, 최근까지 트랜스진 통합을 위한 우세한 메카니즘은 재조합 DNA 가닥 사이의 상동성을 거의 수반하지 않는 비정규 재조합을 기초로 한다. 따라서, 상기 분야에서의 주요 도전과제는, 비정규 재조합을 통한 도입된 외래 DNA의 훨씬 더 효율적인 통합에 의해 가려진 드문 상동성 재조합 이벤트의 검출이다.
주문 설계된 아연 핑거 뉴클레아제 (ZFN)는 DNA 내의 표적화 부위-특이적 이중-가닥 파괴를 생성하고 후속적으로 절단된 말단부를 재조합하도록 설계된 단백질이다. ZFN은 제한 엔도뉴클레아제, 예컨대 예를 들어 FokI의 비-특이적 절단 도메인을 아연 핑거 DNA-결합 단백질과 조합한다. 예를 들어, 문헌 [Huang et al. (1996) J. Protein Chem. 15:481-9; Kim et al. (1997) Proc. Natl. Acad. Sci. USA 94:3616-20; Kim et al. (1996) Proc. Natl. Acad. Sci. USA 93:1156-60; Kim et al. (1994) Proc Natl. Acad. Sci. USA 91:883-7; Kim et al. (1997b) Proc. Natl. Acad. Sci. USA 94:12875-9; Kim et al. (1997c) Gene 203:43-9; Kim et al. (1998) Biol. Chem. 379:489-95; Nahon and Raveh (1998) Nucleic Acids Res. 26:1233-9; Smith et al. (1999) Nucleic Acids Res. 27:674-81]을 참조한다. 개별 아연 핑거 모티프는 광범위한 DNA 부위를 표적화하고 그에 결합하도록 설계될 수 있다. 정규 Cys2His2 뿐만 아니라 비-정규 Cys3His 아연 핑거 단백질은 α-나선을 이중 나선의 큰 홈 내로 삽입함으로써 DNA에 결합한다. 아연 핑거에 의한 DNA의 인식은 모듈식이다: 각각의 핑거는 먼저 표적 내의 3개의 연속적인 염기 쌍과 접촉하고, 단백질 내의 몇몇 주요 잔기가 인식을 매개한다. FokI 제한 엔도뉴클레아제는 DNA를 절단하여 이중-가닥 파괴를 유도하기 위해 뉴클레아제 도메인을 통해 이량체화되어야 한다는 것이 밝혀진 바 있다. 유사하게, ZFN은 또한 DNA를 절단하기 위해 뉴클레아제 도메인의 이량체화를 필요로 한다. Mani et al. (2005) Biochem. Biophys. Res. Commun. 334:1191-7; Smith et al. (2000) Nucleic Acids Res. 28:3361-9. ZFN의 이량체화는 반대로 배향된 2개의 인접한 결합 부위에 의해 용이해진다. 상기 동일 문헌.
관련 기술분야의 상기 예 및 이와 관련된 제한은 예시적이며 배타적인 것으로 의도되지 않는다. 관련 기술분야의 다른 제한은 본 명세서를 읽음으로써 관련 기술분야의 통상의 기술자에게 명백해질 것이다.
바람직한 실시양태에서, 본 개시내용은 부위 특이적 뉴클레아제 결합 도메인, 분석 도메인 및 플라스미드 도메인을 포함하는 폴리뉴클레오티드 공여자 카세트에 관한 것이다. 추가 실시양태에서, 폴리뉴클레오티드 공여자 카세트는 3 Kbp 미만의 길이를 포함한다. 추가 실시양태는 폴리뉴클레오티드 공여자 카세트를 포함하는 트랜스제닉 세포를 포함한다. 일부 측면에서, 트랜스제닉 세포는 트랜스제닉 식물 세포이다. 또 다른 실시양태에서, 본 개시내용은 트랜스제닉 식물 세포를 포함하는 트랜스제닉 식물에 관한 것이다. 추가 측면은 단자엽 식물 또는 쌍자엽 식물인 트랜스제닉 식물을 포함한다. 다른 실시양태에서, 단자엽 식물은 옥수수 식물, 밀 식물 및 벼 식물로 이루어진 군으로부터 선택된다. 또 다른 실시양태에서, 쌍자엽 식물은 대두 식물, 목화 식물 및 카놀라 식물로 이루어진 군으로부터 선택된다. 추가로, 본 개시내용은 트랜스제닉 식물로부터 생산된 트랜스제닉 종자에 관한 것이다.
또 다른 실시양태에서, 본 개시내용은 서열 132에 대해 적어도 90% 서열 동일성을 갖는 폴리뉴클레오티드 서열, 서열 133에 대해 90% 서열 동일성을 갖는 폴리뉴클레오티드 서열, 서열 134에 대해 적어도 90% 서열 동일성을 갖는 폴리뉴클레오티드 서열, 서열 135에 대해 적어도 90% 서열 동일성을 갖는 폴리뉴클레오티드 서열, 서열 136에 대해 적어도 90% 서열 동일성을 갖는 폴리뉴클레오티드 서열, 서열 137에 대해 적어도 90% 서열 동일성을 갖는 폴리뉴클레오티드 서열, 서열 138에 대해 적어도 90% 서열 동일성을 갖는 폴리뉴클레오티드 서열, 서열 139에 대해 적어도 90% 서열 동일성을 갖는 폴리뉴클레오티드 서열, 서열 140에 대해 적어도 90% 서열 동일성을 갖는 폴리뉴클레오티드 서열 및 서열 141에 대해 적어도 90% 서열 동일성을 갖는 폴리뉴클레오티드 서열로 이루어진 군으로부터 선택된 폴리뉴클레오티드 공여자 카세트에 관한 것이다.
추가 실시양태에서, 폴리뉴클레오티드 공여자 카세트는 1개 이상의 부위 특이적 뉴클레아제 결합 서열로 이루어진 부위 특이적 뉴클레아제 결합 도메인으로 구성된다. 한 측면에서, 1개 이상의 부위 특이적 뉴클레아제 결합 서열을 포함하는 부위 특이적 뉴클레아제 결합 도메인은 아연 핑거 결합 단백질, 메가뉴클레아제 결합 단백질, CRISPR 결합 단백질 또는 TALEN 결합 단백질에 의해 결합된다.
다른 실시양태에서, 폴리뉴클레오티드 공여자 카세트는 서열 142에 대해 적어도 90% 서열 동일성을 갖는 폴리뉴클레오티드 서열 및 서열 143에 대해 적어도 90% 서열 동일성을 갖는 폴리뉴클레오티드 서열로 이루어진 군으로부터 선택된 분석 도메인을 포함한다. 일부 측면에서, 분석 도메인은 1개 이상의 제한 효소 서열을 포함한다. 다른 측면에서, 분석 도메인은 40 내지 60%의 구아닌 및 시토신 염기 쌍 백분율을 포함한다. 추가 측면에서, 분석 도메인은 적어도 9 Bp 길이인 복수의 반복 서열을 함유하지 않는 폴리뉴클레오티드를 포함한다. 추가의 측면에서, 분석 도메인은 9 Bp 초과의 길이의 일련의 동일한 염기 쌍 서열을 함유하지 않은 폴리뉴클레오티드를 포함한다. 한 측면에서, 분석 도메인은 -19 kcal/mol 초과의 자유 에너지 (ΔG)의 2차 구조를 갖는 폴리뉴클레오티드를 포함한다. 다양한 다른 측면에서, 분석 도메인은 1개 이상의 프라이머 결합 서열을 포함한다.
한 실시양태에서, 폴리뉴클레오티드 공여자 카세트는 1개 이상의 상동성 아암 서열을 포함한다. 다른 측면에서, 1개 이상의 상동성 아암 서열은 50 내지 100개 염기 쌍 길이이다. 또 다른 실시양태에서, 분석 도메인은 펩티드를 코딩하지 않는다. 또 다른 실시양태에서, 분석 도메인은 펩티드를 코딩한다. 한 측면에서, 분석 도메인은 트랜스진을 포함하는 유전자 발현 카세트를 포함한다. 추가 측면에서, 유전자 발현 카세트는 프로모터를 포함한다. 또 다른 측면에서, 트랜스진은 리포터 유전자를 포함한다. 추가의 측면에서, 리포터 유전자는 yfp 유전자, gus 유전자, rfp 유전자, gfp 유전자, 카나마이신 저항성 유전자, aad-1 유전자, aad-12 유전자, pat 유전자 및 글리포세이트 내성 유전자로 이루어진 군으로부터 선택된다. 추가의 실시양태에서, 플라스미드 도메인은 pUC19 플라스미드를 포함한다. 한 측면에서, 플라스미드 도메인은 고-카피수 복제 기점을 포함한다. 추가 측면에서, 고-카피수 복제 기점은 cole1 복제 기점을 포함한다. 추가의 측면에서, 플라스미드 도메인은 선택 마커를 포함한다. 추가 측면에서, 선택 마커는 카나마이신 선택 마커, 암피실린 선택 마커, 스펙티노마이신 선택 마커, 클로람페니콜 선택 마커 및 리팜피신 선택 마커로 이루어진 군으로부터 선택된다.
한 실시양태에서, 본 개시내용은 식물 세포의 게놈 내의 폴리뉴클레오티드 공여자 카세트의 표적화 통합 방법에 관한 것이다. 한 측면에서, 방법은, 적어도 1개의 DNA-결합 도메인 및 적어도 1개의 뉴클레아제 도메인을 포함하며, 여기서 적어도 1개의 DNA-결합 도메인은 식물 세포의 게놈 내의 표적 부위에 결합하는 것인 부위 특이적 DNA 결합 뉴클레아제를 발현시키고; 식물 세포를 폴리뉴클레오티드 공여자 카세트와 접촉시키고; 식물 세포의 게놈 내의 표적 부위를 부위 특이적 DNA 결합 뉴클레아제로 절단하고; 폴리뉴클레오티드 공여자 카세트를 식물 세포의 게놈 내의 표적 부위 내로 통합시키는 것에 관한 것이다. 추가 측면에서, 적어도 1개의 DNA-결합 도메인은 아연 핑거 결합 도메인, 메가뉴클레아제 결합 도메인, TALEN 결합 도메인, 메가뉴클레아제 및 CRISPR 결합 도메인으로 이루어진 군으로부터 선택된다. 또 다른 측면에서, 뉴클레아제 도메인은 유형 IIS 제한 엔도뉴클레아제로부터의 것이다. 또 다른 측면에서, 유형 IIS 제한 엔도뉴클레아제는 FokI 및 StsI로 이루어진 군으로부터 선택된다. 추가의 측면에서, 폴리뉴클레오티드 공여자 카세트는 폴리펩티드를 발현한다. 또 다른 측면에서, 폴리뉴클레오티드 공여자 카세트는 비-코딩 핵산 서열을 포함한다. 한 측면에서, 폴리뉴클레오티드 공여자 카세트는 1개 이상의 아연 핑거 결합 서열을 포함한다. 또 다른 측면에서, 폴리뉴클레오티드 공여자 카세트는 1개 이상의 프라이머 결합 서열을 포함한다. 추가의 측면에서, 폴리뉴클레오티드 공여자 카세트의 통합은 상동성 지정 복구 메카니즘을 통해 발생한다. 추가의 측면에서, 폴리뉴클레오티드 공여자 카세트의 통합은 비-상동 말단 연결 지정 복구 메카니즘을 통해 발생한다. 한 실시양태에서, 폴리뉴클레오티드 공여자 카세트의 통합을 위해 선택된 식물 세포는 단자엽 또는 쌍자엽 식물 세포이다. 한 실시양태에서, 식물 세포는 옥수수 식물 세포, 밀 식물 세포 및 벼 식물 세포로 이루어진 군으로부터 선택된 단자엽 식물 세포이다. 한 실시양태에서, 식물 세포는 대두 식물 세포, 목화 식물 세포 및 카놀라 식물 세포로 이루어진 군으로부터 선택된 쌍자엽 식물 세포이다.
상기 기재된 예시적인 측면 및 실시양태 이외에도, 추가 측면 및 실시양태가 하기 기재의 연구에 의해 명백해질 것이다.
도 1은 pDAB111845의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉, 5, 7, 8, 9, 10, 11, 12, 15, 16, 25 및 26)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다.
도 2는 pDAB111846의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉, 1, 2, 5, 6, 11, 12, 15, 16, 21, 22, 29 및 30)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다.
도 3은 pDAB117415의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉, ZFN51 및 ZFN52)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 상기 플라스미드 설계에는 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 어셈블리를 위해 (즉, 깁슨(Gibson) 어셈블리를 통해) 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 추가로 포함된다.
도 4는 pDAB117416의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉, ZFN54 및 ZFN53)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 상기 플라스미드 설계에는 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 어셈블리를 위해 (즉, 깁슨 어셈블리를 통해) 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 추가로 포함된다.
도 5는 pDAB117417의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉, ZFN55)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 상기 플라스미드 설계에는 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 어셈블리를 위해 (즉, 깁슨 어셈블리를 통해) 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 추가로 포함된다.
도 6은 pDAB117419의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉, ZFN59 및 ZFN60)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 상기 플라스미드 설계에는 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 어셈블리를 위해 (즉, 깁슨 어셈블리를 통해) 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 추가로 포함된다.
도 7은 pDAB117434의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉 ZFN66, ZFN67, ZFN68 및 ZFN69)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 상기 플라스미드 설계에는 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 어셈블리를 위해 (즉, 깁슨 어셈블리를 통해) 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 추가로 포함된다.
도 8은 pDAB117418의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉 ZFN56, ZFN57 및 ZFN58)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 상기 플라스미드 설계에는 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 어셈블리를 위해 (즉, 깁슨 어셈블리를 통해) 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 추가로 포함된다.
도 9는 pDAB117420의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉, ZFN61 및 ZFN62)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 상기 플라스미드 설계에는 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 어셈블리를 위해 (즉, 깁슨 어셈블리를 통해) 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 추가로 포함된다. 도 10은 pDAB117421의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉 PPL17 쌍 3, PPL17 쌍 1 및 PPL17 쌍 2)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 상기 플라스미드 설계에는 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 어셈블리를 위해 (즉, 깁슨 어셈블리를 통해) 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 추가로 포함된다.
도 11 비-상동 말단 연결 (NHEJ)을 통한 통합을 위한 범용 공여자 폴리뉴클레오티드 서열의 표현. 관심 DNA (DNA X)가 관심 DNA의 어느 한 말단에 1개 이상 (즉, "1-N")의 아연 핑거 결합 부위 (ZFN BS)를 포함하는 2개의 제안된 벡터가 제공된다. 수직 화살표는 고유한 제한 부위를 제시하고, 수평 화살표는 잠재적 PCR 프라이머 부위를 나타낸다.
도 12 상동-지정 복구 (HDR)를 통한 통합을 위한 범용 공여자 폴리뉴클레오티드 서열의 표현. DNAX 및 HA 서열을 일괄하는 아연 핑거 뉴클레아제 결합 부위 (ZFN)를 갖는, 관심 DNA에 플랭킹된 상동 서열 (HA)의 2개 영역을 포함하는 관심 DNA (DNA X). 수직 화살표는 고유한 제한 부위를 제시하고, 수평 화살표는 잠재적 PCR 프라이머 부위를 나타낸다.
도 13A-13C는 제아 메이스(Zea mays) 최적 게놈 유전자좌 표적화 및 확인에서 범용 공여자 폴리뉴클레오티드 시스템 통합의 표적화 및 확인에 사용된 구축물을 예시한다. 도 13A) 도 5의 pDAB111845에 상기 제시된 바와 같은 ZFN 쌍의 위치를 갖는 ZFN 설계 공간. ZFN 쌍은 숫자로 표지되고, 결합 및 절단을 위한 ZFN 단백질에 의해 특이적으로 인식되는 특이적 ZFN 결합 서열에 상응한다. 도 13B) ZFN 단백질 발현 구축물의 형상. ZFN 발현 구축물은 ZFN 단백질의 발현을 유도하는데 사용되는 구성적 식물 프로모터 (Zm Ubi1)를 함유한다. ZFN 단백질은 핵 국재화 서열 (NLS), 아연 핑거 단백질 (ZFP-L 및 ZFP-R, 여기서 L은 좌측 결합 ZFN 단백질을 나타내고, R은 우측 결합 단백질을 나타냄), Fok-1 엔도뉴클레아제 (Fok1) 및 자기-가수분해 2A (2A)를 함유한다. 도 13C) 제아 메이스 최적 게놈 유전자좌의 NHEJ 매개 표적화를 위한 범용 공여자 폴리뉴클레오티드. Z1-Z6은 제아 메이스 최적 게놈 유전자좌 표적에 특이적인 ZFN 결합 부위를 나타낸다. ZFN 부위의 수는 3-6개로 달라질 수 있다. 수직 화살표는 고유한 제한 부위를 제시하고, 수평 화살표는 잠재적 PCR 프라이머 부위를 나타낸다. 범용 공여자 폴리뉴클레오티드 시스템은 제아 메이스 최적 게놈 유전자좌 내의 통합에 사용된 공여자에 공통적인 짧은 (110 bp) 서열이다.
도 14는 pDAB8393의 플라스미드 지도를 예시한다.
도 15는 제아 메이스 선택된 게놈 유전자좌 표적에서의 ZFN 절단 활성을 예시한다. 절단 활성은 1백만 개의 고품질 리드당 ZFN 절단 부위에서 indel (삽입 및 결실)을 갖는 서열의 수로 나타낸다.
도 16은 NHEJ 기반 신속 표적화 분석 (RTA) 방법을 사용한 제아 메이스 선택된 게놈 유전자좌 표적의 확인을 예시한다.
도 17은 플랭킹 서열 분석 및 트랜스진 발현 연구에 사용된 이벤트를 포함하는 무작위 통합을 통해 제아 메이스 내로 형질전환된 플라스미드 구축물을 예시한다.
도 2는 pDAB111846의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉, 1, 2, 5, 6, 11, 12, 15, 16, 21, 22, 29 및 30)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다.
도 3은 pDAB117415의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉, ZFN51 및 ZFN52)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 상기 플라스미드 설계에는 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 어셈블리를 위해 (즉, 깁슨(Gibson) 어셈블리를 통해) 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 추가로 포함된다.
도 4는 pDAB117416의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉, ZFN54 및 ZFN53)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 상기 플라스미드 설계에는 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 어셈블리를 위해 (즉, 깁슨 어셈블리를 통해) 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 추가로 포함된다.
도 5는 pDAB117417의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉, ZFN55)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 상기 플라스미드 설계에는 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 어셈블리를 위해 (즉, 깁슨 어셈블리를 통해) 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 추가로 포함된다.
도 6은 pDAB117419의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉, ZFN59 및 ZFN60)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 상기 플라스미드 설계에는 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 어셈블리를 위해 (즉, 깁슨 어셈블리를 통해) 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 추가로 포함된다.
도 7은 pDAB117434의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉 ZFN66, ZFN67, ZFN68 및 ZFN69)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 상기 플라스미드 설계에는 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 어셈블리를 위해 (즉, 깁슨 어셈블리를 통해) 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 추가로 포함된다.
도 8은 pDAB117418의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉 ZFN56, ZFN57 및 ZFN58)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 상기 플라스미드 설계에는 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 어셈블리를 위해 (즉, 깁슨 어셈블리를 통해) 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 추가로 포함된다.
도 9는 pDAB117420의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉, ZFN61 및 ZFN62)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 상기 플라스미드 설계에는 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 어셈블리를 위해 (즉, 깁슨 어셈블리를 통해) 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 추가로 포함된다. 도 10은 pDAB117421의 플라스미드 지도를 예시한다. 넘버링된 요소 (즉 PPL17 쌍 3, PPL17 쌍 1 및 PPL17 쌍 2)는 상응하는 아연 핑거 뉴클레아제 단백질에 의해 인식되고 절단되는 약 20 내지 35개 염기 쌍 길이의 아연 핑거 뉴클레아제 결합 서열에 상응한다. 이들 아연 핑거 결합 서열 및 주석 처리된 "UZI 서열" (이는 프라이머 설계를 위한 제한 부위 및 DNA 서열, 또는 코딩 서열을 함유하는 100-150 bp 주형 영역임)은 범용 공여자 카세트를 포함한다. 상기 플라스미드 설계에는 플라스미드 벡터 내의 범용 공여자 카세트의 고처리량 어셈블리를 위해 (즉, 깁슨 어셈블리를 통해) 플라스미드 벡터에 대한 상동성을 공유하는 서열인 "104113 중첩"이 추가로 포함된다.
도 11 비-상동 말단 연결 (NHEJ)을 통한 통합을 위한 범용 공여자 폴리뉴클레오티드 서열의 표현. 관심 DNA (DNA X)가 관심 DNA의 어느 한 말단에 1개 이상 (즉, "1-N")의 아연 핑거 결합 부위 (ZFN BS)를 포함하는 2개의 제안된 벡터가 제공된다. 수직 화살표는 고유한 제한 부위를 제시하고, 수평 화살표는 잠재적 PCR 프라이머 부위를 나타낸다.
도 12 상동-지정 복구 (HDR)를 통한 통합을 위한 범용 공여자 폴리뉴클레오티드 서열의 표현. DNAX 및 HA 서열을 일괄하는 아연 핑거 뉴클레아제 결합 부위 (ZFN)를 갖는, 관심 DNA에 플랭킹된 상동 서열 (HA)의 2개 영역을 포함하는 관심 DNA (DNA X). 수직 화살표는 고유한 제한 부위를 제시하고, 수평 화살표는 잠재적 PCR 프라이머 부위를 나타낸다.
도 13A-13C는 제아 메이스(Zea mays) 최적 게놈 유전자좌 표적화 및 확인에서 범용 공여자 폴리뉴클레오티드 시스템 통합의 표적화 및 확인에 사용된 구축물을 예시한다. 도 13A) 도 5의 pDAB111845에 상기 제시된 바와 같은 ZFN 쌍의 위치를 갖는 ZFN 설계 공간. ZFN 쌍은 숫자로 표지되고, 결합 및 절단을 위한 ZFN 단백질에 의해 특이적으로 인식되는 특이적 ZFN 결합 서열에 상응한다. 도 13B) ZFN 단백질 발현 구축물의 형상. ZFN 발현 구축물은 ZFN 단백질의 발현을 유도하는데 사용되는 구성적 식물 프로모터 (Zm Ubi1)를 함유한다. ZFN 단백질은 핵 국재화 서열 (NLS), 아연 핑거 단백질 (ZFP-L 및 ZFP-R, 여기서 L은 좌측 결합 ZFN 단백질을 나타내고, R은 우측 결합 단백질을 나타냄), Fok-1 엔도뉴클레아제 (Fok1) 및 자기-가수분해 2A (2A)를 함유한다. 도 13C) 제아 메이스 최적 게놈 유전자좌의 NHEJ 매개 표적화를 위한 범용 공여자 폴리뉴클레오티드. Z1-Z6은 제아 메이스 최적 게놈 유전자좌 표적에 특이적인 ZFN 결합 부위를 나타낸다. ZFN 부위의 수는 3-6개로 달라질 수 있다. 수직 화살표는 고유한 제한 부위를 제시하고, 수평 화살표는 잠재적 PCR 프라이머 부위를 나타낸다. 범용 공여자 폴리뉴클레오티드 시스템은 제아 메이스 최적 게놈 유전자좌 내의 통합에 사용된 공여자에 공통적인 짧은 (110 bp) 서열이다.
도 14는 pDAB8393의 플라스미드 지도를 예시한다.
도 15는 제아 메이스 선택된 게놈 유전자좌 표적에서의 ZFN 절단 활성을 예시한다. 절단 활성은 1백만 개의 고품질 리드당 ZFN 절단 부위에서 indel (삽입 및 결실)을 갖는 서열의 수로 나타낸다.
도 16은 NHEJ 기반 신속 표적화 분석 (RTA) 방법을 사용한 제아 메이스 선택된 게놈 유전자좌 표적의 확인을 예시한다.
도 17은 플랭킹 서열 분석 및 트랜스진 발현 연구에 사용된 이벤트를 포함하는 무작위 통합을 통해 제아 메이스 내로 형질전환된 플라스미드 구축물을 예시한다.
I. 개관
본 개시내용은 다양한 측면에서 아연 핑거 뉴클레아제 결합 도메인, 분석 도메인 및 플라스미드 도메인을 포함하는 폴리뉴클레오티드 공여자 카세트를 제공한다. 다른 측면에서, 본 개시내용은 식물 세포의 게놈 내의 폴리뉴클레오티드 공여자 카세트의 표적화 통합을 제공하는 방법을 제공한다. 개시된 방법에 따르면, 적어도 1개의 DNA-결합 도메인 및 적어도 1개의 뉴클레아제 도메인을 포함하는 부위 특이적 DNA 결합 뉴클레아제가, 적어도 1개의 DNA-결합 도메인이 식물 세포의 게놈 내의 표적 부위에 결합하도록 발현된다. 추가로, 식물 세포가 폴리뉴클레오티드 공여자 카세트와 접촉된다. 후속으로, 식물 세포의 게놈 내의 표적 부위가 부위 특이적 DNA 결합 뉴클레아제로 절단되고, 폴리뉴클레오티드 공여자 카세트가 식물 세포의 게놈 내의 표적 부위 내로 통합된다.
II. 용어
달리 정의되지 않는 한, 본원에 사용된 모든 기술 과학 용어는 본 개시내용이 관련된 기술분야의 통상의 기술자에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 상충하는 경우, 정의를 비롯하여 본원이 우선할 것이다. 문맥에서 달리 요구되지 않는 한, 단수의 용어는 복수를 포함할 것이고, 복수의 용어는 단수를 포함할 것이다. 본원에 인용된 모든 공개, 특허 및 다른 참고문헌은, 특허 또는 특허 공개의 단지 특정 섹션만이 참조로 포함되는 것으로 나타내지 않는 한, 각각의 개별 공개 또는 특허 출원이 구체적으로 및 개별적으로 참조로 포함되는 것으로 나타낸 경우와 같이, 모든 목적을 위해 그 전문이 참조로 포함된다.
본 개시내용을 추가로 명확화하기 위해, 하기 용어, 약어 및 정의가 제공된다.
본원에 사용된 용어 "포함한다", "포함하는", "포괄한다", "포괄하는", "갖는다", "갖는", "함유한다", 또는 "함유하는", 또는 그의 임의의 다른 변형은 비-배타적이거나 또는 개방형인 것을 의도한다. 예를 들어, 일련의 요소들을 포함하는 조성물, 혼합물, 과정, 방법, 물품, 또는 장치는 반드시 이들 요소에만 제한되는 것은 아니며, 이러한 조성물, 혼합물, 과정, 방법, 물품, 또는 장치에 명백히 열거되지 않거나 내재되지 않은 다른 요소를 포함할 수 있다. 또한, 달리 명백하게 언급되지 않는 한, "또는"은 포함적 논리합을 지칭하며 배타적 논리합을 지칭하지 않는다. 예를 들어, 조건 A 또는 B는 다음 중 임의의 하나에 의해 충족된다: A가 참이고 (또는 존재하고) B가 거짓인 (또는 존재하지 않는) 것, A가 거짓이고 (또는 존재하지 않고) B가 참인 (또는 존재하는) 것, 및 A 및 B 둘 다가 참인 (또는 존재하는) 것.
본원에 사용된 용어 "발명" 또는 "본 발명"은 비제한적 용어이며, 특정한 본 발명의 임의의 단일 실시양태를 지칭하는 것으로 의도되지 않고, 본원에 개시된 모든 가능한 실시양태를 포괄하도록 의도된다.
본원에 사용된 용어 "식물"은 전체 식물 및 임의의 자손, 세포, 조직, 또는 식물의 부분을 포함한다. 용어 "식물 부분"은, 예를 들어 비제한적으로, 종자 (성숙 종자, 외종피가 없는 미성숙 배아 및 미성숙 종자 포함); 식물 삽목부; 식물 세포; 식물 세포 배양물; 식물 기관 (예를 들어, 화분, 배아, 꽃, 열매, 싹, 잎, 뿌리, 줄기 및 관련된 외식편)을 비롯한 식물의 임의의 부분(들)을 포함한다. 식물 조직 또는 식물 기관은 종자, 캘러스, 또는 구조적 또는 기능적 단위로 조직화된 식물 세포의 임의의 다른 군일 수 있다. 식물 세포 또는 조직 배양물은 세포 또는 조직을 얻은 식물의 생리학적 및 형태학적 특징을 갖는 식물을 재생할 수 있고, 식물과 실질적으로 동일한 유전자형을 갖는 식물을 재생할 수 있다. 대조적으로, 일부 식물 세포는 식물을 생산하도록 재생될 수 없다. 식물 세포 또는 조직 배양물에서 재생가능한 세포는 배아, 원형질체, 분열조직 세포, 캘러스, 화분, 잎, 꽃밥, 뿌리, 근단, 수염, 꽃, 커넬, 이삭, 속대, 껍질, 또는 줄기일 수 있다.
식물 부분은 수확가능한 부분 및 자손 식물의 번식에 유용한 부분을 포함한다. 번식에 유용한 식물 부분은, 예를 들어 비제한적으로, 종자; 열매; 삽목부; 묘목; 괴경; 및 근경을 포함한다. 식물의 수확가능한 부분은, 예를 들어 비제한적으로 꽃; 화분; 묘목; 괴경; 잎; 줄기; 열매; 종자 및 뿌리를 비롯한 식물의 임의의 유용한 부분일 수 있다.
식물 세포는 식물의 구조적 및 생리학적 단위이다. 본원에 사용된 식물 세포는 원형질체 및 부분 세포벽 내의 원형질체를 포함한다. 식물 세포는 단리된 단일 세포, 또는 세포의 응집체 (예를 들어, 이쇄성 캘러스 및 배양된 세포)의 형태일 수 있고, 보다 고차원적으로 조직화된 단위 (예를 들어, 식물 조직, 식물 기관, 및 식물)의 일부일 수 있다. 따라서, 식물 세포는 원형질체, 배우체 생산 세포, 또는 전체 식물로 재생될 수 있는 세포 또는 세포의 집단일 수 있다. 이에 따라, 다수의 식물 세포를 포함하며 전체 식물로 재생될 수 있는 종자는 본원의 실시양태에서 "식물 부분"으로 간주된다.
본원에 사용된 용어 "원형질체"는 세포벽이 완전히 또는 부분적으로 제거되었으며 네이키드 지질 이중층 막을 갖는 식물 세포를 지칭한다. 전형적으로, 원형질체는 세포 배양물 또는 전체 식물로 재생되는 효력을 갖는, 세포벽이 없는 단리된 식물 세포이다.
본원에 사용된 "내인성 서열"은 유기체 또는 유기체의 게놈 내의 그의 자연 위치에 존재하는 천연 형태의 폴리뉴클레오티드, 유전자 또는 폴리펩티드를 정의한다.
본원에 사용된 용어 "단리된"은 그의 자연 환경에서 제거되었음을 의미한다.
본원에 사용된 용어 "정제된"은 천연 또는 자연 환경에서 분자 또는 화합물과 정상적으로 회합되어 있는 오염물이 실질적으로 없는 형태의 분자 또는 화합물의 단리에 관한 것이며, 본래 조성물의 다른 성분으로부터 분리된 결과로서 순도가 증가된 것을 의미한다. 용어 "정제된 핵산"은 본원에서 폴리펩티드, 지질 및 탄수화물을 포함하나 이에 제한되지는 않는 다른 화합물로부터 분리된 핵산 서열을 기재하기 위해 사용된다.
본원에 사용된 용어 "폴리뉴클레오티드", "핵산", 및 "핵산 분자"는 상호교환가능하게 사용되고, 단수의 핵산; 복수의 핵산; 핵산 단편, 변이체, 또는 그의 유도체; 및 핵산 구축물 (예를 들어, 메신저 RNA (mRNA) 및 플라스미드 DNA (pDNA))을 포괄할 수 있다. 폴리뉴클레오티드 또는 핵산은 전장 cDNA 서열의 뉴클레오티드 서열, 또는 비번역 5' 및/또는 3' 서열 및 코딩 서열(들)을 비롯한 그의 단편을 함유할 수 있다. 폴리뉴클레오티드 또는 핵산은 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드로 구성될 수 있고, 이는 비변형된 리보뉴클레오티드 또는 데옥시리보뉴클레오티드 또는 변형된 리보뉴클레오티드 또는 데옥시리보뉴클레오티드를 포함할 수 있다. 예를 들어, 폴리뉴클레오티드 또는 핵산은 단일- 및 이중-가닥 DNA; 단일- 및 이중-가닥 영역의 혼합물인 DNA; 단일- 및 이중-가닥 RNA; 및 단일- 및 이중-가닥 영역의 혼합물인 RNA로 구성될 수 있다. DNA 및 RNA를 포함하는 하이브리드 분자는 단일-가닥, 이중-가닥, 또는 단일- 및 이중-가닥 영역의 혼합물일 수 있다. 상기 용어는 또한 화학적으로, 효소적으로, 및 대사적으로 변형된 형태의 폴리뉴클레오티드 또는 핵산을 포함한다.
특이적 DNA는 또한 데옥시리보뉴클레오티드 염기-쌍형성의 규칙에 따라 결정되는 서열을 갖는 그의 상보체를 지칭하는 것으로 이해된다.
본원에 사용된 용어 "유전자"는 기능적 생성물 (RNA 또는 폴리펩티드/단백질)을 코딩하는 핵산을 지칭한다. 유전자는 기능적 생성물을 코딩하는 서열의 앞 (5' 비-코딩 서열) 및/또는 뒤 (3' 비-코딩 서열)에 조절 서열을 포함할 수 있다.
본원에 사용된 용어 "코딩 서열"은 특정 아미노산 서열을 코딩하는 핵산 서열을 지칭한다. "조절 서열"은 연관된 코딩 서열의 전사, RNA 프로세싱 또는 안정성, 또는 번역에 영향을 미치는, 코딩 서열의 상류 (예를 들어, 5' 비-코딩 서열), 내부 또는 하류 (예를 들어, 3' 비-코딩 서열)에 위치하는 뉴클레오티드 서열을 지칭한다. 조절 서열은, 예를 들어 비제한적으로 프로모터; 번역 리더 서열; 인트론; 폴리아데닐화 인식 서열; RNA 프로세싱 부위; 이펙터 결합 부위; 및 스템-루프 구조를 포함한다.
본원에 사용된 용어 "분석 도메인"은 핵산 서열의 표적화 삽입을 보조하는 기능적 요소를 함유하는 핵산 서열을 정의한다. 예를 들어, 분석 도메인은 특이적으로 설계된 제한 효소 부위, 아연 핑거 결합 부위, 조작된 랜딩 패드 또는 조작된 트랜스진 통합 플랫폼을 함유할 수 있고, 유전자 조절 요소 또는 오픈 리딩 프레임을 포함하거나 포함하지 않을 수 있다. 예를 들어, 전문이 본원에 참조로 포함되는 미국 특허 공개 번호 20110191899를 참조한다.
본원에 정의된 바와 같은 "부위 특이적 뉴클레아제 결합 도메인"은 1개 이상의 부위 특이적 결합 서열을 포함하는 핵산 서열이다. 본원에 사용된 부위 특이적 결합 서열은 서열-특이적 상호작용으로 단백질에 결합하는 핵산 서열이다.
본원에 사용된 용어 "폴리펩티드"는 단수의 폴리펩티드, 복수의 폴리펩티드 및 그의 단편을 포함한다. 이 용어는 아미드 결합 (펩티드 결합으로도 공지됨)에 의해 선형으로 연결된 단량체 (아미노산)로 구성된 분자를 지칭한다. 용어 "폴리펩티드"는 2개 이상의 아미노산의 임의의 쇄 또는 쇄들을 지칭하고, 특정 길이 또는 크기의 생성물을 지칭하지는 않는다. 따라서, 펩티드, 디펩티드, 트리펩티드, 올리고펩티드, 단백질, 아미노산 쇄, 또는 2개 이상의 아미노산의 쇄 또는 쇄들을 지칭하기 위해 사용되는 임의의 다른 용어는 "폴리펩티드"의 정의 내에 포함되고, 상기 용어는 본원에서 "폴리펩티드"와 상호교환가능하게 사용된다. 폴리펩티드는 천연 생물학적 공급원으로부터 단리되거나 또는 재조합 기술에 의해 생산될 수 있으나, 특정 폴리펩티드가 반드시 특정 핵산으로부터 번역되는 것은 아니다. 폴리펩티드는 예를 들어 비제한적으로 화학적 합성을 포함하는 임의의 적절한 방식으로 생성될 수 있다.
대조적으로, 용어 "이종"은 참조 (숙주) 유기체 내의 그의 위치에서 정상적으로 발견되지 않는 폴리뉴클레오티드, 유전자 또는 폴리펩티드를 지칭한다. 예를 들어, 이종 핵산은 참조 유기체 내에서 상이한 게놈 위치에서 정상적으로 발견되는 핵산일 수 있다. 추가의 예로서, 이종 핵산은 참조 유기체에서 정상적으로 발견되지 않는 핵산일 수 있다. 이종 폴리뉴클레오티드, 유전자 또는 폴리펩티드를 포함하는 숙주 유기체는 이종 폴리뉴클레오티드, 유전자 또는 폴리펩티드를 숙주 유기체 내로 도입함으로써 생산될 수 있다. 특정한 예에서, 이종 폴리뉴클레오티드는 상응하는 천연 폴리뉴클레오티드와 상이한 형태로 공급원 유기체 내로 재도입된 천연 코딩 서열 또는 그의 일부를 포함한다. 특정한 예에서, 이종 유전자는 상응하는 천연 유전자와 상이한 형태로 공급원 유기체 내로 재도입된 천연 코딩 서열 또는 그의 일부를 포함한다. 예를 들어, 이종 유전자는 천연 숙주 내로 재도입된 비-천연 조절 영역을 포함하는 키메라 유전자의 일부인 천연 코딩 서열을 포함할 수 있다. 특정한 예에서, 이종 폴리펩티드는 상응하는 천연 폴리펩티드와 상이한 형태로 공급원 유기체 내로 재도입된 천연 폴리펩티드이다.
이종 유전자 또는 폴리펩티드는 키메라 또는 융합 폴리펩티드, 또는 이를 코딩하는 유전자를 생산하기 위해 또 다른 유전자 또는 폴리펩티드에 융합된 기능적 폴리펩티드를 코딩하는 기능적 폴리펩티드 또는 핵산 서열을 포함하는 유전자 또는 폴리펩티드일 수 있다. 특정한 실시양태의 유전자 및 단백질은 구체적으로 예시된 전장 서열 및 일부, 절편, 단편 (인접 단편 및 전장 분자와 비교한 내부 및/또는 말단 결실 포함), 변이체, 돌연변이체, 키메라, 및 이들 서열의 융합체를 포함한다.
본원에 사용된 용어 "변형"은 폴리뉴클레오티드에 의해 코딩된 폴리펩티드의 활성을 감소시키거나, 실질적으로 제거하거나 또는 제거하는 본원에 개시된 폴리뉴클레오티드에서의 변화, 뿐만 아니라 폴리펩티드의 활성을 감소시키거나, 실질적으로 제거하거나 또는 제거하는 본원에 개시된 폴리펩티드에서의 변화를 지칭할 수 있다. 대안적으로, 용어 "변형"은 폴리뉴클레오티드에 의해 코딩된 폴리펩티드의 활성을 증가시키거나 또는 증진시키는 본원에 개시된 폴리뉴클레오티드에서의 변화, 뿐만 아니라 폴리펩티드의 활성을 증가시키거나 또는 증진시키는 본원에 개시된 폴리펩티드에서의 변화를 지칭할 수 있다. 이러한 변화는 결실, 돌연변이 (예를 들어, 자발적 돌연변이유발, 무작위 돌연변이유발, 돌연변이유발 유전자에 의해 초래된 돌연변이유발, 또는 트랜스포손 돌연변이 유발), 치환, 삽입, 하향조절, 세포 위치 변경, 폴리뉴클레오티드 또는 폴리펩티드의 상태 변경 (예를 들어, 메틸화, 인산화 또는 유비퀴틴화), 보조인자 제거, 안티센스 RNA/DNA의 도입, 간섭 RNA/DNA의 도입, 화학적 변형, 공유 변형, UV 또는 X선 조사, 상동 재조합, 유사분열 재조합, 프로모터 교체 방법, 및/또는 이들의 조합을 포함하나 이에 제한되지는 않는 관련 기술분야에 널리 공지된 방법에 의해 이루어질 수 있다. 어떤 뉴클레오티드 또는 아미노산 잔기가 변형될 수 있는지를 결정하는 안내는 특정한 폴리뉴클레오티드 또는 폴리펩티드의 서열을 상동 폴리뉴클레오티드 또는 폴리펩티드의 서열과 비교하고, 높은 상동성 영역 (보존된 영역) 또는 컨센서스 서열 내에서 이루어진 변형의 수를 최대화함으로써 확인할 수 있다.
본원에 사용된 용어 "유도체"는 본 개시내용에 제시된 서열의 변형을 지칭한다. 이러한 변형의 예는 작물 종에서 본원에 개시된 코딩 서열의 기능을 보존하거나, 경미하게 변경하거나 증가시키는, 본원에 개시된 코딩 서열의 핵산 서열에 관련된 1개 이상의 염기의 치환, 삽입, 및/또는 결실이다. 이러한 유도체는 예를 들어 서열 구조를 예측하고 최적화하기 위한 컴퓨터 모델링 기술을 사용하여 관련 기술분야의 통상의 기술자에 의해 용이하게 결정될 수 있다. 따라서, 용어 "유도체"는 또한 본 개시내용의 실시양태의 생산에 사용하기 위한 개시된 관능기를 가질 수 있도록 본원에 개시된 코딩 서열과 실질적인 서열 동일성을 갖는 핵산 서열을 포함한다.
용어 "프로모터"는 핵산 코딩 서열 또는 기능적 RNA의 발현을 제어할 수 있는 DNA 서열을 지칭한다. 예에서, 제어되는 코딩 서열은 프로모터 서열에 대해 3'에 위치한다. 프로모터는 그 전체가 천연 유전자로부터 유래될 수 있거나, 프로모터는 자연에서 발견된 상이한 프로모터로부터 유래된 상이한 요소로 구성될 수 있거나, 또는 프로모터는 심지어 합리적으로 설계된 DNA 절편을 포함할 수 있다. 관련 기술분야의 통상의 기술자는 상이한 프로모터가 상이한 조직 또는 세포 유형에서, 또는 상이한 발생 단계에서, 또는 상이한 환경적 또는 생리학적 조건에 반응하여 유전자의 발현을 지시할 수 있음을 이해한다. 상기 모든 프로모터의 예는 공지되어 있고, 이종 핵산의 발현을 제어하기 위해 관련 기술분야에서 사용된다. 대부분의 시기에 대부분의 세포 유형 내에서 유전자의 발현을 지시하는 프로모터는 통상적으로 "구성적 프로모터"로 지칭된다. 게다가, 관련 기술분야의 통상의 기술자들이 조절 서열의 정확한 경계를 설명하기 위해 시도해왔지만 (많은 경우에 비성공적임), 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있는 것으로 이해되고 있다. 특정한 핵산의 프로모터 활성은 관련 기술분야의 통상의 기술자에게 친숙한 기술을 사용하여 검정될 수 있다.
용어 "작동가능하게 연결된"은 핵산 서열 중 하나의 기능이 또 다른 것에 의해 영향을 받는, 단일 핵산 상의 핵산 서열들의 회합을 지칭한다. 예를 들어, 프로모터가 코딩 서열의 발현에 영향을 미칠 수 있는 경우에 프로모터는 그 코딩 서열과 작동가능하게 연결된다 (예를 들어, 코딩 서열은 프로모터의 전사 제어 하에 있다). 코딩 서열은 조절 서열에 센스 또는 안티센스 배향으로 작동가능하게 연결될 수 있다.
본원에 사용된 용어 "발현"은 DNA로부터 유래된 센스 (mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 지칭할 수 있다. 발현은 또한 mRNA의 폴리펩티드로의 번역을 지칭할 수 있다. 본원에 사용된 용어 "과다발현"은 동일한 유전자 또는 관련 유전자의 내인성 발현보다 더 높은 발현을 지칭한다. 따라서, 이종 유전자는 그의 발현이 대등한 내인성 유전자의 발현보다 더 높은 경우에 "과다발현"된다.
본원에 사용된 용어 "형질전환" 또는 "형질전환시킴"은 유전적으로 안정한 유전을 일으키는, 핵산 또는 그의 단편의 숙주 유기체 내로의 전달 및 통합을 지칭한다. 형질전환 핵산을 함유하는 숙주 유기체는 "트랜스제닉", "재조합" 또는 "형질전환된" 유기체로 지칭된다. 공지된 형질전환 방법은 예를 들어 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)- 또는 에이. 리조게네스(A. rhizogenes)-매개 형질전환; 인산칼슘 형질전환; 폴리브렌 형질전환; 원형질체 융합; 전기천공; 초음파 방법 (예를 들어, 초음파천공); 리포솜 형질전환; 미세주사; 네이키드 DNA로의 형질전환; 플라스미드 벡터로의 형질전환; 바이러스 벡터로의 형질전환; 바이오리스틱 형질전환 (마이크로입자 충격); 탄화규소 휘스커스(WHISKERS)-매개 형질전환; 에어로졸 비밍; 및 PEG-매개 형질전환을 포함한다.
본원에 사용된 용어 "도입된" (핵산을 세포 내로 도입하는 것과 관련됨)은 세포의 형질전환, 뿐만 아니라 통상의 식물 육종 기술을 이용하여 수행할 수 있는, 제2 식물이 핵산을 함유하도록 핵산을 포함하는 식물을 제2 식물과 교배하는 것을 포함한다. 이러한 육종 기술은 관련 기술분야에 공지되어 있다. 식물 육종 기술의 논의에 대해서는, 문헌 [Poehlman (1995) Breeding Field Crops, 4th Edition, AVI Publication Co., Westport CT]을 참조한다.
역교배 방법이 핵산을 식물 내로 도입하기 위해 사용될 수 있다. 이 기술은 수 십년 동안 형질을 식물 내로 도입하기 위해 사용되어 왔다. 역교배 (및 다른 식물 육종 방법론)에 대한 설명의 예는 예를 들어 상기 문헌 [Poelman (1995)]; 및 [Jensen (1988) Plant Breeding Methodology, Wiley, New York, NY]에서 찾아볼 수 있다. 예시적인 역교배 프로토콜에서, 관심 대상의 본래 식물 ("반복친")은 도입될 핵산을 보유하는 제2 식물 ("비-반복친")과 교배된다. 상기 교배로부터 생성되는 자손은 이어서 다시 반복친과 교배되고, 비-반복친으로부터의 핵산 이외에도 반복친의 본질적으로 모든 목적하는 형태학적 및 생리학적 특징이 전환된 식물에서 회복되는 전환된 식물이 얻어질 때까지 이 과정을 반복한다.
"결합"은 거대분자들 간의 (예를 들어, 단백질과 핵산 간의) 서열-특이적인 비-공유 상호작용을 지칭한다. 전체로서의 상호작용이 서열-특이적인 한, 결합 상호작용의 모든 성분이 서열-특이적일 필요는 없다 (예를 들어, DNA 백본 내의 포스페이트 잔기와의 접촉). 이러한 상호작용은 일반적으로 10-6 M-1 이하의 해리 상수 (Kd)에 의해 특성화된다. "친화도"는 결합 강도를 지칭하고, 결합 친화도의 증가는 보다 낮은 Kd와 상호관련된다.
"결합 단백질"은 또 다른 분자에 비-공유적으로 결합할 수 있는 단백질이다. 결합 단백질은, 예를 들어 DNA 분자 (DNA-결합 단백질), RNA 분자 (RNA-결합 단백질) 및/또는 단백질 분자 (단백질-결합 단백질)에 결합할 수 있다. 단백질-결합 단백질의 경우에, 이는 자신에게 결합할 수 있고/거나 (동종이량체, 동종삼량체 등을 형성) 이는 상이한 단백질 또는 단백질들의 1개 이상의 분자에 결합할 수 있다. 결합 단백질은 1종 초과의 유형의 결합 활성을 가질 수 있다. 예를 들어, 아연 핑거 단백질은 DNA-결합, RNA-결합 및 단백질-결합 활성을 갖는다.
"재조합"은 비-상동 말단 연결 (NHEJ) 및 상동 재조합에 의한 공여자 포획을 포함하나 이에 제한되지는 않는 2개의 폴리뉴클레오티드 사이의 유전 정보의 교환 과정을 지칭한다. 본 개시내용의 목적을 위해, "상동 재조합 (HR)"은 예를 들어 상동성-지정 복구 메카니즘을 통한 세포에서의 이중-가닥 파괴의 복구 동안 발생하는 상기 교환의 특수한 형태를 지칭한다. 이 과정은 뉴클레오티드 서열 상동성을 필요로 하고, "표적" 분자 (즉, 이중-가닥 파괴를 겪은 것)의 주형 복구를 위해 "공여자" 분자를 사용하며, 이는 공여자로부터 표적으로의 유전자 정보의 전달을 유도하기 때문에 "비-교차 유전자 전환" 또는 "쇼트 트랙 유전자 전환"으로 다양하게 공지되어 있다. 어떠한 특정한 이론에 얽매이는 것을 원하지는 않지만, 이러한 전달은 파괴된 표적과 공여자 사이에 형성된 헤테로듀플렉스 DNA의 미스매치 수정, 및/또는 표적의 일부가 될 유전자 정보를 재합성하는데 공여자가 사용되는 "합성-의존성 가닥 어닐링" 및/또는 관련된 과정을 수반할 수 있다. 이러한 특수화된 HR은 종종, 공여자 폴리뉴클레오티드의 서열의 일부 또는 전부가 표적 폴리뉴클레오티드 내로 혼입되도록 표적 분자의 서열의 변경을 일으킨다. HR-유도 통합을 위해, 공여자 분자는 적어도 50-100개 염기 쌍 길이의 게놈에 대한 적어도 1개의 상동성 영역 ("상동성 아암")을 함유한다. 예를 들어, 미국 특허 공개 번호 20110281361을 참조한다.
본 개시내용의 방법에서, 본원에 기재된 1종 이상의 표적화 뉴클레아제는 미리 결정된 부위에서 표적 서열 (예를 들어, 세포 염색질)에 이중-가닥 파괴를 생성하고, 파괴 영역에서 뉴클레오티드 서열에 대한 상동성을 갖는 "공여자" 폴리뉴클레오티드가 세포 내로 도입될 수 있다. 이중-가닥 파괴의 존재는 공여자 서열의 통합을 용이하게 하는 것으로 밝혀졌다. 공여자 서열은 물리적으로 통합될 수 있거나, 또는 대안적으로, 공여자 폴리뉴클레오티드는 상동 재조합을 통한 파괴의 복구를 위한 주형으로 사용되어 공여자 내의 뉴클레오티드 서열의 전부 또는 일부의 세포 염색질 내로의 도입을 일으킨다. 따라서, 세포 염색질 내의 제1 서열은 변경될 수 있고, 특정 실시양태에서, 공여자 폴리뉴클레오티드에 존재하는 서열로 전환될 수 있다. 따라서, 용어 "교체하다" 또는 "교체"의 사용은 하나의 뉴클레오티드 서열의 또 다른 것에 의한 교체 (즉, 정보를 제공하는 의미에서 서열의 교체)를 나타내는 것으로 이해될 수 있고, 하나의 폴리뉴클레오티드의 또 다른 것에 의한 물리적 또는 화학적 교체를 반드시 필요로 하는 것은 아니다.
"절단"은 DNA 분자의 공유결합 백본의 파괴를 지칭한다. 절단은 포스포디에스테르 결합의 효소적 또는 화학적 가수분해를 포함하나 이에 제한되지는 않는 다양한 방법에 의해 개시될 수 있다. 단일-가닥 절단 및 이중-가닥 절단 둘 다가 가능하고, 이중-가닥 절단은 2개의 별개의 단일-가닥 절단 이벤트의 결과로서 발생할 수 있다. DNA 절단은 평활 말단 또는 스태거형 말단의 생산을 일으킬 수 있다. 특정 실시양태에서, 융합 폴리펩티드가 표적화 이중-가닥 DNA 절단에 사용된다.
본원에 사용된 용어 "플라스미드" 및 "벡터"는 세포의 중추적 대사의 일부가 아닌 1개 이상의 유전자(들)를 보유할 수 있는 염색체외 요소를 지칭한다. 플라스미드 및 벡터는 전형적으로 원형 이중-가닥 DNA 분자이다. 그러나, 플라스미드 및 벡터는 단일- 또는 이중-가닥 DNA 또는 RNA의 선형 또는 원형 핵산일 수 있고, 프로모터 단편 및 코딩 DNA 서열을 임의의 적절한 3' 비번역된 서열과 함께 세포 내로 도입할 수 있는 고유 구축 내로 다수의 뉴클레오티드 서열이 연결되거나 재조합된, 본질적으로 임의의 공급원으로부터 유래된 DNA를 보유할 수 있다. 예에서, 플라스미드 및 벡터는 박테리아 숙주에서의 전파를 위한 자율 복제 서열을 포함할 수 있다.
폴리펩티드 및 "단백질"은 본원에서 상호교환가능하게 사용되고, 펩티드 결합을 통해 연결된 2개 이상의 아미노산의 분자 쇄를 포함한다. 이들 용어가 특정 길이의 생성물을 지칭하는 것은 아니다. 따라서, "펩티드" 및 "올리고펩티드"는 폴리펩티드의 정의 내에 포함된다. 상기 용어는 폴리펩티드의 번역후 변형, 예를 들어 글리코실화, 아세틸화, 인산화 등을 포함한다. 추가로, 단백질 단편, 유사체, 돌연변이된 또는 변이체 단백질, 융합 단백질 등은 폴리펩티드의 의미 내에 포함된다. 상기 용어는 또한, 합성될 수 있거나 또는 공지된 단백질 조작 기술을 사용하여 재조합적으로 발현될 수 있는 1종 이상의 아미노산 유사체 또는 비-정규 또는 비천연 아미노산이 포함된 분자를 포함한다. 추가로, 본 발명의 융합 단백질은 널리 공지된 유기 화학 기술에 의해 본원에 기재된 바와 같이 유도체화될 수 있다.
용어 "융합 단백질"은 단백질이 1종 초과의 모 단백질 또는 폴리펩티드로부터 유래된 폴리펩티드 성분을 포함한다는 것을 나타낸다. 전형적으로, 융합 단백질은, 1종의 단백질로부터의 폴리펩티드 서열을 코딩하는 뉴클레오티드 서열이 상이한 단백질로부터의 폴리펩티드 서열을 코딩하는 뉴클레오티드 서열에 인 프레임으로 첨부되고, 임의로 링커에 의해 이로부터 분리되어 있는 융합 유전자로부터 발현된다. 이어서, 융합 유전자가 재조합 숙주 세포에 의해 단일 단백질로서 발현될 수 있다.
III. 본 발명의 실시양태
본 개시내용의 한 실시양태에서, 아연 핑거 뉴클레아제 결합 도메인, 분석 도메인 및 플라스미드 도메인을 포함하는 폴리뉴클레오티드 공여자 카세트가 제공된다.
일부 실시양태에서, 청구범위 제1항의 폴리뉴클레오티드 공여자 카세트, 폴리뉴클레오티드 공여자 카세트는 3 Kbp 미만의 길이를 포함한다. 폴리뉴클레오티드 공여자 카세트의 예시적인 길이는 약 3Kbp, 2.9Kbp, 2.8Kbp, 2.7Kbp, 2.6Kbp, 2.5Kbp, 2.4 Kbp, 2.3 Kbp, 2.2 Kbp, 2.1 Kbp, 2.0 Kbp, 1.9 Kbp, 1.8 Kbp, 1.7 Kbp, 1.6 Kbp, 1.5 Kbp, 1.4 Kbp, 1.3 Kbp, 1.2 Kbp, 1.1 Kbp, 1.0 Kbp, 0.9 Kbp, 0.8 Kbp, 0.7 Kbp, 0.6 Kbp, 0.5 Kbp, 0.4 Kbp, 0.3 Kbp, 0.2 Kbp, 또는 0.1 Kbp일 수 있다. 용어 "염기 쌍" ("bp"로도 기재됨)은 쌍의 각각의 염기가 다른 것에 (예를 들어, 수소 결합을 통해) 비-공유 결합되는, 각각 별개의 단일 가닥 핵산 내의 뉴클레오티드 염기 (뉴클레오티드)의 쌍을 지칭한다. 예를 들어, 왓슨-크릭(Watson-Crick) 염기 쌍은 통상적으로 1개의 퓨린 및 1개의 피리미딘을 함유한다. 구아노신은 시토신과 쌍형성할 수 있고 (G-C), 아데닌은 티민과 쌍형성할 수 있고 (A-T), 우라실은 아데닌과 쌍형성할 수 있다 (U-A). 염기 쌍 내의 2개의 염기는 서로에 상보적인 것으로 표현된다. 염기 쌍은 킬로 염기 쌍 (Kbp), 메가 염기 쌍 (Mbp) 또는 기가 염기 쌍 (Gbp)으로 언급될 수 있으며, 여기서 "킬로"는 1000의 증분을 나타내고, "메가"는 1백만의 증분을 나타내고, "기가"는 10억의 증분을 나타낸다.
다른 실시양태에서, 세포는 부위 특이적 뉴클레아제 결합 도메인, 분석 도메인 및 플라스미드 도메인을 포함하는 폴리뉴클레오티드 공여자 카세트로 형질전환되고, 폴리뉴클레오티드 공여자 카세트는 숙주 세포의 DNA 내로 통합된다. 본원에서 지칭되는 용어 "세포"는 자기 복제가 가능한 살아있는 유기체를 포괄하고, 진핵 또는 원핵 세포일 수 있다. 일부 실시양태에서, 형질전환된 세포는 식물 세포이다. 일부 실시양태에서, 식물 세포는 쌍자엽 및 단자엽 식물 둘 다를 포함하는 임의의 고등 식물, 및 작물 식물 및 식물의 오일을 위해 사용되는 식물을 포함하는 소비성 식물일 수 있으나, 이에 제한되지는 않는다. 따라서, 하기 추가로 기재된 바와 같은 임의의 식물 종 또는 식물 세포가 형질전환을 위해 선택될 수 있다.
일부 실시양태에서, 본 개시내용에 따라 형질전환되는 식물 세포는 쌍자엽 및 단자엽 식물 둘 다를 포함하는 임의의 고등 식물, 및 특히 작물 식물을 포함하는 소비성 식물을 포함하나, 이에 제한되지는 않는다. 이러한 식물은 예를 들어 알팔파, 대두, 목화, 평지씨 (또한 카놀라로 기재됨), 아마인, 콘, 벼, 브라키아리아, 밀, 홍화, 소르굼, 사탕무, 해바라기, 담배 및 터프 그래스를 포함할 수 있으나, 이에 제한되지는 않는다. 따라서, 임의의 식물 종 또는 식물 세포가 선택될 수 있다. 일부 실시양태에서, 본원에 사용된 식물 세포, 및 그로부터 성장 또는 유래된 식물은 평지씨 (브라시카 나푸스(Brassica napus)); 인도 머스타드 (브라시카 준세아(Brassica juncea)); 에티오피아 머스타드 (브라시카 카리나타(Brassica carinata)); 순무 (브라시카 라파(Brassica rapa)); 양배추 (브라시카 올레라세아(Brassica oleracea)); 대두 (글리신 맥스(Glycine max)); 아마인/아마 (리눔 우시타티시뭄(Linum usitatissimum)); 옥수수 (또한 콘으로 기재됨) (제아 메이스); 홍화 (카르타무스 틴크토리우스(Carthamus tinctorius)); 해바라기 (헬리안투스 안누스(Helianthus annuus)); 담배 (니코티아나 타바쿰(Nicotiana tabacum)); 아라비돕시스 탈리아나(Arabidopsis thaliana); 브라질 넛 (베톨레티아 엑셀사(Betholettia excelsa)); 피마자 (리시누스 콤뮤니스(Ricinus communis)); 코코넛 (코쿠스 누시페라(Cocus nucifera)); 코리안더 (코리안드룸 사티붐(Coriandrum sativum)); 목화 (고시피움(Gossypium) 아종); 땅콩 (아라키스 히포가에아(Arachis hypogaea)); 호호바 (심몬드시아 키넨시스(Simmondsia chinensis)); 기름 야자 (엘라에이스 구이니이스(Elaeis guineeis)); 올리브 (올레아 에우르파에아(Olea eurpaea)); 벼 (오리자 사티바(Oryza sativa)); 스쿼시 (쿠쿠르비타 막시마(Cucurbita maxima)); 보리 (호르데움 불가레(Hordeum vulgare)); 사탕수수 (사카룸 오피시나룸(Saccharum officinarum)); 벼 (오리자 사티바); 밀 (트리티쿰(Triticum) 아종, 예를 들어 트리티쿰 두룸(Triticum durum) 및 트리티쿰 아에스티붐(Triticum aestivum)); 및 좀개구리밥 (렘나세아에(Lemnaceae) 종)으로부터 수득가능한 세포를 포함하나, 이에 제한되지는 않는다. 일부 실시양태에서, 식물 종 내의 유전적 배경은 상이할 수 있다.
유전자 변형 식물의 생산에 관하여, 식물의 유전자 조작 방법은 관련 기술분야에 널리 공지되어 있다. 예를 들어, 쌍자엽 식물 뿐만 아니라 단자엽 식물에 대한 생물학적 및 생리적 형질전환 프로토콜을 비롯하여 식물 형질전환을 위한 다수의 방법이 개발되어 왔다 (예를 들어, 문헌 [Goto-Fumiyuki et al., Nature Biotech 17:282-286 (1999); Miki et al., Methods in Plant Molecular Biology and Biotechnology, Glick, B. R. and Thompson, J. E. Eds., CRC Press, Inc., Boca Raton, pp. 67-88 (1993)]). 추가로, 식물 세포 또는 조직 형질전환, 및 식물의 재생을 위한 벡터 및 시험관내 배양 방법은, 예를 들어 문헌 [Gruber et al., Methods in Plant Molecular Biology and Biotechnology, Glick, B. R. and Thompson, J. E. Eds., CRC Press, Inc., Boca Raton, pp. 89-119 (1993)]에서 이용가능하다.
식물 숙주 세포 내로 DNA를 삽입하는 다수의 기술이 이용가능하다. 이들 기술은 형질전환 작용제로서 아그로박테리움 투메파시엔스 또는 아그로박테리움 리조게네스를 사용한 비-아암 T-DNA에 의한 형질전환, 인산칼슘 형질감염, 폴리브렌 형질전환, 원형질체 융합, 전기천공, 초음파 방법 (예를 들어, 초음파천공), 리포솜 형질전환, 미세주사, 네이키드 DNA, 플라스미드 벡터, 바이러스 벡터, 바이오리스틱스 (마이크로입자 충격), 탄화규소 휘스커스 매개 형질전환, 에어로졸 비밍, 또는 PEG 뿐만 아니라 다른 가능한 방법을 포함한다.
예를 들어, 식물 세포 원형질체의 전기천공 및 미세주사와 같은 기술을 사용하여 DNA 구축물을 식물 세포의 게놈 DNA 내로 직접 도입할 수 있거나, 또는 바이오리스틱 방법, 예컨대 DNA 입자 충격을 사용하여 DNA 구축물을 식물 조직으로 직접 도입할 수 있다 (예를 들어, 문헌 [Klein et al. (1987) Nature 327:70-73] 참조). 식물 세포 형질전환을 위한 추가의 방법은 탄화규소 휘스커스 매개 DNA 흡수를 통한 미세주사를 포함한다 (Kaeppler et al. (1990) Plant Cell Reporter 9:415-418). 대안적으로, DNA 구축물은 나노입자 형질전환을 통해 식물 세포 내로 도입될 수 있다 (예를 들어, 전문이 본원에 참조로 포함되는 미국 특허 출원 번호 12/245,685 참조).
또 다른 공지된 식물 형질전환 방법은 미세발사체의 표면 상에서 DNA가 운반되는 미세발사체-매개 형질전환이다. 이 방법에서, 식물 세포 벽 및 막을 침투하기에 충분한 속도로 미세발사체를 가속화시키는 바이오리스틱 장치를 이용하여 발현 벡터를 식물 조직 내로 도입시킨다. Sanford et al., Part. Sci. Technol. 5:27 (1987), Sanford, J. C., Trends Biotech. 6:299 (1988), Sanford, J. C., Physiol. Plant 79:206 (1990), Klein et al., Biotechnology 10:268 (1992).
대안적으로, 유전자 전달 및 형질전환 방법은 염화칼슘 침전을 통한 원형질체 형질전환, 네이키드 DNA의 폴리에틸렌 글리콜 (PEG)- 또는 전기천공-매개 흡수 (문헌 [Paszkowski et al. (1984) EMBO J 3:2717-2722, Potrykus et al. (1985) Molec. Gen. Genet. 199:169-177; Fromm et al. (1985) Proc. Nat. Acad. Sci. USA 82:5824-5828; 및 Shimamoto (1989) Nature 338:274-276] 참조) 및 식물 조직의 전기천공 (D'Halluin et al. (1992) Plant Cell 4:1495-1505)을 포함하나, 이에 제한되지는 않는다.
발현 벡터를 식물 내로 도입하기 위해 광범위하게 이용되는 방법은 아그로박테리움의 자연 형질전환 시스템에 기초한다. 문헌 [Horsch et al., Science 227:1229 (1985)]. 에이. 투메파시엔스 및 에이. 리조게네스는 식물 세포를 유전적으로 형질전환시키기에 유용한 것으로 공지된 식물 병원성 토양 박테리아이다. 에이. 투메파시엔스 및 에이. 리조게네스 각각의 Ti 및 Ri 플라스미드는 식물의 유전적 형질전환의 원인이 되는 유전자를 보유한다. 문헌 [Kado, C. I., Crit. Rev. Plant. Sci. 10:1 (1991)]. 아그로박테리움 벡터 시스템 및 아그로박테리움-매개 유전자 전달 방법에 관한 설명은 또한, 예를 들어 상기 문헌 [Gruber et al.], 상기 문헌 [Miki et al.], 문헌 [Moloney et al., Plant Cell Reports 8:238 (1989)], 및 미국 특허 번호 4,940,838 및 5,464,763에서 이용가능하다.
아그로박테리움을 형질전환에 사용하는 경우에, 삽입시킬 DNA는 특수 플라스미드, 즉 중간 벡터 또는 이원 벡터 내로 클로닝되어야 한다. 중간 벡터는 그 자체가 아그로박테리움에서 복제될 수 없다. 중간 벡터는 헬퍼 플라스미드의 사용 (접합)에 의해 아그로박테리움 투메파시엔스 내로 전달될 수 있다. 재팬 토바코 슈퍼바이너리(Japan Tobacco Superbinary) 시스템은 이러한 시스템의 한 예이다 (문헌 [Komari et al., (2006) In: Methods in Molecular Biology (K. Wang, ed.) No. 343: Agrobacterium Protocols (2nd Edition, Vol. 1) Humana Press Inc., Totowa, NJ, pp.15-41; 및 Komori et al., (2007) Plant Physiol. 145:1155-1160]에서 검토됨). 이원 벡터는 그 자체가 이. 콜라이(E. coli) 및 아그로박테리움 둘 다에서 복제될 수 있다. 이는 선택 마커 유전자, 및 우측 및 좌측 T-DNA 경계 영역에 의해 프레이밍되는 링커 또는 폴리링커를 포함한다. 이는 아그로박테리움 내로 직접 형질전환될 수 있다 (Holsters, 1978). 숙주 세포로서 사용된 아그로박테리움은 vir 영역을 보유하는 플라스미드를 포함해야 한다. Ti 또는 Ri 플라스미드는 또한 T-DNA의 전달에 필요한 vir 영역을 포함한다. vir 영역은 T-DNA를 식물 세포 내로 전달하는데 필요하다. 추가의 T-DNA가 함유될 수 있다.
아그로박테리움 투메파시엔스 숙주의 병독성 기능은, 세포가 이원 T DNA 벡터 (Bevan (1984) Nuc. Acid Res. 12:8711-8721) 또는 공동-배양 절차 (Horsch et al. (1985) Science 227:1229-1231)를 사용하여 박테리아에 의해 감염되는 경우에, 구축물 및 인접 마커를 함유하는 T-가닥이 식물 세포 DNA 내로 삽입되도록 지시할 것이다. 일반적으로, 아그로박테리움 형질전환 시스템은 쌍자엽 식물을 조작하는데 사용된다 (Bevan et al. (1982) Ann. Rev. Genet 16:357-384; Rogers et al. (1986) Methods Enzymol. 118:627-641). 아그로박테리움 형질전환 시스템은 또한 DNA를 단자엽 식물 및 식물 세포로 형질전환시키는데, 뿐만 아니라 전달하는데 사용될 수 있다. 미국 특허 번호 5,591,616; 문헌 [Hernalsteen et al. (1984) EMBO J 3:3039-3041; Hooykass Van Slogteren et al. (1984) Nature 311:763-764; Grimsley et al. (1987) Nature 325:1677-179; Boulton et al. (1989) Plant Mol. Biol. 12:31-40; 및 Gould et al. (1991) Plant Physiol. 95:426-434]를 참조한다. 유전적 구축물을 특정한 식물 세포 내로 도입한 후, 식물 세포를 성장시킬 수 있고, 싹 및 뿌리와 같은 분화 조직의 출아 시에 성숙 식물이 생성될 수 있다. 일부 실시양태에서, 다수의 식물이 생성될 수 있다. 식물을 재생시키기 위한 방법론은 관련 기술분야의 통상의 기술자에게 공지되어 있고, 이는 예를 들어 문헌 [Plant Cell and Tissue Culture, 1994, Vasil and Thorpe Eds. Kluwer Academic Publishers 및 Plant Cell Culture Protocols (Methods in Molecular Biology 111, 1999 Hall Eds Humana Press)]에서 찾아볼 수 있다. 본원에 기재된 유전자 변형 식물은 발효 배지에서 배양하거나 또는 토양과 같은 적합한 매체에서 성장시킬 수 있다. 일부 실시양태에서, 고등 식물에 적합한 성장 매체는 식물을 위한 임의의 성장 매체, 예를 들어 비제한적으로 토양, 모래, 뿌리 성장을 지지하는 임의의 다른 미립자 매체 (예를 들어, 버미큘라이트, 펄라이트 등) 또는 수경재배 배양, 뿐만 아니라 적합한 빛, 물, 및 고등 식물의 성장을 최적화시키는 영양 보충제를 포함할 수 있다.
임의의 상기 형질전환 기술에 의해 생산된 형질전환된 식물 세포를 배양하여, 형질전환된 유전자형을 보유하고, 따라서 목적 표현형을 보유하는 전체 식물을 재생시킬 수 있다. 이러한 재생 기술은 조직 배양 성장 배지 내의 특정 피토호르몬의 조작에 의존하며, 전형적으로 목적 뉴클레오티드 서열과 함께 도입된 살생물제 및/또는 제초제 마커에 의존한다. 배양된 원형질체로부터의 식물 재생은 문헌 [Evans, et al., "Protoplasts Isolation and Culture" in Handbook of Plant Cell Culture, pp. 124-176, Macmillian Publishing Company, New York, 1983; 및 Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985]에 기재되어 있다. 식물 캘러스, 외식편, 기관, 화분, 배아 또는 그의 부분으로부터 재생이 또한 수득될 수 있다. 이러한 재생 기술은 일반적으로 문헌 [Klee et al. (1987) Ann. Rev. of Plant Phys. 38:467-486]에 기재되어 있다.
다른 실시양태에서, 형질전환된 식물 세포는 식물을 생산하기 위해 재생될 수 없다. 이러한 세포는 일시적으로 형질전환된 것으로 표현된다. 일시적으로 형질전환된 세포는 특정 트랜스진의 발현 및/또는 기능성을 검정하기 위해 생산될 수 있다. 일시적 형질전환 기술은 관련 기술분야에 공지되어 있고, 상기 기재된 형질전환 기술에 대한 작은 변형을 포함한다. 일시적 형질전환은 신속하게 완료되며 안정한 형질전환 기술만큼 많은 방책 (예를 들어, 전체 식물의 발달을 위한 식물의 배양, 자가-수정 또는 게놈 내의 트랜스진의 고정을 위한 식물의 교배 등)을 필요로 하지 않기 때문에, 관련 기술분야의 통상의 기술자는 특정 트랜스진의 발현 및/또는 기능성을 신속하게 검정하기 위해 일시적 형질전환의 이용을 선택할 수 있다.
한 실시양태에서, 범용 공여자 폴리뉴클레오티드는 본질적으로 임의의 식물 내로 도입될 수 있다. 매우 다양한 식물 및 식물 세포 시스템이 본 개시내용의 범용 공여자 폴리뉴클레오티드의 부위 특이적 통합 및 상기 언급된 다양한 형질전환 방법을 위해 조작될 수 있다. 한 실시양태에서, 조작하기 위한 표적 식물 및 식물 세포는 단자엽 및 쌍자엽 식물, 예컨대 작물, 예를 들어 곡실 작물 (예를 들어, 밀, 옥수수, 벼, 기장, 보리), 과일 작물 (예를 들어, 토마토, 사과, 배, 딸기, 오렌지), 사료 작물 (예를 들어, 알팔파), 뿌리 채소 작물 (예를 들어, 당근, 감자, 사탕무, 참마), 잎 채소 작물 (예를 들어, 상추, 시금치); 현화 식물 (예를 들어, 페튜니아, 장미, 국화), 침엽수 및 소나무 (예를 들어, 전나무, 가문비나무); 식물환경복원에 사용되는 식물 (예를 들어, 중금속 축적 식물); 오일 작물 (예를 들어, 해바라기, 평지씨) 및 실험 목적으로 사용되는 식물 (예를 들어, 아라비돕시스)를 포함하나, 이에 제한되지는 않는다. 따라서, 개시된 방법 및 조성물은 아스파라구스(Asparagus), 아베나(Avena), 브라시카(Brassica), 시트루스(Citrus), 시트룰루스(Citrullus), 캅시쿰(Capsicum), 쿠쿠르비타(Cucurbita), 다우쿠스(Daucus), 에리게론(Erigeron), 글리신(Glycine), 고시피움(Gossypium), 호르데움(Hordeum), 락투카(Lactuca), 롤리움(Lolium), 리코페르시콘(Lycopersicon), 말루스(Malus), 만니호트(Manihot), 니코티아나(Nicotiana), 오리코프라그무스(Orychophragmus), 오리자(Oryza), 페르세아(Persea), 파세올루스(Phaseolus), 피숨(Pisum), 피루스(Pyrus), 프루누스(Prunus), 라파누스(Raphanus), 세칼레(Secale), 솔라눔(Solanum), 소르굼(Sorghum), 트리티쿰(Triticum), 비티스(Vitis), 비그나(Vigna) 및 제아 메이스 속으로부터의 종을 포함하나 이에 제한되지는 않는 광범위한 식물에 걸쳐 유용하다.
다른 실시양태에서, 폴리뉴클레오티드 공여자 카세트는 특정 폴리뉴클레오티드 서열을 포함한다. 특정 폴리뉴클레오티드 서열의 예는 서열 132, 서열 133, 서열 134, 서열 135, 서열 136, 서열 137, 서열 138, 서열 139, 서열 140 및 서열 141을 포함하나, 이에 제한되지는 않는다. 다양한 실시양태에서, 특정 폴리뉴클레오티드 서열, 서열 132, 서열 133, 서열 134, 서열 135, 서열 136, 서열 137, 서열 138, 서열 139, 서열 140 및 서열 141에 대해 적어도 90% 서열 동일성을 갖는 서열이 본원에 개시된다. 다른 실시양태에서, 특정 폴리뉴클레오티드 서열, 서열 132, 서열 133, 서열 134, 서열 135, 서열 136, 서열 137, 서열 138, 서열 139, 서열 140 및 서열 141에 대해 적어도 95% 서열 동일성을 갖는 서열이 본원에 개시된다. 다른 실시양태에서, 특정 폴리뉴클레오티드 서열, 서열 132, 서열 133, 서열 134, 서열 135, 서열 136, 서열 137, 서열 138, 서열 139, 서열 140 및 서열 141에 대해 적어도 97% 서열 동일성을 갖는 서열이 본원에 개시된다. 또 다른 실시양태에서, 특정 폴리뉴클레오티드 서열, 서열 132, 서열 133, 서열 134, 서열 135, 서열 136, 서열 137, 서열 138, 서열 139, 서열 140 및 서열 141에 대해 적어도 99% 서열 동일성을 갖는 서열이 본원에 개시된다. 한 실시양태에서, 폴리뉴클레오티드 공여자 카세트는 서열 142 및 143으로 이루어진 군으로부터 선택된 서열과 적어도 90, 93, 95, 97 또는 99% 서열 동일성을 갖는 서열을 포함한다.
관련 기술분야에 공지되어 있는 용어 "퍼센트 동일성" (또는 "% 동일성")은 서열을 비교함으로써 결정되는, 2개 이상의 폴리펩티드 서열 또는 2개 이상의 폴리뉴클레오티드 서열 사이의 관계이다. 관련 기술분야에서 "동일성"은 또한 경우에 따라, 서열의 스트링 사이에서의 매칭에 의해 판단되는, 폴리펩티드 또는 폴리뉴클레오티드 서열 사이의 서열 관련성의 정도를 의미한다. "동일성" 및 "유사성"은 하기 문헌에 개시된 것들을 포함하나 이에 제한되지 않는 공지된 방법에 의해 용이하게 계산될 수 있다: 1.) Computational Molecular Biology (Lesk, A. M., Ed.) Oxford University: NY (1988); 2.) Biocomputing: Informatics and Genome Projects (Smith, D. W., Ed.) Academic: NY (1993); 3.) Computer Analysis of Sequence Data, Part I (Griffin, A. M., and Griffin, H. G., Eds.) Humania: NJ (1994); 4.) Sequence Analysis in Molecular Biology (von Heinje, G., Ed.) Academic (1987); 및 5.) Sequence Analysis Primer (Gribskov, M. and Devereux, J., Eds.) Stockton: NY (1991).
핵산 및 아미노산 서열 동일성을 결정하기 위한 기술은 관련 기술분야에 공지되어 있다. 전형적으로, 이러한 기술은 유전자에 대한 mRNA의 뉴클레오티드 서열을 결정하는 것 및/또는 이에 의해 코딩되는 아미노산 서열을 결정하는 것, 및 이들 서열을 제2의 뉴클레오티드 또는 아미노산 서열과 비교하는 것을 포함한다. 게놈 서열이 또한 이러한 방식으로 결정 및 비교될 수 있다. 일반적으로, 동일성은 2개의 폴리뉴클레오티드 또는 폴리펩티드 서열 각각의 정확한 뉴클레오티드-대-뉴클레오티드 또는 아미노산-대-아미노산 대응을 지칭한다. 2개 이상의 서열 (폴리뉴클레오티드 또는 아미노산)은 이들의 퍼센트 동일성을 결정함으로써 비교될 수 있다. 핵산 또는 아미노산 서열에 관계없이 2개의 서열의 퍼센트 동일성은 정렬된 2개의 서열 사이의 정확한 매치의 수를 더 짧은 서열의 길이로 나누고 100을 곱한 것이다. 전문이 본원에 참조로 포함되는 문헌 [Russell, R., and Barton, G., "Structural Features can be Unconserved in Proteins with Similar Folds," J. Mol. Biol. 244, 332-350 (1994)]의 337페이지를 참조한다.
추가로, 동일성 및 유사성을 결정하기 위한 방법은 공중 이용가능한 컴퓨터 프로그램으로 편성되어 있다. 서열 정렬 및 퍼센트 동일성 계산은 예를 들어 벡터(Vector) NTI® 스위트 (인비트로젠(Invitrogen), 캘리포니아주 칼스배드)의 얼라인X(AlignX) 프로그램 또는 레이저진(LASERGENE) 생물정보학 컴퓨팅 스위트 (DNASTAR 인크.(DNASTAR Inc.), 위스콘신주 매디슨)의 메갈라인(MegAlign)™ 프로그램을 사용하여 수행될 수 있다. 서열의 다중 정렬은 클러스탈(Clustal) V (문헌 [Higgins and Sharp, CABIOS. 5:151-153 (1989); Higgins, D.G. et al., Comput. Appl. Biosci., 8:189-191 (1992)]에 개시됨)로 표지된 정렬 방법에 상응하는 "클러스탈 V 정렬 방법"을 포함하는 몇몇 다양한 알고리즘을 포괄하며 레이저진 생물적보학 컴퓨팅 스위트 (DNASTAR 인크.)의 메갈라인™ 프로그램에서 발견되는 "클러스탈 정렬 방법"을 사용하여 수행된다. 다중 정렬의 경우, 디폴트 값은 갭 페널티=10 및 갭 길이 페널티=10에 상응한다. 클러스탈 방법을 사용한 단백질 서열의 쌍별 정렬 및 퍼센트 동일성의 계산을 위한 디폴트 파라미터는 KTUPLE=1, 갭 페널티=3, 윈도우=5 및 DIAGONALS SAVED=5이다. 핵산의 경우, 이들 파라미터는 KTUPLE=2, 갭 페널티=5, 윈도우=4 및 DIAGONALS SAVED=4이다. 클러스탈 V 프로그램을 사용한 서열의 정렬 후에, 동일한 프로그램에서 "서열 거리" 표를 살펴봄으로써 "퍼센트 동일성"을 얻을 수 있다. 추가로, "클러스탈 W 정렬 방법"이 이용가능하고, 클러스탈 W (문헌 [Higgins and Sharp, CABIOS. 5:151-153 (1989); Higgins, D.G. et al., Comput. Appl. Biosci. 8:189-191 (1992)]에 기재됨)로 표지되며 레이저진 생물정보학 컴퓨팅 스위트 (DNASTAR 인크.)의 메갈라인™ v6.1 프로그램에서 발견되는 정렬 방법에 상응한다. 다중 정렬을 위한 디폴트 파라미터 (갭 페널티=10, 갭 길이 페널티=0.2, 딜레이 디버전(Delay Divergen) 서열(%)=30, DNA 전이 가중치=0.5, 단백질 가중 매트릭스=고넷(Gonnet) 시리즈, DNA 가중 매트릭스=IUB). 클러스탈 W 프로그램을 사용한 서열의 정렬 후에, 동일한 프로그램에서 "서열 거리" 표를 살펴봄으로써 "퍼센트 동일성"을 얻을 수 있다.
용어 "서열 분석 소프트웨어"는 뉴클레오티드 또는 아미노산 서열의 분석에 유용한 임의의 컴퓨터 알고리즘 또는 소프트웨어 프로그램을 지칭한다. "서열 분석 소프트웨어"는 상업적으로 입수가능하거나 또는 독립적으로 개발될 수 있다. 전형적인 서열 분석 소프트웨어는 1.) GCG 프로그램 스위트 (위스콘신 패키지 버전(Wisconsin Package Version) 9.0, 제네틱스 컴퓨터 그룹(Genetics Computer Group; GCG), 위스콘신주 메디슨); 2.) BLASTP, BLASTN, BLASTX (Altschul et al., J. Mol. Biol, 215:403-410 (1990)); 3.) DNASTAR (DNASTAR, 인크., 위스콘신주 메디슨); 4.) 시퀀처(Sequencher) (진 코드 코포레이션(Gene Codes Corporation), 미시건 주 앤 아버); 및 5.) 스미스-워터맨(Smith-Waterman) 알고리즘을 포함하는 FASTA 프로그램 (W. R. Pearson, Comput. Methods Genome Res., [Proc. Int. Symp.] (1994), Meeting Date 1992, 111-20. Editor(s): Suhai, Sandor. Plenum: New York, NY)을 포함할 것이나, 이에 제한되지는 않는다. 본 출원의 문맥에서, 서열 분석 소프트웨어가 분석에 사용되는 경우에 분석 결과는 달리 명시되지 않는 한, 언급된 프로그램의 "디폴트 값"을 기초로 할 것임이 이해될 것이다. 본원에 사용된 "디폴트 값"은 처음 초기화될 때 소프트웨어에 본래 로딩된 임의의 세트의 값 또는 파라미터를 의미할 것이다.
혼성화 기술이 언급되는 경우에, 공지된 뉴클레오티드 서열의 전부 또는 일부는 선택된 유기체로부터 클로닝된 게놈 DNA 단편 또는 cDNA 단편 (즉, 게놈 또는 cDNA 라이브러리)의 집단에 존재하는 다른 상응하는 뉴클레오티드 서열에 선택적으로 혼성화하는 프로브로서 사용될 수 있다. 혼성화 프로브는 게놈 DNA 단편, 플라스미드 DNA 단편, cDNA 단편, RNA 단편, PCR 증폭된 DNA 단편, 올리고뉴클레오티드 또는 다른 폴리뉴클레오티드일 수 있고, 검출가능한 기, 예컨대 32P 또는 임의의 다른 검출가능한 마커로 표지될 수 있다. 따라서, 예를 들어, 혼성화를 위한 프로브는 본 개시내용의 실시양태의 DNA 서열을 기초로 하는 합성 올리고뉴클레오티드를 표지함으로써 제조될 수 있다. 혼성화를 위한 및 cDNA 및 게놈 라이브러리의 구축을 위한 프로브의 제조 방법은 일반적으로 관련 기술분야에 공지되어 있고, 개시되어 있다 (Sambrook et al., 1989).
본 개시내용의 실시양태의 핵산 프로브 및 프라이머는 엄격한 조건 하에 표적 DNA 서열에 혼성화한다. 임의의 통상적인 핵산 혼성화 또는 증폭 방법이 샘플 중 트랜스제닉 이벤트로부터의 DNA의 존재를 확인하는데 사용될 수 있다. 핵산 분자 또는 그의 단편은 특정 환경 하에 다른 핵산 분자에 특이적으로 혼성화할 수 있다. 본원에 사용된 바와 같이, 2개의 핵산 분자는 이 두 분자가 역평행의 이중-가닥 핵산 구조를 형성할 수 있는 경우에 서로에 대해 특이적으로 혼성화할 수 있는 것으로 표현된다. 핵산은 2개의 핵산 분자가 완전한 상보성을 나타내는 경우에 또 다른 핵산 분자의 "상보체"인 것으로 표현된다. 본원에 사용된 바와 같이, 분자 중 하나의 모든 뉴클레오티드가 다른 것의 뉴클레오티드에 상보적인 경우에, 분자는 "완전한 상보성"을 나타내는 것으로 표현된다. 완전한 상보성을 나타내는 분자는 일반적으로 통상적인 "고-엄격도" 조건 하에 서로 어닐링된 상태로 유지되도록 하는 충분한 안정성으로 서로에 대해 혼성화될 것이다. 통상적인 고-엄격도 조건은 문헌 [Sambrook et al., 1989]에 기재되어 있다.
2개의 분자는 이들이 적어도 통상적인 "저-엄격도" 조건 하에 서로 어닐링된 상태로 유지되도록 하는 충분한 안정성으로 서로에 대해 혼성화될 수 있는 경우에 "최소 상보성"을 나타내는 것으로 표현된다. 통상적인 저-엄격도 조건은 문헌 [Sambrook et al., 1989]에 기재되어 있다. 핵산 분자가 프라이머 또는 프로브로서 기능하기 위해서는, 이용된 특정한 용매 및 염 농도 하에 안정한 이중-가닥 구조를 형성할 수 있도록 서열의 최소 상보성을 나타낼 것만이 요구된다.
혼성화의 엄격도에 영향을 미치는 인자들은 관련 기술분야의 통상의 기술자에게 널리 공지되어 있고, 온도, pH, 이온 강도, 및 유기 용매 예컨대 포름아미드 및 디메틸술폭시드의 농도를 포함하나, 이에 제한되지는 않는다. 관련 기술분야의 통상의 기술자에게 널리 공지된 바와 같이, 혼성화 엄격도는 온도가 높을수록, 이온 강도가 낮을수록, 및 용매 농도가 낮을수록 증가된다.
용어 "엄격한 조건"은 또는 "엄격도 조건"은 문헌 [Sambrook et al., 1989]의 9.52-9.55에 논의된 특정 혼성화 절차에 의해 표적 핵산 (즉, 특정한 관심 핵산 서열)에 대한 핵산 프로브의 혼성화와 관련하여 기능적으로 정의된다. 또한, 문헌 [Sambrook et al., 1989]의 9.47-9.52 및 9.56-9.58을 참조한다.
전형적으로, 엄격한 조건은 염 농도가 pH 7.0 내지 8.3에서 약 1.5 M Na+ 이온 미만, 전형적으로 약 0.01 내지 1.0 M Na+ 이온 농도 (또는 다른 염)이고, 온도가 짧은 프로브 (예를 들어, 10 내지 50개의 뉴클레오티드)에 대해서는 적어도 약 30℃이고, 긴 프로브 (예를 들어, 50개 초과의 뉴클레오티드)에 대해서는 적어도 약 60℃인 조건일 것이다. 엄격한 조건은 또한 포름아미드와 같은 탈안정화제를 첨가함으로써 달성될 수 있다. 예시적인 저 엄격도 조건은 37℃에서 30 내지 35% 포름아미드, 1.0 M NaCl, 0.1% SDS (소듐 도데실 술페이트)의 완충 용액에 의한 혼성화, 및 50 내지 55℃에서 1X 내지 2X SSC (20X SSC=3.0 M NaCl/0.3 M 시트르산삼나트륨)에서의 세척을 포함한다. 예시적인 중간 정도의 엄격도 조건은 37℃에서 40 내지 45% 포름아미드, 1.0 M NaCl, 0.1% SDS에서의 혼성화, 및 55 내지 60℃에서 0.5X 내지 1X SSC에서의 세척을 포함한다. 예시적인 고 엄격도 조건은 37℃에서 50% 포름아미드, 1.0 M NaCl, 0.1% SDS에서의 혼성화, 및 60 내지 65℃에서 0.1X SSC에서의 세척을 포함한다.
특이성은 전형적으로 혼성화후 세척의 함수이고, 결정적인 인자는 이온 강도 및 최종 세척 용액의 온도이다. DNA-DNA 하이브리드의 경우, Tm은 식: Tm = 81.5℃+16.6 (logM)+0.41 (%GC)-0.61 (%form.)-500/L로부터 근사화될 수 있고; 여기서 M은 1가 양이온의 몰농도이고, %GC는 DNA 내의 구아노신 및 시토신 뉴클레오티드의 백분율이고, % form.은 혼성화 용액 중 포름아미드의 백분율이고, L은 염기 쌍 내의 하이브리드의 길이이다 (Meinkoth and Wahl, 1984). Tm은 (규정된 이온 강도 및 pH 하에) 상보적 표적 서열의 50%가 완벽하게 매칭되는 프로브에 혼성화되는 온도이다. Tm은 각각 1%의 미스매칭에 대해 약 1℃만큼 감소되며; 따라서, 혼성화를 위해 Tm, 혼성화 및/또는 세척 조건이 목적하는 동일성의 서열에 대해 조정될 수 있다. 예를 들어, 90%의 동일성을 갖는 서열을 고려하는 경우, Tm은 10℃ 감소될 수 있다. 일반적으로, 엄격한 조건은 규정된 이온 강도 및 pH에서 특정 서열 및 그의 보체에 대한 열 융점 (Tm)보다 약 5℃ 더 낮은 온도가 되도록 선택된다. 그러나, 극도로 엄격한 조건은 열 융점 (Tm)보다 1, 2, 3 또는 4℃ 더 낮은 온도에서의 혼성화 및/또는 세척을 이용할 수 있고; 중간 정도의 엄격한 조건은 열 융점 (Tm)보다 6, 7, 8, 9 또는 10℃ 더 낮은 온도에서의 혼성화 및/또는 세척을 이용할 수 있으며; 저 엄격도 조건은 열 융점 (Tm)보다 11 내지 20℃ 더 낮은 온도에서의 혼성화 및/또는 세척을 이용할 수 있다. 식, 혼성화 및 세척 조성물, 및 목적하는 Tm을 사용하여, 통상의 기술자는 혼성화 및/또는 세척 용액의 엄격도에서의 변화가 고유하게 기재됨을 이해할 것이다. 원하는 정도의 미스매칭이 45℃ (수용액) 또는 32℃ (포름아미드 용액) 미만의 Tm을 초래하는 경우, 더 높은 온도가 사용될 수 있도록 SSC 농도를 증가시키는 것이 바람직하다. 핵산의 혼성화에 대한 광범위한 안내가 문헌 [(1997) Ausubel et al., Short Protocols in Molecular Biology, pages 2-40, Third Edit. (1997) 및 Sambrook et al. (1989)]에서 발견된다.
한 실시양태에서, 폴리뉴클레오티드 공여자 카세트는 1개 이상의 아연 핑거 뉴클레아제 결합 도메인을 포함한다. 이에 따라, 폴리뉴클레오티드 공여자 카세트의 한 실시양태는 1개의 아연 핑거 뉴클레아제 결합 도메인, 2개의 아연 핑거 뉴클레아제 결합 도메인, 3개의 아연 핑거 뉴클레아제 결합 도메인, 4개의 아연 핑거 뉴클레아제 결합 도메인, 5개의 아연 핑거 뉴클레아제 결합 도메인, 6개의 아연 핑거 뉴클레아제 결합 도메인, 7개의 아연 핑거 뉴클레아제 결합 도메인, 8개의 아연 핑거 뉴클레아제 결합 도메인, 9개의 아연 핑거 뉴클레아제 결합 도메인, 10개의 아연 핑거 뉴클레아제 결합 도메인 또는 그 초과의 아연 핑거 결합 도메인을 포함한다.
표적 부위의 선택; ZFP 및 융합 단백질 (및 이를 코딩하는 폴리뉴클레오티드)의 설계 및 구축 방법은 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 미국 특허 번호 6,140,081; 5,789,538; 6,453,242; 6,534,261; 5,925,523; 6,007,988; 6,013,453; 6,200,759; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970 WO 01/88197; WO 02/099084; WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 및 WO 03/016496에 상세하게 기재되어 있다.
후속 실시양태에서, 1개 이상의 아연 핑거 결합 서열을 포함하는 아연 핑거 뉴클레아제 결합 도메인은 아연 핑거 결합 단백질, 메가뉴클레아제 결합 단백질, CRIPSR 또는 TALEN 결합 단백질에 의해 결합된다.
특정 실시양태에서, 본원에 기재된 조성물 및 방법은 공여자 분자에 대한 결합 및/또는 세포의 게놈 내의 관심 영역에 대한 결합을 위해 메가뉴클레아제 (귀소 엔도뉴클레아제) 결합 단백질 또는 메가뉴클레아제 DNA-결합 도메인을 이용한다. 자연-발생 메가뉴클레아제는 15-40개의 염기-쌍 절단 부위를 인식하고, 통상적으로 4개의 패밀리로 분류된다: LAGLIDADG 패밀리, GIY-YIG 패밀리, His-Cyst 박스 패밀리 및 HNH 패밀리. 예시적인 귀소 엔도뉴클레아제는 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII를 포함한다. 이들의 인식 서열은 공지되어 있다. 또한, 미국 특허 번호 5,420,032; 미국 특허 번호 6,833,252; 문헌 [Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol. Biol. 263:163-180; Argast et al. (1998) J. Mol. Biol. 280:345-353 및 New England Biolabs catalogue]를 참조한다.
특정 실시양태에서, 본원에 기재된 방법 및 조성물은 조작된 (비-자연 발생) 귀소 엔도뉴클레아제 (메가뉴클레아제)를 포함하는 뉴클레아제를 사용한다. 귀소 엔도뉴클레아제 및 메가뉴클레아제, 예컨대 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII의 인식 서열은 공지되어 있다. 또한, 미국 특허 번호 5,420,032; 미국 특허 번호 6,833,252; 문헌 [Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol. Biol. 263:163-180; Argast et al. (1998) J. Mol. Biol. 280:345-353 및 New England Biolabs catalogue]를 참조한다. 추가로, 귀소 엔도뉴클레아제 및 메가뉴클레아제의 DNA-결합 특이성은 비-천연 표적 부위에 결합하도록 조작될 수 있다. 예를 들어, 문헌 [Chevalier et al. (2002) Molec. Cell 10:895-905; Epinat et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth et al. (2006) Nature 441:656-659; Paques et al. (2007) Current Gene Therapy 7:49-66]; 미국 특허 공개 번호 20070117128을 참조한다. 귀소 엔도뉴클레아제 및 메가뉴클레아제의 DNA-결합 도메인은 전체적으로 뉴클레아제의 맥락에서 (즉, 뉴클레아제가 동족 절단 도메인을 포함하도록) 변경될 수 있거나, 또는 이종 절단 도메인에 융합될 수 있다.
다른 실시양태에서, 본원에 기재된 방법 및 조성물에 사용되는 1종 이상의 뉴클레아제의 DNA-결합 도메인은 자연 발생 또는 조작된 (비-자연 발생) TAL 이펙터 DNA 결합 도메인을 포함한다. 예를 들어, 전문이 본원에 참조로 포함되는 미국 특허 공개 번호 20110301073을 참조한다. 크산토모나스(Xanthomonas) 속의 식물 병원성 박테리아는 중요한 작물 식물에서 많은 질병을 야기하는 것으로 공지되어 있다. 크산토모나스의 병원성은 25종 초과의 상이한 이펙터 단백질을 식물 세포 내로 주입하는 보존된 유형 III 분비 (T3S) 시스템에 의존한다. 이들 주입된 단백질 중에는 식물 전사 활성화제를 모방하고 식물 트랜스크립톰을 조작하는 전사 활성화제-유사 (TAL) 이펙터가 존재한다 (문헌 [Kay et al. (2007) Science 318:648-651] 참조). 이들 단백질은 DNA 결합 도메인 및 전사 활성화 도메인을 함유한다. 대부분의 잘 특성화된 TAL-이펙터 중 1종은 크산토모나스 캄페스트그리스 병원형 베시카토리아(Xanthomonas campestgris pv. Vesicatoria)로부터의 AvrBs3이다 (문헌 [Bonas et al. (1989) Mol Gen Genet 218: 127-136] 및 WO2010079430 참조). TAL-이펙터는 탠덤 반복부의 집중된 도메인을 함유하고, 각각의 반복부는 이들 단백질의 DNA 결합 특이성에 핵심적인 대략 34개의 아미노산을 함유한다. 추가로, 이들은 핵 국재화 서열 및 산성 전사 활성화 도메인을 함유한다 (검토에 대해서는, 문헌 [Schornack S, et al. (2006) J Plant Physiol 163(3): 256-272] 참조). 추가로, 식물병원성 박테리아 랄스토니아 솔라나세아룸(Ralstonia solanacearum), 알. 솔라나세아룸 생물변이형 1 균주 GMI1000 및 생물변이형 4 균주 RS1000에서 크산토모나스의 AvrBs3 패밀리에 상동성인 brg11 및 hpx17로 지정된 2개의 유전자가 발견되었다 (문헌 [Heuer et al. (2007) Appl and Envir Micro 73(13): 4379-4384] 참조). 이들 유전자는 서로 뉴클레오티드 서열이 98.9% 동일하지만, hpx17의 반복 도메인 내의 1,575 bp의 결실에서 상이하다. 그러나, 유전자 생성물 둘 다는 크산토모나스의 AvrBs3 패밀리 단백질과 40% 미만의 서열 동일성을 갖는다. 예를 들어, 전문이 본원에 참조로 포함되는 미국 특허 공개 번호 20110239315, 20110145940 및 20110301073을 참조한다.
이들 TAL 이펙터의 특이성은 탠덤 반복부에서 발견되는 서열에 따라 달라진다. 반복된 서열은 대략 102 bp를 포함하고, 반복부는 전형적으로 서로에 대해 91-100% 상동성이다 (상기 동일 문헌 [Bonas et al.]). 반복부의 다형성은 통상적으로 위치 12 및 13에 위치하고, 위치 12 및 13의 초가변 이잔기의 정체와 TAL-이펙터의 표적 서열 내의 인접 뉴클레오티드의 정체 사이에 1:1 대응이 존재하는 것으로 보인다 (문헌 [Moscou and Bogdanove, (2009) Science 326:1501 및 Boch et al. (2009) Science 326:1509-1512] 참조). 실험에 의해, 이들 TAL-이펙터의 DNA 인식을 위한 천연 코드는 위치 12 및 13의 HD 서열이 시토신 (C)에 결합하고, NG가 T에 결합하고, NI가 A, C, G 또는 T에 결합하고, NN이 A 또는 G에 결합하고, ING가 T에 결합하도록 결정되었다. 이들 DNA 결합 반복부는, 새로운 서열과 상호작용하고 식물 세포 내에서 비-내인성 리포터 유전자의 발현을 활성화시킬 수 있는 인공 전사 인자를 제조하기 위해 새로운 조합 및 반복부의 수를 갖는 단백질로 조립되었다 (상기 동일 문헌 [Boch et al.]). 조작된 TAL 단백질은 효모 리포터 검정 (플라스미드 기반 표적)에서 활성을 나타내는 TAL 이펙터 도메인 뉴클레아제 융합체 (TALEN)를 수득하기 위해 FokI 절단 절반 도메인에 연결되었다. 예를 들어, 미국 특허 공개 번호 20110301073; Christian et al. ((2010)< Genetics epub 10.1534/genetics.110.120717)을 참조한다.
다른 실시양태에서, 뉴클레아제는 CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부: Clustered Regularly Interspaced Short Palindromic Repeats)/Cas (CRISPR 연관: CRISPR Associated) 뉴클레아제 시스템을 포함하는 시스템이다. CRISPR/Cas는 게놈 조작을 위해 사용될 수 있는 박테리아 시스템을 기반으로 하는 최근 조작된 뉴클레아제 시스템이다. 이는 많은 박테리아 및 고세균의 적응 면역 반응의 일부를 기반으로 한다. 바이러스 또는 플라스미드가 박테리아에 침입하면, 침입자의 DNA의 절편은 '면역' 반응에 의해 CRISPR RNA (crRNA)로 전환된다. 이어서, 이러한 crRNA는 부분 상보성의 영역을 통해, 프로토스페이서 인접 모티프 (PAM) NGG 다음의 표적 DNA 내의 crRNA에 상동성인 영역으로 Cas9 뉴클레아제를 가이드하기 위해 tracrRNA로 불리는 또 다른 유형의 RNA와 회합된다. Cas9는 crRNA 전사체 내에 함유된 20-뉴클레오티드 가이드 서열에 의해 특정된 부위에서 DSB에서 평활 말단을 생성하기 위해 DNA를 절단한다. Cas9는 부위 특이적 DNA 인식 및 절단을 위해 crRNA 및 tracrRNA 둘 다를 필요로 한다. 상기 시스템은 본 발명에 이르러 crRNA 및 tracrRNA가 하나의 분자 ("단일 가이드 RNA")로 조합될 수 있도록 조작되었고, 단일 가이드 RNA의 crRNA 동등 부분은 PAM에 인접한 표적 임의의 목적 서열로 Cas9 뉴클레아제를 가이드하도록 조작될 수 있다 (문헌 [Jinek et al. (2012) Science 337, p. 816-821, Jinek et al., (2013), eLife 2:e00471, 및 David Segal, (2013) eLife 2:e00563] 참조). 따라서, CRISPR/Cas 시스템은 게놈 내의 목적 표적에서 DSB를 생성하기 위해 조작될 수 있고, DSB의 복구는 오류 유발 복구의 증가를 유발하기 위한 복구 억제제의 사용에 의해 영향받을 수 있다.
특정 실시양태에서, 세포의 게놈의 생체내 절단 및/또는 표적화 절단을 위해 사용되는 1종 이상의 뉴클레아제의 DNA 결합 도메인은 아연 핑거 단백질을 포함한다. 바람직하게는, 아연 핑거 단백질은 선택 표적 부위에 결합하도록 조작되었다는 점에서 비-자연 발생적이다. 예를 들어, 문헌 [Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan et al. (2001) Nature Biotechnol. 19:656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411-416]; 미국 특허 번호 6,453,242; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,030,215; 6,794,136; 7,067,317; 7,262,054; 7,070,934; 7,361,635; 7,253,273; 및 미국 특허 공개공보 번호 2005/0064474; 2007/0218528; 2005/0267061을 참조하며, 이들 모두는 그 전문이 본원에 참조로 포함된다.
조작된 아연 핑거 결합 도메인은 자연-발생 아연 핑거 단백질과 비교하여 신규한 결합 특이성을 가질 수 있다. 조작 방법은 합리적 설계 및 다양한 유형의 선택을 포함하나, 이에 제한되지는 않는다. 합리적 설계는, 예를 들어 삼중 (또는 사중) 뉴클레오티드 서열 및 개별 아연 핑거 아미노산 서열을 포함하는 데이터베이스의 사용을 포함하며, 여기서 각각의 삼중 또는 사중 뉴클레오티드 서열은 특정한 삼중 또는 사중 서열에 결합하는 아연 핑거의 1종 이상의 아미노산 서열과 회합된다. 예를 들어, 전문이 본원에 참조로 포함되는 공동 소유의 미국 특허 6,453,242 및 6,534,261을 참조한다.
파지 디스플레이 및 2-하이브리드 시스템을 비롯한 예시적인 선택 방법이 미국 특허 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 및 6,242,568; 뿐만 아니라 WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 및 GB 2,338,237에 개시되어 있다. 추가로, 아연 핑거 결합 도메인에 대한 결합 특이성의 증진은 예를 들어 공동 소유의 WO 02/077227에 기재된 바 있다.
추가로, 이들 및 다른 참고문헌에 개시된 바와 같이, 아연 핑거 도메인 및/또는 다중-핑거의 아연 핑거 단백질은 예를 들어 5개 이상의 아미노산 길이의 링커를 포함하는 임의의 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한, 6개 이상의 아미노산 길이의 예시적인 링커 서열에 대해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기재된 단백질은 단백질의 개별 아연 핑거 사이의 적합한 링커의 임의의 조합을 포함할 수 있다.
조성물, 특히 트랜스진을 보유하는 공여자 분자의 생체내 절단에 유용한 뉴클레아제 및 트랜스진이 표적화 방식으로 게놈 내로 통합되도록 하는 세포의 게놈의 절단을 위한 뉴클레아제가 본원에 기재된다. 특정 실시양태에서, 1종 이상의 뉴클레아제는 자연 발생된다. 다른 실시양태에서, 1종 이상의 뉴클레아제는 비-자연 발생되며, 즉 DNA-결합 도메인 및/또는 절단 도메인에서 조작된다. 예를 들어, 자연-발생 뉴클레아제의 DNA-결합 도메인은 선택된 표적 부위에 결합하도록 변경될 수 있다 (예를 들어, 동족 결합 부위와 상이한 부위에 결합하도록 조작된 메가뉴클레아제). 다른 실시양태에서, 뉴클레아제는 이종 DNA-결합 및 절단 도메인 (예를 들어, 아연 핑거 뉴클레아제; TAL-이펙터 도메인 DNA 결합 단백질; 이종 절단 도메인을 갖는 메가뉴클레아제 DNA-결합 도메인)을 포함한다.
임의의 적합한 절단 도메인은 뉴클레아제를 형성하기 위해 DNA-결합 도메인에 작동적으로 연결될 수 있다. 예를 들어, ZFP DNA-결합 도메인은 뉴클레아제 도메인에 융합되어 ZFN - 그의 조작된 (ZFP) DNA 결합 도메인을 통해 그의 의도된 핵산 표적을 인식하고 뉴클레아제 활성을 통해 ZFP 결합 부위 부근에서 DNA를 절단할 수 있는 기능적 개체를 생성하였다. 예를 들어, 문헌 [Kim et al. (1996) Proc Natl Acad Sci USA 93(3):1156-1160]을 참조한다. 보다 최근에, ZFN은 다양한 유기체에서 게놈 변형을 위해 사용된 바 있다. 예를 들어, 미국 특허 공개 20030232410; 20050208489; 20050026157; 20050064474; 20060188987; 20060063231; 및 국제 공개 WO 07/014275를 참조한다. 마찬가지로, TALE DNA-결합 도메인은 뉴클레아제 도메인에 융합되어 TALEN을 생성하였다. 예를 들어, 미국 공개 번호 20110301073을 참조한다.
상기 나타낸 바와 같이, 절단 도메인은 DNA-결합 도메인, 예를 들어 아연 핑거 DNA-결합 도메인 및 뉴클레아제로부터의 절단 도메인 또는 TALEN DNA-결합 도메인 및 절단 도메인, 또는 메가뉴클레아제 DNA-결합 도메인 및 상이한 뉴클레아제로부터의 절단 도메인에 이종성일 수 있다. 이종 절단 도메인은 특정한 엔도뉴클레아제 또는 엑소뉴클레아제로부터 수득될 수 있다. 절단 도메인이 유래될 수 있는 예시적인 엔도뉴클레아제는 제한 엔도뉴클레아제 및 귀소 엔도뉴클레아제를 포함하나, 이에 제한되지는 않는다. 예를 들어, 문헌 [2002-2003 Catalogue, New England Biolabs, Beverly, MA; 및 Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388]을 참조한다. DNA를 절단하는 추가의 효소가 공지되어 있다 (예를 들어, S1 뉴클레아제; 녹두 뉴클레아제; 췌장 DNase I; 미크로코쿠스 뉴클레아제; 효모 HO 엔도뉴클레아제; 또한, 문헌 [Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press,1993] 참조). 이들 효소 (또는 그의 기능적 단편) 중 1종 이상이 절단 도메인 및 절단 절반-도메인의 공급원으로 사용될 수 있다.
유사하게, 절단 절반-도메인은 상기 제시된 바와 같이, 절단 활성을 위해 이량체화를 필요로 하는 임의의 뉴클레아제 또는 그의 일부로부터 유래될 수 있다. 일반적으로, 융합 단백질이 절단 절반-도메인을 포함하는 경우에 2개의 융합 단백질이 절단에 필요하다. 대안적으로, 2개의 절단 절반-도메인을 포함하는 단일 단백질이 사용될 수 있다. 2개의 절단 절반-도메인이 동일한 엔도뉴클레아제 (또는 그의 기능적 단편)로부터 유래될 수 있거나, 또는 각각의 절단 절반-도메인이 상이한 엔도뉴클레아제 (또는 그의 기능적 단편)로부터 유래될 수 있다. 추가로, 2개의 융합 단백질의 각각의 표적 부위에 대한 결합이 절단 절반-도메인들을 서로에 대해 공간 배향으로 위치시켜 절단 절반-도메인들이 예를 들어 이량체화에 의해 기능적 절단 도메인을 형성하도록, 2개의 융합 단백질에 대한 표적 부위들은 바람직하게는 서로에 대해 배치된다. 따라서, 특정 실시양태에서, 표적 부위의 가까운 가장자리는 5-8개의 뉴클레오티드 또는 15-18개의 뉴클레오티드에 의해 분리된다. 그러나, 임의의 정수 개의 뉴클레오티드 또는 뉴클레오티드 쌍이 2개의 표적 부위 사이에 개재될 수 있다 (예를 들어, 2 내지 50개의 뉴클레오티드 쌍 또는 그 초과). 일반적으로, 절단 부위는 표적 부위 사이에 존재한다.
제한 엔도뉴클레아제 (제한 효소)는 많은 종에 존재하고, DNA에 서열-특이적으로 결합할 수 있고 (인식 부위에서), 결합 부위에서 또는 그 부근에서 DNA를 절단할 수 있다. 특정 제한 효소 (예를 들어, 유형 IIS)는 인식 부위에서 떨어진 부위에서 DNA를 절단하고, 분리가능한 결합 및 절단 도메인을 갖는다. 예를 들어, 유형 IIS 효소 Fok I은 하나의 가닥 상의 인식 부위로부터 9개의 뉴클레오티드, 및 다른 가닥 상의 인식 부위로부터 13개의 뉴클레오티드에서 DNA의 이중-가닥 절단을 촉매한다. 예를 들어, US 특허 5,356,802; 5,436,150 및 5,487,994; 뿐만 아니라 문헌 [Li et al. (1992) Proc. Natl. Acad. Sci. USA 89:4275-4279; Li et al. (1993) Proc. Natl. Acad. Sci. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91:883-887; Kim et al. (1994b) J. Biol. Chem. 269:31,978-31,982]을 참조한다. 따라서, 한 실시양태에서, 융합 단백질은 적어도 1종의 유형 IIS 제한 효소로부터의 절단 도메인 (또는 절단 절반-도메인), 및 조작되거나 조작되지 않을 수 있는 1개 이상의 아연 핑거 결합 도메인을 포함한다.
절단 도메인이 결합 도메인으로부터 분리가능한 예시적인 유형 IIS 제한 효소는 Fok I이다. 상기 특정한 효소는 이량체로서 활성이다. Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10,570-10,575. 따라서, 본 개시내용의 목적을 위해, 개시된 융합 단백질에 사용된 Fok I 효소의 부분은 절단 절반-도메인으로 간주된다. 따라서, 아연 핑거-Fok I 융합체를 사용한 표적화 이중-가닥 절단 및/또는 DNA 서열의 표적화 교체를 위해, 각각 FokI 절단 절반-도메인을 포함하는 2개의 융합 단백질이 촉매 활성 절단 도메인을 재구성하기 위해 사용될 수 있다. 대안적으로, 아연 핑거 결합 도메인 및 2개의 Fok I 절단 절반-도메인을 함유하는 단일 폴리펩티드 분자가 또한 사용될 수 있다. 아연 핑거-Fok I 융합체를 사용한 표적화 절단 및 표적화 서열 변경을 위한 파라미터는 본 개시내용의 다른 곳에서 제공된다.
절단 도메인 또는 절단 절반-도메인은 절단 활성을 보유하거나 또는 기능적 절단 도메인을 형성하기 위해 다량체화 (예를 들어, 이량체화)하는 능력을 보유하는 단백질의 임의의 부분일 수 있다.
예시적인 유형 IIS 제한 효소는 전문이 본원에 포함되는 국제 공개 WO 07/014275에 기재되어 있다. 추가의 제한 효소가 또한 분리가능한 결합 및 절단 도메인을 함유하고, 이들은 본 개시내용에서 고려된다. 예를 들어, 문헌 [Roberts et al. (2003) Nucleic Acids Res. 31:418-420]을 참조한다.
특정 실시양태에서, 절단 도메인은, 예를 들어 미국 특허 공개 번호 20050064474; 20060188987; 20070305346 및 20080131962 (이들 모두의 개시내용은 그 전문이 본원에 참조로 포함됨)에 기재된 바와 같이 동종이량체화를 최소화하거나 또는 방지하는 1개 이상의 조작된 절단 절반-도메인 (이량체화 도메인 돌연변이체로도 지칭됨)을 포함한다. Fok I의 위치 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537, 및 538의 아미노산 잔기는 모두 Fok I 절단 절반-도메인의 이량체화에 영향을 주기 위한 표적이다.
절대적 이종이량체를 형성하는 Fok I의 예시적인 조작된 절단 절반-도메인은 제1 절단 절반-도메인이 Fok I의 위치 490 및 538의 아미노산 잔기에서의 돌연변이를 포함하고 제2 절단 절반-도메인이 아미노산 잔기 486 및 499에서의 돌연변이를 포함하는 쌍을 포함한다.
따라서, 한 실시양태에서, 490에서의 돌연변이는 Glu (E)를 Lys (K)로 교체하고; 538에서의 돌연변이는 Iso (I)를 Lys (K)로 교체하고; 486에서의 돌연변이는 Gln (Q)를 Glu (E)로 교체하고; 위치 499에서의 돌연변이는 Iso (I)를 Lys (K)로 교체한다. 구체적으로, 본원에 기재된 조작된 절단 절반-도메인은 "E490K:I538K"로 지정된 조작된 절단 절반-도메인을 생산하기 위해 하나의 절단 절반-도메인에서 위치 490 (E→K) 및 538 (I→K)을 돌연변이시키고, "Q486E:I499L"로 지정된 조작된 절단 절반-도메인을 생산하기 위해 또 다른 절단 절반-도메인에서 위치 486 (Q→E) 및 499 (I→L)를 돌연변이시킴으로써 제조하였다. 본원에 기재된 조작된 절단 절반-도메인은 비정상적 절단이 최소화되거나 또는 제거된 절대적 이종이량체 돌연변이체이다. 예를 들어, 미국 특허 공개 번호 2008/0131962를 참조하며, 그의 개시내용은 모든 목적을 위해 그 전문이 참조로 포함된다. 특정 실시양태에서, 조작된 절단 절반-도메인은 위치 486, 499 및 496 (야생형 FokI에 대해 넘버링됨)에서의 돌연변이, 예를 들어 위치 486의 야생형 Gln (Q) 잔기를 Glu (E) 잔기로, 위치 499의 야생형 Iso (I) 잔기를 Leu (L) 잔기로, 위치 496의 야생형 Asn (N) 잔기를 Asp (D) 또는 Glu (E) 잔기로 교체한 돌연변이 (각각 "ELD" 및 "ELE" 도메인으로도 지칭됨)를 포함한다. 다른 실시양태에서, 조작된 절단 절반-도메인은 위치 490, 538 및 537 (야생형 FokI에 대해 넘버링됨)에서의 돌연변이, 예를 들어 위치 490의 야생형 Glu (E) 잔기를 Lys (K) 잔기로, 위치 538의 야생형 Iso (I) 잔기를 Lys (K) 잔기로, 위치 537의 야생형 His (H) 잔기를 Lys (K) 잔기 또는 Arg (R) 잔기로 교체한 돌연변이 (각각 "KKK" 및 "KKR" 도메인으로도 지칭됨)를 포함한다. 다른 실시양태에서, 조작된 절단 절반-도메인은 위치 490 및 537 (야생형 FokI에 대해 넘버링됨)에서의 돌연변이, 예를 들어 위치 490의 야생형 Glu (E) 잔기를 Lys(K) 잔기로, 위치 537의 야생형 His (H) 잔기를 Lys (K) 잔기 또는 Arg (R) 잔기로 교체한 돌연변이 (각각 "KIK" 및 "KIR" 도메인으로도 지칭됨)를 포함한다. (미국 특허 공개 번호 20110201055 참조). 다른 실시양태에서, 조작된 절단 절반 도메인은 "Sharkey" 및/또는 "Sharkey'" 돌연변이를 포함한다 (문헌 [Guo et al., (2010) J. Mol. Biol. 400(1):96-107] 참조).
본원에 기재된 조작된 절단 절반-도메인은 임의의 적합한 방법을 사용하여, 예를 들어 미국 특허 공개 번호 20050064474; 20080131962; 및 20110201055에 기재된 바와 같은 야생형 절단 절반-도메인 (Fok I)의 부위-지정 돌연변이유발에 의해 제조될 수 있다.
대안적으로, 뉴클레아제는 소위 "분할-효소" 기술을 사용하여 핵산 표적 부위에서 생체내에서 조립될 수 있다 (예를 들어, 미국 특허 공개 번호 20090068164 참조). 이러한 분할 효소의 성분은 별개의 발현 구축물 상에서 발현될 수 있거나, 또는 개별 성분이 예를 들어 자가-절단 2A 펩티드 또는 IRES 서열에 의해 분리되는 1개의 오픈 리딩 프레임에 연결될 수 있다. 성분은 개별 아연 핑거 결합 도메인 또는 메가뉴클레아제 핵산 결합 도메인의 도메인일 수 있다.
뉴클레아제는 예를 들어 WO 2009/042163 및 20090068164에 기재된 바와 같은 효모-기반 염색체 시스템에서 사용 전에 활성에 대해 스크리닝될 수 있다. 뉴클레아제 발현 구축물은 관련 기술분야에 공지된 방법을 사용하여 용이하게 설계될 수 있다. 예를 들어, 미국 특허 공개 20030232410; 20050208489; 20050026157; 20050064474; 20060188987; 20060063231; 및 국제 공개 WO 07/014275를 참조한다. 뉴클레아제의 발현은 구성적 프로모터 또는 유도성 프로모터, 예를 들어 라피노스 및/또는 갈락토스의 존재 하에 활성화되고 (탈억제되고) 글루코스의 존재 하에 억제되는 갈락토키나제 프로모터의 제어 하에 이루어질 수 있다.
한 실시양태에서, 폴리뉴클레오티드 공여자 카세트는 분석 도메인을 포함한다. 다른 실시양태에서, 분석 도메인은 특정 폴리뉴클레오티드 서열을 포함한다. 특정 폴리뉴클레오티드 서열의 예는 서열 142 및 서열 143을 포함하나, 이에 제한되지는 않는다. 다양한 실시양태에서, 서열 142 및 서열 143의 특정 폴리뉴클레오티드 서열에 대해 적어도 90% 서열 동일성을 갖는 서열이 본원에 개시된다. 다른 실시양태에서, 서열 142 및 서열 143의 특정 폴리뉴클레오티드 서열에 대해 적어도 95% 서열 동일성을 갖는 서열이 본원에 개시된다. 다른 실시양태에서, 서열 142 및 서열 143의 특정 폴리뉴클레오티드 서열에 대해 적어도 97% 서열 동일성을 갖는 서열이 본원에 개시된다. 또 다른 실시양태에서, 서열 142 및 서열 143의 특정 폴리뉴클레오티드 서열에 대해 적어도 99% 서열 동일성을 갖는 서열이 본원에 개시된다.
한 실시양태에서, 분석 도메인은 40 내지 60%의 구아닌 및 시토신 비를 포함한다. 다른 실시양태에서, 분석 도메인은 42.25 내지 57.5%의 구아닌 및 시토신 비를 포함한다. 다른 실시양태에서, 분석 도메인은 45 내지 55%의 구아닌 및 시토신 비를 포함한다. 또 다른 실시양태에서, 분석 도메인은 47.75 내지 52.25%의 구아닌 및 시토신 비를 포함한다. 폴리뉴클레오티드 서열을 포함하는 영역에 걸친 구아닌 및 시토신 함량의 비는 폴리뉴클레오티드 서열 내의 구아닌 및 시토신 잔기의 수를 계수하고, 이 수를 폴리뉴클레오티드 서열의 스트레치 내의 염기 쌍의 총수로 나눈 후, 결과에 100을 곱하여 폴리뉴클레오티드 서열에 대한 구아닌 및 시토신의 백분율을 결정함으로써 계산될 수 있다. 40-60%의 시토신에 대한 구아닌의 비를 포함하는 프라이머가 PCR 증폭 동안 주형 DNA와 보다 안정한 결합을 생성한다. 그러나, 60% 초과의 시토신에 대한 구아닌의 비를 갖는 DNA 분자는, 이러한 서열이 줄기 루프, 이량체 및 다른 2차 구조를 형성할 수 있기 때문에 PCR을 통해 증폭시키기 어렵다.
용융 온도 (Tm)는 DNA 가닥의 절반이 이중-나선 상태로 있고 절반이 무작위 코일 상태로 있는 온도로 정의된다. 용융 온도는 분자의 길이, 그 분자의 특정 뉴클레오티드 서열 조성, 및 용액 중 염 및 핵산의 몰농도를 포함하는 변수에 따라 달라질 수 있다. 듀플렉스 안정성 및 용융 온도는 열순환이 수반될 수 있는 핵산 증폭에서 중요하다. 이러한 열순환 단계 동안, 온도는 표적 핵산 및 그의 보체의 듀플렉스가 해리되도록 용융 온도 초과로 충분히 높게 상승된다. 재어닐링의 후속 단계에서, 온도는 비-특이적 혼성화를 회피하기에는 충분히 높게 유지하면서, 표적 핵산 및 프라이머(들) 및/또는 프로브(들)의 듀플렉스가 형성될 수 있도록 용융 온도 미만으로 된다. 용융 온도 및 그를 측정하는 방법은 관련 기술분야에 철저히 기재되어 있다. 예를 들어, 문헌 [Nucleic Acids Research (1990) 18, 6409-6412 및 Bioinformatics, V. 12(12), pp. 1226-1227]을 참조한다. 듀플렉스 안정성을 뉴클레오티드 서열에 관련시킨 이론적 또는 실험적 모델이 핵산에 대한 용융 온도를 예측하는데 사용될 수 있다. 예를 들어, 문헌 [Proc. Natl. Acad. Sci: U.S.A. 1986, 83:3746-3750, Biochemistry 1996, 35:3555-3562; 및 Proc. Natl. Acad Sci. U.S.A. 1998, 95:1460-1465]은 관련 기술분야에서 폭넓게 사용되며 "최근접 이웃 모델"로 공지되어 있는 용융 온도를 예측하기 위한 모델을 기재하고 있다. 이 모델은 올리고뉴클레오티드의 길이 및 그 내의 염기의 서열 둘 다를 고려한다.
예측된 용융 온도는 임의의 모이어티와 접합되지 않는 올리고뉴클레오티드의 이론적으로 계산된 용융 온도를 지칭한다. 이는 통상적으로 올리고뉴클레오티드의 실제 용융 온도의 추정치이며, 전형적으로 임의의 표지 및 임의의 회합된 링커 등의 효과를 고려하지 않은 올리고뉴클레오티드의 서열을 기초로 한다. 올리고뉴클레오티드의 정확한 서열을 고려할 때, 올리고뉴클레오티드의 용융 온도는 상기 논의된 바와 같이 예측될 수 있다. 본 발명에 따른 예측된 용융 온도는, 한 실시양태에서, 최근접 이웃 모델을 사용하여 계산된다. 추가 실시양태에서, 본 발명에 따른 예측된 용융 온도는 산타루치아(SantaLucia) 값 (SantaLucia, J., Jr. (1998) Proc. Natl. Acad. Sci. U.S.A. (1998) 95, 1460-1465)을 사용하는 최근접 이웃 열역학적 이론을 사용하여 계산된다. 산타루치아 값은 용융 온도를 예측하는데 사용될 수 있는 다양한 컴퓨터 프로그램에 포함된다. 한 실시양태에서, "비콘 디자이너(Beacon Designer)" 소프트웨어 패키지가 사용된다. 한 실시양태에서, 산타루치아 값은 하기 반응 조건과 함께 사용된다; 0.25 nM의 핵산 농도; 50 mM의 1가 이온 농도; 5mM의 유리 마그네슘 이온 농도; 332.84mM의 총 Na+ 당량; 및 25℃의 자유 에너지 계산을 위한 온도. 사용된 특정한 소프트웨어 프로그램 또는 방법론의 선택에 상관없이, 바람직하게는 동일한 소프트웨어 프로그램 또는 방법론이 본 발명에 사용된 프라이머(들) 및 프로브(들)의 예측된 용융 온도를 확인하기 위해, 적합하게는 그의 디폴트 설정으로 사용된다.
용어 "최소 자유 에너지" (MFE), "자유 에너지" 및 "깁스(Gibbs) 자유 에너지"는 본원에서 상호교환가능하게 사용된다. 깁스 자유 에너지는 엔탈피 및 절대 온도의 생성물 및 시스템의 엔트로피 사이의 차이인 열역학적 양이다. 깁스 자유 에너지는 비-기계적 일을 수행하는 시스템의 능력이며, ΔG는 시스템 상에서 수행된 비-기계적 일을 측정한다. (Perrot, Pierre. A to Z of Thermodynamics. Oxford University Press (1998)). 깁스 자유 에너지는 G=H-TS로 정의되며, 여기서 H는 엔탈피이고, T는 온도이고, S는 엔트로피이다 (H=U+pV, 여기서 p는 압력이고, V는 부피임).
모든 시스템이 최소 자유 에너지를 달성하도록 의도된다는 것이 일반적으로 고려된다. 따라서, 깁스 자유 에너지에서의 변화, ΔG가 음수인 경우에, 반응은 유리하며 에너지는 방출된다. 방출된 에너지의 양은 상기 특정한 화학 반응의 결과로서 수행될 수 있는 일의 최대량과 동일하다. 조건이 양수인 깁스 자유 에너지에서의 변화, ΔG를 일으키는 경우에, 반응이 진행되도록 하기 위해 에너지가 시스템에 추가되여야 한다. 등온, 등압 시스템에서, 깁스 자유 에너지는 열역학적 과정에 수반되는 엔탈피 및 엔트로피의 경쟁 효과의 대표적인 척도이다. 따라서, 깁스 자유 에너지는 역학적 양인 것으로 간주될 수 있다.
자유 에너지의 측정이 뉴클레오티드 서열 길이에 의해 편향될 수 있다는 것을 유념한다. 보다 긴 뉴클레오티드 서열은 짧은 뉴클레오티드 서열보다 큰 범위의 자유 에너지를 갖는다. 따라서, 가변 길이의 뉴클레오티드 서열은 자유 에너지를 서열 길이로 나누어 자유 에너지 계산 (kcal/mol)을 정규화함으로써 비교될 수 있다 (즉, 평균 자유 에너지=ΔG/뉴클레오티드 서열의 길이 (kcal/mol/염기 쌍)).
따라서, 본원에 사용된 최소 자유 에너지 (즉 자유 에너지, 깁스 자유 에너지)는 열역학적 최적화 (즉, 최저 자유 에너지 값 (즉, 깁스 자유 에너지; ΔG (kcal/mol); ΔG/뉴클레오티드 서열의 길이 (kcal/mol/염기 쌍)을 갖는 주커(Zuker) 알고리즘 (M. Zuker and P. Stiegler, Nucleic Acids Research 9:133-148 (1981))의 구현)에 의해 발견된 구조에 대한 값을 확인한다. 서열의 깁스 자유 에너지는 예를 들어 관련 기술분야의 통상의 기술자에게 공지된 바와 같은 RNA폴드(RNAfold)™ 또는 프라이머 익스프레스(PRIMER EXPRESS)™ (버전 1.0, 어플라이드 바이오시스템즈(Applied Biosystems), 캘리포니아주 포스터 시티) 또는 m폴드(mFOLD)™ 소프트웨어 (현재 유니폴드(UNIFold)™) (IDT, 캘리포니아주 산호세) 프로그램을 사용하여 계산될 수 있다. (예를 들어 상기 동일 문헌, 문헌 [Hofacker et al. Monatshefte f. Chemie 125: 167-188 (1994); McCaskill J S. Biopolymers 29 (6-7):1105-19. (1990); 및 Hofacker et al. Bioinformatics 22 (10):1172-6 (2006)] 참조).
한 실시양태에서, 분석 도메인은 적어도 9 Bp 길이인 복수의 반복 서열을 함유하지 않는 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, 복수의 반복 서열은 적어도 9 Bp 길이의 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 폴리뉴클레오티드 단편을 포함한다. 한 실시양태에서, 제1 폴리뉴클레오티드 서열은 동일한 서열을 포함하는 제2 폴리뉴클레오티드 서열이 제1 폴리뉴클레오티드 서열의 바로 하류에 위치할 때 반복 서열을 구성한다 (예를 들어 제1 폴리뉴클레오티드 서열은 5'-gaaaaataacaa-3'을 포함하고, 이 폴리뉴클레오티드 서열은, 동일한 서열을 포함하는 제2 폴리뉴클레오티드 서열 (밑줄 표시)이 제1 폴리뉴클레오티드 서열의 바로 하류에 위치할 때 반복 서열을 구성함 5'-gaaaaataacaagaaaaataacaa -3'). 한 실시양태에서, 분석 도메인은 복수의 이러한 반복적 서열을 함유하지 않는 폴리뉴클레오티드를 포함한다.
한 실시양태에서, 분석 도메인은 9 Bp 초과의 길이의 일련의 동일한 염기 쌍 서열을 함유하지 않는 폴리뉴클레오티드를 포함한다. 동일한 염기 쌍은 공간적 또는 시간적 연속으로 차례로 있는 동일한 퓨린 (아데닌 또는 구아닌) 또는 피리미딘 (시토신 또는 티민) 염기 쌍의 9 Bp 초과의 임의의 개수의 염기 쌍이다. 따라서, 5'-AAAAAAAAA-3', 5'-GGGGGGGGG-3', 5'-CCCCCCCCC-3' 또는 5'-TTTTTTTTT-3'과 같은 뉴클레오티드의 스트레치는 일련의 9개의 동일한 염기 쌍을 포함할 것이다. 한 실시양태에서, 일련의 동일한 염기 쌍 서열은 9 Bp, 10 Bp, 11 Bp, 12 Bp, 13 Bp, 14 Bp, 15 Bp 또는 그 초과의 Bp 길이를 초과할 수 있다.
다른 실시양태에서, 폴리뉴클레오티드 공여자 카세트의 분석 도메인은 1개 이상의 제한 효소 서열을 포함한다. 제한 효소는 DNA를 단편으로 절단할 수 있는 효소이다. 제한 효소에 의한 고분자량 게놈 DNA의 보다 저분자량의 단편으로의 절단은 보다 효율적인 단리 및 후속 분석을 위한 DNA 단편의 조작을 가능하게 한다.
제한 효소 소화 (제한 엔도뉴클레아제 소화로도 언급됨)는 뉴클레아제 효소를 사용하여 폴리뉴클레오티드 서열을 절단하는 경우에 수행된다. 관련 기술분야의 통상의 기술자가 이용가능한 다수의 제한 효소가 존재한다. www.neb.com/nebecomm/tech_reference/restriction_enzymes/overview.asp에 기재된 바와 같이, 4개 분류가 제한 효소를 특징화하는데 사용된다. 이들 분류는 서브유닛 조성, 절단 위치, 서열 특이성 및 보조인자 요건에 기초하여 이루어진다.
유형 I 효소는 인식/결합 서열로부터 떨어져 있는 (> 1,000 bp 떨어져 있는) 위치에서 DNA를 무작위로 절단한다. 유형 I 효소에 의해 결합되는 인식 부위는 비대칭이다. 그 결과, 이들 효소는 별개의 제한 단편 또는 뚜렷한 겔-밴딩 패턴을 생산하지 않기 때문에 이들 효소는 유전자 클로닝에 사용되지 않는다. 유형 I 효소는 다중기능적이며, 유형 I 제한 효소를 포함하는 상이한 서브유닛은 상이한 활성을 담당한다 (즉, 서브유닛 HsdR은 제한을 코딩하고, 서브유닛 HsdM은 DNA의 메틸화를 코딩하며, 서브유닛 HsdS는 인식 서열의 특이성을 코딩함).
유형 II 효소는 인식 서열에 근접한 위치에서 DNA를 소화시킨다. 이들 효소는 이량체로서 기능하며, 여기서 서브유닛은 센스 가닥에 결합하고, 서브유닛의 제2 카피는, 전형적으로 4 내지 8개 뉴클레오티드 길이인 회문식 서열에서 안티센스 가닥에 결합한다. DNA에 결합하는 유형 II 이량체는 대칭 DNA 서열에 결합하는 동종이량체, 또는 비대칭 DNA 서열에 결합하는 이종이량체일 수 있다. 효소는 연속 서열 또는 불연속 서열을 인식할 수 있다. 유형 II 효소는 상업적으로 입수가능하고, 통상적으로 DNA 분석 및 유전자 클로닝에 사용된다. 이들 효소의 광범위한 용법은 아가로스 겔 상에 생성되고 분해될 수 있는 구별되는 제한 단편의 결과이다.
유형 II 효소는 아미노산 서열 유사성에 있어서 고도로 벗어나는 비관련 단백질의 집합이다. 유형 II 효소는 문자 접미어를 사용하여 표지되는 하위카테고리로 분류된다. 유형 IIB 제한 효소는 1개 초과의 서브유닛을 함유하는 다량체이다. 이들 효소는 인식 서열의 양측을 절단하며, 이로써 인식 서열의 제거가 일어난다. 유형 IIE 및 유형 IIF 제한 효소는 그의 인식 서열의 2개의 카피와의 상호작용 후에 DNA를 절단한다. 유형 IIG 제한 효소는 단일 서브유닛으로 구성된다. 효소의 N-말단부는 DNA 절단 도메인 및 DNA 수식 도메인을 보유한다. 효소의 C-말단 부분은 DNA 서열 결합 도메인을 보유한다. 이들 효소는 그의 인식 서열의 외측을 절단한다. 유형 IIM 제한 효소는 메틸화 DNA를 인식하고 절단한다. 유형 IIS 제한 효소는 이량체로서 기능하고 비-회문식 비대칭 인식 부위 외측의 위치에서 DNA를 절단한다. 이들 효소는 하나는 DNA 결합을 위한 것이고 다른 것은 DNA 절단을 위한 것인 2개의 구별되는 도메인으로 구성된다.
유형 III 효소는 조합 제한-및-변형 효소이다. 이들 효소는 2개의 별개의 비-회문식 서열을 인식하고 그의 인식 서열의 외측을 절단한다. 유형 III 효소는 절단을 달성하기 위해 동일한 DNA 분자 내에 반대 배향의 2개의 인식 서열을 필요로 한다.
유형 IV 효소는 메틸화 DNA를 인식한다. 그 예는 이. 콜라이의 McrBC 및 Mrr 시스템을 포함한다.
한 실시양태에서, 폴리뉴클레오티드 공여자 카세트의 분석 도메인은 1개 이상의 프라이머 결합 서열을 포함한다. 용어 "프라이머 결합 서열"은 관련 기술분야에 공지된 임의의 적합한 프라이머 연장 반응 또는 증폭 반응, 예를 들어 비제한적으로 PCR을 위해 프라이머가 어닐링할 수 있는 주형으로서 직접적으로 또는 그의 보체에 의해 작용할 수 있는, 분석 도메인 또는 임의의 다른 폴리뉴클레오티드 서열, 전형적으로 표적 영역 및/또는 앰플리콘에 플랭킹된 서열의 영역을 지칭한다. 2개의 프라이머-결합 부위가 단일 폴리뉴클레오티드 상에 존재하는 경우에, 2개의 프라이머-결합 부위의 배향은 일반적으로 상이하다는 것이 관련 기술분야의 통상의 기술자에 의해 인지될 것이다. 예를 들어, 프라이머 쌍의 1개의 프라이머는 제1 프라이머-결합 부위에 상보적이고, 그와 혼성화될 수 있는 반면, 프라이머 쌍의 상응하는 프라이머는 제2 프라이머-결합 부위의 보체와 혼성화되도록 설계된다. 다른 방식으로 말하자면, 일부 실시양태에서, 제1 프라이머-결합 부위는 센스 배향일 수 있고, 제2 프라이머-결합 부위는 안티센스 배향일 수 있다. 앰플리콘의 프라이머-결합 부위는 표적 플랭킹 서열 또는 그의 보체의 서열과 동일한 서열 또는 적어도 그의 일부를 포함할 수 있으나, 반드시 포함할 필요는 없다.
프라이머는 -1 내지 -18 kcal/mol의 자유 에너지 (ΔG)로 계산된 2차 구조를 포함하는 분석 도메인에 결합하도록 설계될 수 있다. 한 실시양태에서, 프라이머는 문헌 [Markham, N. R. & Zuker, M. (2008) UNAFold: software for nucleic acid folding and hybridization. In Keith, J. M., editor, Bioinformatics, Volume II. Structure, Function and Applications, number 453 in Methods in Molecular Biology, chapter 1, pages 3-31. Humana Press, Totowa, NJ. ISBN 978-1-60327-428-9]을 사용하여 계산된 -1 내지 -18 kcal/mol의 자유 에너지 (ΔG)를 갖는 2차 구조를 포함하는 분석 도메인의 영역보다 적어도 10℃ 더 높은 용융 온도 (Tm)로 설계될 수 있다.
한 실시양태에서, 폴리뉴클레오티드 공여자 카세트의 분석 도메인은 1개 이상의 상동성 아암 서열을 포함한다. 1개 이상의 상동성 아암 서열의 후속 실시양태는 50 내지 100개 염기 쌍의 길이로 구성된다. 뉴클레오티드의 무작위 스트레치로 구성된 상동성 아암은 용이하게 설계될 수 있고, 다양한 적용을 위해 합성될 수 있다. 범용 폴리뉴클레오티드 공여자 서열은 숙주 게놈 내의 폴리뉴클레오티드의 상동 통합을 위해 이용되는 1개 이상의 상동성 아암을 포함할 수 있다. 일부 실시양태에서, 상동성 아암은 상동성 아암 내에 또는 바로 옆에 이중 가닥 파괴를 도입하고 상동성 아암 영역 내에 트랜스진을 포함하는 유전자 발현 카세트를 포함할 수 있는 제2 폴리뉴클레오티드를 통합함으로써 표적화된다. 전형적으로, 제2 폴리뉴클레오티드의 통합은 상동 재조합 지정 복구를 통해 발생한다.
한 실시양태에서, 상동성 아암 영역은 최적 게놈 유전자좌와 적어도 80, 90, 93, 95, 99 또는 100% 서열 동일성을 공유한다. 한 실시양태에서, 상동성 아암 영역은 식물 세포의 최적 게놈 유전자좌와 적어도 80, 90, 93, 95, 99 또는 100% 서열 동일성을 공유한다. 한 실시양태에서, 최적 게놈 유전자좌는, 저메틸화되고 발현가능하며 재조합의 증거를 예증하고 식물의 게놈에서 유전자 영역에 대해 근위 위치에 위치하는 비유전자 단자엽 또는 쌍자엽 서열이다.
한 실시양태에서, 최적 게놈 유전자좌는 하기 특성 또는 특징을 갖는 저메틸화 비유전자 서열이다:
a) 상기 비유전자 서열의 메틸화의 수준은 1% 이하임;
b) 비유전자 서열은 게놈에 함유된 임의의 다른 서열과 40% 미만의 서열 동일성을 공유함;
c) 비유전자 서열은 게놈에 함유된 임의의 다른 서열과 40% 미만의 서열 동일성을 공유함;
d) 비유전자 서열은 기지의 또는 예측된 발현 코딩 서열의 40 Kb 영역 내에 위치함; 및
e) 비유전자 서열은 0.00041 cM/Mb 초과의 게놈 내의 재조합 빈도를 나타냄.
한 실시양태에서, 최적 게놈 유전자좌는 하기 특성 또는 특징 중 1, 2, 3, 4 또는 5개를 갖는 저메틸화 비유전자 서열이다:
a) 상기 비유전자 서열의 40 Kb 내에 기지의 또는 예측된 유전자 코딩 서열을 가짐;
b) 상기 비유전자 서열의 1개의 말단의 40 Kb 내에 기지의 유전자의 2Kb 상류 및/또는 1 Kb 하류를 포함하는 서열을 가짐;
c) 비유전자 서열 내에 1% 초과의 DNA 메틸화를 함유하지 않음;
d) 게놈 내의 임의의 다른 서열에 대해 40% 초과의 서열 동일성을 갖는 1 Kb 서열을 함유하지 않음; 및
e) 0.00041 cM/Mb 초과의 재조합 빈도로 재조합의 증거를 예증함.
한 실시양태에 따르면, 선택된 비유전자 서열은 하기 특징 중 2, 3, 4, 5, 6, 7 또는 8개를 포함한다:
a) 비유전자 서열은 메틸화 폴리뉴클레오티드를 함유하지 않음;
b) 비유전자 서열은 게놈 내에 0.00041 내지 62.42 cM/Mb 비율의 재조합을 나타냄;
c) 비유전자 서열은 0 내지 0.962 수준의 게놈의 뉴클레오솜 점유율을 나타냄;
d) 비유전자 서열은 게놈에 함유된 임의의 다른 1 Kb 서열과 40% 미만의 서열 동일성을 공유함;
e) 비유전자 서열은 염색체 동원체로부터의 게놈 거리의 비를 나타내는, 0.00373 내지 0.99908의 상대 위치 값을 가짐;
f) 비유전자 서열은 25.17 내지 68.3% 범위의 구아닌/시토신 퍼센트 함량을 가짐;
g) 비유전자 서열은 유전자 서열 근위에 위치함;
h) 상기 비유전자 서열을 포함하는 게놈 서열의 1 Mb 영역은 1개 이상의 비유전자 서열을 포함함.
한 실시양태에서, 폴리뉴클레오티드 공여자 카세트의 분석 도메인은 펩티드를 코딩하지 않는 서열을 포함한다.
한 실시양태에서, 폴리뉴클레오티드 공여자 카세트의 분석 도메인은 펩티드를 코딩하는 서열을 포함한다. 펩티드의 발현을 위해, 펩티드 서열을 코딩하는 뉴클레오티드 서열은 전형적으로 전사를 지시하는 프로모터를 함유하는 발현 벡터 내로 서브클로닝된다. 적합한 박테리아 및 진핵 프로모터는 관련 기술분야에 널리 공지되어 있고, 예를 들어 문헌 [Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd ed. 1989; 3rd ed., 2001); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); 및 Current Protocols in Molecular Biology (Ausubel et al., supra.)]에 기재되어 있다. 펩티드의 발현을 위한 박테리아 발현 시스템은, 예를 들어 이. 콜라이, 바실루스(Bacillus) 종 및 살모넬라(Salmonella)에서 이용가능하다 (Palva et al., Gene 22:229-235 (1983)). 상기 발현 시스템을 위한 키트는 상업적으로 입수가능하다. 포유동물 세포, 효모 및 곤충 세포를 위한 진핵생물 발현 시스템은 관련 기술분야의 통상의 기술자에게 널리 공지되어 있고, 또한 상업적으로 입수가능하다.
한 실시양태에서, 폴리뉴클레오티드 공여자 카세트는 트랜스진을 포함하는 유전자 발현 카세트를 포함한다. 유전자 발현 카세트는 전형적으로 원핵 또는 진핵의 숙주 세포에서의 핵산 발현에 필요한 모든 추가의 요소들을 함유하는 전사 단위 또는 발현 카세트를 함유한다. 따라서, 전형적인 유전자 발현 카세트는, 예를 들어 단백질을 코딩하는 핵산 서열에 작동가능하게 연결된 프로모터, 및 필요한 신호, 예를 들어 전사체의 효율적인 폴리아데닐화, 전사 종결, 리보솜 결합 부위 또는 번역 종결에 필요한 신호를 함유한다. 카세트의 추가의 요소는 예를 들어 인핸서 및 이종 스플라이싱 신호를 포함할 수 있다.
한 실시양태에서, 유전자 발현 카세트는 또한 관심 이종 뉴클레오티드 서열의 3' 말단에 식물에서 기능성인 전사 및 번역 종결 영역을 포함할 것이다. 종결 영역은 본 개시내용의 실시양태의 프로모터 뉴클레오티드 서열 그대로일 수 있거나, 관심 DNA 서열 그대로일 수 있거나, 또는 또 다른 공급원으로부터 유래될 수 있다. 편리한 종결 영역은 에이. 투메파시엔스의 Ti-플라스미드, 예컨대 옥토핀 신타제 및 노팔린 신타제 (nos) 종결 영역으로부터 이용가능하며 (Depicker et al., Mol. and Appl. Genet. 1:561-573 (1982) 및 Shaw et al. (1984) Nucleic Acids Research vol. 12, No. 20 pp7831-7846(nos)); 또한 문헌 [Guerineau et al. Mol. Gen. Genet. 262:141-144 (1991); Proudfoot, Cell 64:671-674 (1991); Sanfacon et al. Genes Dev. 5:141-149 (1991); Mogen et al. Plant Cell 2:1261-1272 (1990); Munroe et al. Gene 91:151-158 (1990); Ballas et al. Nucleic Acids Res. 17:7891-7903 (1989); Joshi et al. Nucleic Acid Res. 15:9627-9639 (1987)]을 참조한다.
다른 실시양태에서, 유전자 발현 카세트는 5' 리더 서열을 추가로 함유할 수 있다. 이러한 리더 서열은 번역을 증진시키는 작용을 할 수 있다. 번역 리더는 관련 기술분야에 공지되어 있고, 예로서 피코르나바이러스 리더, EMCV 리더 (뇌심근염 5' 비코딩 영역) (Elroy-Stein et al. Proc. Nat. Acad. Sci. USA 86:6126-6130 (1989)); 포티바이러스 리더, 예를 들어, TEV 리더 (담배 식각 바이러스) (Carrington and Freed, Journal of Virology, 64: 1590-1597 (1990)), MDMV 리더 (옥수수 위축 모자이크 바이러스) (Allison et al., Virology 154:9-20 (1986)); 인간 이뮤노글로불린 중쇄 결합 단백질 (BiP) (Macejak et al. Nature 353:90-94 (1991)); 알팔파 모자이크 바이러스의 코트 단백질 mRNA로부터의 비번역된 리더 (AMV RNA 4) (Jobling et al. Nature 325:622-625 (1987)); 담배 모자이크 바이러스 리더 (TMV) (Gallie et al. (1989) Molecular Biology of RNA, pages 237-256); 및 옥수수 황백화 얼룩 바이러스 리더 (MCMV) (Lommel et al. Virology 81:382-385 (1991))를 포함한다. 또한 문헌 [Della-Cioppa et al. Plant Physiology 84:965-968 (1987)]을 참조한다. 또한, 구축물은 번역 및/또는 mRNA 안정성을 증진시키는 서열, 예컨대 인트론을 함유할 수 있다. 이러한 인트론의 한 예는 아라비돕시스 탈리아나(Arabidopsis thaliana)의 히스톤 H3.III 변이체의 유전자 II의 제1 인트론이다. Chaubet et al. Journal of Molecular Biology, 225:569-574 (1992).
한 실시양태에서, 폴리뉴클레오티드 공여자 서열의 유전자 발현 카세트는 프로모터를 포함한다. 펩티드 코딩 핵산의 발현을 지시하기 위해 사용되는 프로모터는 특정한 용도에 따라 달라진다. 예를 들어, 숙주 세포에 적합한 강한 구성적 프로모터는 전형적으로 단백질의 발현 및 정제에 사용된다. 바람직한 식물 프로모터의 비제한적 예는 에이. 탈리아나 유비퀴틴-10 (ubi-10) (Callis, et al., 1990, J. Biol. Chem., 265:12486-12493); 에이. 투메파시엔스 만노핀 신타제 (Δmas) (Petolino et al., 미국 특허 번호 6,730,824); 및/또는 카사바 베인 모자이크 바이러스 (CsVMV) (Verdaguer et al., 1996, Plant Molecular Biology 31:1129-1139)로부터 유래된 프로모터 서열을 포함한다.
본원에 개시된 방법에서, 식물에서 유전자의 발현을 지시하는 다수의 프로모터가 사용될 수 있다. 이러한 프로모터는 구성적, 화학적-조절, 유도성, 조직-특이적, 및 종자-우선 프로모터로부터 선택될 수 있다.
구성적 프로모터는 예를 들어 코어 콜리플라워 모자이크 바이러스 35S 프로모터 (Odell et al. (1985) Nature 313:810-812); 벼 액틴 프로모터 (McElroy et al. (1990) Plant Cell 2:163-171); 옥수수 유비퀴틴 프로모터 (미국 특허 번호 5,510,474; 문헌 [Christensen et al. (1989) Plant Mol. Biol. 12:619-632 및 Christensen et al. (1992) Plant Mol. Biol. 18:675-689]); pEMU 프로모터 (Last et al. (1991) Theor. Appl. Genet. 81:581-588); ALS 프로모터 (미국 특허 번호 5,659,026); 옥수수 히스톤 프로모터 (Chaboute et al. Plant Molecular Biology, 8: 179-191 (1987)) 등을 포함한다.
이용가능한 식물 상용성 프로모터의 범위는 조직 특이적 및 유도성 프로모터를 포함한다. 유도성 조절 요소는 유도인자에 반응하여 1종 이상의 DNA 서열 또는 유전자의 전사를 직접 또는 간접적으로 활성화시킬 수 있는 것이다. 유도인자의 부재 하에, DNA 서열 또는 유전자는 전사되지 않을 것이다. 전형적으로, 전사를 활성화시키기 위해 유도성 조절 요소에 특이적으로 결합하는 단백질 인자는 불활성 형태로 존재하고, 이어서 유도인자에 의해 활성 형태로 직접 또는 간접적으로 전환된다. 유도인자는 화학적 작용제, 예컨대 단백질, 대사물, 성장 조절제, 제초제 또는 페놀계 화합물, 또는 열, 추위, 염, 또는 독성 요소에 의해 직접적으로 또는 병원체 또는 질병원, 예컨대 바이러스의 작용을 통해 간접적으로 부가되는 생리학적 스트레스일 수 있다. 전형적으로, 전사를 활성화시키기 위해 유도성 조절 요소에 특이적으로 결합하는 단백질 인자는 불활성 형태로 존재하고, 이어서 유도인자에 의해 활성 형태로 직접 또는 간접적으로 전환된다. 유도인자는 화학적 작용제, 예컨대 단백질, 대사물, 성장 조절제, 제초제 또는 페놀계 화합물, 또는 열, 추위, 염, 또는 독성 요소에 의해 직접적으로 또는 병원체 또는 질병원, 예컨대 바이러스의 작용을 통해 간접적으로 부가되는 생리학적 스트레스일 수 있다. 유도성 조절 요소를 함유하는 식물 세포는 예컨대 분무, 살수, 가열 또는 유사한 방법에 의해 유도인자를 세포 또는 식물에 외부에서 적용함으로써 유도인자에 노출될 수 있다.
임의의 유도성 프로모터가 본 개시내용의 실시양태에 사용될 수 있다. 문헌 [Ward et al. Plant Mol. Biol. 22: 361-366 (1993)]을 참조한다. 예시적인 유도성 프로모터는 엑디손 수용체 프로모터 (미국 특허 번호 6,504,082); 구리에 반응하는 ACE1 시스템으로부터의 프로모터 (Mett et al. PNAS 90: 4567-4571 (1993)); 벤젠술폰아미드 제초제 완화제에 반응하는 옥수수로부터의 In2-1 및 In2-2 유전자 (미국 특허 번호 5,364,780; 문헌 [Hershey et al., Mol. Gen. Genetics 227: 229-237 (1991) 및 Gatz et al., Mol. Gen. Genetics 243: 32-38 (1994)]); Tn10으로부터의 Tet 리프레서 (Gatz et al., Mol. Gen. Genet. 227: 229-237 (1991)); 또는 전사 활성이 글루코코르티코스테로이드 호르몬에 의해 유도되는 스테로이드 호르몬 유전자로부터의 프로모터 (Schena et al., Proc. Natl. Acad. Sci. U.S.A. 88: 10421 (1991) 및 McNellis et al., (1998) Plant J. 14(2):247-257); 출아전 제초제로서 사용되는 소수성 친전자성 화합물에 의해 활성화되는 옥수수 GST 프로모터 (미국 특허 번호 5,965,387 및 국제 특허 출원, 공개 번호 WO 93/001294 참조); 및 살리실산에 의해 활성화되는 담배 PR-1a 프로모터 (문헌 [Ono S, Kusama M, Ogura R, Hiratsuka K., "Evaluation of the Use of the Tobacco PR-1a Promoter to Monitor Defense Gene Expression by the Luciferase Bioluminescence Reporter System," Biosci Biotechnol Biochem. 2011 Sep 23;75(9):1796-800] 참조)를 포함한다. 관심 대상의 다른 화학물질-조절 프로모터는 테트라시클린-유도성 및 테트라시클린-억제성 프로모터를 포함한다 (예를 들어, 문헌 [Gatz et al., (1991) Mol. Gen. Genet. 227:229-237], 및 미국 특허 번호 5,814,618 및 5,789,156 참조).
관심 대상의 다른 조절성 프로모터는 각각 추위 또는 열에 대한 노출에 반응하여 전사가 일어날 수 있는 추위 반응성 조절 요소 또는 열 충격 조절 요소 (Takahashi et al., Plant Physiol. 99:383-390, 1992); 혐기성 조건에 의해 유도가능한 알콜 데히드로게나제 유전자의 프로모터 (Gerlach et al., PNAS USA 79:2981-2985 (1982); Walker et al., PNAS 84(19):6624-6628 (1987)); 및 완두콩 rbcS 유전자 또는 완두콩 psaDb 유전자로부터 유래된 광-유도성 프로모터 (Yamamoto et al. (1997) Plant J. 12(2):255-265); 광-유도성 조절 요소 (Feinbaum et al., Mol. Gen. Genet. 226:449, 1991; Lam and Chua, Science 248:471, 1990; Matsuoka et al. (1993) Proc. Natl. Acad. Sci. USA 90(20):9586-9590; Orozco et al. (1993) Plant Mol. Bio. 23(6): 1129-1138); 식물 호르몬 유도성 조절 요소 (Yamaguchi-Shinozaki et al., Plant Mol. Biol. 15:905, 1990; Kares et al., Plant Mol. Biol. 15:225, 1990) 등을 포함한다. 유도성 조절 요소는 또한 벤젠술폰아미드 제초제 완화제에 반응하는 옥수수 In2-1 또는 In2-2 유전자의 프로모터 (Hershey et al., Mol. Gen. Gene, 227:229-237, 1991; Gatz et al., Mol. Gen. Genet. 243:32-38, 1994), 및 트랜스포손 Tn10의 Tet 리프레서 (Gatz et al., Mol. Gen. Genet. 227:229-237, 1991)일 수 있다. 스트레스 유도성 프로모터는 염/물 스트레스-유도성 프로모터, 예컨대 P5CS (Zang et al. (1997) Plant Sciences 129:81-89); 추위-유도성 프로모터, 예컨대 cor15a (Hajela et al. (1990) Plant Physiol. 93:1246-1252), cor15b (Wilhelm et al. (1993) Plant Mol Biol 23: 1073-1077), wsc120 (Ouellet et al. (1998) FEBS Lett. 423-324-328), ci7 (Kirch et al. (1997) Plant Mol Biol. 33:897-909), ci21A (Schneider et al. (1997) Plant Physiol. 113:335-45); 가뭄-유도성 프로모터, 예컨대 Trg-31 (Chaudhary et al. (1996) Plant Mol. Biol. 30:1247-57), rd29 (Kasuga et al. (1999) Nature Biotechnology 18:287-291); 삼투압 유도성 프로모터, 예컨대 Rab17 (Vilardell et al. (1991) Plant Mol. Biol. 17:985-93) 및 오스모틴 (Raghothama et al. (1993) Plant Mol Biol 23:1117-28); 열 유도성 프로모터, 예컨대 열 충격 단백질 (Barros et al. (1992) Plant Mol. 19:665-75; Marrs et al. (1993) Dev. Genet. 14:27-41), smHSP (Waters et al. (1996) J. Experimental Botany 47:325-338), 및 파슬리 유비퀴틴 프로모터로부터의 열 충격 유도성 요소 (WO 03/102198)를 포함한다. 다른 스트레스-유도성 프로모터는 rip2 (미국 특허 번호 5,332,808 및 미국 공개 번호 2003/0217393) 및 rd29a (Yamaguchi-Shinozaki et al. (1993), Mol. Gen. Genetics 236:331-340)를 포함한다. 아그로박테리움 pMAS 프로모터 (Guevara-Garcia et al. (1993) Plant J. 4(3):495-505) 및 아그로박테리움 ORF13 프로모터 (Hansen et al., (1997) Mol. Gen. Genet. 254(3):337-343)를 비롯한 특정 프로모터는 상처에 의해 유도가능하다.
조직-우선 프로모터는 특정한 식물 조직 내의 증진된 전사 및/또는 발현을 표적화하기 위해 이용될 수 있다. 우선적 발현이 언급되는 경우, 이는 다른 식물 조직에서보다 특정한 식물 조직에서 더 높은 수준으로 발현되는 것을 의미한다. 이들 유형의 프로모터의 예는 종자 우선 발현, 예컨대 파세올린 프로모터 (Bustos et al.1989. The Plant Cell Vol. 1, 839-853) 및 옥수수 글로불린-1 유전자 (Belanger, et al. 1991 Genetics 129:863-972)에 의해 제공되는 것을 포함한다. 쌍자엽 식물의 경우, 종자-우선 프로모터는 콩 β-파세올린, 나핀, β-콘글리시닌, 대두 렉틴, 크루시페린 등을 포함하나, 이에 제한되지는 않는다. 단자엽 식물의 경우, 종자-우선 프로모터는 옥수수 15 kDa 제인, 22 kDa 제인, 27 kDa 제인, γ-제인, 왁시, 슈렁큰 1, 슈렁큰 2, 글로불린 1 등을 포함하나, 이에 제한되지는 않는다. 종자-우선 프로모터는 또한 종자 내의 특정 조직에 우세하게 유전자 발현을 지시하는 프로모터, 예컨대 예를 들어 γ-제인의 내배유-우선 프로모터, 담배로부터의 잠재 프로모터 (Fobert et al. 1994. T-DNA tagging of a seed coat-specific cryptic promoter in tobacco. Plant J. 4: 567-577), 콘으로부터의 P-유전자 프로모터 (Chopra et al. 1996. Alleles of the maize P gene with distinct tissue specificities encode Myb-homologous proteins with C-terminal replacements. Plant Cell 7:1149-1158, Erratum in Plant Cell.1997, 1:109), 콘으로부터의 글로불린-1 프로모터 (Belenger and Kriz.1991. Molecular basis for Allelic Polymorphism of the maize Globulin-1 gene. Genetics 129: 863-972), 및 종피 또는 콘 커넬의 껍질에 대한 발현을 지시하는 프로모터, 예를 들어 과피-특이적 글루타민 신테타제 프로모터 (Muhitch et al.,2002. Isolation of a Promoter Sequence From the Glutamine Synthetase1-2 Gene Capable of Conferring Tissue-Specific Gene Expression in Transgenic Maize. Plant Science 163:865-872)를 포함한다.
유전자 발현 카세트는 5' 리더 서열을 함유할 수 있다. 이러한 리더 서열은 번역을 증진시키는 작용을 할 수 있다. 번역 리더는 관련 기술분야에 공지되어 있고, 예로서 피코르나바이러스 리더, EMCV 리더 (뇌심근염 5' 비코딩 영역) (Elroy-Stein et al. Proc. Nat. Acad. Sci. USA 86:6126-6130 (1989)); 포티바이러스 리더, 예를 들어, TEV 리더 (담배 식각 바이러스) (Carrington and Freed, Journal of Virology, 64: 1590-1597 (1990)), MDMV 리더 (옥수수 위축 모자이크 바이러스) (Allison et al., Virology 154:9-20 (1986)); 인간 이뮤노글로불린 중쇄 결합 단백질 (BiP) (Macejak et al. Nature 353:90-94 (1991)); 알팔파 모자이크 바이러스의 코트 단백질 mRNA의 비번역된 리더 (AMV RNA 4) (Jobling et al. Nature 325:622-625 (1987)); 담배 모자이크 바이러스 리더 (TMV) (Gallie et al. (1989) Molecular Biology of RNA, pages 237-256); 및 옥수수 황백화 얼룩 바이러스 리더 (MCMV) (Lommel et al. Virology 81:382-385 (1991))를 포함한다. 또한 문헌 [Della-Cioppa et al. Plant Physiology 84:965-968 (1987)]을 참조한다.
구축물은 또한 번역 및/또는 mRNA 안정성을 증진시키는 서열, 예컨대 인트론을 함유할 수 있다. 이러한 인트론의 한 예는 아라비돕시스 탈리아나의 히스톤 H3.III 변이체의 유전자 II의 제1 인트론이다. Chaubet et al. Journal of Molecular Biology, 225:569-574 (1992).
특정한 소기관, 특히 색소체, 전분체, 또는 세포질 세망으로 지시되거나 또는 세포의 표면 또는 세포외로 분비되는 이종 뉴클레오티드 서열의 발현 생성물을 갖는 것이 바람직한 경우에, 발현 카세트는 통과 펩티드에 대한 코딩 서열을 추가로 포함할 수 있다. 이러한 통과 펩티드는 관련 기술분야에 널리 공지되어 있으며, 아실 운반체 단백질, RUBISCO의 작은 서브유닛, 식물 EPSP 신타제 및 헬리안투스 안누스(Helianthus annuus)에 대한 통과 펩티드 (Lebrun et al. US 특허 5,510,417 참조), 제아 메이스 브리틀(Brittle)-1 엽록체 통과 펩티드 (Nelson et al. Plant Physiol 117(4): 1235-1252 (1998); Sullivan et al. Plant Cell 3(12):1337-48; Sullivan et al., Planta (1995) 196(3):477-84; Sullivan et al., J. Biol. Chem. (1992) 267(26): 18999-9004) 등을 포함하나, 이에 제한되지는 않는다. 추가로, 키메라 엽록체 통과 펩티드, 예컨대 최적화 통과 펩티드가 관련 기술분야에 널리 공지되어 있다 (미국 특허 번호 5,510,471 참조). 추가의 엽록체 통과 펩티드는 미국 특허 번호 5,717,084; 5,728,925에 이전에 기재된 바 있다. 관련 기술분야의 통상의 기술자는 생성물을 특정한 소기관에서 발현시키는데 이용가능한 많은 옵션을 용이하게 인식할 것이다. 예를 들어, 보리 알파 아밀라제 서열은 종종 세포질 세망에서의 발현을 유도하기 위해 사용된다. Rogers, J. Biol. Chem. 260:3731-3738 (1985).
한 실시양태에서, 폴리뉴클레오티드 공여자 카세트는 트랜스진을 포함한다. 본원의 일부 실시양태는 유전자 발현 카세트를 포함하는 폴리펩티드를 코딩하는 트랜스진을 제공한다. 이러한 트랜스진은 트랜스제닉 식물을 생산하기 위한 임의의 매우 다양한 적용에서 유용할 수 있다. 유전자 발현 카세트를 포함하는 트랜스진의 특정한 예는 본원의 예시적 목적을 위해 제공되고, 형질 유전자, RNAi 유전자 또는 리포터/선택 마커 유전자를 포함하는 유전자 발현을 포함한다.
식물에서의 발현을 위해 유전자를 조작할 때, 유망한 숙주 식물(들)의 코돈 바이어스는, 예를 들어 식물 게놈의 코돈 분포 또는 다양한 식물 유전자의 단백질 코딩 영역에 대한 정보를 찾기 위한 공중 이용가능한 DNA 서열 데이터베이스를 사용하여 결정될 수 있다. 최적화된 (예를 들어, 식물-최적화된) DNA 서열이 종이 상에 설계되거나 또는 인 실리코 설계되면, 실제 DNA 분자는 서열이 설계된 서열에 정확하게 대응하도록 실험실에서 합성될 수 있다. 이러한 합성 핵산 분자(들)은 정확하게 이들이 자연 또는 천연 공급원으로부터 유래된 경우와 같이 클로닝되고 달리 조작될 수 있다.
한 실시양태에서, 발현될 트랜스진이 본원에 개시된다. 유전자 발현 카세트는 리포터/선택 마커 유전자, 형질 유전자 또는 RNAi 유전자를 포함할 수 있다. 선택 마커 유전자, 형질 유전자 및 RNAi 유전자의 예는 하기에 추가로 제공된다. 본원에 개시된 방법은 이들이 트랜스진의 단백질 생성물의 특정 기능 또는 다른 기능에 의존하지 않는 배선 형질전환체를 선택하는 방법을 제공한다는 점에서 유리하다.
해충 또는 질병에 대한 저항성을 부여하는 트랜스진 또는 코딩 서열
(A) 식물 질병 저항성 유전자. 식물 방어는 종종, 식물 내의 질병 저항성 유전자 (R)의 생성물과 병원체 내의 상응하는 비병원성 (Avr) 유전자의 생성물 사이의 특이적 상호작용에 의해 활성화된다. 식물 품종을 클로닝된 저항성 유전자로 형질전환시켜, 특정 병원체 균주에 저항성인 식물을 조작할 수 있다. 이러한 유전자의 예는 클라도스포리움 풀붐(Cladosporium fulvum)에 대한 저항성의 경우, 토마토 Cf-9 유전자 (Jones et al., 1994 Science 266:789); 슈도모나스 시린가에(Pseudomonas syringae) 병원형 토마토에 대한 저항성의 경우, 단백질 키나제를 코딩하는 토마토 Pto 유전자 (Martin et al., 1993 Science 262:1432); 및 슈도모나스 시린가에에 대한 저항성의 경우, 아라비돕시스 RSSP2 유전자 (Mindrinos et al., 1994 Cell 78:1089)를 포함한다.
(B) 바실루스 투린기엔시스(Bacillus thuringiensis) 단백질, 그의 유도체, 또는 이를 모델로 한 합성 폴리펩티드, 예컨대 Bt δ-내독소 유전자의 뉴클레오티드 서열 (Geiser et al., 1986 Gene 48:109), 및 영양 살곤충 (VIP) 유전자 (예를 들어, 문헌 [Estruch et al. (1996) Proc. Natl. Acad. Sci. 93:5389-94] 참조). 더욱이, δ-내독소 유전자를 코딩하는 DNA 분자는 ATCC 수탁 번호 40098, 67136, 31995 및 31998 하에 아메리칸 타입 컬쳐 콜렉션(American Type Culture Collection) (메릴랜드주 록빌)으로부터 구입할 수 있다.
(C) 렉틴, 예컨대 여러 클리비아 미니아타(Clivia miniata) 만노스-결합 렉틴 유전자의 뉴클레오티드 서열 (Van Damme et al., 1994 Plant Molec. Biol. 24:825).
(D) 곤충 해충에 대한 살유충제로서 유용한 비타민 결합 단백질, 예컨대 아비딘 및 아비딘 동족체. 미국 특허 번호 5,659,026을 참조한다.
(E) 효소 억제제, 예를 들어 프로테아제 억제제 또는 아밀라제 억제제. 이러한 유전자의 예는 벼 시스테인 프로테이나제 억제제 (Abe et al., 1987 J. Biol. Chem. 262:16793), 담배 프로테이나제 억제제 I (Huub et al., 1993 Plant Molec. Biol. 21:985), 및 α-아밀라제 억제제 (Sumitani et al., 1993 Biosci. Biotech. Biochem. 57:1243)를 포함한다.
(F) 곤충-특이적 호르몬 또는 페로몬, 예컨대 엑디스테로이드 및 유충 호르몬, 그의 변이체, 그에 기초한 모방체, 또는 그의 길항제 또는 효능제, 예컨대 유충 호르몬의 불활성인자인, 클로닝된 유충 호르몬 에스테라제의 바큘로바이러스 발현 (Hammock et al., 1990 Nature 344:458).
(G) 발현 시에, 침범한 해충의 생리학을 교란시키는 곤충-특이적 펩티드 또는 뉴로펩티드 (J. Biol. Chem. 269:9). 이러한 유전자의 예는 곤충 이뇨 호르몬 수용체 (Regan, 1994), 디플로프테라 푼크타타(Diploptera punctata)에서 확인된 알로스타틴 (Pratt, 1989), 및 곤충-특이적, 마비성 신경독소 (미국 특허 번호 5,266,361)를 포함한다.
(H) 뱀, 말벌 등에 의해 자연에서 생산된 곤충-특이적 독, 예컨대 전갈 곤충독성 펩티드 (Pang, 1992 Gene 116:165).
(I) 모노테르펜, 세스퀴테르펜, 스테로이드, 히드록삼산, 페닐프로파노이드 유도체 또는 살곤충 활성을 갖는 또 다른 비-단백질 분자의 과축적을 일으키는 효소.
(J) 생물학적 활성 분자의 변형 (번역후 변형 포함)에 수반되는 효소; 예를 들어, 천연이든 합성이든 관계없이, 당분해 효소, 단백질분해 효소, 지질분해 효소, 뉴클레아제, 시클라제, 트랜스아미나제, 에스테라제, 히드롤라제, 포스파타제, 키나제, 포스포릴라제, 폴리머라제, 엘라스타제, 키티나제 및 글루카나제. 이러한 유전자의 예는 callas 유전자 (PCT 공개 출원 WO93/02197), 키티나제-코딩 서열 (이는 예를 들어 수탁 번호 3999637 및 67152 하에 ATCC로부터 수득할 수 있음), 담배 구충 키티나제 (Kramer et al., 1993 Insect Molec. Biol. 23:691), 및 파슬리 ubi4-2 폴리유비퀴틴 유전자 (Kawalleck et al., 1993 Plant Molec. Biol. 21:673)를 포함한다.
(K) 신호 전달을 자극하는 분자. 이러한 분자의 예는 녹두 칼모듈린 cDNA 클론에 대한 뉴클레오티드 서열 (Botella et al., 1994 Plant Molec. Biol. 24:757) 및 옥수수 칼모듈린 cDNA 클론의 뉴클레오티드 서열 (Griess et al., 1994 Plant Physiol. 104:1467)을 포함한다.
(L) 소수성 모멘트 펩티드. 미국 특허 번호 5,659,026 및 5,607,914를 참조하며; 후자는 질병 저항성을 부여하는 합성 항미생물 펩티드를 교시한다.
(M) 막 퍼미아제, 채널 형성제 또는 채널 차단제 , 예컨대 트랜스제닉 담배 식물이 슈도모나스 솔라나세아룸(Pseudomonas solanacearum)에 대해 저항성이 되도록 하는 세크로핀-β 용해 펩티드 유사체 (Jaynes et al., 1993 Plant Sci. 89:43).
(N) 바이러스-침습성 단백질 또는 그로부터 유래된 복합 독소. 예를 들어, 형질전환된 식물 세포에스의 바이러스 코트 단백질의 축적은, 코트 단백질 유전자가 유래되는 바이러스 뿐만 아니라 관련 바이러스에 의한 바이러스 감염 및/또는 그에 의해 유발된 질병 발생에 대한 저항성을 부여한다. 코트 단백질-매개 저항성은 알팔파 모자이크 바이러스, 오이 모자이크 바이러스, 담배 줄무늬 바이러스, 감자 바이러스 X, 감자 바이러스 Y, 담배 식각 바이러스, 담배 얼룩무늬 바이러스 및 담배 모자이크 바이러스에 대해 형질전환된 식물에 부여되어 왔다. 예를 들어 문헌 [Beachy et al. (1990) Ann. Rev. Phytopathol. 28:451]을 참조한다.
(O) 곤충-특이적 항체 또는 그로부터 유래된 면역독소. 따라서, 곤충 장에서의 결정적 대사 기능을 표적화하는 항체는 침범된 효소를 불활성화시켜 곤충을 사멸시킬 것이다. 예를 들어, 문헌 [Taylor et al. (1994) Abstract #497, Seventh Int'l. Symposium on Molecular Plant-Microbe Interactions]에는 단일-쇄 항체 단편의 생산을 통한 트랜스제닉 담배에서의 효소적 불활성화가 제시되어 있다.
(P) 바이러스-특이적 항체. 예를 들어, 재조합 항체 유전자를 발현하는 트랜스제닉 식물이 바이러스 공격으로부터 보호된다는 것을 제시하는 문헌 [Tavladoraki et al. (1993) Nature 266:469]을 참조한다.
(Q) 병원체 또는 기생충에 의해 자연에서 생산된 발달-정지 단백질. 따라서, 진균 엔도 α-1,4-D 폴리갈락투로나제는 식물 세포벽 호모-α-1,4-D-갈락투로나제를 가용화시킴으로써 진균 콜로니화 및 식물 영양소 방출을 촉진시킨다 (Lamb et al., 1992) Bio/Technology 10:1436. 콩 엔도폴리갈락투로나제-억제 단백질을 코딩하는 유전자의 클로닝 및 특성화는 문헌 [Toubart et al. (1992 Plant J. 2:367)]에 기재되어 있다.
(R) 식물에 의해 자연에서 생산된 발달-정지 단백질, 예컨대 진균성 질병에 대한 증가된 저항성을 제공하는 보리 리보솜-불활성화 유전자 (Longemann et al., 1992). Bio/Technology 10:3305.
(S) RNA 분자를 사용하여 표적 유전자의 발현을 억제하는 RNA 간섭. 한 예에서 RNA 분자는 부분 또는 완전 이중 가닥이고, 이는 침묵화 반응을 촉발하여 dsRNA를 소형 간섭 RNA로 절단하고, 이어서 이는 상동 mRNA를 파괴하는 표적화 복합체 내로 혼입된다. 예를 들어, US 특허 6,506,559 (Fire et al.); 6,573,099 (Graham et al.)를 참조한다.
제초제에 대한 저항성을 부여하는 유전자
(A) 생장점 또는 분열조직을 억제하는 제초제, 예컨대 이미다잘리논, 술폰아닐리드 또는 술포닐우레아 제초제에 대한 저항성 또는 내성을 코딩하는 유전자. 이 카테고리 내의 예시적인 유전자는 AHAS 효소 (Miki et al., 1990 Theor. Appl. Genet. 80:449)로도 공지된 돌연변이체 ALS 효소 (Lee et al., 1988 EMBOJ. 7:1241)를 코딩한다.
(B) 돌연변이체 EPSP 신타제 및 aroA 유전자에 의해, 또는 유전자, 예컨대 GAT (글리포세이트 아세틸트랜스퍼라제) 또는 GOX (글리포세이트 옥시다제) 및 다른 포스포노 화합물, 예컨대 글루포시네이트 (pat 및 bar 유전자; DSM-2), 및 아릴옥시페녹시프로피온산 및 시클로헥산디온 (ACCase 억제제 코딩 유전자)의 대사 불활성화를 통해 부여된 글리포세이트에 대한 저항성 또는 내성을 코딩하는 1종 이상의 추가의 유전자. 예를 들어, 글리포세이트 저항성을 부여할 수 있는 EPSP의 형태의 뉴클레오티드 서열을 개시하고 있는 미국 특허 번호 4,940,835를 참조한다. 돌연변이체 aroA 유전자를 코딩하는 DNA 분자는 ATCC 수탁 번호 39256 하에 수득할 수 있고, 상기 돌연변이체 유전자의 뉴클레오티드 서열은 미국 특허 번호 4,769,061에 개시되어 있다. 유럽 특허 출원 번호 0 333 033 및 미국 특허 번호 4,975,374에는 L-포스피노트리신과 같은 제초제에 대한 저항성을 부여해주는 글루타민 신테타제 유전자의 뉴클레오티드 서열이 개시되어 있다. 포스피노트리신아세틸-트랜스퍼라제 유전자의 뉴클레오티드 서열은 유럽 출원 번호 0 242 246에 제공된다. 문헌 [De Greef et al. (1989) Bio/Technology 7:61]에는 포스피노트리신 아세틸 트랜스퍼라제 활성을 코딩하는 키메라 bar 유전자를 발현하는 트랜스제닉 식물의 생산이 기재되어 있다. 아릴옥시페녹시프로피온산 및 시클로헥산디온에 대한 저항성을 부여해주는 예시적인 유전자, 예컨대 세톡시딤 및 할옥시포프는 문헌 [Marshall et al. (1992) Theor. Appl. Genet. 83:435]에 기재된 Accl-S1, Accl-S2 및 Accl-S3 유전자이다.
(C) 광합성을 억제하는 제초제, 예컨대 트리아진 (psbA 및 gs+ 유전자) 및 벤조니트릴 (니트릴라제 유전자)에 대한 저항성 또는 내성을 코딩하는 유전자. 문헌 [Przibilla et al. (1991) Plant Cell 3:169]에는 클라미도모나스(Chlamydomonas)를 형질전환시키기 위해 돌연변이체 psbA 유전자를 코딩하는 플라스미드를 사용하는 것이 기재되어 있다. 니트릴라제 유전자에 대한 뉴클레오티드 서열은 미국 특허 번호 4,810,648에 개시되어 있고, 이들 유전자를 함유하는 DNA 분자는 ATCC 수탁 번호 53435, 67441 및 67442 하에 입수가능하다. 글루타티온 S-트랜스퍼라제를 코딩하는 DNA의 클로닝 및 발현은 문헌 [Hayes et al. (1992) Biochem. J. 285:173]에 기재되어 있다.
(D) 파라-히드록시페닐피루베이트 (HPP)를 호모겐티세이트 내로 형질전환시키는 반응을 촉매하는 효소인 히드록시페닐피루베이트 디옥시게나제 (HPPD)에 결합하는 제초제에 대한 저항성 또는 내성을 코딩하는 유전자. 이는 제초제, 예컨대 이속사졸 (EP418175, EP470856, EP487352, EP527036, EP560482, EP682659, 미국 특허 번호 5,424,276), 특히 옥수수에 대한 선택적 제초제인 이속사플루톨, 디케토니트릴 (EP496630, EP496631), 특히 2-시아노-3-시클로프로필-1-(2-SO2CH3-4-CF3 페닐)프로판-1,3-디온 및 2-시아노-3-시클로프로필-1-(2-SO2CH3-4-2,3Cl2페닐)프로판-1,3-디온, 트리케톤 (EP625505, EP625508, 미국 특허 번호 5,506,195), 특히 술코트리온 및 피라졸리네이트를 포함한다. 예를 들어 미국 특허 번호 6,268,549 및 6,245,968 및 미국 특허 출원, 공개 번호 20030066102에 기재된 유전자를 비롯하여, 식물에서 과잉의 HPPD를 생산하는 유전자가 이러한 제초제에 대한 내성 또는 저항성을 제공할 수 있다.
(E) 페녹시 옥신 제초제, 예컨대 2,4-디클로로페녹시아세트산 (2,4-D)에 대한 저항성 또는 내성을 코딩하며, 또한 아릴옥시페녹시프로피오네이트 (AOPP) 제초제에 대한 저항성 또는 내성을 부여할 수 있는 유전자. 이러한 유전자의 예는 미국 특허 번호 7,838,733에 기재된 α-케토글루타레이트-의존성 디옥시게나제 효소 (aad-1) 유전자를 포함한다.
(F) 페녹시 옥신 제초제, 예컨대 2,4-디클로로페녹시아세트산 (2,4-D)에 대한 저항성 또는 내성을 코딩하며, 또한 피리딜옥시 옥신 제초제, 예컨대 플루록시피르 또는 트리클로피르에 대한 저항성 또는 내성을 부여할 수 있는 유전자. 이러한 유전자의 예는 WO 2007/053482 A2에 기재된 α-케토글루타레이트-의존성 디옥시게나제 효소 유전자 (aad-12)를 포함한다.
(G) 디캄바에 대한 저항성 또는 내성을 코딩하는 유전자 (예를 들어 미국 특허 공개 번호 20030135879 참조).
(H) 프로토포르피리노겐 옥시다제 (PPO)를 억제하는 제초제에 대한 저항성 또는 내성을 제공하는 유전자 (미국 특허 번호 5,767,373 참조).
(I) 광화학계 II 반응 중심 (PS II)의 코어 단백질에 결합하는 트리아진 제초제 (예컨대 아트라진) 및 우레아 유도체 (예컨대 디우론) 제초제에 대한 저항성 또는 내성을 제공하는 유전자 (문헌 [Brussian et al., (1989) EMBO J. 1989, 8(4): 1237-1245] 참조).
가치-부가된 형질을 부여하거나 이에 기여하는 유전자
(A) 예를 들어, 옥수수 또는 브라시카를 안티센스 유전자 또는 스테아로일-ACP 데새투라제로 형질전환시켜 식물의 스테아르산 함량을 증가시킴으로써 변형된 지방산 대사 (Knultzon et al., 1992) Proc. Nat. Acad. Sci. USA 89:2624.
(B) 감소된 피테이트 함량
(1) 피타제-코딩 유전자, 예컨대 아스페르길루스 니거(Aspergillus niger) 피타제 유전자 (Van Hartingsveldt et al., 1993 Gene 127:87)의 도입은 피테이트의 붕괴를 증진시켜, 보다 많은 유리 포스페이트를 형질전환된 식물에 부가한다.
(2) 피테이트 함량을 감소시키는 유전자가 도입될 수 있다. 옥수수에서, 이는 예를 들어 낮은 수준의 피트산을 특징으로 하는 옥수수 돌연변이체를 발생시키는 단일 대립 유전자와 연관된 DNA를 클로닝하고, 이어서 재도입시킴으로써 달성될 수 있다 (Raboy et al., 1990 Maydica 35:383).
(C) 예를 들어 식물을 전분의 분지화 패턴을 변경시키는 효소를 코딩하는 유전자로 형질전환시킴으로써 달성된 변형된 탄수화물 조성. 이러한 효소의 예는 스트렙토코쿠스 무쿠스(Streptococcus mucus) 프룩토실트랜스퍼라제 유전자 (Shiroza et al., 1988 J. Bacteriol. 170:810), 바실루스 서브틸리스(Bacillus subtilis) 레반수크라제 유전자 (Steinmetz et al., 1985 Mol. Gen. Genel. 200:220]), 바실루스 리케니포르미스(Bacillus licheniformis) α-아밀라제 (Pen et al., 1992 Bio/Technology 10:292), 토마토 인버타제 유전자 (Elliot et al., 1993), 보리 아밀라제 유전자 (Sogaard et al., 1993 J. Biol. Chem. 268:22480), 및 옥수수 내배유 전분 분지화 효소 II (Fisher et al., 1993 Plant Physiol. 102:10450)를 포함한다.
후속 실시양태에서, 트랜스진은 리포터 유전자를 포함한다. 다양한 실시양태에서, 리포터 유전자는 yfp 유전자, gus 유전자, rfp 유전자, gfp 유전자, 카나마이신 저항성 유전자, aad-1 유전자, aad-12 유전자, pat 유전자 및 글리포세이트 내성 유전자로 이루어진 군으로부터 선택된다. 형질전환된 세포 또는 조직 또는 식물 부분 또는 식물의 선택을 위한 리포터 또는 마커 유전자가 형질전환 벡터에 포함될 수 있다. 선택 마커의 예는 항대사물, 예컨대 제초제 또는 항생제에 대한 저항성을 부여해주는 것, 예를 들어 메토트렉세이트에 대한 저항성을 부여해주는 디히드로폴레이트 리덕타제 (Reiss, Plant Physiol. (Life Sci. Adv.) 13:143-149, 1994; 또한 문헌 [Herrera Estrella et al., Nature 303:209-213, 1983; Meijer et al., Plant Mol. Biol. 16:807-820, 1991] 참조); 아미노글리코시드 네오마이신, 카나마이신 및 파로마이신에 대한 저항성을 부여해주는 네오마이신 포스포트랜스퍼라제 (Herrera-Estrella, EMBO J. 2:987-995, 1983 및 Fraley et al. Proc. Natl. Acad. Sci USA 80:4803 (1983)) 및 히그로마이신에 대한 저항성을 부여해주는 히그로마이신 포스포트랜스퍼라제 (Marsh, Gene 32:481-485, 1984; 또한 문헌 [Waldron et al., Plant Mol. Biol. 5:103-108, 1985; Zhijian et al., Plant Science 108:219-227, 1995] 참조); 세포가 트립토판 대신 인돌을 이용할 수 있게 해주는 trpB; 세포가 히스티딘 대신 히스티놀을 이용할 수 있게 해주는 hisD (Hartman, Proc. Natl. Acad. Sci., USA 85:8047, 1988); 세포가 만노스를 이용할 수 있게 해주는 만노스-6-포스페이트 이소머라제 (WO 94/20627); 오르니틴 데카르복실라제 억제제, 2-(디플루오로메틸)-DL-오르니틴에 대한 저항성을 부여해주는 오르니틴 데카르복실라제 (DFMO; McConlogue, 1987, In: Current Communications in Molecular Biology, Cold Spring Harbor Laboratory ed.); 및 블라스티시딘 S에 대한 저항성을 부여해주는, 아스페르길루스 테레우스(Aspergillus terreus)로부터의 데아미나제 (Tamura, Biosci. Biotechnol. Biochem. 59:2336-2338, 1995)를 포함한다.
추가의 선택 마커는 예를 들어 이미다졸리논 또는 술포닐우레아 저항성을 부여해주는 돌연변이체 아세토락테이트 신타제 (Lee et al., EMBO J. 7:1241-1248, 1988), 아트라진에 대한 저항성을 부여해주는 돌연변이체 psbA (Smeda et al., Plant Physiol. 103:911-917, 1993), 또는 돌연변이체 프로토포르피리노겐 옥시다제 (미국 특허 번호 5, 767, 373 참조), 또는 글루포시네이트와 같은 제초제에 대한 저항성을 부여하는 다른 마커를 포함한다. 적합한 선택 마커 유전자의 예는 클로람페니콜 (Herrera Estrella et al., EMBO J. 2:987-992, 1983); 스트렙토마이신 (Jones et al., Mol. Gen. Genet. 210:86-91, 1987); 스펙티노마이신 (Bretagne-Sagnard et al., Transgenic Res. 5:131-137, 1996); 블레오마이신 (Hille et al., Plant Mol. Biol. 7:171-176, 1990); 술폰아미드 (Guerineau et al., Plant Mol. Biol. 15:127-136, 1990); 브로목시닐 (Stalker et al., Science 242:419-423, 1988); 글리포세이트 (Shaw et al., Science 233:478-481, 1986); 포스피노트리신 (DeBlock et al., EMBO J. 6:2513-2518, 1987) 등에 대한 저항성을 코딩하는 유전자를 포함하나, 이에 제한되지는 않는다.
선택적 유전자의 사용을 위한 한 가지 옵션은 글루포시네이트-저항성 코딩 DNA이고, 한 실시양태에서는 카사바 베인 모자이크 바이러스 프로모터의 제어 하의 포스피노트리신 아세틸 트랜스퍼라제 (pat), 옥수수 최적화 pat 유전자 또는 bar 유전자일 수 있다. 이들 유전자는 비알라포스에 대한 저항성을 부여한다. 문헌 [Wohlleben et al., (1988) Gene 70: 25-37; Gordon-Kamm et al., Plant Cell 2:603; 1990; Uchimiya et al., BioTechnology 11:835, 1993; White et al., Nucl. Acids Res. 18:1062, 1990; Spencer et al., Theor. Appl. Genet. 79:625-631, 1990; 및 Anzai et al., Mol. Gen. Gen. 219:492, 1989]을 참조한다. pat 유전자의 버전은 미국 특허 번호 6,096,947에 기재된 옥수수 최적화 pat 유전자이다.
추가로, 마커를 코딩하는 폴리뉴클레오티드를 함유하는 식물 세포의 확인을 촉진시키는 마커를 이용할 수 있다. 스코어링가능하거나 스크리닝가능한 마커가 유용하며, 여기서 서열의 존재로 인해 측정가능한 생성물이 생산되고, 식물 세포의 파괴 없이 상기 생성물이 생산될 수 있다. 그 예는 β-글루쿠로니다제, 또는 다양한 발색 기질이 공지되어 있는 효소를 코딩하는 uidA 유전자 (GUS) (예를 들어, US 특허 5,268,463 및 5,599,670); 클로람페니콜 아세틸 트랜스퍼라제 (Jefferson et al. The EMBO Journal vol. 6 No. 13 pp. 3901-3907); 및 알칼리성 포스파타제를 포함한다. 바람직한 실시양태에서, 사용된 마커는 베타-카로텐 또는 프로비타민 A이다 (Ye et al., Science 287:303-305- (2000)). 상기 유전자는 벼의 영양을 증진시키는데 사용되어 왔지만, 이러한 경우에 이는 스크리닝가능한 마커로서 대신 이용되고, 관심 유전자에 연결된 유전자의 존재는 제공된 금색에 의해 검출된다. 상기 유전자가 식물에 대한 그의 영양적 기여를 위해 사용되는 상황과는 달리, 제조 목적을 위해서는 보다 적은 양의 단백질도 충분하다. 다른 스크리닝가능한 마커는, 예를 들어 특히, 식물 조직에서 안토시아닌 색소 (적색)의 생산을 조절하는 생성물을 코딩하는 R-유전자좌 유전자 (Dellaporta et al., in Chromosome Structure and Function, Kluwer Academic Publishers, Appels and Gustafson eds., pp. 263-282 (1988)); 플라보노이드 색소의 생합성을 제어하는 유전자, 예컨대 옥수수 C1 유전자 (Kao et al., Plant Cell (1996) 8: 1171-1179; Scheffler et al. Mol. Gen. Genet. (1994) 242:40-48) 및 옥수수 C2 (Wienand et al., Mol. Gen. Genet. (1986) 203:202-207); B 유전자 (Chandler et al., Plant Cell (1989) 1:1175-1183), p1 유전자 (Grotewold et al., Proc. Natl. Acad. Sci USA (1991) 88:4587-4591; Grotewold et al., Cell (1994) 76:543-553; Sidorenko et al., Plant Mol. Biol. (1999)39:11-19); 브론즈 유전자좌 유전자 (Ralston et al., Genetics (1988) 119:185-197; Nash et al., Plant Cell (1990) 2(11): 1039-1049)를 비롯한 안토시아닌/플라보노이드 유전자를 전반적으로 포함한다 (문헌 [Taylor and Briggs, The Plant Cell (1990)2:115-127]에서의 논의 참조).
적합한 마커의 추가의 예는 시안 형광 단백질 (CYP) 유전자 (Bolte et al. (2004) J. Cell Science 117: 943-54 및 Kato et al. (2002) Plant Physiol 129:913-42), 황색 형광 단백질 유전자 (에브로겐(Evrogen)으로부터의 PHIYFP™; 문헌 [Bolte et al. (2004) J. Cell Science 117:943-54] 참조); 존재가 예를 들어 X선 필름, 섬광 계수, 형광 분광광도측정법, 저조도 비디오 카메라, 광자 계수 카메라 또는 멀티웰 발광측정법을 사용하여 검출될 수 있는 루시페라제를 코딩하는 lux 유전자 (Teeri et al. (1989) EMBO J. 8:343); 녹색 형광 단백질 (GFP) 유전자 (Sheen et al., Plant J. (1995) 8(5):777-84); 및 마커 유전자로 형질전환된 식물 세포가 적색이며, 이에 따라 시각적으로 선택가능한 DsRed2 (Dietrich et al. (2002) Biotechniques 2(2):286-293)를 포함한다. 추가의 예는 다양한 발색 기질 (예를 들어, PADAC, 발색 세팔로스포린)이 공지되어 있는 효소를 코딩하는 β-락타마제 유전자 (Sutcliffe, Proc. Nat'l. Acad. Sci. U.S.A. (1978) 75:3737); 발색 카테콜을 전환시킬 수 있는 카테콜 디옥시게나제를 코딩하는 xylE 유전자 (Zukowsky et al., Proc. Nat'l. Acad. Sci. U.S.A. (1983) 80:1101); α-아밀라제 유전자 (Ikuta et al., Biotech. (1990) 8:241); 및 티로신을 DOPA 및 도파퀴논 (이들은 이후에 축합되어 용이하게 검출가능한 화합물 멜라닌을 형성함)으로 산화시킬 수 있는 효소를 코딩하는 티로시나제 유전자 (Katz et al., J. Gen. Microbiol. (1983) 129:2703)를 포함한다. 분명하게는, 이러한 많은 마커가 이용가능하고, 관련 기술분야의 통상의 기술자에게 공지되어 있다.
후속 실시양태에서, 폴리뉴클레오티드 공여자의 분석 도메인은 서열 142 또는 서열 143을 포함한다. 서열 142 또는 서열 143의 변형 및 유도체가 본 개시내용의 범위 내에서 고려된다. 서열 142 또는 서열 143의 이러한 변형 및 유도체는 특정 수준의 서열 동일성을 공유하는 서열을 생성할 수 있다. 다양한 실시양태에서, 서열 142에 대해 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 Bp 변형을 갖는 서열이 본원에 개시된다. 다른 실시양태에서, 서열 143에 대해 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 Bp 변형을 갖는 서열이 본원에 개시된다.
다른 실시양태에서, 범용 폴리뉴클레오티드 공여자 카세트의 플라스미드 도메인은 플라스미드 서열을 포함한다. 플라스미드 또는 벡터는 원핵 벡터, 셔틀 벡터, 곤충 벡터 또는 진핵 벡터로 기재되거나 또는 지칭될 수 있다. 전형적으로, 플라스미드는 복제 기점 및 선택 마커 유전자로 구성된 염색체외 요소, 종종 원형 DNA이다. 때때로, 이. 콜라이에서 기능적인 플라스미드를 갖는 것이 바람직할 수 있다 (예를 들어, DNA 서열 분석, 삽입물의 구축, 핵산의 양 수득). 범용 폴리뉴클레오티드 공여자에 사용된 특정한 플라스미드는 의도된 용도 (예를 들어, 식물, 동물, 박테리아, 진균, 및 원충에서의 발현)와 관련하여 선택될 수 있다. 표준 박테리아 및 동물 발현 플라스미드는 관련 기술분야에 공지되어 있고, 예를 들어 미국 특허 공개 20050064474A1 및 국제 특허 공개 WO 05/084190, WO05/014791 및 WO03/080809에 상세히 기재되어 있다.
다른 실시양태에서, 폴리뉴클레오티드 공여자 카세트의 플라스미드 도메인은 pUC19 플라스미드 서열을 포함한다. pUC19는 작은 이중 가닥 DNA 환이다. 플라스미드는 박테리아 복제가 가능한 고 카피수 복제 기점을 함유하고, 다중 클로닝 부위를 함유한다. 문헌 [Yanisch-Perron, C., Vieira, J. and Messing, J. (1985). Gene. 33, 103-119]을 참조한다. 다른 플라스미드가 공지되어 있고, 관련 기술분야에서 통상적으로 사용된다. 예를 들어, pUC18, pBR322, pBR325, pBR328, pACYC184, pAT153, pUC118 및 pUC119가 관련 기술분야에 통상적으로 공지되어 있는 플라스미드이다.
다른 실시양태에서, 폴리뉴클레오티드 공여자 카세트의 플라스미드 도메인은 고-카피수 복제 기점을 포함한다. 고-카피수 복제 기점의 후속 실시양태는 ColE1 복제 기점을 포함한다. 본원에 사용된 용어 "복제 기점" 또는 "ORI"는 플라스미드의 복제를 위해 필요한 뉴클레오티드의 영역을 포괄하는 것으로 의도된다. 복제 기점의 일부 예: pBR322의 뉴클레오티드 1766-3148; ColE1의 뉴클레오티드 1667-2892; 및 pACC184의 뉴클레오티드 580-1407. 한 실시양태에서, 폴리뉴클레오티드 공여자 카세트의 플라스미드 도메인은 2개 이상의 상이한 복제 기점을 포함할 수 있다.
실시양태에서, 플라스미드 도메인은 선택 마커를 포함한다. 플라스미드 도메인 선택 마커의 후속 실시양태는 카나마이신 선택 마커, 암피실린 선택 마커, 스펙티노마이신 선택 마커, 클로람페니콜 선택 마커 및 리팜피신 선택 마커로 이루어진 군으로부터 선택된다. 적합한 선택 마커는 항생제 저항성 유전자이다. 다른 선택 마커는 점수화가능한 마커 유전자 예를 들어 베타-글루쿠로니다제 (GUS) (Kononov, et al., Plant J. 11, 945-957, 1997)를 포함할 수 있고, 백본 DNA의 존재를 검출하기 위한 수단을 제공할 수 있으나, 이들을 함유하는 세포에 대해 선택하기 위한 수단은 제공하지 않으며, 검정은 조직 파괴성이다. 조건부 치사인 음성 선택 마커 유전자가 또한 백본 DNA에 사용될 수 있다. 다른 조건부 치사 유전자 산물의 대표적인 예는 하기를 포함한다: 티오크산틴을 독성 티오크산틴 모노포스페이트로 전환시키는 이. 콜라이 구아닌 포스포리보실 트랜스퍼라제 (Besnard et al., Mol. Cell. Biol. 7:4139-4141, 1987); 불활성 인산화 화합물 예컨대 미토마이신 포스페이트 및 독소루비신-포스페이트를 독성 탈인산화 화합물로 전환시키는 알칼리성 포스파타제; 5-플루오로시토신을 독성 화합물 5-플루오로우라실로 전환시키는 진균 (예를 들어 푸사리움 옥시스포룸(Fusarium oxysporum)) 또는 박테리아 시토신 데아미나제 (codA) (Mullen, PNAS 89:33, 1992); 파라-N-비스(2-클로로에틸) 아미노벤조일 글루탐산으로부터 글루탐산을 절단하여 독성 벤조산 머스타드를 생성하는 카르복시펩티다제 G2; 및 독소루비신 및 멜팔란의 페녹시아세트아미드 유도체를 독성 화합물로 전환시키는 페니실린-V 아미다제 (일반적으로 문헌 [Vrudhula et al., J. of Med. Chem. 36(7):919-923, 1993; Kern et al., Canc. Immun. Immunother. 31(4):202-206, 1990] 참조); 및 포스포네이트 모노에스테르 히드롤라제, pehA (미국 특허 번호 5,254,801). 그러나, 백본 DNA를 함유하는 세포에 치사성인 독성 생성물을 제공하기 위해 외인성 기질이 첨가되어야 한다. 본 발명은 조건부 치사 유전자 산물을 위해 필요에 따라 배양 배지에 추가의 기질을 첨가하거나 식물 배양 세포를 기질로 외인성으로 처리하는 것을 필요로 하지 않는다.
본 개시내용의 또 다른 실시양태에서, 식물 세포의 게놈 내의 범용 폴리뉴클레오티드 공여자 카세트의 표적화 통합을 위한 방법이 개시된다. 특정 실시양태에서, 적어도 1개의 DNA-결합 도메인 및 적어도 1개의 뉴클레아제 도메인을 포함하는 부위 특이적 DNA 결합 뉴클레아제 (여기서 적어도 1개의 DNA-결합 도메인은 식물 세포의 게놈 내의 표적 부위에 결합함)가 발현된다. 다른 실시양태에서, 식물 세포는 범용 폴리뉴클레오티드 공여자 카세트와 접촉된다. 추가 실시양태에서, 식물 세포의 게놈 내의 표적 부위는 부위 특이적 DNA 결합 뉴클레아제로 절단된다. 또 다른 실시양태에서, 범용 폴리뉴클레오티드 공여자 카세트는 식물 세포의 게놈 내의 표적 부위 내로 통합된다.
한 실시양태에서, 상동성 지정 복구 메카니즘을 통한 식물 세포의 게놈 내의 범용 폴리뉴클레오티드 공여자 카세트의 표적화 통합이 개시된다. 또 다른 실시양태에서, 비-상동 말단 연결 지정 복구 메카니즘을 통한 식물 세포의 게놈 내의 범용 폴리뉴클레오티드 공여자 카세트의 표적화 통합이 개시된다.
본원에 개시된 공여자 분자는 표적화, 상동성-독립적 방법을 통해 세포의 게놈 내로 통합된다. 이러한 표적화 통합을 위해, 게놈은 뉴클레아제, 예를 들어 DNA-결합 도메인 (예를 들어, 아연 핑거 결합 도메인 또는 TAL 이펙터 도메인은 미리 결정된 절단 부위에서 또는 그 부근에서 표적 부위에 결합하도록 조작됨)과 뉴클레아제 도메인 (예를 들어, 절단 도메인 또는 절단 절반-도메인) 사이의 융합체를 사용하여 목적하는 위치 (또는 위치들)에서 절단된다. 특정 실시양태에서, 각각 DNA-결합 도메인 및 절단 절반-도메인을 포함하는 2개의 융합 단백질이 세포 내에서 발현되고, 기능적 절단 도메인을 재구성하고 표적 부위 근처에서 DNA를 절단하는 방식으로 병렬배치된 표적 부위에 결합한다. 한 실시양태에서, 절단은 2개의 DNA-결합 도메인의 표적 부위 사이에서 발생한다. DNA-결합 도메인 중 하나 또는 둘 다가 조작될 수 있다. 또한, 미국 특허 번호 7,888,121; 미국 특허 공개 20050064474 및 국제 특허 출원 공개 WO05/084190, WO05/014791 및 WO 03/080809를 참조한다.
본원에 기재된 뉴클레아제는 폴리펩티드 및/또는 폴리뉴클레오티드로서 도입될 수 있다. 예를 들어, 각각 상기 언급된 폴리펩티드들 중 하나를 코딩하는 서열을 포함하는 2개의 폴리뉴클레오티드가 세포 내로 도입될 수 있고, 폴리펩티드들이 발현되어 각각 그의 표적 서열에 결합하면, 표적 서열에서 또는 그 부근에서 절단이 일어난다. 대안적으로, 융합 폴리펩티드 둘 다를 코딩하는 서열을 포함하는 단일 폴리뉴클레오티드가 세포 내로 도입될 수 있다. 폴리뉴클레오티드는 DNA, RNA, 또는 DNA 및/또는 RNA의 임의의 변형된 형태 또는 유사체일 수 있다.
관심 영역 내에 이중-가닥 파괴의 도입 후, 트랜스진은 본원에 기재된 이중-가닥 공여자 분자의 선형화 후에 비-상동성 의존성 방법 (예를 들어, 비-상동성 말단 연결 (NHEJ))을 통해 표적화 방식으로 관심있는 영역 내로 통합된다. 이중-가닥 공여자는 바람직하게는 뉴클레아제, 예를 들어 이중-가닥 파괴를 게놈에 도입하기 위해 사용되는 1개 이상의 동일하거나 상이한 뉴클레아제를 사용하여 생체 내에서 선형화된다. 세포에서 염색체 및 공여자의 동기화된 절단은 (세포 내로의 도입 전 공여자 분자의 선형화와 비교하여) 공여자 DNA 분해를 제한할 수 있다. 공여자의 선형화를 위해 사용되는 뉴클레아제 표적 부위(들)는 바람직하게는 트랜스진(들) 서열(들)을 파괴시키지 않는다.
트랜스진은 뉴클레아제 오버행의 간단한 라이게이션 ("정방향" 또는 "AB" 배향으로 지정됨)에 의해 또는 엇갈린 방향 ("역방향" 또는 "BA" 배향으로 지정됨)으로, 예상된 방향으로 게놈 내로 통합될 수 있다. 특정 실시양태에서, 트랜스진은 공여자 및 염색체 오버행의 정확한 라이게이션 후에 통합된다. 다른 실시양태에서, BA 또는 AB 배향의 트랜스진의 통합은 몇몇 뉴클레오티드의 결실을 일으킨다.
IV. 범용 공여자 폴리뉴클레오티드의 검출을 위한 검정
다양한 검정이 본 개시내용의 특정 실시양태에 기재된 범용 공여자 폴리뉴클레오티드를 검출하기 위해 이용될 수 있다. 하기 기술이 다양한 상황에서 유용하고, 한 실시양태에서, 식물 세포에서 핵산 분자 및/또는 트랜스진을 코딩하는 폴리펩티드의 존재를 검출하는데 유용하다. 예를 들어, 분자의 존재는 서열의 프라이머 또는 프로브의 사용, 코딩된 단백질을 검출하기 위한 ELISA 검정, 단백질을 검출하기 위한 웨스턴 블롯, 또는 RNA 또는 DNA를 검출하기 위한 노던 또는 서던 블롯을 포함하는 다양한 방식으로 결정될 수 있다. 범용 공여자 폴리뉴클레오티드를 검출하기 위한 효소적 검정이 이용될 수 있다. 또한, 범용 공여자 폴리뉴클레오티드 단백질의 존재를 검출할 수 있는 항체가 관련 기술분야에서 인지되는 절차를 사용하여 생성될 수 있다. 추가의 기술, 예컨대 계내 혼성화, 효소 염색, 및 면역염색이 또한 특정 식물 기관 및 조직에서의 재조합 구축물의 존재 또는 발현을 검출하기 위해 사용될 수 있다. 범용 공여자 폴리뉴클레오티드에 함유된 트랜스진은 식물의 일부 조직에서 또는 일부 발생 단계에서 선택적으로 발현될 수 있거나, 또는 범용 공여자 폴리뉴클레오티드에 함유된 트랜스진은 실질적으로 그의 전체 생명 주기를 따라 실질적으로 모든 식물 조직에서 발현될 수 있다. 그러나, 임의의 조합 발현 방식이 또한 적용가능하다.
서던 분석은, DNA를 제한 엔도뉴클레아제로 절단하고, DNA를 분자량에 의해 분리하기 위해 아가로스 겔 상에서 분획화한 후, 나일론 막으로 전달하는 통상적으로 사용되는 검출 방법이다. 이어서, 이를 32P (또는 다른 프로브 표지)로 방사성 표지된 프로브 단편과 혼성화하고, SDS 용액에서 세척한다.
마찬가지로, 노던 분석은 RNA를 제한 엔도뉴클레아제로 절단하고, RNA를 분자량에 의해 분리하기 위해 아가로스 겔 상에서 분획화한 후, 나일론 막으로 전달하는 유사한 프로토콜을 전개한다. 이어서, 이를 32P (또는 다른 프로브 표지)로 방사성 표지된 프로브 단편과 혼성화하고, SDS 용액에서 세척한다. 관심 조직으로부터 단리된 RNA (예를 들어, mRNA)의 분석은 상대 발현 수준을 나타낼 수 있다. 전형적으로, mRNA가 존재하거나 mRNA 양이 증가하였다면, 상응하는 트랜스진이 발현되고 있는 것으로 가정될 수 있다. 노던 분석, 또는 다른 mRNA 분석 프로토콜이 도입된 트랜스진 또는 천연 유전자의 발현 수준을 결정하기 위해 사용될 수 있다.
웨스턴 분석에서, DNA/RNA를 단리하는 대신에, 관심 단백질을 추출하고, 아크릴아미드 겔 상에 둔다. 이어서, 단백질을 막 상으로 블롯팅하고, 표지 물질과 접촉시킨다. 예를 들어, 문헌 [Hood et al., "Commercial Production of Avidin from Transgenic Maize; Characterization of Transformants, Production, Processing, Extraction and Purification" Molecular Breeding 3:291-306 (1997); Towbin et al., (1979) "Electrophoretic transfer of proteins from polyacrylamide gels to nitrocellulose sheets: procedure and some applications" Proc Natl Acad Sci USA 76(9): 4350-4354; Renart et al. "Transfer of proteins from gels to diazobenzyloxymethyl-paper and detection with antisera: a method for studying antibody specificity and antigen structure" Proc Natl Acad Sci USA 76(7): 3116-3120]을 참조한다.
범용 공여자 폴리뉴클레오티드 또는 그의 절편은 PCR 증폭을 위한 프라이머로서 사용될 수 있다. PCR 증폭의 수행에 있어서, 프라이머와 주형 사이에 어느 정도의 미스매치는 용인될 수 있다. 따라서, 예시된 프라이머의 돌연변이, 결실, 및 삽입 (특히 뉴클레오티드의 5' 말단으로의 부가)은 본 개시내용의 범위에 포함된다. 돌연변이, 삽입 및 결실은 통상의 기술자에게 공지된 방법에 의해 주어진 프라이머에서 생산될 수 있다.
검출 방법의 또 다른 예는 문헌 [Winge (Innov. Pharma. Tech. 00:18-24, 2000)]에 기재된 파이로시퀀싱 기술이다. 이 방법에서, 인접한 게놈 DNA 및 삽입 DNA 접합부에 중첩되는 올리고뉴클레오티드가 설계된다. 올리고뉴클레오티드는 관심 영역으로부터의 단일-가닥 PCR 생성물에 혼성화하고 (삽입된 서열에서 하나의 프라이머 및 플랭킹 게놈 서열에서 하나의 프라이머), DNA 폴리머라제, ATP, 술푸릴라제, 루시퍼라제, 아피라제, 아데노신 5' 포스포술페이트 및 루시페린의 존재 하에 인큐베이션된다. DNTP는 개별적으로 첨가되고, 혼입은 측정되는 광 신호를 생성한다. 광 신호는 성공적인 증폭, 혼성화, 및 단일 또는 다중-염기 연장으로 인한 트랜스진 삽입물/플랭킹 서열의 존재를 나타낸다. (이러한 기술은 최초의 서열분석을 위해 사용되고, 특정 유전자가 공지된 경우에 그의 검출을 위해 사용되지 않는다.)
서열 검출에 사용하기 위한 분자 비콘이 기재된 바 있다. 간략하게, 플랭킹 게놈 및 삽입 DNA 접합부에 중첩되는 FRET 올리고뉴클레오티드 프로브가 설계된다. FRET 프로브 특유의 구조로 인해 이는 형광 및 켄칭 모이어티를 매우 근접한 상태로 유지하는 2차 구조를 함유하게 된다. FRET 프로브 및 PCR 프라이머 (삽입 DNA 서열에서 하나의 프라이머 및 플랭킹 게놈 서열에서 하나의 프라이머)를 열안정성 폴리머라제 및 dNTP의 존재하에 사이클링한다. 성공적인 PCR 증폭 후에, FRET 프로브(들)의 표적 서열에 대한 혼성화는 프로브 2차 구조의 제거 및 형광 및 켄칭 모이어티의 공간 분리를 일으킨다. 형광 신호는 성공적인 증폭 및 혼성화로 인한 플랭킹 게놈/트랜스진 삽입 서열의 존재를 나타낸다.
택맨(TAQMAN)® (라이프 테크놀로지스(Life Technologies), 캘리포니아주 포스터 시티)으로 달리 공지된 가수분해 프로브 검정은 DNA 서열의 존재를 검출 및 정량화하는 방법이다. 간략하게, FRET 올리고뉴클레오티드 프로브는 트랜스진 내에 하나의 올리고, 및 이벤트-특이적 검출을 위해 플랭킹 게놈 서열에 하나를 갖도록 설계된다. FRET 프로브 및 PCR 프라이머 (삽입 DNA 서열에서 하나의 프라이머 및 플랭킹 게놈 서열에서 하나의 프라이머)를 열안정성 폴리머라제 및 dNTP의 존재하에 사이클링한다. FRET 프로브의 혼성화는 FRET 프로브 상의 켄칭 모이어티로부터의 형광 모이어티의 절단 및 방출을 일으킨다. 형광 신호는 성공적인 증폭 및 혼성화로 인한 플랭킹/트랜스진 삽입 서열의 존재를 나타낸다.
ELISA 또는 효소 연결 면역검정은 1971년 이후에 공지되었다. 일반적으로, 완충제 중에 가용화된 항원을 플라스틱 표면 상에 코팅한다. 혈청을 첨가하면, 항체는 고체상 위의 항원에 부착될 수 있다. 이들 항체의 존재 또는 부재는 효소에 접합될 때 입증될 수 있다. 적절한 기질을 첨가하면 정량화할 수 있는 결합된 접합체의 양이 검출될 수 있을 것이다. 통상의 ELISA 검정은 비오티닐화 항-(단백질) 폴리클로날 항체 및 알칼리성 포스파타제 접합체를 사용하는 것이다. 예를 들어, 라카제 수준의 정량적 결정을 위해 사용되는 ELISA는 상업적으로 입수된 폴리클로날 토끼 항체를 이용하는 항체 샌드위치 검정일 수 있다. 항체는 검출을 위해 알칼리성 포스파타제에 접합된다. 또 다른 예에서, 트립신 또는 트립시노겐을 검출하기 위한 ELISA 검정은 비오티닐화 항-트립신 또는 항-트립시노겐 폴리클로날 항체 및 스트렙타비딘-알칼리성 포스파타제 접합체를 사용한다.
본 개시내용의 실시양태는 하기 실시예 추가로 예시된다. 이들 실시예는 단지 예시의 방식으로 제공된다는 것을 이해해야 한다. 상기 실시양태 및 하기 실시예로부터, 관련 기술분야의 통상의 기술자는 본 개시내용의 본질적인 특징을 확인할 수 있고, 그의 취지 및 범위로부터 벗어나지 않으면서 다양한 용법 및 조건에 적합하도록 본 개시내용의 실시양태를 다양하게 변화 및 변형시킬 수 있다. 따라서, 본원에 제시되고 기재된 것들 이외에도, 본 개시내용의 실시양태의 다양한 변형이 상기 설명으로부터 관련 기술분야의 통상의 기술자에게 명백해질 것이다. 이러한 변형은 또한 첨부된 청구범위의 범위 내에 속하는 것으로 의도된다. 다음은 예시의 방식으로 제공되고, 본 발명의 범위를 제한하는 것으로 의도되지 않는다.
실시예
실시예 1: 제아 메이스 내의 게놈 유전자좌에 결합하는 아연 핑거의 설계
표적화가능한 제아 메이스 게놈 유전자좌의 확인된 DNA 서열에 대해 지시된 아연 핑거 단백질을 이전에 기재된 바와 같이 설계하였다. 예를 들어, 문헌 [Urnov et al., (2005) Nature 435:646-551]을 참조한다. 예시적인 표적 서열 및 인식 나선은 표 1 (인식 나선 영역 설계) 및 표 2 (표적 부위)에 제시된다. 표 2에서, ZFP 인식 나선이 접촉하는 표적 부위 내의 뉴클레오티드를 대문자로 나타내고; 비-접촉된 뉴클레오티드를 소문자로 나타내었다. 아연 핑거 뉴클레아제 (ZFN) 표적 부위를 제아 메이스 내의 모든 72개의 선택된 게놈 유전자좌에 대해 설계하였다. 다수의 ZFP 설계를 개발하고, 제아 메이스에서 확인되고 선택된 72개의 상이한 대표적인 게놈 유전자좌 표적 부위를 갖는 효모 프록시 시스템에서 최고 수준의 효율로 결합하는 핑거를 확인하기 위해 시험하였다. 아연 핑거 인식 서열에 최고 수준의 효율로 결합하는 특이적 ZFP 인식 나선 (표 1)을 표적화 및 제아 메이스 게놈 내의 공여자 서열의 통합을 위해 사용하였다.
<표 1> 제아 메이스 선택된 게놈 유전자좌에 대한 아연 핑거 설계 (N/A는 "적용가능하지 않음"을 나타냄).
<표 2> 제아 메이스 선택된 게놈 유전자좌의 표적 부위.
제아 메이스 대표적인 게놈 유전자좌 아연 핑거 설계를 CCHC 구조의 적어도 1개의 핑거를 갖는 단백질을 코딩하는 아연 핑거 발현 벡터 내로 혼입시켰다. 미국 특허 공개 번호 2008/0182332를 참조한다. 특히, 각각의 단백질 내의 마지막 핑거는 인식 나선에 대한 CCHC 백본을 가졌다. 비-정규 아연 핑거-코딩 서열을, 제아 메이스로부터 유래된 opaque-2 핵 국재화 신호 및 4개의 아미노산 링커를 통해 유형 IIS 제한 효소 FokI의 뉴클레아제 도메인 (문헌 [Wah et al., (1998) Proc. Natl. Acad. Sci. USA 95:10564-10569]의 서열의 아미노산 384-579)에 융합시켜 아연-핑거 뉴클레아제 (ZFN)를 형성하였다. 미국 특허 번호 7,888,121을 참조한다. 다양한 기능적 도메인에 대한 아연 핑거를 생체내 사용을 위해 선택하였다. 추정 게놈 표적 부위에 결합하도록 설계, 생산 및 시험된 다수의 ZFN 중에서, 상기 표 2에 기재된 ZFN이 생체내 활성을 갖는 것으로 확인되었고, 식물체내에서 고유 제아 메이스 게놈 폴리뉴클레오티드 표적 부위에 효율적으로 결합하고 이를 절단할 수 있다는 것을 특징으로 하였다.
ZFN 구축물 조립
이전에 기재된 바와 같이 확인된 ZFN 유전자 발현 구축물을 함유하는 플라스미드 벡터를 관련 기술분야에 통상적으로 공지된 기능 및 기술을 사용하여 설계하고 완성하였다 (예를 들어, 문헌 [Ausubel 또는 Maniatis] 참조). 각각의 ZFN-코딩 서열을 아연 핑거 뉴클레아제의 상류에 위치한 opaque-2 핵 국재화 신호 (Maddaloni et al., (1989) Nuc. Acids Res. 17:7532)를 코딩하는 서열에 융합시켰다. 비-정규 아연 핑거-코딩 서열을 유형 IIS 제한 효소 FokI의 뉴클레아제 도메인에 융합시켰다 (amino acids 384-579 of the sequence of Wah et al. (1998) Proc. Natl. Acad. Sci. USA 95:10564-10569). 융합 단백질의 발현은 제아 메이스 유비퀴틴 유전자 (5' 비번역 영역 (UTR) 포함)로부터 강한 구성적 프로모터에 의해 유도되었다 (Toki et al., (1992) Plant Physiology 100;1503-07). 발현 카세트는 또한 제아 메이스 퍼옥시다제 5 유전자 (Per5) 유전자로부터의 3' UTR (전사 종결인자 및 폴리아데닐화 부위 포함)을 포함하였다 (미국 특허 공개 번호 2004/0158887). 토세아 아시그나(Thosea asigna) 바이러스 (Szymczak et al., (2004) Nat Biotechnol. 22:760-760)로부터의 뉴클레오티드 서열을 코딩하는 자가-가수분해 2A를 구축물 내로 클로닝된 2개의 아연 핑거 뉴클레아제 융합 단백질 사이에 부가하였다.
플라스미드 벡터를 인-퓨전(IN-FUSION)™ 어드밴티지 테크놀로지(Advantage Technology) (클론테크(Clontech), 캘리포니아주 마운틴 뷰)를 사용하여 조립하였다. 제한 엔도뉴클레아제는 뉴 잉글랜드 바이오랩스(New England BioLabs) (매사추세츠주 입스위치)로부터 입수하였고, T4 DNA 리가제 (인비트로젠, 캘리포니아주 칼스배드)를 DNA 라이게이션을 위해 사용하였다. 플라스미드 제조는 공급업체의 지침에 따라 뉴클레오스핀(NUCLEOSPIN)® 플라스미드 키트 (머셔레이-나겔 인크.(Macherey-Nagel Inc.), 펜실베니아주 베들레헴)) 또는 플라스미드 미디 키트(Plasmid Midi Kit) (퀴아젠(Qiagen))를 사용하여 수행하였다. DNA 단편을 아가로스 트리스-아세테이트 겔 전기영동 후에 퀴아퀵 겔 익스트랙션 키트(QIAQUICK GEL EXTRACTION KIT)™ (퀴아젠)를 사용하여 단리하였다. 모든 라이게이션 반응의 콜로니를 초기에 미니프렙 DNA의 제한 소화에 의해 스크리닝하였다. 선택된 클론의 플라스미드 DNA를 상업적 서열분석 업체 (유로핀스 MWG 오페론(Eurofins MWG Operon), 앨라배마주 헌츠빌)에 의해 서열분석하였다. 서열 데이터를 조립하고, 시퀀처™ 소프트웨어 (진 코드스 코포레이션(Gene Codes Corp.), 미시건주 앤 아버)를 사용하여 분석하였다.
플라스미드를 구축하고, 제한 효소 소화를 통해 및 DNA 서열분석을 통해 확인하였다.
범용 공여자 구축물 조립
다수의 표적 유전자좌의 신속한 시험을 지지하기 위해, 신규, 가요성 범용 공여자 시스템 서열을 설계하고, 구축하였다. 범용 공여자 폴리뉴클레오티드 서열은 고처리량 벡터 구축 방법론 및 분석과 상용성이었다. 범용 공여자 시스템은 적어도 3개의 모듈 도메인으로 구성되었다: 비-가변 ZFN 결합 도메인, 분석 및 사용자 규정 특징 도메인, 및 벡터 스케일 업을 위한 단순 플라스미드 백본. 비-가변 범용 공여자 폴리뉴클레오티드 서열은 모든 공여자에 공통적이었고, 모든 제아 메이스 표적 부위에 걸쳐 사용될 수 있는 유한 집합의 검정의 설계를 허용하며, 따라서 표적화 평가에서의 균일성을 제공하고 분석 사이클 시간을 감소시킨다. 이들 도메인의 모듈 특성은 고처리량 공여자 조립을 허용하였다. 추가로, 범용 공여자 폴리뉴클레오티드 서열은 하류 분석을 단순화하고 결과의 해석을 증진시키는 것을 목표로 하는 다른 고유 특징을 갖는다. 이는 진단적으로 예측된 크기로의 PCR 생성물의 소화를 가능하게 하는 비대칭 제한 부위 서열을 함유하였다. PCR 증폭에서 문제가 될 것으로 예상된 2차 구조를 포함하는 서열을 제거하였다. 범용 공여자 폴리뉴클레오티드 서열은 크기가 작았다 (3.0 Kb 미만). 최종적으로, 범용 공여자 폴리뉴클레오티드 서열은 대량의 시험 DNA가 시기적절한 방식으로 벌크화되도록 하는 고 카피 pUC19 백본 상에 구축하였다.
한 실시양태로서, 범용 폴리뉴클레오티드 공여자 카세트 서열을 포함하는 플라스미드의 예는 서열 132 및 도 1로서 제공된다. 추가의 실시양태에서, 폴리뉴클레오티드 공여자 카세트 서열은 pDAB111846, 서열 133, 도 2; pDAB117415, 서열 134, 도 3; pDAB117416, 서열 135, 도 4; pDAB117417, 서열 136, 도 5; pDAB117419, 서열 137, 도 6; pDAB117434 서열 138, 도 7; pDAB117418, 서열 139, 도 8; pDAB117420, 서열 140, 도 9; 및 pDAB117421, 서열 141, 도 10으로서 제공된다. 또 다른 실시양태에서, 기능적 발현 코딩 서열 또는 무기능 (프로모터가 없는) 발현 코딩 서열을 갖는 범용 공여자 폴리뉴클레오티드 서열을 포함하는 추가의 서열이 구축될 수 있다. 범용 공여자 시스템을 구성하는 다양한 도메인 (비-가변 ZFN 결합 도메인, 분석 및 사용자 규정 특징 도메인, 및 단순 플라스미드 백본)은 표 3에서 상기 기재된 바와 같은 구축물에 대해 주석 처리된다.
<표 3> 비-가변 ZFN 결합 도메인, 분석 및 사용자 규정 특징 도메인, 및 플라스미드 백본을 확인하기 위한 범용 공여자 시스템 벡터의 주석.
또 다른 실시양태에서, 범용 공여자 폴리뉴클레오티드 서열은 플라스미드로서 전달된 작은 2-3 Kb 모듈 공여자 시스템이다. 이는, 제한 부위 및 프라이머 설계를 위한 DNA 서열 (프라이머는 임의의 계산된 2차 구조보다 10℃ 더 높은 Tm으로 설계됨) 또는 코딩 서열 및 단순 플라스미드 백본을 보유하는, "DNA X" 또는 "UZI 서열" 또는 "분석 도메인" (서열 142 및 서열 143)으로 지칭되는 짧은 100-150 bp 주형 영역인, 임의의 수의 ZFN 결합 부위를 포함하는 최소 공여자이다 (도 11). 한 실시양태에서, 분석 도메인은, 40 내지 60%의 구아닌 및 시토신 염기 쌍 백분율을 함유하고; 9 Bp 초과의 반복 서열 (예를 들어, 5'-gtatttcatgtatttcat-3')을 함유하지 않으며; 9 Bp초과의 일련의 동일한 염기 쌍을 함유하지 않도록 설계되고; 문헌 [Markham, N. R. & Zuker, M. (2008) UNAFold: software for nucleic acid folding and hybridization. In Keith, J. M., editor, Bioinformatics, Volume II. Structure, Function and Applications, number 453 in Methods in Molecular Biology, chapter 1, pages 3-31. Humana Press, Totowa, NJ. ISBN 978-1-60327-428-9]에서 계산된 바와 같이 자유 에너지가 -18 kcal/mol 미만인 2차 구조가 없다. 표 4를 참조한다. 전체 플라스미드는 적절한 ZFN 결합 부위에서 DNA 이중 가닥 파괴 후에 NHEJ를 통해 삽입되고; ZFN 결합 부위는 탠덤 혼입될 수 있다. 범용 공여자 폴리뉴클레오티드 서열의 이러한 실시양태는 표적 부위 및 ZFN의 신속한 스크리닝에 가장 적합하고, 증폭시키기 어려운 서열은 공여자에서 최소화된다.
<표 4> ΔG 자유 에너지, 동일한 염기 쌍의 9 Bp 진행의 수, 9 Bp 초과의 반복 서열의 수, 및 구아닌 / 시토신 백분율에 대한 분석 도메인 조성물의 분석.
추가 실시양태에서, 범용 공여자 폴리뉴클레오티드 서열은 적어도 4개의 모듈로 구성되고, 부분 ZFN 결합 부위, 상동성 아암, 대략 100 bp 분석 조각 또는 코딩 서열을 갖는 DNA X를 보유한다. 범용 공여자 폴리뉴클레오티드 서열의 이러한 실시양태는 여러 ZFN을 사용하여 다양한 폴리뉴클레오티드 표적 부위에서의 NHEJ 매개 유전자 삽입을 조사하는데 적합하다. (도 12).
범용 공여자 폴리뉴클레오티드 서열은 2가지 방식의 표적화 공여자 삽입 (NHEJ/HDR)에서 규정된 DNA 결합 도메인을 갖는 모든 표적화 분자와 함께 사용될 수 있다. 이에 따라, 범용 공여자 폴리뉴클레오티드 서열이 적절한 ZFN 발현 구축물과 공동-전달되는 경우에, 공여자 벡터 및 옥수수 게놈은 둘 다 특정한 ZFN의 결합에 의해 지시된 1개의 특이적 위치에서 절단된다. 선형화되면, 공여자는 NHEJ 또는 HDR에 의해 게놈 내로 혼입될 수 있다. 이어서, 벡터 설계에서의 다양한 분석 고려사항을 이용하여 표적화 통합의 효율적 전달을 최대화하는 아연 핑거를 결정할 수 있다. (도 13).
실시예 2: 제아 메이스 형질전환 절차
제아 메이스 c.v. Hi-II 원형질체로의 전달 전에, 각각의 ZFN 구축물에 대한 플라스미드 DNA를 공급업체의 지침에 따라 퓨어 일드 플라스미드 맥시프렙 시스템(PURE YIELD PLASMID MAXIPREP SYSTEM)® (프로메가 코포레이션(Promega Corporation), 위스콘신주 매디슨) 또는 플라스미드 맥시 키트(PLASMID MAXI KIT)® (퀴아젠, 캘리포니아주 발렌시아)를 사용하여 이. 콜라이의 배양물로부터 제조하였다.
원형질체 단리
제아 메이스 c.v. Hi-II 현탁 세포를 3.5일 유지 스케줄로 유지하고, 4 mL 충전 세포 부피 (PCV)의 세포를 수집하고, 효소 용액 (0.6% 펙토리아제(PECTOLYASE)™, 6% 셀룰라제(CELLULASE)™ ("오노주카(Onozuka)" R10; 야쿠르트 파마슈티칼스(Yakult Pharmaceuticals), 일본), 4 mM MES (pH 5.7), 0.6 M 만니톨, 15 mM MgCl2) 20 mL를 함유하는 50 mL 멸균 원추형 튜브 (피셔 사이언티픽(Fisher Scientific))로 옮겼다. 배양물을 마개를 막고, 파라필름(PARAFILM)™으로 감싸고, 원형질체가 방출될 때까지 실온에서 16-18시간 동안 인큐베이션하기 위해 10으로 설정된 속도로 플랫폼 로커 (써모 사이언티픽(Thermo Scientific), 배리 믹스 플랫폼 로커(Vari Mix platform Rocker))에 두었다. 인큐베이션 후에, 세포를 소화의 품질에 대해 현미경으로 평가하였다. 소화된 세포를 100 μm 세포 스트레이너를 통해 여과하고, 10 mL W5 배지 [2mM MES (pH5.7), 205 mM NaCl, 167 mM CaCl2, 6.7mM KCl]로 세정하고, 이어서 70 μm 및 40 μm 세포 스트레이너를 통해 여과하였다. 100 μm 및 40 μm 스트레이너를 10 mL W5 배지로 세정하였다. 여과된 원형질체를 세정된 배지와 함께 50 ml 원심분리 튜브에 수집하였고, 최종 부피는 대략 40 mL였다. 이어서, "헤비 그래디언트(Heavy Gradient) 용액" [500 mM 수크로스, 1mM CaCl2, 5mM MES (pH6.0)] 8 mL를 원형질체/효소 용액의 하부에 천천히 첨가하고, 300-350 x g로 15분 동안 스윙 암 버킷 로터를 사용한 원심분리로 원심분리하였다. 원심분리에 후에, 원형질체 밴드 약 7-8 mL를 제거하고, W5 25 mL로 세척하고, 180-200 x g로 15분 동안 원심분리하였다. 이어서, 원형질체를 MMG 용액 [4 mM MES (pH 5.7), 0.6 M 만니톨, 15 mM MgCl2] 10 mL 중에 재현탁시켰다. 원형질체를 혈구계 또는 유동 세포측정기를 사용하여 계수하고, MMG를 사용하여 ml당 1.67백만개로 희석하였다.
PEG를 사용한 제아 메이스 c.v. Hi-II 현탁 배양물 유래 원형질체의 형질전환
대략 0.5백만개의 원형질체 (MMG 용액 중 300 μL)를 2 mL 튜브로 옮기고, DNA 40 μL와 혼합하고, 실온에서 5-10분 동안 인큐베이션하였다. 그 다음, 새로 제조한 PEG 용액 (36% PEG 4000, 0.3 M 만니톨, 0.4M CaCl2) 300 μL를 첨가하고, 혼합물을 반전에 의해 주기적으로 혼합하면서 15-20분 동안 실온에서 인큐베이션하였다. 인큐베이션 후, W5 세척액 1 mL를 천천히 첨가하고, 세포를 부드럽게 혼합하고, 원형질체를 15분 동안 180-200 x g로 원심분리에 의해 펠릿화하였다. 펠릿을 WI 배지 [4mM MES (pH 5.7), 0.6 M 만니톨, 20 mM KCl] 1 ml 중에 재현탁시키고, 튜브를 알루미늄 호일로 감싸고, 약 16시간 동안 밤새 실온에서 인큐베이션하였다.
ZFN 및 공여자의 형질전환
각각의 선택된 게놈 유전자좌에 대해, 제아 메이스 원형질체를 yfp 유전자 발현 대조군, ZFN 단독, 공여자 단독, 및 ZFN 및 공여자의 1:10 비 (중량 기준)의 혼합물로 형질감염시켰다. 0.5백만개의 원형질체의 형질감염을 위한 DNA의 총량은 80 μg이었다. 모든 처리는 3 또는 6회 반복하여 수행하였다. 사용된 yfp 유전자 발현 대조군은 제아 메이스 유비퀴틴 1 프로모터 - 황색 형광 단백질 코딩 서열 - 제아 메이스 Per5 3'UTR 및 벼 액틴1 프로모터 - pat 코딩 서열 - 제아 메이스 리파제 3'UTR 유전자 발현 카세트를 함유하는 pDAB8393 (도 14)이었다. 전형적인 표적화 실험에서, ZFN 단독 4 μg을, 또는 이를 공여자 36 μg과 함께 공동-형질감염시키고, yfp 리포터 유전자 구축물 40 μg을 각각의 처리에 첨가하였다. 충전제로서 일정한 양의 yfp 유전자 발현 플라스미드의 포함은 다수의 유전자좌에 걸친 형질감염 품질의 평가 및 반복 처리를 가능하게 한다. 추가로, 일정한 양의 yfp 유전자 발현 플라스미드의 사용은 공여자 삽입의 신속 표적화 분석에서 임의의 기술적 문제의 빠른 트러블 슈팅을 가능하게 한다.
실시예 3: 아연 핑거 뉴클레아제를 통한 제아 메이스에서의 게놈 유전자좌의 절단
ZFN 형질감염된 제아 메이스 c.v. Hi-II 원형질체를 형질감염 24시간 후에 2 mL 에펜도르프(EPPENDORF)™ 튜브에서 1600 rpm으로 원심분리하여 수확하고, 상청액을 제거하였다. 게놈 DNA를 퀴아젠 플랜트 DNA 익스트랙션 키트™ (퀴아젠, 캘리포니아주 발렌시아)를 사용하여 원형질체 펠릿으로부터 추출하였다. 단리된 DNA를 물 50 μL 중에 재현탁시키고, 농도를 나노드롭(NANODROP)® (인비트로젠, 뉴욕주 그랜드 아일랜드)에 의해 결정하였다. DNA의 정체를 0.8% 아가로스 겔 전기영동 상에 샘플을 진행시킴으로써 추정하였다. 서열분석 (일루미나, 인크.(Illumina, Inc.), 캘리포니아주 샌디에고)을 위한 앰플리콘을 생성하기 위한 PCR 증폭을 위해 모든 샘플을 정규화하였다 (20-25 ng/μL). 처리 샘플 및 대조군 샘플로부터의 각각의 시험 ZFN 인식 서열을 포함하는 영역을 증폭시키기 위한 바코딩된 PCR 프라이머를 IDT (아이오와주 코랄빌, HPLC 정제됨)로부터 설계하고 구입하였다. 최적 증폭 조건을 23.5 μL 반응물 중 0.2 μM 적절한 바코딩된 프라이머, 아큐프라임 PFX 슈퍼믹스(ACCUPRIME PFX SUPERMIX)™ (인비트로젠, 캘리포니아주 칼스배드) 및 주형 게놈 DNA 100 ng을 사용하여 구배 PCR에 의해 확인하였다. 사이클링 파라미터는 95℃에서의 초기 변성 (5분), 이어서 변성 (95℃, 15초), 어닐링 (55-72℃, 30초), 연장 (68℃, 1분)의 35회 사이클, 및 최종 연장 (68℃, 7분)이었다. 증폭 생성물을 3.5% TAE 아가로스 겔 상에서 분석하고, 각각의 프라이머 조합에 적절한 어닐링 온도를 결정하고, 이를 사용하여 상기 기재된 바와 같은 대조군 및 ZFN 처리된 샘플로부터 앰플리콘을 증폭시켰다. 모든 앰플리콘을 3.5% 아가로스 겔 상에서 정제하고, 물 중에서 용리시키고, 농도를 나노드롭™에 의해 결정하였다. 차세대 서열분석을 위해, ZFN 처리된 및 상응하는 옥수수 원형질체 대조군으로부터의 PCR 앰플리콘 대략 100 ng을 함께 모으고, 일루미나 차세대 서열분석 (NGS)을 사용하여 서열분석하였다.
각각의 제아 메이스 선택된 게놈 유전자좌에서의 적절한 ZFN의 절단 활성을 검정하였다. ZFN 절단 부위를 포함하는 짧은 앰플리콘을 게놈 DNA로부터 증폭시키고, 일루미나 NGS에 적용하였다 (ZFN 처리된 및 대조군 원형질체로부터). ZFN 유도된 절단 또는 DNA 이중 가닥 파괴를 절단 부위에서의 뉴클레오티드의 삽입 또는 결실 (Indel)에 의한 세포 NHEJ 복구 경로에 의해 해결하였으며, 따라서 절단 부위에서의 Indel의 존재는 ZFN 활성의 척도이며, 이를 NGS에 의해 결정하였다. 표적 특이적 ZFN의 절단 활성을 NGS 분석 소프트웨어 (특허 공개 2012-0173,153, DNA 서열의 데이터 분석)를 사용하여 1백만개의 고품질 서열당 Indel을 갖는 서열의 수로 추정하였다 (도 15). 대조군에 비해 5-100배 범위의 활성이 제아 메이스 선택된 게놈 유전자좌 표적에 대해 관찰되었고, 각각의 ZFN 절단 부위에서의 Indel의 다양한 발자국을 나타낸 서열 정렬에 의해 추가로 확인하였다. 이러한 데이터는 제아 메이스 선택된 게놈 유전자좌가 ZFN에 의해 절단될 수 있다는 것을 시사한다. 각각의 표적에서의 차등 활성은 그의 염색질 상태 및 절단에 대한 순종성 뿐만 아니라 각각의 ZFN의 발현의 효율을 반영한다.
실시예 4: 폴리뉴클레오티드 공여자의 통합의 신속 표적화 분석
아연 핑거 뉴클레아제를 통한 제아 메이스에서의 게놈 유전자좌 내의 서열
비-상동 말단 연결 (NHEJ) 매개 공여자 삽입을 통한 제아 메이스 선택된 게놈 유전자좌 표적 내의 범용 공여자 폴리뉴클레오티드 서열의 표적화의 확인을 반-처리량 원형질체 기반 신속 표적화 분석 방법을 사용하여 수행하였다. 각각의 제아 메이스 선택된 게놈 유전자좌 표적에 대해, 3 내지 6개의 ZFN 설계를 시험하고, 표적화를 차세대 서열분석 방법 (도 15)에 의한 ZFN 매개 절단의 측정 및 접합 인-아웃 PCR (도 16)에 의한 공여자 삽입의 측정에 의해 평가하였다. 검정 둘 다에서 양성인 제아 메이스 선택된 게놈 유전자좌를 표적화가능한 유전자좌로서 확인하였다.
ZFN 공여자 삽입 신속 표적화 분석
제아 메이스 선택된 게놈 유전자좌 표적이 공여자 삽입을 위해 표적화될 수 있는지를 결정하기 위해, ZFN 구축물 및 범용 공여자 폴리뉴클레오티드 구축물을 옥수수 원형질체로 공동-전달하고, 이를 24시간 동안 인큐베이션한 후, 분석을 위해 게놈 DNA를 추출하였다. 발현된 ZFN이 제아 메이스 선택된 게놈 유전자좌 표적 및 공여자 둘 다에서 표적 결합 부위를 컷팅할 수 있었던 경우에, 선형화된 공여자는 비-상동 말단 연결 (NHEJ) 경로를 통해 옥수수 게놈 내의 절단된 표적 부위 내로 삽입되었을 것이다. 제아 메이스 선택된 게놈 유전자좌 표적에서의 표적화된 통합의 확인을 "아웃" 프라이머가 천연 게놈 유전자좌에서의 서열을 인식하고 "인" 프라이머가 공여자 DNA 내의 서열에 결합하는 "인-아웃" PCR 전략에 기초하여 수행하였다. 공여자 DNA가 제아 메이스 선택된 게놈 유전자좌 표적에 삽압된 경우에만 PCR 검정이 예상된 크기의 증폭 생성물을 생산하는 방식으로 프라이머를 설계하였다. 인-아웃 PCR 검정을 삽입 접합부의 5'- 및 3'-말단 둘 다에서 수행하였다. 통합된 폴리뉴클레오티드 공여자 서열의 분석에 사용된 프라이머를 표 5에 제공하였다.
네스티드 "인-아웃" PCR을 사용한 표적 유전자좌에서의 ZFN 공여자 삽입
모든 PCR 증폭은 타카라(TAKARA) EX TAQ HS™ 키트 (클론테크(Clonetech), 캘리포니아주 마운틴 뷰)를 사용하여 수행하였다. 제1 인-아웃 PCR을 1X 타카라 EX TAQ HS™ 완충제, 0.2 mM dNTP, 0.2 μM "아웃" 프라이머 (표 5), 0.05 μM "인" 프라이머 (상기 기재된 범용 공여자 카세트로부터 설계), 0.75 단위의 타카라 EX TAQ HS™ 폴리머라제 및 10 ng 추출된 옥수수 원형질체 DNA를 함유하는 20 μL 최종 반응 부피로 수행하였다. 이어서, 2분 동안 94℃, 12초 동안 98℃ 및 2분 동안 68℃의 20 사이클, 이어서 10분 동안 72℃ 및 4℃에서 유지로 이루어진 PCR 프로그램을 사용하여 반응을 수행하였다. 최종 PCR 생성물을 시각화를 위해 1KB 플러스 DNA 래더(1KB PLUS DNA LADDER)™ (라이프 테크놀로지스(Life Technologies), 뉴욕주 그랜드 아일랜드)와 함께 아가로스 겔 상에서 진행시켰다.
네스티드 인-아웃 PCR을 1X 타카라 EX TAQ HS™ 완충제, 0.2 mM dNTP, 0.2 μM "아웃" 프라이머 (표 5), 0.1 μM "인" 프라이머 (상기 기재된 범용 공여자 카세트로부터 설계, 표 6), 0.75 단위의 타카라 EX TAQ HS™ 폴리머라제 및 1 μL의 제1 PCR 생성물을 함유하는 20 μL 최종 반응 부피로 수행하였다. 이어서, 2분 동안 94℃, 12초 동안 98℃, 30초 동안 66℃ 및 45초 동안 68℃의 31 사이클, 이어서 10분 동안 72℃ 및 4℃에서 유지로 이루어진 PCR 프로그램을 사용하여 반응을 수행하였다. 최종 PCR 생성물을 시각화를 위해 1KB 플러스 DNA 래더™ (라이프 테크놀로지스, 뉴욕주 그랜드 아일랜드)와 함께 아가로스 겔 상에서 진행시켰다.
<표 5> 최적 게놈 유전자좌의 네스티드 인-아웃 PCR 분석을 위한 모든 "아웃" 프라이머의 목록.
<표 6> 최적 게놈 유전자좌의 네스티드 인-아웃 PCR 분석을 위한 모든 "인" 프라이머의 목록.
<표 7> ZFN 절단 활성을 위한 프라이머.
원형질체 표적화 시스템에서의 인-아웃 PCR 검정의 전개는, 대량의 플라스미드 DNA가 형질감염에 사용되며 대량의 플라스미드 DNA가 원형질체 표적화 시스템에 남고 세포 게놈 DNA 함께 후속적으로 추출되기 때문에 특히 도전과제가 되어 왔다. 나머지 플라스미드 DNA는 게놈 DNA의 상대 농도를 희석시키고 검출의 전반적 감수성을 감소시킬 수 있으며, 또한 비-특이적인 이상 PCR 반응의 중요한 원인이 될 수 있다. ZFN 유도된 NHEJ-기반 공여자 삽입은 전형적으로 정방향 또는 역방향 배향으로 일어난다. 정방향 배향 삽입에 대한 DNA의 인-아웃 PCR 분석은, 아마도 표적 내의 ZFN 결합 부위 주위의 상동성의 공유 영역, 및 증폭 과정 동안 비통합 공여자 DNA의 프라이밍 및 연장을 일으킬 수 있었던 공여자로 인해 종종 가양성 밴드를 나타내었다. 가양성은 역방향 배향 삽입 생성물에 대해 프로빙하는 분석에서는 나타나지 않았으며, 따라서 모든 표적화 공여자 통합 분석을 신속 표적화 분석에서 역방향 공여자 삽입을 조사하도록 수행하였다. 특이성을 추가로 증가시키고 배경을 감소시키기 위해, 네스티드 PCR 전략을 또한 이용하였다. 네스티드 PCR 전략은 제1 PCR 반응의 제1 증폭 생성물 내의 더 짧은 영역을 증폭시키는 제2 PCR 증폭 반응을 사용하였다. 비대칭 양의 "인" 및 "아웃" 프라이머의 사용은 선택된 게놈 유전자좌에서의 신속 표적화 분석에 대하여 접합 PCR을 추가로 최적화하였다.
인-아웃 PCR 분석 결과를 아가로스 겔 상에서 시각화하였다. 모든 제아 메이스 선택된 게놈 유전자좌에 대해, "ZFN + 공여자 처리"는 5' 및 3' 말단에서 거의 예상된 크기의 밴드를 생산하였다. 대조 ZFN 또는 공여자 단독 처리는 PCR에서 음성이었으며, 이는 상기 방법이 표적 부위에서의 공여자 통합에 대해 특이적으로 스코어링하였다는 것을 시사한다. 모든 처리는 3 내지 6회 반복하여 수행하였고, 다수의 반복 (양쪽 말단에서 ≥ 2)에서 예상되는 PCR 생성물의 존재를 사용하여 표적화를 확인하였다. NHEJ를 통한 공여자 삽입은 표적 및/또는 공여자 ZFN 부위에서 선형화된 말단의 프로세싱으로 인해 생성되는 보다 낮은 강도의 부산물을 종종 생산한다. 추가로, 일부 ZFN은 일관되게 높은 수준의 공여자 통합을 생산하고 일부 ZFN은 보다 덜 일관된 수준의 공여자 통합을 생산하며 다른 ZFN은 어떠한 통합도 일으키지 않으면서, 다양한 ZFN가 다양한 수준의 표적화 통합에 대한 효율을 일으켰음이 관찰되었다. 전체적으로, 시험된 각각의 제아 메이스 선택된 게놈 유전자좌 표적에 대해, 1종 이상의 ZFN에 의한 제아 메이스 대표적인 게놈 유전자좌 표적 내에서의 표적화 통합이 나타났으며, 이로써 각각의 이들 유전자좌가 표적화가능하였음이 확인된다. 게다가, 각각의 제아 메이스 선택된 게놈 유전자좌 표적은 정밀 유전자 형질전환에 적합하다. 이들 제아 메이스 선택된 게놈 유전자좌 표적의 확인을 다수회 반복하였고, 매번 유사한 결과가 얻어졌으며, 이로써 플라스미드 설계 및 구축물, 원형질체 형질전환, 샘플 프로세싱 및 샘플 분석을 포함하는 확인 방법의 재현성이 확인된다.
결론
공여자 플라스미드, 및 제아 메이스 선택된 게놈 유전자좌 표적을 특이적으로 절단하도록 설계된 1개의 ZFN을 제아 메이스 c.v. Hi-II 원형질체 내로 형질감염시키고, 세포를 24시간 후에 수확하였다. 인-아웃 접합 PCR에 의한 대조군, ZFN 처리된 및 ZFN와 공여자 처리된 원형질체로부터 단리된 게놈 DNA의 분석은 ZFN 에 의한 게놈 DNA 절단의 결과로서 범용 공여자 폴리뉴클레오티드의 표적화 삽입을 제시하였다 (표 8). 이들 연구는, 범용 공여자 폴리뉴클레오티드 시스템이 내인성 부위에서의 표적화를 평가하고 후보 ZFN을 스크리닝하는데 사용될 수 있다는 것을 제시한다. 최종적으로, 원형질체 기반 신속 표적화 분석 및 신규 범용 공여자 폴리뉴클레오티드 서열 시스템은 식물에서의 정밀 게놈 조작 노력을 위해 게놈 표적 및 ZFN을 스크리닝하기 위한 개선된 시스템을 제공한다. 상기 방법은 DNA 이중 또는 단일 가닥 파괴를 도입하는 임의의 뉴클레아제를 사용한 임의의 관심 시스템의 게놈 표적에서의 부위 특이적 절단 및 공여자 삽입을 평가하기 위해 확장될 수 있다.
<표 8> 제아 메이스 선택된 게놈 유전자좌 표적 내의 범용 공여자 폴리뉴클레오티드 서열의 통합의 결과.
본 발명의 측면이 특정 실시양태에서 기재되었지만, 이들은 본 개시내용의 취지 및 범위 내에서 추가로 변형될 수 있다. 따라서, 본 출원은 그의 일반적 원리를 사용한 본 발명의 실시양태의 임의의 변경, 사용 또는 적합화를 포괄하는 것으로 의도된다. 또한, 본 출원은, 이들 실시양태가 관련되며 첨부된 청구범위의 제한 내에 속하는 관련 기술분야의 공지된 또는 통상의 실시 내에 있는 한, 본 개시내용으로부터의 이러한 이탈을 포괄하는 것으로 의도된다.
SEQUENCE LISTING
<110> Dow AgroSciences LLC
Sastry-Dent, Lakshmi
Evans, Steve
Blue, Ryan
Cao, Zehui
<120> A UNIVERSAL DONOR SYSTEM FOR GENE TARGETING
<130> 14764-232301
<160> 219
<170> PatentIn version 3.5
<210> 1
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 1
Gln Ser Gly Asp Leu Thr Arg
1 5
<210> 2
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 2
Arg Lys Asp Gln Leu Val Ala
1 5
<210> 3
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 3
Arg Ser Asp Asp Leu Thr Arg
1 5
<210> 4
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 4
Thr Ser Ser Asn Arg Lys Thr
1 5
<210> 5
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 5
Arg Ser Asp Thr Leu Ser Glu
1 5
<210> 6
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 6
Ala Arg Ser Thr Arg Thr Asn
1 5
<210> 7
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 7
Arg Ser Asp Ser Leu Ser Val
1 5
<210> 8
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 8
Asp Arg Ser Asn Arg Lys Thr
1 5
<210> 9
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 9
Gln Ser Ser His Leu Thr Arg
1 5
<210> 10
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 10
Arg Ser Asp Ala Leu Ala Arg
1 5
<210> 11
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 11
Arg Ser Asp Asp Leu Thr Arg
1 5
<210> 12
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 12
Asp Pro Ser Ala Leu Arg Lys
1 5
<210> 13
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 13
Arg Ser Asp Asn Leu Ser Gln
1 5
<210> 14
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 14
Ala Ser Asn Asp Arg Lys Lys
1 5
<210> 15
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 15
Glu Arg Gly Thr Leu Ala Arg
1 5
<210> 16
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 16
Arg Ser Asp His Leu Ser Arg
1 5
<210> 17
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 17
Glu Arg Gly Thr Leu Ala Arg
1 5
<210> 18
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 18
Gln Ser Gly His Leu Ser Arg
1 5
<210> 19
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 19
Arg Ser Ala Asn Leu Ala Arg
1 5
<210> 20
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 20
Asp Arg Ser Asp Leu Ser Arg
1 5
<210> 21
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 21
Arg Ser Asp Thr Leu Ser Gln
1 5
<210> 22
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 22
Arg Ser Ala Asp Leu Ser Arg
1 5
<210> 23
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 23
Asp Arg Ser Asn Leu Ser Arg
1 5
<210> 24
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 24
Asn Ser Arg Asn Leu Arg Asn
1 5
<210> 25
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 25
Arg Ser Asp Ser Leu Ser Val
1 5
<210> 26
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 26
Asp Arg Ser His Leu Ala Arg
1 5
<210> 27
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 27
Asp Arg Ser Asn Leu Ser Arg
1 5
<210> 28
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 28
Arg Arg Ser Asp Leu Lys Arg
1 5
<210> 29
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 29
Arg Ser Asp Thr Leu Ser Glu
1 5
<210> 30
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 30
Gln Asn Ala Thr Arg Ile Asn
1 5
<210> 31
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 31
Gln Ser Gly Ser Leu Thr Arg
1 5
<210> 32
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 32
Gln Ser Gly Asp Leu Thr Arg
1 5
<210> 33
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 33
Arg Ser Asp Val Leu Ser Glu
1 5
<210> 34
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 34
Thr Arg Asn Gly Leu Lys Tyr
1 5
<210> 35
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 35
Arg Ser Asp Asn Leu Ser Arg
1 5
<210> 36
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 36
Asp Asn Ser Asn Arg Lys Thr
1 5
<210> 37
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 37
Gln Asn Ala His Arg Lys Thr
1 5
<210> 38
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 38
Gln Lys Ala Thr Arg Ile Thr
1 5
<210> 39
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 39
Asp Arg Ser His Leu Thr Arg
1 5
<210> 40
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 40
Arg Ser Asp Asp Arg Lys Lys
1 5
<210> 41
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 41
Ala Ser Lys Thr Arg Thr Asn
1 5
<210> 42
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 42
Gln Ser Gly Ser Leu Thr Arg
1 5
<210> 43
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 43
Leu Arg His His Leu Thr Arg
1 5
<210> 44
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 44
Gln Ser Ala His Leu Lys Ala
1 5
<210> 45
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 45
Gln Ser Gly Asp Leu Thr Arg
1 5
<210> 46
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 46
Ala Ser His Asn Leu Arg Thr
1 5
<210> 47
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 47
Asp Arg Ser Asn Leu Thr Arg
1 5
<210> 48
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 48
Gln Ser Ser Asp Leu Ser Arg
1 5
<210> 49
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 49
Asp Ala Gly Asn Arg Asn Lys
1 5
<210> 50
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 50
Asp Arg Ser Asp Leu Ser Arg
1 5
<210> 51
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 51
Arg Ser Asp Asn Leu Thr Arg
1 5
<210> 52
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 52
Asp Arg Ser His Leu Ser Arg
1 5
<210> 53
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 53
Thr Ser Gly Asn Leu Thr Arg
1 5
<210> 54
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 54
Gln Ser Ser Asp Leu Ser Arg
1 5
<210> 55
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 55
Gln Ser Ser Asp Leu Ser Arg
1 5
<210> 56
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 56
His Arg Ser Thr Arg Asn Arg
1 5
<210> 57
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 57
Arg Ser Asp Asp Leu Thr Arg
1 5
<210> 58
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 58
Asp Arg Ser Asn Leu Lys Ala
1 5
<210> 59
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 59
Asp Arg Ser His Leu Thr Arg
1 5
<210> 60
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 60
Gln Arg Ser Thr Leu Lys Ser
1 5
<210> 61
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 61
Arg Ser Asp Ala Leu Ser Arg
1 5
<210> 62
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 62
Arg Ser Asp Asp Leu Thr Arg
1 5
<210> 63
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 63
Asp Arg Ser His Leu Thr Arg
1 5
<210> 64
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 64
Thr Ser Ser Asn Arg Lys Thr
1 5
<210> 65
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 65
Arg Ser Asp Thr Leu Ser Glu
1 5
<210> 66
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 66
Asp Arg Ser His Leu Ala Arg
1 5
<210> 67
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 67
Asp Arg Ser Ala Arg Thr Arg
1 5
<210> 68
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 68
Gln Ser Gly His Leu Ser Arg
1 5
<210> 69
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 69
Gln Ser Gly Asn Leu Ala Arg
1 5
<210> 70
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 70
Arg Ser Asp Val Leu Ser Thr
1 5
<210> 71
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 71
Arg Tyr Ala Tyr Leu Thr Ser
1 5
<210> 72
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 72
Arg Arg Trp Thr Leu Val Gly
1 5
<210> 73
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 73
Arg Ser Asp Asn Leu Ser Gln
1 5
<210> 74
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 74
Ala Ser Asn Asp Arg Lys Lys
1 5
<210> 75
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 75
Gln Ser Gly Asp Leu Thr Arg
1 5
<210> 76
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 76
Leu Lys Asp Thr Leu Arg Arg
1 5
<210> 77
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 77
Gln Ser Gly Asn Leu Ala Arg
1 5
<210> 78
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 78
Gln Ser Gly Asp Leu Thr Arg
1 5
<210> 79
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 79
Met Gln Asn Tyr Leu Ser Arg
1 5
<210> 80
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 80
Arg Ser Asp His Leu Ser Glu
1 5
<210> 81
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 81
Gln Asn Ala Asn Arg Lys Thr
1 5
<210> 82
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 82
Arg Ser Ala Asp Leu Thr Arg
1 5
<210> 83
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 83
Arg Ser Asp Asn Leu Ser Glu
1 5
<210> 84
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 84
Gln Ser Ala Asn Arg Thr Lys
1 5
<210> 85
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 85
Arg Ser Asp Ala Leu Ser Arg
1 5
<210> 86
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 86
Asp Arg Ser Ala Leu Ala Arg
1 5
<210> 87
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 87
Arg Ser Asp His Leu Ser Glu
1 5
<210> 88
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 88
Asp Ser Gln Asn Arg Ile Lys
1 5
<210> 89
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 89
Gln Ser Gly Asp Leu Thr Arg
1 5
<210> 90
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 90
Asp Lys Gly Asn Leu Thr Lys
1 5
<210> 91
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 91
Arg Ser Ala Asp Leu Thr Arg
1 5
<210> 92
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 92
Asp Arg Ser His Leu Ala Arg
1 5
<210> 93
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 93
Arg Ser Asp Thr Leu Ser Glu
1 5
<210> 94
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 94
Asp Arg Ser Asn Arg Lys Thr
1 5
<210> 95
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 95
Asp Arg Ser Asn Leu Ser Arg
1 5
<210> 96
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 96
Leu Arg Gln Asp Leu Lys Arg
1 5
<210> 97
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 97
Arg Ser Asp His Leu Ser Glu
1 5
<210> 98
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 98
Asp Arg Ser Ala Leu Ala Arg
1 5
<210> 99
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 99
Asp Arg Ser Ala Leu Ser Arg
1 5
<210> 100
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 100
Asn Arg Arg Gly Arg Trp Ser
1 5
<210> 101
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 101
Arg Pro Tyr Thr Leu Arg Leu
1 5
<210> 102
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 102
His Arg Ser Ser Leu Arg Arg
1 5
<210> 103
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 103
Arg Ser Asp Ser Leu Leu Arg
1 5
<210> 104
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 104
Trp Leu Ser Ser Leu Ser Ala
1 5
<210> 105
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 105
Gln Ser Gly Asp Leu Thr Arg
1 5
<210> 106
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 106
Asp Arg Ser His Leu Ala Arg
1 5
<210> 107
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 107
Asp Arg Ser Asn Leu Ser Arg
1 5
<210> 108
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 108
Leu Lys Gln His Leu Asn Glu
1 5
<210> 109
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 109
Leu Arg His His Leu Thr Arg
1 5
<210> 110
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 110
Gln Ser Gly Asn Leu His Val
1 5
<210> 111
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Zinc Finger Protein Recognition Helices
<400> 111
Thr Ser Gly His Leu Ser Arg
1 5
<210> 112
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 112
ctactccgta tgcgaaggca cg 22
<210> 113
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 113
tattcgcggt gggacacttg at 22
<210> 114
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 114
ccggagccgg ggcctcccag gc 22
<210> 115
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 115
atcgcgacgc gacgcgacga gac 23
<210> 116
<211> 13
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 116
tgcatgcgca gta 13
<210> 117
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 117
acaccggcgc acggcacg 18
<210> 118
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 118
agaggtgtaa cc 12
<210> 119
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 119
tcgggcacaa gaaacgag 18
<210> 120
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 120
tacgctgaca atgca 15
<210> 121
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 121
ccagctgatg gagaggac 18
<210> 122
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 122
agagcaggcg ag 12
<210> 123
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 123
agcaaagtga gtagtt 16
<210> 124
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 124
tggatggaag gaatc 15
<210> 125
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 125
gaagctacat cccag 15
<210> 126
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 126
tacgcgcaac ggaacgca 18
<210> 127
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 127
caccggtgtc gtgtaacag 19
<210> 128
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 128
cccggacgac gccgag 16
<210> 129
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 129
gacatggcac gcgcatcgag 20
<210> 130
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 130
gcatgtgtgg ttttg 15
<210> 131
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Zinc Finger Binding Sequences
<400> 131
ggtcaaggta gtgac 15
<210> 132
<211> 2378
<212> DNA
<213> Artificial Sequence
<220>
<223> universal polynucleotide donor cassette sequence
<400> 132
aagttggtga tacatgaacc aacacgaaga acccgccagt cctactacca ctctccttcg 60
tttgacctag ctggctggtt aagaaactga tgttgatacc agccactact ccgagctagt 120
agtaaaagat ttttacagcc aggggagcca caggttagta gagtggtagg agcagtgttg 180
gactgatggc tcgcttacat aagcagttct gtcccatgga gccaatgtcc tgatacggta 240
ggacacatat cccttaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 300
gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 360
tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 420
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 480
cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 540
ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 600
tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 660
gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 720
gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 780
gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 840
ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 900
ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag 960
ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 1020
gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 1080
ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 1140
tggtcatggc gttcggaacc gtgctgaccc gcaagtggca acctcccgtg cctctgctca 1200
cctttaccgc ctggcaactg gcggccacct gcagggcgat cgcaccgagc gcttagtggg 1260
aatttgtacc ccttatcgaa ccgggagcac aggatgacgc ctaacaattc attcaagccg 1320
acaccgcttc gcggcgcggc ttaattcagg agttaaacat catgagggaa gcggtgatcg 1380
ccgaagtatc gactcaacta tcagaggtag ttggcgtcat cgagcgccat ctcgaaccga 1440
cgttgctggc cgtacatttg tacggctccg cagtggatgg cggcctgaag ccacacagtg 1500
atattgattt gctggttacg gtgaccgtaa ggcttgatga aacaacgcgg cgagctttga 1560
tcaacgacct tttggaaact tcggcttccc ctggagagag cgagattctc cgcgctgtag 1620
aagtcaccat tgttgtgcac gacgacatca ttccgtggcg ttatccagct aagcgcgaac 1680
tgcaatttgg agaatggcag cgcaatgaca ttcttgcagg tatcttcgag ccagccacga 1740
tcgacattga tctggctatc ttgctgacaa aagcaagaga acatagcgtt gccttggtag 1800
gtccagcggc ggaggaactc tttgatccgg ttcctgaaca ggatctattt gaggcgctaa 1860
atgaaacctt aacgctatgg aactcgccgc ccgactgggc tggcgatgag cgaaatgtag 1920
tgcttacgtt gtcccgcatt tggtacagcg cagtaaccgg caaaatcgcg ccgaaggatg 1980
tcgctgccga ctgggcaatg gagcgcctgc cggcccagta tcagcccgtc atacttgaag 2040
ctaggcaggc ttatcttgga caagaagatc gcttggcctc gcgcgcagat cagttggaag 2100
aatttgttca ctacgtgaaa ggcgagatca ccaaggtagt cggcaaataa tgtctaacaa 2160
ttcgttcaag ccgacgccgc ttcgcggcgc ggcttaactc aagcgttaga gagctgggga 2220
agactatgcg cgatcgcctg cagctacgtg ccttcgcata cggagtagtt tattcgcggt 2280
gggacacttg atagaaaggt taagaggaca cgcctaaaca gttgtgaata catacataca 2340
caccgataca cagatgctaa agcactaaag cccctaaa 2378
<210> 133
<211> 2424
<212> DNA
<213> Artificial Sequence
<220>
<223> universal polynucleotide donor cassette sequence
<400> 133
tttgcgggat ctggatgggc tgttttcgcg cgcggcgtca ctttccctta acttctcgcg 60
ctggaagagg cagctgcctg cttttgcttg gccgctgacc atgacacctg gccccgcttt 120
gcagcccgtg gaggactctt ggcgagccac aggttagtag agtggtagga gcagtgttgg 180
actgatggct cgcttacata agcagttctg tcccatggag ccaatgtcct gatacggtag 240
gacacatatc ccttaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg 300
ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 360
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 420
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 480
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 540
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 600
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 660
aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 720
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 780
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 840
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 900
gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 960
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 1020
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 1080
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 1140
ggtcatggcg ttcggaaccg tgctgacccg caagtggcaa cctcccgtgc ctctgctcac 1200
ctttaccgcc tggcaactgg cggccacctg cagggcgatc gcaccgagcg cttagtggga 1260
atttgtaccc cttatcgaac cgggagcaca ggatgacgcc taacaattca ttcaagccga 1320
caccgcttcg cggcgcggct taattcagga gttaaacatc atgagggaag cggtgatcgc 1380
cgaagtatcg actcaactat cagaggtagt tggcgtcatc gagcgccatc tcgaaccgac 1440
gttgctggcc gtacatttgt acggctccgc agtggatggc ggcctgaagc cacacagtga 1500
tattgatttg ctggttacgg tgaccgtaag gcttgatgaa acaacgcggc gagctttgat 1560
caacgacctt ttggaaactt cggcttcccc tggagagagc gagattctcc gcgctgtaga 1620
agtcaccatt gttgtgcacg acgacatcat tccgtggcgt tatccagcta agcgcgaact 1680
gcaatttgga gaatggcagc gcaatgacat tcttgcaggt atcttcgagc cagccacgat 1740
cgacattgat ctggctatct tgctgacaaa agcaagagaa catagcgttg ccttggtagg 1800
tccagcggcg gaggaactct ttgatccggt tcctgaacag gatctatttg aggcgctaaa 1860
tgaaacctta acgctatgga actcgccgcc cgactgggct ggcgatgagc gaaatgtagt 1920
gcttacgttg tcccgcattt ggtacagcgc agtaaccggc aaaatcgcgc cgaaggatgt 1980
cgctgccgac tgggcaatgg agcgcctgcc ggcccagtat cagcccgtca tacttgaagc 2040
taggcaggct tatcttggac aagaagatcg cttggcctcg cgcgcagatc agttggaaga 2100
atttgttcac tacgtgaaag gcgagatcac caaggtagtc ggcaaataat gtctaacaat 2160
tcgttcaagc cgacgccgct tcgcggcgcg gcttaactca agcgttagag agctggggaa 2220
gactatgcgc gatcgcctgc aggtggttgc ctgggaggcc ccggctccgg gcatcgcgac 2280
gcgacgcgac gagacgcgta aaagtcaccc gtcgcggtct cgcatgcgcg agggaggcag 2340
gcaggcagcg aacaaaatcg cacgcgcgtc gtcgactgcc tggcctggcc tggtccagct 2400
gaaaaccgcc ccggtttgcc tccg 2424
<210> 134
<211> 2225
<212> DNA
<213> Artificial Sequence
<220>
<223> universal polynucleotide donor cassette sequence
<400> 134
gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 60
gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 120
taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 180
cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 240
ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 300
aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 360
tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 420
gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 480
cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 540
ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 600
cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 660
gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 720
cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 780
tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 840
ttaagggatt ttggtcatgg cgttcggaac cgtgctgacc cgcaagtggc aacctcccgt 900
gcctctgctc acctttaccg cctggcaact ggcggccacc tgcagggcga tcgcaccgag 960
cgcttagtgg gaatttgtac cccttatcga accgggagca caggatgacg cctaacaatt 1020
cattcaagcc gacaccgctt cgcggcgcgg cttaattcag gagttaaaca tcatgaggga 1080
agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca tcgagcgcca 1140
tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg gcggcctgaa 1200
gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg aaacaacgcg 1260
gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga gcgagattct 1320
ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc gttatccagc 1380
taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag gtatcttcga 1440
gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag aacatagcgt 1500
tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac aggatctatt 1560
tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg ctggcgatga 1620
gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc 1680
gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt atcagcccgt 1740
catacttgaa gctaggcagg cttatcttgg acaagaagat cgcttggcct cgcgcgcaga 1800
tcagttggaa gaatttgttc actacgtgaa aggcgagatc accaaggtag tcggcaaata 1860
atgtctaaca attcgttcaa gccgacgccg cttcgcggcg cggcttaact caagcgttag 1920
agagctgggg aagactatgc gcgatcgcct gcagtccgca gttaccttcc ccatcatgaa 1980
cttggagacc gaaaggtgtg gtgcctagtt accccgaaga aatgaaacat ctgcattgtc 2040
agcgtagtat cccagctgat ggagaggaca tacccatgag gagccacagg ttagtagagt 2100
ggtaggagca gtgttggact gatggctcgc ttacataagc agttctgtcc catggagcca 2160
atgtcctgat acggtaggac acatatccct taatgaatcg gccaacgcgc ggggagaggc 2220
ggttt 2225
<210> 135
<211> 2234
<212> DNA
<213> Artificial Sequence
<220>
<223> universal polynucleotide donor cassette sequence
<400> 135
gagagctggg gaagactatg cgcgatcgcc tgcagtgtcg cgaggcaggg agcagccgcg 60
tgtccgcctg ctgctgctgg aatggcgcgg tggccgcgcg cggtgacgtc ggcaaggctg 120
gtctcgcctg ctcttggcaa gcaaagtgag tagttacacg gcgctggctg gagccacagg 180
ttagtagagt ggtaggagca gtgttggact gatggctcgc ttacataagc agttctgtcc 240
catggagcca atgtcctgat acggtaggac acatatccct taatgaatcg gccaacgcgc 300
ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg 360
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 420
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 480
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 540
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 600
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 660
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 720
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 780
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 840
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 900
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt 960
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 1020
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 1080
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 1140
gaacgaaaac tcacgttaag ggattttggt catggcgttc ggaaccgtgc tgacccgcaa 1200
gtggcaacct cccgtgcctc tgctcacctt taccgcctgg caactggcgg ccacctgcag 1260
ggcgatcgca ccgagcgctt agtgggaatt tgtacccctt atcgaaccgg gagcacagga 1320
tgacgcctaa caattcattc aagccgacac cgcttcgcgg cgcggcttaa ttcaggagtt 1380
aaacatcatg agggaagcgg tgatcgccga agtatcgact caactatcag aggtagttgg 1440
cgtcatcgag cgccatctcg aaccgacgtt gctggccgta catttgtacg gctccgcagt 1500
ggatggcggc ctgaagccac acagtgatat tgatttgctg gttacggtga ccgtaaggct 1560
tgatgaaaca acgcggcgag ctttgatcaa cgaccttttg gaaacttcgg cttcccctgg 1620
agagagcgag attctccgcg ctgtagaagt caccattgtt gtgcacgacg acatcattcc 1680
gtggcgttat ccagctaagc gcgaactgca atttggagaa tggcagcgca atgacattct 1740
tgcaggtatc ttcgagccag ccacgatcga cattgatctg gctatcttgc tgacaaaagc 1800
aagagaacat agcgttgcct tggtaggtcc agcggcggag gaactctttg atccggttcc 1860
tgaacaggat ctatttgagg cgctaaatga aaccttaacg ctatggaact cgccgcccga 1920
ctgggctggc gatgagcgaa atgtagtgct tacgttgtcc cgcatttggt acagcgcagt 1980
aaccggcaaa atcgcgccga aggatgtcgc tgccgactgg gcaatggagc gcctgccggc 2040
ccagtatcag cccgtcatac ttgaagctag gcaggcttat cttggacaag aagatcgctt 2100
ggcctcgcgc gcagatcagt tggaagaatt tgttcactac gtgaaaggcg agatcaccaa 2160
ggtagtcggc aaataatgtc taacaattcg ttcaagccga cgccgcttcg cggcgcggct 2220
taactcaagc gtta 2234
<210> 136
<211> 2165
<212> DNA
<213> Artificial Sequence
<220>
<223> universal polynucleotide donor cassette sequence
<400> 136
gagagctggg gaagactatg cgcgatcgcc tgcagtgttg tgcagccgta cgtgccgtgc 60
gccggtgtat gtctgcatgc gcagtactta ttttctgaag cgagccacag gttagtagag 120
tggtaggagc agtgttggac tgatggctcg cttacataag cagttctgtc ccatggagcc 180
aatgtcctga tacggtagga cacatatccc ttaatgaatc ggccaacgcg cggggagagg 240
cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 300
tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 360
aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 420
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 480
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 540
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 600
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 660
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 720
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 780
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 840
agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg 900
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 960
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1020
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 1080
ctcacgttaa gggattttgg tcatggcgtt cggaaccgtg ctgacccgca agtggcaacc 1140
tcccgtgcct ctgctcacct ttaccgcctg gcaactggcg gccacctgca gggcgatcgc 1200
accgagcgct tagtgggaat ttgtacccct tatcgaaccg ggagcacagg atgacgccta 1260
acaattcatt caagccgaca ccgcttcgcg gcgcggctta attcaggagt taaacatcat 1320
gagggaagcg gtgatcgccg aagtatcgac tcaactatca gaggtagttg gcgtcatcga 1380
gcgccatctc gaaccgacgt tgctggccgt acatttgtac ggctccgcag tggatggcgg 1440
cctgaagcca cacagtgata ttgatttgct ggttacggtg accgtaaggc ttgatgaaac 1500
aacgcggcga gctttgatca acgacctttt ggaaacttcg gcttcccctg gagagagcga 1560
gattctccgc gctgtagaag tcaccattgt tgtgcacgac gacatcattc cgtggcgtta 1620
tccagctaag cgcgaactgc aatttggaga atggcagcgc aatgacattc ttgcaggtat 1680
cttcgagcca gccacgatcg acattgatct ggctatcttg ctgacaaaag caagagaaca 1740
tagcgttgcc ttggtaggtc cagcggcgga ggaactcttt gatccggttc ctgaacagga 1800
tctatttgag gcgctaaatg aaaccttaac gctatggaac tcgccgcccg actgggctgg 1860
cgatgagcga aatgtagtgc ttacgttgtc ccgcatttgg tacagcgcag taaccggcaa 1920
aatcgcgccg aaggatgtcg ctgccgactg ggcaatggag cgcctgccgg cccagtatca 1980
gcccgtcata cttgaagcta ggcaggctta tcttggacaa gaagatcgct tggcctcgcg 2040
cgcagatcag ttggaagaat ttgttcacta cgtgaaaggc gagatcacca aggtagtcgg 2100
caaataatgt ctaacaattc gttcaagccg acgccgcttc gcggcgcggc ttaactcaag 2160
cgtta 2165
<210> 137
<211> 2264
<212> DNA
<213> Artificial Sequence
<220>
<223> universal polynucleotide donor cassette sequence
<400> 137
gagagctggg gaagactatg cgcgatcgcc tgcagtaacg atttattttc ctcgtttctt 60
gtgcccgaaa gagagaggtg taacccatcc tctataacag tgtggctttg acaacggttc 120
aatatgtatg tttggcaaat gtagatttgt gccaattctt ggtcataatc agcgcggaca 180
aaccggctac ccaaatttgg gagccacagg ttagtagagt ggtaggagca gtgttggact 240
gatggctcgc ttacataagc agttctgtcc catggagcca atgtcctgat acggtaggac 300
acatatccct taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 360
ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 420
agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 480
catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 540
tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 600
gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 660
ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 720
cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 780
caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 840
ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 900
taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 960
taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 1020
cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 1080
tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 1140
gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 1200
catggcgttc ggaaccgtgc tgacccgcaa gtggcaacct cccgtgcctc tgctcacctt 1260
taccgcctgg caactggcgg ccacctgcag ggcgatcgca ccgagcgctt agtgggaatt 1320
tgtacccctt atcgaaccgg gagcacagga tgacgcctaa caattcattc aagccgacac 1380
cgcttcgcgg cgcggcttaa ttcaggagtt aaacatcatg agggaagcgg tgatcgccga 1440
agtatcgact caactatcag aggtagttgg cgtcatcgag cgccatctcg aaccgacgtt 1500
gctggccgta catttgtacg gctccgcagt ggatggcggc ctgaagccac acagtgatat 1560
tgatttgctg gttacggtga ccgtaaggct tgatgaaaca acgcggcgag ctttgatcaa 1620
cgaccttttg gaaacttcgg cttcccctgg agagagcgag attctccgcg ctgtagaagt 1680
caccattgtt gtgcacgacg acatcattcc gtggcgttat ccagctaagc gcgaactgca 1740
atttggagaa tggcagcgca atgacattct tgcaggtatc ttcgagccag ccacgatcga 1800
cattgatctg gctatcttgc tgacaaaagc aagagaacat agcgttgcct tggtaggtcc 1860
agcggcggag gaactctttg atccggttcc tgaacaggat ctatttgagg cgctaaatga 1920
aaccttaacg ctatggaact cgccgcccga ctgggctggc gatgagcgaa atgtagtgct 1980
tacgttgtcc cgcatttggt acagcgcagt aaccggcaaa atcgcgccga aggatgtcgc 2040
tgccgactgg gcaatggagc gcctgccggc ccagtatcag cccgtcatac ttgaagctag 2100
gcaggcttat cttggacaag aagatcgctt ggcctcgcgc gcagatcagt tggaagaatt 2160
tgttcactac gtgaaaggcg agatcaccaa ggtagtcggc aaataatgtc taacaattcg 2220
ttcaagccga cgccgcttcg cggcgcggct taactcaagc gtta 2264
<210> 138
<211> 2373
<212> DNA
<213> Artificial Sequence
<220>
<223> universal polynucleotide donor cassette sequence
<400> 138
gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 60
gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 120
taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 180
cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 240
ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 300
aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 360
tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 420
gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 480
cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 540
ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 600
cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 660
gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 720
cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 780
tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 840
ttaagggatt ttggtcatgg cgttcggaac cgtgctgacc cgcaagtggc aacctcccgt 900
gcctctgctc acctttaccg cctggcaact ggcggccacc tgcagggcga tcgcaccgag 960
cgcttagtgg gaatttgtac cccttatcga accgggagca caggatgacg cctaacaatt 1020
cattcaagcc gacaccgctt cgcggcgcgg cttaattcag gagttaaaca tcatgaggga 1080
agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca tcgagcgcca 1140
tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg gcggcctgaa 1200
gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg aaacaacgcg 1260
gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga gcgagattct 1320
ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc gttatccagc 1380
taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag gtatcttcga 1440
gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag aacatagcgt 1500
tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac aggatctatt 1560
tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg ctggcgatga 1620
gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc 1680
gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt atcagcccgt 1740
catacttgaa gctaggcagg cttatcttgg acaagaagat cgcttggcct cgcgcgcaga 1800
tcagttggaa gaatttgttc actacgtgaa aggcgagatc accaaggtag tcggcaaata 1860
atgtctaaca attcgttcaa gccgacgccg cttcgcggcg cggcttaact caagcgttag 1920
agagctgggg aagactatgc gcgatcgcct gcagataagg aactatatac aaaaccacac 1980
atgcacacgt ggtcaaggta gtgactaatc tcgcctaata cacggcgctg gctgatgcat 2040
gcgtgacacg gtggctagct agctgttgat cccggccggc ccgtgatgac agcgctcggc 2100
gtcttcaggc ttcagaaccg ttgatcaagg acgatgagct tgagagctga atccgcggtt 2160
cgtggtgttc atctcagcgt gtctcgtcgt cggcccggtc ggcagcggca gaatttcatt 2220
tcagactgga gccacaggtt agtagagtgg taggagcagt gttggactga tggctcgctt 2280
acataagcag ttctgtccca tggagccaat gtcctgatac ggtaggacac atatccctta 2340
atgaatcggc caacgcgcgg ggagaggcgg ttt 2373
<210> 139
<211> 2241
<212> DNA
<213> Artificial Sequence
<220>
<223> universal polynucleotide donor cassette sequence
<400> 139
gagagctggg gaagactatg cgcgatcgcc tgcaggagct tgcattaact agcaaagtga 60
ttccttccat ccatgcaaga agctacatcc cagtgggtgc ggcaaaagct gtatgaaaag 120
gttggagact tccatacaac tgttgtgtgt cgagtagtag aaaccaacaa caaagtcgag 180
ccacaggtta gtagagtggt aggagcagtg ttggactgat ggctcgctta cataagcagt 240
tctgtcccat ggagccaatg tcctgatacg gtaggacaca tatcccttaa tgaatcggcc 300
aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 360
cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 420
ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 480
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 540
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 600
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 660
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 720
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 780
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 840
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 900
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa 960
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 1020
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 1080
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 1140
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat ggcgttcgga accgtgctga 1200
cccgcaagtg gcaacctccc gtgcctctgc tcacctttac cgcctggcaa ctggcggcca 1260
cctgcagggc gatcgcaccg agcgcttagt gggaatttgt accccttatc gaaccgggag 1320
cacaggatga cgcctaacaa ttcattcaag ccgacaccgc ttcgcggcgc ggcttaattc 1380
aggagttaaa catcatgagg gaagcggtga tcgccgaagt atcgactcaa ctatcagagg 1440
tagttggcgt catcgagcgc catctcgaac cgacgttgct ggccgtacat ttgtacggct 1500
ccgcagtgga tggcggcctg aagccacaca gtgatattga tttgctggtt acggtgaccg 1560
taaggcttga tgaaacaacg cggcgagctt tgatcaacga ccttttggaa acttcggctt 1620
cccctggaga gagcgagatt ctccgcgctg tagaagtcac cattgttgtg cacgacgaca 1680
tcattccgtg gcgttatcca gctaagcgcg aactgcaatt tggagaatgg cagcgcaatg 1740
acattcttgc aggtatcttc gagccagcca cgatcgacat tgatctggct atcttgctga 1800
caaaagcaag agaacatagc gttgccttgg taggtccagc ggcggaggaa ctctttgatc 1860
cggttcctga acaggatcta tttgaggcgc taaatgaaac cttaacgcta tggaactcgc 1920
cgcccgactg ggctggcgat gagcgaaatg tagtgcttac gttgtcccgc atttggtaca 1980
gcgcagtaac cggcaaaatc gcgccgaagg atgtcgctgc cgactgggca atggagcgcc 2040
tgccggccca gtatcagccc gtcatacttg aagctaggca ggcttatctt ggacaagaag 2100
atcgcttggc ctcgcgcgca gatcagttgg aagaatttgt tcactacgtg aaaggcgaga 2160
tcaccaaggt agtcggcaaa taatgtctaa caattcgttc aagccgacgc cgcttcgcgg 2220
cgcggcttaa ctcaagcgtt a 2241
<210> 140
<211> 2195
<212> DNA
<213> Artificial Sequence
<220>
<223> universal polynucleotide donor cassette sequence
<400> 140
gagagctggg gaagactatg cgcgatcgcc tgcagggacc ccgtcgccgt cggcacagcg 60
tcagggcggt aacatgcgtt ccgttgcgcg tacggaccac cggtgtcgtg taacaggaag 120
agctgtcagt ggagccacag gttagtagag tggtaggagc agtgttggac tgatggctcg 180
cttacataag cagttctgtc ccatggagcc aatgtcctga tacggtagga cacatatccc 240
ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc 300
ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 360
aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 420
aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 480
gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 540
gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 600
tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 660
ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 720
ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 780
tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 840
tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 900
ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 960
aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 1020
ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 1080
tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatggcgtt 1140
cggaaccgtg ctgacccgca agtggcaacc tcccgtgcct ctgctcacct ttaccgcctg 1200
gcaactggcg gccacctgca gggcgatcgc accgagcgct tagtgggaat ttgtacccct 1260
tatcgaaccg ggagcacagg atgacgccta acaattcatt caagccgaca ccgcttcgcg 1320
gcgcggctta attcaggagt taaacatcat gagggaagcg gtgatcgccg aagtatcgac 1380
tcaactatca gaggtagttg gcgtcatcga gcgccatctc gaaccgacgt tgctggccgt 1440
acatttgtac ggctccgcag tggatggcgg cctgaagcca cacagtgata ttgatttgct 1500
ggttacggtg accgtaaggc ttgatgaaac aacgcggcga gctttgatca acgacctttt 1560
ggaaacttcg gcttcccctg gagagagcga gattctccgc gctgtagaag tcaccattgt 1620
tgtgcacgac gacatcattc cgtggcgtta tccagctaag cgcgaactgc aatttggaga 1680
atggcagcgc aatgacattc ttgcaggtat cttcgagcca gccacgatcg acattgatct 1740
ggctatcttg ctgacaaaag caagagaaca tagcgttgcc ttggtaggtc cagcggcgga 1800
ggaactcttt gatccggttc ctgaacagga tctatttgag gcgctaaatg aaaccttaac 1860
gctatggaac tcgccgcccg actgggctgg cgatgagcga aatgtagtgc ttacgttgtc 1920
ccgcatttgg tacagcgcag taaccggcaa aatcgcgccg aaggatgtcg ctgccgactg 1980
ggcaatggag cgcctgccgg cccagtatca gcccgtcata cttgaagcta ggcaggctta 2040
tcttggacaa gaagatcgct tggcctcgcg cgcagatcag ttggaagaat ttgttcacta 2100
cgtgaaaggc gagatcacca aggtagtcgg caaataatgt ctaacaattc gttcaagccg 2160
acgccgcttc gcggcgcggc ttaactcaag cgtta 2195
<210> 141
<211> 2222
<212> DNA
<213> Artificial Sequence
<220>
<223> universal polynucleotide donor cassette sequence
<400> 141
gagagctggg gaagactatg cgcgatcgcc tgcaggctcg tcgctgatca ccagtatcta 60
ctcgtacagt actccatgga tgcgtacgcg cccgggaact cctcggcgtc gtccgggctg 120
accgacatgg cacgcgcatc gaggatgtag atgcacgtga gccacaggtt agtagagtgg 180
taggagcagt gttggactga tggctcgctt acataagcag ttctgtccca tggagccaat 240
gtcctgatac ggtaggacac atatccctta atgaatcggc caacgcgcgg ggagaggcgg 300
tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 360
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 420
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 480
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 540
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 600
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 660
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 720
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 780
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 840
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 900
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 960
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 1020
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 1080
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 1140
acgttaaggg attttggtca tggcgttcgg aaccgtgctg acccgcaagt ggcaacctcc 1200
cgtgcctctg ctcaccttta ccgcctggca actggcggcc acctgcaggg cgatcgcacc 1260
gagcgcttag tgggaatttg taccccttat cgaaccggga gcacaggatg acgcctaaca 1320
attcattcaa gccgacaccg cttcgcggcg cggcttaatt caggagttaa acatcatgag 1380
ggaagcggtg atcgccgaag tatcgactca actatcagag gtagttggcg tcatcgagcg 1440
ccatctcgaa ccgacgttgc tggccgtaca tttgtacggc tccgcagtgg atggcggcct 1500
gaagccacac agtgatattg atttgctggt tacggtgacc gtaaggcttg atgaaacaac 1560
gcggcgagct ttgatcaacg accttttgga aacttcggct tcccctggag agagcgagat 1620
tctccgcgct gtagaagtca ccattgttgt gcacgacgac atcattccgt ggcgttatcc 1680
agctaagcgc gaactgcaat ttggagaatg gcagcgcaat gacattcttg caggtatctt 1740
cgagccagcc acgatcgaca ttgatctggc tatcttgctg acaaaagcaa gagaacatag 1800
cgttgccttg gtaggtccag cggcggagga actctttgat ccggttcctg aacaggatct 1860
atttgaggcg ctaaatgaaa ccttaacgct atggaactcg ccgcccgact gggctggcga 1920
tgagcgaaat gtagtgctta cgttgtcccg catttggtac agcgcagtaa ccggcaaaat 1980
cgcgccgaag gatgtcgctg ccgactgggc aatggagcgc ctgccggccc agtatcagcc 2040
cgtcatactt gaagctaggc aggcttatct tggacaagaa gatcgcttgg cctcgcgcgc 2100
agatcagttg gaagaatttg ttcactacgt gaaaggcgag atcaccaagg tagtcggcaa 2160
ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta actcaagcgt 2220
ta 2222
<210> 142
<211> 110
<212> DNA
<213> Artificial Sequence
<220>
<223> Analytical Domain
<400> 142
gagccacagg ttagtagagt ggtaggagca gtgttggact gatggctcgc ttacataagc 60
agttctgtcc catggagcca atgtcctgat acggtaggac acatatccct 110
<210> 143
<211> 118
<212> DNA
<213> Artificial Sequence
<220>
<223> Analytical Domain
<400> 143
actagttttc atagggatat gtgaggacta accttggcca aaggagctgg aactgcctgc 60
agttatgtaa gggccttagt ccaaattgct ccaccctctg ggaagctaat ggactagt 118
<210> 144
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 144
cgccacaaat ctgaaccagc a 21
<210> 145
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 145
ccacgatcga cattgatctg gcta 24
<210> 146
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 146
gcgacatatc aggccaacag g 21
<210> 147
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 147
gggatatgtg tcctaccgta tcagg 25
<210> 148
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 148
ccagcataca gttagggccc a 21
<210> 149
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 149
gttgccttgg taggtccagc 20
<210> 150
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 150
cgaaaactca gcatgcggga a 21
<210> 151
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 151
gagccatcag tccaacactg c 21
<210> 152
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 152
acaggcgtac agcaacacca 20
<210> 153
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 153
gaccctatgg tgttggatcc ca 22
<210> 154
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 154
cgggagctag gcaacaaatc g 21
<210> 155
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 155
tctgactaaa cgggtggatg ctg 23
<210> 156
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 156
cggatcagtt gattcgctca ctttca 26
<210> 157
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 157
gccgaaaagc agcaactgga a 21
<210> 158
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 158
gattgctacg cagaccgcct a 21
<210> 159
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 159
cactattcct ccggcatgca g 21
<210> 160
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 160
tgacctattg atcggtcggc tc 22
<210> 161
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 161
tgccttgaat ctcagggatg ca 22
<210> 162
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 162
gccgaagcta actagcggac a 21
<210> 163
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 163
catggagtag cagctgtgct g 21
<210> 164
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 164
gaaaagcagt caccggctct g 21
<210> 165
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 165
ccatggacat gaattcggca cg 22
<210> 166
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 166
cttttgcacc acggagcaga c 21
<210> 167
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 167
gctagcaaaa ctttgaagct cgctc 25
<210> 168
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 168
gaggtccctt acgggtcatc g 21
<210> 169
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 169
accaggtcta tcttgcgcag ac 22
<210> 170
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 170
aatagcgtgg tcgggtccta g 21
<210> 171
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 171
acgaacgatc caaggtgcag t 21
<210> 172
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 172
tagagacgag gactctgggc t 21
<210> 173
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 173
aagtccaaca tgggcacaac c 21
<210> 174
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 174
cctcgttaag ggtgcaggtt g 21
<210> 175
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 175
ccaagtcagc ttctaagcca tcaaac 26
<210> 176
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 176
aaccctagac ttctgcctgg tg 22
<210> 177
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 177
gctcacttac gagcagatcc ca 22
<210> 178
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 178
ggtgcacgca tgttctcatg t 21
<210> 179
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 179
tgtttaccgc agccatgctt g 21
<210> 180
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 180
gttgtatacg gcatccatcc gct 23
<210> 181
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 181
gaatgaaact ggtggtctgc tcc 23
<210> 182
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 182
ccgacgaggt acaagtagca gg 22
<210> 183
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 183
cccgtagtcc agattcttgt ggt 23
<210> 184
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 184
gtcgtttgtt cggaagggga g 21
<210> 185
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 185
cgtagttgtc cggcatgtcc t 21
<210> 186
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 186
tgtatccctt cggtgagcac g 21
<210> 187
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 187
tgaatcgact cgctgacagg tg 22
<210> 188
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 188
ccacgatcga cattgatctg gcta 24
<210> 189
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 189
gggatatgtg tcctaccgta tcagg 25
<210> 190
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 190
gttgccttgg taggtccagc 20
<210> 191
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 191
gagccatcag tccaacactg c 21
<210> 192
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 192
tggcactaat ctcaccggct 20
<210> 193
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 193
agtcttagaa gtacgctacc gt 22
<210> 194
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 194
tacttggctt cggcggcga 19
<210> 195
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 195
gggtgacttt tacgcgtctc g 21
<210> 196
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 196
ggtcacgacg catggcctaa 20
<210> 197
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 197
aggatgcatg gatcaccgtc 20
<210> 198
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 198
gctctgttgt gcagccgtac 20
<210> 199
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 199
cgttgcagat accacagtgt ac 22
<210> 200
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 200
gctagtagct gtttacacgg cgtct 25
<210> 201
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 201
aggtcgagac aaccaagtag ag 22
<210> 202
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 202
acaggacatc gagcttgcat 20
<210> 203
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 203
cagaagaaag gcatcaactc atg 23
<210> 204
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 204
ctctttcacc tctactttta cttcag 26
<210> 205
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 205
attgaaccgt tgtcaaagcc a 21
<210> 206
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 206
cacagcgtca gggcggtaac 20
<210> 207
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 207
ggcacgcacc tgtcactgac 20
<210> 208
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 208
gtacgcgccc gggaactcct 20
<210> 209
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 209
cctgcggccc acgtgcatct 20
<210> 210
<211> 3213
<212> DNA
<213> artificial sequence
<220>
<223> optimal loci_ 204637
<400> 210
ggaaacgaga gtgggataaa caagcgtaaa aaatgaacgg gaacgagagt attaagcgga 60
aacttataat ttaatacaaa acacacgtga tattgatggc gagctagcag tacaacaaca 120
tggaacaaac agatacagag agacaattaa tactacattg ttatttgctt gtttgtggtg 180
tatatatata gctacgacca gcgttgttta agtctttagg acatttgtca ttaaggggag 240
gcaattaata ctacattgtt atttgcttgt ttgtggtgta catatagcta ggtagaataa 300
ccttttatgc tataatttgc atatataatg ctttagctaa tgcattaatg catcttgggc 360
cgatcccggg tttctaaaat atataataaa taccggttca acctggctaa aaacgagtgg 420
gatagaccct atcatgtttt agaatttttt cacaaataca aaaacagacg gatcaaatat 480
agaaaaatga tattggtcgg gacgtcctct ttcaacctta catgcgggtc ggtcgtcgag 540
ccaattttca gctttgcggg tgaagtaaaa gaagcgaagc caagtagcaa gcacgcatgg 600
gcatggccgc atgggccgtg cgggcgtgca tggcacatgg cagcgcgcag cacatcgatg 660
gatcctcggc tccagccggc gtcaggcgac acagatgtct tccgtgcaaa cggccgctga 720
aagagacgag acgaccgcgt tcttgtggaa gaaaagaagc gagatcgagg ctcggcgggg 780
cgcccccttg ggcagcaggc aaggcatcgg tacggatcca attccatgcg tgggaatctc 840
ccggagctag gccggaggga agggagcctg gggagagccg aaggggaaac agtgcggtcg 900
gcagcggtcc gcggtaggaa gggtgatgac aggagcggga gtaaatgcct gtagcccgta 960
ggggcacggt cgtctcccgt caaccggctg gccgccgcgc ccgcctcggt cgccatgcca 1020
cctgcagcag cagcagcatc gagcccctgc atgcattgca tgccatgcat gcagcagcag 1080
cagcaggcca ggtcaggcca ggtagcgtag cgcccgtagc gcgggctccg tccgtccatg 1140
tccctgtccc tggccgcagc tactaggagt actatagtgt gtagtactgc tcagcagccg 1200
tgcagtgcgg tgcgcggcgg aggggcgggc gagctggcaa agtggcaact ggcttggcta 1260
ggctagcttt ccgttggcgt ggttgggctt tgcaggacag ctggtgcacg tgacggggcg 1320
ggagggggca tgcttcccta tatcagccac agctaccgcc gtactagccc cccgcaccta 1380
gctttagcta gggccagccg gccgcccgtc tcccggctgc gttgtggttg tggtggagtg 1440
gatgggagat gagatggatg atgccattgt cacatcacgc acctgccgct gccgcgcgcg 1500
caaggcgcac ttgcctgccc tgggccctcc tcccaccggg ggtctcgtct ggcaccgtca 1560
cttcatgggg aggggaagca tgggcatggc tgcatggtgc gtgcaccacg cttcattcgt 1620
atatacagct gttagccggg atggatcggc tgatgctctc aactgaagtg atcgataaaa 1680
agcggtgcgt tggtattagc tggcctcgtg ccgtccggcg ggacgcgttg gaagcttttt 1740
cgactccggg gagacttttt ttttagactt gcaatccact ctcactgatc cactgctttt 1800
ctgctcgtgt gctaaactgc taactcggca atatagcatc actcatttgc ggtgcaactg 1860
cagtgcgcag cctacagatc caaagctacg tactgtactc taaattcctt gctgtagtac 1920
gtgaaacgtc atgcgtatcc ggccggctcc cgcgagacag gaagagacag cgactcgcag 1980
acttgcagct gcccagcagg cagtagcttg ccctttttaa tcgcagcact tggggttgac 2040
agtcacacac acactggtcg cggcgcggca gatgaggcgc cacaaatctg aaccagcata 2100
cagttagggc ccatgatttc ccccctttct ctatggtttt tatatataaa aaaactgatt 2160
tatatgaaac ttttgtatga ttcctcctaa attcctgcat ttcaaataag acatcgagct 2220
agtgtaagcg taggcctgca aagctgcagc tgcctgttcc ctgtactact tggcactaat 2280
ctcaccggct acgtgccttc gcatacggag tagtttattc gcggtgggac acttgataga 2340
aaggctacgg tagcgtactt ctaagactat ggtcatttaa aacactattt tatactatag 2400
tctatactgt tactacacta gagttaaaat ataaagatga atatagataa attactgaag 2460
atagtctaaa catcttttcc attttttaag aggacacgcc taaacagttg tgaatacata 2520
catacacacc gatacacaga tgctaaagca ctaaagcccc taaaaagttg gtgatacatg 2580
aaccaacacg aaatcgatca cctttgaacc cgccagtcct actaccactc tccttcgttt 2640
gacctagctg gctggttaag aaaaaaagtt cgttttccgt aaaagcgatc caagtgacaa 2700
cgacgagacg tgattttccg tacctgactg atgttgatac cagccactac tccgagctag 2760
tagtaaaaga tttttacagc caggggagag acggcgttcg tctgctagtg gctagaccgc 2820
gcgtgttgcg cgacgccggg ccggggcgcg cggtcggcca cggactggca gccggtgcga 2880
ggcacgccgc gtggtccagc tagatcgccg accgggcacg gcagacgacg gccggtccag 2940
cggctggaca cgggcacacg agagtacgag actgcgcgcg tttaggttgg taccactacc 3000
accatgcatg tcgcgactcg ctcgtccgat tatggagcaa aaacacctgt cgtcatgcga 3060
atcattgtac ggcatagcga taagaaaaaa aaacttaccg cttctagcat gcccgtcgta 3120
tgcgacgacg aagttgagaa atcatgccca agcaagcttc ccgcatgctg agttttcgct 3180
gaccctgttg gcctgatatg tcgctgaccc tga 3213
<210> 211
<211> 4938
<212> DNA
<213> artificial sequence
<220>
<223> optimal_loci_204726
<400> 211
ctcaatcgcc aaagtagaga atgatgtttt tcagcctaca ggccccaggt agcagctgtg 60
tgttgcaaag caacttgtat aatacaattg gacaagttcg agcttcaaat aactcatata 120
ccatgcaaag caaattggat ggttttcagc ccacgtaatt aaatggaaat caagttttcc 180
aacctgtcaa gcactacatg attaattgaa accttcagtt ctgcatgggt gccaatctgg 240
ccaatagaag tgttattgct tatgcagttt gcacatgatt taaatagatg aaaacaaata 300
acaaagtaga gttagtgctt gcagtcagct tgtcccactc ccatacttcc tttgcacttt 360
tcctcccagc aaattagtac cagcttttac gtgtcctcat cataacaagt attgaccatg 420
aatcaaaata cagacatcac tcacagctca cagttccagg ccatggttac aacctagcac 480
taagttgacc aaggcttcta aatttagaac ttttaatagc agaagtgcct tgaagatgta 540
aagcctgcaa atatacagga gggacaatga tcagattctc caccaacata actcactagt 600
gctttgggtt aacaataatc atataaagga accaagttat gctgacagaa aattatttgg 660
aataatacca gcaatcaaat aaaagaacca agttgtgctg acaaaagcaa cataaagacc 720
aagaaactat atgacaaaaa ttttgtgaat acatcattct tttgtgggcg aagagtatac 780
gtagatatta gtttatttaa aaaattaaaa aattggttta aaatttagtt aaagctcatt 840
ttttgcctga gtcaaggtaa tacaacacat cagtatcata tatccaaatc tgtggattca 900
ccagctcaaa ggaagatagc aaagataaca acaggttagc gttgctgaat tgtaaagtac 960
agaactagct agtgttgctg aattgtaaag tccacaagca aattgttgca gctcgccttc 1020
atgctaagaa attgacatgc tgaattgttg agcatgcagc tgaaacacac ttagataaac 1080
taaggtatat atacatgcag cctaattaaa gtactagaac tactaattac ttggtaatgc 1140
actacatatg tgtagaatgt tcagaggaac agctagcgtt gttccaacat gtgcatgaac 1200
ttttaactga aagggcatgt tttatcaatc tctttagacc tcagtagagt ttaggcagtg 1260
gaaagctact aactaggaga gatgtcattt attttttaac tatcacttaa caggcagaat 1320
tagccaaaca aaaaaaggac catgctttta catagacaac ctgtaaagtc catgtgacag 1380
aaaatatatt ggatgcaaac tgacttagga actaaaaaag cttgaatctt tttgtattta 1440
gatccaaaga acccctgacc atttttcaaa atggctgtta agaaaacctt gaaaattctt 1500
gtccattata tcctattgtt acttgatttc tgaaaccgat gtataaataa tcagagcaaa 1560
ctttactgaa aagtggtggc acatcgagga ggagaggaag caaccaggga aggcacggca 1620
taggaacgtg cgctgtgcac atgcgggctt attgtcttag ctagaaaagt ggtgtgagtc 1680
aggtcaggtc aggtcagagg gggatcgatg gaccgatccg attcggcagg cggaacaagt 1740
gaaggttcag tgcacggcga ggcgagtcca ccggagcgac tgagggaaac aaagcaaagc 1800
aaaagggaca gagggatccc agaacggggc gggggtgcgg acgacggaaa gcgaaagcga 1860
cggcacggag gggtgggcac cattagatta ctggtatctg gacggccgac caggtacagg 1920
cgtacagcaa caccagccac acacaccgac ccagccagca aaaccgctcc tccgcctttc 1980
ggcttccagc caggttttcg tttcgcgtgg ttttcccctc cctccgcgcg gcctactaaa 2040
tcaatcactc acccgccgtc gtcggggtgg ctggcacgcg tgcgctccag gggtgggctg 2100
ggtgcatgca cccgcgcggt taagctagct ctggcgcata gccgtccgcg tcaccgggag 2160
ctaggcaaca aatcggaggc ctctcgggcg cgcgcgtcgc tgtctgccgc agccgcagcc 2220
tgctgtactg tacttggctt cggcggcgac ccccgcgtcc aagtggttgc ctgggaggcc 2280
ccggctccgg gcatcgcgac gcgacgcgac gagacgcgta aaagtcaccc gtcgcggtct 2340
cgcatgcgcg agggaggcag gcaggcagcg aacaaaatcg cacgcgcgtc gtcgactgcc 2400
tggcctggcc tggtccagct gaaaaccgcc ccggtttgcc tccgtttgcg ggatctggat 2460
gggctgtttt cgcgctggcg ggggtcaatg caaaacgggc gatgtgccgt gtggtgtgcg 2520
cggcgcggcg tcactttccc ttaacttctc gcgctggaag aggcagctgc ctgcttttgc 2580
cgcagctgaa aaggaggagg aagaaaatga tcggccggat tggatggcga cggcgggcgg 2640
aagcggaacc ttcttgcttg gccgctgacc atgacacctg gccccgcttt gcagcccgtg 2700
gaggactctt ggcagctttt acgcgtgccg ccggtgtgcg tgcgttgtct aggcaaggca 2760
cggcaagcag agcacgcgag ggcggatgag gaattttgac actgcaaaaa tcccaaatcc 2820
gcaagtatgc acactcaccc gcacgaccag tagcgtgact gcgtgagtac tgtttagttg 2880
gtcacccata ggagtagcgt tctatatatg aacaggagaa acaaaaatat atgcccttgt 2940
tagtcgttcc gaatttcaaa aaaattggaa atcagtcgca cggcctacta tgctatatgc 3000
ccttggtagt cggcacgacg ggtatatacg ggatggaacc gagccggtgc gtgatttccg 3060
tggacgtgac attgattgga gtggtcatac agactgctgg gactggagtc ttgcatacaa 3120
acatccaaga cagcatccac ccgtttagtc agagtcagac tcgagtacga cgaatatcga 3180
tcagacaaga gccaaatcca tttgggatcc aacaccatag ggtcattatt gttttgggac 3240
catgggaccg gatcatgcgt atatactatg tgtctattat tagcatgccg acgcgcgcat 3300
tcggccgcta gataggccct ctgacagtaa ttaatatatg aggaggagag gaaatacttt 3360
ccacctattt ttttctcgct atagaggatc gttgtcaaaa aaacaacctt tttggttagg 3420
gtttgacctc tgtttatcca attcaatttg agtgaattaa tttttagtga caaatgatac 3480
atcaataaga catttatgat aacttcaatt ttcaagattt atgaacctag ccagttggat 3540
acctagataa aggtagagtg tactttcatt aaggatggac atgtgttagg tgtggaccca 3600
cataataata tgtatttgaa aagtacttaa agtaggaact tgtatcctaa tatgtatttg 3660
acatgcacgc gtgacttggt ggcctcggcg accgagcgcg gaggcaaggc atgtggcacc 3720
gatcgaagca ggcacatata actgtcgccg cgccgtatag agtcggcact gacccaccca 3780
cccctgcgtc ctagctagct agttgctact agctccgatc gcgatcggta gggtagggac 3840
gacgatacga tgcatggatt gaccaccgtg caaggtctgc agatgatgcc atcggtctct 3900
gacgatcatc tcgacacgga catccggaat tgtattgggt ctggtagctt ctggctgccg 3960
gccggctgct acttgtacgg ccaataatgc gtggtgagtg gtctgctgca ctggatctgc 4020
aggcgaggcg tctgatcatg cagcatatgc gtggtgcccc ggccgccacc cgcgtacgtt 4080
gttgcgaagc cgggaggaca gcacattgta cgtgcaccgg ccccatacta cttatggacg 4140
acagaatatg cgtggcagca gaaccccatg acgcgggtgt ccgctggcga gcacggggcc 4200
ggagagacgg ccgcgacgtg acgagggaac aaccacccca acccaaccaa cgcgcgtagg 4260
ctcagcccgg cggcggcccc tgcccaggag ccgggcgggc tccacgtaca tcgatcagtt 4320
ggattcgatc actgtgcaga tccacgatcc atgccccatc tccatgcgtg tcttgtcctc 4380
ttgcttgcta tcaacctgac atccaagtgg tgcacagcgt gaggagatcg gagcggagat 4440
ccgggctgtg tctgtgcgcg gcatgtccgt acgcgcagtg tacgccgcag tcctgctcct 4500
gcacgcggtc acgggacggg actgagccaa ctcgatctga ggatgattgt ttttctgggc 4560
ccgcgctgcg cgccttgtgt ttgttcgacg tgtttttgtg catctacggc gccgatcgta 4620
tagtagcatg tctgaaatct gaatgcctgg tgatagctca gctgcctgcc tgcgccctgc 4680
ggcattgcag ttgcagccct gttgattctc gatttgggaa caccaagaca ggcgcagatg 4740
aattgcatgt gtccgtaata tgcctgcact gcaccctgca taggttgcag taacaaacta 4800
acaatccctg gacaacgtac gcgtgacaac gtcttgacca ggagaagagc aacgcgcgcc 4860
acaggcatcc ggccagagat gccgcaaggc ctgactagcc cagcggccag cgccactgca 4920
tgcattgcat ccaggacc 4938
<210> 212
<211> 1370
<212> DNA
<213> artificial sequence
<220>
<223> optimal_loci_156393
<400> 212
acggaagttg gcgccgcgag agcaggacgt ggtttggacc agaccagatc agagcgtcgg 60
tcggttcctg ttcctggtgg tatggcaccc atggaggccg ataaactaac tagtcaaggc 120
attggatccc gcgggcctgg aaaagcagtc accggctctg gacctgggac tgggaggcaa 180
gccctccggc ttttgcacca cggagcagac acgggctcca ggaatcgatt cagtgcagcg 240
gcacgccgag gcgcctcaca tgattcctca gcacatgcct gcctgcactg cacagccggg 300
aagtctgttc acttgtactg cgtcgtccct tggcgcgagg atgatagcta aggctcgctt 360
cccgcgacac acgtacccac gcacgcacgg aaccagaacg ttttgccgac ttcgtgtgat 420
caaggaccgt tgatcacgcc gcgctgctac taaaggatat ataaaaaaaa tgacagcgct 480
cggcgtcttc aggcttcaga accgttgatc aaggacgatg agcttgagag ctgaatccgg 540
acggatcgga ctgcgtcgac gacgataaac agcagtgcct gcatgctctg ttgtgcagcc 600
gtacgtgccg tgcgccggtg tatgtctgca tgcgcagtac ttattttctg aagcaggtat 660
atacaatata ctagctagta cactgtggta tctgcaacgt agtactgatc tggattctcc 720
atgttggcgt gtatactctc ttttcttcac aggatcaagt tcatgcactg agcaccagat 780
cagattcagc caccgatcga gggagaggga gtgccggagc cggagcagga cagggggcgg 840
cgacgtccca cgtgcacggc gatctcaatt atattctcat gcatgcagcg gacaccggat 900
cgaggaagcg cggcaaagcc tcgtgatttc gatcggacgc cccgatcgca tcgcatcgca 960
tcgcatcgca tcgcagcagt gcgcaagggc agaaccgcag ggcatggcgc ccgaacggag 1020
cccatcagcg cccagtcgat cggcaagccc agagcgagct tcaaagtttt gctagcttcg 1080
tgccgaattc atgtccatgg atatcggaat gtgcatgcag cagttgttgc cgggcaattg 1140
atgcagacaa ctcttttttt tttttcaaat atccgggttt atttatatat atacgagata 1200
caatagatag ctttggccac aagcgattaa atgacgctgg tcggtaggga agcttctggt 1260
ggagaccaga cttgagaaaa aaaataaacc caagacctat aaaggcaaga caatcatgcg 1320
tgctctgtcc tccgggaaga taaatggctg catgaagcag ttgaataaaa 1370
<210> 213
<211> 1190
<212> DNA
<213> artificial sequence
<220>
<223> optimal_loci_198387
<400> 213
gaacatcctg catgcatata gcctggctgg tggcagcatt cttttcttca tgcgagccag 60
acccttttta tcaggaaacc aatcaaaccc tagacttctg cctggtgcac gcatgttctc 120
atgtcattta agaaatgcac ataattttgc cggttctgta cgattaggac ttttcattta 180
atttcgtaca tttttaccaa aagttagtca gattagttca aaataaataa aaaactagtt 240
tttccccaaa aatcataaga ccatttgtgg taaagcatta ttatatgata acaaaagaaa 300
actaaggtct tgtttggttg accttgtgag ttgtgaagct gcttttgttt tggtcaaaac 360
caaaagtcaa taaagaggag aaaagaaata gctacttttg ctctagtaca taatttatga 420
ctctttcacc tctactttta cttcagttgt gaaaaataac gatttatttt cctcgtttct 480
tgtgcccgaa agagagaggt gtaacccatc ctctataaca gtgtggcttt gacaacggtt 540
caatatgtat gtttggatgc aggcccaagg tcgcttggcc aaatattggc cttgacaaac 600
caatttggcc catgtttagt tggaggccaa atgttggcca tgaccaggaa attttggtcg 660
tgcaaatgta gatttgtgcc aattcttggt cataatcagc gcggacaaac cggctaccca 720
aatttggctt ggtcgtattg cattttaacc ataaaccaaa catccaaact tgaacccaat 780
tttggcttga tccaactttg gccagctacc taattttagc atttctctgg tccacaacac 840
aacaggccct agtgcgagcg tggccctggc acgctaccct gccttgacgc gtgtgaagcc 900
ttagtggcag cctcaaccgc aggtgtggat ccggcggcgg tcatggcgtg tgcggccctg 960
acaatggcca tggtgcaggc gcttccaaca tggtcatggc gtgggacagc atgcggtcct 1020
gtccccagcg catgtgttgc cccaacacaa gcatggctgc ggtaaacaac tttggcgaga 1080
ggaagatgga aatgtgagtc taacaagtgg gtctgcttat aagtgtgtga gagagaaagt 1140
tgagtggatg acatgtggga tctgctcgta agtgagctac aataaacacg 1190
<210> 214
<211> 3965
<212> DNA
<213> artificial sequence
<220>
<223> optimal_loci_31710
<400> 214
gtttgtttca atttcataat ttaccattgc aacagctgct cttcgacgca gaaacatttg 60
tcgtggttgg agaaatatgt atatgtgcaa ccaacaaagt tcagattgat tacgacgaag 120
atcggcgcta gcttgtttca agagaaaaca aatgcatctc ttgaggcaac atcggagaga 180
caaaaatggc atgtagtttt cttacacaca acggaattgc tgatgaaggt tttagtgatt 240
gatggatgat atttgtagta actagtttta ttcatcaagg gaagtttgtt ccaatggaaa 300
tgtgcacaac tactaaaaat atcttatcgt ctcagaagga agaattggtg aatatattta 360
gcctcatttc ctagacgcat acatatattc catactaagt caataaatcc atggacacca 420
aaatgctgca taattagcga atgcaaggat gcctcgccgg ttttaagaaa ttctggtagt 480
agcttgcaag ccaacgccaa gacgacgaac tagtcttaag ttgaaaagat cctgatggta 540
aaactctatc atctttcctt tgcctcattg tcttgcatga caattttttg gtttttctgt 600
gttctgattt aattggttga atgttgtaag acagaaactg ggttacttca ttatcttaat 660
gaaataaaat cccttcataa aaaaaaagct tgaatgtctt agtgatctag ctcgtatttc 720
tctcttttga agcttccttg tccgttgcag tatcgtccaa ttgcagaaaa aatggtgtgg 780
aaatttgatg ttttcttgtg ccaagatggc tcatcaggtg ttgtatttgt atatattctc 840
tcccttttaa aattaggcaa tatcgggtgg ttagtgactt ggttctctca ccatgatgcc 900
actatcaacc tccatttgtt cagaagatat tcgcaaaaat atacagccat tctaattaag 960
ttcgtgttgt ggaagatgta aatctgttgt cctaacctgt ctaaatatga acaaagataa 1020
ctagattgtt tgcacgtata gacacagcac caaattcgac caaatctggc ctcattgcag 1080
aagtgtaaaa tgttaacaac tactacgcac agctcctgct gtatttgtgt aaaactgaca 1140
aagaaacttg tgggcggcgg attcggtgag ctttatctct acgtgttgca ctttagatgt 1200
ttatatataa attctgttga caaaagatta ctggagtttc tagttccacc cagttaaggc 1260
cgtacgccaa ccctttgaag agttgggatc ttctacgtgg catgattcat ttctgacagg 1320
gattattatt aatggagaag tttccttaag ttcgaagcat ggctaaacaa gcaacaccta 1380
actaacctcc tgcatagggt aaaacagtcc ccgaatattg tattaagaag aagacaggtg 1440
aagtaaactc gtaaagcggc accatatata gggcattgtg agaacggtcg cagttaggat 1500
tgggtcttag acatgtgctt ttggcgtgag attcagaaga tctaaggatt gctacgcaga 1560
ccgcctaatc atataaatta tgaaccaatg catggattaa ctaataatat cgatagatgt 1620
gtcttttttt tctctctatt ctgtgggatc ggatcagttg attcgctcac tttcactcac 1680
ttttcttttg cgccgatgtg tccgcagtta ccttccccat catgaacttg gagaccgaaa 1740
ggtgtggtgc ctagttaccc cgtactgcaa tttaccaatg gcgctggggt ggaaataaag 1800
ggcaggcgca caacacagaa aggaccagca gcagcaccac caccaccggg cactagctag 1860
ctagctctct ggtcaatgga gcatgcagct tagctgggat tcagacactg ttgctggctt 1920
gctgctgctg caattgcttg ttcaaggcga acacaagaga gatccgaagc atggttgagt 1980
ctctgggcgt agaaaacagt gccggtttcc atcggttaga caagaacgca agagagagat 2040
cgtccatacg acgtgcatga ggaccagatg gagattcaga gacgacccca tcttctttgc 2100
ataaagaaac tagatgaagc ttgtgtcgtc gcctataaga aatgaaacat ctgcattgtc 2160
agcgtagtat cccagctgat ggagaggaca tacccatgag gcaataaatc aaacgacctt 2220
ttaattttta cagccaatgc attgcatgct gcattatcaa actggcgaaa agtgcttttt 2280
tttaaggggg ggaaggctac catgggttgc attgaccgag tgccccctct cgtagggcct 2340
atgccacatt actttcttga aaggcaacca caggctgatc tggaagtcca ttccacggtg 2400
gcatgcatgg gcggcgccac acgtcagtca tccgctcgag ggcaagcttc ggtcgatcga 2460
tgacgctgcc cggctgcatg ccggaggaat agtggagaag ggtgcagagc agagggatgg 2520
tcagatcatt ccagttgctg cttttcggca cttgcatatg tgatatatgg agcaaacagc 2580
accgctggct ggatggatcg gatcgcatac accatatatg atcgaagatg agcctagcca 2640
tgcatgttgc aatatggact actatgtaca tctgtcgcac gtactagctt gatattaatt 2700
cagtgtacat ccaattacac acatgcatat gcagtaactg gacgtttatt tgcacacttg 2760
cactatatac acatcgatca gacgtcgctc cagagtacat tcagcactgg gtttttcttt 2820
tctttgggac tgactgctat gctagcaagt cactaactca ctatagctag ctagctagct 2880
ttgtcttgtg ttttttttcc ctgtggatgg atcgtcctgg cagtggagga gattgttggt 2940
ggggtggtgg agctgagatg cagcattatt tgaaagagat gcgcgtcaaa tgattaagtc 3000
agggacgcct ttccacatat tcgtgattca gttgggcata ttgcactgca ggcaggctag 3060
ctagttgacc agaaaagtga gttgttgttg cattgcattg catgcatgag atccaagtac 3120
gtgttaacct gggtaggatg tttcctaaca tgatcacaca cttccccatc atcatatcac 3180
tagtaagcta gcccttgctg gaatgtacag gacccaacaa aaagaccatg catgcatgca 3240
tgactaaagt ccataatgta acactgacag acagaggata tagatagaac agccgcgccg 3300
gcctgaagaa acatcagcag gtcatcaacc acttagtggc tgcatgctcc tactagtctc 3360
ggcaggccat ttctttctag aggacaaaaa cgcttgcaag ggtactctag cttagacggg 3420
cagagatcga gatgggtagc tagtgggagg tgtggtaatg ctgtgcccat ttgctggagg 3480
ctagctgctt gttggagagc tagctaaggc gtgggagagg ccaggggggg ataagagatg 3540
atgctcgggc aaggcaactt gggtggtcgg gccgagacct gcaaaaggca agtagtagct 3600
gagctgggac gacggcattg gaggcctctt ttttccgatc ccgctttacc acttctttct 3660
atcgcatctc atcgatcccc caatcccagc cgatcctcgc tcatcgtggc cccataatgc 3720
gtgctgcccg ctagcttagc tgccattgcc attggaagca ccagtccata gcagcgcgtt 3780
gctgcatccg gcggctgcct gttggggagg agacgatgca tgcacgcgtc caatccggtt 3840
gttcgttctc aataatatca ccccggcccg gcccgtattt agagatattc gcccgagcgc 3900
agtccagcta gcacagcaac gcagtcgcag tgcatgcaat gcaagttgga gtctgtcagc 3960
gttac 3965
<210> 215
<211> 1330
<212> DNA
<213> Artificial Sequence
<220>
<223> optimal_loci_31710
<400> 215
tatatatatc cggttggcgc ttaaaaaaaa tccaagctac gcggtgtgtg tcatcgatcg 60
gttgttgctt ggagagcatg gaaaggctgg gcatcactgg gactggtaga gcattgcatg 120
ggtgccctac tcgactagcc gactccttcc ttgattgctc gccggtcgcg cgcgcggcgc 180
gcgggcccat gcaacatgca tgcatgatga atgggggccg ccgggacagg gcgcccatgc 240
tggggtgctt gacctattga tcggtcggct cctcggccgc ggcgcgcgcg attccaccac 300
caccgtcgcc ggtcacccgc cgaagctaac tagcggacac ccggcgcgcg gctccggcgc 360
ttttccccca tggccccatc cctctcccaa agtggaaaag gggggaaaag ggataagaag 420
ggacaaaacc acggaaggta cgtggaacgt gggtgagggt ctggaagcca agatagggtc 480
acgacgcatg gcctaaaaag tgtcgcgagg cagggagcag ccgcgtgtcc gcctgctgct 540
gctggaatgg cgcggtggcc gcgcgcggtg acggtgatcc atgcatcctc ctgtcctatg 600
tacaacctca aagctactac gactactact gtggttttta tactccgtat atatgagaac 660
tacaagtcgg caaggctggt ctcgcctgct cttgccaagc aaagtgagta gttacacggc 720
gctggctgat gcatgcgtga cacggtggct agctagctgt tgatcccggc cggcccgtgg 780
acgaacccgt acgcgtacgt gtgtttgcgt tgcatcccaa acaagtgctc ggttgctgtt 840
gccgtggacg atcgatcgat cggcccacgc atcacatcat cattcattcc ggccggatcg 900
atcgggcact gtggaagcaa cgaaaccgcg cgcagccgcc actgtggctt ggccttggtg 960
gcagcaggag gacgcagctg cggccggtgg ggcaggggcg gaggcggagg cggaggcgcg 1020
gagcaagcag cacagctgct actccatgca tgcatccctg agattcaagg catcaagcaa 1080
gcgtctgcgt ctctgagact ctgactctct gtagcgacta gtggtgggcg agggtcgagt 1140
ggtcgacgca gtaagctcag gtcagggcca ctgggccagc atcgatttta tggcaagaca 1200
tgggcgcgcg cgagatgggc acccacagtc gactgcccct ctgcatgtgg ccctggcacc 1260
ccgcctgcag gcctacacaa cacaacagcg ggagcagtcg gctgcagagg atcccgtccc 1320
cagaaggcca 1330
<210> 216
<211> 1081
<212> DNA
<213> artificial sequence
<220>
<223> optimal_loci_197372
<400> 216
agaacgggtc ggtatcgagg agcggcgaga taatagaggc aatgtgacaa tgtgtaaaca 60
cttagggtcc tagcatcctt gaagtatgtg tatgtgctaa agaaatagca cttggctcct 120
tggaaggtcc tagagacgag gactctgggc tcctcgttaa gggtgcaggt tgaagtggag 180
acccagagct actagcaatt acaggccatg aggagatagt atccctcatc caacattgag 240
tatccatggt ataggtactt atttataacc aactgctctt gttgtcttct ttgttgtatg 300
aactatagta actcaagcat atatctagat cagtagtgat ggtgaaatcc ctagtggaag 360
tcgatgccac acgtaaattc tttgtttggc tactcaatag aagaagattt atatacccac 420
accccaagaa acttgccccc cagccatcca tcaatccaaa gataacccaa attgtagcac 480
tagatgttga aacgagtcgt gttgagcaag gaacaatgtc tacactgaag atggtggcag 540
gacaggacat cgagcttgca ttaactagca aagtgattcc ttccatccat gcaagaagct 600
acatcccagt gggtgcggca aaagccacac taacacttca tgagttgatg cctttcttct 660
gaatgttcaa ttcaaatctt gcatgggcga gggagctcta gtctaagctg tatgaaaagg 720
ttggagactt ccatacaact gttgtgtgtc gagtagtaga aaccaacaac aaagtcattg 780
tatggtactt agagtagata gggacaacat gctattgtgt gccaagtagc aagaaacaac 840
aatggagcca ctatatgcta cttagattag ttggactagc ttagaccata gttttccaat 900
ggcttagagc tgaattggaa gatctggtca tgtctgagtt ggacttgtac tcttgtcaaa 960
ctaggtttgg accatggttg tttgatggct tagaagctga cttggaatac ttggttgtgc 1020
ccatgttgga cttgtactct tagttgaatt gggtttggaa catagttgtc ccttagctta 1080
g 1081
<210> 217
<211> 3903
<212> DNA
<213> artificial sequence
<220>
<223> optimal_loci_232228
<220>
<221> misc_feature
<222> (2818)..(2917)
<223> n is a, c, g, or t
<400> 217
ccgtgtgtca gcatcacgtg cgcggcgaga ggaaggatga cgatggcttg gttgctcgta 60
gttgtagaga gatagaatga aagcttcttt cagttctttg tatatgtaaa ttcttgctaa 120
taattttttg ttttaaatat acatatatat taacgttttc gtggatggtt attgttgtag 180
tacttaacat gagaatgagt gcatggccgg aatgggatgg catgatgaac catttcaatt 240
tagtatcagc cttcggtggg aagcaaacca taagcgcgcg tacacatacc acaccacacc 300
ggcatgagtg caaggcatta acgactcgca atggatgtcc tgtcgaagcg agagggacgg 360
ggtgggtggc ctgggtccgg cattatccct ttgccgagct cgagcagatc aggcgaaaaa 420
aaatcggatg aggctgctcc ggcgcggagt cggccaccga agcgagtgca ggcgcaggca 480
gccagccgtc gtggatcccg cgatccgggc cccgggatct ccgctgccca catggcccgg 540
tggccgccag ggtggtggcc gcacggagag gcgtccggat cgggcaccgc ggctgccgct 600
gggaggacgt gggacccacc tctggacatc aggacgtcag gcgcatgttc tcgtaggcca 660
cgcgctgaca cgatcaactg ttgcggaaca aaaatggcgc tgtgtcacgt ccatcatcca 720
tgccgtcagt ataagcaagt actactaatc gagcgcgatg cacgctgatt ggcgaccgag 780
gtggtgctaa ttattggtgc ctgtactacc taaatggcta ctgcatggaa cggaatcacc 840
ggaggcaggc aggcaggcag cgatgacgag tcttaggcca gagtcgctgc gggcacctgt 900
cgcctcacgg gcgcctggtt gccgtcacgg gctgtgcctg ctcggcttcg gcttcggctt 960
cggctccgcc tgccgccccg cgcgcgctcg gatcggttgg tttggctgct cctatccgga 1020
acgggatgga ttccgatagg tggatgagta aaactaactg gagcgagccg ggaccggcag 1080
gcagaggcgc cgcgcgctcc acgtcgacca accagctcct ccagtcccac tagccgggga 1140
cggggaggac agcatccgat gtggccacac ccgcttcacc agccggccgg tgaccacttc 1200
gaccagcgag cgagccgttg tgtggctgct ggttggacag ccgacgcgcg cgccgggggg 1260
gccccgcttg ttgtatacgg catccatccg ctgccgctgc ggcgggcggg cgggcgggtg 1320
ccgacgaggt acaagtagca ggacaggagt gcaggatggc tgcgcggcta cctgaccgtg 1380
acccgcgacg gggacggggg ggaccccgtc gccgtcggca cagcgtcagg gcggtaacat 1440
gcgttccgtt gcgcgtacgg accaccggtg tcgtctaaca ggaagagctg tcagtgacag 1500
gtgcgtgccg ccgagtgacg gccgcgcaac ccatccgcgc gctcctgctc cggctagcct 1560
atccagtgcg gttcgtggtg ttcctctcag cgtgtctcgt cgtcggcccg gtcggcagcg 1620
gcagaatttc atttcagact gttgcctcgc cgaggattgt gcagattttt ttttgtgtgc 1680
cggccgatgg agagtttccc gtacaaaagt tgtggatgca ggttacacca tatccagtga 1740
atactcattc ttagccttgt ttacgtacta cggttccaaa gataggctaa cttaatactt 1800
ctgcatgaac aaccctcctc ccacacacca tctcagctca ctatccaaac ttcaatacgt 1860
tcagcaaatg aaaaacaaag tacaaacaaa cgaagctaag aataaagatg ttgggacgat 1920
taagttataa tcatgcattt acggttttcc acgtagacag gggtatatga tgaaaaagaa 1980
cattaattat gccaaaactt tagtggtact gaactagtat aggtattgat ccactgaatg 2040
attaaaaaaa aatcaacatc cattgtgcct cacaaagaga taggcaaaac ttcacggcaa 2100
agtaatatga tccagggcaa atatgtatgg cacattaaat gataactcca agtggatctt 2160
tcatgttctt tatcttcagt gctaatacca caagaatctg gactacggga gcagaccacc 2220
agtttcattc atatattttt tttatgaaaa aaaattatag tacgtatcag gggtgggtct 2280
gtgggtgggg ctacttgctg cactcaaaac gtcaagtagt tgtctagatg gcacatagcc 2340
tatcaactat caagttcatt acaaaaatta tatacaaatg caacaggtca atggaaggat 2400
catatttaag ctgggttcag gagcagtagt gaacaataca cacttttcag tccactagcc 2460
taacacttca gtgcagcagt tgacctatac acaatagcaa tgttttagtt caaatttacc 2520
tgaaacacag cataccactt gaactcccag actccagatt ggtggtctac cacatgtcaa 2580
ctgagttgtg ccagggttga catataaagc agtacacaaa atgtttcagt cataaatgtg 2640
gaaaaacaca tcatgcaact actaggattt tactaccaga tagatagtgg acacaaacat 2700
caccgagata cttccctgaa aaggaaagaa attgcaacat cacggtacaa gtaaaatgtg 2760
aaggacaaca acacgggcgt agaacatgga gagacgtctg tgtcgagcaa agtgtaannn 2820
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2880
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnaat atatagtcac actgcaaaag 2940
atatggacaa gttcaagtgt caactgatgt taaatggtaa ttaaacattc atattaatag 3000
gagagcaatg ttctacgatg tgggggtggg gggggggtgc tgagctagac agtcaaagaa 3060
agccctcgac aacctaaaag aactatgcgg tttttggatg acaactagca tgactaggca 3120
gccatcctgc aatggagatt gacgttgttt cctcaaaaaa aaaatgtagg ccggtgttgc 3180
atgcatggaa tttttttttg aactgccaaa tgccccttct gcctaaaagt ttaggcttta 3240
agcacaactg gttaagctaa ttaggactac taaaatgtag acttaaacaa ttttatgcag 3300
tacctgacag atgcagcttc gtgctcagca gctagcgtta gtaaagaagc atggatactc 3360
tttaaatata gctatttata gcatctaccg tctaggtgag taggcagaca ttgttcagca 3420
tttgagccct tggaattttc tagtaaaatg tcatttttat aagaattgca aaaggttcca 3480
cccatgcagc catgctgcac tagttcgaaa gagaaatggt gtgtgctttt tttaaggaaa 3540
cattttccag tagtcttcta aacaatccct cgaagctggt agccgaccag ctacatgccc 3600
aatcccaaat ttgttttttc taacaaaatt tcaaaaatgt aactgaaaac aagatctagc 3660
agcaaatata actaaaaaac ctgctaagca gtaacaatag gactttaagc tctggttgca 3720
gtataaatat aatcaaaatg cggtggttat gtgatctgta gttcagattg caaagatttt 3780
caagctagga ataacgcctt gcatcatcag attcctttgg ttcaaacata tgataaacct 3840
gagataaaat ttaaactatt cttgttcttc ccacatagca ttctgggtaa gccattaaac 3900
ttc 3903
<210> 218
<211> 1172
<212> DNA
<213> Artificial Sequence
<220>
<223> optimal_loci_285621
<400> 218
tacaacaaac cgaattttaa tttacaagaa aataagaatt tttgaacaaa tatatttctg 60
aacttatgag aatctctagt tttttttata ttttttcatg ctttgttttt gaattcgaaa 120
ttccaaacga aaaaaaatca aaaaaaagac ggtagaattt gtttctgtcg tttgttcgga 180
aggggagaaa acggcgaaac ccggcgaatc ccgagcggga tttgtatccc ttcggtgagc 240
acgcggccca cgcacacggc agcgatcgtg tccacggtgt tatccggcag cacaaacctg 300
ctgcgcaaga acttgcccat ccgccgctcc atgcgcaggt attggcgtct cgcgctcctc 360
tggttgccgc tcgtcgctga tcaccagtat ctactcgtac agtactccat ggatgcgtac 420
gcgcccggga actcctcggc gtcgtccggg ctgaccgaca tggcacgcgc atcgaggatg 480
tagatgcacg tgggccgcag gccaggtctg gccgtctggg gccgtgacgc cgggagccgc 540
gccgctgtca aaccgcgtca gctcaatcct agggtccgtt ttctcaattc ccaacgctgt 600
agacgaaagg ggtggtgtgg gcctgagagg tagagggccc cggccggggc tactcgatcc 660
ggccatcatc ggctcgccgg agctcaccgt gtgcgtgtcc tacaccacgt gaccactcgc 720
ctccatgaat catcatcaat tccacccctt tgccaaggca caatggccaa ccatgtgcgt 780
gctgttaatt aatttaattt aacggaacct tgagggtttc ttttttgaaa aaaataattg 840
accagaataa tccgatcgca tcaccacttc accggcagtc ctgcagtcca acactggaag 900
cgaagcgacc tctctctgtc ttgcgtgcaa cccggccgag cgcgtcacgc gtccatctgc 960
cgcttcgttc tggcttggcg caaatgagca tcacatgatt ggccgacacc agcaggcatt 1020
gcagatcgca caagcggggg atgtgatgtg acgtgaggca tacacctgtc agcgagtcga 1080
ttcagggcga cacaacgaat ggagtcgagt agaacgagag gacatgccgg acaactacgc 1140
ctcgccgagc ctgcgagctg taccgaccgg at 1172
<210> 219
<211> 1275
<212> DNA
<213> artificial sequence
<220>
<223> optimal_loci_157315
<400> 219
ggaccctata cactgaagat ctgccttgac tatggctaag gctgaggccc accgagcagg 60
ggttgctcct aaggctcatt ggagaggaga cagttccaca ccacgagttt gatagaacag 120
tctagaacaa cccggggccc tataggcagc tccaaccata agcgcttcta gatttagttc 180
tcatggacgg ccgaggtccc ttacgggtca tcggatctct aataaggtcc tcagtcttat 240
tagagaatag cgtggtcggg tcctagctag ggcctctccg gacttaaggc cggcctcctg 300
atgagaagat aaatgagttc ctgatgggaa gcaccagcat atcagagaac ataacttatt 360
acgatttttt tttgtttgtg cgaggagagc ttattatttt gatggctagg tgtagtcatc 420
aaggtagaaa acgatctttc attagcacga acaccttact gtaaataata agtagtcgtg 480
tagaaaacat ttgaccttca aaggctgcaa cgagtaaatt aaaagaaaca tgcatgtgca 540
ttattcaatg tttcaacgaa aacgtggaac ttgattttta ttttgcgtga gggagcttaa 600
ttatttctgt tgatgtgtaa acacgttgga aatggggccc ccgaaccaca cgtcatactt 660
tttttaatta tttttgtagg ttgctatgct gagctagtag ctgtttacac ggcgtctgtt 720
attctgataa ggaactatat acaaaaccac acatgcacac gtggtcaagg tagtgactaa 780
tctcgcctaa taccactgac aaatcatctc tacttggttg tctcgaccta tagttgctaa 840
aatccatgtg gctaaacttt agttttctct gagttgacga ttaattatta catatacttt 900
atacttgaac tatagttacc tgcatgttgt aaaattatct aaaaattcac gtaggtcaaa 960
tgtggaagaa gtgccataga aaacaacagt cccatattgt gcatcggcaa tgaataatac 1020
cacgtgctac cgaacacggt gaggattact ggtcgttcgt cccgtgatca agctggtagg 1080
tggtatatat gcagctctta tgaagttgtt gagaagattg acgcagtgat ctatcgtcaa 1140
actgaaacgg agacgggcat cactgcacct tggatcgttc gtgcgtttcc atttccattt 1200
ctctgctgcc cgcagccagt gtgcagccgt cgtctgcgca agatagacct ggtcatccgc 1260
tagagcgagc cctgt 1275
Claims (51)
- 부위 특이적 뉴클레아제 결합 도메인, 서열 142의 폴리뉴클레오티드 서열을 포함하는 분석 도메인 및 플라스미드 도메인을 포함하는 폴리뉴클레오티드 공여자 카세트.
- 제1항에 있어서, 폴리뉴클레오티드 공여자 카세트가 3 Kbp 미만의 길이를 포함하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제1항의 폴리뉴클레오티드 공여자 카세트를 포함하는 트랜스제닉 세포.
- 제3항에 있어서, 세포가 트랜스제닉 식물 세포인 트랜스제닉 세포.
- 제4항의 트랜스제닉 식물 세포를 포함하는 트랜스제닉 식물.
- 제5항에 있어서, 식물이 단자엽 식물인 트랜스제닉 식물.
- 제6항에 있어서, 단자엽 식물이 옥수수 식물, 밀 식물 및 벼 식물로 이루어진 군으로부터 선택된 것인 트랜스제닉 식물.
- 제5항에 있어서, 식물이 쌍자엽 식물인 트랜스제닉 식물.
- 제8항에 있어서, 쌍자엽 식물이 대두 식물, 목화 식물 및 카놀라 식물로 이루어진 군으로부터 선택된 것인 트랜스제닉 식물.
- 제5항의 트랜스제닉 식물로부터의 트랜스제닉 종자.
- 제1항에 있어서, 폴리뉴클레오티드 공여자 카세트가 서열 132의 폴리뉴클레오티드 서열, 서열 133의 폴리뉴클레오티드 서열, 서열 134의 폴리뉴클레오티드 서열, 서열 135의 폴리뉴클레오티드 서열, 서열 136의 폴리뉴클레오티드 서열, 서열 137의 폴리뉴클레오티드 서열, 서열 138의 폴리뉴클레오티드 서열, 서열 139의 폴리뉴클레오티드 서열, 서열 140의 폴리뉴클레오티드 서열 및 서열 141의 폴리뉴클레오티드 서열로 이루어진 군으로부터 선택된 서열을 포함하는 폴리뉴클레오티드 공여자 카세트.
- 제1항에 있어서, 부위 특이적 뉴클레아제 결합 도메인이 2개 이상의 부위 특이적 뉴클레아제 결합 서열을 포함하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제1항에 있어서, 부위 특이적 뉴클레아제 결합 도메인이 아연 핑거 결합 단백질, 메가뉴클레아제 결합 단백질, CRISPR 결합 단백질 또는 TALEN 결합 단백질에 의해 결합된 것인 폴리뉴클레오티드 공여자 카세트.
- 제1항에 있어서, 분석 도메인이 1개 이상의 제한 효소 서열을 포함하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제1항에 있어서, 분석 도메인이 40% 내지 60%의 구아닌 및 시토신 염기 쌍 백분율을 포함하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제1항에 있어서, 분석 도메인이 9개 염기 쌍 초과의 길이를 갖는 어떠한 반복 서열도 함유하지 않는 폴리뉴클레오티드를 포함하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제11항에 있어서, 분석 도메인이 9 Bp 초과의 길이의 일련의 동일한 염기 쌍 서열을 함유하지 않는 폴리뉴클레오티드를 포함하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제1항에 있어서, 분석 도메인이 -19 kcal/mol 초과의 자유 에너지 (ΔG)의 2차 구조를 갖는 폴리뉴클레오티드를 포함하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제1항에 있어서, 분석 도메인이 1개 이상의 프라이머 결합 서열을 포함하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제1항에 있어서, 폴리뉴클레오티드 공여자 카세트가 1개 이상의 상동성 아암 서열을 포함하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제20항에 있어서, 1개 이상의 상동성 아암 서열이 50 내지 100개 염기 쌍 길이인 폴리뉴클레오티드 공여자 카세트.
- 제20항에 있어서, 1개 이상의 상동성 아암 서열이 게놈 유전자좌와 적어도 80% 서열 동일성을 공유하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제22항에 있어서, 게놈 유전자좌가 최적 유전자좌_204637, 최적_유전자좌_204726, 최적_유전자좌_156393, 최적_유전자좌_198387, 최적_유전자좌_31710, 최적_유전자좌_64542, 최적_유전자좌_197372, 최적_유전자좌_232228, 최적_유전자좌_285621 및 최적_유전자좌_157315로 이루어진 군으로부터 선택된 것인 폴리뉴클레오티드 공여자 카세트.
- 제1항에 있어서, 분석 도메인이 펩티드를 코딩하지 않는 것인 폴리뉴클레오티드 공여자 카세트.
- 제1항에 있어서, 분석 도메인이 펩티드를 코딩하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제25항에 있어서, 분석 도메인이 트랜스진을 포함하는 유전자 발현 카세트를 포함하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제26항에 있어서, 유전자 발현 카세트가 프로모터를 포함하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제26항에 있어서, 트랜스진이 리포터 유전자를 포함하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제28항에 있어서, 리포터 유전자가 yfp 유전자, gus 유전자, rfp 유전자, gfp 유전자, 카나마이신 저항성 유전자, aad-1 유전자, aad-12 유전자, pat 유전자 및 글리포세이트 내성 유전자로 이루어진 군으로부터 선택된 것인 폴리뉴클레오티드 공여자 카세트.
- 제1항에 있어서, 플라스미드 도메인이 pUC19 플라스미드를 포함하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제1항에 있어서, 플라스미드 도메인이 고-카피수 복제 기점을 포함하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제31항에 있어서, 고-카피수 복제 기점이 cole1 복제 기점을 포함하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제1항에 있어서, 플라스미드 도메인이 선택 마커를 포함하는 것인 폴리뉴클레오티드 공여자 카세트.
- 제33항에 있어서, 선택 마커가 카나마이신 선택 마커, 암피실린 선택 마커, 스펙티노마이신 선택 마커, 클로람페니콜 선택 마커 및 리팜피신 선택 마커로 이루어진 군으로부터 선택된 것인 폴리뉴클레오티드 공여자 카세트.
- a. 적어도 1개의 DNA-결합 도메인 및 적어도 1개의 뉴클레아제 도메인을 포함하며, 여기서 적어도 1개의 DNA-결합 도메인은 식물 세포의 게놈 내의 표적 부위에 결합하는 것인 부위 특이적 DNA 결합 뉴클레아제를 발현시키고;
b. 식물 세포를 제1항의 폴리뉴클레오티드 공여자 카세트와 접촉시키고;
c. 식물 세포의 게놈 내의 표적 부위를 부위 특이적 DNA 결합 뉴클레아제로 절단하고;
d. 제1항의 폴리뉴클레오티드 공여자 카세트를 식물 세포의 게놈 내의 표적 부위 내로 통합시키는 것
을 포함하는, 식물 세포의 게놈 내의 폴리뉴클레오티드 공여자 카세트의 표적화 통합 방법. - 제35항에 있어서, 적어도 1개의 DNA-결합 도메인이 아연 핑거 결합 도메인, 메가뉴클레아제 결합 도메인, TALEN 결합 도메인, 메가뉴클레아제 및 CRISPR 결합 도메인으로 이루어진 군으로부터 선택된 것인 방법.
- 제35항에 있어서, 뉴클레아제 도메인이 유형 IIS 제한 엔도뉴클레아제로부터의 것인 방법.
- 제37항에 있어서, 유형 IIS 제한 엔도뉴클레아제가 FokI 및 StsI로 이루어진 군으로부터 선택된 것인 방법.
- 제35항에 있어서, 폴리뉴클레오티드 공여자 카세트가 폴리펩티드를 발현하는 것인 방법.
- 제35항에 있어서, 폴리뉴클레오티드 공여자 카세트가 비-코딩 핵산 서열을 포함하는 것인 방법.
- 제35항에 있어서, 폴리뉴클레오티드 공여자 카세트가 1개 이상의 아연 핑거 결합 서열을 포함하는 것인 방법.
- 제35항에 있어서, 폴리뉴클레오티드 공여자 카세트가 1개 이상의 프라이머 결합 서열을 포함하는 것인 방법.
- 제35항에 있어서, 통합이 상동성 지정 복구 메카니즘을 포함하는 것인 방법.
- 제35항에 있어서, 통합이 비-상동 말단 연결 지정 복구 메카니즘을 포함하는 것인 방법.
- 제35항에 있어서, 식물 세포가 단자엽 식물 세포인 방법.
- 제45항에 있어서, 단자엽 식물 세포가 옥수수 식물 세포, 밀 식물 세포 및 벼 식물 세포로 이루어진 군으로부터 선택된 것인 방법.
- 제35항에 있어서, 식물 세포가 쌍자엽 식물 세포인 방법.
- 제47항에 있어서, 쌍자엽 식물 세포가 대두 식물 세포, 목화 식물 세포 및 카놀라 식물 세포로 이루어진 군으로부터 선택된 것인 방법.
- 제35항에 있어서, 표적 부위가 게놈 유전자좌를 포함하는 것인 방법.
- 제49항에 있어서, 게놈 유전자좌가 하기 특징을 포함하는 저메틸화 비유전자 서열인 방법:
a. 상기 비유전자 서열의 메틸화의 수준은 1% 이하임;
b. 상기 비유전자 서열은 게놈에 함유된 임의의 다른 서열과 40% 미만의 서열 동일성을 공유함;
c. 상기 비유전자 서열은 기지의 또는 예측된 발현 코딩 서열의 40 Kb 영역 내에 위치함; 및
d. 상기 비유전자 서열은 0.00041 cM/Mb 초과의 게놈 내의 재조합 빈도를 나타냄. - 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361899543P | 2013-11-04 | 2013-11-04 | |
US61/899,543 | 2013-11-04 | ||
PCT/US2014/063732 WO2015066637A1 (en) | 2013-11-04 | 2014-11-03 | A universal donor system for gene targeting |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160079090A KR20160079090A (ko) | 2016-07-05 |
KR102248730B1 true KR102248730B1 (ko) | 2021-05-07 |
Family
ID=53005271
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167014602A KR102248730B1 (ko) | 2013-11-04 | 2014-11-03 | 유전자 표적화를 위한 범용 공여자 시스템 |
Country Status (14)
Country | Link |
---|---|
US (1) | US10077449B2 (ko) |
EP (1) | EP3066192B1 (ko) |
JP (1) | JP6560203B2 (ko) |
KR (1) | KR102248730B1 (ko) |
CN (1) | CN105683357B (ko) |
AR (1) | AR098283A1 (ko) |
AU (1) | AU2014341928B2 (ko) |
BR (1) | BR102014027448A8 (ko) |
CA (1) | CA2926534A1 (ko) |
IL (1) | IL245313B (ko) |
RU (1) | RU2687369C2 (ko) |
TW (1) | TWI669395B (ko) |
WO (1) | WO2015066637A1 (ko) |
ZA (1) | ZA201601929B (ko) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103842511A (zh) | 2011-03-23 | 2014-06-04 | 先锋国际良种公司 | 产生复合转基因性状基因座的方法 |
EP2734621B1 (en) | 2011-07-22 | 2019-09-04 | President and Fellows of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
US9163284B2 (en) | 2013-08-09 | 2015-10-20 | President And Fellows Of Harvard College | Methods for identifying a target site of a Cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US9834791B2 (en) | 2013-11-07 | 2017-12-05 | Editas Medicine, Inc. | CRISPR-related methods and compositions with governing gRNAS |
US9840699B2 (en) | 2013-12-12 | 2017-12-12 | President And Fellows Of Harvard College | Methods for nucleic acid editing |
CA2956224A1 (en) | 2014-07-30 | 2016-02-11 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
WO2016040030A1 (en) | 2014-09-12 | 2016-03-17 | E. I. Du Pont De Nemours And Company | Generation of site-specific-integration sites for complex trait loci in corn and soybean, and methods of use |
EP4400584A3 (en) | 2014-12-03 | 2024-10-16 | Agilent Technologies, Inc. | Guide rna with chemical modifications |
CA2973903C (en) | 2015-01-27 | 2024-03-12 | Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences | A method for site-directed modification of whole plant through gene transient expression |
KR20240038141A (ko) | 2015-04-06 | 2024-03-22 | 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 | Crispr/cas-매개 유전자 조절을 위한 화학적으로 변형된 가이드 rna |
EP3095870A1 (en) | 2015-05-19 | 2016-11-23 | Kws Saat Se | Methods for the in planta transformation of plants and manufacturing processes and products based and obtainable therefrom |
CA2994883A1 (en) * | 2015-08-14 | 2017-02-23 | Institute Of Genetics And Developmental Biology, Chinese Academy Of Scnces | Method for obtaining glyphosate-resistant rice by site-directed nucleotide substitution |
WO2017040967A1 (en) * | 2015-09-04 | 2017-03-09 | Octavo Systems Llc | Improved system using system in package components |
US10167457B2 (en) | 2015-10-23 | 2019-01-01 | President And Fellows Of Harvard College | Nucleobase editors and uses thereof |
WO2017083766A1 (en) * | 2015-11-13 | 2017-05-18 | Massachusetts Institute Of Technology | High-throughput crispr-based library screening |
US10767175B2 (en) | 2016-06-08 | 2020-09-08 | Agilent Technologies, Inc. | High specificity genome editing using chemically modified guide RNAs |
SG11201900907YA (en) | 2016-08-03 | 2019-02-27 | Harvard College | Adenosine nucleobase editors and uses thereof |
CN109804066A (zh) | 2016-08-09 | 2019-05-24 | 哈佛大学的校长及成员们 | 可编程cas9-重组酶融合蛋白及其用途 |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
SG11201903089RA (en) | 2016-10-14 | 2019-05-30 | Harvard College | Aav delivery of nucleobase editors |
US10745677B2 (en) | 2016-12-23 | 2020-08-18 | President And Fellows Of Harvard College | Editing of CCR5 receptor gene to protect against HIV infection |
CN106591293A (zh) * | 2016-12-28 | 2017-04-26 | 贵州省草业研究所 | 基于酶切连接从未知基因组中分离已知序列侧翼序列的方法 |
WO2018165504A1 (en) | 2017-03-09 | 2018-09-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
WO2018165629A1 (en) | 2017-03-10 | 2018-09-13 | President And Fellows Of Harvard College | Cytosine to guanine base editor |
US11268082B2 (en) | 2017-03-23 | 2022-03-08 | President And Fellows Of Harvard College | Nucleobase editors comprising nucleic acid programmable DNA binding proteins |
WO2018209320A1 (en) | 2017-05-12 | 2018-11-15 | President And Fellows Of Harvard College | Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation |
EP3658573A1 (en) | 2017-07-28 | 2020-06-03 | President and Fellows of Harvard College | Methods and compositions for evolving base editors using phage-assisted continuous evolution (pace) |
WO2019139645A2 (en) | 2017-08-30 | 2019-07-18 | President And Fellows Of Harvard College | High efficiency base editors comprising gam |
CN111757937A (zh) | 2017-10-16 | 2020-10-09 | 布罗德研究所股份有限公司 | 腺苷碱基编辑器的用途 |
CN107545153B (zh) * | 2017-10-25 | 2021-06-11 | 桂林电子科技大学 | 一种基于卷积神经网络的核小体分类预测方法 |
DE112019005166T5 (de) | 2018-10-16 | 2021-07-29 | Blueallele, Llc | Verfahren zur gezielten insertion von dna in gene |
BR112021018607A2 (pt) | 2019-03-19 | 2021-11-23 | Massachusetts Inst Technology | Métodos e composições para editar sequências de nucleotídeos |
JP2023525304A (ja) | 2020-05-08 | 2023-06-15 | ザ ブロード インスティテュート,インコーポレーテッド | 標的二本鎖ヌクレオチド配列の両鎖同時編集のための方法および組成物 |
CN114317588B (zh) * | 2020-09-29 | 2023-06-27 | 中国农业科学院生物技术研究所 | 一种作物高温响应型基因组精准甲基化调控回路 |
WO2023039586A1 (en) | 2021-09-10 | 2023-03-16 | Agilent Technologies, Inc. | Guide rnas with chemical modification for prime editing |
WO2023049728A1 (en) * | 2021-09-21 | 2023-03-30 | Pairwise Plants Services, Inc. | Color-based and/or visual methods for identifying the presence of a transgene and compositions and constructs relating to the same |
CN114369677A (zh) * | 2022-01-04 | 2022-04-19 | 江汉大学 | 一种检测小麦转基因成分和转基因品系的引物组合、试剂盒、检测方法及应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010077319A1 (en) * | 2008-12-17 | 2010-07-08 | Dow Agrosciences Llc | Targeted integration into the zp15 locus |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NZ526507A (en) * | 2001-01-26 | 2005-07-29 | Commw Scient Ind Res Org | Methods and means for producing efficient silencing construct using recombinational cloning |
US20030232410A1 (en) * | 2002-03-21 | 2003-12-18 | Monika Liljedahl | Methods and compositions for using zinc finger endonucleases to enhance homologous recombination |
ZA200900787B (en) * | 2006-08-11 | 2010-05-26 | Dow Agrosciences Llc | Zinc finger nuclease-mediated homologous recombination |
BRPI0812233B1 (pt) * | 2007-06-05 | 2022-10-04 | Bayer Cropscience Ag | Processos para troca de uma sequência de dna-alvo no genoma de uma célula de planta ou planta por uma sequência de dna de interesse, e vetor de dna |
EP2304030B1 (en) * | 2008-07-01 | 2015-11-25 | Monsanto Technology LLC | Recombinant dna constructs and methods for modulating expression of a target gene |
CA2754956A1 (en) * | 2009-03-20 | 2010-09-23 | Basf Plant Science Company Gmbh | Nematode-resistant transgenic plants |
EA031356B1 (ru) * | 2010-01-22 | 2018-12-28 | ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи | Вырезание трансгенов в генетически измененных организмах |
NZ600733A (en) * | 2010-01-22 | 2014-09-26 | Dow Agrosciences Llc | Engineered landing pads for gene targeting in plants |
CA2801834A1 (en) | 2010-06-09 | 2011-12-15 | Kathleen D'halluin | Methods and means to modify a plant genome at a nucleotide sequence commonly used in plant genome engineering |
WO2013009525A1 (en) | 2011-07-08 | 2013-01-17 | Cellectis S.A. | Method for increasing the efficiency of double-strand break-induced mutagenssis |
EP3041344A4 (en) * | 2013-09-04 | 2017-04-19 | Dow AgroSciences LLC | Rapid targeting analysis in crops for determining donor insertion |
-
2014
- 2014-11-03 RU RU2016122038A patent/RU2687369C2/ru active
- 2014-11-03 EP EP14858498.0A patent/EP3066192B1/en not_active Not-in-force
- 2014-11-03 US US14/531,710 patent/US10077449B2/en not_active Expired - Fee Related
- 2014-11-03 TW TW103138081A patent/TWI669395B/zh not_active IP Right Cessation
- 2014-11-03 BR BR102014027448A patent/BR102014027448A8/pt not_active Application Discontinuation
- 2014-11-03 AR ARP140104120A patent/AR098283A1/es unknown
- 2014-11-03 KR KR1020167014602A patent/KR102248730B1/ko active IP Right Grant
- 2014-11-03 CA CA2926534A patent/CA2926534A1/en not_active Abandoned
- 2014-11-03 CN CN201480060417.5A patent/CN105683357B/zh not_active Expired - Fee Related
- 2014-11-03 JP JP2016526812A patent/JP6560203B2/ja not_active Expired - Fee Related
- 2014-11-03 AU AU2014341928A patent/AU2014341928B2/en not_active Ceased
- 2014-11-03 WO PCT/US2014/063732 patent/WO2015066637A1/en active Application Filing
-
2016
- 2016-03-18 ZA ZA2016/01929A patent/ZA201601929B/en unknown
- 2016-04-25 IL IL245313A patent/IL245313B/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010077319A1 (en) * | 2008-12-17 | 2010-07-08 | Dow Agrosciences Llc | Targeted integration into the zp15 locus |
Non-Patent Citations (1)
Title |
---|
Yong Zhang 등. Plant Physiology. Vol. 161, 페이지 20-27 (2013.01.)* |
Also Published As
Publication number | Publication date |
---|---|
KR20160079090A (ko) | 2016-07-05 |
BR102014027448A8 (pt) | 2021-08-24 |
JP6560203B2 (ja) | 2019-08-14 |
CA2926534A1 (en) | 2015-05-07 |
JP2016534727A (ja) | 2016-11-10 |
ZA201601929B (en) | 2019-06-26 |
US20150143588A1 (en) | 2015-05-21 |
TWI669395B (zh) | 2019-08-21 |
US10077449B2 (en) | 2018-09-18 |
EP3066192A1 (en) | 2016-09-14 |
CN105683357B (zh) | 2020-10-30 |
WO2015066637A1 (en) | 2015-05-07 |
RU2687369C2 (ru) | 2019-05-13 |
RU2016122038A (ru) | 2017-12-11 |
IL245313B (en) | 2019-05-30 |
CN105683357A (zh) | 2016-06-15 |
EP3066192B1 (en) | 2019-05-01 |
AU2014341928A1 (en) | 2016-04-07 |
AR098283A1 (es) | 2016-05-26 |
AU2014341928B2 (en) | 2017-11-30 |
RU2016122038A3 (ko) | 2018-06-21 |
IL245313A0 (en) | 2016-06-30 |
BR102014027448A2 (pt) | 2015-09-15 |
TW201522630A (zh) | 2015-06-16 |
EP3066192A4 (en) | 2017-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102248730B1 (ko) | 유전자 표적화를 위한 범용 공여자 시스템 | |
KR102238137B1 (ko) | 공여자 삽입을 결정하기 위한 작물에서의 신속 표적화 분석 | |
KR102630763B1 (ko) | 동시 유전자 편집 및 반수체 유도 | |
CN109312316B (zh) | 修饰基因组的组合物和方法 | |
US9181559B2 (en) | Generation of high polyhydroxybutyrate producing oilseeds | |
KR101447300B1 (ko) | 안트라닐레이트 신타제의 엽록체를 표적으로 하는 발현에 의한 고-트립토판 옥수수의 생산 | |
JP6473419B2 (ja) | 部位特異的ヌクレアーゼ活性のdna検出方法 | |
KR20130132405A (ko) | 형질전환 빈도를 증가시키기 위해 변형된 아그로박테리움 균주 | |
KR20160111450A (ko) | 제아 메이스 조절 요소 및 그의 용도 | |
CN114302644B (zh) | 调控植物中基因表达的启动子 | |
KR102720045B1 (ko) | 동시 유전자 편집 및 반수체 유도 | |
RU2788349C2 (ru) | Одновременное редактирование генов и индукция гаплоидов |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |