CN114302644B - 调控植物中基因表达的启动子 - Google Patents
调控植物中基因表达的启动子 Download PDFInfo
- Publication number
- CN114302644B CN114302644B CN202080060198.6A CN202080060198A CN114302644B CN 114302644 B CN114302644 B CN 114302644B CN 202080060198 A CN202080060198 A CN 202080060198A CN 114302644 B CN114302644 B CN 114302644B
- Authority
- CN
- China
- Prior art keywords
- protein
- plant
- nucleic acid
- expression cassette
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 146
- 230000001105 regulatory effect Effects 0.000 title description 50
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 285
- 230000009261 transgenic effect Effects 0.000 claims abstract description 89
- 241000196324 Embryophyta Species 0.000 claims description 273
- 102000004169 proteins and genes Human genes 0.000 claims description 221
- 150000007523 nucleic acids Chemical class 0.000 claims description 149
- 239000002773 nucleotide Substances 0.000 claims description 129
- 125000003729 nucleotide group Chemical group 0.000 claims description 129
- 102000039446 nucleic acids Human genes 0.000 claims description 122
- 108020004707 nucleic acids Proteins 0.000 claims description 122
- 102000040430 polynucleotide Human genes 0.000 claims description 93
- 108091033319 polynucleotide Proteins 0.000 claims description 93
- 239000002157 polynucleotide Substances 0.000 claims description 93
- 240000008042 Zea mays Species 0.000 claims description 84
- 239000013598 vector Substances 0.000 claims description 73
- 238000000034 method Methods 0.000 claims description 68
- 230000000749 insecticidal effect Effects 0.000 claims description 54
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 37
- 238000013518 transcription Methods 0.000 claims description 37
- 230000035897 transcription Effects 0.000 claims description 36
- 108091026890 Coding region Proteins 0.000 claims description 24
- 101150102464 Cry1 gene Proteins 0.000 claims description 16
- 102000040650 (ribonucleotides)n+m Human genes 0.000 claims description 14
- 241000209510 Liliopsida Species 0.000 claims description 8
- 108700007698 Genetic Terminator Regions Proteins 0.000 claims description 6
- 230000008488 polyadenylation Effects 0.000 claims description 6
- 108091036066 Three prime untranslated region Proteins 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims description 4
- 230000000361 pesticidal effect Effects 0.000 abstract description 2
- 230000009418 agronomic effect Effects 0.000 abstract 1
- 235000018102 proteins Nutrition 0.000 description 175
- 210000001519 tissue Anatomy 0.000 description 98
- 210000004027 cell Anatomy 0.000 description 87
- 108020004414 DNA Proteins 0.000 description 73
- 108091028043 Nucleic acid sequence Proteins 0.000 description 59
- 230000009466 transformation Effects 0.000 description 49
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 48
- 241000238631 Hexapoda Species 0.000 description 38
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 32
- 235000009973 maize Nutrition 0.000 description 32
- 241000589158 Agrobacterium Species 0.000 description 29
- 238000009396 hybridization Methods 0.000 description 27
- 241000607479 Yersinia pestis Species 0.000 description 21
- 239000002299 complementary DNA Substances 0.000 description 20
- 230000000694 effects Effects 0.000 description 20
- 230000006870 function Effects 0.000 description 19
- 239000003550 marker Substances 0.000 description 19
- 210000002706 plastid Anatomy 0.000 description 18
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 16
- 235000005822 corn Nutrition 0.000 description 16
- 239000000047 product Substances 0.000 description 16
- 108091022912 Mannose-6-Phosphate Isomerase Proteins 0.000 description 15
- 102000048193 Mannose-6-phosphate isomerases Human genes 0.000 description 15
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 15
- 230000001404 mediated effect Effects 0.000 description 15
- 238000002965 ELISA Methods 0.000 description 14
- 239000000523 sample Substances 0.000 description 14
- 238000012217 deletion Methods 0.000 description 13
- 230000037430 deletion Effects 0.000 description 13
- 108020004999 messenger RNA Proteins 0.000 description 13
- 230000001850 reproductive effect Effects 0.000 description 13
- 238000012360 testing method Methods 0.000 description 13
- 238000003556 assay Methods 0.000 description 12
- 241000894006 Bacteria Species 0.000 description 10
- 108700019146 Transgenes Proteins 0.000 description 10
- 238000012546 transfer Methods 0.000 description 10
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- 150000001413 amino acids Chemical class 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 210000002257 embryonic structure Anatomy 0.000 description 9
- 238000003752 polymerase chain reaction Methods 0.000 description 9
- -1 region Substances 0.000 description 9
- 238000013519 translation Methods 0.000 description 9
- 108020005029 5' Flanking Region Proteins 0.000 description 8
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 8
- 108700026244 Open Reading Frames Proteins 0.000 description 8
- 230000001276 controlling effect Effects 0.000 description 8
- 239000003623 enhancer Substances 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 7
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 7
- 230000003321 amplification Effects 0.000 description 7
- 239000000284 extract Substances 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 239000004009 herbicide Substances 0.000 description 7
- 230000035772 mutation Effects 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 230000005026 transcription initiation Effects 0.000 description 7
- 238000011144 upstream manufacturing Methods 0.000 description 7
- 108020004705 Codon Proteins 0.000 description 6
- 230000003115 biocidal effect Effects 0.000 description 6
- 238000004113 cell culture Methods 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 230000008595 infiltration Effects 0.000 description 6
- 238000001764 infiltration Methods 0.000 description 6
- 210000000056 organ Anatomy 0.000 description 6
- 239000002245 particle Substances 0.000 description 6
- 239000013612 plasmid Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 210000001938 protoplast Anatomy 0.000 description 6
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 5
- 241001460678 Napo <wasp> Species 0.000 description 5
- 241001147398 Ostrinia nubilalis Species 0.000 description 5
- 108020004511 Recombinant DNA Proteins 0.000 description 5
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 5
- 241000723873 Tobacco mosaic virus Species 0.000 description 5
- 108700009124 Transcription Initiation Site Proteins 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 101150065438 cry1Ab gene Proteins 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 235000013305 food Nutrition 0.000 description 5
- 230000002363 herbicidal effect Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 231100000331 toxic Toxicity 0.000 description 5
- 230000002588 toxic effect Effects 0.000 description 5
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 4
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- 108060001084 Luciferase Proteins 0.000 description 4
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 4
- OJOBTAOGJIWAGB-UHFFFAOYSA-N acetosyringone Chemical compound COC1=CC(C(C)=O)=CC(OC)=C1O OJOBTAOGJIWAGB-UHFFFAOYSA-N 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 239000005090 green fluorescent protein Substances 0.000 description 4
- 238000003306 harvesting Methods 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 230000002147 killing effect Effects 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 239000002853 nucleic acid probe Substances 0.000 description 4
- 235000016709 nutrition Nutrition 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 230000002103 transcriptional effect Effects 0.000 description 4
- 238000011426 transformation method Methods 0.000 description 4
- 230000010474 transient expression Effects 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 108010000700 Acetolactate synthase Proteins 0.000 description 3
- 108020005544 Antisense RNA Proteins 0.000 description 3
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 208000035240 Disease Resistance Diseases 0.000 description 3
- 102000053187 Glucuronidase Human genes 0.000 description 3
- 108010060309 Glucuronidase Proteins 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- 206010021929 Infertility male Diseases 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- 239000005089 Luciferase Substances 0.000 description 3
- 208000007466 Male Infertility Diseases 0.000 description 3
- 240000007594 Oryza sativa Species 0.000 description 3
- 235000007164 Oryza sativa Nutrition 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Chemical class Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 3
- 230000000692 anti-sense effect Effects 0.000 description 3
- 230000000975 bioactive effect Effects 0.000 description 3
- 230000001488 breeding effect Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 239000003593 chromogenic compound Substances 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 210000001161 mammalian embryo Anatomy 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000004161 plant tissue culture Methods 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 2
- 108020005065 3' Flanking Region Proteins 0.000 description 2
- QUTYKIXIUDQOLK-PRJMDXOYSA-N 5-O-(1-carboxyvinyl)-3-phosphoshikimic acid Chemical compound O[C@H]1[C@H](OC(=C)C(O)=O)CC(C(O)=O)=C[C@H]1OP(O)(O)=O QUTYKIXIUDQOLK-PRJMDXOYSA-N 0.000 description 2
- 241000724328 Alfalfa mosaic virus Species 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000726103 Atta Species 0.000 description 2
- 241000193388 Bacillus thuringiensis Species 0.000 description 2
- 101100007613 Bacillus thuringiensis cry1Ha gene Proteins 0.000 description 2
- 101100007617 Bacillus thuringiensis cry1Ic gene Proteins 0.000 description 2
- 101100007618 Bacillus thuringiensis cry1Id gene Proteins 0.000 description 2
- 101100007619 Bacillus thuringiensis cry1Ja gene Proteins 0.000 description 2
- 101100007620 Bacillus thuringiensis cry1Jb gene Proteins 0.000 description 2
- 101100275684 Bacillus thuringiensis cry2Ac gene Proteins 0.000 description 2
- 101100275685 Bacillus thuringiensis cry2Ad gene Proteins 0.000 description 2
- 101100007616 Bacillus thuringiensis subsp. entomocidus cry1Ib gene Proteins 0.000 description 2
- 101100007615 Bacillus thuringiensis subsp. kurstaki cry1Ia gene Proteins 0.000 description 2
- 101100275683 Bacillus thuringiensis subsp. kurstaki cry2Ab gene Proteins 0.000 description 2
- 101100007614 Bacillus thuringiensis subsp. morrisoni cry1Hb gene Proteins 0.000 description 2
- 101100007621 Bacillus thuringiensis subsp. morrisoni cry1Ka gene Proteins 0.000 description 2
- 241000701489 Cauliflower mosaic virus Species 0.000 description 2
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- NDUPDOJHUQKPAG-UHFFFAOYSA-N Dalapon Chemical compound CC(Cl)(Cl)C(O)=O NDUPDOJHUQKPAG-UHFFFAOYSA-N 0.000 description 2
- 241000721047 Danaus plexippus Species 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 241000701484 Figwort mosaic virus Species 0.000 description 2
- 239000005561 Glufosinate Substances 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- 239000005562 Glyphosate Substances 0.000 description 2
- 101100288095 Klebsiella pneumoniae neo gene Proteins 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 241000710118 Maize chlorotic mottle virus Species 0.000 description 2
- XUMBMVFBXHLACL-UHFFFAOYSA-N Melanin Chemical compound O=C1C(=O)C(C2=CNC3=C(C(C(=O)C4=C32)=O)C)=C2C4=CNC2=C1C XUMBMVFBXHLACL-UHFFFAOYSA-N 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 206010034133 Pathogen resistance Diseases 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 102000039471 Small Nuclear RNA Human genes 0.000 description 2
- 108020004688 Small Nuclear RNA Proteins 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 241000723792 Tobacco etch virus Species 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940097012 bacillus thuringiensis Drugs 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000029918 bioluminescence Effects 0.000 description 2
- 238000005415 bioluminescence Methods 0.000 description 2
- 238000009395 breeding Methods 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 244000038559 crop plants Species 0.000 description 2
- 101150085721 cry2Aa gene Proteins 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 239000011536 extraction buffer Substances 0.000 description 2
- 230000035558 fertility Effects 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 2
- 229940097068 glyphosate Drugs 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 229960000485 methotrexate Drugs 0.000 description 2
- 239000003147 molecular marker Substances 0.000 description 2
- 108010058731 nopaline synthase Proteins 0.000 description 2
- 238000007899 nucleic acid hybridization Methods 0.000 description 2
- 239000000575 pesticide Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000002731 protein assay Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- SQGYOTSLMSWVJD-UHFFFAOYSA-N silver(1+) nitrate Chemical compound [Ag+].[O-]N(=O)=O SQGYOTSLMSWVJD-UHFFFAOYSA-N 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 229960000268 spectinomycin Drugs 0.000 description 2
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- FCHBECOAGZMTFE-ZEQKJWHPSA-N (6r,7r)-3-[[2-[[4-(dimethylamino)phenyl]diazenyl]pyridin-1-ium-1-yl]methyl]-8-oxo-7-[(2-thiophen-2-ylacetyl)amino]-5-thia-1-azabicyclo[4.2.0]oct-2-ene-2-carboxylate Chemical compound C1=CC(N(C)C)=CC=C1N=NC1=CC=CC=[N+]1CC1=C(C([O-])=O)N2C(=O)[C@@H](NC(=O)CC=3SC=CC=3)[C@H]2SC1 FCHBECOAGZMTFE-ZEQKJWHPSA-N 0.000 description 1
- 108020004465 16S ribosomal RNA Proteins 0.000 description 1
- UPMXNNIRAGDFEH-UHFFFAOYSA-N 3,5-dibromo-4-hydroxybenzonitrile Chemical compound OC1=C(Br)C=C(C#N)C=C1Br UPMXNNIRAGDFEH-UHFFFAOYSA-N 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- HUNCSWANZMJLPM-UHFFFAOYSA-N 5-methyltryptophan Chemical compound CC1=CC=C2NC=C(CC(N)C(O)=O)C2=C1 HUNCSWANZMJLPM-UHFFFAOYSA-N 0.000 description 1
- 241001556567 Acanthamoeba polyphaga mimivirus Species 0.000 description 1
- 101100001031 Acetobacter aceti adhA gene Proteins 0.000 description 1
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- 241000511582 Actinomyces meyeri Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 101150021974 Adh1 gene Proteins 0.000 description 1
- 241000242764 Aequorea victoria Species 0.000 description 1
- 108010000239 Aequorin Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 108010037870 Anthranilate Synthase Proteins 0.000 description 1
- 241001605719 Appias drusilla Species 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 101100438027 Bacillus thuringiensis cry13Aa gene Proteins 0.000 description 1
- 101100497222 Bacillus thuringiensis cry1Af gene Proteins 0.000 description 1
- 101100497223 Bacillus thuringiensis cry1Ag gene Proteins 0.000 description 1
- 101100497226 Bacillus thuringiensis cry1Bb gene Proteins 0.000 description 1
- 101100497229 Bacillus thuringiensis cry1Be gene Proteins 0.000 description 1
- 101100497234 Bacillus thuringiensis cry1Db gene Proteins 0.000 description 1
- 101100007611 Bacillus thuringiensis cry1Ga gene Proteins 0.000 description 1
- 101100219228 Bacillus thuringiensis cry21Aa gene Proteins 0.000 description 1
- 101100219229 Bacillus thuringiensis cry22Aa gene Proteins 0.000 description 1
- 101100497220 Bacillus thuringiensis subsp. aizawai cry1Ad gene Proteins 0.000 description 1
- 101100497233 Bacillus thuringiensis subsp. aizawai cry1Da gene Proteins 0.000 description 1
- 101100497236 Bacillus thuringiensis subsp. aizawai cry1Eb gene Proteins 0.000 description 1
- 101100007609 Bacillus thuringiensis subsp. aizawai cry1Fa gene Proteins 0.000 description 1
- 101100497221 Bacillus thuringiensis subsp. alesti cry1Ae gene Proteins 0.000 description 1
- 101100004851 Bacillus thuringiensis subsp. finitimus cry26Aa gene Proteins 0.000 description 1
- 101100004857 Bacillus thuringiensis subsp. finitimus cry28Aa gene Proteins 0.000 description 1
- 101100219223 Bacillus thuringiensis subsp. fukuokaensis cry20Aa gene Proteins 0.000 description 1
- 101100497232 Bacillus thuringiensis subsp. galleriae cry1Cb gene Proteins 0.000 description 1
- 101100058761 Bacillus thuringiensis subsp. higo cry19Ba gene Proteins 0.000 description 1
- 101100004852 Bacillus thuringiensis subsp. higo cry27Aa gene Proteins 0.000 description 1
- 101100058759 Bacillus thuringiensis subsp. jegathesan cry19Aa gene Proteins 0.000 description 1
- 101100004846 Bacillus thuringiensis subsp. jegathesan cry25Aa gene Proteins 0.000 description 1
- 101100497235 Bacillus thuringiensis subsp. kenyae cry1Ea gene Proteins 0.000 description 1
- 101100497219 Bacillus thuringiensis subsp. kurstaki cry1Ac gene Proteins 0.000 description 1
- 101100497227 Bacillus thuringiensis subsp. morrisoni cry1Bc gene Proteins 0.000 description 1
- 101100007610 Bacillus thuringiensis subsp. morrisoni cry1Fb gene Proteins 0.000 description 1
- 101100004839 Bacillus thuringiensis subsp. thompsoni cry15Aa gene Proteins 0.000 description 1
- 101100497228 Bacillus thuringiensis subsp. wuhanensis cry1Bd gene Proteins 0.000 description 1
- 101100007612 Bacillus thuringiensis subsp. wuhanensis cry1Gb gene Proteins 0.000 description 1
- 108700003860 Bacterial Genes Proteins 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 108020004256 Beta-lactamase Proteins 0.000 description 1
- 239000005489 Bromoxynil Substances 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 1
- 229930186147 Cephalosporin Natural products 0.000 description 1
- 241000195628 Chlorophyta Species 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- AHMIDUVKSGCHAU-UHFFFAOYSA-N Dopaquinone Natural products OC(=O)C(N)CC1=CC(=O)C(=O)C=C1 AHMIDUVKSGCHAU-UHFFFAOYSA-N 0.000 description 1
- 241001057636 Dracaena deremensis Species 0.000 description 1
- 102100023882 Endoribonuclease ZC3H12A Human genes 0.000 description 1
- 101710112715 Endoribonuclease ZC3H12A Proteins 0.000 description 1
- 101100437498 Escherichia coli (strain K12) uidA gene Proteins 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 206010020649 Hyperkeratosis Diseases 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241000588744 Klebsiella pneumoniae subsp. ozaenae Species 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- WTDRDQBEARUVNC-UHFFFAOYSA-N L-Dopa Natural products OC(=O)C(N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- AHMIDUVKSGCHAU-LURJTMIESA-N L-dopaquinone Chemical compound [O-]C(=O)[C@@H]([NH3+])CC1=CC(=O)C(=O)C=C1 AHMIDUVKSGCHAU-LURJTMIESA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 241000255777 Lepidoptera Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- GDBQQVLCIARPGH-UHFFFAOYSA-N Leupeptin Natural products CC(C)CC(NC(C)=O)C(=O)NC(CC(C)C)C(=O)NC(C=O)CCCN=C(N)N GDBQQVLCIARPGH-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 244000141359 Malus pumila Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 101150054907 Mrps12 gene Proteins 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108010033272 Nitrilase Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 238000002944 PCR assay Methods 0.000 description 1
- 101100058757 Paenibacillus popilliae cry18Ba gene Proteins 0.000 description 1
- 101100058758 Paenibacillus popilliae cry18Ca gene Proteins 0.000 description 1
- 101100382106 Paraclostridium bifermentans cry16Aa gene Proteins 0.000 description 1
- 101100058755 Paraclostridium bifermentans cry17Aa gene Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 108010064851 Plant Proteins Proteins 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 108010066717 Q beta Replicase Proteins 0.000 description 1
- 101100120298 Rattus norvegicus Flot1 gene Proteins 0.000 description 1
- 101100412401 Rattus norvegicus Reg3a gene Proteins 0.000 description 1
- 101100412403 Rattus norvegicus Reg3b gene Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101100199945 Schizosaccharomyces pombe (strain 972 / ATCC 24843) rps1201 gene Proteins 0.000 description 1
- 241000242583 Scyphozoa Species 0.000 description 1
- 108010016634 Seed Storage Proteins Proteins 0.000 description 1
- 241000663938 Semium Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000592344 Spermatophyta Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 229940100389 Sulfonylurea Drugs 0.000 description 1
- 101150088517 TCTA gene Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 241000656145 Thyrsites atun Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 102000003425 Tyrosinase Human genes 0.000 description 1
- 108060008724 Tyrosinase Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 101150067314 aadA gene Proteins 0.000 description 1
- 230000036579 abiotic stress Effects 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- JUGOREOARAHOCO-UHFFFAOYSA-M acetylcholine chloride Chemical compound [Cl-].CC(=O)OCC[N+](C)(C)C JUGOREOARAHOCO-UHFFFAOYSA-M 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 235000001014 amino acid Nutrition 0.000 description 1
- 229940024606 amino acid Drugs 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 239000004410 anthocyanin Substances 0.000 description 1
- 229930002877 anthocyanin Natural products 0.000 description 1
- 235000010208 anthocyanin Nutrition 0.000 description 1
- 150000004636 anthocyanins Chemical class 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 230000007321 biological mechanism Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 230000023852 carbohydrate metabolic process Effects 0.000 description 1
- 235000021256 carbohydrate metabolism Nutrition 0.000 description 1
- 235000011089 carbon dioxide Nutrition 0.000 description 1
- 229960004261 cefotaxime Drugs 0.000 description 1
- AZZMGZXNTDTSME-JUZDKLSSSA-M cefotaxime sodium Chemical compound [Na+].N([C@@H]1C(N2C(=C(COC(C)=O)CS[C@@H]21)C([O-])=O)=O)C(=O)\C(=N/OC)C1=CSC(N)=N1 AZZMGZXNTDTSME-JUZDKLSSSA-M 0.000 description 1
- 230000023402 cell communication Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 229940124587 cephalosporin Drugs 0.000 description 1
- 150000001780 cephalosporins Chemical class 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 210000001726 chromosome structure Anatomy 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 101150041868 cry1Aa gene Proteins 0.000 description 1
- 101150108868 cry1Ba gene Proteins 0.000 description 1
- 101150049404 cry1Ca gene Proteins 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000001784 detoxification Methods 0.000 description 1
- MHUWZNTUIIFHAS-CLFAGFIQSA-N dioleoyl phosphatidic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(COP(O)(O)=O)OC(=O)CCCCCCC\C=C/CCCCCCCC MHUWZNTUIIFHAS-CLFAGFIQSA-N 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 230000002222 downregulating effect Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000001819 effect on gene Effects 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000000408 embryogenic effect Effects 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000009313 farming Methods 0.000 description 1
- 230000004129 fatty acid metabolism Effects 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 230000005078 fruit development Effects 0.000 description 1
- 230000004345 fruit ripening Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 230000037442 genomic alteration Effects 0.000 description 1
- 230000035784 germination Effects 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 239000003630 growth substance Substances 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 208000000509 infertility Diseases 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 208000021267 infertility disease Diseases 0.000 description 1
- 239000002917 insecticide Substances 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- GDBQQVLCIARPGH-ULQDDVLXSA-N leupeptin Chemical compound CC(C)C[C@H](NC(C)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C=O)CCCN=C(N)N GDBQQVLCIARPGH-ULQDDVLXSA-N 0.000 description 1
- 108010052968 leupeptin Proteins 0.000 description 1
- 229960004502 levodopa Drugs 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005360 mashing Methods 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000012092 media component Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 239000004570 mortar (masonry) Substances 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- YCIMNLLNPGFGHC-UHFFFAOYSA-N o-dihydroxy-benzene Natural products OC1=CC=CC=C1O YCIMNLLNPGFGHC-UHFFFAOYSA-N 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 235000021118 plant-derived protein Nutrition 0.000 description 1
- 101150082349 pmi gene Proteins 0.000 description 1
- 230000010152 pollination Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000002331 protein detection Methods 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000012340 reverse transcriptase PCR Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 101150015537 rps12 gene Proteins 0.000 description 1
- 101150098466 rpsL gene Proteins 0.000 description 1
- 238000003118 sandwich ELISA Methods 0.000 description 1
- HFHDHCJBZVLPGP-UHFFFAOYSA-N schardinger α-dextrin Chemical compound O1C(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(O)C2O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC2C(O)C(O)C1OC2CO HFHDHCJBZVLPGP-UHFFFAOYSA-N 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000008117 seed development Effects 0.000 description 1
- 230000010153 self-pollination Effects 0.000 description 1
- 230000009758 senescence Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000014639 sexual reproduction Effects 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- HBMJWWWQQXIZIP-UHFFFAOYSA-N silicon carbide Chemical compound [Si+]#[C-] HBMJWWWQQXIZIP-UHFFFAOYSA-N 0.000 description 1
- 229910010271 silicon carbide Inorganic materials 0.000 description 1
- 229910001961 silver nitrate Inorganic materials 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 210000000352 storage cell Anatomy 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 230000009105 vegetative growth Effects 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
- C12N15/8222—Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
- C12N15/8223—Vegetative tissue-specific promoters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
- C12N15/8222—Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
- C12N15/8223—Vegetative tissue-specific promoters
- C12N15/8225—Leaf-specific, e.g. including petioles, stomata
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/32—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
- C07K14/325—Bacillus thuringiensis crystal peptides, i.e. delta-endotoxins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8202—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
- C12N15/8205—Agrobacterium mediated transformation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
- C12N15/8222—Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
- C12N15/823—Reproductive tissue-specific promoters
- C12N15/8231—Male-specific, e.g. anther, tapetum, pollen
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8279—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
- C12N15/8286—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Insects & Arthropods (AREA)
- Pest Control & Pesticides (AREA)
- Reproductive Health (AREA)
- Pregnancy & Childbirth (AREA)
- Crystallography & Structural Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
Abstract
本发明涉及在驱动异源基因的根特异性表达方面具有特定效用的启动子,所述异源基因赋予给定转基因植物增强的农艺、园艺和/或杀有害生物特性。本发明还涉及包含本发明启动子的DNA分子和含有以下DNA分子的转化的植物组织及其种子,所述DNA分子包含与一个或多个异源基因可操作地连接的本发明的启动子。
Description
序列表
提供ASCII文本格式的序列表作为纸质副本的替代,该序列表是根据37 C.F.R.§1.821提交的,名称为“81937-REG-ORG-NAT-1_ST25.txt”,大小为239千字节,于2019年9月4日生成并经由EFS-Web提交。这个序列表特此通过引用以其披露内容并入本说明书中。
技术领域
本发明总体上涉及植物分子生物学和调控植物中基因表达的领域。还披露了转基因真核生物(包括转基因植物细胞、植物和种子),其基因组包括用于控制异源基因表达的分子构建体。
背景技术
转基因作物由越来越复杂的遗传修饰(包括赋予不同性状的多个转基因,也称为“基因堆叠”或“性状堆叠”)组成。例如,目前市场上的许多转基因玉米产品在同一植物内含有编码用于控制广谱昆虫有害生物的杀昆虫蛋白的多种基因、编码赋予植物对广谱化学除草剂的耐受性的蛋白的多种基因以及编码在植物转化过程中用作选择性标记的蛋白的多种基因。许多用于控制昆虫有害生物的转基因蛋白(例如来自苏云金芽孢杆菌(Bacillusthuringiensis)的晶体内毒素(称为Cry蛋白))对鳞翅目或鞘翅目昆虫有害生物有活性。鳞翅目活性Cry蛋白的实例包括Cry1A、Cry1B、Cry1C、Cry1D、Cry1E、Cry1F和Cry9。鞘翅目活性Cry蛋白的实例包括Cry3A、Cry3B、Cry3C、Cry8、二元Cry23-Cry37以及二元Cry34-Cry35。在给定的昆虫目内,大多数个体Cry蛋白对窄谱昆虫物种有生物活性。即使具有这种窄谱活性,某些Cry蛋白可能对与目标有害生物昆虫相同的昆虫目中的某些非有害生物物种具有低到中等的活性。例如,Hellmich等人(2001)Proc.Natl.Aca.Sci.[美国科学院院刊]98:11925-11930发现对鳞翅目有害生物(例如欧洲玉米螟(European corn borer,Ostrinianubilalis))有活性的某些纯化的Cry蛋白对非有害生物鳞翅目昆虫(普累克西普斑蝶(monarch butterfly)(黑脉金斑蝶(Danaus plexippus)))的一龄虫也有一定的活性。然而,靠后龄期的黑脉金斑蝶幼虫远不那么容易受影响。
目前,大多数编码杀昆虫蛋白的转基因在商业转基因作物中的表达由组成型启动子(即,在整个植物中在所有或大部分组织类型(包括花粉)中、在植物的整个生长周期中起作用的启动子)驱动。由于植物花粉可能是一些非有害生物昆虫物种的食物来源,或者假设植物花粉可能被风携带并沉积到非有害生物昆虫宿主植物上,因此调控转基因作物商业化的监管机构担心花粉中某些杀昆虫蛋白(例如,某些Cry蛋白)的高水平表达可能对非有害生物昆虫的本地化种群产生不利影响。此外,已经观察到花粉中某些杀昆虫蛋白的表达对转基因植物的雄性能育性有不利影响。例如,在玉米花粉中表达的高水平的Vip3杀昆虫蛋白可能导致某些近交遗传背景中的雄性能育性下降或完全不育(美国专利号10,214,784;通过引用并入本文)。因此,调节杀昆虫蛋白在转基因植物中的表达将是有益的,例如,使其在营养组织(大多数有害生物昆虫最初取食的地方)(例如叶组织)中高水平表达,但在花粉(一些非有害生物昆虫可能取食的植物组织)中减少表达。
因此,希望提供在植物的生殖结构(如花粉和/或雄穗)的组织中排除转基因表达的植物,特别是玉米植物。这可以在本发明的范围内通过提供一种调控核苷酸序列来实现,该调控核苷酸序列的至少一部分具有转录起始功能,该功能指导编码目的蛋白的可操作地连接的多核苷酸在基本上所有植物组织中表达,但基本上排除在植物的雄性生殖结构的组织中(特别是花粉和/或雄穗组织中)表达,因此那些组织中存在极少或没有表达产物。然后可以使用该调控核苷酸序列来开发表达系统,该表达系统能够在目标有害生物通常摄食的组织中有效积累目的蛋白,例如杀昆虫蛋白,并且消除或减少该杀昆虫蛋白在非靶组织或器官中和/或可能被目的蛋白损害的那些组织中的累积。
发明内容
本发明提供了用于选择性地指导转基因植物组织中的转基因表达的组合物和方法。特别地,提供了新颖的启动子多核苷酸,这些新颖的启动子多核苷酸能够启动和/或调节其可操作地连接的DNA多核苷酸的转录。本发明的启动子的特征在于它们能够选择性地调节任何可操作地连接的DNA多核苷酸的表达,如编码杀昆虫蛋白的多核苷酸,优先地在多种植物组织如叶、茎、根等中,而不是在雄性生殖组织如花粉中。
在一些方面,本发明的启动子多核苷酸包含在植物中起到启动子作用的SEQ IDNO:1-11中的任一项或其互补序列,或与SEQ ID NO:1-11中的任一项相关的片段、区域、顺式元件或多核苷酸。本发明的启动子在除雄性生殖组织(例如花粉)之外的任何植物组织中指导功能性转录,与植物的其他非雄性生殖组织相比,在花粉中,转录被消除或显著降低。
本发明进一步涉及包含本发明的启动子的嵌合构建体、表达盒和载体,该启动子与异源DNA多核苷酸可操作地连接,该异源DNA多核苷酸编码希望在非花粉的植物组织中表达的蛋白。例如,本发明的重组DNA分子在5'至3'方向上可以包含本发明的启动子和终止子序列,该启动子与编码杀昆虫蛋白的DNA序列可操作地连接,该杀昆虫蛋白对以植物组织为食的昆虫有害生物具有活性,该终止子序列与目的基因的3'端可操作地连接。在一些方面,本发明的终止子序列包含SEQ ID NO:12-20中的任一项或其互补序列,或与SEQ ID NO:12-20中的任一项相关的片段、区域或核苷酸序列。在其他方面,本发明的载体是可用于植物转化的二元载体。在其他方面,该二元载体包含SEQ ID NO:21-28中的任一项或与SEQ ID NO:21-28中的任一项相关的序列。
在其他方面,本发明的调控序列与编码杀昆虫蛋白的核苷酸序列可操作地连接。因此,在将表达盒(包含与杀昆虫蛋白编码序列可操作地连接的本发明的启动子)插入植物基因组中后,所得转基因植物将受到保护以免受以非花粉组织(如叶和茎)为食的有害昆虫的攻击,而不会影响以花粉为食的有益昆虫。
本发明还进一步涉及包含本发明的启动子、嵌合构建体、表达盒或载体的转基因植物,如转基因玉蜀黍植物。
本发明还提供了通过将含有本发明的启动子的重组DNA分子掺入植物基因组中以在除某些雄性生殖组织(例如花粉)之外的转基因植物组织中特异性表达异源编码序列的方法,本发明的启动子与编码目的蛋白(如杀昆虫蛋白)的DNA多核苷酸可操作地连接。
本发明进一步提供了一种通过将含有本发明的启动子的重组DNA分子掺入植物基因组中以减轻转基因植物(例如近交玉米植物)中雄性不育的方法,本发明的启动子与编码以下蛋白质的DNA多核苷酸可操作地连接,该蛋白质在雄性生殖组织如花粉中表达时引起雄性不育。在一些方面,该蛋白是Vip3杀昆虫蛋白并且该转基因植物是近交玉米植物。
本发明上述以及其他方面将从以下具体实施方式、附图和序列表中变得清楚。
对序列表中的序列的简述
SEQ ID NO:1是PMP370-3启动子的核苷酸序列。
SEQ ID NO:2是PMP393-1启动子的核苷酸序列。
SEQ ID NO:3是PMP393-2启动子的核苷酸序列。
SEQ ID NO:4是PMP393-3启动子的核苷酸序列。
SEQ ID NO:5是PMP393-4启动子的核苷酸序列。
SEQ ID NO:6是PMP855-1启动子的核苷酸序列。
SEQ ID NO:7是PMP747-1启动子的核苷酸序列。
SEQ ID NO:8是PMP004-1启动子的核苷酸序列。
SEQ ID NO:9是PMP335-1启动子的核苷酸序列。
SEQ ID NO:10是PMP722-1启动子的核苷酸序列。
SEQ ID NO:11是PMP948-2启动子的核苷酸序列。
SEQ ID NO:12是t370-2终止子的核苷酸序列。
SEQ ID NO:13是t393-1终止子的核苷酸序列。
SEQ ID NO:14是t393-2终止子的核苷酸序列。
SEQ ID NO:15是t855-1终止子的核苷酸序列。
SEQ ID NO:16是t747-1终止子的核苷酸序列。
SEQ ID NO:17是t004-1终止子的核苷酸序列。
SEQ ID NO:18是t335-1终止子的核苷酸序列。
SEQ ID NO:19是t722-1终止子的核苷酸序列。
SEQ ID NO:20是t948-2终止子的核苷酸序列。
SEQ ID NO:21是pSYN18499二元载体的核苷酸序列。
SEQ ID NO:22是pSYN18500二元载体的核苷酸序列。
SEQ ID NO:23是pSYN18501二元载体的核苷酸序列。
SEQ ID NO:24是pSYN18498二元载体的核苷酸序列。
SEQ ID NO:25是pSYN18617二元载体的核苷酸序列。
SEQ ID NO:26是pSYN18618二元载体的核苷酸序列。
SEQ ID NO:27是pSYN18619二元载体的核苷酸序列。
SEQ ID NO:28是pSYN18705二元载体的核苷酸序列。
SEQ ID NO:29是PMP393-4的核苷酸序列:Cry1Ai表达盒。
具体实施方式
本说明不旨在是可以实施本发明的所有不同方式或可以添加到本发明中的所有特征的详细目录。例如,关于一个实施例所说明的特征可以并入其他实施例中,并且关于一个特定实施例所说明的特征可以从那个实施例删除。因此,本发明预期了,在本发明的一些实施例中,可以排除或省略本文陈述的任何特征或特征的组合。此外,鉴于本披露内容,本文建议的不同实施例的众多变化以及增加物对于本领域技术人员是显而易见的,这不脱离本发明。因此,以下说明旨在阐述本发明的一些特定实施例,并且并没有穷尽地叙述其所有排列、组合和变化。
除非另外定义,本文所使用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常所理解的相同的含义。在本文的发明的说明中使用的术语是仅出于描述特定实施例的目的,且并不旨在限制本发明。分子生物学中常用术语的定义可在以下文献中找到:Benjamin Lewin,Genes V[基因V],由Oxford University Press[牛津大学出版社]出版,1994(ISBN 0-19-854287-9);Kendrew等人(编辑),The Encyclopedia of MolecularBiology[分子生物学百科全书],由Blackwell Science Ltd.[布莱克威尔科学出版公司]出版,1994(ISBN 0-632-02182-9);以及Robert A.Meyers(编辑),Molecular Biology andBiotechnology:a Comprehensive Desk Reference[分子生物学与生物技术:综合案头参考],由VCH Publishers,Inc.[VCH出版公司]出版,1995(ISBN 1-56081-569-8)。
本文引用的所有的公开、专利申请、专利以及其他参考文件对于引用中提及的有关句子和/或段落的传授内容通过引用以其全文并入。
本文提供的核苷酸序列以5'至3'方向从左至右表示,并且使用代表核苷酸碱基的标准代码表示,如37 CFR§§1.821-1.825和世界知识产权组织(WIPO)标准ST.25中所述,例如:腺嘌呤(A)、胞嘧啶(C)、胸腺嘧啶(T)、以及鸟嘌呤(G)。
氨基酸同样是使用WIPO标准ST.25来指示,例如:丙氨酸(Ala;A)、精氨酸(Arg;R)、天冬酰胺(Asn;N)、天冬氨酸(Asp;D)、半胱氨酸(Cys;C)、谷氨酰胺(Gln;Q)、谷氨酸(Glu;E)、甘氨酸(Gly;G)、组氨酸(His;H)、异亮氨酸(Ile;1)、亮氨酸(Leu;L)、赖氨酸(Lys;K)、甲硫氨酸(Met;M)、苯丙氨酸(Phe;F)、脯氨酸(Pro;P)、丝氨酸(Ser;S)、苏氨酸(Thr;T)、色氨酸(Trp;W)、酪氨酸(Tyr;Y)、以及缬氨酸(Val;V)。
除非上下文另外指示,明确地预期的是本文所述的本发明的不同特征可以按任何组合使用。而且,本发明还考虑到在本发明的一些实施例中,本文陈述的任何特征或特征的组合可以被排除或省略。举例说明,如果本说明书陈述组合物包含组分A、B和C,明确地预期A、B或C的任何一种或其组合可单一地或以任何组合被省略和放弃。
为了清晰起见,定义了在本说明书中所使用的某些术语并且将其呈现如下:
如本文和所附权利要求所使用的,单数形式“一个/一种(a/an)”和“所述/该(the)”包括复数指代物,除非上下文另外明确地指示。因此,例如,提及“一种植物”是提及一种或多种植物并且包括本领域技术人员已知的其等效物等。
如本文所使用的,术语“和/或”是指并且涵盖一个或多个相关联的列出项的任何及全部可能组合,连同当以可替代性(“或”)解释时组合的缺少。
术语“约”本文用于意指大约、大致、约或在……左右。当术语“约”结合数值范围来使用时,它通过将边界延伸至高于以及低于所阐述的数值来限定这个范围。一般而言,术语“约”本文用于将数值限定至以20%的变化,优选地10%上下(更高或更低)地高于以及低于规定值。关于温度,术语“约”意指±1℃,优选±0.5℃。当术语“约”被用于本发明的上下文中(例如与温度或分子量值组合)时,确切值(即,无“约”)是优选的。
如本文所使用的,术语“扩增的”意指使用至少一种核酸分子作为模板,构建核酸分子的多个拷贝或与该核酸分子互补的多个拷贝。扩增系统包括聚合酶链式反应(PCR)系统、连接酶链式反应(LCR)系统、基于核酸序列的扩增(NASBA,安大略省密西索加的坎基尼公司(Cangene,Mississauga,Ontario))、Q-β复制酶系统、基于转录的扩增系统(TAS)、以及链置换扩增(SDA)。参见,例如,Diagnostic Molecular Microbiology:Principles andApplications[诊断分子微生物学:原理与应用],PERSING等人编,American Society forMicrobiology[美国微生物学会],华盛顿(Washington,D.C.),(1993)。扩增的产物被称为“扩增子”。
杀昆虫蛋白的“活性”意指杀昆虫蛋白作为口服活性的昆虫控制剂发挥作用,具有毒性作用、和/或能够干扰或阻止昆虫摄食,这可能引起或者可能不引起昆虫的死亡。当杀昆虫蛋白被递送至昆虫时,这种结果典型地是该昆虫的死亡,或者该昆虫不以该杀昆虫蛋白可被该昆虫可用的来源为食。“杀有害生物”被定义为有毒的生物活性,其能够控制有害生物(如昆虫、线虫、真菌、细菌或病毒),优选地通过杀死或破坏它们来进行控制。“杀昆虫”被定义为有毒的生物活性,其能够控制昆虫,优选地通过杀死它们来进行控制。“杀有害生物剂”是具有杀有害生物活性的药剂。“杀昆虫剂”是具有杀昆虫活性的药剂。
如本文所使用的,术语“回交(backcross)”和“使回交(backcrossing)”是指如下方法,凭借该方法将子代植物与其亲本之一回交一代或多代(例如,2代或更多代、3代或更多代、4代或更多代、5代或更多代、6代或更多代、7代或更多代等)。在回交方案中,“供体”亲本是指具有待渗入的所希望的基因或DNA构建体或基因座的亲本植物。“受体”亲本(使用一次或多次)或“轮回”亲本(使用两次或更多次)是指基因或DNA构建体或基因座被渗入其中的亲本植物。例如,参见Ragot等人,Marker-assisted Backcrossing:A PracticalExample[标记辅助回交:实践范例],在TECHNIQUES ET UTILISATIONS DES MARQUEURSMOLECULAIRES LES COLLOQUES[分子标记技术和应用专题讨论会]中,第72卷,第45-56页(1995);和Openshaw等人,Marker-assisted Selection in Backcross Breeding[回交育种中的标记辅助选择],在PROCEEDINGS OF THE SYMPOSIUM“ANALYSIS OF MOLECULARMARKER DATA,”[专题讨论会会议记录“分子标记数据分析”]中,第41-43页(1994)。初始杂交产生F1代。术语“BC1”是指第二次使用轮回亲本,“BC2”是指第三次使用轮回亲本,等。在实施例中,针对所希望的基因或基因座(例如,在来自子代植物或植物部分的核酸样品中)的存在鉴定和/或选择至少一代或多代子代。在实施例中,针对所希望的基因或DNA构建体或基因座的存在,鉴定和/或选择子代的两代或更多代(或甚至所有代)。
如本文所使用的,术语“嵌合构建体”或“嵌合基因”或“嵌合多核苷酸”或“嵌合核酸”或“嵌合蛋白”(或相似术语)是指如下构建体或核酸分子或蛋白质,该构建体或核酸分子或蛋白质分别包含被组装进单个核酸分子或蛋白质中的不同来源的两个或更多个多核苷酸或氨基酸基序或结构域。术语“嵌合构建体”、“嵌合基因”、“嵌合多核苷酸”或“嵌合核酸”是指如下任何构建体或分子,该构建体或分子含有但不限于(1)多核苷酸(例如,DNA),包括在自然界中没有被发现在一起的调节多核苷酸和编码多核苷酸(即,构建体中的至少一个多核苷酸相对于它的其他多核苷酸中的至少一个是异源的),或(2)编码不是天然毗邻的蛋白部分的多核苷酸,或(3)不是天然毗邻的启动子部分。另外,嵌合构建体、嵌合基因、嵌合多核苷酸或嵌合核酸可以包含衍生自不同来源的调节多核苷酸和编码多核苷酸,或包含衍生自相同来源、但以与在自然界中所发现的不同的方式进行布置的调节多核苷酸和编码多核苷酸。在本发明的一些实施例中,嵌合构建体、嵌合基因、嵌合多核苷酸或嵌合核酸包含表达盒,该表达盒包含在调节多核苷酸的控制下、特别地在植物或细菌中具有功能性的调节多核苷酸的控制下的本发明的多核苷酸。
“编码序列”是转录成RNA(如mRNA、rRNA、tRNA、snRNA、正义RNA或反义RNA)的核酸序列。在一些方面,RNA进而在生物体(如玉米植物)中被翻译以产生蛋白质(例如,本发明的杀昆虫蛋白)。在其他方面,RNA不被翻译以产生蛋白质,而是作为RNA分子起作用以调节本发明的重组杀昆虫蛋白的表达。
如本文所使用的,“密码子优化的”序列意指如下核苷酸序列,其中这些密码子被选择以反映宿主细胞或生物体可以具有的特定的密码子偏好性。这典型地是以这样一种方式来完成,该方式是为了保持由待优化的核苷酸序列所编码的多肽的氨基酸序列。在某些实施例中,本发明的重组DNA构建体的DNA序列包括针对该构建体有待在其中进行表达的细胞(例如,动物、植物、或真菌细胞)进行了优化的密码子。例如,有待在植物细胞中表达的构建体可以使其全部或部分序列(例如,第一基因抑制元件或基因表达元件)进行密码子优化用于在植物中表达。参见例如,美国专利号6,121,014,通过引用并入本文。
术语“包含(comprises或comprising)”当用于本说明书中时指示所说明的特征、整数、步骤、操作、要素、或组分的存在,但并不排除一个或多个其他特征、整数、步骤、操作、要素、组分、或其组的存在或添加。
如本文所使用的,过渡短语“基本上由……组成”(以及语法变体)意指,权利要求的范围有待被解读为涵盖权利要求中所列举的指定材料或步骤以及非实质上改变所要求的发明的一个或多个基本和新颖特征的那些。因此,当用于本发明的权利要求中时,术语“基本上由……组成”并不旨在被解释为等同于“包含(comprising)”。
“控制”昆虫意指通过毒性作用抑制昆虫有害生物存活、生长、摄食、或繁殖的能力,或者限制昆虫相关的作物植物损害或损失,或者保护在昆虫有害生物存在的条件下生长时的作物的产量潜力。“控制”昆虫可以是或可以不是意指杀死昆虫,尽管其优选意指杀死昆虫。
如本文所使用的,术语“玉米(corn)”与术语“玉蜀黍(maize)”或“玉米(Zeamays)”同义。
如本文所使用的,术语“杂交(cross)”或“经杂交的(crossed)”是指通过授粉融合配子以产生子代(例如,细胞、种子或植物)。该术语包括有性杂交(一个植物由另一个授粉)和自交(自花授粉,例如当花粉和胚珠是来自相同的植物时)两者。术语“使杂交(crossing)”是指通过授粉使配子融合以产生子代的行为。
“外显子”是指携带对蛋白或其一部分进行编码的序列的DNA的区段。外显子被间插的、非编码序列(内含子)分离。出于本发明的目的,术语“外显子”的定义包括对源自靶基因的外显子的核苷酸序列进行修饰,条件是该经修饰的外显子没有显著地降低其关联的5'调节序列的活性。
如本文所使用的“表达盒”意指能够在适当的宿主细胞中指导特定的核苷酸序列的表达的核酸序列,包含可操作地连接至目的核苷酸序列的启动子,该目的核苷酸序列可操作地连接至终止信号。它还典型地包含适当翻译该核苷酸序列所需要的序列。包含该目的核苷酸序列的表达盒可能具有其组分中的至少一种,该组分相对于它的其他组分中的至少一种而言是异源的。该表达盒还可以是天然存在的但已经是以对于异源表达有用的重组形式而获得的表达盒。表达盒的这种用途使它如此在其被引入的细胞中不是天然存在的。然而,典型地,表达盒相对于宿主而言是异源的,即该表达盒的特定核酸序列不是天然存在于宿主细胞中的,并且必须已经通过转化过程引入到宿主细胞或宿主细胞的祖先中。在表达盒中核苷酸序列的表达可以是在组成型启动子或诱导型启动子的控制之下,该启动子只有当该宿主细胞暴露于一些特定的外界刺激时才启动转录。在多细胞生物体(如植物)的情况下,该启动子对于特定组织、或器官、或者发育阶段也可以是特异的。
表达盒还可以任选地包括在植物中发挥作用的转录和/或翻译终止区(即,终止区)。多种转录终止子是可供用于在表达盒中使用的并且负责在超出目的异源核苷酸序列时的转录终止以及正确的mRNA聚腺苷酸化。终止区对于转录起始区可以是天然的,对于可操作地连接的目的核苷酸序列可以是天然的,对于植物宿主可以是天然的,或者可以是衍生自另一种来源(即,对于启动子、目的核苷酸序列、植物宿主、或其任何组合而言是外来的或异源的)。适当的转录终止子包括但不限于CAMV 35S终止子、tml终止子、胭脂碱合酶终止子和/或豌豆rbcs E9终止子。这些终止子可以在单子叶植物和双子叶植物两者中使用。此外,可以使用编码序列的天然转录终止子。任何已知在植物中发挥作用的可用的终止子均可以在本发明的上下文中使用。
当参考多核苷酸(如植物的基因、开放阅读框(ORF)或其部分、或转基因)而使用时,术语“表达”是指通过基因的“转录”(即经由RNA聚合酶的酶促作用)将基因中编码的遗传信息转化为RNA(例如,mRNA、rRNA、tRNA或snRNA),并在适用的情况下(例如,如果基因编码蛋白)通过mRNA的“翻译”转化为蛋白质的过程。基因表达可以在该过程的许多阶段进行调节。例如,在反义构建体或dsRNA构建体的情况下,各自地表达可仅指该反义RNA或仅指dsRNA的转录。在本发明的一些实施例中,“表达”是指正义(mRNA)或功能性RNA的转录和稳定累积。在本发明的一些实施例中,“表达”是指蛋白质的产生。
如本文所使用的,术语“功能性转录”意指本发明的调控多核苷酸的表达产生一定量的目的蛋白,从而赋予产生该蛋白的组织用于其预期目的的表型。例如但不限于,编码杀昆虫蛋白的多核苷酸在转基因植物(例如转基因玉蜀黍植物)的叶组织中“功能性转录”,产生一定量的杀昆虫蛋白,该杀昆虫蛋白对以产生杀昆虫蛋白的叶组织为食的昆虫有害生物是有毒的。可替代地,术语“功能性转录”意指在转基因植物的任何组织中产生的蛋白质的量为至少50ng/mg总可溶性蛋白质(TSP),或至少100ng/mg TSP,或至少500ng/mg TSP,或至少800ng/mg TSP,或至少1000ng/mg TSP,或至少2000ng/mg TSP,或至少3000ng/mg TSP。在本发明的一些实施例中,与本发明的启动子可操作地连接的多核苷酸可以在非花粉组织中“功能性转录”且在转基因植物的花粉组织中以极低的水平转录,因此在花粉组织中产生极少量的蛋白质。这种极少量的蛋白质可以在约1ng/mg TSP至约15ng/mg TSP的范围内。这种低表达水平并不意味着多核苷酸在花粉中“功能性转录”,尤其是与同一转基因植物中的其他非花粉组织相比。在其他实施例中,在转基因植物(例如转基因玉蜀黍植物)的非花粉组织中产生的蛋白质水平是同一转基因植物的花粉组织中的至少100倍、或至少200倍、或至少300倍、或至少400倍、,或至少500倍、或至少600倍、或至少700倍、或至少800倍、或至少900倍或至少1000倍。
“基因”是位于基因组内并且包含编码核酸序列的限定区域,并且典型地还包含其他负责控制该编码部分表达(也就是转录和翻译)的主要调节性核酸。基因还可以包含其他5'和3'未翻译序列和终止序列。另外的可能存在的元件是例如内含子。如在自然界中所发现,基因的调节核酸序列在正常情况下可能不与该相关联的核酸序列进行可操作地连接,并因此不会是嵌合基因。
“目的基因”是指当转移至植物时,在该植物上赋予所希望的性状(如抗生素抗性、病毒抗性、昆虫抗性、疾病抗性、或对其他有害生物的抗性、除草剂耐受性、非生物胁迫耐受性、雄性不育、改性脂肪酸代谢、改性碳水化合物代谢、改善的营养价值、工业过程中改善的性能或改变的繁殖能力)的任何核酸分子。“目的基因”还可以是被转移至植物用于在该植物中产生商业上有价值的酶或代谢物的基因。
“异源”核酸序列或核酸分子是天然地不与将该核酸序列引入其中的宿主细胞相关联的核酸序列或核酸分子,包括天然存在的核酸序列的非天然存在的多个拷贝。异源核酸序列或核酸分子可以包含嵌合序列,如嵌合表达盒,在该表达盒中,启动子和编码区源自多源生物体。启动子序列可以是组成型启动子序列、组织特异性启动子序列、化学诱导型启动子序列、伤口诱导型启动子序列、胁迫诱导型启动子序列、或发育阶段特异性启动子序列。
“同源”核酸序列是与其被引入的宿主细胞天然相关联的核酸序列。
在两个核酸或氨基酸序列的上下文中,术语“同一性”或“相同的”或“基本上相同的”是指当针对最大对应性进行比较和比对时具有至少60%、优选至少80%、更优选90%、甚至更优选95%、并且最优选至少99%核苷酸或氨基酸残基同一性的两个或更多个序列或子序列,如使用以下序列比较算法之一或通过目测检查所测量的。优选地,基本的同一性存在于整个具有长度为至少约50个残基或碱基的序列的区域中,更优选地在整个至少约100个残基或碱基的区域中,并且最优选地这些序列在至少约150个残基或碱基上是基本上相同的。在一个尤其优选的实施例中,这些序列在整个编码区域长度中是基本上相同的。此外,基本上相同的核酸或氨基酸序列基本上执行相同的功能。
对于序列比较,典型地,一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入到计算机中(如有必要,指定子序列坐标),并且指定序列算法程序的参数。然后,该序列比较算法基于所指定的程序参数来计算这个或这些测试序列相对于该参考序列的序列同一性百分比。
用于比较的序列的最佳比对可以按照以下方式进行,例如通过Smith和Waterman,Adv.Appl.Math.[应用数学进展]2:482(1981)的局部同源性算法、通过Needleman和Wunsch,J.Mol.Biol.[分子生物学杂志]48:443(1970)的同源比对算法、通过Pearson和Lipman,Proc.Nat'l.Acad.Sci.USA[美国国家科学院院刊]85:2444(1988)的相似性方法的搜索,通过这些算法的计算机化实施(威斯康星州遗传学分析软件包(Wisconsin GeneticsSoftware Package)中的GAP、BESTFIT、FASTA和TFASTA,遗传学计算机组(GeneticsComputer Group),科学街575号,麦迪逊,威斯康星州),或通过目测检查(总体上参见Ausubel等人,下文)。
适用于确定序列同一性百分比以及序列相似性的算法的一个实例是BLAST算法,其描述于以下文献中:Altschul等人,J.Mol.Biol.[分子生物学杂志]215:403-410(1990)。执行BLAST分析的软件是通过国家生物技术信息中心(the National Center forBiotechnology Information,美国国家医学图书馆(U.S.National Library ofMedicine),美国洛克维尔大道8600号(8600Rockville Pike),贝塞斯达,马里兰州20894)可供公众使用的。这种算法涉及首先通过鉴定查询序列中具有长度W的短字码而鉴定得分高的序列对(HSP),这些得分高的序列对当与数据库序列中具有相同长度的字码(word)进行比对时匹配或满足一些正值阈值的得分T。T被称为邻近字码得分阈(Altschul等人,1990)。这些初始的邻近字码命中充当种子用于起始搜索以发现含有它们的较长的HSP。然后,将这些字码命中在两个方向上沿着每个序列延伸直到累积的比对得分可以增加。对于核苷酸序列,使用参数M(对于一对匹配残基的奖赏得分;总是>0)和N(对于错配残基的罚分;总是<0)来计算累积的得分。对于氨基酸序列,使用得分矩阵来计算累积得分。当累积的比对得分从它的最大达到值降低了数量X;由于累积一个或多个负得分的残基比对使累积得分趋于0或0以下;或者到达任一序列的末端时,停止这些字码命中在每个方向上的延伸。BLAST算法的参数W、T、以及X决定了比对的灵敏度与速度。BLASTN程序(对核苷酸序列来说)使用字长(W)为11、期望值(E)为10、截止值(cutoff)为100、M=5、N=-4、以及两条链的比较作为默认值。对于氨基酸序列,BLASTP程序使用字长(W)为3、期望值(E)为10、以及BLOSUM62评分矩阵作为默认值(参见Henikoff和Henikoff,Proc.Natl.Acad Sci.USA[美国国家科学院院刊]89:10915(1989))。
除了计算序列同一性百分比之外,BLAST算法还进行两个序列之间的相似性的统计分析(参见例如,Karlin和Altschul,Proc.Nat'l.Acad.Sci.USA[美国国家科学院院刊]90:5873-5787(1993))。由BLAST算法提供的相似性的一种量度是最小概率总和(P(N)),它提供了在两个核苷酸或氨基酸序列之间会偶然发生匹配的概率的指示。例如,若在测试核酸序列与参考核酸序列的比较中最小概率总和小于约0.1、更优选地小于约0.01、并且最优选地小于约0.001,则该测试核酸序列被认为是与该参考序列相似的。
两个核酸序列基本上相同的另一个指示是这两种分子在严格条件下彼此杂交。短语“特异性杂交”是指分子在严格条件下仅与特定的核苷酸序列结合、双链化或杂交,这是在该序列存在于复合混合物(例如,总细胞的)DNA或RNA中时进行的。“基本上结合”是指在探针核酸与靶核酸之间的互补杂交,并且涵盖少量错配,这些错配可以通过降低杂交介质的严格度来调适,以实现靶核酸序列的所希望的检测。
在核酸杂交实验(如DNA杂交和RNA杂交)的上下文中,“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。较长的序列在较高的温度下特异性杂交。对核酸杂交的广泛指导见于以下文献中:Tijssen(1993)LaboratoryTechniques in Biochemistry and Molecular Biology-Hybridization with NucleicAcid Probes[生物化学和分子生物学实验室技术-使用核酸探针的杂交]第2章第I部分“Overview of principles of hybridization and the strategy of nucleic acidprobe assays[杂交原理和核酸探针测定策略综述]”Elsevier[爱思唯尔集团],纽约。通常,高严格杂交和洗涤条件在限定的离子强度和pH下被选定为比特定序列的热熔点(Tm)低约5℃。典型地,在“严格条件”下,探针将会与它的靶序列进行杂交,但不会与其他序列杂交。
Tm是50%的靶序列与完全匹配的探针进行杂交时的温度(在限定的离子强度和pH下)。非常严格条件被选定为等于特定探针的Tm。对于互补核酸(它们在DNA或RNA印迹中在滤器上具有超过100个互补的残基)的杂交的严格杂交条件的实例是在42℃下、具有1mg肝素的50%甲酰胺、将杂交进行过夜。高严格洗涤条件的实例是0.15M NaCl在72℃下持续约15分钟。严格洗涤条件的实例是0.2×SSC洗涤在65℃下持续15分钟(参见,Sambrook,下文,对于SSC缓冲液的说明)。通常,高严格洗涤之前会先进行低严格洗涤,以去除背景探针信号。对于例如超过100个核苷酸的双链体的中等严格洗涤的实例是1×SSC在45℃下持续15分钟。对于例如超过100个核苷酸的双链体的低严格洗涤的实例是4-6×SSC在40℃下持续15分钟。对于短探针(例如,约10至50个核苷酸),严格条件典型地涉及小于约1.0M的Na离子的盐浓度,典型地在pH 7.0至8.3下约0.01至1.0M的Na离子浓度(或其他盐类),并且该温度典型地是至少约30℃。还可以通过添加去稳定剂(如甲酰胺)来达到严格条件。一般而言,相比于不相关的探针,在特定的杂交测定中观察到高出2倍(或更高)的信噪比就表明检测到特异性杂交。如果在严格条件下彼此不杂交的核酸所编码的蛋白是基本上相同的,则它们仍然是基本上相同的。例如,当使用遗传密码允许的最大程度的密码子简并而创建核酸的拷贝时,则发生这种情况。
以下是可以用来克隆同源核苷酸序列(这些序列与本发明的参考核苷酸序列基本上相同)的杂交/洗涤条件的设置的实例:参考核苷酸序列在以下条件下优选地与该参考核苷酸序列杂交:在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在2×SSC、0.1%SDS中在50℃洗涤;更令人希望的是在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在1×SSC、0.1%SDS中在50℃洗涤;仍更令人希望的是在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在0.5×SSC、0.1%SDS中在50℃洗涤;优选地在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在0.1×SSC、0.1%SDS中在50℃洗涤;更优选地在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中在50℃,并且在0.1×SSC、0.1%SDS中在65℃洗涤。
两个核酸序列或蛋白基本上相同的另一个指示是由第一核酸编码的蛋白与由第二核酸编码的蛋白进行免疫性交联反应或与其特异性结合。因此,蛋白典型地是与第二蛋白基本上相同的,例如其中这两种蛋白仅区别于保守性取代。
“内含子”指几乎唯一地在真核基因中发生的DNA的一个内插区段,但这个内插区段在该基因产物中没有被翻译成氨基酸序列。通过一个称为剪接的过程从未成熟的mRNA中去除这些内含子,该剪接使外显子未被触及,从而形成一个mRNA。出于本发明的目的,术语“内含子”的定义包括对源自靶基因的内含子的核苷酸序列进行修饰,条件是该经修饰的内含子没有显著地降低其关联的5'调节序列的活性。
术语“分离的”核酸分子、多核苷酸或蛋白质是不再存在于其天然环境中的核酸分子、多核苷酸或蛋白质。本发明的分离的核酸分子、多核苷酸或蛋白质可以按照纯化的形式存在,或者可以存在于重组宿主中,例如转基因细菌或转基因植物中。因此,如本文所列举的对“分离的”核酸分子的要求涵盖包含在转基因植物基因组内的核酸分子。
“核酸分子”或“核酸序列”是可以从任何来源中分离的单链或双链DNA或RNA的区段。在本发明的上下文中,核酸分子典型地是DNA的区段。在一些实施例中,本发明的核酸分子是分离的核酸分子。
“可操作地连接”是指在单一核酸片段上多核苷酸的关联,这样使得一者的功能影响另一者的功能。例如,当启动子能够影响编码多核苷酸或功能RNA的表达时(即,该编码多核苷酸或功能RNA处于该启动子的转录控制之下),则该启动子与该编码多核苷酸或功能RNA是可操作地连接的。正义方向或者反义方向的编码多核苷酸能够与调节多核苷酸可操作地连接。
术语“蛋白质”、“肽”和“多肽”在本文中可互换使用。
“植物”是在发育的任何阶段的任何植物,特别是种子植物。
“植物细胞”是植物的结构和生理单位,包含原生质体和细胞壁。植物细胞可以处于分离的单个细胞或培养细胞的形式,或者是作为较高级的组织单位(如例如,植物组织、植物器官、或全株植物)的一部分。
“植物细胞培养物”意指植物单元(如例如,原生质体、细胞培养物细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、接合子以及处于不同发育阶段的胚)的培养物。
“植物材料”是指叶、茎、根、花或花的部分、果实、花粉、卵细胞、接合子、种子、切条、细胞或组织培养物、或植物的任何其他部分或产物。
“植物器官”是植物的独特而明显的已结构化并且分化的部分,如根、茎、叶、花芽或胚。
如本文所使用的“植物组织”意指组织化成结构和功能单元的一组植物细胞。包括植物中或培养物中的任何植物组织。这个术语包括但不限于全株植物、植物器官、植物种子、组织培养物以及被组织化成结构和/或功能单元的任何植物细胞群组。这个术语与如以上列出的或由该定义以其他方式涵盖的任何具体类型的植物组织的联合应用或单独应用并不旨在排除任何其他类型的植物组织。例如,“绒毡层”是玉米植物孢子囊(特别是花药)内的组织,为生长的孢子提供营养。
“多核苷酸”是指由共价键合于链中的许多核苷酸单体构成的聚合物。此类“多核苷酸”包括DNA、RNA、经修饰的寡核苷酸(例如,包含对于生物RNA或DNA非典型的碱基的寡核苷酸,如2'-O-甲基化寡核苷酸)等。在一些实施例中,核酸或多核苷酸可以是单链的、双链的、多链的或其组合。除非另有说明,否则除任何明确指示的多核苷酸之外,本发明的具体核酸或多核苷酸任选地还包含或编码互补多核苷酸。
“目的多核苷酸”是指任何多核苷酸,当将其转移至生物(例如,植物)中时赋予该生物体所希望的特征,如昆虫抗性、疾病抗性、除草剂耐受性、抗生素抗性、改善的营养价值、工业过程中改善的性能、商业上有价值的酶或代谢物的产生、或者改变的繁殖能力。
“启动子”是编码区的不被翻译的DNA序列上游,其含有RNA聚合酶结合位点并且启动DNA的转录。启动子区还可以包括充当基因表达的调节物的其他元件。
“优选表达”指基因产物如下表达,这些基因产物优选地在一个或几个植物组织中(空间限制)和/或在一个或几个植物发育阶段(时间限制)以较高水平来表达,而在其他组织/发育阶段,存在相对较低水平的表达。
如本文所使用的,术语“重组”是指核酸分子(例如,DNA或RNA)或蛋白或生物体的如下形式,该形式通常不会在自然界中发现并且正因为如此通过人类干预来产生。如本文所使用的,“重组核酸分子”是包含多核苷酸组合的核酸分子,这些多核苷酸不会天然地共同存在并且是人类干预的结果,例如,由至少两种彼此异源的多核苷酸的组合组成的核酸分子,或人工合成的(例如,使用组装的核苷酸序列合成的多核苷酸)并且包含不同于通常存在于自然界中的多核苷酸的多核苷酸的核酸分子,或包含人工掺入至宿主细胞的基因组DNA中和该宿主细胞基因组相关侧翼DNA中的转基因的核酸分子。重组核酸分子的另一个实例是由将转基因插入至植物的基因组DNA中产生的DNA分子,其可以最终导致该生物体中的重组RNA/或蛋白分子的表达。如本文所使用的,“重组植物”是通常不会在自然界中存在的植物,是人类干预的结果,并且含有掺入至其基因组中的转基因和/或异源核酸分子。由于此类基因组改变,重组植物明显不同于相关的野生型植物。
“调控序列”或“调控元件”等在本文应当理解为是指以下核苷酸序列,该核苷酸序列通过提供对于RNA聚合酶以及用于适当转录所要求的其他因子的识别来控制可操作地相关编码序列的表达,并且通常位于它的编码序列的上游(5')处。“调控序列”包括位于近端的5'调控序列以及相关编码区的上游的更远端元件,这些调控序列和元件影响相关编码序列的转录、RNA加工或稳定性、或翻译。“调控序列”可以进一步包括3'序列,这些3'序列包括3'非翻译序列和/或3'非转录序列,位于相关编码区域的下游,并且该调控序列可以包括转录终止位点,例如终止子。“调控序列”可以包括增强子、启动子、非翻译的前导序列、内含子、以及聚腺苷酸化信号序列。它们包括天然序列以及合成序列、连同可能是合成序列与天然序列的组合的序列。“增强子”是一种DNA序列,它可以刺激启动子的活性并且可以是该启动子的固有元件或插入的异源元件以增强启动子的水平或组织特异性。它能够在两个方向(正常或翻转)上进行操作,并且甚至当移动到该启动子的上游或下游时还能够发挥作用。增强子的实例还包括玄参花叶病毒增强子(eFMV)和花椰菜花叶病毒增强子(e35S)。术语“调控序列”的含义包括“转录起始”或“启动子”序列和“启动子调控序列”。这些术语在本文中可以互换使用。
“调控元件”是指参与控制核苷酸序列的表达的序列。调控元件包含可操作地连接至目的核苷酸序列的启动子以及终止信号。它们还典型地涵盖适当翻译该核苷酸序列所需的序列。
“特异性表达”是仅限于一种或几种植物组织(空间限制)和/或一种或几种植物发育阶段(时间限制)的基因产物的表达。
“组织特异性启动子”是指以下受调控的启动子,它们不表达于所有植物细胞中或仅在特定器官(如,叶、根或种子)的一个或多个细胞类型、特定组织(如,胚或子叶)、或特定细胞类型(如,叶实质或种子存储细胞)中表达。这些还包括受时间调节的启动子,如在胚形成的初期或晚期、在种子或果实发育的果实成熟期间、在叶子被彻底分化中、或在衰老的起始时。
“转录盒”以5'-3'转录方向将包含转录和翻译起始区、目的DNA序列以及在植物中起作用的转录和翻译终止区。终止区可以对转录起始区是天然的,可以对目的DNA序列是天然的,或者可以衍生自另一个来源。
“转录起始位点”是围绕着第一核苷酸(该第一核苷酸是经转录的序列的一部分)的位置,它还被定义为位置+1。相对于这个位点,对该基因的所有其他序列及其控制区域进行编号。对下游序列(即在3'方向上的其他蛋白编码序列)进行正性命名,而对上游序列(在5'方向上的大多数控制区域)进行负性命名。
在多核苷酸的上下文中,“瞬时转化”意指将多核苷酸引入细胞中并且没有整合到该细胞的基因组中。瞬时转化可以通过例如酶联免疫测定(ELISA)或蛋白质印迹来进行检测,这两种方法可以检测由引入生物体的一个或多个核酸分子编码的肽或多肽的存在。细胞的稳定转化可以通过例如细胞基因组DNA与核酸序列(这些序列与引入生物体(例如,植物)中的核酸分子的核苷酸序列特异性地杂交)的DNA印迹杂交测定来进行检测。细胞的稳定转化可以通过例如细胞的RNA与核酸序列(这些序列与引入植物或其他生物体的核酸分子的核苷酸序列特异性地杂交)的RNA印记杂交测定来进行检测。细胞的稳定转化还可以通过例如聚合酶链式反应(PCR)或本领域内熟知的其他扩增反应来进行检测,该反应采用与核酸分子的一个或多个靶序列进行杂交的特异性引物序列,导致这一个或多个靶序列的扩增,这种扩增可以根据标准方法进行检测。转化还可以通过本领域熟知的直接测序和/或杂交方案进行检测。
“转化”是用于将异源核酸引入到宿主细胞或生物体的方法。在特定实施例中,“转化”意指DNA分子稳定地整合到目的生物体的基因组(核或质体)中。
“转化的/转基因的/重组的”是指异源核酸分子已经引入其中的宿主生物体(例如细菌或植物)。核酸分子可以被稳定地整合到宿主的基因组中,或者核酸分子还可以作为染色体外分子存在。这种染色体外分子能够自主复制。转化的细胞、组织或植物应当理解为不仅涵盖转化过程的终产物,而且涵盖其转基因子代。“非转化的”、“非转基因的”、或“非重组的”宿主是指不含该异源的核酸分子的野生型生物体,例如细菌或植物。
“载体”被定义包括(尤其)呈双链或单链的线形或环形的任何质粒、黏粒、噬菌体或农杆菌二元载体,它们可能是或可能不是可自我传送的或可活动的,并且它们可以通过整合到细胞基因组中来转化原核或真核宿主,或在染色体外存在(例如,具有复制起点的自主复制的质粒)。特别包括的是穿梭载体,穿梭载体一词是指一种DNA运载体,该DNA运载体自然地或经设计能够在两个不同的宿主生物体中复制,这些宿主生物体可以选自:放线菌以及相关的物种、细菌和真核生物(例如,高等植物、哺乳动物、酵母或真菌细胞)。
本发明总体上涉及调控多核苷酸,其至少部分具有转录起始功能,该功能指导可操作地连接的蛋白质编码多核苷酸在基本上所有植物组织中的表达,但基本上不包括在雄性生殖组织(如花粉和/或雄穗组织)中的表达。调控多核苷酸可用于嵌合构建体、表达盒、重组载体等中以驱动目标有害生物通常摄食的植物组织中的目的蛋白(例如杀昆虫蛋白)的表达,并消除或减少杀昆虫蛋白在典型地不被有害生物昆虫摄食的组织或在那些可能被杀昆虫蛋白损害的组织(如花粉或雄穗)中的积累。
通过克隆与在除花粉以外的组织中表达的cDNA序列(即“非花粉”cDNA序列)同源的基因组序列来获得启动子序列。基因组序列可以通过杂交方法或通过使用PCR方法从已知序列在5'或3'方向上延伸序列(有时称为“基因组步行(genome walking)”)获得。例如,为了获得针对cDNA已知序列的基因组序列5',针对cDNA 5'端附近的序列制作引物。使用每个与短寡核苷酸衔接子连接的基因组DNA序列的5'端构建基因组文库。使用与衔接子序列杂交的引物和非花粉cDNA序列的5'引物进行的PCR使得基因组序列的扩增位于非花粉序列的同源序列的5'。对从基因组步行获得的DNA序列进行测序,如果需要额外的5'区域,则使用现在获得的最长克隆的5'端的引物重复该过程。还通过在高严格条件下杂交获得与非花粉cDNA序列同源的基因组序列。高严格条件选择用于由非花粉cDNA序列制成的探针的杂交,以与其在基因组DNA中的同源序列杂交。基因组DNA包含在λ噬菌体载体中的5-20kb玉蜀黍基因组DNA序列的基因组DNA文库中。将与非花粉cDNA杂交的基因组克隆进行分离并对其进行测序。
本发明的启动子位于编码序列的紧邻上游的非花粉(pollen-minus)cDNA序列的5'-区域中。调控区域的大小优选在约2kb至8kb之间的范围内并且包含5'-非转录序列,特别是5'-非转录序列和5'-UTR以及全部或部分的代表第一内含子的核苷酸序列。本文示例性的启动子列于SEQ ID NO:1-11中。本发明的调控序列可以进一步包括刚好在越过非花粉cDNA翻译终止密码子处开始的3'序列的一部分,包括被转录但不被翻译的序列(UTR)和作为转录终止子和聚腺苷酸化信号起作用的不被转录的序列。特别地,该3'序列在约1.0kb和约2.5kb之间的范围内。本文示例性的终止子列于SEQ ID NO:12-20中。
基因组克隆可以包含在mRNA或cDNA克隆中未发现的内含子序列。基因组序列可以额外地包含5'非翻译序列、3'非翻译序列以及5'和3'调控序列。发现启动子序列在cDNA序列的基因组序列5'中。克隆与非花粉cDNA序列同源的基因组序列。与cDNA序列同源的序列的5'的序列在本文中称为包含启动子区域的5'侧翼区域。
在一些实施例中,本发明提供了一种嵌合DNA构建体,该嵌合DNA构建体包含与调控序列可操作地连接的杀昆虫蛋白编码序列,该调控序列的至少一部分具有转录起始功能,该功能指导编码的杀昆虫蛋白在除了雄性生殖组织(如花粉和/或雄穗)以外的基本上所有植物组织中的表达,因此极少或没有表达产物以任何显著程度存在于花粉和/或雄穗组织中。如所指定的,本发明的核酸序列可以DNA或RNA的形式提供;如本领域普通技术人员所熟知的,披露其中一种必然限定另一种。此外,如本领域普通技术人员所熟知的,给定核酸序列的披露必然限定该序列的精确互补体。
在一些实施例中,本发明提供了一种表达盒,该表达盒包含启动子,该启动子包含核苷酸序列,a)该核苷酸序列与SEQ ID NO:1-11中的任一项具有至少95%至至少99%的同一性;或b)该核酸序列是SEQ ID NO:1-11中的任一项,与目的异源多核苷酸可操作地连接,该目的异源多核苷酸与包括聚腺苷酸化信号的3'非翻译区可操作地连接,其中该异源多核苷酸在转基因植物的非花粉组织中功能性转录。在其他实施例中,异源多核苷酸编码杀昆虫蛋白或双链RNA(dsRNA)。在其他实施例中,杀昆虫蛋白是Cry蛋白或Vip3蛋白。
在仍其他实施例中,杀昆虫Cry蛋白选自由以下组成的组:Cry1Aa、Cry1Ab、Cry1Ac、Cry1Ad、Cry1Ae、Cry1Af、Cry1Ag、Cry1Ah、Cry1Ai、Cry1Aj、Cry1Ba、Cry1Bb、Cry1Bc、Cry1Bd、Cry1Be、Cry1Bf、Cry1Bg、Cry1Bh、Cry1Bi、Cry1Ca、Cry1Cb、Cry1Da、Cry1Db、Cry1Dc、Cry1Dd、Cry1Ea、Cry1Eb、Cry1Fa、Cry1Fb、Cry1Ga、Cry1Gb、Cry1Gc、Cry1Ha、Cry1Hb、Cry1Hc、Cry1Ia、Cry1Ib、Cry1Ic、Cry1Id、Cry1Ie、Cry1If、Cry1Ig、Cry1Ja、Cry1Jb、Cry1Jc、Cry1Jd、Cry1Ka、Cry1La、Cry1Ma、Cry1Na、Cry1Nb、Cry2Aa、Cry2Ab、Cry2Ac、Cry2Ad、Cry2Ae、Cry2Af、Cry2Ag、Cry2Ah、Cry2Ai、Cry2Aj、Cry2Ak,Cry2Al、Cry2Ba、Cry3Aa、Cry3Ba、Cry3Bb、Cry3Ca、Cry4Aa、Cry4Ba、Cry4Ca、Cry4Cb、Cry4Cc、Cry5Aa、Cry5Ab、Cry5Ac、Cry5Ad、Cry5Ba、Cry5Ca、Cry5Da、Cry5Ea、Cry6Aa、Cry6Ba、Cry7Aa、Cry7Ab、Cry7Ac、Cry7Ba、Cry7Bb、Cry7Ca、Cry7Cb、Cry7Da、Cry7Ea、Cry7Fa、Cry7Fb、Cry7Ga、Cry7Gb、Cry7Gc、Cry7Gd、Cry7Ha、Cry7Ia、Cry7Ja、Cry7Ka、Cry7Kb、Cry7La、Cry8Aa、Cry8Ab、Cry8Ac、Cry8Ad、Cry8Ba、Cry8Bb、Cry8Bc、Cry8Ca、Cry8Da、Cry8Db、Cry8Ea、Cry8Fa、Cry8Ga、Cry8Ha、Cry8Ia、Cry8Ib、Cry8Ja、Cry8Ka、Cry8Kb、Cry8La、Cry8Ma、Cry8Na、Cry8Pa、Cry8Qa、Cry8Ra、Cry8Sa、Cry8Ta、Cry9Aa、Cry9Ba、Cry9Bb、Cry9Ca、Cry9Da、Cry9Db、Cry9Dc、Cry9Ea、Cry9Eb、Cry9Ec、Cry9Ed、Cry9Ee、Cry9Fa、Cry9Ga、Cry10Aa、Cry11Aa、Cry11Ba、Cry11Bb、Cry12Aa,Cry13Aa、Cry14Aa、Cry14Ab、Cry15Aa、Cry16Aa、Cry17Aa、Cry18Aa、Cry18Ba、Cry18Ca、Cry19Aa、Cry19Ba、Cry19Ca、Cry20Aa、Cry20Ba、Cry21Aa、Cry21Ba、Cry21Ca、Cry21Da、Cry21Ea、Cry21Fa、Cry21Ga、Cry21Ha、Cry22Aa、Cry22Ab、Cry22Ba、Cry22Bb、Cry23Aa、Cry24Aa、Cry24Ba、Cry24Ca、Cry25Aa、Cry26Aa、Cry27Aa、Cry28Aa、Cry29Aa、Cry29Ba、Cry30Aa、Cry30Ba、Cry30Ca、Cry30Da、Cry30Db、Cry30Ea、Cry30Fa、Cry30Ga,Cry31Aa、Cry31Ab、Cry31Ac、Cry31Ad、Cry32Aa、Cry32Ab、Cry32Ba、Cry32Ca、Cry32Cb、Cry32Da、Cry32Ea、Cry32Eb、Cry32Fa、Cry32Ga、Cry32Ha、Cry32Hb、Cry32Ia、Cry32Ja、Cry32Ka、Cry32La、Cry32Ma、Cry32Mb、Cry32Na、Cry32Oa、Cry32Pa、Cry32Qa、Cry32Ra、Cry32Sa、Cry32Ta、Cry32Ua、Cry33Aa、Cry34Aa、Cry34Ab、Cry34Ac、Cry34Ba、Cry35Aa、Cry35Ab、Cry35Ac、Cry35Ba、Cry36Aa、Cry37Aa、Cry38Aa、Cry39Aa、Cry40Aa、Cry40Ba、Cry40Ca、Cry40Da、Cry41Aa、Cry41Ab、Cry41Ba、Cry42Aa、Cry43Aa、Cry43Ba、Cry43Ca、Cry43Cb、Cry43Cc、Cry44Aa、Cry45Aa、Cry46Aa、Cry46Ab、Cry47Aa、Cry48Aa、Cry48Ab、Cry49Aa、Cry49Ab、Cry50Aa、Cry50Ba、Cry51Aa、Cry52Aa、Cry52Ba、Cry53Aa、Cry53Ab、Cry54Aa、Cry54Ab、Cry54Ba、Cry55Aa、Cry56Aa、Cry57Aa、Cry57Ab、Cry58Aa、Cry59Aa、Cry59Ba、Cry60Aa、Cry60Ba、Cry61Aa、Cry62Aa、Cry63Aa、Cry64Aa、Cry65Aa、Cry66Aa、Cry67Aa、Cry68Aa、Cry69Aa、Cry69Ab、Cry70Aa、Cry70Ba、Cry70Bb、Cry71Aa、Cry72Aa以及Cry73Aa。在仍其他实施例中,Cry蛋白是Cry1蛋白。在其他实施例中,Cry1蛋白是Cry1A蛋白。在仍其他实施例中,Cry1A蛋白是Cry1Ab或Cry1Ai蛋白。
在其他实施例中,由与本发明的启动子可操作地连接的异源多核苷酸编码的Vip3杀昆虫蛋白选自由以下组成的组:Vip3Aa1、Vip3Aa2、Vip3Aa3、Vip3Aa4、Vip3Aa5、Vip3Aa6、Vip3Aa7、Vip3Aa8、Vip3Aa9、Vip3Aa10、Vip3Aa11、Vip3Aa12、Vip3Aa13、Vip3Aa14、Vip3Aa15、Vip3Aa16、Vip3Aa17、Vip3Aa18、Vip3Aa19、Vip3Aa20、Vip3Aa21、Vip3Aa22、Vip3Aa2、Vip3Aa24、Vip3Aa25、Vip3Aa26、Vip3Aa27、Vip3Aa28、Vip3Aa29、Vip3Aa30、Vip3Aa31、Vip3Aa32、Vip3Aa33、Vip3Aa34、Vip3Aa35、Vip3Aa36、Vip3Aa37、Vip3Aa38、Vip3Aa39、Vip3Aa40、Vip3Aa41、Vip3Aa42、Vip3Aa43、Vip3Aa44、Vip3Ab1、Vip3Ab2、Vip3Ac1、Vip3Ad1、Vip3Ad2、Vip3Ae1、Vip3Af1、Vip3Af2、Vip3Af3、Vip3Ag1、Vip3Ag2、Vip3Ag3、HM117633、Vip3Ag4、Vip3Ag5、Vip3Ah1、Vip3Ba1、Vip3Ba2、Vip3Bb1、Vip3Bb2以及Vip3Bb3。在仍其他实施例中,Vip3蛋白是Vip3A蛋白。在其他实施例中,Vip3A蛋白是Vip3Aa蛋白。在其他实施例中,Vip3Aa蛋白是Vip3Aa19或Vip3Aa20蛋白。
在一些实施例中,本发明的异源多核苷酸在其中被功能性转录的转基因植物是单子叶植物。在其他实施例中,单子叶植物是玉蜀黍植物。在其他实施例中,玉蜀黍植物是近交玉蜀黍植物或杂交玉蜀黍植物。在一些实施例中,异源多核苷酸在其中功能性表达的玉蜀黍植物的组织是叶、花丝或苞叶。
在一些实施例中,本发明的表达盒的3'非翻译区包含选自SEQ ID NO:12-20中任一项的终止子序列。在仍其他的实施例中,表达盒包含SEQ ID NO:29。
在一些实施例中,本发明提供了包含本发明的表达盒的重组载体。在其他实施例中,重组载体是能够在多种生物体中发挥作用的二元载体。在其他实施例中,生物体是细菌或植物。在其他实施例中,二元载体包含SEQ ID NO:21-28中的任一项。
在一些实施例中,本发明提供了用本发明的重组载体或表达盒转化的植物细胞。在其他实施例中,重组载体或表达盒在植物细胞中瞬时表达。在其他实施例中,本发明的重组载体或表达盒被稳定地整合到植物细胞的基因组中。在其他实施例中,植物细胞是单子叶植物细胞。在仍其他实施例中,单子叶植物细胞是玉蜀黍植物细胞。在其他实施例中,表达盒包含SEQ ID NO:21-28中任一项的表达盒序列。在仍其他实施例中,表达盒包含SEQ IDNO:29。
在一些实施例中,本发明提供了包含本发明的表达盒或载体的转基因植物。在其他实施例中,表达盒或载体或其部分被稳定地整合到转基因植物的基因组中。在其他实施例中,转基因植物是单子叶植物。在仍其他实施例中,单子叶转基因植物是转基因玉蜀黍植物。在其他实施例中,转基因玉蜀黍植物是近交玉蜀黍植物或杂交玉蜀黍植物。在其他实施例中,转基因玉蜀黍植物在任何非花粉的组织中以功能水平表达目的蛋白。在仍其他实施例中,以功能水平表达目的蛋白的组织是叶、花丝或苞叶。
在其他实施例中,在转基因植物的任何非花粉的组织中以功能水平表达的目的蛋白是Cry蛋白或Vip3蛋白。在其他实施例中,Cry蛋白或Vip3蛋白选自上述的Cry蛋白和Vip3蛋白的列表。在其他实施例中,Cry蛋白是Cry1蛋白。在其他实施例中,Cry1蛋白是Cry1A蛋白。在仍其他实施例中,Cry1A蛋白是Cry1Ab蛋白或Cry1Ai蛋白。在仍其他实施例中,Vip3蛋白是Vip3A蛋白。在其他实施例中,Vip3A蛋白是Vip3Aa蛋白。在仍其他实施例中,VIp3Aa蛋白是Vip3Aa19或Vip3Aa20蛋白。
在一些实施例中,本发明提供了任何本发明的转基因植物的转基因种子。在其他实施例中,转基因种子包含本发明的表达盒或载体或其部分。在其他实施例中,转基因种子是玉蜀黍种子。在其他实施例中,玉蜀黍种子用作玉蜀黍繁殖手段。在其他实施例中,转基因玉蜀黍种子用作收获的谷物。
在一些实施例中,本发明提供了分离的核酸分子,该核酸分子包含选自由以下组成的组的核苷酸序列:a)在SEQ ID NO:1-20中列出的序列;b)在高严格条件下与a)的核苷酸序列杂交的核苷酸序列;和c)包含a)的核苷酸序列的片段的核苷酸序列,其中所述片段保持a)的核苷酸序列的功能;其中所述核酸分子在转基因植物的非花粉的组织中启动或终止可操作地连接的目的多核苷酸的功能性转录。
在一些实施例中,与本发明的分离的核酸分子可操作地连接的目的多核苷酸编码杀昆虫蛋白或双链RNA(dsRNA)。在其他实施例中,杀昆虫蛋白是Cry蛋白或Vip3蛋白。在其他实施例中,Cry蛋白或Vip3蛋白选自上述的Cry蛋白和Vip3蛋白的列表。在其他实施例中,Cry蛋白是Cry1蛋白。在其他实施例中,Cry1蛋白是Cry1A蛋白。在其他实施例中,Cry1A蛋白是Cry1Ab或Cry1Ai蛋白。在仍其他实施例中,Vip3蛋白是Vip3A蛋白。在其他实施例中,Vip3A蛋白是Viip3Aa蛋白。在其他实施例中,Vip3Aa蛋白是Vip3Aa19或Vip3Aa20蛋白。
在一些实施例中,本发明的分离的核酸分子包含在SEQ ID NO:1中列出的启动子核苷酸序列。在其他实施例中,本发明的分离的核酸分子包含在SEQ ID NO:1中列出的启动子核苷酸序列和在SEQ ID NO:12中列出的终止子核苷酸序列。
在一些实施例中,本发明的分离的核酸分子包含在SEQ ID NO:2中列出的启动子核苷酸序列。在其他实施例中,本发明的分离的核酸分子包含在SEQ ID NO:2中列出的启动子核苷酸序列和在SEQ ID NO:13或SEQ ID NO:14中列出的终止子核苷酸序列。
在一些实施例中,本发明的分离的核酸分子包含在SEQ ID NO:3中列出的启动子核苷酸序列。在其他实施例中,本发明的分离的核酸分子包含在SEQ ID NO:3中列出的启动子核苷酸序列和在SEQ ID NO:13或SEQ ID NO:14中列出的终止子核苷酸序列。
在一些实施例中,本发明的分离的核酸分子包含在SEQ ID NO:4中列出的启动子核苷酸序列。在其他实施例中,本发明的分离的核酸分子包含在SEQ ID NO:4中列出的启动子核苷酸序列和在SEQ ID NO:13或SEQ ID NO:14中列出的终止子核苷酸序列。
在一些实施例中,本发明的分离的核酸分子包含在SEQ ID NO:5中列出的启动子核苷酸序列。在其他实施例中,本发明的分离的核酸分子包含在SEQ ID NO:5中列出的启动子核苷酸序列和在SEQ ID NO:13或SEQ ID NO:14中列出的终止子核苷酸序列。
在一些实施例中,本发明的分离的核酸分子包含在SEQ ID NO:6中列出的启动子核苷酸序列。在其他实施例中,本发明的分离的核酸分子包含在SEQ ID NO:6中列出的启动子核苷酸序列和在SEQ ID NO:15中列出的终止子核苷酸序列。
在一些实施例中,本发明的分离的核酸分子包含在SEQ ID NO:7中列出的启动子核苷酸序列。在其他实施例中,本发明的分离的核酸分子包含在SEQ ID NO:7中列出的启动子核苷酸序列和在SEQ ID NO:16中列出的终止子核苷酸序列。
在一些实施例中,本发明的分离的核酸分子包含在SEQ ID NO:8中列出的启动子核苷酸序列。在其他实施例中,本发明的分离的核酸分子包含在SEQ ID NO:8中列出的启动子核苷酸序列和在SEQ ID NO:17中列出的终止子核苷酸序列。
在一些实施例中,本发明的分离的核酸分子包含在SEQ ID NO:9中列出的启动子核苷酸序列。在其他实施例中,本发明的分离的核酸分子包含在SEQ ID NO:9中列出的启动子核苷酸序列和在SEQ ID NO:18中列出的终止子核苷酸序列。
在一些实施例中,本发明的分离的核酸分子包含在SEQ ID NO:10中列出的启动子核苷酸序列。在其他实施例中,本发明的分离的核酸分子包含在SEQ ID NO:10中列出的启动子核苷酸序列和在SEQ ID NO:19中列出的终止子核苷酸序列。
在一些实施例中,本发明的分离的核酸分子包含在SEQ ID NO:11中列出的启动子核苷酸序列。在其他实施例中,本发明的分离的核酸分子包含在SEQ ID NO:11中列出的启动子核苷酸序列和在SEQ ID NO:20中列出的终止子核苷酸序列。
在一些实施例中,本发明的分离的核酸分子在转基因玉蜀黍植物的任何非花粉组织中启动或终止可操作地连接的目的多核苷酸的功能性转录。
在一些实施例中,本发明提供了一种用于在转基因植物或转基因植物细胞中表达目的蛋白或目的多核苷酸的方法,所述方法包括:将本发明的表达盒或载体引入植物或植物细胞中,所述表达盒或载体包含与异源多核苷酸可操作地连接的启动子,所述异源多核苷酸编码目的蛋白或目的多核苷酸,其中所述启动子包含SEQ ID NO:1-11中的任一项,并且其中所述目的蛋白或目的多核苷酸在转基因植物的非花粉组织中功能性表达。在其他实施例中,表达盒或载体还包含终止子序列,该终止子序列与包含SEQ ID NO:12-20中任一项的异源多核苷酸可操作地连接。
用于在转基因植物或转基因植物细胞中表达目的蛋白或目的多核苷酸的方法的其他实施例中,目的蛋白是杀昆虫蛋白或目的多核苷酸是杀昆虫的dsRNA。在其他实施例中,杀昆虫蛋白是Cry蛋白或Vip3蛋白。在其他实施例中,Cry蛋白或Vip3蛋白选自上述的Cry蛋白和Vip3蛋白的列表。在其他实施例中,Cry蛋白是Cry1蛋白。在仍其他实施例中,Cry1蛋白是Cry1A蛋白。在其他实施例中,Cry1A蛋白是Cry1Ab或Cry1Ai蛋白。在仍其他实施例中,Vip3蛋白是Vip3A蛋白。在其他实施例中,Vip3A蛋白是Viip3Aa蛋白。在其他实施例中,Vip3Aa蛋白是Vip3Aa19或Vip3Aa20蛋白。
用于在转基因植物或转基因植物细胞中表达目的蛋白或目的多核苷酸的方法的其他实施例中,转基因植物是转基因玉蜀黍植物。在其他实施例中,转基因玉蜀黍植物是近交玉蜀黍植物或杂交玉蜀黍植物。在仍其他实施例中,转基因玉蜀黍植物中以功能水平表达目的蛋白的组织是叶、花丝或苞叶。
在本发明的一些实施例中,为了进一步描述在任何非花粉组织中表达所需的序列以及影响总体表达水平的那些调控序列,可以在非花粉启动子区域中进行缺失。在每个非花粉基因组克隆的5'侧翼区域进行缺失。在大多数启动子中,500-1000个碱基对(bp)的5'侧翼序列足以实现启动子活性,包括组织特异性活性。5'侧翼区域的缺失可导致约50bp、100bp、250bp、500bp、750bp和1000bp或更大的启动子区域。这些启动子缺失序列有双重用途。这些缺失使每个非花粉基因组克隆的5'侧翼序列内的调控序列得以进一步定位。此外,这些缺失提供了启动子和调控序列的工具箱,启动子和调控序列的表达水平和表达模式各不相同,从而为选择用于适当的基因调控的启动子序列提供了额外的灵活性。
本领域技术人员还清楚,可以使用本领域已知的方法将一个或多个核苷酸的突变、插入、缺失和/或取代引入SEQ ID NO:1-11的核苷酸序列中。此外,改组本发明的序列可以提供新的且不同的核苷酸序列。例如,SEQ ID NO:3-5是SEQ ID NO:1的变体,其与SEQ IDNO:2相比具有一个或多个取代、缺失或添加。
为了测试根据本发明的变体DNA序列(如SEQ ID NO:1-11的缺失片段)的功能,将目的序列可操作地连接到选择性或可见标记基因上并且标记基因的表达用分离的组织(如叶组织或细胞)在瞬时表达试验中测定或通过稳定转化到植物中测定。本领域的技术人员应当知晓能够驱动相关编码序列的表达的DNA序列是以模块的方式建造的。因此,来自较短DNA片段的表达水平与来自最长的片段的表达水平相比可以是不同的,并且彼此之间可以是不同的。例如,下调上游元件的缺失将导致相关编码序列的表达水平的增加,而上调元件的缺失将导致该相关编码序列的表达水平降低。本领域技术人员还应当知晓,发育特异性或组织特异性元件的缺失将导致相关编码序列的表达谱在时间上或空间上发生变化。
在本发明的另一个实施例中,可以使用本领域熟知的杂交或PCR技术将与SEQ IDNO:1-11同源的DNA和基因组DNA序列从其他玉蜀黍种质中分离出来。分离的序列可以与SEQID NO:1-11相同,或者它们可以与SEQ ID NO:1-11基本上相同。从其他玉蜀黍种质中获得的序列不必包含与本文披露的序列功能上相同的相同核苷酸序列。一些核苷酸缺失、添加和取代可能对基因表达没有影响或只有很小的影响。根据本发明,优选的分离的核酸分子包含与SEQ ID NO:1-11中列出的任一核苷酸序列具有至少90%、或至少91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性的核苷酸序列。更优选的分离的核酸分子包含与SEQ ID NO:1-11中列出的任一核苷酸序列具有至少90%同一性的核苷酸序列。甚至更优选的分离的核酸分子包含与SEQ ID NO:1-11中列出的任一核苷酸序列具有至少95%同一性的核苷酸序列。甚至更优选的分离的核酸分子包含与SEQ ID NO:1-11中列出的任一核苷酸序列具有至少99%同一性的核苷酸序列。最优选的分离的核酸分子包含SEQ ID NO:1-11中列出的任一核苷酸序列。
在其他实施例中,cDNA和基因组DNA序列可以从代表非花粉玉蜀黍基因和启动子的同源物的其他植物进行克隆。这些同源物使人们获得额外的非花粉启动子,这些启动子可用于在植物的非花粉组织中进行多个基因的调控。使用玉蜀黍cDNA和基因组序列或其部分进行的杂交用于筛选其他植物基因组中的同源或基本上相同的序列。这些序列可以仅包含SEQ ID NO:1-11的核苷酸子集。优选的同源长度是20个碱基对(bp)的长度,更优选地50bp的长度,最优选地至少100bp的长度。在本发明的一个实施例中,杂交探针由SEQ IDNO:1-11中的任一项或部分制备。此类序列的杂交可以在高严格条件下进行。或者,可以使用低或中等严格的条件以允许序列中的一些错配,以便检测到更低程度的相似性(异源探测)。通常,探针的长度小于约1000个核苷酸,优选地长度小于500个核苷酸。
在本发明的其他实施例中,通过制备包含在SEQ ID NO:1-11中任一项内的序列的引物来分离cDNA和基因组序列。引物可用于来自植物的cDNA或基因组DNA的PCR反应以获得同源序列或与SEQ ID NO:1-11中的任一项具有基本同一性的序列。
表达盒的构建
构建表达盒,该表达盒包含非花粉基因组克隆的5'侧翼序列。在本发明的实施例中,每个表达盒中使用的启动子区域包含5'侧翼区域直至并包括翻译起点。翻译起点由在cDNA和同源基因组序列中发现的开放阅读框(ORF)的第一个ATG表示。因此,启动子区域可以包括5'非翻译前导序列以及转录起始位点、核心启动子和额外的调控元件。在本发明的其他实施例中,构建表达盒,该表达盒包含非花粉基因组克隆的5'侧翼序列直至并包括转录起始位点。转录起始位点可以由获得的最长cDNA克隆的第一个核苷酸定义。此外,转录起始位点可以通过使用本领域熟知的技术进一步定义,这些技术包括RACE PCR、RNA酶保护映射和引物延伸分析。
表达盒可以进一步包含转录终止子,位于启动子下游(3')。多种转录终止子可供用于在表达盒中使用。转录终止子负责终止转基因以外的转录和正确的mRNA转录物的mRNA聚腺苷酸化。适当的转录终止子是已知在植物中发挥作用的那些,并且包括CaMV 35S终止子、tml终止子、胭脂碱合酶终止子以及豌豆rbcS E9终止子。这些终止子可以在单子叶植物和双子叶植物两者中使用。此外,可以使用基因的天然转录终止子。例如,可以使用3'侧翼序列,该3'侧翼序列包含与非花粉cDNA克隆同源的区域的基因组序列的3'。本文示例的此类终止子包括SEQ ID NO:12-20中的任一项。
在本发明的一些实施例中,异源编码序列,例如杀昆虫编码序列、可见标记编码序列或选择性标记编码序列,被克隆到本发明的启动子和转录终止子之间,由此异源编码序列与启动子可操作地连接,并且转录终止子与异源编码序列可操作地连接。可用于本发明的可见标记的实例包括但不限于β-葡萄糖醛酸酶(GUS)、氯霉素乙酰转移酶(CAT)、萤光素酶(LUC)和具有荧光特性的蛋白质,例如来自水母(Aequora victoria)的绿色荧光蛋白(GFP)。原则上,更多的蛋白适用于此目的,前提是该蛋白不会干扰植物的基本功能。可用于本发明的异源编码序列的另外的实例包括但不限于抗生素抗性、病毒抗性、昆虫抗性、疾病抗性或对其他有害生物的抗性、除草剂耐受性、改善的营养价值、工业过程中改善的性能或改变的繁殖能力。在本发明的其他实施例中,编码对以非花粉植物组织为食的昆虫的抗性的基因被克隆到本发明的启动子和本领域已知或本发明的终止子之间。在本发明的另一个实施例中,编码功能性RNA(例如反义RNA、正义抑制的正义RNA或双链RNA)的序列还可以被克隆到启动子和转录终止子之间。
已经发现众多序列增强了来自转录单位之内的基因表达并且这些序列可以与本发明的启动子结合使用以增加它们在转基因植物中的表达。已经示出不同的内含子序列增强了特别是在单子叶植物细胞中的表达。例如,还已知许多源自病毒的未翻译的前导序列增强了表达,并且这些序列在双子叶植物的细胞中是特别有效的。确切地说,已经显示来自烟草花叶病毒(TMV,“W-序列”)、玉蜀黍褪绿斑驳病毒(MCMV)、以及苜蓿花叶病毒(AMV)的前导序列在增强表达方面是有效的(例如,Gallie等人Nucl.Acids Res.[核酸研究]15:8693-8711(1987);Skuzeski等人Plant Molec.Biol.[植物分子生物学]15:65-79(1990))。本发明的非花粉启动子可以包括或经修饰后包括一个或多个增强子元件。在一些实例中,启动子可以包括多个增强子元件。如与不包含增强子元件的启动子相比,包含增强子元件的启动子在非花粉组织中提供了更高水平的转录。适用于植物的增强子元件包括PClSV增强子元件(美国专利号5,850,019)、CaMV 35S增强子元件(美国专利号5,106,739和5,164,316)和FMV增强子元件(Maiti等人(1997)Transgenic Res.[转基因研究]6:143-156);描述于申请WO 87/07644中描述的烟草花叶病毒(TMV)的翻译激活剂,或例如Carrington和Freed,1990,J.Virol.[病毒学杂志]64:1590-1597描述的烟草蚀刻病毒(TEV)的翻译激活剂,或内含子如玉蜀黍的adh1内含子或水稻肌动蛋白的内含子1。还参见PCT WO 96/23898、WO2012/021794、WO 2012/021797、WO 2011/084370和WO 2011/028914。
植物转化
用于转化植物的程序在本领域中是已知的并且普遍描述于文献中。用于植物转化的方法的非限制性实例包括通过以下项的转化:细菌介导的核酸递送(例如,经由农杆菌)、病毒介导的核酸递送、碳化硅或核酸须晶介导的核酸递送、脂质体介导的核酸递送、微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米粒子介导的转化、超声处理、渗入、PEG介导的核酸吸收、以及使得核酸引入到植物细胞中的任何其他电学的、化学的、物理的(机械的)或生物的机制,包括其任何组合。对于本领域已知的不同植物转化方法的一般指导包括以下文献:Miki等人(“Procedures for Introducing Foreign DNA intoPlants”in Methods in Plant Molecular Biology and Biotechnology[植物分子生物学与生物技术方法中的“用于将外来DNA引入植物中的程序”],Glick,B.R.和Thompson,J.E.编辑,CRC出版公司(CRC Press,Inc.),波卡拉顿(Boca Raton),1993,第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.[细胞与分子生物学快报]7:849-858(2002))。
对于农杆菌介导的转化,二元载体或携带至少一个T-DNA边界序列的载体是适合的,而对于直接基因转移(例如,微粒轰击等),任何载体都是适合的,并且可以使用仅含有目的构建体的线性DNA。在直接基因转移的情况下,可以使用以单个DNA种类的转化或共转化(Schocher等人,Biotechnology[生物技术]4:1093-1096(1986))。对于直接基因转移以及农杆菌介导的转移两者,转化通常(但不是必需的)用如下选择性标记进行,该选择性标记可以是正向选择(磷甘露糖异构酶;PMI),提供对抗生素(卡那霉素、潮霉素或甲氨蝶呤)或除草剂(草甘膦或草铵膦)的抗性。然而,选择性标记的选择对于本发明并不是至关重要的。
农杆菌介导的转化是用于转化植物的常用方法,因为它的高转化效率以及因为它与许多不同物种的广泛实用性。农杆菌介导的转化典型地涉及将携带外来目的DNA的二元运载体转移至适当的农杆菌菌株,这可能取决于由宿主农杆菌菌株在共同存在的Ti质粒上或在染色体上携带的vir基因的互补物(Uknes等人(1993)Plant Cell[植物细胞]5:159-169)。将该重组二元运载体转移至农杆菌可以使用携带该重组二元运载体的大肠杆菌、辅助大肠杆菌菌株(该辅助菌株携带能够将该重组二元运载体移动到靶标农杆菌菌株中的质粒)通过三亲本交配程序实现。可替代地,可以通过核酸转化将该重组二元运载体转移至农杆菌中(和Willmitzer,(1988)Nucleic Acids Res.[核酸研究]16:9877)。
可以使用农杆菌转化双子叶植物以及单子叶植物。用于农杆菌介导的水稻转化方法包括已熟知的水稻转化方法,如任何以下文献中描述的那些:欧洲专利申请EP 1198985A1、Aldemita和Hodges(Planta[植物]199:612-617,1996);Chan等人(Plant Mol Biol[植物分子生物学]22(3):491-506,1993)、Hiei等人(Plant J[植物杂志]6(2):271-282,1994),其披露内容通过引用并入本文,其引用程度如同完全阐明一样。在玉米转化的情况下,优选方法是如Ishida等人(Nat.Biotechnol[自然生物技术]14(6):745-50,1996)或Frame等人(Plant Physiol[植物生理学]129(1):13-22,2002)中所描述的,其披露内容通过引用并入本文,其引用程度如同完全阐明一样。所述方法通过以下文献中的实例来进一步描述:B.Jenes等人,Techniques for Gene Transfer[基因转移技术],于:TransgenicPlants[转基因植物],第1卷,Engineering and Utilization[工程与利用],编著S.D.Kung和R.Wu,Academic Press[美国学术出版社](1993)128-143以及Potrykus Annu.Rev.PlantPhysiol.Plant Molec.Biol.[植物生理学与植物分子生物学年度综述]42(1991)205-225。有待表达的核酸或构建体优选地克隆至适合于转化根癌农杆菌(Agrobacteriumtumefaciens)的载体例如pBin19中(Bevan等人,Nucl.Acids Res.[核酸研究]12(1984)8711)。然后,能够以已知的方式使用由这种载体转化的农杆菌来转化植物,如用作模型的植物像拟南芥或作物植物如烟草植物,方法是例如通过将捣碎的叶或切碎的叶浸没于农杆菌溶液中,并且然后将其在适合的培养基中培养。通过根癌农杆菌转化植物例如Hagen和Willmitzer在Nucl.Acid Res.[核酸研究](1988)16,9877中描述或尤其从F.F.White,Vectors for Gene Transfer in Higher Plants[在高等植物中基因转移的载体];Transgenic Plants[转基因植物],第1卷,Engineering and Utilization[工程与利用],编著S.D.Kung和R.Wu,Academic Press[美国学术出版社],1993,第15-38页中已知。
通过重组农杆菌进行的植物转化通常涉及该农杆菌与来自该植物的外植体的共培养,并且遵循本领域熟知的方法。在携带位于这些二元质粒T-DNA边界之间的抗生素或除草剂抗性标记的选择培养基上对转化的组织进行再生。
如先前所讨论的,另一种用于转化植物、植物部分和植物细胞的方法涉及在植物组织和细胞上推进惰性或生物活性的粒子。参见例如,美国专利号4,945,050;5,036,006和5,100,792。通常,这种方法涉及在有效于穿透该细胞的外表面并提供掺入在其内部中的条件下在植物细胞处推进惰性或生物活性的粒子。当使用惰性粒子时,可以通过用含有目的核酸的载体包被这些粒子而将该载体引入该细胞中。可替代地,一个或多个细胞可以被该载体围绕以使得该载体通过该粒子的激发而被带入该细胞中。也可以将生物活性的粒子(例如,干酵母细胞、干细菌或噬菌体,各自含有一种或多种被试图引入的核酸)推进到植物组织中。
在其他实施例中,本发明的多核苷酸可以被直接转化进质体基因组中。质体转化的主要优点在于质体通常能够表达细菌基因而无需实质性的修饰,而且质体能够在单个启动子的控制下表达多个开放阅读框。在以下文献中广泛描述了质体转化技术:美国专利号5,451,513、5,545,817和5,545,818;PCT申请号WO 95/16783;以及McBride等人(1994)Proc.Nati.Acad.Sci.USA[美国国家科学院院刊]91,7301-7305。基本的叶绿体转化技术涉及例如使用生物射弹(biolistic)或原生质体转化(例如,氯化钙或PEG介导的转化),将位于选择性标记侧翼的经克隆的质体DNA区连同目的基因一起引入合适的靶组织中。这些1至1.5kb的侧翼区(被命名为靶向序列)促进了与质体基因组的同源重组,并且因而允许置换或修饰原质体(plastome)的特定区域。最初,可以将叶绿体16S rRNA和rps12基因(赋予针对大观霉素或链霉素的抗性)的点突变用作供转化用的选择性标记(Svab,Z.、Hajdukiewicz,P.和Maliga,P.(1990)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]87,8526-8530;Staub,J.M.和Maliga,P.(1992)Plant Cell[植物细胞]4,39-45)。在这些标记之间克隆位点的存在允许建立质体靶向载体用于外来基因的引入(Staub,J.M.和Maliga,P.,(1993)EMBO J.[欧洲分子生物学杂志]12,601-606)。转化效率的实质性增加可以通过用显性的选择性标记(对大观霉素解毒酶氨基糖苷-3'-腺苷转移酶进行编码的细菌aadA基因)置换隐性的rRNA或r蛋白抗生素抗性基因而获得(Svab,Z.和Maliga,P.,(1993)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90,913-917)。先前,这种标记已经被成功地用于莱茵衣藻(Chlamydomonas reinhardtii)这种绿藻的质体基因组的高频率转化(Goldschmidt-Clermont,M.(1991)Nucl.Acids Res.[核酸研究]19:4083-4089)。有用于质体转化的其他选择性标记在本领域是已知的,并且被包括在本发明的范围之内。典型地,转化之后需要大约15-20个细胞分裂循环以便达到同质状态。质体表达(其中基因通过同源重组被插入到在每个植物细胞中存在的所有数千个环状质体基因组的拷贝中)利用了超过核表达的基因的庞大的拷贝数目的优点,以便允许能够很容易超过总的可溶性植物蛋白的10%的表达水平。在一个实施例中,可以将本发明的多核苷酸插入质体靶向运载体中并转化进所希望的植物宿主的质体基因组中。因此,可以获得与含有本发明的核苷酸序列的质体基因组同型的植物,这些植物能够高表达该多核苷酸。
选择转化的转基因植物、植物细胞或植物组织培养物的方法在本领域中是常规的,并且可以用于本文提供的本发明的方法中。例如,本发明的重组载体还可以包括包含用于选择性标记的核苷酸序列的表达盒,该选择性标记可以用于选择转化的植物、植物部分或植物细胞。如本文所使用的,“选择性标记”意指如下核苷酸序列,当该核苷酸序列表达时向表达该标记的植物、植物部分或植物细胞赋予不同的表型,并且因此允许此类转化的植物、植物部分或植物细胞与不具有该标记的那些区别开来。这样的核苷酸序列可以编码选择性或筛选性标记,这取决于该标记是否赋予可以通过化学手段而被选择的性状,如通过使用选择剂(例如,抗生素、除草剂等),或者取决于该标记是否仅是人们可以通过观察或测试而鉴别的性状,如通过筛选(例如,R基因座性状)。当然,适合的选择性标记的许多实例在本领域是已知的并且可以用于本文描述的表达盒中。
选择性标记的实例包括但不限于:编码neo或nptII的核苷酸序列,其赋予针对卡那霉素、G418等的抗性(Potrykus等人(1985)Mol.Gen.Genet.[分子遗传学和基因组学]199:183-188);编码bar的核苷酸序列,其赋予针对草胺膦的抗性;编码改变的5-烯醇丙酮酰莽草酸-3-磷酸(EPSP)合酶的核苷酸序列,其赋予针对草甘膦的抗性(Hinchee等人(1988)Biotech.[生物技术]6:915-922);编码腈水解酶(如来自臭鼻克雷白氏杆菌(Klebsiella ozaenae)的bxn)的核苷酸序列,其赋予对溴苯腈的抗性(Stalker等人(1988)Science[科学]242:419-423);编码改变的乙酰乳酸合酶(ALS)的核苷酸序列,其赋予针对咪唑啉酮、磺酰脲或其他ALS抑制化学药剂的抗性(欧洲专利申请号154204);编码抗甲氨蝶呤二氢叶酸还原酶(DHFR)的核苷酸序列(Thillet等人(1988)J.Biol.Chem.[生物化学杂志]263:12500-12508);编码茅草枯脱卤酶的核苷酸序列,其赋予针对茅草枯的抗性;编码甘露糖-6-磷酸异构酶(也称为磷酸甘露糖异构酶(PMI))的核苷酸序列,其赋予代谢甘露糖的能力(美国专利号5,767,378和5,994,629);编码改变的邻氨基苯甲酸合酶的核苷酸序列,其赋予针对5-甲基色氨酸的抗性;或编码hph的核苷酸序列,其赋予针对潮霉素的抗性。本领域技术人员能够选择用于在本发明的表达盒中使用的适合的选择性标记。
额外的选择性标记包括但不限于编码β-葡萄糖醛酸酶的核苷酸序列或编码多种显色底物已知的酶的uidA(GUS);编码调节植物组织中花色苷色素(红色)产生的产物的R-基因座核苷酸序列(Dellaporta等人,“Molecular cloning of the maize R-nj alleleby transposon-tagging with Ac[通过Ac转座子标签技术对玉蜀黍R-nj等位基因的分子克隆]”263-282于:Chromosome Structure and Function:Impact of New Concepts[染色体结构和功能:新概念的影响],18th Stadler Genetics Symposium[第十八届斯塔德勒遗传学研讨会](Gustafson和Appels编,Plenum Press[Plenum出版社]1988));编码β-内酰胺酶的核苷酸序列,β-内酰胺酶是多种显色底物已知的酶(例如PADAC,一种显色头孢菌素)(Sutcliffe(1978)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:3737-3741);编码xylE的核苷酸序列,xylE编码儿茶酚双加氧酶(Zukowsky等人(1983)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]80:1101-1105);编码酪氨酸酶的核苷酸序列,所述酪氨酸酶是能够将酪氨酸氧化成DOPA和多巴醌的酶,DOPA和多巴醌又缩合形成黑色素(Katz等人(1983)J.Gen.Microbiol.[普通微生物学杂志]129:2703-2714);编码β-半乳糖苷酶的核苷酸序列,β-半乳糖苷酶是存在显色底物的酶;编码荧光素酶(lux)的核苷酸序列,荧光素酶可用于生物发光检测(Ow等人(1986)Science[科学]234:856-859);编码水母发光蛋白的核苷酸序列,水母发光蛋白可用于钙敏感生物发光检测(Prasher等人(1985)Biochem.Biophys.Res.Comm.[生化和生物物理研究通讯]126:1259-1268);或编码绿色荧光蛋白的核苷酸序列(Niedz等人(1995)Plant Cell Reports[植物细胞报道]14:403-406)。本领域技术人员能够选择用于在本发明的表达盒中使用的适合的选择性标记。
此外,如本领域中已知的,完整的转基因植物可以使用多种已知技术中的任何技术从转化的植物细胞、植物组织培养物或培养的原生质体再生而来。在以下文献中描述了从植物细胞、植物组织培养物或培养的原生质体进行的植物再生:例如,Evans等人(Handbook of Plant Cell Cultures[植物细胞培养物手册],第1卷,MacMilanPublishing Co.[麦克米兰出版公司],纽约(1983));以及Vasil I.R.(编辑)(CellCulture and Somatic Cell Genetics of Plants[植物的细胞培养和体细胞遗传学],Acad.Press[美国学术出版社],奥兰多市,第I卷(1984)和第II卷(1986))。
另外,工程化入以上所述的本发明的转基因植物、植物部分、植物细胞或种子中的遗传特性可以通过有性生殖或营养生长来传递,并且因此可以在子代植物中维持并传代。通常,维持和传代利用了被开发以适合特定目的(如收获、播种或耕作)的已知农业方法。
因此,可以按本领域已知的任意多种方法(如上所述的)将多核苷酸引入该植物、植物部分或植物细胞中。因此,没有依赖用于将一种或多种多核苷酸引入植物中的特定方法,相反可以使用允许将该一种或多种多核苷酸在植物细胞中瞬时表达或稳定地整合到该植物的基因组中的任何方法。在有待引入一种以上多核苷酸的情况下,这些对应的多核苷酸可以作为单一核酸分子的一部分、或者作为分开的核酸分子而进行组装,并且可以位于相同的或不同的核酸分子上。因此,可以在单个转化事件中、在分开的转化事件中、或者例如作为育种方案的一部分在植物中,将这些多核苷酸引入目的细胞中。
本发明的额外的实施例包括从本发明的转基因植物或其部分产生的收获产物以及从该收获产物产生的加工产物。收获产物可以是如在此描述的全株或任何植物部分。因此,在一些实施例中,收获产物的非限制性实例包括种子、果实、花或其部分(例如,花药、柱头等)、叶、茎等。在其他实施例中,加工产物包括但不限于从收获的本发明的种子或其他植物部分产生的细粉、粗粉、油、淀粉、谷物等,其中该种子或其他植物部分包含本发明的核酸分子/多核苷酸/核苷酸序列。
在其他实施例中,本发明提供了来自本发明的转基因种子或转基因植物的提取物,其中该提取物包含本发明的核酸分子、多核苷酸、核苷酸序列或杀昆虫蛋白。可以根据本领域熟知的程序制备来自植物或植物部分的提取物(参见,de la Torre等人,Food,Agric.Environ.[食品、农业与环境]2(1):84-89(2004);Guidet,Nucleic Acids Res.[核酸研究]22(9):1772-1773(1994);Lipton等人,Food Agric.Immun.[食品与农业免疫学]12:153-164(2000))。
启动子活性评估
有几种方法可用于评估启动子的活性。如上所述,用可见标记构建表达盒。可以使用瞬时转化方法来评估启动子活性。使用如微粒轰击、农杆菌转化或原生质体转化等转化方法,将表达盒递送至植物细胞或组织。在转化后随时间(例如使用本领域已知的方法递送DNA后2小时、5小时、8小时、16小时、24小时、36小时、48小时和72小时)监测报告基因活性,例如β-葡萄糖醛酸酶活性、萤光素酶活性或GFP荧光性。报告基因活性可以通过以下方式来监测:通过酶活性、通过由报告基因编码的酶的底物对细胞或组织进行染色、或通过在适当的光波长下直接观察。杀昆虫蛋白(例如本发明的Cry1Ab或Vip3)可以作为可见标记,由此测试转化的植物细胞的杀昆虫活性。可以测定全长启动子序列、启动子序列的缺失和突变并比较其表达水平。此外,可以使用本领域熟知的方法测量RNA水平,这些方法例如RNA印迹法、竞争性逆转录酶PCR和RNA酶保护测定。这些测定通过测量标准转录报告mRNA的“稳态”浓度来测量启动子的表达水平。这种测量是间接的,因为报告mRNA的浓度不仅取决于其合成速率,还取决于mRNA降解的速率。因此,稳态水平是合成速率和降解速率的乘积。然而,当转录序列相同时,可以认为降解速率以固定速率进行,因此该值可以作为合成速率的量度。
如上所述,通过将包含可见标记或目的基因的表达盒中的启动子稳定转化到植物中来进一步确定启动子活性。使用上述各种方法(如以上所述的酶活性测定、RNA分析和蛋白质测定),在发育过程中监测启动子活性,另外通过监测初级转化体中不同组织中的表达以及通过转基因植物的后代进行监测。
实例
通过参考以下具体的实例可以进一步描述本发明。这些实例仅仅是作为说明性的目的而提供的,并且不旨在进行限制,除非另外说明。本文使用的标准重组DNA和分子克隆技术在本领域中是熟知的并且在以下文献中有描述:Ausubel(编辑),Current Protocolsin Molecular Biology[现代分子生物学实验指南],John Wiley and Sons,Inc.[约翰·威利父子公司](1994);J.Sambrook等人,Molecular Cloning:ALaboratory Manual[分子克隆:实验室手册],第3版,Cold Spring Harbor,NY:Cold Spring Harbor LaboratoryPress[冷泉港,纽约:冷泉港实验室出版社](2001);以及T.J.Silhavy,M.L.Berman和L.W.Enquist,Experiments with Gene Fusions[基因融合实验],Cold Spring HarborLaboratory,Cold Spring Harbor,NY[冷泉港实验室出版社],冷泉港,纽约(1984)。
实例1.玉蜀黍调控元件的鉴定。
在先正达(Syngenta)专有的(Zm80K)Affymetrix芯片上对来自玉蜀黍基因的调控元件进行鉴定,这些调控元件在多种组织类型中高表达但在花粉中不表达,即花粉表达极低或未检测到。来自8种不同玉蜀黍基因的调控元件被用于制备构建体,以驱动转基因玉米组织和植物中昆虫控制基因的表达。表1中示出了所使用的调控元件的描述。
表1.用于制备表达构建体的调控元件的描述。
还从克隆上述鉴定的启动子的相同基因中鉴定了终止子元件。终止子的描述见表2。
表2.本发明终止子元件的描述。
实例2:非花粉表达载体的构建
为了测试转基因玉蜀黍植物中的上述调控元件(启动子和终止子),制备了8个二元载体。每个二元载体含有两个表达盒。
第一表达盒包含eFMV/e35S转录增强子,该转录增强子与待测试的本发明的启动子可操作地连接,该启动子与编码Cry1Ab杀昆虫蛋白的异源编码序列(cry1Ab)(美国专利号5,625,136)可操作地连接,该异源编码序列与启动子的匹配终止子序列可操作地连接。例如,为测试prZm061393-01启动子(SEQ ID NO:2)而制备的表达盒包含tZm061393-01终止子(SEQ ID NO:13)。
第二表达盒,其对于每个二元载体都是相同的,它包含玉蜀黍泛素启动子(prUbi1-10)(Christensen等人,1992PMB 18:675),该玉蜀黍泛素启动子与磷酸甘露糖异构酶(PMI;美国专利号5,767,378)编码序列可操作地连接,该磷酸甘露糖异构酶编码序列与Ubi1终止子(tUbi1-01)可操作地连接。PMI的表达允许在甘露糖上正向选择转基因植物。
将两个表达盒克隆至适合于农杆菌介导的玉蜀黍转化的载体中。表3列出并描述了构建的二元载体。
表3.构建用于测试玉蜀黍中非花粉启动子的二元载体。
实例3:由非花粉启动子指导的玉蜀黍中Cry1Ab的瞬时表达
使用冻融法(An等人,Binary vector[二元载体].于:Gelvin S B,Schilproot RA(编辑),Plant molecular biology manual.[植物分子生物学手册]Kluwar AcademicPublishers[克鲁维尔学术出版社],多德雷赫特(Dordrecht),第A3 1-19页(1988))将上述载体转移到含有辅助质粒(pSBI)的根癌农杆菌(Agrobacterium tumefactions)菌株LBA4404中。如Azhakanandam等人,Plant Mol.Biol.[植物分子植物学]63:393-404(2007)所述进行农杆菌培养物的制备。简言之,使基因修饰的农杆菌在50mL含有100μM乙酰丁香酮和10μM MES(pH 5.6)的YP培养基中生长过夜,然后通过在4000x g下离心10min进行沉淀。将沉淀物重悬于感染培养基(Murashige和Skoog盐连同维生素、2%蔗糖、500μM MES(pH5.6)、10μM MgSO4和100μM乙酰丁香酮)中至OD600=0.5,然后在28℃下保持2-3小时。
基本上如美国专利号8,642,839中所述进行玉蜀黍幼苗的植物原位瞬时表达测定,该文献通过引用以其全文并入本文。简言之,使玉蜀黍种子在温室条件下在装有Fafard发芽混合物的2.5英寸盆中发芽。使幼苗保持在14/10日/夜循环下,日光强度为2000μ-mol-m-2s-1,并保持补充照明。温度保持在23℃-26℃之间。主要使用V2阶段的初级和次级叶进行农杆菌浸润实验(Ritchie S.W.,Hanway J.J.Benson G.O.(编辑):How a Corn PlantDevelops:Iowa State Univ Special Report No.48[玉米植株如何发育:爱荷华州立大学特别报告第48号],2005年7月)。为了使浸润更容易,在农杆菌浸润前1-2小时给这些幼苗膨胀浇水,这样保持叶膨胀和气孔打开。使用5mL注射器体(带有Luer-Lok.TM.尖端的BD 5ml注射器,BD.TM.公司,富兰克林湖(Franklin Lakes),新泽西州07427,美国),通过将注射器的尖端按压在叶的背轴面,在玉蜀黍幼苗上进行单片叶的浸润。用1ml农杆菌悬浮液/28秒/叶对V2阶段的第一和第二可见叶进行浸润。将浸润的植物转移并且维持在设定于25℃的生长箱条件下,伴以16/8日/夜循环,其中光强度为1900μ-mol-m-2s-1。浸润后4天收获植物组织,用于随后使用ELISA分析Cry1Ab蛋白和PMI蛋白检测。结果表明在所有8个载体组中均检测到两种蛋白质,这表明本发明的启动子能够驱动转基因在玉蜀黍细胞中的表达。
实例4:使用非花粉启动子在稳定转化的玉米中表达Cry1Ab
基本上如在Negrotto等人,2000,Plant Cell Reports[植物细胞通讯]19:798-803中所描述地进行未成熟玉蜀黍胚的农杆菌转化,将该文献通过引用以其全文并入本文。然而,本领域内已知的多种培养基组分可以被替代。简言之,使包含以上所述的植物转化载体的农杆菌菌株LBA4404(pSB1)在约28℃在YEP(酵母提取物(5g/L)、蛋白胨(10g/L)、NaCl(5g/L)、15g/l琼脂,pH 6.8)固体培养基上生长约2-4天。将大约0.8X109个农杆菌悬浮于补充有100μM As的LS-inf培养基中(Negrotto等人,同上)。在此培养基中对细菌预诱导约30-60分钟。
将来自适合的基因型的未成熟胚从约8-12天大的穗中切除到液体LS-inf+100μMAs中。将胚用新鲜的感染培养基冲洗一次。然后添加农杆菌溶液,并且将这些胚涡旋约30秒并使其与细菌一起沉降约5分钟。然后将这些胚盾片向上地转移到LSA培养基中,并且在黑暗中培养两至三天。随后,将每皮氏板(petri plate)20与25个之间的胚转移到补充有头孢噻肟(250mg/l)和硝酸银(1.6mg/l)的LSDc培养基中,并且在28℃在黑暗中培养10天。
将产生胚性愈伤组织的未成熟的胚转移到LSD1M0.5S培养基中。在此培养基上选择培养物约6周,在约3周时进行继代培养步骤。将存活着的愈伤组织转移到补充有甘露糖的Reg1培养基中。在光照中培养(16小时光照/8小时黑暗方案)之后,然后将绿色组织转移到不具有生长调节剂的Reg2培养基中,并且孵育约1-2周。将小植株转移到含有Reg3培养基的Magenta GA-7盒(伊利诺斯州芝加哥的马真塔公司(Magenta Corp,Chicago Ill.))中,并且使它们在光照中生长。约2-3周后,测定植物是否存在pmi基因和cry1Ab-09编码序列。将来自PCR测定的阳性植物转移到温室并测试Cry1Ab-09蛋白在叶和花粉中的表达水平,以及测试其抗欧洲玉米螟(玉米螟(Ostrinia nubilalis))的活性。
在转基因玉蜀黍植物的营养(V)和生殖(R)生长阶段测定Cry1Ab蛋白的浓度。“V”阶段在数字上被指定为V1、V2、V3等,由通过VT阶段的叶的数量表示,在VT阶段可以看到雄穗的最后一个分支。“R”阶段分别被指定为从抽丝到穗生理成熟的R1到R6。对于使用本领域已知的ELISA方案测试的每个启动子,通过ELISA在来自8-12个事件的V3-V4和VT阶段的叶以及花丝、苞叶和花粉中定量Cry1Ab。简言之,将叶组织冻干,然后通过使用咖啡研磨器、搅拌器、GrindomixTM研磨器(布林克曼仪器(Brinkmann Instruments);韦斯特伯里(Westbury),美国纽约)、带有研棒的研钵或碾磨机、或这些装置的组合进行处理将其磨成细粉末。所有处理都是在干冰或液氮的存在下进行的。将样品充分混合以确保均匀。确定每个样品的干重百分比并且将处理过的样品存储在约-80℃下直至冻干。
对于每个被分析的样品,将1.0g等分试样的粉末化的植物材料(非花粉)称重加入15ml的聚丙烯管中,悬浮在3ml的提取缓冲液[50mM CAPS、0.1M NaCl、2mM EDTA、1mM二硫苏糖醇、1mM4-(1-氨乙基)苯磺酰氟盐酸盐、1mM亮抑酶肽,pH 10]中,并且使用均质器(Tomtek;美国康涅狄格州哈姆登)进行提取。在4℃下于10,000x g下离心15min之后,使用上清液通过ELISA进行Cry1Ab和PMI分析。在用碘乙酰胺进行处理(如Hill和Straka(1988)所描述的)之后,使用BCATM蛋白测定试剂(Pierce公司;罗克福德(Rockford),伊利诺伊州,美国)对提取物中的总蛋白进行定量。
通过将花粉1:30(w/v)悬浮在提取缓冲液中来制备玉蜀黍花粉提取物。在冰上约30min之后,通过在约15,000psi下3次通过弗氏细胞压碎器(French Pressure Cell)来破裂花粉悬浮液,随后在4℃下于14,000x g下离心约5min。如下所述通过ELISA在上清液上进行Cry1Ab和PMI分析。如上所述对总蛋白进行定量。
如上所述制备的提取物通过ELISA(Tijssen,1985)定量分析Cry1Ab和PMI。使用免疫亲和纯化的单克隆抗Cry1Ab抗体和免疫亲和纯化的多克隆抗Cry1Ab抗体对Cry1Ab进行定量。使用对PMI具有特异性的蛋白A纯化的多克隆兔和免疫亲和纯化的多克隆山羊抗体对PMI进行定量。基于位于该标准曲线的线性部分上的纯参考蛋白的最低浓度、在无背景干扰下可以被分析的对照提取物的最大体积、以及等分试样代表的样品的相应重量估计Cry1Ab和PMI的双夹心ELISA的定量下限。
Cry1Ab ELISA的结果示于表4中。Cry1Ab ELISA测试的检测水平(LOD)确定为约0.37ng/mg总可溶性蛋白(TSP)。对于每个测试的启动子,在来自所有事件的V3-V4叶、花丝、苞叶和VT叶中检测到可量化水平的Cry1Ab蛋白,其显著高于花粉中的水平。对于每个启动子,花粉中Cry1Ab的浓度仅略高于ELISA的LOD。所测试的8个启动子中有5个在非花粉组织中表达Cry1Ab,其表达水平比LOD高1000倍以上。8个启动子中有3个表达Cry1Ab,其表达水平比LOD高约500至约950倍。相比之下,所测试的8个启动子中有7个在花粉中表达的Cry1Ab,其表达水平比LOD高10倍以下,而一个启动子prZmU45855在花粉中表达Cry1Ab,其浓度比LOD高15倍。然而,来自包含001747-01、061393-01、AF032370-02、009722-01、015335-01或058948-02启动子的每个载体组的每个事件中的一些植物在花粉中没有可检测水平的Cry1Ab。Cry1Ab在所有测试的非花粉组织中均以杀昆虫水平表达,而对于所有测试的启动子,在花粉中的Cry1Ab水平均低于杀昆虫活性所需的浓度。
表4.在转基因玉蜀黍植物组织中的Cry1Ab表达。
实例5.在稳定转化的玉蜀黍中的Cry1Ai表达
如上所述使用表达盒转化玉蜀黍植物,该表达盒包含eFMV/e35S转录增强子,该转录增强子与本发明的PMP393-4启动子(SEQ ID NO:5)可操作地连接,该PMP393-4启动子与编码全长Cry1Ai杀昆虫蛋白的异源编码序列可操作地连接(美国申请公开号20190177377),该异源编码序列与本发明的t393-2终止子(SEQ ID NO:14)可操作地连接。如上所述测定来自40个事件的V3-V4叶组织和花粉。Cry1Ai ELISA测试的检测水平(LOD)确定为约0.75ng/mg总可溶性蛋白(TSP)。对来自40个转基因玉蜀黍事件的组织的ELISA结果表明,V3-V4叶中Cry1Ai蛋白的水平范围为约10ng/mg TSP至约80ng/mg TSP,而在花粉中未检测到Cri1Ai蛋白,这表明在全部40个事件中花粉中的表达水平低于ELISA的LOD,即<0.75ng/mg TSP。
在本说明书中提到的所有公开物以及专利申请对于本发明相关领域的普通技术人员的技术水平是指示性的。所有公开物和专利申请均通过引用并入本文,其程度如同每个单独的公开物或专利申请被明确地并单独地指示通过引用而并入。
虽然为了清楚理解的目的已经通过说明和举例的方式在一定详细程度上描述了以上发明,但是对于本领域技术人员而言显而易见的是在本发明的范围内可以进行某些改变和修饰。
序列表
<110> Syngenta Crop Protection AG
Clarke, Joseph
Azhakanandam, Kasi
Zhou, Ailing
Conville, Jard
<120> 调控植物中基因表达的启动子
<130> 81937-US-L-ORG-NAT-1
<160> 29
<170> PatentIn version 3.5
<210> 1
<211> 2738
<212> DNA
<213> 玉米
<400> 1
gagatatgtg atgtatatgt gatatatgtg atgattatgt gatatatttt ttgtttgttt 60
ggatggaata ataaaaacaa ataaaaaggg tatgttggcc acttttggcg agtgtaacac 120
tcagcaaaga ggtactttgc cgagtgtcac agtcatatca ttcggcaaag aaggcacaca 180
tgggaaccga taaagcttct ttgccgagtg ttgtggcctt agcactcggc aaagaagcaa 240
cttttgccga gagcctccta gtgtactcgg caaaggaact gacaaaggag cccactgatg 300
attcctttga tgagtggtag tccggcagac acacggcaaa gataaagtct ttgccgagtg 360
ccacctaata cgcccggcaa aggaactggc aaaggacaca cgatgagttt atttgtcgag 420
tgctagtaca atagacactc gacaaagagt gagcctttgc agagtgtcac cgtggcactc 480
ggcaaagtcc actctttgtc gagtgtcacc gtgacactca gcgaagtctc cgtcgctgtc 540
atctgtcgcc gtgacgtcga cttttttttg ccgagtaccg agtggttgcc gagtgtccga 600
caaaaaatac tcggttaaag accgttgccg atgtcagttc accaagacct tttttatcaa 660
gtgtcatact tgataaagtc ttccccaagt attttcaaaa ctttgtcgat tacctcacac 720
accaaggggt aggatcgtgt tgaggcggtt tgctgcttgt ttcttgcttt cgccgaacca 780
acggaccatg agcgcataaa ccaatgggcg agcggccgca tatacaggcc tgcgcggcga 840
gcctcacctt gctggatttg aatgccccct cggcatggtc aatgaccatg catctttgtg 900
cagaacatat aaaatgcaca aattaattaa ttaataaaaa tacatgaaag agtacataat 960
ttgtttgtgg attattaatt atatttataa atatattata gtatattata ttttatcttt 1020
atctaactac aaaaataatt atagattgtt aacttttttt tgcattactg gtaagatttt 1080
gtcgatttta taattttgtc taacatgttt tattatcaat ctaaaattgc aaattatatg 1140
ttaacgaact aaatttgtaa taaaatatat gtaataaagg tcgtctaaaa gtaagctaaa 1200
attcacgcac ctaaatttta tttagtaaag tgttttttct tgacatatga cactagtgtt 1260
ttcaaagctt gtctcttaat ttaggattaa attaataggc ctctctaaat tgctttttat 1320
aagataaata aatcctattc cgtctgctca tcttcaaaga acatttcaat gaaacaaata 1380
tttgggaaaa ccaatggaaa aagaataaaa ataaaaattg aaaaagagaa gtggaggaaa 1440
agtagggttc cattccacgg cctgtcgagt gtcgacccac aaaccacgca accgatatat 1500
tccccagcac ccccagtctc cagccgtcca accgagacac cgcgtgcgaa ccaagcagac 1560
cacaacaaga agaagcgtag tcgtcgccgg aaggaaaggc gcggagcaag atctcgtggc 1620
aggcgtacgt cgacgagcac ctgaagtgcg agatcgaagg acagcatctc agcgccgccg 1680
ccatcgtcgg tcacgacggc agcgtttggg cgcagtccga gagcttcccc gaggtcattc 1740
actcccacct tatctcttcc cgctctactt gcttagttgc tttatccatg ttcagtgctc 1800
ctgcgctgat ttagacccgc gcgactctgg atctgcccca gccgtgcggc ccggccggat 1860
cggagcgagg ggatgtccgg atctcggtcg ctgaggcgag atgcggatct aaggcccctt 1920
ccctcggtga cgtggttgct gctgctgctg ttctccgggc gtttgatgcc aatatagctg 1980
agatcaagct tgatgatctg cgtactgtgg atttgctagt gagggatggc cggatcgggc 2040
tgttggcgtc cgacctgatt tggttgttcg cttgaataga cttacttacc agtggacagt 2100
ggtagtgatc gttcagcagc agtagagcaa tttgttttac atgtaaaatt tgagtggctg 2160
ctagagatgc accaatggcc gagctgcatg tgtttattcc tatatagcga cagttgtgtg 2220
attgatccaa aacgcaaaat tttagttttc atcaaatgat gatttcctga tgccactacc 2280
tgtgtgtgag gcacttatta aatgaaaagt aactttcggt tgggatctgg gaatctgtat 2340
tgtgttccgt ggttggtcac agcttgtggc ctgcattgtt ccataggcca aatggctagg 2400
caaggaaaat aaatcatgta atttggaaaa aaataactgc catagtcagt agtgtacagc 2460
agtacatgct tgtccgggcc ttttatttca ccatcgtgtt gtggtatatg gagtacttgg 2520
attgtgcgat gctttataca tttgtttgtt ctagcagagt ttgagtttat atttctattc 2580
ttatgtaggg cgtcacgagt gtcgtcaatt gttacatcct tacatccttg tgttcacaat 2640
atgatccatc aactctttct tctgcggtct cttatccctg tgttctcatg tccatgtttc 2700
ctgcttcttg ttgcagttaa agccttagga ggtaaacc 2738
<210> 2
<211> 2627
<212> DNA
<213> 人工序列
<220>
<223> 来自Zm061393基因具有T到A突变以去除起始密码子的5' 调控序列。
<400> 2
tctgcctttc tgttcttcaa acgatgtctc atgtctgcgc tggacaactt tcttgttgcc 60
gcctgtcgct tgcgctgtgc tgactggacg cagctccgga ggtttggttg tgcttggttt 120
tcgtagagaa ctcgccactt gccgcccgca cgttcttggt gtttcctcct ccccgctgtg 180
ttctgcgcac gggctttttc tgagagaccc atgtttccct tttactttta taaacagtat 240
acatgctatg tttctagaag gaggggaaac ctaatccccc taatccaatg gcggggagga 300
aatagggtgg ggtggggtgg ggggagggaa atatctcgct actttttaat ccggacaagc 360
tcatttgcgt ttgcgtctga atgatgatga ctgcaatgct gatcgcacct cgggtgtcgg 420
atcaccagct tttggctgct ctcaccaaat cagctgcaag aagattagag cacaaaagaa 480
ttacagaaag agagcctttt tcttttcttc cttgtggggt tcctttcatt tcgtgctctc 540
ctttctctgc cagccagtcc gtccttgcgt ccactgcacc tgcacacagg tcaccccgac 600
ccgcactgtt ctagactcca ttagaaaaaa aaaggtctga acctttccga aaccagccag 660
ccattggtct ggcaggccag catatgctaa ttggattttt ttgccgcatc attgagtgcg 720
ccatcaggat ttggaaatcc tggttttgag taatacagta atttggcatt atccattgcc 780
gaattcccaa gctccgtcag cttgaacgtg gacccctacc atctgcacca gctcggcacc 840
tcacgctcgc agcgctagga gcctaggagc agctgcccgt ctatttattg gtccctctcc 900
cgtcccagag aaaccctccc tccctcctcc attggactgc ttgctccctg ttgaccattg 960
gggtatgctt gctgccttgc tctcctgttc atctccgtgc taaacctctg tcctctgggt 1020
gggtttttgc tgggattttg agctaatctg ctggtcccgg tagaaaaaga tcatgtcccc 1080
tgacgtgctc aagcgctcgc cttagccgcg tccttgcccc ccgccatttt ttgcggtttc 1140
ggtgtgttcc cgtgactcgc cgggtgcgtc atcgcctgaa tcttgtctgg gctctgctga 1200
catgttcttg gctagttggg tttatagatt cctctgatct aaaccgtgcc tgtgctgcgc 1260
acagaactct cccctgtcct ttcctggggt tttggttacg tggtggtagt aagcttggat 1320
ttgcacatgg ataaagttgt tctaagctcc gtgggttgct tgagatcttg ctgttattgc 1380
gtgccgtgct cacttttttt gcaatccgag gaatgaattt gtcgtttact cgttttggtg 1440
gattattagc gcgaaaaaaa aactcttttt tttttgttct tttactacga aaagcatctt 1500
cttggatttt gctatcttct tttactacga aaaactcttg agtctaggaa tttgaatttg 1560
tgatgtccat tcttgcagtg cgctgtgctt tattgggaag ccaaatccta ttattttctg 1620
cctctagggt ctgaatggaa tcagtactct tgagacagaa aatcaatcca atcaagttga 1680
tttctttctt taaaaatatt atcacagaac taagtgcttg tgcggaatca gtactggctt 1740
ttgtttggtg gaggatcaat acttgctttt gtttgggggt ggcaactgtt ttgctataag 1800
attccatgtg ttcctgttga gatgaatcat atatagtata gctgcatact acaaatctgt 1860
ttttcaaatt taggttgctt tggcatgatc tatttttttg tcagacagac tttctaagtg 1920
gtagctcttg atttcttgtt cttgtacaac tggtgctgct gaatcttgac cgtatagctc 1980
gaattgcagt attctgaacc atcgagccaa ggctgccaag ctgactcgcc tccacagtct 2040
tcgcgaacgc cttggtgcca ccttctcctc ccatcccaat gaactgatag cactcttttc 2100
caggtgggct taccaaaatc atataacttg catttcattc ggtactgaaa gttgttaatt 2160
tgttattctc ttcatgcctg tcttaatagc acacccagat gtaaacacga gattatgcaa 2220
cttcttactt ggtttctttt gttggcacca tcatgcatgc taattgctaa ggatgttacc 2280
tattcatcct tgactcatat tatcatatgt aatgatttta tgatcacgag actattgatt 2340
gtgaagcata gtatagctgt tcttcagttt ttgtaccctt ttgttttttt ccttaagcta 2400
gaactggtac aatttagttg ataagacagt gtagtttgta gtacgtcatt tgacagattg 2460
tttgtcttta gctggtaaag tgccatttaa tatctgtatc cttcagatct aataaaaagg 2520
atatgagatg tccatcacaa gaggggaaaa attacatgat ctgagatgta acatccgttt 2580
ttatttgtga aataccactt ctacaggtat cttcactagg gtaaacc 2627
<210> 3
<211> 2695
<212> DNA
<213> 人工序列
<220>
<223> 添加到3'端的TMV增强子。
<400> 3
tctgcctttc tgttcttcaa acgatgtctc atgtctgcgc tggacaactt tcttgttgcc 60
gcctgtcgct tgcgctgtgc tgactggacg cagctccgga ggtttggttg tgcttggttt 120
tcgtagagaa ctcgccactt gccgcccgca cgttcttggt gtttcctcct ccccgctgtg 180
ttctgcgcac gggctttttc tgagagaccc aagtttccct tttactttta taaacagtat 240
acatgctatg tttctagaag gaggggaaac ctaatccccc taatccaatg gcggggagga 300
aatagggtgg ggtggggtgg ggggagggaa atatctcgct actttttaat ccggacaagc 360
tcatttgcgt ttgcgtctga atgatgatga ctgcaatgct gatcgcacct cgggtgtcgg 420
atcaccagct tttggctgct ctcaccaaat cagctgcaag aagattagag cacaaaagaa 480
ttacagaaag agagcctttt tcttttcttc cttgtggggt tcctttcatt tcgtgctctc 540
ctttctctgc cagccagtcc gtccttgcgt ccactgcacc tgcacacagg tcaccccgac 600
ccgcactgtt ctagactcca ttagaaaaaa aaaggtctga acctttccga aaccagccag 660
ccattggtct ggcaggccag catatgctaa ttggattttt ttgccgcatc attgagtgcg 720
ccatcaggat ttggaaatcc tggttttgag taatacagta atttggcatt atccattgcc 780
gaattcccaa gctccgtcag cttgaacgtg gacccctacc atctgcacca gctcggcacc 840
tcacgctcgc agcgctagga gcctaggagc agctgcccgt ctatttattg gtccctctcc 900
cgtcccagag aaaccctccc tccctcctcc attggactgc ttgctccctg ttgaccattg 960
gggtatgctt gctgccttgc tctcctgttc atctccgtgc taaacctctg tcctctgggt 1020
gggtttttgc tgggattttg agctaatctg ctggtcccgg tagaaaaaga tcatgtcccc 1080
tgacgtgctc aagcgctcgc cttagccgcg tccttgcccc ccgccatttt ttgcggtttc 1140
ggtgtgttcc cgtgactcgc cgggtgcgtc atcgcctgaa tcttgtctgg gctctgctga 1200
catgttcttg gctagttggg tttatagatt cctctgatct aaaccgtgcc tgtgctgcgc 1260
acagaactct cccctgtcct ttcctggggt tttggttacg tggtggtagt aagcttggat 1320
ttgcacatgg ataaagttgt tctaagctcc gtgggttgct tgagatcttg ctgttattgc 1380
gtgccgtgct cacttttttt gcaatccgag gaatgaattt gtcgtttact cgttttggtg 1440
gattattagc gcgaaaaaaa aactcttttt tttttgttct tttactacga aaagcatctt 1500
cttggatttt gctatcttct tttactacga aaaactcttg agtctaggaa tttgaatttg 1560
tgatgtccat tcttgcagtg cgctgtgctt tattgggaag ccaaatccta ttattttctg 1620
cctctagggt ctgaatggaa tcagtactct tgagacagaa aatcaatcca atcaagttga 1680
tttctttctt taaaaatatt atcacagaac taagtgcttg tgcggaatca gtactggctt 1740
ttgtttggtg gaggatcaat acttgctttt gtttgggggt ggcaactgtt ttgctataag 1800
attccatgtg ttcctgttga gatgaatcat atatagtata gctgcatact acaaatctgt 1860
ttttcaaatt taggttgctt tggcatgatc tatttttttg tcagacagac tttctaagtg 1920
gtagctcttg atttcttgtt cttgtacaac tggtgctgct gaatcttgac cgtatagctc 1980
gaattgcagt attctgaacc atcgagccaa ggctgccaag ctgactcgcc tccacagtct 2040
tcgcgaacgc cttggtgcca ccttctcctc ccatcccaat gaactgatag cactcttttc 2100
caggtgggct taccaaaatc atataacttg catttcattc ggtactgaaa gttgttaatt 2160
tgttattctc ttcatgcctg tcttaatagc acacccagat gtaaacacga gattatgcaa 2220
cttcttactt ggtttctttt gttggcacca tcatgcatgc taattgctaa ggatgttacc 2280
tattcatcct tgactcatat tatcatatgt aatgatttta tgatcacgag actattgatt 2340
gtgaagcata gtatagctgt tcttcagttt ttgtaccctt ttgttttttt ccttaagcta 2400
gaactggtac aatttagttg ataagacagt gtagtttgta gtacgtcatt tgacagattg 2460
tttgtcttta gctggtaaag tgccatttaa tatctgtatc cttcagatct aataaaaagg 2520
atatgagatg tccatcacaa gaggggaaaa attacatgat ctgagatgta acatccgttt 2580
ttatttgtga aataccactt ctacaggtat cttcactagg gtttgtcgaa caacaacaaa 2640
caacaaacaa caaagtcgaa caacaacaaa caacaaacaa caaagtcgac caaaa 2695
<210> 4
<211> 2694
<212> DNA
<213> 人工序列
<220>
<223> 包括点突变以消除ORFS。
<400> 4
tctgcctatc tgttcttcaa acgatgtctc atgtctgcgc tggacaactt tcttgttgcc 60
gcctgtcgct tgcgctgtgc tgactggacg cagctccgga ggtttggttg tgcttggttt 120
tcgtagagaa ctcgccactt gccgcccgca cgttcttggt gtttcctcct ccccgctgtg 180
ttctgcgcac gggctttttc tgagagaccc aagtttccct tttactttta taaacagtat 240
acatgctatg tttctagaag gaggggaaac ctaatccccc taatccaatg gcggggagga 300
aatagggtgg ggtggggtgg ggggagggaa atatctcgct actttttaat ccggacaagc 360
tcatttgcgt ttgcgtctga atgatgatga ctgcaatgct gatcgcacct cgggtgtcgg 420
atcaccagct tttggctgct ctcaccaaat cagctgcaag aagattagag cacaaaagaa 480
ttacagaaag agagcctttt tcttttcttc cttgtggggt tcctttcatt tcgtgctctc 540
ctttctctgc cagccagtcc gtccttgcgt ccactgcacc tgcacacagg tcaccccgac 600
ccgcactgtt ctagactcca ttagaaaaaa aaaggtctga acctttccga aaccagccag 660
ccattggtct ggcaggccag catatgctaa ttggattttt ttgccgcatc attgagtgcg 720
ccatcaggat ttggaaatcc tggttttgag taatacagta atttggcatt atccattgcc 780
gaattcccaa gctccgtcag cttgaacgtg gacccctacc atctgcacca gctcggcacc 840
tcacgctcgc agcgctagga gcctaggagc agctgcccgt ctatttattg gtccctctcc 900
cgtcccagag aaaccctccc tccctcctcc attggactgc ttgctccctg ttgaccattg 960
gggtatgctt gctgccttgc tctcctgttc atctccgtgc taaacctctg tcctctgggt 1020
gggtttttgc tgggattttg agctaatctg ctggtcccgg tagaaaaaga tcatgtcccc 1080
tgacgtgctc aagcgctcgc cttagccgcg tccttgcccc ccgccatttt ttgcggtttc 1140
ggtgtgttcc cgtgactcgc cgggtgcgtc atcgcctgaa tcttgtctgg gctctgctga 1200
catgttcttg gctagttggg tttatagatt cctctgatct aaaccgtgcc tgtgctgcgc 1260
acagaactct cccctgtcct ttcctggggt tttggttacg tggtggtagt aagcttggat 1320
ttgcacatgg ataaagttgt tctaagctcc gtgggttgct tgagatcttg ctgttattgc 1380
gtgccgtgct cacttttttt gcaatccgag gaatgaattt gtcgtttact cgttttggtg 1440
gattattagc gcgaaaaaaa aactcttttt tttttgttct tttactacga aaagcatctt 1500
cttggatttt gctatcttct tttactacga aaaactcttg agtctaggaa tttgaatttg 1560
tgatgtccat tcttgcagtg cgctgtgctt tattgggaag ccaaatccta ttattttctg 1620
cctctagggt ctgaatggaa tcagtactct tgagacagaa aatcaatcca atcaagttga 1680
tttctttctt taaaaatatt atcacagaac taagtgcttg tgcggaatca gtactggctt 1740
ttgtttggtg gaggatcaat acttgctttt gtttgggggt ggcaactgtt ttgctataag 1800
attccatgtg ttcctgttga gatgaatcat atatagtata gctgcatact acaaatctgt 1860
ttttcaaatt taggttgctt tggcatgatc tatttttttg tcagacagac tttctaagtg 1920
gtagctcttg atttcttgtt cttgtacaac tggtgctgct gaatcttgac cgtatagctc 1980
gaattgcagt attctgaacc atcgagccaa ggctgccaag ctgactcgcc tccacagtct 2040
tcgcgaacgc cttggtgcca ccttctcctc ccatcccaat gaactgatag cactcttttc 2100
caggtgggct taccaaaatc atataacttg catttcattc ggtactgaaa gttgttaatt 2160
tgttattctc ttcatgcctg tcttaatagc acacccagat gtaaacacga gattatgcaa 2220
cttcttactt ggtttctttt gttggcacca tcatgcatgc taattgctaa ggatgttacc 2280
tattcatcct tgactcatat tatcatatgt aatgatttta tgatcacgag actattgatt 2340
gtgaagcata gtatagctgt tcttcagttt ttgtaccctt ttgttttttt ccttaagcta 2400
gaactggtac aatttagttg ataagacagt gtagtttgta gtacgtcatt tgacagattg 2460
tttgtcttta gctggtaaag tgccatttaa tatctgtatc cttcagatct aataaaaagg 2520
atatgagatg tccatcacaa gaggggaaaa attacatgat ctgagatgta acatccgttt 2580
ttatttgtga aataccactt ctacaggtat cttcactagg gtttgtcgaa caacaacaaa 2640
caacaaacaa caaagtcgaa caacaacaaa caacaaacaa caaagtcgac caaa 2694
<210> 5
<211> 2626
<212> DNA
<213> 人工序列
<220>
<223> 包括点突变以消除反义链上的交叉组件ORF。
<400> 5
tctgcctttc tgttcttcaa acgatgtcac atgtctgcgc tggacaactt tcttgttgcc 60
gcctgtcgct tgcgctgtgc tgactggacg cagctccgga ggtttggttg tgcttggttt 120
tcgtagagaa ctcgccactt gccgcccgca cgttcttggt gtttcctcct ccccgctgtg 180
ttctgcgcac gggctttttc tgagagaccc atgtttccct tttactttta taaacagtat 240
acatgctatg tttctagaag gaggggaaac ctaatccccc taatccaatg gcggggagga 300
aatagggtgg ggtggggtgg ggggagggaa atatctcgct actttttaat ccggacaagc 360
tcatttgcgt ttgcgtctga atgatgatga ctgcaatgct gatcgcacct cgggtgtcgg 420
atcaccagct tttggctgct ctcaccaaat cagctgcaag aagattagag cacaaaagaa 480
ttacagaaag agagcctttt tcttttcttc cttgtggggt tcctttcatt tcgtgctctc 540
ctttctctgc cagccagtcc gtccttgcgt ccactgcacc tgcacacagg tcaccccgac 600
ccgcactgtt ctagactcca ttagaaaaaa aaaggtctga acctttccga aaccagccag 660
ccattggtct ggcaggccag catatgctaa ttggattttt ttgccgcatc attgagtgcg 720
ccatcaggat ttggaaatcc tggttttgag taatacagta atttggcatt atccattgcc 780
gaattcccaa gctccgtcag cttgaacgtg gacccctacc atctgcacca gctcggcacc 840
tcacgctcgc agcgctagga gcctaggagc agctgcccgt ctatttattg gtccctctcc 900
cgtcccagag aaaccctccc tccctcctcc attggactgc ttgctccctg ttgaccattg 960
gggtatgctt gctgccttgc tctcctgttc atctccgtgc taaacctctg tcctctgggt 1020
gggtttttgc tgggattttg agctaatctg ctggtcccgg tagaaaaaga tcatgtcccc 1080
tgacgtgctc aagcgctcgc cttagccgcg tccttgcccc ccgccatttt ttgcggtttc 1140
ggtgtgttcc cgtgactcgc cgggtgcgtc atcgcctgaa tcttgtctgg gctctgctga 1200
catgttcttg gctagttggg tttatagatt cctctgatct aaaccgtgcc tgtgctgcgc 1260
acagaactct cccctgtcct ttcctggggt tttggttacg tggtggtagt aagcttggat 1320
ttgcacatgg ataaagttgt tctaagctcc gtgggttgct tgagatcttg ctgttattgc 1380
gtgccgtgct cacttttttt gcaatccgag gaatgaattt gtcgtttact cgttttggtg 1440
gattattagc gcgaaaaaaa aactcttttt tttttgttct tttactacga aaagcatctt 1500
cttggatttt gctatcttct tttactacga aaaactcttg agtctaggaa tttgaatttg 1560
tgatgtccat tcttgcagtg cgctgtgctt tattgggaag ccaaatccta ttattttctg 1620
cctctagggt ctgaatggaa tcagtactct tgagacagaa aatcaatcca atcaagttga 1680
tttctttctt taaaaatatt atcacagaac taagtgcttg tgcggaatca gtactggctt 1740
ttgtttggtg gaggatcaat acttgctttt gtttgggggt ggcaactgtt ttgctataag 1800
attccatgtg ttcctgttga gatgaatcat atatagtata gctgcatact acaaatctgt 1860
ttttcaaatt taggttgctt tggcatgatc tatttttttg tcagacagac tttctaagtg 1920
gtagctcttg atttcttgtt cttgtacaac tggtgctgct gaatcttgac cgtatagctc 1980
gaattgcagt attctgaacc atcgagccaa ggctgccaag ctgactcgcc tccacagtct 2040
tcgcgaacgc cttggtgcca ccttctcctc ccatcccaat gaactgatag cactcttttc 2100
caggtgggct taccaaaatc atataacttg catttcattc ggtactgaaa gttgttaatt 2160
tgttattctc ttcatgcctg tcttaatagc acacccagat gtaaacacga gattatgcaa 2220
cttcttactt ggtttctttt gttggcacca tcatgcatgc taattgctaa ggatgttacc 2280
tattcatcct tgactcatat tatcatatgt aatgatttta tgatcacgag actattgatt 2340
gtgaagcata gtatagctgt tcttcagttt ttgtaccctt ttgttttttt ccttaagcta 2400
gaactggtac aatttagttg ataagacagt gtagtttgta gtacgtcatt tgacagattg 2460
tttgtcttta gctggtaaag tgccatttaa tatctgtatc cttcagatct aataaaaagg 2520
atatgagatg tccatcacaa gaggggaaaa attacatgat ctgagatgta acatccgttt 2580
ttatttgtga aataccactt ctacaggtat cttcactagg gtaaac 2626
<210> 6
<211> 2510
<212> DNA
<213> 玉米
<400> 6
atgccttacg atcatctgac atcttaaata tttcaaactg cagtatttca aaaactgtgg 60
ttttgtcaaa aactttgttc ccaaactgag actaaaatgt agtgctagat aataaggcct 120
tacccgttgg aatgacaaaa aagaaacaga aaacacctga aaaatagtat tgccttggct 180
ctaaattata aatcgttttg gttttattta atatctattt tttaagcata ctaaaatcta 240
tgtacctatg aaaaataaaa tatgaactac aatttaagac tgagtacagt gtacagcgat 300
aagttatatg aaccacaatt gtttttgaaa ggaaaaaaac taaattgaca agagaaacaa 360
tcaactcttt tagaaacttt gtataccaaa aaacgaaata aagaagaaga aaaaaataca 420
cacgatgagt ttattagccc acaaaacatg aaaaaaaatg agagttaaag cctaactcag 480
gcccacaaag aatcacaagc gcccatattc acagccgccg aaaggtttcg gcccccagtt 540
ggatctcaga gcccagtgtg aaataggact gacttgtctc tgatggttac gttacgtagg 600
gattgaaaca aacaggcagt gagccgatgt ggcagaccgg agcgcagaag cgacgacgac 660
catgaactga aggcgctggc agtgggccat gcgcccagaa cgctgacgaa ccacgacgac 720
gcggacgttc tacgaggtcg gtggggccgt cggcagcccg ccggagcata ttcgccgtcg 780
acagaggcag agaaggggaa tgtgtgggag catattccac ccgtgggaag cctcggagtc 840
ggagatgtgc agatctgccg gacgcacatg cgcacagctg ccgcaataga aaccagtgtc 900
tttttatttt attttataag aaaaaactag aaaagaaaat ccagtcttct atacaggcct 960
gcacagagag agaggaggga aggtcaaatc gtagaaaaaa aatgcttcct tttattgtta 1020
cgacattggc ctgaatatat actcattgtt tctttcctta acttcaacaa ttattgattt 1080
tgacaatcca ttttttattt tagttcgcca aggttttggt tggagaagaa tttaaaacct 1140
agccaagcag tcgagcacga gagccgccgc cgccgccgcc gccgttggca ggacctgctg 1200
acctctgacg accggacacg gacgttttcc aaagtccaaa ctcggggtag gtaggtcgtg 1260
aggctgctgc gttcgccaag ggaagaagca tctagttgaa gctagaaacg ggcagggggg 1320
aggggccgac gctatcggaa atctgaagcc cagcacggac ggacggacgg gcaggggcgg 1380
cggcacatcc tcgtctgacc gccgcgccgc gtccgacatg cgcaagctgc tgctcttccc 1440
gcgcccccac ggcggccggg ccggcagagc acgggacgcg cggggcgggc ctgacgtcgt 1500
tttcacgtgg tccgtcaccg ttgcttgcat agcgtacagg agtatagtcc catttccgaa 1560
accaaaaaaa gtaaacaaaa aaatgccgtc gcattagttg gctggcaagg gaagaccaag 1620
atggttttca aatcaaacat gtaaaaaaat gtttctttct tttttgaacg aacttaccag 1680
ttcgaattct ttaccggcat tattggttta aattgttccc caagaaagaa agaaaagaaa 1740
agcgggggga aatatgcctt ccttccttct tgcgtcacag accacgcgcg gatacaccgc 1800
acaacagcca ggcagcaagc agagcaccca ccgccggaag cggccgtcgg acagaacgac 1860
acgtggggca cggcacagtc cgggcccgca cgtcatcgaa gacacctgac ctgcccatgc 1920
gtcttctaga gaaaggcgga cggacaggtc acccccgcac ctcattccag gagttgcatt 1980
tcgctttctc ctttatttat ttataccaat aaaaaataaa tccgcctttt ctcctcccta 2040
tcgtgtgtct tcctctcgcc ggctttaaaa acgcacacaa gcgctaaaac cctctccacc 2100
gtccacctca gctcccatat ccgctcccct acctctccag catcctcccg tctccgtcgt 2160
ctcgtctccg ctcctcacct cgccgctagc caagggtaac tcctcgctcc cggccggccc 2220
ccgcgtcggg gttttccatt tactactact cgctgctccc tcctgctccg tgctcagact 2280
cagatccgac caaagcggtt tcgctgacta aattctcctt cgtttttttt tctttttctg 2340
gacggattcc tggacgcagg caagatcaag atcggaatca acggtgagtc tgtaccccca 2400
acacaaactc gttcttcctg ctcggttcgt tgggtctgga ctctggagtg atctgagtgg 2460
ggtctctgcg cgcctgcgtg ctcaggtttc tgaaggatcg gcagtaaacc 2510
<210> 7
<211> 2046
<212> DNA
<213> 玉米
<400> 7
aaatgaatta atatattatc taaattcaga cgggaaaaag agagaaggaa tcaggaaggc 60
tgagtgcaat attagttttt cattgagcac aatcttatta tgtttgatga acatcttgaa 120
caaagtatga gtggaaaaca acacttatgt tatatctgca gcacagattg ttagaagtga 180
aggctacctt gagatggtga taggtctctg aacccatctg cattgcttct tcgaagttca 240
tagcaccaac aagaagaatc ataatttcct acaaataaga aatgtttata gttactccaa 300
aactacagtt aaacatattg atatggttga tatacatgaa caactaactg tcttaatatg 360
tttctgttta ggcaaaagat gacacaagtg gacaaagtaa gggaataatg cattcaactt 420
ctcagactct aaaggtttgg atgaatactt gaatgggaag accatttcca gcatgctttc 480
caccattaat gactgtattt gcagggacag gaagagttgt agcgcttttg ccaacaagat 540
ccgctatatg cttgtagagt ggaacctgca cagcaacaag catccaatga tctgagaata 600
agaattatgt gcggtggcat gacacattta ccaaattatg atgattttag cagaagagca 660
gcacctcttt ttcagcagca ccagctttgc aagctgcaat tgacactgcc agcatagtat 720
ttgctccaag ctcagcctgc atttcgcaca atatcatatc tatttccatt tggataaaat 780
ctatttgcca gaaatatggg aacggaatca agatacagaa aaaagttgag gctgtagtgg 840
taagtgggaa cacaagtaca gtgaaaagat agcattattt tccgaacagt caaattaacc 900
gaaataagta gtatcacata ctgaccctaa attgactaca cccaatgtaa agaattgctt 960
gtgcatattg agccatcagt tgtttgtttg tgtaatggat ttgacaatgc agaattcagg 1020
agcaaaaaaa accgcaaagg agagagaggg aaaggatctc cgagtatccc acctgtggcg 1080
cgccttgtca agtccatgat ggcctggtcg atctgcgcct gctgctgcgg atccatccca 1140
acgagtgcct ccgacacctt gtcgttgatc acccgcaccg cgtaggcgac ccccctggcg 1200
aggaacttcc gcctctcgga ggccccggcc gcgtcggcgg cggcgcccac gagcgcgccc 1260
acgctagccg tagatgctcg gtgcacggcc ttgttggtgt gcaactcgac ctcaacggcc 1320
ggtgcgctac gcccgtcaag gatctggcgc gcccgcaccc tcgtgatcac ggtgggcgcc 1380
tcccgcctca tgtggccgac gatgaaaagc gccgggtcag gggccttggc gcggagcgcc 1440
gtattcaggg cctcctcgct cttgcgcgag agcaggtgct tccccaggta ctcctgcact 1500
gacatggctg ccacagcggt ggaattttct tgtcctcacg acttcgccac gtcgtcctca 1560
cctccctggc ttcccacgac tccgccgtat cgaggtgctc ggtgggtcgc cttaatccga 1620
agtccgaact aggaagacga gacagagagg tctgaggaat gggcctcgtt tgatgttgag 1680
ctgaattatt tttccagcat aagcccaggt cttggtccat gaacaaaatt actagaaacc 1740
cagcccagta ctacgatcta aaagagggac tgccactgga tagctctctc tagcattctc 1800
cacgctccaa tacagcggcg tagggtctat ccgggtctat ccgcgaacac gtgagaactc 1860
tccagaaact gctttctcct ccacttcatc tctctcgctt tccctctata aaaagacccc 1920
ttctaggaat tgagggagac agcaagcagc gatccgaagc tcaatcaatt cactcaaacc 1980
tcttccccaa atcttcgatt agattctcgt tgacaagaag actataaccg aacctgaccg 2040
taaacc 2046
<210> 8
<211> 2489
<212> DNA
<213> 玉米
<400> 8
tagtcaccac accatgatca tcttgtttgt tgtagaatac ccacttgtta cctacaacaa 60
tttggtttgg acgtggaact aaatgcaaga ccttattcct cgtgaagttg ttgagcacct 120
cttgcattgc caccacccag tctggatctc taagtgcatc ctctatcatg tatggctcaa 180
tagaagacac acaagagtaa tgttcacaaa aatgagcaac ttgagagcga gtgattaacc 240
ccttttgaat gtcaccaagg atggagttga cggggtgata tcgctgaatt gcttggtgaa 300
ctcttgagtg aggtggtctt tgatcttgaa tctcttggtc atcctccttt tcttgaacaa 360
cttcatctcc cccttgattg attcgttctt cttgaggtgg ctcattgtct tgaacttgat 420
cttcttcttc ttcttgagct ggttcctcat cttaagttgg tggagatgtt tgtatggaat 480
atgatagttg atcatgtgct tgtgaaggct cttcgggttt ttgtggacac atgtctccaa 540
tggacatgtt tcttagcgcg atgcatggag cctctttatc atctaaatca tcaagatcaa 600
cttgctctag ttgagagcct ctagtggaca cacatcttcg ggttaaatgg ttttatggaa 660
tattttttct tcacagatac aaatagtatc gaatatttca gatatttcat ggttttgtcg 720
aatacaaata taaaatcgga tagagaaaac taaatttaat tatatccatt tccatccata 780
ttaaaattga atacggatat agatatccat attagcattt tatttgaata cgaatatata 840
taatttggat gtctagacat tcgaatccat ctctaattag tgtgggaatg agggacactg 900
aaaaacaatg acgtgcatgg tgacatcata caatagtaca attctgacga cgatgaagga 960
atttacgtgc ggatcagcga caccacctgg tttggtggtt cctgtcgccg gaggcgcaag 1020
aaataaagag ggcacataac tacgtgaaat caagcccaat tagtctgcct tggctccctt 1080
atgctgtttt aaaaagttta gggttaagtc attagtagac tgttgcgggt ttagaaattt 1140
ttagagaatt ttgtttacaa cagcccctaa actaaagttt ttgggaacaa attttagtag 1200
tcttttaagt tgctctaaga ctatattttt ttagttgagg aggacagtga caattttgga 1260
gttgctctaa aaccatgttt tttagtcgag tgggacagtg gcaattactt aactacaatg 1320
cacaacacca ggaatccagg atgaaaaatt actacaccga gggctagttt gggaacctca 1380
ttttcccaag agattttcat tttcccaaag aaaattagtt tatttttcct tgggaaaata 1440
gaaatccttt ggaaaattgg agtttccaaa ctagccttga ttttttttcc taagatatgt 1500
gcagatcttt ctttgagagg acacaaaaaa aatggattgg gattgggctc atcgaaggcc 1560
gaatattcct atccatcgtt cgtgccggat taggcccaga accagaaaag agctaggccg 1620
ggctgcagta gcactatcct ctgtttcaca atattatgca cttttgatca ctttatttat 1680
gtcaaaaata cttgatacat cacgttttat tttcactttc gcctctataa aagtattaag 1740
ggatttctag acaattcaaa atgtaatttt ataagactat gtttgtcatt ttataaaaaa 1800
aaatagtttg attattttgg tgaacgtgcc ttggtcaaaa tttgtgggaa cggaggatgc 1860
tatcaaattc gtctgcgcag atgtacgccc agtaacgaag tatcgtcaat cgactgatga 1920
ccccgtcacc gtcagcaaga cagcaactca acattcaaat tcgaccgtaa taacatccac 1980
atacatacac ggagtatcaa tctagactag aggagacggg tgaacgtggt gagcctccgc 2040
ccataatgca accctactag tgctagcttt cggccgcgaa aaaacgtccc cacccccacg 2100
tctcaacttt atagccgccc cctccccacc gccgcggccg ccacgcgcag cagcaacccg 2160
gtagcaggag cgcagccagc aagctcaggc ccccagccct actgccaccg cgccgaacga 2220
caaggccgag ccggcggagc accgtccagc tgaggaggag gaggccgcgg cggccggcga 2280
ggatgaggac accggcgccc aggtcgcgcc catcgtgaag ctggaggagg tcgccgttac 2340
cactggagag gaggacgagg acgcgctcct ggacttgtga ggcatccgcg gccgcttcga 2400
ttcccccccc tccccgatcc gatttgccca tgtcttgttg atctgatgtg cggcggctgt 2460
gcaggaaggc gaagctctac cggtaaacc 2489
<210> 9
<211> 2320
<212> DNA
<213> 玉米
<400> 9
tttgtattgt tgtatgtaat gaataatctt tatatatata tatatatata tatatatata 60
tatatatata tatatatata tatatatgtg tgtgtgtggg ggggtgtggg ggtgtgtgta 120
ttgatgtctc ttggacaaca agattacaca aaacacaatt agaataaaaa aatatcctcg 180
tgtatataaa cttgtccgta taccatatta gaacacataa attttaggca acattttttc 240
catcaacatt cttcaatcat caaccaaaat ttacggatac acaagataag agggggtatg 300
taaggttgta cgtaatgggc tacatgataa catcaaagat tatgcaagca aatctcaatc 360
caccaggcga tcataaacat catagttcac atgcttcagt tttaaagcca tcgtagttcc 420
cgtgcaaaga caaaaacatt agaattattc aatacaagtt gcacaagata gttcaataaa 480
atttaaacca caatagtatt atccaacaaa gctagttcat accattatag tttctagtaa 540
acaagaatag agaacatata ttaagcaaac agaccacata ggataaggct aaggatgtat 600
ttttgtctat tgttttctgt gacatcgatc tcgtttgcac gagtaaaact aaaacatgag 660
aaaattccga taaaaaatag gaatctagaa atacgaacgg aaaacactaa accattttta 720
ttcctgtttc taaaatatat catctcgttt ctgtttttct ctgtaaatat gaaaacgatc 780
agatcatagt taaaacggaa tacagtaccg gacgaaacaa tatttctctc tcgtttcccc 840
cttatagcat ctccaaaagc tccccagaag tctcccctaa atctattttt ttggaaaaac 900
acaaaaacat gtctccaaca gttcctctaa agcgccccca actttttcat agcccttaaa 960
actccctcat ttgtagctac aaatgagggg ttttttgggc tccccagaaa caaactgctg 1020
ctttaagatg tttggttgag gagccaagta gaatggagtc gtttcatccc tgattctagg 1080
aacggagccg ttctgttctg tgtttggtaa tctggaacgg agcggctctg ttttttgttt 1140
ggttgcagag tgaacggaac ggagcgtgac tgtgagagcg ggatgagaac ggagcggctc 1200
cgttcggttg attttttgga gcggaatggt tccggatttg aggagaatat tccataattg 1260
gagtcattcc gttctagttc ctttataacc aaacagcaac aaaactggga tagaatggtt 1320
ccgttctact tggctcttca accaaacact aactaaggga cctgttggag aaatgattaa 1380
aatttaccct cacttattat ttagatattc cttaaaacta attttgagaa gtcgttttat 1440
ggagtgctct tggagatgct cttagttcgt agatctgatt gtgtgtatgt atgtaagcat 1500
atgcgtctgt actacgatcc acggtaaaaa agtcacaaac atataataat agcgtcattc 1560
aataaattga taacgtaaag tataaatgaa cttttaactc tgtttgagta aacaactcgt 1620
gcagagactg caatgaaatc tattattttt tctaaaataa ttatacaagt tgaggaaatg 1680
ctatttgttc cactaagcga cgatgtattt tgttttttaa aaaaatcgac gaggtactgc 1740
tcggttatta ttttcacatg caccgcgcgt tgtttttggg ccggcccatt tgtattgcga 1800
atttgcggag acgaatatga ccgaatggag tttagaaagc ccagctcact taggattgtc 1860
tattttctca agaaaagaga gaatgggccc aaaggcctaa acaccaaaac ccgatccgct 1920
tatgggatgt catggacatg gagtctggga ccgtccggca gatgagacga cagccgtcgg 1980
atcagaaacc ctagcgcggg aggctctccc tattaatacc caccctgcac cccgcgggag 2040
gagtctttcc tagggtttcg tagcttctag ccgccgccgc gtccgcctcg ccaagcgcag 2100
cagccgccgc agcacatcgc tctctcgatc tcagccatag cggaggtgga gcagcaacag 2160
gacacgccga agctcttcaa ccgctggacc ttcgatgatg tccaggtacg cgaacgagtc 2220
ttcgcatctc tgcatgcttc gattctttag ccttgccgct actagcagtg gatggaaccg 2280
acgatgaaat ctgcaggtga acgacatctc gctgtaaacc 2320
<210> 10
<211> 2686
<212> DNA
<213> 人工序列
<220>
<223> 包括玉蜀黍优化的Kozak序列。
<400> 10
ggatcctgag gtgtggcttg tatgtttcct gaccccctgg tggtgttccc agtttgcaat 60
acatcatttt ctgtagccct tgtacttgct gtgatccctg tttattgttc agggaaaact 120
tagtgcagtg tattagaaat atagaaacct cacatttcga agagcagaat agtgtttgat 180
aacagttttt ttaacgcaac aacgtttgtt agactgtgtc cagcggccag cgggtagtgt 240
aaaataggtg acgcgaaact atatgtgata ttgtttgaca ctatttgcag agtatagttt 300
aaaatagggg gtgtgagtaa tctgctgaag atagccttaa gagttaagat accaaggtat 360
agtttatcat atgcaaaaga aaagaaaaaa aaggaaatac aaaccattgt ttttatgttg 420
gttagagcta ggtaattatc tcttgaccag tgtatttcca aacctgttct tctcagtttc 480
tgtgctccgt cgatactgaa cattgttgtt catttctcat ttgttgaacg atggtatttc 540
aggagctaga gaagaggaga gaggagcttg agtctctgtt aactgctgac cggatccgct 600
gcgtttgggg gcggcaggat ctccgaccgg atccgcccgc cgtgcccgcg accggatccg 660
ctgcgtttgg gggggggcag gatctccgac cggatccgcc cgccgtggcc gcaaccggat 720
ccgctgcgtt tggggcggca ggatctccga ccggatccgc ccaccgtggc ggcgaccgga 780
tccgctgcgt ttgggggcgg caaggaagcg ggtggggctt ctagggttca ggtggcgggc 840
gtcggggtag agagtgcctg cggcgattct ggcgggcatg cgcagggtgg ggcaggggtg 900
tggtcgagcg ggccatgcac aaccttccat ccgcgggatt ttgcgggcgt tgctggcgcg 960
acggatttgc aggagttgct ggcgcggagc tttgagggcg cggccgattt ggggactgcg 1020
ggcgttggcg attttgcggg cgttgctggc gcggcagatt ctgcgggcgt tgctggcgcg 1080
gggactgcgg acgcgacagc tgtgctcgcc tgcggccgcg aggaaggcga cggggactgc 1140
gggcgcgggg agggaaatcg cgggcggagc gcgcgatggc agaacacaca gaactatgga 1200
cgcctacact aagggggtgt ttggtttcta gggactaatg tttagtccct tcattttatt 1260
cctttttagt atataaattg ctaaatatag aaactaaaat aaagttttag tttctatatt 1320
tagcaatttt agaacaaaaa tggaataaaa tgtagggact aaacattagt ccctaaaaac 1380
caaacacccc ttaaatacat aagaagtagt agagattatt attatttgtg tctattgata 1440
tgatcattat gatattatat tttactgttt taatctaaat atagttatta tattcagata 1500
attattttat taaatccaaa aatatttaac ttctaatgta ataaggagag aatactctaa 1560
tatcataata atttcttcta aagtgaccct cggatttgga gatgactgac agggagggct 1620
gtgcaccctt ctttctttcc ttttcaattg aagaacttgg gttgtgcttg ctcacacaac 1680
cgaatgaccg atgcacaccg acgcgcacgg agcggaccag cacagcccgg aaactgccct 1740
acgccgacac gttttccggt gcggcccagc agcagcaggg aggaaggttc gctcggtcgc 1800
tgggcctggc tccgcgtgcc gtccctccta taaatgcgag tcctcgccga gtccactggg 1860
caccagaagc tcactcactg ctcgttgccg gctgcccccg cggccccggc cagtccatcc 1920
cctcgctcgc tccccaactc cagcaggcag atcagataca tccatccatt cgcgcaccgg 1980
aaggtgagcg ccgtgaacga accatccgcc ctgctagctg cgatctgtag ccttgcgtcg 2040
ctttcgcgcc tagatcgtca cgtcacctat cacgatccgt gcggttctag atctgtggtt 2100
tttccttccc ctggtggtcg aatccttcca tccaccagac caccacggga cctcgtggat 2160
tccttttggt tttcctgtgc cgagagccaa aatcgagggg gggggcttgt tttttattgg 2220
ctcggtctcc cgctgtctcg tgatctgatt tgctgtagta atcagcagga aaggaagggt 2280
tgaactaaga gcgccgtggc ggtttcgtcg tcgctgaacc cggacgcgcc gctcttcatc 2340
ccggcggcgc tgctgcaggt ggaggacttc tcgccgcagt ggtgggacct catcaccacc 2400
actgcctggt tccgcgacca ctggtcccgc gagcgcgccc acctggacga gatcgccgag 2460
cagatcgacg cggccggcct cctccccgac gacgaggacc tcttctacga cgaccaggtc 2520
gagcagggcc ccgtcgccgc cgcccttaag ataggtactg atgtctctct ctctctctct 2580
ctcttactct cccctcgatt ttagatctgc ctgaaggacg aatcatagtg acctcacgtt 2640
ggtgcgtttt tctccaccag attcggtgct caaggcgctg taaacc 2686
<210> 11
<211> 7672
<212> DNA
<213> 人工序列
<220>
<223> 包括玉蜀黍优化的Kozak序列。
<400> 11
tatagaatag ctcactatcc tatttattat agtttaagta tatagccaat attttaaatt 60
tactatttat taaattctag ggaagatagt ctcaattcat aactttatta taatacgttt 120
gaaattttaa atctttagga aattttctta attcacctag atacgattct ggagtgttac 180
aagctgcgaa tatactggtg ccattgagta tacataaatg gatttaggtg gtgctcaata 240
ggtgaaaatg agatactaat cacttaaatt tcaaaatttc tatggtgcca ctgtactcgg 300
ataggtctat ctagggctgg acaaaatgct cgtggctcgc tggctcgctc gtttcgtggt 360
cagctcggct cggctcggat cggctcattt gaattttgtc acgagctgag ctgacattct 420
agctcggttc gttaacgagc cagctcgcga gctaaacgag ctaccatatt ctagtaaaac 480
gaaattatat tcatatcatt tatagaataa ttgatgaaca tgttatatat atgtgagatg 540
tctatggcct atgaattaaa ctaatgatta atgaactatg cctatgtgtt aatttggtct 600
atgcaaatat aattatgggt taaactgatg aacatgcatg tgaattgtga attaatgagt 660
gatgaattgt gctaatttgg tgttatattg acatggtttg tgaaactatg agtataatta 720
ctattttcta ttgttaaatt agtttgaaat taactaaaaa ataattatta tatacatttt 780
attttttttc tgctctggct cgcgagctaa acgagccagc tcgacctcgt aaacgagccg 840
agccgagctg actctgtggc tcgttacctt aacgagccga gccgagctgg ctcgttagct 900
taacgagcca gctcgaactc ggacgagccg agccgagctg gctcgttatc cacccctagg 960
tctatctagc ttctgatgtt tgcaaacctt agagttggag tgttcagcca gctactcctt 1020
tgctttgctg aataaccata ccaaacacgc ccatattaat acccgctcgg cggtggttct 1080
gcaatcaaac gcaggccgca gtcgcgtgcg gaactagagg tccttcagag aagtgccgtg 1140
ccagtgccac cgccggccgc atcatcgttc cgcccccctg gtacgagcac ttcgcagagc 1200
tgcaacctac atccctttta cataaatcta ttgtctcgta ttgccgttga cgccggaata 1260
gtcttcgcat cccttttaca taaatccgat gttttctttc tccgattcct ttgaggaatc 1320
atcacgggtc agggcaggtg ttctgccgtt tgcccttttc tttatattct ccttagaaga 1380
aatatttagt tggaggctgg acatagccgg aggagctaac taatcgagcg gtgtactggc 1440
aaaacaaaag gagcggagca agaaagggga gaaaaaacta gccactgccg gagcgctatt 1500
ggccgtgttg ggcctggaag cttgcatcaa tacttccctc gccccgattt ggttccaaaa 1560
tcatacaagt cccaaagttg tcaagatatt ggaggtatgc aagcgacttg gatctcaaaa 1620
tagaagaaat ttcggatctg agcacaaatc tgagttgaaa aaactgcaac tcaaaatcat 1680
caaaaaaaga agaagaaaga aacgaatata ttcgctcctc ttctcagccg aacccaaagg 1740
aattgaatcc aaaccctggg taggcagaca gtgagatatg gaggagagca ggaggcgaac 1800
aagagaggct gcggccacga atatctcacg aacaagcaca tcatgggtcc acggagcggg 1860
cagggtgacg ggctcccgac ggcgagctac atctcggaag agcaccaggg cagcatgtcg 1920
tgttgggcag gttggccgtc tggcggacgg cggacggtga ctcgtggtca gggtgcacct 1980
gctcgattaa ggcgcctgac tactcatgtc ttggtctctt tgcttgtgtt tgctatatgc 2040
tgctcgtacc tcatgagcat actaagttga ctgctcagtc tgctgagtct gtttttctag 2100
ggtatagtgc tgagcacaag ggatatcatt gttgggatat gattgctcgt tggatgaggg 2160
tctcttggga tgttgtcttt gatgaggctc attcttttta ttcttgtcct tctttcgatg 2220
ctttgtcaac atccttggtt gatcccatct cttttctata ttttctagat gcccgtgtta 2280
ctattggacc tgcctcacgc ttggtgcgcc cacgatagta gccttagctc cttctgacat 2340
gttcatctct ctttcggtgc cttcctttgt ggtgccttct atagtgtttt ctttggagcc 2400
tgctgcttta gcccctgact acgctatgaa cacttgtcta cacccgccgg gtcatcaatt 2460
cttttggtac accatcatcc tctcatgcgt tgccctctta tgatgtgcgc tcttctgcaa 2520
ctcattcatt ttcttgcgat ttacctttga ctgatgctcc ctattcatct ctggatccag 2580
cttcctcagt tgactctttg ctggagccac ctcttagacg gagtcatcgt tttcgtcagc 2640
cacctaatgg gtactctcct tcaggtttag tcgctaccgt tctttctgag ctgacttctt 2700
atcatgatgc tattcttcat ctgtaacgac aacatgcgat ttctgaggag attgctactc 2760
ttgagcgcac tagcacgttg gaacttgttc cttgtccatc acgtgtttgt cctatcacca 2820
gtatgtgggt ctataaggtc aagacccgtt ctgatggttc tcttgatcgc tataaatctc 2880
gtctagttgc ccaaggcttc cagtaggaac atggttgtgg ctatgatgag atttttgcac 2940
ctgttgctca tatgaccact gttcgcactc ttcttgctat ggcctctgtt cgtgcgtggt 3000
ccatctctca tcttgatgtc aagaatacct ttcttgatgg taagctactt gagttctata 3060
tgtagccatc gcctaggtat tctatttctg cttgtatggt ttgttgtctt cgccgttccc 3120
cttatggcct caagcaggct ccacattctt ggtttcagct ctttgcttct atgataactg 3180
ttgttggttt ttctaccagt aatcatggtc ctgcactctt tgtgtactac ctcctctcgg 3240
ggtcggactc ttctttatgt tgatgatata attatcactg gagataacct tgagtatgtt 3300
gactttgtta aggcacgtct tagttatcat tttctcatgt ctgatcttgg tcctctgtgt 3360
tactttcttg ggacaaaggt ttcttctttg tctcagggcc tttatctatc tcaagaggag 3420
tacattcaag attttcttca tcgggcttct cttaccgatc actagattgt tgagactccc 3480
aagcagctca atcttcacct tagtgccgat gatggcgagt cttttcccga ccatactcgt 3540
tatcgtcaac atactgtagg aagttttgtt tatctctgtg tcactcgtct tgacatttca 3600
tatgttgtgt gtatcctgag ttagtttgct tcagatccca tccaggtaca ctatagtcac 3660
ttgctttgtg tcctacaata tctttgtgga accatatcta gatgtatgtt ctttccacat 3720
tctagctcgt tgcaactgca atcttgttct gatgctactt gggctagtga ttttttcgat 3780
agttggtctc tttctcaata ttgtgttttt cttggtggtt ctctcattgc tcggaagact 3840
aagtagcagg tagcagtttc tcgtttgagt accgaggctg agttgcgtgc tatggccctt 3900
gtgactgcag aggttacttg gttacgatag ttgcttgagg attttcatgt ttctgtttcc 3960
atgacgactc cttttgtctg acagtacagg tgttatcagt attgctcgtg atgcggtgaa 4020
gcatgaggtc accaagcata ttggagttga tgtttcgtat acacgagctg aagtctagga 4080
tgatgttatc ttgatttggt atgtgccttt agagcttcag ttggctaatt tcttcacgag 4140
ggcacaggct cgcgctgagc ataaattttt cctctcaaaa ctcagtgtta tagatccacc 4200
ttgagtttga gggagtatta gatagatatg ggtttatttg tatttttcca ttttataagg 4260
gtattagata gataggcaac gactgctatg caagtagtca ttctgtgcaa gcgtgcaagc 4320
aaaccatctg atccattata tcgtgatcca accgtgggtc acatttaaca cttaaaccct 4380
tccaccacca actcaataat ctttataaaa aaacccctaa caaacaatgg ttatatctgt 4440
ggttggatcg taatctaata gatcagatgg tttgcttgta cgcttgcaca gaatgactgc 4500
ttgcatagca gttgttgcct agatagatat gggtttattt gtatttttct cttaagggtt 4560
tttgtgtata tttgtactca tgtacctata tatttgtgct agttgacccc ataatgaata 4620
gacctgctat tcataatatt tgcaaaccat gaaaatttga ttattacgaa ctatccaaat 4680
actcgaacac atgggcatta tagctcacaa aaatggaagg ttgagctgct gcttgaagaa 4740
cctcaacatc tttgaacaac aacctcaacg aaacttgtat atgaaccaac ttccaaacaa 4800
tcccttgtgg aaggatagta atgacttcag ggcattgatc acacatatcc gacggtggaa 4860
ctactgtaac aaccctcttt tctgtggaat atagttgaaa ctctacaact tgaccaaaac 4920
caagatgacg acatatggtg gaactaacaa aacaagagga ctacactacc tcattagctt 4980
attaagcaca atctcttggc accacaacaa cgaacaacaa aaccatcatt tggatgctct 5040
gtgggcgact aaatgcaaat tctttgcatg gttgatcatc ccaaattggt ggcacttagc 5100
tataggctag cagtgagagg atggccgaac aacatgcatt gtccactatg ttggtgtagc 5160
catgagacca accaccacat aaatgccaaa cgttcattca ccaaaaaaat ctaggcaaca 5220
atggcttgga tttcttacct gcagctccac caagctaact ggagttcaat taggtcaacg 5280
tatgggtggt ggtcgagtat agcagtcaca aatgatgttc taaagatggg gttgtgttaa 5340
cacatcttgc ttgtagcacg agaacactgg aaggagtgaa accaaagaat ctttcaacac 5400
aaggacctat caacgctatc catgattggg aaattcaagg acgaaactag aatttgggtg 5460
aacacatgca caaggcacct aggagagcct ttcttttgta ctgttaatcc ctttttaaac 5520
tctctctgtc cttaggagtt cgtttcttcc gctctattca atgaagttag gcacaatctt 5580
gtgtgatttc attagaaaaa cacaagtaaa ttgcatggtc agtacttgaa gtattacagg 5640
aatctcgtct gcccccaaac tattaaacct tatatttggc tccctaatgt acttaactga 5700
tctcattctg gtcaaactaa acatggtgat ggcaaggagc cgatatggtc gcccatgtgg 5760
atgtgattta agcaaaaaat ctcatggtcc atagctgtgt caacaagcca acatgccatc 5820
gcttccttat gccgagactg cccatgtcgc tcgcttttac tgtcatcatc atcaaactgc 5880
ctgtcatgtc tacggatgcc atgaccgctg tcacacatga tgtggagatg aacctgtcca 5940
tcaacttcca cgtgctgcca ctatcgctag ctgacaccgt cttggtcatt gctgtgtagg 6000
gctaggctaa gagtcgctga atgatccttt cgctctcctt tacaggaaca tgctgtttac 6060
tttgtgtcgc caaggcgtgc tagagtacct cttctacacc tccagcacca gtagccttat 6120
tgttagcttg cacatcccac ataagcaggc cgatgtgaat gataacttca gggacgtcga 6180
cggcatgtca ctgccaagag tcatttggtg ggaagcgttg tcatgccatc tgtcgtgcca 6240
ttttgtcctc agttcgaccg ccattaccgt gagcacaacc tttgcgcatg gttggccgct 6300
tccatcaccc ttattccgtt tcctcgtgtt ggtcttgccc caaggctatg gttagcagac 6360
cgtgcatatg gccggcaaaa gactattttg cactgtagat tgcactcttt atatagtgaa 6420
gtttaaaata ggagatgaga tgaataaggc tgctggagat agcctaaacc cttgcagctc 6480
gtgcttgcat cgggggagcc aaaaggcgtc cacctccacc atcgccgaag cactgagcac 6540
tactctggct tgtgtttcag caccacaccg cagagtgctt agggccacca acctcctctt 6600
gcctctgtgc ccagagcacc atcagctctg ctgcctccct ctgttccttg tgcttgctag 6660
gcaggcaatt ccgagctggg gcccaacttg taacgctgat ttcaccatct tgccactgcc 6720
gggcaccaag tggacacatt tgacttggcc tagtgggttt tctgcataaa tcacatacat 6780
gtggatgcca tatcaggctc tttggtgttg tcgtgtctac tttcgacaag gatgagatca 6840
cttaaacata ttagggagcc aagtatgtaa tttcatagtt tagggaccta cacaaaaatc 6900
gtataatact ttagaacagc cgtgcagttt actcaatcaa cacatacaaa gtcagatctt 6960
aagctctgat acttcaaagg aatggttgag cccagttgac aaacaatctt gcttcattca 7020
ttgaattgtt tataggagtg gctatgtaac tactgggtgg ttttgtttga cctgtcatcc 7080
aaattgtgta gtcaaccata aacatacacg tcacacaata cattttggat gtgacagata 7140
ggatttaggc gagagaatgt acaatgtcac tgaaaaatta ccactgtatg gaaaggacaa 7200
tctaagtgaa aagagaacca gggcctaatg gtttcaggac ttcaaactcc ggccaaatga 7260
atttacagtg cttaaattaa ctcatgttaa tcatgatagc caaagcatgg gcaaaagaga 7320
aactatgaat aaatcgacaa tgtattctat atagcagtaa tataccatgt cacgagcttt 7380
tacactaatg ggctgtattt ttctgcagtt attttaactg gcaatattct atgtcacagt 7440
aatatttgtt aaattttttc cagaatagca actgaactag aagtctagta tttcttaatt 7500
ggataacaaa aggaattagt gtgcatttgg cttacgaaca atcagtcacc caacattgaa 7560
tttgaagttc tgtttcctct ttgttcagac gacactctcc aaatgaatgc cttatatttt 7620
gtgttgctcc tcttttctgc agagtgttca gtaacttctt ccgatgtaaa cc 7672
<210> 12
<211> 1014
<212> DNA
<213> 玉米
<400> 12
aagttcgtca tgttctgttt tggtcatttg ggcaccaaag tttgcgcctc atttggttct 60
gtaatccgtg aggtcgtgca tgtacttggc gtattgcatg cagtgaataa tttagcttgg 120
gtttgtttgt tgggggcagt gttggggacg gatttggatt ggggtttatg cttggcatcg 180
cgtcgtatcg aaactcagct gctgtttcgc tgagtaatgt acatttccct ggtaatggta 240
cttgtggact ctgatgcttt tatgggaacg agtgcatttt actgccgtgc ttggccgtgc 300
tgttgaatta ttcccgtagt gtattaaata ttggatgcac cagattgttt gtcccattta 360
cgcataattt tcccgtcata tgttgaatta tttacgaatt ataaaatatg taatttatat 420
ttatttttat gaagtatata aaattttact tttttgttat ataattaaat attttttgtt 480
ttgataaaat ggtatgtttt attttaaata aaaatctata aaaaaagatg atatggtggc 540
tggaaggtaa cgataaatta tgtatactaa agtattaacg atagtaaata tagttggacg 600
atagatgatg tgacggggtt tgttcttttg attttaatct ataatgcttg tctatagatt 660
acagccgcat caatttaaat agctgctttt aatctgaagc gaacaaccga taaaaataga 720
cattaggcca tctccaacag ttcgaccgtg caaagtatta ttttgctatt gcactatttg 780
aataatggat tttagaatag ggagtgataa aaagtgagat aaaaagttta ataaaaatag 840
tcttagatcc aacaaatata cgctgccctc ccatcagttg cctggaccca tgccaagaag 900
tgccagccat agtcgtatga aaaatgattc taagggcgtt cgcaatggtt gtcttaaata 960
gttagctatt gtgaagctga aactaagaga agaataaaaa tataatttat ttca 1014
<210> 13
<211> 1216
<212> DNA
<213> 玉米
<400> 13
tacggggaaa gaaggagaag aagaagaaga agcccaggcc ggagaaccat cgcctgcatt 60
tcgatctgtt tcaccgcaat tcgcattgtt agtcgtgtat tggagttatg tgtacttggt 120
ttccaagaac tttggttcct tctcgttttt ttttccttgc ttgtttgagc gtttttgggc 180
agcgctggcc tggttcctag tatggtggga attggctgca ccttttgctt cgaataaaaa 240
tgcctgctcg ttcacctgtc ttccagagtg caatgcgatg ttctgttgcc caggtcgtgt 300
ggttctgact gatggcgatg ttgtgttctt ctgttaatcg cctgttttaa cgtggtaggc 360
tgatgcttgt tcttgttgag aaagcttgct gtgccagaca tggctgcttg aatacaagtg 420
aaggaaaaaa aaagccatgc caagtaaagt tgcacaaaat ttcaactgct cagtggacca 480
ctggaccatg ttcttggtta ttgcagttgc agggcttcac atggcgtttg gacagcagtc 540
ttggattgat gcataaagag gtggtggtta atgaggacgc aaggccgttc cctcagagtc 600
agtcacaagg ttgcagaggt cacggttctc ttccctttcc gcttcctgtc acatcggaat 660
tgttgtttac gccatctgcc catcacccac caagtctatg tttctgtact ggatctttca 720
atggcggaac gcgcttagtt cttcgtcaca gtcgaatcac atgatctaat cgatgtcttt 780
aatctcgctg taaaaagggt gggacggtgg gtgcagggta gggaccaggg aaggcctgcc 840
taaacgtatc cataaacatg cacagcaacc ctaagatatt atactgccta cttcctaaga 900
tatagttatt tctagtctat tttttttccg tccacatcca aataagtgat aatatataga 960
catacatata tatactatat tcatcataga ttaatgaacg aatgtatact tagtttaaac 1020
ctaattatat tttaggaagg atggagtatg aaacatgaca atacaacaaa aaaaaatcat 1080
gtaattgcat atcgtcaaag ttatctgaag taaccaatcc agggggaaat cccgttagca 1140
aacatacaag agcaccgccc cactacatcc cagaaaataa aacaaaacca gaactcagat 1200
ggataaataa tactac 1216
<210> 14
<211> 1216
<212> DNA
<213> 人工序列
<220>
<223> 包括两个突变以去除意外的ORFS。
<400> 14
tacggggaaa gaaggagaag aagaagaaga agcccaggcc ggagaaccat cgcctgcatt 60
tcgatctgtt tcaccgcaat tcgcattgtt agtcgtgtat tggagttatg tgtacttggt 120
ttccaagaac tttggttcct tctcgttttt ttttccttgc ttgtttgagc gtttttgggc 180
agcgctggcc tggttcctag tatggtggga attggctgca ccttttgctt cgaataaaaa 240
tgcctgctcg ttcacctgtc ttccagagtg caatgcgatg ttctgttgcc caggtcgtgt 300
ggttctgact gatggcgatg ttgtgttctt ctgttaatcg cctgttttaa cgtggtaggc 360
tgttgcttgt tcttgttgag aaagcttgct gtgccagaca tggctgcttg aatacaagtg 420
aaggaaaaaa aaagccatgc caagtaaagt tgcacaaaat ttcaactgct cagtggacca 480
ctggaccatg ttcttggtta ttgcagttgc agggcttcac atggcgtttg gacagcagtc 540
ttggattgat ccataaagag gtggtggtta atgaggacgc aaggccgttc cctcagagtc 600
agtcacaagg ttgcagaggt cacggttctc ttccctttcc gcttcctgtc acatcggaat 660
tgttgtttac gccatctgcc catcacccac caagtctatg tttctgtact ggatctttca 720
atggcggaac gcgcttagtt cttcgtcaca gtcgaatcac atgatctaat cgatgtcttt 780
aatctcgctg taaaaagggt gggacggtgg gtgcagggta gggaccaggg aaggcctgcc 840
taaacgtatc cataaacatg cacagcaacc ctaagatatt atactgccta cttcctaaga 900
tatagttatt tctagtctat tttttttccg tccacatcca aataagtgat aatatataga 960
catacatata tatactatat tcatcataga ttaatgaacg aatgtatact tagtttaaac 1020
ctaattatat tttaggaagg atggagtatg aaacatgaca atacaacaaa aaaaaatcat 1080
gtaattgcat atcgtcaaag ttatctgaag taaccaatcc agggggaaat cccgttagca 1140
aacatacaag agcaccgccc cactacatcc cagaaaataa aacaaaacca gaactcagat 1200
ggataaataa tactac 1216
<210> 15
<211> 1004
<212> DNA
<213> 玉米
<400> 15
agagagatat ttctgcctcc ctatcgtggg tcgtccccaa tggcctttgg tcgcagacca 60
tctttgctgc ttgtctatgc tgagaataaa tgtgaacggt gcccctggac gctggatcca 120
tgctggtttt ggacacggtt gtctttttgt gtttaactta tctgctaccg tcctgtaacg 180
aattcactaa gttctagttc ttttgtgctt tgttaagaat ataaacaatg aggtttcaat 240
tttggtggcg ccatccggtc tgattgcgta ctagtatcat gcatatctga gctggtcttt 300
ccggagtaac agtttttttt tgtttcgtgt caatgattct cagcctgttc atttggtctt 360
aatccatatc ggttactact ataatgttgt cttgtctcta tagattgcag cagtctaaca 420
catgttcttg gtatcctttt gggtgtgttt aatgctattt gctctgtgtt gtctttttcg 480
ttaatcggga cagagttttc tctctgtttt gacagtttcg gtggttcttt tttgtgtgtg 540
gtcagcgagt cacgaactgc tggttggcca gcgaaatagc gcagactatt atgggtcttc 600
tgctggtgaa tatggaagga cgaggttaaa ttttctgctt tgatgtgtct gccctctgcc 660
gctgtgctgc atgcatgtgt ttgggagcga agcagcgtgc tgtttgggcg tatggttggc 720
atggtgttaa attatttcgc tgattcagct ttgggttatc actggttttg atggtcacgc 780
tgtgtcgtaa gagagatcgt ggcagcaaaa tggagaaaaa ggcagtgaaa caaactttca 840
gggtgtggaa tgtatgggat tcgtatggtt gaggccagga tttgtcaatt ggtcaagttg 900
aaaagtaaag gcgagacaga ttggcgagga ccgaggagag attggggttc agaaacttcg 960
gttacacttt aatcccctcc atctccctcc actcctccct tcta 1004
<210> 16
<211> 1023
<212> DNA
<213> 玉米
<400> 16
acctcggtct gcggtcgtcg tacctgcgtg gtttgaggaa cggcagttcg cctcggtcgt 60
tctgtgaaat aaaattgggt tacaagaatt atggcgtttg tcaatatggt cgtaatgtcg 120
taggatggtg gaatgtggtc acaaactttg cgtatgttgg gtctactggt ggtgtctgaa 180
tctatgtatg gatgtcatga gtttgtctac tagagttcta gttcctgtgg tgttcgtatg 240
atgtatatca tgagttaact ctatctaaaa tttcttcatt atggtatttt taagaaataa 300
attctttatt atggtttttt taaagggact atgtccatcc taacaagagc aacgtccaat 360
aattctctaa aacttaaatt taagaaccga ataaaaaatg agtagttttt aaatactttc 420
tatctaacct tatttactct tctccatatt ttagtagttt tttaaataga cttactaaat 480
ttagttactc tatattttgg taactcgaca gaatacaatc tgtgattaat ttttctcaca 540
tgtggtagct agatacgaca cttttttttt tactttttag cacatgcaca atggagtagt 600
tagattcaac acttatgaca caagtttttt cttcaccgtt ggactattat tgtcgcatat 660
gttgccaccg cgaaccaccg ctcctctata ggttatgtca atcgaccttt cctcttttgt 720
cttcgacatc atccaagact aacaaagtta gattcaaatc aaactagatg tccagactgg 780
caaagttaga tttaaaatca aactactatc tacatataag caactattag ggactaagtt 840
atttttctac ttcaatagtt gttgctagca acttgctaaa cataatttta gaaaactttt 900
ttagagaact attagagttg ctctaaaagg ttttgtagtc ccatttactg ttttgtgact 960
attattaggt ggagtttggg cagtaaaaag gccaaataga aaatggggtt gagattggga 1020
aaa 1023
<210> 17
<211> 1028
<212> DNA
<213> 玉米
<400> 17
aggttgaagg caaacaaggg tcaaatggat gccattccat tcatttcgtt tccaaggttc 60
agcttccccg caaattttca ttgtgttttc tccgagatga atgtttgtgt tcggtgaaat 120
cagagtcgtc agtcatctac atagcttttc ttggttgata gactgttatt ttaagtcgca 180
tgtttatctg ggatggctgg ggtcagcatg tttgtacaat tatttggagt tgcttttgga 240
atggtcgcgg tttgatgagt tgcctacagc catgagatgt cttttcgctc cacttttatg 300
gttcattcgt tctcaataat atgggatgct atacttgtgt tgatccatta tcttgatgca 360
tcgttgtctg tgcactgcaa caacaatacc catctgaaca cccctatcaa taaaatacca 420
ttttttttct ttccatccca ctaatctagg cccactttct cactcttttc ttatccacta 480
tattgtcaat atagaatctg gggagagaga gagagagaga gagattgaga gagagagaga 540
gagagagatt taggctccct cccttcctat attcaaaata ggtatcgcct ttgggtcacc 600
tgttggaatg atttatttta gtatcgtcca tatttaattt aaacaaatgt tgaattttac 660
atgcatattg atttaaagtt tgttagttta tgagcatcac caactaagat ctctaatgcc 720
aaagagcatc tccactagtt ccaaaaaact ctctaaattt aatttaggat gttagtaacc 780
agaaattatg ctccaacagt ttcctaaatg agttccttaa atataccaac tttttaaata 840
tctctattta gtcaaacttg agaaattgtt tcacactccc aatagttgtc atcaatcaca 900
tcgtaaaatc atttgagttc gcacccgtgt acaagtggtg cactttaaat aaattaaatt 960
acgaaaatga taaatttact atcgagttag cataatttaa aaatatataa caacataaga 1020
actgggaa 1028
<210> 18
<211> 1002
<212> DNA
<213> 玉米
<400> 18
actgagcttg tatcctggtg cactctgcgc tggaaacttt tatgtcgctg gcagtcgtat 60
cggttcttgt tttaccaatg tttagagttt tttgagacct atatgcggtt ttggttttca 120
gtgcacaatt aaaattactg agtaatgtag ttgattggga acagaaatgt ttggtgcctg 180
gtttaccgaa ctccagttct cttgtcattt ttctttattc tatagtctgt attatgtatg 240
cgtatgagta ttgagatgat tctgcatttg aattgtctgc tttgttgctg tcgctgtatg 300
cgtaccaatg gtaacagggt agttgtggga agtagacacg gccggttcta tgttttcgtg 360
cttccgcggt tcaggctggt taagcctatg gagcgtacgc acgctcctcc cgtctctccg 420
tgtcctgcat gctggcaaca ggagtgcggc ccagcgcacg ccctaatcga cggcggtata 480
tttgtctgtc cctccatttt gtggtgaggc tattcgcaac cgttatcctt aaattttttc 540
tcctatatca ctattcccct atttttcctt atattttttc atcttcagca gcggttctcc 600
taaatactcc ctctataccc actacaacta taaatattat tttccatatc tattcatcat 660
ttattaccac tttttttcaa ctaaaaaata ctcgcatgca tggattttac ggaagggggg 720
ctgtcacagt atccccttga tctgctgtga gagaaaaggg ggacactagg tagggtgcaa 780
ggtagggagc agcggtgcgg gtggtagcgt ggttactgca gccgctacga cgtgagcagt 840
gttaggggag aggatggaag ggtggtgcgc tgctgcagat aacccgagcg ccaaacactc 900
atgggtgata attaggtata agaaaagata ttttatggtt aggagagtat agagagaatt 960
tagtggtaac ttctatggaa gatggaaaaa taggggtgaa at 1002
<210> 19
<211> 1001
<212> DNA
<213> 玉米
<400> 19
gttcgctggg ggaactcatc aggaaggctg ctgcccctct tgcagccttg ctcctggctg 60
ccgccgctgt cgtggtctgc tctttcaagt cgaagtaacg gtggttcgag ctagtggata 120
gtgtggctca actgtagaag ttccttttgt atagcaagca agtaaaaaaa aaaaatgacc 180
aaaaaatata acaaaatgca gctgtaagtt tactgctgct ctctaagtcg tgttcagtca 240
tccagtgtgt ctagtctagg gaaaccccat aaaaatggtg aaggtggaat cccatcccag 300
tgtcataatt aaggatgcac ttcttctgta agcaaatgta tgatgtacaa tggccggccg 360
gcagtctaaa tgttacaact agctcttctt ggtgaattca ccggtccaca ctgatgtgct 420
gctatgtatc attactatcc agttagggct tgttcggtta ttcctacgcc atatggattg 480
gacgggattg gaaaatttta gtagacattt tgacttctat ggatttaaac ccacccaatc 540
ccctccaatc cacatggatt gagatgaaac cgaacaagcc cttagttgga tggatggatg 600
atctcacgcg cttgagttta tctagttgct gatatgggag agcccctcaa cacctcaaat 660
attgtggata agtttaatcc tacactgtca gtcttcagtt ataaggcacg cactcttcga 720
cgttgggcgc tgtcttttgt ttcaaaggtt gaggcaacct caacctcgtt taaaacagag 780
agcaaagcta atttccaaac tgatgtaagt catgtgtcct taattaccaa agtagcaatg 840
atgacattgt tatgttgtgt gctaatgagc cattacgtga acatcagttc ctgccttgcc 900
gcttcgttca gccgggccgg ggtatatttt gagtcactaa aaggacacgt cggatgaatg 960
gaaaattgcc tcttgtcttt accaagagtg tcgcccgcga g 1001
<210> 20
<211> 2037
<212> DNA
<213> 玉米
<400> 20
cgacgtacaa atctcatctg tgccttgctc tagtttccca aatggaatta actatgcatg 60
atttgtttgg aaactcttat tgcatccatc cagataatgc atccaccata aggtaatatc 120
ttgatgacat ctgtgcctga tggtgtacca aatgtctcta tctctgcatt gagccacgag 180
taggaggata gcctaggggt gccttgactc caaagttgta ttgaaaaaga tggatgaagc 240
aggcaaatgc tgcctgaatc catgactcag ggcacagatt ttccactcaa aggaagataa 300
gattgcatta cttcatgatc ttttgaactg cctctgcaag acgggactcg gatagtggat 360
gcaaagatct aatactggcc tcaggcaacg agttgtttca ctcgaaagtc tagaaatgac 420
cgggctcaaa ttttgcaccc caaggaaagt gagtttgcat tacttcatga ccttttgaac 480
tgcctctgca agactggact cagattacgc ttgattggtt gccggcctca ccttcgcctg 540
gcttgcgcga gcctgcgtct atagaaatgc gccggactca cgtctccgtc gatgcaggca 600
ttcgactgaa aaaacattta aactgcaccc atgcgtgcgg gctgagctta tgtcatacaa 660
gtaaccaatc acaggcttaa gttcagtcaa cgcatgcgct aagcttggat gtggctgacc 720
gggcaaccaa tcacacagat agtggatgca cggatctaat attggctaat ttggttaaac 780
ttgtctaacc ttagacgtgg caagtgagtc agcggatcaa atctgctcta aaattgtctg 840
cctcctagat gtccttggtg ttccaagatt taatcatcac tgcactattt ctttgcgttg 900
cttcgctgca gcttcgcgtt acttgcattc gcttaatcag gattactttg atcaactagg 960
tttctaactt ctactacctt cacttgcaca gggtgcccgt cctgctagcc ggtgtgcttg 1020
ctgtgcgatc gtttggcatg tgcttgttga ggggttgcta ggggattgga gaggattgaa 1080
gggattaaat ctcctcctat tcaattttga ataggagggg atttaatccc cttcaatccc 1140
cctcaaacca ctagtaaccg aacgtggcct gagggggcgg gcgagtcttt atattgaatg 1200
aaactacata aaatagcatg ccgtctctgt cactggcaat ggacggtggt gcctagcgca 1260
actcagcgca caactgtgtg tcttgatttt tcttctgttt atcacggcat tagtgccatg 1320
ccgttttatg ttacagtgtt gtgtgctcgc aagcatccga aaatatgcgt ctgagtttag 1380
ggttgggtca aacttgtcga atttggggtt ctgttataat atgttgagca tgaataaaga 1440
tggatgctgg tgactctgtc gccatcgccg tccatcatga gtgtcctgta attcaactta 1500
tatctatcat gtatgtatgt atgtatgtat gtatgtatgt atatgctgtc tactatgctt 1560
ctttgtttta actgaaatgt gtgttacagt gttacttctc tggggtccat ttaaaacggc 1620
atttcgttta cgataggaac cagccattat aatctttaac caataatttc gctaaccaat 1680
ttcaactatt gcaatgcgaa cttaatatta tcagatttat aaccgaatgc gctatcaaat 1740
aatcataagg ttgtaatcat aataatataa tataaaataa atgagtgctc gaagtgaaat 1800
tttagagagc gttataagaa aaattgatgt gatctccaag aataatagcc cctcccggct 1860
cccggtacaa acatagggct tctttagaat gcaggattgt gagaacatag gaataggaaa 1920
aatataggaa ttctatagga atgtatatgg aaaacagagg attgaaaaac acagaaaaaa 1980
tgtgaaagca agtctttgga tgaagcgtag gaaacttata ggaataggaa ttcataa 2037
<210> 21
<211> 16119
<212> DNA
<213> 人工序列
<220>
<223> 重组载体。
<400> 21
attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt 60
taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120
tgtcaaacac tgatagttta aactgaaggc gggaaacgac aatctgatca tgagcggaga 180
attaagggag tcacgttatg acccccgccg atgacgcggg acaagccgtt ttacgtttgg 240
aactgacaga accgcaacgc tgcaggaatt ggccgcagcg gccatttaaa tcaattgggc 300
gcgccagctg cttgtgggga ccagacaaaa aaggaatggt gcagaattgt taggcgcacc 360
taccaaaagc atctttgcct ttattgcaaa gataaagcag attcctctag tacaagtggg 420
gaacaaaata acgtggaaaa gagctgtcct gacagcccac tcactaatgc gtatgacgaa 480
cgcagtgacg accacaaaac tcgagacttt tcaacaaagg gtaatatccg gaaacctcct 540
cggattccat tgcccagcta tctgtcactt tattgtgaag atagtggaaa aggaaggtgg 600
ctcctacaaa tgccatcatt gcgataaagg aaaggctatc gttgaagatg cctctgccga 660
cagtggtccc aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc 720
aaccacgtct tcaaagcaag tggattgatg tgatatctcc actgacgtaa gggatgacga 780
acaatcccac tatccttcgg taccggaccc gagatatgtg atgtatatgt gatatatgtg 840
atgattatgt gatatatttt ttgtttgttt ggatggaata ataaaaacaa ataaaaaggg 900
tatgttggcc acttttggcg agtgtaacac tcagcaaaga ggtactttgc cgagtgtcac 960
agtcatatca ttcggcaaag aaggcacaca tgggaaccga taaagcttct ttgccgagtg 1020
ttgtggcctt agcactcggc aaagaagcaa cttttgccga gagcctccta gtgtactcgg 1080
caaaggaact gacaaaggag cccactgatg attcctttga tgagtggtag tccggcagac 1140
acacggcaaa gataaagtct ttgccgagtg ccacctaata cgcccggcaa aggaactggc 1200
aaaggacaca cgatgagttt atttgtcgag tgctagtaca atagacactc gacaaagagt 1260
gagcctttgc agagtgtcac cgtggcactc ggcaaagtcc actctttgtc gagtgtcacc 1320
gtgacactca gcgaagtctc cgtcgctgtc atctgtcgcc gtgacgtcga cttttttttg 1380
ccgagtaccg agtggttgcc gagtgtccga caaaaaatac tcggttaaag accgttgccg 1440
atgtcagttc accaagacct tttttatcaa gtgtcatact tgataaagtc ttccccaagt 1500
attttcaaaa ctttgtcgat tacctcacac accaaggggt aggatcgtgt tgaggcggtt 1560
tgctgcttgt ttcttgcttt cgccgaacca acggaccatg agcgcataaa ccaatgggcg 1620
agcggccgca tatacaggcc tgcgcggcga gcctcacctt gctggatttg aatgccccct 1680
cggcatggtc aatgaccatg catctttgtg cagaacatat aaaatgcaca aattaattaa 1740
ttaataaaaa tacatgaaag agtacataat ttgtttgtgg attattaatt atatttataa 1800
atatattata gtatattata ttttatcttt atctaactac aaaaataatt atagattgtt 1860
aacttttttt tgcattactg gtaagatttt gtcgatttta taattttgtc taacatgttt 1920
tattatcaat ctaaaattgc aaattatatg ttaacgaact aaatttgtaa taaaatatat 1980
gtaataaagg tcgtctaaaa gtaagctaaa attcacgcac ctaaatttta tttagtaaag 2040
tgttttttct tgacatatga cactagtgtt ttcaaagctt gtctcttaat ttaggattaa 2100
attaataggc ctctctaaat tgctttttat aagataaata aatcctattc cgtctgctca 2160
tcttcaaaga acatttcaat gaaacaaata tttgggaaaa ccaatggaaa aagaataaaa 2220
ataaaaattg aaaaagagaa gtggaggaaa agtagggttc cattccacgg cctgtcgagt 2280
gtcgacccac aaaccacgca accgatatat tccccagcac ccccagtctc cagccgtcca 2340
accgagacac cgcgtgcgaa ccaagcagac cacaacaaga agaagcgtag tcgtcgccgg 2400
aaggaaaggc gcggagcaag atctcgtggc aggcgtacgt cgacgagcac ctgaagtgcg 2460
agatcgaagg acagcatctc agcgccgccg ccatcgtcgg tcacgacggc agcgtttggg 2520
cgcagtccga gagcttcccc gaggtcattc actcccacct tatctcttcc cgctctactt 2580
gcttagttgc tttatccatg ttcagtgctc ctgcgctgat ttagacccgc gcgactctgg 2640
atctgcccca gccgtgcggc ccggccggat cggagcgagg ggatgtccgg atctcggtcg 2700
ctgaggcgag atgcggatct aaggcccctt ccctcggtga cgtggttgct gctgctgctg 2760
ttctccgggc gtttgatgcc aatatagctg agatcaagct tgatgatctg cgtactgtgg 2820
atttgctagt gagggatggc cggatcgggc tgttggcgtc cgacctgatt tggttgttcg 2880
cttgaataga cttacttacc agtggacagt ggtagtgatc gttcagcagc agtagagcaa 2940
tttgttttac atgtaaaatt tgagtggctg ctagagatgc accaatggcc gagctgcatg 3000
tgtttattcc tatatagcga cagttgtgtg attgatccaa aacgcaaaat tttagttttc 3060
atcaaatgat gatttcctga tgccactacc tgtgtgtgag gcacttatta aatgaaaagt 3120
aactttcggt tgggatctgg gaatctgtat tgtgttccgt ggttggtcac agcttgtggc 3180
ctgcattgtt ccataggcca aatggctagg caaggaaaat aaatcatgta atttggaaaa 3240
aaataactgc catagtcagt agtgtacagc agtacatgct tgtccgggcc ttttatttca 3300
ccatcgtgtt gtggtatatg gagtacttgg attgtgcgat gctttataca tttgtttgtt 3360
ctagcagagt ttgagtttat atttctattc ttatgtaggg cgtcacgagt gtcgtcaatt 3420
gttacatcct tacatccttg tgttcacaat atgatccatc aactctttct tctgcggtct 3480
cttatccctg tgttctcatg tccatgtttc ctgcttcttg ttgcagttaa agccttagga 3540
ggtaaaccat ggacaacaac cccaacatca acgagtgcat cccctacaac tgcctgagca 3600
accccgaggt ggaggtgctg ggcggcgagc gcatcgagac cggctacacc cccatcgaca 3660
tcagcctgag cctgacccag ttcctgctga gcgagttcgt gcccggcgcc ggcttcgtgc 3720
tgggcctggt ggacatcatc tggggcatct tcggccccag ccagtgggac gccttcctgg 3780
tgcagatcga gcagctgatc aaccagcgca tcgaggagtt cgcccgcaac caggccatca 3840
gccgcctgga gggcctgagc aacctgtacc aaatctacgc cgagagcttc cgcgagtggg 3900
aggccgaccc caccaacccc gccctgcgcg aggagatgcg catccagttc aacgacatga 3960
acagcgccct gaccaccgcc atccccctgt tcgccgtgca gaactaccag gtgcccctgc 4020
tgagcgtgta cgtgcaggcc gccaacctgc acctgagcgt gctgcgcgac gtcagcgtgt 4080
tcggccagcg ctggggcttc gacgccgcca ccatcaacag ccgctacaac gacctgaccc 4140
gcctgatcgg caactacacc gaccacgccg tgcgctggta caacaccggc ctggagcgcg 4200
tgtggggtcc agacagccgc gactggatca ggtacaacca gttccgccgc gagctgaccc 4260
tgaccgtgct ggacatcgtg agcctgttcc ccaactacga cagccgcacc taccccatcc 4320
gcaccgtgag ccagctgacc cgcgagattt acaccaaccc cgtgctggag aacttcgacg 4380
gcagcttccg cggcagcgcc cagggcatcg agggcagcat ccgcagcccc cacctgatgg 4440
acatcctgaa cagcatcacc atctacaccg acgcccaccg cggcgagtac tactggagcg 4500
gccaccagat catggccagc cccgtcggct tcagcggccc cgagttcacc ttccccctgt 4560
acggcactat gggcaacgct gcacctcagc agcgcatcgt ggcacagctg ggccagggag 4620
tgtaccgcac cctgagcagc accctgtacc gtcgaccttt caacatcggc atcaacaacc 4680
agcagctgag cgtgctggac ggcaccgagt tcgcctacgg caccagcagc aacctgccca 4740
gcgccgtgta ccgcaagagc ggcaccgtgg acagcctgga cgagatcccc cctcagaaca 4800
acaacgtgcc acctcgacag ggcttcagcc accgtctgag ccacgtgagc atgttccgca 4860
gtggcttcag caacagcagc gtgagcatca tccgtgcacc tatgttcagc tggattcacc 4920
gcagtgccga gttcaacaac atcatcccca gcagccagat cacccagatc cccctgacca 4980
agagcaccaa cctgggcagc ggcaccagcg tggtgaaggg ccccggcttc accggcggcg 5040
acatcctgcg ccgcaccagc cccggccaga tcagcaccct gcgcgtgaac atcaccgccc 5100
ccctgagcca gcgctaccgc gtccgcatcc gctacgccag caccaccaac ctgcagttcc 5160
acaccagcat cgacggccgc cccatcaacc agggcaactt cagcgccacc atgagcagcg 5220
gcagcaacct gcagagcggc agcttccgca ccgtgggctt caccaccccc ttcaacttca 5280
gcaacggcag cagcgtgttc accctgagcg cccacgtgtt caacagcggc aacgaggtgt 5340
acatcgaccg catcgagttc gtgcccgccg aggtgacctt cgaggccgag tacgacctgg 5400
agagggctca gaaggccgtg aacgagctgt tcaccagcag caaccagatc ggcctgaaga 5460
ccgacgtgac cgactaccac atcgatcagg tgtaggagct caagttcgtc atgttctgtt 5520
ttggtcattt gggcaccaaa gtttgcgcct catttggttc tgtaatccgt gaggtcgtgc 5580
atgtacttgg cgtattgcat gcagtgaata atttagcttg ggtttgtttg ttgggggcag 5640
tgttggggac ggatttggat tggggtttat gcttggcatc gcgtcgtatc gaaactcagc 5700
tgctgtttcg ctgagtaatg tacatttccc tggtaatggt acttgtggac tctgatgctt 5760
ttatgggaac gagtgcattt tactgccgtg cttggccgtg ctgttgaatt attcccgtag 5820
tgtattaaat attggatgca ccagattgtt tgtcccattt acgcataatt ttcccgtcat 5880
atgttgaatt atttacgaat tataaaatat gtaatttata tttattttta tgaagtatat 5940
aaaattttac ttttttgtta tataattaaa tattttttgt tttgataaaa tggtatgttt 6000
tattttaaat aaaaatctat aaaaaaagat gatatggtgg ctggaaggta acgataaatt 6060
atgtatacta aagtattaac gatagtaaat atagttggac gatagatgat gtgacggggt 6120
ttgttctttt gattttaatc tataatgctt gtctatagat tacagccgca tcaatttaaa 6180
tagctgcttt taatctgaag cgaacaaccg ataaaaatag acattaggcc atctccaaca 6240
gttcgaccgt gcaaagtatt attttgctat tgcactattt gaataatgga ttttagaata 6300
gggagtgata aaaagtgaga taaaaagttt aataaaaata gtcttagatc caacaaatat 6360
acgctgccct cccatcagtt gcctggaccc atgccaagaa gtgccagcca tagtcgtatg 6420
aaaaatgatt ctaagggcgt tcgcaatggt tgtcttaaat agttagctat tgtgaagctg 6480
aaactaagag aagaataaaa atataattta tttcacggac cgcgatcgct taattaagct 6540
tgcatgcctg cagtgcagcg tgacccggtc gtgcccctct ctagagataa tgagcattgc 6600
atgtctaagt tataaaaaat taccacatat tttttttgtc acacttgttt gaagtgcagt 6660
ttatctatct ttatacatat atttaaactt tactctacga ataatataat ctatagtact 6720
acaataatat cagtgtttta gagaatcata taaatgaaca gttagacatg gtctaaagga 6780
caattgagta ttttgacaac aggactctac agttttatct ttttagtgtg catgtgttct 6840
cctttttttt tgcaaatagc ttcacctata taatacttca tccattttat tagtacatcc 6900
atttagggtt tagggttaat ggtttttata gactaatttt tttagtacat ctattttatt 6960
ctattttagc ctctaaatta agaaaactaa aactctattt tagttttttt atttaataat 7020
ttagatataa aatagaataa aataaagtga ctaaaaatta aacaaatacc ctttaagaaa 7080
ttaaaaaaac taaggaaaca tttttcttgt ttcgagtaga taatgccagc ctgttaaacg 7140
ccgtcgacga gtctaacgga caccaaccag cgaaccagca gcgtcgcgtc gggccaagcg 7200
aagcagacgg cacggcatct ctgtcgctgc ctctggaccc ctctcgagag ttccgctcca 7260
ccgttggact tgctccgctg tcggcatcca gaaattgcgt ggcggagcgg cagacgtgag 7320
ccggcacggc aggcggcctc ctcctcctct cacggcaccg gcagctacgg gggattcctt 7380
tcccaccgct ccttcgcttt cccttcctcg cccgccgtaa taaatagaca ccccctccac 7440
accctctttc cccaacctcg tgttgttcgg agcgcacaca cacacaacca gatctccccc 7500
aaatccaccc gtcggcacct ccgcttcaag gtacgccgct cgtcctcccc ccccccccct 7560
ctctaccttc tctagatcgg cgttccggtc catggttagg gcccggtagt tctacttctg 7620
ttcatgtttg tgttagatcc gtgtttgtgt tagatccgtg ctgctagcgt tcgtacacgg 7680
atgcgacctg tacgtcagac acgttctgat tgctaacttg ccagtgtttc tctttgggga 7740
atcctgggat ggctctagcc gttccgcaga cgggatcgat ttcatgattt tttttgtttc 7800
gttgcatagg gtttggtttg cccttttcct ttatttcaat atatgccgtg cacttgtttg 7860
tcgggtcatc ttttcatgct tttttttgtc ttggttgtga tgatgtggtc tggttgggcg 7920
gtcgttctag atcggagtag aattctgttt caaactacct ggtggattta ttaattttgg 7980
atctgtatgt gtgtgccata catattcata gttacgaatt gaagatgatg gatggaaata 8040
tcgatctagg ataggtatac atgttgatgc gggttttact gatgcatata cagagatgct 8100
ttttgttcgc ttggttgtga tgatgtggtg tggttgggcg gtcgttcatt cgttctagat 8160
cggagtagaa tactgtttca aactacctgg tgtatttatt aattttggaa ctgtatgtgt 8220
gtgtcataca tcttcatagt tacgagttta agatggatgg aaatatcgat ctaggatagg 8280
tatacatgtt gatgtgggtt ttactgatgc atatacatga tggcatatgc agcatctatt 8340
catatgctct aaccttgagt acctatctat tataataaac aagtatgttt tataattatt 8400
ttgatcttga tatacttgga tgatggcata tgcagcagct atatgtggat ttttttagcc 8460
ctgccttcat acgctattta tttgcttggt actgtttctt ttgtcgatgc tcaccctgtt 8520
gtttggtgtt acttctgcag ggatccccga tcatgcaaaa actcattaac tcagtgcaaa 8580
actatgcctg gggcagcaaa acggcgttga ctgaacttta tggtatggaa aatccgtcca 8640
gccagccgat ggccgagctg tggatgggcg cacatccgaa aagcagttca cgagtgcaga 8700
atgccgccgg agatatcgtt tcactgcgtg atgtgattga gagtgataaa tcgactctgc 8760
tcggagaggc cgttgccaaa cgctttggcg aactgccttt cctgttcaaa gtattatgcg 8820
cagcacagcc actctccatt caggttcatc caaacaaaca caattctgaa atcggttttg 8880
ccaaagaaaa tgccgcaggt atcccgatgg atgccgccga gcgtaactat aaagatccta 8940
accacaagcc ggagctggtt tttgcgctga cgcctttcct tgcgatgaac gcgtttcgtg 9000
aattttccga gattgtctcc ctactccagc cggtcgcagg tgcacatccg gcgattgctc 9060
actttttaca acagcctgat gccgaacgtt taagcgaact gttcgccagc ctgttgaata 9120
tgcagggtga agaaaaatcc cgcgcgctgg cgattttaaa atcggccctc gatagccagc 9180
agggtgaacc gtggcaaacg attcgtttaa tttctgaatt ttacccggaa gacagcggtc 9240
tgttctcccc gctattgctg aatgtggtga aattgaaccc tggcgaagcg atgttcctgt 9300
tcgctgaaac accgcacgct tacctgcaag gcgtggcgct ggaagtgatg gcaaactccg 9360
ataacgtgct gcgtgcgggt ctgacgccta aatacattga tattccggaa ctggttgcca 9420
atgtgaaatt cgaagccaaa ccggctaacc agttgttgac ccagccggtg aaacaaggtg 9480
cagaactgga cttcccgatt ccagtggatg attttgcctt ctcgctgcat gaccttagtg 9540
ataaagaaac caccattagc cagcagagtg ccgccatttt gttctgcgtc gaaggcgatg 9600
caacgttgtg gaaaggttct cagcagttac agcttaaacc gggtgaatca gcgtttattg 9660
ccgccaacga atcaccggtg actgtcaaag gccacggccg tttagcgcgt gtttacaaca 9720
agctgtaaga gcttactgaa aaaattaaca tctcttgcta agctgggagc tcgtcatggg 9780
tcgtttaagc tgccgatgtg cctgcgtcgt ctggtgccct ctctccatat ggaggttgtc 9840
aaagtatctg ctgttcgtgt catgagtcgt gtcagtgttg gtttaataat ggaccggttg 9900
tgttgtgtgt gcgtactacc cagaactatg acaaatcatg aataagtttg atgtttgaaa 9960
ttaaagcctg tgctcattat gttctgtctt tcagttgtct cctaatattt gcctgcaggt 10020
actggctatc taccgtttct tacttaggag gtgtttgaat gcactaaaac taatagttag 10080
tggctaaaat tagttaaaac atccaaacac catagctaat agttgaacta ttagctattt 10140
ttggaaaatt agttaatagt gaggtagtta tttgttagct agctaattca actaacaatt 10200
tttagccaac taacaattag tttcagtgca ttcaaacacc cccttaatgt taacgtggtt 10260
ctatctaccg tctcctaata tatggttgat tgttcggttt gttgctatgc tattgggttc 10320
tgattgctgc tagttcttgc tgaatccaga agttctcgta gtatagctca gattcatatt 10380
atttatttga gtgataagtg atccaggtta ttactatgtt agctaggttt tttttacaag 10440
gataaattat ctgtgatcat aattcttatg aaagctttat gtttcctgga ggcagtggca 10500
tgcaatgcat gacagcaact tgatcacacc agctgaggta gatacggtaa caaggttctt 10560
aaatctgttc accaaatcat tggagaacac acatacacat tcttgccagt cttggttaga 10620
gaaatttcat gacaaaatgc caaagctgtc ttgactcttc acttttggcc atgagtcgtg 10680
acttagtttg gtttaatgga ccggttctcc tagcttgttc tactcaaaac tgttgttgat 10740
gcgaataagt tgtgatggtt gatctctgga ttttgttttg ctctcaatag tggacgagat 10800
tagatagccc ggaaatttac cggtgcccgg gcggccagca tggccgtatc cgcaatgtgt 10860
tattaagttg tctaagcgtc aatttgttta caccacaata tatcctgcca ccagccagcc 10920
aacagctccc cgaccggcag ctcggcacaa aatcaccact cgatacaggc agcccatcag 10980
aattaattct catgtttgac agcttatcat cgactgcacg gtgcaccaat gcttctggcg 11040
tcaggcagcc atcggaagct gtggtatggc tgtgcaggtc gtaaatcact gcataattcg 11100
tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt gcgccgacat cataacggtt 11160
ctggcaaata ttctgaaatg agctgttgac aattaatcat ccggctcgta taatgtgtgg 11220
aattgtgagc ggataacaat ttcacacagg aaacagacca tgagggaagc gttgatcgcc 11280
gaagtatcga ctcaactatc agaggtagtt ggcgtcatcg agcgccatct cgaaccgacg 11340
ttgctggccg tacatttgta cggctccgca gtggatggcg gcctgaagcc acacagtgat 11400
attgatttgc tggttacggt gaccgtaagg cttgatgaaa caacgcggcg agctttgatc 11460
aacgaccttt tggaaacttc ggcttcccct ggagagagcg agattctccg cgctgtagaa 11520
gtcaccattg ttgtgcacga cgacatcatt ccgtggcgtt atccagctaa gcgcgaactg 11580
caatttggag aatggcagcg caatgacatt cttgcaggta tcttcgagcc agccacgatc 11640
gacattgatc tggctatctt gctgacaaaa gcaagagaac atagcgttgc cttggtaggt 11700
ccagcggcgg aggaactctt tgatccggtt cctgaacagg atctatttga ggcgctaaat 11760
gaaaccttaa cgctatggaa ctcgccgccc gactgggctg gcgatgagcg aaatgtagtg 11820
cttacgttgt cccgcatttg gtacagcgca gtaaccggca aaatcgcgcc gaaggatgtc 11880
gctgccgact gggcaatgga gcgcctgccg gcccagtatc agcccgtcat acttgaagct 11940
aggcaggctt atcttggaca agaagatcgc ttggcctcgc gcgcagatca gttggaagaa 12000
tttgttcact acgtgaaagg cgagatcacc aaagtagtcg gcaaataaag ctctagtgga 12060
tctccgtacc cggggatctg gctcgcggcg gacgcacgac gccggggcga gaccataggc 12120
gatctcctaa atcaatagta gctgtaacct cgaagcgttt cacttgtaac aacgattgag 12180
aatttttgtc ataaaattga aatacttggt tcgcattttt gtcatccgcg gtcagccgca 12240
attctgacga actgcccatt tagctggaga tgattgtaca tccttcacgt gaaaatttct 12300
caagcgctgt gaacaagggt tcagatttta gattgaaagg tgagccgttg aaacacgttc 12360
ttcttgtcga tgacgacgtc gctatgcggc atcttattat tgaatacctt acgatccacg 12420
ccttcaaagt gaccgcggta gccgacagca cccagttcac aagagtactc tcttccgcga 12480
cggtcgatgt cgtggttgtt gatctagatt taggtcgtga agatgggctc gagatcgttc 12540
gtaatctggc ggcaaagtct gatattccaa tcataattat cagtggcgac cgccttgagg 12600
agacggataa agttgttgca ctcgagctag gagcaagtga ttttatcgct aagccgttca 12660
gtatcagaga gtttctagca cgcattcggg ttgccttgcg cgtgcgcccc aacgttgtcc 12720
gctccaaaga ccgacggtct ttttgtttta ctgactggac acttaatctc aggcaacgtc 12780
gcttgatgtc cgaagctggc ggtgaggtga aacttacggc aggtgagttc aatcttctcc 12840
tcgcgttttt agagaaaccc cgcgacgttc tatcgcgcga gcaacttctc attgccagtc 12900
gagtacgcga cgaggaggtt tatgacagga gtatagatgt tctcattttg aggctgcgcc 12960
gcaaacttga ggcagatccg tcaagccctc aactgataaa aacagcaaga ggtgccggtt 13020
atttctttga cgcggacgtg caggtttcgc acggggggac gatggcagcc tgagccaatt 13080
cccagatccc cgaggaatcg gcgtgagcgg tcgcaaacca tccggcccgg tacaaatcgg 13140
cgcggcgctg ggtgatgacc tggtggagaa gttgaaggcc gcgcaggccg cccagcggca 13200
acgcatcgag gcagaagcac gccccggtga atcgtggcaa gcggccgctg atcgaatccg 13260
caaagaatcc cggcaaccgc cggcagccgg tgcgccgtcg attaggaagc cgcccaaggg 13320
cgacgagcaa ccagattttt tcgttccgat gctctatgac gtgggcaccc gcgatagtcg 13380
cagcatcatg gacgtggccg ttttccgtct gtcgaagcgt gaccgacgag ctggcgaggt 13440
gatccgctac gagcttccag acgggcacgt agaggtttcc gcagggccgg ccggcatggc 13500
cagtgtgtgg gattacgacc tggtactgat ggcggtttcc catctaaccg aatccatgaa 13560
ccgataccgg gaagggaagg gagacaagcc cggccgcgtg ttccgtccac acgttgcgga 13620
cgtactcaag ttctgccggc gagccgatgg cggaaagcag aaagacgacc tggtagaaac 13680
ctgcattcgg ttaaacacca cgcacgttgc catgcagcgt acgaagaagg ccaagaacgg 13740
ccgcctggtg acggtatccg agggtgaagc cttgattagc cgctacaaga tcgtaaagag 13800
cgaaaccggg cggccggagt acatcgagat cgagctagct gattggatgt accgcgagat 13860
cacagaaggc aagaacccgg acgtgctgac ggttcacccc gattactttt tgatcgatcc 13920
cggcatcggc cgttttctct accgcctggc acgccgcgcc gcaggcaagg cagaagccag 13980
atggttgttc aagacgatct acgaacgcag tggcagcgcc ggagagttca agaagttctg 14040
tttcaccgtg cgcaagctga tcgggtcaaa tgacctgccg gagtacgatt tgaaggagga 14100
ggcggggcag gctggcccga tcctagtcat gcgctaccgc aacctgatcg agggcgaagc 14160
atccgccggt tcctaatgta cggagcagat gctagggcaa attgccctag caggggaaaa 14220
aggtcgaaaa ggtctctttc ctgtggatag cacgtacatt gggaacccaa agccgtacat 14280
tgggaaccgg aacccgtaca ttgggaaccc aaagccgtac attgggaacc ggtcacacat 14340
gtaagtgact gatataaaag agaaaaaagg cgatttttcc gcctaaaact ctttaaaact 14400
tattaaaact cttaaaaccc gcctggcctg tgcataactg tctggccagc gcacagccga 14460
agagctgcaa aaagcgccta cccttcggtc gctgcgctcc ctacgccccg ccgcttcgcg 14520
tcggcctatc gcggccgctg gccgctcaaa aatggctggc ctacggccag gcaatctacc 14580
agggcgcgga caagccgcgc cgtcgccact cgaccgccgg cgctgaggtc tgcctcgtga 14640
agaaggtgtt gctgactcat accaggcctg aatcgcccca tcatccagcc agaaagtgag 14700
ggagccacgg ttgatgagag ctttgttgta ggtggaccag ttggtgattt tgaacttttg 14760
ctttgccacg gaacggtctg cgttgtcggg aagatgcgtg atctgatcct tcaactcagc 14820
aaaagttcga tttattcaac aaagccgccg tcccgtcaag tcagcgtaat gctctgccag 14880
tgttacaacc aattaaccaa ttctgattag aaaaactcat cgagcatcaa atgaaactgc 14940
aatttattca tatcaggatt atcaatacca tatttttgaa aaagccgttt ctgtaatgaa 15000
ggagaaaact caccgaggca gttccatagg atggcaagat cctggtatcg gtctgcgatt 15060
ccgactcgtc caacatcaat acaacctatt aatttcccct cgtcaaaaat aaggttatca 15120
agtgagaaat caccatgagt gacgactgaa tccggtgaga atggcaaaag ctctgcatta 15180
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 15240
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 15300
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 15360
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 15420
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 15480
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 15540
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 15600
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 15660
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 15720
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 15780
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 15840
cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 15900
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 15960
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 16020
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 16080
aaaaaggatc ttcacctaga tccttttgat ccggaatta 16119
<210> 22
<211> 16210
<212> DNA
<213> 人工序列
<220>
<223> 重组载体
<400> 22
attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt 60
taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120
tgtcaaacac tgatagttta aactgaaggc gggaaacgac aatctgatca tgagcggaga 180
attaagggag tcacgttatg acccccgccg atgacgcggg acaagccgtt ttacgtttgg 240
aactgacaga accgcaacgc tgcaggaatt ggccgcagcg gccatttaaa tcaattgggc 300
gcgccagctg cttgtgggga ccagacaaaa aaggaatggt gcagaattgt taggcgcacc 360
taccaaaagc atctttgcct ttattgcaaa gataaagcag attcctctag tacaagtggg 420
gaacaaaata acgtggaaaa gagctgtcct gacagcccac tcactaatgc gtatgacgaa 480
cgcagtgacg accacaaaac tcgagacttt tcaacaaagg gtaatatccg gaaacctcct 540
cggattccat tgcccagcta tctgtcactt tattgtgaag atagtggaaa aggaaggtgg 600
ctcctacaaa tgccatcatt gcgataaagg aaaggctatc gttgaagatg cctctgccga 660
cagtggtccc aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc 720
aaccacgtct tcaaagcaag tggattgatg tgatatctcc actgacgtaa gggatgacga 780
acaatcccac tatccttcgg taccggaccc tctgcctttc tgttcttcaa acgatgtctc 840
atgtctgcgc tggacaactt tcttgttgcc gcctgtcgct tgcgctgtgc tgactggacg 900
cagctccgga ggtttggttg tgcttggttt tcgtagagaa ctcgccactt gccgcccgca 960
cgttcttggt gtttcctcct ccccgctgtg ttctgcgcac gggctttttc tgagagaccc 1020
atgtttccct tttactttta taaacagtat acatgctatg tttctagaag gaggggaaac 1080
ctaatccccc taatccaatg gcggggagga aatagggtgg ggtggggtgg ggggagggaa 1140
atatctcgct actttttaat ccggacaagc tcatttgcgt ttgcgtctga atgatgatga 1200
ctgcaatgct gatcgcacct cgggtgtcgg atcaccagct tttggctgct ctcaccaaat 1260
cagctgcaag aagattagag cacaaaagaa ttacagaaag agagcctttt tcttttcttc 1320
cttgtggggt tcctttcatt tcgtgctctc ctttctctgc cagccagtcc gtccttgcgt 1380
ccactgcacc tgcacacagg tcaccccgac ccgcactgtt ctagactcca ttagaaaaaa 1440
aaaggtctga acctttccga aaccagccag ccattggtct ggcaggccag catatgctaa 1500
ttggattttt ttgccgcatc attgagtgcg ccatcaggat ttggaaatcc tggttttgag 1560
taatacagta atttggcatt atccattgcc gaattcccaa gctccgtcag cttgaacgtg 1620
gacccctacc atctgcacca gctcggcacc tcacgctcgc agcgctagga gcctaggagc 1680
agctgcccgt ctatttattg gtccctctcc cgtcccagag aaaccctccc tccctcctcc 1740
attggactgc ttgctccctg ttgaccattg gggtatgctt gctgccttgc tctcctgttc 1800
atctccgtgc taaacctctg tcctctgggt gggtttttgc tgggattttg agctaatctg 1860
ctggtcccgg tagaaaaaga tcatgtcccc tgacgtgctc aagcgctcgc cttagccgcg 1920
tccttgcccc ccgccatttt ttgcggtttc ggtgtgttcc cgtgactcgc cgggtgcgtc 1980
atcgcctgaa tcttgtctgg gctctgctga catgttcttg gctagttggg tttatagatt 2040
cctctgatct aaaccgtgcc tgtgctgcgc acagaactct cccctgtcct ttcctggggt 2100
tttggttacg tggtggtagt aagcttggat ttgcacatgg ataaagttgt tctaagctcc 2160
gtgggttgct tgagatcttg ctgttattgc gtgccgtgct cacttttttt gcaatccgag 2220
gaatgaattt gtcgtttact cgttttggtg gattattagc gcgaaaaaaa aactcttttt 2280
tttttgttct tttactacga aaagcatctt cttggatttt gctatcttct tttactacga 2340
aaaactcttg agtctaggaa tttgaatttg tgatgtccat tcttgcagtg cgctgtgctt 2400
tattgggaag ccaaatccta ttattttctg cctctagggt ctgaatggaa tcagtactct 2460
tgagacagaa aatcaatcca atcaagttga tttctttctt taaaaatatt atcacagaac 2520
taagtgcttg tgcggaatca gtactggctt ttgtttggtg gaggatcaat acttgctttt 2580
gtttgggggt ggcaactgtt ttgctataag attccatgtg ttcctgttga gatgaatcat 2640
atatagtata gctgcatact acaaatctgt ttttcaaatt taggttgctt tggcatgatc 2700
tatttttttg tcagacagac tttctaagtg gtagctcttg atttcttgtt cttgtacaac 2760
tggtgctgct gaatcttgac cgtatagctc gaattgcagt attctgaacc atcgagccaa 2820
ggctgccaag ctgactcgcc tccacagtct tcgcgaacgc cttggtgcca ccttctcctc 2880
ccatcccaat gaactgatag cactcttttc caggtgggct taccaaaatc atataacttg 2940
catttcattc ggtactgaaa gttgttaatt tgttattctc ttcatgcctg tcttaatagc 3000
acacccagat gtaaacacga gattatgcaa cttcttactt ggtttctttt gttggcacca 3060
tcatgcatgc taattgctaa ggatgttacc tattcatcct tgactcatat tatcatatgt 3120
aatgatttta tgatcacgag actattgatt gtgaagcata gtatagctgt tcttcagttt 3180
ttgtaccctt ttgttttttt ccttaagcta gaactggtac aatttagttg ataagacagt 3240
gtagtttgta gtacgtcatt tgacagattg tttgtcttta gctggtaaag tgccatttaa 3300
tatctgtatc cttcagatct aataaaaagg atatgagatg tccatcacaa gaggggaaaa 3360
attacatgat ctgagatgta acatccgttt ttatttgtga aataccactt ctacaggtat 3420
cttcactagg gtaaaccatg gacaacaacc ccaacatcaa cgagtgcatc ccctacaact 3480
gcctgagcaa ccccgaggtg gaggtgctgg gcggcgagcg catcgagacc ggctacaccc 3540
ccatcgacat cagcctgagc ctgacccagt tcctgctgag cgagttcgtg cccggcgccg 3600
gcttcgtgct gggcctggtg gacatcatct ggggcatctt cggccccagc cagtgggacg 3660
ccttcctggt gcagatcgag cagctgatca accagcgcat cgaggagttc gcccgcaacc 3720
aggccatcag ccgcctggag ggcctgagca acctgtacca aatctacgcc gagagcttcc 3780
gcgagtggga ggccgacccc accaaccccg ccctgcgcga ggagatgcgc atccagttca 3840
acgacatgaa cagcgccctg accaccgcca tccccctgtt cgccgtgcag aactaccagg 3900
tgcccctgct gagcgtgtac gtgcaggccg ccaacctgca cctgagcgtg ctgcgcgacg 3960
tcagcgtgtt cggccagcgc tggggcttcg acgccgccac catcaacagc cgctacaacg 4020
acctgacccg cctgatcggc aactacaccg accacgccgt gcgctggtac aacaccggcc 4080
tggagcgcgt gtggggtcca gacagccgcg actggatcag gtacaaccag ttccgccgcg 4140
agctgaccct gaccgtgctg gacatcgtga gcctgttccc caactacgac agccgcacct 4200
accccatccg caccgtgagc cagctgaccc gcgagattta caccaacccc gtgctggaga 4260
acttcgacgg cagcttccgc ggcagcgccc agggcatcga gggcagcatc cgcagccccc 4320
acctgatgga catcctgaac agcatcacca tctacaccga cgcccaccgc ggcgagtact 4380
actggagcgg ccaccagatc atggccagcc ccgtcggctt cagcggcccc gagttcacct 4440
tccccctgta cggcactatg ggcaacgctg cacctcagca gcgcatcgtg gcacagctgg 4500
gccagggagt gtaccgcacc ctgagcagca ccctgtaccg tcgacctttc aacatcggca 4560
tcaacaacca gcagctgagc gtgctggacg gcaccgagtt cgcctacggc accagcagca 4620
acctgcccag cgccgtgtac cgcaagagcg gcaccgtgga cagcctggac gagatccccc 4680
ctcagaacaa caacgtgcca cctcgacagg gcttcagcca ccgtctgagc cacgtgagca 4740
tgttccgcag tggcttcagc aacagcagcg tgagcatcat ccgtgcacct atgttcagct 4800
ggattcaccg cagtgccgag ttcaacaaca tcatccccag cagccagatc acccagatcc 4860
ccctgaccaa gagcaccaac ctgggcagcg gcaccagcgt ggtgaagggc cccggcttca 4920
ccggcggcga catcctgcgc cgcaccagcc ccggccagat cagcaccctg cgcgtgaaca 4980
tcaccgcccc cctgagccag cgctaccgcg tccgcatccg ctacgccagc accaccaacc 5040
tgcagttcca caccagcatc gacggccgcc ccatcaacca gggcaacttc agcgccacca 5100
tgagcagcgg cagcaacctg cagagcggca gcttccgcac cgtgggcttc accaccccct 5160
tcaacttcag caacggcagc agcgtgttca ccctgagcgc ccacgtgttc aacagcggca 5220
acgaggtgta catcgaccgc atcgagttcg tgcccgccga ggtgaccttc gaggccgagt 5280
acgacctgga gagggctcag aaggccgtga acgagctgtt caccagcagc aaccagatcg 5340
gcctgaagac cgacgtgacc gactaccaca tcgatcaggt gtaggagctc tacggggaaa 5400
gaaggagaag aagaagaaga agcccaggcc ggagaaccat cgcctgcatt tcgatctgtt 5460
tcaccgcaat tcgcattgtt agtcgtgtat tggagttatg tgtacttggt ttccaagaac 5520
tttggttcct tctcgttttt ttttccttgc ttgtttgagc gtttttgggc agcgctggcc 5580
tggttcctag tatggtggga attggctgca ccttttgctt cgaataaaaa tgcctgctcg 5640
ttcacctgtc ttccagagtg caatgcgatg ttctgttgcc caggtcgtgt ggttctgact 5700
gatggcgatg ttgtgttctt ctgttaatcg cctgttttaa cgtggtaggc tgatgcttgt 5760
tcttgttgag aaagcttgct gtgccagaca tggctgcttg aatacaagtg aaggaaaaaa 5820
aaagccatgc caagtaaagt tgcacaaaat ttcaactgct cagtggacca ctggaccatg 5880
ttcttggtta ttgcagttgc agggcttcac atggcgtttg gacagcagtc ttggattgat 5940
gcataaagag gtggtggtta atgaggacgc aaggccgttc cctcagagtc agtcacaagg 6000
ttgcagaggt cacggttctc ttccctttcc gcttcctgtc acatcggaat tgttgtttac 6060
gccatctgcc catcacccac caagtctatg tttctgtact ggatctttca atggcggaac 6120
gcgcttagtt cttcgtcaca gtcgaatcac atgatctaat cgatgtcttt aatctcgctg 6180
taaaaagggt gggacggtgg gtgcagggta gggaccaggg aaggcctgcc taaacgtatc 6240
cataaacatg cacagcaacc ctaagatatt atactgccta cttcctaaga tatagttatt 6300
tctagtctat tttttttccg tccacatcca aataagtgat aatatataga catacatata 6360
tatactatat tcatcataga ttaatgaacg aatgtatact tagtttaaac ctaattatat 6420
tttaggaagg atggagtatg aaacatgaca atacaacaaa aaaaaatcat gtaattgcat 6480
atcgtcaaag ttatctgaag taaccaatcc agggggaaat cccgttagca aacatacaag 6540
agcaccgccc cactacatcc cagaaaataa aacaaaacca gaactcagat ggataaataa 6600
tactaccgga ccgcgatcgc ttaattaagc ttgcatgcct gcagtgcagc gtgacccggt 6660
cgtgcccctc tctagagata atgagcattg catgtctaag ttataaaaaa ttaccacata 6720
ttttttttgt cacacttgtt tgaagtgcag tttatctatc tttatacata tatttaaact 6780
ttactctacg aataatataa tctatagtac tacaataata tcagtgtttt agagaatcat 6840
ataaatgaac agttagacat ggtctaaagg acaattgagt attttgacaa caggactcta 6900
cagttttatc tttttagtgt gcatgtgttc tccttttttt ttgcaaatag cttcacctat 6960
ataatacttc atccatttta ttagtacatc catttagggt ttagggttaa tggtttttat 7020
agactaattt ttttagtaca tctattttat tctattttag cctctaaatt aagaaaacta 7080
aaactctatt ttagtttttt tatttaataa tttagatata aaatagaata aaataaagtg 7140
actaaaaatt aaacaaatac cctttaagaa attaaaaaaa ctaaggaaac atttttcttg 7200
tttcgagtag ataatgccag cctgttaaac gccgtcgacg agtctaacgg acaccaacca 7260
gcgaaccagc agcgtcgcgt cgggccaagc gaagcagacg gcacggcatc tctgtcgctg 7320
cctctggacc cctctcgaga gttccgctcc accgttggac ttgctccgct gtcggcatcc 7380
agaaattgcg tggcggagcg gcagacgtga gccggcacgg caggcggcct cctcctcctc 7440
tcacggcacc ggcagctacg ggggattcct ttcccaccgc tccttcgctt tcccttcctc 7500
gcccgccgta ataaatagac accccctcca caccctcttt ccccaacctc gtgttgttcg 7560
gagcgcacac acacacaacc agatctcccc caaatccacc cgtcggcacc tccgcttcaa 7620
ggtacgccgc tcgtcctccc cccccccccc tctctacctt ctctagatcg gcgttccggt 7680
ccatggttag ggcccggtag ttctacttct gttcatgttt gtgttagatc cgtgtttgtg 7740
ttagatccgt gctgctagcg ttcgtacacg gatgcgacct gtacgtcaga cacgttctga 7800
ttgctaactt gccagtgttt ctctttgggg aatcctggga tggctctagc cgttccgcag 7860
acgggatcga tttcatgatt ttttttgttt cgttgcatag ggtttggttt gcccttttcc 7920
tttatttcaa tatatgccgt gcacttgttt gtcgggtcat cttttcatgc ttttttttgt 7980
cttggttgtg atgatgtggt ctggttgggc ggtcgttcta gatcggagta gaattctgtt 8040
tcaaactacc tggtggattt attaattttg gatctgtatg tgtgtgccat acatattcat 8100
agttacgaat tgaagatgat ggatggaaat atcgatctag gataggtata catgttgatg 8160
cgggttttac tgatgcatat acagagatgc tttttgttcg cttggttgtg atgatgtggt 8220
gtggttgggc ggtcgttcat tcgttctaga tcggagtaga atactgtttc aaactacctg 8280
gtgtatttat taattttgga actgtatgtg tgtgtcatac atcttcatag ttacgagttt 8340
aagatggatg gaaatatcga tctaggatag gtatacatgt tgatgtgggt tttactgatg 8400
catatacatg atggcatatg cagcatctat tcatatgctc taaccttgag tacctatcta 8460
ttataataaa caagtatgtt ttataattat tttgatcttg atatacttgg atgatggcat 8520
atgcagcagc tatatgtgga tttttttagc cctgccttca tacgctattt atttgcttgg 8580
tactgtttct tttgtcgatg ctcaccctgt tgtttggtgt tacttctgca gggatccccg 8640
atcatgcaaa aactcattaa ctcagtgcaa aactatgcct ggggcagcaa aacggcgttg 8700
actgaacttt atggtatgga aaatccgtcc agccagccga tggccgagct gtggatgggc 8760
gcacatccga aaagcagttc acgagtgcag aatgccgccg gagatatcgt ttcactgcgt 8820
gatgtgattg agagtgataa atcgactctg ctcggagagg ccgttgccaa acgctttggc 8880
gaactgcctt tcctgttcaa agtattatgc gcagcacagc cactctccat tcaggttcat 8940
ccaaacaaac acaattctga aatcggtttt gccaaagaaa atgccgcagg tatcccgatg 9000
gatgccgccg agcgtaacta taaagatcct aaccacaagc cggagctggt ttttgcgctg 9060
acgcctttcc ttgcgatgaa cgcgtttcgt gaattttccg agattgtctc cctactccag 9120
ccggtcgcag gtgcacatcc ggcgattgct cactttttac aacagcctga tgccgaacgt 9180
ttaagcgaac tgttcgccag cctgttgaat atgcagggtg aagaaaaatc ccgcgcgctg 9240
gcgattttaa aatcggccct cgatagccag cagggtgaac cgtggcaaac gattcgttta 9300
atttctgaat tttacccgga agacagcggt ctgttctccc cgctattgct gaatgtggtg 9360
aaattgaacc ctggcgaagc gatgttcctg ttcgctgaaa caccgcacgc ttacctgcaa 9420
ggcgtggcgc tggaagtgat ggcaaactcc gataacgtgc tgcgtgcggg tctgacgcct 9480
aaatacattg atattccgga actggttgcc aatgtgaaat tcgaagccaa accggctaac 9540
cagttgttga cccagccggt gaaacaaggt gcagaactgg acttcccgat tccagtggat 9600
gattttgcct tctcgctgca tgaccttagt gataaagaaa ccaccattag ccagcagagt 9660
gccgccattt tgttctgcgt cgaaggcgat gcaacgttgt ggaaaggttc tcagcagtta 9720
cagcttaaac cgggtgaatc agcgtttatt gccgccaacg aatcaccggt gactgtcaaa 9780
ggccacggcc gtttagcgcg tgtttacaac aagctgtaag agcttactga aaaaattaac 9840
atctcttgct aagctgggag ctcgtcatgg gtcgtttaag ctgccgatgt gcctgcgtcg 9900
tctggtgccc tctctccata tggaggttgt caaagtatct gctgttcgtg tcatgagtcg 9960
tgtcagtgtt ggtttaataa tggaccggtt gtgttgtgtg tgcgtactac ccagaactat 10020
gacaaatcat gaataagttt gatgtttgaa attaaagcct gtgctcatta tgttctgtct 10080
ttcagttgtc tcctaatatt tgcctgcagg tactggctat ctaccgtttc ttacttagga 10140
ggtgtttgaa tgcactaaaa ctaatagtta gtggctaaaa ttagttaaaa catccaaaca 10200
ccatagctaa tagttgaact attagctatt tttggaaaat tagttaatag tgaggtagtt 10260
atttgttagc tagctaattc aactaacaat ttttagccaa ctaacaatta gtttcagtgc 10320
attcaaacac ccccttaatg ttaacgtggt tctatctacc gtctcctaat atatggttga 10380
ttgttcggtt tgttgctatg ctattgggtt ctgattgctg ctagttcttg ctgaatccag 10440
aagttctcgt agtatagctc agattcatat tatttatttg agtgataagt gatccaggtt 10500
attactatgt tagctaggtt ttttttacaa ggataaatta tctgtgatca taattcttat 10560
gaaagcttta tgtttcctgg aggcagtggc atgcaatgca tgacagcaac ttgatcacac 10620
cagctgaggt agatacggta acaaggttct taaatctgtt caccaaatca ttggagaaca 10680
cacatacaca ttcttgccag tcttggttag agaaatttca tgacaaaatg ccaaagctgt 10740
cttgactctt cacttttggc catgagtcgt gacttagttt ggtttaatgg accggttctc 10800
ctagcttgtt ctactcaaaa ctgttgttga tgcgaataag ttgtgatggt tgatctctgg 10860
attttgtttt gctctcaata gtggacgaga ttagatagcc cggaaattta ccggtgcccg 10920
ggcggccagc atggccgtat ccgcaatgtg ttattaagtt gtctaagcgt caatttgttt 10980
acaccacaat atatcctgcc accagccagc caacagctcc ccgaccggca gctcggcaca 11040
aaatcaccac tcgatacagg cagcccatca gaattaattc tcatgtttga cagcttatca 11100
tcgactgcac ggtgcaccaa tgcttctggc gtcaggcagc catcggaagc tgtggtatgg 11160
ctgtgcaggt cgtaaatcac tgcataattc gtgtcgctca aggcgcactc ccgttctgga 11220
taatgttttt tgcgccgaca tcataacggt tctggcaaat attctgaaat gagctgttga 11280
caattaatca tccggctcgt ataatgtgtg gaattgtgag cggataacaa tttcacacag 11340
gaaacagacc atgagggaag cgttgatcgc cgaagtatcg actcaactat cagaggtagt 11400
tggcgtcatc gagcgccatc tcgaaccgac gttgctggcc gtacatttgt acggctccgc 11460
agtggatggc ggcctgaagc cacacagtga tattgatttg ctggttacgg tgaccgtaag 11520
gcttgatgaa acaacgcggc gagctttgat caacgacctt ttggaaactt cggcttcccc 11580
tggagagagc gagattctcc gcgctgtaga agtcaccatt gttgtgcacg acgacatcat 11640
tccgtggcgt tatccagcta agcgcgaact gcaatttgga gaatggcagc gcaatgacat 11700
tcttgcaggt atcttcgagc cagccacgat cgacattgat ctggctatct tgctgacaaa 11760
agcaagagaa catagcgttg ccttggtagg tccagcggcg gaggaactct ttgatccggt 11820
tcctgaacag gatctatttg aggcgctaaa tgaaacctta acgctatgga actcgccgcc 11880
cgactgggct ggcgatgagc gaaatgtagt gcttacgttg tcccgcattt ggtacagcgc 11940
agtaaccggc aaaatcgcgc cgaaggatgt cgctgccgac tgggcaatgg agcgcctgcc 12000
ggcccagtat cagcccgtca tacttgaagc taggcaggct tatcttggac aagaagatcg 12060
cttggcctcg cgcgcagatc agttggaaga atttgttcac tacgtgaaag gcgagatcac 12120
caaagtagtc ggcaaataaa gctctagtgg atctccgtac ccggggatct ggctcgcggc 12180
ggacgcacga cgccggggcg agaccatagg cgatctccta aatcaatagt agctgtaacc 12240
tcgaagcgtt tcacttgtaa caacgattga gaatttttgt cataaaattg aaatacttgg 12300
ttcgcatttt tgtcatccgc ggtcagccgc aattctgacg aactgcccat ttagctggag 12360
atgattgtac atccttcacg tgaaaatttc tcaagcgctg tgaacaaggg ttcagatttt 12420
agattgaaag gtgagccgtt gaaacacgtt cttcttgtcg atgacgacgt cgctatgcgg 12480
catcttatta ttgaatacct tacgatccac gccttcaaag tgaccgcggt agccgacagc 12540
acccagttca caagagtact ctcttccgcg acggtcgatg tcgtggttgt tgatctagat 12600
ttaggtcgtg aagatgggct cgagatcgtt cgtaatctgg cggcaaagtc tgatattcca 12660
atcataatta tcagtggcga ccgccttgag gagacggata aagttgttgc actcgagcta 12720
ggagcaagtg attttatcgc taagccgttc agtatcagag agtttctagc acgcattcgg 12780
gttgccttgc gcgtgcgccc caacgttgtc cgctccaaag accgacggtc tttttgtttt 12840
actgactgga cacttaatct caggcaacgt cgcttgatgt ccgaagctgg cggtgaggtg 12900
aaacttacgg caggtgagtt caatcttctc ctcgcgtttt tagagaaacc ccgcgacgtt 12960
ctatcgcgcg agcaacttct cattgccagt cgagtacgcg acgaggaggt ttatgacagg 13020
agtatagatg ttctcatttt gaggctgcgc cgcaaacttg aggcagatcc gtcaagccct 13080
caactgataa aaacagcaag aggtgccggt tatttctttg acgcggacgt gcaggtttcg 13140
cacgggggga cgatggcagc ctgagccaat tcccagatcc ccgaggaatc ggcgtgagcg 13200
gtcgcaaacc atccggcccg gtacaaatcg gcgcggcgct gggtgatgac ctggtggaga 13260
agttgaaggc cgcgcaggcc gcccagcggc aacgcatcga ggcagaagca cgccccggtg 13320
aatcgtggca agcggccgct gatcgaatcc gcaaagaatc ccggcaaccg ccggcagccg 13380
gtgcgccgtc gattaggaag ccgcccaagg gcgacgagca accagatttt ttcgttccga 13440
tgctctatga cgtgggcacc cgcgatagtc gcagcatcat ggacgtggcc gttttccgtc 13500
tgtcgaagcg tgaccgacga gctggcgagg tgatccgcta cgagcttcca gacgggcacg 13560
tagaggtttc cgcagggccg gccggcatgg ccagtgtgtg ggattacgac ctggtactga 13620
tggcggtttc ccatctaacc gaatccatga accgataccg ggaagggaag ggagacaagc 13680
ccggccgcgt gttccgtcca cacgttgcgg acgtactcaa gttctgccgg cgagccgatg 13740
gcggaaagca gaaagacgac ctggtagaaa cctgcattcg gttaaacacc acgcacgttg 13800
ccatgcagcg tacgaagaag gccaagaacg gccgcctggt gacggtatcc gagggtgaag 13860
ccttgattag ccgctacaag atcgtaaaga gcgaaaccgg gcggccggag tacatcgaga 13920
tcgagctagc tgattggatg taccgcgaga tcacagaagg caagaacccg gacgtgctga 13980
cggttcaccc cgattacttt ttgatcgatc ccggcatcgg ccgttttctc taccgcctgg 14040
cacgccgcgc cgcaggcaag gcagaagcca gatggttgtt caagacgatc tacgaacgca 14100
gtggcagcgc cggagagttc aagaagttct gtttcaccgt gcgcaagctg atcgggtcaa 14160
atgacctgcc ggagtacgat ttgaaggagg aggcggggca ggctggcccg atcctagtca 14220
tgcgctaccg caacctgatc gagggcgaag catccgccgg ttcctaatgt acggagcaga 14280
tgctagggca aattgcccta gcaggggaaa aaggtcgaaa aggtctcttt cctgtggata 14340
gcacgtacat tgggaaccca aagccgtaca ttgggaaccg gaacccgtac attgggaacc 14400
caaagccgta cattgggaac cggtcacaca tgtaagtgac tgatataaaa gagaaaaaag 14460
gcgatttttc cgcctaaaac tctttaaaac ttattaaaac tcttaaaacc cgcctggcct 14520
gtgcataact gtctggccag cgcacagccg aagagctgca aaaagcgcct acccttcggt 14580
cgctgcgctc cctacgcccc gccgcttcgc gtcggcctat cgcggccgct ggccgctcaa 14640
aaatggctgg cctacggcca ggcaatctac cagggcgcgg acaagccgcg ccgtcgccac 14700
tcgaccgccg gcgctgaggt ctgcctcgtg aagaaggtgt tgctgactca taccaggcct 14760
gaatcgcccc atcatccagc cagaaagtga gggagccacg gttgatgaga gctttgttgt 14820
aggtggacca gttggtgatt ttgaactttt gctttgccac ggaacggtct gcgttgtcgg 14880
gaagatgcgt gatctgatcc ttcaactcag caaaagttcg atttattcaa caaagccgcc 14940
gtcccgtcaa gtcagcgtaa tgctctgcca gtgttacaac caattaacca attctgatta 15000
gaaaaactca tcgagcatca aatgaaactg caatttattc atatcaggat tatcaatacc 15060
atatttttga aaaagccgtt tctgtaatga aggagaaaac tcaccgaggc agttccatag 15120
gatggcaaga tcctggtatc ggtctgcgat tccgactcgt ccaacatcaa tacaacctat 15180
taatttcccc tcgtcaaaaa taaggttatc aagtgagaaa tcaccatgag tgacgactga 15240
atccggtgag aatggcaaaa gctctgcatt aatgaatcgg ccaacgcgcg gggagaggcg 15300
gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 15360
ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 15420
gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 15480
aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 15540
gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 15600
ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 15660
cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 15720
cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 15780
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 15840
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 15900
agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg 15960
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 16020
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 16080
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 16140
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttga 16200
tccggaatta 16210
<210> 23
<211> 15881
<212> DNA
<213> 人工序列
<220>
<223> 重组载体
<400> 23
attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt 60
taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120
tgtcaaacac tgatagttta aactgaaggc gggaaacgac aatctgatca tgagcggaga 180
attaagggag tcacgttatg acccccgccg atgacgcggg acaagccgtt ttacgtttgg 240
aactgacaga accgcaacgc tgcaggaatt ggccgcagcg gccatttaaa tcaattgggc 300
gcgccagctg cttgtgggga ccagacaaaa aaggaatggt gcagaattgt taggcgcacc 360
taccaaaagc atctttgcct ttattgcaaa gataaagcag attcctctag tacaagtggg 420
gaacaaaata acgtggaaaa gagctgtcct gacagcccac tcactaatgc gtatgacgaa 480
cgcagtgacg accacaaaac tcgagacttt tcaacaaagg gtaatatccg gaaacctcct 540
cggattccat tgcccagcta tctgtcactt tattgtgaag atagtggaaa aggaaggtgg 600
ctcctacaaa tgccatcatt gcgataaagg aaaggctatc gttgaagatg cctctgccga 660
cagtggtccc aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc 720
aaccacgtct tcaaagcaag tggattgatg tgatatctcc actgacgtaa gggatgacga 780
acaatcccac tatccttcgg taccggaccc atgccttacg atcatctgac atcttaaata 840
tttcaaactg cagtatttca aaaactgtgg ttttgtcaaa aactttgttc ccaaactgag 900
actaaaatgt agtgctagat aataaggcct tacccgttgg aatgacaaaa aagaaacaga 960
aaacacctga aaaatagtat tgccttggct ctaaattata aatcgttttg gttttattta 1020
atatctattt tttaagcata ctaaaatcta tgtacctatg aaaaataaaa tatgaactac 1080
aatttaagac tgagtacagt gtacagcgat aagttatatg aaccacaatt gtttttgaaa 1140
ggaaaaaaac taaattgaca agagaaacaa tcaactcttt tagaaacttt gtataccaaa 1200
aaacgaaata aagaagaaga aaaaaataca cacgatgagt ttattagccc acaaaacatg 1260
aaaaaaaatg agagttaaag cctaactcag gcccacaaag aatcacaagc gcccatattc 1320
acagccgccg aaaggtttcg gcccccagtt ggatctcaga gcccagtgtg aaataggact 1380
gacttgtctc tgatggttac gttacgtagg gattgaaaca aacaggcagt gagccgatgt 1440
ggcagaccgg agcgcagaag cgacgacgac catgaactga aggcgctggc agtgggccat 1500
gcgcccagaa cgctgacgaa ccacgacgac gcggacgttc tacgaggtcg gtggggccgt 1560
cggcagcccg ccggagcata ttcgccgtcg acagaggcag agaaggggaa tgtgtgggag 1620
catattccac ccgtgggaag cctcggagtc ggagatgtgc agatctgccg gacgcacatg 1680
cgcacagctg ccgcaataga aaccagtgtc tttttatttt attttataag aaaaaactag 1740
aaaagaaaat ccagtcttct atacaggcct gcacagagag agaggaggga aggtcaaatc 1800
gtagaaaaaa aatgcttcct tttattgtta cgacattggc ctgaatatat actcattgtt 1860
tctttcctta acttcaacaa ttattgattt tgacaatcca ttttttattt tagttcgcca 1920
aggttttggt tggagaagaa tttaaaacct agccaagcag tcgagcacga gagccgccgc 1980
cgccgccgcc gccgttggca ggacctgctg acctctgacg accggacacg gacgttttcc 2040
aaagtccaaa ctcggggtag gtaggtcgtg aggctgctgc gttcgccaag ggaagaagca 2100
tctagttgaa gctagaaacg ggcagggggg aggggccgac gctatcggaa atctgaagcc 2160
cagcacggac ggacggacgg gcaggggcgg cggcacatcc tcgtctgacc gccgcgccgc 2220
gtccgacatg cgcaagctgc tgctcttccc gcgcccccac ggcggccggg ccggcagagc 2280
acgggacgcg cggggcgggc ctgacgtcgt tttcacgtgg tccgtcaccg ttgcttgcat 2340
agcgtacagg agtatagtcc catttccgaa accaaaaaaa gtaaacaaaa aaatgccgtc 2400
gcattagttg gctggcaagg gaagaccaag atggttttca aatcaaacat gtaaaaaaat 2460
gtttctttct tttttgaacg aacttaccag ttcgaattct ttaccggcat tattggttta 2520
aattgttccc caagaaagaa agaaaagaaa agcgggggga aatatgcctt ccttccttct 2580
tgcgtcacag accacgcgcg gatacaccgc acaacagcca ggcagcaagc agagcaccca 2640
ccgccggaag cggccgtcgg acagaacgac acgtggggca cggcacagtc cgggcccgca 2700
cgtcatcgaa gacacctgac ctgcccatgc gtcttctaga gaaaggcgga cggacaggtc 2760
acccccgcac ctcattccag gagttgcatt tcgctttctc ctttatttat ttataccaat 2820
aaaaaataaa tccgcctttt ctcctcccta tcgtgtgtct tcctctcgcc ggctttaaaa 2880
acgcacacaa gcgctaaaac cctctccacc gtccacctca gctcccatat ccgctcccct 2940
acctctccag catcctcccg tctccgtcgt ctcgtctccg ctcctcacct cgccgctagc 3000
caagggtaac tcctcgctcc cggccggccc ccgcgtcggg gttttccatt tactactact 3060
cgctgctccc tcctgctccg tgctcagact cagatccgac caaagcggtt tcgctgacta 3120
aattctcctt cgtttttttt tctttttctg gacggattcc tggacgcagg caagatcaag 3180
atcggaatca acggtgagtc tgtaccccca acacaaactc gttcttcctg ctcggttcgt 3240
tgggtctgga ctctggagtg atctgagtgg ggtctctgcg cgcctgcgtg ctcaggtttc 3300
tgaaggatcg gcagtaaacc atggacaaca accccaacat caacgagtgc atcccctaca 3360
actgcctgag caaccccgag gtggaggtgc tgggcggcga gcgcatcgag accggctaca 3420
cccccatcga catcagcctg agcctgaccc agttcctgct gagcgagttc gtgcccggcg 3480
ccggcttcgt gctgggcctg gtggacatca tctggggcat cttcggcccc agccagtggg 3540
acgccttcct ggtgcagatc gagcagctga tcaaccagcg catcgaggag ttcgcccgca 3600
accaggccat cagccgcctg gagggcctga gcaacctgta ccaaatctac gccgagagct 3660
tccgcgagtg ggaggccgac cccaccaacc ccgccctgcg cgaggagatg cgcatccagt 3720
tcaacgacat gaacagcgcc ctgaccaccg ccatccccct gttcgccgtg cagaactacc 3780
aggtgcccct gctgagcgtg tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg 3840
acgtcagcgt gttcggccag cgctggggct tcgacgccgc caccatcaac agccgctaca 3900
acgacctgac ccgcctgatc ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg 3960
gcctggagcg cgtgtggggt ccagacagcc gcgactggat caggtacaac cagttccgcc 4020
gcgagctgac cctgaccgtg ctggacatcg tgagcctgtt ccccaactac gacagccgca 4080
cctaccccat ccgcaccgtg agccagctga cccgcgagat ttacaccaac cccgtgctgg 4140
agaacttcga cggcagcttc cgcggcagcg cccagggcat cgagggcagc atccgcagcc 4200
cccacctgat ggacatcctg aacagcatca ccatctacac cgacgcccac cgcggcgagt 4260
actactggag cggccaccag atcatggcca gccccgtcgg cttcagcggc cccgagttca 4320
ccttccccct gtacggcact atgggcaacg ctgcacctca gcagcgcatc gtggcacagc 4380
tgggccaggg agtgtaccgc accctgagca gcaccctgta ccgtcgacct ttcaacatcg 4440
gcatcaacaa ccagcagctg agcgtgctgg acggcaccga gttcgcctac ggcaccagca 4500
gcaacctgcc cagcgccgtg taccgcaaga gcggcaccgt ggacagcctg gacgagatcc 4560
cccctcagaa caacaacgtg ccacctcgac agggcttcag ccaccgtctg agccacgtga 4620
gcatgttccg cagtggcttc agcaacagca gcgtgagcat catccgtgca cctatgttca 4680
gctggattca ccgcagtgcc gagttcaaca acatcatccc cagcagccag atcacccaga 4740
tccccctgac caagagcacc aacctgggca gcggcaccag cgtggtgaag ggccccggct 4800
tcaccggcgg cgacatcctg cgccgcacca gccccggcca gatcagcacc ctgcgcgtga 4860
acatcaccgc ccccctgagc cagcgctacc gcgtccgcat ccgctacgcc agcaccacca 4920
acctgcagtt ccacaccagc atcgacggcc gccccatcaa ccagggcaac ttcagcgcca 4980
ccatgagcag cggcagcaac ctgcagagcg gcagcttccg caccgtgggc ttcaccaccc 5040
ccttcaactt cagcaacggc agcagcgtgt tcaccctgag cgcccacgtg ttcaacagcg 5100
gcaacgaggt gtacatcgac cgcatcgagt tcgtgcccgc cgaggtgacc ttcgaggccg 5160
agtacgacct ggagagggct cagaaggccg tgaacgagct gttcaccagc agcaaccaga 5220
tcggcctgaa gaccgacgtg accgactacc acatcgatca ggtgtaggag ctcagagaga 5280
tatttctgcc tccctatcgt gggtcgtccc caatggcctt tggtcgcaga ccatctttgc 5340
tgcttgtcta tgctgagaat aaatgtgaac ggtgcccctg gacgctggat ccatgctggt 5400
tttggacacg gttgtctttt tgtgtttaac ttatctgcta ccgtcctgta acgaattcac 5460
taagttctag ttcttttgtg ctttgttaag aatataaaca atgaggtttc aattttggtg 5520
gcgccatccg gtctgattgc gtactagtat catgcatatc tgagctggtc tttccggagt 5580
aacagttttt ttttgtttcg tgtcaatgat tctcagcctg ttcatttggt cttaatccat 5640
atcggttact actataatgt tgtcttgtct ctatagattg cagcagtcta acacatgttc 5700
ttggtatcct tttgggtgtg tttaatgcta tttgctctgt gttgtctttt tcgttaatcg 5760
ggacagagtt ttctctctgt tttgacagtt tcggtggttc ttttttgtgt gtggtcagcg 5820
agtcacgaac tgctggttgg ccagcgaaat agcgcagact attatgggtc ttctgctggt 5880
gaatatggaa ggacgaggtt aaattttctg ctttgatgtg tctgccctct gccgctgtgc 5940
tgcatgcatg tgtttgggag cgaagcagcg tgctgtttgg gcgtatggtt ggcatggtgt 6000
taaattattt cgctgattca gctttgggtt atcactggtt ttgatggtca cgctgtgtcg 6060
taagagagat cgtggcagca aaatggagaa aaaggcagtg aaacaaactt tcagggtgtg 6120
gaatgtatgg gattcgtatg gttgaggcca ggatttgtca attggtcaag ttgaaaagta 6180
aaggcgagac agattggcga ggaccgagga gagattgggg ttcagaaact tcggttacac 6240
tttaatcccc tccatctccc tccactcctc ccttctacgg accgcgatcg cttaattaag 6300
cttgcatgcc tgcagtgcag cgtgacccgg tcgtgcccct ctctagagat aatgagcatt 6360
gcatgtctaa gttataaaaa attaccacat attttttttg tcacacttgt ttgaagtgca 6420
gtttatctat ctttatacat atatttaaac tttactctac gaataatata atctatagta 6480
ctacaataat atcagtgttt tagagaatca tataaatgaa cagttagaca tggtctaaag 6540
gacaattgag tattttgaca acaggactct acagttttat ctttttagtg tgcatgtgtt 6600
ctcctttttt tttgcaaata gcttcaccta tataatactt catccatttt attagtacat 6660
ccatttaggg tttagggtta atggttttta tagactaatt tttttagtac atctatttta 6720
ttctatttta gcctctaaat taagaaaact aaaactctat tttagttttt ttatttaata 6780
atttagatat aaaatagaat aaaataaagt gactaaaaat taaacaaata ccctttaaga 6840
aattaaaaaa actaaggaaa catttttctt gtttcgagta gataatgcca gcctgttaaa 6900
cgccgtcgac gagtctaacg gacaccaacc agcgaaccag cagcgtcgcg tcgggccaag 6960
cgaagcagac ggcacggcat ctctgtcgct gcctctggac ccctctcgag agttccgctc 7020
caccgttgga cttgctccgc tgtcggcatc cagaaattgc gtggcggagc ggcagacgtg 7080
agccggcacg gcaggcggcc tcctcctcct ctcacggcac cggcagctac gggggattcc 7140
tttcccaccg ctccttcgct ttcccttcct cgcccgccgt aataaataga caccccctcc 7200
acaccctctt tccccaacct cgtgttgttc ggagcgcaca cacacacaac cagatctccc 7260
ccaaatccac ccgtcggcac ctccgcttca aggtacgccg ctcgtcctcc cccccccccc 7320
ctctctacct tctctagatc ggcgttccgg tccatggtta gggcccggta gttctacttc 7380
tgttcatgtt tgtgttagat ccgtgtttgt gttagatccg tgctgctagc gttcgtacac 7440
ggatgcgacc tgtacgtcag acacgttctg attgctaact tgccagtgtt tctctttggg 7500
gaatcctggg atggctctag ccgttccgca gacgggatcg atttcatgat tttttttgtt 7560
tcgttgcata gggtttggtt tgcccttttc ctttatttca atatatgccg tgcacttgtt 7620
tgtcgggtca tcttttcatg cttttttttg tcttggttgt gatgatgtgg tctggttggg 7680
cggtcgttct agatcggagt agaattctgt ttcaaactac ctggtggatt tattaatttt 7740
ggatctgtat gtgtgtgcca tacatattca tagttacgaa ttgaagatga tggatggaaa 7800
tatcgatcta ggataggtat acatgttgat gcgggtttta ctgatgcata tacagagatg 7860
ctttttgttc gcttggttgt gatgatgtgg tgtggttggg cggtcgttca ttcgttctag 7920
atcggagtag aatactgttt caaactacct ggtgtattta ttaattttgg aactgtatgt 7980
gtgtgtcata catcttcata gttacgagtt taagatggat ggaaatatcg atctaggata 8040
ggtatacatg ttgatgtggg ttttactgat gcatatacat gatggcatat gcagcatcta 8100
ttcatatgct ctaaccttga gtacctatct attataataa acaagtatgt tttataatta 8160
ttttgatctt gatatacttg gatgatggca tatgcagcag ctatatgtgg atttttttag 8220
ccctgccttc atacgctatt tatttgcttg gtactgtttc ttttgtcgat gctcaccctg 8280
ttgtttggtg ttacttctgc agggatcccc gatcatgcaa aaactcatta actcagtgca 8340
aaactatgcc tggggcagca aaacggcgtt gactgaactt tatggtatgg aaaatccgtc 8400
cagccagccg atggccgagc tgtggatggg cgcacatccg aaaagcagtt cacgagtgca 8460
gaatgccgcc ggagatatcg tttcactgcg tgatgtgatt gagagtgata aatcgactct 8520
gctcggagag gccgttgcca aacgctttgg cgaactgcct ttcctgttca aagtattatg 8580
cgcagcacag ccactctcca ttcaggttca tccaaacaaa cacaattctg aaatcggttt 8640
tgccaaagaa aatgccgcag gtatcccgat ggatgccgcc gagcgtaact ataaagatcc 8700
taaccacaag ccggagctgg tttttgcgct gacgcctttc cttgcgatga acgcgtttcg 8760
tgaattttcc gagattgtct ccctactcca gccggtcgca ggtgcacatc cggcgattgc 8820
tcacttttta caacagcctg atgccgaacg tttaagcgaa ctgttcgcca gcctgttgaa 8880
tatgcagggt gaagaaaaat cccgcgcgct ggcgatttta aaatcggccc tcgatagcca 8940
gcagggtgaa ccgtggcaaa cgattcgttt aatttctgaa ttttacccgg aagacagcgg 9000
tctgttctcc ccgctattgc tgaatgtggt gaaattgaac cctggcgaag cgatgttcct 9060
gttcgctgaa acaccgcacg cttacctgca aggcgtggcg ctggaagtga tggcaaactc 9120
cgataacgtg ctgcgtgcgg gtctgacgcc taaatacatt gatattccgg aactggttgc 9180
caatgtgaaa ttcgaagcca aaccggctaa ccagttgttg acccagccgg tgaaacaagg 9240
tgcagaactg gacttcccga ttccagtgga tgattttgcc ttctcgctgc atgaccttag 9300
tgataaagaa accaccatta gccagcagag tgccgccatt ttgttctgcg tcgaaggcga 9360
tgcaacgttg tggaaaggtt ctcagcagtt acagcttaaa ccgggtgaat cagcgtttat 9420
tgccgccaac gaatcaccgg tgactgtcaa aggccacggc cgtttagcgc gtgtttacaa 9480
caagctgtaa gagcttactg aaaaaattaa catctcttgc taagctggga gctcgtcatg 9540
ggtcgtttaa gctgccgatg tgcctgcgtc gtctggtgcc ctctctccat atggaggttg 9600
tcaaagtatc tgctgttcgt gtcatgagtc gtgtcagtgt tggtttaata atggaccggt 9660
tgtgttgtgt gtgcgtacta cccagaacta tgacaaatca tgaataagtt tgatgtttga 9720
aattaaagcc tgtgctcatt atgttctgtc tttcagttgt ctcctaatat ttgcctgcag 9780
gtactggcta tctaccgttt cttacttagg aggtgtttga atgcactaaa actaatagtt 9840
agtggctaaa attagttaaa acatccaaac accatagcta atagttgaac tattagctat 9900
ttttggaaaa ttagttaata gtgaggtagt tatttgttag ctagctaatt caactaacaa 9960
tttttagcca actaacaatt agtttcagtg cattcaaaca cccccttaat gttaacgtgg 10020
ttctatctac cgtctcctaa tatatggttg attgttcggt ttgttgctat gctattgggt 10080
tctgattgct gctagttctt gctgaatcca gaagttctcg tagtatagct cagattcata 10140
ttatttattt gagtgataag tgatccaggt tattactatg ttagctaggt tttttttaca 10200
aggataaatt atctgtgatc ataattctta tgaaagcttt atgtttcctg gaggcagtgg 10260
catgcaatgc atgacagcaa cttgatcaca ccagctgagg tagatacggt aacaaggttc 10320
ttaaatctgt tcaccaaatc attggagaac acacatacac attcttgcca gtcttggtta 10380
gagaaatttc atgacaaaat gccaaagctg tcttgactct tcacttttgg ccatgagtcg 10440
tgacttagtt tggtttaatg gaccggttct cctagcttgt tctactcaaa actgttgttg 10500
atgcgaataa gttgtgatgg ttgatctctg gattttgttt tgctctcaat agtggacgag 10560
attagatagc ccggaaattt accggtgccc gggcggccag catggccgta tccgcaatgt 10620
gttattaagt tgtctaagcg tcaatttgtt tacaccacaa tatatcctgc caccagccag 10680
ccaacagctc cccgaccggc agctcggcac aaaatcacca ctcgatacag gcagcccatc 10740
agaattaatt ctcatgtttg acagcttatc atcgactgca cggtgcacca atgcttctgg 10800
cgtcaggcag ccatcggaag ctgtggtatg gctgtgcagg tcgtaaatca ctgcataatt 10860
cgtgtcgctc aaggcgcact cccgttctgg ataatgtttt ttgcgccgac atcataacgg 10920
ttctggcaaa tattctgaaa tgagctgttg acaattaatc atccggctcg tataatgtgt 10980
ggaattgtga gcggataaca atttcacaca ggaaacagac catgagggaa gcgttgatcg 11040
ccgaagtatc gactcaacta tcagaggtag ttggcgtcat cgagcgccat ctcgaaccga 11100
cgttgctggc cgtacatttg tacggctccg cagtggatgg cggcctgaag ccacacagtg 11160
atattgattt gctggttacg gtgaccgtaa ggcttgatga aacaacgcgg cgagctttga 11220
tcaacgacct tttggaaact tcggcttccc ctggagagag cgagattctc cgcgctgtag 11280
aagtcaccat tgttgtgcac gacgacatca ttccgtggcg ttatccagct aagcgcgaac 11340
tgcaatttgg agaatggcag cgcaatgaca ttcttgcagg tatcttcgag ccagccacga 11400
tcgacattga tctggctatc ttgctgacaa aagcaagaga acatagcgtt gccttggtag 11460
gtccagcggc ggaggaactc tttgatccgg ttcctgaaca ggatctattt gaggcgctaa 11520
atgaaacctt aacgctatgg aactcgccgc ccgactgggc tggcgatgag cgaaatgtag 11580
tgcttacgtt gtcccgcatt tggtacagcg cagtaaccgg caaaatcgcg ccgaaggatg 11640
tcgctgccga ctgggcaatg gagcgcctgc cggcccagta tcagcccgtc atacttgaag 11700
ctaggcaggc ttatcttgga caagaagatc gcttggcctc gcgcgcagat cagttggaag 11760
aatttgttca ctacgtgaaa ggcgagatca ccaaagtagt cggcaaataa agctctagtg 11820
gatctccgta cccggggatc tggctcgcgg cggacgcacg acgccggggc gagaccatag 11880
gcgatctcct aaatcaatag tagctgtaac ctcgaagcgt ttcacttgta acaacgattg 11940
agaatttttg tcataaaatt gaaatacttg gttcgcattt ttgtcatccg cggtcagccg 12000
caattctgac gaactgccca tttagctgga gatgattgta catccttcac gtgaaaattt 12060
ctcaagcgct gtgaacaagg gttcagattt tagattgaaa ggtgagccgt tgaaacacgt 12120
tcttcttgtc gatgacgacg tcgctatgcg gcatcttatt attgaatacc ttacgatcca 12180
cgccttcaaa gtgaccgcgg tagccgacag cacccagttc acaagagtac tctcttccgc 12240
gacggtcgat gtcgtggttg ttgatctaga tttaggtcgt gaagatgggc tcgagatcgt 12300
tcgtaatctg gcggcaaagt ctgatattcc aatcataatt atcagtggcg accgccttga 12360
ggagacggat aaagttgttg cactcgagct aggagcaagt gattttatcg ctaagccgtt 12420
cagtatcaga gagtttctag cacgcattcg ggttgccttg cgcgtgcgcc ccaacgttgt 12480
ccgctccaaa gaccgacggt ctttttgttt tactgactgg acacttaatc tcaggcaacg 12540
tcgcttgatg tccgaagctg gcggtgaggt gaaacttacg gcaggtgagt tcaatcttct 12600
cctcgcgttt ttagagaaac cccgcgacgt tctatcgcgc gagcaacttc tcattgccag 12660
tcgagtacgc gacgaggagg tttatgacag gagtatagat gttctcattt tgaggctgcg 12720
ccgcaaactt gaggcagatc cgtcaagccc tcaactgata aaaacagcaa gaggtgccgg 12780
ttatttcttt gacgcggacg tgcaggtttc gcacgggggg acgatggcag cctgagccaa 12840
ttcccagatc cccgaggaat cggcgtgagc ggtcgcaaac catccggccc ggtacaaatc 12900
ggcgcggcgc tgggtgatga cctggtggag aagttgaagg ccgcgcaggc cgcccagcgg 12960
caacgcatcg aggcagaagc acgccccggt gaatcgtggc aagcggccgc tgatcgaatc 13020
cgcaaagaat cccggcaacc gccggcagcc ggtgcgccgt cgattaggaa gccgcccaag 13080
ggcgacgagc aaccagattt tttcgttccg atgctctatg acgtgggcac ccgcgatagt 13140
cgcagcatca tggacgtggc cgttttccgt ctgtcgaagc gtgaccgacg agctggcgag 13200
gtgatccgct acgagcttcc agacgggcac gtagaggttt ccgcagggcc ggccggcatg 13260
gccagtgtgt gggattacga cctggtactg atggcggttt cccatctaac cgaatccatg 13320
aaccgatacc gggaagggaa gggagacaag cccggccgcg tgttccgtcc acacgttgcg 13380
gacgtactca agttctgccg gcgagccgat ggcggaaagc agaaagacga cctggtagaa 13440
acctgcattc ggttaaacac cacgcacgtt gccatgcagc gtacgaagaa ggccaagaac 13500
ggccgcctgg tgacggtatc cgagggtgaa gccttgatta gccgctacaa gatcgtaaag 13560
agcgaaaccg ggcggccgga gtacatcgag atcgagctag ctgattggat gtaccgcgag 13620
atcacagaag gcaagaaccc ggacgtgctg acggttcacc ccgattactt tttgatcgat 13680
cccggcatcg gccgttttct ctaccgcctg gcacgccgcg ccgcaggcaa ggcagaagcc 13740
agatggttgt tcaagacgat ctacgaacgc agtggcagcg ccggagagtt caagaagttc 13800
tgtttcaccg tgcgcaagct gatcgggtca aatgacctgc cggagtacga tttgaaggag 13860
gaggcggggc aggctggccc gatcctagtc atgcgctacc gcaacctgat cgagggcgaa 13920
gcatccgccg gttcctaatg tacggagcag atgctagggc aaattgccct agcaggggaa 13980
aaaggtcgaa aaggtctctt tcctgtggat agcacgtaca ttgggaaccc aaagccgtac 14040
attgggaacc ggaacccgta cattgggaac ccaaagccgt acattgggaa ccggtcacac 14100
atgtaagtga ctgatataaa agagaaaaaa ggcgattttt ccgcctaaaa ctctttaaaa 14160
cttattaaaa ctcttaaaac ccgcctggcc tgtgcataac tgtctggcca gcgcacagcc 14220
gaagagctgc aaaaagcgcc tacccttcgg tcgctgcgct ccctacgccc cgccgcttcg 14280
cgtcggccta tcgcggccgc tggccgctca aaaatggctg gcctacggcc aggcaatcta 14340
ccagggcgcg gacaagccgc gccgtcgcca ctcgaccgcc ggcgctgagg tctgcctcgt 14400
gaagaaggtg ttgctgactc ataccaggcc tgaatcgccc catcatccag ccagaaagtg 14460
agggagccac ggttgatgag agctttgttg taggtggacc agttggtgat tttgaacttt 14520
tgctttgcca cggaacggtc tgcgttgtcg ggaagatgcg tgatctgatc cttcaactca 14580
gcaaaagttc gatttattca acaaagccgc cgtcccgtca agtcagcgta atgctctgcc 14640
agtgttacaa ccaattaacc aattctgatt agaaaaactc atcgagcatc aaatgaaact 14700
gcaatttatt catatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg 14760
aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga 14820
ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat 14880
caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa agctctgcat 14940
taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc 15000
tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca 15060
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 15120
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 15180
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 15240
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 15300
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 15360
tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 15420
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 15480
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 15540
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 15600
tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 15660
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 15720
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 15780
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta 15840
tcaaaaagga tcttcaccta gatccttttg atccggaatt a 15881
<210> 24
<211> 15436
<212> DNA
<213> 人工序列
<220>
<223> 重组载体
<400> 24
attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt 60
taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120
tgtcaaacac tgatagttta aactgaaggc gggaaacgac aatctgatca tgagcggaga 180
attaagggag tcacgttatg acccccgccg atgacgcggg acaagccgtt ttacgtttgg 240
aactgacaga accgcaacgc tgcaggaatt ggccgcagcg gccatttaaa tcaattgggc 300
gcgccagctg cttgtgggga ccagacaaaa aaggaatggt gcagaattgt taggcgcacc 360
taccaaaagc atctttgcct ttattgcaaa gataaagcag attcctctag tacaagtggg 420
gaacaaaata acgtggaaaa gagctgtcct gacagcccac tcactaatgc gtatgacgaa 480
cgcagtgacg accacaaaac tcgagacttt tcaacaaagg gtaatatccg gaaacctcct 540
cggattccat tgcccagcta tctgtcactt tattgtgaag atagtggaaa aggaaggtgg 600
ctcctacaaa tgccatcatt gcgataaagg aaaggctatc gttgaagatg cctctgccga 660
cagtggtccc aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc 720
aaccacgtct tcaaagcaag tggattgatg tgatatctcc actgacgtaa gggatgacga 780
acaatcccac tatccttcgg taccggaccc aaatgaatta atatattatc taaattcaga 840
cgggaaaaag agagaaggaa tcaggaaggc tgagtgcaat attagttttt cattgagcac 900
aatcttatta tgtttgatga acatcttgaa caaagtatga gtggaaaaca acacttatgt 960
tatatctgca gcacagattg ttagaagtga aggctacctt gagatggtga taggtctctg 1020
aacccatctg cattgcttct tcgaagttca tagcaccaac aagaagaatc ataatttcct 1080
acaaataaga aatgtttata gttactccaa aactacagtt aaacatattg atatggttga 1140
tatacatgaa caactaactg tcttaatatg tttctgttta ggcaaaagat gacacaagtg 1200
gacaaagtaa gggaataatg cattcaactt ctcagactct aaaggtttgg atgaatactt 1260
gaatgggaag accatttcca gcatgctttc caccattaat gactgtattt gcagggacag 1320
gaagagttgt agcgcttttg ccaacaagat ccgctatatg cttgtagagt ggaacctgca 1380
cagcaacaag catccaatga tctgagaata agaattatgt gcggtggcat gacacattta 1440
ccaaattatg atgattttag cagaagagca gcacctcttt ttcagcagca ccagctttgc 1500
aagctgcaat tgacactgcc agcatagtat ttgctccaag ctcagcctgc atttcgcaca 1560
atatcatatc tatttccatt tggataaaat ctatttgcca gaaatatggg aacggaatca 1620
agatacagaa aaaagttgag gctgtagtgg taagtgggaa cacaagtaca gtgaaaagat 1680
agcattattt tccgaacagt caaattaacc gaaataagta gtatcacata ctgaccctaa 1740
attgactaca cccaatgtaa agaattgctt gtgcatattg agccatcagt tgtttgtttg 1800
tgtaatggat ttgacaatgc agaattcagg agcaaaaaaa accgcaaagg agagagaggg 1860
aaaggatctc cgagtatccc acctgtggcg cgccttgtca agtccatgat ggcctggtcg 1920
atctgcgcct gctgctgcgg atccatccca acgagtgcct ccgacacctt gtcgttgatc 1980
acccgcaccg cgtaggcgac ccccctggcg aggaacttcc gcctctcgga ggccccggcc 2040
gcgtcggcgg cggcgcccac gagcgcgccc acgctagccg tagatgctcg gtgcacggcc 2100
ttgttggtgt gcaactcgac ctcaacggcc ggtgcgctac gcccgtcaag gatctggcgc 2160
gcccgcaccc tcgtgatcac ggtgggcgcc tcccgcctca tgtggccgac gatgaaaagc 2220
gccgggtcag gggccttggc gcggagcgcc gtattcaggg cctcctcgct cttgcgcgag 2280
agcaggtgct tccccaggta ctcctgcact gacatggctg ccacagcggt ggaattttct 2340
tgtcctcacg acttcgccac gtcgtcctca cctccctggc ttcccacgac tccgccgtat 2400
cgaggtgctc ggtgggtcgc cttaatccga agtccgaact aggaagacga gacagagagg 2460
tctgaggaat gggcctcgtt tgatgttgag ctgaattatt tttccagcat aagcccaggt 2520
cttggtccat gaacaaaatt actagaaacc cagcccagta ctacgatcta aaagagggac 2580
tgccactgga tagctctctc tagcattctc cacgctccaa tacagcggcg tagggtctat 2640
ccgggtctat ccgcgaacac gtgagaactc tccagaaact gctttctcct ccacttcatc 2700
tctctcgctt tccctctata aaaagacccc ttctaggaat tgagggagac agcaagcagc 2760
gatccgaagc tcaatcaatt cactcaaacc tcttccccaa atcttcgatt agattctcgt 2820
tgacaagaag actataaccg aacctgaccg taaaccatgg acaacaaccc caacatcaac 2880
gagtgcatcc cctacaactg cctgagcaac cccgaggtgg aggtgctggg cggcgagcgc 2940
atcgagaccg gctacacccc catcgacatc agcctgagcc tgacccagtt cctgctgagc 3000
gagttcgtgc ccggcgccgg cttcgtgctg ggcctggtgg acatcatctg gggcatcttc 3060
ggccccagcc agtgggacgc cttcctggtg cagatcgagc agctgatcaa ccagcgcatc 3120
gaggagttcg cccgcaacca ggccatcagc cgcctggagg gcctgagcaa cctgtaccaa 3180
atctacgccg agagcttccg cgagtgggag gccgacccca ccaaccccgc cctgcgcgag 3240
gagatgcgca tccagttcaa cgacatgaac agcgccctga ccaccgccat ccccctgttc 3300
gccgtgcaga actaccaggt gcccctgctg agcgtgtacg tgcaggccgc caacctgcac 3360
ctgagcgtgc tgcgcgacgt cagcgtgttc ggccagcgct ggggcttcga cgccgccacc 3420
atcaacagcc gctacaacga cctgacccgc ctgatcggca actacaccga ccacgccgtg 3480
cgctggtaca acaccggcct ggagcgcgtg tggggtccag acagccgcga ctggatcagg 3540
tacaaccagt tccgccgcga gctgaccctg accgtgctgg acatcgtgag cctgttcccc 3600
aactacgaca gccgcaccta ccccatccgc accgtgagcc agctgacccg cgagatttac 3660
accaaccccg tgctggagaa cttcgacggc agcttccgcg gcagcgccca gggcatcgag 3720
ggcagcatcc gcagccccca cctgatggac atcctgaaca gcatcaccat ctacaccgac 3780
gcccaccgcg gcgagtacta ctggagcggc caccagatca tggccagccc cgtcggcttc 3840
agcggccccg agttcacctt ccccctgtac ggcactatgg gcaacgctgc acctcagcag 3900
cgcatcgtgg cacagctggg ccagggagtg taccgcaccc tgagcagcac cctgtaccgt 3960
cgacctttca acatcggcat caacaaccag cagctgagcg tgctggacgg caccgagttc 4020
gcctacggca ccagcagcaa cctgcccagc gccgtgtacc gcaagagcgg caccgtggac 4080
agcctggacg agatcccccc tcagaacaac aacgtgccac ctcgacaggg cttcagccac 4140
cgtctgagcc acgtgagcat gttccgcagt ggcttcagca acagcagcgt gagcatcatc 4200
cgtgcaccta tgttcagctg gattcaccgc agtgccgagt tcaacaacat catccccagc 4260
agccagatca cccagatccc cctgaccaag agcaccaacc tgggcagcgg caccagcgtg 4320
gtgaagggcc ccggcttcac cggcggcgac atcctgcgcc gcaccagccc cggccagatc 4380
agcaccctgc gcgtgaacat caccgccccc ctgagccagc gctaccgcgt ccgcatccgc 4440
tacgccagca ccaccaacct gcagttccac accagcatcg acggccgccc catcaaccag 4500
ggcaacttca gcgccaccat gagcagcggc agcaacctgc agagcggcag cttccgcacc 4560
gtgggcttca ccaccccctt caacttcagc aacggcagca gcgtgttcac cctgagcgcc 4620
cacgtgttca acagcggcaa cgaggtgtac atcgaccgca tcgagttcgt gcccgccgag 4680
gtgaccttcg aggccgagta cgacctggag agggctcaga aggccgtgaa cgagctgttc 4740
accagcagca accagatcgg cctgaagacc gacgtgaccg actaccacat cgatcaggtg 4800
taggagctca cctcggtctg cggtcgtcgt acctgcgtgg tttgaggaac ggcagttcgc 4860
ctcggtcgtt ctgtgaaata aaattgggtt acaagaatta tggcgtttgt caatatggtc 4920
gtaatgtcgt aggatggtgg aatgtggtca caaactttgc gtatgttggg tctactggtg 4980
gtgtctgaat ctatgtatgg atgtcatgag tttgtctact agagttctag ttcctgtggt 5040
gttcgtatga tgtatatcat gagttaactc tatctaaaat ttcttcatta tggtattttt 5100
aagaaataaa ttctttatta tggttttttt aaagggacta tgtccatcct aacaagagca 5160
acgtccaata attctctaaa acttaaattt aagaaccgaa taaaaaatga gtagttttta 5220
aatactttct atctaacctt atttactctt ctccatattt tagtagtttt ttaaatagac 5280
ttactaaatt tagttactct atattttggt aactcgacag aatacaatct gtgattaatt 5340
tttctcacat gtggtagcta gatacgacac tttttttttt actttttagc acatgcacaa 5400
tggagtagtt agattcaaca cttatgacac aagttttttc ttcaccgttg gactattatt 5460
gtcgcatatg ttgccaccgc gaaccaccgc tcctctatag gttatgtcaa tcgacctttc 5520
ctcttttgtc ttcgacatca tccaagacta acaaagttag attcaaatca aactagatgt 5580
ccagactggc aaagttagat ttaaaatcaa actactatct acatataagc aactattagg 5640
gactaagtta tttttctact tcaatagttg ttgctagcaa cttgctaaac ataattttag 5700
aaaacttttt tagagaacta ttagagttgc tctaaaaggt tttgtagtcc catttactgt 5760
tttgtgacta ttattaggtg gagtttgggc agtaaaaagg ccaaatagaa aatggggttg 5820
agattgggaa aacggaccgc gatcgcttaa ttaagcttgc atgcctgcag tgcagcgtga 5880
cccggtcgtg cccctctcta gagataatga gcattgcatg tctaagttat aaaaaattac 5940
cacatatttt ttttgtcaca cttgtttgaa gtgcagttta tctatcttta tacatatatt 6000
taaactttac tctacgaata atataatcta tagtactaca ataatatcag tgttttagag 6060
aatcatataa atgaacagtt agacatggtc taaaggacaa ttgagtattt tgacaacagg 6120
actctacagt tttatctttt tagtgtgcat gtgttctcct ttttttttgc aaatagcttc 6180
acctatataa tacttcatcc attttattag tacatccatt tagggtttag ggttaatggt 6240
ttttatagac taattttttt agtacatcta ttttattcta ttttagcctc taaattaaga 6300
aaactaaaac tctattttag tttttttatt taataattta gatataaaat agaataaaat 6360
aaagtgacta aaaattaaac aaataccctt taagaaatta aaaaaactaa ggaaacattt 6420
ttcttgtttc gagtagataa tgccagcctg ttaaacgccg tcgacgagtc taacggacac 6480
caaccagcga accagcagcg tcgcgtcggg ccaagcgaag cagacggcac ggcatctctg 6540
tcgctgcctc tggacccctc tcgagagttc cgctccaccg ttggacttgc tccgctgtcg 6600
gcatccagaa attgcgtggc ggagcggcag acgtgagccg gcacggcagg cggcctcctc 6660
ctcctctcac ggcaccggca gctacggggg attcctttcc caccgctcct tcgctttccc 6720
ttcctcgccc gccgtaataa atagacaccc cctccacacc ctctttcccc aacctcgtgt 6780
tgttcggagc gcacacacac acaaccagat ctcccccaaa tccacccgtc ggcacctccg 6840
cttcaaggta cgccgctcgt cctccccccc cccccctctc taccttctct agatcggcgt 6900
tccggtccat ggttagggcc cggtagttct acttctgttc atgtttgtgt tagatccgtg 6960
tttgtgttag atccgtgctg ctagcgttcg tacacggatg cgacctgtac gtcagacacg 7020
ttctgattgc taacttgcca gtgtttctct ttggggaatc ctgggatggc tctagccgtt 7080
ccgcagacgg gatcgatttc atgatttttt ttgtttcgtt gcatagggtt tggtttgccc 7140
ttttccttta tttcaatata tgccgtgcac ttgtttgtcg ggtcatcttt tcatgctttt 7200
ttttgtcttg gttgtgatga tgtggtctgg ttgggcggtc gttctagatc ggagtagaat 7260
tctgtttcaa actacctggt ggatttatta attttggatc tgtatgtgtg tgccatacat 7320
attcatagtt acgaattgaa gatgatggat ggaaatatcg atctaggata ggtatacatg 7380
ttgatgcggg ttttactgat gcatatacag agatgctttt tgttcgcttg gttgtgatga 7440
tgtggtgtgg ttgggcggtc gttcattcgt tctagatcgg agtagaatac tgtttcaaac 7500
tacctggtgt atttattaat tttggaactg tatgtgtgtg tcatacatct tcatagttac 7560
gagtttaaga tggatggaaa tatcgatcta ggataggtat acatgttgat gtgggtttta 7620
ctgatgcata tacatgatgg catatgcagc atctattcat atgctctaac cttgagtacc 7680
tatctattat aataaacaag tatgttttat aattattttg atcttgatat acttggatga 7740
tggcatatgc agcagctata tgtggatttt tttagccctg ccttcatacg ctatttattt 7800
gcttggtact gtttcttttg tcgatgctca ccctgttgtt tggtgttact tctgcaggga 7860
tccccgatca tgcaaaaact cattaactca gtgcaaaact atgcctgggg cagcaaaacg 7920
gcgttgactg aactttatgg tatggaaaat ccgtccagcc agccgatggc cgagctgtgg 7980
atgggcgcac atccgaaaag cagttcacga gtgcagaatg ccgccggaga tatcgtttca 8040
ctgcgtgatg tgattgagag tgataaatcg actctgctcg gagaggccgt tgccaaacgc 8100
tttggcgaac tgcctttcct gttcaaagta ttatgcgcag cacagccact ctccattcag 8160
gttcatccaa acaaacacaa ttctgaaatc ggttttgcca aagaaaatgc cgcaggtatc 8220
ccgatggatg ccgccgagcg taactataaa gatcctaacc acaagccgga gctggttttt 8280
gcgctgacgc ctttccttgc gatgaacgcg tttcgtgaat tttccgagat tgtctcccta 8340
ctccagccgg tcgcaggtgc acatccggcg attgctcact ttttacaaca gcctgatgcc 8400
gaacgtttaa gcgaactgtt cgccagcctg ttgaatatgc agggtgaaga aaaatcccgc 8460
gcgctggcga ttttaaaatc ggccctcgat agccagcagg gtgaaccgtg gcaaacgatt 8520
cgtttaattt ctgaatttta cccggaagac agcggtctgt tctccccgct attgctgaat 8580
gtggtgaaat tgaaccctgg cgaagcgatg ttcctgttcg ctgaaacacc gcacgcttac 8640
ctgcaaggcg tggcgctgga agtgatggca aactccgata acgtgctgcg tgcgggtctg 8700
acgcctaaat acattgatat tccggaactg gttgccaatg tgaaattcga agccaaaccg 8760
gctaaccagt tgttgaccca gccggtgaaa caaggtgcag aactggactt cccgattcca 8820
gtggatgatt ttgccttctc gctgcatgac cttagtgata aagaaaccac cattagccag 8880
cagagtgccg ccattttgtt ctgcgtcgaa ggcgatgcaa cgttgtggaa aggttctcag 8940
cagttacagc ttaaaccggg tgaatcagcg tttattgccg ccaacgaatc accggtgact 9000
gtcaaaggcc acggccgttt agcgcgtgtt tacaacaagc tgtaagagct tactgaaaaa 9060
attaacatct cttgctaagc tgggagctcg tcatgggtcg tttaagctgc cgatgtgcct 9120
gcgtcgtctg gtgccctctc tccatatgga ggttgtcaaa gtatctgctg ttcgtgtcat 9180
gagtcgtgtc agtgttggtt taataatgga ccggttgtgt tgtgtgtgcg tactacccag 9240
aactatgaca aatcatgaat aagtttgatg tttgaaatta aagcctgtgc tcattatgtt 9300
ctgtctttca gttgtctcct aatatttgcc tgcaggtact ggctatctac cgtttcttac 9360
ttaggaggtg tttgaatgca ctaaaactaa tagttagtgg ctaaaattag ttaaaacatc 9420
caaacaccat agctaatagt tgaactatta gctatttttg gaaaattagt taatagtgag 9480
gtagttattt gttagctagc taattcaact aacaattttt agccaactaa caattagttt 9540
cagtgcattc aaacaccccc ttaatgttaa cgtggttcta tctaccgtct cctaatatat 9600
ggttgattgt tcggtttgtt gctatgctat tgggttctga ttgctgctag ttcttgctga 9660
atccagaagt tctcgtagta tagctcagat tcatattatt tatttgagtg ataagtgatc 9720
caggttatta ctatgttagc taggtttttt ttacaaggat aaattatctg tgatcataat 9780
tcttatgaaa gctttatgtt tcctggaggc agtggcatgc aatgcatgac agcaacttga 9840
tcacaccagc tgaggtagat acggtaacaa ggttcttaaa tctgttcacc aaatcattgg 9900
agaacacaca tacacattct tgccagtctt ggttagagaa atttcatgac aaaatgccaa 9960
agctgtcttg actcttcact tttggccatg agtcgtgact tagtttggtt taatggaccg 10020
gttctcctag cttgttctac tcaaaactgt tgttgatgcg aataagttgt gatggttgat 10080
ctctggattt tgttttgctc tcaatagtgg acgagattag atagcccgga aatttaccgg 10140
tgcccgggcg gccagcatgg ccgtatccgc aatgtgttat taagttgtct aagcgtcaat 10200
ttgtttacac cacaatatat cctgccacca gccagccaac agctccccga ccggcagctc 10260
ggcacaaaat caccactcga tacaggcagc ccatcagaat taattctcat gtttgacagc 10320
ttatcatcga ctgcacggtg caccaatgct tctggcgtca ggcagccatc ggaagctgtg 10380
gtatggctgt gcaggtcgta aatcactgca taattcgtgt cgctcaaggc gcactcccgt 10440
tctggataat gttttttgcg ccgacatcat aacggttctg gcaaatattc tgaaatgagc 10500
tgttgacaat taatcatccg gctcgtataa tgtgtggaat tgtgagcgga taacaatttc 10560
acacaggaaa cagaccatga gggaagcgtt gatcgccgaa gtatcgactc aactatcaga 10620
ggtagttggc gtcatcgagc gccatctcga accgacgttg ctggccgtac atttgtacgg 10680
ctccgcagtg gatggcggcc tgaagccaca cagtgatatt gatttgctgg ttacggtgac 10740
cgtaaggctt gatgaaacaa cgcggcgagc tttgatcaac gaccttttgg aaacttcggc 10800
ttcccctgga gagagcgaga ttctccgcgc tgtagaagtc accattgttg tgcacgacga 10860
catcattccg tggcgttatc cagctaagcg cgaactgcaa tttggagaat ggcagcgcaa 10920
tgacattctt gcaggtatct tcgagccagc cacgatcgac attgatctgg ctatcttgct 10980
gacaaaagca agagaacata gcgttgcctt ggtaggtcca gcggcggagg aactctttga 11040
tccggttcct gaacaggatc tatttgaggc gctaaatgaa accttaacgc tatggaactc 11100
gccgcccgac tgggctggcg atgagcgaaa tgtagtgctt acgttgtccc gcatttggta 11160
cagcgcagta accggcaaaa tcgcgccgaa ggatgtcgct gccgactggg caatggagcg 11220
cctgccggcc cagtatcagc ccgtcatact tgaagctagg caggcttatc ttggacaaga 11280
agatcgcttg gcctcgcgcg cagatcagtt ggaagaattt gttcactacg tgaaaggcga 11340
gatcaccaaa gtagtcggca aataaagctc tagtggatct ccgtacccgg ggatctggct 11400
cgcggcggac gcacgacgcc ggggcgagac cataggcgat ctcctaaatc aatagtagct 11460
gtaacctcga agcgtttcac ttgtaacaac gattgagaat ttttgtcata aaattgaaat 11520
acttggttcg catttttgtc atccgcggtc agccgcaatt ctgacgaact gcccatttag 11580
ctggagatga ttgtacatcc ttcacgtgaa aatttctcaa gcgctgtgaa caagggttca 11640
gattttagat tgaaaggtga gccgttgaaa cacgttcttc ttgtcgatga cgacgtcgct 11700
atgcggcatc ttattattga ataccttacg atccacgcct tcaaagtgac cgcggtagcc 11760
gacagcaccc agttcacaag agtactctct tccgcgacgg tcgatgtcgt ggttgttgat 11820
ctagatttag gtcgtgaaga tgggctcgag atcgttcgta atctggcggc aaagtctgat 11880
attccaatca taattatcag tggcgaccgc cttgaggaga cggataaagt tgttgcactc 11940
gagctaggag caagtgattt tatcgctaag ccgttcagta tcagagagtt tctagcacgc 12000
attcgggttg ccttgcgcgt gcgccccaac gttgtccgct ccaaagaccg acggtctttt 12060
tgttttactg actggacact taatctcagg caacgtcgct tgatgtccga agctggcggt 12120
gaggtgaaac ttacggcagg tgagttcaat cttctcctcg cgtttttaga gaaaccccgc 12180
gacgttctat cgcgcgagca acttctcatt gccagtcgag tacgcgacga ggaggtttat 12240
gacaggagta tagatgttct cattttgagg ctgcgccgca aacttgaggc agatccgtca 12300
agccctcaac tgataaaaac agcaagaggt gccggttatt tctttgacgc ggacgtgcag 12360
gtttcgcacg gggggacgat ggcagcctga gccaattccc agatccccga ggaatcggcg 12420
tgagcggtcg caaaccatcc ggcccggtac aaatcggcgc ggcgctgggt gatgacctgg 12480
tggagaagtt gaaggccgcg caggccgccc agcggcaacg catcgaggca gaagcacgcc 12540
ccggtgaatc gtggcaagcg gccgctgatc gaatccgcaa agaatcccgg caaccgccgg 12600
cagccggtgc gccgtcgatt aggaagccgc ccaagggcga cgagcaacca gattttttcg 12660
ttccgatgct ctatgacgtg ggcacccgcg atagtcgcag catcatggac gtggccgttt 12720
tccgtctgtc gaagcgtgac cgacgagctg gcgaggtgat ccgctacgag cttccagacg 12780
ggcacgtaga ggtttccgca gggccggccg gcatggccag tgtgtgggat tacgacctgg 12840
tactgatggc ggtttcccat ctaaccgaat ccatgaaccg ataccgggaa gggaagggag 12900
acaagcccgg ccgcgtgttc cgtccacacg ttgcggacgt actcaagttc tgccggcgag 12960
ccgatggcgg aaagcagaaa gacgacctgg tagaaacctg cattcggtta aacaccacgc 13020
acgttgccat gcagcgtacg aagaaggcca agaacggccg cctggtgacg gtatccgagg 13080
gtgaagcctt gattagccgc tacaagatcg taaagagcga aaccgggcgg ccggagtaca 13140
tcgagatcga gctagctgat tggatgtacc gcgagatcac agaaggcaag aacccggacg 13200
tgctgacggt tcaccccgat tactttttga tcgatcccgg catcggccgt tttctctacc 13260
gcctggcacg ccgcgccgca ggcaaggcag aagccagatg gttgttcaag acgatctacg 13320
aacgcagtgg cagcgccgga gagttcaaga agttctgttt caccgtgcgc aagctgatcg 13380
ggtcaaatga cctgccggag tacgatttga aggaggaggc ggggcaggct ggcccgatcc 13440
tagtcatgcg ctaccgcaac ctgatcgagg gcgaagcatc cgccggttcc taatgtacgg 13500
agcagatgct agggcaaatt gccctagcag gggaaaaagg tcgaaaaggt ctctttcctg 13560
tggatagcac gtacattggg aacccaaagc cgtacattgg gaaccggaac ccgtacattg 13620
ggaacccaaa gccgtacatt gggaaccggt cacacatgta agtgactgat ataaaagaga 13680
aaaaaggcga tttttccgcc taaaactctt taaaacttat taaaactctt aaaacccgcc 13740
tggcctgtgc ataactgtct ggccagcgca cagccgaaga gctgcaaaaa gcgcctaccc 13800
ttcggtcgct gcgctcccta cgccccgccg cttcgcgtcg gcctatcgcg gccgctggcc 13860
gctcaaaaat ggctggccta cggccaggca atctaccagg gcgcggacaa gccgcgccgt 13920
cgccactcga ccgccggcgc tgaggtctgc ctcgtgaaga aggtgttgct gactcatacc 13980
aggcctgaat cgccccatca tccagccaga aagtgaggga gccacggttg atgagagctt 14040
tgttgtaggt ggaccagttg gtgattttga acttttgctt tgccacggaa cggtctgcgt 14100
tgtcgggaag atgcgtgatc tgatccttca actcagcaaa agttcgattt attcaacaaa 14160
gccgccgtcc cgtcaagtca gcgtaatgct ctgccagtgt tacaaccaat taaccaattc 14220
tgattagaaa aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc 14280
aataccatat ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt 14340
ccataggatg gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca 14400
acctattaat ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac 14460
gactgaatcc ggtgagaatg gcaaaagctc tgcattaatg aatcggccaa cgcgcgggga 14520
gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 14580
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 14640
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 14700
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 14760
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 14820
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 14880
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 14940
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 15000
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 15060
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 15120
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 15180
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 15240
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 15300
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 15360
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 15420
ttttgatccg gaatta 15436
<210> 25
<211> 15884
<212> DNA
<213> 人工序列
<220>
<223> 重组载体
<400> 25
attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt 60
taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120
tgtcaaacac tgatagttta aactgaaggc gggaaacgac aatctgatca tgagcggaga 180
attaagggag tcacgttatg acccccgccg atgacgcggg acaagccgtt ttacgtttgg 240
aactgacaga accgcaacgc tgcaggaatt ggccgcagcg gccatttaaa tcaattgggc 300
gcgccagctg cttgtgggga ccagacaaaa aaggaatggt gcagaattgt taggcgcacc 360
taccaaaagc atctttgcct ttattgcaaa gataaagcag attcctctag tacaagtggg 420
gaacaaaata acgtggaaaa gagctgtcct gacagcccac tcactaatgc gtatgacgaa 480
cgcagtgacg accacaaaac tcgagacttt tcaacaaagg gtaatatccg gaaacctcct 540
cggattccat tgcccagcta tctgtcactt tattgtgaag atagtggaaa aggaaggtgg 600
ctcctacaaa tgccatcatt gcgataaagg aaaggctatc gttgaagatg cctctgccga 660
cagtggtccc aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc 720
aaccacgtct tcaaagcaag tggattgatg tgatatctcc actgacgtaa gggatgacga 780
acaatcccac tatccttcgg taccggaccc tagtcaccac accatgatca tcttgtttgt 840
tgtagaatac ccacttgtta cctacaacaa tttggtttgg acgtggaact aaatgcaaga 900
ccttattcct cgtgaagttg ttgagcacct cttgcattgc caccacccag tctggatctc 960
taagtgcatc ctctatcatg tatggctcaa tagaagacac acaagagtaa tgttcacaaa 1020
aatgagcaac ttgagagcga gtgattaacc ccttttgaat gtcaccaagg atggagttga 1080
cggggtgata tcgctgaatt gcttggtgaa ctcttgagtg aggtggtctt tgatcttgaa 1140
tctcttggtc atcctccttt tcttgaacaa cttcatctcc cccttgattg attcgttctt 1200
cttgaggtgg ctcattgtct tgaacttgat cttcttcttc ttcttgagct ggttcctcat 1260
cttaagttgg tggagatgtt tgtatggaat atgatagttg atcatgtgct tgtgaaggct 1320
cttcgggttt ttgtggacac atgtctccaa tggacatgtt tcttagcgcg atgcatggag 1380
cctctttatc atctaaatca tcaagatcaa cttgctctag ttgagagcct ctagtggaca 1440
cacatcttcg ggttaaatgg ttttatggaa tattttttct tcacagatac aaatagtatc 1500
gaatatttca gatatttcat ggttttgtcg aatacaaata taaaatcgga tagagaaaac 1560
taaatttaat tatatccatt tccatccata ttaaaattga atacggatat agatatccat 1620
attagcattt tatttgaata cgaatatata taatttggat gtctagacat tcgaatccat 1680
ctctaattag tgtgggaatg agggacactg aaaaacaatg acgtgcatgg tgacatcata 1740
caatagtaca attctgacga cgatgaagga atttacgtgc ggatcagcga caccacctgg 1800
tttggtggtt cctgtcgccg gaggcgcaag aaataaagag ggcacataac tacgtgaaat 1860
caagcccaat tagtctgcct tggctccctt atgctgtttt aaaaagttta gggttaagtc 1920
attagtagac tgttgcgggt ttagaaattt ttagagaatt ttgtttacaa cagcccctaa 1980
actaaagttt ttgggaacaa attttagtag tcttttaagt tgctctaaga ctatattttt 2040
ttagttgagg aggacagtga caattttgga gttgctctaa aaccatgttt tttagtcgag 2100
tgggacagtg gcaattactt aactacaatg cacaacacca ggaatccagg atgaaaaatt 2160
actacaccga gggctagttt gggaacctca ttttcccaag agattttcat tttcccaaag 2220
aaaattagtt tatttttcct tgggaaaata gaaatccttt ggaaaattgg agtttccaaa 2280
ctagccttga ttttttttcc taagatatgt gcagatcttt ctttgagagg acacaaaaaa 2340
aatggattgg gattgggctc atcgaaggcc gaatattcct atccatcgtt cgtgccggat 2400
taggcccaga accagaaaag agctaggccg ggctgcagta gcactatcct ctgtttcaca 2460
atattatgca cttttgatca ctttatttat gtcaaaaata cttgatacat cacgttttat 2520
tttcactttc gcctctataa aagtattaag ggatttctag acaattcaaa atgtaatttt 2580
ataagactat gtttgtcatt ttataaaaaa aaatagtttg attattttgg tgaacgtgcc 2640
ttggtcaaaa tttgtgggaa cggaggatgc tatcaaattc gtctgcgcag atgtacgccc 2700
agtaacgaag tatcgtcaat cgactgatga ccccgtcacc gtcagcaaga cagcaactca 2760
acattcaaat tcgaccgtaa taacatccac atacatacac ggagtatcaa tctagactag 2820
aggagacggg tgaacgtggt gagcctccgc ccataatgca accctactag tgctagcttt 2880
cggccgcgaa aaaacgtccc cacccccacg tctcaacttt atagccgccc cctccccacc 2940
gccgcggccg ccacgcgcag cagcaacccg gtagcaggag cgcagccagc aagctcaggc 3000
ccccagccct actgccaccg cgccgaacga caaggccgag ccggcggagc accgtccagc 3060
tgaggaggag gaggccgcgg cggccggcga ggatgaggac accggcgccc aggtcgcgcc 3120
catcgtgaag ctggaggagg tcgccgttac cactggagag gaggacgagg acgcgctcct 3180
ggacttgtga ggcatccgcg gccgcttcga ttcccccccc tccccgatcc gatttgccca 3240
tgtcttgttg atctgatgtg cggcggctgt gcaggaaggc gaagctctac cggtaaacca 3300
tggacaacaa ccccaacatc aacgagtgca tcccctacaa ctgcctgagc aaccccgagg 3360
tggaggtgct gggcggcgag cgcatcgaga ccggctacac ccccatcgac atcagcctga 3420
gcctgaccca gttcctgctg agcgagttcg tgcccggcgc cggcttcgtg ctgggcctgg 3480
tggacatcat ctggggcatc ttcggcccca gccagtggga cgccttcctg gtgcagatcg 3540
agcagctgat caaccagcgc atcgaggagt tcgcccgcaa ccaggccatc agccgcctgg 3600
agggcctgag caacctgtac caaatctacg ccgagagctt ccgcgagtgg gaggccgacc 3660
ccaccaaccc cgccctgcgc gaggagatgc gcatccagtt caacgacatg aacagcgccc 3720
tgaccaccgc catccccctg ttcgccgtgc agaactacca ggtgcccctg ctgagcgtgt 3780
acgtgcaggc cgccaacctg cacctgagcg tgctgcgcga cgtcagcgtg ttcggccagc 3840
gctggggctt cgacgccgcc accatcaaca gccgctacaa cgacctgacc cgcctgatcg 3900
gcaactacac cgaccacgcc gtgcgctggt acaacaccgg cctggagcgc gtgtggggtc 3960
cagacagccg cgactggatc aggtacaacc agttccgccg cgagctgacc ctgaccgtgc 4020
tggacatcgt gagcctgttc cccaactacg acagccgcac ctaccccatc cgcaccgtga 4080
gccagctgac ccgcgagatt tacaccaacc ccgtgctgga gaacttcgac ggcagcttcc 4140
gcggcagcgc ccagggcatc gagggcagca tccgcagccc ccacctgatg gacatcctga 4200
acagcatcac catctacacc gacgcccacc gcggcgagta ctactggagc ggccaccaga 4260
tcatggccag ccccgtcggc ttcagcggcc ccgagttcac cttccccctg tacggcacta 4320
tgggcaacgc tgcacctcag cagcgcatcg tggcacagct gggccaggga gtgtaccgca 4380
ccctgagcag caccctgtac cgtcgacctt tcaacatcgg catcaacaac cagcagctga 4440
gcgtgctgga cggcaccgag ttcgcctacg gcaccagcag caacctgccc agcgccgtgt 4500
accgcaagag cggcaccgtg gacagcctgg acgagatccc ccctcagaac aacaacgtgc 4560
cacctcgaca gggcttcagc caccgtctga gccacgtgag catgttccgc agtggcttca 4620
gcaacagcag cgtgagcatc atccgtgcac ctatgttcag ctggattcac cgcagtgccg 4680
agttcaacaa catcatcccc agcagccaga tcacccagat ccccctgacc aagagcacca 4740
acctgggcag cggcaccagc gtggtgaagg gccccggctt caccggcggc gacatcctgc 4800
gccgcaccag ccccggccag atcagcaccc tgcgcgtgaa catcaccgcc cccctgagcc 4860
agcgctaccg cgtccgcatc cgctacgcca gcaccaccaa cctgcagttc cacaccagca 4920
tcgacggccg ccccatcaac cagggcaact tcagcgccac catgagcagc ggcagcaacc 4980
tgcagagcgg cagcttccgc accgtgggct tcaccacccc cttcaacttc agcaacggca 5040
gcagcgtgtt caccctgagc gcccacgtgt tcaacagcgg caacgaggtg tacatcgacc 5100
gcatcgagtt cgtgcccgcc gaggtgacct tcgaggccga gtacgacctg gagagggctc 5160
agaaggccgt gaacgagctg ttcaccagca gcaaccagat cggcctgaag accgacgtga 5220
ccgactacca catcgatcag gtgtaggagc tcaggttgaa ggcaaacaag ggtcaaatgg 5280
atgccattcc attcatttcg tttccaaggt tcagcttccc cgcaaatttt cattgtgttt 5340
tctccgagat gaatgtttgt gttcggtgaa atcagagtcg tcagtcatct acatagcttt 5400
tcttggttga tagactgtta ttttaagtcg catgtttatc tgggatggct ggggtcagca 5460
tgtttgtaca attatttgga gttgcttttg gaatggtcgc ggtttgatga gttgcctaca 5520
gccatgagat gtcttttcgc tccactttta tggttcattc gttctcaata atatgggatg 5580
ctatacttgt gttgatccat tatcttgatg catcgttgtc tgtgcactgc aacaacaata 5640
cccatctgaa cacccctatc aataaaatac catttttttt ctttccatcc cactaatcta 5700
ggcccacttt ctcactcttt tcttatccac tatattgtca atatagaatc tggggagaga 5760
gagagagaga gagagattga gagagagaga gagagagaga tttaggctcc ctcccttcct 5820
atattcaaaa taggtatcgc ctttgggtca cctgttggaa tgatttattt tagtatcgtc 5880
catatttaat ttaaacaaat gttgaatttt acatgcatat tgatttaaag tttgttagtt 5940
tatgagcatc accaactaag atctctaatg ccaaagagca tctccactag ttccaaaaaa 6000
ctctctaaat ttaatttagg atgttagtaa ccagaaatta tgctccaaca gtttcctaaa 6060
tgagttcctt aaatatacca actttttaaa tatctctatt tagtcaaact tgagaaattg 6120
tttcacactc ccaatagttg tcatcaatca catcgtaaaa tcatttgagt tcgcacccgt 6180
gtacaagtgg tgcactttaa ataaattaaa ttacgaaaat gataaattta ctatcgagtt 6240
agcataattt aaaaatatat aacaacataa gaactgggaa cggaccgcga tcgcttaatt 6300
aagcttgcat gcctgcagtg cagcgtgacc cggtcgtgcc cctctctaga gataatgagc 6360
attgcatgtc taagttataa aaaattacca catatttttt ttgtcacact tgtttgaagt 6420
gcagtttatc tatctttata catatattta aactttactc tacgaataat ataatctata 6480
gtactacaat aatatcagtg ttttagagaa tcatataaat gaacagttag acatggtcta 6540
aaggacaatt gagtattttg acaacaggac tctacagttt tatcttttta gtgtgcatgt 6600
gttctccttt ttttttgcaa atagcttcac ctatataata cttcatccat tttattagta 6660
catccattta gggtttaggg ttaatggttt ttatagacta atttttttag tacatctatt 6720
ttattctatt ttagcctcta aattaagaaa actaaaactc tattttagtt tttttattta 6780
ataatttaga tataaaatag aataaaataa agtgactaaa aattaaacaa atacccttta 6840
agaaattaaa aaaactaagg aaacattttt cttgtttcga gtagataatg ccagcctgtt 6900
aaacgccgtc gacgagtcta acggacacca accagcgaac cagcagcgtc gcgtcgggcc 6960
aagcgaagca gacggcacgg catctctgtc gctgcctctg gacccctctc gagagttccg 7020
ctccaccgtt ggacttgctc cgctgtcggc atccagaaat tgcgtggcgg agcggcagac 7080
gtgagccggc acggcaggcg gcctcctcct cctctcacgg caccggcagc tacgggggat 7140
tcctttccca ccgctccttc gctttccctt cctcgcccgc cgtaataaat agacaccccc 7200
tccacaccct ctttccccaa cctcgtgttg ttcggagcgc acacacacac aaccagatct 7260
cccccaaatc cacccgtcgg cacctccgct tcaaggtacg ccgctcgtcc tccccccccc 7320
cccctctcta ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac 7380
ttctgttcat gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta 7440
cacggatgcg acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt 7500
ggggaatcct gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt 7560
gtttcgttgc atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt 7620
gtttgtcggg tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt 7680
gggcggtcgt tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat 7740
tttggatctg tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg 7800
aaatatcgat ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag 7860
atgctttttg ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc 7920
tagatcggag tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta 7980
tgtgtgtgtc atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg 8040
ataggtatac atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat 8100
ctattcatat gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa 8160
ttattttgat cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt 8220
tagccctgcc ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc 8280
ctgttgtttg gtgttacttc tgcagggatc cccgatcatg caaaaactca ttaactcagt 8340
gcaaaactat gcctggggca gcaaaacggc gttgactgaa ctttatggta tggaaaatcc 8400
gtccagccag ccgatggccg agctgtggat gggcgcacat ccgaaaagca gttcacgagt 8460
gcagaatgcc gccggagata tcgtttcact gcgtgatgtg attgagagtg ataaatcgac 8520
tctgctcgga gaggccgttg ccaaacgctt tggcgaactg cctttcctgt tcaaagtatt 8580
atgcgcagca cagccactct ccattcaggt tcatccaaac aaacacaatt ctgaaatcgg 8640
ttttgccaaa gaaaatgccg caggtatccc gatggatgcc gccgagcgta actataaaga 8700
tcctaaccac aagccggagc tggtttttgc gctgacgcct ttccttgcga tgaacgcgtt 8760
tcgtgaattt tccgagattg tctccctact ccagccggtc gcaggtgcac atccggcgat 8820
tgctcacttt ttacaacagc ctgatgccga acgtttaagc gaactgttcg ccagcctgtt 8880
gaatatgcag ggtgaagaaa aatcccgcgc gctggcgatt ttaaaatcgg ccctcgatag 8940
ccagcagggt gaaccgtggc aaacgattcg tttaatttct gaattttacc cggaagacag 9000
cggtctgttc tccccgctat tgctgaatgt ggtgaaattg aaccctggcg aagcgatgtt 9060
cctgttcgct gaaacaccgc acgcttacct gcaaggcgtg gcgctggaag tgatggcaaa 9120
ctccgataac gtgctgcgtg cgggtctgac gcctaaatac attgatattc cggaactggt 9180
tgccaatgtg aaattcgaag ccaaaccggc taaccagttg ttgacccagc cggtgaaaca 9240
aggtgcagaa ctggacttcc cgattccagt ggatgatttt gccttctcgc tgcatgacct 9300
tagtgataaa gaaaccacca ttagccagca gagtgccgcc attttgttct gcgtcgaagg 9360
cgatgcaacg ttgtggaaag gttctcagca gttacagctt aaaccgggtg aatcagcgtt 9420
tattgccgcc aacgaatcac cggtgactgt caaaggccac ggccgtttag cgcgtgttta 9480
caacaagctg taagagctta ctgaaaaaat taacatctct tgctaagctg ggagctcgtc 9540
atgggtcgtt taagctgccg atgtgcctgc gtcgtctggt gccctctctc catatggagg 9600
ttgtcaaagt atctgctgtt cgtgtcatga gtcgtgtcag tgttggttta ataatggacc 9660
ggttgtgttg tgtgtgcgta ctacccagaa ctatgacaaa tcatgaataa gtttgatgtt 9720
tgaaattaaa gcctgtgctc attatgttct gtctttcagt tgtctcctaa tatttgcctg 9780
caggtactgg ctatctaccg tttcttactt aggaggtgtt tgaatgcact aaaactaata 9840
gttagtggct aaaattagtt aaaacatcca aacaccatag ctaatagttg aactattagc 9900
tatttttgga aaattagtta atagtgaggt agttatttgt tagctagcta attcaactaa 9960
caatttttag ccaactaaca attagtttca gtgcattcaa acaccccctt aatgttaacg 10020
tggttctatc taccgtctcc taatatatgg ttgattgttc ggtttgttgc tatgctattg 10080
ggttctgatt gctgctagtt cttgctgaat ccagaagttc tcgtagtata gctcagattc 10140
atattattta tttgagtgat aagtgatcca ggttattact atgttagcta ggtttttttt 10200
acaaggataa attatctgtg atcataattc ttatgaaagc tttatgtttc ctggaggcag 10260
tggcatgcaa tgcatgacag caacttgatc acaccagctg aggtagatac ggtaacaagg 10320
ttcttaaatc tgttcaccaa atcattggag aacacacata cacattcttg ccagtcttgg 10380
ttagagaaat ttcatgacaa aatgccaaag ctgtcttgac tcttcacttt tggccatgag 10440
tcgtgactta gtttggttta atggaccggt tctcctagct tgttctactc aaaactgttg 10500
ttgatgcgaa taagttgtga tggttgatct ctggattttg ttttgctctc aatagtggac 10560
gagattagat agcccggaaa tttaccggtg cccgggcggc cagcatggcc gtatccgcaa 10620
tgtgttatta agttgtctaa gcgtcaattt gtttacacca caatatatcc tgccaccagc 10680
cagccaacag ctccccgacc ggcagctcgg cacaaaatca ccactcgata caggcagccc 10740
atcagaatta attctcatgt ttgacagctt atcatcgact gcacggtgca ccaatgcttc 10800
tggcgtcagg cagccatcgg aagctgtggt atggctgtgc aggtcgtaaa tcactgcata 10860
attcgtgtcg ctcaaggcgc actcccgttc tggataatgt tttttgcgcc gacatcataa 10920
cggttctggc aaatattctg aaatgagctg ttgacaatta atcatccggc tcgtataatg 10980
tgtggaattg tgagcggata acaatttcac acaggaaaca gaccatgagg gaagcgttga 11040
tcgccgaagt atcgactcaa ctatcagagg tagttggcgt catcgagcgc catctcgaac 11100
cgacgttgct ggccgtacat ttgtacggct ccgcagtgga tggcggcctg aagccacaca 11160
gtgatattga tttgctggtt acggtgaccg taaggcttga tgaaacaacg cggcgagctt 11220
tgatcaacga ccttttggaa acttcggctt cccctggaga gagcgagatt ctccgcgctg 11280
tagaagtcac cattgttgtg cacgacgaca tcattccgtg gcgttatcca gctaagcgcg 11340
aactgcaatt tggagaatgg cagcgcaatg acattcttgc aggtatcttc gagccagcca 11400
cgatcgacat tgatctggct atcttgctga caaaagcaag agaacatagc gttgccttgg 11460
taggtccagc ggcggaggaa ctctttgatc cggttcctga acaggatcta tttgaggcgc 11520
taaatgaaac cttaacgcta tggaactcgc cgcccgactg ggctggcgat gagcgaaatg 11580
tagtgcttac gttgtcccgc atttggtaca gcgcagtaac cggcaaaatc gcgccgaagg 11640
atgtcgctgc cgactgggca atggagcgcc tgccggccca gtatcagccc gtcatacttg 11700
aagctaggca ggcttatctt ggacaagaag atcgcttggc ctcgcgcgca gatcagttgg 11760
aagaatttgt tcactacgtg aaaggcgaga tcaccaaagt agtcggcaaa taaagctcta 11820
gtggatctcc gtacccgggg atctggctcg cggcggacgc acgacgccgg ggcgagacca 11880
taggcgatct cctaaatcaa tagtagctgt aacctcgaag cgtttcactt gtaacaacga 11940
ttgagaattt ttgtcataaa attgaaatac ttggttcgca tttttgtcat ccgcggtcag 12000
ccgcaattct gacgaactgc ccatttagct ggagatgatt gtacatcctt cacgtgaaaa 12060
tttctcaagc gctgtgaaca agggttcaga ttttagattg aaaggtgagc cgttgaaaca 12120
cgttcttctt gtcgatgacg acgtcgctat gcggcatctt attattgaat accttacgat 12180
ccacgccttc aaagtgaccg cggtagccga cagcacccag ttcacaagag tactctcttc 12240
cgcgacggtc gatgtcgtgg ttgttgatct agatttaggt cgtgaagatg ggctcgagat 12300
cgttcgtaat ctggcggcaa agtctgatat tccaatcata attatcagtg gcgaccgcct 12360
tgaggagacg gataaagttg ttgcactcga gctaggagca agtgatttta tcgctaagcc 12420
gttcagtatc agagagtttc tagcacgcat tcgggttgcc ttgcgcgtgc gccccaacgt 12480
tgtccgctcc aaagaccgac ggtctttttg ttttactgac tggacactta atctcaggca 12540
acgtcgcttg atgtccgaag ctggcggtga ggtgaaactt acggcaggtg agttcaatct 12600
tctcctcgcg tttttagaga aaccccgcga cgttctatcg cgcgagcaac ttctcattgc 12660
cagtcgagta cgcgacgagg aggtttatga caggagtata gatgttctca ttttgaggct 12720
gcgccgcaaa cttgaggcag atccgtcaag ccctcaactg ataaaaacag caagaggtgc 12780
cggttatttc tttgacgcgg acgtgcaggt ttcgcacggg gggacgatgg cagcctgagc 12840
caattcccag atccccgagg aatcggcgtg agcggtcgca aaccatccgg cccggtacaa 12900
atcggcgcgg cgctgggtga tgacctggtg gagaagttga aggccgcgca ggccgcccag 12960
cggcaacgca tcgaggcaga agcacgcccc ggtgaatcgt ggcaagcggc cgctgatcga 13020
atccgcaaag aatcccggca accgccggca gccggtgcgc cgtcgattag gaagccgccc 13080
aagggcgacg agcaaccaga ttttttcgtt ccgatgctct atgacgtggg cacccgcgat 13140
agtcgcagca tcatggacgt ggccgttttc cgtctgtcga agcgtgaccg acgagctggc 13200
gaggtgatcc gctacgagct tccagacggg cacgtagagg tttccgcagg gccggccggc 13260
atggccagtg tgtgggatta cgacctggta ctgatggcgg tttcccatct aaccgaatcc 13320
atgaaccgat accgggaagg gaagggagac aagcccggcc gcgtgttccg tccacacgtt 13380
gcggacgtac tcaagttctg ccggcgagcc gatggcggaa agcagaaaga cgacctggta 13440
gaaacctgca ttcggttaaa caccacgcac gttgccatgc agcgtacgaa gaaggccaag 13500
aacggccgcc tggtgacggt atccgagggt gaagccttga ttagccgcta caagatcgta 13560
aagagcgaaa ccgggcggcc ggagtacatc gagatcgagc tagctgattg gatgtaccgc 13620
gagatcacag aaggcaagaa cccggacgtg ctgacggttc accccgatta ctttttgatc 13680
gatcccggca tcggccgttt tctctaccgc ctggcacgcc gcgccgcagg caaggcagaa 13740
gccagatggt tgttcaagac gatctacgaa cgcagtggca gcgccggaga gttcaagaag 13800
ttctgtttca ccgtgcgcaa gctgatcggg tcaaatgacc tgccggagta cgatttgaag 13860
gaggaggcgg ggcaggctgg cccgatccta gtcatgcgct accgcaacct gatcgagggc 13920
gaagcatccg ccggttccta atgtacggag cagatgctag ggcaaattgc cctagcaggg 13980
gaaaaaggtc gaaaaggtct ctttcctgtg gatagcacgt acattgggaa cccaaagccg 14040
tacattggga accggaaccc gtacattggg aacccaaagc cgtacattgg gaaccggtca 14100
cacatgtaag tgactgatat aaaagagaaa aaaggcgatt tttccgccta aaactcttta 14160
aaacttatta aaactcttaa aacccgcctg gcctgtgcat aactgtctgg ccagcgcaca 14220
gccgaagagc tgcaaaaagc gcctaccctt cggtcgctgc gctccctacg ccccgccgct 14280
tcgcgtcggc ctatcgcggc cgctggccgc tcaaaaatgg ctggcctacg gccaggcaat 14340
ctaccagggc gcggacaagc cgcgccgtcg ccactcgacc gccggcgctg aggtctgcct 14400
cgtgaagaag gtgttgctga ctcataccag gcctgaatcg ccccatcatc cagccagaaa 14460
gtgagggagc cacggttgat gagagctttg ttgtaggtgg accagttggt gattttgaac 14520
ttttgctttg ccacggaacg gtctgcgttg tcgggaagat gcgtgatctg atccttcaac 14580
tcagcaaaag ttcgatttat tcaacaaagc cgccgtcccg tcaagtcagc gtaatgctct 14640
gccagtgtta caaccaatta accaattctg attagaaaaa ctcatcgagc atcaaatgaa 14700
actgcaattt attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta 14760
atgaaggaga aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg 14820
cgattccgac tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt 14880
tatcaagtga gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagctctg 14940
cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct 15000
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 15060
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 15120
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 15180
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 15240
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 15300
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 15360
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 15420
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 15480
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 15540
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 15600
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 15660
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 15720
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 15780
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 15840
ttatcaaaaa ggatcttcac ctagatcctt ttgatccgga atta 15884
<210> 26
<211> 15689
<212> DNA
<213> 人工序列
<220>
<223> 重组载体
<400> 26
attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt 60
taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120
tgtcaaacac tgatagttta aactgaaggc gggaaacgac aatctgatca tgagcggaga 180
attaagggag tcacgttatg acccccgccg atgacgcggg acaagccgtt ttacgtttgg 240
aactgacaga accgcaacgc tgcaggaatt ggccgcagcg gccatttaaa tcaattgggc 300
gcgccagctg cttgtgggga ccagacaaaa aaggaatggt gcagaattgt taggcgcacc 360
taccaaaagc atctttgcct ttattgcaaa gataaagcag attcctctag tacaagtggg 420
gaacaaaata acgtggaaaa gagctgtcct gacagcccac tcactaatgc gtatgacgaa 480
cgcagtgacg accacaaaac tcgagacttt tcaacaaagg gtaatatccg gaaacctcct 540
cggattccat tgcccagcta tctgtcactt tattgtgaag atagtggaaa aggaaggtgg 600
ctcctacaaa tgccatcatt gcgataaagg aaaggctatc gttgaagatg cctctgccga 660
cagtggtccc aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc 720
aaccacgtct tcaaagcaag tggattgatg tgatatctcc actgacgtaa gggatgacga 780
acaatcccac tatccttcgg taccggaccc tttgtattgt tgtatgtaat gaataatctt 840
tatatatata tatatatata tatatatata tatatatata tatatatata tatatatgtg 900
tgtgtgtggg ggggtgtggg ggtgtgtgta ttgatgtctc ttggacaaca agattacaca 960
aaacacaatt agaataaaaa aatatcctcg tgtatataaa cttgtccgta taccatatta 1020
gaacacataa attttaggca acattttttc catcaacatt cttcaatcat caaccaaaat 1080
ttacggatac acaagataag agggggtatg taaggttgta cgtaatgggc tacatgataa 1140
catcaaagat tatgcaagca aatctcaatc caccaggcga tcataaacat catagttcac 1200
atgcttcagt tttaaagcca tcgtagttcc cgtgcaaaga caaaaacatt agaattattc 1260
aatacaagtt gcacaagata gttcaataaa atttaaacca caatagtatt atccaacaaa 1320
gctagttcat accattatag tttctagtaa acaagaatag agaacatata ttaagcaaac 1380
agaccacata ggataaggct aaggatgtat ttttgtctat tgttttctgt gacatcgatc 1440
tcgtttgcac gagtaaaact aaaacatgag aaaattccga taaaaaatag gaatctagaa 1500
atacgaacgg aaaacactaa accattttta ttcctgtttc taaaatatat catctcgttt 1560
ctgtttttct ctgtaaatat gaaaacgatc agatcatagt taaaacggaa tacagtaccg 1620
gacgaaacaa tatttctctc tcgtttcccc cttatagcat ctccaaaagc tccccagaag 1680
tctcccctaa atctattttt ttggaaaaac acaaaaacat gtctccaaca gttcctctaa 1740
agcgccccca actttttcat agcccttaaa actccctcat ttgtagctac aaatgagggg 1800
ttttttgggc tccccagaaa caaactgctg ctttaagatg tttggttgag gagccaagta 1860
gaatggagtc gtttcatccc tgattctagg aacggagccg ttctgttctg tgtttggtaa 1920
tctggaacgg agcggctctg ttttttgttt ggttgcagag tgaacggaac ggagcgtgac 1980
tgtgagagcg ggatgagaac ggagcggctc cgttcggttg attttttgga gcggaatggt 2040
tccggatttg aggagaatat tccataattg gagtcattcc gttctagttc ctttataacc 2100
aaacagcaac aaaactggga tagaatggtt ccgttctact tggctcttca accaaacact 2160
aactaaggga cctgttggag aaatgattaa aatttaccct cacttattat ttagatattc 2220
cttaaaacta attttgagaa gtcgttttat ggagtgctct tggagatgct cttagttcgt 2280
agatctgatt gtgtgtatgt atgtaagcat atgcgtctgt actacgatcc acggtaaaaa 2340
agtcacaaac atataataat agcgtcattc aataaattga taacgtaaag tataaatgaa 2400
cttttaactc tgtttgagta aacaactcgt gcagagactg caatgaaatc tattattttt 2460
tctaaaataa ttatacaagt tgaggaaatg ctatttgttc cactaagcga cgatgtattt 2520
tgttttttaa aaaaatcgac gaggtactgc tcggttatta ttttcacatg caccgcgcgt 2580
tgtttttggg ccggcccatt tgtattgcga atttgcggag acgaatatga ccgaatggag 2640
tttagaaagc ccagctcact taggattgtc tattttctca agaaaagaga gaatgggccc 2700
aaaggcctaa acaccaaaac ccgatccgct tatgggatgt catggacatg gagtctggga 2760
ccgtccggca gatgagacga cagccgtcgg atcagaaacc ctagcgcggg aggctctccc 2820
tattaatacc caccctgcac cccgcgggag gagtctttcc tagggtttcg tagcttctag 2880
ccgccgccgc gtccgcctcg ccaagcgcag cagccgccgc agcacatcgc tctctcgatc 2940
tcagccatag cggaggtgga gcagcaacag gacacgccga agctcttcaa ccgctggacc 3000
ttcgatgatg tccaggtacg cgaacgagtc ttcgcatctc tgcatgcttc gattctttag 3060
ccttgccgct actagcagtg gatggaaccg acgatgaaat ctgcaggtga acgacatctc 3120
gctgtaaacc atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag 3180
caaccccgag gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga 3240
catcagcctg agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt 3300
gctgggcctg gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct 3360
ggtgcagatc gagcagctga tcaaccagcg catcgaggag ttcgcccgca accaggccat 3420
cagccgcctg gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg 3480
ggaggccgac cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat 3540
gaacagcgcc ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct 3600
gctgagcgtg tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt 3660
gttcggccag cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac 3720
ccgcctgatc ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg 3780
cgtgtggggt ccagacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac 3840
cctgaccgtg ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat 3900
ccgcaccgtg agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga 3960
cggcagcttc cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat 4020
ggacatcctg aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag 4080
cggccaccag atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct 4140
gtacggcact atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg 4200
agtgtaccgc accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa 4260
ccagcagctg agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc 4320
cagcgccgtg taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa 4380
caacaacgtg ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg 4440
cagtggcttc agcaacagca gcgtgagcat catccgtgca cctatgttca gctggattca 4500
ccgcagtgcc gagttcaaca acatcatccc cagcagccag atcacccaga tccccctgac 4560
caagagcacc aacctgggca gcggcaccag cgtggtgaag ggccccggct tcaccggcgg 4620
cgacatcctg cgccgcacca gccccggcca gatcagcacc ctgcgcgtga acatcaccgc 4680
ccccctgagc cagcgctacc gcgtccgcat ccgctacgcc agcaccacca acctgcagtt 4740
ccacaccagc atcgacggcc gccccatcaa ccagggcaac ttcagcgcca ccatgagcag 4800
cggcagcaac ctgcagagcg gcagcttccg caccgtgggc ttcaccaccc ccttcaactt 4860
cagcaacggc agcagcgtgt tcaccctgag cgcccacgtg ttcaacagcg gcaacgaggt 4920
gtacatcgac cgcatcgagt tcgtgcccgc cgaggtgacc ttcgaggccg agtacgacct 4980
ggagagggct cagaaggccg tgaacgagct gttcaccagc agcaaccaga tcggcctgaa 5040
gaccgacgtg accgactacc acatcgatca ggtgtaggag ctcactgagc ttgtatcctg 5100
gtgcactctg cgctggaaac ttttatgtcg ctggcagtcg tatcggttct tgttttacca 5160
atgtttagag ttttttgaga cctatatgcg gttttggttt tcagtgcaca attaaaatta 5220
ctgagtaatg tagttgattg ggaacagaaa tgtttggtgc ctggtttacc gaactccagt 5280
tctcttgtca tttttcttta ttctatagtc tgtattatgt atgcgtatga gtattgagat 5340
gattctgcat ttgaattgtc tgctttgttg ctgtcgctgt atgcgtacca atggtaacag 5400
ggtagttgtg ggaagtagac acggccggtt ctatgttttc gtgcttccgc ggttcaggct 5460
ggttaagcct atggagcgta cgcacgctcc tcccgtctct ccgtgtcctg catgctggca 5520
acaggagtgc ggcccagcgc acgccctaat cgacggcggt atatttgtct gtccctccat 5580
tttgtggtga ggctattcgc aaccgttatc cttaaatttt ttctcctata tcactattcc 5640
cctatttttc cttatatttt ttcatcttca gcagcggttc tcctaaatac tccctctata 5700
cccactacaa ctataaatat tattttccat atctattcat catttattac cacttttttt 5760
caactaaaaa atactcgcat gcatggattt tacggaaggg gggctgtcac agtatcccct 5820
tgatctgctg tgagagaaaa gggggacact aggtagggtg caaggtaggg agcagcggtg 5880
cgggtggtag cgtggttact gcagccgcta cgacgtgagc agtgttaggg gagaggatgg 5940
aagggtggtg cgctgctgca gataacccga gcgccaaaca ctcatgggtg ataattaggt 6000
ataagaaaag atattttatg gttaggagag tatagagaga atttagtggt aacttctatg 6060
gaagatggaa aaataggggt gaaatcggac cgcgatcgct taattaagct tgcatgcctg 6120
cagtgcagcg tgacccggtc gtgcccctct ctagagataa tgagcattgc atgtctaagt 6180
tataaaaaat taccacatat tttttttgtc acacttgttt gaagtgcagt ttatctatct 6240
ttatacatat atttaaactt tactctacga ataatataat ctatagtact acaataatat 6300
cagtgtttta gagaatcata taaatgaaca gttagacatg gtctaaagga caattgagta 6360
ttttgacaac aggactctac agttttatct ttttagtgtg catgtgttct cctttttttt 6420
tgcaaatagc ttcacctata taatacttca tccattttat tagtacatcc atttagggtt 6480
tagggttaat ggtttttata gactaatttt tttagtacat ctattttatt ctattttagc 6540
ctctaaatta agaaaactaa aactctattt tagttttttt atttaataat ttagatataa 6600
aatagaataa aataaagtga ctaaaaatta aacaaatacc ctttaagaaa ttaaaaaaac 6660
taaggaaaca tttttcttgt ttcgagtaga taatgccagc ctgttaaacg ccgtcgacga 6720
gtctaacgga caccaaccag cgaaccagca gcgtcgcgtc gggccaagcg aagcagacgg 6780
cacggcatct ctgtcgctgc ctctggaccc ctctcgagag ttccgctcca ccgttggact 6840
tgctccgctg tcggcatcca gaaattgcgt ggcggagcgg cagacgtgag ccggcacggc 6900
aggcggcctc ctcctcctct cacggcaccg gcagctacgg gggattcctt tcccaccgct 6960
ccttcgcttt cccttcctcg cccgccgtaa taaatagaca ccccctccac accctctttc 7020
cccaacctcg tgttgttcgg agcgcacaca cacacaacca gatctccccc aaatccaccc 7080
gtcggcacct ccgcttcaag gtacgccgct cgtcctcccc ccccccccct ctctaccttc 7140
tctagatcgg cgttccggtc catggttagg gcccggtagt tctacttctg ttcatgtttg 7200
tgttagatcc gtgtttgtgt tagatccgtg ctgctagcgt tcgtacacgg atgcgacctg 7260
tacgtcagac acgttctgat tgctaacttg ccagtgtttc tctttgggga atcctgggat 7320
ggctctagcc gttccgcaga cgggatcgat ttcatgattt tttttgtttc gttgcatagg 7380
gtttggtttg cccttttcct ttatttcaat atatgccgtg cacttgtttg tcgggtcatc 7440
ttttcatgct tttttttgtc ttggttgtga tgatgtggtc tggttgggcg gtcgttctag 7500
atcggagtag aattctgttt caaactacct ggtggattta ttaattttgg atctgtatgt 7560
gtgtgccata catattcata gttacgaatt gaagatgatg gatggaaata tcgatctagg 7620
ataggtatac atgttgatgc gggttttact gatgcatata cagagatgct ttttgttcgc 7680
ttggttgtga tgatgtggtg tggttgggcg gtcgttcatt cgttctagat cggagtagaa 7740
tactgtttca aactacctgg tgtatttatt aattttggaa ctgtatgtgt gtgtcataca 7800
tcttcatagt tacgagttta agatggatgg aaatatcgat ctaggatagg tatacatgtt 7860
gatgtgggtt ttactgatgc atatacatga tggcatatgc agcatctatt catatgctct 7920
aaccttgagt acctatctat tataataaac aagtatgttt tataattatt ttgatcttga 7980
tatacttgga tgatggcata tgcagcagct atatgtggat ttttttagcc ctgccttcat 8040
acgctattta tttgcttggt actgtttctt ttgtcgatgc tcaccctgtt gtttggtgtt 8100
acttctgcag ggatccccga tcatgcaaaa actcattaac tcagtgcaaa actatgcctg 8160
gggcagcaaa acggcgttga ctgaacttta tggtatggaa aatccgtcca gccagccgat 8220
ggccgagctg tggatgggcg cacatccgaa aagcagttca cgagtgcaga atgccgccgg 8280
agatatcgtt tcactgcgtg atgtgattga gagtgataaa tcgactctgc tcggagaggc 8340
cgttgccaaa cgctttggcg aactgccttt cctgttcaaa gtattatgcg cagcacagcc 8400
actctccatt caggttcatc caaacaaaca caattctgaa atcggttttg ccaaagaaaa 8460
tgccgcaggt atcccgatgg atgccgccga gcgtaactat aaagatccta accacaagcc 8520
ggagctggtt tttgcgctga cgcctttcct tgcgatgaac gcgtttcgtg aattttccga 8580
gattgtctcc ctactccagc cggtcgcagg tgcacatccg gcgattgctc actttttaca 8640
acagcctgat gccgaacgtt taagcgaact gttcgccagc ctgttgaata tgcagggtga 8700
agaaaaatcc cgcgcgctgg cgattttaaa atcggccctc gatagccagc agggtgaacc 8760
gtggcaaacg attcgtttaa tttctgaatt ttacccggaa gacagcggtc tgttctcccc 8820
gctattgctg aatgtggtga aattgaaccc tggcgaagcg atgttcctgt tcgctgaaac 8880
accgcacgct tacctgcaag gcgtggcgct ggaagtgatg gcaaactccg ataacgtgct 8940
gcgtgcgggt ctgacgccta aatacattga tattccggaa ctggttgcca atgtgaaatt 9000
cgaagccaaa ccggctaacc agttgttgac ccagccggtg aaacaaggtg cagaactgga 9060
cttcccgatt ccagtggatg attttgcctt ctcgctgcat gaccttagtg ataaagaaac 9120
caccattagc cagcagagtg ccgccatttt gttctgcgtc gaaggcgatg caacgttgtg 9180
gaaaggttct cagcagttac agcttaaacc gggtgaatca gcgtttattg ccgccaacga 9240
atcaccggtg actgtcaaag gccacggccg tttagcgcgt gtttacaaca agctgtaaga 9300
gcttactgaa aaaattaaca tctcttgcta agctgggagc tcgtcatggg tcgtttaagc 9360
tgccgatgtg cctgcgtcgt ctggtgccct ctctccatat ggaggttgtc aaagtatctg 9420
ctgttcgtgt catgagtcgt gtcagtgttg gtttaataat ggaccggttg tgttgtgtgt 9480
gcgtactacc cagaactatg acaaatcatg aataagtttg atgtttgaaa ttaaagcctg 9540
tgctcattat gttctgtctt tcagttgtct cctaatattt gcctgcaggt actggctatc 9600
taccgtttct tacttaggag gtgtttgaat gcactaaaac taatagttag tggctaaaat 9660
tagttaaaac atccaaacac catagctaat agttgaacta ttagctattt ttggaaaatt 9720
agttaatagt gaggtagtta tttgttagct agctaattca actaacaatt tttagccaac 9780
taacaattag tttcagtgca ttcaaacacc cccttaatgt taacgtggtt ctatctaccg 9840
tctcctaata tatggttgat tgttcggttt gttgctatgc tattgggttc tgattgctgc 9900
tagttcttgc tgaatccaga agttctcgta gtatagctca gattcatatt atttatttga 9960
gtgataagtg atccaggtta ttactatgtt agctaggttt tttttacaag gataaattat 10020
ctgtgatcat aattcttatg aaagctttat gtttcctgga ggcagtggca tgcaatgcat 10080
gacagcaact tgatcacacc agctgaggta gatacggtaa caaggttctt aaatctgttc 10140
accaaatcat tggagaacac acatacacat tcttgccagt cttggttaga gaaatttcat 10200
gacaaaatgc caaagctgtc ttgactcttc acttttggcc atgagtcgtg acttagtttg 10260
gtttaatgga ccggttctcc tagcttgttc tactcaaaac tgttgttgat gcgaataagt 10320
tgtgatggtt gatctctgga ttttgttttg ctctcaatag tggacgagat tagatagccc 10380
ggaaatttac cggtgcccgg gcggccagca tggccgtatc cgcaatgtgt tattaagttg 10440
tctaagcgtc aatttgttta caccacaata tatcctgcca ccagccagcc aacagctccc 10500
cgaccggcag ctcggcacaa aatcaccact cgatacaggc agcccatcag aattaattct 10560
catgtttgac agcttatcat cgactgcacg gtgcaccaat gcttctggcg tcaggcagcc 10620
atcggaagct gtggtatggc tgtgcaggtc gtaaatcact gcataattcg tgtcgctcaa 10680
ggcgcactcc cgttctggat aatgtttttt gcgccgacat cataacggtt ctggcaaata 10740
ttctgaaatg agctgttgac aattaatcat ccggctcgta taatgtgtgg aattgtgagc 10800
ggataacaat ttcacacagg aaacagacca tgagggaagc gttgatcgcc gaagtatcga 10860
ctcaactatc agaggtagtt ggcgtcatcg agcgccatct cgaaccgacg ttgctggccg 10920
tacatttgta cggctccgca gtggatggcg gcctgaagcc acacagtgat attgatttgc 10980
tggttacggt gaccgtaagg cttgatgaaa caacgcggcg agctttgatc aacgaccttt 11040
tggaaacttc ggcttcccct ggagagagcg agattctccg cgctgtagaa gtcaccattg 11100
ttgtgcacga cgacatcatt ccgtggcgtt atccagctaa gcgcgaactg caatttggag 11160
aatggcagcg caatgacatt cttgcaggta tcttcgagcc agccacgatc gacattgatc 11220
tggctatctt gctgacaaaa gcaagagaac atagcgttgc cttggtaggt ccagcggcgg 11280
aggaactctt tgatccggtt cctgaacagg atctatttga ggcgctaaat gaaaccttaa 11340
cgctatggaa ctcgccgccc gactgggctg gcgatgagcg aaatgtagtg cttacgttgt 11400
cccgcatttg gtacagcgca gtaaccggca aaatcgcgcc gaaggatgtc gctgccgact 11460
gggcaatgga gcgcctgccg gcccagtatc agcccgtcat acttgaagct aggcaggctt 11520
atcttggaca agaagatcgc ttggcctcgc gcgcagatca gttggaagaa tttgttcact 11580
acgtgaaagg cgagatcacc aaagtagtcg gcaaataaag ctctagtgga tctccgtacc 11640
cggggatctg gctcgcggcg gacgcacgac gccggggcga gaccataggc gatctcctaa 11700
atcaatagta gctgtaacct cgaagcgttt cacttgtaac aacgattgag aatttttgtc 11760
ataaaattga aatacttggt tcgcattttt gtcatccgcg gtcagccgca attctgacga 11820
actgcccatt tagctggaga tgattgtaca tccttcacgt gaaaatttct caagcgctgt 11880
gaacaagggt tcagatttta gattgaaagg tgagccgttg aaacacgttc ttcttgtcga 11940
tgacgacgtc gctatgcggc atcttattat tgaatacctt acgatccacg ccttcaaagt 12000
gaccgcggta gccgacagca cccagttcac aagagtactc tcttccgcga cggtcgatgt 12060
cgtggttgtt gatctagatt taggtcgtga agatgggctc gagatcgttc gtaatctggc 12120
ggcaaagtct gatattccaa tcataattat cagtggcgac cgccttgagg agacggataa 12180
agttgttgca ctcgagctag gagcaagtga ttttatcgct aagccgttca gtatcagaga 12240
gtttctagca cgcattcggg ttgccttgcg cgtgcgcccc aacgttgtcc gctccaaaga 12300
ccgacggtct ttttgtttta ctgactggac acttaatctc aggcaacgtc gcttgatgtc 12360
cgaagctggc ggtgaggtga aacttacggc aggtgagttc aatcttctcc tcgcgttttt 12420
agagaaaccc cgcgacgttc tatcgcgcga gcaacttctc attgccagtc gagtacgcga 12480
cgaggaggtt tatgacagga gtatagatgt tctcattttg aggctgcgcc gcaaacttga 12540
ggcagatccg tcaagccctc aactgataaa aacagcaaga ggtgccggtt atttctttga 12600
cgcggacgtg caggtttcgc acggggggac gatggcagcc tgagccaatt cccagatccc 12660
cgaggaatcg gcgtgagcgg tcgcaaacca tccggcccgg tacaaatcgg cgcggcgctg 12720
ggtgatgacc tggtggagaa gttgaaggcc gcgcaggccg cccagcggca acgcatcgag 12780
gcagaagcac gccccggtga atcgtggcaa gcggccgctg atcgaatccg caaagaatcc 12840
cggcaaccgc cggcagccgg tgcgccgtcg attaggaagc cgcccaaggg cgacgagcaa 12900
ccagattttt tcgttccgat gctctatgac gtgggcaccc gcgatagtcg cagcatcatg 12960
gacgtggccg ttttccgtct gtcgaagcgt gaccgacgag ctggcgaggt gatccgctac 13020
gagcttccag acgggcacgt agaggtttcc gcagggccgg ccggcatggc cagtgtgtgg 13080
gattacgacc tggtactgat ggcggtttcc catctaaccg aatccatgaa ccgataccgg 13140
gaagggaagg gagacaagcc cggccgcgtg ttccgtccac acgttgcgga cgtactcaag 13200
ttctgccggc gagccgatgg cggaaagcag aaagacgacc tggtagaaac ctgcattcgg 13260
ttaaacacca cgcacgttgc catgcagcgt acgaagaagg ccaagaacgg ccgcctggtg 13320
acggtatccg agggtgaagc cttgattagc cgctacaaga tcgtaaagag cgaaaccggg 13380
cggccggagt acatcgagat cgagctagct gattggatgt accgcgagat cacagaaggc 13440
aagaacccgg acgtgctgac ggttcacccc gattactttt tgatcgatcc cggcatcggc 13500
cgttttctct accgcctggc acgccgcgcc gcaggcaagg cagaagccag atggttgttc 13560
aagacgatct acgaacgcag tggcagcgcc ggagagttca agaagttctg tttcaccgtg 13620
cgcaagctga tcgggtcaaa tgacctgccg gagtacgatt tgaaggagga ggcggggcag 13680
gctggcccga tcctagtcat gcgctaccgc aacctgatcg agggcgaagc atccgccggt 13740
tcctaatgta cggagcagat gctagggcaa attgccctag caggggaaaa aggtcgaaaa 13800
ggtctctttc ctgtggatag cacgtacatt gggaacccaa agccgtacat tgggaaccgg 13860
aacccgtaca ttgggaaccc aaagccgtac attgggaacc ggtcacacat gtaagtgact 13920
gatataaaag agaaaaaagg cgatttttcc gcctaaaact ctttaaaact tattaaaact 13980
cttaaaaccc gcctggcctg tgcataactg tctggccagc gcacagccga agagctgcaa 14040
aaagcgccta cccttcggtc gctgcgctcc ctacgccccg ccgcttcgcg tcggcctatc 14100
gcggccgctg gccgctcaaa aatggctggc ctacggccag gcaatctacc agggcgcgga 14160
caagccgcgc cgtcgccact cgaccgccgg cgctgaggtc tgcctcgtga agaaggtgtt 14220
gctgactcat accaggcctg aatcgcccca tcatccagcc agaaagtgag ggagccacgg 14280
ttgatgagag ctttgttgta ggtggaccag ttggtgattt tgaacttttg ctttgccacg 14340
gaacggtctg cgttgtcggg aagatgcgtg atctgatcct tcaactcagc aaaagttcga 14400
tttattcaac aaagccgccg tcccgtcaag tcagcgtaat gctctgccag tgttacaacc 14460
aattaaccaa ttctgattag aaaaactcat cgagcatcaa atgaaactgc aatttattca 14520
tatcaggatt atcaatacca tatttttgaa aaagccgttt ctgtaatgaa ggagaaaact 14580
caccgaggca gttccatagg atggcaagat cctggtatcg gtctgcgatt ccgactcgtc 14640
caacatcaat acaacctatt aatttcccct cgtcaaaaat aaggttatca agtgagaaat 14700
caccatgagt gacgactgaa tccggtgaga atggcaaaag ctctgcatta atgaatcggc 14760
caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 14820
tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 14880
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 14940
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 15000
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 15060
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 15120
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 15180
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 15240
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 15300
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 15360
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga 15420
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 15480
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 15540
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 15600
gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 15660
ttcacctaga tccttttgat ccggaatta 15689
<210> 27
<211> 16054
<212> DNA
<213> 人工序列
<220>
<223> 重组载体
<400> 27
attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt 60
taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120
tgtcaaacac tgatagttta aactgaaggc gggaaacgac aatctgatca tgagcggaga 180
attaagggag tcacgttatg acccccgccg atgacgcggg acaagccgtt ttacgtttgg 240
aactgacaga accgcaacgc tgcaggaatt ggccgcagcg gccatttaaa tcaattgggc 300
gcgccagctg cttgtgggga ccagacaaaa aaggaatggt gcagaattgt taggcgcacc 360
taccaaaagc atctttgcct ttattgcaaa gataaagcag attcctctag tacaagtggg 420
gaacaaaata acgtggaaaa gagctgtcct gacagcccac tcactaatgc gtatgacgaa 480
cgcagtgacg accacaaaac tcgagacttt tcaacaaagg gtaatatccg gaaacctcct 540
cggattccat tgcccagcta tctgtcactt tattgtgaag atagtggaaa aggaaggtgg 600
ctcctacaaa tgccatcatt gcgataaagg aaaggctatc gttgaagatg cctctgccga 660
cagtggtccc aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc 720
aaccacgtct tcaaagcaag tggattgatg tgatatctcc actgacgtaa gggatgacga 780
acaatcccac tatccttcgg taccggaccc ggatcctgag gtgtggcttg tatgtttcct 840
gaccccctgg tggtgttccc agtttgcaat acatcatttt ctgtagccct tgtacttgct 900
gtgatccctg tttattgttc agggaaaact tagtgcagtg tattagaaat atagaaacct 960
cacatttcga agagcagaat agtgtttgat aacagttttt ttaacgcaac aacgtttgtt 1020
agactgtgtc cagcggccag cgggtagtgt aaaataggtg acgcgaaact atatgtgata 1080
ttgtttgaca ctatttgcag agtatagttt aaaatagggg gtgtgagtaa tctgctgaag 1140
atagccttaa gagttaagat accaaggtat agtttatcat atgcaaaaga aaagaaaaaa 1200
aaggaaatac aaaccattgt ttttatgttg gttagagcta ggtaattatc tcttgaccag 1260
tgtatttcca aacctgttct tctcagtttc tgtgctccgt cgatactgaa cattgttgtt 1320
catttctcat ttgttgaacg atggtatttc aggagctaga gaagaggaga gaggagcttg 1380
agtctctgtt aactgctgac cggatccgct gcgtttgggg gcggcaggat ctccgaccgg 1440
atccgcccgc cgtgcccgcg accggatccg ctgcgtttgg gggggggcag gatctccgac 1500
cggatccgcc cgccgtggcc gcaaccggat ccgctgcgtt tggggcggca ggatctccga 1560
ccggatccgc ccaccgtggc ggcgaccgga tccgctgcgt ttgggggcgg caaggaagcg 1620
ggtggggctt ctagggttca ggtggcgggc gtcggggtag agagtgcctg cggcgattct 1680
ggcgggcatg cgcagggtgg ggcaggggtg tggtcgagcg ggccatgcac aaccttccat 1740
ccgcgggatt ttgcgggcgt tgctggcgcg acggatttgc aggagttgct ggcgcggagc 1800
tttgagggcg cggccgattt ggggactgcg ggcgttggcg attttgcggg cgttgctggc 1860
gcggcagatt ctgcgggcgt tgctggcgcg gggactgcgg acgcgacagc tgtgctcgcc 1920
tgcggccgcg aggaaggcga cggggactgc gggcgcgggg agggaaatcg cgggcggagc 1980
gcgcgatggc agaacacaca gaactatgga cgcctacact aagggggtgt ttggtttcta 2040
gggactaatg tttagtccct tcattttatt cctttttagt atataaattg ctaaatatag 2100
aaactaaaat aaagttttag tttctatatt tagcaatttt agaacaaaaa tggaataaaa 2160
tgtagggact aaacattagt ccctaaaaac caaacacccc ttaaatacat aagaagtagt 2220
agagattatt attatttgtg tctattgata tgatcattat gatattatat tttactgttt 2280
taatctaaat atagttatta tattcagata attattttat taaatccaaa aatatttaac 2340
ttctaatgta ataaggagag aatactctaa tatcataata atttcttcta aagtgaccct 2400
cggatttgga gatgactgac agggagggct gtgcaccctt ctttctttcc ttttcaattg 2460
aagaacttgg gttgtgcttg ctcacacaac cgaatgaccg atgcacaccg acgcgcacgg 2520
agcggaccag cacagcccgg aaactgccct acgccgacac gttttccggt gcggcccagc 2580
agcagcaggg aggaaggttc gctcggtcgc tgggcctggc tccgcgtgcc gtccctccta 2640
taaatgcgag tcctcgccga gtccactggg caccagaagc tcactcactg ctcgttgccg 2700
gctgcccccg cggccccggc cagtccatcc cctcgctcgc tccccaactc cagcaggcag 2760
atcagataca tccatccatt cgcgcaccgg aaggtgagcg ccgtgaacga accatccgcc 2820
ctgctagctg cgatctgtag ccttgcgtcg ctttcgcgcc tagatcgtca cgtcacctat 2880
cacgatccgt gcggttctag atctgtggtt tttccttccc ctggtggtcg aatccttcca 2940
tccaccagac caccacggga cctcgtggat tccttttggt tttcctgtgc cgagagccaa 3000
aatcgagggg gggggcttgt tttttattgg ctcggtctcc cgctgtctcg tgatctgatt 3060
tgctgtagta atcagcagga aaggaagggt tgaactaaga gcgccgtggc ggtttcgtcg 3120
tcgctgaacc cggacgcgcc gctcttcatc ccggcggcgc tgctgcaggt ggaggacttc 3180
tcgccgcagt ggtgggacct catcaccacc actgcctggt tccgcgacca ctggtcccgc 3240
gagcgcgccc acctggacga gatcgccgag cagatcgacg cggccggcct cctccccgac 3300
gacgaggacc tcttctacga cgaccaggtc gagcagggcc ccgtcgccgc cgcccttaag 3360
ataggtactg atgtctctct ctctctctct ctcttactct cccctcgatt ttagatctgc 3420
ctgaaggacg aatcatagtg acctcacgtt ggtgcgtttt tctccaccag attcggtgct 3480
caaggcgctg taaaccatgg acaacaaccc caacatcaac gagtgcatcc cctacaactg 3540
cctgagcaac cccgaggtgg aggtgctggg cggcgagcgc atcgagaccg gctacacccc 3600
catcgacatc agcctgagcc tgacccagtt cctgctgagc gagttcgtgc ccggcgccgg 3660
cttcgtgctg ggcctggtgg acatcatctg gggcatcttc ggccccagcc agtgggacgc 3720
cttcctggtg cagatcgagc agctgatcaa ccagcgcatc gaggagttcg cccgcaacca 3780
ggccatcagc cgcctggagg gcctgagcaa cctgtaccaa atctacgccg agagcttccg 3840
cgagtgggag gccgacccca ccaaccccgc cctgcgcgag gagatgcgca tccagttcaa 3900
cgacatgaac agcgccctga ccaccgccat ccccctgttc gccgtgcaga actaccaggt 3960
gcccctgctg agcgtgtacg tgcaggccgc caacctgcac ctgagcgtgc tgcgcgacgt 4020
cagcgtgttc ggccagcgct ggggcttcga cgccgccacc atcaacagcc gctacaacga 4080
cctgacccgc ctgatcggca actacaccga ccacgccgtg cgctggtaca acaccggcct 4140
ggagcgcgtg tggggtccag acagccgcga ctggatcagg tacaaccagt tccgccgcga 4200
gctgaccctg accgtgctgg acatcgtgag cctgttcccc aactacgaca gccgcaccta 4260
ccccatccgc accgtgagcc agctgacccg cgagatttac accaaccccg tgctggagaa 4320
cttcgacggc agcttccgcg gcagcgccca gggcatcgag ggcagcatcc gcagccccca 4380
cctgatggac atcctgaaca gcatcaccat ctacaccgac gcccaccgcg gcgagtacta 4440
ctggagcggc caccagatca tggccagccc cgtcggcttc agcggccccg agttcacctt 4500
ccccctgtac ggcactatgg gcaacgctgc acctcagcag cgcatcgtgg cacagctggg 4560
ccagggagtg taccgcaccc tgagcagcac cctgtaccgt cgacctttca acatcggcat 4620
caacaaccag cagctgagcg tgctggacgg caccgagttc gcctacggca ccagcagcaa 4680
cctgcccagc gccgtgtacc gcaagagcgg caccgtggac agcctggacg agatcccccc 4740
tcagaacaac aacgtgccac ctcgacaggg cttcagccac cgtctgagcc acgtgagcat 4800
gttccgcagt ggcttcagca acagcagcgt gagcatcatc cgtgcaccta tgttcagctg 4860
gattcaccgc agtgccgagt tcaacaacat catccccagc agccagatca cccagatccc 4920
cctgaccaag agcaccaacc tgggcagcgg caccagcgtg gtgaagggcc ccggcttcac 4980
cggcggcgac atcctgcgcc gcaccagccc cggccagatc agcaccctgc gcgtgaacat 5040
caccgccccc ctgagccagc gctaccgcgt ccgcatccgc tacgccagca ccaccaacct 5100
gcagttccac accagcatcg acggccgccc catcaaccag ggcaacttca gcgccaccat 5160
gagcagcggc agcaacctgc agagcggcag cttccgcacc gtgggcttca ccaccccctt 5220
caacttcagc aacggcagca gcgtgttcac cctgagcgcc cacgtgttca acagcggcaa 5280
cgaggtgtac atcgaccgca tcgagttcgt gcccgccgag gtgaccttcg aggccgagta 5340
cgacctggag agggctcaga aggccgtgaa cgagctgttc accagcagca accagatcgg 5400
cctgaagacc gacgtgaccg actaccacat cgatcaggtg taggagctcg ttcgctgggg 5460
gaactcatca ggaaggctgc tgcccctctt gcagccttgc tcctggctgc cgccgctgtc 5520
gtggtctgct ctttcaagtc gaagtaacgg tggttcgagc tagtggatag tgtggctcaa 5580
ctgtagaagt tccttttgta tagcaagcaa gtaaaaaaaa aaaatgacca aaaaatataa 5640
caaaatgcag ctgtaagttt actgctgctc tctaagtcgt gttcagtcat ccagtgtgtc 5700
tagtctaggg aaaccccata aaaatggtga aggtggaatc ccatcccagt gtcataatta 5760
aggatgcact tcttctgtaa gcaaatgtat gatgtacaat ggccggccgg cagtctaaat 5820
gttacaacta gctcttcttg gtgaattcac cggtccacac tgatgtgctg ctatgtatca 5880
ttactatcca gttagggctt gttcggttat tcctacgcca tatggattgg acgggattgg 5940
aaaattttag tagacatttt gacttctatg gatttaaacc cacccaatcc cctccaatcc 6000
acatggattg agatgaaacc gaacaagccc ttagttggat ggatggatga tctcacgcgc 6060
ttgagtttat ctagttgctg atatgggaga gcccctcaac acctcaaata ttgtggataa 6120
gtttaatcct acactgtcag tcttcagtta taaggcacgc actcttcgac gttgggcgct 6180
gtcttttgtt tcaaaggttg aggcaacctc aacctcgttt aaaacagaga gcaaagctaa 6240
tttccaaact gatgtaagtc atgtgtcctt aattaccaaa gtagcaatga tgacattgtt 6300
atgttgtgtg ctaatgagcc attacgtgaa catcagttcc tgccttgccg cttcgttcag 6360
ccgggccggg gtatattttg agtcactaaa aggacacgtc ggatgaatgg aaaattgcct 6420
cttgtcttta ccaagagtgt cgcccgcgag cggaccgcga tcgcttaatt aagcttgcat 6480
gcctgcagtg cagcgtgacc cggtcgtgcc cctctctaga gataatgagc attgcatgtc 6540
taagttataa aaaattacca catatttttt ttgtcacact tgtttgaagt gcagtttatc 6600
tatctttata catatattta aactttactc tacgaataat ataatctata gtactacaat 6660
aatatcagtg ttttagagaa tcatataaat gaacagttag acatggtcta aaggacaatt 6720
gagtattttg acaacaggac tctacagttt tatcttttta gtgtgcatgt gttctccttt 6780
ttttttgcaa atagcttcac ctatataata cttcatccat tttattagta catccattta 6840
gggtttaggg ttaatggttt ttatagacta atttttttag tacatctatt ttattctatt 6900
ttagcctcta aattaagaaa actaaaactc tattttagtt tttttattta ataatttaga 6960
tataaaatag aataaaataa agtgactaaa aattaaacaa atacccttta agaaattaaa 7020
aaaactaagg aaacattttt cttgtttcga gtagataatg ccagcctgtt aaacgccgtc 7080
gacgagtcta acggacacca accagcgaac cagcagcgtc gcgtcgggcc aagcgaagca 7140
gacggcacgg catctctgtc gctgcctctg gacccctctc gagagttccg ctccaccgtt 7200
ggacttgctc cgctgtcggc atccagaaat tgcgtggcgg agcggcagac gtgagccggc 7260
acggcaggcg gcctcctcct cctctcacgg caccggcagc tacgggggat tcctttccca 7320
ccgctccttc gctttccctt cctcgcccgc cgtaataaat agacaccccc tccacaccct 7380
ctttccccaa cctcgtgttg ttcggagcgc acacacacac aaccagatct cccccaaatc 7440
cacccgtcgg cacctccgct tcaaggtacg ccgctcgtcc tccccccccc cccctctcta 7500
ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 7560
gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 7620
acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 7680
gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 7740
atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 7800
tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 7860
tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 7920
tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 7980
ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 8040
ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 8100
tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 8160
atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 8220
atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 8280
gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttattttgat 8340
cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 8400
ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 8460
gtgttacttc tgcagggatc cccgatcatg caaaaactca ttaactcagt gcaaaactat 8520
gcctggggca gcaaaacggc gttgactgaa ctttatggta tggaaaatcc gtccagccag 8580
ccgatggccg agctgtggat gggcgcacat ccgaaaagca gttcacgagt gcagaatgcc 8640
gccggagata tcgtttcact gcgtgatgtg attgagagtg ataaatcgac tctgctcgga 8700
gaggccgttg ccaaacgctt tggcgaactg cctttcctgt tcaaagtatt atgcgcagca 8760
cagccactct ccattcaggt tcatccaaac aaacacaatt ctgaaatcgg ttttgccaaa 8820
gaaaatgccg caggtatccc gatggatgcc gccgagcgta actataaaga tcctaaccac 8880
aagccggagc tggtttttgc gctgacgcct ttccttgcga tgaacgcgtt tcgtgaattt 8940
tccgagattg tctccctact ccagccggtc gcaggtgcac atccggcgat tgctcacttt 9000
ttacaacagc ctgatgccga acgtttaagc gaactgttcg ccagcctgtt gaatatgcag 9060
ggtgaagaaa aatcccgcgc gctggcgatt ttaaaatcgg ccctcgatag ccagcagggt 9120
gaaccgtggc aaacgattcg tttaatttct gaattttacc cggaagacag cggtctgttc 9180
tccccgctat tgctgaatgt ggtgaaattg aaccctggcg aagcgatgtt cctgttcgct 9240
gaaacaccgc acgcttacct gcaaggcgtg gcgctggaag tgatggcaaa ctccgataac 9300
gtgctgcgtg cgggtctgac gcctaaatac attgatattc cggaactggt tgccaatgtg 9360
aaattcgaag ccaaaccggc taaccagttg ttgacccagc cggtgaaaca aggtgcagaa 9420
ctggacttcc cgattccagt ggatgatttt gccttctcgc tgcatgacct tagtgataaa 9480
gaaaccacca ttagccagca gagtgccgcc attttgttct gcgtcgaagg cgatgcaacg 9540
ttgtggaaag gttctcagca gttacagctt aaaccgggtg aatcagcgtt tattgccgcc 9600
aacgaatcac cggtgactgt caaaggccac ggccgtttag cgcgtgttta caacaagctg 9660
taagagctta ctgaaaaaat taacatctct tgctaagctg ggagctcgtc atgggtcgtt 9720
taagctgccg atgtgcctgc gtcgtctggt gccctctctc catatggagg ttgtcaaagt 9780
atctgctgtt cgtgtcatga gtcgtgtcag tgttggttta ataatggacc ggttgtgttg 9840
tgtgtgcgta ctacccagaa ctatgacaaa tcatgaataa gtttgatgtt tgaaattaaa 9900
gcctgtgctc attatgttct gtctttcagt tgtctcctaa tatttgcctg caggtactgg 9960
ctatctaccg tttcttactt aggaggtgtt tgaatgcact aaaactaata gttagtggct 10020
aaaattagtt aaaacatcca aacaccatag ctaatagttg aactattagc tatttttgga 10080
aaattagtta atagtgaggt agttatttgt tagctagcta attcaactaa caatttttag 10140
ccaactaaca attagtttca gtgcattcaa acaccccctt aatgttaacg tggttctatc 10200
taccgtctcc taatatatgg ttgattgttc ggtttgttgc tatgctattg ggttctgatt 10260
gctgctagtt cttgctgaat ccagaagttc tcgtagtata gctcagattc atattattta 10320
tttgagtgat aagtgatcca ggttattact atgttagcta ggtttttttt acaaggataa 10380
attatctgtg atcataattc ttatgaaagc tttatgtttc ctggaggcag tggcatgcaa 10440
tgcatgacag caacttgatc acaccagctg aggtagatac ggtaacaagg ttcttaaatc 10500
tgttcaccaa atcattggag aacacacata cacattcttg ccagtcttgg ttagagaaat 10560
ttcatgacaa aatgccaaag ctgtcttgac tcttcacttt tggccatgag tcgtgactta 10620
gtttggttta atggaccggt tctcctagct tgttctactc aaaactgttg ttgatgcgaa 10680
taagttgtga tggttgatct ctggattttg ttttgctctc aatagtggac gagattagat 10740
agcccggaaa tttaccggtg cccgggcggc cagcatggcc gtatccgcaa tgtgttatta 10800
agttgtctaa gcgtcaattt gtttacacca caatatatcc tgccaccagc cagccaacag 10860
ctccccgacc ggcagctcgg cacaaaatca ccactcgata caggcagccc atcagaatta 10920
attctcatgt ttgacagctt atcatcgact gcacggtgca ccaatgcttc tggcgtcagg 10980
cagccatcgg aagctgtggt atggctgtgc aggtcgtaaa tcactgcata attcgtgtcg 11040
ctcaaggcgc actcccgttc tggataatgt tttttgcgcc gacatcataa cggttctggc 11100
aaatattctg aaatgagctg ttgacaatta atcatccggc tcgtataatg tgtggaattg 11160
tgagcggata acaatttcac acaggaaaca gaccatgagg gaagcgttga tcgccgaagt 11220
atcgactcaa ctatcagagg tagttggcgt catcgagcgc catctcgaac cgacgttgct 11280
ggccgtacat ttgtacggct ccgcagtgga tggcggcctg aagccacaca gtgatattga 11340
tttgctggtt acggtgaccg taaggcttga tgaaacaacg cggcgagctt tgatcaacga 11400
ccttttggaa acttcggctt cccctggaga gagcgagatt ctccgcgctg tagaagtcac 11460
cattgttgtg cacgacgaca tcattccgtg gcgttatcca gctaagcgcg aactgcaatt 11520
tggagaatgg cagcgcaatg acattcttgc aggtatcttc gagccagcca cgatcgacat 11580
tgatctggct atcttgctga caaaagcaag agaacatagc gttgccttgg taggtccagc 11640
ggcggaggaa ctctttgatc cggttcctga acaggatcta tttgaggcgc taaatgaaac 11700
cttaacgcta tggaactcgc cgcccgactg ggctggcgat gagcgaaatg tagtgcttac 11760
gttgtcccgc atttggtaca gcgcagtaac cggcaaaatc gcgccgaagg atgtcgctgc 11820
cgactgggca atggagcgcc tgccggccca gtatcagccc gtcatacttg aagctaggca 11880
ggcttatctt ggacaagaag atcgcttggc ctcgcgcgca gatcagttgg aagaatttgt 11940
tcactacgtg aaaggcgaga tcaccaaagt agtcggcaaa taaagctcta gtggatctcc 12000
gtacccgggg atctggctcg cggcggacgc acgacgccgg ggcgagacca taggcgatct 12060
cctaaatcaa tagtagctgt aacctcgaag cgtttcactt gtaacaacga ttgagaattt 12120
ttgtcataaa attgaaatac ttggttcgca tttttgtcat ccgcggtcag ccgcaattct 12180
gacgaactgc ccatttagct ggagatgatt gtacatcctt cacgtgaaaa tttctcaagc 12240
gctgtgaaca agggttcaga ttttagattg aaaggtgagc cgttgaaaca cgttcttctt 12300
gtcgatgacg acgtcgctat gcggcatctt attattgaat accttacgat ccacgccttc 12360
aaagtgaccg cggtagccga cagcacccag ttcacaagag tactctcttc cgcgacggtc 12420
gatgtcgtgg ttgttgatct agatttaggt cgtgaagatg ggctcgagat cgttcgtaat 12480
ctggcggcaa agtctgatat tccaatcata attatcagtg gcgaccgcct tgaggagacg 12540
gataaagttg ttgcactcga gctaggagca agtgatttta tcgctaagcc gttcagtatc 12600
agagagtttc tagcacgcat tcgggttgcc ttgcgcgtgc gccccaacgt tgtccgctcc 12660
aaagaccgac ggtctttttg ttttactgac tggacactta atctcaggca acgtcgcttg 12720
atgtccgaag ctggcggtga ggtgaaactt acggcaggtg agttcaatct tctcctcgcg 12780
tttttagaga aaccccgcga cgttctatcg cgcgagcaac ttctcattgc cagtcgagta 12840
cgcgacgagg aggtttatga caggagtata gatgttctca ttttgaggct gcgccgcaaa 12900
cttgaggcag atccgtcaag ccctcaactg ataaaaacag caagaggtgc cggttatttc 12960
tttgacgcgg acgtgcaggt ttcgcacggg gggacgatgg cagcctgagc caattcccag 13020
atccccgagg aatcggcgtg agcggtcgca aaccatccgg cccggtacaa atcggcgcgg 13080
cgctgggtga tgacctggtg gagaagttga aggccgcgca ggccgcccag cggcaacgca 13140
tcgaggcaga agcacgcccc ggtgaatcgt ggcaagcggc cgctgatcga atccgcaaag 13200
aatcccggca accgccggca gccggtgcgc cgtcgattag gaagccgccc aagggcgacg 13260
agcaaccaga ttttttcgtt ccgatgctct atgacgtggg cacccgcgat agtcgcagca 13320
tcatggacgt ggccgttttc cgtctgtcga agcgtgaccg acgagctggc gaggtgatcc 13380
gctacgagct tccagacggg cacgtagagg tttccgcagg gccggccggc atggccagtg 13440
tgtgggatta cgacctggta ctgatggcgg tttcccatct aaccgaatcc atgaaccgat 13500
accgggaagg gaagggagac aagcccggcc gcgtgttccg tccacacgtt gcggacgtac 13560
tcaagttctg ccggcgagcc gatggcggaa agcagaaaga cgacctggta gaaacctgca 13620
ttcggttaaa caccacgcac gttgccatgc agcgtacgaa gaaggccaag aacggccgcc 13680
tggtgacggt atccgagggt gaagccttga ttagccgcta caagatcgta aagagcgaaa 13740
ccgggcggcc ggagtacatc gagatcgagc tagctgattg gatgtaccgc gagatcacag 13800
aaggcaagaa cccggacgtg ctgacggttc accccgatta ctttttgatc gatcccggca 13860
tcggccgttt tctctaccgc ctggcacgcc gcgccgcagg caaggcagaa gccagatggt 13920
tgttcaagac gatctacgaa cgcagtggca gcgccggaga gttcaagaag ttctgtttca 13980
ccgtgcgcaa gctgatcggg tcaaatgacc tgccggagta cgatttgaag gaggaggcgg 14040
ggcaggctgg cccgatccta gtcatgcgct accgcaacct gatcgagggc gaagcatccg 14100
ccggttccta atgtacggag cagatgctag ggcaaattgc cctagcaggg gaaaaaggtc 14160
gaaaaggtct ctttcctgtg gatagcacgt acattgggaa cccaaagccg tacattggga 14220
accggaaccc gtacattggg aacccaaagc cgtacattgg gaaccggtca cacatgtaag 14280
tgactgatat aaaagagaaa aaaggcgatt tttccgccta aaactcttta aaacttatta 14340
aaactcttaa aacccgcctg gcctgtgcat aactgtctgg ccagcgcaca gccgaagagc 14400
tgcaaaaagc gcctaccctt cggtcgctgc gctccctacg ccccgccgct tcgcgtcggc 14460
ctatcgcggc cgctggccgc tcaaaaatgg ctggcctacg gccaggcaat ctaccagggc 14520
gcggacaagc cgcgccgtcg ccactcgacc gccggcgctg aggtctgcct cgtgaagaag 14580
gtgttgctga ctcataccag gcctgaatcg ccccatcatc cagccagaaa gtgagggagc 14640
cacggttgat gagagctttg ttgtaggtgg accagttggt gattttgaac ttttgctttg 14700
ccacggaacg gtctgcgttg tcgggaagat gcgtgatctg atccttcaac tcagcaaaag 14760
ttcgatttat tcaacaaagc cgccgtcccg tcaagtcagc gtaatgctct gccagtgtta 14820
caaccaatta accaattctg attagaaaaa ctcatcgagc atcaaatgaa actgcaattt 14880
attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta atgaaggaga 14940
aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg cgattccgac 15000
tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt tatcaagtga 15060
gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagctctg cattaatgaa 15120
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 15180
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 15240
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 15300
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 15360
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 15420
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 15480
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 15540
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 15600
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 15660
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 15720
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 15780
gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 15840
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 15900
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 15960
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 16020
ggatcttcac ctagatcctt ttgatccgga atta 16054
<210> 28
<211> 22075
<212> DNA
<213> 人工序列
<220>
<223> 重组载体
<400> 28
attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt 60
taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120
tgtcaaacac tgatagttta aactgaaggc gggaaacgac aatctgatca tgagcggaga 180
attaagggag tcacgttatg acccccgccg atgacgcggg acaagccgtt ttacgtttgg 240
aactgacaga accgcaacgc tgcaggaatt ggccgcagcg gccatttaaa tcaattgggc 300
gcgccagctg cttgtgggga ccagacaaaa aaggaatggt gcagaattgt taggcgcacc 360
taccaaaagc atctttgcct ttattgcaaa gataaagcag attcctctag tacaagtggg 420
gaacaaaata acgtggaaaa gagctgtcct gacagcccac tcactaatgc gtatgacgaa 480
cgcagtgacg accacaaaac tcgagacttt tcaacaaagg gtaatatccg gaaacctcct 540
cggattccat tgcccagcta tctgtcactt tattgtgaag atagtggaaa aggaaggtgg 600
ctcctacaaa tgccatcatt gcgataaagg aaaggctatc gttgaagatg cctctgccga 660
cagtggtccc aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc 720
aaccacgtct tcaaagcaag tggattgatg tgatatctcc actgacgtaa gggatgacga 780
acaatcccac tatccttcgg taccggaccc tatagaatag ctcactatcc tatttattat 840
agtttaagta tatagccaat attttaaatt tactatttat taaattctag ggaagatagt 900
ctcaattcat aactttatta taatacgttt gaaattttaa atctttagga aattttctta 960
attcacctag atacgattct ggagtgttac aagctgcgaa tatactggtg ccattgagta 1020
tacataaatg gatttaggtg gtgctcaata ggtgaaaatg agatactaat cacttaaatt 1080
tcaaaatttc tatggtgcca ctgtactcgg ataggtctat ctagggctgg acaaaatgct 1140
cgtggctcgc tggctcgctc gtttcgtggt cagctcggct cggctcggat cggctcattt 1200
gaattttgtc acgagctgag ctgacattct agctcggttc gttaacgagc cagctcgcga 1260
gctaaacgag ctaccatatt ctagtaaaac gaaattatat tcatatcatt tatagaataa 1320
ttgatgaaca tgttatatat atgtgagatg tctatggcct atgaattaaa ctaatgatta 1380
atgaactatg cctatgtgtt aatttggtct atgcaaatat aattatgggt taaactgatg 1440
aacatgcatg tgaattgtga attaatgagt gatgaattgt gctaatttgg tgttatattg 1500
acatggtttg tgaaactatg agtataatta ctattttcta ttgttaaatt agtttgaaat 1560
taactaaaaa ataattatta tatacatttt attttttttc tgctctggct cgcgagctaa 1620
acgagccagc tcgacctcgt aaacgagccg agccgagctg actctgtggc tcgttacctt 1680
aacgagccga gccgagctgg ctcgttagct taacgagcca gctcgaactc ggacgagccg 1740
agccgagctg gctcgttatc cacccctagg tctatctagc ttctgatgtt tgcaaacctt 1800
agagttggag tgttcagcca gctactcctt tgctttgctg aataaccata ccaaacacgc 1860
ccatattaat acccgctcgg cggtggttct gcaatcaaac gcaggccgca gtcgcgtgcg 1920
gaactagagg tccttcagag aagtgccgtg ccagtgccac cgccggccgc atcatcgttc 1980
cgcccccctg gtacgagcac ttcgcagagc tgcaacctac atccctttta cataaatcta 2040
ttgtctcgta ttgccgttga cgccggaata gtcttcgcat cccttttaca taaatccgat 2100
gttttctttc tccgattcct ttgaggaatc atcacgggtc agggcaggtg ttctgccgtt 2160
tgcccttttc tttatattct ccttagaaga aatatttagt tggaggctgg acatagccgg 2220
aggagctaac taatcgagcg gtgtactggc aaaacaaaag gagcggagca agaaagggga 2280
gaaaaaacta gccactgccg gagcgctatt ggccgtgttg ggcctggaag cttgcatcaa 2340
tacttccctc gccccgattt ggttccaaaa tcatacaagt cccaaagttg tcaagatatt 2400
ggaggtatgc aagcgacttg gatctcaaaa tagaagaaat ttcggatctg agcacaaatc 2460
tgagttgaaa aaactgcaac tcaaaatcat caaaaaaaga agaagaaaga aacgaatata 2520
ttcgctcctc ttctcagccg aacccaaagg aattgaatcc aaaccctggg taggcagaca 2580
gtgagatatg gaggagagca ggaggcgaac aagagaggct gcggccacga atatctcacg 2640
aacaagcaca tcatgggtcc acggagcggg cagggtgacg ggctcccgac ggcgagctac 2700
atctcggaag agcaccaggg cagcatgtcg tgttgggcag gttggccgtc tggcggacgg 2760
cggacggtga ctcgtggtca gggtgcacct gctcgattaa ggcgcctgac tactcatgtc 2820
ttggtctctt tgcttgtgtt tgctatatgc tgctcgtacc tcatgagcat actaagttga 2880
ctgctcagtc tgctgagtct gtttttctag ggtatagtgc tgagcacaag ggatatcatt 2940
gttgggatat gattgctcgt tggatgaggg tctcttggga tgttgtcttt gatgaggctc 3000
attcttttta ttcttgtcct tctttcgatg ctttgtcaac atccttggtt gatcccatct 3060
cttttctata ttttctagat gcccgtgtta ctattggacc tgcctcacgc ttggtgcgcc 3120
cacgatagta gccttagctc cttctgacat gttcatctct ctttcggtgc cttcctttgt 3180
ggtgccttct atagtgtttt ctttggagcc tgctgcttta gcccctgact acgctatgaa 3240
cacttgtcta cacccgccgg gtcatcaatt cttttggtac accatcatcc tctcatgcgt 3300
tgccctctta tgatgtgcgc tcttctgcaa ctcattcatt ttcttgcgat ttacctttga 3360
ctgatgctcc ctattcatct ctggatccag cttcctcagt tgactctttg ctggagccac 3420
ctcttagacg gagtcatcgt tttcgtcagc cacctaatgg gtactctcct tcaggtttag 3480
tcgctaccgt tctttctgag ctgacttctt atcatgatgc tattcttcat ctgtaacgac 3540
aacatgcgat ttctgaggag attgctactc ttgagcgcac tagcacgttg gaacttgttc 3600
cttgtccatc acgtgtttgt cctatcacca gtatgtgggt ctataaggtc aagacccgtt 3660
ctgatggttc tcttgatcgc tataaatctc gtctagttgc ccaaggcttc cagtaggaac 3720
atggttgtgg ctatgatgag atttttgcac ctgttgctca tatgaccact gttcgcactc 3780
ttcttgctat ggcctctgtt cgtgcgtggt ccatctctca tcttgatgtc aagaatacct 3840
ttcttgatgg taagctactt gagttctata tgtagccatc gcctaggtat tctatttctg 3900
cttgtatggt ttgttgtctt cgccgttccc cttatggcct caagcaggct ccacattctt 3960
ggtttcagct ctttgcttct atgataactg ttgttggttt ttctaccagt aatcatggtc 4020
ctgcactctt tgtgtactac ctcctctcgg ggtcggactc ttctttatgt tgatgatata 4080
attatcactg gagataacct tgagtatgtt gactttgtta aggcacgtct tagttatcat 4140
tttctcatgt ctgatcttgg tcctctgtgt tactttcttg ggacaaaggt ttcttctttg 4200
tctcagggcc tttatctatc tcaagaggag tacattcaag attttcttca tcgggcttct 4260
cttaccgatc actagattgt tgagactccc aagcagctca atcttcacct tagtgccgat 4320
gatggcgagt cttttcccga ccatactcgt tatcgtcaac atactgtagg aagttttgtt 4380
tatctctgtg tcactcgtct tgacatttca tatgttgtgt gtatcctgag ttagtttgct 4440
tcagatccca tccaggtaca ctatagtcac ttgctttgtg tcctacaata tctttgtgga 4500
accatatcta gatgtatgtt ctttccacat tctagctcgt tgcaactgca atcttgttct 4560
gatgctactt gggctagtga ttttttcgat agttggtctc tttctcaata ttgtgttttt 4620
cttggtggtt ctctcattgc tcggaagact aagtagcagg tagcagtttc tcgtttgagt 4680
accgaggctg agttgcgtgc tatggccctt gtgactgcag aggttacttg gttacgatag 4740
ttgcttgagg attttcatgt ttctgtttcc atgacgactc cttttgtctg acagtacagg 4800
tgttatcagt attgctcgtg atgcggtgaa gcatgaggtc accaagcata ttggagttga 4860
tgtttcgtat acacgagctg aagtctagga tgatgttatc ttgatttggt atgtgccttt 4920
agagcttcag ttggctaatt tcttcacgag ggcacaggct cgcgctgagc ataaattttt 4980
cctctcaaaa ctcagtgtta tagatccacc ttgagtttga gggagtatta gatagatatg 5040
ggtttatttg tatttttcca ttttataagg gtattagata gataggcaac gactgctatg 5100
caagtagtca ttctgtgcaa gcgtgcaagc aaaccatctg atccattata tcgtgatcca 5160
accgtgggtc acatttaaca cttaaaccct tccaccacca actcaataat ctttataaaa 5220
aaacccctaa caaacaatgg ttatatctgt ggttggatcg taatctaata gatcagatgg 5280
tttgcttgta cgcttgcaca gaatgactgc ttgcatagca gttgttgcct agatagatat 5340
gggtttattt gtatttttct cttaagggtt tttgtgtata tttgtactca tgtacctata 5400
tatttgtgct agttgacccc ataatgaata gacctgctat tcataatatt tgcaaaccat 5460
gaaaatttga ttattacgaa ctatccaaat actcgaacac atgggcatta tagctcacaa 5520
aaatggaagg ttgagctgct gcttgaagaa cctcaacatc tttgaacaac aacctcaacg 5580
aaacttgtat atgaaccaac ttccaaacaa tcccttgtgg aaggatagta atgacttcag 5640
ggcattgatc acacatatcc gacggtggaa ctactgtaac aaccctcttt tctgtggaat 5700
atagttgaaa ctctacaact tgaccaaaac caagatgacg acatatggtg gaactaacaa 5760
aacaagagga ctacactacc tcattagctt attaagcaca atctcttggc accacaacaa 5820
cgaacaacaa aaccatcatt tggatgctct gtgggcgact aaatgcaaat tctttgcatg 5880
gttgatcatc ccaaattggt ggcacttagc tataggctag cagtgagagg atggccgaac 5940
aacatgcatt gtccactatg ttggtgtagc catgagacca accaccacat aaatgccaaa 6000
cgttcattca ccaaaaaaat ctaggcaaca atggcttgga tttcttacct gcagctccac 6060
caagctaact ggagttcaat taggtcaacg tatgggtggt ggtcgagtat agcagtcaca 6120
aatgatgttc taaagatggg gttgtgttaa cacatcttgc ttgtagcacg agaacactgg 6180
aaggagtgaa accaaagaat ctttcaacac aaggacctat caacgctatc catgattggg 6240
aaattcaagg acgaaactag aatttgggtg aacacatgca caaggcacct aggagagcct 6300
ttcttttgta ctgttaatcc ctttttaaac tctctctgtc cttaggagtt cgtttcttcc 6360
gctctattca atgaagttag gcacaatctt gtgtgatttc attagaaaaa cacaagtaaa 6420
ttgcatggtc agtacttgaa gtattacagg aatctcgtct gcccccaaac tattaaacct 6480
tatatttggc tccctaatgt acttaactga tctcattctg gtcaaactaa acatggtgat 6540
ggcaaggagc cgatatggtc gcccatgtgg atgtgattta agcaaaaaat ctcatggtcc 6600
atagctgtgt caacaagcca acatgccatc gcttccttat gccgagactg cccatgtcgc 6660
tcgcttttac tgtcatcatc atcaaactgc ctgtcatgtc tacggatgcc atgaccgctg 6720
tcacacatga tgtggagatg aacctgtcca tcaacttcca cgtgctgcca ctatcgctag 6780
ctgacaccgt cttggtcatt gctgtgtagg gctaggctaa gagtcgctga atgatccttt 6840
cgctctcctt tacaggaaca tgctgtttac tttgtgtcgc caaggcgtgc tagagtacct 6900
cttctacacc tccagcacca gtagccttat tgttagcttg cacatcccac ataagcaggc 6960
cgatgtgaat gataacttca gggacgtcga cggcatgtca ctgccaagag tcatttggtg 7020
ggaagcgttg tcatgccatc tgtcgtgcca ttttgtcctc agttcgaccg ccattaccgt 7080
gagcacaacc tttgcgcatg gttggccgct tccatcaccc ttattccgtt tcctcgtgtt 7140
ggtcttgccc caaggctatg gttagcagac cgtgcatatg gccggcaaaa gactattttg 7200
cactgtagat tgcactcttt atatagtgaa gtttaaaata ggagatgaga tgaataaggc 7260
tgctggagat agcctaaacc cttgcagctc gtgcttgcat cgggggagcc aaaaggcgtc 7320
cacctccacc atcgccgaag cactgagcac tactctggct tgtgtttcag caccacaccg 7380
cagagtgctt agggccacca acctcctctt gcctctgtgc ccagagcacc atcagctctg 7440
ctgcctccct ctgttccttg tgcttgctag gcaggcaatt ccgagctggg gcccaacttg 7500
taacgctgat ttcaccatct tgccactgcc gggcaccaag tggacacatt tgacttggcc 7560
tagtgggttt tctgcataaa tcacatacat gtggatgcca tatcaggctc tttggtgttg 7620
tcgtgtctac tttcgacaag gatgagatca cttaaacata ttagggagcc aagtatgtaa 7680
tttcatagtt tagggaccta cacaaaaatc gtataatact ttagaacagc cgtgcagttt 7740
actcaatcaa cacatacaaa gtcagatctt aagctctgat acttcaaagg aatggttgag 7800
cccagttgac aaacaatctt gcttcattca ttgaattgtt tataggagtg gctatgtaac 7860
tactgggtgg ttttgtttga cctgtcatcc aaattgtgta gtcaaccata aacatacacg 7920
tcacacaata cattttggat gtgacagata ggatttaggc gagagaatgt acaatgtcac 7980
tgaaaaatta ccactgtatg gaaaggacaa tctaagtgaa aagagaacca gggcctaatg 8040
gtttcaggac ttcaaactcc ggccaaatga atttacagtg cttaaattaa ctcatgttaa 8100
tcatgatagc caaagcatgg gcaaaagaga aactatgaat aaatcgacaa tgtattctat 8160
atagcagtaa tataccatgt cacgagcttt tacactaatg ggctgtattt ttctgcagtt 8220
attttaactg gcaatattct atgtcacagt aatatttgtt aaattttttc cagaatagca 8280
actgaactag aagtctagta tttcttaatt ggataacaaa aggaattagt gtgcatttgg 8340
cttacgaaca atcagtcacc caacattgaa tttgaagttc tgtttcctct ttgttcagac 8400
gacactctcc aaatgaatgc cttatatttt gtgttgctcc tcttttctgc agagtgttca 8460
gtaacttctt ccgatgtaaa ccatggacaa caaccccaac atcaacgagt gcatccccta 8520
caactgcctg agcaaccccg aggtggaggt gctgggcggc gagcgcatcg agaccggcta 8580
cacccccatc gacatcagcc tgagcctgac ccagttcctg ctgagcgagt tcgtgcccgg 8640
cgccggcttc gtgctgggcc tggtggacat catctggggc atcttcggcc ccagccagtg 8700
ggacgccttc ctggtgcaga tcgagcagct gatcaaccag cgcatcgagg agttcgcccg 8760
caaccaggcc atcagccgcc tggagggcct gagcaacctg taccaaatct acgccgagag 8820
cttccgcgag tgggaggccg accccaccaa ccccgccctg cgcgaggaga tgcgcatcca 8880
gttcaacgac atgaacagcg ccctgaccac cgccatcccc ctgttcgccg tgcagaacta 8940
ccaggtgccc ctgctgagcg tgtacgtgca ggccgccaac ctgcacctga gcgtgctgcg 9000
cgacgtcagc gtgttcggcc agcgctgggg cttcgacgcc gccaccatca acagccgcta 9060
caacgacctg acccgcctga tcggcaacta caccgaccac gccgtgcgct ggtacaacac 9120
cggcctggag cgcgtgtggg gtccagacag ccgcgactgg atcaggtaca accagttccg 9180
ccgcgagctg accctgaccg tgctggacat cgtgagcctg ttccccaact acgacagccg 9240
cacctacccc atccgcaccg tgagccagct gacccgcgag atttacacca accccgtgct 9300
ggagaacttc gacggcagct tccgcggcag cgcccagggc atcgagggca gcatccgcag 9360
cccccacctg atggacatcc tgaacagcat caccatctac accgacgccc accgcggcga 9420
gtactactgg agcggccacc agatcatggc cagccccgtc ggcttcagcg gccccgagtt 9480
caccttcccc ctgtacggca ctatgggcaa cgctgcacct cagcagcgca tcgtggcaca 9540
gctgggccag ggagtgtacc gcaccctgag cagcaccctg taccgtcgac ctttcaacat 9600
cggcatcaac aaccagcagc tgagcgtgct ggacggcacc gagttcgcct acggcaccag 9660
cagcaacctg cccagcgccg tgtaccgcaa gagcggcacc gtggacagcc tggacgagat 9720
cccccctcag aacaacaacg tgccacctcg acagggcttc agccaccgtc tgagccacgt 9780
gagcatgttc cgcagtggct tcagcaacag cagcgtgagc atcatccgtg cacctatgtt 9840
cagctggatt caccgcagtg ccgagttcaa caacatcatc cccagcagcc agatcaccca 9900
gatccccctg accaagagca ccaacctggg cagcggcacc agcgtggtga agggccccgg 9960
cttcaccggc ggcgacatcc tgcgccgcac cagccccggc cagatcagca ccctgcgcgt 10020
gaacatcacc gcccccctga gccagcgcta ccgcgtccgc atccgctacg ccagcaccac 10080
caacctgcag ttccacacca gcatcgacgg ccgccccatc aaccagggca acttcagcgc 10140
caccatgagc agcggcagca acctgcagag cggcagcttc cgcaccgtgg gcttcaccac 10200
ccccttcaac ttcagcaacg gcagcagcgt gttcaccctg agcgcccacg tgttcaacag 10260
cggcaacgag gtgtacatcg accgcatcga gttcgtgccc gccgaggtga ccttcgaggc 10320
cgagtacgac ctggagaggg ctcagaaggc cgtgaacgag ctgttcacca gcagcaacca 10380
gatcggcctg aagaccgacg tgaccgacta ccacatcgat caggtgtagg agctcgacgt 10440
acaaatctca tctgtgcctt gctctagttt cccaaatgga attaactatg catgatttgt 10500
ttggaaactc ttattgcatc catccagata atgcatccac cataaggtaa tatcttgatg 10560
acatctgtgc ctgatggtgt accaaatgtc tctatctctg cattgagcca cgagtaggag 10620
gatagcctag gggtgccttg actccaaagt tgtattgaaa aagatggatg aagcaggcaa 10680
atgctgcctg aatccatgac tcagggcaca gattttccac tcaaaggaag ataagattgc 10740
attacttcat gatcttttga actgcctctg caagacggga ctcggatagt ggatgcaaag 10800
atctaatact ggcctcaggc aacgagttgt ttcactcgaa agtctagaaa tgaccgggct 10860
caaattttgc accccaagga aagtgagttt gcattacttc atgacctttt gaactgcctc 10920
tgcaagactg gactcagatt acgcttgatt ggttgccggc ctcaccttcg cctggcttgc 10980
gcgagcctgc gtctatagaa atgcgccgga ctcacgtctc cgtcgatgca ggcattcgac 11040
tgaaaaaaca tttaaactgc acccatgcgt gcgggctgag cttatgtcat acaagtaacc 11100
aatcacaggc ttaagttcag tcaacgcatg cgctaagctt ggatgtggct gaccgggcaa 11160
ccaatcacac agatagtgga tgcacggatc taatattggc taatttggtt aaacttgtct 11220
aaccttagac gtggcaagtg agtcagcgga tcaaatctgc tctaaaattg tctgcctcct 11280
agatgtcctt ggtgttccaa gatttaatca tcactgcact atttctttgc gttgcttcgc 11340
tgcagcttcg cgttacttgc attcgcttaa tcaggattac tttgatcaac taggtttcta 11400
acttctacta ccttcacttg cacagggtgc ccgtcctgct agccggtgtg cttgctgtgc 11460
gatcgtttgg catgtgcttg ttgaggggtt gctaggggat tggagaggat tgaagggatt 11520
aaatctcctc ctattcaatt ttgaatagga ggggatttaa tccccttcaa tccccctcaa 11580
accactagta accgaacgtg gcctgagggg gcgggcgagt ctttatattg aatgaaacta 11640
cataaaatag catgccgtct ctgtcactgg caatggacgg tggtgcctag cgcaactcag 11700
cgcacaactg tgtgtcttga tttttcttct gtttatcacg gcattagtgc catgccgttt 11760
tatgttacag tgttgtgtgc tcgcaagcat ccgaaaatat gcgtctgagt ttagggttgg 11820
gtcaaacttg tcgaatttgg ggttctgtta taatatgttg agcatgaata aagatggatg 11880
ctggtgactc tgtcgccatc gccgtccatc atgagtgtcc tgtaattcaa cttatatcta 11940
tcatgtatgt atgtatgtat gtatgtatgt atgtatatgc tgtctactat gcttctttgt 12000
tttaactgaa atgtgtgtta cagtgttact tctctggggt ccatttaaaa cggcatttcg 12060
tttacgatag gaaccagcca ttataatctt taaccaataa tttcgctaac caatttcaac 12120
tattgcaatg cgaacttaat attatcagat ttataaccga atgcgctatc aaataatcat 12180
aaggttgtaa tcataataat ataatataaa ataaatgagt gctcgaagtg aaattttaga 12240
gagcgttata agaaaaattg atgtgatctc caagaataat agcccctccc ggctcccggt 12300
acaaacatag ggcttcttta gaatgcagga ttgtgagaac ataggaatag gaaaaatata 12360
ggaattctat aggaatgtat atggaaaaca gaggattgaa aaacacagaa aaaatgtgaa 12420
agcaagtctt tggatgaagc gtaggaaact tataggaata ggaattcata acggaccgcg 12480
atcgcttaat taagcttgca tgcctgcagt gcagcgtgac ccggtcgtgc ccctctctag 12540
agataatgag cattgcatgt ctaagttata aaaaattacc acatattttt tttgtcacac 12600
ttgtttgaag tgcagtttat ctatctttat acatatattt aaactttact ctacgaataa 12660
tataatctat agtactacaa taatatcagt gttttagaga atcatataaa tgaacagtta 12720
gacatggtct aaaggacaat tgagtatttt gacaacagga ctctacagtt ttatcttttt 12780
agtgtgcatg tgttctcctt tttttttgca aatagcttca cctatataat acttcatcca 12840
ttttattagt acatccattt agggtttagg gttaatggtt tttatagact aattttttta 12900
gtacatctat tttattctat tttagcctct aaattaagaa aactaaaact ctattttagt 12960
ttttttattt aataatttag atataaaata gaataaaata aagtgactaa aaattaaaca 13020
aatacccttt aagaaattaa aaaaactaag gaaacatttt tcttgtttcg agtagataat 13080
gccagcctgt taaacgccgt cgacgagtct aacggacacc aaccagcgaa ccagcagcgt 13140
cgcgtcgggc caagcgaagc agacggcacg gcatctctgt cgctgcctct ggacccctct 13200
cgagagttcc gctccaccgt tggacttgct ccgctgtcgg catccagaaa ttgcgtggcg 13260
gagcggcaga cgtgagccgg cacggcaggc ggcctcctcc tcctctcacg gcaccggcag 13320
ctacggggga ttcctttccc accgctcctt cgctttccct tcctcgcccg ccgtaataaa 13380
tagacacccc ctccacaccc tctttcccca acctcgtgtt gttcggagcg cacacacaca 13440
caaccagatc tcccccaaat ccacccgtcg gcacctccgc ttcaaggtac gccgctcgtc 13500
ctcccccccc ccccctctct accttctcta gatcggcgtt ccggtccatg gttagggccc 13560
ggtagttcta cttctgttca tgtttgtgtt agatccgtgt ttgtgttaga tccgtgctgc 13620
tagcgttcgt acacggatgc gacctgtacg tcagacacgt tctgattgct aacttgccag 13680
tgtttctctt tggggaatcc tgggatggct ctagccgttc cgcagacggg atcgatttca 13740
tgattttttt tgtttcgttg catagggttt ggtttgccct tttcctttat ttcaatatat 13800
gccgtgcact tgtttgtcgg gtcatctttt catgcttttt tttgtcttgg ttgtgatgat 13860
gtggtctggt tgggcggtcg ttctagatcg gagtagaatt ctgtttcaaa ctacctggtg 13920
gatttattaa ttttggatct gtatgtgtgt gccatacata ttcatagtta cgaattgaag 13980
atgatggatg gaaatatcga tctaggatag gtatacatgt tgatgcgggt tttactgatg 14040
catatacaga gatgcttttt gttcgcttgg ttgtgatgat gtggtgtggt tgggcggtcg 14100
ttcattcgtt ctagatcgga gtagaatact gtttcaaact acctggtgta tttattaatt 14160
ttggaactgt atgtgtgtgt catacatctt catagttacg agtttaagat ggatggaaat 14220
atcgatctag gataggtata catgttgatg tgggttttac tgatgcatat acatgatggc 14280
atatgcagca tctattcata tgctctaacc ttgagtacct atctattata ataaacaagt 14340
atgttttata attattttga tcttgatata cttggatgat ggcatatgca gcagctatat 14400
gtggattttt ttagccctgc cttcatacgc tatttatttg cttggtactg tttcttttgt 14460
cgatgctcac cctgttgttt ggtgttactt ctgcagggat ccccgatcat gcaaaaactc 14520
attaactcag tgcaaaacta tgcctggggc agcaaaacgg cgttgactga actttatggt 14580
atggaaaatc cgtccagcca gccgatggcc gagctgtgga tgggcgcaca tccgaaaagc 14640
agttcacgag tgcagaatgc cgccggagat atcgtttcac tgcgtgatgt gattgagagt 14700
gataaatcga ctctgctcgg agaggccgtt gccaaacgct ttggcgaact gcctttcctg 14760
ttcaaagtat tatgcgcagc acagccactc tccattcagg ttcatccaaa caaacacaat 14820
tctgaaatcg gttttgccaa agaaaatgcc gcaggtatcc cgatggatgc cgccgagcgt 14880
aactataaag atcctaacca caagccggag ctggtttttg cgctgacgcc tttccttgcg 14940
atgaacgcgt ttcgtgaatt ttccgagatt gtctccctac tccagccggt cgcaggtgca 15000
catccggcga ttgctcactt tttacaacag cctgatgccg aacgtttaag cgaactgttc 15060
gccagcctgt tgaatatgca gggtgaagaa aaatcccgcg cgctggcgat tttaaaatcg 15120
gccctcgata gccagcaggg tgaaccgtgg caaacgattc gtttaatttc tgaattttac 15180
ccggaagaca gcggtctgtt ctccccgcta ttgctgaatg tggtgaaatt gaaccctggc 15240
gaagcgatgt tcctgttcgc tgaaacaccg cacgcttacc tgcaaggcgt ggcgctggaa 15300
gtgatggcaa actccgataa cgtgctgcgt gcgggtctga cgcctaaata cattgatatt 15360
ccggaactgg ttgccaatgt gaaattcgaa gccaaaccgg ctaaccagtt gttgacccag 15420
ccggtgaaac aaggtgcaga actggacttc ccgattccag tggatgattt tgccttctcg 15480
ctgcatgacc ttagtgataa agaaaccacc attagccagc agagtgccgc cattttgttc 15540
tgcgtcgaag gcgatgcaac gttgtggaaa ggttctcagc agttacagct taaaccgggt 15600
gaatcagcgt ttattgccgc caacgaatca ccggtgactg tcaaaggcca cggccgttta 15660
gcgcgtgttt acaacaagct gtaagagctt actgaaaaaa ttaacatctc ttgctaagct 15720
gggagctcgt catgggtcgt ttaagctgcc gatgtgcctg cgtcgtctgg tgccctctct 15780
ccatatggag gttgtcaaag tatctgctgt tcgtgtcatg agtcgtgtca gtgttggttt 15840
aataatggac cggttgtgtt gtgtgtgcgt actacccaga actatgacaa atcatgaata 15900
agtttgatgt ttgaaattaa agcctgtgct cattatgttc tgtctttcag ttgtctccta 15960
atatttgcct gcaggtactg gctatctacc gtttcttact taggaggtgt ttgaatgcac 16020
taaaactaat agttagtggc taaaattagt taaaacatcc aaacaccata gctaatagtt 16080
gaactattag ctatttttgg aaaattagtt aatagtgagg tagttatttg ttagctagct 16140
aattcaacta acaattttta gccaactaac aattagtttc agtgcattca aacaccccct 16200
taatgttaac gtggttctat ctaccgtctc ctaatatatg gttgattgtt cggtttgttg 16260
ctatgctatt gggttctgat tgctgctagt tcttgctgaa tccagaagtt ctcgtagtat 16320
agctcagatt catattattt atttgagtga taagtgatcc aggttattac tatgttagct 16380
aggttttttt tacaaggata aattatctgt gatcataatt cttatgaaag ctttatgttt 16440
cctggaggca gtggcatgca atgcatgaca gcaacttgat cacaccagct gaggtagata 16500
cggtaacaag gttcttaaat ctgttcacca aatcattgga gaacacacat acacattctt 16560
gccagtcttg gttagagaaa tttcatgaca aaatgccaaa gctgtcttga ctcttcactt 16620
ttggccatga gtcgtgactt agtttggttt aatggaccgg ttctcctagc ttgttctact 16680
caaaactgtt gttgatgcga ataagttgtg atggttgatc tctggatttt gttttgctct 16740
caatagtgga cgagattaga tagcccggaa atttaccggt gcccgggcgg ccagcatggc 16800
cgtatccgca atgtgttatt aagttgtcta agcgtcaatt tgtttacacc acaatatatc 16860
ctgccaccag ccagccaaca gctccccgac cggcagctcg gcacaaaatc accactcgat 16920
acaggcagcc catcagaatt aattctcatg tttgacagct tatcatcgac tgcacggtgc 16980
accaatgctt ctggcgtcag gcagccatcg gaagctgtgg tatggctgtg caggtcgtaa 17040
atcactgcat aattcgtgtc gctcaaggcg cactcccgtt ctggataatg ttttttgcgc 17100
cgacatcata acggttctgg caaatattct gaaatgagct gttgacaatt aatcatccgg 17160
ctcgtataat gtgtggaatt gtgagcggat aacaatttca cacaggaaac agaccatgag 17220
ggaagcgttg atcgccgaag tatcgactca actatcagag gtagttggcg tcatcgagcg 17280
ccatctcgaa ccgacgttgc tggccgtaca tttgtacggc tccgcagtgg atggcggcct 17340
gaagccacac agtgatattg atttgctggt tacggtgacc gtaaggcttg atgaaacaac 17400
gcggcgagct ttgatcaacg accttttgga aacttcggct tcccctggag agagcgagat 17460
tctccgcgct gtagaagtca ccattgttgt gcacgacgac atcattccgt ggcgttatcc 17520
agctaagcgc gaactgcaat ttggagaatg gcagcgcaat gacattcttg caggtatctt 17580
cgagccagcc acgatcgaca ttgatctggc tatcttgctg acaaaagcaa gagaacatag 17640
cgttgccttg gtaggtccag cggcggagga actctttgat ccggttcctg aacaggatct 17700
atttgaggcg ctaaatgaaa ccttaacgct atggaactcg ccgcccgact gggctggcga 17760
tgagcgaaat gtagtgctta cgttgtcccg catttggtac agcgcagtaa ccggcaaaat 17820
cgcgccgaag gatgtcgctg ccgactgggc aatggagcgc ctgccggccc agtatcagcc 17880
cgtcatactt gaagctaggc aggcttatct tggacaagaa gatcgcttgg cctcgcgcgc 17940
agatcagttg gaagaatttg ttcactacgt gaaaggcgag atcaccaaag tagtcggcaa 18000
ataaagctct agtggatctc cgtacccggg gatctggctc gcggcggacg cacgacgccg 18060
gggcgagacc ataggcgatc tcctaaatca atagtagctg taacctcgaa gcgtttcact 18120
tgtaacaacg attgagaatt tttgtcataa aattgaaata cttggttcgc atttttgtca 18180
tccgcggtca gccgcaattc tgacgaactg cccatttagc tggagatgat tgtacatcct 18240
tcacgtgaaa atttctcaag cgctgtgaac aagggttcag attttagatt gaaaggtgag 18300
ccgttgaaac acgttcttct tgtcgatgac gacgtcgcta tgcggcatct tattattgaa 18360
taccttacga tccacgcctt caaagtgacc gcggtagccg acagcaccca gttcacaaga 18420
gtactctctt ccgcgacggt cgatgtcgtg gttgttgatc tagatttagg tcgtgaagat 18480
gggctcgaga tcgttcgtaa tctggcggca aagtctgata ttccaatcat aattatcagt 18540
ggcgaccgcc ttgaggagac ggataaagtt gttgcactcg agctaggagc aagtgatttt 18600
atcgctaagc cgttcagtat cagagagttt ctagcacgca ttcgggttgc cttgcgcgtg 18660
cgccccaacg ttgtccgctc caaagaccga cggtcttttt gttttactga ctggacactt 18720
aatctcaggc aacgtcgctt gatgtccgaa gctggcggtg aggtgaaact tacggcaggt 18780
gagttcaatc ttctcctcgc gtttttagag aaaccccgcg acgttctatc gcgcgagcaa 18840
cttctcattg ccagtcgagt acgcgacgag gaggtttatg acaggagtat agatgttctc 18900
attttgaggc tgcgccgcaa acttgaggca gatccgtcaa gccctcaact gataaaaaca 18960
gcaagaggtg ccggttattt ctttgacgcg gacgtgcagg tttcgcacgg ggggacgatg 19020
gcagcctgag ccaattccca gatccccgag gaatcggcgt gagcggtcgc aaaccatccg 19080
gcccggtaca aatcggcgcg gcgctgggtg atgacctggt ggagaagttg aaggccgcgc 19140
aggccgccca gcggcaacgc atcgaggcag aagcacgccc cggtgaatcg tggcaagcgg 19200
ccgctgatcg aatccgcaaa gaatcccggc aaccgccggc agccggtgcg ccgtcgatta 19260
ggaagccgcc caagggcgac gagcaaccag attttttcgt tccgatgctc tatgacgtgg 19320
gcacccgcga tagtcgcagc atcatggacg tggccgtttt ccgtctgtcg aagcgtgacc 19380
gacgagctgg cgaggtgatc cgctacgagc ttccagacgg gcacgtagag gtttccgcag 19440
ggccggccgg catggccagt gtgtgggatt acgacctggt actgatggcg gtttcccatc 19500
taaccgaatc catgaaccga taccgggaag ggaagggaga caagcccggc cgcgtgttcc 19560
gtccacacgt tgcggacgta ctcaagttct gccggcgagc cgatggcgga aagcagaaag 19620
acgacctggt agaaacctgc attcggttaa acaccacgca cgttgccatg cagcgtacga 19680
agaaggccaa gaacggccgc ctggtgacgg tatccgaggg tgaagccttg attagccgct 19740
acaagatcgt aaagagcgaa accgggcggc cggagtacat cgagatcgag ctagctgatt 19800
ggatgtaccg cgagatcaca gaaggcaaga acccggacgt gctgacggtt caccccgatt 19860
actttttgat cgatcccggc atcggccgtt ttctctaccg cctggcacgc cgcgccgcag 19920
gcaaggcaga agccagatgg ttgttcaaga cgatctacga acgcagtggc agcgccggag 19980
agttcaagaa gttctgtttc accgtgcgca agctgatcgg gtcaaatgac ctgccggagt 20040
acgatttgaa ggaggaggcg gggcaggctg gcccgatcct agtcatgcgc taccgcaacc 20100
tgatcgaggg cgaagcatcc gccggttcct aatgtacgga gcagatgcta gggcaaattg 20160
ccctagcagg ggaaaaaggt cgaaaaggtc tctttcctgt ggatagcacg tacattggga 20220
acccaaagcc gtacattggg aaccggaacc cgtacattgg gaacccaaag ccgtacattg 20280
ggaaccggtc acacatgtaa gtgactgata taaaagagaa aaaaggcgat ttttccgcct 20340
aaaactcttt aaaacttatt aaaactctta aaacccgcct ggcctgtgca taactgtctg 20400
gccagcgcac agccgaagag ctgcaaaaag cgcctaccct tcggtcgctg cgctccctac 20460
gccccgccgc ttcgcgtcgg cctatcgcgg ccgctggccg ctcaaaaatg gctggcctac 20520
ggccaggcaa tctaccaggg cgcggacaag ccgcgccgtc gccactcgac cgccggcgct 20580
gaggtctgcc tcgtgaagaa ggtgttgctg actcatacca ggcctgaatc gccccatcat 20640
ccagccagaa agtgagggag ccacggttga tgagagcttt gttgtaggtg gaccagttgg 20700
tgattttgaa cttttgcttt gccacggaac ggtctgcgtt gtcgggaaga tgcgtgatct 20760
gatccttcaa ctcagcaaaa gttcgattta ttcaacaaag ccgccgtccc gtcaagtcag 20820
cgtaatgctc tgccagtgtt acaaccaatt aaccaattct gattagaaaa actcatcgag 20880
catcaaatga aactgcaatt tattcatatc aggattatca ataccatatt tttgaaaaag 20940
ccgtttctgt aatgaaggag aaaactcacc gaggcagttc cataggatgg caagatcctg 21000
gtatcggtct gcgattccga ctcgtccaac atcaatacaa cctattaatt tcccctcgtc 21060
aaaaataagg ttatcaagtg agaaatcacc atgagtgacg actgaatccg gtgagaatgg 21120
caaaagctct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 21180
gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 21240
tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 21300
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 21360
cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 21420
ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 21480
tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 21540
gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 21600
gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 21660
gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 21720
ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 21780
ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg ctgaagccag 21840
ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 21900
gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 21960
ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 22020
tggtcatgag attatcaaaa aggatcttca cctagatcct tttgatccgg aatta 22075
<210> 29
<211> 7910
<212> DNA
<213> 人工序列
<220>
<223> Cry1Ai表达盒
<400> 29
agctgcttgt ggggaccaga caaaaaagga atggtgcaga attgttaggc gcacctacca 60
aaagcaactt tgcctttatt gcaaagataa agcagattcc tctagtacaa gtggggaaca 120
aaataacgtg gaaaagagct gtcctgacag cccactcact attgcgtttg acgaacgcag 180
tgacgaccac aaaactcgag acttttcaac aaagggtatt atccggaaac ctcctcggat 240
tccattgccc agctatctgt cactttattg tgaagatagt ggaaaaggaa ggtggctcct 300
acaaatgcca tcattgcgat aaaggaaagg ctatcgttga agatgcctct gccgacagtg 360
gtcccaaaga tggaccccca cccacgagga gcatcgtgga aaaagaagac gttccaacca 420
cgtcttcaaa gcaagtggat tgatgtgata tctccactga cgtaagggtt gacgaacaat 480
cccactatcc ttctgcctaa ttagctaacg gaccctctgc ctttctgttc ttcaaacgat 540
gtcacatgtc tgcgctggac aactttcttg ttgccgcctg tcgcttgcgc tgtgctgact 600
ggacgcagct ccggaggttt ggttgtgctt ggttttcgta gagaactcgc cacttgccgc 660
ccgcacgttc ttggtgtttc ctcctccccg ctgtgttctg cgcacgggct ttttctgaga 720
gacccatgtt tcccttttac ttttataaac agtatacatg ctatgtttct agaaggaggg 780
gaaacctaat ccccctaatc caatggcggg gaggaaatag ggtggggtgg ggtgggggga 840
gggaaatatc tcgctacttt ttaatccgga caagctcatt tgcgtttgcg tctgaatgat 900
gatgactgca atgctgatcg cacctcgggt gtcggatcac cagcttttgg ctgctctcac 960
caaatcagct gcaagaagat tagagcacaa aagaattaca gaaagagagc ctttttcttt 1020
tcttccttgt ggggttcctt tcatttcgtg ctctcctttc tctgccagcc agtccgtcct 1080
tgcgtccact gcacctgcac acaggtcacc ccgacccgca ctgttctaga ctccattaga 1140
aaaaaaaagg tctgaacctt tccgaaacca gccagccatt ggtctggcag gccagcatat 1200
gctaattgga tttttttgcc gcatcattga gtgcgccatc aggatttgga aatcctggtt 1260
ttgagtaata cagtaatttg gcattatcca ttgccgaatt cccaagctcc gtcagcttga 1320
acgtggaccc ctaccatctg caccagctcg gcacctcacg ctcgcagcgc taggagccta 1380
ggagcagctg cccgtctatt tattggtccc tctcccgtcc cagagaaacc ctccctccct 1440
cctccattgg actgcttgct ccctgttgac cattggggta tgcttgctgc cttgctctcc 1500
tgttcatctc cgtgctaaac ctctgtcctc tgggtgggtt tttgctggga ttttgagcta 1560
atctgctggt cccggtagaa aaagatcatg tcccctgacg tgctcaagcg ctcgccttag 1620
ccgcgtcctt gccccccgcc attttttgcg gtttcggtgt gttcccgtga ctcgccgggt 1680
gcgtcatcgc ctgaatcttg tctgggctct gctgacatgt tcttggctag ttgggtttat 1740
agattcctct gatctaaacc gtgcctgtgc tgcgcacaga actctcccct gtcctttcct 1800
ggggttttgg ttacgtggtg gtagtaagct tggatttgca catggataaa gttgttctaa 1860
gctccgtggg ttgcttgaga tcttgctgtt attgcgtgcc gtgctcactt tttttgcaat 1920
ccgaggaatg aatttgtcgt ttactcgttt tggtggatta ttagcgcgaa aaaaaaactc 1980
tttttttttt gttcttttac tacgaaaagc atcttcttgg attttgctat cttcttttac 2040
tacgaaaaac tcttgagtct aggaatttga atttgtgatg tccattcttg cagtgcgctg 2100
tgctttattg ggaagccaaa tcctattatt ttctgcctct agggtctgaa tggaatcagt 2160
actcttgaga cagaaaatca atccaatcaa gttgatttct ttctttaaaa atattatcac 2220
agaactaagt gcttgtgcgg aatcagtact ggcttttgtt tggtggagga tcaatacttg 2280
cttttgtttg ggggtggcaa ctgttttgct ataagattcc atgtgttcct gttgagatga 2340
atcatatata gtatagctgc atactacaaa tctgtttttc aaatttaggt tgctttggca 2400
tgatctattt ttttgtcaga cagactttct aagtggtagc tcttgatttc ttgttcttgt 2460
acaactggtg ctgctgaatc ttgaccgtat agctcgaatt gcagtattct gaaccatcga 2520
gccaaggctg ccaagctgac tcgcctccac agtcttcgcg aacgccttgg tgccaccttc 2580
tcctcccatc ccaatgaact gatagcactc ttttccaggt gggcttacca aaatcatata 2640
acttgcattt cattcggtac tgaaagttgt taatttgtta ttctcttcat gcctgtctta 2700
atagcacacc cagatgtaaa cacgagatta tgcaacttct tacttggttt cttttgttgg 2760
caccatcatg catgctaatt gctaaggatg ttacctattc atccttgact catattatca 2820
tatgtaatga ttttatgatc acgagactat tgattgtgaa gcatagtata gctgttcttc 2880
agtttttgta cccttttgtt tttttcctta agctagaact ggtacaattt agttgataag 2940
acagtgtagt ttgtagtacg tcatttgaca gattgtttgt ctttagctgg taaagtgcca 3000
tttaatatct gtatccttca gatctaataa aaaggatatg agatgtccat cacaagaggg 3060
gaaaaattac atgatctgag atgtaacatc cgtttttatt tgtgaaatac cacttctaca 3120
ggtatcttca ctagggtaaa ccatggacaa taatcctaat attaacgagt gcattccata 3180
caactgcctg agcaatcctg aggtggaggt tctcggcggg gagaggattg agacgggcta 3240
cacgccgatc gacatctccc tgagcctcac ccagttcctc ctgtccgagt tcgtgccggg 3300
cgccggcttc gtgctgggcc tcgtcgacat catctggggc atcttcggcc ccagccagtg 3360
ggacgccttc ctggtccaga tcgagcagct catcaaccag aggatcgagg agttcgcgcg 3420
caaccaggcc atctccaggc tggagggcct cagcaacctg taccagatct acgccgagtc 3480
cttccgcgag tgggaggcgg acccgaccaa cccggctctg agggaggaga tgcgcatcca 3540
gttcaacgac atgaactcgg ccctgaccac cgctatcccc ctcttcgccg tgcagaacta 3600
ccaggtgccg ctcctgtcgg tctacgtgca ggctgccaac ctgcacctct cggtgctgag 3660
ggacgtgagc gtcttcggcc agcgctgggg cttcgacgcg gccacgatca actcccgcta 3720
caacgacctc acgaggctga tcggcaacta caccgactac gccgtccgct ggtacaacac 3780
cggcctcgag agggtgtggg gcccggacag cagggactgg gtcaggtaca accagttccg 3840
cagggagctg accctcacgg tgctggacat cgtcgccctc ttctccaact acgactcgag 3900
gaggtacccc atcaggaccg tgtcccagct gacgagggag atctacacca accccgtcct 3960
cgagaacttc gacggcagct tccgcggcat ggcccagagg atcgagcaga acatccgcca 4020
gccgcacctg atggacatcc tcaactccat caccatctac acggacgtgc acaggggctt 4080
caactactgg tcgggccacc agatcacggc ttccccagtg ggcttcagcg gcccggagtt 4140
cgccttccca ctgttcggca acgcgggcaa cgcggccccg ccagtgctcg tctccctcac 4200
cggcctcggc atcttccgca ccctgtccag cccgctctac aggaggatca tcctcggcag 4260
cggccccaat aatcaggagc tgttcgtgct cgacggcacg gagttctcct tcgcgagcct 4320
gaccacgaac ctcccgtcca cgatctacag gcagaggggc acggtggact ccctggacgt 4380
catcccgccc caggacaact cggtcccgcc ccgcgccggc ttctcccaca ggctgagcca 4440
cgtgaccatg ctcagccagg cggccggcgc cgtctacacc ctcagggccc cgaccttctc 4500
ctggcagcac aggagcgcgg agttcaacaa catcatcgcc tccgacagca tcacgcagat 4560
cccggcggtg aagggcaact tcctcttcaa cggctccgtc atcagcggcc ccggcttcac 4620
cggcggcgac ctggtgcgcc tcaactccag cggcaacaac atccagaaca ggggctacat 4680
cgaggtcccg atccacttcc cgtccaccag caccaggtac agggtgcgcg tcaggtacgc 4740
ttcggtgacc ccgatccacc tgaacgtcaa ctggggcaac tccagcatct tctccaacac 4800
ggtgccggct acggccacca gcctggacaa cctccagtcc agcgacttcg gctacttcga 4860
gtccgccaac gcgttcacgt ccagcctcgg caacatcgtg ggcgtccgca acttctcggg 4920
gacggctggc gtgatcatcg acaggttcga gttcatcccc gtcacggcca ccctggaggc 4980
tgagtacaac ctcgagcgcg cccagaaggc cgtgaacgcc ctgttcacct ccacgaacca 5040
gctgggcctc aagaccaacg tcacggacta ccacatcgac caggtgtcca acctggtcac 5100
ctgcctcagc gacgagttct gcctggacga gaagagggag ctgagcgaga aggtgaagca 5160
cgccaagcgc ctctccgacg agaggaacct cctgcaggac agcaacttca aggacattaa 5220
taggcagccc gagaggggct ggggcggctc cacgggcatc accatccagg gcggcgacga 5280
cgtcttcaag gagaactacg tcaccctgag cggcacgttc gacgagtgct accccacgta 5340
cctctaccag aagatcgacg agtccaagct gaaggcgttc acccgctacc agctcagggg 5400
ctacatcgag gacagccagg acctggaggt gtacctcatc cgctacaacg ccaagcacga 5460
gacgctgaac gtgcccggca cgggctccct gtggcccctc gcggtcaaga gccccatcgg 5520
caggtgcggc gagcccaaca ggtgcgcccc caggatcgag tggaagccgg acgtggactg 5580
cagctgcagg gacggcgaga agtgcgctca ccactcccac cacttcagcc tcgacatcga 5640
cgtcggctgc acggacctga acgaggacct cggcgtgtgg gtcatcttca agattaaaac 5700
ccaggacggc cacgcgaaga tcggcaacct ggagttcctc gaggagaagc tgctgctggg 5760
cgaggctctg gccagggtga agaaggccga gaagaagtgg cgcgacaaga gggagaagct 5820
cgagtgggag acgaacatcg tctacaagga ggcgaaggag tccgtggacg ccctgttcgt 5880
cgacagccag tacaaccgcc tccagaccga cacgaacatc gcgatgatcc acgccgcgga 5940
caagagggtg caccgcatca gggaggccta cctgcccgag ctgagcgtga tcccgggcgt 6000
caacgctgcg atcttcgagg agctggaggg cctcatcttc accgcgttct ccctgtacga 6060
cgcccgcaac gtgatcaaga acggcgactt caactacggc ctcagctgct ggaacgtcaa 6120
gggccacgtg gacgtcgagg agcagaacaa ccacaggtcg gtgctggtca tccccgagtg 6180
ggaggccgag gtgagccagg aggtgcgcgt ctgcccgggc aggggctaca tcctccgcgt 6240
caccgcctac aaggagggct acggcgaggg ctgcgtcacg atccacgaga tcgaggacaa 6300
caccgacgag ctgaagttct ccaactgcgt ggaggaggag gtctacccga ataataccgt 6360
gacgtgcaac gactacaccg ccacgcagga ggagtacgag ggcacctaca cctcgaggaa 6420
caggggctac gacggcgcct acgagtccaa cagctcggtc cccgcggact acgctagcgc 6480
gtacgaggag aaggcctaca ccgacggcag gagggacaac ccgtgcgagt ccaaccgcgg 6540
ctaccgggac tacacgccgc tgccggcggg ctacgtgacc aaggagctgg agtacttccc 6600
ggagacggac aaggtctgga tcgagctggg ggagaccgag gggactttcc tggttgattc 6660
agtggagctg ctgctgatgg aggagtgaga gctctacggg gaaagaagga gaagaagaag 6720
aagaagccca ggccggagaa ccatcgcctg catttcgatc tgtttcaccg caattcgcat 6780
tgttagtcgt gtattggagt tatgtgtact tggtttccaa gaactttggt tccttctcgt 6840
ttttttttcc ttgcttgttt gagcgttttt gggcagcgct ggcctggttc ctagtatggt 6900
gggaattggc tgcacctttt gcttcgaata aaaatgcctg ctcgttcacc tgtcttccag 6960
agtgcaatgc gatgttctgt tgcccaggtc gtgtggttct gactgatggc gatgttgtgt 7020
tcttctgtta atcgcctgtt ttaacgtggt aggctgttgc ttgttcttgt tgagaaagct 7080
tgctgtgcca gacatggctg cttgaataca agtgaaggaa aaaaaaagcc atgccaagta 7140
aagttgcaca aaatttcaac tgctcagtgg accactggac catgttcttg gttattgcag 7200
ttgcagggct tcacatggcg tttggacagc agtcttggat tgatccataa agaggtggtg 7260
gttaatgagg acgcaaggcc gttccctcag agtcagtcac aaggttgcag aggtcacggt 7320
tctcttccct ttccgcttcc tgtcacatcg gaattgttgt ttacgccatc tgcccatcac 7380
ccaccaagtc tatgtttctg tactggatct ttcaatggcg gaacgcgctt agttcttcgt 7440
cacagtcgaa tcacatgatc taatcgatgt ctttaatctc gctgtaaaaa gggtgggacg 7500
gtgggtgcag ggtagggacc agggaaggcc tgcctaaacg tatccataaa catgcacagc 7560
aaccctaaga tattatactg cctacttcct aagatatagt tatttctagt ctattttttt 7620
tccgtccaca tccaaataag tgataatata tagacataca tatatatact atattcatca 7680
tagattaatg aacgaatgta tacttagttt aaacctaatt atattttagg aaggatggag 7740
tatgaaacat gacaatacaa caaaaaaaaa tcatgtaatt gcatatcgtc aaagttatct 7800
gaagtaacca atccaggggg aaatcccgtt agcaaacata caagagcacc gccccactac 7860
atcccagaaa ataaaacaaa accagaactc agatggataa ataatactac 7910
Claims (38)
1.一种表达盒,所述表达盒包含SEQ ID NO:5列出的启动子以及与之可操作地连接的目的异源多核苷酸,所述目的异源多核苷酸与包含聚腺苷酸化信号的3'非翻译区可操作地连接,其中所述异源多核苷酸在转基因植物的非花粉的组织中功能性转录。
2.如权利要求1所述的表达盒,其中所述异源多核苷酸编码杀昆虫蛋白或双链RNA(dsRNA)。
3.如权利要求2所述的表达盒,其中所述杀昆虫蛋白是Cry蛋白或Vip3蛋白。
4.如权利要求3所述的表达盒,其中所述Cry蛋白是Cry1蛋白。
5.如权利要求4所述的表达盒,其中所述Cry1蛋白是Cry1A蛋白。
6.如权利要求5所述的表达盒,其中所述Cry1A蛋白是Cry1Ab或Cry1Ai蛋白。
7.如权利要求3所述的表达盒,其中所述Vip3蛋白是Vip3A蛋白。
8.如权利要求7所述的表达盒,其中所述Vip3A蛋白是Vip3Aa蛋白。
9.如权利要求8所述的表达盒,其中所述Vip3Aa蛋白是Vip3Aa20蛋白。
10.如权利要求1所述的表达盒,其中所述转基因植物是单子叶植物。
11.如权利要求10所述的表达盒,其中所述单子叶植物是玉蜀黍植物。
12.如权利要求11所述的表达盒,其中所述玉蜀黍植物是近交玉蜀黍植物或杂交玉蜀黍植物。
13.如权利要求11所述的表达盒,其中所述组织是叶、花丝或苞叶。
14.一种重组载体,所述重组载体包含如权利要求1所述的表达盒。
15.一种用于在植物或植物细胞中表达目的蛋白或目的多核苷酸的方法,所述方法包括:将表达盒引入所述植物或植物细胞中,所述表达盒包含与异源多核苷酸可操作地连接的启动子,所述异源多核苷酸编码所述目的蛋白或目的多核苷酸,其中所述启动子由SEQID NO:5组成,并且其中所述目的蛋白或目的多核苷酸在转基因植物的非花粉的组织中功能性表达。
16.如权利要求15所述的方法,其中所述目的蛋白是杀昆虫蛋白或所述目的多核苷酸是杀昆虫的dsRNA。
17.如权利要求16所述的方法,其中所述杀昆虫蛋白是Cry蛋白或Vip3蛋白。
18.如权利要求17所述的方法,其中所述Cry蛋白是Cry1蛋白。
19.如权利要求18所述的方法,其中所述Cry1蛋白是Cry1A蛋白。
20.如权利要求19所述的方法,其中所述Cry1A蛋白是Cry1Ab或Cry1Ai蛋白。
21.如权利要求17所述的方法,其中所述Vip3蛋白是Vip3A蛋白。
22.如权利要求21所述的方法,其中所述Vip3A蛋白是Vip3Aa蛋白。
23.如权利要求22所述的方法,其中所述Vip3Aa蛋白是Vip3Aa20蛋白。
24.如权利要求15所述的方法,其中所述转基因植物是玉蜀黍植物。
25.如权利要求24所述的方法,其中所述组织是叶、苞叶或花丝。
26.一种分离的核酸分子,所述核酸分子由SEQ ID NO:5列出的核苷酸序列组成,其中所述核酸分子在转基因植物的非花粉的组织中启动可操作地连接的目的多核苷酸的功能性转录。
27.如权利要求26所述的分离的核酸分子,其中所述可操作地连接的目的多核苷酸编码杀昆虫蛋白或dsRNA。
28.如权利要求27所述的分离的核酸分子,其中所述杀昆虫蛋白是Cry蛋白或Vip3蛋白。
29.如权利要求28所述的分离的核酸分子,其中所述Cry蛋白是Cry1蛋白。
30.如权利要求29所述的分离的核酸分子,其中所述Cry1蛋白是Cry1A蛋白。
31.如权利要求30所述的分离的核酸分子,其中所述Cry1A蛋白是Cry1Ab或Cry1Ai蛋白。
32.如权利要求28所述的分离的核酸分子,其中所述Vip3蛋白是Vip3A蛋白。
33.如权利要求32所述的分离的核酸分子,其中所述Vip3A蛋白是Vip3Aa蛋白。
34.如权利要求33所述的分离的核酸分子,其中所述Vip3Aa蛋白是Vip3Aa20蛋白。
35.如权利要求26所述的分离的核酸分子,其中所述转基因植物是转基因玉蜀黍植物。
36.如权利要求1所述的表达盒,其中所述3'非翻译区包含选自SEQ ID NO:12-20中任一项的终止子序列。
37.如权利要求14所述的重组载体,其中所述载体是二元载体,所述二元载体包含SEQID NO:21-28中任一项。
38.一种在转基因植物的非花粉的组织中特异性表达异源编码序列的方法,所述方法包括:a)用载体转化植物细胞,其中所述载体包含如权利要求1所述的表达盒;b)使包含所述表达盒的转基因植物细胞生长;和c)从所述经转化的植物细胞产生转基因植物,其中所述异源编码序列在所述核酸分子的控制下在非花粉的组织中特异性表达。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311568862.XA CN117587059A (zh) | 2019-09-06 | 2020-08-26 | 调控植物中基因表达的启动子 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962896735P | 2019-09-06 | 2019-09-06 | |
US62/896,735 | 2019-09-06 | ||
PCT/US2020/047899 WO2021045942A1 (en) | 2019-09-06 | 2020-08-26 | Promoters for regulation of gene expression in plants |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311568862.XA Division CN117587059A (zh) | 2019-09-06 | 2020-08-26 | 调控植物中基因表达的启动子 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114302644A CN114302644A (zh) | 2022-04-08 |
CN114302644B true CN114302644B (zh) | 2023-12-01 |
Family
ID=74852021
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080060198.6A Active CN114302644B (zh) | 2019-09-06 | 2020-08-26 | 调控植物中基因表达的启动子 |
CN202311568862.XA Pending CN117587059A (zh) | 2019-09-06 | 2020-08-26 | 调控植物中基因表达的启动子 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311568862.XA Pending CN117587059A (zh) | 2019-09-06 | 2020-08-26 | 调控植物中基因表达的启动子 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20220325293A1 (zh) |
EP (1) | EP4025040A4 (zh) |
CN (2) | CN114302644B (zh) |
AR (1) | AR119859A1 (zh) |
BR (1) | BR112022003914A2 (zh) |
CA (1) | CA3147794A1 (zh) |
CL (1) | CL2022000532A1 (zh) |
MX (1) | MX2022002385A (zh) |
WO (1) | WO2021045942A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115413222B (zh) * | 2020-04-23 | 2024-06-04 | 先正达农作物保护股份公司 | 大豆启动子及其用途 |
WO2024059464A1 (en) * | 2022-09-14 | 2024-03-21 | Monsanto Technology Llc | Plant regulatory elements and uses thereof |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103261425A (zh) * | 2010-12-22 | 2013-08-21 | 先锋国际良种公司 | 病毒启动子、其截短物以及使用方法 |
US20170114356A1 (en) * | 2015-02-20 | 2017-04-27 | E I Du Pont De Nemours And Company | Novel alternatively spliced transcripts and uses thereof for improvement of agronomic characteristics in crop plants |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5955330A (en) * | 1989-05-18 | 1999-09-21 | Research Corporation Technologies | Means for enhancing gene expression |
US7584058B2 (en) * | 2003-02-27 | 2009-09-01 | Methexis Genomics N.V. | Genetic diagnosis using multiple sequence variant analysis |
WO2005049841A1 (en) * | 2003-11-17 | 2005-06-02 | Commonwealth Scientific And Industrial Research Organisation | Insect resistance using inhibition of gene expression |
US8344209B2 (en) * | 2008-07-14 | 2013-01-01 | Syngenta Participations Ag | Plant regulatory sequences |
-
2020
- 2020-08-26 BR BR112022003914A patent/BR112022003914A2/pt unknown
- 2020-08-26 WO PCT/US2020/047899 patent/WO2021045942A1/en unknown
- 2020-08-26 MX MX2022002385A patent/MX2022002385A/es unknown
- 2020-08-26 US US17/640,963 patent/US20220325293A1/en active Pending
- 2020-08-26 CN CN202080060198.6A patent/CN114302644B/zh active Active
- 2020-08-26 CA CA3147794A patent/CA3147794A1/en active Pending
- 2020-08-26 EP EP20859787.2A patent/EP4025040A4/en active Pending
- 2020-08-26 CN CN202311568862.XA patent/CN117587059A/zh active Pending
- 2020-08-28 AR ARP200102427A patent/AR119859A1/es unknown
-
2022
- 2022-03-03 CL CL2022000532A patent/CL2022000532A1/es unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103261425A (zh) * | 2010-12-22 | 2013-08-21 | 先锋国际良种公司 | 病毒启动子、其截短物以及使用方法 |
US20170114356A1 (en) * | 2015-02-20 | 2017-04-27 | E I Du Pont De Nemours And Company | Novel alternatively spliced transcripts and uses thereof for improvement of agronomic characteristics in crop plants |
Non-Patent Citations (1)
Title |
---|
Wilson等.AC212194.5.《NCBI,GenBank》.2013,全文. * |
Also Published As
Publication number | Publication date |
---|---|
US20220325293A1 (en) | 2022-10-13 |
CN114302644A (zh) | 2022-04-08 |
EP4025040A1 (en) | 2022-07-13 |
CL2022000532A1 (es) | 2022-10-07 |
MX2022002385A (es) | 2022-03-17 |
WO2021045942A1 (en) | 2021-03-11 |
EP4025040A4 (en) | 2024-01-03 |
CA3147794A1 (en) | 2021-03-11 |
CN117587059A (zh) | 2024-02-23 |
AR119859A1 (es) | 2022-01-19 |
BR112022003914A2 (pt) | 2022-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102630763B1 (ko) | 동시 유전자 편집 및 반수체 유도 | |
US10450580B2 (en) | Transcriptional regulation for improved plant productivity | |
CN113667676B (zh) | 玉米事件mir162 | |
KR102248730B1 (ko) | 유전자 표적화를 위한 범용 공여자 시스템 | |
US9181559B2 (en) | Generation of high polyhydroxybutyrate producing oilseeds | |
CN101040049B (zh) | 胁迫抗性植物 | |
KR101447300B1 (ko) | 안트라닐레이트 신타제의 엽록체를 표적으로 하는 발현에 의한 고-트립토판 옥수수의 생산 | |
CN112852991B (zh) | 转基因玉米事件lp007-7及其检测方法 | |
CN113621642A (zh) | 一种用于农作物杂交育种制种的遗传智能化育制种系统及其应用 | |
CN115997023A (zh) | 与大豆中疾病抗性相关联的新颖的抗性基因 | |
CN114302644B (zh) | 调控植物中基因表达的启动子 | |
CN101918560B (zh) | 在氮限制条件下具有改变的农学特性的植物以及涉及编码lnt2多肽及其同源物的基因的相关构建体和方法 | |
KR20170136549A (ko) | 트랜스젠 발현을 위한 식물 프로모터 | |
KR102720045B1 (ko) | 동시 유전자 편집 및 반수체 유도 | |
KR20240088901A (ko) | 칸나바세아에 세포 형질전환 | |
RU2788349C2 (ru) | Одновременное редактирование генов и индукция гаплоидов | |
EP3283632A1 (en) | Plant promoter for transgene expression | |
CN113557303A (zh) | 转基因表达的调节 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |