CN117551689A - 与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用 - Google Patents
与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用 Download PDFInfo
- Publication number
- CN117551689A CN117551689A CN202311479530.4A CN202311479530A CN117551689A CN 117551689 A CN117551689 A CN 117551689A CN 202311479530 A CN202311479530 A CN 202311479530A CN 117551689 A CN117551689 A CN 117551689A
- Authority
- CN
- China
- Prior art keywords
- protein
- soybean
- gene
- plant
- expression cassette
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 178
- 241000196324 Embryophyta Species 0.000 title claims abstract description 125
- 244000068988 Glycine max Species 0.000 title claims abstract description 106
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 94
- 239000012620 biological material Substances 0.000 title claims abstract description 13
- 230000009261 transgenic effect Effects 0.000 claims abstract description 34
- 235000010469 Glycine max Nutrition 0.000 claims description 86
- 230000014509 gene expression Effects 0.000 claims description 39
- 239000013598 vector Substances 0.000 claims description 34
- 108020004707 nucleic acids Proteins 0.000 claims description 28
- 102000039446 nucleic acids Human genes 0.000 claims description 28
- 150000007523 nucleic acids Chemical class 0.000 claims description 28
- 210000004027 cell Anatomy 0.000 claims description 23
- 108020004414 DNA Proteins 0.000 claims description 21
- 244000005700 microbiome Species 0.000 claims description 19
- 108091026890 Coding region Proteins 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 13
- 102000053602 DNA Human genes 0.000 claims description 11
- 239000000126 substance Substances 0.000 claims description 11
- 239000002299 complementary DNA Substances 0.000 claims description 10
- 108020005004 Guide RNA Proteins 0.000 claims description 6
- 238000009395 breeding Methods 0.000 claims description 6
- 230000001488 breeding effect Effects 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 6
- 210000000056 organ Anatomy 0.000 claims description 6
- 230000001603 reducing effect Effects 0.000 claims description 6
- 210000004899 c-terminal region Anatomy 0.000 claims description 3
- 125000000539 amino acid group Chemical group 0.000 claims description 2
- 230000002222 downregulating effect Effects 0.000 claims description 2
- 102000037865 fusion proteins Human genes 0.000 claims description 2
- 108020001507 fusion proteins Proteins 0.000 claims description 2
- 230000003827 upregulation Effects 0.000 claims description 2
- 230000003313 weakening effect Effects 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 3
- 230000003247 decreasing effect Effects 0.000 claims 2
- 238000011160 research Methods 0.000 abstract description 3
- 235000018102 proteins Nutrition 0.000 description 68
- 239000013612 plasmid Substances 0.000 description 22
- 125000003729 nucleotide group Chemical group 0.000 description 21
- 239000002773 nucleotide Substances 0.000 description 20
- 150000001413 amino acids Chemical group 0.000 description 19
- 235000013339 cereals Nutrition 0.000 description 19
- 230000035772 mutation Effects 0.000 description 14
- 108091033409 CRISPR Proteins 0.000 description 11
- 238000012163 sequencing technique Methods 0.000 description 11
- 239000013604 expression vector Substances 0.000 description 10
- 239000002609 medium Substances 0.000 description 10
- 150000003839 salts Chemical class 0.000 description 10
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 9
- 230000033228 biological regulation Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- 229920001817 Agar Polymers 0.000 description 8
- 239000008272 agar Substances 0.000 description 8
- 229930006000 Sucrose Natural products 0.000 description 7
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 239000005720 sucrose Substances 0.000 description 7
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 241000589158 Agrobacterium Species 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 238000010354 CRISPR gene editing Methods 0.000 description 5
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 5
- 229960001230 asparagine Drugs 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 229930182816 L-glutamine Natural products 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- OJOBTAOGJIWAGB-UHFFFAOYSA-N acetosyringone Chemical compound COC1=CC(C(C)=O)=CC(OC)=C1O OJOBTAOGJIWAGB-UHFFFAOYSA-N 0.000 description 4
- 229940024606 amino acid Drugs 0.000 description 4
- 235000001014 amino acid Nutrition 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 239000001963 growth medium Substances 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 239000002904 solvent Substances 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 229930186147 Cephalosporin Natural products 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 229940124587 cephalosporin Drugs 0.000 description 3
- 150000001780 cephalosporins Chemical class 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 238000010362 genome editing Methods 0.000 description 3
- 238000003306 harvesting Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000010257 thawing Methods 0.000 description 3
- 229940027257 timentin Drugs 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- PWKSKIMOESPYIA-UHFFFAOYSA-N 2-acetamido-3-sulfanylpropanoic acid Chemical compound CC(=O)NC(CS)C(O)=O PWKSKIMOESPYIA-UHFFFAOYSA-N 0.000 description 2
- 241000588986 Alcaligenes Species 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 241000701489 Cauliflower mosaic virus Species 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 241000589565 Flavobacterium Species 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- VHJLVAABSRFDPM-IMJSIDKUSA-N L-1,4-dithiothreitol Chemical compound SC[C@H](O)[C@@H](O)CS VHJLVAABSRFDPM-IMJSIDKUSA-N 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 241001483078 Phyto Species 0.000 description 2
- 108700001094 Plant Genes Proteins 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 102000044159 Ubiquitin Human genes 0.000 description 2
- 108090000848 Ubiquitin Proteins 0.000 description 2
- 241000607479 Yersinia pestis Species 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 230000009418 agronomic effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 239000012881 co-culture medium Substances 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 239000012877 elongation medium Substances 0.000 description 2
- 230000000408 embryogenic effect Effects 0.000 description 2
- 108010045262 enhanced cyan fluorescent protein Proteins 0.000 description 2
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000001543 one-way ANOVA Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 230000001954 sterilising effect Effects 0.000 description 2
- 238000004659 sterilization and disinfection Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 239000012137 tryptone Substances 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 241000724791 Filamentous phage Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 101710132455 Protein A2 Proteins 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 239000005708 Sodium hypochlorite Substances 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000000460 chlorine Substances 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000021040 cytoplasmic transport Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000000378 dietary effect Effects 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003337 fertilizer Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- 239000012869 germination medium Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 101150054900 gus gene Proteins 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013028 medium composition Substances 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 230000031787 nutrient reservoir activity Effects 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000009712 regulation of translation Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000012883 rooting culture medium Substances 0.000 description 1
- 239000012882 rooting medium Substances 0.000 description 1
- 238000006748 scratching Methods 0.000 description 1
- 230000002393 scratching effect Effects 0.000 description 1
- -1 sgRNA Proteins 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- SUKJFIGYRHOWBL-UHFFFAOYSA-N sodium hypochlorite Chemical compound [Na+].Cl[O-] SUKJFIGYRHOWBL-UHFFFAOYSA-N 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229940099259 vaseline Drugs 0.000 description 1
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Botany (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
Abstract
本发明涉及生物技术领域,具体公开了与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用。所述蛋白质为GmCOL2a或/和GmCOL2b。本发明通过将GmCOL2a或/和GmCOL2b蛋白的编码基因敲除,得到GmCOL2a或/和GmCOL2b基因敲除的转基因大豆植株,转基因大豆株高降低,单株荚数粒数增加。本发明所提供的GmCOL2a或/和GmCOL2b蛋白及其编码基因在大豆株高和单株荚数粒数研究中具有重要的理论意义和应用价值。
Description
技术领域
本发明属于生物技术领域,具体涉及与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用。
背景技术
大豆是世界重要的粮油兼用作物,也是人类优质蛋白及畜牧业饲料蛋白的主要来源。随着全球人口继续以前所未有的速度增长,对粮食的需求激增,使作物产量的提高成为现代作物育种技术面临的紧迫挑战。满足世界上大多数饮食需求的四种主要粮食作物是大豆、玉米、小麦和大豆。通过追求大幅度提高作物产量的研究攻关,研究人员对半矮秆作物的优势有了重大发现,这些作物具有许多优秀的特性,如抗倒伏能力增强、有效利用肥料和提高光能利用率。此外,半矮秆作物通常对多种植物病虫害具有更高的抗性,这在一定程度上保证了作物在高密度种植条件下的稳定产量。大豆是世界重要的粮油兼用作物,也是人类优质蛋白及畜牧业饲料蛋白的主要来源。大豆的荚果主要着生于茎节上。大豆的株高、单株荚数和粒数指标是决定大豆抗倒伏性和产量的关键性状,是选育理想株型高产大豆新品种的重要目标。由于能够同时改良大豆株高、单株荚数和粒数的基因和作用机制报道较少,限制了大豆理想株型的分子选育。所以能够同时实现大豆株高降低、单株荚数和粒数增加对提高大豆抗倒伏性和产量具有重要的理论和生产意义。
发明内容
本发明所要解决的技术问题是如何改良大豆株高、单株荚数或/和粒数。所要解决的技术问题不限于所描述的技术主题,本领域技术人员通过以下描述可以清楚地理解本文未提及的其它技术主题。
为解决上述技术问题,本发明提供了以下技术方案:
本发明提供了蛋白质或抑制或降低或下调所述蛋白质的编码基因表达的物质或抑制或降低或下调所述蛋白质活性或/和含量的物质在下述任一种中的应用:
D1)提高大豆产量,
D2)降低大豆株高;
D2)制备降低大豆株高的产品;
D3)培育半矮杆大豆;
D4)制备培育半矮杆大豆的产品;
D5)改良半矮杆大豆或制备半矮杆大豆的产品;
D6)增加大豆单株荚数;
D7)制备增加大豆单株荚数的产品;
D8)培育单株荚数增加的大豆;
D9)制备培育单株荚数增加的大豆的产品;
D10)增加大豆单株粒数;
D11)制备增加大豆单株粒数的产品;
D12)培育单株粒数增加的大豆;
D13)制备培育单株粒数增加的大豆的产品;
D14)大豆育种;
所述蛋白质为下述任一种,
A1)氨基酸序列是SEQ ID No.2的蛋白质;
A2)将SEQ ID No.2所示的氨基酸序列经过氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有80%以上的同一性且具有相同功能的蛋白质;
A3)在A1)或A2)的N端和/或C端连接标签得到的具有相同功能的融合蛋白质。
为了使A1)中的蛋白质便于纯化或检测,可在由序列表中SEQ ID No.2所示的氨基酸序列组成的蛋白质的氨基末端或羧基末端连接标签蛋白。
所述标签蛋白包括但不限于:GST(谷胱甘肽巯基转移酶)标签蛋白、His6标签蛋白(His-tag)、MBP(麦芽糖结合蛋白)标签蛋白、Flag标签蛋白、SUMO标签蛋白、HA标签蛋白、Myc标签蛋白、eGFP(增强型绿色荧光蛋白)、eCFP(增强型青色荧光蛋白)、eYFP(增强型黄绿色荧光蛋白)、mCherry(单体红色荧光蛋白)或AviTag标签蛋白。
本领域普通技术人员可以很容易地采用已知的方法,例如定向进化或点突变的方法,对本发明的编码蛋白质GmCOL2a或/和GmCOL2b的核苷酸序列进行突变。那些经过人工修饰的,具有与本发明分离得到的蛋白质GmCOL2a或/和GmCOL2b的核苷酸序列75%或75%以上同一性的核苷酸,只要编码蛋白质GmCOL2a或/和GmCOL2b且具有蛋白质GmCOL2a或/和GmCOL2b功能,均是衍生于本发明的核苷酸序列并且等同于本发明的序列。
上述75%或75%以上同一性,可为80%、85%、90%或95%以上的同一性。本文中,同一性是指氨基酸序列或核苷酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性,如NCBI主页网站的BLAST网页。例如,可在高级BLAST2.1中,通过使用blastp作为程序,将Expect值设置为10,将所有Filter设置为OFF,使用BLOSUM62作为Matrix,将Gap existence cost,Per residue gap cost和Lambda ratio分别设置为11,1和0.85(缺省值)并进行检索以对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。本文中,所述80%以上的同一性可为至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
本文中,调控所述蛋白质活性和/或含量的物质可为调控基因表达的物质,所述基因编码所述蛋白质GmCOL2a或/和GmCOL2b。所述调控基因表达的物质可为进行如下6种调控中至少一种调控的物质:1)在所述基因转录水平上进行的调控;2)在所述基因转录后进行的调控(也就是对所述基因的初级转录物的剪接或加工进行的调控);3)对所述基因的RNA转运进行的调控(也就是对所述基因的mRNA由细胞核向细胞质转运进行的调控);4)对所述基因的翻译进行的调控;5)对所述基因的mRNA降解进行的调控;6)对所述基因的翻译后的调控(也就是对所述基因翻译的蛋白质的活性进行调控)。
上文中,所述植物育种的目的可包括培育株高降低、单株荚数和粒数增加的植物。
上文中A2)所述蛋白质为氨基酸序列是SEQ ID No.2的蛋白质。
进一步地,上述应用中所述物质为生物材料,所述生物材料为下述任一种:
B1)、核酸分子;
B2)、表达B1)所述核酸分子的基因;
B3)、含有B2)所述基因的表达盒;
B4)、含有B2)所述基因的重组载体、或含有B3)所述表达盒的重组载体;
B5)、含有B2)所述基因的重组微生物、或含有B3)所述表达盒的重组微生物、或含有B4)所述重组载体的重组微生物;
B6)、含有B2)所述基因的转基因植物细胞系、或含有B3)所述表达盒的转基因植物细胞系、或含有B4)所述重组载体的转基因植物细胞系;
B7)、含有B2)所述基因的转基因植物组织、或含有B3)所述表达盒的转基因植物组织、或含有B4)所述重组载体的转基因植物组织;
B8)、含有B2)所述基因的转基因植物器官、或含有B3)所述表达盒的转基因植物器官、或含有B3)所述重组载体的转基因植物器官。
B1)所述核酸分子可为DNA或RNA。所述RNA可为gRNA或shRNA。
本文中B1)所述核酸分子为gRNA,所述gRNA的靶标为所述蛋白质的编码基因。
所述蛋白质的编码基因可为C1)、C2)或C3)所示的所述蛋白质的编码基因:
C1)编码序列是SEQ ID No.1或SEQ ID No.3的cDNA分子或DNA分子;
C2)与C1)限定的cDNA或DNA分子杂交且编码具有相同功能的蛋白质的cDNA分子或DNA分子。
SEQ ID No.1所示的DNA分子编码氨基酸序列是SEQ ID No.2的蛋白质GmCOL2a。SEQ ID No.3所示的DNA分子编码氨基酸序列是SEQ ID No.4的蛋白质GmCOL2b。SEQ IDNO.1所示的核苷酸序列为蛋白质GmCOL2a编码基因(CDS)的核苷酸序列。SEQ ID NO.3所示的核苷酸序列为蛋白质GmCOL2b编码基因(CDS)的核苷酸序列。
本发明所述的蛋白质GmCOL2a或/和GmCOL2b的基因(GmCOL2a或/和GmCOL2b基因)可以为任意能够编码蛋白质GmCOL2a或/和GmCOL2b的核苷酸序列。考虑到密码子的简并性以及不同物种密码子的偏爱性,本领域技术人员可以根据需要使用适合特定物种表达的密码子。
B1)所述核酸分子还可包括在SEQ ID No.1或/和SEQ ID No.3所示核苷酸序列基础上经密码子偏好性改造得到的核酸分子。
所述核酸分子还包括与SEQ ID No.1或/和SEQ ID No.3所示的核苷酸序列一致性为95%以上且来源相同种属的核酸分子。本文所述核酸分子可以是DNA,如cDNA、基因组DNA或重组DNA;所述核酸分子也可以是RNA,如gRNA、mRNA、siRNA、shRNA、sgRNA、miRNA或反义RNA。
本文所述载体是本领域技术人员公知的,包括但不限于:质粒、噬菌体(如λ噬菌体或M13丝状噬菌体等)、黏粒(即柯斯质粒)、Ti质粒或病毒载体。具体可为PTF101-SpCas9。
可用现有的植物表达载体构建含有GmCOL2a或GmCOL2b基因的重组表达载体。所述植物表达载体包括但不限于如双元农杆菌载体和可用于植物微弹轰击的载体等。所述植物表达载体还可包含外源基因的3'端非翻译区域,即包含聚腺苷酸信号和任何其它参与mRNA加工或基因表达的DNA片段。所述聚腺苷酸信号可引导聚腺苷酸加入到mRNA前体的3'端,如包括但不限于农杆菌冠瘿瘤诱导(Ti)质粒基因(如胭脂合成酶Nos基因)、植物基因(如大豆贮藏蛋白基因)3'端转录的非翻译区均具有类似功能。
使用GmCOL2a或/和GmCOL2b基因构建重组植物表达载体时,在其转录起始核苷酸前可加上任何一种增强型启动子或组成型启动子,包括但不限于如花椰菜花叶病毒(CAMV)35S启动子、玉米的泛素启动子(ubiquitin),它们可单独使用或与其它植物启动子结合使用;此外,使用本发明的基因构建植物表达载体时,还可使用增强子,包括翻译增强子或转录增强子,这些增强子区域可以是ATG起始密码子或邻接区域起始密码子等,但必需与编码序列的阅读框相同,以保证整个序列的正确翻译。所述翻译控制信号和起始密码子的来源是广泛的,可以是天然的,也可以是合成的。翻译起始区域可以来自转录起始区域或结构基因。
为了便于对转基因植物细胞或植物进行鉴定及筛选,可对所用植物表达载体进行加工,如加入包括但不限于可在植物中表达的编码可产生颜色变化的酶或发光化合物的基因(GUS基因、荧光素酶基因等)、具有抗性的抗生素标记物(庆大霉素标记物、卡那霉素标记物等)或是抗化学试剂标记基因(如抗除草剂基因)等。从转基因植物的安全性考虑,可不加任何选择性标记基因,直接以逆境筛选转化植株。
利用任何一种可以引导外源基因在植物中表达的载体,将靶向敲除本发明所提供的GmCOL2a或/和GmCOL2b基因的片段导入植物细胞或受体植物,可获得株高降低和增加单株荚数粒数增加的植株。携带GmCOL2a或/和GmCOL2b基因的表达载体可通过使用Ti质粒、Ri质粒、植物病毒载体、直接DNA转化、显微注射、电导、农杆菌介导等常规生物学方法转化植物细胞或组织,并将转化的植物组织培育成植株。
本文所述微生物可为酵母、细菌、藻或真菌。其中,细菌可来自埃希氏菌属(Escherichia),欧文氏菌(Erwinia),根癌农杆菌属(Agrobacterium)、黄杆菌属(Flavobacterium),产碱菌属(Alcaligenes),假单胞菌属(Pseudomonas),芽孢杆菌属(Bacillus)等。具体可为大肠杆菌DH5α和/或根癌农杆菌EHA105。
所述gRNA的靶点可为SEQ ID No.1的第26到45位核苷酸或/和SEQ ID No.3第32到51位核苷酸。
本发明还提供一种提高大豆产量、降低大豆株高、增加大豆单株荚数或/和增加大豆粒数的方法,包括下调或降低或减弱目的大豆中前述蛋白质的编码基因的表达量或所述蛋白质的含量得到转基因大豆,所述转基因大豆的株高低于所述目的大豆,所述转基因大豆的单株荚数和豆单株粒数高于所述目的大豆。
上述株高降低、单株荚数和粒数增加的大豆理解为不仅包含将所述GmCOL2a或/和GmCOL2b基因转化目的大豆得到的第一代转基因植物,也包括其子代。可以在该物种中繁殖该基因,也可用常规育种技术将该基因转移进入相同物种的其它品种,特别包括商业品种中。所述抗逆植物包括种子、愈伤组织、完整植株和细胞。
进一步地,上述方法中所述上调或增强或提高目的大豆中前述蛋白质的编码基因的表达量或所述蛋白质的含量为将前述蛋白质的编码基因导入所述目的大豆。
前述蛋白质也属于本发明的保护范围。
本发明还提供生物材料,所述生物材料为下述任一种:
B1)、编码前述蛋白质的核酸分子;
B2)、含有B1)所述核酸分子的表达盒;
B3)、含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)、含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物;
B5)、抑制或降低或下调前述蛋白质的编码基因的表达的核酸分子或抑制或降低或下调所述蛋白质的活性或含量的核酸分子;
B6)、表达B5)所述核酸分子的编码基因;
B7)、含有B6)所述基因的表达盒;
B8)、含有B6)所述基因的重组载体、或含有B7)所述表达盒的重组载体;
B9)、含有B6)所述基因的重组微生物、或含有B7)所述表达盒的重组微生物、或含有B4)所述重组载体的重组微生物。
上述生物材料中B1)所述核酸分子如C1)、C2)或C3)所示的所述蛋白质的编码基因:
C1)编码序列是SEQ ID No.1或SEQ ID No.3的cDNA分子或DNA分子;
C2)与C1)限定的cDNA或DNA分子杂交且编码具有相同功能的蛋白质的cDNA分子或DNA分子。
本发明通过将GmCOL2a或/和GmCOL2b蛋白的编码基因敲除,得到GmCOL2a或/和GmCOL2b基因敲除的转基因大豆植株,转基因大豆株高降低,单株荚数粒数增加。本发明所提供的GmCOL2a或/和GmCOL2b蛋白及其编码基因在大豆株高和单株荚数粒数研究中具有重要的理论意义和应用价值。
附图说明
图1为GmCOL2a和GmCOL2b基因结构及CRISPR/Cas9靶点序列。
图2为CRISPR/Cas9介导的GmCOL2a和GmCOL2b靶点处的定点突变。
图3为Jack、Gmcol2a和Gmcol2b突变体在廊坊田间的表型。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
根癌农杆菌EHA105,记载在如下文献中:Cai Y,Chen L,Liu X,Guo C,Sun S,WuC,Jiang B,Han T and Hou W(2018),CRISPR/Cas9-mediated targeted mutagenesis ofGmFT2a delays flowering time in soya bean.Plant Biotechnol J 16,176-185,公众可以从中国农业科学院作物科学研究所获得。
栽培大豆Jack,记载在如下文献中:Chen L,Cai Y,Liu X,Yao W,Guo C,Sun S,WuC,Jiang B,Han T,Hou W(2018),Improvement of soybean Agrobacterium-mediatedtransformation efficiency by adding glutamine and asparagine into the culturemedia.International Journal of Molecular Sciences 19,3039,公众可以从中国农业科学院作物科学研究所获得。
PCR扩增用的高保真酶为PhantaMax Super-Fidelity DNAPolymerase,购于南京诺唯赞生物科技有限公司,货号P505-d3。MS盐:Phyto Tech,目录号:M524。MS有机:PhytoTech公司,目录号:M533。B5有机:Phytotech公司,目录号:G219。B5盐:Phytotech公司,目录号:G768。
LB固体培养基组分:NaCl 10g/L,酵母提取物5g/L,胰蛋白胨10g/L,琼脂15g/L,溶剂为水。
YEP固体培养基由溶剂和溶剂组成;各溶质及其在YEP固体培养基中的浓度为:NaCl 5g/L,酵母提取物5g/L,胰蛋白胨10g/L,15g/L琼脂;溶剂为水。YEP固体培养基的pH为7.0。
发芽培养基(pH 5.8):3.12g/L B5盐、1mL/LB5有机、20g/L蔗糖、7.5g/L琼脂,余量为水。
液体培养基(pH 5.4):0.43g/L MS盐、1mL/LB5有机、40mg/L乙酰丁香酮、150mg/L二硫苏糖醇、100mg/L L-半胱氨酸、30g/L蔗糖、3.9mg/L 2-吗啉乙磺酸,余量为水。
共培养培养基(pH 5.4):0.43g/L MS盐、1mL/L B5有机、40mg/L乙酰丁香酮、150mg/L二硫苏糖醇、100mg/L L-半胱氨酸、30g/L蔗糖、7.5g/L琼脂、3.9mg/L 2-吗啉乙磺酸,余量为水。
恢复培养基(pH 5.4):3.1g/L B5盐、1mL/L B5有机、30g/L蔗糖、150mg/L头孢霉素、150mg/L特美汀、1mg/L 6-BA、0.98g/L 2-吗啉乙磺酸、7.5g/L琼脂、4mL/L Fe盐(200×)、50mg/L L-天冬酰胺、50mg/L L-谷氨酰胺,余量为水。
筛选培养基(pH 5.4):3.1g/LB5盐、1mL/LB5有机、0.98g/L 2-吗啉乙磺酸、30g/L蔗糖、150mg/L头孢霉素、150mg/L特美汀、1mg/L 6-BA、6mg/L草丁膦、7.5g/L琼脂、4mL/L Fe盐(200×)、50mg/L L-天冬酰胺、50mg/L L-谷氨酰胺,余量为水。
伸长培养基(pH 5.6):4.0g/L MS盐、1mL/L B5有机、0.6g/L 2-吗啉乙磺酸、30g/L蔗糖、150mg/L头孢霉素、150mg/L特美汀、0.1mg/L IAA、0.5mg/L GA、1mg/L 6-BA、6mg/L草丁膦、7.5g/L琼脂、4mL/LFe盐(200×)、50mg/L L-天冬酰胺、50mg/L L-谷氨酰胺,余量为水。
生根培养基(pH 5.7):2.165g/LMS盐、1mL/LB5有机、0.6g/L 2-吗啉乙磺酸、20g/L蔗糖、7.5g/L琼脂、50mg/L L-天冬酰胺、50mg/L L-谷氨酰胺,余量为水。
实施例1、利用CRISPR/Cas9定点敲除大豆基因GmCOL2a和GmCOL2b
1.1sgRNA靶点序列选择
从Phytozome数据库获得大豆GmCOL2a(Glyma.13G050300)基因组序列、CDS序列(SEQ ID No.1)、蛋白序列(SEQ ID No.2)和GmCOL2b(Glyma.19G039000)基因组序列、CDS序列(SEQ ID No.3)、蛋白序列(SEQ ID No.4)。如图1所示,在GmCOL2a的第一个外显子上选择了一个靶点GmCOL2a-sgRNA,靶点序列为5′-TTGGTGGCAGCACCGGCACC-3′,靶向GmCOL2a基因组序列的1026-1045位,也即SEQ ID No.1的第26到45位;在GmCOL2b的第一个外显子上选择了一个靶点GmCOL2b-sgRNA,靶点序列为5′-GCAGCAACACTGGCACCACC-3′,靶向GmCOL26基因组序列的1032-1051位,也即SEQ ID No.3的第32到51位。
1.2CRISPR/Cas9载体构建
(1)用限制性内切酶NHeI和BbsI,在50uL体系和37℃条件下双酶切载体pUC57-sgRNA-SpCas93小时,1%的琼脂糖凝胶电泳检测,胶回收目的条带(大小约3201bp)。该目的条带含有AtU6启动子驱动的sgRNA表达盒元件。
(2)按照sgRNA的靶点序列合成引物,序列如下(小写字母即为靶点):
GmCOL2a-Cas9-F:5′-TCGAAGTAGTGATTGttggtggcagcaccggcaccGTTTTAGAGCTAGAA-3′
GmCOL2a-Cas9-R:5′-TTCTAGCTCTAAAACggtgccggtgctgccaccaacAATCACTACTTCGA-3′
GmCOL2b-Cas9-F:5′-TCGAAGTAGTGATTGgcagcaacactggcaccaccGTTTTAGAGCTAGAA-3′
GmCOL2b-Cas9-R:5′-TTCTAGCTCTAAAACggtggtgccagtgttgctgcCAATCACTACTTCGA-3′
(3)在离心管中加入相应的F/R引物(浓度10μM)各5μL,加入ddH2O 15μL至反应体系为25μL。95℃3min,0.1℃/s退火至16℃,16℃保持10min,完成退火,形成oligo二聚体。GmCOL2a-Cas9-F和GmCOL2a-Cas9-R形成的oligo二聚体编码靶向于GmCOL2a的sgRNA(名称为sgRNA-GmCOL2a)。GmCOL2b-Cas9-F和GmCOL2b-Cas9-R形成的oligo二聚体编码靶向于GmCOL2b的sgRNA(名称为sgRNA-GmCOL2b)。
(4)取3.5μL退火产物与1.5μL酶切后的pUC57-sgRNA-SpCas9载体胶回收产物,用Ultra One Step Cloning Kit(南京诺唯赞生物科技有限公司,货号C115-02)进行连接,冻融法转化大肠杆菌DH5α,涂于LB+Amp的固体培养基上,倒置在37℃培养箱中过夜。挑取单克隆,摇菌,进行测序分析。测序引物为pSgRNA-CX:5′-CGCCAGGGTTTTCCCAGTCACGAC-3′,测序结果正确的菌液用于质粒提取。提取得到的质粒命名为pUC57-sgRNA-SpCas9-GmCOL2a质粒和pUC57-sgRNA-SpCas9-GmCOL2b质粒。pUC57-sgRNA-SpCas9-GmCOL2a质粒已连接上靶向GmCOL2a的sgRNA的序列。pUC57-sgRNA-SpCas9-GmCOL2b质粒已连接上靶向GmCOL2b的靶序列sgRNA的序列。
(5)用限制性内切酶PacI和PmeI,在50uL体系和37℃条件下进行双酶切,反应时间为3小时。pUC57-sgRNA-SpCas9-GmCOL2a质粒经双酶切后回收约586bp的目的片段sgRNA-SpCas9-GmCOL2a,pUC57-sgRNA-SpCas9-GmCOL2b质粒经双酶切后胶回收约586bp的目的片段sgRNA-SpCas9-GmCOL2b,空载PTF101-SpCas9质粒经双酶切后回收约14232bp的目的片段,随后用T4 DNA连接酶(NEB,货号M0202V)将sgRNA-SpCas9-GmCOL2a和sgRNA-SpCas9-GmCOL2b分别连接至空载PTF101-SpCas9质粒经双酶切后的目的片段,冻融法转化大肠杆菌DH5α,涂于LB+Spe的固体培养基上,倒置在37℃培养箱中过夜。挑取单克隆,摇菌,测序验证是否连接成功。测序引物为sgRNA-TYJC:5′-TGGGAATCTGAAAGAAGAGAAGCA-3′。将验证正确的质粒命名为pGmCOL2a-sgRNA和pGmCOL2b-sgRNA。重组质粒pGmCOL2a-sgRNA是以包含GmCOL2a的靶点序列的sgRNA的表达盒元件替代PTF101-SpCas9质粒上的PacI和Pme酶切识别位点之间的核苷酸序列并保持其他核苷酸序列不变的重组表达载体。重组质粒pGmCOL2b-sgRNA是以包含GmCOL2b的靶点序列的sgRNA的表达盒元件替代PTF101-SpCas9质粒上的PacI和Pme酶切识别位点之间的核苷酸序列并保持其他核苷酸序列不变的重组表达载体。
(6)提取质粒,将质粒pGmCOL2a-sgRNA和pGmCOL2b-sgRNA通过冻融法分别转化根癌农杆菌EHA105的感受态细胞,得到重组农杆菌,命名为EHA105-GmCOL2a-sgRNA和EHA105-GmCOL2b-sgRNA。
1.3根癌农杆菌介导的大豆遗传转化
将重组菌EHA105-GmCOL2a-sgRNA和EHA105-GmCOL2b-sgRNA转化大豆栽培品种Jack。具体步骤如下:
1、种子灭菌
1)取无病虫害和斑点、饱满、均一、干燥的大豆品种Jack种子,完全平铺在培养皿中,然后将培养皿放入干燥器中。
2)完成步骤1)后,在所述干燥器中放入100mL容量的烧杯,在烧杯中倒入90mL 12M次氯酸钠水溶液,再慢慢加入5mL浓盐酸,然后迅速盖上干燥器,用凡士林密封,放置16小时,进行氯气灭菌。
2、制备侵染菌液
1)28℃,培养上述得到的EHA105-GmCOL2a-sgRNA和EHA105-GmCOL2b-sgRNA菌液,用液体培养基重悬,得到OD600nm=0.6-0.8的侵染菌液。
2)将步骤1处理后的Jack大豆种子放入超净台中,在显微镜下,剥去种皮,沿长轴将两个子叶分开,保留带完整胚轴的那片子叶,在其胚轴和子叶连接处进行划伤,一般一个子叶划伤3-5刀,然后在28℃培养箱中,浸染2小时。
3)将子叶内面(平滑面)向上,平铺于已铺有无菌滤纸的共培养培养基上,温度22℃,暗培养5天。
4)共培养5天后,外植体胚轴伸长到2厘米,切掉部分胚轴,使其保留0.5cm。将处理后的外植体放到恢复培养基中,28℃,16小时光照/8小时黑暗条件下,培养7天。
5)从恢复培养基中取出外植体,去除新芽,切除部分胚轴,保留0.5cm的胚轴,再将修整后外植体转入到筛选培养基中,28℃,16小时光照/8小时黑暗条件下培养21天。
6)经过21天的筛选诱导,外植体产生大量不定芽,剥除子叶和棕色的叶子,将剩余的部分转入伸长培养基中培养,28℃,16小时光照/8小时黑暗条件下培养。
7)在伸长培养基中,当丛生芽抽出5-8厘米幼茎时,从不定芽基部剪下来;茎基部在1mg/LIBA溶液中沾1分钟,然后转入生根培养基中培养,28℃,16小时光照/8小时黑暗条件下培养一周,在茎基部产生大量根后,移栽到盆中,获得的植株为T0代转基因大豆植株。
1.4基因编辑植株的编辑类型检测
(1)利用植物基因组DNA提取试剂盒(康为世纪,CW0553)提取T0代转基因大豆植株叶片的DNA。
(2)以DNA作为模板进行PCR扩增。靶点GmCOL2a-sgRNA的扩增引物为GmCOL2a-SpCas9-F:5′-AGGGATAACATGAGATTTTGACTGG-3′和GmCOL2a-SpCas9-R:5′-AGGGATAACATGAGATTTTGACTGG-3′,扩增片段的长度为788bp,测序引物为COL-CX:5′-CACGATGGCACCCTTGATTCTCCC-3′。靶点GmCOL2b-sgRNA的扩增引物为GmCOL2b-SpCas9-F:5′-ACACGTGTCTCCAAGTTGTGT-3′和GmCOL2b-SpCas9-R:5′-ACGCGTTTGTGATTGTGCTC-3′,扩增片段的长度为756bp,测序引物为GmCOL2b-SpCas9-F。PCR反应体系:2×Max Buffer25μL,dNTP Mix(10mM each)1μL,DNA(200ng/μL)2μL,F(10pmol/μL)2μL,R(10pmol/μL)2μL,Max Super-Fidelity DNAPolymerase 1μL,ddH2O 17μL,总体积50μL。扩增反应体系:95℃3min;95℃15sec,56℃15sec,72℃45sec,35个循环;72℃5min。扩增产物进行测序分析。测序结果有三种情况:测序峰图从CRISPR/Cas9切割位点附近往后出现重叠峰,在靶位点上游没有重叠峰,则为杂合的编辑类型;峰图从前到后均没出现重叠的峰,然后与野生型参考序列比对,若完全一致,则说明没有发生定点突变;峰图从前到后均没出现重叠的峰,然后与野生型参考序列比对,若不完全匹配,则确定具体的突变类型,突变类型一般包括碱基的插入、缺失和错配等。
经检测,T0代GmCOL2a-SpCas9转基因大豆植株41株中,发生基因编辑的植株为22株;T0代GmCOL2b-SpCas9转基因大豆植株36株中,发生基因编辑的植株为16株。将T0代基因编辑的植株自交1代,得到T1代基因编辑的植株。之后按照上述方法检测T1代基因编辑的植株的突变类型。
结果发现,在GmCOL2a-sgRNA靶点产生了两种纯合的突变类型(图2中A),分别命名为Gmcol2a-51和Gmcol2a-78。与野生型大豆的基因组DNA相比:
Gmcol2a-51编码GmCOL2a蛋白的基因的两条同源染色体均发生了相同的缺失,缺失了SEQ ID No.1的第35-42位共计8个核苷酸,导致编辑位点后的氨基酸翻译移码,蛋白序列提前终止,从而将GmCOL2a基因敲除。
Gmcol2a-78编码GmCOL2a蛋白的基因的两条同源染色体均发生了相同的缺失,缺失了基因组的第682-1079位共计398个核苷酸(包含SEQ ID No.1的第1到79位碱基)导致编辑位点后的氨基酸翻译移码,蛋白序列提前终止,从而将GmCOL2a基因敲除。上述Gmcol2a-78突变体中突变后的基因组如后文记载的Gmcol2a-78突变体中突变后的基因组序列所示,其编码序列如后文记载的Gmcol2a-78突变体中突变后的编码序列(CDS)所示,其氨基酸序列如后文记载的Gmcol2a-78突变体中突变后的氨基酸序列所示,GmCOL2a蛋白功能缺失。
结果发现,在GmCOL2b-sgRNA靶点产生了两种纯合的突变类型(图2中B),分别命名为Gmcol2b-35和Gmcol2b-46。与野生型大豆的基因组DNA相比:
Gmcol2b-35编码GmCOL2b蛋白的基因的两条同源染色体均发生了相同的缺失,缺失了SEQ ID No.3的第48位共计1个核苷酸,导致编辑位点后的氨基酸翻译移码,蛋白序列提前终止,从而将GmCOL2b基因敲除。上述Gmcol2b-35突变体中突变后的基因组如后文记载的Gmcol2b-35突变体中突变后的基因组序列所示,其编码序列如后文记载的Gmcol2b-35突变体中突变后的编码序列(CDS)所示,其氨基酸序列如后文记载的Gmcol2b-35突变体中突变后的氨基酸序列所示,GmCOL2b蛋白功能缺失。
Gmcol2b-46编码GmCOL2b蛋白的基因的两条同源染色体均发生了相同的缺失,缺失了SEQ ID No.3的第46-48位共计3核苷酸,导致编辑位点缺失了一个氨基酸。
随后,将T1代的Gmcol2a-78和Gmcol2b-35突变体分别自交1代,得到T2代纯合的Gmcol2a-78和Gmcol2b-35突变体种子,命名为Gmcol2a突变体和Gmcol2b突变体,用于后续田间实验。
实施例2、野生型、Gmcol2a和Gmcol2b突变体在廊坊田间的表型观察
分别将野生型大豆品种Jack、Gmcol2a和Gmcol2b突变体夏播种植于廊坊(39.5°N,116.6°E)大田,小区采用随机区组设计,3次重复。处理小区面积为15平方米(6.0米×2.5米),每个小区播种6行,行长6米;行距50厘米,株距10厘米。每个小区从中间4行随机选取5株,每种材料从三个小区共选取15株,观察并统计株高(厘米)、主茎节数(个)、单株荚数(个)和单株粒数(个)等农艺性状。采用GraphPad Prism 8软件对数据进行处理,实验结果以平均值±标准差表示,采用One-wayANOVA检验,P<0.05(*)表示与野生型大豆品种Jack相比具有显著性差异,P<0.01(**)表示与野生型大豆品种Jack相比具有极显著差异。野生型Jack、Gmcol2a和Gmcol2b突变体在廊坊田间的表型如图3所示。统计结果表明,与野生型Jack相比,Gmcol2a和Gmcol2b突变体的株高降低,单株荚数和单株粒数极显著地增加,但主茎节数无显著差异,具体数据见表1。
表1野生型、Gmcol2a和Gmcol2b突变体在廊坊的田间表型
植株 | 株高(cm) | 单株荚数(个) | 单株粒数(粒) | 主茎节数(节) |
Jack | 103.4±3.9 | 85.6±17.7 | 204.5±40.1 | 21.6±0.7 |
Gmcol2a | 74.7±5.8** | 101.9±13.8** | 235.3±39.3** | 20.9±1.3 |
Gmcol2b | 71.2±8.0** | 101.1±12.6** | 242.4±34.1** | 21.3±1.0 |
实施例3在北京田间三个种植密度条件下的表型观察
分别将野生型大豆品种Jack、Gmcol2a和Gmcol2b突变体夏播种植于北京(40.2°N,116.6°E)大田。处理小区面积为5平方米(2.0米×2.5米),每个小区播种6行,行长2米,行距50厘米。设置了三个种植密度,分别为密度1(286,000株/公顷)、密度2(200,000株/公顷)和密度3(154,000株/公顷)。小区采用随机区组设计,3次重复。从每个小区中间4行随机选取15株,每种材料每种密度条件从三个小区共选取45株,观察并统计株高、主茎节数、单株荚数和单株粒数等农艺性状。采用GraphPad Prism 8软件对数据进行处理,实验结果以平均值±标准差表示,采用One-wayANOVA检验,P<0.05(*)表示在同一种植密度下,与野生型大豆品种Jack相比具有显著性差异,P<0.01(**)表示与野生型大豆品种Jack相比具有极显著差异。统计结果表明,在三种种植密度条件下,与野生型Jack相比,Gmcol2a和Gmcol2b突变体都表现出株高降低,单株荚数和单株粒数显著增加的表型,但主茎节数无显著差异,具体数据见表2。由此可见,GmCOL2a或GmCOL2b蛋白的功能丧失会导致大豆株高显著降低、单株荚数显著增加以及单株粒数显著增加。随后,对每个小区实收产量进行鉴定。每个小区的六行材料,去掉两个边行,剩下的四行混合收获并称重,重量换算成千克/公顷表示。结果表明,野生型Jack在密度1、密度2和密度3的群体收获产量分别为3405.5±311.9千克/公顷,3361.1±170.2千克/公顷和2932.2±178.9千克/公顷;Gmcol2a突变体在密度1、密度2和密度3的群体收获产量分别为4366.7±260.3千克/公顷,4300.0±104.1千克/公顷和3555.6±105.8千克/公顷,相比于对照Jack分别增产28.2%、27.9%和21.2%。Gmcol2b突变体在密度1、密度2和密度3的群体收获产量分别为3850.0±115.5千克/公顷,4011.1±67.4千克/公顷和4066.7±264.6千克/公顷,相比于对照Jack分别增产13.1%、19.3%和38.7%。
表2野生型、Gmcol2a和Gmcol2b突变体北京不同种植密度的田间表型
植株 | 株高(cm) | 单株荚数(个) | 单株粒数(粒) | 主茎节数(节) |
Jack-密度1 | 151.0±8.1 | 58.7±7.4 | 152.6±20.6 | 23.2±1.5 |
Gmcol2a-密度1 | 129.7±7.9** | 72.0±8.2** | 184.8±21.9** | 22.2±1.5 |
Gmcol2b-密度1 | 128.4±6.9** | 66.8±10.6** | 170.4±28.0** | 21.8±1.5 |
Jack-密度2 | 136.2±6.3 | 69.3±12.8 | 179.0±34.0 | 23.4±1.7 |
Gmcol2a-密度2 | 124.2±6.6** | 82.7±8.3** | 214.2±21.0** | 22.8±1.3 |
Gmcol2b-密度2 | 122.4±6.8** | 79.9±10.9** | 207.8±31.4** | 22.9±1.6 |
Jack-密度3 | 130.7±8.8 | 74.2±14.7 | 196.5±39.0 | 23.5±1.9 |
Gmcol2a-密度3 | 119.2±8.1** | 90.0±17.8** | 235.9±47.6** | 23.3±1.9 |
Gmcol2b-密度3 | 115.07±10.6** | 101.1±24.7** | 256.9±63.7** | 23.6±1.3 |
GmCOL2a基因组序列
5'-AGGATCGTCCAAGTCAATATAGCTTATGCTGGTTCAAAGTGCAAATCCGATCCAA GAAGAAGCTCGACCTTATCTGAGTTTGATAACATTAATTGCTTGTATGTCACATGGCTTGCGATTTACAACAACCATCAACAACTTTTCCTATGCATTCTACATACATATAAGGCATTCTTATAACTTCAAGTTCATATCTAATCTTTCATTTCTTGCCTATTTCTTACAAAAGCTAACTTGAACGTTGATGCCTTTACAAGTAGCGACCATCAAACCCCTCCTTTATAACCACCATGGTGCTACTATGTTATTCCTAAGTACACCAAACAAAATTTATTATGAACAATAATATTTGAACACCATGTTATTTGAAACATTCCACCTTGACAGTTCTTCTAACTCCACCAACAAAAAATTACTATTTATTTTCATAATCACAAAGACTCCACATTCTATCTGCAAAATCAGTAATCATCTAAACACGTGCTTTAATCCTTTTACGTACAGCCAATAAGATTACATGAAAGGAAAGCATATATATTAAGGGATAACATGAGATTTTGACTGGTGCATGTATATAGAATCTACATGGACCCAAAATTACACGTGTCTCCAAGTTGTGCCTCCATAGCAATACGAACAAAGCCTCAACATCTCTTTAATGATT
CCAAAAGGCAAAGGAAGCAACATGCACAGGTCCAACAAAAAAAAAAAAAAAAAACCT
CTCTCCTATTCAACCCCAAAACACAACCAACCACAAGATAAGCAAGAACTTGTGCACGC
CACTAACTTGCTGCCACGATGGCACCCTTGATTCTCCCCCAACACTACTTGGTTCTCCTC
ACTGAACTCAACTTCTCACTCACACTCACTTCTCTTCCTCCAAATTAGTTCCAACTCCAA
GTTAGTTCCAACACAAACACAAACACACACACATACATAAACCAAGCAAAGAAAGACT
CTACAAACACTTCACTACTCATACAATATTTTCAGACACAACATGTTGAAGGAAGGCACC
AACAACGTTGGTGGCAGCACCGGCACCTGGTCACATGTCTGCGACACGTGCCGGTCAG
CGCCATGCGTACTGTACTGCCATGCAGACTCAGCATACCTTTGCTCATCCTGCGATGCTC
GTGTCCATGCGGCTAACCGTGTGGCCTCAAGACACGAGCGTGTGTGGGTGTGCGAAGC
GTGTGAACGTGCTCCCGCAGCGTTTCTATGCAAAGCCGACGCAGCTTCTCTTTGTTCTTC
CTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACCACCGCGTGCCCA
TTCTCCCGATCTCTGGTTCCCTCTTCGGGGAACCAGAGCATGAACGCGTGTACGCGTTC
GTGAATGAAGTGGAAGCGGAGGAGGAAGAGGAAGAGGTTTTTGATGAGTATGATGAGG
TTGAAGCAGCTTCGTGGTTGTTGCCACATCCTATGAAAAATGATAAAATTGACGAGAATG
GTGGTGATAAGGGTTTTTTGTTTGGTGATGAGTATTTCGACAACCTTGTTGATTGTAACTC
ATGTGGTCACAATAACAACCAGTTTAGCAACGTTTATGATCAGCACCAGCAGAATTACA
GCAACACTGTCCCTCAGAACTATGCAGTGGTTCCAGTTCAGGTGCCGCAGCATTTTCAA
CCGGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGATGGTTCTCTTAGTCAA
AGTGTAAGTTACCTTCTTTTTACTTCTATGTGTTTCTTTTTGGTTTGTTGTTTATATCAATG
GGGTTTTCCCTTCTTTTTTTTTTTTTTTTTCTTTTTGCAAACTCTTTGGATCATTCATCCAT
TGGATTATACTACTTTATTAGATTTTGCCTTGAAACCTGTGCTAACTCTTCCTTCTAATTGA
CAGTTTCTTTTTCTCCATTCGTATGAAACCAAGGTTTTAAACTGCAGTCATAGTCATAGTC
AAGATTATAGTTTATTCAAAAACATTAGCATTGTAATACAATTGTACTGTAATTGTCGTCG
TGAAAAAGTTAAAAAAAAGTTTAAAAAATCTCAATCGCATACCTTCTATAAAAATCTTGA
TTGAAACCAAAGTGGGTTTCATAAGTAGTTTCTTTTACAAGAAAAACTAGCAATAAAGT
CAACTACTCTAGATCCATTGCCATACATGTGACCTTGATCCATTCCACAACGTTTCGTATT
TCTTTGCCTACCCTTTTCCCATTGACTACTTTTCTGTCTTGAGAGACATTTATTTTATTTTT
TTCGTATGCAATAGCTTTCCCTTTTTGATGTCTTGTATTTGCTAGTTATAGTTGTGATTCCT
CATAAACAGATACTTACTTTTATAGGGTAACTTAGCTTTTCACCAATTTTCGCCCATACAT
AGTTAGACTTCCCTAAACTTTGTTTCCTCATTTCTTCAACTATAATTTGATCAATTGTATAT
TAATTTCCCATAATTTTCAGCTTCAATTAAAAAATTTGAGCCTAAGTGCCTGTTTTATTAA
AGCCAAACAATGGGGGGTTTAATATTTTAAAAACTTTCTTCTATATTTCTTTTACATTTCCT
CTGTTTTCTAATATATCTTTTCTTTTTTCTATTACATCATCTTTGATATATTTTCACCTTTTTC
TTCTTACTTTGGGGACAAACATTATTGTTTCACAAAATTGGTTAGCTACTAATAGTTTATT
GCCTTACCTGTAATCTCTCAAACTTCATACACGTTTTTGTGTTAATCTTTTATATTTCATTT
TTAATTTAGGTTTCGGTTTCATCGATGGATGTTGGTGTTGTACTCGAATCAACAATAAGTG
ACATCTCAATGTCCCACTCAAAGTCGCCAATAGGGACAACTGACCTATTTCCTCCCCTTC
CCATGCCTTCACATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATACAGGGAG
AAAAAGAAGACAAGAAAATTTGAGAAGAAAATAAGGTATGCCTCAAGGAAGGCCTATG
CAGAGACTAGACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACCGATGTAGAAGCTGA
AGTGGACCAGATGTTCTCCACAACACTATTCACTGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAGAATGGAAAGAAAGTAATGGCCAGGCCATAAAAGAGAAGGTT-3'
GmCOL2b基因组序列
5'-TAAAAAAAAAGTATCATATTTAGAGAGACTAAAAGATTATTTAAGTCAAAAAATA ATTTTTGTTTAGCATTTGTTCTCACCGAGTTCTAGGCAAGTGATCCGTCTTCGTCTTCCCTTTAGTAGTTGAACAGGTCAATTGGTTAAACCACAGATTGATGGAAGTGATATAATGATTAAATATGCGATATATATTACTTGTGTCACATATTAATGAAATTGTGCGGATGGTCTAGTGGTAAATATACTAGAAAGATTTTCCTAGACAAAGATCGACTCTATGGTTGGTAATTTACTTTTACAATTTCCTTAAAATAGTCAAGTAACTAGCTGTAAACCTCAGCAAATTTAGTACTTGGAGCAACTATGAACAATTAATGATATTTATTTTAAACATTCCACCTTAATTAACATCTTAGTTCTCCAAACTCCACCAACCAAAAATTTCTATTTATTTTCATAATCACAAGCACTCCACATTCTATCTGCAAAATCAGTAATTAACCAAACACTTGCTTTAATCCTTTTAGAGCCAATAAGATTACTGAGAGGAAAGGATATATTAAGGGGTAACAAGAGATTCTAACTGGTGCAAGTATAGAATCTACATGGACCCAAATGACACGTGTCTCCAAGTTGTGTCACCATAGCAATACGAACAAAGCCTCAGCATCTCTTTAATGATTCCAAAAGGCAAAGAAGCAACATGCATGGACAGGTCCAACACCAAAACAAAAAACCCTCTCTCCTAATCAACCCTGAAACACAACCAACCACAAGATAAGCAAGAACTTGTGCACGCCACTAACTTGCTGCCACGTTGGCACTCTTGATTCTCCCCCCAACACTACTTGGTTCACCTCACTAAACTCAATTTCTCACTCACACTCACTTCAGTTCAATTCACTTCCCTTCCTCCAAATTAGTTCCAACACAAAAACCAAGCAAAGAAAAAGACTCTACCGAAACACTTCACTACTCATACAATATTTTCAGACACAACATGTTGAAGGAAGGCACCAACAACGTTGGTGGCAGCAACACTGGCACCACCTGGTCACGTGTCTGTGACACGTGCCTGTCTGCGCCATGCGTGCTGTACTGCCATGCAGACTCAGCATATCTTTGCTCTTCCTGTGATGCTCGTGTGCATGCAGCTAACCGTGTGGCCTCGAGACACAAGCGTGTGTGGGTGTGCGAAGCGTGTGAGCGTGCTCCGGCGGCGTTTCTATGCAAAGCTGACGCAGCTTCTCTTTGTTCTTCCTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACAACCGTGTTCCCATTCTCCCGATCTCAGGTTCCCTCTTCAGGGAACCAGAGCACAATCACAAACGCGTGGAACACGCGTTCGTGAATGAGGTTGAGGAGGAAGAGGAAGGGGTTTTTGATGAGTATGAAGACGAGGTTGAAGCTGCTTCGTGGTTGTTGCCACATCCTATGAAAAATAATGATGAAATTGAGGAGAATGATTGTGGTGACGAGGGTTTTTTGTTTGTTGATGAGTATTTGGACAATCTTGTTGATTGTTGTAACTCATGTGGTCACAATGACAACCAGTTTAGCAACGTTTATCAGCACCAGCAGAATTACAACACTGTCCCTCAGAACTATGTAGTGGTTCCAGTTCAGGTGCCGCAGCATTTTCAACCCGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGATGGTTCTCTTAGTCAAAGTGTAAGACTCTTCTTTTCAATTACTTCTGTGTTTCTTTTTCGGTTTGTTTTTTATATGAATAGTGTTTTCCCTTTTTCTCTTTCTTTTTCTTTTCCCAGACTCTTTGGATCATTCATCCATTGGATTATACTTTATCAGATTTTGATTTTGCCTTGACACCTTTGCTAACTCTTCCTTCCAATTGGCAGTTTCTTTCCTTTCTCCGTTCATATGAAACTAGGGTTTTAAATTATACTCATGATCAATAATTTGGTTGCAATTTTTGATATTGTAGTACAATTGCTATTGTTGTTGTGAAAAGTTAAAAAAATCTTAATGTTGTAACCGAAATCTCAATCACATACTGTTTGTAAAATCCTTGGTTGAAATCAAAGTGGGTTTCCCAAGTAGCTTCTTTTACTAGAAACGCTAGCAAAGTCAACTACTCTAGTTCAATTGCCATATATGTGACTAATTTGATTCATTCCACAACTCTTCATATTTCTTTGACTACCCTTTTACCGTTCACTTTGCGGTCTTGAGAGACTTTTATTTATTTTCTTTTTTGTCGTATATAAGATCAGCTTTGCCTTTATGGTGTCTTTTATTTGCTAGTTATAGTTGTGATTCCTCTTAAACTTTGTTTCCTCATTTCATCAACTGTATATTAATTTCCCATAATTTTTCAGCTTCAATTAAAAAAATTGAGCCTAAGTGCCTGATTTATTAAAGCCACAAAATGGGTGGTTTAATTTTTTCGACACCTTTCTTTTATATTTCTTTTACTCTTCTTCTCTTTTCTTTTTCTATTACATCATCTATAATATATCTTCACCTTTTTCTTCTTACTTTGGGGACAAACATTTTTGTTTCACAAAGCTGGTTAGCTACTAGTTTATTGCTTAGAAAATTTATAGCCTTACCTGTGATCTCTCAAACTTCATACACGATTTTGTGTTAATCTTTTATATTTCATTTTTAATTTAGGTTTCGGTTTCATCAATGGATGTTGGAGTTGTACCCGAATCAACAGTAAGTGGCATCTCAATGTCCCACTCAAAGTCACCAATAGGGACAAATGACCTATTTCCTCCCCTTCTCATGCCTTCACATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATATAGGGAGAAAAAGAAGACAAGAAAGTTCGAGAAGAAAATAAGATATGCCTCAAGGAAGGCCTATGCAGAGACTAGACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACTGATGTAGAAGCTGAAGTGGATCAGATGTTCTCCACAAAACTATTCAATGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAGAATGGAAAGAAAGTAATTGCCAAGCCATAGAAGAGAAGGTTGGGAACCACACATCATTGGAAGAACTTCATGTAATTTTTATGTAGTCTAATTAGTTTGGTATTATATTTACTTCTATCTTGTGCTTTATAAATATAAAGTAT-3'
pUC57-sgRNA-SpCas9载体序列
5'-TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGA CGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGTTTAAACGGCGCGCCCCAATGTCCCTAGGTTCGTTGAACAACGGAAACTCGACTTGCCTTCCGCACAATACATCATTTCTTCTTAGCTTTTTTTCTTCTTCTTCGTTCATACAGTTTTTTTTTGTTTATCAGCTTACATTTTCTTGAACCGTAGCTTTCGTTTTCTTCTTTTTAACTTTCCATTCGGAGTTTTTGTATCTTGTTTCATAGTTTGTCCCAGGATTAGAATGATTAGGCATCGAACCTTCAAGAATTTGATTGAATAAAACATCTTCATTCTTAAGATATGAAGATAATCTTCAAAAGGCCCCTGGGAATCTGAAAGAAGAGAAGCAGGCCCATTTATATGGGAAAGAACAATAGTATTTCTTATATAGGCCCATTTAAGTTGAAAACAATCTTCAAAAGTCCCACATCGCTTAGATAAGAAAACGAAGCTGAGTTTATATACAGCTAGAGTCGAAGTAGTGATTGCTAGCGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCAGAAGACCCGTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCAAAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAGATTTTTTTACTAGTTTAATTAAGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTC-3'
PTF101-SpCas9载体序列如下:
5'-AGTACTTTAAAGTACTTTAAAGTACTTTAAAGTACTTTGATCCAACCCCTCCGCTG CTATAGTGCAGTCGGCTTCTGACGTTCAGTGCAGCCGTCTTCTGAAAACGACATGTCGC
ACAAGTCCTAAGTTACGCGACAGGCTGCCGCCCTGCCCTTTTCCTGGCGTTTTCTTGTCG
CGTGTTTTAGTCGCATAAAGTAGAATACTTGCGACTAGAACCGGAGACATTACGCCATGA
ACAAGAGCGCCGCCGCTGGCCTGCTGGGCTATGCCCGCGTCAGCACCGACGACCAGGA
CTTGACCAACCAACGGGCCGAACTGCACGCGGCCGGCTGCACCAAGCTGTTTTCCGAG
AAGATCACCGGCACCAGGCGCGACCGCCCGGAGCTGGCCAGGATGCTTGACCACCTAC
GCCCTGGCGACGTTGTGACAGTGACCAGGCTAGACCGCCTGGCCCGCAGCACCCGCGA
CCTACTGGACATTGCCGAGCGCATCCAGGAGGCCGGCGCGGGCCTGCGTAGCCTGGCA
GAGCCGTGGGCCGACACCACCACGCCGGCCGGCCGCATGGTGTTGACCGTGTTCGCCG
GCATTGCCGAGTTCGAGCGTTCCCTAATCATCGACCGCACCCGGAGCGGGCGCGAGGCC
GCCAAGGCCCGAGGCGTGAAGTTTGGCCCCCGCCCTACCCTCACCCCGGCACAGATCG
CGCACGCCCGCGAGCTGATCGACCAGGAAGGCCGCACCGTGAAAGAGGCGGCTGCACT
GCTTGGCGTGCATCGCTCGACCCTGTACCGCGCACTTGAGCGCAGCGAGGAAGTGACG
CCCACCGAGGCCAGGCGGCGCGGTGCCTTCCGTGAGGACGCATTGACCGAGGCCGACG
CCCTGGCGGCCGCCGAGAATGAACGCCAAGAGGAACAAGCATGAAACCGCACCAGGA
CGGCCAGGACGAACCGTTTTTCATTACCGAAGAGATCGAGGCGGAGATGATCGCGGCCG
GGTACGTGTTCGAGCCGCCCGCGCACGTCTCAACCGTGCGGCTGCATGAAATCCTGGCC
GGTTTGTCTGATGCCAAGCTGGCGGCCTGGCCGGCCAGCTTGGCCGCTGAAGAAACCG
AGCGCCGCCGTCTAAAAAGGTGATGTGTATTTGAGTAAAACAGCTTGCGTCATGCGGTC
GCTGCGTATATGATGCGATGAGTAAATAAACAAATACGCAAGGGGAACGCATGAAGGTT
ATCGCTGTACTTAACCAGAAAGGCGGGTCAGGCAAGACGACCATCGCAACCCATCTAGC
CCGCGCCCTGCAACTCGCCGGGGCCGATGTTCTGTTAGTCGATTCCGATCCCCAGGGCA
GTGCCCGCGATTGGGCGGCCGTGCGGGAAGATCAACCGCTAACCGTTGTCGGCATCGAC
CGCCCGACGATTGACCGCGACGTGAAGGCCATCGGCCGGCGCGACTTCGTAGTGATCGA
CGGAGCGCCCCAGGCGGCGGACTTGGCTGTGTCCGCGATCAAGGCAGCCGACTTCGTG
CTGATTCCGGTGCAGCCAAGCCCTTACGACATATGGGCCACCGCCGACCTGGTGGAGCT
GGTTAAGCAGCGCATTGAGGTCACGGATGGAAGGCTACAAGCGGCCTTTGTCGTGTCGC
GGGCGATCAAAGGCACGCGCATCGGCGGTGAGGTTGCCGAGGCGCTGGCCGGGTACGA
GCTGCCCATTCTTGAGTCCCGTATCACGCAGCGCGTGAGCTACCCAGGCACTGCCGCCG
CCGGCACAACCGTTCTTGAATCAGAACCCGAGGGCGACGCTGCCCGCGAGGTCCAGGC
GCTGGCCGCTGAAATTAAATCAAAACTCATTTGAGTTAATGAGGTAAAGAGAAAATGAG
CAAAAGCACAAACACGCTAAGTGCCGGCCGTCCGAGCGCACGCAGCAGCAAGGCTGC
AACGTTGGCCAGCCTGGCAGACACGCCAGCCATGAAGCGGGTCAACTTTCAGTTGCCG
GCGGAGGATCACACCAAGCTGAAGATGTACGCGGTACGCCAAGGCAAGACCATTACCG
AGCTGCTATCTGAATACATCGCGCAGCTACCAGAGTAAATGAGCAAATGAATAAATGAGT
AGATGAATTTTAGCGGCTAAAGGAGGCGGCATGGAAAATCAAGAACAACCAGGCACCG
ACGCCGTGGAATGCCCCATGTGTGGAGGAACGGGCGGTTGGCCAGGCGTAAGCGGCTG
GGTTGTCTGCCGGCCCTGCAATGGCACTGGAACCCCCAAGCCCGAGGAATCGGCGTGA
GCGGTCGCAAACCATCCGGCCCGGTACAAATCGGCGCGGCGCTGGGTGATGACCTGGT
GGAGAAGTTGAAGGCCGCGCAGGCCGCCCAGCGGCAACGCATCGAGGCAGAAGCACG
CCCCGGTGAATCGTGGCAAGCGGCCGCTGATCGAATCCGCAAAGAATCCCGGCAACCG
CCGGCAGCCGGTGCGCCGTCGATTAGGAAGCCGCCCAAGGGCGACGAGCAACCAGATT
TTTTCGTTCCGATGCTCTATGACGTGGGCACCCGCGATAGTCGCAGCATCATGGACGTGG
CCGTTTTCCGTCTGTCGAAGCGTGACCGACGAGCTGGCGAGGTGATCCGCTACGAGCTT
CCAGACGGGCACGTAGAGGTTTCCGCAGGGCCGGCCGGCATGGCCAGTGTGTGGGATT
ACGACCTGGTACTGATGGCGGTTTCCCATCTAACCGAATCCATGAACCGATACCGGGAA
GGGAAGGGAGACAAGCCCGGCCGCGTGTTCCGTCCACACGTTGCGGACGTACTCAAGT
TCTGCCGGCGAGCCGATGGCGGAAAGCAGAAAGACGACCTGGTAGAAACCTGCATTCG
GTTAAACACCACGCACGTTGCCATGCAGCGTACGAAGAAGGCCAAGAACGGCCGCCTG
GTGACGGTATCCGAGGGTGAAGCCTTGATTAGCCGCTACAAGATCGTAAAGAGCGAAAC
CGGGCGGCCGGAGTACATCGAGATCGAGCTAGCTGATTGGATGTACCGCGAGATCACAG
AAGGCAAGAACCCGGACGTGCTGACGGTTCACCCCGATTACTTTTTGATCGATCCCGGC
ATCGGCCGTTTTCTCTACCGCCTGGCACGCCGCGCCGCAGGCAAGGCAGAAGCCAGATG
GTTGTTCAAGACGATCTACGAACGCAGTGGCAGCGCCGGAGAGTTCAAGAAGTTCTGT
TTCACCGTGCGCAAGCTGATCGGGTCAAATGACCTGCCGGAGTACGATTTGAAGGAGGA
GGCGGGGCAGGCTGGCCCGATCCTAGTCATGCGCTACCGCAACCTGATCGAGGGCGAA
GCATCCGCCGGTTCCTAATGTACGGAGCAGATGCTAGGGCAAATTGCCCTAGCAGGGGA
AAAAGGTCGAAAAGGTCTCTTTCCTGTGGATAGCACGTACATTGGGAACCCAAAGCCGT
ACATTGGGAACCGGAACCCGTACATTGGGAACCCAAAGCCGTACATTGGGAACCGGTC
ACACATGTAAGTGACTGATATAAAAGAGAAAAAAGGCGATTTTTCCGCCTAAAACTCTTT
AAAACTTATTAAAACTCTTAAAACCCGCCTGGCCTGTGCATAACTGTCTGGCCAGCGCA
CAGCCGAAGAGCTGCAAAAAGCGCCTACCCTTCGGTCGCTGCGCTCCCTACGCCCCGCC
GCTTCGCGTCGGCCTATCGCGGCCGCTGGCCGCTCAAAAATGGCTGGCCTACGGCCAGG
CAATCTACCAGGGCGCGGACAAGCCGCGCCGTCGCCACTCGACCGCCGGCGCCCACAT
CAAGGCACCCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGC
TCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCA
GGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCCAGTCACGTAGC
GATAGCGGAGTGTATACTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGC
ACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGC
TCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTA
TCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAA
GAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCT
GGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTC
AGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTC
CCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCC
TTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGT
CGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCT
TATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAG
CAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTG
AAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTG
AAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCG
CTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCT
CAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACG
TTAAGGGATTTTGGTCATGCATGATATATCTCCCAATTTGTGTAGGGCTTATTATGCACGCT
TAAAAATAATAAAAGCAGACTTGACCTGATAGTTTGGCTGTGAGCAATTATGTGCTTAGT
GCATCTAACGCTTGAGTTAAGCCGCGCCGCGAAGCGGCGTCGGCTTGAACGAATTTCTA
GCTAGACATTATTTGCCGACTACCTTGGTGATCTCGCCTTTCACGTAGTGGACAAATTCTT
CCAACTGATCTGCGCGCGAGGCCAAGCGATCTTCTTCTTGTCCAAGATAAGCCTGTCTA
GCTTCAAGTATGACGGGCTGATACTGGGCCGGCAGGCGCTCCATTGCCCAGTCGGCAGC
GACATCCTTCGGCGCGATTTTGCCGGTTACTGCGCTGTACCAAATGCGGGACAACGTAA
GCACTACATTTCGCTCATCGCCAGCCCAGTCGGGCGGCGAGTTCCATAGCGTTAAGGTTT
CATTTAGCGCCTCAAATAGATCCTGTTCAGGAACCGGATCAAAGAGTTCCTCCGCCGCT
GGACCTACCAAGGCAACGCTATGTTCTCTTGCTTTTGTCAGCAAGATAGCCAGATCAATG
TCGATCGTGGCTGGCTCGAAGATACCTGCAAGAATGTCATTGCGCTGCCATTCTCCAAAT
TGCAGTTCGCGCTTAGCTGGATAACGCCACGGAATGATGTCGTCGTGCACAACAATGGT
GACTTCTACAGCGCGGAGAATCTCGCTCTCTCCAGGGGAAGCCGAAGTTTCCAAAAGG
TCGTTGATCAAAGCTCGCCGCGTTGTTTCATCAAGCCTTACGGTCACCGTAACCAGCAA
ATCAATATCACTGTGTGGCTTCAGGCCGCCATCCACTGCGGAGCCGTACAAATGTACGGC
CAGCAACGTCGGTTCGAGATGGCGCTCGATGACGCCAACTACCTCTGATAGTTGAGTCG
ATACTTCGGCGATCACCGCTTCCCCCATGATGTTTAACTTTGTTTTAGGGCGACTGCCCTG
CTGCGTAACATCGTTGCTGCTCCATAACATCAAACATCGACCCACGGCGTAACGCGCTTG
CTGCTTGGATGCCCGAGGCATAGACTGTACCCCAAAAAAACAGTCATAACAAGCCATGA
AAACCGCCACTGCGCCGTTACCACCGCTGCGTTCGGTCAAGGTTCTGGACCAGTTGCGT
GACGGCAGTTACGCTACTTGCATTACAGCTTACGAACCGAACGAGGCTTATGTCCACTG
GGTTCGTGCCCGAATTGATCACAGGCAGCAACGCTCTGTCATCGTTACAATCAACATGCT
ACCCTCCGCGAGATCATCCGTGTTTCAAACCCGGCAGCTTAGTTGCCGTTCTTCCGAATA
GCATCGGTAACATGAGCAAAGTCTGCCGCCTTACAACGGCTCTCCCGCTGACGCCGTCC
CGGACTGATGGGCTGCCTGTATCGAGTGGTGATTTTGTGCCGAGCTGCCGGTCGGGGAG
CTGTTGGCTGGCTGGTGGCAGGATATATTGTGGTGTAAACAAATTGACGCTTAGACAACT
TAATAACACATTGCGGACGTTTTTAATGTACTGAATTAACGCCGAATTGCTCTAGCATTCG
CCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACG
CCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTT
TCCCAGTCACGACGTTGTAAAACGACGGCCAGTGCCAAGCTAATTCGCTTCAAGACGTG
CTCAAATCACTATTTCCACACCCCTATATTTCTATTGCACTCCCTTTTAACTGTTTTTTATT
ACAAAAATGCCCTGGAAAATGCACTCCCTTTTTGTGTTTGTTTTTTTGTGAAACGATGTT
GTCAGGTAATTTATTTGTCAGTCTACTATGGTGGCCCATTATATTAATAGCAACTGTCGGT
CCAATAGACGACGTCGATTTTCTGCATTTGTTTAACCACGTGGATTTTATGACATTTTATAT
TAGTTAATTTGTAAAACCTACCCAATTAAAGACCTCATATGTTCTAAAGACTAATACTTAA
TGATAACAATTTTCTTTTAGTGAAGAAAGGGATAATTAGTAAATATGGAACAAGGGCAGA
AGATTTATTAAAGCCGCGGTAAGAGACAACAAGTAGGTACGTGGAGTGTCTTAGGTGAC
TTACCCACATAACATAAAGTGACATTAACAAACATAGCTAATGCTCCTATTTGAATAGTGC
ATATCAGCATACCTTATTACATATAGATAGGAGCAAACTCTAGCTAGATTGTTGAGCAGAT
CTCGGTGACGGGCAGGACCGGACGGGGCGGTACCGGCAGGCTGAAGTCCAGCTGCCA
GAAACCCACGTCATGCCAGTTCCCGTGCTTGAAGCCGGCCGCCCGCAGCATGCCGCGG
GGGGCATATCCGAGCGCCTCGTGCATGCGCACGCTCGGGTCGTTGGGCAGCCCGATGAC
AGCGACCACGCTCTTGAAGCCCTGTGCCTCCAGGGACTTCAGCAGGTGGGTGTAGAGC
GTGGAGCCCAGTCCCGTCCGCTGGTGGCGGGGGGAGACGTACACGGTCGACTCGGCCG
TCCAGTCGTAGGCGTTGCGTGCCTTCCAGGGGCCCGCGTAGGCGATGCCGGCGACCTCG
CCGTCCACCTCGGCGACGAGCCAGGGATAGCGCTCCCGCAGACGGACGAGGTCGTCCG
TCCACTCCTGCGGTTCCTGCGGCTCGGTACGGAAGTTGACCGTGCTTGTCTCGATGTAGT
GGTTGACGATGGTGCAGACCGCCGGCATGTCCGCCTCGGTGGCACGGCGGATGTCGGC
CGGGCGTCGTTCTGGGCTCATGGTAGATCCCCCGTTCGTAAATGGTGAAAATTTTCAGAA
AATTGCTTTTGCTTTAAAAGAAATGATTTAAATTGCTGCAATAGAAGTAGAATGCTTGATT
GCTTGAGATTCGTTTGTTTTGTATATGTTGTGTTGAGAATTAATTCTCGAGGTCCTCTCCA
AATGAAATGAACTTCCTTATATAGAGGAAGGGTCTTGCGAAGGATAGTGGGATTGTGCGT
CATCCCTTACGTCAGTGGAGATATCACATCAATCCACTTGCTTTGAAGACGTGGTTGGAA
CGTCTTCTTTTTCCACGATGCTCCTCGTGGGTGGGGGTCCATCTTTGGGACCACTGTCGG
TAGAGGCATCTTGAACGATAGCCTTTCCTTTATCGCAATGATGGCATTTGTAGGAGCCAC
CTTCCTTTTCCACTATCTTCACAATAAAGTGACAGATAGCTGGGCAATGGAATCCGAGGA
GGTTTCCGGATATTACCCTTTGTTGAAAAGTCTCAATTGCCCTTTGGTCTTCTGAGACTGT
ATCTTTGATATTTTTGGAGTAGACAAGTGTGTCGTGCTCCACCATGTTATCACATCAATCC
ACTTGCTTTGAAGACGTGGTTGGAACGTCTTCTTTTTCCACGATGCTCCTCGTGGGTGG
GGGTCCATCTTTGGGACCACTGTCGGCAGAGGCATCTTCAACGATGGCCTTTCCTTTATC
GCAATGATGGCATTTGTAGGAGCCACCTTCCTTTTCCACTATCTTCACAATAAAGTGACA
GATAGCTGGGCAATGGAATCCGAGGAGGTTTCCGGATATTACCCTTTGTTGAAAAGTCTC
AATTGCCCTTTGGTCTTCTGAGACTGTATCTTTGATATTTTTGGAGTAGACAAGTGTGTCG
TGCTCCACCATGTTGACCTGCAGGCATGCAAGCTTGCATGCCTGCAGGTCCCCAGATTA
GCCTTTTCAATTTCAGAAAGAATGCTAACCCACAGATGGTTAGAGAGGCTTACGCAGCA
GGTCTCATCAAGACGATCTACCCGAGCAATAATCTCCAGGAAATCAAATACCTTCCCAAG
AAGGTTAAAGATGCAGTCAAAAGATTCAGGACTAACTGCATCAAGAACACAGAGAAAG
ATATATTTCTCAAGATCAGAAGTACTATTCCAGTATGGACGATTCAAGGCTTGCTTCACAA
ACCAAGGCAAGTAATAGAGATTGGAGTCTCTAAAAAGGTAGTTCCCACTGAATCAAAGG
CCATGGAGTCAAAGATTCAAATAGAGGACCTAACAGAACTCGCCGTAAAGACTGGCGA
ACAGTTCATACAGAGTCTCTTACGACTCAATGACAAGAAGAAAATCTTCGTCAACATGG
TGGAGCACGACACACTTGTCTACTCCAAAAATATCAAAGATACAGTCTCAGAAGACCAA
AGGGCAATTGAGACTTTTCAACAAAGGGTAATATCCGGAAACCTCCTCGGATTCCATTG
CCCAGCTATCTGTCACTTTATTGTGAAGATAGTGGAAAAGGAAGGTGGCTCCTACAAAT
GCCATCATTGCGATAAAGGAAAGGCCATCGTTGAAGATGCCTCTGCCGACAGTGGTCCC
AAAGATGGACCCCCACCCACGAGGAGCATCGTGGAAAAAGAAGACGTTCCAACCACGT
CTTCAAAGCAAGTGGATTGATGTGATATCTCCACTGACGTAAGGGATGACGCACAATCC
CACTATCCTTCGCAAGACCCTTCCTCTATATAAGGAAGTTCATTTCATTTGGAGAGAACA
CGGGGGACTCTAGAATGGCCCCTAAGAAGAAGAGAAAGGTCGGTATTCACGGCGTTCC
TGCGGCGATGGACAAGAAGTATAGTATTGGTCTGGACATTGGGACGAATTCCGTTGGCT
GGGCCGTGATCACCGATGAGTACAAGGTCCCTTCCAAGAAGTTTAAGGTTCTGGGGAAC
ACCGATCGGCACAGCATCAAGAAGAATCTCATTGGAGCCCTCCTGTTCGACTCAGGCGA
GACCGCCGAAGCAACAAGGCTCAAGAGAACCGCAAGGAGACGGTATACAAGAAGGAA
GAATAGGATCTGCTACCTGCAGGAGATTTTCAGCAACGAAATGGCGAAGGTGGACGATT
CGTTCTTTCATAGATTGGAGGAGAGTTTCCTCGTCGAGGAAGATAAGAAGCACGAGAGG
CATCCTATCTTTGGCAACATTGTCGACGAGGTTGCCTATCACGAAAAGTACCCCACAATC
TATCATCTGCGGAAGAAGCTTGTGGACTCGACTGATAAGGCGGACCTTAGATTGATCTAC
CTCGCTCTGGCACACATGATTAAGTTCAGGGGCCATTTTCTGATCGAGGGGGATCTTAAC
CCGGACAATAGCGATGTGGACAAGTTGTTCATCCAGCTCGTCCAAACCTACAATCAGCT
CTTTGAGGAAAACCCAATTAATGCTTCAGGCGTCGACGCCAAGGCGATCCTGTCTGCAC
GCCTTTCAAAGTCTCGCCGGCTTGAGAACTTGATCGCTCAACTCCCGGGCGAAAAGAA
GAACGGCTTGTTCGGGAATCTCATTGCACTTTCGTTGGGGCTCACACCAAACTTCAAGA
GTAATTTTGATCTCGCTGAGGACGCAAAGCTGCAGCTTTCCAAGGACACTTATGACGAT
GACCTGGATAACCTTTTGGCCCAAATCGGCGATCAGTACGCGGACTTGTTCCTCGCCGC
GAAGAATTTGTCGGACGCGATCCTCCTGAGTGATATTCTCCGCGTGAACACCGAGATTAC
AAAGGCCCCGCTCTCGGCGAGTATGATCAAGCGCTATGACGAGCACCATCAGGATCTGA
CCCTTTTGAAGGCTTTGGTCCGGCAGCAACTCCCAGAGAAGTACAAGGAAATCTTCTTT
GATCAATCCAAGAACGGCTACGCTGGTTATATTGACGGCGGGGCATCGCAGGAGGAATT
CTACAAGTTTATCAAGCCAATTCTGGAGAAGATGGATGGCACAGAGGAACTCCTGGTGA
AGCTCAATAGGGAGGACCTTTTGCGGAAGCAAAGAACTTTCGATAACGGCAGCATCCCT
CACCAGATTCATCTCGGGGAGCTGCACGCCATCCTGAGAAGGCAGGAAGACTTCTACCC
CTTTCTTAAGGATAACCGGGAGAAGATCGAAAAGATTCTGACGTTCAGAATTCCGTACTA
TGTCGGACCACTCGCCCGGGGTAATTCCAGATTTGCGTGGATGACCAGAAAGAGCGAG
GAAACCATCACACCTTGGAACTTCGAGGAAGTGGTCGATAAGGGCGCTTCCGCACAGA
GCTTCATTGAGCGCATGACAAATTTTGACAAGAACCTGCCTAATGAGAAGGTCCTTCCC
AAGCATTCCCTCCTGTACGAGTATTTCACTGTTTATAACGAACTCACGAAGGTGAAGTAT
GTGACCGAGGGAATGCGCAAGCCCGCCTTCCTGAGCGGCGAGCAAAAGAAGGCGATCG
TGGACCTTTTGTTTAAGACCAATCGGAAGGTCACAGTTAAGCAGCTCAAGGAGGACTAC
TTCAAGAAGATTGAATGCTTCGATTCCGTTGAGATCAGCGGCGTGGAAGACAGGTTTAA
CGCGTCACTGGGGACTTACCACGATCTCCTGAAGATCATTAAGGATAAGGACTTCTTGG
ACAACGAGGAAAATGAGGATATCCTCGAAGACATTGTCCTGACTCTTACGTTGTTTGAG
GATAGGGAAATGATCGAGGAACGCTTGAAGACGTATGCCCATCTCTTCGATGACAAGGT
TATGAAGCAGCTCAAGAGAAGAAGATACACCGGATGGGGAAGGCTGTCCCGCAAGCTT
ATCAATGGCATTAGAGACAAGCAATCAGGGAAGACAATCCTTGACTTTTTGAAGTCTGA
TGGCTTCGCGAACAGGAATTTTATGCAGCTGATTCACGATGACTCACTTACTTTCAAGGA
GGATATCCAGAAGGCTCAAGTGTCGGGACAAGGTGACAGTCTGCACGAGCATATCGCCA
ACCTTGCGGGATCTCCTGCAATCAAGAAGGGTATTCTGCAGACAGTCAAGGTTGTGGAT
GAGCTTGTGAAGGTCATGGGACGGCATAAGCCCGAGAACATCGTTATTGAGATGGCCAG
AGAAAATCAGACCACACAAAAGGGTCAGAAGAACTCGAGGGAGCGCATGAAGCGCAT
CGAGGAAGGCATTAAGGAGCTGGGGAGTCAGATCCTTAAGGAGCACCCGGTGGAAAAC
ACGCAGTTGCAAAATGAGAAGCTCTATCTGTACTATCTGCAAAATGGCAGGGATATGTAT
GTGGACCAGGAGTTGGATATTAACCGCCTCTCGGATTACGACGTCGATCATATCGTTCCT
CAGTCCTTCCTTAAGGATGACAGCATTGACAATAAGGTTCTCACCAGGTCCGACAAGAA
CCGCGGGAAGTCCGATAATGTGCCCAGCGAGGAAGTCGTTAAGAAGATGAAGAACTAC
TGGAGGCAACTTTTGAATGCCAAGTTGATCACACAGAGGAAGTTTGATAACCTCACTAA
GGCCGAGCGCGGAGGTCTCAGCGAACTGGACAAGGCGGGCTTCATTAAGCGGCAACTG
GTTGAGACTAGACAGATCACGAAGCACGTGGCGCAGATTCTCGATTCACGCATGAACAC
GAAGTACGATGAGAATGACAAGCTGATCCGGGAAGTGAAGGTCATCACCTTGAAGTCA
AAGCTCGTTTCTGACTTCAGGAAGGATTTCCAATTTTATAAGGTGCGCGAGATCAACAAT
TATCACCATGCTCATGACGCATACCTCAACGCTGTGGTCGGAACAGCATTGATTAAGAAG
TACCCGAAGCTCGAGTCCGAATTCGTGTACGGTGACTATAAGGTTTACGATGTGCGCAA
GATGATCGCCAAGTCAGAGCAGGAAATTGGCAAGGCCACTGCGAAGTATTTCTTTTACT
CTAACATTATGAATTTCTTTAAGACTGAGATCACGCTGGCTAATGGCGAAATCCGGAAGA
GACCACTTATTGAGACCAACGGCGAGACAGGGGAAATCGTGTGGGACAAGGGGAGGGA
TTTCGCCACAGTCCGCAAGGTTCTCTCTATGCCTCAAGTGAATATTGTCAAGAAGACTGA
AGTCCAGACGGGCGGGTTCTCAAAGGAATCTATTCTGCCCAAGCGGAACTCGGATAAGC
TTATCGCCAGAAAGAAGGACTGGGACCCGAAGAAGTATGGAGGTTTCGACTCACCAAC
GGTGGCTTACTCTGTCCTGGTTGTGGCAAAGGTGGAGAAGGGAAAGTCAAAGAAGCTC
AAGTCTGTCAAGGAGCTCCTGGGTATCACCATTATGGAGAGGTCCAGCTTCGAAAAGAA
TCCGATCGATTTTCTCGAGGCGAAGGGATATAAGGAAGTGAAGAAGGACCTGATCATTA
AGCTTCCAAAGTACAGTCTTTTCGAGTTGGAAAACGGCAGGAAGCGCATGTTGGCTTCC
GCAGGAGAGCTCCAGAAGGGTAACGAGCTTGCTTTGCCGTCCAAGTATGTGAACTTCCT
CTATCTGGCATCCCACTACGAGAAGCTCAAGGGCAGCCCAGAGGATAACGAACAGAAG
CAACTGTTTGTGGAGCAACACAAGCATTATCTTGACGAGATCATTGAACAGATTTCGGA
GTTCAGTAAGCGCGTCATCCTCGCCGACGCGAATTTGGATAAGGTTCTCTCAGCCTACAA
CAAGCACCGGGACAAGCCTATCAGAGAGCAGGCGGAAAATATCATTCATCTCTTCACCC
TGACAAACCTTGGGGCTCCCGCTGCATTCAAGTATTTTGACACTACGATTGATCGGAAG
AGATACACTTCTACGAAGGAGGTGCTGGATGCAACCCTTATCCACCAATCGATTACTGGC
CTCTACGAGACGCGGATCGACTTGAGTCAGCTCGGGGGGGATAAGAGACCAGCGGCAA
CCAAGAAGGCAGGACAAGCGAAGAAGAAGAAGTAGGTTAACGAATTTCCCCGATCGTT
CAAACATTTGGCAATAAAGTTTCTTAAGATTGAATCCTGTTGCCGGTCTTGCGATGATTAT
CATATAATTTCTGTTGAATTACGTTAAGCATGTAATAATTAACATGTAATGCATGACGTTAT
TTATGAGATGGGTTTTTATGATTAGAGTCCCGCAATTATACATTTAATACGCGATAGAAAA
CAAAATATAGCGCGCAAACTAGGATAAATTATCGCGCGCGGTGTCATCTATGTTACTAGAT
CGGGAATTCTTAATTAAGGATCCGTAATCATGTCATAGCTGTTTCCTGTGTGAAATTGTTA
TCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTG
CCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGG
GAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTT
GCGTATTGGAGCTTGAGCTTGGATCAGATTGTCGTTTCCCGCCTTCAGGCGCGCCGTTTA
AACTATCAGTGTTTGACAGGATATATTGGCGGGTAAACCTAAGAGAAAAGAGCGTTTATT
AGAATAATCGGATATTTAAAAGGGCGTGAAAAGGTTTATCCGTTCGTCCATTTGTATGTGCATGCCAACCACAGGGTTCCCCTCGGGATCAA-3'
Gmcol2a-78突变体中突变后的基因组序列
5'-AGGATCGTCCAAGTCAATATAGCTTATGCTGGTTCAAAGTGCAAATCCGATCCAA GAAGAAGCTCGACCTTATCTGAGTTTGATAACATTAATTGCTTGTATGTCACATGGCTTGCGATTTACAACAACCATCAACAACTTTTCCTATGCATTCTACATACATATAAGGCATTCTTATAACTTCAAGTTCATATCTAATCTTTCATTTCTTGCCTATTTCTTACAAAAGCTAACTTGAACGTTGATGCCTTTACAAGTAGCGACCATCAAACCCCTCCTTTATAACCACCATGGTGCTACTATGTTATTCCTAAGTACACCAAACAAAATTTATTATGAACAATAATATTTGAACACCATGTTATTTGAAACATTCCACCTTGACAGTTCTTCTAACTCCACCAACAAAAAATTACTATTTATTTTCATAATCACAAAGACTCCACATTCTATCTGCAAAATCAGTAATCATCTAAACACGTGCTTTAATCCTTTTACGTACAGCCAATAAGATTACATGAAAGGAAAGCATATATATTAAGGGATAACATGAGATTTTGACTGGTGCATGTATATAGAATCTACATGGACCCAAAATTACACGTGTCTCCAAGTTGTGCCTCCATAGCAATACGAACAAAGCCTCAACATCTCTTTAATGATTCCAAAAGGCAAAGGAAGCATGCGTACTGTACTGCCATGCAGACTCAGCATACCTTTGCTCATCCTGCGATGCTCGTGTCCATGCGGCTAACCGTGTGGCCTCAAGACACGAGCGTGTGTGGGTGTGCGAAGCGTGTGAACGTGCTCCCGCAGCGTTTCTATGCAAAGCCGACGCAGCTTCTCTTTGTTCTTCCTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACCACCGCGTGCCCATTCTCCCGATCTCTGGTTCCCTCTTCGGGGAACCAGAGCATGAACGCGTGTACGCGTTCGTGAATGAAGTGGAAGCGGAGGAGGAAGAGGAAGAGGTTTTTGATGAGTATGATGAGGTTGAAGCAGCTTCGTGGTTGTTGCCACATCCTATGAAAAATGATAAAATTGACGAGAATGGTGGTGATAAGGGTTTTTTGTTTGGTGATGAGTATTTCGACAACCTTGTTGATTGTAACTCATGTGGTCACAATAACAACCAGTTTAGCAACGTTTATGATCAGCACCAGCAGAATTACAGCAACACTGTCCCTCAGAACTATGCAGTGGTTCCAGTTCAGGTGCCGCAGCATTTTCAACCGGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGATGGTTCTCTTAGTCAAAGTGTAAGTTACCTTCTTTTTACTTCTATGTGTTTCTTTTTGGTTTGTTGTTTATATCAATGGGGTTTTCCCTTCTTTTTTTTTTTTTTTTTCTTTTTGCAAACTCTTTGGATCATTCATCCATTGGATTATACTACTTTATTAGATTTTGCCTTGAAACCTGTGCTAACTCTTCCTTCTAATTGACAGTTTCTTTTTCTCCATTCGTATGAAACCAAGGTTTTAAACTGCAGTCATAGTCATAGTCAAGATTATAGTTTATTCAAAAACATTAGCATTGTAATACAATTGTACTGTAATTGTCGTCGTGAAAAAGTTAAAAAAAAGTTTAAAAAATCTCAATCGCATACCTTCTATAAAAATCTTGATTGAAACCAAAGTGGGTTTCATAAGTAGTTTCTTTTACAAGAAAAACTAGCAATAAAGTCAACTACTCTAGATCCATTGCCATACATGTGACCTTGATCCATTCCACAACGTTTCGTATTTCTTTGCCTACCCTTTTCCCATTGACTACTTTTCTGTCTTGAGAGACATTTATTTTATTTTTTTCGTATGCAATAGCTTTCCCTTTTTGATGTCTTGTATTTGCTAGTTATAGTTGTGATTCCTCATAAACAGATACTTACTTTTATAGGGTAACTTAGCTTTTCACCAATTTTCGCCCATACATAGTTAGACTTCCCTAAACTTTGTTTCCTCATTTCTTCAACTATAATTTGATCAATTGTATATTAATTTCCCATAATTTTCAGCTTCAATTAAAAAATTTGAGCCTAAGTGCCTGTTTTATTAAAGCCAAACAATGGGGGGTTTAATATTTTAAAAACTTTCTTCTATATTTCTTTTACATTTCCTCTGTTTTCTAATATATCTTTTCTTTTTTCTATTACATCATCTTTGATATATTTTCACCTTTTTCTTCTTACTTTGGGGACAAACATTATTGTTTCACAAAATTGGTTAGCTACTAATAGTTTATTGCCTTACCTGTAATCTCTCAAACTTCATACACGTTTTTGTGTTAATCTTTTATATTTCATTTTTAATTTAGGTTTCGGTTTCATCGATGGATGTTGGTGTTGTACTCGAATCAACAATAAGTGACATCTCAATGTCCCACTCAAAGTCGCCAATAGGGACAACTGACCTATTTCCTCCCCTTCCCATGCCTTCACATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATACAGGGAGAAAAAGAAGACAAGAAAATTTGAGAAGAAAATAAGGTATGCCTCAAGGAAGGCCTATGCAGAGACTAGACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACCGATGTAGAAGCTGAAGTGGACCAGATGTTCTCCACAACACTATTCACTGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAGAATGGAAAGAAAGTAATGGCCAGGCCATAAAAGAGAAGGTT-3'
Gmcol2a-78突变体中突变后的编码序列(CDS)
5'-CATGCGTACTGTACTGCCATGCAGACTCAGCATACCTTTGCTCATCCTGCGATGCT CGTGTCCATGCGGCTAACCGTGTGGCCTCAAGACACGAGCGTGTGTGGGTGTGCGAAGCGTGTGAACGTGCTCCCGCAGCGTTTCTATGCAAAGCCGACGCAGCTTCTCTTTGTTCTTCCTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACCACCGCGTGCCCATTCTCCCGATCTCTGGTTCCCTCTTCGGGGAACCAGAGCATGAACGCGTGTACGCGTTCGTGAATGAAGTGGAAGCGGAGGAGGAAGAGGAAGAGGTTTTTGATGAGTATGATGAGGTTGAAGCAGCTTCGTGGTTGTTGCCACATCCTATGAAAAATGATAAAATTGACGAGAATGGTGGTGATAAGGGTTTTTTGTTTGGTGATGAGTATTTCGACAACCTTGTTGATTGTAACTCATGTGGTCACAATAACAACCAGTTTAGCAACGTTTATGATCAGCACCAGCAGAATTACAGCAACACTGTCCCTCAGAACTATGCAGTGGTTCCAGTTCAGGTGCCGCAGCATTTTCAACCGGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGATGGTTCTCTTAGTCAAAGTGTTTCGGTTTCATCGATGGATGTTGGTGTTGTACTCGAATCAACAATAAGTGACATCTCAATGTCCCACTCAAAGTCGCCAATAGGGACAACTGACCTATTTCCTCCCCTTCCCATGCCTTCACATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATACAGGGAGAAAAAGAAGACAAGAAAATTTGAGAAGAAAATAAGGTATGCCTCAAGGAAGGCCTATGCAGAGACTAGACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACCGATGTAGAAGCTGAAGTGGACCAGATGTTCTCCACAACACTATTCACTGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAG-3'
Gmcol2a-78突变体中突变后的氨基酸序列
MRTVLPCRLSIPLLILRCSCPCG
Gmcol2b-35突变体中突变后的基因组序列
5'-TAAAAAAAAAGTATCATATTTAGAGAGACTAAAAGATTATTTAAGTCAAAAAATA ATTTTTGTTTAGCATTTGTTCTCACCGAGTTCTAGGCAAGTGATCCGTCTTCGTCTTCCCTTTAGTAGTTGAACAGGTCAATTGGTTAAACCACAGATTGATGGAAGTGATATAATGATTAAATATGCGATATATATTACTTGTGTCACATATTAATGAAATTGTGCGGATGGTCTAGTGGTAAATATACTAGAAAGATTTTCCTAGACAAAGATCGACTCTATGGTTGGTAATTTACTTTTACAATTTCCTTAAAATAGTCAAGTAACTAGCTGTAAACCTCAGCAAATTTAGTACTTGGAGCAACTATGAACAATTAATGATATTTATTTTAAACATTCCACCTTAATTAACATCTTAGTTCTC
CAAACTCCACCAACCAAAAATTTCTATTTATTTTCATAATCACAAGCACTCCACATTCTAT
CTGCAAAATCAGTAATTAACCAAACACTTGCTTTAATCCTTTTAGAGCCAATAAGATTAC
TGAGAGGAAAGGATATATTAAGGGGTAACAAGAGATTCTAACTGGTGCAAGTATAGAAT
CTACATGGACCCAAATGACACGTGTCTCCAAGTTGTGTCACCATAGCAATACGAACAAA
GCCTCAGCATCTCTTTAATGATTCCAAAAGGCAAAGAAGCAACATGCATGGACAGGTCC
AACACCAAAACAAAAAACCCTCTCTCCTAATCAACCCTGAAACACAACCAACCACAAG
ATAAGCAAGAACTTGTGCACGCCACTAACTTGCTGCCACGTTGGCACTCTTGATTCTCCC
CCCAACACTACTTGGTTCACCTCACTAAACTCAATTTCTCACTCACACTCACTTCAGTTC
AATTCACTTCCCTTCCTCCAAATTAGTTCCAACACAAAAACCAAGCAAAGAAAAAGACT
CTACCGAAACACTTCACTACTCATACAATATTTTCAGACACAACATGTTGAAGGAAGGC
ACCAACAACGTTGGTGGCAGCAACACTGGCACACCTGGTCACGTGTCTGTGACACGTG
CCTGTCTGCGCCATGCGTGCTGTACTGCCATGCAGACTCAGCATATCTTTGCTCTTCCTGT
GATGCTCGTGTGCATGCAGCTAACCGTGTGGCCTCGAGACACAAGCGTGTGTGGGTGTG
CGAAGCGTGTGAGCGTGCTCCGGCGGCGTTTCTATGCAAAGCTGACGCAGCTTCTCTTT
GTTCTTCCTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACAACCGTG
TTCCCATTCTCCCGATCTCAGGTTCCCTCTTCAGGGAACCAGAGCACAATCACAAACGC
GTGGAACACGCGTTCGTGAATGAGGTTGAGGAGGAAGAGGAAGGGGTTTTTGATGAGT
ATGAAGACGAGGTTGAAGCTGCTTCGTGGTTGTTGCCACATCCTATGAAAAATAATGATG
AAATTGAGGAGAATGATTGTGGTGACGAGGGTTTTTTGTTTGTTGATGAGTATTTGGACA
ATCTTGTTGATTGTTGTAACTCATGTGGTCACAATGACAACCAGTTTAGCAACGTTTATC
AGCACCAGCAGAATTACAACACTGTCCCTCAGAACTATGTAGTGGTTCCAGTTCAGGTG
CCGCAGCATTTTCAACCCGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGAT
GGTTCTCTTAGTCAAAGTGTAAGACTCTTCTTTTCAATTACTTCTGTGTTTCTTTTTCGGT
TTGTTTTTTATATGAATAGTGTTTTCCCTTTTTCTCTTTCTTTTTCTTTTCCCAGACTCTTTG
GATCATTCATCCATTGGATTATACTTTATCAGATTTTGATTTTGCCTTGACACCTTTGCTAA
CTCTTCCTTCCAATTGGCAGTTTCTTTCCTTTCTCCGTTCATATGAAACTAGGGTTTTAAA
TTATACTCATGATCAATAATTTGGTTGCAATTTTTGATATTGTAGTACAATTGCTATTGTTG
TTGTGAAAAGTTAAAAAAATCTTAATGTTGTAACCGAAATCTCAATCACATACTGTTTGT
AAAATCCTTGGTTGAAATCAAAGTGGGTTTCCCAAGTAGCTTCTTTTACTAGAAACGCTA
GCAAAGTCAACTACTCTAGTTCAATTGCCATATATGTGACTAATTTGATTCATTCCACAAC
TCTTCATATTTCTTTGACTACCCTTTTACCGTTCACTTTGCGGTCTTGAGAGACTTTTATTT
ATTTTCTTTTTTGTCGTATATAAGATCAGCTTTGCCTTTATGGTGTCTTTTATTTGCTAGTTA
TAGTTGTGATTCCTCTTAAACTTTGTTTCCTCATTTCATCAACTGTATATTAATTTCCCATA
ATTTTTCAGCTTCAATTAAAAAAATTGAGCCTAAGTGCCTGATTTATTAAAGCCACAAAA
TGGGTGGTTTAATTTTTTCGACACCTTTCTTTTATATTTCTTTTACTCTTCTTCTCTTTTCTT
TTTCTATTACATCATCTATAATATATCTTCACCTTTTTCTTCTTACTTTGGGGACAAACATTT
TTGTTTCACAAAGCTGGTTAGCTACTAGTTTATTGCTTAGAAAATTTATAGCCTTACCTGT
GATCTCTCAAACTTCATACACGATTTTGTGTTAATCTTTTATATTTCATTTTTAATTTAGGTT
TCGGTTTCATCAATGGATGTTGGAGTTGTACCCGAATCAACAGTAAGTGGCATCTCAATG
TCCCACTCAAAGTCACCAATAGGGACAAATGACCTATTTCCTCCCCTTCTCATGCCTTCA
CATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATATAGGGAGAAAAAGAAGA
CAAGAAAGTTCGAGAAGAAAATAAGATATGCCTCAAGGAAGGCCTATGCAGAGACTAG
ACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACTGATGTAGAAGCTGAAGTGGATCAGA
TGTTCTCCACAAAACTATTCAATGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAGAATG
GAAAGAAAGTAATTGCCAAGCCATAGAAGAGAAGGTTGGGAACCACACATCATTGGAA
GAACTTCATGTAATTTTTATGTAGTCTAATTAGTTTGGTATTATATTTACTTCTATCTTGTGCTTTATAAATATAAAGTAT-3'
Gmcol2b-35突变体中突变后的编码序列(CDS)
5'-ATGTTGAAGGAAGGCACCAACAACGTTGGTGGCAGCAACACTGGCACACCTGG TCACGTGTCTGTGACACGTGCCTGTCTGCGCCATGCGTGCTGTACTGCCATGCAGACTCAGCATATCTTTGCTCTTCCTGTGATGCTCGTGTGCATGCAGCTAACCGTGTGGCCTCGAGACACAAGCGTGTGTGGGTGTGCGAAGCGTGTGAGCGTGCTCCGGCGGCGTTTCTATGCAAAGCTGACGCAGCTTCTCTTTGTTCTTCCTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACAACCGTGTTCCCATTCTCCCGATCTCAGGTTCCCTCTTCAGGGAACCAGAGCACAATCACAAACGCGTGGAACACGCGTTCGTGAATGAGGTTGAGGAGGAAGAGGAAGGGGTTTTTGATGAGTATGAAGACGAGGTTGAAGCTGCTTCGTGGTTGTTGCCACATCCTATGAAAAATAATGATGAAATTGAGGAGAATGATTGTGGTGACGAGGGTTTTTTGTTTGTTGATGAGTATTTGGACAATCTTGTTGATTGTTGTAACTCATGTGGTCACAATGACAACCAGTTTAGCAACGTTTATCAGCACCAGCAGAATTACAACACTGTCCCTCAGAACTATGTAGTGGTTCCAGTTCAGGTGCCGCAGCATTTTCAACCCGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGATGGTTCTCTTAGTCAAAGTGTTTCGGTTTCATCAATGGATGTTGGAGTTGTACCCGAATCAACAGTAAGTGGCATCTCAATGTCCCACTCAAAGTCACCAATAGGGACAAATGACCTATTTCCTCCCCTTCTCATGCCTTCACATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATATAGGGAGAAAAAGAAGACAAGAAAGTTCGAGAAGAAAATAAGATATGCCTCAAGGAAGGCCTATGCAGAGACTAGACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACTGATGTAGAAGCTGAAGTGGATCAGATGTTCTCCACAAAACTATTCAATGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAG-3'
Gmcol2b-35突变体中突变后的氨基酸序列
MLKEGTNNVGGSNTGTPGHVSVTRACLRHACCTAMQTQHIFALPVMLVCMQLTVWPRDTSVCGCAKRVSVLRRRFYAKLTQLLFVLPVMLTFTQQTLSLAATTVFPFSRSQVPSSGNQSTITNAWNTRS
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。
Claims (9)
1.应用,其特征在于,所述应用为蛋白质或抑制或降低或下调所述蛋白质的编码基因表达的物质或抑制或降低或下调所述蛋白质活性或/和含量的物质在下述任一种中的应用:
D1)提高大豆产量;
D2)降低大豆株高;
D2)制备降低大豆株高的产品;
D3)培育半矮杆大豆;
D4)制备培育半矮杆大豆的产品;
D5)改良半矮杆大豆或制备半矮杆大豆的产品;
D6)增加大豆单株荚数;
D7)制备增加大豆单株荚数的产品;
D8)培育单株荚数增加的大豆;
D9)制备培育单株荚数增加的大豆的产品;
D10)增加大豆单株粒数;
D11)制备增加大豆单株粒数的产品;
D12)培育单株粒数增加的大豆;
D13)制备培育单株粒数增加的大豆的产品;
D14)大豆育种;
所述蛋白质为下述任一种,
A1)氨基酸序列是SEQ ID No.2的蛋白质;
A2)将SEQ ID No.2所示的氨基酸序列经过氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有80%以上的同一性且具有相同功能的蛋白质;
A3)在A1)或A2)的N端和/或C端连接标签得到的具有相同功能的融合蛋白质。
2.根据权利要求1所述的应用,其特征在于,A2)所述蛋白质为氨基酸序列是SEQ IDNo.4的蛋白质。
3.根据权利要求1或2所述的应用,其特征在于,所述物质为生物材料,所述生物材料为下述任一种:
B1)、核酸分子;
B2)、表达B1)所述核酸分子的基因;
B3)、含有B2)所述基因的表达盒;
B4)、含有B2)所述基因的重组载体、或含有B3)所述表达盒的重组载体;
B5)、含有B2)所述基因的重组微生物、或含有B3)所述表达盒的重组微生物、或含有B4)所述重组载体的重组微生物;
B6)、含有B2)所述基因的转基因植物细胞系、或含有B3)所述表达盒的转基因植物细胞系、或含有B4)所述重组载体的转基因植物细胞系;
B7)、含有B2)所述基因的转基因植物组织、或含有B3)所述表达盒的转基因植物组织、或含有B4)所述重组载体的转基因植物组织;
B8)、含有B2)所述基因的转基因植物器官、或含有B3)所述表达盒的转基因植物器官、或含有B3)所述重组载体的转基因植物器官。
4.根据权利要求2或3所述的应用,其特征在于,B1)所述核酸分子为gRNA,所述gRNA的靶标为所述蛋白质的编码基因。
5.提高大豆产量、降低大豆株高、增加大豆单株荚数或/和增加大豆粒数的方法,包括下调或降低或减弱目的大豆中权利要求1或权利要求2中所述蛋白质的编码基因的表达量或所述蛋白质的含量得到转基因大豆,所述转基因大豆的株高低于所述目的大豆,所述转基因大豆的单株荚数和豆单株粒数高于所述目的大豆。
6.根据权利要求5所述的方法,其特征在于,所述上调或增强或提高目的大豆中权利要求1或权利要求2中所述蛋白质的编码基因的表达量或所述蛋白质的含量为将权利要求1或权利要求2中所述蛋白质的编码基因导入所述目的大豆。
7.权利要求1或权利要求2中所述的蛋白质。
8.生物材料,其特征在于,所述生物材料为下述任一种:
B1)、编码权利要求1或权利要求2中所述蛋白质的核酸分子;
B2)、含有B1)所述核酸分子的表达盒;
B3)、含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)、含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物;
B5)、抑制或降低或下调权利要求1或权利要求2中所述蛋白质的编码基因的表达的核酸分子或抑制或降低或下调所述蛋白质的活性或含量的核酸分子;
B6)、表达B5)所述核酸分子的编码基因;
B7)、含有B6)所述基因的表达盒;
B8)、含有B6)所述基因的重组载体、或含有B7)所述表达盒的重组载体;
B9)、含有B6)所述基因的重组微生物、或含有B7)所述表达盒的重组微生物、或含有B4)所述重组载体的重组微生物。
9.根据权利要求8所述的生物材料,其特征在于,B1)所述核酸分子如C1)、C2)或C3)所示的所述蛋白质的编码基因:
C1)编码序列是SEQ ID No.1或SEQ ID No.3的cDNA分子或DNA分子;
C2)与C1)限定的cDNA或DNA分子杂交且编码具有相同功能的蛋白质的cDNA分子或DNA分子。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311479530.4A CN117551689A (zh) | 2023-11-08 | 2023-11-08 | 与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311479530.4A CN117551689A (zh) | 2023-11-08 | 2023-11-08 | 与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117551689A true CN117551689A (zh) | 2024-02-13 |
Family
ID=89810229
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311479530.4A Pending CN117551689A (zh) | 2023-11-08 | 2023-11-08 | 与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117551689A (zh) |
-
2023
- 2023-11-08 CN CN202311479530.4A patent/CN117551689A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116515888A (zh) | GmMTAs蛋白在调控大豆株高中的应用 | |
CN114369147B (zh) | Bfne基因在番茄株型改良和生物产量提高中的应用 | |
CN110713994B (zh) | 一种植物耐逆性相关蛋白TaMAPK3及其编码基因和应用 | |
CN116891862B (zh) | 一种沟叶结缕草耐盐基因ZmLA1、蛋白及其应用 | |
CN117384927A (zh) | 番茄LecRK26基因在调控植物灰霉病抗性中的应用 | |
US20030154518A1 (en) | Removal of selectable markers from transformed cells | |
CN117106820A (zh) | 一种通过基因组编辑创制番茄少侧枝的方法及其应用 | |
CN110684088B (zh) | 蛋白ZmbZIPa3及其编码基因在调控植物生长发育与耐逆性中的应用 | |
US20230030612A1 (en) | Solanaceous plant and solanaceous plant cell having resistance to tomato spotted wilt virus, and method for producing solanaceous plant | |
CN111499709B (zh) | 水稻穗粒数相关的rgn1蛋白及其编码基因与应用 | |
CN110343159B (zh) | 一种绿豆开花基因VrELF3的表达载体的应用 | |
CN117551689A (zh) | 与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用 | |
CN115011631B (zh) | 调控玉米苗期抗旱性的蛋白及其编码基因和应用 | |
CN116789785B (zh) | 长雄蕊野生稻高产、高光效基因FarL1及其应用 | |
CN114316002B (zh) | 一种大豆无茸毛相关蛋白及其编码基因和应用 | |
CN114316003B (zh) | 大豆茸毛稀少相关蛋白及其编码基因和应用 | |
CN114316004B (zh) | 大豆茸毛稠密相关蛋白及其编码基因和应用 | |
CN114672493B (zh) | 一种用ZmPHT1;7蛋白或其编码基因培育抗旱植物的方法 | |
CN114644701B (zh) | 来源于玉米的蛋白及其相关生物材料的应用 | |
CN115197307B (zh) | 调控植物抗逆性的蛋白IbGER5及其编码基因与用途 | |
CN102675437A (zh) | 调节植物器官大小和花器官内部非对称性的方法 | |
CN116444637A (zh) | 调控植物叶片衰老和产量相关蛋白GmWRKY100及其编码基因与应用 | |
CN117947091A (zh) | GmTPS2蛋白及其编码基因在改良大豆株型和产量性状中的应用 | |
CN117925693A (zh) | GmTPS1蛋白及其编码基因在改良大豆株型性状和产量中的应用 | |
CN116590270A (zh) | 一种控制水稻谷粒大小的基因及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |