CN112980870A - 创制水稻大长粒型新种质的方法及其应用 - Google Patents
创制水稻大长粒型新种质的方法及其应用 Download PDFInfo
- Publication number
- CN112980870A CN112980870A CN201911298653.1A CN201911298653A CN112980870A CN 112980870 A CN112980870 A CN 112980870A CN 201911298653 A CN201911298653 A CN 201911298653A CN 112980870 A CN112980870 A CN 112980870A
- Authority
- CN
- China
- Prior art keywords
- rice
- gene
- sequence
- osgs2
- cas9
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 235000007164 Oryza sativa Nutrition 0.000 title claims abstract description 100
- 235000009566 rice Nutrition 0.000 title claims abstract description 97
- 238000000034 method Methods 0.000 title claims abstract description 46
- 240000007594 Oryza sativa Species 0.000 title description 83
- 108091033409 CRISPR Proteins 0.000 claims abstract description 92
- 101000857247 Oryza sativa subsp. japonica Glutamine synthetase, chloroplastic Proteins 0.000 claims abstract description 78
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract description 39
- 230000027455 binding Effects 0.000 claims abstract description 26
- 235000013339 cereals Nutrition 0.000 claims abstract description 26
- 108091040297 miR396 stem-loop Proteins 0.000 claims abstract description 23
- 239000013598 vector Substances 0.000 claims abstract description 19
- 230000008685 targeting Effects 0.000 claims abstract description 9
- 238000009395 breeding Methods 0.000 claims abstract description 8
- 230000001488 breeding effect Effects 0.000 claims abstract description 7
- 108091086571 miR396c stem-loop Proteins 0.000 claims abstract description 7
- 241000209094 Oryza Species 0.000 claims abstract 18
- 238000010362 genome editing Methods 0.000 claims description 35
- 108090000623 proteins and genes Proteins 0.000 claims description 35
- 239000002773 nucleotide Substances 0.000 claims description 29
- 125000003729 nucleotide group Chemical group 0.000 claims description 29
- 102000004169 proteins and genes Human genes 0.000 claims description 25
- 230000004048 modification Effects 0.000 claims description 14
- 238000012986 modification Methods 0.000 claims description 14
- 238000012217 deletion Methods 0.000 claims description 13
- 230000037430 deletion Effects 0.000 claims description 13
- 230000014509 gene expression Effects 0.000 claims description 13
- 240000002582 Oryza sativa Indica Group Species 0.000 claims description 12
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 12
- 108020005004 Guide RNA Proteins 0.000 claims description 10
- 238000006467 substitution reaction Methods 0.000 claims description 8
- 108700004991 Cas12a Proteins 0.000 claims description 6
- 240000008467 Oryza sativa Japonica Group Species 0.000 claims description 5
- 238000010459 TALEN Methods 0.000 claims description 5
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims description 5
- 235000013305 food Nutrition 0.000 claims description 5
- 101710163270 Nuclease Proteins 0.000 claims description 4
- 238000003780 insertion Methods 0.000 claims description 4
- 230000037431 insertion Effects 0.000 claims description 4
- 239000002994 raw material Substances 0.000 claims description 3
- 235000013361 beverage Nutrition 0.000 claims 1
- 230000006872 improvement Effects 0.000 abstract description 6
- 108091027544 Subgenomic mRNA Proteins 0.000 abstract 1
- 108020004414 DNA Proteins 0.000 description 21
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 17
- 238000005516 engineering process Methods 0.000 description 15
- 230000001965 increasing effect Effects 0.000 description 10
- 238000012216 screening Methods 0.000 description 10
- 206010020649 Hyperkeratosis Diseases 0.000 description 9
- 230000009261 transgenic effect Effects 0.000 description 9
- 241000589158 Agrobacterium Species 0.000 description 8
- 150000001413 amino acids Chemical class 0.000 description 8
- 241000196324 Embryophyta Species 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 7
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 6
- 239000000306 component Substances 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 101710197633 Actin-1 Proteins 0.000 description 4
- 238000010453 CRISPR/Cas method Methods 0.000 description 4
- -1 CRISPR/Cpf1 Proteins 0.000 description 4
- 108010042407 Endonucleases Proteins 0.000 description 4
- 102000004533 Endonucleases Human genes 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 230000005782 double-strand break Effects 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 238000003752 polymerase chain reaction Methods 0.000 description 4
- 238000003753 real-time PCR Methods 0.000 description 4
- 238000012300 Sequence Analysis Methods 0.000 description 3
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000010008 shearing Methods 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 238000010443 CRISPR/Cpf1 gene editing Methods 0.000 description 2
- 230000007018 DNA scission Effects 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 108091029865 Exogenous DNA Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 101710091256 Growth-regulating factor 4 Proteins 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- 108700011259 MicroRNAs Proteins 0.000 description 2
- 102000010722 N-Glycosyl Hydrolases Human genes 0.000 description 2
- 108010063372 N-Glycosyl Hydrolases Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 108020005093 RNA Precursors Proteins 0.000 description 2
- 238000011529 RT qPCR Methods 0.000 description 2
- 240000000111 Saccharum officinarum Species 0.000 description 2
- 235000007201 Saccharum officinarum Nutrition 0.000 description 2
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 230000006780 non-homologous end joining Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 150000007523 nucleic acids Chemical group 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- DWINFPQUSSHSFS-UVBJJODRSA-N Ala-Arg-Trp Chemical compound N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O DWINFPQUSSHSFS-UVBJJODRSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- ZDYNWWQXFRUOEO-XDTLVQLUSA-N Ala-Gln-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDYNWWQXFRUOEO-XDTLVQLUSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 1
- OMDNCNKNEGFOMM-BQBZGAKWSA-N Ala-Met-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O OMDNCNKNEGFOMM-BQBZGAKWSA-N 0.000 description 1
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 101001032849 Arabidopsis thaliana Growth-regulating factor 1 Proteins 0.000 description 1
- 101001027309 Arabidopsis thaliana Growth-regulating factor 2 Proteins 0.000 description 1
- 101001027315 Arabidopsis thaliana Growth-regulating factor 3 Proteins 0.000 description 1
- 101001027298 Arabidopsis thaliana Growth-regulating factor 7 Proteins 0.000 description 1
- 101001027304 Arabidopsis thaliana Growth-regulating factor 8 Proteins 0.000 description 1
- 101001027302 Arabidopsis thaliana Growth-regulating factor 9 Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- DPNHSNLIULPOBH-GUBZILKMSA-N Arg-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DPNHSNLIULPOBH-GUBZILKMSA-N 0.000 description 1
- ZEAYJGRKRUBDOB-GARJFASQSA-N Arg-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZEAYJGRKRUBDOB-GARJFASQSA-N 0.000 description 1
- GFMWTFHOZGLTLC-AVGNSLFASA-N Arg-His-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(O)=O GFMWTFHOZGLTLC-AVGNSLFASA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 1
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 1
- OKZOABJQOMAYEC-NUMRIWBASA-N Asn-Gln-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OKZOABJQOMAYEC-NUMRIWBASA-N 0.000 description 1
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 1
- YNQIDCRRTWGHJD-ZLUOBGJFSA-N Asp-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(O)=O YNQIDCRRTWGHJD-ZLUOBGJFSA-N 0.000 description 1
- XJQRWGXKUSDEFI-ACZMJKKPSA-N Asp-Glu-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XJQRWGXKUSDEFI-ACZMJKKPSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- LZZYPRNAOMGNLH-UHFFFAOYSA-M Cetrimonium bromide Chemical compound [Br-].CCCCCCCCCCCCCCCC[N+](C)(C)C LZZYPRNAOMGNLH-UHFFFAOYSA-M 0.000 description 1
- GEEXORWTBTUOHC-FXQIFTODSA-N Cys-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N GEEXORWTBTUOHC-FXQIFTODSA-N 0.000 description 1
- WZJLBUPPZRZNTO-CIUDSAMLSA-N Cys-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N WZJLBUPPZRZNTO-CIUDSAMLSA-N 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- LLVXTGUTDYMJLY-GUBZILKMSA-N Gln-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N LLVXTGUTDYMJLY-GUBZILKMSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 1
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- OLTHVCNYJAALPL-BHYGNILZSA-N Glu-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCC(=O)O)N)C(=O)O OLTHVCNYJAALPL-BHYGNILZSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- PYUCNHJQQVSPGN-BQBZGAKWSA-N Gly-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)CN=C(N)N PYUCNHJQQVSPGN-BQBZGAKWSA-N 0.000 description 1
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 1
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- IALQAMYQJBZNSK-WHFBIAKZSA-N Gly-Ser-Asn Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O IALQAMYQJBZNSK-WHFBIAKZSA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- ZIMTWPHIKZEHSE-UWVGGRQHSA-N His-Arg-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O ZIMTWPHIKZEHSE-UWVGGRQHSA-N 0.000 description 1
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- MPSBSKHOWJQHBS-IHRRRGAJSA-N Leu-His-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N MPSBSKHOWJQHBS-IHRRRGAJSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- SIGZKCWZEBFNAK-QAETUUGQSA-N Leu-Ser-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SIGZKCWZEBFNAK-QAETUUGQSA-N 0.000 description 1
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- RYOLKFYZBHMYFW-WDSOQIARSA-N Lys-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 RYOLKFYZBHMYFW-WDSOQIARSA-N 0.000 description 1
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 1
- XABXVVSWUVCZST-GVXVVHGQSA-N Lys-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN XABXVVSWUVCZST-GVXVVHGQSA-N 0.000 description 1
- WXHHTBVYQOSYSL-FXQIFTODSA-N Met-Ala-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O WXHHTBVYQOSYSL-FXQIFTODSA-N 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 1
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 1
- QGLFRQCECIWXFA-RCWTZXSCSA-N Pro-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1)O QGLFRQCECIWXFA-RCWTZXSCSA-N 0.000 description 1
- ZVEQWRWMRFIVSD-HRCADAONSA-N Pro-Phe-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N3CCC[C@@H]3C(=O)O ZVEQWRWMRFIVSD-HRCADAONSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- XNJVJEHDZPDPQL-BZSNNMDCSA-N Pro-Trp-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1c[nH]c2ccccc12)NC(=O)[C@@H]1CCCN1)C(O)=O XNJVJEHDZPDPQL-BZSNNMDCSA-N 0.000 description 1
- 244000184734 Pyrus japonica Species 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- MOINZPRHJGTCHZ-MMWGEVLESA-N Ser-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N MOINZPRHJGTCHZ-MMWGEVLESA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- ZWSZBWAFDZRBNM-UBHSHLNASA-N Ser-Trp-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ZWSZBWAFDZRBNM-UBHSHLNASA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 1
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 1
- MOCXXGZHHSPNEJ-AVGNSLFASA-N Tyr-Cys-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O MOCXXGZHHSPNEJ-AVGNSLFASA-N 0.000 description 1
- OKDNSNWJEXAMSU-IRXDYDNUSA-N Tyr-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 OKDNSNWJEXAMSU-IRXDYDNUSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- PTFCDOFLOPIGGS-UHFFFAOYSA-N Zinc dication Chemical compound [Zn+2] PTFCDOFLOPIGGS-UHFFFAOYSA-N 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000017730 intein-mediated protein splicing Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 231100000053 low toxicity Toxicity 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 108010016686 methionyl-alanyl-serine Proteins 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- MXHCPCSDRGLRER-UHFFFAOYSA-N pentaglycine Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O MXHCPCSDRGLRER-UHFFFAOYSA-N 0.000 description 1
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000012883 rooting culture medium Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Gastroenterology & Hepatology (AREA)
- Botany (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本申请公开了创制水稻大长粒型新种质的方法,其包括修饰水稻中的OsGS2基因,使其miR396结合功能,尤其是miR396c结合功能丧失。本申请还公开了通过所述方法创制的水稻用于育种或改良种质资源的用途,能够靶向水稻OsGS2基因的sgRNA,以及能够靶向水稻OsGS2基因的CRISPR/Cas9编辑载体。本申请为水稻育种改良提供了一种新的方法,特别是对于一些其它性状良好,粒型尚需改良的品种,提供了一种便捷高效的改良策略。
Description
技术领域
本申请涉及基因编辑技术领域,尤其涉及一种以CRISPR/Cas9基因编辑技术创制OsGS2基因突变体来改变水稻粒型的方法。
背景技术
水稻是中国主要的粮食作物,全国60%以上的人口以稻米为主食。水稻籽粒形状是影响产量的重要性状之一,粒型增大与水稻增产直接相关。同时籽粒形状也影响稻米的外观品质,随着人民生活的日益改善,对米质要求越来越高。在目前国内餐饮市场上,长粒米广受青睐。有一些水稻品种其它性状很好,却因为粒型不够长而限制了其市场份额。
水稻OsGS2基因编码一个转录激活因子GRF4,在水稻生长发育中发挥重要的作用。已有研究表明,OsGS2受miR396调节,当miR396结合区段处2个碱基发生自然突变后,会产生大粒表型。
以Cas9为代表的基因编辑技术是近年来分子育种领域的热点技术,它能够实现亲本目标性状的快速精准改良,且不涉及转基因安全问题。该技术在育种中的应用大多数是通过对目标基因进行碱基的添加或删除,从而使基因功能失活,获得相应的目标性状。目前还没有利用CRISPR技术编辑OsGS2基因,创制增大增长粒型水稻种质的相关研究。
发明内容
本申请涉及一种以CRISPR/Cas9基因编辑技术创制OsGS2基因突变体来改良水稻粒型的方法。最终获得了粒型明显增大增长的优质水稻品种。为实现上述目的,本申请采用如下技术方案。
在第一方面,本申请提供了创制水稻大长粒型新种质的方法,其包括修饰水稻中的OsGS2基因,使其miR396结合功能,尤其是miR396c结合功能丧失。
在一些实施方案中,所述修饰通过基因编辑进行。
在一些实施方案中,所述OsGS2基因包含以下序列或由以下序列组成:SEQ ID NO:1所示的核苷酸序列或与其具有至少90%、95%、99%或更高的序列同一性并编码相同功能的蛋白质的活性变体序列,或者编码SEQ ID NO:2所示的氨基酸序列或与其具有至少90%、95%、99%或更高的序列同一性的保留其功能的活性变体序列的核苷酸序列。
在优选的实施方案中,所述水稻为籼稻或粳稻。
在一些实施方案中,所述基因编辑通过选自以下的序列特异性核酸酶中的一种或多种进行:CRISPR/Cas9、CRISPR/Cpf1、CRISPR/Cas12a、TALEN、大范围核酸酶和ZFN。优选地,所述基因编辑通过CRISPR/Cas9进行。
在一些实施方案中,所述CRISPR/Cas9包含Cas9,其中所述Cas9包含SEQ ID NO:5所示的核苷酸序列或与其具有至少90%、95%、99%或更高的序列同一性并编码相同功能的蛋白质的活性变体序列。
在一些实施方案中,所述CRISPR/Cas9包含导向RNA(sgRNA),其中所述sgRNA靶向OsGS2基因的miR396结合区段。
在一些具体的实施方案中,所述sgRNA靶向SEQ ID NO:3所示的核苷酸序列。
在一些具体的实施方案中,所述sgRNA包含SEQ ID NO:4所示的核苷酸序列或与其具有至少90%、95%、99%或更高的序列同一性的保留其功能的活性变体序列。
在一些实施方案中,所述修饰导致OsGS2基因的miR396结合区段发生缺失、插入、取代或以上的组合。
在一些具体的实施方案中,所述修饰导致OsGS2基因的miR396c结合区段内缺失或添加3的倍数数量的碱基,例如3bp、6bp、9bp,和/或所结合区段内的碱基发生取代。
在第二方面,本申请提供了通过第一方面所述的方法创制的水稻用于育种的用途。
在第三方面,本申请提供了通过第一方面所述的方法创制的水稻用于改良种质资源的用途。
在第四方面,本申请提供了通过第一方面所述的方法获得的水稻的种子制成的制品,其选自食品、饮品、饲料或工业原料。
在第五方面,本申请提供了能够靶向水稻OsGS2基因的sgRNA,其包含SEQ ID NO:4所示的核苷酸序列或由SEQ ID NO:4所示的核苷酸序列组成。
在第六方面,本申请提供了能够靶向水稻OsGS2基因的CRISPR/Cas9编辑载体,其包含表达Cas9的第一表达盒和表达sgRNA的第二表达盒,其中所述Cas9包含SEQ ID NO:5所示的核苷酸序列或与其具有至少90%、95%、99%或更高的序列同一性并编码相同功能的蛋白质的活性变体序列,并且所述sgRNA包含SEQ ID NO:4所示的核苷酸序列或与其具有至少90%、95%、99%或更高的序列同一性的保留其功能的活性变体序列。
在第七方面,本申请提供了创制水稻大长粒型新种质的方法,其包括通过第六方面所述的CRISPR/Cas9编辑载体导入含有OsGS2基因的水稻中。
在一些实施方案中,所述OsGS2基因包含以下序列或由以下序列组成:SEQ ID NO:1所示的核苷酸序列或与其具有至少90%、95%、99%或更高的序列同一性并编码相同功能的蛋白质的活性变体序列,或者编码SEQ ID NO:2所示的氨基酸序列或与其具有至少90%、95%、99%或更高的序列同一性的保留其功能的活性变体序列的核苷酸序列。
在优选的实施方案中,所述水稻为籼稻或粳稻。
本申请提出了一种基因编辑技术的巧妙运用,利用其定向打靶功能来实现基因突变,并筛选出特定突变类型。该方法简单易行、成本低、并且效率高。本申请利用基因编辑技术对OsGS2基因功能的定点编辑,成功地获得了粒型显著增长增大的籼稻品种,也为利用CRISPR/Cas9基因编辑技术快速改良水稻品种的粒型提供一种有效的策略。
附图说明
图1显示了本申请实施例1中构建的编辑载体pZZT00521的图谱。
图2显示了OsGS2基因的序列和编辑株系OsGS2基因的序列,其中WT:野生型X12;CR13和CR84:编辑株系;下划线表示PAM序列;虚线表示缺失序列;方框表示外显子;靶标位置和miR396c位置有部分交叠,位于第三外显子。
图3显示了野生型株系和编辑株系OsGS2基因编码的氨基酸序列,WT,野生型;CR13、CR84,编辑株系;虚线表示缺失的氨基酸。
图4显示了编辑株系和对照株系中,幼茎、幼叶、叶、幼穗、穗中的OsGS2基因的表达量差异,其中穗<3:幼穗长度小于3cm,穗4-7:幼穗长度在4cm到7cm之间;穗>8:幼穗长度大于8cm。
图5显示了OsGS2基因编辑株系与野生型株系的籽粒比较,其中WT:野生型;CR13和CR84:编辑株系。图4中的上图为稻谷的照片,下图为米粒的照片。
详细描述
提供以下定义和方法以更好地界定本申请以及在本申请实践中指导本领域普通技术人员。除非另作说明,本申请的术语按照相关领域普通技术人员的常规用法理解。
定义
本文使用的术语“基因编辑(gene editing)”或“基因组编辑(genome edting)”,是一种新兴的比较精确的能对生物体基因组特定目标基因进行修饰的一种基因工程技术。基因编辑指能够对目标基因进行定点“编辑”,实现对特定DNA片段的修饰。基因编辑依赖于经过基因工程改造的核酸酶,也称“分子剪刀”,在基因组中特定位置产生位点特异性双链断裂(DSB),诱导生物体通过非同源末端连接(NHEJ)或同源重组(HR)来修复DSB,因为这个修复过程容易出错,从而导致靶向突变。
本文使用的术语“CRISPR/Cas9”是指使用RNA引导链靶向内切核酸酶切割位点的内切核酸酶。参见,Jinek等人,Science 337:816-821(2013);Cong等人,Science(2013年1月3日);和Mali等人,Science(2013年1月3日)。目前发现的CRISPR/Cas9系统有三种不同类型即I型、II型和III型,它们存在于大约40%已测序的真细菌和90%已测序的古细菌中。其中II型的组成较为简单,以Cas9蛋白以及向导RNA(gRNA)为核心组成,也是目前研究得最深入的类型。当细菌抵御噬菌体等外源DNA入侵时,在前导区的调控下,CRISPR被转录为长的RNA前体(pre-crRNA),然后加工成一系列短的含有保守重复序列和间隔区的成熟crRNA,最终识别并结合到与其互补的外源DNA序列上发挥剪切作用。CRISPR/Cas9的剪切位点位于crRNA互补序列下游临近的PAM区(Protospacer Adjacent Motif)的5’-GG-N18-NGG-3’特征区域中的NGG位点,而这种特征的序列在每128bp的随机DNA序列中就重复出现一次。
本文使用的术语“CRISPR/Cas12a”也是一类新型的CRISPR-Cas系统。相较于Cas9蛋白来说,Cas12a蛋白更具准确度,同时也更安全。CRISPR/Cas9工作时,Cas9蛋白识别PAM序列(RNA编写的遗传密码),通过gRNA解开部分双螺旋,在这个过程中,Cas9蛋白一旦找到匹配较好的序列时,便会紧密贴合在该段DNA上,而在这个过程中,也许会出现一些错配的现象,但这种结合是不可逆的。而在这一方面,Cas12a就显得机智许多,它在寻找“靶标”时,会对沿途的DNA序列进行单碱基的识别,如若发现有匹配不好的碱基,便会离开重新寻找,在寻找到PAM序列时,Cas12a蛋白会与PAM序列形成一种半封闭的R-环(R-loop),当识别到正确的序列时,才会完全结合成封闭的R-环,所以这种结合是可逆的,这也体现出了它更安全的一面。
本文使用的术语“转录激活子样效应器核苷酶”或“TAL效应器核苷酶”或“TALEN”是指一类通过使TAL效应器DNA结合结构域与DNA切割结构域融合而产生的人工限制内切核酸酶。
本文使用的术语“锌指核酸酶(ZFN)”由一个DNA识别域以及一个DNA剪切域组成。DNA识别域为3~4个ZF串联结构,每个ZF约含30个氨基酸,被1个锌离子所固定,可识别并结合1个特异的三联体碱基,DNA剪切域由非特异性核酸内切酶Fok I羧基端的96个氨基酸残基组成。每个Fok I单体与1个ZFP相连构成1个ZFN,并识别特定的位点,当2个识别位点相距恰当的距离时(6~8bp),2个单体ZFN相互作用产生酶切功能,形成双链断裂,从而介导DNA定点剪切。
本文使用的术语“大范围核酸酶(meganuclease)”是指能够识别14-40碱基长度的核酸序列的归巢核酸内切酶。一些大范围核酸酶可以容忍小的归巢位点序列差异,大的识别区域仍然能够保证这些酶的高度特异性,而这反过来又可保持低水平的基因组内非特异性裂解和较低的毒性。大范围核酸酶由自我剪接RNA内含子或自我剪接蛋白内含子序列的移动序列内的开放阅读框架编码。
本文使用的术语“同一性”,在两个或更多个核酸或多肽的情况下,指相同或具有相同核苷酸或氨基酸的指定百分比(即在指定区域内,当在比较窗或指定区域内比较和比对最大一致性时,约60%的同一性,优选65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性)的两条或更多条序列或亚序列,如利用BLAST或BLAST 2.0序列比较算法以默认参数或通过手工比对和可视检查(参阅如NCBI网站等)所测量的。
具体实施方式
本申请提出了一种以CRISPR/Cas9基因编辑技术创制OsGS2基因在其miR396结合区段缺失3的倍数数量的碱基,例如3bp、6bp、9bp来改良水稻粒型的方法,其适应于所有含有功能性OsGS2基因的水稻品种中,包括以下步骤:
(1)拟改良水稻品种OsGS2基因的序列分析,在miR396结合区段选择合适位点设计靶标;
(2)构建编辑载体,将拟改良水稻品种的愈伤组织作为遗传转化的受体材料,用农杆菌介导法将编辑载体导入愈伤组织细胞,并再生成水稻株系;
(3)对OsGS2基因编辑株系的基因型检测和分析,选取目标位置碱基缺失3的倍数的编辑株系进行性状分析,考察粒型情况。
(4)经过传代分离、鉴定筛选,得到编辑纯合且非转基因的大粒长粒表型水稻种质。
植物MicroRNAs(miRNAs)是由具有发夹结构的单链RNA前体(约70-90个碱基大小)经过Dicer-like酶加工后生成的具有调控功能且大小约21个碱基的小分子RNA。miR396是Jones-Rhoades等于2004年首先在拟南芥中发现的,同时通过5'RACE证实了部分AtGRF基因家族成员(AtGRF1、AtGRF2、AtGRF3、AtGRF7、AtGRF8、AtGRF9)是miR396的靶基因。EST序列分析发现miR396在多个不同的物种中存在,是高度保守的小分子,并且其初始转录体和成熟的miRNA都具有高度保守性。水稻OsGS2基因编码一个转录激活因子GRF4,在水稻生长发育中发挥重要的作用。miR396通过结合OsGS2的miR396结合区段来调节水稻的生长发育,例如碳氮代谢、穗长等。
本申请的创制水稻大长粒型新种质的方法,具体包括以下步骤:
(1)水稻中OsGS2基因的检测;
(2)水稻中OsGS2基因CRISPR/cas9编辑载体的构建;
(3)将籼稻X12的愈伤组织作为遗传转化的受体材料,用农杆菌介导法将编辑载体导入,鉴定编辑株系中OsGS2基因的编辑情况,获得不同编辑类型的OsGS2等位基因,并筛选编辑位点3碱基倍数(如3、6、9等)增减的基因型。经过传代分离、鉴定筛选,得到编辑纯合且非转基因的株系,最终获得粒型增大增长的改良品系。
本申请具体涉及如下技术方案。
在第一方面,本申请提供了创制水稻大长粒型新种质的方法,其包括修饰水稻中的OsGS2基因,使其miR396结合功能,尤其是miR396c结合功能丧失。
在一些实施方案中,所述修饰通过基因编辑进行。
在一些实施方案中,所述OsGS2基因包含以下序列或由以下序列组成:SEQ ID NO:1所示的核苷酸序列或与其具有至少约70%,75%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高的同一性并编码相同功能的蛋白质的活性变体序列,或者编码SEQ ID NO:2所示的氨基酸序列或与其具有至少约70%,75%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高的序列同一性的保留其功能的活性变体序列的核苷酸序列。
本文所用的术语“活性变体序列”指基本上相似的序列。对于核苷酸序列,活性变体序列包括由于遗传密码子简并性而编码相同功能的蛋白质的那些序列。诸如天然存在的等位基因变体可以使用公知的分子生物学技术例如聚合酶链式反应(PCR)和杂交技术来鉴定。例如,在本申请中,与籼稻X12的OsGS2基因具有至少约70%,75%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高的同一性并且也编码功能性OsGS2蛋白的来自其他水稻品种的基因,包括在本申请定义的“活性变体序列”中。同一性的确定是通过本文描述的序列比对程序,所述程序使用默认参数。核苷酸的活性变体序列与该核苷酸序列的差异可以少至1-15个核苷酸、少至1-10个(例如6-10个),少至5个,少至4,3,2或甚至1个核苷酸。
对于蛋白质序列,术语“活性变体序列”包括衍生自天然蛋白的多肽,所述衍生是通过缺失(所谓的截短)天然蛋白N末端和/或C末端的一个或多个氨基酸或将一个或多个氨基酸添加至所述天然蛋白的N末端和/或C末端;在天然蛋白的一个或多个位点缺失或添加一个或多个氨基酸;或者在天然蛋白的一个或多个位点取代一个或多个氨基酸。因而,就蛋白质而言,术语“活性变体序列”包括天然蛋白的生物活性片段,其包含保留天然蛋白生物学活性,例如具有OsGS2蛋白功能的足够数目的连续氨基酸残基。这样的功能相对天然蛋白可以是不同的或者是改良的,或者可以是不变的,只要保留了OsGS2蛋白功能。同一性的确定是通过本文描述的序列比对程序,所述程序使用默认参数。蛋白的活性变体序列与该蛋白的差异可以少至1-15个氨基酸残基、少至1-10个(例如6-10个),少至5个,少至4,3,2或甚至1个氨基酸残基。在优选的实施方案中,所述水稻为籼稻或粳稻。
在一些实施方案中,所述基因编辑通过选自以下的序列特异性核酸酶中的一种或多种进行:CRISPR/Cas9、CRISPR/Cpf1、CRISPR/Cas12a、TALEN、大范围核酸酶和ZFN。优选地,所述基因编辑通过CRISPR/Cas9进行。
在一些实施方案中,所述CRISPR/Cas9包含Cas9,其中所述Cas9包含SEQ ID NO:5所示的核苷酸序列或与其具有至少约70%,75%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高的序列同一性并编码相同功能的蛋白质的活性变体序列。
在一些实施方案中,所述CRISPR/Cas9包含导向RNA(sgRNA),其中所述sgRNA靶向OsGS2基因的miR396结合区段。
在一些具体的实施方案中,所述sgRNA靶向SEQ ID NO:3所示的核苷酸序列。
在一些具体的实施方案中,所述sgRNA包含SEQ ID NO:4所示的核苷酸序列或与其具有至少约70%,75%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高的序列同一性的保留其功能的活性变体序列。
在一些实施方案中,所述修饰导致OsGS2基因的miR396结合区段发生缺失、插入、取代或以上的组合。
在一些具体的实施方案中,所述修饰导致OsGS2基因的miR396结合区段内缺失或添加3的倍数数量的碱基,例如3bp、6bp、9bp,和/或所结合区段内的碱基发生取代。修饰结果改变了miR396结合区段的序列但并不影响上下游蛋白质的翻译和氨基酸的序列。具体地,修饰的结果是仅仅使得OsGS2基因的miR396结合功能丧失。
在第二方面,本申请提供了通过第一方面所述的方法创制的水稻用于育种的用途。
在第三方面,本申请提供了通过第一方面所述的方法创制的水稻用于改良种质资源的用途。
在第四方面,本申请提供了通过第一方面所述的方法获得的水稻的种子制成的制品,其选自食品、饮品、饲料或工业原料。
在第五方面,本申请提供了能够靶向水稻OsGS2基因的sgRNA,其包含SEQ ID NO:4所示的核苷酸序列或由SEQ ID NO:4所示的核苷酸序列组成。
在第六方面,本申请提供了能够靶向水稻OsGS2基因的CRISPR/Cas9编辑载体,其包含表达Cas9的第一表达盒和表达sgRNA的第二表达盒,其中所述Cas9包含SEQ ID NO:5所示的核苷酸序列或与其具有至少约70%,75%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高的序列同一性并编码相同功能的蛋白质的活性变体序列,并且所述sgRNA包含SEQ ID NO:4所示的核苷酸序列或与其具有至少约70%,75%,80%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高的序列同一性的保留其功能的活性变体序列。
在第七方面,本申请提供了创制水稻大长粒型新种质的方法,其包括通过第六方面所述的CRISPR/Cas9编辑载体导入含有OsGS2基因的水稻中。
在一些实施方案中,所述OsGS2基因包含以下序列或由以下序列组成:SEQ ID NO:1所示的核苷酸序列或与其具有至少90%、95%、99%或更高的序列同一性并编码相同功能的蛋白质的活性变体序列,或者编码SEQ ID NO:2所示的氨基酸序列或与其具有至少90%、95%、99%或更高的序列同一性的保留其功能的活性变体序列的核苷酸序列。
在优选的实施方案中,所述水稻为一些其它性状良好,粒型尚需改良的品种,例如籼稻或粳稻。在优选的实施方案中,所述水稻为籼稻X12。
本说明书和权利要求书中,词语“包括”、“包含”和“含有”意指“包括但不限于”,且并非意图排除其他部分、添加物、组分、或步骤。
应该理解,在本申请的特定方面、实施方案或实施例中描述的特征、特性、组分或步骤,可适用于本文所描述的任何其他的方面、实施方案或实施例,除非与之矛盾。
实施例
以下实施例用于说明本申请,但不用来限制本申请的范围。在不背离本申请精神和实质的情况下,对本申请方法、步骤或条件所作的修改或替换,均属于本申请的范围。
若未特别指明,实施例中所用的化学试剂均为常规市售试剂,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。
以下实施例中使用的水稻品种为籼稻X12,其由中国种子集团有限公司提供。
实施例1 CRISPR/Cas9编缉载体的构建
水稻OsGS2基因的序列分析及基因编辑靶点设计
水稻OsGS2基因的序列如SEQ ID NO:1所示。序列分析显示,该基因含有5个外显子,其中第3个外显子中有一个miR396结合区段,位于SEQ ID NO:1中第1185-1204位碱基。本实施例所设的靶序列在籼稻X12材料中OsGS2基因第3外显子中的第1199-1218位碱基(GTGGAAACGCAGCTGGTCGC(SEQ ID NO:3)),如图2所示。
CRISPR/Cas9编缉载体的构建
本实施例采用的基因编辑技术为第三代基因编辑技术CRISPR/cas9,所使用的载体根据Liu等人(Hao Liu,Yuduan Ding,Yanqing Zhou,Wenqi Jin,Kabin Xie*,Ling-LingChen*.CRISPR-P 2.0:an improved CRISPR/Cas9 tool for genome editing inplants.Mol Plant,2017,10(3):530-532)的方法设计,利用CRISPR-P2.0(http://crispr.hzau.edu.cn/CRISPR2/)在线工具设计了导向RNA(sgRNA)(SEQ ID NO:4),sgRNA是由引导RNA(gRNA)和骨架RNA(gRNA scaffold)核苷酸序列连接起来的一个整体分子。植物表达载体包含甘蔗Ubi4启动子(即甘蔗泛素4启动子)驱动的Cas9(SEQ ID NO:5)表达盒,以及水稻U3启动子驱动的sgRNA表达盒。构建的CRISPR/Cas9编缉载体命名为pZZT00521,其图谱参见图1。
实施例2籼稻X12的遗传转化
将实施例1构建的编辑载体转入农杆菌菌株EHA105(华中农业大学馈赠)中并进行测序鉴定。由籼稻X12种子诱导产生胚性愈伤组织,与含有上述编缉载体的农杆菌EHA105共同孵育,经过筛选再生等一系列步骤完成遗传转化。农杆菌侵染水稻愈伤组织及筛选、分化流程参照Nishimura等的文献报道(A protocol for Agrobacterium-mediatedtransformation in rice.Nature protocols,2006,6:2 796-2 802)。具体流程包括,水稻愈伤组织与农杆菌共培养3天后,将愈伤组织于250mg/L Carbenicillin的ddH2O中浸泡30min,去除多余的农杆菌后置于含250mg/L Carbenicillin的筛选培养基上筛选3轮,然后将抗性愈伤转移至再生培养基上培养,待分化出2~3cm的小苗后,将其转移至生根培养基中继续培养2周。
实施例3 T0代OsGS2基因编辑水稻的筛选和鉴定
将实施例2中的再生植株送至温室种植,取再生的T0代小苗叶片,通过CTAB法提取植物基因组DNA作为模板。DNA样品用荧光定量PCR方法进行阳性检测。荧光定量PCR方法选择筛选标记基因CP4作为目标基因和水稻ACTIN1基因作为内参基因,于荧光定量PCR仪上进行扩增和荧光值检测,根据RQ值筛选出转基因阳性的植株(CP4基因RQ值>0.1,结果未示出)。用于扩增筛选标记基因CP4的引物序列为csp356:CAGCACAGGTTAAGTCTG(SEQ ID NO:6)和csp357:GTCTGTCTCAACGGTAAG(SEQ ID NO:7);用于扩增ACTIN1基因的引物序列为csp106:TGCTATGTACGTCGCCATCCAG(SEQ ID NO:8)和csp107:AATGAGTAACCACGCTCCGTCA(SEQID NO:9)。
用OsGS2基因靶位点特异性检测引物(正向引物为5’端含有FAM荧光修饰的csp7342:5’-GCATTCTTGTGTGTAACACGG-3’(SEQ ID NO:10);反向引物csp7323:5’-CATTATCCATGTGCAGCTGAG-3’(SEQ ID NO:11))和Q5超保真DNA聚合酶进行PCR扩增。待反应结束后,利用琼脂糖电泳检测PCR扩增成功与否。之后利用ABI3730XL测序仪进行毛细管电泳,之后用软件分析扩增片段的碱基长度。结果显示全部39株T0代水稻的OsGS2基因在靶标区域发生长度变化,突变率为100%,变化主要以一两个碱基的插入或缺失为主,最长的缺失为21bp。其中有两个株系各有一个拷贝编辑结果为缺失6个碱基,这是我们的目标编辑结果,即增减碱基数为3的倍数。另外,所有发生编辑的株系中,两个拷贝OsGS2基因都被成功编辑。这些数据表明,编辑载体能够高效地编辑OsGS2基因。
实施例4 T1代OsGS2基因编辑纯合非转基因水稻的筛选和鉴定以及其中OsGS2基因转录水平表达量的变化
将实施例3中鉴定的缺失6个碱基的阳性水稻株系移入温室进行移栽种植,收取其自交T1代种子。选取2株编辑结果为缺失6个碱基的株系编号018和029的T1代种子(约100粒),进行发芽、育苗,提取幼苗的DNA进行转基因成分检测及编辑位点PCR检测,去掉含有转基因成分、没有编辑或者编辑位点杂合的株系,保留不携带转基因成分,并且编辑位点纯合的株系,将其分别命名为CR13和CR84。转基因成分检测方法请参见《基因编辑后代材料GMO检测流程》,其是根据中国国家标准农业部953号公告6-2007号公告GB/T 19495—2004转基因产品检测标准要求进行。为确认CR13和CR84编辑株系中OsGS2基因编辑情况,对其靶位点区域进行PCR扩增和测序。结果显示,CR13株系和CR84株系缺失了6bp核苷酸,并有一个碱基突变(图2)。除了突变处3个氨基酸发生变化,没有影响OsGS2基因其它位置的翻译(图3)。
提取编辑株系CR13和对照株系的以下地上部分的RNA,反转录为cDNA作为模板,用引物csp8113:5’-GTGACCTTGGTCAGAACACC-3’(SEQ ID NO:12)和csp8114:5’-ATTCTCATCAGCGAGGTCTG-3’(SEQ ID NO:13)进行实时荧光定量PCR的扩增。结果显示,在上述编辑株系中,幼茎、幼叶、叶、幼穗、穗中的OsGS2基因表达量均有不同程度的上调(图4)。
实施例5编辑株系的籽粒表型鉴定
将CR13和CR84 T2代纯合编辑株系及对照种子(WT)进行表型拍照(图5)。从图中可以看出,无论是稻谷还是米粒,粒长方面,编辑株系都明显大于对照;粒宽方面,编辑株系也略大于对照。从整体上看,编辑株系的籽粒明显大于对照。用近红外仪对稻谷的长、宽进行测量,并算出长宽比(表1)。
表1 OsGS2基因编辑株系与野生型株系的稻谷的长、宽及长宽比
材料 | 长均值(mm) | 宽均值(mm) | 长宽比 |
WT | 9.19 | 2.36 | 3.89 |
CR13 | 10.84 | 2.62 | 4.14 |
CR84 | 11.11 | 2.46 | 4.51 |
由于粒型明显增大,编辑株系的稻谷的千粒重也明显增大(表2)。
表2 OsGS2基因编辑株系与野生型株系的稻谷千粒重
材料 | 千粒重(g) |
WT | 22.2 |
CR13 | 26.1 |
CR84 | 25.4 |
从上述结果中可以看出,本申请利用CRISPR/Cas9基因编辑技术获得了OsGS2基因突变体。与TALEN和ZFN技术相比,CRISPR/Cas9基因编辑技术操作过程简单方便,节约成本,一般实验室都可操作,是一种快速获得籽粒粒型增大增长水稻品种或种质资源的生物技术育种方法。
虽然,上文中已经用一般性说明及具体实施方案对本申请的技术方案作了详尽的描述,但在这些技术方案的基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本申请精神的基础上所做的这些修改或改进,均属于本申请要求保护的范围。
序列表
SEQ ID NO:1:水稻OsGS2基因的核苷酸序列
ATGGCGATGCCGTATGCCTCCCTGTCTCCGGCGGTGGCCGACCACCGCTCGTCCCCGGCAGCCGCGACCGCCTCCCTCCTCCCCTTCTGCCGCTCCACCCCGCTCTCCGCGTAAGCAACGCGAACCCGCGGCTACAACCCATTTTCTTGGCTCCAGTGGTGCATGTGACAACACGGTGAGACGTTGTGTGTGGGTGGGTGGGTGCAGGGGCGGTGGTGGCGTCGCGATGGGGGAGGACGCGCCGATGACCGCGAGGTGGCCGCCGGCGGCGGCGGCGAGGCTGCCGCCGTTCACCGCGGCGCAGTACGAGGAGCTGGAGCAGCAGGCGCTCATATACAAGTACCTGGTGGCAGGCGTGCCCGTCCCGCCGGATCTCGTGCTCCCCATCCGCCGCGGACTCGACTCCCTCGCCGCCCGCTTCTACAACCATCCCGCCCGTACGTCGTGTTCCTATTTCTTGCCTCTCCTCTACCATCGCTGCATTGCTTTTGGATGCTTGTTTAGTGTCGGCTTCTTTGTTTATTCCGATCAGGCGTACTTTGCTTCCATTTGTTAATTGGCTCCGGGTCATTTGTTAATCCGGGTTACGCGATTCAAGAAACATGCGTGTGTGTTTTTATGCTATCCTCCGGATTTGGTAATAAAAAGGCTTGTTTTTAAATCCAAAACTCGTGCTCGCTTCACGATTAGCGCATCATTTTTTTTTTTTGGGGGGGGGGGGGGGGAAGTTTGCCCATCATTCTGTCTCTGTTTGATCTGATAGAGGACGTGCACACGCTCTTGTCTGAAATAAAATCTTTTGTTTATCAGTATGCCCATGGGATAAGCCATTTTCTCTGTGAACCAACACCCTGGCAAACTGTTTTTTTGCTCGCCATTTTTGAGCGATTGCTAAGAACAGATAACTATGCCCTGCATATGGATCGGATATGGACTTCTCAAATATTCAAATGCCATTCTATTAGGAACTCAAAATGCATTACCAACAAATGCATTCTTGTGTGTAACACGGTTGCTACGATGTGCCTGTTTTTGTACAGTTGGATATGGTCCGTACTTCGGCAAGAAGCTGGACCCAGAGCCAGGGCGGTGCCGGCGTACGGACGGCAAGAAATGGCGGTGCTCGAAGGAGGCCGCGCCGGATTCCAAGTACTGCGAGCGCCACATGCACCGCGGCCGCAACCGTTCAAGAAAGCCTGTGGAAACGCAGCTGGTCGCCCAGTCCCAACCGCCCTCATCTGTTGTCGGTTCTGCGGCGGCGCCCCTTGCTGCTGCCTCCAATGGCAGCAGCTTCCAAAACCACTCTCTTTACCCTGCTATTGCCGGCAGCAATGGCGGGGGCGGGGGGAGGAACATGCCCAGCTCATTTGGCTCGGCGTTGGGTTCTCAGCTGCACATGGATAATGCTGCCCCTTATGCAGCTGTTGGTGGTGGAACAGGCAAAGATCTCAGGTGATTGTTCATTTCTTTTTTTTTAATCAAACGCCATATTTACTTGTTTAGCACTGTCTTGAATCATGATATGTATCCTTCCGTTGTCTAAAAAAAAGGTGCCATGCTCTAACTGATTGGTGTCAGGTGGATGCAGTTATGAATCTGTATTTTTCATTGTGATCGGTTAATAACTGTGTCCCATTTGTTTGCATTGGTGGCAATCGAATCAGCTGTCCATGCTCAGTAGTACTACTTCGATTTGGTGCTGCAATCACTGAAAGTCTGAAACTTTACTCTCTGCACTGCAAAAATTTGTGTTATGTTTAGGTTTCCAGAGTGCTGCCTCTTTGCCCTTCCCATACTTTCTGGTATCAGTTTTCAGCCCCAGAAGCCGGGGACAGTCTCCATAAGAGATTTCTGCTCAGGTGAAACTGGGGTGCAGGGTCTTAACATGGCTTTGGCCCAGTAGTTTGAAACATGTACTGTCCATAAAGATGATACTACTACATATTTGTGTCTGCCCTCGCAGTGCTTGTGCCTGCTGGTAGCTGATCATGGCTTCCCTTGGCATTTACTCCACTTCTTTATTCCTCCACAGAATCCAGTTGTTTCTGTCTCTGCTCTTCAGGGGCAGTCAATTATTTGGCCCTTGCAAAATACTGTCTCTGAAGATGTCTCACCGATCACCACTATACCTGAAACATTTTCCAGTGGCCAGCGTGAGCTGCATGATGCTCCAAGTCAACTCTATACTCATCCAATGTTGATGATTAGATTTTAACAATGCAACTCTTTGATTTATCTTCCCTACAAAAAAAAAGGAACTCTTTGATTTATCTTCGGTGAATCTCAGTCTGACCTTAGTACCTAGCCTCATTATTTACTTCACCAAATGTATAACTCTACAGTGCTTGTTCGTGTTGATTTGGTTTAGTTTAGTTATTGAATTATTCGGTCACCTTAGTCTTTGATTGTTTTTTTCTTTCTGCTCTTGTCATCAACTGTTTAGGGTTCAGCTGACTTGCTGCTGCAACTAAACTGTCTTCTGGTTTTACTGCAAAATAGAATGTTTCTTGGGCCATGATCTGCTGCTATATATGATTAGTTAAACCATGGTTCTATGTTTTCTTATATGAATTCATGACAAGAATACTAACTTTTGGAAAAGGTAATTTTATTTTTTTTGTATGATAATAATGCTTTGGATTCTTTCTAGTTTATCTGTCGGACTTAGGTTAACTACATTTCCTCCGGTACATGGATTTATTTCATTCTTACAATTGAGCCCTTATGAATATTTTCTTCCTAATTCTGTTCTAAAAAGTTAGAATTGACATATTTTCGATAGGTACATGCCTAGCACTTGCATTCGTGTTTCCTACTAATTCCCAATCACTGTATCTTCTCAAATTCAGGTATACTGCTTATGGCACAAGATCTTTGGCGGATGAGCAGAGTCAACTCATTACTGAAGCTATCAACACATCTATTGAAAATCCATGGCGGCTGCTGCCATCTCAGAACTCGCCATTTCCCCTTTCAAGCTATTCTCAGCTGGGGGCACTAAGTGACCTTGGTCAGAACACCCCCAGCTCACTTTCAAAGGTTCAGAGGCAGCCACTTTCGTTCTTTGGGAACGACTATGCGGCTGTCGATTCTGTGAAGCAAGAGAACCAGACGCTGCGTCCCTTCTTTGATGAGTGGCCAAAGGGAAGGGATTCATGGTCAGACCTCGCTGATGAGAATGCTAATCTTTCGTCATTCTCAGGCACCCAACTGTCGATCTCCATACCAATGGCATCCTCTGACTTCTCGGCGGCCAGTTCTCGATCAACTAATGGTACGACTACTTGATCTCCCCCCAATTACTTCGTGCGTGTTTATGTCTGTATCCTGCAATGTCTGAAGATTTCTTACTGAAAACGTCATCTGGTCTGTGTGCAGGTGACTGA
SEQ ID NO:2:水稻OsGS2基因编码的氨基酸序列
MAMPYASLSPAVADHRSSPAAATASLLPFCRSTPLSAGGGGVAMGEDAPMTARWPPAAAARLPPFTAAQYEELEQQALIYKYLVAGVPVPPDLVLPIRRGLDSLAARFYNHPALGYGPYFGKKLDPEPGRCRRTDGKKWRCSKEAAPDSKYCERHMHRGRNRSRKPVETQLVAQSQPPSSVVGSAAAPLAAASNGSSFQNHSLYPAIAGSNGGGGGRNMPSSFGSALGSQLHMDNAAPYAAVGGGTGKDLRYTAYGTRSLADEQSQLITEAINTSIENPWRLLPSQNSPFPLSSYSQLGALSDLGQNTPSSLSKVQRQPLSFFGNDYAAVDSVKQENQTLRPFFDEWPKGRDSWSDLADENANLSSFSGTQLSISIPMASSDFSAASSRSTNGD
SEQ ID NO:3:水稻OsGS2基因中的靶序列
GTGGAAACGCAGCTGGTCGC
SEQ ID NO:4:sgRNA的核苷酸序列
GCGACCAGCTGCGTTTCCACGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCT
SEQ ID NO:5:Cas9的核苷酸序列
ATGCCGAAGAAGCGCCGCCGCGTGGACAAGAAGTACTCCATCGGCCTCGACATCGGCACCAACTCCGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCGTCCAAGAAGTTCAAGGTGCTCGGCAACACCGACCGCCACTCCATCAAGAAGAACCTCATCGGCGCCCTCCTCTTCGACTCCGGCGAGACCGCCGAGGCCACCCGCCTCAAGCGCACCGCCCGCCGCCGCTACACCCGCCGCAAGAACCGCATCTGCTACCTCCAGGAGATCTTCTCCAACGAGATGGCCAAGGTGGACGACTCCTTCTTCCACCGCCTCGAGGAGTCCTTCCTCGTGGAGGAGGACAAGAAGCACGAGCGCCACCCGATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCGACCATCTACCACCTCCGCAAGAAGCTCGTGGACTCCACCGACAAGGCCGACCTCCGCCTCATCTACCTCGCCCTCGCCCACATGATCAAGTTCCGCGGCCACTTCCTCATCGAGGGCGACCTCAACCCGGACAACTCCGACGTGGACAAGCTCTTCATCCAGCTCGTGCAGACCTACAACCAGCTCTTCGAGGAGAACCCGATCAACGCCTCCGGCGTGGACGCCAAGGCCATCCTCTCCGCCCGCCTCTCCAAGTCCCGCCGCCTCGAGAACCTCATCGCCCAGCTCCCGGGCGAGAAGAAGAACGGCCTCTTCGGCAACCTCATCGCCCTCTCCCTCGGCCTCACCCCGAACTTCAAGTCCAACTTCGACCTCGCCGAGGACGCCAAGCTCCAGCTCTCCAAGGACACCTACGACGACGACCTCGACAACCTCCTCGCCCAGATCGGCGACCAGTACGCCGACCTCTTCCTCGCCGCCAAGAACCTCTCCGACGCCATCCTCCTCTCCGACATCCTCCGCGTGAACACCGAGATCACCAAGGCCCCGCTCTCCGCCTCCATGATCAAGCGCTACGACGAGCACCACCAGGACCTCACCCTCCTCAAGGCCCTCGTGCGCCAGCAGCTCCCGGAGAAGTACAAGGAGATCTTCTTCGACCAGTCCAAGAACGGCTACGCCGGCTACATCGACGGCGGCGCCTCCCAGGAGGAGTTCTACAAGTTCATCAAGCCGATCCTCGAGAAGATGGACGGCACCGAGGAGCTCCTCGTGAAGCTCAACCGCGAGGACCTCCTCCGCAAGCAGCGCACCTTCGACAACGGCTCCATCCCGCACCAGATCCACCTCGGCGAGCTCCACGCCATCCTCCGCCGCCAGGAGGACTTCTACCCGTTCCTCAAGGACAACCGCGAGAAGATCGAGAAGATCCTCACCTTCCGCATCCCGTACTACGTGGGCCCGCTCGCCCGCGGCAACTCCCGCTTCGCCTGGATGACCCGCAAGTCCGAGGAGACCATCACCCCGTGGAACTTCGAGGAGGTGGTGGACAAGGGCGCCTCCGCCCAGTCCTTCATCGAGCGCATGACCAACTTCGACAAGAACCTCCCGAACGAGAAGGTGCTCCCGAAGCACTCCCTCCTCTACGAGTACTTCACCGTGTACAACGAGCTCACCAAGGTGAAGTACGTGACCGAGGGCATGCGCAAGCCGGCCTTCCTCTCCGGCGAGCAGAAGAAGGCCATCGTGGACCTCCTCTTCAAGACCAACCGCAAGGTGACCGTGAAGCAGCTCAAGGAGGACTACTTCAAGAAGATCGAGTGCTTCGACTCCGTGGAGATCTCCGGCGTGGAGGACCGCTTCAACGCCTCCCTCGGCACCTACCACGACCTCCTCAAGATCATCAAGGACAAGGACTTCCTCGACAACGAGGAGAACGAGGACATCCTCGAGGACATCGTGCTCACCCTCACCCTCTTCGAGGACCGCGAGATGATCGAGGAGCGCCTCAAGACCTACGCCCACCTCTTCGACGACAAGGTGATGAAGCAGCTCAAGCGCCGCCGCTACACCGGCTGGGGCCGCCTCTCCCGCAAGCTCATCAACGGCATCCGCGACAAGCAGTCCGGCAAGACCATCCTCGACTTCCTCAAGTCCGACGGCTTCGCCAACCGCAACTTCATGCAGCTCATCCACGACGACTCCCTCACCTTCAAGGAGGACATCCAGAAGGCCCAGGTGTCCGGCCAGGGCGACTCCCTCCACGAGCACATCGCCAACCTCGCCGGCTCCCCGGCCATCAAGAAGGGCATCCTCCAGACCGTGAAGGTGGTGGACGAGCTCGTGAAGGTGATGGGCCGCCACAAGCCGGAGAACATCGTGATCGAGATGGCCCGCGAGAACCAGACCACCCAGAAGGGCCAGAAGAACTCCCGCGAGCGCATGAAGCGCATCGAGGAGGGCATCAAGGAGCTCGGCTCCCAGATCCTCAAGGAGCACCCGGTGGAGAACACCCAGCTCCAGAACGAGAAGCTCTACCTCTACTACCTCCAGAACGGCCGCGACATGTACGTGGACCAGGAGCTCGACATCAACCGCCTCTCCGACTACGACGTGGACCACATCGTGCCGCAGTCCTTCCTCAAGGACGACTCCATCGACAACAAGGTGCTCACCCGCTCCGACAAGAACCGCGGCAAGTCCGACAACGTGCCGTCCGAGGAGGTGGTGAAGAAGATGAAGAACTACTGGCGCCAGCTCCTCAACGCCAAGCTCATCACCCAGCGCAAGTTCGACAACCTCACCAAGGCCGAGCGCGGCGGCCTCTCCGAGCTCGACAAGGCCGGCTTCATCAAGCGCCAGCTCGTGGAGACCCGCCAGATCACCAAGCACGTGGCCCAGATCCTCGACTCCCGCATGAACACCAAGTACGACGAGAACGACAAGCTCATCCGCGAGGTGAAGGTGATCACCCTCAAGTCCAAGCTCGTGTCCGACTTCCGCAAGGACTTCCAGTTCTACAAGGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTCAACGCCGTGGTGGGCACCGCCCTCATCAAGAAGTACCCGAAGCTCGAGTCCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGCAAGATGATCGCCAAGTCCGAGCAGGAGATCGGCAAGGCCACCGCCAAGTACTTCTTCTACTCCAACATCATGAACTTCTTCAAGACCGAGATCACCCTCGCCAACGGCGAGATCCGCAAGCGCCCGCTCATCGAGACCAACGGCGAGACCGGCGAGATCGTGTGGGACAAGGGCCGCGACTTCGCCACCGTGCGCAAGGTGCTCTCCATGCCGCAGGTGAACATCGTGAAGAAGACCGAGGTGCAGACCGGCGGCTTCTCCAAGGAGTCCATCCTCCCGAAGCGCAACTCCGACAAGCTCATCGCCCGCAAGAAGGACTGGGACCCGAAGAAGTACGGCGGCTTCGACTCCCCGACCGTGGCCTACTCCGTGCTCGTGGTGGCCAAGGTGGAGAAGGGCAAGTCCAAGAAGCTCAAGTCCGTGAAGGAGCTCCTCGGCATCACCATCATGGAGCGCTCCTCCTTCGAGAAGAACCCGATCGACTTCCTCGAGGCCAAGGGCTACAAGGAGGTGAAGAAGGACCTCATCATCAAGCTCCCGAAGTACTCCCTCTTCGAGCTCGAGAACGGCCGCAAGCGCATGCTCGCCTCCGCCGGCGAGCTCCAGAAGGGCAACGAGCTCGCCCTCCCGTCCAAGTACGTGAACTTCCTCTACCTCGCCTCCCACTACGAGAAGCTCAAGGGCTCCCCGGAGGACAACGAGCAGAAGCAGCTCTTCGTGGAGCAGCACAAGCACTACCTCGACGAGATCATCGAGCAGATCTCCGAGTTCTCCAAGCGCGTGATCCTCGCCGACGCCAACCTCGACAAGGTGCTCTCCGCCTACAACAAGCACCGCGACAAGCCGATCCGCGAGCAGGCCGAGAACATCATCCACCTCTTCACCCTCACCAACCTCGGCGCCCCGGCCGCCTTCAAGTACTTCGACACCACCATCGACCGCAAGCGCTACACCTCCACCAAGGAGGTGCTCGACGCCACCCTCATCCACCAGTCCATCACCGGCCTCTACGAGACCCGCATCGACCTCTCCCAGCTCGGCGGCGACCCGAAGAAGCGCCGCCGCGTGTGA
SEQ ID NO:6:用于扩增筛选标记基因CP4的正向引物序列
CAGCACAGGTTAAGTCTG
SEQ ID NO:7:用于扩增筛选标记基因CP4的反向引物序列
GTCTGTCTCAACGGTAAG
SEQ ID NO:8:用于扩增ACTIN1基因的正向引物序列
TGCTATGTACGTCGCCATCCAG
SEQ ID NO:9:用于扩增ACTIN1基因的反向引物序列
AATGAGTAACCACGCTCCGTCA
SEQ ID NO:10:用于扩增OsGS2基因编辑位点的正向引物
GCATTCTTGTGTGTAACACGG
SEQ ID NO:11:用于扩增OsGS2基因编辑位点的反向引物
CATTATCCATGTGCAGCTGAG
SEQ ID NO:12:用于qPCR检测OsGS2基因表达量的正向引物
GTGACCTTGGTCAGAACACC
SEQ ID NO:13:用于qPCR检测OsGS2基因表达量的反向引物
ATTCTCATCAGCGAGGTCTG
序列表
<110> 中国种子集团有限公司
<120> 创制水稻大长粒型新种质的方法及其应用
<160> 13
<170> SIPOSequenceListing 1.0
<210> 1
<211> 3386
<212> DNA/RNA
<213> 水稻(Oryza sativa)
<400> 1
atggcgatgc cgtatgcctc cctgtctccg gcggtggccg accaccgctc gtccccggca 60
gccgcgaccg cctccctcct ccccttctgc cgctccaccc cgctctccgc gtaagcaacg 120
cgaacccgcg gctacaaccc attttcttgg ctccagtggt gcatgtgaca acacggtgag 180
acgttgtgtg tgggtgggtg ggtgcagggg cggtggtggc gtcgcgatgg gggaggacgc 240
gccgatgacc gcgaggtggc cgccggcggc ggcggcgagg ctgccgccgt tcaccgcggc 300
gcagtacgag gagctggagc agcaggcgct catatacaag tacctggtgg caggcgtgcc 360
cgtcccgccg gatctcgtgc tccccatccg ccgcggactc gactccctcg ccgcccgctt 420
ctacaaccat cccgcccgta cgtcgtgttc ctatttcttg cctctcctct accatcgctg 480
cattgctttt ggatgcttgt ttagtgtcgg cttctttgtt tattccgatc aggcgtactt 540
tgcttccatt tgttaattgg ctccgggtca tttgttaatc cgggttacgc gattcaagaa 600
acatgcgtgt gtgtttttat gctatcctcc ggatttggta ataaaaaggc ttgtttttaa 660
atccaaaact cgtgctcgct tcacgattag cgcatcattt tttttttttg gggggggggg 720
gggggaagtt tgcccatcat tctgtctctg tttgatctga tagaggacgt gcacacgctc 780
ttgtctgaaa taaaatcttt tgtttatcag tatgcccatg ggataagcca ttttctctgt 840
gaaccaacac cctggcaaac tgtttttttg ctcgccattt ttgagcgatt gctaagaaca 900
gataactatg ccctgcatat ggatcggata tggacttctc aaatattcaa atgccattct 960
attaggaact caaaatgcat taccaacaaa tgcattcttg tgtgtaacac ggttgctacg 1020
atgtgcctgt ttttgtacag ttggatatgg tccgtacttc ggcaagaagc tggacccaga 1080
gccagggcgg tgccggcgta cggacggcaa gaaatggcgg tgctcgaagg aggccgcgcc 1140
ggattccaag tactgcgagc gccacatgca ccgcggccgc aaccgttcaa gaaagcctgt 1200
ggaaacgcag ctggtcgccc agtcccaacc gccctcatct gttgtcggtt ctgcggcggc 1260
gccccttgct gctgcctcca atggcagcag cttccaaaac cactctcttt accctgctat 1320
tgccggcagc aatggcgggg gcggggggag gaacatgccc agctcatttg gctcggcgtt 1380
gggttctcag ctgcacatgg ataatgctgc cccttatgca gctgttggtg gtggaacagg 1440
caaagatctc aggtgattgt tcatttcttt ttttttaatc aaacgccata tttacttgtt 1500
tagcactgtc ttgaatcatg atatgtatcc ttccgttgtc taaaaaaaag gtgccatgct 1560
ctaactgatt ggtgtcaggt ggatgcagtt atgaatctgt atttttcatt gtgatcggtt 1620
aataactgtg tcccatttgt ttgcattggt ggcaatcgaa tcagctgtcc atgctcagta 1680
gtactacttc gatttggtgc tgcaatcact gaaagtctga aactttactc tctgcactgc 1740
aaaaatttgt gttatgttta ggtttccaga gtgctgcctc tttgcccttc ccatactttc 1800
tggtatcagt tttcagcccc agaagccggg gacagtctcc ataagagatt tctgctcagg 1860
tgaaactggg gtgcagggtc ttaacatggc tttggcccag tagtttgaaa catgtactgt 1920
ccataaagat gatactacta catatttgtg tctgccctcg cagtgcttgt gcctgctggt 1980
agctgatcat ggcttccctt ggcatttact ccacttcttt attcctccac agaatccagt 2040
tgtttctgtc tctgctcttc aggggcagtc aattatttgg cccttgcaaa atactgtctc 2100
tgaagatgtc tcaccgatca ccactatacc tgaaacattt tccagtggcc agcgtgagct 2160
gcatgatgct ccaagtcaac tctatactca tccaatgttg atgattagat tttaacaatg 2220
caactctttg atttatcttc cctacaaaaa aaaaggaact ctttgattta tcttcggtga 2280
atctcagtct gaccttagta cctagcctca ttatttactt caccaaatgt ataactctac 2340
agtgcttgtt cgtgttgatt tggtttagtt tagttattga attattcggt caccttagtc 2400
tttgattgtt tttttctttc tgctcttgtc atcaactgtt tagggttcag ctgacttgct 2460
gctgcaacta aactgtcttc tggttttact gcaaaataga atgtttcttg ggccatgatc 2520
tgctgctata tatgattagt taaaccatgg ttctatgttt tcttatatga attcatgaca 2580
agaatactaa cttttggaaa aggtaatttt attttttttg tatgataata atgctttgga 2640
ttctttctag tttatctgtc ggacttaggt taactacatt tcctccggta catggattta 2700
tttcattctt acaattgagc ccttatgaat attttcttcc taattctgtt ctaaaaagtt 2760
agaattgaca tattttcgat aggtacatgc ctagcacttg cattcgtgtt tcctactaat 2820
tcccaatcac tgtatcttct caaattcagg tatactgctt atggcacaag atctttggcg 2880
gatgagcaga gtcaactcat tactgaagct atcaacacat ctattgaaaa tccatggcgg 2940
ctgctgccat ctcagaactc gccatttccc ctttcaagct attctcagct gggggcacta 3000
agtgaccttg gtcagaacac ccccagctca ctttcaaagg ttcagaggca gccactttcg 3060
ttctttggga acgactatgc ggctgtcgat tctgtgaagc aagagaacca gacgctgcgt 3120
cccttctttg atgagtggcc aaagggaagg gattcatggt cagacctcgc tgatgagaat 3180
gctaatcttt cgtcattctc aggcacccaa ctgtcgatct ccataccaat ggcatcctct 3240
gacttctcgg cggccagttc tcgatcaact aatggtacga ctacttgatc tccccccaat 3300
tacttcgtgc gtgtttatgt ctgtatcctg caatgtctga agatttctta ctgaaaacgt 3360
catctggtct gtgtgcaggt gactga 3386
<210> 2
<211> 394
<212> PRT
<213> 水稻(Oryza sativa)
<400> 2
Met Ala Met Pro Tyr Ala Ser Leu Ser Pro Ala Val Ala Asp His Arg
1 5 10 15
Ser Ser Pro Ala Ala Ala Thr Ala Ser Leu Leu Pro Phe Cys Arg Ser
20 25 30
Thr Pro Leu Ser Ala Gly Gly Gly Gly Val Ala Met Gly Glu Asp Ala
35 40 45
Pro Met Thr Ala Arg Trp Pro Pro Ala Ala Ala Ala Arg Leu Pro Pro
50 55 60
Phe Thr Ala Ala Gln Tyr Glu Glu Leu Glu Gln Gln Ala Leu Ile Tyr
65 70 75 80
Lys Tyr Leu Val Ala Gly Val Pro Val Pro Pro Asp Leu Val Leu Pro
85 90 95
Ile Arg Arg Gly Leu Asp Ser Leu Ala Ala Arg Phe Tyr Asn His Pro
100 105 110
Ala Leu Gly Tyr Gly Pro Tyr Phe Gly Lys Lys Leu Asp Pro Glu Pro
115 120 125
Gly Arg Cys Arg Arg Thr Asp Gly Lys Lys Trp Arg Cys Ser Lys Glu
130 135 140
Ala Ala Pro Asp Ser Lys Tyr Cys Glu Arg His Met His Arg Gly Arg
145 150 155 160
Asn Arg Ser Arg Lys Pro Val Glu Thr Gln Leu Val Ala Gln Ser Gln
165 170 175
Pro Pro Ser Ser Val Val Gly Ser Ala Ala Ala Pro Leu Ala Ala Ala
180 185 190
Ser Asn Gly Ser Ser Phe Gln Asn His Ser Leu Tyr Pro Ala Ile Ala
195 200 205
Gly Ser Asn Gly Gly Gly Gly Gly Arg Asn Met Pro Ser Ser Phe Gly
210 215 220
Ser Ala Leu Gly Ser Gln Leu His Met Asp Asn Ala Ala Pro Tyr Ala
225 230 235 240
Ala Val Gly Gly Gly Thr Gly Lys Asp Leu Arg Tyr Thr Ala Tyr Gly
245 250 255
Thr Arg Ser Leu Ala Asp Glu Gln Ser Gln Leu Ile Thr Glu Ala Ile
260 265 270
Asn Thr Ser Ile Glu Asn Pro Trp Arg Leu Leu Pro Ser Gln Asn Ser
275 280 285
Pro Phe Pro Leu Ser Ser Tyr Ser Gln Leu Gly Ala Leu Ser Asp Leu
290 295 300
Gly Gln Asn Thr Pro Ser Ser Leu Ser Lys Val Gln Arg Gln Pro Leu
305 310 315 320
Ser Phe Phe Gly Asn Asp Tyr Ala Ala Val Asp Ser Val Lys Gln Glu
325 330 335
Asn Gln Thr Leu Arg Pro Phe Phe Asp Glu Trp Pro Lys Gly Arg Asp
340 345 350
Ser Trp Ser Asp Leu Ala Asp Glu Asn Ala Asn Leu Ser Ser Phe Ser
355 360 365
Gly Thr Gln Leu Ser Ile Ser Ile Pro Met Ala Ser Ser Asp Phe Ser
370 375 380
Ala Ala Ser Ser Arg Ser Thr Asn Gly Asp
385 390
<210> 3
<211> 20
<212> DNA/RNA
<213> 水稻(Oryza sativa)
<400> 3
gtggaaacgc agctggtcgc 20
<210> 4
<211> 97
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 4
gcgaccagct gcgtttccac gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgct 97
<210> 5
<211> 4149
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 5
atgccgaaga agcgccgccg cgtggacaag aagtactcca tcggcctcga catcggcacc 60
aactccgtgg gctgggccgt gatcaccgac gagtacaagg tgccgtccaa gaagttcaag 120
gtgctcggca acaccgaccg ccactccatc aagaagaacc tcatcggcgc cctcctcttc 180
gactccggcg agaccgccga ggccacccgc ctcaagcgca ccgcccgccg ccgctacacc 240
cgccgcaaga accgcatctg ctacctccag gagatcttct ccaacgagat ggccaaggtg 300
gacgactcct tcttccaccg cctcgaggag tccttcctcg tggaggagga caagaagcac 360
gagcgccacc cgatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccg 420
accatctacc acctccgcaa gaagctcgtg gactccaccg acaaggccga cctccgcctc 480
atctacctcg ccctcgccca catgatcaag ttccgcggcc acttcctcat cgagggcgac 540
ctcaacccgg acaactccga cgtggacaag ctcttcatcc agctcgtgca gacctacaac 600
cagctcttcg aggagaaccc gatcaacgcc tccggcgtgg acgccaaggc catcctctcc 660
gcccgcctct ccaagtcccg ccgcctcgag aacctcatcg cccagctccc gggcgagaag 720
aagaacggcc tcttcggcaa cctcatcgcc ctctccctcg gcctcacccc gaacttcaag 780
tccaacttcg acctcgccga ggacgccaag ctccagctct ccaaggacac ctacgacgac 840
gacctcgaca acctcctcgc ccagatcggc gaccagtacg ccgacctctt cctcgccgcc 900
aagaacctct ccgacgccat cctcctctcc gacatcctcc gcgtgaacac cgagatcacc 960
aaggccccgc tctccgcctc catgatcaag cgctacgacg agcaccacca ggacctcacc 1020
ctcctcaagg ccctcgtgcg ccagcagctc ccggagaagt acaaggagat cttcttcgac 1080
cagtccaaga acggctacgc cggctacatc gacggcggcg cctcccagga ggagttctac 1140
aagttcatca agccgatcct cgagaagatg gacggcaccg aggagctcct cgtgaagctc 1200
aaccgcgagg acctcctccg caagcagcgc accttcgaca acggctccat cccgcaccag 1260
atccacctcg gcgagctcca cgccatcctc cgccgccagg aggacttcta cccgttcctc 1320
aaggacaacc gcgagaagat cgagaagatc ctcaccttcc gcatcccgta ctacgtgggc 1380
ccgctcgccc gcggcaactc ccgcttcgcc tggatgaccc gcaagtccga ggagaccatc 1440
accccgtgga acttcgagga ggtggtggac aagggcgcct ccgcccagtc cttcatcgag 1500
cgcatgacca acttcgacaa gaacctcccg aacgagaagg tgctcccgaa gcactccctc 1560
ctctacgagt acttcaccgt gtacaacgag ctcaccaagg tgaagtacgt gaccgagggc 1620
atgcgcaagc cggccttcct ctccggcgag cagaagaagg ccatcgtgga cctcctcttc 1680
aagaccaacc gcaaggtgac cgtgaagcag ctcaaggagg actacttcaa gaagatcgag 1740
tgcttcgact ccgtggagat ctccggcgtg gaggaccgct tcaacgcctc cctcggcacc 1800
taccacgacc tcctcaagat catcaaggac aaggacttcc tcgacaacga ggagaacgag 1860
gacatcctcg aggacatcgt gctcaccctc accctcttcg aggaccgcga gatgatcgag 1920
gagcgcctca agacctacgc ccacctcttc gacgacaagg tgatgaagca gctcaagcgc 1980
cgccgctaca ccggctgggg ccgcctctcc cgcaagctca tcaacggcat ccgcgacaag 2040
cagtccggca agaccatcct cgacttcctc aagtccgacg gcttcgccaa ccgcaacttc 2100
atgcagctca tccacgacga ctccctcacc ttcaaggagg acatccagaa ggcccaggtg 2160
tccggccagg gcgactccct ccacgagcac atcgccaacc tcgccggctc cccggccatc 2220
aagaagggca tcctccagac cgtgaaggtg gtggacgagc tcgtgaaggt gatgggccgc 2280
cacaagccgg agaacatcgt gatcgagatg gcccgcgaga accagaccac ccagaagggc 2340
cagaagaact cccgcgagcg catgaagcgc atcgaggagg gcatcaagga gctcggctcc 2400
cagatcctca aggagcaccc ggtggagaac acccagctcc agaacgagaa gctctacctc 2460
tactacctcc agaacggccg cgacatgtac gtggaccagg agctcgacat caaccgcctc 2520
tccgactacg acgtggacca catcgtgccg cagtccttcc tcaaggacga ctccatcgac 2580
aacaaggtgc tcacccgctc cgacaagaac cgcggcaagt ccgacaacgt gccgtccgag 2640
gaggtggtga agaagatgaa gaactactgg cgccagctcc tcaacgccaa gctcatcacc 2700
cagcgcaagt tcgacaacct caccaaggcc gagcgcggcg gcctctccga gctcgacaag 2760
gccggcttca tcaagcgcca gctcgtggag acccgccaga tcaccaagca cgtggcccag 2820
atcctcgact cccgcatgaa caccaagtac gacgagaacg acaagctcat ccgcgaggtg 2880
aaggtgatca ccctcaagtc caagctcgtg tccgacttcc gcaaggactt ccagttctac 2940
aaggtgcgcg agatcaacaa ctaccaccac gcccacgacg cctacctcaa cgccgtggtg 3000
ggcaccgccc tcatcaagaa gtacccgaag ctcgagtccg agttcgtgta cggcgactac 3060
aaggtgtacg acgtgcgcaa gatgatcgcc aagtccgagc aggagatcgg caaggccacc 3120
gccaagtact tcttctactc caacatcatg aacttcttca agaccgagat caccctcgcc 3180
aacggcgaga tccgcaagcg cccgctcatc gagaccaacg gcgagaccgg cgagatcgtg 3240
tgggacaagg gccgcgactt cgccaccgtg cgcaaggtgc tctccatgcc gcaggtgaac 3300
atcgtgaaga agaccgaggt gcagaccggc ggcttctcca aggagtccat cctcccgaag 3360
cgcaactccg acaagctcat cgcccgcaag aaggactggg acccgaagaa gtacggcggc 3420
ttcgactccc cgaccgtggc ctactccgtg ctcgtggtgg ccaaggtgga gaagggcaag 3480
tccaagaagc tcaagtccgt gaaggagctc ctcggcatca ccatcatgga gcgctcctcc 3540
ttcgagaaga acccgatcga cttcctcgag gccaagggct acaaggaggt gaagaaggac 3600
ctcatcatca agctcccgaa gtactccctc ttcgagctcg agaacggccg caagcgcatg 3660
ctcgcctccg ccggcgagct ccagaagggc aacgagctcg ccctcccgtc caagtacgtg 3720
aacttcctct acctcgcctc ccactacgag aagctcaagg gctccccgga ggacaacgag 3780
cagaagcagc tcttcgtgga gcagcacaag cactacctcg acgagatcat cgagcagatc 3840
tccgagttct ccaagcgcgt gatcctcgcc gacgccaacc tcgacaaggt gctctccgcc 3900
tacaacaagc accgcgacaa gccgatccgc gagcaggccg agaacatcat ccacctcttc 3960
accctcacca acctcggcgc cccggccgcc ttcaagtact tcgacaccac catcgaccgc 4020
aagcgctaca cctccaccaa ggaggtgctc gacgccaccc tcatccacca gtccatcacc 4080
ggcctctacg agacccgcat cgacctctcc cagctcggcg gcgacccgaa gaagcgccgc 4140
cgcgtgtga 4149
<210> 6
<211> 18
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 6
cagcacaggt taagtctg 18
<210> 7
<211> 18
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 7
gtctgtctca acggtaag 18
<210> 8
<211> 22
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 8
tgctatgtac gtcgccatcc ag 22
<210> 9
<211> 22
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 9
aatgagtaac cacgctccgt ca 22
<210> 10
<211> 21
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 10
gcattcttgt gtgtaacacg g 21
<210> 11
<211> 21
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 11
cattatccat gtgcagctga g 21
<210> 12
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 12
gtgaccttgg tcagaacacc 20
<210> 13
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 13
attctcatca gcgaggtctg 20
Claims (10)
1.创制水稻大长粒型新种质的方法,其包括修饰水稻中的OsGS2基因,使其miR396结合功能,尤其是miR396c结合功能丧失,任选地,所述修饰通过基因编辑进行。
2.根据权利要求1所述的方法,其中所述OsGS2基因包含以下序列或由以下序列组成:SEQ ID NO:1所示的核苷酸序列或与其具有至少90%、95%、99%或更高的序列同一性并编码相同功能的蛋白质的活性变体序列,或者编码SEQ ID NO:2所示的氨基酸序列或与其具有至少90%、95%、99%或更高的序列同一性的保留其功能的活性变体序列的核苷酸序列,任选地,所述水稻为籼稻或粳稻。
3.根据权利要求1所述的方法,其中所述基因编辑通过选自以下的序列特异性核酸酶中的一种或多种进行:CRISPR/Cas9、CRISPR/Cas12a、TALEN、大范围核酸酶和ZFN,优选地,所述基因编辑通过CRISPR/Cas9进行,任选地,所述CRISPR/Cas9包含Cas9,其中所述Cas9包含SEQ ID NO:5所示的核苷酸序列或与其具有至少90%、95%、99%或更高的序列同一性并编码相同功能的蛋白质的活性变体序列,任选地,所述CRISPR/Cas9包含导向RNA(sgRNA),其中所述sgRNA靶向OsGS2基因的miR396结合区段,任选地,所述sgRNA靶向SEQ ID NO:3所示的核苷酸序列,任选地,所述sgRNA包含SEQ ID NO:4所示的核苷酸序列或与其具有至少90%、95%、99%或更高的序列同一性的保留其功能的活性变体序列。
4.根据权利要求1-3中任一项所述的方法,其中所述修饰导致OsGS2基因的miR396结合区段发生缺失、插入、取代或以上的组合,任选地,所述修饰导致OsGS2基因的miR396c结合区段内缺失或添加3的倍数数量的碱基,例如3bp、6bp、9bp,和/或所结合区段内的碱基发生取代。
5.通过权利要求1-4中任一项所述的方法创制的水稻用于育种的用途。
6.通过权利要求1-4中任一项所述的方法创制的水稻用于改良种质资源的用途。
7.由权利要求1-4中任一项的方法获得的水稻的种子制成的制品,其选自食品、饮品、饲料或工业原料。
8.能够靶向水稻OsGS2基因的sgRNA,其包含SEQ ID NO:4所示的核苷酸序列或由SEQID NO:4所示的核苷酸序列组成。
9.能够靶向水稻OsGS2基因的CRISPR/Cas9编辑载体,其包含表达Cas9的第一表达盒和表达sgRNA的第二表达盒,其中所述Cas9包含SEQ ID NO:5所示的核苷酸序列或与其具有至少90%、95%、99%或更高的序列同一性并编码相同功能的蛋白质的活性变体序列,并且所述sgRNA包含SEQ ID NO:4所示的核苷酸序列或与其具有至少90%、95%、99%或更高的序列同一性的保留其功能的活性变体序列。
10.创制水稻大长粒型新种质的方法,其包括将权利要求9所述的CRISPR/Cas9编辑载体导入含有OsGS2基因的水稻中,任选地,所述OsGS2基因包含以下序列或由以下序列组成:SEQ ID NO:1所示的核苷酸序列或与其具有至少90%、95%、99%或更高的序列同一性并编码相同功能的蛋白质的活性变体序列,或者编码SEQ ID NO:2所示的氨基酸序列或与其具有至少90%、95%、99%或更高的序列同一性的保留其功能的活性变体序列的核苷酸序列,任选地,所述水稻为籼稻或粳稻。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911298653.1A CN112980870A (zh) | 2019-12-17 | 2019-12-17 | 创制水稻大长粒型新种质的方法及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911298653.1A CN112980870A (zh) | 2019-12-17 | 2019-12-17 | 创制水稻大长粒型新种质的方法及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112980870A true CN112980870A (zh) | 2021-06-18 |
Family
ID=76341918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911298653.1A Pending CN112980870A (zh) | 2019-12-17 | 2019-12-17 | 创制水稻大长粒型新种质的方法及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112980870A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102304520A (zh) * | 2010-01-26 | 2012-01-04 | 中国科学院遗传与发育生物学研究所 | 小分子rna的调控位点及其应用 |
CN110066823A (zh) * | 2018-01-22 | 2019-07-30 | 中国科学院上海生命科学研究院 | Mim396在增大水稻穗形及提高水稻株高中的应用 |
-
2019
- 2019-12-17 CN CN201911298653.1A patent/CN112980870A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102304520A (zh) * | 2010-01-26 | 2012-01-04 | 中国科学院遗传与发育生物学研究所 | 小分子rna的调控位点及其应用 |
CN110066823A (zh) * | 2018-01-22 | 2019-07-30 | 中国科学院上海生命科学研究院 | Mim396在增大水稻穗形及提高水稻株高中的应用 |
Non-Patent Citations (3)
Title |
---|
JIANG HU ET AL.,: "A Rare Allele of GS2 Enhances Grain Size and Grain Yield in Rice", 《MOLECULAR PLANT》 * |
叶超楠: "热胁迫下水稻miR396家族及靶基因OsGRFs的表达研究", 《农业生物技术学报》 * |
金正勋等: "水稻谷氨酰胺合成酶同工型基因转录表达量与启动子结构关系分析", 《东北农业大学学报》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109705198B (zh) | OsCKX7蛋白质及其编码基因在调控植物纹枯病抗性中的应用 | |
CN110218810B (zh) | 调控玉米雄穗构型的启动子、分子标记及其应用 | |
CN110938120A (zh) | 改变二倍体马铃薯材料自交不亲和性的StSCI蛋白 | |
CN107759676B (zh) | 一种植物直链淀粉合成相关蛋白Du15与其编码基因及应用 | |
Ramadan et al. | Efficient CRISPR/Cas9 mediated pooled-sgRNAs assembly accelerates targeting multiple genes related to male sterility in cotton | |
CN108291234A (zh) | 倍数孢子体形成基因 | |
CN113265422B (zh) | 靶向敲除水稻粒型调控基因slg7的方法、水稻粒型调控基因slg7突变体及其应用 | |
WO2019129145A1 (en) | Flowering time-regulating gene cmp1 and related constructs and applications thereof | |
WO2015007241A1 (en) | Molecular marker | |
CN116782762A (zh) | 植物单倍体诱导 | |
CN112980839B (zh) | 创制水稻高直链淀粉型新种质的方法及其应用 | |
KR102516522B1 (ko) | 반수체 식물을 유도하는 pPLAⅡη 유전자 및 이의 용도 | |
CA3089886A1 (en) | Compositions and methods for improving crop yields through trait stacking | |
CN113151345B (zh) | 创制水稻低糊化温度新种质的方法及其应用 | |
CN110452914B (zh) | 一个调控油菜素内酯信号转导的基因BnC04BIN2-like1及其应用 | |
CN112980870A (zh) | 创制水稻大长粒型新种质的方法及其应用 | |
CN113999871B (zh) | 创制矮杆直立株型的水稻种质的方法及其应用 | |
CA3131193A1 (en) | Methods and compositions for generating dominant short stature alleles using genome editing | |
WO2018228348A1 (en) | Methods to improve plant agronomic trait using bcs1l gene and guide rna/cas endonuclease systems | |
CN115340994A (zh) | 创制水稻大长粒型新种质的方法 | |
CN115216488A (zh) | 创制水稻大长粒型新种质或大长粒型矮杆新种质的方法及其应用 | |
CN113462661B (zh) | 从玉米中分离的siz1蛋白及其编码基因和在品种改良中的应用 | |
CN114516906B (zh) | 玉米与菌根真菌共生相关蛋白及其编码基因与应用 | |
CN108841839B (zh) | 蛋白质TabZIP60在调控植物对氮素吸收中的应用 | |
US20240167046A1 (en) | Inducible mosaicism |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Country or region after: China Address after: Room 3610, 6th Floor, Building 3, Yabulun Industrial Park, Yazhou Bay Science and Technology City, Yazhou District, Sanya City, Hainan Province, 572025 Applicant after: CHINA NATIONAL SEED GROUP Corp.,Ltd. Address before: 15 / F, Sinochem building, A2 Fuxingmenwai street, Xicheng District, Beijing 100045 Applicant before: CHINA NATIONAL SEED GROUP Corp.,Ltd. Country or region before: China |