CN107043778A - 真菌基因定点插入突变的近原位回补方法 - Google Patents
真菌基因定点插入突变的近原位回补方法 Download PDFInfo
- Publication number
- CN107043778A CN107043778A CN201611041330.0A CN201611041330A CN107043778A CN 107043778 A CN107043778 A CN 107043778A CN 201611041330 A CN201611041330 A CN 201611041330A CN 107043778 A CN107043778 A CN 107043778A
- Authority
- CN
- China
- Prior art keywords
- gene
- site
- target
- complementary
- mutant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003780 insertion Methods 0.000 title claims abstract description 63
- 230000037431 insertion Effects 0.000 title claims abstract description 63
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000035772 mutation Effects 0.000 title claims abstract description 27
- 108700005088 Fungal Genes Proteins 0.000 title claims abstract description 22
- 238000011065 in-situ storage Methods 0.000 title claims abstract description 18
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 176
- 239000012634 fragment Substances 0.000 claims abstract description 93
- 240000000111 Saccharum officinarum Species 0.000 claims abstract description 46
- 235000007201 Saccharum officinarum Nutrition 0.000 claims abstract description 46
- 230000000295 complement effect Effects 0.000 claims abstract description 45
- 241000589155 Agrobacterium tumefaciens Species 0.000 claims abstract description 36
- 108091027544 Subgenomic mRNA Proteins 0.000 claims abstract description 27
- 239000013612 plasmid Substances 0.000 claims abstract description 24
- 230000001404 mediated effect Effects 0.000 claims abstract description 23
- 108091033409 CRISPR Proteins 0.000 claims abstract description 21
- 238000012216 screening Methods 0.000 claims abstract description 15
- NRAUADCLPJTGSF-ZPGVOIKOSA-N [(2r,3s,4r,5r,6r)-6-[[(3as,7r,7as)-7-hydroxy-4-oxo-1,3a,5,6,7,7a-hexahydroimidazo[4,5-c]pyridin-2-yl]amino]-5-[[(3s)-3,6-diaminohexanoyl]amino]-4-hydroxy-2-(hydroxymethyl)oxan-3-yl] carbamate Chemical compound NCCC[C@H](N)CC(=O)N[C@@H]1[C@@H](O)[C@H](OC(N)=O)[C@@H](CO)O[C@H]1\N=C/1N[C@H](C(=O)NC[C@H]2O)[C@@H]2N\1 NRAUADCLPJTGSF-ZPGVOIKOSA-N 0.000 claims abstract description 14
- 241000233866 Fungi Species 0.000 claims abstract description 8
- 108020004414 DNA Proteins 0.000 claims description 70
- 230000002779 inactivation Effects 0.000 claims description 30
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 claims description 25
- 244000053095 fungal pathogen Species 0.000 claims description 17
- 238000003169 complementation method Methods 0.000 claims description 15
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 claims description 14
- 238000005516 engineering process Methods 0.000 claims description 12
- 230000001131 transforming effect Effects 0.000 claims description 11
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 8
- 241000221566 Ustilago Species 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 7
- 239000003550 marker Substances 0.000 claims description 7
- 230000001717 pathogenic effect Effects 0.000 claims description 6
- 101150112014 Gapdh gene Proteins 0.000 claims description 5
- 101150018082 U6 gene Proteins 0.000 claims description 4
- 238000010367 cloning Methods 0.000 claims description 4
- 108020004688 Small Nuclear RNA Proteins 0.000 claims description 2
- 102000039471 Small Nuclear RNA Human genes 0.000 claims description 2
- 244000052769 pathogen Species 0.000 claims description 2
- 241000589158 Agrobacterium Species 0.000 abstract description 23
- 108020004635 Complementary DNA Proteins 0.000 abstract description 11
- 238000010804 cDNA synthesis Methods 0.000 abstract description 11
- 239000002299 complementary DNA Substances 0.000 abstract description 11
- 238000011160 research Methods 0.000 abstract description 6
- 201000010099 disease Diseases 0.000 abstract 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract 3
- 241000221561 Ustilaginales Species 0.000 abstract 1
- 230000010354 integration Effects 0.000 abstract 1
- 239000000047 product Substances 0.000 description 27
- 230000006870 function Effects 0.000 description 21
- 239000002609 medium Substances 0.000 description 16
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 15
- 239000000203 mixture Substances 0.000 description 15
- 238000001514 detection method Methods 0.000 description 12
- 210000004027 cell Anatomy 0.000 description 11
- 238000001962 electrophoresis Methods 0.000 description 10
- 238000011084 recovery Methods 0.000 description 10
- 238000012258 culturing Methods 0.000 description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- 238000012163 sequencing technique Methods 0.000 description 8
- 239000001963 growth medium Substances 0.000 description 7
- 101150029559 hph gene Proteins 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 238000012795 verification Methods 0.000 description 7
- 101150073246 AGL1 gene Proteins 0.000 description 6
- 238000012408 PCR amplification Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 239000003016 pheromone Substances 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 241000196324 Embryophyta Species 0.000 description 5
- 101710163270 Nuclease Proteins 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 229960002727 cefotaxime sodium Drugs 0.000 description 5
- AZZMGZXNTDTSME-JUZDKLSSSA-M cefotaxime sodium Chemical compound [Na+].N([C@@H]1C(N2C(=C(COC(C)=O)CS[C@@H]21)C([O-])=O)=O)C(=O)\C(=N/OC)C1=CSC(N)=N1 AZZMGZXNTDTSME-JUZDKLSSSA-M 0.000 description 5
- 238000003501 co-culture Methods 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- JQXXHWHPUNPDRT-WLSIYKJHSA-N rifampicin Chemical compound O([C@](C1=O)(C)O/C=C/[C@@H]([C@H]([C@@H](OC(C)=O)[C@H](C)[C@H](O)[C@H](C)[C@@H](O)[C@@H](C)\C=C\C=C(C)/C(=O)NC=2C(O)=C3C([O-])=C4C)C)OC)C4=C1C3=C(O)C=2\C=N\N1CC[NH+](C)CC1 JQXXHWHPUNPDRT-WLSIYKJHSA-N 0.000 description 5
- 229960001225 rifampicin Drugs 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000007865 diluting Methods 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 238000003209 gene knockout Methods 0.000 description 4
- 239000003292 glue Substances 0.000 description 4
- 239000006166 lysate Substances 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 4
- 229960000268 spectinomycin Drugs 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 3
- 101150068236 MFA2 gene Proteins 0.000 description 3
- 239000007795 chemical reaction product Substances 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 239000012154 double-distilled water Substances 0.000 description 3
- 230000002538 fungal effect Effects 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- 230000013011 mating Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 229920001817 Agar Polymers 0.000 description 2
- 238000010354 CRISPR gene editing Methods 0.000 description 2
- 108091029865 Exogenous DNA Proteins 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 241000258149 Hemicentrotus Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 239000001888 Peptone Substances 0.000 description 2
- 108010080698 Peptones Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 238000009630 liquid culture Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000007500 overflow downdraw method Methods 0.000 description 2
- 235000019319 peptone Nutrition 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 238000012257 pre-denaturation Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000001954 sterilising effect Effects 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 108700026220 vif Genes Proteins 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- SXGZJKUKBWWHRA-UHFFFAOYSA-N 2-(N-morpholiniumyl)ethanesulfonate Chemical compound [O-]S(=O)(=O)CC[NH+]1CCOCC1 SXGZJKUKBWWHRA-UHFFFAOYSA-N 0.000 description 1
- OSBLTNPMIGYQGY-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid;boric acid Chemical compound OB(O)O.OCC(N)(CO)CO.OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O OSBLTNPMIGYQGY-UHFFFAOYSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- 241000756137 Hemerocallis Species 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- RSOMVHWMIAZNLE-HJWJTTGWSA-N Met-Phe-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSOMVHWMIAZNLE-HJWJTTGWSA-N 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 229910004619 Na2MoO4 Inorganic materials 0.000 description 1
- BFYHIHGIHGROAT-HTUGSXCWSA-N Phe-Glu-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFYHIHGIHGROAT-HTUGSXCWSA-N 0.000 description 1
- 241000209051 Saccharum Species 0.000 description 1
- 239000008051 TBE buffer Substances 0.000 description 1
- 241001052560 Thallis Species 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- 241000082085 Verticillium <Phyllachorales> Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 229910052927 chalcanthite Inorganic materials 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 229910052564 epsomite Inorganic materials 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 101150118163 h gene Proteins 0.000 description 1
- XLYOFNOQVPJJNP-ZSJDYOACSA-N heavy water Substances [2H]O[2H] XLYOFNOQVPJJNP-ZSJDYOACSA-N 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 229910000359 iron(II) sulfate Inorganic materials 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- SQQMAOCOWKFBNP-UHFFFAOYSA-L manganese(II) sulfate Chemical compound [Mn+2].[O-]S([O-])(=O)=O SQQMAOCOWKFBNP-UHFFFAOYSA-L 0.000 description 1
- 229910000357 manganese(II) sulfate Inorganic materials 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000003950 pathogenic mechanism Effects 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- -1 seq. id No.22) Proteins 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000011684 sodium molybdate Substances 0.000 description 1
- TVXXNOYZHKPKGW-UHFFFAOYSA-N sodium molybdate (anhydrous) Chemical compound [Na+].[Na+].[O-][Mo]([O-])(=O)=O TVXXNOYZHKPKGW-UHFFFAOYSA-N 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/65—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2810/00—Vectors comprising a targeting moiety
- C12N2810/10—Vectors comprising a non-peptidic targeting moiety
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Mycology (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明公开了一种真菌基因定点插入突变的近原位回补方法,将修饰过的互补基因片段和U6启动子驱动携带抗性基因特异识别序列的sgRNA表达盒与根癌农杆菌T‑质粒整合,构建以诺尔丝菌素为抗性筛选标记的根癌农杆菌介导的病原真菌基因定点互补载体;用该互补载体转化病原真菌基因插入失活突变体的孢子,依赖该突变体所携带的Cas9对靶标位点进行切割,从而实现将互补基因片段准确插入突变体的抗性基因靶标序列。发明人将该法应用于甘蔗鞭黑穗菌Δmfa2、prf或g827突变株实现了互补DNA片段的准确定点插入,使目标基因功能恢复,具有简易性、高效性和准确性,为研究病原真菌功能基因组学提供了重要工具。
Description
技术领域
本发明属于微生物基因工程领域中用于真菌基因敲除及互补的分子工具及实验体系,尤其涉及一种真菌基因定点插入突变的近原位回补方法。
背景技术
基因失活技术是通过改变生物的遗传基因,令特定的基因序列发生改变,导致基因失活并丧失功能,进而推测出该基因生物学功能的一种遗传工程技术。基因互补是在基因缺失突变体中人工导入所缺失的基因从而实现恢复该基因功能的技术。基因失活和基因互补广泛应用于基因功能的研究。
根癌农杆菌(Agrobac terium tumefaciens)是一种革兰氏阴性土壤杆菌,在自然条件下,它能够在植物的受伤部位侵染植物细胞,将其染色体外遗传物质Ti质粒段DNA(T-DNA)大多以单拷贝形式随机整合进植物的基因组中。许多研究表明根癌农杆菌不仅可以转化植物而且可以转化细菌、动物和真菌。因此,通过这一原理,利用农杆菌介导将外源DNA片段转化至靶细胞中已成为研究植物、真菌甚至动物功能基因的一种常用反向遗传学技术。
CRISPR/Cas是一种基因定点编辑技术,在该系统中通过形成具有引导作用的sgRNA(single guide RNA)引导核酸酶Cas9蛋白在靶位点切割双链DNA,再通过非同源末端连接进行DNA双链断裂修复,在此修复过程中可进行序列编辑或小片段缺失而造成基因序列的改变从而起到对基因的编辑或敲除。
迄今为止,在许多病原真菌中尚无法通过转化原生质体的方法进行有效的遗传操作,只能依赖农杆菌介导的转化导入外源DNA片段,而农杆菌介导的外源DNA片段转化具有随机性,无法对特定位点进行精确插入。且在基因敲除后的基因互补验证中,有的物种由于缺乏相应的基因互补技术而无法进行基因互补验证;目前在病原真菌中均采取随机插入互补基因片段的方法进行基因互补,若基因互补时互补片段随机插入在另一功能基因的DNA编码区时则会影响其他基因功能而无法达到准确恢复所敲除的基因功能来研究基因功能的目的。因此,有必要开发一套高效的定点插入基因互补技术,为研究病原真菌的基因功能及其致病机制提供便利。
发明内容
本发明要解决的技术问题是提供一种真菌基因定点插入突变的近原位回补方法,以实现互补基因DNA片段在设定的基因组位点的准确插入,使目标基因功能恢复,从而为研究病原真菌功能基因组学提供重要工具。
为解决上述技术问题,本发明采用以下技术方案:
真菌基因定点插入突变的近原位回补方法,是将靶标位点经过碱基更改但氨基酸序列不变的互补基因片段和U6启动子驱动携带抗性基因特异识别序列的sgRNA表达盒与根癌农杆菌T-质粒整合,构建以诺尔丝菌素为抗性筛选标记的根癌农杆菌介导的病原真菌基因定点互补载体;用该互补载体转化病原真菌基因插入失活突变体的孢子,依赖突变体内所携带的Cas9对靶标位点进行切割,从而实现将互补基因片段准确插入突变体的抗性基因靶标位点。
上述真菌基因定点插入突变的近原位回补方法,互补基因片段经In-fusion技术重组至带有携带抗性基因特异识别序列的sgRNA表达盒及gapd基因启动子驱动的诺尔丝菌素抗性基因的双元载体中,再由携带该双元载体的根癌农杆菌介导转化携带Cas9基因的插入失活突变体的孢子,从而达到对真菌基因组的定点互补。
突变体所携带的抗性基因为潮霉素抗性基因,以及所有来源于敲除突变体所携带的作为选择标记的抗性基因。
病原真菌为甘蔗鞭黑穗菌。
互补基因片段为mfa2、prf或g827基因,以及其他所有基因敲除突变株的互补基因。
病原真菌基因插入失活突变体的孢子按以下方法制备:使用甘蔗鞭黑穗菌内源snRNA启动子驱动sgRNA表达盒,将CRISPR-Cas9系统与根癌农杆菌T-质粒整合,构建以潮霉素为抗性筛选标记的根癌农杆菌介导的甘蔗鞭黑穗菌基因定点插入载体失活系统;将目标基因的特异识别序列克隆入sgRNA表达盒,用于转化甘蔗鞭黑穗菌担孢子,从而将载体系统的可跳动DNA片段准确插入甘蔗鞭黑穗菌目标基因靶标序列;目标基因为甘蔗鞭黑穗菌JG35野生型菌株的mfa2、prf或g827基因。
病原真菌基因插入失活突变体的孢子按以下方法制备:通过将甘蔗鞭黑穗菌内源U6基因启动子(Ss PU6,SEQ.ID.No.17的碱基序列;Ss U6RNA,SEQ.ID.No.18的碱基序列)与所插入位点靶标序列以及sgRNA序列经Overlapping PCR融合后,经In-fusion技术重组至带有由甘蔗鞭黑穗菌内源gapd基因启动子驱动的Cas9基因及潮霉素抗性基因的双元载体中;再由携带该双元载体的根癌农杆菌介导转化甘蔗鞭黑穗菌从而达到对甘蔗鞭黑穗菌基因组的定点插入;甘蔗鞭黑穗菌u6基因启动子具有序列表SEQ.ID.No.17的碱基序列。
发明人研究了CRISPR-Cas9介导的基因插入失活及基因互补技术,计划依靠靶向序列引导及农杆菌介导,在病原真菌基因组中定点插入外源片段高效地进行基因敲除,构建目标基因的敲除突变株;并在所获得的敲除突变株中,计划依靠靶向序列引导及农杆菌介导定点互补所敲除基因在靶标位点处经过碱基更改但氨基酸序列不变的DNA片段,构建目标基因的互补突变株。
为此,发明人建立了一套基因定点插入突变方法和基因定点互补方法,其中,基因定点插入突变方法为根癌农杆菌和CRISPR-Cas9介导的基因定点插入突变方法,该法使用U6基因启动子驱动sgRNA表达盒,将CRISPR-Cas9系统与根癌农杆菌T-质粒整合,构建以潮霉素为抗性筛选标记的根癌农杆菌介导的病原真菌基因定点插入突变载体系统;将目标基因的特异识别序列克隆入sgRNA表达盒,将该表达盒连接至基因定点插入突变载体后,将该载体转化真菌孢子,从而将载体系统的可跳动DNA片段准确插入目标基因靶标位点,达到破坏基因功能使目标基因突变失活的目的。基因定点互补方法为真菌基因定点插入突变的近原位回补方法,在对目标基因进行插入突变失活的过程中,Cas9基因和潮霉素抗性基因随T-DNA一同插入到目标基因中,因此在对目标基因进行互补时,可使用携带潮霉素抗性基因特异识别序列的sgRNA表达盒与根癌农杆菌T-质粒整合构建以诺尔丝菌素为抗性筛选标记的基因互补载体系统;将在靶标位点处经过碱基更改但氨基酸序列不变目标互补片段导入该定点互补载体中,用于转化已携带Cas9基因的敲除突变体的孢子,Cas9基因在新导入的携带潮霉素抗性基因特异识别序列的sgRNA的引导下对潮霉素抗性基因靶标序列进行切割,从而将互补DNA片段精确插入潮霉素抗性基因中实现基因定点互补的目的。通过将不同的靶标序列克隆至sgRNA表达盒即可将互补DNA序列定点互补至特定位点中。
通过在甘蔗鞭黑穗菌基因组中进行实验,发明人发现了具有功能的甘蔗鞭黑穗菌u6基因启动子,其可在甘蔗鞭黑穗菌中转录出载体上位于U6启动子下游sgRNA序列,用于在上述基因定点插入失活方法中执行基本的转录功能。
通过在甘蔗鞭黑穗菌JG35野生型菌株中分别对mfa2(mfa2 cds,SEQ.ID.No.21;MFA2,SEQ.ID.No.22)、prf和g827等3个基因进行基因失活,分别构建三个基因的敲除突变株。在敲除mfa2基因时,对随机挑选的具有潮霉素抗性的46个转化子进行PCR鉴定,其中发生外源片段定点插入的转化子为18个,外源片段定点插入率为39%,即靶基因失活率为39%。在敲除prf基因时,对随机挑选的具有潮霉素抗性的23个转化子进行PCR鉴定,其中发生外源片段定点插入的转化子为5个,外源片段定点插入率为21.7%,即靶基因失活率为21.7%。在敲除g827基因时,对随机挑选的具有潮霉素抗性的23个转化子进行PCR鉴定,其中发生外源片段定点插入的转化子为3个,外源片段定点插入率为13%,即靶基因失活率为13%。实验表明,通过根癌农杆菌介导的CRISPR-Cas9定点插入技术可在病原真菌中对目标基因进行定点插入而达到基因失活的目的,进而对基因功能进行研究;而且基因失活效率显著高于目前常用的同源双交换基因打靶的效率。由农杆菌T-DNA/CRISPR/Cas9组合介导的定点插入的这一现象在其他物种中尚无报道。上述高效基因失活系统的建立,为研究病原真菌的功能基因组学提供了重要工具,该系统具有高效性和准确性,方便在病原真菌中进行基因功能的研究。
以甘蔗鞭黑穗菌编码信息素基因mfa2为例,发明人利用农杆菌介导的CRISPR-Cas9定点插入技术在mfa2基因中定点插入整合有CRISPR-Cas9的T-DNA序列,破坏了mfa2基因,从而导致该基因功能的缺失(图4)。甘蔗鞭黑穗菌mfa2基因编码信息素,信息素在单倍体菌株配合过程中具有重要的作用。正负交配型的野生型甘蔗鞭黑穗菌JG35和JG36未配合是呈酵母状(图6B),两者可以通过配合在平板上形成白色绒毛状菌落(图6C),而被外源片段插入后的mfa2基因功能丧失从而导致转化子无法与野生型JG36菌株配对形成白色绒毛状菌落(图6A)。发明人通过设计引物对转化子进行筛选鉴定(图5),可明确外源片段插入的方向(图7),由于甘蔗鞭黑穗菌无法通过原生质体转化的方法导入外源基因片段,且传统的由农杆菌介导的转化均是随机插入。因此,发明人通过整合农杆菌T-DNA/CRISPR/Cas9能够实现在病原真菌中定点插入外源DNA片段使目标基因失活,为研究病原真菌功能基因组学提供了重要工具。
以上述研究成果为基础,发明人通过在甘蔗鞭黑穗菌Δmfa2突变株中对mfa2基因进行基因互补,构建Δmfa2的基因互补株,建立了一种基因定点互补方法。以甘蔗鞭黑穗菌编码信息素基因mfa2为例,本发明利用农杆菌介导的CRISPR-Cas9定点互补技术在hph基因中定点插入整合有在靶标位点处经过碱基更改但氨基酸序列不改变的mfa2基因序列及其内源启动子的T-DNA序列,破坏了hph基因的同时插入mfa2及其内源启动子,从而导致hph基因功能的缺失和mfa2基因的功能修复(图10)。在互补mfa2基因及其内源启动子时,对随机挑选的具有诺尔丝菌素抗性的190个回补转化子进行潮霉素及PCR鉴定,其中hph基因被互补片段定点插入失活的转化子为160个,即靶基因失活率为84.2%。在这190个具有诺尔丝菌素抗性的互补转化子中,170个转化子能恢复mating功能,互补效率为89.5%,其中外源片段定点插入至潮霉素靶标位点且恢复mating功能的互补的转化子为148个,定点互补率为77.9%。在Δmfa2菌株中由于mfa2基因序列回补后mfa2基因功能得到修复从而导致转化子恢复与野生型JG36菌株配对形成白色绒毛状菌落(图13)。本发明通过潮霉素和诺尔丝菌素对互补转化子进行抗性筛选,并通过设计引物对互补转化子进行筛选鉴定(图10),可明确回补片段插入的方向,而传统的基因互补是通过互补片段随机插入实现,但在随机插入的同时具有破坏基因导致其他基因失活的可能。因此,本发明通过整合农杆菌T-DNA和目标互补DNA片段能够实现在携带Cas9基因的基因插入失活突变体中定点互补DNA片段,使目标基因功能恢复,为研究病原真菌功能基因组学提供了重要工具。
附图说明
图1是pLS-HCas9质粒图谱。
图2是pSgRNA-SsU6质粒图谱。
图3是pSgRNA-SsU6质粒和pLS-HCas-mfa2质粒的电泳图,图中:A)pSgRNA-SsU6质粒构建,M:GeneRuler 1Kb plus;1:线性pSgRNA Vector;2:SsPu6;3:pSgRNA-SsU6;B)pLS-HCas-mfa2质粒构建,M:GeneRuler 1Kb plus;1:线性pLS-HCas9vector;2:SspU6-mfa2-sgRNA;3:pLS-HCas9-mfa2。
图4是pLS-HCas9-mfa2定点插入甘蔗鞭黑穗菌mfa2基因的示意图。
图5是定点插入的PCR鉴定方法示意图。
图6是农杆菌介导的CRISPR-Cas9定点插入失活甘蔗鞭黑穗菌mfa2基因结果图。
图7是转化子的PCR验证图,图中:A)以转化子基因组DNA为模板,M:GeneRuler1Kbplus;1-17:转化子;B)以转化子基因组DNA为模板,M:GeneRuler 1Kb plus;1-17:转化子。
图8是Δmfa2、Δprf及Δg827转化子PCR测序比对图。
图9是pNGR-com质粒图谱。
图10是pNGR-com-mfa2定点互补目标片段及PCR鉴定的示意图。
图11是互补转化子的PCR验证图,图中:A)分别以Δmfa2和转化子基因组DNA为模板,以引物Hph F和hph1-R扩增,M:GeneRuler 1Kb plus;B)分别以Δmfa2和转化子基因组DNA为模板,以引物Cmfa2F和Cmfa2R扩增,M:GeneRuler 1Kb plus;C)分别以Δmfa2和转化子基因组DNA为模板,以引物对GpdF/Cmfa2R和natR01/hph1-R扩增,M:GeneRuler 1Kbplus;。D)分别以Δmfa2和转化子基因组DNA为模板,以引物对GpdF/natR01和Cmfa2R/hph1-R扩增,M:GeneRuler 1Kb plus。
图12是互补mfa2转化子PCR测序比对图。
图13是农杆菌介导的CRISPR-Cas9定点互补mfa2基因结果图。
具体实施方式
本发明真菌基因定点插入突变的近原位回补方法,是将在靶标位点处经过碱基更改但氨基酸序列不变的互补基因片段和U6启动子驱动携带抗性基因特异识别序列的sgRNA表达盒与根癌农杆菌T-质粒整合,构建以诺尔丝菌素为抗性筛选标记的根癌农杆菌介导的病原真菌基因定点互补载体;用该互补载体转化病原真菌基因插入失活突变体的孢子,依赖基因插入失活突变体内所携带的Cas9对靶标位点进行切割,从而实现将互补基因片段准确插入突变体的抗性基因靶标序列。其中,将在靶标位点处经过碱基更改但氨基酸序列不变的互补基因片段经In-fusion技术重组至带有携带抗性基因特异识别序列的sgRNA表达盒及gapd基因启动子驱动的诺尔丝菌素抗性基因的双元载体中,再由携带该双元载体的根癌农杆菌介导转化携带Cas9基因的插入失活突变体的孢子,从而达到对真菌基因组的定点互补。
为进一步阐明上述发明构思,以甘蔗鞭黑穗菌信息素基因mfa2为例进行说明。下述实施例中的实验方法,如无特别说明,均为常规方法;所用实验材料和试剂,如无特别说明,均可通过商业途径获得。实施例中的甘蔗鞭黑穗菌野生型菌株和农杆菌菌株AGL1从广西大学获得。
一、具体试验操作步骤
1.U6启动子驱动的携带目标基因靶标的sgRNA的获得
以pSgRNA-SsU6(SEQ.ID.No.19)质粒为模板,在一个反应中使用4种引物:U-F(5’-ctccgttttacctgtggaatcg-3’,SEQ.ID.No.1)和gR-R(5’-cggaggaaaattccatccac-3’,SEQ.ID.No.2)各0.2μM,SsU6Tmfa2-(5’-ggacggaggcagcaacagtcgagggtaaaatctgattgtatg-3’,SEQ.ID.No.3)和gRTmfa2+(5’-actgttgctgcctccgtccgttttagagctagaaat-3’,SEQ.ID.No.4)各0.1μM。30个循环:94℃10s,58℃15s,68℃20s。
2.将上步PCR产物稀释10倍后取2微升为模板,使用引物对:U-Fs BamHI in(5’-ctatgttactagaggatcccggaatgatctacaaagcgttcttc-3’,SEQ.ID.No.5)和gR-RHindIII in(5’-taaccatggtaccaagcttattccatccactccaagctcttg-3’,SEQ.ID.No.6),用高保真DNA聚合酶进行PCR扩增,PCR扩增程序:98℃预变性2min,98℃变性10sec,60℃退火15sec,72℃延伸20sec,进行30个循环;最后72℃延伸5min。电泳检测:取5μl扩增产物,加入1μl的6×Loading buffer混匀,点样于0.8%的琼脂糖凝胶(含0.05μL/mL Goldview)上样孔中,用0.5×TBE缓冲液在3-5V/em电压条件下电泳30min,于凝胶成像系统下观察分析。PCR反应液组成(50μL体系)如下:
3.采用胶回收试剂盒对第2步PCR产物进行胶回收纯化。
4.采用限制性内切酶BamHI和HindIII酶切双元载体pLS-HCas9(SEQ.ID.No.20),采用片段纯化试剂盒对酶切产物进行纯化回收。酶切反应液组成(100μL体系)如下:
5.采用In-fusion方法对回收的sgRNA表达盒片段与纯化的线性双元载体pLS-HCas9进行连接,反应体系如下:
5×In-fusion 1μl
回收sgRNA表达盒片段 3μl
纯化的线性pLS-HCas9载体 1μl
50℃反应30分钟,立即置于冰上。
6.反应产物转化DH5α感受态细胞:在超净台内将第5步所得连接产物加入感受态细胞中,冰上放置30min后,于42℃热击45秒后立即置于冰上冷却2分钟。在超净台内向EP管中加入1ml无菌SOC液体培养基,将EP管置于37℃摇床,200rpm摇动1小时后,将菌体涂布到含壮观霉素终浓度为100μg/ml的LA平板中,置于37℃倒置培养过夜。
7.通过菌落PCR对转化子进行筛选。采用引物对L1F(5’-gcatgacgttatttatgaggtggg-3’,SEQ.ID.No.7)和L1R(5’-gttatctagctggcgaaagggg-3’,SEQ.ID.No.8),以转化子为模板进行菌落PCR扩增后,取1μl产物进行电泳检测,扩增出716bp大小的转化子为阳性转化子。对PCR产物进行电泳检测后将阳性转化子进行测序确保无碱基突变。PCR反应液组成(20μL体系):
8.提取序列完全正确的转化子质粒DNA。
9.农杆菌感受态的制备:配制10%(W/V)的甘油,常规灭菌后置于4℃冰箱保存待用。在含利福平50μg/mL的LB培养基平板上划线活化根癌农杆菌菌株AGL1,置于28℃培养,2天后长出单菌落,用无菌接种环将单菌落接种至含有5mL LB液体培养基(利福平终浓度为50μg/mL)的50mL离心管中,28℃、200rpm振荡培养2天。按1%的比例转接至无菌三角瓶中,置于28℃、200rpm振荡培养4-6h至OD600 0.4-0.5左右,冰上冷却10min使细胞停止生长后,于4℃、4000rpm离心收集菌体,用预冷的10%甘油轻轻地重新悬浮菌体,冰上放置5min后,4℃、4000rpm再次离心,弃上清,重复甘油悬浮、离心一次,最后用1-2mL预冷的10%甘油轻轻地重新悬浮菌体沉淀,分装至无菌1.5mL EP管中,每管50μL,置于-80℃保存备用。
10.电脉冲法转化根癌农杆菌:将上述甘油法制得的根癌农杆菌感受态细胞在冰上融化后,加入1-2μL质粒DNA,将加好DNA的农杆菌用微量移液器的吸头轻混匀后加入到无菌脉冲杯中,将脉冲杯置于电脉冲仪上,电脉冲仪设定为2.5kV,电击5ms后迅速将1mL的SOC培养基加入脉冲杯中,混匀,转入2mL的无菌离心管中,置于28℃、200rpm摇床培养1小时后,涂布到含有75μg/mL壮观霉素和50μg/mL利福平的LB选择性培养基平板上,置于28℃恒温培养箱倒置培养2天。
11.阳性农杆菌转化子的筛选:采用引物对L1F(5’-gcatgacgttatttatgaggtggg-3’)和L1R(5’-gttatctagctggcgaaagggg-3’),以农杆菌转化子为模板进行PCR扩增后,取3μl产物进行电泳检测,扩增出716bp大小的转化子为阳性转化子。PCR反应液组成与第7步相同。
12.农杆菌的诱导培养
基本培养基(minimal media,MM):2.05g K2HP04,1.45g KH2P04,0.5g NH4N03,0.01g CaCl2,2g Glucose,0.3g(NH4)S04,0.001g FeS04,5ml Z-buffer(每种成分各0.01%ZnSO4·7H2O,CuSO4·5H2O,H3BO3,MnSO4·H2O和Na2MoO4·2H2O),加双蒸水定容至1000mL,pH6.7-7.0。
诱导培养基(induce media,IM):7.808g MES(2-(N-吗啡啉)乙磺酸),1gGlucose,1.45g KH2PO4,0.5g NH4NO3,0.01g CaCl2,0.6g MgSO4·7H2O,0.3g NaCl,0.5g(NH4)SO4,5ml Z-buffer,调pH值到5.6,双蒸水定容至1000mL。固体IM培养基则加入2%的琼脂。高温灭菌后备用。
将活化后的携带双元载体pLS-HCas9-mfa2的根瘤农杆菌AGL1接种到含有75μg/mL壮观霉素和50μg/mL利福平的MM培养基中,28℃、200rpm培养至OD600为0.8-1.2。用IM培养基将培养物稀释至OD600为0.15,加入200μM的AS,于28℃、200rpm且避光的条件下继续培养至OD600为0.5左右即可用于共培养。
13.甘蔗鞭黑粉菌的准备
YEPS培养基:酵母提取物10g,蛋白胨20g,蔗糖20g,双蒸水定容至1000mL,固体YEPS培养基则加入2%的琼脂,高温灭菌后备用。将甘蔗鞭黑粉菌野生型单倍体菌株从-80℃冰箱中取出,在YEPS平板上划线活化,挑取菌体至YEPS液体培养基中28℃、200rpm培养过夜,用YEPS将培养物稀释至OD600为0.15后继续培养10-12h至OD600为1.0左右即可用于共培养。
14.根癌农杆菌与甘蔗鞭黑粉菌的共培养
将于IM诱导培养至OD600为0.5的携带双元载体pLS-HCas9-mfa2的AGL1菌液与等体积的OD600为1.0的甘蔗鞭黑粉菌野生型单倍体菌株培养液混合,将混合好的菌液均匀涂布在预先铺好混合纤维素微孔滤膜(孔径为0.45μm)的IM培养基平板(含有200μM的AS)上,在28℃下避光共培养48-72h后,将滤膜转移至含300μg/mL头孢噻肟钠和200μg/mL潮霉素的YEPS选择性平板上,于28℃倒置培养8-12天以获得转化子。
15.甘蔗鞭黑穗菌阳性转化子的筛选:将滤膜上的转化子转接至含300μg/mL头孢噻肟钠和200μg/mL潮霉素的YEPS选择性平板上,于28℃倒置培养1-2天后,挑取能正常生长的转化子进行菌落PCR预处理。
16.向PCR管中加入20μl Mithy Prep for DNA,用无菌枪头挑取适量菌体加入裂解液中并混匀,95℃处理10分钟后,12000rpm离心3分钟。
17.取上步上清2μl作为PCR模板。分别用3对引物进行扩增:
1)mfa2C1F(5’-tgcctgaattgctccgcttgtc-3’,SEQ.ID.No.9)和mfa2C1R(5’-tggctctgtttctcacgagatcacg-3’,SEQ.ID.No.10),
2)HygR01(5’-tgtatggagcagcagacgcgctac-3’,SEQ.ID.No.11)和mfa2C1R(5’-tggctctgtttctcacgagatcacg-3’),
3)HygR01和mfa2C 1F(5’-tgcctgaattgctccgcttgtc-3’)。
对PCR产物进行电泳检测。筛选第一轮无法扩增同时第二轮扩增出大小约为1000bp的转化子,或第一轮无法扩增同时第3轮扩增出大小约为100bp的转化子。
PCR反应液组成(20μl体系):
18.将扩增出的1000bp的片段进行测序鉴定后则确定目标基因敲除成功。
19.U6启动子驱动的携带hph基因靶标的sgRNA的获得:以pSgRNA-SsU6(SEQ.ID.No.19)质粒为模板,在一个反应中使用4种引物:U-F(5’-ctccgttttacctgtggaatcg-3’,SEQ.ID.No.1)和gR-R(5’-cggaggaaaattccatccac-3’,SEQ.ID.No.2)各0.2μM,SsU6Thph-(5’-tccgagagctgcatcaggtcgagggtaaaatctgattgtatg-3’,SEQ.ID.No.35)和gRThph+(5’-acctgatgcagctctcggagttttagagctagaaatag-3’,SEQ.ID.No.36)各0.1μM。用高保真DNA聚合酶扩增,扩增程序与第1步相同。
20.将上步PCR产物稀释10倍后取2微升为模板,使用引物对:ngU-Fs BamHI in(5’-cgactctagaggatcccttaagcggaatgatctacaaagcgttcttc-3’,SEQ.ID.No.37)和NGgR-RBamHI in(5’-aatcactaggggatccATTCCATCCACTCCAAGCTCTTG-3’,SEQ.ID.No.38),用高保真DNA聚合酶进行PCR扩增,PCR扩增程序与PCR反应液组成与第2步相同。
21.采用胶回收试剂盒对第20步PCR产物进行胶回收纯化。
22.采用限制性内切酶BamHI酶切双元载体pNGR,采用片段纯化试剂盒对酶切产物进行纯化回收。酶切反应液组成(100μL体系)如下:
23.采用In-fusion方法对回收的hph-sgRNA表达盒片段与纯化的线性双元载体pNGR进行连接,反应体系如下:
5×In-fusion 1μl
回收hph-sgRNA表达盒片段 3μl
纯化的线性pNGR载体 1μl
50℃反应30分钟,立即置于冰上。
24.反应产物转化DH5α感受态细胞:具体实验步骤与第6步相同。
25.通过菌落PCR对转化子进行筛选。采用引物对N1F(5’-cacatacaaatggacgaacgg-3’,SEQ.ID.No.39)和N1R(5’-ctagatctcgctgtttcttcggtc-3’,SEQ.ID.No.40),以转化子为模板进行菌落PCR扩增后,取1μl产物进行电泳检测,扩增出974bp大小的转化子为阳性转化子。对PCR产物进行电泳检测后将阳性转化子进行测序确保无碱基突变。PCR反应液组成第7步相同
26.提取序列完全正确的转化子质粒DNA即为真菌基因定点插入突变的近原位互补载体pNGR-com(SEQ.ID.No.33)。
27.互补片段的获得:以甘蔗鞭黑穗菌野生型菌株JG35基因组为模板,分别以两对引物Cmfa2F(5’-gctagcccattgggcacaccag-3’)和newmfa2R(5’-ttgcacacaggcagcaacagtttcgaagatgaacatggtgaattggtaaag-3’,SEQ.ID.No.41),newmfa2F(5’-gaaactgttgctgcctgtgtgcaagccattgtttctgttaacgagc-3’,SEQ.ID.No.42)和Cmfa2R(5’-ttaggccacggtgcagtagactg-3’,SEQ.ID.No.28)扩增30个循环:94℃10s,58℃15s,68℃20s。对两个目的片段进行胶回收后,将两个回收片段进行融合PCR反应,扩增15个循环:94℃30s,58℃30s,68℃30s。所得产物中的mfa2基因CDS中的13bp至36bp的序列由5’-gagactgttgctgcctccgtccag-3’更换为5’-gaaactgttgctgcctgtgtgcaa-3’,但氨基酸序列并未改变,防止被敲除mfa2基因时插入到基因组中的mfa2靶标序列识别。
28.将上步PCR产物稀释10倍后取2微升为模板,使用引物对:C mfa2PstI F in(5’-ctaagcttgcatgcctgcaggctagcccattgggcacaccag-3’,SEQ.ID.No.23)和C mfa2PstIRin(5’-cctctagagtcgacctgcagttaggccacggtgcagtagactgc-3’,SEQ.ID.No.24),用高保真DNA聚合酶进行PCR扩增,PCR扩增程序:98℃预变性2min,98℃变性10sec,60℃退火15sec,72℃延伸20sec,进行30个循环;最后72℃延伸5min。电泳检测与第2步相同。PCR反应液组成与第7步相同。
29.采用胶回收试剂盒对第28步PCR产物即互补片段(SEQ.ID.No.34)进行胶回收纯化。
30.采用限制性内切酶 PstI酶切双元载体pNGR-com,采用片段纯化试剂盒对酶切产物进行纯化回收。酶切反应液组成(100μL体系)如下:
31.采用In-fusion方法将互补片段与纯化的线性双元载体pNGR-com进行连接,构建pNGR-com-mfa2反应体系如下:
5×In-fusion 1μl
回收互补片段 1μl
纯化pNGR-com载体 3μl
50℃反应30分钟,立即置于冰上。
32.反应产物转化DH5α感受态细胞:具体实验步骤与第6步相同。
33.通过菌落PCR对转化子进行筛选。采用引物对C mfa2 PstI F in(5’-ctaagcttgcatgcctgcaggctagcccattgggcacaccag-3’)和C mfa2PstI R in(5’-cctctagagtcgacctgcagttaggccacggtgcagtagactgc-3’),以转化子为模板进行PCR扩增后,取1μl产物进行电泳检测,扩增出944bp大小的转化子为阳性转化子。对PCR产物进行电泳检测后将阳性转化子进行测序确保无碱基突变。PCR反应液组成与第7步相同。
34.提取序列完全正确的转化子质粒DNA。
35.电脉冲法转化根癌农杆菌:具体实验步骤与第10步相同。
36.阳性农杆菌转化子的筛选:采用引物对C mfa2PstI F in(5’-ctaagcttgcatgcctgcaggctagcccattgggcacaccag-3’)和C mfa2PstI R in(5’-cctctagagtcgacctgcagttaggccacggtgcagtagactgc-3’),以农杆菌转化子为模板进行PCR扩增后,取3μl产物进行电泳检测,扩增出944bp大小的转化子为阳性转化子。PCR反应液组成PCR反应液组成与第11步相同。
37.农杆菌的诱导培养:将活化后的携带双元载体pNGRS-com-mfa2的根瘤农杆菌AGL1接种到含有75μl/mL壮观霉素和50μg/mL利福平的MM培养基中,28℃、200rpm培养至OD600为0.8-1.2。用IM培养基将培养物稀释至OD600为0.15,加入200μM的AS,于28℃、200rpm且避光的条件下继续培养至OD600为0.5左右即可用于共培养。
38.甘蔗鞭黑粉菌Δmfa2的准备:将由根癌农杆菌和CRISPR-Cas9介导的基因定点插入失活方法获得的甘蔗鞭黑穗菌mfa2基因插入突变株甘蔗鞭黑粉菌菌株Δmfa2从-80℃冰箱中取出,在YEPS平板上划线活化,挑取菌体至YEPS液体培养基中28℃、200rpm培养过夜,用YEPS将培养物稀释至OD600为0.15后继续培养10-12h至OD600为1.0左右即可用于共培养。
39.根癌农杆菌与甘蔗鞭黑粉菌的共培养:将于IM诱导培养至OD600为0.5的携带双元载体pNGRS-com-mfa2的AGL1菌液与等体积的OD600为1.0的Δmfa2担孢子培养液混合,将混合好的菌液均匀涂布在预先铺好混合纤维素微孔滤膜(孔径为0.45μm)的IM培养基平板(含有200μM的AS)上,在28℃下避光共培养48-72h后,将滤膜转移至含300μg/mL头孢噻肟钠和60μg/mL诺尔丝菌素的YEPS选择性平板上,于28℃倒置培养8-12天以获得转化子。
40.甘蔗鞭黑穗菌互补阳性转化子的筛选:将滤膜上的转化子同时转接至含300μg/mL头孢噻肟钠和60μg/mL诺尔丝菌素的YEPS选择性平板上以及转接至含300μg/mL头孢噻肟钠和200μg/mL潮霉素的YEPS选择性平板上,于28℃倒置培养1-2天后,挑取在含诺尔丝菌素的YEPS选择性平板上能正常生长而不能在含潮霉素的YEPS选择性平板上正常生长的转化子进行菌落PCR预处理。
41.向PCR管中加入20μl Mithy Prep for DNA,用无菌枪头挑取适量菌体加入裂解液中并混匀,95℃处理10分钟后,12000rpm离心3分钟。
42.取上步上清2μl作为PCR模板。PCR反应液体系与第17步相同,分别用6对引物进行扩增,
1)Hph F(5’-atgaaaaagcctgaactcaccgcg-3’,SEQ.ID.No.25)和hph1-R
(5’-ggtcaagaccaatgcggagc-3’,SEQ.ID.No.26),
2)Cmfa2F(5’-gctagcccattgggcacaccag-3’,SEQ.ID.No.27)和Cmfa2R
(5’-ttaggccacggtgcagtagactg-3’,SEQ.ID.No.28),
3)GpdF(5’-gattagatcttgctgat-3’,SEQ.ID.No.29)和Cmfa2R,
4)natR01(5’-cggactcccggacgttcgtc-3’,SEQ.ID.No.30)和hph1-R
(5’-ggtcaagaccaatgcggagc-3’),
5)GpdF(5’-gattagatcttgctgat-3’)和natR01(5’-cggactcccggacgttcgtc-3’),
6)Cmfa2R Cmfa2R(5’-ttaggccacggtgcagtagactg-3’)和hph1-R
(5’-ggtcaagaccaatgcggagc-3’):
对PCR产物进行电泳检测。筛选第1对引物无法扩增同时第2对引物扩增出大小为924bp片段且第3、4对引物扩增出大小为1686bp和1676bp片段的转化子,或第1对引物无法扩增同时第2对引物扩增出大小为924bp片段且第5、6对引物扩增出大小为1624bp和1738bp片段的转化子。
二、试验结果
如图1至图11。其中,
图3A为pSgRNA-SsU6质粒构建,使用引物SsPu6 F in(5’-atcggcagcaaaggatacgatcgtcccgacgatgctc-3’,SEQ.ID.No.12)和Ss Pu6 R in(5’-tcttcagaggtctctcgagggtaaaatctgattgtatgag-3’,SEQ.ID.No.13)扩增SsPu6,使用引物pSgRNA-F(5’-agagacctctgaagataacatac,SEQ.ID.No.14)和pSgRNA-R(5’-tcctttgctgccgattccacag-3’,SEQ.ID.No.15)扩增pSgRNA Vector。
图3B为pLS-HCas-mfa2质粒构建,使用引物U-F(5’-ctccgttttacctgtggaatcg)、gR-R(5’-cggaggaaaattccatccac)、SsU6Tmfa2-(5’-ggacggaggcagcaacagtcgagggtaaaatctgattgtatg)和gRTmfa2+(5’-actgttgctgcctccgtccgttttagagctagaaat)扩增SspU6-mfa2-sgRNA。
图4显示,pLS-HCas9与基因mfa2(SEQ.ID.No.21)靶标序列的sgRNA表达盒连接后构建成pLS-HCas9-mfa2双元载体,该双元载体转化甘蔗鞭黑穗菌后,在菌株体内表达Cas9核酸酶,并由sgRNA引导Cas9核酸酶在与靶标序列互补的DNA上切割双链DNA,双元载体中的T-DNA片段则插入该DNA缺口,并通过非同源末端连接进行修复。最终导致T-DNA片段插入mfa2基因中造成mfa2基因功能的缺失。
图5显示,双元载体中的T-DNA片段可以正向或反向两种方式插入基因组中,均可以造成目标基因失活。在转化完成后需对转化子进行鉴定。通过裂解液处理转化子后,离心取上清作为模板可直接进行PCR验证。未发生外源片段插入的转化子和野生型菌株可由mfa2C1F(5’-tgcctgaattgctccgcttgtc-3’,SEQ.ID.No.31)和mfa2C1R(5’-tggctctgtttctcacgagatcacg-3’,SEQ.ID.No.32)为引物扩增出1168bp大小片段,而发生外源片段定点插入的转化子则无法扩增;外源片段正向定点插入的转化子可由引物HygR01(5’-tgtatggagcagcagacgcgctac-3’)和mfa2C1R(5’-tggctctgtttctcacgagatcacg-3’)扩增约1000bp大小片段,可由引物CasR01(5’-ggataccgaccttccgcttcttc-3’,SEQ.ID.No.16)和mfa2C1F(5’-tgcctgaattgctccgcttgtc-3’)扩增约1000bp大小片段,而未发生外源片段定点插入的转化子和野生型菌株则无法扩增;外源片段反向定点插入的转化子可由引物HygR01(5’-tgtatggagcagcagacgcgctac-3’)和mfa2C1F(5’-tgcctgaattgctccgcttgtc-3’)扩增约1000bp大小片段,可由引物CasR01(5’-ggataccgaccttccgcttcttc-3’)和mfa2C1R(5’-tggctctgtttctcacgagatcacg-3’)扩增约1000bp大小片段,而未发生外源片段定点插入的转化子和野生型菌株则无法扩增。
图6为农杆菌介导的CRISPR-Cas9定点插入失活甘蔗鞭黑穗菌mfa2基因结果图,A)部分转化子丧失与异性菌株G36配合的能力;B)野生型甘蔗鞭黑穗菌JG35菌株呈酵母状;C)野生型甘蔗鞭黑穗菌菌株JG35与JG36在培养基上配合可形成白色绒毛状菌落。由甘蔗鞭黑穗菌mfa2基因编码的信息素与甘蔗鞭黑穗菌的有性配合密切相关,破坏甘蔗鞭黑穗菌mfa2基因后,突变体Δmfa2不能与野生型JG36菌株配合,不能形成白色绒毛状菌落。
图7转化子的PCR验证中,A)以转化子基因组DNA为模板,引物mfa2C1F(5’-tgcctgaattgctccgcttgtc-3’)和HygRO1(5’-tgtatggagcagcagacgcgctaC-3’)扩增,外源片段正向插入的转化子扩增出约1kb大小的片段,野生型菌株JG35和外源片段反向插入的转化子则无法扩增出该条带。B)以转化子基因组DNA为模板,引物mfa2C1R(5’-tggctctgtttctcacgagatcacg-3’)和HygR01(5’-tgtatggagcagcagacgcgctaC-3’)扩增,外源片段反向插入的转化子扩增出约1kb大小的片段,野生型菌株JG35和外源片段正向插入的转化子则无法扩增出该条带。
图8显示,经PCR产物测序比对,A)在Δmfa2转化子中,T-DNA片段插入到mfa2基因的特异靶标位点。B)在Δprf转化子中,T-DNA片段插入到prf基因的特异靶标位点。C)在Δg827转化子中,T-DNA片段插入到g827基因的特异靶标位点。
图10显示,pNGR-com与由碱基修改过的mfa2及其启动子序列组成的互补片段连接后构建成pNGR-com-mfa2双元载体,该双元载体转化由根癌农杆菌和CRISPR-Cas9介导的基因定点插入失活方法获得的Δmfa2后,在菌株体内表达Cas9核酸酶,并由sgRNA引导Cas9核酸酶在与潮霉素靶标序列互补的DNA上切割双链DNA,互补双元载体中的携带有互补DNA片段的T-DNA则插入该DNA缺口,并通过非同源末端连接进行修复。最终导致互补DNA片段插入潮霉素抗性基因hph中造成hph基因功能的缺失以及mfa2基因的互补。
图11显示,互补双元载体中的T-DNA片段可以正向或反向两种方式插入缺失突变体基因组中,均可以造成hph基因失活及mfa2基因的互补。在转化完成后需对转化子进行鉴定。通过裂解液处理转化子后,离心取上清作为模板可直接进行PCR验证。Δmfa2菌株可由HphF(5’-atgaaaaagcctgaactcaccgcg-3’)和hph1-R(5’-ggtcaagaccaatgcggagc-3’)为引物扩增出817bp大小片段,而发生外源片段定点互补的转化子则无法扩增,表明如h基因被互补片段插入失活;发生外源片段互补的转化子可由引物Cmfa2 F(5’-gctagcccattgggcacaccag-3’)和Cmfa2R(5’-ttaggccacggtgcagtagactg-3’)扩增出924bp大小片段,而Δmfa2则无法扩增,表明互补DNA片段插入到缺失突变体基因组中;互补DNA片段正向定点互补的转化子可由引物GpdF(5’-gattagatcttgctgat-3’)和Cmfa2R(5’-ttaggccacggtgcagtagactg-3’)扩增1686bp大小片段,可由引物natR01(5’-cggactcccggacgttcgtc-3’)和hph1-R(5’-ggtcaagaccaatgcggagc-3’)扩增1676bp大小片段,而Δmfa2则无法扩增;互补DNA片段反向定点插入的转化子可由引物GpdF(5’-gattagatcttgctgat-3’)和natR01(5’-cggactcccggacgttcgtc-3’)扩增1624bp大小片段,可由引物Cmfa2R(5’-ttaggccacggtgcagtagactg-3’)和hph1-R(5’-ggtcaagaccaatgcggagc-3’)扩增1738bp大小片段,而Δmfa2则无法扩增;
图12显示,经PCR产物测序比对,互补DNA片段插入到潮霉素抗性基因的特异靶标位点。
图13为农杆菌介导的CRISPR-Cas9定点互补mfa2基因结果图,互补转化子恢复与异性菌株JG36配合的能力,在培养基上配合可形成白色绒毛状菌落。
SEQUENCE LISTING
<110> 广西大学
<120> 真菌基因定点插入突变的近原位回补方法
<130> 真菌基因定点插入突变的近原位回补方法
<160> 42
<170> PatentIn version 3.3
<210> 1
<211> 22
<212> DNA
<213> 人工序列
<400> 1
ctccgtttta cctgtggaat cg 22
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<400> 2
cggaggaaaa ttccatccac 20
<210> 3
<211> 42
<212> DNA
<213> 人工序列
<400> 3
ggacggaggc agcaacagtc gagggtaaaa tctgattgta tg 42
<210> 4
<211> 36
<212> DNA
<213> 人工序列
<400> 4
actgttgctg cctccgtccg ttttagagct agaaat 36
<210> 5
<211> 44
<212> DNA
<213> 人工序列
<400> 5
ctatgttact agaggatccc ggaatgatct acaaagcgtt cttc 44
<210> 6
<211> 42
<212> DNA
<213> 人工序列
<400> 6
taaccatggt accaagctta ttccatccac tccaagctct tg 42
<210> 7
<211> 24
<212> DNA
<213> 人工序列
<400> 7
gcatgacgtt atttatgagg tggg 24
<210> 8
<211> 22
<212> DNA
<213> 人工序列
<400> 8
gttatctagc tggcgaaagg gg 22
<210> 9
<211> 22
<212> DNA
<213> 人工序列
<400> 9
tgcctgaatt gctccgcttg tc 22
<210> 10
<211> 25
<212> DNA
<213> 人工序列
<400> 10
tggctctgtt tctcacgaga tcacg 25
<210> 11
<211> 24
<212> DNA
<213> 人工序列
<400> 11
tgtatggagc agcagacgcg ctac 24
<210> 12
<211> 37
<212> DNA
<213> 人工序列
<400> 12
atcggcagca aaggatacga tcgtcccgac gatgctc 37
<210> 13
<211> 40
<212> DNA
<213> 人工序列
<400> 13
tcttcagagg tctctcgagg gtaaaatctg attgtatgag 40
<210> 14
<211> 23
<212> DNA
<213> 人工序列
<400> 14
agagacctct gaagataaca tac 23
<210> 15
<211> 22
<212> DNA
<213> 人工序列
<400> 15
tcctttgctg ccgattccac ag 22
<210> 16
<211> 23
<212> DNA
<213> 人工序列
<400> 16
ggataccgac cttccgcttc ttc 23
<210> 17
<211> 305
<212> DNA
<213> 人工序列
<400> 17
cggaatgatc tacaaagcgt tcttctgcac cgaagtgagg cacttgtttg tggcactgaa 60
acaggctgaa cagcttacag cttcacaggt caggtctgga accggagatt tttttggcgc 120
gcgtctgtgt taggttgtta tacctctctt caaaaggatg gaaaaagatg ttgtgccggc 180
gaatggccag gttattcacg attagcaagc ttggcgaatc ggaggccaat tttcctcagc 240
acccttctaa gtcgtacaag gttttagacg catacgtcta ctcatacaat cagattttac 300
cctcg 305
<210> 18
<211> 130
<212> DNA
<213> 人工序列
<400> 18
gtcggccccg aaaggggctt gacatatgat ctaacaaata aacgatacag agaagattag 60
cattgtcctc agaatatgga tggcaccgtt gatcagaaga gctgctctct ccggagagca 120
aatatgtttt 130
<210> 19
<211> 3849
<212> DNA
<213> 人工序列
<400> 19
ggatccagcg tgggtctcgg ttttagagct agaaatagca agttaaaata aggctagtcc 60
gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt ttcaagagct tggagtggat 120
ggaattttcc tccgttttac ctgtggaatc ggcagcaaag gatacgatcg tcccgacgat 180
gctcgagaac gggcgcggag gcgggggtat tgggtgttga tgaaagttgt ggatggtggt 240
tgacaagaaa cgtgtggagc ggcatgaagc gctgctcgaa ggatctaaag tgcttgacgg 300
cggatgacct gtgaagagga cgaggcaaag ggggaaggag cggggaaggc actgtaccgg 360
tttgggagga acgcttgttg ttcttgttcc ggtagccgag ggtgatctta gcggagagcc 420
aagttagctg tgctgcgctg cttgcaaggc cgggcggttc cagagacaca atgaattggc 480
agtgcggaga agccgatcta gctctttgtt gttgctagtt cagggcggtc ggctttgccg 540
tgttagcgag agcgttgtcg tcgtgaaaaa aggcggggtc aactcgcttg gtgctgtgct 600
gtacagtaca gtagagtcgg gtcagccttg ccgcgtgttg gtctttgtga ggaagagaga 660
aggaatgcgc gcgcggctga acgtgaaaac ggcctaaccg gttccaagca aatttcattt 720
ttctactccg cgcaactcct caccgggctt cgttggttcc ggaggccgtt gccagttgtc 780
ccaaggcagc tttgagatgg ccgacatcct tcagatgcat cgtgctagaa acttctcagt 840
aacaaggcga tcgtgtaatg ctgccggaat gatctacaaa gcgttcttct gcaccgaagt 900
gaggcacttg tttgtggcac tgaaacaggc tgaacagctt acagcttcac aggtcaggtc 960
tggaaccgga gatttttttg gcgcgcgtct gtgttaggtt gttatacctc tcttcaaaag 1020
gatggaaaaa gatgttgtgc cggcgaatgg ccaggttatt cacgattagc aagcttggcg 1080
aatcggaggc caattttcct cagcaccctt ctaagtcgta caaggtttta gacgcatacg 1140
tctactcata caatcagatt ttaccctcga gagacctctg aagataacat actaagcttg 1200
gcactggccg tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat 1260
cgccttgcag cacatccccc tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat 1320
cgcccttccc aacagttgcg cagcctgaat ggcgaatggc gcctgatgcg gtattttctc 1380
cttacgcatc tgtgcggtat ttcacaccgc atatggtgca ctctcagtac aatctgctct 1440
gatgccgcat agttaagcca gccccgacac ccgccaacac ccgctgacgc gccctgacgg 1500
gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 1560
tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgagac gaaagggcct cgtgatacgc 1620
ctatttttat aggttaatgt catgataata atggtttctt agacgtcagg tggcactttt 1680
cggggaaatg tgcgcggaac ccctatttgt ttatttttct aaatacattc aaatatgtat 1740
ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg 1800
agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt 1860
tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt gggtgcacga 1920
gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa 1980
gaacgttttc caatgatgag cacttttaaa gttctgctat gtggcgcggt attatcccgt 2040
attgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa tgacttggtt 2100
gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag agaattatgc 2160
agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac aacgatcgga 2220
ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac tcgccttgat 2280
cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac cacgatgcct 2340
gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac tctagcttcc 2400
cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact tctgcgctcg 2460
gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg tgggtctcgc 2520
ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt tatctacacg 2580
acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat aggtgcctca 2640
ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta gattgattta 2700
aaacttcatt tttaatttaa aaggatctag gtgaagatcc tttttgataa tctcatgacc 2760
aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa 2820
ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca 2880
ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta 2940
actggcttca gcagagcgca gataccaaat actgttcttc tagtgtagcc gtagttaggc 3000
caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca 3060
gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta 3120
ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag 3180
cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt 3240
cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc 3300
acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac 3360
ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac 3420
gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc 3480
tttcctgcgt tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat 3540
accgctcgcc gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag 3600
cgcccaatac gcaaaccgcc tctccccgcg cgttggccga ttcattaatg cagctggcac 3660
gacaggtttc ccgactggaa agcgggcagt gagcgcaacg caattaatgt gagttagctc 3720
actcattagg caccccaggc tttacacttt atgcttccgg ctcgtatgtt gtgtggaatt 3780
gtgagcggat aacaatttca cacaggaaac agctatgacc atgattacga attcgagctc 3840
ggtacccgg 3849
<210> 20
<211> 13925
<212> DNA
<213> 人工序列
<400> 20
ctagtgatta gatcttgctg ataggcaggt ttgcttggag aatgggggga aaagactgac 60
cgaagaaaca gcgagatcta gaagtgataa gcggaaagaa tctgacttgc tgtgatcagc 120
agccaatttt tttttcgttt tttttttttc actccacatc gtcgtgcgtg cacggtctgc 180
atgtgtaaat tgtattcatc gaaagccaca gttgaataca tcagcccgat gtggatttcg 240
aaaaccaatt aatcttggaa ttcacgcgct cagatcagtc catagagtcg acttcggctg 300
tttccaagag cttcttctct gcgaggtggt tgcccgtgtt tctcgctggg aaaaaaggat 360
cgattattat tcgcttctac ctcgctcgca cccttggcct gctgaaggaa acagcgccga 420
gactcggtca cggttgctgg gctccgtgtt gatgctggga cggcgcaaag tggggcccgc 480
gcactcttcg agccaaggac ctcactcttc aagaacaagc gctgtcgcca tcgtcttctt 540
ctttctgctc caccatcgaa tctttctttc tcgtttcgaa accaaaacac tcttccaatg 600
gactataagg accacgacgg agactacaag gatcatgata ttgattacaa agacgatgac 660
gataagatgg ccccaaagaa gaagcggaag gtcggtatcc acggagtccc agcagccgac 720
aagaagtaca gcatcggcct ggacatcggc accaactctg tgggctgggc cgtgatcacc 780
gacgagtaca aggtgcccag caagaaattc aaggtgctgg gcaacaccga ccggcacagc 840
atcaagaaga acctgatcgg agccctgctg ttcgacagcg gcgaaacagc cgaggccacc 900
cggctgaaga gaaccgccag aagaagatac accagacgga agaaccggat ctgctatctg 960
caagagatct tcagcaacga gatggccaag gtggacgaca gcttcttcca cagactggaa 1020
gagtccttcc tggtggaaga ggataagaag cacgagcggc accccatctt cggcaacatc 1080
gtggacgagg tggcctacca cgagaagtac cccaccatct accacctgag aaagaaactg 1140
gtggacagca ccgacaaggc cgacctgcgg ctgatctatc tggccctggc ccacatgatc 1200
aagttccggg gccacttcct gatcgagggc gacctgaacc ccgacaacag cgacgtggac 1260
aagctgttca tccagctggt gcagacctac aaccagctgt tcgaggaaaa ccccatcaac 1320
gccagcggcg tggacgccaa ggccatcctg tctgccagac tgagcaagag cagacggctg 1380
gaaaatctga tcgcccagct gcccggcgag aagaagaatg gcctgttcgg aaacctgatt 1440
gccctgagcc tgggcctgac ccccaacttc aagagcaact tcgacctggc cgaggatgcc 1500
aaactgcagc tgagcaagga cacctacgac gacgacctgg acaacctgct ggcccagatc 1560
ggcgaccagt acgccgacct gtttctggcc gccaagaacc tgtccgacgc catcctgctg 1620
agcgacatcc tgagagtgaa caccgagatc accaaggccc ccctgagcgc ctctatgatc 1680
aagagatacg acgagcacca ccaggacctg accctgctga aagctctcgt gcggcagcag 1740
ctgcctgaga agtacaaaga gattttcttc gaccagagca agaacggcta cgccggctac 1800
attgacggcg gagccagcca ggaagagttc tacaagttca tcaagcccat cctggaaaag 1860
atggacggca ccgaggaact gctcgtgaag ctgaacagag aggacctgct gcggaagcag 1920
cggaccttcg acaacggcag catcccccac cagatccacc tgggagagct gcacgccatt 1980
ctgcggcggc aggaagattt ttacccattc ctgaaggaca accgggaaaa gatcgagaag 2040
atcctgacct tccgcatccc ctactacgtg ggccctctgg ccaggggaaa cagcagattc 2100
gcctggatga ccagaaagag cgaggaaacc atcaccccct ggaacttcga ggaagtggtg 2160
gacaagggcg cttccgccca gagcttcatc gagcggatga ccaacttcga taagaacctg 2220
cccaacgaga aggtgctgcc caagcacagc ctgctgtacg agtacttcac cgtgtataac 2280
gagctgacca aagtgaaata cgtgaccgag ggaatgagaa agcccgcctt cctgagcggc 2340
gagcagaaaa aggccatcgt ggacctgctg ttcaagacca accggaaagt gaccgtgaag 2400
cagctgaaag aggactactt caagaaaatc gagtgcttcg actccgtgga aatctccggc 2460
gtggaagatc ggttcaacgc ctccctgggc acataccacg atctgctgaa aattatcaag 2520
gacaaggact tcctggacaa tgaggaaaac gaggacattc tggaagatat cgtgctgacc 2580
ctgacactgt ttgaggacag agagatgatc gaggaacggc tgaaaaccta tgcccacctg 2640
ttcgacgaca aagtgatgaa gcagctgaag cggcggagat acaccggctg gggcaggctg 2700
agccggaagc tgatcaacgg catccgggac aagcagtccg gcaagacaat cctggatttc 2760
ctgaagtccg acggcttcgc caacagaaac ttcatgcagc tgatccacga cgacagcctg 2820
acctttaaag aggacatcca gaaagcccag gtgtccggcc agggcgatag cctgcacgag 2880
cacattgcca atctggccgg cagccccgcc attaagaagg gcatcctgca gacagtgaag 2940
gtggtggacg agctcgtgaa agtgatgggc cggcacaagc ccgagaacat cgtgatcgaa 3000
atggccagag agaaccagac cacccagaag ggacagaaga acagccgcga gagaatgaag 3060
cggatcgaag agggcatcaa agagctgggc agccagatcc tgaaagaaca ccccgtggaa 3120
aacacccagc tgcagaacga gaagctgtac ctgtactacc tgcagaatgg gcgggatatg 3180
tacgtggacc aggaactgga catcaaccgg ctgtccgact acgatgtgga ccatatcgtg 3240
cctcagagct ttctggcgga cgactccatc gacaacaagg tgctgaccag aagcgacaag 3300
aaccggggca agagcgacaa cgtgccctcc gaagaggtcg tgaagaagat gaagaactac 3360
tggcggcagc tgctgaacgc caagctgatt acccagagaa agttcgacaa tctgaccaag 3420
gccgagagag gcggcctgag cgaactggat aaggccggct tcatcaagag acagctggtg 3480
gaaacccggc agatcacaaa gcacgtggca cagatcctgg actcccggat gaacactaag 3540
tacgacgaga atgacaagct gatccgggaa gtgaaagtga tcaccctgaa gtccaagctg 3600
gtgtccgatt tccggaagga tttccagttt tacaaagtgc gcgagatcaa caactaccac 3660
cacgcccacg acgcctacct gaacgccgtc gtgggaaccg ccctgatcaa aaagtaccct 3720
gcgctggaaa gcgagttcgt gtacggcgac tacaaggtgt acgacgtgcg gaagatgatc 3780
gccaagagcg agcaggaaat cggcaaggct accgccaagt acttcttcta cagcaacatc 3840
atgaactttt tcaagaccga gattaccctg gccaacggcg agatccggaa ggcgcctctg 3900
atcgagacaa acggcgaaac cggggagatc gtgtgggata agggccggga ttttgccacc 3960
gtgcggaaag tgctgagcat gccccaagtg aatatcgtga aaaagaccga ggtgcagaca 4020
ggcggcttca gcaaagagtc tatcctgccc aagaggaaca gcgataagct gatcgccaga 4080
aagaaggact gggaccctaa gaagtacggc ggcttcgaca gccccaccgt ggcctattct 4140
gtgctggtgg tggccaaagt ggaaaagggc aagtccaaga aactgaagag tgtgaaagag 4200
ctgctgggga tcaccatcat ggaaagaagc agcttcgaga agaatcccat cgactttctg 4260
gaagccaagg gctacaaaga agtgaaaaag gacctgatca tcaagctgcc taagtactcc 4320
ctgttcgagc tggaaaacgg ccggaagaga atgctggcct ctgccggcga actgcagaag 4380
ggaaacgaac tggccctgcc ctccaaatat gtgaacttcc tgtacctggc cagccactat 4440
gagaagctga agggctcccc cgaggataat gagcagaaac agctgtttgt ggaacagcac 4500
aagcactacc tggacgagat catcgagcag atcagcgagt tctccaagag agtgatcctg 4560
gccgacgcta atctggacaa agtgctgtcc gcctacaaca agcaccggga taagcccatc 4620
agagagcagg ccgagaatat catccacctg tttaccctga ccaatctggg agcccctgcc 4680
gccttcaagt actttgacac caccatcgac cggaagaggt acaccagcac caaagaggtg 4740
ctggacgcca ccctgatcca ccagagcatc accggcctgt acgagacacg gatcgacctg 4800
tctcagctgg gaggcgacaa aaggccggcg gccacgaaaa aggccggcca ggcaaaaaag 4860
aaaaagtaat cccgatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt 4920
tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat 4980
taacatgtaa tgcatgacgt tatttatgag gtgggttttt atgattagag tcccgcaatt 5040
atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg 5100
cgcggtgtca tctatgttac tagaggatcc aagcttggta ccatggttaa ttaagaattc 5160
gacgtcgggc ccaattcgcc ctatagtgag tcgtattaca attcactggc cgtcgtttta 5220
caacgtcgtg actgggaaaa ccctggcggt tacccaactt aatcgccttg cagcacatcc 5280
ccctttcgcc agctagataa cttcgtatag catacattat acgaagttat gatctagtga 5340
ttagatcttg ctgataggca ggtttgcttg gagaatgggg ggaaaagact gaccgaagaa 5400
acagcgagat ctagaagtga taagcggaaa gaatctgact tgctgtgatc agcagccaat 5460
ttttttttcg tttttttttt tcactccaca tcgtcgtgcg tgcacggtct gcatgtgtaa 5520
attgtattca tcgaaagcca cagttgaata catcagcccg atgtggattt cgaaaaccaa 5580
ttaatcttgg aattcacgcg ctcagatcag tccatagagt cgacttcggc tgtttccaag 5640
agcttcttct ctgcgaggtg gttgcccgtg tttctcgctg ggaaaaaagg atcgattatt 5700
attcgcttct acctcgctcg cacccttggc ctgctgaagg aaacagcgcc gagactcggt 5760
cacggttgct gggctccgtg ttgatgctgg gacggcgcaa agtggggccc gcgcactctt 5820
cgagccaagg acctcactct tcaagaacaa gcgctgtcgc catcgtcttc ttctttctgc 5880
tccaccatcg aatctttctt tctcgtttcg aaaccaaaac actcttccac catgaaaaag 5940
cctgaactca ccgcgacgtc tgtcgagaag tttctgatcg aaaagttcga cagcgtctcc 6000
gacctgatgc agctctcgga gggcgaagaa tctcgtgctt tcagcttcga tgtaggaggg 6060
cgtggatatg tcctgcgggt aaatagctgc gccgatggtt tctacaaaga tcgttatgtt 6120
tatcggcact ttgcatcggc cgcgctcccg attccggaag tgcttgacat tggggagttt 6180
agcgagagcc tgacctattg catctcccgc cgtgcacagg gtgtcacgtt gcaagacctg 6240
cctgaaaccg aactgcccgc tgttctacaa ccggtcgcgg aggctatgga tgcgatcgct 6300
gcggccgatc ttagccagac gagcgggttc ggcccattcg gaccgcaagg aatcggtcaa 6360
tacactacat ggcgtgattt catatgcgcg attgctgatc cccatgtgta tcactggcaa 6420
actgtgatgg acgacaccgt cagtgcgtcc gtcgcgcagg ctctcgatga gctgatgctt 6480
tgggccgagg actgccccga agtccggcac ctcgtgcacg cggatttcgg ctccaacaat 6540
gtcctgacgg acaatggccg cataacagcg gtcattgact ggagcgaggc gatgttcggg 6600
gattcccaat acgaggtcgc caacatcttc ttctggaggc cgtggttggc ttgtatggag 6660
cagcagacgc gctacttcga gcggaggcat ccggagcttg caggatcgcc acgactccgg 6720
gcgtatatgc tccgcattgg tcttgaccaa ctctatcaga gcttggttga cggcaatttc 6780
gatgatgcag cttgggcgca gggtcgatgc gacgcaatcg tccgatccgg agccgggact 6840
gtcgggcgta cacaaatcgc ccgcagaagc gcggccgtct ggaccgatgg ctgtgtagaa 6900
gtactcgccg atagtggaaa ccgacgcccc agcactcgtc cgagggcaaa gaaatagagt 6960
agatgccgac cgggatctgt cgatcgacaa gctcgagttt ctccataata atgtgtgagt 7020
agttcccaga taagggaatt agggttccta tagggtttcg ctcatgtgtt gagcatataa 7080
gaaaccctta gtatgtattt gtatttgtaa aatacttcta tcaataaaat ttctaattcc 7140
taaaaccaaa atccagtact aaaatccaga tcccccgaat tagatctcga gataacttcg 7200
tatagcatac attatacgaa gttatttatt gaattcaatt cggcgttaat tcagtacatt 7260
aaaaacgtcc gcaatgtgtt attaagttgt ctaagcgtca atttgtttac accacaatat 7320
atcctgccac cagccagcca acagctcccc gaccggcagc tcggcacaaa atcaccactc 7380
gatacaggca gcccatcagt ccgggacggc gtcagcggga gagccgttgt aaggcggcag 7440
actttgctca tgttaccgat gctattcgga agaacggcaa ctaagctgcc gggtttgaaa 7500
cacggatgat ctcgcggagg gtagcatgtt gattgtaacg atgacagagc gttgctgcct 7560
gtgatcaatt cgggcacgaa cccagtggac ataagcctcg ttcggttcgt aagctgtaat 7620
gcaagtagcg taactgccgt cacgcaactg gtccagaacc ttgaccgaac gcagcggtgg 7680
taacggcgca gtggcggttt tcatggcttc ttgttatgac atgttttttt ggggtacagt 7740
ctatgcctcg ggcatccaag cagcaagcgc gttacgccgt gggtcgatgt ttgatgttat 7800
ggagcagcaa cgatgttacg cagcagggca gtcgccctaa aacaaagtta aacatcatgg 7860
gggaagcggt gatcgccgaa gtatcgactc aactatcaga ggtagttggc gtcatcgagc 7920
gccatctcga accgacgttg ctggccgtac atttgtacgg ctccgcagtg gatggcggcc 7980
tgaagccaca cagtgatatt gatttgctgg ttacggtgac cgtaaggctt gatgaaacaa 8040
cgcggcgagc tttgatcaac gaccttttgg aaacttcggc ttcccctgga gagagcgaga 8100
ttctccgcgc tgtagaagtc accattgttg tgcacgacga catcattccg tggcgttatc 8160
cagctaagcg cgaactgcaa tttggagaat ggcagcgcaa tgacattctt gcaggtatct 8220
tcgagccagc cacgatcgac attgatctgg ctatcttgct gacaaaagca agagaacata 8280
gcgttgcctt ggtaggtcca gcggcggagg aactctttga tccggttcct gaacaggatc 8340
tatttgaggc gctaaatgaa accttaacgc tatggaactc gccgcccgac tgggctggcg 8400
atgagcgaaa tgtagtgctt acgttgtccc gcatttggta cagcgcagta accggcaaaa 8460
tcgcgccgaa ggatgtcgct gccgactggg caatggagcg cctgccggcc cagtatcagc 8520
ccgtcatact tgaagctaga caggcttatc ttggacaaga agaagatcgc ttggcctcgc 8580
gcgcagatca gttggaagaa tttgtccact acgtgaaagg cgagatcacc aaggtagtcg 8640
gcaaataatg tctagctaga aattcgttca agccgacgcc gcttcgccgg cgttaactca 8700
agcgattaga tgcactaagc acataattgc tcacagccaa actatcaggt caagtctgct 8760
tttattattt ttaagcgtgc ataataagcc ctacacaaat tgggagatat atcatgcatg 8820
accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc 8880
aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa 8940
ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag 9000
gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta 9060
ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta 9120
ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag 9180
ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg 9240
gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg 9300
cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag 9360
cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc 9420
cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa 9480
aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg 9540
ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct 9600
gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa 9660
gagcgcctga tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatatgg 9720
tgcactctca gtacaatctg ctctgatgcc gcatagttaa gccagtatac actccgctat 9780
cgctacgtga ctgggtcatg gctgcgcccc gacacccgcc aacacccgct gacgcgccct 9840
gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct 9900
gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gaggcagggt gccttgatgt 9960
gggcgccggc ggtcgagtgg cgacggcgcg gcttgtccgc gccctggtag attgcctggc 10020
cgtaggccag ccatttttga gcggccagcg gccgcgatag gccgacgcga agcggcgggg 10080
cgtagggagc gcagcgaccg aagggtaggc gctttttgca gctcttcggc tgtgcgctgg 10140
ccagacagtt atgcacaggc caggcgggtt ttaagagttt taataagttt taaagagttt 10200
taggcggaaa aatcgccttt tttctctttt atatcagtca cttacatgtg tgaccggttc 10260
ccaatgtacg gctttgggtt cccaatgtac gggttccggt tcccaatgta cggctttggg 10320
ttcccaatgt acgtgctatc cacaggaaag agaccttttc gacctttttc ccctgctagg 10380
gcaatttgcc ctagcatctg ctccgtacat taggaaccgg cggatgcttc gccctcgatc 10440
aggttgcggt agcgcatgac taggatcggg ccagcctgcc ccgcctcctc cttcaaatcg 10500
tactccggca ggtcatttga cccgatcagc ttgcgcacgg tgaaacagaa cttcttgaac 10560
tctccggcgc tgccactgcg ttcgtagatc gtcttgaaca accatctggc ttctgccttg 10620
cctgcggcgc ggcgtgccag gcggtagaga aaacggccga tgccgggatc gatcaaaaag 10680
taatcggggt gaaccgtcag cacgtccggg ttcttgcctt ctgtgatctc gcggtacatc 10740
caatcagcta gctcgatctc gatgtactcc ggccgcccgg tttcgctctt tacgatcttg 10800
tagcggctaa tcaaggcttc accctcggat accgtcacca ggcggccgtt cttggccttc 10860
ttcgtacgct gcatggcaac gtgcgtggtg tttaaccgaa tgcaggtttc taccaggtcg 10920
tctttctgct ttccgccatc ggctcgccgg cagaacttga gtacgtccgc aacgtgtgga 10980
cggaacacgc ggccgggctt gtctcccttc ccttcccggt atcggttcat ggattcggtt 11040
agatgggaaa ccgccatcag taccaggtcg taatcccaca cactggccat gccggccggc 11100
cctgcggaaa cctctacgtg cccgtctgga agctcgtagc ggatcacctc gccagctcgt 11160
cggtcacgct tcgacagacg gaaaacggcc acgtccatga tgctgcgact atcgcgggtg 11220
cccacgtcat agagcatcgg aacgaaaaaa tctggttgct cgtcgccctt gggcggcttc 11280
ctaatcgacg gcgcaccggc tgccggcggt tgccgggatt ctttgcggat tcgatcagcg 11340
gccgcttgcc acgattcacc ggggcgtgct tctgcctcga tgcgttgccg ctgggcggcc 11400
tgcgcggcct tcaacttctc caccaggtca tcacccagcg ccgcgccgat ttgtaccggg 11460
ccggatggtt tgcgaccgtc acgccgattc ctcgggcttg ggggttccag tgccattgca 11520
gggccggcag acaacccagc cgcttacgcc tggccaaccg cccgttcctc cacacatggg 11580
gcattccacg gcgtcggtgc ctggttgttc ttgattttcc atgccgcctc ctttagccgc 11640
taaaattcat ctactcattt attcatttgc tcatttactc tggtagctgc gcgatgtatt 11700
cagatagcag ctcggtaatg gtcttgcctt ggcgtaccgc gtacatcttc agcttggtgt 11760
gatcctccgc cggcaactga aagttgaccc gcttcatggc tggcgtgtct gccaggctgg 11820
ccaacgttgc agccttgctg ctgcgtgcgc tcggacggcc ggcacttagc gtgtttgtgc 11880
ttttgctcat tttctcttta cctcattaac tcaaatgagt tttgatttaa tttcagcggc 11940
cagcgcctgg acctcgcggg cagcgtcgcc ctcgggttct gattcaagaa cggttgtgcc 12000
ggcggcggca gtgcctgggt agctcacgcg ctgcgtgata cgggactcaa gaatgggcag 12060
ctcgtacccg gccagcgcct cggcaacctc accgccgatg cgcgtgcctt tgatcgcccg 12120
cgacacgaca aaggccgctt gtagccttcc atccgtgacc tcaatgcgct gcttaaccag 12180
ctccaccagg tcggcggtgg cccatatgtc gtaagggctt ggctgcaccg gaatcagcac 12240
gaagtcggct gccttgatcg cggacacagc caagtccgcc gcctggggcg ctccgtcgat 12300
cactacgaag tcgcgccggc cgatggcctt cacgtcgcgg tcaatcgtcg ggcggtcgat 12360
gccgacaacg gttagcggtt gatcttcccg cacggccgcc caatcgcggg cactgccctg 12420
gggatcggaa tcgactaaca gaacatcggc cccggcgagt tgcagggcgc gggctagatg 12480
ggttgcgatg gtcgtcttgc ctgacccgcc tttctggtta agtacagcga taaccttcat 12540
gcgttcccct tgcgtatttg tttatttact catcgcatca tatacgcagc gaccgcatga 12600
cgcaagctgt tttactcaaa tacacatcac ctttttagac ggcggcgctc ggtttcttca 12660
gcggccaagc tggccggcca ggccgccagc ttggcatcag acaaaccggc caggatttca 12720
tgcagccgca cggttgagac gtgcgcgggc ggctcgaaca cgtacccggc cgcgatcatc 12780
tccgcctcga tctcttcggt aatgaaaaac ggttcgtcct ggccgtcctg gtgcggtttc 12840
atgcttgttc ctcttggcgt tcattctcgg cggccgccag ggcgtcggcc tcggtcaatg 12900
cgtcctcacg gaaggcaccg cgccgcctgg cctcggtggg cgtcacttcc tcgctgcgct 12960
caagtgcgcg gtacagggtc gagcgatgca cgccaagcag tgcagccgcc tctttcacgg 13020
tgcggccttc ctggtcgatc agctcgcggg cgtgcgcgat ctgtgccggg gtgagggtag 13080
ggcgggggcc aaacttcacg cctcgggcct tggcggcctc gcgcccgctc cgggtgcggt 13140
cgatgattag ggaacgctcg aactcggcaa tgccggcgaa cacggtcaac accatgcggc 13200
cggccggcgt ggtggtgtcg gcccacggct ctgccaggct acgcaggccc gcgccggcct 13260
cctggatgcg ctcggcaatg tccagtaggt cgcgggtgct gcgggccagg cggtctagcc 13320
tggtcactgt cacaacgtcg ccagggcgta ggtggtcaag catcctggcc agctccgggc 13380
ggtcgcgcct ggtgccggtg atcttctcgg aaaacagctt ggtgcagccg gccgcgtgca 13440
gttcggcccg ttggttggtc aagtcctggt cgtcggtgct gacgcgggca tagcccagca 13500
ggccagcggc ggcgctcttg ttcatggcgt aatgtctccg gttctagtcg caagtattct 13560
actttatgcg actaaaacac gcgacaagaa aacgccagga aaagggcagg gcggcagcct 13620
gtcgcgtaac ttaggacttg tgcgacatgt cgttttcaga agacggctgc actgaacgtc 13680
agaagccgac tgcactatag cagcggaggg gttggatcaa agtactttga tcccgagggg 13740
aaccctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt 13800
taaatatccg ttattctaat aaacgctctt ttctcttagg tttacccgcc aatatatcct 13860
gtcaaacact gatagtttaa actgaaggcg ggaaacgaca atctgatcca agctcaagct 13920
aagct 13925
<210> 21
<211> 120
<212> DNA
<213> 人工序列
<400> 21
atgttcatct tcgagactgt tgctgcctcc gtccaggcca ttgtttctgt taacgagcaa 60
gagcaggccc ctgtcaacga gggccgtggt cagcctgcag tctactgcac cgtggcctaa 120
<210> 22
<211> 39
<212> PRT
<213> 人工序列
<400> 22
Met Phe Ile Phe Glu Thr Val Ala Ala Ser Val Gln Ala Ile Val Ser
1 5 10 15
Val Asn Glu Gln Glu Gln Ala Pro Val Asn Glu Gly Arg Gly Gln Pro
20 25 30
Ala Val Tyr Cys Thr Val Ala
35
<210> 23
<211> 42
<212> DNA
<213> 人工序列
<400> 23
ctaagcttgc atgcctgcag gctagcccat tgggcacacc ag 42
<210> 24
<211> 44
<212> DNA
<213> 人工序列
<400> 24
cctctagagt cgacctgcag ttaggccacg gtgcagtaga ctgc 44
<210> 25
<211> 24
<212> DNA
<213> 人工序列
<400> 25
atgaaaaagc ctgaactcac cgcg 24
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<400> 26
ggtcaagacc aatgcggagc 20
<210> 27
<211> 22
<212> DNA
<213> 人工序列
<400> 27
gctagcccat tgggcacacc ag 22
<210> 28
<211> 23
<212> DNA
<213> 人工序列
<400> 28
ttaggccacg gtgcagtaga ctg 23
<210> 29
<211> 17
<212> DNA
<213> 人工序列
<400> 29
gattagatct tgctgat 17
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<400> 30
cggactcccg gacgttcgtc 20
<210> 31
<211> 22
<212> DNA
<213> 人工序列
<400> 31
tgcctgaatt gctccgcttg tc 22
<210> 32
<211> 25
<212> DNA
<213> 人工序列
<400> 32
tggctctgtt tctcacgaga tcacg 25
<210> 33
<211> 8874
<212> DNA
<213> 人工序列
<400> 33
tactttaaag tactttgatc ccgaggggaa ccctgtggtt ggcatgcaca tacaaatgga 60
cgaacggata aaccttttca cgccctttta aatatccgat tattctaata aacgctcttt 120
tctcttaggt ttacccgcca atatatcctg tcaaacactg atagtttaaa ctgaaggcgg 180
gaaacgacaa tctgatccaa gctcaagcta agcttgcatg cctgcaggtc gactctagag 240
gatcccttaa gcggaatgat ctacaaagcg ttcttctgca ccgaagtgag gcacttgttt 300
gtggcactga aacaggctga acagcttaca gcttcacagg tcaggtctgg aaccggagat 360
ttttttggcg cgcgtctgtg ttaggttgtt atacctctct tcaaaaggat ggaaaaagat 420
gttgtgccgg cgaatggcca ggttattcac gattagcaag cttggcgaat cggaggccaa 480
ttttcctcag cacccttcta agtcgtacaa ggttttagac gcatacgtct actcatacaa 540
tcagatttta ccctcgacct gatgcagctc tcggagtttt agagctagaa atagcaagtt 600
aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg ctttttttca 660
agagcttgga gtggatggaa tggatcccct agtgattaga tcttgctgat aggcaggttt 720
gcttggagaa tggggggaaa agactgaccg aagaaacagc gagatctaga agtgataagc 780
ggaaagaatc tgacttgctg tgatcagcag ccaatttttt tttcgttttt ttttttcact 840
ccacatcgtc gtgcgtgcac ggtctgcatg tgtaaattgt attcatcgaa agccacagtt 900
gaatacatca gcccgatgtg gatttcgaaa accaattaat cttggaattc acgcgctcag 960
atcagtccat agagtcgact tcggctgttt ccaagagctt cttctctgcg aggtggttgc 1020
ccgtgtttct cgctgggaaa aaaggatcga ttattattcg cttctacctc gctcgcaccc 1080
ttggcctgct gaaggaaaca gcgccgagac tcggtcacgg ttgctgggct ccgtgttgat 1140
gctgggacgg cgcaaagtgg ggcccgcgca ctcttcgagc caaggacctc actcttcaag 1200
aacaagcgct gtcgccatcg tcttcttctt tctgctccac catcgaatct ttctttctcg 1260
tttcgaaacc aaaacactct tccaccatgg gtaccactct tgacgacacg gcttaccggt 1320
accgcaccag tgtcccgggg gacgccgagg ccatcgaggc actggatggg tccttcacca 1380
ccgacaccgt cttccgcgtc accgccaccg gggacggctt caccctgcgg gaggtgccgg 1440
tggacccgcc cctgaccaag gtgttccccg acgacgaatc ggacgacgaa tcggacgccg 1500
gggaggacgg cgacccggac tcccggacgt tcgtcgcgta cggggacgac ggcgacctgg 1560
cgggcttcgt ggtcgtctcg tactccggct ggaaccgccg gctgaccgtc gaggacatcg 1620
aggtcgcccc ggagcaccgg gggcacgggg tcgggcgcgc gttgatgggg ctcgcgacgg 1680
agttcgcccg cgagcggggc gccgggcacc tctggctgga ggtcaccaac gtcaacgcac 1740
cggcgatcca cgcgtaccgg cggatggggt tcaccctctg cggcctggac accgccctgt 1800
acgacggcac cgcctcggac ggcgagcagg cgctctacat gagcatgccc tgcccctaat 1860
cagtactgac aataaaaaga ttcttgtttt caagaacttg tcatttgtat agttttttta 1920
tattgtagtt gttctatttt aatcaaatgt tagcgtgatt tatatttttt ttcgcctcga 1980
catcatctgc ccagatgcga agttaagtgc gcagaaagta atatcatgcg tcaatcgtat 2040
gtgaatgctg gtcgctatac tgctgtcgat tcgatactaa cgccgccatc cagtgtcgac 2100
tagggttgct gccatcggcc tcgctcgcgt ctttgccgga tagcaagagc gcctttggcc 2160
tctacgagcc ctgccacggc tctgcgcccg atctgcccgc cgggaaggcg aacccgatcg 2220
gatgcatcct ctctgctgcc atgatgctga agttgtcgtt gaacatggtt gctgccggcg 2280
aggcggtcga gcaggcagtg caggaggtgt tggactcggg agtcagaacg ggcgacctgc 2340
tcggctcgag ggtaccgagc tcgaattcaa ttcggcgtta attcagtaca ttaaaaacgt 2400
ccgcaatgtg ttattaagtt gtctaagcgt caatttgttt acaccacaat atatcctgcc 2460
accagccagc caacagctcc ccgaccggca gctcggcaca aaatcaccac tcgatacagg 2520
cagcccatca gtccgggacg gcgtcagcgg gagagccgtt gtaaggcggc agactttgct 2580
catgttaccg atgctattcg gaagaacggc aactaagctg ccgggtttga aacacggatg 2640
atctcgcgga gggtagcatg ttgattgtaa cgatgacaga gcgttgctgc ctgtgatcaa 2700
ttcgggcacg aacccagtgg acataagcct cgttcggttc gtaagctgta atgcaagtag 2760
cgtaactgcc gtcacgcaac tggtccagaa ccttgaccga acgcagcggt ggtaacggcg 2820
cagtggcggt tttcatggct tcttgttatg acatgttttt ttggggtaca gtctatgcct 2880
cgggcatcca agcagcaagc gcgttacgcc gtgggtcgat gtttgatgtt atggagcagc 2940
aacgatgtta cgcagcaggg cagtcgccct aaaacaaagt taaacatcat gggggaagcg 3000
gtgatcgccg aagtatcgac tcaactatca gaggtagttg gcgtcatcga gcgccatctc 3060
gaaccgacgt tgctggccgt acatttgtac ggctccgcag tggatggcgg cctgaagcca 3120
cacagtgata ttgatttgct ggttacggtg accgtaaggc ttgatgaaac aacgcggcga 3180
gctttgatca acgacctttt ggaaacttcg gcttcccctg gagagagcga gattctccgc 3240
gctgtagaag tcaccattgt tgtgcacgac gacatcattc cgtggcgtta tccagctaag 3300
cgcgaactgc aatttggaga atggcagcgc aatgacattc ttgcaggtat cttcgagcca 3360
gccacgatcg acattgatct ggctatcttg ctgacaaaag caagagaaca tagcgttgcc 3420
ttggtaggtc cagcggcgga ggaactcttt gatccggttc ctgaacagga tctatttgag 3480
gcgctaaatg aaaccttaac gctatggaac tcgccgcccg actgggctgg cgatgagcga 3540
aatgtagtgc ttacgttgtc ccgcatttgg tacagcgcag taaccggcaa aatcgcgccg 3600
aaggatgtcg ctgccgactg ggcaatggag cgcctgccgg cccagtatca gcccgtcata 3660
cttgaagcta gacaggctta tcttggacaa gaagaagatc gcttggcctc gcgcgcagat 3720
cagttggaag aatttgtcca ctacgtgaaa ggcgagatca ccaaggtagt cggcaaataa 3780
tgtctagcta gaaattcgtt caagccgacg ccgcttcgcc ggcgttaact caagcgatta 3840
gatgcactaa gcacataatt gctcacagcc aaactatcag gtcaagtctg cttttattat 3900
ttttaagcgt gcataataag ccctacacaa attgggagat atatcatgca tgaccaaaat 3960
cccttaacgt gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc 4020
ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct 4080
accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg 4140
cttcagcaga gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca 4200
cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc 4260
tgctgccagt ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga 4320
taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac 4380
gacctacacc gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga 4440
agggagaaag gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag 4500
ggagcttcca gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg 4560
acttgagcgt cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag 4620
caacgcggcc tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc 4680
tgcgttatcc cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc 4740
tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgcct 4800
gatgcggtat tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct 4860
cagtacaatc tgctctgatg ccgcatagtt aagccagtat acactccgct atcgctacgt 4920
gactgggtca tggctgcgcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct 4980
tgtctgctcc cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt 5040
cagaggtttt caccgtcatc accgaaacgc gcgaggcagg gtgccttgat gtgggcgccg 5100
gcggtcgagt ggcgacggcg cggcttgtcc gcgccctggt agattgcctg gccgtaggcc 5160
agccattttt gagcggccag cggccgcgat aggccgacgc gaagcggcgg ggcgtaggga 5220
gcgcagcgac cgaagggtag gcgctttttg cagctcttcg gctgtgcgct ggccagacag 5280
ttatgcacag gccaggcggg ttttaagagt tttaataagt tttaaagagt tttaggcgga 5340
aaaatcgcct tttttctctt ttatatcagt cacttacatg tgtgaccggt tcccaatgta 5400
cggctttggg ttcccaatgt acgggttccg gttcccaatg tacggctttg ggttcccaat 5460
gtacgtgcta tccacaggaa agagaccttt tcgacctttt tcccctgcta gggcaatttg 5520
ccctagcatc tgctccgtac attaggaacc ggcggatgct tcgccctcga tcaggttgcg 5580
gtagcgcatg actaggatcg ggccagcctg ccccgcctcc tccttcaaat cgtactccgg 5640
caggtcattt gacccgatca gcttgcgcac ggtgaaacag aacttcttga actctccggc 5700
gctgccactg cgttcgtaga tcgtcttgaa caaccatctg gcttctgcct tgcctgcggc 5760
gcggcgtgcc aggcggtaga gaaaacggcc gatgccggga tcgatcaaaa agtaatcggg 5820
gtgaaccgtc agcacgtccg ggttcttgcc ttctgtgatc tcgcggtaca tccaatcagc 5880
tagctcgatc tcgatgtact ccggccgccc ggtttcgctc tttacgatct tgtagcggct 5940
aatcaaggct tcaccctcgg ataccgtcac caggcggccg ttcttggcct tcttcgtacg 6000
ctgcatggca acgtgcgtgg tgtttaaccg aatgcaggtt tctaccaggt cgtctttctg 6060
ctttccgcca tcggctcgcc ggcagaactt gagtacgtcc gcaacgtgtg gacggaacac 6120
gcggccgggc ttgtctccct tcccttcccg gtatcggttc atggattcgg ttagatggga 6180
aaccgccatc agtaccaggt cgtaatccca cacactggcc atgccggccg gccctgcgga 6240
aacctctacg tgcccgtctg gaagctcgta gcggatcacc tcgccagctc gtcggtcacg 6300
cttcgacaga cggaaaacgg ccacgtccat gatgctgcga ctatcgcggg tgcccacgtc 6360
atagagcatc ggaacgaaaa aatctggttg ctcgtcgccc ttgggcggct tcctaatcga 6420
cggcgcaccg gctgccggcg gttgccggga ttctttgcgg attcgatcag cggccgcttg 6480
ccacgattca ccggggcgtg cttctgcctc gatgcgttgc cgctgggcgg cctgcgcggc 6540
cttcaacttc tccaccaggt catcacccag cgccgcgccg atttgtaccg ggccggatgg 6600
tttgcgaccg tcacgccgat tcctcgggct tgggggttcc agtgccattg cagggccggc 6660
agacaaccca gccgcttacg cctggccaac cgcccgttcc tccacacatg gggcattcca 6720
cggcgtcggt gcctggttgt tcttgatttt ccatgccgcc tcctttagcc gctaaaattc 6780
atctactcat ttattcattt gctcatttac tctggtagct gcgcgatgta ttcagatagc 6840
agctcggtaa tggtcttgcc ttggcgtacc gcgtacatct tcagcttggt gtgatcctcc 6900
gccggcaact gaaagttgac ccgcttcatg gctggcgtgt ctgccaggct ggccaacgtt 6960
gcagccttgc tgctgcgtgc gctcggacgg ccggcactta gcgtgtttgt gcttttgctc 7020
attttctctt tacctcatta actcaaatga gttttgattt aatttcagcg gccagcgcct 7080
ggacctcgcg ggcagcgtcg ccctcgggtt ctgattcaag aacggttgtg ccggcggcgg 7140
cagtgcctgg gtagctcacg cgctgcgtga tacgggactc aagaatgggc agctcgtacc 7200
cggccagcgc ctcggcaacc tcaccgccga tgcgcgtgcc tttgatcgcc cgcgacacga 7260
caaaggccgc ttgtagcctt ccatccgtga cctcaatgcg ctgcttaacc agctccacca 7320
ggtcggcggt ggcccatatg tcgtaagggc ttggctgcac cggaatcagc acgaagtcgg 7380
ctgccttgat cgcggacaca gccaagtccg ccgcctgggg cgctccgtcg atcactacga 7440
agtcgcgccg gccgatggcc ttcacgtcgc ggtcaatcgt cgggcggtcg atgccgacaa 7500
cggttagcgg ttgatcttcc cgcacggccg cccaatcgcg ggcactgccc tggggatcgg 7560
aatcgactaa cagaacatcg gccccggcga gttgcagggc gcgggctaga tgggttgcga 7620
tggtcgtctt gcctgacccg cctttctggt taagtacagc gataaccttc atgcgttccc 7680
cttgcgtatt tgtttattta ctcatcgcat catatacgca gcgaccgcat gacgcaagct 7740
gttttactca aatacacatc acctttttag acggcggcgc tcggtttctt cagcggccaa 7800
gctggccggc caggccgcca gcttggcatc agacaaaccg gccaggattt catgcagccg 7860
cacggttgag acgtgcgcgg gcggctcgaa cacgtacccg gccgcgatca tctccgcctc 7920
gatctcttcg gtaatgaaaa acggttcgtc ctggccgtcc tggtgcggtt tcatgcttgt 7980
tcctcttggc gttcattctc ggcggccgcc agggcgtcgg cctcggtcaa tgcgtcctca 8040
cggaaggcac cgcgccgcct ggcctcggtg ggcgtcactt cctcgctgcg ctcaagtgcg 8100
cggtacaggg tcgagcgatg cacgccaagc agtgcagccg cctctttcac ggtgcggcct 8160
tcctggtcga tcagctcgcg ggcgtgcgcg atctgtgccg gggtgagggt agggcggggg 8220
ccaaacttca cgcctcgggc cttggcggcc tcgcgcccgc tccgggtgcg gtcgatgatt 8280
agggaacgct cgaactcggc aatgccggcg aacacggtca acaccatgcg gccggccggc 8340
gtggtggtgt cggcccacgg ctctgccagg ctacgcaggc ccgcgccggc ctcctggatg 8400
cgctcggcaa tgtccagtag gtcgcgggtg ctgcgggcca ggcggtctag cctggtcact 8460
gtcacaacgt cgccagggcg taggtggtca agcatcctgg ccagctccgg gcggtcgcgc 8520
ctggtgccgg tgatcttctc ggaaaacagc ttggtgcagc cggccgcgtg cagttcggcc 8580
cgttggttgg tcaagtcctg gtcgtcggtg ctgacgcggg catagcccag caggccagcg 8640
gcggcgctct tgttcatggc gtaatgtctc cggttctagt cgcaagtatt ctactttatg 8700
cgactaaaac acgcgacaag aaaacgccag gaaaagggca gggcggcagc ctgtcgcgta 8760
acttaggact tgtgcgacat gtcgttttca gaagacggct gcactgaacg tcagaagccg 8820
actgcactat agcagcggag gggttggatc aaagtacttt aaagtacttt aaag 8874
<210> 34
<211> 902
<212> DNA
<213> 人工序列
<400> 34
gctagcccat tgggcacacc agtgtctttg ccatcgtacc acagaatttc agagtgcatt 60
gtattgtatc ccactccaga aacgtgtgct tcgacattga gtctgggaca aaggcgtggt 120
atgtcagcca acttgttttt caattttttc aattcttcaa tgagagacga cgcatcttta 180
aaagaagggc cgagcaggtt ctaacgcctt caatatgtgc actcgtattt gatcacaatt 240
tgccctttga aagatttacc ctttgtttct ccgcatcttt aattctactc gcgatagccc 300
tttaacctct gaagtgaggc ggcatgtgcg ctcgcatgag aagatgttga caggctttgt 360
tcaagtcctg tgcaactcac tcgcttttcg aagggacaaa gggacaaaca agcttccttt 420
gtctcgcgcc ctttgtcccg ctcgtctcct ttgtcctact tgcctgaatt gctccgcttg 480
tctcctttgt cctgctggaa ttccttgtgc tacctgccga tacgataagt tcgcttattt 540
tggcgtggaa agcacggcct cgtttgacga acaacagcga cattttcctt gggaacaaga 600
acgacgctca agtacagctt tctcgtcgtc gtttcaagct gttgcgaaag catataagga 660
caacaacaga tgccccctca aagtggacgc cttctcatcg tccaatcctc acttcttcac 720
gtctctcaca cttcacacaa gactttcagt cttttagaca ccactctctt taccaattca 780
ccatgttcat cttcgaaact gttgctgcct gtgtgcaagc cattgtttct gttaacgagc 840
aagagcaggc ccctgtcaac gagggccgtg gtcagcctgc agtctactgc accgtggcct 900
aa 902
<210> 35
<211> 42
<212> DNA
<213> 人工序列
<400> 35
tccgagagct gcatcaggtc gagggtaaaa tctgattgta tg 42
<210> 36
<211> 38
<212> DNA
<213> 人工序列
<400> 36
acctgatgca gctctcggag ttttagagct agaaatag 38
<210> 37
<211> 47
<212> DNA
<213> 人工序列
<400> 37
cgactctaga ggatccctta agcggaatga tctacaaagc gttcttc 47
<210> 38
<211> 39
<212> DNA
<213> 人工序列
<400> 38
aatcactagg ggatccattc catccactcc aagctcttg 39
<210> 39
<211> 21
<212> DNA
<213> 人工序列
<400> 39
cacatacaaa tggacgaacg g 21
<210> 40
<211> 24
<212> DNA
<213> 人工序列
<400> 40
ctagatctcg ctgtttcttc ggtc 24
<210> 41
<211> 51
<212> DNA
<213> 人工序列
<400> 41
ttgcacacag gcagcaacag tttcgaagat gaacatggtg aattggtaaa g 51
<210> 42
<211> 46
<212> DNA
<213> 人工序列
<400> 42
gaaactgttg ctgcctgtgt gcaagccatt gtttctgtta acgagc 46
Claims (7)
1.一种真菌基因定点插入突变的近原位回补方法,其特征在于:将靶标位点经过碱基更改但氨基酸序列不变的互补基因片段和U6启动子驱动携带抗性基因特异识别序列的sgRNA表达盒与根癌农杆菌T-质粒整合,构建以诺尔丝菌素为抗性筛选标记的根癌农杆菌介导的病原真菌基因定点互补载体;用该互补载体转化病原真菌基因插入失活突变体的孢子,依赖突变体内所携带的Cas9对靶标位点进行切割,从而实现将互补基因片段准确插入突变体的抗性基因靶标位点。
2.根据权利要求1所述的真菌基因定点插入突变的近原位回补方法,其特征在于:所述互补基因片段经In-fusion技术重组至带有携带抗性基因特异识别序列的sgRNA表达盒及gapd基因启动子驱动的诺尔丝菌素抗性基因的双元载体中,再由携带该双元载体的根癌农杆菌介导转化携带Cas9基因的插入失活突变体的孢子。
3.根据权利要求1所述的真菌基因定点插入突变的近原位回补方法,其特征在于:所述突变体所携带的抗性基因为潮霉素抗性基因。
4.根据权利要求1所述的真菌基因定点插入突变的近原位回补方法,其特征在于:所述病原真菌为甘蔗鞭黑穗菌。
5.根据权利要求4所述的真菌基因定点插入突变的近原位回补方法,其特征在于:所述互补基因片段为mfa2、prf或g827基因。
6.根据权利要求5所述的真菌基因定点插入突变的近原位回补方法,其特征在于所述病原真菌基因插入失活突变体的孢子按以下方法制备:使用甘蔗鞭黑穗菌内源snRNA启动子驱动sgRNA表达盒,将CRISPR-Cas9系统与根癌农杆菌T-质粒整合,构建以潮霉素为抗性筛选标记的根癌农杆菌介导的甘蔗鞭黑穗菌基因定点插入载体失活系统;将目标基因的特异识别序列克隆入sgRNA表达盒,用于转化甘蔗鞭黑穗菌担孢子,从而将载体系统的可跳动DNA片段准确插入甘蔗鞭黑穗菌目标基因靶标序列;所述目标基因为甘蔗鞭黑穗菌JG35野生型菌株的mfa2、prf或g827基因。
7.根据权利要求6所述的真菌基因定点插入突变的近原位回补方法,其特征在于所述病原真菌基因插入失活突变体的孢子按以下方法制备:通过将甘蔗鞭黑穗菌内源U6基因启动子与所插入位点靶标序列以及sgRNA序列经Overlapping PCR融合后,经In-fusion技术重组至带有由甘蔗鞭黑穗菌内源gapd基因启动子驱动的Cas9基因及潮霉素抗性基因的双元载体中;再由携带该双元载体的根癌农杆菌介导转化甘蔗鞭黑穗菌从而达到对甘蔗鞭黑穗菌基因组的定点插入;所述甘蔗鞭黑穗菌u6基因启动子具有序列表SEQ.ID.No.17的碱基序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611041330.0A CN107043778B (zh) | 2017-03-14 | 2017-03-14 | 真菌基因定点插入突变的近原位回补方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611041330.0A CN107043778B (zh) | 2017-03-14 | 2017-03-14 | 真菌基因定点插入突变的近原位回补方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107043778A true CN107043778A (zh) | 2017-08-15 |
CN107043778B CN107043778B (zh) | 2021-08-17 |
Family
ID=59543782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611041330.0A Expired - Fee Related CN107043778B (zh) | 2017-03-14 | 2017-03-14 | 真菌基因定点插入突变的近原位回补方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107043778B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109971782A (zh) * | 2019-04-11 | 2019-07-05 | 中国农业科学院兰州兽医研究所 | 一种鼠伤寒沙门氏菌回复株的构建方法 |
CN112752843A (zh) * | 2018-07-03 | 2021-05-04 | 丰田自动车株式会社 | 甘蔗属植物的黑穗病抗性相关标记及其利用 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103981215A (zh) * | 2014-05-23 | 2014-08-13 | 安徽省农业科学院水稻研究所 | 一种用于基因工程的骨干质粒载体及应用 |
WO2014186686A2 (en) * | 2013-05-17 | 2014-11-20 | Two Blades Foundation | Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases |
CN105255898A (zh) * | 2015-11-27 | 2016-01-20 | 江西农业大学 | 一种沉默水稻过氧化氢酶基因OsCAT3的sgRNA |
WO2016049163A2 (en) * | 2014-09-24 | 2016-03-31 | The Broad Institute Inc. | Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder |
CN106232803A (zh) * | 2014-02-27 | 2016-12-14 | 孟山都技术公司 | 用于定点基因组修饰的组合物和方法 |
CN106434651A (zh) * | 2016-07-19 | 2017-02-22 | 广西大学 | 根癌农杆菌和CRISPR‑Cas9介导的基因定点插入失活方法及其应用 |
-
2017
- 2017-03-14 CN CN201611041330.0A patent/CN107043778B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014186686A2 (en) * | 2013-05-17 | 2014-11-20 | Two Blades Foundation | Targeted mutagenesis and genome engineering in plants using rna-guided cas nucleases |
CN106232803A (zh) * | 2014-02-27 | 2016-12-14 | 孟山都技术公司 | 用于定点基因组修饰的组合物和方法 |
CN103981215A (zh) * | 2014-05-23 | 2014-08-13 | 安徽省农业科学院水稻研究所 | 一种用于基因工程的骨干质粒载体及应用 |
WO2016049163A2 (en) * | 2014-09-24 | 2016-03-31 | The Broad Institute Inc. | Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder |
CN105255898A (zh) * | 2015-11-27 | 2016-01-20 | 江西农业大学 | 一种沉默水稻过氧化氢酶基因OsCAT3的sgRNA |
CN106434651A (zh) * | 2016-07-19 | 2017-02-22 | 广西大学 | 根癌农杆菌和CRISPR‑Cas9介导的基因定点插入失活方法及其应用 |
Non-Patent Citations (2)
Title |
---|
GULDENER: "LK056652.1", 《GENBANK》 * |
TAKAYUKI ET AL: "Tailor-Made CRISPR/Cas System for Highly Efficient Targeted Gene Replacement in the Rice Blast Fungus", 《IOTECHNOLOGY AND BIOENGINEERING》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112752843A (zh) * | 2018-07-03 | 2021-05-04 | 丰田自动车株式会社 | 甘蔗属植物的黑穗病抗性相关标记及其利用 |
CN109971782A (zh) * | 2019-04-11 | 2019-07-05 | 中国农业科学院兰州兽医研究所 | 一种鼠伤寒沙门氏菌回复株的构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107043778B (zh) | 2021-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020289750B2 (en) | Engineered meganucleases with recognition sequences found in the human T cell receptor alpha constant region gene | |
AU2020264325A1 (en) | Plant genome modification using guide rna/cas endonuclease systems and methods of use | |
AU2021200863A1 (en) | Genetically-modified cells comprising a modified human t cell receptor alpha constant region gene | |
CN101835901B (zh) | 遗传修饰的光合生物的高通量筛选 | |
CN1950510B (zh) | 富含谷氨酰胺的玉米种子蛋白质和启动子 | |
CN106687594A (zh) | 用于产生对草甘膦除草剂具有抗性的植物的组合物和方法 | |
KR20100057016A (ko) | 생활성 펩티드의 발현 및 정제를 위한 가용성 태그 | |
CN107429258A (zh) | 用于加速的性状渐渗的方法和组合物 | |
KR20210151916A (ko) | 뒤시엔느 근육 이영양증의 치료를 위한 aav 벡터-매개된 큰 돌연변이 핫스팟의 결실 | |
KR20180084135A (ko) | 감소된 clr2 활성을 갖는 사상 진균에서 단백질을 생산하는 방법 | |
AU2024205703A1 (en) | Wheat stem rust resistance genes and methods of use | |
CN107043778B (zh) | 真菌基因定点插入突变的近原位回补方法 | |
CN111566217A (zh) | 宿主细胞中风味化合物的产生 | |
US5955368A (en) | Expression system for clostridium species | |
KR20180081817A (ko) | 감소된 clr1 활성을 갖는 사상 진균에서 단백질을 생산하는 방법 | |
CN101835798A (zh) | 将感兴趣蛋白靶向宿主细胞包膜的方法和组合物 | |
CN110818784B (zh) | 水稻基因OsATL15在调节农药的吸收转运中的应用 | |
CA2353083A1 (en) | Method of constructing male sterile plant | |
US20230039558A1 (en) | Chloroplast or accumulated lipid particle enriched with an oil-body protein fusion polypeptide and method for producing the same in algae | |
CN1274388A (zh) | 突变芽胞杆菌rna酶基因及其转化植物 | |
CN111154770B (zh) | 水稻基因OsABCC2在调节农药的吸收转运中的应用 | |
CN108410901B (zh) | 无抗性筛选双抗原锚定表达载体pLQ2a及制备方法 | |
KR102302827B1 (ko) | 크리스퍼 간섭을 이용한 유전자 발현 억제용 조성물 | |
CN112553243B (zh) | CRISPR/xCas9基因编辑系统在棉花中的应用 | |
CN114989282B (zh) | 一种抗二硝基苯胺类除草剂的水稻突变型蛋白及应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210817 |
|
CF01 | Termination of patent right due to non-payment of annual fee |