CN111996209A - 孤雌生殖单倍体诱导基因dmp及其应用 - Google Patents

孤雌生殖单倍体诱导基因dmp及其应用 Download PDF

Info

Publication number
CN111996209A
CN111996209A CN202010457851.4A CN202010457851A CN111996209A CN 111996209 A CN111996209 A CN 111996209A CN 202010457851 A CN202010457851 A CN 202010457851A CN 111996209 A CN111996209 A CN 111996209A
Authority
CN
China
Prior art keywords
sequence
gene
protein
plant
haploid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010457851.4A
Other languages
English (en)
Other versions
CN111996209B (zh
Inventor
陈绍江
钟裕
刘晨旭
祁晓龙
李梦然
陈宝建
焦炎炎
刘宗凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Agricultural University
Original Assignee
China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Agricultural University filed Critical China Agricultural University
Publication of CN111996209A publication Critical patent/CN111996209A/zh
Application granted granted Critical
Publication of CN111996209B publication Critical patent/CN111996209B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/02Methods or apparatus for hybridisation; Artificial pollination ; Fertility
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Analytical Chemistry (AREA)
  • Botany (AREA)
  • Virology (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了孤雌生殖单倍体诱导基因DMP及其应用。本发明从拟南芥中克隆了孤雌生殖单倍体诱导基因AtDMP8和AtDMP9。实验证明,AtDMP8和AtDMP9的突变能够产生孤雌生殖单倍体诱导能力,这使得孤雌生殖方式诱导产生单倍体的应用向双子叶作物上延伸。本发明又进一步在番茄中进行了验证,在番茄中同样发现SlDMP的突变能够产生孤雌生殖单倍体诱导能力。本发明为拓宽单倍体育种技术在双子叶植物上应用及揭示孤雌生殖单倍体产生的生物学机理奠定了重要的基础。鉴于目前育种行业中单倍体育种技术利用的广泛性,本发明具有十分广泛的应用空间和市场前景。

Description

孤雌生殖单倍体诱导基因DMP及其应用
技术领域
本发明涉及以基因组编辑技术为主的农业生物技术领域和作物遗传育种领域,具体涉及一种植物母本单倍体诱导系的制备方法及其应用,特别涉及一种利用基因编辑技术得到的孤雌生殖单倍体诱导基因DMP突变体作为植物单倍体诱导系在诱导植物产生母本单倍体中的应用。
背景技术
优良自交系的选育是作物利用杂种优势、选育优良杂交种的基础和关键。但传统选育方法需要7~8个世代才能获得较为稳定的自交系,而单倍体育种技术只需2个世代(Weber D F,2014),大大缩短了育种的周期。目前,在双子叶作物上单倍体的产生主要依靠的还是花药离体培养,效率低下且对材料的基因型依赖性较高,很难实现规模化的应用。虽然将遗传修饰的着丝粒特异组蛋白CENH3(centromere-specific histone 3 variant)导入拟南芥cenh3突变体中可诱导单倍体的产生,但该方式在诱导过程中产生大量的整倍体(Ravi,M,et al,2010)。
目前,基因编辑技术的体系已经非常成熟稳定,但受遗传转化对材料和基因型依赖的限制而无法进一步发挥其最大的作用。虽然可通过将基因编辑载体导入某个容易转化的受体材料中,进一步将其与需要编辑的目标杂交而实现编辑(Li C et al.,2017),但需要经过长时间的回交才能将背景恢复且不能达到100%。将单倍体诱导与基因编辑技术结合实现了对目标材料单倍体基因的编辑而获得纯合的编辑系,极大缩短了及扩宽了单倍体和基因编辑技术的应用范围(Kelliher,T et al.,2019;Wang,B et al.,2019;Hu,N etal.,2019)。然而,在双子叶植物中由于生物诱导产生单倍体方式的欠缺而无法与基因编辑技术进行结合。
发明内容
本发明的目的是提供一种植物单倍体诱导系的制备方法。
本发明提供的植物单倍体诱导系的制备方法包括如下步骤:沉默或抑制植物基因组中DMP基因的表达和/或活性或敲除DMP基因,得到转基因植物,即为植物单倍体诱导系;所述植物为双子叶植物;
所述DMP基因编码的蛋白质为如下(1)或(2)或(3)或(4)所示的蛋白质:
(1)氨基酸序列是序列2或序列4或序列6所示的蛋白质;
(2)在序列2或序列4或序列6所示的蛋白质的N端和/或C端连接标签得到的融合蛋白质;
(3)将序列2或序列4或序列6所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的蛋白质;
(4)与序列2或序列4或序列6所示的氨基酸序列具有75%或75%以上的同源性且具有相同功能的蛋白质。
上述植物单倍体诱导系的制备方法中,所述双子叶植物为拟南芥时,所述DMP基因为AtDMP8基因和/或AtDMP9基因;所述方法为沉默或抑制拟南芥基因组中AtDMP8基因和/或AtDMP9基因的表达和/或活性或敲除AtDMP8基因和/或AtDMP9基因,得到转基因拟南芥,即为拟南芥单倍体诱导系;
所述双子叶植物为番茄时,所述DMP基因为SlDMP基因;所述方法为沉默或抑制番茄基因组中SlDMP基因或敲除SlDMP基因,得到转基因番茄,即为番茄单倍体诱导系。
上述植物单倍体诱导系的制备方法中,所述沉默或抑制拟南芥基因组中AtDMP8基因和/或AtDMP9基因的表达和/或活性或敲除AtDMP8基因和/或AtDMP9基因为使拟南芥基因组中AtDMP8基因和/或AtDMP9基因表达量降低或使拟南芥基因组中AtDMP8基因和/或AtDMP9基因发生缺失突变或插入突变或碱基替换;
所述沉默或抑制番茄基因组中SlDMP基因的表达和/或活性或敲除SlDMP基因为使番茄基因组中SlDMP基因表达量降低或使番茄基因组中SlDMP基因发生缺失突变或插入突变或碱基替换。
所述使植物基因组中DMP基因表达量降低的方式可为RNAi干扰或过表达或启动子编辑。所述RNAi干扰可为单链RNA干扰,如miRNA,也可为双链RNA干扰,如siRNA、dsRNA、shRNA等。
所述使植物基因组中DMP基因发生缺失突变或插入突变或碱基替换的方式可为CRISPR/Cas9或TELLEN或T-DNA插入或EMS诱变。
进一步的,所述使植物基因组中DMP基因发生缺失突变或插入突变或碱基替换的方式为CRISPR/Cas9。
更进一步的,所述拟南芥中,所述CRISPR/Cas9的靶序列为序列1第98-117位、序列3第290-309位、序列3第368-387位和序列1第509-528位。
所述番茄中,所述CRISPR/Cas9的靶序列为序列5第76-95位和序列5第247-266位。
在本发明的具体实施例中,所述使植物基因组中DMP基因发生缺失突变或插入突变或碱基替换的方法包括如下步骤:将含有所述靶序列的CRISPR/Cas9载体导入植物中,得到转基因植物。
所述植物为拟南芥时,所述含有所述靶序列的CRISPR/Cas9载体为将序列7所示的DNA分子(sgRNA表达元件)、序列9所示的DNA分子(Cas9表达元件)和序列10所示的DNA分子(荧光蛋白表达元件)通过golden gate的方法连接到pICSL4723载体后得到的重组载体。
所述植物为番茄时,所述含有所述靶序列的CRISPR/Cas9载体为将序列8所示的DNA分子(sgRNA表达元件)、序列11所示的DNA分子(Cas9表达元件)、序列10所示的DNA分子(荧光蛋白表达元件)和序列12所示的DNA分子(NptII表达元件)通过golden gate的方法连接到pICSL4723载体后得到的重组载体。
上述植物单倍体诱导系的制备方法还包括筛选DMP基因突变体的步骤。
本发明的另一个目的是提供一种植物单倍体的制备方法。
本发明提供的植物单倍体的制备方法包括如下步骤:将由上述方法制备的植物单倍体诱导系或其后代进行自交或者作为父本与其他植物材料杂交,得到自交后代或杂交后代,即为所述植物单倍体;所述植物为双子叶植物。
进一步的,上述植物单倍体的制备方法还包括如下步骤:将所述自交后代或所述杂交后代单株进行荧光标记鉴定和/或单倍体性状鉴定和/或叶片倍性鉴定和/或分子标记鉴定,选取至少一种方法鉴定为单倍体的后代单株为植物单倍体。
更进一步的,所述荧光标记鉴定方法可按照如下方法进行:在含有所述靶序列的CRISPR/Cas9载体上携带荧光蛋白表达元件(如启动子AtOLEO1驱动TagRFP(Entacmaeaquadricolor)的表达元件),通过荧光灯对待测植株的荧光信号进行观察:若待测植株无荧光或弱荧光,则该植株为或候选为单倍体;若待测植株表现出相应荧光,则该植株为或候选为二倍体。
所述单倍体性状鉴定方法可按照如下方法进行:若待测植株具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,则该植株为或候选为单倍体;若待测植株具有植株高大,叶片宽大,披散,育性正常等特征,则该植株为或候选为二倍体。
所述叶片倍性鉴定方法可按照如下方法进行:提取待测植株幼嫩叶片的细胞核,以二倍体植物叶片作为对照;再用流式细胞仪器检测信号,首先检测二倍体细胞核信号,并将二倍体细胞核信号峰位设为50(由于二倍体细胞内的遗传物质是单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在25附近出现)。若待测植株细胞核信号峰出现在25附近,则该植株为或候选为单倍体;若待测植株的信号峰出现在50附近,其与二倍体细胞核信号强度富集位置相同,则该植株为或候选为二倍体。
所述分子标记鉴定可按照如下方法进行:采用父本(母本单倍体诱导系)和母本间多态性引物进行PCR扩增,根据PCR扩增产物判断待测植株为单倍体还是二倍体:若待测植株的扩增产物仅具有母本的带型,不存在父本的带型,则该植株为或候选为单倍体;若待测植株的扩增产物具有父本和母本的杂合带型,则该植株为或候选为二倍体。
如下1)-5)任一种应用也属于本发明的保护范围:
1)由上述方法制备得到的植物单倍体诱导系在培育植物单倍体中的应用;
2)沉默或抑制植物基因组中AtDMP8基因和/或AtDMP9基因的表达和/或活性或敲除AtDMP8基因和/或AtDMP9基因的物质在培育植物单倍体诱导系或培育植物单倍体中的应用;
3)沉默或抑制植物基因组中SlDMP基因的表达和/或活性或敲除SlDMP基因的物质在培育植物单倍体诱导系或植物单倍体中的应用;
4)AtDMP8蛋白质或其相关生物材料和/或AtDMP9蛋白质或其相关生物材料在调控植物单倍体诱导系的诱导率或提高植物单倍体诱导系的诱导率或培育植物单倍体诱导系或植物单倍体中的应用;
5)SlDMP蛋白质或其相关生物材料在调控植物单倍体诱导系的诱导率或提高植物单倍体诱导系的诱导率或培育植物单倍体诱导系或植物单倍体中的应用。
上述任一所述的应用或方法中,所述AtDMP8蛋白质是如下a1)或a2)或a3)或a4)所示的蛋白质:
a1)氨基酸序列是序列2所示的蛋白质;
a2)在序列2所示的蛋白质的N端和/或C端连接标签得到的融合蛋白质;
a3)将序列2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的蛋白质;
a4)与序列2所示的氨基酸序列具有75%或75%以上的同源性且具有相同功能的蛋白质;
所述AtDMP9蛋白质是如下b1)或b2)或b3)或b4)所示的蛋白质:
b1)氨基酸序列是序列4所示的蛋白质;
b2)在序列4所示的蛋白质的N端和/或C端连接标签得到的融合蛋白质;
b3)将序列4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的蛋白质;
b4)与序列4所示的氨基酸序列具有75%或75%以上的同源性且具有相同功能的蛋白质。
所述SlDMP蛋白质是如下c1)或c2)或c3)或c4)所示的蛋白质:
c1)氨基酸序列是序列6所示的蛋白质;
c2)在序列6所示的蛋白质的N端和/或C端连接标签得到的融合蛋白质;
c3)将序列6所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的蛋白质;
c4)与序列6所示的氨基酸序列具有75%或75%以上的同源性且具有相同功能的蛋白质。
所述AtDMP8蛋白质或AtDMP9蛋白质或SlDMP蛋白质相关生物材料为下述A1)至A12)中的任一种:
A1)编码所述AtDMP8蛋白质或AtDMP9蛋白质或SlDMP蛋白质的核酸分子;
A2)含有A1)所述核酸分子的表达盒;
A3)含有A1)所述核酸分子的重组载体;
A4)含有A2)所述表达盒的重组载体;
A5)含有A1)所述核酸分子的重组微生物;
A6)含有A2)所述表达盒的重组微生物;
A7)含有A3)所述重组载体的重组微生物;
A8)含有A4)所述重组载体的重组微生物;
A9)含有A1)所述核酸分子的转基因植物细胞系;
A10)含有A2)所述表达盒的转基因植物细胞系;
A11)含有A3)所述重组载体的转基因植物细胞系;
A12)含有A4)所述重组载体的转基因植物细胞系。
进一步的,A1)所述核酸分子为如下B1)或B2)或B3)所示的基因:
B1)其编码序列是序列1或序列3或序列5所示的cDNA分子或基因组DNA分子;
B2)与B1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述AtDMP8蛋白质或AtDMP9蛋白质或SlDMP蛋白质的cDNA分子或基因组DNA分子;
B3)在严格条件下与B1)或B2)限定的核苷酸序列杂交,且编码所述AtDMP8蛋白质或AtDMP9蛋白质或SlDMP蛋白质的cDNA分子或基因组DNA分子。
其中,序列1为编码AtDMP8蛋白质的核酸分子,序列3为编码AtDMP9蛋白质的核酸分子,序列5为编码SlDMP蛋白质的核酸分子。
更进一步的,所述敲除AtDMP8基因和/或AtDMP9基因的物质或所述敲除SlDMP基因的物质为上述含有所述靶序列的CRISPR/Cas9载体。
上述任一所述的应用或方法中,所述植物为双子叶植物;所述双子叶植物具体可为拟南芥或番茄;所述拟南芥具体可为野生型拟南芥(Col-0)或ms1;所述番茄具体可为野生型番茄AC或Micro-Tom或由番茄AC和Micro-Tom杂交获得的F1代材料。
本发明从拟南芥中克隆了孤雌生殖单倍体诱导基因AtDMP8和AtDMP9。实验证明,AtDMP8和AtDMP9的突变能够产生孤雌生殖单倍体诱导能力,这使得孤雌生殖方式诱导产生单倍体的应用向双子叶作物上延伸。本发明又进一步在番茄中进行了验证,在番茄中同样发现SlDMP的突变能够产生孤雌生殖单倍体诱导能力。本发明为拓宽单倍体育种技术在双子叶植物上应用及揭示孤雌生殖单倍体产生的生物学机理奠定了重要的基础。鉴于目前育种行业中单倍体育种技术利用的广泛性,本发明具有十分广泛的应用空间和市场前景。
附图说明
图1为拟南芥单倍体和二倍体对比图。箭头所指的植株为单倍体。
图2为拟南芥单倍体和二倍体抽薹后对比图。
图3为拟南芥单倍体和二倍体流式细胞结果对比图。
图4为拟南芥单倍体荧光鉴别图。图a为拟南芥种子在白光下的表型,图b为拟南芥种子在荧光下的表型,箭头所指的种子为单倍体。
图5为拟南芥单倍体和二倍体的分子标记验证胶图。M为2K分子标记,I为母本材料带型,II为父本材料带型,III为单倍体带型,IV为二倍体带型。
图6为野生型番茄和sldmp突变体的植株与果实对比图。图a,b分别为野生型番茄和sldmp突变体植株,图c,d分别为野生型番茄和sldmp突变体自交果实。
图7为番茄种子荧光表达图。图a,b分别为在明场下拍摄番茄种子未发芽与发芽的表现,图c,d分别为荧光下拍摄番茄种子未发芽与发芽的表现。
图8为番茄单倍体和二倍体流式细胞结果对比图。
图9为重组载体中主要元件的结构示意图。图a,b分别为拟南芥和番茄的载体结构示意图。
具体实施方式
以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中的实验方法,如无特殊说明,均为常规方法。下述实施例中所用的试验材料,如无特殊说明,均为自常规生化试剂商店购买得到的。以下实施例中的定量试验,均设置三次重复实验,结果取平均值。
下述实施例中的pICSL4723载体记载于文献“Castel,B.and L.Tomlinson,et al.(2019).Optimization of T-DNA architecture for Cas9-mediated mutagenesis inArabidopsis.PloS one,14(1).”中,公众可从中国农业大学获得,该试验材料只为重复本发明的相关实验所用,不可作为其它用途使用。
下述实施例中的野生型拟南芥Col-0和ms1均记载于文献“Rosso,M.G.and Y.Li,et al.(2003).An Arabidopsis thaliana T-DNA mutagenized population(GABI-Kat)for flanking sequence tag-based reverse genetics.Plant Mol Biol 53(1-2):247-59.”中,公众可从中国农业大学获得,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。
下述实施例中的野生型番茄AC记载于文献“Yuan,G.and C.Jia,et al.(2010).Effect of brassinosteroids on drought resistance and abscisic acidconcentration in tomato under water stress.Scientia Horticulturae 126(2):103-108.”中,公众可从中国农业大学获得,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。
下述实施例中的野生型番茄Micro-Tom记载于文献“Sun,H.and S.Uchii,et al.(2006).A highly efficient transformation protocol for Micro-Tom,a modelcultivar for tomato functional genomics.Plant and Cell Physiology 47(3):426-431.”中,公众可从中国农业大学获得,该生物材料只为重复本发明的相关实验所用,不可作为其它用途使用。
本发明中的AtDMP8基因的CDS序列如序列表中序列1第95-826位所示,AtDMP8基因编码的蛋白的氨基酸序列如序列2所示。
本发明中的AtDMP9基因的CDS序列如序列表中序列3第141-875位所示,AtDMP9基因编码的蛋白的氨基酸序列如序列4所示。
本发明中的SlDMP基因的CDS序列如序列表中序列5第1-678位所示,SlDMP基因编码的蛋白的氨基酸序列如序列6所示。
实施例1、AtDMP8和/或AtDMP9基因敲除的拟南芥突变体的制备及其应用
一、利用CRISPR/Cas9系统敲除AtDMP8和/或AtDMP9基因
利用CRISPR/Cas9系统敲除拟南芥中的AtDMP8和/或AtDMP9基因,获得AtDMP8和/或AtDMP9基因敲除的拟南芥突变体。具体步骤如下:
1、sgRNA序列的选择
分别在AtDMP8和AtDMP9基因上设计靶位点序列,长度为20bp。
靶位点1位于序列1第98-117位,位于序列3第144-163位,sgRNA靶位点1序列为GAGAAAACAGAGGAAAGCGT。
靶位点2位于序列3第290-309位,sgRNA靶位点2序列为AAGAGGTCGAAAACGTCGCA。
靶位点3位于序列3第368-387位,sgRNA靶位点3序列为TCAAGAGTGTTCCTGTCGGA。
靶位点4位于序列1第509-528位,位于序列3第558-577位,sgRNA靶位点4序列为ATGAACACCGCGAGTCCACG。
2、CRISPR/Cas9载体的构建
CRISPR/Cas9载体为将序列7所示的DNA分子(sgRNA表达元件)、序列9所示的DNA分子(Cas9表达元件)和序列10所示的DNA分子(荧光蛋白表达元件)通过golden gate的方法连接到pICSL4723载体后得到的重组载体(载体结构图如图9a所示)。序列7所示的DNA分子依次包括靶向靶位点1的sgRNA的编码序列、靶向靶位点2的sgRNA的编码序列、靶向靶位点2的sgRNA的编码序列、靶向靶位点4的sgRNA的编码序列,每个sgRNA的编码序列前均包括用于启动sgRNA的编码序列表达的AtU6-26启动子。
3、转基因植株的获得
将步骤2获得的CRISPR/Cas9载体通过热激转化转至农杆菌感受态细胞GV3101(农杆菌GV3101感受态细胞购自北京奥森鼎信生物技术有限公司,公众可通过购买获得),得到重组菌GV3101/CRISPR/Cas9。
再将重组菌GV3101/CRISPR/Cas9采用农杆菌侵染拟南芥花序的转化方法(重组农杆菌进行28℃扩繁,扩繁后的菌液用于拟南芥花序侵染)侵染野生型拟南芥Col-0的花序,经过红色荧光筛选后获得T1代转基因拟南芥植株。
4、AtDMP8和/或AtDMP9基因发生突变的转基因植株鉴定
采集步骤3获得的T1代转基因拟南芥植株叶片,并提取基因组DNA作为模板,采用如下两对引物分别进行PCR扩增,得到不同株系的PCR扩增产物。
AtDMP8突变序列检测引物的序列如下:
DMP8F1:TGCGAAATGAGATTGGTTTTGGG;
DMP8R1:AAACACCCTGTGACTCTCCG。
AtDMP9突变序列检测引物的序列如下:
DMP9F1:ATAACCGTCAATAACCGCCG;
DMP9R2:CCAGTCATGCAACCAACACC。
将不同株系的PCR扩增产物进行Sanger测序,并将测序结果与野生型拟南芥Col-0的AtDMP8和AtDMP9分别进行比对。根据以下原则分别对AtDMP8和AtDMP9的基因型进行鉴定。
自靶位点序列起具有双峰特征的序列,则该株系的基因型为杂合基因型(2条同源染色体中的1条染色体上的AtDMP8和/或AtDMP9基因突变,且另1条染色体上的AtDMP8和/或AtDMP9基因未突变),该株系为T1代转基因拟南芥杂合突变型株系;
自靶位点序列起具有特异单峰特征的序列,若与野生型拟南芥Col-0的AtDMP8和AtDMP9的基因序列相同,则该株系的基因型为野生型,即AtDMP8和AtDMP9基因序列没有发生突变;若与野生型拟南芥Col-0的AtDMP8和/或AtDMP9的基因序列不同,则该株系的基因型为纯合基因型(2条同源染色体上的AtDMP8和/或AtDMP9基因均发生突变),该株系为T1代转基因拟南芥纯合突变型株系。
鉴定结果如表1和2所示(表1,2分别为T1代转基因拟南芥的AtDMP8和AtDMP9基因突变情况):41株T1代转基因拟南芥植株中,33株T1代转基因植株的AtDMP8基因发生突变,其中2株AtDMP8基因发生纯合突变,17株AtDMP8基因发生双等位突变。28株T1代转基因植株的AtDMP9基因发生突变,其中5株AtDMP9基因发生纯合突变,7株AtDMP9基因发生双等位突变。AtDMP8和AtDMP9均发生纯合突变/双等位突变的有12株。进一步选择纯合突变/双等位突变单株中导致移码突变(缺失不是3的倍数)的单株进行表型鉴定。共有AtDMP8纯合突变/双等位突变、AtDMP9纯合突变/双等位突变、AtDMP8和AtDMP9均纯合突变/双等位突变这3种类型。
表1、T1代转基因拟南芥的AtDMP8基因突变类型
Figure BDA0002509939840000071
Figure BDA0002509939840000081
表2、T1代转基因拟南芥的AtDMP9基因突变类型
Figure BDA0002509939840000082
Figure BDA0002509939840000091
获得的T1代转基因拟南芥AtDMP8基因突变株系有T1-34,具体突变如下:
经测序鉴定表明:与野生型拟南芥Col-0的基因组DNA相比,T1代转基因拟南芥AtDMP8基因突变株系T1-34的差异仅在于在编码AtDMP8蛋白的基因中,一条染色体发生了片段缺失,该缺失的片段位于序列1第115-512位;另一条染色体发生了一个碱基T的插入,该碱基T的插入位置位于序列1第114-115位之间。
获得的T1代转基因拟南芥AtDMP8和AtDMP9基因双突变株系有T1-6、T1-11、T1-19、T1-24、T1-25、T1-28、T1-32,具体突变如下:
经测序鉴定表明:与野生型拟南芥Col-0的基因组DNA相比,T1代转基因拟南芥AtDMP8和AtDMP9基因双突变株系T1-6的差异仅在于在编码AtDMP8蛋白的基因中,一条染色体发生了片段缺失,该缺失的片段位于序列1第115-512位,另一条染色体发生了片段缺失,该缺失的片段位于序列1第113-114位,且在编码AtDMP9蛋白的基因中发生了片段插入,该插入的片段的核苷酸序列为:GTTTACACGGCGACTC,该片段的插入位置位于序列3第160-161位之间。
经测序鉴定表明:与野生型拟南芥Col-0的基因组DNA相比,T1代转基因拟南芥AtDMP8和AtDMP9基因双突变株系T1-11的差异仅在于在编码AtDMP8蛋白的基因中发生了一个碱基T的插入,该碱基T的插入位置位于序列3第114-115位之间,且在编码AtDMP9蛋白的基因中,一条染色体发生了碱基T插入,该碱基T的插入位置位于序列3第160-161位之间,另一条染色体发生片段插入,该插入的片段的核苷酸序列为:GTTTACACGGCGACTC,该片段的插入位置位于序列3第160-161位之间。
经测序鉴定表明:与野生型拟南芥Col-0的基因组DNA相比,T1代转基因拟南芥AtDMP8和AtDMP9基因双突变株系T1-19的差异仅在于在编码AtDMP8蛋白的基因中,一条染色体发生了一个碱基T的缺失,该缺失的碱基位于序列1第114位,另一条染色体发生了片段缺失,该缺失的片段位于序列1第115-511位,且在编码AtDMP9蛋白的基因中,一条染色体发生了一个碱基T的缺失,该缺失的碱基位于序列1第114位,另一条染色体发生了片段缺失,该缺失的片段位于序列1第115-511位,在编码AtDMP9蛋白的基因中,一条染色体发生了片段缺失,该缺失的片段位于序列3第161-560位,另一条染色体发生了片段缺失,该缺失的片段位于序列3第161-564位。
经测序鉴定表明:与野生型拟南芥Col-0的基因组DNA相比,T1代转基因拟南芥AtDMP8和AtDMP9基因双突变株系T1-24的差异仅在于在编码AtDMP8蛋白的基因中,一条染色体发生了片段缺失,该缺失的片段位于序列1第115-512位,另一条染色体发生了一个碱基T的插入,该碱基T的插入位置位于序列1第114-115位之间;且在编码AtDMP9蛋白的基因中,一条染色体发生了片段缺失,该缺失的片段位于序列3第161-560位,另一条染色体发生了片段缺失,该缺失的片段位于序列3第159-160位。
经测序鉴定表明:与野生型拟南芥Col-0的基因组DNA相比,T1代转基因拟南芥AtDMP8和AtDMP9基因双突变株系T1-25的差异仅在于在编码AtDMP8蛋白的基因中,一条染色体发生了一个碱基T的缺失,该缺失的碱基位于序列1第114位,另一条染色体发生了片段CGT的插入,该片段的插入位置位于序列1第114-115位之间;且在编码AtDMP9蛋白的基因中,一条染色体发生了片段缺失,该缺失的片段位于序列3第161-162位,另一条染色体发生了一个碱基A的插入,该碱基A的插入位置位于序列3第160-161位之间。
经测序鉴定表明:与野生型拟南芥Col-0的基因组DNA相比,T1代转基因拟南芥AtDMP8和AtDMP9基因双突变株系T1-28的差异仅在于在编码AtDMP8蛋白的基因中,一条染色体发生了片段缺失,该缺失的片段位于序列1第115-512位,另一条染色体发生了一个碱基T的缺失,该缺失的碱基位于序列1第114位;且在编码AtDMP9蛋白的基因中发生了一个碱基A的插入,该碱基A的插入位置位于序列3第160-161位之间。
经测序鉴定表明:与野生型拟南芥Col-0的基因组DNA相比,T1代转基因拟南芥AtDMP8和AtDMP9基因双突变株系T1-32的差异仅在于在编码AtDMP8蛋白的基因中,一条染色体发生了片段缺失,该缺失的片段位于序列1第115-511位,另一条染色体发生了一个碱基T的插入,该碱基T的插入位置位于序列1第114-115位之间,且在编码AtDMP9蛋白的基因中发生了碱基C的缺失,该缺失的碱基位于序列3第161位。
5、T2代转基因拟南芥的基因型鉴定
将步骤4获得的T1代转基因拟南芥AtDMP8和/或AtDMP9基因突变型株系T1-19、T1-33和T1-38自交,收获种子后再播种,得到T2代转基因拟南芥。鉴定T2代转基因拟南芥的AtDMP8和AtDMP9基因的基因型,具体方法如下:以T2代转基因拟南芥的基因组DNA为模板,分别利用AtDMP8(DMP8F1和DMP8R1)和AtDMP9(DMP9F1和DMP9R2)的突变序列检测引物按照步骤4中的方法鉴定T2代转基因拟南芥AtDMP8和AtDMP9基因的基因型。
获得的T2代转基因拟南芥AtDMP8基因突变纯合型株系有T2-33-1、T2-33-2和T2-33-3,这3个株系的突变序列一样,具体突变如下:
经测序鉴定表明:与野生型拟南芥Col-0的基因组DNA相比,T2代转基因拟南芥AtDMP8基因突变纯合型株系T2-33-1、T2-33-2和T2-33-3的差异仅在于在编码AtDMP8蛋白的基因中发生了片段替换,该片段替换为将序列1第115-511位所示的片段替换为大小为202bp的片段。大小为202bp的片段的核苷酸序列具体如下:GAAATTGACGAGCATTGATGTCTTCGAAACCGTTTTTTGAACTCCTTTCGCCACCATGCGACGTTTTCTACCTTTTCCTCCTCCCGCGGCGGCTCCTGCCGGAAGCATAGGCAGTGAAGAGAGAGGGACAGGTTTGGGCGACCGAGACGATGTTGGTGACGGATTTTGCGTCGTTGTCGTCGTGTAAACTCTGATTCCGACG。
获得的T2代转基因拟南芥AtDMP9基因突变纯合型株系有T2-33-4、T2-33-5和T2-33-6,这3个株系的突变序列一样,具体突变如下:
经测序鉴定表明:与野生型拟南芥Col-0的基因组DNA相比,T2代转基因拟南芥AtDMP9基因突变纯合型株系T2-33-4、T2-33-5和T2-33-6的差异仅在于在编码AtDMP9蛋白的基因中发生了一个碱基T的插入,该碱基T的插入位置位于序列3第160-161位之间,且在编码AtDMP9蛋白的基因中发生了片段插入,该插入的片段的核苷酸序列具体如下:CGTCGGAATCAGAGTTTACACGGCGACTCCGCCGCAAAAACCATCACCATCACCACCTTCTCGTTCACCAAAACCCGTCTTAATCTCTTCATTGCCTTCCCTCCCGTCAGGAGCCGCCGCTGGAGGAGGAAGAGGTCGAAAACGTCGCATGGTGGCGCAAGGAGTTCAAAAAACGGTTTCGAAGACATCAATGCTCGTCAACTTCCTTCCGACAGGAACACTCTTGATGTTCGAAATGGTTCTTCCATCAATATACCGTGACGGAGACTGTAACGGAATCAACACACTCATGATTCATCTCCTCTTGCTTCTTTGCGCAATGTCTTGTTTCTTCTTCCATTTTACCGACAGTTTCAAAGCATCCGATGGGAAGATCTACTACGGTTTCGTGACGCCACGTG,该片段的插入位置位于序列3第561-562位之间。
获得的T2代转基因拟南芥AtDMP8和AtDMP9基因突变纯合型株系有T2-19、T2-38-1和T2-38-2,且各个株系的突变类型如下:
经测序鉴定表明:与野生型拟南芥Col-0的基因组DNA相比,T2代转基因拟南芥AtDMP8和AtDMP9基因突变纯合型株系T2-19的差异仅在于在编码AtDMP8蛋白的基因中发生了片段缺失,该缺失的片段位于序列1第115-511位,且在编码AtDMP9蛋白的基因中发生了片段缺失,该缺失的片段位于序列3第161-564位。
经测序鉴定表明:与野生型拟南芥Col-0的基因组DNA相比,T2代转基因拟南芥AtDMP8和AtDMP9基因突变纯合型株系T2-38-1和T2-38-2的差异仅在于在编码AtDMP8蛋白的基因中发生了片段缺失,该缺失的片段位于序列1第115-127位,且在编码AtDMP9蛋白的基因中两个位置发生了碱基T和碱基G的插入,分别位于序列3第160-161位之间和序列3第562-563位之间。
选取以上T1和T2代转基因拟南芥突变株系用于下述单倍体诱导能力分析实验。
二、AtDMP8和/或AtDMP9基因敲除的拟南芥突变体在诱导产生单倍体中的应用
(一)AtDMP8和AtDMP9基因敲除的拟南芥突变体的单倍体自交诱导能力鉴定
将AtDMP8和AtDMP9基因所获得3种类型突变体分别自交获得自交后代,通过如下方法对自交后代进行单倍体鉴别(由于野生拟南芥Col为纯合的自交系,在此背景上敲除AtDMP8和AtDMP9基因所获得突变体自交后代无法通过分子标记去鉴定单倍体):
1、植株表型鉴别
将自交种子种植后,观察单株表型,单倍体具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,二倍体则表现为植株高大,叶片宽大,披散,育性正常(图1、图2)。
2、流式细胞检测叶片鉴别
将上述步骤1中获得的表现为单倍体性状植株进行流式细胞检测,具体方法如下:提取待测植株幼嫩叶片的细胞核,以二倍体拟南芥叶片作为对照;再用流式细胞仪器检测信号,首先检测二倍体细胞核信号,并将二倍体细胞核信号峰位设为50(由于二倍体细胞内的遗传物质是单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在25附近出现)。若待测植株细胞核信号峰出现在25附近,则认为该待测植株为单倍体植株。若待测植株的信号峰出现在50附近,则认为其与二倍体细胞核信号强度富集位置相同,该待测植株为二倍体(图3)。
统计上述鉴定结果并按照如下公式计算诱导率:诱导率(%)=(单倍体株数/总株数)×100。可以看出,AtDMP8和AtDMP9基因同时突变后,在自交后代中可获得单倍体。
表3、dmp突变体自交后代中单倍体诱导率统计
基因型 植株编号 总株数 单倍体数 单倍体诱导率(%)
WT Col-0 523 0 0
dmp8 T2-33-1 270 0 0
dmp9 T2-33-4 183 0 0
dmp8dmp9 T2-38-1 165 6 3.64
(二)AtDMP8和AtDMP9基因敲除的拟南芥突变体的单倍体杂交诱导能力鉴定
将AtDMP8和AtDMP9基因所获得3种类型突变体分别与拟南芥ms1材料进行杂交获得杂交后代,通过如下方法对杂交后代中的单倍体进行鉴别:
1、荧光标记鉴别
CRISPR/Cas9载体上携带启动子AtOLEO1驱动TagRFP(Entacmaea quadricolor)的表达元件。由于启动子AtOLEO1在成熟的种子胚中特异表达,可通过荧光灯对TagRFP的荧光信号进行观察。因此,用携带该表达元件的突变体为父本与其它不携带荧光的母本材料杂交,所得到的种子中,二倍体种子的胚由于具有父本的基因组而表现出强的红色荧光,而单倍体种子的胚由于来源于母本而表现为无荧光或弱荧光(图4)。
2、分子标记鉴别
将上述步骤1鉴定出的不具有荧光和具有弱荧光的种子进一步种植,提取其基因组DNA,采用拟南芥ms1与AtDMP8和AtDMP9基因敲除的拟南芥突变体间多态性引物092B02-F(092B02-F:CAGCTGAGATGAACGAGTTGTCTT)、092B02-R(092B02-R:TCTTTTGAGTCACTCCGTATGTCC)和LB-o8474(LB-o8474:ATAATAACGCTGCGGACATCTACATTTT)进行PCR扩增,并将扩增产物进行琼脂糖带型检测,若待测单株的扩增产物的大小为500bp,表现为1条带,认为该单株条带为拟南芥ms1带型,不存在父本材料的带型,则该单株是母本单倍体。若待测单株的扩增产物的大小为500bp和1094bp,表现为2条带,认为该单株条带为拟南芥ms1和转基因拟南芥突变株系杂合带型,则该单株是正常杂交的后代,是二倍体(图5)。
3、成熟植株表型鉴别
对上述步骤1和2鉴定出的植株进一步观察其表型,单倍体具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,二倍体则表现为植株高大,叶片宽大,披散,育性正常。
4、流式细胞检测叶片鉴别
将上述步骤3中获得的表现为单倍体性状植株进行流式细胞检测,具体方法如下:提取待测植株幼嫩叶片的细胞核,以二倍体拟南芥叶片作为对照;再用流式细胞仪器检测信号,首先检测二倍体细胞核信号,并将二倍体细胞核信号峰位设为50(由于二倍体细胞内的遗传物质是单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在25附近出现)。若待测植株细胞核信号峰出现在25附近,则认为该待测植株为单倍体植株。若待测植株的信号峰出现在50附近,则认为其与二倍体细胞核信号强度富集位置相同,该待测植株为二倍体。
统计上述鉴定结果并按照如下公式计算诱导率:诱导率(%)=(母本单倍体株数/总株数)×100。可以看出,AtDMP8基因突变、AtDMP9基因突变和AtDMP8和AtDMP9基因同时突变后与其他材料杂交,在后代中可获得母本单倍体。
表4、dmp突变体杂交后代中单倍体诱导率统计
Figure BDA0002509939840000131
实施例2、SlDMP基因敲除的番茄突变体的制备及其应用
一、利用CRISPR/Cas9系统敲除SlDMP基因
利用CRISPR/Cas9系统敲除番茄中的SlDMP基因,获得SlDMP基因敲除的番茄突变体。具体步骤如下:
1、sgRNA序列的选择
在SlDMP基因上设计靶位点序列,长度为20bp。
靶位点1位于序列5第76-95位,sgRNA靶位点1序列为TATCCTACTAATTTACCACA。
靶位点2位于序列5第247-266位,sgRNA靶位点2序列为TCTCCTTTACCAAATACTGA。
2、CRISPR/Cas9载体的构建
CRISPR/Cas9载体为将序列8所示的DNA分子(sgRNA表达元件)、序列11所示的DNA分子(Cas9表达元件)、序列10所示的DNA分子(荧光蛋白表达元件)和序列12所示的DNA分子(NptII表达元件)通过golden gate的方法连接到pICSL4723载体后得到的重组载体(载体结构图如图9b所示)。序列8所示的DNA分子依次包括靶向靶位点1的sgRNA的编码序列、靶向靶位点2的sgRNA的编码序列,每个sgRNA的编码序列前均包括用于启动sgRNA的编码序列表达的AtU6-26启动子。
3、转基因植株的获得
将步骤2获得的CRISPR/Cas9载体通过热激转化转至农杆菌感受态细胞GV3101(农杆菌GV3101感受态细胞购自北京奥森鼎信生物技术有限公司,公众可通过购买获得),得到重组菌GV3101/CRISPR/Cas9。
再将重组菌GV3101/CRISPR/Cas9采用农杆菌侵染番茄子叶外植体的方法(重组农杆菌进行28℃扩繁,扩繁后的菌液用于番茄子叶外植体)侵染野生型番茄AC的子叶外植体,经过卡那抗性筛选后获得T0代转基因番茄植株。
4、SlDMP基因发生突变的转基因植株鉴定
采集步骤3获得的T0代转基因番茄植株叶片,并提取基因组DNA作为模板,采用如下引物进行PCR扩增,得到不同株系的PCR扩增产物。
SlDMP基因突变序列检测引物的序列如下:
SlDMPF2:ACTGCTTAGGATATTAACTGACCC;
SlDMPR1:TTTTGGCACATCGACACCAAG。
将不同株系的PCR扩增产物进行Sanger测序,根据测序结果与野生型番茄AC的SlDMP基因进行比对。根据以下原则对SlDMP的基因型进行鉴定。
自靶位点序列起具有双峰特征的序列,则该株系的基因型为杂合基因型(2条同源染色体中的1条染色体上的SlDMP基因突变,且另1条染色体上的SlDMP基因未突变),该株系为T0代转基因番茄杂合突变型株系;
自靶位点序列起具有特异单峰特征的序列,若与野生型番茄AC的SlDMP基因序列相同,则该株系的基因型为野生型,即SlDMP基因序列没有发生突变;若与野生型番茄AC的SlDMP基因序列不同,则该株系的基因型为纯合基因型(2条同源染色体上的SlDMP基因发生突变),该株系为T0代转基因番茄纯合突变型株系。
表5、T0代转基因番茄的SlDMP基因突变类型
Figure BDA0002509939840000141
Figure BDA0002509939840000151
5、T1代转基因番茄的基因型鉴定
将步骤4获得的T0代转基因番茄SlDMP基因突变株系T0-12和T0-34自交,收获种子后再播种,得到T1代转基因番茄。鉴定T1代转基因番茄的SlDMP基因的基因型,具体方法如下:以T1代转基因番茄的基因组DNA为模板,利用SlDMP(SlDMPF2和SlDMPR1)的突变序列检测引物按照步骤4中的方法鉴定T1代转基因番茄SlDMP基因的基因型。
最终获得的T1代转基因番茄SlDMP基因突变纯合型株系有sldmp-1和sldmp-2,各个株系的突变类型如下:
经测序鉴定表明:与野生型番茄AC的基因组DNA相比,T1代转基因番茄SlDMP基因突变纯合型株系sldmp-1的差异仅在于在编码SlDMP蛋白的基因中发生了一个碱基C的插入,该插入的碱基位于序列5第92-93位之间。
经测序鉴定表明:与野生型番茄AC的基因组DNA相比,T1代转基因番茄SlDMP基因突变纯合型株系sldmp-2的差异仅在于在编码SlDMP蛋白的基因中发生了片段缺失,该缺失片段位于序列5第93-249位。
二、SlDMP基因敲除的番茄突变体在诱导产生单倍体中的应用
(一)SlDMP基因敲除的番茄突变体的植株表现和结实率分析
对比野生型番茄AC和AC背景下敲除SlDMP基因的番茄突变体植株表现,可以发现SlDMP基因敲除后并不影响植株的长势(图6)。对每个番茄自交果实的种子数目进行统计,野生型的每个自交果实平均约产生79.5粒种子,而sldmp突变体仅产生17粒,显著低于野生型(表6)。表明SlDMP基因突变后导致了结实率下降,暗示了sldmp突变体具有单倍体诱导的能力。
表6、sldmp突变体自交结实数目统计
材料 统计果穗数 平均结实数
WT 12 79.5±24.1
sldmp-1 14 19.7±7.1
sldmp-2 23 15.3±6.6
注:WT为野生型番茄AC。
(二)SlDMP基因敲除的番茄突变体的单倍体杂交诱导能力鉴定
将sldmp突变体与番茄AC和Micro-Tom杂交获得的F1代材料进行杂交获得杂交后代,通过如下方法对杂交后代中的单倍体进行鉴别:
1、荧光标记鉴别
CRISPR/Cas9载体上携带启动子AtOLEO1驱动TagRFP(Entacmaea quadricolor)的表达元件。由于启动子AtOLEO1在成熟的种子胚中特异表达,可通过荧光灯对TagRFP的荧光信号进行观察。因此,用携带该表达元件的突变体为父本与其它不携带荧光的母本材料杂交,所得到的种子中,二倍体种子的胚由于具有父本的基因组而表现出红色荧光,而单倍体种子的胚由于来源于母本而表现为无荧光或弱荧光(图7)。
2、分子标记鉴别
将上述步骤1鉴定出的不具有荧光的种子进一步种植,提取其基因组DNA,采用番茄AC与Micro-Tom杂交获得的F1代和SlDMP基因敲除的番茄突变体间多态性引物SlDMPF2+SlDMPR1进行PCR扩增,并将扩增产物进行琼脂糖带型检测或者测序,若待测单株的扩增产物表现为1条带或测序结果为单一峰图,认为该单株条带为母本带型,不存在父本材料的带型,则该单株是母本单倍体。若待测单株的扩增产物表现为2条带或测序结果为杂合峰图,认为该单株条带为番茄AC与Micro-Tom杂交获得的F1代和SlDMP基因敲除的番茄突变体的杂合带型,则该单株是正常杂交的后代,是二倍体。
3、成熟植株表型鉴别
对上述步骤1和2鉴定出的植株进一步观察其表型,单倍体具有植株矮小,叶片较窄,且上冲,株型紧凑,雄性不育等特征,二倍体则表现为植株高大,叶片宽大,披散,育性正常。
4、流式细胞检测叶片鉴别
将上述步骤3中获得的表现为单倍体性状植株进行流式细胞检测,具体方法如下:提取待测植株幼嫩叶片的细胞核,以二倍体番茄叶片作为对照;再用流式细胞仪器检测信号,首先检测二倍体细胞核信号,并将二倍体细胞核信号峰位设为100(由于二倍体细胞内的遗传物质是单倍体细胞内遗传物质的两倍,因此,单倍体细胞核信号峰位在50附近出现)。若待测植株细胞核信号峰出现在50附近,则认为该待测植株为单倍体植株。若待测植株的信号峰出现在100附近,则认为其与二倍体细胞核信号强度富集位置相同,该待测植株为二倍体(图8)。
统计上述鉴定结果并按照如下公式计算诱导率:诱导率(%)=(母本单倍体株数/总株数)×100。SlDMP基因突变后与其他材料杂交,在杂交后代中可获得母本单倍体。
表7、sldmp突变体杂交后代中单倍体诱导率统计
杂交组合 总植株数 单倍体数 单倍体诱导率(%)
F<sub>1</sub>×WT 954 0 0.00
F<sub>1</sub>×sldmp-1 323 2 0.62
F<sub>1</sub>×sldmp-2 629 3 0.99
注:F1为番茄AC和Micro-Tom杂交的后代,WT为野生型番茄AC。
序列表
<110>中国农业大学
<120>孤雌生殖单倍体诱导基因DMP及其应用
<160>12
<170>PatentIn version 3.5
<210>1
<211>856
<212>DNA
<213>Artificial Sequence
<400>1
ccgtcgtact aaagatagtt cgaacaaaaa tccaaaacac atttctcatt tcacaaaaca 60
aacgaaaact attgagtcac aaaacacaga gagaatggag aaaacagagg aaagcgtcgg 120
aatcagagtt tacacgacga caacgacgca aaatccgtca ccaacatcgt ctcggtcgcc 180
caaacctgtc cctctctctt cactgcctat gcttccggca ggagccgccg cgggaggagg 240
aaaaggtaga aaacgtcgca tggtggcgaa aggagttcaa aaaacggttt cgaagacatc 300
aatgctcgtc aatttccttc cgacaggaac tctcttgatg ttcgaaatgg ttcttccgac 360
aatctaccgt gacggagact gtaacggaat caacacactc atgattcatc ttctcttgct 420
tctttgcgca atgtcttgtt tcttcttcca tttcaccgac agtttcaaag cctccgatgg 480
gaaaatttac tacggttttg tgactccacg tggactcgcg gtgttcatga aaccaccctc 540
gccggggttt ggaggcggag atgtgattgc agagaaggag attccggtga cggatgagag 600
gtataagttg agggttaatg actttgtgca ttcagtgatg agtgttttgg tttttatggc 660
gatcgcgttt tcggatcgga gagtcacagg gtgtttgttt ccaggaaaag agaaggagat 720
ggatcaagtt atggagagtt ttccgttaat ggtcggaatt gtttgcagtg ctttgtttct 780
tgtttttccg accagtcgat acggtgtcgg atgcatgtct acataataac taatttcact 840
tttctgttgt tttgtg 856
<210>2
<211>243
<212>PRT
<213>Artificial Sequence
<400>2
Met Glu Lys Thr Glu Glu Ser Val Gly Ile Arg Val Tyr Thr Thr Thr
1 5 10 15
Thr Thr Gln Asn Pro Ser Pro Thr Ser Ser Arg Ser Pro Lys Pro Val
20 25 30
Pro Leu Ser Ser Leu Pro Met Leu Pro Ala Gly Ala Ala Ala Gly Gly
35 40 45
Gly Lys Gly Arg Lys Arg Arg Met Val Ala Lys Gly Val Gln Lys Thr
50 55 60
Val Ser Lys Thr Ser Met Leu Val Asn Phe Leu Pro Thr Gly Thr Leu
65 70 75 80
Leu Met Phe Glu Met Val Leu Pro Thr Ile Tyr Arg Asp Gly Asp Cys
85 90 95
Asn Gly Ile Asn Thr Leu Met Ile His Leu Leu Leu Leu Leu Cys Ala
100 105 110
Met Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe Lys Ala Ser Asp
115 120 125
Gly Lys Ile Tyr Tyr Gly Phe Val Thr Pro Arg Gly Leu Ala Val Phe
130 135 140
Met Lys Pro Pro Ser Pro Gly Phe Gly Gly Gly Asp Val Ile Ala Glu
145 150 155 160
Lys Glu Ile Pro Val Thr Asp Glu Arg Tyr Lys Leu Arg Val Asn Asp
165 170 175
Phe Val His Ser Val Met Ser Val Leu Val Phe Met Ala Ile Ala Phe
180 185 190
Ser Asp Arg Arg Val Thr Gly Cys Leu Phe Pro Gly Lys Glu Lys Glu
195 200 205
Met Asp Gln Val Met Glu Ser Phe Pro Leu Met Val Gly Ile Val Cys
210 215 220
Ser Ala Leu Phe Leu Val Phe Pro Thr Ser Arg Tyr Gly Val Gly Cys
225 230 235 240
Met Ser Thr
<210>3
<211>992
<212>DNA
<213>Artificial Sequence
<400>3
cgatgaaact ctataaccgt caataaccgc cgcgatttga aaaataaata caaaaatctc 60
attctccatt aaaccattta acacaacata cgaaaaactg gtaaatcaca aaagaaaaaa 120
acagagagaa acacacgaaa atggagaaaa cagaggaaag cgtcggaatc agagtttaca 180
cggcgactcc gccgcaaaaa ccatcaccat caccaccttc tcgttcacca aaacccgtct 240
taatctcttc attgccttcc ctcccgtcag gagccgccgc tggaggagga agaggtcgaa 300
aacgtcgcat ggtggcgcaa ggagttcaaa aaacggtttc gaagacatca atgctcgtca 360
acttccttcc gacaggaaca ctcttgatgt tcgaaatggt tcttccatca atataccgtg 420
acggagactg taacggaatc aacacactca tgattcatct cctcttgctt ctttgcgcaa 480
tgtcttgttt cttcttccat tttaccgaca gtttcaaagc atccgatggg aagatctact 540
acggtttcgt gacgccacgt ggactcgcgg tgttcatgaa accgccgcct ccagagtttg 600
gtggcggaga tgttatagcg gaggcagaga ttccggtgac tgatgatagg tataagttga 660
cggttaatga ctttgttcat gcagtgatga gcgttttggt gtttatggcg attgcgtttt 720
cggatcgaag agtcacggga tgtttgtttc cagggaaaga gaaagagatg gatcaagtta 780
tggagagttt tccaataatg gttggaattg tttgtagtgc tttgtttctt gtttttccga 840
ccactcgata tggtgttggt tgcatgactg gttaatttat tttcactttt ctgttttttg 900
gtttgtttta gtatctattt cgtattttcc ttgtaattta gattatctga tttaaactcc 960
aatgttctac tatttttatc tattgtattg tt 992
<210>4
<211>244
<212>PRT
<213>Artificial Sequence
<400>4
Met Glu Lys Thr Glu Glu Ser Val Gly Ile Arg Val Tyr Thr Ala Thr
1 5 10 15
Pro Pro Gln Lys Pro Ser Pro Ser Pro Pro Ser Arg Ser Pro Lys Pro
20 25 30
Val Leu Ile Ser Ser Leu Pro Ser Leu Pro Ser Gly Ala Ala Ala Gly
35 40 45
Gly Gly Arg Gly Arg Lys Arg Arg Met Val Ala Gln Gly Val Gln Lys
50 55 60
Thr Val Ser Lys Thr Ser Met Leu Val Asn Phe Leu Pro Thr Gly Thr
65 70 75 80
Leu Leu Met Phe Glu Met Val Leu Pro Ser Ile Tyr Arg Asp Gly Asp
85 90 95
Cys Asn Gly Ile Asn Thr Leu Met Ile His Leu Leu Leu Leu Leu Cys
100 105 110
Ala Met Ser Cys Phe Phe Phe His Phe Thr Asp Ser Phe Lys Ala Ser
115 120 125
Asp Gly Lys Ile Tyr Tyr Gly Phe Val Thr Pro Arg Gly Leu Ala Val
130 135 140
Phe Met Lys Pro Pro Pro Pro Glu Phe Gly Gly Gly Asp Val Ile Ala
145 150 155 160
Glu Ala Glu Ile Pro Val Thr Asp Asp Arg Tyr Lys Leu Thr Val Asn
165 170 175
Asp Phe Val His Ala Val Met Ser Val Leu Val Phe Met Ala Ile Ala
180 185 190
Phe Ser Asp Arg Arg Val Thr Gly Cys Leu Phe Pro Gly Lys Glu Lys
195 200 205
Glu Met Asp Gln Val Met Glu Ser Phe Pro Ile Met Val Gly Ile Val
210 215 220
Cys Ser Ala Leu Phe Leu Val Phe Pro Thr Thr Arg Tyr Gly Val Gly
225 230 235 240
Cys Met Thr Gly
<210>5
<211>757
<212>DNA
<213>Artificial Sequence
<400>5
atggagcaaa ctagtgaagg aattggaata aaaatgtata gtacatcgaa acgcgtcgat 60
aattcatcgt ctatgtatcc tactaattta ccacaaggtg aaataatccc agaattacca 120
ataccaattg gtggtaaaaa aagaagagca atggcaaatg gtgtacaaaa aacactttca 180
aaaacttcat tacttgttaa ttttctccca acgggaaccc ttttaacatt tgaaatgtta 240
cttccctcag tatttggtaa aggagattgt tcaccaatta ctacatttat gattttaacg 300
ttacttggac tttgtacttt gtcatgtttt ttctttcatt ttaccgatag ttttcgaggt 360
cctgatggta aaatttacta tggttttgtt acaccaagag gtttgaaagt tttcaagact 420
ggacttggtg tcgatgtgcc aaaagatgaa aggtacattg tgggagtgac agattttgta 480
catgcaatga tgtctgtttt ggtgtttgtg gcaattgcat tttctgatca cagagtaaca 540
ctttgtctat ttcctggaca tgctaaagaa cttgatgaaa ttatgaggag ttttccatta 600
atggttggag ttatttgtag tggacttttt cttgtttttc ctaattcgag atatggtgtt 660
ggatgtatgt ctgcttagat atctacgttt acattctttc atgtattgta atatacgttg 720
gttgatattt atttaaaatc tatctatctt gtattga 757
<210>6
<211>225
<212>PRT
<213>Artificial Sequence
<400>6
Met Glu Gln Thr Ser Glu Gly Ile Gly Ile Lys Met Tyr Ser Thr Ser
1 5 10 15
Lys Arg Val Asp Asn Ser Ser Ser Met Tyr Pro Thr Asn Leu Pro Gln
20 25 30
Gly Glu Ile Ile Pro Glu Leu Pro Ile Pro Ile Gly Gly Lys Lys Arg
35 40 45
Arg Ala Met Ala Asn Gly Val Gln Lys Thr Leu Ser Lys Thr Ser Leu
50 55 60
Leu Val Asn Phe Leu Pro Thr Gly Thr Leu Leu Thr Phe Glu Met Leu
65 70 75 80
Leu Pro Ser Val Phe Gly Lys Gly Asp Cys Ser Pro Ile Thr Thr Phe
85 90 95
Met Ile Leu Thr Leu Leu Gly Leu Cys Thr Leu Ser Cys Phe Phe Phe
100 105 110
His Phe Thr Asp Ser Phe Arg Gly Pro Asp Gly Lys Ile Tyr Tyr Gly
115 120 125
Phe Val Thr Pro Arg Gly Leu Lys Val Phe Lys Thr Gly Leu Gly Val
130 135 140
Asp Val Pro Lys Asp Glu Arg Tyr Ile Val Gly Val Thr Asp Phe Val
145 150 155 160
His Ala Met Met Ser Val Leu Val Phe Val Ala Ile Ala Phe Ser Asp
165 170 175
His Arg Val Thr Leu Cys Leu Phe Pro Gly His Ala Lys Glu Leu Asp
180 185 190
Glu Ile Met Arg Ser Phe Pro Leu Met Val Gly Val Ile Cys Ser Gly
195 200 205
Leu Phe Leu Val Phe Pro Asn Ser Arg Tyr Gly Val Gly Cys Met Ser
210 215 220
Ala
225
<210>7
<211>1447
<212>DNA
<213>Artificial Sequence
<400>7
catcttcatt cttaagatat gaagataatc ttcaaaaggc ccctgggaat ctgaaagaag 60
agaagcaggc ccatttatat gggaaagaac aatagtattt cttatatagg cccatttaag 120
ttgaaaacaa tcttcaaaag tcccacatcg cttagataag aaaacgaagc tgagtttata 180
tacagctaga gtcgaagtag tgattgagaa aacagaggaa agcgtgtttt agagctagaa 240
atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg 300
ctttttttct agacccagct ttcttgtaca aagttggcat tacgctttac gaattcccat 360
ggggagcatc ttcattctta agatatgaag ataatcttca aaaggcccct gggaatctga 420
aagaagagaa gcaggcccat ttatatggga aagaacaata gtatttctta tataggccca 480
tttaagttga aaacaatctt caaaagtccc acatcgctta gataagaaaa cgaagctgag 540
tttatataca gctagagtcg aagtagtgat tgaagaggtc gaaaacgtcg cagttttaga 600
gctagaaata gcaagttaaa ataaggctag tccgttatca acttgaaaaa gtggcaccga 660
gtcggtgctt tttttctaga cccagctttc ttgtacaaag ttggcattac gctcagagaa 720
ttcgcatgcg gagcatcttc attcttaaga tatgaagata atcttcaaaa ggcccctggg 780
aatctgaaag aagagaagca ggcccattta tatgggaaag aacaatagta tttcttatat 840
aggcccattt aagttgaaaa caatcttcaa aagtcccaca tcgcttagat aagaaaacga 900
agctgagttt atatacagct agagtcgaag tagtgattgt caagagtgtt cctgtcggag 960
ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg 1020
gcaccgagtc ggtgcttttt ttctagaccc agctttcttg tacaaagttg gcattacgct 1080
tgtggaattc gcatgcggag catcttcatt cttaagatat gaagataatc ttcaaaaggc 1140
ccctgggaat ctgaaagaag agaagcaggc ccatttatat gggaaagaac aatagtattt 1200
cttatatagg cccatttaag ttgaaaacaa tcttcaaaag tcccacatcg cttagataag 1260
aaaacgaagc tgagtttata tacagctaga gtcgaagtag tgattgatga acaccgcgag 1320
tccacggttt tagagctaga aatagcaagt taaaataagg ctagtccgtt atcaacttga 1380
aaaagtggca ccgagtcggt gctttttttc tagacccagc tttcttgtac aaagttggca 1440
ttacgct 1447
<210>8
<211>714
<212>DNA
<213>Artificial Sequence
<400>8
catcttcatt cttaagatat gaagataatc ttcaaaaggc ccctgggaat ctgaaagaag 60
agaagcaggc ccatttatat gggaaagaac aatagtattt cttatatagg cccatttaag 120
ttgaaaacaa tcttcaaaag tcccacatcg cttagataag aaaacgaagc tgagtttata 180
tacagctaga gtcgaagtag tgattgtatc ctactaattt accacagttt tagagctaga 240
aatagcaagt taaaataagg ctagtccgtt atcaacttga aaaagtggca ccgagtcggt 300
gctttttttc tagacccagc tttcttgtac aaagttggca ttacgcttgt ggaattcctc 360
gagggagcat cttcattctt aagatatgaa gataatcttc aaaaggcccc tgggaatctg 420
aaagaagaga agcaggccca tttatatggg aaagaacaat agtatttctt atataggccc 480
atttaagttg aaaacaatct tcaaaagtcc cacatcgctt agataagaaa acgaagctga 540
gtttatatac agctagagtc gaagtagtga ttgtctcctt taccaaatac tgagttttag 600
agctagaaat agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg 660
agtcggtgct ttttttctag acccagcttt cttgtacaaa gttggcatta cgct 714
<210>9
<211>6137
<212>DNA
<213>Artificial Sequence
<400>9
ctcaactttt gattcgctat ttgcagtgca cctgtggcgt tcatcacatc ttttgtggca 60
ctgtttgcac tggtcattgc tattacaaag gaccttcctg atgttgaagg agatcgaaag 120
taagtaactg cacgcataac cattttcttt ccgctctttg gctcaatcca tttgacagtc 180
aaagacaatg tttaaccagc tccgtttgat atattgtctt tatgtgtttg ttcaagcatg 240
tttagttaat catgcctttg attgatcttg aataggttcc aaatatcaac cctggcaaca 300
aaacttggag tgagaaacat tgcattcctc ggttctggac ttctgctagt aaattatgtt 360
tcagccatat cactagcttt ctacatgcct caggtgaatt catctatttc cgtcttaact 420
atttcggtta attaaagcac gaacaccatt actgcatgta gaagcttgat aaactatcgc 480
caccaattta tttttgttgc gatattgtta ctttcctcag tatgcagctt tgaaaagacc 540
aaccctctta tcctttaaca atgaacaggt ttttagaggt agcttgatga ttcctgcaca 600
tgtgatcttg gcttcaggct taattttcca ggtaaagcat tatgagatac tcttatatct 660
cttacatact tttgagataa tgcacaagaa cttcataact atatgcttta gtttctgcat 720
ttgacactgc caaattcatt aatctctaat atctttgttg ttgatctttg gtagacatgg 780
gtactagaaa aagcaaacta caccaaggta aaatactttt gtacaaacat aaactcgtta 840
tcacggaaca tcaatggagt gtatatctaa cggagtgtag aaacatttga ttattgcagg 900
aagctatctc aggatattat cggtttatat ggaatctctt ctacgcagag tatctgttat 960
tccccttcct ctagctttca atttcatggt gaggatatgc agttttcttt gtatatcatt 1020
cttcttcttc tttgtagctt ggagtcaaaa tcggttcctt catgtacata catcaaggat 1080
atgtccttct gaatttttat atcttgcaat aaaaatgctt gtaccaattg aaacaccagc 1140
tttttgagtt ctatgatcac tgacttggtt ctaaccaaaa aaaaaaaaat gtttaattta 1200
catatctaaa agtaggttta gggaaaccta aacagtaaaa tatttgtata ttattcgaat 1260
ttcactcatc ataaaaactt aaattgcacc ataaaatttt gttttactat taatgatgta 1320
atttgtgtaa cttaagataa aaataatatt ccgtaagtta accggctaaa accacgtata 1380
aaccagggaa cctgttaaac cggttcttta ctggataaag aaatgaaagc ccatgtagac 1440
agctccatta gagcccaaac cctaaatttc tcatctatat aaaaggagtg acattagggt 1500
ttttgttcgt cctcttaaag cttctcgttt tctctgccgt ctctctcatt cgcgcgacgc 1560
aaacgatctt caggtgatct tctttctcca aatcctctct cataactctg atttcgtact 1620
tgtgtatttg agctcacgct ctgtttctct caccacagcc tactgtattt ttacaacaat 1680
taccaacaac aacaaacaac aaacaacatt acaattacta tttacaatta caatggataa 1740
gaagtactct atcggactcg atatcggaac taactctgtg ggatgggctg tgatcaccga 1800
tgagtacaag gtgccatcta agaagttcaa ggttctcgga aacaccgata ggcactctat 1860
caagaaaaac cttatcggtg ctctcctctt cgattctggt gaaactgctg aggctaccag 1920
actcaagaga accgctagaa gaaggtacac cagaagaaag aacaggatct gctacctcca 1980
agagatcttc tctaacgaga tggctaaagt ggatgattca ttcttccaca ggctcgaaga 2040
gtcattcctc gtggaagaag ataagaagca cgagaggcac cctatcttcg gaaacatcgt 2100
tgatgaggtg gcataccacg agaagtaccc tactatctac cacctcagaa agaagctcgt 2160
tgattctact gataaggctg atctcaggct catctacctc gctctcgctc acatgatcaa 2220
gttcagagga cacttcctca tcgagggtga tctcaaccct gataactctg atgtggataa 2280
gttgttcatc cagctcgtgc agacctacaa ccagcttttc gaagagaacc ctatcaacgc 2340
ttcaggtgtg gatgctaagg ctatcctctc tgctaggctc tctaagtcaa gaaggcttga 2400
gaacctcatt gctcagctcc ctggtgagaa gaagaacgga cttttcggaa acttgatcgc 2460
tctctctctc ggactcaccc ctaacttcaa gtctaacttc gatctcgctg aggatgcaaa 2520
gctccagctc tcaaaggata cctacgatga tgatctcgat aacctcctcg ctcagatcgg 2580
agatcagtac gctgatttgt tcctcgctgc taagaacctc tctgatgcta tcctcctcag 2640
tgatatcctc agagtgaaca ccgagatcac caaggctcca ctctcagctt ctatgatcaa 2700
gagatacgat gagcaccacc aggatctcac acttctcaag gctcttgtta gacagcagct 2760
cccagagaag tacaaagaga ttttcttcga tcagtctaag aacggatacg ctggttacat 2820
cgatggtggt gcatctcaag aagagttcta caagttcatc aagcctatcc tcgagaagat 2880
ggatggaacc gaggaactcc tcgtgaagct caatagagag gatcttctca gaaagcagag 2940
gaccttcgat aacggatcta tccctcatca gatccacctc ggagagttgc acgctatcct 3000
tagaaggcaa gaggatttct acccattcct caaggataac agggaaaaga ttgagaagat 3060
tctcaccttc agaatccctt actacgtggg acctctcgct agaggaaact caagattcgc 3120
ttggatgacc agaaagtctg aggaaaccat caccccttgg aacttcgaag aggtggtgga 3180
taagggtgct agtgctcagt ctttcatcga gaggatgacc aacttcgata agaaccttcc 3240
aaacgagaag gtgctcccta agcactcttt gctctacgag tacttcaccg tgtacaacga 3300
gttgaccaag gttaagtacg tgaccgaggg aatgaggaag cctgcttttt tgtcaggtga 3360
gcaaaagaag gctatcgttg atctcttgtt caagaccaac agaaaggtga ccgtgaagca 3420
gctcaaagag gattacttca agaaaatcga gtgcttcgat tcagttgaga tttctggtgt 3480
tgaggatagg ttcaacgcat ctctcggaac ctaccacgat ctcctcaaga tcattaagga 3540
taaggatttc ttggataacg aggaaaacga ggatatcttg gaggatatcg ttcttaccct 3600
caccctcttt gaagatagag agatgattga agaaaggctc aagacctacg ctcatctctt 3660
cgatgataag gtgatgaagc agttgaagag aagaagatac actggttggg gaaggctctc 3720
aagaaagctc attaacggaa tcagggataa gcagtctgga aagacaatcc ttgatttcct 3780
caagtctgat ggattcgcta acagaaactt catgcagctc atccacgatg attctctcac 3840
ctttaaagag gatatccaga aggctcaggt ttcaggacag ggtgatagtc tccatgagca 3900
tatcgctaac ctcgctggat ctcctgcaat caagaaggga atcctccaga ctgtgaaggt 3960
tgtggatgag ttggtgaagg tgatgggaag gcataagcct gagaacatcg tgatcgaaat 4020
ggctagagag aaccagacca ctcagaaggg acagaagaac tctagggaaa ggatgaagag 4080
gatcgaggaa ggtatcaaag agcttggatc tcagatcctc aaagagcacc ctgttgagaa 4140
cactcagctc cagaatgaga agctctacct ctactacctc cagaacggaa gggatatgta 4200
tgtggatcaa gagttggata tcaacaggct ctctgattac gatgttgatc atatcgtgcc 4260
acagtcattc ttgaaggatg attctatcga taacaaggtg ctcaccaggt ctgataagaa 4320
caggggtaag agtgataacg tgccaagtga agaggttgtg aagaaaatga agaactattg 4380
gaggcagctc ctcaacgcta agctcatcac tcagagaaag ttcgataact tgactaaggc 4440
tgagagggga ggactctctg aattggataa ggcaggattc atcaagaggc agcttgtgga 4500
aaccaggcag atcactaagc acgttgcaca gatcctcgat tctaggatga acaccaagta 4560
cgatgagaac gataagttga tcagggaagt gaaggttatc accctcaagt caaagctcgt 4620
gtctgatttc agaaaggatt tccaattcta caaggtgagg gaaatcaaca actaccacca 4680
cgctcacgat gcttacctta acgctgttgt tggaaccgct ctcatcaaga agtatcctaa 4740
gctcgagtca gagttcgtgt acggtgatta caaggtgtac gatgtgagga agatgatcgc 4800
taagtctgag caagagatcg gaaaggctac cgctaagtat ttcttctact ctaacatcat 4860
gaatttcttc aagaccgaga ttaccctcgc taacggtgag atcagaaaga ggccactcat 4920
cgagacaaac ggtgaaacag gtgagatcgt gtgggataag ggaagggatt tcgctaccgt 4980
tagaaaggtg ctctctatgc cacaggtgaa catcgttaag aaaaccgagg tgcagaccgg 5040
tggattctct aaagagtcta tcctccctaa gaggaactct gataagctca ttgctaggaa 5100
gaaggattgg gaccctaaga aatacggtgg tttcgattct cctaccgtgg cttactctgt 5160
tctcgttgtg gctaaggttg agaagggaaa gagtaagaag ctcaagtctg ttaaggaact 5220
tctcggaatc actatcatgg aaaggtcatc tttcgagaag aacccaatcg atttcctcga 5280
ggctaaggga tacaaagagg ttaagaagga tctcatcatc aagctcccaa agtactcact 5340
cttcgaactc gagaacggta gaaagaggat gctcgcttct gctggtgagc ttcaaaaggg 5400
aaacgagctt gctctcccat ctaagtacgt taactttctt tacctcgctt ctcactacga 5460
gaagttgaag ggatctccag aagataacga gcagaagcaa cttttcgttg agcagcacaa 5520
gcactacttg gatgagatca tcgagcagat ctctgagttc tctaaaaggg tgatcctcgc 5580
tgatgcaaac ctcgataagg tgttgtctgc ttacaacaag cacagagata agcctatcag 5640
ggaacaggca gagaacatca tccatctctt cacccttacc aacctcggtg ctcctgctgc 5700
tttcaagtac ttcgatacaa ccatcgatag gaagagatac acctctacca aagaagtgct 5760
cgatgctacc ctcatccatc agtctatcac tggactctac gagactagga tcgatctctc 5820
acagctcggt ggtgattcaa gggctgatcc taagaagaag aggaaggttt gagcttgtca 5880
agcagatcgt tcaaacattt ggcaataaag tttcttaaga ttgaatcctg ttgccggtct 5940
tgcgatgatt atcatataat ttctgttgaa ttacgttaag catgtaataa ttaacatgta 6000
atgcatgacg ttatttatga gatgggtttt tatgattaga gtcccgcaat tatacattta 6060
atacgcgata gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc 6120
atctatgtta ctagatc 6137
<210>10
<211>2311
<212>DNA
<213>Artificial Sequence
<400>10
aatgtcgcgg aacaaatttt aaaactaaat cctaaatttt tctaattttg ttgccaatag 60
tggatatgtg ggccgtatag aaggaatcta ttgaaggccc aaacccatac tgacgagccc 120
aaaggttcgt tttgcgtttt atgtttcggt tcgatgccaa cgccacattc tgagctaggc 180
aaaaaacaaa cgtgtctttg aatagactcc tctcgttaac acatgcagcg gctgcatggt 240
gacgccatta acacgtggcc tacaattgca tgatgtctcc attgacacgt gacttctcgt 300
ctcctttctt aatatatcta acaaacactc ctacctcttc caaaatatat acacatcttt 360
ttgatcaatc tctcattcaa aatctcattc tctctagtaa acaagaacaa aaaaatggcg 420
gatacagcta gaggaaccca tcacgatatc atcggcagag atcagtaccc gatgatgggc 480
cgagatcgtg accagtacca gatgtccgga cgaggatctg actactccaa gtctaggcag 540
attgctaaag ctgcaactgc tgtcacagct ggtggttccc tccttgttct ctccagcctt 600
acccttgttg gaactgtcat agctttgact gttgcaacac ctctgctcgt tatcttcagc 660
ccaatccttg tcccggctct catcacagtt gcactcctca tcaccggttt tctttcctct 720
ggagggtttg gcattgccgc tataaccgtt ttctcttgga tttacaagta agcacacatt 780
tatcatctta cttcataatt ttgtgcaata tgtgcatgca tgtgttgagc cagtagcttt 840
ggatcaattt ttttggtcga ataacaaatg taacaataag aaattgcaaa ttctagggaa 900
catttggtta actaaatacg aaatttgacc tagctagctt gaatgtgtct gtgtatatca 960
tctatatagg taaaatgctt ggtatgatac ctattgattg tgaataggta cgcaacggga 1020
gagcacccac agggatcaga caagttggac agtgcaagga tgaagttggg aagcaaagct 1080
caggatctga aagacagagc tcagtactac ggacagcaac atactggtgg ggaacatgac 1140
cgtgaccgta ctcgtggtgg ccagcacact actatgagcg agctgattaa ggagaacatg 1200
cacatgaagc tgtacatgga gggcaccgtg aacaaccacc acttcaagtg cacatccgag 1260
ggcgaaggca agccctacga gggcacccag accatgagaa tcaaggtggt cgagggcggc 1320
cctctcccct tcgccttcga catcctggct accagcttca tgtacggcag cagaaccttc 1380
atcaaccaca cccagggcat ccccgacttc tttaagcagt ccttccctga gggcttcaca 1440
tgggagagag tcaccacata cgaagatggg ggcgtgctga ccgctaccca ggacaccagc 1500
ctccaggacg gctgcctcat ctacaacgtc aagatcagag gggtgaactt cccatccaac 1560
ggccctgtga tgcagaagaa aacactcggc tgggaggcca acaccgagat gctgtacccc 1620
gctgacggcg gcctggaagg cagaagcgac atggccctga agctcgtggg cgggggccac 1680
ctgatctgca acttcaagac cacatacaga tccaagaaac ccgctaagaa cctcaagatg 1740
cccggcgtct actatgtgga ccacagactg gaaagaatca aggaggccga caaagaaacc 1800
tacgtcgagc agcacgaggt ggctgtggcc agatactgcg acctccctag caaactgggg 1860
cacaagtgag cttaccccac tgatgtcatc gtcatagtcc aataactcca atgtcgggga 1920
gttagtttat gaggaataaa gtgtttagaa tttgatcagg gggagataat aaaagccgag 1980
tttgaatctt tttgttataa gtaatgttta tgtgtgtttc tatatgttgt caaatggtac 2040
catgtttttt ttcctctctt tttgtaactt gcaagtgttg tgttgtactt tatttggctt 2100
ctttgtaagt tggtaacggt ggtctatata tggaaaaggt cttgttttgt taaacttatg 2160
ttagttaact ggattcgtct ttaaccacaa aaagttttca ataagctaca aatttagaca 2220
cgcaagccga tgcagtcatt agtacatata tttattgcaa gtgattacat ggcaacccaa 2280
acttcaaaaa cagtaggttg ctccatttag t 2311
<210>11
<211>5247
<212>DNA
<213>Artificial Sequence
<400>11
gtcaacatgg tggagcacga cactctggtc tactccaaaa atgtcaaaga tacagtctca 60
gaagatcaaa gggctattga gacttttcaa caaaggataa tttcgggaaa cctcctcgga 120
ttccattgcc cagctatctg tcacttcatc gaaaggacag tagaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gctatcattc aagatctctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga ggttccaacc 300
acgtctacaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac tctggtctac 360
tccaaaaatg tcaaagatac agtctcagaa gatcaaaggg ctattgagac ttttcaacaa 420
aggataattt cgggaaacct cctcggattc cattgcccag ctatctgtca cttcatcgaa 480
aggacagtag aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggct 540
atcattcaag atctctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagaggt tccaaccacg tctacaaagc aagtggattg atgtgacatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggaca cgctcgagta taagagctca tttttacaac 780
aattaccaac aacaacaaac aacaaacaac attacaatta catttacaat tatcgataca 840
atggacaaga agtactccat tgggctcgat atcggcacaa acagcgtcgg ctgggccgtc 900
attacggacg agtacaaggt gccgagcaaa aaattcaaag ttctgggcaa taccgatcgc 960
cacagcataa agaagaacct cattggcgcc ctcctgttcg actccgggga gacggccgaa 1020
gccacgcggc tcaaaagaac agcacggcgc agatataccc gcagaaagaa tcggatctgc 1080
tacctgcagg agatctttag taatgagatg gctaaggtgg atgactcttt cttccatagg 1140
ctggaggagt cctttttggt ggaggaggat aaaaagcacg agcgccaccc aatctttggc 1200
aatatcgtgg acgaggtggc gtaccatgaa aagtacccaa ccatatatca tctgaggaag 1260
aagcttgtag acagtactga taaggctgac ttgcggttga tctatctcgc gctggcgcat 1320
atgatcaaat ttcggggaca cttcctcatc gagggggacc tgaacccaga caacagcgat 1380
gtcgacaaac tctttatcca actggttcag acttacaatc agcttttcga agagaacccg 1440
atcaacgcat ccggagttga cgccaaagca atcctgagcg ctaggctgtc caaatcccgg 1500
cggctcgaaa acctcatcgc acagctccct ggggagaaga agaacggcct gtttggtaat 1560
cttatcgccc tgtcactcgg gctgaccccc aactttaaat ctaacttcga cctggccgaa 1620
gatgccaagc ttcaactgag caaagacacc tacgatgatg atctcgacaa tctgctggcc 1680
cagatcggcg accagtacgc agaccttttt ttggcggcaa agaacctgtc agacgccatt 1740
ctgctgagtg atattctgcg agtgaacacg gagatcacca aagctccgct gagcgctagt 1800
atgatcaagc gctatgatga gcaccaccaa gacttgactt tgctgaaggc ccttgtcaga 1860
cagcaactgc ctgagaagta caaggaaatt ttcttcgatc agtctaaaaa tggctacgcc 1920
ggatacattg acggcggagc aagccaggag gaattttaca aatttattaa gcccatcttg 1980
gaaaaaatgg acggcaccga ggagctgctg gtaaagctta acagagaaga tctgttgcgc 2040
aaacagcgca ctttcgacaa tggaagcatc ccccaccaga ttcacctggg cgaactgcac 2100
gctatcctca ggcggcaaga ggatttctac ccctttttga aagataacag ggaaaagatt 2160
gagaaaatcc tcacatttcg gataccctac tatgtaggcc ccctcgcccg gggaaattcc 2220
agattcgcgt ggatgactcg caaatcagaa gagactatca ctccctggaa cttcgaggaa 2280
gtcgtggata agggggcctc tgcccagtcc ttcatcgaaa ggatgactaa ctttgataaa 2340
aatctgccta acgaaaaggt gcttcctaaa cactctctgc tgtacgagta cttcacagtt 2400
tataacgagc tcaccaaggt caaatacgtc acagaaggga tgagaaagcc agcattcctg 2460
tctggagagc agaagaaagc tatcgtggac ctcctcttca agacgaaccg gaaagttacc 2520
gtgaaacagc tcaaagaaga ttatttcaaa aagattgaat gtttcgactc tgttgaaatc 2580
agcggagtgg aggatcgctt caacgcatcc ctgggaacgt atcacgatct cctgaaaatc 2640
attaaagaca aggacttcct ggacaatgag gagaacgagg acattcttga ggacattgtc 2700
ctcaccctta cgttgtttga agatagggag atgattgaag aacgcttgaa aacttacgct 2760
catctcttcg acgacaaagt catgaaacag ctcaagaggc gccgatatac aggatggggg 2820
cggctgtcaa gaaaactgat caatgggatc cgagacaagc agagtggaaa gacaatcctg 2880
gattttctta agtccgatgg atttgccaac cggaacttca tgcagttgat ccatgatgac 2940
tctctcacct ttaaggagga catccagaaa gcacaagttt ctggccaggg ggacagtctc 3000
cacgagcaca tcgctaatct tgcaggtagc ccagctatca aaaagggaat actgcagacc 3060
gttaaggtcg tggatgaact cgtcaaagta atgggaaggc ataagcccga gaatatcgtt 3120
atcgagatgg cccgagagaa ccaaactacc cagaagggac agaagaacag tagggaaagg 3180
atgaagagga ttgaagaggg tataaaagaa ctggggtccc aaatccttaa ggaacaccca 3240
gttgaaaaca cccagcttca gaatgagaag ctctacctgt actacctgca gaacggcagg 3300
gacatgtacg tggatcagga actggacatc aatcggctct ccgactacga cgtggatcat 3360
atcgtgcccc agtcttttct caaagatgat tctattgata ataaagtgtt gacaagatcc 3420
gataaaaata gagggaagag tgataacgtc ccctcagaag aagttgtcaa gaaaatgaaa 3480
aattattggc ggcagctgct gaacgccaaa ctgatcacac aacggaagtt cgataatctg 3540
actaaggctg aacgaggtgg cctgtctgag ttggataaag ccggcttcat caaaaggcag 3600
cttgttgaga cacgccagat caccaagcac gtggcccaaa ttctcgattc acgcatgaac 3660
accaagtacg atgaaaatga caaactgatt cgagaggtga aagttattac tctgaagtct 3720
aagctggttt cagatttcag aaaggacttt cagttttata aggtgagaga gatcaacaat 3780
taccaccatg cgcatgatgc ctacctgaat gcagtggtag gcactgcact tatcaaaaaa 3840
tatcccaagc ttgaatctga atttgtttac ggagactata aagtgtacga tgttaggaaa 3900
atgatcgcaa agtctgagca ggaaataggc aaggccaccg ctaagtactt cttttacagc 3960
aatattatga attttttcaa gaccgagatt acactggcca atggagagat tcggaagcga 4020
ccacttatcg aaacaaacgg agaaacagga gaaatcgtgt gggacaaggg tagggatttc 4080
gcgacagtcc ggaaggtcct gtccatgccg caggtgaaca tcgttaaaaa gaccgaagta 4140
cagaccggag gcttctccaa ggaaagtatc ctcccgaaaa ggaacagcga caagctgatc 4200
gcacgcaaaa aagattggga ccccaagaaa tacggcggat tcgattctcc tacagtcgct 4260
tacagtgtac tggttgtggc caaagtggag aaagggaagt ctaaaaaact caaaagcgtc 4320
aaggaactgc tgggcatcac aatcatggag cgatcaagct tcgaaaaaaa ccccatcgac 4380
tttctcgagg cgaaaggata taaagaggtc aaaaaagacc tcatcattaa gcttcccaag 4440
tactctctct ttgagcttga aaacggccgg aaacgaatgc tcgctagtgc gggcgagctg 4500
cagaaaggta acgagctggc actgccctct aaatacgtta atttcttgta tctggccagc 4560
cactatgaaa agctcaaagg atctcccgaa gataatgagc agaagcagct gttcgtggaa 4620
caacacaaac actaccttga tgagatcatc gagcaaataa gcgaattctc caaaagagtg 4680
atcctcgccg acgctaacct cgataaggtg ctttctgctt acaataagca cagggataag 4740
cccatcaggg agcaggcaga aaacattatc cacttgttta ctctgaccaa cttgggcgcg 4800
cctgcagcct tcaagtactt cgacaccacc atagacagaa agcggtacac ctctacaaag 4860
gaggtcctgg acgccacact gattcatcag tcaattacgg ggctctatga aacaagaatc 4920
gacctctctc agctcggtgg agacagcagg gctgacccca agaagaagag gaaggtgtga 4980
gcttgtcaag cagatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt 5040
gccggtcttg cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt 5100
aacatgtaat gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta 5160
tacatttaat acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc 5220
gcggtgtcat ctatgttact agatcga 5247
<210>12
<211>1867
<212>DNA
<213>Artificial Sequence
<400>12
cggagaatta agggagtcac gttatgaccc ccgccgatga cgcgggacaa gccgttttac 60
gtttggaact gacagaaccg caacgttgaa ggagccactg agccgcgggt ttctggagtt 120
taatgagcta agcacatacg tcagaaacca ttattgcgcg ttcaaaagtc gcctaaggtc 180
actatcagct agcaaatatt tcttgtcaaa aatgctccac tgacgttcca taaattcccc 240
tcggtatcca attagagtct catattcact ctcctatttt tacaacaatt accaacaaca 300
acaaacaaca aacaacatta caattacatt tacaattacc atggttgaac aagatggatt 360
gcacgcaggt tctccggccg cttgggtgga gaggctattc ggctatgact gggcacaaca 420
gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca gcgcaggggc gcccggttct 480
ttttgtcaag accgacctgt ccggtgccct gaatgaactg caggacgagg cagcgcggct 540
atcgtggctg gccacgacgg gcgttccttg cgcagctgtg ctcgacgttg tcactgaagc 600
gggaagggac tggctgctat tgggcgaagt gccggggcag gatctcctgt catctcacct 660
tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg cggcggctgc atacgcttga 720
tccggctacc tgcccattcg accaccaagc gaaacatcgc atcgagcgag cacgtactcg 780
gatggaagcc ggtcttgtcg atcaggatga tctggacgaa gagcatcagg ggctcgcgcc 840
agccgaactg ttcgccaggc tcaaggcgcg catgcccgac ggcgaggatc tcgtcgtgac 900
tcatggcgat gcctgcttgc cgaatatcat ggtggaaaat ggccgctttt ctggattcat 960
cgactgtggc cggctgggtg tggcggaccg ctatcaggac atagcgttgg ctacccgtga 1020
tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc ctcgtgcttt acggtatcgc 1080
cgctcccgat tcgcagcgca tcgccttcta tcgccttctt gacgagttct tctgagcggg 1140
actctggggt tcgctagagt cctgctttaa tgagatatgc gagacgccta tgatcgcatg 1200
atatttgctt tcaattctgt tgtgcacgtt gtaaaaaacc tgagcatgtg tagctcagat 1260
ccttaccgcc ggtttcggtt cattctaatg aatatatcac ccgttactat cgtattttta 1320
tgaataatat tctccgttca atttactgat tgtaccctac tacttatatg tacaatatta 1380
aaatgaaaac aatatattgt gctgaatagg tttatagcga catctatgat agagcgccac 1440
aataacaaac aattgcgttt tattattaca aatccaattt taaaaaaagc ggcagaaccg 1500
gtcaaaccta aaagactgat tacataaatc ttattcaaat ttcaaaagtg ccccaggggc 1560
tagtatctac gacacaccga gcggcgaact aataacgctc actgaaggga actccggttc 1620
cccgccggcg cgcatgggtg agattccttg aagttgagta ttggccgtcc gctctaccga 1680
aagttacggg caccattcaa cccggtccag cacggcggcc gggtaaccga cttgctgccc 1740
cgagaattat gcagcatttt tttggtgtat gtgggcccca aatgaagtgc aggtcaaacc 1800
ttgacagtga cgacaaatcg ttgggcgggt ccagggcgaa ttttgcgaca acatgtcgag 1860
gctcagc 1867

Claims (10)

1.一种植物单倍体诱导系的制备方法,包括如下步骤:沉默或抑制植物基因组中DMP基因的表达和/或活性或敲除DMP基因,得到转基因植物,即为植物单倍体诱导系;所述植物为双子叶植物;
所述DMP基因编码的蛋白质为如下(1)或(2)或(3)或(4)所示的蛋白质:
(1)氨基酸序列是序列2或序列4或序列6所示的蛋白质;
(2)在序列2或序列4或序列6所示的蛋白质的N端和/或C端连接标签得到的融合蛋白质;
(3)将序列2或序列4或序列6所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的蛋白质;
(4)与序列2或序列4或序列6所示的氨基酸序列具有75%或75%以上的同源性且具有相同功能的蛋白质。
2.根据权利要求1所述的方法,其特征在于:所述双子叶植物为拟南芥时,所述DMP基因为AtDMP8基因和/或AtDMP9基因;所述方法为沉默或抑制拟南芥基因组中AtDMP8基因和/或AtDMP9基因的表达和/或活性或敲除AtDMP8基因和/或AtDMP9基因,得到转基因拟南芥,即为拟南芥单倍体诱导系;
或,所述双子叶植物为番茄时,所述DMP基因为SlDMP基因;所述方法为沉默或抑制番茄基因组中SlDMP基因或敲除SlDMP基因,得到转基因番茄,即为番茄单倍体诱导系。
3.根据权利要求2所述的方法,其特征在于:所述沉默或抑制拟南芥基因组中AtDMP8基因和/或AtDMP9基因的表达和/或活性或敲除AtDMP8基因和/或AtDMP9基因为使拟南芥基因组中AtDMP8基因和/或AtDMP9基因表达量降低或使拟南芥基因组中AtDMP8基因和/或AtDMP9基因发生缺失突变或插入突变或碱基替换;
或,所述沉默或抑制番茄基因组中SlDMP基因的表达和/或活性或敲除SlDMP基因为使番茄基因组中SlDMP基因表达量降低或使番茄基因组中SlDMP基因发生缺失突变或插入突变或碱基替换。
4.根据权利要求3所述的方法,其特征在于:所述使拟南芥基因组中AtDMP8基因和/或AtDMP9基因发生缺失突变或插入突变或碱基替换或所述使番茄基因组中SlDMP基因发生缺失突变或插入突变或碱基替换的方式均为CRISPR/Cas9。
5.根据权利要求4所述的方法,其特征在于:所述拟南芥中,所述CRISPR/Cas9的靶序列为序列1第98-117位、序列3第290-309位、序列3第368-387位和序列1第509-528位;
或,所述番茄中,所述CRISPR/Cas9的靶序列为序列5第76-95位和序列5第247-266位。
6.一种植物单倍体的制备方法,包括如下步骤:将由权利要求1-5任一所述的方法制备的植物单倍体诱导系或其后代进行自交或者作为父本与其他植物材料杂交,得到自交后代或杂交后代,即为所述植物单倍体;所述植物为双子叶植物。
7.根据权利要求6所述的方法,其特征在于:所述方法还包括如下步骤:将所述自交后代或所述杂交后代单株进行荧光标记鉴定和/或单倍体性状鉴定和/或叶片倍性鉴定和/或分子标记鉴定,选取至少一种方法鉴定为单倍体的后代单株为植物单倍体。
8.如下1)-5)任一种应用:
1)由权利要求1-5任一所述的方法制备得到的植物单倍体诱导系在培育植物单倍体中的应用;
2)沉默或抑制植物基因组中AtDMP8基因和/或AtDMP9基因的表达和/或活性或敲除AtDMP8基因和/或AtDMP9基因的物质在培育植物单倍体诱导系或植物单倍体中的应用;
3)沉默或抑制植物基因组中SlDMP基因的表达和/或活性或敲除SlDMP基因的物质在培育植物单倍体诱导系或植物单倍体中的应用;
4)AtDMP8蛋白质或其相关生物材料和/或AtDMP9蛋白质或其相关生物材料在调控植物单倍体诱导系的诱导率或提高植物单倍体诱导系的诱导率或培育植物单倍体诱导系或植物单倍体中的应用;
5)SlDMP蛋白质或其相关生物材料在调控植物单倍体诱导系的诱导率或提高植物单倍体诱导系的诱导率或培育植物单倍体诱导系或植物单倍体中的应用;
所述AtDMP8蛋白质是如下a1)或a2)或a3)或a4)所示的蛋白质:
a1)氨基酸序列是序列2所示的蛋白质;
a2)在序列2所示的蛋白质的N端和/或C端连接标签得到的融合蛋白质;
a3)将序列2所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的蛋白质;
a4)与序列2所示的氨基酸序列具有75%或75%以上的同源性且具有相同功能的蛋白质;
所述AtDMP9蛋白质是如下b1)或b2)或b3)或b4)所示的蛋白质:
b1)氨基酸序列是序列4所示的蛋白质;
b2)在序列4所示的蛋白质的N端和/或C端连接标签得到的融合蛋白质;
b3)将序列4所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的蛋白质;
b4)与序列4所示的氨基酸序列具有75%或75%以上的同源性且具有相同功能的蛋白质。
所述SlDMP蛋白质是如下c1)或c2)或c3)或c4)所示的蛋白质:
c1)氨基酸序列是序列6所示的蛋白质;
c2)在序列6所示的蛋白质的N端和/或C端连接标签得到的融合蛋白质;
c3)将序列6所示的氨基酸序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的蛋白质;
c4)与序列6所示的氨基酸序列具有75%或75%以上的同源性且具有相同功能的蛋白质。
9.根据权利要求8所述的应用,其特征在于:所述AtDMP8蛋白质或AtDMP9蛋白质或SlDMP蛋白质相关生物材料为下述A1)至A12)中的任一种:
A1)编码所述AtDMP8蛋白质或AtDMP9蛋白质或SlDMP蛋白质的核酸分子;
A2)含有A1)所述核酸分子的表达盒;
A3)含有A1)所述核酸分子的重组载体;
A4)含有A2)所述表达盒的重组载体;
A5)含有A1)所述核酸分子的重组微生物;
A6)含有A2)所述表达盒的重组微生物;
A7)含有A3)所述重组载体的重组微生物;
A8)含有A4)所述重组载体的重组微生物;
A9)含有A1)所述核酸分子的转基因植物细胞系;
A10)含有A2)所述表达盒的转基因植物细胞系;
A11)含有A3)所述重组载体的转基因植物细胞系;
A12)含有A4)所述重组载体的转基因植物细胞系。
10.根据权利要求9所述的应用,其特征在于:A1)所述核酸分子为如下B1)或B2)或B3)所示的基因:
B1)其编码序列是序列1或序列3或序列5所示的cDNA分子;
B2)与B1)限定的核苷酸序列具有75%或75%以上同一性,且编码所述AtDMP8蛋白质或AtDMP9蛋白质或SlDMP蛋白质的cDNA分子或基因组DNA分子;
B3)在严格条件下与B1)或B2)限定的核苷酸序列杂交,且编码所述AtDMP8蛋白质或AtDMP9蛋白质或SlDMP蛋白质的cDNA分子或基因组DNA分子。
CN202010457851.4A 2019-05-27 2020-05-27 孤雌生殖单倍体诱导基因dmp及其应用 Active CN111996209B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2019104450823 2019-05-27
CN201910445082 2019-05-27

Publications (2)

Publication Number Publication Date
CN111996209A true CN111996209A (zh) 2020-11-27
CN111996209B CN111996209B (zh) 2022-05-10

Family

ID=73467447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010457851.4A Active CN111996209B (zh) 2019-05-27 2020-05-27 孤雌生殖单倍体诱导基因dmp及其应用

Country Status (8)

Country Link
US (1) US20220403400A1 (zh)
EP (1) EP3978613A4 (zh)
JP (1) JP2022538516A (zh)
CN (1) CN111996209B (zh)
AU (1) AU2020282488B2 (zh)
CL (1) CL2021003137A1 (zh)
WO (1) WO2020239137A1 (zh)
ZA (1) ZA202109641B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113557955A (zh) * 2021-07-19 2021-10-29 中国农业大学 一种基于生殖隔离性状的单倍体诱导系遗传保纯方法
CN113817036A (zh) * 2021-10-21 2021-12-21 中国农业科学院生物技术研究所 Dmp蛋白及其编码基因与应用
CN114350701A (zh) * 2022-01-06 2022-04-15 武汉大学 卵细胞特异表达基因ecs制备被子植物单倍体的方法及应用
CN114525300A (zh) * 2022-01-28 2022-05-24 中国农业科学院深圳农业基因组研究所 多核苷酸和蛋白质的应用及其单倍体诱导系
WO2022117024A1 (zh) * 2020-12-03 2022-06-09 中国农业大学 孤雌生殖单倍体诱导基因及其应用
CN115568416A (zh) * 2022-02-21 2023-01-06 贵州省烟草科学研究院 一种利用烟草白粉病抗性筛选烟草单倍体及评估诱导率的方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023242872A1 (en) * 2022-06-17 2023-12-21 National Institute Of Plant Genome Research Recombinant expression cassettes for modification of glucosinolate content in plants

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HUE055721T2 (hu) * 2013-10-21 2021-12-28 Univ Georgia A parthenogenezis indukciójának génje, az apogámiás reprodukció összetevõje
CN108192912B (zh) * 2017-01-13 2019-05-07 中国农业大学 一种诱导产生玉米母本单倍体的方法
BR112020016171A2 (pt) * 2018-02-08 2020-12-15 China Agricultural University Método para preparar uma linhagem indutora de planta haploide materna, método para preparar uma planta haploide materna, proteína, material biológico relacionado à proteína e uso

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PHILIPP CYPRYS等: "Gamete fusion is facilitated by two sperm cell-expressed DUF679 membrane proteins", 《NATURE PLANTS》 *
王继恩等: "水稻脱粒性的研究进展及展望", 《湖北农业科学》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114656546B (zh) * 2020-12-03 2023-09-19 中国农业大学 孤雌生殖单倍体诱导基因及其应用
WO2022117024A1 (zh) * 2020-12-03 2022-06-09 中国农业大学 孤雌生殖单倍体诱导基因及其应用
CN114656546A (zh) * 2020-12-03 2022-06-24 中国农业大学 孤雌生殖单倍体诱导基因及其应用
CN117069814A (zh) * 2020-12-03 2023-11-17 中国农业大学 孤雌生殖单倍体诱导基因GhDMP及其应用
CN117069814B (zh) * 2020-12-03 2024-04-19 中国农业大学 孤雌生殖单倍体诱导基因GhDMP及其应用
CN113557955A (zh) * 2021-07-19 2021-10-29 中国农业大学 一种基于生殖隔离性状的单倍体诱导系遗传保纯方法
CN113817036A (zh) * 2021-10-21 2021-12-21 中国农业科学院生物技术研究所 Dmp蛋白及其编码基因与应用
CN113817036B (zh) * 2021-10-21 2022-06-14 中国农业科学院生物技术研究所 Dmp蛋白及其编码基因与应用
WO2023066413A1 (zh) * 2021-10-21 2023-04-27 中国农业科学院生物技术研究所 Dmp蛋白及其编码基因与应用
CN114350701A (zh) * 2022-01-06 2022-04-15 武汉大学 卵细胞特异表达基因ecs制备被子植物单倍体的方法及应用
CN114350701B (zh) * 2022-01-06 2024-04-19 武汉大学 卵细胞特异表达基因ecs制备被子植物单倍体的方法及应用
CN114525300A (zh) * 2022-01-28 2022-05-24 中国农业科学院深圳农业基因组研究所 多核苷酸和蛋白质的应用及其单倍体诱导系
CN115568416A (zh) * 2022-02-21 2023-01-06 贵州省烟草科学研究院 一种利用烟草白粉病抗性筛选烟草单倍体及评估诱导率的方法

Also Published As

Publication number Publication date
CN111996209B (zh) 2022-05-10
AU2020282488B2 (en) 2024-08-01
WO2020239137A1 (zh) 2020-12-03
JP2022538516A (ja) 2022-09-05
ZA202109641B (en) 2022-09-28
EP3978613A4 (en) 2023-07-19
US20220403400A1 (en) 2022-12-22
AU2020282488A1 (en) 2022-01-06
CL2021003137A1 (es) 2022-07-15
EP3978613A1 (en) 2022-04-06

Similar Documents

Publication Publication Date Title
CN111996209B (zh) 孤雌生殖单倍体诱导基因dmp及其应用
CN109628480B (zh) 玉米孤雌生殖单倍体诱导基因ZmPLA1E及其应用
CN107988229A (zh) 一种利用CRISPR-Cas修饰OsTAC1基因获得分蘖改变的水稻的方法
CN110213961A (zh) 基于基因组编辑的作物工程化和生产矮秆植物
CN111763687B (zh) 一种基于基因编辑技术快速培育玉米单倍体诱导系的方法
CN108165554B (zh) 控制玉米叶宽基因ZmNL4及其应用
CN109924120B (zh) 一种改良水稻稻瘟病抗性和白叶枯病抗性的方法
CN109234310A (zh) 快速获得无转基因基因编辑植株的重组载体及使用方法
CN112725374A (zh) 创制植物单倍体诱导系的方法及其应用
CN111073875B (zh) 小麦单倍体诱导基因及其应用
WO2018129704A1 (zh) 玉米母本单倍体主效诱导基因及应用
CN113186200B (zh) 一对控制西瓜卷须有无和侧枝多少的基因ClTFL/Cltfl1及用途
CN106868036B (zh) 一种定点突变创制玉米紧凑株型种质的方法及其应用
CN109837295A (zh) 一种用基因编辑创制的水稻单倍体诱导系及其创制方法和应用
CN117757836A (zh) OsHR突变型基因在提高水稻对褐飞虱抗性中的应用
US20220333125A1 (en) GENE ZmPLD3 FOR INDUCING MAIZE MATERNAL HAPLOID PRODUCTION AND ITS APPLICATION THEREOF
CN117069814B (zh) 孤雌生殖单倍体诱导基因GhDMP及其应用
CN105925587B (zh) 一个受低温响应的早期水稻叶绿体发育基因及其检测方法和应用
JPWO2012127558A1 (ja) 新品種、植物品種の鑑別方法、及びイネ個体を早生化する方法
CN114525300A (zh) 多核苷酸和蛋白质的应用及其单倍体诱导系
CN114350701A (zh) 卵细胞特异表达基因ecs制备被子植物单倍体的方法及应用
CN117305326B (zh) 青花菜BoCENH3基因及其在单倍体诱导中的应用
EA047686B1 (ru) Ген dmp индукции партеногенетического гаплоида и его применение
CN116837002B (zh) ZmDPP1及其编码蛋白在玉米育性控制中的应用
CN116445497B (zh) 甘蓝BoDMP9基因及其在母本单倍体诱导中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant