CN117551689A - 与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用 - Google Patents

与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用 Download PDF

Info

Publication number
CN117551689A
CN117551689A CN202311479530.4A CN202311479530A CN117551689A CN 117551689 A CN117551689 A CN 117551689A CN 202311479530 A CN202311479530 A CN 202311479530A CN 117551689 A CN117551689 A CN 117551689A
Authority
CN
China
Prior art keywords
protein
soybean
gene
plant
expression cassette
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311479530.4A
Other languages
English (en)
Inventor
蔡宇鹏
侯文胜
陈莉
姚伟伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Original Assignee
Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Crop Sciences of Chinese Academy of Agricultural Sciences filed Critical Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Priority to CN202311479530.4A priority Critical patent/CN117551689A/zh
Publication of CN117551689A publication Critical patent/CN117551689A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明涉及生物技术领域,具体公开了与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用。所述蛋白质为GmCOL2a或/和GmCOL2b。本发明通过将GmCOL2a或/和GmCOL2b蛋白的编码基因敲除,得到GmCOL2a或/和GmCOL2b基因敲除的转基因大豆植株,转基因大豆株高降低,单株荚数粒数增加。本发明所提供的GmCOL2a或/和GmCOL2b蛋白及其编码基因在大豆株高和单株荚数粒数研究中具有重要的理论意义和应用价值。

Description

与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和 应用
技术领域
本发明属于生物技术领域,具体涉及与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用。
背景技术
大豆是世界重要的粮油兼用作物,也是人类优质蛋白及畜牧业饲料蛋白的主要来源。随着全球人口继续以前所未有的速度增长,对粮食的需求激增,使作物产量的提高成为现代作物育种技术面临的紧迫挑战。满足世界上大多数饮食需求的四种主要粮食作物是大豆、玉米、小麦和大豆。通过追求大幅度提高作物产量的研究攻关,研究人员对半矮秆作物的优势有了重大发现,这些作物具有许多优秀的特性,如抗倒伏能力增强、有效利用肥料和提高光能利用率。此外,半矮秆作物通常对多种植物病虫害具有更高的抗性,这在一定程度上保证了作物在高密度种植条件下的稳定产量。大豆是世界重要的粮油兼用作物,也是人类优质蛋白及畜牧业饲料蛋白的主要来源。大豆的荚果主要着生于茎节上。大豆的株高、单株荚数和粒数指标是决定大豆抗倒伏性和产量的关键性状,是选育理想株型高产大豆新品种的重要目标。由于能够同时改良大豆株高、单株荚数和粒数的基因和作用机制报道较少,限制了大豆理想株型的分子选育。所以能够同时实现大豆株高降低、单株荚数和粒数增加对提高大豆抗倒伏性和产量具有重要的理论和生产意义。
发明内容
本发明所要解决的技术问题是如何改良大豆株高、单株荚数或/和粒数。所要解决的技术问题不限于所描述的技术主题,本领域技术人员通过以下描述可以清楚地理解本文未提及的其它技术主题。
为解决上述技术问题,本发明提供了以下技术方案:
本发明提供了蛋白质或抑制或降低或下调所述蛋白质的编码基因表达的物质或抑制或降低或下调所述蛋白质活性或/和含量的物质在下述任一种中的应用:
D1)提高大豆产量,
D2)降低大豆株高;
D2)制备降低大豆株高的产品;
D3)培育半矮杆大豆;
D4)制备培育半矮杆大豆的产品;
D5)改良半矮杆大豆或制备半矮杆大豆的产品;
D6)增加大豆单株荚数;
D7)制备增加大豆单株荚数的产品;
D8)培育单株荚数增加的大豆;
D9)制备培育单株荚数增加的大豆的产品;
D10)增加大豆单株粒数;
D11)制备增加大豆单株粒数的产品;
D12)培育单株粒数增加的大豆;
D13)制备培育单株粒数增加的大豆的产品;
D14)大豆育种;
所述蛋白质为下述任一种,
A1)氨基酸序列是SEQ ID No.2的蛋白质;
A2)将SEQ ID No.2所示的氨基酸序列经过氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有80%以上的同一性且具有相同功能的蛋白质;
A3)在A1)或A2)的N端和/或C端连接标签得到的具有相同功能的融合蛋白质。
为了使A1)中的蛋白质便于纯化或检测,可在由序列表中SEQ ID No.2所示的氨基酸序列组成的蛋白质的氨基末端或羧基末端连接标签蛋白。
所述标签蛋白包括但不限于:GST(谷胱甘肽巯基转移酶)标签蛋白、His6标签蛋白(His-tag)、MBP(麦芽糖结合蛋白)标签蛋白、Flag标签蛋白、SUMO标签蛋白、HA标签蛋白、Myc标签蛋白、eGFP(增强型绿色荧光蛋白)、eCFP(增强型青色荧光蛋白)、eYFP(增强型黄绿色荧光蛋白)、mCherry(单体红色荧光蛋白)或AviTag标签蛋白。
本领域普通技术人员可以很容易地采用已知的方法,例如定向进化或点突变的方法,对本发明的编码蛋白质GmCOL2a或/和GmCOL2b的核苷酸序列进行突变。那些经过人工修饰的,具有与本发明分离得到的蛋白质GmCOL2a或/和GmCOL2b的核苷酸序列75%或75%以上同一性的核苷酸,只要编码蛋白质GmCOL2a或/和GmCOL2b且具有蛋白质GmCOL2a或/和GmCOL2b功能,均是衍生于本发明的核苷酸序列并且等同于本发明的序列。
上述75%或75%以上同一性,可为80%、85%、90%或95%以上的同一性。本文中,同一性是指氨基酸序列或核苷酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性,如NCBI主页网站的BLAST网页。例如,可在高级BLAST2.1中,通过使用blastp作为程序,将Expect值设置为10,将所有Filter设置为OFF,使用BLOSUM62作为Matrix,将Gap existence cost,Per residue gap cost和Lambda ratio分别设置为11,1和0.85(缺省值)并进行检索以对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。本文中,所述80%以上的同一性可为至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
本文中,调控所述蛋白质活性和/或含量的物质可为调控基因表达的物质,所述基因编码所述蛋白质GmCOL2a或/和GmCOL2b。所述调控基因表达的物质可为进行如下6种调控中至少一种调控的物质:1)在所述基因转录水平上进行的调控;2)在所述基因转录后进行的调控(也就是对所述基因的初级转录物的剪接或加工进行的调控);3)对所述基因的RNA转运进行的调控(也就是对所述基因的mRNA由细胞核向细胞质转运进行的调控);4)对所述基因的翻译进行的调控;5)对所述基因的mRNA降解进行的调控;6)对所述基因的翻译后的调控(也就是对所述基因翻译的蛋白质的活性进行调控)。
上文中,所述植物育种的目的可包括培育株高降低、单株荚数和粒数增加的植物。
上文中A2)所述蛋白质为氨基酸序列是SEQ ID No.2的蛋白质。
进一步地,上述应用中所述物质为生物材料,所述生物材料为下述任一种:
B1)、核酸分子;
B2)、表达B1)所述核酸分子的基因;
B3)、含有B2)所述基因的表达盒;
B4)、含有B2)所述基因的重组载体、或含有B3)所述表达盒的重组载体;
B5)、含有B2)所述基因的重组微生物、或含有B3)所述表达盒的重组微生物、或含有B4)所述重组载体的重组微生物;
B6)、含有B2)所述基因的转基因植物细胞系、或含有B3)所述表达盒的转基因植物细胞系、或含有B4)所述重组载体的转基因植物细胞系;
B7)、含有B2)所述基因的转基因植物组织、或含有B3)所述表达盒的转基因植物组织、或含有B4)所述重组载体的转基因植物组织;
B8)、含有B2)所述基因的转基因植物器官、或含有B3)所述表达盒的转基因植物器官、或含有B3)所述重组载体的转基因植物器官。
B1)所述核酸分子可为DNA或RNA。所述RNA可为gRNA或shRNA。
本文中B1)所述核酸分子为gRNA,所述gRNA的靶标为所述蛋白质的编码基因。
所述蛋白质的编码基因可为C1)、C2)或C3)所示的所述蛋白质的编码基因:
C1)编码序列是SEQ ID No.1或SEQ ID No.3的cDNA分子或DNA分子;
C2)与C1)限定的cDNA或DNA分子杂交且编码具有相同功能的蛋白质的cDNA分子或DNA分子。
SEQ ID No.1所示的DNA分子编码氨基酸序列是SEQ ID No.2的蛋白质GmCOL2a。SEQ ID No.3所示的DNA分子编码氨基酸序列是SEQ ID No.4的蛋白质GmCOL2b。SEQ IDNO.1所示的核苷酸序列为蛋白质GmCOL2a编码基因(CDS)的核苷酸序列。SEQ ID NO.3所示的核苷酸序列为蛋白质GmCOL2b编码基因(CDS)的核苷酸序列。
本发明所述的蛋白质GmCOL2a或/和GmCOL2b的基因(GmCOL2a或/和GmCOL2b基因)可以为任意能够编码蛋白质GmCOL2a或/和GmCOL2b的核苷酸序列。考虑到密码子的简并性以及不同物种密码子的偏爱性,本领域技术人员可以根据需要使用适合特定物种表达的密码子。
B1)所述核酸分子还可包括在SEQ ID No.1或/和SEQ ID No.3所示核苷酸序列基础上经密码子偏好性改造得到的核酸分子。
所述核酸分子还包括与SEQ ID No.1或/和SEQ ID No.3所示的核苷酸序列一致性为95%以上且来源相同种属的核酸分子。本文所述核酸分子可以是DNA,如cDNA、基因组DNA或重组DNA;所述核酸分子也可以是RNA,如gRNA、mRNA、siRNA、shRNA、sgRNA、miRNA或反义RNA。
本文所述载体是本领域技术人员公知的,包括但不限于:质粒、噬菌体(如λ噬菌体或M13丝状噬菌体等)、黏粒(即柯斯质粒)、Ti质粒或病毒载体。具体可为PTF101-SpCas9。
可用现有的植物表达载体构建含有GmCOL2a或GmCOL2b基因的重组表达载体。所述植物表达载体包括但不限于如双元农杆菌载体和可用于植物微弹轰击的载体等。所述植物表达载体还可包含外源基因的3'端非翻译区域,即包含聚腺苷酸信号和任何其它参与mRNA加工或基因表达的DNA片段。所述聚腺苷酸信号可引导聚腺苷酸加入到mRNA前体的3'端,如包括但不限于农杆菌冠瘿瘤诱导(Ti)质粒基因(如胭脂合成酶Nos基因)、植物基因(如大豆贮藏蛋白基因)3'端转录的非翻译区均具有类似功能。
使用GmCOL2a或/和GmCOL2b基因构建重组植物表达载体时,在其转录起始核苷酸前可加上任何一种增强型启动子或组成型启动子,包括但不限于如花椰菜花叶病毒(CAMV)35S启动子、玉米的泛素启动子(ubiquitin),它们可单独使用或与其它植物启动子结合使用;此外,使用本发明的基因构建植物表达载体时,还可使用增强子,包括翻译增强子或转录增强子,这些增强子区域可以是ATG起始密码子或邻接区域起始密码子等,但必需与编码序列的阅读框相同,以保证整个序列的正确翻译。所述翻译控制信号和起始密码子的来源是广泛的,可以是天然的,也可以是合成的。翻译起始区域可以来自转录起始区域或结构基因。
为了便于对转基因植物细胞或植物进行鉴定及筛选,可对所用植物表达载体进行加工,如加入包括但不限于可在植物中表达的编码可产生颜色变化的酶或发光化合物的基因(GUS基因、荧光素酶基因等)、具有抗性的抗生素标记物(庆大霉素标记物、卡那霉素标记物等)或是抗化学试剂标记基因(如抗除草剂基因)等。从转基因植物的安全性考虑,可不加任何选择性标记基因,直接以逆境筛选转化植株。
利用任何一种可以引导外源基因在植物中表达的载体,将靶向敲除本发明所提供的GmCOL2a或/和GmCOL2b基因的片段导入植物细胞或受体植物,可获得株高降低和增加单株荚数粒数增加的植株。携带GmCOL2a或/和GmCOL2b基因的表达载体可通过使用Ti质粒、Ri质粒、植物病毒载体、直接DNA转化、显微注射、电导、农杆菌介导等常规生物学方法转化植物细胞或组织,并将转化的植物组织培育成植株。
本文所述微生物可为酵母、细菌、藻或真菌。其中,细菌可来自埃希氏菌属(Escherichia),欧文氏菌(Erwinia),根癌农杆菌属(Agrobacterium)、黄杆菌属(Flavobacterium),产碱菌属(Alcaligenes),假单胞菌属(Pseudomonas),芽孢杆菌属(Bacillus)等。具体可为大肠杆菌DH5α和/或根癌农杆菌EHA105。
所述gRNA的靶点可为SEQ ID No.1的第26到45位核苷酸或/和SEQ ID No.3第32到51位核苷酸。
本发明还提供一种提高大豆产量、降低大豆株高、增加大豆单株荚数或/和增加大豆粒数的方法,包括下调或降低或减弱目的大豆中前述蛋白质的编码基因的表达量或所述蛋白质的含量得到转基因大豆,所述转基因大豆的株高低于所述目的大豆,所述转基因大豆的单株荚数和豆单株粒数高于所述目的大豆。
上述株高降低、单株荚数和粒数增加的大豆理解为不仅包含将所述GmCOL2a或/和GmCOL2b基因转化目的大豆得到的第一代转基因植物,也包括其子代。可以在该物种中繁殖该基因,也可用常规育种技术将该基因转移进入相同物种的其它品种,特别包括商业品种中。所述抗逆植物包括种子、愈伤组织、完整植株和细胞。
进一步地,上述方法中所述上调或增强或提高目的大豆中前述蛋白质的编码基因的表达量或所述蛋白质的含量为将前述蛋白质的编码基因导入所述目的大豆。
前述蛋白质也属于本发明的保护范围。
本发明还提供生物材料,所述生物材料为下述任一种:
B1)、编码前述蛋白质的核酸分子;
B2)、含有B1)所述核酸分子的表达盒;
B3)、含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)、含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物;
B5)、抑制或降低或下调前述蛋白质的编码基因的表达的核酸分子或抑制或降低或下调所述蛋白质的活性或含量的核酸分子;
B6)、表达B5)所述核酸分子的编码基因;
B7)、含有B6)所述基因的表达盒;
B8)、含有B6)所述基因的重组载体、或含有B7)所述表达盒的重组载体;
B9)、含有B6)所述基因的重组微生物、或含有B7)所述表达盒的重组微生物、或含有B4)所述重组载体的重组微生物。
上述生物材料中B1)所述核酸分子如C1)、C2)或C3)所示的所述蛋白质的编码基因:
C1)编码序列是SEQ ID No.1或SEQ ID No.3的cDNA分子或DNA分子;
C2)与C1)限定的cDNA或DNA分子杂交且编码具有相同功能的蛋白质的cDNA分子或DNA分子。
本发明通过将GmCOL2a或/和GmCOL2b蛋白的编码基因敲除,得到GmCOL2a或/和GmCOL2b基因敲除的转基因大豆植株,转基因大豆株高降低,单株荚数粒数增加。本发明所提供的GmCOL2a或/和GmCOL2b蛋白及其编码基因在大豆株高和单株荚数粒数研究中具有重要的理论意义和应用价值。
附图说明
图1为GmCOL2a和GmCOL2b基因结构及CRISPR/Cas9靶点序列。
图2为CRISPR/Cas9介导的GmCOL2a和GmCOL2b靶点处的定点突变。
图3为Jack、Gmcol2a和Gmcol2b突变体在廊坊田间的表型。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
根癌农杆菌EHA105,记载在如下文献中:Cai Y,Chen L,Liu X,Guo C,Sun S,WuC,Jiang B,Han T and Hou W(2018),CRISPR/Cas9-mediated targeted mutagenesis ofGmFT2a delays flowering time in soya bean.Plant Biotechnol J 16,176-185,公众可以从中国农业科学院作物科学研究所获得。
栽培大豆Jack,记载在如下文献中:Chen L,Cai Y,Liu X,Yao W,Guo C,Sun S,WuC,Jiang B,Han T,Hou W(2018),Improvement of soybean Agrobacterium-mediatedtransformation efficiency by adding glutamine and asparagine into the culturemedia.International Journal of Molecular Sciences 19,3039,公众可以从中国农业科学院作物科学研究所获得。
PCR扩增用的高保真酶为PhantaMax Super-Fidelity DNAPolymerase,购于南京诺唯赞生物科技有限公司,货号P505-d3。MS盐:Phyto Tech,目录号:M524。MS有机:PhytoTech公司,目录号:M533。B5有机:Phytotech公司,目录号:G219。B5盐:Phytotech公司,目录号:G768。
LB固体培养基组分:NaCl 10g/L,酵母提取物5g/L,胰蛋白胨10g/L,琼脂15g/L,溶剂为水。
YEP固体培养基由溶剂和溶剂组成;各溶质及其在YEP固体培养基中的浓度为:NaCl 5g/L,酵母提取物5g/L,胰蛋白胨10g/L,15g/L琼脂;溶剂为水。YEP固体培养基的pH为7.0。
发芽培养基(pH 5.8):3.12g/L B5盐、1mL/LB5有机、20g/L蔗糖、7.5g/L琼脂,余量为水。
液体培养基(pH 5.4):0.43g/L MS盐、1mL/LB5有机、40mg/L乙酰丁香酮、150mg/L二硫苏糖醇、100mg/L L-半胱氨酸、30g/L蔗糖、3.9mg/L 2-吗啉乙磺酸,余量为水。
共培养培养基(pH 5.4):0.43g/L MS盐、1mL/L B5有机、40mg/L乙酰丁香酮、150mg/L二硫苏糖醇、100mg/L L-半胱氨酸、30g/L蔗糖、7.5g/L琼脂、3.9mg/L 2-吗啉乙磺酸,余量为水。
恢复培养基(pH 5.4):3.1g/L B5盐、1mL/L B5有机、30g/L蔗糖、150mg/L头孢霉素、150mg/L特美汀、1mg/L 6-BA、0.98g/L 2-吗啉乙磺酸、7.5g/L琼脂、4mL/L Fe盐(200×)、50mg/L L-天冬酰胺、50mg/L L-谷氨酰胺,余量为水。
筛选培养基(pH 5.4):3.1g/LB5盐、1mL/LB5有机、0.98g/L 2-吗啉乙磺酸、30g/L蔗糖、150mg/L头孢霉素、150mg/L特美汀、1mg/L 6-BA、6mg/L草丁膦、7.5g/L琼脂、4mL/L Fe盐(200×)、50mg/L L-天冬酰胺、50mg/L L-谷氨酰胺,余量为水。
伸长培养基(pH 5.6):4.0g/L MS盐、1mL/L B5有机、0.6g/L 2-吗啉乙磺酸、30g/L蔗糖、150mg/L头孢霉素、150mg/L特美汀、0.1mg/L IAA、0.5mg/L GA、1mg/L 6-BA、6mg/L草丁膦、7.5g/L琼脂、4mL/LFe盐(200×)、50mg/L L-天冬酰胺、50mg/L L-谷氨酰胺,余量为水。
生根培养基(pH 5.7):2.165g/LMS盐、1mL/LB5有机、0.6g/L 2-吗啉乙磺酸、20g/L蔗糖、7.5g/L琼脂、50mg/L L-天冬酰胺、50mg/L L-谷氨酰胺,余量为水。
实施例1、利用CRISPR/Cas9定点敲除大豆基因GmCOL2a和GmCOL2b
1.1sgRNA靶点序列选择
从Phytozome数据库获得大豆GmCOL2a(Glyma.13G050300)基因组序列、CDS序列(SEQ ID No.1)、蛋白序列(SEQ ID No.2)和GmCOL2b(Glyma.19G039000)基因组序列、CDS序列(SEQ ID No.3)、蛋白序列(SEQ ID No.4)。如图1所示,在GmCOL2a的第一个外显子上选择了一个靶点GmCOL2a-sgRNA,靶点序列为5′-TTGGTGGCAGCACCGGCACC-3′,靶向GmCOL2a基因组序列的1026-1045位,也即SEQ ID No.1的第26到45位;在GmCOL2b的第一个外显子上选择了一个靶点GmCOL2b-sgRNA,靶点序列为5′-GCAGCAACACTGGCACCACC-3′,靶向GmCOL26基因组序列的1032-1051位,也即SEQ ID No.3的第32到51位。
1.2CRISPR/Cas9载体构建
(1)用限制性内切酶NHeI和BbsI,在50uL体系和37℃条件下双酶切载体pUC57-sgRNA-SpCas93小时,1%的琼脂糖凝胶电泳检测,胶回收目的条带(大小约3201bp)。该目的条带含有AtU6启动子驱动的sgRNA表达盒元件。
(2)按照sgRNA的靶点序列合成引物,序列如下(小写字母即为靶点):
GmCOL2a-Cas9-F:5′-TCGAAGTAGTGATTGttggtggcagcaccggcaccGTTTTAGAGCTAGAA-3′
GmCOL2a-Cas9-R:5′-TTCTAGCTCTAAAACggtgccggtgctgccaccaacAATCACTACTTCGA-3′
GmCOL2b-Cas9-F:5′-TCGAAGTAGTGATTGgcagcaacactggcaccaccGTTTTAGAGCTAGAA-3′
GmCOL2b-Cas9-R:5′-TTCTAGCTCTAAAACggtggtgccagtgttgctgcCAATCACTACTTCGA-3′
(3)在离心管中加入相应的F/R引物(浓度10μM)各5μL,加入ddH2O 15μL至反应体系为25μL。95℃3min,0.1℃/s退火至16℃,16℃保持10min,完成退火,形成oligo二聚体。GmCOL2a-Cas9-F和GmCOL2a-Cas9-R形成的oligo二聚体编码靶向于GmCOL2a的sgRNA(名称为sgRNA-GmCOL2a)。GmCOL2b-Cas9-F和GmCOL2b-Cas9-R形成的oligo二聚体编码靶向于GmCOL2b的sgRNA(名称为sgRNA-GmCOL2b)。
(4)取3.5μL退火产物与1.5μL酶切后的pUC57-sgRNA-SpCas9载体胶回收产物,用Ultra One Step Cloning Kit(南京诺唯赞生物科技有限公司,货号C115-02)进行连接,冻融法转化大肠杆菌DH5α,涂于LB+Amp的固体培养基上,倒置在37℃培养箱中过夜。挑取单克隆,摇菌,进行测序分析。测序引物为pSgRNA-CX:5′-CGCCAGGGTTTTCCCAGTCACGAC-3′,测序结果正确的菌液用于质粒提取。提取得到的质粒命名为pUC57-sgRNA-SpCas9-GmCOL2a质粒和pUC57-sgRNA-SpCas9-GmCOL2b质粒。pUC57-sgRNA-SpCas9-GmCOL2a质粒已连接上靶向GmCOL2a的sgRNA的序列。pUC57-sgRNA-SpCas9-GmCOL2b质粒已连接上靶向GmCOL2b的靶序列sgRNA的序列。
(5)用限制性内切酶PacI和PmeI,在50uL体系和37℃条件下进行双酶切,反应时间为3小时。pUC57-sgRNA-SpCas9-GmCOL2a质粒经双酶切后回收约586bp的目的片段sgRNA-SpCas9-GmCOL2a,pUC57-sgRNA-SpCas9-GmCOL2b质粒经双酶切后胶回收约586bp的目的片段sgRNA-SpCas9-GmCOL2b,空载PTF101-SpCas9质粒经双酶切后回收约14232bp的目的片段,随后用T4 DNA连接酶(NEB,货号M0202V)将sgRNA-SpCas9-GmCOL2a和sgRNA-SpCas9-GmCOL2b分别连接至空载PTF101-SpCas9质粒经双酶切后的目的片段,冻融法转化大肠杆菌DH5α,涂于LB+Spe的固体培养基上,倒置在37℃培养箱中过夜。挑取单克隆,摇菌,测序验证是否连接成功。测序引物为sgRNA-TYJC:5′-TGGGAATCTGAAAGAAGAGAAGCA-3′。将验证正确的质粒命名为pGmCOL2a-sgRNA和pGmCOL2b-sgRNA。重组质粒pGmCOL2a-sgRNA是以包含GmCOL2a的靶点序列的sgRNA的表达盒元件替代PTF101-SpCas9质粒上的PacI和Pme酶切识别位点之间的核苷酸序列并保持其他核苷酸序列不变的重组表达载体。重组质粒pGmCOL2b-sgRNA是以包含GmCOL2b的靶点序列的sgRNA的表达盒元件替代PTF101-SpCas9质粒上的PacI和Pme酶切识别位点之间的核苷酸序列并保持其他核苷酸序列不变的重组表达载体。
(6)提取质粒,将质粒pGmCOL2a-sgRNA和pGmCOL2b-sgRNA通过冻融法分别转化根癌农杆菌EHA105的感受态细胞,得到重组农杆菌,命名为EHA105-GmCOL2a-sgRNA和EHA105-GmCOL2b-sgRNA。
1.3根癌农杆菌介导的大豆遗传转化
将重组菌EHA105-GmCOL2a-sgRNA和EHA105-GmCOL2b-sgRNA转化大豆栽培品种Jack。具体步骤如下:
1、种子灭菌
1)取无病虫害和斑点、饱满、均一、干燥的大豆品种Jack种子,完全平铺在培养皿中,然后将培养皿放入干燥器中。
2)完成步骤1)后,在所述干燥器中放入100mL容量的烧杯,在烧杯中倒入90mL 12M次氯酸钠水溶液,再慢慢加入5mL浓盐酸,然后迅速盖上干燥器,用凡士林密封,放置16小时,进行氯气灭菌。
2、制备侵染菌液
1)28℃,培养上述得到的EHA105-GmCOL2a-sgRNA和EHA105-GmCOL2b-sgRNA菌液,用液体培养基重悬,得到OD600nm=0.6-0.8的侵染菌液。
2)将步骤1处理后的Jack大豆种子放入超净台中,在显微镜下,剥去种皮,沿长轴将两个子叶分开,保留带完整胚轴的那片子叶,在其胚轴和子叶连接处进行划伤,一般一个子叶划伤3-5刀,然后在28℃培养箱中,浸染2小时。
3)将子叶内面(平滑面)向上,平铺于已铺有无菌滤纸的共培养培养基上,温度22℃,暗培养5天。
4)共培养5天后,外植体胚轴伸长到2厘米,切掉部分胚轴,使其保留0.5cm。将处理后的外植体放到恢复培养基中,28℃,16小时光照/8小时黑暗条件下,培养7天。
5)从恢复培养基中取出外植体,去除新芽,切除部分胚轴,保留0.5cm的胚轴,再将修整后外植体转入到筛选培养基中,28℃,16小时光照/8小时黑暗条件下培养21天。
6)经过21天的筛选诱导,外植体产生大量不定芽,剥除子叶和棕色的叶子,将剩余的部分转入伸长培养基中培养,28℃,16小时光照/8小时黑暗条件下培养。
7)在伸长培养基中,当丛生芽抽出5-8厘米幼茎时,从不定芽基部剪下来;茎基部在1mg/LIBA溶液中沾1分钟,然后转入生根培养基中培养,28℃,16小时光照/8小时黑暗条件下培养一周,在茎基部产生大量根后,移栽到盆中,获得的植株为T0代转基因大豆植株。
1.4基因编辑植株的编辑类型检测
(1)利用植物基因组DNA提取试剂盒(康为世纪,CW0553)提取T0代转基因大豆植株叶片的DNA。
(2)以DNA作为模板进行PCR扩增。靶点GmCOL2a-sgRNA的扩增引物为GmCOL2a-SpCas9-F:5′-AGGGATAACATGAGATTTTGACTGG-3′和GmCOL2a-SpCas9-R:5′-AGGGATAACATGAGATTTTGACTGG-3′,扩增片段的长度为788bp,测序引物为COL-CX:5′-CACGATGGCACCCTTGATTCTCCC-3′。靶点GmCOL2b-sgRNA的扩增引物为GmCOL2b-SpCas9-F:5′-ACACGTGTCTCCAAGTTGTGT-3′和GmCOL2b-SpCas9-R:5′-ACGCGTTTGTGATTGTGCTC-3′,扩增片段的长度为756bp,测序引物为GmCOL2b-SpCas9-F。PCR反应体系:2×Max Buffer25μL,dNTP Mix(10mM each)1μL,DNA(200ng/μL)2μL,F(10pmol/μL)2μL,R(10pmol/μL)2μL,Max Super-Fidelity DNAPolymerase 1μL,ddH2O 17μL,总体积50μL。扩增反应体系:95℃3min;95℃15sec,56℃15sec,72℃45sec,35个循环;72℃5min。扩增产物进行测序分析。测序结果有三种情况:测序峰图从CRISPR/Cas9切割位点附近往后出现重叠峰,在靶位点上游没有重叠峰,则为杂合的编辑类型;峰图从前到后均没出现重叠的峰,然后与野生型参考序列比对,若完全一致,则说明没有发生定点突变;峰图从前到后均没出现重叠的峰,然后与野生型参考序列比对,若不完全匹配,则确定具体的突变类型,突变类型一般包括碱基的插入、缺失和错配等。
经检测,T0代GmCOL2a-SpCas9转基因大豆植株41株中,发生基因编辑的植株为22株;T0代GmCOL2b-SpCas9转基因大豆植株36株中,发生基因编辑的植株为16株。将T0代基因编辑的植株自交1代,得到T1代基因编辑的植株。之后按照上述方法检测T1代基因编辑的植株的突变类型。
结果发现,在GmCOL2a-sgRNA靶点产生了两种纯合的突变类型(图2中A),分别命名为Gmcol2a-51和Gmcol2a-78。与野生型大豆的基因组DNA相比:
Gmcol2a-51编码GmCOL2a蛋白的基因的两条同源染色体均发生了相同的缺失,缺失了SEQ ID No.1的第35-42位共计8个核苷酸,导致编辑位点后的氨基酸翻译移码,蛋白序列提前终止,从而将GmCOL2a基因敲除。
Gmcol2a-78编码GmCOL2a蛋白的基因的两条同源染色体均发生了相同的缺失,缺失了基因组的第682-1079位共计398个核苷酸(包含SEQ ID No.1的第1到79位碱基)导致编辑位点后的氨基酸翻译移码,蛋白序列提前终止,从而将GmCOL2a基因敲除。上述Gmcol2a-78突变体中突变后的基因组如后文记载的Gmcol2a-78突变体中突变后的基因组序列所示,其编码序列如后文记载的Gmcol2a-78突变体中突变后的编码序列(CDS)所示,其氨基酸序列如后文记载的Gmcol2a-78突变体中突变后的氨基酸序列所示,GmCOL2a蛋白功能缺失。
结果发现,在GmCOL2b-sgRNA靶点产生了两种纯合的突变类型(图2中B),分别命名为Gmcol2b-35和Gmcol2b-46。与野生型大豆的基因组DNA相比:
Gmcol2b-35编码GmCOL2b蛋白的基因的两条同源染色体均发生了相同的缺失,缺失了SEQ ID No.3的第48位共计1个核苷酸,导致编辑位点后的氨基酸翻译移码,蛋白序列提前终止,从而将GmCOL2b基因敲除。上述Gmcol2b-35突变体中突变后的基因组如后文记载的Gmcol2b-35突变体中突变后的基因组序列所示,其编码序列如后文记载的Gmcol2b-35突变体中突变后的编码序列(CDS)所示,其氨基酸序列如后文记载的Gmcol2b-35突变体中突变后的氨基酸序列所示,GmCOL2b蛋白功能缺失。
Gmcol2b-46编码GmCOL2b蛋白的基因的两条同源染色体均发生了相同的缺失,缺失了SEQ ID No.3的第46-48位共计3核苷酸,导致编辑位点缺失了一个氨基酸。
随后,将T1代的Gmcol2a-78和Gmcol2b-35突变体分别自交1代,得到T2代纯合的Gmcol2a-78和Gmcol2b-35突变体种子,命名为Gmcol2a突变体和Gmcol2b突变体,用于后续田间实验。
实施例2、野生型、Gmcol2a和Gmcol2b突变体在廊坊田间的表型观察
分别将野生型大豆品种Jack、Gmcol2a和Gmcol2b突变体夏播种植于廊坊(39.5°N,116.6°E)大田,小区采用随机区组设计,3次重复。处理小区面积为15平方米(6.0米×2.5米),每个小区播种6行,行长6米;行距50厘米,株距10厘米。每个小区从中间4行随机选取5株,每种材料从三个小区共选取15株,观察并统计株高(厘米)、主茎节数(个)、单株荚数(个)和单株粒数(个)等农艺性状。采用GraphPad Prism 8软件对数据进行处理,实验结果以平均值±标准差表示,采用One-wayANOVA检验,P<0.05(*)表示与野生型大豆品种Jack相比具有显著性差异,P<0.01(**)表示与野生型大豆品种Jack相比具有极显著差异。野生型Jack、Gmcol2a和Gmcol2b突变体在廊坊田间的表型如图3所示。统计结果表明,与野生型Jack相比,Gmcol2a和Gmcol2b突变体的株高降低,单株荚数和单株粒数极显著地增加,但主茎节数无显著差异,具体数据见表1。
表1野生型、Gmcol2a和Gmcol2b突变体在廊坊的田间表型
植株 株高(cm) 单株荚数(个) 单株粒数(粒) 主茎节数(节)
Jack 103.4±3.9 85.6±17.7 204.5±40.1 21.6±0.7
Gmcol2a 74.7±5.8** 101.9±13.8** 235.3±39.3** 20.9±1.3
Gmcol2b 71.2±8.0** 101.1±12.6** 242.4±34.1** 21.3±1.0
实施例3在北京田间三个种植密度条件下的表型观察
分别将野生型大豆品种Jack、Gmcol2a和Gmcol2b突变体夏播种植于北京(40.2°N,116.6°E)大田。处理小区面积为5平方米(2.0米×2.5米),每个小区播种6行,行长2米,行距50厘米。设置了三个种植密度,分别为密度1(286,000株/公顷)、密度2(200,000株/公顷)和密度3(154,000株/公顷)。小区采用随机区组设计,3次重复。从每个小区中间4行随机选取15株,每种材料每种密度条件从三个小区共选取45株,观察并统计株高、主茎节数、单株荚数和单株粒数等农艺性状。采用GraphPad Prism 8软件对数据进行处理,实验结果以平均值±标准差表示,采用One-wayANOVA检验,P<0.05(*)表示在同一种植密度下,与野生型大豆品种Jack相比具有显著性差异,P<0.01(**)表示与野生型大豆品种Jack相比具有极显著差异。统计结果表明,在三种种植密度条件下,与野生型Jack相比,Gmcol2a和Gmcol2b突变体都表现出株高降低,单株荚数和单株粒数显著增加的表型,但主茎节数无显著差异,具体数据见表2。由此可见,GmCOL2a或GmCOL2b蛋白的功能丧失会导致大豆株高显著降低、单株荚数显著增加以及单株粒数显著增加。随后,对每个小区实收产量进行鉴定。每个小区的六行材料,去掉两个边行,剩下的四行混合收获并称重,重量换算成千克/公顷表示。结果表明,野生型Jack在密度1、密度2和密度3的群体收获产量分别为3405.5±311.9千克/公顷,3361.1±170.2千克/公顷和2932.2±178.9千克/公顷;Gmcol2a突变体在密度1、密度2和密度3的群体收获产量分别为4366.7±260.3千克/公顷,4300.0±104.1千克/公顷和3555.6±105.8千克/公顷,相比于对照Jack分别增产28.2%、27.9%和21.2%。Gmcol2b突变体在密度1、密度2和密度3的群体收获产量分别为3850.0±115.5千克/公顷,4011.1±67.4千克/公顷和4066.7±264.6千克/公顷,相比于对照Jack分别增产13.1%、19.3%和38.7%。
表2野生型、Gmcol2a和Gmcol2b突变体北京不同种植密度的田间表型
植株 株高(cm) 单株荚数(个) 单株粒数(粒) 主茎节数(节)
Jack-密度1 151.0±8.1 58.7±7.4 152.6±20.6 23.2±1.5
Gmcol2a-密度1 129.7±7.9** 72.0±8.2** 184.8±21.9** 22.2±1.5
Gmcol2b-密度1 128.4±6.9** 66.8±10.6** 170.4±28.0** 21.8±1.5
Jack-密度2 136.2±6.3 69.3±12.8 179.0±34.0 23.4±1.7
Gmcol2a-密度2 124.2±6.6** 82.7±8.3** 214.2±21.0** 22.8±1.3
Gmcol2b-密度2 122.4±6.8** 79.9±10.9** 207.8±31.4** 22.9±1.6
Jack-密度3 130.7±8.8 74.2±14.7 196.5±39.0 23.5±1.9
Gmcol2a-密度3 119.2±8.1** 90.0±17.8** 235.9±47.6** 23.3±1.9
Gmcol2b-密度3 115.07±10.6** 101.1±24.7** 256.9±63.7** 23.6±1.3
GmCOL2a基因组序列
5'-AGGATCGTCCAAGTCAATATAGCTTATGCTGGTTCAAAGTGCAAATCCGATCCAA GAAGAAGCTCGACCTTATCTGAGTTTGATAACATTAATTGCTTGTATGTCACATGGCTTGCGATTTACAACAACCATCAACAACTTTTCCTATGCATTCTACATACATATAAGGCATTCTTATAACTTCAAGTTCATATCTAATCTTTCATTTCTTGCCTATTTCTTACAAAAGCTAACTTGAACGTTGATGCCTTTACAAGTAGCGACCATCAAACCCCTCCTTTATAACCACCATGGTGCTACTATGTTATTCCTAAGTACACCAAACAAAATTTATTATGAACAATAATATTTGAACACCATGTTATTTGAAACATTCCACCTTGACAGTTCTTCTAACTCCACCAACAAAAAATTACTATTTATTTTCATAATCACAAAGACTCCACATTCTATCTGCAAAATCAGTAATCATCTAAACACGTGCTTTAATCCTTTTACGTACAGCCAATAAGATTACATGAAAGGAAAGCATATATATTAAGGGATAACATGAGATTTTGACTGGTGCATGTATATAGAATCTACATGGACCCAAAATTACACGTGTCTCCAAGTTGTGCCTCCATAGCAATACGAACAAAGCCTCAACATCTCTTTAATGATT
CCAAAAGGCAAAGGAAGCAACATGCACAGGTCCAACAAAAAAAAAAAAAAAAAACCT
CTCTCCTATTCAACCCCAAAACACAACCAACCACAAGATAAGCAAGAACTTGTGCACGC
CACTAACTTGCTGCCACGATGGCACCCTTGATTCTCCCCCAACACTACTTGGTTCTCCTC
ACTGAACTCAACTTCTCACTCACACTCACTTCTCTTCCTCCAAATTAGTTCCAACTCCAA
GTTAGTTCCAACACAAACACAAACACACACACATACATAAACCAAGCAAAGAAAGACT
CTACAAACACTTCACTACTCATACAATATTTTCAGACACAACATGTTGAAGGAAGGCACC
AACAACGTTGGTGGCAGCACCGGCACCTGGTCACATGTCTGCGACACGTGCCGGTCAG
CGCCATGCGTACTGTACTGCCATGCAGACTCAGCATACCTTTGCTCATCCTGCGATGCTC
GTGTCCATGCGGCTAACCGTGTGGCCTCAAGACACGAGCGTGTGTGGGTGTGCGAAGC
GTGTGAACGTGCTCCCGCAGCGTTTCTATGCAAAGCCGACGCAGCTTCTCTTTGTTCTTC
CTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACCACCGCGTGCCCA
TTCTCCCGATCTCTGGTTCCCTCTTCGGGGAACCAGAGCATGAACGCGTGTACGCGTTC
GTGAATGAAGTGGAAGCGGAGGAGGAAGAGGAAGAGGTTTTTGATGAGTATGATGAGG
TTGAAGCAGCTTCGTGGTTGTTGCCACATCCTATGAAAAATGATAAAATTGACGAGAATG
GTGGTGATAAGGGTTTTTTGTTTGGTGATGAGTATTTCGACAACCTTGTTGATTGTAACTC
ATGTGGTCACAATAACAACCAGTTTAGCAACGTTTATGATCAGCACCAGCAGAATTACA
GCAACACTGTCCCTCAGAACTATGCAGTGGTTCCAGTTCAGGTGCCGCAGCATTTTCAA
CCGGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGATGGTTCTCTTAGTCAA
AGTGTAAGTTACCTTCTTTTTACTTCTATGTGTTTCTTTTTGGTTTGTTGTTTATATCAATG
GGGTTTTCCCTTCTTTTTTTTTTTTTTTTTCTTTTTGCAAACTCTTTGGATCATTCATCCAT
TGGATTATACTACTTTATTAGATTTTGCCTTGAAACCTGTGCTAACTCTTCCTTCTAATTGA
CAGTTTCTTTTTCTCCATTCGTATGAAACCAAGGTTTTAAACTGCAGTCATAGTCATAGTC
AAGATTATAGTTTATTCAAAAACATTAGCATTGTAATACAATTGTACTGTAATTGTCGTCG
TGAAAAAGTTAAAAAAAAGTTTAAAAAATCTCAATCGCATACCTTCTATAAAAATCTTGA
TTGAAACCAAAGTGGGTTTCATAAGTAGTTTCTTTTACAAGAAAAACTAGCAATAAAGT
CAACTACTCTAGATCCATTGCCATACATGTGACCTTGATCCATTCCACAACGTTTCGTATT
TCTTTGCCTACCCTTTTCCCATTGACTACTTTTCTGTCTTGAGAGACATTTATTTTATTTTT
TTCGTATGCAATAGCTTTCCCTTTTTGATGTCTTGTATTTGCTAGTTATAGTTGTGATTCCT
CATAAACAGATACTTACTTTTATAGGGTAACTTAGCTTTTCACCAATTTTCGCCCATACAT
AGTTAGACTTCCCTAAACTTTGTTTCCTCATTTCTTCAACTATAATTTGATCAATTGTATAT
TAATTTCCCATAATTTTCAGCTTCAATTAAAAAATTTGAGCCTAAGTGCCTGTTTTATTAA
AGCCAAACAATGGGGGGTTTAATATTTTAAAAACTTTCTTCTATATTTCTTTTACATTTCCT
CTGTTTTCTAATATATCTTTTCTTTTTTCTATTACATCATCTTTGATATATTTTCACCTTTTTC
TTCTTACTTTGGGGACAAACATTATTGTTTCACAAAATTGGTTAGCTACTAATAGTTTATT
GCCTTACCTGTAATCTCTCAAACTTCATACACGTTTTTGTGTTAATCTTTTATATTTCATTT
TTAATTTAGGTTTCGGTTTCATCGATGGATGTTGGTGTTGTACTCGAATCAACAATAAGTG
ACATCTCAATGTCCCACTCAAAGTCGCCAATAGGGACAACTGACCTATTTCCTCCCCTTC
CCATGCCTTCACATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATACAGGGAG
AAAAAGAAGACAAGAAAATTTGAGAAGAAAATAAGGTATGCCTCAAGGAAGGCCTATG
CAGAGACTAGACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACCGATGTAGAAGCTGA
AGTGGACCAGATGTTCTCCACAACACTATTCACTGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAGAATGGAAAGAAAGTAATGGCCAGGCCATAAAAGAGAAGGTT-3'
GmCOL2b基因组序列
5'-TAAAAAAAAAGTATCATATTTAGAGAGACTAAAAGATTATTTAAGTCAAAAAATA ATTTTTGTTTAGCATTTGTTCTCACCGAGTTCTAGGCAAGTGATCCGTCTTCGTCTTCCCTTTAGTAGTTGAACAGGTCAATTGGTTAAACCACAGATTGATGGAAGTGATATAATGATTAAATATGCGATATATATTACTTGTGTCACATATTAATGAAATTGTGCGGATGGTCTAGTGGTAAATATACTAGAAAGATTTTCCTAGACAAAGATCGACTCTATGGTTGGTAATTTACTTTTACAATTTCCTTAAAATAGTCAAGTAACTAGCTGTAAACCTCAGCAAATTTAGTACTTGGAGCAACTATGAACAATTAATGATATTTATTTTAAACATTCCACCTTAATTAACATCTTAGTTCTCCAAACTCCACCAACCAAAAATTTCTATTTATTTTCATAATCACAAGCACTCCACATTCTATCTGCAAAATCAGTAATTAACCAAACACTTGCTTTAATCCTTTTAGAGCCAATAAGATTACTGAGAGGAAAGGATATATTAAGGGGTAACAAGAGATTCTAACTGGTGCAAGTATAGAATCTACATGGACCCAAATGACACGTGTCTCCAAGTTGTGTCACCATAGCAATACGAACAAAGCCTCAGCATCTCTTTAATGATTCCAAAAGGCAAAGAAGCAACATGCATGGACAGGTCCAACACCAAAACAAAAAACCCTCTCTCCTAATCAACCCTGAAACACAACCAACCACAAGATAAGCAAGAACTTGTGCACGCCACTAACTTGCTGCCACGTTGGCACTCTTGATTCTCCCCCCAACACTACTTGGTTCACCTCACTAAACTCAATTTCTCACTCACACTCACTTCAGTTCAATTCACTTCCCTTCCTCCAAATTAGTTCCAACACAAAAACCAAGCAAAGAAAAAGACTCTACCGAAACACTTCACTACTCATACAATATTTTCAGACACAACATGTTGAAGGAAGGCACCAACAACGTTGGTGGCAGCAACACTGGCACCACCTGGTCACGTGTCTGTGACACGTGCCTGTCTGCGCCATGCGTGCTGTACTGCCATGCAGACTCAGCATATCTTTGCTCTTCCTGTGATGCTCGTGTGCATGCAGCTAACCGTGTGGCCTCGAGACACAAGCGTGTGTGGGTGTGCGAAGCGTGTGAGCGTGCTCCGGCGGCGTTTCTATGCAAAGCTGACGCAGCTTCTCTTTGTTCTTCCTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACAACCGTGTTCCCATTCTCCCGATCTCAGGTTCCCTCTTCAGGGAACCAGAGCACAATCACAAACGCGTGGAACACGCGTTCGTGAATGAGGTTGAGGAGGAAGAGGAAGGGGTTTTTGATGAGTATGAAGACGAGGTTGAAGCTGCTTCGTGGTTGTTGCCACATCCTATGAAAAATAATGATGAAATTGAGGAGAATGATTGTGGTGACGAGGGTTTTTTGTTTGTTGATGAGTATTTGGACAATCTTGTTGATTGTTGTAACTCATGTGGTCACAATGACAACCAGTTTAGCAACGTTTATCAGCACCAGCAGAATTACAACACTGTCCCTCAGAACTATGTAGTGGTTCCAGTTCAGGTGCCGCAGCATTTTCAACCCGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGATGGTTCTCTTAGTCAAAGTGTAAGACTCTTCTTTTCAATTACTTCTGTGTTTCTTTTTCGGTTTGTTTTTTATATGAATAGTGTTTTCCCTTTTTCTCTTTCTTTTTCTTTTCCCAGACTCTTTGGATCATTCATCCATTGGATTATACTTTATCAGATTTTGATTTTGCCTTGACACCTTTGCTAACTCTTCCTTCCAATTGGCAGTTTCTTTCCTTTCTCCGTTCATATGAAACTAGGGTTTTAAATTATACTCATGATCAATAATTTGGTTGCAATTTTTGATATTGTAGTACAATTGCTATTGTTGTTGTGAAAAGTTAAAAAAATCTTAATGTTGTAACCGAAATCTCAATCACATACTGTTTGTAAAATCCTTGGTTGAAATCAAAGTGGGTTTCCCAAGTAGCTTCTTTTACTAGAAACGCTAGCAAAGTCAACTACTCTAGTTCAATTGCCATATATGTGACTAATTTGATTCATTCCACAACTCTTCATATTTCTTTGACTACCCTTTTACCGTTCACTTTGCGGTCTTGAGAGACTTTTATTTATTTTCTTTTTTGTCGTATATAAGATCAGCTTTGCCTTTATGGTGTCTTTTATTTGCTAGTTATAGTTGTGATTCCTCTTAAACTTTGTTTCCTCATTTCATCAACTGTATATTAATTTCCCATAATTTTTCAGCTTCAATTAAAAAAATTGAGCCTAAGTGCCTGATTTATTAAAGCCACAAAATGGGTGGTTTAATTTTTTCGACACCTTTCTTTTATATTTCTTTTACTCTTCTTCTCTTTTCTTTTTCTATTACATCATCTATAATATATCTTCACCTTTTTCTTCTTACTTTGGGGACAAACATTTTTGTTTCACAAAGCTGGTTAGCTACTAGTTTATTGCTTAGAAAATTTATAGCCTTACCTGTGATCTCTCAAACTTCATACACGATTTTGTGTTAATCTTTTATATTTCATTTTTAATTTAGGTTTCGGTTTCATCAATGGATGTTGGAGTTGTACCCGAATCAACAGTAAGTGGCATCTCAATGTCCCACTCAAAGTCACCAATAGGGACAAATGACCTATTTCCTCCCCTTCTCATGCCTTCACATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATATAGGGAGAAAAAGAAGACAAGAAAGTTCGAGAAGAAAATAAGATATGCCTCAAGGAAGGCCTATGCAGAGACTAGACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACTGATGTAGAAGCTGAAGTGGATCAGATGTTCTCCACAAAACTATTCAATGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAGAATGGAAAGAAAGTAATTGCCAAGCCATAGAAGAGAAGGTTGGGAACCACACATCATTGGAAGAACTTCATGTAATTTTTATGTAGTCTAATTAGTTTGGTATTATATTTACTTCTATCTTGTGCTTTATAAATATAAAGTAT-3'
pUC57-sgRNA-SpCas9载体序列
5'-TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGA CGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGTTTAAACGGCGCGCCCCAATGTCCCTAGGTTCGTTGAACAACGGAAACTCGACTTGCCTTCCGCACAATACATCATTTCTTCTTAGCTTTTTTTCTTCTTCTTCGTTCATACAGTTTTTTTTTGTTTATCAGCTTACATTTTCTTGAACCGTAGCTTTCGTTTTCTTCTTTTTAACTTTCCATTCGGAGTTTTTGTATCTTGTTTCATAGTTTGTCCCAGGATTAGAATGATTAGGCATCGAACCTTCAAGAATTTGATTGAATAAAACATCTTCATTCTTAAGATATGAAGATAATCTTCAAAAGGCCCCTGGGAATCTGAAAGAAGAGAAGCAGGCCCATTTATATGGGAAAGAACAATAGTATTTCTTATATAGGCCCATTTAAGTTGAAAACAATCTTCAAAAGTCCCACATCGCTTAGATAAGAAAACGAAGCTGAGTTTATATACAGCTAGAGTCGAAGTAGTGATTGCTAGCGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCAGAAGACCCGTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCAAAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAGATTTTTTTACTAGTTTAATTAAGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTC-3'
PTF101-SpCas9载体序列如下:
5'-AGTACTTTAAAGTACTTTAAAGTACTTTAAAGTACTTTGATCCAACCCCTCCGCTG CTATAGTGCAGTCGGCTTCTGACGTTCAGTGCAGCCGTCTTCTGAAAACGACATGTCGC
ACAAGTCCTAAGTTACGCGACAGGCTGCCGCCCTGCCCTTTTCCTGGCGTTTTCTTGTCG
CGTGTTTTAGTCGCATAAAGTAGAATACTTGCGACTAGAACCGGAGACATTACGCCATGA
ACAAGAGCGCCGCCGCTGGCCTGCTGGGCTATGCCCGCGTCAGCACCGACGACCAGGA
CTTGACCAACCAACGGGCCGAACTGCACGCGGCCGGCTGCACCAAGCTGTTTTCCGAG
AAGATCACCGGCACCAGGCGCGACCGCCCGGAGCTGGCCAGGATGCTTGACCACCTAC
GCCCTGGCGACGTTGTGACAGTGACCAGGCTAGACCGCCTGGCCCGCAGCACCCGCGA
CCTACTGGACATTGCCGAGCGCATCCAGGAGGCCGGCGCGGGCCTGCGTAGCCTGGCA
GAGCCGTGGGCCGACACCACCACGCCGGCCGGCCGCATGGTGTTGACCGTGTTCGCCG
GCATTGCCGAGTTCGAGCGTTCCCTAATCATCGACCGCACCCGGAGCGGGCGCGAGGCC
GCCAAGGCCCGAGGCGTGAAGTTTGGCCCCCGCCCTACCCTCACCCCGGCACAGATCG
CGCACGCCCGCGAGCTGATCGACCAGGAAGGCCGCACCGTGAAAGAGGCGGCTGCACT
GCTTGGCGTGCATCGCTCGACCCTGTACCGCGCACTTGAGCGCAGCGAGGAAGTGACG
CCCACCGAGGCCAGGCGGCGCGGTGCCTTCCGTGAGGACGCATTGACCGAGGCCGACG
CCCTGGCGGCCGCCGAGAATGAACGCCAAGAGGAACAAGCATGAAACCGCACCAGGA
CGGCCAGGACGAACCGTTTTTCATTACCGAAGAGATCGAGGCGGAGATGATCGCGGCCG
GGTACGTGTTCGAGCCGCCCGCGCACGTCTCAACCGTGCGGCTGCATGAAATCCTGGCC
GGTTTGTCTGATGCCAAGCTGGCGGCCTGGCCGGCCAGCTTGGCCGCTGAAGAAACCG
AGCGCCGCCGTCTAAAAAGGTGATGTGTATTTGAGTAAAACAGCTTGCGTCATGCGGTC
GCTGCGTATATGATGCGATGAGTAAATAAACAAATACGCAAGGGGAACGCATGAAGGTT
ATCGCTGTACTTAACCAGAAAGGCGGGTCAGGCAAGACGACCATCGCAACCCATCTAGC
CCGCGCCCTGCAACTCGCCGGGGCCGATGTTCTGTTAGTCGATTCCGATCCCCAGGGCA
GTGCCCGCGATTGGGCGGCCGTGCGGGAAGATCAACCGCTAACCGTTGTCGGCATCGAC
CGCCCGACGATTGACCGCGACGTGAAGGCCATCGGCCGGCGCGACTTCGTAGTGATCGA
CGGAGCGCCCCAGGCGGCGGACTTGGCTGTGTCCGCGATCAAGGCAGCCGACTTCGTG
CTGATTCCGGTGCAGCCAAGCCCTTACGACATATGGGCCACCGCCGACCTGGTGGAGCT
GGTTAAGCAGCGCATTGAGGTCACGGATGGAAGGCTACAAGCGGCCTTTGTCGTGTCGC
GGGCGATCAAAGGCACGCGCATCGGCGGTGAGGTTGCCGAGGCGCTGGCCGGGTACGA
GCTGCCCATTCTTGAGTCCCGTATCACGCAGCGCGTGAGCTACCCAGGCACTGCCGCCG
CCGGCACAACCGTTCTTGAATCAGAACCCGAGGGCGACGCTGCCCGCGAGGTCCAGGC
GCTGGCCGCTGAAATTAAATCAAAACTCATTTGAGTTAATGAGGTAAAGAGAAAATGAG
CAAAAGCACAAACACGCTAAGTGCCGGCCGTCCGAGCGCACGCAGCAGCAAGGCTGC
AACGTTGGCCAGCCTGGCAGACACGCCAGCCATGAAGCGGGTCAACTTTCAGTTGCCG
GCGGAGGATCACACCAAGCTGAAGATGTACGCGGTACGCCAAGGCAAGACCATTACCG
AGCTGCTATCTGAATACATCGCGCAGCTACCAGAGTAAATGAGCAAATGAATAAATGAGT
AGATGAATTTTAGCGGCTAAAGGAGGCGGCATGGAAAATCAAGAACAACCAGGCACCG
ACGCCGTGGAATGCCCCATGTGTGGAGGAACGGGCGGTTGGCCAGGCGTAAGCGGCTG
GGTTGTCTGCCGGCCCTGCAATGGCACTGGAACCCCCAAGCCCGAGGAATCGGCGTGA
GCGGTCGCAAACCATCCGGCCCGGTACAAATCGGCGCGGCGCTGGGTGATGACCTGGT
GGAGAAGTTGAAGGCCGCGCAGGCCGCCCAGCGGCAACGCATCGAGGCAGAAGCACG
CCCCGGTGAATCGTGGCAAGCGGCCGCTGATCGAATCCGCAAAGAATCCCGGCAACCG
CCGGCAGCCGGTGCGCCGTCGATTAGGAAGCCGCCCAAGGGCGACGAGCAACCAGATT
TTTTCGTTCCGATGCTCTATGACGTGGGCACCCGCGATAGTCGCAGCATCATGGACGTGG
CCGTTTTCCGTCTGTCGAAGCGTGACCGACGAGCTGGCGAGGTGATCCGCTACGAGCTT
CCAGACGGGCACGTAGAGGTTTCCGCAGGGCCGGCCGGCATGGCCAGTGTGTGGGATT
ACGACCTGGTACTGATGGCGGTTTCCCATCTAACCGAATCCATGAACCGATACCGGGAA
GGGAAGGGAGACAAGCCCGGCCGCGTGTTCCGTCCACACGTTGCGGACGTACTCAAGT
TCTGCCGGCGAGCCGATGGCGGAAAGCAGAAAGACGACCTGGTAGAAACCTGCATTCG
GTTAAACACCACGCACGTTGCCATGCAGCGTACGAAGAAGGCCAAGAACGGCCGCCTG
GTGACGGTATCCGAGGGTGAAGCCTTGATTAGCCGCTACAAGATCGTAAAGAGCGAAAC
CGGGCGGCCGGAGTACATCGAGATCGAGCTAGCTGATTGGATGTACCGCGAGATCACAG
AAGGCAAGAACCCGGACGTGCTGACGGTTCACCCCGATTACTTTTTGATCGATCCCGGC
ATCGGCCGTTTTCTCTACCGCCTGGCACGCCGCGCCGCAGGCAAGGCAGAAGCCAGATG
GTTGTTCAAGACGATCTACGAACGCAGTGGCAGCGCCGGAGAGTTCAAGAAGTTCTGT
TTCACCGTGCGCAAGCTGATCGGGTCAAATGACCTGCCGGAGTACGATTTGAAGGAGGA
GGCGGGGCAGGCTGGCCCGATCCTAGTCATGCGCTACCGCAACCTGATCGAGGGCGAA
GCATCCGCCGGTTCCTAATGTACGGAGCAGATGCTAGGGCAAATTGCCCTAGCAGGGGA
AAAAGGTCGAAAAGGTCTCTTTCCTGTGGATAGCACGTACATTGGGAACCCAAAGCCGT
ACATTGGGAACCGGAACCCGTACATTGGGAACCCAAAGCCGTACATTGGGAACCGGTC
ACACATGTAAGTGACTGATATAAAAGAGAAAAAAGGCGATTTTTCCGCCTAAAACTCTTT
AAAACTTATTAAAACTCTTAAAACCCGCCTGGCCTGTGCATAACTGTCTGGCCAGCGCA
CAGCCGAAGAGCTGCAAAAAGCGCCTACCCTTCGGTCGCTGCGCTCCCTACGCCCCGCC
GCTTCGCGTCGGCCTATCGCGGCCGCTGGCCGCTCAAAAATGGCTGGCCTACGGCCAGG
CAATCTACCAGGGCGCGGACAAGCCGCGCCGTCGCCACTCGACCGCCGGCGCCCACAT
CAAGGCACCCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGC
TCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCA
GGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCCAGTCACGTAGC
GATAGCGGAGTGTATACTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGC
ACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGC
TCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTA
TCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAA
GAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCT
GGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTC
AGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTC
CCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCC
TTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGT
CGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCT
TATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAG
CAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTG
AAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTG
AAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCG
CTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCT
CAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACG
TTAAGGGATTTTGGTCATGCATGATATATCTCCCAATTTGTGTAGGGCTTATTATGCACGCT
TAAAAATAATAAAAGCAGACTTGACCTGATAGTTTGGCTGTGAGCAATTATGTGCTTAGT
GCATCTAACGCTTGAGTTAAGCCGCGCCGCGAAGCGGCGTCGGCTTGAACGAATTTCTA
GCTAGACATTATTTGCCGACTACCTTGGTGATCTCGCCTTTCACGTAGTGGACAAATTCTT
CCAACTGATCTGCGCGCGAGGCCAAGCGATCTTCTTCTTGTCCAAGATAAGCCTGTCTA
GCTTCAAGTATGACGGGCTGATACTGGGCCGGCAGGCGCTCCATTGCCCAGTCGGCAGC
GACATCCTTCGGCGCGATTTTGCCGGTTACTGCGCTGTACCAAATGCGGGACAACGTAA
GCACTACATTTCGCTCATCGCCAGCCCAGTCGGGCGGCGAGTTCCATAGCGTTAAGGTTT
CATTTAGCGCCTCAAATAGATCCTGTTCAGGAACCGGATCAAAGAGTTCCTCCGCCGCT
GGACCTACCAAGGCAACGCTATGTTCTCTTGCTTTTGTCAGCAAGATAGCCAGATCAATG
TCGATCGTGGCTGGCTCGAAGATACCTGCAAGAATGTCATTGCGCTGCCATTCTCCAAAT
TGCAGTTCGCGCTTAGCTGGATAACGCCACGGAATGATGTCGTCGTGCACAACAATGGT
GACTTCTACAGCGCGGAGAATCTCGCTCTCTCCAGGGGAAGCCGAAGTTTCCAAAAGG
TCGTTGATCAAAGCTCGCCGCGTTGTTTCATCAAGCCTTACGGTCACCGTAACCAGCAA
ATCAATATCACTGTGTGGCTTCAGGCCGCCATCCACTGCGGAGCCGTACAAATGTACGGC
CAGCAACGTCGGTTCGAGATGGCGCTCGATGACGCCAACTACCTCTGATAGTTGAGTCG
ATACTTCGGCGATCACCGCTTCCCCCATGATGTTTAACTTTGTTTTAGGGCGACTGCCCTG
CTGCGTAACATCGTTGCTGCTCCATAACATCAAACATCGACCCACGGCGTAACGCGCTTG
CTGCTTGGATGCCCGAGGCATAGACTGTACCCCAAAAAAACAGTCATAACAAGCCATGA
AAACCGCCACTGCGCCGTTACCACCGCTGCGTTCGGTCAAGGTTCTGGACCAGTTGCGT
GACGGCAGTTACGCTACTTGCATTACAGCTTACGAACCGAACGAGGCTTATGTCCACTG
GGTTCGTGCCCGAATTGATCACAGGCAGCAACGCTCTGTCATCGTTACAATCAACATGCT
ACCCTCCGCGAGATCATCCGTGTTTCAAACCCGGCAGCTTAGTTGCCGTTCTTCCGAATA
GCATCGGTAACATGAGCAAAGTCTGCCGCCTTACAACGGCTCTCCCGCTGACGCCGTCC
CGGACTGATGGGCTGCCTGTATCGAGTGGTGATTTTGTGCCGAGCTGCCGGTCGGGGAG
CTGTTGGCTGGCTGGTGGCAGGATATATTGTGGTGTAAACAAATTGACGCTTAGACAACT
TAATAACACATTGCGGACGTTTTTAATGTACTGAATTAACGCCGAATTGCTCTAGCATTCG
CCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACG
CCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTT
TCCCAGTCACGACGTTGTAAAACGACGGCCAGTGCCAAGCTAATTCGCTTCAAGACGTG
CTCAAATCACTATTTCCACACCCCTATATTTCTATTGCACTCCCTTTTAACTGTTTTTTATT
ACAAAAATGCCCTGGAAAATGCACTCCCTTTTTGTGTTTGTTTTTTTGTGAAACGATGTT
GTCAGGTAATTTATTTGTCAGTCTACTATGGTGGCCCATTATATTAATAGCAACTGTCGGT
CCAATAGACGACGTCGATTTTCTGCATTTGTTTAACCACGTGGATTTTATGACATTTTATAT
TAGTTAATTTGTAAAACCTACCCAATTAAAGACCTCATATGTTCTAAAGACTAATACTTAA
TGATAACAATTTTCTTTTAGTGAAGAAAGGGATAATTAGTAAATATGGAACAAGGGCAGA
AGATTTATTAAAGCCGCGGTAAGAGACAACAAGTAGGTACGTGGAGTGTCTTAGGTGAC
TTACCCACATAACATAAAGTGACATTAACAAACATAGCTAATGCTCCTATTTGAATAGTGC
ATATCAGCATACCTTATTACATATAGATAGGAGCAAACTCTAGCTAGATTGTTGAGCAGAT
CTCGGTGACGGGCAGGACCGGACGGGGCGGTACCGGCAGGCTGAAGTCCAGCTGCCA
GAAACCCACGTCATGCCAGTTCCCGTGCTTGAAGCCGGCCGCCCGCAGCATGCCGCGG
GGGGCATATCCGAGCGCCTCGTGCATGCGCACGCTCGGGTCGTTGGGCAGCCCGATGAC
AGCGACCACGCTCTTGAAGCCCTGTGCCTCCAGGGACTTCAGCAGGTGGGTGTAGAGC
GTGGAGCCCAGTCCCGTCCGCTGGTGGCGGGGGGAGACGTACACGGTCGACTCGGCCG
TCCAGTCGTAGGCGTTGCGTGCCTTCCAGGGGCCCGCGTAGGCGATGCCGGCGACCTCG
CCGTCCACCTCGGCGACGAGCCAGGGATAGCGCTCCCGCAGACGGACGAGGTCGTCCG
TCCACTCCTGCGGTTCCTGCGGCTCGGTACGGAAGTTGACCGTGCTTGTCTCGATGTAGT
GGTTGACGATGGTGCAGACCGCCGGCATGTCCGCCTCGGTGGCACGGCGGATGTCGGC
CGGGCGTCGTTCTGGGCTCATGGTAGATCCCCCGTTCGTAAATGGTGAAAATTTTCAGAA
AATTGCTTTTGCTTTAAAAGAAATGATTTAAATTGCTGCAATAGAAGTAGAATGCTTGATT
GCTTGAGATTCGTTTGTTTTGTATATGTTGTGTTGAGAATTAATTCTCGAGGTCCTCTCCA
AATGAAATGAACTTCCTTATATAGAGGAAGGGTCTTGCGAAGGATAGTGGGATTGTGCGT
CATCCCTTACGTCAGTGGAGATATCACATCAATCCACTTGCTTTGAAGACGTGGTTGGAA
CGTCTTCTTTTTCCACGATGCTCCTCGTGGGTGGGGGTCCATCTTTGGGACCACTGTCGG
TAGAGGCATCTTGAACGATAGCCTTTCCTTTATCGCAATGATGGCATTTGTAGGAGCCAC
CTTCCTTTTCCACTATCTTCACAATAAAGTGACAGATAGCTGGGCAATGGAATCCGAGGA
GGTTTCCGGATATTACCCTTTGTTGAAAAGTCTCAATTGCCCTTTGGTCTTCTGAGACTGT
ATCTTTGATATTTTTGGAGTAGACAAGTGTGTCGTGCTCCACCATGTTATCACATCAATCC
ACTTGCTTTGAAGACGTGGTTGGAACGTCTTCTTTTTCCACGATGCTCCTCGTGGGTGG
GGGTCCATCTTTGGGACCACTGTCGGCAGAGGCATCTTCAACGATGGCCTTTCCTTTATC
GCAATGATGGCATTTGTAGGAGCCACCTTCCTTTTCCACTATCTTCACAATAAAGTGACA
GATAGCTGGGCAATGGAATCCGAGGAGGTTTCCGGATATTACCCTTTGTTGAAAAGTCTC
AATTGCCCTTTGGTCTTCTGAGACTGTATCTTTGATATTTTTGGAGTAGACAAGTGTGTCG
TGCTCCACCATGTTGACCTGCAGGCATGCAAGCTTGCATGCCTGCAGGTCCCCAGATTA
GCCTTTTCAATTTCAGAAAGAATGCTAACCCACAGATGGTTAGAGAGGCTTACGCAGCA
GGTCTCATCAAGACGATCTACCCGAGCAATAATCTCCAGGAAATCAAATACCTTCCCAAG
AAGGTTAAAGATGCAGTCAAAAGATTCAGGACTAACTGCATCAAGAACACAGAGAAAG
ATATATTTCTCAAGATCAGAAGTACTATTCCAGTATGGACGATTCAAGGCTTGCTTCACAA
ACCAAGGCAAGTAATAGAGATTGGAGTCTCTAAAAAGGTAGTTCCCACTGAATCAAAGG
CCATGGAGTCAAAGATTCAAATAGAGGACCTAACAGAACTCGCCGTAAAGACTGGCGA
ACAGTTCATACAGAGTCTCTTACGACTCAATGACAAGAAGAAAATCTTCGTCAACATGG
TGGAGCACGACACACTTGTCTACTCCAAAAATATCAAAGATACAGTCTCAGAAGACCAA
AGGGCAATTGAGACTTTTCAACAAAGGGTAATATCCGGAAACCTCCTCGGATTCCATTG
CCCAGCTATCTGTCACTTTATTGTGAAGATAGTGGAAAAGGAAGGTGGCTCCTACAAAT
GCCATCATTGCGATAAAGGAAAGGCCATCGTTGAAGATGCCTCTGCCGACAGTGGTCCC
AAAGATGGACCCCCACCCACGAGGAGCATCGTGGAAAAAGAAGACGTTCCAACCACGT
CTTCAAAGCAAGTGGATTGATGTGATATCTCCACTGACGTAAGGGATGACGCACAATCC
CACTATCCTTCGCAAGACCCTTCCTCTATATAAGGAAGTTCATTTCATTTGGAGAGAACA
CGGGGGACTCTAGAATGGCCCCTAAGAAGAAGAGAAAGGTCGGTATTCACGGCGTTCC
TGCGGCGATGGACAAGAAGTATAGTATTGGTCTGGACATTGGGACGAATTCCGTTGGCT
GGGCCGTGATCACCGATGAGTACAAGGTCCCTTCCAAGAAGTTTAAGGTTCTGGGGAAC
ACCGATCGGCACAGCATCAAGAAGAATCTCATTGGAGCCCTCCTGTTCGACTCAGGCGA
GACCGCCGAAGCAACAAGGCTCAAGAGAACCGCAAGGAGACGGTATACAAGAAGGAA
GAATAGGATCTGCTACCTGCAGGAGATTTTCAGCAACGAAATGGCGAAGGTGGACGATT
CGTTCTTTCATAGATTGGAGGAGAGTTTCCTCGTCGAGGAAGATAAGAAGCACGAGAGG
CATCCTATCTTTGGCAACATTGTCGACGAGGTTGCCTATCACGAAAAGTACCCCACAATC
TATCATCTGCGGAAGAAGCTTGTGGACTCGACTGATAAGGCGGACCTTAGATTGATCTAC
CTCGCTCTGGCACACATGATTAAGTTCAGGGGCCATTTTCTGATCGAGGGGGATCTTAAC
CCGGACAATAGCGATGTGGACAAGTTGTTCATCCAGCTCGTCCAAACCTACAATCAGCT
CTTTGAGGAAAACCCAATTAATGCTTCAGGCGTCGACGCCAAGGCGATCCTGTCTGCAC
GCCTTTCAAAGTCTCGCCGGCTTGAGAACTTGATCGCTCAACTCCCGGGCGAAAAGAA
GAACGGCTTGTTCGGGAATCTCATTGCACTTTCGTTGGGGCTCACACCAAACTTCAAGA
GTAATTTTGATCTCGCTGAGGACGCAAAGCTGCAGCTTTCCAAGGACACTTATGACGAT
GACCTGGATAACCTTTTGGCCCAAATCGGCGATCAGTACGCGGACTTGTTCCTCGCCGC
GAAGAATTTGTCGGACGCGATCCTCCTGAGTGATATTCTCCGCGTGAACACCGAGATTAC
AAAGGCCCCGCTCTCGGCGAGTATGATCAAGCGCTATGACGAGCACCATCAGGATCTGA
CCCTTTTGAAGGCTTTGGTCCGGCAGCAACTCCCAGAGAAGTACAAGGAAATCTTCTTT
GATCAATCCAAGAACGGCTACGCTGGTTATATTGACGGCGGGGCATCGCAGGAGGAATT
CTACAAGTTTATCAAGCCAATTCTGGAGAAGATGGATGGCACAGAGGAACTCCTGGTGA
AGCTCAATAGGGAGGACCTTTTGCGGAAGCAAAGAACTTTCGATAACGGCAGCATCCCT
CACCAGATTCATCTCGGGGAGCTGCACGCCATCCTGAGAAGGCAGGAAGACTTCTACCC
CTTTCTTAAGGATAACCGGGAGAAGATCGAAAAGATTCTGACGTTCAGAATTCCGTACTA
TGTCGGACCACTCGCCCGGGGTAATTCCAGATTTGCGTGGATGACCAGAAAGAGCGAG
GAAACCATCACACCTTGGAACTTCGAGGAAGTGGTCGATAAGGGCGCTTCCGCACAGA
GCTTCATTGAGCGCATGACAAATTTTGACAAGAACCTGCCTAATGAGAAGGTCCTTCCC
AAGCATTCCCTCCTGTACGAGTATTTCACTGTTTATAACGAACTCACGAAGGTGAAGTAT
GTGACCGAGGGAATGCGCAAGCCCGCCTTCCTGAGCGGCGAGCAAAAGAAGGCGATCG
TGGACCTTTTGTTTAAGACCAATCGGAAGGTCACAGTTAAGCAGCTCAAGGAGGACTAC
TTCAAGAAGATTGAATGCTTCGATTCCGTTGAGATCAGCGGCGTGGAAGACAGGTTTAA
CGCGTCACTGGGGACTTACCACGATCTCCTGAAGATCATTAAGGATAAGGACTTCTTGG
ACAACGAGGAAAATGAGGATATCCTCGAAGACATTGTCCTGACTCTTACGTTGTTTGAG
GATAGGGAAATGATCGAGGAACGCTTGAAGACGTATGCCCATCTCTTCGATGACAAGGT
TATGAAGCAGCTCAAGAGAAGAAGATACACCGGATGGGGAAGGCTGTCCCGCAAGCTT
ATCAATGGCATTAGAGACAAGCAATCAGGGAAGACAATCCTTGACTTTTTGAAGTCTGA
TGGCTTCGCGAACAGGAATTTTATGCAGCTGATTCACGATGACTCACTTACTTTCAAGGA
GGATATCCAGAAGGCTCAAGTGTCGGGACAAGGTGACAGTCTGCACGAGCATATCGCCA
ACCTTGCGGGATCTCCTGCAATCAAGAAGGGTATTCTGCAGACAGTCAAGGTTGTGGAT
GAGCTTGTGAAGGTCATGGGACGGCATAAGCCCGAGAACATCGTTATTGAGATGGCCAG
AGAAAATCAGACCACACAAAAGGGTCAGAAGAACTCGAGGGAGCGCATGAAGCGCAT
CGAGGAAGGCATTAAGGAGCTGGGGAGTCAGATCCTTAAGGAGCACCCGGTGGAAAAC
ACGCAGTTGCAAAATGAGAAGCTCTATCTGTACTATCTGCAAAATGGCAGGGATATGTAT
GTGGACCAGGAGTTGGATATTAACCGCCTCTCGGATTACGACGTCGATCATATCGTTCCT
CAGTCCTTCCTTAAGGATGACAGCATTGACAATAAGGTTCTCACCAGGTCCGACAAGAA
CCGCGGGAAGTCCGATAATGTGCCCAGCGAGGAAGTCGTTAAGAAGATGAAGAACTAC
TGGAGGCAACTTTTGAATGCCAAGTTGATCACACAGAGGAAGTTTGATAACCTCACTAA
GGCCGAGCGCGGAGGTCTCAGCGAACTGGACAAGGCGGGCTTCATTAAGCGGCAACTG
GTTGAGACTAGACAGATCACGAAGCACGTGGCGCAGATTCTCGATTCACGCATGAACAC
GAAGTACGATGAGAATGACAAGCTGATCCGGGAAGTGAAGGTCATCACCTTGAAGTCA
AAGCTCGTTTCTGACTTCAGGAAGGATTTCCAATTTTATAAGGTGCGCGAGATCAACAAT
TATCACCATGCTCATGACGCATACCTCAACGCTGTGGTCGGAACAGCATTGATTAAGAAG
TACCCGAAGCTCGAGTCCGAATTCGTGTACGGTGACTATAAGGTTTACGATGTGCGCAA
GATGATCGCCAAGTCAGAGCAGGAAATTGGCAAGGCCACTGCGAAGTATTTCTTTTACT
CTAACATTATGAATTTCTTTAAGACTGAGATCACGCTGGCTAATGGCGAAATCCGGAAGA
GACCACTTATTGAGACCAACGGCGAGACAGGGGAAATCGTGTGGGACAAGGGGAGGGA
TTTCGCCACAGTCCGCAAGGTTCTCTCTATGCCTCAAGTGAATATTGTCAAGAAGACTGA
AGTCCAGACGGGCGGGTTCTCAAAGGAATCTATTCTGCCCAAGCGGAACTCGGATAAGC
TTATCGCCAGAAAGAAGGACTGGGACCCGAAGAAGTATGGAGGTTTCGACTCACCAAC
GGTGGCTTACTCTGTCCTGGTTGTGGCAAAGGTGGAGAAGGGAAAGTCAAAGAAGCTC
AAGTCTGTCAAGGAGCTCCTGGGTATCACCATTATGGAGAGGTCCAGCTTCGAAAAGAA
TCCGATCGATTTTCTCGAGGCGAAGGGATATAAGGAAGTGAAGAAGGACCTGATCATTA
AGCTTCCAAAGTACAGTCTTTTCGAGTTGGAAAACGGCAGGAAGCGCATGTTGGCTTCC
GCAGGAGAGCTCCAGAAGGGTAACGAGCTTGCTTTGCCGTCCAAGTATGTGAACTTCCT
CTATCTGGCATCCCACTACGAGAAGCTCAAGGGCAGCCCAGAGGATAACGAACAGAAG
CAACTGTTTGTGGAGCAACACAAGCATTATCTTGACGAGATCATTGAACAGATTTCGGA
GTTCAGTAAGCGCGTCATCCTCGCCGACGCGAATTTGGATAAGGTTCTCTCAGCCTACAA
CAAGCACCGGGACAAGCCTATCAGAGAGCAGGCGGAAAATATCATTCATCTCTTCACCC
TGACAAACCTTGGGGCTCCCGCTGCATTCAAGTATTTTGACACTACGATTGATCGGAAG
AGATACACTTCTACGAAGGAGGTGCTGGATGCAACCCTTATCCACCAATCGATTACTGGC
CTCTACGAGACGCGGATCGACTTGAGTCAGCTCGGGGGGGATAAGAGACCAGCGGCAA
CCAAGAAGGCAGGACAAGCGAAGAAGAAGAAGTAGGTTAACGAATTTCCCCGATCGTT
CAAACATTTGGCAATAAAGTTTCTTAAGATTGAATCCTGTTGCCGGTCTTGCGATGATTAT
CATATAATTTCTGTTGAATTACGTTAAGCATGTAATAATTAACATGTAATGCATGACGTTAT
TTATGAGATGGGTTTTTATGATTAGAGTCCCGCAATTATACATTTAATACGCGATAGAAAA
CAAAATATAGCGCGCAAACTAGGATAAATTATCGCGCGCGGTGTCATCTATGTTACTAGAT
CGGGAATTCTTAATTAAGGATCCGTAATCATGTCATAGCTGTTTCCTGTGTGAAATTGTTA
TCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTG
CCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGG
GAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTT
GCGTATTGGAGCTTGAGCTTGGATCAGATTGTCGTTTCCCGCCTTCAGGCGCGCCGTTTA
AACTATCAGTGTTTGACAGGATATATTGGCGGGTAAACCTAAGAGAAAAGAGCGTTTATT
AGAATAATCGGATATTTAAAAGGGCGTGAAAAGGTTTATCCGTTCGTCCATTTGTATGTGCATGCCAACCACAGGGTTCCCCTCGGGATCAA-3'
Gmcol2a-78突变体中突变后的基因组序列
5'-AGGATCGTCCAAGTCAATATAGCTTATGCTGGTTCAAAGTGCAAATCCGATCCAA GAAGAAGCTCGACCTTATCTGAGTTTGATAACATTAATTGCTTGTATGTCACATGGCTTGCGATTTACAACAACCATCAACAACTTTTCCTATGCATTCTACATACATATAAGGCATTCTTATAACTTCAAGTTCATATCTAATCTTTCATTTCTTGCCTATTTCTTACAAAAGCTAACTTGAACGTTGATGCCTTTACAAGTAGCGACCATCAAACCCCTCCTTTATAACCACCATGGTGCTACTATGTTATTCCTAAGTACACCAAACAAAATTTATTATGAACAATAATATTTGAACACCATGTTATTTGAAACATTCCACCTTGACAGTTCTTCTAACTCCACCAACAAAAAATTACTATTTATTTTCATAATCACAAAGACTCCACATTCTATCTGCAAAATCAGTAATCATCTAAACACGTGCTTTAATCCTTTTACGTACAGCCAATAAGATTACATGAAAGGAAAGCATATATATTAAGGGATAACATGAGATTTTGACTGGTGCATGTATATAGAATCTACATGGACCCAAAATTACACGTGTCTCCAAGTTGTGCCTCCATAGCAATACGAACAAAGCCTCAACATCTCTTTAATGATTCCAAAAGGCAAAGGAAGCATGCGTACTGTACTGCCATGCAGACTCAGCATACCTTTGCTCATCCTGCGATGCTCGTGTCCATGCGGCTAACCGTGTGGCCTCAAGACACGAGCGTGTGTGGGTGTGCGAAGCGTGTGAACGTGCTCCCGCAGCGTTTCTATGCAAAGCCGACGCAGCTTCTCTTTGTTCTTCCTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACCACCGCGTGCCCATTCTCCCGATCTCTGGTTCCCTCTTCGGGGAACCAGAGCATGAACGCGTGTACGCGTTCGTGAATGAAGTGGAAGCGGAGGAGGAAGAGGAAGAGGTTTTTGATGAGTATGATGAGGTTGAAGCAGCTTCGTGGTTGTTGCCACATCCTATGAAAAATGATAAAATTGACGAGAATGGTGGTGATAAGGGTTTTTTGTTTGGTGATGAGTATTTCGACAACCTTGTTGATTGTAACTCATGTGGTCACAATAACAACCAGTTTAGCAACGTTTATGATCAGCACCAGCAGAATTACAGCAACACTGTCCCTCAGAACTATGCAGTGGTTCCAGTTCAGGTGCCGCAGCATTTTCAACCGGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGATGGTTCTCTTAGTCAAAGTGTAAGTTACCTTCTTTTTACTTCTATGTGTTTCTTTTTGGTTTGTTGTTTATATCAATGGGGTTTTCCCTTCTTTTTTTTTTTTTTTTTCTTTTTGCAAACTCTTTGGATCATTCATCCATTGGATTATACTACTTTATTAGATTTTGCCTTGAAACCTGTGCTAACTCTTCCTTCTAATTGACAGTTTCTTTTTCTCCATTCGTATGAAACCAAGGTTTTAAACTGCAGTCATAGTCATAGTCAAGATTATAGTTTATTCAAAAACATTAGCATTGTAATACAATTGTACTGTAATTGTCGTCGTGAAAAAGTTAAAAAAAAGTTTAAAAAATCTCAATCGCATACCTTCTATAAAAATCTTGATTGAAACCAAAGTGGGTTTCATAAGTAGTTTCTTTTACAAGAAAAACTAGCAATAAAGTCAACTACTCTAGATCCATTGCCATACATGTGACCTTGATCCATTCCACAACGTTTCGTATTTCTTTGCCTACCCTTTTCCCATTGACTACTTTTCTGTCTTGAGAGACATTTATTTTATTTTTTTCGTATGCAATAGCTTTCCCTTTTTGATGTCTTGTATTTGCTAGTTATAGTTGTGATTCCTCATAAACAGATACTTACTTTTATAGGGTAACTTAGCTTTTCACCAATTTTCGCCCATACATAGTTAGACTTCCCTAAACTTTGTTTCCTCATTTCTTCAACTATAATTTGATCAATTGTATATTAATTTCCCATAATTTTCAGCTTCAATTAAAAAATTTGAGCCTAAGTGCCTGTTTTATTAAAGCCAAACAATGGGGGGTTTAATATTTTAAAAACTTTCTTCTATATTTCTTTTACATTTCCTCTGTTTTCTAATATATCTTTTCTTTTTTCTATTACATCATCTTTGATATATTTTCACCTTTTTCTTCTTACTTTGGGGACAAACATTATTGTTTCACAAAATTGGTTAGCTACTAATAGTTTATTGCCTTACCTGTAATCTCTCAAACTTCATACACGTTTTTGTGTTAATCTTTTATATTTCATTTTTAATTTAGGTTTCGGTTTCATCGATGGATGTTGGTGTTGTACTCGAATCAACAATAAGTGACATCTCAATGTCCCACTCAAAGTCGCCAATAGGGACAACTGACCTATTTCCTCCCCTTCCCATGCCTTCACATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATACAGGGAGAAAAAGAAGACAAGAAAATTTGAGAAGAAAATAAGGTATGCCTCAAGGAAGGCCTATGCAGAGACTAGACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACCGATGTAGAAGCTGAAGTGGACCAGATGTTCTCCACAACACTATTCACTGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAGAATGGAAAGAAAGTAATGGCCAGGCCATAAAAGAGAAGGTT-3'
Gmcol2a-78突变体中突变后的编码序列(CDS)
5'-CATGCGTACTGTACTGCCATGCAGACTCAGCATACCTTTGCTCATCCTGCGATGCT CGTGTCCATGCGGCTAACCGTGTGGCCTCAAGACACGAGCGTGTGTGGGTGTGCGAAGCGTGTGAACGTGCTCCCGCAGCGTTTCTATGCAAAGCCGACGCAGCTTCTCTTTGTTCTTCCTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACCACCGCGTGCCCATTCTCCCGATCTCTGGTTCCCTCTTCGGGGAACCAGAGCATGAACGCGTGTACGCGTTCGTGAATGAAGTGGAAGCGGAGGAGGAAGAGGAAGAGGTTTTTGATGAGTATGATGAGGTTGAAGCAGCTTCGTGGTTGTTGCCACATCCTATGAAAAATGATAAAATTGACGAGAATGGTGGTGATAAGGGTTTTTTGTTTGGTGATGAGTATTTCGACAACCTTGTTGATTGTAACTCATGTGGTCACAATAACAACCAGTTTAGCAACGTTTATGATCAGCACCAGCAGAATTACAGCAACACTGTCCCTCAGAACTATGCAGTGGTTCCAGTTCAGGTGCCGCAGCATTTTCAACCGGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGATGGTTCTCTTAGTCAAAGTGTTTCGGTTTCATCGATGGATGTTGGTGTTGTACTCGAATCAACAATAAGTGACATCTCAATGTCCCACTCAAAGTCGCCAATAGGGACAACTGACCTATTTCCTCCCCTTCCCATGCCTTCACATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATACAGGGAGAAAAAGAAGACAAGAAAATTTGAGAAGAAAATAAGGTATGCCTCAAGGAAGGCCTATGCAGAGACTAGACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACCGATGTAGAAGCTGAAGTGGACCAGATGTTCTCCACAACACTATTCACTGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAG-3'
Gmcol2a-78突变体中突变后的氨基酸序列
MRTVLPCRLSIPLLILRCSCPCG
Gmcol2b-35突变体中突变后的基因组序列
5'-TAAAAAAAAAGTATCATATTTAGAGAGACTAAAAGATTATTTAAGTCAAAAAATA ATTTTTGTTTAGCATTTGTTCTCACCGAGTTCTAGGCAAGTGATCCGTCTTCGTCTTCCCTTTAGTAGTTGAACAGGTCAATTGGTTAAACCACAGATTGATGGAAGTGATATAATGATTAAATATGCGATATATATTACTTGTGTCACATATTAATGAAATTGTGCGGATGGTCTAGTGGTAAATATACTAGAAAGATTTTCCTAGACAAAGATCGACTCTATGGTTGGTAATTTACTTTTACAATTTCCTTAAAATAGTCAAGTAACTAGCTGTAAACCTCAGCAAATTTAGTACTTGGAGCAACTATGAACAATTAATGATATTTATTTTAAACATTCCACCTTAATTAACATCTTAGTTCTC
CAAACTCCACCAACCAAAAATTTCTATTTATTTTCATAATCACAAGCACTCCACATTCTAT
CTGCAAAATCAGTAATTAACCAAACACTTGCTTTAATCCTTTTAGAGCCAATAAGATTAC
TGAGAGGAAAGGATATATTAAGGGGTAACAAGAGATTCTAACTGGTGCAAGTATAGAAT
CTACATGGACCCAAATGACACGTGTCTCCAAGTTGTGTCACCATAGCAATACGAACAAA
GCCTCAGCATCTCTTTAATGATTCCAAAAGGCAAAGAAGCAACATGCATGGACAGGTCC
AACACCAAAACAAAAAACCCTCTCTCCTAATCAACCCTGAAACACAACCAACCACAAG
ATAAGCAAGAACTTGTGCACGCCACTAACTTGCTGCCACGTTGGCACTCTTGATTCTCCC
CCCAACACTACTTGGTTCACCTCACTAAACTCAATTTCTCACTCACACTCACTTCAGTTC
AATTCACTTCCCTTCCTCCAAATTAGTTCCAACACAAAAACCAAGCAAAGAAAAAGACT
CTACCGAAACACTTCACTACTCATACAATATTTTCAGACACAACATGTTGAAGGAAGGC
ACCAACAACGTTGGTGGCAGCAACACTGGCACACCTGGTCACGTGTCTGTGACACGTG
CCTGTCTGCGCCATGCGTGCTGTACTGCCATGCAGACTCAGCATATCTTTGCTCTTCCTGT
GATGCTCGTGTGCATGCAGCTAACCGTGTGGCCTCGAGACACAAGCGTGTGTGGGTGTG
CGAAGCGTGTGAGCGTGCTCCGGCGGCGTTTCTATGCAAAGCTGACGCAGCTTCTCTTT
GTTCTTCCTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACAACCGTG
TTCCCATTCTCCCGATCTCAGGTTCCCTCTTCAGGGAACCAGAGCACAATCACAAACGC
GTGGAACACGCGTTCGTGAATGAGGTTGAGGAGGAAGAGGAAGGGGTTTTTGATGAGT
ATGAAGACGAGGTTGAAGCTGCTTCGTGGTTGTTGCCACATCCTATGAAAAATAATGATG
AAATTGAGGAGAATGATTGTGGTGACGAGGGTTTTTTGTTTGTTGATGAGTATTTGGACA
ATCTTGTTGATTGTTGTAACTCATGTGGTCACAATGACAACCAGTTTAGCAACGTTTATC
AGCACCAGCAGAATTACAACACTGTCCCTCAGAACTATGTAGTGGTTCCAGTTCAGGTG
CCGCAGCATTTTCAACCCGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGAT
GGTTCTCTTAGTCAAAGTGTAAGACTCTTCTTTTCAATTACTTCTGTGTTTCTTTTTCGGT
TTGTTTTTTATATGAATAGTGTTTTCCCTTTTTCTCTTTCTTTTTCTTTTCCCAGACTCTTTG
GATCATTCATCCATTGGATTATACTTTATCAGATTTTGATTTTGCCTTGACACCTTTGCTAA
CTCTTCCTTCCAATTGGCAGTTTCTTTCCTTTCTCCGTTCATATGAAACTAGGGTTTTAAA
TTATACTCATGATCAATAATTTGGTTGCAATTTTTGATATTGTAGTACAATTGCTATTGTTG
TTGTGAAAAGTTAAAAAAATCTTAATGTTGTAACCGAAATCTCAATCACATACTGTTTGT
AAAATCCTTGGTTGAAATCAAAGTGGGTTTCCCAAGTAGCTTCTTTTACTAGAAACGCTA
GCAAAGTCAACTACTCTAGTTCAATTGCCATATATGTGACTAATTTGATTCATTCCACAAC
TCTTCATATTTCTTTGACTACCCTTTTACCGTTCACTTTGCGGTCTTGAGAGACTTTTATTT
ATTTTCTTTTTTGTCGTATATAAGATCAGCTTTGCCTTTATGGTGTCTTTTATTTGCTAGTTA
TAGTTGTGATTCCTCTTAAACTTTGTTTCCTCATTTCATCAACTGTATATTAATTTCCCATA
ATTTTTCAGCTTCAATTAAAAAAATTGAGCCTAAGTGCCTGATTTATTAAAGCCACAAAA
TGGGTGGTTTAATTTTTTCGACACCTTTCTTTTATATTTCTTTTACTCTTCTTCTCTTTTCTT
TTTCTATTACATCATCTATAATATATCTTCACCTTTTTCTTCTTACTTTGGGGACAAACATTT
TTGTTTCACAAAGCTGGTTAGCTACTAGTTTATTGCTTAGAAAATTTATAGCCTTACCTGT
GATCTCTCAAACTTCATACACGATTTTGTGTTAATCTTTTATATTTCATTTTTAATTTAGGTT
TCGGTTTCATCAATGGATGTTGGAGTTGTACCCGAATCAACAGTAAGTGGCATCTCAATG
TCCCACTCAAAGTCACCAATAGGGACAAATGACCTATTTCCTCCCCTTCTCATGCCTTCA
CATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATATAGGGAGAAAAAGAAGA
CAAGAAAGTTCGAGAAGAAAATAAGATATGCCTCAAGGAAGGCCTATGCAGAGACTAG
ACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACTGATGTAGAAGCTGAAGTGGATCAGA
TGTTCTCCACAAAACTATTCAATGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAGAATG
GAAAGAAAGTAATTGCCAAGCCATAGAAGAGAAGGTTGGGAACCACACATCATTGGAA
GAACTTCATGTAATTTTTATGTAGTCTAATTAGTTTGGTATTATATTTACTTCTATCTTGTGCTTTATAAATATAAAGTAT-3'
Gmcol2b-35突变体中突变后的编码序列(CDS)
5'-ATGTTGAAGGAAGGCACCAACAACGTTGGTGGCAGCAACACTGGCACACCTGG TCACGTGTCTGTGACACGTGCCTGTCTGCGCCATGCGTGCTGTACTGCCATGCAGACTCAGCATATCTTTGCTCTTCCTGTGATGCTCGTGTGCATGCAGCTAACCGTGTGGCCTCGAGACACAAGCGTGTGTGGGTGTGCGAAGCGTGTGAGCGTGCTCCGGCGGCGTTTCTATGCAAAGCTGACGCAGCTTCTCTTTGTTCTTCCTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACAACCGTGTTCCCATTCTCCCGATCTCAGGTTCCCTCTTCAGGGAACCAGAGCACAATCACAAACGCGTGGAACACGCGTTCGTGAATGAGGTTGAGGAGGAAGAGGAAGGGGTTTTTGATGAGTATGAAGACGAGGTTGAAGCTGCTTCGTGGTTGTTGCCACATCCTATGAAAAATAATGATGAAATTGAGGAGAATGATTGTGGTGACGAGGGTTTTTTGTTTGTTGATGAGTATTTGGACAATCTTGTTGATTGTTGTAACTCATGTGGTCACAATGACAACCAGTTTAGCAACGTTTATCAGCACCAGCAGAATTACAACACTGTCCCTCAGAACTATGTAGTGGTTCCAGTTCAGGTGCCGCAGCATTTTCAACCCGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGATGGTTCTCTTAGTCAAAGTGTTTCGGTTTCATCAATGGATGTTGGAGTTGTACCCGAATCAACAGTAAGTGGCATCTCAATGTCCCACTCAAAGTCACCAATAGGGACAAATGACCTATTTCCTCCCCTTCTCATGCCTTCACATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATATAGGGAGAAAAAGAAGACAAGAAAGTTCGAGAAGAAAATAAGATATGCCTCAAGGAAGGCCTATGCAGAGACTAGACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACTGATGTAGAAGCTGAAGTGGATCAGATGTTCTCCACAAAACTATTCAATGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAG-3'
Gmcol2b-35突变体中突变后的氨基酸序列
MLKEGTNNVGGSNTGTPGHVSVTRACLRHACCTAMQTQHIFALPVMLVCMQLTVWPRDTSVCGCAKRVSVLRRRFYAKLTQLLFVLPVMLTFTQQTLSLAATTVFPFSRSQVPSSGNQSTITNAWNTRS
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。

Claims (9)

1.应用,其特征在于,所述应用为蛋白质或抑制或降低或下调所述蛋白质的编码基因表达的物质或抑制或降低或下调所述蛋白质活性或/和含量的物质在下述任一种中的应用:
D1)提高大豆产量;
D2)降低大豆株高;
D2)制备降低大豆株高的产品;
D3)培育半矮杆大豆;
D4)制备培育半矮杆大豆的产品;
D5)改良半矮杆大豆或制备半矮杆大豆的产品;
D6)增加大豆单株荚数;
D7)制备增加大豆单株荚数的产品;
D8)培育单株荚数增加的大豆;
D9)制备培育单株荚数增加的大豆的产品;
D10)增加大豆单株粒数;
D11)制备增加大豆单株粒数的产品;
D12)培育单株粒数增加的大豆;
D13)制备培育单株粒数增加的大豆的产品;
D14)大豆育种;
所述蛋白质为下述任一种,
A1)氨基酸序列是SEQ ID No.2的蛋白质;
A2)将SEQ ID No.2所示的氨基酸序列经过氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有80%以上的同一性且具有相同功能的蛋白质;
A3)在A1)或A2)的N端和/或C端连接标签得到的具有相同功能的融合蛋白质。
2.根据权利要求1所述的应用,其特征在于,A2)所述蛋白质为氨基酸序列是SEQ IDNo.4的蛋白质。
3.根据权利要求1或2所述的应用,其特征在于,所述物质为生物材料,所述生物材料为下述任一种:
B1)、核酸分子;
B2)、表达B1)所述核酸分子的基因;
B3)、含有B2)所述基因的表达盒;
B4)、含有B2)所述基因的重组载体、或含有B3)所述表达盒的重组载体;
B5)、含有B2)所述基因的重组微生物、或含有B3)所述表达盒的重组微生物、或含有B4)所述重组载体的重组微生物;
B6)、含有B2)所述基因的转基因植物细胞系、或含有B3)所述表达盒的转基因植物细胞系、或含有B4)所述重组载体的转基因植物细胞系;
B7)、含有B2)所述基因的转基因植物组织、或含有B3)所述表达盒的转基因植物组织、或含有B4)所述重组载体的转基因植物组织;
B8)、含有B2)所述基因的转基因植物器官、或含有B3)所述表达盒的转基因植物器官、或含有B3)所述重组载体的转基因植物器官。
4.根据权利要求2或3所述的应用,其特征在于,B1)所述核酸分子为gRNA,所述gRNA的靶标为所述蛋白质的编码基因。
5.提高大豆产量、降低大豆株高、增加大豆单株荚数或/和增加大豆粒数的方法,包括下调或降低或减弱目的大豆中权利要求1或权利要求2中所述蛋白质的编码基因的表达量或所述蛋白质的含量得到转基因大豆,所述转基因大豆的株高低于所述目的大豆,所述转基因大豆的单株荚数和豆单株粒数高于所述目的大豆。
6.根据权利要求5所述的方法,其特征在于,所述上调或增强或提高目的大豆中权利要求1或权利要求2中所述蛋白质的编码基因的表达量或所述蛋白质的含量为将权利要求1或权利要求2中所述蛋白质的编码基因导入所述目的大豆。
7.权利要求1或权利要求2中所述的蛋白质。
8.生物材料,其特征在于,所述生物材料为下述任一种:
B1)、编码权利要求1或权利要求2中所述蛋白质的核酸分子;
B2)、含有B1)所述核酸分子的表达盒;
B3)、含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)、含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物;
B5)、抑制或降低或下调权利要求1或权利要求2中所述蛋白质的编码基因的表达的核酸分子或抑制或降低或下调所述蛋白质的活性或含量的核酸分子;
B6)、表达B5)所述核酸分子的编码基因;
B7)、含有B6)所述基因的表达盒;
B8)、含有B6)所述基因的重组载体、或含有B7)所述表达盒的重组载体;
B9)、含有B6)所述基因的重组微生物、或含有B7)所述表达盒的重组微生物、或含有B4)所述重组载体的重组微生物。
9.根据权利要求8所述的生物材料,其特征在于,B1)所述核酸分子如C1)、C2)或C3)所示的所述蛋白质的编码基因:
C1)编码序列是SEQ ID No.1或SEQ ID No.3的cDNA分子或DNA分子;
C2)与C1)限定的cDNA或DNA分子杂交且编码具有相同功能的蛋白质的cDNA分子或DNA分子。
CN202311479530.4A 2023-11-08 2023-11-08 与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用 Pending CN117551689A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311479530.4A CN117551689A (zh) 2023-11-08 2023-11-08 与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311479530.4A CN117551689A (zh) 2023-11-08 2023-11-08 与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用

Publications (1)

Publication Number Publication Date
CN117551689A true CN117551689A (zh) 2024-02-13

Family

ID=89810229

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311479530.4A Pending CN117551689A (zh) 2023-11-08 2023-11-08 与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用

Country Status (1)

Country Link
CN (1) CN117551689A (zh)

Similar Documents

Publication Publication Date Title
CN116515888A (zh) GmMTAs蛋白在调控大豆株高中的应用
CN114369147B (zh) Bfne基因在番茄株型改良和生物产量提高中的应用
CN110713994B (zh) 一种植物耐逆性相关蛋白TaMAPK3及其编码基因和应用
CN116891862B (zh) 一种沟叶结缕草耐盐基因ZmLA1、蛋白及其应用
CN117384927A (zh) 番茄LecRK26基因在调控植物灰霉病抗性中的应用
US20030154518A1 (en) Removal of selectable markers from transformed cells
CN117106820A (zh) 一种通过基因组编辑创制番茄少侧枝的方法及其应用
CN110684088B (zh) 蛋白ZmbZIPa3及其编码基因在调控植物生长发育与耐逆性中的应用
US20230030612A1 (en) Solanaceous plant and solanaceous plant cell having resistance to tomato spotted wilt virus, and method for producing solanaceous plant
CN111499709B (zh) 水稻穗粒数相关的rgn1蛋白及其编码基因与应用
CN110343159B (zh) 一种绿豆开花基因VrELF3的表达载体的应用
CN117551689A (zh) 与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用
CN115011631B (zh) 调控玉米苗期抗旱性的蛋白及其编码基因和应用
CN116789785B (zh) 长雄蕊野生稻高产、高光效基因FarL1及其应用
CN114316002B (zh) 一种大豆无茸毛相关蛋白及其编码基因和应用
CN114316003B (zh) 大豆茸毛稀少相关蛋白及其编码基因和应用
CN114316004B (zh) 大豆茸毛稠密相关蛋白及其编码基因和应用
CN114672493B (zh) 一种用ZmPHT1;7蛋白或其编码基因培育抗旱植物的方法
CN114644701B (zh) 来源于玉米的蛋白及其相关生物材料的应用
CN115197307B (zh) 调控植物抗逆性的蛋白IbGER5及其编码基因与用途
CN102675437A (zh) 调节植物器官大小和花器官内部非对称性的方法
CN116444637A (zh) 调控植物叶片衰老和产量相关蛋白GmWRKY100及其编码基因与应用
CN117947091A (zh) GmTPS2蛋白及其编码基因在改良大豆株型和产量性状中的应用
CN117925693A (zh) GmTPS1蛋白及其编码基因在改良大豆株型性状和产量中的应用
CN116590270A (zh) 一种控制水稻谷粒大小的基因及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination