CN117551689A

CN117551689A - 与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用

Info

Publication number: CN117551689A
Application number: CN202311479530.4A
Authority: CN
Inventors: 蔡宇鹏; 侯文胜; 陈莉; 姚伟伟
Original assignee: Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Current assignee: Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Priority date: 2023-11-08
Filing date: 2023-11-08
Publication date: 2024-02-13

Abstract

本发明涉及生物技术领域，具体公开了与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用。所述蛋白质为GmCOL2a或/和GmCOL2b。本发明通过将GmCOL2a或/和GmCOL2b蛋白的编码基因敲除，得到GmCOL2a或/和GmCOL2b基因敲除的转基因大豆植株，转基因大豆株高降低，单株荚数粒数增加。本发明所提供的GmCOL2a或/和GmCOL2b蛋白及其编码基因在大豆株高和单株荚数粒数研究中具有重要的理论意义和应用价值。

Description

与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用

技术领域

本发明属于生物技术领域，具体涉及与大豆株高、单株荚数和单株粒数相关蛋白及其生物材料和应用。

背景技术

大豆是世界重要的粮油兼用作物，也是人类优质蛋白及畜牧业饲料蛋白的主要来源。随着全球人口继续以前所未有的速度增长，对粮食的需求激增，使作物产量的提高成为现代作物育种技术面临的紧迫挑战。满足世界上大多数饮食需求的四种主要粮食作物是大豆、玉米、小麦和大豆。通过追求大幅度提高作物产量的研究攻关，研究人员对半矮秆作物的优势有了重大发现，这些作物具有许多优秀的特性，如抗倒伏能力增强、有效利用肥料和提高光能利用率。此外，半矮秆作物通常对多种植物病虫害具有更高的抗性，这在一定程度上保证了作物在高密度种植条件下的稳定产量。大豆是世界重要的粮油兼用作物，也是人类优质蛋白及畜牧业饲料蛋白的主要来源。大豆的荚果主要着生于茎节上。大豆的株高、单株荚数和粒数指标是决定大豆抗倒伏性和产量的关键性状，是选育理想株型高产大豆新品种的重要目标。由于能够同时改良大豆株高、单株荚数和粒数的基因和作用机制报道较少，限制了大豆理想株型的分子选育。所以能够同时实现大豆株高降低、单株荚数和粒数增加对提高大豆抗倒伏性和产量具有重要的理论和生产意义。

发明内容

本发明所要解决的技术问题是如何改良大豆株高、单株荚数或/和粒数。所要解决的技术问题不限于所描述的技术主题，本领域技术人员通过以下描述可以清楚地理解本文未提及的其它技术主题。

为解决上述技术问题，本发明提供了以下技术方案：

本发明提供了蛋白质或抑制或降低或下调所述蛋白质的编码基因表达的物质或抑制或降低或下调所述蛋白质活性或/和含量的物质在下述任一种中的应用：

D1)提高大豆产量，

D2)降低大豆株高；

D2)制备降低大豆株高的产品；

D3)培育半矮杆大豆；

D4)制备培育半矮杆大豆的产品；

D5)改良半矮杆大豆或制备半矮杆大豆的产品；

D6)增加大豆单株荚数；

D7)制备增加大豆单株荚数的产品；

D8)培育单株荚数增加的大豆；

D9)制备培育单株荚数增加的大豆的产品；

D10)增加大豆单株粒数；

D11)制备增加大豆单株粒数的产品；

D12)培育单株粒数增加的大豆；

D13)制备培育单株粒数增加的大豆的产品；

D14)大豆育种；

所述蛋白质为下述任一种，

A1)氨基酸序列是SEQ ID No.2的蛋白质；

A2)将SEQ ID No.2所示的氨基酸序列经过氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有80％以上的同一性且具有相同功能的蛋白质；

A3)在A1)或A2)的N端和/或C端连接标签得到的具有相同功能的融合蛋白质。

为了使A1)中的蛋白质便于纯化或检测，可在由序列表中SEQ ID No.2所示的氨基酸序列组成的蛋白质的氨基末端或羧基末端连接标签蛋白。

所述标签蛋白包括但不限于：GST(谷胱甘肽巯基转移酶)标签蛋白、His6标签蛋白(His-tag)、MBP(麦芽糖结合蛋白)标签蛋白、Flag标签蛋白、SUMO标签蛋白、HA标签蛋白、Myc标签蛋白、eGFP(增强型绿色荧光蛋白)、eCFP(增强型青色荧光蛋白)、eYFP(增强型黄绿色荧光蛋白)、mCherry(单体红色荧光蛋白)或AviTag标签蛋白。

本领域普通技术人员可以很容易地采用已知的方法，例如定向进化或点突变的方法，对本发明的编码蛋白质GmCOL2a或/和GmCOL2b的核苷酸序列进行突变。那些经过人工修饰的，具有与本发明分离得到的蛋白质GmCOL2a或/和GmCOL2b的核苷酸序列75％或75％以上同一性的核苷酸，只要编码蛋白质GmCOL2a或/和GmCOL2b且具有蛋白质GmCOL2a或/和GmCOL2b功能，均是衍生于本发明的核苷酸序列并且等同于本发明的序列。

上述75％或75％以上同一性，可为80％、85％、90％或95％以上的同一性。本文中，同一性是指氨基酸序列或核苷酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性，如NCBI主页网站的BLAST网页。例如，可在高级BLAST2.1中，通过使用blastp作为程序，将Expect值设置为10，将所有Filter设置为OFF，使用BLOSUM62作为Matrix，将Gap existence cost，Per residue gap cost和Lambda ratio分别设置为11，1和0.85(缺省值)并进行检索以对氨基酸序列的同一性进行计算，然后即可获得同一性的值(％)。本文中，所述80％以上的同一性可为至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的同一性。

本文中，调控所述蛋白质活性和/或含量的物质可为调控基因表达的物质，所述基因编码所述蛋白质GmCOL2a或/和GmCOL2b。所述调控基因表达的物质可为进行如下6种调控中至少一种调控的物质：1)在所述基因转录水平上进行的调控；2)在所述基因转录后进行的调控(也就是对所述基因的初级转录物的剪接或加工进行的调控)；3)对所述基因的RNA转运进行的调控(也就是对所述基因的mRNA由细胞核向细胞质转运进行的调控)；4)对所述基因的翻译进行的调控；5)对所述基因的mRNA降解进行的调控；6)对所述基因的翻译后的调控(也就是对所述基因翻译的蛋白质的活性进行调控)。

上文中，所述植物育种的目的可包括培育株高降低、单株荚数和粒数增加的植物。

上文中A2)所述蛋白质为氨基酸序列是SEQ ID No.2的蛋白质。

进一步地，上述应用中所述物质为生物材料，所述生物材料为下述任一种：

B1)、核酸分子；

B2)、表达B1)所述核酸分子的基因；

B3)、含有B2)所述基因的表达盒；

B4)、含有B2)所述基因的重组载体、或含有B3)所述表达盒的重组载体；

B5)、含有B2)所述基因的重组微生物、或含有B3)所述表达盒的重组微生物、或含有B4)所述重组载体的重组微生物；

B6)、含有B2)所述基因的转基因植物细胞系、或含有B3)所述表达盒的转基因植物细胞系、或含有B4)所述重组载体的转基因植物细胞系；

B7)、含有B2)所述基因的转基因植物组织、或含有B3)所述表达盒的转基因植物组织、或含有B4)所述重组载体的转基因植物组织；

B8)、含有B2)所述基因的转基因植物器官、或含有B3)所述表达盒的转基因植物器官、或含有B3)所述重组载体的转基因植物器官。

B1)所述核酸分子可为DNA或RNA。所述RNA可为gRNA或shRNA。

本文中B1)所述核酸分子为gRNA，所述gRNA的靶标为所述蛋白质的编码基因。

所述蛋白质的编码基因可为C1)、C2)或C3)所示的所述蛋白质的编码基因：

C1)编码序列是SEQ ID No.1或SEQ ID No.3的cDNA分子或DNA分子；

C2)与C1)限定的cDNA或DNA分子杂交且编码具有相同功能的蛋白质的cDNA分子或DNA分子。

SEQ ID No.1所示的DNA分子编码氨基酸序列是SEQ ID No.2的蛋白质GmCOL2a。SEQ ID No.3所示的DNA分子编码氨基酸序列是SEQ ID No.4的蛋白质GmCOL2b。SEQ IDNO.1所示的核苷酸序列为蛋白质GmCOL2a编码基因(CDS)的核苷酸序列。SEQ ID NO.3所示的核苷酸序列为蛋白质GmCOL2b编码基因(CDS)的核苷酸序列。

本发明所述的蛋白质GmCOL2a或/和GmCOL2b的基因(GmCOL2a或/和GmCOL2b基因)可以为任意能够编码蛋白质GmCOL2a或/和GmCOL2b的核苷酸序列。考虑到密码子的简并性以及不同物种密码子的偏爱性，本领域技术人员可以根据需要使用适合特定物种表达的密码子。

B1)所述核酸分子还可包括在SEQ ID No.1或/和SEQ ID No.3所示核苷酸序列基础上经密码子偏好性改造得到的核酸分子。

所述核酸分子还包括与SEQ ID No.1或/和SEQ ID No.3所示的核苷酸序列一致性为95％以上且来源相同种属的核酸分子。本文所述核酸分子可以是DNA，如cDNA、基因组DNA或重组DNA；所述核酸分子也可以是RNA，如gRNA、mRNA、siRNA、shRNA、sgRNA、miRNA或反义RNA。

本文所述载体是本领域技术人员公知的，包括但不限于：质粒、噬菌体(如λ噬菌体或M13丝状噬菌体等)、黏粒(即柯斯质粒)、Ti质粒或病毒载体。具体可为PTF101-SpCas9。

可用现有的植物表达载体构建含有GmCOL2a或GmCOL2b基因的重组表达载体。所述植物表达载体包括但不限于如双元农杆菌载体和可用于植物微弹轰击的载体等。所述植物表达载体还可包含外源基因的3'端非翻译区域，即包含聚腺苷酸信号和任何其它参与mRNA加工或基因表达的DNA片段。所述聚腺苷酸信号可引导聚腺苷酸加入到mRNA前体的3'端，如包括但不限于农杆菌冠瘿瘤诱导(Ti)质粒基因(如胭脂合成酶Nos基因)、植物基因(如大豆贮藏蛋白基因)3'端转录的非翻译区均具有类似功能。

使用GmCOL2a或/和GmCOL2b基因构建重组植物表达载体时，在其转录起始核苷酸前可加上任何一种增强型启动子或组成型启动子，包括但不限于如花椰菜花叶病毒(CAMV)35S启动子、玉米的泛素启动子(ubiquitin)，它们可单独使用或与其它植物启动子结合使用；此外，使用本发明的基因构建植物表达载体时，还可使用增强子，包括翻译增强子或转录增强子，这些增强子区域可以是ATG起始密码子或邻接区域起始密码子等，但必需与编码序列的阅读框相同，以保证整个序列的正确翻译。所述翻译控制信号和起始密码子的来源是广泛的，可以是天然的，也可以是合成的。翻译起始区域可以来自转录起始区域或结构基因。

为了便于对转基因植物细胞或植物进行鉴定及筛选，可对所用植物表达载体进行加工，如加入包括但不限于可在植物中表达的编码可产生颜色变化的酶或发光化合物的基因(GUS基因、荧光素酶基因等)、具有抗性的抗生素标记物(庆大霉素标记物、卡那霉素标记物等)或是抗化学试剂标记基因(如抗除草剂基因)等。从转基因植物的安全性考虑，可不加任何选择性标记基因，直接以逆境筛选转化植株。

利用任何一种可以引导外源基因在植物中表达的载体，将靶向敲除本发明所提供的GmCOL2a或/和GmCOL2b基因的片段导入植物细胞或受体植物，可获得株高降低和增加单株荚数粒数增加的植株。携带GmCOL2a或/和GmCOL2b基因的表达载体可通过使用Ti质粒、Ri质粒、植物病毒载体、直接DNA转化、显微注射、电导、农杆菌介导等常规生物学方法转化植物细胞或组织，并将转化的植物组织培育成植株。

本文所述微生物可为酵母、细菌、藻或真菌。其中，细菌可来自埃希氏菌属(Escherichia)，欧文氏菌(Erwinia)，根癌农杆菌属(Agrobacterium)、黄杆菌属(Flavobacterium)，产碱菌属(Alcaligenes)，假单胞菌属(Pseudomonas)，芽孢杆菌属(Bacillus)等。具体可为大肠杆菌DH5α和/或根癌农杆菌EHA105。

所述gRNA的靶点可为SEQ ID No.1的第26到45位核苷酸或/和SEQ ID No.3第32到51位核苷酸。

本发明还提供一种提高大豆产量、降低大豆株高、增加大豆单株荚数或/和增加大豆粒数的方法，包括下调或降低或减弱目的大豆中前述蛋白质的编码基因的表达量或所述蛋白质的含量得到转基因大豆，所述转基因大豆的株高低于所述目的大豆，所述转基因大豆的单株荚数和豆单株粒数高于所述目的大豆。

上述株高降低、单株荚数和粒数增加的大豆理解为不仅包含将所述GmCOL2a或/和GmCOL2b基因转化目的大豆得到的第一代转基因植物，也包括其子代。可以在该物种中繁殖该基因，也可用常规育种技术将该基因转移进入相同物种的其它品种，特别包括商业品种中。所述抗逆植物包括种子、愈伤组织、完整植株和细胞。

进一步地，上述方法中所述上调或增强或提高目的大豆中前述蛋白质的编码基因的表达量或所述蛋白质的含量为将前述蛋白质的编码基因导入所述目的大豆。

前述蛋白质也属于本发明的保护范围。

本发明还提供生物材料，所述生物材料为下述任一种：

B1)、编码前述蛋白质的核酸分子；

B2)、含有B1)所述核酸分子的表达盒；

B3)、含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体；

B4)、含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物；

B5)、抑制或降低或下调前述蛋白质的编码基因的表达的核酸分子或抑制或降低或下调所述蛋白质的活性或含量的核酸分子；

B6)、表达B5)所述核酸分子的编码基因；

B7)、含有B6)所述基因的表达盒；

B8)、含有B6)所述基因的重组载体、或含有B7)所述表达盒的重组载体；

B9)、含有B6)所述基因的重组微生物、或含有B7)所述表达盒的重组微生物、或含有B4)所述重组载体的重组微生物。

上述生物材料中B1)所述核酸分子如C1)、C2)或C3)所示的所述蛋白质的编码基因：

C1)编码序列是SEQ ID No.1或SEQ ID No.3的cDNA分子或DNA分子；

本发明通过将GmCOL2a或/和GmCOL2b蛋白的编码基因敲除，得到GmCOL2a或/和GmCOL2b基因敲除的转基因大豆植株，转基因大豆株高降低，单株荚数粒数增加。本发明所提供的GmCOL2a或/和GmCOL2b蛋白及其编码基因在大豆株高和单株荚数粒数研究中具有重要的理论意义和应用价值。

附图说明

图1为GmCOL2a和GmCOL2b基因结构及CRISPR/Cas9靶点序列。

图2为CRISPR/Cas9介导的GmCOL2a和GmCOL2b靶点处的定点突变。

图3为Jack、Gmcol2a和Gmcol2b突变体在廊坊田间的表型。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南，并不以任何方式构成对本发明的限制。

下述实施例中的实验方法，如无特殊说明，均为常规方法，按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

根癌农杆菌EHA105，记载在如下文献中：Cai Y,Chen L,Liu X,Guo C,Sun S,WuC,Jiang B,Han T and Hou W(2018),CRISPR/Cas9-mediated targeted mutagenesis ofGmFT2a delays flowering time in soya bean.Plant Biotechnol J 16,176-185，公众可以从中国农业科学院作物科学研究所获得。

栽培大豆Jack，记载在如下文献中：Chen L,Cai Y,Liu X,Yao W,Guo C,Sun S,WuC,Jiang B,Han T,Hou W(2018),Improvement of soybean Agrobacterium-mediatedtransformation efficiency by adding glutamine and asparagine into the culturemedia.International Journal of Molecular Sciences 19,3039，公众可以从中国农业科学院作物科学研究所获得。

PCR扩增用的高保真酶为PhantaMax Super-Fidelity DNAPolymerase，购于南京诺唯赞生物科技有限公司，货号P505-d3。MS盐：Phyto Tech，目录号：M524。MS有机：PhytoTech公司，目录号：M533。B5有机：Phytotech公司，目录号：G219。B5盐：Phytotech公司，目录号：G768。

LB固体培养基组分：NaCl 10g/L，酵母提取物5g/L，胰蛋白胨10g/L，琼脂15g/L，溶剂为水。

YEP固体培养基由溶剂和溶剂组成；各溶质及其在YEP固体培养基中的浓度为：NaCl 5g/L，酵母提取物5g/L，胰蛋白胨10g/L，15g/L琼脂；溶剂为水。YEP固体培养基的pH为7.0。

发芽培养基(pH 5.8)：3.12g/L B5盐、1mL/LB5有机、20g/L蔗糖、7.5g/L琼脂，余量为水。

液体培养基(pH 5.4)：0.43g/L MS盐、1mL/LB5有机、40mg/L乙酰丁香酮、150mg/L二硫苏糖醇、100mg/L L-半胱氨酸、30g/L蔗糖、3.9mg/L 2-吗啉乙磺酸，余量为水。

共培养培养基(pH 5.4)：0.43g/L MS盐、1mL/L B5有机、40mg/L乙酰丁香酮、150mg/L二硫苏糖醇、100mg/L L-半胱氨酸、30g/L蔗糖、7.5g/L琼脂、3.9mg/L 2-吗啉乙磺酸，余量为水。

恢复培养基(pH 5.4)：3.1g/L B5盐、1mL/L B5有机、30g/L蔗糖、150mg/L头孢霉素、150mg/L特美汀、1mg/L 6-BA、0.98g/L 2-吗啉乙磺酸、7.5g/L琼脂、4mL/L Fe盐(200×)、50mg/L L-天冬酰胺、50mg/L L-谷氨酰胺，余量为水。

筛选培养基(pH 5.4)：3.1g/LB5盐、1mL/LB5有机、0.98g/L 2-吗啉乙磺酸、30g/L蔗糖、150mg/L头孢霉素、150mg/L特美汀、1mg/L 6-BA、6mg/L草丁膦、7.5g/L琼脂、4mL/L Fe盐(200×)、50mg/L L-天冬酰胺、50mg/L L-谷氨酰胺，余量为水。

伸长培养基(pH 5.6)：4.0g/L MS盐、1mL/L B5有机、0.6g/L 2-吗啉乙磺酸、30g/L蔗糖、150mg/L头孢霉素、150mg/L特美汀、0.1mg/L IAA、0.5mg/L GA、1mg/L 6-BA、6mg/L草丁膦、7.5g/L琼脂、4mL/LFe盐(200×)、50mg/L L-天冬酰胺、50mg/L L-谷氨酰胺，余量为水。

生根培养基(pH 5.7)：2.165g/LMS盐、1mL/LB5有机、0.6g/L 2-吗啉乙磺酸、20g/L蔗糖、7.5g/L琼脂、50mg/L L-天冬酰胺、50mg/L L-谷氨酰胺，余量为水。

实施例1、利用CRISPR/Cas9定点敲除大豆基因GmCOL2a和GmCOL2b

1.1sgRNA靶点序列选择

从Phytozome数据库获得大豆GmCOL2a(Glyma.13G050300)基因组序列、CDS序列(SEQ ID No.1)、蛋白序列(SEQ ID No.2)和GmCOL2b(Glyma.19G039000)基因组序列、CDS序列(SEQ ID No.3)、蛋白序列(SEQ ID No.4)。如图1所示，在GmCOL2a的第一个外显子上选择了一个靶点GmCOL2a-sgRNA，靶点序列为5′-TTGGTGGCAGCACCGGCACC-3′，靶向GmCOL2a基因组序列的1026-1045位，也即SEQ ID No.1的第26到45位；在GmCOL2b的第一个外显子上选择了一个靶点GmCOL2b-sgRNA，靶点序列为5′-GCAGCAACACTGGCACCACC-3′，靶向GmCOL26基因组序列的1032-1051位，也即SEQ ID No.3的第32到51位。

1.2CRISPR/Cas9载体构建

(1)用限制性内切酶NHeI和BbsI，在50uL体系和37℃条件下双酶切载体pUC57-sgRNA-SpCas93小时，1％的琼脂糖凝胶电泳检测，胶回收目的条带(大小约3201bp)。该目的条带含有AtU6启动子驱动的sgRNA表达盒元件。

(2)按照sgRNA的靶点序列合成引物，序列如下(小写字母即为靶点)：

GmCOL2a-Cas9-F:5′-TCGAAGTAGTGATTGttggtggcagcaccggcaccGTTTTAGAGCTAGAA-3′

GmCOL2a-Cas9-R:5′-TTCTAGCTCTAAAACggtgccggtgctgccaccaacAATCACTACTTCGA-3′

GmCOL2b-Cas9-F:5′-TCGAAGTAGTGATTGgcagcaacactggcaccaccGTTTTAGAGCTAGAA-3′

GmCOL2b-Cas9-R:5′-TTCTAGCTCTAAAACggtggtgccagtgttgctgcCAATCACTACTTCGA-3′

(3)在离心管中加入相应的F/R引物(浓度10μM)各5μL，加入ddH₂O 15μL至反应体系为25μL。95℃3min，0.1℃/s退火至16℃，16℃保持10min，完成退火，形成oligo二聚体。GmCOL2a-Cas9-F和GmCOL2a-Cas9-R形成的oligo二聚体编码靶向于GmCOL2a的sgRNA(名称为sgRNA-GmCOL2a)。GmCOL2b-Cas9-F和GmCOL2b-Cas9-R形成的oligo二聚体编码靶向于GmCOL2b的sgRNA(名称为sgRNA-GmCOL2b)。

(4)取3.5μL退火产物与1.5μL酶切后的pUC57-sgRNA-SpCas9载体胶回收产物，用Ultra One Step Cloning Kit(南京诺唯赞生物科技有限公司，货号C115-02)进行连接，冻融法转化大肠杆菌DH5α，涂于LB+Amp的固体培养基上，倒置在37℃培养箱中过夜。挑取单克隆，摇菌，进行测序分析。测序引物为pSgRNA-CX：5′-CGCCAGGGTTTTCCCAGTCACGAC-3′，测序结果正确的菌液用于质粒提取。提取得到的质粒命名为pUC57-sgRNA-SpCas9-GmCOL2a质粒和pUC57-sgRNA-SpCas9-GmCOL2b质粒。pUC57-sgRNA-SpCas9-GmCOL2a质粒已连接上靶向GmCOL2a的sgRNA的序列。pUC57-sgRNA-SpCas9-GmCOL2b质粒已连接上靶向GmCOL2b的靶序列sgRNA的序列。

(5)用限制性内切酶PacI和PmeI，在50uL体系和37℃条件下进行双酶切，反应时间为3小时。pUC57-sgRNA-SpCas9-GmCOL2a质粒经双酶切后回收约586bp的目的片段sgRNA-SpCas9-GmCOL2a，pUC57-sgRNA-SpCas9-GmCOL2b质粒经双酶切后胶回收约586bp的目的片段sgRNA-SpCas9-GmCOL2b，空载PTF101-SpCas9质粒经双酶切后回收约14232bp的目的片段，随后用T4 DNA连接酶(NEB，货号M0202V)将sgRNA-SpCas9-GmCOL2a和sgRNA-SpCas9-GmCOL2b分别连接至空载PTF101-SpCas9质粒经双酶切后的目的片段，冻融法转化大肠杆菌DH5α，涂于LB+Spe的固体培养基上，倒置在37℃培养箱中过夜。挑取单克隆，摇菌，测序验证是否连接成功。测序引物为sgRNA-TYJC：5′-TGGGAATCTGAAAGAAGAGAAGCA-3′。将验证正确的质粒命名为pGmCOL2a-sgRNA和pGmCOL2b-sgRNA。重组质粒pGmCOL2a-sgRNA是以包含GmCOL2a的靶点序列的sgRNA的表达盒元件替代PTF101-SpCas9质粒上的PacI和Pme酶切识别位点之间的核苷酸序列并保持其他核苷酸序列不变的重组表达载体。重组质粒pGmCOL2b-sgRNA是以包含GmCOL2b的靶点序列的sgRNA的表达盒元件替代PTF101-SpCas9质粒上的PacI和Pme酶切识别位点之间的核苷酸序列并保持其他核苷酸序列不变的重组表达载体。

(6)提取质粒，将质粒pGmCOL2a-sgRNA和pGmCOL2b-sgRNA通过冻融法分别转化根癌农杆菌EHA105的感受态细胞，得到重组农杆菌，命名为EHA105-GmCOL2a-sgRNA和EHA105-GmCOL2b-sgRNA。

1.3根癌农杆菌介导的大豆遗传转化

将重组菌EHA105-GmCOL2a-sgRNA和EHA105-GmCOL2b-sgRNA转化大豆栽培品种Jack。具体步骤如下：

1、种子灭菌

1)取无病虫害和斑点、饱满、均一、干燥的大豆品种Jack种子，完全平铺在培养皿中，然后将培养皿放入干燥器中。

2)完成步骤1)后，在所述干燥器中放入100mL容量的烧杯，在烧杯中倒入90mL 12M次氯酸钠水溶液，再慢慢加入5mL浓盐酸，然后迅速盖上干燥器，用凡士林密封，放置16小时，进行氯气灭菌。

2、制备侵染菌液

1)28℃，培养上述得到的EHA105-GmCOL2a-sgRNA和EHA105-GmCOL2b-sgRNA菌液，用液体培养基重悬，得到OD_600nm＝0.6-0.8的侵染菌液。

2)将步骤1处理后的Jack大豆种子放入超净台中，在显微镜下，剥去种皮，沿长轴将两个子叶分开，保留带完整胚轴的那片子叶，在其胚轴和子叶连接处进行划伤，一般一个子叶划伤3-5刀，然后在28℃培养箱中，浸染2小时。

3)将子叶内面(平滑面)向上，平铺于已铺有无菌滤纸的共培养培养基上，温度22℃，暗培养5天。

4)共培养5天后，外植体胚轴伸长到2厘米，切掉部分胚轴，使其保留0.5cm。将处理后的外植体放到恢复培养基中，28℃，16小时光照/8小时黑暗条件下，培养7天。

5)从恢复培养基中取出外植体，去除新芽，切除部分胚轴，保留0.5cm的胚轴，再将修整后外植体转入到筛选培养基中，28℃，16小时光照/8小时黑暗条件下培养21天。

6)经过21天的筛选诱导，外植体产生大量不定芽，剥除子叶和棕色的叶子，将剩余的部分转入伸长培养基中培养，28℃，16小时光照/8小时黑暗条件下培养。

7)在伸长培养基中，当丛生芽抽出5-8厘米幼茎时，从不定芽基部剪下来；茎基部在1mg/LIBA溶液中沾1分钟，然后转入生根培养基中培养，28℃，16小时光照/8小时黑暗条件下培养一周，在茎基部产生大量根后，移栽到盆中，获得的植株为T0代转基因大豆植株。

1.4基因编辑植株的编辑类型检测

(1)利用植物基因组DNA提取试剂盒(康为世纪，CW0553)提取T0代转基因大豆植株叶片的DNA。

(2)以DNA作为模板进行PCR扩增。靶点GmCOL2a-sgRNA的扩增引物为GmCOL2a-SpCas9-F：5′-AGGGATAACATGAGATTTTGACTGG-3′和GmCOL2a-SpCas9-R：5′-AGGGATAACATGAGATTTTGACTGG-3′，扩增片段的长度为788bp，测序引物为COL-CX：5′-CACGATGGCACCCTTGATTCTCCC-3′。靶点GmCOL2b-sgRNA的扩增引物为GmCOL2b-SpCas9-F：5′-ACACGTGTCTCCAAGTTGTGT-3′和GmCOL2b-SpCas9-R：5′-ACGCGTTTGTGATTGTGCTC-3′，扩增片段的长度为756bp，测序引物为GmCOL2b-SpCas9-F。PCR反应体系：2×Max Buffer25μL，dNTP Mix(10mM each)1μL，DNA(200ng/μL)2μL，F(10pmol/μL)2μL，R(10pmol/μL)2μL，Max Super-Fidelity DNAPolymerase 1μL，ddH₂O 17μL，总体积50μL。扩增反应体系：95℃3min；95℃15sec，56℃15sec，72℃45sec，35个循环；72℃5min。扩增产物进行测序分析。测序结果有三种情况：测序峰图从CRISPR/Cas9切割位点附近往后出现重叠峰，在靶位点上游没有重叠峰，则为杂合的编辑类型；峰图从前到后均没出现重叠的峰，然后与野生型参考序列比对，若完全一致，则说明没有发生定点突变；峰图从前到后均没出现重叠的峰，然后与野生型参考序列比对，若不完全匹配，则确定具体的突变类型，突变类型一般包括碱基的插入、缺失和错配等。

经检测，T0代GmCOL2a-SpCas9转基因大豆植株41株中，发生基因编辑的植株为22株；T0代GmCOL2b-SpCas9转基因大豆植株36株中，发生基因编辑的植株为16株。将T0代基因编辑的植株自交1代，得到T1代基因编辑的植株。之后按照上述方法检测T1代基因编辑的植株的突变类型。

结果发现，在GmCOL2a-sgRNA靶点产生了两种纯合的突变类型(图2中A)，分别命名为Gmcol2a-51和Gmcol2a-78。与野生型大豆的基因组DNA相比：

Gmcol2a-51编码GmCOL2a蛋白的基因的两条同源染色体均发生了相同的缺失，缺失了SEQ ID No.1的第35-42位共计8个核苷酸，导致编辑位点后的氨基酸翻译移码，蛋白序列提前终止，从而将GmCOL2a基因敲除。

Gmcol2a-78编码GmCOL2a蛋白的基因的两条同源染色体均发生了相同的缺失，缺失了基因组的第682-1079位共计398个核苷酸(包含SEQ ID No.1的第1到79位碱基)导致编辑位点后的氨基酸翻译移码，蛋白序列提前终止，从而将GmCOL2a基因敲除。上述Gmcol2a-78突变体中突变后的基因组如后文记载的Gmcol2a-78突变体中突变后的基因组序列所示，其编码序列如后文记载的Gmcol2a-78突变体中突变后的编码序列(CDS)所示，其氨基酸序列如后文记载的Gmcol2a-78突变体中突变后的氨基酸序列所示，GmCOL2a蛋白功能缺失。

结果发现，在GmCOL2b-sgRNA靶点产生了两种纯合的突变类型(图2中B)，分别命名为Gmcol2b-35和Gmcol2b-46。与野生型大豆的基因组DNA相比：

Gmcol2b-35编码GmCOL2b蛋白的基因的两条同源染色体均发生了相同的缺失，缺失了SEQ ID No.3的第48位共计1个核苷酸，导致编辑位点后的氨基酸翻译移码，蛋白序列提前终止，从而将GmCOL2b基因敲除。上述Gmcol2b-35突变体中突变后的基因组如后文记载的Gmcol2b-35突变体中突变后的基因组序列所示，其编码序列如后文记载的Gmcol2b-35突变体中突变后的编码序列(CDS)所示，其氨基酸序列如后文记载的Gmcol2b-35突变体中突变后的氨基酸序列所示，GmCOL2b蛋白功能缺失。

Gmcol2b-46编码GmCOL2b蛋白的基因的两条同源染色体均发生了相同的缺失，缺失了SEQ ID No.3的第46-48位共计3核苷酸，导致编辑位点缺失了一个氨基酸。

随后，将T1代的Gmcol2a-78和Gmcol2b-35突变体分别自交1代，得到T2代纯合的Gmcol2a-78和Gmcol2b-35突变体种子，命名为Gmcol2a突变体和Gmcol2b突变体，用于后续田间实验。

实施例2、野生型、Gmcol2a和Gmcol2b突变体在廊坊田间的表型观察

分别将野生型大豆品种Jack、Gmcol2a和Gmcol2b突变体夏播种植于廊坊(39.5°N,116.6°E)大田，小区采用随机区组设计，3次重复。处理小区面积为15平方米(6.0米×2.5米)，每个小区播种6行，行长6米；行距50厘米，株距10厘米。每个小区从中间4行随机选取5株，每种材料从三个小区共选取15株，观察并统计株高(厘米)、主茎节数(个)、单株荚数(个)和单株粒数(个)等农艺性状。采用GraphPad Prism 8软件对数据进行处理，实验结果以平均值±标准差表示，采用One-wayANOVA检验，P＜0.05(*)表示与野生型大豆品种Jack相比具有显著性差异，P＜0.01(**)表示与野生型大豆品种Jack相比具有极显著差异。野生型Jack、Gmcol2a和Gmcol2b突变体在廊坊田间的表型如图3所示。统计结果表明，与野生型Jack相比，Gmcol2a和Gmcol2b突变体的株高降低，单株荚数和单株粒数极显著地增加，但主茎节数无显著差异，具体数据见表1。

表1野生型、Gmcol2a和Gmcol2b突变体在廊坊的田间表型

植株	株高(cm)	单株荚数(个)	单株粒数(粒)	主茎节数(节)
					Jack	103.4±3.9	85.6±17.7	204.5±40.1	21.6±0.7
Gmcol2a	74.7±5.8**	101.9±13.8**	235.3±39.3**	20.9±1.3
					Gmcol2b	71.2±8.0**	101.1±12.6**	242.4±34.1**	21.3±1.0

实施例3在北京田间三个种植密度条件下的表型观察

分别将野生型大豆品种Jack、Gmcol2a和Gmcol2b突变体夏播种植于北京(40.2°N,116.6°E)大田。处理小区面积为5平方米(2.0米×2.5米)，每个小区播种6行，行长2米，行距50厘米。设置了三个种植密度，分别为密度1(286,000株/公顷)、密度2(200,000株/公顷)和密度3(154,000株/公顷)。小区采用随机区组设计，3次重复。从每个小区中间4行随机选取15株，每种材料每种密度条件从三个小区共选取45株，观察并统计株高、主茎节数、单株荚数和单株粒数等农艺性状。采用GraphPad Prism 8软件对数据进行处理，实验结果以平均值±标准差表示，采用One-wayANOVA检验，P＜0.05(*)表示在同一种植密度下，与野生型大豆品种Jack相比具有显著性差异，P＜0.01(**)表示与野生型大豆品种Jack相比具有极显著差异。统计结果表明，在三种种植密度条件下，与野生型Jack相比，Gmcol2a和Gmcol2b突变体都表现出株高降低，单株荚数和单株粒数显著增加的表型，但主茎节数无显著差异，具体数据见表2。由此可见，GmCOL2a或GmCOL2b蛋白的功能丧失会导致大豆株高显著降低、单株荚数显著增加以及单株粒数显著增加。随后，对每个小区实收产量进行鉴定。每个小区的六行材料，去掉两个边行，剩下的四行混合收获并称重，重量换算成千克/公顷表示。结果表明，野生型Jack在密度1、密度2和密度3的群体收获产量分别为3405.5±311.9千克/公顷，3361.1±170.2千克/公顷和2932.2±178.9千克/公顷；Gmcol2a突变体在密度1、密度2和密度3的群体收获产量分别为4366.7±260.3千克/公顷，4300.0±104.1千克/公顷和3555.6±105.8千克/公顷，相比于对照Jack分别增产28.2％、27.9％和21.2％。Gmcol2b突变体在密度1、密度2和密度3的群体收获产量分别为3850.0±115.5千克/公顷，4011.1±67.4千克/公顷和4066.7±264.6千克/公顷，相比于对照Jack分别增产13.1％、19.3％和38.7％。

表2野生型、Gmcol2a和Gmcol2b突变体北京不同种植密度的田间表型

植株	株高(cm)	单株荚数(个)	单株粒数(粒)	主茎节数(节)
					Jack-密度1	151.0±8.1	58.7±7.4	152.6±20.6	23.2±1.5
Gmcol2a-密度1	129.7±7.9**	72.0±8.2**	184.8±21.9**	22.2±1.5
					Gmcol2b-密度1	128.4±6.9**	66.8±10.6**	170.4±28.0**	21.8±1.5
Jack-密度2	136.2±6.3	69.3±12.8	179.0±34.0	23.4±1.7
					Gmcol2a-密度2	124.2±6.6**	82.7±8.3**	214.2±21.0**	22.8±1.3
Gmcol2b-密度2	122.4±6.8**	79.9±10.9**	207.8±31.4**	22.9±1.6
					Jack-密度3	130.7±8.8	74.2±14.7	196.5±39.0	23.5±1.9
Gmcol2a-密度3	119.2±8.1**	90.0±17.8**	235.9±47.6**	23.3±1.9
					Gmcol2b-密度3	115.07±10.6**	101.1±24.7**	256.9±63.7**	23.6±1.3

GmCOL2a基因组序列

5'-AGGATCGTCCAAGTCAATATAGCTTATGCTGGTTCAAAGTGCAAATCCGATCCAA GAAGAAGCTCGACCTTATCTGAGTTTGATAACATTAATTGCTTGTATGTCACATGGCTTGCGATTTACAACAACCATCAACAACTTTTCCTATGCATTCTACATACATATAAGGCATTCTTATAACTTCAAGTTCATATCTAATCTTTCATTTCTTGCCTATTTCTTACAAAAGCTAACTTGAACGTTGATGCCTTTACAAGTAGCGACCATCAAACCCCTCCTTTATAACCACCATGGTGCTACTATGTTATTCCTAAGTACACCAAACAAAATTTATTATGAACAATAATATTTGAACACCATGTTATTTGAAACATTCCACCTTGACAGTTCTTCTAACTCCACCAACAAAAAATTACTATTTATTTTCATAATCACAAAGACTCCACATTCTATCTGCAAAATCAGTAATCATCTAAACACGTGCTTTAATCCTTTTACGTACAGCCAATAAGATTACATGAAAGGAAAGCATATATATTAAGGGATAACATGAGATTTTGACTGGTGCATGTATATAGAATCTACATGGACCCAAAATTACACGTGTCTCCAAGTTGTGCCTCCATAGCAATACGAACAAAGCCTCAACATCTCTTTAATGATT

CCAAAAGGCAAAGGAAGCAACATGCACAGGTCCAACAAAAAAAAAAAAAAAAAACCT

CTCTCCTATTCAACCCCAAAACACAACCAACCACAAGATAAGCAAGAACTTGTGCACGC

CACTAACTTGCTGCCACGATGGCACCCTTGATTCTCCCCCAACACTACTTGGTTCTCCTC

ACTGAACTCAACTTCTCACTCACACTCACTTCTCTTCCTCCAAATTAGTTCCAACTCCAA

GTTAGTTCCAACACAAACACAAACACACACACATACATAAACCAAGCAAAGAAAGACT

CTACAAACACTTCACTACTCATACAATATTTTCAGACACAACATGTTGAAGGAAGGCACC

AACAACGTTGGTGGCAGCACCGGCACCTGGTCACATGTCTGCGACACGTGCCGGTCAG

CGCCATGCGTACTGTACTGCCATGCAGACTCAGCATACCTTTGCTCATCCTGCGATGCTC

GTGTCCATGCGGCTAACCGTGTGGCCTCAAGACACGAGCGTGTGTGGGTGTGCGAAGC

GTGTGAACGTGCTCCCGCAGCGTTTCTATGCAAAGCCGACGCAGCTTCTCTTTGTTCTTC

CTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACCACCGCGTGCCCA

TTCTCCCGATCTCTGGTTCCCTCTTCGGGGAACCAGAGCATGAACGCGTGTACGCGTTC

GTGAATGAAGTGGAAGCGGAGGAGGAAGAGGAAGAGGTTTTTGATGAGTATGATGAGG

TTGAAGCAGCTTCGTGGTTGTTGCCACATCCTATGAAAAATGATAAAATTGACGAGAATG

GTGGTGATAAGGGTTTTTTGTTTGGTGATGAGTATTTCGACAACCTTGTTGATTGTAACTC

ATGTGGTCACAATAACAACCAGTTTAGCAACGTTTATGATCAGCACCAGCAGAATTACA

GCAACACTGTCCCTCAGAACTATGCAGTGGTTCCAGTTCAGGTGCCGCAGCATTTTCAA

CCGGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGATGGTTCTCTTAGTCAA

AGTGTAAGTTACCTTCTTTTTACTTCTATGTGTTTCTTTTTGGTTTGTTGTTTATATCAATG

GGGTTTTCCCTTCTTTTTTTTTTTTTTTTTCTTTTTGCAAACTCTTTGGATCATTCATCCAT

TGGATTATACTACTTTATTAGATTTTGCCTTGAAACCTGTGCTAACTCTTCCTTCTAATTGA

CAGTTTCTTTTTCTCCATTCGTATGAAACCAAGGTTTTAAACTGCAGTCATAGTCATAGTC

AAGATTATAGTTTATTCAAAAACATTAGCATTGTAATACAATTGTACTGTAATTGTCGTCG

TGAAAAAGTTAAAAAAAAGTTTAAAAAATCTCAATCGCATACCTTCTATAAAAATCTTGA

TTGAAACCAAAGTGGGTTTCATAAGTAGTTTCTTTTACAAGAAAAACTAGCAATAAAGT

CAACTACTCTAGATCCATTGCCATACATGTGACCTTGATCCATTCCACAACGTTTCGTATT

TCTTTGCCTACCCTTTTCCCATTGACTACTTTTCTGTCTTGAGAGACATTTATTTTATTTTT

TTCGTATGCAATAGCTTTCCCTTTTTGATGTCTTGTATTTGCTAGTTATAGTTGTGATTCCT

CATAAACAGATACTTACTTTTATAGGGTAACTTAGCTTTTCACCAATTTTCGCCCATACAT

AGTTAGACTTCCCTAAACTTTGTTTCCTCATTTCTTCAACTATAATTTGATCAATTGTATAT

TAATTTCCCATAATTTTCAGCTTCAATTAAAAAATTTGAGCCTAAGTGCCTGTTTTATTAA

AGCCAAACAATGGGGGGTTTAATATTTTAAAAACTTTCTTCTATATTTCTTTTACATTTCCT

CTGTTTTCTAATATATCTTTTCTTTTTTCTATTACATCATCTTTGATATATTTTCACCTTTTTC

TTCTTACTTTGGGGACAAACATTATTGTTTCACAAAATTGGTTAGCTACTAATAGTTTATT

GCCTTACCTGTAATCTCTCAAACTTCATACACGTTTTTGTGTTAATCTTTTATATTTCATTT

TTAATTTAGGTTTCGGTTTCATCGATGGATGTTGGTGTTGTACTCGAATCAACAATAAGTG

ACATCTCAATGTCCCACTCAAAGTCGCCAATAGGGACAACTGACCTATTTCCTCCCCTTC

CCATGCCTTCACATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATACAGGGAG

AAAAAGAAGACAAGAAAATTTGAGAAGAAAATAAGGTATGCCTCAAGGAAGGCCTATG

CAGAGACTAGACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACCGATGTAGAAGCTGA

AGTGGACCAGATGTTCTCCACAACACTATTCACTGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAGAATGGAAAGAAAGTAATGGCCAGGCCATAAAAGAGAAGGTT-3'

GmCOL2b基因组序列

5'-TAAAAAAAAAGTATCATATTTAGAGAGACTAAAAGATTATTTAAGTCAAAAAATA ATTTTTGTTTAGCATTTGTTCTCACCGAGTTCTAGGCAAGTGATCCGTCTTCGTCTTCCCTTTAGTAGTTGAACAGGTCAATTGGTTAAACCACAGATTGATGGAAGTGATATAATGATTAAATATGCGATATATATTACTTGTGTCACATATTAATGAAATTGTGCGGATGGTCTAGTGGTAAATATACTAGAAAGATTTTCCTAGACAAAGATCGACTCTATGGTTGGTAATTTACTTTTACAATTTCCTTAAAATAGTCAAGTAACTAGCTGTAAACCTCAGCAAATTTAGTACTTGGAGCAACTATGAACAATTAATGATATTTATTTTAAACATTCCACCTTAATTAACATCTTAGTTCTCCAAACTCCACCAACCAAAAATTTCTATTTATTTTCATAATCACAAGCACTCCACATTCTATCTGCAAAATCAGTAATTAACCAAACACTTGCTTTAATCCTTTTAGAGCCAATAAGATTACTGAGAGGAAAGGATATATTAAGGGGTAACAAGAGATTCTAACTGGTGCAAGTATAGAATCTACATGGACCCAAATGACACGTGTCTCCAAGTTGTGTCACCATAGCAATACGAACAAAGCCTCAGCATCTCTTTAATGATTCCAAAAGGCAAAGAAGCAACATGCATGGACAGGTCCAACACCAAAACAAAAAACCCTCTCTCCTAATCAACCCTGAAACACAACCAACCACAAGATAAGCAAGAACTTGTGCACGCCACTAACTTGCTGCCACGTTGGCACTCTTGATTCTCCCCCCAACACTACTTGGTTCACCTCACTAAACTCAATTTCTCACTCACACTCACTTCAGTTCAATTCACTTCCCTTCCTCCAAATTAGTTCCAACACAAAAACCAAGCAAAGAAAAAGACTCTACCGAAACACTTCACTACTCATACAATATTTTCAGACACAACATGTTGAAGGAAGGCACCAACAACGTTGGTGGCAGCAACACTGGCACCACCTGGTCACGTGTCTGTGACACGTGCCTGTCTGCGCCATGCGTGCTGTACTGCCATGCAGACTCAGCATATCTTTGCTCTTCCTGTGATGCTCGTGTGCATGCAGCTAACCGTGTGGCCTCGAGACACAAGCGTGTGTGGGTGTGCGAAGCGTGTGAGCGTGCTCCGGCGGCGTTTCTATGCAAAGCTGACGCAGCTTCTCTTTGTTCTTCCTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACAACCGTGTTCCCATTCTCCCGATCTCAGGTTCCCTCTTCAGGGAACCAGAGCACAATCACAAACGCGTGGAACACGCGTTCGTGAATGAGGTTGAGGAGGAAGAGGAAGGGGTTTTTGATGAGTATGAAGACGAGGTTGAAGCTGCTTCGTGGTTGTTGCCACATCCTATGAAAAATAATGATGAAATTGAGGAGAATGATTGTGGTGACGAGGGTTTTTTGTTTGTTGATGAGTATTTGGACAATCTTGTTGATTGTTGTAACTCATGTGGTCACAATGACAACCAGTTTAGCAACGTTTATCAGCACCAGCAGAATTACAACACTGTCCCTCAGAACTATGTAGTGGTTCCAGTTCAGGTGCCGCAGCATTTTCAACCCGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGATGGTTCTCTTAGTCAAAGTGTAAGACTCTTCTTTTCAATTACTTCTGTGTTTCTTTTTCGGTTTGTTTTTTATATGAATAGTGTTTTCCCTTTTTCTCTTTCTTTTTCTTTTCCCAGACTCTTTGGATCATTCATCCATTGGATTATACTTTATCAGATTTTGATTTTGCCTTGACACCTTTGCTAACTCTTCCTTCCAATTGGCAGTTTCTTTCCTTTCTCCGTTCATATGAAACTAGGGTTTTAAATTATACTCATGATCAATAATTTGGTTGCAATTTTTGATATTGTAGTACAATTGCTATTGTTGTTGTGAAAAGTTAAAAAAATCTTAATGTTGTAACCGAAATCTCAATCACATACTGTTTGTAAAATCCTTGGTTGAAATCAAAGTGGGTTTCCCAAGTAGCTTCTTTTACTAGAAACGCTAGCAAAGTCAACTACTCTAGTTCAATTGCCATATATGTGACTAATTTGATTCATTCCACAACTCTTCATATTTCTTTGACTACCCTTTTACCGTTCACTTTGCGGTCTTGAGAGACTTTTATTTATTTTCTTTTTTGTCGTATATAAGATCAGCTTTGCCTTTATGGTGTCTTTTATTTGCTAGTTATAGTTGTGATTCCTCTTAAACTTTGTTTCCTCATTTCATCAACTGTATATTAATTTCCCATAATTTTTCAGCTTCAATTAAAAAAATTGAGCCTAAGTGCCTGATTTATTAAAGCCACAAAATGGGTGGTTTAATTTTTTCGACACCTTTCTTTTATATTTCTTTTACTCTTCTTCTCTTTTCTTTTTCTATTACATCATCTATAATATATCTTCACCTTTTTCTTCTTACTTTGGGGACAAACATTTTTGTTTCACAAAGCTGGTTAGCTACTAGTTTATTGCTTAGAAAATTTATAGCCTTACCTGTGATCTCTCAAACTTCATACACGATTTTGTGTTAATCTTTTATATTTCATTTTTAATTTAGGTTTCGGTTTCATCAATGGATGTTGGAGTTGTACCCGAATCAACAGTAAGTGGCATCTCAATGTCCCACTCAAAGTCACCAATAGGGACAAATGACCTATTTCCTCCCCTTCTCATGCCTTCACATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATATAGGGAGAAAAAGAAGACAAGAAAGTTCGAGAAGAAAATAAGATATGCCTCAAGGAAGGCCTATGCAGAGACTAGACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACTGATGTAGAAGCTGAAGTGGATCAGATGTTCTCCACAAAACTATTCAATGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAGAATGGAAAGAAAGTAATTGCCAAGCCATAGAAGAGAAGGTTGGGAACCACACATCATTGGAAGAACTTCATGTAATTTTTATGTAGTCTAATTAGTTTGGTATTATATTTACTTCTATCTTGTGCTTTATAAATATAAAGTAT-3'

pUC57-sgRNA-SpCas9载体序列

5'-TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGA CGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGTTTAAACGGCGCGCCCCAATGTCCCTAGGTTCGTTGAACAACGGAAACTCGACTTGCCTTCCGCACAATACATCATTTCTTCTTAGCTTTTTTTCTTCTTCTTCGTTCATACAGTTTTTTTTTGTTTATCAGCTTACATTTTCTTGAACCGTAGCTTTCGTTTTCTTCTTTTTAACTTTCCATTCGGAGTTTTTGTATCTTGTTTCATAGTTTGTCCCAGGATTAGAATGATTAGGCATCGAACCTTCAAGAATTTGATTGAATAAAACATCTTCATTCTTAAGATATGAAGATAATCTTCAAAAGGCCCCTGGGAATCTGAAAGAAGAGAAGCAGGCCCATTTATATGGGAAAGAACAATAGTATTTCTTATATAGGCCCATTTAAGTTGAAAACAATCTTCAAAAGTCCCACATCGCTTAGATAAGAAAACGAAGCTGAGTTTATATACAGCTAGAGTCGAAGTAGTGATTGCTAGCGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCAGAAGACCCGTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCAAAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAGATTTTTTTACTAGTTTAATTAAGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTC-3'

PTF101-SpCas9载体序列如下：

5'-AGTACTTTAAAGTACTTTAAAGTACTTTAAAGTACTTTGATCCAACCCCTCCGCTG CTATAGTGCAGTCGGCTTCTGACGTTCAGTGCAGCCGTCTTCTGAAAACGACATGTCGC

ACAAGTCCTAAGTTACGCGACAGGCTGCCGCCCTGCCCTTTTCCTGGCGTTTTCTTGTCG

CGTGTTTTAGTCGCATAAAGTAGAATACTTGCGACTAGAACCGGAGACATTACGCCATGA

ACAAGAGCGCCGCCGCTGGCCTGCTGGGCTATGCCCGCGTCAGCACCGACGACCAGGA

CTTGACCAACCAACGGGCCGAACTGCACGCGGCCGGCTGCACCAAGCTGTTTTCCGAG

AAGATCACCGGCACCAGGCGCGACCGCCCGGAGCTGGCCAGGATGCTTGACCACCTAC

GCCCTGGCGACGTTGTGACAGTGACCAGGCTAGACCGCCTGGCCCGCAGCACCCGCGA

CCTACTGGACATTGCCGAGCGCATCCAGGAGGCCGGCGCGGGCCTGCGTAGCCTGGCA

GAGCCGTGGGCCGACACCACCACGCCGGCCGGCCGCATGGTGTTGACCGTGTTCGCCG

GCATTGCCGAGTTCGAGCGTTCCCTAATCATCGACCGCACCCGGAGCGGGCGCGAGGCC

GCCAAGGCCCGAGGCGTGAAGTTTGGCCCCCGCCCTACCCTCACCCCGGCACAGATCG

CGCACGCCCGCGAGCTGATCGACCAGGAAGGCCGCACCGTGAAAGAGGCGGCTGCACT

GCTTGGCGTGCATCGCTCGACCCTGTACCGCGCACTTGAGCGCAGCGAGGAAGTGACG

CCCACCGAGGCCAGGCGGCGCGGTGCCTTCCGTGAGGACGCATTGACCGAGGCCGACG

CCCTGGCGGCCGCCGAGAATGAACGCCAAGAGGAACAAGCATGAAACCGCACCAGGA

CGGCCAGGACGAACCGTTTTTCATTACCGAAGAGATCGAGGCGGAGATGATCGCGGCCG

GGTACGTGTTCGAGCCGCCCGCGCACGTCTCAACCGTGCGGCTGCATGAAATCCTGGCC

GGTTTGTCTGATGCCAAGCTGGCGGCCTGGCCGGCCAGCTTGGCCGCTGAAGAAACCG

AGCGCCGCCGTCTAAAAAGGTGATGTGTATTTGAGTAAAACAGCTTGCGTCATGCGGTC

GCTGCGTATATGATGCGATGAGTAAATAAACAAATACGCAAGGGGAACGCATGAAGGTT

ATCGCTGTACTTAACCAGAAAGGCGGGTCAGGCAAGACGACCATCGCAACCCATCTAGC

CCGCGCCCTGCAACTCGCCGGGGCCGATGTTCTGTTAGTCGATTCCGATCCCCAGGGCA

GTGCCCGCGATTGGGCGGCCGTGCGGGAAGATCAACCGCTAACCGTTGTCGGCATCGAC

CGCCCGACGATTGACCGCGACGTGAAGGCCATCGGCCGGCGCGACTTCGTAGTGATCGA

CGGAGCGCCCCAGGCGGCGGACTTGGCTGTGTCCGCGATCAAGGCAGCCGACTTCGTG

CTGATTCCGGTGCAGCCAAGCCCTTACGACATATGGGCCACCGCCGACCTGGTGGAGCT

GGTTAAGCAGCGCATTGAGGTCACGGATGGAAGGCTACAAGCGGCCTTTGTCGTGTCGC

GGGCGATCAAAGGCACGCGCATCGGCGGTGAGGTTGCCGAGGCGCTGGCCGGGTACGA

GCTGCCCATTCTTGAGTCCCGTATCACGCAGCGCGTGAGCTACCCAGGCACTGCCGCCG

CCGGCACAACCGTTCTTGAATCAGAACCCGAGGGCGACGCTGCCCGCGAGGTCCAGGC

GCTGGCCGCTGAAATTAAATCAAAACTCATTTGAGTTAATGAGGTAAAGAGAAAATGAG

CAAAAGCACAAACACGCTAAGTGCCGGCCGTCCGAGCGCACGCAGCAGCAAGGCTGC

AACGTTGGCCAGCCTGGCAGACACGCCAGCCATGAAGCGGGTCAACTTTCAGTTGCCG

GCGGAGGATCACACCAAGCTGAAGATGTACGCGGTACGCCAAGGCAAGACCATTACCG

AGCTGCTATCTGAATACATCGCGCAGCTACCAGAGTAAATGAGCAAATGAATAAATGAGT

AGATGAATTTTAGCGGCTAAAGGAGGCGGCATGGAAAATCAAGAACAACCAGGCACCG

ACGCCGTGGAATGCCCCATGTGTGGAGGAACGGGCGGTTGGCCAGGCGTAAGCGGCTG

GGTTGTCTGCCGGCCCTGCAATGGCACTGGAACCCCCAAGCCCGAGGAATCGGCGTGA

GCGGTCGCAAACCATCCGGCCCGGTACAAATCGGCGCGGCGCTGGGTGATGACCTGGT

GGAGAAGTTGAAGGCCGCGCAGGCCGCCCAGCGGCAACGCATCGAGGCAGAAGCACG

CCCCGGTGAATCGTGGCAAGCGGCCGCTGATCGAATCCGCAAAGAATCCCGGCAACCG

CCGGCAGCCGGTGCGCCGTCGATTAGGAAGCCGCCCAAGGGCGACGAGCAACCAGATT

TTTTCGTTCCGATGCTCTATGACGTGGGCACCCGCGATAGTCGCAGCATCATGGACGTGG

CCGTTTTCCGTCTGTCGAAGCGTGACCGACGAGCTGGCGAGGTGATCCGCTACGAGCTT

CCAGACGGGCACGTAGAGGTTTCCGCAGGGCCGGCCGGCATGGCCAGTGTGTGGGATT

ACGACCTGGTACTGATGGCGGTTTCCCATCTAACCGAATCCATGAACCGATACCGGGAA

GGGAAGGGAGACAAGCCCGGCCGCGTGTTCCGTCCACACGTTGCGGACGTACTCAAGT

TCTGCCGGCGAGCCGATGGCGGAAAGCAGAAAGACGACCTGGTAGAAACCTGCATTCG

GTTAAACACCACGCACGTTGCCATGCAGCGTACGAAGAAGGCCAAGAACGGCCGCCTG

GTGACGGTATCCGAGGGTGAAGCCTTGATTAGCCGCTACAAGATCGTAAAGAGCGAAAC

CGGGCGGCCGGAGTACATCGAGATCGAGCTAGCTGATTGGATGTACCGCGAGATCACAG

AAGGCAAGAACCCGGACGTGCTGACGGTTCACCCCGATTACTTTTTGATCGATCCCGGC

ATCGGCCGTTTTCTCTACCGCCTGGCACGCCGCGCCGCAGGCAAGGCAGAAGCCAGATG

GTTGTTCAAGACGATCTACGAACGCAGTGGCAGCGCCGGAGAGTTCAAGAAGTTCTGT

TTCACCGTGCGCAAGCTGATCGGGTCAAATGACCTGCCGGAGTACGATTTGAAGGAGGA

GGCGGGGCAGGCTGGCCCGATCCTAGTCATGCGCTACCGCAACCTGATCGAGGGCGAA

GCATCCGCCGGTTCCTAATGTACGGAGCAGATGCTAGGGCAAATTGCCCTAGCAGGGGA

AAAAGGTCGAAAAGGTCTCTTTCCTGTGGATAGCACGTACATTGGGAACCCAAAGCCGT

ACATTGGGAACCGGAACCCGTACATTGGGAACCCAAAGCCGTACATTGGGAACCGGTC

ACACATGTAAGTGACTGATATAAAAGAGAAAAAAGGCGATTTTTCCGCCTAAAACTCTTT

AAAACTTATTAAAACTCTTAAAACCCGCCTGGCCTGTGCATAACTGTCTGGCCAGCGCA

CAGCCGAAGAGCTGCAAAAAGCGCCTACCCTTCGGTCGCTGCGCTCCCTACGCCCCGCC

GCTTCGCGTCGGCCTATCGCGGCCGCTGGCCGCTCAAAAATGGCTGGCCTACGGCCAGG

CAATCTACCAGGGCGCGGACAAGCCGCGCCGTCGCCACTCGACCGCCGGCGCCCACAT

CAAGGCACCCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGC

TCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCA

GGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCCAGTCACGTAGC

GATAGCGGAGTGTATACTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGC

ACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGC

TCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTA

TCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAA

GAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCT

GGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTC

AGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTC

CCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCC

TTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGT

CGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCT

TATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAG

CAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTG

AAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTG

AAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCG

CTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCT

CAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACG

TTAAGGGATTTTGGTCATGCATGATATATCTCCCAATTTGTGTAGGGCTTATTATGCACGCT

TAAAAATAATAAAAGCAGACTTGACCTGATAGTTTGGCTGTGAGCAATTATGTGCTTAGT

GCATCTAACGCTTGAGTTAAGCCGCGCCGCGAAGCGGCGTCGGCTTGAACGAATTTCTA

GCTAGACATTATTTGCCGACTACCTTGGTGATCTCGCCTTTCACGTAGTGGACAAATTCTT

CCAACTGATCTGCGCGCGAGGCCAAGCGATCTTCTTCTTGTCCAAGATAAGCCTGTCTA

GCTTCAAGTATGACGGGCTGATACTGGGCCGGCAGGCGCTCCATTGCCCAGTCGGCAGC

GACATCCTTCGGCGCGATTTTGCCGGTTACTGCGCTGTACCAAATGCGGGACAACGTAA

GCACTACATTTCGCTCATCGCCAGCCCAGTCGGGCGGCGAGTTCCATAGCGTTAAGGTTT

CATTTAGCGCCTCAAATAGATCCTGTTCAGGAACCGGATCAAAGAGTTCCTCCGCCGCT

GGACCTACCAAGGCAACGCTATGTTCTCTTGCTTTTGTCAGCAAGATAGCCAGATCAATG

TCGATCGTGGCTGGCTCGAAGATACCTGCAAGAATGTCATTGCGCTGCCATTCTCCAAAT

TGCAGTTCGCGCTTAGCTGGATAACGCCACGGAATGATGTCGTCGTGCACAACAATGGT

GACTTCTACAGCGCGGAGAATCTCGCTCTCTCCAGGGGAAGCCGAAGTTTCCAAAAGG

TCGTTGATCAAAGCTCGCCGCGTTGTTTCATCAAGCCTTACGGTCACCGTAACCAGCAA

ATCAATATCACTGTGTGGCTTCAGGCCGCCATCCACTGCGGAGCCGTACAAATGTACGGC

CAGCAACGTCGGTTCGAGATGGCGCTCGATGACGCCAACTACCTCTGATAGTTGAGTCG

ATACTTCGGCGATCACCGCTTCCCCCATGATGTTTAACTTTGTTTTAGGGCGACTGCCCTG

CTGCGTAACATCGTTGCTGCTCCATAACATCAAACATCGACCCACGGCGTAACGCGCTTG

CTGCTTGGATGCCCGAGGCATAGACTGTACCCCAAAAAAACAGTCATAACAAGCCATGA

AAACCGCCACTGCGCCGTTACCACCGCTGCGTTCGGTCAAGGTTCTGGACCAGTTGCGT

GACGGCAGTTACGCTACTTGCATTACAGCTTACGAACCGAACGAGGCTTATGTCCACTG

GGTTCGTGCCCGAATTGATCACAGGCAGCAACGCTCTGTCATCGTTACAATCAACATGCT

ACCCTCCGCGAGATCATCCGTGTTTCAAACCCGGCAGCTTAGTTGCCGTTCTTCCGAATA

GCATCGGTAACATGAGCAAAGTCTGCCGCCTTACAACGGCTCTCCCGCTGACGCCGTCC

CGGACTGATGGGCTGCCTGTATCGAGTGGTGATTTTGTGCCGAGCTGCCGGTCGGGGAG

CTGTTGGCTGGCTGGTGGCAGGATATATTGTGGTGTAAACAAATTGACGCTTAGACAACT

TAATAACACATTGCGGACGTTTTTAATGTACTGAATTAACGCCGAATTGCTCTAGCATTCG

CCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACG

CCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTT

TCCCAGTCACGACGTTGTAAAACGACGGCCAGTGCCAAGCTAATTCGCTTCAAGACGTG

CTCAAATCACTATTTCCACACCCCTATATTTCTATTGCACTCCCTTTTAACTGTTTTTTATT

ACAAAAATGCCCTGGAAAATGCACTCCCTTTTTGTGTTTGTTTTTTTGTGAAACGATGTT

GTCAGGTAATTTATTTGTCAGTCTACTATGGTGGCCCATTATATTAATAGCAACTGTCGGT

CCAATAGACGACGTCGATTTTCTGCATTTGTTTAACCACGTGGATTTTATGACATTTTATAT

TAGTTAATTTGTAAAACCTACCCAATTAAAGACCTCATATGTTCTAAAGACTAATACTTAA

TGATAACAATTTTCTTTTAGTGAAGAAAGGGATAATTAGTAAATATGGAACAAGGGCAGA

AGATTTATTAAAGCCGCGGTAAGAGACAACAAGTAGGTACGTGGAGTGTCTTAGGTGAC

TTACCCACATAACATAAAGTGACATTAACAAACATAGCTAATGCTCCTATTTGAATAGTGC

ATATCAGCATACCTTATTACATATAGATAGGAGCAAACTCTAGCTAGATTGTTGAGCAGAT

CTCGGTGACGGGCAGGACCGGACGGGGCGGTACCGGCAGGCTGAAGTCCAGCTGCCA

GAAACCCACGTCATGCCAGTTCCCGTGCTTGAAGCCGGCCGCCCGCAGCATGCCGCGG

GGGGCATATCCGAGCGCCTCGTGCATGCGCACGCTCGGGTCGTTGGGCAGCCCGATGAC

AGCGACCACGCTCTTGAAGCCCTGTGCCTCCAGGGACTTCAGCAGGTGGGTGTAGAGC

GTGGAGCCCAGTCCCGTCCGCTGGTGGCGGGGGGAGACGTACACGGTCGACTCGGCCG

TCCAGTCGTAGGCGTTGCGTGCCTTCCAGGGGCCCGCGTAGGCGATGCCGGCGACCTCG

CCGTCCACCTCGGCGACGAGCCAGGGATAGCGCTCCCGCAGACGGACGAGGTCGTCCG

TCCACTCCTGCGGTTCCTGCGGCTCGGTACGGAAGTTGACCGTGCTTGTCTCGATGTAGT

GGTTGACGATGGTGCAGACCGCCGGCATGTCCGCCTCGGTGGCACGGCGGATGTCGGC

CGGGCGTCGTTCTGGGCTCATGGTAGATCCCCCGTTCGTAAATGGTGAAAATTTTCAGAA

AATTGCTTTTGCTTTAAAAGAAATGATTTAAATTGCTGCAATAGAAGTAGAATGCTTGATT

GCTTGAGATTCGTTTGTTTTGTATATGTTGTGTTGAGAATTAATTCTCGAGGTCCTCTCCA

AATGAAATGAACTTCCTTATATAGAGGAAGGGTCTTGCGAAGGATAGTGGGATTGTGCGT

CATCCCTTACGTCAGTGGAGATATCACATCAATCCACTTGCTTTGAAGACGTGGTTGGAA

CGTCTTCTTTTTCCACGATGCTCCTCGTGGGTGGGGGTCCATCTTTGGGACCACTGTCGG

TAGAGGCATCTTGAACGATAGCCTTTCCTTTATCGCAATGATGGCATTTGTAGGAGCCAC

CTTCCTTTTCCACTATCTTCACAATAAAGTGACAGATAGCTGGGCAATGGAATCCGAGGA

GGTTTCCGGATATTACCCTTTGTTGAAAAGTCTCAATTGCCCTTTGGTCTTCTGAGACTGT

ATCTTTGATATTTTTGGAGTAGACAAGTGTGTCGTGCTCCACCATGTTATCACATCAATCC

ACTTGCTTTGAAGACGTGGTTGGAACGTCTTCTTTTTCCACGATGCTCCTCGTGGGTGG

GGGTCCATCTTTGGGACCACTGTCGGCAGAGGCATCTTCAACGATGGCCTTTCCTTTATC

GCAATGATGGCATTTGTAGGAGCCACCTTCCTTTTCCACTATCTTCACAATAAAGTGACA

GATAGCTGGGCAATGGAATCCGAGGAGGTTTCCGGATATTACCCTTTGTTGAAAAGTCTC

AATTGCCCTTTGGTCTTCTGAGACTGTATCTTTGATATTTTTGGAGTAGACAAGTGTGTCG

TGCTCCACCATGTTGACCTGCAGGCATGCAAGCTTGCATGCCTGCAGGTCCCCAGATTA

GCCTTTTCAATTTCAGAAAGAATGCTAACCCACAGATGGTTAGAGAGGCTTACGCAGCA

GGTCTCATCAAGACGATCTACCCGAGCAATAATCTCCAGGAAATCAAATACCTTCCCAAG

AAGGTTAAAGATGCAGTCAAAAGATTCAGGACTAACTGCATCAAGAACACAGAGAAAG

ATATATTTCTCAAGATCAGAAGTACTATTCCAGTATGGACGATTCAAGGCTTGCTTCACAA

ACCAAGGCAAGTAATAGAGATTGGAGTCTCTAAAAAGGTAGTTCCCACTGAATCAAAGG

CCATGGAGTCAAAGATTCAAATAGAGGACCTAACAGAACTCGCCGTAAAGACTGGCGA

ACAGTTCATACAGAGTCTCTTACGACTCAATGACAAGAAGAAAATCTTCGTCAACATGG

TGGAGCACGACACACTTGTCTACTCCAAAAATATCAAAGATACAGTCTCAGAAGACCAA

AGGGCAATTGAGACTTTTCAACAAAGGGTAATATCCGGAAACCTCCTCGGATTCCATTG

CCCAGCTATCTGTCACTTTATTGTGAAGATAGTGGAAAAGGAAGGTGGCTCCTACAAAT

GCCATCATTGCGATAAAGGAAAGGCCATCGTTGAAGATGCCTCTGCCGACAGTGGTCCC

AAAGATGGACCCCCACCCACGAGGAGCATCGTGGAAAAAGAAGACGTTCCAACCACGT

CTTCAAAGCAAGTGGATTGATGTGATATCTCCACTGACGTAAGGGATGACGCACAATCC

CACTATCCTTCGCAAGACCCTTCCTCTATATAAGGAAGTTCATTTCATTTGGAGAGAACA

CGGGGGACTCTAGAATGGCCCCTAAGAAGAAGAGAAAGGTCGGTATTCACGGCGTTCC

TGCGGCGATGGACAAGAAGTATAGTATTGGTCTGGACATTGGGACGAATTCCGTTGGCT

GGGCCGTGATCACCGATGAGTACAAGGTCCCTTCCAAGAAGTTTAAGGTTCTGGGGAAC

ACCGATCGGCACAGCATCAAGAAGAATCTCATTGGAGCCCTCCTGTTCGACTCAGGCGA

GACCGCCGAAGCAACAAGGCTCAAGAGAACCGCAAGGAGACGGTATACAAGAAGGAA

GAATAGGATCTGCTACCTGCAGGAGATTTTCAGCAACGAAATGGCGAAGGTGGACGATT

CGTTCTTTCATAGATTGGAGGAGAGTTTCCTCGTCGAGGAAGATAAGAAGCACGAGAGG

CATCCTATCTTTGGCAACATTGTCGACGAGGTTGCCTATCACGAAAAGTACCCCACAATC

TATCATCTGCGGAAGAAGCTTGTGGACTCGACTGATAAGGCGGACCTTAGATTGATCTAC

CTCGCTCTGGCACACATGATTAAGTTCAGGGGCCATTTTCTGATCGAGGGGGATCTTAAC

CCGGACAATAGCGATGTGGACAAGTTGTTCATCCAGCTCGTCCAAACCTACAATCAGCT

CTTTGAGGAAAACCCAATTAATGCTTCAGGCGTCGACGCCAAGGCGATCCTGTCTGCAC

GCCTTTCAAAGTCTCGCCGGCTTGAGAACTTGATCGCTCAACTCCCGGGCGAAAAGAA

GAACGGCTTGTTCGGGAATCTCATTGCACTTTCGTTGGGGCTCACACCAAACTTCAAGA

GTAATTTTGATCTCGCTGAGGACGCAAAGCTGCAGCTTTCCAAGGACACTTATGACGAT

GACCTGGATAACCTTTTGGCCCAAATCGGCGATCAGTACGCGGACTTGTTCCTCGCCGC

GAAGAATTTGTCGGACGCGATCCTCCTGAGTGATATTCTCCGCGTGAACACCGAGATTAC

AAAGGCCCCGCTCTCGGCGAGTATGATCAAGCGCTATGACGAGCACCATCAGGATCTGA

CCCTTTTGAAGGCTTTGGTCCGGCAGCAACTCCCAGAGAAGTACAAGGAAATCTTCTTT

GATCAATCCAAGAACGGCTACGCTGGTTATATTGACGGCGGGGCATCGCAGGAGGAATT

CTACAAGTTTATCAAGCCAATTCTGGAGAAGATGGATGGCACAGAGGAACTCCTGGTGA

AGCTCAATAGGGAGGACCTTTTGCGGAAGCAAAGAACTTTCGATAACGGCAGCATCCCT

CACCAGATTCATCTCGGGGAGCTGCACGCCATCCTGAGAAGGCAGGAAGACTTCTACCC

CTTTCTTAAGGATAACCGGGAGAAGATCGAAAAGATTCTGACGTTCAGAATTCCGTACTA

TGTCGGACCACTCGCCCGGGGTAATTCCAGATTTGCGTGGATGACCAGAAAGAGCGAG

GAAACCATCACACCTTGGAACTTCGAGGAAGTGGTCGATAAGGGCGCTTCCGCACAGA

GCTTCATTGAGCGCATGACAAATTTTGACAAGAACCTGCCTAATGAGAAGGTCCTTCCC

AAGCATTCCCTCCTGTACGAGTATTTCACTGTTTATAACGAACTCACGAAGGTGAAGTAT

GTGACCGAGGGAATGCGCAAGCCCGCCTTCCTGAGCGGCGAGCAAAAGAAGGCGATCG

TGGACCTTTTGTTTAAGACCAATCGGAAGGTCACAGTTAAGCAGCTCAAGGAGGACTAC

TTCAAGAAGATTGAATGCTTCGATTCCGTTGAGATCAGCGGCGTGGAAGACAGGTTTAA

CGCGTCACTGGGGACTTACCACGATCTCCTGAAGATCATTAAGGATAAGGACTTCTTGG

ACAACGAGGAAAATGAGGATATCCTCGAAGACATTGTCCTGACTCTTACGTTGTTTGAG

GATAGGGAAATGATCGAGGAACGCTTGAAGACGTATGCCCATCTCTTCGATGACAAGGT

TATGAAGCAGCTCAAGAGAAGAAGATACACCGGATGGGGAAGGCTGTCCCGCAAGCTT

ATCAATGGCATTAGAGACAAGCAATCAGGGAAGACAATCCTTGACTTTTTGAAGTCTGA

TGGCTTCGCGAACAGGAATTTTATGCAGCTGATTCACGATGACTCACTTACTTTCAAGGA

GGATATCCAGAAGGCTCAAGTGTCGGGACAAGGTGACAGTCTGCACGAGCATATCGCCA

ACCTTGCGGGATCTCCTGCAATCAAGAAGGGTATTCTGCAGACAGTCAAGGTTGTGGAT

GAGCTTGTGAAGGTCATGGGACGGCATAAGCCCGAGAACATCGTTATTGAGATGGCCAG

AGAAAATCAGACCACACAAAAGGGTCAGAAGAACTCGAGGGAGCGCATGAAGCGCAT

CGAGGAAGGCATTAAGGAGCTGGGGAGTCAGATCCTTAAGGAGCACCCGGTGGAAAAC

ACGCAGTTGCAAAATGAGAAGCTCTATCTGTACTATCTGCAAAATGGCAGGGATATGTAT

GTGGACCAGGAGTTGGATATTAACCGCCTCTCGGATTACGACGTCGATCATATCGTTCCT

CAGTCCTTCCTTAAGGATGACAGCATTGACAATAAGGTTCTCACCAGGTCCGACAAGAA

CCGCGGGAAGTCCGATAATGTGCCCAGCGAGGAAGTCGTTAAGAAGATGAAGAACTAC

TGGAGGCAACTTTTGAATGCCAAGTTGATCACACAGAGGAAGTTTGATAACCTCACTAA

GGCCGAGCGCGGAGGTCTCAGCGAACTGGACAAGGCGGGCTTCATTAAGCGGCAACTG

GTTGAGACTAGACAGATCACGAAGCACGTGGCGCAGATTCTCGATTCACGCATGAACAC

GAAGTACGATGAGAATGACAAGCTGATCCGGGAAGTGAAGGTCATCACCTTGAAGTCA

AAGCTCGTTTCTGACTTCAGGAAGGATTTCCAATTTTATAAGGTGCGCGAGATCAACAAT

TATCACCATGCTCATGACGCATACCTCAACGCTGTGGTCGGAACAGCATTGATTAAGAAG

TACCCGAAGCTCGAGTCCGAATTCGTGTACGGTGACTATAAGGTTTACGATGTGCGCAA

GATGATCGCCAAGTCAGAGCAGGAAATTGGCAAGGCCACTGCGAAGTATTTCTTTTACT

CTAACATTATGAATTTCTTTAAGACTGAGATCACGCTGGCTAATGGCGAAATCCGGAAGA

GACCACTTATTGAGACCAACGGCGAGACAGGGGAAATCGTGTGGGACAAGGGGAGGGA

TTTCGCCACAGTCCGCAAGGTTCTCTCTATGCCTCAAGTGAATATTGTCAAGAAGACTGA

AGTCCAGACGGGCGGGTTCTCAAAGGAATCTATTCTGCCCAAGCGGAACTCGGATAAGC

TTATCGCCAGAAAGAAGGACTGGGACCCGAAGAAGTATGGAGGTTTCGACTCACCAAC

GGTGGCTTACTCTGTCCTGGTTGTGGCAAAGGTGGAGAAGGGAAAGTCAAAGAAGCTC

AAGTCTGTCAAGGAGCTCCTGGGTATCACCATTATGGAGAGGTCCAGCTTCGAAAAGAA

TCCGATCGATTTTCTCGAGGCGAAGGGATATAAGGAAGTGAAGAAGGACCTGATCATTA

AGCTTCCAAAGTACAGTCTTTTCGAGTTGGAAAACGGCAGGAAGCGCATGTTGGCTTCC

GCAGGAGAGCTCCAGAAGGGTAACGAGCTTGCTTTGCCGTCCAAGTATGTGAACTTCCT

CTATCTGGCATCCCACTACGAGAAGCTCAAGGGCAGCCCAGAGGATAACGAACAGAAG

CAACTGTTTGTGGAGCAACACAAGCATTATCTTGACGAGATCATTGAACAGATTTCGGA

GTTCAGTAAGCGCGTCATCCTCGCCGACGCGAATTTGGATAAGGTTCTCTCAGCCTACAA

CAAGCACCGGGACAAGCCTATCAGAGAGCAGGCGGAAAATATCATTCATCTCTTCACCC

TGACAAACCTTGGGGCTCCCGCTGCATTCAAGTATTTTGACACTACGATTGATCGGAAG

AGATACACTTCTACGAAGGAGGTGCTGGATGCAACCCTTATCCACCAATCGATTACTGGC

CTCTACGAGACGCGGATCGACTTGAGTCAGCTCGGGGGGGATAAGAGACCAGCGGCAA

CCAAGAAGGCAGGACAAGCGAAGAAGAAGAAGTAGGTTAACGAATTTCCCCGATCGTT

CAAACATTTGGCAATAAAGTTTCTTAAGATTGAATCCTGTTGCCGGTCTTGCGATGATTAT

CATATAATTTCTGTTGAATTACGTTAAGCATGTAATAATTAACATGTAATGCATGACGTTAT

TTATGAGATGGGTTTTTATGATTAGAGTCCCGCAATTATACATTTAATACGCGATAGAAAA

CAAAATATAGCGCGCAAACTAGGATAAATTATCGCGCGCGGTGTCATCTATGTTACTAGAT

CGGGAATTCTTAATTAAGGATCCGTAATCATGTCATAGCTGTTTCCTGTGTGAAATTGTTA

TCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTG

CCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGG

GAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTT

GCGTATTGGAGCTTGAGCTTGGATCAGATTGTCGTTTCCCGCCTTCAGGCGCGCCGTTTA

AACTATCAGTGTTTGACAGGATATATTGGCGGGTAAACCTAAGAGAAAAGAGCGTTTATT

AGAATAATCGGATATTTAAAAGGGCGTGAAAAGGTTTATCCGTTCGTCCATTTGTATGTGCATGCCAACCACAGGGTTCCCCTCGGGATCAA-3'

Gmcol2a-78突变体中突变后的基因组序列

5'-AGGATCGTCCAAGTCAATATAGCTTATGCTGGTTCAAAGTGCAAATCCGATCCAA GAAGAAGCTCGACCTTATCTGAGTTTGATAACATTAATTGCTTGTATGTCACATGGCTTGCGATTTACAACAACCATCAACAACTTTTCCTATGCATTCTACATACATATAAGGCATTCTTATAACTTCAAGTTCATATCTAATCTTTCATTTCTTGCCTATTTCTTACAAAAGCTAACTTGAACGTTGATGCCTTTACAAGTAGCGACCATCAAACCCCTCCTTTATAACCACCATGGTGCTACTATGTTATTCCTAAGTACACCAAACAAAATTTATTATGAACAATAATATTTGAACACCATGTTATTTGAAACATTCCACCTTGACAGTTCTTCTAACTCCACCAACAAAAAATTACTATTTATTTTCATAATCACAAAGACTCCACATTCTATCTGCAAAATCAGTAATCATCTAAACACGTGCTTTAATCCTTTTACGTACAGCCAATAAGATTACATGAAAGGAAAGCATATATATTAAGGGATAACATGAGATTTTGACTGGTGCATGTATATAGAATCTACATGGACCCAAAATTACACGTGTCTCCAAGTTGTGCCTCCATAGCAATACGAACAAAGCCTCAACATCTCTTTAATGATTCCAAAAGGCAAAGGAAGCATGCGTACTGTACTGCCATGCAGACTCAGCATACCTTTGCTCATCCTGCGATGCTCGTGTCCATGCGGCTAACCGTGTGGCCTCAAGACACGAGCGTGTGTGGGTGTGCGAAGCGTGTGAACGTGCTCCCGCAGCGTTTCTATGCAAAGCCGACGCAGCTTCTCTTTGTTCTTCCTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACCACCGCGTGCCCATTCTCCCGATCTCTGGTTCCCTCTTCGGGGAACCAGAGCATGAACGCGTGTACGCGTTCGTGAATGAAGTGGAAGCGGAGGAGGAAGAGGAAGAGGTTTTTGATGAGTATGATGAGGTTGAAGCAGCTTCGTGGTTGTTGCCACATCCTATGAAAAATGATAAAATTGACGAGAATGGTGGTGATAAGGGTTTTTTGTTTGGTGATGAGTATTTCGACAACCTTGTTGATTGTAACTCATGTGGTCACAATAACAACCAGTTTAGCAACGTTTATGATCAGCACCAGCAGAATTACAGCAACACTGTCCCTCAGAACTATGCAGTGGTTCCAGTTCAGGTGCCGCAGCATTTTCAACCGGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGATGGTTCTCTTAGTCAAAGTGTAAGTTACCTTCTTTTTACTTCTATGTGTTTCTTTTTGGTTTGTTGTTTATATCAATGGGGTTTTCCCTTCTTTTTTTTTTTTTTTTTCTTTTTGCAAACTCTTTGGATCATTCATCCATTGGATTATACTACTTTATTAGATTTTGCCTTGAAACCTGTGCTAACTCTTCCTTCTAATTGACAGTTTCTTTTTCTCCATTCGTATGAAACCAAGGTTTTAAACTGCAGTCATAGTCATAGTCAAGATTATAGTTTATTCAAAAACATTAGCATTGTAATACAATTGTACTGTAATTGTCGTCGTGAAAAAGTTAAAAAAAAGTTTAAAAAATCTCAATCGCATACCTTCTATAAAAATCTTGATTGAAACCAAAGTGGGTTTCATAAGTAGTTTCTTTTACAAGAAAAACTAGCAATAAAGTCAACTACTCTAGATCCATTGCCATACATGTGACCTTGATCCATTCCACAACGTTTCGTATTTCTTTGCCTACCCTTTTCCCATTGACTACTTTTCTGTCTTGAGAGACATTTATTTTATTTTTTTCGTATGCAATAGCTTTCCCTTTTTGATGTCTTGTATTTGCTAGTTATAGTTGTGATTCCTCATAAACAGATACTTACTTTTATAGGGTAACTTAGCTTTTCACCAATTTTCGCCCATACATAGTTAGACTTCCCTAAACTTTGTTTCCTCATTTCTTCAACTATAATTTGATCAATTGTATATTAATTTCCCATAATTTTCAGCTTCAATTAAAAAATTTGAGCCTAAGTGCCTGTTTTATTAAAGCCAAACAATGGGGGGTTTAATATTTTAAAAACTTTCTTCTATATTTCTTTTACATTTCCTCTGTTTTCTAATATATCTTTTCTTTTTTCTATTACATCATCTTTGATATATTTTCACCTTTTTCTTCTTACTTTGGGGACAAACATTATTGTTTCACAAAATTGGTTAGCTACTAATAGTTTATTGCCTTACCTGTAATCTCTCAAACTTCATACACGTTTTTGTGTTAATCTTTTATATTTCATTTTTAATTTAGGTTTCGGTTTCATCGATGGATGTTGGTGTTGTACTCGAATCAACAATAAGTGACATCTCAATGTCCCACTCAAAGTCGCCAATAGGGACAACTGACCTATTTCCTCCCCTTCCCATGCCTTCACATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATACAGGGAGAAAAAGAAGACAAGAAAATTTGAGAAGAAAATAAGGTATGCCTCAAGGAAGGCCTATGCAGAGACTAGACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACCGATGTAGAAGCTGAAGTGGACCAGATGTTCTCCACAACACTATTCACTGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAGAATGGAAAGAAAGTAATGGCCAGGCCATAAAAGAGAAGGTT-3'

Gmcol2a-78突变体中突变后的编码序列(CDS)

5'-CATGCGTACTGTACTGCCATGCAGACTCAGCATACCTTTGCTCATCCTGCGATGCT CGTGTCCATGCGGCTAACCGTGTGGCCTCAAGACACGAGCGTGTGTGGGTGTGCGAAGCGTGTGAACGTGCTCCCGCAGCGTTTCTATGCAAAGCCGACGCAGCTTCTCTTTGTTCTTCCTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACCACCGCGTGCCCATTCTCCCGATCTCTGGTTCCCTCTTCGGGGAACCAGAGCATGAACGCGTGTACGCGTTCGTGAATGAAGTGGAAGCGGAGGAGGAAGAGGAAGAGGTTTTTGATGAGTATGATGAGGTTGAAGCAGCTTCGTGGTTGTTGCCACATCCTATGAAAAATGATAAAATTGACGAGAATGGTGGTGATAAGGGTTTTTTGTTTGGTGATGAGTATTTCGACAACCTTGTTGATTGTAACTCATGTGGTCACAATAACAACCAGTTTAGCAACGTTTATGATCAGCACCAGCAGAATTACAGCAACACTGTCCCTCAGAACTATGCAGTGGTTCCAGTTCAGGTGCCGCAGCATTTTCAACCGGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGATGGTTCTCTTAGTCAAAGTGTTTCGGTTTCATCGATGGATGTTGGTGTTGTACTCGAATCAACAATAAGTGACATCTCAATGTCCCACTCAAAGTCGCCAATAGGGACAACTGACCTATTTCCTCCCCTTCCCATGCCTTCACATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATACAGGGAGAAAAAGAAGACAAGAAAATTTGAGAAGAAAATAAGGTATGCCTCAAGGAAGGCCTATGCAGAGACTAGACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACCGATGTAGAAGCTGAAGTGGACCAGATGTTCTCCACAACACTATTCACTGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAG-3'

Gmcol2a-78突变体中突变后的氨基酸序列

MRTVLPCRLSIPLLILRCSCPCG

Gmcol2b-35突变体中突变后的基因组序列

5'-TAAAAAAAAAGTATCATATTTAGAGAGACTAAAAGATTATTTAAGTCAAAAAATA ATTTTTGTTTAGCATTTGTTCTCACCGAGTTCTAGGCAAGTGATCCGTCTTCGTCTTCCCTTTAGTAGTTGAACAGGTCAATTGGTTAAACCACAGATTGATGGAAGTGATATAATGATTAAATATGCGATATATATTACTTGTGTCACATATTAATGAAATTGTGCGGATGGTCTAGTGGTAAATATACTAGAAAGATTTTCCTAGACAAAGATCGACTCTATGGTTGGTAATTTACTTTTACAATTTCCTTAAAATAGTCAAGTAACTAGCTGTAAACCTCAGCAAATTTAGTACTTGGAGCAACTATGAACAATTAATGATATTTATTTTAAACATTCCACCTTAATTAACATCTTAGTTCTC

CAAACTCCACCAACCAAAAATTTCTATTTATTTTCATAATCACAAGCACTCCACATTCTAT

CTGCAAAATCAGTAATTAACCAAACACTTGCTTTAATCCTTTTAGAGCCAATAAGATTAC

TGAGAGGAAAGGATATATTAAGGGGTAACAAGAGATTCTAACTGGTGCAAGTATAGAAT

CTACATGGACCCAAATGACACGTGTCTCCAAGTTGTGTCACCATAGCAATACGAACAAA

GCCTCAGCATCTCTTTAATGATTCCAAAAGGCAAAGAAGCAACATGCATGGACAGGTCC

AACACCAAAACAAAAAACCCTCTCTCCTAATCAACCCTGAAACACAACCAACCACAAG

ATAAGCAAGAACTTGTGCACGCCACTAACTTGCTGCCACGTTGGCACTCTTGATTCTCCC

CCCAACACTACTTGGTTCACCTCACTAAACTCAATTTCTCACTCACACTCACTTCAGTTC

AATTCACTTCCCTTCCTCCAAATTAGTTCCAACACAAAAACCAAGCAAAGAAAAAGACT

CTACCGAAACACTTCACTACTCATACAATATTTTCAGACACAACATGTTGAAGGAAGGC

ACCAACAACGTTGGTGGCAGCAACACTGGCACACCTGGTCACGTGTCTGTGACACGTG

CCTGTCTGCGCCATGCGTGCTGTACTGCCATGCAGACTCAGCATATCTTTGCTCTTCCTGT

GATGCTCGTGTGCATGCAGCTAACCGTGTGGCCTCGAGACACAAGCGTGTGTGGGTGTG

CGAAGCGTGTGAGCGTGCTCCGGCGGCGTTTCTATGCAAAGCTGACGCAGCTTCTCTTT

GTTCTTCCTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACAACCGTG

TTCCCATTCTCCCGATCTCAGGTTCCCTCTTCAGGGAACCAGAGCACAATCACAAACGC

GTGGAACACGCGTTCGTGAATGAGGTTGAGGAGGAAGAGGAAGGGGTTTTTGATGAGT

ATGAAGACGAGGTTGAAGCTGCTTCGTGGTTGTTGCCACATCCTATGAAAAATAATGATG

AAATTGAGGAGAATGATTGTGGTGACGAGGGTTTTTTGTTTGTTGATGAGTATTTGGACA

ATCTTGTTGATTGTTGTAACTCATGTGGTCACAATGACAACCAGTTTAGCAACGTTTATC

AGCACCAGCAGAATTACAACACTGTCCCTCAGAACTATGTAGTGGTTCCAGTTCAGGTG

CCGCAGCATTTTCAACCCGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGAT

GGTTCTCTTAGTCAAAGTGTAAGACTCTTCTTTTCAATTACTTCTGTGTTTCTTTTTCGGT

TTGTTTTTTATATGAATAGTGTTTTCCCTTTTTCTCTTTCTTTTTCTTTTCCCAGACTCTTTG

GATCATTCATCCATTGGATTATACTTTATCAGATTTTGATTTTGCCTTGACACCTTTGCTAA

CTCTTCCTTCCAATTGGCAGTTTCTTTCCTTTCTCCGTTCATATGAAACTAGGGTTTTAAA

TTATACTCATGATCAATAATTTGGTTGCAATTTTTGATATTGTAGTACAATTGCTATTGTTG

TTGTGAAAAGTTAAAAAAATCTTAATGTTGTAACCGAAATCTCAATCACATACTGTTTGT

AAAATCCTTGGTTGAAATCAAAGTGGGTTTCCCAAGTAGCTTCTTTTACTAGAAACGCTA

GCAAAGTCAACTACTCTAGTTCAATTGCCATATATGTGACTAATTTGATTCATTCCACAAC

TCTTCATATTTCTTTGACTACCCTTTTACCGTTCACTTTGCGGTCTTGAGAGACTTTTATTT

ATTTTCTTTTTTGTCGTATATAAGATCAGCTTTGCCTTTATGGTGTCTTTTATTTGCTAGTTA

TAGTTGTGATTCCTCTTAAACTTTGTTTCCTCATTTCATCAACTGTATATTAATTTCCCATA

ATTTTTCAGCTTCAATTAAAAAAATTGAGCCTAAGTGCCTGATTTATTAAAGCCACAAAA

TGGGTGGTTTAATTTTTTCGACACCTTTCTTTTATATTTCTTTTACTCTTCTTCTCTTTTCTT

TTTCTATTACATCATCTATAATATATCTTCACCTTTTTCTTCTTACTTTGGGGACAAACATTT

TTGTTTCACAAAGCTGGTTAGCTACTAGTTTATTGCTTAGAAAATTTATAGCCTTACCTGT

GATCTCTCAAACTTCATACACGATTTTGTGTTAATCTTTTATATTTCATTTTTAATTTAGGTT

TCGGTTTCATCAATGGATGTTGGAGTTGTACCCGAATCAACAGTAAGTGGCATCTCAATG

TCCCACTCAAAGTCACCAATAGGGACAAATGACCTATTTCCTCCCCTTCTCATGCCTTCA

CATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATATAGGGAGAAAAAGAAGA

CAAGAAAGTTCGAGAAGAAAATAAGATATGCCTCAAGGAAGGCCTATGCAGAGACTAG

ACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACTGATGTAGAAGCTGAAGTGGATCAGA

TGTTCTCCACAAAACTATTCAATGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAGAATG

GAAAGAAAGTAATTGCCAAGCCATAGAAGAGAAGGTTGGGAACCACACATCATTGGAA

GAACTTCATGTAATTTTTATGTAGTCTAATTAGTTTGGTATTATATTTACTTCTATCTTGTGCTTTATAAATATAAAGTAT-3'

Gmcol2b-35突变体中突变后的编码序列(CDS)

5'-ATGTTGAAGGAAGGCACCAACAACGTTGGTGGCAGCAACACTGGCACACCTGG TCACGTGTCTGTGACACGTGCCTGTCTGCGCCATGCGTGCTGTACTGCCATGCAGACTCAGCATATCTTTGCTCTTCCTGTGATGCTCGTGTGCATGCAGCTAACCGTGTGGCCTCGAGACACAAGCGTGTGTGGGTGTGCGAAGCGTGTGAGCGTGCTCCGGCGGCGTTTCTATGCAAAGCTGACGCAGCTTCTCTTTGTTCTTCCTGTGATGCTGACATTCACTCAGCAAACCCTCTCGCTAGCCGCCACAACCGTGTTCCCATTCTCCCGATCTCAGGTTCCCTCTTCAGGGAACCAGAGCACAATCACAAACGCGTGGAACACGCGTTCGTGAATGAGGTTGAGGAGGAAGAGGAAGGGGTTTTTGATGAGTATGAAGACGAGGTTGAAGCTGCTTCGTGGTTGTTGCCACATCCTATGAAAAATAATGATGAAATTGAGGAGAATGATTGTGGTGACGAGGGTTTTTTGTTTGTTGATGAGTATTTGGACAATCTTGTTGATTGTTGTAACTCATGTGGTCACAATGACAACCAGTTTAGCAACGTTTATCAGCACCAGCAGAATTACAACACTGTCCCTCAGAACTATGTAGTGGTTCCAGTTCAGGTGCCGCAGCATTTTCAACCCGGTTTGGACTTTGACTCATCAAAAGCTGGGTTCAGTTACGATGGTTCTCTTAGTCAAAGTGTTTCGGTTTCATCAATGGATGTTGGAGTTGTACCCGAATCAACAGTAAGTGGCATCTCAATGTCCCACTCAAAGTCACCAATAGGGACAAATGACCTATTTCCTCCCCTTCTCATGCCTTCACATCTCACACCAATGGACAGAGAGGCAAGAGTCCTAAGATATAGGGAGAAAAAGAAGACAAGAAAGTTCGAGAAGAAAATAAGATATGCCTCAAGGAAGGCCTATGCAGAGACTAGACCCCGCATAAAGGGTCGTTTTGCAAAGAGAACTGATGTAGAAGCTGAAGTGGATCAGATGTTCTCCACAAAACTATTCAATGAAGTTGGAGGTAGCATTTTTCCCACTTTCTAG-3'

Gmcol2b-35突变体中突变后的氨基酸序列

MLKEGTNNVGGSNTGTPGHVSVTRACLRHACCTAMQTQHIFALPVMLVCMQLTVWPRDTSVCGCAKRVSVLRRRFYAKLTQLLFVLPVMLTFTQQTLSLAATTVFPFSRSQVPSSGNQSTITNAWNTRS

以上对本发明进行了详述。对于本领域技术人员来说，在不脱离本发明的宗旨和范围，以及无需进行不必要的实验情况下，可在等同参数、浓度和条件下，在较宽范围内实施本发明。虽然本发明给出了特殊的实施例，应该理解为，可以对本发明作进一步的改进。总之，按本发明的原理，本申请欲包括任何变更、用途或对本发明的改进，包括脱离了本申请中已公开范围，而用本领域已知的常规技术进行的改变。

Claims

1.应用，其特征在于，所述应用为蛋白质或抑制或降低或下调所述蛋白质的编码基因表达的物质或抑制或降低或下调所述蛋白质活性或/和含量的物质在下述任一种中的应用：

D1)提高大豆产量；

D2)降低大豆株高；

D2)制备降低大豆株高的产品；

D3)培育半矮杆大豆；

D4)制备培育半矮杆大豆的产品；

D5)改良半矮杆大豆或制备半矮杆大豆的产品；

D6)增加大豆单株荚数；

D7)制备增加大豆单株荚数的产品；

D8)培育单株荚数增加的大豆；

D9)制备培育单株荚数增加的大豆的产品；

D10)增加大豆单株粒数；

D11)制备增加大豆单株粒数的产品；

D12)培育单株粒数增加的大豆；

D13)制备培育单株粒数增加的大豆的产品；

D14)大豆育种；

所述蛋白质为下述任一种，

A1)氨基酸序列是SEQ ID No.2的蛋白质；

2.根据权利要求1所述的应用，其特征在于，A2)所述蛋白质为氨基酸序列是SEQ IDNo.4的蛋白质。

3.根据权利要求1或2所述的应用，其特征在于，所述物质为生物材料，所述生物材料为下述任一种：

B1)、核酸分子；

B2)、表达B1)所述核酸分子的基因；

B3)、含有B2)所述基因的表达盒；

4.根据权利要求2或3所述的应用，其特征在于，B1)所述核酸分子为gRNA，所述gRNA的靶标为所述蛋白质的编码基因。

5.提高大豆产量、降低大豆株高、增加大豆单株荚数或/和增加大豆粒数的方法，包括下调或降低或减弱目的大豆中权利要求1或权利要求2中所述蛋白质的编码基因的表达量或所述蛋白质的含量得到转基因大豆，所述转基因大豆的株高低于所述目的大豆，所述转基因大豆的单株荚数和豆单株粒数高于所述目的大豆。

6.根据权利要求5所述的方法，其特征在于，所述上调或增强或提高目的大豆中权利要求1或权利要求2中所述蛋白质的编码基因的表达量或所述蛋白质的含量为将权利要求1或权利要求2中所述蛋白质的编码基因导入所述目的大豆。

7.权利要求1或权利要求2中所述的蛋白质。

8.生物材料，其特征在于，所述生物材料为下述任一种：

B1)、编码权利要求1或权利要求2中所述蛋白质的核酸分子；

B2)、含有B1)所述核酸分子的表达盒；

B5)、抑制或降低或下调权利要求1或权利要求2中所述蛋白质的编码基因的表达的核酸分子或抑制或降低或下调所述蛋白质的活性或含量的核酸分子；

B6)、表达B5)所述核酸分子的编码基因；

B7)、含有B6)所述基因的表达盒；

9.根据权利要求8所述的生物材料，其特征在于，B1)所述核酸分子如C1)、C2)或C3)所示的所述蛋白质的编码基因：

C1)编码序列是SEQ ID No.1或SEQ ID No.3的cDNA分子或DNA分子；