CN116615547A - 用于对货物核苷酸序列转座的系统和方法 - Google Patents

用于对货物核苷酸序列转座的系统和方法 Download PDF

Info

Publication number
CN116615547A
CN116615547A CN202180079027.2A CN202180079027A CN116615547A CN 116615547 A CN116615547 A CN 116615547A CN 202180079027 A CN202180079027 A CN 202180079027A CN 116615547 A CN116615547 A CN 116615547A
Authority
CN
China
Prior art keywords
leu
sequence
lys
arg
gln
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180079027.2A
Other languages
English (en)
Inventor
布莱恩·托马斯
克利斯多佛·布朗
丹妮拉·S·A·戈尔茨曼
克里斯蒂娜·布特弗尔德
利萨·亚历山大
詹森·刘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Macrogenomics
Original Assignee
Macrogenomics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Macrogenomics filed Critical Macrogenomics
Priority claimed from PCT/US2021/047196 external-priority patent/WO2022066335A1/en
Publication of CN116615547A publication Critical patent/CN116615547A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本公开内容提供了用于将货物核苷酸序列转座到靶核酸位点的系统和方法。这些系统和方法可以包括包含所述货物核苷酸序列的第一双链核酸,其中所述货物核苷酸序列被配置为与重组酶复合物相互作用;包含cas效应子和至少一种工程化向导多核苷酸的cas效应子复合物,所述工程化向导多核苷酸被配置为与所述靶核酸位点杂交;和所述重组酶复合物,其中所述重组酶复合物被配置为将所述货物核苷酸募集到所述靶核酸位点。

Description

用于对货物核苷酸序列转座的系统和方法
相关申请
本申请要求于2020年9月24日提交的标题为“SYSTEMS AND METHODS FORTRANSPOSING CARGO NUCLEOTIDE SEQUENCES”的美国临时申请号63/082,983、于2021年5月11日提交的标题为“SYSTEMS AND METHODS FOR TRANSPOSING CARGO NUCLEOTIDESEQUENCES”的美国临时申请号63/187,290以及于2021年8月12日提交的标题为“SYSTEMSAND METHODS FOR TRANSPOSING CARGO NUCLEOTIDE SEQUENCES”的美国临时申请号63/232,578的权益,其中的每一个通过引用以其全文并入本文。
背景技术
Cas酶及其相关的簇状规则间隔短回文重复序列(Clustered RegularlyInterspaced Short Palindromic Repeat,CRISPR)向导核糖核酸(RNA)似乎是原核免疫系统中普遍存在的(约45%的细菌,约84%的古生菌)组分,用于通过CRISPR-RNA导向的核酸切割来保护此类微生物免受非自身核酸诸如传染性病毒和质粒的伤害。虽然编码CRISPRRNA元件的脱氧核糖核酸(DNA)元件在结构和长度上可能相对保守,但其CRISPR相关(Cas)蛋白具有高度多样性,含有多种核酸相互作用结构域。虽然早在1987年就已经观察到CRISPR DNA元件,但CRISPR/Cas复合物的可编程核酸内切酶切割能力直到最近才被认识到,这使得重组CRISPR/Cas系统在不同的DNA操纵和基因编辑应用中得到使用。
序列表
本申请包含序列表,其已按ASCII格式以电子方式递交并且特此通过引用以其全文并入。所述ASCII副本创建于2021年8月20日,名称为55921-714_602_SL.txt并且大小为196,492字节。
发明内容
在一些方面,本公开内容提供了一种用于将货物核苷酸序列转座到靶核酸位点的系统,其包括:包含货物核苷酸序列的第一双链核酸,所述货物核苷酸序列被配置为与Tn7型转座酶复合物相互作用;包含II类V型Cas效应子和工程化向导多核苷酸的Cas效应子复合物,所述工程化向导多核苷酸被配置为与所述靶核苷酸序列杂交;和被配置为结合所述Cas效应子复合物的Tn7型转座酶复合物,其中所述Tn7型转座酶复合物包含TnsB亚基。在一些实施方案中,所述货物核苷酸序列与左侧转座酶识别序列和右侧转座酶识别序列侧接。在一些实施方案中,所述系统还包括包含所述靶核酸位点的第二双链核酸。在一些实施方案中,所述系统还包括与所述靶核酸位点相邻的PAM序列,所述PAM序列与所述Cas效应子复合物相容。在一些实施方案中,所述PAM序列位于所述靶核酸位点的3’处。在一些实施方案中,所述PAM序列位于所述靶核酸位点的5’处。在一些实施方案中,所述工程化向导多核苷酸被配置为结合所述II类V型Cas效应子。在一些实施方案中,所述II类V型Cas效应子包含多肽,所述多肽包含与SEQ ID NO:1、12、16、20-30、64或80-85或其变体具有至少80%同一性的序列。在一些实施方案中,所述TnsB亚基包含多肽,所述多肽具有与SEQ ID NO:2、13、17或65或其变体具有至少80%同一性的序列。在一些实施方案中,所述Tn7型转座酶复合物包含至少一种或至少两种三种多肽,所述多肽包含与SEQ ID NO:3-4、14-15、18-19或66-67中的任一个或其变体具有至少80%同一性的序列。在一些实施方案中,所述工程化向导多核苷酸包含序列,所述序列包含与SEQ ID NO:5-6、32-33、94-95或104-105中的任一个或其变体具有至少80%同一性的至少约46-80个连续核苷酸。在一些实施方案中,所述工程化向导多核苷酸包含与SEQ ID NO:106、107、108、5、45-63、68-75或96-103中任一个或其变体的非简并核苷酸具有至少80%序列同一性的序列。在一些实施方案中,所述左侧重组酶序列包含与SEQ ID NO:9、11、36-38、76或78或其变体具有至少80%同一性的序列。在一些实施方案中,所述右侧重组酶序列包含与SEQ ID NO:8、10、39-44、77、79或93或其变体具有至少80%同一性的序列。在一些实施方案中,所述II类V型Cas效应子和所述Tn7型转座酶复合物由包含少于约10千碱基的多核苷酸序列编码。
在一些方面,本公开内容提供了一种用于将货物核苷酸序列转座到包含靶核苷酸序列的靶核酸位点的方法,其包括在细胞内表达本文所述的方面或实施方案中任一个的系统或将本文所述的方面或实施方案中任一个的系统引入细胞中。
在一些方面,本公开内容提供了一种用于将货物核苷酸序列转座到靶核酸位点的方法,其包括使包含所述货物核苷酸序列的第一双链核酸与以下接触:包含II类V型Cas效应子和至少一种工程化向导多核苷酸的Cas效应子复合物,所述工程化向导多核苷酸被配置为与所述靶核苷酸序列杂交;被配置为结合所述Cas效应子复合物的Tn7型转座酶复合物,其中所述Tn7型转座酶复合物包含TnsB亚基;和包含所述靶核酸位点的第二双链核酸。在一些实施方案中,所述货物核苷酸序列与左侧转座酶识别序列和右侧转座酶识别序列侧接。在一些实施方案中,所述系统还包括与所述靶核酸位点相邻的PAM序列,所述PAM序列与所述Cas效应子复合物相容。在一些实施方案中,所述PAM序列位于所述靶核酸位点的3’处。在一些实施方案中,所述工程化向导多核苷酸被配置为结合所述II类V型Cas效应子。在一些实施方案中,所述II类V型Cas效应子包含多肽,所述多肽包含与SEQ ID NO:1、12、16、20-30、64或80-85或其变体具有至少80%同一性的序列。在一些实施方案中,所述TnsB亚基包含多肽,所述多肽具有与SEQ ID NO:2、13、17或65或其变体具有至少80%同一性的序列。在一些实施方案中,所述Tn7型转座酶复合物包含至少一种或至少两种多肽,所述多肽包含与SEQ ID NO:3-4、14-15、18-19或66-67中的任一个或其变体具有至少80%同一性的序列。在一些实施方案中,所述工程化向导多核苷酸包含序列,所述序列包含与SEQ ID NO:5-6、32-33、94-95或104-105中的任一个或其变体具有至少80%同一性的至少约46-80个连续核苷酸。在一些实施方案中,所述左侧重组酶序列包含与SEQ ID NO:9、11、36-38、76或78或其变体具有至少80%同一性的序列。在一些实施方案中,所述右侧重组酶序列包含与SEQ IDNO:8、10、39-44、77、79或93或其变体具有至少80%同一性的序列。在一些实施方案中,所述II类V型Cas效应子和所述Tn7型转座酶复合物由包含少于约10千碱基的多核苷酸序列编码。
在一些方面,本公开内容提供了一种用于将货物核苷酸序列转座到靶核酸位点的系统,其包括:包含货物核苷酸序列的第一双链核酸,所述货物核苷酸序列被配置为与Tn7型转座酶复合物相互作用;包含II类V型Cas效应子和工程化向导多核苷酸的Cas效应子复合物,所述工程化向导多核苷酸被配置为与所述靶核苷酸序列杂交;和被配置为结合所述Cas效应子复合物的Tn7型转座酶复合物,其中所述Tn7型转座酶复合物包含TnsB、TnsC和TniQ组分,其中:(a)所述II类V型Cas效应子包含多肽,所述多肽具有与SEQ ID NO:1、12、16、20-30、64或80-85中的任一个或其变体具有至少80%序列同一性的序列;或者(b)所述Tn7型转座酶复合物包含具有与SEQ ID NO:2-4、13-15、17-19或65-67中的任一个或其变体具有至少80%序列同一性的序列的TnsB、TnsC或TniQ组分。在一些实施方案中,所述转座酶复合物与所述Cas效应子复合物非共价结合。在一些实施方案中,所述转座酶复合物与所述Cas效应子复合物共价连接。在一些实施方案中,所述转座酶复合物与所述Cas效应子复合物在单个多肽中融合。在一些实施方案中,所述II类V型Cas效应子包含多肽,所述多肽具有与SEQ ID NO:1、12、16、20-30、64或80-85中的任一个或其变体具有至少80%序列同一性的序列。在一些实施方案中,所述Tn7型转座酶复合物包含具有与SEQ ID NO:2-4、13-15、17-19或65-67中的任一个或其变体具有至少80%序列同一性的序列的TnsB、TnsC或TniQ组分。在一些实施方案中,所述II类V型Cas效应子是Cas12k效应子。在一些实施方案中,所述货物核苷酸序列与左侧转座酶识别序列和右侧转座酶识别序列侧接。在一些实施方案中,所述系统还包括包含所述靶核酸位点的第二双链核酸。在一些实施方案中,所述系统还包括与所述靶核酸位点相邻的PAM序列,所述PAM序列与所述Cas效应子复合物相容。在一些实施方案中,所述PAM序列位于所述靶核酸位点的5’或3’处。在一些实施方案中,所述PAM序列包含SEQ ID NO:31。在一些实施方案中,所述工程化向导多核苷酸被配置为结合所述II类V型Cas效应子。在一些实施方案中,所述工程化向导多核苷酸包含序列,所述序列包含与SEQID NO:5-6、32-33、94-95或104-105中的任一个或其变体具有至少80%同一性的至少约46-80个连续核苷酸。在一些实施方案中,所述工程化向导多核苷酸包含与SEQ ID NO:106、107、108、5、45-63、68-75或96-103中任一个或其变体的非简并核苷酸具有至少80%序列同一性的序列。在一些实施方案中,所述左侧重组酶序列包含与SEQ ID NO:9、11、36-38、76或78中的任一个或其变体具有至少80%同一性的序列。在一些实施方案中,所述右侧重组酶序列包含与SEQ ID NO:8、10、39-44、77、79或93中的任一个具有至少80%同一性的序列。在一些实施方案中,所述II类V型Cas效应子和所述Tn7型转座酶复合物由包含少于约10千碱基的多核苷酸序列编码。在一些实施方案中:(a)所述II类V型Cas效应子包含与SEQ ID NO:1、81、82、83或85中的任一个或其变体具有至少80%序列同一性的序列;(b)所述左侧重组酶序列包含与SEQ ID NO:9、11、36、37或38中的任一个或其变体具有至少80%序列同一性的序列;(c)所述右侧重组酶序列包含与SEQ ID NO:8、39、40、41、42、43、44或93中的任一个或其变体具有至少80%同一性的序列;(d)所述工程化向导多核苷酸:(i)包含与SEQ IDNO:6或其变体的至少约46-80个核苷酸具有至少80%序列同一性的序列;或(ii)包含与SEQID NO:5、45-63、68-75或96-103中任一个或体变体的非简并核苷酸具有至少80%同一性的序列;(e)所述TnsB、TnsC和TniQ组分包含多肽,所述多肽具有与SEQ ID NO:2-4或其变体具有至少80%同一性的序列;或者(f)所述PAM序列包含SEQ ID NO:31。在一些实施方案中:(a)所述II类V型Cas效应子包含与SEQ ID NO:12或其变体具有至少80%序列同一性的序列;(b)所述左侧重组酶序列包含与SEQ ID NO:76或其变体具有至少80%序列同一性的序列;(c)所述右侧重组酶序列包含与SEQ ID NO:77或其变体具有至少80%同一性的序列;(d)所述工程化向导多核苷酸:(i)包含与SEQ ID NO:32或104或其变体的至少约46-80个核苷酸具有至少80%序列同一性的序列;或(ii)包含与SEQ ID NO:107或102中任一个或其变体的非简并核苷酸具有至少80%同一性的序列;或者(e)所述TnsB、TnsC和TniQ组分包含多肽,所述多肽具有与SEQ ID NO:13-15或其变体具有至少80%同一性的序列。在一些实施方案中:(a)所述II类V型Cas效应子包含与SEQ ID NO:16或其变体具有至少80%序列同一性的序列;(b)所述左侧重组酶序列包含与SEQ ID NO:78或其变体具有至少80%序列同一性的序列;(c)所述右侧重组酶序列包含与SEQ ID NO:79或其变体具有至少80%同一性的序列;(d)所述工程化向导多核苷酸:(i)包含与SEQ ID NO:33或105或其变体的至少约46-80个核苷酸具有至少80%序列同一性的序列;或(ii)包含与SEQ ID NO:108或103中任一个或其变体的非简并核苷酸具有至少80%同一性的序列;或者(e)所述TnsB、TnsC和TniQ组分包含多肽,所述多肽具有与SEQ ID NO:17-19或其变体具有至少80%同一性的序列。
在一些方面,本公开内容提供了一种工程化核酸酶系统,其包括:包含RuvC结构域的核酸内切酶,其中所述核酸内切酶来源于未培养微生物,并且其中所述核酸内切酶是与SEQ ID NO:1、12、16、20-30、64或80-85中的任一个或其变体具有至少80%同一性的II类V-K型Cas效应子;和工程化向导RNA,其中所述工程化向导RNA被配置为与所述核酸内切酶形成复合物,并且所述工程化向导RNA包含被配置为与靶核酸序列杂交的间隔子序列。在一些实施方案中,所述工程化向导多核苷酸包含序列,所述序列包含与SEQ ID NO:5-6、32-33、94-95或104-105中的任一个或其变体具有至少80%同一性的至少约46-80个连续核苷酸。在一些实施方案中,所述工程化向导多核苷酸包含与SEQ ID NO:106、107、108、5、45-63、68-75或96-103中任一个或其变体的非简并核苷酸具有至少80%同一性的序列。在一些实施方案中,所述系统还包括与所述靶核酸位点相邻的PAM序列,所述PAM序列与所述Cas效应子复合物相容。在一些实施方案中,所述PAM序列位于所述靶核酸位点的5’处。在一些实施方案中,所述PAM序列包含SEQ ID NO:31。在一些实施方案中:(a)所述II类V-K型Cas效应子包含与SEQ ID NO:1、81、82、83或85中的任一个或其变体具有至少80%序列同一性的序列;(b)所述左侧重组酶序列包含与SEQ ID NO:9、11、36、37或38中的任一个或其变体具有至少80%序列同一性的序列;(c)所述右侧重组酶序列包含与SEQ ID NO:8、39、40、41、42、43、44或93中的任一个或其变体具有至少80%同一性的序列;(d)所述工程化向导多核苷酸:(i)包含与SEQ ID NO:6或其变体的至少约46-80个核苷酸具有至少80%序列同一性的序列;或(ii)包含与SEQ ID NO:5、45-63、68-75或96-103中任一个或体变体的非简并核苷酸具有至少80%同一性的序列;(e)所述TnsB、TnsC和TniQ组分包含多肽,所述多肽具有与SEQ IDNO:2-4或其变体具有至少80%同一性的序列;或者(f)所述PAM序列包含SEQ ID NO:31。
根据其中仅示出和描述了本公开内容的说明性实施方案的以下具体描述,本公开内容的另外的方面和优点对于本领域技术人员将显而易见。如将会理解的,本公开内容能够具有其他的和不同的实施方案,并且其若干细节能够在各个明显的方面进行修改,所有这些都不背离本公开内容。因此,附图和说明书将在本质上被视为是说明性的而非限制性的。
援引并入
本说明书中所提及的所有出版物、专利和专利申请均通过引用并入本文,其程度犹如具体地且单独地指出每个单独的出版物、专利或专利申请均通过引用并入。
附图说明
本发明的新颖特征在所附权利要求书中具体阐述。将通过参考阐述了其中利用本发明原理的说明性实施方案的以下具体实施方式和附图(在本文中也称为“图(Figure)”和“图(FIG.)”)获得对本发明的特征和优点的更好的理解,在所述附图中:
图1描绘了不同类和型的CRISPR/Cas基因座的典型组织。
图2描绘了与其中crRNA和tracrRNA联结的杂交sgRNA相比,例如针对Cas9示出的天然II类II型crRNA/tracrRNA对的架构。
图3描绘了在Tn7和Tn7样元件中发现的两种途径。
图4描绘了MG64家族的V型Tn7 CAST的基因组背景。A)顶部:MG64-1 CAST系统由CRISPR阵列(CRISPR重复序列)、V型核酸酶和三个预测的转座酶蛋白质序列组成。预测tracrRNA在CAST效应子与CRISPR阵列之间的基因间区域中。底部:转座酶TnsB的催化结构域的多序列比对。催化残基通过框指示。B)预测了MG64-1CAST系统的两个转座子末端。
图5描绘了本文所述的CAST系统的对应sgRNA的预测结构。图5A(左侧)示出了在重复序列-反重复序列茎处预测的MG64-1tracrRNA和crRNA双链体复合物。将环截短,并且将GAAA的四元环添加到茎环结构中,以产生图5B(右侧)中所示的设计的sgRNA。
图6描绘了靶向至由靶间隔子序列的5’处的NNNNNNNN组成的质粒文库的转座反应的结果。反应#1指示存在靶文库,#2示出两个转座反应中存在供体片段,#3-5示出对应于适当的转座反应的sg特异性PCR条带。
图7描绘了Sanger测序的结果。图7A示出了LE更接近PAM的转座反应中转座子左端(LE)上供体靶标接合点的Sanger测序。预期的序列位于图的顶部,其中预测的转座事件距离PAM 61bp。顶部色谱图是从供体片段内开始的测序结果。在右端上可以看到清晰的信号,直至供体/靶标接合点(虚线)。这代表转座产物的混合物。图的底部色谱图是从靶标至供体/靶标接合点的测序。左侧的信号是清晰的信号,直至接合点。图7B示出了LE更接近PAM的产物中转座子右端(RE)上供体靶标接合点的Sanger测序。预期的序列位于图的顶部,其中预测的转座事件距离PAM 61bp。顶部色谱图是从供体片段内开始的测序结果。在左端上可以看到清晰的信号,直至供体/靶标接合点(虚线)。图7C是PAM文库的特写。图7D是对于LE更接近PAM的事件的NGS的SeqLogo分析,其指示PAM基序中对NGTN的非常强烈的偏好。
图8描绘了Cas12k效应子序列的系统发育基因树。该树是从在此回收的64个Cas12k序列(橙色和黑色分支)和来自公共数据库的229个参考Cas12k序列(灰色分支)的多序列比对中推断出来的。橙色分支指示确认与CAST转座子组分缔合的Cas12k效应子。
图9示出了MG64家族CRISPR重复序列比对。Cas12k CAST CRISPR重复序列含有保守基序5’-GNNGGNNTGAAAG-3’。在MG64-1中,CRISPR重复序列基序内的短重复序列-反重复序列(RAR)与tracrRNA对齐。MG64 RAR基序似乎定义了tracrRNA的开始和末端(5’末端:RAR1(TTTC);3’末端:RAR2(CCNNC))。
图10A和图10B描绘了通过折叠MG64系统的CRISPR重复序列+tracrRNA预测的二级结构。
图11A描绘了MG64-3 CRISPR基因座。tracrRNA在CRISPR阵列的上游编码,而转座子末端在下游编码(黑色内框)。对应于部分3’CRISPR重复序列和部分间隔子的序列在转座子内编码(外框)。自匹配间隔子在转座子末端外部编码。图11B描绘了本文提供的各种CAST的tracrRNA序列比对。tracrRNA序列的比对示出了保守区域。具体地,序列位置92-98(顶部框)处的序列“TGCTTTC”被认为对于sgRNA三级结构和与crRNA的非连续重复序列-反重复序列配对是重要的。我们还认为位置265-278(底部框)处的发夹“CYCC(n6)GGRG”对于功能(可能是定位用于crRNA配对的下游序列)是重要的。
图12A描绘了MG64-1 sgRNA的预测结构。图12B描绘了MG64-3sgRNA的预测结构。图12C描绘了MG64-5 sgRNA的预测结构。
图13描绘了PCR数据,其表明MG64-1对sgRNA v2-1具有活性。使用针对体外靶向整合酶活性所述的方案,在体外转录/翻译系统中表达效应蛋白及其TnsB、TnsC和TniQ蛋白。在翻译之后,将靶DNA、货物DNA和sgRNA添加在反应缓冲液中。通过跨靶标/供体接合点的PCR测定整合。图13A描绘了说明整合供体DNA的潜在取向的图表。PCR反应3、4、5和6代表每种整合连接产物,取决于供体在靶位点处整合的取向。图13B描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像,其显示:泳道1)apo(没有sgRNA),泳道2)具有sgRNA 1,和泳道3)具有sgRNA v2-1。图13C描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像,其显示:泳道1)apo(没有sgRNA),泳道2)具有sgRNA 1,和泳道3)具有sgRNA v2-1。
图14描绘了针对MG64-1的序列和距PAM的距离绘制的PCR反应5(LE在PAM近端,图的上半部分)和PCR反应4(RE在PAM远端,图的下半部分)。对整合窗口的分析指示,在间隔子PAM位点处发生的整合中有95%在距离PAM的58与68个核苷酸之间的10bp窗口内。远端与近端频率之间整合距离的差异反映了整合位点重复-由于整合时转座酶的交错核酸酶活性而导致的3-5个碱基对重复。
图15描绘了转座效率的菌落PCR筛选的结果。在温育之后,18个菌落形成单位(CFU)在板上可见;8个在板A(没有IPTG,泳道标记为A)上并且10个在板B(回收时具有100μMIPTG,泳道标记为B)上。所有18个菌落形成单位都通过菌落PCR进行分析,其给出指示成功的转座反应的产物条带(箭头)。
图16描绘了所选菌落PCR产物的测序结果,其确认它们代表转座事件,因为它们跨越了在lacZ基因中的工程化靶位点处LE与PAM之间的接合点。最小LE序列在筛选顶部以蓝色指示(min LE),而靶标和PAM以灰色指示。在PCR产物中观察到一些序列变化,但是鉴于插入可能发生在PAM上游的不同距离处,这种变化是意料之中的。
图17描绘了工程化单向导的64-1转座活性的测试结果。黑色框是与此实验无关的泳道。图17A描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=sgRNA v1-1,泳道4=sgRNA v1-2,泳道5=sgRNAv1-3。图17B描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=sgRNA v1-1,泳道4=sgRNA v1-2,泳道5=sgRNAv1-3。图17C描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=sgRNA v1-4,泳道4=sgRNA v1-6,泳道5=sgRNAv1-7,泳道6=sgRNA v1-8,泳道7=sgRNA v1-9。图17D描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=sgRNA v1-4,泳道4=sgRNA v1-6,泳道5=sgRNA v1-7,泳道6=sgRNA v1-8,泳道7=sgRNA v1-9。图17E描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=sgRNA v1-5,泳道4=略过,泳道5=sgRNA v1-10。图17F描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=sgRNA v1-5,泳道4=略过,泳道5=sgRNA v1-10。图17G描绘了转座的PCR4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=sgRNAv1-17,泳道4=sgRNA v1-18,泳道5=略过,泳道6=sgRNA v1-19,泳道7=略过,泳道8=sgRNA v1-20。图17H描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=sgRNAv1-17,泳道4=sgRNA v1-18,泳道5=略过,泳道6=sgRNA v1-19,泳道7=略过,泳道8=sgRNA v1-20
图18描绘了工程化LE和RE的64-1转座活性的测试结果。黑色框是与此实验无关的泳道。图18A描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=LE 86bp,泳道4=LE 105bp,泳道5=RE 196bp,泳道6=RE 242bp,泳道7=RE内部缺失50,泳道8=RE内部缺失81。图18B描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=LE 86bp,泳道4=LE 105bp,泳道5=RE 196bp,泳道6=RE 242bp,泳道7=RE内部缺失50,泳道8=RE内部缺失81。图18C描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=RE内部缺失81和178bp,泳道4=略过,泳道5=RE内部缺失81和196bp,泳道6=略过,泳道7=RE内部缺失81和212bp,泳道8=略过。图18D描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=RE内部缺失81和178bp,泳道4=略过,泳道5=RE内部缺失81和196bp,泳道6=略过,泳道7=RE内部缺失81和212bp,泳道8=略过。图18E描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=RE内部缺失81和178bp+LE 68bp,泳道4=RE内部缺失81和178bp+LE86bp,泳道5=略过,泳道6=RE内部缺失81和178bp+LE 105bp,泳道7=略过。图18F描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=RE内部缺失81和178bp+LE 68bp,泳道4=RE内部缺失81和178bp+LE 86bp,泳道5=略过,泳道6=RE内部缺失81和178bp+LE 105bp,泳道7=略过。图18G描绘了转座的PCR 6(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=0bp突出端,泳道4=1bp突出端,泳道5=2bp突出端,泳道6=3bp突出端,泳道7=5bp突出端,泳道8=10bp突出端。
图19描绘了具有NLS的工程化CAST组分的转座活性的测试结果。黑色框是与此实验无关的泳道。图19A描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=略过,泳道4=略过,泳道5=略过,泳道6=NLS-TnsB,泳道7=略过,泳道8=TnsB-NLS。图19B描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=略过,泳道4=略过,泳道5=略过,泳道6=NLS-TnsB,泳道7=略过,泳道8=TnsB-NLS。图19C描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=略过,泳道4=略过,泳道5=略过,泳道6=NLS-TniQ,泳道7=略过,泳道8=TniQ-NLS。图19D描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=略过,泳道4=略过,泳道5=略过,泳道6=NLS-TniQ,泳道7=略过,泳道8=TniQ-NLS。图19E描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=略过,泳道4=略过,泳道5=NLS-Cas12k,泳道6=Cas12k-NLS,泳道7=NLS-TnsC,泳道8=TnsC-NLS。图19F描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=略过,泳道4=略过,泳道5=NLS-Cas12k,泳道6=Cas12k-NLS,泳道7=NLS-TnsC,泳道8=TnsC-NLS。图19G描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=NLS-HA-TnsC,泳道4=NLS-TnsC-FLAG,泳道5=NLS-TnsC-HA,泳道6=NLS-TnsC-Myc,泳道7=NLS-FLAG-TnsC,泳道8=NLS-Myc-TnsC。图19H描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=NLS-HA-TnsC,泳道4=NLS-TnsC-FLAG,泳道5=NLS-TnsC-HA,泳道6=NLS-TnsC-Myc,泳道7=NLS-FLAG-TnsC,泳道8=NLS-Myc-TnsC。图19I描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=Cas 2x NLS apo(没有sgRNA),泳道4=Cas 2x NLS holo(+sgRNA)。图19J描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=Cas 2x NLS apo(没有sgRNA),泳道4=Cas 2x NLSholo(+sgRNA)
图20描绘了充当单个套件的工程化CAST-NLS。除非另外描述,否则所有的泳道都具有Cas12k-NLS和NLS-TniQ、TnsB、TnsC和sgRNA。图20A描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=NLS-TnsB,泳道4=TnsB-NLS,泳道5=NLS-TnsB和NLS-TnsC,泳道6=TnsB-NLS和NLS-TnsC。图20B描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=NLS-TnsB,泳道4=TnsB-NLS,泳道5=NLS-TnsB和NLS-TnsC,泳道6=TnsB-NLS和NLS-TnsC。
图21描绘了Cas效应子和TniQ蛋白融合物的转座活性的测试结果。图21A描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA)与Cas-TniQ融合物,泳道2=holo(+sgRNA)与Cas-TniQ融合物,泳道3=apo(没有sgRNA)与TniQ-Cas融合物,泳道4=holo(+sgRNA)与TniQ-Cas融合物。图21B描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA)与Cas-TniQ融合物,泳道2=holo(+sgRNA)与Cas-TniQ融合物,泳道3=apo(没有sgRNA)与TniQ-Cas融合物,泳道4=holo(+sgRNA)与TniQ-Cas融合物。图21C描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA)与TniQ-Cas融合物,泳道2=holo(+sgRNA)与TniQ-Cas融合物,泳道3=单独的holo Cas,泳道4=apo(没有sgRNA)与TniQ-48接头-Cas融合物,泳道5=holo(+sgRNA)与TniQ-48接头-Cas融合物,泳道6=apo(没有sgRNA)与TniQ-68接头-Cas融合物,泳道7=holo(+sgRNA)与TniQ-68接头-Cas融合物,泳道8=holo(+sgRNA)与TniQ-72接头-Cas融合物。图21D描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA)与TniQ-Cas融合物,泳道2=holo(+sgRNA)与TniQ-Cas融合物,泳道3=单独的holo Cas,泳道4=apo(没有sgRNA)与TniQ-48接头-Cas融合物,泳道5=holo(+sgRNA)与TniQ-48接头-Cas融合物,泳道6=apo(没有sgRNA)与TniQ-68接头-Cas融合物,泳道7=holo(+sgRNA)与TniQ-68接头-Cas融合物,泳道8=holo(+sgRNA)与TniQ-72接头-Cas融合物。图21E描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=apo(没有sgRNA)与NLS-TniQ-Cas-NLS融合物,泳道4=holo(+sgRNA)与NLS-TniQ-Cas-NLS融合物,泳道5=apo(没有sgRNA)与NLS-TniQ-77接头-Cas-NLS融合物,泳道6=holo(+sgRNA)与NLS-TniQ-77接头-Cas-NLS融合物。图21F描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=apo(没有sgRNA)与NLS-TniQ-Cas-NLS融合物,泳道4=holo(+sgRNA)与NLS-TniQ-Cas-NLS融合物,泳道5=apo(没有sgRNA)与NLS-TniQ-77接头-Cas-NLS融合物,泳道6=holo(+sgRNA)与NLS-TniQ-77接头-Cas-NLS融合物。图21G描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=NLS-TniQ-Cas-NLS apo(没有sgRNA),泳道4=NLS-TniQ-Cas-NLS holo(+sgRNA),泳道5=Cas-NLS-P2A-NLS-TniQ apo(没有sgRNA),泳道6=Cas-NLS-P2A-NLS-TniQ holo(+sgRNA)。图21H描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=NLS-TniQ-Cas-NLS apo(没有sgRNA),泳道4=NLS-TniQ-Cas-NLS holo(+sgRNA),泳道5=Cas-NLS-P2A-NLS-TniQ apo(没有sgRNA),泳道6=Cas-NLS-P2A-NLS-TniQholo(+sgRNA)。
图22描绘了TnsB和TnsC在人细胞中表达,接着进行细胞分级分离和体外转座反应的结果。图22A描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=holo(+sgRNA)与未处理的(没有TnsB)细胞质,泳道4=holo(+sgRNA)与未处理的核质,泳道5=holo(+sgRNA)与NLS-TnsB细胞质,泳道6=holo(+sgRNA)与NLS-TnsB细胞核质,泳道7=holo(+sgRNA)与TnsB-NLS细胞质,泳道8=holo(+sgRNA)与TnsB-NLS细胞核质,泳道9=holo(+sgRNA)与NLS-TniQ细胞质,泳道10=holo(+sgRNA)与NLS-TniQ细胞核质。图22B描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=holo(+sgRNA)与未处理的(没有TnsB)细胞质,泳道4=holo(+sgRNA)与未处理的核质,泳道5=holo(+sgRNA)与NLS-TnsB细胞质,泳道6=holo(+sgRNA)与NLS-TnsB细胞核质,泳道7=holo(+sgRNA)与TnsB-NLS细胞质,泳道8=holo(+sgRNA)与TnsB-NLS细胞核质,泳道9=holo(+sgRNA)与NLS-TniQ细胞质,泳道10=holo(+sgRNA)与NLS-TniQ细胞核质。图22C描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=holo(+sgRNA)没有TnsC,泳道4=holo(+sgRNA)与未处理的(没有TnsC)细胞质,泳道5=holo(+sgRNA)与未处理的核质,泳道6=holo(+sgRNA)与NLS-HA-TnsC细胞质,泳道7=holo(+sgRNA)与NLS-HA-TnsC细胞核质,泳道8=holo(+sgRNA)与TnsC-NLS细胞质,泳道9=holo(+sgRNA)与TnsC-NLS细胞核质。图22D描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=holo(+sgRNA)没有TnsC,泳道4=holo(+sgRNA)与未处理的(没有TnsC)细胞质,泳道5=holo(+sgRNA)与未处理的核质,泳道6=holo(+sgRNA)与NLS-HA-TnsC细胞质,泳道7=holo(+sgRNA)与NLS-HA-TnsC细胞核质,泳道8=holo(+sgRNA)与TnsC-NLS细胞质,泳道9=holo(+sgRNA)与TnsC-NLS细胞核质。图22E描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=apo(没有sgRNA)NLS-TnsB-IRES-NLS-TnsC细胞质,泳道4=holo(+sgRNA)NLS-TnsB-IRES-NLS-TnsC细胞质,泳道5=apo(没有sgRNA)NLS-TnsB-IRES-NLS-TnsC核质,泳道6=holo(+sgRNA)NLS-TnsB-IRES-NLS-TnsC核质,泳道7=apo(没有sgRNA)TnsB-NLS-IRES-NLS-TnsC细胞质,泳道8=holo(+sgRNA)TnsB-NLS-IRES-NLS-TnsC细胞质,泳道9=apo(没有sgRNA)TnsB-NLS-IRES-NLS-TnsC核质,泳道10=holo(+sgRNA)TnsB-NLS-IRES-NLS-TnsC核质。图22F描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=apo(没有sgRNA)NLS-TnsB-IRES-NLS-TnsC细胞质,泳道4=holo(+sgRNA)NLS-TnsB-IRES-NLS-TnsC细胞质,泳道5=apo(没有sgRNA)NLS-TnsB-IRES-NLS-TnsC核质,泳道6=holo(+sgRNA)NLS-TnsB-IRES-NLS-TnsC核质,泳道7=apo(没有sgRNA)TnsB-NLS-IRES-NLS-TnsC细胞质,泳道8=holo(+sgRNA)TnsB-NLS-IRES-NLS-TnsC细胞质,泳道9=apo(没有sgRNA)TnsB-NLS-IRES-NLS-TnsC核质,泳道10=holo(+sgRNA)TnsB-NLS-IRES-NLS-TnsC核质。
图23描绘了Cas12k和TniQ连接的构建体在人细胞中表达,接着进行体外转座测试的结果。图23A描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=Cas-NLS holo(+sgRNA)细胞质,泳道4=Cas-NLSholo(+sgRNA)核质,泳道5=Cas-NLS holo(+sgRNA)核质+另外的sgRNA,泳道6=Cas-NLS-P2A-NLS-TniQ holo(+sgRNA)细胞质,泳道7=Cas-NLS-P2A-NLS-TniQ holo(+sgRNA)核质,泳道8=Cas-NLS-P2A-NLS-TniQ holo(+sgRNA)核质+另外的sgRNA。图23B描绘了转座的PCR4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=apo(没有sgRNA)Cas-NLS-P2A-NLS-TniQ细胞质,泳道4=holo(+sgRNA)Cas-NLS-P2A-NLS-TniQ细胞质,泳道5=apo(没有sgRNA)Cas-NLS-P2A-NLS-TniQ核质,泳道6=holo(+sgRNA)Cas-NLS-P2A-NLS-TniQ核质,泳道7=holo(+sgRNA)Cas-NLS-P2A-NLS-TniQ核质+另外的holo Cas-NLS,泳道8=holo(+sgRNA)Cas-NLS-P2A-NLS-TniQ核质+NLS-TniQ。图23C描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=apo(没有sgRNA)Cas-NLS-P2A-NLS-TniQ细胞质,泳道4=holo(+sgRNA)Cas-NLS-P2A-NLS-TniQ细胞质,泳道5=apo(没有sgRNA)Cas-NLS-P2A-NLS-TniQ核质,泳道6=holo(+sgRNA)Cas-NLS-P2A-NLS-TniQ核质,泳道7=holo(+sgRNA)Cas-NLS-P2A-NLS-TniQ核质+另外的holo Cas-NLS,泳道8=holo(+sgRNA)Cas-NLS-P2A-NLS-TniQ核质+NLS-TniQ。图23D描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=apo(没有sgRNA)NLS-TniQ-Cas-NLS细胞质,泳道4=holo(+sgRNA)NLS-TniQ-Cas-NLS细胞质,泳道5=apo(没有sgRNA)NLS-TniQ-Cas-NLS核质,泳道6=holo(+sgRNA)NLS-TniQ-Cas-NLS核质,泳道7=holo(+sgRNA)NLS-TniQ-Cas-NLS核质+另外的holo Cas-NLS,泳道8=holo(+sgRNA)NLS-TniQ-Cas-NLS核质+NLS-TniQ。图23E描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=apo(没有sgRNA)NLS-TniQ-Cas-NLS细胞质,泳道4=holo(+sgRNA)NLS-TniQ-Cas-NLS细胞质,泳道5=apo(没有sgRNA)NLS-TniQ-Cas-NLS核质,泳道6=holo(+sgRNA)NLS-TniQ-Cas-NLS核质,泳道7=holo(+sgRNA)NLS-TniQ-Cas-NLS核质+另外的holo Cas-NLS,泳道8=holo(+sgRNA)NLS-TniQ-Cas-NLS核质+NLS-TniQ。图23F描绘了转座的PCR 4(检测供体的RE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=apo(没有sgRNA)Cas-NLS-IRES-NLS-TniQ细胞质,泳道4=holo(+sgRNA)Cas-NLS-IRES-NLS-TniQ细胞质,泳道5=apo(没有sgRNA)Cas-NLS-IRES-NLS-TniQ核质,泳道6=apo(没有sgRNA)Cas-NLS-IRES-NLS-TniQ核质+另外的PURExpress,泳道7=apo(没有sgRNA)Cas-NLS-IRES-NLS-TniQ核质+另外的Cas-NLS,泳道8=apo(没有sgRNA)Cas-NLS-IRES-NLS-TniQ核质+NLS-TniQ,泳道9=holo(+sgRNA)Cas-NLS-IRES-NLS-TniQ核质,泳道10=holo(+sgRNA)Cas-NLS-IRES-NLS-TniQ核质+另外的PURExpress,泳道11=holo(+sgRNA)Cas-NLS-IRES-NLS-TniQ核质+另外的Cas-NLS,泳道12=holo(+sgRNA)Cas-NLS-IRES-NLS-TniQ核质+NLS-TniQ。图23G描绘了转座的PCR 5(检测供体的LE接合点)的凝胶图像:泳道1=apo(没有sgRNA),泳道2=holo(+sgRNA),泳道3=apo(没有sgRNA)Cas-NLS-IRES-NLS-TniQ细胞质,泳道4=holo(+sgRNA)Cas-NLS-IRES-NLS-TniQ细胞质,泳道5=apo(没有sgRNA)Cas-NLS-IRES-NLS-TniQ核质,泳道6=apo(没有sgRNA)Cas-NLS-IRES-NLS-TniQ核质+另外的PURExpress,泳道7=apo(没有sgRNA)Cas-NLS-IRES-NLS-TniQ核质+另外的Cas-NLS,泳道8=apo(没有sgRNA)Cas-NLS-IRES-NLS-TniQ核质+NLS-TniQ,泳道9=holo(+sgRNA)Cas-NLS-IRES-NLS-TniQ核质,泳道10=holo(+sgRNA)Cas-NLS-IRES-NLS-TniQ核质+另外的PURExpress,泳道11=holo(+sgRNA)Cas-NLS-IRES-NLS-TniQ核质+另外的Cas-NLS,泳道12=holo(+sgRNA)Cas-NLS-IRES-NLS-TniQ核质+NLS-TniQ。
图24描绘了64-1TnsB及其LE DNA序列的电泳迁移率变动测定(EMSA)结果。EMSA结果确认了结合和TnsB识别。在体外转录/翻译系统中表达TnsB蛋白,用含有LE序列的FAM标记DNA温育,并且然后在天然5% TBE凝胶上分离。结合被观察为标记条带中的向上位移。多个TnsB结合位点在EMSA中产生多个位移。泳道1:仅FAM标记的DNA。泳道2:FAM DNA加体外转录/翻译系统(没有TnsB蛋白)。泳道3:FAM DNA加TnsB。
序列表的简要描述
随附的序列表提供了根据本公开内容的方法、组合物和系统中使用的示例性多核苷酸和多肽序列。下面是本文中的序列的示例性描述。
MG64
SEQ ID NO:1、12、16、20-30、64和80-85示出了MG64 Cas效应子的全长肽序列。
SEQ ID No:2-4、13-15、17-19和65-67示出了MG64转座蛋白的肽序列,其可能包含与MG64 Cas效应子缔合的重组酶复合物。
SEQ ID NO:5-6、32-33、94-95和104-105示出了从与MG64 Cas效应子相同的基因座衍生的MG64 tracrRNA的核苷酸序列。
SEQ ID NO:7和34-35示出了MG64靶CRISPR重复序列的核苷酸序列。
SEQ ID NO:106-108示出了MG64 crRNA的核苷酸序列。
SEQ ID NO:8、10、39-44、77、79和93示出了与MG64系统缔合的右侧转座酶识别序列的核苷酸序列。
SEQ ID NO:9、11、36-38、76和78示出了与MG64系统缔合的左侧转座酶识别序列的核苷酸序列。
SEQ ID NO:31示出了与本文所述的MG64 Cas效应子缔合的PAM序列。
Seq ID NO:45-63、68-75和96-103示出了被工程化以与MG64 Cas效应子一起作用的单向导RNA的核苷酸序列。
其他序列
SEQ ID NO:86-87示出了核定位信号的肽序列。
SEQ ID NO:88-89示出了接头的肽序列。
SEQ ID NO:90-92示出了表位标签的肽序列。
具体实施方式
尽管本文已经示出和描述了本发明的各个实施方案,但对于本领域技术人员显而易见的是,此类实施方案仅通过举例的方式提供。在不背离本发明的情况下,本领域技术人员可以想到多种变型、改变和替代。应理解,可以采用针对本文所述的本发明实施方案的各种可替代方案。
除非另外指示,否则本文公开的一些方法的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的技术。参见例如Sambrook和Green,Molecular Cloning:A Laboratory Manual,第4版(2012);Current Protocols inMolecular Biology丛书(F.M.Ausubel等人编);Methods In Enzymology丛书(AcademicPress,Inc.),PCR 2:A Practical Approach(M.J.MacPherson,B.D.Hames和G.R.Taylor编(1995)),Harlow和Lane编(1988)Antibodies,A Laboratory Manual,and Culture ofAnimal Cells:A Manual of Basic Technique and Specialized Applications,第6版(R.I.Freshney编(2010))(其通过引用以其全文并入本文)。
如本文所用,除非上下文另外明确指示,否则单数形式“一个”、“一种”和“所述”旨在还包括复数形式。此外,在术语“包括”(“including”)、“包括”(“includes”)、“具有”(“having”)、“具有”(“has”)、“具有”(“with”)或其变体在具体实施方式和/或权利要求书中使用的程度上,此类术语旨在以与术语“包含”(“comprising”)相似的方式是包含性的。
术语“约”或“大约”意指由本领域普通技术人员确定的具体值处于可接受的误差范围内,这将部分取决于所述值的测量或确定方式,即测量系统的限制性。例如,根据本领域的实践,“约”可以意指在1个或多于1个标准偏差内。可替代地,“约”可以意指给定值的至多20%、至多15%、至多10%、至多5%或至多1%的范围。
如本文所用,“细胞”通常是指生物细胞。细胞可以是活生物体的基本结构、功能和/或生物单元。细胞可以源自具有一个或多个细胞的任何生物体。一些非限制性实例包括:原核细胞、真核细胞、细菌细胞、古细菌细胞、单细胞真核生物体的细胞、原生动物细胞、来自植物的细胞(例如来自植物作物、水果、蔬菜、谷物、大豆、玉米、玉蜀黍、小麦、种子、番茄、水稻、木薯、甘蔗、南瓜、干草、土豆、棉花、大麻、烟草、开花植物、针叶树、裸子植物、蕨类植物、石松、金鱼藻、地钱、苔藓的细胞)、藻细胞(例如,布朗葡萄藻(Botryococcusbraunii)、莱茵衣藻(Chlamydomonas reinhardtii)、微拟球藻(Nannochloropsisgaditana)、蛋白核小球藻(Chlorella pyrenoidosa)、展枝马尾藻(Sargassum patensC.Agardh)等)、海藻类(例如海带)、真菌细胞(例如酵母细胞、来自蘑菇的细胞)、动物细胞、来自无脊椎动物(例如果蝇、刺胞动物、棘皮动物、线虫等)的细胞、来自脊椎动物(例如鱼、两栖动物、爬行动物、鸟类、哺乳动物)的细胞、来自哺乳动物(例如,猪、奶牛、山羊、绵羊、啮齿动物、大鼠、小鼠、非人灵长类、人等)的细胞等等。有时,细胞并非源自天然生物体(例如,细胞可以是合成的,有时称为人工细胞)。
如本文所用,术语“核苷酸”通常是指碱基-糖-磷酸组合。核苷酸可以包括合成核苷酸。核苷酸可以包括合成核苷酸类似物。核苷酸可以是核酸序列(例如,脱氧核糖核酸(DNA)和核糖核酸(RNA))的单体单元。术语核苷酸可以包括核糖核苷三磷酸腺苷三磷酸(ATP)、尿苷三磷酸(UTP)、胞嘧啶三磷酸(CTP)、鸟苷三磷酸(GTP)和脱氧核糖核苷三磷酸,诸如dATP、dCTP、dITP、dUTP、dGTP、dTTP或其衍生物。此类衍生物可以包括例如[αS]dATP、7-脱氮-dGTP和7-脱氮-dATP,以及赋予含有它们的核酸分子以核酸酶抗性的核苷酸衍生物。如本文所用,术语核苷酸可以是指双脱氧核糖核苷三磷酸(ddNTP)及其衍生物。双脱氧核糖核苷三磷酸的说明性实例可以包括但不限于ddATP、ddCTP、ddGTP、ddITP和ddTTP。核苷酸可以是未标记的,或是可检测标记的,诸如使用包含光学可检测的部分(例如荧光团)的部分。也可以用量子点进行标记。可检测标记可以包括例如放射性同位素、荧光标记、化学发光标记、生物发光标记和酶标记。核苷酸的荧光标记可以包括但不限于荧光素、5-羧基荧光素(FAM)、2′7′-二甲氧基-4′5-二氯-6-羧基荧光素(JOE)、罗丹明、6-羧基罗丹明(R6G)、N,N,N′,N′-四甲基-6-羧基罗丹明(TAMRA)、6-羧基-X-罗丹明(ROX)、4-(4′二甲基氨基苯偶氮基)苯甲酸(DABCYL)、Cascade Blue、Oregon Green、Texas Red、青色素和5-(2′-氨基乙基)氨基萘-1-磺酸(EDANS)。荧光标记的核苷酸的具体实例可以包括[R6G]dUTP、[TAMRA]dUTP、[R110]dCTP、[R6G]dCTP、[TAMRA]dCTP、[JOE]ddATP、[R6G]ddATP、[FAM]ddCTP、[R110]ddCTP、[TAMRA]ddGTP、[ROX]ddTTP、[dR6G]ddATP、[dR110]ddCTP、[dTAMRA]ddGTP和[dROX]ddTTP,获自Perkin Elmer,Foster City,Calif;FluoroLink脱氧核苷酸、FluoroLink Cy3-dCTP、FluoroLink Cy5-dCTP、FluoroLink Fluor X-dCTP、FluoroLink Cy3-dUTP和FluoroLink Cy5-dUTP,获自Amersham,Arlington Heights,Ill.;荧光素-15-dATP、荧光素-12-dUTP、四甲基-罗丹明-6-dUTP、IR770-9-dATP、荧光素-12-ddUTP、荧光素-12-UTP和荧光素-15-2′-dATP,获自Boehringer Mannheim,Indianapolis,Ind.;以及染色体标记的核苷酸、BODIPY-FL-14-UTP、BODIPY-FL-4-UTP、BODIPY-TMR-14-UTP、BODIPY-TMR-14-dUTP、BODIPY-TR-14-UTP、BODIPY-TR-14-dUTP、Cascade Blue-7-UTP、Cascade Blue-7-dUTP、荧光素-12-UTP、荧光素-12-dUTP、Oregon Green 488-5-dUTP、罗丹明Green-5-UTP、罗丹明Green-5-dUTP、四甲基罗丹明-6-UTP、四甲基罗丹明-6-dUTP、Texas Red-5-UTP、TexasRed-5-dUTP和Texas Red-12-dUTP,获自Molecular Probes,Eugene,Oreg.。核苷酸也可以通过化学修饰来标记或标志。化学修饰的单核苷酸可以是生物素-dNTP。生物素化dNTP的一些非限制性实例可以包括生物素-dATP(例如,生物素-N6-ddATP、生物素-14-dATP)、生物素-dCTP(例如,生物素-11-dCTP、生物素-14-dCTP)和生物素-dUTP(例如,生物素-11-dUTP、生物素-16-dUTP、生物素-20-dUTP)。
术语“多核苷酸”、“寡核苷酸”和“核酸”可互换用于通常指任何长度的核苷酸的聚合物形式(脱氧核糖核苷酸或核糖核苷酸)或其类似物,无论呈单链、双链或多链形式。多核苷酸对于细胞可以是外源的或内源的。多核苷酸可以存在于无细胞环境中。多核苷酸可以是基因或其片段。多核苷酸可以是DNA。多核苷酸可以是RNA。多核苷酸可以具有任何三维结构,并且可以执行任何功能。多核苷酸可以包含一种或多种类似物(例如,改变的骨架、糖或核碱基)。如果存在,则可以在聚合物组装之前或之后赋予对核苷酸结构的修饰。类似物的一些非限制性实例包括:5-溴尿嘧啶、肽核酸、异种核酸、吗啉代、锁核酸、乙二醇核酸、苏阿糖核酸、双脱氧核苷酸、虫草素、7-脱氮-GTP、荧光团(例如,与糖连接的罗丹明或荧光素)、含硫醇的核苷酸、生物素连接的核苷酸、荧光碱基类似物、CpG岛、甲基-7-鸟苷、甲基化核苷酸、肌苷、硫尿苷、假尿苷、二氢尿苷、辫苷(queuosine)和怀俄苷(wyosine)。多核苷酸的非限制性实例包括基因或基因片段的编码或非编码区、由连锁分析所定义的基因座、外显子、内含子、信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微RNA(miRNA)、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、无细胞的多核苷酸包括无细胞DNA(cfDNA)和无细胞RNA(cfRNA)、核酸探针和引物。核苷酸的序列可以被非核苷酸组分中断。
术语“转染”或“转染的”通常是指通过基于非病毒或基于病毒的方法将核酸引入细胞中。核酸分子可以是编码完整蛋白质或其功能部分的基因序列。参见,例如Sambrook等人,1989,Molecular Cloning:ALaboratory Manual,18.1-18.88。
术语“肽”、“多肽”和“蛋白质”在本文中可互换用于通常指通过一个或多个肽键联结的至少两个氨基酸残基的聚合物。此术语不意味聚合物的特定长度,也不旨在暗示或区分肽是使用重组技术、化学或酶合成产生的,抑或天然存在的。所述术语适用于天然存在的氨基酸聚合物以及包含至少一个修饰氨基酸的氨基酸聚合物。在一些情况下,聚合物可以被非氨基酸中断。所述术语包括任何长度的氨基酸链,包括全长蛋白质,以及具有或没有二级和/或三级结构(例如,结构域)的蛋白质。所述术语还涵盖已例如通过二硫键形成、糖基化、脂化、乙酰化、磷酸化、氧化和任何其他操纵,诸如与标记组分的缀合来修饰的氨基酸聚合物。如本文所用,术语“氨基酸(amino acid)”和“氨基酸(amino acids)”通常是指天然氨基酸和非天然氨基酸,包括但不限于修饰氨基酸和氨基酸类似物。修饰氨基酸可以包括天然氨基酸和非天然氨基酸,它们被化学修饰成包括非天然存在于氨基酸上的基团或化学部分。氨基酸类似物可以是指氨基酸衍生物。术语“氨基酸”包括D-氨基酸和L-氨基酸。
如本文所用,“非原生”通常可以是指在原生核酸或蛋白质中未见到的核酸或多肽序列。非原生可以是指亲和标签。非原生可以是指融合物。非原生可以是指包含突变、插入和/或缺失的天然存在的核酸或多肽序列。非原生序列可以呈现和/或编码一种活性(如酶活性、甲基转移酶活性、乙酰转移酶活性、激酶活性、泛素化活性等),而非原生序列所融合的核酸和/或多肽序列也可以呈现这种活性。非原生核酸或多肽序列可通过基因工程与天然存在的核酸或多肽序列(或其变体)连接,以生成编码嵌合核酸和/或多肽的嵌合核酸和/或多肽序列。
如本文所用,术语“启动子”通常是指DNA调控区域,其控制基因的转录或表达,并且可以位于核苷酸或核苷酸的起始RNA转录的区域附近或与其重叠。启动子可以含有结合通常被称为转录因子的蛋白质因子的特定DNA序列,所述蛋白质因子促进RNA聚合酶与DNA的结合,引起基因转录。‘基础启动子’,也被称为‘核心启动子’,通常可以是指含有促进可操作连接的多核苷酸的转录表达的所有基本必要元件的启动子。真核生物基础启动子通常但不一定含有TATA盒和/或CAAT盒。
如本文所用,术语“表达”通常是指核酸序列或多核苷酸从DNA模板转录(诸如转录成mRNA或其他RNA转录物)的过程和/或转录的mRNA随后翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以统称为“基因产物”。如果多核苷酸衍生自基因组DNA,则在真核细胞中的表达可以包括mRNA的剪接。
如本文所用,“可操作连接的”、“可操作连接”、“可操作地连接的”或其语法等同词通常是指基因元件例如启动子、增强子、多腺苷酸化序列等的并置,其中各元件处于允许它们以预期方式操作的关系中。例如,调控元件可以包括启动子和/或增强子序列,如果调控元件帮助起始编码序列的转录,则调控元件可操作地连接到编码区。在调控元件与编码区之间可能存在间插残基,只要维持这种功能关系即可。
如本文所用,“载体”通常是指包含多核苷酸或与多核苷酸缔合并且可以用于介导多核苷酸向细胞的递送的大分子或大分子缔合物。载体的实例包括质粒、病毒载体、脂质体和其他基因递送媒介物。载体通常包括遗传元件,例如调控元件,它们可操作地连接到基因上,以促进基因在靶标中的表达。
如本文所用,“表达盒”和“核酸盒”可互换使用,通常是指一起表达或可操作连接以便表达的核酸序列或元件的组合。在一些情况下,表达盒是指调控元件与一个或多个同它们可操作连接以便表达的基因的组合。
DNA或蛋白质序列的“功能片段”通常是指保留生物活性(功能或结构)的片段,其生物活性与全长DNA或蛋白质序列的生物活性基本上相似。DNA序列的生物活性可能是它以一种已知的可归因于全长序列的方式影响表达的能力。
如本文所用,“工程化”对象通常表示所述对象已通过人为干预被修饰。根据非限制性实例:核酸可以通过将其序列改变成自然界中不存在的序列来修饰;核酸可以被修饰,方法是将其连接到与它在自然界中不相缔合的核酸上,使得所连接的产物具有原核酸中不存在的功能;工程化核酸可以在体外合成,其序列在自然界中不存在;蛋白质可以通过将其氨基酸序列改变成自然界中不存在的序列来进行修饰;工程化蛋白可以获得新的功能或性质。“工程化”系统包含至少一种工程化组分。
如本文所用,“合成的”和“人工的”可互换使用,是指与天然存在的人类蛋白质具有低序列同一性(例如,小于50%的序列同一性、小于25%的序列同一性、小于10%的序列同一性、小于5%的序列同一性、小于1%的序列同一性)的蛋白质或其结构域。例如,VPR和VP64结构域是合成的反式激活结构域。
如本文所用,术语“tracrRNA”或“tracr序列”通常可以是指与野生型示例性tracrRNA序列(例如,来自化脓性链球菌金黄色葡萄球菌等的tracrRNA,或SEQ ID NO:*_*)具有至少约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或100%序列同一性和/或序列相似性的核酸。tracrRNA可以是指与野生型示例性tracrRNA序列(例如,来自化脓性链球菌金黄色葡萄球菌等的tracrRNA)具有至多约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或100%序列同一性和/或序列相似性的核酸。tracrRNA可以是指tracrRNA的修饰形式,其可以包括核苷酸的变化,诸如缺失、插入或取代、变体、突变或嵌合体。tracrRNA可以是指在至少6个连续核苷酸的一段上与野生型示例性tracrRNA(例如,来自化脓性链球菌金黄色葡萄球菌等的tracrRNA)序列具有至少约60%同一性的核酸。例如,tracrRNA序列可以在至少6个连续核苷酸的一段上与野生型示例性tracrRNA(例如,来自化脓性链球菌金黄色葡萄球菌等的tracrRNA)序列具有至少约60%同一性、至少约65%同一性、至少约70%同一性、至少约75%同一性、至少约80%同一性、至少约85%同一性、至少约90%同一性、至少约95%同一性、至少约98%同一性、至少约99%同一性或100%同一性。可以通过在相邻CRISPR阵列中鉴定与部分重复序列序列互补的区域在基因组序列上预测II型tracrRNA序列。
如本文所用,“向导核酸”通常可以是指可以与另一核酸杂交的核酸。向导核酸可以是RNA。向导核酸可以是DNA。向导核酸可以被编程为与核酸序列以位点特异性的方式结合。待靶向的核酸或靶核酸可以包含核苷酸。向导核酸可以包含核苷酸。靶核酸的一部分可以与向导核酸的一部分互补。双链靶多核苷酸与向导核酸互补并杂交的链可以称为互补链。双链靶多核苷酸与互补链互补并且因此可能不与向导核酸互补的链可以称为非互补链。向导核酸可以包含一条多核苷酸链并且可以称为“单向导核酸”。向导核酸可以包含两条多核苷酸链并且可以称为“双向导核酸”。如果没有另外规定,则术语“向导核酸”可以是包含性的,指代单向导核酸和双向导核酸两者。向导核酸可以包含可以称为“核酸靶向区段”或“核酸靶向序列”的区段。核酸靶向区段可以包含可以称为“蛋白质结合区段”、或“蛋白质结合序列”、或“Cas蛋白结合区段”的子区段。
术语“序列同一性”或“百分比同一性”在两个或更多个核酸或多肽序列的背景下,通常是指在局部或全局比较窗口上进行最大对应性比较和比对时,两个(例如,在成对比对中)或更多个(例如,在多序列比对中)相同或具有指定百分比的相同氨基酸残基或核苷酸的序列,如使用序列比较算法所测量。适用于多肽序列的序列比较算法包括例如BLASTP,使用的参数是字长(W)为3,期望值(E)为10,并且BLOSUM62打分矩阵设置空位成本为存在为11,延伸为1,并使用条件组成打分矩阵调整,针对大于30个残基的多肽序列;BLASTP,使用的参数是字长(W)为2,期望值(E)为1000000,并且PAM30打分矩阵设置空位成本为对于开放空位为9,而对于延伸空位为1,针对小于30个残基的序列(这些是在https://blast.ncbi.nlm.nih.gov处获得的BLAST套件中BLASTP的默认参数);CLUSTALW,采用参数为;Smith-Waterman同源搜索算法,采用参数为匹配为2,错配为-1,并且空位为-1;MUSCLE,采用默认参数;MAFFT,采用的参数retree为2且最大迭代次数为1000;Novafold,采用默认参数;HMMER hmmalign,采用默认参数。
本公开内容中包括具有一个或多个保守氨基酸取代的本文所述的任一种酶的变体。此类保守取代可以在多肽的氨基酸序列中进行,而不会破坏多肽的三维结构或功能。保守取代可以通过将疏水性、极性和R链长度相似的氨基酸相互取代来实现。另外或可替代地,通过比较来自不同物种的同源蛋白质的比对序列,可以通过定位在物种之间发生突变而不改变所编码蛋白质的基本功能的氨基酸残基(例如,非保守残基)来鉴定保守取代。此类保守取代的变体可以包括与本文所述的任一种系统(例如,本文所述的MG64系统)具有以下同一性的变体:至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%。在一些实施方案中,此类保守取代的变体是功能变体。此类功能变体可以涵盖以下序列,该序列具有取代,使得核酸内切酶的关键活性位点残基的活性不会被破坏。在一些实施方案中,本文所述的任何系统的功能变体缺乏图4和图5中所示的至少一种保守或功能残基的取代。在一些实施方案中,本文所述的任何系统的功能变体缺乏图4和图5中所示的所有保守或功能残基的取代。
提供功能相似的氨基酸的保守取代表可从多种参考文献中获得(参见,例如Creighton,Proteins:Structures and Molecular Properties(W H Freeman&Co.;第2版(1993年12月)))。以下八个组各自含有彼此为保守取代的氨基酸:
1)丙氨酸(A)、甘氨酸(G);
2)天冬氨酸(D)、谷氨酸(E);
3)天冬酰胺(N)、谷氨酰胺(Q);
4)精氨酸(R)、赖氨酸(K);
5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V);
6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);
7)丝氨酸(S)、苏氨酸(T);以及
8)半胱氨酸(C)、甲硫氨酸(M)。
如本文所用,术语“RuvC_III结构域”通常是指RuvC核酸内切酶结构域的第三不连续区段(RuvC核酸酶结构域包含三个不连续区段,即RuvC_I、RuvC_II和RuvC_III)。RuvC结构域或其区段通常可以通过与已知结构域序列的比对、与具有注释结构域的蛋白质的结构比对或通过与基于已知结构域序列(例如,RuvC_III的Pfam HMM PF18541)构造的隐马尔可夫模型(HMM)的比较来鉴定。
如本文所用,术语“HNH结构域”通常是指具有特征性组氨酸和天冬酰胺残基的核酸内切酶结构域。HNH结构域通常可以通过与已知结构域序列的比对、与具有注释结构域的蛋白质的结构比对或通过与基于已知结构域序列(例如,结构域HNH的Pfam HMM PF01844)构造的隐马尔可夫模型(HMM)的比较来鉴定。
如本文所用,术语“重组酶”通常是指介导重组酶识别序列之间的DNA重组的位点特异性酶,其导致重组酶识别序列之间DNA片段的切除、整合、倒置或交换(例如,易位)。
如本文所用,在核酸修饰(例如,基因组修饰)的背景下,术语“重组(recombine)”或“重组(recombination)”通常是指两个或更多个核酸分子,或单个核酸分子的两个或更多个区域通过重组酶蛋白的作用进行修饰的过程。重组可以导致例如在一个或多个核酸分子内或之间的核酸序列的插入、倒置、切除或易位。
如本文所用,术语“转座子”通常是指在携带“货物DNA”的基因组中进出的可移动元件。在一些情况下,这些转座子可以在转座的核酸类型、转座子末端处的重复序列类型、待携带的货物类型或转座方式(即,自我修复或宿主修复)方面有所不同。如本文所用,术语“转座酶(transposase)”或“转座酶(transposases)”通常是指与转座子末端结合并催化其向基因组的另一部分移动的酶。在一些情况下,所述移动可以是通过剪切和粘贴机制或复制性转座机制进行的移动。
如本文所用,术语“Tn7”或“Tn7样转座酶”通常是指包含三种主要组分的转座酶家族:异源转座酶(TnsA和/或TnsB)以及调节蛋白(TnsC)。除TnsABC转座蛋白之外,Tn7元件还可以编码专门的靶位点选择蛋白TnsD和TnsE。与TnsABC共接合,序列特异性DNA结合蛋白TnsD引导转座到被称为“Tn7附接位点”的保守位点attTn7。TnsD是还包括TniQ的蛋白质大家族的成员。TniQ已显示靶向转座到质粒的分解位点中。
在一些情况下,本文所述的CAST系统可以包含一种或多种Tn7或Tn7样转座酶。在某些示例性实施方案中,Tn7或Tn7样转座酶包含多聚体蛋白复合物。在某些示例性实施方案中,多聚体蛋白复合物包括TnsA、TnsB、TnsC或TniQ。在这些组合中,转座酶(TnsA、TnsB、TnsC、TniQ)可以彼此形成复合物或融合蛋白。
如本文所用,术语“Cas12k”(可替代地“II类V-K型”)通常是指已发现核酸酶活性有缺陷的V型CRISPR系统的一个亚型(例如,它们可能包含至少一个有缺陷的RuvC结构域,所述结构域缺乏至少一个对于DNA切割重要的催化残基)。此类效应子亚型通常与CAST系统相关联。
概述
具有独特功能和结构的新Cas酶的发现可以提供进一步破坏脱氧核糖核酸(DNA)编辑技术的潜力,提高了速度、特异性、功能和易用性。相对于簇状规则间隔短回文重复序列(CRISPR)系统在微生物中的预测流行率和微生物物种的纯粹多样性,在文献中相对很少有功能特征的CRISPR/Cas酶存在。这在一定程度上是因为大量的微生物物种可能不容易在实验室条件下培养。从含有大量微生物物种的自然环境生态位中进行宏基因组测序,可能会大幅增加已知的新CRISPR/Cas系统的数量,并加速发现新的寡核苷酸编辑功能。2016年,通过对自然微生物群落的宏基因组分析,发现了CasX/CasY CRISPR系统,这是近期证明这种方法成果的一个实例。
CRISPR/Cas系统是RNA定向的核酸酶复合物,其被描述为充当微生物中的适应性免疫系统。在其自然背景下,CRISPR/Cas系统出现在CRISPR(簇状规则间隔短回文重复序列)操作子或基因座中,其通常包含两个部分:(i)一组短重复序列(30-40bp),由同样短的间隔子序列隔开,其编码基于RNA的靶向元件;和(ii)编码Cas的ORF,所述Cas编码由基于RNA的靶向元件和辅助蛋白/酶指导的核酸酶多肽。特定的靶核酸序列的有效核酸酶靶向通常需要:(i)靶标(靶种子)的开头6-8个核酸与crRNA向导之间的互补杂交;以及(ii)在靶种子的限定范围内存在原间隔子相邻基序(PAM)序列(PAM通常是宿主基因组中不常见的序列)。取决于系统的确切功能和组织,CRISPR-Cas系统通常基于共享的功能特征和进化相似性分为2类、5型和16个亚型(参见图1)。
I类CRISPR-Cas系统具有大型多亚基效应子复合物,并且包括I型、III型和IV型。
I型CRISPR-Cas系统在组分方面被认为具有中等复杂性。在I型CRISPR-Cas系统中,RNA靶向元件的阵列被转录成长前体crRNA(前crRNA),所述前体在重复序列元件处被加工以释放出短的、成熟的crRNA,当它们后接有一个称为原间隔子相邻基序(PAM)的合适的短共有序列时,所述crRNA将核酸酶复合物导向核酸靶标。此加工通过称为级联的大型核酸内切酶复合物的核糖核酸内切酶亚基(Cas6)进行,所述复合物还包含crRNA定向核酸酶复合物的核酸酶(Cas3)蛋白组分。Cas I核酸酶主要充当DNA核酸酶。
III型CRISPR系统的特征可以是存在称为Cas10的中央核酸酶,以及包含Csm或Cmr蛋白亚基的重复序列相关神秘蛋白(RAMP)。就像在I型系统中一样,成熟的crRNA是使用Cas6样酶从前crRNA加工而来。与I型和II型系统不同,III型系统似乎靶向并切割DNA-RNA双链体(诸如DNA链被用作RNA聚合酶的模板)。
IV型CRISPR-Cas系统具有效应子复合物,它是由高度还原的大亚基核酸酶(csf1)、Cas5(csf3)和Cas7(csf2)组的RAMP蛋白的两个基因组成的,并且在一些情况下,还有所预测的小亚基的基因;此类系统通常见于内源性质粒上。
II类CRISPR-Cas系统通常具有单多肽多结构域核酸酶效应子,并且包括II型、V型和VI型。
II型CRISPR-Cas系统在组分方面被认为是最简单的。在II型CRISPR-Cas系统中,将CRISPR阵列加工成成熟的crRNA不需要特殊的核酸内切酶亚基的存在,而是需要小的反式编码crRNA(tracrRNA),其区域与阵列重复序列序列互补;tracrRNA与对应的效应子核酸酶(例如Cas9)和重复序列序列两者相互作用,以形成前体dsRNA结构,所述结构被内源性RNAse III切割,生成装载有tracrRNA和crRNA两者的成熟效应子酶。Cas II核酸酶被称为DNA核酸酶。2型效应子通常表现为一种结构,所述结构由采用RNase H折叠的RuvC样核酸内切酶结构域组成,其中不相关的HNH核酸酶结构域插入RuvC样核酸酶结构域的折叠内。RuvC样结构域负责(例如,crRNA互补的)靶DNA链的切割,而HNH结构域负责移位DNA链的切割。
V型CRISPR-Cas系统的特征是类似于II型效应子的核酸酶效应子(例如,Cas12)结构,包含RuvC样结构域。与II型类似,大多数(但不是所有)V型CRISPR系统都使用tracrRNA将前crRNA加工成为成熟的crRNA;然而,与II型系统不同,II型系统需要RNAse III将前crRNA切割成多个crRNA,而V型系统能够使用效应子核酸酶本身来切割前crRNA。与II型CRISPR-Cas系统一样,V型CRISPR-Cas系统又被称为DNA核酸酶。与II型CRISPR-Cas系统不同,一些V型酶(例如,Cas12a)似乎具有强大的单链非特异性脱氧核糖核酸酶活性,其可以通过双链靶序列的第一crRNA定向切割来激活。
VI型CRIPSR-Cas系统具有RNA导向的RNA核酸内切酶。VI型系统的单一多肽效应子(例如Cas13)包含两个HEPN核糖核酸酶结构域,而不是RuvC样结构域。与II型和V型系统都不同的是,VI型系统似乎也不需要tracrRNA来将前crRNA加工成crRNA。然而,与V型系统类似,一些VI型系统(例如C2C2)似乎具有强大的单链非特异性核酸酶(核糖核酸酶)活性,其通过靶RNA的第一crRNA定向切割来激活。
由于其更简单的构架,II类CRISPR-Cas已被最广泛地应用于设计核酸酶/基因组编辑应用的工程化和开发中。
这种系统在体外使用的早期改编之一可以见于Jinek等人(Science.2012年8月17日;337(6096):816-21,其通过引用以其全文并入本文)中。Jinek的研究首先描述了一种系统,其涉及(i)重组表达的、纯化的全长Cas9(例如,II类II型Cas酶),从化脓性链球菌SF370中分离,(ii)纯化的成熟的~42nt crRNA,携带有与靶DNA序列互补的~20nt 5’序列,所述靶DNA序列需要在3’tracr-结合序列之后被切割(整个crRNA在体外从载有T7启动子序列的合成DNA模板中转录);(iii)纯化的tracrRNA,其在体外从载有T7启动子序列的合成DNA模板中转录,以及(iv)Mg2+。Jinek后来描述了一种改进的工程化系统,其中(ii)的crRNA通过接头(例如GAAA)与(iii)的5’末端联结,以形成单一稠合的合成向导RNA(sgRNA),其能够自行将Cas9导向靶标(比较图2的上图和下图)。
Mali等人(Science.2013年2月15日;339(6121):823–826.)(其通过引用以其全文并入本文)后来通过提供编码以下的DNA载体改编此系统在哺乳动物细胞中的使用:(i)在具有C端核定位序列(例如,SV40 NLS)的合适的哺乳动物启动子和合适的多腺苷酸化信号(例如,TK pA信号)下编码密码子优化的Cas9(例如,II类II型Cas酶)的ORF;以及(ii)在合适的聚合酶III启动子(例如,U6启动子)下编码sgRNA(具有从G开始的5’序列、后面是与3’tracr-结合序列联结的20nt互补靶向核酸序列、接头和tracrRNA序列)的ORF。
转座子是可以在基因组中的位置之间移动的可移动元件。此类转座子已经进化到限制它们对宿主施加的负面影响。使用多种调节机制来维持低频转座,并且有时与各种细胞过程协调转座。一些原核转座子也可以调动有益于宿主或以其他方式帮助维持元件的功能。某些转座子可能还进化出了严格控制靶位点选择的机制,最著名的实例是Tn7家族。
转座子Tn7和类似元件可以是临床环境中抗生素抗性和发病机制功能以及在自然环境中编码其他适应性功能的储存库。例如,Tn7系统已经进化出几乎完全避免整合到重要宿主基因中的机制,但也通过识别能够在宿主细菌之间移动Tn7的可移动质粒和噬菌体来最大化元件的散布。
Tn7和Tn7样元件可以控制它们插入的位置和时间,具有将插入导向到细菌基因组中的单个保守位置中的一种途径;和似乎适用于最大限度地靶向到能够在细菌之间运输元件的可移动质粒中的第二途径(参见图3)。Tn7样转座子与CRISPR-Cas系统之间的缔合表明,转座子可以劫持CRISPR效应子,以在靶位点中生成R环并有利于转座子经由质粒和噬菌体传播。
MG64系统
在一方面,本公开内容提供了一种用于将货物核苷酸序列转座到靶核酸位点的系统。所述系统可以包括货物核苷酸序列的第一双链核酸。此货物核苷酸序列可以被配置为与Tn7型转座酶复合物相互作用。所述系统可以包括Cas效应子复合物。所述Cas效应子复合物可以包含II类V型Cas效应子和被配置为与靶核苷酸序列杂交的工程化向导多核苷酸。所述系统可以包括被配置为结合Cas效应子复合物的Tn7型转座酶复合物,其中所述Tn7型转座酶复合物包含TnsB亚基。
在一些情况下,所述货物核苷酸序列与左侧转座酶识别序列侧接。在一些情况下,所述货物核苷酸序列与右侧转座酶识别序列侧接。在一些情况下,所述货物核苷酸序列与左侧转座酶识别序列和右侧转座酶识别序列侧接。在一些情况下,所述系统还包括包含所述靶核酸位点的第二双链核酸。在一些情况下,所述系统还包括与所述靶核酸位点相邻的PAM序列,所述PAM序列与所述Cas效应子复合物相容。在一些情况下,所述PAM序列位于所述靶核酸位点的3’处。
在一些情况下,所述工程化向导多核苷酸被配置为结合所述II类V型Cas效应子。在一些情况下,所述II类V型Cas效应子是II类V-K型效应子。在一些情况下,所述II类V型Cas效应子包含多肽,所述多肽包含与SEQ ID NO:1、12、16、20-30、64或80-85中的任一个或其变体具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的序列。在一些情况下,所述II类V型Cas效应子包含多肽,所述多肽包含与SEQ ID NO:1、12、16、20-30、64或80-85基本上相同的序列。在一些情况下,所述TnsB亚基包含多肽,所述多肽具有与SEQ ID NO:2、13、17或65或其变体具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的序列。在一些情况下,所述TnsB亚基包含多肽,所述多肽具有与SEQ ID NO:2、13、17或65基本上相同的序列。
在一些情况下,所述Tn7型转座酶复合物包含至少一种多肽,所述多肽包含与SEQID NO:3-4、14-15、18-19或66-67中的任一个或其变体具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的序列。在一些情况下,所述重组酶复合物包含至少一种多肽,所述多肽包含与SEQ ID NO:3-4、14-15、18-19或66-67中的任一个基本上相同的序列。在一些情况下,所述Tn7型转座酶复合物包含至少两种多肽,所述多肽包含与SEQ ID NO:3-4、14-15、18-19或66-67中的任一个或其变体具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的序列。在一些情况下,所述Tn7型转座酶复合物包含至少两种多肽,所述多肽包含与SEQ ID NO:3-4、14-15、18-19或66-67中的任一个基本上相同的序列。
在一些情况下,所述工程化向导多核苷酸包含序列,所述序列包含与SEQ ID NO:5-6、32-33、94-95或104-105中的任一个或其变体具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的至少约46-80个连续核苷酸。在一些情况下,所述工程化向导多核苷酸包含序列,所述序列包含与SEQ ID NO:5-6、32-33、94-95或104-105中的任一个基本上相同的至少约46-80个连续核苷酸。
在一些情况下,所述左侧重组酶序列包含与SEQ ID NO:9、11、36-38、76或78或其变体具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的序列。在一些情况下,所述左侧重组酶序列包含与SEQ ID NO:9、11、36-38、76或78基本上相同的序列。
在一些情况下,所述右侧重组酶序列包含与SEQ ID NO:8、10、39-44、77、79或93或其变体具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的序列。在一些情况下,所述右侧重组酶序列包含与SEQ ID NO:8、10、39-44、77、79或93基本上相同的序列。
在一些情况下,所述II类V型Cas效应子和所述Tn7型转座酶复合物由包含少于约20千碱基、少于约15千碱基、少于约10千碱基或少于约5千碱基的多核苷酸序列编码。
在一方面,本公开内容提供了一种用于将货物核苷酸序列转座到包含靶核苷酸序列的靶核酸位点的方法,其包括在细胞内表达本文所述的系统或将本文所述的系统引入细胞中。
在一方面,本公开内容提供了一种用于将货物核苷酸序列转座到靶核酸位点的方法,其包括使包含所述货物核苷酸序列的第一双链核酸与包含II类V型Cas效应子和至少一种工程化向导多核苷酸的Cas效应子复合物接触,所述工程化向导多核苷酸被配置为与所述靶核苷酸序列杂交。所述方法可以包括使包含所述货物核苷酸序列的所述第一双链核酸与被配置为结合所述Cas效应子复合物的Tn7型转座酶复合物接触,其中所述Tn7型转座酶复合物包含TnsB亚基。所述方法可以包括使包含货物核苷酸序列的第一双链核酸与包含靶核酸位点的第二双链核酸接触。
在一些情况下,所述货物核苷酸序列与左侧转座酶识别序列侧接。在一些情况下,所述货物核苷酸序列与右侧转座酶识别序列侧接。在一些情况下,所述货物核苷酸序列与左侧转座酶识别序列和右侧转座酶识别序列侧接。在一些情况下,所述方法还包括与所述靶核酸位点相邻的PAM序列,所述PAM序列与所述Cas效应子复合物相容。在一些情况下,所述PAM序列位于所述靶核酸位点的3’处。
在一些情况下,所述工程化向导多核苷酸被配置为结合所述II类V型Cas效应子。在一些情况下,所述II类V型Cas效应子包含多肽,所述多肽包含与SEQ ID NO:1、12、16、20-30、64或80-85中的任一个或其变体具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的序列。在一些情况下,所述II类V型Cas效应子包含多肽,所述多肽包含与SEQ ID NO:1、12、16、20-30、64或80-85基本上相同的序列。
在一些情况下,所述TnsB亚基包含多肽,所述多肽具有与SEQ ID NO:2、13、17或65或其变体具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的序列。在一些情况下,所述TnsA亚基包含多肽,所述多肽具有与SEQ ID NO:2、13、17或65基本上相同的序列。
在一些情况下,所述Tn7型转座酶复合物包含至少一种多肽,所述多肽包含与SEQID NO:3-4、14-15、18-19或66-67中的任一个或其变体具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的序列。在一些情况下,所述重组酶复合物包含至少一种多肽,所述多肽包含与SEQ ID NO:3-4、14-15、18-19或66-67中的任一个基本上相同的序列。在一些情况下,所述Tn7型转座酶复合物包含至少两种多肽,所述多肽包含与SEQ ID NO:3-4、14-15、18-19或66-67中的任一个或其变体具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的序列。在一些情况下,所述Tn7型转座酶复合物包含至少两种多肽,所述多肽包含与SEQ ID NO:3-4、14-15、18-19或66-67中的任一个基本上相同的序列。
在一些情况下,所述工程化向导多核苷酸包含序列,所述序列包含与SEQ ID NO:5-6、32-33、94-95或104-105中的任一个或其变体具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的至少约46-80个连续核苷酸。在一些情况下,所述工程化向导多核苷酸包含序列,所述序列包含与SEQ ID NO:5-6、32-33、94-95或104-105中的任一个基本上相同的至少约46-80个连续核苷酸。
在一些情况下,所述左侧重组酶序列包含与SEQ ID NO:9、11、36-38、76或78或其变体具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的序列。在一些情况下,所述左侧重组酶序列包含与SEQ ID NO:9、11、36-38、76或78基本上相同的序列。在一些情况下,所述右侧重组酶序列包含与SEQ ID NO:8、10、39-44、77、79或93或其变体具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的序列。在一些情况下,所述右侧重组酶序列包含与SEQ IDNO:8、10、39-44、77、79或93基本上相同的序列。
在一些情况下,所述II类V型Cas效应子和所述Tn7型转座酶复合物由包含少于约20千碱基、少于约15千碱基、少于约10千碱基或少于约5千碱基的多核苷酸序列编码。
根据IUPAC惯例,在整个实施例中使用以下缩写:
A=腺嘌呤
C=胞嘧啶
G=鸟嘌呤
T=胸腺嘧啶
R=腺嘌呤或鸟嘌呤
Y=胞嘧啶或胸腺嘧啶
S=鸟嘌呤或胞嘧啶
W=腺嘌呤或胸腺嘧啶
K=鸟嘌呤或胸腺嘧啶
M=腺嘌呤或胞嘧啶
B=C、G或T
D=A、G或T
H=A、C或T
V=A、C或G
实施例
实施例1–(一般方案)本文所述的系统的PAM序列鉴定/确认
在基于大肠杆菌裂解物的表达系统(myTXTL,Arbor Biosciences)中表达推定的核酸内切酶。通过对质粒测序来确定PAM序列,质粒中随机生成的潜在PAM序列可以被推定的核酸酶切割。在此系统中,在T7启动子的控制下,在体外从PCR片段中转录并翻译编码推定核酸酶的大肠杆菌密码子优化的核苷酸序列。第二PCR片段采用最小的CRISPR阵列,它是由T7启动子和重复序列-间隔子-重复序列序列构成的,所述片段在相同的反应中转录。在TXTL系统中成功表达核酸内切酶和重复序列-间隔子-重复序列序列,接着进行CRISPR阵列加工,提供了活性的体外CRISPR核酸酶复合物。
将含有间隔子序列的靶质粒库用TXTL反应的输出物温育,所述间隔子序列与最小阵列中其前为8N混合碱基(潜在的PAM序列)的间隔子序列相匹配。在1-3小时之后,停止反应,并且用DNA清理试剂盒(例如,Zymo DCC、AMPure XP珠、QiaQuick等)回收DNA。适配物序列被平末端连接到被核酸内切酶切割的具有活性PAM序列的DNA上,而未被切割的DNA则无法连接。然后用对文库和适配物序列有特异性的引物,通过PCR扩增包含活性PAM序列的DNA区段。将PCR扩增产物在凝胶上拆分,以鉴定对应于切割事件的扩增子。切割反应的扩增区段也被用作制备NGS文库的模板或作为Sanger测序的底物。对所得的文库(它是起始8N文库的子集)测序揭示了与CRISPR复合物相容的具有PAM活性的序列。对于用加工过的RNA构建体进行的PAM测试,重复相同的程序,只是与质粒文库一起添加体外转录的RNA,并省略了最小CRISPR阵列模板。
对Cas效应子和CRISPR阵列周围的基因间区域的分析鉴定了对应于tracrRNA的双链体化(duplexing)序列的潜在反重复序列序列。对tracrRNA和crRNA重复序列进行折叠和修剪,添加GAAA的四元环序列以维持crRNA-tracrRNA复合物的茎环区域。
实施例2a–体外靶向的整合酶活性
整合酶活性优先用先前鉴定的PAM测定,但可以用PAM文库底物代替进行,其效率降低。用于体外测试的组分的一种排列涉及三个质粒,含有供体序列的质粒除外:(1)在T7启动子下具有效应子(或多个效应子)的表达质粒;(2)在T7启动子下具有转座酶基因的表达质粒;sgRNA或crRNA和tracrRNA;(3)含有间隔子位点和适当的PAM的靶质粒;和(4)含有所需的左端(LE)和右端(RE)DNA序列用于围绕货物基因(例如,选择标志物,诸如Tet抗性基因)转座的供体质粒。使用体外转录/翻译(TXTL)系统(例如,基于大肠杆菌裂解物或网织红细胞裂解物的系统),表达效应子和转座酶基因。在表达之后,添加RNA、靶DNA和供体DNA并温育以允许发生转座。通过跨转座酶位点的接合点的PCR检测转座,一个引物在靶DNA上,并且一个引物在供体DNA上。经由NGS对所得的PCR产物进行测序,以确定相对于sgRNA/crRNA靶向位点的确切插入拓扑学。引物定位在下游,使得容纳并检测各种插入位点。设计引物,使得在货物的取向上并且在间隔子的任一侧上检测整合,因为整合方向在开始时也是未知的。
经由对具有整合货物的靶DNA的实验输出进行定量PCR(qPCR)测量,将其以同样经由qPCR测量的未修饰靶DNA的量为基准归一化来测量整合效率。
此测定可以用纯化的蛋白质组分进行,而不是从基于裂解物的表达进行。在这种情况下,在T7诱导型启动子下在大肠杆菌蛋白酶缺陷B菌株中表达蛋白质,使用超声处理裂解细胞,并且使用AKTA Avant FPLC(GE Lifescience)上的HisTrap FF(GE Lifescience)Ni-NTA亲和色谱法纯化感兴趣的His标记蛋白。使用ImageLab软件(Bio-Rad)中的密度测量法确定在SDS-PAGE和InstantBlue Ultrafast(Sigma-Aldrich)考马斯染色的丙烯酰胺凝胶(Bio-Rad)上拆分的蛋白质条带的纯度。将蛋白质在由50mM Tris-HCl、300mM NaCl、1mMTCEP、5%甘油;pH 7.5构成的储存缓冲液(或如针对最大稳定性确定的其他缓冲液)中脱盐并在-80℃下储存。在纯化之后,将一种或多种效应子和一种或多种转座酶添加到在反应缓冲液中的如上所述的sgRNA、靶DNA和供体DNA中,所述反应缓冲液例如26mM HEPES pH 7.5、4.2mM TRIS pH 8、50μg/mL BSA、2mM ATP、2.1mM DTT、0.05mM EDTA、0.2mM MgCl2、28mMNaCl、21mM KCl、1.35%甘油(最终pH 7.5),补充有15mM Mg(Oac)2
实施例2b–体外活性
靶向核酸酶
原位表达和蛋白质序列分析指示一些RNA导向的效应子是活性核酸酶。它们含有预测的核酸内切酶相关结构域(匹配RuvC和HNH_核酸内切酶结构域)和/或预测的HNH和RuvC催化残基。
使用myTXTL系统和体外转录RNA,用工程化单向导RNA序列测试候选活性。成功切割文库的活性蛋白在凝胶中产生约170bp的条带。
DNA整合和转座
当编码转座子的基因组序列在转座子的左端和右端内含有一个或多个具有转座酶和/或整合酶功能的蛋白质序列时,预测转座子具有活性。如在此定义的Tn7转座子由催化转座酶TnsB组成,但也可能含有TnsA、TnsC、TnsD、TnsE、TniQ和/或其他转座酶或整合酶。转座子末端由预测的转座酶结合位点组成,其含有长度为15bp至150bp的正向和/或反向重复序列,侧接转座酶蛋白和其他‘货物’基因。蛋白质序列分析指示转座酶含有整合酶结构域、转座酶结构域和/或转座酶催化残基,从而表明它们具有活性(例如,图4A)。
靶向DNA整合
推定的CRISPR相关转座子(CAST)含有靶向CRISPR核酸酶或效应子的DNA和/或RNA,以及在CRISPR阵列附近具有预测转座酶功能的蛋白质。在一些系统中,基于核酸内切酶相关催化结构域和/或催化残基的存在,预测核酸酶具有活性。
在一些系统中,预测效应子与已知的CRISPR效应蛋白具有同源性,但基于核酸内切酶结构域和/或催化残基不存在而没有活性。当CRISPR基因座(无活性CRISPR核酸酶和阵列)和转座酶蛋白位于预测的转座子左端和右端内时,预测转座酶与效应子相关联(图4A)。在这种情况下,预测效应子会基于向导RNA将DNA整合引导到特定的基因组位置。
用五种类型的组分测试CAST活性:(1)由myTXTL或PURExpress表达的Cas效应蛋白;(2)含有靶序列和对应于Cas酶的PAM的靶DNA片段或质粒;(3)含有与DNA片段或质粒中转座酶系统的LE和RE侧接的DNA标志物或片段的供体DNA片段;(4)使用myTXTL或PURExpress表达的转座酶蛋白的任何组合;以及(5)工程化的体外转录单向导RNA序列。通过供体-靶标接合点的PCR扩增来测定成功对供体片段转座的活性系统。
进行转座反应之后,接合点的PCR扩增显示发生了适当的供体-靶标形成,并且转座反应具有sg依赖性。(图6)。反应#3和#4的PCR扩增指示供体相对于靶标的两个取向均已形成:一个是LE更接近PAM,并且另一个是RE更接近PAM。虽然形成了两种转座取向,但是其中LE更接近PAM的靶标中的供体整合存在偏好,由反应#4和#5中存在的强条带表示。
对优选取向产物进行Sanger测序。在发生LE更接近PAM的整合中,靶标/供体接合点处正向或反向的测序色谱信号明显衰减。这指示,在LE更接近PAM取向的产物中,整合发生在一系列核苷酸中,其中LE更接近PAM产物的主要产物是距离PAM的61bp整合(图7a)。在供体-靶标接合点上从供体起源的测序限定了LE和RE序列的基本外部边界的组成(图7A和7B)。对LE和RE结构域的进一步研究将确定转座所必需的LE和RE序列的内部极限。对LE更接近PAM产物上的RE的测序显示供体RE下游的3bp重复(图7B)。这部分是由于Tn7转座酶整合事件,其在交错的切割部位处切割和连接供体片段。3bp重复小于其他Tn7转座酶的预期5bp重复。
在靶质粒的8N文库上对PCR扩增产物的Sanger测序也阐明了作为间隔子的5’末端上的nGTn/nGTt的MG64-1效应子的PAM偏好(图7C)。PAM文库靶标的NGS分析证实了5’末端处的nGTn基序偏好。
实施例3–预测的RNA折叠
使用Andronescu 2007的方法在37°下计算活性单一RNA序列所预测的RNA折叠。将所有发夹-环二级结构从结构中单独删除,并迭代编译成较小的单向导。在第二种方法中,将MG64-1的tracrRNA与已知的Vk型tracrRNA对齐,并且将独特插入的区域从单向导中突变并减少57个碱基。图12A描绘了MG64-1 sgRNA的预测结构。图12B描绘了MG64-3 sgRNA的预测结构。图12C描绘了MG64-5sgRNA的预测结构。碱基的颜色对应于此碱基的碱基配对的概率,其中红色表示高概率,并且蓝色表示低概率。
实施例4–经由凝胶位移进行的转座子末端验证
经由电泳迁移率变动测定(EMSA)测试转座子末端的TnsB结合。在这种情况下,将潜在的LE或RE合成为DNA片段(100-500bp),并经由PCR和FAM标记的引物用FAM进行末端标记。在体外转录/翻译系统(例如,PURExpress)中合成TnsB蛋白。在合成之后,将1μL TnsB蛋白添加到在10μL反应结合缓冲液(20mM HEPES pH 7.5、2.5mM Tris pH 7.5、10mM NaCl、0.0625mM EDTA、5mM TCEP、0.005% BSA、1ug/mL聚(dI-dC)和5%甘油)中的50nM标记的RE或LE中。将该结合在30°下温育40分钟,然后添加2uL 6X加载缓冲液(60mM KCl、10mM TrispH 7.6、50%甘油)。将结合反应在5%TBE凝胶上分离并可视化。在TnsB存在下LE或RE的位移归因于成功的结合并指示转座酶活性(图24)。
实施例5–大肠杆菌中的整合酶活性
由于大肠杆菌缺乏有效修复基因组双链DNA断裂的能力,所以通过能够引起大肠杆菌基因组双链断裂的试剂对大肠杆菌进行转化会导致细胞死亡。利用此现象,在大肠杆菌中,通过将核酸内切酶或效应子辅助整合酶和向导RNA(例如,如在实施例3中确定)与间隔子/靶标和整合到其基因组DNA中的PAM序列在靶菌株中重组表达来测试核酸内切酶或效应子辅助整合酶活性。
然后用含有核酸酶或效应子和单向导RNA的质粒、表达整合酶和辅助基因的质粒以及含有温度敏感复制起点的质粒转化工程化菌株,所述质粒具有与左端(LE)和右端(RE)转座子基序侧接以进行整合的可选择标志物。然后筛选诱导表达这些基因的转化体,以用于通过在限制性温度下选择质粒复制来将标志物转移到基因组靶标,并且通过PCR确认基因组中的标志物整合。
使用无偏倚方法筛选脱靶整合。简而言之,将纯化的gDNA用Tn5转座酶或剪切片段化,并且然后使用对连接接头具有特异性的引物和可选择标志物对感兴趣的DNA进行PCR扩增。然后制备扩增子以用于NGS测序。将所得序列的分析修剪掉转座子序列,并且将侧接序列映射到基因组上以确定插入位置,并且确定脱靶插入率。
实施例6–转座酶活性的菌落PCR筛选
为了测试细菌细胞中的核酸酶或效应子辅助整合酶活性,由BL21(DE3)大肠杆菌细胞构建菌株MGB0032,所述大肠杆菌细胞被工程化为含有靶标和对MG64_1具有特异性的对应PAM序列。然后用pJL56(表达MG64_1效应子和辅助套件的质粒,具有氨苄西林抗性)和pTCM 64_1sg(具有氯霉素抗性的质粒,表达由T7启动子驱动的感兴趣的工程化靶标的单向导RNA序列)转化MGB0032大肠杆菌细胞。
然后将含有两种质粒的MGB0032培养物生长至饱和,至少1:10稀释到具有适当抗生素的生长培养物中,并在37℃下温育,直至OD为大约1。将来自此生长阶段的细胞制成电感受态并用流线型64_1pDonor转化,所述质粒携带具有四环素抗性的标志物,与左端(LE)和右端(RE)转座子基序侧接以进行整合。然后将电穿孔细胞在IPTG存在或不存在下在LB培养基上以100μM的最终浓度恢复2小时,然后铺板在LB-琼脂-氨苄西林-氯霉素-四环素上并在37℃下温育4天。使用无菌牙签对每个所得的CFU进行采样,将其混合到水中。向此溶液中添加Q5高保真PCR主混合物(New England Biolabs)和引物LA155(5’-GCTCTTCCGATCTNNNNNGATGAGCGCATTGTTAGATTTCAT-3’)和oJL50(5’-AAACCGACATCGCAGGCTTC-3’)。这些引物侧接预测的插入接合点。预测的产物大小是609bp。将DNA扩增的PCR产物在2%琼脂糖凝胶上可视化。对PCR产物进行Sanger测序确认了转座事件。
实施例7–细胞内表达/体外测定
为了在生理相关环境中测试NLS构建体的功能,使用慢病毒转导将用活性NLS标记的CAST组分克隆的构建体整合到K562细胞中。简而言之,将克隆到慢病毒转移质粒中的构建体转染到具有包膜和包装质粒的293T细胞中,并且在温育72小时之后从培养基中收获含有病毒的上清液。然后将含有病毒的培养基用K562细胞系和8μg/mL聚凝胺温育72小时,并且然后选择转染的细胞以使用嘌呤霉素以1μg/mL批量整合4天。在4天结束时收获进行选择的细胞系,并且针对核和细胞质成分(fraction)进行差异化裂解。然后用一组互补的体外表达组分测试后续成分的转座能力。
将1000万个细胞离心并用1xPBS pH 7.4洗涤一次。将上清液洗涤液完全抽吸到细胞沉淀中,并在-80℃下快速冷冻16小时。在冰上解冻之后,根据团块测量细胞沉淀大小,并且使用适当提取体积的细胞分级分离和核提取试剂(NE-PER)来天然提取细胞成分中的蛋白质。简而言之,细胞质提取试剂以1:10的细胞团块与提取试剂体积来使用。通过涡旋混合细胞悬浮液并用非离子洗涤剂裂解。然后将细胞在4℃下以16,000xg离心5分钟。然后将细胞质提取上清液倾析并保存以用于体外测试。然后以1:2的原始细胞团块与核提取试剂来添加核提取试剂,并且通过在冰上以间歇涡旋来在冰上温育1小时。然后将核悬浮液在4℃下以16,000x g离心10分钟,并且将上清液核提取物倾析并测试体外转座活性。针对每种情况使用4μL的每个细胞和核提取物,我们用一组互补的体外表达蛋白、供体DNA、pTarget和缓冲液进行体外转座反应。通过供体-靶标接合点的PCR扩增来测定转座活性的证据。
实施例8–在哺乳动物细胞中的活性(预测的)
为了显示哺乳动物细胞中的靶向和切割活性,将核定位序列融合到每个核酸酶或效应蛋白和整合酶蛋白的C末端,并且纯化融合蛋白。合成靶向感兴趣的基因组基因座的单向导RNA,并且用核酸酶/效应蛋白温育以形成核糖核蛋白复合物。用含有与左端(LE)和右端(RE)基序侧接的可选择新霉素抗性标志物(NeoR)或荧光标志物的质粒转染细胞,回收4-6小时,并且随后用核酸酶RNP和整合酶蛋白电穿孔。通过计数G418抗性菌落或荧光激活细胞术来定量质粒与基因组的整合。在电穿孔之后72小时提取基因组DNA,并且用于制备NGS文库。通过将基因组片段化并制备转座子标志物的扩增子和侧接DNA来测定脱靶频率,以用于NGS文库制备。选择至少40个不同的靶位点来测试每个靶向系统的活性。
实施例9–靶向核酸酶的活性
原位表达和蛋白质序列分析表明一些RNA导向的效应子是活性核酸酶。它们含有预测的核酸内切酶相关结构域(匹配RuvC和HNH_核酸内切酶结构域)和预测的HNH和RuvC催化残基(图4A)。
使用myTXTL系统和体外转录RNA,用工程化单向导RNA序列测试候选活性。成功切割文库的活性蛋白在凝胶中产生约170bp的条带。
实施例10–转座子的鉴定
当转座子在转座子的左端与右端之间含有一个或多个具有转座酶和/或整合酶功能的蛋白质序列时,预测转座子具有活性。如在此定义的Tn7转座子由催化转座酶TnsB组成,但也可能含有TnsA、TnsC、TnsD、TnsE、TniQ和/或其他转座酶或整合酶。转座子末端由预测的转座酶结合位点组成,其含有长度为15bp至150bp的正向和/或反向重复序列,侧接转座酶蛋白和其他‘货物’基因。蛋白质序列分析指示转座酶含有整合酶结构域、转座酶结构域和/或转座酶催化残基,从而表明它们具有活性(例如,图4A和图5A)。
实施例11–CRISPR相关转座子的鉴定
推定的CRISPR相关转座子(CAST)含有靶向CRISPR效应子的DNA和/或RNA,以及在CRISPR阵列附近具有预测转座酶功能的蛋白质。在一些系统中,基于核酸内切酶相关催化结构域和/或催化残基的存在,预测效应子具有核酸酶活性(例如,图4A)。当CRISPR基因座(CRISPR核酸酶和阵列)和转座酶蛋白位于预测的转座子左端与右端之间时,预测转座酶与活性核酸酶相关联(例如,图4B和4C)。在这种情况下,预测效应子会基于向导RNA将DNA整合引导到特定的基因组位置。
在一些系统中,预测效应子与已知的CRISPR效应蛋白具有同源性,但基于核酸内切酶结构域和/或催化残基不存在而没有活性(图5A)。当CRISPR基因座(无活性CRISPR核酸酶和阵列)和转座酶蛋白位于预测的转座子左端和右端内时,预测转座酶与效应子相关联(图5A和图5B)。
实施例12–CAST发现
CRISPR相关转座子(CAST)是由转座子组成的系统,所述转座子已进化为与CRISPR系统相互作用以促进DNA货物的靶向整合。
CAST是编码一个或多个蛋白质序列的基因组序列,所述蛋白质序列涉及转座子的签名左端和右端内的DNA转座。如在此定义的Tn7转座子由催化转座酶TnsB组成,但也可能含有催化转座酶TnsA、装载蛋白TnsC或TniB以及靶识别蛋白TnsD、TnsE、TniQ和/或其他转座子相关组分。转座子末端由预测的转座酶结合位点组成,其含有长度为15bp至150bp的正向和/或反向重复序列,侧接转座子机器和其他‘货物’基因。
此外,CAST还在CRISPR阵列附近编码靶向CRISPR核酸酶或效应子的DNA和/或RNA。在一些系统中,基于核酸内切酶相关催化结构域和/或催化残基的存在,预测效应子是活性核酸酶。在一些系统中,预测效应子与已知的CRISPR效应蛋白具有序列相似性,但基于核酸内切酶结构域和/或催化残基不存在而没有活性。当CRISPR基因座和转座子相关蛋白位于预测的转座子左端和右端内时,预测转座子与效应子相关联。在这种情况下,预测效应子会基于向导RNA将DNA整合引导到特定的基因组位置。
实施例13–II类Cas12K CAST
Cas12k CAST系统编码核酸酶缺陷的CRISPR Cas12k效应子、CRISPR阵列、tracrRNA和Tn7样转座蛋白。Cas12k效应子在系统发育上是多样化的,并且已经针对若干效应子确认了确认它们与CAST相关联的特征(图8)。例如,在MG64-3 CRISPR基因座下游鉴定到转座子左端,如通过末端反向重复序列和自匹配间隔子序列所示(图11A)。Cas12k CASTCRISPR重复序列(crRNA)含有保守基序5’-GNNGGNNTGAAAG-3’(图9)。crRNA基序内的短重复序列-反重复序列(RAR)与tracrRNA的不同区域对齐(图9和图10),并且RAR基序似乎限定tracrRNA的开始和结束(例如,对于MG64-1,tracrRNA的5’末端含有RAR1(TTTC)并且3’末端含有RAR2(CCNNC),(图10A)。
实施例14–转座子末端预测
转座子末端是从侧接效应子和转座子机器的基因间区域估计的。例如,对于Cas12k CAST,直接位于TnsB上游和直接位于CRISPR基因座下游的基因间区域被预测为含有Tn7转座子左端和右端(LE和RE)。
在重叠群上预测到~12bp的正向和反向重复序列(DR/IR),最多有2个错配。另外,使用点图算法来查找侧接CAST转座子的短(~10-20bp)DR/IR。预测位于侧接CAST效应子和转座子基因的基因间区域中的匹配DR/IR编码转座子结合位点。将从基因间区域提取的编码推定转座子结合位点的LE和RE对齐以限定转座子末端边界。推定转座子LE和RE末端是以下区域:a)位于第一个和最后一个预测转座子编码基因的上游和下游400bp内;b)共享多个短反向重复序列;和c)共享>65%核苷酸同一性。
实施例15–单向导设计
对Cas效应子和CRISPR阵列周围的基因间区域的分析鉴定了潜在的反重复序列序列和与对应于tracrRNA双链体化序列的反重复序列相邻的保守“CYCC(n6)GGRG”茎环结构(图11B)。对tracrRNA和crRNA重复序列进行折叠和修剪,添加GAAA的四元环序列以维持crRNA-tracrRNA互补序列的茎环区域。
实施例16–使用靶向核酸酶的体外整合活性
原位表达和蛋白质序列分析指示一些RNA导向的效应子是活性核酸酶。它们含有预测的核酸内切酶相关结构域(匹配RuvC和HNH_核酸内切酶结构域)和/或预测的HNH和RuvC催化残基。使用myTXTL系统和体外转录RNA,用工程化单向导RNA序列测试候选活性。成功切割文库的活性蛋白在凝胶中产生约170bp的条带。
实施例17–可编程DNA整合
用五种类型的组分测试CAST活性:(1)由myTXTL或PURExpress表达的Cas效应蛋白(SEQ ID NO:1),(2)含有靶序列和对应于Cas酶的PAM的靶DNA片段或质粒(SEQ ID NO:31),(3)含有与DNA片段或质粒中转座酶系统的LE和RE侧接的DNA标志物或片段的供体DNA片段(SEQ ID NO:8-11)(4)使用myTXTL或PURExpress表达的转座酶蛋白的任何组合(SEQ IDNO:2-4),以及(5)工程化的体外转录单向导RNA序列(SEQ ID NO:5)。通过供体-靶标接合点的PCR扩增来测定成功对供体片段转座的活性系统。
进行转座反应之后,接合点的PCR扩增显示发生了适当的供体-靶标形成,并且转座反应具有sg依赖性。(图9)。反应#3和#4的PCR扩增指示供体相对于靶标的两个取向均已形成:一个是LE更接近PAM,并且另一个是RE更接近PAM。虽然发生了两种转座取向,但是其中LE更接近PAM的靶标中的供体整合似乎存在偏好,由反应#4和#5中存在的强条带表示。
对优选取向产物进行Sanger测序。在发生LE更接近PAM的整合中,靶标/供体接合点处正向或反向的测序色谱信号明显衰减。这指示,在LE更接近PAM取向的产物中,整合发生在一系列核苷酸中,其中LE更接近PAM产物的主要产物是距离PAM的61bp整合(图10a)。在供体-靶标接合点上从供体起源的测序限定了LE和RE序列的基本外部边界的组成(图10a、图10ab)。对LE更接近PAM产物上的RE的测序显示供体RE下游的3bp重复(图10b)。这部分是由于Tn7转座酶整合事件,其在交错的切割部位处切割和连接供体片段。3bp重复小于其他Tn7转座酶的预期5bp重复。
在靶质粒的8N文库上对PCR扩增产物的Sanger测序也指示了作为间隔子的5’末端上的nGTn/nGTt的MG64-1效应子的PAM偏好(图10c)。PAM文库靶标的NGS分析证实了5’末端处的nGTn基序偏好。
单向导测试的进一步发展确认了具有新sgRNA支架的MG64-1的活性(图13)。
实施例18–整合窗口确定
针对NGS文库对扩增的PAM的PCR接合点进行索引,并用V2300读取试剂盒在MiSeq上进行测序。使用CRISPResso,使用推定转座序列的扩增子序列对读取进行映射和定量,与PAM的整合距离为60bp(向导序列(guideseq)=20bp在LE或RE的3’末端,窗口中心=0,窗口大小=20)。将插入缺失直方图以检测到的总插入缺失读取为基准归一化,并且相对于60bp参考序列绘制频率(图14)
针对MG64-1的序列和距PAM的距离绘制PCR反应5(LE在PAM近端,图14上图)和PCR4(RE在PAM远端,图14下图)。对整合窗口的分析指示,在间隔子PAM位点处发生的整合中有95%在距离PAM的58与68个核苷酸之间的10bp窗口内。远端与近端频率之间整合距离的差异反映了整合位点重复-由于整合时转座酶的交错核酸酶活性而导致的3-5个碱基对重复。
实施例19–转座酶活性的菌落PCR筛选
经由菌落PCR筛选测定转座活性。在用pDonor质粒转化之后,将大肠杆菌铺板到含有氨苄西林、氯霉素和四环素的LB-琼脂上。将所选的CFU添加到含有PCR试剂和侧接所选插入接合点的引物的溶液中。整合产物的PCR反应在凝胶上可见(图15)。所选菌落PCR产物的测序结果确认它们代表转座事件,因为它们跨越了在lacZ基因中的工程化靶位点处LE与PAM之间的接合点(图16)。
实施例20–单向导工程化
使用Andronescu 2007的方法在37°计算活性单一RNA序列所预测的RNA折叠。将所有发夹-环二级结构从构建体中单独删除,并迭代编译成较小的单向导。工程化单向导(esg)4、6、7、8、9对于供体转座具有活性(图17C和图17D),其中工程化sgRNA 8和9是较弱的单向导并用PCR5进行转座(图17D)。工程化向导5能够进行转座,然而工程化sgRNA 10用PCR5进行弱转座(图17E和图17F)。Esg 17是esg6和esg7缺失的组合,并且esg 18是esg 4和esg5的组合。两者都能够跨PCR4和PCR5强转座(图17G和图17H),然而,组合添加esg 6和esg 18产生esg 19,导致PCR5中的转座较弱,并且将esg 7添加到esg 19产生esg 20,导致PCR5的转座接合点非常弱(图8G和图8H)。在第二种方法中,将MG64-1的tracrRNA与已知的Vk型tracrRNA对齐,并且将独特插入的区域从单向导中突变。通过截短MG64-1 sgRNA的插入序列将sgRNA最小化(图14)。还测试了随后的2个缺失,esg 2和esg 3(图17A和图17B),但esg2和esg3都没有导致明显的转座,并且因此单向导减少了57个碱基。
实施例21–LE-RE最小化
对靶标-转座接合点的测序有助于通过鉴定来自掺入靶标反应中的供体质粒的最外层序列来鉴定末端反向重复序列。通过对变异率为10%的14bp进行重复序列分析,鉴定末端内包含的短重复序列,并且设计了用于保留重复序列、同时删除冗余序列的对这些最小末端的截短。在多次迭代中进行预测和克隆,每个相互作用都通过体外转座进行测试。单独设计初始LE和RE缺失,并且对于LE克隆至68bp、86bp和105bp,对于RE克隆至178bp、196bp和242bp。64-1的RE也具有明显的序列跨度,没有重复序列,因此设计并克隆了50bp和81bp的内部缺失。对于PCR 4和PCR 5,所有单个缺失之间的转座都是稳健的(图18A、图18B),并且随后对RE进行81bp的内部缺失和组合缺失。在81bp内部缺失上克隆前178、196和212bp的修剪端并测试转座。所有设计的构建体的转座都是活跃的。通过与68bp的LE组合,我们确定转座在向下至68bp的LE区域和96bp的RE区域被证明是活跃的(图18E、图18F)。
实施例22–转座的突出端影响
为了测试转座是否需要TnsB结合基序之外的冗余序列,设计了针对LE和RE两者的TGTACA基序设计的寡聚物,并且用0、1、2、3、5和10bp的额外碱基对合成。使用这些合成的寡聚物来生成具有突出端的供体PCR片段并测试其转座到靶位点中的能力。最值得注意的是,PCR6很少从体外反应中被检测到(图18G泳道1、2),但是对于0-3bp的小突出端,我们能够在PCR 6处检测到有效整合,反映了RE在PAM近端的取向,这在较大的侧接序列下未检测到。
实施例23–CAST NLS设计
用于治疗目的的真核基因组编辑在很大程度上依赖于将编辑酶输入细胞核中。较大蛋白质的小多肽段向细胞组分发出信号,以便蛋白质跨核膜输入。这些标签的放置并非不重要,因为这些NLS标签需要提供输入功能,同时还要维持其融合的蛋白质的功能。为了测试NLS对CAST复合物的每个组分的功能取向,我们设计并合成了将核质蛋白NLS融合到MGCAST的每个组分的N末端并将SV40 NLS融合到C末端的构建体。在无细胞体外转录/翻译反应中表达这些构建体的蛋白质,并且用一组未标记的组分补体测试体外转座活性。使用PCR4(评估RE远端转座)和同源转座事件PCR 5(LE向近端转座),通过供体-靶标接合点的PCR评估NLS标记的构建体的活性维持。
大多数组分产生维持活性的单个NLS取向。TnsB是CAST组分,其通过PCR 4和PCR 5对N末端NLS和C末端NLS均具有活性(图19A、图19B)。TniQ对N末端NLS标签具有活性(图19C、图19D)。并且Cas12k组分对C末端标记的NLS具有活性(图19E、图19F,泳道5、6)。测试了具有核质蛋白和SV40 NLS标签两者的Cas12k的进一步开发并发现其具有活性(图19I、图19J,泳道4)。TnsC对N末端NLS具有弱活性(图19E、图19F,泳道7),但是TnsC标记的进一步探索鉴定了新的起作用的NLS-HA-TnsC和NLS-FLAG-TnsC构建体(图19G、图19H,分别是泳道3和7)。最终结果是NLS完全标记的组分套件,所述组分在体外具有活性,具有NLS-TnsB和TnsB-NLS两种取向(图20A、图20B,泳道5、6)。
实施例24–Cas12k和TniQ蛋白融合构建体设计和测试
为了简化蛋白质组分的表达并最大限度地减少这些组分向细胞的递送,我们设计、合成并测试了Cas12k效应子和TniQ蛋白之间的融合构建体。设计并合成与Cas12k融合的TniQ的两个取向,C末端融合物Cas-TniQ和N末端融合物TniQ-Cas。虽然两种构建体对PCR4的活性都较弱(图21A),但当体外表达并测定转座能力时,通过TniQ-Cas融合蛋白稳健地形成了PCR5接合点(图21B)。用可变接头结构域测定转座长度,包括原始(20个氨基酸接头)、48、68、72和77(图21C、图21D、图21E、图21F)。然后将NLS标签连接至TniQ的N末端和Cas12k的C末端,并且通过PCR5发现其仍然具有活性(图20E、图21F)。
另外两个接头被用来融合效应子和TniQ基因。P2A(一种自停止翻译序列)在Cas-NLS-P2A-NLS-TniQ构建体中具有活性(图21G、图21H,泳道6),并且基于MCV内部核糖体进入序列(IRES)mRNA的接头允许细胞中两种组分的独立翻译(图23F、图23G)。
实施例25–细胞内表达结合体外转座测试
为了在生理相关环境中测试NLS构建体的功能,使用慢病毒转导将用活性NLS标记的CAST组分克隆的构建体整合到K562细胞中。简而言之,将克隆到慢病毒转移质粒中的构建体转染到具有包膜和包装质粒的293T细胞中,并且在温育72小时之后从培养基中收获含有病毒的上清液。然后将含有病毒的培养基用K562细胞系和8μg/mL聚凝胺温育72小时,并且然后选择转染的细胞以使用嘌呤霉素以1μg/mL批量整合4天。在4天结束时收获进行选择的细胞系,并且针对核和细胞质成分进行差异化裂解。然后用一组互补的体外表达组分测试后续成分的转座能力。
NLS-TnsB和TnsB-NLS均通过细胞分级分离和体外转座进行测试,并且跨细胞质和细胞核成分两者均检测到转座,并且NLS-TniQ在细胞质中具有可检测的活性(图22A、图22B)。NLS-HA-TnsC和NLS-FLAG-TnsC在表达时在细胞质和细胞核成分中均具有活性(图22D),然而PCR4在两种TnsC构建体的细胞核成分中形成。(图22C)。
当NLS-TnsB或TnsB-NLS均通过使用IRES与NLS-FLAG-TnsC连接时,NLS-TnsB-IRES-NLS-FLAG-TnsC主要在细胞核成分中具有活性,而TnsB-NLS-IRES-NLS-FLAG-TnsC在细胞质和细胞核成分中均具有活性。这指示NLS-TnsB具有更高的向细胞核运货的能力(图21E、图21F)。
类似地对细胞中的Cas12k融合物进行分级分离并测试转座。将Cas-NLS Cas-NLS-P2A-NLS-TniQ转导到细胞中、分级分离并在体外测试亚细胞活性。Cas-NLS-P2A-NLS-TniQ能够通过将单向导添加到反应中来在细胞质中转座(图23A)。通过补充全Cas蛋白(+sgRNA)或具有sgRNA的额外TniQ,我们能够补充细胞核成分中的Cas-NLS-P2A-NLS-TniQ构建体。这指示Cas-NLS和NLS-TniQ均成功进入了细胞核中(图23B、图23C)。NLS-TniQ-Cas-NLS融合蛋白具有类似的结果,但需要更多地补充TniQ(图23D、图23E),并且Cas-NLS-IRES-NLS-TniQ需要仅来自全Cas-NLS的补充(图23F、图23G)。整体上,这指示CAST的所有组分都能够递送到细胞的细胞核成分中。
实施例26–经由凝胶位移进行的转座子末端验证
为了验证TnsB在预测转座子末端序列上的活性,使用FAM标记的寡聚物扩增MG64-1的LE。使用无细胞转录/翻译系统表达MG64-1TnsB蛋白,并且用LE FAM标记产物温育。在温育30分钟之后,在天然5% TBE凝胶上观察到结合(图24)。共温育泳道(图24,泳道3)内的多个荧光产物条带指示至少有2个TnsB结合位点。
本公开内容的系统可以用于各种应用,例如像核酸编辑(例如,基因编辑)或与核酸分子的结合(例如,序列特异性结合)。此类系统可以用于例如矫正(例如,去除或替换)可能引起对象疾病的基因遗传突变;使基因失活以确定其在细胞中的功能;作为检测致病基因元件的诊断工具(例如,经由逆转录病毒RNA或编码致病突变的扩增DNA序列的切割);作为灭活酶与探针组合以靶向和检测特定的核苷酸序列(例如,编码细菌中抗生素抗性的序列);通过靶向病毒基因组致使病毒失去活性或无法感染宿主细胞;添加基因或修改代谢途径以使生物体产生有价值的小分子、大分子或次级代谢物;建立进化选择的基因驱动元件;和/或作为生物传感器检测外来小分子和核苷酸对细胞的干扰。
尽管本文已经示出和描述了本发明的各个实施方案,但对于本领域技术人员明显的是,此类实施方案仅通过举例的方式提供。本发明并不旨在受本说明书内提供的具体实施例的限制。虽然已经参考上述说明书描述了本发明,但本文的实施方案的描述和说明并不意味着以限制的意义来解释。在不背离本发明的情况下,本领域技术人员现在将想到多种变型、改变和替代。此外,应理解,本发明的所有方面不限于本文中所述的取决于各种条件和变量的具体的描绘、配置或相对比例。应理解,本文所述的本发明的实施方案的各种替代方案可以用于实践本发明。因此,设想本发明还应覆盖任何这种替代方案、修改、变型或等同方案。预期以下权利要求限定本发明的范围,并且由此覆盖这些权利要求及其等同方案范围内的方法和结构。
序列表
<110> 宏基因组学公司
<120> 用于对货物核苷酸序列转座的系统和方法
<130> 55921-714.602
<140>
<141>
<150> 63/232,578
<151> 2021-08-12
<150> 63/187,290
<151> 2021-05-11
<150> 63/082,983
<151> 2020-09-24
<160> 108
<170> PatentIn版本3.5
<210> 1
<211> 612
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64活性效应子序列
<220>
<223> MG64-1活性效应子
<400> 1
Met Ser Gln Ile Thr Ile Gln Cys Arg Leu Val Ala Lys Glu Pro Ile
1 5 10 15
Arg His Thr Leu Trp Gln Leu Met Ala Asp Leu Asn Thr Pro Phe Ile
20 25 30
Asn Glu Leu Leu Gln Lys Val Ala Gln His Pro Asp Phe Glu Lys Trp
35 40 45
Lys Gln Arg Gly Arg Leu Lys Val Lys Val Ile Glu Gln Leu Gly Asn
50 55 60
Glu Leu Lys Lys Asp Pro Arg Phe Leu Gly Gln Pro Ala Arg Phe Tyr
65 70 75 80
Thr Ser Gly Ile Asn Leu Val Lys Tyr Ile Phe Lys Ser Trp Leu Lys
85 90 95
Leu Gln Gln Arg Leu Gln Gln Lys Leu Asp Arg Lys Arg Arg Trp Leu
100 105 110
Glu Val Leu Lys Ser Asp Asp Gln Leu Ile Lys Asp Gly Gln Thr Asp
115 120 125
Leu Glu Thr Ile Arg Gln Lys Ala Thr Glu Ile Leu Gln Ser Tyr Glu
130 135 140
Gly Thr Glu Gln Leu Phe Asn Thr Leu Phe Gln Ala Tyr Asn Ser Glu
145 150 155 160
Glu Asp Ile Leu Thr Arg Thr Ala Leu Asn Tyr Leu Leu Lys Asn Arg
165 170 175
Cys Lys Leu Pro Gln Lys Pro Glu Asp Ala Lys Lys Phe Ala Lys Arg
180 185 190
Arg Arg Gln Val Glu Ile Ala Ile Lys Arg Leu Gln Glu Gln Ile Lys
195 200 205
Ala Arg Leu Pro Gln Gly Arg Asp Val Thr Asn Glu Asn Trp Leu Glu
210 215 220
Thr Leu Asn Leu Ala Cys Tyr Thr Asp Pro Glu Asn Ile Glu Glu Ala
225 230 235 240
Arg Ser Trp Gln Asp Lys Leu Leu Thr Lys Ser Ser Ser Ile Pro Phe
245 250 255
Pro Ile Asn Tyr Glu Thr Asn Glu Asp Leu Ile Trp Ser Lys Asn Glu
260 265 270
Lys Gly His Leu Cys Val Gln Phe Asn Gly Ile Ser Asp Leu Lys Phe
275 280 285
Lys Ile Tyr Cys Asp Lys Arg Gln Leu Lys Trp Phe Gln Arg Phe Tyr
290 295 300
Glu Asp Gln Gln Ile Lys Lys Ser Asn Asn Asn Gln His Ser Ser Ala
305 310 315 320
Leu Phe Thr Leu Arg Ser Gly Arg Ile Leu Trp Gln Glu Asp Lys Gly
325 330 335
Lys Gly Gln Leu Trp Asp Ile His Arg Leu Thr Leu Gln Cys Thr Leu
340 345 350
Asp Thr Arg Thr Trp Thr Gln Glu Gly Thr Glu Gln Val Lys Glu Glu
355 360 365
Lys Ala Asp Glu Ile Ala Gly Ile Leu Thr Arg Met Asn Glu Lys Gly
370 375 380
Asp Leu Thr Lys Asn Gln Gln Ala Phe Ile Gln Arg Lys Gln Ser Thr
385 390 395 400
Leu Asp Lys Leu Glu Asn Pro Phe Pro Arg Pro Ser Arg Pro Val Tyr
405 410 415
Arg Gly Gln Ser Asn Ile Leu Leu Gly Val Ser Met Glu Leu Lys Lys
420 425 430
Pro Ala Thr Ile Ala Val Ile Asp Gly Met Thr Arg Lys Val Leu Thr
435 440 445
Tyr Arg Asn Ile Lys Gln Leu Leu Gly Lys Asn Tyr Pro Leu Leu Asn
450 455 460
Arg Gln Arg Arg Gln Lys Gln Leu Gln Ser His Gln Arg Asn Val Ala
465 470 475 480
Gln Arg Lys Glu Ala Phe Asn Gln Phe Gly Asp Ser Glu Leu Gly Glu
485 490 495
Tyr Ile Asp Arg Leu Leu Ala Lys Ala Ile Ile Ala Ile Ala Lys Gln
500 505 510
Tyr Gln Ala Arg Ser Ile Val Val Pro His Leu Lys Asp Ile Arg Glu
515 520 525
Ala Ile Gln Ser Glu Ile Gln Ala Leu Ala Glu Ala Lys Ile Pro Asn
530 535 540
Cys Ile Glu Ala Gln Ala Glu Tyr Ala Lys Lys Tyr Arg Ile Gln Val
545 550 555 560
His Gln Trp Ser Tyr Gly Arg Leu Ile Asp Asn Ile Gln Ala Gln Ala
565 570 575
Ser Lys Leu Gly Ile Val Ile Glu Glu Ser Gln Gln Pro Leu Gln Gly
580 585 590
Thr Pro Leu Gln Lys Ala Ala Glu Leu Ala Phe Lys Ala Tyr Gln Ser
595 600 605
Arg Leu Ser Ala
610
<210> 2
<211> 563
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64活性转座蛋白序列
<220>
<223> MG64-1-B活性转座蛋白
<400> 2
Met Lys Asn Ala Asn Ser Pro Pro Ser Ser Ser Val Asp Asp His Gln
1 5 10 15
Lys Glu Gln His Leu Val Ile Pro Ser Glu Leu Ser Asp Glu Ala Gln
20 25 30
Leu Lys Leu Glu Val Ile Gln Thr Leu Leu Glu Pro Cys Asp Arg Arg
35 40 45
Thr Tyr Gly Gln Arg Leu Arg Glu Ala Ala Glu Lys Leu Gly Lys Ser
50 55 60
Lys Arg Thr Val Gln Arg Leu Val Lys Lys Trp Glu Glu Glu Gly Leu
65 70 75 80
Glu Ala Ile Ala Pro Thr Asn Arg Ser Asp Lys Gly Asp Phe Arg Ile
85 90 95
Glu Glu Gln Leu Gln Glu Phe Ile Ile Lys Thr Tyr Gln Asn Gly Asn
100 105 110
Lys Gly Ser Leu Arg Val Thr Arg Lys Gln Val Tyr Leu Lys Thr Lys
115 120 125
Ala Lys Ala Glu Glu Leu Ser Ile Asn Pro Pro Ser His Met Thr Val
130 135 140
Tyr Arg Ile Leu Gln Pro Leu Ile Glu Lys Gln Glu Lys Lys Lys Ser
145 150 155 160
Ile Arg Ser Pro Gly Trp Arg Gly Ser Gln Leu Ser Val Lys Thr Arg
165 170 175
Ala Gly Gln Asp Leu Ser Val Glu Tyr Ser Asn His Val Trp Gln Cys
180 185 190
Asp His Thr Arg Ala Asp Leu Leu Leu Val Asp Gln Tyr Gly Glu Leu
195 200 205
Leu Gly Arg Pro Trp Leu Thr Thr Val Ile Asp Thr Tyr Ser Arg Cys
210 215 220
Ile Ile Gly Ile Asn Leu Gly Phe Asp Ala Pro Ser Ser Gln Val Val
225 230 235 240
Ala Leu Ala Leu Arg His Ala Ile Leu Pro Lys Tyr Tyr Thr Pro Asp
245 250 255
Tyr Leu Leu Gly Glu Glu Trp Gly Thr Tyr Gly Lys Pro Glu His Phe
260 265 270
Tyr Thr Asp Gly Gly Lys Asp Phe Arg Ser Asn His Leu Gln Gln Ile
275 280 285
Ser Val Gln Leu Gly Phe Val Cys His Leu Arg Asp Arg Pro Ser Glu
290 295 300
Gly Gly Ile Val Glu Arg Pro Phe Lys Thr Leu Asn Leu Glu Phe Phe
305 310 315 320
Ser Thr Leu Pro Gly Tyr Thr Gly Ser Asn Val Gln Glu Arg Pro Glu
325 330 335
Asp Ala Glu Lys Glu Ala Cys Leu Thr Leu Arg Gln Leu Glu Gln Lys
340 345 350
Leu Val Arg Tyr Ile Val Asp Asn Tyr Asn Gln Arg Met Asp Ala Arg
355 360 365
Met Gly Asp Gln Thr Arg Phe Gln Arg Trp Glu Ser Gly Leu Ile Ala
370 375 380
Thr Pro Asp Val Ile Ser Glu Arg Glu Leu Asp Ile Cys Leu Met Lys
385 390 395 400
Gln Thr Arg Arg Lys Val Gln Arg Gly Gly Tyr Leu Gln Phe Glu Asn
405 410 415
Leu Met Tyr Arg Gly Glu Asn Leu Ala Gly Tyr Ala Gly Glu Ser Val
420 425 430
Ile Leu Arg Phe Asp Pro Arg Asp Ile Thr Thr Val Leu Val Tyr Gln
435 440 445
Lys Glu Ser Asn His Glu Val Phe Leu Thr Arg Ala Tyr Ala Met Asp
450 455 460
Leu Glu Thr Glu Gln Met Ser Leu Asp Glu Ala Lys Ala Ser Ser Lys
465 470 475 480
Arg Val Arg Asp Ala Gly Lys Thr Val Gly Asn Arg Ser Ile Leu Ser
485 490 495
Glu Val Arg Asp Arg Gln Ile Phe Pro Lys Ala Lys Lys Ser Lys Lys
500 505 510
Glu Arg Tyr Gln Glu Glu Gln Lys Ala Ile Thr Ser Lys Pro Leu Glu
515 520 525
Ile Thr Glu Trp Glu Ser Glu Glu Thr Asp Phe Ser Pro Pro Ser Ser
530 535 540
Glu Thr Pro Gln Val Glu Val Phe Asp Tyr Glu Thr Leu Gln Glu Asp
545 550 555 560
Tyr Gly Phe
<210> 3
<211> 278
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64活性转座蛋白序列
<220>
<223> MG64-1-C活性转座蛋白
<400> 3
Met Thr Ile Gln Glu Ala Gln Ala Val Ala Lys Gln Leu Gly Asp Ile
1 5 10 15
Gln Leu Thr Ser Glu Lys Leu Gln Ala Glu Ile Gln Arg Leu Asn Arg
20 25 30
Lys Thr Val Val Thr Leu Ser His Val Glu Ala Leu His Asn Trp Leu
35 40 45
Glu Gly Lys Arg Gln Ala Lys Gln Ser Cys Arg Val Val Gly Glu Ser
50 55 60
Arg Thr Gly Lys Thr Ile Ala Cys Asn Ala Tyr Arg Leu Arg His Lys
65 70 75 80
Pro Ile Gln Thr Pro Gly Lys Pro Pro Ile Val Pro Val Val Tyr Ile
85 90 95
Gln Val Thr Gln Glu Cys Gly Ala Lys Asp Leu Phe Gly Ala Ile Ile
100 105 110
Glu His Leu Lys Tyr Gln Met Thr Lys Gly Thr Val Ala Glu Ile Arg
115 120 125
Gln Arg Thr Phe Lys Val Leu Gln Arg Cys Gly Val Glu Met Leu Ile
130 135 140
Ile Asp Glu Ala Asp Arg Leu Lys Pro Lys Thr Phe Ala Glu Val Arg
145 150 155 160
Asp Ile Phe Asp Lys Leu Asn Ile Ala Val Val Leu Val Gly Thr Asp
165 170 175
Arg Leu Asp Ala Val Ile Lys Arg Asp Glu Gln Val Tyr Asn Arg Phe
180 185 190
Arg Ala Cys His Arg Phe Gly Lys Leu Ala Gly Asp Glu Phe Ser Gln
195 200 205
Thr Val Asn Ile Trp Glu Arg Gln Val Leu Lys Leu Pro Val Ala Ser
210 215 220
Asn Leu Ser Ser Lys Arg Met Leu Lys Ile Leu Gly Gln Ala Thr Gly
225 230 235 240
Gly Tyr Leu Gly Leu Leu Asp Met Ile Leu Arg Glu Ser Ala Ile Arg
245 250 255
Ala Leu Lys Lys Gly Leu Gln Lys Ile Asp Leu Asp Thr Leu Lys Glu
260 265 270
Val Thr Glu Glu Tyr Arg
275
<210> 4
<211> 171
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64活性转座蛋白序列
<220>
<223> MG64-1-Q活性转座蛋白
<400> 4
Met Glu Ser Arg Glu Ile Gln Pro Trp Trp Phe Leu Val Glu Pro Leu
1 5 10 15
Ala Gly Glu Ser Ile Ser His Phe Leu Gly Arg Phe Arg Arg Glu Asn
20 25 30
Glu Leu Thr Val Thr Met Met Gly Lys Ile Thr Gly Leu Gly Gly Thr
35 40 45
Ile Thr Arg Trp Glu Lys Phe Arg Phe Ile Pro Ile Pro Thr Glu Glu
50 55 60
Glu Leu Thr Ala Leu Ser Glu Val Val Gln Val Glu Val Glu Arg Leu
65 70 75 80
Trp Gln Met Phe Pro Pro Lys Gly Val Gly Met Lys His Gln Pro Ile
85 90 95
Arg Leu Cys Gly Ala Cys Tyr Glu Glu Glu Arg Cys His Lys Ile Glu
100 105 110
Trp Gln Leu Lys Thr Thr Gln Phe Cys Ser Gln His Gly Leu Thr Leu
115 120 125
Leu Ser Glu Cys Pro Asn Cys Gly Ala Arg Phe Gln Phe Pro Ala Leu
130 135 140
Trp Val Asn Gly Trp Cys His Arg Cys Phe Leu Thr Phe Gly Glu Met
145 150 155 160
Val Glu Gly Gln Ser Asn Lys Lys Lys Tyr Leu
165 170
<210> 5
<211> 319
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性效应子测试的sgRNA序列
<220>
<221> 修饰的_碱基
<222> (296)..(319)
<223> a、c、t、g、未知或其他
<400> 5
aaaataatcg cgccgtagat catgttcttg attgaacctc tgaactacga aaaatgaggg 60
ttagtttgac tctcggcaga tagtcttgct ttctgaccct agtggctgtc caccctgatg 120
ctgatttcta caatttaggt tgtagagatg attaacctgt aacttgaggt tagctaataa 180
tttcatttta tagggtaggt gcgctcccag caataagtgg cgtgggttta ccacagtgac 240
ggctactgaa tcacctccga ccaaggagga atccactgaa aagatggatt gaaagnnnnn 300
nnnnnnnnnn nnnnnnnnn 319
<210> 6
<211> 277
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性效应子tracrRNA序列
<400> 6
aaaataatcg cgccgtagat catgttcttg attgaacctc tgaactacga aaaatgaggg 60
ttagtttgac tctcggcaga tagtcttgct ttctgaccct agtggctgtc caccctgatg 120
ctgatttcta caatttaggt tgtagagatg attaacctgt aacttgaggt tagctaataa 180
tttcatttta tagggtaggt gcgctcccag caataagtgg cgtgggttta ccacagtgac 240
ggctactgaa tcacctccga ccaaggagga atccact 277
<210> 7
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
寡核苷酸
<220>
<223> MG64-1活性效应子的靶CRISPR重复序列
<400> 7
cgtcacaatc tattttggtt aatgagatgg attgaaag 38
<210> 8
<211> 449
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性转座子末端RE
<400> 8
aatgaacaaa aatgtctgat tattacataa ttgtttattt aatataattg tatcgtaata 60
cttgaagttt ggagacaagt aatttgttaa tactgctcca gtccctaaaa aagtgccatt 120
cgggtaaatg acacttaatc tgttaattta ctggaaaatg acagttaatt tgttaatata 180
gtaagcaata acttttgtca aagattaatg ctataattca gctaaagcag tgattatata 240
aagctttcac tctcaaatag ttcggcgaca cgattttgtt aagacgacaa ataattagtt 300
actgtacatt tacccataac tttgccgttt tggtaaggtt atcgttcaaa acacaagtgg 360
caagattatg gttcaaaacc taagtcccgt ttagtttgct tgaacacttc acgaacttga 420
gggtaacgaa gaaagctagg gtgagtcaa 449
<210> 9
<211> 319
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性转座子末端LE
<400> 9
ctcttaagga aatctatgta agtttgttgg gttagttgcg ttttcagtaa atactgtgtt 60
atagtaagaa cttgtgcgga cgtatagctc agttggttag agtacatcgt tgacatcgat 120
ggggtcactg gttcgagtcc agttacgtcc atattttttt gaagtgtgta taatattaac 180
tatgtgactt tatgtacatt aacagattat ttgtcatcgg taacaaattg ttgtcatctt 240
aacaaaatat ttgtcatcaa taacatatta tgtgtcgtgt gcttattact gaaactaatc 300
ctagacgatg gtaaaaaat 319
<210> 10
<211> 308
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性转座子RE的外部边界
<400> 10
tgtacagtaa ctaattattt gtcgtcttaa caaaatcgtg tcgccgaact atttgagagt 60
gaaagcttta tataatcact gctttagctg aattatagca ttaatctttg acaaaagtta 120
ttgcttacta tattaacaaa ttaactgtca ttttccagta aattaacaga ttaagtgtca 180
tttacccgaa tggcactttt ttagggactg gagcagtatt aacaaattac ttgtctccaa 240
acttcaagta ttacgataca attatattaa ataaacaatt atgtaataat cagacatttt 300
tgttcatt 308
<210> 11
<211> 127
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性转座子最小LE
<400> 11
tgtacattaa cagattattt gtcatcggta acaaattgtt gtcatcttaa caaaatattt 60
gtcatcaata acatattatg tgtcgtgtgc ttattactga aactaatcct agacgatggt 120
aaaaaat 127
<210> 12
<211> 643
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64效应子序列
<220>
<223> MG64-3效应子
<400> 12
Met Ser Lys Ile Thr Ile Gln Cys Arg Leu Val Ala Ser Glu Ala Thr
1 5 10 15
Arg Gln Tyr Leu Trp His Leu Met Ala Asp Ile Tyr Thr Pro Phe Val
20 25 30
Asn Glu Met Leu Arg Gln Ile Arg Glu Asp Asp Asn Phe Glu Gln Trp
35 40 45
Arg Gln Ala Gly Lys Ile Pro Ala Gly Val Phe Glu Asp Tyr Arg Lys
50 55 60
Ala Leu Lys Thr Glu Ser Arg Phe Gln Gly Met Pro Gly Arg Trp Tyr
65 70 75 80
Tyr Ala Gly Arg Glu Glu Val Lys Arg Ile Tyr Lys Ser Trp Leu Ala
85 90 95
Leu Arg Arg Arg Leu Arg Asn Gln Leu Ser Gly Gln Asn Arg Trp Leu
100 105 110
Glu Val Leu Gln Ser Asp Glu Thr Leu Met Ala Val Ser Gly Leu Asp
115 120 125
Leu Pro Ala Leu Arg Ala Ala Ser Thr Lys Leu Leu Asp Leu Leu Ser
130 135 140
Ser Gln Ile Ala Lys Pro Ala Lys Gly Ser Lys Lys Thr Asn Arg Gly
145 150 155 160
Lys Gly Lys Lys Gln Ala Lys Gln Thr Gln Gly Lys Ser Leu Tyr Gln
165 170 175
Ser Leu Trp Asp Leu Tyr Lys Glu Thr Glu Asp Ile Leu Gln Lys Cys
180 185 190
Ala Ile Ala Tyr Leu Leu Lys Asn Lys Ser Gln Val Pro Asp Lys Pro
195 200 205
Glu Asp Pro Glu Lys Phe Arg His Arg Arg Arg Lys Ala Glu Ile Arg
210 215 220
Thr Glu Arg Leu Asn Glu Gln Leu Thr Lys Thr Arg Leu Pro Lys Gly
225 230 235 240
Arg Asp Leu Thr Asn Glu Gln Trp Leu Glu Ala Leu Ala Ile Ala Thr
245 250 255
Glu Gln Ile Pro Lys Asp Glu Thr Glu Ala Ala Ile Trp Gln Ser Arg
260 265 270
Leu Leu Thr Asp Ala Ala Ser Leu Pro Phe Pro Val Ala Tyr Glu Thr
275 280 285
Asn Glu Asp Leu Lys Trp Phe Leu Asn Gly Lys Gly Arg Leu Cys Val
290 295 300
Ser Phe Asn Gly Leu Ser Glu His Thr Phe Glu Ile Tyr Cys Asp Lys
305 310 315 320
Arg Gln Leu His Trp Phe Lys Arg Phe Leu Glu Asp Gln Gln Ile Lys
325 330 335
Lys Glu His Gln Gly Lys Arg Ser Ser Gly Leu Phe Thr Leu Arg Ser
340 345 350
Gly Arg Ile Ser Trp Thr Ser Pro Ser Asp Ile Asp Lys Ser Pro Cys
355 360 365
Trp Thr Ala Asn Arg Leu Thr Leu His Cys Ser Val Asp Thr Arg Leu
370 375 380
Trp Thr Gln Glu Gly Thr Glu Glu Val Arg Gln Glu Lys Ala Thr Asn
385 390 395 400
Ile Ala Lys Ile Ile Ala Gly Thr Lys Ala Lys Gly Asn Leu Asn Gln
405 410 415
Lys Gln Gln Asp Phe Ile Thr Lys Arg Glu Thr Thr Leu Lys Leu Leu
420 425 430
His Asn Pro Phe Pro Arg Pro Ser Lys Pro Leu Tyr Gln Gly Asn Pro
435 440 445
Ser Ile Ile Ala Ala Val Ser Phe Gly Leu Glu Lys Pro Ala Thr Leu
450 455 460
Ala Ile Val Asp Ile Thr Thr Gly Lys Ala Ile Thr Tyr Arg Ser Ile
465 470 475 480
Arg Gln Leu Leu Asp Gln Asn Tyr Lys Leu Phe Thr Lys His Arg Leu
485 490 495
Gln Gln Gln Gln Arg Ala His Gln Arg His Gln Asn Gln Lys Glu Ser
500 505 510
Ala Glu Asn Arg Ile Ser Glu Gly Gly Leu Gly Glu His Val Asp Ser
515 520 525
Leu Ile Ala Lys Ala Ile Leu Glu Thr Ala Ala Glu Tyr Gly Ala Ser
530 535 540
Ser Ile Val Leu Pro Glu Leu Gly Asn Ile Arg Glu Ile Ile Gln Ala
545 550 555 560
Glu Val Ile Ala Lys Ala Glu Arg Lys Ile Pro Gly Leu Lys Glu Lys
565 570 575
Gln Asp Glu Tyr Ala Ala Lys Phe Arg Ala Ser Val His Arg Trp Ser
580 585 590
Tyr Gly Arg Leu Ala Gln Lys Ile Thr Thr Lys Ala Ala Leu Gln Gly
595 600 605
Leu Glu Thr Glu Ser Thr Arg Gln Pro Leu Gln Gly Ser Pro Gln Glu
610 615 620
Lys Ala Arg Asn Leu Ala Ile Ala Ala Tyr Glu Ser Arg Lys Val Asp
625 630 635 640
Gln Arg Ala
<210> 13
<211> 542
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64转座蛋白序列
<220>
<223> MG64-3-B转座蛋白
<400> 13
Met Glu Leu Val Asn Pro Asp Asp Leu Asn Ser Val Glu Ala Arg Leu
1 5 10 15
Lys Leu Glu Ile Val Glu Lys Leu Ser Glu Pro Cys Asp Arg Arg Thr
20 25 30
Tyr Gly Glu Arg Leu Arg Ser Ala Ala Gln Lys Leu Glu Cys Ser Val
35 40 45
Arg Thr Val Gln Arg Leu Met Lys Lys Trp Glu Gln Glu Gly Ile His
50 55 60
Ala Leu Ile Asp Ser Gly Arg Lys Asp Lys Gly Asn Pro Arg Ile Ser
65 70 75 80
Glu Asp Trp Gln Ser Phe Ile Lys Asp Ala Tyr Asp Asn Gly Lys Cys
85 90 95
Thr Pro Ala Gln Val Phe Thr Lys Val Arg Gln Arg Ala Arg Gln Glu
100 105 110
Gly Leu Asp Ser His Pro Ser His Met Thr Val Tyr Arg Ile Leu Asn
115 120 125
Pro Leu Ile Glu Ala Lys Glu Gln Lys Asn Asn Ile Arg Asn Val Gly
130 135 140
Trp Lys Gly Ala Arg Leu Ala Leu Lys Thr Arg Asp Gly Glu Val Leu
145 150 155 160
Glu Ile Asp Tyr Ser Asn Gln Val Trp Gln Cys Asp His Thr Arg Ala
165 170 175
Asp Ile Leu Leu Val Asp Lys Tyr Gly Tyr Gln Met Gly Arg Pro Trp
180 185 190
Leu Thr Thr Val Val Asp Thr Tyr Ser Arg Ala Ile Val Gly Ile Asn
195 200 205
Leu Gly Tyr Asp Ala Pro Ser Ser Arg Val Val Ala Leu Ala Leu Arg
210 215 220
His Ala Ile Leu Pro Lys Gln Tyr Gly Ala Glu Tyr Lys Leu Tyr Ala
225 230 235 240
Glu Trp Pro Thr Cys Gly Val Pro Asp His Met Phe Thr Asp Gly Gly
245 250 255
Lys Asp Phe Arg Ser Asn His Leu Gln Gln Ile Gly Val Gln Leu Gly
260 265 270
Phe Ile Cys His Leu Arg Asp Arg Pro Ser Glu Gly Gly Ile Val Glu
275 280 285
Arg Pro Phe Gly Thr Ile Asn Thr Gln Phe Phe Ser Thr Leu Pro Gly
290 295 300
Tyr Thr Gly Ser Asn Val Gln Asp Arg Pro Pro Glu Ala Glu Ala Glu
305 310 315 320
Ala Cys Leu Thr Leu His Glu Leu Glu Lys Leu Leu Val Ala Tyr Ile
325 330 335
Val Asn Thr Tyr Asn Gln Arg Leu Asp Ala Arg Met Gly Asp Gln Thr
340 345 350
Arg Ile Gln Arg Trp Glu Ala Gly Leu Leu Lys Gln Pro Pro Thr Ile
355 360 365
Ser Glu Arg Glu Leu Asp Ile Cys Leu Met Lys Gln Thr Arg Arg Thr
370 375 380
Ile Tyr Arg Gly Gly Tyr Leu Gln Phe Glu Asn Leu Thr Tyr Trp Gly
385 390 395 400
Glu Thr Leu Ala Glu Gln Ala Gly Glu Asn Ile Val Leu Arg Tyr Asp
405 410 415
Pro Arg Asp Ile Thr Arg Leu Leu Val Tyr Arg Tyr Glu Ser Asp Arg
420 425 430
Glu Val Tyr Leu Gly Val Ala Gln Ala Gln Asp Leu Glu Gly Glu Val
435 440 445
Leu Ala Leu Asp Asp Ala Lys Ala His Ser Arg Arg Ile Arg Glu Asp
450 455 460
Gly Lys Ala Val Ser Asn Asp Ala Met Leu Asp Glu Met Arg Asp Arg
465 470 475 480
Glu Ala Phe Val Asp Glu Lys Lys Lys Ser Arg Lys Glu Arg Gln Lys
485 490 495
Glu Glu Gln Glu Asp Leu Arg Gln Thr Pro Leu Pro Val Ile Glu Ala
500 505 510
Asp Ser Phe Asp Glu Asp Glu Ser Gly Glu Pro Gln Asp Asn Leu Glu
515 520 525
Ile Pro Glu Phe Glu Ile Trp Glu Phe Asp Asn Asn Asp Ile
530 535 540
<210> 14
<211> 272
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64转座蛋白序列
<220>
<223> MG64-3-C转座蛋白
<400> 14
Met Val Thr Thr Thr Leu Ser Glu Gln Glu Ile Gln Ala His Ile Glu
1 5 10 15
Arg Leu Arg Lys Asp Lys Thr Val Ala Leu Glu Ser Val Gln Gln Ala
20 25 30
His Thr Trp Leu Asp Arg Lys Arg Asn Ala Arg Gln Cys Gly Arg Ile
35 40 45
Ile Gly Glu Ser Arg Thr Gly Lys Thr Lys Ala Cys Glu Ser Tyr Leu
50 55 60
Lys Lys Asn Gly Leu Pro Asp Leu Ser Gly Lys Ile Pro Asn Ile Pro
65 70 75 80
Ile Ser Tyr Phe Val Pro Lys Gln Asp Cys Thr Ser Arg Glu Leu Phe
85 90 95
Arg Ala Ile Leu Glu His Tyr Gly Asp Glu Leu Pro Arg Gly Thr Val
100 105 110
Gly Asp Ala Arg Ser Lys Thr Phe Lys Val Leu Arg Glu Cys Gln Thr
115 120 125
Glu Met Leu Ile Ile Asp Glu Ala Asp Arg Leu Lys Pro Lys Thr Phe
130 135 140
Ala Asp Val Arg Asp Ile Phe Asp Asn Leu Glu Ile Ser Val Val Leu
145 150 155 160
Val Gly Thr Lys Lys Arg Leu Asp Lys Val Val Lys Ala Asp Glu Gln
165 170 175
Val Phe Asn Arg Phe Arg Ser Ser Tyr Lys Ile Gly Thr Ile Pro Ser
180 185 190
Ser Gln Leu Ala Thr Ile Val Gly Val Trp Glu Arg Asp Ile Leu Lys
195 200 205
Leu Pro Leu Pro Ser Asn Leu Thr Ser Glu Ser Met Leu Lys Glu Ile
210 215 220
Arg Arg Ala Thr Gly Lys Ser Arg Lys Gly Tyr Tyr Ile Gly Leu Ile
225 230 235 240
Asp Met Val Leu Arg Ala Ala Ala Val Met Ala Leu Glu Lys Gly Gln
245 250 255
Met Lys Val Asp Lys Ala Thr Leu Lys Val Ala Val Glu Asp Tyr Leu
260 265 270
<210> 15
<211> 165
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64转座蛋白序列
<220>
<223> MG64-3-Q转座蛋白
<400> 15
Met Thr Met Pro Ile Val Pro Thr Trp Val Phe Pro Val Asp Pro Tyr
1 5 10 15
Ser Gly Glu Ser Leu Ser His Phe Leu Gly Arg Phe Cys Arg Glu Asn
20 25 30
His Ala Thr Leu Asn Gln Leu Gly Glu Lys Thr Gly Leu Gly Ala Val
35 40 45
Leu Gly Arg Trp Glu Lys Phe Arg Phe Ile Pro Pro Pro Asn Asp Ala
50 55 60
Gln Leu Ala Ala Leu Ala Lys Leu Val Arg Leu Glu Val Asp Gln Ile
65 70 75 80
Lys Gln Met Leu Pro Gln Glu Ala Met Gln Asn Arg Val Ile Arg Leu
85 90 95
Cys Ala Ala Cys Tyr Ala Glu Glu Pro Tyr His Arg Ile Glu Trp Gln
100 105 110
Tyr Lys Leu Ala Asn Arg Cys Asp Arg His His Leu Leu Leu Leu Leu
115 120 125
Glu Cys Pro Asn Cys Lys Ala Lys Leu Pro Met Pro Ser Lys Trp Ala
130 135 140
Asn Gly Thr Cys Lys Arg Cys Leu Thr Pro Phe Asp Gln Met Val Ala
145 150 155 160
Leu Gln Lys Gly Val
165
<210> 16
<211> 692
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64效应子序列
<220>
<223> MG64-5效应子
<400> 16
Met Lys Thr Ile Arg Cys Cys Leu Cys Ala Asn Pro Glu Thr Arg Arg
1 5 10 15
Tyr Phe Trp Lys Ile Met Val Thr Tyr Thr Leu Leu Val Asn Glu Leu
20 25 30
Leu Ala Ala Met Pro Gln Arg Pro Glu Phe Ala Gln Trp Lys Gln Arg
35 40 45
Gly Thr Ile Ala Arg Glu Ala Val Arg Ile Val Leu Thr Pro Leu Lys
50 55 60
Thr Asp Pro Thr Tyr Ala Asp Leu Pro Lys Arg Phe Phe Ser Ser Ala
65 70 75 80
Glu Leu Leu Val Cys Tyr Val Tyr Lys Ser Trp Leu Ala Leu Gln Lys
85 90 95
Arg Arg Tyr Trp Lys Leu Val Gly Lys Gln Arg Trp Leu Gln Val Ile
100 105 110
Glu Asp Asp Leu Gln Ser Leu Leu Thr Asp Asn Phe Ser Leu Glu Ser
115 120 125
Val Gln Ser Lys Ala His Gln Ile Leu Glu Gln Ala His Lys Glu Leu
130 135 140
Glu Lys Gln Pro Gln Arg Phe Lys Lys Lys Gly Lys Lys Ser Arg Pro
145 150 155 160
Leu Phe Gly Tyr Leu Leu Asp Leu Tyr Gly Thr Thr Ala Asp Lys Leu
165 170 175
Glu Arg Arg Ala Ile Gly His Leu Leu His His Asp Leu Lys Val Ser
180 185 190
Asp Thr Glu Asp Phe Pro Glu Thr Ile Gln Phe Ser Ile Asp Gln Gln
195 200 205
Gln Val Glu Ile Ala Arg Leu Lys Glu Gln Leu Gln Ser Arg Leu Pro
210 215 220
Asp Gly Arg Asp Pro Thr Gln Ala Arg Phe Leu Glu Lys Leu Arg Ile
225 230 235 240
Ala Thr Ala Leu Pro Glu Leu Glu Leu Glu Gly Phe Asp Glu Glu His
245 250 255
Phe Ser Glu Trp Arg Thr Gln Lys Gln Ile Pro Leu Leu Asn Pro Leu
260 265 270
Pro Tyr Pro Val Leu Phe Gly Ser Ser Ser Asp Leu His Trp Lys Leu
275 280 285
Glu Pro Gln Lys Ala Thr Thr Glu Ala Asn Ile Ser Pro Glu Val Pro
290 295 300
Thr Ala Arg Ser Glu Arg Val Lys Glu Arg Ile Gln Val Arg Phe Lys
305 310 315 320
Gly Asp Glu Leu Gln Asp Ser Trp Phe Lys Leu Gln Cys Asp Arg Arg
325 330 335
Gln Leu Pro Ile Phe Arg Gln Phe Val Thr Asp Tyr Leu Cys Gln Lys
340 345 350
Gln Ala Pro Asp His Glu Lys Phe Gly Glu Gly Leu Phe Thr Leu Arg
355 360 365
Ser Ala Cys Leu Val Trp Lys Glu Asp Pro Gln Gly Ala Arg Lys Arg
370 375 380
Lys Lys Arg Arg Lys Gln Gly Ala Cys Gln Asp Glu Pro Trp Glu Thr
385 390 395 400
His Arg Leu Tyr Leu His Cys Thr Ile Asp Thr Arg Phe Leu Thr Gln
405 410 415
Glu Gly Thr Glu Gln Val Arg Ala Thr Lys Leu Asp Leu Ala Gln Lys
420 425 430
Ala Leu Glu Gly Ile Glu Asn Lys Thr Ala Leu Glu Thr Val Thr Gln
435 440 445
Glu Pro Ser Ala Glu Gln Gln Lys His Leu Lys Arg Lys Gln Thr Thr
450 455 460
Val His Arg Leu Glu Thr Gln Lys Pro Pro Val Arg Pro Thr Ile Gln
465 470 475 480
Pro Tyr Glu Gly Lys Ser Asn Ile Val Val Gly Val Ser Leu Ser Arg
485 490 495
His Glu Pro Val Thr Leu Ile Val Phe Asp Thr Ala Gln Asn Lys Val
500 505 510
Leu Glu Cys Met Gly Thr Gln Ala Leu Leu Lys Ile His Gly Ile Gln
515 520 525
Ser Pro Arg Lys Asn Arg Ser Ile Gly Lys Leu Gln Gln Glu Gln Ser
530 535 540
Gln Leu Leu Arg Arg Trp Arg Arg Lys Arg Lys Gln Asn Pro His Arg
545 550 555 560
Arg Ala Asp Gly Gln Arg Gln Asp Asn Tyr Arg Ser Gly Asn Ser Glu
565 570 575
Ser Lys Leu Gly Asp Tyr Leu Asp Arg Leu Ile Ala Ala Arg Leu Val
580 585 590
Ala Leu Ala Thr Lys Arg Gln Ala Ser Val Ile Val Leu Pro Glu Leu
595 600 605
Gly Asp Ile Arg Glu Ser Val Glu Cys Ser Leu Gln Ala Lys Ala Gln
610 615 620
Arg Lys Tyr Pro Gln His Lys Lys Leu Gln Ala Lys Tyr Ala Lys His
625 630 635 640
Phe Arg His Glu Phe His Arg Trp Ser Tyr Gly Arg Leu Gln Gln Tyr
645 650 655
Ile Ala Glu Arg Ala Thr Gln Gln Asn Leu Ala Leu Leu Lys Gly Arg
660 665 670
Gln Pro Lys Gln Gly Thr Glu Gln Glu Lys Val Leu Glu Ile Ile Ser
675 680 685
Ser Ala Cys Leu
690
<210> 17
<211> 636
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64转座蛋白序列
<220>
<223> MG64-5-B转座蛋白
<400> 17
Met Thr Asn Ser Arg Leu Gly Gly Thr Met Lys Asn Leu Ser Asp His
1 5 10 15
Pro Asp Ser Glu Lys Leu Thr Tyr Glu Gln Glu His Cys Leu Val Asp
20 25 30
Glu Leu Ser Pro Glu Leu Gln Arg Lys Val Glu Leu Ile Gln Ala Ile
35 40 45
Val Asp Ala Pro Asp Arg Lys Thr Glu Arg Gln Arg Ile Ala Ile Ala
50 55 60
Ala Gln Glu Leu Gly Arg Cys Thr Lys Thr Ile Arg Ser Tyr Arg Asp
65 70 75 80
Ala Leu Arg Glu Asp Gly Ile Val Ala Leu Thr Arg Thr Glu Arg Ser
85 90 95
Asp Lys Gly Gln Arg Arg Asn Ile Ser Gln Pro Trp Ile Asp Leu Val
100 105 110
Leu Ala Leu Tyr Lys Arg Gly Gln Arg Ser Phe Cys Arg Ser Arg Asn
115 120 125
Gln Val Trp Leu Leu Ile Gln Gly Met Thr Ser Lys Leu Leu Ser Asp
130 135 140
Asp Trp Lys Thr Pro Glu Lys Arg Ala Glu Leu Met Glu Trp Tyr Ala
145 150 155 160
Gln Lys Leu Gly Ala Ala Ala Glu Asn Ala Lys Ser Lys Leu Asn Lys
165 170 175
Ile Leu Gly Ser Ile Arg Lys Glu Leu Glu Val Gly Ile Cys Met Pro
180 185 190
Pro Arg Ser His Met Ser Val Tyr Gly Ile Ile Asp Asp Tyr Leu Glu
195 200 205
Gln Gln His Arg Lys Ala Arg His Pro Gly Gln Gly Pro Glu Gln Val
210 215 220
Ile Gln Thr Thr Gly Glu Leu Leu Val Ile Glu Val Thr Asn Gly Ile
225 230 235 240
Phe Gln Ala Asp His Ser Gly Ile Asp Ile Leu Leu Lys Asp Lys Asp
245 250 255
Gly Asn Glu Ile Gly Tyr Pro Phe Leu Thr Val Ile Ile Glu Cys Ala
260 265 270
Ser Gly Cys Val Thr Gly Phe Tyr Leu Gly Phe Arg Gln Pro Gly Ser
275 280 285
His Glu Val Ala Leu Ala Leu Arg His Ala Ile Leu Pro Lys Gln Tyr
290 295 300
Gly Pro Glu Tyr Lys Leu Glu Lys Gln Trp Gln Cys Val Gly Ile Pro
305 310 315 320
Arg Tyr Leu Val Thr Asp Arg Ala Lys Glu Phe Lys Ser Lys His Leu
325 330 335
Gln Gln Ile Ala Ala Glu Leu Gly Phe Glu Leu Arg Tyr Arg Ala Tyr
340 345 350
Pro Ser Gln Gly Gly Leu Val Glu Ser Val Phe Asp Lys Ile Asn Lys
355 360 365
Glu Val Leu Ser Asn Leu Pro Gly Tyr Lys Gly Ser Asn Val Gln Lys
370 375 380
Arg Pro Lys Asn Ala Glu Lys Tyr Ala Cys Leu Thr Ile Glu Asp Leu
385 390 395 400
Glu Gln Glu Leu Val Arg Tyr Phe Cys Asp His Tyr Asn Gln His Phe
405 410 415
Tyr Pro Arg Met Lys Asp Arg Thr Arg Ala Met Gln Trp Glu Glu Arg
420 425 430
Leu Val Glu Pro Pro Val Ile Pro Asp Glu Arg Glu Leu Asp Leu Cys
435 440 445
Leu Leu Lys Arg Lys Gln Thr Ala Lys Val Gln Lys Tyr Gly Thr Ile
450 455 460
Gln Phe Gln Asn Glu Ile Tyr Gln Gly Asn Cys Leu Leu Gly Arg Glu
465 470 475 480
Thr Glu Lys Ile Ser Phe Arg Tyr Asn Pro Ser Asn Ile Ile His Val
485 490 495
Leu Ala Tyr Thr Val Glu Glu Thr Asp Lys Pro Ser Lys Phe Leu Gly
500 505 510
Val Leu Lys Ala Arg Asp Arg Lys Glu Glu Lys Leu Ser Leu His Ser
515 520 525
Leu Lys Leu Glu Gln Lys Leu Ile Arg Ala Arg Gly Lys Lys Leu Asp
530 535 540
Gln Ser Ser Ile Tyr Asn Asp Ala Leu Lys Arg Asn Glu Arg Ala Glu
545 550 555 560
Arg Glu Leu His Gly Leu Arg Lys Gln Gln Arg Arg Lys Glu His Glu
565 570 575
Arg Thr Gly Arg Ser Glu Gly Leu Gly Asn Val Ile Asp Phe Lys Arg
580 585 590
Gln Glu Asn Glu Ala Ile Gly Thr Lys Asn Ser Gln Ile Gly Pro Ile
595 600 605
Gln Lys Leu Val Lys Arg Leu Lys Pro Lys Arg Lys Ala Lys Val Ala
610 615 620
Ala Lys Asn Trp Gln Gln Lys Leu Ser Glu Asn Trp
625 630 635
<210> 18
<211> 291
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64转座蛋白序列
<220>
<223> MG64-5-C转座蛋白
<400> 18
Met Ala Gln Pro Gln Leu Ile Ser Gln Gln Leu Gln Thr Gln Pro Ser
1 5 10 15
Pro Phe Pro Leu Pro Asp Lys Glu Ala Glu Ile Asp Arg Leu Arg Ala
20 25 30
Gly Ala Pro Phe Leu Thr Thr Asp Arg Asp Thr Ala Leu Glu Gln Trp
35 40 45
Leu Asp Thr Gln Arg Lys Ser Gly Asn Pro Gly Phe Ile Cys Ser Ala
50 55 60
Lys Gly Ser Gly Leu Ser Asp Ser Cys Gln Asp Tyr Arg Met Asn Arg
65 70 75 80
Val Arg Ser Lys Gly Met Ile Gln Gln Leu Pro Val Pro Val Val Tyr
85 90 95
Val Arg Val Pro Pro Ile Cys Ser Val Ser His Phe His Thr Thr Leu
100 105 110
Leu Thr Ala Leu Asn His Pro Ile Thr Thr Gly Arg Leu Lys Asp Lys
115 120 125
Arg Pro Arg Val Arg Gly Arg Leu Lys Ser Ile Gln Thr Arg Gln Leu
130 135 140
Ile Ile Asp Asp Ala Asp Phe Leu Ser Phe Glu Ala Leu Ser Glu Ile
145 150 155 160
Ala Gln Ile Tyr Asp Asp Leu Lys Ile Pro Ser Ile Leu Cys Gly Thr
165 170 175
Tyr Tyr Leu Glu Lys Arg Leu Gln Gln Arg Tyr Trp Asp Arg Ile Gly
180 185 190
Asn Ser Phe Leu Asp Phe Tyr Glu Tyr Pro Pro Met Ser Gln Asp Glu
195 200 205
Val Val Glu Val Ile Asp Thr Trp Glu Thr Glu Phe Leu Gln Trp Pro
210 215 220
Glu Glu Ser Asp Leu Leu Ile Glu Asp Val Leu Lys Ala Val Tyr Val
225 230 235 240
Lys Thr Gly Gly Leu Arg Asp Ala Leu Asn Glu Val Leu Arg Lys Val
245 250 255
Ala Ile Gln Ala Leu Lys Gln Asp Ser Tyr Lys Ile Thr Thr Glu Ile
260 265 270
Ile Val Ser Val Leu Asn Gly Arg Val Gln Pro Arg Ile Lys Pro Ala
275 280 285
Gln Glu Glu
290
<210> 19
<211> 169
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64转座蛋白序列
<220>
<223> MG64-5-Q转座蛋白
<400> 19
Met Thr Asp Gln Gln Thr Val Trp Met Glu His Val Glu Pro Tyr Glu
1 5 10 15
Gly Glu Ser Ile Ser His Tyr Phe Gly Arg Phe Arg Arg Val Glu Gly
20 25 30
Asn Ser Phe Ser Ala Pro Thr Thr Leu Ser Ala Ala Val Gly Ile Gly
35 40 45
Pro Ala Leu Ser Arg Trp Glu Lys Phe Arg Phe Asn Pro Phe Pro Ser
50 55 60
Pro Gln Glu Leu Glu Ala Met Gly Lys Leu Ile Gly Leu Thr Val Glu
65 70 75 80
Gln Leu Arg Thr Met Leu Pro Ala Lys Gly Glu Arg Leu Val Met Arg
85 90 95
Ser Thr Arg Leu Cys Gly Ala Cys Tyr Arg Glu Ala Pro Tyr His Arg
100 105 110
Ile His Trp Gln Tyr Glu Ser Thr Glu Gly Cys Asp Lys His Arg Leu
115 120 125
Arg Leu Ile Ser Arg Cys Pro Val Cys Asp Glu Lys Phe Ala Leu Pro
130 135 140
Val Glu Trp Ile Glu Gly Ala Cys Lys Gln Cys Gly Met Lys Phe Thr
145 150 155 160
Ser Met His Lys Lys Gln Lys Pro Tyr
165
<210> 20
<211> 640
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64效应子序列
<220>
<223> MG64-33效应子
<400> 20
Met Lys Glu Ser Leu Tyr Phe Val Ile Arg Cys Leu Leu Ser Ala Asp
1 5 10 15
Ala Glu Thr Arg Arg Thr Met Trp Leu Leu Met Gln Arg Tyr Thr Leu
20 25 30
Leu Val Asn Lys Leu Leu Glu Val Ile Pro Gly Ser Ser Glu Phe Pro
35 40 45
Val Trp Arg Glu Gln Gly Tyr Ile Pro Asp Asn Ala Leu Ala Glu Phe
50 55 60
Ile Asp Thr Ile Lys Pro Asp Leu Asp Tyr Ser Gly Leu Pro Gly Arg
65 70 75 80
Phe Tyr Thr Ser Ala Lys Ile Leu Val Lys Asn Ile Tyr Lys Ser Trp
85 90 95
Phe Ala Leu Gln Arg Lys Tyr Ser Arg Lys Ile Thr Gly Lys Ile Arg
100 105 110
Trp Ile Lys Ile Ile Asn Ser Glu Ile Asp Leu Ile Lys Asn Thr Glu
115 120 125
Phe Glu Leu Asp Gln Ile Thr Asn Ala Ala Asn Ala Ala Leu Lys Leu
130 135 140
Ala Lys Lys Lys Lys Glu Glu Ser Glu Lys Ser Asn Ser Glu Ser Ser
145 150 155 160
Thr Ser Leu Leu Gly Ile Leu Ile Glu Met Gln Phe Lys Thr Lys Ser
165 170 175
Pro Leu Lys Lys Arg Gly Ile Asn His Leu Leu Leu Asn Asn Leu Asn
180 185 190
Ile Glu Tyr Lys Asp Phe Thr Leu Asp Ser Leu Glu Ala Arg Val Glu
195 200 205
Val Ala Phe Leu Glu Ile Glu Ala Leu Glu Lys Arg Leu Arg Ser Arg
210 215 220
Leu Pro Lys Gly Arg Asp Pro Asp Gly Tyr Arg Tyr Val Leu Ala Leu
225 230 235 240
Ser Lys Ala Ala Ser Leu Pro Glu Glu Ala Leu Thr Pro Glu Lys Phe
245 250 255
Asp Glu Ile His Ala Asp Ile Pro Ile Tyr Asn Glu Leu Pro Tyr Pro
260 265 270
Leu Ile Tyr Glu Gly Ala Ser Asn Ile Val Trp Thr Leu Ile Lys Pro
275 280 285
Glu Gly Asn Arg Ser Asn Phe Gly Arg Leu Gln Ile His Phe Asn Gly
290 295 300
Ile Ser Glu Leu Lys Phe Leu Ile Gln Cys Gly Arg Arg Gln Leu Pro
305 310 315 320
Val Phe Lys Gly Phe Tyr His Asp Ala Ile Glu Asn Lys Gly Arg Ile
325 330 335
Ser Arg Gly Glu Ile Pro Tyr Asn Glu Gly Leu Asn Arg Phe Arg Ser
340 345 350
Ala Gln Ile Leu Trp Lys Pro Asp Pro Ser Leu Asp Phe Arg Lys Lys
355 360 365
Lys Lys Asn Ile Pro Ser Thr Pro Trp Glu Val Asn Arg Leu Tyr Leu
370 375 380
His Cys Ser Val Asp Lys Ala Thr Leu Ser Ala Glu Gly Thr Glu Cys
385 390 395 400
Leu Arg Gln Met Lys Ile Lys Lys Ile Glu Glu Lys Lys Glu Lys Pro
405 410 415
Leu Ser Pro Arg Lys Gln Thr Glu Leu Glu Arg Leu Gln Ser Ala Ala
420 425 430
Pro Pro Pro Arg Pro Ser Ile Gln Pro Tyr Val Gly Asp Pro Asp Met
435 440 445
Val Val Cys Ile Cys Phe Ser Pro Asp Glu Pro Val Ile Val Val Pro
450 455 460
Val Asp Leu Ala Lys Glu Ala Ala Leu Tyr Ala Leu Asn Thr Lys Ala
465 470 475 480
Leu Leu Asn Arg Ala Thr Lys Ala Ile Trp Arg Met Gly Lys Leu Glu
485 490 495
Thr Leu Ser Asp Asn Gly Lys Ala Leu Cys His Asp Asn Gly Gly Lys
500 505 510
Leu Asn Ile Arg Asn Pro Arg Thr Tyr Ser Val Gln Lys Pro Tyr Gly
515 520 525
Leu Val Thr Arg Leu Asn Thr Leu Ser Glu Gln Gln Val Lys Arg Arg
530 535 540
Thr Arg Glu Gln Ser Lys Gly Lys Tyr Arg Gly Ser Gln Ser Leu Ser
545 550 555 560
Asn Leu Ser Leu Ser Val Cys Arg Leu Ile Ala Ala Arg Leu Val Asp
565 570 575
Leu Ser Leu Gln Leu Asn Ala Gly Arg Val Ile Ile Pro Asp Phe Glu
580 585 590
Gly Ile Arg Asp Trp Val Gln Ala Phe Ile Ala Ala Lys Ala Val Lys
595 600 605
Ala Phe Pro Asp Ser Lys Gln Gln Gln Lys Lys Phe Arg Gln Glu Phe
610 615 620
Arg Ala Lys Tyr His Arg Trp Ser Tyr Arg Lys Leu Ala Gln Glu Ile
625 630 635 640
<210> 21
<211> 612
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64效应子序列
<220>
<223> MG64-34效应子
<400> 21
Met Ser Gln Ile Thr Ile Gln Cys Arg Leu Val Ala Lys Glu Pro Ile
1 5 10 15
Arg His Thr Leu Trp Gln Leu Met Ala Asp Leu Asn Thr Pro Phe Ile
20 25 30
Asn Glu Leu Leu Gln Lys Val Ala Gln His Pro Asp Phe Glu Lys Trp
35 40 45
Lys Gln Arg Gly Arg Leu Lys Val Lys Val Ile Glu Gln Leu Gly Asn
50 55 60
Glu Leu Lys Lys Asp Pro Arg Phe Leu Gly Gln Pro Ala Arg Phe Tyr
65 70 75 80
Thr Ser Gly Ile Asn Leu Val Lys Tyr Ile Phe Lys Ser Trp Leu Lys
85 90 95
Leu Gln Gln Arg Leu Gln Gln Lys Leu Asp Arg Lys Arg Arg Trp Leu
100 105 110
Glu Val Leu Lys Ser Asp Asp Gln Leu Ile Lys Asp Gly Gln Thr Asp
115 120 125
Leu Glu Thr Ile Arg Gln Lys Ala Thr Glu Ile Leu Gln Ser Tyr Glu
130 135 140
Gly Thr Glu Gln Leu Phe Asn Thr Leu Phe Gln Ala Tyr Asn Ser Glu
145 150 155 160
Glu Asp Ile Leu Thr Arg Thr Ala Leu Asn Tyr Leu Leu Lys Asn Arg
165 170 175
Cys Lys Leu Pro Gln Lys Pro Glu Asp Ala Lys Lys Phe Ala Lys Arg
180 185 190
Arg Arg Gln Val Glu Ile Ala Ile Lys Arg Leu Gln Glu Gln Ile Lys
195 200 205
Ala Arg Leu Pro Gln Gly Arg Asp Val Thr Asn Glu Asn Trp Leu Glu
210 215 220
Thr Leu Asn Leu Ala Cys Tyr Thr Asp Pro Glu Asn Ile Glu Glu Ala
225 230 235 240
Arg Ser Trp Gln Asp Lys Leu Leu Thr Lys Ser Ser Ser Ile Pro Phe
245 250 255
Pro Ile Asn Tyr Glu Thr Asn Glu Asp Leu Ile Trp Ser Lys Asn Glu
260 265 270
Lys Gly His Leu Cys Val Gln Phe Asn Gly Ile Ser Asp Leu Lys Phe
275 280 285
Lys Ile Tyr Cys Asp Lys Arg Gln Leu Lys Trp Phe Gln Arg Phe Tyr
290 295 300
Glu Asp Gln Gln Ile Lys Lys Ser Asn Asn Asn Gln His Ser Ser Ala
305 310 315 320
Leu Phe Thr Leu Arg Ser Gly Arg Ile Leu Trp Gln Glu Asp Lys Gly
325 330 335
Lys Gly Gln Leu Trp Asp Ile His Arg Leu Thr Leu Gln Cys Thr Leu
340 345 350
Asp Thr Arg Thr Trp Thr Gln Glu Gly Thr Glu Gln Val Lys Glu Glu
355 360 365
Lys Ala Asp Glu Ile Ala Gly Ile Leu Thr Arg Met Asn Glu Lys Gly
370 375 380
Asp Leu Thr Lys Asn Gln Gln Ala Phe Ile Gln Arg Lys Gln Ser Thr
385 390 395 400
Leu Asp Lys Leu Glu Asn Pro Phe Pro Arg Pro Ser Arg Pro Val Tyr
405 410 415
Arg Gly Gln Ser Asn Ile Leu Leu Gly Val Ser Met Glu Leu Lys Lys
420 425 430
Pro Ala Thr Ile Ala Val Ile Asp Gly Met Thr Arg Lys Val Leu Thr
435 440 445
Tyr Arg Asn Ile Lys Gln Leu Leu Gly Lys Asn Tyr Pro Leu Leu Asn
450 455 460
Arg Gln Arg Arg Gln Lys Gln Leu Gln Ser His Gln Arg Asn Val Ala
465 470 475 480
Gln Arg Lys Glu Ala Phe Asn Gln Phe Gly Asp Ser Glu Leu Gly Glu
485 490 495
Tyr Ile Asp Arg Leu Leu Ala Lys Ala Ile Ile Ala Ile Ala Lys Gln
500 505 510
Tyr Gln Ala Arg Ser Ile Val Val Pro His Leu Lys Asp Ile Arg Glu
515 520 525
Ala Ile Gln Ser Glu Ile Gln Ala Leu Ala Glu Ala Lys Ile Pro Asn
530 535 540
Cys Ile Glu Ala Gln Ala Glu Tyr Ala Lys Lys Tyr Arg Ile Gln Val
545 550 555 560
His Gln Trp Ser Tyr Gly Arg Leu Ile Asp Asn Ile Gln Ala Gln Ala
565 570 575
Ser Lys Leu Gly Ile Val Ile Glu Glu Ser Gln Gln Pro Leu Gln Gly
580 585 590
Thr Pro Leu Gln Lys Ala Ala Glu Leu Ala Phe Lys Ala Tyr Gln Ser
595 600 605
Arg Leu Ser Ala
610
<210> 22
<211> 525
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64效应子序列
<220>
<223> MG64-35效应子
<400> 22
Arg Glu Val Leu Ser Gln Leu Ser Thr Gln Ser Thr Ile Glu Gly Pro
1 5 10 15
Pro Asp Thr Gln Thr Lys Arg Pro Lys Ala Lys Ser Arg Lys Ser Lys
20 25 30
Lys Lys Gln Ser Thr Ala Gln Asn Lys Asp Leu Ile Gly Lys Leu Tyr
35 40 45
Lys Ala Tyr Glu Ala Thr Asn Asp Leu Thr Gln Arg Cys Ile Leu Ala
50 55 60
Tyr Leu Ile Lys Asp Ala Gly Thr Ile Ser Glu Glu Glu Glu Thr Pro
65 70 75 80
Glu Ala Phe Thr His Arg Ile His Arg Lys Gln Lys Asp Ile Ala Arg
85 90 95
Leu Glu Asp Arg Leu Gln Ala Arg Leu Pro Lys Gly Arg Asp Leu Thr
100 105 110
Gly Asp Ile Phe Thr Asp Thr Leu Phe Ile Ala Gln His Gln Glu Pro
115 120 125
Glu Asp Val Asn Gln Met Arg Asp Trp Gln Ala Lys Leu Leu Met Arg
130 135 140
Pro Ala Asp Leu Pro Asp Pro Ile Arg Tyr Asp Ser Ser Thr Asp Met
145 150 155 160
Met Trp Lys Pro Asp Asp Gln Gly Arg Ile Thr Val Asn Phe Asn Gly
165 170 175
Leu Glu Lys Phe Leu Lys Asn Ser Asp Leu Glu Val Lys Ser Trp Leu
180 185 190
Lys Glu His Gln Ala Tyr Pro Phe Arg Ile Gln Cys Asp Gln Arg Gln
195 200 205
Leu Pro Tyr Phe Gln Arg Phe Leu Ala Asp Trp Gln Ala Tyr Thr Ala
210 215 220
Asp Ala Glu Asn Tyr Pro Ala Gly Leu Leu Thr Leu Ser Ser Ala Met
225 230 235 240
Leu Ala Trp Arg Lys Gly Lys Lys Asn Arg Lys Gly Glu Pro Trp Asn
245 250 255
Ile His Gln Leu Val Leu Tyr Cys Ser Phe Asp Thr Arg Leu Leu Thr
260 265 270
Ala Glu Gly Thr Ala Ala Val Gln Gln Gln Lys Ile Glu Lys Ala Gln
275 280 285
Lys Gln Ala Glu Ser Ala Gln Asn Lys Lys Leu Asn Asp Asn Gln Arg
290 295 300
Gln Ala Arg Asn Arg Ser Ala Thr Thr Leu Arg Lys Leu Asp Asn Leu
305 310 315 320
Pro Thr Arg Pro Ser Gln Lys Ala Tyr Gln Ala Lys Pro Glu Leu Leu
325 330 335
Leu Gly Leu Ser Ile Gly Leu Ser Glu Pro Ile Thr Val Ala Val Val
340 345 350
Asp Ala Ser Thr Gln Gln Val Leu Thr Tyr Arg Thr Ser His Thr Leu
355 360 365
Leu Gly Glu Gln His Arg Leu Leu Arg Arg Gln Arg Gln Lys Gln Gln
370 375 380
Gln Asn Arg Leu Lys Arg Gln Gln Asn Gln Lys Lys Gly Ile Arg His
385 390 395 400
Gln Pro Ser Glu Ser Glu Leu Gly Gln Tyr Val Asp Arg Leu Leu Ala
405 410 415
Lys Ala Ile Thr Gln Leu Ala Gln Ser His Gln Val Ser Ser Ile Val
420 425 430
Leu Pro Asn Leu Leu Asn Arg Arg Asp Leu Leu Asp Ser Glu Ile Gln
435 440 445
Ala Arg Ala Glu Gln Gln Cys Pro Gly Ser Ile Ser Ala Gln Glu Lys
450 455 460
Tyr Ala Lys Ala Phe Arg Gln Ser Leu His Ser Trp Asp Tyr Arg Arg
465 470 475 480
Leu Ile Glu Ala Ile Arg Gly Ser Ala Gly Lys His Asp Ile Pro Leu
485 490 495
Glu Glu Ala Phe Leu Thr Ala Ser Ser Asp Pro Lys Glu Gln Ala Lys
500 505 510
Glu Ile Ala Ile Ala Ala Tyr Gln Ala Arg Thr Glu Asp
515 520 525
<210> 23
<211> 724
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64效应子序列
<220>
<223> MG64-36效应子
<400> 23
Met Glu Thr Arg Glu Met Ser Gln Pro Asn Leu Pro Ala Cys Met Lys
1 5 10 15
Thr Ile Met Cys Cys Leu Cys Ala Ser Pro Glu Thr Arg Arg Tyr Phe
20 25 30
Trp Glu Thr Met Val Ser Tyr Thr Leu Leu Val Asn Glu Leu Leu Glu
35 40 45
Ala Val Pro Asn Arg Pro Glu Phe Pro Gln Trp Gln Arg Arg Gly Thr
50 55 60
Ile Asp Arg Glu Ala Val Arg Ile Val Leu Lys Pro Leu Lys Ala Lys
65 70 75 80
Pro Asn Tyr Ala Gln Leu Pro Lys Arg Phe Phe Thr Ser Ala Glu Leu
85 90 95
Ile Val Cys Tyr Val Tyr Lys Ser Trp Leu Ala Leu Gln Lys Arg Arg
100 105 110
Gln Trp Gln Leu Glu Gly Lys His Arg Trp Leu Ala Ala Ile Ala Ser
115 120 125
Asp Leu Lys Ser Ile Leu Ser Ser Asp Leu Ser Phe Glu Thr Val Gln
130 135 140
Ala Lys Ala Arg Gln Ile Leu Glu Gln Ala Glu Gln Asp Leu Glu Pro
145 150 155 160
Pro Pro Pro Glu Val Thr Lys Lys Gly Lys Lys Ser Lys Arg Arg Lys
165 170 175
Lys Ser Lys Ser Leu Leu Lys Tyr Leu Leu Asp Arg His Asp Glu Thr
180 185 190
Thr Gln Glu Leu Glu Arg Arg Ala Ile Cys His Leu Leu Arg His Asp
195 200 205
Leu Lys Val Ile Glu Glu Glu Asp Thr Pro Glu Thr Ile Gln His Val
210 215 220
Ile Asp Arg Lys Arg Ile Glu Ile Glu Arg Leu Thr Glu Gln Leu Gln
225 230 235 240
Ser Arg Leu Pro Lys Gly Arg Asp Pro Asn His Glu Arg Phe Met Glu
245 250 255
Arg Leu Glu Met Ala Ile Ala Leu Pro Asp Gly Ser Pro Lys His Trp
260 265 270
Asp Pro Glu Glu Phe Asp Glu Trp Arg Ile Gln Lys Gln Ile Pro Glu
275 280 285
Leu Asn Thr Leu Pro Tyr Pro Ile Leu Phe Gly Ser Ala Ser Asp Leu
290 295 300
Tyr Trp Asp Ile Leu Asn Asp Thr Thr Ser Ala Ala Thr Val Ser Ala
305 310 315 320
Lys Lys Lys Ser Arg Lys Ser Lys Arg Pro Asn Glu Arg Leu Gln Val
325 330 335
Arg Phe Lys Gly Leu Asp Glu His Lys Cys Lys Ile Gln Cys Asp Arg
340 345 350
Arg Gln Leu Lys Thr Phe Arg Gln Phe Ala Thr Asp Tyr Ile Ser Asn
355 360 365
Gln Gln Leu Pro Lys Asp Glu Lys Phe Gly Glu Gly Leu Phe Ala Leu
370 375 380
Arg Ser Ala Cys Leu Ile Trp Lys Val Asp Pro Asp Ala Ser Ala Ser
385 390 395 400
Arg Arg Asn Arg Gln Lys Ala Val Leu Arg Lys Asp Ser His Leu Lys
405 410 415
Ala Ser Leu Glu Lys Gly Glu Val Cys Leu Ile Asp Tyr Pro Trp Glu
420 425 430
Thr His Arg Leu Tyr Leu His Cys Thr Phe Asp Ile Arg Leu Leu Thr
435 440 445
Gln Gln Gly Thr Glu Gln Val Arg Leu Lys Lys Leu Asp Ala Ala Gln
450 455 460
Lys Ser Val Glu Lys Thr Gln Glu Arg Gln Ala Ala Asp Pro Ser Ile
465 470 475 480
Thr Met Thr Ala Asn Gln Ala Ser Arg Phe Lys Ala Lys Gln Thr Ser
485 490 495
Ile Ser Arg Leu Glu Lys Asn Arg Pro Ala Glu Arg Pro Glu Cys Gln
500 505 510
Ile Tyr Gln Pro Asn Pro Asn Ile Val Val Gly Ile Ser Leu Ser Arg
515 520 525
His Glu Pro Val Thr Val Val Val Phe Asn Lys Glu Lys Asn Gln Ala
530 535 540
Ser Glu Tyr Trp Ser Thr Glu Ser Leu Leu Lys Met Arg Gly Ile Thr
545 550 555 560
Ser Pro Arg Asn Asn Gln Ser Ile Val Gln Leu Gln His Glu Gln Gln
565 570 575
Gln Leu Leu Arg Arg Trp Arg Arg Gln Arg His Tyr Asn Ile Tyr Gln
580 585 590
Arg Pro Glu Gly Gln Lys Gln Gly Asp Tyr His Gln His Asp Ala Glu
595 600 605
Ser Arg Leu Gly Asp Tyr Leu Asp Arg Leu Ile Ala Ala Arg Val Thr
610 615 620
Glu Leu Ala Val Arg Arg Gln Ala Ala Ala Ile Ala Leu Pro Glu Leu
625 630 635 640
Gln Asn Ile Arg Glu Ser Val Glu Ser Asp Ile Gln Ala Arg Ala Glu
645 650 655
Lys Lys His Pro His His Ala Asn Leu Gln Ala Gln Tyr Ala Lys Gln
660 665 670
Tyr Arg Arg Glu Phe His Arg Trp Ser Phe Gly Arg Phe Glu Gln Tyr
675 680 685
Ile Thr Glu Ala Ala Lys Gln Arg Gly Ile Ala Val Tyr Lys Gly Arg
690 695 700
Gln Pro Lys His Gly Asn Glu Gln Glu Lys Ala Leu Ala Val Val Thr
705 710 715 720
Asn Val Ile Ala
<210> 24
<211> 618
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64效应子序列
<220>
<223> MG64-37效应子
<400> 24
Met Ser Gln Lys Thr Val Arg Ala Arg Leu Ile Val Pro Glu Glu Thr
1 5 10 15
Arg Lys Ala Phe Trp Glu Leu Thr Ala Gly Asp Asn Thr Pro Leu Val
20 25 30
Asn Glu Ala Leu Arg Leu Leu Pro Thr His Ser Asp Phe Ser Lys Trp
35 40 45
Arg Gln Lys Gly Asn Leu Pro Asp Lys Ile Ala Glu Asp Leu Val Lys
50 55 60
Thr Leu Lys Glu Asp Leu Arg Phe Val Gly Gln Pro Phe Trp Ser Tyr
65 70 75 80
Ile Ser Ala His Lys Gln Val Thr Tyr Thr Phe Arg Ser Trp Leu Ala
85 90 95
Leu Gln His Arg Lys Gln Trp Lys Leu Ala Gly Lys Arg Leu Trp Leu
100 105 110
Glu Ile Leu Gln Pro Asp Glu Ile Leu Ala Glu Ser Val Gly Tyr Thr
115 120 125
Pro Asp Ala Leu Ile Lys Ala Ala Lys Lys Asn Leu Ala Asp Ile Glu
130 135 140
Ala Gln Asp Asn Pro Phe Asp Ala Leu Phe Ser Ala Tyr Arg Lys Thr
145 150 155 160
Lys Ser Leu Lys Arg Lys Ser Ala Ile Ala Tyr Leu Leu Lys Arg Ser
165 170 175
Ala Lys Leu Leu Pro Glu Glu Glu Asp Ile Ala Lys Leu Ala Gln Arg
180 185 190
Tyr Arg Lys Thr Glu Ile Phe Ile Gln Arg Leu Glu Ala Gln Leu Lys
195 200 205
Ala Ser Leu Pro Lys Gly Arg Asp Met Ser Gly Asp Arg Gln Leu Glu
210 215 220
Ala Leu Gln Gln Ile Ile Gln Ala Pro Pro Met Asp Asp Val Ser Tyr
225 230 235 240
Asn Ala Trp Lys Asn Ala Leu Thr Thr Glu Pro Ala Ala Phe Pro Phe
245 250 255
Pro Ile Ser Ile Glu Thr Ala Ala Trp Leu Ile Trp Ser Gln Asp Asp
260 265 270
Lys Gly Arg Leu Leu Leu Gln Leu Ser Gly Trp Gly Gln His Thr Phe
275 280 285
Lys Val Tyr Phe Asp Lys Ala His Gln His Trp Phe Trp Arg Phe Leu
290 295 300
Gln Asp Gln Glu Thr Asn Gln Asn Gly Gly Asp Gln His Ser Ala Ala
305 310 315 320
Leu Phe Thr Leu Arg Ala Ala Lys Ile Met Trp Phe Pro Ser Lys Lys
325 330 335
His Lys Asp Ala Pro Glu Pro Trp His Arg Tyr His Leu Asn Leu Leu
340 345 350
Cys Thr Ile Asp Thr Arg Ala Trp Thr Gln Glu Gly Thr Glu Ile Ile
355 360 365
Ala Gln Glu Lys Ala Val Lys Thr Ala Lys Gln Leu Ala Ser Met Arg
370 375 380
Lys Lys Glu Ser Leu Thr Gln Asn Gln Gln Gly Tyr Ile Arg Arg Leu
385 390 395 400
Glu Ser Thr Leu Asn Arg Leu Gln Val Pro Tyr Pro Arg Pro Ser Arg
405 410 415
Pro Ile Tyr Gln Gly Lys Pro Glu Ile Leu Val Gly Val Ser Met Gly
420 425 430
Leu Glu Lys Val Ala Thr Val Ala Val Val Asn Ala Leu Thr Gly Arg
435 440 445
Val Leu Thr Tyr Arg Ser Glu Lys Gln Leu Leu Gly Glu Asn Tyr Pro
450 455 460
Leu Leu Arg Gln Ala Arg Ala Glu Ile Ala Lys Lys Ser His Gln Gly
465 470 475 480
His Arg Gln Arg Leu Arg Gly Val Lys Ser Ile Ser Lys Glu Ser Asp
485 490 495
Lys Gly Lys Gln Val Asp Arg Leu Phe Ala Lys Ala Ile Val Glu Leu
500 505 510
Val Val Glu His Gln Ala Gly Ser Ile Val Leu Pro Asp Leu Ala Tyr
515 520 525
Lys Arg Glu Ile Ile Glu Ala Glu Phe Gln Gln Arg Ala Ile Glu Lys
530 535 540
Val Pro Asp Phe Val Asp Gly Gln Lys Glu Tyr Ala Lys Ala Tyr Leu
545 550 555 560
Ser Gln Val His Arg Trp Pro Tyr Ala Arg Leu Gln Gly Cys Thr Thr
565 570 575
Ser Lys Ala Glu Gln Ser Gly Ile Ser Cys Glu Ile Thr Lys Gln Gln
580 585 590
Tyr Ser Gly Thr Pro Gln Asp Lys Ala Lys Gly Leu Gly Phe Leu Ala
595 600 605
Tyr Ser Gln Arg Ser Thr Ala Leu Ala Glu
610 615
<210> 25
<211> 661
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64效应子序列
<220>
<223> MG64-38效应子
<400> 25
Met Ser Ile Ile Thr Ile His Cys His Leu His Thr Thr Glu Ala Ile
1 5 10 15
Arg Arg Leu Leu Trp Gln Val Met Ala Ala Ser Asn Thr Pro Leu Ile
20 25 30
Ser Thr Leu Leu Arg His Val Ala Glu His Pro Asp Phe Asp Thr Trp
35 40 45
Gln Thr Asn Gly Ser Val Pro Val Lys Thr Val Arg Asn Ile Ala Glu
50 55 60
Pro Leu Lys Ala His Tyr Pro Ser Gln Pro Gly Arg Phe Tyr Ala Ser
65 70 75 80
Ala Tyr Gln Met Val Ser Tyr Thr Tyr Glu Ser Trp Leu Ala Thr Gln
85 90 95
Lys Met Ile Lys Leu Arg Leu Asp Gly Thr Arg Arg Trp Leu Ser Ile
100 105 110
Phe Lys Ser Asp Ala Glu Leu Leu Glu Leu Thr Gly Leu Ser Leu Glu
115 120 125
Ser Leu Arg Gln Ser Ala Arg Glu Val Leu Ser Gln Leu Ser Thr Gln
130 135 140
Ser Thr Ala Gly Arg Pro Ser Asp Thr Gln Thr Lys Pro Pro Lys Ala
145 150 155 160
Lys Ser Arg Lys Ser Lys Lys Lys Gln Ala Thr Ala Gln Asp Lys Asp
165 170 175
Leu Ile Gly Lys Leu Phe Lys Ala Tyr Glu Ala Thr Asp Asp Leu Thr
180 185 190
Gln Arg Cys Ile Leu Ala Tyr Leu Ile Lys Asn Gly Gly Thr Ile Thr
195 200 205
Asp Glu Ala Glu Thr Pro Glu Ala Phe Ala His Arg Leu His Arg Lys
210 215 220
Gln Lys Asp Ile Ala Gln Leu Glu Asn Arg Leu Gln Ala Arg Leu Pro
225 230 235 240
Lys Gly Arg Asp Leu Thr Gly Asp Thr Phe Ile Asp Thr Leu Leu Ile
245 250 255
Ala Gln Gln Gln Glu Pro Glu Asp Val Ala Gln Met Arg Asp Trp Gln
260 265 270
Ala Lys Leu Leu Met Arg Pro Ala Asp Leu Pro Tyr Pro Ile Arg Tyr
275 280 285
Asp Ser Ser Thr Asp Met Met Trp Lys Pro Asp Asp Gln Glu Arg Ile
290 295 300
Thr Val Asn Phe Asn Gly Leu Glu Lys Phe Leu Lys Asn Ser Asp Pro
305 310 315 320
Ala Val Lys Ala Trp Leu Lys Glu His Lys Glu Tyr Pro Phe Arg Ile
325 330 335
Gln Cys Asp Gln Arg Gln Leu Pro Tyr Phe Gln Arg Phe Leu Thr Asp
340 345 350
Trp Gln Ala Tyr Thr Ala Asp Lys Ala Asn Tyr Pro Ala Gly Leu Leu
355 360 365
Thr Leu Ser Ser Ala Met Leu Ala Trp Arg Lys Ser Lys Lys Lys Arg
370 375 380
Lys Gly Glu Pro Trp Asn Thr Tyr Gln Leu Ala Leu Tyr Cys Ser Phe
385 390 395 400
Asp Thr Arg Leu Leu Thr Ala Glu Gly Thr Val Glu Val Gln Gln Glu
405 410 415
Lys Leu Arg Lys Ala Gln Lys Gln Ala Asn Ser Thr Lys Asp Lys Lys
420 425 430
Leu Asp Glu Asn Gln Leu Gln Ala Gln Thr Arg Ser Ala Thr Ser Leu
435 440 445
Arg Lys Leu Glu Asn Leu Pro Ala Arg Pro Ser Arg Lys Pro Tyr Glu
450 455 460
Gly Lys Ser Glu Leu Leu Leu Gly Ile Ser Ile Gly Phe Ser Glu Pro
465 470 475 480
Val Thr Val Ala Ile Val Asp Ala Ser Thr Gln Gln Ala Ile Thr Tyr
485 490 495
Arg Thr Ser Arg Thr Leu Leu Gly Asp Gln His Arg Leu Leu Arg Arg
500 505 510
Gln Arg Gln Gln Lys Gln Gln Asn Arg Leu Lys Arg Gln Gln Asn Gln
515 520 525
Lys Lys Gly Ile Arg His Gln Pro Ser Glu Ser Glu Leu Gly Gln Tyr
530 535 540
Val Asp Arg Leu Leu Ala Lys Ala Ile Ile Gln Leu Ala Gln Thr His
545 550 555 560
Gln Val Ser Ser Ile Val Leu Pro Asn Leu Thr Asn Asp Arg Asp Ile
565 570 575
Leu Asn Ser Glu Ile Gln Ala Arg Ala Glu Gln Lys Cys Pro Gly Ala
580 585 590
Ile Ala Ala Gln Ala Lys Tyr Ala Lys Glu Val Arg Ile Ser Ile His
595 600 605
Ser Trp Asp Tyr Arg Arg Leu Ser Asp Ala Ile Arg Ser Ser Ala Ser
610 615 620
Lys Gln Gly Ile Pro Leu Glu Glu Ala Phe Leu Thr Val Arg Thr Asn
625 630 635 640
Pro Lys Glu Gln Ala Arg Glu Leu Ala Ile Ala Ala Tyr Gln Ala Arg
645 650 655
Thr Glu Asn Arg Asn
660
<210> 26
<211> 625
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64效应子序列
<220>
<223> MG64-39效应子
<400> 26
Ala Ser Ser Thr His Lys Pro Met Ser Gln Lys Thr Ile Arg Cys Arg
1 5 10 15
Leu Val Ala Ser Glu Glu Thr Arg Arg Ala Ile Trp Gln Leu Met Ala
20 25 30
Glu Arg Asn Thr Pro Leu Val Asn Glu Val Leu Arg Gln Leu Pro Glu
35 40 45
His Pro Asp Phe Pro Lys Trp Gln Gln Arg Gly Lys Leu Pro Asp Leu
50 55 60
Pro Val Lys Arg Leu Ile Asp Ser Leu Lys Pro Asp Pro Arg Phe Cys
65 70 75 80
Asp Gln Pro Val Trp Tyr Tyr Ile Ser Ala Gln Lys Gln Val Ala Tyr
85 90 95
Thr Phe Arg Ser Trp Leu Ser Leu Gln Lys Arg Lys Gln Trp Arg Leu
100 105 110
Glu Gly Lys Arg Arg Trp Leu Asp Ile Leu Gln Pro Asp Ala Glu Leu
115 120 125
Ala Glu Gln Ala Lys Cys Ser Val Glu Ala Leu Arg Leu Ala Ala Ser
130 135 140
Asn Met Leu Lys Lys Val Asp Asp Pro Asp Pro Phe Lys Leu Leu Phe
145 150 155 160
Lys Glu Tyr Gly Thr Ser Lys Ser Thr Lys Arg Gln Cys Ala Leu Ala
165 170 175
Tyr Leu Leu Lys Arg Asp Ala Lys Leu Glu Pro Glu Ala Glu Asp Leu
180 185 190
Glu Lys Leu Asp Gln Arg Arg Ser Lys Ala Glu Ile Gln Ile Lys Gln
195 200 205
Leu Glu Thr Gln Leu Lys Ala Ser Leu Pro Lys Gly Arg Asp Leu Thr
210 215 220
Gly Gln Ile Gln Ala Gln Ala Leu Thr Gln Ser Val Gln Ser Pro Pro
225 230 235 240
Leu Asp Asp Glu Ala Tyr Ser Thr Trp His Ala Ser Leu Ala Arg Glu
245 250 255
Pro Ala Ile Phe Pro Phe Pro Ile Ile Tyr Glu Thr Ile Glu Ser Leu
260 265 270
Val Trp Ser Lys Asn Ser Lys Gly Arg Tyr Ser Val Cys Phe Gln Gly
275 280 285
Gln Gly Thr Gly Ile His Thr Phe Lys Ile Tyr Cys Asp Lys Pro His
290 295 300
Gln His Trp Phe Glu Arg Phe Trp Ile Asp Gln Glu Thr Lys Arg Ser
305 310 315 320
Gly Asn Asp Arg His Ser Ala Gly Leu Phe Thr Leu Arg Ser Ala Arg
325 330 335
Leu Ser Trp Ile Pro Ser Lys Lys His Gln Asp Glu Pro Glu Pro Trp
340 345 350
Asn Arg Tyr Tyr Leu Ser Leu Ser Cys Thr Val Asp Thr Ala Leu Trp
355 360 365
Thr Gln Glu Gly Thr Gln Thr Val Ile Gln Glu Lys Ala Val Ala Thr
370 375 380
Ala Ser Lys Leu Gln Ser Met Gln Glu Lys Glu Ser Leu Asn Lys Asn
385 390 395 400
Gln Gln Gly Tyr Val Arg Arg Leu Glu Ser Thr Leu Thr Arg Leu Gln
405 410 415
Thr Pro Tyr Pro Arg Pro Ser Arg Ala Leu Tyr Gln Gly Arg Ser Asp
420 425 430
Ile Leu Val Gly Val Ser Met Gly Leu Asp Lys Pro Ala Thr Val Ala
435 440 445
Val Val Asn Ala Leu Thr Gly Glu Val Leu Thr Tyr Arg Ser Thr Lys
450 455 460
Gln Leu Leu Gly Glu Gln Tyr Pro Leu Leu Gln Arg Ala Arg Ser Glu
465 470 475 480
Arg Ala Lys Val Ala His Gln Gly His Arg Gln Arg Arg Lys Gly Gly
485 490 495
Lys Arg Val Asn Gln Glu Ser Asn Leu Gly Lys His Val Asp Arg Leu
500 505 510
Leu Ala Lys Ala Ile Val Glu Val Ala Gln Gln Tyr Gln Ala Gly Ser
515 520 525
Ile Val Leu Pro Asp Leu Ala His Ile Arg Glu Ile Val Glu Ser Glu
530 535 540
Val Lys Gln Lys Ala Ala Lys Lys Val Pro Asp Phe Leu Asp Gly Gln
545 550 555 560
Lys Gln Tyr Ala Lys Ala Tyr Arg Thr Gln Val His Gln Trp Ser Tyr
565 570 575
His Arg Leu Gln Asp Ala Ile Thr Ser Lys Ala Gly Gln Ser Ser Ile
580 585 590
Ala Thr Glu Val Ala Lys Gln Asp Tyr Ser Gly Ser Pro Gln Glu Lys
595 600 605
Ala Lys Ser Leu Cys Leu Ala Gly Tyr Glu Gln Arg Leu Ala Leu Ser
610 615 620
Ser
625
<210> 27
<211> 595
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64效应子序列
<220>
<223> MG64-40效应子
<400> 27
Met Ala Glu Arg Asn Thr Pro Leu Val Asn Glu Val Leu Arg Gln Leu
1 5 10 15
Pro Glu His Pro Asp Phe Ala Lys Trp Gln Gln Lys Gly Asn Leu Pro
20 25 30
Asp Val Ala Val Lys Arg Ile Ile Asp Ala Leu Lys Ser Asp Pro His
35 40 45
Phe Ser Asp Gln Pro Phe Trp Tyr Tyr Thr Ser Ala Gln Lys Gln Val
50 55 60
Thr Tyr Thr Phe Lys Ser Trp Leu Ser Ile Gln Arg Arg Lys Gln Trp
65 70 75 80
Arg Leu Gln Gly Lys Arg Phe Trp Leu Glu Ile Leu Leu Pro Asp Ala
85 90 95
Lys Leu Ala Glu Leu Ala Glu Cys Ser Val Glu Lys Leu Arg Thr Glu
100 105 110
Ala Ala Lys Ile Leu Thr Lys Val Gly Asp Val Asp Pro Phe Lys His
115 120 125
Leu Leu Glu Gln Tyr Arg His Glu Lys Lys Leu Leu Arg Lys Tyr Ala
130 135 140
Ile Ala Phe Leu Leu Lys Arg Asn Thr Gly Ile Asp Arg Glu Glu Asp
145 150 155 160
Leu Glu Gln Leu Lys Gln Arg Ser Arg Arg Val Glu Leu Gln Ile Arg
165 170 175
Arg Leu Glu Ile Gln Leu Gln Ala Ser Leu Pro Lys Gly Arg Asp Leu
180 185 190
Thr Gly Glu Arg Gln Ala Ala Ala Leu Ala Gln Ser Val Leu Ala Ser
195 200 205
Pro Asp Asp Asp Glu Ser Tyr Glu Leu Trp Arg Asn Thr Val Thr Arg
210 215 220
Glu Pro Ala Gln Phe Pro Phe Pro Val Ile Cys Glu Thr Ser Glu Trp
225 230 235 240
Leu Lys Trp Gln Arg Asp Gln Asn Gly Arg Ile Ser Val Gly Phe Ser
245 250 255
Ala Leu Ser Glu His Val Phe Lys Ile Tyr Cys Asp Lys Pro His Gln
260 265 270
His Trp Phe Asn Arg Phe Phe Glu Asp Gln Glu Thr Lys Arg Ser Gly
275 280 285
Gly Lys Gln His Ser Ala Gly Leu Phe Thr Leu Arg Ser Ala Lys Leu
290 295 300
Thr Trp Val Pro Ser Asn Lys His Ala Asn Ala Ser Glu Pro Trp Asn
305 310 315 320
Cys Tyr Tyr Leu Asn Leu Ser Cys Thr Val Asp Thr Arg Leu Trp Thr
325 330 335
Gln Glu Gly Thr Gln Ile Val Ile Gln Glu Lys Ala Ala Glu Lys Ala
340 345 350
Gly Lys Leu Glu Ser Met Arg Arg Lys Glu Asn Leu Ser Lys Thr Gln
355 360 365
Gln Gly Tyr Ile Lys Arg Leu Glu Ala Thr Leu Asp Lys Leu Gln Thr
370 375 380
Pro Tyr Pro Arg Pro Ser Arg Gln Leu Tyr Ser Gly Lys Ala Asn Ile
385 390 395 400
Leu Ala Gly Val Ser Met Gly Leu Asp Lys Pro Ala Thr Val Ala Val
405 410 415
Val Asp Ala Leu Thr Gly Glu Val Leu Thr Tyr Arg Ser Val Lys Gln
420 425 430
Leu Leu Gly Glu Asn His Gln Leu Leu Arg Arg Ala Gln Ile Glu Lys
435 440 445
Thr Lys Ile Ala His Arg Gly His Lys Asn Arg Arg Gln Gly Gly Arg
450 455 460
Lys Val Ser Glu Glu Ser Asn Val Ala Gln Gln Val Asp Arg Leu Leu
465 470 475 480
Ala Lys Ser Ile Val Glu Ile Ala Arg Lys Tyr Gln Ala Ser Ser Ile
485 490 495
Val Val Pro Asp Leu Ala Asp Ile Arg Glu Ile Val Glu Thr Glu Val
500 505 510
Lys Ala Arg Ala Gln Asp Lys Val Pro Asp Phe Val Glu Gly Gln Gln
515 520 525
Gln Tyr Ala Lys Ala Tyr Arg Thr Gln Val His Gln Trp Ser Tyr Arg
530 535 540
Arg Leu Gln Glu Ala Val Arg Thr Lys Ala Glu Gln Ser Gly Ile Thr
545 550 555 560
Ile Glu Val Val Arg Gln Gly Leu Ser Gly Thr Gln His Glu Lys Ala
565 570 575
Lys Ala Leu Ala Leu Gln Gly Tyr Glu Lys Arg Ile Arg Glu His Val
580 585 590
Glu Met Ala
595
<210> 28
<211> 537
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64效应子序列
<220>
<223> MG64-41效应子
<400> 28
Gln Leu Ala Gly Gln Asn Arg Trp Leu Glu Val Leu Gln Asn Asp Glu
1 5 10 15
Thr Leu Met Ala Val Ser Gly Leu Glu Ile Gln Ala Leu Arg Ala Glu
20 25 30
Ser Thr Lys Leu Leu Asp Leu Leu Ser Ser Gln Ile Thr Lys Pro Ala
35 40 45
Lys Gly Ser Lys Lys Thr Asn Arg Gly Lys Gly Lys Lys Gln Ala Lys
50 55 60
Gln Thr Gln Gly Lys Thr Leu Tyr Gln Ser Leu Trp Asp Leu Tyr Arg
65 70 75 80
Glu Thr Glu Asp Ile Leu Gln Lys Cys Ala Ile Ala Tyr Leu Leu Lys
85 90 95
Asn Lys Cys Gln Val Pro Gly Lys Pro Glu Asp Pro Glu Lys Phe Gln
100 105 110
His Arg Arg Arg Lys Ala Glu Ile Arg Ala Glu Arg Leu Asn Glu Gln
115 120 125
Leu Ile Glu Thr Arg Leu Pro Lys Gly Arg Asp Leu Thr Asn Glu Gln
130 135 140
Trp Leu Glu Ala Leu Lys Ile Ala Thr Glu Gln Val Pro Lys Asp Glu
145 150 155 160
Glu Glu Ala Ala Ile Trp Gln Ser Arg Leu Leu Thr Asn Ala Ala Lys
165 170 175
Phe Pro Phe Pro Val Ala Tyr Glu Thr Asn Glu Asp Leu Lys Trp Phe
180 185 190
Leu Asn Gly Lys Gly Arg Leu Cys Val Arg Phe Asn Gly Leu Ser Glu
195 200 205
His Thr Phe Lys Ile Tyr Cys Asp Gln Arg Gln Leu His Trp Phe Lys
210 215 220
Arg Phe Leu Glu Asn Lys Gln Asn Lys Lys Asp Asn Lys Gly Lys His
225 230 235 240
Thr Ser Gly Leu Phe Thr Leu Arg Ser Gly Arg Ile Leu Trp Lys Pro
245 250 255
His Ser Gly Val Val Lys Asn Ala Pro Trp Thr Val Asn His Leu Thr
260 265 270
Leu Gln Cys Ser Val Asp Thr Arg Leu Trp Thr Ala Glu Gly Thr Glu
275 280 285
Gln Val Arg Gln Glu Lys Ala Thr Ser Ile Ala Lys Val Ile Ala Gly
290 295 300
Thr Lys Ala Lys Gly Asn Leu Asn Arg Asn Gln Leu Asp Ser Ile Ser
305 310 315 320
Asn Arg Glu Lys Thr Leu Glu Leu Met His Asn Pro Phe Pro Arg Pro
325 330 335
Ser Gln Pro Ile Tyr Gln Gly Asn Pro Ser Ile Ile Ala Ala Val Ser
340 345 350
Phe Gly Leu Glu Lys Pro Ala Thr Leu Ala Ile Val Asp Val Ile Thr
355 360 365
Gly Lys Ala Ile Thr Tyr Arg Ser Ile Arg Gln Leu Leu Gly Asn Ser
370 375 380
Tyr Lys Leu Phe Asn Lys Gln Arg Leu Lys Gln Lys Gln Arg Asp Tyr
385 390 395 400
Trp Arg His Lys Asn Gln Gln Lys Ser Ala Asp Asn Arg Ile Ser Glu
405 410 415
Gly Gly Leu Gly Asp Tyr Val Asp Ser Leu Ile Ala Lys Ser Ile Val
420 425 430
Asp Thr Ala Ala Arg Tyr Glu Ala Val Ser Ile Val Leu Pro Asp Gln
435 440 445
Ser Asn Ile Arg Glu Ile Ile His Ala Glu Ile Gln Ala Lys Ala Glu
450 455 460
Arg Lys Ile Pro Gly Leu Lys Glu Lys Gln Asp Lys Tyr Ala Ala Gln
465 470 475 480
Tyr Arg Arg Ser Val His Arg Trp Ser Tyr Gly Arg Leu Ser Gln Lys
485 490 495
Ile Thr Thr Lys Ala Ala Ile His Gly Val Ala Ile Glu Ile Thr Arg
500 505 510
Gln Pro Leu Gln Gly Thr Pro Gln Glu Lys Ala Val Gly Leu Ala Val
515 520 525
Ser Ala Tyr Gln Ser Arg Gln Val Gly
530 535
<210> 29
<211> 643
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64效应子序列
<220>
<223> MG64-42效应子
<400> 29
Met Ser Gln Ile Thr Val Gln Cys Arg Leu Val Ala Ser Glu Glu Thr
1 5 10 15
Arg Gln Tyr Leu Trp Tyr Leu Met Ala Asp Ile Tyr Thr Pro Phe Val
20 25 30
Asn Glu Met Leu Arg Gln Ile Arg Glu Asp Asp Asn Phe Glu Gln Trp
35 40 45
Arg Gln Ala Gly Lys Ile Pro Ala Gly Val Phe Glu Asp Tyr Arg Lys
50 55 60
Ala Leu Lys Thr Glu Ser Arg Phe Gln Gly Met Pro Gly Arg Trp Tyr
65 70 75 80
Tyr Ala Gly Arg Glu Glu Val Lys Arg Ile Tyr Lys Ser Trp Leu Ala
85 90 95
Leu Arg Arg Arg Leu Arg Asn Gln Leu Ser Gly Gln Asn Arg Trp Leu
100 105 110
Glu Val Leu Gln Ser Asp Glu Thr Leu Met Ala Val Ser Gly Leu Asp
115 120 125
Leu Pro Ala Leu Arg Ala Ala Ser Thr Lys Leu Leu Asp Leu Leu Ser
130 135 140
Ser Gln Ile Ala Lys Pro Ala Lys Gly Ser Lys Lys Thr Asn Arg Gly
145 150 155 160
Lys Gly Lys Lys Gln Ala Lys Gln Thr Gln Gly Lys Ser Leu Tyr Gln
165 170 175
Ser Leu Trp Asp Leu Tyr Lys Glu Thr Glu Asp Ile Leu Gln Lys Cys
180 185 190
Ala Ile Ala Tyr Leu Leu Lys Asn Lys Ser Gln Val Pro Asp Lys Pro
195 200 205
Glu Asp Pro Glu Lys Phe Arg His Arg Arg Arg Lys Ala Glu Ile Arg
210 215 220
Thr Glu Arg Leu Asn Glu Gln Leu Thr Lys Thr Arg Leu Pro Lys Gly
225 230 235 240
Arg Asp Leu Thr Asn Glu Gln Trp Leu Glu Ala Leu Ala Ile Ala Thr
245 250 255
Glu Gln Ile Pro Lys Asp Glu Thr Glu Ala Ala Ile Trp Gln Ser Arg
260 265 270
Leu Leu Thr Asp Ala Ala Ser Leu Pro Phe Pro Val Ala Tyr Glu Thr
275 280 285
Asn Glu Asp Leu Lys Trp Phe Leu Asn Gly Lys Gly Arg Leu Cys Val
290 295 300
Ser Phe Asn Gly Leu Ser Glu His Thr Phe Glu Ile Tyr Cys Asp Lys
305 310 315 320
Arg Gln Leu His Trp Phe Lys Arg Phe Leu Glu Asp Gln Gln Ile Lys
325 330 335
Lys Glu His Gln Gly Lys Arg Ser Ser Gly Leu Phe Thr Leu Arg Ser
340 345 350
Gly Arg Ile Ser Trp Thr Ser Pro Ser Asp Ile Asp Lys Ser Pro Cys
355 360 365
Trp Thr Ala Asn Arg Leu Thr Leu His Cys Ser Val Asp Thr Arg Leu
370 375 380
Trp Thr Gln Glu Gly Thr Glu Glu Val Arg Gln Glu Lys Ala Thr Asn
385 390 395 400
Ile Ala Lys Ile Ile Ala Gly Thr Lys Ala Lys Gly Asn Leu Asn Gln
405 410 415
Lys Gln Gln Asp Phe Ile Thr Lys Arg Glu Thr Thr Leu Lys Leu Leu
420 425 430
His Asn Pro Phe Pro Arg Pro Ser Lys Pro Leu Tyr Gln Gly Asn Pro
435 440 445
Ser Ile Ile Ala Ala Val Ser Phe Gly Leu Glu Lys Pro Ala Thr Leu
450 455 460
Ala Ile Val Asp Ile Thr Thr Gly Lys Ala Ile Thr Tyr Arg Ser Ile
465 470 475 480
Arg Gln Leu Leu Asp Gln Asn Tyr Lys Leu Phe Thr Lys His Arg Leu
485 490 495
Gln Gln Gln Gln Arg Ala His Gln Arg His Gln Asn Gln Lys Glu Ser
500 505 510
Ala Glu Asn Arg Ile Ser Glu Gly Gly Leu Gly Glu His Val Asp Ser
515 520 525
Leu Ile Ala Lys Ala Ile Leu Glu Thr Ala Ala Glu Tyr Gly Ala Ser
530 535 540
Ser Ile Val Leu Pro Glu Leu Gly Asn Ile Arg Glu Ile Ile Gln Ala
545 550 555 560
Glu Val Ile Ala Lys Ala Glu Arg Lys Ile Pro Gly Leu Lys Glu Lys
565 570 575
Gln Asp Glu Tyr Ala Ala Lys Phe Arg Ala Ser Val His Arg Trp Ser
580 585 590
Tyr Gly Arg Leu Ala Gln Lys Ile Thr Thr Lys Ala Ala Leu Gln Gly
595 600 605
Leu Glu Thr Glu Ser Thr Arg Gln Pro Leu Gln Gly Ser Pro Gln Glu
610 615 620
Lys Ala Arg Asn Leu Ala Ile Ala Ala Tyr Glu Ser Arg Lys Val Asp
625 630 635 640
Gln Arg Ala
<210> 30
<211> 526
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64效应子序列
<220>
<223> MG64-43效应子
<400> 30
Met Pro Thr Thr Leu Ala Pro Lys Arg Pro Leu Ser Lys Ser Ser Asp
1 5 10 15
Tyr Met Lys Thr Ile Arg Cys Cys Leu Cys Ala Asn Pro Glu Thr Arg
20 25 30
Arg Tyr Phe Trp Lys Ile Met Val Thr Tyr Thr Leu Leu Val Asn Glu
35 40 45
Leu Leu Ala Ala Met Pro Gln Arg Pro Glu Phe Ala Gln Trp Lys Gln
50 55 60
Arg Gly Thr Ile Ala Arg Glu Ala Val Arg Ile Val Leu Thr Pro Leu
65 70 75 80
Lys Ser Asp Pro Thr Tyr Ala Asp Leu Pro Lys Arg Phe Phe Ser Ser
85 90 95
Ala Glu Leu Leu Val Cys Tyr Val Tyr Lys Ser Trp Leu Ala Leu Gln
100 105 110
Lys Arg Arg Tyr Trp Lys Leu Val Gly Lys Gln Arg Trp Leu Gln Val
115 120 125
Ile Glu Asp Asp Leu Gln Ser Leu Leu Thr Asp Asn Phe Ser Leu Glu
130 135 140
Ser Val Gln Ser Lys Ala His Gln Ile Leu Glu Gln Ala His Lys Glu
145 150 155 160
Leu Glu Lys Gln Pro Gln Arg Phe Lys Lys Lys Gly Lys Lys Ser Arg
165 170 175
Pro Leu Phe Gly Tyr Leu Leu Asp Leu Tyr Gly Thr Thr Ala Asp Lys
180 185 190
Leu Glu Arg Arg Ala Ile Gly His Leu Leu His His Asp Leu Lys Val
195 200 205
Ser Asp Thr Glu Asp Phe Pro Glu Thr Ile Gln Phe Ser Ile Asp Gln
210 215 220
Gln Gln Val Glu Ile Ala Arg Leu Lys Glu Gln Leu Gln Ser Arg Leu
225 230 235 240
Pro Asp Gly Arg Asp Pro Thr Gln Ala Arg Phe Leu Glu Lys Leu Arg
245 250 255
Ile Ala Thr Ala Leu Pro Glu Leu Glu Leu Glu Gly Phe Asp Glu Glu
260 265 270
His Phe Ser Glu Trp Arg Thr Gln Lys Gln Ile Pro Leu Leu Asn Pro
275 280 285
Leu Pro Tyr Pro Val Leu Phe Gly Ser Ser Ser Asp Leu His Trp Lys
290 295 300
Leu Glu Pro Gln Lys Ala Thr Thr Glu Ala Asn Ile Ser Pro Glu Val
305 310 315 320
Pro Thr Ala Arg Ser Glu Arg Val Lys Glu Arg Ile Gln Val Arg Phe
325 330 335
Lys Gly Asp Glu Leu Gln Asp Ser Trp Phe Lys Leu Gln Cys Asp Arg
340 345 350
Arg Gln Leu Pro Ile Phe Arg Gln Phe Val Thr Asp Tyr Leu Cys Gln
355 360 365
Lys Gln Ala Pro Asp His Glu Lys Phe Gly Glu Gly Leu Phe Thr Leu
370 375 380
Arg Ser Ala Cys Leu Val Trp Lys Glu Asp Pro Gln Gly Ala Arg Lys
385 390 395 400
Arg Lys Lys Arg Arg Lys Gln Gly Ala Cys Gln Asp Glu Pro Trp Glu
405 410 415
Thr His Arg Leu Tyr Leu His Cys Thr Ile Asp Thr Arg Phe Leu Thr
420 425 430
Gln Glu Gly Thr Glu Gln Val Arg Ala Thr Lys Leu Asp Leu Ala Gln
435 440 445
Lys Ala Leu Glu Gly Ile Glu Asn Lys Thr Ala Leu Glu Thr Val Thr
450 455 460
Gln Glu Pro Ser Ala Glu Gln Gln Lys His Leu Lys Arg Lys Gln Thr
465 470 475 480
Thr Val His Arg Leu Glu Thr Gln Lys Pro Pro Val Arg Pro Thr Ile
485 490 495
Gln Pro Tyr Glu Gly Lys Ser Asn Ile Val Val Gly Val Ser Leu Ser
500 505 510
Arg His Glu Pro Val Thr Leu Ile Val Phe Asp Thr Ala Gln
515 520 525
<210> 31
<211> 3
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
寡核苷酸
<220>
<223> MG64-1活性效应子单向导 5' PAM
<220>
<221> 修饰的_碱基
<222> (3)..(3)
<223> a、c、t、g、未知或其他
<400> 31
gtn 3
<210> 32
<211> 417
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> 编码tracrRNA的MG64-3效应子基因间区域
<400> 32
aggttcgtat gtaccactaa aataaatgca gcgcctaagt tcatgtcgtc agcggcctct 60
gtgcttagaa aaagggctag tttgactgtc tgaacgcagt cttgctttct gacctagata 120
actgtccatc cccaaagctg tgagcgcacg cagcaagagg gcacgggttc cggagtgatg 180
gttatcaaat tcacctccga gcaaggagga atccacccaa aacttaaatt tggcaaacct 240
aagcgaggtc aaaaaccctg ggaggtttgc caaaagactg aagctcctgg tctacaaagg 300
tttgagtcat ctagtttgtc ccaatttctg gtctgtcata agaatttagt agaactagat 360
tgggctttgc caaattcaac tctgcaaagc ttgcagggta tgcctttccg atggcaa 417
<210> 33
<211> 468
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> 编码tracrRNA的MG64-5效应子基因间区域
<400> 33
ctcagcacag atatctgaac cttgaaaaat gaatatctga tatttcttgt gcgcgccggt 60
tctttaggga ctgagcgata agttagggcg agtttaattg ctttccagcc cgtgtagttg 120
tccgctctct tgtgcagctt gctgcatgct aggtgtcggg tcgcgccgac atccaagagg 180
ccatgtttct gtagttagag gctatctctt caattatagg gatacaggtg tacgtgtcgt 240
ggcagctacc aaacagcccc gagcaagggg gcccatccaa attttggcaa acctcagcgc 300
agtcaatatg cccaggcggt ttgccaatct ctcaaatcct tgtgcaatag gtctttcatg 360
caatctcgtc attgagaagc ttcctagagg cgttcggcat ccccaaaata attgaggttt 420
gccaaatacc ccctcgaaaa gactgctgta taagcttttc aagctgcg 468
<210> 34
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
寡核苷酸
<220>
<223> MG64-3效应子靶CRISPR重复序列
<400> 34
gtcgcccaag gcatttcagg gcagggcgga ttgaaag 37
<210> 35
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
寡核苷酸
<220>
<223> MG64-5效应子靶CRISPR重复序列
<400> 35
gtttcatccc tgcatttcaa tgcagatggg atgaaag 37
<210> 36
<211> 105
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 LE 105bp
<400> 36
tgtacattaa cagattattt gtcatcggta acaaattgtt gtcatcttaa caaaatattt 60
gtcatcaata acatattatg tgtcgtgtgc ttattactga aacta 105
<210> 37
<211> 86
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
寡核苷酸
<220>
<223> MG64-1 LE 86bp
<400> 37
tgtacattaa cagattattt gtcatcggta acaaattgtt gtcatcttaa caaaatattt 60
gtcatcaata acatattatg tgtcgt 86
<210> 38
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
寡核苷酸
<220>
<223> MG64-1 LE 68bp
<400> 38
tgtacattaa cagattattt gtcatcggta acaaattgtt gtcatcttaa caaaatattt 60
gtcatcaa 68
<210> 39
<211> 242
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 RE 242bp
<400> 39
tgtacagtaa ctaattattt gtcgtcttaa caaaatcgtg tcgccgaact atttgagagt 60
gaaagcttta tataatcact gctttagctg aattatagca ttaatctttg acaaaagtta 120
ttgcttacta tattaacaaa ttaactgtca ttttccagta aattaacaga ttaagtgtca 180
tttacccgaa tggcactttt ttagggactg gagcagtatt aacaaattac ttgtctccaa 240
ac 242
<210> 40
<211> 196
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 RE 196bp
<400> 40
tgtacagtaa ctaattattt gtcgtcttaa caaaatcgtg tcgccgaact atttgagagt 60
gaaagcttta tataatcact gctttagctg aattatagca ttaatctttg acaaaagtta 120
ttgcttacta tattaacaaa ttaactgtca ttttccagta aattaacaga ttaagtgtca 180
tttacccgaa tggcac 196
<210> 41
<211> 178
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 RE 178bp
<400> 41
tgtacagtaa ctaattattt gtcgtcttaa caaaatcgtg tcgccgaact atttgagagt 60
gaaagcttta tataatcact gctttagctg aattatagca ttaatctttg acaaaagtta 120
ttgcttacta tattaacaaa ttaactgtca ttttccagta aattaacaga ttaagtgt 178
<210> 42
<211> 260
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 RE内部缺失50
<400> 42
tgtacagtaa ctaattattt gtcgtcttaa caaaatcgtg tcgccgaact atttgagagt 60
gaaagaaagt tattgcttac tatattaaca aattaactgt cattttccag taaattaaca 120
gattaagtgt catttacccg aatggcactt ttttagggac tggagcagta ttaacaaatt 180
acttgtctcc aaacttcaag tattacgata caattatatt aaataaacaa ttatgtaata 240
atcagacatt tttgttcatt 260
<210> 43
<211> 231
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 RE内部缺失81
<400> 43
tgtacagtaa ctaattattt gtcgtcttaa caaaatcgtg tcgccgaact atttattaac 60
aaattaactg tcattttcca gtaaattaac agattaagtg tcatttaccc gaatggcact 120
tttttaggga ctggagcagt attaacaaat tacttgtctc caaacttcaa gtattacgat 180
acaattatat taaataaaca attatgtaat aatcagacat ttttgttcat t 231
<210> 44
<211> 96
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
寡核苷酸
<220>
<223> MG64-1 RE内部缺失81 & 178bp
<400> 44
tgtacagtaa ctaattattt gtcgtcttaa caaaatcgtg tcgccgaact attaacaaat 60
taactgtcat tttccagtaa attaacagat taagtg 96
<210> 45
<211> 237
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 1
<400> 45
aaaataatcg cgccgtagat catgttcttg attgaacctc tgaactacga aaaatgaggg 60
ttagtttgac tctcggcaga tagtcttgct ttctgaccct agtggctgtc caccctgatg 120
ctgatttcta catagggtag gtgcgctccc agcaataagt ggcgtgggtt taccacagtg 180
acggctactg aatcacctcc gaccaaggag gaatccactg aaaagatgga ttgaaag 237
<210> 46
<211> 214
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 2
<400> 46
aaaataatcg cgccgtagat catgttcttg attgaacctc tgaactacga aaaatgaggg 60
ttagtttgac tctcggcaga tagtcttgct ttctgaccct agtggctgtc caccctgatg 120
ctggaaacag caataagtgg cgtgggttta ccacagtgac ggctactgaa tcacctccga 180
ccaaggagga atccactaaa agatggattg aaag 214
<210> 47
<211> 170
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 3
<400> 47
aaaataatcg cgccgtagat catgttcttg attgaacctc tgaactacga aaaatgaggg 60
ttagtttgac tctcggcaga tagtcttgct ttctgaccct agtggctgtg aaaacggcta 120
ctgaatcacc tccgaccaag gaggaatcca ctgaaaagat ggattgaaag 170
<210> 48
<211> 276
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 4
<400> 48
aaaataatcg cgccgtagat catgttcttg attgaacctc tgaactacga aaaatgaggg 60
ttagtttgac tctcggcaga tagtcttgct ttctgaccct agtggctgtc caccctgatg 120
ctgatttcta caatttaggt tgtagagatg attaacctgt aacttgaggt tagctaataa 180
tttcatttta tagggtaggt gcgctcccag caataagtgg cgtgggttta ccacagtgac 240
ggctactgaa tcacctccga ccaaggagga tgaaag 276
<210> 49
<211> 281
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 5
<400> 49
aaaataatcg cgccgtagat catgttcttg attgaacctc tgaactacga aaaatgaggg 60
ttagtttgac tctcggcaga tagtcttgct ttctgaccct agtggctgtc caccctgatg 120
ctgatttcta caatttaggt tgtagagatg attaacctgt aacttgaggt tagctaataa 180
tttcatttta tagggtaggt gcgctcccag caataagtgg cgtgggttta ccacagtgac 240
ggctactgaa tcacgaatcc actgaaaaga tggattgaaa g 281
<210> 50
<211> 284
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 6
<400> 50
gccgtagatc atgttcttga ttgaacctct gaactacgaa aaatgagggt tagtttgact 60
ctcggcagat agtcttgctt tctgacccta gtggctgtcc accctgatgc tgatttctac 120
aatttaggtt gtagagatga ttaacctgta acttgaggtt agctaataat ttcattttat 180
agggtaggtg cgctcccagc aataagtggc gtgggtttac cacagtgacg gctactgaat 240
cacctccgac caaggaggaa tccactgaaa agatggattg aaag 284
<210> 51
<211> 283
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 7
<400> 51
aaaataatcg cgccgtagat catgcctctg aactacgaaa aatgagggtt agtttgactc 60
tcggcagata gtcttgcttt ctgaccctag tggctgtcca ccctgatgct gatttctaca 120
atttaggttg tagagatgat taacctgtaa cttgaggtta gctaataatt tcattttata 180
gggtaggtgc gctcccagca ataagtggcg tgggtttacc acagtgacgg ctactgaatc 240
acctccgacc aaggaggaat ccactgaaaa gatggattga aag 283
<210> 52
<211> 273
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 8
<400> 52
aaaataatcg cgccgtagat aactacgaaa aatgagggtt agtttgactc tcggcagata 60
gtcttgcttt ctgaccctag tggctgtcca ccctgatgct gatttctaca atttaggttg 120
tagagatgat taacctgtaa cttgaggtta gctaataatt tcattttata gggtaggtgc 180
gctcccagca ataagtggcg tgggtttacc acagtgacgg ctactgaatc acctccgacc 240
aaggaggaat ccactgaaaa gatggattga aag 273
<210> 53
<211> 263
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 9
<400> 53
aaaataatcg cgccgcgaaa aatgagggtt agtttgactc tcggcagata gtcttgcttt 60
ctgaccctag tggctgtcca ccctgatgct gatttctaca atttaggttg tagagatgat 120
taacctgtaa cttgaggtta gctaataatt tcattttata gggtaggtgc gctcccagca 180
ataagtggcg tgggtttacc acagtgacgg ctactgaatc acctccgacc aaggaggaat 240
ccactgaaaa gatggattga aag 263
<210> 54
<211> 278
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 10
<400> 54
aaaataatcg cgccgtagat catgttcttg attgaacctc tgaactacga aaaatgcggc 60
agatagtctt gctttctgac cctagtggct gtccaccctg atgctgattt ctacaattta 120
ggttgtagag atgattaacc tgtaacttga ggttagctaa taatttcatt ttatagggta 180
ggtgcgctcc cagcaataag tggcgtgggt ttaccacagt gacggctact gaatcacctc 240
cgaccaagga ggaatccact gaaaagatgg attgaaag 278
<210> 55
<211> 215
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 11
<400> 55
aaaataatcg cgccgtagat catgttcttg attgaacctc tgaactacga aaaatgaggg 60
ttagtttgac tctcgcctag tggctgtcca ccctgatgct gatttctaca tagggtaggt 120
gcgctcccag caataagtgg cgtgggttta ccacagtgac ggctactgaa tcacctccga 180
ccaaggagga atccactgaa aagatggatt gaaag 215
<210> 56
<211> 221
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 12
<400> 56
aaaataatcg cgccgtagat catgttcttg attgaacctc tgaactacga aaaatgaggg 60
ttagtttgac tctcggcaga tagtcttgct ttctgaccct agtggctgtc caccctgatg 120
ctgatttcta catagggtag gtgcgctgtg ggtttaccac agtgacggct actgaatcac 180
ctccgaccaa ggaggaatcc actgaaaaga tggattgaaa g 221
<210> 57
<211> 226
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 13
<400> 57
aaaataatcg cgccgtagat catgttcttg attgaacctc tgaactacga aaaatgaggg 60
ttagtttgac tctcggcaga tagtcttgct ttctgaccct agtggctgtc caccctgatg 120
ctgatttcta catagggtag gtgcgctccc agcaataagt ggcgcagtga cggctactga 180
atcacctccg accaaggagg aatccactga aaagatggat tgaaag 226
<210> 58
<211> 224
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 14
<400> 58
aaaataatcg cgccgtagat catgttcttg attgaacctc tgaactacga aaaatgaggg 60
ttagtttgac tctcggcaga tagtcttgct ttctgaccct agtggctgtc caccctgatg 120
ctgatttcta catagggtag gtgcgctccc agcaataagt ggcagtgacg gctactgaat 180
cacctccgac caaggaggaa tccactgaaa agatggattg aaag 224
<210> 59
<211> 204
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 15
<400> 59
aaaataatcg cgccgtagat catgttcttg attgaacctc tgaactacga aaaatgaggg 60
ttagtttgac tctcggcaga tagtcttgct ttctgaccct agtggctgtc caccctgatg 120
ctgatttcta catagggtag gtgcgctccc agcaataagt ggcgtgggtt taccacagtg 180
acggctactg aatcacgatg aaag 204
<210> 60
<211> 181
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 16
<400> 60
gccgtagatc atgcctctga actacgaaaa atgagggtta gtttgactct cggcagatag 60
tcttgctttc tgaccctagt ggctgtccac cctgatgctg atttctacat agggtaggtg 120
cgctcccagc aataagtggc gtgggtttac cacagtgacg gctactgaat cacgatgaaa 180
g 181
<210> 61
<211> 262
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 17
<400> 61
aaaataatcg cgccgtagat catgttcttg attgaacctc tgaactacga aaaatgaggg 60
ttagtttgac tctcggcaga tagtcttgct ttctgaccct agtggctgtc caccctgatg 120
ctgatttcta caatttaggt tgtagagatg attaacctgt aacttgaggt tagctaataa 180
tttcatttta tagggtaggt gcgctcccag caataagtgg cgtgggttta ccacagtgac 240
ggctactgaa tcacgatgaa ag 262
<210> 62
<211> 272
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 18
<400> 62
gccgtagatc atgcctctga actacgaaaa atgagggtta gtttgactct cggcagatag 60
tcttgctttc tgaccctagt ggctgtccac cctgatgctg atttctacaa tttaggttgt 120
agagatgatt aacctgtaac ttgaggttag ctaataattt cattttatag ggtaggtgcg 180
ctcccagcaa taagtggcgt gggtttacca cagtgacggc tactgaatca cctccgacca 240
aggaggaatc cactgaaaag atggattgaa ag 272
<210> 63
<211> 251
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1 工程化单向导 19
<400> 63
gccgtagatc atgttcttga ttgaacctct gaactacgaa aaatgagggt tagtttgact 60
ctcggcagat agtcttgctt tctgacccta gtggctgtcc accctgatgc tgatttctac 120
aatttaggtt gtagagatga ttaacctgta acttgaggtt agctaataat ttcattttat 180
agggtaggtg cgctcccagc aataagtggc gtgggtttac cacagtgacg gctactgaat 240
cacgatgaaa g 251
<210> 64
<211> 122
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64效应子序列
<220>
<223> MG64-55效应子
<400> 64
Met Ser Gln Ile Thr Val Arg Ala Arg Leu Ile Ala Pro Glu Glu Thr
1 5 10 15
Arg Arg Ala Tyr Trp Asp Leu Met Ala Ala Ser Asn Thr Pro Leu Ile
20 25 30
Asn Glu Ala Leu Arg Ile Leu Pro Thr Leu Pro Asp Phe Pro Lys Trp
35 40 45
Arg Gln Lys Gly Asn Leu Pro Asp Lys Ala Ala Glu Asn Leu Ile Ile
50 55 60
Lys Leu Lys Glu Asp Pro Arg Phe Val Gly Gln Leu Phe Trp Ser Tyr
65 70 75 80
Ile Ser Ala His Lys Gln Val Thr Tyr Thr Phe Arg Ser Trp Leu Ala
85 90 95
Leu Gln His Arg Lys Gln Trp Lys Leu Ala Gly Lys Arg Leu Trp Leu
100 105 110
Glu Ile Leu Gln Pro Asp Glu Thr Leu Ala
115 120
<210> 65
<211> 134
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64转座蛋白序列
<220>
<223> MG64-55-B转座蛋白
<400> 65
Ser Ser Ser Val Ser Lys Gly Thr Met Met Ala Gln Trp Arg Asn Ala
1 5 10 15
Tyr Thr Ser Ile Leu Lys Leu Ile Asp Arg Gln Ser Leu Lys Ala Lys
20 25 30
Ser Val His Leu Gly His Leu His Lys Gly Ile Ser Arg Ala Arg Ser
35 40 45
Leu Arg Glu Trp Glu Ala Ala Lys Lys Ala Leu Lys Lys Gln Asn Lys
50 55 60
Asn Leu Thr Ser Gln Asn Val Ser Thr Tyr Phe Glu Asp Glu Glu Arg
65 70 75 80
Thr Pro Gln Lys Ser Met Arg Gln Arg Arg Lys Ala Ala Gln Lys Ala
85 90 95
Asn Lys Lys Pro Leu Pro Met Ile Glu Asp Asp Leu Gln Glu Glu Ser
100 105 110
Asn Leu Glu Asp Glu Lys Asn Pro Leu Leu Asp Leu Glu Val Thr Tyr
115 120 125
Asp Asp Asp Leu Phe Glu
130
<210> 66
<211> 272
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64转座蛋白序列
<220>
<223> MG64-55-C转座蛋白
<400> 66
Met Glu Lys Gln Val Asp Gln Ile Ala Ser Ala Leu Gly Ala Leu Pro
1 5 10 15
Glu Leu Ser Pro Glu Ile His Lys Glu Leu Glu Arg Leu Ser Lys Arg
20 25 30
Pro Tyr Ile Leu Leu Pro Lys Val Glu Ser Cys His Ile Phe Leu Glu
35 40 45
Glu Cys Arg Leu Gly Arg Ala His Gly Arg Ile Val Gly Asp Ser Gly
50 55 60
Val Gly Lys Thr Ile Ser Ala Lys Ala Tyr Ser Lys Arg Leu Ala Glu
65 70 75 80
Ala Ser Thr Glu Lys Asn Val Ile Tyr Thr Ile Leu Asn Pro Asn Cys
85 90 95
Thr Pro Lys Glu Phe Tyr Glu Lys Ile Leu Glu Ala Leu Gly Phe Thr
100 105 110
Tyr Thr Lys Gly Ser Ile Lys Phe Leu Arg Asn Arg Ala Cys Gln Val
115 120 125
Leu Ser Arg Arg Gln Ile Ser Val Leu Phe Ile Asp Glu Ala Ser Phe
130 135 140
Leu Lys Met Asp Ala Ile Gly Glu Leu Ile Tyr Leu Glu Glu Ser Glu
145 150 155 160
Val Val Pro Ser Ile Phe Leu Ile Gly Thr Asp Arg Leu Asp Thr Leu
165 170 175
Leu Ser Gly Asn Glu Gln Val Ala Arg Arg Tyr Pro Arg Tyr Gln Tyr
180 185 190
Gly Arg Leu His Asp Lys Glu Leu Lys Asp Val Val Asp Leu Trp Glu
195 200 205
Gln Lys Val Leu Gln Leu Pro Val Lys Ser Asn Leu Lys Tyr Lys Ala
210 215 220
Lys Leu Asn Val Ile Thr Lys Ala Thr Ser Gly Cys Leu Gly Glu Ile
225 230 235 240
Asp Gln Leu Leu Arg Arg Ala Ala Arg Lys Ala Leu Ile Leu Gly Glu
245 250 255
Ser Lys Ile Ser Leu Asn Ile Leu Arg Glu Val Ala Gly Gln Phe Glu
260 265 270
<210> 67
<211> 169
<212> PRT
<213> 未知
<220>
<223> 未知的描述:
MG64转座蛋白序列
<220>
<223> MG64-55-Q转座蛋白
<400> 67
Met Asn Asp Ala Gln Ala Ala Gln Trp His Phe Lys Pro Glu Pro Phe
1 5 10 15
Glu Gly Glu Ser Phe Ser His Phe Leu Gly Arg Tyr Cys Ala Val Asn
20 25 30
Cys Ile Ala Pro Asn Ile Leu Ala Lys His Ile Glu Ala Gly Ser Val
35 40 45
Ala Ile Gly Arg Trp Arg Lys Leu Arg Tyr Asn Pro Ser Pro Ser Glu
50 55 60
Arg His Leu Gln Arg Leu Ala Asp Val Thr Gly Val Ser Gln Glu Arg
65 70 75 80
Leu Leu Ala Met Leu Pro Gln Glu Pro Met Gln Ile Gly Thr Ile Arg
85 90 95
Leu Cys Ala Ala Cys Tyr Gly Glu Glu Pro Cys His Arg Ile Arg Trp
100 105 110
Gln Tyr Lys Ser Thr Gln Phe Cys Asp Arg His Gln Leu Thr Leu Leu
115 120 125
Ala Arg Cys Pro Cys Cys Lys Ala Pro Phe Pro Ile Pro Ala Glu Trp
130 135 140
Asp Ala Gly Ile Cys Leu Arg Cys Gly Lys Ala Phe Val Glu Leu Ala
145 150 155 160
Glu Phe Gln Lys Ser Val Leu Gly Gln
165
<210> 68
<211> 239
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性
sgRNA 11
<220>
<221> 修饰的_碱基
<222> (217)..(239)
<223> a、c、u、g、未知或其他
<400> 68
gaaaauaauc gcgccguaga ucauguucuu gauugaaccu cugaacuacg aaaaaugagg 60
guuaguuuga cucucgccua guggcugucc acccugaugc ugauuucuac auaggguagg 120
ugcgcuccca gcaauaagug gcguggguuu accacaguga cggcuacuga aucaccuccg 180
accaaggagg aauccacuga aaagauggau ugaaagnnnn nnnnnnnnnn nnnnnnnnn 239
<210> 69
<211> 245
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性效应子工程化sgRNA 12
<220>
<221> 修饰的_碱基
<222> (223)..(245)
<223> a、c、u、g、未知或其他
<400> 69
gaaaauaauc gcgccguaga ucauguucuu gauugaaccu cugaacuacg aaaaaugagg 60
guuaguuuga cucucggcag auagucuugc uuucugaccc uaguggcugu ccacccugau 120
gcugauuucu acauagggua ggugcgcugu ggguuuacca cagugacggc uacugaauca 180
ccuccgacca aggaggaauc cacugaaaag auggauugaa agnnnnnnnn nnnnnnnnnn 240
nnnnn 245
<210> 70
<211> 250
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性效应子工程化sgRNA 13
<220>
<221> 修饰的_碱基
<222> (228)..(250)
<223> a、c、u、g、未知或其他
<400> 70
gaaaauaauc gcgccguaga ucauguucuu gauugaaccu cugaacuacg aaaaaugagg 60
guuaguuuga cucucggcag auagucuugc uuucugaccc uaguggcugu ccacccugau 120
gcugauuucu acauagggua ggugcgcucc cagcaauaag uggcgcagug acggcuacug 180
aaucaccucc gaccaaggag gaauccacug aaaagaugga uugaaagnnn nnnnnnnnnn 240
nnnnnnnnnn 250
<210> 71
<211> 248
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性效应子工程化sgRNA 14
<220>
<221> 修饰的_碱基
<222> (226)..(248)
<223> a、c、u、g、未知或其他
<400> 71
gaaaauaauc gcgccguaga ucauguucuu gauugaaccu cugaacuacg aaaaaugagg 60
guuaguuuga cucucggcag auagucuugc uuucugaccc uaguggcugu ccacccugau 120
gcugauuucu acauagggua ggugcgcucc cagcaauaag uggcagugac ggcuacugaa 180
ucaccuccga ccaaggagga auccacugaa aagauggauu gaaagnnnnn nnnnnnnnnn 240
nnnnnnnn 248
<210> 72
<211> 263
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性效应子工程化sgRNA v2-1
<220>
<221> 修饰的_碱基
<222> (241)..(263)
<223> a、c、u、g、未知或其他
<400> 72
gaauuaauag cgccgccguu caugcuucua ggagccucug aaaggugaca aaugcggguu 60
aguuuggcug uugucagaca gucuugcuuu cugacccugg uagcugccca ccccgaagcu 120
gcuguuccuu gugaacagga auuaggugcg cccccaguaa uaaggguaug gguuuaccac 180
agugguggcu acugaaucac cuccgagcaa ggaggaaccc acugaaaggu ggguugaaag 240
nnnnnnnnnn nnnnnnnnnn nnn 263
<210> 73
<211> 262
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性效应子工程化sgRNA 20
<220>
<221> 修饰的_碱基
<222> (240)..(262)
<223> a、c、u、g、未知或其他
<400> 73
gccguagauc augccucuga acuacgaaaa augaggguua guuugacucu cggcagauag 60
ucuugcuuuc ugacccuagu ggcuguccac ccugaugcug auuucuacaa uuuagguugu 120
agagaugauu aaccuguaac uugagguuag cuaauaauuu cauuuuauag gguaggugcg 180
cucccagcaa uaaguggcgu ggguuuacca cagugacggc uacugaauca cgaugaaagn 240
nnnnnnnnnn nnnnnnnnnn nn 262
<210> 74
<211> 241
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-3效应子sgRNA
<220>
<221> 修饰的_碱基
<222> (219)..(241)
<223> a、c、u、g、未知或其他
<400> 74
gaaauaaaug cagcgccuaa guucaugucg ucagcggccu cugugcuuag aaaaagggcu 60
aguuugacug ucugaacgca gucuugcuuu cugaccuaga uaacugucca uccccaaagc 120
ugugagcgca cgcagcaaga gggcacgggu uccggaguga ugguuaucaa auucaccucc 180
gagcaaggag gaauccaccc gaaagggcgg auugaaagnn nnnnnnnnnn nnnnnnnnnn 240
n 241
<210> 75
<211> 264
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-5效应子sgRNA
<220>
<221> 修饰的_碱基
<222> (242)..(264)
<223> a、c、u、g、未知或其他
<400> 75
gcgcgccggu ucuuuaggga cugagcgaua aguuagggcg aguuuaauug cuuuccagcc 60
cguguaguug uccgcucucu ugugcagcuu gcugcaugcu aggugucggg ucgcgccgac 120
auccaagagg ccauguuucu guaguuagag gcuaucucuu caauuauagg gauacaggug 180
uacgugucgu ggcagcuacc aaacagcccc gagcaagggg gcccauccga aaggaugaaa 240
gnnnnnnnnn nnnnnnnnnn nnnn 264
<210> 76
<211> 447
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-3 推定转座子末端LE
<400> 76
aaggcgagtt tgggaacgga tactcctggg catttctaac tcaacgtggt atcgtcataa 60
atccgagggc gattagcaca gtggtagcgc gcttccttca cacggaagag gtcactggtt 120
cgaacccagt atcgcccata catttgtcga ataacgcttt atttgtcgtc ggtaacacat 180
ttgtgtcgtc cataacgctt agatgtcatc gataacagtt ttttgtcacc ttctcggtaa 240
gtttgccgtt aagcgatcgt tcacacaatg ctgtcgtcca aaattaggct tttgatgtgt 300
gaaggaagcg cgcctttcaa tccacctatg cgtatattaa cgccaaaact tgatccaagt 360
acaaatgttt taagactgta ttctggtctg catgaaaagc tttaggcgtc tagatatgag 420
aagccaccta atctacatgc ggtcgac 447
<210> 77
<211> 430
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-3 推定转座子末端RE
<400> 77
ggagtcatgc agtacaagtg aattaaatca aatgtactat gactaccaag atatgtcatc 60
taatttgtta gatccgataa agccgccaag aggcgacaaa gagtgtgtta atgccaaggt 120
gatctcagat tccaagagac gacactgatt gtgttcaact tccaagagac gtcagttatt 180
ctgttagtca aagagactca ttgagatatg agtggaaacg ctgaagagtc tgatctgaat 240
tggttctggc tatctcaagc tcgatgacaa gattgcgtta tgacgacatt ttacgtgtta 300
ctcgacaaca gcggctgacg gtggcaccct cagcaatttt ctcttccaca aagtcgggat 360
catctgaccc cgtgacgaag ggccgccagg gacgtatacc atgtcactga ggcagcaaga 420
tagggatcaa 430
<210> 78
<211> 450
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-5 推定转座子末端LE
<400> 78
ttgagacgaa ggttgatatc tatcgagccg taactgcttg agctgagttt tcaacctcta 60
agcgcaagaa aaaacgactc gtaattcgcg aaaaacgcac atatgaactt tcgacttccg 120
atttgcgaaa aatgactttg cgactcgcaa tctgcgaatc tgtacttgtt tactgatttc 180
gggttggagt gccaaaactc tctctgggca gggactttac ggattattta caagcgatat 240
taatctgcga atcgcgacat ttaatgtgcg aacgtacacc agatttaaag gattaatttc 300
ccaaaaaaca cggaagaata ggcattttag ccgtcaaacc gctattacag tcggtcaatt 360
gatgttaaat ccgccatttt tgccagattt aaggaattag tttccaaaat cctaggccct 420
agttggatgt tgggtgcgat cgcagcgctc 450
<210> 79
<211> 583
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-5 推定转座子末端RE
<400> 79
tttagttgtc gcaaagacaa ctgtaaaagt ggtatcacag gtgccctgga atcgtcaaac 60
cctctctatt agatcctttt tgcttgtttt gcggtctgat caggatcaga tttatcgatt 120
ccaagcttgt cataatgaca attaacgaat agcgatatac gtatacgtac atcgacatgt 180
tgatagttgc tcacccacac agtggccgcg agcgacttac cgaaaggctc ctaggtgttt 240
gtgagtggta ttggaaagca gcaaaagcga tcgcaccccc taatggagtc tgccgaaaca 300
ggcgcaaaac aaagatggcg acgattgcag aaacgcctga cagcagcagc cgaggatggg 360
aatactaggc tgctaatgtc gatcgcccac aagtacccaa atgcctgaaa cccacatcac 420
cgttggagcc catcaagatt ttgagactta cctgacggaa cctttcggtg acgggcctgc 480
cagtgatgaa cgtgcggccg actttagaaa taggctgaaa tcagcccaga cgctccaaga 540
tgctggtttg ccaatagtcg aaaatgtttt ggttggtcgc tga 583
<210> 80
<211> 803
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多肽
<220>
<223> MG64-1效应子 - MG64-1-Q融合物
<400> 80
Met Ser Gln Ile Thr Ile Gln Cys Arg Leu Val Ala Lys Glu Pro Ile
1 5 10 15
Arg His Thr Leu Trp Gln Leu Met Ala Asp Leu Asn Thr Pro Phe Ile
20 25 30
Asn Glu Leu Leu Gln Lys Val Ala Gln His Pro Asp Phe Glu Lys Trp
35 40 45
Lys Gln Arg Gly Arg Leu Lys Val Lys Val Ile Glu Gln Leu Gly Asn
50 55 60
Glu Leu Lys Lys Asp Pro Arg Phe Leu Gly Gln Pro Ala Arg Phe Tyr
65 70 75 80
Thr Ser Gly Ile Asn Leu Val Lys Tyr Ile Phe Lys Ser Trp Leu Lys
85 90 95
Leu Gln Gln Arg Leu Gln Gln Lys Leu Asp Arg Lys Arg Arg Trp Leu
100 105 110
Glu Val Leu Lys Ser Asp Asp Gln Leu Ile Lys Asp Gly Gln Thr Asp
115 120 125
Leu Glu Thr Ile Arg Gln Lys Ala Thr Glu Ile Leu Gln Ser Tyr Glu
130 135 140
Gly Thr Glu Gln Leu Phe Asn Thr Leu Phe Gln Ala Tyr Asn Ser Glu
145 150 155 160
Glu Asp Ile Leu Thr Arg Thr Ala Leu Asn Tyr Leu Leu Lys Asn Arg
165 170 175
Cys Lys Leu Pro Gln Lys Pro Glu Asp Ala Lys Lys Phe Ala Lys Arg
180 185 190
Arg Arg Gln Val Glu Ile Ala Ile Lys Arg Leu Gln Glu Gln Ile Lys
195 200 205
Ala Arg Leu Pro Gln Gly Arg Asp Val Thr Asn Glu Asn Trp Leu Glu
210 215 220
Thr Leu Asn Leu Ala Cys Tyr Thr Asp Pro Glu Asn Ile Glu Glu Ala
225 230 235 240
Arg Ser Trp Gln Asp Lys Leu Leu Thr Lys Ser Ser Ser Ile Pro Phe
245 250 255
Pro Ile Asn Tyr Glu Thr Asn Glu Asp Leu Ile Trp Ser Lys Asn Glu
260 265 270
Lys Gly His Leu Cys Val Gln Phe Asn Gly Ile Ser Asp Leu Lys Phe
275 280 285
Lys Ile Tyr Cys Asp Lys Arg Gln Leu Lys Trp Phe Gln Arg Phe Tyr
290 295 300
Glu Asp Gln Gln Ile Lys Lys Ser Asn Asn Asn Gln His Ser Ser Ala
305 310 315 320
Leu Phe Thr Leu Arg Ser Gly Arg Ile Leu Trp Gln Glu Asp Lys Gly
325 330 335
Lys Gly Gln Leu Trp Asp Ile His Arg Leu Thr Leu Gln Cys Thr Leu
340 345 350
Asp Thr Arg Thr Trp Thr Gln Glu Gly Thr Glu Gln Val Lys Glu Glu
355 360 365
Lys Ala Asp Glu Ile Ala Gly Ile Leu Thr Arg Met Asn Glu Lys Gly
370 375 380
Asp Leu Thr Lys Asn Gln Gln Ala Phe Ile Gln Arg Lys Gln Ser Thr
385 390 395 400
Leu Asp Lys Leu Glu Asn Pro Phe Pro Arg Pro Ser Arg Pro Val Tyr
405 410 415
Arg Gly Gln Ser Asn Ile Leu Leu Gly Val Ser Met Glu Leu Lys Lys
420 425 430
Pro Ala Thr Ile Ala Val Ile Asp Gly Met Thr Arg Lys Val Leu Thr
435 440 445
Tyr Arg Asn Ile Lys Gln Leu Leu Gly Lys Asn Tyr Pro Leu Leu Asn
450 455 460
Arg Gln Arg Arg Gln Lys Gln Leu Gln Ser His Gln Arg Asn Val Ala
465 470 475 480
Gln Arg Lys Glu Ala Phe Asn Gln Phe Gly Asp Ser Glu Leu Gly Glu
485 490 495
Tyr Ile Asp Arg Leu Leu Ala Lys Ala Ile Ile Ala Ile Ala Lys Gln
500 505 510
Tyr Gln Ala Arg Ser Ile Val Val Pro His Leu Lys Asp Ile Arg Glu
515 520 525
Ala Ile Gln Ser Glu Ile Gln Ala Leu Ala Glu Ala Lys Ile Pro Asn
530 535 540
Cys Ile Glu Ala Gln Ala Glu Tyr Ala Lys Lys Tyr Arg Ile Gln Val
545 550 555 560
His Gln Trp Ser Tyr Gly Arg Leu Ile Asp Asn Ile Gln Ala Gln Ala
565 570 575
Ser Lys Leu Gly Ile Val Ile Glu Glu Ser Gln Gln Pro Leu Gln Gly
580 585 590
Thr Pro Leu Gln Lys Ala Ala Glu Leu Ala Phe Lys Ala Tyr Gln Ser
595 600 605
Arg Leu Ser Ala Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
610 615 620
Gly Gly Gly Ser Gly Gly Gly Ser Met Glu Ser Arg Glu Ile Gln Pro
625 630 635 640
Trp Trp Phe Leu Val Glu Pro Leu Ala Gly Glu Ser Ile Ser His Phe
645 650 655
Leu Gly Arg Phe Arg Arg Glu Asn Glu Leu Thr Val Thr Met Met Gly
660 665 670
Lys Ile Thr Gly Leu Gly Gly Thr Ile Thr Arg Trp Glu Lys Phe Arg
675 680 685
Phe Ile Pro Ile Pro Thr Glu Glu Glu Leu Thr Ala Leu Ser Glu Val
690 695 700
Val Gln Val Glu Val Glu Arg Leu Trp Gln Met Phe Pro Pro Lys Gly
705 710 715 720
Val Gly Met Lys His Gln Pro Ile Arg Leu Cys Gly Ala Cys Tyr Glu
725 730 735
Glu Glu Arg Cys His Lys Ile Glu Trp Gln Leu Lys Thr Thr Gln Phe
740 745 750
Cys Ser Gln His Gly Leu Thr Leu Leu Ser Glu Cys Pro Asn Cys Gly
755 760 765
Ala Arg Phe Gln Phe Pro Ala Leu Trp Val Asn Gly Trp Cys His Arg
770 775 780
Cys Phe Leu Thr Phe Gly Glu Met Val Glu Gly Gln Ser Asn Lys Lys
785 790 795 800
Lys Tyr Leu
<210> 81
<211> 803
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多肽
<220>
<223> MG64-1-Q - MG64-1效应子融合物
<400> 81
Met Glu Ser Arg Glu Ile Gln Pro Trp Trp Phe Leu Val Glu Pro Leu
1 5 10 15
Ala Gly Glu Ser Ile Ser His Phe Leu Gly Arg Phe Arg Arg Glu Asn
20 25 30
Glu Leu Thr Val Thr Met Met Gly Lys Ile Thr Gly Leu Gly Gly Thr
35 40 45
Ile Thr Arg Trp Glu Lys Phe Arg Phe Ile Pro Ile Pro Thr Glu Glu
50 55 60
Glu Leu Thr Ala Leu Ser Glu Val Val Gln Val Glu Val Glu Arg Leu
65 70 75 80
Trp Gln Met Phe Pro Pro Lys Gly Val Gly Met Lys His Gln Pro Ile
85 90 95
Arg Leu Cys Gly Ala Cys Tyr Glu Glu Glu Arg Cys His Lys Ile Glu
100 105 110
Trp Gln Leu Lys Thr Thr Gln Phe Cys Ser Gln His Gly Leu Thr Leu
115 120 125
Leu Ser Glu Cys Pro Asn Cys Gly Ala Arg Phe Gln Phe Pro Ala Leu
130 135 140
Trp Val Asn Gly Trp Cys His Arg Cys Phe Leu Thr Phe Gly Glu Met
145 150 155 160
Val Glu Gly Gln Ser Asn Lys Lys Lys Tyr Leu Gly Gly Gly Ser Gly
165 170 175
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Met
180 185 190
Ser Gln Ile Thr Ile Gln Cys Arg Leu Val Ala Lys Glu Pro Ile Arg
195 200 205
His Thr Leu Trp Gln Leu Met Ala Asp Leu Asn Thr Pro Phe Ile Asn
210 215 220
Glu Leu Leu Gln Lys Val Ala Gln His Pro Asp Phe Glu Lys Trp Lys
225 230 235 240
Gln Arg Gly Arg Leu Lys Val Lys Val Ile Glu Gln Leu Gly Asn Glu
245 250 255
Leu Lys Lys Asp Pro Arg Phe Leu Gly Gln Pro Ala Arg Phe Tyr Thr
260 265 270
Ser Gly Ile Asn Leu Val Lys Tyr Ile Phe Lys Ser Trp Leu Lys Leu
275 280 285
Gln Gln Arg Leu Gln Gln Lys Leu Asp Arg Lys Arg Arg Trp Leu Glu
290 295 300
Val Leu Lys Ser Asp Asp Gln Leu Ile Lys Asp Gly Gln Thr Asp Leu
305 310 315 320
Glu Thr Ile Arg Gln Lys Ala Thr Glu Ile Leu Gln Ser Tyr Glu Gly
325 330 335
Thr Glu Gln Leu Phe Asn Thr Leu Phe Gln Ala Tyr Asn Ser Glu Glu
340 345 350
Asp Ile Leu Thr Arg Thr Ala Leu Asn Tyr Leu Leu Lys Asn Arg Cys
355 360 365
Lys Leu Pro Gln Lys Pro Glu Asp Ala Lys Lys Phe Ala Lys Arg Arg
370 375 380
Arg Gln Val Glu Ile Ala Ile Lys Arg Leu Gln Glu Gln Ile Lys Ala
385 390 395 400
Arg Leu Pro Gln Gly Arg Asp Val Thr Asn Glu Asn Trp Leu Glu Thr
405 410 415
Leu Asn Leu Ala Cys Tyr Thr Asp Pro Glu Asn Ile Glu Glu Ala Arg
420 425 430
Ser Trp Gln Asp Lys Leu Leu Thr Lys Ser Ser Ser Ile Pro Phe Pro
435 440 445
Ile Asn Tyr Glu Thr Asn Glu Asp Leu Ile Trp Ser Lys Asn Glu Lys
450 455 460
Gly His Leu Cys Val Gln Phe Asn Gly Ile Ser Asp Leu Lys Phe Lys
465 470 475 480
Ile Tyr Cys Asp Lys Arg Gln Leu Lys Trp Phe Gln Arg Phe Tyr Glu
485 490 495
Asp Gln Gln Ile Lys Lys Ser Asn Asn Asn Gln His Ser Ser Ala Leu
500 505 510
Phe Thr Leu Arg Ser Gly Arg Ile Leu Trp Gln Glu Asp Lys Gly Lys
515 520 525
Gly Gln Leu Trp Asp Ile His Arg Leu Thr Leu Gln Cys Thr Leu Asp
530 535 540
Thr Arg Thr Trp Thr Gln Glu Gly Thr Glu Gln Val Lys Glu Glu Lys
545 550 555 560
Ala Asp Glu Ile Ala Gly Ile Leu Thr Arg Met Asn Glu Lys Gly Asp
565 570 575
Leu Thr Lys Asn Gln Gln Ala Phe Ile Gln Arg Lys Gln Ser Thr Leu
580 585 590
Asp Lys Leu Glu Asn Pro Phe Pro Arg Pro Ser Arg Pro Val Tyr Arg
595 600 605
Gly Gln Ser Asn Ile Leu Leu Gly Val Ser Met Glu Leu Lys Lys Pro
610 615 620
Ala Thr Ile Ala Val Ile Asp Gly Met Thr Arg Lys Val Leu Thr Tyr
625 630 635 640
Arg Asn Ile Lys Gln Leu Leu Gly Lys Asn Tyr Pro Leu Leu Asn Arg
645 650 655
Gln Arg Arg Gln Lys Gln Leu Gln Ser His Gln Arg Asn Val Ala Gln
660 665 670
Arg Lys Glu Ala Phe Asn Gln Phe Gly Asp Ser Glu Leu Gly Glu Tyr
675 680 685
Ile Asp Arg Leu Leu Ala Lys Ala Ile Ile Ala Ile Ala Lys Gln Tyr
690 695 700
Gln Ala Arg Ser Ile Val Val Pro His Leu Lys Asp Ile Arg Glu Ala
705 710 715 720
Ile Gln Ser Glu Ile Gln Ala Leu Ala Glu Ala Lys Ile Pro Asn Cys
725 730 735
Ile Glu Ala Gln Ala Glu Tyr Ala Lys Lys Tyr Arg Ile Gln Val His
740 745 750
Gln Trp Ser Tyr Gly Arg Leu Ile Asp Asn Ile Gln Ala Gln Ala Ser
755 760 765
Lys Leu Gly Ile Val Ile Glu Glu Ser Gln Gln Pro Leu Gln Gly Thr
770 775 780
Pro Leu Gln Lys Ala Ala Glu Leu Ala Phe Lys Ala Tyr Gln Ser Arg
785 790 795 800
Leu Ser Ala
<210> 82
<211> 831
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多肽
<220>
<223> MG64-1-Q- 48aa接头- MG64-1效应子融合物
<400> 82
Met Glu Ser Arg Glu Ile Gln Pro Trp Trp Phe Leu Val Glu Pro Leu
1 5 10 15
Ala Gly Glu Ser Ile Ser His Phe Leu Gly Arg Phe Arg Arg Glu Asn
20 25 30
Glu Leu Thr Val Thr Met Met Gly Lys Ile Thr Gly Leu Gly Gly Thr
35 40 45
Ile Thr Arg Trp Glu Lys Phe Arg Phe Ile Pro Ile Pro Thr Glu Glu
50 55 60
Glu Leu Thr Ala Leu Ser Glu Val Val Gln Val Glu Val Glu Arg Leu
65 70 75 80
Trp Gln Met Phe Pro Pro Lys Gly Val Gly Met Lys His Gln Pro Ile
85 90 95
Arg Leu Cys Gly Ala Cys Tyr Glu Glu Glu Arg Cys His Lys Ile Glu
100 105 110
Trp Gln Leu Lys Thr Thr Gln Phe Cys Ser Gln His Gly Leu Thr Leu
115 120 125
Leu Ser Glu Cys Pro Asn Cys Gly Ala Arg Phe Gln Phe Pro Ala Leu
130 135 140
Trp Val Asn Gly Trp Cys His Arg Cys Phe Leu Thr Phe Gly Glu Met
145 150 155 160
Val Glu Gly Gln Ser Asn Lys Lys Lys Tyr Leu Gly Gly Gly Ser Gly
165 170 175
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly
180 185 190
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly
195 200 205
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Met Ser Gln Ile Thr
210 215 220
Ile Gln Cys Arg Leu Val Ala Lys Glu Pro Ile Arg His Thr Leu Trp
225 230 235 240
Gln Leu Met Ala Asp Leu Asn Thr Pro Phe Ile Asn Glu Leu Leu Gln
245 250 255
Lys Val Ala Gln His Pro Asp Phe Glu Lys Trp Lys Gln Arg Gly Arg
260 265 270
Leu Lys Val Lys Val Ile Glu Gln Leu Gly Asn Glu Leu Lys Lys Asp
275 280 285
Pro Arg Phe Leu Gly Gln Pro Ala Arg Phe Tyr Thr Ser Gly Ile Asn
290 295 300
Leu Val Lys Tyr Ile Phe Lys Ser Trp Leu Lys Leu Gln Gln Arg Leu
305 310 315 320
Gln Gln Lys Leu Asp Arg Lys Arg Arg Trp Leu Glu Val Leu Lys Ser
325 330 335
Asp Asp Gln Leu Ile Lys Asp Gly Gln Thr Asp Leu Glu Thr Ile Arg
340 345 350
Gln Lys Ala Thr Glu Ile Leu Gln Ser Tyr Glu Gly Thr Glu Gln Leu
355 360 365
Phe Asn Thr Leu Phe Gln Ala Tyr Asn Ser Glu Glu Asp Ile Leu Thr
370 375 380
Arg Thr Ala Leu Asn Tyr Leu Leu Lys Asn Arg Cys Lys Leu Pro Gln
385 390 395 400
Lys Pro Glu Asp Ala Lys Lys Phe Ala Lys Arg Arg Arg Gln Val Glu
405 410 415
Ile Ala Ile Lys Arg Leu Gln Glu Gln Ile Lys Ala Arg Leu Pro Gln
420 425 430
Gly Arg Asp Val Thr Asn Glu Asn Trp Leu Glu Thr Leu Asn Leu Ala
435 440 445
Cys Tyr Thr Asp Pro Glu Asn Ile Glu Glu Ala Arg Ser Trp Gln Asp
450 455 460
Lys Leu Leu Thr Lys Ser Ser Ser Ile Pro Phe Pro Ile Asn Tyr Glu
465 470 475 480
Thr Asn Glu Asp Leu Ile Trp Ser Lys Asn Glu Lys Gly His Leu Cys
485 490 495
Val Gln Phe Asn Gly Ile Ser Asp Leu Lys Phe Lys Ile Tyr Cys Asp
500 505 510
Lys Arg Gln Leu Lys Trp Phe Gln Arg Phe Tyr Glu Asp Gln Gln Ile
515 520 525
Lys Lys Ser Asn Asn Asn Gln His Ser Ser Ala Leu Phe Thr Leu Arg
530 535 540
Ser Gly Arg Ile Leu Trp Gln Glu Asp Lys Gly Lys Gly Gln Leu Trp
545 550 555 560
Asp Ile His Arg Leu Thr Leu Gln Cys Thr Leu Asp Thr Arg Thr Trp
565 570 575
Thr Gln Glu Gly Thr Glu Gln Val Lys Glu Glu Lys Ala Asp Glu Ile
580 585 590
Ala Gly Ile Leu Thr Arg Met Asn Glu Lys Gly Asp Leu Thr Lys Asn
595 600 605
Gln Gln Ala Phe Ile Gln Arg Lys Gln Ser Thr Leu Asp Lys Leu Glu
610 615 620
Asn Pro Phe Pro Arg Pro Ser Arg Pro Val Tyr Arg Gly Gln Ser Asn
625 630 635 640
Ile Leu Leu Gly Val Ser Met Glu Leu Lys Lys Pro Ala Thr Ile Ala
645 650 655
Val Ile Asp Gly Met Thr Arg Lys Val Leu Thr Tyr Arg Asn Ile Lys
660 665 670
Gln Leu Leu Gly Lys Asn Tyr Pro Leu Leu Asn Arg Gln Arg Arg Gln
675 680 685
Lys Gln Leu Gln Ser His Gln Arg Asn Val Ala Gln Arg Lys Glu Ala
690 695 700
Phe Asn Gln Phe Gly Asp Ser Glu Leu Gly Glu Tyr Ile Asp Arg Leu
705 710 715 720
Leu Ala Lys Ala Ile Ile Ala Ile Ala Lys Gln Tyr Gln Ala Arg Ser
725 730 735
Ile Val Val Pro His Leu Lys Asp Ile Arg Glu Ala Ile Gln Ser Glu
740 745 750
Ile Gln Ala Leu Ala Glu Ala Lys Ile Pro Asn Cys Ile Glu Ala Gln
755 760 765
Ala Glu Tyr Ala Lys Lys Tyr Arg Ile Gln Val His Gln Trp Ser Tyr
770 775 780
Gly Arg Leu Ile Asp Asn Ile Gln Ala Gln Ala Ser Lys Leu Gly Ile
785 790 795 800
Val Ile Glu Glu Ser Gln Gln Pro Leu Gln Gly Thr Pro Leu Gln Lys
805 810 815
Ala Ala Glu Leu Ala Phe Lys Ala Tyr Gln Ser Arg Leu Ser Ala
820 825 830
<210> 83
<211> 851
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多肽
<220>
<223> MG64-1-Q- 68aa接头- MG64-1效应子融合物
<400> 83
Met Glu Ser Arg Glu Ile Gln Pro Trp Trp Phe Leu Val Glu Pro Leu
1 5 10 15
Ala Gly Glu Ser Ile Ser His Phe Leu Gly Arg Phe Arg Arg Glu Asn
20 25 30
Glu Leu Thr Val Thr Met Met Gly Lys Ile Thr Gly Leu Gly Gly Thr
35 40 45
Ile Thr Arg Trp Glu Lys Phe Arg Phe Ile Pro Ile Pro Thr Glu Glu
50 55 60
Glu Leu Thr Ala Leu Ser Glu Val Val Gln Val Glu Val Glu Arg Leu
65 70 75 80
Trp Gln Met Phe Pro Pro Lys Gly Val Gly Met Lys His Gln Pro Ile
85 90 95
Arg Leu Cys Gly Ala Cys Tyr Glu Glu Glu Arg Cys His Lys Ile Glu
100 105 110
Trp Gln Leu Lys Thr Thr Gln Phe Cys Ser Gln His Gly Leu Thr Leu
115 120 125
Leu Ser Glu Cys Pro Asn Cys Gly Ala Arg Phe Gln Phe Pro Ala Leu
130 135 140
Trp Val Asn Gly Trp Cys His Arg Cys Phe Leu Thr Phe Gly Glu Met
145 150 155 160
Val Glu Gly Gln Ser Asn Lys Lys Lys Tyr Leu Gly Gly Gly Ser Gly
165 170 175
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly
180 185 190
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly
195 200 205
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly
210 215 220
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Met
225 230 235 240
Ser Gln Ile Thr Ile Gln Cys Arg Leu Val Ala Lys Glu Pro Ile Arg
245 250 255
His Thr Leu Trp Gln Leu Met Ala Asp Leu Asn Thr Pro Phe Ile Asn
260 265 270
Glu Leu Leu Gln Lys Val Ala Gln His Pro Asp Phe Glu Lys Trp Lys
275 280 285
Gln Arg Gly Arg Leu Lys Val Lys Val Ile Glu Gln Leu Gly Asn Glu
290 295 300
Leu Lys Lys Asp Pro Arg Phe Leu Gly Gln Pro Ala Arg Phe Tyr Thr
305 310 315 320
Ser Gly Ile Asn Leu Val Lys Tyr Ile Phe Lys Ser Trp Leu Lys Leu
325 330 335
Gln Gln Arg Leu Gln Gln Lys Leu Asp Arg Lys Arg Arg Trp Leu Glu
340 345 350
Val Leu Lys Ser Asp Asp Gln Leu Ile Lys Asp Gly Gln Thr Asp Leu
355 360 365
Glu Thr Ile Arg Gln Lys Ala Thr Glu Ile Leu Gln Ser Tyr Glu Gly
370 375 380
Thr Glu Gln Leu Phe Asn Thr Leu Phe Gln Ala Tyr Asn Ser Glu Glu
385 390 395 400
Asp Ile Leu Thr Arg Thr Ala Leu Asn Tyr Leu Leu Lys Asn Arg Cys
405 410 415
Lys Leu Pro Gln Lys Pro Glu Asp Ala Lys Lys Phe Ala Lys Arg Arg
420 425 430
Arg Gln Val Glu Ile Ala Ile Lys Arg Leu Gln Glu Gln Ile Lys Ala
435 440 445
Arg Leu Pro Gln Gly Arg Asp Val Thr Asn Glu Asn Trp Leu Glu Thr
450 455 460
Leu Asn Leu Ala Cys Tyr Thr Asp Pro Glu Asn Ile Glu Glu Ala Arg
465 470 475 480
Ser Trp Gln Asp Lys Leu Leu Thr Lys Ser Ser Ser Ile Pro Phe Pro
485 490 495
Ile Asn Tyr Glu Thr Asn Glu Asp Leu Ile Trp Ser Lys Asn Glu Lys
500 505 510
Gly His Leu Cys Val Gln Phe Asn Gly Ile Ser Asp Leu Lys Phe Lys
515 520 525
Ile Tyr Cys Asp Lys Arg Gln Leu Lys Trp Phe Gln Arg Phe Tyr Glu
530 535 540
Asp Gln Gln Ile Lys Lys Ser Asn Asn Asn Gln His Ser Ser Ala Leu
545 550 555 560
Phe Thr Leu Arg Ser Gly Arg Ile Leu Trp Gln Glu Asp Lys Gly Lys
565 570 575
Gly Gln Leu Trp Asp Ile His Arg Leu Thr Leu Gln Cys Thr Leu Asp
580 585 590
Thr Arg Thr Trp Thr Gln Glu Gly Thr Glu Gln Val Lys Glu Glu Lys
595 600 605
Ala Asp Glu Ile Ala Gly Ile Leu Thr Arg Met Asn Glu Lys Gly Asp
610 615 620
Leu Thr Lys Asn Gln Gln Ala Phe Ile Gln Arg Lys Gln Ser Thr Leu
625 630 635 640
Asp Lys Leu Glu Asn Pro Phe Pro Arg Pro Ser Arg Pro Val Tyr Arg
645 650 655
Gly Gln Ser Asn Ile Leu Leu Gly Val Ser Met Glu Leu Lys Lys Pro
660 665 670
Ala Thr Ile Ala Val Ile Asp Gly Met Thr Arg Lys Val Leu Thr Tyr
675 680 685
Arg Asn Ile Lys Gln Leu Leu Gly Lys Asn Tyr Pro Leu Leu Asn Arg
690 695 700
Gln Arg Arg Gln Lys Gln Leu Gln Ser His Gln Arg Asn Val Ala Gln
705 710 715 720
Arg Lys Glu Ala Phe Asn Gln Phe Gly Asp Ser Glu Leu Gly Glu Tyr
725 730 735
Ile Asp Arg Leu Leu Ala Lys Ala Ile Ile Ala Ile Ala Lys Gln Tyr
740 745 750
Gln Ala Arg Ser Ile Val Val Pro His Leu Lys Asp Ile Arg Glu Ala
755 760 765
Ile Gln Ser Glu Ile Gln Ala Leu Ala Glu Ala Lys Ile Pro Asn Cys
770 775 780
Ile Glu Ala Gln Ala Glu Tyr Ala Lys Lys Tyr Arg Ile Gln Val His
785 790 795 800
Gln Trp Ser Tyr Gly Arg Leu Ile Asp Asn Ile Gln Ala Gln Ala Ser
805 810 815
Lys Leu Gly Ile Val Ile Glu Glu Ser Gln Gln Pro Leu Gln Gly Thr
820 825 830
Pro Leu Gln Lys Ala Ala Glu Leu Ala Phe Lys Ala Tyr Gln Ser Arg
835 840 845
Leu Ser Ala
850
<210> 84
<211> 855
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多肽
<220>
<223> MG64-1-Q- 72aa接头- MG64-1效应子融合物
<400> 84
Met Glu Ser Arg Glu Ile Gln Pro Trp Trp Phe Leu Val Glu Pro Leu
1 5 10 15
Ala Gly Glu Ser Ile Ser His Phe Leu Gly Arg Phe Arg Arg Glu Asn
20 25 30
Glu Leu Thr Val Thr Met Met Gly Lys Ile Thr Gly Leu Gly Gly Thr
35 40 45
Ile Thr Arg Trp Glu Lys Phe Arg Phe Ile Pro Ile Pro Thr Glu Glu
50 55 60
Glu Leu Thr Ala Leu Ser Glu Val Val Gln Val Glu Val Glu Arg Leu
65 70 75 80
Trp Gln Met Phe Pro Pro Lys Gly Val Gly Met Lys His Gln Pro Ile
85 90 95
Arg Leu Cys Gly Ala Cys Tyr Glu Glu Glu Arg Cys His Lys Ile Glu
100 105 110
Trp Gln Leu Lys Thr Thr Gln Phe Cys Ser Gln His Gly Leu Thr Leu
115 120 125
Leu Ser Glu Cys Pro Asn Cys Gly Ala Arg Phe Gln Phe Pro Ala Leu
130 135 140
Trp Val Asn Gly Trp Cys His Arg Cys Phe Leu Thr Phe Gly Glu Met
145 150 155 160
Val Glu Gly Gln Ser Asn Lys Lys Lys Tyr Leu Gly Gly Gly Ser Gly
165 170 175
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly
180 185 190
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly
195 200 205
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly
210 215 220
Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Gly Ser Met Ser Gln Ile Thr Ile Gln Cys Arg Leu Val Ala Lys
245 250 255
Glu Pro Ile Arg His Thr Leu Trp Gln Leu Met Ala Asp Leu Asn Thr
260 265 270
Pro Phe Ile Asn Glu Leu Leu Gln Lys Val Ala Gln His Pro Asp Phe
275 280 285
Glu Lys Trp Lys Gln Arg Gly Arg Leu Lys Val Lys Val Ile Glu Gln
290 295 300
Leu Gly Asn Glu Leu Lys Lys Asp Pro Arg Phe Leu Gly Gln Pro Ala
305 310 315 320
Arg Phe Tyr Thr Ser Gly Ile Asn Leu Val Lys Tyr Ile Phe Lys Ser
325 330 335
Trp Leu Lys Leu Gln Gln Arg Leu Gln Gln Lys Leu Asp Arg Lys Arg
340 345 350
Arg Trp Leu Glu Val Leu Lys Ser Asp Asp Gln Leu Ile Lys Asp Gly
355 360 365
Gln Thr Asp Leu Glu Thr Ile Arg Gln Lys Ala Thr Glu Ile Leu Gln
370 375 380
Ser Tyr Glu Gly Thr Glu Gln Leu Phe Asn Thr Leu Phe Gln Ala Tyr
385 390 395 400
Asn Ser Glu Glu Asp Ile Leu Thr Arg Thr Ala Leu Asn Tyr Leu Leu
405 410 415
Lys Asn Arg Cys Lys Leu Pro Gln Lys Pro Glu Asp Ala Lys Lys Phe
420 425 430
Ala Lys Arg Arg Arg Gln Val Glu Ile Ala Ile Lys Arg Leu Gln Glu
435 440 445
Gln Ile Lys Ala Arg Leu Pro Gln Gly Arg Asp Val Thr Asn Glu Asn
450 455 460
Trp Leu Glu Thr Leu Asn Leu Ala Cys Tyr Thr Asp Pro Glu Asn Ile
465 470 475 480
Glu Glu Ala Arg Ser Trp Gln Asp Lys Leu Leu Thr Lys Ser Ser Ser
485 490 495
Ile Pro Phe Pro Ile Asn Tyr Glu Thr Asn Glu Asp Leu Ile Trp Ser
500 505 510
Lys Asn Glu Lys Gly His Leu Cys Val Gln Phe Asn Gly Ile Ser Asp
515 520 525
Leu Lys Phe Lys Ile Tyr Cys Asp Lys Arg Gln Leu Lys Trp Phe Gln
530 535 540
Arg Phe Tyr Glu Asp Gln Gln Ile Lys Lys Ser Asn Asn Asn Gln His
545 550 555 560
Ser Ser Ala Leu Phe Thr Leu Arg Ser Gly Arg Ile Leu Trp Gln Glu
565 570 575
Asp Lys Gly Lys Gly Gln Leu Trp Asp Ile His Arg Leu Thr Leu Gln
580 585 590
Cys Thr Leu Asp Thr Arg Thr Trp Thr Gln Glu Gly Thr Glu Gln Val
595 600 605
Lys Glu Glu Lys Ala Asp Glu Ile Ala Gly Ile Leu Thr Arg Met Asn
610 615 620
Glu Lys Gly Asp Leu Thr Lys Asn Gln Gln Ala Phe Ile Gln Arg Lys
625 630 635 640
Gln Ser Thr Leu Asp Lys Leu Glu Asn Pro Phe Pro Arg Pro Ser Arg
645 650 655
Pro Val Tyr Arg Gly Gln Ser Asn Ile Leu Leu Gly Val Ser Met Glu
660 665 670
Leu Lys Lys Pro Ala Thr Ile Ala Val Ile Asp Gly Met Thr Arg Lys
675 680 685
Val Leu Thr Tyr Arg Asn Ile Lys Gln Leu Leu Gly Lys Asn Tyr Pro
690 695 700
Leu Leu Asn Arg Gln Arg Arg Gln Lys Gln Leu Gln Ser His Gln Arg
705 710 715 720
Asn Val Ala Gln Arg Lys Glu Ala Phe Asn Gln Phe Gly Asp Ser Glu
725 730 735
Leu Gly Glu Tyr Ile Asp Arg Leu Leu Ala Lys Ala Ile Ile Ala Ile
740 745 750
Ala Lys Gln Tyr Gln Ala Arg Ser Ile Val Val Pro His Leu Lys Asp
755 760 765
Ile Arg Glu Ala Ile Gln Ser Glu Ile Gln Ala Leu Ala Glu Ala Lys
770 775 780
Ile Pro Asn Cys Ile Glu Ala Gln Ala Glu Tyr Ala Lys Lys Tyr Arg
785 790 795 800
Ile Gln Val His Gln Trp Ser Tyr Gly Arg Leu Ile Asp Asn Ile Gln
805 810 815
Ala Gln Ala Ser Lys Leu Gly Ile Val Ile Glu Glu Ser Gln Gln Pro
820 825 830
Leu Gln Gly Thr Pro Leu Gln Lys Ala Ala Glu Leu Ala Phe Lys Ala
835 840 845
Tyr Gln Ser Arg Leu Ser Ala
850 855
<210> 85
<211> 860
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多肽
<220>
<223> MG64-1-Q- 77aa接头- MG64-1效应子融合物
<400> 85
Met Glu Ser Arg Glu Ile Gln Pro Trp Trp Phe Leu Val Glu Pro Leu
1 5 10 15
Ala Gly Glu Ser Ile Ser His Phe Leu Gly Arg Phe Arg Arg Glu Asn
20 25 30
Glu Leu Thr Val Thr Met Met Gly Lys Ile Thr Gly Leu Gly Gly Thr
35 40 45
Ile Thr Arg Trp Glu Lys Phe Arg Phe Ile Pro Ile Pro Thr Glu Glu
50 55 60
Glu Leu Thr Ala Leu Ser Glu Val Val Gln Val Glu Val Glu Arg Leu
65 70 75 80
Trp Gln Met Phe Pro Pro Lys Gly Val Gly Met Lys His Gln Pro Ile
85 90 95
Arg Leu Cys Gly Ala Cys Tyr Glu Glu Glu Arg Cys His Lys Ile Glu
100 105 110
Trp Gln Leu Lys Thr Thr Gln Phe Cys Ser Gln His Gly Leu Thr Leu
115 120 125
Leu Ser Glu Cys Pro Asn Cys Gly Ala Arg Phe Gln Phe Pro Ala Leu
130 135 140
Trp Val Asn Gly Trp Cys His Arg Cys Phe Leu Thr Phe Gly Glu Met
145 150 155 160
Val Glu Gly Gln Ser Asn Lys Lys Lys Tyr Leu Gly Thr Lys Tyr Leu
165 170 175
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
180 185 190
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
195 200 205
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
210 215 220
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser
225 230 235 240
Gly Gly Gly Ser Gly Gly Gly Ser Met Ser Gln Ile Thr Ile Gln Cys
245 250 255
Arg Leu Val Ala Lys Glu Pro Ile Arg His Thr Leu Trp Gln Leu Met
260 265 270
Ala Asp Leu Asn Thr Pro Phe Ile Asn Glu Leu Leu Gln Lys Val Ala
275 280 285
Gln His Pro Asp Phe Glu Lys Trp Lys Gln Arg Gly Arg Leu Lys Val
290 295 300
Lys Val Ile Glu Gln Leu Gly Asn Glu Leu Lys Lys Asp Pro Arg Phe
305 310 315 320
Leu Gly Gln Pro Ala Arg Phe Tyr Thr Ser Gly Ile Asn Leu Val Lys
325 330 335
Tyr Ile Phe Lys Ser Trp Leu Lys Leu Gln Gln Arg Leu Gln Gln Lys
340 345 350
Leu Asp Arg Lys Arg Arg Trp Leu Glu Val Leu Lys Ser Asp Asp Gln
355 360 365
Leu Ile Lys Asp Gly Gln Thr Asp Leu Glu Thr Ile Arg Gln Lys Ala
370 375 380
Thr Glu Ile Leu Gln Ser Tyr Glu Gly Thr Glu Gln Leu Phe Asn Thr
385 390 395 400
Leu Phe Gln Ala Tyr Asn Ser Glu Glu Asp Ile Leu Thr Arg Thr Ala
405 410 415
Leu Asn Tyr Leu Leu Lys Asn Arg Cys Lys Leu Pro Gln Lys Pro Glu
420 425 430
Asp Ala Lys Lys Phe Ala Lys Arg Arg Arg Gln Val Glu Ile Ala Ile
435 440 445
Lys Arg Leu Gln Glu Gln Ile Lys Ala Arg Leu Pro Gln Gly Arg Asp
450 455 460
Val Thr Asn Glu Asn Trp Leu Glu Thr Leu Asn Leu Ala Cys Tyr Thr
465 470 475 480
Asp Pro Glu Asn Ile Glu Glu Ala Arg Ser Trp Gln Asp Lys Leu Leu
485 490 495
Thr Lys Ser Ser Ser Ile Pro Phe Pro Ile Asn Tyr Glu Thr Asn Glu
500 505 510
Asp Leu Ile Trp Ser Lys Asn Glu Lys Gly His Leu Cys Val Gln Phe
515 520 525
Asn Gly Ile Ser Asp Leu Lys Phe Lys Ile Tyr Cys Asp Lys Arg Gln
530 535 540
Leu Lys Trp Phe Gln Arg Phe Tyr Glu Asp Gln Gln Ile Lys Lys Ser
545 550 555 560
Asn Asn Asn Gln His Ser Ser Ala Leu Phe Thr Leu Arg Ser Gly Arg
565 570 575
Ile Leu Trp Gln Glu Asp Lys Gly Lys Gly Gln Leu Trp Asp Ile His
580 585 590
Arg Leu Thr Leu Gln Cys Thr Leu Asp Thr Arg Thr Trp Thr Gln Glu
595 600 605
Gly Thr Glu Gln Val Lys Glu Glu Lys Ala Asp Glu Ile Ala Gly Ile
610 615 620
Leu Thr Arg Met Asn Glu Lys Gly Asp Leu Thr Lys Asn Gln Gln Ala
625 630 635 640
Phe Ile Gln Arg Lys Gln Ser Thr Leu Asp Lys Leu Glu Asn Pro Phe
645 650 655
Pro Arg Pro Ser Arg Pro Val Tyr Arg Gly Gln Ser Asn Ile Leu Leu
660 665 670
Gly Val Ser Met Glu Leu Lys Lys Pro Ala Thr Ile Ala Val Ile Asp
675 680 685
Gly Met Thr Arg Lys Val Leu Thr Tyr Arg Asn Ile Lys Gln Leu Leu
690 695 700
Gly Lys Asn Tyr Pro Leu Leu Asn Arg Gln Arg Arg Gln Lys Gln Leu
705 710 715 720
Gln Ser His Gln Arg Asn Val Ala Gln Arg Lys Glu Ala Phe Asn Gln
725 730 735
Phe Gly Asp Ser Glu Leu Gly Glu Tyr Ile Asp Arg Leu Leu Ala Lys
740 745 750
Ala Ile Ile Ala Ile Ala Lys Gln Tyr Gln Ala Arg Ser Ile Val Val
755 760 765
Pro His Leu Lys Asp Ile Arg Glu Ala Ile Gln Ser Glu Ile Gln Ala
770 775 780
Leu Ala Glu Ala Lys Ile Pro Asn Cys Ile Glu Ala Gln Ala Glu Tyr
785 790 795 800
Ala Lys Lys Tyr Arg Ile Gln Val His Gln Trp Ser Tyr Gly Arg Leu
805 810 815
Ile Asp Asn Ile Gln Ala Gln Ala Ser Lys Leu Gly Ile Val Ile Glu
820 825 830
Glu Ser Gln Gln Pro Leu Gln Gly Thr Pro Leu Gln Lys Ala Ala Glu
835 840 845
Leu Ala Phe Lys Ala Tyr Gln Ser Arg Leu Ser Ala
850 855 860
<210> 86
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
<220>
<223> 核质蛋白NLS
<400> 86
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 87
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
<220>
<223> SV40 2x NLS
<400> 87
Pro Lys Lys Lys Arg Lys Val Asp Gly Ser Pro Lys Lys Lys Arg Lys
1 5 10 15
Val Asp Ser
<210> 88
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
<220>
<223> P2A
<400> 88
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 89
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
<220>
<223> T2A
<400> 89
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 90
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
<220>
<223> HA
<400> 90
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1 5
<210> 91
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
<220>
<223> Myc
<400> 91
Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1 5 10
<210> 92
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
<220>
<223> FLAG
<400> 92
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
<210> 93
<211> 486
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性转座子末端LE
<400> 93
ctggctaatg cacccagtaa ggcagcggta tcatcaacgg ggtctgacgc tcagtggaac 60
gaaaactcac gttaggctct cttaaggaaa tctatgtaag tttgttgggt tagttgcgtt 120
ttcagtaaat actgtgttat agtaagaact tgtgcggacg tatagctcag ttggttagag 180
tacatcgttg acatcgatgg ggtcactggt tcgagtccag ttacgtccat atttttttga 240
agtgtgtata atattaacta tgtgacttta tgtacattaa cagattattt gtcatcggta 300
acaaattgtt gtcatcttaa caaaatattt gtcatcaata acatattatg tgtcgtgtgc 360
ttattactga aactaatcct agacgatggt aaaaaataga acacatttcc ccgaaaagtg 420
ccacctgacg tctaagaaac cattattatc atgacattaa cctataaaaa taggcgtatc 480
acgagg 486
<210> 94
<211> 199
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-3效应子推定tracrRNA
<400> 94
tgcagcgcct aagttcatgt cgtcagcggc ctctgtgctt agaaaaaggg ctagtttgac 60
tgtctgaacg cagtcttgct ttctgaccta gataactgtc catccccaaa gctgtgagcg 120
cacgcagcaa gagggcacgg gttccggagt gatggttatc aaattcacct ccgagcaagg 180
aggaatccac ccaaaactt 199
<210> 95
<211> 237
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-5效应子推定tracrRNA
<400> 95
tcttgtgcgc gccggttctt tagggactga gcgataagtt agggcgagtt taattgcttt 60
ccagcccgtg tagttgtccg ctctcttgtg cagcttgctg catgctaggt gtcgggtcgc 120
gccgacatcc aagaggccat gtttctgtag ttagaggcta tctcttcaat tatagggata 180
caggtgtacg tgtcgtggca gctaccaaac agccccgagc aagggggccc atccaaa 237
<210> 96
<211> 239
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性效应子工程化sgRNA 11
<220>
<221> 修饰的_碱基
<222> (217)..(239)
<223> a、c、u、g、未知或其他
<400> 96
gaaaauaauc gcgccguaga ucauguucuu gauugaaccu cugaacuacg aaaaaugagg 60
guuaguuuga cucucgccua guggcugucc acccugaugc ugauuucuac auaggguagg 120
ugcgcuccca gcaauaagug gcguggguuu accacaguga cggcuacuga aucaccuccg 180
accaaggagg aauccacuga aaagauggau ugaaagnnnn nnnnnnnnnn nnnnnnnnn 239
<210> 97
<211> 245
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性效应子工程化sgRNA 12
<220>
<221> 修饰的_碱基
<222> (223)..(245)
<223> a、c、u、g、未知或其他
<400> 97
gaaaauaauc gcgccguaga ucauguucuu gauugaaccu cugaacuacg aaaaaugagg 60
guuaguuuga cucucggcag auagucuugc uuucugaccc uaguggcugu ccacccugau 120
gcugauuucu acauagggua ggugcgcugu ggguuuacca cagugacggc uacugaauca 180
ccuccgacca aggaggaauc cacugaaaag auggauugaa agnnnnnnnn nnnnnnnnnn 240
nnnnn 245
<210> 98
<211> 250
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性效应子工程化sgRNA 13
<220>
<221> 修饰的_碱基
<222> (228)..(250)
<223> a、c、u、g、未知或其他
<400> 98
gaaaauaauc gcgccguaga ucauguucuu gauugaaccu cugaacuacg aaaaaugagg 60
guuaguuuga cucucggcag auagucuugc uuucugaccc uaguggcugu ccacccugau 120
gcugauuucu acauagggua ggugcgcucc cagcaauaag uggcgcagug acggcuacug 180
aaucaccucc gaccaaggag gaauccacug aaaagaugga uugaaagnnn nnnnnnnnnn 240
nnnnnnnnnn 250
<210> 99
<211> 248
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性效应子工程化sgRNA 14
<220>
<221> 修饰的_碱基
<222> (226)..(248)
<223> a、c、u、g、未知或其他
<400> 99
gaaaauaauc gcgccguaga ucauguucuu gauugaaccu cugaacuacg aaaaaugagg 60
guuaguuuga cucucggcag auagucuugc uuucugaccc uaguggcugu ccacccugau 120
gcugauuucu acauagggua ggugcgcucc cagcaauaag uggcagugac ggcuacugaa 180
ucaccuccga ccaaggagga auccacugaa aagauggauu gaaagnnnnn nnnnnnnnnn 240
nnnnnnnn 248
<210> 100
<211> 263
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性效应子工程化sgRNA v2-1
<220>
<221> 修饰的_碱基
<222> (241)..(263)
<223> a、c、u、g、未知或其他
<400> 100
gaauuaauag cgccgccguu caugcuucua ggagccucug aaaggugaca aaugcggguu 60
aguuuggcug uugucagaca gucuugcuuu cugacccugg uagcugccca ccccgaagcu 120
gcuguuccuu gugaacagga auuaggugcg cccccaguaa uaaggguaug gguuuaccac 180
agugguggcu acugaaucac cuccgagcaa ggaggaaccc acugaaaggu ggguugaaag 240
nnnnnnnnnn nnnnnnnnnn nnn 263
<210> 101
<211> 262
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-1活性效应子工程化sgRNA 20
<220>
<221> 修饰的_碱基
<222> (240)..(262)
<223> a、c、u、g、未知或其他
<400> 101
gccguagauc augccucuga acuacgaaaa augaggguua guuugacucu cggcagauag 60
ucuugcuuuc ugacccuagu ggcuguccac ccugaugcug auuucuacaa uuuagguugu 120
agagaugauu aaccuguaac uugagguuag cuaauaauuu cauuuuauag gguaggugcg 180
cucccagcaa uaaguggcgu ggguuuacca cagugacggc uacugaauca cgaugaaagn 240
nnnnnnnnnn nnnnnnnnnn nn 262
<210> 102
<211> 241
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-3效应子sgRNA
<220>
<221> 修饰的_碱基
<222> (219)..(241)
<223> a、c、u、g、未知或其他
<400> 102
gaaauaaaug cagcgccuaa guucaugucg ucagcggccu cugugcuuag aaaaagggcu 60
aguuugacug ucugaacgca gucuugcuuu cugaccuaga uaacugucca uccccaaagc 120
ugugagcgca cgcagcaaga gggcacgggu uccggaguga ugguuaucaa auucaccucc 180
gagcaaggag gaauccaccc gaaagggcgg auugaaagnn nnnnnnnnnn nnnnnnnnnn 240
n 241
<210> 103
<211> 264
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-5效应子sgRNA
<220>
<221> 修饰的_碱基
<222> (242)..(264)
<223> a、c、u、g、未知或其他
<400> 103
gcgcgccggu ucuuuaggga cugagcgaua aguuagggcg aguuuaauug cuuuccagcc 60
cguguaguug uccgcucucu ugugcagcuu gcugcaugcu aggugucggg ucgcgccgac 120
auccaagagg ccauguuucu guaguuagag gcuaucucuu caauuauagg gauacaggug 180
uacgugucgu ggcagcuacc aaacagcccc gagcaagggg gcccauccga aaggaugaaa 240
gnnnnnnnnn nnnnnnnnnn nnnn 264
<210> 104
<211> 199
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-3效应子推定tracrRNA序列
<400> 104
ugcagcgccu aaguucaugu cgucagcggc cucugugcuu agaaaaaggg cuaguuugac 60
ugucugaacg cagucuugcu uucugaccua gauaacuguc cauccccaaa gcugugagcg 120
cacgcagcaa gagggcacgg guuccggagu gaugguuauc aaauucaccu ccgagcaagg 180
aggaauccac ccaaaacuu 199
<210> 105
<211> 237
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
多核苷酸
<220>
<223> MG64-5效应子推定tracrRNA序列
<400> 105
ucuugugcgc gccgguucuu uagggacuga gcgauaaguu agggcgaguu uaauugcuuu 60
ccagcccgug uaguuguccg cucucuugug cagcuugcug caugcuaggu gucgggucgc 120
gccgacaucc aagaggccau guuucuguag uuagaggcua ucucuucaau uauagggaua 180
cagguguacg ugucguggca gcuaccaaac agccccgagc aagggggccc auccaaa 237
<210> 106
<211> 38
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
寡核苷酸
<220>
<223> MG64-1活性效应子's crRNA序列
<400> 106
cgucacaauc uauuuugguu aaugagaugg auugaaag 38
<210> 107
<211> 37
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
寡核苷酸
<220>
<223> MG64-3效应子crRNA序列
<400> 107
gucgcccaag gcauuucagg gcagggcgga uugaaag 37
<210> 108
<211> 37
<212> RNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的
寡核苷酸
<220>
<223> MG64-5效应子crRNA序列
<400> 108
guuucauccc ugcauuucaa ugcagauggg augaaag 37

Claims (56)

1.一种用于将货物核苷酸序列转座到靶核酸位点的系统,所述系统包括:
包含货物核苷酸序列的第一双链核酸,所述货物核苷酸序列被配置为与Tn7型转座酶复合物相互作用;
包含II类V型Cas效应子和工程化向导多核苷酸的Cas效应子复合物,所述工程化向导多核苷酸被配置为与所述靶核苷酸序列杂交;和
被配置为结合所述Cas效应子复合物的Tn7型转座酶复合物,其中所述Tn7型转座酶复合物包含TnsB亚基。
2.如权利要求1所述的系统,其中所述货物核苷酸序列与左侧转座酶识别序列和右侧转座酶识别序列侧接。
3.如权利要求1或2所述的系统,还包括包含所述靶核酸位点的第二双链核酸。
4.如权利要求1-3所述的系统,还包括与所述靶核酸位点相邻的PAM序列,所述PAM序列与所述Cas效应子复合物相容。
5.如权利要求4所述的系统,其中所述PAM序列位于所述靶核酸位点的3’处。
6.如权利要求4所述的系统,其中所述PAM序列位于所述靶核酸位点的5’处。
7.如权利要求1-6中任一项所述的系统,其中所述工程化向导多核苷酸被配置为结合所述II类V型Cas效应子。
8.如权利要求1-7中任一项所述的系统,其中所述II类V型Cas效应子包含多肽,所述多肽包含与SEQ ID NO:1、12、16、20-30、64或80-85或其变体具有至少80%同一性的序列。
9.如权利要求1-8中任一项所述的系统,其中所述TnsB亚基包含多肽,所述多肽具有与SEQ ID NO:2、13、17或65或其变体具有至少80%同一性的序列。
10.如权利要求1-9中任一项所述的系统,其中所述Tn7型转座酶复合物包含至少一种或至少两种三种多肽,所述多肽包含与SEQ ID NO:3-4、14-15、18-19或66-67中的任一个或其变体具有至少80%同一性的序列。
11.如权利要求1-10中任一项所述的系统,其中所述工程化向导多核苷酸包含序列,所述序列包含与SEQ ID NO:5-6、32-33、94-95或104-105中的任一个或其变体具有至少80%同一性的至少约46-80个连续核苷酸。
12.如权利要求1-11中任一项所述的系统,其中所述工程化向导多核苷酸包含与SEQID NO:106、107、108、5、45-63、68-75或96-103中任一个或其变体的非简并核苷酸具有至少80%序列同一性的序列。
13.如权利要求2-12中任一项所述的系统,其中所述左侧重组酶序列包含与SEQ IDNO:9、11、36-38、76或78或其变体具有至少80%同一性的序列。
14.如权利要求2-13中任一项所述的系统,其中所述右侧重组酶序列包含与SEQ IDNO:8、10、39-44、77、79或93或其变体具有至少80%同一性的序列。
15.如权利要求1-14中任一项所述的系统,其中所述II类V型Cas效应子和所述Tn7型转座酶复合物由包含少于约10千碱基的多核苷酸序列编码。
16.一种用于将货物核苷酸序列转座到包含靶核苷酸序列的靶核酸位点的方法,其包括在细胞内表达如权利要求1-15中任一项所述的系统或将如权利要求1-15中任一项所述的系统引入细胞中。
17.一种用于将货物核苷酸序列转座到靶核酸位点的方法,所述方法包括使包含所述货物核苷酸序列的第一双链核酸与以下接触:
包含II类V型Cas效应子和至少一种工程化向导多核苷酸的Cas效应子复合物,所述工程化向导多核苷酸被配置为与所述靶核苷酸序列杂交;
被配置为结合所述Cas效应子复合物的Tn7型转座酶复合物,其中所述Tn7型转座酶复合物包含TnsB亚基;和
包含所述靶核酸位点的第二双链核酸。
18.如权利要求17所述的方法,其中所述货物核苷酸序列与左侧转座酶识别序列和右侧转座酶识别序列侧接。
19.如权利要求17或18所述的方法,其还包括与所述靶核酸位点相邻的PAM序列,所述PAM序列与所述Cas效应子复合物相容。
20.如权利要求19所述的方法,其中所述PAM序列位于所述靶核酸位点的3’处。
21.如权利要求17-20中任一项所述的方法,其中所述工程化向导多核苷酸被配置为结合所述II类V型Cas效应子。
22.如权利要求17-21中任一项所述的方法,其中所述II类V型Cas效应子包含多肽,所述多肽包含与SEQ ID NO:1、12、16、20-30、64或80-85或其变体具有至少80%同一性的序列。
23.如权利要求17-22中任一项所述的方法,其中所述TnsB亚基包含多肽,所述多肽具有与SEQ ID NO:2、13、17或65或其变体具有至少80%同一性的序列。
24.如权利要求17-23中任一项所述的方法,其中所述Tn7型转座酶复合物包含至少一种或至少两种多肽,所述多肽包含与SEQ ID NO:3-4、14-15、18-19或66-67中的任一个或其变体具有至少80%同一性的序列。
25.如权利要求17-24中任一项所述的方法,其中所述工程化向导多核苷酸包含序列,所述序列包含与SEQ ID NO:5-6、32-33、94-95或104-105中的任一个或其变体具有至少80%同一性的至少约46-80个连续核苷酸。
26.如权利要求18-25中任一项所述的方法,其中所述左侧重组酶序列包含与SEQ IDNO:9、11、36-38、76或78或其变体具有至少80%同一性的序列。
27.如权利要求18-26中任一项所述的方法,其中所述右侧重组酶序列包含与SEQ IDNO:8、10、39-44、77、79或93或其变体具有至少80%同一性的序列。
28.如权利要求17-27中任一项所述的方法,其中所述II类V型Cas效应子和所述Tn7型转座酶复合物由包含少于约10千碱基的多核苷酸序列编码。
29.一种用于将货物核苷酸序列转座到靶核酸位点的系统,所述系统包括:
包含货物核苷酸序列的第一双链核酸,所述货物核苷酸序列被配置为与Tn7型转座酶复合物相互作用;
包含II类V型Cas效应子和工程化向导多核苷酸的Cas效应子复合物,所述工程化向导多核苷酸被配置为与所述靶核苷酸序列杂交;和
被配置为结合所述Cas效应子复合物的Tn7型转座酶复合物,其中所述Tn7型转座酶复合物包含TnsB、TnsC和TniQ组分,其中:
(a)所述II类V型Cas效应子包含多肽,所述多肽具有与SEQ ID NO:1、12、16、20-30、64或80-85中的任一个或其变体具有至少80%序列同一性的序列;或者
(b)所述Tn7型转座酶复合物包含具有与SEQ ID NO:2-4、13-15、17-19或65-67中的任一个或其变体具有至少80%序列同一性的序列的TnsB、TnsC或TniQ组分。
30.如权利要求29所述的系统,其中所述转座酶复合物与所述Cas效应子复合物非共价结合。
31.如权利要求29或30所述的系统,其中所述转座酶复合物与所述Cas效应子复合物共价连接。
32.如权利要求31所述的系统,其中所述转座酶复合物与所述Cas效应子复合物在单个多肽中融合。
33.如权利要求29-32中任一项所述的系统,其中所述II类V型Cas效应子包含多肽,所述多肽具有与SEQ ID NO:1、12、16、20-30、64或80-85中的任一个或其变体具有至少80%序列同一性的序列。
34.如权利要求29-33中任一项所述的系统,其中所述Tn7型转座酶复合物包含具有与SEQ ID NO:2-4、13-15、17-19或65-67中的任一个或其变体具有至少80%序列同一性的序列的TnsB、TnsC或TniQ组分。
35.如权利要求29-34中任一项所述的系统,其中所述II类V型Cas效应子是Cas12k效应子。
36.如权利要求29-35中任一项所述的系统,其中所述货物核苷酸序列与左侧转座酶识别序列和右侧转座酶识别序列侧接。
37.如权利要求29-36中任一项所述的系统,其还包括包含所述靶核酸位点的第二双链核酸。
38.如权利要求29-37中任一项所述的系统,其还包括与所述靶核酸位点相邻的PAM序列,所述PAM序列与所述Cas效应子复合物相容。
39.如权利要求38所述的系统,其中所述PAM序列位于所述靶核酸位点的5’处。
40.如权利要求39所述的系统,其中所述PAM序列包含SEQ ID NO:31。
41.如权利要求29-40中任一项所述的系统,其中所述工程化向导多核苷酸被配置为结合所述II类V型Cas效应子。
42.如权利要求29-41中任一项所述的系统,其中所述工程化向导多核苷酸包含序列,所述序列包含与SEQ ID NO:5-6、32-33、94-95或104-105中的任一个或其变体具有至少80%同一性的至少约46-80个连续核苷酸。
43.如权利要求29-41中任一项所述的系统,其中所述工程化向导多核苷酸包含与SEQID NO:106、107、108、5、45-63、68-75或96-103中任一个或其变体的非简并核苷酸具有至少80%序列同一性的序列。
44.如权利要求36-43中任一项所述的系统,其中所述左侧重组酶序列包含与SEQ IDNO:9、11、36-38、76或78中的任一个或其变体具有至少80%同一性的序列。
45.如权利要求36-44中任一项所述的系统,其中所述右侧重组酶序列包含与SEQ IDNO:8、10、39-44、77、79或93中的任一个具有至少80%同一性的序列。
46.如权利要求29-45中任一项所述的系统,其中所述II类V型Cas效应子和所述Tn7型转座酶复合物由包含少于约10千碱基的多核苷酸序列编码。
47.如权利要求38-46中任一项所述的系统,其中:
(a)所述II类V型Cas效应子包含与SEQ ID NO:1、81、82、83或85中的任一个或其变体具有至少80%序列同一性的序列;
(b)所述左侧重组酶序列包含与SEQ ID NO:9、11、36、37或38中的任一个或其变体具有至少80%序列同一性的序列;
(c)所述右侧重组酶序列包含与SEQ ID NO:8、39、40、41、42、43、44或93中的任一个或其变体具有至少80%同一性的序列;
(d)所述工程化向导多核苷酸:(i)包含与SEQ ID NO:6或其变体的至少约46-80个核苷酸具有至少80%序列同一性的序列;或(ii)包含与SEQ ID NO:5、45-63、68-75或96-103中任一个或其变体的非简并核苷酸具有至少80%同一性的序列;
(e)所述TnsB、TnsC和TniQ组分包含多肽,所述多肽具有与SEQ ID NO:2-4或其变体具有至少80%同一性的序列;或者
(f)所述PAM序列包含SEQ ID NO:31。
48.如权利要求38-46中任一项所述的系统,其中:
(a)所述II类V型Cas效应子包含与SEQ ID NO:12或其变体具有至少80%序列同一性的序列;
(b)所述左侧重组酶序列包含与SEQ ID NO:76或其变体具有至少80%序列同一性的序列;
(c)所述右侧重组酶序列包含与SEQ ID NO:77或其变体具有至少80%同一性的序列;
(d)所述工程化向导多核苷酸:(i)包含与SEQ ID NO:32或104或其变体的至少约46-80个核苷酸具有至少80%序列同一性的序列;或(ii)包含与SEQ ID NO:107或102中任一个或其变体的非简并核苷酸具有至少80%同一性的序列;或者
(e)所述TnsB、TnsC和TniQ组分包含多肽,所述多肽具有与SEQ ID NO:13-15或其变体具有至少80%同一性的序列。
49.如权利要求38-46中任一项所述的系统,其中:
(a)所述II类V型Cas效应子包含与SEQ ID NO:16或其变体具有至少80%序列同一性的序列;
(b)所述左侧重组酶序列包含与SEQ ID NO:78或其变体具有至少80%序列同一性的序列;
(c)所述右侧重组酶序列包含与SEQ ID NO:79或其变体具有至少80%同一性的序列;
(d)所述工程化向导多核苷酸:(i)包含与SEQ ID NO:33或105或其变体的至少约46-80个核苷酸具有至少80%序列同一性的序列;或(ii)包含与SEQ ID NO:108或103中任一个或其变体的非简并核苷酸具有至少80%同一性的序列;或者
(e)所述TnsB、TnsC和TniQ组分包含多肽,所述多肽具有与SEQ ID NO:17-19或其变体具有至少80%同一性的序列。
50.一种工程化核酸酶系统,所述系统包括:
包含RuvC结构域的核酸内切酶,其中所述核酸内切酶来源于未培养微生物,并且其中所述核酸内切酶是与SEQ ID NO:1、12、16、20-30、64或80-85中的任一个或其变体具有至少80%同一性的II类V-K型Cas效应子;和
工程化向导RNA,其中所述工程化向导RNA被配置为与所述核酸内切酶形成复合物,并且所述工程化向导RNA包含被配置为与靶核酸序列杂交的间隔子序列。
51.如权利要求50所述的工程化核酸酶系统,其中所述工程化向导多核苷酸包含序列,所述序列包含与SEQ ID NO:5-6、32-33、94-95或104-105中的任一个或其变体具有至少80%同一性的至少约46-80个连续核苷酸。
52.如权利要求50或51所述的工程化核酸酶系统,其中所述工程化向导多核苷酸包含与SEQ ID NO:106、107、108、5、45-63、68-75或96-103中任一个或其变体的非简并核苷酸具有至少80%同一性的序列。
53.如权利要求50-52中任一项所述的工程化核酸酶系统,还包括与所述靶核酸位点相邻的PAM序列,所述PAM序列与所述Cas效应子复合物相容。
54.如权利要求53所述的工程化核酸酶系统,其中所述PAM序列位于所述靶核酸位点的5’处。
55.如权利要求54所述的工程化核酸酶系统,其中所述PAM序列包含SEQ ID NO:31。
56.如权利要求53-55中任一项所述的系统,其中:
(a)所述II类V-K型Cas效应子包含与SEQ ID NO:1、81、82、83或85中的任一个或其变体具有至少80%序列同一性的序列;
(b)所述左侧重组酶序列包含与SEQ ID NO:9、11、36、37或38中的任一个或其变体具有至少80%序列同一性的序列;
(c)所述右侧重组酶序列包含与SEQ ID NO:8、39、40、41、42、43、44或93中的任一个或其变体具有至少80%同一性的序列;
(d)所述工程化向导多核苷酸:(i)包含与SEQ ID NO:6或其变体的至少约46-80个核苷酸具有至少80%序列同一性的序列;或(ii)包含与SEQ ID NO:5、45-63、68-75或96-103中任一个或其变体的非简并核苷酸具有至少80%同一性的序列;
(e)所述TnsB、TnsC和TniQ组分包含多肽,所述多肽具有与SEQ ID NO:2-4或其变体具有至少80%同一性的序列;或者
(f)所述PAM序列包含SEQ ID NO:31。
CN202180079027.2A 2020-09-24 2021-08-23 用于对货物核苷酸序列转座的系统和方法 Pending CN116615547A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US63/082,983 2020-09-24
US63/187,290 2021-05-11
US202163232578P 2021-08-12 2021-08-12
US63/232,578 2021-08-12
PCT/US2021/047196 WO2022066335A1 (en) 2020-09-24 2021-08-23 Systems and methods for transposing cargo nucleotide sequences

Publications (1)

Publication Number Publication Date
CN116615547A true CN116615547A (zh) 2023-08-18

Family

ID=87685811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180079027.2A Pending CN116615547A (zh) 2020-09-24 2021-08-23 用于对货物核苷酸序列转座的系统和方法

Country Status (1)

Country Link
CN (1) CN116615547A (zh)

Similar Documents

Publication Publication Date Title
US10982200B2 (en) Enzymes with RuvC domains
AU2020223370B2 (en) Enzymes with RuvC domains
US20240336905A1 (en) Class ii, type v crispr systems
US20230340481A1 (en) Systems and methods for transposing cargo nucleotide sequences
US20240301374A1 (en) Systems and methods for transposing cargo nucleotide sequences
WO2021178934A1 (en) Class ii, type v crispr systems
EP3924477A1 (en) Enzymes with ruvc domains
US20220220460A1 (en) Enzymes with ruvc domains
EP4165177A1 (en) Enzymes with ruvc domains
WO2023076952A1 (en) Enzymes with hepn domains
CN116615547A (zh) 用于对货物核苷酸序列转座的系统和方法
GB2617659A (en) Enzymes with RUVC domains
WO2023164592A2 (en) Fusion proteins
WO2023164591A2 (en) Systems and methods for transposing cargo nucleotide sequences
KR20240145512A (ko) 융합 단백질
WO2023164590A2 (en) Fusion proteins

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination